Utf-8 или win-1251

Статус
В этой теме нельзя размещать новые ответы.
Даже не читал предыдущих ораторов. Извиняюсь перед ними. Однозначно UTF-8!
Завтра ты станешь серьезным человеком (вдруг;) ) и возникнет необходимость прикрутить французский язык к сайту или скорее всего китайский.
Мне приходилось... Считай все с нуля пришлось переделывать. Теперь только UTF-8 использую.
 
В чем кодить – все равно. Я предпочитаю UTF-8, но это просто инструментарий определяет, а так я никаких символов за пределами ascii не использую и вам не советую. Тексты интерфейса лучше выносить отдельно и кодировать их в то, что вам удобно. Ну и при таком раскладе utf8 все-таки удобнее. Раздражают русские CMS, которые в 1251 "by design".
 
насчет популярности

кстати - сделайте [CTRL]+ этой страницы )
 
А почему все молчат про регистронезависимые regexpы или этим никто не пользуется?
 
А почему все молчат про регистронезависимые regexpы или этим никто не пользуется?
А тема разве об этом? И регю выражения задаются с условиями.
 
Тема о выборе между Utf-8 или win-1251,
при использовании Utf-8 возникают косяки с изменением регистра в строках, даже если локаль выставленна правильно.
Если для большинства операций со строками можно обойтись другими функциями например из mb_* то для regexpов это не проходит.
Самый простой пример найти в строке все вхождения слова "Жаба", причем в независисмости от регистра "/жаба/i" не работает приходиться извращаться и писать "/(Ж|ж)(А|а)(Б|б)(А|а)/i".
Причем вариант с [ ] тоже не работатет.

то есть в PHP<6 косячно реализована подержка регистронезависимости в UTF-8.
 
Тема о выборе между Utf-8 или win-1251,
при использовании Utf-8 возникают косяки с изменением регистра в строках, даже если локаль выставленна правильно.
Если для большинства операций со строками можно обойтись другими функциями например из mb_* то для regexpов это не проходит.
Самый простой пример найти в строке все вхождения слова "Жаба", причем в независисмости от регистра "/жаба/i" не работает приходиться извращаться и писать "/(Ж|ж)(А|а)(Б|б)(А|а)/i".
конечно не работает. Надо добавлять модификатор u, который предназначен для работы с UTF-8.
 
Если используешь AJAX или Flash (или собираешься, или не собираешься, но эти технологии тебе нравятся) то UTF-8 однозначно (чтобы не было половины страниц в одной кодировке, половины в другой), а вообще мне кажется win-1251 это прошлое
2 BaziliX - а ты делал сайт для японцев?
я делал для китайцев UTF мне лично не помог, пришлось использовать спецсимволы HTML - иначе никак.
 
Зависит от аудитории, для русскоязычного сообщества win-1251 будет более привычным, для других - utf8.
Ещё правильно было замечено, что win-1251 не содержит избыточного набора символов, как в utf8, потому и будет занимать немного меньше.
 
Зависит от аудитории, для русскоязычного сообщества win-1251 будет более привычным, для других - utf8.
аудитории все равно, в чем закодирован текст. Если они нашли на сайте интересный контент, то windows-1251 не будет ни на сколько «привычнее» для них, чем UTF-8.
 
Статус
В этой теме нельзя размещать новые ответы.
Назад
Сверху