jabbaxatt
Добрый модератор
- Регистрация
- 21 Янв 2009
- Сообщения
- 902
- Реакции
- 433
- Автор темы
- #21
Вот уж чего не знал. Для русских символов всегда достаточно было сменить кодировку файла на utf-8.Если не сложно - объясните, пожалуйста, поподробнее что ещё вас в регулярках не устраивает, разумеется ещё кроме того, что они работают на долю секунды дольше чем строковые функции? Спасибо!!! DOM.... вообще не представляю как его в html юзать, ведь многим сайтам до xhtml оооочень далеко.
Ну, я использую всё - и регулярки и Dom и строковые.
Конкретно из регулярок - у меня функция preg_replace иногда искажает буквы. Примерно как в топике Для просмотра ссылки Войди
Dom удобен не для разбора страницы на запчасти, а если нужно вытащить что-то конкретное. Например адреса всех ссылок (Href). Пара строчек и массив готов.
А строковые всем хороши, быстры и надёжны - но у них плохая универсальность. Ими делаю только то что можно сделать.
Конкретнее - попробуй код. У меня этот код гасит некоторые буквы исходного UTF-8:
PHP:
$text= preg_replace('/\s+/', ' ', $text);
А вот это работает нормально:
PHP:
$text=ereg_replace('[ ]+',' ',$text);
Вот ещё обсуждение похожей ситуации - Для просмотра ссылки Войди