- Автор темы
- #1
Здравствуйте.
Написал парсер для одного польского сайта.
Он в УТФ8, мой сайт в ср1251
После получение страницы в УТФ8, мне нужно сделать матчинг по словам.
Но в польском языке есть некоторые буквы с "черточками" сверху.
В утф8 текст отображается нормально, но после iconv("UTF-8", "cp1251//TRANSLIT", page)
У меня вместо этих букв отображаются знаки вопроса, остальной текст конвертируется нормально.
параметр TRANSLIT, как я понимаю должен был заменить эти спец символы для польского языка, нашими символами.
Тоесть о (с черточкой) заменить на простую о и т.д.
Мне нужно текст сохранить читабельным но без этих символов, тоесть заменить их на наши.
Как быть?
Спасибо.
Написал парсер для одного польского сайта.
Он в УТФ8, мой сайт в ср1251
После получение страницы в УТФ8, мне нужно сделать матчинг по словам.
Но в польском языке есть некоторые буквы с "черточками" сверху.
В утф8 текст отображается нормально, но после iconv("UTF-8", "cp1251//TRANSLIT", page)
У меня вместо этих букв отображаются знаки вопроса, остальной текст конвертируется нормально.
параметр TRANSLIT, как я понимаю должен был заменить эти спец символы для польского языка, нашими символами.
Тоесть о (с черточкой) заменить на простую о и т.д.
Мне нужно текст сохранить читабельным но без этих символов, тоесть заменить их на наши.
Как быть?
Спасибо.