Master-X
Регистрация
|
Вход
Форум
|
Новости
|
Статьи
Главная
»
Форум
»
Программинг, Скрипты, Софт, Сервисы
»
Тема:
Curl и cp1251
Новая тема
Ответить
цитата
10/07/09 в 01:11
Sterx
имеем курл запрос
возвращает заголовок+тело страницы
обращаемся к яндексу - получаем кракозябры
ставим CURLOPT_HTTPHEADER=>"Accept-Charset: utf-8"
или CURLOPT_HTTPHEADER=>"Accept-Charset: cp1251"
возвращает нормальный текст
однако, при работе preg_match_all
в результирующем массиве снова кракозябры
что не так?
цитата
10/07/09 в 01:24
allchange
у меня подобное было помогало что-то вроде этого $result = iconv ('CP1251','UTF-8',$result);
цитата
10/07/09 в 01:55
Sterx
ага
привожу к виду таким образом
но выражения из БД
с полученным текстом отказываются сравниваться
должно быть чтото еще
это только на некоторых хостах такое
цитата
10/07/09 в 02:28
Sterx
то есть cp1251
и преобразованная utf-8 в cp1251(iconv)
разные.
точно также и полученная с помощью правильного хидера
также разные
вывод одинаков, а хеш разный
цитата
14/07/09 в 14:17
flying
Как оценивалась "нормальность" текста? Например вывод текстов в шестнадцатиричном дампе дает разные результаты?
Вообще для дальнейшего анализа было бы хорошо получить примеры текстов. Проблема явно в том что из разных источников приходят данные в разных кодировках (при этом с Яндекса по-идее все идет в utf-8).
Да, и еще один момент: попробуй использовать "windows-1251" вместо "cp1251", это все-таки стандартное именование данной кодовой таблицы.
цитата
14/07/09 в 14:32
Sterx
спасибо разобрался уже
страницы на разных хостах принимались курлом в разных кодировках
cp1251 всегда и использовал
Новая тема
Ответить
Эта страница в полной версии