Master-X
Форум | Новости | Статьи
Главная » Форум » Программинг, Скрипты, Софт, Сервисы » 
Тема: Curl и cp1251
цитата
10/07/09 в 01:11
 Sterx
имеем курл запрос
возвращает заголовок+тело страницы
обращаемся к яндексу - получаем кракозябры
ставим CURLOPT_HTTPHEADER=>"Accept-Charset: utf-8"
или CURLOPT_HTTPHEADER=>"Accept-Charset: cp1251"
возвращает нормальный текст
однако, при работе preg_match_all
в результирующем массиве снова кракозябры
что не так?
цитата
10/07/09 в 01:24
 allchange
у меня подобное было помогало что-то вроде этого $result = iconv ('CP1251','UTF-8',$result);
цитата
10/07/09 в 01:55
 Sterx
ага
привожу к виду таким образом
но выражения из БД
с полученным текстом отказываются сравниваться
должно быть чтото еще

это только на некоторых хостах такое
цитата
10/07/09 в 02:28
 Sterx
то есть cp1251
и преобразованная utf-8 в cp1251(iconv)
разные.

точно также и полученная с помощью правильного хидера
также разные

вывод одинаков, а хеш разный
цитата
14/07/09 в 14:17
 flying
Как оценивалась "нормальность" текста? Например вывод текстов в шестнадцатиричном дампе дает разные результаты?

Вообще для дальнейшего анализа было бы хорошо получить примеры текстов. Проблема явно в том что из разных источников приходят данные в разных кодировках (при этом с Яндекса по-идее все идет в utf-8).

Да, и еще один момент: попробуй использовать "windows-1251" вместо "cp1251", это все-таки стандартное именование данной кодовой таблицы.
цитата
14/07/09 в 14:32
 Sterx
спасибо разобрался уже
страницы на разных хостах принимались курлом в разных кодировках
cp1251 всегда и использовал


Эта страница в полной версии