Lexikon
Вчера потребовалось спарсить название одной категории товаров. Исключительно название товаров. Яндекс маркет разрешает папсить только 9-10 страниц, затем (302) снова примерно через 30 минут можно начать парсить, но вот если перезапускаю роутер (IP при этом остается), можно снова спарсить.
Возник вопрос, что именно может удаляться и тем самым позволяет снова парсить?
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $linkToContent);
curl_setopt($ch, CURLOPT_REFERER, $urlReferer);
curl_setopt($ch, CURLOPT_USERAGENT, $useragent);
curl_setopt($ch, CURLOPT_COOKIESESSION, TRUE);
//curl_setopt($ch, CURLOPT_HTTPHEADER, array('Expect:'));
curl_setopt($ch, CURLOPT_COOKIE, 'тут прописаны данные из кукисов браузера');
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_HEADER, 0);
curl_setopt($ch, CURLOPT_COOKIEJAR, 'COOKIE.txt');
curl_setopt($ch, CURLOPT_COOKIEFILE, 'COOKIE.txt');
curl_setopt($ch, CURLOPT_SSL_VERIFYHOST,0);
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER,0);
И еще один вопросик
Код:
curl_setopt($ch, CURLOPT_COOKIEFILE, 'COOKIE.txt');
как можно получить содержимое 'COOKIE.txt' ?
johndoe2
Lexikon писал:
И еще один вопросик
Код:
curl_setopt($ch, CURLOPT_COOKIEFILE, 'COOKIE.txt');
как можно получить содержимое 'COOKIE.txt' ?
COOKIE.txt по настройкам (CURLOPT_COOKIEJAR,CURLOPT_COOKIEFILE) лежит в рабочем каталоге скрипта.
CURLOPT_COOKIEFILE = откуда читать куки
CURLOPT_COOKIEJAR = куда писать куки