Master-X
Форум | Новости | Статьи
Главная » Форум » Программинг, Скрипты, Софт, Сервисы » 
Тема: Html-парсинг. кривая верстка
цитата
12/11/10 в 16:14
 FXIX
перед тем как отправить на хтмл-парсер чем кривую верстку страницы выправлять? собственно два решения нагуглил
http://php.net/manual/en/book.tidy.php
http://htmlpurifier.org/
плюсы\минусы?
цитата
12/11/10 в 16:55
 _s_[sov]
FXIX: а что через XPath или preg_match актуальна валидная верстка?

я обычно собаку ставлю и не парюсь, а так да, варнингов через ДОМ повылазит.
цитата
12/11/10 в 17:33
 FXIX
нене. я с регулярками не работаю. только http://simplehtmldom.sourceforge.net
селектор div.content составил и вперед. все варнинги наружу. в лог. через 3 месяца верстка смениться а ты даже не увидишь за @. при объемах от 300 сайтов - и не захочешь видетьicon_smile.gif. а тем более регулярки писать сидеть.
собственно невалидность не мешает но хотелось бы поправлять как-то. хоть на 10%
цитата
12/11/10 в 17:40
 Yacc
FXIX писал:
нене. я с регулярками не работаю. только http://simplehtmldom.sourceforge.net

Наш человек. icon_smile.gif smail54.gif
цитата
12/11/10 в 21:43
 JM
ого спасибка за ссылочки


Эта страница в полной версии