Re[3]: библиотека для парса веб контента
От: den123 Израиль http://den123.smugmug.com
Дата: 29.01.13 18:44
Оценка:
Здравствуйте, a.v.v, Вы писали:

AVV>Здравствуйте, den123, Вы писали:


D>>Если вы хотите писать что-то типа робота, то есть отличный фрэймворк — HtmlUnit. Этот же фрэймворк поможет "вытащить" HTML текст.


AVV>да, писать предполагается робота который будет ползать по заданным сайтам и анализировать изменения и выжимку скидывать в базу


HtmlUnit очень хорошо подходит для написания роботов. Он создавался для написания тестов, проверяющих работу сайтов, но ничто не мешает использовать его для написания роботов. Сделан очень грамотно. Рекомендую.
WBR — Yuriy
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.