Доброго времени суток!
Необходимо автоматизировать брождение по сайтам.
Начал реализовывать на Perl'е, но спустя время решил отказаться от него ввиду сложности чтения кода через определенное время
Решил заюзать Python.
Вопрос: какие библиотеки существуют для питона позволяющие парсить страницы на предмет html-форм,
отправлять заполненые формы на сервер и тд и тп.
ЗЫ: было бы круто если бы кто-нить провел аналогию с пеловыми библами
LWP::UserAgent — Web user agent class
HTML::Parser — HTML parser class
HTML::Form — Class that represents an HTML form element
HTTP::Request — HTTP style request message
HTTP::Response — HTTP style response message
Спасибо за внимание!
Здравствуйте, __chaos__, Вы писали:
___>Вопрос: какие библиотеки существуют для питона позволяющие парсить страницы на предмет html-форм,
___>отправлять заполненые формы на сервер и тд и тп.
например, связка urllib2+ClientForm:
http://wwwsearch.sourceforge.net/old/ClientForm/
Здравствуйте, __chaos__, Вы писали:
___>Вопрос: какие библиотеки существуют для питона позволяющие парсить страницы на предмет html-форм,
___>отправлять заполненые формы на сервер и тд и тп.
Может на либы для скрейпинга посмотреть?
scrapy,
scrape.py, вроде ещё были, с ходу не вспоминается.
Или взять тот же
lxml?
Здравствуйте, neFormal, Вы писали:
F>Здравствуйте, __chaos__, Вы писали:
___>>Вопрос: какие библиотеки существуют для питона позволяющие парсить страницы на предмет html-форм,
___>>отправлять заполненые формы на сервер и тд и тп.
F>например, связка urllib2+ClientForm: http://wwwsearch.sourceforge.net/old/ClientForm/
то что надо! Спасибо!
ЗЫ посмотрю что еще предложат
Здравствуйте, Курилка, Вы писали:
К>Здравствуйте, __chaos__, Вы писали:
___>>Вопрос: какие библиотеки существуют для питона позволяющие парсить страницы на предмет html-форм,
___>>отправлять заполненые формы на сервер и тд и тп.
К>Может на либы для скрейпинга посмотреть?
К>scrapy, scrape.py, вроде ещё были, с ходу не вспоминается.
К>Или взять тот же lxml?
пищщу
отпад!
сравню что лучше для моей задачи: или предложенное вами или ClientForm.
ЗЫ пробежав по диагонали по ClientForm и lxml заметил что аттач файла у 1го выполняется очень просто, у 2го не заметил пока
А я для простеньких нужд использовал mechanize, там кажется встроен clientform.