HTTP парсинг результатов поиска
От: Аноним  
Дата: 03.08.10 06:43
Оценка:
Добрый день.

Никогда в этой области ничего не писал, потому прошу совета в плане выбора инструментов.

Имеется несколько сайтов такого плана:
http://zakupki.gov.ru/Tender/Purchase.aspx (тут кроме данных из таблицы понадобится еще печатная форма и, возможно, подробная информация, ссылки на которые в первом столбце располагаются)
http://sberbank-ast.ru/purchaseList.aspx (ну и тут тоже подробная инфа потребуется)

В общем, нужно вбивать параметры в формы поиска и извлекать результаты из табличек.
Проблема у меня в выборе инструментов.
Что лучше для данной задачи использовать?
WebBrowser, HttpWebRequest, WebClient,....?
Re: HTTP парсинг результатов поиска
От: andrey82  
Дата: 03.08.10 06:59
Оценка:
Здравствуйте, Аноним, Вы писали:

А>Добрый день.


А>Никогда в этой области ничего не писал, потому прошу совета в плане выбора инструментов.

А>...

А>В общем, нужно вбивать параметры в формы поиска и извлекать результаты из табличек.

А>Проблема у меня в выборе инструментов.
А>Что лучше для данной задачи использовать?
А>WebBrowser, HttpWebRequest, WebClient,....?

Я обычно использовал для подобных задач WatiN (для нормальной обработки страниц со скриптами)
Скачивание простых страниц/картинок и отправка данных — HttpWebRequest
Разбор скачанных HTML страниц — HtmlAgilityPack
Re: HTTP парсинг результатов поиска
От: andrey82  
Дата: 03.08.10 07:02
Оценка:
Здравствуйте, Аноним, Вы писали:

А>В общем, нужно вбивать параметры в формы поиска и извлекать результаты из табличек.

А>Проблема у меня в выборе инструментов.
А>Что лучше для данной задачи использовать?
А>WebBrowser, HttpWebRequest, WebClient,....?

Еще забыл упомянуть такие полезные инструменты, как Firebug (расширение для Firefox для просмотра DOM структуры страницы) и Fiddler (анализ HTTP трафика — строки запросов, кукисы, имена POST параметров).
Re[2]: HTTP парсинг результатов поиска
От: Аноним  
Дата: 03.08.10 07:15
Оценка:
Здравствуйте, andrey82, Вы писали:

A>Я обычно использовал для подобных задач WatiN (для нормальной обработки страниц со скриптами)

A>Скачивание простых страниц/картинок и отправка данных — HttpWebRequest
A>Разбор скачанных HTML страниц — HtmlAgilityPack

Ага. Благодарю за наводку. Буду копать в этом направлении
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.