Динамическая работа с HTML страницами
От: Marko  
Дата: 07.10.06 11:57
Оценка:
Здраствуйте,

Как можна средствами .NET динамически работать с HTML страницами?
Обясню на примере, что менно мне надо:
1. Загружаю например страницу Рамблера;
2. Строчку поиска заполняю фразой которую надо найти;
3. Нажимаю кнопку Найти, Как результат Рамблер возвращает мне найденые ссылки;
4. Нужно сохранить первые 3 страницы с результатами как отдельные файлы на диске;
Все это нужно сделать динамически.

Для End User все должно выглядеть следующим образом:
1. Есть Windows программа с одной кнопкой и одним текстовым полем;
2. Юзер вводит тект для поиска и нажимает кнопку Найти;
3. Програма проделывает все описаное ранее и информирует юзера что результаты сохранены где то на диске;

Работа с Рамблером это только пример. Нужна общая схема.

Буду благодарен за любые ответы или ссылки с примерами.
Marko.
Динамическая работа с HTML страницами
От: Аноним  
Дата: 07.10.06 20:27
Оценка:
Прочитайте про [email]http://msdn2.microsoft.com/en-us/library/system.net.webrequest.aspx]WebRequest. Параметры передаете в Url, например для Yandex можно передать параметр http://www.yandex.ru/yandsearch?stype=&nl=0&text=ASP.NET (поиск строки ASP.NET).
С помощью WebRequest получите текст HTML страницы, который можно разобрать с помощью RegEx или просто строковыми функциями.
Только подобная программа нарушает правила пользования поисковых систем. Засудят вас
--
Гайдар Магдануров
|]Блог | Сайт
Difficult I do now, impossible will take a while...


данное сообщение получено с www.gotdotnet.ru
ссылка на оригинальное сообщение
Re: Динамическая работа с HTML страницами
От: Marko  
Дата: 09.10.06 07:48
Оценка:
Спасибо за ответ,

Возможно я не совсем правильно описал вопрос ответ на который я ищу.
Да действительно с помощю класса WebRequest я могу получить текст передав параметры в Url. Но это только частичный случай.
В общем случае содержимое страницы с которой мне нужно работать изменяется изо дня в день — различное количесво текстовых полей, чекбоксов и других елементов управления. Проанализировав содержимое страницы и различные внешние параметры мне надо определить какие из чекбоксов виделить какие нет, какой текст ввести в кождый из текстовых полей и так далее.
После етого нужно нажать одну из кнопок на этой же странице и вот уже эту страницу которая сожержит ответ на мой реквест сохранить на диске.
Как резюме, проблеми две:
1. Каким образом и с помощью каких класов я могу перечислить все елементы управления на странице
и работать с ними(вводить текст в текстовые поля вибирать чекбоксы ...)
2. Каким образом и с помощью каких класов я могу несколько раз перегружать содержымое страницы и работать с
полученым контентом (эмулировать работу юзера с веб браузером).

P.S. Работа с Рамблером действительно только пример.

Спасибо,
Marko
Re: Динамическая работа с HTML страницами
От: Константин Л.  
Дата: 09.10.06 09:35
Оценка:
Здравствуйте, Marko, Вы писали:

[]

MSHTML
... << RSDN@Home 1.1.4 stable SR1 rev. 568>>
Re[2]: Динамическая работа с HTML страницами
От: _daily_  
Дата: 09.10.06 09:50
Оценка:
Здравствуйте, Marko,
Писал кодато точно такую же программу НО на С++ (+ в ней кроме рамблера есть возможность искать в других 20 поискавиках одновременно) могу скинуть исходники если интерестно отпишись мне на мыло
«Были холопами, стали рабами». A.Пугачева.
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.