Простой парсер HTML
От: Аноним  
Дата: 02.03.12 15:45
Оценка:
Подскажите пожалуйста простой и быстрый парсер HTML, open-source, под Windows.
Re: Простой парсер HTML
От: Centaur Россия  
Дата: 02.03.12 16:03
Оценка:
Здравствуйте, Аноним, Вы писали:

А>Подскажите пожалуйста простой и быстрый парсер HTML, open-source, под Windows.


HTML за всё время существования оброс таким количеством *****, что простых парсеров его в природе существовать не может.
Re[2]: Простой парсер HTML
От: igna Россия  
Дата: 02.03.12 16:05
Оценка:
Здравствуйте, Centaur, Вы писали:

C>HTML за всё время существования оброс таким количеством *****, что простых парсеров его в природе существовать не может.


А если снять требование простоты?
Re: Простой парсер HTML
От: Kswapd Россия  
Дата: 02.03.12 16:33
Оценка: +1
А>Подскажите пожалуйста простой и быстрый парсер HTML, open-source, под Windows.

При чём тут Windows вообще?

Поиск по этому сайту с запросом "парсер HTML" откроет много чудес...
Re[3]: Простой парсер HTML
От: Centaur Россия  
Дата: 03.03.12 06:20
Оценка: 3 (1)
Здравствуйте, igna, Вы писали:

C>>HTML за всё время существования оброс таким количеством *****, что простых парсеров его в природе существовать не может.


I>А если снять требование простоты?


Тогда можно выдирать из Firefox’а, Chromium’а, WebKit’а, а то и lynx’а/links’а.
Re: Простой парсер HTML
От: c-smile Канада http://terrainformatica.com
Дата: 03.03.12 06:52
Оценка:
Здравствуйте, Аноним, Вы писали:

А>Подскажите пожалуйста простой и быстрый парсер HTML, open-source, под Windows.


А что у простого парсера HTML должно быть на выходе?
Re: Простой парсер HTML
От: m e  
Дата: 03.03.12 08:44
Оценка:
А>Подскажите пожалуйста простой и быстрый парсер HTML, open-source, под Windows.

http://www.jezuk.co.uk/cgi-bin/view/arabica/log?id=3591

tagsoup / taggle

отмазка -- я ими не пользовался (хотя собираюсь)
Re: Простой парсер HTML
От: hotdox  
Дата: 04.03.12 12:38
Оценка:
Здравствуйте, Аноним, Вы писали:

А>Подскажите пожалуйста простой и быстрый парсер HTML, open-source, под Windows.


Есть http://sourceforge.net/projects/htmlcxx/ C++ там есть vcproj файлы, но он особенно не развивается

Есть http://www.netsurf-browser.org/projects/hubbub/, там надо подтащить пару библиотек от тех же разработчиков, нет файла сборки под винду, но портировать его сборку на CMake мне удалось без проблем, то есть и vcproj должен быть не сложный
Re[2]: Простой парсер HTML
От: hotdox  
Дата: 04.03.12 12:38
Оценка:
Здравствуйте, hotdox, Вы писали:

H>Здравствуйте, Аноним, Вы писали:


А>>Подскажите пожалуйста простой и быстрый парсер HTML, open-source, под Windows.


H>Есть http://sourceforge.net/projects/htmlcxx/ C++ там есть vcproj файлы, но он особенно не развивается


H>Есть http://www.netsurf-browser.org/projects/hubbub/, там надо подтащить пару библиотек от тех же разработчиков, нет файла сборки под винду, но портировать его сборку на CMake мне удалось без проблем, то есть и vcproj должен быть не сложный


Использовал оба, второй нравиться больше
Re: Простой парсер HTML
От: Cruelty  
Дата: 07.03.12 13:35
Оценка:
Здравствуйте, Аноним, Вы писали:

А>Подскажите пожалуйста простой и быстрый парсер HTML, open-source, под Windows.


libtidy + libxslt + libxml2
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.