Re: Простой парсер HTML - C/C++. Прикладные вопросы

Здравствуйте, Аноним, Вы писали:

А>Подскажите пожалуйста простой и быстрый парсер HTML, open-source, под Windows.

HTML за всё время существования оброс таким количеством *****, что простых парсеров его в природе существовать не может.

Здравствуйте, Centaur, Вы писали:

C>HTML за всё время существования оброс таким количеством *****, что простых парсеров его в природе существовать не может.

А если снять требование простоты?

А>Подскажите пожалуйста простой и быстрый парсер HTML, open-source, под Windows.

При чём тут Windows вообще?

Поиск по этому сайту с запросом "парсер HTML" откроет много чудес...

Здравствуйте, igna, Вы писали:

C>>HTML за всё время существования оброс таким количеством *****, что простых парсеров его в природе существовать не может.

I>А если снять требование простоты?

Тогда можно выдирать из Firefox’а, Chromium’а, WebKit’а, а то и lynx’а/links’а.

Здравствуйте, Аноним, Вы писали:

А>Подскажите пожалуйста простой и быстрый парсер HTML, open-source, под Windows.

А что у простого парсера HTML должно быть на выходе?

А>Подскажите пожалуйста простой и быстрый парсер HTML, open-source, под Windows.

http://www.jezuk.co.uk/cgi-bin/view/arabica/log?id=3591

tagsoup / taggle

отмазка -- я ими не пользовался (хотя собираюсь)

Здравствуйте, Аноним, Вы писали:

А>Подскажите пожалуйста простой и быстрый парсер HTML, open-source, под Windows.

Есть http://sourceforge.net/projects/htmlcxx/ C++ там есть vcproj файлы, но он особенно не развивается

Есть http://www.netsurf-browser.org/projects/hubbub/, там надо подтащить пару библиотек от тех же разработчиков, нет файла сборки под винду, но портировать его сборку на CMake мне удалось без проблем, то есть и vcproj должен быть не сложный

Здравствуйте, hotdox, Вы писали:

H>Здравствуйте, Аноним, Вы писали:

А>>Подскажите пожалуйста простой и быстрый парсер HTML, open-source, под Windows.

H>Есть http://sourceforge.net/projects/htmlcxx/ C++ там есть vcproj файлы, но он особенно не развивается

H>Есть http://www.netsurf-browser.org/projects/hubbub/, там надо подтащить пару библиотек от тех же разработчиков, нет файла сборки под винду, но портировать его сборку на CMake мне удалось без проблем, то есть и vcproj должен быть не сложный

Использовал оба, второй нравиться больше

Здравствуйте, Аноним, Вы писали:

А>Подскажите пожалуйста простой и быстрый парсер HTML, open-source, под Windows.

libtidy + libxslt + libxml2

Переместить
Удалить
Выделить ветку

Пока на собственное сообщение не было ответов, его можно удалить.

	От:	Аноним
	Дата:	02.03.12 15:45
	Оценка:

	От:	Centaur
	Дата:	02.03.12 16:03
	Оценка:

	От:	igna
	Дата:	02.03.12 16:05
	Оценка:

	От:	Kswapd
	Дата:	02.03.12 16:33
	Оценка:	+1

	От:	Centaur
	Дата:	03.03.12 06:20
	Оценка:	3 (1)

От:	c-smile	http://terrainformatica.com
Дата:	03.03.12 06:52
Оценка:

	От:	hotdox
	Дата:	04.03.12 12:38
	Оценка:

	От:	hotdox
	Дата:	04.03.12 12:38
	Оценка:

	От:	Cruelty
	Дата:	07.03.12 13:35
	Оценка: