Чем парсить HTML?

Чем парсить XML — не вопрос. Проблема в том, что HTML — не всегда well-formed XML. Существует пакет org.w3c.dom.html, описывающий интерсфейсы модели DOM для HTML. А как теперь получить этот самый HTMLDocument ???

Нашел такую штуку : http://www.docuverse.com/domsdk/
Использует javax.swing.text.html.parser для создания SAX парсера и для создния DOM. Но нифига не понимает таких, например, вещей:

<img src="myimage.jpg">

может я чего-то не понимаю? Существует ли какое-то СТАНДАРТНОЕ решение для работы с DOM HTML ????

Переместить
Удалить
Выделить ветку

Пока на собственное сообщение не было ответов, его можно удалить.

	От:	Borisman
	Дата:	27.05.03 06:19
	Оценка: