HTML -> XML
От: leshka  
Дата: 29.01.02 15:52
Оценка:
Добрый день!

Может кто-нибудь посоветует быcтрое и красивое программное решение данной проблемы.

Заранее благодарен.
Re: HTML -> XML
От: AliBaba  
Дата: 30.01.02 18:10
Оценка:
Я бы тоже послушал. Какой-нибудь способ перегонки html в xml. Сложный, простой — лишь бы работал. Не писать же парсер самому. :)
Re[2]: HTML -> XML
От: kig Россия  
Дата: 30.01.02 20:46
Оценка: 5 (1)
Здравствуйте AliBaba, Вы писали:

AB>Я бы тоже послушал. Какой-нибудь способ перегонки html в xml. Сложный, простой — лишь бы работал. Не писать же парсер самому. :)


А MSHTML не подходит в качестве парсера HTML? Кстати, через интерфейсы IHTMLDOMxxx он уже представляет HTML в виде, очень похожем IXMLDOMxxx.
;)
Re[3]: HTML -> XML
От: leshka  
Дата: 30.01.02 21:07
Оценка:
Здравствуйте kig, Вы писали:

kig>Здравствуйте AliBaba, Вы писали:


AB>>Я бы тоже послушал. Какой-нибудь способ перегонки html в xml. Сложный, простой — лишь бы работал. Не писать же парсер самому. :)


kig>А MSHTML не подходит в качестве парсера HTML? Кстати, через интерфейсы IHTMLDOMxxx он уже представляет HTML в виде, очень похожем IXMLDOMxxx.

kig> ;)

Подходит, я сейчас так и делаю, но может есть более красивый способ, чем обходить все дерево HTML, параллельно создавая XML ?
Re[4]: HTML -> XML
От: Dancom Украина  
Дата: 31.01.02 10:21
Оценка:
Для конвертирования HTML -> XTML есть тулза
HTML Tidy.

Найти можно на W3.org раздел XML ;)
Re[5]: HTML -> XML
От: entin  
Дата: 19.02.02 10:26
Оценка:
Здравствуйте Dancom, Вы писали:

D>Для конвертирования HTML -> XTML есть тулза

D>HTML Tidy.

D>Найти можно на W3.org раздел XML


Я его пробовал использовать в проекте — работает, но не всегда. Если HTML сильно кривой — ломается без выходного XHTML.

Еще минус — он в виде .exe. Было бы неплохо переделать его в COM объект. Но у меня руки не дошли до этого.
Re[6]: HTML -> XML
От: Irenkov_Alexander  
Дата: 04.03.02 07:10
Оценка:
Здравствуйте entin, Вы писали:

D>>Для конвертирования HTML -> XTML есть тулза

D>>HTML Tidy.

E>Еще минус — он в виде .exe. Было бы неплохо переделать его в COM объект. Но у меня руки не дошли до этого.


Руки до этого уже дошли. TidyCOM. http://perso.wanadoo.fr/ablavier/TidyCOM/
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.