xpath in html
От: bukazoid  
Дата: 05.06.07 11:53
Оценка:
hi

хотелось бы разбирать html в дерево
и xpath подобными запросами выбирать нужные вершины.

нащёл на perl
xsh и HTML::TreeBuilder::XPath

хотелось бы на java подобное.

линком ткните.
Re: xpath in html
От: beshenov  
Дата: 05.06.07 11:54
Оценка:
Здравствуйте, bukazoid, Вы писали:

B>hi


B>хотелось бы разбирать html


XHTML?
Re[2]: xpath in html
От: bukazoid  
Дата: 05.06.07 12:06
Оценка:
Здравствуйте, beshenov, Вы писали:

B>Здравствуйте, bukazoid, Вы писали:


B>>hi


B>>хотелось бы разбирать html


B>XHTML?


предлагаете конвертировать ?

желательно без конвертирования
Re[3]: xpath in html
От: beshenov  
Дата: 05.06.07 12:16
Оценка:
Здравствуйте, bukazoid, Вы писали:

B>>XHTML?


B>предлагаете конвертировать ?


B>желательно без конвертирования


Ничего не предлагаю, но с XHTML вы будете работать как с XML, поэтому готовые решения найти проще.
Re[4]: xpath in html
От: bukazoid  
Дата: 05.06.07 13:34
Оценка:
Здравствуйте, beshenov, Вы писали:

B>Здравствуйте, bukazoid, Вы писали:


B>>>XHTML?


B>>предлагаете конвертировать ?


B>>желательно без конвертирования


B>Ничего не предлагаю, но с XHTML вы будете работать как с XML, поэтому готовые решения найти проще


уточню вопрос
хотелось бы разбирать html С СЕРВЕРА в дерево.

ps. впринципе весь проэкт это компонент для управления кучей железок имеющих web-only управление.
Re[5]: xpath in html
От: bedrin  
Дата: 05.06.07 14:23
Оценка:
Здравствуйте, bukazoid, Вы писали:

B>уточню вопрос

B>хотелось бы разбирать html С СЕРВЕРА в дерево.

B>ps. впринципе весь проэкт это компонент для управления кучей железок имеющих web-only управление.


Google: java html2xml
Re[5]: xpath in html
От: beshenov  
Дата: 05.06.07 14:31
Оценка:
Здравствуйте, bukazoid, Вы писали:

B>>>>XHTML?


B>>>предлагаете конвертировать ?


B>>>желательно без конвертирования


B>>Ничего не предлагаю, но с XHTML вы будете работать как с XML, поэтому готовые решения найти проще


B>уточню вопрос

B>хотелось бы разбирать html С СЕРВЕРА в дерево.

XHTML --- гораздо легче, универсальнее и надежнее. Если HTML валидный, то переход на XHTML можно более-менее автоматизировать.

B>ps. впринципе весь проэкт это компонент для управления кучей железок имеющих web-only управление.


Не вполне ясно. Железки не ваши и гипертекстовая разметка не ваша? Ну тогда только желаю удачи в поисках парсера для HTML :-/
Re[6]: xpath in html
От: bukazoid  
Дата: 05.06.07 15:02
Оценка:
Здравствуйте, beshenov, Вы писали:

B>Не вполне ясно. Железки не ваши и гипертекстовая разметка не ваша? Ну тогда только желаю удачи в поисках парсера для HTML


Железки наши.
прошивка от производителя.
гипертекстовая разметка естественно не наша

B>Ну тогда только желаю удачи в поисках парсера для HTML


ключевой момент
Re: xpath in html
От: bolshik Россия http://denis-zhdanov.blogspot.com/
Дата: 05.06.07 15:26
Оценка:
Здравствуйте, bukazoid, Вы писали:

B>hi


B>хотелось бы разбирать html в дерево

B>и xpath подобными запросами выбирать нужные вершины.

B>нащёл на perl

B>xsh и HTML::TreeBuilder::XPath

B>хотелось бы на java подобное.


B>линком ткните.


тык -> JTidy?

P.S. сам не пробовал, только у Брайана читал
http://denis-zhdanov.blogspot.com
Re[3]: xpath in html
От: Alex Leshkin  
Дата: 06.06.07 05:17
Оценка:
Здравствуйте, bukazoid, Вы писали:
B>>>хотелось бы разбирать html
B>желательно без конвертирования
ну тогда наверно java html parser
... << RSDN@Home 1.1.4 stable SR1 rev. 568>>
Re[4]: xpath in html
От: bukazoid  
Дата: 06.06.07 13:12
Оценка:
Здравствуйте, Alex Leshkin, Вы писали:

AL>Здравствуйте, bukazoid, Вы писали:

B>>>>хотелось бы разбирать html
B>>желательно без конвертирования
AL>ну тогда наверно java html parser
фильтр вершин аля xpath ?
Re[5]: xpath in html
От: Alex Leshkin  
Дата: 06.06.07 13:57
Оценка:
Здравствуйте, bukazoid, Вы писали:

B>>>>>хотелось бы разбирать html

B>>>желательно без конвертирования
AL>>ну тогда наверно java html parser
B>фильтр вершин аля xpath ?
ну типа того.
... << RSDN@Home 1.1.4 stable SR1 rev. 568>>
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.