Здравствуйте, Holms, Вы писали:
H>а не подскажет народ где можно найти маленький, кроссплатформенный HTML парсер, H>для парсинга и выявлениы значений.
Рекоменду немного изучать Java. Кросс-платформенная
Здравствуйте, CMEX_, Вы писали:
CME>Здравствуйте, Holms, Вы писали:
H>>а не подскажет народ где можно найти маленький, кроссплатформенный HTML парсер, H>>для парсинга и выявлениы значений. CME>Рекоменду немного изучать Java. Кросс-платформенная
Здравствуйте, Holms, Вы писали:
H> а не подскажет народ где можно найти маленький, кроссплатформенный HTML H> парсер, для парсинга и выявлениы значений. H> H> т.е. надо например узнать значение атрибутов и то что между тэгами H> H> т.е. если есть хтмл такой формы H> H>
H> H> надо найти для тэга а его атрибут и значение, H> для первого случая будет <img src="myimage.gif"> H> для второго CLick here
Если нужно просто выуживать значения атрибутов, то лучше использовать регулярные выражения. Если уж языки советовать для этих целей, то скорее на Perl надо смотреть. Джава тут абсолютно ни при чем.
-- Всего хорошего!
-- Alex Alexandrov, e-mail: alexandrov_alex@fromru.com
Posted via RSDN NNTP Server 1.7 "Bedlam"
It's kind of fun to do the impossible (Walt Disney)
Здравствуйте, alexandrov_alex, Вы писали:
_>Если нужно просто выуживать значения атрибутов, то лучше использовать регулярные выражения. Если уж языки советовать для этих целей, то скорее на Perl надо смотреть. Джава тут абсолютно ни при чем.
Согласен
как написать regexp который бы выдавал все содержимое тэга вместе с текстом внутри него (innerText)
Здравствуйте, Holms, Вы писали:
H> Здравствуйте, alexandrov_alex, Вы писали: H> H> _>Если нужно просто выуживать значения атрибутов, то лучше использовать H> регулярные выражения. Если уж языки советовать для этих целей, то скорее H> на Perl надо смотреть. Джава тут абсолютно ни при чем. Согласен H> H> как написать regexp который бы выдавал все содержимое тэга вместе с H> текстом внутри него (innerText) H> H> например. есть такой фрагмент документа H> H>
Есть замечательнейшая книга гражданина по фамилии Фридл, которая называется "Регулярные выражения". Посвящена эта книга, как это ни удивительно, регулярным выражениям. Издана в оригинале издательством O'Reilly, перевод — "Питер". Там много примеров, в основном как раз про выуживание тегов. Автор работал на Yahoo!, и я так понимаю, весь движок паука там на регулярных выражениях основан.
Примеров касательно вашей задачи я приводить не буду, ибо как боюсь опростоволоситься: с регулярными выражениями я еще нормально, а вот HTML для меня — не очень знакомая вещь.
-- Всего хорошего!
-- Alex Alexandrov, e-mail: alexandrov_alex@fromru.com
Posted via RSDN NNTP Server 1.7 "Bedlam"
It's kind of fun to do the impossible (Walt Disney)