HTML парсер для Firemonkey
От: Tai  
Дата: 11.08.20 10:57
Оценка:
Здравствуйте,
Посоветуйте, пожалуйста, хороший HTML парсер для Firemonkey (Windows, Android). Нужно извлечь все ссылки из html-строки.
Re: HTML парсер для Firemonkey
От: gyraboo Россия  
Дата: 12.08.20 12:00
Оценка:
Здравствуйте, Tai, Вы писали:

Tai>Посоветуйте, пожалуйста, хороший HTML парсер для Firemonkey (Windows, Android). Нужно извлечь все ссылки из html-строки.


А обычный регэксп не сгодится? Ну типа http[s]?://[\w.?=%&]+
Надо ли извлекать только ссылки из незакоментаренного html-кода, или включая те, что в комментах, в контенте тегов и в закоментаренном коде?
www.nanonewsnet.ru
Re[2]: HTML парсер для Firemonkey
От: Mystic Artifact  
Дата: 12.08.20 12:26
Оценка:
Здравствуйте, gyraboo, Вы писали:

G>А обычный регэксп не сгодится? Ну типа http[s]?://[\w.?=%&]+

Ну, незнаю насколько это нужно ТС, но в html документе, в URL — схема и хост не обязательны, а так же путь не обязательно абсолютный.
Re[3]: HTML парсер для Firemonkey
От: gyraboo Россия  
Дата: 12.08.20 12:36
Оценка: +1
Здравствуйте, Mystic Artifact, Вы писали:

G>>А обычный регэксп не сгодится? Ну типа http[s]?://[\w.?=%&]+

MA> Ну, незнаю насколько это нужно ТС, но в html документе, в URL — схема и хост не обязательны, а так же путь не обязательно абсолютный.

Поэтому и спрашиваю. От этого зависит выбор способа парсинга, если нужны только ссылки из относительно валидного html-а, то надо парсить html-парсером как DOM и выцеплять ссылки как значения атрибутов из объектной модели распарсенного документа.
Если же надо получить вообще все ссылки, включая ссылки из контента и закомментаренного кода — то тут html-парсер вообще не при делах, и нужно парсить регэкспом, и он конечно будет посложнее приведенного выше.
www.nanonewsnet.ru
Re: HTML парсер для Firemonkey
От: BlackEric http://black-eric.lj.ru
Дата: 13.08.20 08:14
Оценка:
Здравствуйте, Tai, Вы писали:

Tai>Здравствуйте,

Tai>Посоветуйте, пожалуйста, хороший HTML парсер для Firemonkey (Windows, Android). Нужно извлечь все ссылки из html-строки.

Extract HTML Tag information, Such as Links, Images

Вот это можно подпилить.
https://github.com/BlackEric001
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.