Но проблема в том что регулярное выражение это не может выбрать правильно скажем такие урл
<a href="http://google.com?id='10'">
<a href='http://google.com"> — не правильно!
я понимаю что выражение (?>[\\\"\\\'])? — должен встретится символ ' или " или вообще ни один из них
А как сделать, чтобы скажем результат (?>[\\\"\\\'])? запомнился и применился после окончания урл? т.е.
если стоит " в начале, то и заканчиватся урл должен только "
Здравствуйте, Socket, Вы писали:
S>А как сделать, чтобы скажем результат (?>[\\\"\\\'])? запомнился и применился после окончания урл? т.е. S>если стоит " в начале, то и заканчиватся урл должен только "
Использовать back references.
<\\s*a\\s+href\\s*=\\s*(?>[\\\"\\\'])?([^\\s\\>\\\'\\\"]+)\\1.*>
Здравствуйте, Roman Odaisky, Вы писали:
RO>Здравствуйте, Socket, Вы писали:
S>><\\s*a\\s*href\\s*=\\s*(?>[\\\"\\\'])?([^\\s\\>\\\'\\\"]+)(?>[\\\"\\\'])?.*>
RO>Неправильное оно: <A CLASS=LARGE HREF="http://example.com">.
Я забыл указать что html код изначально прирявнян к нижнему регистру, потому icase флаг мне не нужен.
Здравствуйте, Yagg, Вы писали:
Y>Здравствуйте, Socket, Вы писали:
S>>А как сделать, чтобы скажем результат (?>[\\\"\\\'])? запомнился и применился после окончания урл? т.е. S>>если стоит " в начале, то и заканчиватся урл должен только " Y>Использовать back references. Y><\\s*a\\s+href\\s*=\\s*(?>[\\\"\\\'])?([^\\s\\>\\\'\\\"]+)\\1.*>
Почему то ругулярка которую вы мне дали не работает.
Может быть я чтото не так делаю?
т.к. вы мне дали линк на описание синтаксиса перла, то я добавил boost::regex::perl
Здравствуйте, Socket, Вы писали:
S>Добрый день! S>Пытаюсь выбрать урл из html кода. S>Вопрос мой скорее к знатокам регулярных выражений. S>Написал вот я код на С++
Здравствуйте, c-smile, Вы писали:
CS>Здравствуйте, Socket, Вы писали:
S>>Добрый день! S>>Пытаюсь выбрать урл из html кода. S>>Вопрос мой скорее к знатокам регулярных выражений. S>>Написал вот я код на С++
CS>...
CS>Берем: CS>http://www.codeproject.com/cpp/HTML_XML_Scanner.asp
Здравствуйте, c-smile, Вы писали:
CS>Здравствуйте, Socket, Вы писали:
S>>Добрый день! S>>Пытаюсь выбрать урл из html кода. S>>Вопрос мой скорее к знатокам регулярных выражений. S>>Написал вот я код на С++
CS>...
CS>Берем: CS>http://www.codeproject.com/cpp/HTML_XML_Scanner.asp
CS>и пишем:
CS>
Здравствуйте, c-smile, Вы писали:
CS>и будет тебе шастя.
Действительно щастья подвалило с твоим исправлением.
На долго ли — отпишу ч-з пару дней, поюзаем эту либу на скорость и вылеты, я отпишу насколько она хороша
Здравствуйте, Socket, Вы писали:
S>Здравствуйте, c-smile, Вы писали:
CS>>и будет тебе шастя.
S>Действительно щастья подвалило с твоим исправлением. S>На долго ли — отпишу ч-з пару дней, поюзаем эту либу на скорость и вылеты, я отпишу насколько она хороша
Общал отписать отзыв о этой библиотеке.
В общем неделю работает. Работает быстро, вылетов из за использования этой библиотеки не было обнаружено.
В общем буду продалжать использовать ее для выбора урл