Помогите с регулярным выражением
От: Divineshadow  
Дата: 10.06.08 12:45
Оценка:
Здравствуйте.
Есть HTML таблица:
<table>
<tr>
<td>aaa</td>
<td>bbb</td>
</tr>

<tr>
<td>ccc</td>
<td>ddd</td>
</tr>
</table>

Помогите составить регулярное выражение, с помощью которого можно вытащить текст из ячеек.
Re: Помогите с регулярным выражением
От: Lloyd Россия  
Дата: 10.06.08 13:17
Оценка: 1 (1) +1
Здравствуйте, Divineshadow, Вы писали:

D>Помогите составить регулярное выражение, с помощью которого можно вытащить текст из ячеек.


Может стоит попробовать SgmlReader?
... << RSDN@Home 1.2.0 alpha rev. 786>>
Re: Помогите с регулярным выражением
От: Nikolkos  
Дата: 10.06.08 13:27
Оценка: 3 (1)
Здравствуйте, Divineshadow, Вы писали:

D>Здравствуйте.

D>Есть HTML таблица:
D><table>
D><tr>
D> <td>aaa</td>
D> <td>bbb</td>
D></tr>

D><tr>

D> <td>ccc</td>
D> <td>ddd</td>
D></tr>
D></table>

D>Помогите составить регулярное выражение, с помощью которого можно вытащить текст из ячеек.


Так?

<td>(?<text>[^>]*)</td>
Re: Помогите с регулярным выражением
От: gyraboo  
Дата: 10.06.08 13:32
Оценка:
Здравствуйте, Divineshadow, Вы писали:

D>Здравствуйте.

D>Есть HTML таблица:
D><table>
D><tr>
D> <td>aaa</td>
D> <td>bbb</td>
D></tr>

D><tr>

D> <td>ccc</td>
D> <td>ddd</td>
D></tr>
D></table>

D>Помогите составить регулярное выражение, с помощью которого можно вытащить текст из ячеек.


Конкретно для данного примера (без учета переноса строк внутри тага, возможных атрибутов у td и прочих вариаций):
(<td>)(\\w.*)(</)
и брать группу #2 как результат.
Re[2]: Помогите с регулярным выражением
От: pr0ff  
Дата: 10.06.08 20:54
Оценка: 1 (1)
Здравствуйте, Lloyd, Вы писали:

L>Может стоит попробовать SgmlReader?


Или это: http://www.majestic12.co.uk/projects/html_parser.php
... << RSDN@Home 1.2.0 alpha 4 rev. 1089>>
Re: Помогите с регулярным выражением
От: mrozov  
Дата: 11.06.08 09:59
Оценка:
Здравствуйте, Divineshadow, Вы писали:

D>Здравствуйте.

D>Есть HTML таблица:
...
D>Помогите составить регулярное выражение, с помощью которого можно вытащить текст из ячеек.

Шутки-шутками, а мне самому не так давно пришлось парсить html-страницу. И я тоже решил делать это регулярными выражениями. И больше того — сделал.

И только задним числом осознал, что это задача для XPath.
Re[2]: Помогите с регулярным выражением
От: anton_t Россия  
Дата: 11.06.08 14:07
Оценка:
Здравствуйте, mrozov, Вы писали:

M>Здравствуйте, Divineshadow, Вы писали:


D>>Здравствуйте.

D>>Есть HTML таблица:
M>...
D>>Помогите составить регулярное выражение, с помощью которого можно вытащить текст из ячеек.

M>Шутки-шутками, а мне самому не так давно пришлось парсить html-страницу. И я тоже решил делать это регулярными выражениями. И больше того — сделал.


M>И только задним числом осознал, что это задача для XPath.


Это если удастся сделать из html xml.
Re[3]: Помогите с регулярным выражением
От: mrozov  
Дата: 11.06.08 16:14
Оценка:
Здравствуйте, anton_t, Вы писали:

_>Это если удастся сделать из html xml.


дык
Автор: Lloyd
Дата: 10.06.08
Re[2]: Помогите с регулярным выражением
От: Divineshadow  
Дата: 16.06.08 11:08
Оценка:
Здравствуйте, Lloyd, Вы писали:

L>Может стоит попробовать SgmlReader?

Может быть я конечно что то не правильно делаю, но он даже http://ya.ru распарсить не может..
Правда некоторые странички по сложнее иногда всё-таки поддаются..
Re: Помогите с регулярным выражением
От: Divineshadow  
Дата: 18.06.08 06:04
Оценка:
В результате пришлось написать собственный простейший html парсер...
Всем спасибо за ответы.
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.