Помогите с регулярным выражением - .NET

Здравствуйте.
Есть HTML таблица:
<table>
<tr>
<td>aaa</td>
<td>bbb</td>
</tr>

<tr>
<td>ccc</td>
<td>ddd</td>
</tr>
</table>

Помогите составить регулярное выражение, с помощью которого можно вытащить текст из ячеек.

Здравствуйте, Divineshadow, Вы писали:

D>Помогите составить регулярное выражение, с помощью которого можно вытащить текст из ячеек.

Может стоит попробовать SgmlReader?

... << RSDN@Home 1.2.0 alpha rev. 786>>

<td>(?<text>[^>]*)</td>

Здравствуйте, Divineshadow, Вы писали:

D>Здравствуйте.
D>Есть HTML таблица:
D><table>
D><tr>
D> <td>aaa</td>
D> <td>bbb</td>
D></tr>

D><tr>
D> <td>ccc</td>
D> <td>ddd</td>
D></tr>
D></table>

D>Помогите составить регулярное выражение, с помощью которого можно вытащить текст из ячеек.

Конкретно для данного примера (без учета переноса строк внутри тага, возможных атрибутов у td и прочих вариаций):
(<td>)(\\w.*)(</)
и брать группу #2 как результат.

Здравствуйте, Lloyd, Вы писали:

L>Может стоит попробовать SgmlReader?

Или это: http://www.majestic12.co.uk/projects/html_parser.php

... << RSDN@Home 1.2.0 alpha 4 rev. 1089>>

Здравствуйте, Divineshadow, Вы писали:

D>Здравствуйте.
D>Есть HTML таблица:
...
D>Помогите составить регулярное выражение, с помощью которого можно вытащить текст из ячеек.

Шутки-шутками, а мне самому не так давно пришлось парсить html-страницу. И я тоже решил делать это регулярными выражениями. И больше того — сделал.

И только задним числом осознал, что это задача для XPath.

Здравствуйте, mrozov, Вы писали:

M>Здравствуйте, Divineshadow, Вы писали:

D>>Здравствуйте.
D>>Есть HTML таблица:
M>...
D>>Помогите составить регулярное выражение, с помощью которого можно вытащить текст из ячеек.

M>Шутки-шутками, а мне самому не так давно пришлось парсить html-страницу. И я тоже решил делать это регулярными выражениями. И больше того — сделал.

M>И только задним числом осознал, что это задача для XPath.

Это если удастся сделать из html xml.

Здравствуйте, anton_t, Вы писали:

_>Это если удастся сделать из html xml.

дык

Здравствуйте, Lloyd, Вы писали:

L>Может стоит попробовать SgmlReader?
Может быть я конечно что то не правильно делаю, но он даже http://ya.ru распарсить не может..

Правда некоторые странички по сложнее иногда всё-таки поддаются..

В результате пришлось написать собственный простейший html парсер...

Всем спасибо за ответы.

Переместить
Удалить
Выделить ветку

Пока на собственное сообщение не было ответов, его можно удалить.

	От:	Divineshadow
	Дата:	10.06.08 12:45
	Оценка:

	От:	Lloyd
	Дата:	10.06.08 13:17
	Оценка:	1 (1) +1

	От:	Nikolkos
	Дата:	10.06.08 13:27
	Оценка:	3 (1)

	От:	gyraboo
	Дата:	10.06.08 13:32
	Оценка:

	От:	pr0ff
	Дата:	10.06.08 20:54
	Оценка:	1 (1)

	От:	mrozov
	Дата:	11.06.08 09:59
	Оценка:

	От:	anton_t
	Дата:	11.06.08 14:07
	Оценка:

	От:	mrozov
	Дата:	11.06.08 16:14
	Оценка: