Здравствуйте, Divineshadow, Вы писали:
D>Здравствуйте. D>Есть HTML таблица: D><table> D><tr> D> <td>aaa</td> D> <td>bbb</td> D></tr>
D><tr> D> <td>ccc</td> D> <td>ddd</td> D></tr> D></table>
D>Помогите составить регулярное выражение, с помощью которого можно вытащить текст из ячеек.
Здравствуйте, Divineshadow, Вы писали:
D>Здравствуйте. D>Есть HTML таблица: D><table> D><tr> D> <td>aaa</td> D> <td>bbb</td> D></tr>
D><tr> D> <td>ccc</td> D> <td>ddd</td> D></tr> D></table>
D>Помогите составить регулярное выражение, с помощью которого можно вытащить текст из ячеек.
Конкретно для данного примера (без учета переноса строк внутри тага, возможных атрибутов у td и прочих вариаций):
(<td>)(\\w.*)(</)
и брать группу #2 как результат.
Здравствуйте, Divineshadow, Вы писали:
D>Здравствуйте. D>Есть HTML таблица:
... D>Помогите составить регулярное выражение, с помощью которого можно вытащить текст из ячеек.
Шутки-шутками, а мне самому не так давно пришлось парсить html-страницу. И я тоже решил делать это регулярными выражениями. И больше того — сделал.
И только задним числом осознал, что это задача для XPath.
Здравствуйте, mrozov, Вы писали:
M>Здравствуйте, Divineshadow, Вы писали:
D>>Здравствуйте. D>>Есть HTML таблица: M>... D>>Помогите составить регулярное выражение, с помощью которого можно вытащить текст из ячеек.
M>Шутки-шутками, а мне самому не так давно пришлось парсить html-страницу. И я тоже решил делать это регулярными выражениями. И больше того — сделал.
M>И только задним числом осознал, что это задача для XPath.
Здравствуйте, Lloyd, Вы писали:
L>Может стоит попробовать SgmlReader?
Может быть я конечно что то не правильно делаю, но он даже http://ya.ru распарсить не может..
Правда некоторые странички по сложнее иногда всё-таки поддаются..