Re[4]: Как получить не теги из HTML
От: Кодёнок  
Дата: 18.11.04 09:44
Оценка: 2 (1)
Ну тогда тебе повезло! Есть такой метод, IHTMLElement2::getAdjacentText() — работает именно так как тебе нужно.

ActivePython 2.3.2 Build 231 (ActiveState Corp.) based on
Python 2.3.2 (#49, Nov  6 2003, 10:18:20) [MSC v.1200 32 bit (Intel)] on win32
Type "help", "copyright", "credits" or "license" for more information.
>>> import win32com.client
>>> ie = win32com.client.Dispatch("internetexplorer.application")
>>> ie.Navigate2("about:hey<HR>how<HR>wow")
>>> ie.Document.all.tags("HR")[1].getAdjacentText("beforeBegin")
u'how'
>>> ie.Document.all.tags("HR")[1].getAdjacentText("afterEnd")
u'wow'
>>>


Для элементов типа <HR> только эти два работает, остальные два (afterBegin и beforeEnd) вызывают ошибку.

A_S>>>><HR>

A_S>>>>Как получить этиу строку
A_S>>>><HR>

A_S>А задача такая, открытый в IE html документ нужно загнать в list, для последующего разбора, элементы списка это строки содержащие теги которые не имеют дочерних элементов, это я все получаю из коллекций элементов, а если встреч элемент не тег (как в примере) его тоже нужно отправить в list.
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.