как лучше всего пропарсить страницу HTML (документ НЕ правильно построенный, NOT well-formed).
Было бы лучше всего привести данные к определенной структуре (XML через XSLT?)
Чем можно воспользоваться? желательно избегать применения сторонних фреймворков.