HTML не является подмножеством XML и в общем случае XML-парсерами не прочитается. Да и регулярными выражениями парсить его не выйдет именно в силу их регулярности. Разве что просто теги заменять.
octalforty Shoutbox
HgLab: Mercurial Server and Repository Management for Windows