Здравствуйте, DarthSidius, Вы писали:
DS>Есть HTML, надо достать пару элементов типа как GetElementById или через XPath DS>Ничего записывать-модифицировать в документе не надо.
Здравствуйте, DarthSidius, Вы писали:
DS>Есть HTML, надо достать пару элементов типа как GetElementById или через XPath DS>Ничего записывать-модифицировать в документе не надо.
Здравствуйте, Sinix, Вы писали:
S>Здравствуйте, DarthSidius, Вы писали:
DS>>Смотрел на него, не слишком мощно для моей задачи?
S>Тогда regex-ы. Хинт: перед использованием ознакомиться с списком побочных эффектов.
Ага, спс.
While it is true that asking regexes to parse arbitrary HTML is like asking Mr. Bean to write an operating system, it's sometimes appropriate to parse a limited, known set of HTML.
If you have a small set of HTML pages that you want to scrape data from and then stuff into a database, regexes might work fine. For example, I recently wanted to get the names, parties, and districts of Australian federal Representatives, which I got off of the Parliament's web site. This was a limited, one-time job.
Regexes worked just fine for me, and were very fast to set up.
Здравствуйте, DarthSidius, Вы писали:
DS>Есть HTML, надо достать пару элементов типа как GetElementById или через XPath DS>Ничего записывать-модифицировать в документе не надо.
Здравствуйте, Serginio1, Вы писали:
S>Здравствуйте, DarthSidius, Вы писали:
DS>>Есть HTML, надо достать пару элементов типа как GetElementById или через XPath DS>>Ничего записывать-модифицировать в документе не надо.
S>http://rsdn.ru/forum/dotnet/6364737.1
Здравствуйте, Sinix, Вы писали:
S>Здравствуйте, DarthSidius, Вы писали:
DS>>Смотрел на него, не слишком мощно для моей задачи?
S>Тогда regex-ы. Хинт: перед использованием ознакомиться с списком побочных эффектов.
Вот что, нет что-то вроде LINQ to HTML или просто XPath ?
Здравствуйте, DarthSidius, Вы писали:
DS>Здравствуйте, Serginio1, Вы писали:
S>>Здравствуйте, DarthSidius, Вы писали:
DS>>>Есть HTML, надо достать пару элементов типа как GetElementById или через XPath DS>>>Ничего записывать-модифицировать в документе не надо.
S>>http://rsdn.ru/forum/dotnet/6364737.1
Здравствуйте, Serginio1, Вы писали:
DS>>>>Есть HTML, надо достать пару элементов типа как GetElementById или через XPath DS>>>>Ничего записывать-модифицировать в документе не надо.
S>>>http://rsdn.ru/forum/dotnet/6364737.1
Здравствуйте, DarthSidius, Вы писали:
DS>Здравствуйте, Serginio1, Вы писали:
DS>>>>>Есть HTML, надо достать пару элементов типа как GetElementById или через XPath DS>>>>>Ничего записывать-модифицировать в документе не надо.
S>>>>http://rsdn.ru/forum/dotnet/6364737.1
Ты считаешь, что SgmlReader легче чем AngleSharp?
Лучше потратить время на изучение AngleSharp. Это пригодится и при вэб программировании (JQuery)
И поиск быстрее нежели сначала сконыертировать в XML а затем в нем искать нужное. Это хорошо на маленьких страницах, но на больших это тормоза.
и солнце б утром не вставало, когда бы не было меня