Как распарсить гугл?
От: Aleksey82  
Дата: 24.12.21 10:27
Оценка:
А точнее поисковую страницу

Допустим, имеем какую-то страницу с результатами поиска, типа " https://www.google.com/search?q=cats+videos&source=hp&ei=3R7CYeuNIKOHwPAPmoaNoAI&iflsig=ALs-wAMAAAAAYcIs7ac1qFAFy8fUTeiYJjbWI_Wf7agY&ved=0ahUKEwir8N7bxPX0AhWjAxAIHRpDAyQQ4dUDCAg&uact=5&oq=cats+videos&gs_lcp=Cgdnd3Mtd2l6EAMyBAguEEMyBAgAEEMyBAgAEAoyBAgAEAoyBAguEAoyBAgAEAoyBAgAEAoyBAgAEEMyBAgAEAoyBAgAEApQAFgAYO4FaABwAHgAgAFUiAFUkgEBMZgBAKABAqABAQ&sclient=gws-wiz "

Для каждого результата на странице надо собрать ссылку и краткое описание. Related searches не нужны, и большой верхний блок, который как реклама, не нужен.

Смысл в том что для разных запросов эта страница может немного различаться. Может есть какой-то опен-сорс проект или описание показывающее как люди это решают в настоящий момент времени? Наверняка не мне одному надо парсить эти результаты..
Re: Как распарсить гугл?
От: samius Япония http://sams-tricks.blogspot.com
Дата: 24.12.21 11:06
Оценка:
Здравствуйте, Aleksey82, Вы писали:

A>Может есть какой-то опен-сорс проект или описание показывающее как люди это решают в настоящий момент времени? Наверняка не мне одному надо парсить эти результаты..


https://developers.google.com/custom-search/v1/reference/rest/v1/cse/list
Re[2]: Как распарсить гугл?
От: Aleksey82  
Дата: 24.12.21 11:39
Оценка:
S>https://developers.google.com/custom-search/v1/reference/rest/v1/cse/list

У меня немного другая тема. Я делаю некую функциональность в браузере на основе chromium. Когда юзер переходит в гугл и что-то ищет, мне надо взять страницу с результатами поиска и выполнить некие действия.
Т.е. мне надо распарсить ответ от гугла, который пришел из-за действий пользователя.
Re: xPath
От: VikDD  
Дата: 27.12.21 13:58
Оценка:
Попробовать получить результаты каки-то простым xPath'ом типа
//div[@data-async-context]/div/div[@class="g"]//a//cite

и уже с ними работать.
С уважением, VikDD
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.