Алгоритмы работы поисковых систем (Yandex, Google)
От: Poseidon СССР  
Дата: 26.11.09 15:37
Оценка: :))) :))) :))) :)
ввожу такую строку запрса —
как сделать ровные линии на металлической поверхности

выводит — что угодно, кроме того что нужно. сами проверьте

то же самое в кавычках (exact phrase)

— ничего не найдено

что же это за алгоритмы такие и методы индексирования??? наверное уже нельзя придумать что-то более интеллектуальное??

09.12.09 07:52: Перенесено из 'Философия программирования'
Re: Алгоритмы работы поисковых систем (Yandex, Google)
От: servancho Россия https://dedis.ru
Дата: 26.11.09 15:52
Оценка:
Здравствуйте, Poseidon, Вы писали:

P>ввожу такую строку запрса -

P>как сделать ровные линии на металлической поверхности
P>выводит — что угодно, кроме того что нужно. сами проверьте
P>то же самое в кавычках (exact phrase)
P>- ничего не найдено
P>что же это за алгоритмы такие и методы индексирования??? наверное уже нельзя придумать что-то более интеллектуальное??

Они работают над этим
Если руки золотые, не важно из какого места они растут.
Re: Алгоритмы работы поисковых систем (Yandex, Google)
От: fddima  
Дата: 26.11.09 16:00
Оценка:
Здравствуйте, Poseidon, Вы писали:

P>что же это за алгоритмы такие и методы индексирования??? наверное уже нельзя придумать что-то более интеллектуальное??

Почему же нельзя... Придумать всегда можно, можно даже реализовать. Просто... ещё работают над этим.
Re: Алгоритмы работы поисковых систем (Yandex, Google)
От: kochetkov.vladimir Россия https://kochetkov.github.io
Дата: 26.11.09 16:13
Оценка: +1
Здравствуйте, Poseidon, Вы писали:

P>что же это за алгоритмы такие и методы индексирования??? наверное уже нельзя придумать что-то более интеллектуальное??


можно придумать и более интеллектуальное, почему нет? например вот такое


[Интервью] .NET Security — это просто
Автор: kochetkov.vladimir
Дата: 07.11.17
Re[2]: Алгоритмы работы поисковых систем (Yandex, Google)
От: Poseidon СССР  
Дата: 26.11.09 17:08
Оценка:
Здравствуйте, kochetkov.vladimir, Вы писали:

KV>Здравствуйте, Poseidon, Вы писали:


P>>что же это за алгоритмы такие и методы индексирования??? наверное уже нельзя придумать что-то более интеллектуальное??


KV>можно придумать и более интеллектуальное, почему нет? например вот такое


KV>)


Yes! Чтобы поисковая система в ответ на запрос пользователя сгенерила несколько релевантных запросов, возможно более "правильных" чем оригинальный, провела поиск по всем запрсам и выбрала результаты максимально соответствующие исходному запросу.. а так ищутся документы в которых тупо встречаются слова из запроса пользователя, да и то не обязательно.
и еще огорчает что находятся документы устаревшие, хотелось бы сначала новейшие, потом более старые
Re: Алгоритмы работы поисковых систем (Yandex, Google)
От: frogkiller Россия  
Дата: 26.11.09 17:48
Оценка:
Здравствуйте, Poseidon, Вы писали:

P>ввожу такую строку запрса -

P>как сделать ровные линии на металлической поверхности
P>выводит — что угодно, кроме того что нужно. сами проверьте
P>то же самое в кавычках (exact phrase)
P>- ничего не найдено

Яндекс заботится о Вас: http://yandex.ru/search?text=%D0%BA%D0%B0%D0%BA+%D1%81%D0%B4%D0%B5%D0%BB%D0%B0%D1%82%D1%8C+%22%D1%80%D0%BE%D0%B2%D0%BD%D1%8B%D0%B5+%D0%BB%D0%B8%D0%BD%D0%B8%D0%B8%22+%D0%BD%D0%B0+%22%D0%BC%D0%B5%D1%82%D0%B0%D0%BB%D0%BB%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%BE%D0%B9+%D0%BF%D0%BE%D0%B2%D0%B5%D1%80%D1%85%D0%BD%D0%BE%D1%81%D1%82%D0%B8%22&lr=1

P>что же это за алгоритмы такие и методы индексирования??? наверное уже нельзя придумать что-то более интеллектуальное??


Курица — это инструмент, с помощью которого одно яйцо производит другие.
Re: Алгоритмы работы поисковых систем (Yandex, Google)
От: FlyDoc Россия http://www.flydoc.ru
Дата: 26.11.09 17:57
Оценка:
Здравствуйте, Poseidon, Вы писали:

P>ввожу такую строку запрса -

P>как сделать ровные линии на металлической поверхности

бритые киски еще поищите
--------------------------
http://www.flydoc.ru
Re[2]: Алгоритмы работы поисковых систем (Yandex, Google)
От: frogkiller Россия  
Дата: 26.11.09 17:57
Оценка:
Здравствуйте, frogkiller, Вы писали:

F>Яндекс заботится о Вас: http://yandex.ru/search?text=%D0%BA%D0%B0%D0%BA+%D1%81%D0%B4%D0%B5%D0%BB%D0%B0%D1%82%D1%8C+%22%D1%80%D0%BE%D0%B2%D0%BD%D1%8B%D0%B5+%D0%BB%D0%B8%D0%BD%D0%B8%D0%B8%22+%D0%BD%D0%B0+%22%D0%BC%D0%B5%D1%82%D0%B0%D0%BB%D0%BB%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%BE%D0%B9+%D0%BF%D0%BE%D0%B2%D0%B5%D1%80%D1%85%D0%BD%D0%BE%D1%81%D1%82%D0%B8%22&lr=1


А ещё лучше так: http://yandex.ru/search?text=%28%D1%81%D0%B4%D0%B5%D0%BB%D0%B0%D1%82%D1%8C+%D1%80%D0%BE%D0%B2%D0%BD%D1%8B%D0%B5+%26%2F%28-1+3%29+%D0%BB%D0%B8%D0%BD%D0%B8%D0%B8+%26%26%2F%28-32768+32767%29+%D0%BD%D0%B0+%D0%BC%D0%B5%D1%82%D0%B0%D0%BB%D0%BB%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%BE%D0%B9+%26%2F%28-1+3%29+%D0%BF%D0%BE%D0%B2%D0%B5%D1%80%D1%85%D0%BD%D0%BE%D1%81%D1%82%D0%B8%29%2F%2F6&lr=1
Курица — это инструмент, с помощью которого одно яйцо производит другие.
Re[3]: Алгоритмы работы поисковых систем (Yandex, Google)
От: kochetkov.vladimir Россия https://kochetkov.github.io
Дата: 26.11.09 20:11
Оценка:
Здравствуйте, Poseidon, Вы писали:

P>Yes! Чтобы поисковая система в ответ на запрос пользователя сгенерила несколько релевантных запросов, возможно более "правильных" чем оригинальный, провела поиск по всем запрсам и выбрала результаты максимально соответствующие исходному запросу.. а так ищутся документы в которых тупо встречаются слова из запроса пользователя, да и то не обязательно.


Знаешь, я сам слабо понял, что именно тебе было нужно по твоему запросу и "более релевантный" запрос сгенерил тупо наугад Ну, возможно caffeine (www2.sandbox.google.com) нас чем-нибудь порадует в ближайшее время

P>и еще огорчает что находятся документы устаревшие, хотелось бы сначала новейшие, потом более старые


voila!

[Интервью] .NET Security — это просто
Автор: kochetkov.vladimir
Дата: 07.11.17
Re[2]: Алгоритмы работы поисковых систем (Yandex, Google)
От: kochetkov.vladimir Россия https://kochetkov.github.io
Дата: 26.11.09 20:17
Оценка: :))
Здравствуйте, frogkiller, Вы писали:

F>Яндекс заботится о Вас:


Я прошу прощения, а Яндекс о нас всегда заботится, или только в этой теме? В какие часы можно обращаться за формулировками запросов? Спасибо.


[Интервью] .NET Security — это просто
Автор: kochetkov.vladimir
Дата: 07.11.17
Re: Алгоритмы работы поисковых систем (Yandex, Google)
От: andy1618 Россия  
Дата: 27.11.09 07:02
Оценка: -1
Здравствуйте, Poseidon, Вы писали:

P>ввожу такую строку запрса -

P>как сделать ровные линии на металлической поверхности
P>выводит — что угодно, кроме того что нужно. сами проверьте

P>что же это за алгоритмы такие и методы индексирования??? наверное уже нельзя придумать что-то более интеллектуальное??


Действительно, удивляет, что алгоритмы, о которых писали ещё лет 30-40 назад, до сих пор остаются "неподъёмными" даже для лучших софтверных компаний.
С грустью вспоминаю книжку Попова Э.В. "Общение с ЭВМ на естественном языке" (1982 год), где приведены алгоритмы морфологического и синтаксического анализа текстов, построение семантического графа запроса, логический вывод по графу и синтез ответа на ЕЯ.
Где это всё? Худо-бедно сейчас разобрались только с морфологией, а о печальном состоянии синтаксического анализа можно судить по работе машинных переводчиков — там шаг влево шаг вправо от строгой структуры текста — и всё, приехали! Про семантику уж лучше и не вспоминать

По-видимому, язык наш слишком "велик и могуч", чтобы вот так просто с ним разобраться. И это правильно!
Re[3]: Алгоритмы работы поисковых систем (Yandex, Google)
От: frogkiller Россия  
Дата: 27.11.09 09:22
Оценка: 13 (2)
Здравствуйте, kochetkov.vladimir, Вы писали:

F>>Яндекс заботится о Вас:

KV>Я прошу прощения, а Яндекс о нас всегда заботится, или только в этой теме? В какие часы можно обращаться за формулировками запросов? Спасибо.

Вот не поверишь, он заботится о пользователях всегда Если ты посмотришь: я не перевормулировал запрос — я всего лишь чуть более правильно расставил расстояния между словами, которые хотел найти в тексте. Ты, и кто угодно, легко могут сделать это самостоятельно с помощью языка поисковых запросов. Он гораздо проще и бейсика с паскалем, не говоря уже о плюсах или брейнфаке

Более того, раскрою страшную тайну целая группа людей буквально не спит ночами, думает, как бы автоматически так расставить эти расстояния или даже переформулировать запрос — чтобы тебе даже не пришлось напрягаться и думать, какие расстояния поставить. Если вдуматься — это вершина синтаксического сахара, та самая серебрянная пуля и волшебная кнопка "сделай мне хорошо".

Ну а что не всегда получается понять, чего же именно пользоввателю надо — так это, мы только учимся телепатии

KV>
Курица — это инструмент, с помощью которого одно яйцо производит другие.
Re[3]: Алгоритмы работы поисковых систем (Yandex, Google)
От: Трурль  
Дата: 27.11.09 13:08
Оценка:
Здравствуйте, frogkiller, Вы писали:

F>Здравствуйте, frogkiller, Вы писали:


F>>Яндекс заботится о Вас: http://yandex.ru/search?text=%D0%BA%D0%B0%D0%BA+%D1%81%D0%B4%D0%B5%D0%BB%D0%B0%D1%82%D1%8C+%22%D1%80%D0%BE%D0%B2%D0%BD%D1%8B%D0%B5+%D0%BB%D0%B8%D0%BD%D0%B8%D0%B8%22+%D0%BD%D0%B0+%22%D0%BC%D0%B5%D1%82%D0%B0%D0%BB%D0%BB%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%BE%D0%B9+%D0%BF%D0%BE%D0%B2%D0%B5%D1%80%D1%85%D0%BD%D0%BE%D1%81%D1%82%D0%B8%22&lr=1


F>А ещё лучше так: http://yandex.ru/search?text=%28%D1%81%D0%B4%D0%B5%D0%BB%D0%B0%D1%82%D1%8C+%D1%80%D0%BE%D0%B2%D0%BD%D1%8B%D0%B5+%26%2F%28-1+3%29+%D0%BB%D0%B8%D0%BD%D0%B8%D0%B8+%26%26%2F%28-32768+32767%29+%D0%BD%D0%B0+%D0%BC%D0%B5%D1%82%D0%B0%D0%BB%D0%BB%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%BE%D0%B9+%26%2F%28-1+3%29+%D0%BF%D0%BE%D0%B2%D0%B5%D1%80%D1%85%D0%BD%D0%BE%D1%81%D1%82%D0%B8%29%2F%2F6&lr=1


А толку-то? Все равно чего нужно нет.
Re[4]: Алгоритмы работы поисковых систем (Yandex, Google)
От: frogkiller Россия  
Дата: 27.11.09 14:31
Оценка:
Здравствуйте, Трурль, Вы писали:

Т>А толку-то? Все равно чего нужно нет.


Тебе нужно, чтоб обязательно было на первой странице? Надо всего лишь поиграться с расстояниями между словами, например, вот так: http://yandex.ru/search?text=%28%D1%80%D0%BE%D0%B2%D0%BD%D1%8B%D0%B5+%26%2F%28-1+3%29+%D0%BB%D0%B8%D0%BD%D0%B8%D0%B8+%26%26+%D0%BC%D0%B5%D1%82%D0%B0%D0%BB%D0%BB%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%BE%D0%B9+%26%2F%28-1+3%29+%D0%BF%D0%BE%D0%B2%D0%B5%D1%80%D1%85%D0%BD%D0%BE%D1%81%D1%82%D0%B8%29%2F%2F6&lr=1

Имхо второй результат вполне соответствует запросу. Вероятно, это не совсем то, что хотел автор, но тогда надо было спрашивать не "сделать", а "гравировать".
Курица — это инструмент, с помощью которого одно яйцо производит другие.
Re[2]: Алгоритмы работы поисковых систем (Yandex, Google)
От: Mystic Украина http://mystic2000.newmail.ru
Дата: 27.11.09 17:11
Оценка:
Здравствуйте, andy1618, Вы писали:

A>Действительно, удивляет, что алгоритмы, о которых писали ещё лет 30-40 назад, до сих пор остаются "неподъёмными" даже для лучших софтверных компаний.

A>С грустью вспоминаю книжку Попова Э.В. "Общение с ЭВМ на естественном языке" (1982 год), где приведены алгоритмы морфологического и синтаксического анализа текстов, построение семантического графа запроса, логический вывод по графу и синтез ответа на ЕЯ.
A>Где это всё? Худо-бедно сейчас разобрались только с морфологией, а о печальном состоянии синтаксического анализа можно судить по работе машинных переводчиков — там шаг влево шаг вправо от строгой структуры текста — и всё, приехали! Про семантику уж лучше и не вспоминать

Может потому что приведенные алгоритмы полностью не работают? Раньше было проще: готовая реализация не требовалась... Вспоминается беседа Донского, Ботвинника и Томпсона, когда на рассуждения Ботвинника об алгоритмах, лежащих в основе ПИОНЕРа, Томпсон парировал: "в 81-м году рассуждать об алгоритмах, не имея программ, неприлично". Но до СССР эта волна тогда еще не докатилась.
Re[2]: Алгоритмы работы поисковых систем (Yandex, Google)
От: Silver_s Ниоткуда  
Дата: 28.11.09 14:46
Оценка:
KV>Здравствуйте, Poseidon, Вы писали:

P>>что же это за алгоритмы такие и методы индексирования??? наверное уже нельзя придумать что-то более интеллектуальное??

Интеллектуальное в вебе есть(много) но в качестве игрушек. Пользы от них пока мало.

KV>можно придумать и более интеллектуальное, почему нет? например вот


Когда точная фраза не находится. И результаты ожидаются малочисленные. Тогда лучше не использовать падежи и лишние слова. В данном случае лишние слова: "как,на, ровные, поверхности". (все равно не выдаст: как рисовать кривые линии внутри металлических объемов)
ИМХО, наилучший запрос в данном случае : разметка металл линия
Если не хватит, можно несколько вариантов с падежами попробовать.
Re[3]: Алгоритмы работы поисковых систем (Yandex, Google)
От: andy1618 Россия  
Дата: 30.11.09 06:23
Оценка:
Здравствуйте, Mystic, Вы писали:

M>Может потому что приведенные алгоритмы полностью не работают? Раньше было проще: готовая реализация не требовалась...


И да, и нет: алгоритмы были рабочие, в книге упоминались даже названия рабочих систем. Но нюанс в том, что алгоритмы хорошо работали не на полном пространстве языка, а на его довольно суженном подмножестве. Кроме того, время работы некоторых алгоритмов экспоненциально зависит от длины предложения, и комбинаторный взрыв происходил даже на некоторых классических текстах, не говоря уже о современной моде писать всё без знаков препинания
В общем, как всегда, дьявол кроется в деталях
Re[4]: Алгоритмы работы поисковых систем (Yandex, Google)
От: Mystic Украина http://mystic2000.newmail.ru
Дата: 30.11.09 17:19
Оценка:
Здравствуйте, andy1618, Вы писали:

A>Здравствуйте, Mystic, Вы писали:


M>>Может потому что приведенные алгоритмы полностью не работают? Раньше было проще: готовая реализация не требовалась...


A>И да, и нет: алгоритмы были рабочие, в книге упоминались даже названия рабочих систем. Но нюанс в том, что алгоритмы хорошо работали не на полном пространстве языка, а на его довольно суженном подмножестве. Кроме того, время работы некоторых алгоритмов экспоненциально зависит от длины предложения, и комбинаторный взрыв происходил даже на некоторых классических текстах, не говоря уже о современной моде писать всё без знаков препинания

A>В общем, как всегда, дьявол кроется в деталях

Опять хочется провести аналогию с программой ПИОНЕР. Тоже в книгах писалось, что это рабочая программа, что она решила этюд Надареишвили. И нашла комбинацию из партии Ботвинник--Капабланка из АВРО-турнира (1938). Только вот этюд Надареишвили не решается, а комбинацию ПИОНЕР нашел с подкрутками в программе специально для этой позиции.

Соответственно и тут я не исключаю мысль о том, что система ПОЭТ, если ее подкрутить для разбора определенного предложения, могла его разобрать Для отчетности неплохой результат.

Ну а так если алгоритмы полностью описаны в книге, то я не вижу сложности в том, чтобы их реализовать. Если сохранились исходники, я не вижу большой сложности их перевести в что-то более современное. Если этим исследованиям 25 лет, то многое уже могло бы быть в свободном доступе. Но этого нет. Возникает вопрос: почему?
Re[5]: Алгоритмы работы поисковых систем (Yandex, Google)
От: andy1618 Россия  
Дата: 01.12.09 07:38
Оценка:
Здравствуйте, Mystic, Вы писали:

M>Соответственно и тут я не исключаю мысль о том, что система ПОЭТ, если ее подкрутить для разбора определенного предложения, могла его разобрать Для отчетности неплохой результат.


Да, если взять сильно ограниченный словарь, то довольно легко построить работоспособную систему. Это напоминает проект ЭЛИЗА, когда при тщательном выборе вопросов, у наблюдателей создаётся впечатление действительно умной системы


M>Ну а так если алгоритмы полностью описаны в книге, то я не вижу сложности в том, чтобы их реализовать. Если сохранились исходники, я не вижу большой сложности их перевести в что-то более современное. Если этим исследованиям 25 лет, то многое уже могло бы быть в свободном доступе. Но этого нет. Возникает вопрос: почему?


Вот-вот, это и странно. Возможно, дело в том, что в таких системах алгоритм — это лишь вершина айсберга, а главную часть составляет лингвистическое наполнение системы (словоформы и их морфологические признаки, смысловая совместимость слов, модели управления глаголов, базовые синтаксические структуры русских предложений и т.п.).
А такое по силам только крупной компании, да ещё при условии хорошей мотивации, чтобы результаты разработки можно было реально использовать в бизнесе. Возможно, проблема ещё и с этим.
Re[6]: Алгоритмы работы поисковых систем (Yandex, Google)
От: Mystic Украина http://mystic2000.newmail.ru
Дата: 01.12.09 11:05
Оценка:
Здравствуйте, andy1618, Вы писали:

A>Здравствуйте, Mystic, Вы писали:


A>Да, если взять сильно ограниченный словарь, то довольно легко построить работоспособную систему. Это напоминает проект ЭЛИЗА, когда при тщательном выборе вопросов, у наблюдателей создаётся впечатление действительно умной системы


Зато какая реклама


M>>Ну а так если алгоритмы полностью описаны в книге, то я не вижу сложности в том, чтобы их реализовать. Если сохранились исходники, я не вижу большой сложности их перевести в что-то более современное. Если этим исследованиям 25 лет, то многое уже могло бы быть в свободном доступе. Но этого нет. Возникает вопрос: почему?


A>Вот-вот, это и странно. Возможно, дело в том, что в таких системах алгоритм — это лишь вершина айсберга, а главную часть составляет лингвистическое наполнение системы (словоформы и их морфологические признаки, смысловая совместимость слов, модели управления глаголов, базовые синтаксические структуры русских предложений и т.п.).

A>А такое по силам только крупной компании, да ещё при условии хорошей мотивации, чтобы результаты разработки можно было реально использовать в бизнесе. Возможно, проблема ещё и с этим.

В свободном доступе силами энтузазистов думаю заполнилась бы база быстро. Бизнес? Те же поисковые системы, улучшенная индексация. Вопрос еще в том, так ли хорошо работает алгоритм на больших базах? Если параметров алгоритма много, то их можно подкрутить для небольшой базы. Если провести аналог с нейросетью, то чем проще ее структура, тем проще обучение.
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.