Здравствуйте, Poseidon, Вы писали:
P>ввожу такую строку запрса - P>как сделать ровные линии на металлической поверхности P>выводит — что угодно, кроме того что нужно. сами проверьте P>то же самое в кавычках (exact phrase) P>- ничего не найдено P>что же это за алгоритмы такие и методы индексирования??? наверное уже нельзя придумать что-то более интеллектуальное??
Они работают над этим
Если руки золотые, не важно из какого места они растут.
Re: Алгоритмы работы поисковых систем (Yandex, Google)
Здравствуйте, Poseidon, Вы писали:
P>что же это за алгоритмы такие и методы индексирования??? наверное уже нельзя придумать что-то более интеллектуальное??
Почему же нельзя... Придумать всегда можно, можно даже реализовать. Просто... ещё работают над этим.
Re: Алгоритмы работы поисковых систем (Yandex, Google)
Здравствуйте, Poseidon, Вы писали:
P>что же это за алгоритмы такие и методы индексирования??? наверное уже нельзя придумать что-то более интеллектуальное??
можно придумать и более интеллектуальное, почему нет? например вот такое
Здравствуйте, kochetkov.vladimir, Вы писали:
KV>Здравствуйте, Poseidon, Вы писали:
P>>что же это за алгоритмы такие и методы индексирования??? наверное уже нельзя придумать что-то более интеллектуальное??
KV>можно придумать и более интеллектуальное, почему нет? например вот такое
KV>)
Yes! Чтобы поисковая система в ответ на запрос пользователя сгенерила несколько релевантных запросов, возможно более "правильных" чем оригинальный, провела поиск по всем запрсам и выбрала результаты максимально соответствующие исходному запросу.. а так ищутся документы в которых тупо встречаются слова из запроса пользователя, да и то не обязательно.
и еще огорчает что находятся документы устаревшие, хотелось бы сначала новейшие, потом более старые
Re: Алгоритмы работы поисковых систем (Yandex, Google)
Здравствуйте, Poseidon, Вы писали:
P>ввожу такую строку запрса - P>как сделать ровные линии на металлической поверхности P>выводит — что угодно, кроме того что нужно. сами проверьте P>то же самое в кавычках (exact phrase) P>- ничего не найдено
Здравствуйте, Poseidon, Вы писали:
P>Yes! Чтобы поисковая система в ответ на запрос пользователя сгенерила несколько релевантных запросов, возможно более "правильных" чем оригинальный, провела поиск по всем запрсам и выбрала результаты максимально соответствующие исходному запросу.. а так ищутся документы в которых тупо встречаются слова из запроса пользователя, да и то не обязательно.
Знаешь, я сам слабо понял, что именно тебе было нужно по твоему запросу и "более релевантный" запрос сгенерил тупо наугад Ну, возможно caffeine (www2.sandbox.google.com) нас чем-нибудь порадует в ближайшее время
P>и еще огорчает что находятся документы устаревшие, хотелось бы сначала новейшие, потом более старые
Здравствуйте, Poseidon, Вы писали:
P>ввожу такую строку запрса - P>как сделать ровные линии на металлической поверхности P>выводит — что угодно, кроме того что нужно. сами проверьте
P>что же это за алгоритмы такие и методы индексирования??? наверное уже нельзя придумать что-то более интеллектуальное??
Действительно, удивляет, что алгоритмы, о которых писали ещё лет 30-40 назад, до сих пор остаются "неподъёмными" даже для лучших софтверных компаний.
С грустью вспоминаю книжку Попова Э.В. "Общение с ЭВМ на естественном языке" (1982 год), где приведены алгоритмы морфологического и синтаксического анализа текстов, построение семантического графа запроса, логический вывод по графу и синтез ответа на ЕЯ.
Где это всё? Худо-бедно сейчас разобрались только с морфологией, а о печальном состоянии синтаксического анализа можно судить по работе машинных переводчиков — там шаг влево шаг вправо от строгой структуры текста — и всё, приехали! Про семантику уж лучше и не вспоминать
По-видимому, язык наш слишком "велик и могуч", чтобы вот так просто с ним разобраться. И это правильно!
Re[3]: Алгоритмы работы поисковых систем (Yandex, Google)
Здравствуйте, kochetkov.vladimir, Вы писали:
F>>Яндекс заботится о Вас: KV>Я прошу прощения, а Яндекс о нас всегда заботится, или только в этой теме? В какие часы можно обращаться за формулировками запросов? Спасибо.
Вот не поверишь, он заботится о пользователях всегда Если ты посмотришь: я не перевормулировал запрос — я всего лишь чуть более правильно расставил расстояния между словами, которые хотел найти в тексте. Ты, и кто угодно, легко могут сделать это самостоятельно с помощью языка поисковых запросов. Он гораздо проще и бейсика с паскалем, не говоря уже о плюсах или брейнфаке
Более того, раскрою страшную тайну целая группа людей буквально не спит ночами, думает, как бы автоматически так расставить эти расстояния или даже переформулировать запрос — чтобы тебе даже не пришлось напрягаться и думать, какие расстояния поставить. Если вдуматься — это вершина синтаксического сахара, та самая серебрянная пуля и волшебная кнопка "сделай мне хорошо".
Ну а что не всегда получается понять, чего же именно пользоввателю надо — так это, мы только учимся телепатии
KV>
Курица — это инструмент, с помощью которого одно яйцо производит другие.
Re[3]: Алгоритмы работы поисковых систем (Yandex, Google)
Имхо второй результат вполне соответствует запросу. Вероятно, это не совсем то, что хотел автор, но тогда надо было спрашивать не "сделать", а "гравировать".
Курица — это инструмент, с помощью которого одно яйцо производит другие.
Re[2]: Алгоритмы работы поисковых систем (Yandex, Google)
Здравствуйте, andy1618, Вы писали:
A>Действительно, удивляет, что алгоритмы, о которых писали ещё лет 30-40 назад, до сих пор остаются "неподъёмными" даже для лучших софтверных компаний. A>С грустью вспоминаю книжку Попова Э.В. "Общение с ЭВМ на естественном языке" (1982 год), где приведены алгоритмы морфологического и синтаксического анализа текстов, построение семантического графа запроса, логический вывод по графу и синтез ответа на ЕЯ. A>Где это всё? Худо-бедно сейчас разобрались только с морфологией, а о печальном состоянии синтаксического анализа можно судить по работе машинных переводчиков — там шаг влево шаг вправо от строгой структуры текста — и всё, приехали! Про семантику уж лучше и не вспоминать
Может потому что приведенные алгоритмы полностью не работают? Раньше было проще: готовая реализация не требовалась... Вспоминается беседа Донского, Ботвинника и Томпсона, когда на рассуждения Ботвинника об алгоритмах, лежащих в основе ПИОНЕРа, Томпсон парировал: "в 81-м году рассуждать об алгоритмах, не имея программ, неприлично". Но до СССР эта волна тогда еще не докатилась.
Re[2]: Алгоритмы работы поисковых систем (Yandex, Google)
KV>Здравствуйте, Poseidon, Вы писали:
P>>что же это за алгоритмы такие и методы индексирования??? наверное уже нельзя придумать что-то более интеллектуальное??
Интеллектуальное в вебе есть(много) но в качестве игрушек. Пользы от них пока мало.
KV>можно придумать и более интеллектуальное, почему нет? например вот
Когда точная фраза не находится. И результаты ожидаются малочисленные. Тогда лучше не использовать падежи и лишние слова. В данном случае лишние слова: "как,на, ровные, поверхности". (все равно не выдаст: как рисовать кривые линии внутри металлических объемов)
ИМХО, наилучший запрос в данном случае : разметка металл линия
Если не хватит, можно несколько вариантов с падежами попробовать.
Re[3]: Алгоритмы работы поисковых систем (Yandex, Google)
Здравствуйте, Mystic, Вы писали:
M>Может потому что приведенные алгоритмы полностью не работают? Раньше было проще: готовая реализация не требовалась...
И да, и нет: алгоритмы были рабочие, в книге упоминались даже названия рабочих систем. Но нюанс в том, что алгоритмы хорошо работали не на полном пространстве языка, а на его довольно суженном подмножестве. Кроме того, время работы некоторых алгоритмов экспоненциально зависит от длины предложения, и комбинаторный взрыв происходил даже на некоторых классических текстах, не говоря уже о современной моде писать всё без знаков препинания
В общем, как всегда, дьявол кроется в деталях
Re[4]: Алгоритмы работы поисковых систем (Yandex, Google)
Здравствуйте, andy1618, Вы писали:
A>Здравствуйте, Mystic, Вы писали:
M>>Может потому что приведенные алгоритмы полностью не работают? Раньше было проще: готовая реализация не требовалась...
A>И да, и нет: алгоритмы были рабочие, в книге упоминались даже названия рабочих систем. Но нюанс в том, что алгоритмы хорошо работали не на полном пространстве языка, а на его довольно суженном подмножестве. Кроме того, время работы некоторых алгоритмов экспоненциально зависит от длины предложения, и комбинаторный взрыв происходил даже на некоторых классических текстах, не говоря уже о современной моде писать всё без знаков препинания A>В общем, как всегда, дьявол кроется в деталях
Опять хочется провести аналогию с программой ПИОНЕР. Тоже в книгах писалось, что это рабочая программа, что она решила этюд Надареишвили. И нашла комбинацию из партии Ботвинник--Капабланка из АВРО-турнира (1938). Только вот этюд Надареишвили не решается, а комбинацию ПИОНЕР нашел с подкрутками в программе специально для этой позиции.
Соответственно и тут я не исключаю мысль о том, что система ПОЭТ, если ее подкрутить для разбора определенного предложения, могла его разобрать Для отчетности неплохой результат.
Ну а так если алгоритмы полностью описаны в книге, то я не вижу сложности в том, чтобы их реализовать. Если сохранились исходники, я не вижу большой сложности их перевести в что-то более современное. Если этим исследованиям 25 лет, то многое уже могло бы быть в свободном доступе. Но этого нет. Возникает вопрос: почему?
Re[5]: Алгоритмы работы поисковых систем (Yandex, Google)
Здравствуйте, Mystic, Вы писали:
M>Соответственно и тут я не исключаю мысль о том, что система ПОЭТ, если ее подкрутить для разбора определенного предложения, могла его разобрать Для отчетности неплохой результат.
Да, если взять сильно ограниченный словарь, то довольно легко построить работоспособную систему. Это напоминает проект ЭЛИЗА, когда при тщательном выборе вопросов, у наблюдателей создаётся впечатление действительно умной системы
M>Ну а так если алгоритмы полностью описаны в книге, то я не вижу сложности в том, чтобы их реализовать. Если сохранились исходники, я не вижу большой сложности их перевести в что-то более современное. Если этим исследованиям 25 лет, то многое уже могло бы быть в свободном доступе. Но этого нет. Возникает вопрос: почему?
Вот-вот, это и странно. Возможно, дело в том, что в таких системах алгоритм — это лишь вершина айсберга, а главную часть составляет лингвистическое наполнение системы (словоформы и их морфологические признаки, смысловая совместимость слов, модели управления глаголов, базовые синтаксические структуры русских предложений и т.п.).
А такое по силам только крупной компании, да ещё при условии хорошей мотивации, чтобы результаты разработки можно было реально использовать в бизнесе. Возможно, проблема ещё и с этим.
Re[6]: Алгоритмы работы поисковых систем (Yandex, Google)
Здравствуйте, andy1618, Вы писали:
A>Здравствуйте, Mystic, Вы писали:
A>Да, если взять сильно ограниченный словарь, то довольно легко построить работоспособную систему. Это напоминает проект ЭЛИЗА, когда при тщательном выборе вопросов, у наблюдателей создаётся впечатление действительно умной системы
Зато какая реклама
M>>Ну а так если алгоритмы полностью описаны в книге, то я не вижу сложности в том, чтобы их реализовать. Если сохранились исходники, я не вижу большой сложности их перевести в что-то более современное. Если этим исследованиям 25 лет, то многое уже могло бы быть в свободном доступе. Но этого нет. Возникает вопрос: почему?
A>Вот-вот, это и странно. Возможно, дело в том, что в таких системах алгоритм — это лишь вершина айсберга, а главную часть составляет лингвистическое наполнение системы (словоформы и их морфологические признаки, смысловая совместимость слов, модели управления глаголов, базовые синтаксические структуры русских предложений и т.п.). A>А такое по силам только крупной компании, да ещё при условии хорошей мотивации, чтобы результаты разработки можно было реально использовать в бизнесе. Возможно, проблема ещё и с этим.
В свободном доступе силами энтузазистов думаю заполнилась бы база быстро. Бизнес? Те же поисковые системы, улучшенная индексация. Вопрос еще в том, так ли хорошо работает алгоритм на больших базах? Если параметров алгоритма много, то их можно подкрутить для небольшой базы. Если провести аналог с нейросетью, то чем проще ее структура, тем проще обучение.
Здравствуйте, Poseidon, Вы писали:
P>что же это за алгоритмы такие и методы индексирования??? наверное уже нельзя придумать что-то более интеллектуальное??
спасет отца русской демократии — по ключевому слову покажет близкие к нему и, таким образом, поможет построить запрос
Здравствуйте, kochetkov.vladimir, Вы писали:
KV>Здравствуйте, Poseidon, Вы писали:
P>>что же это за алгоритмы такие и методы индексирования??? наверное уже нельзя придумать что-то более интеллектуальное??
KV>можно придумать и более интеллектуальное, почему нет? например вот такое
Давно хотел об этом сказать.
Делаем твой запрос без всяких изменений. Получаем результат.
Результаты 1 — 10 из примерно 6 140 для разметка металлических поверхностей ровными линиями.
6140, говорите? Ну-ну. Листаем до
Результаты 791 — 800 из примерно 6 130 для разметка металлических поверхностей ровными линиями
И что мы там видим ?
FAQ — Керамическая плитка Одесса, мозайка, бордюр, декор
[DOC] ЛЕГКАЯ АТЛЕТИКА
Покрытие пола линолеумом
<p>Василий Михайлович Востриков</p> <p>Строительные инструменты</p>
КРАСКА ПО МЕТАЛЛУ. Антикоррозионные краски по металлу. Краски и ...
Как выбрать кирпич?
утв. Минэнерго РФ 15.03.2002, РАО "ЕЭС России" 19.02.2002)
ПРАВИЛА МИНЭНЕРГО РФ ОТ 15.03.2002 N ... ПРАВИЛА ОХРАНЫ ТРУДА ПРИ ...
DOC] РД 153-34.0-03.420-2002
Товары и цены, продажа бытовой и климатической техники, купить ...
Да, в тесте этих статей есть слова "разметка, линии, поверхности" и др. Но толку от этих сообщений нуль целых и нуль десятых, если речь идет о поиске того, что указано в строке поиска.
Так что все эти "из примерно 6 130 " чепуха в чистом виде. С таким же успехом можно было бы выдать первые 10-20, ну от силы 50 найденных результатов.
With best regards
Pavel Dvorkin
Re[4]: Алгоритмы работы поисковых систем (Yandex, Google)
Здравствуйте, Трурль, Вы писали:
Т>А толку-то? Все равно чего нужно нет.
Собственно, алгоритмы поиска — это все полумеры. А вдруг ну нет такого в интернете? Ну там про "как отгравировать супулькерий ровными линиями по каждой сепульке"?
Надо отбросить дедовские методы и идти вперед — при запросе система должна генерировать страницу и давать ссылку на нее. Заодно не надо будет перебирать эти тысячи страниц и ответ гарантированно будет! Чистое счастье для пользователей.
... << RSDN@Home 1.2.0 alpha 4 rev. 1237>>
Re[3]: Алгоритмы работы поисковых систем (Yandex, Google)
Здравствуйте, Poseidon, Вы писали:
P>Yes! Чтобы поисковая система в ответ на запрос пользователя сгенерила несколько релевантных запросов, возможно более "правильных" чем оригинальный, провела поиск по всем запрсам и выбрала результаты максимально соответствующие исходному запросу.. а так ищутся документы в которых тупо встречаются слова из запроса пользователя, да и то не обязательно.
Строить более "правильные" запросы, чем ввел пользователь, то есть, говоря проще, переделывать то, что он писал в то, что он на самом деле имел в виду (но, возможно, сам не осознавал) — это замечательная идея. Причем непонятно, зачем копаться в этих тысячах страниц, если мы можем и так понять, что же хочет пользователь?
В идеале оно как — ты вводишь "Что бы мне съесть на завтрак такого, чтобы хорошо?". А она проводит полный анализ вопроса, твоего медсостояния (по базе клиники), географического положения, содержимого холодильника (либо по java-холодильнику, либо по данным о покупках из магазинов), и выдает "Красную икру с апельсинами!". И не дай бог угадает недостаточно правильно!
Или там, тоже очень важное применение. Вот не знаешь что делать и пишешь в Яндекс — "Бросать мне жену и уходить к любовнице или нет?". А она проводит тоже такой мощный интеллектуальный анализ, зачитывает все стотыщпицот форумов в инете с данным вопросом, и выдает "Да, непременно! Послезавтра!". Или "Нет ни в коем случае!". Ведь там же лучше понимают, чего тебе на самом деле надо, правда?
... << RSDN@Home 1.2.0 alpha 4 rev. 1237>>
Re[4]: Алгоритмы работы поисковых систем (Yandex, Google)
Здравствуйте, frogkiller, Вы писали:
F>Здравствуйте, kochetkov.vladimir, Вы писали:
F>>>Яндекс заботится о Вас: KV>>Я прошу прощения, а Яндекс о нас всегда заботится, или только в этой теме? В какие часы можно обращаться за формулировками запросов? Спасибо.
F>Вот не поверишь, он заботится о пользователях всегда Если ты посмотришь: я не перевормулировал запрос — я всего лишь чуть более правильно расставил расстояния между словами, которые хотел найти в тексте. Ты, и кто угодно, легко могут сделать это самостоятельно с помощью языка поисковых запросов. Он гораздо проще и бейсика с паскалем, не говоря уже о плюсах или брейнфаке
Впечатлило, спасибо.
F>Ну а что не всегда получается понять, чего же именно пользоввателю надо — так это, мы только учимся телепатии
Да ладно, это всего-лишь была маленькая беззлобная месть за "забанить желто-полосатых" (с)
Здравствуйте, kochetkov.vladimir, Вы писали:
F>> язык запросов KV> Впечатлило, спасибо.
На самом деле я, конечно, несколько преувеличил значимость всех этих супер-технологий — всё равно основная масса запросов — вида "порно" и "одноклассники". Но для и для гиков есть где порезвиться.
[offtop] F>>Ну а что не всегда получается понять, чего же именно пользоввателю надо — так это, мы только учимся телепатии KV>Да ладно, это всего-лишь была маленькая беззлобная месть за "забанить желто-полосатых" (с)
Ой, да ладно, кто ж вас забанит, "это ж — памятник"^w пока остальные яйца-в-профиль такие фокусы с тарифами отмачивают, да и не только с тарифами. Это я так, от общего настроения в индустрии плакался, что вряд ли удастся силами простых смертных побороть приносящий немалые деньги механизм спама.
[/offtop]
Курица — это инструмент, с помощью которого одно яйцо производит другие.
Re: Алгоритмы работы поисковых систем (Yandex, Google)
Здравствуйте, Poseidon, Вы писали:
P>ввожу такую строку запрса - P>как сделать ровные линии на металлической поверхности
Я, может, туплю, но не пойму, что ты хотел у гугла спросить. Как нарисовать ровную линию на металле? Да как и на всем другом — линейка + карандаш, не думаю, что еще кто-то догадался бы такое спрашивать. Или что-то другое?
Новости очень смешные. Зря вы не смотрите. Как будто за наркоманами подсматриваешь. Только тетка с погодой в завязке.
There is no such thing as a winnable war.
Re: Алгоритмы работы поисковых систем (Yandex, Google)
P>ввожу такую строку запрса - P>как сделать ровные линии на металлической поверхности P>выводит — что угодно, кроме того что нужно. сами проверьте P>то же самое в кавычках (exact phrase) P>- ничего не найдено P>что же это за алгоритмы такие и методы индексирования??? наверное уже нельзя придумать что-то более интеллектуальное??
Только в эту пятницу была на семинаре от Яндекса. там после докладов была пятиминутка юмора — который они не публикуют, но рассказывают на семинарах. так вот, у них как-то складируются последовательности запросов от одного айпи и потом анализируются, кто чего как ищет. так что если будете интересные запросы вводить, у вас есть шанс туда попасть