Здравствуйте, Алексей Владимирович Миронов, Вы писали:
АВМ>В том-то и дело, что пользуемся, но с трудом. Меня, например, интересовала система оценок. Недолго думая, я набрал в строке поиска "оценки" и получил 1450 документов.
Попытаюсь оправдаться. Дело в том, что в любом окружении есть свой набор часто упоминаемых терминов и понятий. Часто эти термины перегружены, часто просто очень часто упоминаемы, поэтому поиск по этим словам/понятиям неинформативен. И в нашей среде есть слова, которые сами по себе неинформативны по причине употребляемости в диком количестве сообщений.
Такими словами являются не только названия технологий и прочие имена собственные, но и такие безобидные, на превый взгляд, слова, как "оценки" (в следствие того, что много чего тут вокруг них вертится). Все выше сказанное является верным и для словосочетаний.
К чему я клоню.
АВМ>В библиографоведении подобный ответ поисковой системы называется "необоснованным отказом", т.е. книга в библиотеке есть, но добраться читатель с помощью поискового аппарата не может.
... не умеет. Любой неинформативный запрос должен быть уточнен.
АВМ>А у многих спрашивающих этого времени нет
Это — распространенная отмазка. Такие есть во многих областях человеческой деятельности. Приведу лищь пару примеров:
— я не учусь печатать вслепую, потому-что у сменя нет на это времени (ну, все время занимает набивание текста со скоростью 40 символов в минуту)
— я не учусь быстро читать, ...
...
— за этой водкой и стакан вина выпить некогда. :=-)
Клоню я к тому, что последовательный перебор в поиске присутствует всегда (ну, пользователем, задающим запрос), но перебор последовательно 25 страниц и 3-х отличается разительно. А времени насколько меньше тратится... Ужас.
Что же касается проблем, связанных с со множественностью результатов поиска:
1. Сайт на 99% (там еще много знаков после запятой) состоит из ужасно коротких сообщений, что сильно сбивает релевантность поиска. Ну, что пишете, то индексируем.
2. Для больших сообщений самая релевантная цитата может не попадать в тот кусок выдачи, который видит пользователь. Связано это с тем, что существует ограничение контекста для
2-3-4-5-словных запросов. Сейчас оно выставлено по максимуму (по просьбам трудящихся). Для уточнения
2-3-4-5-словных запросов следует использовать оператор ограничения контекста [n,...] (прописью: <квадратная скобка> <максимальное расстояние между словами запроса> <запятая> <запрос> <квадратная скобка>) Данный запрос призван найти документы, в которых лексемы поискового запроса находятся в пределах <максимальное расстояние между словами запроса> слов. (пример: [2,топ 100])
3. Многие словосочетания также достаточно часто употребляемы по-разному (ну, со сменой порядка слов, со вставкой других слов внутрь выражений, ётц). Посему, для поиска точной фразы предназначен оператор поиска точной фразы.
4. Тот контент, что индексирует поисковый движок, и тот, что вы видите в форуме, несколько отличаются. Выброшено все цитирование, все лишнее, текст сформатирован по минимуму. По соглашению HTML содержит следующие зоны:
title - заголовок сообщения/статьи
h1 - имя автора сообщения (только для форума).
Посему, для поиска чего-то только в заголовке сообщения (статьи) следует пользовать оператор
title.
Для поиска имени автора сообщения следует пользоваться оператором
heading. Данный оператор ищет так-же и в зоне title, но все-равно дает нормальные результаты по поиску персональных сообщений от зарегистрированных пользователей (ннк пользователя является атрибутом сообщения, и смена ника в профайле не приведет к корректировке содержимого сообщения).
Далее, для поиска
первоначального сообщения, содержащего описание оценок, нам потребуется некоторое ассоциативное мышление. Применим тот факт, что оценки появились не ради себя, а для топ 100.
На момент написания данного сообщения искомое сообщение находится:
- по запросу: топ 100 (82 документа, 14-е место (2-я страница) — первое сообщение, первое из найденных сообщений ветки — на 5-м (1-я страница));
— "топ 100" — 17 место
— топ 100 heading(it) — 9-е место (тут я применил знание того факта, что практически все сообщения о движке сделаны автором с ником IT)
Не так давно система оценок была изменена. Сообщение, сообщившее миру этот радостный факт, находится на первом месте (из одного найденного) по запросу: система оценок heading(it)
PS: Этот пост не имеет своей целью оправдать писателей поискового движка, работу движка, обидеть пользователя, или что-то в таком духе, а только показать, как эффективно пользоваться поиском. Конечно, он так-же не призван
научить всех его читавших задавать правильные поисковые запросы, и качественно и своевременно уточнять неинформативные (на то есть специальный документ, хотя и слабо, но перекликающийся с темой). Также он не призван оправдать администрацию сайта в том, что такая важная часть сервиса, как топ, не имеет описания, висящего на более видном месте, чем утонувшее сообщение в форуме "Обсуждение сайта".
PS2: Конечно, знание искать быстро сэкономит вам кучу времени (в любом поиске). Иногда любой самый правильный тематический запрос не способен дать правильный результат по нескольким причинам. К этому надо быть готовым. Решением в этом случае будет другая стратегия поиска (например, смена поисковика).
PS3: На сайте RSDN.RU в тестовом режиме запущен поиск по форумам. Для активизации его следует пользовать режим группировки "По разделам". Дизайн и функциональность не окончательны, посему критиковать запрещается. Также, если данный режим не будет удовлетворять техническим ограничениям, на него наложенным, он будет ликвидирован. Так-что, ссылками кидаться не спешите.
Надеюсь, что данный пост заставит всех его читавших задуматься о своем свободном времени, и что имеет больший приоритет.
И успешного Вам Поиска.