Re[5]: Идея революционного(?) интернет поисковика
От: Fiery_Ice  
Дата: 09.04.08 18:18
Оценка:
Здравствуйте, __gas, Вы писали:

__>Вообще-то есть еще такое понятие, как хэширование...


Ну да, и каждую новую копию песни, сжатую другим кодеком, или имеющую малейшие шумовые искажения считать новой...

__>У меня появляются более реалистичные идеи поиска по мультимедии. Например, можно мелодии разбивать на определенные составляющие, как то: ритм, частотную характеристику и т.п. далее в искомой мелодии выделять тот же набор параметров и начинать поиск по соответствующей БД с использованием хэша. Можно искать мелодии не целиком по контенту, а по отдельным кускам (например, 3 секунда начала, 5 секунд середина, 2-3 секунды конец). Соответственно можно выдавать похожие мелодии, у которых могут совпадать не все части с искомой мелодией — это уже будет поиск с произвольной релевантностью.


-Можно и разбивать. А можно и в объединенном виде использовать. Дело вкуса.
-По поводу кусков:
а)нет никаких гарантий, что в самой базе находятся полные версии композиций
б)5с гдето в середине могут оказаться практически идентичными у тысяч "композиций" (нынешняя эстрада не блещет оригинальностью)
-если использовать поэлементное сравнение, то результат точнее (тем более что элементов-то не так и много)

__>накапливать 100Тб базы, разумеется не придется — база будет содержать в лучшем случае небольшие отрывки и ссылки на индексируемые ресурсы.

Прийдется: отпечаток каждого обработанного звукового файла должен хранится в базе, а будит-ли он сопоставлятся со ссылкой — дело десятое (главное теги хранить — пользователь ведь именно их хочет узнать, отправляя на обработку свой файл)

Здравствуйте, WolfHound, Вы писали:

WH>Линейный поиск... как все запущенно.

WH>Должен быть в худшем случае log(N).

Согласен, что запущено. Но тратить время на продумывание и устранение этой проблемы у меня нет желания (по крайней мере сейчас) — и по-важнее дела есть. В конце концов, на реализацию этой системы, у меня уйдет хз сколько времени, а в природе уже и готовые аналоги есть...
Все с детства знают, что то-то то-то невозможно. Но всегда находится "невежда", который этого не знает. Он-то и делает открытие.
Альберт Эйнштейн.
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.