Начинаю новый проект.
Предполагаемый объем данных:
документов - ~100,000,000
место на диске - 15-20 Gb (в txt формате)
+
Online Search Engine
На P4 — 2800Gh+4Gb
Всю жизнь хранил данные в
txt.
Есть опыт с DB = (84 Mln docs ~10Gb). Но update делаю раз в 6 мес.
Сейчас придется делать update в реальном времени => присматриваюсь к MySQL,
Собираюсь использовать MySQL++.
Поискать поискал, но не нашёл
точных ответов.
Помогите дать оценку:
1. Какой будет ~объём DB MySQL.
2. Какой будет ~объём индекса.
3. Скорость update (doc/sec) Возможный входящий поток до 50 doc/sec
4. Скорость поиска по 1-2-3-... ключевым словам (микро - милли - sec - ... - часы)
средствами MySQL.
5. Скорость выборки документа по ID (микро - милли - sec)
Если есть опыт с бОльшими или меньшими объёмами — отпишите пожалуйста.
Вдруг удасться интерполировать.
.