Здравствуйте, wildwind, Вы писали:
W>Здравствуйте, Павел_, Вы писали:
П_>>Фирма хранит информацию о транзакциях в файлах(небольших от 20 до 40 кб) за большой период файлов накопилось миллионы. П_>>Как построить схему хранения файлов и метаинформации о них, номер транзакции, дата, оператор с поддержкой версионности? П_>>Предполагал хранить ссылку на место расположение файла и мета информацию в базе, 1 таблица для актуальных файлов, вторая таблица история изменений. Ключ это номер транзакции. На диске же хранить файлы так /data/trans_001/version_0/сам файл П_>>и для версионности использовать /data/trans_001/version_1/сам файл. Правильно ли я мыслю? Самих папочек на версию будет 10-15, но вот самих файлов будет несколько миллионов. Могу разбить транзакции по контрагентам или дате или региону. Может кто то сталкивался с подобной задачей. Прощу подсказки. Спасибо
W>Формат файлов, структура? Паттерны доступа? Какая метаинформация? Прирост? Как все устроено сейчас? Какова цель переделки?
W>Без знания всего этого я бы рассматривал в такой последовательности: W>- распарсить все и в базу W>- не парсить и в базу W>- VCS W>- архивы W>- свой велосипед
Структура XML ложится в базу неоюходимая информация, есть куча побочной, которая редко используется. Парчится файлик что нужно для работы ложится в базу что не особо остается в файлике.
Прирост постоянный за месяц на 20 тыс. Сейчас все хранится распределенно, трудночти с резервным копированием и котролем, цель вести централизованно.