Re[2]: Версионность большого количества файлов, как?
От: Павел_  
Дата: 26.06.11 17:24
Оценка:
Здравствуйте, wildwind, Вы писали:

W>Здравствуйте, Павел_, Вы писали:


П_>>Фирма хранит информацию о транзакциях в файлах(небольших от 20 до 40 кб) за большой период файлов накопилось миллионы.

П_>>Как построить схему хранения файлов и метаинформации о них, номер транзакции, дата, оператор с поддержкой версионности?
П_>>Предполагал хранить ссылку на место расположение файла и мета информацию в базе, 1 таблица для актуальных файлов, вторая таблица история изменений. Ключ это номер транзакции. На диске же хранить файлы так /data/trans_001/version_0/сам файл
П_>>и для версионности использовать /data/trans_001/version_1/сам файл. Правильно ли я мыслю? Самих папочек на версию будет 10-15, но вот самих файлов будет несколько миллионов. Могу разбить транзакции по контрагентам или дате или региону. Может кто то сталкивался с подобной задачей. Прощу подсказки. Спасибо

W>Формат файлов, структура? Паттерны доступа? Какая метаинформация? Прирост? Как все устроено сейчас? Какова цель переделки?


W>Без знания всего этого я бы рассматривал в такой последовательности:

W>- распарсить все и в базу
W>- не парсить и в базу
W>- VCS
W>- архивы
W>- свой велосипед
Структура XML ложится в базу неоюходимая информация, есть куча побочной, которая редко используется. Парчится файлик что нужно для работы ложится в базу что не особо остается в файлике.
Прирост постоянный за месяц на 20 тыс. Сейчас все хранится распределенно, трудночти с резервным копированием и котролем, цель вести централизованно.
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.