определение статистики над множеством
От: Аноним  
Дата: 08.11.13 10:33
Оценка:
Здравствуйте такая задача есть множество различных B-Tree, с различными типами ключей от bool до int128 в них храниться огромное количество элементов от 100 млн., и есть постоянное количество по сути SQL запросов, захотелось сделать следующею оптимизацию, заранее определять к примеру сколько различных ключей в дереве, их распределение, что бы определять в первую очередь самые селективные элементы. Понятно то для типов типа bool, short, date это не сложно практически массив. Но вот что можно сделать для int32, int64, int128, если абстрагироваться от данных. Есть ли какие ни будь эффективные структуры данных которые позволяли бы над множеством int64 давать более менее точную картину распределения, я пока вижу как вариант использовать хеш размером 1мб.
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.