https://pgm.di.unipi.it/
Новый подход к теме learned indexes (не знаю, как перевести, может "умные" индексы), построенный на кусочно-линейной аппроксимации.
Заявлены какие-то фантастические показатели, особенно для статических индексов.
Публикация:
http://www.vldb.org/pvldb/vol13/p1162-ferragina.pdf
Здравствуйте, wildwind, Вы писали:
W>Публикация: http://www.vldb.org/pvldb/vol13/p1162-ferragina.pdf
Да, очень интересно.
Здравствуйте, wildwind, Вы писали:
W>Новый подход к теме learned indexes (не знаю, как перевести, может "умные" индексы),
Обучающиеся индексы
W>построенный на кусочно-линейной аппроксимации.
W>Заявлены какие-то фантастические показатели, особенно для статических индексов.
W>Публикация: http://www.vldb.org/pvldb/vol13/p1162-ferragina.pdf
Подвох: индекс работает только для числовых ключей.
2 U is a range of reals because of the arithmetic operations required by the linear models. Our solution works for any kind of keys that can be mapped to reals while preserving their order. Examples include integers, strings, etc.
То есть чтобы это работало для строк, надо иметь какой-то способ отображения строк в нумерики, сохраняющий порядок при сравнении. Можно, конечно, просто взять первые четыре UCS2 символа и откастить их к int64, но там будет слишком много повторов.
Вообще, можно поставить эксперимент — взять какой-нибудь real world dataset со строками, и попробовать сравнить PGM на нём с классикой
Здравствуйте, wildwind, Вы писали:
W>https://pgm.di.unipi.it/
W>Новый подход к теме learned indexes (не знаю, как перевести, может "умные" индексы), построенный на кусочно-линейной аппроксимации.
W>Заявлены какие-то фантастические показатели, особенно для статических индексов.
W>Публикация: http://www.vldb.org/pvldb/vol13/p1162-ferragina.pdf
Годнота!