PGM-index
От: wildwind Россия  
Дата: 25.01.21 12:36
Оценка: 120 (3) +1
https://pgm.di.unipi.it/

Новый подход к теме learned indexes (не знаю, как перевести, может "умные" индексы), построенный на кусочно-линейной аппроксимации.
Заявлены какие-то фантастические показатели, особенно для статических индексов.

Публикация: http://www.vldb.org/pvldb/vol13/p1162-ferragina.pdf
Re: PGM-index
От: Sinclair Россия https://github.com/evilguest/
Дата: 29.01.21 06:14
Оценка:
Здравствуйте, wildwind, Вы писали:
W>Публикация: http://www.vldb.org/pvldb/vol13/p1162-ferragina.pdf
Да, очень интересно.
Уйдемте отсюда, Румата! У вас слишком богатые погреба.
Re: PGM-index
От: Sinclair Россия https://github.com/evilguest/
Дата: 29.01.21 07:05
Оценка: +1
Здравствуйте, wildwind, Вы писали:
W>Новый подход к теме learned indexes (не знаю, как перевести, может "умные" индексы),
Обучающиеся индексы
W>построенный на кусочно-линейной аппроксимации.
W>Заявлены какие-то фантастические показатели, особенно для статических индексов.
W>Публикация: http://www.vldb.org/pvldb/vol13/p1162-ferragina.pdf
Подвох: индекс работает только для числовых ключей.

2 U is a range of reals because of the arithmetic operations required by the linear models. Our solution works for any kind of keys that can be mapped to reals while preserving their order. Examples include integers, strings, etc.

То есть чтобы это работало для строк, надо иметь какой-то способ отображения строк в нумерики, сохраняющий порядок при сравнении. Можно, конечно, просто взять первые четыре UCS2 символа и откастить их к int64, но там будет слишком много повторов.
Вообще, можно поставить эксперимент — взять какой-нибудь real world dataset со строками, и попробовать сравнить PGM на нём с классикой
Уйдемте отсюда, Румата! У вас слишком богатые погреба.
Re: PGM-index
От: HFTMan  
Дата: 30.01.21 13:22
Оценка:
Здравствуйте, wildwind, Вы писали:

W>https://pgm.di.unipi.it/


W>Новый подход к теме learned indexes (не знаю, как перевести, может "умные" индексы), построенный на кусочно-линейной аппроксимации.

W>Заявлены какие-то фантастические показатели, особенно для статических индексов.

W>Публикация: http://www.vldb.org/pvldb/vol13/p1162-ferragina.pdf


Годнота!
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.