От: | BlackEric | http://black-eric.lj.ru | |
Дата: | 05.11.21 13:36 | ||
Оценка: | 84 (2) |
Строки преобладают в наборах данных реального мира. Они часто занимают большую часть данных и медленно обрабатываются. В этой работе мы представляем Fast Static Symbol Table (FSST), упрощенную схему сжатия строк. Для текстовых данных FSST предлагает скорость распаковки и сжатия, аналогичную или превосходящую лучшие методы сжатия с оптимизацией скорости, такие как LZ4, но предлагает значительно лучшие коэффициенты сжатия. Более того, использование статической таблицы символов обеспечивает произвольный доступ к отдельным сжатым строкам, обеспечивая ленивую распаковку и обработку запросов к сжатым данным. Мы считаем, что эти функции сделают FSST ценным элементом в стандартном наборе инструментов сжатия.