Имеем что юзеры работали долгие годы с экселями в разных вариантах.
Иногда это просто плоский файл — таблица иногда сложные виды данных и это надо легко и быстро трансформировать
в массивы данных.
Сейчас делаем это на шарпе, но производительность не всегда устравивает, т.к. юзер может прислать 100К строк в сложном формате и приходится построчно собирать массив данных.
Кто какие языки\либы знает чтобы быстро решать подобные задачи?
Здравствуйте, merge, Вы писали:
M>Сейчас делаем это на шарпе, но производительность не всегда устравивает, т.к. юзер может прислать 100К строк в сложном формате и приходится построчно собирать массив данных. M>Кто какие языки\либы знает чтобы быстро решать подобные задачи?
Шарп у вас работает через CОМ или прямой читатель файлов?
В pandas неплохой читатель, но это врапер над xlrd/openpyxl, которые можно использовать и напрямую.
Здравствуйте, novitk, Вы писали:
N>Здравствуйте, merge, Вы писали:
M>>Сейчас делаем это на шарпе, но производительность не всегда устравивает, т.к. юзер может прислать 100К строк в сложном формате и приходится построчно собирать массив данных. M>>Кто какие языки\либы знает чтобы быстро решать подобные задачи?
N>Шарп у вас работает через CОМ или прямой читатель файлов?
прямой читатель файлов
N>В pandas неплохой читатель, но это врапер над xlrd/openpyxl, которые можно использовать и напрямую.
Здравствуйте, merge, Вы писали:
N>>Шарп у вас работает через CОМ или прямой читатель файлов? M>прямой читатель файлов
Тогда если он не совсем криво написан я не уверен, что производительность питоновских библиотек будет сильно лучше. Будет обычный managed vs unmanaged, то есть вряд ли больше чем +20%.
N>>В pandas неплохой читатель, но это врапер над xlrd/openpyxl, которые можно использовать и напрямую. M>а можно чуть подробнее про это?
Что не понятно/не гуглится по ключевым словам?