Коллеги, поделитесь опытом разбора офисных документов на серверной стороне.
С форматом OpenXML (Microsoft Office 2007 и выше) все понятно: есть Open XML SDK, предназначенный именно для серверной обработки, в отличиее от автоматизации Office. Но что делать со старым бинарным форматом (Microsoft Office 2003 и ниже)?
Посмотрел вариант использования Microsoft Office Compatibility Pack for Word, Excel, and PowerPoint File Formats (
http://social.msdn.microsoft.com/Forums/en/oxmlsdk/thread/8becabda-0014-4e06-8354-5f576bf46595) для конвертации бинарных форматов "на лету" в формат OpenXML для последующего разбора с помощью Open XML SDK. Но в данном варианте есть ограничения:
конверторы совершенно не документированы;
конверторы работают только с файлами на диске, соответственно, возникают накладные расходы на запись-чтение на диск;
при многопоточной конвертации начинаются проблемы, никак не диагностируемые конверторами (результат 0 и никакого вывода, но файла с результатом на диске нет).
конвертор Excel в отличие от Word и PowerPoint кроме прочего еще и окно создает при конвертации, правда неблокирующее.
Предположительно, количество документов в бинарном формате в обрабатываемом хранилище будет незначительно, потому, возможно, проблемы и не проявятся. Но быть может существуют другие более чистые решения?