Re: Импорт документа MS Word
От: Константин Л.  
Дата: 23.06.06 11:46
Оценка:
Здравствуйте, dzeaman, Вы писали:

D>Приветствую!


D>Может быть, кто-нибудь встречался с чем-то подобным...


D>Есть модуль импорта из MS Word. Работает ужасно долго. Причина — в использовании метода get_Information, который, как показалось, просто необходим для определения, какой странице принадлежит параграф, и для определения координат параграфа. Один его вызов занимает 0.2 сек, довольно-таки много, если параграфов под сотню — время уже только на get_Information увеличивается до минуты (три вызова на параграф). А если одно слово из параграфа выделяется другим стилем — это вообще хана, такая ситуация так и осталась необработанной


D>Есть, в принципе, мысль, как это обойти: парсить документ, высчитывать координаты текста на основе его параметров, высот символов, ширин символов, расстояний между строк, полей документа, табуляций, встречающихся картинок и объектов, которые надо обойти, и т.д и т.д. и т.д. Мне это представляется не самой простой задачей, к тому же придется переписывать весь модуль с нуля


это самоубийство и мазохизм

D>Может, есть у кого идеи, как обойтись без переписывания? Также не откажусь от мыслей, как переписать модуль меньшей кровью, если уж это будет единственным выходом.


D>Заранее благодарен за любые комментарии
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.