Здравствуйте, dzeaman, Вы писали:
D>Приветствую!
D>Может быть, кто-нибудь встречался с чем-то подобным...
D>Есть модуль импорта из MS Word. Работает ужасно долго. Причина — в использовании метода get_Information, который, как показалось, просто необходим для определения, какой странице принадлежит параграф, и для определения координат параграфа. Один его вызов занимает 0.2 сек, довольно-таки много, если параграфов под сотню — время уже только на get_Information увеличивается до минуты (три вызова на параграф). А если одно слово из параграфа выделяется другим стилем — это вообще хана, такая ситуация так и осталась необработанной
D>Есть, в принципе, мысль, как это обойти: парсить документ, высчитывать координаты текста на основе его параметров, высот символов, ширин символов, расстояний между строк, полей документа, табуляций, встречающихся картинок и объектов, которые надо обойти, и т.д и т.д. и т.д. Мне это представляется не самой простой задачей, к тому же придется переписывать весь модуль с нуля
это самоубийство и мазохизм
D>Может, есть у кого идеи, как обойтись без переписывания? Также не откажусь от мыслей, как переписать модуль меньшей кровью, если уж это будет единственным выходом.
D>Заранее благодарен за любые комментарии