Нужна помощь!!! Извлечение текста из PDF
От: SvatSergio  
Дата: 13.03.06 20:57
Оценка:
Возникла задача (а точнее проблема):
Необходимо извлечь текстовую информацию из файлов формата PDF. При этом есть одна особенность — файл поврежден и стандартными средствами инфу извлечь не возможно...
Я вроде разобрался как и где хранится текст. В принципе английский текст извлеч получается, но вот если документ был на руссском возникают проблемы:
1-я и пока основная после декомпрессии выводится абракодабра... Что с ней делать??? Может нужно изменить параметры декомпрессии???
Если кто занимался подобными вещами, помогите плиз!!!

P.S. Программирую на VS c++ для декомпресси использую zlib (точнее функцию uncompress).
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.