Возникла задача (а точнее проблема):
Необходимо извлечь текстовую информацию из файлов формата PDF. При этом есть одна особенность — файл поврежден и стандартными средствами инфу извлечь не возможно...
Я вроде разобрался как и где хранится текст. В принципе английский текст извлеч получается, но вот если документ был на руссском возникают проблемы:
1-я и пока основная после декомпрессии выводится абракодабра... Что с ней делать??? Может нужно изменить параметры декомпрессии???
Если кто занимался подобными вещами, помогите плиз!!!
P.S. Программирую на VS c++ для декомпресси использую zlib (точнее функцию uncompress).