Отсканировать бумажные книги.
От: fk0 Россия https://fk0.name
Дата: 20.02.22 12:18
Оценка:
Hello...

Хочу отсканировать несколько десятков бумажных книг разного формата.
Как это можно сделать?

Проблема с обычными сканерами:

1) ручная работа, легко ошибиться (пропустить страницу);

2) и чертовски медленно -- полминуты на страницу;

3) не равномерная освещённость (что будет потом проблемой, см. ниже);

4) не плотное прилегание книги и "заворот строчек" в центре страницы как следствие,
плохую фокусировка, размытие текста;

Проблемы с постобработкой:

1) неравномерная засветка позволяет только кодирование страницы в градациях серого,
перевести в монохромный вид не получается -- это и читать неудобно потом, и
объёмы информации гораздо больше. Допускаю, что эта проблема имеет алгоритмическое
решение.

2) хотелось бы распознавание текста и добавить потом буковки поверх картинки в djvu,
пусть далеко не 100% надёжно -- нужно не для чтения, а для поиска по тексту.

3) хотелось бы решить проблему с автоматическим поворотом и обрезкой изображения, если страница
была повернута при сканировании;

4) хотелось бы алгоритмически решить проблему с заворотом строчек на изгибе страницы;

5) и решить проблему с не резким фокусом, когда страница не прилегает к стеклу сканера.

По всем пунктам касающимся математической обработки хотелось бы уйти от специализированных
программ к чему-то вроде octave/matlab, чтоб иметь возможность во-первых подстройки алгоритма,
во-вторых запуска в пакетном режиме. Для распознавания текста тоже не годятся программы вроде
"FineReader". Нужна пакетная обработка изображений страниц и результат который можно в дальнейшем
интегрировать в процесс, а не просто вордовский файл.

Вообще задача сканирования и постобработки -- это две мало связанные, разделённые во времени
задачи. Первая должна породить множество дискретных файлов, хоть TIFF, потом их сжать в djvu
(иначе дисков не напасёшься), а потом вторая задача -- разобрать файлы обратно на страницы, обработать страницы и собрать обратно. Сейчас я умею что-то подобное делать с помощью netpbm/imagemagick и djvulibre.

По поводу сканирования. Обращаться к кому-то за деньги, думаю дохлый номер. Хотят безумно дорого
и разумеется напортачат где-то в середине, а такие ошибки потом съедят массу времени.

Скорей нужен сканер. Либо способный автоматически переворачивать страницы. Не знаю есть ли такое,
но скорей за космический ценник. Наверное вариант только если можно продать после того как попользовался.

Либо хотя бы способный работать быстро. Т.е. никаких крышек и стекла на которое нужно класть книгу.
Книга должна "сканироваться" сверху, фотографическим способом. На страницу должно уходить не более
сотен миллисекунд, иначе просто душу вымотает, с таким работать невозможно, когда оно расчитано на
работников "почты россии". И нужна кнопка запуска фотографирования. Перевернул-нажал.

Fujitsu ScanSnap вроде похож на такое. Но у них в рекламе: "при каждом нажатии кнопки «Scan» большая область сканирования формата A3 записывается менее чем за 3 секунды". Так невозможно. Если работать вручную есть какой-то ритм с которым может работать человек, когда нужно постоянно ждать, это выматывает. Я не понимаю проблемы. Такое впечатление, что это какое-то искусственное ограничение введённое секретными масонами исповедующими "461 градус по фаренгейту", и проще штатив для фотоаппарата приспособить... Хотя непонятно как там быть со светом. Купить бестеневую (круглую) лампу?

С фотоаппаратами тоже проблема. У меня был фотоаппарат Casio Exilim -- снимал сразу и не тормозил. Сейчас же обычно везде табличка "ждите, фотография записывается". Те же три секунды. Да и ещё срабатывание с задержкой после нажатия пуска. Фотоаппараты "для спортивных событий" отдельная категория за подвышенный ценник теперь. Может проще мобильник приспособить? Вот кажется реально так. Мобильник не тупит, даёт фотографии приличного качества, держатель с лампой для него купить на каждом углу можно. Нафоткать так все страницы. А потом перегнать на комп и обрабатывать. Зачем нужны дорогущие и тормозные сканеры? Наверняка с картинкой какие-то проблемы будут...

Если расстояние одно и искажения одинаковые, опять же наверное можно алгоритмически восстановить картинку, просто фиксированным алгоритмом с одними и теми же настройками. Но вот каким софтом пользоваться? Софт должен скриптоваться. Наверное задача выравнять освещённость (для чего вначале на белом листе по десятку точек замерить, а потом получить какой-то градиент на который домножать входящие изображения), и выравнять геометрические искажения (аналогично -- по сетке напечатаной на принтере откалибровать и потом в обратную сторону исправить)...

Да и с мобильником нужна какая-то программа, которая отключит всю автоматику вообще и позволит все настройки крутить исключительно руками. Баланс белого, выдержку, фокус, зум. Такое бывает? В более дорогом самсунге какое-то подобие есть, в дешевеньких -- полный автомат практически (т.е. не применимы). И нужен жёсткий штатив, иначе ж все калибровки без толку. На рынке полно шатких треног, но что-то, чтоб жёстко фиксировалось к столу -- не видел.

Пока писал, я понял, что я отстал от жизни. На рынке полно т.н. "документ-камер". Но нигде нет понятного описания -- что это? За 40 тыщ рублей пытаются продать веб-камеру на опять же гибком штативе? А свет отдельно самому городить? Склоняюсь, купить на Савеловском круглую лампу с держателем для телефона, там же тиски для ремонта мобильников с вакуумной присоской, одно зажать в другое и будет вполне себе. Уложусь в три тыщи. И у держалки для телефона есть даже кнопка для селфи -- то что надо! Перевернул, нажал. И не тормозит.

Может кто что посоветует.
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.