Здравствуйте, Ocenochka, Вы писали:
O>И как входы маппить, если для одной цифры при обучении подаем десятки пикселов,
O>а искать надо в большой картинке на тысячи пикселов?
Если распознавать только картинки с цифрами (и больше ничего на них нет),
то картинки ресайзят под один размер, обычно не более 100х100 пикселей.
Да, одна из основных проблем нейросетей — необходим достаточно большой объем данных для обучения.
Весьма часто данные генерируют программно. В случае цифр их легко можно искажать-размывать-пеерворачивать,
генерировать новые. Но вообще есть много уже готовых датасетов по различным темам.
Стоит поискать их, прежде чем создавать свои.
Для поиска цифр на больших изображениях применяют CNN сети, для которых тоже все изображения ресайзят в единый формат.
Вместо обьъяснения того, как работают CNN сети, порекомендую курсы на курсере.
Вот весьма базовый, простой и доходчивый от Adrew NG (часть специализации нейросетей)