посоветуйте литературу, пожалуйста, по прикладной стороне разработки моделей.
А то пока как в темном царстве. Вроде как есть задача. Под нее подходит 3-5 типовых архитектур. Неужели все перебирать опытным путем?
Аналогично вопросы по размеру слоев, их количеству и т.п.
Вот чатжпт предлагает под задачу классификации CNN (feature extraction) + LSTM (temporal dependencies), например. Последнее для меня звучит диковато поскольку я считал что "временная зависимость" предполагает учет контекста при последовательной работе. А какой может быть контекст если у тебя независимые "вектора" на входе.
Причем иногда он предлагает CNN на два слоя, а иногда на три. А если задачу переформулировать чуток, то вообще предлагает SVM.
Или вот еще загвоздка. Есть фичи, которые видно только на большом масштабе (окне). Но большое окно может содержать с десяток мелких фич. Получается либо делать отдельные модели под разные фичи, либо как-то резать большой вход на сегменты внутри модели, но боюсь что это приведет к монструозности последней.