.. а точнее о его сейчас практически реализуемой части — deep networks.
Какая нибудь вводная для dummies.
Мне сейчас понятна однослойная обучаемая сеть — это по сути NxM матрица, её обучают штрафуя (меняя коэффициенты) ответственные за неправильные ответы.
Как обстоит дело с многослойной? Я читал что каждый слой обучают отдельно, но как? Что является критерием неправильного ответа промежуточного слоя?