Здравствуйте, Erop, Вы писали:
E>Здравствуйте, Khimik, Вы писали:
E>>>Пуллинг -- это ещё один нелинейный слой, который берёт наш "квадратик" 4х4х10 и заменяет его квадратиком 1х1х10, выбирая каждый раз максимальной значение из 16-и.
K>>Я чувствую какую-то путаницу в обозначениях. Здесь 4*4 — это размер растра, а третья цифра (10) — количество вариантов значений в каждом растре? E>Да, обычно это называют "число каналов"
Нет, кажется вы меня путаете.
E>Идя CNN в том, что есть некое "окошко", например 13х13, которое скользит по исходной картинке, и вычисляет с ОДНИМИ И ТЕМИ ЖЕ коэффициентами свёртки, например 128 разных свёрток. В результате (если не дополнять исходную картинку 16х16 нулями), получим "картинку" 4х4 в каждом "пикселе" которой лежит 128 чисел. Теперь можем сделать ещё одну свёртку, которая из 128 числе делает 10 (то есть матрица 128х10), получаем 10 вероятностей, что в соответствующем тому или иному "пикселю" квадрате есть та или иная цифра.
Всё-таки, судя по этому тексту, обозначение 4*4*128 значит, что в каждом "пикселе" растра 4*4 содержится 128 чисел. Т.е. этот массив всё-таки трехмерный, а не двумерный, как мне вначале показалось.
"Ты должен сделать добро из зла, потому что его больше не из чего сделать." Р.П. Уоррен