Re[7]: Эра магии - когда технология становится магией - Компьютерные священные войны

Здравствуйте, Shmj, Вы писали:

A>>Где в ЛЛМ используют необратимые функции?

S>

S>В больших языковых моделях (LLM) необратимые функции используются в различных компонентах архитектуры и процесса обучения. Вот где они применяются:

S>Функции активации:

S>ReLU (Rectified Linear Unit): Эта функция преобразует отрицательные значения в ноль. Поскольку невозможно восстановить исходное отрицательное значение из нуля, ReLU считается необратимой.
S>GELU (Gaussian Error Linear Unit): Хотя эта функция более гладкая, она также необратима из-за своей нелинейной природы.

S>Softmax:
S>Используется в выходном слое для преобразования логитов в вероятности. Softmax необратим, так как из выходных вероятностей невозможно точно восстановить исходные логиты.
S>...

S>- это вам для начала. Но и так понятно что по имеющейся модели нельзя восстановить данные, на которых она обучалась. Размер модели будет во много крат меньше самих данных, даже если данные сжать.

А ты знаешь, что a || b необратимая (в твоём смысле) функция? И a && b тоже необратимая. И только !a обратимая. Вот так. Практически любая программа — магия! Пыщь пыщь!

	От:	Alekzander
	Дата:	28.09.24 14:07
	Оценка: