Информация об изменениях

Сообщение Re: HRM - думающая нейросеть от 21.08.2025 19:25

Изменено 21.08.2025 19:26 Nuzhny

Re: HRM - думающая нейросеть
Здравствуйте, Nuzhny, Вы писали:

N>Hierarchical Reasoning Model

N>По сравнению с мейнстримовыми LLM, которые ни шахматы, ни судоку решить не могут, получился прямо таки прорыв.
N>

N>Самая громкая статья месяца – Hierarchical Reasoning Model

N>Без предисловий, сразу главный результат: у авторов получилось сделать модельку всего на 27 миллионов (!) параметров, которая обошла o3-mini на ARC-AGI-1. Неудивительно, что об этой работе сейчас говорит все комьюнити, а авторы ARC-AGI даже сами написали большой разбор результатов модели на их бенчмарке.

N>Погнали разбираться.

N>Итак, вся архитектура состоит из двух рекуррентных модулей: быстрого низкоуровневого и медленного высокоуровневого. Первый отвечает за быстрые локальные вычисления и решения частных задач, а цель второго – абстрактно управлять процессом и ставить таски первому.

N>Суть в том, что они обновляются с разной частотой. Исходная задача разбивается на несколько циклов рассуждения. В каждом из них верхний модуль обновляется только один раз и дает новый контекст нижнему модулю, который в свою очередь делает много мелких шагов и ищет локальное решение.

N>Сколько будет таких итераций, модель решает сама. Останавливаться (или не останавливаться) в правильный момент ее специально учили с помощью RL. Так что «думать» она может и пару секунд, и пару часов.

N>Обучается HRM не совсем привычно для рекуррентной модели: здесь, вместо того чтобы сохранять все внутренние состояния, авторы решили обновлять градиенты только по финальному стейту. Удивительно, но факт – это работает.

N>Кстати, вся конструкция и принцип обучения очень похожи на то, как работает наш мозг. Некоторые области отвечают за абстракцию, другие – за конкретные моментальные действия, а общаются они посредством обратных связей. Здесь те же принципы иерархии (отсюда и название). Плюс, мозг тоже не хранит промежуточные траектории и к сходимости приходит через схожие волновые циклы.

N>Итог: модель для своего размера просто беспрецедентно хороша на решениях всяких головоломок типа судоку, лабиринтов и индуктивных задач. В общем, именно в тех областях, где привычные LLM обычно фейлятся. Конечно, особенно поражают результаты на ARC-AGI, которые мы описали в начале.

N>Революция или нет, но выглядит действительно очень изящно и эффектно.

N>Обязательно почитайте работу полностью тут (+ вот еще один отличный разбор на русском языке)


N>Ссылка на Телегу


Ссылка на анализ на английском.

Дублирую ссылку на обзор на русском.
Re: HRM - думающая нейросеть