Здравствуйте, Vzhyk2, Вы писали:
V>У дипсика, по его "рассуждениям" видно, что пытаются сделать, но пока получается плохо.
Это другой кейс: рассуждающие модели сейчас — это не по-настоящему рассуждающие модели. Они просто пытаются рекуррентно увеличить свой промт полезными словами.
Вот одна из попыток сделать рассуждающую модель:
Teaching LLMs to Plan: Logical Chain-of-Thought Instruction Tuning for Symbolic Planning
Вот другая:
Hierarchical Reasoning Model.
То, что есть в индустрии сейчас — это костыль, а не настоящие рассуждения. Да, он отчасти работает, но только отчасти.