Re[6]: Qwen3.6 27B

Здравствуйте, Философ, Вы писали:

Ф>Наверное, если ты почитаешь нашу переписку, то поймёшь

Наверное не пойму, потому что я не знаю, что такое мосфеты и все эти ваши гейты и ферриты.

Ф>Мне нужна вероятность 99.99%. Поэтому вычитываю и пересчитываю. Это поднимает вопрос о его нужности: доверять его ответам нельзя, можно поручать только самые простые задачи, а такие задачи а Алиса решает.

Поэтому индустрия и идёт дальше по цепочке, заменяя чаты на агентов с инструментами и агентов, которые перепроверяют других агентов. Как думаешь, с какой вероятностью получается верное доказательство у математиков, которые просто используют LLM? Если же LLM генерирует доказательство в lean, а там проверка проходит, то как изменяется вероятность того, что доказательство будет верным?
В том-то и дело, что для улучшения качества и снижения галлюцинаций надо внедрять детерменированный инструментарий и перепроверку.
Если LLM попросить написать код, то с большой вероятностью он будет некорректным и даже нерабочим.
Если дать ей интерпретатор/компилятор и в цикле запускать, пока не будет собираться без ошибок.
Если добавить тесты, то вероятность получения корректной программы возрастёт.
Почему бы тебе не найти какой-нибудь электротехнический решатель и не подружить свою LLM с ним? чтобы она смогла делать схемы, тестировать их и т.д.?

От:	Nuzhny	https://github.com/Nuzhny007
Дата:	23.04.26 12:18
Оценка:	+1