Re[6]: Qwen3.6 27B
От: Nuzhny Россия https://github.com/Nuzhny007
Дата: 23.04.26 12:18
Оценка: +1
Здравствуйте, Философ, Вы писали:

Ф>Наверное, если ты почитаешь нашу переписку, то поймёшь


Наверное не пойму, потому что я не знаю, что такое мосфеты и все эти ваши гейты и ферриты.

Ф>Мне нужна вероятность 99.99%. Поэтому вычитываю и пересчитываю. Это поднимает вопрос о его нужности: доверять его ответам нельзя, можно поручать только самые простые задачи, а такие задачи а Алиса решает.


Поэтому индустрия и идёт дальше по цепочке, заменяя чаты на агентов с инструментами и агентов, которые перепроверяют других агентов. Как думаешь, с какой вероятностью получается верное доказательство у математиков, которые просто используют LLM? Если же LLM генерирует доказательство в lean, а там проверка проходит, то как изменяется вероятность того, что доказательство будет верным?
В том-то и дело, что для улучшения качества и снижения галлюцинаций надо внедрять детерменированный инструментарий и перепроверку.
Если LLM попросить написать код, то с большой вероятностью он будет некорректным и даже нерабочим.
Если дать ей интерпретатор/компилятор и в цикле запускать, пока не будет собираться без ошибок.
Если добавить тесты, то вероятность получения корректной программы возрастёт.
Почему бы тебе не найти какой-нибудь электротехнический решатель и не подружить свою LLM с ним? чтобы она смогла делать схемы, тестировать их и т.д.?
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.