Здравствуйте, temnik, Вы писали:
T>Агенты лучше и качественней, благодаря тому, что "видят" весь проект.
Только поэтому? Если, как я уже упоминал, загрузить архив с полным текстом в чат — он обработает его так же, как и агент, читающий тот же набор файлов с локальной ФС? Или таки чатовые движки действительно придушены, чтоб переходили на агентов?
T>Вы говорили про код, а пример совсем о другом.
В чем Вы видите
качественную разницу? Когда генераторы изображений поймали на ошибках с количеством пальцев, в них быстро встроили самопроверки на артефакты такого рода. Если у ИИ-движка есть функция вставки ссылки в текст выдачи (с оформлением в качестве ссылки), то должна быть и самопроверка на валидность этой ссылки. Если такой самопроверки нет, то какие есть основания доверять сгенерированному коду? Только тот факт, что на нем выполняются сгенерированные тем же ИИ тесты?
T>Вот сколько времени Вы уже потратили тут на обсуждение своей идеи монитора процессов?
В совокупности — минут пятнадцать. Набираю я быстро.
T>Вы бы потратили его в беседах с ИИ с большей пользой.
Я пока не могу понять, как именно. Я несколько раз просил разные ИИ "напиши мне полный текст приложения, делающего конкретно то-то и то-то". На это он мне вываливал, как это можно сделать, генерировал какие-то простенькие и очень грубые примеры, делающие вид, будто они решают поставленную задачу, но и только. Я по нескольку раз уточнял требования, он каждый раз отвечал в стиле "да, конечно", и продолжал нести пургу — точь-в-точь, как недалекий подчиненный, который смотрит тебе в рот, и старается всячески угодить, только не понимает, как, хоть ему кол на голове теши.
Тогда я пытался переходить на уровень ниже, и просил его написать отдельные компоненты. Он выдавал нечто, очень похожее на повсеместно валяющиеся наборы "для всего сразу, и ни для чего конкретно", которые можно взять за основу, но разбираться и допиливать нередко будет сложнее, чем написать с нуля.
Из этого у меня сложилось впечатление, что он тупо собирает вместе элементы кода, выдранные из известных ему примеров задач, которые уже кто-то когда-то решал. Сделать то, чего еще никто делать не пытался (а я главным образом только таким и занимаюсь), у него не выходит.
А если опускаться еще ниже, то "код для перестановки элементов массива задом наперед" я и сам быстро напишу без этих заморочек.
T>при выборе из двух китайцев для кода я рекомендую Qwen
Попробую в ближайшее время и его.
T>Не просите его ходить по сайту
Почему? Это же простая, чисто алгоритмическая задача, признаки правильности выполнения которой жестко регламентированы и хорошо известны. Из той же серии, что и вычисление математических формул, имитация выполнения "локального" программного кода и т.п. Если он приводит в качестве примера невалидную ссылку, да еще и добывает из каких-то глубин древности тексты, которые ассоциируются с именами в пути URL, то и совершенно левое слово при OCR может подставить, и вставить в код идентификатор другой переменной.
У меня с ИИ повторяется ситуация, которая уже много раз бывала с разными устройствами и программами: я регулярно нахожу как воспроизводимые, так и случайные баги, с которыми большинство не сталкивается почти никогда.

Я хз, как так получается, но факт.