Здравствуйте, L_G, Вы писали:
L_G>В перспективе же (приближаясь к совершенству) ИИ обязательно (ИМХО) должен научиться задавать правильные вопросы — т.е. это ИИ должен уточнять ТЗ в диалоговом режиме, доводя его до полноты и непротиворечивости — еще ДО начала этапа генерации решения по ТЗ!
Неа, не будет такого. С текущим дикпиком я провел такой эксперимент. Сначала заставил его задавать вопросы, пока коротенькое ТЗ не станет однозначным. Он в итоге удовлетворился и написал, что теперь получилось однозначное для него ТЗ. Дальше попросил сгенерировать решение по полученному ТЗ — дальшео он просто набредил, как будто его и не было. Таковы LLM и по другому они не могут.
Многоагентный модели не сильно улучшат ситуацию.
Пока они отличны для случая, когда самому лень писать простенький код, а LLM быстро его находит в своем датасете и вываливает его тебе.
Здравствуйте, Vzhyk2, Вы писали:
V>Пока они отличны для случая, когда самому лень писать простенький код, а LLM быстро его находит в своем датасете и вываливает его тебе.
Намного более важно — когда лень читать документацию и оно за тебя прочитает и выдаст ответ на конкретный вопросы. Но пока работает кривовато, иногда приходится читать таки самому.
Вот не нужно писать код — научил бы его кто сжато и компактно отвечать на вопросы по документации, можно с примерами кода.
Здравствуйте, Shmj, Вы писали:
S>Вот не нужно писать код — научил бы его кто сжато и компактно отвечать на вопросы по документации, можно с примерами кода.
Скачиваешь модель, дообучаешь на свою доку и получишь то, что хочешь.
Здравствуйте, Vzhyk2, Вы писали:
S>>Вот не нужно писать код — научил бы его кто сжато и компактно отвечать на вопросы по документации, можно с примерами кода. V>Скачиваешь модель, дообучаешь на свою доку и получишь то, что хочешь.
Если взять книжки мои и на них обучить — сколько займет времени? Но там же практически везде PDF, то есть еще распознать нужно.
L_G>>В перспективе же (приближаясь к совершенству) ИИ обязательно (ИМХО) должен научиться задавать правильные вопросы — т.е. это ИИ должен уточнять ТЗ в диалоговом режиме, доводя его до полноты и непротиворечивости — еще ДО начала этапа генерации решения по ТЗ! V>Неа, не будет такого.
я не случайно говорил про ИИ вообще, а не про LLM
V>Таковы LLM и по другому они не могут.
согласен. но это же не конец эволюции ИИ, должно появиться что-то более совершенное. как вариант, использующее систему формальной логики (внутри которой однозначность и непротиворечивость наборов высказываний легко проверять, а неоднозначности и противоречия — выявлять. и устранять их, формулируя вопросы и анализируя ответы, не останавливаясь до полного устранения).
о сроках я даже не гадаю. AGI можем до конца жизни не дождаться. но узкоспециализированные системы для программирования должны быть попроще.
Здравствуйте, Shmj, Вы писали:
S>В Copilot добавили GPT 5.2 и он реально удивил.
Его можно использовать и без копилота, хоть через голый curl, хоть через codex от openai.
S>Нужно было заняться формоклепством — т.е. чисто верстка, обработка событий, связь с данными. Но форма сложная, одна лишь верстка дорогого стоит. Так вот — играючи не напрягая мозг (лишь изредка контролируя чтобы не писало бреда) — наваял эту форму — получилось 34 файла и около 70 Кб. кода. Форма сложная, с обработкой скролла, разные реакции и несколько разных вариантов как эта форма может быть представлена.
S>Так вот — смогло. Удивился. Пару раз по крупному пришлось направлять его, т.к. его решения ушли в сторону страшных усложнений. Так же оно не могло протестировать скролл — там был баг — но просто сообщил ему и подсказал решение. Удивлен.
Это всё так, здорово и замечательно. НО.
1) Оно не может работать с большими кодовыми базами.
Ему в контекст влезет три файла, ну четыре. Ещё нужно оставить место на его
размышления и вывод. Да, он может грепать и т.п., но в целом это не поможет.
Т.к. программист видящий проект не в первый раз в жизни на самом деле в голове
обладает достаточно большим знанием о нём. Понимает архитектуру, какие компоненты
за что отвечают. GPT -- не может, это просто не уместится физически в контекст.
Потенциально можно было бы разбить код на небольшие функционально изолированные
единицы (классы, функции), заставить GPT проанализировать каждую и связи между
ними и документировать на человеческом языке (предполагая, что документация
будет своеобразным "сжатием с потерями", т.е. займёт существено меньше).
Затем сложить документацию в RAG базу данных и показывать её с помощью маленькой
модели по запросу большой. Т.е. чтоб оно не только грепать могло, но и почитать
своими руками же созданную документацию. Но... такого софта сейчас практиески нет.
2) GPT отличается очень "своеобразными решениями" в отличие от человека. Ввиду чего
его и приходится постоянно направлять. Иначе рождаются такие казусы, как
"удалил юнит-тесты чтоб починить сборку", "добавил код, который в случае если
юнит-тесты фейлятся -- возвращает успех" (потому, что понимает, что фейлятся юнит-
тесты не потому, что ошибка в коде, а потому, что в сборке есть другая проблема,
он её понимает, понимает что в тестах ошибки нет, но принимает странные решения).
И здесь проблема: на взаимодействие с ним, да и сам он не быстрый (я использую
через API), тратится очень много времени. Натурально быстрей руками. Хотя иногда
действительно, докапывается до решения когда тебе не понятно. Но в целом -- не
эффективно. На AI времени тратится больше чем на работу.
S>Далее все более задумываюсь в чем же основная функция человека будет. Без человека оно не может, нужен дирижер.
Самая главная проблема AI сейас, что никто не понимает как его использовать
эффективно и используют неправильно. И что нет хороших агентов. Те что есть
не позволяют работать ни над большими задачами, ни над большими кодовыми базами,
ни автоматизировать что-то (т.к. предполагают схему работы "Human In the Middle").
S>И понял вот что. От человека требуется задать правила игры. S> Всегда есть некие правила игры, которые, быть может, воспринимаются нами очевидные. Но машине нужно объяснить.
Именно. И их столько, что перечислять устанешь.
Кроме того, нужно правильно поставить изначальную цель. Иначе на запрос "почини сборку"
будет без зазрения совести удалять юнит-тесты. И не поспоришь. Починил же.
Здравствуйте, L_G, Вы писали:
S>>Вот эти правила игры, которые достаточно сложно описать — они как бы больше на уровне интуиции — их и должен обеспечить человек.
L_G>Это только текущее состояние ИИ (примитивных LLM) таково, что от человека либо а) требуется сразу ПОЛНОЕ (что вряд ли возможно!) и непротиворечивое ТЗ (ИИ не должен ничего угадывать — но работа по составлению человеком такого ТЗ слишком трудозатратна, да и способность ИИ угадывать бывает крайне полезна, хоть она же самая и приводит к ошибкам), либо б) будет МНОГО циклов "ИИ сгенерировал — человек проверил — исправляем" (опять же куча лишних трудозатрат).
L_G>В перспективе же (приближаясь к совершенству) ИИ обязательно (ИМХО) должен научиться задавать правильные вопросы — т.е. это ИИ должен уточнять ТЗ в диалоговом режиме, доводя его до полноты и непротиворечивости — еще ДО начала этапа генерации решения по ТЗ!
На самом деле, ИИ не так уж и туп. Он обладает ГИГАНСКИМ объёмом знаний по сравнению
с обычным человеком. Но нужно понимать, что на самом деле "ИИ" -- это лишь база данных
с запросами на естесственном языке. Если ей на вход не подать ключ, то нужные значения
на выходе никогда и не появятся. Он сам может написать ТЗ. Но его нужно хотя бы попросить
об этом. Что вот я мол хочу решить такую-то задачу, с примерно такими условиями.
А что дальше? А дальше не надо код писать. Дальше нужно попросить его проанализировать
входные данные, формализовать, найти возможные противоречия и неоднозначности, задать
уточняющие вопросы -- это работает. Но если такой запрос даже не делать, то сам он
ничего такого тоже не сделает. У него нет причин, может быть, разве что в промпте
у конкретного агента будет требование попытаться формализировать данную задачу и разбить
на подзадачи.
L_G>Тогда человеку не обязательно быть точным, всё помнить и всё заранее предусматривать — умный ИИ вытянет из него своими вопросами всю нужную инфу и не отпустит, пока не получит всё, что нужно!
В принципе, всё это уже есть. Но без правильного начального промпта само не получится.
Здравствуйте, Vzhyk2, Вы писали:
V>Здравствуйте, L_G, Вы писали:
L_G>>В перспективе же (приближаясь к совершенству) ИИ обязательно (ИМХО) должен научиться задавать правильные вопросы — т.е. это ИИ должен уточнять ТЗ в диалоговом режиме, доводя его до полноты и непротиворечивости — еще ДО начала этапа генерации решения по ТЗ! V>Неа, не будет такого. С текущим дикпиком я провел такой эксперимент. Сначала заставил его задавать вопросы, пока коротенькое ТЗ не станет однозначным. Он в итоге удовлетворился и написал, что теперь получилось однозначное для него ТЗ. Дальше попросил сгенерировать решение по полученному ТЗ — дальшео он просто набредил, как будто его и не было. Таковы LLM и по другому они не могут. V>Многоагентный модели не сильно улучшат ситуацию.
У меня негативное мнение относительно DeepSeek, да и всех китайских моделях кроме Xiaomi Mimo V2 flash.
Они как правило тратят очень много токенов на размышления (кроме DeepSeek) и в процессе размышлений
могут вовсе зациклиться. И действительно бредят если что-то не знают и не понимают. Хотя при этом имеют
высокие рейтинги в бенчмарках. Я думаю, они только в бенчмарках и сильны...
Потом, у меня сложилось впечатление, что для начального составления ТЗ нужна большая/дорогая модель.
Западная. А написание кода удаётся делегировать даже gpt-oss-120b (и она справляется лучше китайских моделей).
V>Пока они отличны для случая, когда самому лень писать простенький код, а LLM быстро его находит в своем датасете и вываливает его тебе.
В принципе, если задача рекурсивно решается путём разбития её на более мелкие составляющие,
где самые мелкие части находятся в датасете -- почему бы и нет.
Здравствуйте, fk0, Вы писали:
fk0> Его можно использовать и без копилота, хоть через голый curl, хоть через codex от openai.
Мне тоже сначала было лень установить плагин и все настроить и я себя убеждал что разницы нет. Но разница — небо и земля. Когда оно имеет доступ к файлам проекта, может запускать проект и анализировать консоль с ошибками, может даже запускать браузер, внедряться в браузер и смотреть лог JS — совсем другой уровень — который даже пугает.
Здравствуйте, Vzhyk2, Вы писали:
S>>Вот не нужно писать код — научил бы его кто сжато и компактно отвечать на вопросы по документации, можно с примерами кода. V>Скачиваешь модель, дообучаешь на свою доку и получишь то, что хочешь.
И моделька может быть маленькая, её задача получить уже готовые сведения и как-то скомпоновать
ответ чтоб он соответствовал запросу. Может быть ещё, улучшить изначальный пользовательский
запрос (фактически, ключ для векторной базы данных).
Здравствуйте, Shmj, Вы писали:
S>Если взять книжки мои и на них обучить — сколько займет времени? Но там же практически везде PDF, то есть еще распознать нужно.
Зависит от вычислительных ресурсов, что у тебя есть, если на дешевом ноутбуке, то и лет 10 занять может. Если на приличном кластере из горы тесл, то и за 2-3 мин управишься или быстрее.
Здравствуйте, L_G, Вы писали:
L_G>согласен. но это же не конец эволюции ИИ, должно появиться что-то более совершенное. как вариант, использующее систему формальной логики (внутри которой однозначность и непротиворечивость наборов высказываний легко проверять, а неоднозначности и противоречия — выявлять. и устранять их, формулируя вопросы и анализируя ответы, не останавливаясь до полного устранения). L_G>о сроках я даже не гадаю. AGI можем до конца жизни не дождаться. но узкоспециализированные системы для программирования должны быть попроще.
Во-во. В теории возможно, но для реализации подобного нужны очень большие вложения денег. А когда их вкладывают, то планируют и окупаемость. Если окупаемости не видать, то и вкладывать не будут.
Сейчас толстосумы (инвесторы) больше в золото уходят, чем рисковано инвестируют. Через лет 15 тренд может снова поменяться, а может и через 50.
V>Сейчас толстосумы (инвесторы) больше в золото уходят, чем рисковано инвестируют. Через лет 15 тренд может снова поменяться, а может и через 50.
кроме абстрактных толстосумов-инвесторов есть еще большие IT-корпорации, одновременно являющиеся и ИИ-провайдерами, и крупными софтописателями + еще и производителями инструментов для программистов (Google, MS, etc).
вот им идея вложиться в своё же развитие, сделав узкоспециализирванный ИИ для программирования — и для других, и для себя — должна казаться более оправданной, чем тем, кто не разбирается в IT.