Новое сообщение в форум Shareware и бизнес

Форум	Shareware и бизнес
Тема	Как правильно задавать вопросы

Здравствуйте, Sinclair, Вы писали:

S>Здравствуйте, Евгений Музыченко, Вы писали:

ЕМ>>Что значит "[b]помимо[/b] чата"? :facepalm: Как Вы не поймете, что не бывает LLM-чатов без агентов? 
ЕМ>>У каждого веб-чата их полно - для поиска в интернете, для разбора файлов, загруженных в чат, для исполнения программ на основных языках и т.п.
S>"Полно" - это примерно полтора десятка "встроенных возможностей". И в них не входит никакого "исполнения программ на основных языках".

ЕМ>>А если под "агентом вообще" Вы имеете в виду непременно [i]локального[/i] агента, то сперва обоснуйте, чем локальный агент будет отличаться от удаленного, имеющего доступ к тем же инструментам и тому же набору данных.
S>Под агентом я имею в виду возможность взаимодействия с внешним инструментом, который не входит в коробочную поставку чата.

ЕМ>>А удаленный агент чат-бота будет иметь доступ до того, что ему предоставил (загрузил в чат) [i]я[/i].
S>Ну попробуйте предоставить в чат компилятор msvc.exe и исходник программы, пусть скомпилирует и запустит.

ЕМ>>А что [i]технически[/i] мешает дать [i]любому[/i] агенту доступ куда угодно через сеть: Вашему локальному - к моей системе, нужным локальным агентам веб-чат-бота - к любой системе, где есть паскаль?
S>И как мой локальный агент попадёт на вашу систему, если у него нет "сообщника" на вашей стороне? То, что вы предлагаете, собственно и есть агентный режим - на вашей системе ставится инструмент, который становится доступен нейросети. Это ровно то, от чего вы хотите уйти, и получить пользу от "простого чата", не имея агента.

ЕМ>>Мне не нужно напрягаться - я это прекрасно осознаю. А вот Вы почему-то упорно не желаете осознать, что система "сервер LLM - сервер веб-чата - набор локальных агентов веб-чата" "топологически" эквивалентна системе "сервер LLM - Ваш локальный агент - Ваш набор локальных инструментов", как кружка топологически эквивалентна тору.
S>Я всё прекрасно осознаю. А вы не хотите понять, что [i]реализация[/i] такой схемы в виде однострочного окошка "отправь команду чату" экономически нецелесообразно.
S>Примерно у всех производителей сейчас есть возможность за отдельные деньги купить себе облачный workspace, сконфигурировать его под [i]свои[/i] нужды, и подключить к нему LLМ при помощи локального агента. 
S>Но это и есть тот самый агентский режим, без которого "чистая болталка" бесполезна, и всегда будет бесполезна. И он, естественно, не будет частью бесплатного или околобесплатного предложения "чистого чата".
S>Вы будете платить за это решение стоимость, сопоставимую с обычной арендой сервера в облаке и запуском на нём claude.exe точно так же, как делали бы локально.

ЕМ>>Вот после такого не говорите, пожалуйста, что "понимаете, как оно работает". Ибо, коли оно в состоянии перевести идею/алгоритм в процедурный программный код, то бинарник может быть получен из этого кода [i]простыми табличными подстановками[/i], которые оно тоже умеет делать. Для программы на ассемблере эти подстановки тривиальны, для программ на ЯВУ более сложны, но лишь количественно, а не качественно.
S>Нда. А вы точно программист? Давайте отвлечёмся от чатов и ЛЛМ. 
S>Покажите мне компилятор какого-нибудь промышленного языка, построенный на "простых табличных подстановках". Зачем-то идиоты тратят десятилетия на разработку лексеров, парсеров, семантических анализаторов, оптимизаторов, кодогенераторов, линкеров. А надо было всего-то сделать серию простых табличных подстановок, и не выделываться с этими миллионами строк кода.

ЕМ>>А это зависит от мощности модели. Никаких принципиальных ограничений не вижу.
S>Значит, такая оптика. Вы поймите, что получить в тексте чата смешение русского с английским или там кусочек иврита - норм, мелочь, "по сути-то он правильно пишет". И это делают самые мощные из имеющихся моделей. И будут делать примерно всегда - по вполне себе математическим причинам: устроены они так. Все упражнения по увеличению количества параметров и удлиннению контекстных окон просто отдаляют тот момент, когда чат начнёт галлюцинировать.
S>И если для текста обычной беседы это вполне приемлемо; тем более мы всегда можем просто закрыть деградировавшую сессию и начать новую, то для исполняемого кода такой косяк будет фатален.
S>И самое классное - что вы его даже не обнаружите. Где-то среди полусотни мегабайт исполняемого кода будет редкая ветка, где вместо инструкций x86 написан булшит. 
S>Никак вы не предотвратите такое поведение - это имманентное свойство нейросетей.

ЕМ>>Угу, а [i]всё[/i], что делается алгоритмически, может быть получено и вероятностными/статистическими методами, при соответствующем подборе коэффициентов. Позиксовая программа в эту схему включается лишь для того, чтобы упростить обработку и стабилизировать ее. Если не жалко ресурсов (потребность в которых растет экспоненциально), то всю обработку можно передать модели.
S>Именно что экспоненциально. С точки зрения математиков "невычислимая задача" и "NP-полная задача" принципиально отличаются: вторая-то разрешима! 
S>А с точки зрения инженера (или, скажем, продакт-менеджера) NP-полнота является синонимом неразрешимости, и как раз по причине экспоненциальности.

ЕМ>>Я и отзывы читал, и собственный опыт имею. Но покажите мне, где я утверждал, что LLM якобы "все делает точно"? :) Вы этого не найдете. А вот то, что точность и надежность ее работы можно повышать бесконечно, для меня очевидно - как очевидно и то, что [i]сейчас[/i] это чересчур затратно, поэтому пока "пишем на простой".
S>:) Бесконечны только две вещи - человеческая глупость и вселенная. Причём насчёт вселенной это не точно.

ЕМ>>Они и на уровне агентов [i]сейчас[/i] не заменят тех, кто [i]знает больше них[/i]. 
S>Не очень понятно, что именно вы имеете в виду в этом количественном сравнении. Что значит "знать больше них"?

S>Пока еще хватает областей знания, не включенных в обучающие выборки - как в этих сферах могли бы помочь агенты?
S>Давайте какой-нибудь пример.

ЕМ>>Почему только в десять, а не в тысячу? Почему не на квантовом компьютере?
S>:) А, в нейронках оказалось недостаточно магии, давайте добавим слово "квантовый" - тогда уж точно магии хватит :)))

ЕМ>>Коли с повышением мощности модели и объема контекста растет объем правильно генерируемого кода - тут бы и сделать вывод, что проблема чисто количественная, а не качественная.
S>:)

ЕМ>>Тут прямая аналогия с RSA-шифрованием: те, кто "слышал звон", смело утверждают "расшифровать невозможно", а те, кто [i]понимает[/i], говорят "невозможно за разумное время доступными техническими средствами".
S>Не совсем так. Те, кто "слышал звон", говорят "расшифровать сложно", а те, кто [i]понимает[/i], говорят "невозможно". Потому что за этим "невозможно" подразумевается "когда доступные технические средства доберутся до практической расшифровки существующих ключей, мы просто чуть-чуть увеличим длину ключа". Так и здесь - выручка от решенной проблемы будет расти медленнее, чем затраты на решение "грубой силой".

S>А главное, непонятно - зачем вообще этим заниматься? Агентный режим позволяет нам "логарифмировать" размер задачи, и получить ту самую линейную функцию затрат от объёма задачи, заведомо выигрывая у всех, кто пытается взлететь экспоненциальное решение.

ЕМ>>А питон, стало быть, един и неделим? Если скрипт, правильно работающий в системе веб-чата, неправильно работает у меня, то кто виноват - чат, я или питон?
S>Так он его не для вас и делает. Он его делает для внутреннего потребления, это одноразовый скрипт, который будет выброшен сразу после использования. Для него не стоят вопросы стилистической красоты, кросс-платформенности и чего бы то ни было. Зато и ограничения у него. Во второй же сессии использования чатГПТ я нарвался на то, что он не смог мне сделать нужную презентацию в повер-поинт. Несмотря на заявленный скилл "работа с .PPTX".
S>"Простите, но питоновая библиотека, которая у меня есть, не умеет работать с такими фигурами. Я могу вам рассказать, куда нажимать в приложении для достижения нужного эффекта".
S>Диаграмму он не может туда вставить! И библиотеку поновее взять тоже не может. А вы рассуждаете о "всех популярных языках программирования"....

ЕМ>>Если же Вы имели в виду "нецелесообразно", "невыгодно" или что-то подобное, то будьте, пожалуйста, внимательнее к речи.
S>Я вам уже неоднократно писал, что речь об экономических ограничениях, продиктованных техническими причинами.

ЕМ>>Нужно-то оно нужно, но сколько ж Вы видели [b]точных[/b]? :) "Точное решение" - это программа, которая, работая бесконечно долго в любых возможных условиях, допустимых ее спецификацией, не совершит ни одной ошибки, если их не совершит ее окружение (аппаратура, ОС, программы-компаньоны и т.п.). 
S>Ну, если хотите - можно и такой уровень качества потребовать. Но для начала можно ограничиться тем, что программа должна быть семантически корректна в терминах выбранного языка. Например, набора команд ARM, или JVM bytecode, или языка C#. Вряд ли вам для чего-то понадобится текст, который отдалённо похож на программу на С++, но ею не является.

ЕМ>>Вот тут бы и догадаться, что [i]технически[/i] нейронке ничто не мешает создавать себе агентов [i]самостоятельно[/i]. Но это чревато непредсказуемым развитием ее способностей. Возможно, их искусственно ограничивают прежде всего по этой причине.
S>Не абстрактных "способностей", а конкретных разрушительных последствий. Даже с ограниченным набором инструментов нейронки уже роняют прод и стирают коммерческие данные. 
S>А если ей дать ещё и возможность сочинять себе инструменты на ходу, то катастрофа себя ждать не заставит. Это опять экономические соображения, продиктованные техническими причинами.

ЕМ>>Если скрипт из десятка строчек удовлетворяет понятию "правильный скрипт", то в чем Вы видите противоречие?
S>В том, что не все задачи сводятся к скрипту из десятка строчек :xz:
ЕМ>>А я где-то утверждал, что он [i]всегда[/i] способен непосредственно породить скрипт любого размера и любой сложности?
S>Именно вы предлагали режим работы, в котором LLM сразу фонтанирует потоком токенов без помощи "нестохастических" инструментов. Если вы имели в виду "мы будем ограничиваться только задачами, решением которых является десятистрочная программа на python 3.14 с вот таким списком импортов", то надо было так и написать - я бы даже не начинал с вами спорить.

ЕМ>>Здрасьте. Это ж чисто формальная структура, подчиняющаяся известным формальным правилам. Если LLM не будет экономить ресурсы сервера, что может ей помешать сколь угодно долго соотносить порожденную структуру с набором правил?
S>Стохастическая природа нейросетей. Она никогда не сможет получить "точный" результат соотнесения с "набором правил". Вы пытаетесь аппроксимировать дискретную структуру гладкой функцией.
S>Про явление Гиббса слышали?

ЕМ>>Средства синтаксического/статистического анализа, компиляторы, линкеры, отладчики, системы виртуальных машин, аппаратные интерфейсы и вообще все, что может потребоваться для работы.
S>Все существующие в природе и одновременно? Боюсь, даже $200000 будет мало.

Теги:

Введите теги разделенные пробелами. Обрамляйте в кавычки словосочетания с пробелами внутри, например: "Visual Studio" .NET

Имя, пароль: Загрузить Нравится наш сайт? Помогите его развитию!
Отключить смайлики Получать ответы по e-mail