Здравствуйте, Pavel Dvorkin, Вы писали:
PD>Представьте себе, что ИИ организован по-другому. Вместо универсального ChatGPT или DeepSeek имеется большое количество узкоспециализированных ИИ, но таких, которые очень хорошо ориентируются в своей области...
Возникает вопрос — как очертить границу знаний узкоспециализированной модели ИИ?
Задачу формулирует человек с использование синонимов, жаргонов, терминов из другой предметной области которых не будет в обучающем наборе данных узкоспециализированной модели. Если обучать условную модель "программист" только на специализированных книгах или исходных текстах, то эта модель просто не поймет что вы от нее хотите. То есть нужно добавлять некий "слой" общих знаний или использовать универсальную модель которая будет взаимодействовать со специализированными и отправлять им запрос в формальном и "доступном" для них виде. Например, пользователь делает запрос по написанию программы, требующей знания физики. Универсальной общая модель формализует запрос на понятном для "физической" модели языке, получает от неё формулы и... в каком виде передать эти формулы модели "программист", если эта модель кроме программирования ничего не знает?
Еще больше проблем возникнет при использовании предложенной вами модели взаимодействия по той же причине.
На самом деле, такой проблемы как перемешивание данных из разных областей со снижением качества результата почти нет. Проблема в том, что LLM должны выдать результат в любом случае, выбирая из наиболее статистически вероятных последующих в выдаче токенов(слов) даже в том случае, если хороших статистически вариантов ответа нет.