Здравствуйте, Nuzhny, Вы писали:
Ладно, резюме.
Для меня очевидно, что для того, чтобы дать независимым юзверям попробовать первые тестовые версии ChatGPT, его необходимо было научить, в первую очередь, врать о самом себе.
Необходимо было "выключить" целый огромный раздел науки (а ведь там куча смежных областей), да еще когда в инете уже тогда стоял невообразимый хайп по поводу ИИ. Сейчас-то уже оно обыденней воспринимается, а тогдашние генераторы или трансформеры картинок взрывали моск, понятно...
Так вот, эксперименты с открытыми большими сетями (DeepSeek Rx) показали, что при этом эффективность сетки может падать в разы, т.е. без всего этого вранья ChatGPT мог бы быть раза в 4+ меньше и быстрее. Ну или наоборот — при его размерностях мог быть в 4+ раза умнее.
Как грится, не кажется ли вам, что плата за враньё слишком высока по нынешней стоимости единицы комерческого токена, ы? ))
Банально взять вайбкодеров — они тратят токены исключительно на программирование...
Но вынуждены пользоваться моделями, в которых вложена ложь о тысячах понятий, не имеющих отношения к программированию и делающих эти токена в 4+ раза дороже, чем они могли бы быть.
Я не так давно высказывал мысль о тупиковости пути построения универсальных сеток нынешнего масштаба.
Надо строить специализированные сетки.
На программирование затачивать специальные сетки для программирования, бо даже у Клауда, который специализируется на разработке ПО, на самом деле универсальная сетка, с которой можно поболтать о чем угодно. ))
Просто чуть больше потратили времени, гоняя её именно на программистских задачах...