Будущее нейросетей - индивидуально обученные нейросети
От: Shmj Ниоткуда  
Дата: 13.01.24 00:27
Оценка: +1
Сейчас в основном обучают нейросети для масс, а не для конкретно каждого случая. И в основном юзают шаред мощности, не так много народа запускают их на своем железе. Даже корп. пользователи могут покупать подписки на OpenAI или там Copilot, а не запускать у себя на своих серверах.

Есть магазины моделей, но принцип тот же — одна модель для многих пользователей.

Предвижу в ближайшем будущем потребность чуть ли не на каждый проект иметь индивидуально обученную сеть для него. Вот как сейчас имеем Wiki для проекта — так и нейросетка будет для каждого проекта. И это потребует доп. вычислительных мощностей для каждой конторы.

Нейросетка будет знать все особенности конкретно вашего проекта, сможет глубоко проанализировать всю кодовую базу и все с этим связанное — возможно на анализ и формирование модели уйдет несколько дней. Зато потом сможет по требованиям вносить изменения в код.

Будет похоже на принятие нового члена в команду — ему потребуется время на то, чтобы "въехать в проект". Ну и по затратам будет эквивалентно содержанию одного работника.

Кто что скажет?
Отредактировано 13.01.2024 0:28 Shmj . Предыдущая версия .
Re: Будущее нейросетей - индивидуально обученные нейросети
От: opfor  
Дата: 13.01.24 01:14
Оценка:
Здравствуйте, Shmj, Вы писали:

S>Кто что скажет?


уже делают, например используя transfer learning. Когда к выходу генерализованной сети, ранее обученной гигантами вроде Гугла, добавляют слои, которые обучаешь уже ты сам под свою задачу. Выходит дешевле и быстрее.
Re: Будущее нейросетей - индивидуально обученные нейросети
От: Vzhyk2  
Дата: 13.01.24 07:00
Оценка:
Здравствуйте, Shmj, Вы писали:

S>Кто что скажет?

Что уже лет 15-20 как нейросетки достаточно развились их не только лишь все дообучают на свои кастомные датасеты.
И да, если кастомный датасет большой или сетка большая, то нужно или покупать или арендовать мощное железо для оного.
Re[2]: Будущее нейросетей - индивидуально обученные нейросети
От: Shmj Ниоткуда  
Дата: 13.01.24 07:40
Оценка:
Здравствуйте, Vzhyk2, Вы писали:

V>Что уже лет 15-20 как нейросетки достаточно развились их не только лишь все дообучают на свои кастомные датасеты.

V>И да, если кастомный датасет большой или сетка большая, то нужно или покупать или арендовать мощное железо для оного.

Но только на проекты, которые непосредственно связаны с анализом данных.

Я о том, что нейросетка будет типа сотрудника — разработчика ПО, дизайнера и т.д. Вот есть у вас кодовая база некая — на ней обучат нейросеть и она будет типа робо-сотрудника.
Re: Будущее нейросетей - индивидуально обученные нейросети
От: Nuzhny Россия https://github.com/Nuzhny007
Дата: 13.01.24 08:57
Оценка: +2
Здравствуйте, Shmj, Вы писали:

S>Предвижу в ближайшем будущем потребность чуть ли не на каждый проект иметь индивидуально обученную сеть для него. Вот как сейчас имеем Wiki для проекта — так и нейросетка будет для каждого проекта. И это потребует доп. вычислительных мощностей для каждой конторы.


Мне кажется, что такая нейронка — это плохая нейронка. Не надо обучаться на конкретном проекте, его надо уметь понимать без переобучения сети примерно также, как general сети сейчас могу суммаризировать статьи. То есть код проекта должен помещаться в память нейросети и не более того.
Re[2]: Будущее нейросетей - индивидуально обученные нейросети
От: Shmj Ниоткуда  
Дата: 13.01.24 09:10
Оценка:
Здравствуйте, Nuzhny, Вы писали:

N>Мне кажется, что такая нейронка — это плохая нейронка. Не надо обучаться на конкретном проекте, его надо уметь понимать без переобучения сети примерно также, как general сети сейчас могу суммаризировать статьи. То есть код проекта должен помещаться в память нейросети и не более того.


Но часто для проекта — требуется глубокое погружение. Даже человеку нужно несколько месяцев чтобы въехать.

Оно то хорошо универсального всезнайку — но так не работает. И код проекта — это обычно гигабайты, ну сотни мегабайт — не поместится все в памяти.
Re: Будущее нейросетей - индивидуально обученные нейросети
От: gandjustas Россия http://blog.gandjustas.ru/
Дата: 13.01.24 09:11
Оценка: 1 (1)
Здравствуйте, Shmj, Вы писали:

S>Предвижу в ближайшем будущем потребность чуть ли не на каждый проект иметь индивидуально обученную сеть для него. Вот как сейчас имеем Wiki для проекта — так и нейросетка будет для каждого проекта. И это потребует доп. вычислительных мощностей для каждой конторы.

Уже есть. Мелкософт предлагает AI помощников для интернет-магазионв, дообученных на данных самого магазина. Там правда есть косяки с этим, думаю систему ее долго будут дорабаотывать.

Естественно внутрикорпоративное использование таки дообученных на локаьных данных моделях тоже предполагается. Скормишь ей базу знаний организации, она будет не только имитацией полнотекстового поиска, но и сможет объединять знания из разных статей.


S>Будет похоже на принятие нового члена в команду — ему потребуется время на то, чтобы "въехать в проект". Ну и по затратам будет эквивалентно содержанию одного работника.

А вот это сомнительно. Вики с полнотекстовым поиском не то, чтобы сильно помогает на практике. И вообще "знания" != "информация", точной формулы перевода второго в первое пока нет и не факт что АИ исправит ситуацию, особенно с его способностями выдумывать то, чего нет. Это выдумывание заложено в архитектуру трансформеров и победить "правилами" не получится.
Re: Будущее нейросетей - индивидуально обученные нейросети
От: Evgeny.Panasyuk Россия  
Дата: 13.01.24 09:39
Оценка:
Здравствуйте, Shmj, Вы писали:

S>Предвижу в ближайшем будущем потребность чуть ли не на каждый проект иметь индивидуально обученную сеть для него. Вот как сейчас имеем Wiki для проекта — так и нейросетка будет для каждого проекта. И это потребует доп. вычислительных мощностей для каждой конторы.


Это не будущие, а прошлое и настоящие. И нужно это только из-за технических ограничений.
С увеличением размера контекста, силы интеллекта, и с улучшением технологий свопинга в и из ramконтекста (vector db и прочее), необходимость в нейронках заточенных под проект (в плане перестройки весов) — отпадёт, а вся заточка будет происходит инструкциями непосредственно в контекстном окне, в котором будет также находится весь код проекта (либо эквивалент в виде свопинга).
Re[3]: Будущее нейросетей - индивидуально обученные нейросети
От: Vzhyk2  
Дата: 13.01.24 09:58
Оценка:
Здравствуйте, Shmj, Вы писали:

S>Но только на проекты, которые непосредственно связаны с анализом данных.

S>Я о том, что нейросетка будет типа сотрудника — разработчика ПО, дизайнера и т.д. Вот есть у вас кодовая база некая — на ней обучат нейросеть и она будет типа робо-сотрудника.
Мда, чатгпт логичнее тебя высказывается. Ты же просто какой генератор случайных фраз.
Re[4]: Будущее нейросетей - индивидуально обученные нейросети
От: Shmj Ниоткуда  
Дата: 13.01.24 13:09
Оценка: :)
Здравствуйте, Vzhyk2, Вы писали:

V>Мда, чатгпт логичнее тебя высказывается. Ты же просто какой генератор случайных фраз.


Но я умею страдать — меня можно обидеть. А GPT, не смотря на все красивости в речи и эрудированность — не умеет наслаждаться и страдать.
Re: Будущее нейросетей - индивидуально обученные нейросети
От: vsb Казахстан  
Дата: 13.01.24 13:36
Оценка:
Ну в Chat GPT есть некий пролог, который ты можешь настраивать перед началом диалога. Т.н. промпт. Который и настраивает нейросеть под конкретный диалог. Для этого ничего обучать не надо. Я бы предположил, что скорей в эту сторону будет развитие, т.к. специалистов по нейросетям практически не существует, а промпт писать может кто угодно.
Re[2]: Будущее нейросетей - индивидуально обученные нейросети
От: Shmj Ниоткуда  
Дата: 13.01.24 13:56
Оценка:
Здравствуйте, vsb, Вы писали:

vsb>Ну в Chat GPT есть некий пролог, который ты можешь настраивать перед началом диалога. Т.н. промпт. Который и настраивает нейросеть под конкретный диалог. Для этого ничего обучать не надо. Я бы предположил, что скорей в эту сторону будет развитие, т.к. специалистов по нейросетям практически не существует, а промпт писать может кто угодно.


Но модели то продают — не столько сложна наука обучать и готовить модели.
Re[3]: Будущее нейросетей - индивидуально обученные нейросети
От: Nuzhny Россия https://github.com/Nuzhny007
Дата: 13.01.24 20:46
Оценка:
Здравствуйте, Shmj, Вы писали:

S>Но часто для проекта — требуется глубокое погружение. Даже человеку нужно несколько месяцев чтобы въехать.


Пока не вижу проблем и противоречий.

S>Оно то хорошо универсального всезнайку — но так не работает. И код проекта — это обычно гигабайты, ну сотни мегабайт — не поместится все в памяти.


Пока тоже не вижу проблем. Но я и не вижу задач. Вполне можно представить проект иерархично и подгружать в контекст конкретную часть, держа в нём же общую иерархию. Это называется абстракцией. Примерно так ЧатГПТ пишет диплом, который не помещается в контекст сейчас: сначала тема, потом содержание, потом, опускаясь по иерархии вниз, разворачиваем части, главы, параграфы.
Re[4]: Будущее нейросетей - индивидуально обученные нейросети
От: Shmj Ниоткуда  
Дата: 13.01.24 21:20
Оценка:
Здравствуйте, Nuzhny, Вы писали:

S>>Оно то хорошо универсального всезнайку — но так не работает. И код проекта — это обычно гигабайты, ну сотни мегабайт — не поместится все в памяти.


N>Пока тоже не вижу проблем. Но я и не вижу задач. Вполне можно представить проект иерархично и подгружать в контекст конкретную часть, держа в нём же общую иерархию. Это называется абстракцией. Примерно так ЧатГПТ пишет диплом, который не помещается в контекст сейчас: сначала тема, потом содержание, потом, опускаясь по иерархии вниз, разворачиваем части, главы, параграфы.


Но в таком случае контекст в голове человека — он лишь по мелочи может использовать нейросеть. А хотелось бы чтобы контекст и полное видение проекта было в нейросети — чтобы она могла сама дописывать новые модули в проекте по словесному описанию.
Re: Будущее нейросетей - индивидуально обученные нейросети
От: pva  
Дата: 13.01.24 21:49
Оценка:
Здравствуйте, Shmj, Вы писали:

S>Кто что скажет?

Скажу, что специализированная midjourney уже выдает потрясающие результаты. Вероятно, с развитием НС предстоит большая конкуренция кормовой базы (пользователей) за место под солнцем. Немного пугает.
newbie
Re[5]: Будущее нейросетей - индивидуально обученные нейросети
От: Evgeny.Panasyuk Россия  
Дата: 14.01.24 00:58
Оценка:
Здравствуйте, Shmj, Вы писали:

S>А хотелось бы чтобы контекст и полное видение проекта было в нейросети


Ну представь что размер контекста стал таким, что в него помещается весь проект.
В таком случае перенастройка весов не нужна. Достаточно загрузить проект в контекст
Re[6]: Будущее нейросетей - индивидуально обученные нейросети
От: Shmj Ниоткуда  
Дата: 14.01.24 02:56
Оценка:
Здравствуйте, Evgeny.Panasyuk, Вы писали:

EP>Ну представь что размер контекста стал таким, что в него помещается весь проект.

EP>В таком случае перенастройка весов не нужна. Достаточно загрузить проект в контекст

Пока еще до этого далеко. Весь проект с исходниками, документацией, особенностями сферы — это гигабайты активных связанных данных.
Re[5]: Будущее нейросетей - индивидуально обученные нейросети
От: Nuzhny Россия https://github.com/Nuzhny007
Дата: 15.01.24 06:12
Оценка:
Здравствуйте, Shmj, Вы писали:

S>Но в таком случае контекст в голове человека — он лишь по мелочи может использовать нейросеть. А хотелось бы чтобы контекст и полное видение проекта было в нейросети — чтобы она могла сама дописывать новые модули в проекте по словесному описанию.


Не надо контекст в голове человека. ЯП — это формальная штука, которую вполне однозначно парсят компиляторы. Соответственно, они тебе сами, без всяких нейросетей могут сгенерировать все необходимые абстракции на уровне интерфейсов. Загрузить его не будет проблемой.
Re[6]: Будущее нейросетей - индивидуально обученные нейросети
От: Shmj Ниоткуда  
Дата: 15.01.24 07:27
Оценка:
Здравствуйте, Nuzhny, Вы писали:

N>Не надо контекст в голове человека. ЯП — это формальная штука, которую вполне однозначно парсят компиляторы. Соответственно, они тебе сами, без всяких нейросетей могут сгенерировать все необходимые абстракции на уровне интерфейсов. Загрузить его не будет проблемой.


Текущая парадигма позволяет обработать 1 экран кода, а нужно — сотни мегабайт кода.
Re[7]: Будущее нейросетей - индивидуально обученные нейросети
От: Nuzhny Россия https://github.com/Nuzhny007
Дата: 15.01.24 08:09
Оценка:
Здравствуйте, Shmj, Вы писали:

S>Текущая парадигма позволяет обработать 1 экран кода, а нужно — сотни мегабайт кода.


Экран кода — это мало, объём контекста у него намного больше. Ты что-то путаешь.

GPT-4 имеет максимальный размер токенов 32 768 — это 215, если вам интересно, почему число выглядит знакомым. Это примерно соответствует 64 000 словам или 50 страницам текста — достаточно для целой пьесы или рассказа.

Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.