Здравствуйте, CoolSul, Вы писали:
CS>Это он так намекает на переход на платную версию?
Ну, если посмотреть на:
— текущие уже вбуханные в отрасль миллиарды (если не триллионы)
— заявления о том, что нужны еще миллиарды
— повышение стоимости требуемой инфраструктуры (память, процессоры, ... — а также электричество и стоимость возведения дата-центров) и явная её нехватка (т.е. в ближайшее время рост стоимости только продолжится)
— убыточность (точнее отсутствие прибыли — они живут за счет вбуханных инвестиций) основных игроков
— завышенные ожидания (в части экономии средств или заметном увеличении производительности), на фоне весьма посредственных реальных результатов. Как минимум часть заявлений о массовых увольнениях в следствии "внедрения ИИ", на поверку оказались "не вполне точными" (компании просто увольняли дорогих сотрудников, нанимая более дешевых или просто оказывали давление на персонал, с целью уменьшения ЗП, ...)
— то, что предыдущие "технологические активы, которые вот-вот и принесут миллиарды" (зеленая энергетика, электромобили, крипта, ... — что там еще было за эти годы?) уже не выглядят такими привлекательными, и все надежды на "светлое будущее ИИ"
— нарастающий поток скепсиса от бизнеса, даже, казалось бы высокотехнологичного о том, что ИИ сможет окупить свои безумные траты и стать реальной точкой роста (вот буквально сегодня приводят слова CEO IBM, о том что просто не существует варианта при которым текущие траты могли бы себя оправдать)
В общем, вера "в светлое, а главное прибыльное ИИ-будущее" начинает улетучиваться, а значит у чуваков не остается вариантов кроме как фиксировать прибыль, пока еще есть те, кто готов платить, хоть за что-то...
Здравствуйте, Михаил Романов, Вы писали:
МР>В общем, вера "в светлое, а главное прибыльное ИИ-будущее" начинает улетучиваться, а значит у чуваков не остается вариантов кроме как фиксировать прибыль, пока еще есть те, кто готов платить, хоть за что-то...
Это в общем, но тут речь про Antropic. А у него положение сильно иное, чем у того же OpenAI:
1. Его основная клиентская база — разработчики, а не просто пользователи. Там есть деньги и идёт стабильный денежный поток из индустрии.
2. Он использует не только видеокарты от Nvidia, но и TPU от Amazon и Google, что дешевле.
3. Он значительно раньше, чем OpenAI выходит на прибыльность и планирует на IPO.
То есть меньше пользователей, меньше трат, сосредоточен на платёжеспособной аудитории, более узко специализирован, тратит меньше на оборудование. Я бы сравнил их с Apple: клиенты будут платить, будут получать вылизанный инструмент, будут при этом ещё и лояльны.
Здравствуйте, Михаил Романов, Вы писали:
МР>Здравствуйте, CoolSul, Вы писали:
CS>>Это он так намекает на переход на платную версию? МР>Ну, если посмотреть на:
А у нас ещё в новостях писали, что сильно увеличилась потребность в электричестве из-за ИИ — стартапов. Боимся, что зима настанет, и электростанции будут не справляться.
Здравствуйте, VladD2, Вы писали:
VD>А куда ж они денутся то потом? VD>Чё думаешь все программисты забьют на ИИ и пойдут писать снова болейрплэйт-код руками?
Думаю, будут искать способы уменьшить затраты, например:
— более легкие модели
— развертывание on-premise (хотя не уверен, что здесь будет выигрыш у всех)
— ужесточение контроля за расходами на облачные ИИ сервисы
Т.е. вопрос не в том, что они обязательно накроются, а в том, что период "первой бесплатной дозы" заканчивается, и сейчас будут поднимать ценники, просто потому, что ИИ штука дорогая, а возвращать инвестиции надо
Здравствуйте, Nuzhny, Вы писали:
N>То есть меньше пользователей, меньше трат, сосредоточен на платёжеспособной аудитории, более узко специализирован, тратит меньше на оборудование. Я бы сравнил их с Apple: клиенты будут платить, будут получать вылизанный инструмент, будут при этом ещё и лояльны.
Возможно, тем не менее, мой комментарий про "период первой дозы заканчивается" я считаю применимым и тут. А значит рост тарифов (и "выжимание" пользователей с бесплатных) просто неизбежен.
Здравствуйте, Doom100500, Вы писали:
D>А у нас ещё в новостях писали, что сильно увеличилась потребность в электричестве из-за ИИ — стартапов. Боимся, что зима настанет, и электростанции будут не справляться. D>Кто платить за всё это должен?
Совершенно справедливо. Я даже видел мысль, что тормозом будет не аппаратная часть (чипы, память, ...), а нехватка электроэнергии (ну или её стремительный рост стоимости).
Здравствуйте, Михаил Романов, Вы писали:
МР>Возможно, тем не менее, мой комментарий про "период первой дозы заканчивается" я считаю применимым и тут. А значит рост тарифов (и "выжимание" пользователей с бесплатных) просто неизбежен.
Рост тарифов ещё надо доказать. Тут надо смотреть не абсолютную величину, а число токенов за 1$
Про выжимание с бесплатных тарифов не сильно верится, это уже проходили с бесплатной почтой и поисковиками — реклама окупает.
Здравствуйте, Михаил Романов, Вы писали:
МР>Думаю, будут искать способы уменьшить затраты, например: МР>- более легкие модели
Они тупые. Очевидно, что размер имеет значение. Умная модель не может быть меньше 200b. Это как отрезать части мозга у человека и надеяться на то, что он останется дееспособным инженером.
МР>- развертывание on-premise (хотя не уверен, что здесь будет выигрыш у всех) МР>- ужесточение контроля за расходами на облачные ИИ сервисы
Ты представляешь себе деньги требуемые для покупки железа необходимого для хостигна не полноценной ЛЛМ-ки? Там даже затраты на электричество будут весомыми. А уж железо и подавно. Аренда железа в России катастрофически дорога.
ИИ как сервис плох только тем, что страдает конфиденциальность. В остальном это куда дешевле чем хостить ЛЛМ самим.
Программистов в компании не так много обычно. Именно им нужны мощные и продвинутые модели. Остальные могу тупо бесплатными веб-версиями пользоваться.
Тот же ДипСик работает в последнее время весьма стабильно и покрывает потребности 90% людей не связанных с разработкой софта.
Я думаю, что ИИ как сервис будет еще очень долго лучшим, с точки зрения затрат решением.
МР>Т.е. вопрос не в том, что они обязательно накроются, а в том, что период "первой бесплатной дозы" заканчивается, и сейчас будут поднимать ценники, просто потому, что ИИ штука дорогая, а возвращать инвестиции надо
Ну это логично. Но ценник будет определяться рынком. Учитывая крутость опенсорсных моделей любой дурак сможет купить железо и захостить ИИ-шку.
Так что цены на ИИ как сервис должны устаканиться на приемлемом для людей уровне.
Еще есть надежда на прогресс в железе и самих ИИ. Возможно нужно смотреть в сторону специализированных ИИ. Я уже многократно говорил, что мне не нужно чтобы ИИ пишущая код умела лечить кандидоз и вообще знала, что это такое.
С железом же все куда лучше. Оно явно будет развиваться. Думаю, что в пределах лет 5 китайские фирмы додумаются, что нужно делать карты класса 4090/5090 с 256 Гб оперативки. С 48 Гб уже есть на рынке и стоят порядка 370 тыр, что много, но не запредельно. Ну а появление терабайтных карт позволит спустить ИИ на персоональный компьютер. Но это точно не в ближайшие годы. Сейчас большие компании скупают дорогущие карты и делают супер-кластеры. Гражданское железо с ними сравниться не может. Нужно лет 5-10.
Есть логика намерений и логика обстоятельств, последняя всегда сильнее.
Здравствуйте, CoolSul, Вы писали:
CS>Пользуюсь бесплатной версией, всегда хватало.
CS>В последнее время после несложного запроса пишет просто: CS>Taking longer than usual. Trying again shortly (attempt 9 of 10) CS>и не выполняет запрос.
CS>Это он так намекает на переход на платную версию?
У меня сейчас суперплатный (Max) испортился. Пишет ошибку 500 на любой запрос. Походу claoudflare отказал в работе и всё что с ним связано накрылось, включая Клода.
Даже даундетектор и тот накрылся. Пожаловаться и то не получается..
Здравствуйте, VladD2, Вы писали:
VD>Тот же ДипСик работает в последнее время весьма стабильно и покрывает потребности 90% людей не связанных с разработкой софта.
Он и с разработкой софта справляется довольно сносно. Может не самый лучший, но для РФ самый доступный. Правда всякие гигачаты от Сбера не пробовал.
VD>С железом же все куда лучше. Оно явно будет развиваться. Думаю, что в пределах лет 5 китайские фирмы додумаются, что нужно делать карты класса 4090/5090 с 256 Гб оперативки. С 48 Гб уже есть на рынке и стоят порядка 370 тыр, что много, но не запредельно. Ну а появление терабайтных карт позволит спустить ИИ на персоональный компьютер. Но это точно не в ближайшие годы. Сейчас большие компании скупают дорогущие карты и делают супер-кластеры. Гражданское железо с ними сравниться не может. Нужно лет 5-10.
Думаю терабайт VRAM в гражданском железе мы увидим примерно никогда Не через 5 лет точно. К этому совершено нет ни технологических ни коммерческих предпосылок. Даже предположу, что "чрезмерному" увеличению RAM в консьюмерском сегменте будут мешать, сейчас некоторые умельцы даже в РФ, умеют добавлять RAM на карту, например, делая из 4090 с 24 Гб, 4090 c 48 Гб. Так вот предполагаю, что Nvidia позаботится и со стороны железа и со стороны драйверов, чтобы нельзя было этого сделать. Как в свое время обломала переделки игровых карт в Quadro.
Кроме того, не удивлюсь, если лет через 10, а то и существенно раньше, все это зверски зарегулируют законодательно, собственно уже потихоньку началаи: в ЕС есть EU AI Act, который много чего требует с ростом сложности модели.