Здравствуйте, _ilya_, Вы писали:
__>Вполне запустится Qwen3-Coder-30B-A3B-Instruct-Q8_0 даже с минимальной видюхой 1070.
Отличный совет из разряда вредных советов. Начать с того, что предложенная модель в базе требует 32Гб. Не считая КВ-кеша. И для минимально вменяемого инференса (одним глазком лизнуть) предложенного конфига явно не хватит.
Даже вариант с 48Гб суммарной памяти будет работать с тормозами из-за постоянной переброски контекста между видяхой и памятью. А уж если там не просто чатиться, а пытаться разрабатывать, то прийдется увеличить размер контекста и оно вообще станет тормозное.
Если нет нормального бюджета, то я бы на текущий момент взял подписку одного из топов и игрался с ней. У того же Alibaba/Qwen light подписка стоит $10/мес, а лимиты там выше чем у Клавдии. Да, он тупее последней, но для многих задач вполне себе на уровне.