Qwen3.6 27B
От: GlebЗ Россия  
Дата: 23.04.26 10:30
Оценка: 72 (3)
Вышла 22 часа назад. Кто занимается локальными/корпоративными LLM.
Re: Qwen3.6 27B
От: Философ Ад http://vk.com/id10256428
Дата: 23.04.26 10:57
Оценка:
Здравствуйте, GlebЗ, Вы писали:

GЗ>Вышла 22 часа назад. Кто занимается локальными/корпоративными LLM.


Квен в любом случае тупой. Я периодически смотрю, нет ли прогресса, но увы
Вот из последнего:

Q:

Я нашёл ферритовое кольцо с начальной магнитной проницаемостью около 120 000 размерами 26х16х10 мм с индукцией насыщения около 12 000 Гс и маленькой коэрцитивной силой. Судя по графику, петля имеет высокую степень прямоугольности (0.85–0.95).
Я думаю на этом феррите делать магнитный ключ для тяжёлых мосфетов — 20 нФ на затворе с требуемым напряжением 10 В. Мой драйвер обеспечивает ток всего 2 А. Думаю делать дроссель с одним витком, а перед дросселем ставить керамический конденсатор на 10 нФ, с ESR примерно 20 мОм.
Какова будет зардержка, длинна фронта и какова амплитуда выброса, и что будет после выброса (как будет изменяться напряжение на затворе)?

A:


Анализ магнитного ключа на насыщающемся дросселе
....
2. Время задержки до насыщения
....
Оценка через заряд предварительной ёмкости:
Cₚ = 10 нФ заряжается током 2 А: dV/dt = I/C = 2 / 10нФ = 0,2 В/нс
Для достижения ~10 В: ~50 нс
Но высокая индуктивность 114 мкГн ограничивает скорость нарастания тока
....
3. Длительность фронта после насыщения
После насыщения индуктивность падает до ~30 нГн, и начинается разряд Cₚ в C₉ через Lₛₐₜ.


Смотри, беглое чтение, без глубокого анализа его измышлений, сразу же находит 2 косяка:

1) Он не может сообразить по описанию, где в цепи стоит дроссель — пытается заряжать 10 нФ через дроссель, хотя из описания явно видно (выделил жирным), что дроссель в этом процессе не участвует, т.к. конденсатор стоит до дросселя, перед ним.

2) Сразу после насыщения у него начинает течь тот в обратную сторону: индуктивность насыщения у него в обе стороны одинаковая, без знака.
Если ты посмотришь его ответ, то он знает что такое прямоугольная петля гистерезиса (он ранее написал про интервал от -B до +B — это просто недостаток "мышления".

Вот такие его косяки видно даже неспециалисту, просто при вдумчивом чтении его попыток Имитации Мышления.
===============================
Код он и пишет и анализирует примерно также, но на примере анализа цепей это просто легче показать — меньше текста надо.
===============================


Как бы то ни было, у него есть плюсы: он умеет рассматривать осциллограммы: кидаешь ему осциллограмму, и он запросто считает dI/dt на запршенном участке.
Всё сказанное выше — личное мнение, если не указано обратное.
Отредактировано 23.04.2026 11:02 Философ . Предыдущая версия .
Re[2]: Qwen3.6 27B
От: GlebЗ Россия  
Дата: 23.04.26 11:08
Оценка: +2
Здравствуйте, Философ, Вы писали:

Ф>Квен в любом случае тупой. Я периодически смотрю, нет ли прогресса, но увы

Вот тут должен защитить железяку перед вами, продвинутыми животными. У нее есть прогресс, но он нивелируется тем что нет прогресса у тебя...

Ты подходишь к модели как четыре года назад. Забудь. Те времена прошли. Уже полгода как хайпуется агентская логика, когда модель начинает просматривать интернеты ссылка за ссылкой, серфить текста и на этой основе строить ответ или ответы. Это уже не задача знаний, это задача умения человеческого языка,
Re[2]: Qwen3.6 27B
От: Nuzhny Россия https://github.com/Nuzhny007
Дата: 23.04.26 11:12
Оценка: +1 :)
Здравствуйте, Философ, Вы писали:

Ф>Код он и пишет и анализирует примерно также, но на примере анализа цепей это просто легче показать — меньше текста надо.


Я с маленькой локальной LLM Qwen3.5 9b вполне успешно решаю текущие проблемы с bash и cmake. Оно мне пишет одноразовые утилиты на Питоне. Да, не всё с первого раза, в плотном диалоге, но сильно быстрее, чем я бы сделал в одиночку. Но тут плюс, что я в принципе сам разбираюсь и в инструментах, и в предметной области.
Re[3]: Qwen3.6 27B
От: Vzhyk2  
Дата: 23.04.26 11:29
Оценка:
Здравствуйте, Nuzhny, Вы писали:

N>Да, не всё с первого раза, в плотном диалоге, но сильно быстрее, чем я бы сделал в одиночку.

А ты сравнивал со своей скоростью 5-10 лет назад?

У меня ускорение пока получалось только в части посмотреть что новенького по какой теме появилось. Самому с поисковиками рыскать получается долго.
С кодом обычно с дипсиком медленнее. Но если с ним повозиться, то в итоге рабочий и приличный код можно от него получить.
Re[3]: Qwen3.6 27B
От: Философ Ад http://vk.com/id10256428
Дата: 23.04.26 11:35
Оценка:
Здравствуйте, GlebЗ, Вы писали:

GЗ>Ты подходишь к модели как четыре года назад. Забудь. Те времена прошли. Уже полгода как хайпуется агентская логика, когда модель начинает просматривать интернеты ссылка за ссылкой, серфить текста и на этой основе строить ответ или ответы. Это уже не задача знаний, это задача умения человеческого языка,



Просто почитай нашу переписку.
Тут не надо сёрфить — до сёрфинга ещё далеко: оно задачу понять не может.

Снова не верно. Я даже не полностью читал твой ответ, т.к. в начале ответа приведена неверная цепь.
Правильная цепь выглядит так:
Драйвер->С1->Дроссель->Затвор(C2)


И это самые явные, самые очевидные косяки. Его решение ещё вычитывать нужно.
Ну например потому, что магнитный ключ имеет утечку: до момента насыщения C2 будет уже заряжен до какого-то значения — считать в лоб тут нельзя.

Чтобы сёрфить, нужно ещё понять, что надо что-то сёрфить — возможно, что там вообще сёрфить не надо. Дети это в третьем классе учатся делать: у них в задачах появляются лишние условия, которые не влияют на ответ, которые учитывать не надо.
Если ты полезешь сёрфить за тем, что считать не надо, ты просто потеряешь время. В случае квена так и будет: он даже задачу понять не может.
Всё сказанное выше — личное мнение, если не указано обратное.
Re[4]: Qwen3.6 27B
От: Nuzhny Россия https://github.com/Nuzhny007
Дата: 23.04.26 11:54
Оценка: +2
Здравствуйте, Философ, Вы писали:

Ф>Тут не надо сёрфить — до сёрфинга ещё далеко: оно задачу понять не может.


Сёрфить — это всего лишь один из инструментов. Ещё им дают интерпретатор Питона, чтобы оно не училось считать, а делегировала вычисления инструментам. Математики инспользуют lean для проверки гипотез. И т.д. Инструменты призваны снизить число галлюцинаций и повысить качество ответов.
То есть раньше были просто чаты с моделями. Потом чаты с рассуждающими моделями. Потом агенты с инструментами. Потом оркестрация таких агентов. Тебе надо продвигаться дальше по цепочке, что повышает точность и вероятность получения правильного ответа.
Re[5]: Qwen3.6 27B
От: Философ Ад http://vk.com/id10256428
Дата: 23.04.26 12:11
Оценка:
Здравствуйте, Nuzhny, Вы писали:

N>....Тебе надо продвигаться дальше по цепочке, что повышает точность и вероятность получения правильного ответа.


Наверное, если ты почитаешь нашу переписку, то поймёшь: неверный расчёт задержки и недоучёт заряда гейта приводит к работе мосфета в линейном режиме. Довольно дорогие мосфеты выгорают мгновенно: мощности измеряемые в киловаттах они долго не держат.
Это приводит к тому, что мне снова нужно ждать посылку из Китая — недельки 3 ждать, с негарантированным резульатом: китайцы подделывают мосфеты (маленький кристалл внутри, характерный для бросовых моделей).

Мне нужна вероятность 99.99%. Поэтому вычитываю и пересчитываю. Это поднимает вопрос о его нужности: доверять его ответам нельзя, можно поручать только самые простые задачи, а такие задачи и Алиса решает.
Всё сказанное выше — личное мнение, если не указано обратное.
Отредактировано 23.04.2026 12:12 Философ . Предыдущая версия .
Re[6]: Qwen3.6 27B
От: Nuzhny Россия https://github.com/Nuzhny007
Дата: 23.04.26 12:18
Оценка: +1
Здравствуйте, Философ, Вы писали:

Ф>Наверное, если ты почитаешь нашу переписку, то поймёшь


Наверное не пойму, потому что я не знаю, что такое мосфеты и все эти ваши гейты и ферриты.

Ф>Мне нужна вероятность 99.99%. Поэтому вычитываю и пересчитываю. Это поднимает вопрос о его нужности: доверять его ответам нельзя, можно поручать только самые простые задачи, а такие задачи а Алиса решает.


Поэтому индустрия и идёт дальше по цепочке, заменяя чаты на агентов с инструментами и агентов, которые перепроверяют других агентов. Как думаешь, с какой вероятностью получается верное доказательство у математиков, которые просто используют LLM? Если же LLM генерирует доказательство в lean, а там проверка проходит, то как изменяется вероятность того, что доказательство будет верным?
В том-то и дело, что для улучшения качества и снижения галлюцинаций надо внедрять детерменированный инструментарий и перепроверку.
Если LLM попросить написать код, то с большой вероятностью он будет некорректным и даже нерабочим.
Если дать ей интерпретатор/компилятор и в цикле запускать, пока не будет собираться без ошибок.
Если добавить тесты, то вероятность получения корректной программы возрастёт.
Почему бы тебе не найти какой-нибудь электротехнический решатель и не подружить свою LLM с ним? чтобы она смогла делать схемы, тестировать их и т.д.?
Re[7]: Qwen3.6 27B
От: Философ Ад http://vk.com/id10256428
Дата: 23.04.26 12:29
Оценка:
Здравствуйте, Nuzhny, Вы писали:

N>Почему бы тебе не найти какой-нибудь электротехнический решатель и не подружить свою LLM с ним? чтобы она смогла делать схемы, тестировать их и т.д.?


Увы, но даже NI Multisim спотыкается о переходные процессы — выдаёт ошибку и затыкается. Приходится шаманить с временем шага, что далеко не всегда успешно. Приходится дробить схему и считать по частям.

Конкретно для магнитного ключа я писал отдельную маленькую софтинку. Заметь, только на расчёт магнитного ключа на i9-11900kf уходит половина секунды (в один поток), это с адаптивным шагом. Без такого хака (адаптивный шаг) оно либо считает до ишачьей пасхи, либо падает.

Зело сомневаюсь, что встроить такой расчёт в большую систему, типа NI Multisim возможно: расчёт задаёт длинну шага, и это может быть неприемлимо для остальной части схемы. Скорее всего результат будет когда рак на горе свистнет.

Гораздо более продуктивным может быть аналитическое решениение, но оно получается супермегасложным.
Всё сказанное выше — личное мнение, если не указано обратное.
Отредактировано 23.04.2026 12:33 Философ . Предыдущая версия .
Re[4]: Qwen3.6 27B
От: GlebЗ Россия  
Дата: 23.04.26 13:01
Оценка: +1
Здравствуйте, Vzhyk2, Вы писали:

V>У меня ускорение пока получалось только в части посмотреть что новенького по какой теме появилось. Самому с поисковиками рыскать получается долго.

V>С кодом обычно с дипсиком медленнее. Но если с ним повозиться, то в итоге рабочий и приличный код можно от него получить.
Ты работаешь с агентом или с чатом? Это две кардинальные разницы.
Re: Qwen3.6 27B
От: VladD2 Российская Империя www.nemerle.org
Дата: 23.04.26 21:47
Оценка:
Здравствуйте, GlebЗ, Вы писали:

GЗ>Вышла 22 часа назад. Кто занимается локальными/корпоративными LLM.


Надо попробовать сравнить ее с 35b, но с менее квантованным кэшем. Я сейчас 35b с K-Q4_0 и V-Q4_0 гоняю. Попробовал поднять K до Q8_0, но сразу пошли тормоза. Может быть с 27B удастся уменьшить квантизацию кэша.
Есть логика намерений и логика обстоятельств, последняя всегда сильнее.
Re[2]: Qwen3.6 27B
От: VladD2 Российская Империя www.nemerle.org
Дата: 23.04.26 21:50
Оценка:
Здравствуйте, Философ, Вы писали:

Ф>Квен в любом случае тупой. Я периодически смотрю, нет ли прогресса, но увы


Умнее в классе ~30b нет. 35b вполне себе на уровне код пишет. Добавить команды в гуй, и простой код написать может с пол пинка.

Просто надо понимать, что Qwen дрессируется именно на агентский режим написания кода. Прогресс от 2.5 и 3.0 очень значительный.

Да, по сравнению с полноценным ДипСиком он туп, но в весах до 35б включительно ему конкурентов пока нет. И кэш из коробки 356К.
Есть логика намерений и логика обстоятельств, последняя всегда сильнее.
Re[6]: Qwen3.6 27B
От: VladD2 Российская Империя www.nemerle.org
Дата: 23.04.26 22:02
Оценка:
Здравствуйте, Философ, Вы писали:

Ф>Наверное, если ты почитаешь нашу переписку, то поймёшь: неверный расчёт задержки и недоучёт заряда гейта приводит к работе мосфета в линейном режиме. Довольно дорогие мосфеты выгорают мгновенно: мощности измеряемые в киловаттах они долго не держат.


Понимаешь ли в чём дело? Никому твои мосфетты не нужны. Людям нужно решать прикладные задачи. Код писать (например, тесты). Баги искать. А мофеттами ты или сам разберешься, или большую ЛЛМ-ку привлечешь. Понятно, что ЛЛМ в формате 20-35b — это далеко не гений. Но ее обучили пользоваться агентами, и это дает ей возможность сильно сократить контекст и делать исследования перед работой. Для написания кода это значит многое. А твои вопросы по мофеттам — это проверка конкретных знаний. Я в них еще больший ноль, чем та нейронка, что ты использовал. Но в вопросах написания компиляторов я и тебе, и той нейронке огромную фору дам. Так же и с нейронкой. Ну не вложили в нее знания по мофеттам в нужном тебе объёме. Но это еще не значит, что нейронка не пригодна для других задач.

Ф>Это приводит к тому, что мне снова нужно ждать посылку из Китая — недельки 3 ждать, с негарантированным результатом: китайцы подделывают мосфеты (маленький кристалл внутри, характерный для бросовых моделей).


Ф>Мне нужна вероятность 99.99%. Поэтому вычитываю и пересчитываю. Это поднимает вопрос о его нужности: доверять его ответам нельзя, можно поручать только самые простые задачи, а такие задачи и Алиса решает.


Ты пытаешься сам себя убедить. Твоя проверка не мосфеттах никому не нужна. А ты в неё уперся. Ну недостаточно у нее знаний для конкретной задачи. Точно так же нее будет недостаточно знаний и по другим вопросам. Но прочесть код, понять его и поправить она вполне может.
Есть логика намерений и логика обстоятельств, последняя всегда сильнее.
Re: Qwen3.6 27B
От: pva  
Дата: 24.04.26 07:34
Оценка: 4 (1)
Здравствуйте, GlebЗ, Вы писали:

GЗ>Вышла 22 часа назад. Кто занимается локальными/корпоративными LLM.

Вчера погонял ее немного в версии Q6_K (контекст 200к, использованный до 100к). Показала себя хуже геммы-4 или квена-35-3, но это может быть косяк с настройками модели (не было времени разбираться).
Очень часто зацикливается как на этапе thinking так и на этапе генерации. Приходится перезапускать запрос.
newbie
Re: Qwen3.6 27B
От: opfor  
Дата: 24.04.26 08:15
Оценка:
Здравствуйте, GlebЗ, Вы писали:

GЗ>Вышла 22 часа назад. Кто занимается локальными/корпоративными LLM.


Это ж, поди, какое-то железо окуенное должно быть, на уровне топовых геймерских машин с сотнями нефти оперативы? (да и то будут одни страдания от использования)?
Обычный макбук не потянет?
Re[2]: Qwen3.6 27B
От: Nuzhny Россия https://github.com/Nuzhny007
Дата: 24.04.26 08:24
Оценка:
Здравствуйте, opfor, Вы писали:

O>Это ж, поди, какое-то железо окуенное должно быть, на уровне топовых геймерских машин с сотнями нефти оперативы? (да и то будут одни страдания от использования)?

O>Обычный макбук не потянет?

Совсем примерно:
Re[2]: Qwen3.6 27B
От: GlebЗ Россия  
Дата: 24.04.26 09:33
Оценка:
Здравствуйте, VladD2, Вы писали:

GЗ>>Вышла 22 часа назад. Кто занимается локальными/корпоративными LLM.

VD>Надо попробовать сравнить ее с 35b, но с менее квантованным кэшем. Я сейчас 35b с K-Q4_0 и V-Q4_0 гоняю. Попробовал поднять K до Q8_0, но сразу пошли тормоза. Может быть с 27B удастся уменьшить квантизацию кэша.
У меня на тесте по классификаторам выиграла несколько процентов у 35B но самое главное — менее волантильна при параллельной нагрузке на vllm. Обе модели квантизованные по AWK (4 bit), кэши не квантизованы. Агнентские функции выполняет лучше, программирование не пробовал, но всякое организационное, код ревьюв — на ура. Хотя это вопрос ощущений а не цифр.
Re[7]: Qwen3.6 27B
От: Философ Ад http://vk.com/id10256428
Дата: 24.04.26 11:09
Оценка:
Здравствуйте, VladD2, Вы писали:

VD>Ты пытаешься сам себя убедить. Твоя проверка не мосфеттах никому не нужна. А ты в неё уперся...


Переписка не про мосфеты, а про цепь из одного дросселя и двух конденсаторов, которую питает источник тока. Это простейшая цепь. Однако квен не может сообразить, кто к кому подключен. Похожие цепи дают на ТОЭ, на втором и третьем курсе.

UPD: про мосфеты, он кстати, знает — даже может рассказать причину по которой в графике SOA сверху прямая линия, и по какой причине в разделах Absolute Maximum Ratings ток отличается от того, что на графике. Квен может рассказать про любой график в даташите, подробно обосновав причины по которым этот график именно такой, и зачем он вот такой. Однако рассказать теорию — это одно, а по описанию понять к чем подключен C1, а к чем С2 — совершенно другое. Он владеет математическими методами, в т.ч. численными, но применять их не может.
Чтобы его использовать с пользой, нужно по кусочкам декомпозировать задачу, напрячь его на нужный мат. метод или численный метод, и собрать всё это руками. Это огромная работа — куда большая, чем подбирать методы решения под конкретный кусочек. И с задачами которые при её выполнении возникают справляется и Гигачат. На кой ляд тогда этот квен нужен? И я не про 30b — думаю на сайте у них куда более крупная модель.
Всё сказанное выше — личное мнение, если не указано обратное.
Отредактировано 24.04.2026 11:21 Философ . Предыдущая версия .
Re: Qwen3.6 27B
От: BlackEric http://black-eric.lj.ru
Дата: 24.04.26 12:49
Оценка:
Здравствуйте, GlebЗ, Вы писали:

GЗ>Вышла 22 часа назад. Кто занимается локальными/корпоративными LLM.


В задачах OCR, в том числе рукописного текста, Qwen 3.6 хорош. Особенно если после распознавания нужно вытащить смысл из текста в свободной форме. Специальные модели больше не нужны.
https://github.com/BlackEric001
Re[2]: Qwen3.6 27B
От: Философ Ад http://vk.com/id10256428
Дата: 24.04.26 13:07
Оценка:
Здравствуйте, BlackEric, Вы писали:

BE>В задачах OCR, в том числе рукописного текста, Qwen 3.6 хорош. Особенно если после распознавания нужно вытащить смысл из текста в свободной форме. Специальные модели больше не нужны.


Ты про какую именно модель?
Я использовал ту, которая на сайте, для описания осциллограм — реально хорошо справляется.
Всё сказанное выше — личное мнение, если не указано обратное.
Отредактировано 24.04.2026 23:21 Философ . Предыдущая версия .
Re[3]: Qwen3.6 27B
От: BlackEric http://black-eric.lj.ru
Дата: 24.04.26 13:28
Оценка:
Здравствуйте, Философ, Вы писали:

Ф>Здравствуйте, BlackEric, Вы писали:


BE>>В задачах OCR, в том числе рукописного текста, Qwen 3.6 хорош. Особенно если после распознавания нужно вытащить смысл из текста в свободной форме. Специальные модели больше не нужны.


Ф>Ты про какую именно модель?

Ф>Я использовал ту, которая на сайте для описания осциллограм — реально хорошо справляется.

qwen3.6:35b. Запускаю локально под Ollama.
https://github.com/BlackEric001
Re[2]: Qwen3.6 27B
От: GlebЗ Россия  
Дата: 24.04.26 13:31
Оценка: +1
Здравствуйте, Философ, Вы писали:

Сделай такой запрос

Ты преподаватель по ТОЭ. Обязательно реши задачу:
Я нашёл ферритовое кольцо с начальной магнитной проницаемостью около 120 000 размерами 26х16х10 мм с индукцией насыщения около 12 000 Гс и маленькой коэрцитивной силой. Судя по графику, петля имеет высокую степень прямоугольности (0.85–0.95).
Я думаю на этом феррите делать магнитный ключ для тяжёлых мосфетов — 20 нФ на затворе с требуемым напряжением 10 В. Мой драйвер обеспечивает ток всего 2 А. Думаю делать дроссель с одним витком, а перед дросселем ставить керамический конденсатор на 10 нФ, с ESR примерно 20 мОм.
Какова будет зардержка, длинна фронта и какова амплитуда выброса, и что будет после выброса (как будет изменяться напряжение на затворе)?
Составь план решения, выполни решение, проверь решение, если решение неверно, реши его снова.

Я не буду его делать, потому что не понимаю в твоей тематике ни шиша.
Re[4]: Qwen3.6 27B
От: Философ Ад http://vk.com/id10256428
Дата: 24.04.26 13:37
Оценка:
Здравствуйте, BlackEric, Вы писали:

Ф>>Ты про какую именно модель?

Ф>>Я использовал ту, которая на сайте для описания осциллограм — реально хорошо справляется.

BE>qwen3.6:35b. Запускаю локально под Ollama.


О! А можешь сделать доброе дело? Попробуй ей вот это скормить http://files.rsdn.org/67254/RigolDS20.png
Запрос такой:
=========
На скриншоте представлена часть осциллограммы снятой с L-C цепи, где представлен процесс разряда конденсатора. Игнорируя выбросы укажи промежуток времени, где скорость падения напряжения максимальна. Какова она?
=========

Скажи, на каком железе, и сколько трудилась модель. Что ответила.
Всё сказанное выше — личное мнение, если не указано обратное.
Re[3]: Qwen3.6 27B
От: pva  
Дата: 24.04.26 19:55
Оценка:
Здравствуйте, Nuzhny, Вы писали:

N>Я с маленькой локальной LLM Qwen3.5 9b вполне успешно решаю текущие проблемы с bash и cmake.

Хехе... я тут по подсказкам с форума завел Qwen3.5-122B-A10B на спарке со скоростью 50токс. Правда в 4 бита, но пока больших косяков не заметно. Обещают подвезти гибридное квантование до 5 бит. Но я вообще надеюсь что кто-то родит модель для программинга-тулинга в конфигурации примерно xxx-64b-a8b и заживем.
newbie
Re[5]: Qwen3.6 27B
От: VladD2 Российская Империя www.nemerle.org
Дата: 24.04.26 22:02
Оценка: 6 (1)
Здравствуйте, Философ, Вы писали:

Ф>О! А можешь сделать доброе дело? Попробуй ей вот это скормить http://files.rsdn.org/67254/RigolDS20.png

Ф>Запрос такой:
Ф>=========
Ф>На скриншоте представлена часть осциллограммы снятой с L-C цепи, где представлен процесс разряда конденсатора. Игнорируя выбросы укажи промежуток времени, где скорость падения напряжения максимальна. Какова она?
Ф>=========



Ф>Скажи, на каком железе, и сколько трудилась модель. Что ответила.


4090 + 3090 Ti

qwen3.6-35b-a3b — квантованная в Q6_K c KV-кэшем квантованным в Q4_0
Есть логика намерений и логика обстоятельств, последняя всегда сильнее.
Re[4]: Qwen3.6 27B
От: VladD2 Российская Империя www.nemerle.org
Дата: 24.04.26 22:08
Оценка:
Здравствуйте, pva, Вы писали:

pva>Хехе... я тут по подсказкам с форума завел Qwen3.5-122B-A10B на спарке со скоростью 50токс. Правда в 4 бита, но пока больших косяков не заметно. Обещают подвезти гибридное квантование до 5 бит. Но я вообще надеюсь что кто-то родит модель для программинга-тулинга в конфигурации примерно xxx-64b-a8b и заживем.


Да 35 уже работает. А в 4-битное квантование я немного не верю. Мои опыты с ним показали существенное падение качества инференса. В прочем это на 35b-моделях. Возможно ум 122b вывозит.

Интересно было бы сравнить 35b в умеренном квантовании (Q6-Q8) с 122b в Q4.

Если не секрет когда по чем разжился DGX Spark? И как он вообще?
Есть логика намерений и логика обстоятельств, последняя всегда сильнее.
Re[6]: Qwen3.6 27B
От: Философ Ад http://vk.com/id10256428
Дата: 24.04.26 22:21
Оценка:
Здравствуйте, VladD2, Вы писали:

Ф>>Скажи, на каком железе, и сколько трудилась модель. Что ответила.

VD>4090 + 3090 Ti

Неплохо! За 1:46 то.
Если руками курсором юзать туда-сюда, глядя на delta_Y и delta_X, то это минимум 10 — 15 минут. А если на компе, то без курсора — деления на клетках руками придётся считать. Это минут 20.

И того:
1) сохранить скриншот на флэшку — 30 секунд
2) переткнуть флэшку на комп — 10 секунд
3) открыть флэйшку на компе и добраться до файла — 30 секунд
4) написать запрос — 1.5 минуты
5) подождать ответ модели — 1:46
6) чтение ответа модели — 60 секунд
-------------
5 минут 26 секунд

Ускорение минимум вдвое.

Спасибо.
Всё сказанное выше — личное мнение, если не указано обратное.
Re[5]: Qwen3.6 27B
От: VladD2 Российская Империя www.nemerle.org
Дата: 24.04.26 23:01
Оценка:
Здравствуйте, Философ, Вы писали:

Ф>О! А можешь сделать доброе дело? Попробуй ей вот это скормить http://files.rsdn.org/67254/RigolDS20.png

Ф>Запрос такой:
Ф>=========
Ф>На скриншоте представлена часть осциллограммы снятой с L-C цепи, где представлен процесс разряда конденсатора. Игнорируя выбросы укажи промежуток времени, где скорость падения напряжения максимальна. Какова она?
Ф>=========



Ф>Скажи, на каком железе, и сколько трудилась модель. Что ответила.


Железо то же, что и здесь
Автор: VladD2
Дата: 25.04 01:02
(4090 + 3090 Ti).

Модель qwen3.6-27b.

Короче, по оно фактически ушло в бред на 10 минут. Так что восхищение этой 27b не разделяю независимо от результата.

Тоже самое с выключенными размышлениями:

qwen/qwen3.6-27b
На осциллограмме показан процесс разряда конденсатора в L-C цепи (с затухающими колебаниями, но на данном участке — плавное падение напряжения).

Нас интересует максимальная скорость падения напряжения, то есть наибольший по модулю отрицательный градиент напряжения dV/dt.

Анализ графика:
Горизонтальная ось: время, масштаб 1.00 мкс/деление (видимо, 10 делений = 10 мкс, но на экране видно до ~8.6 мкс).
Вертикальная ось: 5.00 В/деление (канал 1).
Начальное напряжение перед разрядом — около +15 В.
Разряд начинается примерно после 4.6 мкс (после затухания колебаний).
Напряжение плавно падает от ~15 В до ~0 В к ~8.6 мкс.
Где максимальная скорость падения?
В цепи LC при разряде конденсатора через индуктивность, скорость изменения напряжения максимальна в момент, когда ток через конденсатор максимален — это происходит в начале разряда, когда конденсатор ещё сильно заряжен, и ток быстро растёт.

Однако, на данном графике мы видим затухающий разряд, и после затухания колебаний (до ~4.6 мкс) начинается плавное экспоненциальное падение — типичное для RC-цепи или затухающей LC с сопротивлением.

Но вопрос: где скорость падения напряжения максимальна?

Посмотрим на форму кривой:

После 4.6 мкс — напряжение начинает падать.
Крутизна кривой (наклон) наибольшая в самом начале падения, то есть немного после 4.6 мкс.
По мере разряда наклон уменьшается — кривая становится более пологой.
Значит, максимальная скорость падения напряжения наблюдается в начале разряда, примерно в интервале от 4.6 мкс до 5.0 мкс.

Оценка скорости падения напряжения:
Возьмём два точки:

В момент t₁ ≈ 4.6 мс → V₁ ≈ 15.0 В
В момент t₂ ≈ 5.0 мс → V₂ ≈ 12.0 В (примерно, по сетке: 3 деления вниз от 15 В = 15 — 3×5 = 0? Нет, подождите — шкала 5 В/дел, значит каждое деление — 5 В.
Посмотрим внимательнее:

Верхняя линия — 15 В.
Ниже — 10 В, 5 В, 0 В, -5 В и т.д.
В момент 4.6 мкс — напряжение чуть ниже 15 В, скажем, ~14.5 В.
В момент 5.0 мкс — напряжение примерно ~12.5 В (на 0.4 деления ниже 15 В → 15 — 0.4×5 = 13? Лучше оценить по сетке).
Давайте возьмём более чёткие точки:

При t = 5.0 мкс — напряжение ≈ 12.5 В (между 10 и 15, ближе к 15 — скажем, 12.5)
При t = 5.5 мкс — напряжение ≈ 8.0 В (чуть выше 5 В)
Тогда за Δt = 0.5 мкс = 0.5 × 10⁻⁶ с, ΔV = 12.5 — 8.0 = 4.5 В

→ |dV/dt| ≈ 4.5 В / 0.5 мкс = 9.0 × 10⁶ В/с = 9.0 МВ/с

Проверим ещё один участок — ближе к началу:

t = 4.7 мкс → V ≈ 14.0 В
t = 5.0 мкс → V ≈ 12.5 В → Δt = 0.3 мкс, ΔV = 1.5 В → |dV/dt| = 1.5 / 0.3e-6 = 5.0 МВ/с — меньше.
А если взять:

t = 5.0 мкс → 12.5 В
t = 5.2 мкс → 10.0 В (примерно) → Δt = 0.2 мкс, ΔV = 2.5 В → |dV/dt| = 2.5 / 0.2e-6 = 12.5 МВ/с
Ещё лучше:

t = 5.0 мкс → 12.5 В
t = 5.1 мкс → 11.0 В (предположим) → Δt = 0.1 мкс, ΔV = 1.5 В → 15 МВ/с
Но это уже экстраполяция.

Лучше использовать видимые точки на сетке:

На графике видно, что от 5.0 мкс до 6.0 мкс напряжение падает с ~12.5 В до ~5.0 В → ΔV = 7.5 В за 1.0 мкс → 7.5 МВ/с

От 5.0 мкс до 5.5 мкс: с 12.5 В до ~8.0 В → 4.5 В за 0.5 мкс → 9.0 МВ/с

От 5.5 мкс до 6.0 мкс: с 8.0 В до 5.0 В → 3.0 В за 0.5 мкс → 6.0 МВ/с

Значит, максимальная скорость падения — в интервале 5.0–5.5 мкс, и составляет примерно 9.0 МВ/с.

Но давайте посмотрим на самый крутой участок — возможно, чуть раньше?

В момент 4.6 мкс напряжение ещё почти 15 В, а в 5.0 мкс — уже 12.5 В → за 0.4 мкс падение 2.5 В → 6.25 МВ/с

Так что максимум действительно в районе 5.0–5.5 мкс.

Ответ:
Промежуток времени, где скорость падения напряжения максимальна: примерно от 5.0 мкс до 5.5 мкс.

Максимальная скорость падения напряжения: около 9.0 МВ/с (или 9 × 10⁶ В/с).

⚠️ Примечание: Поскольку это LC-цепь, теоретически в идеальном случае (без сопротивления) напряжение должно колебаться, но здесь видно затухание — значит, есть сопротивление. В таком случае максимальная скорость изменения напряжения может быть не в самом начале разряда, а чуть позже, из-за фазового сдвига между током и напряжением в индуктивности. Однако на данном графике визуально самый крутой наклон — в указанном интервале.

✅ Итоговый ответ:

Промежуток времени: ~5.0 мкс – 5.5 мкс

Максимальная скорость падения напряжения: ~9.0 МВ/с


Тоже самое Qweb3,6-35b без размышлений:

На осциллограмме видно, что сигнал начинается с резкого скачка (вероятно, импульс запуска или переходный процесс), затем следует почти постоянный уровень около **15 В**, а после **~5.6 мкс** начинается плавное снижение напряжения — это и есть разряд конденсатора в L-C цепи.

---

### Задача:
Указать **промежуток времени, где скорость падения напряжения максимальна**, и вычислить эту максимальную скорость.

> *Скорость падения напряжения* — это производная \( \frac{dV}{dt} \). Максимальная по модулю отрицательная производная соответствует самому крутому спаду.

---

### Анализ графика:

— До ~5.6 мкс — напряжение почти постоянно (~15 В).
— После 5.6 мкс — начинается экспоненциальный спад.
— Кривая имеет форму, характерную для разряда RC или LC-цепи (в данном случае, вероятно, затухающие колебания или экспоненциальный спад).
— Наибольшая крутизна спада наблюдается **в начале разряда**, то есть сразу после 5.6 мкс.

Посмотрим на точки:

— При **t = 5.6 мкс** → V ≈ 15 В
— При **t = 6.6 мкс** → V ≈ 7.5 В (примерно половина от 15 В — это может быть время полураспада)
— При **t = 7.6 мкс** → V ≈ 3.75 В

Если предположить, что спад экспоненциальный:
\( V(t) = V_0 e^{-t/\tau} \), то максимальная скорость падения будет в начале процесса, при t=0 относительно начала разряда.

Но на графике мы видим, что между **5.6 мкс и 6.6 мкс** напряжение падает с ~15 В до ~7.5 В — это изменение на **7.5 В за 1 мкс**.

Между **6.6 мкс и 7.6 мкс** — падает с 7.5 В до ~3.75 В — тоже 3.75 В за 1 мкс.

Значит, **максимальная скорость падения** — в самом начале разряда, то есть **между 5.6 мкс и 6.6 мкс**.

---

### Вычисление максимальной скорости:

\[
\left| \frac{\Delta V}{\Delta t} \right| = \frac{15\,\text{В} — 7.5\,\text{В}}{6.6\,\text{мкс} — 5.6\,\text{мкс}} = \frac{7.5\,\text{В}}{1\,\text{мкс}} = 7.5 \times 10^6\,\text{В/с}
\]

---

### Ответ:

> **Промежуток времени, где скорость падения напряжения максимальна:**
> **от 5.6 мкс до 6.6 мкс**

> **Максимальная скорость падения напряжения:**
> **7.5 МВ/с (или 7.5 × 10⁶ В/с)**

---

*Примечание:* Если бы мы хотели быть точнее, можно было бы взять производную в точке t=5.6 мкс, используя касательную, но по данным графика с шагом 1 мкс, это лучшее приближение. Также стоит отметить, что в реальных L-C цепях с потерями спад может быть не чисто экспоненциальным, но для целей задачи такого приближения достаточно.

Есть логика намерений и логика обстоятельств, последняя всегда сильнее.
Re[7]: Qwen3.6 27B
От: VladD2 Российская Империя www.nemerle.org
Дата: 24.04.26 23:05
Оценка:
Здравствуйте, Философ, Вы писали:

Ф>Неплохо! За 1:46 то.


Да оно херней занималось все эти 1:46 минут. Я в твоей бухгалтерии ничего не помнимю. Ниже привел тоже самое без рассуждений. Оцени. Может они не нужны вовсе?

Ф>Спасибо.


Я правильно понял, что оно задачу твою вкурило правильно?
Есть логика намерений и логика обстоятельств, последняя всегда сильнее.
Re[8]: Qwen3.6 27B
От: Философ Ад http://vk.com/id10256428
Дата: 24.04.26 23:14
Оценка:
Здравствуйте, VladD2, Вы писали:

VD>Да оно херней занималось все эти 1:46 минут. Я в твоей бухгалтерии ничего не помнимю. Ниже привел тоже самое без рассуждений. Оцени. Может они не нужны вовсе?


Завтра скорее всего. Я пока не способен — устал, глянул что младшие модели писали и шарики за ролизи заехали: "скорость полураспада" — ппц какой-то.

VD>Я правильно понял, что оно задачу твою вкурило правильно?


Максимальную скорость падения напряжение посчитало правильно. Время — здесь вроде тоже правильно (с первого взгляда). Точных цифр не помню, но цифры прям очень похожи на правду. Но если скорость совпала, значит скорее всего правильно.
Всё сказанное выше — личное мнение, если не указано обратное.
Re[3]: Qwen3.6 27B
От: VladD2 Российская Империя www.nemerle.org
Дата: 24.04.26 23:37
Оценка:
Здравствуйте, Nuzhny, Вы писали:

N>Совсем примерно:

N>Image: Screenshot from 2026-04-23 13-47-44.png

Что реально так медленно?

И какой смысл мерить пенисы на 8b и 14b при 128 Гб+?

Чую пахнет салициловым. Если что у меня на дохлых 4090+3090Ti и на 35b 100+ t/s получается.
Есть логика намерений и логика обстоятельств, последняя всегда сильнее.
Re[5]: Qwen3.6 27B
От: pva  
Дата: 25.04.26 11:49
Оценка:
Здравствуйте, VladD2, Вы писали:

VD>Мои опыты с ним показали существенное падение качества инференса. Возможно ум 122b вывозит.

Да, 122 в целом вывозит, но там не полноценный 4-бит, а гибрид с FP8. Короче, сообщество мутит, пытаясь выжать из железа максимум и приблизить к 5 битам с умеренной скоростью.
Там выкатили еще какой-то эксперимент, который должен улучшить инференс. Посмотрим.

VD>Интересно было бы сравнить 35b в умеренном квантовании (Q6-Q8) с 122b в Q4.

По ощущениям примерно одинаково хоршо. Но это только ощущения. Раскатывать полноценное сравнения нет особо времени и желания.

VD>Если не секрет когда по чем разжился DGX Spark? И как он вообще?

Разжился где-то в феврале за ~5к (в США 4к, но где мы а где США). Вообще, уныл и сыр. Выкатили для энтузиастов в расчете на допил. На форумах куча жалоб на это.
Основные претензии: рекламировали до 1PFLOPs, а по итогу и близко к этому не подошли. Отдельная беда — медленная память. Ну и по мелочи еще много чего.
Короче, не рекомендую. Хотел написать что для команд я бы смотрел в сторону B300, но глянул ценник и понял что не нужно туда смотреть
newbie
Re[3]: Qwen3.6 27B
От: AndrewVK Россия http://blogs.rsdn.org/avk
Дата: 25.04.26 17:10
Оценка:
Здравствуйте, GlebЗ, Вы писали:

GЗ> Хотя это вопрос ощущений а не цифр.


Llm-as-a-judge для таких вещей самое то.
AVK Blog
Re: Qwen3.6 27B
От: _ilya_  
Дата: 25.04.26 18:26
Оценка:
Здравствуйте, GlebЗ, Вы писали:

GЗ>Вышла 22 часа назад. Кто занимается локальными/корпоративными LLM.


Q4 влазит в одну 3090 и на контексте 32К шарашит под 100 токенов/с, PP фактически мгновенный.
Но качество — хуже Qwen3.6 35B (которая в 1 "слабую" видюху с большим контекстом не лезет в Q4 увы). Мой тест на логику 27B не прошла, а 35B прошла как и более серъезные модели (но они уже на 120B+). Если впихивать и задействовать RAM, скорость в 4 раза медленнее e 35B чем у MOE 27B. Но работает хоть и медленнее, зато точнее.
Re[2]: Qwen3.6 27B
От: xma  
Дата: 25.04.26 19:00
Оценка:
Здравствуйте, _ilya_, Вы писали:

__>Но качество — хуже Qwen3.6 35B (которая в 1 "слабую" видюху с большим контекстом не лезет в Q4 увы).

это MoE модель же, поэтому её можно разбросать между ОЗУ и VRAM (гугли)

__>Мой тест на логику 27B не прошла, а 35B прошла как и более серъезные модели (но они уже на 120B+).

ну вообще в кодинге по идее (по официальным бенчам и не только) 27B dense чуть круче, чем 35B MoE

__>Если впихивать и задействовать RAM, скорость в 4 раза медленнее e 35B чем у MOE 27B.

ты чё т гонишь, MoE это как раз qwen3.5:35b-a3b — а qwen3.5:27b это dense (плотная модель)

__>Но работает хоть и медленнее, зато точнее.

ну обычно ваще т главное это pp512 рекомендуется от 250 t/s и выше, но на любительских проектах часто может хватать и от 120 t/s (input)
Отредактировано 25.04.2026 19:02 xma . Предыдущая версия .
Re: Qwen3.6 27B
От: Serginio1 СССР https://habrahabr.ru/users/serginio1/topics/
Дата: 25.04.26 19:05
Оценка:
Здравствуйте, GlebЗ, Вы писали:

GЗ>Вышла 22 часа назад. Кто занимается локальными/корпоративными LLM.


Интересно сравнение с Claude Code

https://dzen.ru/a/adkkO9JQs0PEdZ4B

Что вообще такое Qwen Code
Это не просто модель с автодополнением кода. Qwen Code — полноценный ИИ-агент для терминала, примерно как Claude Code: читает весь репозиторий, сам запускает команды, правит файлы, гоняет тесты, чинит ошибки и коммитит результат.

В апреле 2026 года вышел Qwen 3.6 Plus — флагманская версия, с которой собственно и началась вся история. На её основе работает и CLI-агент Qwen Code, и плагины для VS Code и JetBrains.

Технически под капотом — гибрид двух подходов к обработке длинных текстов и архитектура «смесь экспертов»: модель огромная по параметрам, но на каждый запрос активирует лишь небольшую их часть. Из-за этого она работает быстрее, чем должна была бы при своём размере. Но это детали — важнее то, что она умеет на практике.


Про деньги — и вот тут начинается интересное
Claude Code через API на базе Opus стоит $15 за миллион входящих токенов и $75 за миллион исходящих. Qwen 3.6 Plus — $0.40 и $1.20 соответственно.

Чтобы это не осталось абстракцией: возьмём реальный рабочий месяц — 50 миллионов входящих токенов и 10 миллионов исходящих. Это нормальная нагрузка, если агент активно работает с большим репозиторием.

На Claude Opus такой месяц обойдётся в $1 500. На GPT-5.2 Codex — в $227. На Qwen 3.6 Plus — в $32.

Тридцать два доллара.

Это не опечатка. Разница с Claude Opus — в 47 раз. С Codex — в 7 раз.

Cursor, кстати, в этом разговоре стоит отдельно: это IDE, которая берёт те же модели под капотом (Claude, GPT) и продаёт тебе удобный интерфейс за $20–40 в месяц. Если ты платишь за Cursor Pro и активно его используешь — ты платишь за удобство плюс накрутку сверху. Qwen Code CLI не такой красивый, но работает в терминале бесплатно или за копейки.

и солнце б утром не вставало, когда бы не было меня
Re[2]: Qwen3.6 27B
От: AndrewVK Россия http://blogs.rsdn.org/avk
Дата: 25.04.26 20:42
Оценка: 16 (1)
Здравствуйте, Serginio1, Вы писали:

S>Claude Code через API на базе Opus стоит $15 за миллион входящих токенов и $75 за миллион исходящих. Qwen 3.6 Plus — $0.40 и $1.20 соответственно.


Сравнили теплое с мягким. Опус и Квен это как мерседес и лада. Сравнивать квен можно с соннетом, да и то квен существенно проигрывает.

S>Чтобы это не осталось абстракцией: возьмём реальный рабочий месяц — 50 миллионов входящих токенов и 10 миллионов исходящих.


Это очень мало на месяц, в режиме строгой экономии.

S>На Claude Opus такой месяц обойдётся в $1 500. На GPT-5.2 Codex — в $227. На Qwen 3.6 Plus — в $32.


S>Тридцать два доллара.


S>Это не опечатка. Разница с Claude Opus — в 47 раз. С Codex — в 7 раз.


S>Qwen Code CLI не такой красивый, но работает в терминале бесплатно или за копейки.


Кодинг агентов сейчас море и почти все они бесплатны. Затык только в модельках. Как по мне, Опуса никто пока не превзошел. На втором месте — GLM-5. А квен пока очень средненько, как, впрочем, и клодовский соннет.
С другой стороны, разные модели на plan/act никто не отменял, на plan обычно много токенов не тратится, особенно дорогих исходящих, а для act квен или glm-5 вполне себе норм.

Есть, кстати, забавный способ экономии токенов — просишь его общаться языком древнего человека.
AVK Blog
Re[8]: Qwen3.6 27B
От: AndrewVK Россия http://blogs.rsdn.org/avk
Дата: 25.04.26 20:58
Оценка:
Здравствуйте, Философ, Вы писали:

Ф>UPD: про мосфеты, он кстати, знает — даже может рассказать причину по которой в графике SOA сверху прямая линия


Тебе уже объясняли. Пытаться вытащить глубинные специфичные знания из голой llm, даже большой — тухлое дело. Это даже не позапрошлый век по меркам AI. Давным давно придумали RAG — и туда ты можешь загнать свою специфичную базу знаний. Потом поняли что rag слабоват, даже навороченный типа графового. Очень много порождает ненужных связей. Поэтому придумали для формализованных данных MCP. А потом придумали субагентов, у каждого из которых свой маленький rag и свои жесткие гардрейлы по его теме. Набор субагентов заворачивается к агента-оркестратора, у которого свой rag и свои гардрейлы.
Вот для кодинга таких агентов наплодили море, а для расчета мосфетов — увы, скорее всего нет ни одного (хотя какие то скиллы на тему гуглятся, но я не настоящий сварщик, поэтому хз). Ты можешь сам попробовать такого агента сделать, хотя бы просто на уровне своих скиллов.

Ф>Чтобы его использовать с пользой, нужно по кусочкам декомпозировать задачу, напрячь его на нужный мат. метод или численный метод, и собрать всё это руками.


Ну вот и опиши методу в скилле, а потом подсунь его ллмке. А без этого ты будешь хлебать галлюцинации полной ложкой. Trash in — trash out. Старая истина по прежнему работает.
AVK Blog
 
Подождите ...
Wait...
Пока на собственное сообщение не было ответов, его можно удалить.