Здравствуйте, GlebЗ, Вы писали:
GЗ>qwen3.6 27B в прекрасной первозданности и с хорошей скоростью и с максимальным контекстом. Так как он проектировался. Туда же embedder, tts. Я думаю скоро появится qwen3.6 122B
Увы, все модели деградируют если увеличивать контекст. Т.е. максимальный скорее бесполезен, сейчас оптимум 32-64К.
Вот тут опен-модели:
https://github.com/NVIDIA/RULER
У закрытых аналогичная деградация
https://vc.ru/ai/1926251-dlinnyy-kontekst-llm-i-rag-sistemy