У кого есть такой опыт? Какая нейронка лучше всех переводит с русского на английский? (ChatGPT, YandexGPT, Deepseek, Claude, Gemini)
Так, чтобы у носителей языков не было отторжения.
Тексты: новости, публицистика.
Re: А какая нейронка лучше всех переводит с русского на английский?
Здравствуйте, Kocur, Вы писали:
K>У кого есть такой опыт? Какая нейронка лучше всех переводит с русского на английский? (ChatGPT, YandexGPT, Deepseek, Claude, Gemini) K>Так, чтобы у носителей языков не было отторжения.
Думаю, что локально будет лучше всей Saiga. В облаке и Яндекс, и Сбер примерно одинаково.
Re: А какая нейронка лучше всех переводит с русского на английский?
Здравствуйте, Kocur, Вы писали:
K>У кого есть такой опыт? Какая нейронка лучше всех переводит с русского на английский? (ChatGPT, YandexGPT, Deepseek, Claude, Gemini) K>Так, чтобы у носителей языков не было отторжения.
K>Тексты: новости, публицистика.
Для повседневных переводов (статьи, почта, пользовательский интерфейс) использую GPT
(сейчас это 4.1 mini, использую потому стоит копейки, для обычных переводов его выше крыши)
Были проблемы с переводом длинных (больше 10 листов) формальных документов типа договоров с недвижимостью или договора на разработку.
Возможно неправильно задан промпт, но в результате язык получался не такой "деревянный" как в исходнике, и местами используемые термины не бьются.
В общем при переводе юридических документов, где необходим канцелярский стиль и формулировки, к нему есть вопросы.
Re[2]: А какая нейронка лучше всех переводит с русского на английский?
Здравствуйте, Kocur, Вы писали:
N>>Думаю, что локально будет лучше всей Saiga. В облаке и Яндекс, и Сбер примерно одинаково.
K>ничего не понял. Какая Сайга?
Если ты на своем компе хочешь запускать (локально, без интернета)
K>Сбер переводит с русского на английский на уровня носителя?
Любая из перечисленных переводит на уровне носителя.
Здравствуйте, Kocur, Вы писали:
K>а как лучше? сразу всю книгу отдать на перевод или маленькими кусочками переводить, главами?
У него контекст (объем текста для перевода) ограничен. Сейчас получится только главами, книга в контекст не влезет.
Хотя смотря какая книга конечно. GPT-4 mini например 128к это примерно 50 страниц
Здравствуйте, Kocur, Вы писали:
K>ничего не понял. Какая Сайга?
Не Сайга, а Saiga. Это нейросеть — феномен. Можешь поискать всякие бенчмарки для русскоязычных LLM, там по-любому в лидерах будет Saiga. Она тренируется и развивается всего одним энтузиастом и бьёт по качеству именитых конкурентов. Потому что при тренировке нейросетей главное не размер, а качество датасета и правильная тренировка.
K>Сбер переводит с русского на английский на уровня носителя?
Я хз про уровень носителя, но хорошо. Я иногда Гигачатом для переписки пользуюсь, пока никто не жаловался.
Re[5]: А какая нейронка лучше всех переводит с русского на а
Здравствуйте, Kocur, Вы писали:
K>а как лучше? сразу всю книгу отдать на перевод или маленькими кусочками переводить, главами?
Слушай, а откуда книга взялась? Там же новости и публицистика были. Тебе тогда надо искать что-то с большим контекстом, чтобы постараться туда книгу целиком засунуть. Но и тут имеет значение, что за книга.
Re[6]: А какая нейронка лучше всех переводит с русского на а
Здравствуйте, bnk, Вы писали:
bnk>У него контекст (объем текста для перевода) ограничен. Сейчас получится только главами, книга в контекст не влезет. bnk>Хотя смотря какая книга конечно. GPT-4 mini например 128к это примерно 50 страниц
Кажется, что у гугловской gemini размер контекста 1 миллион токенов. В него книга поместится.
Re: А какая нейронка лучше всех переводит с русского на английский?
Еще такой вопрос: как лучше переводить HTML-файлы(со вставками PHP) на разные языки?
Хочу на сайте иметь перевод на 10 языков. Я создаю HTML-файл с русским текстом. Как лучше сделать, чтобы появилось еще 9 таких же файлов переведенных на 9 разных языков? А таких файлов десятки.
И как проще всего автоматизировать перевод? Если я поменяю немного в русском файле, то как тут же "обновить" перевод на остальные 9 языков?
Re[7]: А какая нейронка лучше всех переводит с русского на а
Здравствуйте, Nuzhny, Вы писали:
N>Здравствуйте, bnk, Вы писали:
bnk>>У него контекст (объем текста для перевода) ограничен. Сейчас получится только главами, книга в контекст не влезет. bnk>>Хотя смотря какая книга конечно. GPT-4 mini например 128к это примерно 50 страниц
N>Кажется, что у гугловской gemini размер контекста 1 миллион токенов. В него книга поместится.
И правда
Загуглил, 2.5 flash это 1 миллион — 3000 страниц текста (2.5 pro — 2 миллиона). Можно запихать любую книгу.
Re[2]: А какая нейронка лучше всех переводит с русского на а
Здравствуйте, The Minister, Вы писали:
TM>Здравствуйте, Kocur, Вы писали:
TM>Еще такой вопрос: как лучше переводить HTML-файлы(со вставками PHP) на разные языки? TM>Хочу на сайте иметь перевод на 10 языков. Я создаю HTML-файл с русским текстом. Как лучше сделать, чтобы появилось еще 9 таких же файлов переведенных на 9 разных языков? А таких файлов десятки. TM>И как проще всего автоматизировать перевод? Если я поменяю немного в русском файле, то как тут же "обновить" перевод на остальные 9 языков?
VS Code + GitHub Copilot Agent + Claude 4. Клод, потому что он в программировании разбирается и не испортит разметку или еще чего.
Просто открываешь папку с твоим сайтом и ставишь ему задачу ровно так как ты тут написал, на русском. Все сделает чики-поки. Создаст все нужные файлы в смысле и переведет.
Можно через GitHub (Coding Agent), ответ Microsoft чемберлену codex. тогда репозиторий с сайтом должен быть на GitHub а не локально.
Так же ставишь задачу: создаешь issue на GitHub, пишешь туда что нужно сделать — текст выше, и назначаешь GitHub Copilot в качестве исполнителя, он работает и тебе сделает pull request в твой репозиторий. Все как с живым человеком в общем.
GPT (4.1) и Gemini в программировании шарят слабее IMHO, к тому же GPT ленится (может вставить "ну вот тут сам допиши", в таком духе)
Если бы я хотел "сам дописать", просил бы я тебя спрашивается?
Хотя лучше наверное так: Попросить Клода подготовить к переводу (добавить файлы), а переводить уже с помощью GPT.
Клод очень долго возится и много жрет, для "простой" задачи типа перевода с языка на язык его использовать нецелесообразно.
У меня перевод приложения (на Испанксий), содержащего около 2500 строк локализации и примерно 30 локализуемых (текстовых) файлов занял примерно пару часов.
Весь код который нужен был для добавления языка (изменения в контролах и прочем, около 100 строк изменений) был добавлен автоматически, руками не написал ни строчки
А вообще для переводов есть же стандартные (ну более-менее) фреймворки типа i18n и t(xxx), которые позволяют все локализуемые строки можно хранить отдельно от кода.
Кстати Клода также можно попросить добавить поддержку этого i18n к сайту, и вынести все локализуемые строки в отдельный файл
Здравствуйте, Kocur, Вы писали:
K>У кого есть такой опыт? Какая нейронка лучше всех переводит с русского на английский? (ChatGPT, YandexGPT, Deepseek, Claude, Gemini) K>Так, чтобы у носителей языков не было отторжения.
Читал как-то одну статью, там утверждалось, что DeepL неплохо переводит. А может это просто была реклама. Хотя лично я без понятия кто из вышеприведённого списка лучше. Тем более применительно к нейронкам сейчас любят рассуждать про недетерминированность.
Re[2]: А какая нейронка лучше всех переводит с русского на английский?
V>Читал как-то одну статью, там утверждалось, что DeepL неплохо переводит. А может это просто была реклама. Хотя лично я без понятия кто из вышеприведённого списка лучше. Тем более применительно к нейронкам сейчас любят рассуждать про недетерминированность.
А DeepL детерминирован
Re: А какая нейронка лучше всех переводит с русского на английский?
Здравствуйте, Kocur, Вы писали:
K>У кого есть такой опыт? Какая нейронка лучше всех переводит с русского на английский? (ChatGPT, YandexGPT, Deepseek, Claude, Gemini) K>Так, чтобы у носителей языков не было отторжения.
K>Тексты: новости, публицистика.
Да любая сетка не плохо переводит, если у неё сам язык натренирован. Deepseek отлично говорит и переводит на русский (оценить обратный процесс сложнее, так как сам не носитель языка). А вот с таблицами Deepseek вряд ли справится. Не умеет он в форматы. Новости без проблем. В прочем, банальный https://translate.google.ru/ тоже вполне сносно переводит. Для понимания хватает.
Есть логика намерений и логика обстоятельств, последняя всегда сильнее.
Re[7]: А какая нейронка лучше всех переводит с русского на а
Здравствуйте, Kocur, Вы писали:
K>У кого есть такой опыт? Какая нейронка лучше всех переводит с русского на английский? (ChatGPT, YandexGPT, Deepseek, Claude, Gemini) K>Так, чтобы у носителей языков не было отторжения.
K>Тексты: новости, публицистика.
Переводит лучше всех ChatGPT.
Если вопрос о том, чем лучше переводить локально, то была какая-то миниатюрная Gemma, достаточно маленькая, чтобы работать на CPU, но достаточно умная, чтобы от перевода не плевался читатель.
В топике выше некоторые люди рассуждают о размере контекста, с чего-то они решили, что если засунуть 100 килобайт текста на вход нейронки, она непременно переведёт весь текст. Этого не получится, переводить надо абзац за абзацем, сохраняя предыдущий контекст, "скользящим окном".
Re[2]: А какая нейронка лучше всех переводит с русского на а
Здравствуйте, Слава, Вы писали:
С>Переводит лучше всех ChatGPT.
Это очень странное заявление, кстати. Уже давно в русских переводах лидируют локальный российские сетки.
Гугловская gemma уже какое-то время превосходит ChatGPT в программировании и математике.
Если почитать reddit, то:
2025 02 UPDATE: Gemma 2 and EuroLLM is the best for me, but strangely Gemma 2 is better at translating from a non-English language into English and EuroLLM is better at translating from English into a non-English language.
ChatGPT — это что-то субоптимальное, не больше и не меньше.
С>В топике выше некоторые люди рассуждают о размере контекста, с чего-то они решили, что если засунуть 100 килобайт текста на вход нейронки, она непременно переведёт весь текст. Этого не получится, переводить надо абзац за абзацем, сохраняя предыдущий контекст, "скользящим окном".
Целиком, конечно, нет смысла. Но при переводе по частям будет результат так себе. Надо следить за стилем, за контекстом (если книга — это художественное произведение, то контекст важен), за деталями перевода. Большую художественную книгу нейросеть точно перевести сейчас не сможет сама. Возможно, что поможет хороший и подробный промт, в котором указывать стиль, что за книга, возможно, её краткое содержание или содержание предыдущих частей, главных героев. Тут можно вспомнить, что не существует хорошего перевода Гарри Поттера на русский (самый лучший — фанатский, но и он не полный), Толкиена переводят и так, и сяк.
Далее, что же переводим? Автор говорил про новости и публицистику — это не большие книги, проблем не будет.
Можно брать две нейросети: одна переводчик, другая редактор, а человек читает замечания редактора и принимает решение.