Адрес для входа в РФ: exler.wiki
Рейтинг различных сервисов машинного перевода
Международный независимый бенчмарк DiBiMT – это эталонный тест для измерения процента ошибок в переводах. Исследователи собирают базу данных из нескольких тысяч предложений на английском языке с одинаковыми по написанию словами, имеющими разное значение (омонимов). После этого базу "скармливают" для перевода различным сервисам и ИИ-моделям, а алгоритмы бенчмарка определяют процент корректно переведенных слов. Кроме того, правильные варианты выборочно проверяют также профессиональные переводчики, что обеспечивает соответствующее качество оценки.
На основе этих показателей был сделан данный рейтинг. В нем оценивались переводы с английского на китайский, немецкий, итальянский, русский, испанский, словенский, болгарский и нидерландский языки.
Первая пятерка для переводов с английского на испанский.
А вот первая пятерка переводов с английского на немецкий. Тут DeepL вырвался вперед.
Первая пятерка для переводов с английского на китайский.
Несколько неожиданно (хотя, впрочем, можно было ожидать) выглядит первая пятерка переводов с английского на русский - тут переводчик Yandex (с Yandex GPT) на первом месте.
Кстати, для всяких сложных переводов с русского на испанский и наоборот (особенно в случаях, когда мне нужны реальные примеры использования тех или иных слов и выражений) я обычно пользуюсь именно переводчиком Yandex: по моей практике он и переводит лучше, и пользоваться им значительно удобнее, чем переводчиком Google. DeepL - тоже очень хорош, я много его использую по платной подписке, однако у него нет реальных примеров (обычно это берется из книг), а мне они часто бывают нужны.
А вы какими переводчиками для каких языков пользуетесь?
Недавно Невзорова спрашивала в посте на канале Глебыча.
Всех кто может, а не просто хочет помочь, просьба писать в наш чат «Наповальство» по ссылке в шапке. Присылайте готовые варианты видео или кусочки.
Нужно срочно и на волонтерских началах. Если мы это не организовали ранее, тот это только потому, что средств на это у нас нет.
(Ни госдеп, ни Украина нам не платят, грантов не получали и не получаем).
Ждем, это важно.
Админ Невзорова Лидия
В чате набросали:
Первые две совершенно бесплатны, остальные просят вполне внятных денег, если еще и API то минимальных 5$ хватит на пол года переводов
[2] Титры нужно еще писать тогда самому, подгонять под видеоряд.
Быстрее на оутсорс нейронками это дело отдать. Потратить три часа: видео боту в ТГ кинул -> транскрибируется -> переводится -> озвучивается на нужных языках и добавляются титры- > кладется в папку + помечается в таблице -> заливается на ютьюб.
Это будет быстрее чем я этот текст написал
[3] Бесплатный Qwen, DeepSeek, API Gemini при чем последних два с make отлично работают, вообще на изи прикрутить транскрипцию+ перевод.
Сервис elevenlabs.io
Тестовая версия до 5 минут - голос индуса, осень странно на выходе.
Можно клонировать голос, платная подписка и в объемах видосов на канале нужна версия PRO за $99
Второй сервис - какой-то кривой.
veed.io
А что еще есть?
Еще вот этот сервис хорош на транскрибирование - turboscribe.ai
Русский, английский и другие.
Я время от времени беру заказы на сложные переводы. Преимущественно английский-тайский и английский-русский.
Claude 3.5 Sonnet рвет всех по этому списку, как тузик грелку. Даже сравнивать нельзя.
Естественно, если просто написать 'переведи на английский' фигня получится у всех LLM.
Поэтому затраты времени на перевод, например, одного авторского листа специализированного текста выглядит так:
• 40-60 минут составление и отладка промпта
• пару минут перевод
• 20-60 минут проверка и редактирование.
• 40-60 минут составление и отладка промпта
• пару минут перевод
• 20-60 минут проверка и редактирование.
Ниже alexplusplus писал, что тюнит модель для улучшения перевода. В вашем случае это тем более может иметь практический смысл.
Авторский лист = 40 тысяч знаков с пробелами.
Есть некий xml файл, который содержит перевод для программы. Для каждого языка — свой файл. Есть у меня такой файл для русского языка, где все служебные поля на английском. И вот мне нужно: чтобы всё английское осталось, как есть, а все русское перевелось на другой язык. Реальный кейс, год назад мучил все доступные ИИ, никто не справился. А что сейчас, куды бечь? Количество строк — порядка 25к, если это важно.
Во вторых, за год появилось много новых моделей ИИ. Наверняка кто-то из них может справиться. Опять же вопрос, какой промпт использовался, насколько он качественный. Надо дальше пробовать.
В третьих, можно попробовать написать простой питоновский скрипт, который пройдет по всем тэгам, возьмет контент каждого тэга, дернет АПИ переводчика или ИИ и переведенное значение сохранит в новом файле в этом же тэге. Для написания питоновских скриптов рекомендую cursor.com. Понадобится время что бы разобраться (если раньше не было релевантного опыта), но это полезный навык который останется навсегда.
Какое-то время назад часто был нужен шведско-английский перевод - Google Translate был очень приемлемым.
Reverso хорош тем, что кучу реальных примеров приводит, по котором понимаешь, что же в итоге правильно. Для этого надо переведить короткие фразы. Длинные тексты как-то не было необходимости пока.
Ну и несколько раз пользовался, чтобы самому проверить, можно ли у них узнать правильный перевод фразы/словосочетания, которую я тут в блоге оставляю без пояснений, понимая что ~99% не просто прошедших мимо забьют её в Гугл или в ДипЛ.
Переводил статьи с совершенно незнакомых языков, полностью осознавая, что в результате многое переврано, вплоть до смысла наоборот.
А так, "in production", так сказать, я часто пользуюсь multitran.com, он лучше других известных словарей может подсказать чуть ли не все возможные переводы слова, иногда синонимы; опять же, для поиска синонимов, я просто гуглю "искомое-слово синоним" на нужном языке и натыкаюсь на хорошие сайты для этого.
ИИ я пока что не пользовался никаким, ни для чего.
И мне легко было так отвечать на тот вопрос, как человеку, у которого русский, английский и немецкий где-то на уровне C2, по степени "простоя опыта" то чуть ниже по факту, то чуть выше, а с испанским я сдал три экзамена-ступени по онлайн-курсу на все "отлично", но опыта использования мало, в лучшие времена сам бы не оценил бы выше средненького B2 на понимание и B1 активно, а с тех пор не удаётся уделять достаточно (да хоть сколько-то) времени. А на украинском я хоть активно могу и употребить всего несколько общих предварительно заученых фраз, поддержать с ошибками короткий разговор на улице, но например мюнхенскую речь Зеленского понял целиком без заглядывания в словари, Юрия Великого, когда он шутит тоже с неологизмами и сленгом, онлайн-мемы и подобное обычно понимаю правильно. Читая новости и цитируемые тут в комментах законы (редко, на самом деле, а когда уже знаю о чём речь или неинтересно - пропускаю), не помню уже, когда в последний раз в словарь лез.
Не у всех есть склонность к лингвистическому "задротству" и столь же богатые возможности ("выборки") для самообучения, что активного, что пассивного, как были у меня, даже не упониминая количество свободного времени, и я понимаю, что для многих это (переводчики/ИИ) очень ценные инструменты; уж какие на данный момент есть в наличии.
В связи с этим, у меня тоже есть вопрос: велика ли разница в качестве перевода бесплатным и платным вариантами одного и того же машинного переводчика? Любого, не только DeepL.
Я более-менее с английским знаком. мне изредка нужно перевод неизвестного мне слова узнать.
Ну и иногда приходится слово с русского (а то и с английского) на украинский переводить, я все же не в совершенстве его знаю.
У меня сейчас такой сценарий есть: перед просмотром фильма закинуть в чатХХ субтитры на английском и попросить выбрать из них наиболее сложные слова и речевые обороты и объяснить их мне. Тут я до конца не определился чем пользоваться - пользуюсь пока всем параллельно: джемини, дипсиком, о1. И готовлю массив примеров для файнтюнинга 4о под эту задачу.
Сценарий такой же как описал в своем посте - закидываю субтитры и прошу выбрать и объяснить все самое вкусное из них, что бы в процессе просмотра фильма меньше спотыкаться.
Или вы после первого разбора еще раз корректируете при помощи GPT‑4o? Как-то слишком глубоко и трудоемко получается… к тому же вы еще и платите за это.
Гугл-переводчик:
Put it on its butt.
Варианты: Put it on your butt. (Положите его себе на задницу.)
Put it on the bottom.
DeepL:
Put it on the butt.
Reverso:
поставить на попа.
поставить на
to put on bet on placed on put the put it on
попа
pop priest Pope bum bottom
Яндекс:
Put it on your ass
ЗЫЖ "Put it on Padre".
Вот Claude:
В английском языке выражение «поставить на попа» можно перевести как "to stand (something) upright" или "to set (something) on end". Эти фразы используются, когда объект ставится вертикально, на свой торец или узкую сторону.
Например:
He stood the box upright - Он поставил коробку на попа
The barrel was set on end - Бочка была поставлена на попа

upd: у меня нет 110 Gb ОЗУ для полноценной Gemma 2, поэтому я запустил квантованную (gemma-2-27b-it-Q8_0.gguf). На скриншоте можно посмотреть потребление. Скорость ответа — чуть больше двух токенов в секунду. Это где-то минута на абзац.
Квантование, конечно, вносит свои коррективы в качество ответа. Так, например, она может начать отвечать на русском, а потом перейдет на английский. Просьба отвечать только на русском, зачастую игнорируется.

Я так понимаю на столбец Miss в этом рейтинге стоит обращать пристальное внимание.
По опыту - ИИ-чаты рулят. Клод и Дипсик часто дают варианты лучше, но только GPT обучаем.
По опыту для себя определил, что для более качественного перевода, лучше выбирать переводчик родом из той страны, язык которой используется в одном из направлений перевода. Например, для русско-польского или русско-украинского — Яндекс подойдет лучше.

До сих пор пользуюсь если надо.



Возьмем, например, выражение «торговая точка», которое в зависимости от контекста будет по-разному переведено на английский.
ChatGPT, объясняет:
1️⃣ Контекст розничной торговли (магазин, киоск)
Пример: «В нашем районе открылась новая торговая точка с фермерскими продуктами.»
Перевод: "A new retail outlet with farm products has opened in our neighborhood."
✅ Здесь "retail outlet" указывает на магазин или киоск как физическое место продажи.
2️⃣ Контекст бизнеса и франчайзинга
Пример: «Эта компания расширяет сеть своих торговых точек по всей стране.»
Перевод: "This company is expanding its chain of sales points across the country."
✅ В данном случае "sales points" акцентирует внимание не на физическом магазине, а на местах реализации продукции в масштабах сети.
3️⃣ Контекст электронной коммерции (онлайн-продажи)
Пример: «Теперь торговая точка этой компании работает и в интернете.»
Перевод: "Now this company operates an online storefront as well."
✅ "Online storefront" подчеркивает, что речь идет о цифровой платформе для продаж, а не о физическом магазине.
С другой стороны,"(пластиковая) пленка для пищевых продуктов" - слишком длинно. И как быть?
Надо будет попробовать Яндекс - спасибо за наводку.