Адрес для входа в РФ: exler.wiki
Закадровый перевод англоязычных видео
Яндекс таки запустил сервис автоматического закадрового перевода англоязычных видео в Youtube и Vimeo.
Пользователям "Яндекс.Браузера" и в мобильных приложениях стал доступен закадровый перевод видео с английского языка. Поддерживаются как мужской, так и женский голос, сообщается в пресс-релизе "Яндекса".
Перевод происходит в несколько этапов. Сначала ИИ распознает речь, превращает ее в текст и с помощью нейросетей разбивает на предложения. Потом определяет пол говорящего, переводит предложения на русский язык и синтезирует голос. Остается совместить перевод с видеорядом. Это совсем не тривиальная задача, потому что в русском языке предложения длиннее, чем в английском. Здесь на помощь снова приходят нейросети.
Поэтому процесс перевода занимает несколько минут - для этого нужно поставить видео на паузу и подождать. Как только все будет готово, пользователю придет соответствующее уведомление.
Согласно заявлению компании, поддерживаются любые англоязычные видео на YouTube, Vimeo и других популярных платформах. Перевод доступен в "Яндекс.Браузере" для Windows, macOS, Linux и Android и в мобильном приложении для Android и iOS. (Отсюда.)
В Яндекс.Браузере при просмотре англоязычных роликов на соответствующем сервисе появляется вот такая надпись.
Если нажать на кнопку включить, то может сразу пойти автоматический перевод, а может появиться вот такая надпись, и тогда придется подождать, прежде чем перевод будет готов.
Погонял разные ролики. Вообще очень прикольно и прямо-таки впечатляет. Понятно, что лучше всего включать перевод на сольных выступлениях, ну и понятно, что там будет немало всяких огрехов (это совершенно неудивительно), но в общем и целом понять смысл того, о чем говорится - вполне можно. И это круто!
Заметно хуже, когда разговаривают несколько людей и еще друг друга перебивают, но и с таким вариантом сервис более или менее справился.
«То, что я вижу и слышу в ролике - это даже рядом никакой не "автоматический перевод"». www.exler.ru
«Угроза инфраструктуре в масштабах страны». «Ведомости» сообщили о крупнейшей кибератаке в истории рунета — на «Яндекс»
:)
А над сложными кусками (хорошему) переводчику и самому интересно поколдовать.
Впрочем, я думаю, что даже самый ленивый и тупой переводчик книг не будет пользоваться автопереводом, чтобы мы наслаждались "Мы только что сделали это!" (We just did it!)
Ну или ты приведешь пример абзаца на страницу, пускай даже из Кинга, где "рутину" на себя возьмет нейросеть.
Для устного перевода (который мы сейчас обсуждаем) все это вообще не работает. Каким боком связывать свой замечательный кусочек перевода и синтезированный голосовой перевод?
Т.е. хорошему переводчику машинный перевод нужен, как протез ноги здоровому бегуну, ИМХО. А вот если совсем язык не понимаешь - то тут даже несовершенный автоматический переводчик вполне помогает.
По моему опыту: машинный перевод переводчику на фиг не нужен. Но он очень полезен для тех языков, которые либо не знаешь совсем (но тут есть опасность, может перевести ровно наоборот), либо знаешь, но хреново.
www.bbc.com
//*******************
The ministry said Zinichev, 55, had died in Norilsk while trying to save someone's life.
A cameraman had fallen off a cliff during an interview, according to Margarita Simonyan, the head of Russian broadcaster RT.
"He and the cameraman were on the edge of a cliff. The cameraman slipped and fell into the water," she said.
"Zinichev rushed after the fallen man and died after hitting a protruding rock." The cameraman, later named as film director Alexander Melnik, 63, also died.
//**************
Министерство сообщило, что 55-летний Зиничев погиб в Норильске, пытаясь спасти чью-то жизнь.
По словам Маргариты Симоньян, главы российской телерадиокомпании RT, оператор упал с обрыва во время интервью.
"Они с оператором были на краю обрыва. Оператор поскользнулся и упал в воду", - сказала она.
"Зиничев бросился за упавшим человеком и погиб, ударившись о выступающий камень". Оператор, которого позже назвали кинорежиссером Александром Мельником, 63 лет, также погиб.
Переведено с помощью www.DeepL.com/Translator (бесплатная версия)
Беда неопытного переводчика - невнимательность. Ну и, соответственно, не надо садиться за перевод, если не в состоянии перевести текст сам. Раньше живые переводчики легко могли проморгать идиому, упустить контекст... С такой подпоркой больше внимания уйдёт деталям и качеству языка. Ну и интенсивней обогащается словарный запас.
Мы не могли представить, что можно получить не Prompt. Ага... И 20 лет не прошло.
Ещё помню, как японисты свой компьютерный словарь составляли, используя англо-японскую базу + англо-русские словари. Почти за год справились.
Ознакомившись с результатом, понимаешь, что курс на удешевление работы переводчика, таки, неизбежен.
Михо Миядзаки из AKB48 появилась в качестве гостя на эстрадном шоу TBS "Akko ni Omakase! в качестве гостя. Это отличный способ убедиться, что вы получаете максимальную отдачу от своего бизнеса.
Я не уверен, слышали ли вы об этом, но уверен, что слышали. Но дальше все зависит от вас. Если я вижу, что кто-то из участников ест ланч-бокс, я немного отодвигаюсь или ем молча. Но даже если я осторожен, если я один (в Короне), в группе много людей", - сказал он, говоря о трудностях групповых занятий.
Если у вас возникнут вопросы или комментарии, пожалуйста, обращайтесь к нам.
Я не знаю, что из этого делать. Единственное, что мы можем сделать, - это мыть руки, дезинфицировать, полоскать рот и дистанцироваться от вируса", - сказала она.
Переведено с помощью www.DeepL.com/Translator (бесплатная версия)
И речь скорее не об удешевлении услуг переводчиков, а о сокращении их числа до небольшого круга настоящих профессионалов. Ибо уже сейчас машинные алгоритмы переводят лучше тех, кто считает, что перевод — это просто заменить одни слова на другие.
А так оглянешься через много лет, и выясняешь, что большую часть развлекательного контента перевели любители, энтузиасты и "натасканные" школьники за очень маленькие деньги, или вообще бесплатно. Так неужели работодатели откажутся от такой халявы?
Ну, наняли Голышева на перевод Поттера. Заплатили. А ему "мальчик не нравится". Чтоб ему умирать, как этот перевод читается.
А просто: дать ему перевести отрывок из любого фильма Гая Ричи.
«If so, then surely, because this is what it is. But concerning anyone - here you are!
Х/ф "Формула любви"
Ну и недавно стали приходить слова из английского, но тут чуть похуже из-за того, что испанский и русский их переиначивают каждый под себя.
У меня испанский "окказиональный", я когда то его учил, но в обычной жизни ни фига не помню кроме того самого "уна сервеза". Активируется он, когда мне приходится месяц и дольше жить в стране, где понимают только испанский (последний раз Чили). К началу второго месяца я уже более менее на бытовые темы общаюсь, с чудовищным количеством ошибок, конечно.
Согласные, кроме билабиального б/в, вполне легко воспринимаются русским ухом, даже не смотря на некую шепелявость звука "с".
P.S. В изучении он мне показался намного легче английского.
¿
Когда синтезатор речи (например, та же Алиса) ошибается при зачитывании русского текста, это объясняется тем, что она не поняла значение слово из контекста. Но здесь у нейросети ведь есть оригинал слова - и это явно wine, а не guilt. То есть при переводе "wines of Bordeaux > вина Бордо > озвучка" не учитывается информация о типе склонения / падеже, что довольно странно, учитывая, насколько продвинулись сегодня системы перевода.
ИИ тоже не существует, это просто много if... else
— Ну, конечно!
— И что они возникают среди мельчайших облачков электронов?
— Ты же отлично знаешь об этом.
— И что феноменология рассветов, закатов, кровавых войн объясняется сопряжением переменных сущностей?
— Но ведь так оно и есть!
— А разве мы сами, если нас исследовать методами физическими, химическими, логическими, не представляем собой те же пляшущие облачка электронов? Положительные и отрицательные заряды, вмонтированные в пустоту? И разве наше бытие не является результатом столкновений этих пляшущих частиц, хотя сами мы воспринимаем коленца молекул как страх, желание или раздумья? И что же еще творится в твоей голове, когда ты мечтаешь, кроме двоичной алгебры переключений и неустанных странствий электронов?
— Клапауцик ты мой! Ты отождествляешь наше бытие с бытием того запертого в стеклянном ящике лжегосударства?! — закричал Трурль.
— Неумелый подражатель, возжаждав пыток, сделал бы себе бесформенного идола из дерева и воска и, придав ему некоторое сходство с разумным существом, издевался бы над ним суррогатно и неестественно. Но подумай, к чему ведет дальнейшее совершенствование этого замысла! Представь себе, что другой сделает куклу с граммофоном в животе, чтобы она стонала под ударами; представь себе куклу, которая, если ее бить, будет молить о пощаде, куклу, которая станет гомеостатом; представь себе куклу плачущую, истекающую кровью, куклу, которая боится смерти, хоть и прельщается ни с чем не сравнимым ее спокойствием! Неужели ты не видишь, как мастерство подражателя приводит к тому, что видимость становится истиной, а подделка — действительностью?
— Все это софизмы! Подданные этого негодяя Экзилия действительно подвергаются пыткам и казням, хнычут, дерутся, целуются, но оттого и потому, что я соответствующим образом сочетал параметры, а о том, чувствуют ли они что-нибудь при этом, ничего неизвестно, Клапауций, потому что ничего тебе об этом не скажут электроны, пляшущие в их головах!
— Если б я тебе голову разбил, тоже ничего не увидел бы, кроме электронов. Ты, наверное, притворяешься, будто не видишь того, на что я указываю...
(c) Станислав Лем
Во-вторых, как филолог могу с уверенностью сказать, что для большинства словарных слов уже давно составлены соответствующие орфоэпические парадигмы. Существует система склонений Зализняка, которая учитывает не только "текст" (то есть буквенные сочетания, как в школе), но и ударения. Учитывая, что омографы в русском языке очень распространены (начиная с популярного примера "зАмок - замОк" и заканчивая разными падежными формами одного слова), логично было бы при синтезе речи не "тупо перегонять в текст", а учитывать орфоэпическую норму и смотреть, от какого слова образована падежная форма (в нашем случае определить, что в основе слово "вино", а не "вина" — не так сложно, для этого не надо думать "как человек").
В общем-то я уверен, что Яндекс это доработает, просто сегодня с утра именно этот момент обратил на себя внимание и больше всего резал уши, когда я слушал ролик про Бордо 😄
Да позволяет общий смысл понять для незнающего, для интермедиейта позволяет рутину снять, что-то уяснить на экзотическом языке - уже земной поклон.
При определении задачи как AI-полной, подразумевается, что она не может быть решена простым алгоритмом, таким, например, какой использовался в «Элизе». Примерами AI-полных задач можно считать компьютерное зрение, понимание естественного языка[1], прохождение теста Тьюринга[3]. Эти задачи легко решаются человеком (некоторые даже описаны в терминах человеческого поведения), но любая из них, по сути, представляет собой сложнейшую систему отношений человеческих понятий. Некоторые компьютерные системы могут решать сильно упрощённые вариации этих задач, но в полной мере они пока не могут быть решены.
Ну-ну
Дважды перевёл одну и ту же сцену в двух разных роликах.
- I love you, I always have.
Результат:
- Я люблю вас, я всегда так делал.
- Я люблю вас, у меня всегда есть вы.
Есть еще над чем поработать. Ну и до выбора "ты" или "вы" нейросети еще не дорасли.
***
Зачем мы перешли на "ты"?
За это нам и перепало -
На грош любви и простоты,
А что-то главное пропало.
***
между собой они говорят на ты - you
Вы вообще в курсе истории этого слова?
- Alright.
- Как ты это делаешь?
- Всегда правой.
— How much watches?
— Ten clocks.
— Such much?
— For whom how…
— MGIMO finished?
— A-a-a-asking!..
Which watch?
Ten watch.
Such much?
Whom how.
Finished FeelFuck* (MGIMO, Fiztekh, InYaz etc.)?
Ask!
*(Филфак, сокр. филологический факультет)
Ну и кстати, те, «кто внимательно следит за тем, что происходит в мире машинных переводов» знают, что уже давно есть www.deepl.com где перевод делают нейросети. Попробуйте. Вы удивитесь насколько круто в этом деле продвинулись нейросеточки.
А в гугле перевод делают переводчики?
Не знаю что там у Гугла «под капотом» в его переводчике, но его переводы далеки от того результата, что выдаёт DeepL
Я погонял свои специализированные тексты через deepl и через google. Встречаются предложения, которые deepl сформировал лучше или точнее, но всё же google это делал явно чаще.
Вот пример:
Исходник:
"Recording of seismic waves from controlled sources provide information on the region that the waves travel through. If the density or composition of the rock changes, waves are reflected. Reflections recorded using Reflection Seismology can provide a wealth of information on the structure of the earth up to several kilometers deep and are used to increase our understanding of the geology as well as to explore for oil and gas. Changes in the travel direction, called refraction, can be used to infer the deep structure of the Earth."
deepl:
"Запись сейсмических волн от контролируемых источников дает информацию о регионе, через который проходят волны. При изменении плотности или состава породы волны отражаются. Отражения, записанные с помощью рефракционной сейсмологии, могут дать богатую информацию о структуре Земли на глубине до нескольких километров и используются для углубления нашего понимания геологии, а также для разведки нефти и газа. Изменения в направлении движения, называемые рефракцией, могут быть использованы для выводов о глубинной структуре Земли."
google:
"Регистрация сейсмических волн от контролируемых источников дает информацию о регионе, через который проходят волны. Если плотность или состав породы изменяется, волны отражаются. Отражения, записанные с помощью Reflection Seismology, могут предоставить обширную информацию о структуре земли на глубине до нескольких километров и используются для улучшения нашего понимания геологии, а также для разведки нефти и газа. Изменения направления движения, называемые рефракцией, можно использовать для определения глубинной структуры Земли."
Перевод гугла мне больше понравился. Как геофизик могу сказать... Именно "регистрация" данных, а не "запись". Опять же "обширную информацию" по мне звучит лучше, чем "богатую информацию". Да и "улучшения понимания" получше, чем "углубление понимания". Последнее предложение deepl перевел более дословно, но по смыслу гугл ближе - infer именно вскрыть то что под поверхностью, по сути определить структуру.
Но, опять же, достаточно было случаев, когда deepl был поточнее.
Но тут есть два возражения. Во-первых, сложно представить, что рассуждающий так человек слушает и читает японские произведения по-японски, арабские по-арабски, финские по-фински, польские по-польски и так далее. Поскольку освоить даже десять-двадцать языков большинство людей не в состоянии, остается либо закрывать глаза на мировую культуру и ограничиться только, допустим, английским - либо (сюрприз) прибегать к тому же старому доброму переводу, якобы отключающему моск.
И, во-вторых, англичане и другие англоязычные граждане, слушая и читая произведения на родном языке и не нуждаясь в переводе, не превращаются же в овощей и придурков из "идиократии" по этой причине?