Адрес для входа в РФ: exler.world

Голосовой переводчик в Skype

24.10.2016 12:04  8559   Комментарии (44)

Некоторое время назад компания Microsoft запустила в Skype тестовую версию автоматического перевода - как для сообщений, так и для разговоров. Соответствующая пиктограмма появилась в правом верхнем углу, там функцию перевода можно активировать для каждого абонента, указав при этом, на каком языке общаетесь вы и на каком абонент.

В технических изданиях, авторы которых в курсе современного состояния дел с машинным переводом, об этой новости писали очень спокойно, потому что понимали, что тут не только никакой "революции" не произошло, но и говорить о нововведении можно разве что только как об игрушке, в которую поначалу немного поиграются, а потом забросят ввиду почти полной непригодности.

Зато в глянцевых изданиях и в телевизоре понеслась разлюли-малина из серии "больше не нужно учить иностранные языки", "все границы общения стерты", "профессия переводчика стала невостребована" и прочая полнейшая чушь.

Мне как бы наплевать на все это, однако друзья и родственники начитались и наслушались передач на данную тему и теперь всерьез считают, что этим автоматическим переводчиком можно пользоваться.

Ну, ладно, решил посмотреть, как это все работает. Сначала погонял автоматический перевод чата - это проще всего.

С одной стороны - русский, с другой - испанский. Получается обычный машинный перевод. Цитирую из пресс-релиза MS:

В отличие от других переводчиков, данный сервис переводит не отдельные слова, а целиком предложения, учитывая морфологию и принцип построения фраз.

Так вот. Во-первых, морфологию и принцип построения фраз переводчик Google начал учитывать минимум лет за пять до того, как был написан данный пресс-релиз. Во-вторых, да и Google до сих пор все это дело учитывает более чем криво, а уж у MS переводчик еще более примитивный (ну, оно и понятно). Что в итоге получается? Простейшие идиомы не понимает (фраза сверху - "¡A tomar por culo!"; впрочем, Google ее еще круче переводит - "Для того, чтобы задницу!"), элементарнейшие фразы, как правило, переводит нормально, как только текст чуть сложнее - уже плывет или совсем уплывает. Какая-то морфология тут проявляется крайне редко. У Google с этим делом, кстати, слегка получше.

Так что, как обычно с машинными переводчиками, все это дело можно использовать для понимания хотя бы общего смысла, однако тут все сильно зависит от исходного текста. Простейшие тексты - да, можно понять, но когда текст уже более сложный - начинаются проблемы. А если собеседник будет использовать всякие идиомы, сокращения, молодежный сленг и так далее - все это превращается в совершенно нечитаемую кашу.

Ну, в общем, это знают все, кто более или менее плотно работал с машинными переводчиками.

Да, ну и еще, конечно, многое зависит от исходных языков. Потому что, например, английский-испанский и наоборот - работает намного лучше, чем английский-русский/русский-английский.

Но с переводами чатов - и так все понятно. Мне интересно было попробовать широко разрекламированную возможность автоматического голосового перевода. Но вот тут началась веселуха. Потому что тут распознавалка голоса работала, мягко говоря, очень криво.

Для чистоты эксперимента сначала мы включили просто распознавание с русского на русский. Программа пыталась понять, что мы говорим, и выдавала это в виде текста. Разговор получился, как видите, более чем содержательный.

А это уже с той стороны идет испанский, который распознается и делается перевод на русский. Красота!

Ну, в общем, если с чатом еще туда-сюда, то с переводом с голоса - вилы полные и прежде всего - из-за системы распознавания, которая работает очень криво. Что странно: у того же Google клавиатурная распознавалка работает более или менее пристойно, я ее иногда использую, когда текст совсем простой.

Так что тут о переводе живого текста не может быть и речи. Ну, конечно, кроме ситуаций, когда вы просто хотите чисто поржать. Потому что очень кривое распознавание, а потом еще и очень кривой перевод-подстрочник - на выходе будет только Чак в Бразилии и лыжи Бога, я понимаю.

По Сети в рекламных целях гоняют всякие смешные ролики, вроде того, с детишками, где англоговорящая девочка легко объясняется с испаноговорящей. Ну, таких роликов, как вы понимаете, наснимать можно хоть тыщу, делов-то. Более того, если долго посидеть, то можно составить, например, испано-английский диалог, в котором переводчик будет работать почти идеально. Если очень-очень долго посидеть. Но для живой речи - пока вообще никак. А уж радостные ролики про беседы англоязычных с китайцами - это, конечно, ржачка полнейшая.

Да вы сами попробуйте, это все довольно забавно.

24.10.2016 12:04
Комментарии 44

Да не нужно никакого смысла понимать. что за бред. Нужно переводить, и все. Программа, которая в го ирает, она что, проникает в смысл игры? Просто естественный язык - это многомерное пространство гораздо шире, чем шахматы и го. Ну и что? Подождем еще лет 50, все получим.
24.10.16 23:48
0 0

Вот, кстати, свежая новость про термояд:

"30 сентября, в 9:25 ученые и инженеры центра изучения плазмы Массачусетского технологического института сделали шаг вперед в погоне за чистой энергией. Команда установила новый мировой рекорд по давлению плазмы в токамаке Alcator C-Mod. Давление плазмы является ключевым элементом для производства энергии в процессе ядерного синтеза, новый результат MIT достиг более 2 атмосфер.

Пресс-служба MIT "

Так что дело движется потихоньку
24.10.16 22:14
0 0

dmitri: Так что дело движется потихоньку


news.mit.edu



Я так понимаю, это отсюда. Молоцы, что работают. Конечно, полезно ставить достижимые задачи. О количестве энергии на выходе я не нашел, только пишут, что давление -- 2/3 задачи. Надеюсь, это так. Часто трудность задач нелинейна, и смотря как сформулировать... Можно сказать, что долететъ до Марса -- 50% задачи. По затратам, и сложности, полет обратно -- самое трудное (не помню чисел... 99%?), а не 50%. Т.е. вторая половина в 50 раз сложнее первой. 😄
25.10.16 00:17
0 0

Как раз с распознаванием речи проблем огромных нет. Проблемы есть с переводом. Чтобы переводить любой текст, нужно его смысл понимать и все подтексты. Для этого нужен интеллект сравнимый с человеческим. Достичь этого - дело далеко не пяти лет
24.10.16 19:33
0 0

Xebec: Чтобы переводить любой текст, нужно его смысл понимать и все подтексты. Для этого нужен интеллект сравнимый с человеческим. Достичь этого - дело далеко не пяти лет

Именно. Только системы искусственного интеллекта, иначе никак.
24.10.16 19:54
0 0

Я, несомненно, рискую нарваться на ведро сарказма от яблокофобов, но думаю, что распознованием голоса в 10 иосе весьма приличное. Проверил это случайно на голосовых сообщениях. Качество распознавания очень высокое. Если сообщение оставляет носитель языка. Но пока спотыкается на индусах, что странно, учитывая рассовый состав разработчиков.
24.10.16 19:22
0 0

Ну понятно что скептиков хватает. Да, prompt все помним, кому за...



Дело в том чтобы перевести фразу, нередко (а то всегда) нужно понять смысл. Это думаю отрицать не будем? Вот как раз в слове "понять" и начинаеться все, т.к. это уже упирается в проблему AI.



AI в узкоспециализированных областях уже дает неплохие результаты - тот же распознаватель речи например. За последние 10 лет - очень серьезный сдвиг.


24.10.16 17:55
0 0

баннеры: скоростной английский за 5 уроков. sic!

english.metland.me
24.10.16 18:18
0 0

Пока не сделают спелчекер, способный исправлять -тся/ться - не поверю, что компутерная программа может достойно переводить с одного языка на другой. В новостях-то уже несколько лет постоянно: "ИИ написал рассказ, победивший на конкурсе", "ИИ затроллил группу ватников", "ИИ научился раскрашивать чёрно-белые картинки"... Но по-прежнему интернет переполняют "не нравиться - не читай" и "книга, вообщем, не плохая".
24.10.16 16:09
0 0

Qualcuno:
Пока не сделают спелчекер, способный исправлять -тся/ться - не поверю, что компутерная программа может достойно переводить с одного языка на другой.


А если сделают для языков без -тся/ться, а на последние вообще забьют, тоже не поверите?
24.10.16 17:24
0 0

Когда стоишь в очереди на кассу в каком-нибудь московском Ашане, кажется, что покупатели вокруг так и разговаривают, как у Алекса в диалогах на картинках. Может, Microsoft для них делал переводчик? 😄
24.10.16 15:44
0 0

napie: Когда стоишь в очереди на кассу в каком-нибудь московском Ашане, кажется, что покупатели вокруг так и разговаривают, как у Алекса в диалогах на картинках. Может, Microsoft для них делал переводчик?

Морфеус, ты как здесь?
26.10.16 09:49
0 0

Ха! Немедленно вспомнилась история, когда мне, студенту третьего курса переводческого факультета, уже в 1999 году старательно объясняли, что я учусь на "мёртвую профессию" и что уже через десять лет электронные переводчики полностью заменят живых.
24.10.16 14:56
0 0

При всем при этом MS рапортует что их система распознования голоса достигла уровня понимания человека 96%, вот новость из СМИ:

geektimes.ru

Константин Игоревич: При всем при этом MS рапортует что их система распознования голоса достигла уровня понимания человека 96%, вот новость из СМИ:



https://geektimes.ru/post/281652/

Читал. Позволил себе не поверить.

Все эти тестирования переводилок почему-то всегда стремятся к известному анекдоту про японскую бензопилу и сибирских мужиков 😉 Очевидно же, что пробовать их надо на диалогах "Вася, привет! Это Джон. Джон, здорово! Как дела? Когда приедешь, куда пойдем? Дела нормально, приеду тогда-то. Может быть, съездим в Питер и погуляем по окрестностям?" Вот для чего они сделаны и для чего их нужно применять, а не пытаться обсуждать жизнь, вселенную и все остаольное. Для этого нужно самому язык учить. Но я не могу выучить все языки, а надо и с китайцем Ляо иногда договориться, где встретиться.
24.10.16 13:07
0 0

>возможно, после того, как лыжи Бога, я понимаю...

>еще одна крем ее водит другой язык. Вы.

Великолепно! запомню эти коаны! ))
24.10.16 13:06
0 0

Deathtiny: Еще лет через 5 - уже real-time разговорный язык подтянеться.  

invisible999( 24.10.16 13:04 )

Это врятьли (с) тов. Сухов
24.10.16 14:06
0 0

Ничего, прогресс немалый за последные несколько лет. Текстовый перевод несложных (например газетных) текстов сколее всего будет вполне читабельный лет через 5. Еще лет через 5 - уже real-time разговорный язык подтянеться.
24.10.16 13:04
0 0

invisible999: Еще лет через 5 - уже real-time разговорный язык подтянеться.  


Я думаю, умение писать ться тся у людей быстрее подтянется.

Главное не сам перевод, а распознавание звуков. Перевод набитых текстов работал уже в конце 90-х, что можно было примерно понять, о чем речь идет.

Я бы сказал -- позорище. Artificial Intelligence my ass.
24.10.16 13:07
0 0

invisible999:
Ничего, прогресс немалый за последные несколько лет. Текстовый перевод несложных (например газетных) текстов сколее всего будет вполне читабельный лет через 5. Еще лет через 5 - уже real-time разговорный язык подтянеться.


Только за десять лет можно три-четыре языка самому выучить
24.10.16 13:15
0 0

invisible999:
Ничего, прогресс немалый за последные несколько лет. Текстовый перевод несложных (например газетных) текстов сколее всего будет вполне читабельный лет через 5. Еще лет через 5 - уже real-time разговорный язык подтянеться.


Да-да, это последние лет 25 мне рассказывают.
24.10.16 14:43
0 0

invisible999:
Ничего, прогресс немалый за последные несколько лет. Текстовый перевод несложных (например газетных) текстов сколее всего будет вполне читабельный лет через 5. Еще лет через 5 - уже real-time разговорный язык подтянеться.


неисключено подтянется за счет изменения текста в сторону более пригодного для перевода
24.10.16 14:54
0 0

invisible999:
Ничего, прогресс немалый за последные несколько лет. Текстовый перевод несложных (например газетных) текстов сколее всего будет вполне читабельный лет через 5. Еще лет через 5 - уже real-time разговорный язык подтянеться.


Посмеялся, спасибо! Мне об этом ещё семнадцать лет назад об этом навешивали 😄
24.10.16 14:58
0 0

invisible999:
Ничего, прогресс немалый за последные несколько лет. Текстовый перевод несложных (например газетных) текстов сколее всего будет вполне читабельный лет через 5. Еще лет через 5 - уже real-time разговорный язык подтянеться.


Такие же прогнозы десятилетиями крутятся вокруг сильного искуственного интеллекта и квантовых компьютеров. Они все будут "завтра", ага...
24.10.16 15:40
0 0

А в том диалоге с русского на русский что реально говорилось никак нельзя посмотреть? А то что-то догадалка отказывает...
24.10.16 12:53
0 0

Qualcuno:
А в том диалоге с русского на русский что реально говорилось никак нельзя посмотреть? А то что-то догадалка отказывает...


Увы, это только звук можно было записать.
24.10.16 12:58
0 0

С английским языком работает хорошо по очень простой причине - он выбран в качестве базового языка. Поэтому, при переводе с испанского на русский и обратно, на самом деле имеем цепочку испанский - английский - русский в одну сторону, и русский - английский - испанский в другую. С соответствующим результатом 😄
24.10.16 12:51
0 0

sambl4:
С английским языком работает хорошо по очень простой причине - он выбран в качестве базового языка. Поэтому, при переводе с испанского на русский и обратно, на самом деле имеем цепочку испанский - английский - русский в одну сторону, и русский - английский - испанский в другую. С соответствующим результатом


А тогда всегда будет такой результат, что очевидно 😉


24.10.16 12:58
0 0
Теги
Сортировать по алфавиту или записям
BLM 21
Calella 143
exler.ru 272
авто 442
видео 3997
вино 359
еда 500
ЕС 60
игры 114
ИИ 29
кино 1581
попы 191
СМИ 2760
софт 930
США 132
шоу 6