ИИ и голосовой перевод
12.09.2023 09:00
17672
Комментарии (158)
ИИ всё крутеет и крутеет. В ленте стали попадаться переводы на различные языки кусочков из стримов известных персонажей, и там создавалось почти полное впечатление того, что это именно данный персонаж самолично говорит на другом языке - до того четко сохранялись и воспроизводились его интонации.
Порылся, почитал - таких сервисов уже несколько, один из лучших, судя по всему, это HeyGen Labs.
Зарегистрировался, засунул туда демонстрационный ролик со мной из недавней статьи в "Ликбезе", заказал для экзотики перевод на немецкий - зацените результат. Там и качество перевода, насколько я могу судить по другим языкам, вполне пристойное, а уж голос и интонации - совершенно мои. Да и в артикуляцию практически точно попадают - фантастика просто!
Войдите, чтобы оставить комментарий.
Когда уже кто-нибудь сделает видео с Путиным, где он говорит фразу Людвига Аристарховича: "Ай-ай-ай-ай! А кто это сдеееелал?!"
Есть сервис такой, где можно дать видео, и поменять/объединить с текстом? Очень надо! ))))
Есть сервис такой, где можно дать видео, и поменять/объединить с текстом? Очень надо! ))))
Хотел повторить. Залил ролик. Уже почти сутки жду результат. И там сейчас в обработке 90т роликов. Чувствую, это на надолго
Как никто не догадался оцифровать Михалева и Озерова. Благо, материала полно.
Как никто не догадался оцифровать Михалева и Озерова. Благо, материала полно.
Очередь где? Какое видео?
1) Делается "переговорка" или перевод нужного фильма человеком с хорошей дикцией и похожестью.
2) Делается обработка по технологии, по которой делают AI Covers.
Первая же ссылка:
1) Делается "переговорка" или перевод нужного фильма человеком с хорошей дикцией и похожестью.
2) Делается обработка по технологии, по которой делают AI Covers.
Первая же ссылка:
Как никто не догадался оцифровать Михалева и Озерова. Благо, материала полно.
Дастиш фантастиш.
Впечатлило!
Впечатлило!
Дастиш
Жаль не real-time. Переводчик в телефоне или в видеочате был бы просто революционным прорывом.
Мне кажется, или иногда говорит "вы" вместо "я" ?
А, понял: в оригинале, видимо, "обратите внимание," а перевело как "особо отметьте," хотя при таком выборе слов должно было быть "особо отмечУ".
А, понял: в оригинале, видимо, "обратите внимание," а перевело как "особо отметьте," хотя при таком выборе слов должно было быть "особо отмечУ".
Круто!
Подобные переводы очень хороши пока используется общеупотребительная лексика. При переводе специальных текстов со специфической терминологией уже все не так хорошо
No shit, Sherlock! 😄
Не надо врать, Алекс к Испанскому выучил Немецкий и хвастается))))
Где-то был подробный гайд по ИИ. Там было, как заменять голос в песне на другой. Например пестня SOD спетая Винни-Пухом ) Это какой-то запредельный уровень жонглирования ИИ )
Круто! 😄
Посмотрел. Качество перевода отличное, интонации вроде похожи, правда, сам голос мне показался несколько другим. Что касается артикуляции, то непопадание в неё в исходном ролике передано в переводе в точности, тут ИИ тоже оказался на высоте.
Что касается артикуляции, то непопадание в неё в исходном ролике передано в переводе в точности, тут ИИ тоже оказался на высоте.
Лучше всего ИИ удались обои.
Лучше всего ИИ удались обои.
И, будто узором прельщен,
«Мне нравятся очень… обои!» —
Сказал им и выбежал вон.
(c)
👍
Немецкая версия очень хорошая. Попадание в артикуляцию тоже просто супер.
Немецкая версия очень хорошая. Попадание в артикуляцию тоже просто супер.
Female dog меня убивает ) Это так сучка он переводит?
Это так сучка он переводит?
ЧатГПТ тоже принципиально не ругается
The word "bitch" is a derogatory and offensive term in English. It is often used to insult or demean someone, particularly women, in a disrespectful and hurtful manner. Using this word is considered impolite and disrespectful, and it can be offensive to many people.
It's important to choose your words carefully and use respectful and appropriate language when communicating with others. Using offensive language can harm relationships and lead to misunderstandings or conflicts.

ЧатГПТ тоже принципиально не ругается
Так задумано, чтобы детишки не пользовались, для забавы (перевода с ругательствами).
ЧатГПТ тоже принципиально не ругается
Вот сука!
Вот сука!
Так задумано, чтобы детишки не пользовались, для забавы (перевода с ругательствами).
Алекс а Ваше исходное видео на русском, и вроде как в описании ИИ написано что на входе он русский не понимает....Как получилось? )
Теперь ИИ и караоке в барах петь будет.
Ха... А я даже и не посмотрел, понимает он или нет, просто ролик залил. Значит, все-таки хорошо понимает, потому что переводит-то правильно, я друзьям из Германии показывал 😄
Обалдеть.
спасибо!
спасибо!
Да, хороший перевод.
А я ему залил на русском, он завис на 87.2%. Думал, дело в языке. Залил на английском с другого аккаунта. Так же висит на 87.2%. И даже отменить нельзя - нет такой опции. Фэйл 😒
А я ему залил на русском, он завис на 87.2%. Думал, дело в языке. Залил на английском с другого аккаунта. Так же висит на 87.2%. И даже отменить нельзя - нет такой опции. Фэйл 😒
Алекс а Ваше исходное видео на русском, и вроде как в описании ИИ написано что на входе он русский не понимает....Как получилось? )
(Не)кстати про ИИ. Я ищу софт для конвертации текста в речь. "Читалку", проще говоря, чтобы читала мне книжки вслух. Языки - английский (обязательно), польский и немецкий (желательно). Какие из существующих на рынке звучат наиболее натурально? Готова купить (заплатить один раз), но не готова платить абонплату. До сих пробовала только амазоновскую Алексу и это было ужасно, уши заболели минут через 5.
"Читалку", проще говоря, чтобы читала мне книжки вслух.
Без интонаций?
Чтобы звучало натурально.
Покупаю аудиокниги в Одибл. Есть, конечно, далеко не всё, что хочется, но растут по-тихоньку )
Покупаю аудиокниги в Одибл.
читалка нужна, чтобы слушать те, которых в библиотеке как раз нет.
у Киндл есть TTS
У продвинутых "читалок" обычных текстовых книг обычно есть чтение с помощью TTS (text-to-speech engine). Я в телефоне на Андроиде использую eReader Prestigio, это читалка с возможностью также использовать TTS. Но наверняка есть много подобных читалок.
TTS это отдельный компонент, у Гугла в Андроиде неплохой встроенный, на мой взгляд. Есть несколько женских и мужских голосов. Но можно купить и установить другие TTS движки, которые та же самая читалка сможет использовать вместо встроенного. Искать их можно прям по слову TTS, обычно бывает бесплатное демо с озвучкой произвольного текста, где можно оценить качество. Я сам другие не устанавливал, потому что меня устраивает встроенная гугловская. Она немного "механическая", но я быстро привык и перестал обращать внимание.
TTS это отдельный компонент, у Гугла в Андроиде неплохой встроенный, на мой взгляд. Есть несколько женских и мужских голосов. Но можно купить и установить другие TTS движки, которые та же самая читалка сможет использовать вместо встроенного. Искать их можно прям по слову TTS, обычно бывает бесплатное демо с озвучкой произвольного текста, где можно оценить качество. Я сам другие не устанавливал, потому что меня устраивает встроенная гугловская. Она немного "механическая", но я быстро привык и перестал обращать внимание.
Неужели однажды фильмы смогут дублировать не этими отвратительными голосами, читая текст "с выражением" и наделяя всех женских персонажей интонациями и голосами просто отвратительными, а мужских - отвратительными двух типов: "с хрипотцой" и "тенорок"!
Если смогут сохранить и тембр, и интонации, и манеру, и оттенки акцента, то тогда вот реально можно будет смотреть без субтитров
Если смогут сохранить и тембр, и интонации, и манеру, и оттенки акцента, то тогда вот реально можно будет смотреть без субтитров
Это вы еще не слышали, какими голосами дублируют фильмы в Турции!
это в той стране наверное, я слушать это не могу
в Украине давно все правильно дублируют -перевод негромко для передачи смысла нейтрально,
а передача интонации языком оригинала, кот не заглушается
в Украине давно все правильно дублируют -перевод негромко для передачи смысла нейтрально,
а передача интонации языком оригинала, кот не заглушается
Это вы еще не слышали, какими голосами дублируют фильмы в Турции!
... кот не заглушается
Такое поднимается с полноги двумя скриптами на локальной машине.
Такое поднимается с полноги двумя скриптами на локальной машине.
Такое поднимается с полноги двумя скриптами на локальной машине.
speech2text через whisper-модель.
speech2text через whisper-модель.
С вами, Алекс.
Вместо
"""
Зарегистрировался, засунул туда демонстрационный ролик со мной из недавней статьи в "Ликбезе", заказал для экзотики перевод на немецкий - зацените результат.
"""
два скрипта с виспером.
Вместо
"""
Зарегистрировался, засунул туда демонстрационный ролик со мной из недавней статьи в "Ликбезе", заказал для экзотики перевод на немецкий - зацените результат.
"""
два скрипта с виспером.
а губы он тоже синхронизирует?
С вами, Алекс.Вместо"""Зарегистрировался, засунул туда демонстрационный ролик со мной из недавней статьи в "Ликбезе", заказал для экзотики перевод на немецкий - зацените результат."""два скрипта с виспером.
Уже фильмы озвучивают. Если не знаешь, сразу и не скажешь, что ИИ.
А есть ли перевод на мандаринский китайский? Тогда текст в исполнении Алекса выглядел бы где-то так:
Вот. Переведите с помощью ИИ, наконец, этот ролик на русский.
На руский рязанский, руский вологодский или на руский краснодарский?
Вот сейчас Алекс как добавит в правила бан за "мат в видео"... 😄
Алекс, у HeyGen русского языка в списке источников не значится. Как?
Яндекс браузером или костылями можно уже не пользоваться?
Да и в артикуляцию практически точно попадают
Почему проверяешь на незнакомом языке? Почему не используешь знакомые языки?
Почему проверяешь на незнакомом языке? Почему не используешь знакомые языки?
Потому что так хочет Аллах и народ Рима.
Народ Рима взвыл бы от восторга, если бы Экслер заставил свою говорящую голову говорить сначала по русски, потом по английски, потом по немецки, испански, латыни, урду... Эффектно получилось бы.
по русски, потом по английски, потом по немецки
Эффектно получилось бы.
А ещё не появилось сервиса с ИИ / AI который определял бы по аудио / видео / фото оно настоящее или сгенерированное? Мне кажется запрос на такого рода сервис вполне очевиден.
сервиса с ИИ / AI который определял бы по аудио / видео / фото оно настоящее или сгенерированное?
Сервис Aiornot Дороничева.
Баловался с картинками - определял точно.
Баловался с картинками - определял точно.
Скока занести разработчику, чтобы конкретный файл определился как надо?..
Есть форензик сервисы для определения манипуляции с JPEG-ами.
Есть форензик сервисы для определения манипуляции с JPEG-ами.
А сервисы не стоят на месте, к тому же их много и у них разные алгоритмы.
Немножко оффтопа - к недавней теме про эмодзи и документы. Вот и до нас эта зараза докатилась

А можно не гоняться за всякой желтизной и немножко разобраться в вопросе. У сторон в договоре было русским по белому прописано, что вся переписка в мессенджерах и email'ах имеет юридическую силу как допсоглашения. Один чувак спросил, мол, вот это вам грузить? Второй ответил большим пальцем. Первый отгрузил. Второй не заплатил.
А по прессе и пабликам пошли гулять страшные истории.
А по прессе и пабликам пошли гулять страшные истории.
Где-то тихо плачут актеры дубляжа.
Где-то тихо плачут актеры дубляжа.
"Войс-овер" не зло. Пусть будет.
Удачи слушать два голоса сразу
Дубляж это зло
Но вот когда ИИ сможет качественно перевести сложный (богатый идиомами, аллюзиями или просто юмором) или технический текст... Кажется, век профессиональных переводчиков подходит к концу. Останется им только вычитывать машинный перевод. Нынешними темпами это может произойти через несколько лет.
Удачи слушать два голоса сразу
Так им и надо. Дубляж это зло (особенно силами современных дублёров). "Войс-овер" не зло. Пусть будет.
Где-то тихо плачут актеры дубляжа.
И смешного тут, на самом деле, мало. Ломают людям жизнь, забирают работу.
И, кто знает, не будем ли мы завтра на их месте.
Так им и надо. Дубляж это зло (особенно силами современных дублёров). "Войс-овер" не зло. Пусть будет.
>А как смотреть, с субтитрами?
об томатически сос донными
об томатически сос донными
И смешного тут, на самом деле, мало. Ломают людям жизнь, забирают работу.
об томатически сос донными
Вообще никаких проблем. Целое поколение VHS-зрителей на этом выросло.
Реально плачут. Причем не тихо.И смешного тут, на самом деле, мало. Ломают людям жизнь, забирают работу.И, кто знает, не будем ли мы завтра на их месте.
Целое поколение VHS-зрителей на этом выросло.
При совке, говорят, еще больше поколений выросло
Так им и надо. Дубляж это зло (особенно силами современных дублёров). "Войс-овер" не зло. Пусть будет.
Всякие Кубики в кубе, НВ-резки и прочее - жуткая жуть.
А как смотреть, с субтитрами?
Иначе, это как слушать песни Челентано в дубляже Стасом Михайловым.
Нуачо? Зато все слова понятны!
При совке, говорят, еще больше поколений выросло
Но даже "хороший" дубляж снижает восприятие фильма
Кстати, дубляж был качественнее на порядок (а то и два)Но даже "хороший" дубляж снижает восприятие фильма
Негодяи! Нужно все эти ИИ сжечь!
Пока их ещё не смели толпы голодных безработных людей.
Эта та же особа, которая яростно защищала пиратство в кинотеатрах )
Реально плачут. Причем не тихо.
(или вообще какого-то современного "дублятора" с этим отвратительным придыханием на конце фраз и дебильно-пафосными восклицаниями "о, черт")
И язык изучать лучше с субтитрами.
И язык изучать лучше с субтитрами.
И язык изучать лучше с субтитрами.
"Голосом Павла сейчас озвучиваются различные ролики в интернете, в том числе направленные на критику СВО и действий различных войск". Вот это реально подстава!
и действий различных войск
"Голосом Павла сейчас озвучиваются различные ролики в интернете, в том числе направленные на критику СВО и действий различных войск". Вот это реально подстава!
В кино ходят не для того, чтобы учить язык.
На мой взгляд, комиссар Жюв в озвучке Владимира Кенигсона звучит лучше оригинала.
Всякие Кубики в кубе, НВ-резки и прочее - жуткая жуть.
Кстати, дубляж был качественнее на порядок (а то и два)
комиссар Жюв в озвучке Владимира Кенигсона звучит лучше оригинала.
Не должен быть суррогат лучше оригинала. Он должен быть как оригинал.
Мне прям интересно, в какой момент ни одно доказательство в суде не будет применимым без тщательнейшей экспертизы. Фото, видео, голос, тексты - все подделывается до степени смешения с оригиналом.
----
Если кто не смотрел, крайне рекомендую сериал "Захват" - "The Capture". www.kinopoisk.ru - www.imdb.com
Вкратце, стали подделывать видео с любых камер "на лету", что позволило исказить реальность, обвинить невиновного, подделать прямой эфир на ТВ и, как следствие, управлять всем и всеми.
----
Если кто не смотрел, крайне рекомендую сериал "Захват" - "The Capture". www.kinopoisk.ru - www.imdb.com
Вкратце, стали подделывать видео с любых камер "на лету", что позволило исказить реальность, обвинить невиновного, подделать прямой эфир на ТВ и, как следствие, управлять всем и всеми.
Ну, с таким уровнем ыкспердизы, как в рфии, никакое ИИ и не нужно, чтобы посадить кого угодно по любой статье. Просто привлекают ыксперда с тремя классами церковно-приходской школы, он авторитетно "устанавливает", что чёрное - это белое, и вуаля.
Мир вокруг одной РФ не вертится. Более того, сильно сомневаюсь, что топовые разработки в области ИИ рождаются в недрах "института точного приборостроения и животноводства".
Я про то, что от момента "посмотрите, что ИИ умеет" до "вот видеозапись, где обвиняемый насилует дохлую утку в прямом эфире CNN" осталось 3..2..1...
Было расхожее выражение "врет, как очевидец". Станет "врет, как ИИ".
Сейчас Алекс говорит по-немецки и все такие: "уголки губ пикселизированы и шевелятся ненатурально". Завтра выйдет ролик, в котором Алекс на чистейшем урду будет призывать к джихаду против коренных племен Тумба-юмба в качестве, не отличимом от реального.
И что вы будете делать тогда?
Я про то, что от момента "посмотрите, что ИИ умеет" до "вот видеозапись, где обвиняемый насилует дохлую утку в прямом эфире CNN" осталось 3..2..1...
Было расхожее выражение "врет, как очевидец". Станет "врет, как ИИ".
Сейчас Алекс говорит по-немецки и все такие: "уголки губ пикселизированы и шевелятся ненатурально". Завтра выйдет ролик, в котором Алекс на чистейшем урду будет призывать к джихаду против коренных племен Тумба-юмба в качестве, не отличимом от реального.
И что вы будете делать тогда?
Я про то, что от момента "посмотрите, что ИИ умеет" до "вот видеозапись, где обвиняемый насилует дохлую утку в прямом эфире CNN" осталось 3..2..1...
И что вы будете делать тогда?
до "вот видеозапись, где обвиняемый насилует дохлую утку в прямом эфире CNN"
Евро-ньюс в фейковых "видеорепортажах с места событий" был и безо всяких ИИ не раз замечен.
А кто может подсказать приличную читалку текста? Так, чтобы было более менее натурально.
В 2023 году любая
Да уж, фантастика пришла в нашу реальность, ждем когда на ходу в видеозвонках будет переводить 😄
Уже есть как минимум транскрипт на лету c переводом, например, в Teams.
транскрипт на лету c переводом, например, в Teams
Вот это дааа! А я как дурак уже месяца три немецкий учу)
уже месяца три немецкий учу
Вот это дааа! А я как дурак уже месяца три немецкий учу)
Китайский надо учить! Китайский!
Вау, невероятное что-то, перевод совершенно без акцента и роботизированных ноток тоже не слышно.
Нагляднее было бы задать перевод знакомого иностранного текста на русский язык. Вот тогда можно было бы оценить качество перевода.
По неизвестному тебе немецкому трудно судить.
По неизвестному тебе немецкому трудно судить.
Нагляднее было бы задать перевод знакомого иностранного текста на русский язык. Вот тогда можно было бы оценить качество перевода. По неизвестному тебе немецкому трудно судить.
По неизвестному тебе немецкому трудно судить.
ну и тембр там все же не везде его
Нагляднее было бы задать перевод знакомого иностранного текста на русский язык. Вот тогда можно было бы оценить качество перевода. По неизвестному тебе немецкому трудно судить.
Чистое нативное произношение. Если не знать, что Алекс языка не знает (ну и тембр там все же не везде его), даже не заподозришь
По известному мне немецкому звучит очень хорошо. Аж самой захотелось услышать себя без акцента ))
По-моему, везде не. И ниже оригинала.
Берете Яндекс...
Чистое нативное произношение. Если не знать, что Алекс языка не знает (ну и тембр там все же не везде его), даже не заподозришь
А вот с построением фраз и лексикой могут быть вопросы, если судить по гугловским переводам.
В самом начале очень похоже.
Берете Яндекс.Браузер и запускаете голосовой перевод на русский любого видеоролика с Youtube. Я здесь это показывал.
Вот у Гугла нередко бывают нюансы в переводах.
А вот с построением фраз и лексикой могут быть вопросы, если судить по гугловским переводам.
а те ролики, что в интернете гуляют, там русских вроде как с сильным русским акцентом перевели, насколько я могу судить
Если брать не Гугл, а DeepL или GPT-4, то перевод в большинстве случаев получается очень пристойный.
Яндексом не пользуюсь. Уж извините.
А вот с построением фраз и лексикой могут быть вопросы, если судить по гугловским переводам.
Вчера нашёл ezdubs_bot в телеге. Но там нет русского. Может кто подскажет аналог с русским языком?
Das ist fantastisch!!!
Если знать - область вокруг рта более пикселизирована.
Ждем видеозвонков "мама, я сбил человека!" Ну и
Ждем видеозвонков "мама, я сбил человека!" Ну и
область вокруг рта более пикселизирована
"мама, я сбил человека!"
А прикинь, ИИ обучат диалог вести? (Ой, уже ж! Осталось реал-тайм генерацию морды лица доделать...)
Теги
Информация
Что ещё почитать
Обзор смартфона Redmi Note 14 Pro 5G
15.04.2025
47
Сакральные гайки пеламидных тунцов
06.06.2025
112
Петербургские азуры гипоксидных арбузов
18.07.2025
98