В Google научили алгоритм прямому переводу устной речи

Разработчики из Google под руководством Юнхуэя У (Yonghui Wu) создали алгоритм, переводящий речь с одного языка на другой без использования промежуточного перевода речи в текстовое представление.

N+1 16.05.2019 17:29:56

Компания Google разработала алгоритм, способный напрямую переводить речь на другой язык, не используя текстовое представление сказанных слов.

Кроме того, алгоритм может сохранять характеристики голоса человека на переведенной записи. Описание разработки опубликовано в блоге Google AI, а также в статье на arXiv.org.

Современные смартфоны и умные колонки умеют переводить на другие языки не только текст, но и речь. К примеру, недавно Google добавила такую функцию в голосовой помощник Assistant. Подобные системы имеют технические различия, но в целом устроены похоже и перевод в них проходит в три этапа. Сначала алгоритм распознает слова на аудиозаписи и создает текстовое представление речи. Затем происходит перевод текста на исходном языке в текст на требуемом языке. На последнем этапе используется система синтеза речи, превращающая переведенный текст в аудиозапись. Такой подход работает достаточно хорошо, но он имеет и недостатки. К примеру, из-за отсутствия прямой связи между исходной и синтезированной записью речи алгоритм может некорректно передавать интонации и паузы.

Разработчики из Google под руководством Юнхуэя У (Yonghui Wu) создали алгоритм, переводящий речь с одного языка на другой без использования промежуточного перевода речи в текстовое представление. Созданный разработчиками алгоритм представляет собой набор из нескольких отдельных алгоритмов, часть из которых использует архитектуру нейросети с долгой краткосрочной памятью (LSTM). В целом алгоритм можно представить в виде трех модулей, центральный из которых принимает спектрограмму исходной аудиозаписи с голосом и синтезирует спектрограмму для записи речи на другом языке. После получения новой спектрограммы она отдается алгоритму для синтеза аудиофайлов. Третий модуль представляет собой кодировщик, данные с которого используются, если необходимо сохранить голос с оригинальной речи.

Для обучения исследователи использовали два больших датасета, содержащих записи разговоров на английском и испанском, а также их текстовое представление. Во время обучения алгоритм выполнял еще одну задачу, которую разработчики называют критически важной для того, чтобы научить его переводить не только отдельные простые слова, но и целые предложения. Алгоритм предсказывал текстовые последовательности фонем на обоих языках. Во время работы эта часть алгоритма не используется и лишь помогает обучить нейросеть корректному созданию спектрограмм.
Авторы работы продемонстрировали пример работы алгоритма при переводе с испанского на английский язык. Остальные примеры доступны на сайте исследовательской группы.

Разработчики проверили качество работы алгоритма с помощью BLEU-метода, при котором машинный перевод сравнивается с переводом, выполненным человеком. Оказалось, что классический подход с промежуточным преобразованием речи в текст дает лучший результат. Вместе с этим они отмечают, что это первый пример алгоритма для прямого перевода устной речи, обученного на полноценном корпусе языка. Ранее другие исследователи показывали принципиальную возможность такого подхода, но использовали датасет из 100 слов.

Источник: N+1

Подписывайтесь на канал «Хвилі» в Telegram, на канал «Хвилі» вYoutube, страницу «Хвилі» в Facebook

Последние новости

Bloomberg: США и Россия работают над соглашением о перемирии, которое закрепит завоевания Путина в Украине

Трамп и Путин готовят встречу на следующей неделе для подписания соглашения о прекращении войны

17:40 08.08

17:40

В Google научили алгоритм прямому переводу устной речи

Bloomberg: США и Россия работают над соглашением о перемирии, которое закрепит завоевания Путина в Украине

Трамп и Путин готовят встречу на следующей неделе для подписания соглашения о прекращении войны

Военнослужащие СЗЧ могут вернуться через Армию+ до 30 августа: Минобороны обнародовало алгоритм действий

До 30 августа военные из СЗЧ до 10 мая могут возобновиться по упрощенной процедуре через Армию+

Отключение мобильного интернета: Россия пытается изолировать Крым

Формально отключение мобильного интернета объясняют "соображениями безопасности"

В США назвали главное условие для переговоров Трампа с Путиным

Перспективы встречи Трампа и Путина

Вступление Украины в ЕС и НАТО поможет противодействовать пропаганде РФ – польский дипломат

Дипломат отметил, что дезинформация, которую распространяет Россия, подрывает доверие между нашими странами

Как сняться с розыска через "Резерв+" без посещения ТЦК: объяснение юриста

Статус "В розыске" в приложении "Резерв+" с красной отметкой обычно свидетельствует о нарушении правил военного учета

Россияне используют "ждунов" для атак на Волчанском направлении

Отдельную опасность представляют дроны на оптоволокне, которые россияне используют как "ждунов"

Проект АІ Factory: в Украине будут внедрять ИИ в государственные сервисы

На инфраструктуре в рамках AI Factory будут работать ключевые государственные сервисы с ИИ

Fox News назвали возможное время и место встречи Трампа и Путина

Встреча Трампа и Путина

Лукашенко готовит армию к подавлению протестов в Беларуси - разведка

Кроме того, вводится более широкое толкование оснований для объявления военного положения

Bloomberg: США и Россия работают над соглашением о перемирии, которое закрепит завоевания Путина в Украине

Военнослужащие СЗЧ могут вернуться через Армию+ до 30 августа: Минобороны обнародовало алгоритм действий

Отключение мобильного интернета: Россия пытается изолировать Крым

В США назвали главное условие для переговоров Трампа с Путиным

Вступление Украины в ЕС и НАТО поможет противодействовать пропаганде РФ – польский дипломат

Как сняться с розыска через "Резерв+" без посещения ТЦК: объяснение юриста

Россияне используют "ждунов" для атак на Волчанском направлении

Проект АІ Factory: в Украине будут внедрять ИИ в государственные сервисы

Fox News назвали возможное время и место встречи Трампа и Путина

Лукашенко готовит армию к подавлению протестов в Беларуси - разведка

"Одноразовые камикадзе": российские штурмовики идут на смерть в пустых "брониках"

Отопительный сезон: прифронтовые регионы получат помощь от доноров

На Закарпатье вырос спрос на квартиры в новостройках: цены на жилье

В WSJ узнали о плане Путина для Трампа: чем рискует Украина

Славянск под прицелом: РФ активизировала удары на Северском направлении

Bloomberg: США и Россия работают над соглашением о перемирии, которое закрепит завоевания Путина в Украине

Трамп и Путин готовят встречу на следующей неделе для подписания соглашения о прекращении войны

Военнослужащие СЗЧ могут вернуться через Армию+ до 30 августа: Минобороны обнародовало алгоритм действий

До 30 августа военные из СЗЧ до 10 мая могут возобновиться по упрощенной процедуре через Армию+

Отключение мобильного интернета: Россия пытается изолировать Крым

Формально отключение мобильного интернета объясняют "соображениями безопасности"

В США назвали главное условие для переговоров Трампа с Путиным

Перспективы встречи Трампа и Путина

Вступление Украины в ЕС и НАТО поможет противодействовать пропаганде РФ – польский дипломат

Дипломат отметил, что дезинформация, которую распространяет Россия, подрывает доверие между нашими странами

Как сняться с розыска через "Резерв+" без посещения ТЦК: объяснение юриста

Статус "В розыске" в приложении "Резерв+" с красной отметкой обычно свидетельствует о нарушении правил военного учета

Россияне используют "ждунов" для атак на Волчанском направлении

Отдельную опасность представляют дроны на оптоволокне, которые россияне используют как "ждунов"

Проект АІ Factory: в Украине будут внедрять ИИ в государственные сервисы

На инфраструктуре в рамках AI Factory будут работать ключевые государственные сервисы с ИИ

Fox News назвали возможное время и место встречи Трампа и Путина

Встреча Трампа и Путина

Лукашенко готовит армию к подавлению протестов в Беларуси - разведка

Кроме того, вводится более широкое толкование оснований для объявления военного положения

Bloomberg: США и Россия работают над соглашением о перемирии, которое закрепит завоевания Путина в Украине

Военнослужащие СЗЧ могут вернуться через Армию+ до 30 августа: Минобороны обнародовало алгоритм действий

Отключение мобильного интернета: Россия пытается изолировать Крым

В США назвали главное условие для переговоров Трампа с Путиным

Вступление Украины в ЕС и НАТО поможет противодействовать пропаганде РФ – польский дипломат

Как сняться с розыска через "Резерв+" без посещения ТЦК: объяснение юриста

Россияне используют "ждунов" для атак на Волчанском направлении

Проект АІ Factory: в Украине будут внедрять ИИ в государственные сервисы

Fox News назвали возможное время и место встречи Трампа и Путина

Лукашенко готовит армию к подавлению протестов в Беларуси - разведка

"Одноразовые камикадзе": российские штурмовики идут на смерть в пустых "брониках"

Отопительный сезон: прифронтовые регионы получат помощь от доноров

На Закарпатье вырос спрос на квартиры в новостройках: цены на жилье

В WSJ узнали о плане Путина для Трампа: чем рискует Украина

Славянск под прицелом: РФ активизировала удары на Северском направлении

Lidl, Biedronka или Auchan: украинцам в Польше подсказали, где закупаться выгоднее всего

Блокировка мобильной связи во время атак дронов: что ждет украинцев

Россия, на выход: в Перской затоке быстро нашли замену путинской нефти, - Reuters

The Financial Times: Националист побеждает на президентских выборах в Польше