В Google научили алгоритм прямому переводу устной речи

N+1 16.05.2019 17:29:56

Компания Google разработала алгоритм, способный напрямую переводить речь на другой язык, не используя текстовое представление сказанных слов.

Кроме того, алгоритм может сохранять характеристики голоса человека на переведенной записи. Описание разработки опубликовано в блоге Google AI, а также в статье на arXiv.org.

Современные смартфоны и умные колонки умеют переводить на другие языки не только текст, но и речь. К примеру, недавно Google добавила такую функцию в голосовой помощник Assistant. Подобные системы имеют технические различия, но в целом устроены похоже и перевод в них проходит в три этапа. Сначала алгоритм распознает слова на аудиозаписи и создает текстовое представление речи. Затем происходит перевод текста на исходном языке в текст на требуемом языке. На последнем этапе используется система синтеза речи, превращающая переведенный текст в аудиозапись. Такой подход работает достаточно хорошо, но он имеет и недостатки. К примеру, из-за отсутствия прямой связи между исходной и синтезированной записью речи алгоритм может некорректно передавать интонации и паузы.

Разработчики из Google под руководством Юнхуэя У (Yonghui Wu) создали алгоритм, переводящий речь с одного языка на другой без использования промежуточного перевода речи в текстовое представление. Созданный разработчиками алгоритм представляет собой набор из нескольких отдельных алгоритмов, часть из которых использует архитектуру нейросети с долгой краткосрочной памятью (LSTM). В целом алгоритм можно представить в виде трех модулей, центральный из которых принимает спектрограмму исходной аудиозаписи с голосом и синтезирует спектрограмму для записи речи на другом языке. После получения новой спектрограммы она отдается алгоритму для синтеза аудиофайлов. Третий модуль представляет собой кодировщик, данные с которого используются, если необходимо сохранить голос с оригинальной речи.

Для обучения исследователи использовали два больших датасета, содержащих записи разговоров на английском и испанском, а также их текстовое представление. Во время обучения алгоритм выполнял еще одну задачу, которую разработчики называют критически важной для того, чтобы научить его переводить не только отдельные простые слова, но и целые предложения. Алгоритм предсказывал текстовые последовательности фонем на обоих языках. Во время работы эта часть алгоритма не используется и лишь помогает обучить нейросеть корректному созданию спектрограмм.
Авторы работы продемонстрировали пример работы алгоритма при переводе с испанского на английский язык. Остальные примеры доступны на сайте исследовательской группы.

Разработчики проверили качество работы алгоритма с помощью BLEU-метода, при котором машинный перевод сравнивается с переводом, выполненным человеком. Оказалось, что классический подход с промежуточным преобразованием речи в текст дает лучший результат. Вместе с этим они отмечают, что это первый пример алгоритма для прямого перевода устной речи, обученного на полноценном корпусе языка. Ранее другие исследователи показывали принципиальную возможность такого подхода, но использовали датасет из 100 слов.

Источник: N+1

Подписывайтесь на канал «Хвилі» в Telegram, на канал «Хвилі» вYoutube, страницу «Хвилі» в Facebook

В Google научили алгоритм прямому переводу устной речи

Посилити правила для біженців: Київ таємно тисне на ЄС заради повернення українців

Україна хоче повернути біженців із ЄС

Війська США в Україні: Туск заявив про можливий елемент гарантій безпеки

Заяви лідерів Польщі та Німеччини

Інтеграція ВПО: В Україні кардинально змінюють підхід до переселенців

Чому мільйони українців роками бояться розпакувати валізи

Ажіотаж та дефіцит: чому тепличні овочі різко подорожчали

Аналітики пояснили різкий стрибок цін перед Новим роком

У BILD пояснили, що приховують "фальшиві" посмішки Трампа та Зеленського

Аналіз BILD про підсумки саміту

Фермери отримали компенсацію за українську агротехніку: що купували найчастіше

Яку техніку масово скуповують фермери, щоб отримати 25% знижки від держави

Підтримка бізнесу: нові ШІ-асистенти допоможуть отримати грант і написати бізнес-план

Команда Дія.Бізнес представила п'ять віртуальних фахівців

Таксистів змусять платити податки по-новому: що буде з цінами на поїздки

Майже половина заробітку може зникнути

Зеленський назвав наслідки для США у разі "падіння України"

Зеленський обговорив з Fox News допомогу США та перспективи завершення війни

У ТЦК пояснили, як тепер визначається статус придатності військовозобов'язаного

Ступені придатності та рішення ВЛК

Посилити правила для біженців: Київ таємно тисне на ЄС заради повернення українців

Війська США в Україні: Туск заявив про можливий елемент гарантій безпеки

Інтеграція ВПО: В Україні кардинально змінюють підхід до переселенців

Ажіотаж та дефіцит: чому тепличні овочі різко подорожчали

У BILD пояснили, що приховують "фальшиві" посмішки Трампа та Зеленського

Фермери отримали компенсацію за українську агротехніку: що купували найчастіше

Підтримка бізнесу: нові ШІ-асистенти допоможуть отримати грант і написати бізнес-план

Таксистів змусять платити податки по-новому: що буде з цінами на поїздки

Зеленський назвав наслідки для США у разі "падіння України"

У ТЦК пояснили, як тепер визначається статус придатності військовозобов'язаного

Святковий стіл: як вибрати справжню червону ікру на Новий рік та відрізнити підробку

З лютого запрацюють нові правила для "листів щастя" від податкової: деталі

Тяжкий злочин і непогашена судимість: чи підлягають такі чоловіки мобілізації

Новий календар щеплень: як зміниться вакцинація з 1 січня

Зарплата зросла удвічі: найприбутковіші професії 2025 року

Посилити правила для біженців: Київ таємно тисне на ЄС заради повернення українців

Україна хоче повернути біженців із ЄС

Війська США в Україні: Туск заявив про можливий елемент гарантій безпеки

Заяви лідерів Польщі та Німеччини

Інтеграція ВПО: В Україні кардинально змінюють підхід до переселенців

Чому мільйони українців роками бояться розпакувати валізи

Ажіотаж та дефіцит: чому тепличні овочі різко подорожчали

Аналітики пояснили різкий стрибок цін перед Новим роком

У BILD пояснили, що приховують "фальшиві" посмішки Трампа та Зеленського

Аналіз BILD про підсумки саміту

Фермери отримали компенсацію за українську агротехніку: що купували найчастіше

Яку техніку масово скуповують фермери, щоб отримати 25% знижки від держави

Підтримка бізнесу: нові ШІ-асистенти допоможуть отримати грант і написати бізнес-план

Команда Дія.Бізнес представила п'ять віртуальних фахівців

Таксистів змусять платити податки по-новому: що буде з цінами на поїздки

Майже половина заробітку може зникнути

Зеленський назвав наслідки для США у разі "падіння України"

Зеленський обговорив з Fox News допомогу США та перспективи завершення війни

У ТЦК пояснили, як тепер визначається статус придатності військовозобов'язаного

Ступені придатності та рішення ВЛК

Посилити правила для біженців: Київ таємно тисне на ЄС заради повернення українців

Війська США в Україні: Туск заявив про можливий елемент гарантій безпеки

Інтеграція ВПО: В Україні кардинально змінюють підхід до переселенців

Ажіотаж та дефіцит: чому тепличні овочі різко подорожчали

У BILD пояснили, що приховують "фальшиві" посмішки Трампа та Зеленського

Фермери отримали компенсацію за українську агротехніку: що купували найчастіше

Підтримка бізнесу: нові ШІ-асистенти допоможуть отримати грант і написати бізнес-план

Таксистів змусять платити податки по-новому: що буде з цінами на поїздки

Зеленський назвав наслідки для США у разі "падіння України"

У ТЦК пояснили, як тепер визначається статус придатності військовозобов'язаного

Святковий стіл: як вибрати справжню червону ікру на Новий рік та відрізнити підробку

З лютого запрацюють нові правила для "листів щастя" від податкової: деталі

Тяжкий злочин і непогашена судимість: чи підлягають такі чоловіки мобілізації

Новий календар щеплень: як зміниться вакцинація з 1 січня

Зарплата зросла удвічі: найприбутковіші професії 2025 року

Lidl, Biedronka чи Auchan: українцям у Польщі підказали, де закуповуватися найвигідніше

Блокування мобільного зв'язку під час атак дронів: що чекає на українців

Росія, на вихід: у Перській затоці швидко знайшли заміну путінській нафті, – Reuters

The Financial Times: Націоналіст перемагає на президентських виборах у Польщі