В Disney научили алгоритм читать сценарий и «снимать» по нему видео

Алгоритм упрощает исходные предложения, а затем сопоставляет каждый объект или действие с аналогами, имеющимися в его библиотеке, и создает на их основе 3D-анимацию

N+1 16.04.2019 20:27:44

Исследователи из Disney Research разработали алгоритм, способный создавать короткие анимационные ролики на основе сценария, написанного естественным языком.

Во время работы алгоритм упрощает исходные предложения, а затем сопоставляет каждый объект или действие с аналогами, имеющимися в его библиотеке, и создает на их основе 3D-анимацию, рассказывают авторы статьи, опубликованной на arXiv.org.

Ученые начали решать проблему синтеза изображений или видеозаписей на основе текстового описания достаточно давно, однако пока эта технология находится на начальном этапе развития и ее реализации обладают множеством недостатков. Эту проблему можно разбить на две основные части: обработка естественного языка, позволяющая компьютеру понимать смысл сказанного человеком, а также создание кадров. При обработке речевой последовательности от человека компьютер пытается понять структуру предложений, а также соотношение между словами в нем, а затем на основе этих знаний выполнить следующую задачу. В данном случае такой задачей является синтез реалистичного изображения или видеоролика, в котором объекты действуют в соответствии с исходным сценарием.

Алгоритмы, создающие ролики на основе текстового описания, уже существуют. Однако они обладают несколькими недостатками, главный из которых заключается в том, что им требуется не обычный текст на естественном языке (к примеру, сценарий фильма), а максимально простые, хотя и грамматически корректные, предложения. Ашутош Моди (Ashutosh Modi) и его коллеги из DIsney Research разработали алгоритм, способный работать с реальными сценариями фильмов и спектаклей. Обычно сценарии имеют четкую структуру, в которой можно выделить описание сцены с действиями персонажей, диалоги, техническую информацию для операторов и другие элементы. В своей работе исследователи сконцентрировались только на основном элементе, в котором происходит общее описание сцены и перечисляются действия действующих лиц.

Созданную разработчиками программу можно разделить на несколько модулей, выполняющих определенную функцию. Сначала исходный текст сценария получает модуль, отвечающий за предварительную обработку. Он распознает элементы сценария, к примеру, описание сцены, и создает пары типа «абзац текста — название элемента». Затем эти данные передаются модулю обработки языка. Изначально он упрощает предложения, по возможности разбивая каждое из них на два или больше, которые описывает по одному действию. Это происходит благодаря набору правил, по которым алгоритм распознает типы слов и их соотношения между собой.

Кроме того, модуль упрощает предложения не только структурно, но и лексически, заменяя слова на синонимы. Это необходимо для того, чтобы на последнем этапе алгоритм смог подобрать для каждого слова в сценарии соответствующую 3D-модель или анимацию из библиотеки, собранной авторами. После получения упрощенного сценария алгоритм размечает технические данные, такие время начала действия, эмоции действующих персонажей и другие, и отдает эти данные модулю, создающему итоговую 3D-анимацию на основе этих данных.

Разработчики проверили эффективность алгоритма с помощью BLEU-метода. Во время оценки три человека проводили такое же преобразование сценариев, как и алгоритм, а затем исследователи измеряли различия в преобразованиях, выполненных людьми и алгоритмом. Выяснилось, что качество преобразования (близость к преобразованию, сделанному человеком) достаточно сильно варьируются в зависимости от типа слова в предложении, к примеру, ближе всего к человеку алгоритм описывал манеры, с которыми делаются те или иные действия. Сравнение с другими алгоритмами обработки естественного языка показало, что новый алгоритм дает более близкий к человеческому результат.

Наконец, авторы провели оценку на добровольцах, которых просили оценить качество работы алгоритма. В общем случае при оценке по пятибалльной шкале от «Полностью несогласен» до «Полностью согласен» 45,23 процента добровольцев согласились с утверждением, что алгоритм корректно визуализирует текст. Кроме того, почти 60 процентов добровольцев согласились с тем, что алгоритм не добавляет в визуализацию действия, не упомянутые в сценарии.

Источник: N+1

Подписывайтесь на канал «Хвилі» в Telegram, на канал «Хвилі» вYoutube, страницу «Хвилі» в Facebook

В Disney научили алгоритм читать сценарий и «снимать» по нему видео

Алгоритм упрощает исходные предложения, а затем сопоставляет каждый объект или действие с аналогами, имеющимися в его библиотеке, и создает на их основе 3D-анимацию

Влияние блэкаута: как отключения света изменили правила игры на рынке жилья

Энергетический кризис в корне изменил критерии выбора жилья

Деньги ЕС для Украины зависли из-за одной страны: в чем дело

Среди союзников растет разочарование, так как переговоры зашли в тупик

Срочная верификация: владельцев Starlink предупредили о массовых блокировках

Минобороны вводит жесткие ограничения и тотальную проверку

Постоянное водительское удостоверение: сколько штрафов разрешается для обмена прав без экзаменов

Первое водительское удостоверение выдается сроком на 2 года

Миллиарды доверия: украинцы и ФОП увеличили банковские вклады до исторического максимума

Только за прошлый год объем вкладов вырос на впечатляющие 225,5 млрд грн

Логистическая ловушка и грабеж: почему РФ до сих пор держит часть флота в Крыму и как вывозит ресурсы

Оккупанты уже вывели из Крыма самые ценные боевые единицы

Пенсия за выслугу лет для учителей: новые правила зачисления и лимиты выплат

Процедура имеет ряд важных нюансов — от обязательного увольнения до обновленных правил учета стажа

Путин "кинул" Трампа: почему обещанная тишина закончилась катастрофой

Как Путин использовал обещание США для подготовки решающего удара?

Зима вернется дважды: названы даты новых температурных провалов после потепления

К каким погодным "сюрпризам" готовиться украинцам в феврале?

Без НАТО, но с зубами: раскрыт план защиты Украины от будущей агрессии России

Может ли Украина в одиночку противостоять будущей российской агрессии?

Влияние блэкаута: как отключения света изменили правила игры на рынке жилья

Деньги ЕС для Украины зависли из-за одной страны: в чем дело

Срочная верификация: владельцев Starlink предупредили о массовых блокировках

Постоянное водительское удостоверение: сколько штрафов разрешается для обмена прав без экзаменов

Миллиарды доверия: украинцы и ФОП увеличили банковские вклады до исторического максимума

Логистическая ловушка и грабеж: почему РФ до сих пор держит часть флота в Крыму и как вывозит ресурсы

Пенсия за выслугу лет для учителей: новые правила зачисления и лимиты выплат

Путин "кинул" Трампа: почему обещанная тишина закончилась катастрофой

Зима вернется дважды: названы даты новых температурных провалов после потепления

Без НАТО, но с зубами: раскрыт план защиты Украины от будущей агрессии России

"Конец эпохи": Польша официально меняет правила для украинцев

Переговоры в Абу-Даби: Politico оценило, готов ли Путин к реальному миру

Разрыв в четыре раза: опубликован рейтинг минимальных зарплат в странах ЕС

Налог на роскошь: за какие авто водителям придется выложить дополнительные 25 тысяч гривен

Меньше прожиточного минимума: сколько украинцев получают мизерные пенсии в 2026 году

Влияние блэкаута: как отключения света изменили правила игры на рынке жилья

Энергетический кризис в корне изменил критерии выбора жилья

Деньги ЕС для Украины зависли из-за одной страны: в чем дело

Среди союзников растет разочарование, так как переговоры зашли в тупик

Срочная верификация: владельцев Starlink предупредили о массовых блокировках

Минобороны вводит жесткие ограничения и тотальную проверку

Постоянное водительское удостоверение: сколько штрафов разрешается для обмена прав без экзаменов

Первое водительское удостоверение выдается сроком на 2 года

Миллиарды доверия: украинцы и ФОП увеличили банковские вклады до исторического максимума

Только за прошлый год объем вкладов вырос на впечатляющие 225,5 млрд грн

Логистическая ловушка и грабеж: почему РФ до сих пор держит часть флота в Крыму и как вывозит ресурсы

Оккупанты уже вывели из Крыма самые ценные боевые единицы

Пенсия за выслугу лет для учителей: новые правила зачисления и лимиты выплат

Процедура имеет ряд важных нюансов — от обязательного увольнения до обновленных правил учета стажа

Путин "кинул" Трампа: почему обещанная тишина закончилась катастрофой

Как Путин использовал обещание США для подготовки решающего удара?

Зима вернется дважды: названы даты новых температурных провалов после потепления

К каким погодным "сюрпризам" готовиться украинцам в феврале?

Без НАТО, но с зубами: раскрыт план защиты Украины от будущей агрессии России

Может ли Украина в одиночку противостоять будущей российской агрессии?

Влияние блэкаута: как отключения света изменили правила игры на рынке жилья

Деньги ЕС для Украины зависли из-за одной страны: в чем дело

Срочная верификация: владельцев Starlink предупредили о массовых блокировках

Постоянное водительское удостоверение: сколько штрафов разрешается для обмена прав без экзаменов

Миллиарды доверия: украинцы и ФОП увеличили банковские вклады до исторического максимума

Логистическая ловушка и грабеж: почему РФ до сих пор держит часть флота в Крыму и как вывозит ресурсы

Пенсия за выслугу лет для учителей: новые правила зачисления и лимиты выплат

Путин "кинул" Трампа: почему обещанная тишина закончилась катастрофой

Зима вернется дважды: названы даты новых температурных провалов после потепления

Без НАТО, но с зубами: раскрыт план защиты Украины от будущей агрессии России

"Конец эпохи": Польша официально меняет правила для украинцев

Переговоры в Абу-Даби: Politico оценило, готов ли Путин к реальному миру

Разрыв в четыре раза: опубликован рейтинг минимальных зарплат в странах ЕС

Налог на роскошь: за какие авто водителям придется выложить дополнительные 25 тысяч гривен

Меньше прожиточного минимума: сколько украинцев получают мизерные пенсии в 2026 году

Lidl, Biedronka или Auchan: украинцам в Польше подсказали, где закупаться выгоднее всего

Блокировка мобильной связи во время атак дронов: что ждет украинцев

Россия, на выход: в Перской затоке быстро нашли замену путинской нефти, - Reuters

The Financial Times: Националист побеждает на президентских выборах в Польше