Новый алгоритм OpenAI умеет создавать осмысленные тексты

N+1 15.02.2019 21:01:46

Исследователи из OpenAI создали алгоритм, который умеет создавать правдоподобные тексты и отвечать на вопросы без спецификации необходимой задачи в процессе обучения.

Единственное умение GPT-2, обученного на восьми миллионах текстовых веб-страниц, — предсказывать последующее слово. Описание работы алгоритма доступно на официальном сайте проекта.

В последние годы машинное обучение все чаще и эффективнее применяют в решении задач автоматической обработки языка. В зависимости от задачи архитектура обучаемой модели и используемый для обучения датасеты должны быть разными, что может сильно ограничить их возможности и усложнить процесс разработки.

Команда из OpenAI под руководством Алека Рэдфорда (Alec Radford) решила создать алгоритм, который бы умел решать множество различных задач по обработке текста без спецификации этих задач при обучении. Для этого исследователи собрали датасет WebText, который содержит 40 гигабайт текста, взятого с восьми миллионов страниц в интернете. В отличие от большинства подобных датасетов, для которых берутся тексты с сайта Википедии или же исключительно новостные заметки, в WebText попали самые разные материалы.

Авторы утверждают, что единственная способность их алгоритма, — генерировать новые слова на основании прочитанного. Сравнительно простое решение задачи автоматической обработки языка позволило ученым создать алгоритм, который может не только дописывать отрывки, представленные людьми, но также и писать эссе на заданные темы и новости на основании заголовков.

У созданного алгоритма есть и свои ограничения. Например, наиболее удачный пример его работы — эссе на тему того, почему переработка мусора — это плохо, получилось убедительным только с 25 попытки, и при этом все равно содержало мелкие ошибки вроде необязательного повтора слов. Также среди недостатков алгоритма разработчики отметили семантические трудности и быстрые и порой неуместные смены тем. При этом тексты, которые широко представлены в обучающей выборке (например, новостные заметки) даются алгоритму лучше: правдоподобные образцы он выдает уже со второй попытки.

Также разработчики опробовали алгоритм на других задачах: ответе на случайные вопросы, переводе текста и вопросах на понимание прочитанного. Несмотря на это, что эффективность алгоритма для этих задач значительно ниже алгоритмов, настроенных на определенные задачи, GPT-2, к примеру, удалось добиться максимальной средней точности при ответе на вопрос в 63,5 процента. При этом ни один из вопросов и ответ на него не были использованы в обучающей выборке. При этом ему также удалось перевести несколько отдельных слов и ответить на большинство вопросов по прочитанным текстам. Разработчики считают, что эффективность GPT-2 в выполнении этих задач можно повысить с расширением датасета и увеличением вычислительной мощности компьютеров, который используется для обучения.

Разработчики не выложили программный код обученной модели целиком, опасаясь «недобросовестных использований»: вместо этого они предоставили упрощенную модель для других исследователей, а также описали проделанную работу в препринте.

Помимо нового алгоритма, который производит правдоподобные текстовые отрывки, у OpenAI также есть бот, который умеет играть в Dota 2: в 2017 году он выступил против сильнейших игроков и победил.

Источник: N+1

Подписывайтесь на канал «Хвилі» в Telegram, на канал «Хвилі» в Youtube, страницу «Хвилі» в Facebook

Останні новини

$35 мільярдів, "Ельза" та ракети до Patriot: підсумки "Рамштайну" для України

Союзники оголосили масштабний пакет допомоги, Британія виділяє пів мільярда на ППО, а Німеччина запускає виробництво європейських далекобійних дронів

21:00 12.02

Пенсіонерів попередили про проблему із виплатами: кому можуть затримати

Попри формальну бездефіцитність кошторису, грошей на виконання судових рішень щодо перерахунку пенсій заклали критично мало

20:40 12.02 Хвиля

Переведення годинників на літній час в Україні в 2026 році

Президент також повідомив про ліквідацію наслідків масованої атаки на енергосистему та попередив дипломатів про відповідальність за пасивність

19:35 12.02 Хвиля

Дія договору про скорочення стратегічних наступальних озброєнь офіційно завершилася, відкриваючи шлях до безконтрольної гонки озброєнь

18:45 12.02 Хвиля

Це офіційно: Зеленський запустив процес оформлення гарантій безпеки

Лідер України підписав указ №111/2026

18:35 12.02 Хвиля

Останні новини

21:00

Новый алгоритм OpenAI умеет создавать осмысленные тексты

$35 мільярдів, "Ельза" та ракети до Patriot: підсумки "Рамштайну" для України

Союзники оголосили масштабний пакет допомоги, Британія виділяє пів мільярда на ППО, а Німеччина запускає виробництво європейських далекобійних дронів

Пенсіонерів попередили про проблему із виплатами: кому можуть затримати

Попри формальну бездефіцитність кошторису, грошей на виконання судових рішень щодо перерахунку пенсій заклали критично мало

Переведення годинників змінили: з’явилося уточнення про літній час 2026

Депутати голосували за відміну перекладу стрілок, але закон "завис у повітрі"

Кремль пропонує Трампу повернення до долара та спільний видобуток нафти: Bloomberg про деталі секретного меморандуму

Видання Bloomberg отримало доступ до внутрішнього документа Москви з сімома пунктами економічної угоди між РФ та США

Вибори під час війни: Зеленський готує несподіваний сценарій

Що насправді стоїть за лаштунками майбутньої виборчої кампанії?

Зеленський висловив переговори з РФ і різко розкритикував МОК через рішення щодо Гераскевича

Президент також повідомив про ліквідацію наслідків масованої атаки на енергосистему та попередив дипломатів про відповідальність за пасивність

Доплата понад 1000 гривень: хто з пенсіонерів має право на нову допомогу

Найбільш істотну допомогу можуть отримати самотні люди похилого віку

Тисяча ракет та закупівлі у США: Британія оголосила про потужний пакет допомоги Україні

Міністр оборони Великобританії Джон Гілі зробив заяву

Ера масового розповсюдження: світ втратив останній ядерний запобіжник стримування США та Росії

Дія договору про скорочення стратегічних наступальних озброєнь офіційно завершилася, відкриваючи шлях до безконтрольної гонки озброєнь

Це офіційно: Зеленський запустив процес оформлення гарантій безпеки

Лідер України підписав указ №111/2026

$35 мільярдів, "Ельза" та ракети до Patriot: підсумки "Рамштайну" для України

Пенсіонерів попередили про проблему із виплатами: кому можуть затримати

Переведення годинників змінили: з’явилося уточнення про літній час 2026

Кремль пропонує Трампу повернення до долара та спільний видобуток нафти: Bloomberg про деталі секретного меморандуму

Вибори під час війни: Зеленський готує несподіваний сценарій

Зеленський висловив переговори з РФ і різко розкритикував МОК через рішення щодо Гераскевича

Доплата понад 1000 гривень: хто з пенсіонерів має право на нову допомогу

Тисяча ракет та закупівлі у США: Британія оголосила про потужний пакет допомоги Україні

Ера масового розповсюдження: світ втратив останній ядерний запобіжник стримування США та Росії

Це офіційно: Зеленський запустив процес оформлення гарантій безпеки

Від резидентів до ФОПів: хто зобов’язаний звітувати та платити податок та прибуток

Світло доведеться чекати роками: українців шокували прогнозом щодо "повернення до нормального життя"

З'явилося відео пусків ракет "Фламінго": чим Україна рознесла арсенал ГРАУ під Волгоградом

Трамп позбавив Путіна союзників: допоможе завершити війну в Україні

Чому збивають не все: Сирський назвав головну проблему ППО

$35 мільярдів, "Ельза" та ракети до Patriot: підсумки "Рамштайну" для України

Союзники оголосили масштабний пакет допомоги, Британія виділяє пів мільярда на ППО, а Німеччина запускає виробництво європейських далекобійних дронів

Пенсіонерів попередили про проблему із виплатами: кому можуть затримати

Попри формальну бездефіцитність кошторису, грошей на виконання судових рішень щодо перерахунку пенсій заклали критично мало

Переведення годинників змінили: з’явилося уточнення про літній час 2026

Депутати голосували за відміну перекладу стрілок, але закон "завис у повітрі"

Кремль пропонує Трампу повернення до долара та спільний видобуток нафти: Bloomberg про деталі секретного меморандуму

Видання Bloomberg отримало доступ до внутрішнього документа Москви з сімома пунктами економічної угоди між РФ та США

Вибори під час війни: Зеленський готує несподіваний сценарій

Що насправді стоїть за лаштунками майбутньої виборчої кампанії?

Зеленський висловив переговори з РФ і різко розкритикував МОК через рішення щодо Гераскевича

Президент також повідомив про ліквідацію наслідків масованої атаки на енергосистему та попередив дипломатів про відповідальність за пасивність

Доплата понад 1000 гривень: хто з пенсіонерів має право на нову допомогу

Найбільш істотну допомогу можуть отримати самотні люди похилого віку

Тисяча ракет та закупівлі у США: Британія оголосила про потужний пакет допомоги Україні

Міністр оборони Великобританії Джон Гілі зробив заяву

Ера масового розповсюдження: світ втратив останній ядерний запобіжник стримування США та Росії

Дія договору про скорочення стратегічних наступальних озброєнь офіційно завершилася, відкриваючи шлях до безконтрольної гонки озброєнь

Це офіційно: Зеленський запустив процес оформлення гарантій безпеки

Лідер України підписав указ №111/2026

$35 мільярдів, "Ельза" та ракети до Patriot: підсумки "Рамштайну" для України

Пенсіонерів попередили про проблему із виплатами: кому можуть затримати

Переведення годинників змінили: з’явилося уточнення про літній час 2026

Кремль пропонує Трампу повернення до долара та спільний видобуток нафти: Bloomberg про деталі секретного меморандуму

Вибори під час війни: Зеленський готує несподіваний сценарій

Зеленський висловив переговори з РФ і різко розкритикував МОК через рішення щодо Гераскевича

Доплата понад 1000 гривень: хто з пенсіонерів має право на нову допомогу

Тисяча ракет та закупівлі у США: Британія оголосила про потужний пакет допомоги Україні

Ера масового розповсюдження: світ втратив останній ядерний запобіжник стримування США та Росії

Це офіційно: Зеленський запустив процес оформлення гарантій безпеки

Від резидентів до ФОПів: хто зобов’язаний звітувати та платити податок та прибуток

Світло доведеться чекати роками: українців шокували прогнозом щодо "повернення до нормального життя"

З'явилося відео пусків ракет "Фламінго": чим Україна рознесла арсенал ГРАУ під Волгоградом

Трамп позбавив Путіна союзників: допоможе завершити війну в Україні

Чому збивають не все: Сирський назвав головну проблему ППО

Lidl, Biedronka чи Auchan: українцям у Польщі підказали, де закуповуватися найвигідніше

Блокування мобільного зв'язку під час атак дронів: що чекає на українців

Росія, на вихід: у Перській затоці швидко знайшли заміну путінській нафті, – Reuters

The Financial Times: Націоналіст перемагає на президентських виборах у Польщі