ИИ DeepMind победил людей в кооперативной игре Quake III Arena

Сотрудники британской компании DeepMind, которая с 2014 года принадлежит Google, опубликовали статью в журнале Science, посвященную успехам их искусственного интеллекта.

На этот раз они смогли натренировать алгоритм на командную игру в режиме «Захват флага» мультиплеерного шутера Quake III Arena. Команда из агентов ИИ в подавляющем количестве игр победила команду людей.

Для тренировки агентов специалисты использовали обучение с подкреплением — метод машинного обучения, при котором система учится, взаимодействуя со средой. Авторы статьи пишут, что этот метод успешно зарекомендовал себя в обучении одного агента, но они хотели узнать, насколько он успешен при командной работе.

В качестве платформы они выбрали мультиплеерный шутер от первого лица Quake III Arena, но задали свои условия игры. Во-первых, карты каждый раз генерируются случайно. Во-вторых, в матче принимают участие только четыре игрока: по два с каждой стороны. Соревнование проходит только в одном режиме — «Захват флага»: каждая из команд должна одновременно защитить свой флаг, захватить флаг оппонентов и принести на свою базу. Реакцию системы снизили до средних показателей человека.

Авторы тренировали 30 агентов. Тренировка происходила благодаря многотысячным параллельным партиям, которые отыгрывали агенты. При этом каждый агент представлял собой индивидуальную единицу, которая действует самостоятельно, исходя из обучения с подкреплением. Специалисты также демонстрируют филогенетическое дерево, которое строится в ходе этого обучения.

После тренировок алгоритмы сыграли несколько партий с командой людей. Обе команды играли на неизвестных для них картах. Пара агентов за игру в среднем захватывала на 16 флагов больше, чем пара людей. Только когда человек играл в партнерстве с искусственным интеллектом, ему удавалось выиграть у объединения алгоритмов (5% вероятности победы).

Профессор Технологического колледжа Джорджии Марк Ридл (Mark Riedl) раскритиковал такой подход британской фирмы, сказав, что агенты не обмениваются сообщениями, а лишь реагируют на те события, которые происходят в игре. Однако представитель DeepMind Макс Джадерберг (Max Jaderberg) возразил:

«[В нашей симуляции] один из агентов сидит в лагере противника, ожидая, когда вновь появится флаг, это возможно только потому, что он полагается на своего партнера по команде».

Джадерберг говорит об одной из тактик искусственного интеллекта, выработанной тем в ходе обучения, которая предполагает ожидание появления нового флага в лагере оппонента. Ее часто используют и люди.

В январе DeepMind сообщила, что ее искусственный интеллект AlphaStar одолел двух профессиональных игроков в стратегию StarCraft II, проходящую в реальном времени.

Источник: naked-science.ru

Подписывайтесь на канал «Хвилі» в Telegram, на канал «Хвилі» в Youtube, страницу «Хвилі» в Facebook

Популярні новини зараз

Втратите до 40% заощаджень: експерт пояснив головну помилку при покупці золота

По всій Україні повернули графіки відключень: Укренерго дало прогноз на 7 лютого

Закордонний паспорт без цього документа більше не дадуть: для українців запровадили нові правила

Переведення годинника в Україні: з'явилося важливе уточнення про літній час

Готуйтеся до колапсу на дорогах: де вдарять морози та засипле снігом

У яких регіонах погода може паралізувати рух транспорту?

Зеленський прозвітував про переговори з РФ і США: потрібно більше прогресу

Президент заслухав доповідь переговорної групи та визначив рамки подальшого діалогу

Удари по тилу: ЗСУ знищили центр виробництва дронів та РСЗВ "Ураган" окупантів

ЗСУ завдали серію прицільних ударів по військових об'єктах РФ у Донецькій та Запорізькій областях

"Потрібен реальний тиск": Зеленський заявив, що Росія цілила в об'єкти, пов'язані з АЕС

Енергетика постраждала по всій країні

Блокування Starlink на фронті: окупанти шукають способи повернути зв'язок за допомогою українців

У Міноборони попередили охочих заробити на активації Starlink

Масштаб колосальний: у ДТЕК оцінили ситуацію після нового обстрілу енергетики

Росія завдала масованого удару по енергетичній інфраструктурі України

Дрони СБУ вразили унікальний завод у РФ: там робили паливо для ракет Х-101

У РФ горить завод ракетного палива

Масштабний удар Росії по енергетиці: АЕС знизили потужність генерації

У Міненерго розповіли, що відбувається

Зеленський: США вимагають закінчити війну до літа, а переговори переносять у Маямі

Росія продовжує вимагати повного виходу українських сил з території Донецької області

Масований удар по енергетиці: ППО збила майже 400 дронів

Зеленський озвучив наслідки нічного терору, а Повітряні сили розкрили деталі роботи ППО

Готуйтеся до колапсу на дорогах: де вдарять морози та засипле снігом

Зеленський прозвітував про переговори з РФ і США: потрібно більше прогресу

Удари по тилу: ЗСУ знищили центр виробництва дронів та РСЗВ "Ураган" окупантів

"Потрібен реальний тиск": Зеленський заявив, що Росія цілила в об'єкти, пов'язані з АЕС

Блокування Starlink на фронті: окупанти шукають способи повернути зв'язок за допомогою українців

Масштаб колосальний: у ДТЕК оцінили ситуацію після нового обстрілу енергетики

Дрони СБУ вразили унікальний завод у РФ: там робили паливо для ракет Х-101

Масштабний удар Росії по енергетиці: АЕС знизили потужність генерації

Зеленський: США вимагають закінчити війну до літа, а переговори переносять у Маямі

Масований удар по енергетиці: ППО збила майже 400 дронів

Втратите до 40% заощаджень: експерт пояснив головну помилку при покупці золота

Майже половина грошей йде на це: ПриватБанк розкрив головні витрати українців

Знають навіть дату народження: українців попередили про нову схему викрадення грошей з карток

Тисячі пенсіонерів не отримали доплати: названо причину блокування коштів

У Києві та області вдарять морози до -24 градусів: синоптики назвали дати різкого похолодання

Lidl, Biedronka чи Auchan: українцям у Польщі підказали, де закуповуватися найвигідніше

Блокування мобільного зв'язку під час атак дронів: що чекає на українців

Росія, на вихід: у Перській затоці швидко знайшли заміну путінській нафті, – Reuters

The Financial Times: Націоналіст перемагає на президентських виборах у Польщі