ИИ DeepMind победил людей в кооперативной игре Quake III Arena

Сотрудники британской компании DeepMind, которая с 2014 года принадлежит Google, опубликовали статью в журнале Science, посвященную успехам их искусственного интеллекта.

На этот раз они смогли натренировать алгоритм на командную игру в режиме «Захват флага» мультиплеерного шутера Quake III Arena. Команда из агентов ИИ в подавляющем количестве игр победила команду людей.

Для тренировки агентов специалисты использовали обучение с подкреплением — метод машинного обучения, при котором система учится, взаимодействуя со средой. Авторы статьи пишут, что этот метод успешно зарекомендовал себя в обучении одного агента, но они хотели узнать, насколько он успешен при командной работе.

В качестве платформы они выбрали мультиплеерный шутер от первого лица Quake III Arena, но задали свои условия игры. Во-первых, карты каждый раз генерируются случайно. Во-вторых, в матче принимают участие только четыре игрока: по два с каждой стороны. Соревнование проходит только в одном режиме — «Захват флага»: каждая из команд должна одновременно защитить свой флаг, захватить флаг оппонентов и принести на свою базу. Реакцию системы снизили до средних показателей человека.

Авторы тренировали 30 агентов. Тренировка происходила благодаря многотысячным параллельным партиям, которые отыгрывали агенты. При этом каждый агент представлял собой индивидуальную единицу, которая действует самостоятельно, исходя из обучения с подкреплением. Специалисты также демонстрируют филогенетическое дерево, которое строится в ходе этого обучения.

После тренировок алгоритмы сыграли несколько партий с командой людей. Обе команды играли на неизвестных для них картах. Пара агентов за игру в среднем захватывала на 16 флагов больше, чем пара людей. Только когда человек играл в партнерстве с искусственным интеллектом, ему удавалось выиграть у объединения алгоритмов (5% вероятности победы).

Профессор Технологического колледжа Джорджии Марк Ридл (Mark Riedl) раскритиковал такой подход британской фирмы, сказав, что агенты не обмениваются сообщениями, а лишь реагируют на те события, которые происходят в игре. Однако представитель DeepMind Макс Джадерберг (Max Jaderberg) возразил:

«[В нашей симуляции] один из агентов сидит в лагере противника, ожидая, когда вновь появится флаг, это возможно только потому, что он полагается на своего партнера по команде».

Джадерберг говорит об одной из тактик искусственного интеллекта, выработанной тем в ходе обучения, которая предполагает ожидание появления нового флага в лагере оппонента. Ее часто используют и люди.

В январе DeepMind сообщила, что ее искусственный интеллект AlphaStar одолел двух профессиональных игроков в стратегию StarCraft II, проходящую в реальном времени.

Источник: naked-science.ru

Подписывайтесь на канал «Хвилі» в Telegram, на канал «Хвилі» в Youtube, страницу «Хвилі» в Facebook

Популярные статьи сейчас

Вьетнамский синдром Путина: почему Россия не может ни победить, ни отступить

Путин "кинул" Трампа: почему обещанная тишина закончилась катастрофой

"Конец эпохи": Польша официально меняет правила для украинцев

Украинцам массово возвращают деньги за коммуналку: результаты масштабных проверок

"До мира ещё далеко": что заявили Уиткофф и Дмитриев о переговорах в Абу-Даби

О чем договорились делегации?

Холод снова ворвется: морозная погода еще потреплет нервы украинцам

Диденко предупредила о коварстве атлантического тепла и назвала точные даты, когда морозы вернутся с новой силой

"У противника катастрофа": отключение Starlink парализовало россиян на фронте

Министр Михаил Федоров и советник по вопросам военных технологий Сергей "Флэш" Бескрестнов раскрыли подробности

Путин выдвинул новое условия для завершения войны

В ОАЭ проходит второй день переговоров между Украиной, США и РФ

Тарифы покрывают лишь 60%: украинские города рискуют остаться без тепла

Названы главные причины коллапса

Мобилизация осужденных с условным сроком наказания: на какие действия имеет право ТЦК

Нахождение под надзором органа пробации не освобождают лицо от административной ответственности перед ТЦК

Мнимая экономия: три бытовых прибора, которые не стоит выключать из розетки

В частности, телевизоры с OLED-матрицами выполняют важную работу, даже когда вы их не смотрите

Американский газ уже в системе: первая партия LNG обеспечит теплом 700 тысяч украинских семей

Объем поставки составил почти 100 млн куб. м.

Минфин подсчитал деньги чиновников: сколько зарабатывают в госсекторе

За год численность работников госорганов уменьшилась примерно на 3%

"Идеально дополняют друг друга": глава ЕСПЧ назвал составляющие системы наказания для России

Ключевая особенность текущей стратегии заключается в объединении усилий различных институтов

"До мира ещё далеко": что заявили Уиткофф и Дмитриев о переговорах в Абу-Даби

Холод снова ворвется: морозная погода еще потреплет нервы украинцам

"У противника катастрофа": отключение Starlink парализовало россиян на фронте

Путин выдвинул новое условия для завершения войны

Тарифы покрывают лишь 60%: украинские города рискуют остаться без тепла

Мобилизация осужденных с условным сроком наказания: на какие действия имеет право ТЦК

Мнимая экономия: три бытовых прибора, которые не стоит выключать из розетки

Американский газ уже в системе: первая партия LNG обеспечит теплом 700 тысяч украинских семей

Минфин подсчитал деньги чиновников: сколько зарабатывают в госсекторе

"Идеально дополняют друг друга": глава ЕСПЧ назвал составляющие системы наказания для России

Битва за небо: американская RTX ускоряет поставки ракет Patriot после рекордных атак РФ

Украина и Япония готовят историческое оборонное соглашение: что в фокусе

Хлеб по 150 гривен и дорогое масло: украинцев предупредили о взлете цен на популярные продукты

Квартира станет непригодной: эксперты назвали фатальную ошибку при отключении тепла

Индексация с "сюрпризом": кому из украинцев повысят пенсии в феврале

Lidl, Biedronka или Auchan: украинцам в Польше подсказали, где закупаться выгоднее всего

Блокировка мобильной связи во время атак дронов: что ждет украинцев

Россия, на выход: в Перской затоке быстро нашли замену путинской нефти, - Reuters

The Financial Times: Националист побеждает на президентских выборах в Польше