Традиционно систему ориентации автопилота на дороге рассматривают как взаимодействие трех составляющих: ИИ должен распознать ближайшие объекты, отследить их траектории, а также предсказать их поведение в ближайшие секунды.
Все это позволяет спланировать безопасную траекторию. Как указывает Phys.org, неверное суждение на любом из трех этапов может привести к аварии.
Команда исследователей из Торонто совместно с Uber Advanced Technologies Group решила объединить все три задачи в одном алгоритме. Главная цель — исключить возможность ошибок взаимодействия. Но, помимо прочего, новый алгоритм стал намного быстрее. Детали о нем расскажут на конференции по машинному зрению в Солт-Лейк-Сити в ходе доклада с говорящим названием «Fast and Furious: Real Time End-to-End 3-D Detection».
По утверждению авторов, анализ одного изображения с использованием их нейросети занимает лишь 30 миллисекунд.
Для достижения такого феноменального результата исследователи применили сразу несколько необычных подходов, рассказала руководитель команды Ракель Уртазун.
Так, приоритет при анализе дорожной обстановки был отдан не камерам, а лидарам — датчикам, указывающим на расстояние до объекта. В отличие от области обработки изображения с помощью алгоритмов, тут обучение системы заняло значительно больше времени. В этом помогли предоставленные Uber данные о 6500 различных ситуациях — в совокупности более миллиона кадров.
Если бы ИИ работал с фотографиями, каждый объект нужно было бы идентифицировать, потратив ресурсы на их распознавание и «просмотр» обширных пространств между отдельными объектами. Уртазун объясняет, что для обучении ИИ на основе данных лидара — хаотичных раскиданных по пространству точек, находящихся на разном удалении от наблюдателя — потребовалось разработать новый подход.
Исследователям удалось в этом хаосе выделить ключевые регионы, на проработку которых компьютер робомобиля сможет гибко выделять необходимые ресурсы. Это сделало алгоритм намного быстрее — примерно в 10 раз.
Команда Уртазун представит на конференции в Солт-Лейк-Сити девять различных работ. Результаты работы над анализирующей дорожную обстановку нейросестью представлены в работе «SBNet: Sparse Blocks Network for Fast Inference».
В Университете Торонто считают, что такой подход можно будет использовать в других сферах. Однако, как подчеркивает Уртазун, сейчас ученые сконцентрировались на автономном вождении, которое она называет одной из «фундаментальных проблем столетия».
Источник: hightech.plus
Подписывайтесь на канал «Хвилі» в Telegram, страницу «Хвилі» в Facebook.