Google DeepMind разрабатывает робота, играющего в настольный теннис
Люди прочно удерживают лидерство над роботами в настольном теннисе уже более 40 лет, но недавние достижения Google DeepMind показывают, что ситуация меняется. Как подробно описано в недавно опубликованном документе, исследователи разработали первую в мире роботизированную систему, способную играть в пинг-понг на уровне любителя.
Исследователи часто выбирают классические игры, такие как шахматы и го, чтобы проверить стратегические возможности искусственного интеллекта. Однако, если дело доходит до объединения стратегии и физической активности в реальном времени, то настольный теннис является давним стандартом в робототехнической отрасли. Инженеры сталкивали машины с людьми в бесчисленных раундах пинг-понга на протяжении более четырех десятилетий из-за интенсивных вычислительных и физических требований этого вида спорта, включающих быструю адаптацию к динамическим переменным, сложным движениям и зрительной координации.
«Робот должен хорошо владеть навыками низкого уровня, такими как возврат мяча, а также навыками высокого уровня, такими как разработка стратегии и долгосрочное планирование для достижения цели», — пояснили исследователи Google DeepMind.
Чтобы разработать своего высокоразвитого бота, инженеры сначала составили большой набор данных «начальных состояний мячей для настольного тенниса», включая информацию о позиционировании, вращении и скорости. Затем они поручили своей системе искусственного интеллекта попрактиковаться с использованием этого набора данных в физически точных виртуальных симуляциях для изучения таких навыков, как возврат подачи, прицеливание слева и методы топ-спина справа.
После обучения системы на наборе данных инженеры DeepMind соединили ИИ с роботизированной рукой, способной выполнять сложные, быстрые движения, и настроили ее против игроков-людей. Эти данные, включая визуальную информацию о движении теннисного мяча, снятую камерами робота, затем снова анализировались в симуляциях для создания «непрерывного цикла обратной связи» обучения.
Фаза тестирования показала, что робот для настольного тенниса преуспел в игре с игроками начального уровня, одержав победу во всех встречах. В игре с игроками среднего уровня робот продемонстрировал похвальные результаты, выиграв 55% матчей. Однако производительность робота значительно снизилась при игре с продвинутыми игроками - в этих матчах он не смог одержать ни одной победы. В целом, в 29 матчах система одержала 13 побед или выиграла 45% своих испытаний, продемонстрировав «уверенную любительскую производительность человеческого уровня».
Самый большой недостаток системы — ее способность реагировать на быстрые мячи. DeepMind предполагает, что основными причинами этого являются следующие факторы: задержка системы, обязательные сбросы между ударами и недостаток полезных данных. Другими уязвимыми местами системы являются высокие и низкие мячи, удары слева и слабая способность читать вращение входящего мяча.
«Чтобы устранить ограничения задержки, которые мешают роботу реагировать на быстрые мячи, мы предлагаем исследовать расширенные алгоритмы управления и аппаратные оптимизации», — отмечают исследователи. «Сюда может входить изучение моделей для прогнозирования траекторий мячей или внедрение более быстрых протоколов связи между датчиками и исполнительными механизмами робота».
Исследования DeepMind показывают, что, хотя робот добился значительных успехов в имитации игры на уровне человека, однако остаются существенные препятствия, которые необходимо преодолеть, прежде чем он сможет эффективно конкурировать с продвинутыми игроками.