Все о Цифровых системах - новости, статьи, обзоры, аналитика. Более 1000 компаний, товаров и услуг в каталоге.
Добавить компанию

DeepMind представляет модель Genie 3 для создания интерактивных виртуальных миров

Рубрики: «Искусственный интеллект (AI)», «Генеративный AI (Gen AI)»

Этот искусственный интеллект — третья версия серии алгоритмов, представленных компанией в феврале прошлого года. По данным DeepMind, он может способствовать развитию исследований в области машинного обучения, создавая более качественные среды обучения для моделей ИИ.

Genie 3 генерирует виртуальные миры на основе подсказок естественного языка. Он может имитировать прогнозы погоды, альпийские пейзажи и другие локации как на открытом воздухе, так и в помещении. Например, в одном из внутренних тестов исследователи DeepMind попросили Genie 3 создать сложную подводную среду с большой медузой.

DeepMind представляет модель Genie 3 для создания интерактивных виртуальных миров

С помощью подсказок пользователи могут изменять виртуальный мир. Модели можно поручить изменить погоду, угол обзора камеры или добавить в окружающую среду новые объекты. Также можно моделировать взаимодействие между этими объектами.

Предшественник алгоритма, модель Genie 2, могла обрабатывать виртуальные среды до 20 секунд за раз. DeepMind утверждает, что Genie 3 может обрабатывать данные до нескольких минут. Исследователи также повысили качество рендеринга с 360p до 720p, что соответствует разрешению 1280x720 пикселей.

Ещё одна область, в которой Genie 3 предлагает улучшения - стабильность рендеринга. Модель анализирует предыдущие кадры, чтобы определить, как следует генерировать следующие.

«Авторегрессивная генерация окружения, как правило, представляет собой более сложную техническую задачу, чем создание целого видео, поскольку неточности, как правило, накапливаются со временем», — объяснили в блоге исследователи DeepMind Джек Паркер-Холдер и Шломи Фрухтер. «Несмотря на эту сложность, окружение в Genie 3 остаётся практически неизменным в течение нескольких минут, а визуальная память охватывает события вплоть до одной минуты назад».

Модель Genie 3 может подойти для обучения агентов искусственного интеллекта, предназначенных для управления автономными системами, такими как промышленные роботы. Зачастую такие алгоритмы обучаются в условиях моделирования реальных условий, в которых им предстоит действовать.

Компания DeepMind протестировала функции обучения агентов, реализованные в Genie 3, с помощью модели искусственного интеллекта SIMA. Алгоритм SIMA предназначен для автономного выполнения задач в виртуальных средах. В ходе тестирования исследователи DeepMind успешно проинструктировали SIMA выполнить ряд действий в средах, сгенерированных Genie 3.

«В каждом виртуальном мире мы поручили агенту преследовать набор определённых целей, которых он стремится достичь, отправляя навигационные команды в Genie 3», — сообщили Паркер-Холдер и Фрухтер. «Как и любая другая среда, Genie 3 не знает цели агента, а вместо этого моделирует будущее на основе его действий».

Первоначально DeepMind предоставит Genie 3 ограниченному числу тестировщиков в качестве ознакомительной исследовательской версии. В будущем DeepMind планирует сделать ИИ доступным для большего числа пользователей.

Источник: