Следующее обновление ChatGPT позволит создавать видео из текста

Рубрики: «Искусственный интеллект (AI)», «Чат-боты»

13.03.2023

Расширенные возможности чат-бота ChatGPT с искусственным интеллектом, такие как отладка кода, написание эссе или шутки, привели к его огромной популярности. Несмотря на это его помощь была ограничена текстовыми ответами. Похоже скоро ситуация изменится.

Согласно заявлению Андреаса Брауна, технического директора Microsoft в Германии, на конференции «AI in Focus - Digital Kickoff», на следующей неделе планируется запуск GPT-4, который сможет генерировать видео по текстовым запросам.

«На следующей неделе мы представим GPT-4; в нем у нас будут мультимодальные модели, которые предложат совершенно разные возможности — например, видео», — сказал Браун присутствовавшему на мероприятии немецкому новостному агентству Heise.

ChatGPT работает на архитектуре языковой модели от OpenAI под названием Generative Pre-trained Transformer, также известной как GPT. В частности модели GPT-3 или GPT-3.5 ограничивают чат-бот выводом текстовой информации.

Поскольку GPT-4 будет мультимодальным искусственным интеллектом (ИИ), то, в отличие от предыдущих моделей, варианты его использования могут выходить за рамки текста.

Хольгер Кенн, директор по бизнес-стратегии Microsoft в Германии, сказал: «Искусственный интеллект также может переводить текст в видео, музыку и изображения».

Генератор преобразования текста в видео не является совершенно новой концепцией, поскольку у таких технологических гигантов, как Meta и Google, уже есть подобные модели.

У Meta есть Make-A-Video, а у Google — Imagen Video, которые используют искусственный интеллект для создания видео на основе пользовательского ввода.

Тем не менее, технологии Meta и Google остаются на стадии исследований и недоступны для широкой публики, что создает для OpenAI идеальную возможность оставаться впереди конкурентов в области генеративного искусственного интеллекта.

Источник: