Следующее обновление ChatGPT позволит создавать видео из текста
Согласно заявлению Андреаса Брауна, технического директора Microsoft в Германии, на конференции «AI in Focus - Digital Kickoff», на следующей неделе планируется запуск GPT-4, который сможет генерировать видео по текстовым запросам.
«На следующей неделе мы представим GPT-4; в нем у нас будут мультимодальные модели, которые предложат совершенно разные возможности — например, видео», — сказал Браун присутствовавшему на мероприятии немецкому новостному агентству Heise.
ChatGPT работает на архитектуре языковой модели от OpenAI под названием Generative Pre-trained Transformer, также известной как GPT. В частности модели GPT-3 или GPT-3.5 ограничивают чат-бот выводом текстовой информации.
Поскольку GPT-4 будет мультимодальным искусственным интеллектом (ИИ), то, в отличие от предыдущих моделей, варианты его использования могут выходить за рамки текста.
Хольгер Кенн, директор по бизнес-стратегии Microsoft в Германии, сказал: «Искусственный интеллект также может переводить текст в видео, музыку и изображения».
Генератор преобразования текста в видео не является совершенно новой концепцией, поскольку у таких технологических гигантов, как Meta и Google, уже есть подобные модели.
У Meta есть Make-A-Video, а у Google — Imagen Video, которые используют искусственный интеллект для создания видео на основе пользовательского ввода.
Тем не менее, технологии Meta и Google остаются на стадии исследований и недоступны для широкой публики, что создает для OpenAI идеальную возможность оставаться впереди конкурентов в области генеративного искусственного интеллекта.