Все о Цифровых системах - новости, статьи, обзоры, аналитика. Более 1000 компаний, товаров и услуг в каталоге.
Добавить компанию

OpenAI внедряет новые функции в генератор изображений DALL-E

Рубрики: «Искусственный интеллект (AI)», «Генеративный искусственный интеллект», «Чат боты»

Новая функция основана на модели искусственного интеллекта под названием DALL-E 3, которую компания представила в сентябре прошлого года. Несколько недель спустя OpenAI интегрировала модель в свой чат-бот ChatGPT. Оригинальная версия редактора DALL-E позволяла клиентам создавать изображения на основе текстовых подсказок и визуальных примеров, а также вносить последующие изменения. Последнее обновление облегчит пользователям редактирование созданных ими изображений.

В ChatGPT-3 редактор DALL-E доступен через тот же интерфейс чат-бота, что и другие функции службы. Недавно добавленная кнопка «Выбрать» в верхней части интерфейса позволяет пользователям выделять конкретный раздел изображения, который они хотят отредактировать. Оттуда они могут вводить инструкции на естественном языке, описывающие необходимые изменения. Пользователь может, например, на фотографии леса нарисовать круг вокруг дерева и попросить редактор DALL-E удалить его. Также можно изменить дизайн объектов на изображении или добавить новые.

«Чтобы получить лучшие результаты мы рекомендуем выбирать большее пространство вокруг области, которую вы собираетесь редактировать», — сообщила OpenAI в статье, подробно описывающей обновление.

Также в новой версии инженеры OpenAI добавили ряд удобных функций. В редакторе DALL-E появились новые кнопки «Отменить» и «Повторить действие», которые позволяют быстро отменить выбор участков изображения, выделенных пользователем с помощью инструмента «Выделение». Клиенты также могут настроить соотношение сторон изображения, создаваемого инструментом, а также получить доступ к предложениям по стилю рисования.

Редактор DALL-E доступен в ChatGPT Pro - платной версии чат-бота, а также в двух более продвинутых уровнях продуктов, которые OpenAI предлагает для предприятий. Функция доступна как в веб-версии, так и в мобильном приложении.

DALL-E 3, генератор изображений искусственного интеллекта, на котором основана эта функция, является третьей итерацией нейронной сети, впервые представленной OpenAI в 2021 году. По сравнению с предыдущими версиями, она генерирует изображения более высокого качества и может более точно следовать инструкциям пользователя. OpenAI приписывает эту особенность набору обучающих данных DALL-E 3.

Исследователи OpenAI обучили ИИ на большой коллекции изображений и соответствующих подписей. По данным компании, 95% этих подписей были созданы с использованием большой языковой модели, разработанной специально для DALL-E 3. Эта языковая модель генерирует относительно короткие описания изображений, в которых подробно описываются только основные элементы изображения. OpenAI считает, что этот подход способствует развитию обучения искусственного интеллекта.

Источник: