Все о Цифровых системах - новости, статьи, обзоры, аналитика. Более 1000 компаний, товаров и услуг в каталоге.
Добавить компанию

OpenAI внедряет расширенный голосовой режим для некоторых пользователей ChatGPT Plus

Рубрики: «Искусственный интеллект (AI)», «Синтез и распознавание речи», «Генеративный искусственный интеллект», «Голосовые помощники», «Чат боты»

Новый расширенный голосовой режим OpenAI для ChatGPT будет предложен небольшому числу людей, подписавшихся на ChatGPT Plus. Функция, которую OpenAI продемонстрировала на своем мероприятии по запуску GPT-4o в мае, подверглась критике за голос похожий на Скарлетт Йоханссон. В итоге компания отложила запуск реалистичного голосового общения с конца июня до июля по соображениям безопасности.

Обновленный голосовой режим оказался заметно более эффективным, чем текущий голосовой режим ChatGPT. На сцене сотрудники OpenAI могли прерывать чат-бота и просить его рассказать историю разными способами, а чат-бот при этом спокойно воспринимал их прерывания, корректируя свои ответы.

«Мы отложили выпуск на один месяц, чтобы достичь нашей планки для запуска. В рамках этой задержки компания улучшает способность модели обнаруживать и отклонять определенный контент», - заявила OpenAI в блоге.

Компания протестировала возможности голосовой модели с более чем 100 внешними тестерами «красной команды» (людьми, которые пытаются атаковать технологии, чтобы найти в них слабые места). Недавно OpenAI столкнулась с большим вниманием к своей политике безопасности, поэтому эта пауза, возможно, была ей необходима.

«OpenAI также добавила новые фильтры, которые будут распознавать и блокировать определенные запросы на создание музыки или другого защищенного авторским правом аудио», - сказала представитель OpenAI Тая Кристиансон.

Во время мероприятия OpenAI одним из основных критических замечаний к новому режиму было то, насколько голос на сцене по имени «Sky», был похож на голос актрисы Йоханссон, которая играла личность ИИ в фильме «Она». В новом режиме ChatGPT будут использоваться только четыре предустановленных голоса, созданных с помощью актеров озвучивания.

«Мы сделали так, что ChatGPT не может имитировать голоса других людей, как отдельных лиц, так и общественных деятелей, и будет блокировать выходные данные, которые отличаются от одного из этих предустановленных голосов», - добавила Кристиансон.

OpenAI планирует предоставить новый режим всем пользователям ChatGPT Plus осенью. Компания работает над внедрением новых продуктов на основе генеративного ИИ, стремясь сохранить свое преимущество в стремительно развивающейся гонке за ИИ.

Источник: