OpenAI представляет новые функции безопасности для ChatGPT
Первое обновление будет посвящено компоненту маршрутизатора GPT-5 - системы искусственного интеллекта, лежащей в основе ChatGPT. Маршрутизатор анализирует каждый запрос пользователя и автоматически определяет, какая из больших языковых моделей OpenAI лучше всего подходит для его обработки. Клиенты также могут вручную указать какую модель использовать.
OpenAI выпустит обновлённую версию маршрутизатора, который сможет определять испытывает ли пользователь острый стресс, и отправлять подсказки оптимизированной большой языковой модели рассуждений. Такие большие языковые модели обеспечивают «более полезные и значимые ответы», лежащие в основе ChatGPT. Маршрутизатор выберет оптимизированную для рассуждений большую языковую модель, даже если пользователь изначально выбрал менее продвинутый алгоритм.
Кроме того, OpenAI внедрит функцию родительского контроля, призванную обеспечить более надёжную защиту контента для подростков. Родители смогут связать свои учётные записи ChatGPT с учётными записями своих детей-подростков, отправив им электронное письмо с подтверждением. После этого они смогут устанавливать правила поведения, соответствующие возрасту, и отключать некоторые функции ChatGPT, такие как история чата. Кроме того, OpenAI планирует генерировать оповещения о потенциально опасных запросах. Выход данного обновления запланирован на следующий месяц.
«ChatGPT будет отправлять уведомления, когда обнаружит, что подросток находится в состоянии острого стресса. Экспертная оценка поможет этой функции поддерживать доверие между родителями и подростками», - заявил представитель OpenAI в блоге.
Также OpenAI планирует привлечь экспертов из совета по развитию молодежи, психическому здоровью и взаимодействию человека и компьютера. Эти специалисты помогут компании в разработке будущих обновлений родительского контроля ChatGPT. По данным OpenAI, совет будет сотрудничать со второй группой экспертов, получившей название «Глобальная сеть врачей». В неё входят более 250 медицинских специалистов, включая психиатров, педиатров и врачей общей практики. OpenAI уже сотрудничала с этими врачами в рамках многочисленных исследовательских инициатив.
«Их вклад напрямую влияет на наши исследования безопасности, обучение на моделях и другие мероприятия, помогая нам при необходимости быстро привлекать нужных специалистов», — написали сотрудники OpenAI. «Мы привлекаем в нашу сеть ещё больше врачей и исследователей, в том числе тех, кто обладает глубокими знаниями в таких областях, как расстройства пищевого поведения, употребление психоактивных веществ и здоровье подростков».
Объявленные обновления являются частью более масштабной инициативы по обеспечению безопасности ИИ, о которой OpenAI впервые рассказала в прошлом месяце. Тогда компания заявила, что её исследователи также повысят эффективность ChatGPT в выявлении признаков психического и эмоционального стресса в длительных сеансах чата. Кроме того, OpenAI улучшит систему защиты, используемую для блокировки потенциально опасных ответов на подсказки.


