OpenAI позволит пользователям настраивать GPT-3.5 Turbo для решения конкретных задач

23.08.2023

Компания OpenAI, создавшая чат-бота ChatGPT, сообщила, что теперь клиенты могут точно настроить базовую модель GPT-3.5 Turbo, используя свои собственные данные.

Теперь пользователи получили возможность создавать индивидуальные модели ИИ, которые потенциально могут соответствовать возможностям GPT-4 или даже превосходить их. Тонкая настройка искусственного интеллекта подразумевает использование стандартной модели, такой как GPT-3.5 Turbo, и предоставление ей дополнительных данных для создания модели, способной решать очень специфические задачи.

Например, клиенты могут создать бота на основе GPT-3.5 Turbo, специально обученного предоставлению надежных ответов на определенном языке или использованию кратких формулировок. Они также могут обучить его на конкретной базе знаний и затем использовать бота для оказания поддержки клиентам или сотрудникам.

Компания OpenAI уже некоторое время предлагает тонкую настройку для вариантов GPT-3, таких как davinci-002 или babbage-002, но в ближайшие месяцы планирует отказаться от этих версий. По данным компании, клиенты, желающие выполнить тонкую настройку GPT-3.5 Turbo, получат в свое распоряжение базовую модель, которая обучена на данных из открытых источников Интернета. Затем они смогут дополнить модель своими собственными данными для более специфического обучения.

Другие варианты использования тонко настроенных моделей включают создание бота, который обучен имитировать голос бренда из соображений единообразия, или бота-генератора кода, который предлагает фрагменты кода разработчикам. Кроме того, тонкая настройка позволяет сократить текстовые подсказки, чтобы ускорить вызовы интерфейса прикладного программирования GPT-3 Turbo и снизить затраты. OpenAI утверждает, что некоторым клиентам удалось уменьшить размер своих текстовых подсказок до 90%.

«С момента выпуска GPT-3.5 Turbo разработчики и предприятия попросили предоставить возможность настраивать модель для создания уникального и дифференцированного опыта для своих пользователей», — написала OpenAI в своем блоге. «Это обновление дает разработчикам возможность настраивать модели, которые лучше работают для их сценариев использования, и запускать эти пользовательские модели в большом масштабе».

OpenAI запустила модель GPT-3.5 Turbo в начале года, заявив тогда, что она идеально подходит для приложений, не ориентированных на чат. Модель способна обрабатывать 4000 токенов одновременно, что в два раза больше, чем предыдущие модели OpenAI. Компания определяет «токены» как части слов, похожие на слоги — например, «fan», «tas» и «tic» составляют три токена, составляющие слово «fantastic» («фантастический»). Токены играют важную роль в тонкой настройке.

«Прежде чем API обработает запросы, входные данные разбиваются на токены», — объясняет OpenAI. «Эти токены не разрезаются точно там, где начинаются или заканчиваются слова — токены могут включать в себя конечные пробелы и даже подслова».

GPT-3.5 Turbo — не самая продвинутая модель искусственного интеллекта, предлагаемая OpenAI. Эта честь принадлежит модели GPT-4, которая дебютировала в июне этого года. GPT-4 понимает не только текст, но и изображения. Пока эту модель нельзя точно настроить, но компания OpenAI заявила, что планирует сделать её настройку доступной для клиентов позднее в этом году.

Источник: