OpenAI представляет новые инструменты для ускоренной разработки голосовых помощников на основе ИИ
Стартап, поддерживаемый корпорацией Microsoft, заявил, что новый инструмент, работающий в режиме реального времени, уже запущен для тестирования. Он позволит разработчикам создавать голосовые приложения на базе искусственного интеллекта, используя единый набор инструкций.
Ранее этот процесс требовал от разработчиков прохождения как минимум трех этапов:
- Транскрибирование аудио, то есть преобразование речи в текстовую расшифровку;
- Запуск модели сгенерированного текста для выработки ответа на запрос;
- И, наконец, использование отдельной модели преобразования текста в речь.
Значительная часть доходов OpenAI поступает от предприятий, которые используют ее услуги для создания собственных приложений ИИ, что делает внедрение расширенных возможностей ключевым аргументом в пользу продаж. Конкуренция на рынке также обостряется, поскольку технологические гиганты, включая Alphabet (материнскую компанию Google), интегрируют в свои бизнес-процессы модели искусственного интеллекта, способные обрабатывать различные формы информации, такие как видео, аудио и текст.
Компания OpenAI ожидает, что в следующем году ее доход вырастет до 11,6 млрд долларов с предполагаемых 3,7 млрд долларов в 2024 году, сообщило агентство Reuters. Компания также находится в процессе привлечения средств в размере 6,5 млрд долларов, что может привести к переоценке ее стоимости до 150 млрд долларов.
В рамках последнего выпуска OpenAI представила инструмент тонкой настройки моделей после обучения, который позволит разработчикам улучшить ответы, генерируемые моделями с использованием изображений и текста. Этот процесс тонкой настройки может включать обратную связь от людей, которые, опираясь на ответы модели, предоставляют ей примеры хороших и плохих ответов. По словам представителей OpenAI, использование изображений для точной настройки моделей даст этим моделям более глубокие возможности понимания изображений, что позволит использовать визуальный поиск и улучшенное обнаружение объектов для автономных транспортных средств.
Стартап также представил инструмент, который позволит небольшим моделям учиться у более крупных, а также функцию «оперативного кэширования», которая вдвое сокращает затраты на разработку за счет повторного использования фрагментов текста, ранее обработанных ИИ.