Baidu расширяет линейку решений на базе искусственного интеллекта
Ведущая поисковая компания Китая относится к числу технологических фирм, переключающих свое внимание на коммерциализацию приложений больших языковых моделей (LLM). Это происходит после почти двух лет крупных инвестиций в исследования и разработки языковых моделей, которые рекламируются как альтернатива GPT американской компании OpenAI.
На ежегодной Всемирной конференции Baidu генеральный директор Робин Ли представил I-RAG — технологию преобразования текста в изображение. Система использует возможности поиска Baidu для решения проблемы «галлюцинаций», при которой созданные изображения отличаются от введенного текста или содержат несуществующие элементы.
«Платформа чат-бота с искусственным интеллектом Ernie теперь ежедневно обрабатывает 1,5 миллиарда запросов пользователей, что значительно больше, чем 200 миллионов ежедневных запросов, которые платформа обрабатывала в мае», - сказал Робин Ли.
Взаимодействия чат-бота с пользователями включают в себя такие задачи, как создание текста, ответы на вопросы и помощь с различными приложениями, использующими искусственный интеллект.
Усилия Baidu по коммерциализации в основном были сосредоточены вокруг ее ИИ-агентов, которые позволяют пользователям создавать собственные приложения. Компания также интегрировала эту технологию в существующую линейку продуктов и предлагает ее пользователям через свои облачные сервисы.
Помимо прочего, Baidu также представила пару умных очков со встроенным помощником на основе искусственного интеллекта, разработанную аппаратным подразделением компании под названием Xiaodu. Гаджет оснащен камерами для съемки фото и видео и поддерживает голосовое взаимодействие с помощью помощника Ernie.
Ли заявил, что компания не ставит перед собой цель создать «суперприложение» на основе ИИ, что свидетельствует об отличии стратегии Baidu от стратегии других компаний, например, таких как компания ByteDance, которая в этом году запустила несколько автономных приложений на основе искусственного интеллекта.
Baidu также представила инновационный инструмент MiaoDa, который использует возможности больших языковых моделей для генерации кода, позволяя пользователям разрабатывать программные приложения без обширных знаний в области программирования. Запуск MiaoDa означает, что пользователи могут бытро преобразовывать свои идеи в практические приложения. Философия дизайна этого инструмента заключается в том, что пока у пользователя есть идея, он может реализовать ее через MiaoDa, тем самым открывая новую эру, где творчество создает ценность.