Google претендует на лидерство в сфере мультимодального ИИ
Мультимодальный искусственный интеллект — модели глубокого обучения, способные одновременно обрабатывать данные разных типов, таких как текст, изображения, видео, аудио, 3D и пр. Благодаря этому мультимодальный ИИ может анализировать поведение потребителей, объединяя данные из изображений, текста и социальных сетей, позволяя компаниям создавать более целевые, персонализированные и эффективные рекламные кампании.
Подразделение облачных вычислений компании Google недавно заявило, что мультимодальный искусственный интеллект, станет одним из пяти главных трендов ИИ в 2025 году. В основе стратегии Google в области мультимодального ИИ лежит BigQuery — хранилище, способное собирать и анализировать множество типов данных.
«BigQuery был изначальной системой хранения данных еще до того, как появился этот термин», — сказала Ясмин Ахмад, руководителя по стратегии и управлению исходящими продуктами в области данных, аналитики и ИИ в Google. «Мы создали реляционный движок для поддержки структурированного анализа, который хотели выполнять корпоративные клиенты».
По оценкам Google, 90% корпоративных данных неструктурированы. Объединяя распознавание изображений и голоса со структурированными данными для обучения организации cмогут извлекать информацию из ранее неиспользуемых данных.
Так, например, компания United Parcel Service (UPS) создала панель управления, которая использует данные датчиков, установленных на грузовиках, для оптимизации маршрутов доставки, выдавая водителям конкретные инструкции в режиме реального времени. Компания Bell Canada использует созданные с помощью ИИ расшифровки звонков в свой контакт-центр для обучения ассистента-коучинга, который обеспечивает обратную связь с агентами.
Мультимодальный ИИ может позволить ритейлерам собирать мнения клиентов из нескольких источников, таких как колл-центры, обзоры в социальных сетях и отзывы в мобильных приложениях, а затем передавать их в генеративный механизм искусственного интеллекта, который найдет новые сегменты для целевых маркетинговых кампаний.
«Сочетание мультимодальных данных и искусственного интеллекта обеспечивает такой уровень персонализации и масштабируемости, который был недостижим прежде», - сказала Ахмад.