Alibaba выпускает более 100 моделей ИИ с открытым исходным кодом и новый генератор видео

Рубрики: «Искусственный интеллект (AI)», «Облачные технологии и сервисы»

23.09.2024

Alibaba Cloud, подразделение облачных вычислений китайской компании Alibaba Group Ltd., объявило о выпуске более 100 новых моделей искусственного интеллекта с открытым исходным кодом в рамках семейства моделей Qwen 2.5.

Представленная на конференции Apsara, новая серия моделей следует за выпущенной в прошлом году базовой моделью компании Tongyi Qianwen, или Qwen. С тех пор модели Qwen были загружены более 40 миллионов раз на таких платформах, как Hugging Face и Modelscop.

Размеры новых моделей варьируются от полумиллиарда до 72 миллиардов параметров. В больших языковых моделях параметры определяют поведение модели и то, что она использует для развития своих навыков, таких как математика, программирование или экспертные знания.

Меньшие, более легкие модели можно быстро обучить, используя гораздо меньше вычислительных ресурсов на более сфокусированных обучающих наборах. Такие модели преуспевают в более простых задачах. Напротив, более крупные модели требуют большой вычислительной мощности и более длительного времени обучения и, как правило, лучше справляются со сложными задачами, требующими глубокого понимания языка.

В семейство Qwen 2.5 компания Alibaba включила модели, которые предоставляют основные языковые знания для обобщения, вопросов и ответов, а также других стандартных задач языковых моделей. Компания также выпустила модели для наборов программирования и математики, которые претерпели существенные улучшения по сравнению с предыдущими поколениями.

«Alibaba Cloud с беспрецедентной интенсивностью инвестирует в исследования и разработки технологий ИИ и создание своей глобальной инфраструктуры», — сказал Эдди Ву, председатель и главный исполнительный директор Alibaba Cloud Intelligence. «Мы стремимся создать инфраструктуру ИИ будущего для обслуживания наших глобальных клиентов и раскрытия их бизнес-потенциала».

В дополнение к языковым моделям компания также представила обновления своих мультимодальных моделей искусственного интеллекта, включая новую модель преобразования текста в видео в составе большого семейства моделей генератора изображений Tongyi Wanxiang. Новая модель может генерировать высококачественные видео на основе подсказок на китайском и английском языках и преобразовывать статические изображения в высококачественные видео в самых разных стилях. Видеоролики, которые создает модель, включают реалистичные сцены и 3D-анимацию. Внутри модели реализована усовершенствованная архитектура диффузионного трансформера, позволяющая повысить качество реконструкции видео.

Эта новость последовала за объявлением Alibaba Cloud в конце прошлого месяца о выпуске Qwen2-VL - модели искусственного интеллекта, способной к расширенному восприятию изображений и многоязычным разговорным возможностям. По данным компании, она может понимать видео продолжительностью до 20 минут и отвечать на вопросы, связанные с контентом. Модель предназначена для интеграции в мобильные телефоны, автомобили и роботов.

Источник: