DeepSeek выпускает обновленную модель искусственного интеллекта R1

29.05.2025

Китайский стартап DeepSeek выпустил обновленную версию своей модели рассуждений на основе искусственного интеллекта под названием R1‑0528. Компания не делала официального заявления, но обновление DeepSeek R1 было выпущено в репозитории Hugging Face.

Обновленная модель R1 с 685 миллиардами параметров, вероятно, потребует значительных вычислительных ресурсов, выходящих за рамки оборудования потребительского уровня. Согласно объявлению компании, это обновление является «незначительным. Оно лицензировано в соответствии с разрешительной лицензией Массачусетского технологического института (MIT), разрешающей её коммерческое использование. Репозиторий Hugging Face для модели R1‑0528 не имеет подробного описания, но включает файлы конфигурации и веса, которые управляют поведением модели.

Стартап DeepSeek приобрел известность в начале этого года после того, как его бесплатная модель рассуждений R1 с открытым исходным кодом превзошла предложения американских конкурентов, включая OpenAI. Низкая стоимость и сжатые сроки разработки потрясли мировые рынки, вызвав опасения, что американские технологические гиганты перерасходуют средства на инфраструктуру ИИ и стирают миллиарды долларов стоимости крупных американских технологических акций. С тех пор эти компании в целом восстановились.

Модель ИИ R1-0528 является моделью рассуждений, то есть она может выполнять более сложные задачи посредством пошагового логического мыслительного процесса. По результатам тестов сайта LiveCodeBench, который сравнивает модели с различными метриками, модернизированная модель DeepSeek R1 уступает моделям рассуждений o4-mini и o3 от OpenAI. Между тем, модель R1 стартапа, выпущенная в ноябре 2024 года, и модель V3-0324 превзошли OpenAI o1 Preview и GPT‑4o по многим показателям.

DeepSeek стал олицетворением того, как китайский искусственный интеллект продолжает развиваться, несмотря на попытки США ограничить доступ страны к чипам и другим технологиям. В этом месяце китайские технологические гиганты Baidu и Tencent рассказали, как они повышают эффективность своих моделей искусственного интеллекта для преодоления ограничений на экспорт полупроводников из США.

Дженсен Хуан, генеральный директор компании Nvidia, которая разрабатывает графические процессоры, необходимые для обучения огромных моделей искусственного интеллекта, на этой неделе раскритиковал экспортный контроль США.

«США основывали свою политику на предположении, что Китай не может производить чипы ИИ. Это предположение всегда было сомнительным, а теперь оно явно неверно», — сказал Хуан. «Вопрос не в том, будет ли у Китая искусственный интеллект. Он уже есть».

Источник: