Google разрабатывает ИИ для исследователей на основе Gemini 2.0
Компания описывает инструмент как ИИ-соучёного (AI co-scientist). Он работает на базе Gemini 2.0 - последней версии флагманского семейства больших языковых моделей Google. Языковые модели этой серии могут обрабатывать мультимодальные данные и имеют функцию, которая позволяет им выполнять действия во внешних системах, таких как базы данных.
Чтобы использовать новый инструмент ИИ, исследователи взаимодействуют с ним через интерфейс чат-бота. Пользователь указывает цель, например, поиск новых клинических применений для существующего лекарства, а инструмент предлагает потенциальные способы достижения этой цели. Программное обеспечение генерирует план исследования, состоящий из нескольких пунктов, и находит научные статьи с данными, относящимися к проекту.
Пользователи могут настраивать логический вывод соучёного различными способами. Вместо того, чтобы просто указать цель исследования, ученый может ввести предложение по достижению этой цели и попросить ИИ рассмотреть идею. Кроме того, пользователи могут предоставить обратную связь по первоначальному быстрому ответу ИИ, чтобы помочь ему внести улучшения.
«Помимо стандартного обзора литературы, обобщения и инструментов «глубокого исследования», данная система ИИ предназначена для выявления новых, оригинальных знаний и формулирования явно новых исследовательских гипотез и предложений», - написали исследователи Google Юрай Готтвайс и Вивек Натараян в своем блоге.
Искусственный интеллект соучёного работает на базе более чем полудюжины ИИ-агентов. Это программы машинного обучения, которые могут выполнять действия с высокой степенью автономности. Каждая из них выполняет разное подмножество задач, необходимых для создания плана исследования.
Первый агент, названный Generation, анализирует изучаемое научное явление и генерирует несколько гипотез, которые пытаются его объяснить. Затем второй агент, названный Ranking, уточняет эти гипотезы с помощью нескольких вспомогательных агентов ИИ.
Один из вспомогательных агентов, Proximity, удаляет повторяющиеся исследовательские идеи. Другой просматривает оставшиеся предложения с помощью общедоступных научных данных. Также есть третий агент, названный Evolution, который может упростить вывод ИИ, чтобы сделать его более понятным.
Для генерации гипотез система использует подход, называемый «test-time compute». Эта техника позволяет повысить качество выходных данных модели ИИ, увеличивая количество времени и инфраструктуры, которые она использует для генерации быстрых ответов. Помимо большой языковой модели серии Gemini 2.0, на которой основан соучёный, подход «test-time compute» также поддерживается несколькими конкурирующими моделями ИИ, включая o1 от OpenAI.
Чтобы проверить возможности соучёного, Google попросила группу исследователей представить системе 15 научных целей. Участники определили, что ответы ИИ «имеют более высокий потенциал новизны и воздействия», чем результаты конкурирующих моделей.