Запущен Kosmos — «ИИ - ученый», способный проводить исследования, требующие шести месяцев, за один день

Компания Edison Scientific, новый коммерческий проект FutureHouse, объявила о запуске Kosmos — своего нового поколения ИИ - ученых. Этот новый инструмент обещает преобразовать подход к научным исследованиям, преодолевая ограничения памяти и логического мышления, присущие прежним языковым моделям, и позволяя совершать сложные автономные открытия.
Запуск также знаменует собой переход управления платформой от FutureHouse к Edison Scientific, который сохранит бесплатный уровень для ученых и введет платные опции для продвинутых пользователей.
Гигантский скачок от чат-ботов к «глубоким исследованиям»
В отличие от своего предшественника «Robin» и большинства современных агентов ИИ, которым приходится сталкиваться с ограниченными контекстными окнами, Kosmos представляет ключевое нововведение: использование структурированных моделей мира.
Эта архитектура позволяет ИИ использовать информацию, полученную из сотен траекторий агентов, и поддерживать согласованность для достижения конкретной исследовательской цели на десятках миллионов токенов.
Согласно техническому отчёту, один запуск Kosmos включает чтение 1500 научных статей и выполнение 42 000 строк аналитического кода. «Мы рассматриваем это скорее как набор реагентов, чем как чат-бот; это то, что запускается на особо важных объектах по мере необходимости», — объясняет Edison Scientific, отличая свой инструмент от разговорных помощников, таких как ChatGPT.
Эффективная метрика
Самые удивительные данные, обнародованные компанией, были получены от пользователей бета-версии.
По оценкам, один запуск Kosmos может за один день выполнить то, на что у учёного с докторской степенью или постдокторанта ушло бы около шести месяцев, при этом точность выводов составляет 79,4%.

Хотя эта цифра кажется невероятной, компания подкрепляет ее двумя методами проверки:
Опросы пользователей: Независимые ученые подсчитали, что в среднем экономия человеческого труда составляет 6,14 месяцев на одно выполнение.
Независимая проверка: если подсчитать время, необходимое человеку для прочтения статей и написания аналитического кода, обрабатываемого ИИ, то эта цифра приближается к 4,1 месяцам непрерывной работы.
Семь подтвержденных открытий
Чтобы продемонстрировать, что Kosmos не только обрабатывает данные, но и генерирует реальные знания, команда представила семь открытий, разделив их на воспроизведение результатов человеческих исследований и совершенно новые вклады.
Например, агенту удалось воспроизвести сложные результаты в различных областях: от определения метаболических путей в мозге мышей до критических факторов влажности в эффективности перовскитных солнечных батарей (открытие в области материаловедения).
Более того, ИИ предложил новые молекулярные механизмы развития диабета 2 типа и болезни Альцгеймера. Особого внимания заслуживает открытие, что снижение экспрессии генов флиппаз в стареющих нейронах может спровоцировать атаку иммунной системы на уязвимые нейроны при болезни Альцгеймера.
Эта гипотеза уже проверяется в лабораторных условиях.

Компания Edison Scientific подчёркивает прослеживаемость этих открытий.
В отличие от «чёрных ящиков» других моделей, каждый вывод в отчёте Kosmos можно отследить до конкретной строки кода или конкретного отрывка научной литературы, которые его вдохновили.
Вердикт отрасли
Появление Kosmos не осталось незамеченным. Сэм Альтман, генеральный директор OpenAI, прокомментировал запуск в социальной сети X:
«Это захватывающе; надеюсь, мы увидим ещё много подобных проектов, и это станет одним из самых значительных достижений ИИ. Поздравляю команду Future House».
Однако создатели предупреждают, что инструмент не идеален:
Kosmos всё ещё может попасть в «кроличьи норы» или обнаружить статистически значимые, но не имеющие научного значения корреляции.
Тем не менее, запуск знаменует собой важную веху в эпоху науки, ускоренной с помощью ИИ.