Nucleus AI: Трансформация сельского хозяйства с помощью модели LLM на 22 миллиарда параметров

Nucleus AI, молодой калифорнийский стартап, поднимает планку в области искусственного интеллекта, представляя свою последнюю разработку: уникальную модель большого языкового моделирования (LLM) с неимоверными 22 миллиардами параметров. Эта инновационная модель, доступная по лицензии MIT и коммерческой лицензии, находится на грани сегментов 13B и 34B и обещает множество возможностей в генерации контента и разработке продуктов. Nucleus заявляет, что их модель превосходит по эффективности аналогичные разработки и станет ключом к их стремлению преобразовать сельское хозяйство через применение искусственного интеллекта.
Гнандип Мотури, генеральный директор компании, подчеркивает: “Наша модель на 22 миллиарда параметров — это только начало. Через несколько недель мы представим наши передовые RetNet-модели, обещающие революционные изменения в затратах и скорости выполнения”. Nucleus начал проект, обучив 22B-модель менее чем за четыре месяца, благодаря вычислительным ресурсам от их первого инвестора. Они использовали данные из многочисленных источников, включая веб-сайты, Википедию и код, чтобы обогатить модель, и в итоге достигли обучения на более чем триллионе токенов данных.
Следующим этапом станет выпуск дополнительных версий модели на 22 миллиардах токенов, а также двух RetNet-моделей на 3 миллиардах и 11 миллиардах параметров соответственно. Эти модели, наряду с интеграцией лучших аспектов RNN и нейросетей-трансформеров, обещают увеличение скорости в 15 раз при использовании всего четверти памяти GPU, необходимой для аналогичных моделей-трансформеров. Nucleus выделяется не только своими техническими достижениями, но и амбициями. Они не стремятся создавать обычные чат-боты, как многие другие компании в сфере LLM, а планируют использовать искусственный интеллект для разработки интеллектуальной операционной системы, которая оптимизирует процессы сельского хозяйства, помогая фермерам эффективно управлять предложением и спросом. Это обещает революцию в отрасли и подчеркивает важность передовых исследований в области искусственного интеллекта для общества.
Nucleus AI, молодой калифорнийский стартап, представляет уникальную модель большого языкового моделирования (LLM) с невероятными 22 миллиардами параметров. Эта инновационная модель, доступная по лицензии MIT и коммерческой лицензии, обещает революционизировать генерацию контента и разработку продуктов. Обучение 22B-модели заняло всего несколько месяцев благодаря щедрости ресурсов от первых инвесторов. Сейчас компания готовится к выпуску RetNet-моделей с 3 и 11 миллиардами параметров, обещая увеличение скорости в 15 раз при использовании лишь четверти памяти GPU по сравнению с аналогичными моделями-трансформерами.
Nucleus не ограничивается созданием обычных чат-ботов, как многие другие компании в области LLM. Их амбиции выше: они стремятся создать интеллектуальную операционную систему, которая оптимизирует процессы сельского хозяйства, помогая фермерам эффективно управлять предложением и спросом. Это обещает революцию в отрасли и подчеркивает важность передовых исследований в области искусственного интеллекта для общества.
Nucleus AI, калифорнийский стартап, объединивший таланты из Amazon и Samsung Research, сегодня представил свой первый продукт – модель языка объемом 22 миллиарда параметров (LLM). Эта универсальная модель, которая доступна под лицензией MIT с открытым исходным кодом и коммерческой лицензией, является трансформационной в сельском хозяйстве.
Nucleus начал обучение модели на 22 миллиардах примеров около трех с половиной месяцев назад. Они использовали существующие исследования и сообщество с открытым исходным кодом для предварительного обучения модели на контекстной длине 2 048 токенов. Затем модель была обучена на триллионе токенов данных, включая информацию из веб-сайтов, Wikipedia, Stack Exchange, arXiv и кода