🧠 Kandinsky — нейросеть Сбера, которая может нарисовать что угодно по текстовому запросу. Как она работает?
Краткое содержание:
🧠 Kandinsky — нейросеть Сбера, которая может нарисовать что угодно по текстовому запросу. Как она работает?
Искусственный интеллект давно применяют в медицине, бизнесе, робототехнике, безопасности и других областях. Большой популярностью пользуются нейросети для работы с иллюстрациями и текстами. Одна из таких — свежая Kandinsky от Сбера.
Новая модель генерации изображений стала наследницей предыдущей нейросети ruDALL-E, которую Сбер представил в ноябре 2021 года. Первую версию обучали на массиве данных из 120 млн пар «текст-изображение».
🥑 Умные алгоритмы могли за несколько минут нарисовать картинку, которая подходила бы под текстовое описание пользователя, даже под самое небанальное.
Например, нейросеть удачно справлялась с запросами вроде «Ктулху в Р'льехе ждёт рассвет» или «Ждун в форме авокадо».
Kandinsky переняла все преимущества предшественницы и получила новые навыки. Нейросети «скормили» ещё 179 млн изображений с текстовыми описаниями, поэтому она стала точнее генерировать результаты.
🖼 Обновился и способ повышения разрешения картинок. Текстуры, тени и отражения выглядят более натурально, так что и финальный результат стал ещё реалистичнее. Ещё новая модель научилась генерировать изображения с произвольным соотношением сторон.
Как и раньше, чтобы создать картинку, нужно три этапа. На первом Kandinsky генерирует несколько изображений. На втором другая нейросеть выбирает картинки, которые лучше остальных подходят текстовому описанию.
Третья нейронка увеличивает эти изображения в размере и в разрешении. На выходе получается набор картинок высокого качества.
🏛 Разработчики считают, что их технологию будут применять в бизнесе. Например, с её помощью можно быстро создавать качественные материалы для рекламы, архитектурного и промышленного дизайна.
Испытать возможности Kandinsky можно в мобильном приложении «Салют» или на умных устройствах Sber. Для этого нужно ввести или озвучить запрос «Включи художника».
https://messenger.sberbank.ru/sharing/fintech/821458569592