Кирилл
КириллПодписчиков: 22
РейтингРейтингРейтингРейтингРейтинг1476

LCM-LoRa: Нейронная сеть для генерации изображений в реальном времени

52 просмотрa
14 дочитываний
0 комментариев
Эта публикация уже заработала 0,71 рублей за дочитывания
Зарабатывать

Исследователи из Университета Цинхуа разработали алгоритм LCM-LoRa, который революционизирует генерацию изображений в реальном времени на основе текстовых описаний или эскизов. Следовательно, эта технология знаменует значительный прогресс в этой области.

Популярные модели преобразования текста в изображение, такие как Stable Diffusion, Midjourney и DALLE-3, обычно занимают от нескольких секунд до двух минут для создания изображения. LCM-LoRa (модель скрытой согласованности - адаптация низкого ранга), усовершенствование по сравнению со стабильной диффузией, значительно сокращает время генерации примерно до 100 миллисекунд. Таким образом, эта разработка представляет собой прорыв в эффективности и скорости.

LCM-LoRa ускоряет генерацию изображений за счет сокращения количества необходимых этапов выборки - процессов преобразования исходного текста или изображения в более детализированное и высококачественное изображение. Например, изображения генерируются алгоритмом всего за 4 шага:

LCM-LoRa: Нейронная сеть для генерации изображений в реальном времени

LCM-LoRa может обрабатывать только текстовый запрос или комбинацию текстового запроса и эскиза примитивных фигур (таких как прямоугольники, линии и овалы), или изображение, которое нуждается в модификации. Таким образом, она обеспечивает гибкость в выборе типов входных данных.

Этот метод применим не только для генерации двумерных, но и трехмерных сцен, значительно ускоряя разработку видеоигр, спецэффектов в фильмах, а также сред дополненной и смешанной реальности. Более того, сокращение количества этапов выборки подразумевает более низкие требования к вычислительным ресурсам.

Потенциально LCM-LoRa может быть интегрирована с любой моделью преобразования текста в изображение, но в настоящее время авторы протестировали ее только на Stable Diffusion. Вы можете протестировать алгоритм здесь. Код LCM-LoRa доступен публично на GitHub.

Понравилась публикация?
9 / 0
нет
Подписаться
Донаты ₽
Михаил Тимофеев
Подписчиков 1548
04.05.2024, 10:20
РейтингРейтингРейтингРейтингРейтинг264.6к
"Добро пожаловать на NeuroArt Exchange –ваш рынок цифрового искусства нового ...
Подробнее
Неинтересно
-1
4
Будь в курсе
Подписчиков 2605
27.03.2024, 14:25
РейтингРейтингРейтингРейтингРейтинг776.1к
MidJourney — это платформа, которая позволяет создавать уникальные изображения ...
Подробнее
Неинтересно
00:57
Поделитесь этим видео
-3
50
Елена
Подписчиков 444
позавчера, 02:56
РейтингРейтингРейтингРейтингРейтинг839.7к
Когда 2 года назад нейросети активно вошли в нашу жизнь, многие стали говорить, что все фрилансеры ...
Подробнее
Неинтересно
0
5