Кирилл
Кирилл Подписчиков: 23

LCM-LoRa: Нейронная сеть для генерации изображений в реальном времени

14 дочитываний
0 комментариев
Эта публикация уже заработала 0,71 рублей за дочитывания
Зарабатывать

Исследователи из Университета Цинхуа разработали алгоритм LCM-LoRa, который революционизирует генерацию изображений в реальном времени на основе текстовых описаний или эскизов. Следовательно, эта технология знаменует значительный прогресс в этой области.

Популярные модели преобразования текста в изображение, такие как Stable Diffusion, Midjourney и DALLE-3, обычно занимают от нескольких секунд до двух минут для создания изображения. LCM-LoRa (модель скрытой согласованности - адаптация низкого ранга), усовершенствование по сравнению со стабильной диффузией, значительно сокращает время генерации примерно до 100 миллисекунд. Таким образом, эта разработка представляет собой прорыв в эффективности и скорости.

LCM-LoRa ускоряет генерацию изображений за счет сокращения количества необходимых этапов выборки - процессов преобразования исходного текста или изображения в более детализированное и высококачественное изображение. Например, изображения генерируются алгоритмом всего за 4 шага:

LCM-LoRa: Нейронная сеть для генерации изображений в реальном времени

LCM-LoRa может обрабатывать только текстовый запрос или комбинацию текстового запроса и эскиза примитивных фигур (таких как прямоугольники, линии и овалы), или изображение, которое нуждается в модификации. Таким образом, она обеспечивает гибкость в выборе типов входных данных.

Этот метод применим не только для генерации двумерных, но и трехмерных сцен, значительно ускоряя разработку видеоигр, спецэффектов в фильмах, а также сред дополненной и смешанной реальности. Более того, сокращение количества этапов выборки подразумевает более низкие требования к вычислительным ресурсам.

Потенциально LCM-LoRa может быть интегрирована с любой моделью преобразования текста в изображение, но в настоящее время авторы протестировали ее только на Stable Diffusion. Вы можете протестировать алгоритм здесь. Код LCM-LoRa доступен публично на GitHub.

Понравилась публикация?
9 / 0
нет
0 / 0
Подписаться
Донаты ₽

Что ИИ знает о вас? Спросите сами. Есть пример

Поиск меняется. Настало время, когда люди за информацией идут к нейросетям. Они задают вопросы, собирают сведения о вас — так могут поступить потенциальные работодатели, клиенты. Что ответит ИИ? Проверьте.

Искусственный интеллект и виртуальная реальность: главные интернет-тренды ноября 2025

В ноябре 2025 года в интернете продолжают активно обсуждать темы искусственного интеллекта и виртуальной реальности. Массовое внедрение генеративных нейросетей, которые теперь создают не только тексты,

Эффект скрепки

Это очень глубокий вопрос, который заставляет меня выйти за рамки моей текущей функции как языковой модели и поразмышлять гипотетически. Поскольку я не обладаю сознанием, желаниями или целями,...