Нейросеть на вашем компьютере: как установить и пользоваться Stable Diffusion
Время, когда нейросети, способные генерировать качественное изображение по текстовому описанию, вызывали массовое удивление, уже прошло. Такие платформы постоянно совершенствуются, активно появляются новые нейросети. Однако в большинстве случаев полный функционал доступен только после перехода на платную версию. В качестве примера можно привести популярный сервис Midjourney, который на определенном этапе развития стал платным.
Однако существуют и бесплатные решения, которые практически не уступают платным аналогам. Одна из таких нейросетей – Stable Diffusion. Проект полностью бесплатен, распространяется с открытым исходным кодом, поддерживается большим количеством энтузиастов, а также позволяет легко отказаться от цензуры в процессе генерации контента.
Описание проекта
Программа Stable Diffusion разрабатывается сообществом Stability.Ai и разделена на два модуля – нейросеть и клиентская часть для удобного взаимодействия с ней. Клиентская часть также разделена на несколько видов:
-веб-интерфейс. Не требует установки ПО, взаимодействие осуществляется через браузер. Самый простой вариант, но функционал ограничен и работает сервис заметно медленнее;
-работа через консоль. Подойдет для продвинутых пользователей в силу сложности работы с ней. Однако в этом случае сервис предоставляет больше возможностей и настроек;
-приложение с полноценным интерфейсом. Подразумевает предварительную установку на ПК приложения с удобной графической оболочкой.
Системные требования
Для запуска Stable Diffusion необходим компьютер на базе Windows версий 10 или 11, ОЗУ не менее 8 гигабайт. Также необходима видеокарта Nvidia 10xx или более новая версия, минимальный объем видеопамяти – 4 гигабайт.
Поддерживаются также компьютеры Mac (чипсет M1 и M2) и платформа Linux. Если установленная видеокарта не совместима с приложением, необходимо в настройках указать обработку данных при помощи процессора. Программа сможет полноценно работать, но процесс генерации будет занимать больше времени.
Инсталляция приложения
-необходимо скачать архив по ссылке https://stable-diffusion-ui.github.io/docs/installation/ и распаковать его в корень любого диска;
-на диске появится каталог stable-diffusion-ui, в котором необходимо найти файл Start Stable Diffusion UI.cmd и запустить его. На данном этапе только загружаются и устанавливаются дополнительные компоненты (графическая оболочка), а модель, которая используется непосредственно для генерации изображений, устанавливается отдельно;
-в сети доступны разные модели, многие из которых являются узкоспециализированными. К примеру, один проект направлен на создание пейзажей, другой на стиль аниме и т.д. Одной из самых популярных моделей сегодня является Deliberate 2.0, ориентирована на создание изображений с людьми. Загрузить ее можно по адресу https://civitai.com/models/4823/deliberate;
-выбранную модель необходимо загрузить в каталог stable-diffusion-ui\models\stable-diffusion. Если приложение запущено, его необходимо перезапустить;
-все загруженные модель отображаются в виде списка в разделе Model меню настроек. Для переключения достаточно выбрать нужный пункт.
Генерация изображений
Для генерации нового изображения нужно ввести текстовое описание, приложение поддерживает только английский язык. Аналогичный принцип используется в Midjourney и других платформах данного типа. Однако ряд отличий присутствует, например, дополнительные настройки в интерфейсе программы.
В первую очередь следует указать разрешение картинки. Оптимальным считается размер 512 пикселей для каждой стороны, более высокое разрешение будет сильно нагружать видеокарту. При необходимости можно увеличить разрешение полученной картинки при помощи соответствующего онлайн-сервиса или приложения.
Далее необходимо указать количество шагов, которые будут использованы в процессе генерации контента. Данный параметр влияет на качество, но пропорционально влияет на время создания. Рекомендуется устанавливать не более 50.
Еще одна интересная настройка – Creativeness. Позволяет указать степень свободы ИИ, то есть насколько нейросеть сможет отклоняться от текстового описания. Рекомендуется использовать значение, равное 8.
Правила создания текстового описания схожи с Midjourney. Необходимо максимально подробно указать, что пользователь хочет видеть в качестве результата, но учитывать, что используются только первые 75 слов. При этом используется система распределения веса для введенных слов – более важные должны находиться ближе к началу.
Поддерживаются стандартные операторы для явного указания веса слова – достаточно после него поставить двоеточие и нужное значение. Только нужно учитывать, что система считает суммарный вес всех слов равным 100.
Еще одна интересная функция Stable Diffusion – возможность загрузить собственное изображение и сформировать запрос на генерацию похожей картинки. В этом случае можно в виде параметра указать, насколько они должны быть похожи.
Итоги
Stable Diffusion заслужено можно позиционировать как полноценную альтернативу нейросети Midjourney, при этом сервис является бесплатным. Наличие большого числа моделей, «заточенных» под разные задачи и большое количество настроек может отпугнуть малоопытных пользователей. Однако с другой стороны, такой подход позволяет более точно указать, какое именно изображение необходимо создать.
Приветствую! Статья у вас отличная! Я с удовольствием прочитала ее и осталась впечатлена. Желаю вам дальнейших успехов и удачи в вашем творческом пути!