Original size 1140x1600

Обучение генеративной модели Stable Diffusion под стиль Ганса Гигера

PROTECT STATUS: not protected

Гигер Рудольф Гигер (1940–2014) — швейцарский художник, известный своими картинами в жанре фантастического реализма, в которых сочетаются биологические и механические элементы. Моя цель — дообучить нейросеть, чтобы она могла генерировать изображения, вдохновленные его стилем.

Для этого я собрала датасет из 17 изображений работ Гигера. Эти изображения станут основой для дообучения модели Stable Diffusion.

Особенностью техники Ганса Гигера было использование аэрографа, позволяющего создавать тонкие и детализированные изображения.

big
Original size 1280x938

Ганс Гигер / Решетчатая структура / 1983

Художник работал без предварительных набросков, начиная с верхнего левого угла и постепенно продвигаясь к правому нижнему. Этот метод позволял ему достигать высокой концентрации и полного погружения в процесс. В поздний период своей карьеры Гигер перестал использовать аэрограф и редко демонстрировал свою технику.

Моя цель — обучить нейросеть воссоздавать характерные черты работ Гигера, такие как высокая детализация, гармоничное сочетание биологических и механических элементов, а также использование специфической цветовой гаммы.

Примеры исходных изображений для обучения

big
Original size 1182x861

Ганс Гигер / Биомеханический пейзаж / 1984

Original size 1181x850

Ганс Гигер / Биомеханический пейзаж / 1977

Original size 1177x884

Ганс Гигер / Нью-Йорк / 1980

Original size 1200x875

Ганс Гигер / Нью-Йорк — Метро / 1981

Процесс обучения

Обучение генеративной модели происходило в среде Google Colab.

Этапы:

  1. Создание дадасета (загрузка исходных изображений (17) через Google Disk)
  2. Приведение изображений к нужному формату
  3. Создание директорий
  4. Подбор промптов к исходным изображениям с помощью модели BLIP
  5. Подключение Hugging Face
  6. Запуск обучения
  7. Сохранение модели в Hugging Face Hub
  8. Генерация изображений с помощью обученной модели

Код:

Original size 1960x1226

Загрузка исходных изображений

Original size 1912x1384

Приведение изображений к нужному формату

Original size 2750x928

Этап создания директорий, проверка

Original size 2888x1146

Подбор промптов к исходным изображениям с помощью модели BLIP

Подключение Hugging Face

0

Запуск обучения

Original size 1884x410

Сохранение модели в Hugging Face Hub

Итоговая серия изображений

В ходе тестирования было найдено, что наиболее подходящий коэффициент lora_scale равен 0.8.

Чтобы изображения были объединены серией, давайте сгенерируем домашних животных в стиле Ганса Гигера!

Original size 1024x1024

Промпт: «painting in Hans Giger style, kittens and puppies run»

Original size 1024x1024

Промпт: «painting in Hans Giger style, goldfish swim in circles»

Original size 1024x1024

Промпт: «painting in Hans Giger style, parakeets chatter»

Original size 1024x1024

Промпт: «painting in Hans Giger style, bunny rabbits hop around»

Original size 1024x1024

Промпт: «painting in Hans Giger style, snails leave slimy trails»

Original size 1024x1024

Промпт: «painting in Hans Giger style, Pet rats enjoy running mazes»

Итог

У меня получилось создать картинки в соответствующей стилю художника Ганса Гигера цветовой гамме, многофигурной композиции и характерной детализации.

Обучение генеративной модели Stable Diffusion под стиль Ганса Гигера
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more