Концепция
Иван Билибин, иллюстрации к «Сказке о царе Салтане», 1904–1905 гг.
Проект направлен на обучение нейросети, обладающей способностью понимать и воспроизводить визуальные стили, характерные для признанных мастеров иллюстрации и графики.
Нейросеть обучается на репрезентативной базе данных картин знаменитого художника, изучая композицию, цветовую палитру, технику мазка, особенности освещения и другие ключевые элементы, формирующие его уникальный художественный почерк
Художником, чьи работы стали основой данного проекта, является Иван Яковлевич Билибин — выдающийся русский художник, книжный иллюстратор и театральный оформитель, один из ярчайших представителей стиля модерн (Art Nouveau) в России. Билибин создал канонические визуальные образы русских сказок и былин («Царевна-Лягушка», «Василиса Прекрасная», «Сказка о царе Салтане»).
Его уникальный «билибинский стиль» строится на безупречно четком, графичном контуре тушью, внутри которого формы заливаются локальными (плоскими) цветами без использования светотеневых градиентов. Особую роль в его работах играют сложнейшие орнаменты, обрамляющие иллюстрации, и глубокое знание древнерусского зодчества и национального костюма.
Иван Билибин, иллюстрации к сказке «Василиса Прекрасная», 1899 г.
Иван Билибин, иллюстрации к «Тысяче и одной ночи», 1932 г.
Интерес к оцифровке стиля Билибина с помощью нейросетей обусловлен тем, что генеративные модели по своей природе «любят» объем, реалистичный свет, мягкие тени и 3D-рендер. Заставить нейросеть отказаться от объема, использовать строгую 2D-заливку, математически точный черный контур и логически выверенные симметричные орнаменты — это настоящий вызов и сложнейший стресс-тест для любой диффузионной модели
Процесс обучения нейросети для генерации изображений
- Сбор и очистка базы изображений (картин художника, в данном случае).
- Выбор архитектуры нейросети (например, GAN, VAE).
- Обучение генератора и дискриминатора.
- Настройка параметров обучения (скорость обучения, функция потерь).
- Визуальная оценка качества полученных изображений, корректировка, если требуется.
Техническая реализация (Код и процесс обучения)
В рамках проекта обучение проводилось в облачной среде Google Colab. Ниже представлены ключевые фрагменты кода, использованные для настройки и запуска процесса файнтюнинга, а также их краткое описание
Сначала мы устанавливаем нужные программы (библиотеки) в Google Colab. Они нужны, чтобы нейросеть могла работать с картинками и обучаться на них. Так как современные нейросети очень «тяжелые», мы используем специальные инструменты, которые сжимают процесс и позволяют запустить его даже на бесплатной видеокарте, не теряя при этом качества.
Это главная команда. Здесь мы буквально говорим нейросети: «Возьми базовую модель, посмотри наши картинки из папки датасета, запомни этот стиль по специальному кодовому слову и сделай нужное количество шагов тренировки». Чтобы облако не зависло от нехватки памяти, мы включаем экономный режим — смешанную точность и 8-битный оптимизатор. Это как упаковать большой чемодан вещей в маленькую ручную кладь.
Нейросеть шаг за шагом просматривает картинки и пытается уловить стиль Билибина. Мы используем метод LoRA — это такой «умный фильтр». Благодаря ему нейросеть не ломает свои базовые знания о мире (она всё ещё помнит, как выглядит обычный дом или волк), а просто учится рисовать эти вещи в новом, плоскостном и сказочном стиле с нужным контуром.
Картины Ивана Билибина отличаются ярким, узнаваемым стилем, который характеризуется несколькими ключевыми особенностями:
— Строгий, непрерывный графичный контур, выполненный черной тушью — Заливка локальными (плоскими) цветами без использования реалистичных светотеневых градиентов — Обилие сложных геометрических и растительных орнаментов, часто вынесенных на декоративные поля (рамки) — Стилизованное, почти орнаментальное изображение природы (закрученные волны, декоративные ветви деревьев, плоские слоистые облака) — Точное внимание к деталям древнерусского костюма, деревянной архитектуры и фольклорной эстетики
Примеры сгенерированных изображений и промпты
Для тестирования модели и раскрытия её потенциала были составлены специальные промпты, проверяющие разные аспекты стиля, включая перенос на современные сюжеты:
Baba Yaga’s wooden hut standing on giant chicken legs in a dense, dark pine forest, in the style of bilibin style, crisp black ink outlines, flat local colors, Art folklore illustration
A vast, snowy Russian steppe with a single horseman in the distance, intricate stylized bare winter branches in the foreground, in the style of bilibin style, minimalist flat colors, crisp black conto
A beautiful Russian Tsarevna wearing an ornate kokoshnik and rich patterned dress, standing in a snowy birch grove, in the style of bilibin style, traditional Slavic fairy tale illustration
A serene river flowing past a traditional Russian wooden village with onion-domed churches at sunset, in the style of bilibin style, decorative landscape illustration, folk art, precise outlines.
A young prince riding a giant magical grey wolf through a terrifying, twisted enchanted forest, in the style of bilibin style, graphic illustration, thick black outlines, muted flat colors.
A dark, enchanted forest with thick, twisted tree roots, stylized foliage and glowing mushrooms, in the style of bilibin style, Art Nouveau graphic art, clean ink lines, flat color palette.
A cyberpunk street scene with neon signs and flying cars, adapted into an Art Nouveau folklore illustration, in the style of bilibin style, thick ink outlines, flat local colors, decorative patterns.
A massive three-headed dragon breathing stylized flames over a green valley, in the style of bilibin style, traditional Russian illustration, decorative scales, flat colors, thick borders.
A skeletal, menacing king wearing a spiked crown, sitting on a throne inside a dark stone vault, in the style of bilibin style, eerie folklore illustration, high contrast black outlines, flat colors.
Как мне кажется, нейросети удалось приблизиться к уникальному стилю Ивана Билибина и передать его. В изображениях можно уловить сказочную атмосферу, специфическую цветовую гамму, попытки строить композицию с помощью орнаментальных рамок и характерную стилизацию природных элементов.
И все же нельзя не отметить, что сгенерированные нейросетью изображения далеки от идеала. Модель часто «срывается» в привычный для себя 3D-объем, добавляя ненужные тени на лицах и тканях, из-за чего теряется эффект плоской книжной иллюстрации. Строгий черный контур иногда становится грязным или прерывистым, а знаменитые билибинские орнаменты часто лишены геометрической логики и симметрии, превращаясь при детальном рассмотрении в бессмысленный абстрактный узор. Все эти вещи могут быть замечены даже непрофессиональным взглядом человека, не имеющего искусствоведческого образования.
Вывод
Итак, эксперимент с оцифровкой сказочного стиля Ивана Билибина наглядно показывает, насколько далеко продвинулось обучение нейросетей.
Если раньше ИИ с трудом справлялся с жесткими графичными контурами и локальными заливками, то современные флагманские модели, такие как Stable Diffusion 3.5, FLUX.1, Midjourney v6 и DALL-E 3, способны не только копировать сложную стилистику модерна, но и переносить её на совершенно новые, нетипичные концепты вроде киберпанка или исследования космоса. Это открывает колоссальные возможности для книжной иллюстрации, геймдева и анимации.
В целом, глубокое дообучение нейросетей (LoRA/Fine-tuning) под конкретного художника — это мощнейший инструмент, который меняет парадигму визуального производства, требуя при этом уважительного и осознанного отношения к первоисточнику и его эстетическим принципам.
Ссылка на блокнот Для генерации промптов был использован ChatGPT




