КОНЦЕПЦИЯ
Работы Михаила Александровича Врубеля трудно не узнать, если вы видели их хотя бы раз в жизни. Сложная цветовая гамма, рубленые мазки, превращающие картину в мозаичное пано, большие и бездонные глаза героев, ломающая мозг зрителя калейдоскопичность. Иногда, при взгляде на его картины может возникнуть идея, что такое изменение пространства на рисунке могла достичь и нейросеть… Этот проект направлен на то, чтобы разобраться, так ли это. Сможет ли нейросеть повторить это красочное безумие синтеза художественного символизма, модерна и романтизма?
ИСХОДНЫЕ ИЗОБРАЖЕНИЯ
Для обучения искусственного интеллекта я использовала картины М. А. Врубеля, находящиеся в открытом доступе в интернете и являющиеся общественным достоянием. Всего было взято 43 картины художника, которые при кадрировании дали 60 фрагментов размером 512×512 пикселя, на которых обучалась модель.
фрагменты, на которых обучалась модель
Портрет актрисы и жены Н. И. Забеллы-Врубель // М. А. Врубель // 1898 г. Сирень // М. А. Врубель // 1900 г.
Основными стилистическими особенностями, на мой взгляд, являются резкие, «топорные» мазки, создающие эффект калейдоскопа или мозаики, сложная, «грязноватая» цветовая гамма, вакуумное пространство.
Иллюстрации к пьесе Уильяма Шекспира, Гамлет и Офелия // М. А. Врубель // 1888 г. Примавера // М. А. Врубель // 1897 г.
фрагменты, на которых обучалась модель
ИТОГОВАЯ СЕРИЯ
На основе промтов создана серия из 6 картин в стиле М. А. Врубеля:
- «Девушка и сирень» — a painting in the style of Vrubel, portrait of a girl sitting next to a vase of lilacs, soft pastel colors, dreamy expression, delicate flowers, intimate atmosphere
«Девушка и сирень»
- «Серебристо-белое платье» — a painting in the style of Vrubel, a girl in a silver-white dress walking forward, turning back to look at the viewer, ethereal, flowing fabric, mysterious gaze, motion blur
«Серебристо-белое платье»
- «В море не спокойно» — a painting in the style of Vrubel, raging sea, stormy waves, dramatic sky, dark clouds, foam and spray, powerful ocean
«В море не спокойно»
- «Влюбленные» — a painting in the style of Vrubel, portrait of a couple in love, embracing each other, tender gaze, symbolic details, romantic mood
«Влюбленные»
- «Рассвет в лесу» — a painting in the style of Vrubel, forest at dawn, morning mist, sun rays filtering through trees, mystical atmosphere, glowing colors
«Рассвет в лесу»
- «Мужчина в галстуке» — a painting in the style of Vrubel, full-length portrait of a serious man with a purple tie, standing confidently, dark background, sharp features, formal attire
«Мужчина в галстуке»
Модель, обученная на 60 фрагментах, действительно повторяет узнаваемую манеру: ту самую вакуумность пространства, дробные мазки, которые складываются в мозаику, и характерную цветовую гамму — глубокие синие, лиловые, приглушённые золотистые оттенки. Сгенерированные картинки сохраняют эту мозаичную структуру, когда формы распадаются на отдельные цветовые пятна и собираются в целое, если немного в расфокусе. Но делает это нейросеть проще и прямолинейнее, чем художник. У Врубеля каждый мазок будто закручивает пространство, создавая ощущение головокружительного вихря. У модели эти же приёмы выглядят спокойнее, статичнее. Подозреваю, что это случилось потому, что в выборке присутствуют не только работы, написанные характерным маслом, но и более гладкие, академичные вещи — они немного сгладили итоговую фактуру. Не думаю, что это сильно ломает систему, так как изначально я и не планировала передавать масляную фактуру. Мне было важно чтобы узнаваемость была и без нее, так как у художника достаточно картин без заметной фактуры мазков.
Интереснее всего получилось с сюжетом, которого у Врубеля почти нет, — с «бушующим морем». Здесь нейросеть растерялась: вместо врубелевского хаоса вышла композиция, которая скорее напоминает акварельный набросок с налётом стилизации. Похоже, модель выучила цвет и фактуру, но не уловила, как художник деформирует пространство, чтобы передать драматургию. А вот портрет мужчины с фиолетовым галстуком и лес на рассвете получились очень близкими к духу Врубеля: тут и характерный взгляд, и пластика, и та самая калейдоскопичность.
В целом видно, что нейросеть способна освоить сложную визуальную систему и довольно убедительно её воспроизвести. Стиль Врубеля угадывается безошибочно — по цвету, мазку, общему настроению. Но передать ту физическую энергию, которая отличает настоящие работы художника, ей не удалось. И это, наверное, самый важный итог эксперимента. Даже такая упрощённая интерпретация подтверждает, что генеративные модели умеют не просто копировать, а осмысленно комбинировать визуальные приёмы, превращая обучение на фрагментах в самостоятельное творчество — пусть и лишённое материальной фактуры оригинала.
ПРОЦЕСС ОБУЧЕНИЯ
На первом этапе я подготовила среду для обучения. Проверила, что в Google Colab активирован GPU T4. Затем установила все требуемые библиотеки.
Далее скачала готовый скрипт обучения train_dreambooth_lora_sdxl.py с официального репозитория Hugging Face. После этого создала папку vrubel.
На этом этапе я визуально проверила загруженные изображения, чтобы убедиться, что они готовы для дальнейшего обучения модели.
С помощью цикла загрузила каждое изображение через Image.open (). Для быстрой проверки ограничилась первыми пятью картинками и передала их в функцию image_grid с параметрами 1 строка и 5 столбцов. В результате получила наглядное превью.
Подготовила автоматическую генерацию текстовых описаний для каждого изображения, чтобы модель во время обучения понимала, что именно изображено на картинке, и могла связывать визуальные образы с текстовыми подсказками.
Затем я определила функцию caption_images, которая принимает изображение, пропускает его через процессор (преобразует в формат, понятный модели), генерирует описание с максимальной длиной 50 токенов и возвращает полученную текстовую подпись. Это позволило мне автоматически получить осмысленные подписи для каждого изображения, которые я позже использовала для обучения.
На этом этапе я освободила оперативную и видеопамять после использования модели BLIP, чтобы подготовить среду к основному обучению.
В конце я установила библиотеку datasets, необходимую для работы с датасетом, в котором хранятся изображения и их текстовые описания.
На этом этапе я запустила процесс обучения модели Stable Diffusion XL с использованием DreamBooth и LoRA. Выставила 500 шагов, обучения заняло примерно час и семь минут.
Далее я полностью подготовила обученную модель к генерации изображений и определила список из шести промптов. Каждый из них начинается с ключевой фразы «a painting in the style of Vrubel», а затем содержит детальное описание желаемой сцены. Я заранее сформулировала эти тексты так, чтобы они максимально точно соответствовали задуманным образам: портрет девочки с сиренью, девушка в серебряном платье, бушующее море, влюблённая пара, лес на рассвете и серьёзный мужчина с фиолетовым галстуком.
В цикле for я прошлась по всем промптам, для каждого выполнила генерацию с параметрами: 25 шагов денойзинга и коэффициент следования промпту 7.5.
Таким образом, я получила шесть сгенерированных картин в узнаваемом стиле Врубеля, которые можно оценить визуально и при необходимости скачать из окружения Colab.
ЗАКЛЮЧЕНИЕ
Обученная на 60 работах Врубеля модель, действительно научилась узнаваемой манере: она воспроизводит характерную вакуумность пространства, дробные мазки, напряжённую цветовую гамму. Сгенерированные изображения сохраняют мозаичную структуру. Однако делает это проще и незамысловатее чем художник.
Можно заметить, что искусственный интеллект способен усвоить сложную визуальную систему, и вполне правдоподобно ее повторить.
ОПИСАНИЕ ПРИМЕНЕНИЯ ГЕНЕРАТИВНОЙ МОДЕЛИ
Во время выполнения проекта были использованы:
— Google Colab для запуска и выполнения кода — Stable Diffusion для обучения генеративной модели — Deepseek для создания промптов для генерации итоговых изображений




