И. И. Врубель на Geograffee

КОНЦЕПЦИЯ

Работы Михаила Александровича Врубеля трудно не узнать, если вы видели их хотя бы раз в жизни. Сложная цветовая гамма, рубленые мазки, превращающие картину в мозаичное пано, большие и бездонные глаза героев, ломающая мозг зрителя калейдоскопичность. Иногда, при взгляде на его картины может возникнуть идея, что такое изменение пространства на рисунке могла достичь и нейросеть… Этот проект направлен на то, чтобы разобраться, так ли это. Сможет ли нейросеть повторить это красочное безумие синтеза художественного символизма, модерна и романтизма?

ИСХОДНЫЕ ИЗОБРАЖЕНИЯ

Для обучения искусственного интеллекта я использовала картины М. А. Врубеля, находящиеся в открытом доступе в интернете и являющиеся общественным достоянием. Всего было взято 43 картины художника, которые при кадрировании дали 60 фрагментов размером 512×512 пикселя, на которых обучалась модель.

Исходный размер 2000x782

фрагменты, на которых обучалась модель

Портрет актрисы и жены Н. И. Забеллы-Врубель // М. А. Врубель // 1898 г. Сирень // М. А. Врубель // 1900 г.

Основными стилистическими особенностями, на мой взгляд, являются резкие, «топорные» мазки, создающие эффект калейдоскопа или мозаики, сложная, «грязноватая» цветовая гамма, вакуумное пространство.

Иллюстрации к пьесе Уильяма Шекспира, Гамлет и Офелия // М. А. Врубель // 1888 г. Примавера // М. А. Врубель // 1897 г.

Исходный размер 2000x782

фрагменты, на которых обучалась модель

ВСЕ ФРАГМЕНТЫ

ИТОГОВАЯ СЕРИЯ

На основе промтов создана серия из 6 картин в стиле М. А. Врубеля:

«Девушка и сирень» — a painting in the style of Vrubel, portrait of a girl sitting next to a vase of lilacs, soft pastel colors, dreamy expression, delicate flowers, intimate atmosphere

Исходный размер 1024x1024

«Девушка и сирень»

«Серебристо-белое платье» — a painting in the style of Vrubel, a girl in a silver-white dress walking forward, turning back to look at the viewer, ethereal, flowing fabric, mysterious gaze, motion blur

Исходный размер 1024x1024

«Серебристо-белое платье»

«В море не спокойно» — a painting in the style of Vrubel, raging sea, stormy waves, dramatic sky, dark clouds, foam and spray, powerful ocean

Исходный размер 1024x1024

«В море не спокойно»

«Влюбленные» — a painting in the style of Vrubel, portrait of a couple in love, embracing each other, tender gaze, symbolic details, romantic mood

Исходный размер 1024x1024

«Влюбленные»

«Рассвет в лесу» — a painting in the style of Vrubel, forest at dawn, morning mist, sun rays filtering through trees, mystical atmosphere, glowing colors

Исходный размер 1024x1024

«Рассвет в лесу»

«Мужчина в галстуке» — a painting in the style of Vrubel, full-length portrait of a serious man with a purple tie, standing confidently, dark background, sharp features, formal attire

Исходный размер 1024x1024

«Мужчина в галстуке»

Модель, обученная на 60 фрагментах, действительно повторяет узнаваемую манеру: ту самую вакуумность пространства, дробные мазки, которые складываются в мозаику, и характерную цветовую гамму — глубокие синие, лиловые, приглушённые золотистые оттенки. Сгенерированные картинки сохраняют эту мозаичную структуру, когда формы распадаются на отдельные цветовые пятна и собираются в целое, если немного в расфокусе. Но делает это нейросеть проще и прямолинейнее, чем художник. У Врубеля каждый мазок будто закручивает пространство, создавая ощущение головокружительного вихря. У модели эти же приёмы выглядят спокойнее, статичнее. Подозреваю, что это случилось потому, что в выборке присутствуют не только работы, написанные характерным маслом, но и более гладкие, академичные вещи — они немного сгладили итоговую фактуру. Не думаю, что это сильно ломает систему, так как изначально я и не планировала передавать масляную фактуру. Мне было важно чтобы узнаваемость была и без нее, так как у художника достаточно картин без заметной фактуры мазков.

Интереснее всего получилось с сюжетом, которого у Врубеля почти нет, — с «бушующим морем». Здесь нейросеть растерялась: вместо врубелевского хаоса вышла композиция, которая скорее напоминает акварельный набросок с налётом стилизации. Похоже, модель выучила цвет и фактуру, но не уловила, как художник деформирует пространство, чтобы передать драматургию. А вот портрет мужчины с фиолетовым галстуком и лес на рассвете получились очень близкими к духу Врубеля: тут и характерный взгляд, и пластика, и та самая калейдоскопичность.

В целом видно, что нейросеть способна освоить сложную визуальную систему и довольно убедительно её воспроизвести. Стиль Врубеля угадывается безошибочно — по цвету, мазку, общему настроению. Но передать ту физическую энергию, которая отличает настоящие работы художника, ей не удалось. И это, наверное, самый важный итог эксперимента. Даже такая упрощённая интерпретация подтверждает, что генеративные модели умеют не просто копировать, а осмысленно комбинировать визуальные приёмы, превращая обучение на фрагментах в самостоятельное творчество — пусть и лишённое материальной фактуры оригинала.

ПРОЦЕСС ОБУЧЕНИЯ

Исходный размер 1360x1088

На первом этапе я подготовила среду для обучения. Проверила, что в Google Colab активирован GPU T4. Затем установила все требуемые библиотеки.

Далее скачала готовый скрипт обучения train_dreambooth_lora_sdxl.py с официального репозитория Hugging Face. После этого создала папку vrubel.

Исходный размер 1360x1014

Исходный размер 1280x256

На этом этапе я визуально проверила загруженные изображения, чтобы убедиться, что они готовы для дальнейшего обучения модели.

С помощью цикла загрузила каждое изображение через Image.open (). Для быстрой проверки ограничилась первыми пятью картинками и передала их в функцию image_grid с параметрами 1 строка и 5 столбцов. В результате получила наглядное превью.

Исходный размер 1360x1236

Подготовила автоматическую генерацию текстовых описаний для каждого изображения, чтобы модель во время обучения понимала, что именно изображено на картинке, и могла связывать визуальные образы с текстовыми подсказками.

Затем я определила функцию caption_images, которая принимает изображение, пропускает его через процессор (преобразует в формат, понятный модели), генерирует описание с максимальной длиной 50 токенов и возвращает полученную текстовую подпись. Это позволило мне автоматически получить осмысленные подписи для каждого изображения, которые я позже использовала для обучения.

Исходный размер 1360x1088

Исходный размер 1360x752

На этом этапе я освободила оперативную и видеопамять после использования модели BLIP, чтобы подготовить среду к основному обучению.

В конце я установила библиотеку datasets, необходимую для работы с датасетом, в котором хранятся изображения и их текстовые описания.

Исходный размер 1360x1236

На этом этапе я запустила процесс обучения модели Stable Diffusion XL с использованием DreamBooth и LoRA. Выставила 500 шагов, обучения заняло примерно час и семь минут.

Далее я полностью подготовила обученную модель к генерации изображений и определила список из шести промптов. Каждый из них начинается с ключевой фразы «a painting in the style of Vrubel», а затем содержит детальное описание желаемой сцены. Я заранее сформулировала эти тексты так, чтобы они максимально точно соответствовали задуманным образам: портрет девочки с сиренью, девушка в серебряном платье, бушующее море, влюблённая пара, лес на рассвете и серьёзный мужчина с фиолетовым галстуком.

В цикле for я прошлась по всем промптам, для каждого выполнила генерацию с параметрами: 25 шагов денойзинга и коэффициент следования промпту 7.5.

Таким образом, я получила шесть сгенерированных картин в узнаваемом стиле Врубеля, которые можно оценить визуально и при необходимости скачать из окружения Colab.

ЗАКЛЮЧЕНИЕ

Обученная на 60 работах Врубеля модель, действительно научилась узнаваемой манере: она воспроизводит характерную вакуумность пространства, дробные мазки, напряжённую цветовую гамму. Сгенерированные изображения сохраняют мозаичную структуру. Однако делает это проще и незамысловатее чем художник.

Можно заметить, что искусственный интеллект способен усвоить сложную визуальную систему, и вполне правдоподобно ее повторить.

ОПИСАНИЕ ПРИМЕНЕНИЯ ГЕНЕРАТИВНОЙ МОДЕЛИ

Во время выполнения проекта были использованы:

— Google Colab для запуска и выполнения кода — Stable Diffusion для обучения генеративной модели — Deepseek для создания промптов для генерации итоговых изображений

БЛОКНОТ

ВСЕ МАТЕРИАЛЫ