Обучение генеративной модели на основе картин Фриды Кало на Geograffee

Фрида Кало — мексиканская художница (1907–1954), чьи автопортреты и сюрреалистические полотна полны автобиографизма, боли и мексиканского фольклора.

Её яркие работы — «Две Фриды», «Колонна разрыва», «Самопортрет с колючими ветками» — сочетают реализм, символизм и экспрессивные цвета, отражая личные трагедии, инвалидность и страстные чувства к Диего Ривере.

Исходный размер 1271x549

Для анализа и обучения модели использовалось 23 картины художницы разных форматов: от портретов до натюрмортов.

Цель проекта — протестировать, насколько генеративная модель анализирует и воспроизводит уникальный стиль Фриды Кало. На основе её автопортретов с мексиканским фольклором, символизмом и экспрессивной палитрой хотим понять, как нейросеть улавливает автобиографические мотивы, эмоциональную насыщенность и культурные детали.

БЛОКНОТ

Сначала изображения работ Фрида Кало были загружены в рабочую среду Google Colab, где на их основе формировался датасет для обучения модели. В выборку вошли произведения разных типов — преимущественно автопортреты, а также натюрморты и композиции с символическими элементами.

На следующем этапе для каждого изображения автоматически создавались текстовые описания с помощью модели BLIP. Это позволило связать визуальные особенности картин — характерную палитру, символику, элементы мексиканского фольклора — с их семантическим содержанием.

Исходный размер 3561x928

Исходный размер 3558x1433

Далее был запущен процесс обучения модели. В качестве базовой архитектуры использовалась Stable Diffusion XL, а настройка под стиль художницы осуществлялась с применением DreamBooth и LoRA. Обучение проводилось через специализированный скрипт.

Гиперпараметры подбирались с учётом ограничений Google Colab, чтобы сохранить стабильность обучения и при этом обеспечить корректное усвоение ключевых особенностей стиля: экспрессивного цвета, символизма и автобиографической образности.

После завершения обучения полученные веса интегрировались обратно в базовую модель через библиотеку Diffusers. Это позволило использовать обученный стиль для генерации новых изображений по текстовым запросам.

Результаты показали, что модель способна воспроизводить характерные черты работ Кало: композицию автопортрета, насыщенную палитру и символические детали.

Исходный размер 3559x256

При этом генерации сохраняют общий визуальный язык художницы, но интерпретируют его в новых композициях.

Исходный размер 3545x775

Исходный размер 3551x793

Исходный размер 3538x1429

Таким образом, даже при небольшом объёме датасета модель продемонстрировала способность улавливать не только формальные признаки, но и эмоционально-смысловую составляющую работ, подтверждая потенциал генеративных моделей для анализа и воспроизведения сложных авторских стилей.

РЕЗУЛЬТАТ

art in Frida Kahlo style, couple portrait holding hands, symbolic connection, naive composition

art in Frida Kahlo style, man portrait, frontal pose, muted earthy tones, flat background

art in Frida Kahlo style, self-portrait with symbolic wounds, surreal elements, muted earthy palette, flat perspective

art in Frida Kahlo style, still life with cut watermelon and papaya, rich red tones, symbolic composition

art in Frida Kahlo style, still life with tropical fruits, symbolic arrangement, warm palette

art in Frida Kahlo style, symbolic still life with cut fruits and seeds, textured surface

art in Frida Kahlo style, woman holding fruit, surreal symbolism, detailed still life, earthy colors

art in Frida Kahlo style, woman surrounded by tropical plants, still pose, flat lighting, intimate mood

Исходный размер 1024x1024

art in Frida Kahlo style, woman with animals, direct gaze, botanical background, detailed textures, warm tones

ИСПОЛЬЗОВАНИЕ ИИ

Stable Diffusion XL (SDXL) — базовая модель для генерации https://huggingface.co/stabilityai/stable-diffusion-xl-base-1.0

BLIP — автоматическая капционировка картин (23 автопортрета Кало) https://huggingface.co/Salesforce/blip-image-captioning-base

DreamBooth — дообучение для фиксации стиля Фриды https://huggingface.co/docs/diffusers/training/dreambooth

LoRA — тонкая настройка под Colab T4 (rank=4, fp16) https://huggingface.co/docs/diffusers/training/lora

Diffusers — загрузка весов и инференс https://github.com/huggingface/diffusers

Google Colab — вычислительная среда + ноутбук https://colab.research.google.com/drive/11oETVaviOIx7cKOC5bA7W3wM_Rf7g0sY