Исходный размер 1140x1600

Обучение генеративной нейросети на картинах Клода Монэ

Проект принимает участие в конкурсе

Концепция

В основе проекта — обучение нейросети, способной не просто имитировать, но анализировать и воссоздавать визуальную грамматику признанных мастеров.

Нейросеть изучает корпус произведений, выделяя устойчивые структуры: композиционные ритмы, колористические системы, фактуру кисти и логику света. Эти элементы в своей совокупности формируют то, что мы называем художественным стилем. Для данной работы в качестве источника выбран Клод Моне — художник, чья оптика стала синонимом самого понятия «впечатление».

Ниже приведены полотна Моне, вошедшие в обучающую выборку и задавшие вектор генерации.

1. Houses of Parliament, Fog Effect, 1904 2. Rouen Cathedral, the Portal and the Tower d`Allban on the Sun, 1894

1. La Grenouillere, 1869 2. Saint-Lazare Station, Exterior View, 1877

1. San Giorgio Maggiore at Dusk, 1908 2. The Grand Canal in Venice, 1908

Ниже — серия изображений, генерированные нейросетью после обучения на картинах Клода Моне.

Серия изображений

  1. «Monet Painting, a serene water lily pond at dawn, soft light, vibrant pastel colors, impressionistic brushstrokes, peaceful atmosphere»
  2. «Monet Painting, a bustling street scene in Paris, blurred figures, foggy atmosphere, reflections on wet cobblestones, soft yellow streetlights, rich impasto textures»
Исходный размер 1024x1024

«Monet Painting, a tranquil garden path with blooming flowers, subtle hues, soft focus, depth of field, natural light, a sense of fleeting moment»

  1. «Monet Painting, a boat on a calm river, reflections of trees and sky, delicate color transitions, hazy morning mist, characteristic loose brushstrokes»
  2. «Monet Painting, a field of poppies under a summer sky, vibrant reds and greens, light breeze, dappled sunlight, open-air painting style»
Исходный размер 1024x1024

«Monet Painting, Rouen Cathedral facade in changing light, dramatic shadows and highlights, vibrant blues and purples, thick brushwork, atmospheric effect»

Поскольку Houses of Parliament (1904) была первой в списке загрузки и, видимо, оказала наибольшее влияние на веса модели, бóльшая серия сгенерированных изображений приобрела характерную для этой работы «туманно-лиловую оптику».

Исходный размер 1827x600

Пример туманного эффекта Houses of Parliament (посередине) на генерации

Также можно заметить, что церковь Санта-Мария-делла-Салюте с картины The Grand Canal in Venice (1908) просочилась в генерации, хотя не упоминалась ни в одном из промптов.

Исходный размер 3528x1129

Процесс обучения

Для создания проекта использовался ноутбук SDXL_DreamBooth_LoRA_Colab.ipynb, предоставленный в ссылках курса, а также модель Stable Diffusion XL.

Исходный размер 1375x334

промпты

Для начала мы отбираем изображения для использования обученной модели LoRA. Код определяет список промптов, вдохновленных стилем Клода Моне, а также «отрицательный промпт» для исключения нежелательных элементов на изображениях. Затем код подготавливает сетку для отображения сгенерированных изображений. В цикле для каждого промпта используется графический процессор (GPU) для быстрой генерации изображения с помощью обученной модели, применяя заданные промпты и параметры генерации. Наконец, каждое полученное изображение отображается в соответствующей ячейке сетки, и вся сетка выводится на экран.

Исходный размер 1478x626

Следующий этап — запуск процесса обучения. Это ключевой момент технической реализации: нейросети даётся команда проанализировать изображения в обучающей выборке и выделить устойчивые стилистические закономерности. Шаг за шагом (steps) модель учится распознавать и присваивать уникальный художественный почерк, ассоциируя его с заданным триггером.

Исходный размер 1392x1016
Исходный размер 1348x896

Использование генеративных нейросетей в проекте

В роли художника выступил Stable Diffusion XL (SDXL).

Для сопроводительной работы использовались Deepseek и Gemini. Deepseek помогал разрабатывать промпты для тестирования обученной модели, а также занимался редактированием текста исследования, помогал писать более точные формулировки. Gemini участвовал в написании кода, что упростило техническую реализацию проекта.

Вывод

Проект показывает, что обучение нейросети на работах художника из общественного достояния решает сразу две задачи. Во-первых, это создание эстетически привлекательных изображений. Во-вторых — возможность взглянуть на знакомое наследие через призму алгоритмов.

Результаты наглядно демонстрируют, что картина Houses of Parliament (1904) стала для нейросети главным ориентиром: её влияние прослеживается почти во всех генерациях.

В итоге проект превращается в эксперимент, где нейросеть примеряет на себя роль художника, а зритель — роль критика, угадывающего в сгенерированных образах знакомые черты полотен Моне.

Обучение генеративной нейросети на картинах Клода Монэ
Проект создан 24.03.2026
Загрузка...
Мы используем файлы cookies для улучшения работы сайта и большего удобства его использования. Более подробную информац...
Показать больше