Концепция
В основе проекта — обучение нейросети, способной не просто имитировать, но анализировать и воссоздавать визуальную грамматику признанных мастеров.
Нейросеть изучает корпус произведений, выделяя устойчивые структуры: композиционные ритмы, колористические системы, фактуру кисти и логику света. Эти элементы в своей совокупности формируют то, что мы называем художественным стилем. Для данной работы в качестве источника выбран Клод Моне — художник, чья оптика стала синонимом самого понятия «впечатление».
Ниже приведены полотна Моне, вошедшие в обучающую выборку и задавшие вектор генерации.
1. Houses of Parliament, Fog Effect, 1904 2. Rouen Cathedral, the Portal and the Tower d`Allban on the Sun, 1894
1. La Grenouillere, 1869 2. Saint-Lazare Station, Exterior View, 1877
1. San Giorgio Maggiore at Dusk, 1908 2. The Grand Canal in Venice, 1908
Ниже — серия изображений, генерированные нейросетью после обучения на картинах Клода Моне.
Серия изображений
- «Monet Painting, a serene water lily pond at dawn, soft light, vibrant pastel colors, impressionistic brushstrokes, peaceful atmosphere»
- «Monet Painting, a bustling street scene in Paris, blurred figures, foggy atmosphere, reflections on wet cobblestones, soft yellow streetlights, rich impasto textures»
«Monet Painting, a tranquil garden path with blooming flowers, subtle hues, soft focus, depth of field, natural light, a sense of fleeting moment»
- «Monet Painting, a boat on a calm river, reflections of trees and sky, delicate color transitions, hazy morning mist, characteristic loose brushstrokes»
- «Monet Painting, a field of poppies under a summer sky, vibrant reds and greens, light breeze, dappled sunlight, open-air painting style»
«Monet Painting, Rouen Cathedral facade in changing light, dramatic shadows and highlights, vibrant blues and purples, thick brushwork, atmospheric effect»
Поскольку Houses of Parliament (1904) была первой в списке загрузки и, видимо, оказала наибольшее влияние на веса модели, бóльшая серия сгенерированных изображений приобрела характерную для этой работы «туманно-лиловую оптику».
Пример туманного эффекта Houses of Parliament (посередине) на генерации
Также можно заметить, что церковь Санта-Мария-делла-Салюте с картины The Grand Canal in Venice (1908) просочилась в генерации, хотя не упоминалась ни в одном из промптов.
Процесс обучения
Для создания проекта использовался ноутбук SDXL_DreamBooth_LoRA_Colab.ipynb, предоставленный в ссылках курса, а также модель Stable Diffusion XL.
промпты
Для начала мы отбираем изображения для использования обученной модели LoRA. Код определяет список промптов, вдохновленных стилем Клода Моне, а также «отрицательный промпт» для исключения нежелательных элементов на изображениях. Затем код подготавливает сетку для отображения сгенерированных изображений. В цикле для каждого промпта используется графический процессор (GPU) для быстрой генерации изображения с помощью обученной модели, применяя заданные промпты и параметры генерации. Наконец, каждое полученное изображение отображается в соответствующей ячейке сетки, и вся сетка выводится на экран.
Следующий этап — запуск процесса обучения. Это ключевой момент технической реализации: нейросети даётся команда проанализировать изображения в обучающей выборке и выделить устойчивые стилистические закономерности. Шаг за шагом (steps) модель учится распознавать и присваивать уникальный художественный почерк, ассоциируя его с заданным триггером.
Использование генеративных нейросетей в проекте
В роли художника выступил Stable Diffusion XL (SDXL).
Для сопроводительной работы использовались Deepseek и Gemini. Deepseek помогал разрабатывать промпты для тестирования обученной модели, а также занимался редактированием текста исследования, помогал писать более точные формулировки. Gemini участвовал в написании кода, что упростило техническую реализацию проекта.
Вывод
Проект показывает, что обучение нейросети на работах художника из общественного достояния решает сразу две задачи. Во-первых, это создание эстетически привлекательных изображений. Во-вторых — возможность взглянуть на знакомое наследие через призму алгоритмов.
Результаты наглядно демонстрируют, что картина Houses of Parliament (1904) стала для нейросети главным ориентиром: её влияние прослеживается почти во всех генерациях.
В итоге проект превращается в эксперимент, где нейросеть примеряет на себя роль художника, а зритель — роль критика, угадывающего в сгенерированных образах знакомые черты полотен Моне.