Описание идеи
Целью данного проекта является обучение генеративной нейросети Stable Diffusion для создания изображений в художественном стиле австрийского художника-экспрессиониста Эгона Шиле. Его работы наполнены тревогой, психологическим напряжением и тоской. Его безжалостные, искаженные портреты, где человеческое тело предстает изломанным, истощенным, с неестественно вытянутыми конечностями и огромными, узловатыми руками. Основная идея проекта заключается в исследовании возможностей современных технологий искусственного интеллекта по воспроизведению визуальных особенностей уникального художественного стиля и генерации новых изображений на его основе.
В рамках проекта была использована модель Stable Diffusion. Для обучения был собран датасет из изображений работ художника, приведённых к квадратному формату (1:1). После обучения модель использовалась для генерации серии новых изображений, демонстрирующих характерные черты стиля — выразительную линию, деформацию пропорций и эмоциональную выразительность.
Обучение нейросети стилю художника Эгон Шиле связано с тем, что его художественная манера отличается от типичных результатов генеративных моделей. Обычно нейросети стремятся создавать «правильные» изображения — с реалистичной анатомией, ровными пропорциями и гармоничной цветовой гаммой. В данном проекте задача заключалась в том, чтобы научить модель создавать намеренно неидеальные формы, использовать более резкие линии и характерную цветовую палитру.
Итоговая серия изображений
С помощью нейросети были составлены промпты: 1: «Close-up of nervous, skeletal hands with elongated, knotted fingers resting on a pale thigh, photo in Egon style, harsh pencil outlines, sickly skin tones.»
На данных изображениях получилось передать эффект сплетенных тел и неестественных поз. Как и в картинах художника, тела имеют вытянутые конечности, подчеркнутые суставы и напряженные лица. Здесь главное не реализм, а эмоции, что удалось передать. Также изображения имеют характерный грифельный контур, который будто размазан. .
Промпт: «Old, decaying wooden boats moored on a murky, lifeless river, photo in Egon style, geometric and angular shapes, dreary mood, textured watercolor wash.»
Промпт: «Two emaciated figures holding each other in a desperate, tangled embrace, photo in Egon style, complex overlapping limbs, raw anatomy, muted earthy watercolors.»
Как и в работах художника, здесь сохраняется ограниченная цветовая палитра: охристые, темно-зеленые, бежевые и серые оттенки.
Промпт: «A skinny, cybernetically enhanced hacker plugged into a machine, wires wrapping around pale limbs, photo in Egon style, angular tech, nervous line art, sickly neon colors.»
В целом можно сказать, что нейросети удалось частично освоить характерный стиль художника Эгон Шиле. В созданных изображениях заметны элементы его эстетики: стремление к искажению пропорций, использование землистых оттенков с цветными акцентами на коже и попытки воспроизвести резкий, графичный контур. Однако это все еще не идеально. Модель часто старается «исправить» фигуры и сделать их более привычными, поэтому вместо выразительной худобы и напряжённой пластики иногда получаются просто странные или неудачно деформированные персонажи. Также заметно, что нейросети сложно работать с пустым пространством — она часто добавляет лишние детали или фон, хотя в оригинальном стиле он обычно остаётся минималистичным.
Описание процесса обучения
1. Подбор и подготовка набора изображений для обучения. 2. Определение подходящей модели нейросети. 3. Запуск процесса обучения генеративной модели. 4. Настройка основных параметров обучения. 5. Анализ полученных изображений.
Сначала я установила библиотеки, которые нужны для обучения модели и работы с методом LoRA.
Далее я создала папку и загрузила в нее изображения, затем я вывела несколько изображений для проверки.
На этом этапе я использовала модель для генерации подписей к изображениям. Эти подписи нужны модели, чтобы понимать, что изображено и какой стиль нужно изучить.
Здесь я запустила процесс обучения модели. Использовался метод LoRA.
На последнем этапе я проверила результат обучения и сгенерировала новое изображение в изученном стиле по текстовому описанию.
Выводы
Таким образом, проект демонстрирует возможности генеративных нейросетей в области цифрового искусства и показывает, как технологии машинного обучения могут использоваться для анализа и воспроизведения художественного стиля. Не всегда идеально и точно, но характерные черты ей точно удалось передать.
Для генерации промптов был использован Claude Sonnet 4.5.




