КОНЦЕПЦИЯ
Для обучения генеративной нейросети Stable Diffusion я использовала собственные иллюстрации из одной серии, созданные ранее в рамках учебного проекта. Все изображения выполнены в единой цветовой гамме и стиле, имеют схожие композиционные решения и включают повторяющихся персонажей. Всего было отобрано 20 изображений.
Иллюстрации для датасета
Поскольку я редко изображаю животных и растения, мне было особенно интересно посмотреть, как они будут интерпретированы нейросетью в моём стиле. Поэтому в итоговой серии я стремилась получить изображения именно этой тематики.
ЖИВОТНЫЕ
Полученные иллюстрации нельзя назвать идеальными, однако в них прослеживаются характерные черты моего стиля. При дополнительной доработке они могут стать основой для интересных визуальных решений.
ПРИРОДА
Нейросеть достаточно хорошо передает цветовые сочетания, мягкие переходы и оттенки, характерные для моих работ. Также ей частично удалось воспроизвести декоративные элементы, текстуры и цветной контур. В сгенерированных изображениях отсутствуют выраженные темные тени, благодаря чему их визуальный язык напоминает детские книжные иллюстрации, выполненные в акварельной технике, что также близко к моему стилю.
ЛЮДИ
Я также пробовала генерировать изображения людей, однако с этой задачей модель справлялась хуже, чем с изображениями животных.
КОД И ИНСТРУМЕНТЫ
В проекте были использованы:
Stable Diffusion XL — для обучения и генерации изображений; BLIP — для автоматической генерации описаний изображений; Chat GPT — для помощи в формулировке идеи проекта, написании текста и создании промптов.
Для генерации изображений и составления текстовых запросов (промптов) использовался Chat GPT. Первые результаты были недостаточно точными, и только после 10–20 повторов удалось получить изображения, соответствующие задумке.
ПРИМЕР КОДА
ЗАКЛЮЧЕНИЕ
В целом результат получился достаточно интересным, несмотря на небольшой объем обучающего датасета. При дальнейшем увеличении количества изображений и ручной корректировке результатов можно добиться более высокого качества и большей схожести с исходным стилем.




