Исходные изображения
За основу проекта я решила взять мозаичный узор. Было интересно посмотреть, как нейросеть будет создавать изображения в данной стилистике



Я подобрала 20 изображений для обучения модели с фотостока Unsplash. Все изображения имеют лицензию «Unsplash License» — она разрешает свободно использовать изображения в любых целях.


Для удобной работы с нейросетью я привела изображения к формату 1:1
Процесс обучения
В рамках проекта обучение проводилось в облачной среде Google Colab с использованием метода LoRA (Low-Rank Adaptation). Этот подход позволяет дообучить тяжелую базовую модель (например, Stable Diffusion), обновляя лишь небольшую часть алгоритмов, что делает процесс быстрым и эффективным.
Загрузка датасета
Ввод токена «photo in M style»
Запуск обучения нейросети
Итоговые изображения
Для тестирования модели и раскрытия её потенциала были составлены специальные промпты, проверяющие разные аспекты стиля:
Промпты:
1/ A surreal human face shown in profile, looking at a stylized bird, photo in Mosaic style, tesserae carefully following the contours of the cheek and eye, highly textured.»
2/ A macro shot of a large human eye, showing exactly how individual square tiles of blue and brown make up the iris, photo in Mosaic style, distinct grout lines visible.»
3/ Close-up of a curved archway decorated with intricate floral mosaic patterns, photo in Mosaic style, curved tile placement following the architectural shape.
4/ A crescent moon and swirling stars in a deep night sky, photo in Mosaic style, deep blue smalt and shimmering silver tiles, thick dark grout separating the pieces.
5/ A stylized medieval dragon breathing fire, photo in Mosaic style, rigid stone tiles, medieval floor mosaic aesthetic, earthy red, ochre and black palette.
6/ A stylized, stark human skull against a dark red background, photo in Mosaic style, made of small pale square stones, ancient roman mosaic aesthetic.
6/ Abstract organic shapes and sunburst patterns, photo in Mosaic style, trencadis technique, made of large, irregularly broken pieces of glossy colorful ceramic plates.
7/ A bold, chaotic arrangement of large colorful glass fragments forming a dynamic abstract composition, photo in Mosaic style, heavy textured cement filling the large gaps.
8/ A classic still life showing a basket of fruit and grapes, photo in Mosaic style, built with tiny micro-mosaic stones, subtle stepping of colors to create volume.
9/ A vibrant, smiling sun with stylized radiating rays, photo in Mosaic style, small square ceramic tiles, clear cement grout lines, warm orange and yellow colors.
Вывод
Как мне кажется, нейросети удалось приблизиться к уникальной технике мозаики и передать ее. В изображениях можно уловить характерную «лоскутную» фактуру, попытки разделить цвета затиркой и имитацию колотого камня или глянцевой смальты. И все же нельзя не отметить, что нейросеть часто генерирует «кусочки», которые при ближайшем рассмотрении сливаются друг с другом. Страдает логика укладки: ИИ часто располагает ряды камней хаотичной сеткой, как будто это просто наложенный поверх фотографии фильтр. Швы между камнями порой исчезают или, наоборот, превращаются в бессмысленные черные пятна.




