Исходный размер 1814x2560

If-Else: Мулиза

Проект принимает участие в конкурсе

Идея проекта

post

Нашу кошку зовут Мулиза. Мы взяли её с улицы совсем недавно, и этот маленький пушистый комочек быстро стал настоящей частью дома.

Глядя на неё, я вдруг поймала себя на мысли: а что, если бы в тот день её нашли не мы, а кто-то совсем другой? Мне стало очень любопытно, как могла бы сложиться её жизнь в других обстоятельствах.

Поэтому я решила поэкспериментировать: обучила нейросеть на своих фотографиях и «отправила» Мулизу в разные воображаемые судьбы.

Исходные данные

Для обучения я собрала 50 фотографий Мулизы. Все снимки квадратные, 1080×1080 — обычные домашние фото, которые я делала сама.

Исходный размер 1344x576

Примеры исходных изображений

Результирующая серия изображений

Исходный размер 1024x576

#Мулиза. Настоящий контент для хозяина-блогера

Исходный размер 2123x170

Промт к изображению 1

Исходный размер 1024x576

Принцесса Мулиза I. Лучшая кошечка для королевы

Исходный размер 2123x170

Промт к изображению 2

Исходный размер 1024x576

Мулиза из супермаркета. Ответственный охранник колбасы

Исходный размер 2123x170

Промт к изображению 3

Исходный размер 1024x576

Мулиза-клоунесса. Звезда цирка Куклачёва

Исходный размер 2123x170

Промт к изображению 4

Исходный размер 1024x576

Мулиза на борту. Вместе со своим капитаном бороздит моря

Исходный размер 2123x170

Промт к изображению 5

Исходный размер 1024x576

Мулизка из деревни. Помогает бабушке выпить всё молоко

Исходный размер 2123x170

Промт к изображению 6

Исходный размер 1024x576

Мулиза-мафиози. Та самая кошка «крестного отца»

Исходный размер 2123x170

Промт к изображению 7

Исходный размер 1024x576

VIP Мулиза. Богатая и роскошная жизнь

Исходный размер 2130x165

Промт к изображению 8

Исходный размер 1024x576

Всевидящая Мулиза. Отличный компаньона для любой гадалки

Исходный размер 2123x170

Промт к изображению 9

Исходный размер 1024x576

Межгалактическая Мулиза. Подружилась даже с пришельцем

Исходный размер 2123x170

Промт к изображению 10

Исходный размер 1024x576

Одинокая Мулиза. Самый грустный из всех исходов

Исходный размер 2123x170

Промт к изображению 11

Описание результата

В итоге нейросеть сгенерировала серию из 11 изображений. Качество генераций получилось среднее, но главное удалось отлично: модель точно передала уникальные черты моей кошки — серый окрас, короткие ушки, выразительные жёлтые глаза и характерную форму мордочки. Анатомия везде правильная, без дефектов. Иногда Мулиза выходит чуть худее, иногда полнее — это даже добавляет живости, будто она живёт в разных условиях.

Людей модель генерирует заметно слабее (руки и лица часто получаются странными), поэтому я специально выбирала промпты без акцента на людях: главная героиня всегда кошка, а окружение и предметы (телефон, колбаса и т. д.) помогают раскрыть новую судьбу.

Серия полностью отразила идею проекта: «А что, если Мулизу в тот день нашли не мы?». В каждой картинке она остаётся узнаваемой именно моей Мулизой, но живёт совершенно другой жизнью — от принцессы и мафиози до одинокой кошки под дождём.

Получился тёплый и забавный лонгрид, где Мулиза всегда в центре внимания.

Принцип работы кода

Принцип работы кода

Обучение проводилось в Kaggle Notebook на GPU Tesla P100 (16 ГБ).

Процесс включал следующие этапы:

— Проверка GPU и установка необходимых библиотек (bitsandbytes, transformers, accelerate, peft, diffusers). — Скачивание официального скрипта train_dreambooth_lora_sdxl.py от Hugging Face. — Подготовка датасета: копирование 50 фотографий Мулизы, генерация подписей через BLIP и добавление токена «TOK muliza cat» в metadata.jsonl. — Запуск обучения с LoRA + DreamBooth (resolution 512, batch size 2, fp16, 8-bit Adam, 800 шагов). — Сохранение обученных LoRA-весов.

Обучение заняло примерно 1 час 12 минут. Готовые веса затем использовались для генерации изображений в Stable Diffusion XL.

Исходный размер 2017x416
Мы используем файлы cookies для улучшения работы сайта и большего удобства его использования. Более подробную информац...
Показать больше