Dragonspace на Geograffee

Концепция проекта

Создание серии изображений, в которой старинные изображения драконов расправляют свои крылья в космическом пространстве. Исследование смешения фантастических образов через генеративные технологии

Исходные изображения для обучения

Источники и права использования: — Фотографии космических кораблей Space X — Старинные рисунки и иллюстрации с драконами Все фотографии были собраны из Wikimedia с тегом «No restrictions»

Результирующая серия изображений

Далее представлены изображения с соответствующими им промтами в подписи внизу

«a draconic spaceship» «a dragon and a planet»

«a dragon in space» «a dragon in the shape of a spaceship»

«a dragon themed spaceship» «a medieval spaceship»

«dragons in space» «dragons on mars»

Развернутый комментарий результатов

Анализ соответствия концепции Проект успешно смешивает старинные иллюстрации и таинственный космос. Переданные элементы стиля: — Цветовая гамма — общая палитра у всех изображений напоминает о старинных иллюстрациях — Узнаваемость — В космических кораблях узнаются использованные в датасете модели — Мистичность — Иллюстрации выглядят таинственно и невесомо, как и положено дракону в космосе

Визуальный анализ изображений A draconic spaceship — Похожий на дракона корабль, морда деформируется в кабину

A dragon and a planet — Дракон держит в лапах планету

a dragon in space — Дракон в темном космосе

A dragon in the shape of a spaceship — немного неудачная попытка создать некий гибрид, дракон только отдаленно напоминает корабль

a dragon themed spaceship — Удачная попытка создать корабль-дракона, в нем угадываются черты использованных в обучении фото кораблей.

a medieval spaceship — Интересная генерация, потому что в промте не упоминаются драконы, но силуэты их крыльев все равно есть.

dragons in space — Наиболее удачная иллюстрация, драконы в стиле старинной иллюстрации летают в космосе.

dragons on mars — Драконы на фоне Марсианского пейзажа выглядят как кадр какого-то таинственного фильма о теории заговора.

Техническая реализация

Процесс обучения Архитектура и параметры: — Базовая модель: Stable Diffusion XL 1.0 — Метод адаптации: Dreambooth с LoRA — Размер датасета: 61 изображение — Количество шагов: 500 — Разрешение: 512×512 пикселей

Описание применения генеративной модели

Использованные модели ИИ:

Stable Diffusion XL 1.0

— Ссылка: https://huggingface.co/stabilityai/stable-diffusion-xl-base-1.0 — Цель: Базовая архитектура для генерации изображений

BLIP (Bootstrapping Language-Image Pre-training)

— Ссылка: https://huggingface.co/Salesforce/blip-image-captioning-base — Цель: Автоматическая аннотация обучающих изображений

Dreambooth \+ LoRA методик

Ноутбук