Концепция проекта
Создание серии изображений, в которой старинные изображения драконов расправляют свои крылья в космическом пространстве. Исследование смешения фантастических образов через генеративные технологии
Исходные изображения для обучения
Источники и права использования: — Фотографии космических кораблей Space X — Старинные рисунки и иллюстрации с драконами Все фотографии были собраны из Wikimedia с тегом «No restrictions»
Результирующая серия изображений
Далее представлены изображения с соответствующими им промтами в подписи внизу
«a draconic spaceship» «a dragon and a planet»
«a dragon in space» «a dragon in the shape of a spaceship»
«a dragon themed spaceship» «a medieval spaceship»
«dragons in space» «dragons on mars»
Развернутый комментарий результатов
Анализ соответствия концепции Проект успешно смешивает старинные иллюстрации и таинственный космос. Переданные элементы стиля: — Цветовая гамма — общая палитра у всех изображений напоминает о старинных иллюстрациях — Узнаваемость — В космических кораблях узнаются использованные в датасете модели — Мистичность — Иллюстрации выглядят таинственно и невесомо, как и положено дракону в космосе
Визуальный анализ изображений A draconic spaceship — Похожий на дракона корабль, морда деформируется в кабину
A dragon and a planet — Дракон держит в лапах планету
a dragon in space — Дракон в темном космосе
A dragon in the shape of a spaceship — немного неудачная попытка создать некий гибрид, дракон только отдаленно напоминает корабль
a dragon themed spaceship — Удачная попытка создать корабль-дракона, в нем угадываются черты использованных в обучении фото кораблей.
a medieval spaceship — Интересная генерация, потому что в промте не упоминаются драконы, но силуэты их крыльев все равно есть.
dragons in space — Наиболее удачная иллюстрация, драконы в стиле старинной иллюстрации летают в космосе.
dragons on mars — Драконы на фоне Марсианского пейзажа выглядят как кадр какого-то таинственного фильма о теории заговора.
Техническая реализация
Процесс обучения Архитектура и параметры: — Базовая модель: Stable Diffusion XL 1.0 — Метод адаптации: Dreambooth с LoRA — Размер датасета: 61 изображение — Количество шагов: 500 — Разрешение: 512×512 пикселей
Описание применения генеративной модели
Использованные модели ИИ:
Stable Diffusion XL 1.0
— Ссылка: https://huggingface.co/stabilityai/stable-diffusion-xl-base-1.0 — Цель: Базовая архитектура для генерации изображений
BLIP (Bootstrapping Language-Image Pre-training)
— Ссылка: https://huggingface.co/Salesforce/blip-image-captioning-base — Цель: Автоматическая аннотация обучающих изображений
Dreambooth \+ LoRA методик
Ноутбук




