

Примеры оригинальных фотографий
///Концепция///
Серия генеративных изображений была создана на основе фотосъемки в постапокалиптичном сеттинге. Идея в основе изображений, созданных нейросетью, заключалась в расширении визуального нарратива оригинальных фотографий и создании иллюстраций-концепций, посвященных эстетическому прочтению образа города-призрака и фантомный катастрофы.
Исходная серия снимков была сформирована в качестве серии фэшн-фотографии, в свою очередь генеративная серия должна была развить оригинальный нарратив как более кинематографичное, иллюстративное прочтение темы.


Примеры оригинальных фотографий
///Финальная серия изображений///
1>>> autumn landscape

2>>> train station intersection, midnight
3>>> city square crowd
4>>> car on the street
5>>> bus station, eastern europe, rain
6>>> somebody, alone in autumn trainstation
7>>> melancholic suburban view, postapocalypse vibe, 18:00 PM
///Техническое описание///
Процесс обучения// Архитектура и параметры:
>>>Базовая модель: Stable Diffusion XL 1.0 >>>Метод адаптации: Dreambooth с LoRA >>>Размер датасета: 14 изображений >>>Количество шагов: 25 >>>Разрешение: 1024×1024 пикселей
///Описание применения генеративной модели///
Использованные модели ИИ:
Stable Diffusion XL 1.0 Ссылка: https://huggingface.co/stabilityai/stable-diffusion-xl-base-1.0 //Цель: Базовая архитектура для генерации изображений
BLIP (Bootstrapping Language-Image Pre-training) — Ссылка: https://huggingface.co/Salesforce/blip-image-captioning-base //Цель: Автоматическая аннотация обучающих изображений
Dreambooth + LoRA //Цель: Персонализация базовой модели под заданный стиль
///Описание процесса обучения///
Обучение:
Обучение проводилось на датасете реальных фотографий, содержащем ограниченное количество изображений в единой визуальной обработке. Для улучшения качества результатов использовались gradient checkpointing и 8-битная оптимизация.
Анализ корреляции концепций:
Проект демонстрирует симбиоз реальной съемки и нейросетевого прочтения концепции.
> > > Модели удалось усвоить ключевые принципы воспроизведения, переданы элементы стиля:
>>>Цветовая интеграция: Приглушенные и монохромные изображения в холодных тонах;
>>>Освещение: точечное контрастное освещение, естественный источник в качестве точки света, наделенный при этом резким визуальным весом;
>>>Структурная адаптация: ракурсы соответствуют точкам съемки, заданным изначальным датасетом.


1>>> оригинальное изображение// 2>>> генеративное изображение #3
///Описание итоговых изображений///
Визуальный анализ изображений:
>>>1 autumn landscape: превалируют приглушенные красноватые и серые оттенки, создается необходимый эффект тревожного состояния, сохранены ключевые элементы оригинальных локаций, световая имитация воспроизводит схему естественного высококонтрастного освещения// наличие артефактов, неравномерность текстуры
>>>2 train station intersection, midnight: несмотря на отсутствие в оригинальном датасете ночных изображений, хорошо переданы ключи освещения и колорита, сохранено ракурсное расстояние, сохранены основные принципы композиции
>>>3 city square, crowd: отдельные участники толпы визуально отсылаются на портреты в оригинальном датасете, сохранены принципы освещения и распределения светотеневой моделировки// большее количество артефактов при генерации фигур людей
>>>4 car on the street: сохранены принципы оригинальной концепции — автомобиль изображен разбитым, подходящим под тон постапокалиптичного мира, оттенки и освещение соответствуют оригинальным.
>>>5 bus station, eastern Europe, rain: несмотря на отсутствие в оригинальном датасете изображений с дождем, удается передать основные принципы освещения и колорита, сохранена композиция и стилизация антропоморфных фигур// большее количество артефактов при генерации людей
>>>6 somebody, alone in autumn trainstation: сохранены принципы кадрирования и оригинальной композиции, отображен точный временной сезон, хорошо передана локация// артефакты в изображении человека
>>>7 melancholic suburban view, postapocalypse vibe, 18:00 PM: хорошо переданы принципы реального-нереального освещения и задано настроение в соответствии с исходным датасетом, сохранены ключевые для концепции объекты в пейзаже




