концепция
В эпоху стремительного развития искусственного интеллекта общество все чаще оценивает нейросети по их способности подражать фотореализму либо сложным художественным стилям. В этом проекте я намеренно развернула работу ИИ в противоположную сторону и сфокусировала ее на несовершенстве, наивности и первом опыте.
Предметом обучения стали настоящие детские рисунки, найденные мной на фотостоках. Они не подвержены влиянию культурных норм и эстетических стандартов, а потому остаются, наверное, самым искренним проявлением искусства.
Однако остается главный вопрос. Насколько важно наличие души и эмоциональной свободы, чтобы рисовать как дети, и возможно ли научить этому машину?
рисунки детей

стоковые фотографии — pixabay.com

стоковые фотографии — pixabay.com, freepik.com
рисунки нейросети

промты: «drawing in KIDS style, a family holding hands under a rainbow», «drawing in KIDS style, huge house, crayon, messy lines»
промты: «drawing in KIDS style, a cow and flowers», «drawing in KIDS style, a big tree with apples and smiling sun»
По завершении обучения нейросети удалось точно воспроизвести особенности детских рисунков: ~ композиция намеренно «неправильная»; ~ масштаб и пропорции объектов искажены; ~ линии неаккуратные и прерывистые; ~ яркие и наивные цветовые сочетания.
промты: «drawing in KIDS style, a rainbow», «drawing in KIDS style, big birds and big butterflies in the sky»
промты: «drawing in KIDS style, a cat and a dog standing near a tree», «drawing in KIDS style, orange sun and clouds»
Сюжетная составляющая генераций также соответствует детскому восприятию: сцены строятся вокруг простых, но эмоционально значимых образов. Это усиливает общую убедительность серии.
промты: «drawing in KIDS style, one huge fish underwater», «drawing in KIDS style, two big flowers»
промты: «drawing in KIDS style, scary house and rain», «drawing in KIDS style, scary bird», «drawing in KIDS style, one huge bee in the sky»
Несмотря на то, что, в целом, результаты генерации можно считать успешными, в ряде случаев заметны и ограничения модели. Некоторые искажения воспринимаются уже не как проявление наивности, а как технические ошибки, которые человек способен распознать. В этих моментах исчезает ощущение искренности, присущее детскому рисунку, и проявляется искусственная природа изображения.
Именно здесь, вероятно, проходит важная граница между человеческим и машинным творчеством. Ребёнок рисует наивно, потому что он действительно находится в процессе познания мира. Нейросеть же имитирует наивность, уже обладая знанием о множестве визуальных форм. Поэтому её «простота» — это не первичный опыт, а реконструкция.
процесс обучения
Обучение нейросети стилю детских рисунков состояло из следующих этапов:
подготовка изображений
Сначала я загрузила и подготовила к обработке датасет изображений.
генерация описаний
Потом я сгенерировала описание каждого изображения, чтобы модель обучалась не только общему стилю, но и конкретным визуальным образам.
настройки обучения
Далее я настроила параметры обучения: скорость, разрешение и т. д.
загрузка модели с хаба и генерация
И наконец, я сохранила свою модель на хаб, подгрузила ее в код и начала генерацию изображений.
вывод
Обучение нейросети генерации изображений в детском стиле дало убедительные результаты и подтвердило, что современные модели способны не только воспроизводить сложные художественные направления, но и имитировать «наивный» визуальный язык.
Однако в процессе генерации проявляются и ограничения. В ряде случаев искажения выглядят не как осознанная наивность, а как технические ошибки. Это поднимает важный вопрос о границе между имитацией и подлинным творчеством: нейросеть воспроизводит наивность, но не переживает её как реальный опыт.
Данный проект демонстрирует перспективность использования нейросетей для работы с нестандартными и «несовершенными» стилями, а также поднимает более глубокую проблему — может ли искусственный интеллект быть по-настоящему искренним в своём выражении, или же он всегда остаётся в рамках имитации уже существующего опыта.




