Исходный размер 1140x1600

Анализ данных и визуализация. Здоровый сон и образ жизни

Введение

Для анализа были выбранны данные о здоровом сне и образе жизни. В таблице из 13  столбцов и 374 строк охвачена информация о продолжительности сна, уровне активности, качестве сна, уровне стресса и многом другом. С помощью этих данных можно отследить взаимосвязь одних факторов с другими, их потенциальное влияние на весь организм и общее самочувствие.

В качестве наиболее удобного вида для визуализации данной информации были выбраны гистограммы, так как они позволяют отследить зависимость одного фактора от другого, а также рассеивающие диаграммы, чтобы показать частотность.

Данные были взяты с ресурса Kaggle.

Описание применения генеративной модели

При создании диаграмм я обращалась к ChatGPT, чтобы выяснить, как совершать те или иные операции, какие функции при этом можно использовать. Все использованные промпты приведены далее.

Обложка проекта была сгенерирована с помощью Stable Diffusion XL по запросу: «A troubled man suffering from insomnia blue colour palette»

Этапы работы

Форматирование таблицы

Первым шагом я загрузила дополнительные библиотеки, которые позже могут помочь в создании диаграмм, и вывела таблицу с данными с помощью функции .read_csv

Исходный размер 1813x702

После первоначального вывода таблицы было обнаружено, что в столбце «BMI  Cathegory» присутствуют два значения, одинаковых по смыслу (Normal weight и Normal). Однако, за счет того, что они записаны по-разному, Python отнес бы их к разным категориям, что могло бы помешать рассчетам.

Чтобы избежать этой проблемы, я объединила эти категории в одну, назвав ее „Normal». Для этого была использована функция .replace (значение Normal weight было заменено на Normal)

Запрос в ChatGPT: „какая функция заменит одно значение другим в Python»

Исходный размер 1776x612

Далее было замечено, что в столбце «Sleep Disorder» в местах пропусков (у тех опрашиваемых, у кого не было обнаружено каких-либо расстройств сна) стоит NaN, что обозначает пустую ячейку. Однако такая ячейка не будет считываться в отдельную категорию при выводе графика, поэтому я заменила значение NaN на No  Sleep Disorder с помощью функции .fillna (), заменяющей все значения NaN в указаном столбце на новые значения.

Запрос в ChatGPT: „как заменить значение NaN в столбце „Sleep Disorder“ на значение „No  Sleep Disorder“ код“

Исходный размер 1817x702

Создание диаграмм

Для диаграмм была выбрана спокойная пастельная цветовая гамма, так как именно с такими цветами у меня ассоциируется сон, которому посвящена основная часть датасета. Фон выбран черный, так как на нем лучше видно светлые тона.

Для начала я решила выяснить, сколько представителей каждой профессии страдают от разных расстройств сна.

Исходный размер 761x213

Поэтапный процесс

  1. Установка стиля графика (whitegrid)
  2. Установка темного фона графика
  3. Создание столбчатой диаграммы, указали, данные из каких столбцов будут отображаться на каждой оси, установка палитры (pastel)
  4. Установка заголовка графика
  5. Поворот подписей на оси x  на 90  градусов, чтобы они не накладывались друг на друга
  6. Установка заголовка оси x
  7. Установка заголовка оси y
  8. Добавление легенды графика в правом верхнем углу
  9. Отображение графика
Исходный размер 580x587

Глядя на построенный график можно отметить, что:

— Среди инженеров-программистов, врачей, инженеров, бугалтеров наибольшее количество опрашиваемых не страдают расстройствами сна — Большинство медсестер страдает остановками дыхания во время сна (Sleep Apnea  — апноэ) — Среди учителей и продавцов большинство имеют бессонницу — В целом наибольшее количество больных апноэ наблюдается среди медсестер. Возможно это связано с тем, что у них ненормированный график работы, что негативно сказывается на сне.

Далее рассмотрим как уровень физической активности влияет на уровень стресса.

Исходный размер 763x215

Поэтапный процесс:

  1. Создание столбчатой диаграммы
  2. Установка черного фона
  3. Установка заголовка для оси х
  4. Установка заголовка для оси у
  5. Установка заголовка для диаграммы
  6. Отображение диаграммы
Исходный размер 554x455

Итак, можно сделать следующий вывод:

— У людей с высокой активностью (65  — 85  минут ежедневно) уровень стресса в среднем меньше чем у людей, тратящих меньшее количество времени на физ.активность. — Примечательно, что у людей с активностью 90  мин/день высокий уровень стресса. Это может сигнализировать о том, что такой уровень активности является для них чрезмерным

Также интересно было бы выяснить, зависит ли качество сна от уровня физической активности.

Исходный размер 1122x195

Поэтапный процесс

  1. Создание фигуры для графика
  2. Установка черного фона
  3. Создание рассеивающей диаграммы, указываем, информацию из какого столбца помещаем на какую ось. Цвет точек зависит от качества сна
  4. Установка заголовка оси х
  5. Установка заголовка оси у
  6. Установка заголовка диаграммы
  7. Установка отображения сетки графика, для лучшей ориентации по графику
  8. Отображение графика
Исходный размер 678x547

Из диаграммы можно сделать следующий вывод:

— качество сна прямо пропорционально уровню физической активности

Рассмотрим, насколько ИМТ зависит от количества шагов в день.

Исходный размер 1180x303

Поэтапный процесс:

  1. Создаем словарь, ключами в которой являются категории ИМТ, а значениями — разные пастельные цвета. Таким образом, каждая категория ИМТ будет иметь собственный цвет
  2. Создание фигуры (поля) для диаграммы
  3. Создание рассеивающей диаграммы, каждой оси присваивается столбец из датасета.
  4. Присвоение каждой метке на оси х значение одной из категорий ИМТ
  5. Установка заголовка для оси у
  6. Установка заголовка для оси х
  7. Установка заголовка диаграммы
  8. Отображение сетки в диаграмме для более удобной ориентации
  9. Установка черного фона
  10. Отображение диаграммы
Исходный размер 868x701

На диаграмме прослеживается следующая закономерность:

— Люди с нормальным весом (категория Normal) проходят в среднем большее количество шагов в день чем люди из других категорий. Люди с сильным ожирением (категория Obese) имеют минимальную физическую активность

Выясним, взаимосвязаны ли ИМТ и расстройства сна.

Исходный размер 1145x249

Поэтапный процесс:

  1. Группировка данных из стобцов BMI Category и Sleep Disorder
  2. Создание столбчатой диаграммы
  3. Установка черного фона
  4. Установка заголовка для оси х
  5. Установка заголовка для оси у
  6. Установка заголовка для таблицы
  7. Создание легенды для таблицы
  8. Отображение диаграммы
Исходный размер 850x613

Глядя на диаграмму, можно проследить следующие закономерности:

— большая часть людей с нормальным весом не имеет проблем со сном — люди с небольшой и повышенной степенью ожирения имеют в одинаковом количестве как проблемы с бессонницей, так и апноэ — избыточный вес может влиять на возникновение проблем со сном

Анализ данных и визуализация. Здоровый сон и образ жизни
Проект создан 25.09.2024
Мы используем файлы cookies для улучшения работы сайта и большего удобства его использования. Более подробную информац...
Показать больше