Original size 2474x3500

Анализ датасета COVID-19

PROTECT STATUS: not protected
2

Концепция

SARS-CoV-2, наиболее известный как COVID-19, потряс весь мир, вызвав глобальный локдаун по всему миру. Коронавирус оказал серьёзное воздействие не только на здоровье миллиардов людей, но и на мировую экономику в целом. Многим из нас 2020 год — год пандемии, запомнится как значимое, но далеко не самое весёлое событие в жизни.

Цель данной работы — провести анализ на основе датасета COVID-19 Dataset, где собрана информация о заболевших. В нём представлены данные о поле, возрасте, имеющихся заболеваниях и прочих маркерах, важных для медицинского исследования.

Цветовая гамма

big
Original size 2560x1130

В качестве основных цветов я выбрала именно те, которые можно увидеть на снимках из микроскопа — красноватый и бледно-жёлтый. На мой взгляд, они сами по себе даже ассоциируются с болезненностью, особенно жёлтый.

Визуализация данных

Первым делом я импортировала все нужные для работы библиотеки: pandas, matplotlib и numpy. А также скачала файл датасета. В качестве рабочей среды был выбран Google Colab.

big
Original size 2560x1130

Импорт нужных библиотек и смачивание файла датасета в colab

Первым пластом данных для обработки стало распределение по половому признаку. Первый график — сравнение количества заболевших среди мужчин и женщин. Здесь, как мы видим, разницы практически нет: и мужчины, и женщины, заболевали одинаково. Второй график отражает смертность по полу. Здесь наоборот заметно, что мужчины умирали реже женщин.

Original size 2560x1117

Диаграммы заболевших COVID-19 по полу и смертности по полу среди пациентов

Original size 2560x1130

Следующий график — это данные о смертности пациентов с сопутствующим COVID-19 заболеваниями. Как мы видим, наиболее высоким риском умереть от коронавируса обладали пациенты с гипертонией, а в зоне наименьшего риска находились астматики.

Original size 2560x1130

График смертности среди пациентов с сопутствующими заболеваниями

Original size 2560x1130

Далее было подобрано две метрики для сравнения: пол и возраст. Как заметно на графике, наибольшая смертность среди как мужчин, так и женщин, наблюдалась в группе 80-99 лет. И, как мы уже заметили ранее, женщины болели чаще мужчин.

Original size 2560x1130

График смертности от заболевания по возрасту и полу

Original size 2560x1130

Здесь наглядно прослеживается пик смертности у женщин и мужчин на июньский период 2020-го года. Перед этим количество смертей от COVID-19 резко начал возрастать.

Original size 2560x1130

График смертности по месяцам и полу

Original size 2560x1130

Источники

Анализ датасета COVID-19
2
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more