Исходный размер 724x966

Участники оллимпиад

PROTECT STATUS: not protected
Исходный размер 1220x686

В данном проекте я исследую данные об олимпийских спортсменах, взятые из датасета с сайта Kaggle, olympics_athletes_dataset.csv. В нём содержится информация о поле, возрасте, виде спорта, годе участия, а также физических характеристиках спортсменов.

Исходный размер 1200x1390

Данная тема была выбрана, так как Олимпийские игры представляют собой значимое мировое событие, объединяющее спортсменов из разных стран. Анализ таких данных позволяет выявить интересные закономерности.

Визуализация

Исходный размер 900x360

Для визуализации данных были выбраны несколько типов графиков: линейный график, столбчатая диаграмма, гистограмма и круговая диаграмма. Линейный график использовался для отображения изменения среднего возраста по годам, столбчатая диаграмма — для сравнения количества спортсменов по полу, гистограмма — для анализа распределения возраста, а круговая диаграмма — для наглядного представления наиболее популярных видов спорта.

Оформление я взяла из айдентики олимпиады 1976. Оранжевый — цвет, который чаще всего ассоциируется со спортом.

Загрузка данных

Работа с данными началась с их загрузки с помощью библиотеки pandas. После этого были выбраны только необходимые столбцы, содержащие ключевую информацию для анализа: пол, возраст, вид спорта, год, рост и вес. После этого данные были сгруппированы по годам для расчёта среднего возраста спортсменов, а также подсчитано количество значений для разных признаков

Исходный размер 1692x1212

Обработка данных и построение графиков

Линейная диаграмма

Исходный размер 1688x1096
Исходный размер 3315x1649

Столбчатая диаграмма

Исходный размер 1680x540
Исходный размер 1576x1126

Гистограмма

Исходный размер 1682x410
Исходный размер 2075x1413

Круговая диаграмма

Исходный размер 1680x358
Исходный размер 1512x1519

Заключение

Средний возраст спортсменов остаётся относительно стабильным на протяжении разных лет, а большинство участников находится в определённом возрастном диапазоне. Также наблюдается различие в количестве спортсменов по полу и концентрация участников в наиболее популярных видах спорта. Использование визуализации позволило упростить восприятие информации и сделать анализ более наглядным. Применение различных типов графиков дало возможность рассмотреть данные с разных сторон.

В большинстве видов спорта максимальные результаты достигаются в определённом возрастном диапазоне, что связано с сочетанием физической выносливости, силы, скорости и накопленного опыта.

В процессе выполнения проекта использовались нейросетевые инструменты (ChatGPT) в качестве вспомогательного средства. Они применялись для уточнения синтаксиса кода, а также для улучшения визуализации графиков. Были подобраны варианты оформления графиков и улучшено расположение элементов.

Участники оллимпиад
Проект создан 22.03.2026
Мы используем файлы cookies для улучшения работы сайта и большего удобства его использования. Более подробную информац...
Показать больше