Исходный размер 1090x1595

Музыка в цифрах: анализ данных Spotify

PROTECT STATUS: not protected

Рубрикатор

  1. Концепция
  2. Введение
  3. Цветовая палитра
  4. Анализ популярности артистов
  5. Анализ продолжительности треков и количества выпущенных песен в год
  6. Анализ наличия PAL
  7. Анализ зависимости аудио характеристик к популярности
  8. Анализ тенденций среди слушателей
  9. Вывод
  10. Описание применения генеративной модели
  11. Ссылки

Концепция

Для анализа данных я выбрала информацию о музыкальных треках, их аудиохарактеристиках и популярности на стриминговой платформе Spotify.
 Датасет был найден на платформе Kaggle и представляет собой набор данных о тысячах песен, включающий метаданные и подробные аудиометрики, рассчитанные алгоритмами платформы.
 Мне было интересно проанализировать именно эти данные, так как Spotify является крупнейшем игроком в индустрии музыкального стриминга, и его тренды отражают мировые предпочтения слушателей.
 Важно: данные актуальны по 2023 год

Введение

Для визуализации данных я использовала следующие типы графиков:

  1. Столбчатая диаграмма — для составления рейтинга артистов по средней популярности песен
  2. Гистограмма — для сравнения средней временной продолжительности треков, а также для выявления количества выущенных песен на платформе в год
  3. Круговая диаграмма — распределение песен по наличию нецензурной лексики
  4. Точечная диаграмма — для выявления связи между аудиохарактеристиками песни и ее популярности
  5. Тепловая карта нормализованных характеристик — для рассмотрения эволюции в музыкальных предпочтениях слушателей по годам

Цветовая палитра

Исходный размер 2940x1274

Анализ популярности артистов

Я использовала код, чтобы проанализировать среднюю популярность артистов по средней популярности их песен. Этот анализ показывает самых успешных исполнителей датасета и позволяет сравнивать их между собой.

Исходный размер 2782x1582

Анализ продолжительности треков и количества выпущенных песен в год

Также с помощью кода были построены гистограммы для сравнения продолжительности треков в датасете, а также для выявления среднего числа выпускаемых работ в год.

Исходный размер 2940x1750

Анализ наличия PAL

Далее мне стало интересно понять, какой процент треков датасета имеет нецензурную лексику в своих текстах. Для этого я построила круговую диаграмму, которая отлично это демонстрирует.

0

Анализ зависимости аудио характеристик к популярности

Для одного из самых интересных и сложных анализов была выбрана точечная диаграмма, которая показывает зависимость популярности композиции от ее аудио характеристик.

Исходный размер 2846x1766
Исходный размер 1734x1398

Анализ тенденций среди слушателей

Финальный анализ включает в себя сразу большое количество показателей, которые помогают нам отследить предпочтения и тенденции слушателей по годам. Для этого был написан код с акцентом на нормализацию музыкальных характеристик и их визуализацию в виде тепловой карты, показывающей эволюцию музыкальных предпочтений с 1990 года по настоящее время. Этот анализ демонстрирует, как менялись музыкальные характеристики от года к году, какие тренды наблюдаются в развитии музыкальных предпочтений аудитории, и позволяет выявить периоды наиболее значительных изменений в музыкальной индустрии.

Исходный размер 2772x1748
Исходный размер 2026x1560

Вывод

Анализ, выбранных мной данных, показал, что популярность треков зависит от множества факторов: жанра, энергетики, длительности, года выпуска и наличия explicit-контента. Топ-артисты поддерживают стабильно высокую популярность, музыкальные характеристики эволюционируют во времени, отражая изменения в технологиях, культуре и вкусах аудитории. Анализ выявил корреляцию между энергетичностью и популярностью, оптимальную длительность треков и динамику предпочтений по годам, что может быть использовано артистами, продюсерами и платформами для оптимизации музыкального контента и рекомендательных систем.

Описание применения генеративной модели

В проекте использована большая языковая модель Claude (версия 4.5), которая помогла с написанием кода и устранением ошибок в нем.

Музыка в цифрах: анализ данных Spotify
Проект создан 17.01.2026
Мы используем файлы cookies для улучшения работы сайта и большего удобства его использования. Более подробную информац...
Показать больше