Рубрикатор
- Концепция
- Введение
- Цветовая палитра
- Анализ популярности артистов
- Анализ продолжительности треков и количества выпущенных песен в год
- Анализ наличия PAL
- Анализ зависимости аудио характеристик к популярности
- Анализ тенденций среди слушателей
- Вывод
- Описание применения генеративной модели
- Ссылки
Концепция
Для анализа данных я выбрала информацию о музыкальных треках, их аудиохарактеристиках и популярности на стриминговой платформе Spotify. Датасет был найден на платформе Kaggle и представляет собой набор данных о тысячах песен, включающий метаданные и подробные аудиометрики, рассчитанные алгоритмами платформы. Мне было интересно проанализировать именно эти данные, так как Spotify является крупнейшем игроком в индустрии музыкального стриминга, и его тренды отражают мировые предпочтения слушателей. Важно: данные актуальны по 2023 год
Введение
Для визуализации данных я использовала следующие типы графиков:
- Столбчатая диаграмма — для составления рейтинга артистов по средней популярности песен
- Гистограмма — для сравнения средней временной продолжительности треков, а также для выявления количества выущенных песен на платформе в год
- Круговая диаграмма — распределение песен по наличию нецензурной лексики
- Точечная диаграмма — для выявления связи между аудиохарактеристиками песни и ее популярности
- Тепловая карта нормализованных характеристик — для рассмотрения эволюции в музыкальных предпочтениях слушателей по годам
Цветовая палитра
Анализ популярности артистов
Я использовала код, чтобы проанализировать среднюю популярность артистов по средней популярности их песен. Этот анализ показывает самых успешных исполнителей датасета и позволяет сравнивать их между собой.
Анализ продолжительности треков и количества выпущенных песен в год
Также с помощью кода были построены гистограммы для сравнения продолжительности треков в датасете, а также для выявления среднего числа выпускаемых работ в год.
Анализ наличия PAL
Далее мне стало интересно понять, какой процент треков датасета имеет нецензурную лексику в своих текстах. Для этого я построила круговую диаграмму, которая отлично это демонстрирует.
Анализ зависимости аудио характеристик к популярности
Для одного из самых интересных и сложных анализов была выбрана точечная диаграмма, которая показывает зависимость популярности композиции от ее аудио характеристик.
Анализ тенденций среди слушателей
Финальный анализ включает в себя сразу большое количество показателей, которые помогают нам отследить предпочтения и тенденции слушателей по годам. Для этого был написан код с акцентом на нормализацию музыкальных характеристик и их визуализацию в виде тепловой карты, показывающей эволюцию музыкальных предпочтений с 1990 года по настоящее время. Этот анализ демонстрирует, как менялись музыкальные характеристики от года к году, какие тренды наблюдаются в развитии музыкальных предпочтений аудитории, и позволяет выявить периоды наиболее значительных изменений в музыкальной индустрии.
Вывод
Анализ, выбранных мной данных, показал, что популярность треков зависит от множества факторов: жанра, энергетики, длительности, года выпуска и наличия explicit-контента. Топ-артисты поддерживают стабильно высокую популярность, музыкальные характеристики эволюционируют во времени, отражая изменения в технологиях, культуре и вкусах аудитории. Анализ выявил корреляцию между энергетичностью и популярностью, оптимальную длительность треков и динамику предпочтений по годам, что может быть использовано артистами, продюсерами и платформами для оптимизации музыкального контента и рекомендательных систем.
Описание применения генеративной модели
В проекте использована большая языковая модель Claude (версия 4.5), которая помогла с написанием кода и устранением ошибок в нем.



