Исходный размер 2480x3500

Анализ данных Spotify

Концепция

Spotify  — наикрупнейший музыкальный стриминговый сервис, постоянно обновляющий свое наполнение и переанализирующий информацию о прослушиваниях. Именно благодаря ежедневному анализу он может предлагать идеальную подборку музыки конкретно под запрос и вкус человека. Такие функции, как распознавание настроения, танцевальности и других аспектов музыки сделали этот сервис топ-1 среди музыкальных приложений.

big
Исходный размер 2700x604

Цветовая палитра. Выбор в айдентике Spotify

Данные для анализа были взяты с сайта kaggle.com после дополнительной сортировки поиска по визуализации данных, чтобы получить наиболее полные, интересные для изучения таблицы. Датасет предоставляет все нужные данные: имя автора, название песни, ее продолжительность и даже пометку, обозначающую наличие нецензурной лексики в тексте. Более того, в таблице есть около 10  колонок, определяющих музыкальные параметры трека, например энергичность и темп. Работать с такими данными удобно и интересно, в процессе постоянно мелькают имена любимых исполнителей и даже есть шанс найти и оценить потенциально новую песню для твоего плейлиста.

big
Исходный размер 2010x604

Вдохновение

При работе с графиками я выбрала палитру в цветах айдентики Spotify  — в большинстве своем это темно-зеленый (078a35) и черный. Для светлого, контрастирующего фона я выбрала светлый зеленый цвет, по холодности похожий на основной цвет логотипа spotify (f0fce6). Среди графиков для изучения меня заинтересовали столбчатые, в том числе группированные диаграммы, точечные диаграммы, круговые и линейные. Все они отвечают своей функции и помогают простроить зависимость между отдельными столбцами и ячейками.

Обработка данных

Чтобы начать работать с датасетом я скачала библиотеку pandas, помогающую открывать, анализировать и изменять таблицы, matplotlib.pyplot для дальшейшей визуализации и seaborn, если вдруг мне понадобятся интересные стили и цвета для моих графиков.

Исходный размер 4273x677

После этого возник вопрос о комфортном использовании данных в таблице. Так я решила перевести продолжительность песни из миллисекунд в секунды, а потом подумала, что формат минуты: секунды был бы еще удобнее.

Исходный размер 4273x1154

Также я увидела, что данные о параметрах треков записаны в странном формате float. Я достала из датасета колонки с такими параметрами, перевела данные в проценты и переименовала колонки (пример: energy  — energy, %) для упрощения системы хранения данных и визуального понимания.

Исходный размер 4273x1154

И в последнюю очередь я решила сразу настроить то, как в будущем будут выглядеть мои графики — прописала размер текста, цвет фона графика и в целом выходящей картинки, а также заголовков.

Исходный размер 4273x1229

Реализация графиков

0

Топ-10 артистов по количеству песен, столбчатая диаграмма

То, что сразу меня заинтересовало, как и всех любителей музыки, создающих рейтинги и премии разного рода — это топ-10 музыкантов по количеству представленных в таблице песен. Код нашел все строчки с одним артистом и провернул это со всеми музыкантами в датасете. На выходе я получила такие данные: больше всего песен на Spotify опубликовала Rihanna, а далее по списку расположились Drake, Calvin Harris, Eminem и Britney Spears, которая также представляет нам свою песню «Oops… I  did it  again» на первой строчке датасета.

0

Связь между числом песен и средней популярностью артиста. Точечная диаграмма

Но так ли количество песен влияет на популярность? Много песен могут выкладывать хоть все, но самыми интересными музыкантами становятся личности, которые активно продвигают свой характер и амбиции в музыке. Для определения этого фактора я построила творческую диаграмму. Ну и результат ответил на мой вопрос — на деле самые популярные артисты — те, кто выложил 2-3  песни, которые действительно понравились публике.

0

Доля песен с пометкой Explicit у топ-10 артистов. Сгруппированная столбчатая диаграмма

Также у многих артистов присутствует пометка «Explicit» у треков, это означает, что в тексте песни присутствует нецензурная и бранная лексика. Я решила посмотреть, у кого больше всего таких песен и соотношение песен с такой пометкой и без нее. Звание владельца большинства нецензурных песен стал Eminem, в то время как наименьшее количество было у Calvin Harris.

0

Соотношение песен Арианы Гранде с нецензурной лексикой и без. Круговая диаграмма

Я решила обратиться к одному из моих любимых артистов — Ариане Гранде. Для начала я решила посмотреть статистику для ее песен, у нее присутствуют песни с бранным тестом, но все же их меньшинство.

0

Как менялось настроение песен Арианы Гранде со временем. Линейная диаграмма

После этого я добралась до самых вкусных данных — параметров о треках и решила проверить настроение у всех выпущенных песен Арианы. Для начала я отсортировала все ее треки по году выпуска и по алфавиту, если год совпадал. Потом на линейном графике расположила их и проследила изменения. Странно, что база Spotify считает песню «God is  a  woman» только на почти 0,3 по настроению — для меня это 10/10, но, может, она посчитала ее не совсем радостной.

Описание применения генеративной модели

Для своего исследования я сгенерировала картинку для обложки через генеративную модель Dall-E.

Ссылка на модель.

Промпт написан ChatGPT: A  young man with curly dark brown hair, wearing large over-ear headphones, sitting in  a  dimly lit room with dark green tones. He  is  gently smiling and holding his hands on  the headphones, immersed in  the music. The atmosphere is  cozy, relaxed, and introspective.

Ссылка на ChatGPT.

Анализ данных Spotify
Проект создан 03.04.2025
Мы используем файлы cookies для улучшения работы сайта и большего удобства его использования. Более подробную информац...
Показать больше