Концепция
Spotify — наикрупнейший музыкальный стриминговый сервис, постоянно обновляющий свое наполнение и переанализирующий информацию о прослушиваниях. Именно благодаря ежедневному анализу он может предлагать идеальную подборку музыки конкретно под запрос и вкус человека. Такие функции, как распознавание настроения, танцевальности и других аспектов музыки сделали этот сервис топ-1 среди музыкальных приложений.

Цветовая палитра. Выбор в айдентике Spotify
Данные для анализа были взяты с сайта kaggle.com после дополнительной сортировки поиска по визуализации данных, чтобы получить наиболее полные, интересные для изучения таблицы. Датасет предоставляет все нужные данные: имя автора, название песни, ее продолжительность и даже пометку, обозначающую наличие нецензурной лексики в тексте. Более того, в таблице есть около 10 колонок, определяющих музыкальные параметры трека, например энергичность и темп. Работать с такими данными удобно и интересно, в процессе постоянно мелькают имена любимых исполнителей и даже есть шанс найти и оценить потенциально новую песню для твоего плейлиста.

Вдохновение
При работе с графиками я выбрала палитру в цветах айдентики Spotify — в большинстве своем это темно-зеленый (078a35) и черный. Для светлого, контрастирующего фона я выбрала светлый зеленый цвет, по холодности похожий на основной цвет логотипа spotify (f0fce6). Среди графиков для изучения меня заинтересовали столбчатые, в том числе группированные диаграммы, точечные диаграммы, круговые и линейные. Все они отвечают своей функции и помогают простроить зависимость между отдельными столбцами и ячейками.
Обработка данных
Чтобы начать работать с датасетом я скачала библиотеку pandas, помогающую открывать, анализировать и изменять таблицы, matplotlib.pyplot для дальшейшей визуализации и seaborn, если вдруг мне понадобятся интересные стили и цвета для моих графиков.
После этого возник вопрос о комфортном использовании данных в таблице. Так я решила перевести продолжительность песни из миллисекунд в секунды, а потом подумала, что формат минуты: секунды был бы еще удобнее.
Также я увидела, что данные о параметрах треков записаны в странном формате float. Я достала из датасета колонки с такими параметрами, перевела данные в проценты и переименовала колонки (пример: energy — energy, %) для упрощения системы хранения данных и визуального понимания.
И в последнюю очередь я решила сразу настроить то, как в будущем будут выглядеть мои графики — прописала размер текста, цвет фона графика и в целом выходящей картинки, а также заголовков.
Реализация графиков
Топ-10 артистов по количеству песен, столбчатая диаграмма
То, что сразу меня заинтересовало, как и всех любителей музыки, создающих рейтинги и премии разного рода — это топ-10 музыкантов по количеству представленных в таблице песен. Код нашел все строчки с одним артистом и провернул это со всеми музыкантами в датасете. На выходе я получила такие данные: больше всего песен на Spotify опубликовала Rihanna, а далее по списку расположились Drake, Calvin Harris, Eminem и Britney Spears, которая также представляет нам свою песню «Oops… I did it again» на первой строчке датасета.
Связь между числом песен и средней популярностью артиста. Точечная диаграмма
Но так ли количество песен влияет на популярность? Много песен могут выкладывать хоть все, но самыми интересными музыкантами становятся личности, которые активно продвигают свой характер и амбиции в музыке. Для определения этого фактора я построила творческую диаграмму. Ну и результат ответил на мой вопрос — на деле самые популярные артисты — те, кто выложил 2-3 песни, которые действительно понравились публике.
Доля песен с пометкой Explicit у топ-10 артистов. Сгруппированная столбчатая диаграмма
Также у многих артистов присутствует пометка «Explicit» у треков, это означает, что в тексте песни присутствует нецензурная и бранная лексика. Я решила посмотреть, у кого больше всего таких песен и соотношение песен с такой пометкой и без нее. Звание владельца большинства нецензурных песен стал Eminem, в то время как наименьшее количество было у Calvin Harris.
Соотношение песен Арианы Гранде с нецензурной лексикой и без. Круговая диаграмма
Я решила обратиться к одному из моих любимых артистов — Ариане Гранде. Для начала я решила посмотреть статистику для ее песен, у нее присутствуют песни с бранным тестом, но все же их меньшинство.
Как менялось настроение песен Арианы Гранде со временем. Линейная диаграмма
После этого я добралась до самых вкусных данных — параметров о треках и решила проверить настроение у всех выпущенных песен Арианы. Для начала я отсортировала все ее треки по году выпуска и по алфавиту, если год совпадал. Потом на линейном графике расположила их и проследила изменения. Странно, что база Spotify считает песню «God is a woman» только на почти 0,3 по настроению — для меня это 10/10, но, может, она посчитала ее не совсем радостной.
Описание применения генеративной модели
Для своего исследования я сгенерировала картинку для обложки через генеративную модель Dall-E.
Промпт написан ChatGPT: A young man with curly dark brown hair, wearing large over-ear headphones, sitting in a dimly lit room with dark green tones. He is gently smiling and holding his hands on the headphones, immersed in the music. The atmosphere is cozy, relaxed, and introspective.



