Исходный размер 1140x1600

Анализ YouTube каналов

Описание проекта

В своем проекте я анализировала каналы на YouTube 2023 году с целью выяснить какие каналы и ютуберы самые востребованные. Обложка для проекта была сгенерирована при помощи Leonardo Ai. Датасет содержаший информацию о ютубе за 2023 год https://www.google.com/url?q=https%3A%2F%2Fwww.kaggle.com%2Fdatasets%2Fnelgiriyewithana%2Fglobal-youtube-statistics-2023

df = pd.read_csv («Global YouTube Statistics.csv», delimiter=', ', encoding='windows-1251') df.head (10)

big
Исходный размер 2818x790

Создаем палитру цветов для стилизации графиков и меняем семейство шрифтов на Pacifico

big
Исходный размер 1404x664

Выведем количество юутберов для каждой категории

data = df['category'].value_counts () print (data)category Entertainment 241 Music 202 People & Blogs 132 Gaming 94 Comedy 69 Film & Animation 46 Education 45 Howto & Style 40 News & Politics 26 Science & Technology 17 Shows 13 Sports 11 Pets & Animals 4 Trailers 2 Nonprofits & Activism 2 Movies 2 Autos & Vehicles 2 Travel & Events 1 Name: count, dtype: int64

Отобразим на графиках «скрипка» топ 5 категорий, из них видно популярную и какие значения в сренднем подписчиков она набирает за месяц.

data = df.query («category in ('Entertainment', 'Music', 'People & Blogs', 'Gaming', 'Comedy')»)

fig = plt.figure (figsize=(10,10)) viol = sns.violinplot (data=data, x="subscribers_for_last_30_days», y="category», fill=False, palette=palette) plt.title ('Кол-во подписчиков за месяц для категории') plt.xlabel ('Кол-во подписчиков') plt.ylabel ('Категория') plt.show ()

Исходный размер 1536x914

Отобразим этот же график в виде пончика, он красивый и более наглядно показывает разницу в процентах

data = df['category'].value_counts ()[: 5]

plt.pie (x=data.values, labels = data.index, colors = palette[2:], wedgeprops=dict (width=0.5), explode=[0.2]+[0]*(len (data) — 1), autopct='%.02f%%') plt.title ('Процент популярности категорий') plt.show ()

Исходный размер 644x426

Точечный график показывает в каком году какой калан был создан с определнной категорией

plt.figure (figsize=(10,8)) scatter = sns.scatterplot (data=df.query ('created_year > 2000'), y="category», x="created_year», hue="category») scatter.set_xticklabels (scatter.get_xticklabels (), rotation=90) scatter.legend_.remove () plt.title ('В каком году был создан канал с определенной категорией') plt.xlabel ('Год создания') plt.ylabel ('Категория') plt.show ()

Исходный размер 1290x794

Узнаем общее кол-во подписчиках на каналах с определенными категориями, для этого хорошо подойдет столбчатая диаграмма

categoryes = df['category'].unique ()

labels = [] values = [] for i in categoryes: data = df.query (f"category == '{i}'»)

sum = data['subscribers'].sum ()

values.append (sum) labels.append (i) fig = plt.figure (figsize=(10,10)) sns.barplot (x = values, y = labels, palette=palette) plt.title ('Кол-во подписчиков в категории') plt.xlabel ('Кол-во подписчиков') plt.ylabel ('Категория') plt.show ()

Исходный размер 1250x922

В заключении используя круговую диаграмму можно посмотреть распределение каналов по странам

data_1 = df['Country'].value_counts ()[: 10]

fig = plt.figure (figsize=(5,10)) plt.pie (x=data_1.values, labels = data_1.index, colors = palette[2:], explode=[0]+[0.3]+[0.4]*(len (data_1) — 2), autopct='%.02f%%') plt.title ('Отношение кол-во видео в стране') plt.show ()

Исходный размер 646x494
Анализ YouTube каналов
Проект создан 08.10.2024
Мы используем файлы cookies для улучшения работы сайта и большего удобства его использования. Более подробную информац...
Показать больше