Концепция
Steam — крупнейшая платформа цифровой дистрибуции игр, а пользовательские оценки напрямую влияют на продажи, популярность и репутацию игр. Анализ оценок позволяет понять, какие факторы связаны с успехом игр и как пользователи реагируют на разные жанры и ценовые категории.
В работе используется датасет Steam Store Games, опубликованный на платформе Kaggle. Он содержит информацию о более чем 20 000 игр, включая пользовательские оценки, жанры, цену и время в игре.
Для наглядного представления доли положительных отзывов по всем играм в датасете использована гистограмма. Горизонтальная ориентация столбчатой диаграммы выбрана с целью облегчения восприятия длинных названий жанров и для фокусировки на сравнении их объемов. Линейный график наглядно демонстрирует зависимость среднего пользовательского рейтинга от ценового сегмента игры. Сложенная столбчатая диаграмма подчеркивает, что даже среди наиболее популярных игр присутствует заметный объем негативной обратной связи.
Визуализация и загрузка данных
С помощью ChatGPT я подобрала палитру для графиков. В начале работы были импортированы ключевые библиотеки: NumPy, Matplotlib.pyplot, Seaborn и Pandas. Затем был загружен и обработан CSV-файл, содержащий данные датасета.
Начало работы с данными
Для обеспечения корректности визуализаций, я предварительно осуществила базовую очистку данных.
График № 1
Анализ графика распределения положительных отзывов показывает явную тенденцию: подавляющее большинство игр в датасете Steam пользуются высокой оценкой игроков, с долей положительных отзывов, часто превышающей 80%. Этот сдвиг вправо говорит о том, что платформа Steam в целом предлагает пользователям качественный контент, который находит отклик. Менее успешные проекты, вероятно, сталкиваются с проблемой низкой вовлеченности аудитории или неспособностью удержать игроков, что отражается в ограниченном количестве отзывов или их негативной динамике.
График № 2
Здесь показаны средние оценки пользователей для игр разных жанров. Жанры были разделены из строкового поля и отсортированы с помощью среднего значения доли положительных отзывов. Лидерами оказались инди и узкоспециализированные жанры, например, Adventure и Casual, а не самые популярные игры. Это значит, что маленькие и специфические проекты чаще лучше подходят под желания своей аудитории, чем большие универсальные проекты.
График № 3
Представленный график демонстрирует отсутствие явной корреляции между стоимостью игры и уровнем удовлетворенности пользователей. Анализ данных показывает, что игры с различными ценовыми категориями могут получать как высокие, так и низкие оценки. Следовательно, цена не является определяющим фактором качества игры с точки зрения потребителя. Ключевыми же аспектами, влияющими на пользовательское восприятие, являются субъективный игровой опыт и степень соответствия продукта ожиданиям целевой аудитории.
График № 4
График демонстрирует соотношение позитивных и негативных отзывов для топовых игр Steam. Очевидно, что даже у самых успешных проектов сохраняется значительный объем критики. Это подтверждает, что массовая популярность не подавляет, а скорее усиливает разнообразие пользовательских мнений, включая негативные.
Вывод
Таким образом, визуализация анализа данных показывает корреляцию между жанрами, ценами, количеством игроков и популярностью. Не обязательно игра должна стоить дорого, чтобы она была качественно разработана и у нее были фанаты. Игры с высокими отзывами обычно нишевые проекты, поскольку от них меньше ожиданий, а с крупных проектов спрос больше и разброс мнений шире.
Для обложки я использовала нейросеть ideogram.ai
Промт: Create a cover for the project, with the Steam logo in the middle. In the background, there are battles between characters from real video games from different universes.



