Original size 1140x1600

Количество предварительно расследованных преступлений

PROTECT STATUS: not protected

Предварительно расследовано преступлений, совершенных лицами, ранее совершавшими преступления

Водная часть

Для своего исследования я выбрала данные о количестве предварительно расследованных преступлений, совершённых ранее судимыми лицами, в различных регионах и субъектах Российской Федерации. Источник информации — открытый портал crimestat.ru, данные представлены в формате XML.

Анализ такой статистики имеет практическую значимость — он может способствовать выработке эффективных решений со стороны органов государственной власти и правоохранительных структур.

В рамках анализа я визуализирую данные с помощью круговых и линейных диаграмм, чтобы сделать информацию более наглядной и доступной для восприятия.

Процесс работы

Сравнение преступности в субъектах РФ и федеральных округах на основе предварительно расследованных преступлений, совершённых ранее судимыми лицами

Шаг 1: Загрузить .xml файл в Colab

big
Original size 1398x140

Шаг 2: Прочитать XML-файл

big
Original size 831x86

Шаг 3: Посмотреть всех потомков indicatorData

big
Original size 853x92

Шаг 4: Посмотреть, что внутри одного подэлемента

big
Original size 979x114

После этого нам становится ясно, как устроены данные, каждая запись выглядит следующим образом: < row > < value >… < / value > < report_period_begin >… < / report_period_begin > < region_name >… < / region_name > < report_period_end >… < / report_period_end > < / row >

Шаг 5: Преобразуем XML в pandas DataFrame

Original size 1168x589

Шаг 6: Построим график

(1) Сравнение преступности в субъектах РФ и федеральных округах на основе предварительно расследованных преступлений, совершённых ранее судимыми лицами

Разделим все регионы на два типа:

  1. субъекты Российской Федерации (области, края, республики)

  2. федеральные округа (например, Приволжский ФО, Южный ФО и т. п.)

Затем сравним совокупное количество преступлений, совершённых ранее судимыми, в этих двух группах.

Шаг 1: Добавим столбец «Тип» (Субъект РФ или Федеральный округ)

Original size 754x49

Шаг 2: Суммируем значения по типу региона

Original size 833x189

Шаг 3: Рисуем диаграмму

Original size 950x164
Original size 650x527

(2) Топ-10 регионов с наибольшим ростом преступлений во втором полугодии

Сравним два периода:

  1. первое полугодие (например, до 01.07.2022)

  2. второе полугодие (например, до 01.12.2022)

И найдём регионы, где прирост был наибольшим.

Шаг 1: Загрузка и парсинг XML

Original size 1315x341

Шаг 2. Оставим только два периода

Original size 1086x120

Шаг 3. Преобразуем таблицу: строки — регионы, столбцы — периоды

Original size 1090x104

Шаг 4. Отберём топ-10 регионов по приросту

Original size 1117x246

Шаг 5. Построим столбчатую диаграмму

Original size 1203x182
Original size 1187x590

(3) Тепловая карта: Преступления ранее судимыми в топ-20 регионах РФ

Шаг 1: Загрузка и парсинг XML

Original size 1369x355

Шаг 2: Создадим сводную таблицу

Original size 1227x180

Шаг 3: Визуализируем — создадим тепловую карту

Original size 1246x213
Original size 1348x989

(4) Вариант графика: Линейная диаграмма динамики по федеральным округам

Покажем, как менялась динамика преступлений, совершённых ранее судимыми лицами, по федеральным округам за годы.

Шаг 1: Загрузка и парсинг XML

Original size 1349x400

Шаг 2: Отфильтруем только федеральные округа

Original size 815x56

Шаг 3: Сгруппируем по году и округу

Original size 884x57

Шаг 4: Преобразуем в таблицу для графика

Original size 931x53

Шаг 4: Построим линейный график

Original size 1232x213
Original size 802x469

(5) Диаграмма рассеяния: Преступность и её изменение по регионам

Покажем не только абсолютное число преступлений, но и насколько оно изменилось по сравнению с предыдущим периодом.

Шаг 1. Укажем путь к XML-файлу

Original size 1229x38

Шаг 2. Распарсим XML-файл и собери таблицу

Original size 1380x357

Шаг 3. Выделим данные за июль и декабрь 2022

Original size 1156x70

Шаг 4. Объединим и рассчитаем изменения

Original size 1251x54

Шаг 7. Построим scatter plot

Original size 1361x257
Original size 989x590
Количество предварительно расследованных преступлений
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more