UIS
Инструкция к разделу «Базы данных и online-анализ» ReloadВернуться к таблице

Уважаемые пользователи, рады приветствовать вас на информационном ресурсе «Базы данных и online-анализ» Университетской информационной системы РОССИЯ!

Описание баз данных

Раздел «Базы данных и online-анализ» (Рис. 1) содержит следующие базы данных: «Регионы России. Ежегодное обновление показателей», «Регионы России: ежемесячное обновление показателей», «Дети России». Эти ресурсы формируют основу инфраструктуры для инновационных учебных курсов с использованием социально-экономической статистики, предусмотренных Федеральными государственными образовательными стандартами высшего профессионального образования.
Рис. 1. Раздел УИС РОССИЯ «Базы данных и on-line анализ». Выбор базы данных

Регионы России: ежегодное обновление показателей

База интегрирует данные государственной социально-экономической статистики Федеральной службы государственной статистики (Росстат), данные бюджетной статистики Министерства финансов РФ/Федерального казначейства (Росказна), Федеральной налоговой службы, содержит порядка 60 тыс. показателей, общий объем базы 1,5 Гб. Блок показателей социально-экономического развития субъектов РФ формируется на основе данных ежегодного сборника Росстата «Регионы России», а также сборников «Экономическая активность населения России (по результатам выборочных обследований)», «Цены в России», «Демографический ежегодник России», «Семья в России», «Российский статистический ежегодник», «Торговля в России», «Труд и занятость в России», «Здравоохранение в России», «Жилищное хозяйство и бытовое обслуживание населения в России». Представлено порядка 2000 показателей, большинство которых - в ретроспективе с 1990 года. Показатели структурированы в соответствии с рубрикацией, используемой в сборниках «Регионы России» с 2005 года. Показатели из сборников за разные годы, начиная с 2000 года, сведены во временные ряды. Показатели Росстата снабжены методологическими пояснениями и «привязаны» к формам статистической отчетности Росстата, дополненным инструкциями по их заполнению.

Регионы России: ежемесячное обновление показателей

Источник данных – региональное приложение к ежемесячному сборнику «Социально-экономическое положение России» и публикация Росстата «Информация для ведения мониторинга социально-экономического положения субъектов Российской Федерации», включает 1140 показателей в ретроспективе с января 2006 года. Данные обновляются ежемесячно.

Дети России

База данных разработана на основе сборников Росстата, в которых публикуются данные, характеризующие положение детей – «Регионы России», «Социальное положение и уровень жизни населения в России», «Здравоохранение в России», «Демографический ежегодник», «Дети в России», «Молодежь в России» и других.

Работа с базой данных «Дети России» аналогична работе с базами данных ««Регионы России. Ежегодное обновление показателей» и «Регионы России: ежемесячное обновление показателей».

Формирование запроса

Главная страница раздела содержит элементы для выбора базы данных и формирования запроса для получения сводной таблицы с данными. Формирование запроса предполагает выбор показателей, территорий (округов, муниципальных образований и/или регионов) и периодов времени (Рис. 2). Для выбора элементов запроса воспользуйтесь вкладками «Показатели», «Регионы» и «Периоды времени», расположенными в левой части экрана. Выбор элементов запроса может быть осуществлен в любом порядке, однако выбор периодов времени является контекстно-зависимым: при выбранных показателях и территориях имеется возможность выбрать только те периоды времени, по которым в базе имеются данные, воспользовавшись опцией «Выбрать всё» (значок «») на вкладке «Периоды времени».

При изменении выбранной базы (в списке в левой верхней части экрана) построится сводная таблица из этой базы с данными, заданными по умолчанию. При формировании запроса с помощью вкладок «Показатели», «Регионы» и «Периоды времени» сводная таблица перестраивается в соответствии с пользовательским запросом.



Рис. 2. Построение запроса – вкладки для выбора территории (региона или муниципального образования), показателей и периодов времени

Выбор показателя

Показатели представлены в виде иерархического многоступенчатого дерева в левой части экрана. Кликом на название показателя раскрывается нижестоящий уровень дерева (Рис. 3).



Рис. 3. Выбор показателя по иерархическому дереву

Возможен поиск показателя по названию, для этого в поисковое окно введите название (или часть названия) показателя и нажмите на кнопку «». Система проводит морфологический анализ и ищет близкие по значению показатели. Например, в базе «Регионы России: ежегодное обновление показателей», при вводе в поисковое окно слова «безработные», получите несколько показателей из рубрики «Труд. Производство важнейших видов продукции. Запрошенное слово/часть слова будет подсвечено в названии найденного показателя (Рис. 4).



Рис. 4. Выбор показателя. Проведен поиск по слову «безработные». Выбран показатель «Труд. Численность безработных»

Выбор территории

Выбор субъекта РФ осуществляется из списка регионов и федеральных округов для баз «Регионы России» (Рис. 5) установите галочки в чек-боксах напротив нужных территорий. Раскрытие нижестоящего уровня в дереве территорий происходит по клику на название региона.



Рис. 5. Выбор территорий в базе «Регионы России: ежемесячное обновление показателей». Выбраны Центральный федеральный округ и Курская область

Выбор года / периода времени

Ретроспектива данных по базам данных и по отдельным показателям разная, что обусловлено разной ретроспективой наблюдений показателей. Отсутствие данных за некоторые годы и периоды времени обусловлено спецификой первоисточника — публикаций Росстата: в ежегодных сборниках показатели представлены не последовательно по годам, а выборочно. Коллективом УИС РОССИЯ выполнены работы по формированию непрерывного последовательного временного ряда на основе обработки публикаций Росстата за разные годы.

В базе «Регионы. Ежегодное обновление показателей» выстроена ретроспектива данных с 1970 года, но до 1989 года показатели представлены выборочно (за 1970, 1979, 1984, 1985, 1986, 1989 годы).
В базе «Регионы. Ежемесячное обновление показателей» данные представлены последовательно с января 1992 года, причем доступны показатели ежемесячные, квартальные и накопленные (нарастающим итогом с начала года).

Для выбора определенного года или нескольких лет поставьте галочку в соответствующих чек-боксах на вкладке «Периоды времени».

Для выбора всех лет выберите опцию «Выбрать всё» (значок«») (Рис. 6). Опция «Выбрать все» активирует процедуру «Включить зависимость» проверку наличия в базе показателей по годам. В результате проверки галочки в чек-боксах появятся только за те годы, по которым есть данные. Эта процедура позволяет избежать выдачи в таблице пустых ячеек, свидетельствующих об отсутствии данных. Для снятия выбора периодов времени предусмотрена опция «Очистить всё» (значок«»).



Рис. 6. Выбор года/периода времени. Выбраны все годы, г. Москва и Московская область, показатель «Валовой региональный продукт. Валовой региональный продукт на душу населения»

Конструктор таблиц

Конструктор таблиц позволяет варьировать формат таблицы (менять представление значений в столбцах и строках), чтобы в зависимости от условий задачи обеспечить наглядность представления данных. На вкладке со значком«» (справа от вкладки «Периоды времени») отображены опции для формирования таблицы (Рис. 7), конструктор позволяет изменять формат таблицы на всех этапах работы. По умолчанию показатели и регионы отображаются в строках, годы — в столбцах (базовое представление таблицы).



Рис. 7. Вкладка конструктора таблиц. Опция представления данных в таблице

При изменении параметров (например, выборе представления значений показателей в столбцах как показано на Рис. 7) вид таблицы динамически перестроится в соответствии с запросом.

Интегрированный поиск

Переход в Интегрированный поиск возможен через элемент «Интегрированный поиск» (значок «») в горизонтальном меню над сводной таблицей или при нажатии на элемент «Документы» (значок «») в ячейке таблицы с названием интересующего показателя (Рис. 8).



Рис. 8. Выбор сервиса поиска из сводной таблицы
При нажатии на элемент «Интегрированный поиск» (значок «») пользователь попадает на стартовую страницу поисковика показателей по базам и публикациям (рис.9). При нажатии на элемент «Документы» (значок «») в ячейке таблицы в строке поиска автоматически появляется название показателя. Напротив разделов отражается количество показателей в базах данных и количество публикаций, где этот показатель присутствует (Рис. 11).

Рис. 9. Стартовая страница интегрированного поиска по базам и публикациям

Главная страница раздела содержит элементы для выбора базы данных статистических показателей. Показатели представлены в виде иерархического многоступенчатого дерева в левой части экрана. Кликом на название показателя раскрывается нижестоящий уровень дерева (Рис. 10).



Рис. 10. Выбор показателя в Базе данных «Регионы России. Ежегодное обновление» по иерархическому дереву

При выборе определенного показателя в строке поиска автоматически появляется его название, напротив разделов отражается количество показателей в базах данных и количество публикаций, где этот показатель присутствует (Рис. 11).



Рис. 11. Поиск показателя «Заработная плата» в базах данных
При выборе интересующего показателя в одной из баз данных открывается сводная таблица доступных данных со значениями для всех регионов за все годы (Рис. 12).

Рис. 12. Сводная таблица для показателя «Основные характеристики субъектов Российской Федерации. Основные социально-экономические показатели. Среднемесячная номинальная начисленная заработная плата работающих в экономике» в Базе данных «Регионы России. Ежегодное обновление» при выборе показателя через Интегрированный поиск

При выборе интересующего показателя в публикациях (Издания государственных органов, Издания исследовательский центров, Научные издания, Средства массовой информации) напротив разделов отражается количество количество публикаций, где этот показатель присутствует (рис. 13).



Рис. 13. Поиск показателя «Заработная плата» в публикациях изданий исследовательских центров

При нажатии на название публикации происходит скачивание файла с публикацией, при нажатии на текст «Ссылка на первоисточник» публикация открывается в браузере (Рис.14).



Рис. 14. Запрос «заработная плата» - аналитика в Вестника Банка России № 35 от 28.04.2018

При количестве публикаций, содержащих искомый показатель (чаще в разделе «Средства массовой информации), превышающем 500 ссылок, необходимо уточнить запрос (рис. 15).



Рис. 15. Поиск уточненного показателя «Минимальная заработная плата» в публикациях средств массовой информации

Сводная таблица данных

Сводная таблица с данными строится автоматически при выборе показателей, территорий и периодов времени на соответствующих вкладках в левой части экрана. Над сводной таблицей располагается горизонтальное меню с элементами «Построить графики» (значок «»), «Интегрированный поиск» (значок «»), «Очистить запрос» (значок «») и «Помощь» (значок «»).

При выборе элемента «Построить графики» (значок «») по заданным параметрам автоматически строится график (Рис. 16). Пользователь может выбрать тип графика «Показатели по региону» или «Регионы по показателю», настраивать отображение показателей, менять тип и цвет визуализации. Подробная справка находится в разделе «Визуализация значений показателей».



Рис. 16. Вид экрана с графиком для нескольких показателей «Население» по Карачаево-Черкесской Республике

При нажатии на значок «Интегрированный поиск» (значок «») пользователь попадает на стартовую страницу поисковика показателей по базам и публикациям.

Для формирования нового запроса выберите элемент «Очистить запрос» (значок «») в горизонтальном меню над сводной таблицей.

Для вызова практикума-инструкции по пользованию Базами данных и инструментами online-анализа необходимо выбрать значок «Помощь» (значок «»).

При нажатии на значок «» в ячейке с названием показателя в сводной таблице открывается всплывающее окно со ссылками на источник/источники для данного показателя (Рис. 17).



Рис. 17. Всплывающее окно со ссылками на источник для показателя «Валовой региональный продукт. Валовой региональный продукт на душу населения»

Типы показателей

В базах данных каждый показатель, включающий единицу измерения, является базовым или расчетным. Базовые показатели могут быть натуральными либо стоимостными. Расчетные показатели могут быть процентными, натуральными либо стоимостными. Таким образом, каждый показатель можно отнести к одному из пяти типов. Ячейки с названиями показателей в сводной таблице окрашиваются в разные цвета в зависимости от типа (Рис. 18). Голубые тона соответствуют базовым показателям, зеленые — расчетным:  

  •  — базовый стоимостной;
  •  — базовый натуральный;
  •  — расчетный процентный;
  •  — расчетный стоимостной;
  •  — расчетный натуральный.

При наведении на ячейку сводной таблицы с названием показателя появляется подсказка с названием типа этого показателя.



Рис. 18. Пример сводной таблицы, содержащей показатели разных типов

Единицы измерения показателей

В базах данных УИС РОССИЯ каждый показатель может иметь одну или несколько единиц измерения. Если единиц измерения несколько, то в ячейке с названием показателя в сводной таблице присутствует раскрывающийся список с доступными для показателя единицами измерения (Рис. 19).



Рис. 19. Список доступных единиц измерения для показателя «Торговля и услуги населению. Оборот оптовой торговли организаций оптовой торговли»

Для удобства пользователя при изменении единицы измерения в ячейке с показателем автоматический переход на эту единицу измерения происходит во всех ячейках с названием данного показателя (для всех выбранных территорий).

Изменение масштаба единиц измерения

Для показателей всех типов, кроме процентного, доступна функция изменения масштаба для выбранной единицы измерения.

Например, в ячейке с названием показателя «Торговля и услуги населению. Оборот оптовой торговли организаций оптовой торговли» при выборе единицы измерения «руб.» будет доступен раскрывающийся список с возможными коэффициентами для изменения масштаба единицы измерения (Рис. 20). По умолчанию коэффициент равен 1, что соответствует единицы измерения «руб.», при выборе коэффициента 1000 значения показателя в сводной таблице будут отображены в тыс. рублей, при коэффициенте 1000 000 — в млн рублей, при 1000 000 000 — в млрд рублей.



Рис. 20. Список доступных коэффициентов масштабирования единицы измерения «руб.» для показателя «Торговля и услуги населению. Оборот оптовой торговли организаций оптовой торговли»

Для удобства пользователя при изменении коэффициента масштабирования единицы измерения в ячейке с показателем автоматический переход на выбранный коэффициент происходит во всех ячейках с названием данного показателя (для всех выбранных территорий).

Сортировка числовых значений

Записи в таблице могут быть отсортированы — упорядочены по убыванию или по возрастанию числовых значений. Сортировка по возрастанию/убыванию происходит по клику на значок «», расположенный в заглавных ячейках сводной таблицы (Рис. 21).



Рис. 21. Сервис сортировки числовых значений. Данные по показателю «Образование. Выпуск специалистов высшими учебными заведениями. Всего» по Чувашской Республике, Удмуртской Республике, Республике Мордовия, Пензенской области за 2010 год отсортированы по возрастанию

Загрузка сводной таблицы в форматах xls и csv

Средства работы с таблицей включают экспорт таблицы в стандартные форматы — xls и csv. Для загрузки сводной таблицы в формате xls и csv нажмите на значок «» и «» соответственно справа над сводной таблицей (Рис. 22).



Рис. 22. Опции для экспорта таблицы в форматы xls и csv

Обработка и анализ данных в таблице

В базах реализованы процедуры отбора, расчета, представления и анализа показателей с использованием основных (классических) методов, применяемых в практической статистике для характеристики совокупности данных в созданной пользователем таблице, в том числе:

  • отбор значений показателей по критерию (значок «»);
  • расчет элементов описательной статистики (среднего значения, суммы, стандартного отклонения, стандартной ошибки, дисперсии, минимума, максимума, размаха, эксцесса (вариации), асимметрии); построение вторичных переменных вариационных рядов (значок «»);
  • вычисление показателей корреляции (значок «»);
  • построение индексов — расчет стоимостных показателей в ценах базисного года (значок «»);
  • построение прогнозов (значок «»).
  • документы (значок «»).
  • статформы (значок «»).
  • методологические документы (значок «»).

Сервисы доступны по клику на соответствующие значки (Рис. 23), при наведении на любой из значков появляется подсказка с названием соответствующего сервиса.



Рис. 23. Вид сводной таблицы со значками для доступа к аналитическим сервисам для расчетных стоимостных показателей

В зависимости от типа показателя набор сервисов, доступных для него, может быть разным. Например, сервис расчета вторичных переменных рядов динамики не доступен для стоимостных и процентных показателей, сервис прогноза доступен только для нестоимостных показателей, т.е. натуральных и процентных (Рис.24). Для сервиса корреляции также имеются некоторые ограничения, зависящие от типа показателя, для которого он вызван: корреляция стоимостного показателя во времени (по одному региону за все доступные в базе периоды времени) вычисляется только для стоимостных показателей из запроса, корреляция натурального / процентного показателя вычисляется для натуральных / процентных показателей из запроса, а также для стоимостных показателей в случае расчета корреляции в пространстве (по нескольким регионам за один период).



Рис. 24. Вид сводной таблицы со значками для доступа к аналитическим сервисам для расчетных процентных показателей

Страницы с сервисными функциями содержат следующие общие элементы: название сервиса, значок «» для доступа к справке с описанием соответствующей сервисной функции, значок «» для возврата к сводной таблице, название выбранных пользователем показателя / территории, для которых была вызвана сервисная функция.

Подробнее о каждом сервисе:

Графики и диаграммы

По клику на значок «» по заданным параметрам строится график и(или) диаграмма (Рис. 25). Пользователь может выбрать тип графиков и диаграмм «Показатели по региону» или «Регионы по показателю», задать тип и цвет визуализации. Подробная справка находится в разделе «Визуализация значений показателей».



Рис. 25. Вид экрана с графиками и диаграммами для показателя «Валовой региональный продукт. Валовой региональный продукт на душу населения» по г. Москве, Владимирской и Московской области

Отбор по критерию

Окно с сервисом «Отбор по критерию» доступно по клику на значок «». Сервис доступен для показателей всех типов. Критерием или фильтром для отбора показателей в таблице могут служить значения большие, меньшие или равные значению, названному пользователем (Рис. 26). При выборе в раскрывающемся списке элементов «среднее значение», «мода», «медиана», «минимум», «максимум» пользователь может автоматически получить значения этих характеристик для всей сводной таблицы и отобрать данные (Рис. 27).



Рис. 26. Вид экрана для задания значения больше, меньше, равно значению, указанному пользователем (257.444)


Рис. 27. Вид экрана для выбора критерия — среднего значения, моды, медианы, минимума, максимума

Ячейки со значениями, удовлетворяющими критерию, выделятся цветом.

Построение вторичных переменных вариационных рядов

Вторичные переменные вариационных рядов (значок «») относятся к понятиям описательной статистики и представляют собой набор показателей, в общем виде описывающих характеристики ряда. В базах данных для вариационных рядов автоматически вычисляются следующие переменные сумма, максимум, минимум, среднее, мода, медиана, размах вариации, дисперсия, среднее линейное отклонение, относительное линейное отклонение, среднее квадратическое отклонение, коэффициент вариации, коэффициент концентрации Джини, коэффициент Герфиндаля, коэффициент асимметрии Пирсона, квартили (1-й и 3-й), квартильный коэффициент, квинтили (1-й и 4-й), квинтильный коэффициент), децили, децильный коэффициент, фондовый коэффициент дифференциации (Рис. 28). Сервис доступен для показателей всех типов.

По каждой переменной может быть построен график и получено определение. Кликните на соответствующий значок — «» или «» (Рис. 27).



Рис. 28. Вид экрана сервиса вторичных переменных вариационных рядов для показателя «Население. Ожидаемая продолжительность жизни при рождении. Все население. Лет» по Приморскому краю, Хабаровскому краю и Амурской области. Получено определение относительного линейного отклонения, построен график коэффициента концентрации Джини

Построение вторичных переменных рядов динамики

Изучение изменения (динамики) явлений во времени — одна из задач статистики. Решается эта задача путем составления т.н. рядов динамики (временных или хронологических рядов).

Ряд динамики представляет собой числовые значения определенного статистического показателя в последовательные моменты или периоды времени (т.е. расположенные в хронологическом порядке). Числовые значения показателя, составляющие ряд динамики, называют уровнями ряда и обычно обозначают через y. Первый член ряда называют начальным уровнем, а последний — конечным. Моменты или периоды времени, к которым относятся уровни, обозначают через t.

Цель изучения рядов динамики — выявить основную тенденцию (закономерность) в изменении уровней ряда, именуемую трендом. Закономерность в изменении уровней ряда в одних случаях проявляется довольно наглядно, в других — может затушевываться колебаниями, вызванными случайными и неслучайными причинами.

Анализ рядов динамики начинается с выявления направления изменения уровней ряда (увеличиваются, уменьшаются или остаются неизменными) в абсолютном и относительном выражении. Чтобы проследить за направлением и размером изменений во времени, для рядов динамики рассчитывают следующие переменные: абсолютный прирост (цепной), абсолютный прирост (базисный), коэффициент (цепной), коэффициент (базисный), темп роста (цепной), темп роста (базисный), темп прироста (цепной), темп прироста (базисный), абсолютное значение (1%) прироста, среднее значение, средний абсолютный прирост, средний коэффициент роста, средний темп роста, средний темп прироста. В базах данных эти переменные рассчитаны по умолчанию для каждой выбранной территории (Рис. 29).

Окно с сервисом доступно по клику на значок «». Сервис доступен только для натуральных показателей (базовых и расчетных).



Рис. 29. Вид экрана с перечнем расчетных показателей и их значений, характеризующих динамику показателя «Население. Ожидаемая продолжительность жизни при рождении. Все население. Лет» по Приморскому краю за период с 1995 года. Получено определение темпа роста, построен график по базисному темпу роста
Для перехода к расчетным показателям по другому региону вернитесь к таблице кликом на значок «» и на вкладке «Регионы» выберите другой регион из списка регионов, указанных в запросе.

Расчет корреляций

Корреляция показателей — это статистическая взаимосвязь двух или нескольких величин. При этом, изменения одной или нескольких из этих величин приводят к систематическому изменению другой или других величин. Корреляция показателей позволяет выявлять статистические зависимости между показателями, наличие или отсутствие корреляционных связей и их тесноту. Математической мерой корреляции двух величин служит коэффициент корреляции. Коэффициент корреляции может изменяться от -1 до +1. Значение -1 означает полностью отрицательную корреляцию, значение +1 означает полностью положительную корреляцию. Значение 0 означает отсутствие корреляции.

В базах данных с помощью сервиса корреляции (значок «») можно попарно рассчитать корреляционные зависимости между выбранным показателем и остальными показателями, указанными при запросе. Возможен расчет корреляций двумя способами:

  • за все периоды по одному из регионов, указанных в запросе (корреляция во времени);
  • по всем регионам за один из периодов, указанных в запросе (корреляция в пространстве).

При этому введены некоторые ограничения на то, между какими парами показателей из запроса рассчитываются показатели корреляции. Ограничения связаны с расчетом корреляций для показателей разных типов. Корреляционные зависимости во времени для стоимостных / натуральных / процентных показателей будут рассчитываться только со стоимостными / натуральными / процентными показателями из запроса. Если выбранный показатель натуральный / процентный, то корреляционные зависимости в пространстве будут рассчитываться со стоимостными и натуральными / процентными показателями из запроса. В каждом из случаев на экран пользователя будет выведено сообщение о типах показателей, для которых возможен расчет показателей корреляции.

Для наглядности коррелируемые показатели могут быть визуализированы в виде графиков. Для каждой пары показателей, проверяемых на корреляцию, строятся графики значений этих показателей и рассчитываются значения корреляционных коэффициентов, позволяющих определить наличие корреляционной связи. Важно помнить, что во многих рядах динамики можно наблюдать зависимость одного из уровней ряда от предшествующих. Зависимость между последовательными (соседними) уровнями ряда динамики называется в статистике автокорреляцией.

Одним из условий корректной корреляции является независимость отдельных значений показателей. Для рядов динамики это равнозначно отсутствию автокорреляции между уровнями ряда, т.е. коррелировать уровни рядов динамики можно лишь в том случае, если в каждом из них отсутствует автокорреляция.

В базах данных в начале процедуры для каждого из рядов происходит проверка на автокорреляцию (при этом используется критерий Дарбина — Уотсона). При обнаружении автокорреляции пользователю выводится соответствующее сообщение (см. Рис. 30).



Рис. 30. Пример расчета корреляции показателя «Правонарушения. Число преступлений, совершенных несовершеннолетними и при их соучастии. Единиц» и «Образование. Выпуск специалистов образовательными учреждениями среднего профессионального образования. Государственные и муниципальные учреждения. Человек» за период с 1990 по 2005 год по Российской Федерации.

На Рис. 31 представлен пример расчета показателей корреляции показателя «Правонарушения. Число преступлений, совершенных несовершеннолетними и при их соучастии» с показателем «Образование. Выпуск специалистов образовательными учреждениями среднего профессионального образования. Государственные и муниципальные учреждения». При этом коррелировать выбранный показатель с показателем «Образование. Выпуск специалистов высшими учебными заведениями. Государственные и муниципальные учреждения» и показателем «Образование. Выпуск специалистов высшими учебными заведениями. Всего» некорректно, так как значения выбранного показателя автокоррелированы. Пользователю выдано соответствующее сообщение.

Для анализа корреляционных связей требуется выбрать не менее двух показателей, нажать на значок «Показатели корреляции» и выбрать один из двух способов расчета корреляции (за определенный год по всем территориям или за все года по определенной территории). Если коррелировать показатели корректно (автокорреляция отсутствует), вычисляются следующие характеристики корреляции — длина выборки, уравнение регрессии, средняя квадратичная ошибка аппроксимации, теоретическое корреляционное отношение, линейный коэффициент корреляции r, средняя ошибка для r, t-статистика для r, коэффициент Спирмена, коэффициент Кендэла, коэффициент Фехнера (Рис. 31).

Все показатели корреляции снабжены справкой с описанием методики расчета. Справки доступны по клику на значок «» (Рис. 31).



Рис. 31. Справка по средней ошибке для линейного коэффициента корреляции

Построение индексов — расчет стоимостных показателей в ценах базисного года

Расчет стоимостных показателей в ценах базисного года необходим для анализа динамики стоимостных показателей с учетом фактора инфляции. Сервис доступен для некоторых стоимостных показателей баз с ежегодным обновлением данных (Рис. 32).

Сервис позволяет рассчитывать показатели в ценах базисного года и строить графики расчетных показателей для любого из регионов Российской Федерации.

Пример расчета показателя «Валовой региональный продукт на душу населения» (ВРП) с помощью показателя «Индекс физического объема валового регионального продукта» за 2003-2009 гг. в ценах 2008 года:  ВРПтекущего года в ценах базисного года, если базисный год следовал после текущего = ВРП в базисном году / Iтекущего года/к базисному году. ВРПтекущего года в ценах базисного года, если текущий год следовал после базисного = ВРП в базисном году * Iтекущего года/к базисному году. Например,  ВРП2003 (в ценах 2008)=ВРП2008 (в ценах 2008) / I2008/2003, где I — (значения показателя «Индекс физического объема валового регионального продукта») / 100, I2008/2003= I2008/2007* I2007/2006* I2006/2005* I2005/2004* I2004/2003.  ВРП2009 (в ценах 2008)=ВРП2008 (в ценах 2008) * I2009/2008.

Для получения расчетных данных кликните на значок «» в ячейке сводной таблицы с названием выбранного показателя (Рис. 32).



Рис. 32. Выбор сервиса построения индексов — расчета показателей в ценах базисного года для показателя «Инвестиции. Инвестиции в основной капитал, руб.; до 1998 г. — тыс. руб.; в фактически действовавших ценах»

По расчетному показателю может быть построен график для любого из регионов Российской Федерации, выбранных при построении запроса (Рис. 33).



Рис. 33. Сервис построения индекса — расчета показателей в ценах базисного года: рассчитан показатель «Инвестиции. Инвестиции в основной капитал, руб.; до 1998 г. — тыс. руб.; в фактически действовавших ценах», базисный год — 2008 г. Построен график этого расчетного показателя по Российской Федерации и Приволжскому федеральному округу

Построение прогнозов

В базах данных реализована процедура построения прогноза временных рядов для нестоимостных показателей на среднесрочный период. Прогнозные значения вычисляются автоматически, без использования экспертных оценок.

Ограничения: для того, чтобы построить прогнозное значение показателя по региону, необходимо, чтобы присутствовали данные, как минимум, за 3 года. Процедура основана на регрессионной модели с настраиваемыми коэффициентами. Используется линейная «взвешенная» регрессия, коэффициенты которой являются весами — каждый весовой коэффициент отображает степень важности, с которой следует учитывать значение показателя за соответствующий период в прогнозировании. Самый первый год, за который значение выбранного показателя присутствует в базе данных, будет учитываться с наименьшим весом, самый последний — с наибольшим. При этом параметр «забывания», отражающий распределение значений весовых коэффициентов, является настраиваемым параметром прогнозирующей функции. Настройка параметра осуществляется с помощью кросс-валидации (скользящего контроля).

Для получения прогнозных значений кликните на значок «» в ячейке с названием нужного показателя в строке, соответствующей нужному региону. Сервис доступен только для нестоимостных показателей (т.е. натуральных и процентных). Построятся графики фактических и прогнозных значений показателя (Рис. 34).



Рис. 34. Функция прогнозирования: прогнозные значения для показателя «Численность студентов высших учебных заведений. Всего, на начало учебного года; человек; на 10 000 человек населения» по Псковской области на ближайшие пять лет

Справка с описанием методики расчета прогнозных значений открывается по клику на значок «» в сервисе прогноза (Рис. 35).



Рис. 35. Функция прогнозирования. Справка

Документы

При нажатии на элемент «Документ» (значок «») пользователь попадает в среду Интегрированного поиска с возможность поиска показателя во всех базах данных статистических показателей и в различных публикациях (Издания государственных органов, Издания исследовательский центров, Научные издания, Средства массовой информации).

Переход через значок «Документы» (значок «») в ячейке таблицы определенного показателя, тогда в строке поиска автоматически появляется название этого показателя, напротив разделов отражается количество показателей в базах данных и количество публикаций, где этот показатель присутствует (Рис. 11). Подробности о возможностях интегрированного поиска находятся в разделе «Интегрированный поиск».



Рис. 11. Поиск показателя «Заработная плата» в базах данных

Статформы

Элемент «Статформы» (значок «») направляет пользователя в раздел Интегрированного поиска «Росстат. Формы статистической отчетности» по выбранному показателю. Отражаются те формы статистической отчетности, которые связаны с интересующим показателем. При нажатии на выбранную форму, она скачивается в формате .doc (Рис.36).

Рис. 36. Скаченная форма «Сведения об основных показателях деятельности микропредприятия»

Методологические документы

Элемент «Методологические документы» (значок «») направляет пользователя в раздел Интегрированного поиска «Росстат. Методологические разработки» по выбранному показателю. Отражаются те методологические документы, которые связаны с выбранным показателем. При нажатии на выбранную форму, она скачивается в формате .doc (Рис.37).

Рис. 37. Скаченная методология форм «Краткосрочная статистика предприятий»

Средства визуализации значений показателей

Графики

Графики — эффективная форма визуального представления данных и временных рядов. С помощью графиков достигается наглядность динамики изменений, взаимосвязи явлений, их сравнения.

Наиболее распространенными типами графиков являются диаграммы, которые могут быть нескольких видов: линейные, радиальные, точечные, плоскостные, объемные, фигурные. Вид диаграммы зависит от вида представляемых данных (одна переменная или один показатель, несколько переменных или показателей, количественные или неколичественные) и задачи построения графика.

Для построения графиков выберите опцию «Построить графики» (значок «») в горизонтальном меню над сводной таблицей или кликните на значок «Графики и диаграммы» «» в ячейке таблицы с названием интересующего показателя (Рис. 38).



Рис. 38. Выбор сервиса построения графиков и диаграмм из сводной таблицы

Страница построения графиков и диаграмм содержит: горизонтальное меню с элементами «Показать таблицу» (значок «show table»), «Интегрированный поиск (значок «» и «Помощь» (значок «»), интерактивную область построения графиков с легендой, элементы для выбора типа графиков (показатели по региону или регионы по показателю), элементы для выбора территорий, показателей и периодов времени для отображения на графике.

График может быть построен а) по значениям одного показателя в одном году для разных регионов или б) график по одному региону по нескольким показателям, а также в) график по результатам расчетов, прогноз и т. д. Вид графика (Рис. 39) можно выбрать из нескольких опций и представить в виде линий, столбцов, ломаной, закрашенной области, точек и др. Кроме того, предусмотрены возможности изменения настроек вида графиков, его цвета и параметров легенды, экспорта рисунков в файл в форматах PNG, JPEG, PDF, SVG (элементы «Download PNG image», «Download JPEG image», «Download PDF document image», «Download SVG vector image») и печати рисунков (элемент «Print chart»).



Рис. 39. Вид экрана с графиками и диаграммами для показателя «Валовой региональный продукт. Валовой региональный продукт на душу населения» по г. Москве, Владимирской и Московской области