Инструкция к разделу «Базы данных и online-анализ» Вернуться к таблице

Уважаемые пользователи, рады приветствовать вас на информационном ресурсе «Базы данных и online-анализ» Университетской информационной системы РОССИЯ!

Описание баз данных

Раздел «Базы данных и online-анализ» (Рис. 1) содержит следующие базы данных: «Регионы России. Ежегодное обновление показателей», «Регионы России: ежемесячное обновление показателей» «Муниципальные образования. Ежегодное обновление показателей». Эти ресурсы формируют основу инфраструктуры для инновационных учебных курсов с использованием социально-экономической статистики, предусмотренных Федеральными государственными образовательными стандартами высшего профессионального образования.


Рис. 1. Раздел УИС РОССИЯ «Базы данных и on-line анализ». Выбор базы данных

Регионы России: ежегодное обновление показателей

База интегрирует данные государственной социально-экономической статистики Федеральной службы государственной статистики (Росстат), данные бюджетной статистики Министерства финансов РФ/Федерального казначейства (Росказна), Федеральной налоговой службы, содержит порядка 60 тыс. показателей, общий объем базы 1,5 Гб. Блок показателей социально-экономического развития субъектов РФ формируется на основе данных ежегодного сборника Росстата «Регионы России», а также сборников «Экономическая активность населения России (по результатам выборочных обследований)», «Цены в России», «Демографический ежегодник России», «Семья в России», «Российский статистический ежегодник», «Торговля в России», «Труд и занятость в России», «Здравоохранение в России», «Жилищное хозяйство и бытовое обслуживание населения в России». Представлено порядка 2000 показателей, большинство которых - в ретроспективе с 1990 года. Показатели структурированы в соответствии с рубрикацией, используемой в сборниках «Регионы России» с 2005 года. Показатели из сборников за разные годы, начиная с 2000 года, сведены во временные ряды. Показатели Росстата снабжены методологическими пояснениями и «привязаны» к формам статистической отчетности, дополненным инструкциями по их заполнению.

Блок показателей бюджетной статистики формируется на основе данных ведомственной статистики, размещенных на официальных сайтах Минфина и Федерального казначейства. Данные представлены в ретроспективе с 1998 года и включают как плановые показатели, так и фактические данные. Обновление показателей производится ежегодно.

Регионы России: ежемесячное обновление показателей

Источник данных — региональное приложение к ежемесячному сборнику «Социально-экономическое положение России» и публикация Росстата «Информация для ведения мониторинга социально-экономического положения субъектов Российской Федерации», включает 1140 показателей в ретроспективе с января 2006 года. Данные обновляются ежемесячно.

Муниципальные образования: ежегодное обновление показателей

База разработана на основе публикации Росстата «Муниципальная статистика. Паспорт муниципального образования», содержит данные по 25000+ муниципалитетам. Общее число показателей — около 900. Показатели представлены в виде временных рядов и даны в разрезе муниципальных районов, городских округов, городских и сельских поселений и отражают социальную инфраструктуру муниципальных образований, финансы, уровень жизни, ряд других сведений. Ретроспектива данных - 2006 год. База дополнена развернутым информационным блоком по муниципальному уровню управления в РФ — основные регулирующие документы, виды территориальных образований, вопросы местного значения, полномочия, история местного самоуправления и т.д. Обновление базы производится ежегодно.

Формирование запроса

Главная страница раздела содержит элементы для выбора базы данных и формирования запроса для получения сводной таблицы с данными. Формирование запроса предполагает выбор показателей, территорий (округов, муниципальных образований и/или регионов) и периодов времени (Рис. 2). Для выбора элементов запроса воспользуйтесь вкладками «Показатели», «Регионы» и «Периоды времени», расположенными в левой части экрана. Выбор элементов запроса может быть осуществлен в любом порядке, однако выбор периодов времени является контекстно-зависимым: при выбранных показателях и территориях имеется возможность выбрать только те периоды времени, по которым в базе имеются данные, воспользовавшись опцией «Выбрать всё» (значок «») на вкладке «Периоды времени».

По умолчанию выбрана база «Регионы России: ежегодное обновление показателей». При изменении выбранной базы (в списке в левой верхней части экрана) построится сводная таблица из этой базы с данными, заданными по умолчанию. При формировании запроса с помощью вкладок «Показатели», «Регионы» и «Периоды времени» сводная таблица перестраивается в соответствии с пользовательским запросом.



Рис. 2. Построение запроса — вкладки для выбора территории (региона или муниципального образования), показателей и периодов времени

Выбор показателя

Показатели представлены в виде иерархического многоступенчатого дерева в левой части экрана. Кликом на название показателя раскрывается нижестоящий уровень дерева (Рис. 3).



Рис. 3. Выбор показателя по иерархическому дереву

Возможен поиск показателя по названию, для этого в поисковое окно введите название (или часть названия) показателя и нажмите на кнопку «». Система проводит морфологический анализ и ищет близкие по значению показатели. Например в базе «Регионы России: ежемесячное обновление показателей», при вводе в поисковое окно слова «молоко», получите несколько показателей из рубрики «Промышленность. Производство важнейших видов продукции», а также показатель «Сельское хозяйство. Производство продуктов животноводства в хозяйствах всех категорий. Молоко». Запрошенное слово/часть слова будет подсвечено в названии найденного показателя (Рис. 4).



Рис. 4. Выбор показателя. Проведен поиск по слову «молоко». Выбраны показатели «Промышленность. Производство важнейших видов продукции. Цельномолочная продукция (в пересчете на молоко)», «Сельское хозяйство. Производство продуктов животноводства в хозяйствах всех категорий. Молоко».

Выбор территории

Выбор субъекта РФ осуществляется из списка регионов и федеральных округов для баз «Регионы России» (Рис. 5) и списка муниципалитетов для базы «Муниципальные образования» (Рис. 6) — установите галочки в чек-боксах напротив нужных территорий. Раскрытие нижестоящего уровня в дереве территорий происходит по клику на название региона.



Рис. 5. Выбор территорий в базе «Регионы России: ежемесячное обновление показателей». Выбраны Центральный федеральный округ и Курская область.

В базе «Муниципальные образования. Ежегодное обновление показателей» для выбора муниципалитета кликните на соответствующий субъект федерации. Будет выдан список всех муниципальных образований данного региона по алфавиту. Для выбора определенных муниципальных образований поставьте галочки у нужных названий.



Рис. 6. Выбор территорий в базе «Муниципальные образования: ежемесячное обновление показателей». Выбраны несколько муниципалитетов Ивановской области: Вичугский муниципальный район, Верхнеландеховский муниципальный район, Гаврилово-Посадский муниципальный район, Заволжский муниципальный район, Ивановский муниципальный район.

Для выбора всех субъектов РФ выберите опцию «Выбрать всё» (значок «») на вкладке «Регионы». Для снятия отмеченных ранее территорий нажмите «Очистить всё» (значок «»).

Выбор года / периода времени

Ретроспектива данных по базам данных и по отдельным показателям разная, что обусловлено разной ретроспективой наблюдений показателей. Отсутствие данных за некоторые годы и периоды времени обусловлено спецификой первоисточника — публикаций Росстата: в ежегодных сборниках показатели представлены не последовательно по годам, а выборочно. Коллективом УИС РОССИЯ выполнены работы по формированию непрерывного последовательного временного ряда на основе обработки публикаций Росстата за разные годы.

В базе «Регионы. Ежегодное обновление показателей» выстроена ретроспектива данных с 1970 года, но до 1989 года показатели представлены выборочно (за 1970, 1979, 1984, 1985, 1986, 1989 годы).
В базе «Регионы. Ежемесячное обновление показателей» данные представлены последовательно с января 1992 года, причем доступны показатели ежемесячные, квартальные и накопленные (нарастающим итогом с начала года).
В базе «Муниципальные образования. Ежегодное обновление показателей» ретроспектива данных с 2005 года.

Для выбора определенного года или нескольких лет поставьте галочку в соответствующих чек-боксах на вкладке «Периоды времени».

Для выбора всех лет выберите опцию «Выбрать всё» (значок «») (Рис. 7). Опция «Выбрать все» активирует процедуру «Включить зависимость» — проверку наличия в базе показателей по годам. В результате проверки галочки в чек-боксах появятся только за те годы, по которым есть данные. Эта процедура позволяет избежать выдачи в таблице пустых ячеек, свидетельствующих об отсутствии данных. Для снятия выбора периодов времени предусмотрена опция «Очистить всё» (значок «»).



Рис. 7. Выбор года/периода времени. Выбраны все годы, Москва и Московская область, показатель «Валовой региональный продукт. Валовой региональный продукт на душу населения». Данные до 1994 года и после 2009 года отсутствуют (галочек нет)

Конструктор таблиц

Конструктор таблиц позволяет варьировать формат таблицы (менять представление значений в столбцах и строках), чтобы в зависимости от условий задачи обеспечить наглядность представления данных. На вкладке со значком «» (справа от вкладки «Периоды времени») отображены опции для формирования таблицы (Рис. 8), конструктор позволяет изменять формат таблицы на всех этапах работы. По умолчанию показатели и регионы отображаются в строках, годы — в столбцах (базовое представление таблицы).



Рис. 8. Вкладка конструктора таблиц. Опция представления данных в таблице

При изменении параметров (например, выборе представления значений показателей в столбцах как показано на Рис. 8) вид таблицы динамически перестроится в соответствии с запросом.

Сводная таблица данных

Сводная таблица с данными строится автоматически при выборе показателей, территорий и периодов времени на соответствующих вкладках в левой части экрана. Над сводной таблицей располагается горизонтальное меню с элементами «Показать на карте» (значок «»), «Построить картограмму» (значок «»), «Построить графики» (значок «»), «Получить публикации» (значок «»), «Очистить запрос» (значок «») и «Помощь» (значок «»).

При нажатии на значок «» в ячейке с названием показателя в сводной таблице открывается всплывающее окно со ссылками на источник/источники для данного показателя (Рис. 9).



Рис. 9. Всплывающее окно со ссылками на источник для показателя «Валовой региональный продукт. Валовой региональный продукт на душу населения»

Для формирования нового запроса выберите элемент «Очистить запрос» (значок «») в горизонтальном меню над сводной таблицей.

Типы показателей

В базах данных каждый показатель, включающий единицу измерения, является базовым или расчетным. Базовые показатели могут быть натуральными либо стоимостными. Расчетные показатели могут быть процентными, натуральными либо стоимостными. Таким образом, каждый показатель можно отнести к одному из пяти типов. Ячейки с названиями показателей в сводной таблице окрашиваются в разные цвета в зависимости от типа (Рис. 10). Голубые тона соответствуют базовым показателям, зеленые — расчетным:

  •  — базовый стоимостной;
  •  — базовый натуральный;
  •  — расчетный процентный;
  •  — расчетный стоимостной;
  •  — расчетный натуральный.

При наведении на ячейку сводной таблицы с названием показателя появляется подсказка с названием типа этого показателя.



Рис. 10. Пример сводной таблицы, содержащей показатели разных типов

Единицы измерения показателей

В базах данных УИС РОССИЯ каждый показатель может иметь одну или несколько единиц измерения. Если единиц измерения несколько, то в ячейке с названием показателя в сводной таблице присутствует раскрывающийся список с доступными для показателя единицами измерения (Рис. 11).



Рис. 11. Список доступных единиц измерения для показателя «Торговля и услуги населению. Оборот оптовой торговли организаций оптовой торговли»

Для удобства пользователя при изменении единицы измерения в ячейке с показателем автоматический переход на эту единицу измерения происходит во всех ячейках с названием данного показателя (для всех выбранных территорий).

Изменение масштаба единиц измерения

Для показателей всех типов, кроме процентного, доступна функция изменения масштаба для выбранной единицы измерения.

Например, в ячейке с названием показателя «Торговля и услуги населению. Оборот оптовой торговли организаций оптовой торговли» при выборе единицы измерения «руб.» будет доступен раскрывающийся список с возможными коэффициентами для изменения масштаба единицы измерения (Рис. 12). По умолчанию коэффициент равен 1, что соответствует единицы измерения «руб.», при выборе коэффициента 1000 значения показателя в сводной таблице будут отображены в тыс. рублей, при коэффициенте 1000 000 — в млн рублей, при 1000 000 000 — в млрд рублей.



Рис. 12. Список доступных коэффициентов масштабирования единицы измерения «руб.» для показателя «Торговля и услуги населению. Оборот оптовой торговли организаций оптовой торговли»

Для удобства пользователя при изменении коэффициента масштабирования единицы измерения в ячейке с показателем автоматический переход на выбранный коэффициент происходит во всех ячейках с названием данного показателя (для всех выбранных территорий).

Сортировка числовых значений

Записи в таблице могут быть отсортированы — упорядочены по убыванию или по возрастанию числовых значений. Сортировка по возрастанию/убыванию происходит по клику на значок «», расположенный в заглавных ячейках сводной таблицы (Рис. 13).



Рис. 13. Сервис сортировки числовых значений. Данные по показателю «Образование. Выпуск специалистов высшими учебными заведениями. Всего» по Чувашской Республике, Удмуртской Республике, Республике Мордовия, Пензенской области за 2010 год отсортированы по возрастанию

Загрузка сводной таблицы в форматах xls и csv

Средства работы с таблицей включают экспорт таблицы в стандартные форматы — xls и csv. Для загрузки сводной таблицы в формате xls и csv нажмите на значок «» и «» соответственно справа над сводной таблицей (Рис. 14).



Рис. 14. Опции для экспорта таблицы в форматы xls и csv

Обработка и анализ данных в таблице

В базах реализованы процедуры отбора, расчета, представления и анализа показателей с использованием основных (классических) методов, применяемых в практической статистике для характеристики совокупности данных в созданной пользователем таблице, в том числе:

  • отбор значений показателей по критерию (значок «»);
  • расчет элементов описательной статистики (среднего значения, суммы, стандартного отклонения, стандартной ошибки, дисперсии, минимума, максимума, размаха, эксцесса (вариации), асимметрии) — построение вторичных переменных вариационных рядов и рядов динамики (значки «» и «» соответственно);
  • вычисление показателей корреляции (значок «»);
  • выявление сезонных колебаний в рядах с ежемесячными или квартальными данными (значок «»);
  • построение индексов — расчет стоимостных показателей в ценах базисного года (значок «»);
  • построение прогнозов (значок «»).

Сервисы доступны по клику на соответствующие значки (Рис. 15), при наведении на любой из значков появляется подсказка с названием соответствующего сервиса.



Рис. 15. Вид сводной таблицы со значками для доступа к аналитическим сервисам

В зависимости от типа показателя набор сервисов, доступных для него, может быть разным. Например, сервис расчета вторичных переменных рядов динамики не доступен для стоимостных и процентных показателей, сервис прогноза доступен только для нестоимостных показателей (т.е. натуральных и процентных). Для сервиса корреляции также имеются некоторые ограничения, зависящие от типа показателя, для которого он вызван: корреляция стоимостного показателя во времени (по одному региону за все доступные в базе периоды времени) вычисляется только для стоимостных показателей из запроса, корреляция натурального / процентного показателя вычисляется для натуральных / процентных показателей из запроса, а также для стоимостных показателей в случае расчета корреляции в пространстве (по нескольким регионам за один период).

Страницы с сервисными функциями содержат следующие общие элементы: название сервиса, значок «» для доступа к справке с описанием соответствующей сервисной функции, значок «» для возврата к сводной таблице, название выбранных пользователем показателя / территории, для которых была вызвана сервисная функция.

Подробнее о каждом сервисе:

Отбор по критерию

Окно с сервисом доступно по клику на значок «». Сервис доступен для показателей всех типов. Критерием или фильтром для отбора показателей в таблице могут служить значения большие, меньшие или равные значению, названному пользователем (Рис. 16). При выборе в раскрывающемся списке элементов «среднее значение», «мода», «медиана», «минимум», «максимум» пользователь может автоматически получить значения этих характеристик для всей сводной таблицы и отобрать данные (Рис. 17).



Рис. 16. Вид экрана для задания значения больше, меньше, равно значению, указанному пользователем (257.444)



Рис. 17. Вид экрана для выбора критерия — среднего значения, моды, медианы, минимума, максимума

Ячейки со значениями, удовлетворяющими критерию, выделятся.

Построение вторичных переменных вариационных рядов

Вторичные переменные вариационных рядов (значок «») относятся к понятиям описательной статистики и представляют собой набор показателей, в общем виде описывающих характеристики ряда. В базах данных для вариационных рядов автоматически вычисляются следующие переменные — сумма, максимум, минимум, среднее, мода, медиана, размах вариации, дисперсия, среднее линейное отклонение, относительное линейное отклонение, среднее квадратическое отклонение, коэффициент вариации, коэффициент концентрации Джини, коэффициент Герфиндаля, коэффициент асимметрии Пирсона, квартили (1-й и 3-й), квартильный коэффициент, квинтили (1-й и 4-й), квинтильный коэффициент), децили, децильный коэффициент, фондовый коэффициент дифференциации (Рис. 18). Сервис доступен для показателей всех типов.

По каждой переменной может быть построен график и получено определение. Кликните на соответствующий значок — «» или «» (Рис. 18).



Рис. 18. Вид экрана сервиса вторичных переменных вариационных рядов для показателя «Население. Ожидаемая продолжительность жизни при рождении. Все население. Лет» по Приморскому краю, Хабаровскому краю и Амурской области. Получено определение относительного линейного отклонения, построен график коэффициента концентрации Джини

Построение вторичных переменных рядов динамики

Изучение изменения (динамики) явлений во времени — одна из задач статистики. Решается эта задача путем составления т.н. рядов динамики (временных или хронологических рядов).

Ряд динамики представляет собой числовые значения определенного статистического показателя в последовательные моменты или периоды времени (т.е. расположенные в хронологическом порядке). Числовые значения показателя, составляющие ряд динамики, называют уровнями ряда и обычно обозначают через y. Первый член ряда называют начальным уровнем, а последний — конечным. Моменты или периоды времени, к которым относятся уровни, обозначают через t.

Цель изучения рядов динамики — выявить основную тенденцию (закономерность) в изменении уровней ряда, именуемую трендом. Закономерность в изменении уровней ряда в одних случаях проявляется довольно наглядно, в других — может затушевываться колебаниями, вызванными случайными и неслучайными причинами.

Анализ рядов динамики начинается с выявления направления изменения уровней ряда (увеличиваются, уменьшаются или остаются неизменными) в абсолютном и относительном выражении. Чтобы проследить за направлением и размером изменений во времени, для рядов динамики рассчитывают следующие переменные: абсолютный прирост (цепной), абсолютный прирост (базисный), коэффициент (цепной), коэффициент (базисный), темп роста (цепной), темп роста (базисный), темп прироста (цепной), темп прироста (базисный), абсолютное значение (1%) прироста, среднее значение, средний абсолютный прирост, средний коэффициент роста, средний темп роста, средний темп прироста. В базах данных эти переменные рассчитаны по умолчанию для каждой выбранной территории (Рис. 19).

Окно с сервисом доступно по клику на значок «». Сервис доступен только для натуральных показателей (базовых и расчетных).



Рис. 19. Вид экрана с перечнем расчетных показателей и их значений, характеризующих динамику показателя «Население. Ожидаемая продолжительность жизни при рождении. Все население. Лет» по Приморскому краю за период с 1995 года. Получено определение темпа роста, построен график по базисному темпу роста

Для перехода к расчетным показателям по другому региону вернитесь к таблице кликом на значок «» и на вкладке «Регионы» выберите другой регион из списка регионов, указанных в запросе и представленных в таблице (Рис. 20).



Рис. 20. Переход к таблице с расчетными показателями по другому региону

Расчет корреляций

Корреляция показателей — это статистическая взаимосвязь двух или нескольких величин. При этом, изменения одной или нескольких из этих величин приводят к систематическому изменению другой или других величин. Корреляция показателей позволяет выявлять статистические зависимости между показателями, наличие или отсутствие корреляционных связей и их тесноту. Математической мерой корреляции двух величин служит коэффициент корреляции. Коэффициент корреляции может изменяться от -1 до +1. Значение -1 означает полностью отрицательную корреляцию, значение +1 означает полностью положительную корреляцию. Значение 0 означает отсутствие корреляции.

В базах данных с помощью сервиса корреляции (значок «») можно попарно рассчитать корреляционные зависимости между выбранным показателем и остальными показателями, указанными при запросе. Возможен расчет корреляций двумя способами:

  • за все периоды по одному из регионов, указанных в запросе (корреляция во времени);
  • по всем регионам за один из периодов, указанных в запросе (корреляция в пространстве).

При этому введены некоторые ограничения на то, между какими парами показателей из запроса рассчитываются показатели корреляции. Ограничения связаны с расчетом корреляций для показателей разных типов. Корреляционные зависимости во времени для стоимостных / натуральных / процентных показателей будут рассчитываться только со стоимостными / натуральными / процентными показателями из запроса. Если выбранный показатель натуральный / процентный, то корреляционные зависимости в пространстве будут рассчитываться со стоимостными и натуральными / процентными показателями из запроса. В каждом из случаев на экран пользователя будет выведено сообщение о типах показателей, для которых возможен расчет показателей корреляции.

Для наглядности коррелируемые показатели могут быть визуализированы в виде графиков. Для каждой пары показателей, проверяемых на корреляцию, строятся графики значений этих показателей и рассчитываются значения корреляционных коэффициентов, позволяющих определить наличие корреляционной связи. Важно помнить, что во многих рядах динамики можно наблюдать зависимость одного из уровней ряда от предшествующих. Зависимость между последовательными (соседними) уровнями ряда динамики называется в статистике автокорреляцией.

Одним из условий корректной корреляции является независимость отдельных значений показателей. Для рядов динамики это равнозначно отсутствию автокорреляции между уровнями ряда, т.е. коррелировать уровни рядов динамики можно лишь в том случае, если в каждом из них отсутствует автокорреляция.

В базах данных в начале процедуры для каждого из рядов происходит проверка на автокорреляцию (при этом используется критерий Дарбина — Уотсона). При обнаружении автокорреляции пользователю выводится соответствующее сообщение (см. Рис. 21).



Рис. 21. Пример расчета корреляции показателя «Правонарушения. Число преступлений, совершенных несовершеннолетними и при их соучастии. Единиц» и «Образование. Выпуск специалистов образовательными учреждениями среднего профессионального образования. Государственные и муниципальные учреждения. Человек» за период с 1990 по 2005 год по Российской Федерации.

На Рис. 22 представлен пример расчета показателей корреляции показателя «Правонарушения. Число преступлений, совершенных несовершеннолетними и при их соучастии» с показателем «Образование. Выпуск специалистов образовательными учреждениями среднего профессионального образования. Государственные и муниципальные учреждения». При этом коррелировать выбранный показатель с показателем «Образование. Выпуск специалистов высшими учебными заведениями. Государственные и муниципальные учреждения» и показателем «Образование. Выпуск специалистов высшими учебными заведениями. Всего» некорректно, так как значения выбранного показателя автокоррелированы. Пользователю выдано соответствующее сообщение.

Для анализа корреляционных связей требуется выбрать не менее двух показателей, нажать на значок «Показатели корреляции» и выбрать один из двух способов расчета корреляции (за определенный год по всем территориям или за все года по определенной территории). Если коррелировать показатели корректно (автокорреляция отсутствует), вычисляются следующие характеристики корреляции — длина выборки, уравнение регрессии, средняя квадратичная ошибка аппроксимации, теоретическое корреляционное отношение, линейный коэффициент корреляции r, средняя ошибка для r, t-статистика для r, коэффициент Спирмена, коэффициент Кендэла, коэффициент Фехнера (Рис. 22).

Все показатели корреляции снабжены справкой с описанием методики расчета. Справки доступны по клику на значок «» (Рис. 21).



Рис. 22. Справка по средней ошибке для линейного коэффициента корреляции

Выявление сезонных колебаний

Для базы «Регионы. Ежемесячное обновление показателей» дополнительно реализован сервис выявления сезонных колебаний (значок «»). Под сезонными колебаниями понимается периодически повторяющиеся из года в год повышение и снижение уровней ряда динамики в отдельные месяцы или кварталы. Сезонная компонента наблюдается в рядах динамики статистических показателей с помесячными и квартальными данными. Сервис доступен по клику на значок «» (Рис. 23).



Рис. 23. Сервис выявление сезонных колебаний. Показатель «Уровень жизни населения. Темпы роста (снижения) денежных доходов и потребительских расходов на душу населения. Денежные доходы» по Центральному федеральному округу.

При изучении рядов динамики, содержащих сезонные колебания, их выделяют из общей колеблемости уровней ряда, измеряют и рассчитывают т.н. «индексы сезонности» — отношение месячных уровней к среднему месячному уровню за год.

Для характеристики силы колеблемости уровней динамического ряда из-за сезонной неравномерности используется среднее квадратическое отклонение индексов сезонности (в процентах) от 100%. В сервисе рассчитываются обе характеристики — индексы сезонности и среднее квадратическое отклонение индексов сезонности, а также строится график индексов сезонности за ряд лет, для которых значения показателя доступны в базе (см. Рис. 24).



Рис. 24. Сервис выявления сезонных колебаний для показателя «Уровень жизни населения. Темпы роста (снижения) денежных доходов и потребительских расходов на душу населения. Потребительские расходы» по Центральному федеральному округу.

Построение индексов

Расчет стоимостных показателей в ценах базисного года необходим для анализа динамики стоимостных показателей с учетом фактора инфляции. Сервис доступен для некоторых стоимостных показателей баз с ежегодным обновлением данных (Рис. 25).

Сервис позволяет рассчитывать показатели в ценах базисного года и строить графики расчетных показателей для любого из регионов Российской Федерации.

Пример расчета показателя «Валовой региональный продукт на душу населения» (ВРП) с помощью показателя «Индекс физического объема валового регионального продукта» за 2003-2009 гг. в ценах 2008 года:
ВРПтекущего года в ценах базисного года, если базисный год следовал после текущего = ВРП в базисном году / Iтекущего года/к базисному году.
ВРПтекущего года в ценах базисного года, если текущий год следовал после базисного = ВРП в базисном году * Iтекущего года/к базисному году.
Например,
ВРП2003 (в ценах 2008)=ВРП2008 (в ценах 2008) / I2008/2003, где I — (значения показателя «Индекс физического объема валового регионального продукта») / 100, I2008/2003= I2008/2007* I2007/2006* I2006/2005* I2005/2004* I2004/2003.
ВРП2009 (в ценах 2008)=ВРП2008 (в ценах 2008) * I2009/2008.

Для получения расчетных данных кликните на значок «» в ячейке сводной таблицы с названием выбранного показателя (Рис. 25).



Рис. 25. Выбор сервиса построения индексов — расчета показателей в ценах базисного года для показателя «Инвестиции. Инвестиции в основной капитал, руб.; до 1998 г. — тыс. руб.; в фактически действовавших ценах»

По расчетному показателю может быть построен график для любого из регионов Российской Федерации, выбранных при построении запроса (Рис. 26).



Рис. 26. Сервис построения индекса — расчета показателей в ценах базисного года: рассчитан показатель «Инвестиции. Инвестиции в основной капитал, руб.; до 1998 г. — тыс. руб.; в фактически действовавших ценах», базисный год — 2008 г. Построен график этого расчетного показателя по Российской Федерации и Приволжскому федеральному округу

Построение прогнозов

В базах данных реализована процедура построения прогноза временных рядов для нестоимостных показателей на среднесрочный период. Прогнозные значения вычисляются автоматически, без использования экспертных оценок.

Ограничения: для того, чтобы построить прогнозное значение показателя по региону, необходимо, чтобы присутствовали данные, как минимум, за 3 года. Процедура основана на регрессионной модели с настраиваемыми коэффициентами. Используется линейная «взвешенная» регрессия, коэффициенты которой являются весами — каждый весовой коэффициент отображает степень важности, с которой следует учитывать значение показателя за соответствующий период в прогнозировании. Самый первый год, за который значение выбранного показателя присутствует в базе данных, будет учитываться с наименьшим весом, самый последний — с наибольшим. При этом параметр «забывания», отражающий распределение значений весовых коэффициентов, является настраиваемым параметром прогнозирующей функции. Настройка параметра осуществляется с помощью кросс-валидации (скользящего контроля).

Для получения прогнозных значений кликните на значок «» в ячейке с названием нужного показателя в строке, соответствующей нужному региону. Сервис доступен только для нестоимостных показателей (т.е. натуральных и процентных). Построятся графики фактических и прогнозных значений показателя (Рис. 27).



Рис. 27. Функция прогнозирования: прогнозные значения для показателя «Численность студентов высших учебных заведений. Всего, на начало учебного года; человек; на 10 000 человек населения» по Псковской области на ближайшие пять лет

Справка с описанием методики расчета прогнозных значений открывается по клику на значок «» в сервисе прогноза (Рис. 28).



Рис. 28. Функция прогнозирования. Справка

Средства визуализации значений показателей

Графики

Графики — самая эффективная форма визуального представления данных и временных рядов. С помощью графиков достигается наглядность динамики изменений, взаимосвязи явлений, их сравнения.

Наиболее распространенными типами графиков являются диаграммы, которые могут быть нескольких видов: линейные, радиальные, точечные, плоскостные, объемные, фигурные. Вид диаграммы зависит от вида представляемых данных (одна переменная или один показатель, несколько переменных или показателей, количественные или неколичественные) и задачи построения графика.

Для построения графиков выберите опцию «Построить графики» (значок «») в горизонтальном меню над сводной таблицей или кликните на значок «Графики и диаграммы» «» в ячейке таблицы с названием интересующего показателя (Рис. 29).



Рис. 29. Выбор сервиса построения графиков и диаграмм из сводной таблицы

Страница построения графиков и диаграмм содержит: горизонтальное меню с элементами «Показать на карте» (значок «»), «Построить картограмму» (значок «»), «Показать таблицу» (значок «») и «Помощь» (значок «»), интерактивную область построения графиков с легендой, элементы для выбора типа графиков (показатели по региону или регионы по показателю), элементы для выбора территорий, показателей и периодов времени для отображения на графике.

График может быть построен а)по значениям одного показателя в одном году для разных регионов или б)график по одному региону по нескольким показателям, а также в)график по результатам расчетов, прогноз и т. д. Вид графика можно выбрать из нескольких опций и представить в виде линий (Рис. 30), столбцов (Рис. 31), ломаной, закрашенной области, точек и др.. Кроме того, предусмотрены возможности изменения настроек вида графиков, его цвета и параметров легенды, экспорта рисунков в файл в форматах PNG, JPEG, PDF, SVG (значок «») и печати рисунков (значок «»). Интерактивная легенда предоставляет возможность удалять / добавлять графики по соответствующему показателю или региону.



Рис. 30. Пример графика в виде линий. Представлены данные по показателям «Основные характеристики субъектов Российской Федерации. Основные социально-экономические показатели. Среднемесячная номинальная начисленная заработная плата работающих в экономике руб.», «Уровень жизни населения. Величина прожиточного минимума, установленная в субъектах Российской Федерации. Величина прожиточного минимума. Трудоспособное население руб.» по Краснодарскому краю с 2001 по 2010 годы. В каждой точке графика можно получить числовое значение показателя

Визуализация данных на карте-схеме

В базах данных УИС РОССИЯ реализована процедура визуализации значений показателей в географическом разрезе на карте-схеме. Для вызова карты-схемы выберите опцию «Показать на карте» (значок «») в горизонтальном меню на странице со сводной таблицей (Рис. 32).



Рис. 32. Опция вызова карты-схемы

Карта-схема дает возможность сопоставить субъекты и федеральные округи между собой по выбранным показателям. Результаты сопоставлений отображаются не только в формате картограмм, но одновременно и в виде гистограмм, позволяющих сравнивать значения показателей в нескольких регионах. Также картографический модуль предусматривает возможность визуализации результатов критериального отбора и сравнения значений показателя с заданным критерием (Рис. 33). Процедура группировки регионов в зависимости от значений выбранных признаков (Рис. 34) позволяет формировать региональные типологии — выделять группы субъектов РФ, схожие с любым заданным субъектом по одному или нескольким критериям.



Рис. 33. Сравнение значений показателя «Наука и инновации. Выпуск из аспирантуры с защитой диссертации, человек» с заданным критериям на картограмме.



Рис. 34. Группировка регионов на основании показателя «Средняя наполняемость классов в государственных и муниципальных дневных общеобразовательных учреждениях, 10-11 (12) классы, приходится учащихся в среднем на один класс; человек».