Тема 2. Правило сложения дисперсий

Практические задания


Общая дисперсия характеризует вариацию признака под влиянием всех условий (факторов) в данной совокупности. Исчисляется общая дисперсия по формуле: , где – общая средняя для всей изучаемой совокупности.

где – частная средняя по j-й группе;

k – число групп;

– число единиц в j-й группе.

Межгрупповая дисперсия () измеряет вариацию изучаемого признака, обусловленную влиянием фактора, положенного в основу группировки. Межгрупповая дисперсия вычисляется по формуле:

,

Средняя из внутригрупповых дисперсий () характеризует случайную вариацию, обусловленную влиянием прочих факторов и вычисляется по формуле:

Тогда общая дисперсия . Удельный вес межгрупповой дисперсии в общей дисперсии (коэффициент детерминации – 2) покажет, на сколько % вариация признака обусловлена вариацией группировочного признака и на сколько % - влиянием прочих факторов.

Показатель h носит название эмпирического корреляционного отношения, показателя степени тесноты связи исследуемого явления и группировочного признака.

Расчет дисперсий по данным распределения домашних хозяйств США в 1987 г. по величине совокупного дохода в зависимости от образования главы семьи:

Совокупный доход, тыс. долл. в год

Число домашних хозяйств, в % к итогу с образованием главы семьи

 

 

 

начальная школа

полное
среднее

I

II

I

II

А

1

2

3

4

5

6

7

До 5

16,3

5,4

2,5

40,75

13,5

3333,2

4143,4

5 – 10

26,7

10,0

7,5

200,25

75

2309,3

5152,9

10 – 15

17,2

11,0

12,5

215

137,5

318

3446,2

15 – 25

19,7

21,6

20

394

432

201,7

2247,3

25 – 35

9,9

19,0

30

297

570

1725

0,76

35 – 50

6.4

18,4

42,5

272

782

4227,1

2783,7

50 – 75

2,9

10,8

62,5

181,25

675

6056,6

11267,5

75 и выше

0,9

3,8

87,5

78,75

332,5

4498,6

12476,5

ИТОГО

100,0

100,0

 

1679

3017,5

22669,5

41518,3

Всего, тыс.

11500

30561

 

 

 

 

 

Получить данные в формате Microsoft Excel 97 (в архиве ZIP)

Для каждой группы рассчитывается средний совокупный доход
и его дисперсия:

Домашние хозяйства
с образованием главы семьи


(тыс. долл.)

Число домашних хозяйств, nj

Начальная школа

16,8

226,70

11500

Полное среднее

30,2

415,18

30561

Всего

 

 

42061

Получить данные в формате Microsoft Excel 97 (в архиве ZIP)

(для объединенной совокупности) = тыс.долл.

Межгрупповая (факторная ) дисперсия:

Средняя из частных (внутригрупповых) дисперсий

Общая дисперсия

Коэффициент детерминации (8,9 %)

Коэффициент детерминации показывает, что различие в уровне образования - начальное или среднее - в незначительной степени влияет на вариацию совокупного дохода домашних хозяйств.

Эмпирический коэффициент корреляции =0,30 свидетельствует о слабой связи между размером совокупного дохода домашних хозяйств и уровнем образования.

При проверке существенности связи часто используется показатель дисперсионное отношение F (критерий Фишера):

где –факторная дисперсия;

– остаточная дисперсия;

– число степеней свободы;

– (количество групп – 1);

– (число наблюдений – число групп).

Расчетное значение F сравнивается с критическим для принятого уровня значимости () и числа степеней свободы.

Если Fрасч.>Fкрит., наличие корреляционной связи доказано (проверяется гипотеза
(Но: об отсутствии взаимосвязи признаков).

При больших числах степеней свободы можно ограничиться вычислением коэффициентов детерминации () и корреляционного отношения , построение таблиц заканчивают при и .

Практические задания

ЗАДАЧА №1

Имеются данные о среднегодовом совокупном доходе домашних хозяйств в США в 1989 г.:

Тыс. долл. в год

Число домашних хозяйств, % к итогу

белые

черные (раса)

До 5

4.2

14,1

5 - 10

9,4

17,2

10 - 15

9,4

11,9

15 - 25

17,8

19,6

25 - 35

16,2

13,8

35 - 50

18,1

12,0

50 - 75

15,2

8,5

75 и выше

9,7

2,9

ИТОГО

100,0

100,0

тысяч дом. хозяйств

80163

10486

Получить данные в формате Microsoft Excel 97 (в архиве ZIP)

Рассчитайте:

1) внутригрупповые средние и дисперсии;

2) среднюю из внутригрупповых дисперсий;

3) межгрупповую дисперсию;

4) общую дисперсию;

5) коэффициент детерминации;

6) оцените существенность различий между двумя группами с помощью эмпирического корреляционного отношения.

ЗАДАЧА №2

Определить величину эмпирического корреляционного отношения, если общая дисперсия: =15,2, групповые средние ; ; , а численности групп соответственно равны 75; 60 и 65.

Получить полный текст документа в формате Microsoft Word (в архиве ZIP)

Казаринова С.Е., Карасев О.И. Теория статистики: справочные материалы, практические и контрольные задания, тесты. - М.: ИНФРА-М, 2002.