ЛАБОРАТОРНА РОБОТА № 4

 

Тема: ВИЯВЛЕННЯ ТА УСУНЕННЯ ЕФЕКТУ ГЕТЕРОСКЕДАСТИЧНОСТІ ДАНИХ

 

Мета роботи: набуття навичок виявлення та усунення ефекту гетероскедастичності з використанням MS Excel.

Зміст роботи: за допомогою табличного процесору MS Excel і пакету Statistica перевірити гіпотезу про наявність гетероскедастичності залишків та враховуючи отримані результати оцінити параметри багатофакторної регресійної моделі.

Вимоги до звіту: назва, тема, мета, завдання, вихідні дані варіанту. Результати аналітичного розв’язання задачі та комп’ютерного у вигляді таблиці MS Excel з вихідними умовами експерименту, таблиці MS Excel з результатами обчислень, висновок про отримані результати. Опис інструментів та функцій MS Excel, що використовувались при вирішенні задачі. Короткий опис технології вирішення задачі в MS.

 

МЕТОДИЧНІ ВКАЗІВКИ ДО РОЗВ’ЯЗАННЯ ЗАДАЧІ

 

Оцінка параметрів моделі на основі узагальненого методу найменших квадратів (методу Ейткена).

Необхідно оцінити параметри економетричної моделі, яка характеризує залежність витрат на харчування від загальних затрат на основі даних, що наведені в табл.

 

Таблиця

Номер

спостереження

Витрати на харчування

Загальні затрати

1

2,30

15

2,16

  0,14

0,020

2

2,20

15

2,16

  0,04

0,002

3

2,08

16

2,20

–0,12

0,015

4

2,20

17

2,25

–0,05

0,002

5

2,10

17

2,25

–0,15

0,022

6

2,32

18

2,29

  0,26

0,0007

7

2,45

19

2,34

  0,11

0,012

8

2,50

20

 

 

 

9

2,20

20

 

 

 

10

2,50

22

 

 

 

11

3,10

64

 

 

 

12

2,40

68

2,37

  0,13

0,016

13

2,82

72

2,52

  0,29

0,085

14

3,04

80

2,68

  0,36

0,128

15

2,70

85

2,99

–0,29

0,084

16

3,91

90

3,18

  0,76

0,573

17

3,10

95

3,38

–0,28

0,076

18

3,99

100

3,57

  0,42

0,178

 

Виходячи з особливостей вихідної інформації, можна припустити, що порушується гіпотеза про незмінність дисперсії.

 

Розв’язання

1. Ідентифікуємо змінні моделі:

 – витрати на харчування, залежна змінна;

 – загальні затрати, незалежна змінна;

.

2. Перевіримо наявність гетероскедастичності для наведених вихідних даних на основі параметричного тесту Гольдфельда-Квандта.

2.1. Впорядкуємо значення незалежної змінної X від меншого до більшого і відкинемо d значень, які знаходяться всередині впорядкованого ряду:

.

2.2. На основі отриманих двох сукупностей спостережень (від першого до сьомого включно і від одинадцятого до вісімнадцятого значення) побудуємо дві економетричні моделі за методом 1 МНК.

1-ша модель: ;

2-га модель: X.

2.3. Визначимо залишки по цих двох моделях:

;

.

Залишки та квадрати залишків наведені в табл.2.

2.4. Розрахуємо залишкові дисперсії та знайдемо їх співвідношення :

.

2.5. Порівняємо критерій  з критичним значенням F- критерію при  і  ступенях свободи і рівні довіри a = 0,01  F = 11. Оскільки крит, вихідні дані мають гетероскедастичність.

4. При наявності гетероскедастичності оцінку параметрів моделі виконаємо методом Ейткена:

.

(В даному прикладі взяті урізані дані, але виконувати лабораторне завдання необхідно по повному обсягу даних)

4.1. Запишемо матриці змінних, які входять в оператор Ейткена:

.

Визначимо матрицю , користуючись гіпотезою: , тобто

4.2 Визначимо добутки матриць:

;

4.3   Знайдемо обернену матрицю:

;

і вектор:

.

4.4. Обчислимо вектор оцінок параметрів моделі:

.

Звідси ;

Економетрична модель витрат на харчування запишеться так:

.

4.5 Економічний аналіз характеристик економетричної моделі.

Залишкова дисперсія  показує, що розрахункові значення витрат на харчування дуже близькі до фактичних.

Параметр моделі свідчить про те, що збільшення загальних затрат на одиницю сприятиме граничному зростанню витрат на харчування на 0,014 одиниць.

4.6 Розрахуємо матрицю коваріацій оцінок параметрів моделі:

Діагональні елементи цієї матриці є дисперсіями оцінок параметрів моделі, інші елементи характеризують коваріацію між оцінками.

4.7 Визначимо стандартні помилки оцінок параметрів і знайдемо їх довірчі інтервали

Для побудови довірчих інтервалів оцінок параметрів моделі знайдемо t-критерій при ступенях свободи n – m = 12 і рівні довіри a  =  0,05 ;  tкрит .

Довірчі інтервали оцінок:

Рівень стандартних помилок та довірчі інтервали оцінок параметрів моделі свідчать про те, що отримані оцінки є неефективними та зміщеними.

 

ПРАКТИЧНІ ЗАВДАННЯ

1.      Побудувати регресійну модель, що характеризує залежність між вхідними статистичними даними.

2.      Побудувати графіки, на яких одночасно відображено фактичні та оцінені значення результуючого показника від пояснюючого фактору, лінія регресії, та зробити на основі нього попередні висновки щодо правомірності вибору форми регресії й гомоскедастичності залишків.

3.      Перевірити гіпотезу про наявність гетероскедастичності залишків за тестом Голдфельда-Квандта.

4.      Припустивши форму гетероскедастичності (використати результати СР.07) оцінити параметри моделі за методом Ейткена.

5.      Перевірити істотність зв’язку, що описується моделями, оцінки параметрів яких розраховані за методом 1МНК і методом Ейткена.

6.      Дати порівняльний аналіз оцінок параметрів, отриманих різними методами, зробити висновки.

Для вирішення задачі використати: інструктивні матеріали, вбудовані функції, надбудову «Аналіз даних» в MS Excel.

 

Початкові дані:

На основі статистичних даних, які наведені в таблицях 1-20 (номер варіанту відповідає номеру таблиці), виконати завдання до роботи.

 

1.                   Для побудови економетричної моделі, що характеризує залежність між затратами на реалізацію продукції, обсягом товарообігу та середнім рівнем товарних запасів необхідно перевірити гіпотезу про наявність гетероскедастичності для вихідних даних, які наведені в табл. 1–7.

 

Таблиця 1

 

Таблиця 2

№ скла-ду

Затрати на реалі-зацію продукції, млн. грн.

Обсяг товаро-обігу,

млн.т.

Серед-ній рівень товар-них запасів,

млн. т

 

№ скла-ду

Затрати на реаліза-цію продукції,

млн. грн.

Обсяг товаро-обігу,

млн.т

Серед-ній рівень товар-них запасів,

млн.т

1

300

25

5

 

1

350

26

5

2

280

20

4

 

2

280

22

4

3

350

30

6

 

3

350

30

6

4

340

30

7

 

4

340

30

7

5

330

28

7

 

5

300

29

7

6

320

28

5

 

6

320

28

5

7

310

25

6

 

7

320

25

6

8

300

24

4

 

8

280

24

4

9

320

27

5

 

9

300

23

6

10

280

22

4

 

10

380

21

5

11

340

35

6

 

11

340

30

6

12

360

30

7

 

12

360

32

7

13

320

29

7

 

13

330

28

8

14

300

28

5

 

14

320

29

5

15

310

25

6

 

15

340

25

6

16

350

26

4

 

16

300

24

9

Таблиця 3

 

Таблиця 4

№ скла-ду

Затрати на реаліза-цію продукції,

млн.грн.

Обсяг товаро-обігу,

млн.т

Серед-ній рівень товар-них запасів,

млн.т

 

№ скла-ду

Затрати на реаліза-цію продукції,

млн.грн.

Обсяг товаро-обігу,

млн.т

Серед-ній рівень товар-них запасів,

млн.т

1

400

25

5

 

1

320

15

5

2

380

20

4

 

2

280

10

4

3

350

30

6

 

3

350

20

6

4

360

30

7

 

4

340

20

7

5

430

28

7

 

5

330

18

7

6

420

28

5

 

6

320

18

5

7

310

25

6

 

7

310

15

6

8

400

24

4

 

8

300

14

4

9

350

25

5

 

9

310

15

5

10

380

20

4

 

10

290

10

4

11

350

30

6

 

11

350

20

6

12

340

30

7

 

12

340

20

7

13

320

28

7

 

 

330

18

7

14

320

28

5

 

14

320

18

5

15

310

25

6

 

15

310

15

6

16

380

24

4

 

16

300

14

4

Таблиця 5

 

Таблиця 6

№ скла-ду

Затрати на реаліза-цію продукції,

млн.грн.

Обсяг товаро-обігу,

млн.т

Серед-ній рівень товар-них запасів,

млн.т

 

№ складу

Затрати на реаліза-цію продукції,

млн.грн.

Обсяг товаро-обігу,

млн.т

Серед-ній рівень товар-них запасів,

млн.т

1

300

25

5

 

1

200

15

5

2

280

20

4

 

2

180

20

4

3

350

20

6

 

3

250

30

6

4

340

10

7

 

4

240

30

7

5

380

28

7

 

5

230

38

7

6

320

28

5

 

6

220

38

5

7

310

15

6

 

7

210

25

6

8

400

24

4

 

8

250

34

4

9

350

25

5

 

9

200

15

5

10

280

20

4

 

10

190

25

4

11

350

20

6

 

11

250

30

6

12

340

20

7

 

12

240

30

7

13

380

28

7

 

13

230

18

7

14

320

28

5

 

14

280

28

5

15

310

15

6

 

15

210

25

6

16

320

14

4

 

16

200

14

4

Таблиця 7

№ складу

Затрати на реалізацію продукції, млн.грн.

Обсяг товарообігу,

млн.т

Середній рівень товарних запасів, млн.т

1

300

8

5

2

280

10

4

3

350

20

6

4

340

15

7

5

330

18

7

6

320

18

5

7

310

15

6

8

300

14

4

9

300

9

5

10

280

10

4

11

350

15

6

12

340

20

7

13

330

21

7

14

320

15

5

15

310

17

6

16

300

20

4

2. Для побудови економетричної моделі, що характеризує залежність між обсягом споживання на душу населення, ціною за одиницю продукції та доходом на душу населення, перевірити гіпотезу про відсутність гетероскедастичності для вихідних даних, які наведено в табл.8–12.

Таблиця 8

 

Таблиця 9

№ спосте-реження

Обсяг спожи-вання продукції

на душу населен-ня, т

Ціна за одиницю продукції,

тис. грн.

Дохід на душу населення, тис.грн.

 

№ спосте-реження

Обсяг спожи-вання продукції на душу населен-ня, т

Ціна за одиницю продук-ції,

тис.грн.

Дохід на душу насе-лення, тис.грн.

 1

 100

  30

  90

 

  1

 200

  30

  80

 2

 120

  35

  75

 

  2

 220

  35

  75

 3

 130

  40

  85

 

  3

 230

  40

  85

 4

 125

  30

  90

 

  4

 225

  35

  90

 5

 140

  45

 105

 

  5

 240

  45

  95

 6

 150

  30

  93

 

  6

 250

  50

  93

 7

 155

  55

  97

 

  7

 255

  55

  97

 8

 160

  60

 100

 

  8

 260

  62

 100

 9

 100

  30

  80

 

  9

 200

  30

  80

10

 120

  35

  75

 

 10

 220

  38

  75

11

 130

  40

  85

 

 11

 230

  40

  85

12

 125

  30

 100

 

 12

 225

  36

  90

13

 140

  45

  95

 

 13

 240

  45

  95

14

 150

  50

  93

 

 14

 250

  50

  93

15

 155

  55

  97

 

 15

 255

  55

  97

16

 160

  60

 100

 

 16

 260

  60

  98

Таблиця 10

 

Таблиця 11

№ спосте-реження

Обсяг спожи-вання продукції на душу населен-ня, т

Ціна за одиницю продукції,

тис. грн.

Дохід на душу насе-лення, тис.грн.

 

№ спосте-реження

Обсяг спожи-вання продукції на душу населен-ня, т

Ціна за одиницю продук-ції,

тис. грн.

Дохід на душу насе-лення, тис.грн

 1

 110

  20

  20

 

  1

 100

  30

  8

 2

 130

  25

  95

 

  2

 120

  35

 17

 3

 140

  30

  85

 

  3

 130

  40

 18

 4

 125

  20

 100

 

  4

 125

  30

 19

 5

 140

  35

  95

 

  5

 140

  45

 19

 6

 160

  20

 103

 

  6

 150

  50

 19

 7

 155

  45

  97

 

  7

 155

  55

 19

 8

 180

  50

 100

 

  8

 160

  60

 20

 9

 120

  20

  90

 

  9

 100

  30

  9

10

 120

  25

  85

 

 10

 120

  35

  7

11

 130

  30

  85

 

 11

 130

  40

 28

12

 135

  20

  90

 

 12

 125

  30

 29

13

 145

  35

 105

 

 13

 140

  45

  9

14

 150

  20

 193

 

 14

 150

  50

  9

15

 155

  45

 197

 

 15

 155

  55

 19

16

 160

  50

 200

 

 16

 160

  60

30

Таблиця 12

№ спостере-женя

Обсяг споживання продукції на душу населення, т

Ціна за одиницю продукції, тис. грн.

Дохід на душу населення, тис.грн.

 1

 100

  30

  28

 2

 120

  35

  27

 3

 130

  40

  25

 4

 125

  30

  20

 5

 140

  45

  35

 6

 150

  50

  40

 7

 155

  55

  45

 8

 160

  60

  50

 9

 150

  65

 120

10

 140

  70

 125

11

 130

  35

  30

12

 180

  45

 145

13

 120

  40

  50

14

 135

  55

  55

15

 155

  50

  88

16

 160

  40

  68

3. Для побудови економетричної моделі, що характеризує залежність між споживанням продукту, ціною його та витратами на виробництво одиниці продукції, необхідно перевірити гіпотезу про відсутність гетероскедастичності для вихідних даних, які наведено в табл.13–18.

Таблиця 13

 

Таблиця 14

№ спос-тере-ження

Спожи-вання продукту на душу населення, т

Ціна за одиницю продукції, тис. грн.

Витрати на вироб-ництво 1т продукту

млн. грн.

 

№ спос-тере-ження

Спожи-вання продукту на душу населен-ня,т

Ціна за одиницю продук-ції,

тис. грн.

Витрати на вироб-ництво 1т продукту,

млн. грн.

 1

 50

 10

 60

 

 1

 50

 10

 60

 2

 45

 12

 62

 

 2

 45

 12

 62

 3

 55

  9

 65

 

 3

 55

  9

 62

 4

 50

 10

 60

 

 4

 50

 10

 60

 5

 60

  8

 55

 

 5

 60

  8

 55

 6

 70

 16

 50

 

 6

 70

  6

 50

 7

 52

 10

 70

 

 7

 55

  5

 20

 8

 47

 12

 62

 

 8

 57

  6

 22

 9

 55

  9

 62

 

 9

 56

  7

 20

10

 50

 10

 60

 

10

 59

  8

 25

11

 65

 18

 85

 

11

 51

  9

 20

12

 70

  9

 50

 

12

 58

 10

 15

Таблиця 15

 

Таблиця 16

№ спос-тере-ження

Спожи-вання продукту на душу населен-

ня, т

Ціна за одиницю продукції  тис. грн.

Витрати на вироб-ництво 1т продукту,

млн. грн.

 

спосте-реження

Спожи-вання продукту на душу населен-ня, т

Ціна за одиницю продук-ції,

тис. грн.

Витрати на вироб-

ництво 1т продукту,

млн.грн.

 1

 50

     10

 70

 

 1

 50

 10

 90

 2

 45

     12

 62

 

 2

 45

 12

 62

 3

 55

      9

 72

 

 3

 55

 19

 82

 4

 50

     10

 60

 

 4

 50

 10

 60

 5

 60

     18

 55

 

 5

 60

  8

 85

 6

 70

     6

 60

 

 6

 70

 16

 50

 7

 50

    15

 60

 

 7

 50

 10

 70

 8

 45

    12

 82

 

 8

 45

 12

 62

 9

 55

    19

 62

 

 9

 55

  9

 62

10

 50

    10

 60

 

10

 50

 10

 80

11

 60

    9

 85

 

11

 60

 12

 65

12

 70

   14

 60

 

12

 70

 14

 60

Таблиця 17

 

Таблиця 18

Спос-тере-ження

Спожи-вання продукту на душу населення, т

Ціна за одиницю продукції, тис. грн.

Витрати на вироб-ництво 1т продукту, млн. грн.

 

спосте-реження

Спожи-вання продукту на душу населення

 

Ціна за одиницю продукції,

тис. грн.

Дохід на душу насе-лення

 1

 50

 10

 70

 

 1

 55

  5

 100

 2

 45

 12

 62

 

 2

 57

  6

 110

 3

 55

  9

 62

 

 3

 56

  7

 112

 4

 50

 10

 60

 

 4

 59

  8

 115

 5

 60

  8

 55

 

 5

 51

  9

 120

 6

 70

  6

 50

 

 6

 58

 10

 135

 7

 80

  8

 82

 

 7

 60

  8

 140

 8

 85

 10

 65

 

 8

 50

  9

 120

 9

 75

 12

 74

 

 9

 45

 15

 110

10

 90

  7

 87

 

10

 65

  8

 130

11

 45

 15

 62

 

11

 70

 11

 150

12

 50

 14

 60

 

12

 52

 12

 170

 

4. Для побудови економетричної моделі, що характеризує залежність між споживанням продукту, доходом на душу населення та ціною, необхідно перевірити гіпотезу про відсутність гетероскедастичності для вихідних даних, які наведено в табл.19–20.

Таблиця 19

 

Таблиця 20

№ спос-тере-ження

Споживання продукту

на душу населення, т

Ціна за одиницю продукції,

тис. грн.

Дохід на душу населенння

 

Спос-тере-ження

Спожи-вання продукту

на душу населення, т

Ціна за одиницю продукції, тис.грн.

Дохід

на душу населення

1

75

5

100

 

 1

 55

  5

 160

2

67

6

110

 

 2

 87

  6

 170

3

56

7

112

 

 3

 56

  7

 112

4

59

8

115

 

 4

 59

  8

 115

5

51

9

120

 

 5

 51

  9

 120

6

58

10

135

 

 6

 58

 10

 135

7

60

7

120

 

 7

 60

 11

 145

8

65

8

130

 

 8

 65

  5

 100

9

45

9

110

 

 9

 70

  6

 110

10

40

10

100

 

10

 50

  4

 120

11

50

15

130

 

11

 55

  5

 130

12

65

14

140

 

12

 62

  7

 150

13

80

7

150

 

13

 53

  8

 140

14

82

5

170

 

14

 50

  9

 120

15

58

10

100

 

15

 55

 10

 130

 

КОНТРОЛЬНІ ПИТАННЯ

1.      Дайте означення гомоскедастичності і гетероскедастичності.

2.      Як впливає явище гетероскедастичності на результати регресійного аналізу?

3.      Назвіть методи визначення гетероскедастичності.

4.      Як перевіряється гетероскедастичність згідно з критерієм m?

5.      Як застосовується параметричний тест для визначення гетероскедастичності?

6.      У чому сутність рангового критерію Спірмена?

7.      Як визначається гетероскедастичність за допомогою регресії залишків?

8.      Опишіть методи формування матриці S в умові .

9.      Як використовується матриця S в методі Ейткена?

10.   Яким чином використовується трансформація моделі з метою усунення гетероскедастичності?

11.   Запишіть формулу обчислення матриці коваріацій параметрів моделі. Чим вона відрізняється від формули при застосуванні 1МНК?

12.   Як дістати незміщену оцінку дисперсії залишків за наявності гетероскедастичності?

13.   Суть та наслідки гетероскедастичності. Методи виявлення та усунення з моделі ознаки гетероскедастичності.

14.   Чи можливо прогнозування результуючого показника при наявності гетероскедастичності?

15.   Узагальнений метод найменших квадратів (метод Ейткена): сутність і використання.