ТЕМА 4. ЛІНІЙНІ
МОДЕЛІ МНОЖИННОЇ РЕГРЕСІЇ.
1. Поняття про множинну лінійну регресію (МЛР).
2. Побудова та аналіз моделі МЛР.
1. Понятя
про множинну лінійну регресію (МЛР).
На будь-який
економічний
показник
Y зазвичай впливає не один, а декілька факторів.
В таких випадках
маємо
справу з множинною лінійною моделлю
(регресією),
що
описує
взаємний
зв’язок
між
залежною змінною
Y та факторами і яку можна
подати у вигляді:
(4.1)
або у векторно-матричній
формі:
, (4.2)
;
;
;
,
де – теоретичні
коефіцієнти
регресії
(часткові
коефіцієнти)
або
параметри
теоретичної
регресії,
які
характеризують
реакцію
залежної
змінної
на зміну
кожного регресора
;
– вільний
член, який
визначає
значення
показника
за умови,
коли значення
факторів
дорівнюють
нулю;
– значення
-го фактора при і-ому
спостереженні;
– випадкові
змінні;
– кількість
факторів;
– кількість
спостережень.
Компоненти вектора
є величинами сталими
(
), але невідомими. Їх
необхідно
оцінити
шляхом обробки
вибірки,
а тому надалі
будемо
мати
справу із
емпіричною
моделлю,
яка є прообразом теоретичної (4.1), (4.2):
(4.3)
де вектор є статистичною
оцінкою
теоретичного вектора
лінійної
множинної
регресії
(4.2).
Вектор похибок
є статистичною
оцінкою
випадкового
вектора
цієї
ж моделі.
2. Побудова та аналіз моделі
МЛР.
Для знаходження значень
параметрів
множинної
лінійної
регресії
використовують
метод найменших
квадратів.
Оцінку
вектора параметрів
знаходять
за формулою:
. (4.4)
Дії з матрицями
зручно
виконувати
з використанням
вбудованих
функцій
програми
електронних
таблиць
Microsoft Excel:
·
функція MTRANSP (ТРАНСП) – для знаходження
транспонованої
матриці;
·
функція MINVERSE (МОБР) – для відшукання
оберненої
матриці;
·
функції MMULT (МУМНОЖ) – для множення
матриць;
·
функція MDETERM (МОПРЕД) – для знаходження
визначника
матриці.
Для спрощення вводимо позначення
.
Відхилення параметрів
множинної
лінійної
регресії
знаходять
за формулою:
, (4.5)
де – табличне
значення
t–статистики Стьюдента за величиною ймовірності
р і ступенем
вільності
;
– оцінка
дисперсії
параметра аі,
яке знаходять
за формулою:
, (4.6)
де – діагональний
елемент
матриці
;
S2 – неусувна і обґрунтована
оцінка
дисперсії
відхилень
фактичних
даних
від
теоретичних,
яке знаходять
за формулою:
.
(4.7)
Тоді довірчий
інтервал
параметра аі матиме
такий
вигляд:
. (4.8)
Для перевірки суттєвості впливу деякого фактора
на показник розраховують значення t–статистики
за формулою:
. (4.9)
Табличне значення t–статистики tрк
знаходять
за величиною ймовірності р, та ступенем вільності
.
Якщо виконується нерівність
, то з ймовірністю р стверджують, що
фактор хі несуттєво
впливає
на показник
Y, і його
можна
виключити
з рівняння
регресії.
Інакше
рівняння
множинної
лінійної
регресії
залишають
без змін.
Перевірку моделі множинної
лінійної
регресії
на адекватність
експериментальним
даним
здійснюють
за допомогою
критерію
Фішера,
розрахункове
значення
якого
знаходять
за формулою:
, (4.10)
де R2
– коефіцієнт
множинної
детермінації,
який
визначають
за формулою:
. (4.11)
Табличне значення критерію
Фішера
Fтаб
знаходять
за величиною ймовірності р і ступенями свободи k1=m-1, k2=n-m. Перевіряють умову:
. (4.12)
Якщо ця умова
виконується,
то з ймовірністю
р стверджують,
що
побудована
модель множинної
лінійної
регресії
адекватна експериментальним
даним
і придатна
для економічного
аналізу
і прогнозування.
Якщо
умова
(4.12) не виконується,
модель не можна вважати адкватною статистичним
даним і, відповідно, не можна використовувати. В такому випадку слід провести
додаткові спостереження і побудувати на їх основі нову модель.
Відхилення розрахункових значень
показника
знаходять
за формулою:
, (4.13)
де tpк
– табличне
значення
t–статистики, яке знаходять
за ймовірністю
р та ступенем
свободи ;
– і- ий
рядок матриці
[Х], складений
із
значень
фактора хі;
– і- ий стовпчик
матриці
[Хt], складений із
значень
фактора хі.
Довірчий інтервал розрахункового
значення
показника
задається
формулою:
,
. (4.14)
Для заданих прогнозних
значень
факторів
прогнозне
значення
показника
обчислюють
за формулою:
. (4.15)
Довірчий інтервал
прогнозного значення показника
задається
формулою:
(4.16)
де відхилення
прогнозного значення показника
знаходять
за формулою:
, (4.17)
де – вектор-рядок, складений із
прогнозних
значень
фактора:
;
– вектор-стовпчик,
складений
із
прогнозних
значень
фактора:
.
Рекомендована література: [3; 6; 7; 8; 9].