ТЕМА 4. ЛІНІЙНІ МОДЕЛІ МНОЖИННОЇ РЕГРЕСІЇ.

 

1.   Поняття про множинну лінійну регресію (МЛР).

2.   Побудова та аналіз моделі МЛР.

 

1.   Понятя про множинну лінійну регресію (МЛР).

На будь-який економічний показник Y зазвичай впливає не один, а декілька факторів. В таких випадках маємо справу з множинною лінійною моделлю (регресією), що описує взаємний зв’язок між залежною змінною Y та факторами  і яку можна подати у вигляді:

                                                           (4.1)

 

 

або у векторно-матричній формі:

,                                            (4.2)

; ; ; ,

 

 

де  теоретичні коефіцієнти регресії (часткові коефіцієнти) або параметри теоретичної регресії, які характеризують реакцію залежної змінної   на зміну кожного регресора  ;

 вільний член, який визначає значення показника за умови, коли значення факторів дорівнюють нулю;

  значення -го фактора при і-ому спостереженні;

 випадкові змінні;

 кількість факторів;

   кількість спостережень.

Компоненти  вектора  є величинами сталими (), але невідомими. Їх необхідно оцінити шляхом обробки вибірки, а тому надалі будемо мати справу із емпіричною моделлю, яка є прообразом теоретичної (4.1), (4.2):

                                             (4.3)

де вектор  є статистичною оцінкою теоретичного вектора  лінійної множинної регресії (4.2).

Вектор похибок  є статистичною оцінкою випадкового вектора  цієї ж моделі.

 

2.   Побудова та аналіз моделі МЛР.

Для знаходження значень параметрів множинної лінійної регресії використовують метод найменших квадратів. Оцінку вектора параметрів знаходять за формулою:

.                                          (4.4)

Дії з матрицями зручно виконувати з використанням вбудованих функцій програми електронних таблиць Microsoft Excel:

·     функція MTRANSP (ТРАНСП) – для знаходження транспонованої матриці;

·     функція MINVERSE (МОБР) – для відшукання оберненої матриці;

·     функції MMULT (МУМНОЖ) – для множення матриць;

·     функція MDETERM (МОПРЕД) – для знаходження визначника матриці.

Для спрощення вводимо позначення .

Відхилення параметрів множинної лінійної регресії знаходять за формулою:

,                                            (4.5)

де  табличне значення t–статистики Стьюдента за величиною ймовірності р і ступенем вільності ;

 оцінка дисперсії параметра аі, яке знаходять за формулою:

,                                                 (4.6)

де  діагональний елемент матриці ;

S2неусувна і обґрунтована оцінка дисперсії відхилень фактичних даних від теоретичних, яке знаходять за формулою:

.                                                (4.7)

Тоді довірчий інтервал параметра аі матиме такий вигляд:

.                                          (4.8)

Для перевірки суттєвості впливу деякого фактора на показник розраховують значення t–статистики за формулою:

.                                            (4.9)

Табличне значення t–статистики tрк знаходять за величиною ймовірності р, та ступенем вільності .

Якщо виконується нерівність , то з ймовірністю р стверджують, що фактор хі несуттєво впливає на показник Y, і його можна виключити з рівняння регресії. Інакше рівняння множинної лінійної регресії залишають без змін.

Перевірку моделі множинної лінійної регресії на адекватність експериментальним даним здійснюють за допомогою критерію Фішера, розрахункове значення якого знаходять за формулою:

,                                          (4.10)

де R2коефіцієнт множинної детермінації, який визначають за формулою:

.                              (4.11)

 

 

Табличне значення критерію Фішера Fтаб знаходять за величиною ймовірності р і ступенями свободи k1=m-1, k2=n-m. Перевіряють умову:

.                                         (4.12)

Якщо ця умова виконується, то з ймовірністю р стверджують, що побудована модель множинної лінійної регресії адекватна експериментальним даним і придатна для економічного аналізу і прогнозування. Якщо умова (4.12) не виконується, модель не можна вважати адкватною статистичним даним і, відповідно, не можна використовувати. В такому випадку слід провести додаткові спостереження і побудувати на їх основі нову модель.

Відхилення розрахункових значень показника знаходять за формулою:

,                                  (4.13)

де tтабличне значення t–статистики, яке знаходять за ймовірністю р та ступенем свободи ;

 і- ий рядок матриці [Х], складений із значень фактора хі;

 і- ий стовпчик матриці [Хt], складений із значень фактора хі.

 

 

Довірчий інтервал розрахункового значення показника задається формулою:

,      .                             (4.14)

Для заданих прогнозних значень факторів  прогнозне значення показника  обчислюють за формулою:

.                                 (4.15)

Довірчий інтервал прогнозного значення показника  задається формулою:

                                (4.16)

де відхилення прогнозного значення показника знаходять за формулою:

 ,                              (4.17)

де  – вектор-рядок, складений із прогнозних значень фактора:

;

 – вектор-стовпчик, складений із прогнозних значень фактора:.

Рекомендована література: [3; 6; 7; 8; 9].