ЛЕКЦІЯ 5. «Нелінійна регресія та
параметризація її рівняння»
Анотація
Нелінійна
регресія відносно пояснюючих змінних. Нелінійна регресія по параметрам, що
оцінюються. Вибір аналітичної форми дослідження моделі на основі апріорної
інформації про залежність та на основі графіків розкиду емпіричних точок.
Фіктивні змінні. Ілюстрація використання фіктивної змінної. Множинні сукупності
фіктивних змінних. Оцінка кості моделі. Дослідження відповідності моделі
емпіричним даним. Оцінка точності моделі.
5.1 Нелінійна множинна економетрична модель
При вивченні залежностей економічних показників на основі
реальних статистичних даних з використанням апарату теорії ймовірностей та
математичної статистики можна зробити висновки, що лінійні залежності
зустрічаються не так часто. Їх використовують лише як частковий випадок для зручності
та наочності розгляду економічного процесу. Частіше зустрічаються моделі,які
відображають економічні процеси у вигляді нелінійної залежності. Існує також
так звана кускова функція, яка на різних ділянках області визначення може бути
задана різними аналітичними виразами.
Якщо між економічними явищами існують нелінійні
відношення, то вони виражаються за допомогою відповідних нелінійних функцій.
Розрізняють два класи нелінійних
регресій:
1) нелінійні відносно пояснюючих змінних,
однак лінійні по параметрам, що оцінюються;
2) нелінійні по параметрам, що оцінюються.
Клас регресій нелінійних
відносно пояснюючих змінних, однак лінійних по параметрам, що оцінюються,
включає рівняння, в яких залежна змінна лінійно пов’язана з параметрами.
Приклад таких регресій можуть слугувати:
-
поліноми різних ступенів
-
рівностороння гіпербола
При
оцінці параметрів регресії, нелінійних по пояснюючим змінним, використовується метод заміни змінних. Суть його полягає
в заміні нелінійних пояснюючих змінних новими лінійними змінними, в результаті
чого нелінійна регресія зводиться до лінійної. До нової, перетвореної регресії
може бути застосований звичайний МНК.
Наприклад,
у випадку поліноміальної моделі з декількома пояснюючими змінними
заміна
До
класу регресій, нелінійних по параметрам,
що оцінюються, відносяться рівняння, в яких залежна змінна нелінійно пов’язана
з параметрами. Прикладом таких регресій є функції:
-
степенева:
-
показникові:
-
експоненціальні:
Якщо нелінійна модель внутрішньо
лінійна, то вона за допомогою відповідних перетворень може бути приведена
до лінійного виду (наприклад, логарифмуванням). Якщо ж нелінійна функція внутрішньо нелінійна, то вона не може
бути зведена до лінійної функції і для оцінки її параметрів використовують
ітеративні процедури, успішність яких залежить від виду рівняння та
особливостей ітеративного підходу, що застосовується.
Прикладом регресії, що є внутрішньо лінійної є регресія
попиту (Y) від загального доходу (z) та ціни цього товару (p):
Подібні залежності між показником Y та m факторами Z1, Z2, ..., Zm
записуються у вигляді
і за допомогою логарифмічного перетворення
зводяться до лінійної по параметрам регресії. Визначення
призводять до лінійної регресійної моделі
Після оцінювання лінійної моделі (5.8) за допомогою
відношень (5.7) можна знайти оцінену регресію для моделі (5.5):
Моделі виду (5.5) отримали широке розповсюдження при
економетричному моделюванні. Це пов’язано з тим, що параметри такої моделі
мають змістовну економічну інтерпретацію. З (5.5) випливає, що
тобто параметр ai
представляє собою коефіцієнт еластичності показника Y по змінній xi.
Для моделей виду
також використовується логарифмічне перетворення,
оскільки визначення
Вибір аналітичної форми дослідження моделі може
здійснюватися на основі апріорної інформації про залежність та на основі
графіків розкиду емпіричних точок.
5.2 Якісні
економічні показники
Звичайно незалежні змінні в регресійних моделях мають
«неперервні» області змінювання (національний дохід, обсяги виробницттва,
розмір заробітної плати тощо), тобто є метрично (кількісно) виміряними
величинами. У реальних ситуаціях економічні явища більш різноманітні. На
залежну змінну крім кількісних факторів впливають і якісні: якість продукції,
рівень професійної підготовки працівниіків, їхня стать, страйки, зміни в
економічній політиці тощо. Часто змінні, що відображають якісні характеристики
об'єкта, набувають лише двох значень: 1 – якщо певна ознака присутня;
0 – якщо вона відсутня. Такі змінні називають бінарними, дихотомними або
dummy-змінними.
У перекладі з англійської мови dummy variables означає
«фіктивні змінні», хоча насправді їх «фіктивність» полягає лише в тому, що вони
кількісно описують деяку якісну ознаку.
Дихотомні змінні використовують у регресійних моделях
поряд з кількісними змінними або утворюють регресійні моделі, у яких всі
фактори є якісними (бінарними) змінними.
Наприклад, при дослідженні заробітної плати може
виникнути питання залежності її від рівня освіти, від| статі працівника тощо.
За певними якісними ознаками, звичайно, дані можна поділити за категоріями й
вивчати кожну залежність окремо, а вже потім шукати відмінності між ними. Але
введення додаткової бінарної змінної дає змогу оцінювати одне рівняння, у якому
різні класи спостережень розділяються за допомогою цієї змінної.
Приклад. Нехай регресійна модель залежності заробітної
плати у від деяких кількісних факторів
Тоді для вивчення впливу вищої освіти на рівень оплати праці
вводять нову змінну
тобто за наявності вищої освіти заробітна плата в
середньому становить
а за її відсутності
У такому разі коефіцієнт
Параметри такої моделі оцінюються за допомогою методу
найменших квадратів, а значущість параметра
Якщо якісна ознака має не два, а більше значень, то
використовують кілька бінарних змінних. Причому їх кількість на одиницю менша,
ніж кількість розглянутих категорій. Це пов'язано з тим, що сума бінарних
змінних, які відповідають різним категоріям, завжди дорівнюватиме одиниці для
всіх спостережень (тобто кожне спостереження, напевно, потрапляє до якоїсь
однієї категорії). А таке співвідношення означає наявність мультиколінеарності
між незалежними змінними і унеможливлює оцінювання параметрів моделі за методом
найменших квадратів.
Однією із сфер застосування бінарних змінних є аналіз
сезонних коливань. Наприклад, модель споживання, що враховує сезонні коливання
За допомогою цих змінних можна усунути сезонні коливання
з метою визначення головних тенденцій розвитку певного економічного процесу.
Крім того, можлива комбінація
фіктивних змінних різного виду. Вона дозволяє моделювати зміну нахилу
тренду з визначеного моменту. Тоді окрім тренду в регресію вводиться наступна
змінна: на початку вибірки до деякого моменту вона дорівнює 0, а далі вона
представляє собою часовий тренд (1, 2, 3 … у випадку однакових інтервалів між
спостереженнями).
Більш детально використання фіктивних змінних висвітлено
у [2, с. 161-164; 3, с. 272-286].
5.3 Регресійні
моделі з бінарними залежними змінними
Бінарними (дихотомиими) можуть бути не лише незалежні, а
й залежні змінні. Такі дані отримують, як правило, під час опитування
населення, перепису тощо. Дані опитувань зазвичай якісні, тобто відтворюють
певний якісний стан досліджуваного об'єкта. Залежна змінна при цьому набуває
двох значень:
Діаграма розсіювання залежності цих двох показників така:
незалежна змінна (дохід) набуває певних значень на числовій осі х, а дані спостереження залежної змінної
у розміщені лише на двох паралельних
прямих у = 0 і у = 1. Застосування класичної регресійної залежності в таких
випадках не дає бажаних результатів: на кінцях проміжку спостережень регресійна
пряма значно відхиляється від точок спостереження. Зокрема, на початковому
етапі вона набуватиме від'ємних значень, а на кінцевому – значень, більших
від одиниці (рис. 5.1). Якщо залежна змінна інтерпретується як імовірність
купівлі, такі результати взагалі абсурдні. У таких випадках доцільніше припустити,
що залежність між розглянутими показниками нелінійна. Дійсно, для сімей (осіб)
з низьким рівнем доходу приріст
Рисунок 5.1
Логічно припустити, що регресійна функція, як і функція розподілу
випадкової величини, має подібну траєкторію розвитку (рис. 5.2). Практикою
перевірено, що функції розподілу доходів можуть бути підпорядковані нормальному
чи логістичному закону розподілу.
Рисунок 5.2
Регресійна модель з бінарною (дихотомною) залежною змінною,
що має нормальний розподіл, називається пробіт-моделлю.
Регресійна модель, у якій залежна змінна підпорядкована
логістичному закону розподілу, називається логіт-моделлю.
Вивчення взаємозв'язку регресії з бінарною залежною
змінною дає підставу для вибору доцільної форми регресійного співвідношення,
відмінної від звичайної лінійної регресії, чим розширює можливості моделювання
та прогнозування специфічних залежностей між економічними показниками
(кількісними та якісними).
Прогнози ймовірностей за перетвореними моделями регресії
(зокрема, за логіт- і пробіт-моделями) застосовуються в багатьох галузях
людської діяльності, в економічних і соціальних дослідженнях. Аналогічні
підходи можуть застосовуватись і для інших якісних змінних та узагальнених моделей
регресії.
5.4 Оцінка
якості моделі
Модель вважається гарною зі статистичної точки зору, якщо
вона адекватна і достатньо точна.
1. Для перевірки
адекватності моделі реальному явищу досліджується ряд залишків, тобто
розбіжностей рівнів, розрахованих по моделі, та фактичних спостережень.
а) Перевірка
рівності математичного очікування рівнів ряду залишків нулю здійснюється в ході
перевірки відповідної нульової гіпотези
де
S – середньоквадратичне відхилення для цієї послідовності, розраховане
для малої вибірки.
В подальшому дане розраховане значення порівнюють з табличним і роблять
висновок про прийняття або відхилення гіпотези.
б) Перевірка умови випадковості
виникнення окремих відхилень від тренду.
в) Перевірка
умови незалежності, або наявності автокорреляції у відхиленнях від моделі росту
(буде розглянуто пізніше).
г) Відповідність
ряду залишків нормальному закону розподілу.
2. Оцінка точності
моделі. В статистичному аналізі широко відомо велика кількість
характеристик точності. Найбільш часто, окрім середньоквадратичного відхилення,
використовують:
-
максимальна за абсолютною величиною похибка
-
відносна максимальна похибка
-
середня по модулю похибка
-
середня по модулю відносна похибка
Кращою за точністю вважається та модель, у якої всі
перелічені характеристики мають меншу величину.
САМОСТЙНА РОБОТА
1. Безумовне
та умовне прогнозування. Оцінка якості прогнозів.