ТЕМА 3. СТАТИСТИЧНІ МЕТОДИ ПЕРЕВІРКИ ГІПОТЕЗ.
МОДЕЛІ КОРЕЛЯЦІЙНО-РЕГРЕСІЙНОГО АНАЛІЗУ РОЗВИТКУ
СОЦІАЛЬНО-ЕКОНОМІЧНИХ СИСТЕМ.
1. Статистичні методи перевірки
гіпотез.
2. Кореляційний зв’язок в
дослідженні стохастичних залежностей. Особливості
кореляційного зв’язку при аналізі економічних явищ.
3. Добір факторних і
результативних ознак для побудови економетричної
моделі.
4. Однофакторний кореляційний
аналіз.
5. Багатофакторний кореляційний аналіз
1. Статистичні методи перевірки гіпотез.
Статистичні
рішення мають імовірнісний характер, тобто завжди існує ймовірність того, що
прийняті рішення будуть помилковими.
Головна цінність прийняття статистичних
рішень полягає в тому, що в межах імовірнісних категорій можна об’єктивно
виміряти ступінь ризику, що відповідає тому чи іншому рішенню.
Завжди при постановці дослідження виникає питання про
розходження груп спостережень. Рішення цього питання зводиться до порівняння
статистичних характеристик, що оцінюють параметри законів розподілу, тобто до
перевірки статистичних гіпотез.
Статистична гіпотеза – це наукове припущення про
ті чи інші статистичні закони розподілу розглянутих випадкових величин, яка
може бути перевірене на основі вибірки.
Майже завжди задача полягає в перевірці нульової гіпотези (Н0) – про відсутність
реального розходження між фактичними і теоретичними показниками. Якщо
розходження близькі до нуля чи знаходяться в межі допустимих значень, то
нульова гіпотеза приймається. Якщо ж розходження виявляються в критичній для
даного статистичного критерію межі, неможливі при нашій гіпотезі і тому
несумісні з нею, то гіпотеза Н0 відкидається.
Прийняття Н0 гіпотези означає, що дані не суперечать припущенню про відсутність
розходжень між фактичними і теоретичними чи двома рядами фактичних розподілів.
Відкидання гіпотези означає, що емпіричні дані несумісні з Н0 і вірна інша, альтернативна гіпотеза.
Справедливість Н0
перевіряється обчисленням статистичних критеріїв перевірки для визначеного
рівня значимості.
Критерій c2 застосовують, коли необхідно
встановити відповідність двох порівнюваних рядів розподілу – емпіричного і теоретичного
чи двох емпіричних. Цей показник використовується при вивченні якісних ознак
для оцінки відповідності емпіричних даних теоретичній передумові, нульовій
гіпотезі (Н0).
Спостережуване значення критерію (c2факт) обчислюють за результатом вибірки, і воно представляє суму
квадратів відхилень емпіричних частот (f) від теоретичних (F),
віднесену до теоретичних частот:
. (3.1)
Теоретичне значення критерію (χ2теор)
залежить від числа ступенів свободи k і рівня значущості a. У найбільш типових випадках число
ступенів свободи визначається за формулою:
k = (c – 1)∙(K – 1), (3.2)
де с – кількість рядків і K – число стовпчиків у аналітичній
таблиці.
Так званий рівень значущості
a – це мала
ймовірність, яка наперед задаються.
Вона може набувати значення a =
0,05; 0,01; 0,001.
Рішення – відхилити чи прийняти нульову гіпотезу – приймають на
підставі порівняння спостережуваного (фактичного) і табличного (теоретичного)
значення критерію.
Гіпотеза Н0
відкидається, якщо c2факт > c2теор, і не відкидається, якщо c2факт < c2теор і коли фактичні і
теоретичні очікувані частоти збігаються, c2=0.
Отже, загальний алгоритм перевірки правильності нульової
гіпотези:
1. Сформулювати
нульову
гіпотезу Н0 й одночасно
альтернативну гіпотезу Н1.
2. Вибрати статистичний критерій, який відповідав би сформульованій нульовій гіпотезі.
3. За результатами вибірки
обчислити фактичне значення критерію.
4. За кількістю ступенів свободи k і обраним рівнем значущості a визначити теоретичне значення критерію.
5. Відхилити чи прийняти нульову гіпотезу на підставі порівняння
фактичного і теоретичного значення критерію.
2. Кореляційний
зв’язок в дослідженні стохастичних залежностей.
Особливості кореляційного зв’язку при аналізі економічних явищ.
У випадку кореляційного
зв’язку значенню фактора відповідає не одне значення
результативного показника, а кілька його значень, тобто відомий розподіл цих
значень.
Кажуть, що при кореляційному
зв’язку одному значенню фактора відповідає середнє
значення результативного показника.
Кореляційний (стохастичний) зв’язок – це неповна, ймовірнісна
залежність між економічними показниками, яка виявляється лише у масі (великій
кількості) спостережень.
При аналізі економічних явищ кореляційний зв’язок має певні особливості:
− він відображається і виявляється не в поодиноких випадках, а в масі
явищ, тобто пов’язаний із дією
закону великих чисел: лише в достатньо великій кількості факторів індивідуальні
особливості та другорядні фактори згладжуються, і залежність, якщо вона є
суттєвою, виявляється достатньо чітко;
− він оцінює взаємозв’язки в конкретних умовах місця і часу, тобто в ряді випадків залежності, отримані для однієї галузі,
непридатні для інших галузей;
− у відношенні до суспільних явищ і процесів він є незворотним;
− при застосування його для
розв’язування економічних задач дослідники мають певні труднощі (обмежена
кількість спостережень; неможливість експерименту на практиці тощо).
3. Добір факторних і результативних ознак для побудови економетричної моделі.
Важливим етапом економетричного моделювання є аналіз відбору та оцінювання
впливу факторів на результативний показник. Від того, наскільки економічно обгрунтованим є вибір факторів, які впливають на
досліджуваний результативний показник, залежить якість економетричної
моделі.
У таблиці 3.1 наведено
приклади факторів для певних показників діяльності підприємства.
Таблиця 3.1
Приклади
факторів, які впливають на показники діяльності підприємства
№ з/п |
Результативний
показник (У) |
Фактори (Х), які впливають на показник |
1 |
2 |
3 |
1 |
Прибуток |
обсяг випуску продукції, якість продукції, ритмічність виробництва, ритмічність реалізації, коефіцієнт асортиментності, коефіцієнт структури, показники використання основних засобів
(наприклад, фондовіддача), матеріаловіддача |
2 |
Рентабельність |
виконання плану реалізації, фондовіддача основних засобів, продуктивність праці, питома вага забракованої продукції, питома вага активної частини основних
засобів |
3 |
Наявність власних оборотних коштів |
прибуток, фондовіддача основних засобів, ритмічність випуску продукції |
4 |
Коефіцієнт оборотності капіталу |
обсяг запасів ТМЦ, матеріаловіддача, показники використання устаткування, продуктивність праці, ритмічність поставок, якість продукції, обсяг незавершеного виробництва |
5 |
Сума кредиторської заборгованості |
обсяг реалізації продукції, коефіцієнт асортиментності, коефіцієнт структури продукції, продуктивність праці, фондовіддача основних засобів, якість продукції, сума дебіторської заборгованості, рентабельність |
6 |
Фінансова стійкість |
фондовіддача основних засобів, матеріаловіддача, продуктивність праці, обсяг товарної продукції, прибуток, питома вага активної частини основних
засобів, втрати від браку. |
7 |
Чистий дохід від реалізації продукції
(товарів, робіт, послуг) |
чисельність робітників, зайнятих у
виробництві, залишкова вартість основних засобів |
У таблиці 3.2 наведено
приклади факторів для певних показників діяльності на макрорівні.
Таблиця 3.2
Приклади
факторів, які впливають на показники діяльності на макрорівні
№ з/п |
Результативний
показник (У) |
Фактори (Х), які впливають на показник |
1 |
2 |
3 |
1 |
Вартість реалізованої лісопродукції,
млн. дол. |
Кількість заготовленої лісосировини,
тис. м3 |
2 |
Кількість заготовленої лісосировини,
тис. м3 |
Площа рубок лісу
на тисячу заготовленої деревини, га / м3 |
3 |
Середньомісячні витрати на
оплату праці штатних працівників, тис.грн. |
Середньомісячна заробітна плата,
тис. грн. |
4 |
Обсяг виробництва сільськогосподарської продукції |
Посівні площі сільськогосподарської культури |
5 |
Середня нормативна грошова оцінка ріллі,
грн. |
Середньорічний курс долара попереднього
року, грн. |
6 |
Рівень рентабельності підприємств
сільського, лісового та рибного господарства, % |
Середньорічна мінімальна заробітна плата, дол. |
7 |
Обсяг виробництва сільськогосподарської
продукції, млн. грн. |
Середньомісячна заробітна плата, грн. |
8 |
Обсяг реалізованої продукції зернових, бобових культур і
насіння олійних рослин, млн. грн. |
Продуктивність праці в сільськогосподарських
підприємствах, тис. грн. / ос. |
9 |
Річний обсяг імпорту сільськогосподарської техніки,
тис. грн. |
Середньорічний курс євро, грн./євро. |
10 |
Річний загальнодержавний обсяг
імпорту сільськогосподарської
техніки, млн. дол. |
Сальдо кредитів
від МВФ, млн. дол. |
Фактори обираються з урахуванням
галузевих особливостей діяльності і результативного показника,
який досліджується.
4.
Однофакторний кореляційний аналіз.
4.1. Сутність парної кореляції.
В дослідженні стохастичних
залежностей з використанням
кореляційно-регресійного аналізу
поширеним є прийом парної кореляції (прийом парного кореляційно-регресійного
аналізу).
Вихідними даними в такому випадку
є пара значень: результативний
показник (Y)
і фактор, який на нього впливає (X).
На основі вихідних даних визначаються статистичні характеристики сукупностей.
Далі вибирається вид рівняння
регресії, тобто відповідний тип математичного рівняння, який найкращим чином відображає
характер досліджуваного зв’язку.
Від правильного визначення
виду рівняння регресії залежать розв’язання задачі й результати розрахунків.
Кореляційно-регресійний аналіз полягає в побудові статистичної моделі у вигляді рівняння регресії (рівняння кореляційного зв’язку).
4.2. Вибір типу функції, що описує оцінювану залежність.
Вибір типу функції, що описує оцінювану залежність, можна здійснювати одним із таких способів:
- теоретичний аналіз досліджуваного процесу;
- використання раніше отриманих (іншими дослідниками) залежностей;
- аналіз раніше отриманих рівнянь та економічного змісту досліджуваного показника;
- аналіз поля кореляції;
- вибір із декількох рівнянь одного, яке найкращим
чином підходить за визначеним
критерієм.
Розглянемо перелічені способи вибору типу функції, що описує оцінювану
залежність, більш детально.
Теоретичний аналіз досліджуваного процесу полягає в тому, що виходячи із знань конкретних умов досліджуваного процесу, шляхом логічних міркувань та економічних обґрунтувань, спираючись на теоретичні основи досліджуваних явищ, встановлюють вид рівняння.
Використання раніше отриманих залежностей дає змогу обрати необхідне рівняння зв’язку на основі результатів аналізу наявної інформації (літературні джерела, дослідження інших авторів тощо).
Аналіз раніше отриманих залежностей та
економічного змісту досліджуваного показника полягає в тому, що на базі раніше отриманого рівняння здійснюють його перетворення
й отримують новий вид рівняння для досліджуваного економічного показника.
Аналіз поля кореляції – найбільш поширений у
практиці прийом, за допомогою якого визначають вид рівняння регресії. Послідовність проведення аналізу поля кореляції:
- на основі наявних статистичних даних будують поле кореляції (у прямокутній системі координат по осі абсцис ОХ відкладають значення фактора впливу X, а по осі ординат ОУ – значення
результативного показника Y. Отримують
на координатній площині
точки, кількість яких відповідає кількості проведених статистичних спостережень. Сукупність побудованих точок і є полем кореляції, тобто графіком взаємозв’язку між фактором і результативним показником);
- проводять лінію, навколо якої групуються точки поля кореляції. Таким чином оцінюють напрямок основної тенденції зміни значень результативного показника
зі зміною значень фактора;
- за видом лінії на
полі кореляції, що відображує основну
тенденцію зміни, обирають загальний вид рівняння отриманої лінії.
Метод вибору рівняння з
кількох залежностей. Якщо є декілька рівнянь, якими, як вважає дослідник, можна
описати результативний показник, вибирають одне, яке має найкращі оціночні
показники. Оцінивши надійність одержаних рівнянь регресії, відкидають ті
рівняння, які з низьким рівнем надійності описують взаємозв’язок, який
вивчається. За значенням коефіцієнта детермінації беруть відповідне рівняння,
при цьому вибирають те рівняння, при якому досягається найбільше значення
індексу кореляції.
Для розв’язання практичних
завдань описані способи вибору типу функції, що описує
оцінювану залежність, використовують у взаємозв’язку, доповнюючи й уточнюючи один
одного.
4.3. Показники, що оцінюють адекватність рівняння регресії.
Використовуючи одержані
рівняння, визначають показники, які характеризують адекватність рівняння
регресії:
- відхилення розрахункових (Уроз)
і статистичних (У) значень
результативного показника Y (ΔУ);
- відносну помилку апроксимації (відношення абсолютного лінійного відхилення до розрахункового значення);
- середню лінійну помилку;
- середню відносну помилку;
- коефіцієнт кореляції для прямолінійної
залежності та індекс кореляції для криволінійної;
- коефіцієнт детермінації, що визначає у відсотках ту частину закономірності, яка описується одержаним рівнянням;
- середню квадратичну помилку.
Зазначені оціночні показники використовують для оцінювання адекватності рівняння регресії.
4.4. Візуальне оцінювання адекватності рівняння регресії.
Залежно від призначення одержаного рівняння регресії проводять візуальне оцінювання його адекватності:
- за величиною візуальних
значень відхилень Dі
результативного показника роблять
висновок про міру «близькості» статистичних і розрахованих за рівнянням значень результативного показника,
а у кінцевому підсумку –
про адекватність вихідних даних одержаному рівнянню регресії щодо абсолютних відхилень Dі;
- за величиною відносних
помилок апроксимації роблять висновок про адекватність рівняння регресії щодо відносних
помилок апроксимації;
- за величиною середнього
лінійного відхилення роблять висновок про адекватність рівняння регресії вихідним даним щодо величини
середньої лінійної помилки, якщо вона не перевищила 5-10% середнього значення у результативного показника;
- за середнім значенням відносної помилки апроксимації роблять висновок про адекватність одержаного рівняння регресії вихідним даним щодо величини середньої
відносної помилки апроксимації, беручи умовно значення середньої відносної помилки не більше 5-10%.
Допустима помилка апроксимації
порівнюється з нею. Припускають
адекватність рівняння регресії, якщо розрахована відносна помилка апроксимації менша від допустимої
її величини.
4.5. Аналіз рівняння регресії.
Аналіз одержаного рівняння регресії дає можливість
зробити такі практичні висновки:
- за значенням коефіцієнта кореляції (табл. 3.3) отримують оцінку тісноти зв’язку між фактором і результативним показником;
- за значенням коефіцієнта детермінації визначають відсоток закономірності, що описує одержаним
рівнянням досліджуваний зв’язок між фактором і результативним показником (відсоток закономірності);
- за значенням коефіцієнта еластичності, визначають міру зміни
результативного показника (у відсотках)
при зміні середнього значення фактора на 1%.
Значення коефіцієнта кореляції |
0,1-0,3 |
0,31-0,5 |
0,51-0,7 |
0,71-0,9 |
0,91-0,99 |
Характеристика тісноти
зв’язку |
Слабкий |
Помірний |
Помітний |
Тісний |
Дуже тісний |
Якщо залежність прямолінійна,
визначають такі величини:
- величину зміни результативної ознаки Y при зміні факторної ознаки X на одиницю;
- значення результативного показника Y при нульовому значенні фактора X;
- граничні помилки розрахункових значень, на основі яких будують довірчі
зони при мінімальних (Xmin), максимальних (Xmax) і середніх (Xсер) значеннях фактора.
5.
Багатофакторний кореляційний аналіз.
5.1. Етапи проведення багатофакторного кореляційного аналізу.
Багатофакторний кореляційний аналіз виконується за методами множинного
кореляційно-регресійного аналізу.
Багатофакторний кореляційний
аналіз здійснюється в декілька етапів (рис. 3.1).
Рис. 3.1. Етапи багатофакторното кореляційного аналізу (множинного
кореляційно-регресійного аналізу)
5.2. Добір факторів для множинного кореляційного аналізу.
Добір факторів для множинного
кореляційного аналізу – дуже важливий етап,
від якого залежить достовірність і точність висновків за отриманими результатами.
Загальний принцип регресійного
аналізу: чим більше вихідних
даних, тим краще. Але це правило не може бути орієнтиром у разі стохастичних залежностей. Охопити всі умови вивчених
обставин практично неможливо.
Чим більше факторів, тим складніше встановити
модель взаємозв’язку факторів,
визначити вид рівняння регресії.
Вибираючи фактори, слід дотримуватися таких вимог:
- враховувати причинні зв’язки між результативним показником і факторами, що впливають на нього, оскільки вони розкривають сутність економічного явища;
- не включати в кореляційну модель фактори, зв’язок яких із
результативним показником має функціональний характер;
- усі фактори мусять мати одиницю величини
(вимірювання);
- залучати до аналізу найбільш значущі фактори, що мають вагомий
вплив на результативний показник;
- не включати в
модель взаємозалежні фактори.