4.3. Оцінка середніх величин.
Як порівнювати сукупності даних, виражених в різних шкалах чи
згрупованих по різних ознаках? Очевидно, найпростіший спосіб – по середніх значеннях.
Відомі різні види середніх величин: середнє арифметичне, медіана, мода, середнє геометричне, середнє
гармонійне, середнє квадратичне.
Узагальненням декількох з перерахованих є середнє по Колмогорову. Для чисел середнє по Колмогорову
обчислюється за формулою:
G{F(X1)+F(X2)+…+F(Xn))/n},
де F – строго монотонна функція, G – функція, зворотна до F. Серед середніх по Колмогорову,
багато добре відомих функцій.
Так, якщо F(x) = x, то
середнє по Колмогорову – це середнє арифметичне, якщо
F(x) = ln x,
то середнє геометричне, якщо F(x) = 1/x,
то середнє гармонійне, якщо F(x) = x2,
то середнє квадратичне, і так далі.
Нехай деякий параметр системи заданий множиною дискретних
значень. Необхідно охарактеризувати ряд по його середніх величинах. Вибір
середньої величини в загальному здійснюється в залежності від умов реальної
задачі.
Використання середнього
арифметичного ґрунтується на припущенні, що вихідна величина розподілена
нормально - всі можливі значення сконцентровані біля деякого найбільш частого
значення а відхилення в більшу і меншу сторону відносно невеликі. Реально такий
розподіл зустрічається рідко.
Тривалість обслуговування абонентів, час очікування, сума
контракту, розмір переведення, частка ринку, відсоток приросту - всі ці і
багато інших показників розподілено ненормально, і
їх, як правило, не варто усереднювати за допомогою середнього арифметичного.
Нормальний розподіл зазвичай зустрічається при великому числі значень - сотні і
тисячі штук. Наприклад, число звернень в крупний колл-центр
може бути розподілене нормально і тому в кожному випадку слід переконатися в
нормальності розподілу.
Значення середнього
гармонійного застосовується тоді, коли необхідно, щоб при усередненні
незмінною залишалась сума величин обернених усереднюваним,
найчастіше коли параметри ряду зв’язані з часом і продуктивністю.
Наприклад: працівник А виконує операцію за 10 хв, а працівник Б
– за 25. За скільки часу вони разом виконають операцію. Відповідь – 14 хв 17 сек (на відміну від середнього арифметичного 17 хв 30 сек), що дозволяє визначити темп надходження заявок на обслуговування.
Перші 100 км шляху автомобіль проїхав зі швидкістю 50 км/год,
другі 100км – 80 км/год. Тоді середня швидкість його руху – за середнім
гармонійним – 61,54 км/год – така, при якій на ту ж дорогу затрачається той же
час.
Середнє геометричне застосовується тоді, коли значення параметра виражають відносні
величини динаміки, побудовані в вигляді ланцюжкових величин, як відношення
кожного наступного члена ряду до попереднього, найчастіше зустрічається в
бізнес-задачах з відсотками і долями, якщо в задачі якість показники змінюються
(ростуть чи падають).
Наприклад: в 2015 році прибуток виріс на 12% від попереднього
року, в 2016 – на 42%. На скільки в середньому виріс прибуток =26,11%.
Середнє квадратичне обраховується для обчислення середньої величини сторін n
квадратних ділянок, середніх діаметрів труб, значень напруги і сили змінного
струму – для обчислення яких використовується квадратична функція.
Таблиця 2
Вид середнього |
гармонічне |
геометричне |
арифметичне |
Квадратичне |
Показник степеня |
-1 |
1 |
0 |
2 |
Формула |
|
|
|
|
З іншого боку, такі популярні середні, як медіана і мода, не можна
представити у вигляді середніх по Колмогорову.
Мода –
це варіант ряду, що найбільш часто зустрічається. Мода застосовується,
наприклад, при визначенні параметрів товару, що має найбільший попит у
покупців. Модою для дискретного ряду є варіант, з найбільшою частотою. При
обчисленні інтервального варіаційного ряду необхідно спочатку визначити
модальний інтервал (по максимальній частоті), а потім –
значення модальної величини ознаки по формулі:
де: –
значення моди,
–
нижня межа модального інтервалу,
–
величина інтервалу,
,
,
– частота модального інтервалу, інтервалу
перед ним і наступного за модальним.
Медіана –
це значення ознаки, яке ділить цей ряд на дві рівні за чисельністю частини. Для
визначення медіани в дискретному ряді за наявності частот спочатку обчислюють напівсуму частот , а потім визначають, яке значення варіанту доводиться на
неї. (Якщо відсортований ряд містить непарне число ознак, то номер медіани
обчислюють за формулою: Ме = (n + 1)/2, n - число ознак в сукупності. В випадку парного числа ознак медіана
рівна середньому з двох центральних ознак.
При
обчисленні медіани для інтервального варіаційного ряду спочатку визначають
медіанний інтервал, в межах якого знаходиться медіана, а потім –
значення медіани по формулі:
де: – шукана
медіана,
–
нижня межа інтервалу, який містить медіану,
– величина інтервалу,
–
сума частот або число членів ряду,
–
сума накопичених частот інтервалів, передуючих медіанному,
–
частота медіанного інтервалу.
Опишемо види допустимих середніх в основних шкалах:
- в шкалі найменувань в якості середнього годиться тільки мода;
- в порядковій шкалі в якості середніх можна використовувати
тільки члени варіаційного ряду (порядкові статистики), зокрема, медіану, але не
середнє арифметичне, середнє геометричне і так далі;
- у шкалах інтервалів можна застосовувати тільки середнє
арифметичне;
- у шкалі відношень стійкими відносно порівняння є тільки
степеневі середні і середнє геометричне.