ТЕМА 11. ТЕОРІЯ ПРИЙНЯТТЯ РІШЕНЬ В УМОВАХ НЕВИЗНАЧЕНОСТІ (ТЕОРІЯ
ГРИ).
1. Основні поняття теорії гри.
2. Класифікація ігор.
3. Критерій мінімаксу-максиміну.
1. Основні поняття
теорії
гри.
Задачі теорії ігор
належать до задач прийняття рішень
за умов невизначеності та ризику.
Теорія
ігор – це математичний апарат, що розглядає
конфліктні ситуації, а також ситуації спільних дій кількох учасників.
Завдання теорії ігор полягає у розробці рекомендацій щодо раціональної
поведінки учасників гри.
Реальні конфліктні ситуації досить складні і обтяжені великою
кількістю несуттєвих чинників, що ускладнює їх аналіз, тому на практиці будують
спрощені моделі конфліктних ситуацій, які називають іграми.
Характерними рисами математичної
моделі ігрової ситуації є наявність, по-перше, кількох учасників, яких
називають гравцями, по-друге, опису
можливих дій кожної із сторін, що називаються стратегіями, по-третє, визначених результатів дій для кожного гравця, що подаються функціями виграшу. Завданням кожного гравця є знаходження оптимальної стратегії, яка за умови
багаторазового повторення гри забезпечує даному гравцю максимально можливий
середній виграш.
Існує дуже
багато різних ігор. Прикладом «гри» в
буквальному розумінні цього
слова, передусім, є спортивна, гра
в карти, шахи тощо. Від реальної конфліктної
ситуації гра відрізняється не лише спрощеною формою, а також наявністю певних правил, за якими мають діяти
її учасники. Дослідження
таких формалізованих
ігор
звичайно не може дати
чітких
рекомендацій
для реальних
умов, проте
є найзручнішим
об’єктом
для вивчення
конфліктних
ситуацій
і оцінки
можливих
рішень
з різних
поглядів.
Розраховані
на основі
ігрових
моделей оптимальні
плани
не визначають
єдино
правильне
рішення
за складних
реальних
умов, проте
є математично
обґрунтованою
підставою
для прийняття
таких рішень.
2.
Класифікація ігор.
Класифікація ігор проводиться
відповідно до вибраного критерію. Ігри можуть розрізнятися залежно від
кількості гравців, кількості стратегій, властивостей функцій виграшу,
можливостей взаємодії між гравцями.
Якщо в грі беруть участь два
гравці, така гра називається парною
(грою двох осіб). Часто у грі беруть участь багато сторін, тоді гра є множинною.
Залежно від кількості стратегій розрізняють скінченні та
нескінченні ігри. Якщо кожен гравець
має
скінченну
кількість
стратегій,
то гра – скінченна, в іншому
разі
– нескінченна.
Якщо виграш
одного гравця
дорівнює
програшу
іншого,
то маємо
гру з нульовою сумою.
Такі
ігри
характеризуються
протилежними
інтересами
сторін,
тобто
ситуацією
конфлікту.
Інші
ігри
– з ненульовою сумою, виникають як за умов конфліктної поведінки
гравців,
так і за їх
узгоджених
дій.
За можливості поєднання
інтересів
гравців
та домовленості
між
ними про вибір
стратегій
можна
казати
про кооперативну гру,
коли ж гравці
не мають
можливості
чи
не бажають
координувати
свої
дії,
то гра
називається
некооперативною.
Найчастіше розглядається гра з
двома гравцями, в якій виграш однієї сторони дорівнює програшу іншої, а сума
виграшів обох сторін дорівнює нулю, що в теорії ігор називають грою двох осіб з нульовою сумою. Подібна
ситуація є типовою у практичній діяльності менеджерів, маркетологів,
спеціалістів рекламних служб, які щоденно приймають рішення за умов гострої
конкуренції, неповноти інформації тощо. Основною метою розв’язування задач
цього класу є розробка рекомендацій щодо вибору оптимальних стратегій
конфліктуючих сторін на основі застосування методичних підходів теорії ігор.
3. Критерій мінімаксу-максиміну.
Отже, нехай
маємо двох гравців А і В (гра двох осіб з нульовою сумою). Кожен гравець
вибирає одну із можливих стратегій. Позначимо стратегії гравця А через
стратегії гравця В
через
.
Результати (плата) за всіма
можливими варіантами гри задаються спеціальними функціями, які залежать від
стратегій гравців, як правило, у вигляді платіжної матриці.
Нехай
– виграш гравця
А;
– виграш гравця
В.
Оскільки гра
з нульовою
сумою, то
Тоді якщо
то
Отже, мета гравця
А – максимізувати величину , а гравця В – мінімізувати її.
Нехай
тоді маємо
матрицю
А:
(11.1)
де рядки відповідають
стратегіям
Аі,
а стовпчики
– стратегіям Bj.
Матриця А називається
платіжною, а також
матрицею гри.
Елемент
цієї
матриці
aij – це виграш
гравця
А, якщо
він
вибрав
стратегію
Ai,
а гравець
В – стратегію Bj.
Із багатьох критеріїв, які
пропонуються теорією ігор для вибору раціональних варіантів рішень,
найпоширенішим є песимістичний критерій мінімаксу-максиміну.
Розглянемо суть цього критерію.
Нехай гравець А вибрав стратегію Ai, тоді у найгіршому разі він отримає виграш, що дорівнює min aij, тобто навіть тоді, якщо гравець В і знав би стратегію гравця
А. Передбачаючи таку можливість, гравець А має вибрати таку стратегію, щоб
максимізувати свій мінімальний виграш, тобто:
(11.2)
Така стратегія гравця А
позначається і має назву максимінної, а
величина гарантованого виграшу цього гравця називається нижньою ціною гри.
Гравець В, який програє суми у розмірі елементів платіжної
матриці, навпаки має вибрати стратегію, що мінімізує його максимально можливий
програш за всіма варіантами дій гравця А. Стратегія
гравця В позначається через і називається мінімаксною, а величина
його програшу – верхньою ціною гри,
тобто:
(11.3)
Оптимальний розв’язок цієї задачі досягається тоді, коли жодній
стороні невигідно змінювати вибрану стратегію, оскільки її суперник може у
відповідь вибрати іншу стратегію, яка забезпечить йому кращий результат.
Гра називається
цілком визначеною, якщо
виконується
умова:
, (11.4)
тобто (11.5)
В такому разі
виграш
гравця
А (програш
гравця
В) називається
значенням гри і дорівнює
елементу
матриці
. Цілком визначені
ігри
називаються
іграми з сідловою точкою,
а елемент
платіжної
матриці,
значення
якого
дорівнює
виграшу
гравця
А (програшу
гравця
В) і є сідловою точкою.
В цій ситуації
оптимальним
рішенням
гри
для обох
сторін
є вибір
лише
однієї
з можливих
так званих
чистих
стратегій
– максимінної для гравця А та мінімаксної для гравця
В. Тобто
якщо
один із
гравців
притримується
оптимальної
стратегії,
то для другого відхилення від
його
оптимальної
стратегії
не може
бути вигідним.
Мінімаксна та максимінна
стратегії
мають
назву
песимістичних. Вибір
оптимальної
стратегії
для кожного з гравців ґрунтується
на припущенні,
що
він
буде діяти
за найгірших
для нього
умов. Зрозуміло,
що
в даному
разі
вибір
такої
стратегії
може
не влаштовувати
учасників
гри.
Можливість
такого розвитку
подій
виникає
тому, що
мінімаксна
та максимінна
стратегії
в даному
разі
не є стійкими.
Тобто обставини,
за яких
обидва
гравці
використовують
мінімаксну
та максимінну
стратегії,
невигідні
гравцям
у тому разі,
коли один з них змінює свою оптимальну
стратегію.
Однак така
нестійкість
властива
не всім
іграм
із
сідловою
точкою. В деяких
випадках
сідловій
точці
відповідають
стійкі
максимінна
та мінімаксна
стратегії.
В такому разі
відхилення
від
оптимальної
стратегії
одним з гравців
спричиняє
таку
зміну
виграшу,
яка є невигідною
для цього
гравця,
оскільки
стан або
не змінюється,
або
погіршується.
Отже, в загальному
випадку
не можна
стверджувати,
що
гра
з сідловою
точкою визначає
стійкі
оптимальні
стратегії.
Рекомендована література: [1; 4; 5; 9; 10; 11].