Меню
Бесплатно
Главная  /  Разное  /  Критерии выбора стратегии в условиях неопределенности. Open Library - открытая библиотека учебной информации

Критерии выбора стратегии в условиях неопределенности. Open Library - открытая библиотека учебной информации

См. П.Н. Брусов, п. 3.8., А.Н. Гармаш, п. 3.3.2.

Неопределенность будем рассматривать как такое состояние знаний лица, принимающего решения (ЛПР), при котором одно или несколько альтернативных решений приводят к блоку возможных результатов, соответствующих различным состояниям внешней среды («природы»), вероятности которых неизвестны. Обычно это происходит потому, что отсутствуют надежные данные, на основании которых вероятности могли бы быть вычислены апостериори, а также потому, что нет каких-либо способов вывести вероятности априори. В этих условиях для определения наилучших, так называемых рациональных, решений можно использовать элементы теории игр, в частности, игры с природой. В них один игрок (человек) старается действовать осмотрительно, а второй игрок (природа) дей­ствует случайно.

Игры с природой – это игры, в которых неопределенность вызва­на не сознательным противодействием противника, а недостаточной осведомленностью об условиях, в которых действуют стороны. Например, заранее неизвестна погода в некотором регионе или покупательский спрос на некоторую продукцию.

Условия такой игры обычно представляются таблицей решений , в которой строки А 1 , А 2 , ..., А m соответствуют стратегиям ЛПР (лица, принимающего решение), а столбцы В 1 , В 2 , … В n – стратегиям при­роды; а ij – выигрыш ЛПР, соответствующий каждой паре стратегий А i , В j .

Возможные стратегии b 1 b 2 b n
а 1 а 1 1 а 1 2 а 1 n
а m а m1 а m2 а mn

В рассматриваемой ситуации при выборе из множества { а 1 , а 2 ,..., а m } наилучшего решения обычно используют следующие критерии.

1. Критерий Вальда. Основывается на принципе пессимизма (наибольшей осторожности). При выборе решения надо рассчитывать на худший вариант действий со стороны природы. Рекомендуется применять максиминную стратегию. Она выбирается из условия

и совпадает с нижней ценой игры.

2. Критерий максимума. Он выбирается из условия

Критерий максимума является оптимистическим: считается, что природа будет наиболее благоприятна для человека.

где – степень оптимизма (показатель пессимизма-оптимизма) – изменяется в диапазоне .

Критерий Гурвица придерживается некоторой промежуточной позиции, учитывающей возможность как наихудшего, так и наилуч­шего поведения природы. При = 1 критерий превращается в кри­терий Вальда, при = 0 – в критерий максимума. На оказывает влияние степень ответственности лица, принимающего решение по выбору стратегии. Чем больше последствия ошибочных решений, больше желания застраховаться, тем ближе к единице.

4. Критерий Сэвиджа. Суть критерия состоит в выборе такой стра­тегии, чтобы не допустить чрезмерно высоких потерь, к которым она может привести. Находится матрица рисков , элементы которой по­казывают, какой убыток понесет человек (фирма), если для каждого состояния природы он не выберет наилучшей стратегии:

R =

Элементы матрицы рисков находятся по формуле

,

где – максимальный элемент в столбце исходной матрицы.

При принятии решений в условиях неопределенности следует оценивать различные варианты с точки зрения нескольких критериев. Если рекомендации совпадают, можно с большей уверенностью выбрать наилучшее решение; если рекомендации противоречат друг другу, окончательное решение надо принимать с учетом резуль­татов дополнительных исследований.

Пример. В приближении посевного сезона фермер имеет четыре аль­тернативы: А 1 – выращивать кукурузу, А 2 – пшеницу, А 3 – овощи или A 4 – использовать землю под пастбища. Платежи, связанные с указан­ными возможностями, зависят от количества осадков, которые условно можно разделить на четыре категории: B 1 – сильные осадки, В 2 – умерен­ные, В 3 – незначительные, B 4 – засушливый сезон.

Платежная матрица оценивается следующим образом:

Какое управленческое решение должен принять фермер?

Решение.

Следует использовать землю под пастбища.

2. Критерий максимума:

Max(80,90,150,35)=150.

Это соответствует стратегии А 3 – выращивать овощи.

2. Воспользуемся критерием Сэвиджа . Составим матрицу рисков, эле­менты которой находим по формуле

Оптимальная стратегия определяется выражением

В соответствии с этим критерием следует сеять пшеницу.

3. Воспользуемся критерием Гурвица . Оптимальная стратегия опреде­ляется по формуле

Предположим, что степень оптимизма Тогда

т.е. следует принять решение о выращивании овощей.

4. Правило максимизации среднего ожидаемого дохода. Если допустить, что известно распределение вероятностей для различных состояний природы, например эти состояния равновероятны (правило Лапласа равновозможности) то для принятия решения следует найти матема­тические ожидания выигрыша:

Так как максимальное значение имеет М 2 , то следует сеять пшеницу.

Вывод : два критерия одновременно рекомендуют выбор управленческой стратегии А 2 (сеять пшеницу), два критерия рекомендуют стратегию А 3 (выращивать овощи) .

Из таблицы видно, что оптимальное поведение во многом зависит от принятого критерия выбора наилучшего решения, поэтому выбор критерия является наименее простым и наиболее ответственным вопросом в теории игр.

Принятие решений в условиях частичной неопределенности (см. П.Н. Брусов, п. 3.9).

Оптимальная по Парето финансовая операция. Рассмотрим матрицу последствий , i=1,2,…,m, j=1,2,…,n. Альтернатива доминирует по Парето альтернативу , если , j=1,2,…,n, и, по крайней мере, для одного индекса j это неравенство строгое. Доминируемая альтернатива не может быть оптимальным решением, т.к. она по всем показателям не «лучше» доминирующей альтернативы. Альтернатива называется Парето-оптимальной (или оптимально по Парето ), если она не диминируется никакой другой альтернативой.

Все Парето-оптимальные решения образуют множество оптимальности по Парето .

Пример. Для матрицы последствий найти множество альтернатив, оптимальных по Парето.

0,4 0,9 0,5 0,5 0,6
0,6 0,5 0,7 0,8 0,9
0,6 0,3 0,8 0,6 0,7
0,3 0,8 0,5 0,4 0,3
0,1 0,3 0,5 0,4 0,3
0,4 0,8 0,5 0,4 0,5

В таблице – возможные альтернативы (стратегии) ЛПР, – одно из состояний неопределенной реальной ситуации.

Решение.

Стратегия доминирует над стратегиями , и . Следовательно, исключаем 4-ю, 5-ю и 6-ю строки матрицы.

Игроки
0,4 0,9 0,5 0,5 0,6
0,6 0,5 0,7 0,8 0,9
0,6 0,3 0,8 0,6 0,7

Больше доминируемых стратегий нет. Получаем множество оптимальности по Парето, состоящее из трех альтернатив: , , .

Одним из важнейших условий принятия эффективного решения, направленного на достижение цели во временной перспективе, является наличие соответствующего объема релевантной информации. Неполная информация, невозможность достоверного предсказания будущих событий и факторов, могущих повлиять на результат, к которому приводит принимаемое решение, являются признаками неопределенности. Достаточно большая часть управляющих решений принимается в условиях неопределенности. Потенциал неопределенности - внешняя среда организации.

Принятие решений в условиях неопределенности связывается с понятием риска и производится с помощью методов исследования операций и теории статистических решений. В общем виде задача принятия решения в условиях неопределенности представляется в виде таблицы эффективности (табл.1).

Таблица1.

О 1 О 2 ... O n
p 1 a 11 a 12 ... a 1 n
p 2 a 21 a 22 ... a 2 n
... ... ... ... ...
p m a m1 a m2 ... a mn

где O n - условия обстановки, которые точно неизвестны, но о которых можно сделать n-предложений (спрос, количество поставщиков, удовлетворенность материалами);

P m -возможные стратегии, линии поведения решения.

Каждой паре стратегии и обстановки, соответствуют выигрыши -A mn .

Выигрыши, указанные в таблице, являются рассчитанными показателями эффективности стратегии (решения) в различных обстановках.

Представленная задача направлена на принятие решений при разработке планов развития предприятий, разработке производственных программ, планов выпуска новых видов продукции, направленности инноваций, выбора стратегий страхования, инвестиции, средств и т.д.

В теории статистических решений применяется специальный показатель риска, который показывает выгодность принимаемой стратегии в данной обстановке с учетом ее неопределенности. Риск рассчитывается как разность между ожидаемым результатом действий при наличии точных данных обстановки и результатом, который может быть достигнут, если эти данные неопределенны. По этой разности рассчитывается таблица рисков выпуска нового вида продукции. Таблица рисков дает возможность оценить качество различных решений и установить полноту реализации возможностей при наличии риска. Выбор наилучшего решения зависит от степени неопределенности.

В зависимости от степени неопределенности обстановки различают 3 варианта принятия решений:

1. Выбор оптимального решения, когда вероятности возможных вариантов обстановки известны. Оптимальное решение определяется по max сумм произведений вероятностей различных вариантов обстановки P(O 1) на соответствующие значения выигрышей А (таблица 6 эффективности) по каждому решению.

2. Выбор оптимального решения, когда вероятности возможных вариантов обстановки неизвестны.

3. Выбор оптимального решения по принципам подхода к оценке результата действий.

В условиях неизвестной вероятности обстановки возможно принятие следующих решений:

а) max-min или “рассчитывай на худшее“ - выбор решения, гарантирующий выигрыш в любых условиях, не меньше, чем наибольший возможный в худших условиях;

б) min max риск в любых условиях. За оптимальное принимается решение, для которого риск, max при различных вариантах обстановки, кажется минимальным.

За оптимальное решение в зависимости от линии ориентации ЛПР принимается решение, для которого показатель G (критерий пессимизма - оптимизма Гурвица) окажется максимальным:

где - минимальный выигрыш, соответствующий решению m;

Максимальный выигрыш, соответствующий решению m;

k - коэффициент, характеризующий линию поведения (ориентации) ЛПР, .

Графически значение k по отношению к линии поведения можно интерпретировать следующей схемой:

значение k


0 0,25 0,5 0,75 1

Линия ориентации в расчете

на лучшее на худшее

Задача:

Предлагается 3 варианта вложения инвестиций:

1) Вложить все имеющиеся средства в акции компании “Нефть-АГ”, что гарантирует высокий доход при соответствующей обстановке;

2) Вложить все средства в ГКО при гарантии низкого и стабильного дохода;

3) Вложить часть средств в акции “Нефть-АГ”, часть в ГКО - т.е. произвести диверсификацию портфеля средств.

Перспектива обозначена тремя вариантами обстановки (исхода событий).

Принять решение по проблеме вложения инвестиций, имея в качестве исходных данных таблицу выигрышей (табл.2).

Таблица 2.

Pi/Oi O 1 O 2 O 3
P 1 0.99 0.1
P 2 0.5 0.5 0.3
P 3 0.25 0.7 0.4

P i - вариант решения;

O i - вариант обстановки;

O 1 - компания “Нефть-АГ” - обанкротилась, ГКО - приносит стабильный доход.

O 2 - компания ”Нефть-АГ” - процветает;

O 3 - кризис в экономике.

Определим оптимальное решение, при котором выигрыш в любых условиях будет не меньше, чем наибольший возможный в худших условиях (max-min).

Из табл. 2 для решения P 1 наименьший выигрыш составит 0, для P 2 - 0.3, для P 3 - 0.25.

Наибольший возможный выигрыш при самом плохом стечении обстоятельств составит 0.3, что соответствует принятию решения P 2 , т.е. при любых вариантах обстановок решение P 2 будет не самым худшим.

Оптимальное решение при условии, что риск окажется минимальным из максимальных его значений при различных вариантах решений определяется из табл.7. Предварительно рассчитывается матрица рынков. При этом максимальный риск при принятии решения P 1 - 0.5; при P 2 - 0.49; при P 3 - 0.29. Из ряда максимальных рисков за оптимальное принимается решение P 3 , имеющее минимальный уровень риска 0,29.

Рассчитаем критерий пессимизма - оптимизма Гурвица для различных вариантов решений в зависимости от значения принятого коэффициента k.

Для решения P 1

Решение:

Рассчитаем матрицу рисков вложения инвестиций (табл.3).

Таблица3.

Pi/Oi O 1 O 2 O 3
P 1 0.5-0=0.5 0.99-0.99=0 0.4-0.1=0.3
P 2 0.5-0.5=0 0.99-0.5=0.49 0.4-0.3=0.1
P 3 0.5-0.25=0.25 0.99-0.7=0.29 0.4-0.4=0

При условии равновероятности обстановок их вероятности равны и составляют:

P(O 1)=P(O 2)=P(O 3)=0.33

Математически ожидания выигрышей при условии равновероятности обстановок определятся из выражения:

W i =P(O i)*A ij ,

где P(O i)-вероятность будущей обстановки;

A ij -выигрыш, соответствующий i-ому решению при j-той обстановке.

W 1 =0.33*0+0.33*0.99+0.33*0.1=0.3597

W 2 =0.33*0.5+0.33*0.5+0.33*0.3=0.329

W 3 =0.33*0.25+0.33*0.7+0.33*0.4=0.445

В условиях равновероятности будущих обстановок наиболее оптимальным является решение P 3.

При других значениях вероятностей обстановок решение может быть другим.

Выбор решения по критерию Гурвица:

для решения P 1: G 1 =0,495;

для решения P 2: G 2 =0,5*0,3+(1-0,5)*0,5=0,4;

для решения P 3: G 3 =0,5*0,25+(1-0,5)*0,7=0,475.

При k=0,5 за оптимальное принимается решение P 1 .

Аналогично рассчитываются значения G i при других значениях коэффициента.

Полученные значения G i сводим в таблицу 4.

Таблица4.

G i при заданных k i
P i /k i 0.00 0.25 0.5 0.75 1.00
P i 0.99 0.743 0.495 0.362
P 2 0.5 0.45 0.4 0.35 0.3
P 3 0.7 0.587 0.475 0.362 0.25
Выбранное решение P 1 P 1 P 1 P 1 P 3 P 2

Лицо, принимающее решение в соответствии с выбранным k i за оптимальное принимает решение, имеющее максимальное значение G i . При k i =0,75 - G max =0,362. За оптимальное принимается решение Р 1 или Р 3 .

1. ОБЩАЯ МЕТОДИКА ФОРМИРОВАНИЯ КРИТЕРИЕВ

Суть предлагаемой методики формирования критериев заключается в реализации следующих пунктов.

1) Из выигрышей аij, i=1,…,m; j=1,…,n, игрока А составляем матрицу А, предполагая, что она удовлетворяет указанным выше условиям: m³2, n³2 и она не содержит доминируемых (в частности, дублируемых) строк.

Выигрыши аij игрока А, представленные в виде матрицы А, дают возможность лучшего обозрения результатов выбора стратегий Аi, i=1,…,m, игроком А при каждом состоянии природы Пj, j=1,…,n.

2) Фиксируем распределение удовлетворяющих условию (1) вероятностей qj=p(Пj), j=1,…,n, состояний природы Пj, j=1,…n, разумеется, если они известны. Таким образом, пункт 2 участвует в методике формирования критерия в случае принятия решения в условиях риска.

3) На основании пунктов 1 и 2 выбираем натуральное число l, 1£l£n, и определенным образом строим матрицу


Назовем их коэффициентами формируемого критерия. Они призваны играть роль количественных оценок некоторых субъективных проявлений игрока А (лица, принимающего решение), а именно степени доверия к распределению вероятностей состояний природы и степени его пессимизма (оптимизма) при принятии решений.

5) Используя матрицу В и коэффициенты l1,…, ll, каждой стратегии Аi, i=1,…,m, игрока А поставим в соответствие число


7) Определим оптимальную стратегию.

Оптимальной стратегией назовем стратегию Аk с максимальным показателем эффективности, другими словами, - стратегию, показатель эффективности Gk которой совпадает с ценой игры G:


Понятно, что такое определение оптимальной стратегии не влечет ее единственности.

Отметим, что по логике этого пункта игрок А, выбирая оптимальную стратегию, максимизирует показатель Gi (см. (5)). Это обстоятельство оправдывает то, что этот показатель мы назвали (в пункте 5) показателем эффективности.

2. ФОРМИРОВАНИЕ НЕКОТОРЫХ ИЗВЕСТНЫХ КРИТЕРИЕВ-ЧАСТНЫЕ СЛУЧАИ ОБЩЕЙ МЕТОДИКИ

Критерий Байеса (, , , ).

1) Пусть А является матрицей выигрышей игрока А.

2) Известны вероятности qj=p(Пj), j=1,…,n, состояний природы Пj, j=1,…,n, удовлетворяющие условию (1). Следовательно, речь идет о принятии решения в условиях риска.

3) Полагаем l=n и матрицу В выбираем равной матрице А, т.е.

bij=aij для всех i=1,…,m и j=1,…,n.

4) Коэффициенты l1,…,ln, выбираем равными соответствующим вероятностям q1,…,qn, т.е. ll=qi, i=1,…,n. Этим самым игрок А выражает полное доверие к истинности распределения вероятностей q1,…,qn, состояний природы.

Из (1) следует, что коэффициенты lj, j=1,…,n удовлетворяют условию (3).

5) Показатель эффективности стратегии Аi по критерию Байеса обозначим через Вi и находим его по формуле (3):


Очевидно, что Вi – средневзвешенный выигрыш при стратегии Аi с весами q1,…,qn.

Если стратегию Аi трактовать как дискретную случайную величину, принимающую значения выигрышей при каждом состоянии природы, то вероятности этих выигрышей будут равны вероятностям состояний природы и тогда Вi есть математическое ожидание этой случайной величины (см. (6)).

6) Цена игры по критерию Байеса, обозначаемая нами через В, определяется по формуле (4):

7) Оптимальной среди чистых стратегий по критерию Байеса является стратегия Аk, для которой показатель эффективности максимален:

Критерий Лапласа (, , , ).

2) Исходя из теоретических, либо из практических соображений, констатируется, что ни одному из возможных состояний природы Пj, j=1,…,n, нельзя отдать предпочтения. Потому все состояния природы считают равновероятностными, т.е. qj=n-1, j=1,…,n. Этот принцип называют принципом «недостаточного основания» Лапласа. Вероятности qj=n-1, j=1,…,n, удовлетворяют условию (1).

Поскольку вероятности состояний природы известны: qj=n-1, j=1,…,n, то мы находимся в ситуации принятия решения в условиях риска.

3) Пусть l=n, а в качестве матрицы В можно взять матрицу, получающуюся из матрицы А, если каждую строку последней заменить на произвольную перестановку ее элементов. В частности, можем положить В=А. В общем же случае элементы матрицы В имеют вид bij=aikj(i), i=1,…, m; j=1,…,n, где aik1(i), aik2(i),…,aikn(i) – некоторая перестановка элементов ai1, ai2,…,ain i-й строки матрицы А.

4) Пусть коэффициенты lj=n-1, j=1,…,n. Очевидно, они удовлетворяют условию (2).

Выбор коэффициентов lj, j=1,…,n, таким образом подтверждает полное доверие игрока А к принципу недостаточного основания Лапласа.

5) По формуле (3) показатель эффективности стратегии Аi по критерию Лапласа, обозначаемый нами через Li, равен:


7) Оптимальной стратегией Аk по критерию Лапласа является стратегия с максимальным показателем эффективности:

Заметим, что, как следует из (7) и (8), показатель эффективности Li будет максимальным тогда и только тогда, когда максимальной будет сумма , и потому в качестве показателя эффективности стратегии Аi можно рассмотреть число , а в качестве цены игры – число .

Тогда оптимальной будет стратегия, сумма выигрышей при которой максимальна.

Критерий Вальда ( – ).

1) Предположим, что А – матрица выигрышей игрока А.

2) Вероятности состояний природы неизвестны и нет возможности получить о них какую-либо статистическую информацию. Поэтому игрок А находится в ситуации принятия решения в условиях неопределенности.

3) Пусть l=1 и


4) Пусть коэффициент l1=1. Очевидно, условие (2) выполняется.

5) Обозначим показатель эффективности стратегии Аi по критерию Вальда через Wi. В силу (9) и значения коэффициента l1=1, по формуле (3) имеем:


Таким образом, показатель эффективности стратегии Аi по критерию Вальда есть минимальный выигрыш игрока А при применении им этой стратегии.

6) Цена игры по критерию Вальда, обозначим ее через W, находится по формуле (4):

7) Оптимальной среди чистых стратегий по критерию Вальда является стратегия Аk с максимальным показателем эффективности:

Другими словами, оптимальной среди чистых стратегий по критерию Вальда считается та чистая стратегия, при которой минимальный выигрыш является максимальным среди минимальных выигрышей всех чистых стратегий. Таким образом, оптимальная стратегия по критерию Вальда гарантирует при любых состояниях природы выигрыш, не меньший максимина:


В силу (10), критерий Вальда является критерием крайнего пессимизма игрока А, а количественным выражением этого крайнего пессимизма является значение коэффициента l1, равное 1. Игрок А, принимая решение, действует по принципу наибольшей осторожности.

Хотя арабская пословица и гласит: «Кто боится собственной тени, тому нет места под солнцем», - тем не менее этот критерий уместен в тех случаях, когда игрок А не столько хочет выиграть, сколько не хочет проиграть. Использование принципа Вальда в обиходе подтверждается такими поговорками как «Семь раз отмерь – один раз отрежь», «Береженого Бог бережет», «Лучше синица в руках, чем журавль в небе».

Критерий Ходжа-Лемана .

1) Предположим, что матрицей выигрышей игрока А является матрица А.

2) Известны вероятности qi=p(Пj), j=1,…,n, состояний природы Пj, j=1,…,n, удовлетворяющие условию (1).

Таким образом, игроку А надлежит принимать решение в условиях риска.

3) Пусть l=2,


· показатель эффективности стратегии Аi по критерию Байеса.

Матрица В примет вид


Очевидно, что эти коэффициенты удовлетворяют условию (2).

5) По формуле (3), с учетом (11), (12), и (13), показатель эффективности стратегии Аi по критерию Ходжа-Лемана равен:

Gi=libi1+l2bi2=(1-l)Wi+lBi=(1-l)aij+ i=1,…,m.

В правой части формулы (14) коэффициент lÎ есть количественный показатель степени доверия игрока А данному распределению вероятностей qi=p(Пj), j=1,…,n, состояний природы Пj, j=1,…,n, а коэффициент (1-l) характеризует количественно степень пессимизма игрока А. Чем больше доверия игрока А данному распределению вероятностей состояний природы, тем меньше пессимизма и наоборот.

6) Цену игры по критерию Ходжа-Лемана находим по формуле (4):

7) Оптимальной стратегией по критерию Ходжа-Лемана является стратегия Аk с наибольшим показателем эффективности:

Отметим, что критерий Ходжа-Лемана является как-бы промежуточным критерием между критериями Байеса и Вальда. При l=1, из (14) имеем:Gi=Bi и потому критерий Ходжа-Лемана превращается в критерий Байеса. А при l=0, из (14): Gi=Wi и, следовательно, из критерия Ходжа-Лемана получаем критерий Вальда.

Критерий Гермейера .

1) Пусть матрица А является матрицей выигрышей игрока А.

2) Даны вероятности qi=p(Пj), j=1,…,n, состояний природы Пj, j=1,…,n, удовлетворяющие условию (1).

Т.о. игрок А находится в ситуации принятия решений в условиях риска

размера m x 1.

4) Полагаем l1=1. Условие (2), очевидно, выполняется.

5) Показатель эффективности стратегии Аi по критерию Гермейера определяем по формуле (3) с учетом (15) и того, что l1=1:


Если игрок А придерживается стратегии Аi, то вероятность выигрыша aij при этой стратегии и при состоянии природы Пj равна, очевидно, вероятности qj этого состояния природы. Поэтому формула (16) показывает, что показатель эффективности стратегии Аi по критерию Гермейера есть минимальный выигрыш при этой стратегии с учетом его вероятности.

6) Цена игры по критерию Гермейера определяется по формуле (4):

7) Оптимальной стратегией по критерию Гермейера считается стратегия Аk с наибольшим показателем эффективности:

Заметим, что критерий Гермейера можно интерпретировать как критерий Вальда, применимый к игре с матрицей


Критерий Гермейера так же, как и критерий Вальда является критерием крайнего пессимизма игрока А, но, в отличие от критерия Вальда, игрок А, принимая решение с максимальной осмотрительностью, учитывает вероятности состояний природы.

В случае равномерного распределения вероятностей состояний природы: qj=n-1, j=1,…,n, показатель эффективности стратегии Аi, в силу формулы (16), будет равен Gi=n-1aij и, следовательно, критерий Гермейера эквивалентен критерию Вальда, т.е. стратегия, оптимальная по критерию Гермейера, оптимальна и по критерию Вальда, и наоборот.

Критерий произведений .

1) Пусть матрицей выигрышей игрока А является матрица А, все элементы которой положительны:

aij>0, i=1,…,m; j=1,…,n.

2) Известны вероятности qj=p(Пj), j=1,…,n, состояний природы Пj, j=1,…,n, и удовлетворяют условию (1).

3) Пусть l=1 и


размера m x 1.

4) Пусть l1=1. Условие (2) выполняется.

5) Показатель эффективности стратегии Аi по критерию произведений в соответствии с формулами (3) и (17) равен

.

6) Цена игры по критерию произведений вычисляется по формуле (4):

7) Оптимальной стратегией по критерию произведений является стратегия Аk с наибольшим показателем эффективности:

Отметим, что для критерия произведений является существенным положительность всех состояний вероятностей состояний природы и всех выигрышей игрока А.

Максимаксный критерий (.-).

2) Вероятность состояний неизвестны. Решение принимается в условиях неопределенности.

3) Пусть l=1 и


размера m x 1.

4) Коэффициент l1 выбираем равным 1: l1=1. При этом условие (2), очевидно, выполняется.

5) Показатель эффективности стратегии Аi по максимаксному критерию обозначим через Мi и определим его по формуле (3) с учетом (18) и того, чтоl1=1:


Таким образом, показатель эффективности стратегии Аi по максимаксному критерию есть наибольший выигрыш при этой стратегии.

6) Цена игры по максимаксному критерию, обозначаемая нами через М, определяется по формуле (4):


Очевидно, что это есть наибольший элемент матрицы А.

7) Оптимальная стратегия по максимаксному критерию есть стратегия Аk с наибольшим показателем эффективности:

Из формулы (19) заключаем, что максимаксный критерий является критерием крайнего оптимизма игрока А. Количественно это выражается тем, что l1=1. Этот критерий противоположен критерию Вальда. Игрок А, пользуясь максимаксным критерием, предполагает, что природа П будет находиться в благоприятнейшем для него состоянии, и, как следствие отсюда, ведет себя весьма легкомысленно, с «шапкозакидательским» настроением, поскольку уверен в наибольшем выигрыше. Вместе с тем, в некоторых случаях этим критерием пользуются осознанно, например, когда перед игроком А стоит дилемма: либо получить наибольший выигрыш, либо стать банкротом. Бытовое отражение подобных ситуаций иллюстрируется поговорками: «Пан или пропал», «Кто не рискует, тот не выигрывает» и т.п.

Оптимальная стратегия по максимальному критерию гарантирует игроку А возможность выигрыша, равного максимаксу.

.

Критерий пессимизма-оптимизма Гурвица с показателем оптимизма lÎ ( – ).

1) Пусть А – матрица выигрышей игрока А.

2) Вероятности состояний природы неизвестны и нет возможности получить о них какую–либо надежную статистическую информацию.

Таким образом, решение о выборе оптимальной стратегии будет приниматься в условиях неопределенности.

3) Положим l=2. Элементы матрицы В


4) Коэффициенты l1 и l2 выбираем следующим образом:


В формуле (22) l - показатель оптимизма, а (1-l) – показатель пессимизма игрока А при выборе им оптимальной стратегии. Чем ближе к единице показатель оптимизма, тем ближе к нулю показатель пессимизма, и тем больше оптимизма и меньше пессимизма. И наоборот. Если l=0,5, то и 1-l=0,5, т.е. показатели оптимизма и пессимизма одинаковы. Это означает, что игрок А при выборе стратегии ведет себя нейтрально.

Таким образом, число l выбирается в пределах от 0 до 1 в зависимости от склонности игрока А к оптимизму или пессимизму.

6) Цена игры по критерию Гурвица Н определяется из формулы (5):


7) Оптимальная стратегия Аk по критерию Гурвица соответствует показателю эффективности

Критерий Гурвица является промежуточным между критерием Вальда и максимаксным критерием и превращается в критерий Вальда при l=0 и - в максимаксный критерий при l=1.

Обобщенный критерий Гурвица с коэффициентами l1,…, ln (, ).

1) Пусть А – матрица выигрышей игрока А.

2) Вероятности состояний природы неизвестны. Так что решение принимается в условиях неопределенности.

3) Матрица В получается из матрицы А перестановкой элементов каждой ее строки в неубывающем порядке:

bi1£bi2£…£bin, i=1,…,m.

Таким образом, в 1-м столбце матрицы В стоят минимальные, а в n-м столбце максимальные выигрыши стратегий. Другими словами, в 1-м столбце матрицы В стоят показатели эффективности стратегий по критерию Вальда, а в n-м столбце – показатели эффективности стратегий по максимаксному критерию.

4) Коэффициенты l1,…, ln выбираются удовлетворяющими условиям (2) соответственно различной степени склонности игрока А к оптимизму. При этом показателем пессимизма игрока А называется число


где целая часть числа , а показателем оптимизма игрока А называется число


Очевидно, что lр+l0=1.

5) Показатель эффективности стратегии Аi по обобщенному критерию Гурвица определяется по формуле (3):


6) Цену игры по обобщенному критерию Гурвица определим по формуле (4):

7) Оптимальные стратегии находятся стандартно: Аk – оптимальная стратегия, если Gk=G.

Отметим, что обобщенный критерий Гурвица учитывает все выигрыши при каждой стратегии, что необходимо для более полной картины эффективности стратегий. Отметим также, что некоторые из приведенных выше критериев являются частными случаями обобщенного критерия Гурвица.

Отметим, что если В=А, то коэффициенты lj, j=1,…,n, можно формально интерпретировать как вероятности состояний природы и в, таком случае, обобщенный критерий Гурвица совпадает с критерием Байеса.

Если lj=n-1, j=1,…,n, то обобщенный критерий Гурвица превращается в критерий Лапласа.

Если l1=1, l2=…=ln=0, то обобщенный критерий Гурвица представляет собой критерий Вальда.

При l1=…=ln-1=0, ln=1, из обобщенного критерия Гурвица получаем максимаксный критерий.

Если l1=1-l, l2=…=ln-1=0, ln=l, где lÎ, то обобщенный критерий Гурвица является критерием Гурвица.

Если В=А и qi=p(Пj), j=1,…,n – вероятности состояний природы, удовлетворяющие условиям (1), то выбрав коэффициенты lj, j=1,…,n, следующим образом: l1=1-l+lq1, lj=lqj, j=2,…,n, где lÎ, мы из обобщенного критерия Гурвица получим критерий Ходжа Лемана.

3. ЗАДАЧА В УСЛОВИЯХ ПОЛНОЙ НЕОПРЕДЕЛЁННОСТИ

Допустим, инвестор принимает решение о строительстве жилья определенного типа в некотором месте. Инвестор действует в условиях неопределенности (информационной непрозрачности) на рынке жилья. Чтобы сформировать представление о ситуации на рынке жилья на момент завершения строительства ему необходимо учесть цены на недвижимость, конкуренцию на рынке жилья, соотношение предложения и спроса, курсы валют и многое другое. Статистические данные свидетельствуют о том, что одной из главных составляющих стоимости жилья является место его расположения.

Рассмотрим математическую модель данной ситуации. Мы имеем игру с природой, где игрок А – инвестор, природа П – совокупность возможных ситуаций на рынке жилья на момент завершения строительства, из которых можно сформировать, например, пять состояний П1, П2, П3, П4, П5 природы. Известны приближенные вероятности этих состояний q1=p(П1)»0,30; q2=p(П2)»0,20; q3=p(П3)»0,15; q4=p(П4)»0,10; q5=p(П5)»0,25. Предположим, что игрок А располагает четырьмя (чистыми) стратегиями А1, А2, А3, А4, представляющими собой выбор определенного места для постройки жилья. Множество этих мест ограничено градостроительными решениями, стоимостью земли и т.д. Инвестиционная привлекательность проекта определяется как процент прироста дохода по отношению к сумме капитальных вложений, оценка которых известна при каждой стратегии и каждом состоянии природы. Эти данные представлены в следующей матрице выигрышей игрока А:


размера 4 х 5, в последней, дополнительной строке которой указаны вероятности состояний природы. Матрица (24) не содержит доминируемых (в частности, дублируемых) строк и все ее элементы положительны.

Инвестору предстоит выбрать участок земли так, чтобы наиболее эффективно использовать капиталовложения.

Подсчитаем показатели эффективности стратегий

· по критериям Байеса, Гермейера и критерию произведений при условии, что инвестор А доверяет данному распределению вероятностей состояний природы,

· по критерию Лапласа, если инвестор А не доверяет данному распределению вероятностей состояний природы и не может отдать предпочтения ни одному из рассматриваемых состояний природы,

· по критерию Ходжа- Лемана с коэффициентом доверия к вероятностям состояний природы, например, l=0,4,

· по критерию Вальда, максимаксному критерию, критерию пессимизма-оптимизма Гурвица с показателем оптимизма, например, l=0,6, и по обобщенному критерию Гурвица с коэффициентами, например, l1=0,35; l2=0,24; l3=0,19; l4=0,13; l5=0,09.

Результаты подсчета показателей эффективности и оптимальные стратегии представлены в следующей таблице:

Таблица показателей эффективности и оптимальных стратегий

Стратегии

Критерии

Ходжа-Лемана

Гермейгера

Произ-ведений

Макси-максный

Обобщенный Гурвица с коэффиц

l1=0,35
l2=0,24
l3=0,19
l4=0,13
l5=0,09

Оптимал. стратегии


Заметим, что, поскольку, в критерии Ходжа- Лемана показатель доверия игрока А распределению вероятностей состояний, указанных в последней строке матрицы (24), равен l=0,4, то показатель пессимизма игрока А равен 1-l=0,6.

В критерии Гурвица показатель оптимизма игрока А равен l=0,4 и, следовательно, показатель его пессимизма также равен 1-l=0,6.

В обобщенном критерии Гурвица по формуле (23) показатель пессимизма

= 0,35+0,24+0,5×0,19=0,685

и, следовательно, показатель оптимизма l0=1-0,685=0,315.

Таким образом, во всех примененных критериях, учитывающих индивидуальные проявления игрока А к пессимизму и оптимизму, игрок А более склонен к пессимистической оценке ситуации, чем к оптимистической, примерно с одинаковыми показателями.

В результате применения девяти критериев мы видим, что в качестве оптимальной стратегии А1 выступает 3 раза, стратегия А3 – 6 раз и стратегия А4 – 1 раз. Поэтому, если у инвестора А нет никаких обоснованных серьезных возражений, то в качестве оптимальной можно рассматривать стратегию А3.

Критерий Сэвиджа (критерий минимаксного риска).

Критерий Гурвица.

Решение.

1. Максиминный критерий Вальда .max min а ij

Вычислим минимальные значения по строкам min а ij , а далее из них выберем максимальное.

Таким образом, получаем Н =max min а ij = 15 i j

Ответ: оптимальной стратегией 1-го игрока А является

стратегия А 4 .

Параметр Гурвица возьмем равным γ =0,6: γ= min а ij +(1-γ) max а ij

5 10 18 255 25 5*0,6+0,4*25=13

А = 8 7 8 23 7 23 7*0,6+0,4*23=13,4

21 18 12 21 12 18 12*0,6+0,4*18=14,4

20 22 19 1515 22 15*0,6+0,4*22=17,8

Получаем H =max=17.8

стратегия А 4 .

Необходимо построить матрицу рисков.

Для этого:

1) вычислить максимальные значения по столбцам

2) вычислить матрицу рисков: r ij = max а ij - а ij

21-5 22-10 19-18 25-25 16 12 1 0

r ij = 21-8 22-7 19-8 25-23 = 13 15 11 2

21-21 22-18 19-12 25-21 0 4 7 4

21-20 22-22 19-19 25-15 1 0 0 10

3) вычислить максимальные значения по строкам и из них выберем строку с минимальным значением:

r ij = 0 4 7 4 7

Получаем H =minmax r ij = 7 при применении стратегии А 3 .

Ответ: оптимальной стратегией первого игрока является

стратегия А 3 .

4. Критерий Лапласа. n

Вычислить средние арифметические по строкам [ 1/n ∑ а ij ]

5 10 18 25 0.25 (5+10+18+25)=14.5 j =1

A = 8 7 8 23 0.25 (8+7+8+23)=11.5

21 18 12 21 0.25 (21+18+12+21)=18

20 22 19 15 0.25 (20+22+19+15)=19

Получаем H =max [ 1/n ∑ а ij ] =19 при применении стратегии А 4 .

Ответ: оптимальной стратегией первого игрока является

стратегия А 4 .

В 1 В 2 В 3 В 4 n

А 1 5 10 18 25 H =max∑P j а ij

А 2 8 7 8 23 i j =1

А 3 21 18 12 21

А 4 20 22 19 15

Вероятности стратегий второго игрока.

В 1 В 2 В 3 В 4
0.2 0.15 0.35 0.3

5*0.2+10*0.15+18*0.35+25*0.3=16.30

8*0.2+7*0.15+8*0.35+23*0.3=12.35

21*0.2+18*0.15+12*0.35+21*0.3=17.40

20*0.2+22*0.15+19*0.35+15*0.3=18.45

Получаем Н = 18,45 при применении стратегии А 4 .

Ответ: оптимальной стратегией первого игрока является

стратегия А 4 .

ПРИМЕР №2

Предприятие имеет возможность самостоятельно планировать объемы выпуска сезонной продукции А 1 , А 2 , А 3 . Не проданная в течении сезона продукция позже реализуется по сниженной цене. Данные о себестоимости продукции, отпускных ценах и объемах реализации в зависимости от уровня спроса приведены в таблице:



Требуется:

1) придать описанной ситуации игровую схему, указать допустимые стратегии сторон, составить платежную матрицу

Указание. Для уменьшения размерности платежной матрицы считать, что одновременно на все три вида продукции уровень спроса одинаков:

повышенный, средний или пониженный.

В игре участвуют 2 игрока: А - производитель, В - потребитель.

Игрок А стремится реализовать свою продукцию так, чтобы получить максимальную прибыль. Стратегиями игрока А являются:

А 1 - продавать продукцию при повышенном состоянии спроса

А 2 - продавать продукцию при среднем состоянии спроса

А 3 - продавать продукцию при пониженном состоянии спроса

Игрок В стремится приобрести продукцию с минимальными затратами. Стратегиями игрока В являются:

В 1 - покупать продукцию при повышенном состоянии спроса

В 2 - покупать продукцию при среднем состоянии спроса

В 3 - покупать продукцию при пониженном состоянии спроса

Интересы игроков А и В - противоположны. Определим цену продукции в течение сезона и после уценки:

Рассчитаем элементы платежной матрицы

Предложение Спрос
стратегии Повышенный спрос 14+38+24 Средний спрос 8+22+13 Пониженный спрос 5+9+7
Повышенный спрос 14+38+24 14*0,8+38*0,5+ 24*1,3=61,4 8*0,8+(14-8) *0,2+ 22*0,5+(38-22)*(-5) +13*1,3+(24-13)*0,2 =29,7 5*0,8+(14-5)*0,2+ 9*0,5+(38-9)*(-5)+ 7*1,3+(24-7)=8,3
Средний спрос 8+22+13 8*0,8+22*0,5+ 13*1,3=34,3 8*0,8+22*0,5+ 13*1,3=34,3 5*0,8+(8-5)*0,2+ 9*0,5+(22-9)*(-5)+ 7*1,3+(13-7)*0,2 =12,9
Пониженный спрос 5+9+7 5*0,8+9*0,5+7*1,3 =17,6 5*0,8+9*0,5+ 7*1,3=17,6 5*0,8+9*0,5+ 7*1,3=17,6

Платежная матрица примет вид

Стратегии В 1 В 2 В 3 α i =min а ij j
А 1 61.4 29.7 8.3 8.3
А 2 34.3 34.3 12.9 12.9
А 3 17.6 17.6 17.6 17.6
β j =max а ij i 61.4 34.3 17.6

α = max α i = 17.6 β = min β j = 17.6

Так как α = β = ν = 17,6, то найдена седловая точка. Значит оптимальное решение: А 3 ; В 3

Производитель (игрок А) получит гарантированную прибыль в размере 17,6 ден.ед., если будет реализовывать свою продукцию при пониженном уровне спроса в объеме 5,9 и 7 ед. соответственно продукции А 1 , А 2 и А 3

Контрольные вопросы:

1.Дайте определение конфликтной ситуации.

2.Как называется математическая модель конфликтной ситуации?

3.Как называются заинтересованные стороны в теории игр?

4.Какая игра называется антагонистической? Приведите пример.

5.Дайте определение понятию «стратегия».

6.Что понимается под исходом конфликта?

7.Дайте определение понятию «выигрыш».

8.На какие классы делятся игры в зависимости от числа игроков?

9.В чем состоит цель игрока А при выборе стратегии?

10. В чем состоит суть максиминного принципа оптимальности и как называется выигрыш, полученный в соответствии в этим принципом?

11.Почему максимин α называют нижней ценой игры?

12.В чем состоит цель игрока В при выборе стратегии?

13.Почему минимакс β называют верхней ценой игры?

14.Почему справедливо неравенство α < β ?

15.Дайте определение цены игры в чистых стратегиях.

16.Какая игра называется игрой в смешанных стратегиях?

17.Как найти оптимальную смешанную стратегию игрока А и цену игры 2 х n геометрически?

18.Что в теории игр понимается под термином «природа»?

19.Приведите примеры в которых решение принимается в условиях неопределенности, связанной с неосознанным принятием различных факторов.

20.Чем отличается выбор оптимальных стратегий игроков в играх с природой от антагонистических игр?

21.Что понимается под риском игрока в игре с природой, и каким образом формируется матрица рисков,

22.Дайте определение критерия Вальда и как по нему определяется выигрыш?

23. Дайте определение критерия Севиджа и как по нему определяется выигрыш?

24. Дайте определение критерия Лапласа и как по нему определяется выигрыш?

25. Дайте определение критерия Байеса и как по нему определяется выигрыш?

26. Какой принцип выбора оптимальной стратегии лежит в основе критерия пессимизма –оптимизма Гурвица относительно выигрышей?

8.Лекция. Системы массового обслуживания.

Выше рассмотренная задача из теории игр предполагала выбор оптимальной стратегии в условиях риска. Это ситуации, когда игрок знает вероятности наступления исходов и последствий для каждого решения.

Совсем другая ситуация наступает, когда эти вероятности не известны, т.е. имеет место полная неопределённость в отношении возможности реализации состояния среды. В этом случае игру можно представить таким образом, что в ней имеется один игрок и некая действительность, называемая природой. Условия такой игры обычно представляется такой же платёжной матрицей, что и раньше, в которой строки представляют стратегии игрока, а столбцы – стратегии природы.

В данном случае при выборе наилучшего решения обычно используют следующие критерии:

1. Максимаксный критерий, или критерий крайнего оптимизма – определяет альтернативу, которая максимизирует максимальный результат для каждой альтернативы, т.е. выбирается стратегия, которой соответствует

2. Максиминный критерий Вальда, или критерий крайнего пессимизма – определяет альтернативу, которая максимизирует минимальный результат для каждой альтернативы, т.е. выбирается стратегия, которой соответствует

3. Критерий минимаксного риска Сэвиджа. Согласно этому критерию выбирается стратегия, при которой величина риска в наихудших условиях минимальна, т.е. равна

Здесь риск = () – .

4. Критерий оптимизма-пессимизма Гурвица рекомендует при выборе решения не руководствоваться ни крайним пессимизмом, ни крайним оптимизмом. Согласно этому критерию стратегия выбирается из условия

+ (1 – k ) }.

Значение коэффициента пессимизма k выбирается исследователем между нулём и единицей из практических соображений.

5. Критерий безразличия Лапласа. В условиях полной неопределённости предполагается, что все возможные среды (природы) равновероятны. Этот критерий выявляет альтернативу с максимальным средним результатом, т.е.

Если известны вероятности реализации для всех состояний среды, можно определить ожидаемую стоимостную оценку EMV для каждой альтернативы. Один из наиболее распространённых критериев выбора альтернативы – максимальная EMV.



Для каждой альтернативы ожидаемая стоимостная оценка EMV есть сумма всевозможных выигрышей для этой альтернативы, умноженных на вероятности реализаций этих выигрышей:

Максимальная EMV в случае равных вероятностей совпадает с критерием безразличия Лапласа.

Проиллюстрируем эти положения на следующем примере, реализованном в модуле Decision Analysis/Decision Tables.

На рисунке 4.6 просчитаны почти все описываемые критерии, кроме критерия минимаксного риска Сэвиджа, который рассчитан на рисунке 4.7.

Из обозначений строк и столбцов очевидны те или иные критерии. Так, например, в столбце EMV (рисунок 4.6) внизу показана максимальная EMV. Кроме того, внизу этого рисунка прописаны значения конкретных критериев и указано, на каких альтернативах они реализованы.

Рисунок 4.6 – Окно отчёта о решении задачи анализа решений

Рисунок 4.7Окно отчёта о вычислении критерия минимаксного риска Сэвиджа

На рисунке 4.7 показаны расчёты критерия минимаксного риска Сэвиджа (он равен 4 и реализован второй альтернативой).

Задания к выполнению лабораторной работы №4

Необходимо выполнить анализ всех задач, описанных в этом разделе.

Исходную информацию для выполнения лабораторной работы возьмёте из задания по транспортной задаче. Игра должна быть 4х4. Матрица транспортных расходов – это три стратегии игрока А. Четвёртую стратегию этого игрока составит строка потребностей (последняя строка, не включённая в матрицу транспортных расходов).

Для решения задачи графическим методов выберите две активные стратегии игрока А с минимальными частотами.

Для анализа игры с природой возьмите эту же платёжную матрицу.

Лабораторная работа №5

Системы массового обслуживания

Общие сведения

Существует широкий класс задач, с которыми приходится постоянно сталкиваться в повседневной и хозяйственной деятельности, где имеют место процессы, приводящие к задержкам в обслуживании и очередям. Системы, в которых протекают указанные процессы, получили название систем массового обслуживания (МО), а математическим описанием или разработкой математических моделей процессов, протекающих в них, занимается теория МО.

В процессе изучения очередей сначала необходимо обращать внимание на следующие основные её компоненты: входящий поток требований, каналы обслуживания, наличие очереди и выходящий поток. Эти составляющие не требуют разъяснения, за исключением дисциплины очереди. Последнее – это просто правило обслуживания. В дальнейшем мы будем рассматривать правило: первый пришёл, первый обслуживается. Системы МО связаны с двумя видами издержек: издержки обслуживания, увеличивающиеся при повышении уровня обслуживания, и издержки, связанные с ожиданием, уменьшающиеся с увеличением уровня обслуживания. Как известно, существует точка минимума общих издержек системы МО.

Определение оптимального уровня обслуживания, минимизирующего суммарные издержки системы МО, и является одной из основных задач при разработке и эксплуатации систем МО.