TEORIA JOCURILOR

104
1. Noţiuni generale Teoria jocurilor este teoria matematică care se ocupă cu determinarea metodelor de alegere a deciziilor în cazuri de competiţie sau situaţii conflictuale. O situaţie conflictuală este cea în care acţionează doi sau mai mulţi factori (persoane fizice, firme, partide politice) având scopuri contrarii. Astfel de situaţii sunt: concurenţa economică, vânzările la licitaţie, alegerile parlamentare etc.. Teoria jocurilor se ocupă şi de cazurile în care o activitate intră în conflict cu caracterul întâmplător al unor evenimente naturale (epidemii, secetă). Pentru construirea unui model formal, simplificat al situaţiei cercetate se vor selecta caracteristicile principale, cele secundare neglijându-se. Terminologia folosită este cea de la jocurile de societate sau de noroc. Prin joc sau joc strategic se înţelege situaţia în care acţionează o mulţime de elemente raţionale (numite jucători sau parteneri) care în mod succesiv şi independent, într-o ordine şi condiţii fixate într-un ansamblu de reguli, iau câte o decizie (efectuează o mutare) dintr-o mulţime dată de alternative. Regulile jocului fixează şi situaţiile în care se termină jocul, precum şi câştigul sau recompensa pentru fiecare jucător. Un joc realizat se mai numeşte partidă. Acţiunile întreprinse de jucători în cadrul unei partide se numesc mutări. Acestea pot fi: libere – când alegerea alternativei este univocă sau TEORIA JOCURILOR 4

Transcript of TEORIA JOCURILOR

Page 1: TEORIA JOCURILOR

1. Noţiuni generale Teoria jocurilor este teoria matematică care se ocupă cu

determinarea metodelor de alegere a deciziilor în cazuri de competiţie sau

situaţii conflictuale. O situaţie conflictuală este cea în care acţionează doi

sau mai mulţi factori (persoane fizice, firme, partide politice) având scopuri

contrarii. Astfel de situaţii sunt: concurenţa economică, vânzările la licitaţie,

alegerile parlamentare etc.. Teoria jocurilor se ocupă şi de cazurile în care o

activitate intră în conflict cu caracterul întâmplător al unor evenimente

naturale (epidemii, secetă). Pentru construirea unui model formal,

simplificat al situaţiei cercetate se vor selecta caracteristicile principale, cele

secundare neglijându-se. Terminologia folosită este cea de la jocurile de

societate sau de noroc.

Prin joc sau joc strategic se înţelege situaţia în care acţionează o

mulţime de elemente raţionale (numite jucători sau parteneri) care în mod

succesiv şi independent, într-o ordine şi condiţii fixate într-un ansamblu de

reguli, iau câte o decizie (efectuează o mutare) dintr-o mulţime dată de

alternative. Regulile jocului fixează şi situaţiile în care se termină jocul,

precum şi câştigul sau recompensa pentru fiecare jucător. Un joc realizat se

mai numeşte partidă.

Acţiunile întreprinse de jucători în cadrul unei partide se numesc

mutări. Acestea pot fi: libere – când alegerea alternativei este univocă sau

TEORIA JOCURILOR 4

Page 2: TEORIA JOCURILOR

Modele matematice în economie

aleatoare, când alegerea alternativei este supusă întâmplării şi e determinată

de un mecanism aleator (zar).

După cantitatea de informaţie de care dispune fiecare jucător există

jocuri cu informaţie completă (şahul) şi jocuri cu informaţie parţială (bridge-

ul), necunoaşterea intenţiilor adversarului constituind elementul esenţial al

situaţiilor conflictuale.

Ansamblul de reguli ce definesc în mod unic mişcările libere în

funcţie de situaţia ivită în timpul jocului se numeşte strategie. Dacă unul

dintre adversari are la dispoziţie m alternative, iar partida se încheie printr-o

alegere, se spune că jucătorul are la dispoziţie m strategii pure. Când

partidele se repetă, jucătorii pot alege strategii pure cu anumite frecvenţe sau

probabilităţi şi atunci se spune că utilizează o strategie mixtă. Dacă numărul

strategiilor pure este finit, spunem că avem un joc finit, în caz contrar avem

un joc infinit. Fiecare jucător urmăreşte aplicarea unei strategii care să îi

aducă un câştig maxim, deci îşi caută o strategie optimă.

Câştigul pi realizat de jucătorul Pi are semnificaţia unei sume băneşti

sau a unui număr de puncte, bunuri etc.. Dacă pi > 0, jucătorul Pi realizează

un câştig în sensul uzual al cuvântului, iar dacă pi < 0 înregistrează o

pierdere.

Din punct de vedere al câştigului distingem:

- jocuri cu sumă nulă – când la sfârşitul unei partide suma pierdută

de o parte din jucători este câştigată de ceilalţi şi

- jocuri cu sumă nenulă – când jucătorii pot să-şi mărească

concomitent câştigurile, prin alegerea unor strategii adecvate.

După numărul n al jucătorilor, jocurile pot fi cu doi parteneri sau cu

n > 2 parteneri.

Page 3: TEORIA JOCURILOR

Teoria jocurilor

Exemplu [2]

Fie jocul cu doi parteneri P1 şi P2 ce constă în 3 mutări libere. O

mutare înseamnă alegerea unuia dintre numerele a sau b, a ≠ b. La prima

mutare P1 alege liber pe a sau pe b; la a doua mutare P2, informat asupra

alegerii făcute de P1, alege la rândul său unul din numerele a sau b. În

sfârşit, la a treia mutare P1, informat asupra alegerii făcute de P2, alege unul

dintre numerele a sau b.

Observăm că este un joc în doi, cu mutări libere şi informaţie

completă ce poate fi reprezentat printr-un arbore de forma:

(1, -1) (2, 1) (-1, 2) (3, 1) (-2, 1) (1, -3) (2, 3) (1, 2)

Vârful 0 arată momentul iniţial, iar cifra 1 scrisă sub 0 arată că prima

mutare este a lui P1. Din 0 pornesc două muchii spre vârfurile a şi b, ce

reprezintă alegerile lui P1. Sub a şi b scriem 2, pentru că următoarea mutare

este a lui P2. Din fiecare vârf pornesc două muchii spre alte vârfuri a şi b,

reprezentând alegerile lui P2 şi sub aceste vârfuri scriem 1 deoarece P1 face

următoarea mutare spre alte vârfuri notate a şi b (care vor fi vârfuri

terminale). Sub ele nu mai scriem nimic, dar fiecăruia îi asociem un vector

b a b b ba a a

a b ba

ba

0

1 1 1 1

22

1

Page 4: TEORIA JOCURILOR

Modele matematice în economie

bidimensional (p1, p2) ale cărui componente reprezintă respectiv câştigurile

celor doi jucători, decurgând din regulile jocului.

S-au obţinut 8 vârfuri terminale ce vor determina tot atâtea partide,

deoarece o partidă este reprezentată de un lanţ ce leagă vârful 0 de unul din

vârfurile terminale. Cele 8 partide sunt: (a, a, a), (a, a, b), (a, b, a), (a, b, b),

(b, a, a), (b, a, b), (b, b, a) şi (b, b, b).

Jocul nu este cu sumă nulă deoarece dacă, de exemplu, s-ar realiza

partida (a, a, b) avem p1 = 2, p2 = 1 şi p1 + p2 = 3 ≠ 0.

Mulţimea strategiilor jucătorului P1 este:

A = ⎨(a, a), (a, b), (b, a), (b, b)⎬, unde primul element din fiecare

pereche reprezintă numărul ales la prima mutare, iar al doilea element indică

numărul ales la a treia mutare.

Mulţimea strategiilor lui P2 este:

B = ⎨(a), (b)⎬, reprezentând alegerile la a doua mutare.

Asociem jocului considerat un tabel cu două intrări A = ⎨A1, ...,A4⎬

- strategiile lui P1 şi B = ⎨B1, B2⎬, strategiile lui P2.

La intersecţia liniei lui Ai cu coloana lui Bj avem un dreptunghi în

care deasupra diagonalei am scris partida, iar dedesubt vectorul (pi, pj) al

câştigurilor celor doi jucători, când aceştia aleg strategiile Ai, respectiv Bj.

B A B1 = (a) B2 = (b)

A1 = (a, a) (a, a, a)(1, -1)

(a, b, a)(-1, 2)

A2 = (a, b) (a, a, b)(2, 1)

(a, b, b)(3, 1)

A3 = (b, a) (b, a, a)(-2, 1)

(b, b, a)(2, 3)

A4 = (b, b) (b, a, b)(1, -3)

(b, b, b)(1, 2)

Page 5: TEORIA JOCURILOR

Teoria jocurilor

Din acest exemplu observăm că există diferite moduri de

reprezentare a unui joc, cu ajutorul unui arbore sau matricial.

Observaţie: Dacă în acelaşi joc considerăm câştigurile date de

următoarea corespondenţă:

(a, a, a) → (2, -2) (b, a, a) → (1, -1)

(a, a, b) → (-1, 1) (b, a, b) → (3, -3)

(a, b, a) → (4, -4) (b, b, a) → (-2, 2)

(a, b, b) → (5, -5) (b, b, b) → (-3, 3)

jocul va fi: finit, cu informaţie completă, cu mutări libere şi cu sumă nulă,

deoarece p1 + p2 = 0 pentru orice vector (p1, p2).

În acest caz reprezentarea matricială poate fi simplificată, scriind în

locul vectorului (p1, p2) doar câştigul p1 al lui P1, deoarece cel al lui P2 e

cunoscut, egal cu – p1.

Forma simplificată a matricei este:

B A

B1 = (a) B2 = (b)

A1 = (a, a) A2 = (a, b) A3 = (b, a) A4 = (b, b)

2 -1 1 3

4 5 -2 -3

2. Jocuri matriceale

Fie un joc finit între doi jucători, în care un jucător are m strategii

pure, iar celălalt n strategii pure. Un astfel de joc se numeşte joc m × n sau

joc matriceal. Dacă jocul este cu sumă nulă, el se va numi antagonist. În

Page 6: TEORIA JOCURILOR

Modele matematice în economie

acest din urmă caz, funcţia de câştig se poate prezenta sub forma unui tabel

de plăţi, adică o matrice m × n, notată cu A, astfel:

A = ⎟⎟⎟

⎜⎜⎜

mn1m

n111

aa

aa

L

MMM

L

sau A = (aij), i = m,1 , j = n,1 .

Matricea A se numeşte matricea jocului (matricea câştigurilor).

Elementul aij este câştigul jucătorului P1 când alege strategia Ai şi jucătorul

P2 alege strategia Bj. Această formă matriceală de prezentare a jocului se va

numi forma normală.

Caracteristicile esenţiale ale unui joc sunt:

a) mulţimea strategiilor pure ale jucătorului P1, notată

A = ⎨A1,..., Am⎬;

b) mulţimea strategiilor pure ale jucătorului P2, notată

B = ⎨B1,...,Bn⎬;

c) funcţia de câştig f: A × B → ℝ, definită prin f(Ai, Bj) = aij,

i = m,1 , j = n,1 .

Imaginea prin f a produsului cartezian A × B este matricea A.

Matricea A se scrie deci în raport cu un singur jucător şi anume P1,

primul jucător (numit şi jucătorul maximizant, din punct de vedere formal –

ambii jucători urmărind acelaşi scop). Când P1 câştigă valoarea aij, P2

plăteşte lui P1 valoarea aij, i = m,1 , j = n,1 .

Pentru P2 toate elementele matricei au semn contrar (fiind un joc cu

sumă nulă). P2 se mai numeşte jucător minimizant. Vom nota jocul definit în

condiţiile de mai sus prin tripletul: G = (A, B, f).

Page 7: TEORIA JOCURILOR

Teoria jocurilor

Exemplu

În jocul numit „aruncarea monedei”, fiecare jucător alege liber stema

(S) sau valoarea (V). Dacă alegerile coincid, jucătorul P1 primeşte de la P2

un euro. Dacă alegerile diferă, P2 primeşte de la P1 un euro.

Atunci forma normală a jocului pentru P1 este:

P2P1

(S) (V)

(S) (V)

1 -1

-1 1

2.1 Jocuri cu punct şa

Fie un joc G = (A, B, f), cu matricea A = (aij), i = m,1 , j = n,1 .

Jucătorii sunt consideraţi la fel de competenţi. Ei aderă la un principiu de

comportare, născut din raţionalitate. Astfel, P1 va acţiona aşa încât cel mai

mic câştig asigurat pe care îl poate obţine de la P2 să fie cât mai mare, iar P2

urmăreşte să facă pe cât posibil mai mică, cea mai mare valoare pe care ar

trebui să o dea lui P1. Acest principiu poartă numele de principiul minimax.

Dacă P1 va alege strategia Ai ∈ A, se aşteaptă ca P2 să aleagă acea

strategie Bj ∈ B care să ofere un câştig cât mai mic pentru P1. Fie acesta

αi = nj1

min≤≤

aij, i = m,1 .

Dintre cele m strategii pure, P1 va alege acea strategie Ai care dă cea

mai mare valoare a lui αi. Notând:

α = i

max αi = i

maxj

min aij

α se va numi valoarea inferioară a jocului şi se mai notează Gv .

Page 8: TEORIA JOCURILOR

Modele matematice în economie

Strategia care asigură lui P1 un câştig egal cu Gv se numeşte

strategie maximin.

Dacă P2 alege strategia Bj ∈ B, se aşteaptă ca P1 să aleagă strategia

Ai ∈ A care îi asigură acestuia un câştig cât mai mare.

Fie

βj = mi1

max≤≤

aij, j = n,1 .

Dintre cele n strategii pure, P2 va alege acea strategie Bj care dă cel

mai mic câştig lui P1, adică cea care dă cea mai mică valoare lui βj. Notând

β = j

min βj = j

mini

max aij

β se va numi valoarea superioară a jocului şi se mai notează cu Gv .

Strategia care asigură lui P2 o pierdere egală cu Gv se numeşte

strategie minimax.

Exemplu

Fie jocul caracterizat de matricea:

B A B1 B2 B3 B4

A1 A2 A3

0 1 2

1 0 4

-2 3 -3

2 2 3

Dacă P1 alege strategia A1 vizând câştigul a14 = 2, P2 poate alege

strategia B3, obligându-l pe P1 la un câştig a13 = -2 (adică o pierdere); când

P1 alege A2, P2 poate răspunde cu B2 şi P1 câştigă a12 = 0, iar când P1 alege

A3, P2 poate alege strategia B3 şi P1 câştigă atunci a31 = -3.

Să determinăm valorile inferioară şi superioară ale jocului.

Calculând αi = 4j1

min≤≤

aij, i = 3,1 , obţinem:

α1 = min⎨0,1,-2,2⎬ = -2

Page 9: TEORIA JOCURILOR

Teoria jocurilor

α2 = min⎨1,0,3,2⎬ = 0

α3 = min⎨2,4,-3,3⎬ = -3

Valoarea inferioară a jocului este:

Gv = 3i1

max≤≤αi = max⎨-2,0,-3⎬ = 0 = α2.

Determinăm βj = 3i1

max≤≤

aij, j = 4,1 . Obţinem:

β1 = max⎨0,1,2⎬ = 2

β2 = max⎨1,0,4⎬ = 4

β3 = max⎨-2,3,-3⎬ = 3

β4 = max⎨2,3⎬ = 3.

Valoarea superioară a jocului este:

Gv = 4j1

min≤≤βj = min⎨2,4,3⎬ = 2 = β1.

De aici rezultă că strategia maximin este A2, iar strategia minimax

este B1.

Observaţie: Calculele de mai sus pot fi simplificate prin organizarea

lor într-un tabel obţinut din cel iniţial, la care se adaugă coloana elementelor

αi şi linia elementelor βj, astfel:

B A B1 B2 B3 B4 αi

A1 A2 A3

0 1 2

1 0 4

-2 3 -3

2 2 3

-2 0 -3

βj 2 4 3 3 02

Dacă într-un joc avem:

Gv = Gv = v

valoarea comună v se numeşte valoarea jocului. Elementul aij în care se

realizează această egalitate se numeşte punct şa, iar jocul respectiv se va

Page 10: TEORIA JOCURILOR

Modele matematice în economie

numi joc cu punct şa. Strategiile Ai şi Bj corespunzătoare punctului şa aij

formează o pereche de strategii minimax şi se vor numi strategii optime. Ele

determină valoarea jocului care este egală cu elementul corespunzător

punctului şa.

Exemplu

Fie jocul cu matricea:

B A B1 B2 B3 B4 αi

A1 A2 A3 A4

1 3 2 3

6 3 1 4

0 5 0 5

3 6 9 7

0 3 0 3

βj 3 6 5 9 α=3β=3

Observăm că α = Gv = 3 = Gv = β

Elementul a21 = 3 va fi punctul şa. Strategiile A2 şi B1 sunt strategii

optime, iar valoarea jocului este v = 3.

Observaţii:

1) Şi elementul a41 = 3 este punct şa, deci şi strategiile A4 şi B1 sunt

optime, iar valoarea jocului este tot v = 3. Deci punctul şa nu este

unic.

2) Abaterea de la strategia optimă poate duce la micşorarea

câştigului lui P1. De exemplu, dacă P1 alege A3 şi P2 îi răspunde

cu B3, câştigul său este a33 = 0, deci scade (tentaţia fiind aceea de

a obţine câştigul maxim, egal cu 9).

3) Elementul a21 = 3 este cel mai mic de pe linia şi cel mai mare de

pe coloana pe care se află. La fel a41 = 3. Aceasta justifică şi

denumirea de punct şa.

Page 11: TEORIA JOCURILOR

Teoria jocurilor

Exemplu

Fie jocul cu matricea:

B A B1 B2 B3 B4 B5

A1 A2 A3 A4

4 3 1 2

-1 -2 2 -6

2 0 0 3

1 -1 -1 1

3 2 -2 0

Observăm că strategia A1 are toate câştigurile respectiv mai mari ca

ale strategiei A2. Jucătorul P1 care doreşte un câştig cât mai mare nu va

alege A2, pentru că poate câştiga mai mult prin A1 oricare ar fi strategia

aleasă de P2. Spunem că strategia A1 domină strategia A2, care este

dominată. A2 poate fi eliminată din joc.

Pentru jucătorul P2, strategia B4 domină strategiile B1 şi B3, acestea

din urmă conducând la pierderi mai mari pentru P2 decât B4. Deci se poate

renunţa la B1 şi B3 şi matricea A se reduce la:

A = ⎟⎟⎟

⎜⎜⎜

−−−

016212

311.

În concluzie, o strategie pură domină o altă strategie pură dacă duce

la câştiguri mai bune decât aceasta din urmă. Un jucător nu trebuie să

folosească niciodată strategii dominate, acestea fiindu-i nefavorabile. Din

matricea A se elimină liniile care au toate elementele respectiv mai mici sau

egale cu ale altei linii şi coloanele ce au toate elementele respectiv mai mari

sau egale decât ale altei coloane. Acest principiu poartă numele de

principiul dominării strategiilor. Aplicarea lui conduce la reducerea

ordinului matricei A şi a volumului de calcule. Se poate demonstra că

Page 12: TEORIA JOCURILOR

Modele matematice în economie

eliminarea strategiilor dominate conduce la un joc care are aceeaşi valoare

ca şi jocul iniţial.

Să observăm că jocul „redus”, rezultat prin eliminarea strategiilor

dominate nu are punct şa, deci nici cel iniţial.

2.2 Jocuri fără punct şa

În jocurile fără punct şa, un jucător îşi poate majora câştigul folosind

altă strategie decât cea minimax dacă este informat asupra comportării

adversarului. Informaţii asupra comportamentului adversarului se pot obţine

prin repetarea partidelor, dacă acesta îşi menţine în toate partidele strategia

minimax. Un jucător nu trebuie să folosească mereu aceeaşi strategie şi nici

să folosească strategiile după o regulă ce poate fi descoperită de adversar.

Va fi necesară alternarea strategiilor pure, cu anumite probabilităţi.

În cele ce urmează vom vedea că, în cazul unui joc matriceal fără

punct şa, valoarea jocului o vom determina folosind un alt joc matriceal

asociat primului, numit joc mediat, notat Γ = (X, Y, ϕ), unde:

a) X = ⎨x ⎪ x = (x1, ..., xm), xi ≥ 0, i = m,1 , ∑=

m

1iix = 1⎬, cu

xi = P(Ai), i = m,1 reprezentând probabilitatea de alegere a

strategiei Ai, iar X este mulţimea strategiilor mixte pentru P1;

b) Y = ⎨y ⎪ y = (y1, ..., yn), yj ≥ 0, j = n,1 , ∑=

n

1jjy = 1⎬ unde

yj = P(Bj), j = n,1 , este probabilitatea de alegere a strategiei Bj,

iar Y mulţimea strategiilor mixte pentru P2;

Page 13: TEORIA JOCURILOR

Teoria jocurilor

c) ϕ: X × Y → ℝ, cu:

ϕ(x, y) = ∑∑= =

m

1i

n

1jjiij yxa dacă P1 foloseşte strategia mixtă

x = (x1, ..., xm), iar P2 foloseşte strategia mixtă y = (y1, ..., yn).

Dacă introducem variabila aleatoare:

(x, j): ⎟⎟⎠

⎞⎜⎜⎝

m21

mjj2j1

xxxaaa

L

L, valoarea medie a acesteia o notăm:

ϕ(x, j) = ∑=

m

1iiijxa şi reprezintă câştigul mediu realizat de P1 când

foloseşte strategia mixtă x = (x1, ..., xm), iar P2 foloseşte strategia pură Bj.

Analog, variabila aleatoare:

(i, y): ⎟⎟⎠

⎞⎜⎜⎝

n21

in2i1i

yyyaaa

L

L va avea valoarea medie:

ϕ(i, y) = ∑=

n

1jjijya şi reprezintă câştigul mediu realizat de P1 când

foloseşte strategia Ai iar P2 foloseşte strategia mixtă y = (y1, ..., yn).

Atunci, putem scrie că:

ϕ(x, y) = ∑∑ ∑ ∑= = = =

ϕ=ϕ=m

1i

n

1j

m

1i

n

1jjijiij )j,x(y)y,i(xyxa , de unde se vede

că ϕ(x, y) semnifică valoarea medie a jocului, care se mai scrie matriceal

astfel: ϕ(x, y) = xAyT.

Pentru jocul mediat Γ = (X, Y, ϕ), vom defini valoarea inferioară Γv

şi valoarea superioară Γv prin expresiile:

Γv = Xx

max∈ Yy

min∈

ϕ(x, y)

Γv = Yy

min∈ Xx

max∈

ϕ(x, y)

Page 14: TEORIA JOCURILOR

Modele matematice în economie

Prezentăm acum, cu sau fără demonstraţie, câteva rezultate din teoria

funcţiilor de mai multe variabile reale ce vor fundamenta principiile

matematice ale jocurilor matriceale.

Teorema 1

Fie X, Y două subspaţii ale unor spaţii liniare şi f: X × Y →ℝ. Dacă

există mărimile:

Xxmax∈ Yy

min∈

f(x, y) şi Yy

min∈ Xx

max∈

f(x, y), atunci

Xxmax∈ Yy

min∈

f(x, y) ≤Yy

min∈ Xx

max∈

f(x, y). (1)

Demonstraţie:

Notăm g(x) = Yy

min∈

f(x, y), (∀) x ∈ X şi h(y) = Xx

max∈

f(x, y), (∀) y ∈Y.

Din definiţia extremelor, avem:

g(x) ≤ f(x, y), (∀) y ∈Y şi (∀)x ∈ X

Atunci:

Xxmax∈

g(x) ≤ Xx

max∈

f(x, y) = h(y), (∀) y ∈Y, şi deci:

Xxmax∈

g(x) ≤ Yy

min∈

h(y).

Revenind la semnificaţiile lui g şi h, rezultă relaţia (1).

Consecinţă 1. Pentru orice joc matriceal G = (A, B, f) există Gv şi

Gv şi Gv ≤ Gv .

Demonstraţie:

Existenţa celor două valori, Gv şi Gv rezultă din faptul că f are o

mulţime finită de valori. Şi dacă în teorema 1 X = A, Y = B şi f (Ai, Bj) = aij

pentru orice Ai ∈ A şi Bj ∈ B, atunci relaţia (1) devine Gv ≤ Gv .

Page 15: TEORIA JOCURILOR

Teoria jocurilor

Teorema 2

În ipotezele teoremei 1, o condiţie necesară şi suficientă ca

Xxmax∈ Yy

min∈

f(x, y) =Yy

min∈ Xx

max∈

f(x, y). (2)

este să existe x0 ∈ X şi y0 ∈ Y şi un număr w ∈ ℝ astfel încât:

f(x, y0) ≤ w ≤ f(x0, y), pentru orice x ∈ X şi y ∈ Y. (3)

Demonstraţie:

Necesitatea: Presupunem relaţia (2) adevărată. Fie x0 ∈ X punctul

care maximizează expresia Yy

min∈

f(x, y) şi fie y0 ∈ Y punctul care

minimizează expresia Xx

max∈

f(x, y), adică:

Yymin∈

f(x0, y) = Xx

max∈ Yy

min∈

f(x, y)

Xxmax∈

f(x, y0) = Yy

min∈ Xx

max∈

f(x, y).

De aici şi din relaţia (2) rezultă că:

Yymin∈

f(x0, y) =Xx

max∈

f(x, y0) = w.

De unde, evident f(x0, y) ≥ w şi f(x, y0) ≤ w, (∀) x ∈ X şi (∀) y ∈ Y,

adică relaţia (3).

Suficienţa: Presupunem că există x0 ∈ X, y0 ∈ Y şi w ∈ℝ astfel

încât relaţia (3) să fie adevărată.

Din f(x0, y) ≥ w, (∀) y ∈ Y, rezultă că şi Yy

min∈

f(x0, y) ≥ w.

Analog, din f(x, y0) ≤ w, (∀) x ∈ X, rezultă că şi Xx

max∈

f(x, y0) ≤ w,

deci Xx

max∈

f(x, y0) ≤ w ≤ Yy

min∈

f(x0, y), (∀) x ∈ X, (∀) y ∈ Y.

Dar Yy

min∈ Xx

max∈

f(x, y) ≤Xx

max∈

f(x, y0) ≤ w

Page 16: TEORIA JOCURILOR

Modele matematice în economie

Xxmax∈ Yy

min∈

f(x, y) ≥ Yy

min∈

f(x0, y) ≥ w

şi de aici, în baza tranzitivităţii relaţiei „≤”, rezultă că:

Yymin∈ Xx

max∈

f(x, y) ≤ Xx

max∈ Yy

min∈

f(x, y).

Această relaţie, împreună cu relaţia (1), implică

w = Xx

max∈ Yy

min∈

f(x,y) = Yy

min∈ Xx

max∈

f(x,y), fapt ce încheie demonstraţia.

Definiţie: Fie f: X × Y →ℝ. Punctul (x0, y0) ∈ X × Y este punct şa

pentru f dacă:

f(x, y0) ≤ f(x0, y0) ≤ f(x0, y), (∀) x ∈ X şi (∀) y ∈ Y.

Consecinţă 2: Dacă G = (A, B, fG) este un joc matriceal m × n, atunci

o condiţie necesară şi suficientă ca Gv = Gv = w este ca fG să admită un

punct şa.

Demonstraţie:

Se aplică teorema 2, în care X = A, Y = B, fG(Ai, Bj) = aij, i = m,1 ,

j = n,1 , luând w = fG(Aio, Bj0).

Condiţia necesară şi suficientă de existenţă a punctului şa este să

existe perechea de strategii pure Aio, Bjo astfel încât:

aiojo = i

maxj

min aij = j

mini

max aij

adică elementul aiojo este cel mai mic din linia i0 şi în acelaşi timp cel mai

mare din coloana j0.

Strategiile A0i şi B

0jcorespunzătoare punctului şa sunt strategii

optime.

Page 17: TEORIA JOCURILOR

Teoria jocurilor

Teorema 3. (teorema fundamentală de minimax)

Fie un joc G = (A, B, f) de două persoane, caracterizat de matricea

jocului A = (aij), i = m,1 , j = n,1 şi fie Γ = (X, Y, ϕ) jocul mediat

corespunzător. Atunci există expresiile:

Γv = Xx

max∈ Yy

min∈

ϕ(x, y) şi Γv = Yy

min∈ Xx

max∈

ϕ(x, y) şi Γv = Γv .

Demonstraţie:

Să demonstrăm existenţa valorilor Γv şi Γv .

Pentru orice y = (y1, ..., yn) ∈ Y funcţia

ϕ(x, y) = ∑∑= =

m

1i

n

1jjiij yxa este funcţie de x = (x1, ..., xm) ∈X,

continuă şi liniară. Într-adevăr:

ϕ(x, y) = ∑∑==

++n

1jjmj

n

1jmjj11 yax...yax , deci este mărginită şi îşi atinge

marginile pe X.

Deci există Xx

max∈

ϕ(x, y) pentru orice y ∈Y, iar această funcţie este

liniară în y ∈ Y, deci este şi continuă. Cum Y este o parte închisă a lui ℝn,

rezultă că există Xx

max∈ Yy

min∈

ϕ(x, y).

Analog se arată că există Yy

min∈ Xx

max∈

ϕ(x, y) şi existenţa e demonstrată.

Din teorema 1, relaţia (1) putem scrie că

Xxmax∈ Yy

min∈

ϕ(x, y) ≤ Yy

min∈ Xx

max∈

ϕ(x, y) (4)

adică Γv ≤ Γv .

Page 18: TEORIA JOCURILOR

Modele matematice în economie

Pentru demonstrarea inegalităţii inverse dăm, fără demonstraţie:

Lema 1 (lema fundamentală a dualităţii):

Dacă A = (aij), i = m,1 , j = n,1 şi x = (x1, ..., xm), y = (y1, ..., yn)

îndeplinesc condiţiile:

xi ≥ 0, ∑=

m

1iix = 1, yj ≥ 0, ∑

=

n

1jjy = 1, atunci există o pereche de

asemenea vectori x, y pentru care numai una din următoarele situaţii este

adevărată:

i) ∑=

m

1iiijxa ≥ 0, j = n,1 ;

ii) ∑=

n

1jjijya ≤ 0, i = m,1 .

Aplicând această lemă pentru matricea jocului A, dacă are loc prima

situaţie (i), înseamnă că există x = (x1, ..., xm) astfel încât a1jx1 +...+amjxm ≥0,

(∀) j = n,1 , de unde:

ϕ(x, y) = ∑=

++n

1jjmmj1j1 y)xa...xa( ≥ 0, (∀) y ∈ Y, deci

Yymin∈

ϕ(x, y)≥0, de unde rezultă că şi Xx

max∈ Yy

min∈

ϕ(x, y)≥0.

Dacă situaţia (ii) din lemă este adevărată, există y = (y1, ..., yn) ∈ Y

astfel încât

ai1y1 + ... + ainyn ≤ 0, i = m,1 , de unde:

ϕ(x, y) = ∑=

++m

1iinin11i x)ya...ya( ≤ 0, (∀) x ∈ X, deci şi

Xxmax∈

ϕ(x, y) ≤ 0, de unde rezultă că şi Yy

min∈ Xx

max∈

ϕ(x, y) ≤ 0.

Page 19: TEORIA JOCURILOR

Teoria jocurilor

Cum numai una dintre cele două situaţii din lemă are loc, niciodată

nu se va verifica relaţia

Xxmax∈ Yy

min∈

ϕ(x, y) < 0 < Yy

min∈ Xx

max∈

ϕ(x, y) (5)

Fie Gk = (A, B, fk) având matricea Ak = (aij – k); i = m,1 , j = n,1 ,

k ∈ℝ şi jocul mediat corespunzător Γk = (X, Y, ϕk), ϕk fiind câştigul mediu

în jocul mediat cu matricea Ak, adică:

ϕk(x, y) = ∑ ∑∑∑∑∑= = === =

−=−m

1i

m

1i

n

1jji

n

1jjiij

m

1i

n

1jjiij yxkyxayx)ka( .

Cum ∑∑i j

ji yx = 1, obţinem:

ϕk(x, y) = ϕ(x, y) – k (6)

Pentru jocul Γk, rezultă din (5) că nu poate avea loc inegalitatea:

Xxmax∈ Yy

min∈

ϕk(x, y) < 0 < Yy

min∈ Xx

max∈

ϕk(x, y)

sau ţinând seama de (6) nu poate avea loc relaţia

Xxmax∈ Yy

min∈

ϕ(x, y) – k < 0 < Yy

min∈ Xx

max∈

ϕ(x, y) – k

care se mai scrie:

Xxmax∈ Yy

min∈

ϕ (x, y) < k < Yy

min∈ Xx

max∈

ϕ(x, y), (∀) k ∈ℝ.

Negarea acestei ultime relaţii implică:

Xxmax∈ Yy

min∈

ϕ(x, y) ≥Yy

min∈ Xx

max∈

ϕ(x, y) sau

Γv ≥ Γv , care, împreună cu (4), dau Γv = Γv .

Definiţie. Valoarea unui joc matriceal G = (A, B, f) cu f(A × B) = A,

A = (aij), i = m,1 , j = n,1 fără punct şa este dată de valoarea Γv = Γv = v a

jocului mediat Γ = (X, Y, ϕ) asociat lui.

Page 20: TEORIA JOCURILOR

Modele matematice în economie

Consecinţă 3: Orice joc matriceal mediat are o valoare şi deci şi o

soluţie. În mulţimea strategiilor X şi Y există cel puţin o pereche de strategii

mixte x0, y0 pentru care:

ϕ(x0, y0) = Xx

max∈ Yy

min∈

ϕ(x, y) =Yy

min∈ Xx

max∈

ϕ(x, y).

Teorema 4 [6]

Dacă G = (A, B, f) şi Γ(X, Y, ϕ) jocul mediat asociat, atunci:

Gv ≤ Γv ≤ Γv ≤ Gv

Teorema 5 [6]

Asupra matricei A = (aij) a unui joc se pot efectua următoarele

operaţii:

a) dacă se permută liniile (coloanele) între ele, valoarea jocului nu se

schimbă şi nici probabilităţile de folosire a strategiilor de către

jucătorul P1 (respectiv P2);

b) dacă la fiecare element aij din matricea A a unui joc matriceal de

valoare v se adaugă acelaşi număr real k, atunci strategiile mixte

optime rămân neschimbate, iar valoarea jocului devine v’ = v + k;

c) dacă toate elementele matricei A dintr-un joc matriceal de valoare

v se înmulţesc cu acelaşi număr k > 0, atunci strategiile mixte

optime rămân neschimbate, iar valoarea jocului devine v’ = kv.

2.3 Rezolvarea jocurilor matriceale

Teorema 3 (teorema minimax) asigură existenţa strategiilor optime

în jocuri de două persoane cu sumă nulă. Ne preocupă să găsim modul cum

Page 21: TEORIA JOCURILOR

Teoria jocurilor

pot fi calculate aceste strategii. În cele ce urmează, vom prezenta câteva

metode pentru soluţia unor jocuri matriceale.

2.3.a Jocuri 2 × 2

Considerăm jocul matriceal cu:

A = ⎟⎟⎠

⎞⎜⎜⎝

2221

1211

aaaa

.

Dacă jocul are punct şa, rezolvarea sa e banală. Presupunem că jocul

nu are punct şa. Atunci strategiile optime x = (x1, x2) şi y = (y1, y2) vor avea

toate componentele pozitive. Valoarea jocului v este:

v = ϕ(x, y) = a11x1y1 + a12x1y2 + a21x2y1 + a22x2y2

şi se mai scrie:

x1(a11y1 + a12y2) + x2(a21y1 + a22y2) = v (7)

Cum y este strategie optimă, fiecare expresie din paranteze este cel

mult egală cu v. Dacă presupunem că una e strict mai mică decât v, de

exemplu:

a11y1 + a12y2 < v

a21y1 + a22y2 ≤ v

cum x1 > 0 şi x1 + x2 = 1 ar rezulta că membrul stâng din (7) este mai mic ca

v. Deci va trebui ca:

a11y1 + a12y2 = v

a21y1 + a22y2 = v.

Raţionând analog se obţine:

a11x1 + a21x2 = v

a12x1 + a22x2 = v.

Page 22: TEORIA JOCURILOR

Modele matematice în economie

Sau matriceal:

AyT ⎟⎟⎠

⎞⎜⎜⎝

⎛=

vv

şi xA = (v, v). (8)

Notând J = (1, 1) şi ţinând seama că x1 + x2 = 1 şi y1 + y2 = 1, găsim

formulele de calcul pentru x, y şi v.

Dacă A este nesingulară, din (8) avem:

xA = vJ şi x = vJA-1. (8’)

Dar x1 + x = 1 este echivalentă cu xJT = 1.

În (8’), înmulţind cu JT, avem:

vJA-1JT = xJT = 1 de unde:

v = T1JJA1− .

Atunci, din (8’) vom avea:

x = T1

1

JJAJA

.

Prima relaţie din (8) se mai scrie: AyT = vJT, de unde:

yT = A-1(vJT) = T1

T1

JJAJA

.

Dacă A este singulară (A-1 nu există), echivalentele formulelor de

mai sus vor fi ([16]):

TT

TT

T J*JA|A|v;

J*JAJ*Ay;

J*JA*JAx === , (9)

unde A* este matricea adjunctă a lui A, ⎪A⎪ determinantul lui A şi J = (1,1).

Aceste formule se verifică şi când A este inversabilă.

Page 23: TEORIA JOCURILOR

Teoria jocurilor

Exemplu

Să se determine soluţia jocului matriceal:

A = ⎟⎟⎠

⎞⎜⎜⎝

⎛3012

.

Rezolvare

Jocul nu are punct şa. Matricea A* = ⎟⎟⎠

⎞⎜⎜⎝

⎛ −2013

, ⎪A⎪ = 6,

JA* = (1,1) ⎟⎟⎠

⎞⎜⎜⎝

⎛ −2013

= (3, 1); A*JT = ⎟⎟⎠

⎞⎜⎜⎝

⎛ −2013

=⎟⎟⎠

⎞⎜⎜⎝

⎛11

⎟⎟⎠

⎞⎜⎜⎝

⎛22

;

JA*JT = (1, 1) ⎟⎟⎠

⎞⎜⎜⎝

⎛22

= 4.

Introducând rezultatele obţinute în (9) avem:

x = ⎟⎠⎞

⎜⎝⎛

41,

43 , y = ⎟

⎠⎞

⎜⎝⎛

21,

21 , v =

23 .

Observaţie: Metoda de mai sus poate fi aplicată în rezolvarea

matriceală a jocurilor, în care dacă notăm matricea câştigurilor cu C = (cij), i

= m,1 , j = n,1 , pentru jocul Γ = (X, Y, f), soluţia şi valoarea jocului se

determină ([9], [21]) cu ajutorul formulelor:

Trr

Tr

*r

Tr

Trr

r

J*AJ|A|v,

JAJ*)A(Jy,

J*AJ*AJx === (9’)

În relaţiile (9’) avem:

- A o matrice nesingulară a lui C, de ordinul r, 2 ≤ r ≤ min(m, n);

- ⎪A⎪ este determinantul matricei A;

- Jr = (1, ..., 1), matrice de ordinul 1 × r;

Page 24: TEORIA JOCURILOR

Modele matematice în economie

Determinarea soluţiei se face astfel:

a) se caută toate submatricele nesingulare A, pornind de la

r = min(m,n);

b) se rezolvă jocurile corespunzătoare matricelor de la a), care

admit numai strategii pozitive;

c) în x şi y se completează cu zerouri componentele

corespunzătoare liniilor şi coloanelor din C care nu intră în A,

obţinând strategiile x0 şi y0;

d) se verifică condiţiile corespunzătoare relaţiilor (8), date de

criteriul Neumann şi anume x0A = vJ şi AyT = vJT.

Dacă aceste relaţii sunt îndeplinite x0 şi y0 sunt strategii optime ale

jocului Γ, iar v este valoarea jocului.

2.3.b Jocuri 2 × n şi m × 2

În acest caz presupunem că cel puţin un jucător posedă numai două

strategii pure. Fie P1 jucătorul ce are numai două strategii pure, adică

analizăm cazul 2 × n. Jocurile m × 2 se tratează într-un mod similar.

Dacă matricea jocului este:

A = ⎟⎟⎠

⎞⎜⎜⎝

n221

n111

a...aa...a

şi x = (x1, x2) e strategia jucătorului P1, atunci acesta urmăreşte să

maximizeze funcţia v(x) – valoarea jocului.

Page 25: TEORIA JOCURILOR

Teoria jocurilor

Modelul matematic al jocului pentru P1 este:

a11x1 + a21x2 ≥ v

a1nx1 + a2nx2 ≥ v

x1 + x2 = 1

x1, x2 ≥ 0

şi poate fi adus la forma matematică a unui model de programare liniară

având necunoscutele x1, x2 şi v, astfel:

[max]f = v

a11x1 + a21x2 – v ≥ 0

a1nx1 + a2nx2 – v ≥ 0

x1 + x2 = 1

x1, x2 ≥ 0, v – oarecare.

Exemplu

Să se determine strategia optimă a jucătorului P1 în jocul definit de

matricea:

A = ⎟⎟⎠

⎞⎜⎜⎝

⎛−

−−1668

442.

Rezolvare

Strategiile lui P1 verifică sistemul:

-2x1 + 8x2 ≥ v

4x1 – 6x2 ≥ v

-4x1 + 16x2 ≥ v

x1 +x2 = 1

x1, x2 ≥ 0, v – oarecare.

Page 26: TEORIA JOCURILOR

Modele matematice în economie

Forma matematică a modelului de programare liniară în

necunoscutele x1, x2 şi v va fi:

[max]f = v

-2x1 + 8x2 – v ≥ 0

4x1 – 6x2 – v ≥ 0

-4x1 + 16x2 – v ≥ 0

x1 +x2 = 1

x1, x2 ≥ 0, v – oarecare.

Cum x1 = 1 – x2, x1, x2 ∈ [0,1], modelul de mai sus devine:

[max]f = v

10x2 – v ≥ 2

10x2 + v ≤ 4

20x2 – v ≥ 4

x2 ∈ [0,1], v – oarecare.

Rezolvăm grafic această problemă şi obţinem:

v

4

2

1 M(0,3; 1)

0 1 x2

-1

-2

-4

v =

-4+2

0x2

v =

-2+1

0x2

v = 4-10x2

Page 27: TEORIA JOCURILOR

Teoria jocurilor

Regiunea haşurată conţine mulţimea punctelor ce satisfac restricţiile

modelului de programare liniară. Punctul M aflat la intersecţia dreptelor

generate de restricţiile 1 şi 2 (deci corespunzătoare coloanelor 1 şi 2 din A)

are abcisa x2 = 0, 3 şi ordonata v = 1. Atunci strategia lui P1 este x = (x1, x2),

unde x2 = 0, 3 şi x1 = 1 – x2 = 0,7 şi valoarea jocului este v = 1.

Observaţie: Aceste valori pot fi obţinute cu formulele (9) pentru

jocul matriceal 2 × 2 format din coloanele 1 şi 2 ale matricei A. Fie

A0 = ⎟⎟⎠

⎞⎜⎜⎝

⎛−

−68

42. Într-adevăr,

⎟⎟⎠

⎞⎜⎜⎝

⎛−−−−

=2846

A*0 , ⎪A0⎪ = - 20, ⎟⎟

⎞⎜⎜⎝

⎛−−−−

=2846

)1,1(JA*0 = (-14, -6).

⎟⎟⎠

⎞⎜⎜⎝

⎛−−

=⎟⎟⎠

⎞⎜⎜⎝

⎛⎟⎟⎠

⎞⎜⎜⎝

⎛−−−−

=1010

11

2846

JA T*0 ; JA *

0 JT = (1,1) ⎟⎟⎠

⎞⎜⎜⎝

⎛−−

1010

= - 20.

x = 201

JJAJA

T*0

*0 −= (-14, -6) = (0,7; 0,3).

v = 2020

JJA|A|T*

0

0

−−

= = 1.

yT = ⎟⎟⎠

⎞⎜⎜⎝

⎛=⎟⎟

⎞⎜⎜⎝

⎛−−

−=5,05,0

1010

201

JJAJA

T*0

T*0 de unde y = (0,5; 0,5; 0).

Am obţinut astfel şi strategia optimă a lui P2.

2.3.c Rezolvarea jocurilor matriciale prin programare liniară

Fie jocul G = (A, B, f) cu matricea A = (aij), i = m,1 , j = n,1 de

valoare v, având jocul mediat corespunzător Γ = (X, Y, ϕ).

Page 28: TEORIA JOCURILOR

Modele matematice în economie

Dacă jucătorul P1 foloseşte strategiile Ai, cu probabilităţile xi,

i = m,1 , poate spera la un câştig egal cel puţin cu valoarea v a jocului,

pentru orice strategie Bj, j = n,1 , a lui P2.

Putem scrie sistemul de inecuaţii:

a11x1 + ... + am1xm ≥ v

a12x1 + ... + am2xm ≥ v

(I) ∶

a1nx1 + ... + amnxm ≥ v

x1 + ... + xm = 1

xi ≥ 0; i = m,1 .

Dacă jucătorul P2 foloseşte strategiile Bj cu probabilităţile yj, j = n,1 ,

el se aşteaptă la o pierdere cel mult egală cu valoarea v a jocului şi putem

scrie sistemul de inecuaţii:

a11y1 + ... + a1nyn ≤ v

a21y1 + ... + a2nyn ≤ v

(II) ∶

am1y1 + ... + amnyn ≤ v

y1 + ... + yn = 1

yj ≥ 0; j = n,1 .

Sistemul (I) corespunde condiţiei ϕ(x, j) ≥ v, j = n,1 , iar sistemul (II)

corespunde condiţiei ϕ(i, y) ≤ v pe care trebuie să le verifice strategiile

x = (x1, ..., xm) şi y = (y1, ..., yn) pentru a fi optime.

Page 29: TEORIA JOCURILOR

Teoria jocurilor

Pentru a transforma cele două sisteme în modele de programare

liniară este necesar ca valoarea v a jocului să fie pozitivă. Deci vom

presupune v > 0 (în caz contrar se face modificarea matricei A în A = ( ija )

cu ija = aij + k > 0, (∀)i = m,1 , j = n,1 şi k > 0.

Notăm Xi = vxi , i = m,1 , Yj =

vy j , j = n,1 .

Condiţiile ca xi şi respectiv yj să fie probabilităţi, devin:

X1 + ...+ Xm = v1

Y1 + ...+ Yn = v1

Deoarece jucătorul P1 urmăreşte obţinerea celei mai mari valori a

câştigului v, deci a celei mai mici valori a lui v1 , el îşi propune să obţină

minf = X1 + ... + Xm.

Jucătorul P2 urmăreşte obţinerea celei mai mici pierderi v, adică cea

mai mare valoare a lui v1 , deci îşi propune să obţină maxg = Y1 + ...+ Yn.

Astfel sistemele (I) şi (II) corespunzătoare celor doi jucători se pot

scrie ca un cuplu de probleme duale de programare liniară şi anume:

[min]f = v1 = X1 + ...+ Xm

a11X1 + ... + am1Xm ≥ 1

(I) ∶

a1nX1 + ... + amnXm ≥ 1

Xi ≥ 0, i = m,1

Page 30: TEORIA JOCURILOR

Modele matematice în economie

[max]g = v1 = Y1 + ...+ Yn

a11Y1 + ... + a1nYn ≤ 1

(II) ∶

am1Y1 + ... + amnYn ≤ 1

Yj ≥ 0, j = n,1

Prin rezolvarea uneia dintre cele două duale se obţin strategiile mixte

optime ale ambilor jucători precum şi valoarea jocului v:

g[max]1

f[min]1v == .

Este de preferat rezolvarea lui II deoarece implică un volum mai mic

de calcule.

Exemplu

O firmă A doreşte să lanseze pe piaţă un anumit tip de produs în trei

sortimente A1, A2, A3. Concurenta ei, firma B, prezintă produsul în

sortimentele B1, B2, B3. Se cunoaşte, din sondajele făcute că dacă

cumpărătorii trebuie să aleagă între sortimentul Ai, i = 3,1 şi Bj, j = 3,1 , ei

preferă fie produsele firmei A (situaţie notată cu 1), fie pe cele ale firmei B

(situaţie notată cu -1), fie sunt indiferenţi (situaţie notată cu 0), conform

tabelului următor:

BjAi

B1 B2 B3

A1 A2 A3

1 -1 0

-1 1 1

0 -1 1

Să se determine strategia firmei A în faţa concurentei B.

Page 31: TEORIA JOCURILOR

Teoria jocurilor

Rezolvare

Fie x1, x2, x3 probabilităţile corespunzătoare celor 3 strategii pure ale

firmei A şi y1, y2, y3 probabilităţile corespunzătoare strategiilor firmei B.

Determinăm valoarea inferioară α şi valoarea superioară β a jocului.

yx y1 y2 y3 αi

x1 x2 x3

1 -1 0

-1 1 1

0 -1 1

-1 -1 0

βj 1 1

1 01

α = max αi = 0 este valoarea inferioară a jocului şi

β = min βj = 1 este valoarea superioară a jocului.

Deci jocul nu are punct şa, iar valoarea v a jocului are proprietatea că

0 ≤ v ≤ 1.

Modelele duale de programare liniară vor fi:

x1 + x2 + x3 =1

x1 – x2 ≥ v

(I) -x1 + x2 + x3 ≥ v

-x2 + x3 ≥ v

xi ≥ 0, i = 3,1

sau cu notaţiile Xi = vxi , i = 3,1 şi [min]f =

v1

Page 32: TEORIA JOCURILOR

Modele matematice în economie

[min]f = v1 = X1 + X2 + X3

X1 – X2 ≥ 1

(I) -X1 + X2 + X3 ≥ 1

-X2 + X3 ≥ 1

Xi ≥ 0, i = 3,1

pentru firma A, iar pentru firma B:

y1 + y2 + y3 =1

y1 – y2 ≤ v

(II) -y1 + y2 - y3 ≤ v

y2 + y3 ≤ v

yj ≥ 0, j = 3,1

Cu notaţiile Yj = vy j , j = 3,1 şi [max]g =

v1 , avem:

[max]g = v1 = Y1 + Y2 + Y3

Y1 – Y2 ≤ 1

(II) -Y1 + Y2 - Y3 ≤ 1

Y2 + Y3 ≤ 1

Yj ≥ 0, j = 3,1

Se rezolvă prin algoritmul simplex al doilea model, aducând

problema la forma standard.

Page 33: TEORIA JOCURILOR

Teoria jocurilor

Y1 – Y2 + Y4 = 1

-Y1 + Y2 – Y3 + Y5 = 1

Y2 + Y3 + Y6 = 1

Yj ≥ 0, j = 6,1

[max]g = v1 = Y1 + Y2 + Y3 + 0(Y4 + Y5 + Y6)

1 1 1 0 0 0 B CB YB a1 a2 a3 a4 a5 a6 θ

←a4 a5 a6

0 0 0

1 1 1

1 ↓ -1 0

-1 1 1

0 -1 1

1 0 0

0 1 0

0 0 1

1 - -

gj 0 0 0 0 0 0 0 ∆j = cj - gj 1 1 1 0 0 0

a1 a5 ←a6

1 0 0

1 2 1

1 0 0

-1 ↓ 0 1

0 -1 1

1 1 0

0 1 0

0 0 1

- - 1

gj 1 1 -1 0 1 0 0 ∆j = cj - gj 0 2 1 -1 0 0

a1 a5 a2

1 0 1

2 2 1

1 0 0

0 0 1

1 -1 1

1 1 0

0 1 0

1 0 1

gj 3 1 1 2 1 0 2 ∆j = cj - gj 0 0 -1 -1 0 -2

[max]g = 3 = [min]f

Y1 = 2, Y2 = 1, Y3 = 0

X1 = 1, X2 = 0, X3 = 2

Atunci v = 31

g[max]1

= .

y1 = vY1 = 31 ⋅ 2 =

32 , y2 = vY2 =

31 ⋅ 1 =

31 , y3 = vY3 =

31 ⋅ 0 = 0

x1 = vX1 = 31 ⋅ 1 =

31 , x2 = vX2 =

31 ⋅ 0 = 0, x3 = vX3 =

31 ⋅ 2 =

32 .

Firma A va avea strategia mixtă

Page 34: TEORIA JOCURILOR

Modele matematice în economie

x = (31 , 0,

32 ), adică va trebui să producă 33, 33% produse din

primul sortiment iar restul 66,66% din al treilea sortiment. Acest plan de

producţie îi asigură firmei A un câştig, fără nici un risc, de 31 în vreme ce

concurenta ei, firma B, va avea o pierdere de 31 .

În concluzie, în rezolvarea unui joc matricial se parcurg următorii

paşi:

Pasul 1. Se determină valoarea inferioară α şi valoarea superioară β

a jocului:

- dacă α = β, jocul are punct şa, se determină strategiile

pure şi valoarea jocului;

- dacă α < β, jocul nu are punct şa; vor trebui determinate

strategiile mixte optime şi valoarea jocului.

Pasul 2. Se elimină strategiile dominate.

Pasul 3. Ne asigurăm ca valoarea v a jocului să fie un număr pozitiv,

ştiind că v ∈ [α, β].

Pasul 4. Scriem modelul de programare liniară pentru jucătorul P2 şi

rezolvăm prin algoritmul simplex problema din care citim

[max]g, Y1,...,Yn şi X1, ..., Xm.

Pasul 5. Determinăm: v = g[max]

1 , xi = vXi, i = m,1 şi yj = vYj,

j = n,1 , adică soluţia optimă a problemei.

Observaţie: Dacă matricea jocului este de forma 2 × 2 sau 2 × n, în

pasul 3 putem alege şi alte metode în afara algoritmului simplex, cum ar fi

cele prezentate la 2.3.a şi 2.3.b.

Page 35: TEORIA JOCURILOR

Teoria jocurilor

3. Jocuri contra naturii

Până acum ne-am ocupat de jocuri în care alegerea strategiilor era

determinată de matricea A a câştigurilor primului jucător P1. Sunt situaţii în

care riscurile cu care se iau hotărâri nu pot fi cunoscute, deoarece jucătorul

P2 nu acţionează raţional. Un astfel de jucător poate fi considerată natura, de

unde şi denumirea de jocuri contra naturii. De analiza unor astfel de situaţii

se ocupă teoria deciziilor.

În cele ce urmează vom prezenta unele criterii de alegere a deciziei

jucătorului P1 (numit şi statistician) în jocurile contra naturii (numite şi

jocuri în caz de incertitudine). Menţionăm că atitudinea faţă de joc, diferită

de la o persoană la alta, face ca în teoria deciziilor să nu existe criterii

universal valabile. Aplicarea criteriilor poate conduce la rezultate diferite.

Alegerea strategiei ar putea fi dată de rezultatul aplicării mai multor criterii.

Vom presupune că statisticianul – jucătorul P1, dispune de m

strategii pure A1, ..., Am, iar natura are n stări B1, ..., Bn.

Fie matricea A = (aij), i = m,1 , j = n,1 , unde aij este câştigul lui P1

când alege strategia Ai, iar natura se află în starea Bj.

Criteriul lui Hurwicz (criteriul optimismului)

Optimismul jucătorului P1 se defineşte ca un număr α ∈ [0,1]. Se

determină numerele reale:

mi = j

min ⎨aij⎬ şi Mi = j

max ⎨aij⎬, i = m,1 .

Fiecărei strategii Ai îi asociem expresia:

αMi + (1 - α)mi, i = m,1 .

Page 36: TEORIA JOCURILOR

Modele matematice în economie

Strategia optimă va fi cea care corespunde la:

imax [αMi + (1 - α)mi]

În folosirea acestui criteriu trebuie să se definească în prealabil

optimismul jucătorului, adică numărul α ∈ [0, 1].

Exemplu

Se consideră jocul contra naturii a cărui matrice a câştigurilor lui P1

în orice strategie a sa Ai, i = 4,1 şi în orice stare Bj, j = 4,1 a naturii este:

B1 B2 B3 B4 A1A2A3A4

2 3 1 3

4 2 5 3

3 3 2 2

3 2 1 3

Să se determine în funcţie de α strategia optimă a lui P1.

Pentru α = 32 care este strategia optimă?

Rezolvare

Ataşăm matricei date coloanele elementelor: mi, Mi şi

αMi + (1 - α)mi, unde mi este respectiv cel mai mic, iar Mi este cel mai mare

număr de pe linia respectivă. Obţinem astfel:

B1 B2 B3 B4 mi Mi αMi+(1-α)mi

A1 A2 A3 A4

2 3 1 3

4 2 5 3

3 3 2 2

3 2 1 3

2 2 1 2

4 3 5 3

2α+2 α+2 4α+1 α+2

Page 37: TEORIA JOCURILOR

Teoria jocurilor

Ca să determinăm i

max [αMi + (1 - α)mi], ştiind că α ∈ [0,1],

observăm că α + 2 ≤ 2α + 2, (∀)α ∈ [0,1]. Merită studiate cazurile:

a) 4α + 1 < α + 2, de unde α < 31 ;

b) α + 2 ≤ 4α + 1 < 2α + 2, de unde 31 ≤ α <

21 ;

c) 2α + 2 ≤ 4α + 1, de unde α ≥ 21 .

Deci pentru α ∈ [0, 31 ), 2α + 2 este cea mai mare valoare şi cum ea

corespunde strategiei A1, aceasta este strategia optimă.

Pentru α ∈ [31 ,

21 ), tot 2α + 2 este valoarea maximă deci A1 e

strategie optimă.

Pentru α ∈ [21 , 1], 4α + 1 e valoarea maximă şi A3 este strategia

optimă.

În particular α = 32 ∈ [

21 , 1], deci A3 este strategia optimă.

Criteriul Bayes - Laplace

În cazul acestui criteriu se va presupune că stările naturii sunt egal

probabile. Şi cum numărul lor este n, probabilitatea ca natura să se afle în

starea Bj este n1 , (∀) j = n,1 .

Page 38: TEORIA JOCURILOR

Modele matematice în economie

Dacă jucătorul P1 va alege strategia Ai, câştigul său va fi

n1 ∑

=

n

1jija , care este valoarea medie a variabilei aleatoare

discrete cu repartiţia:

⎟⎟

⎜⎜

n1

n1

n1

aaa in2i1i

L

L.

P1 va alege strategia pentru care câştigul său mediu este maxim:

⎭⎬⎫

⎩⎨⎧∑=≤≤

n

1jijmi1

an1max .

Observaţia 1:

Dacă se cunosc totuşi probabilităţile diferitelor stări ale naturii

respectiv y1, ..., yn, deci strategia y = (y1, ..., yn) cu yj ≥ 0, j = n,1 şi

∑=

n

1jjy =1, câştigul mediu al statisticianului P1 când foloseşte strategia Ai va

fi, conform formulei din paragraful 2.2:

ϕ(i, y) = ∑=

n

1jjijya , iar câştigul mediu va fi maxim pentru strategia

corespunzătoare valorii:

mi1max

≤≤ϕ(i, y).

Observaţia 2:

Criteriul lui Laplace introduce toate neajunsurile valorii medii. Dacă

estimările au fost făcute grosolan apar erori în apreciere, ce vor duce la

decizii greşite. Criteriul devine uneori inacceptabil când elementele jocului

sunt foarte dispersate.

Page 39: TEORIA JOCURILOR

Teoria jocurilor

Exemplu

Pentru jocul din exemplul precedent să se determine strategia optimă

a lui P1 în cazurile:

a) când stările naturii sunt egal probabile;

b) când probabilităţile ca natura să se afle în stările ei sunt

respectiv:

92,

94,

92,

91 .

Rezolvare

a) Ataşăm matricei jocului coloana ∑=

4

1jija

n1 :

B1 B2 B3 B4 ∑=

4

1jija

n1

A1 A2 A3 A4

2 3 1 3

4 2 5 3

3 3 2 2

3 2 1 3

41⋅12

41⋅10

41⋅9

41⋅11

Deci 4i1

max≤≤⎨ ∑

=

4

1jija

41

⎬ este 41⋅12 ce corespunde strategiei A1 deci

aceasta este strategia optimă, după criteriul Laplace.

b) Calculăm pentru fiecare strategie Ai valoarea expresiei date de

ϕ(i, y), i = 4,1 . Obţinem:

ϕ(1, y) = 91⋅2 +

92⋅4 +

94⋅ 3 +

92⋅3 =

91⋅28;

Page 40: TEORIA JOCURILOR

Modele matematice în economie

ϕ(2, y) = 91⋅3 +

92⋅2 +

94⋅ 3 +

92⋅2 =

91⋅23;

ϕ(3, y) = 91⋅1 +

92⋅5 +

94⋅ 2 +

92⋅1 =

91⋅21;

ϕ(4, y) = 91⋅3 +

92⋅3 +

94⋅ 2 +

92⋅3 =

91⋅23.

Cea mai mare valoare este 91⋅ 28 şi corespunde lui ϕ(1, y), deci A1

este strategia optimă.

Criteriul lui Savage (criteriul regretelor)

Savage compară rezultatul deciziei în cazul necunoaşterii stării

naturii cu cel care s-ar obţine dacă s-ar cunoaşte această stare. Diferenţa

dintre câştigul realizat când se ia decizia fără a cunoaşte stările naturii şi cel

realizat dacă se cunosc acestea reprezintă regretul sau ce s-ar fi câştigat dacă

P1 ar fi cunoscut stările naturii.

Pornind de la matricea A = (aij), i = m,1 , j = n,1 , se formează o nouă

matrice R = (rij), numită matricea regretelor, unde elementul:

rij = mk1

max≤≤

akj – aij, i = m,1 , j = n,1 , adică rij este dat de diferenţa

dintre cel mai mare element de pe coloana j şi elementul aij.

Se obţine astfel un nou joc caracterizat de matricea R care va fi tratat

după criteriul minimax. P1 va alege strategia pe linia căreia se obţine:

mi1min

≤≤⎨

nj1max

≤≤rij⎬, adică linia pe care cel mai mare regret este minim.

Exemplu

Pentru acelaşi joc din ultimele două exemple, aplicând criteriul

regretelor, să se determine strategia ce va fi aleasă de P1.

Page 41: TEORIA JOCURILOR

Teoria jocurilor

Rezolvare

Se determină mai întâi matricea regretelor ale cărei elemente de pe o

coloană se obţin scăzând din cel mai mare element al coloanei fiecare

element al acesteia. Se obţine:

B1 B2 B3 B4 jmax rij

A1 A2 A3 A4

1 0 2 0

1 3 0 2

0 0 1 1

0 1 2 0

1 3 2 2

Atunci i

min ⎨j

max rij⎬ = min⎨1, 3, 2, 2⎬ = 1, ce corespunde strategiei

A1, deci P1 alege această strategie.

Criteriul lui Wald

Dacă jocul are punct şa, statisticianul P1 alege strategia Ai

determinată de condiţia:

imax (

jmin aij).

Dacă jocul nu are punct şa, se determină strategia mixtă

x = (x1, ..., xm) pentru care:

jmin

⎭⎬⎫

⎩⎨⎧∑

=

m

1iiijxa , este maximă.

Exemplu

Aplicarea criteriului lui Wald jocului cercetat şi cu celelalte criterii

ne duce la concluzia că jocul nu are punct şa. Procedând ca în paragraful

2.3.c, se determină strategia mixtă a statisticianului şi se găseşte vectorul:

x = (1/3, 1/3, 0, 1/3),

Page 42: TEORIA JOCURILOR

Modele matematice în economie

de unde rezultă că P1 poate alege oricare dintre strategiile sale A1, A2 sau

A4.

Observaţie: Criteriile aplicate nu au dus mereu la aceeaşi decizie dar

în majoritatea cazurilor s-a obţinut că cea mai bună strategie este A1;

statisticianul pe aceasta o va alege.

Aplicaţie

Patronul unui magazin achiziţionează un număr de frigidere de un

anumit tip pe o perioadă de 6 luni (primăvară – vară), pentru a le vinde. Din

observaţiile statistice, bazate pe cererea din ultimii doi ani, el estimează că

va vinde un număr de frigidere cuprins între: 15 şi 25 cu probabilitatea de

0,1; între 25 şi 35 cu probabilitatea de 0,4; între 35 şi 45 cu 0,3 şi între 45 şi

55 cu 0,2.

Costul unitar de achiziţie este de 300 euro iar preţul unitar de

vânzare este 400 euro (incluzând cheltuielile de transport şi garanţia de

funcţionare pe un an). Toate frigiderele nevândute până în toamnă se

restituie furnizorului pentru 250 euro/bucata.

Să se stabilească numărul optim de frigidere pe care să le

achiziţioneze patronul pentru a obţine un câştig cât mai mare.

Rezolvare

Determinăm matricea A = (aij), i, j = 4,1 , unde aij este câştigul

obţinut de patron când aplică strategia Ai, i = 4,1 şi cererea este în starea Sj,

j = 4,1 . Obţinem astfel: Cererea pieţei

Cantitatea achiziţionată

S1:20 S2:30 S3:40 S4:50

A1:20 A2:30 A3:40 A4:50

2000 1500 1000 500

2000 3000 2500 2000

2000 3000 4000 3500

2000 3000 4000 5000

Page 43: TEORIA JOCURILOR

Teoria jocurilor

unde de exemplu elementul de pe linia A3 şi coloana S2 se calculează astfel:

din cele 40 frigidere achiziţionate se vând 30.

Diferenţa dintre preţul unitar de vânzare şi cel de achiziţionare este

de 100 euro pentru un frigider, ce reprezintă câştigul patronului. Pentru cele

30 frigidere vândute va câştiga 3000 euro. Dar alte 10 frigidere nevândute

vor fi restituite furnizorului cu o pierdere unitară de 50 euro dată de

diferenţa dintre costul de achiziţie 300 şi cel de restituire 250. Deci

pierderea va fi de 500 euro şi atunci beneficiul total va fi de: 3000 – 500 =

= 2500 euro.

Deoarece în stabilirea deciziei contează consecinţele economice se

pot aplica în rezolvarea problemei criteriile: maximin, minimax, Savage,

Bayes-Laplace:

a) Prin criteriul maximin se alege minimul fiecărei linii şi dintre

acestea se găseşte maximul:

A1 A2 A3 A4 2000 1500 1000 500

care este 2000 şi recomandă strategia A1.

b) Criteriul minimax, bazat pe prudenţă, indică alegerea elementelor

maxime pe fiecare linie şi apoi determinarea celui mai mic dintre acestea.

A1 A2 A3 A4 2000 3000 4000 5000

Acest element este 2000 şi arată că cea mai prudentă decizie este A1.

c) Criteriul lui Savage este de fapt criteriul minimax aplicat pe

matricea regretelor, ce va avea forma:

R =

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

050010001500100005001000200010000500300020005000

Page 44: TEORIA JOCURILOR

Modele matematice în economie

pentru care vom căuta maximul pe fiecare linie şi apoi cel mai mic dintre

acestea. Găsim:

A1 A2 A3 A4 3000 2000 1000 1500

cel mai mic element este 1000 şi recomandă strategia A3.

d) Criteriul Bayes-Laplace presupune calculul câştigului mediu

pentru fiecare strategie folosind probabilităţile date în enunţul problemei şi

formulele din paragraful 2.2. Astfel:

ϕ(1,y) = 0,1⋅2000 + 0,4⋅2000 + 0,3⋅2000 + 0,2⋅2000 = 2000

ϕ(2,y) = 0,1⋅1500 + 0,4⋅3000 + 0,3⋅3000 + 0,2⋅3000 = 2850

ϕ(3,y) = 0,1⋅1000 + 0,4⋅2500 + 0,3⋅4000 + 0,2⋅4000 = 3100

ϕ(4,y) = 0,1⋅500 + 0,4⋅2000 + 0,3⋅3500 + 0,2⋅5000 = 2900

Cel mai mare câştig se obţine când se aplică strategia A3.

4. Jocuri de două persoane cu sumă arbitrară (bimatriceale)

Jocurile de două persoane cu sumă oarecare extind în mod natural

jocurile cu sumă nulă de care ne-am ocupat până acum. Ele produc şi o

schimbare calitativă importantă, în sensul că, dacă regulile jocului o permit,

jucătorii pot căuta împreună căi (strategii) de îmbunătăţire a câştigurilor lor,

ceea ce, în cazul jocurilor antagoniste, era exclus din punct de vedere logic.

Obiectul teoriei jocurilor fiind dat de analiza situaţiilor de tip

competiţional, regulile care reglementează concurenţa vor sta la baza

dezvoltărilor ulterioare.

Page 45: TEORIA JOCURILOR

Teoria jocurilor

Astfel, vom studia separat jocurile cu sumă arbitrară de tip

necooperativ, în care nu este permisă (sau nu există interes pentru)

colaborarea între jucători şi apoi jocurile de tip cooperativ, în care jucătorii

îşi pot corela strategiile şi/sau pot apela la transferul mutual al unor părţi din

câştiguri. Şi într-un caz şi în celălalt, preocuparea principală va fi de a defini

un concept de soluţie a jocului, de a cerceta condiţii de existenţă şi a

identifica metode de determinare a acesteia.

Ca o trăsătură care distinge jocurile cu sumă arbitrară de cele cu

sumă nulă se evidenţiază interdependenţa strategiilor componente ale unei

soluţii a jocului.

4.1 Jocuri cu sumă arbitrară necooperative

Vom nota, ca şi mai înainte, cei doi jucători cu P1 şi P2 şi vom

presupune că strategiile lor (pure) sunt în număr finit:

A = ⎨A1, ..., Am⎬ reprezintă mulţimea strategiilor lui P1, iar

B = ⎨B1, ..., Bn⎬, mulţimea strategiilor lui P2.

Definiţie: Se numeşte joc de două persoane cu sumă arbitrară dat în

formă normală, un sistem G = ⎨A, B; f1, f2⎬, unde A şi B conţin strategiile

celor doi jucători iar fi(⋅,⋅), i = 2,1 sunt funcţii definite pe A × B cu valori

reale, numite funcţii de câştig, corespunzătoare fiecăruia dintre aceştia.

Pentru o pereche de strategii (Ai, Bj) vom nota f1(Ai, Bj) = aij şi

f2(Ai, Bj) = bij, i = m,1 , j = n,1 . În vederea unei scrieri compacte a

Page 46: TEORIA JOCURILOR

Modele matematice în economie

elementelor care definesc un joc de acest tip, apelăm la o reprezentare

matriceală ca cea de mai jos:

P2P1

B1 ... Bj ... Bn

A1

∶ Ai

∶ Am

.

. (aij, bij)

.

.

Deoarece elementele tabloului de mai sus sunt perechi de numere

reale care ar putea proveni din suprapunerea a două matrici de dimensiuni

m × n conţinând câştigurile celor doi jucători, luaţi separat, asemenea jocuri

se mai numesc pe scurt jocuri bimatriceale.

Să remarcăm faptul că asupra valorilor sumelor f1(Ai, Bj) + f2(Ai,Bj),

i = m,1 , j = n,1 nu se impune nici o condiţie.

Considerăm, spre exemplificare, următorul joc:

G = ⎨A, B; f1, f2⎬; A = ⎨A1, A2⎬, B = ⎨B1, B2⎬; f1(A1, B1) = 3,

f1(A2, B1) = 1, f1(A1, B2) = 1, f1(A2, B2) = 0; f2(A1, B1) = 0, f2(A2, B1) = 4,

f2(A1, B2) = 2, f2(A2, B2) = 1.

Vom analiza jocul folosind forma sa matriceală.

B1 B2 A1A2

(3,0) (1,4)

(1,2) (0,1)

Se observă că pentru jucătorul P1 este preferabil să joace strategia A1

în raport cu A2, indiferent ce strategie adoptă P2 (B1 sau B2), deoarece avem

f1(A1, ⋅) ≥ f1(A2, ⋅) (într-adevăr, 3 > 1 şi 1 > 0).

Recunoaştem aici existenţa unei strategii dominate a jucătorului 1, în

speţă A2.

Page 47: TEORIA JOCURILOR

Teoria jocurilor

Referitor la strategiile lui P2, să observăm că nici una dintre ele nu o

domină pe cealaltă (0 < 2, dar 4 > 1).

Obiectivul nostru fiind acela de a prevedea desfăşurarea jocului, prin

precizarea strategiilor pe care jucătorii, cel mai probabil, le vor folosi (în

scopul raţional al maximizării câştigului), vom reduce matricea jocului

renunţând la linia corespunzătoare strategiei dominate (pe care ar fi iraţional

să o adopte P1).

B1 B2 A1 (3,0) (1,2)

Este evident acum că jucătorul P2 va alege strategia B2, care îi

asigură un câştig mai mare. În concluzie, perechea de strategii (A1, B2) se

constituie într-o soluţie a jocului, rezultată din confruntarea intereselor lui P1

şi P2. Un efect, în acest caz, este acela că nici un jucător nu îşi realizează

câştigul maxim admisibil (3, respectiv 4), fapt posibil din punct de vedere

teoretic, în general.

În exemplul precedent, raţionamentul utilizat a urmărit identificarea

unei convenţii la care jucătorii, în mod independent, sunt dispuşi să adere,

concretizate printr-o soluţie unică a jocului necooperativ. Aceasta conduce

la ideea folosirii perechii de strategii (A1, B2) în mod liber, în mai multe

partide (repetări ale jocului), de către jucători raţionali care aşteaptă unul de

la celălalt un astfel de comportament.

Ideea cristalizării unei convenţii are, desigur, o latură ideală. Nu

putem presupune că pentru un joc oarecare vom elimina pe rând, strategiile

(strict) dominate, rămânând, în final, cu o singură pereche de strategii. Pe de

altă parte, acest proces de eliminare poate să conducă la o mulţime terminală

de perechi de strategii, dintre care unele nu au calităţile unei soluţii.

Page 48: TEORIA JOCURILOR

Modele matematice în economie

În precizarea calităţilor pe care trebuie să le aibă o soluţie a jocului,

vom ţine cont de faptul că tendinţa unilaterală de câştig a unui jucător poate

fi amendată de opţiunile celuilalt, dar nu şi anihilată. De aceea, apare

naturală cerinţa ca strategia unui jucător, care este o componentă a soluţiei,

să reprezinte cel mai bun răspuns la strategia aleasă de celălat jucător, care

completează soluţia. O astfel de soluţie poate fi numită strategic – stabilă,

deoarece nici un jucător nu are interesul să se abată de la strategia sa, atâta

vreme cât nici ceilalţi nu încearcă acest lucru. Ideea de echilibru pe care

trebuie să îl realizeze strategiile care alcătuiesc soluţia jocului este acum

transparentă. Cele de mai înainte sunt redate în următoarea:

Definiţie. Într-un joc bimatriceal dat în formă normală

G = ⎨A, B; f1, f2⎬, perechea de strategii (A*, B*) reprezintă un punct

de echilibru Nash dacă au loc relaţiile:

f1(A*, B*) ≥ f1(Ai, B*), oricare ar fi Ai ∈ A şi

f2(A*, B*) ≥ f2(A*, Bj), oricare ar fi Bj ∈ B

Altfel spus, maxf1(Ai, B*) este atins în A*, iar maxf2(A*, Bj) e atins Ai∈A Bj∈B

în B*.

Cum A* ∈ A şi B* ∈ B, se obişnuieşte, pentru mai multă claritate, să

se spună că (A*, B*) este punct de echilibru Nash în strategii pure.

Observaţie: Noţiunea de punct de echilibru Nash o generalizează pe

cea de punct şa de la jocurile matriceale (cu sumă nulă). Într-adevăr,

condiţiile:

f(Ai, Bjo) ≤ f(Aio, Bjo) ≤ f(Aio, Bj) (∀) Ai ∈ A, (∀) Bj ∈ B,

care definesc punctul şa aiojo = f(Aio, Bjo) se mai pot scrie:

f(Aio, Bjo) ≥ f(Ai, Bjo), (∀)Ai ∈ A,

-f(Aio, Bjo) ≥ -f(Aio, Bj), (∀)Bj ∈ B.

Page 49: TEORIA JOCURILOR

Teoria jocurilor

De aceea, unii folosesc termenul de punct de echilibru în loc de

punct şa atunci când se referă la soluţia unui joc matriceal G = (A, B, f).

Definiţia precedentă se poate extinde, fără dificultate, la cazul a n

jucători, ale căror funcţii de câştig sunt funcţii reale de n argumente.

Exemplu

Se consideră jocul în formă normală G, căruia îi corespunde

matricea:

B1 B2 B3 B4 A1 A2 A3

(4,0) (0,1) (2,4)

(2,1) (2,0) (1,3)

(0,4) (3,3) (1,2)

(1,1) (5,2) (0,2)

Determinarea punctelor de echilibru Nash ale jocului se va face în

modul următor: pentru fiecare jucător şi pentru fiecare strategie a acestuia,

se determină răspunsul optim al celuilalt jucător la respectiva strategie.

Pentru a-l marca, vom sublinia în acea linie / coloană câştigul maxim

corespunzător.

Astfel, observăm că dacă P1 ar folosi strategia A1, atunci P2 ar trebui

să folosească strategia B3 şi vom scrie atunci (0,4) în poziţia din matrice

corespunzătoare perechii (A1, B3). Asemănător, pentru strategiile A2 şi A3

ale lui P1, vom selecta răspunsurile B3, respectiv B1 şi vom completa (3, 3),

respectiv (2, 4) în locurile potrivite din tabel.

În privinţa replicilor lui P1 la alegerile posibile ale lui P2, strategiei

B1 îi va corespunde A1 şi vom scrie în prima coloană (4, 0) (deoarece 4 > 0

şi 4 > 2). Pentru coloanele a doua, a treia şi a patra, vom selecta strategiile

de răspuns A1, A2 şi A2, respectiv.

Page 50: TEORIA JOCURILOR

Modele matematice în economie

Se obţine aşadar, după procedura de marcare, următorul tabel:

B1 B2 B3 B4 A1 A2 A3

(4,0) (0,1) (2,4)

(2,1) (2,0) (1,3)

(0,4) (3,3) (1,2)

(1,1) (5,2) (0,2)

Ţinând seama de definiţia dată anterior, deducem că punctele de

echilibru corespund acelor perechi de câştiguri în care ambele componente

apar subliniate (dacă există). În exemplul analizat, această situaţie apare

doar în cazul perechii de strategii (A2, B3), care va reprezenta deci soluţia

Nash a jocului.

Vom clarifica în continuare legătura care există între eliminarea

strategiilor strict dominate şi existenţa punctelor de echilibru Nash. Au loc

următoarele rezultate:

Propoziţia 4.1

În jocul dat sub formă normală G = ⎨A, B; f1, f2⎬, dacă strategiile

(S *1 , S *

2 ) reprezintă un punct de echilibru, atunci ele nu sunt afectate de

procedeul de eliminare a strategiilor strict dominate.

Propoziţia 4.2

Dat fiind jocul G = ⎨A, B; f1, f2⎬, dacă eliminarea succesivă a

strategiilor dominate strict conduce la desfiinţarea tuturor combinaţiilor de

strategii, cu excepţia lui (S *1 , S *

2 ), atunci această pereche constituie unicul

punct de echilibru Nash al jocului.

Vom justifica cele afirmate în propoziţia 4.1, folosind reducerea la

absurd. Să presupunem că (S *1 , S *

2 ) este un punct de echilibru al jocului, dar

că una dintre strategiile componente, de exemplu S *1 , a fost eliminată la un

moment dat (eventual precedată de alte strategii din A\⎨S *1 ⎬, sau B\⎨S *

2 ⎬,

Page 51: TEORIA JOCURILOR

Teoria jocurilor

eliminate şi ele), fiind strict dominată. Să notăm cu S’1 o strategie din A care

a „supravieţuit” eliminării succesive până la momentul dispariţiei lui S *1 şi

care o domină strict pe aceasta. Are loc deci relaţia:

f1(S *1 , B) < f1(S’1, B) pentru orice strategie B dintre cele rămase la

acest moment. Cum S *1 ar fi prima eliminată dintre strategiile de echilibru,

din inegalitatea de mai sus rezultă:

f1(S *1 , S *

2 ) < f1(S’1, S *2 ).

Dar astfel este contrazis faptul că S *1 este cel mai bun răspuns al lui

P1 la strategia S *2 a lui P2, aşa cum impune faptul că (S *

1 , S *2 ) e punct de

echilibru. Cu aceasta, demonstraţia se încheie.

Mai departe ne preocupă problema existenţei punctelor de echilibru

multiple ale unui joc bimatriceal. Conform propoziţiei 4.1, nu este posibil ca

strategiile componente ale unuia dintre ele să fie evitate în procesul de

eliminare succesivă a strategiilor strict dominate, iar altele, cu aceeaşi

proprietate, nu. De aici rezultă că în propoziţia 4.2 este suficient să arătăm

că (S *1 , S *

2 ) este punct de echilibru Nash. (Demonstraţia, asemănătoare cu

cea precedentă, se sprijină pe ipoteza că mulţimile de strategii ale ambilor

jucători sunt finite).

Ne vom servi în discuţia noastră de exemplul jocului

G = (A, B; f1, f2) cu matricea câştigurilor:

B1 B2 B3 A1A2A3

(2,0) (3,4) (1,3)

(2,1) (1,2) (0,2)

(4,2) (2,3) (3,0)

Page 52: TEORIA JOCURILOR

Modele matematice în economie

Se poate observa uşor că strategia A1 domină strict pe A3 şi că B3

domină strict pe B2 după eliminarea lui A3. După ce suprimăm strategiile

dominate, jocul are forma simplificată:

B1 B3 A1A2

(2,0) (3,4)

(4,2) (2,3)

Urmând procedura descrisă anterior, sau prin verificare directă,

folosind definiţia, se deduce că (A1, B3) şi (A2, B1) sunt puncte de echilibru

Nash ale jocului.

Aceasta ne permite să remarcăm faptul că, spre deosebire de jocurile

cu sumă nulă, în jocurile bimatriceale, prin interschimbarea strategiilor

corespondente între două puncte de echilibru, perechile rezultate nu mai

sunt puncte de echilibru, aşa cum o demonstrează (A1, B1) şi (A2, B3).

Problema principală însă este ce anume trebuie înţeles prin soluţia

unui astfel de joc. Examinând câştigurile fiecărui jucător în parte, constatăm

că nu putem privilegia vreunul din punctele de echilibru, deoarece jucătorul

P1 preferă, firesc, pe (A1, B3), iar P2 preferă pe (A2, B1).

Teoretic, putem conveni că soluţia jocului este formată din ambele

puncte de echilibru. Practic însă este nevoie de o negociere (uneori dură)

între cei doi jucători sau de un arbitraj pentru a stabili pentru ce strategii vor

opta fiecare. Şanse mai mari de concretizare ar putea avea în acest caz

varianta care dă câştigurile (3, 4), dar elemente de ordin subiectiv nu trebuie

ignorate.

O situaţie de incertitudine în alegerea strategiilor optime ca cea de

faţă, este un teren propice pentru a testa utilitatea strategiilor de tip

maximin.

Page 53: TEORIA JOCURILOR

Teoria jocurilor

Astfel, în ce priveşte strategia maximin a lui P1 vom găsi:

min⎨2,2,4⎬ = 2 → A1; min⎨3,1,2⎬ = 1 → A2; min⎨1,0,3⎬ = 0 → A3,

deci strategia căutată este A1. Analog, pentru P2 avem:

min⎨0,4,3⎬ = 0 → B1; min⎨1,2,2⎬ = 1 → B2; min⎨2,3,0⎬ = 0 → B3,

de unde rezultă că strategia maximin a lui P2 este B2.

După cum se observă, însă, perechea de strategii maximin (A1, B2)

nu este un punct de echilibru. Oricare dintre jucători preferă câştigul care îi

revine ca urmare a alegerii în comun a unuia din punctele de echilibru faţă

de câştigul minim asigurat (într-adevăr (4, 2) > (2,1) şi (3, 4) > (2, 1)). În

fapt, are loc următorul rezultat general:

Propoziţia 4.3

Orice punct de echilibru furnizează fiecărui jucător în parte, un

câştig cel puţin egal cu câştigul său maximin.

Demonstraţie:

Presupunem că (A*, B*) este punct de echilibru al jocului, în

notaţiile de mai înainte. Atunci avem, pentru P1:

f1(A*, B*) ≥ f1(Ai, B*) ≥ minf1(Ai, Bj) pentru orice strategie Ai ∈ A.

De aici rezultă imediat:

maxminf1(Ai, Bj) ≤ f1(A*, B*).

Pentru jucătorul P2, obţinem folosind din nou definiţia punctului de

echilibru: f2(A*,B*) ≥ f2(A*, Bj) ≥ minf2(Ai, Bj), (∀) Bj ∈ B, deci

f2(A*,B*) ≥ maxminf2(Ai, Bj).

În concluzie, într-un joc cu sumă arbitrară, strategiile maximin îşi

pierd din importanţă.

Bj∈B

Bj∈B Ai∈A

Ai∈A

Ai∈A Bj∈B

Page 54: TEORIA JOCURILOR

Modele matematice în economie

Puncte de echilibru în strategii mixte

Posibilitatea existenţei mai multor puncte de echilibru Nash într-un

joc bimatriceal, cu implicaţiile sale în stabilirea soluţiei jocului nu este,

totuşi, lucrul care stânjeneşte cel mai mult. O problemă fundamentală care

apare în acest context este faptul că există jocuri cu sumă arbitrară chiar

dintre cele mai simple, care nu admit strategii pure de echilibru.

Să considerăm următorul joc:

B1 B2 A1A2

(2,1) (1,2)

(0,2) (3,0)

Se poate observa pe acest exemplu că nici o pereche de strategii

(Ai, Bj) nu poate realiza echilibrul. Astfel, pentru (A1, B1) observăm că

jucătorul P2 are interesul să devieze de la strategia B1 către B2, care îi

asigură un câştig superior. Analog, (A2, B1) nu poate fi punct de echilibru,

pentru că jucătorul P1 va prefera strategia A1 lui A2, ş.a.m.d..

Este greu de admis ideea că astfel de jocuri nu admit soluţie, în

sensul echilibrului de tip Nash. Cheia de rezolvare stă şi aici, ca şi în cazul

jocurilor cu sumă nulă, în lărgirea conceptului de strategie şi definirea

noţiunii de echilibru în această accepţiune mai largă.

Trebuie făcută precizarea că noul tip de strategie îl înglobează pe cel

utilizat până acum în discuţie şi că identificarea unor puncte de echilibru

corespunzătoare lui nu suprimă posibilitatea existenţei, pentru un acelaşi

joc, a punctelor de echilibru în strategii pure.

Obişnuim să numim strategie mixtă pe mulţimea A = ⎨A1, ..., Am⎬ a

strategiilor (pure) ale jucătorului P1 o repartiţie de probabilităţi:

x = (x1, ..., xm), unde xi ≥ 0, i = m,1 şi ∑=

m

1iix = 1.

Page 55: TEORIA JOCURILOR

Teoria jocurilor

Mulţimea tuturor acestor strategii o notăm prin X. Analog vom

considera:

Y = ⎨y = (y1,..., yn) ⏐ yj ≥ 0, ∑=

n

1jjy = 1⎬ ca fiind ansamblul

strategiilor mixte pe mulţimea B, a strategiilor jucătorului P2.

Ideea de strategie mixtă se leagă, în mod natural, de alternarea

strategiilor de către un jucător, în decursul mai multor partide. Cum

probabilităţile pot fi interpretate ca limite ale unor frecvenţe relative, se

pune întrebarea dacă în situaţii reale putem considera ca acceptabilă

repetarea (independentă) a jocului de un număr de ori suficient de mare.

Se poate încerca evitarea acestei dificultăţi prin interpretarea unei

strategii mixte a lui P2, y = (y1, ..., yn) ca reprezentând probabilităţile

(subiective) pe care le atribuie P1 utilizării uneia dintre strategiile pure

B1, ..., Bn de către P2 şi, asemănător, a unei strategii mixte a lui P1

(x1, ..., xm), schimbând rolurile între jucători. Impasul ce se profilează aici

ţine de tratarea jocurilor cu mai mult de doi jucători, caz în care doi jucători

pot avea percepţii diferite relative la comportarea unui terţ.

Oricare ar fi interpretarea dată strategiilor mixte, ele ne ajută să

punem în termeni corecţi problema maximizării unui câştig incert, prin

apelul la conceptul fundamental de medie a unei variabile aleatoare.

În condiţiile alegerii independente şi simultane a strategiilor de către

fiecare jucător în parte, folosindu-ne de notaţiile de mai înainte, vom defini

câştigurile celor doi, în ipoteza folosirii strategiilor mixte x şi y, respectiv,

prin: ϕ1(x, y) = ∑∑= =

m

1i

n

1jjiij yxa ;

ϕ2(x, y) = ∑∑= =

m

1i

n

1jjiij yxb ; ϕi: X × Y → ℝ, i = 2,1 ,

Page 56: TEORIA JOCURILOR

Modele matematice în economie

unde xi ⋅ yj reprezintă probabilitatea utilizării perechii de strategii (Ai, Bj),

iar aij şi bij sunt câştigurile asociate ei ale jucătorilor P1 şi P2, respectiv.

Să observăm că de exemplu, câştigul mediu ϕ1(x, y) este o medie a

unor câştiguri medii, considerând, pe rând, strategiile din A fixate faţă de

cele din B, după cum o arată relaţia:

ϕ1(x, y) = ∑ ∑= =

⎟⎟⎠

⎞⎜⎜⎝

⎛m

1i

n

1jjijya xi.

Cu aceste precizări, putem să dăm definiţia extinsă a punctelor de

echilibru ale unui joc bimatriceal în formă normală:

Definiţie: Într-un joc bimatriceal G = ⎨A, B; f1, f2⎬, o pereche de

strategii mixte (x*, y*) este un punct de echilibru Nash dacă au loc

următoarele inegalităţi:

ϕ1(x*,y*) ≥ ϕ1(x, y*)

ϕ2(x*,y*) ≥ ϕ2(x*, y)

pentru orice strategii mixte x ∈ X şi y ∈ Y.

Cu alte cuvinte, x* este cea mai bună strategie (mixtă) de răspuns a

lui P1 la strategia y* a lui P2 şi viceversa.

Se deduce din cele de mai sus că putem porni la determinarea

strategiilor mixte de echilibru ale unui joc (a căror existenţă o vom afirma

ceva mai târziu) prin găsirea celui mai bun răspuns (în strategii mixte sau

pure) al unui jucător la o strategie mixtă a celuilalt.

În demersul nostru ne servim de următorul rezultat:

Propoziţia 4.4

Pentru ca o strategie mixtă a lui P1 să fie un cel mai bun răspuns al

acestuia la o strategie mixtă dată y a lui P2, este necesar şi suficient ca ea să

asigneze probabilităţi strict pozitive numai acelor strategii pure care sunt ele

Page 57: TEORIA JOCURILOR

Teoria jocurilor

însele un cel mai bun răspuns la strategia y (sau numai unei părţi a acestora,

restul primind probabilităţi nule).

Demonstraţie:

Să notăm, pentru o strategie y dată, cu Imax mulţimea indicilor acelor

strategii pure ale lui P1 care sunt un cel mai bun răspuns la y:

Imax = ⎨K ⏐ ∑∑==

≥n

1jjij

n

1jjkj yaya , (∀) i = m,1 ⎬.

Să alegem un K0 ∈ Imax. Fie x = (x1, ..., xm) o strategie mixtă a lui P1

şi să presupunem că există l ∈ n,1 \ Imax astfel încât xl > 0. Notăm cu x’

strategia mixtă obţinută din x prin asocierea probabilităţii x0K + xl la

strategia A0K şi a unei probabilităţi nule la Al. Atunci vom avea:

ϕ1(x, y) = <++⎟⎟⎠

⎞⎜⎜⎝

⎛∑∑∑ ∑==≠ =

n

1jjljl

n

1jjjKK

l,Ki

n

1jjiji yaxyaxyax

00

0

)y,'x(ya0ya)xx(ya 1

n

1jjlj

n

1jjjKlK

l,Ki

n

1jjij 00

0

ϕ=⋅+++⎟⎟⎠

⎞⎜⎜⎝

⎛< ∑∑∑ ∑

==≠ =

, de

unde deducem că x nu este cea mai bună strategie de răspuns la y.

Pentru probarea suficienţei, se consideră I0 ⊆ Imax şi o strategie mixtă

x0 = ( )m1i0ix = care asignează probabilităţi nenule numai acelor strategii Ah, cu

h ∈ I0. De aici rezultă:

∑∑∑∑ ∑====

∈∈ =

=⎟⎟⎠

⎞⎜⎜⎝

⎛=⎟⎟

⎞⎜⎜⎝

⎛=ϕ

n

1jjij

m,1i

n

1jjij

m,1iIh

0h

Ih

n

1jjhj

0h

01 yamaxyamaxxyax)y,x(

00

, şi

mai departe:

ϕ1(x, y) = =≤⎟⎟⎠

⎞⎜⎜⎝

⎛∑∑∑∑=====

n

1jjij

m,1i

m

1ii

n

1jjij

m

1ii yamaxxyax ϕ1(x0, y), oricare ar

fi strategia mixtă x ∈X. Deci x0 este răspuns optim al lui P1 la strategia y.

Page 58: TEORIA JOCURILOR

Modele matematice în economie

Un enunţ similar celui din propoziţia 4.4 caracterizează strategiile mixte ale lui P2 care sunt răspunsuri optime la o strategie mixtă x a lui P1, fixată.

Reamintim că orice strategie pură a unui jucător poate fi interpretată ca o strategie mixtă, exprimabilă printr-un vector binar cu 1 pe poziţia corespunzătoare strategiei şi având restul componentelor egale cu 0.

Revenind la exemplul de mai înainte al jocului bimatriceal 2 × 2, să încercăm determinarea unui punct de echilibru în strategii mixte. Pentru simplitate, vom nota strategiile mixte ale lui P1 prin x = (p, 1 – p) şi

strategiile mixte ale lui P2 cu y = (q, 1 – q), p, q ∈ [0, 1]. Într-o primă etapă, vom găsi strategiile pure optime de răspuns ale

fiecărui jucător, la o strategie mixtă a adversarului.

Pentru o strategie mixtă dată (q, 1 – q) pe B = ⎨B1, B2⎬, câştigul

mediu al lui P1 va fi 2q + 0(1 – q) = 2q, dacă foloseşte strategia A1 sau

1 ⋅ q + 3(1 – q) = 3 – 2q, dacă foloseşte strategia A2.

Rezolvând inecuaţia 2q > 3 – 2q pe intervalul [0, 1], deducem:

- dacă q ∈ [0, 43 ), cel mai bun răspuns al lui P1 este A2;

- dacă q = 43 , atunci A1 şi A2 sunt răspunsuri la fel de bune;

- dacă q ∈ (43 , 1], cel mai bun răspuns al lui P1 este A1.

Inversând rolurile, fie (p, 1 – p) o strategie mixtă pe A = ⎨A1, A2⎬.

Câştigul mediu al lui P2 va fi 1 ⋅ p + 2(1 – p) = 2 – p, dacă foloseşte strategia B1 sau 2p, dacă utilizează strategia B2. Folosindu-ne de soluţia inecuaţiei

2 – p > 2p pe [0, 1], constatăm următoarele:

- pentru p ∈ [0, 32 ), răspunsul optim al lui P2 este B1;

Page 59: TEORIA JOCURILOR

Teoria jocurilor

- pentru p = 32 , P2 poate răspunde atât cu B1, cât şi cu B2;

- pentru p ∈ (32 , 1], răspunsul optim al lui P2 este B2.

Căutăm acum o pereche de strategii mixte (x*, y*), x* = (p*, 1-p*),

y* = (q*, 1 – q*) cu proprietăţile din definiţia extinsă a echilibrului Nash.

Vom analiza pe rând diversele situaţii posibile.

I. Dacă q* ar aparţine intervalului [0, 43 ), atunci răspunsul optim

al lui P1 ar fi strategia pură A2, căreia îi corespunde p = 0 ca

strategie mixtă. Însă răspunsul optim al jucătorului P2 la această

strategie este B1, corespunzând lui q = 1. Cum 1 ∉ (0, 43 ], acest

caz nu e compatibil cu existenţa unui punct de echilibru.

II. Dacă q* ∈ (43 , 1], cel mai bun răspuns al lui P1 este A1, pe care

îl identificăm cu strategia mixtă (1, 0). Cel mai bun răspuns al

lui P2 la această strategie este strategia pură B2, pentru care

avem q = 0. Dar 0 ∉ (43 , 1] şi concluzia e identică celei de la

punctul precedent.

III. În cazul q* = 43 , ca răspuns optim al jucătorului P1 putem lua

orice strategie mixtă (r, 1 – r) pe ⎨A1, A2⎬, r ∈ [0, 1], conform

cu propoziţia 4.4. Dar situaţiile r ∈ [0, 32 ) şi r ∈ (

32 , 1] conduc

la valori ale răspunsurilor corespunzătoare lui q = 1 şi q = 0,

respectiv, ambele diferite de 43 . Pentru r =

32 , răspunsul optim

Page 60: TEORIA JOCURILOR

Modele matematice în economie

fiind orice strategie mixtă (q, 1 – q) pe ⎨B1, B2⎬, în particular

(43 ,

41 ), rezultă că putem alege p* =

32 . În concluzie, punctul de

echilibru al jocului, în strategii mixte, este:

(x*,y*) = ((32 ,

31 ), (

43 ,

41 )).

Importanţa considerării strategiilor mixte în identificarea soluţiilor

posibile ale unui joc bimatriceal reiese din următorul rezultat (pe care îl dăm

într-un caz particular):

Teorema lui Nash

Orice joc finit de două persoane în formă normală, G = ⎨A, B; f1, f2⎬

posedă cel puţin un punct de echilibru, în strategii pure sau mixte.

Demonstraţia teoremei, al cărei enunţ în formă generală se referă la

jocuri de n persoane, are la bază o teoremă de punct fix.

(În cazul de faţă, (x*,y*) cu proprietatea T(x*, y*) = (x*,y*) este

punct fix al unei transformări T). Deşi în demonstraţie nu se construieşte

efectiv un punct de echilibru, concluzia sa este suficient de elocventă.

Vom prezenta în cele ce urmează o procedură de determinare a

punctelor de echilibru ale unui joc bimatriceal în formă normală, atunci când

jucătorii P1, P2 au la dispoziţie m şi n strategii pure, respectiv, cu ajutorul

unui exemplu concret. Vom avea în vedere cazul când câştigurile jucătorilor

sunt nenegative, dar aceasta, după cum se constată, nu reprezintă o restricţie

importantă.

Sunt necesare câteva precizări şi notaţii. Astfel, vom nota cu C1

matricea câştigurilor jucătorului P1 definită prin:

C1 = (aij)n,1jm,1i

== , aij = f1(Ai, Bj), Ai ∈A, Bj ∈ B.

Page 61: TEORIA JOCURILOR

Teoria jocurilor

Asemănător, C2 va desemna matricea câştigurilor jucătorului P2:

C2 = (bij) n,1jm,1i

== , bij = f2(Ai, Bj), Ai ∈ A, Bj ∈ B.

Pentru două strategii mixte, x = (x1, ..., xm) a lui P1 şi y = (y1,..., yn) a

lui P2, se pot transcrie câştigurile medii ale fiecărui jucător în parte, astfel:

ϕ1(x, y) = xC1yT, ϕ2(x, y) = yC T2 xT, unde indicii T înseamnă operaţia

de transpunere.

Notând Jm şi Jn vectorii-linie cu m, respectiv n componente, toate

egale cu 1, vom putea scrie relaţiile:

xJ Tm = 1, y J T

n = 1 (1)

sinonime cu faptul că suma probabilităţilor (xi)i∈ m,1 (respectiv (yj)j∈ n,1 ) face

1.

Să presupunem acum că (x, y) reprezintă o pereche de strategii de

echilibru şi să notăm, pentru simplitate, cu ϕ1 şi ϕ2 câştigurile aferente ei ale

celor doi jucători.

Introducem vectorii Φ1 = (ϕ1, ..., ϕ1) ∈ℝn şi Φ2 = (ϕ2, ..., ϕ2) ∈ℝn,

care ne permit o scriere matriceală a proprietăţii de echilibru. Astfel,

folosind propoziţia 4.4, deducem relaţiile:

C1yT ≤ Φ T1 , C T

2 xT ≤ Φ T2 (2)

în care inegalităţile trebuie interpretate ca funcţionând între oricare două

componente corespondente ale vectorilor – coloană. Ele exprimă faptul că

răspunsurile printr-o strategie pură la strategiile y, respectiv x pot să ducă, în

cel mai bun caz, la egalarea câştigurilor ϕ1, respectiv ϕ2. Acestea sunt atinse

efectiv în (x, y), ceea ce reiese din relaţiile:

xC1yT = xΦ T1 ⇔ x(Φ T

1 - C1yT) = 0

yC T2 xT = yΦ T

2 ⇔ y(Φ T2 - C T

2 xT) = 0 (3)

Page 62: TEORIA JOCURILOR

Modele matematice în economie

în care am ţinut seama de (1).

Rezultă din cele de mai înainte că un punct de echilibru Nash, (x, y),

al unui joc bimatriceal trebuie să satisfacă cele şase relaţii date, la care se

adaugă condiţiile x ≥ 0 şi y ≥ 0.

Concret, vom găsi soluţiile următorului joc bimatriceal, folosind

instrumentarul prezentat pentru cazul general.

B1 B2 B3 A1A2

(4,0) (6,12)

(2,1) (2,10)

(8,6) (4,9)

Cele două matrici de câştiguri ale jucătorilor sunt:

C1 = ⎟⎟⎠

⎞⎜⎜⎝

⎛426824

şi C2 = ⎟⎟⎠

⎞⎜⎜⎝

⎛91012610

Suntem în cazul a m = 2 strategii pure ale jucătorului P1 şi a n = 3

strategii pure ale jucătorului P2.

Vom separa relaţiile de tip liniar de cele neliniare şi apoi le vom

grupa astfel încât să ne ocupăm separat de strategia (x1, x2), respectiv

(y1, y2, y3). Din relaţiile (1) şi (2) va rezulta:

x1 + x2 = 1 y1 + y2 + y3 = 1

12x2 - ϕ2 ≤ 0 4y1 + 2y2 + 8y3 - ϕ1 ≤ 0

x1 + 10x2 - ϕ2 ≤ 0 6y1 + 2y2 + 4y3 - ϕ1 ≤ 0

6x1 + 9x2 - ϕ2 ≤ 0

x1, x2 ≥ 0 y1, y2, y3 ≥ 0

Pentru jocul analizat, atât ϕ1 cât şi ϕ2 sunt nenegative şi ca atare,

vom nota x3 = ϕ2 şi y4 = ϕ1. De asemenea, vom transforma, în sistemele

scrise anterior, inegalităţile în egalităţi, prin introducerea unor variabile-

ecart, notate θi, i = 2,1 , respectiv µj, j = 3,1 .

Page 63: TEORIA JOCURILOR

Teoria jocurilor

Obţinem:

x1 + x2 = 1 y1 + y2 + y3 = 1

(I) 12x2 – x3 + µ1 = 0 (II) 4y1 + 2y2 + 8y3 – y4 + θ1 = 0

x1 + 10x2 - x3 + µ2 = 0 6y1 + 2y2 + 4y3 - y4 + θ2 = 0

6x1 + 9x2 - x3 + µ3 = 0

x1, ..., x3 ≥ 0; µ1,...,µ3 ≥ 0 y1, ..., y4 ≥ 0; θ1, θ2 ≥ 0

Relaţiile (3) vor avea drept corespondent următoarele egalităţi:

(III) x1θ1 + x2θ2 = 0

y1µ1 + y2µ2 + y3µ3 = 0

Căutarea soluţiilor jocului bimatriceal se structurează aşadar în:

- rezolvarea în domeniul numerelor nenegative a sistemului liniar (I),

în necunoscutele x1, x2, x3, µ1, µ2, µ3;

- rezolvarea în domeniul numerelor nenegative a sistemului liniar

(II), în necunoscutele y1, y2, y3, y4, θ1, θ2;

- „filtrarea” soluţiilor, prin verificarea, de tip încrucişat, a

îndeplinirii condiţiilor (III).

În fapt, obiectivul nostru principal este să deducem soluţiile posibile

de bază pentru fiecare din sistemele (I) sau (II), deoarece soluţia generală se

poate obţine ca o combinaţie liniară convexă a soluţiilor de bază. Probarea

condiţiilor (III) o vom face aşadar pentru diferite perechi de soluţii de bază.

Page 64: TEORIA JOCURILOR

Modele matematice în economie

Să considerăm matricea sistemului liniar (I), în care fiecare coloană

este notată cu ak, k = 6,1 :

a1 a2 a3 a4 a5 a6

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

−−−

10019601011010011120000011

Procedura este cea cunoscută de la programarea liniară: se aleg patru

coloane din cele 6 astfel încât ele să formeze o bază în ℝ4,

B = ⎨a1k , a

2k , a3k , a

4k ⎬.

Atunci soluţia de bază va fi dată de (x, µ) = (B-1b, 0), unde

b = (1, 0,0,0)T este coloana termenilor liberi şi toate variabilele ale căror

coloane asociate nu au intrat în bază iau valoarea 0.

Fie de exemplu mulţimea ⎨a1, a2, a3, a5⎬. Deoarece:

det[a1, a2, a3, a5] =

019611101011200011

−−−

= 9 ≠ 0, rezultă că

B = ⎨a1, a2, a3, a5⎬ este o bază. Alegem µ1 = µ3 = 0. Avem de

rezolvat sistemul:

x1 + x2 = 1

12x2 – x3 = 0

x1 + 10x2 - x3 + µ2 = 0

6x1 + 9x2 - x3 = 0

Page 65: TEORIA JOCURILOR

Teoria jocurilor

Se deduce uşor că x3 = 12x2, x2 = 2x1. Cum x1 + x2 = 1, rezultă

x1 = 31 , x2 =

32 , x3 = 8 şi µ2 = 1.

Soluţia de bază va fi deci (x, µ)1 = (31 ,

32 ,8,0,1,0), având toate

componentele pozitive sau nule.

Repetând procedeul pentru alte baze şi testând nenegativitatea

componentelor soluţiilor, vom găsi încă două soluţii posibile de bază.

(x, µ)2 = (1,0,6,6,5,0), corespunzând bazei ⎨a1, a3, a4, a5⎬ şi

(x, µ)3 = (0,1,12, 0,2,3), corespunzând bazei ⎨a2, a3, a5, a6⎬.

Matricea sistemului (II) este:

b1 b2 b3 b4 b5 b6

⎟⎟⎟

⎜⎜⎜

−−

101426011824000111

Putem alege o bază formată din coloanele b1, b2 şi b4, deoarece

determinantul corespunzător lor are valoarea -2. Alegem y3 = θ1 = θ2 = 0.

Din sistemul:

y1 + y2 = 1

4y1 + 2y2 – y4 = 0

6y1 + 2y2 – y4 = 0

deducem y1 = 0, y2 = 1 şi y4 = 2, care ne dau soluţia posibilă de bază:

(y, θ)1 = (0,1,0,2,0,0).

Pentru bazele ⎨b1, b3, b4⎬, ⎨b3, b4, b6⎬ şi ⎨b1, b4, b5⎬, vom obţine alte

soluţii posibile de bază ale sistemului:

(y, θ)2 = (32 , 0,

31 ,

316 , 0, 0), (y, θ)3 = (0,0,1,8,0,4),

Page 66: TEORIA JOCURILOR

Modele matematice în economie

(y, θ)4 = (1, 0,0,6,2,0).

Înainte de a trece la verificarea condiţiilor (III), observăm că, în

ipotezele de nenegativitate a componentelor, x1θ1 + x2θ2 = 0 este

echivalentă cu x1θ1 = 0 şi x2θ2 = 0 şi similar y1µ1 + y2µ2 + y3µ3 = 0 e

îndeplinită dacă şi numai dacă y1µ1 = 0, y2µ2 = 0 şi y3µ3 = 0.

În consecinţă, dacă un θ (µ) este nenul, atunci componenta x

(y) cu acelaşi indice trebuie să fie egală cu zero.

Pentru facilitarea examinărilor necesare, vom construi două

tabele în care marcăm în prima coloană cuplul de strategii (x, y)

examinat, prin indicii corespunzători ordinilor date, iar în ultima

coloană, prin *, dacă perechea (x, y) respectă condiţia impusă. Primul

tabel este:

(x,y) θ1 θ2 x1 x2 */- (1,1)(2,1)(3,1)

0 0 0

0 0 0

1/3 1 0

2/3 0 1

* * *

(1,2)(2,2)(3,2)

0 0 0

0 0 0

1/3 1 0

2/3 0 1

* * *

(1,3)(2,3)(3,3)

0 0 0

4 4 4

1/3 1 0

2/3 0 1

- * -

(1,4)(2,4)(3,4)

2 2 2

0 0 0

1/3 1 0

2/3 0 1

- - *

Page 67: TEORIA JOCURILOR

Teoria jocurilor

Referitor la modul de completare a tabelului, am marcat cu *

perechea (2,3), deoarece θ1x1 = 0 ⋅ 1 = 0 şi θ2x2 = 4 ⋅ 0 = 0, în timp ce pentru

perechea (1, 4) avem θ1 = 2 ≠ 0 şi x1 = 31 ≠ 0, ş.a.m.d..

Cel de-al doilea tabel se prezintă astfel:

(x,y) µ1 µ2 µ3 y1 y2 y3 */- (1,1) (1,2) (1,3) (1,4)

0 0 0 0

1 1 1 1

0 0 0 0

0 2/3 0 1

1 0 0 0

0 1/3 1 0

- * * *

(2,1) (2,2) (2,3) (2,4)

6 6 6 6

5 5 5 5

0 0 0 0

0 2/3 0 1

1 0 0 0

0 1/3 1 0

- - * -

(3,1) (3,2) (3,3) (3,4)

0 0 0 0

2 2 2 2

3 3 3 3

0 2/3 0 1

1 0 0 0

0 1/3 1 0

- - - *

Am marcat cu * cuplul de strategii (1, 2), pentru că avem:

µ1y1 = 0 ⋅ 32 = 0, µ2y2 = 1 ⋅ 0 = 0 şi µ3y3 = 0 ⋅

31 = 0. În schimb

cuplul (3, 2) va fi marcat cu – (respins), deoarece µ1y1 = µ2y2 = 0, însă

µ3y3 = 3 ⋅ 31 = 1 ≠ 0.

Vom extrage din fiecare tabel perechile de strategii marcate cu

asterisc şi apoi vom intersecta cele două mulţimi. Astfel obţinem:

⎨(1,1), (2,1), (3,1), (1,2), (2,2), (3,2), (2,3), (3, 4)⎬ ∩

∩ ⎨(1,2), (1,3), (1,4), (2,3), (3, 4)⎬ = ⎨(1,2), (2,3), (3, 4)⎬.

Intersecţia găsită conţine strategiile de echilibru Nash (pure sau

mixte) ale jocului considerat. Acestea sunt (respectând ordinea):

Page 68: TEORIA JOCURILOR

Modele matematice în economie

⎟⎟⎠

⎞⎜⎜⎝

⎛⎟⎠⎞

⎜⎝⎛

⎟⎠⎞

⎜⎝⎛

31,0,

32,

32,

31 ; ((1, 0), (0,0,1)); ((0,1), (1, 0,0)).

Se observă că avem o pereche de strategii mixte (prima) şi două

perechi de strategii pure, mai exact (A1, B3) şi (A2, B1).

În încheierea discuţiei despre punctele de echilibru ale unui joc

bimatriceal, facem următoarele observaţii:

1. În situaţia în care elementele matricelor de câştiguri nu sunt toate

pozitive sau nule, trebuie să considerăm că ϕ1 şi ϕ2 sunt numere

reale. Pentru a putea să ne folosim în continuare de procedeul

descris mai înainte, putem proceda în două moduri:

a) să exprimăm fiecare variabilă ϕi, i = 2,1 ca diferenţa a două

variabile cărora li se impune să ia valori nenegative:

ϕi = ϕ’i - ϕ”i, ϕ’i ≥ 0, ϕ”i ≥ 0, i = 2,1 ;

b) să adunăm la matricile C1 sau C2 o matrice (m × n) formată

din constante identice între ele, suficient de mari,

transformarea neafectând decât valorile câştigurilor medii, nu

şi determinarea strategiilor de echilibru;

2. În exemplul rezolvat mai înainte, trebuiau considerate cel mult

C 46 = 15 situaţii care conduc la o bază pentru matricea sistemului

(I) şi cel mult C 36 = 20 situaţii de acelaşi tip în cazul sistemului

(II). Pentru un număr mai mare de strategii ale fiecărui jucător,

pentru a fi aplicabilă, metoda face apel la un program care

generează soluţii posibile de bază şi le testează în mod automat;

3. Asupra elementelor matricilor de câştiguri pot fi operate şi alte

tipuri de transformări, ca de pildă scalarea (înmulţirea cu un factor

pozitiv). De asemenea se poate discuta despre o strategie pură

Page 69: TEORIA JOCURILOR

Teoria jocurilor

dominată de o strategie mixtă, care ar putea să o disloce, fără a

afecta esenţial găsirea punctelor de echilibru, (Cititorul este

îndemnat să compare ultimul joc analizat cu unul prezentat

anterior şi să tragă concluziile de rigoare).

4.2 Jocuri bimatriceale cooperative

Aşa cum arătam la începutul discuţiei privind jocurile cu sumă

arbitrară, un joc cooperativ este acela în care regulile sale permit alegerea în

comun a strategiilor şi transferul de câştiguri între jucători, în scopul

cointeresării lor într-o anumită acţiune comună.

Ne vom servi de exemplul câtorva jocuri, pentru a ilustra situaţii în

care jucătorii au interesul să coopereze între ei. Punctul de plecare îl va

constitui, în ideea continuităţii, noţiunea de cuplu de strategii de echilibru

Nash.

Să considerăm jocul bimatriceal următor:

B1 B2 B3 A1A2

(1,2) (2,2)

(2,-2) (4,-1)

(3,1) (6,3)

Se observă cu uşurinţă că perechea de strategii (A2, B3) reprezintă un

punct de echilibru al jocului (în strategii pure). În particular, câştigurile

corespunzătoare ale jucătorilor (6, respectiv 3) sunt valorile maxime ale

funcţiilor de câştig ale fiecăruia, deci şi suma câştigurilor (care nu mai poate

fi îmbunătăţită prin considerarea strategiilor mixte) este maximă, între toate

combinaţiile posibile de strategii. Într-un asemenea caz, ipoteza cooperării

între cei doi jucători nu are nici un efect.

Page 70: TEORIA JOCURILOR

Modele matematice în economie

Dacă însă analizăm jocul:

B1 B2 A1A2

(3,2) (2,8)

(9,1) (7,5)

vom constata că, deşi (A1, B1) este punct de echilibru al jocului, câştigurile

care le revin jucătorilor nu îi pot mulţumi. Chiar suma lor, 5, ia valoarea cea

mai mică posibilă. Eliminând perechile (A2, B1) şi (A1, B2), care favorizează

un jucător şi îl defavorizează pe celălalt, rămâne perechea (A2, B2), ale cărui

câştiguri aduc un plus amândurora faţă de ce le oferă strategiile de echilibru.

Ea este însă instabilă.

Ieşirea din această dilemă se face prin modificarea regulilor jocului,

prin acceptarea cooperării. Odată acceptată, ea aduce cu sine însă o altă

problemă, aceea a împărţirii între cei doi jucători a câştigului comun, egal cu

12. Teoretic, se poate impune interzicerea plăţilor laterale între jucători,

situaţie în care distribuţia câştigurilor poate să rămână cea de la început. Nu

vom adopta o asemenea ipoteză în cele ce urmează.

Jocurile de tip cooperativ au o problematică specifică şi rezolvarea

lor presupune atât introducerea unor noţiuni noi cât şi revalorizarea altora

mai vechi.

Se pune astfel o primă întrebare: sub ce limită a câştigului nu poate

să accepte să coboare fiecare jucător?

Răspunsul îl furnizează acel câştig pe care îl poate obţine un jucător,

acţionând în mod independent, indiferent de strategia (pură sau mixtă)

aleasă de celălalt jucător. Referindu-ne la primul jucător, obţinem valoarea

maximin a jocului corespunzătoare lui, dată de expresia:

Page 71: TEORIA JOCURILOR

Teoria jocurilor

u* = Xx

max∈ Yy

min∈

ϕ1(x,y),

unde x şi y sunt strategii mixte pe mulţimea strategiilor lui P1, respectiv ale

lui P2. Analog, pentru P2 valoarea maximin va fi:

v* = Yy

max∈ Xx

min∈

ϕ2(x,y).

Deci, notând cu (u, v) o pereche de câştiguri ale celor doi jucători, ea

ar putea constitui o soluţie a jocului cooperativ numai dacă avem

(u, v) ≥ (u*, v*).

La întrebarea unde trebuie căutată soluţia jocului, răspunsul îl dă

noţiunea fundamentală de mulţime admisibilă. Aceasta, notată cu S, este

mulţimea tuturor perechilor de câştiguri (u, v) pe care le pot obţine, prin

cooperare în alegerea strategiilor, cei doi jucători. Datorită faptului că sunt

acceptate strategiile mixte şi, mai mult, ele pot fi corelate, această

submulţime a lui ℝ2 are proprietatea de convexitate. Este de presupus că

forma lui S va avea o influenţă asupra găsirii soluţiei jocului.

O altă noţiune importantă este aceea de frontieră Pareto-optimală a

mulţimii admisibile S. Astfel, un punct (u, v) ∈ S aparţine acesteia dacă

oricare ar fi ε > 0, δ > 0 rezultă (u + ε, v) ∉ S şi (u, v + δ) ∉ S.

Vom ilustra noţiunile introduse mai înainte şi vom schiţa metoda de

găsire a soluţiei, folosindu-ne de exemplul următorului joc bimatriceal.

B1 B2 A1A2A3

(1,2) (2,0) (3/2,6)

(3,8) (4,5) (5,3)

Page 72: TEORIA JOCURILOR

Modele matematice în economie

Presupunem că regulile jocului permit cooperarea între jucători (dar

nu ca o consecinţă a faptului că jocul nu admite puncte de echilibru în

strategii pure).

Inversând ordinea de mai înainte, vom determina mai întâi mulţimea

admisibilă S, precizând frontiera sa Pareto-optimală, folosindu-ne de o

reprezentare grafică. Dacă notăm cu W11 punctul din plan de coordonate

(1, 2) şi, mai departe, W12 = (3, 8), W21 = (2, 0), W22 = (4, 5), W31 = (23 , 6),

W32 = (5, 3), unde legătura dintre perechile de indici şi perechile de câştiguri

este evidentă, atunci S va fi reprezentată prin aşa-numita „acoperire

convexă” a punctelor W11, ..., W32 (adică cea mai mică mulţime convexă

plană care le conţine), dată în figura următoare prin mulţimea haşurată: V W12

W31

W22

S

W32

W11

0 W21 u

Să precizăm că există cazuri în care unele puncte - câştiguri W pot să

fie situate în interiorul poligonului convex determinat de restul punctelor,

caz în care mulţimea S va fi generată folosind numai aceste din urmă

puncte.

Frontiera Pareto-optimală a lui S va fi formată, în mod firesc, din

laturi ale poligonului W11W21 ... W31. Singurele care satisfac condiţia dată

sunt W12W22 şi W22W32. (Pentru puncte (u, v) aparţinând altor segmente,

Page 73: TEORIA JOCURILOR

Teoria jocurilor

cum ar fi W21W32 sau W31W12 este suficient să luăm (u, v + δ) sau (u + ε, v),

cu ε, δ > 0 alese corespunzător, pentru a constata că punctele obţinute fac

parte din S). Această frontieră Pareto [W12, W22, W32] va constitui, de fapt,

zona de interes în identificarea soluţiei jocului, deoarece ea corespunde

cursului de creştere, atât în u cât şi în v, a punctelor (u, v) din S, favorabil

ambilor jucători.

În continuare vom găsi valorile maximin ale jocului (în strategii

mixte). Pentru a uşura calculele, să facem observaţia că atunci când dorim să

minimizăm ϕ1(x, y) în raport cu y ∈ Y, pentru un x ∈ X fixat, este suficient

să considerăm strategiile pure y = (1, 0) şi y = (0, 1) deoarece putem scrie:

ϕ1(x, y) = xC1yT = (x1, x2, x3)C11 y1 + (x1, x2, x3) C 2

1 y2

unde y = (y1, y2), y1, y2 ≥ 0, y1 + y2 = 1, iar C11 şi C 2

1 sunt respectiv prima şi

a doua coloană a matricei de câştiguri a jucătorului P1, notată C1. Concret,

vom avea:

Yymin∈

ϕ1(x, y) = min⎨x1 + 2x2 + 23 x3, 3x1 + 4x2 + 5x3⎬ =

= x1 + 2x2 + 23 x3 (x1, x2, x3 ≥ 0)

Cum X = ⎨(x1, x2, x3)⎪x1, x2, x3 ≥ 0, x1 + x2 + x3 = 1⎬ este un simplex

în ℝ3, vom găsi:

u* = Xx

max∈ Yy

min∈

ϕ1(x, y) = Xx

max∈

(x1 + 2x2 + 23 x3) = 2, care se atinge în

vârful (0,1,0) al lui X.

Cu un argument asemănător, folosind egalitatea ϕ2(x, y) = yC T2 xT,

unde C2 este matricea câştigurilor lui P2, vom obţine:

Xxmin∈

ϕ2(x, y) = min⎨2y1 + 8y2, 5y2, 6y1 + 3y2⎬.

Page 74: TEORIA JOCURILOR

Modele matematice în economie

Dar y2 = 1 – y1, deci vom calcula:

min⎨-6y1 + 8, -5y1 + 5, 3y1 + 3⎬ pentru y1 ∈ [0, 1].

Expresia acestuia este egală cu 3y1 + 3, dacă y1 ∈ [0, 41 ] şi egală cu

-5y1 + 5, dacă y1 ∈ [41 , 1]. În final, avem:

v* = Yy

max∈ Xx

min∈

ϕ2(x, y) = 3 ⋅ 41 + 3 =

415 .

Soluţia jocului cooperativ dat, în sensul lui Nash, va fi o pereche

( u , v ) din S, cu proprietatea ( u , v ) ≥ (2, 4

15 ) şi care maximizează expresia

(u – u*)(v – v*) pentru acele perechi (u, v) cu u ≥ 2 (în cazul în care există

(u, v) ∈ S cu u > u* şi v > v*). Ea va aparţine frontierei Pareto-optimale a

lui S.

Se demonstrează că punctul căutat (unic prin construcţie) are

proprietatea că dreapta tangentă la frontiera lui S, dusă prin el, are panta

(coeficientul unghiular) egală cu opusul pantei dreptei care uneşte (u*,v*)

cu ( u , v ). Evident, această tangentă trebuie să existe, drept pentru care

punctele W12, W22 şi W32 sunt tratate (eventual) separat.

Cum coeficientul unghiular al dreptei care uneşte (2, 4

15 ) cu un

(u, v) de pe frontieră este o mărime care variază continuu, analiza decurge

după cum urmează.

Panta dreptei care conţine segmentul [W32W22] (şi care joacă rolul

tangentei la frontiera lui S pentru punctele din interiorul său) este:

α1 = 5435

−− = -2.

Page 75: TEORIA JOCURILOR

Teoria jocurilor

Unind punctul (2, 4

15 ) cu (5, 3) se obţine o dreaptă cu panta egală

cu: 254

153

−= -

41 . Asemănător, dreapta care trece prin punctele (2,

415 ) şi

(4, 5) are panta egală cu 85 . Aşadar, făcându-l pe (u, v) să varieze în

interiorul lui [W32W22] obţinem o dreaptă cu panta β care parcurge

intervalul (-41 ,

85 ). Cum opusul lui α1 nu se găseşte în această plajă de

valori (2 ∉ (-41 ,

85 )), rezultă că ( u , v ) nu aparţine interiorului segmentului

menţionat.

Continuând analiza cu punctele din interiorul segmentului [W22W12],

constatăm că panta dreptei – suport a acestuia este α2 = 4358

−− = -3. Dacă

unim pe (2, 4

15 ) cu (3, 8) obţinem o dreaptă având panta egală cu 4

17 . Deci,

atunci când (u, v) variază între capetele W22 şi W12, dreapta care îl uneşte cu

(u*,v*) are panta β ∈ (85 ,

417 ).

În acest caz, - α2 = 3 ∈ (85 ,

417 ) şi rămâne să îl determinăm pe

( u , v ) ca un punct situat între W22 şi W12.

Dreapta care trece prin punctele (4, 5) şi (3, 8) are ecuaţia:

14u

35v

−−

=− ⇔ v = -3u + 17. Ea se va intersecta cu o dreaptă care

trece prin (2, 4

15 ), de pantă egală cu β2 = 3, în ( u , v ).

Page 76: TEORIA JOCURILOR

Modele matematice în economie

Rezultă sistemul de ecuaţii:

v - 4

15 = 3(u – 2)

v = - 3u + 17

de unde, prin eliminarea lui v, găsim 6u = 17 + 49 şi deci u =

2477 ≈ 3.208,

iar v = 3 ⋅ 2477 -

49 =

859 = 7.375.

Soluţia de tip Nash a jocului cooperativ considerat mai sus este

perechea de câştiguri ( u , v ) = (2477 ,

859 ).

La acest moment se cuvine a fi făcută o observaţie referitoare la

transferul câştigurilor. Astfel, din ecuaţia:

v = -3u + 17, rezultă că o unitate valorică cedată de P1 se transferă

în 3 unităţi valorice ale lui P2, deoarece avem:

-3(u – 1) + 17 = -3u + 17 + 3 = v + 3.

Putem vorbi deci de o rată de transfer a câştigurilor de la P1 către

P2, egală cu 3(3 la 1).

Să facem diferenţele între câştigul dat de soluţia Nash şi valoarea

maximin pentru fiecare jucător în parte:

2477 - 2 =

2429 ;

829

415

859

=−

Raportul lor (în ordinea P2 / P1) este 829 ÷

2429 = 3, deci coincide cu

rata de transfer. Aceasta ne arată că părţile de câştig obţinute prin cooperare,

în plus faţă de câştigul maximin, de către fiecare jucător, se situează într-o

proporţie egală cu rata de transfer în punctul ( u , v ).

Page 77: TEORIA JOCURILOR

Teoria jocurilor

Să nu pierdem din vedere faptul că scopul fiecărui jucător este ca să-

şi îmbunătăţească câştigul, inclusiv prin cooperare, dar neexcluzând

influenţele subiective. În acest context, putem observa că suma câştigurilor

Nash:

u + v ≈ 3.208 + 7.375 = 10.583,

este strict inferioară sumei 3 + 8 = 11 ce rezultă dacă cei doi jucători convin

să aplice strategiile A1 şi B2, respectiv. Diferenţa rezultată ar putea să fie

obiectul unui transfer de câştig în scopul amintit. Trebuie să acceptăm din

această cauză concluzia că soluţia Nash nu e cea mai bună?

Să observăm că în calculele de mai sus nu am ţinut seama de rata de

transfer, egală cu 3 pentru toţi (u, v) ∈ [W12, W22]. Acestea ar fi trebuit să

arate astfel (în unităţi ale lui P2):

3 × 3 + 1 × 8 = 9 + 8 = 17

3 × 3.208 + 1 × 7.375 = 9.624 + 7.375 = 16.999 ≈ 17.

În încheiere să menţionăm că există şi un alt mod de producere a

soluţiei jocului cooperativ, bazat pe aşa-numitele strategii de ameninţare.

Pentru lămuriri, îndrumăm cititorul către referinţele bibliografice date.

5. Jocuri de n persoane. Valoare Shapley

În cele ce urmează vom considera jocul de n persoane, în care notăm

cu N = ⎨1, 2, ..., n⎬ mulţimea tuturor jucătorilor şi presupunem permisă

cooperarea între aceştia.

Definiţia 1. Orice submulţime nevidă a lui N (inclusiv N şi toate

submulţimile formate dintr-un singur jucător) se numeşte coaliţie.

Page 78: TEORIA JOCURILOR

Modele matematice în economie

Definiţia 2: Se numeşte funcţie caracteristică a unui joc de n jucători

funcţia v, definită pe mulţimea părţilor lui N, care asociază fiecărei coaliţii

S ⊂ N valoarea maximin (corespunzătoare lui S) a jocului de două persoane

jucat între coaliţiile S şi N – S.

Deci notăm prin v(S) câştigul pe care jucătorii din S îl pot obţine în

joc (acţionând în cooperare), indiferent de ceea ce fac restul jucătorilor.

Prin definiţie vom considera:

v(Φ) = 0 (1)

Dacă S şi T sunt coaliţii disjuncte, unindu-şi forţele, ele pot realiza

un câştig cel puţin tot atât ca în cazul când acţionează separat. Acest lucru se

scrie astfel:

v(S ∪ T) ≥ v(S) + v(T), dacă S ∩ T = Φ (2)

şi înseamnă că funcţia caracteristică v are proprietatea de superaditivitate.

Dacă în jocul de două persoane elementul esenţial era studiul

strategiilor mixte, în jocul de n persoane acest element esenţial este

formarea de coaliţii. Funcţia caracteristică dă posibilităţile diferitelor coaliţii

şi este cea mai potrivită pentru studiul acestora.

Definiţia 3: Prin joc de n persoane în formă caracteristică se

înţelege o funcţie v cu valori reale definită pe submulţimile lui N şi care

satisface condiţiile (1) şi (2).

Prin definiţie, v(S) este valoarea maximin a jocului între S şi N - S.

Dacă presupunem că jocul este cu sumă constantă, adică suma câştigurilor

tuturor jucătorilor este constantă, indiferent de desfăşurarea jocului, atunci:

v(S) + v(N-S) = v(N).

v(N) este valoarea ce se poate obţine prin cooperare generală şi se mai

numeşte valoare totală.

Page 79: TEORIA JOCURILOR

Teoria jocurilor

Notăm cu v(⎨i⎬) valoarea pe care jucătorul i o poate obţine acţionând

independent. Evident jucătorul i va intra în coaliţia S dacă valoarea

câştigului este cel puţin v(⎨i⎬).

Definiţia 4: Într-un joc v de n persoane vectorul x = (x1, ..., xn), cu

condiţiile:

a) ∑∈Ni

ix = v(N) şi

b) xi ≥ v(⎨i⎬), (∀) i ∈ N, se numeşte imputaţie.

Evident, din a) şi b), rezultă că:

v(N) ≥ {})i(vNi∑∈

.

Definiţia 5: Un joc v se numeşte esenţial, dacă

v(N) > {})i(vNi∑∈

şi neesenţial în caz contrar.

Jocurile esenţiale sunt acelea ce prezintă interes.

Deoarece jocurile în forma caracteristică (definiţia 3) sunt funcţii cu

valori reale, are sens să vorbim despre suma a două sau mai multe jocuri.

Definiţia 6: Se numeşte suport al unui joc v o coaliţie T cu

proprietatea:

v(S) = v(S ∩ T) pentru orice coaliţie S.

Aceasta înseamnă că orice jucător care nu aparţine unui suport al

jocului este lipsit de importanţă, adică nu aduce nimic unei coaliţii.

Definiţia 7: Fie v un joc de n persoane şi π o permutare arbitrară a

mulţimii N. Prin πv înţelegem jocul obţinut din v în care s-au interschimbat

rolurile jucătorilor prin permutarea π.

Page 80: TEORIA JOCURILOR

Modele matematice în economie

Axiomele Shapley

Numim valoare a unui joc v de n persoane, vectorul

ϕ[v] = (ϕ1[v],..., ϕn[v]), unde ϕi[v] reprezintă partea care trebuie atribuită

jucătorului i, i = n,1 , din câştigul total v(N), cu proprietăţile:

a1) pentru orice suport S al lui v avem: ∑∈

=ϕSi

i )S(v]v[ ;

a2) pentru orice permutare π şi orice jucător i ∈ N, ϕπ(i)[πv] = ϕi[v];

a3) pentru oricare două jocuri u şi v avem: ϕ[u + v] = ϕ[u] + ϕ[v].

Aceste trei proprietăţi sunt axiomele lui Shapley şi ele sunt suficiente

pentru a determina o funcţie valoare ϕ, definită pentru toate jocurile. Dăm

fără demonstraţie următoarea:

Teoremă [16]

Există o funcţie unică ϕ, definită pentru toate jocurile, care satisface

axiomele a1, a2, a3 şi anume:

ϕi[v] = {}[ ]∑∈⊂

−−−−

TiNT

)iT(v)T(v!n

)!tn()!1t( (3)

unde t este numărul jucătorilor din coaliţia T.

Semnificaţia termenului v(T) – v(T - ⎨i⎬) este câştigul primit de

jucătorul i, sau valoarea cu care acest jucător contribuie la câştigul total al

coaliţiei T din care face parte.

Dacă vom presupune că termenul v(T) – v(T - ⎨i⎬) poate lua numai

valorile 0 sau 1, şi anume ia valoarea 1 dacă şi numai dacă T este o coaliţie

câştigătoare, dar T - ⎨i⎬ nu este câştigătoare, atunci jocul v este un joc

simplu, iar formula (3) se simplifică, astfel:

ϕi[v] = ∑∈⊂

−−

TiNT !n

)!tn()!1t( (4)

Page 81: TEORIA JOCURILOR

Teoria jocurilor

unde sumarea se face pentru toate coaliţiile câştigătoare T pentru care

T - ⎨i⎬ nu este câştigătoare.

Aplicaţie [16]

O societate pe acţiuni are 4 acţionari ce posedă respectiv 10, 20, 30

şi 40% din acţiuni. Toate deciziile privind activitatea societăţii se iau cu

majoritatea simplă (cel puţin 51% voturi, care sunt proporţionale cu numărul

de acţiuni posedate). Considerând această situaţie ca un joc simplu de 4

persoane se cere:

a) să se găsească toate coaliţiile câştigătoare;

b) să se scrie coaliţiile câştigătoare T pentru care T - ⎨1⎬ nu este

câştigătoare;

c) să se determine valoarea Shapley ϕ = (ϕ1, ϕ2, ϕ3, ϕ4), unde ϕi este

partea ce se atribuie jucătorului i, i = 4,1 , din câştigul total;

d) să se facă observaţii asupra rezultatului obţinut la punctul c).

Rezolvare

a) Coaliţiile câştigătoare sunt:

⎨2, 4⎬, ⎨3, 4⎬, ⎨1, 2, 3⎬, ⎨1, 2, 4⎬, ⎨1, 3, 4⎬, ⎨2, 3, 4⎬, ⎨1, 2, 3, 4⎬.

b) Dintre coaliţiile câştigătoare ce îl conţin pe primul acţionar

singura care devine necâştigătoare când este scos din coaliţie acesta este

coaliţia: ⎨1, 2, 3⎬, în care t (numărul acţionarilor) este egal cu 3.

c) Aplicând formula (4), unde t = 3, n = 4, i = 1, avem:

ϕ1 = 121

!4!1!2= .

Analog, coaliţiile câştigătoare, care îşi pierd această proprietate dacă

acţionarul 2 este înlăturat sunt:

⎨2, 4⎬, ⎨1, 2, 3⎬,⎨1, 2, 4⎬.

Page 82: TEORIA JOCURILOR

Modele matematice în economie

Formula (4) va da pentru ϕ2 suma a trei termeni, fiecare

corespunzând uneia din coaliţiile de mai sus.

Astfel pentru coaliţia ⎨2, 4⎬, t = 2, n = 4, i = 2, primul termen din (4)

va fi:

121

!4)!24()!12(=

−− .

Pentru ⎨1, 2, 3⎬, t = 3, n = 4, i = 2, obţinem:

121

!4)!34()!13(=

−− .

Iar pentru ⎨1, 2, 4⎬, t = 3, n = 4, i = 2, aceeaşi valoare ca mai sus,

adică 121 . Atunci:

ϕ2 = 41

121

121

121

=++ .

Procedând similar vom obţine:

ϕ3 = 41 şi ϕ4 =

125 .

Astfel valoarea Shapley este vectorul:

ϕ = (121 ,

41 ,

41 ,

125 ).

Observaţie: ϕ este o imputaţie deoarece satisface condiţiile

definiţiei 4.

d) Valoarea Shapley nu concordă cu vectorul voturilor dat de

(52,

103,

51,

101 ) ale cărui componente sunt proporţionale cu numărul

acţiunilor deţinute.

Astfel ϕ2 = ϕ3 deşi acţionarul 3 posedă mai multe acţiuni ca

acţionarul 2. Acţionarul 3 nu are posibilităţi mai mari decât acţionarul 2 de a

Page 83: TEORIA JOCURILOR

Teoria jocurilor

participa la o coaliţie câştigătoare. Importanţa acţionarului 4 este mai mare

decât cea corespunzătoare procentului acţiunilor sale, iar a jucătorului 1 este

mai mică decât cea corespunzătoare acţiunilor sale.

Dacă acţionarii ar deţine respectiv 10, 30, 30, 30% din acţiuni,

oricare doi dintre acţionarii 2, 3, 4 pot forma coaliţii câştigătoare în timp ce

acţionarul 1 este lipsit de orice importanţă neputând aduce nimic nici unei

coaliţii. Atunci valoarea jocului este vectorul:

ϕ = (0, 31,

31,

31 ).

6. Probleme

1. Să se stabilească valoarea jocului şi strategiile pure optime pentru

jocul:

BA B1 B2 B3 B4 αi

A1 A2 A3

-4 8 -1

4 6 0

2 5 1

11 7 -4

-4 5 -4

βj 8 6 5 11

Rezolvare

Luând αi = 4j1

min≤≤

aij, i = 3,1 , βj = 3i1

max≤≤

aij, j = 4,1 , completăm

coloanele αi, respectiv βj. Şi deoarece α = 3i1

max≤≤αi = 5 = α2, iar β =

4j1min

≤≤βj =

= 5 = β3 rezultă că jocul are punct şa, iar strategiile pure optime ale celor doi

jucători sunt respectiv A2 şi B3, iar valoarea jocului v = a23 = 5.

Page 84: TEORIA JOCURILOR

Modele matematice în economie

2. Să se rezolve jocul de ordinul 2 × 2 cu matricea:

A = ⎟⎟⎠

⎞⎜⎜⎝

⎛−0611

, pe cale matriceală.

Rezolvare

Jocul nu are punct şa deoarece 6 şi 1 nu sunt minime pe liniile lor.

Vom folosi relaţiile (9) de la 2.3.a. Cum ⎪A⎪ = -6 ≠ 0 şi:

A* = ⎟⎟⎠

⎞⎜⎜⎝

⎛−−−

1610

, JA* = (1, 1) ⎟⎟⎠

⎞⎜⎜⎝

⎛−−−

1610

= (-6, -2);

A*JT = ⎟⎟⎠

⎞⎜⎜⎝

⎛−−−

1610

⎟⎟⎠

⎞⎜⎜⎝

⎛−−

=⎟⎟⎠

⎞⎜⎜⎝

⎛71

11

, JA*JT = (-6, -2) ⎟⎟⎠

⎞⎜⎜⎝

⎛11

= -8

rezultă că:

x = ⎟⎠⎞

⎜⎝⎛=−−−=

41,

43)2,6(

81

J*JA*JA

T

yT = ⎟⎟⎠

⎞⎜⎜⎝

⎛=⎟⎟

⎞⎜⎜⎝

⎛−−

−=8/78/1

71

81

J*JAJ*A

T

T

, de unde y = (81 ,

87 )

v = 43

86

J*JA|A|

T =−−

= .

3. Să se rezolve pe cale grafică jocul a cărui matrice este:

⎟⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜⎜

−−

2251431526

Page 85: TEORIA JOCURILOR

Teoria jocurilor

Rezolvare

Observăm că linia a cincea este dominată de linia a treia, deci vom

renunţa la linia a cincea şi jocul va fi de forma 4 × 2,

A =

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

51431526

.

Strategiile jucătorului P2 verifică relaţiile:

6y1 – 2y2 ≤ v

5y1 + y2 ≤ v

3y1 + 4y2 ≤ v

-y1 + 5y2 ≤ v

y1 + y2 = 1

Punând y1 = 1 – y2 în primele 4 inegalităţi, acestea devin:

6 – 8y2 ≤ v

5 – 4y2 ≤ v

y2 + 3 ≤ v

6y2 – 1 ≤ v

şi sunt reprezentate grafic mai jos: v

6

5 5

M 4

3

(d2)

1 y2

-1

-2

(d4)

(d3)

(d1)

Page 86: TEORIA JOCURILOR

Modele matematice în economie

unde am asociat fiecărei inegalităţi (i), dreapta di, i = 4,1 , ce împarte

semiplanele determinate de inegalitatea (i). Porţiunea din plan cuprinsă între

y2 = 0 şi y2 = 1 (y2 este o probabilitate), şi dedesubtul liniei frânte îngroşate

conţine mulţimea punctelor (y2, v) ce verifică cele 4 inegalităţi. Linia

îngroşată conţine punctele cu cea mai mare valoare a lui v, iar dintre acestea

punctul cu cea mai mică valoare dintre cele de pe linia frântă este

M = d2 ∩ d3 şi deci va avea coordonatele date de soluţia sistemului:

5 – 4y2 = v

y2 + 3 = v

de unde y2 = 52 , y1 =

53 iar v = 3, 4, deci y2 şi v satisfac restricţiile 2 şi 3 cu

egalităţi. Teorema ecarturilor ne spune că atunci componentele x2 şi x3 din

problema duală vor fi pozitive.

Deci strategia lui P2 este y = (53 ,

52 ).

Soluţia optimă a jucătorului P1 verifică relaţiile:

6x1 + 5x2 + 3x3 – x4 ≥ v

-2x1 + x2 + 4x3 + 5x4 ≥ v

x1 + x2 + x3 + x4 = 1

în care x2, x3 > 0 iar x1 = x4 = 0. Atunci eliminând prima şi a patra linie din

A va rezulta un joc redus cu matricea:

A1 = ⎟⎟⎠

⎞⎜⎜⎝

⎛4315

.

Determinarea strategiei lui P1 o vom face cu ajutorul formulelor (9)

din 2.3.a, unde:

⎪A1⎪ = 17; A *1 = ⎟⎟

⎞⎜⎜⎝

⎛−

−5314

; JA *1 = (1,1) ⎟⎟

⎞⎜⎜⎝

⎛−

−5314

= (1, 4);

Page 87: TEORIA JOCURILOR

Teoria jocurilor

JA *1 JT = (1, 4) ⎟⎟

⎞⎜⎜⎝

⎛11

= 5 deci:

x = 51

JJAJA

T*1

*1 = (1, 4) = (

51 ,

54 ), deci x2 =

51 , x3 =

54 şi strategia lui

P1 este x = (0, 51 ,

54 , 0).

4. Să se determine prin metodele cunoscute valoarea jocului şi

strategiile jucătorilor pentru cazul în care matricea plăţilor este:

⎟⎟⎟⎟⎟

⎜⎜⎜⎜⎜

−−

3211113254311204

.

Rezolvare

Aplicând principiul strategiilor dominate observăm că linia a doua

are elementele respectiv mai mari ca linia a patra, deci o vom şterge pe

aceasta din urmă. Coloana a treia domină coloana a patra, care va fi ştearsă

şi matricea jocului se va restrânge la:

A = ⎟⎟⎟

⎜⎜⎜

⎛ −

132431204

.

Cercetăm dacă jocul este cu punct şa, adăugând matricei A coloana

αi (a celor mai mici elemente pe linie) şi linia βj (a celor mai mari elemente

pe coloană).

Page 88: TEORIA JOCURILOR

Modele matematice în economie

Obţinem:

B1 B2 B3 αi A1 A2 A3

4 1 2

0 3 3

-2 4 1

-2 1 1

βj 4 3 4

de unde α = maxαi = 1, β = minβj = 3, deci α ≠ β, jocul nu are punct şa, iar

valoarea jocului v ∈ (1, 3).

a) Rezolvăm întâi problema pe cale matriceală, folosind formulele

(9’) din observaţia dată în paragraful 2.3.a.

⎪A⎪ = -30;

⎟⎟⎟

⎜⎜⎜

−−−

−−=∗

121231887669

A

( ) ( ) 15JJA;3,3,9JA;0,10,5JA TT −=−−−=−−= ∗∗∗

( ) ⎟⎠⎞

⎜⎝⎛=−−−== ∗

0,32,

310,10;5

151

JJAJAx T

( ) ⎟⎠⎞

⎜⎝⎛=−−−−== ∗

∗∗

51,

51,

533,3,9

151

JJAJAJ T

21530

JJAA

v T =−−

== ∗

Aplicăm procedeul din observaţia mai sus citată şi verificăm criteriul

lui Neumann, astfel:

( ) J22,2,2132431204

0,32,

31Ax ==

⎟⎟⎟

⎜⎜⎜

⎛ −⋅⎟⎠⎞

⎜⎝⎛=

Page 89: TEORIA JOCURILOR

Teoria jocurilor

TTJ2

222

5/15/15/3

132431204

yA =⎟⎟⎟

⎜⎜⎜

⎛=

⎟⎟⎟

⎜⎜⎜

⎛⋅⎟⎟⎟

⎜⎜⎜

⎛ −=

Deci x şi y sunt o soluţie a jocului cu 2v = .

b) Rezolvăm problema prin programare liniară. Modelul matematic

al jocului scris din punctul de vedere al celui de al doilea jucător cu strategia

( )321 y,y,yy = , va fi:

[ ] .3,1j,1,0y;1yyy

vyy3y2vy4y3yvy2y4

j321

321

321

31

=∈=++

≤++≤++≤−

Cum ( )3,1v∈ deci este pozitiv, împărţim relaţiile de mai sus prin v

şi notăm:

3,1j,vy

Y jj ==

Deoarece P2 urmăreşte să facă minim v, atunci va dori să facă maxim

v1 şi obţinem:

[max]g = v1 = Y1 + Y2 + Y3

3,1j,0Y

1YY3Y21Y4Y3Y1Y2Y4

j

321

321

31

=≥

≤++≤++≤−

Aducem problema la forma standard şi aplicăm algoritmul simplex.

Page 90: TEORIA JOCURILOR

Modele matematice în economie

6,1j,0Y

1YYY3Y21YY4Y3Y1YY2Y4

j

6321

5321

431

=≥

=+++=+++=+−

( )654321 YYY0YYYv1g[max] +++++== .

1 1 1 0 0 0 B CB YB a1 a2 a3 a4 a5 a6

θ

a4 0 1 4 ↓ 0 -2 1 0 0 a5 0 1 1 3 4 0 1 0 a6 0 1 2 3 1 0 0 1

gj 0 0 0 0 0 0 0 0 ∆j=cj-gj 1 1 1 0 0 0

a1 1 1/4 1 0 -1/2↓ 1/4 0 0 - a5 0 3/4 0 3 9/2 -1/4 1 0 1/6 a6 0 2/4 0 3 2 -1/2 0 1 1/4

gj 1/4 1 0 -1/2 1/4 0 0 ∆j=cj-gj 0 1 3/2 -1/4 0 0

a1 1 1/3 1 1/3 0 2/9 1/9 0 a3 1 1/6 0 2/3 1 -1/18 2/9 0 a6 0 1/6 0 5/3 0 -7/18 0 1

gj 1/2 1 1 1 1/6 1/3 0 ∆j=cj-gj 0 0 0 -1/6 -1/3 0

Am ajuns la soluţia optimă care va fi:

2vundede,21

v1gmax === .

;323/12Yvyundede6/1Y,3/1Y 1131 =⋅====

⎟⎠⎞

⎜⎝⎛=

=⋅==

31,0,

32y

:fivaPluistrategiadeci,3/16/12Yvy 233

Page 91: TEORIA JOCURILOR

Teoria jocurilor

.0,32,

31xşi0x;

32x;

31

612vXx

:undede0X,31X,

61X

3211

321

⎟⎠⎞

⎜⎝⎛======

===

Observaţie: Prin metoda b) strategia lui P1 este aceeaşi cu cea din a),

dar strategia lui P2 diferă. Acest lucru a apărut deoarece în rezolvarea prin simplex a problemei, în etapa de optim ∆2 = 0 deşi a2 ∉ B. În acest caz problema are o infinitate de soluţii. Să mai găsim una continuând simplexul cu încă o iteraţie prin introducerea în bază a lui a2 şi eliminarea lui a6.

a1 1 3/10 1 0 0 3/10 1/9 -1/5 a3 1 1/10 0 0 1 1/10 2/9 -2/5 a2 1 1/10 0 1 0 -7/10 0 3/5

gj 1/2 1 1 1 1/6 1/3 0 ∆j=cj-gj 0 0 0 -1/6 -1/3 0

Obţinem aceeaşi valoare v = 2 şi ⎟⎠⎞

⎜⎝⎛= 0,

32,

31x .

Dar ,101Y,

101Y,

103Y 321 === ce conduce la:

,51y,

51y,

53y 321 === adică ⎟

⎠⎞

⎜⎝⎛=

51,

51,

53y soluţie găsită şi prin

metoda a).

Dar dacă o problemă de programare liniară are două soluţii optime:

⎟⎠⎞

⎜⎝⎛=′′⎟

⎠⎞

⎜⎝⎛=′

51,

51,

53yşi

31,0,

32y ea va avea o infinitate de soluţii optime, date

de combinaţia liniară convexă de y' şi y''. Deci P2 are o infinitate de strategii

date de:

( ) ( )

.10,15

23,5

1,15

951,

51,

531

31,0,

32y1yy

≤λ≤⎟⎠⎞

⎜⎝⎛ λ+λ−λ+

=

=⎟⎠⎞

⎜⎝⎛λ−+⎟

⎠⎞

⎜⎝⎛λ=′′λ−+′λ=

Page 92: TEORIA JOCURILOR

Modele matematice în economie

Observaţie: Dacă la metoda matriceală de la punctul a) am fi aplicat

procedeul dat în paragraful 2.3.a, am fi găsit şi altă soluţie pentru jocul

considerat şi orice combinaţie liniară convexă de soluţiile găsite ar fi fost tot

o soluţie a jocului, de unde infinitatea de soluţii dată de algoritmul simplex.

5. Să se rezolve jocul G = (A, B, f) în care matricea plăţilor A este:

B A B1 B2 B3 B4

A1 A2 A3

3 6 2

-1 8 5

0 3 1

7 5 3

Rezolvare

Determinăm valoarea inferioară şi valoarea superioară ale jocului:

αi = 4j1

min≤≤

aij şi Gv = 3i1

max≤≤αi = α

βj = 3i1

max≤≤

aij şi Gv = 4j1

min≤≤βj = β

Avem:

B A B1 B2 B3 B4 αi

A1 A2 A3

3 6 2

-1 8 5

0 3 1

7 5 3

-1 3 1

βj 6 8 3 7

α1 = min⎨3, -1, 0,7⎬ = -1

α2 = min⎨6, 8, 3,5⎬ = 3

α3 = min⎨2, 5, 1,3⎬ = 1

de unde α = max⎨-1, 3, 1⎬ = 3 = Gv .

β1 = max⎨3, 6, 2⎬ = 6; β2 = max⎨-1, 8, 5⎬ = 8;

Page 93: TEORIA JOCURILOR

Teoria jocurilor

β3 = max⎨0, 3, 1⎬ = 3; β4 = max⎨7, 5, 3⎬ = 7;

β = min⎨6, 8, 3, 7⎬ = 3 = Gv .

Cum vG = Gv = 3, rezultă că jocul are punct şa şi P1 va alege numai

strategia A2 iar P2 numai B3, indiferent de numărul partidelor ce se joacă.

6. Să se rezolve jocul matriceal G = (A, B, f) asociat unei situaţii de

concurenţă a două firme, dacă s-a stabilit că matricea jocului este:

B A B1 B2 B3

A1 A2 A3

0 -2 1

-5 2 -1

2 -1 1

Rezolvare

Determinăm vG şi Gv pentru a vedea dacă jocul are punct şa. Avem:

B A B1 B2 B3 αi

A1 A2 A3

0 -2 1

-5 2 -1

2 -1 1

-5 -2 -1

βj 1 2 2

vG = maxαi = max⎨-5, -2, -1⎬ = -1

Gv = minβj = min⎨1, 2, 2⎬ = 1

Din vG ≠ Gv rezultă că jocul nu are punct şa şi valoarea lui

v ∈ (-1, 1).

Căutăm strategiile mixte x = (x1, x2, x3) pentru P1 şi y = (y1, y2, y3)

pentru P2, prin intermediul programării liniare.

Mai întâi transformăm elementele matricei A, pentru a avea v > 0.

Page 94: TEORIA JOCURILOR

Modele matematice în economie

E suficient să adunăm 2 la elementele matricei iniţiale şi avem:

⎟⎟⎟

⎜⎜⎜

⎛ −=

313140432

A = (aij + 2).

Jocul corespunzător matricei A va avea aceleaşi strategii mixte

optime ca jocul iniţial, doar valoarea jocului este v = v + 2, adică cu 2 mai

mare decât valoarea jocului iniţial.

Pentru P2 problema de programare liniară ce trebuie rezolvată va fi:

2y1 – 3y2 + 4y3 ≤ v

4y2 + y3 ≤ v

3y1 + y2 + 3y3 ≤ v

y1 + y2 + y3 = 1

yj ≥ 0, j = 3,1

Cu v > 0, Yj = v

y j şi v1 = [max]g, avem:

[max]g = v1 = Y1 + Y2 + Y3

2Y1 – 3Y2 + 4Y3 + Y4 = 1

4Y2 + Y3 + Y5 = 1

3Y1 + Y2 + 3Y3 + Y6 = 1

Yj ≥ 0, j = 6,1 .

Rezolvăm problema aplicând algoritmul simplex.

Page 95: TEORIA JOCURILOR

Teoria jocurilor

1 1 1 0 0 0 B CB YB a1 a2 a3 a4 a5 a6 θ

a4 0 1 2 -3 ↓ 4 1 0 0 - a5 0 1 0 4 1 0 1 0 1/4 a6 0 1 3 1 3 0 0 1 1/3

gj 0 0 0 0 0 0 0 ∆j=cj-gj 1 1 1 0 0 0

a4 0 7/4 4 ↓ 0 19/4 1 3/4 0 7/16 a2 1 1/4 0 1 1/4 0 1/4 0 - a6 0 3/4 3 0 11/4 0 -1/4 1 3/12

gj 1/4 0 1 1/4 0 1/4 0 ∆j=cj-gj 1 0 3/4 0 -1/4 0

a4 0 3/4 0 0 13/12 1 13/12 -4/3 a2 1 1/4 0 1 1/4 0 1/4 0 a1 1 1/4 1 0 11/12 0 -1/2 1/3

gj 1/2 1 1 7/6 0 1/6 1/3 ∆j=cj-gj 0 0 -1/6 0 -1/6 -1/3

Am ajuns la soluţia optimă care este:

[max]g = v1 =

21 , de unde v = 2

Y1 = vy1 =

41 , de unde y1 = 2

41 =

21 ; Y2 =

41 , de unde y2 =

21 ,

y3 = 0;

X2 = 61 =

vx1 , de unde x2 = 2

61 =

31 ; X3 =

31 , de unde x3 =

32 ;x1 = 0

deci: x = (0, 31 ,

32 ), y = (

21 ,

21 ,0) iar v = v - 2 = 2 – 2 = 0.

Echilibrul realizat se manifestă aici prin anularea câştigului fiecărui

participant.

7. O familie se aprovizionează pentru iarnă cu cărbune de un anumit

tip. Cantitatea necesară şi condiţiile de aprovizionare sunt date în următorul

tabel [10]:

Page 96: TEORIA JOCURILOR

Modele matematice în economie

Iarna Cantitatea necesară în tone

Preţ unitar u.m./t

Uşoară Obişnuită

Grea

4 5 6

70 75 80

Dacă aprovizionarea se face vara, preţul unitar este de 60 u.m./t.

Se cere:

a) să se scrie matricea plăţilor ştiind că aprovizionarea se face în

timpul verii;

b) să se decidă strategia prin criteriul maximin;

c) să se decidă strategia prin criteriul minimax;

d) să se decidă strategia prin criteriul Savage;

e) să se decidă strategia când stările iernii sunt egal probabile;

alternativ, când probabilităţile sunt respectiv 0,2; 0,5 şi 0,3;

f) pentru α = 0,75 să se determine strategia optimă prin criteriul

Hurwicz.

Rezolvare

a) Matricea asociată jocului generat de problema dată va fi:

Strategia iernii

Cantitatea contractată

uşoarăS1:4t

obişnuită S2:5t

grea S3:6t

A1:4t A2:5t A3:6t

-240 -300 -360

-315 -300 -360

-400 -380 -360

unde, de exemplu, elementul de pe linia lui A2 şi coloana lui S3 s-a calculat

astfel: s-au cumpărat 5t a câte 60 u.m. pentru care s-au plătit 300 u.m.; iarna

Page 97: TEORIA JOCURILOR

Teoria jocurilor

fiind grea, mai este nevoie de o tonă ce se cumpără iarna cu preţul de 80

u.m., deci în total cheltuielile vor fi de 380 sau în matricea câştigurilor lui P1

vom scrie -380.

b) În aplicarea criteriului maximin se alege minimul elementelor de

pe fiecare linie şi dintre acestea se determină maximul, astfel:

A1 A2 A3

-400 -380 -360

Cel mai mare este -360 şi indică alegerea strategiei A3.

c) Criteriul minimax recomandă alegerea elementului maxim de pe

fiecare linie şi apoi determinarea celui mai mic dintre acestea.

A1 A2 A3

-240 -300 -360

Cel mai mic este -360 şi corespunde strategiei A3.

d) Formăm matricea R a regretelor din A scăzând din cel mai mare

element al unei coloane toate elementele coloanei respective. Obţinem:

R = ⎟⎟⎟

⎜⎜⎜

0601202006040150

.

Determinăm apoi în R cel mai mare element pe fiecare linie şi apoi

cel mai mic dintre acestea. Obţinem:

A1 A2 A3

40 60 120

Cel mai mic este 60 şi recomandă strategia A2.

Page 98: TEORIA JOCURILOR

Modele matematice în economie

e) În ipoteza că stările Si, i = 3,1 , sunt egal probabile, vom calcula

cheltuielile medii pentru fiecare strategie Ai, i = 3,1 . Astfel:

ϕ(1, y) = 31 (-240) +

31 (-315) +

31 (-400) = -

3955

ϕ(2, y) = - 3

980 şi ϕ(3, y) = - 3

1080 .

Cea mai mare dintre aceste sume este ϕ(1, y) şi recomandă A1. Dacă

stările nu sunt egal probabile ci au respectiv probabilităţile: 0,2; 0,5; 0,3,

cheltuielile medii vor fi:

ϕ(1, y) = 0,2(-240) + 0,5(-315) + 0,3(-400) = -325, 5

ϕ(2, y) = 0,2(-300) + 0,5(-300) + 0,3(-380) = -324

ϕ(3, y) = 0,2(-360) + 0,5(-360) + 0,3(-360) = -360

şi cea mai mică cheltuială este ϕ(2, y) şi recomandă A2.

f) Ataşăm matricei iniţiale A coloanele elementelor mi = 3j1

min≤≤

aij şi

Mi = 3j1

max≤≤

aij, apoi coloana elementelor αMi + (1 - α)mi, astfel:

Si Ai

S1 S2 S3 mi Mi αMi+(1-α)mi

A1 A2 A3

-240 -300 -360

-315 -300 -360

-400 -380 -360

-400 -380 -360

-240 -300 -360

160α-400 80α-380

-360

Pentru α = 0,75, corespunzător lui A1, obţinem pe ultima coloană

160 ⋅ 0,75 – 400 = - 280; pentru A2, 80 ⋅ 0,75 – 380 = -320 şi pentru A3,

- 360. Cea mai mică cheltuială este pentru A1.

Page 99: TEORIA JOCURILOR

Teoria jocurilor

8. Să se elimine strategiile dominate şi să se cerceteze existenţa

punctelor de echilibru Nash (în strategii pure) pentru următorul joc

bimatriceal.

P2 P1

B1 B2 B3 B4

A1 A2 A3 A4

(5,4) (2,7) (6,8) (3,2)

(3,1) (3,4) (1,3) (4,7)

(9,0) (1,3) (0,2) (2,4)

(4,2) (0,1) (3,5) (2,6)

Rezolvare

Se observă mai întâi că strategia A4 a jucătorului P1 domină strict

strategia A2 (oricare ar fi strategia de răspuns Bj a lui P2, avem a4j > a2j).

După eliminarea lui A2, care nu afectează punctele de echilibru, observăm

că strategia B4 a lui P2 domină strict pe B3 (deoarece 2 > 0, 5 > 2 şi 6 > 4).

După ce B3 este suprimată şi ea, obţinem un tabel restrâns.

B1 B2 B4 A1 A3 A4

(5,4) (6,8) (3,2)

(3,1) (1,3) (4,7)

(4,2) (3,5) (2,6)

În această fază nu vom mai găsi strategii dominate. Urmând

procedura de determinare a răspunsurilor optime, pe linii şi pe coloane, vom

obţine marcările de mai jos:

B1 B2 B4 A1 A3 A4

(5,4) (6,8) (3,2)

(3,1) (1,3) (4,7)

(4,2) (3,5) (2,6)

Cum singurele perechi de câştiguri cu două sublinieri sunt (6,8) şi

(4,7), rezultă că (A3, B1) şi (A4, B2) sunt puncte de echilibru ale jocului (în

strategii pure). Observând câştigurile corespunzătoare, se poate spune că

Page 100: TEORIA JOCURILOR

Modele matematice în economie

(A3, B1) este preferabil lui (A4, B2) pentru ambii jucători şi deci poate

constitui soluţia jocului.

9. Să se construiască un joc bimatriceal care să admită un punct de

echilibru format din strategii pure de tip maximin.

Rezolvare

Fie jocul cu sumă arbitrară dat prin matricea:

B1 B2 A1 A2

(4,5) (2,6)

(3,4) (5,7)

Se observă, fără dificultate, că (A1, B1) şi (A2, B2) sunt puncte de

echilibru Nash al jocului. În acelaşi timp, avem valorile maximin:

2,1imax= 2,1j

min=

aij = max⎨min⎪⎨4,3⎬, min⎨2,5⎬⎬ = max⎨3,2⎬ = 3

2,1imax= 2,1j

min=

bij = max⎨min⎪⎨5,6⎬, min⎨4,7⎬⎬ = max⎨5,4⎬ = 5

Deci A1 e strategia maximin a lui P1 şi B1 e strategia maximin a lui

P2. Se confirmă, pe de altă parte, faptul că orice punct de echilibru îi promite

fiecărui jucător un câştig mai mare sau egal cu valoarea maximin

corespunzătoare lui a jocului.

10. Să se arate că jocul în formă normală de mai jos nu admite

puncte de echilibru Nash în strategii mixte:

B1 B2 B3 A1 A2

(1,0) (0,3)

(1,2) (0,1)

(0,1) (2,0)

Page 101: TEORIA JOCURILOR

Teoria jocurilor

Rezolvare

Fie (p, q, 1 – p – q) o strategie mixtă pe B = ⎨B1, B2, B3⎬.

Avem deci p, q ≥ 0 şi p + q ≤ 1. Căutăm răspunsul optim al lui P1 la

această strategie a lui P2. Dacă P1 foloseşte strategia A1 atunci îi revine un câştig mediu egal cu p + q, iar dacă foloseşte strategia A2, câştigul mediu

este 2(1 – p – q). Comparându-le, se deduce imediat că dacă p + q ∈ [0, 2/3)

cel mai bun răspuns este A2 în timp ce pentru p + q ∈ (2/3, 1], cel mai bun răspuns este A1.

Cazul p + q = 32 nu face deosebire între A1 şi A2 ca replici optime

ale lui P1. Dacă vom considera o strategie mixtă (r, 1 – r) pe A = ⎨A1, A2⎬,

0 ≤ r ≤ 1, câştigurile medii ale lui P2 vor fi egale cu 3 – 3r, r + 1 sau r, după

cum foloseşte strategiile pure B1, B2 sau B3, respectiv. Din inegalităţile

3 – 3r > r + 1 > r reiese că răspunsul optim al lui P2 este B1, pentru

r < 21 şi B2, pentru r >

21 . În cazul r =

21 , se reţin ca cel mai bun răspuns

oricare dintre strategiile B1 sau B2. Să presupunem că punctele de echilibru ale jocului sunt de forma

((r*, 1 – r*), (p*, q*, 1 – p* - q*)). Vom analiza situaţiile posibile pentru r*:

I. Dacă r* ∈ [0, 21 ), răspunsul optim al lui P2 este B1, căruia i-ar

corespunde ca strategie mixtă valorile p* = 1, q* = 0, ceea ce

înseamnă că p* + q* = 1 > 32 şi, în replică, am avea strategia

optimă A1 a lui P1. Cum A1 poate fi identificată cu strategia mixtă (1, 0), rezultă r* = 1, contrazicând ipoteza iniţială;

Page 102: TEORIA JOCURILOR

Modele matematice în economie

II. În cazul r* = 21 , orice strategie mixtă a lui P2 de forma

(λ, 1-λ, 0), 0 ≤ λ ≤ 1 este un răspuns optim. Discuţia continuă ca

mai înainte şi se ajunge la concluzia r* = 1 ≠ 21 ;

III. Dacă r* ∈ (21 , 1), replica cea mai bună a lui P2 este B2; ei îi

corespund valorile p* = 0, q* = 1 şi cum p* + q* > 32 , răspunsul

optim al lui P1 e din nou A1. Obţinem, ca mai sus, r*= 1∉(21 ,1);

IV. Ultima posibilitate, r* = 1 ne conduce la o strategie de răspuns cu p* = 0, q* = 1 şi, de această dată, cu răspunsul în oglindă al lui P1, lanţul deducţiilor se închide. Am obţinut astfel un punct de echilibru în strategii pure, ((1,0), (0,1,0)), fapt ce clarifică cerinţa problemei vis-à-vis de teorema lui Nash. Să mai observăm că, deoarece strategia B3 este strict dominată, componenta corespunzătoare ei într-o strategie optimă a lui P2 nu putea fi decât nulă.

11. ([12]) Două firme cu profile asemănătoare de activitate oferă fiecare câte un loc de muncă. Să presupunem că se plătesc salarii diferite:

firma i plăteşte salariul si, unde (1/2) s1 < s2 < 2s1. Să presupunem că există doi lucrători ce doresc să se angajeze, dar fiecare nu poate opta decât pentru o singură firmă, acest lucru făcându-se simultan. Dacă numai câte un singur lucrător îşi oferă serviciile unei firme, el este angajat.

Dacă ambii lucrători optează pentru aceeaşi firmă, aceasta angajează pe unul dintre ei, la întâmplare, iar celălalt rămâne, pe mai departe, fără serviciu (şi cu o plată presupusă nulă). Să se găsească soluţia în strategii de echilibru Nash a acestui joc.

Page 103: TEORIA JOCURILOR

Teoria jocurilor

Rezolvare Vom construi pentru început forma normală a jocului descris.

Jucătorii sunt cei doi lucrători, strategiile lor constând din opţiunile pe care le fac pentru firma 1 sau firma 2 şi pe care le notăm cu A1, A2, respectiv B1,

B2. Vom nota, ca de obicei, cu f1(⋅,⋅) şi f2(⋅,⋅) respectiv, funcţiile de câştig ale jucătorilor. Considerând utilităţile imediate ale celor doi lucrători, rezultate în urma alegerilor făcute, putem construi următoarea matrice de plăţi (în ipoteza şanselor egale):

B1 B2 A1

A2

(21 s1,

21 s1)

(s2,s1)

(s1,s2)

(21 s2,

21 s2)

Ţinând seama de ipotezele 21 s1 < s2 şi

21 s2 < s1, vom putea scrie:

f1(A1, B2) = s1 > 21 s2 = f1(A2, B2)

f2(A1, B2) = s2 > 21 s1 = f2(A1, B1)

de unde rezultă că (A1, B2) este punct de echilibru Nash.

Asemănător, obţinem relaţiile:

f1(A2, B1) = s2 > 21 s1 = f1(A1, B1)

f2(A2, B1) = s1 > 21 s2 = f2(A2, B2)

ceea ce arată că şi (A2, B1) este un punct de echilibru Nash.

Faptul că fiecare lucrător este angajat dacă se optează pentru una sau

cealaltă dintre perechile de strategii discutate vine în acord cu ideea de

echilibru, chiar dacă unul dintre jucători poate să nu fie mulţumit pe deplin

cu salariul pe care îl obţine.

Page 104: TEORIA JOCURILOR

Modele matematice în economie

Dacă fiecare jucător ţine la şansa sa de a fi angajat şi de a primi un

salariu mai bun, atunci are sens considerarea strategiilor mixte.

Fie (y, 1-y) o strategie mixtă a lui P2. Atunci câştigul mediu al lui P1

va fi dat de:

21 ys1 + (1 – y)s1 = s1 -

21 ys1, sau

ys2 + 21 (1 – y) s2 =

21 s2 +

21 ys2, după cum foloseşte strategia pură

A1 sau A2.

Din inegalitatea s1 - 21 ys1 >

21 s2 +

21 ys2, rezultă că pentru

y ∈ ⎢⎣

⎡⎟⎟⎠

⎞+−

21

21

ssss2,0 cel mai bun răspuns al lui P1 la strategia mixtă a lui P2 este

A1, iar pentru y ∈ ]⎜⎜⎝

⎛+− 1,ssss2

21

21 , acesta este A2 (să observăm că s1 < 2s2 e

echivalent cu 2s1 – s2 < s1 + s2).

O analiză similară se face pornind de la o strategie mixtă (x, 1 – x)

pe ⎨A1, A2⎬. Urmând procedeul de rezolvare descris în soluţia la problema

10, vom obţine următorul punct de echilibru Nash în strategii mixte:

⎟⎟⎠

⎞⎜⎜⎝

⎛⎟⎟⎠

⎞⎜⎜⎝

⎛+−

+−

⎟⎟⎠

⎞⎜⎜⎝

⎛+−

+−

21

12

21

21

21

12

21

21

ssss2,

ssss2,

ssss2,

ssss2 .

Desigur că în acest exemplu de joc nu se pune problema repetării

sale de un număr de ori care să permită alternarea strategiilor.

Metoda de decizie pentru oricare jucător este să folosească un

generator de numere aleatoare (de tipul funcţiei RND a unui calculator de

buzunar); dacă valoarea generată se găseşte în intervalul (0, 21

21

ssss2

+− ),

atunci el va alege strategia A1(B1), altfel va juca A2(B2).