Teoria jocurilor

Post on 11-Aug-2015

49 views 6 download

Transcript of Teoria jocurilor

Teoria jocurilor

• Teoria jocurilor (The Game Theory) poate fi denumită şi “teoria deciziilor interactive, ea având ca obiect analiza comportamentului unor decidenţi raţionali independenţi („jucători”), ale căror decizii se influenţează reciproc.

Evoluţia ideilor de bază ale teoriei jocurilor• Perioada 1910-1930: ☺ se pun bazele teoriei☺ se definesc concepte şi instrumente de bază ale teoriei: structura jocului

(matricială şi extinsă), strategia (planul complet al jucătorului pentru a juca jocul), tipurile de strategie (pură şi mixtă), conceptul de raţionalitate individuală, teorema minimax.

• Perioada 1930-1950: marcată de apariţia lucrării “Theory of Games and Economic Behaviour, de John von Neumann şi Oskar Morgenstern:

☺ se face distincţia între jocurile cooperative şi cele noncooperative☺ se definesc conceptele de soluţie a jocului şi de strategie dominantă☺ se introduce conceptul de utilitate aşteptată şi cel de utilitate transferabilă (TU).

• Perioada 1950-1960:☺ marcată de contribuţia lui John Nash cu conceptul generalizat de echilibru☺ este analizat modelul “dilema prizonierului”, atribuit lui A.W. Tucker.

• Perioada 1960-1970: dezvoltarea teoriei prin analiza jocurilor cu informaţie incompletă şi a jocurilor de coaliţie cu utilităţi netransferabile (NTU), a celor cu mai mulţi jucători.

• Perioada 1970-1990:☺ aplicarea teoriei în domeniile politic şi economic, în biologie; a ☺ definirea conceptului de raţionalitate limitată (bounded rationality).

Componentele minimale ale unui joc sunt :

• Strategiile jucătorilor:

“pure” (se alege o singură strategie)

“mixte” (se aleg două sau mai multe strategii potrivit unei distribuţii de probabilităţi);

•Câştigurile: reprezentate de exemplu prin funcţia de utilitate;

•Regulile jocului

jocurile pot fi statice (când deciziile jucătorilor se iau simultan, după care jocul ia sfârşit)

jocurile dinamice (când deciziile se iau secvenţial, urmărindu-se evoluţia în timp a

jucătorilor);

•Dotarea iniţială: alocarea resurselor către jucători; din acest punct de vedere jocurile pot

fi cu informaţie completă (fiecare jucător cunoaşte numărul, strategiile, funcţiile de câştig

şi regulile jocului) sau cu informaţie incompletă.

Componentele minimale ale unui joc

• Strategiile jucătorilor, care pot fi “pure” (se alege o singură strategie) sau “mixte” (se aleg două sau mai multe strategii potrivit unei distribuţii de probabilităţi);

• Câştigurile , reprezentate de exemplu prin funcţia de utilitate;

• Regulile jocului; jocurile pot fi statice (când deciziile jucătorilor se iau simultan, după care jocul ia sfârşit) şi dinamice (când deciziile se iau secvenţial, urmărindu-se evoluţia în timp a jucătorilor);

• Dotarea iniţială, respectiv alocarea resurselor către jucători; din acest punct de vedere jocurile pot fi cu informaţie completă (fiecare jucător cunoaşte numărul, strategiile, funcţiile de câştig şi regulile jocului) sau cu informaţie incompletă.

Jocul „ Matching Pennies „

• Un exemplu celebru – şi care provine din „jocul de potrivire a banilor” - se referă la două părţi care pot aplica , fiecare, strategiile A şi B . Când ambii jucători aplică aceeaşi strategie, A sau B ( banii „ se potrivesc”), respectiv atât jucătorul 1 ,cât şi jucătorul 2, arată faţa, respectiv versoul monedei , câştigă jucătorul 1. Când cei doi aplică strategii diferite ( banii „nu se potrivesc”, unul arată faţa, celălalt, verso), câştigă jucătorul 2.

Jocul motocicliştilor

M2

M1

A D

A (c,c) (p,o)

D ( o,p) (-, -)

Semnificaţia matricei este următoarea:•dacă M1 şi M2 merg înainte (A,A) motocicliştii se vor ciocni, situaţia este de risc maxim pentru ambii jucători (c,c);•dacă M1 merge înainte, iar M2 deviază (A,D), primul va câştiga premiul (p), iar al doilea pierde jocul (o);•simetric, (D,A) îl face pe M1 să piardă, în favoarea lui M2;•dacă ambii motociclişti deviază (D,D), jocul nu este jucat (-,-).

Dilema prizonierului

(P1)

D T

D (î. Î) (L*, S)

T (S, L*) (L, L)

Semnificaţia matricei este următoarea:-dacă P1 îl denunţă pe P2 şi P2 îl denunţă pe P1 (D+D) ei vor fi condamnaţi la închisoare pentru o perioadă scurtă (Î,Î);-dacă P1 îl denunţă pe P2, iar P2 tace (D+T), P1 va fi eliberat, primind şi o sumă bănească importantă drept recompensă, iar P2 va fi spânzurat (L*,S);-în situaţia simetrică (T+D), P1 va fi spânzurat, P2 va fi eliberat cu recompensă;-dacă amândoi tac (T+T), ei vor fi eliberaţi (L,L).

(P2)

Jocul de negociere ( bargaining) al lui Nash

Jucător1

Propunere 1 Propunere 2

Propunere 1 5, 3 0,0

Propunere 2 0,0 1,10

Jucător2