Curs 8 - Alexandru Ioan Cuza Universitydcristea/cursuri/IA/2017-2018/Curs8 Jocuri.ppt.pdf ·...

Curs 8

Jocuri

Regulile de joc •  Doi jucători: MAX şi MIN •  Fiecare are ca obiectiv câştigarea jocului •  Doar unul poate câştiga sau se poate obține

remiză •  În modelarea iniţială nu intervine şansa

–  dar ea poate fi simulată •  Exemple:

–  şah –  checkers –  tic-tac-toe –  ...

Jocul tic-tac-toe

MAX joacă cu X-uri MIN joacă cu O-uri

Jocul tic-tac-toe

Remiză!

Jocul tic-tac-toe

MAX câştigă

Reprezentarea ca o problemă de IA

1.  Problemă versus instanţă 2.  Spaţiul stărilor:

–  o stare: poziţia pe tabla a semnelor între două mutări –  dimensiunea spaţiului: 39

3.  Reprezentarea unei stări: –  o matrice 3x3

4.  Reprezentarea unei tranziţii –  algoritmic (în abordarea de faţă)

5.  Cum controlăm evoluţia jocului? –  metoda MIN-MAX –  metoda ALPHA-BETA

Arborele de joc

o clasă de simetrie

Arborele de joc

Valoarea unei stări

Câştig pentru MAX: +∞

Valoarea unei stări

Câştig pentru MIN: -∞

Evaluarea unei stări

O stare este mai bună dacă deschide mai multe posibilităţi de câştig până la sfârşitul jocului. Un exemplu de funcţie de evaluare:

valoarea stării este diferenţa dintre numărul de linii pe care le mai poate completa MAX şi cele pe care le mai poate completa MIN.

1 2 3 4 5 6 7 8

8 - 1 2 3 4 = 3 5

Liniile fără nici un semn pot fi luate de ambii jucători...

Liniile fără nici un semn pot fi luate de ambii jucători... 3 - = 3 0

2 1 2 3 3 = -1 -

Evaluarea: de jos în sus

0 -1 1 0

0 -1 1 0 -1 -1

0 -1 1 0

0 -2 -1 0

0 -1 1 0

MAX -1 -2

O dezvoltare a spaţiului de joc pe o adâncime de 2 duce la

concluzia că jucătorul care joacă primul are o şansă de câştig în

plus dacă ocupă centrul

MAX alege mutarea cea mai bună pentru el

MIN -1

MAX gândeşte: MIN alege mutarea cea mai

bună pentru el = cea mai proastă pentru mine

Metoda MIN-MAX function min-max(state, player, depth) begin if (depth = 0) then return score(state); val = worst(player); while (mai sunt stări de generat) begin generez o stare -> s; val <- back-up-compare(val, min-max(s, not(player), depth-1), player);

// următoarea mişcare micşorează spaţiul de căutare în cazul în care se obţine poziţia de câştig într-una // din stările generate:

if (val = -worst(player)) return(val); end return(val); end function worst(player) begin if player = MAX then return -∞; else return +∞; end funtion back-up-compare(val1, val2, player) begin if player = MAX then return max(val1, val2); else return min(val1, val2); end

Apelul:

min-max( ,MAX,2)

while (mai sunt stări de generat) begin generez o stare -> s; ... end

val=-1; player = MAX; depth=1;

0 -1 1 0

val=-1; player = MAX; depth=2;

while (mai sunt stări de generat) begin generez o stare -> s; val <- back-up-compare(val, min-max(s, not(player), depth-1), player); if (val = -worst(player)) return(val); end

min-max( ,MIN,1)

0 -1 1 0

val = worst(player); while (mai sunt stări de generat) begin generez o stare -> s; val <- back-up-compare(val, min-max(s, not(player), depth-1), player); if (val = -worst(player)) return(val); end

0 -1 1 0

val=∞

min-max( ,MIN,1)

if (depth = 0) then return score(state);

0 -1 1 0

min-max( ,MAX,0)

0 -1 1 0

min-max( ,MIN,1)

val <- back-up-compare(val, -1, player); if (val = -worst(player)) return(val); end

val=∞; player=MIN;

-2 -1 0

0 -1 1 0

min-max( ,MIN,1)

-2 -1 0

0 -1 1 0

min-max( ,MIN,1)

-2 -1 0

0 -1 1 0

min-max( ,MIN,1)

-2 -1 0

Metoda alpha-beta

0 -1 1 0

La acest nivel se calculează un maxim.

Un moment din dezvoltarea arborelui în care apare o situaţie particulară:

Acest maxim (valoarea nodului rădăcină) nu poate fi mai mic decât -1!

Metoda alpha-beta

0 -1 1 0

La acest nivel se calculează un minim.

Orice valoare a nodului părinte poate fi mai mică sau egală cu -1.

Metoda alpha-beta

0 -1 1 0

La acest nivel se calculează un minim.

Orice valoare a nodului părinte poate fi mai mică sau egală cu -1.

Ea nu mai poate influenţa valoarea nodului rădăcină!

Generarea poate fi oprită!

Metoda alpha-beta

0 -1 1 0

Metoda alpha-beta function alpha-beta(state, player, depth) begin if (depth = 0) then return score(state); val = worst(player); while (mai sunt stări de generat) begin generez o stare -> s; newval <- alpha-beta(s, not(player), depth-1);

if player=MAX & newval ≤ val then return(newval); else if player=MIN & newval ≥ val then return(newval); else val ! back-up-compare(val, min-max(s, not(player), depth-1), player);

// următoarea mişcare micşorează spaţiul de căutare în cazul în care se obţine poziţia de câştig // într-una din stările generate: if (val = -worst(player)) return(val); end return(val); end

function worst(player) begin if player = MAX then return -∞; else return +∞; end function back-up-compare(val1, val2, player) begin if player = MAX then return max(val1, val2); else return min(val1, val2); end

Apelul:

alpha-beta ( ,MAX,2)

Curs 8 - Alexandru Ioan Cuza Universitydcristea/cursuri/IA/2017-2018/Curs8 Jocuri.ppt.pdf ·...

Documents

Transcript of Curs 8 - Alexandru Ioan Cuza Universitydcristea/cursuri/IA/2017-2018/Curs8 Jocuri.ppt.pdf ·...

UNIVERSITATEA SPIRU HARET FACULTATEA DE RELATII ...sjpa-b.spiruharet.ro/images/secretariat/secretariat-facultate-sjpa/... · cei şase jucători principali din partida internaţională

Biochimie - mail.uaic.romarius.mihasan/teaching/pdfs/biochemistry/Curs8... · B.1.b. Sfingofosfatidele 15.04.2019 Biochimie Curs VIII Sfingofosfatidele–sunt fosfolipidece conțin

bd-curs8-ppt bun 2

LIGA I ˜ ETAPA A XIX˜A …storage0.dms.mpinteractiv.ro/media/401/581/7912/10380051/...jucători la “U”. Doi dintre aceștia, Cleiton și Paulinho, au luat carto-nașe roșii

Chimie Anorganica I-curs8

Curs8 Rezidenti

Topul celor mai valoroase companii: 100 de jucători de 55 ...

ISBN 978-606-722-346-0 Del Potro.pdf · IRACO DE POTRO Sebastián Torok 12 13 Jucători – bărbați şi femei –, rude, antrenori, promotori, ziarişti, ball boys*, foşti jucători

Cepe curs8 proiector

Biblioteca de clase din cadrul de lucrumapetrii/fisiere/POO/Curs8.pdf · programului, interacţiunea cu depanatorul, lansarea proceselor de sistem etc. Spaţiul de nume IO Spaţiul

continuturile curiculare curs8

curs8 metalurgia pulberilor

Curs8 9 Inginerie Citotisulara

Socio-Medicală la Domiciliu “CASMED” 2016casmed.md/upload/file/CASMED-activity report-2016-ro.pdf · partidelor. Cei mai strategi și atenți jucători s-au ales cu premii, cea

Modelare - Curs8

Circuite integrate digitale - WikiLabswiki.dcae.pub.ro/images/d/db/Curs8.pdfCircuite integrate digitale Curs 8 2014 CID curs 8 2 Cuprins algoritmul de minimizare (continuare) hazardul

Operatii de intrare-iesire - math.uaic.rocgales/csharp/Curs8.pdf · clasa BinaryFormatter din spatiul de nume System.Runtime.Serialization.Formatters.Binary, care permite serializarea

curs8.Planificarea proiectului

· Web viewtaxă de participare la diferite competiţii naţionale, internaţionale şi olimpice. Taxă de transfer sau legitimare jucători, servicii contra incendiilor, servicii

Microsoft Power Point Curs8-Diagrafia Geofizica