Proiect - Exemplu

21
Metode si Tehnici de Prognoza Proiect 1/31/2014 AAMM Serban Pisica

description

proiect

Transcript of Proiect - Exemplu

Page 1: Proiect - Exemplu

Metode si Tehnici de Prognoza Proiect 1/31/2014 AAMM Serban Pisica

Page 2: Proiect - Exemplu

2

Contents Capitolul 1: Teorie ......................................................................................................................................... 3

Introducere ............................................................................................................................................... 3

Metode de prognoza................................................................................................................................. 4

Context .................................................................................................................................................. 4

Metoda mediilor mobile ....................................................................................................................... 5

Metoda linear smoothing ..................................................................................................................... 6

Metoda exponential smoothing ........................................................................................................... 6

Erori ........................................................................................................................................................... 8

Capitolul 2: Aplicare pe un exemplu ........................................................................................................... 11

Date ......................................................................................................................................................... 11

Metode de prognoza............................................................................................................................... 14

Metoda mediilor mobile ..................................................................................................................... 14

Linear smoothing ................................................................................................................................ 16

Exponential smoothing ....................................................................................................................... 17

Erori ......................................................................................................................................................... 19

In concluzie ................................................................................................................................................. 21

Page 3: Proiect - Exemplu

3

Capitolul 1: Teorie

Introducere

Capacitatea de a prezice viitorul ar fi extrem de utila. Unii ar spune ca daca am stii tot, tot ce a fost si ce va fi, si totul ar avea un curs bine stabilit, viata nu ar mai fi interesanta. Totul ar urma unui curs pe care il stim foarte bine si, deci, totul ar fi plictisitor. Unii chiar cauta sa mareasca gradul de incertitudine pe care trebuie sa il infrunte, si chiar si sa mareasca miza rezultatului incert, simtind ca asa viata lor va fi mai interesanta. De aceea exista jucatorii de noroc sau cei cu simt de aventura etc. Newton a zis ca daca am stii pozitia si impulsul fiecarei particule din univers la un moment dat, am stii tot ce a fost si ce va fi crezand cu fermitate intr-un univers determinist, fizica dezvoltata de el demonstrand acest model. De atunci fizica a evoluat, inclusiv in sensul dezvoltarii a intregi noi domenii total diferite de ce si-ar fi putut imagina Newton. In prezent, fizica cuantica este avangarda stiintei, iar aceasta demonstreaza un univers probabilistic, chiar indeterminabil. Conform fizicii cuantice, toate evenimentele au o probabilitate atasata. Nimic nu e sigur, exista doar sansa ca ceva sa se intample intr-un fel sau in alt fel, iar aceasta este o proprietate a insasi stofei realitatii. Unele fenomene au probabilitate 50-50, fiind total imprevizibile precum descompunerea nucleara intr-o anumita unitate de timp (a se vedea celebrul experiment mental „Pisica lui Shrodinger”). Alte fenomene sunt probabilistice, dar nu chiar atat de indeterminabile. Conform mecanicii cuantice, daca o particula este prinsa intr-un recipient energetic la un anumit nivel energetic, conform fizicii cuantice nu putem sti exact unde e, dar putem sa calculam distributia probabilitatii pozitiei acesteia. Daca, de exemplu, sunt 80% sanse sa se afle in centrul recipientului, acela este un exemplu de fenomen probabilistic, dar determinabil – nu stim sigur unde e, dar stim ca sansele sa se afle in centru sunt 80%. Desigur, fizica cuantica are o influenta infima la nivel macroscopic, toate legile sale aproximand la acel nivel pe cele newtoniene. Numai rareori au fenomenele cuantice efecte macroscopice. Traim, in concluzie intr-un univers probabilistic, dar totusi determinist. Newton nu a avut perfecta dreptate, nu putem spune cu precizie ce se va intampla in viitor, dar a fost pe aproape. Se pot face presupuneri care, daca sunt realizate suficient de inteligent, pot fi foarte probabil a se realiza. Nu putem face preziceri precise despre viitor, spre bucuria celor care isi doresc viitorul sa ramane incert, nu exista „crystal ball”, dar exista prognoze.

Indiferent de dezbaterile filozofice privind gradul de determinism al universului si de cele poetice privind ce e mai frumos, un viitor incert sau cert, exista o nevoie foarte mare de prognoze pentru scopuri practice. Multe domenii au nevoie mare, sau chiar se bazeaza pe, a stii ce urmeaza sa se intample. Nu se stie sigur niciodata, asadar orice prognoza poarta cu sine un risc. Nu se poate stii niciodata exact ce se intampla in viitor, insa datorita acestor nevoie practice uriase, s-a dezvoltat o intreaga stiinta in jurul realizarii de prognoze, o stiinta care realizeaza presupuneri despre viitor si care gestioneaza riscurile asociate acestor presupuneri. Exemple de domenii includ ingineria, unde este foarte important ca un aparat sau o constructie sa poata opera in conditiile cele mai probabil sa se abata asupra sa. Meteorologia este un alt exemplu, oferindu-ne prognoza meteo, de care depinde totul de la micile pregatiri din viata personala, de exemplu daca sa ne imbracam mai gros sau mai subtire, si pana la masurile de securitate nationale in caz de dezastre naturale. Alte domenii includ cele economice. Un guvern are nevoie de prognoze privind evolutia PIB-ului, productivitatii, surselor de impozite, pentru a pregati bugetul pe anul

Page 4: Proiect - Exemplu

4

urmator. Sistemul financiar-bancar este in totalitate construit pe riscuri si prognoze. Inclusiv, si aici este cel mai important pentru masterul AAMM, afacerile individuale depinde de prognoze, acestea functionand in mare parte in cicluri, si trebuie realizate pregatiri in cadrul unui ciclu pentru cel urmator, cum este de exemplu, comanda pentru materie prima pentru urmatorul ciclu.

Definitie: Prognozarea este procesul de a face presupuneri despre evenimente ale caror rezultate reale nu au fost inca observate. Cel mai adesea prognozarea implica estimarea unei variabile de interes la un anumit moment in viitor. Riscul si incertitudinea sunt centrale prognozarii (Wikipedia). Punand accentul pe aspectul economic, prognozarea este utilizarea de date istorice pentru a determina directia tiparelor viitoare. Prognozarea este utilizata de companii pentru a determina gestionarea bugetelor pentru urmatorul ciclu de business. Aceasta se bazeaza in general pe cererea de bunuri si servicii in raport cu costul producerii acestora. Investitorii utilizeaza prognozarea pentru a determina daca factorii care afecteaza firma, precum asteptarile privind vanzarile, vor rezulta in cresterea sau scadera pretului unei actiuni (Investopedia).

Metode de prognoza

Context

Daca prognozarea este realizarea acestor presupuneri intr-un mod foarte inteligent pentru a avea riscuri cat mai reduse, cum anume sunt realizate?

Intuitiv, s-ar putea presupune ca este necesara familiarizarea intensa cu respectiva variabila: cum a evoluat, ce factori o afecteaza, despre ce domeniu e vorba, ce mecanisme actioneaza in cadrul acelui domeniu etc.

Intuitia ar fi insa gresita. Orice factor care influenteaza acea variabila este la randul sau o variabila, a carei evolutie in viitor nu este cunoscuta. Evident, nu se poate repeta aceasta analiza la infinit, luand in calcul factorii factorilor factorilor etc. Daca se presupune ca unii factori au o influenta mai redusa, si se realizeaza un model matematic cu presupuneri pentru acesti factori, se realizeaza de fapt si de drept o prognoza pe baza de prognoze, ia incertudinile si erorile asociate fiecarei prognoze se aduna. In consecinta, o prognoza realizata pe mai multe prognoze este si mai incerta decat o prognoza realizata numai pe o anumita variabila.

Se poate aplica sistemul descris mai sus. Depinde de la caz la caz. Dupa cum e scris mai sus, Newton a crezut ca intreaga lume poate fi prezisa exact. Intr-advar pentru unele fenomene se pot obtine rezultate 100% precise, precum traiectoria unei mingi in aer. Problema apare in cazul in care complexitatea fenomenelor creste. O minge in aer este influentata in mare parte de factori care sunt constanti sau variaza in timp dupa formule simple. Insa, pe masura ce creste gradul de

Page 5: Proiect - Exemplu

5

complexitate a variatiei unui fenomen sau creste numarul de variabile foarte mult, devine imposibil sa se realizeaza astfel de calcule simple. Se poate utiliza un calculator care are o putere mai mare de calcul, dar de la un punct nici acesta nu poate lua totul in calcul. Apare incertitudinea. Astfel de fenomene sunt studiate in fizica de remura fizicii numita Teoria Haosului. Haos aici nu se refera la dezordine, ci la lipsa linearitatii. Economia, din pacate, este un fenomen foarte haotic, si si activitatea economica a unei singure firme este foarte haotica.

Asadar, exista metode strict matematice consacrate acestor probleme. Aceste metode urmaresc sa realizeze prognoza unui punct de date (datapoint) avand la dispozitie numai punctele de date din trecut si utilizand metode strict matematice, ignorand cu totul partea fizica a problemei.

Mentiune:

Exista un concept care inglobeaza si abordarea matematica si si cea fizica, descrise mai sus. Acest concept se numeste ARMAX. ARMAX este reprezentat printr-o formula

𝑦�𝑡+1 = 𝜇 + 𝛽𝑥1 + ⋯+ 𝛽𝑥𝑡 + 𝑦1 + ⋯+ 𝑦𝑡 + ⋯+ 𝜆𝜖1 + ⋯+ 𝜆𝜖𝑡

unde µ este o constanta, β si λ sunt parametrii si 𝛽𝑥1 + ⋯+ 𝛽𝑥𝑡 corespunde partii fizice, x-urile fiind factori externi variabilei principale, y, si 𝑦1 + ⋯+ 𝑦𝑡 + ⋯+ 𝜆𝜖1 + ⋯+ 𝜆𝜖𝑡 care corespunde partii matematice, y fiind valoarea reala observata si ϵ fiind eroarea intre prognoza si valoarea reala.

In aceasta lucrare prezentam 3 astfel de metode utilizate frecvent. Aceste metode sunt utile numai pentru calcularea unui singur punct de date in viitor.

Metoda mediilor mobile

Toate aceste 3 metode isi propun sa acorde un mai mare impact datelor mai recente si mai putin celor mai vechi in realizarea prognozei pentru urmatorul punct de date. Metoda mediilor mobile se bazeaza pur si simplu pe eliminarea datelor vechi. Se alege un numar de date, 5-10-100, depinde de caz, si pentru fiecare prognoza se repeta procesul (de unde partea de „mobile”).

𝑦�𝑡+1 = 1𝑛� 𝑦𝑖

𝑡

𝑖=𝑡−𝑛

unde y ̂ este prognoza, y este real*, t este intervalul de timp, iar n este numarul ales (5-10-100 etc.). De fapt si de drept, aceasta este formula mediei aritmetice simple.

Page 6: Proiect - Exemplu

6

*NOTA: In aceasta lucrare, intotdeauna prognoza va fi scrisa y ̂, iar valoarea reala y.

Metoda linear smoothing

Dupa cum am scris mai sus, toate metodele se bazeaza pe realizarea unei proportionalitati inverse intre impactul datelor si varsta acestora. Acest lucru se intalneste si la linear smoothing, care actioneaza ca o „normalizare” a datelor: fiecarei valori ii este acordata un parametru, parametrul descrescand cu cresterea timpului, iar suma parametrilor este 1.

𝑦�𝑡+1 =𝑡

𝑡 + ⋯+ 1𝑦𝑡 + ⋯+

1𝑡 + ⋯+ 1

𝑦1 =∑ 𝑖𝑦𝑖𝑡𝑖=1∑ 𝑖𝑡𝑖=1

Metoda exponential smoothing

Aceasta este cea mai complexa dintre cele 3 metode si ofera cea mai precisa prognoza. In plus ofera si optiunea realizarii de erori si de intervale de incredere.

Formula

𝑦�𝑡+1 = Θ𝑦𝑡 + (1 − Θ)𝑦�𝑡, unde θ este un parametru subunitar (intotdeauna 0<θ<1), iar y^ si y reprezinta valorile prognozate, respectiv, reale. Faptul ca 𝑦�𝑡 este in formula pentru 𝑦�𝑡+1 nu este neobisnuit. Este pur si simplu o formula recursiva.

Formula aceasta este foarte simpla, desi poate pare ciudata. Aceasta formula de fapt ascunde posibilitatea unor instrumente suplimentare pentru a oferi o prognoza mai precisa.

Alegerea θ

Aceasta formula nu poate oferi prognoze utile decat este aplicata si la valorile trecute. Initial, y^ nu exista, asadar formula nu poate fi aplicata. y^ se alege. Odata ales, avem primul y^ si se poate calcula urmatorul y^. Acest y^ este aplicat pentru a-l calcula pe al treilea si tot asa.

θ de asemenea poate fi ales la intamplare.

Page 7: Proiect - Exemplu

7

Intrebarea se pune: daca si y^ initial si θ sunt alesi la intamplare, cum poate aceasta metoda sa ofere cele mai precise prognoze? Raspunsul este ca θ se poate alege, dar pentru prognoza cea mai precisa, acesta se determina matematic.

Dupa cum am scris mai sus, exponential smoothing nu poate fi aplicat decat daca este aplicat si la valorile trecute. Pornind de la lista de date care trebuie procesata, se realizeaza o a doua lista de date, aplicand formula de mai sus, alegand un prim y^ aleatoriu, pentru fiecare punct de date.

Acest inverval realizat de exponential smoothing are niste proprietati inreresante, dependente de valoarea lui θ.

In primul rand, se observa cum aceste intervale de date, daca sunt vizualizate sub forma de grafic, apar ca doua grafice paralele. Pentru valori ale lui θ apropriate de 1, graficul prognozelor se aproprie ca forma de cel real, fiind doar un pic defazat. Cu cat θ se aproprie de 1, faza scade, iar intervalele tind sa se suprapuna. Daca intervalele se suprapun, formula va realiza o prognoza pur si simplu egala cu ultimul punct de date. O astfel de prognoza nu este foarte utila. Graficele sunt asemanatoare vizual, cea ce ar putea parea intuitiv ca fiind un lucru bun. Insa, daca se analizeaza cu atentie graficele, se observa ca de fapt acest paralelism rezulta in cele doua grafice neavand nicio interserctie. Asta se traduce in foarte putine prognoze care s-au adeverit. De aici rezulta o prima proprietate interesanta a lui exponential smoothing. θ trebuie ales astfel incat graficul intervalului produs sa aiba numarul maxim de intersectii cu intervalul de valori reale.

Descrierea de mai sus este o descriere intuitiva, simplificata a problemei. De fapt si de drept, se foloseste o metoda mai precisa de a determina calitatea intervalului generat prin aplicarea formulei comparativ cu cel al valorilor reale. Aceasta metoda este calcularea abaterii medii patrate. Aceasta, dupa cum ii spune si numele este media diferentelor dintre valorile calculate si cele reale. Insa nu este o medie aritmetica ci o medie patratica: se calculeaza patratul fiecarei diferente, iar la sfarsit se calculeaza radicalul mediei aritmetice a acestor patrate:

𝜎 = �∑ (𝑦�𝑖 − 𝑦𝑖)2𝑡𝑖=1

𝑡

Media abaterilor patrate, σ, variaza in functie de θ. σ, practic, masoara cat de mult difera prognozele de realitate. Daca prognoza pentru 𝑦�𝑡+1 este realizata cu θ pentru care σ este minim, atunci, dupa cum ar trebui sa fie din acest punct evident, prognoza va diferi de 𝑦𝑡 cu cel mai putin posibil. Cu alte cuvinte prognoza va fi cea mai exacta.

Exponential smoothing este, de fapt si de drept, un produs al stiintei statistice. Dupa cum e scris mai sus, aceste prognoze trebuie realizate strict matematic, pornind pur si simplu de la datele existente. Asadar, formule si principii statistice, precum regresii, corelatii, variatia fata de medie, stau la baza acestor metode de prognoza. In statistica, de exemplu, o analiza care se realizeaza frecvent este analiza unei cantitati mari de date cu valori foarte diferite, un „nor” de date, in scopul gasirii unui tipar, unui trend, de exemplu pentru a gasi corelatia dintre doua variabile. Asemanator, exponential smoothing, practic, analizeaza gradul de dispersie al datelor, adica cat de haotice sunt, cat de sinusoidale, cat de mult variaza in jurul mediei aritmetice a

Page 8: Proiect - Exemplu

8

acestor date, si realizeaza o prognoza pentru urmatorul punct in functie de acest comportament al datelor. Insa, daca in exemplul din statistica dat mai sus, este de interes in principal tiparul, si se urmareste eliminarea, atenuarea, dispersiei, exponential smoothing este interesat in principal tocmai de aceasta dispersie. Asadar, daca o variabila are deja un tipar, un trend, foarte clar, θ tinde spre 1 pe masura ce σ tinde spre valoarea sa minima. Este usor de inteles de ce. Daca un set de date are deja un tipar foarte clar, nu prea e necesara realizarea de prognoze. Cel mai probabil caz este pur si simplu cel al mentinerii tiparului. De fapt, e necesara realizarea unei prognoze: chiar daca exista un tipar de crestere/scadere, cat de mult creste/scade valoarea variabilei? Problema este imprecizia prognozei, nu inutilitatea ei. Asadar, trebuie realizat un set de date care sa prezinte un grad ridicat de haos pe baza setului de date dat astfel incat sa se poata obtine prognoze precise cu exponential smoothing. O metoda des practicata este, pur si simplu, realizarea de prognoze, nu pe datele in sine, ci pe rata variatiei – diferentele dintre valorile fiecarui punct de date – acelor date.

Asadar, etapele in aplicarea exponential smoothing sunt

1) Calcularea ratelor variatiei 2) „Prognozarea” valorilor pentru perioadele de timp in care deja exista valori 3) Calcularea σ dintre cele doua intervale, real si de prognoza 4) Alegerea θ pentru σ minim 5) Realizarea prognozei

Erori

Mai sus e descris procesul necesar pentru a aplica exponential smoothing pentru a obtine o prognoza. Insa cu exponential smoothing putem calcula nu doar o prognoza ci si un interval de incredere.

Intervalul de incredere este cea mai importanta parte a prognozei. Este diferenta dintre o simpla presupunere si un rezultat stiintific. Dupa cum e scris mai sus, fie ca privim universul ca fiind probalistic datorita fizicii cuantice sau teoriei haosului, orice prognoza este incerta, iar realizarea oricarui plan de viitor pe baza acestora este riscanta. O componenta esentiala a realizarii de prognoze este managementul riscului. Un mod de a gestiona riscul este prin prognozarea nu a unei singure valori, ci prin prognozarea ca valoarea reala va fi inclusa intr-un interval.

Exista un fenomen care se intalneste in fizica, si de fapt in toate ramurile de stiinta, fiind un laitmotiv al naturii. Acest fenomen este cel al curbei Gauss. Exista multe tipare si fenomene care se intalnesc in natura in locuri aparent fara nicio legatura unul cu altul. Un exemplu clasic este cel al vartejurilor: galaxiile formeaza vartejuri, maelstromurile sunt vartejuri in apa, cochilia de melc este un vartej, etc. Astfel de tipare se intalnesc in natura datorita universalitatii legilor fizicii si matematicii. Chiar daca scara, situatia, materia prima etc. difera foarte mult, daca factorii implicati sunt matematic identici, atunci si rezultatul va fi acelasi. La fel este si distributia Gaussiana care este utila pentru modelarea a foarte multe lucruri: ciclul de viata al unei firme, dezvoltarea si decaderea unei populatii de organisme intr-un recipient inchis,

Page 9: Proiect - Exemplu

9

distributia energetica a liniilor spectrale, etc. Probabilitatea, de asemenea, este un fenomen care variaza Gaussian.

Variatia Gaussiana este o variatie exponentiala a carui exponent variaza parabolic, 𝑒𝑥2. Graficul sau apare ca o curba, dupa cum apare mai jos.

Forma acestei curbe este dependenta de valoarea lui σ.

In cazul specific al prognozei: axa orizontala ar fi valoarea variabilei prognozate, iar axa verticala cea a probabilitatii, sansele ca rezultatul real sa corespunda acestei prognoze.

Rezultatul produs de exponential smoothing propriu-zis este valoarea corespunzatoare „intaltimii” curbei, este valoarea pe care curba se centreaza. Este cea mai probabila valoare.

Distributia nu ajunge niciodata la 0. Functia are un un varf, iar din acel punct se aproprie de 0 in mod asimptotic, iar asimptota intotdeauna doar tinde spre o valoare, fara sa o atinga vreodata. Integrala acestei distributii este intotdeauna 1. Curba Gaussiana este un instrument foarte puternic pentru a intelege probabilitati, deoarece reprezinta realitatea foarte bine. Orice este posibil, variabila poate sa ia orice valoare, motiv pentru care integrala trebuie sa dea 1.

Insa nu orice valoare are aceleasi sanse sa se adevereasca. Orice e posibil, dar numai unele cazuri sunt probabile. Astfel, dupa cum am scris deja, probabilitatea cea mai ridicata este rezultatul principal din exponential smoothing. Pe aceasta valoare se centreaza curba, insa dupa cum reiese din grafic, sunt probabile si valori apropriate de rezultatul prognozei. Cu cat mai departe de rezultatul principal din exponential smoothing, cu atat mai putin probabil ca acea

Page 10: Proiect - Exemplu

10

prognoza sa se adevereasca, dar orice e posibil. De aceea niciodata nu se pot realiza intervale de 100%. De aceea se numesc intervale „de incredere”, nu intervale sigure. Mai mult, de fapt si de drept, natura gaussiana a probabilitatii releva o proprietate importanta pentru prognozare: inversa proportionalitate dintre siguranta prognozei si utilitatea acesteia. Cu cat intervalul este mai larg, cu atat mai multe cazuri sunt incluse, si deci probabilitatea ca prognoza sa se adevereasca creste. Insa, degeaba este foarte sigura o prognoza, daca este prea generala. Probabilitatea 100% este pentru interval –∞ la +∞, ceea ce nu ofera nicio informatie. Daca intervalul este exagerat de precis, de exemplu, prin a spune ca valoarea prognozei va fi exact rezultatul de la exponential smoothing, prognoza este foarte nesigura. De fapt, aproape nicidata nu va corespunde exact rezultatul real cu prognoza. Un interval cu o singura valoare va avea probabilitate 0. Se aseamana cu principiul Incertitudinii a lui Heisenberg din fizica cuantica: nu se poate stii cu precizie pozitia unei particule si impulsul (viteza*masa) acesteia simultan. Precizia mai mare la una rezulta in imprecizia mai mare la cealalta. Asa si in prognozare: cu cat creste precizia unei prognoze, cu atat scad sansele ca aceasta sa se adevereasca.

In plus, latimea curbei este influentata de σ care la randul sau este influetat de θ, care la randul sau este influentat de neregulatatea seriei de date. Cu cat seria de date este mai dispersata cu atat curba Gauss va fi mai „plata”, si mai putin „ascutita”. Cu cat curba Gauss este mai ascutita cu atat se pot alege intervale de incredere mai precise fara a pierde din utilitate. Cu alte cuvinte, intervalele de incredere ideale difera de la domeniu la domeniu.

In functie de probabilitatea aleasa, un interval de incredere se calculeaz astfel:

𝐶𝐶𝐶𝐶𝑡𝐶𝐶 𝑖𝑛𝑖𝑒𝑖𝑖𝑖𝑖 𝑠𝐶𝐶𝑒𝑖𝑖𝑖𝑖⁄ = 𝑦�𝑡+1 − 𝜖 𝑦�𝑡+1⁄ + 𝜖,

𝐶𝑛𝑢𝑒 𝜖 = 𝑁𝑁𝑁𝑁𝑁𝑁𝑁 �1 −1 − 𝐶%

2, 0,1� ∗ 𝜎,

𝐶𝑛𝑢𝑒 𝑁𝑁𝑁𝑁𝑁𝑁𝑁 𝑒𝑠𝑡𝑒 𝑖 𝑖𝐶𝑛𝑢𝑡𝑖𝑒 𝑢𝑖𝑛𝑠𝐶𝑢𝑖𝐶𝑡𝐶 𝐶𝑒𝑛𝑡𝑖𝐶 𝐶𝑢𝑒𝑠𝑡 𝑠𝑢𝑖𝐶 𝑖𝑛 𝐸𝑥𝑢𝑒𝐶,

𝐶 𝑒𝑠𝑡𝑒 𝐶𝑖𝑖𝑝𝐶𝑝𝑖𝐶𝑖𝑡𝐶𝑡𝑒𝐶 𝐶𝐶𝑒𝐶𝑠𝐶,

𝑖𝐶𝑖 𝜎 𝑒𝑠𝑡𝑒 𝑚𝑒𝑢𝑖𝐶 𝐶𝑝𝐶𝑡𝑒𝑖𝑖𝐶𝑖𝑖 𝐶𝐶𝑡𝑖𝐶𝑡𝑖𝑢𝑒 𝐶 𝑠𝑒𝑖𝑖𝑒𝑖 𝑢𝑒 𝑢𝐶𝑡𝑒

De exemplu pentru un interval de incredere de 95%, adica 95% sanse sa se afle rezultatul in intervalul ales, se aduna/scade 1,96*σ la rezultatul de la exponential smoothing.

Page 11: Proiect - Exemplu

11

Capitolul 2: Aplicare pe un exemplu

Date

Seria de date pe care vor fi aplicate toate metodele si principiile descrise mai sus este a

pretului actiunilor la Google pe o perioada de aproximativ o luna din 2013. Aceste date au fost obtinute de la Google Finance. Seria de date in forma bruta este afisata mai jos:

Index Data Pret 0 11.11.2013 16:00:00 1010.59 1 12.11.2013 16:00:00 1011.78 2 13.11.2013 16:00:00 1032.47 3 14.11.2013 16:00:00 1035.23 4 15.11.2013 16:00:00 1033.56 5 18.11.2013 16:00:00 1031.55 6 19.11.2013 16:00:00 1025.204 7 20.11.2013 16:00:00 1022.31 8 21.11.2013 16:00:00 1034.07 9 22.11.2013 16:00:00 1031.89

10 25.11.2013 16:00:00 1045.93 11 26.11.2013 16:00:00 1058.41 12 27.11.2013 16:00:00 1063.11 13 29.11.2013 16:00:00 1059.59 14 02.12.2013 16:00:00 1054.48 15 03.12.2013 16:00:00 1053.26 16 04.12.2013 16:00:00 1058.18 17 05.12.2013 16:00:00 1057.34 18 06.12.2013 16:00:00 1069.87 19 09.12.2013 16:00:00 1078.14 20 10.12.2013 16:00:00 1084.66 21 11.12.2013 16:00:00 1077.29 22 12.12.2013 16:00:00 1069.96 23 13.12.2013 16:00:00 1060.79 24 16.12.2013 16:00:00 1072.98 25 17.12.2013 16:00:00 1069.86 26 18.12.2013 16:00:00 1084.75 27 19.12.2013 16:00:00 1086.22 28 20.12.2013 16:00:00 1100.62 29 23.12.2013 16:00:00 1115.1 30 24.12.2013 16:00:00 1111.84

Page 12: Proiect - Exemplu

12

31 26.12.2013 16:00:00 1117.46 32 27.12.2013 16:00:00 1118.4 33 30.12.2013 16:00:00 1109.46

34 31.12.2013

Avem 34 de puncte de date si trebuie sa prognozam valoarea pentru ptunctul 35, marcat aici in rosu, pentru 31 Decembrie 2013. Indexul incepe de la 0, si nu de la 1, si de aceea par sa fie 33 de puncte, dar de fapt sunt 34. Motivul pentru care indexul este defazat va deveni clar mai jos.

In forma grafica aceste date arata asa:

Se observa ca exista un trend crescator. Acest lucru nu este deloc suprinzator, avand in vedere ca Google este o firma de succes care continua sa se mentina un exemplu de firma invatoare. Asadar, firma continua sa fie foarte valoroasa, iar pretul actiunilor reflecta acest lucru.

Dupa cum e scris mai sus, este mai indicat sa fie aplicate metodele si tehnicile de prognoza pe rata variatiei unei serii de date cu trend, nu pe date in sine. Asadar, datele pe care vom lucra propriu-zis sunt cele din coloana Rata Pret de mai jos:

Index Data Pret Rata Pret 0 11.11.2013 16:00:00 1010.59

1 12.11.2013 16:00:00 1011.78 0.117752996 2 13.11.2013 16:00:00 1032.47 2.044910949 3 14.11.2013 16:00:00 1035.23 0.267320116 4 15.11.2013 16:00:00 1033.56 -0.161316809 5 18.11.2013 16:00:00 1031.55 -0.19447347 6 19.11.2013 16:00:00 1025.204 -0.615190732 7 20.11.2013 16:00:00 1022.31 -0.282285282 8 21.11.2013 16:00:00 1034.07 1.150336004 9 22.11.2013 16:00:00 1031.89 -0.210817449

10 25.11.2013 16:00:00 1045.93 1.360610143

940960980

10001020104010601080110011201140

1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33

Page 13: Proiect - Exemplu

13

11 26.11.2013 16:00:00 1058.41 1.193196485 12 27.11.2013 16:00:00 1063.11 0.44406232 13 29.11.2013 16:00:00 1059.59 -0.331104025 14 02.12.2013 16:00:00 1054.48 -0.482262007 15 03.12.2013 16:00:00 1053.26 -0.115696836 16 04.12.2013 16:00:00 1058.18 0.467121129 17 05.12.2013 16:00:00 1057.34 -0.07938158 18 06.12.2013 16:00:00 1069.87 1.185049275 19 09.12.2013 16:00:00 1078.14 0.772991111 20 10.12.2013 16:00:00 1084.66 0.604745209 21 11.12.2013 16:00:00 1077.29 -0.679475596 22 12.12.2013 16:00:00 1069.96 -0.680411031 23 13.12.2013 16:00:00 1060.79 -0.857041385 24 16.12.2013 16:00:00 1072.98 1.149143563 25 17.12.2013 16:00:00 1069.86 -0.290778952 26 18.12.2013 16:00:00 1084.75 1.391770886 27 19.12.2013 16:00:00 1086.22 0.135515096 28 20.12.2013 16:00:00 1100.62 1.325698293 29 23.12.2013 16:00:00 1115.1 1.315622104 30 24.12.2013 16:00:00 1111.84 -0.292350462 31 26.12.2013 16:00:00 1117.46 0.505468413 32 27.12.2013 16:00:00 1118.4 0.084119342 33 30.12.2013 16:00:00 1109.46 -0.799356223

34 31.12.2013

A se observa cum primul punct de date de la rata este indexat incepand de la 1. Prognozele vor fi realizate pentru rata pentru punctul 34. A se observa cum rata variatiei pretului este mult mai aleatorie decat pretul in sine:

-1.5

-1

-0.5

0

0.5

1

1.5

2

2.5

1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33

Page 14: Proiect - Exemplu

14

Metode de prognoza

Metoda mediilor mobile

In aceasta lucrare am ales 6 puncte de date. Astfel prognoza pentru punctul 34 este media ultimelor 6 date.

1.325698293 1.315622104 -0.292350462 0.505468413 0.084119342 -0.799356223

0.356533578

Deci prognoza este pur si simplu o crestere cu ~0,356%.

Prognoza a fost realizata, dar acest exercitiu nu ofera foarte multe informatii despre acuratetea acestei metode. Asadar, pentru a face subiectul mai interesant, se afiseaza mai jos aplicarea acestei metode pe datele din trecut (incepand cu punctul 7) si se compara prin grafic cu rezultatele reale.

Medii mobile(6):

7 20.11.2013 16:00:00 1022.31 -0.282285282 0.243167175 8 21.11.2013 16:00:00 1034.07 1.150336004 0.176494129 9 22.11.2013 16:00:00 1031.89 -0.210817449 0.027398304

10 25.11.2013 16:00:00 1045.93 1.360610143 -0.05229129 11 26.11.2013 16:00:00 1058.41 1.193196485 0.201363202 12 27.11.2013 16:00:00 1063.11 0.44406232 0.432641528 13 29.11.2013 16:00:00 1059.59 -0.331104025 0.609183703 14 02.12.2013 16:00:00 1054.48 -0.482262007 0.601047246 15 03.12.2013 16:00:00 1053.26 -0.115696836 0.328947578 16 04.12.2013 16:00:00 1058.18 0.467121129 0.344801013 17 05.12.2013 16:00:00 1057.34 -0.07938158 0.195886178 18 06.12.2013 16:00:00 1069.87 1.185049275 -0.016210167 19 09.12.2013 16:00:00 1078.14 0.772991111 0.107287659 20 10.12.2013 16:00:00 1084.66 0.604745209 0.291303515

Page 15: Proiect - Exemplu

15

21 11.12.2013 16:00:00 1077.29 -0.679475596 0.472471385 22 12.12.2013 16:00:00 1069.96 -0.680411031 0.378508258 23 13.12.2013 16:00:00 1060.79 -0.857041385 0.187252898 24 16.12.2013 16:00:00 1072.98 1.149143563 0.05764293 25 17.12.2013 16:00:00 1069.86 -0.290778952 0.051658645 26 18.12.2013 16:00:00 1084.75 1.391770886 -0.125636365 27 19.12.2013 16:00:00 1086.22 0.135515096 0.005534581 28 20.12.2013 16:00:00 1100.62 1.325698293 0.141366363 29 23.12.2013 16:00:00 1115.1 1.315622104 0.475717917 30 24.12.2013 16:00:00 1111.84 -0.292350462 0.837828498 31 26.12.2013 16:00:00 1117.46 0.505468413 0.597579494 32 27.12.2013 16:00:00 1118.4 0.084119342 0.730287388 33 30.12.2013 16:00:00 1109.46 -0.799356223 0.512345464

34 31.12.2013

0.356533578

Linia rosie este prognoza pe baza mediilor mobile. A se observa cum cele doua grafice se intersecteaza relativ frecvent, semn al unei prognoze relativ acceptabile.

-1

-0.5

0

0.5

1

1.5

2

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28

Page 16: Proiect - Exemplu

16

Linear smoothing

Pe baza formulei de mai sus, suma produselor dintre index si valoarea ratei si impartind la suma indexilor, prognoza pentru 34 este o crestere cu ~0.264%.

Din nou, pentru a intelege eficienta acestei metode de prognoza realizam “prognoze” pentru toate punctele de la 1 la 33 si reprezentam graphic.

index Data Pret Rata Pret Linear smoothing

0 11.11.2013 16:00:00 1010.59 1 12.11.2013 16:00:00 1011.78 0.117752996

2 13.11.2013 16:00:00 1032.47 2.044910949 0.117752996 3 14.11.2013 16:00:00 1035.23 0.267320116 1.402524965 4 15.11.2013 16:00:00 1033.56 -0.161316809 0.83492254 5 18.11.2013 16:00:00 1031.55 -0.19447347 0.436426801 6 19.11.2013 16:00:00 1025.204 -0.615190732 0.22612671 7 20.11.2013 16:00:00 1022.31 -0.282285282 -0.014249702 8 21.11.2013 16:00:00 1034.07 1.150336004 -0.081258597 9 22.11.2013 16:00:00 1031.89 -0.210817449 0.192429092

10 25.11.2013 16:00:00 1045.93 1.360610143 0.111779784 11 26.11.2013 16:00:00 1058.41 1.193196485 0.338839849 12 27.11.2013 16:00:00 1063.11 0.44406232 0.481232622 13 29.11.2013 16:00:00 1059.59 -0.331104025 0.475514114 14 02.12.2013 16:00:00 1054.48 -0.482262007 0.360282951 15 03.12.2013 16:00:00 1053.26 -0.115696836 0.247943623 16 04.12.2013 16:00:00 1058.18 0.467121129 0.202488566 17 05.12.2013 16:00:00 1057.34 -0.07938158 0.233621809 18 06.12.2013 16:00:00 1069.87 1.185049275 0.198843654 19 09.12.2013 16:00:00 1078.14 0.772991111 0.302654772 20 10.12.2013 16:00:00 1084.66 0.604745209 0.349688406 21 11.12.2013 16:00:00 1077.29 -0.679475596 0.37397953 22 12.12.2013 16:00:00 1069.96 -0.680411031 0.278210882 23 13.12.2013 16:00:00 1060.79 -0.857041385 0.194852455 24 16.12.2013 16:00:00 1072.98 1.149143563 0.107194635 25 17.12.2013 16:00:00 1069.86 -0.290778952 0.190550549 26 18.12.2013 16:00:00 1084.75 1.391770886 0.153525203 27 19.12.2013 16:00:00 1086.22 0.135515096 0.245247106 28 20.12.2013 16:00:00 1100.62 1.325698293 0.237409105 29 23.12.2013 16:00:00 1115.1 1.315622104 0.312463532 30 24.12.2013 16:00:00 1111.84 -0.292350462 0.37934077 31 26.12.2013 16:00:00 1117.46 0.505468413 0.336005852 32 27.12.2013 16:00:00 1118.4 0.084119342 0.346597262

Page 17: Proiect - Exemplu

17

33 30.12.2013 16:00:00 1109.46 -0.799356223 0.330689509

34 31.12.2013

0.264216231

Exponential smoothing

Pentru exponential smoothing, s-a preocedat in felul urmator:

1) S-a ales θ aleatoriu 2) S-a ales un punct initial aleatoriu (mai precis 0) 3) S-a aplicat formula 4) S-au calculat separat abaterile patrate 5) S-a calculat abaterea patrata medie, σ 6) S-a modificat θ si s-a urmarit schimbarea σ 7) Pentru σ suficient de mic, s-a ales θ

Aplicand aceste metode, in final θ = 0.0346, iar prognoza pentru 34 este o creste cu ~0.19%.

-1.5

-1

-0.5

0

0.5

1

1.5

2

2.5

1 2 3 4 5 6 7 8 9 101112131415161718192021222324252627282930313233

Page 18: Proiect - Exemplu

18

Aceste calcule sunt afisate mai jos:

0 11.11.2013 16:00:00 1010.59

θ 0.0346 Abaterea patratica

1 12.11.2013 16:00:00 1011.78 0.117752996 0

0.013865768 2 13.11.2013 16:00:00 1032.47 2.044910949 0.004074254

4.165014417

3 14.11.2013 16:00:00 1035.23 0.267320116 0.074687203

0.037107439 4 15.11.2013 16:00:00 1033.56 -0.161316809 0.081352302

0.058888297

5 18.11.2013 16:00:00 1031.55 -0.19447347 0.072955951

0.071518495 6 19.11.2013 16:00:00 1025.204 -0.615190732 0.063702893

0.460896554

7 20.11.2013 16:00:00 1022.31 -0.282285282 0.040213173

0.104005254 8 21.11.2013 16:00:00 1034.07 1.150336004 0.029054727

1.257271702

9 22.11.2013 16:00:00 1031.89 -0.210817449 0.067851059

0.077656138 10 25.11.2013 16:00:00 1045.93 1.360610143 0.058209129

1.696248401

11 26.11.2013 16:00:00 1058.41 1.193196485 0.103272204

1.18793494 12 27.11.2013 16:00:00 1063.11 0.44406232 0.140983584

0.09185672

13 29.11.2013 16:00:00 1059.59 -0.331104025 0.151470108

0.232877794 14 02.12.2013 16:00:00 1054.48 -0.482262007 0.134773043

0.380732253

15 03.12.2013 16:00:00 1053.26 -0.115696836 0.11342363

0.052496188 16 04.12.2013 16:00:00 1058.18 0.467121129 0.105496062

0.130772689

17 05.12.2013 16:00:00 1057.34 -0.07938158 0.11800829

0.03896276 18 06.12.2013 16:00:00 1069.87 1.185049275 0.1111786

1.153198226

19 09.12.2013 16:00:00 1078.14 0.772991111 0.148334525

0.39019585 20 10.12.2013 16:00:00 1084.66 0.604745209 0.169947643

0.189048923

21 11.12.2013 16:00:00 1077.29 -0.679475596 0.184991639

0.747303601 22 12.12.2013 16:00:00 1069.96 -0.680411031 0.155081073

0.698047056

23 13.12.2013 16:00:00 1060.79 -0.857041385 0.126173046

0.966710617 24 16.12.2013 16:00:00 1072.98 1.149143563 0.092153827

1.117227302

25 17.12.2013 16:00:00 1069.86 -0.290778952 0.128725672

0.175984129 26 18.12.2013 16:00:00 1084.75 1.391770886 0.114210812

1.632159744

27 19.12.2013 16:00:00 1086.22 0.135515096 0.15841439

0.000524378 28 20.12.2013 16:00:00 1100.62 1.325698293 0.157622075

1.364402053

29 23.12.2013 16:00:00 1115.1 1.315622104 0.198037512

1.248995321 30 24.12.2013 16:00:00 1111.84 -0.292350462 0.236705939

0.279900675

31 26.12.2013 16:00:00 1117.46 0.505468413 0.218400587

0.082407936 32 27.12.2013 16:00:00 1118.4 0.084119342 0.228333134

0.020797618

33 30.12.2013 16:00:00 1109.46 -0.799356223 0.223343337

1.04591439

34 31.12.2013

0.187957932

Abaterea patratica medie (σ) 0.800963882

Page 19: Proiect - Exemplu

19

In continuare, apare afisarea grafica a acestei prognoze:

Erori Plecand de la rezultatele de mai sus de la exponential smoothing, urmeaza calcularea

intervalelor de incredere.

S-a decis alegerea a trei probabilitati si compararea intre ele pentru a alege cea mai buna prognoza: 50%, 66% si 95%. Pentru fiecare probabilitate s-a calculat un capat inferior si un capat superior, utilizand valoarea lui σ de mai sus si formula NORMINV.

Iata rezultatele:

Intervale de incredere 50% 66% 95%

Capatul Inferior

Capatul Superior

Capatul Inferior

Capatul Superior

Capatul Inferior

Capatul Superior

-0.465554725 0.614929132 -0.689564702 0.838939109 -1.495173158 1.644547565 -0.458889627 0.621594231 -0.682899603 0.845604207 -1.488508059 1.651212664 -0.467285978 0.61319788 -0.691295954 0.837207856 -1.496904411 1.642816312 -0.476539036 0.603944822 -0.700549012 0.827954798 -1.506157469 1.633563254 -0.500028755 0.580455102 -0.724038732 0.804465079 -1.529647188 1.610073535

-1.5

-1

-0.5

0

0.5

1

1.5

2

2.5

1 2 3 4 5 6 7 8 9 10111213141516171819202122232425262728293031323334

Page 20: Proiect - Exemplu

20

-0.511187202 0.569296656 -0.735197178 0.793306632 -1.540805635 1.598915088 -0.47239087 0.608092988 -0.696400846 0.832102964 -1.502009303 1.637711421

-0.4820328 0.598451057 -0.706042777 0.822461034 -1.511651233 1.62806949 -0.436969725 0.643514132 -0.660979701 0.867524109 -1.466588158 1.673132565 -0.399258345 0.681225513 -0.623268321 0.905235489 -1.428876778 1.710843945

-0.38877182 0.691712037 -0.612781797 0.915722013 -1.418390253 1.72133047 -0.405468886 0.675014972 -0.629478862 0.899024948 -1.435087318 1.704633405 -0.426818298 0.653665559 -0.650828275 0.877675536 -1.456436731 1.683283992 -0.434745866 0.645737991 -0.658755843 0.869747967 -1.464364299 1.675356424 -0.422233639 0.658250218 -0.646243616 0.882260195 -1.451852072 1.687868651 -0.429063329 0.651420529 -0.653073305 0.875430505 -1.458681761 1.681038962 -0.391907403 0.688576454 -0.61591738 0.912586431 -1.421525836 1.718194887 -0.370294285 0.710189572 -0.594304262 0.934199548 -1.399912718 1.739808005

-0.35525029 0.725233568 -0.579260266 0.949243544 -1.384868722 1.754852001 -0.385160856 0.695323001 -0.609170832 0.919332978 -1.414779289 1.724941434 -0.414068883 0.666414975 -0.638078859 0.890424951 -1.443687316 1.696033408 -0.448088102 0.632395755 -0.672098079 0.856405732 -1.477706535 1.662014188 -0.411516257 0.6689676 -0.635526234 0.892977577 -1.44113469 1.698586033 -0.426031117 0.65445274 -0.650041094 0.878462717 -1.45564955 1.684071173 -0.381827539 0.698656319 -0.605837515 0.922666295 -1.411445971 1.728274752 -0.382619854 0.697864003 -0.606629831 0.92187398 -1.412238287 1.727482436 -0.342204417 0.73827944 -0.566214394 0.962289417 -1.37182285 1.767897873

-0.30353599 0.776947867 -0.527545967 1.000957844 -1.333154423 1.8065663 -0.321841342 0.758642516 -0.545851318 0.982652492 -1.351459774 1.788260949 -0.311908795 0.768575063 -0.535918771 0.992585039 -1.341527228 1.798193495 -0.316898592 0.763585265 -0.540908569 0.987595242 -1.346517025 1.793203698

-0.352283997 0.728199861 -0.576293973 0.952209837 -1.38190243 1.757818293

Trebuie ales un echilibru intre o latime a intervalului care sa nu fie prea mare, si deci inutila, dar nici probabilitatea ca valoarea reala sa se afle in interval sa fie prea mica. De exemplu, daca s-ar putea utiliza intervalul corespunzator probabilitatii de 95% ar fi cazul ideal, am avea o prognoza foarte precisa si foarte utila. Intervalul 50%, prin definitie, nu e corect decat jumatate din cazuri, ceea ce nu este tocmai o prognoza cu adevarat, mai mult un joc de noroc.

Afisarea grafica a acestor rezultat ajuta foarte mult in a determina care interval este cel mai util.

Page 21: Proiect - Exemplu

21

Se observa cum graficele tuturor capetelor de interval au aceiasi forma ca graficul prognozei. Cel rosu din mojloc este prognoza si este flacata sus si jos de 3 capete de interval corepsunzatoare fiecarei probabilitati. Cu cat mai mare probabilitatea cu atat mai larga diferenta dintre capete, asemeni unui navod care prinde mai multi pesti. Se constata ca gradul de dispersie al acestor date este enorm. Este atat de mare incat intervalul corespunzator probabilitatii de 95% depaseste toate valorile reale. Este absolut inutil pentru prognoze. Ramane de ales intre 50% si 66%. Asa cum e de asteptat, „navodul” de 50% „prinde” cam jumatate din toate varfurile si fracturile graficului albastru, care reprezinta puncte de date reale. Este prea imprecis. Cel de 66% este un pic mai acceptabil. Este mai larg decat cel de 50% si „prinde” mai multe varfuri si fracturi. Este tot imprecis, dar dintre toate 3 este cel mai acceptabil. Acesta va fi ales.

In concluzie: prognoza pentru variatia pretului actiunii la Google pentru 31 Decembrie 2013 este ~+0.19%, cu 66% probabilitate sa fie intre o scadere de nu mai mult de aproximativ -0.58% si o crestere de 0.95%.

Convertind in pret propriu zis asta inseamna:

Pret (EXP) cap inf Prognoza Cap sup

1103.066 1111.545318 1120.024387,

adica sunt 66% sanse ca pretul sa fie intre 1103.066 si 1120.024 dolari. Aceasta este prognoza.

-2

-1.5

-1

-0.5

0

0.5

1

1.5

2

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32