Stat_Matlab.PDF

402
Cuprins Prefat ¸˘ a vii 1 Introducere ˆ ın Matlab 1 1.1 Gestionarea unei sesiuni Matlab ................... 2 1.1.1 Lansarea s ¸i ˆ ınchiderea unei sesiuni Matlab ......... 2 1.1.2 Comenzi help ........................ 2 1.1.3 Comenzi sistem ........................ 4 1.2 Constante. Variabile. Expresii aritmetice ............... 4 1.2.1 Constante ........................... 5 1.2.2 Instruct ¸iunea format .................... 5 1.2.3 Constante speciale ...................... 6 1.2.4 Variabile ........................... 7 1.2.5 Operatori aritmetici ...................... 8 1.2.6 Funct ¸ii predefinite ...................... 9 1.2.7 Comenzi pentru gestiunea variabilelor s ¸i a spat ¸iului de lucru 10 1.3 Instruct ¸iuni de atribuire ........................ 12 1.4 Instruct ¸iuni de citire s ¸i scriere ..................... 13 1.4.1 Instruct ¸iunea input ..................... 13 1.4.2 Instruct ¸iunea ginput .................... 13 1.4.3 Instruct ¸iunea fprintf ................... 13 1.5 Operatori relat ¸ionali s ¸i operatori logici ................ 14 1.5.1 Operatori relat ¸ionali ..................... 14 1.5.2 Operatori logici ........................ 14 1.6 Fis ¸iere script (m–file) ......................... 15 1.6.1 Comenzi pentru gestionarea fis ¸ierelor ............ 17 1.7 Grafic˘ a bidimensional˘ a ........................ 17 1.7.1 Instruct ¸iunea plot ...................... 17 1.7.2 Comenzi s ¸i instruct ¸iuni de gestionare a graficelor ...... 22 1.7.3 Instruct ¸iunile polar s ¸i ezpolar .............. 25 i

Transcript of Stat_Matlab.PDF

Page 1: Stat_Matlab.PDF

Cuprins

Prefata vii

1 Introducere ın Matlab 11.1 Gestionarea unei sesiuni Matlab . . . . . . . . . . . . . . . . . . . 2

1.1.1 Lansarea si ınchiderea unei sesiuni Matlab . . . . . . .. . 21.1.2 Comenzihelp . . . . . . . . . . . . . . . . . . . . . . . . 21.1.3 Comenzi sistem . . . . . . . . . . . . . . . . . . . . . . . . 4

1.2 Constante. Variabile. Expresii aritmetice . . . . . . . . . .. . . . . 41.2.1 Constante . . . . . . . . . . . . . . . . . . . . . . . . . . . 51.2.2 Instructiuneaformat . . . . . . . . . . . . . . . . . . . . 51.2.3 Constante speciale . . . . . . . . . . . . . . . . . . . . . . 61.2.4 Variabile . . . . . . . . . . . . . . . . . . . . . . . . . . . 71.2.5 Operatori aritmetici . . . . . . . . . . . . . . . . . . . . . . 81.2.6 Functii predefinite . . . . . . . . . . . . . . . . . . . . . . 91.2.7 Comenzi pentru gestiunea variabilelor si a spatiului de lucru 10

1.3 Instructiuni de atribuire . . . . . . . . . . . . . . . . . . . . . . . .121.4 Instructiuni de citire si scriere . . . . . . . . . . . . . . . . .. . . . 13

1.4.1 Instructiuneainput . . . . . . . . . . . . . . . . . . . . . 131.4.2 Instructiuneaginput . . . . . . . . . . . . . . . . . . . . 131.4.3 Instructiuneafprintf . . . . . . . . . . . . . . . . . . . 13

1.5 Operatori relationali si operatori logici . . . . . . . . .. . . . . . . 141.5.1 Operatori relationali . . . . . . . . . . . . . . . . . . . . . 141.5.2 Operatori logici . . . . . . . . . . . . . . . . . . . . . . . . 14

1.6 Fisiere script (m–file) . . . . . . . . . . . . . . . . . . . . . . . . . 151.6.1 Comenzi pentru gestionarea fisierelor . . . . . . . . . . . .17

1.7 Grafica bidimensionala . . . . . . . . . . . . . . . . . . . . . . . . 171.7.1 Instructiuneaplot . . . . . . . . . . . . . . . . . . . . . . 171.7.2 Comenzi si instructiuni de gestionare a graficelor .. . . . . 221.7.3 Instructiunilepolar si ezpolar . . . . . . . . . . . . . . 25

i

Page 2: Stat_Matlab.PDF

ii Cuprins

1.7.4 Instructiuneastairs . . . . . . . . . . . . . . . . . . . . 281.7.5 Instructiunilebar si barh . . . . . . . . . . . . . . . . . . 311.7.6 Instructiuneasubplot . . . . . . . . . . . . . . . . . . . 321.7.7 Instructiuneafplot . . . . . . . . . . . . . . . . . . . . . 331.7.8 Instructiuneaezplot . . . . . . . . . . . . . . . . . . . . 351.7.9 Instructiuneafill . . . . . . . . . . . . . . . . . . . . . . 35

1.8 Instructiuni de ciclare si control . . . . . . . . . . . . . . . .. . . 361.8.1 Instructiuneaif . . . . . . . . . . . . . . . . . . . . . . . 371.8.2 Instructiuneaswitch . . . . . . . . . . . . . . . . . . . . 381.8.3 Instructiuneawhile . . . . . . . . . . . . . . . . . . . . . 391.8.4 Instructiuneafor . . . . . . . . . . . . . . . . . . . . . . 40

1.9 Instructiuni de ıntrerupere . . . . . . . . . . . . . . . . . . . . .. . 411.9.1 Instructiuneatry . . .catch . . . . . . . . . . . . . . . . . 411.9.2 Instructiuneapause . . . . . . . . . . . . . . . . . . . . . 421.9.3 Instructiuneareturn . . . . . . . . . . . . . . . . . . . . 421.9.4 Instructiuneabreak . . . . . . . . . . . . . . . . . . . . . 421.9.5 Instructiuneaerror . . . . . . . . . . . . . . . . . . . . . 43

1.10 Functii (proceduri) ın Matlab . . . . . . . . . . . . . . . . . . .. . 431.10.1 Definirea si structura unei functii Matlab . . . . . . .. . . 441.10.2 Apelul unei functii (proceduri) Matlab . . . . . . . . . .. . 451.10.3 Subfunctii . . . . . . . . . . . . . . . . . . . . . . . . . . . 451.10.4 Functiafeval . . . . . . . . . . . . . . . . . . . . . . . . 471.10.5 Comandaecho . . . . . . . . . . . . . . . . . . . . . . . . 48

1.11 Instructiuni de evaluare a eficientei . . . . . . . . . . . . .. . . . . 481.11.1 Instructiuneaflops . . . . . . . . . . . . . . . . . . . . . 481.11.2 Instructiuniletic si toc . . . . . . . . . . . . . . . . . . 49

1.12 Grafica tridimensionala . . . . . . . . . . . . . . . . . . . . . . . .491.12.1 Instructiuneaplot3 . . . . . . . . . . . . . . . . . . . . . 491.12.2 Instructiuneaezplot3 . . . . . . . . . . . . . . . . . . . 511.12.3 Instructiunilemeshgrid , mesh si surf . . . . . . . . . . 511.12.4 Instructiunilecontour si contourf . . . . . . . . . . . 541.12.5 Instructiunileezcontour si ezcontourf . . . . . . . . 561.12.6 Instructiunileezmesh , ezsurf , ezmeshc si ezsurfc . 571.12.7 Instructiunilebar3 si bar3h . . . . . . . . . . . . . . . . 58

2 Elemente de teoria probabilitatilor 612.1 Camp de probabilitate . . . . . . . . . . . . . . . . . . . . . . . . . 622.2 Variabile aleatoare . . . . . . . . . . . . . . . . . . . . . . . . . . 622.3 Functie de repartitie . . . . . . . . . . . . . . . . . . . . . . . . . . 632.4 Legi de probabilitate de tip discret . . . . . . . . . . . . . . . . .. 64

Page 3: Stat_Matlab.PDF

Cuprins iii

2.4.1 Functiile Matlabpdf si cdf . . . . . . . . . . . . . . . . . 652.4.2 Legi de probabilitate de tip discret clasice . . . . . . . .. . 67

2.5 Legi de probabilitate continue . . . . . . . . . . . . . . . . . . . . 732.5.1 Legi de probabilitate continue clasice . . . . . . . . . . . .742.5.2 Legi de probabilitate continue statistice . . . . . . . . .. . 812.5.3 Functia Matlabnormspec . . . . . . . . . . . . . . . . . 872.5.4 Distributie marginala . . . . . . . . . . . . . . . . . . . . . 882.5.5 Functie de repartitie conditionata . . . . . . . . . . .. . . . 892.5.6 Functie de supravietuire. Functie hazard . . . . . . .. . . . 92

2.6 Caracteristici numerice . . . . . . . . . . . . . . . . . . . . . . . . 942.6.1 Valoare medie. Dispersie (varianta). Covariant˘a . . . . . . . 942.6.2 Functii Matlab pentru valoare medie si dispersie . .. . . . 992.6.3 Valoare medie conditionata. Dispersie (variant˘a) conditionata 992.6.4 Functie caracteristica . . . . . . . . . . . . . . . . . . . . . 1032.6.5 Momente . . . . . . . . . . . . . . . . . . . . . . . . . . . 1032.6.6 Mediana. Cuartile. Cuantile . . . . . . . . . . . . . . . . . 1042.6.7 Functia Matlabicdf . . . . . . . . . . . . . . . . . . . . . 1042.6.8 Functia Matlabdisttool . . . . . . . . . . . . . . . . . 107

2.7 Siruri de variabile aleatoare . . . . . . . . . . . . . . . . . . . . .. 1072.7.1 Inegalitatea lui Cebısev . . . . . . . . . . . . . . . . . . . . 1072.7.2 Tipuri de convergenta . . . . . . . . . . . . . . . . . . . . . 1082.7.3 Legea numerelor mari . . . . . . . . . . . . . . . . . . . . 1092.7.4 Teoreme limita . . . . . . . . . . . . . . . . . . . . . . . . 109

3 Statistica descriptiva 1133.1 Concepte de baza ale statisticii . . . . . . . . . . . . . . . . . . .. 1143.2 Culegerea, prezentarea si prelucrarea datelor statistice . . . . . . . . 115

3.2.1 Generarea numerelor aleatoare ın Matlab . . . . . . . . . .1153.2.2 Tabele statistice . . . . . . . . . . . . . . . . . . . . . . . . 1193.2.3 Functiiletabulate si crosstab . . . . . . . . . . . . . 1253.2.4 Functiilecaseread , casewrite , tblread si tblwrite 1273.2.5 Reprezentari grafice . . . . . . . . . . . . . . . . . . . . . 1293.2.6 Functii Matlab pentru reprezentarea grafica a datelor statistice 1343.2.7 Functiarandtool . . . . . . . . . . . . . . . . . . . . . 1473.2.8 Functiilepie si pie3 . . . . . . . . . . . . . . . . . . . . 147

3.3 Parametrii distributiilor statistice . . . . . . . . . . . . .. . . . . . 1483.3.1 Parametri statistici ce masoara tendinta . . . . . . .. . . . 1483.3.2 Functiilemean, geomean si harmean . . . . . . . . . . 1493.3.3 Functiatrimmean . . . . . . . . . . . . . . . . . . . . . 1493.3.4 Functiamedian . . . . . . . . . . . . . . . . . . . . . . . 150

Page 4: Stat_Matlab.PDF

iv Cuprins

3.3.5 Parametri statistici ce masoara dispersarea . . . . .. . . . . 1503.3.6 Functiaprctile . . . . . . . . . . . . . . . . . . . . . . 1513.3.7 Functiamoment . . . . . . . . . . . . . . . . . . . . . . . 1553.3.8 Functiilevar si std . . . . . . . . . . . . . . . . . . . . . 1553.3.9 Functiilerange , iqr , mad, skewness si kurtosis . . 1553.3.10 Functiilemax si min . . . . . . . . . . . . . . . . . . . . . 1563.3.11 Functiilesort si sortrows . . . . . . . . . . . . . . . . 1563.3.12 Functiilesum, prod , cumsumsi cumprod . . . . . . . . 1573.3.13 Functiadiff . . . . . . . . . . . . . . . . . . . . . . . . . 1573.3.14 Functiile nanmean, nanmedian , nanstd , nanmin ,

nanmax si nansum . . . . . . . . . . . . . . . . . . . . . 1583.3.15 Corectiile lui Sheppard . . . . . . . . . . . . . . . . . . . . 1583.3.16 Functiagrpstats . . . . . . . . . . . . . . . . . . . . . 1633.3.17 Functiaboxplot . . . . . . . . . . . . . . . . . . . . . . 164

3.4 Corelatie si regresie . . . . . . . . . . . . . . . . . . . . . . . . . . 1653.4.1 Functiilecov si corrcoef . . . . . . . . . . . . . . . . . 1793.4.2 Functiilelsline , refline si gline . . . . . . . . . . 1813.4.3 Functiilepolyfit si refcurve . . . . . . . . . . . . . . 1823.4.4 Functiilepolyval , polyvalm , poly si roots . . . . . 1833.4.5 Functiapolytool . . . . . . . . . . . . . . . . . . . . . 1843.4.6 Functianlinfit . . . . . . . . . . . . . . . . . . . . . . 1853.4.7 Functianlintool . . . . . . . . . . . . . . . . . . . . . 1863.4.8 Coeficientii Spearman si Kendall . . . . . . . . . . . . . . . 187

4 Teoria selectiei 1974.1 Tipuri de selectie . . . . . . . . . . . . . . . . . . . . . . . . . . . 1974.2 Functii de selectie . . . . . . . . . . . . . . . . . . . . . . . . . . . 198

4.2.1 Media de selectie . . . . . . . . . . . . . . . . . . . . . . . 1994.2.2 Momente de selectie . . . . . . . . . . . . . . . . . . . . . 2014.2.3 Coeficient de corelatie de selectie . . . . . . . . . . . . . .2074.2.4 Functie de repartitie de selectie . . . . . . . . . . . . . .. . 2164.2.5 Functiacdfplot . . . . . . . . . . . . . . . . . . . . . . 223

5 Teoria estimatiei 2295.1 Functie de verosimilitate . . . . . . . . . . . . . . . . . . . . . . . 2295.2 Functii de estimatie . . . . . . . . . . . . . . . . . . . . . . . . . . 236

5.2.1 Functii de estimatie absolut corecte . . . . . . . . . . . .. 2375.2.2 Functii de estimatie corecte . . . . . . . . . . . . . . . . . 2395.2.3 Functii de estimatie eficiente . . . . . . . . . . . . . . . . . 2415.2.4 Estimatori optimali . . . . . . . . . . . . . . . . . . . . . . 247

Page 5: Stat_Matlab.PDF

Cuprins v

5.3 Metode pentru estimarea parametrilor . . . . . . . . . . . . . . .. 2515.3.1 Metoda momentelor . . . . . . . . . . . . . . . . . . . . . 2515.3.2 Metoda verosimilitatii maxime . . . . . . . . . . . . . . . . 2525.3.3 Metoda minimului�� . . . . . . . . . . . . . . . . . . . . 2565.3.4 Metoda intervalelor de ıncredere . . . . . . . . . . . . . . . 2575.3.5 Metoda intervalelor de ıncredere pentru selectii mari . . . . 2755.3.6 Functii Matlab privind estimatia . . . . . . . . . . . . . . .277

6 Verificarea ipotezelor statistice 2856.1 Concepte de baza . . . . . . . . . . . . . . . . . . . . . . . . . . . 2856.2 Testul� privind media teoretica . . . . . . . . . . . . . . . . . . . 286

6.2.1 Functiilezscore si ztest . . . . . . . . . . . . . . . . . 2906.3 Puterea unui test . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2916.4 Testul� (Student) privind media teoretica . . . . . . . . . . . . . . 304

6.4.1 Functiattest . . . . . . . . . . . . . . . . . . . . . . . . 3076.5 Testul raportului verosimilitatilor . . . . . . . . . . . . .. . . . . . 3086.6 Testul�� privind dispersia teoretica . . . . . . . . . . . . . . . . . 3126.7 Testul� (Fisher–Snedecor) pentru compararea dispersiilor . . . . . 3186.8 Teste pentru compararea mediilor . . . . . . . . . . . . . . . . . . 322

6.8.1 Dispersii cunoscute . . . . . . . . . . . . . . . . . . . . . . 3236.8.2 Dispersii egale necunoscute . . . . . . . . . . . . . . . . . 3256.8.3 Functiattest2 . . . . . . . . . . . . . . . . . . . . . . . 3276.8.4 Dispersii diferite necunoscute . . . . . . . . . . . . . . . . 3286.8.5 Observatii perechi . . . . . . . . . . . . . . . . . . . . . . 332

6.9 Testul�� pentru concordanta . . . . . . . . . . . . . . . . . . . . . 3346.10 Testul�� pentru compararea mai multor caracteristici . . . . . . . . 3466.11 Testul�� pentru tabele de contingenta . . . . . . . . . . . . . . . . 3496.12 Testul de concordanta al lui Kolmogorov . . . . . . . . . . .. . . . 353

6.12.1 Functiakstest . . . . . . . . . . . . . . . . . . . . . . . 3606.12.2 Functialillietest . . . . . . . . . . . . . . . . . . . . 362

6.13 Testul Kolmogorov–Smirnov . . . . . . . . . . . . . . . . . . . . . 3636.13.1 Functiakstest2 . . . . . . . . . . . . . . . . . . . . . . 366

Anexa I 369

Anexa II 370

Anexa III 371

Anexa IV 372

Page 6: Stat_Matlab.PDF

vi Cuprins

Anexa V 376

Bibliografie 377

Index 383

Page 7: Stat_Matlab.PDF

Prefata

Aspecte primare ale statisticii se pierd ın negura timpului. Astazi, putem spune, faraa gresi, ca statistica facem fiecare dintre noi, cu stiinta sau fara. Gandul la ziua demaine, cum ne organizam si cum folosim timpul si mijloacele materiale de care dis-punem, are la baza date (statistice) retinute (culese) si prelucrate ın mod simplu saumai complex. Ne dam seama, prin urmare, ca statistica are olarga raspandire, de lautilizarea ei ın mod empiric, pana la apelarea la metodele fundamentate matematic.

Statistica faceau chinezii antici, care dispuneau de date relative la populatie,pamanturi si recolte, dar si egiptenii, care efectuau cadastrari (operatii de determi-nare a unor proprietati agricole si imobiliare cu toate caracteristicile lor) si numararide populatie. Numararea populatiei era cunoscuta si la evrei, de exemplu, ın textebiblice sunt mentionate numarari de populatie, ca cea efectuata de Moise, privindbarbatii buni de oaste. La grecii antici erau, de asemenea, efectuate numarari depopulatie, ale bunurilor necesare pentru scopuri militare, pentru asezarea impozite-lor si evaluarea bogatiilor. Toate acestea au culminat cu recensamintele si ancheteleromane .

Culegerea de date privind resursele umane si materiale aveau la baza o gandirepractica, folosirea acestora ın scopuri fiscale, militare sau administrative. Putemspune ca toate acestea erau utilizate ın descriereastatului.

Tratarea stiintifica a datelor relative la descrierea statului se ıntalneste ın Germa-nia (sec. XVII–XVIII), iar denumirea destatistica apare ın cursul lui Martin Schmei-tzel (1679–1757), intitulat ”Collegium politico-statisticum” (Universitatea din Ha-lle). Unii istorici atribuie ıntaietate privind aceast˘a denumire lui Gottfried Achenwall(1719-1772), care a introdus ınvatamantul ”Staatskunde” la Universitatea din Gottin-gen.

In Anglia, ın aceeasi perioada, ın afara universitatilor, exista ca disciplina descrip-tiva a statului ceea ce se numeaaritmetica politica. Aritmetica politica se ocupa ınspecial de cercetarea fenomenelor demografice.

Un moment important ın dezvoltarea statisticii ıl reprezinta cristalizarea calculu-lui probabilitatilor.

Calculul probabilitatilor si fundamentarea riguroas˘a din punct de vedere matema-

vii

Page 8: Stat_Matlab.PDF

viii Prefata

tic a teoriei probabilitatilor reprezinta o problema fundamentala ın stabilirea loculuisi rolului acestei discipline matematice ın evantaiul larg al matematicii, precum si alfundamentarii teoretice a statisticii matematice.

Desigur, faptul ca cineva, cu diferite ocazii, folosestecuvantul probabil, nuınseamna ca este o persoana initiata ın calculul probabilitatilor. Am putea, eventual,accepta ca sunt percepute anumite aspecte empirice ale calculului probabilitatilor,cand, relativ la un anumit fenomen care prezinta un anumitgrad de nedeterminare,se emit afirmatii de forma:este putin probabil ca..., este foarte probabil ca..., esteimprobabil ca.... De la astfel de afirmatii si pana la cunoasterea si ıntelegerea ın pro-funzime a teoriei probabilitatilor este un drum lung, care este de un larg interes atatdin punct practic cat si teoretic, si care prezinta o atractie deosebita, nu numai pentrumatematicieni, dar si pentru specialisti din alte discipline ale cunoasterii umane: fi-zica, chimie, biologie, economie, medicina, inginerie etc. Aceste aspecte, de-a lungultimpului, se regasesc ın aparitia, dezvoltarea si fundamentarea axiomatica a teorieiprobabilitatilor, care se ımbina si se continua cu diferite domenii de aplicabilitate,dintre care statistica ocupa un rol privilegiat.

Este unanim acceptat ca notiunea de probabilitate ısi are originea ın jocurile denoroc. In antichitate, la egipteni, greci si romani erau cunoscute jocuri de noroc cuzaruri, care s-au perpetuat pana ın zilele de astazi. Separe ca cel mai vechi zar dateazadin jurul anilor���� ı.e.n. si avea fetele numerotate la ıntamplare de la� la �, fata dezarul actual, care are fetele numerotate astfel ca suma numerelor de pe fetele opusesa fie�. Proliferarea jocurilor de noroc s-a produs nu numai prin aria de raspındire,dar si prin diversitatea acestora. Ajunge sa amintim doarjocurile de ruleta care suntinstalate ın marile metropole ale lumii.

Problemele teoretice relative la jocurile de noroc, ın special privind sansele par-tenerilor, au atras atentia savantilor timpului. Astfel, fundamentarea elementara acalculului probabilitatilor poate fi atribuita francezilor P. de Fermat (1601–1665) siB. Pascal (1623–1662). Corespondenta din anul 1654, purtata de cei doi, contine pri-mele aspecte privind calculul sanselor ın jocurile de noroc. O parte din problemeleconsiderate au fost formulate si prezentate lui Pascal de catre Cavalerul de Mere, unrenumit amator al jocurilor de noroc din acea vreme.

Prima carte de introducere ın calculul probabilitatilor esteDe Ratiociniis in AleaeLudo(Cum se rationeaza ın jocurile cu zarul), aparuta ın anul���� si are ca autor peolandezul Ch. Huygens (1629–1695).

Totusi, se remarca faptul ca italianului G. Cardano (1501–1576) i se datoreazalucrarea intitulataLiber de Ludo Aleae(Cartea despre jocurile cu zarul), care a fostcunoscuta si publicata la mai bine de o suta de ani de la disparitia sa.

Un destin asemanator a avut si lucrarea lui James Bernoulli (1654–1705),ArsConjectandi(Arta de a face presupuneri), care a fost publicata de catre fratele sau

Page 9: Stat_Matlab.PDF

Prefata ix

John Bernoulli ın anul����. Se remarca ın continutul cartii, ceea ce se numeste azilegea numerelor mari, unul din rezultatele stralucitoareale teoriei probabilitatilor.

Un alt rezultat de aceeasi dimensiune, teorema limita centrala, se gaseste ın carteaDoctrine of Chances, aparuta ın anul���� si care este opera lui A. de Moivre (1667–1754), ceea ce, se cunoaste, este strans legata de legea normala de probabilitate.

Descoperirea legii normale de probabilitate este atribuita, de cele mai multe ori,lui K. F. Gauss (1777–1855), si care este considerata ca fiind specifica erorilor demasurare. Trebuie remarcat faptul ca ın anul 1808, cu un an ınainte de descoperirealui Gauss, topograful american Robert Adrain (1775–1843) publicase o lucrare ıncare a sugerat utilizarea legii normale pentru descrierea erorilor de masurare.

Rezultatele lui Moivre, privind teorema limita centrala, sunt extinse de catre P. -S. de Laplace (1770–1820), stabilind de asemenea legaturacu legea normala de pro-babilitate, ın carteaTheorie Analytique des Probabilites(Teoria analitica a probabi-lit atilor), aparuta ın anul����.

Un statistician belgian de seama al sec. XIX, unanim recunoscut pentru rezulta-tele de pionerat ın domeniul statisticii matematice este A. Quetelet (1796–1874). Denumele lui se leaga notiuni ale statisticii ca: repartitie, medie, dispersie, observare demasa, regularitate. Pentru el, statistica reprezenta singura metoda ce se poate aplicafenomenelor de masa.

Un salt remarcabil ın dezvoltarea teoria probabilitatilor a fost facut prin contri-butia matematicienilor rusi L. P. Cebısev (1821–1884), A. A. Markov (1856–1922)si A. M. Leapunov (1857–1918). Primul a introdus notiuneade variabila aleatoare,reformuland si generalizand legea numerelor mari ın limbajul variabilelor aleatoare.Folosind notiunea de variabila aleatoare, A. A. Markov si A. M. Leapunov au obtinutapoi alte rezultate privind legea numerelor mari si teorema limita centrala.

Pasul decisiv privind fundamentarea moderna a teoriei probabilitatilor este facutprin lucrarea matematicianului rus A. N. Kolmogorov (1903–1989), aparuta ın anul1933. A. N. Kolmogorov, folosind teoria masurii, reuseste sa construiasca modelulaxiomatic al teoriei probabilitatilor.

Se remarca de asemenea preocupari si rezultate importante obtinute de alti ma-tematicieni ca: S. D. Poisson (1781–1840),E. Borel (1871–1956), S. N. Bernstein(1880–1968), R. von Mises (1883–1953), A. I. Hincin (1894–1959).

Sfarsitul sec. XIX si ınceputul sec. XX se considera a fiınceputul statisticii mo-derne. Este momentul cand se trece de la etapa descriptiva, la interpretarea analitica afenomenelor de masa si obtinerea de concluzii inductivepe baza observatiilor empi-rice. Statisticieni de renume, care au pus bazele statisticii matematice sunt consideratia fi englezii F. Galton (1822–1911) si K. Pearson (1857–1936). Opera acestora estecontinuata de celebrul statistician R. A. Fisher (1890–1962). Dintre reprezentantiiscolii engleze de statistica amintim pe G. U. Yule (1871–1951), W. S. Gosset (1876–

Page 10: Stat_Matlab.PDF

x Prefata

1937), C. E. Spearman (1883–1945), M. Kendall (1907–1983).Pentru detalii privind istoricul statisticii recomandamlucrarea [38].Astazi, statistica matematica, avand un suport teoretic al teoriei probabilitatilor,

are o dezvoltare si aplicabilitate deosebita. Care este motivul aplicarii statisticii ma-tematice pe o scara larga si ın atatea domenii ale cunoasterii umane? Am putea dadoua raspunsuri principale.In primul rand, fiecare cercetator sau persoana care anali-zeaza fenomene ale lumii reale, modeleaza astfel de fenomene, cauta sa puna la bazametodelor sale de cercetare stiintifica, de evaluare a fenomenelor reale, un instrumentde investigare obiectiv. Si este cvasiunanim recunoscut ca matematica are astfel deinstrumente de investigare, inclusiv prin metodele statisticii matematice.In al doilearand, metodele statisticii matematice sunt usor de aplicat. Greutatea consta numaiın fundamentarea riguroasa din punct de vedere matematica acestora. Acest aspecteste ascuns celui care aplica statistica matematica.In materialul pe care ıl prezentam,consideram notiunile (conceptele) de baza ın initierea studiului si aplicarii statisticiimatematice. Se considera partea “ascunsa” a statisticiimatematice, adica fundamen-tarea teoretica, cat de cat riguroasa, a statisticii matematice, dar si partea care prezintamodul de aplicare a metodelor statisticii matematice.

Daca ın tot acest demers avem la dispozitie si mijlocul modern de lucru, reprezen-tat astazi printr–un calculator performant sau mai putinperformant, atunci statisticadevine foarte atractiva. De aceea au fost elaborate o seriede produse soft, care pre-zinta ıntr–o conceptie unitara reprezentarea, prelucrarea si studiul datelor statistice.Amintim aici cateva astfel de produse soft:Statgraphics, Statistica, S–Plus, SAS, Sta-tXact, SPSS, Stata, GraphPad, ViStaetc. Remarcam de asemenea ca unele produsesoft elaborate ın alte scopuri decat cel al prelucrarii datelor statistice, contin proceduriprivind prelucrarea mai elementara sau mai complexa a datelor statistice.In aceastacategorie se ıncadreaza si produsulMatlab, care va fi invocat ın prezenta lucrare, dartot ın aceasta categorie putem aminti siMathematica, Mapleetc.

Page 11: Stat_Matlab.PDF

Capitolul 1

Introducere ın Matlab

MATLAB (MATrix LABoratory) este un sistem interactiv de nivel si performantaınalte pentru efectuarea de calcule stiintifice si tehnice, precum si de analiza si vizua-lizare a datelor si care dispune de un limbaj propriu de programare.

Prima versiune a fost realizata ın anii�� de catreCleve Moler, iar versiuneautilizata ın cele ce urmeaza esteMatlab 6.0.

Se pare ca acest produs are o larga raspandire din mai multe motive:

� interactivitatea sistemului;

� elementele de baza sunt matricele, dupa cum spune si denumirea, ale carortipuri si dimensiuni nu se declara;

� grafica puternica si foarte usor de utilizat;

� posibilitatea integrarii unor proceduri proprii ın limbaje de programare cum arfi Fortran, C;

� arhitectura modulara, care permite adaugarea unor proceduri si functii proprii,ceea ce a permis deja elaborarea unor pachete de proceduri si functii, numitetoolbox–uri, orientate pe anumite domenii, cum ar fi

– Statistica –Statistics Toolbox;

– Functii spline –Spline Toolbox;

– Analiza wavelet –Wavelet Toolbox;

– Procesarea semnalelor –Signal Processing Toolbox;

– Procesarea imaginilor –Image Processing Toolbox;

– Modelare, simulare si analiza sistemelor dinamice –Simulink;

1

Page 12: Stat_Matlab.PDF

2 Introducere ın Matlab

– Calcul simbolic –Symbolic/Extended Symbolic Math Toolbox;

– Ecuatii cu derivate partiale –PDE Toolbox;

– Optimizare –Optimization Toolbox.

1.1 Gestionarea unei sesiuni Matlab

1.1.1 Lansarea siınchiderea unei sesiuni Matlab

Trebuie sa remarcam de la ınceput ca sistemul Matlab dispune de o puternica baza dehelp–uri, dar care poate fi activata doar dupa ce sistemul Matlab a fost lansat.

Lansarea sistemului Matlab se efectueaza prin comenzi ce sunt specifice sistemu-lui de operare pe care este instalat. Vom considera ın continuare sistemul de operareWindows, caz ın care lansarea se face prin activarea

� icon-ului Matlab sau

� aplicatiei Matlabdin directorul ın care a fost instalat sistemul Matlab.

In urma efectuarii acestei comenzi se deschide o fereastr˘a ın care apare prompterulspecific sistemului Matlab

>>

Sistemul Matlab devine ın acest fel interactiv, adica la fiecare comanda sau functietastata si acceptata de Matlab (editarea comenzii sau functiei ıncheindu–se prinEnter ), sistemul o executa si afiseaza pe ecran rezultatul, daca este cazul.

Exista posibilitatea de trecere de la modul interactiv la cel programat, prin tasta-rea numelui unui fisier (cu extensia�m), care contine un program ın sistemul Matlab(succesiune de instructiuni Matlab) si care mod se ıncheie odata cu terminarea exe-cutarii programului respectiv, dupa care se revenie la modul interactiv.

Incheierea unei sesiuni Matlab se poate face, fie prin comenzi specifice sistemuluide operare Windows, fie prin tastarea uneia din comenzile

>>quit>>exit

1.1.2 Comenzihelp

Comandahelp permite utilizatorilor sa aiba acces la o mare cantitate de informatie(ın limba engleza) relativa la ıntreg sistemul Matlab.

Exista diferite variante pentru lansarea comenziihelp , anume prin:

� tastarea comenziihelp urmata de domeniul (topic ) ın care suntem intere-sati, adica

Page 13: Stat_Matlab.PDF

1.1. Gestionarea unei sesiuni Matlab 3

>>help topic

Remarcam faptul ca parametrultopic poate lipsi. Astfel, lansarea comenzii

>>help

are ca efect afisarea pe ecran a unei liste ce cuprinde domeniile care opereaza ınversiunea curenta Matlab

HELP topics:

matlab\general - General purpose commands.matlab\ops - Operators and special characters.matlab\lang - Programming language constructs.matlab\elmat - Elementary matrices and matrix manipulatio n.matlab\elfun - Elementary math functions.matlab\specfun - Specialized math functions.matlab\matfun - Matrix functions - numerical linear algebr a.matlab\datafun - Data analysis and Fourier transforms.matlab\audio - Audio support.matlab\polyfun - Interpolation and polynomials.matlab\funfun - Function functions and ODE solvers.matlab\sparfun - Sparse matrices.matlab\graph2d - Two dimensional graphs.matlab\graph3d - Three dimensional graphs.matlab\specgraph - Specialized graphs.matlab\graphics - Handle Graphics.matlab\uitools - Graphical user interface tools.matlab\strfun - Character strings.matlab\iofun - File input/output.matlab\timefun - Time and dates.matlab\datatypes - Data types and structures.matlab\verctrl - Version control.matlab\winfun - Windows Operating System Interface Files

(DDE/ActiveX)matlab\demos - Examples and demonstrations.toolbox\local - Preferences.toolbox\stats - Statistics Toolbox.

For more help on directory/topic, type "help topic".

� tastarea comenziilookfor urmata de un cuvant cheie (key ), ın care sunteminteresati, adica

>>lookfor key

va lista prima linie de comentariu din fiecare fisier cu extensia .m , care continecuvantul cheiekey , precedata de numele fisierului.

Page 14: Stat_Matlab.PDF

4 Introducere ın Matlab

� tastarea comenziihelpwin urmata de un domeniu (topic ) ın care sunteminteresati, adica

>>helpwin topic

produce deschiderea unei ferestre cu informatii relativela domeniul precizat.

� tastarea comenziihelpdesk , adica

>>helpdesk

produce deschiderea unei ferestre prin care se permite cautarea ın bazahelp –uluiMatlab.

1.1.3 Comenzi sistem

Sistemul Matlab opereaza cu o multime de comenzi pe care leıntalnim si ın altesisteme. Enumeram o parte dintre acestea:

� mkdir – deschiderea unui subdirector nou ın directorul curent;

� cd – schimarea directorului curent;

� dir – lista continutului directorului curent;

� version – afisarea versiunii sistemului Matlab instalat;

� !com – iesire temporara din sistemului Matlab instalat si executia comenziiWindows precizata princom;

� demo– lansarea executiei de programe demonstrative.

Inainte de ınceperea unei sesiuni este de dorit sa se creeze un director prin co-mandamkdir , pentru salvarea fisierelor, iar apoi trecerea ın acest director prin co-mandacd .

1.2 Constante. Variabile. Expresii aritmetice

Avand ın vedere ca sistemul Matlab opereaza numai cu un singur tip de obiect, ma-trice numerica, care ar putea avea elemente numere complexe, rezulta ca orice scalareste considerat ca o matrice cu o linie si o coloana.In plus, reprezentarea internaa elementelor matricelor si operatiile cu acestea se fac ˆın dubla precizie. Deoarecereprezentarea interna este prestabilita, avem doar posibilitatea de precizare a tipului(formatului) de afisare (iesire) respectiv de intrare a datelor.

Page 15: Stat_Matlab.PDF

1.2. Constante. Variabile. Expresii aritmetice 5

1.2.1 Constante

Introducerea constantelor se poate face:� de la tastatura;

� prin generarea cu ajutorul unor instructiuni Matlab;

� dintr–un fisier creat cu ajutorul unui editor.

La intrare constantele numerice pot fi de tipul:� ıntreg: 2002, -2002;

� real: 3.14159, 0.314e1, -.314e+01, 31.4e-1, 31.4e-01;

� complex: a+bi , undea si b sunt doua constante ıntregi sau reale, iari repre-zinta unitatea imaginara (i �

���).

1.2.2 Instructiuneaformat

Sistemul Matlab dispune de cateva sabloane (formatari)standard pentru afisarea (ex-tragera) datelor numerice. Instructiuneaformat prin care se precizeaza formatulstandard are sintaxa

>>format tip

undetip poate lua una din valorileshort , long , short e , long e , short g ,long g , hex , +, bank , rat , loose , compact .

Formateleshort si long afiseaza pe ecran datele numerice ın virgula fixa,respectiv cu 5 cifre zecimale si 15 cifre zecimale (precedate de semnul minus, dacasunt negative).

Formateleshort e si long e afiseaza pe ecran datele numerice ın virgula flo-tanta, respectiv cu 5 cifre zecimale si 15 cifre zecimale (precedate de semnul minus,daca sunt negative).

Formateleshort g si long g afiseaza pe ecran datele numerice cu cea maipotrivita reprezentare, virgula fixa sau virgula flotanta, respectiv cu 5 cifre zecimalesi 15 cifre zecimale (precedate de semnul minus, daca suntnegative).

Formatelerat , bank , hex si + afiseaza pe ecran respectiv datele numerice subforma de fractie ordinara, sub forma bancara (cu douazecimale), sub forma hexaze-cimala, iar ın ultimul caz, prin+ daca numarul este pozitiv, respectiv- , daca numaruleste negativ sispat¸iu daca este zero.

Formateleloose si compact permite afisare datelor la doua randuri (formatimplicit), respectiv la un rand ın cazul al doilea.

Pentru a afla la un moment dat, care format este ın functie sepoate apela lacomanda

>>get(0,’Format’)

Page 16: Stat_Matlab.PDF

6 Introducere ın Matlab

1.2.3 Constante speciale

Sistemul Matlab are cateva constante speciale, care au denumiri specifice (identifica-tori specifici):

� inf – rezultatul ımpartirii la 0;

� NaN(Not a Number) – rezultatul operatiei de tipul���

;

� realmax – cel mai mare numar real pozitiv reprezentat pe dublu cuvant(1.7977e+308 );

� realmin – cel mai mic numar real pozitiv reprezentat pe dublu cuvant(2.2251e-308 );

� pi – �=3.14159... (valoarea reprezentata pe dublu cuvant);

� eps – epsilonul masinii (eps =2.2204e-16 =2�54 );

� date – data curenta;

� clock – timpul curent;

� calendar – calendarul lunii curente;

� i, j – unitatea imaginara (i,j =��

�);

� zeros(n) si zeros(m,n) – genereaza matricea patratica de ordinn, res-pectiv matricea cumlinii si n coloane, avand toate elementele nule;

� ones(n) si ones(m,n) – genereaza matricea patratica de ordinn, respectivmatricea cumlinii si n coloane, avand toate elementele 1;

� eye(n) si eye(m,n) – genereaza matricea patratica de ordinn, respectivmatricea cum linii si n coloane, avand pe diagonala principala 1 si 0 ın rest(cand matricea este patratica avem matricea unitate);

� magic(n) – genereaza matrice magica patratica de ordinn.

Pentru introducerea elementelor unei matrice, linie cu linie, elemente ce pot fi expri-mate si prin expresii aritmetice, acestea sunt incluse ıntre paranteze drepte. Elemen-tele fiecarei linii sunt separate prin spatiu sau virgula, iar liniile sunt separate prinpunct–virgula(;) sau prin trecerea la randul urmator.

Astfel matricea �� � �� � � �

se poate introduce de la tastatura prin

Page 17: Stat_Matlab.PDF

1.2. Constante. Variabile. Expresii aritmetice 7

>>[3 5 2;9 1 4]

sau

>>[3,5,2;9,1,4]

Daca elementele matricei prezinta regularitatea, ca elementele unei linii sunt dateprintr–o progresie aritmetica, atunci avem o introducereprescurtata. De exemplu,introducerea matricei �

� � � �� � � � �se poate face de la tastatura prin

>>[3:2:9;9:-3:0]

1.2.4 Variabile

Variabilele sunt matrice ce sunt utilizate ıntr–un program Matlab sau ın mod interac-tiv si ale caror valori pot fi modificate. Numele lor fiind precizate prinidentificatori,care sunt dati de orice combinatie de litere, cifre zecimale si liniuta de subliniere, dincare primul caracter este litera: Matrice1, mat, ClujNapoca.

Apelarea si vizualizarea unui element al unei variabile (matrice) se face prin spe-cificarea numelui variabilei urmat de lista indicilor corespunzatori, separati prin vir-gula, ınchisa ıntre paranteze. De exemplu,A(i,j ) pune ın evidenta elementul dinlinia i si coloanaj al matriceiA.

Facem observatia ca matricele ın sistemul Matlab nu accepta decat indici strictpozitivi.

Utilizand operatorul doua puncte (:) se pot obtine submatrice ale unei matrice.De exemplu,A(1:3,4:5) extrage submatricea formata din primele trei linii si co-loanele 4 si 5 ale matriceiA, iar A(:,4) si A(1,:) extrag respectiv coloana a patraa matriceiA si prima linie a matriceiA. O forma mai generala de obtinere a uneisubmatrice se realizeaza prin apelul de formaA([l],[c]) , undel si c reprezintaliste de indici de linie si indici de coloane, separati prin virgula sau spatiu. Astfel va fiobtinuta submatricea formata din liniile si coloaneleprecizate prinl , respectivc alematriceiA. Daca se introduce comandaA(:) , atunci matriceaA este transformataıntr–un vector coloana, ce contine coloanele matricei.

Alte combinatii ale acestor tipuri de specificare ale elementelor unei matrice potfi considerate.

Mai remarcam aici comanda

>>reshape(A,m,n)

care transforma matriceaA ıntr–o matrice cumlinii si n coloane. DacaA nu arem�nelemente, atunci apare eroare la executare.

Page 18: Stat_Matlab.PDF

8 Introducere ın Matlab

1.2.5 Operatori aritmetici

Expresiile aritmetice se construiesc dupa cunoscutele reguli ale limbajelor de pro-gramare evoluate, folosind operatorii aritmetici cunoscuti, desigur cu unele operatiispeciale specifice sistemului Matlab.

Ordinea executiilor operatiilor aritmetice este de asemenea cea cunoscuta si pecare o reamintim aici, ıncepand cu cel mai ınalt nivel :

� prima data sunt executate operatiile aritmetice dintre paranteze;

� urmeaza ridicarea la putere, iar daca sunt mai multe operatii consecutive deacest tip, atunci ordinea executiei este de la dreapta la stanga;

� urmatorul nivel de prioritate include operatiile de ınmultire si ımpartire, iardaca sunt mai multe operatii consecutive de acest tip, atunci ordinea executieieste de la stanga la dreapta;

� ultimul nivel de prioritate contine operatiile de adunare si scadere, iar daca suntmai multe operatii consecutive de acest tip, atunci ordinea executiei este de lastanga la dreapta.

Operatorii aritmetici matriceali de care dispune sistemulde baza Matlab sunt:

� A+B, A-B sauplus(A,B), minus(A,B) – aduna, respectiv face dife-renta matricelorA si B de aceleasi dimensiuni, iar daca unul dintre operanzi eun scalar, acesta este extins la matricea constanta data prin scalarul respectiv,avand dimensiunile celeilalte matrice, dupa care se efectueaza operatia;

� A*B saumtimes(A,B) – ınmulteste matriceleA si B, pentru care numarulcoloanelor matriceiA este acelasi cu numarul liniilor matriceiB, iar daca unadin matrice e un scalar, acesta va ınmulti toate elementele celeilalte matrice;

� AˆB saumpower(A,B) – dacaB este un scalarp ıntreg pozitiv, atunci se ob-tine putereap a matricei patraticeA, iar dacaA este un scalar�, atunci se ridicascalarul� la putereaB, matriceaB fiind patratica, adica, pentru exemplificare,daca� � e, atunci eB ���

��� B��� �� AB, A B , A

�B, A/B , sau formele echivalente, respectivtimes(A,B) ,

power(A,B) , ldivide(A,B) , rdivide(A,B) – efectueaza operatiilede ınmultire, de ridicare la putere, ımpartire inversa, ımpartire directa, toate detipul element cu element (ca la operatiile de adunare si scadere), pentru matri-cele de aceleasi dimensiuni, iar daca una dintre matrice eun scalar, aceasta esteextinsa la matricea constanta data prin scalarul respectiv, avand dimensiunileceleilalte matrice, dupa care este efectuata operatia;

Page 19: Stat_Matlab.PDF

1.2. Constante. Variabile. Expresii aritmetice 9

� A�B saumldivide(A,B) – are ca rezultat matricea ce reprezinta solutia

ecuatiei matricealeA*X=B, cand matricea patraticaA este inversabila, iar dacaB este un vector coloana se obtine solutia sistemului liniar corespunzator;

� A/B saumrdivide(A,B) – are ca rezultat matricea ce reprezinta solutiaecuatiei matricealeX*B=A, cand matricea patraticaB este inversabila;

� [A B], [A;B] (concatenarea) – produce concatenarea matricelorA si B peorizontala, respectiv pe verticala, cu conditia ca la concatenarea pe orizontalatrebuie ca numarul liniilor celor doua matrice sa fie acelasi, iar la concatenareape verticala se impune ca numarul coloanelor celor doua matrice sa fie acelasi.

1.2.6 Functii predefinite

Sistemul Matlab dispune de numeroase functii matematice.Remarcam faptul ca toateacestea, avand ın vedere ca matricele sunt obiectele de baza ın Matlab, actioneazaasupra matricelor.

Incercam o clasificare a acestora:

� abs (modul),sqrt (radical),sign (semn),conj (conjugat),angle (argu-ment al numarului complex),imag (parte imaginara),real (parte reala);

� sin (sinus),cos (cosinus),tan (tangenta),cot (cotangenta),csc (cose-canta),sec (secanta);

� asin (arcsinus),acos (arccosinus),atan (arctangenta),acot (arccotan-genta),acsc (arccosecanta),asec (arcsecanta),sinh (sinus hiperbolic),cosh (cosinus hiperbolic),tanh (tangenta hiperbolica),coth (cotangenta hi-perbolica),csch (cosecanta hiperbolica),sech (secanta hiperbolica),asinh(arcsinus hiperbolic),acosh (arccosinus hiperbolic),atanh (arctangenta hi-perbolica),acoth (arccotangenta hiperbolica),acsch (arccosecanta hiper-bolica),asech (arcsecanta hiperbolica);

� exp (exponentiala),log (logaritm natural),log10 (logaritm zecimal),log2(logaritm ın baza doi);

� round (rotunjire la cel mai apropiat ıntreg),floor (rotunjire spre��), fix

(rotunjire spre zero),ceil (rotunjire spre��).

Facem observatia ca pentru functiile trigonometrice seimpune ca argumentele sa fiedate ın radiani.

Daca argumentul functiilor predefinite este matrice, atunci functia se aplicafiecarui element al matricei.

Page 20: Stat_Matlab.PDF

10 Introducere ın Matlab

� atan2(A,B) (are acelasi efect cuatan(A.�B) ), rem(A,B) (restul ım-

partirii lui A la B).

DacaA si B sunt matrice, atunci trebuie sa fie de aceeasi dimensiune,iar functia seaplica element cu element.

� size(A) (dimensiunea matriceiA), length(A) (lungimea vectoruluiA),ndims(A) (numarul dimensiunilor matriceiA), disp(A) (afiseaza ele-mentele matriceiA fara numele matricei),det(A) (determinantul matriceipatraticeA), inv(A) (inversa matricei patraticeA), rank(A) (rangul matri-cei A), A’ sautranspose(A) (transpusa matriceiA, daca matricea este cuelemente numere reale, daca are elemente numere complexe,atunci se efec-tueaza matricea transpusa a conjugatelor elementelor),A’ (transpusa matriceiA), diag(A) (diagonala matricei patraticeA, iar dacaA este vector, gene-reaza matricea patratica diagonala cu elementele diagonalei date de vector),trace(A) (urma matricei patraticeA, adica�� ���).

Trebuie sa remarcam ca dacaA este un vector linie, atunciA�este un vector coloana

si invers, dacaA este un vector coloana, atunciA�este un vector linie.

� factorial(n) (factorialul lui n), perms(1:n) sauperms(v) (gene-reaza toate pemutarile primelorn numere naturale, respectiv genereaza toatepermutarile componentelor vectoruluiv ), nchoosek(n,k) sau variantanchoosek(v,k) (calculeaza numarul combinarilor den elemente luate catek , respectiv genereaza toate combinarile elementelor vectorului v luate catek ),combnk(v,k) (genereaza toate combinarile elementelor vectoruluiv luatecatek ), factor(n) (factorii primi ai lui n repetati de atatea ori cat repre-zinta puterea acestora),primes(n) (numerele prime mai mici decatn), gcd(cmmdc),lcm (cmmmc).

1.2.7 Comenzi pentru gestiunea variabilelor si a spatiului de lucru

Sistemul Matlab se poate lansa din orice director, acesta devenind directorul curent.Desigur este de dorit ca utilizatorul sa lucreze ıntr–un director propriu. Asa cum amvazut, un astfel de director poate fi creat pana nu se intr˘a ın sistemul Matlab, ca apoiacesta sa fie lansat din acest director sau se poate lansa la ˆınceput sistemul Matlab,iar apoi prin comenzilecd si mkdir sa se ajunga ıntr–un director al utilizatoruluisau sa se creeze un director propriu nou.

Toate operatiile sunt executate ın directorul curent.Daca se doresc informatii relative la variabilele existente la un moment dat ın

directorul curent se pot lansa una din comenzile:

Page 21: Stat_Matlab.PDF

1.2. Constante. Variabile. Expresii aritmetice 11

� who – produce lista variabilelor curente;

� whos – produce lista variabilelor curente, ımpreuna cu informatii privindaceste variabile (dimensiune, numar de elemente, memorieocupata, tipul);

� clear – sterge variabilele si functiile temporare din directorul curent (sterge-rea unei singure variabile se realizeaza prin comandaclear urmata de numelevariabilei);

� diary file – salveaza toate informatiile aparute pe ecran ın timpul de-rularii unei sesiuni ın fisierulfile , cu exceptia graficelor;

� save – salveaza variabilele de lucru pe disc;

� load – ıncarca variabilele de lucru de pe disc.

Comenzile

>>save file>>save file x y z

vor salva ın fsierulfile.mat toate variabilele din sesiune curenta, respectiv numaivariabilelex , y , z .

Diferenta dintre comandadiary si comandasave este ca fisierul obtinut prindiary se poate modifica (edita) cu ajutorul unui editor, pe cand celalalt nu se poateedita.

De asemenea, remarcam faptul ca ın fisierul creat prin comandadiary continetoate informatiile pana la ıntalnirea comenzii

>>diary off

Daca ınainte de ınchiderea unei sesiuni Matlab nu se executa o comandasave , atuncitoate variabilele ımpreuna cu continutul lor se pierd.

Intr–o alta sesiune Matlab, se pot recupera variabilele din sesiunea precedenta,daca au fost salvate prin comandasave , prin lansarea comenziiload . Anume, dacafisierul salvat estefile.mat atunci comanda

>>load file

va ıncarca varaibilele cu continutul lor pentru sesiunea curenta.Comandaload poate fi utilizata si pentru ıncarcarea unui fisier ASCII creat cu

alt editor. Astfel comanda

>>load A.dat -ascii

va avea ca efect pentru sesiunea curenta a generarii unei variabile cu numeleA si carecontine ca valori datele din fisierulA.dat .

Page 22: Stat_Matlab.PDF

12 Introducere ın Matlab

1.3 Instructiuni de atribuire

Sistemul Matlab dispune de trei tipuri de instructiuni de atribuire:

expresievariabila = expresie[lista de variabile] = func

Expresia se compune, dupa reguli cunoscute ın programare, cu ajutorul operatiiloraritmetice si al functiilor, prin operarea asupra constantelor si asupra variabilelor.

Daca se considera prima forma a instructiunii de atribuire, atunci rezultatul estepastrat ıntr–o variabila de lucru numitaans si care ramane nemodificata pana laexecutia unei alte instructiuni de atribuire de aceastaforma. Forma a doua faceaceasta atribuire, variabilei din partea stanga a semnului de egalitate.

Forma a treia este specifica pentru cazul ın care se apeleaza oprocedura (functieMatlab), care returneaza mai mult de o valoare.

Exista expresii specifice sistemului Matlab, care nu au corespondent ın alte lim-baje evoluate. Daca vrem sa atribuim unei variabile valori care sunt obtinute ca sielemente ale unei progresii aritmetice, atunci putem folosi una din instructiunile deatribuire

>>vi:pas:vf>>x = vi:pas:vf

undevi , pas , vf sunt expresii aritmetice, care pot fi evaluate la momentul exe-cutarii instructiunii.In urma executarii acestor instructiuni variabilaans respectivxva contine valorile numerice ıncepand cuvi pana lavf cu pasulpas .

Daca valoarea luivf este mai mica decat cea a luivi si pas are valaore negativa,atunci rezultatul instructiunii de atribuire estematricea vida, avand sintaxa [].

Dacapas=1 , atunci se pot considera formele echivalente

>>vi:vf>>x = vi:vf

Un alt tip specific de instructiune de atribuire a sistemului Matlab este acela candvariabila primeste valoarea unei submatrice. De exemplu,instructiunile de atribuire

>>x = A(:,2)>>y = A(end,1:10)

au ca efect obtinerea ınx a vectorului coloana format din coloana a doua a matriceiA,iar y va fi un vector linie format din primele 10 elemente ale ultimei linii a matriceiA.

Orice instructiune poate fi continuata pe linia urmatoare prin trei puncte (. . . ) .O linie poate sa contina mai multe instructiuni separate prin virgula sau prin

punct-virgula (;).Daca o instructiune este urmata de punct-virgula (;), atunci valoarea variabilei nu

este afisata dupa executarea instructiunii, ın caz contrar valoarea curenta a variabileiva fi afisata.

Page 23: Stat_Matlab.PDF

1.4. Instructiuni de citire si scriere 13

1.4 Instructiuni de citire si scriere

1.4.1 Instructiuneainput

Sintaxa comenziiinput este:>>v = input(’s’)

Prin executarea acestei instructiuni se afiseaza pe ecran sirul de caractere dat prins ,asteptandu–se tastarea datelor ce se doresc a fi atribuitepentru variabilav . Candse ıncheie operatiunea de tastarea datelor, se tasteazaEnter , drept consecinta seefectueaza operatia de atribuire.

1.4.2 Instructiuneaginput

Instructiuneaginput permite introducerea de date cu ajutorulmouse-ului dintr-ofereastra ce are trasate axele de coordonate.

Exista urmatoarele forme ale instructiuniiginput :>>[x,y] = ginput(n)>>[x,y] = ginput>>[x,y,buton] = ginput(n)

Executarea unei astfel de instructiuni produce introducerea coordonatelor unorpuncte din figura curenta,n cand se folosesc prima si ultima varianta, respectiv unnumar nedefinit, cand se foloseste varianta a doua. La ınceput apare pe ecran ın fe-reastra figurii curente cursorul realizat prin doua drepteverticale. Prin pozitionarisuccesive, cu ajutorulmouse-ului, ale cursorului pe anumite puncte, urmate declick-uri, coordonatele acestora sunt introduse respectiv ın vectorii x si y . Pentru prima siultima forma trebuie efectuate astfel de operatii succesive ın numar den, iar pentru adoua succesiunea de operatii se ıncheie prin tastarea comenzii Enter . Forma a treiava returna si vectorulbuton , care specifica ce buton almouse–lui a fost folosit lafiecare operatie (1, 2 sau 3, ıncepand de la stanga).

1.4.3 Instructiuneafprintf

Afisarea pe ecran si nu numai, folosind un format propriu, se face cu ajutorulinstructiuniifprintf . Vom prezenta ın continuare numai modul de afisare pe ecranfolosind aceasta instructiune.

Cea mai simpla sintaxa a acestei instructiuni este>>fprintf(’f’,x)

prin care valoarea variabileix este afisata pe ecran conform formatuluif .Formatul f poate fi, de exemplu:%md, %md

�n, %m.zf , %m.zf

�n, %m.ze,

%m.ze�n, undemd, m.zf si m.ze exprima respectiv faptul ca valoarea luix se

afiseaza pempozitii ca un ıntreg, ca un real cuz cifre zecimale, ca un real normalizat

Page 24: Stat_Matlab.PDF

14 Introducere ın Matlab

cu z cifre zecimale. Parametrul�n specifica faptul ca dupa afisare se trece la randul

urmator (tine locul comenziiEnter ).

1.5 Operatori relationali si operatori logici

1.5.1 Operatori relationali� A==B sau eq(A,B) , A˜=B sau ne(A,B) , A<B sau lt(A,B) , A>B sau

gt(A,B) , A<B sau lt(A,B) , A>B saugt(A,B) , A<=B sau le(A,B) ,A>=B sauge(A,B) – compara element cu element matricele de aceleasi di-mensiuniA si B si produce o matrice ce are valorile1 si 0, cand conditia esteadevarata respectiv falsa, iar daca unul din operanzi este un scalar, acesta esteextins la matricea constanta data prin scalarul respectiv, avand dimensiunileceleilalte matrice, dupa care se efectueaza operatia relationala.

1.5.2 Operatori logici� A

�B sauand(A,B) (conjunctia) – compara element cu element matricele de

aceleasi dimensiuniA si B si produce o matrice ce are valorile1 si 0, candambele elemente sunt diferite de zero, respectiv cel putinunul din cele douaelemente este zero;

� A�B sauor(A,B) (disjunctia) – compara element cu element matricele deaceleasi dimensiuniA si B si produce o matrice ce are valorile1 si 0, cand celputin unul din cele doua elemente este zero, respectiv ambele elemente suntzero;

� xor(A,B) (disjunctia exclusiva) – compara element cu element matricele deaceleasi dimensiuniA si B si produce o matrice ce are valorile1 si 0, cand unulsi numai unul din cele doua elemente este zero, respectiv ambele elemente suntzero sau ambele sunt diferite de zero;

Daca unul din operanzi este un scalar, acesta este extins lamatricea constanta dataprin scalarul respectiv, avand dimensiunile celeilalte matrice, dupa care se efectueazaoperatia logica.

� ˜A saunot(A) (negatia) – produce o matrice de aceleasi dimensiuni cu celeale matriceiA avand valorile1 si 0, cand elementul corespunzator al matriceiA este zero, respectiv cand este diferit de zero.

� any(A) – dacaAeste vector, returneza valoarea1, daca exista componente alevectorului diferite de zero si0 ın caz contrar, iar dacaAeste o matrice, opereaza

Page 25: Stat_Matlab.PDF

1.6. Fisiere script (m–file) 15

asupra fiecarei coloane a matricei si returneaza corespunzator un vector de1 si0 cu lungimea egala cu cea a numarului coloanelor matrceiA;

� all(A) – dacaA este vector, returneza valoarea1, daca toate componentelevectorului sunt diferite de zero si0 ın caz contrar, iar dacaA este o matrice, o-pereaza asupra fiecarei coloane a matricei si returneaz˘a corespunzator un vectorde1 si 0 cu lungimea egala cu cea a numarului coloanelor matrceiA.

1.6 Fisiere script (m–file)

Pentru a executa o secventa de instructiuni Matlab (program), fara interventia utili-zatorului, se editeaza un fisier ASCII cu extensia.m , numit (fisier script) saum–file,care sa contina instructiunile programului. Lansareaexecutiei programului se faceprin tastarea numelui (fara extensia.m), dupa care se tasteazaEnter . Astfel, dacautilizatorul si–a creat un fisier script cu numeleexemplu.m , atunci linia de comandaprin care se lanseaza executia este

>>exemplu

Fsierulexemplu.m ar putea avea urmatorul continut

m = input(’m (nr. natural > 0):’);A = magic(m);d = ndims(A)[l c] = size(A)B = A*ones(m,1);C = B’

In urma lansarii executiei acestui program, fara a putea interveni pana la ıncheiereaexecutiei, se produc urmatoarele operatii:

� executa instructiunea din prima linie, prin afisarea pe ecran a mesajului

m (nr. natural > 0):

si se asteapa tastarea unui numar ıntreg pozitiv, dup˘a care prin comandaEnterse trece la instructiunea din linia urmatoare;

� instructiunea din linia a doua va genera matricea magica patraticaA de ordinm, care nu va fi afisata pe ecran deoarece instructiunea se termina cu simbolulpunct–virgula;

� se executa functiandim , iar rezultatul este atribuit variabileid, care va aveavaloarea2 si va fi afisat pe ecran, deoarece instructiunea nu se termina cupunct–virgula, pe doua randuri

d =2

Page 26: Stat_Matlab.PDF

16 Introducere ın Matlab

� urmatoarea instructiune atribuie variabilelorl si c numarul liniilor si coloane-lor matriceiA, care ın cazul de fata coincid cu valoarea luim, iar valorile lui lsi c vor fi afisate pe ecran;

� B va fi un vector coloana cumcomponente si contine produsul dintre matriceaA si vectorul coloana demcomponente, toate avand valoarea1, iar daca avemın vedere caA este o matrice magica, toate componentele luiB vor fi egale;

� ultima instructiune ajuta la afisarea pe ecran a componentelor vectorului linieC, care este vectorul transpus al vectorului coloanaB.

Editarea unui fisier script se poate face cu orice editor de text, dar sistemul Matlabdispune de un editor propriu.

Editorul Matlab se poate lansa din fereastra de lucru Matlabprin comenzi spe-cifice sistemului Windows, alegand din meniulFile optiuneaNewsauOpen, dacase doreste crearea uni nou fisier, respectiv se doreste editare unui fisier deja existent.Acelasi rezultat se obtine prin comanda

edit file.m

ın carefile.m este optional. Daca lipseste acest argument atunci urmeaza crearea(editarea) unui fisier nou, iar daca acest argument este prezent, fisierul cu acest numeurmeaza sa fie reactualizat (editat).

Editorul sistemului Matlab poate fi lansat din orice alta parte prin activarea unuifisier cu extensia.m .

Editorul Matlab are capacitatea de a efectua unele verificari sintactice, de exem-plu corespondenta paranteza deschisa – paranteza ınchisa, dar este prevazut si cu unset de comenzi (debuger) pentru depanarea programului prin evaluarea si modificareaunor variabile si expresii, crearea si stergerea unor puncte de ıntrerupere etc.

Comenzile specifice sistemului de depanare Matlab sunt:

� dbstop – crearea unui punct de ıntrerupere (breakpoint);

� dbclear – stergerea unui punct de ıntrerupere;

� dbstatus – listeaza punctele de ıntrerupere;

� dbstack – listeaza stiva apelurilor;

� dbcont – reluarea executiei programului;

� dbstep – executia uneia sau mai multe instructiuni;

� dbtype – genereaza lista fisierelor cu extensia.m , ımpreuna cu numarul lini-ilor acestora;

Page 27: Stat_Matlab.PDF

1.7. Grafica bidimensionala 17

� dbup – schimba spatiul de lucru curent, cu cel al unui fisier cu extensia.m ,care a fost apelat;

� dbdown – efectueaza operatia inversa comenziidbup ;

� dbmex – execua depanarea unui fisier cu extensia.mex (creat cu unul dinlimbajele Fortran si C);

� dbquit – ıncheierea depanarii.

1.6.1 Comenzi pentru gestionarea fisierelor� type file – listeaza continutul fisieruluifile din directorul curent;

� delete file – sterge fisieruluifile din directorul curent;

� what – listeaza fisierele cu extensiile.m din directorul curent;

� which numef – listeaza calea directorului ın care se afla functianumef ;

Comanda>>what director

extrage lista fisierelor directorului specificat...�toolbox

�matlab

�director

Lista acestor directoare poat fi vizualizata prin comandahelp fara nici un parametru.

1.7 Grafica bidimensionala

Sistemul Matlab dispune de o larga gama de instructiuni sau proceduri (functii) pen-tru reprezentarea grafica a datelor, care permit o apelare simpla si eficienta.

1.7.1 Instructiuneaplot

Formele acceptate de sistemul Matlab pentru instructiunea plot , privind reprezen-tarea grafica ın plan sunt

plot(y)plot(x,y)plot(x1,y1,x2,y2,...)plot(y,s)plot(x,y,s)plot(y1,s1,y2,s2,...)plot(x1,y1,s1,x2,y2,s2,...)

In cazul primei forme, dacay este un vector de lungimem, se reprezinta graficlinia poligonala ce trece prin punctele de coordonate������, � � ��m.

Page 28: Stat_Matlab.PDF

18 Introducere ın Matlab

Programul 1.7.1. Sa consideram programul, care reprezinta grafic linia poligonalace uneste punctele de coordonate������, � � ��m, undey reprezinta elementele dia-gonalei unei matrice magice de ordinm:

m = input(’m:’);y = diag(magic(m));plot(y)

In urma executiei programului, pentrum=10, se obtine graficul din Figura 1.1.

1 2 3 4 5 6 7 8 9 100

10

20

30

40

50

60

70

80

90

100

Figura 1.1: Linie poligonala

Dacay este o matrice de tipul(m,n) , atunci se reprezinta graficn linii poligo-nale, corespunzand celorn coloane ale matriceiy , anume������ �m���, � � ��n.

Programul 1.7.2. Sa consideram programul, care reprezinta grafic liniilepoligonalece unesc respectiv punctele de coordonate������ �����, pentru fiecare� � ��n, undeyeste o matrice magica de ordinm, iar n este un numar ıntreg pozitiv cel multm:

m = input(’m:’);n = input(’n (n<=m):’);y = magic(m);plot(y(:,1:n))

In urma executiei programului, pentrum=10si n=2 , se obtine graficul din Figura 1.2.

Dacay este de tip complex, atunci prima forma este echivalenta cu a doua formaa instructiuniiplot , adica cu

plot(real(y),imag(y))

Page 29: Stat_Matlab.PDF

1.7. Grafica bidimensionala 19

1 2 3 4 5 6 7 8 9 100

10

20

30

40

50

60

70

80

90

100

Figura 1.2: Linii poligonale

Programul 1.7.3. Sa consideram programul, care reprezinta grafic functia cu valoricomplexe� � � ��� ��� ��� ��� ��� ��� �� � � � ��� � �

m = input(’m:’);h =1/m; x = 0:h:1;z = x.*cos(2*pi*x)+i*x.ˆ2.*sin(2*pi*x);plot(z)

In urma executiei programului, pentrum=100, se obtine graficul din Figura 1.3.

Remarcam faptul ca pentru toate celelalte forme, daca avem parametri complecsi,partea imaginara este ignorata.

Daca se utilizeaza a doua forma, iarx si y sunt vectori de aceasi lungimem, atuncise reprezinta grafic linia poligonala ce trece prin punctele de coordonate��� ����,� � ��m.

Programul 1.7.4. Fie programul care reprezinta grafic functia��� �����pe intervalul��� �:m = input(’m:’);h = 1/m; x = 0:h:1;plot(x,sin(2*pi*x))

Executia programului, pentrum=200, genereaza graficul din Figura 1.4.

In cazul ın carex si y sunt matrice avand acelasi tip(m,n) , se reprezinta graficn linii poligonale, corespunzand celorn coloane ale matricelor, adica���� ���� �m���,pentru fiecare� � ��n. Dacax este un vector de lungimem, iar y este un vector delungimemsau matrice de tipul(m,n) , se reprezinta grafic liniile poligonale ce trec

Page 30: Stat_Matlab.PDF

20 Introducere ın Matlab

−2 −1.5 −1 −0.5 0 0.5 1 1.5 2−4

−3

−2

−1

0

1

2

Figura 1.3:� � � ��� ��� ��� ��� ��� ��� ��

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1−1

−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

0.6

0.8

1

Figura 1.4:� � ��� �����

Page 31: Stat_Matlab.PDF

1.7. Grafica bidimensionala 21

prin punctele de coordonate��� ����m���, respectivn linii poligonale ce trec respectivprin punctele date prin��� ���� �m���, pentru fiecare� � ��n.

Forma a treia a instructiuniiplot implica reprezentarea grafica pe aceeasi figura,conform formei precedente, a grupelor de date(x1,y1) , (x2,y2) s.a.m.d.

Programul 1.7.5. Vom prezenta doua variante de programe, care reprezinta peaceeasi figura graficele functiilor��� ����� si ��� ����� pe intervalul��� �:

m = input(’m:’);h = 1/m; x = 0:h:1;y = 2*pi*x;plot(x,sin(y),x,cos(y))

respectivm = input(’m:’);h = 1/m; x = 0:h:1;y = 2*pi*x;y = [sin(y)’ cos(y)’]; x=[x’ x’];plot(x,y)

Executand una din cele doua variante, cum=200, se genereaza graficul din Figu-ra 1.5.

Remarcam faptul ca prima varianta ar fi potrivita daca cele doua functii se re-prezinta grafic pe acelasi domeniu, iar a doua varianta cˆand cele doua functii suntreprezentate grafic pe domenii diferite.

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1−1

−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

0.6

0.8

1

Figura 1.5:�� � ��� �����, �� � ��� �����

Pentru o reprezentare neteda este de dorit ca numarul punctelor ce genereazaliniile poligonale sa fie suficient de mare.

Page 32: Stat_Matlab.PDF

22 Introducere ın Matlab

Pe de alta parte, observam ca prin primele trei tipuri de instructiuneplot nuse specifica nici o caracteristica a liniilor reprezentate grafic. Sistemul Matlab face oalegere implicita a acestor caracteristici.

Ultimele patru forme ale instructiuniiplot permit utilizatorului specificareaunor caracteristici ale liniilor reprezentate grafic cu ajutorul parametruluis .

Parametrul de tipuls este un sir de cel mult trei caractere, prin care se precizeazaculoarea, tipul de marcaj al punctelor si tipul de linie.

Culoarea este specificata cu unul din simbolurile urmatoare:y – galben (yellow),m– violet (magenta),c – ciclamen (cyan), r – rosu (r ed), g – verde (green),b –albastru (blue),w– alb (white),k – negru (black ).

Tipul de marcaj este dat prin unul din simbolurile:� – punct (point),o – cerculet(circle), x – cruciulita diagonala (x–mark),+ – cruciulita (plus), – steluta (star),s– patratel (square),d – romb (diamond),v – triunghi cu varf ın jos (triangle down),ˆ – triunghi cu varf ın sus (triangle up),� – triunghi cu varf spre stanga (triangleleft), � – triunghi cu varf spre dreapta (triangle right),p – steluta ın cinci colturi(pentagram),h – steluta ın sase colturi (hexagram).

Urmatoarele patru tipuri de linie sunt disponibile: continua (solid) (- ), punctata(dotted) (: ), ıntrerupta (dashed) (-- ), linie-punct (dashdot) (-. ).

De exemplu, dacas=’c:’ , graficul este trasat cu linie punctata ciclamen, iardacas=’bd’ punctele sunt marcate prin semnul romb de culoare albastra, dar nusunt unite ıntre ele.

Programul 1.7.6. Vom reprezenta grafic functiile��� ����� si ��� ����� pe interva-lul ��� �, prima functie prin linie continua, iar a doua prin linie ˆıntrerupa, iar punctelede pe cele doua curbe, care au abscisele multipli de

��, sa fie marcate prin cerculete,

respectiv prin stelute.m = input(’m:’);h = 1/m; x = 0:h:1; y = 2*pi*x;y = [sin(y)’ cos(y)’];h = 1/m; p = 0:1/6:1; pp = 2*pi*p;plot(x,y,p,sin(pp),’o’,p,cos(pp),’*’)

Pentrum=200, graficul este cel din Figura 1.6.

1.7.2 Comenzi si instructiuni de gestionare a graficelor

Sistemul Matlab dispune de comenzi si instructiuni prin care sunt gestionate si spe-cificate anumite caracteristici ale graficelor produse privind titlul, etichetarea axelor,inserarea unor texte, marcarea unor retele, delimitarea graficului etc:

� hold on – pastreaza graficul curent, un nou grafic va fi supraimprimat;

� hold off – graficul curent este abandonat, fara a fi sters;

Page 33: Stat_Matlab.PDF

1.7. Grafica bidimensionala 23

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1−1

−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

0.6

0.8

1

Figura 1.6:�� � ��� ����� si

�� � ��� �����

� hold – trece la moduloff , daca sistemul se afla ın modulon , respectiv lamodulon , cand sistemul se afla ın moduloff ;

� clf – sterge graficul curent;

� cla – sterge graficul curent, pastrand axele;

� figure(n) – activeaza fereastra cu graficuln anterior obtinut;

� axis([xmin xmax ymin ymax]) – fixeaza limitele pentru axele absci-selor si ordonatelor pentru figura curenta;

� v = axis – ıntoarce un vector linie ce contine cele patru limite pentru axelede coordonate, care pot fi si -Inf , Inf ;

� axis auto – considera forma implicita a limitelor axelor de coordonate;

� axis manual – pastreaza limitele curente, astfel daca este utilizata instruc-tiuneahold , figurile urmatoare vor avea aceleasi limite pentru axelede coor-donate;

� axis tight – atribuie pentru limitele axelor cele mai apropiate valoricerezulta din datele ce se reprezinta grafic;

� axis ij – configureaza axele ın modulmatrix , adica originea axelor decoordonate este coltul din stanga sus, axai fiind verticala si marcata de sus ınjos, iar axaj este orizontala si este marcata de la stanga la dreapta;

Page 34: Stat_Matlab.PDF

24 Introducere ın Matlab

� axis xy – configureaza axele ın modulcartezian , mod implicit;

� axis equal – unitatile de masura pe cele doua axe au aceeasi marime;

� axis image – la fel cuaxis equal , cu exceptia ca figura este restransala domeniul datelor;

� axis square – pune unitatile de masura pe cele doua axe de coordoanteastfel ıncat figura sa fie prezentata ıntr–un patrat;

� axis normal – rearanjeaza axele ın forma implicita;

� axis off – elimina axele de coordoante;

� axis on – insereaza axele de coordoante;

� title(’text’) – afiseaza textul specificat ın partea de sus a graficului;

� legend(’str1’,’str2’,...) – afiseaza legenda prin care se efectuea-za corespondenta dintre fiecare tip de curba a graficului s¸i textele specificateprin str1 , str2 etc.;

� legend(’str1’,’str2’,...,p) – afiseaza legenda de tipul precizatın pozitiile respectiv ınafara axelor (p=-1 ), ın interiorul axelor, dar pe cat eposibil sa nu acopere figurile trasate (p=0 ), ın partea dreapta sus (p=1 ), careeste pozitia implicita, ın partea stanga sus (p=2 ), ın partea stanga jos (p=3 ), ınpartea dreapta jos (p=4 );

� legend off – elimina legenda;

� xlabel(’text’) – eticheteaza axa abscielor cu textul precizat;

� ylabel(’text’) – eticheteaza axa ordonatelor cu textul precizat;

� text(x,y,’text’) – insereaza textul precizat printext , ın punctul decoordonate(x,y) , iar dacax si y sunt vectori (de aceeasi lungime), atunciinsereaza textul respectiv ın toate punctele de coordoante ��� ����, � � ���� � � �,pe cand daca textul este dat printr-o matrice cu acelasi numar de linii cu cel allungimilor vectorilorx si y , atunci textul din liniai este inserat ın punctul decoordonate��� ����, � � ���� � � �

� gtext(’text’) – afiseaza graficul, ımpreuna cu cursorul plus, unde urmea-za sa fie inserat textul, cursorul putand fi pozitionat cuajutorulmouse-ului sautastele cu sageti, dupa care prin apasarea oricarei taste (mousesaukeyboard),se obtine inserarea textului;

Page 35: Stat_Matlab.PDF

1.7. Grafica bidimensionala 25

� grid – adauga pe grafic o retea rectangulara;

� grid off – grafic fara retea rectangulara;

� zoom – permite marirea unei parti a figurii pentru urmarirea anumitor detalii.

Se fixeaza cursorulmouse-ului pe pozitia ın care suntem interesati a fi marita. Prindublu–click pe butonul din stanga se produce o marire a zonei de doua ori, iar prindublu–click pe butonul din dreapta se produce o micsorare a zonei de dou˘a ori. Dacase pastreaza apasat butonul din dreapta si se deplaseaza cursorul, se obtine un drep-tunghi, care prin eliberarea butonuluimouse–ului, va umple ıntreaga figura.

Prin instructiunilezoom offzoom out

se dezactiveaza instructiuneazoom, respectiv se revine la dimensiunile initiale alefigurii.

Comenzile de tipaxis se impun a fi inserate dupa instructiuneaplot .Mentionam ca textele introduse pe grafic admit sintaxa sistemului LATEX simpli-

ficat.

Programul 1.7.7. Vom considera un exemplu de reprezentare grafica prinmascareaunor parti a graficului. Sa reprezentam grafic cu linie continua pe intervalul[0,6]functia care coincide cu��� ����, cand valorile acestei functii sunt pozitive, iar ın restsa fie zero. Pe aceasi figura, sa reprezentam prin linie ˆıntrerupa si��� ����.

m = input(’m:’);h = 1/m; x = 0:h:6;y = sin(pi*x); Y=ge(y,0).*y;plot(x,y,’k--’,x,Y,’k-’)

Pentrum=200, graficul este cel din Figura 1.7.

1.7.3 Instructiunile polar si ezpolar

Instructiuneapolar este analoga cu instructiuneaplot , numai ca este consideratareprezentarea curbei ın coordoante polare, iar instructiuneaezpolar are sintaxa

ezpolar(’f’,[a,b])

si are ca efect reprezentarea grafica a functiei ın coordonate polare, data prin expre-sia algebricaf , pe intervalul[a,b] . Al doilea parametru este optional. Valoareaimplicita este[0,2 �] .

De exemplu, comandaezpolar(’1+cos(theta)’)

va produce graficul din Figura 1.8. Mai remarcam faptul ca parametrulf poate finumele unei functii Matlab predefinite sau a utilizatorului.

Page 36: Stat_Matlab.PDF

26 Introducere ın Matlab

0 1 2 3 4 5 6−1

−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

0.6

0.8

1

Figura 1.7:� � ��� ����

0.5

1

1.5

2

30

210

60

240

90

270

120

300

150

330

180 0

r = 1+cos(θ)

Figura 1.8:� � �� ��� ��� � � � �����

Page 37: Stat_Matlab.PDF

1.7. Grafica bidimensionala 27

Programul 1.7.8. Urmatorul programclf; t=0:0.01:pi;r=sin(3*t).*exp(-0.3*t);polar(t,r,’k-’), grid

are ca efect graficul din Figura 1.9.

0.2

0.4

0.6

0.8

1

30

210

60

240

90

270

120

300

150

330

180 0

Figura 1.9:� � ��� ����e�����Instructiunea colormap

Sistemul Matlab dispune de un set de gestiune a culorilor ınreprezentarile grafice.Intructiuneacolormap permite definirea unui set propriu pentru gestiunea culorilor.Lansarea unei instructiunii se face prin comanda

colormap(map)colormap(’default’)

A doua comanda seteaza setul de culori la forma standard (implicita).Parametrulmap este o matrice cu trei coloane, fiecare linie continand elemente

numere din intervalul[0,1] , prin care se defineste cate o culoare. Modul de defi-nire a culorii, dupa aceasta regula, se numesteRGB(Red-Green-Blue), si specifica ıncadrul culorii, respectiv intensitatile culorilor rosu, verde si albastru.

Sistemul Matlab dispune de asemenea de unele seturi de culori, care pot fi selec-tate si specificate de utilizator. O parte din acestea sunt obtinute prin:

Page 38: Stat_Matlab.PDF

28 Introducere ın Matlab

colormap spring

genereaza nuante de culori ıntre violet (magenta) si galben;

colormap summer

genereaza nuante de culori ıntre verde si galben;

colormap autumn

genereaza nuante de culori ıntre rosu, trecand prin portocaliu spre galben;

colormap winter

genereaza nuante de culori ıntre albastru si verde;

colormap gray

genereaza nuante de culori gri.

1.7.4 Instructiuneastairs

Sistemul Matlab dispune de procedurastairs pentru reprezentarea grafica afunctiilor ın scara si care accepta formele instructiunii plot .

Instructiunea de forma

stairs(y)

reprezinta grafic functia ın scara cu valorile precizate prin vectoruly de lungimem,iar abscisele sunt considerate numerele de la1 la m. Dacay este o matrice de tipul(m,n) vor fi reprezentate graficn functii ın scara, cate una pentru fiecare coloana amatriceiy .

Daca se considera instructiunea de forma

stairs(x,y)

se va reprezenta grafic functia ın scara cu valorile precizate prin vectoruly si cuabscisele corespunzatoare date prin vectorulx (componentele luix trebuie sa fiecrescatoare).

Dacay si x sunt matrice de acelasi tip(m,n) , atunci se vor reprezenta graficnfunctii ın scara, cate una pentru fiecare din coloanele celor doua matrice (elementelecoloanelor matriceix trebuie sa fie crescatoare). Daca matriceax este un vector co-loana cumcomponente crescatoare, atunci functiile ın scara corespunzatoare celorncoloane ale matriceiy se considera ca au aceleasi abscise precizate prin vectorul x .

Instructiunea de tipul

stairs(x,y,s)

permite prezentarea tipului liniei cu care se traseaza graficul cu ajutorul parametruluis si care are sintaxa cea precizata la instructiuneaplot .

Prin urmare, putem spune ca toate variantele folosite ın cadrul instructiuniiplotau corespondente pentru instructiuneastairs .

Page 39: Stat_Matlab.PDF

1.7. Grafica bidimensionala 29

Programul 1.7.9. Fie functia lui Haar, numita ın analiza waveletfunctie waveletmama

� ��� �

�������������

�� daca� � � � �

��

��� daca

��� � � ��

��ın rest�

Folosind functia�

se defineste familia defunctii wavelet

�� �� ��� � ��� �� � ��

unde� si�

se numescindice de dilatare, respectivindice de translatare. Daca se areın vedere formula de definitie pentru functia

�, putem scrie

�� �� ��� �

�������������

�� � daca���� � � � �

��� � �

�� � ���� � daca

���� � �

�� � � � � ���� � �

�� ���

ın rest�

Vom scrie un program care sa reprezinte grafic functia� definita segementar cu aju-torul functiilor

�� ��, � � ���

, unde�, � si�

sunt fixati (� � �).

Functia� este o functie ın scara, avand punctele de discontinuitate�

���� , pen-tru

� � ����� � �

, cu valorile corespunzatoare acestor puncte,����, pentru

�par,

respectiv�����, pentru

�impar.

Cu aceste precizari, avem urmatorul program Matlab pentru reprezentarea graficaa functiei�:

j = input(’j=’);r = input(’r=’);s = input(’s (>r)=’);rs = 2*s-2*r+3;fprintf(’rs=2s-2r+3=%2d\n’,rs);y = input(’rs valori alternative [1, -1 ... 1]:’);y = 2ˆ(j/2)*y;x = 1/2ˆj*[r:1/2:s+1];stairs(x,y)

Executia programului, pentruj=1, s=1, r=-2 , produce graficul din Figura 1.10.

Singurul inconvenient la executia acestui program este legat de instructiuneainput prin care se initializeaza vectoruly . Cand numarul functiilor

�� �� prin carese defineste functia� este mare, atuncirs este mare si introducerea listei luiy esteanevoioasa.

Page 40: Stat_Matlab.PDF

30 Introducere ın Matlab

−1 −0.8 −0.6 −0.4 −0.2 0 0.2 0.4 0.6 0.8 1−1.5

−1

−0.5

0

0.5

1

1.5

Figura 1.10:� � ������ ����������� �����������O varianta a programului precedent, pentru care nu este necesara initializarea lui

y de la tastatura, ar putea fi urmatorul program:

j = input(’j=’);r = input(’r=’);s = input(’s (>r)=’);rs = 2*s-2*r+3;y = (-ones(1,rs)).ˆ[2*r:2*s+2];y = 2ˆ(j/2)*y;x = 1/2ˆj*[r:1/2:s+1];stairs(x,y)

Programul 1.7.10. Sa reluam reprezentarea grafica a functiilor wavelet Haar si sascriem un program care sa reprezinte pe aceeasi figura doua secvente de functii wa-velet, pentru doua valori consecutive ale indicelui de dilatarej , iar secventele alese saacopere intervalul�

��� �. Pentru aceasta trebuie car=

���, iar s=

�� � �. Totodatasa trasam graficul primei secvente cu linie continua sipunctele sa le marcam princerculete, iar pentru a doua secventa sa alegem linie punctata pentru reprezentareagrafica, iar punctele sa fie marcate cu stelute ın cinci colturi:

clf, hold on, axis offplot([-1.2 1.2],[0 0],’k:’)j = input(’j=’);r = -2\ˆ{}j; s=-r-1;rs = 2*s-2*r+3;y = (-ones(1,rs)).ˆ[2*r:2*s+2];y = 2ˆ(j/2)*y;x = 1/2ˆj*[r:1/2:s+1];stairs(x,y,’ko-’)

Page 41: Stat_Matlab.PDF

1.7. Grafica bidimensionala 31

j = j+1; r = -2ˆj; s=-r-1;rs = 2*s-2*r+3;y = (-ones(1,rs)).ˆ[2*r:2*s+2];y = 2ˆ(j/2)*y;x = 1/2ˆj*[r:1/2:s+1];stairs(x,y,’kp--’)

Executia programului, pentruj=0 , produce graficele din Figura 1.11. Se observa

Figura 1.11:������������, ������ ����������� ������ca programul mai elimina axele sistemului Matlab, dar adauga axa absciselor trasatapunctat.

1.7.5 Instructiunile bar si barh

Aceste doua instructiuni, dupa cum spun si denumirile,reprezinta anumite date nu-merice cu ajutorul barelor (batoanelor) verticale si respectiv orizontale.

Forme ale acestor instructiuni sunt:bar(y,w,’tip’,’color’)bar(x,y,w,’tip’,’color’)barh(y,w,’tip’,’color’)barh(x,y,w,’tip’,’color’)

argumentelew, ’tip’ si ’color’ sunt optionale, dar cand sunt specificate, trebuiesa pastreze aceasta ordine.

Parametrulx este un vector de lungimem.Dacay este un vector de aceeasi lungime ca six , atunci vor fi reprezentate grafic

ın fiecare din punctele de abscisex �,� � ��m, cate o bara de ınaltimile date priny �,

Page 42: Stat_Matlab.PDF

32 Introducere ın Matlab

� � ��m, care pot sa fie si negative. Daca parametrulx lipseste, atunci se consideraimplicit cax are componentele ca fiind primelemnumere naturale.

Dacay este o matrice de tipul(m,n) , reprezentarile sunt efectuate pentru fie-care din celen coloane ale matricei, adica ın fiecare punctx �,

� � ���, de pe axaabsciselor vor fi reprezentate caten bare (batoane).

Parametrulw specifica latimea barelor, implicit fiindw � ��

�, iar pentruw � �

barele se suprapun.Daca parametrultip=grouped , care este valoarea implicita, atunci avem re-

prezentarile precizate mai sus, iar dacatip=stacked barele (batoanele) vor fi sti-vuite pe verticala.

Parametrulcolor specifica culoarea barelor (batoanelor) si are una din urma-toarele valori:r (rosu),g (verde),b (albastru),y (galben),m(violet), c (ciclamen),k (negru),w (alb).

Tot ce s–a spus desprebar se poate spune si pentrubarh , numai ca orientareabarelor este pe orizontala.

1.7.6 Instructiuneasubplot

Sistemul Matlab are posibilitatea de a ımparti o fereastra, pentru reprezentare grafica,ın m�n zone (ferestre), cu ajutorul instructiuniisubplot .

Forma generala a instructiunii estesubplot(m,n,p)

unde m, n si p sunt numere naturale, care exprima faptul ca fereastra initiala seımparte ınm�n ferestre aranjate pem linii si n coloane, iar reprezentarea grafica,la momentul executiei instructiunii, se va face ın fereastrap, numerotarea ferestrelorfacandu–se pe linii.

Programul 1.7.11.Reprezentarea grafica poate fi facuta si cu ajutorul reprezentarilorparametrice ale curbelor.

Pentru reprezentarea grafica a unui cerc cu centrul ın originea axelor de coor-doante am putea folosi secventa de instructiuni:

r = input(’raza=’);t = 0:0.01:2*pi;x = r*sin(t); y=r*cos(t);subplot(2,1,1), plot(x,y)axis normalsubplot(2,1,2), plot(x,y)axis square

Pentrur=2 , graficul din partea stanga a Figurii 1.12, se obtine cand nu s–a impus caunitatile de masura pe cele doua axe de coordoanate safie aceleasi, iar graficul dinpartea dreapta s–a obtinut dupa ce s–a ınlaturat acestneajuns cu instructiuneaaxissquare .

Page 43: Stat_Matlab.PDF

1.7. Grafica bidimensionala 33

−2 −1 0 1 2−2

−1.5

−1

−0.5

0

0.5

1

1.5

2

−2 −1 0 1 2−2

−1.5

−1

−0.5

0

0.5

1

1.5

2

Figura 1.12:� � � ��� �,� � �

��� �, � � �

,� � �����

Programul 1.7.12. Pentru exemplificarea instructiunilorbar , barh si subplot ,facem din nou apel la o matrice magica de ordinmsi sa reprezentam ın patru ferestrede tipul 2�2, prin bare verticale grupate si prin bare verticale stivuite, valorile pri-melor doua coloane ale matricei, respectiv prin bare orizontale grupate si prin bareorizontale stivuite valorile ultimelor doua coloane:

m=input(’m:’); A=magic(m);subplot(221), bar(A(:,[1 2]),’grouped’)title(’Primele doua coloane - grupate’)subplot(222), bar(A(:,[1 2]),’stacked’)title(’Primele doua coloane - stivuite’)subplot(223), barh(A(:,[m-1 m]),’grouped’)title(’Ultimele doua coloane - grupate’)subplot(224), barh(A(:,[m-1 m]),’stacked’)title(’Ultimele doua coloane - stivuite’)colormap summer

Reprezentarea grafica, pentrum=4, este data ın Figura 1.13.

1.7.7 Instructiuneafplot

Pentru reprezentarea grafica a unei functii definite cu ajutorul unei proceduri Matlab,se pot folosi una din urmatoarele variante ale instructiunii fplot:

fplot(’numef’,lim)fplot(’numef’,lim,s)fplot(’numef’,lim,tol)

Page 44: Stat_Matlab.PDF

34 Introducere ın Matlab

1 2 3 40

5

10

15

20Primele doua coloane − grupate

1 2 3 40

5

10

15

20Primele doua coloane − stivuite

0 5 10 15

1

2

3

4

Ultimele doua coloane − grupate

0 5 10 15 20

1

2

3

4

Ultimele doua coloane − stivuite

Figura 1.13: Bare verticale si bare orizontale

fplot(’numef’,lim,tol,s)fplot(’numef’,lim,n)[X,Y] = fplot(’numef’,lim,...)

In toate cazurile se reprezinta grafic functianumef , cu limitele pentru axa abscise-lor specificate prinlim=[xmin xmax] saulim=[xmin xmax ymin ymax] .Tipul liniei folosit ın reprezentarea grafica este specificat prin parametruls , ca siın cazul instructiuniiplot , iar eroarea relativa folosita ın reprezentarea grafic˘a esteprecizata prin parametrultol , care are valoarea implicitatol=2e-3 . Parametrulnspecifica faptul ca graficul se traseaza cu ajutorul an+1 puncte, valoarea implicita alui n esten=1 , iar valoarea maxima a pasului nu depasestexmax�xmin

n Remarcam faptul ca parametrii optionalis , tol si n pot fi luati ın orice ordine.Functianumef poate sa ıntoarca, pentru un vectorx , un vectory de aceeasi

lungime ca six sau o matrice cu mai multe coloane si numar de linii ca si lungimealui x . In primul caz, se va reprezenta grafic o singura curba, iar ˆın al doilea caz, pentrufiecare coloana a matriceiy cate o curba. Parametrulnumef poate fi ınlocuit si cu unsir de caractere de tipul’[f(x),g(x),...]’ , undef , g,... sunt nume de functiiMatlab, caz ın care, pe aceeasi figura, se vor reprezenta grafic functiile respective.

De exemplu, instructiuneafplot(’[sin(2*pi*x), cos(2*pi*x)]’,[0 1])

va reprezenta grafic, pe aceeasi figura, functiile��� ����� si ��� �����, pe intervalul��� �.

Page 45: Stat_Matlab.PDF

1.7. Grafica bidimensionala 35

Ultima forma a instructiuniifplot nu produce nici un grafic, ci pastreazapunctele graficului ınX si Y, care pot fi apoi folosite efectiv, prin instructiuneaplot(X,Y) , la reprezentarea grafica.

1.7.8 Instructiuneaezplot

Sintaxa instructiuniiezplot poate fi:ezplot(’f’)ezplot(’f’,[a,b])ezplot(’f’,[a,b,c,d])ezplot(’x’,’y’)ezplot(’x’,’y’,[a,b])

Parametrulf reprezinta o expresie algebrica de una sau doua variabile.Dacaf este o expresie algebrica de o singura variabila, atuncieste reprezentata

grafic functia definita de aceasta expresie, pe intervalul [a,b] . Valoarea implicita aacestui parametru este[-2 �,2 �] .

Dacaf este o expresie algebrica de doua variabile, atunci este reprezentata graficfunctia implicita definita prinf=0 , pe domeniul[-2 �,2 �] �[-2 �,2 �] , daca sefoloseste prima forma de apel, pe domeniul[a,b] �[a,b] , pentru a doua forma,respectiv pe[a,b] �[c,d] , pentru a treia forma. Cele doua variabile sunt conside-rate ca fiind ordonate lexicografic.

Ultimele doua forme sunt folosite pentru reprezentarileparametrice,x repre-zentand abscisa, iary ordonata. Argumentul acestor parametri variaza ın intervalul[a,b] , iar daca acesta lipseste, atunci se considera intervalul implicit [0,2 �] .

De exemplu, instructiuneaezplot(’sin(3*t)*cos(t)’,’sin(3*t)*sin(t)’,[0,pi])

produce graficul din Figura 1.14. Mai remarcam faptul ca parametrii f , x si y , pot finumele unor functii Matlab predefinite sau ale utilizatorului.

1.7.9 Instructiuneafill

Instructiuneafill este folosita pentru umbrirea interiorului unui poligon specificatprin varfurile sale:

fill(x,y,c)

undex si y specifica varfurile poligonului, iarc reprezinta culoarea dorita pentruinteriorul poligonului.

Instructiunea poate fi utilizata pentru umbrirea unei parti dintr–o figura.

Programul 1.7.13. Sa scriem un program care sa umbreasca aria cuprinsa ıntre axaabsciselor, curba lui Gauss si dreptele perpendiculare peaxa absciselor ın puncteleasi b (-3 �

a�

b�

3).

Page 46: Stat_Matlab.PDF

36 Introducere ın Matlab

−0.8 −0.6 −0.4 −0.2 0 0.2 0.4 0.6 0.8

−0.8

−0.6

−0.4

−0.2

0

0.2

0.4

x

y

x = sin(3 t) cos(t), y = sin(3 t) sin(t)

Figura 1.14:� � ��� ���� ��� ���, � � ��� ���� ��� ���, � � ����Curba lui Gauss este data prin functia

� ��� � ����e�� � � � ��

a = input{’a=’}; b = input(’b=’);xmin = -3; xmax = 3;fplot{’1/sqrt(2*pi)*exp(-xˆ2/2)’,[xmin xmax]}x = a; y = 0;t = a:0.01:b;x = [x,t]; y = [y,1/sqrt(2*pi)*exp(-t.ˆ2/2)];x = [x,b]; y = [y,0];fill(x,y,’c’)

Pentrua=-2 si b=1.5 , se obtine graficul din Figura 1.15.

1.8 Instructiuni de ciclare si control

Ca si ın celelalte limbaje de programare evoluate, sistemul Matlab dispune deinstructiuni, care permit repetarea unei secvente de instructiuni de un numar defi-nit sau indefinit de ori, precum si de instructiuni, care permit iesirea din executareasecventiala a instructiunilor unui program.

Page 47: Stat_Matlab.PDF

1.8. Instructiuni de ciclare si control 37

−3 −2 −1 0 1 2 30

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

Figura 1.15: Curba lui Gauss

1.8.1 Instructiuneaif

Trei forme de baza ale instructiuniiif sunt:

if expsecv

end%%%%%%%%%%%%%%

if expsecv

elsesecv1

end%%%%%%%%%%%%%%

if expsecv

elseif exp1secv1

elsesecv2

end

undeexp si exp1 sunt expresii logice ce pot fi evaluate ın acest punct, iarsecv ,secv1 si secv2 sunt secvente de instructiuni Matlab.

Instructiuneaif sub prima forma face sa se execute secventa de instructiunisecv numai daca valoarea expresiei logiceexp este adevarata, dupa care se trece laprima instructiune ce urmeaza linieiend .

Page 48: Stat_Matlab.PDF

38 Introducere ın Matlab

A doua forma de instructiuneif are ca efect executarea uneia dintre secventelede instructiunisecv si secv1 , ın functie de faptul ca expresia logicaexp esteadevarata, respectiv falsa, dupa care se trece la instructiunea ce urmeaza dupa liniaend .

Ultima forma are ca rezultat executarea uneia dintre secventele de instructiunisecv , secv1 si secv2 , dupa cum valoarea luiexp este adevarata, a luiexp estefalsa si a luiexp1 este adevarata, respectiv valorile expresiilor logiceexp si exp1sunt false siexp2 are valoare adevarata.

De exemplu secventa de instructiuni ce urmeaza stabiles¸te daca elementele unuivectorv cu mcomponente ıntregi sunt toate numere pare, toate impare sau sunt sipare si impare:

if rem(v,2)==0p=0;

elseif rem(v,2)==1p=1;

elsep=2;

endp

Rezultatul executiei acestei secvente atribuie luip una din valorile0, 1, 2, ın functiede faptul ca vectorulv are toate componentele numere pare, toate impare, respectivsi pare si impare.

1.8.2 Instructiuneaswitch

Aceasta instructiune are ca rezultat trecerea executiei, ın functie de valoarea uneiexpresii, ın diferite puncte ce urmeaza.

Forma generala a instructiuniiswitch este:

switch expcase val1

secv1case val2

secv2. . . . .otherwise

secvend

undeexp este o expresie aritmetica sau de tip caracter, iarsecv1 , secv2 , . . . ,secv sunt secvente de instructiuni Matlab. Daca valoarea expresieiexp coincide cucu una din valorileval1 , val2 , . . . atunci se executa secventa de instructiuni cores-punzatoaresecv1 , secv2 , . . . , iar ın caz contrar se executa secventa de instructiunisecv .

De exemplu, secventa de instructiuni

Page 49: Stat_Matlab.PDF

1.8. Instructiuni de ciclare si control 39

m=input(’m=’);switch exprcase ’ones’

A=ones(m)case ’eye’

A=eye(m)case ’magic’

A=magic(m)otherwise

A=zeros(m)end

genereaza matricea patraticaA de ordinm, care poate fi de la caz la caz, respectivmatrice cu toate elementele1, matrice unitate, matrice magica, matrice cu toate ele-mentele zero.

1.8.3 Instructiuneawhile

Instructiuneawhile este o instructiune de ciclare prin care se repeta executia uneisecvente de instructiuni Matlab pana cand o conditieeste satisfacuta. Forma generalaa instructiuni este:

while expsecv

end

si are ca efect executarea secventei de instructiunisecv atata timp cat valoarea ex-presiei logiceexp este adevarata.

De exemplu, daca vrem sa calculam valoarea aproximativ˘a a solutiei ecuatiei� � ��� ���, folosind metoda iterativa, impunand conditia de oprire prin aceea canumarul iteratiilor sa nu depaseasca o valoare datan si distanta dintre doua iterateconsecutive sa nu fie mai mare decat unepsilon �0 dat, atunci avem programul

n=input(’n=’);epsilon=input(’epsilon=’);xv=pi/4; k=1; d=1;while d>epsilon & k<n

k=k+1; xn=cos(xv);d=abs(xn-xv); xv=xn;

endfprintf(’k=%2d\n’,k)fprintf(’d=%10.4f\n’,d)fprintf(’x=%10.4f\n’,xn)

Astfel, pentru valorile la intraren=50 si epsilon=1e-5 , sunt afisate rezultatele:

k=25d= 0.0000x= 0.7391

Page 50: Stat_Matlab.PDF

40 Introducere ın Matlab

1.8.4 Instructiuneafor

Fata de instructiuneawhile , instructiunea de ciclarefor are fixat numarul repeta-rilor unei secvente de instructiuni.

Forma generala a instructiunii este:

for v=vi:pas:vfsecv

end

undev este variabila de ciclare, care ia toate valorile, ıncepand cu valoarea expresieiaritmeticevi pana la valoarea expresieivf , folosind pasul dat prin expresia aritme-ticapas . Pentru fiecare din aceste valori ale luiv se executa succesiv secventasecvde instructiuni Matlab.

Dacapas=1 , atunci putem folosi urmatoarea forma a instructiifor :

for v=vi:vfsecv

end

Mai remarcam faptul ca ın interiorul unui ciclufor poate exista un alt ciclufors.a.m.d.

De exemplu, secventa urmatoare va genera matriceah de tipul (m,n) , numitamatricea lui Hilbert:

m=input(’m=’);n=input(’n=’);h=[];for i=1:m

for j=1:nh(i,j)=1/(i+j-1);

endendformat ratdisp(h)

In urma executarii acestui program, cu valorilem=3si n=6 , se obtin rezulatele

m=3n=4

1 1/2 1/3 1/41/2 1/3 1/4 1/51/3 1/4 1/5 1/6

Mai consideram un exemplu de folosire a instructiuniifor . Vrem sa construimmatricea VandermondeV, corespunzatoare numerelor��,

� � ���, care sunt date

Page 51: Stat_Matlab.PDF

1.9. Instructiuni de ıntrerupere 41

prin vectorula. Reamintim ca forma generala a aceastei matrice este

V �

������

� � � � � ��� �� � � �

����� ��� � � �

���� � � � � � � � � � � � � � � � � � � � � � � �

����� �

���� � � ������

������

MatriceaV poate fi generata prin secventa de program urmatoare:

m=input(’m=’);for i=1:m

a(i)=input(’a(i)=’);endV=[];for i=0:m-1

V=[V;a.ˆi];enddisp(V)

Se observa ca matriceaV a fost intializata cumatricea vida, care este specificata prin[] , iar constructia efectiva s–a facut prin operatia deconcatenare .

Executand programul pentrum=4si a ��� � �,� � ���, se obtine

m=4a(i)=1a(i)=2a(i)=3a(i)=4

1 1 1 11 2 3 41 4 9 161 8 27 64

1.9 Instructiuni de ıntrerupere

1.9.1 Instructiuneatry. . .catch

Forma generala a instructiunii este:

trysecv

catchsecv1

end

si are ca efect executia primei secvente de instructiuni, secv , pana la aparitia uneierori, dupa care se executa a doua secventa de instructiuni, secv1 . Daca nici o

Page 52: Stat_Matlab.PDF

42 Introducere ın Matlab

eroare nu apare ın executia secventeisecv , dupa executarea acesteia, se trece laprima instructiune dupa liniaend . Daca la executia secventei de instructiunisecv1apare o eroare, executia programului este oprita, daca oalta instructiune de tipultry...catch nu exista.

1.9.2 Instructiuneapause

Instructiuneapause are ca efect ıntreruperi temporare ale executiei programelor.Instructiuneapause are urmatoarele forme:

pause(n)pausepause offpause on

Prima forma are ca efect ıntreruperea executarii programului timp den secunde (neste numar pozitiv), cand se ajunge cu executarea ın acest punct.

A doua forma,pause fara argument, ıntrerupe executarea programului, reluareaexecutarii facandu–se prin apasarea oricarei taste.

Instructiuneapause cu argumentuloff are ca efect inhibarea tuturor instruc-tiunilor pause si pause(n) ce urmeaza, iar daca are argumentulon , atunci seproduce reactivarea acestora.

1.9.3 Instructiuneareturn

Instructiunea

return

are ca efect ıntoarcerea ın programul de pe nivelul imediat superior (programul careapeleaza unitatea ın care se afla instructiunea). Nivelul cel mai ınalt este cel carecorespunde modului interactiv de lucru, prin urmare instructiuneareturn , la acestnivel nu are niciun efect.

1.9.4 Instructiuneabreak

Instructiunea

break

are efecte diferite ın functie de locul unde este pozitionata.Daca instructiuneabreak se afla ıntr–un cicluwhile , se produce iesirea fortata

din ciclul respectiv, iar daca se afla ıntr–un ciclufor se produce la fel o iesire fortatadin ciclu, cu observatia ca daca exista un ciclufor superior, se continua cu executa-rea acestuia.

Page 53: Stat_Matlab.PDF

1.10. Functii (proceduri) ın Matlab 43

Daca instructiuneabreak se afla ıntr–o instructiune de tipulif , switch sautry...catch , atunci se abandoneaza executia acestei instructiuni,iar daca estepozitionata ın oricare alta parte, se ıncheie executarea programului.

1.9.5 Instructiuneaerror

Instructiunea

error(’mesaj’)

are ca efect abandonarea executiei si afisarea mesajuluiprecizat prinmesaj .

1.10 Functii (proceduri) ın Matlab

Toate programele scrise pana aici, numitefisiere script, ar putea fi considerate cafiind programe principale. Un astfel de program principal poate sa apeleze alte pro-grame, pe care le numimfunctii sauproceduri, care la randul lor pot face apel la alteproceduri.

Un program principal (fisier script), nu poate fi apelat de o alta unitate de pro-gram. Lansarea executiei unui astfel de program, se poate face numai cand sistemulMatlab este ın mod interactiv, adica avem pe ecran cursorul ��al sistemului Matlab.Lansarea se face ın doua moduri:

� prin tastarea, dupa cursorul��, a numelui sau, fara extensia.m ;

� prin copierea, dupa cursorul��, a continutului fisierului ce contine programul,un exemplu fiind cuplul de comenziCopy – Paste ,

dupa care se tasteaza comandaEnter .Remarcam faptul ca toata istoria unei sesiuni se afla pe ecran, chiar daca unele

secvente mai vechi nu sunt vizibile la un momnet dat, dar cu ajutorul mouse–ului,folosind bara din dreapta a ecranului se poate aduce secventa dorita ınpartea vizi-bila a ecranului. Mai mult, cu ajutorul sistemului de sageti pot fi readuse comenzimai vechi sau mai noi, care pot fi reeditate (modificate) si lansate dupa o astfel dereeditare. Exista chiar o cautare mai rapida a unor instructiuni din lista de instructiunice au fost utlizate ıntr–o sesiune Matlab, anume se tasteaza ınceputul instructiuniiurmata de sageata ın sus.

Inca ceva, toate variabilele folosite ın timpul unei sesiuni Matlab, fie ın modinteractiv, fie prin executia unui program principal (script–file) au un caracter globalsi sunt pastrate ıntr–un spatiu de lucru (workspace ), care la ıncheierea sesiuniiMatlab sunt pierdute. De aceea, avem la dispozitie comenzile pe care le-am prezentat,diary si save care permit, prin lansarea lor, salvarea acestor informatii.

Page 54: Stat_Matlab.PDF

44 Introducere ın Matlab

1.10.1 Definirea si structura unei functii Matlab

Colectia de programe ale sistemului Matlab este constituita, ın mare parte, din functii(proceduri) scrise ın limbajul propriu. Acestea sunt fisiere cu extensia.m avandurmatoarea structura:

function [lista1] = numef(lista2)% linia H1 (help line)% comentariu%corp

undelista1 si lista2 reprezinta respectiv lista variabilelor de iesire (despartiteprin spatii sau virgule) si lista parametrilor de intrare(despartiti prin spatii sau vir-gule),corp este secventa de instructiuni ale functiei cu numelenumef .

Variabilele din corpul procedurii au un caracter local, prin urmare la ıntoarcereaın unitatea care face apelul valorile acestora se pierd, desigur cu exceptia valorilordin lista1 . Exista posibilitatea schimbarii caracterului local, prin instructiunea

global lista

care are ca efect obtinerea caracterului global pentru variabilele dinlista .In corpul unei functii Matlab variabilelenargin si nargout specifica numarul

parametrilor de intrare, adica lungimea listeilista2 , respectiv a parametrilor deiesire, adica lungimea listeilista1 .

Daca ıntr–un fisier script sau de la tastatura se da una din comenzile

nargin(’numef’)nargout(’numef’)

atunci se obtin numarul parametrilor de intrare si respectiv numarul parametrilor deiesire pentru functia Matlab cu numelenumef .

Liniile dinaintea corpului procedurii, care ıncep cu % sunt linii de comentariu sivor fi listate cand se lanseaza comanda

help numef

Din acest motiv, partea de comentariu de la ınceputul procedurii este bine sa continainformatii, care sa descrie pe scurt cum trebuie sa fie apelata si folosita functia res-pectiva.

Mai remarcam prima linie de comentariu, notata cuH1, care are o ınsusire aparte.Cand se lanseaza comanda

lookfor key

care cauta cuvantul cheiekey , aceasta se face numai ın liniileH1 ale fisierelor cuextensia.m , dupa care se listeaza numele fisierelor ce contin cuvantul cheie precizat.

In cadrul liniilor ce alcatuiesccorp –ul functiei pot exista de asemenea linii decomentariu, care ıncep cu simbolul %, dar care nu vor fi afisate odata cu lansareacomenziihelp . Mai mult aparitia simbolului % ın interiorul unei linii face ca tot ceurmeaza pe linia respectiva sa fie considerat comentariu.

Page 55: Stat_Matlab.PDF

1.10. Functii (proceduri) ın Matlab 45

Numele unei functii Matlab,numef , scrisa de utilizator, este de dorit sa fie di-ferit de numele functiilor deja existente ın sistemul Matlab, iar numele fisierului, cuextensia.m , ce va contine functia sa fienumef.m .

Daca lista parametrilor de intrare,lista2 , este vida, atunci linia de definitie afunctiei este de forma

function [lista1] = numef

Daca lista variabilelor de iesire,lista1 , este formata dintr–o singura variabila,atunci se poate renunta la parantezele drepte, iar daca este vida se poate eliminacomplet.

Cu aceste precizari, cea mai simpla linie de defintie a unei functii (proceduri) este

function numef

1.10.2 Apelul unei functii (proceduri) Matlab

Apelarea unei functii se poate face ın doua moduri.Primul mod este cel interactiv, de exemplu, prin una din formele

[apel1] = numef(apel2)numef(apel2)

undeapel2 este lista parametrilor actuali, care poate fi vida sau formata din celmult atatea elemente cat are lista parametrilor formali,lista2 , din linia de definitiea functieinumef , de fiecare data facandu–se legatura de tipul: primul parametru dinapel2 corespunde primului parametru dinlista2 , al doilea element dinapel2corespunde celui de al doilea parametru dinlista2 ,..., corespondenta ıncheindu–se cand se termina listaapel2 . Desigur, dacaapel2 are mai putine elemente decatlista2 , atunci trebuie gestionata aceasta situatie ın corpulfunctiei numef cu aju-torul varaibileinargin .

Rezultatele executarii functieinumef , se pastreaza ın listaapel1 ın primul caz,respectiv ınans ın al doilea caz. O discutie analoga asupra corespondent¸ei dintreapel2 si lista2 , se face si ın cazulapel1 si lista1 .

O alta cale de apel a unei functii este dintr–un alt programsau procedura Ma-tlab, prin aparitia ıntr–o instructiune Matlab a numelui functiei, ımpreuna cu listaparametrilor actuali de tipul listeiapel2 , mai sus precizata.

1.10.3 Subfunctii

Functiile pot avea ıncorp –ul lor apeluri la alte functii. Totdeauna ıntoarcerea ın uni-tatea care cheama se face, cand se ajunge la linia finala acorp –ului unitatii chematesau cand se ıntalneste instructiuneareturn .

Exista doua situatii mai speciale ın constructia functiilor ın Matlab.

Page 56: Stat_Matlab.PDF

46 Introducere ın Matlab

In primul rand, exista posibilitatea ca dupacorp –ul unei functii sa fie definiteuna sau mai multe functii, pe care le numimsubfunctii si care pot fi apelate dincorp –ul functiei. Forma unei astfel de functii ar fi:

function [lista1] = numef(lista2)%% comentariu%corpfunction [list1] = numef1(list2)%% comentariu1%corp1

ın secventa de instructiunicorp facandu–se apel la functianumef1 . Functiile detipul functiei numef1 nu se pot apela din exteriorul fisieruluinumef.m . Dreptconsecinta nicicomentariu1 nu este vizibil din exteriorul functieinumef .

Functia 1.10.1. Sa scriem o procedura, care reprezinta grafic pe intervalul ���� �o multime finita precizata de polinoame ale lui Cebısevde speta I. Daca numarulacestora este par, atunci sa fie reprezentate pe doua coloane, iar ın caz contrar pe osingura coloana.

function cebisev(lista)% Polinomul Cebisev% lista -- contine gradele polinoamelor Cebisev% care vor fi reprezentate grafic;% daca lista are un numar par de elemente,% polinoamele se vor reprezenta pe doua coloane;% daca lista are un numar impar de elemente,% polinoamele se vor reprezenta pe o coloana;%clf, x=-1:0.001:1; r=length(lista);if rem(r,2)==0

m=fix(r/2); n=2;else

m=r; n=1;endfor i=1:r

y=cos(lista(i)*acos(x));splots(m,n,i,x,y,lista(i))

endfunction splots(m,n,k,u,v,gr)subplot(m,n,k), plot(u,v,’k-’)title([’Polinom Cebisev de gradul n=’,num2str(gr)])

Daca se apeleaza functiacebisev princebisev([2:5])

se obtin graficele din Figura 1.16.

Page 57: Stat_Matlab.PDF

1.10. Functii (proceduri) ın Matlab 47

−1 −0.5 0 0.5 1−1

−0.5

0

0.5

1Polinomul Cebisev de gradul n=2

−1 −0.5 0 0.5 1−1

−0.5

0

0.5

1Polinomul Cebisev de gradul n=3

−1 −0.5 0 0.5 1−1

−0.5

0

0.5

1Polinomul Cebisev de gradul n=4

−1 −0.5 0 0.5 1−1

−0.5

0

0.5

1Polinomul Cebisev de gradul n=5

Figura 1.16: Polinoamele lui Cebısev de grad� � �������1.10.4 Functiafeval

Un alt caz special este acela cand printre parametrii formali de intrare dinlista2exista si parametri ce pot lua valori nume ale unor functii. La apelul unei astfel defunctii pe pozitia parametrului actual corespunzator din listaapel2 trebuie sa se afleun sir de caractere ce denumeste functia actuala.

Functia 1.10.2. Functia cu numeleopmatrix opereaza prin operatorii Matlabcunoscuti asupra a doua matrice:

function Z = opmatrix(op,X,Y)%% Efectueaza operatia definita prin op% asupra matricelor X si Y.% Rezultatul este returnat in Z%Z = feval(op,X,Y);

Folosind aceasta functie, de exemplu prin comenzileopmatrix(’plus’,A,B)opmatrix(’minus’,A,B)opmatrix(’and’,A,B)

sauopmatrix(’+’,A,B)opmatrix(’-’,A,B)opmatrix(’&’,A,B)

Page 58: Stat_Matlab.PDF

48 Introducere ın Matlab

se obtin suma, diferenta si respectiv conjunctia matricelorA si B.

1.10.5 Comandaecho

Instructiuneaecho are un comportament putin diferit pentru cele doua tipuridefisiere cu extensia.m .

Daca suntem ın cazul unuifisier script, atunci instructiunile

echo onecho offecho

au respectiv urmatoarele efecte: prima are ca efect afisarea pe ecran a fisierului ın de-rulare, a doua anuleaza acest efect, iar a treia are efectulprimei forme, daca sistemulse afla ın modoff , iar daca se afla ın modoff se va face trecerea la modulon .

Daca suntem ın cazul functiilor Matlab cu extensia.m , atunci avem formele

echo numef onecho numef offecho numefecho on allecho off all

Primele trei forme sunt analoge celor trei din cazulscript, numai ca se mai specifica sinumele functiei la care se refera. Celelalte doua actioneaza asupra tuturor functiilor.

1.11 Instructiuni de evaluare a eficientei

Compararea eficientei algoritmului este posibila ın sistemul Matlab fie prin numara-rea opertiilor ın virgula flotanta, fie prin determinarea duratei, ın secunde, a executieiunei secvente de instructiuni,CPU(CentralProcessorUnit).

1.11.1 Instructiuneaflops

Instructiuneaflops este ıncorporata ın Matlab 6 prin pachetulLAPACK. Prin ur-mare este functionala numai daca sistemul contine siLAPACK.

Obtinerea numarului operatiilor ın virgula flotantaefectuate pentru executia uneisecventesecv de instructiuni Matlab se realizeaza prin:

flops(0)secv

flops

La ıncheierea executiei acestei succesiuni de instructiuni ın variabilaflops se aflanumarul acestor operatii.

Page 59: Stat_Matlab.PDF

1.12. Grafica tridimensionala 49

1.11.2 Instructiunile tic si toc

Pentru obtinerea duratei executiei unei secventtesecv de instructiuni Matlab avemurmatoarea succesiune de instructiuni:

ticsecv

toc

undetic marcheaza ınceputul contorizarii timpului, iartoc anunta ıncheierea con-torizarii, variabilatoc continand timpul masurat ın secunde.

1.12 Grafica tridimensionala

Grafica tridimensionala sau altfel numita3D este axata ın sistemul Matlab pe douadirectii: reprezentarea curbelor ın spatiu si reprezentarea suprafetelor.

1.12.1 Instructiuneaplot3

Instructiuneaplot3 este utilizata pentru reprezentarea curbelor ın spatiusi ın prin-cipiu nu se deosebeste mult de instructiuneaplot din grafica bidimensionala.

Formele ıntalnite pentru aceasta instructiune sunt:

plot3(x,y,z)plot3(x,y,z,s)plot3(x1,y1,z1,x2,y2,z2,...)plot3(x1,y1,z1,s1,x2,y2,z2,s2,...)

Dacax , y , z sunt vectori de acceasi lungimem, atunci se unesc punctele de coordo-nate�x � �y �

�z ��, � � ��m, printr–o linie poligonala de tipul precizat prin parametrul

s , de la instructiuneaplot , iar ın lipsa acestui parametru, sistemul Matlab efec-tueaza o alegere implicita a tipului curbei. Desigur ca netezimea curbei este cu atatmai buna cu cat numarul punctelor este mai mare.

Dacax , y , z sunt matrice de acelasi tip(m,n) , atunci pentru fiecare coloana seobtine cate o linie poligonala, adican linii poligonale. Acestea sunt generate respectivde punctele de coordonate

x �� �y �� �z �� �m

��� �pentru fiecare� � ��n, cu aceeasi

observatie privind parametruls , care precizeaza tipul curbei.In acest caz pe aceeasifigura vor fi obtinute mai multe grafice.

Ultimele doua forme sunt extinderi ale primelor doua, pentru a putea controlamai bine ın special tipul curbelor cu ajutorul parametrilor de tips .

Remarcam de asemenea extinderea actiunilor comenzilor ce controleaza un graficdin cazul bidimensional pentru cazul tridimensional.

Programul 1.12.1. Prezentam un program care ilustreaza miscarea unei particule dinpunctulA pe o spirala pana ın punctulB.

Page 60: Stat_Matlab.PDF

50 Introducere ın Matlab

pas=input(’pas=’); h=input(’h=’);t=0:pas:h; r=exp(-0.2*t); th=pi*t*0.5;x=r.*cos(th); y=r.*sin(th); z=t;plot3(x,y,z), hold onplot3([1,1],[-0.5,0],[0,0])text(1,-0.7,0,’A’), n=length(t);text(x(n),y(n),h+2,’B’)xlabel(’x’), ylabel(’x’), zlabel(’z’)

Sa explicam pe scurt o parte a instructiunilor acestui program.Figura este obtinuta ın doua etape, din cauza aceasta a fost introdusa instructiunea

hold on . Prima instructiuneplot3 traseaza efectiv graficul spiralei, care semai completeaza prin segmentul din planulxoy delimitat de punctele de coordo-nate(1,-0.5,0) si (1,0,0) , trasat cu a doua instructiuneplot3 . Cele douainstructiuni au acelasi rezultat ca si instructiunea

plot3(x,y,z,[1,1],[-0.5,0],[0,0])

doar ca spirala va fi trasata cu o anumita culoare, iar segmentul din planulxoy cualta. Daca vrem ca ıntreaga curba sa fie trasata cu aceeasi culoare se poate apela laparametrul de tips .

Se mai observa ca pozitia initialaA a punctului si pozitia finalaB sunt afisatecu instructiuniletext , iar etichetele celor trei axe de coordoante sunt date prininstructiunile de tiplabel .

Dupa executarea programului, cuh=20 si pas=0.01 , s–a obtinut graficul dinFigura 1.17.

−1

−0.5

0

0.5

1

−1

−0.5

0

0.5

10

5

10

15

20

A

x

B

y

z

Figura 1.17: Miscarea pe spirala

Page 61: Stat_Matlab.PDF

1.12. Grafica tridimensionala 51

1.12.2 Instructiuneaezplot3

Pentru reprezentarea grafica a curbelor ın spatiu, poatefi folosita instructiuneaezplot3 , care se lanseaza prin una din comenzile:

ezplot3(’x’,’y’,’z’)ezplot3(’x’,’y’,’z’,[a,b])ezplot3(’x’,’y’,’z’,’animate’)ezplot3(’x’,’y’,’z’,[a,b],’animate’)

Parametriix , y si z , contin expresii algebrice ale reprezentarilor curbei ˆın functie deun parametrut , din [a,b] . Valoarea implicita a acestui interval este[0,2 �] .

Prezenta parametruluianimate produce pe figura un buton cu numelerepeat ,care prin activare prezinta modul de deplasare a unui punctpe curba reprezentatagrafic.

De exemplu, daca se considera comanda

ezplot3(’sin(t)’,’cos(t)’,’t’,[0,10*pi],’animate’)

se va obtine graficul din Figura 1.18, ın care se observa si butonul repeat .

−1

−0.5

0

0.5

1

−1

−0.5

0

0.5

10

5

10

15

20

25

30

35

x

x = sin(t), y = cos(t), z = t

y

z

Figura 1.18:� ��� � ��� ���, � ��� � ��� ���, ���� � �,� � ��� ���

1.12.3 Instructiunile meshgrid, mesh si surf

Reprezentarea grafica a unei suprafete, data prin functia � � � �����, pe domeniul� � �� , cuprinde doua etape.

Page 62: Stat_Matlab.PDF

52 Introducere ın Matlab

Prima data se realizeaza o retea rectangulara de puncte, cu ajutorul instructiuniimeshgrid , care are sintaxa

[X,Y]=meshgrid(x,y)

undex si y sunt vectori, ın general de lungimi diferite,m si n, care contin punctede pe axeleox si oy si care sunt folosite la generarea retelei rectangulare

x � �y��� � ��m, � � ��n.

Rezultatul executarii instructiuniimeshgrid , are ca efect generarea matricelorX si Y avand acelasi tip(n,m) . Fiecare linie a matriceiX este formata din compo-nentele vectoruluix , iar fiecare coloana a matriceiY este formata din componentelevectorului y . In acest fel punctul de coordonate

x � �y� � al retelei rectangulare, se

poate exprima, cu ajutorul matricelorX si Y, prin perechea(X(j,i),Y(j,i)) .Inainte de a trece la a doua etapa, sa facem observatia cadacax coincide cuy ,

atunci se poate utiliza[X,Y]=meshgrid(x)

Reprezentarea grafica a functiei� � � �����, se face cu ajutorul instructiuniimesh, care are una din formele:

mesh(Z)mesh(Z,C)mesh(x,y,Z)mesh(x,y,Z,C)mesh(X,Y,Z)mesh(X,Y,Z,C)

De la ınceput, sa remarcam faptul ca parametrulC precizeaza scara culorilor. Candlipseste acest parametru, scara culorilor este data de parametrulZ, care reprezintavalorile functiei� � � ����� pe o reteaua rectangulara.In acest ultim caz culoareava fi proportionala cu ınaltimea� din punctul�����.

De asemenea, trebuie sa remarcam faptul ca reprezentarea grafica a suprafeteieste de forma unei retele curbilinii sprijinita pe ınaltimile date prin matriceaZ.

ParametriiX, Y si Z sunt matrice de aceleasi dimensiuni, daca avem ın vederecum au fost obtinute matriceleX si Y, atunci toate aceste trei matrice sunt de tipul(n,m) .

Parametriix si y sunt vectori de tipul celor ce genereaza matriceleX si Y prininstructiuneameshgrid , adica daca acestia au lungimilemsi respectivn, matriceaZva fi de tipul(n,m) , iar punctele pe care se sprijina reteaua curbilinie, care reprezintagraficul functiei, au coordonatele(x(j),y(i),Z(i,j)) .

Daca primii doi parametri lipsesc, adica suntem ın cazulprimelor doua formeale instructiuniimesh, acestea sunt echivalente respectiv cu urmatoarele doua, princonsiderarea valorilor implicitex=1:m si y=1:n .

Instructiuneasurf are aceeasi sintaxa ca instructiuneamesh, adicasurf(Z)surf(Z,C)

Page 63: Stat_Matlab.PDF

1.12. Grafica tridimensionala 53

surf(x,y,Z)surf(x,y,Z,C)surf(X,Y,Z)surf(X,Y,Z,C)

unde parametrii au aceleasi caracteristici. Deosebirea ˆın reprezentarea grafica este caprin instructiuneasurf se produce o colorare a patrulaterelor obtinute prin curbelecare genereaza suprafata corespunzatoare functiei� � � �����.Programul 1.12.2. Vom scrie un program care sa reprezinte grafic functia

� � � ����� � ���e� � �� ���

pe domeniul� � ���� � � ���� �, ın doua figuri alaturate, odata cu instructiunea

mesh si apoi cu instructiuneasurf .clear, clfm=input(’m=’);h=1/m; x=-1:h:1;[X,Y]=meshgrid(x);Z=1/(2*pi)*exp(-0.5*(X.ˆ2+Y.ˆ2));subplot(1,2,1), mesh(X,Y,Z)title(’Grafica prin MESH’)xlabel(’x’), ylabel(’y’), zlabel(’z’)subplot(1,2,2), surf(X,Y,Z)title(’Grafica prin SURF’)xlabel(’x’), ylabel(’y’), zlabel(’z’)

Executarea programului, cu� � �, conduce la reprezentarile grafice din Figura 1.19.

In ıncheierea acestui paragraf, amintim ca exista posibilitatea de umbrire a uneisuprafete cu ajutorul comenzii

shading tip

undetip poate fi:

� faceted (implicit) – umbreste fiecare patrulater de pe suprafata trasata cu ointensitate fixa si traseaza laturile patrulaterelor;

� flat – umbreste fiecare patrulater de pe suprafata trasata cu ointensitate fixa,fara trasarea laturilor patrulaterelor;

� interp – umbrirea fiecarui patrulater de pe suprafata trasata seface ın modgradat, printr–un procedeu de interpolare, care asigura otrecere neteda de laun patrulater la altul, fara trasarea laturilor patrulaterelor.

Programul 1.12.3. Sa scriem un program care efectueaza umbrirea suprafetei repre-zentata grafic prin Programul 1.12.2:

Page 64: Stat_Matlab.PDF

54 Introducere ın Matlab

−1

−0.5

0

0.5

1

−1

−0.5

0

0.5

1

0.04

0.06

0.08

0.1

0.12

0.14

0.16

x

Grafica prin MESH

y

z

−1

−0.5

0

0.5

1

−1

−0.5

0

0.5

1

0.04

0.06

0.08

0.1

0.12

0.14

0.16

x

Grafica prin SURF

y

z

Figura 1.19:� � ���e� � �� ��

m=input(’m=’);h=1/m; x=-1:h:1;[X,Y]=meshgrid(x);Z=1/(2*pi)*exp(-0.5*(X.ˆ2+Y.ˆ2))subplot(1,3,1), surf(X,Y,Z),shading facetedtitle(’Umbrire - faceted’)subplot(1,3,2), surf(X,Y,Z),shading flattitle(’Umbrire - flat’)xlabel(’x’), ylabel(’y’), zlabel(’z’)subplot(1,3,3), surf(X,Y,Z),shading interptitle(’Umbrire - interp’)

Rezultatul executarii programului este ın Figura 1.20.

1.12.4 Instructiunile contour si contourf

Reprezentarea curbelor de nivel ale suprafetei, data prin functia� � � �����, se poateface cu una din urmatoarele forme ale instructiuniicontour :

contour(Z)contour(Z,n)contour(Z,v)contour(X,Y,Z)

Page 65: Stat_Matlab.PDF

1.12. Grafica tridimensionala 55

−1

0

1

−1

−0.5

0

0.5

1

0.04

0.06

0.08

0.1

0.12

0.14

0.16

Umbrire − faceted

−1

0

1

−1

−0.5

0

0.5

1

0.04

0.06

0.08

0.1

0.12

0.14

0.16

Umbrire − flat

−1

0

1

−1

−0.5

0

0.5

1

0.04

0.06

0.08

0.1

0.12

0.14

0.16

Umbrire − interp

Figura 1.20: Umbrirea unei suprafete

contour(X,Y,Z,v)contour(Z,[w w])contour(X,Y,Z,[w w])

unde parametriiX, Y si Z au aceleasi interpretari ca si ın cazul instructiunilor meshsi surf .

Parametrulv este un vector prin care se specifica nivelurile curbelor denivel ceurmeaza a fi reprezentate grafic, iar ın absenta sa, valorile acestui parametru suntautomat calculate. Numarul curbelor de nivel se poate preciza prin parametruln.

Formele instructiuniicontour cu parametrul de tipul[w w] are ca efect tra-sarea curbei de nivel precizata prinw. Aceste forme permit reprezentarea grafica afunctiilor date sub forma implicita. Astfel, daca vremsa reprezentam grafic functia� � � ��� data prin� ����� � �

, atunci graficul functiei� � � ��� va fi dat de curba

de nivel pentru functia� � � �����, considerandw=0.Instructiuneacontourf difera decontour doar prin faptul ca ariile delimitate

de curbele de nivel sunt umbrite.

Programul 1.12.4. Sa reprezentamn curbe de nivel pentru functia considerataın Programul 1.12.2. Reprezentarile acestor curbe de nivel sa fie facute atat cuinstructiuneacontour , cat si cucontourf .

clear, clfm=input(’m=’); n=input(’n=’);h=1/m; x=-1:h:1;

Page 66: Stat_Matlab.PDF

56 Introducere ın Matlab

[X,Y]=meshgrid(x);Z=1/(2*pi)*exp(-0.5*(X.ˆ2+Y.ˆ2));subplot(1,2,1), contour(Z,n)title([’n=’,num2str(n),’ curbe de nivel’])subplot(1,2,2), contourf(Z,n)title([’n=’,num2str(n),’ curbe de nivel umbrite’])

Executarea programului, cu� � � si n=5 , conduce la reprezentarile grafice din

Figura 1.21.

2 4 6 8 10 12

2

4

6

8

10

12

n=5 curbe de nivel

2 4 6 8 10 12

2

4

6

8

10

12

n=5 curbe de nivel umbrite

Figura 1.21: Curbe de nivel

1.12.5 Instructiunile ezcontour si ezcontourf

O forma simplificata, pentru reprezentarea curbelor de nivel, pentru o functie dataprin � � � �����, se obtine cu ajutorul instructiuniiezcontour , avand una dinformele:

ezcontour(f)ezcontour(f,lim)ezcontour(f,n)

undef este expresia matematica a unei functii de doua variabile, privita ca un sir decaractere.

Parametrullim este fie un vector de forma[xmin,xmax] , fie de forma[xmin,xmax,ymin,ymax] . Daca lipseste, se ia implicit[-2 �,2 �,-2 �,2 �] ,iar daca este de prima forma se ia[xmin,xmax,xmin,xmax] .

Parametruln specifica faptul ca ın reprezentarea grafica se foloseste o retea den�n puncte (implicit se consideran=60 ).

De exemplu,

Page 67: Stat_Matlab.PDF

1.12. Grafica tridimensionala 57

f=’sqrt(xˆ2+yˆ2)’ezcontour(f,[-2,2])

are acelasi efect cuezcontour(’sqrt(xˆ2+yˆ2)’,[-2,2])

si produc curbele de nivel pentru functia� � � ����� � ��� � ��, pe domeniul� � ����� � �����.

Instructiuneaezcontourf , fata deezcontour executa si umbrirea ariilorgenerate de curbele de nivel.

1.12.6 Instructiunile ezmesh, ezsurf, ezmeshc si ezsurfc

Sintaxa apelurilor functiilorezmesh ,ezsurf ,ezmeshc siezsurfc este aceeasi,iar efectul executarii lor este reprezentarea grafica a unei suprafete, respectiv a uneisuprafete, ımpreuna cu sau fara curbele de nivel corespunzatoare. De aceea prezentammodurile de apelare, numai pentru una dintre ele.

ezmesh(’f’)ezmesh(’f’,lim)ezmesh(’x’,’y’,’z’)ezmesh(’x’,’y’,’z’,lim)

Parametrulf reprezinta o expresie algebrica, ce defineste suprafata, care urmeazasa fie reprezentata grafic, pe domeniul definit prinlim . Implicit, ın absenta para-metrului lim , domeniul este[-2 �,2 �] �[-2 �,2 �] . Dacalim=[a,b] , atuncidomeniul va fi[a,b] �[a,b] , iar dacalim=[a,b,c,d] , atunci domeniul va fi[a,b] �[c,d] .

Parametriix , y , z , reprezinta expresii algebrice ce definesc suprafata ınmodulparametric.In acest caz, corespunzator, parametrullim , precizeaza domeniul ın careiau valori parametrii cu ajutorul carora se defineste ın mod parametric suprafata ceurmeaza a fi reprezentata.

Remarcam faptul ca formele mai sus prezentate, mai pot avea doi parametri.Unul, n, de tip ıntreg pozitiv, care precizeaza numaruln�n al punctelor retelei. Im-plicit se consideran=60 . Un altul este’circ’ , care prin prezenta sa atrage repre-zentarea luif pe un disc centrat ın domeniul mai sus precizat.

Pentru exemplificare, daca se executa programul Matlab format din urmatoareleinstructiuni:

subplot(1,2,1)ezmesh(’sin(x)*sin(y)’,[-pi,pi],’circ’)subplot(1,2,2)ezmeshc(’sin(x)*sin(y)’,[-pi,pi],’circ’)colormap spring

se obtin graficele din Figura 1.22.Mai remarcam faptul caf , x , y , z pot fi numele unor functii predefinite sau scrise

de utilizator.

Page 68: Stat_Matlab.PDF

58 Introducere ın Matlab

−5

0

5

−5

0

5

−1

−0.5

0

0.5

1

x

sin(x) sin(y)

y

z

−5

0

5

−5

0

5

−1

−0.5

0

0.5

1

x

sin(x) sin(y)

y

z

Figura 1.22: Suprafata fara si cu curbe de nivel

Pentru a ilustra ca cele doua instructiuni de tipulezmesh si ezsurf au deregula acelasi efect, programul urmator reprezinta grafic aceeasi suprafata, respectivcu ezmesh si ezsurf .

clfsubplot(1,2,1),ezsurf(’x*exp(-xˆ2 - yˆ2)’,[-2,2],20)title(’Reprezentare cu ezsurf’)subplot(1,2,2)ezsurf(’x*exp(-xˆ2 - yˆ2)’,[-2,2],20)colormap autumntitle(’Reprezentare cu ezmesh’)

Graficele sunt prezentate ın Figura 1.23.

1.12.7 Instructiunile bar3 si bar3h

Instructiunilebar3 si bar3h corespund instructiunilorbar si respectivbarh dingrafica bidimensionala.

Forme ale acestor instructiuni sunt:

bar3(z,w,’tip’,’color’)bar3(y,z,w,’tip’,’color’)bar3h(y,w,’tip’,’color’)bar3h(y,z,w,’tip’,’color’)

Page 69: Stat_Matlab.PDF

1.12. Grafica tridimensionala 59

−2

−1

0

1

2

−2

−1

0

1

2

−0.5

0

0.5

x

Reprezentare cu ezsurf

y−2

−1

0

1

2

−2

−1

0

1

2

−0.5

0

0.5

x

Reprezentare cu ezmesh

y

Figura 1.23: Suprafata reprezentata� � � ����� � �e��� ��

argumentelew, ’tip’ si ’color’ sunt optionale, dar cand sunt specificate, trebuiesa pastreze aceasta ordine.

Parametruly este un vector de lungimem, avand componentele ordonatecrescator sau descrescator. Dacay lipseste, atunci se considera implicity=1:m .

Dacaz este un vector de aceeasi lungime cuy , atunci vor fi reprezentate graficmbare de lungimiz � ın dreptul punctelory �,

� � ��m, de pe axaoy . Dacaz este o ma-trice de tipul(m,n) , reprezentarile sunt efectuate pentru fiecare din celen coloaneale matricei, adica ın fiecare puncty �,

� � ��m, de pe axaoy , vor fi reprezentate caten bare (batoane).

Parametrulwspecifica grosimea barelor, implicit fiindw� ��

�, iar pentruw � �

barele se suprapun.Daca parametrultip=detached , care este valoarea implicita, atunci barele

din puncteley � de pe axaoy vor fi detasate ın adancime dupa axaox . Dacatip=grouped , barele (batoanele) vor fi grupate ın puncteley �, de pe axaoy , iardacatip=stacked , atunci barele vor fi stivuite ın aceste puncte.

Parametrulcolor specifica culoarea barelor (batoanelor) si are una din urma-toarele valori:r (rosu),g (verde),b (albastru),y (galben),m(violet), c (ciclamen),k (negru),w (alb).

Deosebirea ıntrebar3 si bar3h este ca prima instructiune actioneaza pe verti-cala, iar a doua pe orizontala.

Page 70: Stat_Matlab.PDF

60 Introducere ın Matlab

Programul 1.12.5. Sa scriem un program care genereaza o matrice magica de ordin�

��. Folosind primele trei coloane ale matricei magice, sa reprezentam prin bare

verticale valorile acestora cu fiecare din tipuriledetached ,grouped si stacked .Folosind ultimele trei coloane sa se faca astfel de reprezentari cu ajutorul barelororizontale.

m=input(’m:’); A=magic(m);subplot(2,3,1), bar3(A(:,1:3),.6,’detached’)title(’Bar3 - detached’)subplot(2,3,2), bar3(A(:,1:3),’grouped’)title(’Bar3 - grouped’)subplot(2,3,3), bar3(A(:,m-2:m),.6,’stacked’)title(’Bar3 - stacked’)subplot(2,3,4), bar3h(A(:,m-2:m),.6,’detached’)title(’Bar3h - detached’)subplot(2,3,5), bar3h(A(:,m-2:m),’grouped’)title(’Bar3h - grouped’)subplot(2,3,6), bar3h(A(:,1:3),.6,’stacked’)title(’Bar3h - stacked’)colormap spring

Executarea acestui program, pentrum=4, produce graficele din Figura 1.24.

12

3

12

34

0

10

20

Bar3 − detached

12

34

0

5

10

15

20Bar3 − grouped

12

34

0

20

40Bar3 − stacked

010

20

1

2

3

4

Bar3h − detached

0

10

20

1

2

3

4

Bar3h − grouped

0

20

40

1

2

3

4

Bar3h − stacked

Figura 1.24: Bare verticale si bare orizontale ın 3D

Page 71: Stat_Matlab.PDF

Capitolul 2

Elemente de teoria probabilitatilor

Teoria probabilitatilor are ca obiect de studiu fenomenenedeterministe sau ale-atoare (ıntamplatoare). Un fenomen nedeterminist� este rezultatul imposibilitatiicunoasterii exacte si complete a tuturor elementelor care concura la realizarea aces-tuia. Astfel de fenomene aleatoare ar putea fi apelurile dintr-o centrala telefonica,accidentele de circulatie dintr-o intersectie, extragerile numerelor loto, rezultatelede la ruleta, noii nascuti la o maternitate, numarul particulelor dezintegrate dintr-o substanta radioactiva, miscarea browniana a particulelor unei substante dizolvataıntr-un fluid, sosirea clientilor ıntr-o statie de servire, raspandirea erorilor de tipardintr-o carte, vanzarea painii la o unitate alimentara s¸i ın fine raspandirea stafidelorın prajitura cumparata de la o cofetarie. Toate acestefenomene sunt fenomene alea-toare prin faptul ca nu sunt cunoscute toate conditiile ın care sunt realizate, sau dacao parte din aceste conditii pot fi precizate, ele nu sunt cunoscute cu exactitate. Fac-torii necunoscuti, care se regasesc ın fenomenul real, conduc la astfel de fenomenealeatoare (nedeterministe).

Teoria probabilitatilor vine sa dea metode unitare pentru analiza si studiul unorastfel de fenomene nedeterministe si care provin dintr–o gama larga a activitatii sicunoasterii umane. Pentru aceasta este necesar sa fie formalizat limbajul prin carese trateaza fenomenele aleatoare, ca apoi prin particularizari sa fie obtinute rezultatespecifice fenomenului considerat.

Vom presupune ca avem anumite cunostinte de relative la teoria probabilitatilor.Reamintim ın acest capitol doar o parte din notiunilor de baza ale teoriei proba-bilitatilor, pentru stabilirea unui limbaj comun ın abordarea capitolelor urmatoare.Tinand seama de aceasta motivatie recomandam celor neinitiati ın aceasta disciplinaa teoriei probabilitatilor lucrarile [10], [6], [9], [8].

61

Page 72: Stat_Matlab.PDF

62 Elemente de teoria probabilitatilor

2.1 Camp de probabilitate

Daca se considera fenomenul aleator (experimentul) �, vom numiproberezultateleexperimentului, iar multimea probelor relative la experimentul � o numim spatiulprobelor si pe care ıl notam prin�.

Definitia 2.1.1. Spunem ca submultimea nevida � � � ��� este un�–corp (corpborelian, �-algebra)daca satisface urmatoarele conditii:

(2.1.1) �� �� �� �� � �� ��� � �� � � � ���� �

� � ��

iar perechea����� se numestecamp de evenimente.

Multimea de indici� este o multime cel mult numarabila.

Definitia 2.1.2. Fiind dat campul de evenimente�����, se numesteprobabilitateoaplicatie� � �� �, care verifica urmatoarele trei axiome:

(i) �� � � �� � ��� � ��(ii) � ��� � �� � fiind evenimentul sigur (cert),

(iii) ��� � �� � � � � �� ��� � �� � �� � ������ ��� ��

�� � ���� �

iar tripletul ������ � se numestecamp de probabilitate.

2.2 Variabile aleatoare

Fie campul de probabilitate������ � si �–algebrele multimilor Borel� ���,� ��� �, respectiv pe� si �

�.

Definitia 2.2.1. Numimvariabila aleatoare, aplicatia � � �� �, daca este�–masurabila, adica

(2.2.1) �� � � ��� ����� ��� � �� � � �� � ��� ��� � ��

Observatia 2.2.2.Avand ın vedere ca� ��� poate fi generat de familia de intervale���������, conditia (2.2.1) de�–masurabilitate poate fi ınlocuita prin

(2.2.2) ��� ������� � �� � �� � �� � � �� � ��� � �� � �� �� � ��

Page 73: Stat_Matlab.PDF

2.3. Functie de repartitie 63

Observatia 2.2.3.Cardinalul multimii� ��� a valorilor unei variabile aleatoare�,conduce la o clasificarea a multimii variabilelor aleatoare:

� variabile aleatoare de tip discret, daca�� ���� � ��, adica� are o multimecel mult numarabila de valori;

� variabile aleatoare simple, daca�� ���� � ��, adica� are o multime finitade valori;

� variabile aleatoare de tip continuu, daca�� ����� �, adica� are o multimevalori de puterea continuumului.

Definitia 2.2.4. Numimvector aleator�–(dimensional), aplicatia� � �� �� ,daca este�–masurabila, adica

�� � � ��� � ����� ��� � �� � � �� � ��� ��� ��sau avand ın vedere Observatia 2.2.2

�� � �� � ��� � ���� � �

��� � ���� �� � � �� �� ��� � ���

� � �

��� ��� � ��� � �� �� � �� �

unde�� si ��,� � ���, reprezinta respectiv componentele vectorului aleator� si

ale vectorului�

.

2.3 Functie de repartitie

Fie campul de probabilitate������ � si variabila aleatoare� � � �.

Definitia 2.3.1. Numimfunctie de repartitieatasata variabilei aleatoare�, aplicatia� � �� ��

definita prin

(2.3.1) � ��� � � �� � �� � �� � ��

Observatia 2.3.2. Marea majoritate a tratatelor de teoria probabilitatilor definescfunctia de repartitie prin formula

� ��� � � �� � �� � �� � ��

dar avand ın vedere ca sistemul Matlab foloseste formula (2.3.1), ın definirea functieide repartitie, vom considera aceasta abordare ın cele ceurmeaza.

Page 74: Stat_Matlab.PDF

64 Elemente de teoria probabilitatilor

Definitia 2.3.3. Numimfunctie de repartitieatasata vectorului aleator�–dimensio-nal�, aplicatia� �� �� � �

definita prin

� ��� � � ���� � � �

���� � � ��� � ���� � �

��� � ��� � �� � ���

Fie vectorul aleator� cu functia de repartitie� si fie notata respectiv prin��

functia de repartitie a variabilei aleatoare��, care este componenta�

a vectoruluialeator, pentru fiecare

� � ���.

Definitia 2.3.4. Spunem ca variabilele aleatoare��,� � ���, sunt independente

daca

� ��� � � ���� � � �

���� � �� ���� � � ��� ���� � �� � ���

2.4 Legi de probabilitate de tip discret

Daca variabila aleatoare� este de tip discret, adica are un numar cel mult numarabilde valori, fie acestea�� � �,

� � �, atunci functia de repartitie� atasata este o functieın scara si este data prin:

(2.4.1) � ��� � ��������� � �� � ��

unde�� � � �� � ���.Definitia 2.4.1. Numimdistributiasaurepartitiavariabilei aleatoare� de tip discret,tabloul

���������

unde�� � �,� � �, sunt valorile pe care le ia variabila aleatoare�, iar �� este

probabilitatea cu care variabila aleatoare� ia valoarea��, adica�� � � �� � ���,pentru fiecare

� � �.Deoarece evenimentele�� � ���, � � �, formeaza un sistem complet de eve-

nimente, avem ca��� �� � �. Remarcam de asemenea ca��, reprezinta marimeasaltului functiei de repartitie ın punctul de discontinuitate��, pentru fiecare

� � �.In teoria probabilitatilor si ın aplicatiile sale, seıntalnesc clase de variabile alea-

toare de tip discret. Forma cea mai generala a unei variabile aleatoare apartinand uneiclase se numestelege de probabilitate de tip discret.

Page 75: Stat_Matlab.PDF

2.4. Legi de probabilitate de tip discret 65

2.4.1 Functiile Matlabpdf si cdf

Distributia variabilei aleatoare� poate fi precizata prin ceea ce numimfunctie deprobabilitate( pdf – probability distribution f unction, ın Matlab) definita prin:

� ���� � �� � � � � �sau prinfunctia de repartitie( cdf – cumulativedistribution f unction).

Daca valorile��,� � �, sunt calculate, atunci folosind instructiunileplot ,

bar si stairs , se pot reprezenta grafic functia de probabilitate (pdf ) si functiade repartitie (cdf ). Anume, daca vectorulx contine valorile variabilei aleatoare�,iar p probabilitatile corespunzatoare, atunci intructiunile

plot(x,p,’s’)bar(x,p)stairs(x,p)

vor reprezenta grafic respectiv functia de probabilitate prin simbolul precizat prins ,functia de probabilitate prin bare si functia de repartitie (functie ın scara).

Remarcam faptul ca daca� ia o infinitate numarabila de valori, atunci trebuiesa ne limitam la un numar finit de valori ale variabilei aleatoare, iar reprezentarilegrafice se vor face pe domeniul cuprins ıntre valorile minima si maxima ale acestora.

Programul 2.4.2. Sa consideram variabila aleatoare� care are distributia

���

� � ���

��

���

si vrem sa reprezentam grafic functia de probabilitate (prin puncte si bare) si functiade repartitie pe aceeasi figura.

Am putea presupune ca variabila aleatoare� se refera la aruncarea unui zar.Anume, daca ın urma aruncarii zarului se obtine un numar compus (4 sau 6), atuncise pierde o miza (� � ��), daca se obtine un numar prim (2, 3 sau 5) se castiga omiza (� � �), altfel nu se castiga si nu se pierde nimic (� � �

).Urmatorul program

x = [-1:1]; p = [1/3,1/6,1/2];pc = [1/3,1/2,1];subplot(1,3,1), plot(x,p,’o’)axis([-1.5 1.5 0 1])title(’Functia de probabilitate’)subplot(1,3,2), bar(x,p)axis([-1.5 1.5 0 1])title(’Functia de probabilitate’)subplot(1,3,3), stairs(x,pc)title(’Functia de repartitie’)

produce reprezentarile grafice din Figura 2.1.

Page 76: Stat_Matlab.PDF

66 Elemente de teoria probabilitatilor

−1 0 10

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1Functia de probabilitate

−1 0 10

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1Functia de probabilitate

−1 0 10.3

0.4

0.5

0.6

0.7

0.8

0.9

1Functia de repartitie

Figura 2.1: Functia de frecventa si functia de repartitie

Sistemul Matlab dispune de functii (instructiuni) care calculeaza valorile functieide probabilitate si ale functiei de repartitie pentru legile de probabilitate implementateprin Statistics toolbox.

Functia pdf

Doua moduri de apel pentru calculul valorilor functieipdf avem:p=pdf(’legea’,x,par1,par2,...)p=numef(x,par1,par2,...)

undelegea este un sir de caractere predefinit pentru fiecare din legilede probabili-tate disponibile ınStatistics toolbox, numef este un sir de caractere din care ultimeletrei suntpdf , iar cele ce le preced sunt cele care dau numele predefinit al legii deprobabilitate (ca si cele din parametrullegea ).

In urma executarii uneia din cele doua instructiuni, se calculeaza matriceapa probabilitatilor legii precizata prin parametriilegea , respectivnumef , cores-punzatoare valorilor date prin matriceax si avand parametrii dati prin matricelepar1 , par2 ,... Aceste matrice trebuie sa fie de aceleasi dimensiuni,cu exceptia cadaca unele sunt scalari, acestia se extind la matricele constante de aceleasi dimensiunicu celelalte si care iau valorile scalarilor corespunzatori.

Functia cdf

Si pentru calculul valorilor functiei de repartitie functia cdf avem doua forme deapel

Page 77: Stat_Matlab.PDF

2.4. Legi de probabilitate de tip discret 67

cp=cdf(’legea’,x,par1,par2,...)cp=numef(x,par1,par2,...)

undelegea este un sir de caractere predefinit pentru fiecare din legilede probabili-tate disponibile ınStatistics toolbox, numef este un sir de caractere din care ultimeletrei suntcdf , iar cele ce le preced sunt cele care dau numele predefinit al legii deprobabilitate (ca si cele din parametrullegea ).

In urma executarii uneia din cele doua instructiuni, se calculeaza matriceacp aprobabilitatilor cumulate (valorile functiei de repartitie) a legii precizata prinlegearespectivnumef , corespunzatoare valorilor date prin matriceax si avand parametriidati prin matricelepar1 , par2 ,... Aceste matrice trebuie sa fie de aceleasi dimen-siuni, cu exceptia ca daca unele sunt scalari, acestia se extind la matricele constantede aceleasi dimensiuni cu celelalte si care iau valorile scalarilor corespunzatori.

2.4.2 Legi de probabilitate de tip discret clasice

Vom prezenta ın continuare legile de probabilitate de tip discret recunoscute de siste-mul Matlab, prin pachetul de programeStatistics toolbox. In paranteza, pentru fiecarelege de probabilitate sunt trecute si denumirile acceptate de sistemul Matlab. Facemobservatia ca pentru unele functii sunt acceptate si alte denumiri.

Legea lui Bernoulli

Variabila aleatoare� urmeazalegea lui Bernoulli, pe care o notam�� ���, daca aredistributia

(2.4.2) ��� �� �� �

unde� � ��� ��, � � ���

Legea lui Bernoulli modeleaza un fenomen aleator ın desf˘asurarea caruia sunteminteresati ın aparitia unui eveniment fixat�, pe care ıl vom numisucces, respectiva lui �� numit insucces. Probabilitatea obtinerii succesului este�, iar valoarea cores-punzatoare a variabilei aleatoare� este1, respectiv� � �

� � este probabilitateaproducerii insuccesului, cu valoarea0 corespunzatoare pentru�.

Functia de probabilitate este

� �� ��� � ������ � � � �� ��

Page 78: Stat_Matlab.PDF

68 Elemente de teoria probabilitatilor

Legea uniforma discreta (unid)

Variabila aleatoare� urmeazalegea uniforma discreta, notam� �� �, daca aredistributia

(2.4.3) ����������� �

unde� � �

Functia de probabilitate este

� �� �� � � �� � � � ��� �

Legea binomiala (bino)

Spunem ca variabila aleatoare� urmeazalegea binomiala, notam� �����, daca aredistributia

(2.4.4) �� �� ����������� �

unde � ����� �����������,

iar � � ��� �� si � � ���.

Variabila aleatoare� reprezinta numarul succeselor obtinute ın� repetari inde-pendente ale unui experiment.

Descoperirea legii binomiala este atribuita lui James Bernoulli si care se afla ıncarteaArs Conjectandi(1713). Pascal a considerat cazul particular� � �

� Functia de probabilitate este

� �� ����� � ���������� � � � ��

��

Remarcam faptul ca variabila aleatoare� se obtine ca suma a� variabile alea-toare independente, ce urmeaza fiecare legea lui Bernoulli�� ���. Prin urmare, putemspune si faptul ca legea lui Bernoulli�� ��� se obtine din legea binomiala� �����,pentru� � �.

Programul 2.4.3. Sa scriem un program Matlab care sa reprezinte grafic funct¸ia deprobabilitate (prin puncte si prin bare) si functia de repartitie ale legii de probabilitate� �����.

Executarea programului

Page 79: Stat_Matlab.PDF

2.4. Legi de probabilitate de tip discret 69

n = input(’n=’);p = input(’p=’); x = 0:n;f = pdf(’bino’,x,n,p);subplot(1,3,1), plot(x,f,’o’)axis([-0.5 n+0.5 0 max(p)+0.02])title(’Functia de probabilitate’)subplot(1,3,2), bar(x,f)axis([-.5 n+0.5 0 max(p)+0.02])title(’Functia de probabilitate’)f = cdf(’bino’,x,n,p);subplot(1,3,3), stairs(x,f)title(’Functia de repartitie’)axis([0 n 0 1])

pentrun=7 si p=0.3 , realizeaza graficele din Figura 2.2.

0 2 4 60

0.05

0.1

0.15

0.2

0.25

0.3

Functia de probabilitate

0 1 2 3 4 5 6 70

0.05

0.1

0.15

0.2

0.25

0.3

Functia de probabilitate

0 2 4 60

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1Functia de repartitie

Figura 2.2: Legea binomiala� �������

Legea hipergeometrica (hyge)

Spunem ca variabila aleatoare� urmeazalegea hipergeometrica si vom nota prin� ���� ���, daca are distributia

(2.4.5) �� �� ����������� �

unde� ����� ��� ������� ��� � , iar �

�� ��.

Variabila aleatoare� reprezinta numarul succeselor obtinute ın� extrageri dintr–o populatie de volum

�, fara ıntoarcere, daca numarul indivizilor cu proprietatea

cercetata este�

.

Page 80: Stat_Matlab.PDF

70 Elemente de teoria probabilitatilor

Functia de probabilitate corespunzatoare este:

� �� ���� ��� ���

������� ��� �� � � ��

��

Observatia 2.4.4.Daca se noteaza� � �� si � �

���� , adica probabilitatile ca laprima extragere sa se obtina succes, respectiv insucces, iar

� ��, atunci

� ����� ����������� �

adica se obtine distributia binomiala.

Programul 2.4.5. Pentru a ilustra afirmatia precedenta, sa scriem un program Matlabcare sa reprezinte grafic prin bare functiile de probabilitate pentru

� ���� ��� si� �����, cu� � ��

Executarea programuluiclf;M = input(’M:’);K = input(’K(K<=M):’);n = input(’n(n<=K):’)x = 0:n; p=K/M;fh = pdf(’hyge’,x,M,K,n);fb = pdf(’bino’,x,n,p);bar(x’,[fh’,fb’])colormap winter

pentruM=100, K=40 si n=10 , realizeaza graficul din Figura 2.3.

Legea lui Poisson (poiss)

Variabila aleatoare� urmeaza legea lui Poisson, vom nota�� ���, daca are

distributia

(2.4.6) �� ��� ��������������� � unde �� ��� � ��

��e��, iar��

��

Functia de probabilitate corespunzatoare este

� �� ��� � ��

��e�� � � � �� �� ���

Variabila aleatoare�, care urmeaza legea lui Poisson, numara de cate ori apareun anumit eveniment ıntr–un interval de tip, pe o distant˘a, pe o suprafata etc. Poisson

Page 81: Stat_Matlab.PDF

2.4. Legi de probabilitate de tip discret 71

0 1 2 3 4 5 6 7 8 9 100

0.05

0.1

0.15

0.2

0.25

0.3

0.35

Figura 2.3: Legea hipergeometrica� ���� ������� si legea binomiala� ��������

(1837) a aratat ca legea, care–i poarta numele, este un caz limita a legii binomiale,anume cand�� � �

, pentru� � �. Altfel spus, cand� este mare,� trebuie safie mic, adica probabilitatea producerii evenimentului considerat este mica, de aicidenumirea delege a evenimentelor rare.

Mai remarcam un rezultat cunoscut, care stabileste legatura dintre legea lui Pois-son silegea exponentiala, care va fi prezentata mai ıncolo. Anume, pe cand legea luiPoisson numara evenimentele ce apar ıntr–un interval detimp, legea exponentiala dalungimea intervalului dintre doua aparitii consecutiveale evenimentelor.

Programul 2.4.6. Vom scrie un program Matlab, care sa reprezinte grafic prin barefunctiile de probabilitate pentru� ����� si

�� ��� cu� � ��.

Avand ın vedere comportarea legii� �����, cand� ��, graficele functiilor deprobabilitate pentru cele doua legi de probabilitate trebuie sa se apropie.

Mai remarcam faptul ca legea�� ��� are o infinitate (numarabila) de valori, prin

urmare ın reprezentarea grafica pentru aceasta lege de probabilitate ne vom limita laun numar finit de valori. Anume, vom considera numai valorile ıntregi din intervalul�� � �

����� ����

, alegere care va fi justificata mai tarziu.

Programulclf;n = input(’n=’); p = input(’p=’);lambda = n*p;vi = fix(lambda-3*sqrt(lambda));vf = fix(lambda+3*sqrt(lambda));x = vi:vf;

Page 82: Stat_Matlab.PDF

72 Elemente de teoria probabilitatilor

fb = binopdf(x,n,p);fl = poisspdf(x,lambda);colormap autumnbar(x’,[fb’,fl’])

pentrun=100 si p=0.05 , realizeaza graficul din Figura 2.4.

−1 0 1 2 3 4 5 6 7 8 9 10 110

0.02

0.04

0.06

0.08

0.1

0.12

0.14

0.16

0.18

0.2

Figura 2.4: Legea binomiala� �������

��� si legea Poisson�� ���

Legea binomiala negativa (nbin)

Spunem ca variabila aleatoare� urmeazalegea binomiala negativa sau legea luiPascal, notata�� �����, daca are distributia

�� �� ����������������� � cu � ����� �

��� � �

�� ����� �iar � � ��� �� si � � �

��. Variabila aleatoare� ce urmeaza legea�� ����� repre-zinta numarul insucceselor pana la aparitia succesului de rang�, daca repetarile suntconsiderate independente.

Functia de probabilitate corespunzatoare legii�� ����� este

� �� ����� � ��� � � �� ����� � � � �� �� ���

Observatia 2.4.7. Unele tratate considera ca o variabila aleatoare� ce urmeazalegea lui Pascal reprezinta rangul repetarii la care se produce succesul cu numarul�.

Page 83: Stat_Matlab.PDF

2.5. Legi de probabilitate continue 73

Daca se are ın vedere aceasta definitie se obtine distributia

(2.4.7) �� �� ��������������� � cu � ����� �

�� ��

��

�������� �Legea geometrica (geo)

Legea geometrica, notata �� ���, se obtine ca si caz particular,� � �, al le-gii �� �����. Prin urmare variabila aleatoare� urmeaza legea�� ���, daca aredistributia

�� ���������������� � � � ��� �� � � � � � ��

si reprezinta numarul insucceselor pana la aparitiaprimului succes.Functia de probabilitate pentru legea�� ��� este

� �� ��� � ��� � � � �� �� ���

De remarcat faptul ca daca se aduna� variabile aleatoare independente, fie-care urmand legea�� ���, atunci se obtine o variabila aleatoare ce urmeaza legea�� �����.Observatia 2.4.8. Corespunzator observatiei de la legea lui Pascal, avem c˘a uneletratate considera ca o variabila aleatoare� ce urmeaza legea geometrica reprezintarangul repetarii la care se produce primul succes. Daca seare ın vedere aceastadefinitie se obtine distributia

(2.4.8) �� ����������������

2.5 Legi de probabilitate continue

Definitia 2.5.1. Fie variabila aleatoare� avand functia de repartitie� . Vom spuneca � estevariabila aleatoare (absolut) continua, daca functia de repartitie� esteabsolut continua, sau echivalent se poate reprezenta sub forma

� ��� � � �

�� � ������ pentru orice� � � �

functia � � �� �, numindu–sedensitatea de probabilitatea variabilei alea-toare�.

Page 84: Stat_Matlab.PDF

74 Elemente de teoria probabilitatilor

Definitia 2.5.2. Fie vectorul aleator� avand functia de repartitie� . Spunem ca�estevector aleator de tip continuu, daca functia de repartitie� se poate reprezentasub forma

� ��� � � ���� � � �

���� � � ����� � �

� ���� � ���� � � �

� ������� � �

��� � �� � �� �

functia� �� �� �, numindu–sedensitatea de probabilitatea vectorului aleator�.

Ca la variabilele aleatoare de tip discret si la cele de tip continuu exista clasede variabile aleatoare. Forma cea mai generala a densitat¸ii de probabilitate a uneivariabile aleatoare din clasa respectiva, ne da olege de probabilitate de tip continuu.

Functiile Matlab pdf si cdf

Distributia variabilei aleatoare� de tip continuu poate fi precizata prinfunctie den-sitate de probabilitate(pdf – probability density f unction) sau prinfunctia derepartitie (cdf – cumulativedistribution f unction).

Reprezentarile grafice ale densitatii de probabilitatesi functiei de repartitie ınMatlab se fac folosind instructiunea de tipplot .

Valorile densitatii de probabilitate� si ale functiei de repartitie� , pentru legilede probabilitate implementate prinStatistics toolbox, ca si ın cazul discret, se obtincu ajutorul functiilor Matlabpdf si respectivcdf . Trebuie ınsa sa tinem seama ca� este continua (eventual cu o multime cel mult numarabil˘a de puncte de discontinui-tate), iar� nu mai este o functie ın scara. Prin urmare, pentru asigurarea netezimiigraficelor se impune sa fie considerat un numar suficient de puncte ale graficeloracestor functii.

2.5.1 Legi de probabilitate continue clasice

Prezentam si ın acest caz legile de probabilitate de tip continue recunoscute de siste-mul Matlab, prin pachetul de programeStatistics toolbox.

Legea uniforma (unif)

Spunem ca variabila aleatoare� urmeazalegea uniforma pe intervalul��� �, si vom

nota� ��� ��, daca are densitatea de probabilitate

� �� ��� �� ������

�� �

�daca� � ��� ��

��daca� �� ��� �

Page 85: Stat_Matlab.PDF

2.5. Legi de probabilitate continue 75

Functia de repartitie pentru variabila aleatoare�, ce urmeaza legea uniforma pe in-tervalul ��� �

, este

(2.5.1) � �� ��� �� � � �

�� � �� ��� ���� ������������

��daca� �

��

� � �

� ��

�daca�

� � � ��

�� daca� ���

Denumirea de lege uniforma este legata de faptul ca dacase considera subinter-vale ale intervalului��� �

de lungimi egale, sa zicem ca au lungimea�, atunci proba-bilitatea ca variabila aleatoare� sa ia valori ıntr–un astfel de interval este�� �� � ��.Adica, aceasta probabilitate nu depinde de pozitia subintervalului, ci numai de lun-gimea lui. Intuitiv, am putea spune ca valorile ıntampl˘atoare (aleatoare) ale functiei� sunt “uniform” raspandite pe intervalul��� �

. Acest lucru nu se ıntampla la altelegi de probabilitate, cand aceste valori sunt “grupate” ˆın jurul uneia sau mai multorvalori pe care le ia variabila aleatoare�.

Programul 2.5.3. Sa reprezentam grafic densitatea de probabilitate� si functia derepartitie� pentru legea� ��� ��.

Programul Matlab care urmeazaclf;a = input(’a=’); b = input(’b=’);x = a-1:0.01:b+1;f = pdf(’unif’,x,a,b);F = cdf(’unif’,x,a,b);subplot(1,2,1), plot(x,f,’k-’)axis([a-1 b+1 -0.1 1/(b-a)+0.1])title(’Densitatea de probabilitate’)subplot(1,2,2), plot(x,F,’k-’)axis([a-1 b+1 -0.1 1.1])title(’Functia de repartitie’)

pentrua=1 si b=4 , realizeaza graficele din Figura 2.5.

Putem remarca faptul ca functia de repartitie este continua. Astfel valorile ar-gumentului� � � si � � �

ın formula (2.5.1) pot fi atasate respectiv la cazurile� ��� � �

si � ��� � �. Prin urmare intervalul pe care densitatea de probabilitateeste diferita de zero poate fi interval ınchis la ambele capete, ınchis la un capat sideschis la celalalt, respectiv deschis la ambele capete.In toate aceste cazuri vomconsidera ca avem legea uniforma de probabilitate� ��� ��.Proprietatea 2.5.4. Daca variabila aleatoare� urmeaza legea uniforma pe inter-valul ��� �, adica � ��� ��, numita si lege uniforma standard, si daca �

� �, atunci

variabila aleatoare� � �� � ��� � �

Page 86: Stat_Matlab.PDF

76 Elemente de teoria probabilitatilor

0 1 2 3 4 5−0.1

−0.05

0

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

Densitatea de probabilitate

0 1 2 3 4 5

0

0.2

0.4

0.6

0.8

1

Functia de repartitie

Figura 2.5: Legea uniforma pe����urmeaza legea uniforma � ��� ��.Legea normala (norm)

Spunem ca variabila aleatoare� urmeazalegea normala (legea Gauss–Laplace) deparametri� � � si � �

�, notam aceasta prin

� �����, daca are densitatea deprobabilitate

� �� ����� � ����� e� ������ �

pentru orice� � ��

Functia de repartitie pentrulegea normala standard� ��� �� este

� ��� � ���� � �

��e�� ��� � � � �

si se numestefunctia lui Laplace.In Matlab (si nu numai) exista o functieerf (functia eroare):

erf ��� � �

�� � �

� e�����care verifica relatia

erf ��� � �� ���� � ��

Page 87: Stat_Matlab.PDF

2.5. Legi de probabilitate continue 77

Remarcam ca functia

�� ��� � ���� � �

� e�� ��� � � � �

se numeste de asemeneafunctia lui Laplace. Intre cele doua functii Laplace existarelatia � ��� � �

��

�� ����

Folosind cele doua functii ale lui Laplace avem:

� �� ����� � � �

�� � �� ������� � ����� � �

��e� ������ ��� � �� ��

� � � ���

�� �� ��� � �

Programul 2.5.5. Vom reprezenta grafic densitatea de probabilitate� pentru legea� ����� si functia de repartitie� corespunzatoare.

Executia programului

clf;m = input(’mu=’); s = input(’sigma=’);x = m-3*s:0.01:m+3*s;f = pdf(’norm’,x,m,s);F = cdf(’norm’,x,m,s);subplot(1,2,1), plot(x,f,’k-’)title(’Densitatea de probabilitate’)subplot(1,2,2), plot(x,F,’k-’)title(’Functia de repartitie’)

pentrumu=0 si sigma=1 , produce graficele din Figura 2.6.

Observatia 2.5.6. Daca se considera variabilele aleatoare��, � � ���, indepen-dente, fiecare urmand respectiv legile normale

� ��� ����, atunci combinatia liniara

� �������

��� � �� � � � ������

�� � ��

este o variabila aleatoare ce urmeaza legea normala� �����, unde

� �������

��� � �� �������

����� �

Page 88: Stat_Matlab.PDF

78 Elemente de teoria probabilitatilor

−4 −2 0 2 40

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4Densitatea de probabilitate

−4 −2 0 2 40

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1Functia de repartitie

Figura 2.6: Legea normala standard

Legea lognormala (logn)

Variabila aleatoare� urmeazalegea lognormala de probabilitatesi vom nota aceastaprin

�� �����, daca are densitatea de probabilitate

� �� ����� � ������e� �ln ����� � � �

�� � � � � � ���

Daca� urmeaza legea lognormala de parametri� si �, atunci variabila aleatoare� � ln� urmeaza legea normala (� � e� ).

Legea gamma (gam)

Variabila aleatoare� urmeazalegea gamma, notam aceasta prin�� ��� ��, daca aredensitatea de probabilitate

� �� ��� �� � ���� ����

���e��� � � ��� �

� ��

��

unde� ��� estefunctia lui Euler de speta a doua, adica

� ��� � � �

�����e�����

� ���

Cand� ��, legea gamma tinde la legea normala. Adica, daca� urmeaza legea�� ��� ��, atunci pentru� � �, variabila aleatoare poate fi considerata ca urmandlegea

� �����, cu� � ��

si � � ���.

Page 89: Stat_Matlab.PDF

2.5. Legi de probabilitate continue 79

Programul 2.5.7. Pentru a ilustra aceasta ultima afirmatie, sa reprezentam grafic, peaceeasi figura, densitatile de probabilitate pentru cele doua legi, parametrii acestorasatisfacand relatiile precizate mai sus.

Executand programulclf;a = input(’a=’); b = input(’b=’);m = a*b; s = b*sqrt(a);x = m-3*s:0.01:m+3*s;fn = pdf(’norm’,x,m,s);fg = pdf(’gam’,x,a,b);plot(x,fn,’k-.’,x,fg,’k-’)legend(’Legea normala’,’Legea gamma’)

pentrua=100 si b=10 , acesta produce graficele din Figura 2.7.

700 800 900 1000 1100 1200 13000

0.5

1

1.5

2

2.5

3

3.5

4

4.5x 10

−3

Legea normalaLegea gamma

Figura 2.7: Legile�� ����� ��� si� ������ ����

Legea exponentiala (exp)

Variabila aleatoare� urmeazalegea exponentiala, notam��� ���, daca are densita-tea de probabilitate

� �� ��� � ��e��� � � �

�� � ���

Observam ca se obtine ca si caz particular al legii�� ��� ��, cand se ia� � � si� � �.

Page 90: Stat_Matlab.PDF

80 Elemente de teoria probabilitatilor

Legea exponentiala se aplica la modelarea evenimentelor ce apar aleator ın timp.De asemenea are aplicatii ın studiile privind durata de viata.

Legea beta (beta)

Variabila aleatoare� urmeazalegea beta, notata���� ��� ��, daca are densitatea deprobabilitate:

� �� ��� �� � �� ��� ������ �������� � � � ��� �� � �

� ��

��

unde

� ��� �� � � ��

���� �������� �

estefunctia lui Euler de spetaıntai.Este cunoscut faptul ca daca doua variabile aleatoare independente� si

�ur-

meaza legile�� ��� �� si �� ��� ��, atunci variabila aleatoare� � ���� � � � ur-meaza legea���� ��� ��.

Daca se considera legea���� ��� ��, cu� � � � ��, se obtinelegea de probabili-

late arcsin, care are densitatea de probabilitate

� ��� � ����� ������� � � ��� �� �

Legea Weibull (weib)

Variabila aleatoare� urmeazalegea lui Weibull, notam� ��� ��, daca are densitateade probabilitate

� �� ��� �� � ������e���� � � �

�� �� �

���

Legea a fost descoperita de Weibull (1939) si modeleaza rezistenta la rupere a ma-terialelor. De asemenea se pare ca modeleaza durata de viata mai bine decat legeaexponentiala. Se observa ca legea exponentiala esteun caz particular, anume se obtinecand� � �

� si� � �.

Legea Rayleigh (rayl)

Variabila aleatoare� urmeazalegea lui Rayleigh de probabilitate, notata prin� ���,daca are densitatea de probabilitate:

� �� ��� � ���e� �� � � �

�� ��

��

Page 91: Stat_Matlab.PDF

2.5. Legi de probabilitate continue 81

Se observa ca este caz particular al legii Weibull,� � �

, � � �� ����.Daca viteza unei particule ın directiile� si

�sunt doua variabile aleatoare inde-

pendente, care urmeaza legi normale de probabilitate, cu mediile zero si dispersiileegale, atunci distanta parcursa de particula pe unitatede timp urmeaza legea lui Ray-leigh.

2.5.2 Legi de probabilitate continue statistice

Prezentam legile de probabilitate de tip continuu, denumite astfel ın sistemul Matlab,prin pachetul de programeStatistics toolbox, deoarece utilizarea lor este strans legatade statistica.

Legea t (Student) (t)

Variabila aleatoare� urmeazalegea t (Student) de probabilitate, notata� ���, dacaare densitatea de probabilitate

� �� ��� � � � ���

���� �

�����

��

� ����� � � � � �

� � � (numarul gradelor de libertate).Gosset (1908) a descoperit aceasta lege de probabilitate.Nu i-a fost permis sa

publice rezultatul, drept urmare a publicat–o sub pseudonimul Student.Pentru� � �, se obtinelegea de probabilitatea a lui Cauchy.Daca��, ��, . . . ,�� sunt independente, fiecare urmand legea normala de para-

metri� � �si � � �, atunci

� � ����

� ���������

urmeaza legea� ���.Daca

�urmeaza legea� ���, atunci

� � ��� �

���� � �

urmeaza legea���� ��� ���.

Cand� ��, se ajunge la legea normala standard� ��� ��.

Programul 2.5.8. Pentru ilustrarea ultimei afirmatii, vom scrie un program care sareprezinte pe aceeasi figura graficele densitatilor de probabilitate pentru legile� ���si� ��� ��.

Prin executarea programului Matlab

Page 92: Stat_Matlab.PDF

82 Elemente de teoria probabilitatilor

clf;n = input(’n=’); x = -3:0.01:3;fn = normpdf(x,0,1); fs = tpdf(x,n);plot(x,fn,’k-.’,x,fs,’k-’)legend(’Legea normala’, ’Legea Student’)

pentrun=10 , acesta produce graficele din Figura 2.8.

−3 −2 −1 0 1 2 30

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4Legea normalaLegea Student

Figura 2.8: Legea� ���� si legea� ��� ��

Legea t (Student) necentrata (nct)

Legea t(Student) necentrata, notata� �� �����, generalizeaza legea� ��� si are den-sitatea de probabilitate

� �� ����� � � � ���

���� �

��e�� �

����

� ����� ��� ����� � � � ��

unde�

�� ���� ������

�������� �� � � � �

��

��� � ������

��

� ���

Programul 2.5.9. Programul Matlab ce urmeaza reprezinta grafic functiilederepartitie pentru legile� ��� si � �� �����:

Page 93: Stat_Matlab.PDF

2.5. Legi de probabilitate continue 83

clf;n = input(’n=’); d = input(’delta=’);x = -5:0.01:5;Fc = tcdf(x,n); Fnc = nctcdf(x,n,d);plot(x,Fc,’k-.’,x,Fnc,’k-’)legend(’Legea Student’,..

’Legea Student necentrata’,2)

Pentrun=10 si d=1 , se obtin graficele din Figura 2.9.

−5 −4 −3 −2 −1 0 1 2 3 4 50

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1Legea StudentLegea Student necentrata

Figura 2.9: Legea� �� ���� �� si legea� ����

Legea�� (chi2)

Variabila aleatoare� urmeazalegea�� saulegea Helmert–Pearson, vom nota prin�� ���, daca are densitatea de probabilitate:

� �� ��� � ��� � �

���� ��e�� � � �

��

� � � (numarul gradelor de libertate).Legea�� ��� este un caz particular al legii�� ��� ��, cand� � �

� , iar� � �

.Daca��, ��, . . . ,�� sunt independente, fiecare urmand legea normala de para-

metri� � �si � � �, atunci variabila aleatoare

�� �������

�� �

Page 94: Stat_Matlab.PDF

84 Elemente de teoria probabilitatilor

urmeaza legea�� ���, iar daca variabilele aleatoare independente� si�

urmeazarespectiv legile

� ��� �� si �� ���, atunci variabila aleatoare

� � ����

urmeaza legea� ���.Daca variabila aleatoare� urmeaza legea�� ���, atunci, pentru� � �, varia-

bila aleatoare urmeaza legea� �����, cu� � � si � � ���.

Programul 2.5.10. Pentru ilustrarea afirmatiei, scriem un program care sa repre-zinte pe aceeasi figura graficele densitatilor de probabilitate pentru legile�� ��� si�

����

��.

Prin executarea programului Matlab

clf;n = input(’n=’); s = sqrt(2*n);x = n-3*s:0.01:n+3*s;fn = normpdf(x,n,s); fchi = chi2pdf(x,n);plot(x,fn,’k-.’,x,fchi,’k-’)legend(’Legea normala’, ’Legea chi2’,2)

pentrun=10 , se obtin graficele din Figura 2.10.

0 5 10 15 20 25 30 35 40 45 500

0.01

0.02

0.03

0.04

0.05

0.06Legea normalaLegea chi2

Figura 2.10: Legea�� ���� si legea� ������

Page 95: Stat_Matlab.PDF

2.5. Legi de probabilitate continue 85

Legea�� necentrata (ncx2)

Sa notam prin��� o variabila aleatoare ce urmeaza legea�� ���. Spunem ca variabilaaleatoare� urmeazalegea�� necentrata, daca are functia de repartitie:

� �� ����� ������

����

e���� � ��� �� � ���

Programul 2.5.11. Programul Matlab ce urmeaza reprezinta grafic densitatile deprobabilitate pentru legea�� ��� si legea�� ����� necentrata corespunzatoare:

clf;n = input(’n=’); d = input(’delta=’);x = 0:0.01:15;c = chi2pdf(x,n); fnc = ncx2pdf(x,n,d);plot(x,fc,’k-.’,x,fnc,’k-’)legend(’Legea chi2’, ’Legea chi2 necentrata’)

Pentrun=4 si d=2 , se obtin graficele din Figura 2.11.

0 5 10 150

0.02

0.04

0.06

0.08

0.1

0.12

0.14

0.16

0.18

0.2Legea chi2Legea chi2 necentrata

Figura 2.11: Legea�� ����� si legea�� ���Legea F (Fisher–Snedecor) (f)

Variabila aleatoare� urmeaza legeaF (Fisher–Snedecor), notata� ���

��, daca aredensitatea de probabilitate:

� �� ����� � � � �

��

� ���� �

�� ��

� �� �� ����

������ � � �

��

Page 96: Stat_Matlab.PDF

86 Elemente de teoria probabilitatilor

��� � � (numarul gradelor de libertate)Daca variabilele aleatoare independente� si

�urmeaza legile�� ��� si �� ���,

atunci

� � ��

� �

urmeaza legea� ���

��.Daca variabila aleatoare� urmeaza legea� ���, atunci � � va urma legea

� �����.Daca variabila aleatoare� urmeaza legea

� �����, atuncitransformata lui Fi-

sher, adica� � log�� , urmeaza legea

� �����, cand��

���, unde

(2.5.2) � � ��

���

� ��� � � � ��

���

� ���

Programul 2.5.12. Programul care urmeaza reprezinta pe aceeasi figura graficeledensitatilor de probabilitate pentru transformata lui Fisher� si legea

� �����, unde� si � au valorile date prin (2.5.2).

Remarcam faptul ca densitatea de probabilitate a variabilei aleatoare� este

�� ��� � �e�

��� e�

� �����

clfm = input(’m=’); n = input(’n=’);mu = (1/n-1/m)/2; s = sqrt((1/n+1/m)/2);x = mu-3*s:0.01:mu+3*s;f1 = normpdf(x,mu,s);f2 = 2*exp(2*x).*fpdf(exp(2*x),m,n);plot(x,f1,’k-.’,x,f2,’k-’)legend(’Legea normala’,’Transformata Fisher’,2)

Pentrum=20 si n=30 , se obtin graficele din Figura 2.12.

Legea F (Fisher–Snedecor) necentrata (ncf)

Daca variabilele aleatoare independente� si�

urmeaza respectiv legile�� �����necentrata si�� ����� necentrata, atunci

� � ��

� �

urmeazalegea F(Fisher–Snedecor) necentrata, notata prin��� ���

����.

Functia de repartitie pentru variabila aleatoare legea��� ���

���� este

� �� ������� �

�����

����

e���� ����

����

�����

�� �� �

�� �

Page 97: Stat_Matlab.PDF

2.5. Legi de probabilitate continue 87

−0.8 −0.6 −0.4 −0.2 0 0.2 0.4 0.60

0.2

0.4

0.6

0.8

1

1.2

1.4

1.6

1.8

2Legea normalaTransformata Fisher

Figura 2.12: Transformata Fisher si legea normala corespunzatoare

unde� �� ��� �� estefunctia Beta incompleta de parametrii�� �

��.

Programul 2.5.13. Programul Matlab ce urmeaza reprezinta grafic densitatile deprobabilitate pentru legile

� ����� si

��� ���

����:

clf;m = input(’m=’); n = input(’n=’);d = input(’delta=’);x = 0:0.01:10.01;Fc = fpdf(x,m,n); Fnc = ncfpdf(x,m,n,d);plot(x,Fc,’k-.’,x,Fnc,’k-’)legend(’Legea F’, ’Legea F necentrata’)

Pentrum=5, n=20 si d=10 , se obtin graficele din Figura 2.13.

2.5.3 Functia Matlabnormspec

Avand ın vedere ca legea normala joaca un rol importantın teoria probabilitatilorsi ın statistica, sistemul Matlab ıi acorda la randulsau o atentie speciala. Astfel, ınsistemul Matlab de baza exista functianormspec , cu urmatoarele moduri de apel:

normspec(sp,mu,sigma)p = normspec(sp,mu,sigma)

Functianormspec reprezinta grafic densitatea de probabilitate a legii normale deparametriimu si sigma si umbreste aria marginita de dreptele perpendicularepeaxa absciselor ce trec prin punctele axei precizate prin cele doua componente alevectoruluisp , curba ce reprezinta graficul densitatii de probabilitate si axa absciselor.

Parametrulp, dupa executia functieinormspec , contine valoarea ariei umbrite,adica probabilitatea ca variabila aleatoare sa ia valoridin intervalul precizat prinsp .

Page 98: Stat_Matlab.PDF

88 Elemente de teoria probabilitatilor

0 2 4 6 8 10 120

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8Legea FLegea F necentrata

Figura 2.13: Legea��� ������ ��� si legea

� ������

Programul 2.5.14. Programul Matlab ce urmeaza va reprezenta grafic densitateade probabilitate a legii

� ����� si va umbri aria cuprinsa ıntre dreptele de ecuatii� � � si � � �(� � �

), curba ce reprezinta graficul densitatii de probabilitate si axaabsciselor.

m = input(’mu=’); s = input(’sigma=’);a = input(’a:’); b = input(’b (b>a):’);p = normspec([a,b],m,s);xlabel([’a= ’,num2str(a),’ b= ’,num2str(b)])ylabel(’Densitatea de probabilitate’)title([’Probabilitatea intre a si b : ’,num2str(p)])

Executand acest program cu valorile de intraremu=0, sigma=1 , a=-1.5 si b=2 ,se obtine graficul din Figura 2.14.

Se observa ca instructiuneatitle contine parametrulnum2str(p) , caretransforma valoarea numerica a luip ıntr–un sir de caractere.

2.5.4 Distributie marginala

Fie vectorul aleator� � ����� � �

���� si vectorul aleator�

� � ���� � � � �

���� �,unde� � � �

�, iar � � �� � � �� � �.

Definitia 2.5.15. Numimdistributie marginalaa vectorului distributia vectorului�

�.

Daca� este functia de repartitie a vectorului�, iar�������� este functia vectoruluialeator

�, numindu–sefunctie de repartitie marginala, atunci

�������� ���� � � � �

����� � � ����� � �

���� � � � �

���� � � � �

���� �

Page 99: Stat_Matlab.PDF

2.5. Legi de probabilitate continue 89

−4 −3 −2 −1 0 1 2 3 40

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4Probabilitatea intre a si b : 0.91044

Dens

itatea

de pr

obab

ilitate

a= −1.5 b= 2

Figura 2.14: Legea� ��� ��

adica, pentru obtinerea functiei de repartitie a vectorului�

� se fac sa tinda la� toateargumentele functiei de repartitie� , cu exceptia argumentelor���, . . . ,���.

Daca vectorul aleator� este de tip continuu, avand densitatea de probabilitate�,iar vectorul aleator

� are densitatea de probabilitate��������, care se numestedensitatede probabilitate marginala, atunci

�������� ���� � � � �

���� � � � ��� � � �

� �

�� � ���� � � �

�������� � �

�� � �

�� � �

��� �adica�������� se obtine integrand densitatea de probabilitate� pe���� , ın raport cutoate variabilele independente, cu exceptia variabilelor ���, . . . ,���.

2.5.5 Functie de repartitie conditionata

Fie vectorul aleator bidimensional���� �, avand functia de repartitie� .

Definitia 2.5.16. Numimfunctie de repartitie conditionataa variabilei aleatoare�de catre variabila aleatoare

�, functia�� �� � � �, data prin

�� �� �� ��� � � �� � � �� � �� � �� � ��pentru fiecare

� � � fixat.

Trebuie sa remarcam faptul ca formula de definitie se poate scrie sub forma

�� �� �� ��� � ������� �� � � �� � � � � � ��

Page 100: Stat_Matlab.PDF

90 Elemente de teoria probabilitatilor

sau

�� �� �� ��� � ������� �� � ��� � � � � � ��

� �� � � � � � �� � ������� ����� �� ���� � ���� ��� ��� �� � ��

Daca vectorul aleator���� � este de tip discret, adica are distributia data prin tabloulbidimensional

� � �� � �

��� � �

......

��� � �

���� � �

......

atunci distributia variabilei aleatoare� conditionata de�� � �� � este data prin

� �� � �� �� � �� � � � �� � �� �� � �� �� �� � �� � � ���� �� �

unde� �� � � �� � �� � ���� ��� .Remarcam de asemenea ca are loc formula

(2.5.3) ��� � � �� � ��� ���� � ������

unde���� � � �� � �� �� � �� �.Daca vectorul aleator���� � este de tip continuu, adica are densitatea de proba-

bilitate �, atunci densitatea de probabilitate a variabilei aleatoare� conditionata de�� � �� este data prin

�� �� �� ��� � � ������� ���

�pentru�� ��� �� �

Are loc formula (2.5.3) ın varianta continua:

�� ��� � � ��� �� ��� �� �� �� ����� �

Exemplul 2.5.17 (Legea normala multidimensionala). Vectorul aleator, notat prin�, urmeazalegea normala multidimensionala, notam aceasta prin

� ���� �, dacaare densitatea de probabilitate

(2.5.4)

� �� ���� � � �det��� ������ �

�������

��������

�� ������� ��� ��� �

� � � �� � � � �� �

Page 101: Stat_Matlab.PDF

2.5. Legi de probabilitate continue 91

unde�

este o matrice patratica de ordin� pozitiv definita, iar�

este inversa matri-cei

�.

Daca� � �si notam prin���� � vectorul aleator bidimensional corespunzator,

densitatea de probabilitate devine

(2.5.5)

� ����� � ���������

����

������ �� ������

�����������

��������� ������

����� �������

�����

unde����� � �si �� � � �.

Se cunoaste ca fiecare din componentele� si�

ale vectorului aleator urmeazalegea normala respectiv

� ������� si� ��� ����.

Densitatea de probabilitate conditionata se exprima ın acest fel prin:

(2.5.6) �� �� �� ��� � ������ ��� ���e� ��������������� �

unde� ��� � �� � � ��� �� ����, adica se obtine densitatea de probabilitate a legii

normale� �� ��� �����

���

.

Programul 2.5.18. Scriem ın cele ce urmeaza un program Matlab, care reprezintagrafic densitatea de probabilitate a legii normale bidimensionale.

clf, clearm1 = input(’mu1=’); m2 = input(’mu2=’);s1 = input(’sigma1=’); s2 = input(’sigma2=’);r = input(’r(-1<r<1):’);x = m1-3*s1:.2:m1+3*s1; y = m2-3*s2:.2:m2+3*s2;[X,Y] = meshgrid(x,y);Z = 1/(2*pi*s1*s2*sqrt(1-rˆ2))*exp(-1/(2*(1-rˆ2))...

*((X-m1).ˆ2/s1ˆ2-2*r*(X-m1).*(Y-m2)/(s1*s2)...+(Y-m2).ˆ2/s2ˆ2));

mesh(X,Y,Z)title(’Legea normala bidimensionala’)

Prin executarea acestui program, pentrum1=m2=0, s1=1 , s2=2 si r=-0.5 , seobtine graficul din Figura 2.15.

Programul 2.5.19. Programul Matlab care urmeaza reprezinta grafic densitatea deprobabilitate conditionata ın cazul unui vector aleator ce urmeaza legea normala bi-dimensionala.

clf, clearm1 = input(’mu1=’); m2 = input(’mu2=’);s1 = input(’sigma1=’); s2 = input(’sigma2=’);

Page 102: Stat_Matlab.PDF

92 Elemente de teoria probabilitatilor

−3−2

−10

12

3

−6

−4

−2

0

2

4

60

0.02

0.04

0.06

0.08

0.1

Legea normala bidimensionala

Figura 2.15: Legea� ����� ���������

r = input(’r(-1<r<1):’);Y(1:3) = input(’Y(trei valori):’);m = m1+s1*r*(Y-m2)/s2; s = sqrt(1-rˆ2)*s1;MM = max(m); mm = min(m);X = []; X = mm-3*s:0.01:MM+3*s;hold onfor i=1:3

P = []; P = normpdf(X,m(i),s);if i==1 plot(X,P,’k-.’), endif i==2 plot(X,P,’k-’), endif i==3 plot(X,P,’k--’), end

endtitle(’Legea normala conditionata’)

Prin executarea acestui program, pentrum1=1, m2=0, s1=1 , s2=2 , r=-0.5 siY=[-2,0,2] , se obtin graficele din Figura 2.16. Graficul marcat prin punct–linieeste pentru prima valoare a luiY, cel cu linie continua, pentru a doua valoare, iar prinlinie ıntrerupta, pentru a treia.

2.5.6 Functie de supravietuire. Functie hazard

In aplicatii tehnice si nu numai, sunt utilizate si alte functii atasate variabilelor alea-toare, pentru exprimarea mai potrivita a fenomenului aleator cercetat.

Definitia 2.5.20. Daca variabila aleatoare� are functia de repartitie� , se numeste

Page 103: Stat_Matlab.PDF

2.5. Legi de probabilitate continue 93

−2 −1 0 1 2 3 4 50

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

0.45

0.5Legea normala conditionata

Figura 2.16: Legea normala conditionata pentru� � ������

functie de supravietuireatasata variabilei aleatoare� functia definita prin:

� ��� � ��� ��� � �

�� �� � �� � �� � ��

Se observa ca daca� reprezinta durata de viata a unui individ, atunci� ���

reprezinta probabilitatea ca durata de viata sa depaseasca un prag� dat.

Definitia 2.5.21.Daca variabila aleatoare de tip continuu� are functia de repartitie� si densitatea de probabilitate�, se numestefunctie hazardsau functie de riscinstantaneuatasata variabilei aleatoare� functia definita prin:

���� � � ���

� ��� ���� ���� ��� � �� � �

Avand ın vedere definitia densitatii de probabilitateputem scrie

� ����� � � �� �� � � � ��� �de unde �

����� � � �� �� � � � ���� �� � �� �

adica ������ � � �� �� � � � �� �� � ��

Page 104: Stat_Matlab.PDF

94 Elemente de teoria probabilitatilor

Prin urmare�

��� ar reprezenta probabilitatea ca valoarea variabilei aleatoare� saramana neschimbata ıntr–un interval imediat urmator, de lungime mica, daca valoareaei a depasit pragul�.

2.6 Caracteristici numerice

2.6.1 Valoare medie. Dispersie (varianta). Covarianta

Fie variabila aleatoare� avand functia de repartitie� .

Definitia 2.6.1. Numimvaloare mediesausperanta matematica, caracteristica nu-merica

(2.6.1) � ��� � � ��� ��� ��� �

undeintegrala Stieltjesse impune sa fie absolut convergenta pentru ca valoarea me-die sa existe.

Observatia 2.6.2. Daca variabila aleatoare este de tip discret, adica are distributia

���������, atunci integrala Stieltjes se reduce la o suma, anume

� ��� ����

���� �

care exista pentru cazul cand� este variabila aleatoare simpla, altfel se impune caseria ce apare ın aceasta formula sa fie absolut convergenta.

Daca variabila aleatoare este de tip continuu, adica are densitatea de probabili-tate�, atunci

� ��� � � ��� �� �����

Mai remarcam faptul ca daca� este un vector aleator�–dimensional, iar functia� �� � � este astfel ıncat

� ��

��� sa fie o variabila aleatoare, atunci

� �� � � � ��� ���� ��� � � �

�� � � �

� ���

������� ��� �

care ın cazul continuu devine

� �� � � � ��� ��� ����� � � �

�� � � �

� ���

���� �� ���

Page 105: Stat_Matlab.PDF

2.6. Caracteristici numerice 95

Definitia 2.6.3. Numim dispersiesauvariantacaracteristica numerica atasata va-riabilei aleatoare� definita prin:

(2.6.2)�

�� ��� � � ��� �� ������

Remarcam formula de calcul�

�� ��� � � ��� � �� ����.Definitia 2.6.4. Daca se considera vectorul aleator bidimensional���� �, numimcovariantasaucorelatie, caracteristica numerica

(2.6.3) ��� ���� � � � ��� �� ���� �� �� �� �� �

respectivcoeficient de corelatie, raportul

(2.6.4) � ���� � � ��� ���� ���

�� ��� � �� �� � Observatia 2.6.5.Pentru suma unui numar finit de variabile aleatoare avem:

���

� ������

�� � �����

��� ����� ��

��� ��� ��� ���� �

iar daca variabilele aleatoare sunt independente doua cˆate doua

���

� ������

�� � �����

��� ���� �

Definitia 2.6.6. Daca avem vectorul aleator� � ����� � �

�����, numimvaloaremedie, vectorul

� ��� � �� ���� �� � �

�� ������ �respectivmatrice a covariantelor, matricea

� ��� � ���� ��� ������������ �

Observatia 2.6.7. Din cauza simetriei covariantei, avem ca matricea covarianteloreste simetrica.

Daca componentele vectorului aleator� sunt independente doua cate doua,atunci matricea covariantelor este o matrice diagonala,pe diagonala principalaaflandu–se dispersiile componentelor vectorului aleator.

Avand ın vedere extinderea naturala a valorii medii la matrice aleatoare, putemscrie: � ��� � � ��� �

� ���� �� �� �����

Page 106: Stat_Matlab.PDF

96 Elemente de teoria probabilitatilor

Teorema 2.6.8.Fie vectorul aleator� � ����� � �

����� si matricea�

, de tipul���

��, cu elemente numere reale. Daca se considera vectorul� � ��, atunci

(i) � este un vector aleator;

(ii) valoarea medie a vectorului aleator� este

� �� � � �� ��� sau � �� �� � � �������

(iii) matricea covariantelor vectorului aleator� este data prin

(2.6.5)� �� � � � � �����

Demonstratie.(i) Transformarea liniara a unui vector aleator este vector aleator.(ii) Avand ın vedere proprietati ale valorii medii, pentru o componenta a vectoru-

lui � �� �, se poate scrie

� ���� � �� ������

����� � ������

��� ���� �

de unde rezulta� �� � � �� ���

In mod analog se arata si a doua relatie.(iii) Se poate proceda ca si pentru valoarea medie, daca setine seama de pro-

prietati ale corelatiei. Se scrie succesiv:

��� ��� ���� � ���� �����

����� ������

������� ��� �

����

��� ��� �� ��� �� � �����

��� ��� �� ������

������

�����

���� ���� �� ��� �� ��� �� ����� ���

������

�����

������ ��� ������� �

de unde se obtine relatia (2.6.5).Acelasi lucru se poate obtine si prin folosirea relatiei de la punctul (ii). Anume,

Page 107: Stat_Matlab.PDF

2.6. Caracteristici numerice 97

se poate scrie:

� �� � � � ��� �� �� �� �� �

� �� ���� � ���� ��

� ���� ��� ��� �����

� � �� �� �� ���� �� �

� �������

� �� ��� �

� ���� �� �� �������

� � � ����� �

de unde se obtine din nou relatia (2.6.5).

Proprietatea 2.6.9. Daca� ��� este matricea covariantelor vectorului aleator�,

atunci aceasta este o matrice pozitiv semi–definita, adica

��� ���� � �� �� � ���

Demonstratie.Pornind din membrul drept al relatiei ce se doreste a fi demonstrata,putem scrie succesiv:

��� ���� ������

������

������ ��� ���� � ���� �����

���� �������

����� �

��

� �����

����� � ��

de unde se obtine relatia din enunt.

Proprietatea 2.6.10. Daca matricea�

este o matrice patratica pozitiv definita,adica

��� ���� ��� �� � �� � �� � �

atunci�

poate fi considerata matricea covariantelor unui vector aleator.

Demonstratie.Din algebra liniara este cunoscut faptul ca o matrice pozitiv definitaadmite decompunerea

� � ���� sau � � ���� �

unde��� � ��� � � � � fiind matricea unitate, iar� este o matrice diago-nala cu elementele numere pozitive. Putem face precizareaca diagonala matricei�contine valorile proprii ale matricei

�, iar matricea� este formata din vectorii pro-

prii ortonormati corespunzatori.

Page 108: Stat_Matlab.PDF

98 Elemente de teoria probabilitatilor

Consideram vectorul aleator� avand matricea covariantelor�. Un astfel de vec-tor aleator exista, avand ın vedere de exemplu vectorul aleator care are ca si compo-nente variabile aleatoare independente ce urmeaza fiecarelegea normala

� ��� ��.Vectorul aleator� � ��� �� va avea ca matrice a covariantelor chiar matri-

cea�

.Intradevar, daca se tine seama de relatia (2.6.5), se obtine:

� ��� � ��� � � ��� ���� �� � ��� �� �� � ���� ���

Din aceeasta succesiune de egalitati se obtine afirmatia facuta ın enunt.

Corolarul 2.6.11. Daca matricea covariantelor� ��� a unui vector aleator� este

pozitiv definita, atunci exista o transformare� �� � astfelıncat pentru noul vectoraleator� sa avem� �� � � � si

� �� � � �.

Demonstratie.Folosind descompunerea� ��� � ���� si alegand

� � �� ��,obtinem ca� � � ��

�� ��� este vectorul aleator cautat.

Pe de o parte avem

� �� � � � �� ��� �� ��� ��� � ��

Pe de alta parte� �� � � � � �� �

� ������ � � � ������ �� ��� ������� � � �� ���� � � � �

Din cel doua succesiuni de relatii se obtine ca vectorul� satisface conditiile dorite.

Corolarul 2.6.12. Daca matricea covariantelor� ��� a unui vector aleator� este

pozitiv definita, atunci variabila aleatoare�� � ��

�� ���� �� ����� �� �

� ��� �are valoarea medie� ��� � �.

Demonstratie.Cu notatiile din demonstratia corolarului precedent avem��� � ���� ��� �� � ������ � �� ����� �

Prin urmare, avem succesiv:

�� � ���� ������� ��

�� ��� � � �� �

�����

� ���

Dar avem ca� ���� � �si�

�� ���� � �, astfel ca� � �� � � ��� ���� � �, pentru

fiecare� � ���, ceea ce conduce la�

��� � �.

Page 109: Stat_Matlab.PDF

2.6. Caracteristici numerice 99

2.6.2 Functii Matlab pentru valoare medie si dispersie

Sistemul Matlab dispune de proceduri pentru calulul valorilor medii si ale dispersiilorlegilor de probabilitate implementate prinStatistics toolbox.

Pentru calculul valorilor acestor caracteristici numerice se foloseste apelul[m,v]=numef(x,par1,par2,...)

undenumef este un sir de caractere, care definesc legea de probabilitate, din careultimele patru suntstat , iar cele ce le preced sunt cele care dau numele legii.

In urma executarii instructiunii, se calculeaza matricelemsi v ale valorilor mediisi ale dispersiilor pentru legea considerata, avand parametrii precizati prin matricelepar1 , par2 , ... Aceste matrice trebuie sa fie de aceleasi dimensiuni,cu exceptia cadaca unele sunt scalari, acestia se extind la matricele constante de aceleasi dimensiunicu celelalte si care iau valorile scalarilor corespunzatori.

Valorile medii si dispersiile se calculeaza, pentru fiecare lege de probabilitate ınparte, folosindu–se formulele din Tabelul 2.1.

2.6.3 Valoare medie conditionata. Dispersie (varianta) conditionata

Fie vectorul aleator bidimensional���� � si �� �� functia de repartitie a lui�conditionata de

�.

Definitia 2.6.13. Numimvaloare medie conditionataa variabilei aleatoare� decatre

�, variabila aleatoare

� �� �� � � � ��� ���� �� �� �� � �

o realizare a variabilei aleatoare� �� �� � fiind

� �� ��� � � ��� ���� �� �� ��� � � � �

Daca vectorul aleator���� � este de tip discret, cu distributia

� � �� � �

��� � �

......

��� � �

���� � �

......

atunci variabila aleatoare� �� �� � va avea distributia

� �� �� ��� �� ��� �� �� ���

Page 110: Stat_Matlab.PDF

100 Elemente de teoria probabilitatilor

Legea Denumirea Valoarea medie si dispersia

� �� � unid � ��� � � ��

� ��� ��� � �����

� ����� bino � ��� � �� � ��� ��� � �� �����

� ���� ��� hyge � ��� � ���

� ��� ��� � �

������ �������� ��� poiss � ��� � �� �

�� ��� � �

�� ����� nbin � ��� � ������� � ��� ��� � ��������� ��� geo � ��� � ���� � �

�� ��� � ����� ��� �� unif � ��� � � �

�� �

�� ��� � �������� ����� norm � ��� � �� �

�� ��� � ���� ����� logn � ��� � e

� � � ��� ��� � e�

� �� �e�� ��� ��� �� gam � ��� � �

�� ��� ��� � �

��

��� ��� exp � ��� � �� ��� ��� � ��

���� ��� �� beta � ��� � �� � � � �� ��� � ���� � ���� ��

� ��� �� weib � ��� � �� �� � �� �� � ��

�� ��� � ��� �� �� �� � �� � �� �� ��� ��� rayl � ��� � ���

�� �

�� ��� � ���� ��

� ��� t � ��� � �� ��� ��� � �

���, � ��

� �� ����� nct � ��� � ��� � ���� �� �� �

��

�� ��� � ��� ����� � ���

�� ���� �� �� �

�, � �

�� ��� chi2 � ��� � �� �

�� ��� � ��

�� ����� ncx2 � ��� � �� �� �

�� ��� � � �� � ���� ���

�� f � ��� � ���� � � �

���

�� ��� � ���� ��������������� � � � ���� ���

�� �� ncf � ��� � ��� ��

������ � � ���

��� ��� � � �� �� �� �� �� ������������������ �

� � �Tabelul 2.1: Tabelul valorilor medii si dispersiilor

Page 111: Stat_Matlab.PDF

2.6. Caracteristici numerice 101

unde� �� ��� � ��

����� �� � �� �� � �� � ��

�������� �� � � � �

Daca vectorul aleator���� � este de tip continuu, avand densitatea de probabili-tate�, atunci o realizare a variabilei aleatoare� �� �� � este data prin

� �� ��� � � ��� ��� �� �� ����� � � �

�� � � ������� ��� �� �

Proprietatea 2.6.14.� �� �� �� � � � ���.Demonstratie.Demonstram proprietatea ın cazul continuu. Cazul discret se demon-streaza analog.

Folosind definitia valorii medii avem succesiv:

� �� �� �� � � � ��� � �� ��� �� ����� � � �

�� �� ����� ��� � � �����

�� ��� ����

� � ��� �

�� ��� � ��������� � � �

�� ��� ���� � � ����

Demonstratia se ıncheie daca se retin extremitatileacestui sir de egalitati.

Definitia 2.6.15. Fie vectorul aleator���� �. Numim dispersie conditionatasauvarianta conditionataa variabilei aleatoare� de catre

�, variabila aleatoare

��� �� �� � � �

��� �

� �� �� ��� ���

Proprietatea 2.6.16.�

�� ��� � � �� �� �� �� � � � �� �� �� �� ��

Demonstratie.Pornind de la definitia variantei si folosind proprietati ale ei, putemscrie:

��� ��� ��

��� �

� ������ � ���� �

� �� �� ��� �� �� � �� ������

����� �

� �� �� ���� ����� �� �� � �� ������

� �� ��� �� �� �� �� �� �� �� � �� ����

Vom calcula pe rand cei trei termeni din partea dreapta a acestei relatii.Pentru primul termen, daca se noteaza� � �� �

� �� �� ��� si se aplica propri-etatea valorii medii conditionate avem:

� ��� � � �� �� �� � � ���

��� �

� �� �� ��� ��� �� �

Page 112: Stat_Matlab.PDF

102 Elemente de teoria probabilitatilor

de unde se obtine ca

���� �

� �� �� ���� � � �� �� �� �� ��

Pentru al doilea termen, daca se noteaza� � � �� �� �, se poate scrie:

���� �� �� � �� ������ � �

��� �� �� � �� �� �� �� �����

� ���� �� ������ � �

�� ��� � ��� �� �� �� � �

de unde

���� �� �� � �� ������ � �

�� �� �� �� ��

A mai ramas sa aratam ca al treilea termen este zero.Fixam

� � �si avand ın vedere ca� �� ��� �� ��� � const., putem scrie:

� ��� �� �� ���� �� �� ��� �� ���� � �� �� ��� �� ���� �� �

� �� ���� �� �� ��� �� ��� �� ��� �� ��� � �

Ceea ce a mai ramas de aratat.

Exemplul 2.6.17. Sa consideram vectorul aleator���� �, care urmeaza legea nor-mala, avand densitatea data prin (2.5.5). Este cunoscutca parametrii acestei legi deprobabilitate au urmatoarele interpretari probabilistice:

�� � � ��� � �� � � �� � � ��� � ��� ��� � ��� � �

�� �� � �iar � � ���� �� este coeficientul de corelatie dintre� si

�.

Mai mult, pentru legea normala multidimensionala, avand densitatea de proba-bilitate data prin (2.5.4), se arata ca� este valoarea medie a vectorului aleator ceurmeaza legea normala multidimensionala, iar

�este matricea covariantelor.

Sa revenim la cazul bidimensional si sa constatam ca

� �� �� � �� �� ��� � �� � ���� � �� ���� �

��� �� �� � �� � ��� �� �

���

In mod analog, avem ca

� �� �� � �� �� ��� � �� � ����� �� ���� �

��� �� �� � �� � ��� �� �

���

Page 113: Stat_Matlab.PDF

2.6. Caracteristici numerice 103

Curbele de ecuatii

� ��� � �� � ���� � �� ���� �

� ��� � �� � ����� �� ���� �

se numesccurbele de regresiea lui� ın raport cu�

, respectiv a lui�

ın raport cu�.

2.6.4 Functie caracteristica

Fie variabila aleatoare� si vectorul aleator�–dimensional�.

Definitia 2.6.18. Numimfunctie caracteristicaatasata variabilei aleatoare�, res-pectiv vectorului aleator�, functia definita prin

� ��� �� e���� � �� � � �

� ��� �� �e������ ���� � �� � ��

Utilitatea functiei caracteristice este data de netezimea ei, care este superioarafunctiei de repartitie, aceasta din urma putand fi discontinua, pe cand functia ca-racteristica este uniform continua.In plus, pe baza formulei de inversiune, exista ocaracterizare completa a distributiei unei variabile aleatoare sau a unui vector aleatorcu ajutorul functiei caracteristice.

2.6.5 Momente

Definitia 2.6.19. Fie variabila aleatoare�. Numim moment (initial) si respectivmoment centratde ordin�, caracteristicile numerice

�� � � ���� � �� � � ��� �� ����� � � ��� � ����

Remarcam ca ın statistica sunt folosite ın primul rand primele patru momente.Astfel momentele centrate de ordinele doi si trei se folosesc pentru definireaasi-

metriei (skewness)� � ��

���

iar momentele centrate de ordinele doi si patru se folosescpentru definireaexcesului(kurtosis)

� � ����� sau � � ��

������

In sistemul Matlab, excesul este definit cu prima formula.

Page 114: Stat_Matlab.PDF

104 Elemente de teoria probabilitatilor

2.6.6 Mediana. Cuartile. Cuantile

Definitia 2.6.20. Fie variabila aleatoare�, care are functia de repartitie� . Numimmediana, caracteristica numerica

, care satisface conditiile

(2.6.6) � �� ��� � ��� � �� ���

Avand ın vedere proprietati ale functiei de repartitie, conditiile (2.6.6) se pot scrieechivalent sub forma

� �� � �� � ��� � ���

Daca variabila aleatoare este de tip continuu, relatiile(2.6.6) se reduc la relatia� ��� � �

�, adica� � ��� ���.

In cazul discret, folosind (2.6.6) s–ar putea ca mediana sanu fie determinata ınmod unic, de aceea se alege

ca fiind cel mai mic numar pentru care� ��� � ��

Definitia 2.6.21. Fie variabila aleatoare�, care are functia de repartitie� . Numimcuantilade ordin� � ��� ��, caracteristica numerica ��, care satisface conditiile

(2.6.7) � �� � �� � � ��

� si � �� ��� � � �

Ca si ın cazul medianei, aceste conditii se pot scrie echivalent sub forma

� ��� � �� � �� � ��� � �

care se reduce la relatia� ��� � � � , adica�� � ��� ���, ın cazul continuu.In cazul discret, cuantila�� se ia ca fiind cel mai mic numar pentru care are loc

inegalitatea� ��� � � �.Unele cuantile au denumiri speciale. Iata de exemplu, cuantila de ordin� � �

�este chiar mediana.

Daca� � ��� ��� �� , se obtin ceea ce se numesccuartile, respectivcuartila infe-

rioara, medianasi cuartila superioara.Daca� �

��, � � ���, � � ���� ,

� � ����, se obtin ceea ce poarta denumiriledecilesi respectivcentile.

2.6.7 Functia Matlabicdf

Am vazut ca pentru calculul cuantilelor este necesara inversarea functiei de repartitie.Sistemul Matlab prinStatistics toolboxdispune de functii pentru inversarea functiilorde repartitie ale legilor de probabilitate implementate.

Apelarea acestor functii se face cu una din urmatoarele forme:x = icdf(’legea’,P,p1,p2,...)x = numef(P,p1,p2,...)

Page 115: Stat_Matlab.PDF

2.6. Caracteristici numerice 105

undelegea este un sir de caractere predefinit pentru fiecare din legilede probabili-tate disponibile ınStatistics toolbox, numef este un sir de caractere din care ultimeletrei suntinv , iar cele ce le preced sunt cele care dau numele predefinit al legii deprobabilitate (ca si cele din parametrullegea ).

In urma executarii uneia din cele doua instructiuni, se calculeaza matriceax acuantilelor legii precizata prin parametriilegea , respectivnumef , corespunzatoarevalorilor date prin matriceaP si avand parametrii dati prin matricelepar1 , par2 ,...Aceste matrice trebuie sa fie de aceleasi dimensiuni, cu exceptia ca daca unele suntscalari, acestia se extind la matricele constante de aceleasi dimensiuni cu celelalte sicare iau valorile scalarilor corespunzatori.

Programul 2.6.22. Pentru a ilustra grafic modul de calcul al cuantilelor, vom daunprogram care calculeaza mediana pentru legea uniforma discreta si reprezinta graficacest lucru pentru doua valori distincte ale parametruluiN, precum si cuartilele legiinormale.

clf, clearN1 = input(’N1=’); N2 = input(’N2=’);m = input(’mu=’); s = input(’sigma=’);xu1 = 0:N1+1; yu1 = unidcdf(xu1,N1);xu2 = 0:N2+1; yu2 = unidcdf(xu2,N2);xn = m-3*s:0.01:m+3*s; yn = normcdf(xn,m,s);me1 = icdf(’unid’,1/2,N1);me2 = icdf(’unid’,1/2,N2);Q = icdf(’norm’,[1/4,2/4,3/4],m,s);subplot(3,1,1), stairs(xu1,yu1)set(gca,’Xlim’,[0,N1+1]), set(gca,’xtick’,[me1])set(gca,’xticklabel’,[me1]), hold onplot([0,me1],[1/2,1/2],’k:’,me1,1/2,’o’)plot([me1,me1],[0,1/2],’k-.’)subplot(3,1,2), stairs(xu2,yu2)set(gca,’Xlim’,[0,N2+1]), set(gca,’xtick’,[me2])set(gca,’xticklabel’,[me2]), hold onplot([0,me2],[1/2,1/2],’k:’,me2,1/2,’o’)plot([me2,me2],[0,1/2],’k-.’)subplot(3,1,3),plot(xn,yn,[Q(1),Q(2),Q(3)],[1/4,2/4,3/4],’o’)set(gca,’xtick’,[Q(1),Q(2),Q(3)])set(gca,’xticklabel’,[Q(1),Q(2),Q(3)])hold onX = [m-3*s,Q(1);m-3*s,Q(2);m-3*s,Q(3)];plot(X’,[1/4,1/4;1/2,1/2;3/4,3/4]’,’k:’)plot([Q(1),Q(1)],[0,1/4],’k-.’)plot([Q(2),Q(2)],[0,2/4],’k-.’)plot([Q(3),Q(3)],[0,3/4],’k-.’)

Executarea programului pentruN=5 si N=6, respectiv pentrumu=0si sigma=2 , areca rezulatat graficele din Figura 2.17.

Page 116: Stat_Matlab.PDF

106 Elemente de teoria probabilitatilor

30

0.5

1

30

0.5

1

−1.34898 0 1.348980

0.5

1

Figura 2.17: Medianele pentru� ��� si� ��� si cuartilele pentru� �����

Page 117: Stat_Matlab.PDF

2.7. Siruri de variabile aleatoare 107

2.6.8 Functia Matlabdisttool

Functia (comanda)disttool este un program de demonstrativ. Lansarea acestuiase face prin:

>>disttool

ın urma careia se produce o fereastra grafica interactiva (demonstrativa) privindfunctiile de repartitie (cdf ) si functiile de probabilitate (pdf ).

Fixarea (stabilirea) legii de probabilitate ın scop demonstrativ se face prin ale-gerea din meniul legilor de probabilitate situat ın parteastanga sus a ferestrei, iaruna din alternativelepdf si cdf se face folosind meniul din partea dreapta sus aferestrei. Pentru stabilirea valorilor parametrilor legii de probabilitate considerate sepoate proceda ın doua moduri. Fie prin introducerea ın ferestrele corespunzatoare alevalorilor dorite, fie prin deplasarea barelor atasate acestora. In plus, limite pentru pa-rametrii legii de probabilitate considerate pot fi precizate prin introducerea acestoraın ferestrele considerate.

Determinarea valorii functieipdf respectivcdf ıntr–un punct, se poate obtineprin introducerea argumentului functiei ın fereastra depe axa absciselor sau prindeplasarea dreptei verticale afisata pe grafic, cu ajutorul mouse–lui, pana cand aceastatrece prin punctul respectiv. Inversa functiei de repartitie (icdf ) se poate obtine deasemenea, prin introducerea valorii functiei de repartit¸ie (cdf ) ın fereastra de peaxa ordonatelor sau prin deplasarea dreptei orizontale afis¸ata pe grafic, cu ajutorulmouse–lui, pana cand aceasta trece prin punctul respectiv.

2.7 Siruri de variabile aleatoare

2.7.1 Inegalitatea lui Cebısev

Fie variabila aleatoare�, pentru care exista valoarea medie si dispersia.Inegalitatea lui Cebısev este cunoscuta sub una din formele

� ��� �� ���� � �� � �

� ��� �����

� ��� �� ���� � �� � �

�� �����

� �� � ��

Observatia 2.7.1. Daca ın inegalitatea lui Cebısev se ia� ���, unde s–a notat

� � �� �� ��� abaterea standard, atunci aceasta devine

� ��� �� ���� � ��� �

�� � ���

Page 118: Stat_Matlab.PDF

108 Elemente de teoria probabilitatilor

Astfel, pentru� � � se obtine� ��� �

� ���� � ��� � �� � �������

�ceea ce

ınseamna ca probabilitatea ca valorile lui� sa se abata de la valoarea medie� ���mai putin de trei ori abaterea standard este mai mare decat��

Observatia 2.7.2. Fie variabilele aleatoare��, � � ���, independente si identicrepartizate, avand valorile medii si dispersiile� ���� � �,

��� ���� � ��, pentru

fiecare� � ����

cu ajutorul carora construim variabila aleatoare

�� �������

� � cu � ���� � �� si�

�� ���� � ��� �

Daca se aplica inegalitatea lui Cebısev se obtine

���������

�� ����� �� � �

� �����

� ���������

�� ����� �� � ��

���

� �� � ��

Cele doua inegalitati dau evaluari ale probabilitatilor ca media aritmetica a variabile-lor aleatoare sa se abata de la valoarea medie� mai putin, respectiv mai mult, decat� �

�fixat.

2.7.2 Tipuri de convergenta

Sa consideram sirul de variabile aleatoare������� cu sirul functiilor de repartitiecorespunzatoare�������.Definitia 2.7.3. Spunem ca sirul de variabile aleatoare������� converge ın proba-

bilitate la variabila aleatoare�, si vom nota����� �, daca pentru orice� �

�,

avem ca������� ���� �� � � �� � ��

Definitia 2.7.4. Spunem ca sirul de variabile aleatoare������� converge ın repar-

titie la variabila aleatoare�, si vom nota�� ����, daca avem ca

�������� ��� � � ��� �

unde� este functia de repartitie a variabilei aleatoare�, iar limita considerataexista pentru orice punct de continuitate� � � al functiei� .

Observatia 2.7.5.Daca������, atunci�� ����. Implicatia inversa nu are loc,

dar daca� este o constanta�, atunci afirmatia inversa are loc de asemenea, adicadaca�� ��� �, pentru� � �, atunci��

��� �.

Page 119: Stat_Matlab.PDF

2.7. Siruri de variabile aleatoare 109

2.7.3 Legea numerelor mari

Sa consideram sirul de varaibile aleatoare�������.Definitia 2.7.6. Spunem ca sirul de variabile aleatoare������� urmeaza legea (sla-ba) a numerelor mari, daca pentru orice� �

�avem ca

�������������

������

� � ��

������ �������

� �� � ��

adica��

������

� � ��

������ ���� ��� �

Observatia 2.7.7.Daca variabilele aleatoare ale sirului������� sunt independentesi identic repartizate, iar� ���� � �, atunci

��������������

�� ���� �� � �� adica

��

����� ��

unde�� ��������.

Prin urmare, media aritmetica a primelor� variabile aleatoare din sirul consideratısi pierde caracterul aleator, pentru� ��.

Evident, deoarece convergenta ın probabilitate implic˘a convergenta ın repartitie,avem si

���� ��� �, dar vom vedea imediat ca exista chiar un rezultat mai bun ˆın

ceea ce priveste convergenta ın repartitie.

2.7.4 Teoreme limita

Am vazut ca legea numerelor mari este ın stransa legatura cu convergenta ın pro-babilitate, chiar si cu asa numita convergenta tare, darcare nu a fost prezentata ınsectiunea precedenta.

Teoremele limita abordeaza problematica comportarii asimptotice a sirurilor devaraibile aleatoare din perspectiva convergentei ın repartitie.

Teorema 2.7.8 (Lindeberg–Levy).Fie sirul de variabile aleatoare independente siidentic repartizate�������, pentru care se introduc notatiile

� ���� � �� ��� ���� � �� � �� �

������

��

Page 120: Stat_Matlab.PDF

110 Elemente de teoria probabilitatilor

Daca se construieste sirul de variabile aleatoare�������, cu termenul general

�� ����� ����� �

atunci �� ��� �, unde� este o variabila aleatoare ce urmeaza legea normala� ��� ��, adica

�������� ��� � ���� � �

��e�� ��� �� � ��

�� fiind functia de repartitie a variabilei aleatoare��.

Observatia 2.7.9.Teorema limita de acest tip, ın care legea de probabilitate limitaeste legea normala se numesteteorema limita centrala.

Teoremele limita au un rol aparte ın statistica, unde sunt privite ın urmatoareamaniera. Daca� este mare (� � �), atunci variabila aleatoare�� poate fi conside-rata ca urmand o lege de probabilitate cunoscuta, ın cazul teoremei precedente legeanormala

� ��� ��.Mai observam ca variabila aleatoare

����, cand� ��, urmeaza legea normala

� ��� ���

Teorema 2.7.10 (Moivre–Laplace).Daca variabila aleatoare�� urmeaza legeabinomiala, adica are distributia

��� �

� �� � ����������

�unde� �� � ���� � �

��������� � � � �

�� �

atunci �� ������� ��� ��

unde� este o variabila aleatoare ce urmeaza legea normala� ��� ��.

Rezultatul teoremei se exprima de regula sub forma

(2.7.1) ���� � ����

��� � �� � ���� � �

� e�� ���Observatia 2.7.11. Teorema limita Moivre–Laplace este o consecinta imediata aTeoremei Lindeberg–Levy, daca se are ın vedere ca variabila aleatoare

�� este suma

Page 121: Stat_Matlab.PDF

2.7. Siruri de variabile aleatoare 111

a� variabile aleatoare independente��, � � ���, fiecare urmand aceeasi lege a luiBernoulli, adica avand distibutia

��� �

� �� ����������

unde� �� ��� � ������ �

Mai remarcam faptul ca variabila aleatoare��, care urmeaza legea binomiala

� �����, poate fi privita, pentru� ��, ca urmand legea normala�

�� ������.

Observatia 2.7.12 (Regula celor trei�). Daca ın formula Moivre–Laplace se con-sidera

� � �� � �, atunci

���

� �� �

������ � �� � � ��� �� ���� � �

����

Prin urmare, rezulta ca� �� ��� � � ������ � ��

��� Deoarece, abaterea medie

patratica a variabilei aleatoare� ce urmeaza legea binomiala este� � ����, avemregula urmatoare cunoscuta sub denumirea deregula celor trei�: probabilitatea cafrecventa absoluta

�sa se abata de la valoarea medie� ��� � �� mai putin de trei

ori abaterea medie patratica este mai mare decat��

��.

Observatia 2.7.13 (Corectie de continuitate).Avand ın vedere procesul de apro-ximare a unei legi de tip discret (legea binomiala) cu una detip continuu (legeanormala), pentru obtinerea unor rezultate mai bune ın aplicarea formulei (2.7.1), seimpune aplicarea unei corectii de continuitate, data prin

� �� � ���� � � ��� � �� � ��� � �

�����

��� � � � � � ������

��� �� ��� � �

�����

��� � ���� � ������

��� ��

unde� ��� � ���� � �

��e�� ���reprezinta functia lui Laplace.

Folosind aceasta corectie de continuitate avem urmatoarele formule de aproxi-

Page 122: Stat_Matlab.PDF

112 Elemente de teoria probabilitatilor

mare:

�� ��� � � ��� � �� � ��� � � � �

�����

��� � � ��� � ������

��� ��

���� ��� � � ��� � �� � �

�� �

� � ������

��� �������� �

�����

��� ��

� ��� � �� � ��� � �

��� �

������

��� � � � �� � ������

��� �� ���

� �������

��� � ����� � ������

��� ��

Programul 2.7.14. Pentru a ilustra rezultatele Teoremei Moivre–Laplace, progra-mul Matlab care urmeaza, reprezinta grafic prin bare funct¸ia de probabilitate a legiibinomiale� ����� ımpreuna cu densitatea de probabilitate a legii normale cores-punzatoare, adica

� �� ��

����.clfn = input(’n=’); p = input(’p=’);m = n*p; s = sqrt(n*p*(1-p));x = 0:n; xx = -1:0.01:n+1;P = binopdf(x,n,p); y = normpdf(xx,m,s);bar(x,P,0.3), hold, plot(xx,y)

Executarea programului pentrun=15 si p=0.4 , produce graficul din Figura 2.18.

−2 0 2 4 6 8 10 12 14 160

0.05

0.1

0.15

0.2

0.25

Figura 2.18: Legea� �������� si legea� ������

Page 123: Stat_Matlab.PDF

Capitolul 3

Statistica descriptiva

Statistica se ocupa cu descrierea si analiza numerica a fenomenelorde masa,dezvaluind particularitatile lor de volum, structura, dinamica, conexiune, precum siregularitatile sau legile care le guverneaza.

Etapele principale ce se disting ın cercetarea statistic˘a a unui fenomen aleator sepot considera ca fiind:

a). Definirea (conceptia)obiectului studiat, care contine definirea unitatilor sta-tistice, conceperea chestionarului (ıntrebarilor), planificarea culegerii datelor.

b). Observarea fenomenului(culegerea datelor) conform criteriilor stabilite laetapa precedenta.

c). Descrierea statistica, ce cuprinde reprezentarea grafica a datelor statistice,sistematizarea acestora, precum si calcularea indicatorilor numerici pentru punereaın evidenta a unor proprietati si pentru sugerarea unor ipoteze referitoare la legilecare guverneaza fenomenul cercetat.

d). Modelarea probabilistica a fenomenului cercetat, care are ca obiectiv prin-cipal cercetarea fenomenului folosind ca instrument de lucru teoria probabilitatilorrelativ la datele statistice obtinute conform etapelor precedente.

Daca primele doua etape pot fi considerate ca preliminare,etapa a treia conducela ceea ce numimstatistica descriptiva, iar a patra etapa conduce lastatistica mate-matica saustatistica inferentiala.

Desigur, nu se poate face o delimitare exacta ıntre statistica descriptiva si sta-tistica matematica, mai mult o descriere statistica fundamentata matematic va con-duce la realizarea unei modelari a fenomenului, care pune ˆın evidenta proprietatileesentiale ale acestuia si legaturile dintre acestea. Cao componenta de baza a statis-ticii descriptive, care s-a dezvoltat ın mod impresionantodata cu explozia utilizariicalculatoarelor ın statistica, o reprezintaanaliza datelor. Printre capitolele mai im-portante ale analizei datelor amintimmetodele de clasificaresi metodele factoriale.

113

Page 124: Stat_Matlab.PDF

114 Statistica descriptiva

Pe de alta parte, statistica matematica cuprinde ca si capitole principaleteoriaselectiei, teoria estimatieisi verificarea ipotezelor statistice, strans legat deteoriadeciziilor.

Din cele prezentate putem spune castatistica descriptiva are ca obiectiv principalculegerea si clasificarea datelor statistice ın vederea descrierii numerice si grafice afenomenului cercetat.Statistica matematica elaboreaza modelul matematic, folosinddatele statistice, estimeaza parametrii modelului, stabileste metode pentru validareaipotezelor statistice, toate acestea avand la baza teoriaprobabilitatilor.

Amintim ca studiul statistic al fenomenelor economice face obiectulstatisticiieconomice, iar studiul statistic al fenomenelor ce pot constitui riscuri asigurate repre-zinta obiectulstatisticii actuariale.

3.1 Concepte de baza ale statisticii

Definitia 3.1.1. Numim colectivitate (populatie)o multime�

de elemente cerceta-ta din punct de vedere a uneia sau mai multor proprietati, elementele componentenumindu-seindivizi sauunitati statistice, iar numarul elementelor lui

�se numeste

volumul colectivitatii.

Definitia 3.1.2. Numimcaracteristicasauvariabilaa colectivitatii�

proprietatea su-pusa investigarii statistice relativa la

�. Cand o caracteristica poate fi masurata o

numimcaracteristica cantitativasaunumerica, iar daca aceasta se exprima printr-oınsusire o numimcaracteristica calitativasauatribut.

In unele tratate de statistica variabilele (caracteristicile) calitative sunt numitevariabile nominale. O clasa intermediara de variabile (caracteristici) este formata deasa numitelevariabile (caracteristici) ordinale.

Observatia 3.1.3.Daca se considera colectivitatea�

a studentilor dintr-un an de stu-diu, atunci ınaltimea, greutatea, media obtinuta la sfarsitul anului sunt caracteristicicantitative (numerice), pe cand sexul, culoarea ochilor,grupa sanguina sunt carac-teristici calitative (nominale). Un exemplu de caracteristica ordinala ar fi gradul depregatire (foarte bun, bun, satisfacator, nesatisfacator). Se observa ca relativ la o va-riabila ordinala se poate face ordonarea indivizilor, casi pentru o variabila numerica,ceea ce nu se ıntampla pentru o variabila nominala, darnu se pot face operatii aritme-tice, cum se ıntampla si la variabilele nominale, pe cand pentru o variabila numericaastfel de operatii sunt posibile.

Observatia 3.1.4. Din punct de vedere al teoriei probabilitatilor o caracteristica aunei populatii

�este o variabila aleatoare�. Scopul principal al cercetarii statistice

Page 125: Stat_Matlab.PDF

3.2. Culegerea, prezentarea si prelucrarea datelor statistice 115

este de a stabili legea de probabilitate pe care o urmeaza caracteristica�, utilizandobservatiile (datele statistice) relative la colectivitatea cercetata.

Daca avem ın vedere mai multe caracteristici��,. . . ,��, acestea reprezinta com-ponentele unui vector aleator�, iar cercetarea fenomenului aleator modelat prin�,se poate extinde si la determinarea legaturilor ce exist˘a ıntre componentele vectoruluialeator.

Definitia 3.1.5. O caracteristica � ce ia o multime cel mult numarabila de valori onumimcaracteristica de tip discret, iar daca ia valori dintr-un interval finit sau infinito numimcaracteristica de tip continuu.

Observatia 3.1.6. Daca se considera colectivitatea�

a bolnavilor externati dintr–un spital pe parcursul unei saptamani, atunci caracteristica� ce reprezinta numarulzilelor de internare este o caracteristica de tip discret,pe cand greutatea

�a bolna-

vilor externati reprezinta o caracteristica de tip continuu. Remarcam faptul ca pentrucaracteristica

�caracterul continuu este estompat prin imposibilitatea m˘asurarii e-

xacte a acestei caracteristici, de aceea, practic, se considera ca fiind de asemenea detip discret.

3.2 Culegerea, prezentarea si prelucrareadatelor statistice

Modurile de culegere (observare) a datelor statistice celemai des utilizate sunt:a).Observarea totala (exhaustiva, recensamant), cand toti indivizii colectivitatii

�sunt ınregistrati.

b). Observare partiala (sondaj, selectie), cand dupa criterii bine stabilite suntınregistrati o parte din indivizii colectivitatii

�, numitaesantionsauselectie.

c). Observare curenta, cand ınregistrarea indivizilor se efectueaza odata cu apa-ritia (producerea) lor.

d). Observarea periodica, cand ınregistrarea fenomenului se efectueaza la inter-vale de timp stabilite.

3.2.1 Generarea numerelor aleatoareın Matlab

Matematica, si prin teoria probabilitatilor si statistica matematica, printre multiplelesi larg raspanditele aplicatii, poseda, poate, una legata demodelarea matematica, carese distinge ın mod special prin vastul domeniu de aplicabilitate. Modelarea matema-tica, dupa cum spune si numele, are drept scop construirea demodele matematiceasociate unor fenomene sau sisteme pe care le ıntalnim ındiferite domenii: fizica,chimie, biologie, demografie, medicina, geografie, geologie, economie etc. Desigur,

Page 126: Stat_Matlab.PDF

116 Statistica descriptiva

astfel de modele matematice depind de niste parametri, fie aleatori, fie nealeatori.Odata modelul matematic construit se are ın vedere realizarea practica a acestuia.Dar, apare o mare problema, este acest model matematic (teoretic) construit via-bil? Avem doua alternative, sau realizam practic modelulrespectiv si urmarim cumfunctioneaza acesta (ceea ce, ın general, nu e de dorit),sau simulam functionareamodelului respectiv prin diferite particularizari ale parametrilor modelului si alegemvarianta convenabila. Daca relativ la parametrii nealeatori care intervin ın modelulteoretic nu se ridica probleme speciale, ın privinta parametrilor aleatori apare o nouaproblema, anume obtinerea valorilor acestor parametri.Deoarece parametrii aleatorisunt, din punct de vedere al teoriei probabilitatilor, variabile aleatoare, apare asadarproblema generarii de valori numerice ale acestor variabile aleatoare si care vor purtadenumirea denumere aleatoare. Desigur ca ıntr-un fel vor fi generate aceste numerealeatoare daca parametrul urmeaza, sa zicem, legea uniforma pe un anumit interval sialtfel cand urmeaza legea normala.

Deoarece pentru prezentarea notiunilor si rezultatelorteoretice ale statisticii ma-tematice sunt necesare exemplificari ale acestora, iar culegerea unor date statisticereale nu este ıntodeauna la ındemana, de multe ori vom considera numerele aleatoareca fiind date statistice carora li se vor aplica metodele cercetarii statisticii.

Putem sa amintim de asemenea ca testarea programelor pe calculator, determina-rea statistica a caracteristicilor numerice ale variabilelor aleatoare, care ne conducela metoda Monte Carlo, fac de asemenea necesara generarea numerelor aleatoare.

Metodele de generare a numerelor aleatoare se ımpart ın trei categorii:

� tabelele cu numere aleatoare (uniforme) obtinute, de exemplu, din aruncareamonedei, aruncarea zarului, jocul de ruleta, tabele matematice, tabele de re-censamant etc.

� procedeele fizice, care au la baza fenomene fizice, cum ar fi emiterea particule-lor de o sursa radioactiva, intensitatea curentului la diferite momente, zgomotulelectronic etc.

� procedeele aritmetice (analitice), care utilizeaza o formula de calcul de forma

�� � � � ��� ������ � � �

������ �� �� � �

Deoarece, de regula, se foloseste un volum mare de numere aleatoare, s-a impus ge-nerarea acestora cu ajutorul procedeelor aritmetice. Inconvenientul acestor procedeeanalitice este legat de faptul ca nu poseda caracterul strict aleator, din moment ceexista o legatura functionala ıntre acestea. Dar exista posibilitatea de a alege astfelde procedee analitice care produc siruri denumere pseudoaleatoare, foarte apropiatedin punct de vedere statistic de numerele aleatoare propriu–zise.

Page 127: Stat_Matlab.PDF

3.2. Culegerea, prezentarea si prelucrarea datelor statistice 117

In lucrarile [3] si [5] sunt prezentate proceduri pentru generarea de numere alea-toare pentru diferite legi de probabilitate.

Sistemul Matlab are implementate astfel de proceduri pentru generarea numereloraleatoare, fie prinStatistics toolbox, fie prin sistemul de baza din Matlab.

Functia random

Instructiunile prin care sunt generate numere aleatoare ce urmeaza una din legile deprobabilitate recunoscute de sistemul Matlab prinStatistics toolboxsunt de forma:

x=random(’legea’,par1,par2,...,m,n)x=numef(par1,par2,...,m,n)

undelegea este un sir de caractere predefinit pentru fiecare din legilede probabili-tate disponibile ınStatistics toolbox, numef este un sir de caractere din care ultimeletrei suntrnd , iar cele ce le preced sunt cele care dau numele predefinit al legii deprobabilitate (ca si cele din parametrullegea ).

Executarea uneia din cele doua forme ale instructiuniirandom , are ca efect ge-nerarea matriceix , cu m linii si n coloane, de numere aleatoare ce urmeaza legeade probabilitate corespunzatoare cu parametrii precizat¸i prin matricelep1 ,p2 , . . . .Aceste matrice trebuie sa aiba aceleasi dimensiuni cu matriceax , cu exceptia candunele sunt scalari, caz ın care acestea sunt extinse la matricele constante de aceleasidimensiuni cu celelalte si care iau valorile corespunzatoare scalarilor. Daca toti para-metrii legii de probabilitate sunt scalari, cand lipsesc parametriimsi n se genereazaun numar aleator, cand lipsesten, atunci trebuie camsa fie un vector cu doua compo-nente, care contine dimensiunile matriceix . Daca cel putin unul din parametrii legiiprobabilitate nu este scalar si daca parametriimsi n sunt prezenti, acestia trebuie sacoincida cu dimensiunile matricelor.

Functiile mvnrnd si mvtrnd

Functiilemvnrnd si mvtrnd sunt singurele functii dinStatistics toolbox, prin carese genereaza legi de probabilitate multidimensionale, respectiv legile normala si t(Student).

Apelurile acestor functii se pot face respectiv prin:x=mvnrnd(mu,v,m)x=mvtrnd(r,n,,m)

In primul caz, sunt generatim vectori aleatori ce urmeaza legea normala multidi-mensionala, avand vectorul valorilor mediimu si matricea covariantelorv (matricepatratica pozitiv definita). Ceimvectori aleatori generati sunt obtinuti ın matriceax ,care ın consecinta va aveamlinii, iar numarul coloanelor este dat de dimensiunea le-gii de probabilitate si care trebuie sa coincida cu lungimea vectoruluimusi cu ordinulmatricei patraticev .

Page 128: Stat_Matlab.PDF

118 Statistica descriptiva

In al doilea caz, vor fi generatimvectori aleatori ce urmeaza legea Student multi-dimensionala.

Parametrulr reprezinta matricea coeficientilor de corelatie, care este matrice po-zitiv definita avand pe diagonala principala toate elementele �. Daca aceasta ultimaconditie nu este ındeplinita, adica daca este matricea covariantelor, atunci sistemulMatlab calculeaza prima data, din matricear , matricea coeficientilor de corelatie.

Parametruln reprezinta numarul gradelor de libertate, putand fi un scalar sau unvector de lungimem.

Cei mvectori aleatori sunt obtinuti ın celemlinii ale matriceix si care are atateacoloane cat este dimensiunea legii de probabilitate.

Trebuie sa remarcam faptul ca o linie a matriceix se obtine dintr–un vector alea-tor ce urmeaza legea normala multidimensionala, avandvaloarea medie

�si matricea

covariantelor data prin parametrulr , ale carui componente se ımpart la un numaraleator ce urmeaza legea�� cun grade de libertate.

Functiile rand si randn

Sistemul Matlab de baza contine doua functii pentru generarea de numere aleatoarece urmeaza legea uniforma� ��� ��, prin rand , respectiv legea normala standard� ��� ��, prin randn .

Apelul acestor functii se poate face prin instructiuni deforma:

x=randx=rand(m)x=rand(m,n)x=randnx=randn(m)x=randn(m,n)

In urma executarii unor astfel de instructiuni este generat un numar aleator ce ur-meaza legea� ��� �� respectiv

� ��� ��, cand nu este folosit nici un argument, o ma-trice patratica de ordinmde numere aleatoare, cand apare un argument si o matricede numere aleatoare de tipul(m,n) , cand sunt folosite ambele argumente.

Unele situatii impun regasirea unui anumit sir de numerealeatoare generat prinuna din cele doua functiirand si respectivrandn . Pentru aceasta avem la dispozitieceea ce se numestestarea generatorului.

Obtinerea starii generatoruluirand si randn la un moment dat se poate faceprin:

s=rand(’state’)s=randn(’state’)

Pentru reinitializarea sau schimbarea starii generatorului, se pot utiliza urmatoareleinstructiuni:

Page 129: Stat_Matlab.PDF

3.2. Culegerea, prezentarea si prelucrarea datelor statistice 119

rand(’state’,s)randn(’state’,s)rand(’state’,0)randn(’state’,0)rand(’state’,sum(100*clock))randn(’state’,sum(100*clock))

Parametruls precizeaza starea la care urmeaza sa fie resetat generatorul, dacaacesta este0, generatorul va fi resetat la starea initiala. Daca apareparametrulsum(100*clock) , generatorul este resetat la fiecare apel ın functie de timpul cal-culatorului.

Instructiuni mostenite din Matlab 4 si Matlab 5 sunt de asemenea active:

rand(’seed’)randn(’seed’)rand(’seed’,0)randn(’seed’,0)rand(’seed’,r)randn(’seed’,r)

Functia randperm

Generarea unei permutari a primelorn numere naturale se realizeaza prin instructiu-nea

perm=randperm(n)

si va avea ca efect obtinerea vectoruluiperm ce contine o astfel de permutare.

3.2.2 Tabele statistice

Definitia 3.2.1. Numim tabel statistic (simplu, nesistematizat)un tablou ın careınregistrarile sunt trecuteın ordinea aparitiei lor.

Observatia 3.2.2.Daca observatiile statistice s-au facut relativ la� caracteristici, fieacestea��,��, � � � ,��, asupra a� indivizi, atunci tabelul statistic simplu este matri-cea� � ���� ������������, unde��� este valoarea caracteristicii�� pentru individul

�.

Definitia 3.2.3. Numimtabel statistic (sistematizat)relativ la caracteristica� de tipdiscret, tabloulın care sunt trecute valorile distincte ale caracteristicii si frecventelecu care au aparut aceste valori.

Observatia 3.2.4. Avand caracteristica� de tip discret, care ia valorile distincte�� � � � ���, pentru care s-au obtinutdatele primare�

�����

��� � �

���� , tabelul statisticsistematizat are forma

Page 130: Stat_Matlab.PDF

120 Statistica descriptiva

� ��� ���� ��...

...�� ��

unde�� estefrecventa absoluta a aparitiei valorii�� ın datele primare��� �� � ���.

Prin urmare are loc relatia����� �� � �

.

Definitia 3.2.5. Fie caracteristica de tip continuu�, care ia valori din intervalul��� ��, descompusın intervale disjuncte, numiteclase, prin punctele care satisfacrelatiile

� � �� � �� � � �� � ��

Numim tabel statistic (sistematizat)relativ la caracteristica�, tabloul ce contineclasele caracteristicii si frecventele cu care au aparut aceste clase.

Observatia 3.2.6.Daca datele primare ale caracteristicii continue�, care ia valoriın intervalul ��� ��, sunt�

��, ��

��� � � , �

��, atunci tabelul statistic sistematizat are forma

� ���� ���� ��������� ��

......

��������� ��sau

� ��� ���� ��...

...�� ��

unde �� estefrecventa absoluta a aparitiei clasei��������� printre datele primare��� �� � ���, iar�� � ���� ��� Daca se considera varianta din dreapta pentru tabelulsistematizat, se obtine aceeasi forma de tabel ca si ıncazul caracteristicii discrete.In acest fel s-a ajuns la o unificare a prezentarii prin tabele sistematizate a tipurilordiscrete si continue de caracteristici.

Observatia 3.2.7.Prin stabilirea claselor unei caracteristici continue (care pot fi delungimi egale sau nu) s-a efectuat ogruparea datelor statistice primare, si care seefectueaza si ın cazul caracteristicilor de tip discret, daca au un numar mare de valoridistincte.

Definitia 3.2.8. Numimamplitudineaclasei definita de intervalul��������� lungimeaacestui interval,�� � ��

�����.

Observatia 3.2.9.Cand amplitudinile claselor sunt egale, doua reguli de stabilire anumarului claselor sunt utilizate mai des:

� � �� ��

� lg�

(regula lui Sturges) si � � ���� � �����

������ �

Page 131: Stat_Matlab.PDF

3.2. Culegerea, prezentarea si prelucrarea datelor statistice 121

unde

���� � ����������

��� � �

���� � si ���� � ����������

��� � �

���� ��

In acest fel, din prima regula, se obtine ca

� � � ��

�si �� � �

� ��� � � ����

Cand��� �� este infinit, atunci

� � ���������

�si �� � ���� � ��� � � ��

��

Exemplul 3.2.10. Se considera un lot de�� becuri din punct de vedere al caracteris-ticii �, ce reprezinta durata de viata ın mii ore. Datele statistice obtinute sunt:

1.318 3.128 2.758 1.583 2.517 2.304 1.155 3.156 2.807 2.8793.426 1.690 3.537 2.214 2.219 2.072 2.726 1.403 2.493 1.5603.972 2.637 0.842 2.256 1.708 1.628 2.345 1.855 1.546 3.8522.128 2.465 2.316 2.262 1.962 1.802 2.230 3.460 1.493 3.0931.548 2.298 1.875 3.394 1.931 1.179 1.946 1.355 3.006 2.4551.937 1.977 2.206 1.681 1.960 3.281 2.838 2.525 1.553 2.6762.500 2.641 1.631 1.864 2.015 2.502 2.444 2.636 2.337 1.966

Vrem sa scriem tabelul sistematizat al datelor statistice, considerand clase deamplitudini egale.

Folosind regula lui Sturges avem ca numarul� al claselor poate fi calculat cuajutorul numarului

�al datelor statistice prin

� � �� ��

� lg� � �� ��

� � ��

�����de unde rezulta ca� � �. In acest fel avem ca amplitudinea� a claselor este

� � ���������

�� ��

��� � ��

����

� �����

Cand se foloseste formula

� � ���� � �����

������

pentru calculul amplitudinii claselor, se obtine� � ��

��. In acest caz numarul� alclaselor va fi

� �����

������ � ��

��� � ��

�����

���

de unde� � ��.

Page 132: Stat_Matlab.PDF

122 Statistica descriptiva

Se observa ca folosind cele doua metode s-au obtinut valori distincte pentrunumarul claselor. Aceste formule au mai mult rolul de a da o prima informatie re-lativa la numarul claselor.

In continuare vom considera numarul claselor� � ��, �� � �����

��, � � �� ��,si � � �

��.Folosind aceasta grupare se obtine tabelul sistematizat

� ������ ���� ������ ��� ���� ���� ������ ���� ������ �� ����� � � � �� � ��� ������ ��� ���� ��� ����� ��� ���� ����

sau

� ���� ���� ��� ���� ��� ��� � �� ���� � �� ��

Programul 3.2.11. In urma executarii urmatorului program Matlab

load x.dat -asciiN=length(x);ns=fix(1+10/3*log10(N));ds=(max(x)-min(x))/ns;fprintf(’ ns= %2d, ds= %4.2f\n’,ns,ds)da=8*(max(x)-min(x))/100;na=fix((max(x)-min(x))/da);a=0.7:0.3:4; n=length(a)-1;fprintf(’ na= %2d, da= %4.2f\n’,na,da)for i=1:N

for j=1:nif (a(j)<=x(i))&(x(i)<a(j+1))

cl(i)=j;end

endendt=tabulate(cl);fprintf(’ Tabelul sistematizat\n’)for j=1:n

t(j,1)=(a(j)+a(j+1))/2;fprintf(’%10.2f | %2d\n’,t(j,1),t(j,2))

end

se obtin rezultatele:ns= 7, ds= 0.45na= 12, da= 0.25

Tabelul sistematizat

Page 133: Stat_Matlab.PDF

3.2. Culegerea, prezentarea si prelucrarea datelor statistice 123

0.85 | 11.15 | 21.45 | 91.75 | 92.05 | 102.35 | 152.65 | 102.95 | 53.25 | 43.55 | 33.85 | 2

Se observa ca prima comanda citeste datele statistice din fisierulx.dat , care este unfisier ascii .

Definitia 3.2.12. Numimfrecventa relativaa clasei�� raportul �� � ���

Definitia 3.2.13. Numimfrecvente cumulate ascendente, respectivfrecvente cumu-late descendentefrecventele date de relatiile

�� ������

�� � ��� �

��

��� ��� � � � ��

��

unde�� � �si �

�� � �.

Observatia 3.2.14.Pentru frecventele relative are loc relatia�����

�� � ��

iar pentru cele cumulate au loc relatiile�� � ��� � �

, �� � �si �

�� � �.

Definitia 3.2.15. Numimdistributie statisticaa caracteristicii� tabloul de forma

����

�������� sau ������������

unde��,� � ���, sunt clasele considerate, iar�� si ��,

� � ���, sunt respectivfrecventele absolute si frecventele relative.

Exemplul 3.2.16. Consideram datele statistice de la Exemplul 3.2.10. Atunci distri-butia statistica a caracteristicii� poate fi scrisa, fie cu ajutorul frecventelor absolute,fie cu ajutorul frecventelor relative. Astfel avem ca

���

��

�� ���� ���� ���� ��

�� ���� �

��� ��

�� ��

�� ���� ��

��

� � � � �� �� �� � � � �

��

Page 134: Stat_Matlab.PDF

124 Statistica descriptiva

� � � �� �� � � �

���� ��� ��� � � � ��� ����� ��� ��� � � � ��� ���...

......

......

�� ��� ��� � � � ��� ������ ��� � � � ��� ��� � �

Tabelul 3.1: Tabel de contingenta

sau

���

��

�� ���� ���� ���� ��

�� ���� �

��� ��

�� ��

�� ���� ��

����� �

�����

��� ��

�� ���� ��

���

�� ��� ��� �

��

��

Definitia 3.2.17. Fie colectivitatea�

relativ la care sunt cercetate doua caracteristici� si

�. Numimtabel de contingenta, un tablou care contine clasele caracteristicilor

� si respectiv�

, ımpreuna cu frecventele absolute ale acestor clase.

Observatia 3.2.18.Daca pentru cele doua caracteristici� si�

avem respectiv cla-sele date prin��,

� � ���, si�� , � � ���, iar datele primare sunt date prin pere-

chile ��������� � ���

����

�� �� � �

� ���� ���� �, atunci tabelul de contingenta este Tabelul 3.1unde��� estefrecventa absoluta a aparitiei clasei��� ��� � ın datele primare���� �����,� � ���. Dupa cum se vede tabelul a fost completat cu o linie si o coloana ale carorelemente sunt date prin formulele

��� ������

��� � � � ���� ��� ������

��� � � � ����

��� ������

��� ������

��� ������

�����

��� � ��

Observatia 3.2.19.Cand caracteristicile� si�

sunt caracteristici cantitative si ıntreele exista o relatie de dependenta, tabelul de contingenta se numestetabel de corela-tie.

Exemplul 3.2.20.Un astfel de tabel de corelatie este prezentat pentru datele statisticece reprezinta��� de copii de�� ani cercetati din punct de vedere al ınaltimii�(ın centimetri) si al greutatii

�(ın kilograme). Datele au fost trecute ın tabelul de

corelatie care urmeaza

Page 135: Stat_Matlab.PDF

3.2. Culegerea, prezentarea si prelucrarea datelor statistice 125

� � �24 25 26 27 28 29 30 31 32 33 34 35 ���

126 1 1 3 1 6127 3 4 1 1 9128 1 4 5 7 1 2 1 21129 1 2 6 9 6 4 1 29130 1 7 36 17 6 2 1 70131 1 6 27 56 39 18 4 1 152132 2 10 16 26 7 2 1 64133 1 7 10 11 6 2 1 38134 1 2 4 7 3 1 18135 1 2 3 1 1 8136 1 2 2 1 6137 1 2 1 4��� 2 9 16 30 84 106 89 45 24 11 7 2 425

3.2.3 Functiiletabulate si crosstab

Obtinerea de tabele sistematizate, ın Matlab, este posibila cu ajutorul acestor douafunctii din Statistics toolbox.

Functia tabulate

Apelul functiei tabulate se poate face prin:

tabulate(x)t=tabulate(x)

undex este un vector cu valori pozitive. Prin executarea unei astfel de instructiune,se obtine pe ecran respectiv ınt un tabel statistic sistematizat avand trei coloane.Prima coloana contine valorile distincte ale luix , a doua contine frecventele absoluteale acestor valori distincte, iar ultima reprezinta frecventele relative ın procente.

Programul 3.2.21. Vom scrie un program Matlab, care genereaaNnumere aleatoarece urmeaza legea uniforma� ��� ��, dupa care construieste tabelul sistematizat, con-siderand numarul claselorn dat prin regula lui Sturges, iar clasele fiind identificateprin mijloacele lor.

cleara=input(’a:’); b=input(’b (a<b):’);N=input(’N=’); n=fix(1+10/3*log10(N));xx=unifrnd(a,b,1,N); c=a:(b-a)/n:b;for i=1:N

for j=1:nif c(j)<=xx(i) & xx(i)<c(j+1)

x(i)=j;end

endend

Page 136: Stat_Matlab.PDF

126 Statistica descriptiva

t=tabulate(x);for j=1:n

t(j,1) =(c(j)+c(j+1))/2;endfprintf(’ Clasa f frel\n’)fprintf(’ ______________________\n’)fprintf(’%7.3f %5d %8.2f%%\n’,t’)

Executarea programului, cu datele de intrarea=0 , b=5 si N=200, produce tabelsistematizat:

Clasa f frel______________________

0.313 22 11.00%0.938 27 13.50%1.563 27 13.50%2.188 32 16.00%2.813 27 13.50%3.438 23 11.50%4.063 25 12.50%4.688 17 8.50%

Functia crosstab

Apelul functieicrosstab se poate face prin:crosstab(x,y,z,...)t=crosstab(x,y,z,...)

undex , y , z , ... sunt vectori cu valori ınntregi pozitive avand aceleasi lungimi. Prinexecutarea unei astfel de instructiune, se obtine pe ecran respectiv ınt un tabel sta-tistic sistematizatt , cu atatea intrari cati parametri (vectori) exista. Daca sunt doiparametri,x si y , se obtine tabelul de contingenta.

Programul 3.2.22. Programul Matlab care urmeaza, genereazaNvectori aleatori ceurmeaza legea normala bidimensionala, dupa care construieste tabelul de corelatie cumclase ın raport cu prima variabila, respectivn clase ın raport cu a doua variabila.

clear, mu(1)=input(’m1=’); mu(2)=input(’m2=’);v(1,1)=input(’sigma1ˆ2=’);v(2,2)=input(’sigma2ˆ2=’);v(1,2)=input(’Cov(X,Y)=’); v(2,1) =v(1,2);N=input(’N=’); m=input(’m=’); n=input(’n=’);if det(v) <= 0

error(’Matricea v nu e pozitiv definita!’)endX=mvnrnd(mu,v,N); xx=X(:,1); yy=X(:,2);xmin=min(xx); xmax=max(xx);ymin=min(yy); ymax=max(yy);cx =xmin:(xmax-xmin)/m:xmax;cy =ymin:(ymax-ymin)/n:ymax;

Page 137: Stat_Matlab.PDF

3.2. Culegerea, prezentarea si prelucrarea datelor statistice 127

for k=1:Nfor i=1:m-1

if (cx(i)<=xx(k)) & (xx(k)<cx(i+1))x(k)=i;

endendif (cx(m)<=xx(k)) & (xx(k)<=cx(m+1))

x(k)=m;endfor j=1:n-1

if (cy(j)<=yy(k)) & (yy(k)<cy(j+1))y(k)=j;

endendif (cy(n)<=yy(k)) & (yy(k)<=cy(n+1))

y(k)=n;end

endt=crosstab(x,y);disp(t)

PentruN=100, mu=(5,10) , v ��2 11 3� �

m=6 si n=4 , se obtine tabelul de

corelatie:1 2 0 02 7 0 05 14 6 12 17 8 11 12 12 31 1 1 3

3.2.4 Functiilecaseread, casewrite, tblread si tblwrite

Pentru completarea tabelului de contingenta construit prin functia crosstab , sepoate face apel la aceste functii.Functia casewrite

Apelul functieicasewrite are sintaxacasewrite(obs,’file’)

si are ca efect scrierea datelor din matriceaobs de tip caracter ın fisierul cu numelefile .Functia caseread

Apelul functieicaseread are sintaxaobs=caseread(’file’)

si are ca efect citirea datelor din fisierul cu numelefile ın matriceaobs de tipcaracter.

Page 138: Stat_Matlab.PDF

128 Statistica descriptiva

Functia tblwriteSintaxa functieitblwrite este:

tblwrite(t,va,obs,’file’)

si are ca efect scrierea ın fisierul cu numelefile a matricelor va , obs de tipcaracter si a datelor din matricea numericat .

Matricele va si obs trebuie sa aiba atatea linii cate coloane, respectiv cˆate li-nii are matriceat . Liniile celor doua matrice de tip caracter vor reprezentaetichetepentru coloanele, respectiv liniile matriceit , si drept urmare vor fi asezate ın dreptulcoloanelor si liniilor corespunzatoare.Functia tblread

Sintaxa functieitblread este:

[t,va,obs]=tblread(’file’)

si are ca efect citirea din fisierul cu numelefile a matricelorva , obs de tip caractersi a datelor din matricea numericat .

Programul 3.2.23. Programul care urmeaza completeaza Programul 3.2.22, pentruobtinerea ın tabelul de contingenta si a mijloacelor claselor pentru cele doua variabile.

. . . . . . . . . . . . . .t=crosstab(x,y);fy=fopen(’ly.txt’,’w+’);for j=1:n

laby(j)=(cy(j)+cy(j+1))/2;ly=num2str(laby(j));fprintf(fy,’%s\n’,ly);

endfx=fopen(’lx.txt’,’w+’);for i=1:m

labx(i)=(cx(i)+cx(i+1))/2;lx=num2str(labx(i));fprintf(fx,’%s\n’,lx);

endva=caseread(’ly.txt’); obs=caseread(’lx.txt’);tblwrite(t,va,obs,’clase.txt’);type clase.txt, fclose(’all’);

In urma executarii programului cu aceleasi date de intrare folosite ın Progra-mul 3.2.22, prin instructiunetype este afisat pe ecran tabelul de contingenta:

7.5244 9.7152 11.906 14.09672.5895 4 6 2 03.8424 4 16 7 05.0952 1 13 12 06.348 2 12 9 17.6008 1 1 4 38.8537 0 0 1 1

Page 139: Stat_Matlab.PDF

3.2. Culegerea, prezentarea si prelucrarea datelor statistice 129

Se observa ca datele din tabelul obtinut nu sunt aceleasi cu cele obtinute prin exe-cutarea Programului 3.2.22, desi se dau aceleasi date de intrare. Lucru de asteptat,avand ın vedere ca se genereaza un alt set de numere aleatoare.

Se observa de asemenea, ın noul program, ca apar instruct¸iunile fopen ,fclose , caseread , tblwrite .

Instructiuneafopen este folosita pentru deschiderea fisierelorlx.txt sily.txt , care vor contine etichetele claselor celor doua variabile. Acestea suntdate de mijloacele claselor si sunt transformate ın siruri de caractere prin comandanum2str . Parametrul’w+’ , are ca efect crearea unui fisier nou sau actualizareaunuia deja existent, dupa ce a fost anulat continutul sau, ın vederea scrierii sau citiriiın respectivul fisier. Evident instructiuneafclose este folosita ın vederea ınchideriifisierelor.

Prin instructiunilecaseread sunt citite etichetele claselor din fisierelelx.txtsi ly.txt , care apoi sunt folosite pentru scrierea acestora ın fisierul clase.txt ,cu ajutorul comenziitblwrite , ımpreuna cu elementele tabelului de contingenta.

3.2.5 Reprezentari grafice

Definitia 3.2.24. Numimdiagrama prin batoane (bare)a unei distributii statistice�de tip discret, reprezentarea grafica ıntr-un sistem de axe rectangulare a segmentelor(batoanelor) date prin

� ��� ��� � � � � � � �� �, � � ���, � ��

fiind un factor deproportionalitate, iar�� este frecventa absoluta a valorii ��.

Definitia 3.2.25. Numimdiagrama cumulativa (ascendenta)a unei distributii sta-tistice � de tip discret, linia poligonala care uneste punctele de coordonate��������, ��������, ��� �����, ��� �����, ��� ����� �

� � �, ��� �����, unde�� estefrecventa cumulata (ascendenta) atasata valorii ��, iar � �

�este un factor de

proportionalitate.

Definitia 3.2.26. Numimhistogramaunei distributii statistice� de tip continuu,diagrama obtinuta prin construirea de dreptunghiuri avand drept baze claseledistributiei statistice siınaltimile astfel considerateıncat ariile dreptunghiurilor safie proportionale cu frecventele claselor.

Observatia 3.2.27. Cand clasele distributiei statistice sunt de amplitudini egale,atunci ınaltimile dreptunghiurilor histogramei sunt proportionale cu frecventeleclaselor. Daca factorul de proportionalitate este

�� , atunci se obtine histogramafrecventelor relative.

Se stie ca aria delimitata de curba ce reprezinta graficul unei densitati de pro-babilitate si axa absciselor este 1. Din acest motiv, este de preferat ca factorul deproportionalitate ın construirea histogramei frecvent¸elor relative sa fie astfel ales ıncıt

Page 140: Stat_Matlab.PDF

130 Statistica descriptiva

aria totala a dreptunghiurilor histogramei sa fie de asemenea 1. Se verifica usor cadaca

�este volumul datelor, iar clasa��������� are amplitudinea

�� � ��

�����,

pentru� � ���, atunci functia ın scara ce delimiteaza aceste dreptunghiuri este data

prin: �

� ��� � �����

� � � ��������� � � � ����

Exemplul 3.2.28. Daca se considera datele statistice din Exemplul 3.2.10,si avandın vedere sistematizarea acestora, atunci histograma frecventelor absolute este pre-zentata ın Figura 3.1.

0.4 0.7 1 1.3 1.6 1.9 2.2 2.5 2.8 3.1 3.4 3.7 4 4.30

2

4

6

8

10

12

14

16

Figura 3.1: Histograma frecventelor absolute

Metoda ferestrei mobile

Histograma frecventelor relative a distributiei statistice reprezinta o aproximare des-tul de rudimentara a graficului densitatii de probabilitate a caracteristicii�. O ame-liorare a acestei aproximari se obtine daca se aplicametoda ferestrei mobile.

Metoda ferestrei mobile consta ın construirea clasei� � �

��� � �

��,��

�, pen-

tru fiecare� � ��� ��, si determinarea frecventei�� a acestei clase, cu ajutorul careiase obtine curba data prin

� ��� � ���� � � � ��� ���

Daca se considera functia indicatoare�

a intervalului��

�� ���, adica

(3.2.1)� ��� �

����� daca � � ��

�� ���,

��daca � �� ��

�� ���,

Page 141: Stat_Matlab.PDF

3.2. Culegerea, prezentarea si prelucrarea datelor statistice 131

atunci �

� ��� � ���������

�� ����� �

Pentru a obtine o forma mai regulara pentru

� se pot considera si alte tipuri defunctie nucleu

�, care de regula este o densitate de probabilitate simetrica.

Mai des se utilizeazanucleul Gaussian

(3.2.2)� ��� � ����e�� � � � � �

saunucleul parabolic(Epanechnikov)

(3.2.3)� ��� �

�����

������� ��

� � �daca�� � � ��,

��daca�� � � ��.

Alte nuclee ce s–ar putea folosi sunt:

� ��� ����������

������ �daca�� � � �,

��daca�� � � ��

(3.2.4)

� ��� ������ ��� ����� daca

� � � � �,��

daca�� � � �,(3.2.5)

� ��� ������ �� � daca�� � � �,

��daca�� � � �.

(3.2.6)

Programul 3.2.29. Programul ce urmeaza genereazaNnumere aleatoare ce urmeazalegea normala

� ��� ��, dupa care, folosind acelasi pash pozitiv, reprezinta graficfunctia

� ımpreuna cu densitatea de probabilitate a legii normale,pentru fiecare dincele sase nuclee, mai sus definite.

Calculul valorilor celor sase nuclee se face cu urmatoarea functie Matlab:function y = K(k,x)switch kcase 1

y=(abs(x)<1/2);case 2

y=1/(sqrt(2*pi))*exp(-x.ˆ2/2);case 3

y=(abs(x)<sqrt(5));

Page 142: Stat_Matlab.PDF

132 Statistica descriptiva

y=3/(4*sqrt(5))*(1-x.ˆ2/5).*y;case 4

y=(abs(x)<1);y=15/16*(1-x.ˆ2).ˆ2.*y;

case 5y=((x>0)&(x<1));y=(1+cos(2*pi*x)).*y;

case 6y=(abs(x)<1); y=abs(x).*y;

otherwiseerror(’Eroare’)

end

iar programul Matlab este

clf,clearN=input(’N=’); h=input(’h=’);X=randn(1,N); x=-3:0.01:3;n=length(x); p=pdf(’norm’,x,0,1);for ka=1:6s=zeros(1,n);for i=1:N

s=s+K(ka,(x-X(i))/h);endf=s/(N*h);subplot(3,2,ka), plot(x,f,’-’,x,p,’--’)end

In urma executarii programului, cu valorileN=500 si h=1 , se obtin graficele dinFigura 3.2.

Definitia 3.2.30. Numimpoligonul frecventeloral unei distributii statistice� de tipcontinuu, poligonul obtinut prin unirea punctelor de coordonate��� ������, � � ���,unde�� este factor de proportionalitate, iar�� este frecventa clasei��.

Exemplul 3.2.31.Daca se considera datele statistice din Exemplul 3.2.10,si avand ınvedere sistematizarea acestora, atunci poligonul frecventelor absolute este prezentataın Figura 3.3.

Definitia 3.2.32. Numimdiagrame integrale (cumulative)ale frecventelor cumulateascendente, respectiv descendente, relative la distribut¸ia statistica� de tip continuu,liniile poligonale obtinute prin unirea punctelor de coordonate��� ����, � � ��

�,si respectiv��� �� ��� � � � ��

�.

Exemplul 3.2.33.Daca se considera datele statistice din Exemplul 3.2.10,si avand ınvedere sistematizarea acestora, atunci diagramele integrale ale frecventelor cumulate(ascendente si descendente) sunt prezentate ın Figura 3.4.

Page 143: Stat_Matlab.PDF

3.2. Culegerea, prezentarea si prelucrarea datelor statistice 133

−4 −2 0 2 40

0.1

0.2

0.3

0.4

−4 −2 0 2 40

0.1

0.2

0.3

0.4

−4 −2 0 2 40

0.1

0.2

0.3

0.4

−4 −2 0 2 40

0.1

0.2

0.3

0.4

−4 −2 0 2 40

0.1

0.2

0.3

0.4

−4 −2 0 2 40

0.1

0.2

0.3

0.4

Figura 3.2: Grafice pentru

� ���

Pentru trasarea diagramelor integrale, ın tabelul urmator calculam frecventele ab-solute ascendente si respectiv descendente, conform formulelor

�� ������

�� � ��� �

��

��� ��� � � � ��

��

� ����� ���� ���� ����� ����� ����� ����� ����� ����� ������ �������� � � � �� � �� � � � � � �� � �� � �� �� �� �� � �� � � �� � �

Definitia 3.2.34. Numimnor statisticatasat caracteristicilor� si�

, punctele dinplan obtinute prin reprezentarea grafica a datelor primare���� �����, � � ��� .

Observatia 3.2.35. Norul statistic este utilizat pentru observarea formei legaturiifunctionale care exista ıntre cele doua caracteristici. Amintim cateva legaturi maides ıntalnite:

� ��� � �� � � � ��� � � ��

� ���� � � �

���� � � ��

Page 144: Stat_Matlab.PDF

134 Statistica descriptiva

0.55 0.85 1.15 1.45 1.75 2.05 2.35 2.65 2.95 3.25 3.55 3.85 4.150

2

4

6

8

10

12

14

16

Figura 3.3: Poligonul frecventelor absolute

� ���� � � �

��� �

�� ��

��� ���� � �� � �� � � ��

�� ��� � � �

� ���

�� � �� ��

�� � � �

Daca legatura liniara� � �� � �

este usor de observat din norul statistic, pen-tru celelalte se ıncearca liniarizarea. De exemplu, dac˘a

� � ���, prin logaritmare seajunge la��� � � ��� �

� � ��� �. Se noteaza��� � � �, ��� � � �, ��� � � � si seobtine legatura liniara� � �� ��, pentru���� si ��� � . Pentru aceasta se va repre-zenta grafic norul statistic dat de punctele���� ��� � ��� ����, � � ��� . Daca puncteledin acest nor statistic sunt situate ın jurul unei drepte, atunci se poate considera calegatura dintre� si

�este de forma

� � ���

.

3.2.6 Functii Matlab pentru reprezentarea grafica a datelor statistice

Sistemul Matlab, atat prin sistemul de baza, cat si prinStatistics toolbox, dispune defunctii pentru reprezentarea grafica a datelor statistice.

Cazul discret

Daca ın cercetare se considera o caracteristica (variabila) � de tip discret, functiileMatlab, deja prezentate,bar si stairs se pot utiliza cu succes.

Page 145: Stat_Matlab.PDF

3.2. Culegerea, prezentarea si prelucrarea datelor statistice 135

0.4 0.7 1 1.3 1.6 1.9 2.2 2.5 2.8 3.1 3.4 3.7 4 4.30

10

20

30

40

50

60

70

Figura 3.4: Diagramele integrale ale frecventelor absolute

Pentru exemplificarea modului de utilizare a acestor functii Matlab, vom scriedoua functii Matlab pentru construirea diagramei prin batoane si respectiv pentruconstruirea diagramei cumulative ascendente.

Functia 3.2.36. Functia Matlab pe care o scriem, va genera N numere aleatoare ceurmeaza o lege de probabilitate de tip discret, va construidiagrama prin batoane pen-tru datele astfel obtinute, iar pe aceeasi figura va reprezenta, pentru comparatie, totprin batoane, functia de probabilitate a legii de probabilitate considerate. Pentru ovizualizare corecta a comparatiei, se impune, fie amplificarea functiei de probabili-tate cu factorulN, fie ımpartirea frecventelor distributiei statistice cuN, adica princonsiderarea frecventelor relative.In cele ce urmeaza vom considera prima varianta.

function diag1(N,lege)% Functia diag1 produce diagrama prin batoane% N - reprezinta volumul datelor ce urmeaza a fi generate% lege - reprezinta denumirea Matlab a legii de probabilitat eclf, colormap springswitch legecase ’unid’

n = input(’n (parametrul legii uniforme discrete):’);x = random(lege,n,1,N);t = tabulate(x);P =N*pdf(lege,t(:,1),n);bar(t(:,1),[t(:,2),P])legend(’Frecvente observate’, ’Frecvente teoretice’,1)return

case ’bino’n = input(’n=’); p = input(’p=’);x = random(lege,n,p,1,N);

Page 146: Stat_Matlab.PDF

136 Statistica descriptiva

t = tabulate(x+1);P =N*pdf(lege,t(:,1)-1,n,p);

case ’hyge’M = input(’M=’); K = input(’K=’);n = input(’n=’);x = random(lege,M,K,n,1,N);t = tabulate(x+1);P =N*pdf(lege,t(:,1)-1,M,K,n);

case ’poiss’lambda = input(’lambda=’);x = random(lege,lambda,1,N);t = tabulate(x+1);P =N*pdf(lege,t(:,1)-1,lambda);

case ’nbin’r = input(’r=’); p = input(’p=’);x = random(lege,r,p,1,N);t = tabulate(x+1);P =N*pdf(lege,t(:,1)-1,r,p);

case ’geo’p = input(’p=’);x = random(lege,p,1,N);t = tabulate(x+1);P =N*pdf(lege,t(:,1)-1,p);

otherwiseerror(’Lege discreta necunoscuta’)

endbar(t(:,1),[t(:,2),P])legend(’Frecvente observate’, ’Frecvente teoretice’,1)

Apelul functieidiag1 se face prin

>>diag1(N,’lege’)

unde valorile pentruN si lege , fie ca sunt precizate ın acest apel, fie sunt precizateınainte. De exemplu, comanda

>>diag1(50,’poiss’)

are ca efect apelul functiei pentru legea lui Poisson, iar pe ecran se va cere introduce-rea parametruluilambda , dupa care pe ecran va fi reprezentat graficul din Figura 3.5,ın cazul ın carelambda=7 . Sa remarcam totusi ca la un nou apel, cu aceeasi para-metri, graficul difera, deoarece sunt generate alte numerealeatoare.

Functia 3.2.37. Urmatoarea functie Matlab, va genera N numere aleatoare ce ur-meaza o lege de probabilitate de tip discret, va construi diagrama cumulativa as-cendenta pentru datele astfel obtinute, iar pe aceeasi figura va reprezenta, pentrucomparatie, functia de repartitie a legii de probabilitate considerate. Pentru o vizua-lizare corecta a comparatiei, se impune, fie amplificarea functiei de repartitie cu fac-torul N, fie ımpartirea frecventelor cumulate ale distributiei statistice cuN, adica princonsiderarea frecventelor relative cumulate.In cele ce urmeaza vom considera a douavarianta.

Page 147: Stat_Matlab.PDF

3.2. Culegerea, prezentarea si prelucrarea datelor statistice 137

0 2 4 6 8 10 12 14 16 180

1

2

3

4

5

6

7

8

9Frecvente observateFrecvente teoretice

Figura 3.5: Legea�� ���

function diag2(N,lege)% Functia diag2 produce diagrama cumulativa% N - reprezinta volumul datelor generate% lege - reprezinta denumirea legii de probabilitateclfswitch legecase ’unid’

n=input(’n (parametrul legii uniforme discrete):’);x=random(lege,n,1,N);t=tabulate(x);xx=[t(1,1)-1;t(:,1);t(end,1)+1];cf=[0;cumsum(t(:,2));N]/N;P=cdf(lege,xx,n);stairs(xx,cf,’k-’),hold on,stairs(xx,P,’k-.’),return

case ’bino’n=input(’n=’); p=input(’p=’);x=random(lege,n,p,1,N);t=tabulate(x+1);xx=[t(1,1)-2;t(:,1)-1;t(end,1)];cf=[0;cumsum(t(:,2));N]/N;P=[0;cdf(lege,t(:,1)-1,n,p);1];

case ’hyge’M=input(’M=’); K=input(’K=’);n=input(’n=’);x=random(lege,M,K,n,1,N);t=tabulate(x+1);xx=[t(1,1)-2;t(:,1)-1;t(end,1)];

Page 148: Stat_Matlab.PDF

138 Statistica descriptiva

cf=[0;cumsum(t(:,2));N]/N;P=[0;cdf(lege,t(:,1)-1,M,K,n);1];

case ’poiss’lambda=input(’lambda=’);x=random(lege,lambda,1,N);t=tabulate(x+1);xx=[t(1,1)-2;t(:,1)-1;t(end,1)];cf=[0;cumsum(t(:,2));N]/N;P=[0;cdf(lege,t(:,1)-1,lambda);1];

case ’nbin’r=input(’r=’); p=input(’p=’);x=random(lege,r,p,1,N);t=tabulate(x+1);xx=[t(1,1)-2;t(:,1)-1;t(end,1)];cf=[0;cumsum(t(:,2));N]/N;P=[0;cdf(lege,t(:,1)-1,r,p);1];

case ’geo’p=input(’p=’);x=random(lege,p,1,N);t=tabulate(x+1);xx=[t(1,1)-2;t(:,1)-1;t(end,1)];cf=[0;cumsum(t(:,2));N]/N;P=[0;cdf(lege,t(:,1)-1,p);1];

otherwiseerror(’Lege discreta necunoscuta’)

endstairs(xx,cf,’k-’),hold on,stairs(xx,P,’k-.’)

Apelul functiei diag2 se face analog apelului functieidiag1 prezentata ınFunctia 3.2.36:

>>diag2(N,’lege’)

De exemplu, comanda

>>diag2(50,’bino’)

are ca efect apelul functiei pentru legea binomiala, iar pe ecran se vor cere introdu-cerea parametrilorn si p, dupa care pe ecran va fi reprezentat graficul din Figura 3.6,ın cazul ın caren=7 si p=0.4 . Diagrama cumulativa este reprezentata prin line con-tinua, iar functia de repartitie teoretica prin linie-punct. Si aici remarcam ca la unnou apel, cu aceeasi parametri, graficul difera, deoarecesunt generate alte numerealeatoare.

Cazul continuu

Reprezentari grafice pentru distributia statistica a unei caracteristici (variabile) de tipcontinuu se obtin, fie prin utilizarea functieiplot si bar , fie prin functiilehist ,

Page 149: Stat_Matlab.PDF

3.2. Culegerea, prezentarea si prelucrarea datelor statistice 139

−1 0 1 2 3 4 5 6 70

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Figura 3.6: Legea� �������histc . Remarcam faptul cahist si histc sunt functii specifice sistemului debaza Matlab.

Functia hist

Modurile de apel ale functieihist sunt:

hist(y)hist(y,nb)hist(y,x)n=hist(y)n=hist(y,nb)n=hist(y,x)[n,x]=hist(y)[n,x]=hist(y,nb)

Primele trei forme au ca efect reprezentarea grafica a histogramei corespunzatoaredatelor continute de vectoruly . Parametrulnb reprezinta numarul claselor de ampli-tudini egale, iar daca acesta lipseste, se consideranb=10 . Amplitudinea acestor claseeste obtinuta prin ımpartirea lungimii intervaluluidefinit prin valoarea minima si va-loarea maxima ale componentelor vectoruluiy la nb . Cand se utilizeaza parametrulx , acesta trebuie sa contina mijloacele claselor.

Celelalte forme nu produc reprezentari grafice pentru histograme, ci doar calcu-leaza frecventele absolute si respectiv mijloacele claselor ın vectoriin si x , care aulungimea data prinnb .

Page 150: Stat_Matlab.PDF

140 Statistica descriptiva

Toate formele accepta parametruly ca fiind matrice, caz ın care operatia se exe-cuta pentru fiecare coloana a matricei.

Functia histc

Apelul functieihistc se poate face prin:n=histc(y,a)[n,nb]=hist(y,a)

care au ca efect, pentru datele vectoruluiy , obtinerea ınn a frecventelor claselorprecizate prin componentele vectoruluia, care se impune a fi ordonate crescator.Valorile lui y care sunt ınafara componentelor luia nu sunt luate ın considerare.De aceea e de dorit ca sa fie folosite valorile-inf si inf pentru a fi incluse toatevalorile lui y .

Dacay este o matrice, atunci functia opereaza pentru fiecare coloana ın parte.Parametrulnb va contine numerele de ordine ale claselor ın care au intrat fiecare

din elementele luiy . Pentru elementele care nu au fost clasificate se obtine valoarea0.Sa remarcam ca Figura 3.1, Figura 3.3 si Figura 3.4 au fost realizate, respectiv cu

programele Matlab:clear, clf, load x.dat -ascii2N=length(x);a=0.7:0.3:4; n=length(a)-1;for j=1:n

mij(j)=(a(j)+a(j+1))/2;endfr=histc(x,a); fr=fr(1:end-1);bar(mij,fr,1)axis([0.4 4.3 0 16])set(gca,’xtick’,[0.4:0.3:4.3]), colormap spring

clear, clf, load x.dat -asciiN=length(x);a=0.7:0.3:4; n=length(a)-1;for j=1:n

mij(j)=(a(j)+a(j+1))/2;endfr=histc(x,a); fr=fr(1:end-1);plot(mij,fr,’k-o’)axis([0.55 4.15 0 16])set(gca,’xtick’,[0.55:0.3:4.15]), grid on

clear, clf, load x.dat -asciiN=length(x);a=0.7:0.3:4; n=length(a)-1;fr=histc(x,a); fr=fr(1:end-1);FA=[0;cumsum(fr)], FD=N-FA,

Page 151: Stat_Matlab.PDF

3.2. Culegerea, prezentarea si prelucrarea datelor statistice 141

plot(a,FA,’k-o’,a,FD,’k-o’)axis([0.4 4.3 0 70])set(gca,’xtick’,[0.4:0.3:4.3]), grid on

care utilizeaza functiilehistc si bar .

Functia 3.2.38. Urmatoarea functie Matlab, va genera N numere aleatoare ce ur-meaza o lege de probabilitate de tip continuu si va construi histograma pentru dateleastfel obtinute.Intr–o figura alaturata se va construi histograma folosind functia bar,ımpreuna cu densitatea de probabilitate a legii de probabilitate considerate. Pentru ovizualizare corecta a comparatiei, se impune, ımpartirea frecventelor absolute cuNh,undeh este amplitudinea claselor.

function hist0(N,lege)% Functia hist0 produce histograma% N - reprezinta volumul datelor generate% lege - reprezinta denumirea legii de probabilitateclf, colormap springn=fix(1+10/3*log10(N));switch legecase ’unif’

a=input(’a:’); b=input(’b(a<b):’);x=random(lege,a,b,1,N);[f,c]=hist(x,n); h=c(2)-c(1);t=c(1)-h:0.01:c(end)+h;y=pdf(lege,t,a,b);

case ’norm’mu=input(’mu=’); s=input(’sigma=’);x=random(lege,mu,s,1,N);[f,c]=hist(x,n); h=c(2)-c(1);t=c(1)-h:0.01:c(end)+h;y=pdf(lege,t,mu,s);

case ’logn’mu=input(’mu=’); s=input(’sigma=’);x=random(lege,mu,s,1,N);[f,c]=hist(x,n); h=c(2)-c(1);t=c(1)-h:0.01:c(end)+h;y=pdf(lege,t,mu,s);

case ’gam’a=input(’a=’); b=input(’b=’);x=random(lege,a,b,1,N);[f,c]=hist(x,n); h=c(2)-c(1);t=c(1)-h:0.01:c(end)+h;y=pdf(lege,t,a,b);

case ’exp’mu=input(’mu=’);x=random(lege,mu,1,N);[f,c]=hist(x,n); h=c(2)-c(1);t=c(1)-h:0.01:c(end)+h;y=pdf(lege,t,mu);

Page 152: Stat_Matlab.PDF

142 Statistica descriptiva

case ’beta’a=input(’a=’); b=input(’b=’);x=random(lege,a,b,1,N);[f,c]=hist(x,n); h=c(2)-c(1);t=c(1)-h:0.01:c(end)+h;y=pdf(lege,t,a,b);

case ’weib’a=input(’a=’); b=input(’b=’)x=random(lege,a,b,1,N);[f,c]=hist(x,n); h=c(2)-c(1);t=c(1)-h:0.01:c(end)+h;y=pdf(lege,t,a,b);

case ’rayl’b=input(’b=’);x=random(lege,b,1,N);[f,c]=hist(x,n); h=c(2)-c(1);t=c(1)-h:0.01:c(end)+h;y=pdf(lege,t,a);

otherwiseerror(’Lege continua necunoscuta’)

endsubplot(1,2,1), hist(x,n)subplot(1,2,2), bar(c,f/(N*h),1)hold on, plot(t,y,’k-’)

Apelul functieihist0 se face prin>>hist0(N,’lege’)

De exemplu, comanda>>hist0(500,’norm’)

are ca efect apelul functiei pentru legea normala, iar pe ecran se va cere introdu-cerea parametrilormu si sigma , dupa care pe ecran va fi reprezentat graficul dinFigura 3.7, ın cazul ın caremu=0 si sigma=1 .

Functia scatter

Sistemul Matlab este prevazut cu functiascatter pentru reprezentarea norului sta-tistic ın cazul bidimensional. Apelul functiei se face prin:

scatter(x,y)scatter(x,y,s)scatter(x,y,s,c)scatter(x,y,s,c,m)scatter(x,y,s,c,m,’filled’)

Efectul executarii unei astfel de instructinui este producerea norului statistic precizatprin vectoriix si y , care au aceeasi lungime.

Parametrul optionals specifica marimea marcajelor (cerculete) punctelor noru-lui. Acesta poate sa fie un scalar, ın care caz toate marcajele vor avea aceleasi marimi

Page 153: Stat_Matlab.PDF

3.2. Culegerea, prezentarea si prelucrarea datelor statistice 143

−4 −2 0 2 40

20

40

60

80

100

120

140

−4 −2 0 2 40

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

0.45

Figura 3.7: Legea� ��� ��

sau poate sa fie un vector de aceeasi lungime cux si y , caz ın care se pot specificamarimi diferite pentru puncte diferite.

Parametrulc specifica culoarea marcajelor si poate lua una din cele optculorifolosite si la functiaplot . Dacac este vector, atunci trebuie sa aiba aceeasi lungimecu ceilalti parametri de tip vector, caz ın care se pot specifica culorile fiecarui marcajın parte.

Parametrulmpermite ınlocuirea marcajului implicit (cerculet), prin marcajul pre-cizat prinm.

Prezenta optiunii’filled’ atrage dupa sine umbrirea interiorului marcajului.

Remarcam faptul ca se poate folosi cu succes functiaplot , daca se foloseste unsingur tip de marcaj.

Functia scatter3

Sistemul Matlab este prevazut cu functiascatter3 pentru reprezentarea noruluistatistic ın cazul tridimensional. Apelul functiei se face cu aceleasi instructiuni ca siın cazul functieiscatter , doar ca se mai insereaza ınca un parametruz , a treiadimensiune, dupa primii doi parametrix si y .

Page 154: Stat_Matlab.PDF

144 Statistica descriptiva

Functia gscatter

Statistics toolboxdispune de functiagscatter pentru reprezentarea norului statis-tic ın cazul bidimensional pe grupe de puncte. Apelul funct¸iei se face prin:

gscatter(x,y,g)gscatter(x,y,s)gscatter(x,y,’c’,’m’,s)gscatter(x,y,’c’,’m’,s,’leg’)gscatter(x,y,’c’,’m’,s,’leg’,’xl’,’yl’)

Efectul executarii unei astfel de instructinui este producerea norului statistic precizatprin vectoriix si y , care au aceeasi lungime, folosind gruparea specificata prin vecto-rul g de aceeasi lungime. Punctele norului vor fi marcate la fel pentru valori identicecorespunzatoare ale luig.

Parametrul’c’ specifica culorile marcajelor si are valoarea implicitadataprin’bgrcmyk’ .

Parametrul optional’m’ este un tablou de tip caractere recunoscute de functiaplot , valoarea implicita fiind caracterul’.’ (punct).

Parmetruls specifica marimea marcajelor punctelor norului. Acesta poate sa fieun scalar, ın care caz toate marcajele vor avea aceleasi m˘arimi sau poate sa fie unvector.

Daca nu sunt specificate valori suficiente pentru toate grupele, sistemul Matlabefectueaza o ciclare a valorilor specificate.

Parametrulleg precizeaza daca se doreste afisarea unei legende (implicit acestaeste’on’ ), sau nu se doreste legenda, cand se va specifica valoarea’off’ .

Parametrii’xl’ si ’yl’ precizeaza etichetele pentru cele doua axe de coor-doante. Daca acesti parametri lipsesc, sistemul Matlab eticheteaza axele de coor-doante cu denumirile variabilelorx si respectivy .

Programul 3.2.39. Programul ce urmeaza genereazan vectori aleatori ce urmeazalegea normala bidimensionala sin numere aleatoare ce urmeaza legea uniforma dis-creta. Folosind aceste date, se va reprezenta norul vectorilor aleatori bidimensionali,efectuand gruparea conform numerelor aleatoare uniformegenerate.

clear, mu(1)=input(’m1=’); mu(2)=input(’m2=’);v(1,1)=input(’sigma1ˆ2=’);v(2,2)=input(’sigma2ˆ2=’);v(1,2)=input(’Cov(X,Y)=’); v(2,1) =v(1,2);if det(v) <= 0

error(’Matricea v nu e pozitiv definita!’)endN=input(’N(parametrul legii uniforme):’);n=input(’n=’); X=mvnrnd(mu,v,n);x=X(:,1); y=X(:,2); g=unidrnd(N,n,1);gscatter(x,y,g,’k’,’o*.+’)

Page 155: Stat_Matlab.PDF

3.2. Culegerea, prezentarea si prelucrarea datelor statistice 145

Pentrun=25 , mu=(5,10) , v ��

2 -1-1 3 � si N=4, se obtine Figura 3.8.

3 4 5 6 7 8 97

8

9

10

11

12

13

14

x

y

1234

Figura 3.8: Nor statistic pe grupe

Functia plotmatrix

Sistemul de baza Matlab contine functiaplotmatrix , care reprezinta pe aceeasifigura mai multi nori statistici. Formele de apel ale funct¸iei sunt

plotmatrix(x)plotmatrix(x,y)plotmatrix(x,y,s)

undex si y sunt matrice cu aceleasi numar de linii, dar numarul coloanelor poate fidiferit, fie acestam si respectivn. Executarea unei instructini de acest tip, producem�n nori statistici, pentru fiecare coloana a matriceix cu fiecare coloana a matriceiy , cu marcajele specificate prin parametrul optionals , care are sintaxa de la functiaplot .

Prima forma este echivalenta cuplotmatrix(x,x)

cu exceptia ca pe diagonala principala a matricei norilor statistici vor fi reprezentatehistogramele coloanelor matriceix .

Programul 3.2.40. Programul urmator va genera o matricex de tipul (N,3) , carecontine vectori aleatori ce urmeaza legea normala tridimensionala, dupa care se vaaplica functiaplotmatrix .

Page 156: Stat_Matlab.PDF

146 Statistica descriptiva

clear, mu(1)=input(’m1=’);mu(2)=input(’m2=’); mu(3)=input(’m3=’);v(1,1)=input(’sigma1ˆ2=’);v(2,2)=input(’sigma2ˆ2=’);v(3,3)=input(’sigma3ˆ2=’);v(1,2)=input(’Cov(X,Y)=’); v(2,1) =v(1,2);v(1,3)=input(’Cov(X,Z)=’); v(3,1) =v(1,3);v(2,3)=input(’Cov(Y,Z)=’); v(3,2) =v(1,3);N=input(’N=’); X=mvnrnd(mu,v,N);plotmatrix(X,’o’)

PentruN=10, mu=(5,10,15) si v ���

2 -1 1-1 3 01 0 1

�� �

se obtine Figura 3.9.

10 15 205 10 150 5 10

12

14

16

18

5

10

15

4

6

8

10

Figura 3.9: Functiaplotmatrix

Functia gplotmatrix

Statistics toolboxcontine functiagplotmatrix , care are ın principal acelasi efectca si functiaplotmatrix , avand ınsa posibilitatea afisarii punctelor noruluistati-sitic ın functie de grupele la care apartin.

Formele de apel sunt cele de la functiagscatter , doar cax si y , ın acest caz,sunt matrice cu acelasi numar de linii, iar numarul coloanelor putand fi diferite.

Page 157: Stat_Matlab.PDF

3.2. Culegerea, prezentarea si prelucrarea datelor statistice 147

3.2.7 Functiarandtool

Avand la dispozitie functiilerandom si hist , putem sa prezentam functia demon-strativarandtool . Lansarea acestei functii se face prin:

>>randtool

ın urma careia se produce o fereastra grafica interactiva (demonstrativa) privind ge-nerarea numerelor aleatoare si ilustrarea acestora cu ajutorul histogramelor.

Fixarea (stabilirea) legii de probabilitate ın scop demonstrativ se face prin alege-rea din meniul legilor de probabilitate situat ın partea stanga sus a ferestrei.

Volumul numerelor aleatoare, ce urmeaza a fi generate, se precizeaza prin intro-ducerea acestuia ın fereastra din partea dreapta sus.

Pentru stabilirea valorilor parametrilor legii de probabilitate considerate se poateproceda ın doua moduri. Fie prin introducerea ın ferestrele corespunzatoare ale va-lorilor dorite, fie prin deplasarea barelor atasate acestora. In plus, limite pentru para-metrii legii de probabilitate considerate pot fi precizate prin introducerea acestora ınferestrele considerate.

Activarea butonuluioutput are ca efect salvarea numerelor aleatoare curente ınvaraibilaans sau ın variabila precizata de utilizator, iar butonulresample permiterepetarea generarii de numere aleatoare cu acelasi volumsi aceeasi parametri.

3.2.8 Functiilepie si pie3

Reprezentari ale datelor prin sectoare circulare ın plan, respectiv ın spatiu, se obtinprin functiile pie si pie3 , care se apeleaza prin formele:

pie(x,ex,label)pie3(x,ex,label)

undex este un vector avand componentele pozitive si normalizate, adica astfel ıncatsuma acestora sa fie 1. Daca suma acestora va fi mai mica decˆat 1, atunci numai oparte a cercului va fi reprezentata grafic.

Parametrulex este optional si specifica sectoarele de cerc ce urmeazasa fiedetasate pe figura, acesta, daca este prezent, trebuie s˘a fie un vector numeric deaceeasi lungime cu vectorulx .

Parametrul optionallabel , specifica etichetele sectoarele de cerc, acesta, dacaeste prezent, trebuie sa fie un vector de aceeasi lungime cuvectorulx , dar care continnumai siruri de caractere.

Programul 3.2.41. Programul ce urmeaza genereazan numere aleatoare ce urmeazalegea uniforma discreta� �� �, construieste tabelul sistematizat, dupa care reprezintadatele sistematizate folosind functiilepie si pie3 .

n=input(’n=’); N=input(’N=’);x=unidrnd(N,1,n);t=tabulate(x); d=length(t(:,3));

Page 158: Stat_Matlab.PDF

148 Statistica descriptiva

ex=zeros(1,d); ex(1)=1;subplot(2,1,1), pie(t(:,3)’/100,ex)subplot(2,1,2), pie3(t(:,3)’/100,ex)colormap summer

Prin executia acestui program, cu datelen=50 si N=4, se obtin reprezentarile graficedin Figura 3.10.

32%

18%22%

28%

22%

28%

18%

32%

Figura 3.10: Diagrame circulare

3.3 Parametrii distributiilor statistice

Se considera datele statistice primare���, � � ��� , relative la caracteristica�, dincare se obtine distributia statistica

����

�������� �

3.3.1 Parametri statistici ce masoara tendinta

Definitia 3.3.1. Media (aritmetica)a distributiei statistice a caracteristicii� estedata prin

��� � ��

�����

��� � ������� �

��� ������

�����

Definitia 3.3.2. Media geometricaa distributiei statistice a caracteristicii pozitive�este data prin

��� � ����������

��� � ����������

�����

Page 159: Stat_Matlab.PDF

3.3. Parametrii distributiilor statistice 149

Observatia 3.3.3. In aplicatii se lucreaza mai usor cu

log ��� � ��

�����

��� ��� � ������� �

� ��� �� ������

�� ��� ���

Definitia 3.3.4. Media armonicaa distributiei statistice a caracteristicii nenule�este data prin

��� ��

����� ����

������ �� �

��� �

������� ���

Observatia 3.3.5. Intre cele trei medii definite mai ınainte exista relatiile cunoscute��� � ��� � ���.

3.3.2 Functiilemean, geomean si harmean

Sistemul de baza Matlab contine functiamean, iar Statistics toolboxdispune de ce-lelalte doua functii,geomean si harmmean.

Apelul acestor functii se face prin:ma=mean(x)mg=geomean(x)mh=harmmean(x)

si au ca efect calculul mediilor corespunzatoare, pentrucomponentele vectoruluix ,iar dacax este matrice, atunci operatia se executa pentru fiecare coloana a matricei.Prin urmare, ın acest ultim caz, rezultatul este un vector avand atatea componentecate coloane are matriceax .

3.3.3 Functiatrimmean

Sistemul Matlab, prinStatistics toolbox, dispune de functiatrimmean , care se poateapela prin

m=trimmean(x,p)

avand ca efect calculul mediei aritmetice a vectoruluix , dupa ce au fost eliminatecele mai mici p�� componente si cele mai marip�� componente, iar dacax estematrice, aceasta operatie se face pentru fiecare coloanaın parte.

Definitia 3.3.6. Numimmedianadistributiei statistice a caracteristicii�, valoareanumerica

careımparte datele statistice, ordonate crescator, ın doua parti egale.

Observatia 3.3.7.Fie datele statistice primare ordonate ın mod nedescresc˘ator

����� � ����� � � ������

Page 160: Stat_Matlab.PDF

150 Statistica descriptiva

atunci mediana va fi data prin

� �

����������� daca

� � �� � �,����� � ���� ��

��

daca� � ��

.

Observatia 3.3.8.Cand datele statistice sunt grupate, atunci se determinaprima dataintervalul median�������� � astfel ıncat pentru frecventele cumulate���� si �� sa fiesatisfacute inegalitatile���� � �

� si �� ��� . Folosind apoi interpolarea liniara se

ia ca mediana� � ���� � �� �� �������

unde�� este amplitudinea intervalului median.

Cand caracteristica cercetata este de tip discret, mediana este� � �� .

3.3.4 Functiamedian

Sistemul de baza Matlab dispune de functiamedian . Apelarea acesteia se face prinm=median(x)

si are ca efect calculul medianei pentru componentele vectorului x , iar dacax estematrice, atunci operatia se executa pentru fiecare coloana a matricei. Prin urmare, ınacest ultim caz, rezultatul este un vector avand atatea componente cate coloane arematriceax .

3.3.5 Parametri statistici ce masoara dispersarea

Definitia 3.3.9. Numimcuartileale distributiei statistice a caracteristicii�, valorilenumerice�� (cuartila inferioara), �� �

, �� (cuartila superioara), care ımpartdatele statistice, ordonate crescator, ın patru parti egale.

Observatia 3.3.10.Cand datele statistice sunt grupate, ca si ın cazul medianei, folo-sind interpolarea liniara consideram

�� � ���� � �� �� ��������

�� � ���� � �� ����������

dupa ce s-a determinatintervalul cuartilic inferior ���������, astfel ıncat sa aiba loc���� � �

� si �� ��� , respectivintervalul cuartilic superior ���������, astfel ıncat

���� � ��� si �� � ��

Page 161: Stat_Matlab.PDF

3.3. Parametrii distributiilor statistice 151

Cand caracteristica cercetata este de tip discret, avem ca�� � �� si �� � ��.Observatia 3.3.11. In mod analog se definesc parametri numerici cum ar fidecilelesi centilele.

3.3.6 Functiaprctile

Statistics toolboxcontine functiaprctile , care se poate apela princ=prctile(x,p)

si care calculeaza pentru componentele vectoruluix , dupa ce acestea au fost ordonatecrescator, centilele precizate prin parametrulp, care contine unul sau mai numereıntregi de la 1 la 99. De exemplu,p=[25, 50, 75] produce respectiv cuartilainferioara (�� ), mediana, cuartila superioara (�� ):

�� ����� � ��� �

�� � � floor

��� �� � � � � ceil

��� �

�� ����� � ��� �

�� � � floor

�� �� � ��� � � � � ceil

���� �

Dacax este matrice, atunci se opereaza pentru fiecare coloana ın parte.

Definitia 3.3.12. Numimmodal distributiei statistice a caracteristicii� orice punct��

de maxim local al distributei statistice.

Observatia 3.3.13.Cand distributia statistica are un singur mod spunem caavemdistributie statisticaunimodala. Daca exista doua sau mai multe moduri spunem caavem distributii statisticebimodale, respectivmultimodale.

Observatia 3.3.14.Cand datele statistice sunt grupate, pentru determinareamodului,se determinaintervalul modal, adica intervalul cu frecventa maxima locala. Dacaintervalul modal este���������, atunci se considera

�� � ���� � �� ������

���� �

unde�� � �� � ����, ��� � �� � ����, ��� � � �� � � ��. Formula se obtineusor daca se intersecteaza interpolantul liniar al punctelor ����������� � ��� ���� cuinterpolantul liniar al punctelor���������, ��� ��� ��

Cand caracteristica cercetata este de tip discret, avem ca�� � ��.

Definitia 3.3.15. Numimmoment de ordin�

al distributiei statistice a caracteristicii�, valoarea numerica

�� � ��

�����

���� � ��

�����

����� ������

������

Page 162: Stat_Matlab.PDF

152 Statistica descriptiva

Definitia 3.3.16. Numimamplitudinea (interval de variatie)distributiei statistice acaracteristicii�, valoarea numerica

� � ����������

��� � �

���� ������������

��� � �

���� � � ���������

Definitia 3.3.17. Numimabatere cuartilica (interval intercuartilic)a distributiei sta-tistice a lui �, diferenta dintre cuartila superioara si cuartila inferioara, adicadiferenta��

���.

Observatia 3.3.18.Mai ıntalnim, ın aplicatii,variatia intercuartilica data prin for-mula

� ���

���� � �����

� �����

��

respectivabaterea cuartila relativa

�� ������

��� ��

���

Observatia 3.3.19.Daca����� � �

� , atunci distributia se considera intens con-centrata, iar ın caz contrar, intens dispersata.

Definitia 3.3.20. Numimabatere medie (absoluta)a distributiei statistice�, valoa-rea numerica

� � ��

����� �

��� �� �� ������� �

� ��� �� �������

�� ��� �� ��

unde� � ��.

Definitia 3.3.21. Numimmoment centrat de ordin�

al distributiei statistice�, va-loarea numerica

�� � ��

�����

������� � ��

�����

�� ������� �

�����

�� �������

Definitia 3.3.22. Momentul centrat de ordinul doi al distributiei statistice � senumestedispersiesi se noteaza �� � ��, iar � � ��� se numesteabatere mediepatraticasauabatere standard.

Observatia 3.3.23.Alte formule de calcul pentru dispersie sunt

�� � ��� �����

����� � ��� �����

��������� � ��

�����

�� ����

��� � �� � ��� �� � � �

(formula lui Konig)�

Page 163: Stat_Matlab.PDF

3.3. Parametrii distributiilor statistice 153

Observatia 3.3.24.Se observa ca pentru calculul dispersiei ar fi necesar sa fie par-curse datele statistice de doua ori, odata pentru calculul mediei aritmetice�, iar apoipentru calculul lui��, care foloseste pe�. Prezentam o metoda pentru calculul dis-persiei printr-o singura parcurgere a datelor statistice.

Pentru aceasta introducem notatiile

�� ������

��� si

��� ������

����� ��

� �� � � � ��� �

Vom arata, prima data, ca are loc relatia de recurenta

��� � ����� � �� �� � ��

� ��� � �� �� � � � ����

Pentru stabilirea relatiei de recurenta se scrie succesiv

��������� ������

����� ��

� �� ��������

����� �� ����

��

� ���

�����

���� ���

�����

��� �

�����

�������

��� �

� ��� ����

��

�������

����

��� �����

��

���� �������

�����

� ��� �����

��

��

��� �����

��

�� ��� �

�����

��� �����

��

Daca retinem extremitatile sirului de egalitati avem:

��� � ����� � �� �� � ��

������ � �� ����� � ���� �

� �� � ��� ��� � �� �� �

ce trebuie aratat.Observam ca� � �� ��, iar �� � �� ���. Prin urmare formula de recurenta de

la punctul precedent permite calculul lui�� odata cu calculul lui�, deci printr-oparcurgere a datelor statistice.

Algoritmul de calcul poate fi descris prin urmatoarele etape:

1.� � �

,� � ���.

2. Pentru� � ���:

� � � � ��� , � � �� �� �� � ��

� ��� � ���.

3. � ��

� ; �� ���

Page 164: Stat_Matlab.PDF

154 Statistica descriptiva

Definitia 3.3.25. Numimcoeficient de variatieal distributiei statistice�, raportul

� � ���

care de regula se exprima ın procente (��� � �).

Definitia 3.3.26. Numimcoeficient de variatie intercuartilal distributiei statistice�,raportul

� � ���

��������

� �����

���

Definitia 3.3.27. Numimcoeficientul de asimetrie intercuartil (Yule)al distributieistatistice�, raportul

� ���

���

� � �� ���������

�� �� ���� ��� ��� � ��

�����

Observatia 3.3.28.Coeficientul lui Yule satisface relatiile�� � � � �, iar daca

����� � ��

��� (

��

�), atunci

�� �� � �, ın caz contrar��

��

� �.

Definitia 3.3.29. Numimcoeficienti ai lui Pearsonrelativ la distributia statistica �,rapoartele:

� �� ���

� (coeficient de asimetrie)�

�� �������

(skewness)�

�� �

����� (kurtosis)�(3.3.1)

Definitia 3.3.30. Numim coeficienti ai lui Fisherrelativ la distributia statistica a lui�, valorile numerice

�� ���� � ��

�� (asimetria)�

(3.3.2)

�� ����� � �����

�� � ��

���� (excesul)�

Observatia 3.3.31.Pentru curba lui Gauss avem ca�� � �

, deci �� � �. Cand

�� � �, maximul curbei distributiei este deplasat spre dreapta ˆın raport cu valoarea

medie, iar cand�� � �, maximul este deplasat spre stanga.

Page 165: Stat_Matlab.PDF

3.3. Parametrii distributiilor statistice 155

De asemenea, pentru curba lui Gauss avem ca�� � �, deci�� �

�. Astfel, daca

�� � � ��� � �� atunci curba distributiei este mai ıngustata decat curba lui Gauss,

distributia numindu-seleptocurtica. Daca��� � ��� � �� curba distributiei este

mai turtita, distributia numindu-seplaticurtica.O parte din acesti parametri statistici exista ın sistemul de baza Matlab, iar altii

se gasesc ınStatistics toolbox. Facem prezentarea lor ın cele ce urmeaza.

3.3.7 Functiamoment

Apelul functieimoment se poate face prin

s=moment(x,k)

si are ca efect calculul, pentru componentele vectoruluix , a momentului centrat deordin k , iar dacax este matrice, atunci se opereaza pe fiecare coloana ın parte.

3.3.8 Functiilevar si std

Apelurile functiilor var si std se pot face prin:

v=var(x)s=std(x)v=var(x,w)v=var(x,1)

Primele doua forme calculeaza, pentru componentele vectorului x , dispersia definitaprin

v � �� � �

�����

�x �� �x �� �

unde�

este lungimea vectorului, si respectiv abaterea standards � �v .Forma a doua pentruvar , cand parametrul optionalweste prezent, acesta trebuie

sa fie un vector cu ponderi pozitive a caror suma este 1, siare ca efect calculul luivdupa formula

v ������

w� �x �� �x �� � �x �

�����

w�x ��

Forma a treia pentruvar , cand parametrul optional1 este prezent, are ca efectcalculul lui v dupa formula momentului centrat de ordinul 2.

In toate cazurile, dacax este matrice, se opereaza pe fiecare coloana ın parte.

3.3.9 Functiilerange, iqr, mad, skewness si kurtosis

Apelurile functiilor range , iqr , mad, skewness , kurtosis se fac prin

Page 166: Stat_Matlab.PDF

156 Statistica descriptiva

r=range(x)iq=iqr(x)md=mad(x)sk=skewness(x)k=kurtosis(x)

si calculeaza pentru componentele vectoruluix , respectiv amplitudinea, abatereacuartilica, abaterea absoluta, asimetria (cu formula (3.3.2)) si excesul (cu formula(3.3.1)).

Dacax este matrice, se opereaza pe fiecare coloana ın parte.

3.3.10 Functiilemax si min

Prezentam numai modul de apel pentru functiamax, deoarece functiamin se utili-zeaza la fel.

Pentrumax avem urmatoarele forme de apel:

r=max(x)r=max(x,y)[r,k]=max(x)[r,k]=max(x,y)

Prin acestea se calculeaza valoarea maxima a componentelor vectorului x , iar ınk se obtin si indicii corespunzatori componentelor. Dac˘a este prezent parametruloptional y , care este un vector de aceasi lungime cu cea a luix , atunci r este unvector ce va contine valorile maxime, prin compararea celor doi vectori pe compo-nente. Dacax este matrice, respectiv cand aparey matrice de aceasi dimensiune,atunci comparatiile sunt efectuate pe coloane ın primul caz, iar ın al doilea caz seface compararea element cu element.

3.3.11 Functiilesort si sortrows

Functiasort are urmatoarele forme de apel

y=sort(x)y=sort(x,k)[y,s]=sort(x)[y,s]=sort(x,k)

si sortrows aceleasi forme de apel.Functiasort ordoneaza crescator elementele fiecarei coloane a matriceix , cand

k=1 (care este valoarea implicita), respectiv ordonarea crescatoare pe linii, candk=2 .Vectorul s pastreaza indicii elementelor dinainte de ordonare. Daca x este vector,atunci parametrul optional lipseste si este efectuataordonarea crescatoare a compo-nentelor vectorului, eventual cu pastrarea indicilor componentelor dinainte de ordo-nare ıns .

Page 167: Stat_Matlab.PDF

3.3. Parametrii distributiilor statistice 157

Functiasortrows ordoneaza lexicografic liniile matriceix , avand ın vederetoate elementele liniilor matricei (cand parametrulk lipseste) sau numai elementelece apartin coloanelor precizate prin vectorulk , cu posibilitatea pastrarii ıns a indi-cilor liniilor ınainte de ordonare.

3.3.12 Functiilesum, prod, cumsum si cumprod

Apelurile functiilor sum, prod , cumsum, cumprod , se pot realiza prin:

y=sum(x)y=sum(x,k)y=prod(x)y=prod(x,k)y=cumsum(x)y=cumsum(x,k)y=cumprod(x)y=cumprod(x,k)

Executia acestor instructiuni calculeaza respectiv sumele, sumele partiale, produsele,produsele partiale pentru fiecare coloana a matriceix , candk=1 (valoare implicita),iar candk=2 , se executa aceste operatii pe linii. Dacax este vector, atunci parametruloptionalk lipseste, iar operatiile se executa asupra componentelor vectorului.

3.3.13 Functiadiff

Apelul functieidiff se realizeaza prin:

y=diff(x)y=diff(x,r)y=diff(x,r,k)

In urma executarii unei astfel de instructiune, se calculeaza diferentele de ordinr aleelementelor liniilor consecutive ale matriceix , candk=1 (valoare implicita), respec-tiv diferentele de ordinr ale elementelor coloanelor consecutive ale matriceix , candk=2 , adica

y ��� � x � ��� �x ��� � � � ��� � �� � � ���� �k=1 �y ��� � x ��� � �x ��� � � � ���� � � ��� � �� �k=2 �

Diferentele de ordin doi pentrux sunt diferentele de ordinul ıntai pentruy . Dacaxeste vector, atunci parametrulk lipseste, iar operatia se executa asupra componentelorvectorului.

Page 168: Stat_Matlab.PDF

158 Statistica descriptiva

3.3.14 Functiilenanmean, nanmedian, nanstd,nanmin, nanmax si nansum

Aceste functii dinStatistics toolboxsunt definite ca si functiile corespunzatoaremean, median , std , min , max, sum, cu exceptia faptului ca sunt excluse din cal-cule valorileNaN.

3.3.15 Corectiile lui Sheppard

Daca datele statistice relative la caracteristica� de tip continuu au fost grupate, ınunele cazuri, se cere sa fie aplicatecorectiile lui Sheppardpentru momentele��.Daca se noteaza cu�

�� momentul corectat de ordinul�, atunci

�� � �� � �

�� ����

�� � ��� � �� ��

���� � ����� � � � ���� � � �

unde� este amplitudinea claselor.Folosind formula precedenta scriem primele patru momentecorectate:

� �� � ��� � �

� � ��� ��

��� � �

� � �� � ��� ��� � �

� � ��� ��

��� �

������

Avand ın vedere ca

�� � ��� ���� �� � �� � ����� � ���

�� �� � ��� ����� � ������

������

obtinem, de asemenea, momentele centrate corectate

� �

� � �� �����

� � �� � �� � � �

� � �� ���� �� � ���

��� Corectiile lui Sheppard se aplica, de regula, cand avemdistributie unimodala si

pentru�

� ����, � �����.

Exemplul 3.3.32. Sa revenim la datele statistice din Exemplul 3.2.10 si sacalculamparametrii statistici definiti pana aici.

Printre parametrii statistici care masoara tendinta ıi calculam pe urmatorii.Media (aritmetica), care este data prin

�� � � � ��

�����

��� � ��� ������ � ����� � � ��

���� � ��

������

Page 169: Stat_Matlab.PDF

3.3. Parametrii distributiilor statistice 159

Mediana, care se obtine dupa ordonarea crescatoare a datelor statistice. Anume, avemca

���� � ��� � ����� � ���� � �� � ���� � ���� � �� �� � �� �� � �� ��� �� � �� � � ���� � ���� � ����� � ����� � ����� � ���� � ��� � ���������� � ���� � ���� � ����� � ����� � ���� � ����� � ����� � ��� � ���

���� � ��� � ��� � ��� � �� � � � � �� � ��� � ��� � ������ � �� � ���� � �� � ��� � ��� � � �� � � � � � �� � � ���� � ��� � ���� � ���� � ��� � �� � � ���� � ��� � ���� � �������� � ��� � �� � � ��� � ��� � ��� � ���� � � � � �� � ���

Datele statistice dublu ıncadrate fiind la mijlocul acestei ordonari (numar par de datestatistice) obtinem mediana ca fiind

� ���

��� � ��

����

� ��

����

Cuartila inferioara se obtine din aceeasi ordonare a datelor statistice, luand datastatistica cu numarul de ordine��, prima ıncadrata, adica�� � ��

���, iar cuartila

superioara, luand data statistica cu numarul de ordine��, a doua ıncadrata, adica�� � �

����.Printre parametrii statistici care masoara gradul de ımprastiere ıi calculam pe cei

care urmeaza.Intervalul de variatie este

� � ��������� � ��

��� � ��

��� � ������

Abaterea cuartila sau intervalul intercuartilic se obtine prin

����� � �

����� ��

��� � ��

����

Deoarece����� � �

��� � ����� ��� , avem ca distributia statistica este intens

concentrata.Abaterea cuartila relativa este

�� ������

��

��

�����

��� � ������

Abaterea medie (absoluta) are valoarea data prin

� � ��

����� �

��� �� ��

Page 170: Stat_Matlab.PDF

160 Statistica descriptiva

� ��� � ������

� ��

��� � � ������� �

��� � � � ���

��� � ��

��� ��� �

������

Primele patru momente sunt

�� � � � ��

�������� � ��

�����

��� � ���

������ � ������ � � ��

����� � ���������� � ��

�����

���� � ���

������ � �����

� � � ��

����� � ���

����

�� ���

�����

���� � ���

������ � ������ � � ��

����� � ��������

Folosind legaturile dintre momentele obisnuite si momentele centrate se obtin aces-tea din urma cu formulele

�� � ��� ��� � �

���������� � �� � ����� � ���

� � ���������

�� � ��� ����� � ������

����� � �

��������

Se pot calcula apoi coeficientii lui Pearson

�� � ������� �

������� (skewness)� �

� ������� �

����� (kurtosis)�

respectiv coeficientii lui Fisher

�� ���� � �

����� (asimetria)�

�� ����� �

�������� (excesul)�

Sa recalculam parametrii statistici pe baza datelor statistice sistematizate (gru-pate).

Media (aritmetica) va fi

� � ������� �

��� � ��� �� ��

�� � �� ���� � � �

���

��� � ��

���

Pentru a calcula mediana folosim formula

� � ���� � �� �� �������

Page 171: Stat_Matlab.PDF

3.3. Parametrii distributiilor statistice 161

Aici ���� este cea mai mare frecventa cumulata (ascendenta) ce nudepaseste pe�� ,

deci �� � �� � ���

� �� � ��. Astfel se obtine��� ���� � ���

������, intervalulmedian, care are amplitudinea�� � � � �

�� si frecventa absoluta�� � ��. Prinurmare rezulta ca

� � ��

� � ��� ��

���

��� �

���

Pentru a calcula cuartila inferioara se determina prima data intervalul cuartilic inferior��������� astfel ıncat���� sa fie cea mai mare frecventa cumulata ascendenta ce nudepaseste pe

�� � ����. Aceasta este�� � ��. Prin urmare��� ���� � ����� ��

��, iar�� � � � ���. Se foloseste apoi formula

�� � ���� � �� ��������� � ��� � �

�� �����

��� � ������

In mod analog, pentru cuartila superioara

�� � ��� � �

�� � � ����� ��

��� �

�����

Intervalul modal, cel cu frecventa maxima, este��� ���� � ���

������. Prin urmaremodul va fi calculat cu formula

�� � ��� �� ���

��� ���� ���

� � ��� ��

���

��� � ��� � ��� � ��� ������

Abaterea (absoluta) este

� � ������� �

� ��� �� �

� ��� � � � ���

��� �

�� � � �� �����

� ��

�� � � � �� ���

��� �

�� ��� �

������

Primele patru momente se calculeaza prin

�� � � � ��

����� � ��

����� �

���� � ���

� ���

��� � �� ����� � � � ���

���� � ��������

�� � ������� �

���� � ���

� ���

��� � �

� ����� � � � ���

���� � ��������

Page 172: Stat_Matlab.PDF

162 Statistica descriptiva

�� ���

����� �

���� � ���

� ���

��� � �� ����� � � � ���

���� � ���

�����

iar apoi se obtin momentele centrate

�� � ��� ��� � �

���������� � �� � ����� � ���

� � ��

��������� � ��

� ����� � ����������� � �

��������

Coeficientii lui Pearson sunt

�� � ������� �

����� (skewness)� �

� ������� �

������ (kurtosis)�

iar coeficientii lui Fisher sunt

�� ���� � �

���� (asimetria)�

�� ����� �

������� (excesul)�

Programul 3.3.33. Sa scriem un program, care sa calculeze o parte din acestipa-rametri statistici din exemplul precedent. Ne vom opri numai la acei parametri, caresunt definiti prin functii Matlab, dar evident ca odata deteminati acesti parametri, sepot calcula usor si ceilalti parametri din exemplul precedent.

load x.dat -ascii% fisierul x.dat contine datele% primare din exemplul precedent

ma=mean(x); fprintf(’ma= %6.4f\n’,ma)mg=geomean(x); fprintf(’mg= %6.4f\n’,mg)mh=harmmean(x); fprintf(’mh= %6.4f\n’,mh)m=median(x); fprintf(’mediana=%6.4f\n’,m)Q=prctile(x,[25,75]);

fprintf(’Q1= %6.4f\n’,Q(1)),fprintf(’Q3= %6.4f\n’,Q(2))

md=mad(x); fprintf(’md= %6.4f\n’,md)mu=moment(x,2); fprintf(’mu2= %6.4f\n’,mu)mu=moment(x,3); fprintf(’mu3= %6.4f\n’,mu)mu=moment(x,4); fprintf(’mu4= %6.4f\n’,mu)r=range(x); fprintf(’range= %6.4f\n’,r)iq=iqr(x); fprintf(’iq= %6.4f\n’,iq)s=std(x); fprintf(’s= %6.4f\n’,s)v=var(x); fprintf(’v= %6.4f\n’,v)sk=skewness(x); fprintf(’sk= %6.4f\n’,sk)k=kurtosis(x); fprintf(’k= %6.4f\n’,k)

Prin executarea programului se obtin rezultatelema= 2.2708mg= 2.1725

Page 173: Stat_Matlab.PDF

3.3. Parametrii distributiilor statistice 163

mh= 2.0704mediana=2.2430Q1= 1.8020Q3= 2.6410md= 0.5277mu2= 0.4379mu3= 0.1156mu4= 0.5402range= 3.1300iq= 0.8390s= 0.6666v= 0.4443sk= 0.3988k= 2.8164

3.3.16 Functiagrpstats

Functiagrpstats , dinStatistics toolbox, face posibila determinarea unor parametristatistici pentru date clasificate (grupate) dupa o anumita variabila de grupare.

Apelul functiei se face prin

ma=grpstats(x,g)[ma,s,fr,nume]=grpstats(x,g)

Parametrulg este un vector numeric sau de tip caracter, de aceeasi lungime cunumarul liniilor matriceix , si care permite gruparea datelor continute dex . O astfelde grupare este formata din acele date dinx , pentru fiecare coloana ın parte, pentrucare valorile corespunzatoare ding sunt aceleasi.

Executarea primei instructiuni are ca efect calculul mediilor aritmetice pentrufiecare grupa a fiecarei coloane din matriceax .

A doua instructiune, fata de prima instructiune, mai calculeaza abaterile standards , pentru fiecare grupa din fiecare coloana a matriceix , precum si numarul datelorfr si etichetelenume, pentru fiecare grupa.

Programul 3.3.34. Programul care urmeaza genereaza 100 de numere aleatoareceurmeaza legea uniforma discreta, cu

� � �, ın vectorulg, care va reprezenta unvector de grupare.

In matriceax cu 100 de linii si 3 coloane, vor fi generate numere aleatoareceurmeaza legea normala

� �����, unde parametrul� � �, iar parametrul�, esterespectiv 1, 2 si 3 pentru cele trei coloane.

Folosind vectorul de grupareg, se calculeaza valorile medii, abaterile standard,frecventele absolute si se precizeaza numele grupelor,pentru coloanele matriceix .

g=unidrnd(4,100,1);t=1:3;t=t(ones(100,1),:);

Page 174: Stat_Matlab.PDF

164 Statistica descriptiva

x=normrnd(t,1);[ma,s,fr,nume]=grpstats(x,g);fprintf(’ Mediile pe grupe \n’)disp(ma)fprintf(’ Abaterile standard pe grupe \n’)disp(s)fprintf(’ Frecventele grupelor \n’)disp(fr)fprintf(’ Etichetele grupelor \n’)disp(nume’)

In urma executarii programului se obtin urmatoarele rezultateMediile pe grupe1.2486 1.8376 3.06920.6895 2.0323 3.26201.0393 1.9893 3.02231.0034 1.8834 3.0419

Abaterile standard pe grupe0.2024 0.1701 0.20330.2076 0.1793 0.27630.2051 0.1723 0.15740.1875 0.1670 0.1859

Frecventele grupelor24 24 2423 23 2327 27 2726 26 26

Etichetele grupelor’1’ ’2’ ’3’ ’4’

3.3.17 Functiaboxplot

Sistemul Matlab, prinStatistics toolbox, dispune de functiaboxplot , care se poateapela cu una din urmatoarele forme:

boxplot(x)boxplot(x,cr)boxplot(x,cr,’s’)boxplot(x,cr,’s’,v)boxplot(x,cr,’s’,v,w)

Efectul executarii acestor instructiuni este reprezentarea grafica prin dreptunghiuri cuprelungiri de segmente pentru fiecare coloana a matriceix . Laturile de jos si de susale dreptunghiurilor au ordonatele date de cuartilele inferioare si superioare cores-punzatoare, medianele fiind si ele marcate la randul lor prin segmente paralele situateın interioarele dreptunghiurilor, pozitionate prin ordonatele date de valorile acestora.

Page 175: Stat_Matlab.PDF

3.4. Corelatie si regresie 165

In mijloacele laturilor de jos si de sus ale dreptunghiurilor sunt trasate spre exte-rior segmente verticale de lungimi date prin

��� ��� ����� �w� �respectiv ��� ����� ��� �w� �

unde avem valoarea implicitaw �����

����. Datele care se afla ınafara acestor

prelungiri se numescoutliers (erori grosolane) si sunt marcate prin simbolul pre-cizat prin parametruls (implicit s=+). Daca nu exista astfel de date ıntr–o parte saualta, atunci segmentul din partea de jos se termina cu un marcaj.

Dacacr=1 , atunci dreptunghiurile sunt crestate pe laturile verticale, avand mij-loacele crestaturilor ın dreptul medianelor, iar deschiderile crestaturilor prezintaestimatii robuste pentru valorile medii teoretice. Valoareacr=0 (valoare implicita)implica faptul ca dreptunghiurile nu sunt crestate.

Candv=0 (valoare implicita estev=1 ) reprezentarile prezentate pana aici suntrotite cu

���, adica sunt prezentate pe orizontala.

Remarcam faptul ca dacax este un vector, atunci poate apare un parametru su-plimentarg, imediat dupa parametrulx . Parametrulg este un vector numeric sau detip caracter, de aceeasi lungime cux , si care permite gruparea datelor continute dex .O astfel de grupare este formata din acele date dinx , pentru care valorile corespun-zatoare ding sunt aceleasi. Functiaboxplot ın acest caz va produce dreptunghiuripentru fiecare grupare ın parte.Programul 3.3.35. Programul urmator genereazan vectori aleatori, care urmeazalegea normala bidimensionala, ın matriceaXde tipuln�2, dupa care, folosind functiaboxplot , reprezinta grafic datele pentru prima variabila si respectiv pentru a douavariabila.

clear, mu(1)=input(’m1=’); mu(2)=input(’m2=’);v(1,1)=input(’sigma1ˆ2=’);v(2,2)=input(’sigma2ˆ2=’);v(1,2)=input(’Cov(X,Y)=’); v(2,1) =v(1,2);if det(v) <= 0

error(’Matricea v nu e pozitiv definita!’)endn=input(’n=’); X=mvnrnd(mu,v,n); boxplot(X)xlabel(’Numarul variabilelor’),ylabel(’Valorile variabilelor’)

In urma executarii programului, cu valorilemu1=10, mu2=10, v ��

2 -2-2 3 � si

n=50 , se obtine Figura 3.11.

3.4 Corelatie si regresie

Corelatia (ıntr-un sens larg) poate fi ınteleasa ca legatura careexista ıntre o caracte-ristica dependenta si una sau mai multe caracteristici independente, iarregresiaeste

Page 176: Stat_Matlab.PDF

166 Statistica descriptiva

1 2

6

7

8

9

10

11

12

13

14

Valor

ile va

riabil

elor

Numarul variabilelor

Figura 3.11: Reprezentare de date cuboxplot

� � � �� �� � � �

���� ��� ��� � � � ��� ����� ��� ��� � � � ��� ���...

......

......

�� ��� ��� � � � ��� ������ ��� � � � ��� ��� � �

Tabelul 3.2: Tabel de corelatie

metoda prin care se stabileste acesta legatura.Sa consideram caracteristicile cantitative� si

�relative la colectivitatea

�. Da-

tele statistice primare sunt���� ����� � � � ��� , care dupa grupare sunt prezentate ınTabelul de corelatie 3.2. unde��� reprezinta frecventa absoluta a clasei��� ��� �. Deasemenea, avem ca

�����

��� � ���������

��� � ��� ������

��� ������

��� � ��� � ��

Definitia 3.4.1. Numimmoment de ordinul������� al distributiei statistice a carac-teristicii bidimensionale���� �, valoarea numerica

���� � ��

�����

��������� � ��

�����

�����

������� ��� ������

�����

������� ��� �

Page 177: Stat_Matlab.PDF

3.4. Corelatie si regresie 167

unde��� � ���� este frecventa relativa a clasei��� ��� �.Definitia 3.4.2. Numimmoment centrat de ordinul������� al distributiei statisticebidimensionale���� �, valoarea numerica

���� � ��

�����

�������� ��

�� ��� � ��

�����

�����

��� �������� ��� � ���

������

�����

��� �������� ��� � ��� �

unde

� � ��� � �������

����� � � � ��� � �������

����� �

Observatia 3.4.3.Remarcam, printre momentele centrate, dispersiile pentru distri-butiile statistice ale caracteristicilor� si respectiv

�, anume

��� � ��� � �������

��� ������� � ��� � ��� � ��

�����

��� ��� � ����

Definitia 3.4.4. Numimcoeficient de corelatie(al lui Pearson) al distributiei statis-tice bidimensionale���� �, raportul

� � ������������ ��� � ������

���� � ��� �� �����

Observatia 3.4.5.Folosind datele statistice negrupate avem formulele de calcul pen-tru coeficientul� de corelatie

� ���

��� ������� ���

�� ��

���

��� �����������

��� ����� ���

sau

� ���

���������� ��

���

��������

����� ��

�������� ��

�� ��

���

��� ��������

��� ���� ��

���

��� �����

Page 178: Stat_Matlab.PDF

168 Statistica descriptiva

Observatia 3.4.6.Folosind inegalitatea Cauchy–Schwarz–Buniakovski

������

������ ��

�� ��� � ��

����

������� ���

�����

�� ���

se stabileste ca�� � � �. De asemenea, daca�� �� �, atunci ıntre cele doua caracteris-tici exista o legatura liniara, si invers. Cand� � �

, spunem ca cele doua caracteristicisunt (liniar)necorelate. Prin urmare, coeficientul de corelatie poate fi folosit pentrua stabili daca ıntre cele doua caracteristici exista sau nu o legatura liniara.In cazulın care caracteristica bidimensionala���� � urmeaza legea normala bidimensionala� � �

implica faptul ca cele doua caracteristici sunt independente.

Exemplul 3.4.7. Sa calculam cativa din parametrii definiti pentru datele statistice dela Exemplul 3.2.20.

Pentru a calcula coeficientul de corelatie, calculam prima data valorile medii alecaracteristicilor� si

�. Remarcam, pentru aceasta, ca distributiile statistice ale ca-

racteristicilor� si�

sunt respectiv

��� ��� ��� ��� ��� ��� ��� ��� ��� ��� ��� ��� ���

� � �� �� �� ��� �� �� �� � � ��� �

���

�� �� �� �� �� �� �� �� �� �� �� ��� � �� �� �� ��� �� �� �� �� � �

��

Obtinem astfel ca

� � ���� �� ��� � � ��� � � � ���� � ����

���cm�

� � ���� �� �� � � �� � � � ��� � ���

����kg�

De asemenea, calculand dispersiile caracteristicilor seobtine

��� � ��������

������ � ��������

�������� ���� �� ������ ������ � �

�� ������ ���� �� ����� � �

�� ������ ���� �

������� � ���� ������ � ��������

Page 179: Stat_Matlab.PDF

3.4. Corelatie si regresie 169

��� ���� �����

������ � ��� �����

�������� ���� �� ����� ����� � �

�� ����� ���� �� ���� ���� � �

�� ����

� ���� ������� � ���� ������ � ��������

Covarianta dintre� si�

se calculeaza cu formula

Cov ���� � � ��������

�����

������� � ��������

������� �����

������� ���� �

������� � ���� ����� ����� � ��������

Astfel se ajunge la coeficientul de corelatie

� � Cov ���� �������� �

��������

������� ��������� �

��������

Programul 3.4.8. Programul Matlab, care urmeaza, efectueaza aceste calculef=[1,1,3,1,zeros(1,8);

0,3,4,1,0,1,zeros(1,6);1,4,5,7,1,2,1,zeros(1,5);0,1,2,6,9,6,4,1,zeros(1,4);zeros(1,2),1,7,36,17,6,2,1,zeros(1,3);zeros(1,2),1,6,27,56,39,18,4,1,zeros(1,2);zeros(1,3),2,10,16,26,7,2,1,zeros(1,2);zeros(1,4),1,7,10,11,6,2,1,0;zeros(1,5),1,2,4,7,3,1,0; zeros(1,6),1,2,3,1,1,0;zeros(1,8),1,2,2,1; zeros(1,9),1,2,1];

x=[126:137]; y=[24:35]; fx=sum(f’); fy=sum(f);xa=sum(fx.*x)/(sum(fx)); ya=sum(fy.*y)/(sum(fy));vx=(sum(fx.*x.ˆ2)-(sum(fx.*x))ˆ2/sum(fx))/sum(fx);vy=(sum(fy.*y.ˆ2)-(sum(fy.*y))ˆ2/sum(fy))/sum(fy);cov=(x*f*y’-sum(fx.*x)*sum(fy.*y)/sum(fx))/sum(fx);r=cov/(sqrt(vx*vy));fprintf(’ xa=%8.3f\n ya=%8.4f\n’,xa,ya)fprintf(’ vx=%8.5f\n vy=%8.5f\n’,vx,vy)fprintf(’ cov=%7.5f\n r=%9.6f’,cov,r)

iar rezultatele sunt urmatoarele:xa= 131.054ya= 29.2447vx= 3.45354

Page 180: Stat_Matlab.PDF

170 Statistica descriptiva

vy= 3.35188cov=2.56323r= 0.753374

Definitia 3.4.9. Numimvaloare medie conditionataa distributiei statistice a carac-teristicii

�ın raport cu� � �� , valoarea numerica

�� � � ���� � �

��������

����� ������

������ �� � � � ����

si respectivvaloare medie conditionataa distributiei statistice a caracteristicii� ınraport cu

� � �� , valoarea numerica

�� � � ��� � � ����

�����

����� ������

������ �� � � � ����

Definitia 3.4.10. Curba de ecuatie� � � ��� pe care se situeaza punctele de co-

ordonate ��� ����, � � ���, se numestecurba de regresiea lui�

ın raport cu�,iar curba de ecuatie� � � ��� pe care se situeaza punctele de coordonate��� ��� �,� � ���, se numestecurba de regresiea lui � ın raport cu

�.

Definitia 3.4.11. Numimdispersie conditionataa distributiei statistice a caracteris-ticii

�ın raport cu� � ��, valoarea numerica

��� ��� � ����

�����

��� ��� � ���� �

�����

������ ��� � �

��� � � � ����

si respectivdispersie conditionataa distributiei statistice a caracteristicii� ın raportcu

� � �� , valoarea numerica

��� ��� � ����

�����

��� ������ �� �

�����

������ ���

��� �� � � � ����

Definitia 3.4.12. Numimdispersia conditionataa distributiei statistice a lui�

ınraport cu distributia statistica a lui�, valoarea numerica

��� �� � �������

������ ��� � �����

������ ���si respectivdispersia conditionataa distributiei statistice a lui� ın raport cu distri-butia statistica a lui

�, valoarea numerica

��� �� � �������

������ ��� � �����

� ����� ��� �

Page 181: Stat_Matlab.PDF

3.4. Corelatie si regresie 171

unde��� � ���� este frecventa relativa a clasei��, iar � �� � ���� este frecventa relativaa clasei

�� .Proprietatea 3.4.13.Dispersiile conditionate definite maiınainte satisfac relatiile

��� � ��� �� � ��� �� � ��� � ��� �� � ��� �� �

unde

��� �� � ��

�����

��� ���� ��� � ��� �� � ��

�����

��� ��� ���� �

adica sunt dispersiile valorilor medii conditionate.

Demonstratie.Se porneste de la identitatea

��� � ��� � ��� � ���� � ���

� ��� � � ��� � ��� ���

� �� �

care se ınmulteste cu������ si se ınsumeaza dupa� � ���. Astfel se obtine

�����

������ ��� � ��� �

�����

������ ��� � �

��� ������

������ ���

� ����

� �

�����

������ ��� � �

�� ���� ��

���� ��� � ���� ��� � � ���

� �� ���� �

�� � ��� ��� � ���� ���

Retinem extremitatile acestui sir de egalitati, le ˆınmultim cu ���� si le ınsumam dupa� � ���. Rezulta ın acest mod

��� ���

�����

��� ��� � ��� � �������

�����

��� ��� � ���

� �������

������ ��� � �������

��� ���� ��� � ��� �� � ��� �� �

de unde se obtine prima relatie. Analog se obtine si cealalta relatie.

Definitia 3.4.14. Numimraport de corelatieal distributiei statistice a caracteristicii�fata de distributia statisticii�, valoarea numerica

� �� � ��� ��

� �����

������� �����

Page 182: Stat_Matlab.PDF

172 Statistica descriptiva

si ın mod analog avem

�� �� � ��� ��� ����� �

������� �����

Observatia 3.4.15. Cand�� � �

� � � ��, atunci� � �

�, prin urmare

��� �� � � ��

� �� � �, ceea ce ınseamna absenta dependentei ın medie. Pe de

alta parte,�� �� � � cand��� �

�� � �,� � ���, adica pentru fiecare clasa�� valorile

caracteristicii�

sunt aceleasi.

In cazul ın care, relativ la caracteristica�, exista numai doua clase avem

� � ���� �� � ���� ��

Daca se ınlocuieste aceasta expresie ın formula

��� �� � ��

���� ��� � ��� � ��� ��� � ����

se obtine ca

��� �� � �������� ��� � �

��� �deci

��� �� � ������ ��� � �

��������

Aplicatia 3.4.16. (Determinarea curbelor de regresie).Prezentam ın continuareme-toda celor mai mici patratepentru determinarea ecuatiilor curbelor de regresie.

Presupunem ca din reprezentarea ın plan a punctelor��� ����, � � ���, curba deregresie a lui

�ın raport cu� este de forma

� � � ��� � � �������� � � � �

����. Vom

determina parametrii�� � � � ���, astfel ıncat

� ������ � � � �

���� �

�����

����� � ��

��� � �

����

�����

������ � � �����

������

�����

������ � � ��� ������ � � � �

����

sa fie minima.

Page 183: Stat_Matlab.PDF

3.4. Corelatie si regresie 173

Punctul de minim������ � � � �

���� al functiei

�se obtine prin rezolvareasistemu-

lui normal de ecuatii, rezultat din

����� �

�������

�����

������ � � ��� ������ � � � �

����

�� ��� ������ � � � �

�����

�� � �

pentru� � ���. Ecuatia curbei de regresie va fi

� � � �������� � � � �

����

La fel se determina si ecuatia curbei de regresie a lui� ın raport cu�

.

Aplicatia 3.4.17. (Drepte de regresie).Consideram cazul liniar, adica ecuatia curbeide regresie este

� � � ��� � �� � �. Expresia minimizata este

� ��� �� ������

�����

��� ��� � ���� ��� �

care conduce la sistemul normal de ecuatii

�����������

������

�����

���������

������

�����

������� ������

�����

�������������

�����

��������

������

�����

����� ������

�����

����� �

sau ����� � ���� � ������� � ���� � ���

Solutia acestui sistem liniar este

� ���� � ���������

� ����� ��� � ����������

� ��������

� ����

����

� ��������

� ����� �

���� �� � ��� � � ��� � � �

���

Se obtine ın acest fel ecuatia dreptei de regresie a lui�

ın raport cu� ca fiind

� � � � ����� �� ���

Page 184: Stat_Matlab.PDF

174 Statistica descriptiva

In mod analog se ajunge la ecuatia dreptei de regresie a lui� ın raport cu�

(3.4.1) � �� � �����

�� � ���

Punctul de intersectie al celor doua drepte de regresie are coordonatele����� sise numestecentrul de greutateal distributiei statistice a caracteristicii bidimensionale���� �.

Daca se noteaza�� �� � �

����coeficientul unghiular al dreptei de regresie a lui

�ın raport cu� (numitcoeficientul

de regresieal lui�

ın raport cu�) si cu

�� �� � �����

coeficientul de regresieal lui � ın raport cu�

, atunci

�� ���

�� ���� �� �

De asemenea se constata ca sign�� �� � � sign

�� ��� � Se arata ca unghiul�

format de cele doua drepte de regresie este dat prin relatia

tg� � ��

��

��������� � ���

Folosind aceasta relatie se pot trage urmatoarele concluzii:a) daca�� �� �atunci� � �

, deci dreptele de regresie se confunda, cu specificatiaca pentru� �

��dreptele au panta (coeficientul unghiular) negativa, iar pentru� � �

panta este pozitiva.b) daca� si

�sunt independente atunci� � �

, deci� � �

� (dreptele de regresiesunt perpendiculare).

Observatia 3.4.18.Alte tipuri de curbe de regresie mai des ıntalnite si carepot filiniarizate sunt:

1.� � �

��(exponentiala), care prin logaritmare se liniarizeazadupa cum ur-

meaza��� � � ��� �� � ��� ��

luand� � ��� �, � � ��� �, � � ��� �

;

2.� � �

�� �

(hiperbolica), care se liniarizeaza daca se noteaza� � ��;

3.��� �

�� �

sau� � �

� �, care se liniarizeaza daca se noteaza� � �

� , � � �� ;

Page 185: Stat_Matlab.PDF

3.4. Corelatie si regresie 175

4.� � � ��� � � �

(logaritmica), care se liniarizeaza daca se noteaza� � ��� �;

5.� � �

e��

(exponentiala), care prin logaritmare se liniarizeazaln� � ln

����,

luand� � ln�;

6.� � �

e�

� , care prin logaritmare se liniarizeaza ln� � ln

� � �� , luand� � �

� ,� � ln

�;

7.� � ���, care prin logaritmare se liniarizeaza,��� � � ��� � �

� ��� �, luand� � ��� �, � � ��� �

;

8.��� �e�� � �

sau� � �

�e�� �, care se liniarizeaza daca se ia� � e�� si� � �

Aceasta ultima legatura este un caz particular allegaturii logisticedefinita prin

� � ������ � �

Printre legaturile ce nu pot fi liniarizate amintim:� � ��� � � ��� �,� � ������,� � �

� �� � ����

,

a doua putand fi adusa la forma polinomiala.

Exemplul 3.4.19. Sa consideram din nou datele statistice de la Exemplul 3.2.20, sacalculam noile caracteristici numerice definite si sa determinam ecuatiile dreptelorde regresie.

Valorile medii conditionate si dispersiile conditionate ale lui�

ın raport cu� secalculeaza cu formulele

�� � �

��������

����� � � � ����

si

��� ��� � ����

�����

��� ��� � ���� � � � ����

In mod analog se obtin valorile medii conditionate si dispersiile conditionate ale lui� in raport cu

�.

Aceste valori calculate sunt trecute ın tabelele urmatoare.

Page 186: Stat_Matlab.PDF

176 Statistica descriptiva

� �� �� ���

� ��� ����� ���� ��� ��� ����� ���� ���� ��� ���� � �� ���� �� � ����� ��� ������ ���� ������� ���� �� ��� � � ������ ���� �� ��

si

� �� �� ���

� ����� ����� ��� � ����� ����� ����� ���� ��� ����� ������ ����� ����� ����� ����� ���� ������ ��� ����� ����� ����� � �� ��� �� ��� � �� �

Dispersia conditionata a lui�

ın raport cu� va fi

��� �� � �������

������ ���� ���� �����

��� � ������� � � �����������������

In mod analog dispersia conditionata a lui� ın raport cu�

este

��� �� � �������

������ ��� � ���� �����

��� � �������� � �

���

�������������

Dispersia conditionata a lui�

ın raport cu� se poate calcula si cu formula

��� �� � ��� � ��� �� �

unde

��� �� � ��

�����

��� ���� ���

este dispersia valorilor medii. Anume, avem ca

��� �� � ���� �

� ������� ��

������ � � � ����

�� � ���

������ � ��

������de unde

��� �� � ��������

��

����� � ��������

In mod analog,��� ��

� ��� ���� ���

Page 187: Stat_Matlab.PDF

3.4. Corelatie si regresie 177

unde

��� ��� ��

�����

��� ��� ���� �

adica

��� ��� ���� �

� ���� � ����

����� � � � �������

����

����� � ��

������

In acest fel se obtine ca

��� ��� ������� � �

����� � ��������

Raportul de corelatie al lui�

fata de� este

� �� � ��� ��

� �����

������� �����

��

��

������������

� ���������

iar raportul de corelatie al lui� fata de�

este

�� ��� ��

� ��� ����� �

������� ����� ���

������������ � �

��������

Ecuatiile dreptelor de regresie respectiv a lui�

ın raport cu� si a lui� ın raport cu�au ecuatiile

� � � � ����� �� ��� � � �� � �

����

�� � ���

Avand ın vedere ca

����� � �

���������������

������� � ���������

�����

� ����������������

�������� �

��������avem ecuatiile

�����

���� � �������� �� � ����

���� � ������

��� � �������� �� � ��

����� �

Centrul de greutate al distributiei statistice���� � este punctul de coordonate����� � �����

������

���, adica punctul de intersectie a celor doua drepte de regresie.

Page 188: Stat_Matlab.PDF

178 Statistica descriptiva

Coeficientul de regresie al lui�

ın raport cu� este coeficientul unghiular aldreptei de regresie a lui

�ın raport cu�, adica

�� �� � �

���� � ���������

In mod analog, coeficientul de regresie al lui� ın raport cu�

este

�� �� � �����

� ���������

Pentru determinarea unghiului� format de cele doua drepte de regresie avem formula

tg� � ��

��

��������� � ��� �

adica

tg� � �� �

�����������

�������� ��������

������� � �������� �

�����

de unde� �� ��� � �

���� rad.

Programul 3.4.20. Calculele de mai sus se pot face cu programul Matlab, care ur-meaza:

f=[1,1,3,1,zeros(1,8);0,3,4,1,0,1,zeros(1,6);1,4,5,7,1,2,1,zeros(1,5);0,1,2,6,9,6,4,1,zeros(1,4);zeros(1,2),1,7,36,17,6,2,1,zeros(1,3);zeros(1,2),1,6,27,56,39,18,4,1,zeros(1,2);zeros(1,3),2,10,16,26,7,2,1,zeros(1,2);zeros(1,4),1,7,10,11,6,2,1,0;zeros(1,5),1,2,4,7,3,1,0; zeros(1,6),1,2,3,1,1,0;zeros(1,8),1,2,2,1; zeros(1,9),1,2,1];

x=[126:137]; y=[24:35]; fx=sum(f’); fy=sum(f);xa=sum(fx.*x)/(sum(fx)); ya=sum(fy.*y)/(sum(fy));vx=(sum(fx.*x.ˆ2)-(sum(fx.*x))ˆ2/sum(fx))/sum(fx);vy=(sum(fy.*y.ˆ2)-(sum(fy.*y))ˆ2/sum(fy))/sum(fy);cov=(x*f*y’-sum(fx.*x)*sum(fy.*y)/sum(fx))/sum(fx);r=cov/(sqrt(vx*vy));yb=f*y’./fx’; xb=f’*x’./fy’;for i=1:12

syb(i)=f(i,:)*(y’-yb(i)).ˆ2/fx(i);endfor j=1:12

sxb(j)=f(:,j)’*(x’-xb(j)).ˆ2/fy(j);endsyx=sum(fx.*syb)/sum(fx);

Page 189: Stat_Matlab.PDF

3.4. Corelatie si regresie 179

sxy=sum(fy.*sxb)/sum(fx);syxb=sum(fx’.*(yb-ya).ˆ2)/sum(fx);sxyb=sum(fy’.*(xb-xa).ˆ2)/sum(fx);eyx=sqrt(syxb/vy); exy=sqrt(sxyb/vx);ayx=r*sqrt(vy/vx); axy=r*sqrt(vx/vy);tang=(1-rˆ2)/rˆ2*sqrt(vx*vy)/(vx+vy);arctan=atan(tang); arc=180*arctan/pi;fprintf(’ i | yb | syb | j | xb | sxb\n’)for i=1:12

fprintf(’%3d |%6.2f |%6.3f |%7d |%6.3f |%6.3f\n’,...i,yb(i),syb(i),i,xb(i),sxb(i))

endfprintf(’\n syx=%8.5f, sxy=%8.5f’,syx,sxy)fprintf(’\n eyx=%8.6f, exy=%8.6f’,eyx,exy)fprintf(’\n ayx=%8.6f, axy=%8.6f’,ayx,axy)fprintf(’\n tg=%9.3f, alpha=%6.0f’,tang,arc)

In urma executarii programului precedent, se obtin urmatoarele rezultate:i | yb | syb | j | xb | sxb1 | 25.67 | 0.889 | 1 |127.000 | 1.0002 | 26.11 | 1.432 | 2 |127.556 | 0.6913 | 26.62 | 2.141 | 3 |127.813 | 1.9024 | 28.14 | 1.843 | 4 |129.433 | 2.1125 | 28.43 | 1.045 | 5 |130.464 | 0.8446 | 29.32 | 1.363 | 6 |130.943 | 1.2047 | 29.56 | 1.340 | 7 |131.438 | 1.2808 | 30.63 | 1.706 | 8 |132.000 | 1.7789 | 31.67 | 1.444 | 9 |133.125 | 2.276

10 | 31.88 | 1.359 | 10 |134.091 | 2.99211 | 33.50 | 0.917 | 11 |135.429 | 1.95912 | 34.00 | 0.500 | 12 |136.500 | 0.250

syx= 1.39279, sxy= 1.40291eyx=0.764509, exy=0.770568ayx=0.742203, axy=0.764713tg= 0.381, alpha= 21

3.4.1 Functiilecov si corrcoef

Aceste doua functii sunt specifice sistemului Matlab de baza si pot fi apelate prin:C=cov(x)C=cov(x,y)r=corrcoef(x)

Functiacov calculeaza matricea covariantelor pentru matriceax , unde fiecare co-loana este considerata a fi o variabila:

C�� � �� � �

����� �x �� �x �� �x �� �x� � � ��� � ����

Page 190: Stat_Matlab.PDF

180 Statistica descriptiva

Dacax este vector este returnata varianta vectorului, caz ın care se poate folosi si pa-rametrul optionaly , care este vector de aceeasi dimensiune cux , cand este calculatacovarianta dintrex si y , pe langa variantele luix respectivy , adica

C� �� � �

����� �x � �x � �y � �y �

Prin urmare, ın acest caz,cov (x ,y ) produce acelasi rezultat ca sicov ([x y ]).Remarcam faptul ca instructiuneadiag (cov (x)) genereaza vectorul variantelor

fiecarei coloane a matriceix , iar sqrt (diag (cov (x ))) este vectorul abaterilor stan-dard pentru fiecare coloana a matriceix .

Functiacorrcoef calculeaza matricea coeficientilor de corelatie pentrumatri-ceax , unde fiecare coloana este considerata o variabila:

r �� � C���

C��C��� ��� � ����

Programul 3.4.21. Programul urmator genereazan vectori aleatori, care urmeaza le-gea normala bidimensionala, ın matriceaXde tipuln�2, dupa care, folosind functiilecov si corrcoef , calculeaza matricele covariantelor si a coeficientilor de corelatie,pentru cele doua coloane ale matriceiX.

clear, mu(1)=input(’m1=’); mu(2)=input(’m2=’);v(1,1)=input(’sigma1ˆ2=’);v(2,2)=input(’sigma2ˆ2=’);v(1,2)=input(’Cov(X,Y)=’); v(2,1) =v(1,2);if det(v) <= 0

error(’Matricea v nu e pozitiv definita!’)endn=input(’n=’); X=mvnrnd(mu,v,n);v=cov(X); r=corrcoef(X);fprintf(’Matricea covariantelor\n’), disp(v)fprintf(’Matricea coeficientilor de corelatie\n’), disp (r)

In urma executarii programului, cu valorilemu1=100, mu2=-100 , v ��5 44 4� si

n=1000 , se obtin rezultatele

Matricea covariantelor5.1327 4.04194.0419 4.0487

Matricea coeficientilor de corelatie1.0000 0.88670.8867 1.0000

Page 191: Stat_Matlab.PDF

3.4. Corelatie si regresie 181

3.4.2 Functiilelsline, refline si gline

Functiile lsline , refline si gline apartin laStatistics toolbox, apelurile lorfacandu–se prin:

lslinereflinerefline(m)refline(m,n)glinegline(f)

Functialsline reprezinta grafic ın figura curenta dreptele de regresie,obtinutecu metoda celor mai mici patrate, pentru fiecare curba a figurii, care a fost reprezen-tata grafic cu instructiuneaplot , dar nu prin linie continua, ıntrerupta sau de tipulpunct–linie.

Functiarefline reprezinta grafic ın figura curenta dreapta de ecuatiey=mx+n.Daca lipseste parametruln, se impune ca parametrulmsa fie un vector avand douacomponente,m(1) reprezentand panta dreptei, iarm(2)=n . Adica ın acest cazdreapta, ce se va reprezenta grafic, va avea ecuatiay=m(1)x+m(2) . Daca lip-sesc ambele argumente,msi n, efectul functieirefline coincide cu cel al functieilsline .

Functiagline reprezinta grafic ın figura precizata prin parametrulf , iar dacaacesta lipseste ın figura curenta, segmentul de dreaptaprin marcarea cu ajutorulmouse-lui a capetelor segmentului.

Programul 3.4.22. Vom prezenta un program Matlab, care genereazaNvectori alea-tori ce urmeaza legea normala bidimensionala, reprezinta grafic norul statistic pentruaceste date, precum si cele doua drepte de regresie, a luiY ın raport cuX, respectiv alui X ın raport cuY.

Dreapta de regresie a luiY ın raport cuX se va reprezenta grafic cu functialsline , iar dreapta de regresie a luiX ın raport cuYse va face cu functiarefline ,avand ın vedere parametriimsi n ai dreptei de regresie definita prin (3.4.1), anume

m� ��������� �

n � �� �m���

clear,clf, mu(1)=input(’m1=’); mu(2)=input(’m2=’);v(1,1)=input(’sigma1ˆ2=’);v(2,2)=input(’sigma2ˆ2=’);v(1,2)=input(’Cov(X,Y)=’); v(2,1) =v(1,2);if det(v) <= 0

error(’Matricea v nu e pozitiv definita!’)endN=input(’N=’); Z=mvnrnd(mu,v,N);X=Z(:,1); Y=Z(:,2);

Page 192: Stat_Matlab.PDF

182 Statistica descriptiva

ma=mean(Z); s=std(Z);r=corrcoef([X,Y]);m=s(2)/(r(1,2)*s(1)); n=ma(2)-m*ma(1);plot(X,Y,’.’), lsline, refline(m,n)text(ma(1),ma(2),’o Centrul de greutate’)

Pentru datele de intrareN=20, mu=(0,0) , v ��

1 -0.8-0.8 1 � �

se obtin grafi-

cele din Figura 3.12.

−2 −1.5 −1 −0.5 0 0.5 1 1.5 2−3

−2

−1

0

1

2

3

o Centrul de greutate

Figura 3.12: Drepte de regresie

3.4.3 Functiilepolyfit si refcurve

Functiapolyfit este specifica sistemului de baza Matlab, iar functiarefcurveeste continuta deStatistics toolbox, fiind folosite ın ajustarea datelor prin functii po-linomiale.

Apelurile acestor functii se pot face prin:p=polyfit(x,y,n)refcurve(p)

Functiapolyfit determina coeficientii polinomului de ajustare de gradn, cu me-toda celor mai mici patrate, corespunzator datelor statistice�x � �y �������. Prima com-ponenta a vectoruluip este coeficientul monomului de gradn. Dacan=1 , se obtincoeficientii dreptei de regresie a variabileiY ın raport cu variabilaX.

Functiarefcurve reprezinta grafic ın figura curenta functia polinomial˘a pre-cizata prin coefcientiip, cu precizarea cap(1) reprezinta coeficientul monomuluide grad maxim. Daca parametrulp are doua componente, functia este echivalenta cufunctiarefline .

Page 193: Stat_Matlab.PDF

3.4. Corelatie si regresie 183

Calculul valorilor unei functii polinomiale se face cu ajutorul functieipolyval ,pe care o prezentam ın continuare, ımpreuna cu alte functii specifice sistemului Ma-tlab de baza, din acest grup de functii.

3.4.4 Functiilepolyval, polyvalm, poly si roots

Forme de apel pentru functiilepolyval , polyvalm , poly si roots sunt:

y=polyval(p,x)y=polyvalm(p,x)p=poly(a)p=roots(a)

Functiapolyval calculeaza valoriley ale polinomului precizat prin coeficientiicontinuti de vectorulp, pe fiecare punct al matricei sau vectoruluix .

Functiapolyvalm calculeaza matricea patraticay , care reprezinta valoarea ma-triceala a polinomului precizat prin coeficientii continuti de vectorulp, pentru matri-cea patraticax , adica

y � p�x� �p�x��� � �p� ��

dacap are�� � componente.

Functiapoly calculeaza coeficientii polinomului caracteristic al matricei patra-tice a:

� ��� ���������

� ���� ��� � � �

������ � �

��� � � ����

� � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � �

��� ��� � � �

� ����

��������

iar canda este un vector calculeaza coeficientii polinomului care are ca radacinielementele vectorului, adica ai lui

� ��� ���

����� �a��

Functiaroots calculeaza radacinile polinomului cu coeficientii dat¸i prin vecto-rul p.

Programul 3.4.23. Programul urmator va genera matriceaZ, care contineN vectorialeatori ce urmeaza legea normala bidimensionala. Se transforma apoi componentaa doua a vectorilor aleatori, prin ridicarea acestora la puterea a treia, iar apoi se de-termina polinomul de ajustare de grad trei, prin folosireadatelor transformate. Poli-nomul de ajustare obtinut se reprezinta grafic ımpreunacu norul statistic al datelortransformate.

Page 194: Stat_Matlab.PDF

184 Statistica descriptiva

clf, clear, mu(1)=input(’m1=’); mu(2)=input(’m2=’);v(1,1)=input(’sigma1ˆ2=’);v(2,2)=input(’sigma2ˆ2=’);v(1,2)=input(’Cov(X,Y)=’); v(2,1) =v(1,2);if det(v) <= 0

error(’Matricea v nu e pozitiv definita!’)endN=input(’N=’); Z=mvnrnd(mu,v,N);X=Z(:,1); Y=Z(:,2); p=polyfit(X,Y.ˆ3,3);scatter(X,Y.ˆ3,7,’filled’), hold on,m=mu(1); s=sqrt(v(1,1));x=m-3*s:0.01:m+3*s;y=polyval(p,x); plot(x,y)

Pentru datele de intrareN=25, mu=(0,0) , v ��

1 -0.9-0.9 1 � �

se obtine grafi-

cul din Figura 3.13.

−3 −2 −1 0 1 2 3−25

−20

−15

−10

−5

0

5

10

15

Figura 3.13: Polinom de ajustare de grad 3

3.4.5 Functiapolytool

Functia demonstrativapolytool se lanseaza prin:

>>polytool(x,y)>>polytool(x,y,n)

In urma lansarii se produce un grafic interactiv (demonstrativ) privind polinomul deajustare pentru datele continute ın vectorii coloanax si y , avand gradul precizat

Page 195: Stat_Matlab.PDF

3.4. Corelatie si regresie 185

prin parametruln (valoarea implicita esten=1 ). Schimbarea gradului polinomuluide ajustare se face prin introducerea noii valori ın fereastra din partea de sus.

Pe figura este reprezentat norul statistic pentru datelex si y , ımpreuna cu graficulpolinomului de ajustare (cu linie continua).

Prin introducerea valorii unui argument� ın fereastra de jos sau prin deplasareadreptei verticale pe pozitia abscisei�, pe axa ordonatelor se obtine valoarea cores-punzatoare.

Pe langa aceste elemente, graficul demonstrativ continesi alte elemente, carese refera la notiuni ce urmeaza a fi prezentate ın capitolele ce urmeaza, cum ar fiprobabilitate deıncrederesi intervale deıncredere.

De asemenea, exista posibilitatea ajustarii datelor cu alte metode decat metodacelor mai mici patrate. Alegerea unei astfel de metoda se face prin activarea butonuluimethod din meniu.

3.4.6 Functianlinfit

Pentru ajustarea neliniara,Statistics toolboxdispune de functianlinfit , bazata pemetoda celor mai mici patrate. Apelul functiei se poate face prin:

a=nlinfit(x,y,numef,a0)[a,r]=nlinfit(x,y,f,a0)

undenumef reprezinta numele functiei, care defineste legatura c˘autata dintre va-riabila dependenta, cu valorile continute de vectorul coloanay , variabilele indepen-dente, cu valorile continute ın coloanele matriceix . Matriceax trebuie sa aiba acelasinumar de linii ca si lungimea vectoruluiy .

Parametrula0 reprezinta valorile de pornire (initiale) ale parametrilor a, careurmeaza sa fie calculati.

Functianumef poate fi o functie Matlab proprie, care are linia de definitiefunction z=numef(a,x)

In urma executarii primei instructiuni, se obtin coeficientii a ai functieinumef ,iar daca se foloseste a doua instructiune se mai obtin si erorile r =y -numef(a,x) .

Programul 3.4.24. Vom consideraN vectori aleatori ce urmeaza legea normala bi-dimensionala, pastrati ın matriceaZ de tipul (N,2) . Asupra elementelor coloanei adoua se efectueaza transformarea data prin functiaexp . Daca a doua coloana a luiZ astfel transformata o consideram ca reprezinta valorile unei variabile dependenteY, iar prima coloana consideram ca reprezinta valorile unei variabile independenteX,vrem sa determinam legatura de forma

Y � beaX�

Procedam ın doua moduri, cu ajutorul functieinlinfit (linie continua pe grafic),respectiv prin liniarizarea acestei relatii (linie ınrerupta pe grafic), adica prin logarit-mare:��Y � ��b

�aX�

Page 196: Stat_Matlab.PDF

186 Statistica descriptiva

clf, mu(1)=input(’m1=’); mu(2)=input(’m2=’);v(1,1)=input(’sigma1ˆ2=’);v(2,2)=input(’sigma2ˆ2=’);v(1,2)=input(’Cov(X,Y)=’); v(2,1) =v(1,2);if det(v) <= 0

error(’Matricea v nu e pozitiv definita!’)endN=input(’N=’); Z=mvnrnd(mu,v,N);X=Z(:,1); Y=exp(Z(:,2));a=nlinfit(X,Y,’expo’,[1,1]);p=polyfit(X,log(Y),1);a1=p(1); b1=exp(p(2));scatter(X,Y,7,’filled’), hold onm=mu(1); s=sqrt(v(1,1));x=m-3*s:0.01:m+3*s;y=expo(a,x); y1=b1*exp(a1*x);plot(x,y,’-’,x,y1,’--’)

Considerand datele de intrareN=20, mu=(0,0) , v ��

1 -0.9-0.9 1 � �

se obtin

graficele din Figura 3.14.

−3 −2 −1 0 1 2 30

2

4

6

8

10

12

Figura 3.14: Ajustare neliniara

3.4.7 Functianlintool

Functia demonstrativapolytool se lanseaza prin:

>>nlintool(x,y,numef,a0)

Page 197: Stat_Matlab.PDF

3.4. Corelatie si regresie 187

In urma lansarii se produce un grafic interactiv (demonstrativ) privind ajustarea da-telor continute ın vectorul coloanay si matriceax , avand tipul legaturii precizat prinparametrulnumef , care poate fi o functie Matlab proprie.

Pe figura este reprezentat graficul de ajustare (cu linie continua).Prin introducerea valorii unui argument� ın fereastra de jos sau prin deplasarea

dreptei verticale pe pozitia abscisei�, pe axa ordonatelor se obtine valoarea cores-punzatoare pentru

�.

Elementele obtinute, prin lansarea acestei functii, potfi salvate ın spatiul de lucru,workspace , partial sau ın totalitate, prin utilizarea butonuluiexport .

Pe langa aceste elemente, graficul demonstrativ continesi alte elemente, carese refera la notiuni ce urmeaza a fi prezentate ın capitolele ce urmeaza, cum ar fiintervale deıncredere.

3.4.8 Coeficientii Spearman si Kendall

Definitia 3.4.25. Fie ��� ����, � � ��� , rangurile datelor statistice primare���� �����, � � ���, obtinute prin ordonarea crescatoare dupa prima, respectiv adoua componenta. Numimcoeficient de corelatie al rangurilorsau coeficientul luiSpearman, valoarea numerica � � � ���� � �unde� si

�sunt noile caracteristici care definesc rangurile datelor statistice, res-

pectiv pentru� si�

.

Proprietatea 3.4.26. Daca notam �� � ��� � �� � diferenta rangurilor aceluiasiindivid, atunci

� � �� �� ��� � ��

�����

����

Demonstratie.Conform definitiei lui�

avem ca

� � ����� ���

��� ��� � ��

���

��� ����������

��� ��� � ���

Deoarece������ � � � �

��� � � ������ � � � �

��� � � ����� � � �

�� �, rezulta ca

� � � � ��

�����

� � � � ��

si����� ��� ���� �

����� ��� � ��� �

�����

�� � � � �� ��

Page 198: Stat_Matlab.PDF

188 Statistica descriptiva

�� ����� ������

�� � ������

��� ������� �

� �� � ��

���

deci numitorul din expresia lui�

este calculat.Pentru calcularea numaratorului pornim de la identitatea

� ��� ��� ��� � �� � ��� ���� � ��� � ��� � ���� ��� � ��� � ���� ��� ���� � ��� � ��� � ��� �

care se ınsumeaza pentru� � ��� . Obtinem ın acest fel

����� ��� ��� ��� � �� �

����� ��� ���� �

����� ��� � ��� �

�����

����� �� � �

��� �

������

��� �adica �

���� ��� ��� ��� � �� � � �� � ��

��� �

�����

����

Daca se ınlocuiesc aceste expresii ın formula lui�

se obtine relatia din enuntul pro-prietatii.

Corolarul 3.4.27. Coeficientul lui Spearman verifica relatiile�� � � � �.

Demonstratie.Valoarea maxima� � �se obtine cand�� � �� � � ��� , adica toate

rangurile corespunzatoare celor doua caracteristici coincid. Valoarea minima� � ��

se va obtine cand diferentele rangurilor sunt maxime, adica rangurile sunt inversepentru cele doua caracteristici.In acest caz avem

�����

��� � ���� �

��� � �� ���� �

�� �

� �� � ��

��

de unde se obtine, ıntr-adevar,� � ��.

Acelasi rezultat se obtine si din faptul ca�

este definit cu ajutorul coeficientului(pentru ranguri) Pearson, despre care stie ca ia valori ınintervalul �

��� �.

Observatia 3.4.28.Pe baza corolarului precedent, vom spune ca pentru� � � cele

doua clasamente pentru caracteristicile� si�

sunt identice, pentru� � �

� suntinverse unul celuilalt, iar pentru

� � �sunt independente.

Page 199: Stat_Matlab.PDF

3.4. Corelatie si regresie 189

Observatia 3.4.29.Cand exista doua sau mai multe date statistice primare care auaceeasi valoare, atunci rangurile acestora se consideratoate egale (ex-aequo) cu me-dia aritmetica a rangurilor pe care le ocupa aceste date ın ordonarea crescatoare.corespunzator vom face modificarea lui

�.

Daca ın ordonarea dupa caracteristica� avem� grupe de date statistice carecoincid, fiecare grupa continand��

� � � ���, date statistice si daca ın ordonarea dupacaracteristica

�avem� grupe de date statistice ce coincid, fiecare grupa continˆand�

� � � � ���, date statistice, atunci�

se modifica dupa cum urmeaza

� � �� �� �� � �

� � ��� � ���� ������ �����

�� ��� � �� � ���

���� ��� � �� � ��

unde�� � �

���

����

�� ��� � ��

si�� � �

���

����

�� ��� � �

��

Definitia 3.4.30. Numimcoeficientul lui Kendallrelativ la distributia statistica acaracteristicii bidimensionale���� �, raportul

� � ��

� �� ���

�unde

� �����������

sign ���� ����� ��� � ��

��� �

Proprietatea 3.4.31.Coeficientul lui Kendall satisface relatiile�� � � � �.

Demonstratie.Valoarea maxima a lui�

se obtine cand�

este maxim, adica atunci

cand���� ���

���� � ���

�, pentru fiecare

� � �. In acest caz avem ca

� �����������

� ����� � � �� �

���

deci� � �.

Valoarea minima a lui�

se obtine cand�

este minim,���� ���

���� � ���

� �

,

pentru fiecare� � �, caz ın care

� � �����������

� ����

�� � �� �� ���

��

deci� � ��. Prin urmare avem

�� � � � �.

Page 200: Stat_Matlab.PDF

190 Statistica descriptiva

Observatia 3.4.32.Din proprietatea precedenta, avem ca pentru� � � cele doua

clasamente ale celor doua caracteristici� si�

sunt identice, pentru� � �

� suntinverse unul celuilalt, iar pentru

� � �sunt independente.

Observatia 3.4.33.Pentru calculul rapid al lui�, se poate proceda dupa cum ur-

meaza. Se ordoneaza datele primare���� ����� � � � ��� , ın mod crescator dupa prima

componenta. Fie aceasta������������ � � � ���, cu ����� � ����� � � ����� � Se

calculeaza apoi numarul

� � ���������

sign������ � ����� �

obtinandu-se astfel�.

Remarcam de asemenea ca toate formulele relative la coeficientul lui Kendallraman adevarate daca se lucreaza cu rangurile��� ����, corespunzatoare datelor statis-tice primare���

����

��, � � ��� , asa cum s-au introdus pentru definirea coeficientuluilui Spearman.

Observatia 3.4.34.Cand ın cele doua clasamente sunt valori egale (ex-aequo) seprocedeaza ca la Observatia 3.4.29, adica se ınlocuiesc toate rangurile pentru valorileegale prin media aritmetica a rangurilor pe care le ocupa ˆın ordonare. Corespunzatorse face modificarea lui

�prin formula

� � ��� ������

���

�� ���������

unde�� � �� �

��� �� ��� � �� si �� � �� �

������ �

�� � �� �

cu �� � �� definiti la

Observatia 3.4.29. Pentru calculul lui�

pentru fiecare pereche ex-aequo valoarea lui�

ramane neschimbata.

Exemplul 3.4.35. Echipele diviziei nationale de fotbal sunt clasificate dupa numarulde goluri primite��� si dupa numarul cartonaselor galbene primite�� � ın primele�� meciuri ale campionatului. Datele statistice sunt trecuteın tabelul urmator

Echipa E� E E� E� E� E� E� E� E� E�� E�� E� E�� E�� E�� E�� E�� E��X 15 13 10 13 12 11 16 11 13 9 10 14 15 9 8 9 10 11

Y 13 9 11 11 12 8 7 6 9 8 8 10 11 9 5 10 13 14

Sa calculam coeficientii lui Spearman respectiv al lui Kendall. Pentru aceasta or-donam crescator echipele dupa caracteristica�, dupa care folosind regula ex-aequostabilim rangurile datelor statistice.

Calculele sunt efectuate ın tabelul urmator.

Page 201: Stat_Matlab.PDF

3.4. Corelatie si regresie 191

Echipa� �

Rang���

Rang�� � � �

- +

E�� 8 5 1 1 0 0 0 17

E�� 9 8 3 5 2 4 2 12

E�� 9 9 3 8 5 25 4 9

E�� 9 10 3 10.5 7.5 56.25 6 7

E� 10 11 6 13 7 49 7 4

E�� 10 8 6 5 1 1 2 9

E�� 10 13 6 16.5 10.5 110.25 9 1

E� 11 8 9 5 4 16 2 8

E� 11 6 9 2 7 49 0 9

E�� 11 14 9 18 9 81 8 0

E� 12 12 11 15 4 16 6 1

E 13 9 13 8 5 25 1 4

E� 13 11 13 13 0 0 3 1

E� 13 9 13 8 5 25 1 3

E� 14 10 15 10.5 4.5 20.25 1 2

E� 15 13 16.5 16.5 0 0 2 0

E�� 15 11 16.5 13 3.5 12.25 1 0

E� 16 7 18 3 15 225 0 0

Total 715 55 87

Numarul grupelor ex-aequo este cinci atat pentru� cat si pentru�

. Avem astfel

�� � �

���� �� � ��� � �� � ��� � �� � ��� � �� � ��� � �� � �� � ��

��

�� � �

���� �� � ��� � �� � ��� � �� � ��� � �� � ��� � �� � �� � ��

�� ����� �� � ��� � �� � ��� � �� � ��� � �� � ��� � �� � �� � ���

�� ����� �� � ��� � �� � ��� � �� � ��� � �� � ��� � �� � �� � ���

� ������ � ���

Daca se ınlocuiesc aceste valori ın formule se obtin coeficientii

� � �� ��� �� �� � ��

�� �

�� ������

� �� �� �� � � ������ �� �� �� � � �

� ��

����

� ���

��� ��

��

���

�� ���

��� � �

����

Page 202: Stat_Matlab.PDF

192 Statistica descriptiva

Programul 3.4.36. Programul Matlab, care urmeaza, calculeaza cei doi coeficienti,Spearman si Kendall, fara tratarea cazurilor ex-aequo.

x=[15,13,10,13,12,11,16,11,13,9,10,14,15,9,8,9,10,1 1];y=[13,9,11,11,12,8,7,6,9,8,8,10,11,9,5,10,13,14];[xord,ind]=sort(x); [yord,jnd]=sort(y);for i=1:18

rx(ind(i))=i; ry(jnd(i))=i;endd=abs(rx-ry); d2=d.ˆ2;sp=1-6*sum(d2)/18/(18ˆ2-1);ke=0;for i=1:18

for j=1:18if i<jke=ke+sign((rx(i)-rx(j))*(ry(i)-ry(j)));

endend

endke=2*ke/(18*17);fprintf(’ x | y |rang(x)|rang(y)| d | dˆ2 \n’)for i=1:18

fprintf(’%3d |%4d |%5d |%5d |%4d |%4d\n’,...x(i),y(i),rx(i),ry(i),d(i),d2(i))

endfprintf(’\n sp=%5.3f, ke=%5.3f’,sp,ke)

In urma executarii acestui program, se obtin urmatoarele rezultate:

x | y |rang(x)|rang(y)| d | dˆ215 | 13 | 16 | 16 | 0 | 013 | 9 | 12 | 7 | 5 | 2510 | 11 | 5 | 12 | 7 | 4913 | 11 | 13 | 13 | 0 | 012 | 12 | 11 | 15 | 4 | 1611 | 8 | 8 | 4 | 4 | 1616 | 7 | 18 | 3 | 15 | 22511 | 6 | 9 | 2 | 7 | 4913 | 9 | 14 | 8 | 6 | 36

9 | 8 | 2 | 5 | 3 | 910 | 8 | 6 | 6 | 0 | 014 | 10 | 15 | 10 | 5 | 2515 | 11 | 17 | 14 | 3 | 9

9 | 9 | 3 | 9 | 6 | 368 | 5 | 1 | 1 | 0 | 09 | 10 | 4 | 11 | 7 | 49

10 | 13 | 7 | 17 | 10 | 10011 | 14 | 10 | 18 | 8 | 64

sp=0.269, ke=0.203

Page 203: Stat_Matlab.PDF

3.4. Corelatie si regresie 193

Observatia 3.4.37.(Formula lui Daniels). Coeficientul� de corelatie (al lui Pear-son), coeficientul

�al lui Spearman si coeficientul

�al lui Kendall se pot exprima

prin formula unica

� � ������

���� ��� ������

�������� ����

���

�������� ����

Daca se ia��� � ��

����� � ��� � ��

�� ���

se obtine coeficientul de corelatie�.Intr–adevar, prin calcule algebrice simple se poate scrie

�����

�����

������� � ��

�� ���� � ��

�����

������� �

� �����

����� �

����

�����

iar�����

�����

��������� � ��

�����

���� �

� �����

����� �

�����

�����

���� ����� � ��

�����

���� �

� �����

����� �

astfel ca

� � ����� ��

����� ��

���

��� �����

����� ��

����������

�� ��

���

�����������

��� ���� ��

���

��� �����

� ��

Daca se ia��� � ��

��� � ��� � �� � ��

se obtine, ca mai ınainte, coeficientul�

al lui Spearman, iar daca se considera

��� � sign��

������ � ��� � sign

���� ��� �

se obtine coeficientul�

al lui Kendall.

Page 204: Stat_Matlab.PDF

194 Statistica descriptiva

Definitia 3.4.38. Fie colectivitatea�

cercetata din punct de vedere a� caracteristici����� � � � �

��� si fie datele statistice primare relative la aceste caracteristici scriseın matricea

� �

����

��� ��� � � �

������ ��� � � �

���� � � � � � � � � � � � � � � � � � � �

��� ��� � � �

���

�����

cu matricea� a rangurilor corespunzatoare pentru fiecare caracteristica data prin

� �

������� ��� � � � ������ ��� � � � ���� � � � � � � � � � � � � � � � � � �

��� ��� � � � ���

���� �

Numimcoeficientul de concordanta al lui Kendallraportul

� � ����� ��� �� � �

unde� �

�����

���� � ���� � �

��� ������

��� � ��� ������

���Observatia 3.4.39.Fiecare coloana a tabloului rangurilor este o permutare a nu-merelor���� � � �

��, deci suma elementelor din fiecare coloana este

� �� ��� si prin

urmare

��� � �� �� � ���

Cand cele� clasamente sunt identice, deci coloanele din matricea ranguri-lor sunt identice, totalurile�������� � � �

��� � formeaza o permutare a elementelor� ��� �

� � �

���. In acest caz valoarea lui�

va fi maxima, anume

� ������

�� � � � �� � ��� �� � �� �� ���

��

prin urmare� � �.Cand��� � ��� � � �� � atunci se obtine valoarea minima� � �

, caz ın careavem independenta ıntre caracteristicile cercetate.

Observatia 3.4.40.Cazurile ex-aequo se trateaza ca si pentru doua caracteristici, iarformula modificata este

� � ����� ��� �� � ������� ���� � ��

Page 205: Stat_Matlab.PDF

3.4. Corelatie si regresie 195

unde�� este numarul datelor ex-aequo pentru caracteristica�� .

Exemplul 3.4.41. Se considera�� familii pentru care sunt cercetate urmatoarele ca-racteristici��, ��, ��, �� reprezentand cheltuielile (ın sute de lei) zilnice pentrupaine, legume, fructe, carne respectiv. S-au obtinut urmatoarele date statistice

�� � �� ��

�� � ���� � �� � �� ��� � ������� � �� � ���� ��� �� � ���� �� ��� � � ��� �� ������ ��� �� �� �� ��� �� ��� ��� � ���� �� �� �� � � � ���� ��� ��

Vrem sa calculam coeficientul de concordanta al lui Kendall.Pentru a calcula coeficientul de concordanta al lui Kendall, se determina rangurile

datelor statistice pentru fiecare caracteristica ın parte. Matricea rangurilor este

� �����������������

���������������������

� � � �� � � �� � � �

� � � �� � � �

� �� �� ��

�� � � �� � � �� � �� ���� � � ��� �� � �� �� �� ��

���������������������

De asemenea, avem ca sumele rangurilor de pe fiecare line a matricei rangurilor sunt�� ��� ��� ��� ��� ��� ��� ��� ��� ��� ��� ��, deci

� ������

���� � ���� �� � �

�� ���

�� �� � ���� ���

�� �� � ���� � ���

�� ��

Page 206: Stat_Matlab.PDF

196 Statistica descriptiva

��� � ���� � ���� ���� � � ��� � ���� � �����

Coeficientul de concordanta al lui Kendall va fi

� � �� ������ �� � � �� ������ ���� � ��� �������� �� �

������

Programul 3.4.42. Un program Matlab, care efectueaza aceste calcule, este prezen-tat ın continuare

x=[332,428,354,1437;293,559,388,1527;372,767,562,19 48;406,563,341,1509;386,608,396,1501;438,843,689,2345;534,660,367,1620;460,699,483,1856;385,789,621,2366;655,776,423,1848;584,995,548,2056;515,1097,887,2630 ];

N=12; p=4;[x1,i1]=sort(x(:,1)); [x2,i2]=sort(x(:,2));[x3,i3]=sort(x(:,3)); [x4,i4]=sort(x(:,4));for i=1:12

r1(i1(i))=i; r2(i2(i))=i; r3(i3(i))=i; r4(i4(i))=i;endr=[r1’,r2’,r3’,r4’]; sb=sum((sum(r’)-sum(sum(r))/12) .ˆ2);w=12*sb/(pˆ2*(Nˆ3-N));fprintf(’ Matricea rangurilor\n’)for i=1:12

fprintf(’%6d |%3d |%3d |%3d\n’,r1(i),r2(i),r3(i),r4(i) )endfprintf(’\n w=%5.3f’,w)

iar rezultatele obtinute, ın urma executarii programului, suntMatricea rangurilor

2 | 1 | 2 | 11 | 2 | 4 | 43 | 7 | 9 | 86 | 3 | 1 | 35 | 4 | 5 | 27 | 10 | 11 | 10

10 | 5 | 3 | 58 | 6 | 7 | 74 | 9 | 10 | 11

12 | 8 | 6 | 611 | 11 | 8 | 9

9 | 12 | 12 | 12

w=0.735

Page 207: Stat_Matlab.PDF

Capitolul 4

Teoria selectiei

Studiul statistic al unei colectivitati�

din punct de vedere al uneia sau mai mul-tor caracteristici prin considerarea tuturor indivizilorcolectivitatii de multe ori esteimposibil de efectuat sau foarte costisitor. Daca ne gandim, de exemplu, la studiul ca-litatii produselor unei fabrici de conserve, ne dam seama ca nu are sens considerareatuturor acestor produse pentru efectuarea controlului, ceea ce ar duce la distrugereaıntregii productii. De asemenea, daca se are ın vedere recensamantul populatiei uneitari, ne dam seama de costul ridicat al acestei operatii, motiv pentru care astfel derecensaminte sunt destul de rare.

Si numai din cele doua exemple amintite ınainte, ne dam seama ca ar fi potrivitca sa fie considerata pentru studiu numai o parte a colectivitatii cercetate, iar apoirezultatele obtinute relative la aceasta parte sa fie extinse la ıntreaga colectivitate.

4.1 Tipuri de selectie

Definitia 4.1.1. Numim esantion (selectie, sondaj) relativ la colectivitatea�

osubmultime de indivizi� a lui

�, care urmeaza sa fie cercetati din punct de vedere

a uneia sau mai multor caracteristici, iar numarul indivizilor din esantionul� senumestevolumul esantionului.

Observatia 4.1.2.Modurile de obtinere a esantionului� ne conduc lametode neale-atoaresi respectivmetode aleatoarede selectie.

Dintre metodele nealeatoare amintim:

� selectia sistematica, cand indivizii care intra ın esantion sunt considerat¸i dupao anumita regula, de exemplu din�� ın ��;

197

Page 208: Stat_Matlab.PDF

198 Teoria selectiei

� selectie tipica, cand, cunoscandu-se informatii anterioare referitoare la colec-tivitate, sunt considerati indivizi cu valori medii apropiate de valoarea medie aıntregii colectivitati;

� selectie stratificata, cand colectivitatea este clasificata (stratificata) dupa anu-mite criterii, cunoscandu–se proportia indivizilor pentru fiecare strat. Esantio-nul se ia astfel ıncat sa fie respectate aceste proportiipentru fiecare strat.

Pentru metodele aleatoare, fiecare individ al colectivitatii�

poate sa intre ın esantioncu aceasi probabilitate (selectie cu probabilitati egale) sau cu probabilitati diferite.Metodele aleatoare de selectie sunt:

� repetate(bernoulliene), cand individul, ce intra ın esantion, dupa ce a fost cer-cetat, este reintrodus ın colectivitate;

� nerepetate, cand individul ce intra ın esantion, dupa ce a fost cercetat, nu estereintrodus ın colectivitate.

Observatia 4.1.3.Daca volumul colectivitatii este mult mai mare decat volumul e-santionului, atunci o selectie nerepetata poate fi considerata ca fiind de tip repetat.Aceasta are la baza rezultatul privind comportarea asimptotica a legii hipergeometriceca si o lege binomiala (a se vedea Observatia 2.4.4).

4.2 Functii de selectie

In cele ce urmeaza vom considera ca avem de fiecare data o selectie repetata.

Definitia 4.2.1. Fie colectivitatea�

cercetata din punct de vedere al caracteristicii�. Numimdate de selectierelative la caracteristica� datele statistice����� � � � �

���privind indivizii care intra ın esantion.

Observatia 4.2.2.Datele de selectie pot fi considerate ca fiind valorile unor variabilealeatoare����� � � � �

���, numitevariabile de selectiesi care ın cazul unei selectiirepetate sunt variabile aleatoare independente, identic repartizate cu�.

Definitia 4.2.3. Numimfunctie de selectiesaustatisticavariabila aleatoare

�� ��� ������ � � � �

���� �

unde�� �� �� � este o functie masurabila, iar �� �

�� ������ � � � �

���� senumestevaloarea functiei de selectie.

Page 209: Stat_Matlab.PDF

4.2. Functii de selectie 199

4.2.1 Media de selectie

Definitia 4.2.4. Numimmedie de selectiefunctia de selectie

�� � ��

������

� � iar �� � ��

�����

��

se numestevaloarea mediei de selectie.

Proprietatea 4.2.5. Fie caracteristica� avand valoarea medie� � � ��� si dis-

persia�� � ��� ���, atunci

� �� � �� si

���

�� � � ���� �

Demonstratie.Folosind proprietatile valorii medii si ale dispersieisi avand ın vedereca selectia este repetata avem succesiv

� �� � � �

������ ���� � �

������ ��� � �

��� ���

���

�� � � ���

�����

��� ���� � �

��

�����

��� ��� � �

��� �� � �

��� �

Observatia 4.2.6. In cazul ın care caracteristica� urmeaza legea normala� �����,

atunci ��, fiind o combinatie liniara de variabile aleatoare independente, ce ur-meaza fiecare aceasi lege normala, va urma de asemenea legea normala (a se vedeaObservatia 2.5.6). Pe baza proprietatii precedente�� va urma asadar legea normala� ��� ���.

Proprietatea 4.2.7. Fie caracteristica� avand valoarea medie� � � ��� si dis-

persia�� � ��� ���, atunci statistica

(4.2.1) �� ��� ��

���convergeın repartitie la legea normala

� ��� ��, cand� ��, iar cand� urmeazalegea normala

� ����� afirmatia are loc pentru orice valoare a lui�.

Proprietatea nu reprezinta altceva decat Teorema 2.7.8.

Page 210: Stat_Matlab.PDF

200 Teoria selectiei

Functia 4.2.8.Pentru ilustrarea proprietatii precedente, scriem o functie Matlab, caregenereaza o matrice de tipul(n,m) , ale carei elemente sunt numere aleatoare ce ur-meaza o lege de probabilitate precizata. Pentru fiecare coloana a matricei generate, secalculeaza valoareazn, folosind formula (4.2.1), dupa care se reprezinta grafichisto-grama valorilorzn, ımpreuna cu densitatea de probabilitate a legii normale

� ��� � ���.function hist2(n,m,lege)% Comportare asimptotica a mediei de selectie% lege - legea de probabilitate% (n,m) - tipul matricei generateswitch legecase ’unid’

N=input(’N=’);X=unidrnd(N,n,m); [med,var]=unidstat(N);

case ’bino’nn=input(’n=’); p=input(’p=’);X=binornd(nn,p,n,m); [med,var]=binostat(nn,p);

case ’hyge’M=input(’M=’); K=input(’K=’); nn=input(’n=’);X=hygernd(M,K,nn,n,m); [med,var]=hygestat(M,K,nn);

case ’poiss’la=input(’lambda=’);X=poissrnd(la,n,m); [med,var]=poisstat(la);

case ’nbin’r=input(’r=’); p=input(’p=’);X=nbinrnd(r,p,n,m); [med,var]=nbinstat(r,p);

case ’geo’p=input(’p=’);X=geornd(p,n,m); [med,var]=geostat(p);

case ’unif’a=input(’a:’); b=input(’b(a<b):’);X=unifrnd(a,b,n,m); [med,var]=unifstat(a,b);

case ’norm’mu=input(’mu=’); s=input(’sigma=’);X=normrnd(mu,s,n,m); [med,var]=normstat(mu,s);

case ’logn’mu=input(’mu=’); s=input(’sigma=’);X=lognrnd(mu,s,n,m); [med,var]=lognstat(mu,s);

case ’gam’a=input(’a=’); b=input(’b=’);X=gamrnd(a,b,n,m); [med,var]=gamstat(a,b);

case ’exp’mu=input(’mu=’);X=exprnd(mu,n,m); [med,var]=expstat(mu);

case ’beta’a=input(’a=’); b=input(’b=’);X=betarnd(a,b,n,m); [med,var]=betastat(a,b);

case ’weib’a=input(’a=’); b=input(’b=’);

Page 211: Stat_Matlab.PDF

4.2. Functii de selectie 201

X=weibrnd(a,b,n,m); [med,var]=weibstat(a,b);case ’rayl’

b=input(’b=’);X=raylrnd(b,n,m); [med,var]=raylstat(b);

case ’t’nn=input(’n=’);X=trnd(nn,n,m); [med,var]=tstat(nn);

case ’chi2’nn=input(’n=’);X=chi2rnd(nn,n,m); [med,var]=chi2stat(nn);

case ’f’mm=input(’m=’); nn=input(’n=’);X=frnd(mm,nn,n,m); [med,var]=fstat(mm,nn);

otherwiseerror(’Lege necunoscuta’)

endZ=mean(X); Z=(Z-med)/sqrt(var/n);hist(Z,fix(1+10/3*log10(m)), hold onx=-3:0.01:3; f=normpdf(x,0,1);plot(x,f,’k-’), colormap spring

Apelul functieihist2 se face prin>>hist2(n,m,’lege’)

unde valorile pentrun, msi lege , fie ca sunt precizate ın acest apel, fie sunt precizateınainte. De exemplu, comanda

>>hist2(25,35,’unif’)

are ca efect apelul functiei pentru legea uniforma, iar peecran se va cere introducereaparametrilora si b (a�b), dupa care pe ecran va fi reprezentat graficul din Figura 4.1,ın cazul ın carea=-1 si b=1 . Sa remarcam totusi ca la un nou apel, cu aceeasiparametri, graficul difera, deoarece sunt generate alte numere aleatoare.

4.2.2 Momente de selectie

Definitia 4.2.9. Numimmoment de selectie de ordin�

functia de selectie

��� � ��

�����

����

iar ��� � ��

�����

��� �

se numestevaloarea momentului de selectie de ordin�.

Observatia 4.2.10.Se vede imediat ca��� � ��.

Proprietatea 4.2.11. Fie caracteristica� pentru care exista momentul teoretic deordin

��, ��� � � ����, atunci

� � ���� � �� si�

�� � ���� � ��

��� � ���� �

Page 212: Stat_Matlab.PDF

202 Teoria selectiei

−3 −2 −1 0 1 2 30

2

4

6

8

10

12

Figura 4.1: Legea� ��� ��

iar pentru� ��, avem ca

�� ���� � ���

�������convergeın repartitie la legea normala

� ��� ��.Demonstratie.Deoarece selectia este repetata putem scrie succesiv

� � ���� � ��

�����

����

� ��

�����

���� � �

���� � �� �

��� � ���� � �

��

�����

���

����

� ���

�����

���

��� � ����

��� � ����

� ��

��� � �����

Ultima afirmatie rezulta prin aplicarea Teoremei 2.7.8 sirului��

����� de varia-

bile aleatoare independente si identic repartizate. Anume, deoarece� ���� � ��

si�

����

�� � ��� � ���, avem

�� ������

���� ��

���� � ��� ��

� ����� � ��� ��

� �����

��������

� ����� � ��� ��

����� ����� � ��� � ���

�������

Page 213: Stat_Matlab.PDF

4.2. Functii de selectie 203

dar�� converge ın repartitie la legea normala� ��� ��, ceea ce ıncheie demonstratia.

Definitia 4.2.12. Numimmoment centrat de selectie de ordin�

functia de selectie

��� � ��

�����

��� �� �� �

iar ��� � ��

�����

���� �� �� �

se numestevaloarea momentului centrat de selectie de ordin�.

Observatia 4.2.13.Se vede imediat ca��� � �, iar momentul centrat de ordinul doi

se poate scrie��� � ��� � ����.Proprietatea 4.2.14.Fie caracteristica� pentru care exista momentul teoretic��,atunci pentru momentul centrat de ordinul doi avem

� � ���� � ��

��

�� si�

�� � ���� � ��

���

��� � ���� � �� � ����

�unde�� � �

�� ���, si de asemenea

��� �� � ���� � ��

���

��

Demonstratie.Pentru prima relatie scriem succesiv

� � ���� �� � ���� �� ����� � ��� ����� ������

�� � �

����������

��������

� ���

� ������

����� �

����������

� ����� ��� �

���� ���

���� � � �� � �� ���� � ��

� ��

��� �

��

���

���

��

�� � ���� � ��

��

�� �Daca se retin extremitatile sirului de egalitati avem prima relatie.

Pentru a calcula dispersia, consideram variabilele aleatoare reduse, notate prin�� � �� �� ����, � � ���, care sunt independente si identic repartizate si pentrucare� ���� � �

,�

�� ���� � ��, � � ���.Se arata usor ca

��� � ��

�����

�� � �� �� �unde �� � �

�����

���

Page 214: Stat_Matlab.PDF

204 Teoria selectiei

Pe de alta parte avem ca

��� � ���� � � ����� �

�� � ������ � � ����� �

���

�� ���� �

A ramas, prin urmare, de calculat� �����. Pentru aceasta avem

� ����� � �

����� �����

�� � �� ���� � ����

�� �����

� �� � � �� �����

�� � � �� ���� ����

�� �����

� ���� �� ���� ����

�� �����

� �� ����� �� � �����

� �� � �� �� ��

de unde se obtine

� ����� � ������ �����

� �� �� � �

����� �

�����

� �� � �� �� ���

Calculam pe rand termenii din membrul drept al aceste relatii. Astfel avem

��� �����

� �� �� � ������

� �� �� � ���������

� � �� �� � �� � � ��� � � �� � ����� �

apoi

��� �

�����

� �� � � ������ �����

� �� � �

����������

������ �����

� �� �� ����

� �����

� �� � �

����������

� �� � �� � �

��

��� �������

����� ��

� ���

���� � � �� � ������ � �

��� � �

��

���� �

deoarece������ �� � � �

, pentru orice��� �� � ���,

� �� �. Pentru ultimul termenavem

� �� �� � �

���� �����

� �� � �����������

� �� � �� �

� ���

���� � �� �� � ������ � �

���� � � �� � ��

�� ��� �

Page 215: Stat_Matlab.PDF

4.2. Functii de selectie 205

Termenii lui� �� ��, care nu au fost luati ın considerare, sunt nuli deoarece contin

ca factor pe� ���� � �. Obtinem ın acest fel ca

� ����� � ���

������ ����������

����� � �

��

����� ����� � � �����

�� ���

� �� � ����� �� � �� � �� �� � �

�� �

��� ��� �

deci pentru dispersie avem succesiv

��� � ���� � �� � ���

�� �� � �� � �� �� � �

�� �

��� ��� � �� � ���

�����

� �� � ����� �� � �� � �� �� � ��

�� ��� � �

��

�� ��� � ���� � �� � ������ �

adica�

�� � ���� � ��

��� ��� � ���� � �� � ������ �

Pentru ultima relatie putem considera� ��� � �, deci�

�� � � �, caz ın care

avem

��� �� � ���� � � �� ���� � ������ ������

��� ������

�� �� ����� ������ ������

��� �����

��� � �� ���� � ���

������

���� � ���

������

���� �

deoarece� ����� � � � ������� �

, cand� �� �. Asadar

��� �� � ���� � ��

� ��

��� �

��

����

Observatia 4.2.15.Din proprietatea precedenta avem ca

��� � ���� � �

�� ��������

���� �

deci�

�� � ���� � ��

�� ����� �

Deoarece��� �� � ��� � � ���� ��, avem ca statisticile�� si ��� sunt necorelatepentru� � �, iar daca� are distributia simetrica (�� � �

), atunci �� si ��� suntnecorelate pentru orice�.

Page 216: Stat_Matlab.PDF

206 Teoria selectiei

De asemenea se poate arata ca statistica

�� ���� ����������

converge ın repartitie la legea normala� ��� ��, cand� ��.

Definitia 4.2.16. Numimdispersie de selectiefunctia de selectie

��� � ���

�����

�� � �� �� �iar valoarea numerica ��� � �

��

����� ��� � �� �� �

se numestevaloarea dispersiei de selectie.

Observatia 4.2.17. Intre momentul centrat de selectie de ordinul doi si dispersia deselectie exista relatia

(4.2.2) ��� � �

��

���� �

Ca urmare avem ca

� ���� � �� � �� � ��� �� � ���� � ���� �

���

���� � �� �� � ��

��� � ���� � �� � �����

Proprietatea 4.2.18.Fie caracteristica� pentru care exista momentul centrat teo-

retic �� � ���� �

� �����, atunci� � ���� � �� �� ��� �

Demonstratie.Folosind formula binomului avem ca

��� � ��

�����

��� ���� � �

�����

���

�� ��

������� �� � � ����� ���

� ��� ����� �� ����� � � ����� ���

Fara a restrange generalitatea, se poate considera ca� ��� � �, deci au loc egalita-

tile �� � ��,� � ���. Putem scrie atunci

� ����� � � ����� ������ �� ������� � ������ � ���

Page 217: Stat_Matlab.PDF

4.2. Functii de selectie 207

� �� ������ �� ������� � ������ � ���

Pe de alta parte, din inegalitatea lui Schwarz, se obtine ca

������ ������ � �

������� ������� � � � ���

Daca se are ın vedere Proprietatea 4.2.11, rezulta ca

�������� � �

�� ���������� ������� � ��

�������� � ������ � ������ ����� � �

�������� ������� �

Se poate arata, de asemenea, ca� ����� � � �

�� �. Astfel din inegalitatea lui Sch-warz se obtine

�� ��� ������ � � ����� sau � ��� ������ � � �

��

� � � � � ����

In cazul� � �, se calculeaza direct

� �� ������ � ������ �����

���� �����

����� � � ���

�����

� ����

� ���� �

Luand ın considerare aceste evaluari, se obtine ın final

� ����� � �� ����� ��

���� � �� ��

����

Observatia 4.2.19.Printr–o cale analoga, se poate obtine ca

��� � ���� � ��� � �������� � ���� � ���������

�������

4.2.3 Coeficient de corelatie de selectie

Definitia 4.2.20. Fie caracteristica bidimensinala ���� � si o selectie repetata devolum�, cu datele de selectie��� ����, � � ���, si respectiv variabilele de selectie��� ����, � � ���. Numimcoeficient de corelatie de selectiefunctia de selectie

�� ���

��� ��� �� � ��

� �� ����

��� ��� �� �����

��� ��� �� ��

Page 218: Stat_Matlab.PDF

208 Teoria selectiei

iar valoarea numerica

�� ���

��� ���� �� � ��� � ����

����� ���

� �� �������� ��� � ����

se numestevaloarea coeficientului de corelatie de selectie.

Observatia 4.2.21.Fisher a aratat ca pentru o caracteristica bidimensionala ���� �,care urmeaza legea normala

� ������ ������ ���, densitatea de probabilitate a coe-ficientului de corelatie de selectie este

�� ��� � �� �� �

��� ���������������� � ��

������� ������� ��

�����

������ �� � ���

���� ������������������

�����

� ���� � �

�� � �������� � � � ���� �� �

De asemenea, daca se considera transformarea (lui Fisher) � � �� ln

� ������ si daca� � �

� ln� ���� � atunci� urmeaza aproximativ legea normala

� �� � ������� � �

����

.

In cazul particular� � �, avem densitatea de probabilitate a lui�� exprimata prin

�� ��� � ��� � ���� �� ���� �

���������� � � � ���� �� �

iar statistica

(4.2.3) � ���� � ���

�� ���

urmeaza legea Student cu�� �

grade de libertate.

Programul 4.2.22. Vom scrie un program, care genereaza deN ori caten vectorialeatori, ce urmeaza legea normala bidimensionala, avˆand coeficientul de corelatiedintre cele doua componente nul, adicar=0 . Folosind aceste date se vor calculaN numere aleatoare dupa regula precizata prin statistica (4.2.3), iar histograma co-respunzatoare acestor noi date va fi reprezentata grafic ımpreuna cu densitatea deprobabilitate a legii Student cun-2 grade de libertate.

clear,clf,mu(1)=input(’m1=’); mu(2)=input(’m2=’);v(1,1)=input(’sigma1ˆ2=’);v(2,2)=input(’sigma2ˆ2=’);v(1,2)=0; v(2,1)=0;

Page 219: Stat_Matlab.PDF

4.2. Functii de selectie 209

n=input(’n=’); N=input(’N=’);for k=1:NZ=mvnrnd(mu,v,n); r=corrcoef(Z); r12=r(1,2);t(k)=sqrt(n-2)*r12/sqrt(1-r12ˆ2);endx=-3:0.01:3; f=tpdf(x,n-2);nn=fix(1+10/3*log10(N));[fr,cl]=hist(t,nn); h=cl(2)-cl(1);bar(cl,fr/(h*N),1),hold on, plot(x,f,’k-’)colormap spring

PentruN=50, n=20 , mu=(5,10) , v ��2 00 3� �

se obtin graficele din Figura 4.2.

−3 −2 −1 0 1 2 30

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

0.45

Figura 4.2: Legea� ����

Lema 4.2.23 (Fisher).Daca variabilele aleatoare����� � � � �

��� sunt indepen-dente, fiecare urmand legea normala

� ��� �� si daca se considera matricea orto-normata

� � ���� ��������, atunci variabilele aleatoare

�� �������

���� � � � ����

sunt independente, fiecare urmand legea normala� ��� ��.

Demonstratie.Pentru a arata ca variabilele aleatoare��,

� � ���, sunt independentedeterminam functia caracteristica� a vectorului aleator������ � � � �

����. Pornind de

Page 220: Stat_Matlab.PDF

210 Teoria selectiei

la definitia functiei caracteristice avem

� ���� �� � � � �

� ��� ������

�� �����

����� � � ����

�� �����

�������

��������

����

�� �����

� �����

����������

Variabilele aleatoare�� , � � ���, fiind independente se obtine

� ���� �� � � � �

� ��� ���

��������

�� �����

����������

Fiecare factor din membrul drept este valoarea functiei caracteristice a legii normale� ��� ��, pe punctele, respectiv�

���� ����� , � � ���, adica

� ���� �� � � � �

� ��� ���

������

����

� �����

������� � ������

�����

� �����

�����������

����

�����

� �����

������� � �

����������

���������������

����

� �����

��������

���� � �

����������

����

�����

��������

Folosind conditiile de ortonormalitate relative la coeficientii ��� , se obtine ca

� ���� �� � � � �

� ��� � �������

�����

�����

adica faptul ca����� � � � �

��� sunt variabile aleatoare independente, ce urmeaza fie-care legea normala

� ��� ��.Proprietatea 4.2.24.Fie caracteristica�, ce urmeaza legea normala

� ��� �� si va-riabilele de selectie����� � � � �

���, ce corespund unei selectii repetate de volum�,atunci statisticile

�� ����� � ��

������

� � �� ������

�� � �� �� �

sunt variabile aleatoare independente, ce urmeaza legea normala� ��� �� si respec-

tiv legea�� cu��

�grade de libertate.

Page 221: Stat_Matlab.PDF

4.2. Functii de selectie 211

Demonstratie.Se considera matricea ortonormata

� �

��������

���

���

���

��� � � �

����

��� ���

� �� � �

����

���

� ��� �� � �

� � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � � ��������� �������� �������� �������� � � �

� ����������

��������

pentru care se aplica Lema 4.2.23.Pe de o parte avem ca

�� ��������

��� � ���

������

� � ��

si

� ��� � � �� � � �� � � ��

� � � ��� � � �� � ��� � ����

� ����

������

�� � ���� � ���

Deoarece����� � � � �

��� sunt independente rezulta ca�� si�� sunt independente.

Pe de alta parte�� � �� urmeaza legea normala� ��� ��, iar

�� fiind sumapatratelor a�

�� variabile aleatoare independente, fiecare urmand legea normala

� ��� ��, obtinem ca�� urmeaza legea�� cu �

�� grade de libertate (a se vedea

legea�� prezentata ın Capitolul 2).

Proprietatea 4.2.25. Fie caracteristica�, ce urmeaza legea normala� ����� si

variabilele de selectie����� � � � �

���, ce corespund unei selectii repetate de vo-lum�, atunci statisticile

�� ��� ��

��� � �� � ���

�����

�� � �� �� �

sunt variabile aleatoare independente, ce urmeaza respectiv legea normala� ��� ��

si legea�� cu��

�grade de libertate.

Demonstratie.Se considera variabilele aleatoare

�� � �� ���

� � � ����

Page 222: Stat_Matlab.PDF

212 Teoria selectiei

care sunt variabile aleatoare independente ce urmeaza fiecare legea normala� ��� ��.

Prin aplicarea Proprietatii 4.2.24 pentru variabilele aleatoare��, � � ���, se obtineafirmatia facuta.Intr-adevar avem ca

���

������

� � ���

�����

�� ���

� ��

si�����

��� ���� ������

������

� ��

�����

����

� �� � ���

�����

���� �

�����

����� ���

�����

�� � �� �� � ���

Proprietatea 4.2.26. Fie caracteristica�, ce urmeaza legea normala� ����� si

variabilele de selectie����� � � � �

���, ce corespund unei selectii repetate de vo-lum�, atunci statistica

(4.2.4) � ��� ��

���� ��� ��� ��

����

urmeaza legea Student cu��

�grade de libertate.

Demonstratie.Cu notatiile de la Proprietatea 4.2.25, aratam ca

� � ��� �����

Intr-adevar, avem succesiv

��� ����� �

�� ��

��� ���

��������� �� � �� �� �

�� ��� ������������� �� �

��

��� ��

���� �� �

Din teoria probabilitatilor se stie ca raportul dintreo variabila aleatoare, ce urmeazalegea normala

� ��� �� si radicalul unei variabile aleatoare ce urmeaza legea��, ra-portata la numarul gradelor de libertate, ın cazul ın care cele doua variabile aleatoaresunt independente, este o variabila aleatoare, ce urmeaz˘a legea Student cu acelasinumar al gradelor de libertate ca legea�� considerata (a se vedea legile�� si

�pre-

zentate ın Capitolul 2). Avand ın vedere cine sunt�� si�� rezulta afirmatia din

enuntul proprietatii.

Page 223: Stat_Matlab.PDF

4.2. Functii de selectie 213

Programul 4.2.27. Pentru ilustrarea acestui rezultat, programul Matlab, care urmea-za, genereaza o matrice de tipul(n,m) de numere aleatoare, ce urmeaza legea nor-mala

� �����, dupa care pentru fiecare coloana a matricei generate, se construiescdatele aleatoare conform statisticii (4.2.4). Pentru aceste date se reprezinta grafic his-tograma corespunzatoare, ımpreuna cu densitatea de probabilitate a legii Student cun-1 grade de libertate.

clear,clf, mu=input(’mu=’); sigma=input(’s=’);n=input(’n=’); m=input(’m=’);Z=normrnd(mu,sigma,n,m);t=(mean(Z)-mu)./sqrt(var(Z)/n);x=-3:0.01:3; f=tpdf(x,n-1);nn=fix(1+10/3*log10(m));[fr,clasa]=hist(t,nn);h=clasa(2)-clasa(1);bar(clasa,fr/(h*m),1)hold on, plot(x,f,’k-’)colormap([.7,.7,.7])

Pentrun=15 , m=100, mu=5 si sigma=2 , se obtin graficele din Figura 4.3.

−3 −2 −1 0 1 2 3 40

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

Figura 4.3: Legea� ����Proprietatea 4.2.28. Fie caracteristicile independente� �

si � ��, fiecare urmand

legea normala, respectiv� ��� ��� si

� ���� ��� si variabilele de selectie� ��� � � �

�� ��, respectiv� ��� � � � �

�� ���, ce corespund unei selectii repetate de volum�

pentru caracteristica� �si unei selectii repetate de volum�

��pentru caracteristica

Page 224: Stat_Matlab.PDF

214 Teoria selectiei

� ��, atunci statistica

(4.2.5) � � �� � � �� ��� � ��� ��������� �

�� �� � � ���� ��� �� ����

� ���� � �

�� �

��

unde

�� � � ���

������

�� � �� �� � ����

������

��� �

�� � � ��� � �

�����

� �� � �� ��� � �� �� � ���� � �

�����

� ��� � �� ���� �

urmeaza legea Student cu�� �

��� � �

grade de libertate.

Demonstratie.Conform Observatiei 4.2.6, avem ca mediile de selectie�� �si �� ��

urmeaza fiecare legea normala respectiv� ��� � ��� si

� ���� � ���. Prin urmare

statistica

� � �� � � �� ��� � ��� �����

�� �

� ���

urmeaza legea normala� ��� ��.

Pe de alta parte, folosind Proprietatea 4.2.25, se obtineca statistica

� � ���

�����

� �� � �� ��� � ���

�����

� ��� � �� ���� �

urmeaza legea�� cu �� �

��� � �

grade de libertate, fiind suma a doua variabilealeatoare independente, ce urmeaza legea�� cu�

� ��grade de libertate si respectiv

��� �

�grade de libertate.

Ca si la demonstratia Proprietatii 4.2.26, statistica� �� �� ��� urmeaza legea

Student cu�� �

��� � �

grade de libertate. Mai ramane de aratat ca aceasta statisticaeste chiar statistica� . Intr-adevar, avem succesiv

�� �� ��� �

�� � � �� ��� � ��� ������� �

� ���

��� �

��� � �

�������� � �� � �� ��� ������ � ��� � �� ����

Page 225: Stat_Matlab.PDF

4.2. Functii de selectie 215

� �� � � �� ��� � ��� ��������� � �� �� � � ���� � �� �� �� ��

� ���� � �

�� �

��

� � �

ceea ce trebuie demonstrat.

Observatia 4.2.29.Daca se considera caracteristicile independente� �si� ��

, fiecareurmand legea normala

� ��� ���� si respectiv� ���� ����� si daca avem variabilele

de selectie� ���� �

��� � �

�� ��, ce corespund unei selectii repetate de volum�

�relativa

la caracteristica� �si variabilele de selectie� ��� �� ��

��� � �

�� ��� � ce corespund unei

selectii repetate de volum���

relativa la caracteristica� ��, atunci statistica

� � �� � � �� ��� � ��� �����

��� � ���

urmeaza legea normala� ��� ��.

Proprietatea 4.2.30. Fie caracteristicile independente� �si � ��

, fiecare urmandlegea normala, respectiv

� ��� ���� si� ���� ����� si variabilele de selectie

� ��� � � �

�� ��, respectiv� ��� � � � �

�� ���, ce corespund unei selectii repetate de volum�

pentru caracteristica� �si unei selectii repetate de volum�

��pentru caracteristica

� ��, atunci statistica

(4.2.6) � ��� ��� � �� ��

���

urmeaza legea Fisher–Snedecor cu� � �

� �� si � � �

�� ��grade de libertate.

Demonstratie.Din Proprietatea 4.2.25, avem ca functiile de selectie

� � � �� �

�� �� ��� � � �� �

��� �

�� �� �����

urmeaza fiecare legea�� cu� � �

� �� si � � �

�� ��grade de libertate.

Pe de alta parte, deoarece� �si � ��

sunt independente,� �

si� ��

sunt indepen-dente. Din calculul probabilitatilor (a se vedea legeaf prezentata ın Capitolul 2) estecunoscut ca raportul a doua variabile aleatoare independente, ce urmeaza legea��,raportate fiecare la numarul gradelor de libertate corespunzator, este o variabila ale-atoare, ce urmeaza legea Fisher–Snedecor cu numarul gradelor de libertate date denumerele gradelor de libertate ale celor doua legi��. Asadar avem ca

� ��� ��� � �� ��

��� �� �

�� �

� � ��

��� �

urmeaza legea Fisher–Snedecor cu� � �

� �� si � � �

�� ��grade de libertate.

Page 226: Stat_Matlab.PDF

216 Teoria selectiei

Observatia 4.2.31.Daca� urmeaza legea Fisher–Snedecor cu�

si � grade de li-bertate, atunci

�� urmeaza legea Fisher–Snedecor cu� si

grade de libertate. Prinurmare, daca notam cu�������� cuantila de ordin�

�� a lui � , adica, numarul pen-

tru care are loc� �� � ��������� � ����

atunci avem ca�

������� �������� �

unde

������ este cuantila de ordin� a lui�� . Intr-adevar avem ca relatia care defineste

pe ������, � ��� ������

� � ��este echivalenta cu� �

� � �������

� � sau cu

relatia� �� � �

������

� �

��� Comparand ultima relatie cu relatia care defineste

cuantila��������, se obtine relatia dintre cele doua cuantile mai sus precizata.

Programul 4.2.32. Pentru ilustrarea Proprietatilor 4.2.28 si 4.2.30, vomgenera douamatrice de tipurile(n1,m) si (n2,m) , ale caror elemente sunt numere aleatoare, ceurmeaza respectiv legile normale

� ������� si� ��� ����. Folosind cele doua ma-

trice se vor determina, pentru fiecare pereche de coloane cu acelasi numar de ordine,din cele doua matrice, datele construite conform definitiilor statisticilor (4.2.5) si(4.2.6). Datele astfel obtinute se reprezinta grafic folosind histogramele corespunza-toare, ımpreuna cu densitatea legii Student cun1+n2-2 grade de libertate, respectiva legii Fisher–Snedecor cun1-1 si n2-1 grade de libertate.

clear,clfmu1=input(’mu1=’); s1=input(’sigma1=’);mu2=input(’mu2=’); s2=input(’sigma2=’);n1=input(’n1=’); n2=input(’n2=’); m=input(’m=’);X1=normrnd(mu1,s1,n1,m); X2=normrnd(mu2,s2,n2,m);t=(mean(X1)-mean(X2)-mu1+mu2);t=t./sqrt((n1-1)*var(X1)+(n2-1)*var(X2));t=t*sqrt((n1+n2-2)/(1/n1+1/n2));f=(var(X1)/s1ˆ2)./(var(X2)/s2ˆ2);x1=-3:0.01:3; x2=0:0.01:6;f1=tpdf(x1,n1+n2-2); f2=fpdf(x2,n1-1,n2-1);nn=fix(1+10/3*log10(m));[fr1,c1]=hist(t,nn); [fr2,c2]=hist(f,nn);h1=c1(2)-c1(1); h2=c2(2)-c2(1);subplot(1,2,1)bar(c1,fr1/(m*h1),1), hold on, plot(x1,f1,’k-’)hold offsubplot(1,2,2)bar(c2,fr2/(m*h2),1), hold on, plot(x2,f2,’k-’)colormap([.7,.7,.7])

Pentrun1=15 , n2=20 , m=50, mu1=5, mu2=10, sigma1=2 si sigma2=3 , seobtin graficele din Figura 4.4.

4.2.4 Functie de repartitie de selectie

Definitia 4.2.33. Fie caracteristica� cercetata, datele de selectie����� � � � �

���si variabilele de selectie����� � � � �

���. Numimfunctie de repartitie de selectie,

Page 227: Stat_Matlab.PDF

4.2. Functii de selectie 217

−4 −2 0 2 40

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

0.45

0.5

0 2 4 60

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

Figura 4.4: Legea� ���� si legea� ���� ���

functia de selectie definita prin

��� ��� � �� ����

� � � ��

unde�� ��� � card

��� ��� � �� � � ��� ��iar

��� ��� � card��� ��� � �� � � ��� �

� � � � �se numestevaloarea functiei de repartitie de selectie.

Observatia 4.2.34.Valoarea functiei de repartitie selectie este o functie ın scara deo variabila reala. Daca datele de selectie sunt ordonate crescator, atunci

��� ��� ��������

��daca� � ����

�daca���� � � � �� � � � ����

�� daca� � ���

De asemenea, functia de repartitie de selectie, se vede ca este o variabila aleatoarede tip discret si care are distributia

��� �����

��

��� �� ����� ���� ��������������

Page 228: Stat_Matlab.PDF

218 Teoria selectiei

Pentru demonstratia unui rezultat fundamental al statisticii matematicii, descope-rit de matematicianul rus Glivenko, vom prezenta doua leme.

Lema 4.2.35. Fie sirul de evenimente������� astfel ıncat � ���� � �, � � �,atunci, pentru evenimentul� � �������, avem� ��� � �.

Demonstratie.Aratam la ınceput ca proprietatea enuntata are loc pentru un numarfinit

de evenimente. Demonstratia o facem prin inductie dupa�

.Pentru

� � �, avem� ��� ���� � � ���� � �, de unde� ��� ���� � �,

care ınlocuita ın relatia

� ��� ���� � � ����� � ���� �� ��� ���� �conduce la� ��� ���� � �.

Presupunem ca proprietatea are loc pentru�

si aratam ca este adevarata si pentru� � �. Din nou avem ca� ��� �

��� ���� ��� ��� �, deci� ��� �

��� ��� �.

Scriem formula lui Poincare si tinem seama de ipoteza inductiei, ceea ce conduce la

� � ��� ����

��� � � �����

� ���� �� ����������

� ��� ��� �� � �������� �����

����

�� � �

� � � �� � �

� � � � ��������� � �� � � ������

�� �����

����

Retinem extremitatile si vom obtine

�������� �����

��� � �� � �� �� �

� � �� �� �

� � �� �� � �����

�� � �� �

sau

�������� �����

��� � ��� ��� � � ����� ��� � �� � ���

adica���� ���� ��� � �.

Cand sirul de evenimente este infinit, avem ın vedere scrierea lui� ca urmatoareaintersectie de evenimente

� � �� � ��� ���� � ��� ��� ���� �

unde evenimentele intersectiei satisfac relatiile

�� � ��� ���� � ��� ��� ���� �

Page 229: Stat_Matlab.PDF

4.2. Functii de selectie 219

Conform teoremei de continuitate din teoria probabilitat¸ilor si avand ın vedere prima

parte a demonstratiei putem ıncheia prin� ��� � ������ ���������� � ��

Din calculul probabilitatilor este cunoscuta forma tare a teoremei lui Bernoullisau teorema lui Borel si care o dam sub forma unei leme.

Lema 4.2.36.Se considera � repetari independente ale unui experiment. La fiecarerepetare evenimentul�apare cu probabilitatea�. Fie

�frecventa absoluta a aparitiei

evenimentului� ın cele� repetari, atunci

��������

����

��

�� ����� �� � ��

adica frecventa relativa a aparitiei evenimentului� converge tare (aproape sigur) laprobabilitatea� de aparitie a evenimentului�.

Teorema 4.2.37 (Glivenko).Fie caracteristica� care are functia de repartitie teo-retica � si fie o selectie repetata de volum� relativa la caracteristica� cu variabi-lele de selectie����� � � � �

��� si functia de repartitie de selectie��� corespunzatoa-re, atunci

��������

����� ��

��� ��� �� �������� � ��

adica functia de repartitie de selectie converge aproape sigur la functia de repartitieteoretica.

Demonstratie.Se considera� � � oarecare, dar fixat, si consideram numerele����,� � ��

�, definite prin relatia

���� � ����� � � �� ��� �

��

� � �� � �� ��

Geometric, punctul���� se obtine dupa cum este aratat ın Figura 4.5 si reprezintacuantila de ordin

��

Daca se considera evenimentul���� � �� � �����, atunci avem

� ������ � � �� � ����� � � ������

si��� ������ �

�� �������

� card��� ��� � �

��� � � � ��� �

Prin urmare��� ������ este frecventa relativa a aparitiei evenimentului���� si conformLemei 4.2.36 rezulta ca

����������

��� ������ �� ����������� � ��

Page 230: Stat_Matlab.PDF

220 Teoria selectiei

0

1

xr,k

y=k/r

0

1

xr,k

y=k/r

0

1

xr,k

y=k/r

Figura 4.5: Determinarea cuantilei����

pentru fiecare� � ���. Se poate renunta la valoarea

� � �, deoarece���� � �� si��� ���� � � ���� � �

.Notam prin���� evenimentul

����� ������ �� ��������

�� ��cand� ���

Deoarece� ������ � �,� � ���, conform Lemei 4.2.35, rezulta ca

� ���� � �� �������

��� � ��

unde evenimentul�� ınseamna

�������� ����� ������ �� ��������

�� ��cand� ���

In mod analog, considerand evenimentul���� � �� � ���� �, se obtine ca

�������� ��

��� ����� � �� �� ����� � ������� � ��

Page 231: Stat_Matlab.PDF

4.2. Functii de selectie 221

pentru fiecare� � ���. Daca se noteaza prin���� evenimentul

����� ����� � �� �� ����� � ����

�� ��cand� ���

si�� � ��������� , care ınseamna

�������� ����� ����� � �� �� ����� � ����

�� ��cand� ���

atunci� ���� � �.Daca se considera evenimentul�� � �� ���, care ınseamna

������������� ��� ������ �� ��������

� �� ��� ����� � �� �� ����� � ������� ��

atunci� ���� � �. In acest fel, daca� � �������, conform Lemei 4.2.35, avem� ��� � �, adica

������� ����������

��� ��� ������ �� ��������� �� ��� �����

� �� �� ����� � ������� �� � ��

Aratam ın continuare implicatia

� ��������

����� ��

��� ��� �� ���������

din care se va obtine

� � � ��� � ��������

����� ��

��� ��� �� �������� � ��

deci

��������

����� ��

��� ��� �� �������� � ��

Pentru aceasta sa consideram� � � oarecare. Pentru orice� � � va exista� � � astfel ıncat���� � � � ���� �. Avand ın vedere ca��� si � sunt functii

nedescrescatoare, putem sa scriem urmatoarele inegalitati:

��� ������ � ��� ��� � ��� ����� � � ��si

� ������ � � ��� � � ����� � � �� �de unde se obtine

��� ������ �� ����� � � �� � ��� ��� �� ��� � ��� ����� � � �� �� ������ �

Page 232: Stat_Matlab.PDF

222 Teoria selectiei

Pe de alta parte, din modul de definire a numerelor����, � � ��

�, avem ca

� � � ����� � � �� �� ������ � ��

de unde

� ������ � � ����� � � �� � ��

si � ����� � � �� � � ������� ��

Utilizate ın dubla inegalitate de mai ınainte, conduc la

��� �������� ������� ��

� ��� ����� ��� � ��� ����� � � ���� ����� � � ��� ��

Din prima inegalitate se obtine

� ��� � ��� ��� � � ������ � ��� ������� ��

de unde

����� ��� �� �����

� ����� ������ �� ��������

� ��� ��������

������ ����� � �� ����� ����

� ��

Din a doua inegalitate se obtine

����� ��� �� �����

� ����� ����� � � �� �� ����� � � ����

� ��� ��������

������ ����� � �� �� ����� � �����

� ��

Folosind cele doua inegalitati obtinute rezulta ca����� ��� �� �����

�����, unde

���� � ���������������� ������ �� ��������

� �� ��� ����� � �� �� ����� � ������ �

de unde����� ��� �� �����

� ����� ����, pentru orice� � �.

In final avem ca����� �� ��� ��� � � ������ ���

�� ����, care conduce la

implicatia care trebuia demonstrata.

Teorema 4.2.38 (Kolmogorov).Fie caracteristica� care are functia de repartitieteoretica � continua si fie o selectie repetata de volum� relativa la caracteristica�

Page 233: Stat_Matlab.PDF

4.2. Functii de selectie 223

cu variabilele de selectie����� � � � �

��� si corespunzator functia de repartitie deselectie ���, atunci

������� ���� � �� �� ��� � � �

��

unde

�� � ����� ��

��� ��� �� ������

iar� ��� �

������ ����� ����� � � �

��

estefunctia lui Kolmogorov.

Observatia 4.2.39. Teorema lui Kolmogorov reprezinta comportarea asimptoticaa distantei dintre functia de repartitie de selectie si functia de repartitie teoretica.Demonstratia poate fi gasita ın [56].

Observatia 4.2.40.Functia lui Kolmogorov este tabelata, pentru anumite valori, ınAnexa V.

Observatia 4.2.41.Pentru calculul valorilor aproximative ale functiei lui Kolmogo-rov se pot utiliza urmatoarele formule de aproximare

� ��� �

���������������������

��daca� � �

������

����

��������������� daca��

�� � � � ��

�� �

�����

������� ����� � daca� � � � ����

�� daca� � ����

4.2.5 Functiacdfplot

Statistics tooboxdispune de functiacdfplot , care reprezinta grafic functia derepartitie de selectie. Apelul functiei se poate face prin:

cdfplot(x)h=cdfplot(x)[h,stats]=cdfplot(x)

Prima forma reprezinta grafic functia de repartitie de selectie corespunzatoare da-telor continute de vectorulx , caracteristici cum ar fi culoarea, tipul liniei etc. suntconsiderate implicit de sistemul Matlab. Pentru modificarea unor astfel de caracteris-tici, adica alegerea acestora de catre utilizator, se recomanda a doua forma, prin careparametrulh poate fi folosit ın comandaset .

Page 234: Stat_Matlab.PDF

224 Teoria selectiei

Parametrulstats contine, dupa executarea functiei, o parte din parametrii stat-sitici pentru x . Acestia sunt: valoarea minima (stats.min ), valoarea maxima(stats.max ), valoarea mediei de selectie (stats.mean ), valoarea medianei(stats.median ) si abaterea standard (stats.std ).

Functia 4.2.42.Functia Matlab care urmeaza genereazan numere aleatoare, care ur-meaza o lege de probabilitate precizata, dupa care reprezinta grafic, pe aceeasi figura,functia de repartitie teoretica prin linie-punct, ımpreuna cu functia de repartitie deselectie.

function compar(n,lege)% Functie de repartitie de selectie% lege - legea de probabilitate% n - volumul datelorclfswitch legecase ’unid’

N=input(’N=’);X=unidrnd(N,n,1); [med,var]=unidstat(N);x=med-3*sqrt(var):0.01:med+3*sqrt(var);f=cdf(lege,x,N);

case ’bino’m=input(’n=’); p=input(’p=’);X=binornd(m,p,n,1); [med,var]=binostat(m,p);x=med-3*sqrt(var):0.01:med+3*sqrt(var);f=cdf(lege,x,m,p);

case ’hyge’M=input(’M=’); K=input(’K=’); m=input(’n=’);X=hygernd(M,K,m,n,1); [med,var]=hygestat(M,K,m);x=med-3*sqrt(var):0.01:med+3*sqrt(var);f=cdf(lege,x,M,K,m);

case ’poiss’la=input(’lambda=’);X=poissrnd(la,n,1); [med,var]=poisstat(la);x=med-3*sqrt(var):0.01:med+3*sqrt(var);f=cdf(lege,x,la);

case ’nbin’r=input(’r=’); p=input(’p=’);X=nbinrnd(r,p,n,1); [med,var]=nbinstat(r,p);x=med-3*sqrt(var):0.01:med+3*sqrt(var);f=cdf(lege,x,r,p);

case ’geo’p=input(’p=’);X=geornd(p,n,1); [med,var]=geostat(p);x=med-3*sqrt(var):0.01:med+3*sqrt(var);f=cdf(lege,x,p);

case ’unif’a=input(’a:’); b=input(’b(a<b):’);X=unifrnd(a,b,n,1); [med,var]=unifstat(a,b);

Page 235: Stat_Matlab.PDF

4.2. Functii de selectie 225

x=med-3*sqrt(var):0.01:med+3*sqrt(var);f=cdf(lege,x,a,b);

case ’norm’mu=input(’mu=’); s=input(’sigma=’);X=normrnd(mu,s,n,1); [med,var]=normstat(mu,s);x=med-3*sqrt(var):0.01:med+3*sqrt(var);f=cdf(lege,x,mu,s);

case ’logn’mu=input(’mu=’); s=input(’sigma=’);X=lognrnd(mu,s,n,1); [med,var]=lognstat(mu,s);x=med-3*sqrt(var):0.01:med+3*sqrt(var);f=cdf(lege,x,mu,s);

case ’gam’a=input(’a=’); b=input(’b=’);X=gamrnd(a,b,n,1); [med,var]=gamstat(a,b);x=med-3*sqrt(var):0.01:med+3*sqrt(var);f=cdf(lege,x,a,b);

case ’exp’mu=input(’mu=’);X=exprnd(mu,n,1); [med,var]=expstat(mu);x=med-3*sqrt(var):0.01:med+3*sqrt(var);f=cdf(lege,x,mu);

case ’beta’a=input(’a=’); b=input(’b=’);X=betarnd(a,b,n,1); [med,var]=betastat(a,b);x=med-3*sqrt(var):0.01:med+3*sqrt(var);f=cdf(lege,x,a,b);

case ’weib’a=input(’a=’); b=input(’b=’);X=weibrnd(a,b,n,1); [med,var]=weibstat(a,b);x=med-3*sqrt(var):0.01:med+3*sqrt(var);f=cdf(lege,x,a,b);

case ’rayl’b=input(’b=’);X=raylrnd(b,n,1); [med,var]=raylstat(b);x=med-3*sqrt(var):0.01:med+3*sqrt(var);f=cdf(lege,x,b);

case ’t’m=input(’n=’);X=trnd(m,n,1); [med,var]=tstat(m);x=med-3*sqrt(var):0.01:med+3*sqrt(var);f=cdf(lege,x,m);

case ’chi2’m=input(’n=’);X=chi2rnd(m,n,1); [med,var]=chi2stat(m);x=med-3*sqrt(var):0.01:med+3*sqrt(var);f=cdf(lege,x,m);

case ’f’m1=input(’m=’); m2=input(’n=’);

Page 236: Stat_Matlab.PDF

226 Teoria selectiei

X=frnd(m1,m2,n,1); [med,var]=fstat(m1,m2);x=med-3*sqrt(var):0.01:med+3*sqrt(var);f=cdf(lege,x,m1,m2);

otherwiseerror(’Lege necunoscuta’)

endplot(x,f,’k-.’), hold on, cdfplot(X), grid offtitle(’Functia de repartitie de selectie’)

Apelul functieicompar se face prin

>>compar(n,’lege’)

unde valorile pentrun si lege , fie ca sunt precizate ın acest apel, fie sunt precizateınainte. De exemplu, comanda

>>compar(25,’bino’)

are ca efect apelul functiei pentru legea binomiala, iar pe ecran se va cere introducereaparametrilorn si p, dupa care pe ecran va fi reprezentat graficul din Figura 4.6,ıncazul ın caren=7 si p=0.4 .

−2 −1 0 1 2 3 4 5 6 70

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

x

F(x)

Functia de repartitie de selectie

Figura 4.6: Legea� �������Comanda

>>compar(15,’norm’)

are ca efect apelul functiei pentru legea normala, iar pe ecran se va cere introdu-cerea parametrilormu si sigma , dupa care pe ecran va fi reprezentat graficul dinFigura 4.7, ın cazul ın caremu=5 si sigma=2 .

Page 237: Stat_Matlab.PDF

4.2. Functii de selectie 227

−2 0 2 4 6 8 10 120

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

x

F(x)

Functia de repartitie de selectie

Figura 4.7: Legea� �����

Page 238: Stat_Matlab.PDF

228 Teoria selectiei

Page 239: Stat_Matlab.PDF

Capitolul 5

Teoria estimatiei

Relativ la colectivitatea�

este cercetata caracteristica�, care urmeaza legea de pro-babilitate data prin functia de probabilitate� �����, ce reprezinta functia de frecventadaca� este de tip discret, respectiv densitatea de probabilitateın cazul continuu, iar�

este un parametru real necunoscut. Se considera o selectie repetata de volum�avand corespunzator variabilele de selectie����� � � � �

���.

5.1 Functie de verosimilitate

Definitia 5.1.1. Numimfunctie de verosimilitate, functia de selectie

� ������ � � � �

������ �

������ ��� ��� �

Observatia 5.1.2.Daca se considera functia den variabile reale

� ������ � � � �

������ ������� ��� ��� �

aceasta reprezinta functia frecventa (ın cazul discret), respectiv densitatea de proba-bilitate (ın cazul continuu) a vectorului aleator������ � � � �

����.Definitia 5.1.3. Statistica

� � � ������ � � � �

���� estestatistica suficienta (exhaus-tiva) pentru parametrul

�, daca exista functia masurabila � �� � � nenegativa si

functia masurabila�� � � � nenegativa, astfelıncat

� ������ � � � �

������ � � ������ � � � �

������ ��� � � ������ � � � �

����� ����� �unde

� � � ������ � � � �

����.229

Page 240: Stat_Matlab.PDF

230 Teoria estimatiei

Observatia 5.1.4.Echivalenta cu conditia precedenta pentru suficienta statisticii�

este conditia ca functia de frecventa (ın cazul discret), respectiv densitatea de pro-babilitate (ın cazul continuu)� ���� � � �

����� ��� a vectorului aleator����� � �

����conditionata de evenimentul

� ����� � �

���� � �, sa nu depinda de parametrul

�.

Exemplul 5.1.5. Fie caracteristica� ce urmeaza legea lui Poisson cu parametrul��

�necunoscut, adica are functia de frecventa

� ����� � ��

�� ��� � � � �� ���� � � � �

Consideram statistica� �

�������. Deoarece variabilele aleatoare����� � � � �

���

sunt independente si identic repartizate cu� avem ca�

urmeaza legea lui Poissonde parametru�

�, adica

� �� � �� � ������� ���� � � � �� ���� � � �

Pe de o parte avem:

� ������ � � � �

������ ������� ��� ��� �

�����

������ � ���� � ��������

������� �e����

��

������� � �

�� �e��� �

Se poate considera

� ������ � � � �

���� � ������

�� � �

�� �� �

����� � ��

e��� �

Avand ın vedere ca putem scrie si

� ������ � � � �

������ � ������� e��� ��

�������

�� � �

�� ��

se poate considera de asemenea

� ������ � � � �

���� ���

�������

�� � �

�� �� �

����� � ������� e��� �

Prin urmare, unicitatea acestei scrieri nu se impune.Pe de alta parte, avand ın vedere ca

�urmeaza legea

� ����, avem succesiv

� ������ � � � �

����� ��� �� ��� � ����� � ���� � �

��� � �� �� � ��

Page 241: Stat_Matlab.PDF

5.1. Functie de verosimilitate 231

�� ��� � ����� � ���� � �

��� � �� �� � ��� �� � ��

����� � ���

� � �

����� � ������� � � �������� ��

� �� � ����

��� � � �������� ��������� � ��� � ���

� �� � ��

����������� ������������ ��������������

������ � ���������

�� ���� ���

�������

�� � �

�� �

Asadar� ������ � � � �

����� ��� nu depinde de parametrul�, decat prin intermediul

valorii statisticii�

.

Exemplul 5.1.6 (Familia exponentiala). Se considera caracteristica�, care arefunctia de probabilitate de forma

� ����� � ����� ���� ���� � ���� � �����

Vom arata ca, ın acest caz, statistica

� � � ������ � � � �

���� ������� ����

este suficienta pentru parametrul�. Intr-adevar avem ca

� ������ � � � �

������ ������� ��� ���

� ����� ��������� ����� �� ����

�����

� �����

� ����� ��������� ����� �� ���

����� �

����� ����

��

Daca se considera

� ������ � � � �

���� � ���� �����

� �����

si�

����� � ����� ��� �� �� �����

atunci� ������ � � � �

������ � � ������ � � � �

����� ����� �deci conditia suficientei este ındeplinita.

Page 242: Stat_Matlab.PDF

232 Teoria estimatiei

Definitia 5.1.7. Numimcantitate de informatie (Fisher)a unei selectii de volum�relativa la parametrul

� � � necunoscut, valoarea medie

�� ��� � ������� ������ � � � �

��� ����� ���

cand functia de verosimilitate este derivabila ın raport cu�.

Observatia 5.1.8.Daca parametrul� este�–dimensional, matricea

� �����

�� �� � ����� � �

���������

� � �� � ����� � �

��������� ���������se numestematricea informatiei lui Fisher.

Teorema 5.1.9.Daca domeniul valorilor caracteristicii� nu depinde de parame-trul

�, iar functia de verosimilitate este derivabila de doua ori ın raport cu

�, atunci

�� ��� � �����ln � ������ � � � �

��������� �

Demonstratie.Se porneste de la relatia cunoscuta

�� � �

��� � ������ � � � �

������������ � � �

��� � ��

pe care o satisface densitatea de probabilitate. Se deriveaza aceasta relatie ın raportcu

�si se tine seama de faptul ca�� ������ � � � �

�������� � � ������ � � � �

�����ln � ������ � � � �

�������� �

obtinandu-se

�� � �

����ln � ������ � � � �

�������� � ������ � � � �

������������ � � �

��� � ��

Derivand ınca odata ın raport cu�

rezulta

�� � �

�����ln � ������ � � � �

��������� � ������ � � � �

������������ � � �

�����

� � �

����ln � ������ � � � �

�������� �� ������ � � � �

�������� ������ � � �

��� � ��

Page 243: Stat_Matlab.PDF

5.1. Functie de verosimilitate 233

sau, avand ın vedere relatia de mai ınainte, rezulta c˘a

�� � �

�����ln � ������ � � � �

��������� � ������ � � � �

������������ � � �

�����

� � �

�����

ln � ������ � � � �

�������� �� ������ � � � �

������������ � � �

��� � ��

Asadar am obtinut ca

����ln � ������ � � � �

�����������

���ln � ������ � � � �

�������� �� � ��

de unde avem relatia dorita.

Observatia 5.1.10. In demonstratia teoremei precedente am considerat cazul uneicaracteristici� de tip continuu.In mod analog se procedeaza si ın cazul discret,integrala multipla este ınlocuita cu o suma multipla.

Corolarul 5.1.11. Cand domeniul de definitie al caracteristicii� nu depinde deparametrul

�, atunci�� ��� � ��� ���.

Demonstratie.Deoarece selectia este repetata, avem ca��ln � ������ � � � �

��������� ������

��ln � ��� ������

Folosind Teorema 5.1.9, se obtine

�� ��� � �������

���ln � ��� �������

�����

�� ��� � ��� ��� �

deoarece�� ��� � ��

���ln � �� ������

Observatia 5.1.12.Din demonstratia Teoremei 5.1.9 avem de asemenea ca

�� ��� � ���

��ln � ������ � � � �

�������� �

deoarece

���

ln � ������ � � � �

��������

� ��

Page 244: Stat_Matlab.PDF

234 Teoria estimatiei

Exemplul 5.1.13. Sa consideram caracteristica�, ce urmeaza legea normala� �����, unde� � � este necunoscut, iar� �

�este cunoscut.

Deoarece

� ����� � �����e� ������ � � � � �

avem ca

�� ��� � ����

ln � �� ����� �� � � ��� ������

� ���

Prin urmare, cantitatea de informatie continuta (adus˘a) de o observatie, relativ laparametrul�, este cu atat mai mare cu cat dispersia este mai mica.

Teorema 5.1.14.Fie caracteristica�, cu functia de probabilitate� �����derivabilade doua ori ın raport cu

�si statistica

� � � ������ � � � �

���� relativa la caracte-ristica�, cu functia de probabilitate

������, atunci cantitatea de informatie

�� ��� � ����� ���

������ ��

relativa la parametrul�

continuta ın statistica�

nu depaseste cantitatea deinformatie�� ��� continuta de selectia considerata, adica �� ��� � �� ���.Demonstratie.Daca

������ este functia de frecventa (ın cazul discret), respectiv

densitatea de probabilitate (ın cazul continuu) pentru statistica�

, atunci

� ������ � � � �

������ ��

����� � ������ � � � �

����� ��� �

unde � ������ � � � �

����� ��� este functia de frecventa (ın cazul discret), respectivdensitatea de probabilitate (ın cazul continuu) pentru vectorul aleator����

� � �

����conditionata de evenimentul�� � ��.

Asadar avem ca

(5.1.1)

��ln � ������ � � � �

��������� ���ln �

�������� ���ln � ������ � � � �

����� ������ �

deci

�� ��� � �� ��� �����ln � ������ � � � �

����� ������

� �� ��� �

ceea ce trebuia aratat.

Page 245: Stat_Matlab.PDF

5.1. Functie de verosimilitate 235

Exemplul 5.1.15. Se considera caracteristica� ce urmeaza legea normala� �����

si o selectie repetata de volum�. Vom compara informatia dispersiei de selectie

��� � ���

�����

�� � ���� �

relativa la dispersia teoretica�

����� � ��, cu informatia selectiei relativa la acelasiparametru.

Calculam prima data informatia selectiei de volum� relativa la parametrul notatcu

� � �� � ��� ���. Avand ın vedere ca densitatea de probabilitate a caracteristicii

� este

� ����� � �����e� ������ � � � ��

se obtine�ln � ������ � � � �

��� �

��� �� ���� si�� ln � ������ ��

� ����

� ��� �� ����

Rezulta astfel ca

�� ��� � ����� � � ����

� ����

��� ��� �� � �

����

deci �� ��� � ����

Pe de alta parte, se stie ca statistica

�� � ��

��� ��� � �

������

�� � �� ��

urmeaza legea�� cu��

� grade de libertate. Avand ın vedere legatura dintre statis-ticile �� si ��� rezulta ca densitatea de probabilitate pentru��� este data prin

������ � �

���� � ���� ����

�� ���� ���� ��e� ������� � �

���

Astfel se obtine ca

ln�

����� � C� �

��

� ln��

��� �

��

� ln� � �� � ���

���

Page 246: Stat_Matlab.PDF

236 Teoria estimatiei

de unde�ln

�������� � ��

��

��� �� � ���

��� si

��ln ��������� � �

��

���� �� � ���

��

Calculam acum informatia dispersiei de selectie relativa la��. Pentru aceasta tinemseama de faptul ca

� ���� � ����

����� � ��

��

� �� � �� � �� �Astfel obtinem:

��� ��� � ���

����

� ��

��� � ���� � ��

��

���� �

��

���

deci��� ��� � �

��

���� �

���� �� ��� �

Observatia 5.1.16.Deoarece, ın cazul unei statistici�

suficiente, avem ca functia� ������ � � � �

���� ��� nu depinde de

�rezulta ca�� ��� � �� ��� ın acest caz. Acest

lucru se obtine imediat, daca se are ın vedere relatia (5.1.1).

5.2 Functii de estimatie

Definitia 5.2.1. Fie caracteristica� cu functia de probabilitate� �����, parame-trul

� � � necunoscut si o selectie repetata de volum�. Numimfunctie de estimatie(estimator)pentru parametrul

�, functia de selectie

�� � �� ������ � � � �

���� �care ia valori ın domeniul�, iar valoarea numerica

�� � �� ������ � � � �

���� senumesteestimatialui

�.

Definitia 5.2.2. Estimatorul�� � �� ������ � � � �

���� este estimator (functie de es-

timatie) nedeplasatpentru parametrul necunoscut�, daca �

���� ��

iar valoarea

numerica�� � �� ������ � � � �

���� se numesteestimatie nedeplasatapentru parame-trul

�.

Definitia 5.2.3. Spunem ca estimatorul�� � �� ������ � � � �

���� esteestimator con-

sistent, pentru parametrul necunoscut�, daca

�� p�� �, adica

������� � ����� � � ���

� �

� ��

pentru orice � ��, iar valoarea numerica

�� � �� ������ � � � �

���� se numesteestimatie consistentapentru parametrul

�.

Page 247: Stat_Matlab.PDF

5.2. Functii de estimatie 237

5.2.1 Functii de estimatie absolut corecte

Definitia 5.2.4. Numimfunctie de estimatie (estimator) absolut corectapentru para-metrul

�, functia de selectie

�� � �� ������ � � � �

����, care satisface conditiile

(i) ����

� ��

(ii) �������

�����

� ��

iar valoarea numerica�� � �� ������ � � � �

���� se numesteestimatie absolut corectapentru parametrul

�.

Proprietatea 5.2.5. Un estimator absolut corect este un estimator consistent.

Demonstratie.Fie estimatorul�� � �� ������ � � � �

����, un estimator absolut corectpentru parametrul

�. Din inegalitatea lui Cebısev avem

� � � � ����� � � ���

� �

� ���

�����

���

pentru orice� ��. Facand pe� ��, se obtine

������� � ����� � � ���

� �

� ��

pentru orice� ��, ceea ce trebuie demonstrat.

Exemplul 5.2.6. Fie caracteristica�, ce urmeaza legea normala� �����, unde pa-

rametrul� � � este cunoscut, iar� ��

este necunoscut. Considerand o selectierepetata de volum�, vom determina constanta�� astfel ıncat statistica

�� � ������� ��

� �� �

sa fie estimator absolut corect pentru abaterea standard�.

Avand ın vedere ca variabilele de selectie��,��, . . . ,�� sunt variabile aleatoareidentic repartizate cu�, putem scrie succesiv

(5.2.1)� �� � � ��

������ ���� �� �� � ��

������ ��� �� ��

� ���� ��� �� �� �

Page 248: Stat_Matlab.PDF

238 Teoria estimatiei

Tinem seama de faptul ca� urmeaza legea normala� ����� si obtinem

� ��� �� �� � � ��� �� �� �� ������� � �

���� � ��� �� �� �e� ������ ��

Facem schimbarea de variabila��� � �

si tinem seama de faptul ca functia obtinutaeste para, iar intervalul de integrare este simetric fat˘a de origine:

� ��� �� �� � ����� � �

�� �� ��� �� �� � ����� � �

���� �� ��

� ����� ������ ��� ����

��

� ����

Din conditia de nedeplasare si din formula (5.2.1) avem

� � � �� � � ������� �

adica�� � ����

� Pana aici am aratat ca statistica

�� � ��

���

����� ��

� �� �este un estimator nedeplasat pentru parametrul�.

Deoarece selectia considerata este repetata rezulta ca variabilele de selectie suntindependente, prin urmare se poate scrie

���

�� �� ����

�����

��� ������ ��� �

���

�����

��� ����� ��� �

��

��� ����� �� �

Astfel este ındeplinita si conditia (ii) din Definitia5.2.4, anume�

�� �� � � �

��

��� ��� �� �� �� ��

cand ���

Remarcam ca�

�� ��� �� �� � � ��� ����� � �� ��� �� ��� � �� � ���� � � � �� �� �

Proprietatea 5.2.7. Fie caracteristica� pentru care exista momentul teoretic deordinul

��, ��� � � ����, si fie o selectie repetata de volum�, atunci momentul de

selectie de ordin�

��� � ��

�����

���

este functie de estimatie absolut corecta pentru parametrul��.

Page 249: Stat_Matlab.PDF

5.2. Functii de estimatie 239

Demonstratie.Din Proprietatea 4.2.11 avem ca� � ���� � �� si de asemenea

�������

�� � ���� � ��������� � ���

�� �

Conditiile Definitiei 5.2.4 sunt satisfacute, deci proprietatea este demonstrata.

Observatia 5.2.8. Media de selectie�� �� ���� este functie de estimatie absolutcorecta pentru media teoretica� ��� �� ���.5.2.2 Functii de estimatie corecte

Definitia 5.2.9. Numimfunctie de estimatie (estimator) corecta, pentru parametrulnecunoscut

�, functia de selectie

�� � �� ������ � � � �

����, care satisface conditiile

(i) ����������

� ��

(ii) �������

�����

� ��

iar valoarea numerica�� � �� ������ � � � �

���� se numesteestimatie corectapentruparametrul

�.

Proprietatea 5.2.10.Un estimator corect este un estimator consistent.

Demonstratie.Fie estimatorul�� � �� ������ � � � �

���� corect pentru parametrul�,

atunci din conditiile (i) si (ii) avem ca pentru orice� ��

si��

�exista numarul

natural� � � ����� astfel ıncat

������� � � ���

��

� si�

�����

����� �

pentru� ��

. Asadar, putem scrie

����� � � ���

� ����� �

���� ���

� ������� � � ���

� ����� �

���� ���

��

��

pentru� ��

, de unde daca����� �

���� ���

� �

��vom avea ca���

�� � � ���� �, pentru

� ��

. Prin urmare avem������ �

� ��� ����

� � � � ����� � � ���

� �

�� �

� �

care conduce la inegalitatea

������� �

���� ���

��

� � � � � ����� � � ���

� �

�� �

��

Page 250: Stat_Matlab.PDF

240 Teoria estimatiei

Pe de alta parte, folosind inegalitatea lui Cebısev,

� � ����� �

���� ���

��

� �� �� ��

�����

Deoarece�

�����

� ��� , pentru� �

�, rezulta ca

� � ����� �

���� ���

��

� �� ��

� ��

Prin urmare se ajunge la

� � ����� � � ���

� �

� � � ����� �

���� ���

��

� �� ��

� ��

de unde�� p�� �

, ceea ce trebuie aratat.

Proprietatea 5.2.11. Fie caracteristica� pentru care exista momentul teoretic deordin

��, ��� � �

����, si fie o selectie repetata de volum�, atunci momentulcentrat de selectie de ordin

��� � ��

�����

��� �� ��

este functie de estimatie corecta pentru momentul centrat teoretic de ordin�, adica

pentru�� � � ��� �

� ������.Demonstratie.Conform Observatiei 4.2.18 avem

������� � ���� � ��������� ��

���� � �� �

De asemenea, avem

�������

�� � ���� � ���������� � �������� � ���� � ���������

������� � �

Asadar, conditiile Definitiei 5.2.9 sunt satisfacute.

Observatia 5.2.12.Momentul centrat de selectie de ordinul�, ���, este functie de

estimatie corecta pentru dispersia teoretica�

�� ��� �� ���.Avand ın vedere Observatia 4.2.17 (formula (4.2.2)) avem ca dispersia de selectie

��� � ���

�����

�� � �� ��

este functie de estimatie absolut corecta pentru dispersia teoretica�

�� ��� �� ���.

Page 251: Stat_Matlab.PDF

5.2. Functii de estimatie 241

5.2.3 Functii de estimatie eficiente

Teorema 5.2.13 (Inegalitatea Rao-Cramer).Se considera caracteristica� avandfunctia de probabilitate� �����, � � ��� ��, pentru care exista derivata partiala deordinul ıntai ın raport cu

�si fie o statistica

�� � �� ����� � �

���� absolut corectapentru parametrul

�, atunci

���

��� � ��� ���

Demonstratie.Deoarece estimatorul��

este nedeplasat, avem ca����

� �, adica

�� � �

����� ���� � � �

����� ���� � � �

��������� � � �

��� � ��

unde� ���� � � �

������ ������ � ��� ��� este functia de verosimilitate.Prin derivarea ın raport cu

�a acestei relatii se obtine ca

�� � �

����� ���� � � �

��������� � ������

�� ��� ����� � ��������� � � �

��� � �

sau

�� � �

����� ���� � � �

����� �����

�ln� ��� ����� � ��

���� ��� �

������ � �

��� � ��

Pe de alta parte, deoarece

���

ln� ������� � ������� � ��

avem�

�����

�� � �

����

ln� ��� ����� � �����

� ��� ������

� � �

��� � ��

care scazuta din egalitatea obtinuta ınainte conducela

�� � �

������ ���� � � �

���� � � � �����

�ln� ��� �����

� ���� � � �

��������� � � �

������

adica

����� ����

� � �

���� � ��� �����

�ln� ��� ����� � � ��

Page 252: Stat_Matlab.PDF

242 Teoria estimatiei

Se aplica acum inegalitatea lui Schwarz si se obtine

� ������� ����

� � �

���� � ��� �����

�ln� ��� ����� ��

������ ����

� � �

���� � ���� �� �����

�ln� ��� ����� ��

�� ����� �

��

� �����

�ln� ��� �����

� ���

����� ��

��ln� �� �

���� �

adica�

����� � �

��

��

��

ln � �� �����

Dar avem ca

�� ��� � ��� ��� � �����

ln� �� ����� �� � �

���

��ln� �� �

���� �care ınlocuita ın inegalitatea dinainte conduce la inegalitatea Rao–Cramer.

Definitia 5.2.14. Se numesteeficientaa unei functii de estimatie absolut corecte,�� � �� ������ � � � �

����, pentru parametrul�, raportul

e���

� ���� ����

�����

Definitia 5.2.15. Spunem ca functia de estimatie absolut corecta pentru parame-trul

�,�� � �� ������ � � � �

����, esteeficientadaca inegalitatea Rao–Cramer este

verificata prin egalitate, adica ����

� �.

Exemplul 5.2.16. Se considera caracteristica� ce urmeaza legea normala� �����

si o selectie repetata de volum� relativa la aceasta caracteristica. Vrem sa deter-minam eficienta estimatorului lui� � �� �� ���, construit ın Exemplul 5.2.6, datprin

�� � ��

���

�����

����� � �

Stim ca������ si

���

���� ����� �� � deci �� este estimator absolut corect pentru�.

Page 253: Stat_Matlab.PDF

5.2. Functii de estimatie 243

Pe de alta parte avem

� ����� � �����e� ������ �

de unde ��ln � �������� � ���� ��� �� ����

Se calculeaza usor

�� ��� � ��� ��� � �������� � �� ����

���

��

��

Avem astfel eficienta estimatorului��

e �� � � ���� ���

���

�� � � ����

��

�� � ���� ��� � �

� ��

adica estimatorul�� nu este estimator eficient pentru parametrul�.

Teorema 5.2.17 (Rao-Cramer).Se considera caracteristica� cu functia de pro-babilitate � �����, � � ��� ��, care satisface conditiile Teoremei 5.2.13 si fie functiade estimatie absolut corecta

�� � �� ������ � � � �

���� pentru parametrul�. Conditia

necesara si suficienta ca��

sa fie functie de estimatie eficienta pentru parametrul�

este ca sa aiba loc reprezentarea

ln � ����� � �� ��� �� ��� � � �� ����� ��� �ın plus are loc formula

�� � �� ������ � � � �

���� � ��

�����

� ���� �

Demonstratie.Pentru necesitate, din demonstratia inegalitatii Rao–Cramer, avem caegalitatea ın aceasta inegalitate are loc daca inegalitatea lui Schwarz este verificataprin egalitate. Aceasta are loc daca si numai daca variabilele aleatoare consideratedepind ın mod liniar, adica

� ������ ������ � � � �

���� � ���

�����

�ln� ��� ����� � � �� �

Considerand�� � � (� oarecare),�� � ��� � const., (=0 de exemplu) avem

� ��� ��� ������ � �

��� � �� ��

ln� ������� � �� � ���

ln� ������� �

Page 254: Stat_Matlab.PDF

244 Teoria estimatiei

de unde �ln� ������� � � ���� ���� � ��� �

Astfel s-a obtinut ca

�����

�ln� ��� ����� � � ���

������ ����� �� ���

si prin urmare

� ��� ��� ������ � � � �

���� � �� � � ��������� ����� �� ��� �

de unde�� ������ � � � �

���� � � ���� ���

������ ����� �

� ���� ���

� ��

pentru orice����� � � � �

���. Rezulta de aici ca

�� � ���� ���

� � � �� ���� ���

� �

sunt constante (nu depind de�), deoarece

�� ������ � � � �

���� nu depinde de�. Prin

urmare�� ������ � � � �

���� � � ������ ����� � �

si daca se noteaza� ��� � �

�� ���� �, atunci

�� ������ � � � �

���� � � �����

� ���� � �

� � � � ��

�����

� ���� �

Asadar s-a ajuns la

�� � �� ������ � � � �

���� � ��

�����

� ���� �

Pe de alta parte, deoarece�ln� ������� � � ���� ���� � ��� �

Page 255: Stat_Matlab.PDF

5.2. Functii de estimatie 245

obtinem �ln� ������� �

�� ���

� ��� � �

� �� ��� �� � ��

�de unde �

ln� ������� �� ����

�� ��� � ��

Integram, dupa ce am notat��� ��� � ����� , ultima relatie ın raport cu�

si obtinem

� �ln� ������� �� � � ��� ��� �� ��� � � �� � �� ��� �� ��� � � � � �� �����

� �� ��� �� ��� � � �� ����� ��� �de unde

ln� ����� � �� ��� �� ��� � � �� ����� ����

Pentru suficienta se porneste de la relatia cunoscuta

�� � ������� � ��

adica �� exp ��� ��� �� ��� � � �� ����� ���� �� � ��

pe care o derivam ın raport cu�. Obtinem astfel ca

�� ��� ��� �� ��� � � � ������� � ��

de unde, deoarece��� �� �, rezulta ca

�� �� ��� � � � ������� � ��

Derivam din nou ın raport cu�

si se ajunge la

��� � ������� � �� �� ��� � � �� ������� �� � ��

de unde �� �� ��� � ����� ��� � ������� � ��

Deoarece� �� ��� � �, am obtinut astfel ca

��� �� ��� � �

��� ����

Page 256: Stat_Matlab.PDF

246 Teoria estimatiei

deci�

�����

� ���

���

�����

� ����� ����� ���

Pe de alta parte

�� ��� ���� ��� � � ����

ln� ������� �� �������

�� �� ���� ����� �� ��� � ���� ������� � ����� ����� �

��� ��� � ���� ��� �

Prin urmare putem scrie

����

� ���� ����

����� �

������

������ � ��

deci�� � �� ������ � � � �

���� este estimator eficient pentru parametrul�.

Exemplul 5.2.18. Se considera caracteristica� ce urmeaza legea� �����, cu�

cunoscut si� necunoscut. Vrem sa aratam ca media de selectie este estimator eficientpentru parametrul necunoscut

� � � ��� � ��. Pentru aceasta vom considera oselectie repetata de volum� relativa la aceasta caracteristica.

Functia de frecventa a caracteristicii� este

� ����� ���

�� ��

��� ��� �

����� �de unde

ln � ����� � ln

��

�� � � ln�

� �� ��� ln

��� �

��� �� � �� ln

� � �� �

ln�

� � ���

ln �� � ��� ln

��

�� �� ln�

Considerand

� ��� � �ln

� � �� � �� ln �� � ��� avem �� ��� � ln�

� � ��

deci� ����� � �� ��� � ��� ����� ����� ��� �

unde� ��� � � si

� ��� � ln��

���ln�

� Pe baza teoremei Rao–Cramer se obtineca

�� � ��

�����

� ���� � ��

������

�este estimator eficient pentru parametrul

� ���.

Page 257: Stat_Matlab.PDF

5.2. Functii de estimatie 247

5.2.4 Estimatori optimali

Definitia 5.2.19. Estimatorul nedeplasat�� � �� ������ � � � �

����, pentru parame-trul

�, esteoptimal daca are dispersia minima dintre toti estimatorii nedeplasati ai

lui�.

Observatia 5.2.20.Un estimator eficient este optimal, invers proprietatea nu are loc.

Proprietatea 5.2.21.Estimatorul optimal al unui parametru este unic.

Demonstratie.Fie��� �

��� ������ � � � �

���� si��� �

��� ������ � � � �

���� doiestimatori optimali distincti pentru parametrul

�. Daca se considera functia de selectie

�� � ������ �

���

, atunci��

este estimator nedeplasat pentru�, deoarece

���� � �

������

� �

�����

�� �

� �� � �� � ��

Pe de alta parte

���

��� � �� ��

������

� �

�����

�� ���� ����� ���

� ��

��� ���� ����� ���

� �

unde�� � ���

����� �

�����

.

Din inegalitatea lui Schwarz se obtine

���� ����� ������ ������� ���

���� � �

���������

����������� �

deci ��� ����� ��� � ��. Prin urmare, putem scrie ca

���

��� � ��, ceea

ce contrazice faptul ca���,

��� sunt estimatori optimali, afara de cazul ın care

���

��� � ��, adica��� ����� ���� ��. Avand ın vedere aceste rezultate, putem

scrie:

���

���� ���� � �

������

��

�����

������ ����� ���

� ��������� � ��

adica�

������ �

���� �

. Dar avem ca�����

� �

����

, ceea ce implica

faptul ca������ �

���� � �

� Prin urmare se ajunge la��� �

���, ın contradictie

cu afirmatia ca cei doi estimatori sunt distincti.

Page 258: Stat_Matlab.PDF

248 Teoria estimatiei

Teorema 5.2.22 (Rao-Blackwell).Fie caracteristica� cu functia de probabilitate� ����� si fie

�� � �� ����� � �

���� un estimator nedeplasat pentru parametrul�.

Daca statistica� � � ����

� � �

���� este o statistica suficienta pentru parametrul�,

atunci estimatorul�� � �� ����� � �

���� � � ��� ��

este un estimator nedeplasat

pentru�

si are loc relatia�

����� � �

�����

Demonstratie.Deoarece statistica�

este suficienta rezulta ca functia de probabilitate� ���� � � �

����� ��� conditionata a vectorului aleator����� � �

���� de evenimentul�� � �� nu depinde de

�, deci

���� � � � � � �

� � �

����� ���� � � �

���� � ���� � � �

����� ������ � � �

���nu depinde de

�, adica este o functie de selectie ce nu depinde de

�. Pe de alta parte,

folosind proprietati ale mediei conditionate avem

���� � �

��

��� ���� � ��� � ��

deci nedeplasarea are loc.Pentru a stabili inegalitatea dintre dispersiile celor doiestimatori avem ca

���

��� ������ � �

� � ����� �

���� ��

���

��� ��� � �

������ �

���� ��

��

�����

��� ��� � �

������� �� ��� ��

� �� ��� ��

� � �

Dar avem ca

���

����� ��

��� �

�������

���� ��

��� ���� � ���� �

���� ��

�� �

adica primul termen din expresia lui�

�����

. Al doilea termen din aceeasi expresieeste

����

��� ��� � �

� � � ��� � ���� � ���

��� �

iar ultimul termen este nul deoarece pentru� � �

fixat, avem�������� � const.,

deci

������

���� ��

� ��

��� �����

��

��

��� ��� � �

��

��� ��

��� ����

���

��� ��� � �

� ��

��� ��

�������

Page 259: Stat_Matlab.PDF

5.2. Functii de estimatie 249

Am stabilit astfel relatia�

����� � �

����

��� ���� �

����� �

de unde�

����� � �

�����

.

Definitia 5.2.23. Statistica� � � ������ � � � �

���� estecompletapentru familiade legi de probabilitate� �����, � � �, daca � �� ��� � �

, pentru orice� � �,

implica faptul ca � � �a.s.

Exemplul 5.2.24. Statistica� � ������� este completa pentru familia de legi

Poisson cu parametrul��

�.

Prima data avem ca�

urmeaza legea lui Poisson de parametru��, deci

� �� ��� ������

� ��� ������� ���� � ���� �����

� �����

�� ��

Pe de alta parte� �� ��� � �, pentru orice

��

�, conduce la

�����

� �����

�� �� � ��

pentru orice�

��, ceea ce are loc numai daca fiecare coeficient este nul, adic˘a

� ��� � �, cand

� � �.

Teorema 5.2.25 (Lehmann–Scheffe). In conditiile Teoremei Rao–Blackwell, dacastatistica

� � � ������ � � � �

���� este completa, atunci estimatorul

�� � �� ������ � � � �

���� � � ��� ���

este estimator optimal.

Demonstratie.Fie�� � �� ������ � � � �

���� un estimator nedeplasat pentru parame-trul

�. Folosind Teorema Rao–Blackwell, avem ca estimatorul

�� � �� ������ � � � �

���� � � ��� ��

este nedeplasat pentru parametrul�, adica� ���� � �

, si�

�� ���� � ���

���.

Asadar avem ca� ���� � � ��� � �sau�

��

��� ����� �

��

��� ����� ��

de unde���

��� ��� �

���� ��

��

� �� Avand ın vedere ca statistica

�este

completa rezulta ca���� ��

� �

��� ��

a.s., deci �� � �� a.s., de unde�

����� � �

�� ����.

Page 260: Stat_Matlab.PDF

250 Teoria estimatiei

In final�

����� � �

�� ���� � ���

��� �adica

���

��� � ���

���, pentru

orice estimator nedeplasat��

, ceea ce este chiar conditia din definitia optimalitatii.

Exemplul 5.2.26. Fie caracteristica�, care urmeaza legea lui Poisson de parametru��

�. Vrem sa determinam un estimator optimal pentru parametrul

� � ���.

Functia de frecventa a caracteristicii� este

� ����� ���

�� ��� � � ���

�ln����

In Exemplul 5.2.24 am vazut ca statistica suficienta� � ������� este completa

pentru familia de legi Poisson si urmeaza legea lui Poisson de parametru�� � � ln

��

Daca se considera functia de selectie

�� � �� ������ � � � �

���� � ��

card��� ���� � �� � � ��� ��

atunci��

are distributia��

��

��

����� ��� ������������

�deci �

��� � ���

� � �,

adica��

este estimator nedeplasat pentru parametrul�.

Daca se introduc variabilele aleatoare����� � � � �

��� cu distributiile date prin

�� ������ daca�� � ����

daca�� �� ��

deci� ��� � �� � �, � ��� � �� � �

� �, atunci avem ca

�� � �� ����� �� �

Aplicam Teorema Rao–Blackwell si obtinem

�� � � ��� ���� ���� �����

�� ���� � � �� ��

���

Pentru� � �

, avem

��� ��

� � �� � � �� � � ��� � �� � � � �� � � ��

� � ���

Page 261: Stat_Matlab.PDF

5.3. Metode pentru estimarea parametrilor 251

Folosind formula lui Bayes avem

� �� � � ��� � �� � � ��� � ��� �� � ���� � ��

� �� � ��� � ��� � ��� ��� � ��� � ��

� �� � ��� ��� ���� ����������� ����� �� � �� ������

�� ��� ����� ����

�� ���

de unde se obtine ca

�� � � ��� ���� � ��� ��� � �� �

���

Am ajuns astfel la estimatorul optimal pentru parametrul� � ���, care este dat prin

formula

�� � �� ������ � � � �

���� ���� ����

��

5.3 Metode pentru estimarea parametrilor

5.3.1 Metoda momentelor

Se considera caracteristica�, care are functia de probabilitate� ����� cu parametrulnecunoscut� � ������ � � � �

��� � �� � �� si o selectie repetata de volum�.

Definitia 5.3.1. Numimestimatorpentru parametrul� obtinut prinmetoda momen-telor solutia �� � ���� ��� � � � �

� ���� a sistemului

�� � ��� � � � ��� �

unde�� este momentul teoretic de ordin�, �� � � ���

, iar ��� este momentul deselectie de ordinul

�, adica

��� � ��

�����

���

Observatia 5.3.2. Metoda momentelor este una din cele mai vechi metode de es-timare a parametrilor, folosita initial ın mod empiric.Este fundamentata teoretic pefaptul ca momentele de selectie sunt estimatori absolut corecti pentru momenteleteoretice corespunzatoare. Este cunoscut de asemenea ca�� a.s.�� �� cand����

Page 262: Stat_Matlab.PDF

252 Teoria estimatiei

Exemplul 5.3.3. Se considera caracteristica�, care urmeaza legea gamma cu para-metrii �

� ��

�necunoscuti. Densitatea de probabilitate pentru� este

� ����� �� � �� ��� ���

���e��� � � ���

Vrem sa estimam parametrii� si�

prin metoda momentelor.Se stie ca

�� �� ��� � � ��� �� ����� �� � �

� ��� �� � ��

������ �� � ��

si

�� �� ��� � � ��� ��� ����� �� � �

� ��� �� � ��

�� ����� �� � ��� �� � �� �

Prin urmare, avem sistemul de ecuatii��� � ��� � ��

��� �� � �� � ��� � ��� � ��� �

care are solutia

�� � ������

� �� � �����

5.3.2 Metoda verosimilitatii maxime

Se considera caracteristica� cu functia de probabilitate� �����, unde parametrulnecunoscut� � � � �� . Relativ la caracteristica� se considera o selectie repetatade volum�.

Definitia 5.3.4. Numimestimator de verosimilitate maxima, pentru parametrul�,statistica �� � �� ������ � � � �

����pentru care se obtine maximul functiei de verosimilitate

� ������ � � � �

������ ������� ��� ��� �

iar�

� ��� ������ � � � �

���� se numesteestimatie de verosimilitate maxima, pentruparametrul�.

Observatia 5.3.5. In definitia estimatorului de verosimilitate maxima��

nu este ne-cesar ca� ����� sa fie diferentiabila ın raport cu�. De asemenea, nu este neaparatunic si nedeplasat.

Page 263: Stat_Matlab.PDF

5.3. Metode pentru estimarea parametrilor 253

Observatia 5.3.6. Daca functia de verosimilitate este diferentiabila dedoua ori ınraport cu�, atunci estimatorul de verosimilitate maxima se obtine ca solutie a siste-mului de ecuatii

�� ������ � � � �

��������� � �� � � ��� �

Sistemul de ecuatii este echivalent cu�ln � ������ � � � �

��������� ������

�ln � ��� ������ � �� � � ��� �

numit sistemul ecuatiilor de verosimilitate maxima.

Exemplul 5.3.7. Sa determinam estimatorii de verosimilitate maxima pentru valoa-rea medie si abaterea standard, daca se considera caracteristica�, care urmeaza legeanormala

� �����.Se stie ca� ��� � � si � ��� � �, iar densitatea de probabilitate a lui� este

� ������� � �����e� ������

Pentru a scrie sistemul de verosimilitate maxima, avem ca

�� � ������� � � ����� � ��� � �� �������

�de unde � �� � ��������� � � ��

��� � �� � ��������� � � �

�� �� ����

��

In acest mod se obtine�������������

� ����� ������

� �� � ��� ������� ������

�� ���� � �

� ����� ������

� �� � ��� ������� ������

�� ��� ��� ����

��

� ��

sau �������������

����� ��� ��� � �

�����

���� � ��� ����� � ��

Page 264: Stat_Matlab.PDF

254 Teoria estimatiei

de unde se rezulta estimatorii de verosimilitate maxima

�� � ��

������

� � �� � �� �������

�����

�� � �� �� � ���� �

pentru parametrii� si �.

Exemplul 5.3.8. Caracteristica� urmeaza legea uniforma pe intervalul�����, undeparametrul

��

�este necunoscut. Relativ la caracteristica� se considera o selectie

repetata de volum�. Vrem sa se determinam estimatorul de verosimilitate maxima��, pentru parametrul necunoscut

�.

Estimatorul��

de verosimilitate maxima pentru�

se determina astfel ıncat functiade verosimilitate

� ������ � � � �

������ �

������ ��� ��� � �

��

sa fie maxima pentru�� � �������� � � � �

����. Deoarece

��� � ��� ����

�� � ��� � �

��� � ���

��

������ � � � ������ �se obtine ca

�� � �������� � � � �

���� � ������ � � � �����

Se observa ca ın acest exemplu nu s-a putut folosi ecuatia de verosimilitate ma-xima, deoarece domeniul valorilor caracteristicii�, care este�����, depinde de pa-rametrul estimat.

Vom arata, ın continuare, ca estimatorul astfel construit este estimator corect pen-tru parametrul

�. Apoi vom folosi acest estimator pentru obtinerea unui estimator

absolut corect pentru�.

Functia de repartitie a statisticii��

este

��� ����� � � ��� � ��

�����

� ��� � �� � ��� ������ �

deci��

are densitatea de probabilitate

��� ����� ����� ������� � �� ����� ��� �������� � �����

���

cand � � ����� �

Se calculeaza usor

����

� ��� � �

�� �

����� � �

�� �

�� ����� � �

�� ��

��� ��� � �

�� �

���

Page 265: Stat_Matlab.PDF

5.3. Metode pentru estimarea parametrilor 255

Astfel se obtine ca

����������

� �

�������

�����

� �������

�� �

��� ��

��������� ������

������ ���������

Prin urmare,��

este estimator corect pentru�.

Punand conditia� �� � � �, rezulta ca

� � � �� � � ��� ���� �� �

�� �

��

de unde se obtine�� � � �� si ın final

�� � �� ��

�� � �� ��

��� ��� � � � ��� ��

Deoarece

���

�� � ���� �� �� � ��

���� � �� � ����� �� � ��� �� � ��

� � ���� � �� � � ��

cand� ��, rezulta ca�� este estimator absolut corect pentru parametrul�.

Proprietatea 5.3.9. Daca� � � ������ � � � �

���� este statistica suficienta pentruparametrul

�, iar

��este estimator de verosimilitate maxima pentru

�, atunci

��este

functie de�

.

Demonstratie.Deoarece statistica�

este suficienta rezulta ca

� ������ � � � �

������ � � ������ � � � �

����� ����� �deci maximul lui�, dupa

�, se obtine atunci si numai atunci cand se obtine maximul

lui�

dupa�. Astfel ca

��se exprima ın functie de

�.

Teorema 5.3.10.Daca�� � �� ������ � � � �

���� este functie de estimatie eficientapentru parametrul

�, atunci

��este estimator de verosimilitate maxima pentru

�.

Demonstratie.Deoarece��

este estimator eficient pentru�, din inegalitatea Rao–

Cramer (cu egalitate), avem ca�ln � ������ � � � �

�������� �� ��� ��� � �

Astfel ca �ln � ������ � � � �

������

�� �� ��� ��� � ��� ��

deci��

verifica ecuatia verosimilitatii maxime.

Page 266: Stat_Matlab.PDF

256 Teoria estimatiei

Observatia 5.3.11.Daca valoarea adevarata a parametrului�

este��, se arata ca

functia de verosimilitate maxima��

pentru parametrul�

are urmatoarele comportari

asimptotice:�� a.s.�� ��, cand� � �, iar

��

��� � ��

converge ın repartitie la

legea normala�

��� ��������.

5.3.3 Metoda minimului ��

Se considera colectivitatea�

si caracteristica� cercetata, cu legea de probabilitatedata prin functia� �����, unde� � ���� � � �

���� � � � ��

� Domeniul valorilor lui� ıl consideram compus din clasele��,

� � ���. Vom introduce notatiile urmatoare�� � �� ��� � � �� � ���, adica probabilitatea ca un individ luat la ıntamplare dincolectivitatea

�sa apartina clasei��.

Daca se considera o selectie repetata de volum� cu datele de selectie��� � � �

���,respectiv variabilele de selectie���

� � �

���, notam prin�� frecventa absoluta a da-telor de selectie din clasa��. Fie

�� variabila aleatoare (de selectie) corespunzatoarelui ��, atunci vectorul aleator

� � ����� � �

���� urmeaza legea multinomiala deparametri�� � �� ���, � � ���.

Definitia 5.3.12. Estimatorul cu�� minim pentru parametrul� este estimatorul(functia de selectie)�� � �� ������ � � � �

���� �care realizeaza valoarea minima a

expresiei

�� ������

������� ����

��� ���ın raport cu parametrul�, iar �� � �� ������ � � � �

���� se numesteestimatie cu��minim pentru parametrul�.

Observatia 5.3.13.Daca notam��� � ��

� , atunci valoarea lui�� se poate scrie ın felulurmator:

�� ������

���������

����

�����

�����������

���� �

� �����

�� ����

����

prin urmare, minimul lui�� se obtine cand este minima expresia����� �

����

Observatia 5.3.14.Daca�� ���, � � ���, sunt diferentiabile de doua ori ın raportcu �, atunci �� se obtine ca solutie a sistemului

����� �����

������� �����

��� ���� �� � � ����

Page 267: Stat_Matlab.PDF

5.3. Metode pentru estimarea parametrilor 257

Observatia 5.3.15. In locul expresiei lui�� de mai sus, numitindicatorul lui Pear-son, se pot utiliza alte expresii ca:

�� ��� ������

������� ������

�indicatorul lui Neyman

�� ��� � �

�����

�� ln

� ��

��� ����

indicatorul de verosimilitate�

�� ��� � ��

�����

�� ��� ln

���� �����

�indicatorul lui Kullbach

�� ��� ������

���� ��� ���� �ln

���

�� ���

�ln

�� ������� ���

�indicatorul lui Berkson�

5.3.4 Metoda intervalelor deıncredere

Se considera caracteristica� cu legea de probabilitate� �����, unde parametrul ne-cunoscut

� � � � �. Fie o selectie repetata de volum� si numarul� � ��� ��, numitprobabilitate de risc, �

�� numindu-seprobabilitate deıncredere.

Definitia 5.3.16.Numiminterval de ıncrederepentru parametrul�, intervalul aleator ���� ���� � ��� ������ � � � �

���� � ��� ������ � � � �

����� �unde statisticile��� si ��� sunt astfelıncat � ��� � � � ���� � �

���

iar intervalulnumeric

���� ���� � ��� ������ � � � �

���� � ��� ������ � � � �

������ se numestevaloareaintervalului de ıncrederepentru parametrul

�.

Observatia 5.3.17.Pentru determinarea intervalului de ıncredere se considera o sta-tistica

� � � ������ � � � �

����, care urmeaza o lege de probabilitate cunoscuta, darın expresia careia apare parametrul

�. Se determina apoi intervalul numeric�������

astfel ıncat� �� � �������� � ��

��relatie care se va scrie, ın mod echivalent,

� ��� � � � ���� � ����

Observatia 5.3.18.Cu cat� este mai mic si intervalul de ıncredere are lungimea maimica cu atat estimatia parametrului necunoscut este maibuna.

Observatia 5.3.19.Din relatia� � � �������� � ���, intervalul ������� nu este

determinat ın mod unic.De la problema la problema se mai adauga o conditie suplimentara, de exemplu

fixarea valorii fie a lui��, fie a lui

��. De asemenea, se poate considera o legatura

ıntre�� si

�� data de anumite ipoteze de lucru.

Page 268: Stat_Matlab.PDF

258 Teoria estimatiei

Interval de ıncredere pentru media teoretica – dispersie cunoscuta

Se considera caracteristica� ce urmeaza legea normala� �����, unde

� � � estenecunoscut, iar� �

�este cunoscut.

Pentru construirea unui interval de ıncredere pentru media teoretica�

necu-noscuta efectuam o selectie repetata de volum� si consideram probabilitatea deıncredere�

�� data,� � ��� ��.

Se construieste statistica

� ��� ��

��� �

care urmeaza legea normala� ��� �� (a se vedea Observatia 4.2.6). Prin urmare, pen-

tru � dat determinam intervalul numeric������� astfel ıncat

� � � �������� � � ���� �� ���� � �

���

unde � ��� � ���� � �

� ��� ���estefunctia lui Laplace. Functia lui Laplace este tabelata ınAnexa Ipentru valoripozitive ale argumentului, avand ın vedere ca

� ���� � �� ���.Deoarece dubla inegalitate

�� ��� ��

��� � ��

este echivalenta cu

��� � �� ���

���

�� � �� ��� ��

�� ���

rezulta ca� � ��� �� � ���� � ����

adica� ���� ���� este un interval de ıncrederepentru media teoretica

.Desigur ca intervalul numeric������� nu este ın mod unic determinat. Daca nu

exista nici o informatie suplimentara relativa la valoarea medie, atunci se va consideraintervalul de ıncredere de lungime minima, pentru� fixat, si se obtine cand�� �

���.

In acest caz�� � ���� , va fi dat prin relatia� �����

�� ������� �

���

ceea

ce este echivalent cu� �����

� ����

Cand se foloseste functia lui Laplace definita prin

� ��� � ���� � �

�� ��� ���

Page 269: Stat_Matlab.PDF

5.3. Metode pentru estimarea parametrilor 259

atunci���� se determina din relatia� �����

� �

� �

� si reprezinta de fapt cuantila

de ordin�� �

� Intervalul de ıncredere pentru parametrul

are extremitatile

(5.3.1)

��� � ��� ������ � � � �

���� � �� ����� ��

���� � ��� ������ � � � �

���� � �� � ���� ���

Observatia 5.3.20.Geometric, daca se considera graficele functiei de repartitie sidensitatii de probabilitate a legii normale

� ��� ��, modul de obtinere a cuantilei��este prezentat ın Figura 5.1. Adica, fie intersectand graficul functiei de repartitie alegii normale

� ��� �� cu dreapta de ecuatie� � �, fie alegandu–l pe�� astfel ca aria

umbrita de sub graficul densitatii de probabilitate sa fie�.

0

1

y=γ

γ

f

Figura 5.1: Determinarea cuantilei��

Observatia 5.3.21.Daca exista o informatie relativa la valoarea medie de forma caaceasta nu este limitata superior, atunci intervalul numeric ������� � ���������,care conduce la intervalul de ıncredere

� ���� ���� ���� � ��

����� ��� �

In mod analog, daca se cunoaste ca valoarea medie nu este limitata inferior, adicaare tendinta de a avea valori mici ın raport cu ceea ce ne asteptam, atunci intervalul

Page 270: Stat_Matlab.PDF

260 Teoria estimatiei

numeric������� � ��� ���, care conduce la intervalul de ıncredere

� ���� ���� ����� �� � ��

���� �

Pe baza teoremei limita centrala avem ca rezultatul obtinut se mentine cand� ur-meaza o lege de probabilitate oarecare, pentru� � �� (a se vedea Proprietatea 4.2.7).

Exemplul 5.3.22. Relativ la populatia�

se cerceteaza caracteristica� privind me-dia teoretica� ��� � �

. Stiind ca dispersia teoretica a caracteristicii� este��� ��� � �

���, sa se stabileasca un interval de ıncredere pentru mediateoretica�

cu probabilitatea de ıncredere��

� � ��

��, utilizand distributia empirica deselectie

�� ��

�� ���

� ���

� ���

� ���� ���

� ���� ����� � � � � � � � � �

Deoarece volumul selectiei este� � �� � ��, putem considera ca statistica

� ��� ��

��� �unde � � �� �� ����

urmeaza legea normala� ��� ��. Asadar, extremitatile intervalului de ıncredere pen-

tru media teoretica�

sunt date prin (5.3.1). Calculam valorile acestor extremitati pebaza datelor de selectie.

Valoarea mediei de selectie�� este

��� ��� �����������

������

����������������

������������������

����

iar din Anexa I, pentru���� � �

����, se gaseste���� � ��

��.De asemenea, avem ca

������

�� ����

���

�����

� ���

�� � ����

Obtinem, ın acest fel, intervalul de ıncredere pentru media teoretica� � � ����

�� � ������� � �� � ��

������ � ����

���� �

���� � ���

��� � ������

� ����

��� � ���

���� �

Programul 5.3.23. Calculele pot fi facute cu urmatorul program Matlab:

Page 271: Stat_Matlab.PDF

5.3. Metode pentru estimarea parametrilor 261

x=[22.7,22.8*ones(1,3),22.9*ones(1,7),23*ones(1,4), ...23.1*ones(1,6),23.2*ones(1,7),23.3*ones(1,5),23.4*o nes(1,2)];

s=sqrt(0.35)*norminv(0.975)/sqrt(35);ma=mean(x);m1=ma-s; m2=ma+s;fprintf(’ (m1,m2)=(%6.3f,%6.3f)’,m1,m2)

si care, ın urma executarii, afiseaza rezultatul(m1,m2)=(22.881,23.273)

Interval de ıncredere pentru media teoretica – dispersia necunoscuta

In conditiile sectiunii precedente, dar cu� ��

necunoscut, se va considera statistica

� ��� ��

���� ��� ��� ��

����

care, conform Proprietatii 4.2.26, urmeaza legea Student cu��

�grade de libertate.Se determina intervalul numeric���� ��� astfel ıncat

� � � ���� ���� � ���� ���� ����� ���� � �

���

unde

�� ��� � � � ��

����� �

�� � �

�����

�������� ��� � � ��

este functia de repartitie a legii Student cu�

grade de libertate si care este tabelata,pentru anumite valori, ınAnexa II.

Luand�� � �������� � �� � ��

�, avem ca���� ���������� �

� �

��

iar

� � ��� �� � ���� � ���, deci, intervalul de ıncredere pentru media teoretica

are extremitatile date prin

(5.3.2)

��� � �� � �������� ����

��� � �� � �������� ����

Observatia 5.3.24.Daca exista o informatie relativa la valoarea medie de forma caaceasta nu este limitata superior, adica are tendinta dea avea valori mai mari decatcele asteptate, atunci intervalul numeric���� ��� � ���� ���������, care conduce laintervalul de ıncredere pentru

:

� ���� ���� ���� � ���

�������� ��� �

Page 272: Stat_Matlab.PDF

262 Teoria estimatiei

In mod analog, daca se cunoaste ca valoarea medie nu este limitata inferior, atunciintervalul numeric���� ��� � ������� ���, care conduce la intervalul de ıncredere

� ���� ���� ����� �� � ���

������� �

Observatia 5.3.25.Geometric, daca se considera graficele functiei de repartitie sidensitatii de probabilitate a legii Student cu�

��grade de libertate, modul de obtinere

a cuantilei������ este prezentat ın Figura 5.2.

0

1

tn−1,γ

y=γ

γ

tn−1,γ

f

Figura 5.2: Determinarea cuantilei������

Din teorema limita centrala avem ca rezultatele pot fi aplicate pentru o caracte-ristica� ce urmeaza o lege de probabilitate oarecare, pentru� � ��.

Exemplul 5.3.26.Pentru receptionarea unei marfi ambalata ın cutii, se efectueaza uncontrol, prin sondaj, privind greutatea� a cutiilor. Pentru

��de cutii cantarite s-a

obtinut distributia empirica de selectie, relativ la caracteristica�:

���

��� �

� ��

� ��

� ��� ��

� ���

� � � � � � �

��

Folosind probabilitatea de ıncredere��

��, sa determinam un interval de ıncredere

pentru valoarea medie a greutatii cutiilor, presupunand ca� urmeaza legea normala� �����.

Page 273: Stat_Matlab.PDF

5.3. Metode pentru estimarea parametrilor 263

Deoarece abaterea standard� � �� �� ��� este necunoscuta, se considera sta-tistica

� ��� ��

���� �

care urmeaza legea Student cu��

�grade de libertate.Extremitatile intervalului de ıncredere pentru valorea medie teoretica

� � � ���sunt date prin (5.3.2).

Pentru��

� � �� si ��

� � ��

�� �� � ��

���, din Anexa II se determina�������� � �

����.De asemenea, folosind datele de selectie, obtinem valoarea �� a mediei de selectie��, anume

�� � ��� ����� � � ��

� � � ��

� � � � � � ���� � ��

� � � ���� � ��

���

si valoarea abaterii standard de selectie

�� ����� ���

���� �� ��� � �� �� �

�����������

� ������

Putem scrie atunci intervalul (numeric) de ıncredere��� � �������� ���

�� �� � �������� ���

������

�����

���� �������� � ��

��������� �������� �� ���

��� � ������ �

Programul 5.3.27. Daca se executa programul Matlabx=[2.7,2.8*ones(1,2),2.9*ones(1,5),3*ones(1,3),...

3.1*ones(1,5),3.2*ones(1,4),3.3*ones(1,2)];ma=mean(x); va=var(x);s=tinv(0.99,21)*sqrt(va)/sqrt(22);m1=ma-s; m2=ma+s;fprintf(’ (m1,m2)=(%6.3f,%6.3f)’,m1,m2)

relativ la problema precedenta, se obtine intervalul de ˆıncredere:(m1,m2)=( 2.942, 3.122)

Interval de ıncredere pentru dispersie

Consideram caracteristica� ce urmeaza legea normala� ����� cu

� � � necu-noscut si� �

�necunoscut. Determinam un interval de ıncredere pentru dispersia

teoretica�� a caracteristicii�.

Page 274: Stat_Matlab.PDF

264 Teoria estimatiei

Statistica ce se considera ın acest caz este

�� � �� � �� �����

� ���

�����

�� � ���� �

care, conform Proprietatii 4.2.25, urmeaza legea�� cu��

� grade de libertate.Se determina intervalul numeric

�������� astfel ınat

� �� � ��������� � ���� ���� ����� ���� � ����

unde

�� ��� � ��� � �

�� � �

��� ���� ���� � �

��

este functia de repartitie a legii�� cu�

grade de libertate si este tabelata, pentruanumite valori, ınAnexa III.

Daca se alege��� � ������� si ��� � ��������� , adica astfel ıncat

���� �������� � �� si ���� ����������

� �

� ���

se obtine� ��� � �� � ���� � ���, unde

(5.3.3)

���� � ���� ������ � � � �

���� � �� � �� ������������

���� � ���� ������ � � � �

���� � �� � �� ����������

Observatia 5.3.28.Modul geometric de obtinere a cuantilei������� este prezentat ınFigura 5.3, daca se considera graficele functiei de repartitie si densitatii de probabili-tate a legii�� cu�

��grade de libertate.

Exemplul 5.3.29. Fie � caracteristica ce reprezinta timpul de producere a uneireactii chimice, masurat ın secunde. Daca� urmeaza legea normala

� ����� siavand o selectie repetata de volum� � ��, cu datele de selectie��

��, ��

��, ��

��,��

��, ��

��, ��

�� ��

��, ��

��, ��

��, ��

��, ��

��, vom determina intervalul de ıncredere

pentru dispersia�� � ��� ��� si pentru abaterea standard� � �� �� ���, cu

probabilitatea de ıncredere��

��.Se considera statistica

�� � �� � �� �� ���

�unde �� � � �

��

�����

�� � �� �� � �� � ��

������

� �

Page 275: Stat_Matlab.PDF

5.3. Metode pentru estimarea parametrilor 265

0

1

χ2n−1,γ

y=γ

γ

χ2n−1,γ

fFigura 5.3: Determinarea cuantilei�������

care urmeaza legea�� cu ��

� grade de libertate. Extremitatile intervalului deıncredere pentru�� vor fi date prin (5.3.3).

Pentru determinarea valorilor numerice ale acestor intervale de ıncredere, cal-culam:

�� � ���

������

�� � ��� ���

��� ��

�� � � ��

��� � ��

����

�� � � ���

������ ��� � �� �� � �

���� ���������� � ���� si ���������� � ��

���

Asadar, intervalele de ıncredere pentru�� si � sunt��� ��

�����

�� � �� ��

�����

�� � � ���

��� � ��

���� �

respectiv ���� ��

�����

�� ��

�� ��

�����

�� � � ���

��� � ��

�����

Programul 5.3.30. Un program Matlab, care sa rezolve aceasta problema, ar puteafi urmatorul:

x=[4.21,4.03,3.99,4.05,3.89,3.98,4.01,3.92,4.23,3.8 5,4.20];va=var(x); c1=chi2inv(0.025,10); c2=chi2inv(0.975,10) ;

Page 276: Stat_Matlab.PDF

266 Teoria estimatiei

v1=10*va/c2; v2=10*va/c1; s1=sqrt(v1); s2=sqrt(v2);fprintf(’ (v1,v2)=(%6.3f,%6.3f)\n’,v1,v2)fprintf(’ (s1,s2)=(%6.3f,%6.3f)’,s1,s2)

In urma executarii, se obtin intervalele de ıncredere pentru dispersie si respectiv pen-tru abaterea standard:

(v1,v2)=( 0.008, 0.052)(s1,s2)=( 0.091, 0.229)

Interval de ıncredere pentru raportul dispersiilor

Se considera caracteristicile independente� �si � ��

fiecare urmand legea normala,respectiv

� ��� ���� si� ���� �����. Relativ la cele doua caracteristici se considera

cate o selectie repetata, respectiv de volume��si �

��. Vom determina un interval de

ıncredere pentru raportul������corespunzator probabilitatii de ıncredere�

��

data.Pentru aceasta se considera statistica

� ��� ������ �� �

�� �

care, conform Proprietatii 4.2.30, urmeaza legea Fisher–Snedecor cu� � �

�� �� si

� � �� �

�grade de libertate.Se determina intervalul numeric������� astfel ıncat

� � � �������� � ���� ���� ����� ���� � ����

unde

���� ��� � ���

� � � ��

�� �

��� �

�� � �

��� �� ���

����� ��� � �

��

este functia de repartitie a legii Fisher–Snedecor cu�

si � grade de libertate si careeste tabelata pentru anumite valori ınAnexa IV.

Daca se alege�� � ������ si �� � �������� , adica astfel ıncat

���� �������� �

� si ���� ���������� �

� ���

atunci

(5.3.4) �������� ��

��� �� � ��

��� � �������� ���

�� ��� � ����

Aceasta relatie pune ın evidenta intervalul de ıncredere pentru raportul celor douadispersii.

Page 277: Stat_Matlab.PDF

5.3. Metode pentru estimarea parametrilor 267

Observatia 5.3.31.Modul geometric de obtinere a cuantilei������ este prezentat ınFigura 5.4, daca se considera graficele functiei de repartitie si densitatii de probabili-tate a legii Fisher–Snedecor cu

si � grade de libertate.

0

1

fm,n,γ

y=γ

γ

fm,n,γ

f

Figura 5.4: Determinarea cuantilei������

Exemplul 5.3.32. Se cerceteaza precizia cu care doua masini produc conserve deacelasi tip. Pentru aceasta, se considera cate un esantion din conservele produse decele doua masini si se masoara greutatea acestora. Fie� �

greutatea ın grame a uneiconserve produsa de prima masina, respectiv� ��

pentru a doua masina. Masuratorileobtinute sunt:

� � ���� ��� ��� ���� ���� ��� ���� ��� ��� ���� ����

���� ��� ���� ���� ����� �� ���� ��� ��� ���� ���� ���� ���� ��� ���� ���� ���

Sa se calculeze un interval de ıncredere pentru raportul abaterilor standard, adica

pentru �� ��� ������� ����� � folosind probabilitatea de risc� � �

��.

Vom considera ca cele doua caracteristici� �si � ��

sunt independente si ca ur-meaza legile normale

� ��� ���� si respectiv� ���� �����.

Statistica ce se utilizeaza pentru stabilirea intervalului de ıncredere pentru rapor-tul ������

este

� ��� ������ �� �

�� �

Page 278: Stat_Matlab.PDF

268 Teoria estimatiei

care urmeaza legea Fisher–Snedecor cu� � �

�� �� � �� si � � �

� �� � �� grade

de libertate.Intervalul de ıncredere este dat prin (5.3.4).Pentru aceasta avem ca

�� � � ���

�����

��� � ��� ������ ��� � � ����� � �������

�� �� � ����

�����

���� � ��� ����� � ��� � � ���� � �������

�� � � ��� � �

�����

��� � �� ��� � ���

������� �������� � � ����� � ���������

� �������

�� �� � ���� � �

�����

���� � �� ���� � ���

������ � �������� � � ���� � ���������

� �������

Pe de alta parte, se obtin cuantilele

������ � ������������ � ��

��� �������� � ������������ � ��

���

pe bazaAnexei IV. Facem observatia ca ın acest calcul s-a avut ın vedere ca

������ � ���������

�adica ������������ � �

������������ ��

����� �

���

Se ajunge astfel la faptul ca

��

������

��

�� ������������ ����

�� ������������� � ����������� �

La acelasi rezultat se ajunge si daca se considera statistica��

Programul 5.3.33. Programul Matlab, care urmeaza, calculeaza intervaleledeıncredere pentru raportul dispersiilor, respectiv al abaterilor standard, pentru dateleconsiderate ın problema precedenta.

x1=[1021,980,988,1017,1005,998,1014,985,995,1004,.. .1030,1015,995,1023,1008,1013];

x2=[1003,988,993,1013,1006,1002,1014,997,1002,1010, 975];v1=var(x1); v2=var(x2); r=v1/v2;

Page 279: Stat_Matlab.PDF

5.3. Metode pentru estimarea parametrilor 269

f1=finv(0.025,10,15); f2=finv(0.975,10,15);r1=f1*r; r2=f2*r; s1=sqrt(r1); s2=sqrt(r2);fprintf(’ (r1,r2)=(%6.3f,%6.3f)\n’,r1,r2)fprintf(’ (s1,s2)=(%6.3f,%6.3f)’,s1,s2)

In urma executarii programului, s–a obtinut:

(r1,r2)=( 0.445, 4.795)(s1,s2)=( 0.667, 2.190)

Interval de ıncredere pentru diferenta mediilor

Caracteristicile independente� �si� ��

urmeaza respectiv legile normale� ���

����si� ����

�����. Folosind cate o selectie repetata de volum��si �

��pentru cele doua

caracteristici, vrem sa determinam un interval de ıncredere pentru diferenta������

.Distingem urmatoarele trei situatii:

A. abaterile standard ale celor doua caracteristici sunt cunoscute,

B. abaterile standard sunt necunoscute, dar se stie ca sunt egale,

C. abaterile standard sunt necunoscute si diferite,

pe care le tratam pe rand ın continuare.

A. Abaterile standard��si ���

sunt cunoscute.

Se considera statistica

(5.3.5) � � �� � � �� ��� � ��� �����

��� � ���

care urmeaza legea normala� ��� �� (a se vedea Observatia 4.2.29). Astfel, pen-

tru probabilitatea de risc� � ��� �� data, se poate determina intervalul numeric

������� � ������ �����

astfel ıncat� ��� � � � ��� � ���� Anume,����

se calculeaza din relatia� �����

� ���� , unde

� ��� � ���� � �

� e�� ���este functia lui Laplace, tabelata ınAnexa I. Se ajunge astfel la relatia

(5.3.6) � �� � � �� �� ���

��� ���� � �� � � �� �� ���

� � ����

Page 280: Stat_Matlab.PDF

270 Teoria estimatiei

unde

�� � ���������� ���

���

�care pune ın evidenta extremitatile intervalului de ˆıncredere pentru diferenta celordoua medii.

B. Abaterile standard��si ���

sunt egale cu�, dar necunoscut.

Se considera statistica

(5.3.7) � � �� � � �� ��� � ��� ��������� �

�� �� � � ���� ��� �� ����

� ���� � �

�� �

��

unde

�� � � ��� �

�����

� �� � �� �� � �� �� � ���� �

�����

� �� � �� ��

si care urmeaza legea Student cu� � �

� ���� � �

grade de libertate (a se vedeaProprietatea 4.2.28).

Ca la punctul precedent se obtin extremitatile intervalului de ıncredere

(5.3.8) ����� � �� � � �� �� � ������� �� �

��

�� �

��� � �

���� � �� �� � � ���� � �� �� �� �

unde������ este cuantila de ordin�

��

� pentru legea Student cu�

grade de libertate.

C. Abaterile standard��si ���

sunt diferite si necunoscute.

Se considera statistica

(5.3.9) � � �� � � �� ��� � ��� �����

��� � � �� �

care urmeaza legea Student cu� grade de libertate si care se calculeaza prin formula

(5.3.10)��� ���� � �

� ��� ������ � �

�unde � �

�� ��� � ��� �

����� ����� ��

Ca la punctul precedent se ajunge la extremitatile intervalului de ıncredere pentrudiferenta celor doua medii:

(5.3.11) ����� � �� � � �� �� � ��������� ������ �����

Page 281: Stat_Matlab.PDF

5.3. Metode pentru estimarea parametrilor 271

Exemplul 5.3.34. Masinile�� si

�� ambaleaza carne ın pachete de���� grame.

Greutatea cutiilor este o caracteristica� �, ce urmeaza legea normala

� ��� ���� sirespectiv o caracteristica� ��

, ce urmeaza legea normala� ���� �����.

Cantarind��� de pachete din cele produse de masina�� s–a obtinut valoarea

mediei de selectie�� � � ���� grame, iar din cantarirea a��� de pachete de la masina�� s–a obtinut�� �� � ���� grame.

Folosind probabilitatea de ıncredere��

��, sa determinam intervalul de ıncredere

pentru diferenta�� ����

, daca se stie ca abaterile standard sunt�� � � si ��� � �.Se foloseste statistica (5.3.5), care urmeaza legea normala

� ��� ��. Astfel, inter-valul de ıncredere pentru diferenta

�� ����este dat prin (5.3.6), unde���� se deter-

mina astfel ca� �����

� ���� � �

���. FolosindAnexa I, obtinem���� � ����.

De asemenea, avem ca

��� ��� ���

����� �

���� ��

�����

�����

� �������

Astfel, intervalul de ıncredere pentru diferenta�� ����

este��� � � �� ��� ����� ���

��� ���

��� � �� � � �� ���� ���� ���

��� ���

��� �

� �� � ���� ������ � � � �

��� ������� � ���

�� � ��

��� �

Programul 5.3.35. Executarea programului Matlab:

z1=norminv(0.01,0,1); z2=norminv(0.99,0,1);s=sqrt(9/100+16/150); d=1007-1002;m1=d+z1*s; m2=d+z2*s;fprintf(’ (m1,m2)=(%6.3f,%6.3f)’,m1,m2)

conduce la rezultatul:

(m1,m2)=( 3.968, 6.032)

Exemplul 5.3.36. Fie caracteristica� �ce urmeaza legea normala

� ��� ��� si carereprezinta vanzarile ın milioane lei pe saptamanala magazinele alimentare ın orasul�

si � ��vanzarile ın milioane lei la magazinele alimentare din orasul� si care ur-

meaza legea normala� ���� ���. S–au efectuat doua sondaje, respectiv pentru� �

si� ��

si s–au obtinut urmatoarele date de selectie:

� � ������ ������ ������ ������ ����

�� ������ ������

� �� ������ ����

�� ������ ������ ����

�� ����

��

Page 282: Stat_Matlab.PDF

272 Teoria estimatiei

Cu probabilitatea de ıncredere��

��, vrem sa se construim un interval de ıncrederepentru diferenta

�� ����, daca� �

�este necunoscut.

Folosind statistica (5.3.7), care urmeaza legea Student cu � � �� �

��� � � � ��

grade de libertate, se va construi intervalul de ıncrederepentru�� ����

. Anume,acest interval de ıncredere este precizat prin (5.3.8).

Pentru a determina valoarea numerica a intervalului de ıncredere, se calculeazape rand

�� � � �� ������ � ������ ����� � ���

��� ����

� � ����� � ���

��� � ���������� �� � �

� ������ � ����

� � ����� � ����� � ����

� � ����

�� � ��������

�� � � ��

������� � �� ��� � ������� �� �� � �

�����

���� � �� ���� � ���

����� � � �

�� ��

�� �� ������ � � ���

���� � ��

����

De asemenea, dinAnexa II, pentru��� � �

�� si � � ��, obtinem������ � �

���,astfel ca intervalul de ıncredere pentru

�� ����va fi

��� � � �� ��� � ������ � � �� � � �� ���� ������ �

� �������� �

��� ��

��� � ������ � ��

��� ��

���� � ������ � ����� �

Programul 5.3.37. Prin executarea programului Matlab:x1=[226.5,224.1,218.6,220.1,228.8,229.6,222.5];x2=[221.5,230.2,223.4,224.3,230.8,223.8];ma1=mean(x1); ma2=mean(x2); md=ma1-ma2;v1=var(x1); v2=var(x2);t1=tinv(0.025,11); t2=tinv(0.975,11);s=sqrt((1/7+1/6)/11)*sqrt(6*v1+5*v2);m1=md+t1*s; m2=md+t2*s;fprintf(’ (m1,m2)=(%6.3f,%6.3f)\n’,m1,m2)

regasim intervalul de ıncredere pentru diferenta valorilor medii:(m1,m2)=(-6.324, 3.619)

Exemplul 5.3.38.Se considera doua aparate de ımbuteliat vin ın sticle de���ml. Fiecaracteristica� �

ce reprezinta cantitatea de vin (ın ml) ımbuteliata de primul aparatıntr-o sticla si respectiv� ��

aceeasi caracteristica pentru al doilea aparat. Pentru com-pararea modului de ımbutliere pentru cele doua aparate, se considera cate o selectiedin sticlele ımbuteliate de cele doua aparate, respectiv

� � ��� ��� ��� ��� ��� ��� ��� ��� ��� ��� ��� ��� ��� ���� �� ��� ��� ��� ��� ��� ��� ��� ��� ��� ���

Page 283: Stat_Matlab.PDF

5.3. Metode pentru estimarea parametrilor 273

Vom construi un interval de ıncredere pentru diferenta������ � � �� ���� �� ��� �

folosind probabilitatea de risc� � ��

��. Vom considera ca cele doua caracteristici� �

si� ��sunt independente si ca urmeaza legile normale

� ��� ���� si� ���� �����.

Distingem doua cazuri, unul cand se stie ca�� � ���, caz ın care se foloseste

statistica (5.3.7), care urmeaza legea Student cu� � �� �

��� � �

grade de libertate,respectiv cand se stie ca�� �� ���

, caz ın care se foloseste statistica (5.3.9), careurmeaza legea Student cu� grade de libertate. Numarul� al gradelor de libertate secalculeaza, ın acest caz, cu formula (5.3.10)

In cazul�� � ���, extremitatile intervalului de ıncredere pentru diferenta

������

sunt date prin formulele

��� � �� � � �� �� � � ������

�� �

� ���

�� �

��� � �

���� � �� �� � � ���� � �� �� �� �

��� � �� � � �� �� �� ������

�� �

� ���

�� �

��� � �

���� � �� �� � � ���� � �� �� ��

Cuantila������ � �

�������� � ��

��, s-a determinat, conformAnexei II, din relatia��� ����������� � �

� �

� ���

����

Pe de alta parte

��� � ��� ���� � ��� � � ���� � ������

���� � ��� ���� � ��� � � ���� � ������

���

�� ����

�����

��� � ���� � ���� � ������� � � ���� � ������� � ����

�������

�� �����

�����

���� � ����� � ���� � ������� � � ����� ������� � �����

Astfel avem ca

��� � ������������� � �

��� ���� ���

�� � ��� �

�����

�� � ���� � ���

��

��� � ������������� � �

��� ���� ���

�� � ��� �

�����

�� � ���� � ����

Page 284: Stat_Matlab.PDF

274 Teoria estimatiei

Pentru cazul�� �� ���, calculam prima data numarul� al gradelor de libertate.

Astfel avem ca

� ��� ��� � ��� �

���������� � � �����

�� � ������� � ����

�� � � ��

�����

��� � �����

� �����

iar apoi��� ���� � �

� ��� ������ � �

���

�����

���

���� � ��

����de unde avem ca� � ��

.Extremitatile intervalului de ıncredere sunt date prin

��� � �� � � �� �� � � ������

���� �

����� �����

��� � �� � � �� �� �� ������

���� �

����� �����

Avand ın vedere ca��������� � �

�� rezulta ca

��� � ������������� � �

����

���� �

���� ����

����� � ������

������� � �

����

���� �

���� � ��

��

Programul 5.3.39. Programul Matlab, care urmeaza, rezolva problema precedenta,adica, va determina intervale de ıncredere pentru diferenta mediilor, ın cele douacazuri, cand se considera dispersii egale si necunoscute, respectiv dispersii diferitenecunoscute.

x1=[746,743,748,748,750,745,744,753,750,751,743,747 ,749,742];x2=[749,748,748,753,750,749,747,745,744,751];ma1=mean(x1); ma2=mean(x2); md=ma1-ma2;v1=var(x1); v2=var(x2);t1=tinv(0.025,22); t2=tinv(0.975,22);s=sqrt((1/14+1/10)/22)*sqrt(13*v1+9*v2);m1=md+t1*s; m2=md+t2*s;fprintf(’ (m1,m2)=(%6.3f,%6.3f)\n’,m1,m2)c=(v1/14)/(v1/14+v2/10);n=cˆ2/13+(1-c)ˆ2/9;n=ceil(1/n); t1=tinv(0.025,n); t2=tinv(0.975,n);s=sqrt(v1/14+v2/10); m1=md+t1*s; m2=md+t2*s;fprintf(’ (m1,m2)=(%6.3f,%6.3f)\n’,m1,m2)

Dupa executarea programului, se obtin cele doua intervale de ıncredere:

(m1,m2)=(-3.990, 1.333)(m1,m2)=(-3.888, 1.231)

Page 285: Stat_Matlab.PDF

5.3. Metode pentru estimarea parametrilor 275

5.3.5 Metoda intervalelor deıncredere pentru selectii mari

Fie caracteristica� cercetata, cu legea de probabilitate� �����, unde� � � � �

este un parametru necunoscut. Consideram o selectie repetata de volum� relativa lacaracteristica�, pentru care avem variabilele de selectie����� � � � �

���.

Proprietatea 5.3.40.Daca se considera variabilele aleatoare����� � � � �

��� definiteprin relatia

�� � �ln � ��� ����� �

si pentru care exista dispersia�

�� ���� � �� � �, atunci statistica

� � ���������

�� � ���������

�ln � ��� ����� �

pentru���, urmeaza legea normala� ��� ��.

Demonstratie.Variabilele aleatoare��, � � ���, fiind independente si identic re-partizate, rezulta ca si variabilele aleatoare

��, � � ���, sunt independente si identicrepartizate. Conform teoremei limita centrala, avem ca

���� � ���������

�� �� �����

converge ın repartitie la legea normala� ��� ��.

Deoarece

� ���� � ���

ln � ��� ����� � � ��

rezulta ca���� � �, ceea ce ıncheie demonstratia.

Pentru probabilitatea de ıncredere��� data se va determina intervalul numeric������ �����

astfel ıncat� �

� � ������ �����

� �� ������ �

���

Ceea ce revine la determinarea cuantilei���� astfel ıncat� �����

� ���� Functia�

a lui Laplace este aici, cea tabelata ınAnexa I.Prin operatii algebrice se ınlocuieste inegalitatea�� � � ���� , cu dubla inega-

litate echivalenta de forma��� ������ � � � �

���� � � � ��� ������ � � � �

���� �care

defineste intervalul de ıncredere pentru parametrul�.

Aplicatia 5.3.41. Fie caracteristica� ce ia numai valorile� si�

cu probabilitatile�si respectiv�

��, adica are functia de frecventa� ����� � �� �������� � � � �� ��unde� � ��� �� este un parametru necunoscut.

Page 286: Stat_Matlab.PDF

276 Teoria estimatiei

Vom folosi metoda intervalelor de ıncredere pentru select¸ii mari ın vederea es-timarii parametrului�. Consideram o selectie repetata de volum (mare)� si probabi-litatea de ıncredere�

��. Deoarece ln� ����� � � ln� � ����� ln ����� �

avemca �

ln � ������� � �� � ���

��� � � ��� ����� �

si prin urmare se obtine statistica

� � ���������

�� ��� ����� � ��� ������ �� �� �

Stiind ca�

�� ��� � � ����� rezulta

�� �� ��

��ln � ��� ����� � � �

��

��� ��� ������ � ��� ������ � �� ����� ��� ������ � ����� � �� �����

Statistica� devine asadar

� ���

�� ����� �� �� �si care urmeaza legea normala

� ��� ��, cand� ��.Pentru� dat, se determina���� � � astfel ıncat� � �� � � �� � �

���

Putem scrie ca�� � � � este echivalenta cu

� �� �� ��� ����� � �� sau

�� ��

��� � ���� � ��

�� � � ��� � ��

Discriminantul trinomului este pozitiv, anume� � �� ��� � �� �� �� �� ���

��deci inecuatia ın� are solutia de forma unui interval� ���� ���� si care va reprezentaintervalul de ıncredere pentru parametrul�.

Astfel extremitatile intervalului de ıncredere au urm˘atoarele expresii:

��� � �� �� � �� ���

� � � �� ��� � ��� ��

� ��� �� �

��� � �� �� � ����

��

� � � �� ��� � ��� ��

� ��� ��

Page 287: Stat_Matlab.PDF

5.3. Metode pentru estimarea parametrilor 277

Aceste formule de calcul sunt complicate. Avand ın vedereca aceste formule aufost deduse pentru� mare, sa zicem� � ��, cand se obtin rezultate bune, putemface simplificari ale acestor formule.In primul rand putem folosi urmatoarea scriereasimptotica

� �� � ��

� ��� �� � �� �

iar apoi

��� � � ����� � � ������� �� � ����� ��� � � ����� � � ��������� � �

��� � ����

� ����� � ��������

� �� �� �� ����

S-a ajuns, ın acest mod, la intervalul de ıncredre pentru������ ���� � �

�� ������ �� �� ���

� �� � ����� �� �� ���� ��

Observatia 5.3.42.Daca se doreste sa se determine parametrul� cu o incertitudine�

��, pentru o probabilitate de ıncredere���, atunci volumul selectiei se determina

ın felul urmator. Avand ın vedere ca

����� �� �� ����

� ������

conditia�������

���, echivalenta cu� � �

�������� � conduce la volumul optim al

selectiei.Mai jos prezentam un tabel cu valorile optime ale volumuluiselectiei pentru di-

ferite valori ale nivelului de ıncredere si ale lui��:

�� ���� 0.90 0.95 0.98

0.01 6760 9600 13530

0.02 1700 2400 3380

0.05 270 380 540

5.3.6 Functii Matlab privind estimatia

Sistemul Matlab, prinStatistics toolbox, dispune de functii corespunzatoare teorieiestimatiei, pe care le prezentam ın continuare.

Page 288: Stat_Matlab.PDF

278 Teoria estimatiei

Functia histfit

Functiahistfit are drept rezultat reprezentarea pe aceeasi figura a histogramei sia densitatii legii normale

� ���� ���.Lansarea executarii functiei se face prin una din formele

histfit(x)histfit(x,nc)

undex este un vector ce contine datele ce urmeaza a fi prelucrate,iar nc este numarulclaselor. Daca parametrulnc este absent, atunci numarul claselor se considera cafiind radicalul volumului datelor, adica radicalul lungimii vectorului x .

Programul 5.3.43. Programul urmator genereazan numere aleatoare, ce urmeazalegea normala

� �����, dupa care apeleaza la functiahistfit , iar graficul obtinut,pentrun=100 , � � �� si � � �

, este prezentat ın Figura 5.5.

n=input(’n=’); mu=input(’mu=’);s=input(’sigma=’);x=normrnd(mu,s,1,n);histfit(x), colormap spring

4 6 8 10 12 14 160

2

4

6

8

10

12

14

16

18

20

Figura 5.5: Legea� ������

Functia mle

Pentru estimarea parametrilor, folosind metoda verosimilitatii maxime, precum simetoda intervalelor de ıncredere, poate fi utilizata functia mle . Apelul functiei sepoate face prin una din instructinile:

Page 289: Stat_Matlab.PDF

5.3. Metode pentru estimarea parametrilor 279

P=mle(’lege’,x)[P,int]=mle(’lege’,x)[P,int]=mle(’lege’,x,alpha)[P,int]=mle(’lege’,x,alpha,n)

unde lege specifica una din legile:bernoulli , unid , bino , poiss , geo ,unif , norm , gam, exp , beta , weib si rayl . Parametrulx este un vector, iar ınurma executarii unei astfel de instructiune,P si int vor contine estimatori de verosi-militate maxima, respectiv intervale de ıncredere, pentru parametrii legii considerate,obtinute pe baza datelor continute dex .

Parametrul optionalalpha , avand valoarea implicitaalpha=0.05 , specificaprobabilitate de ıncredere,1-alpha , ın construirea intervalelor de ıncredere.

Ultima forma este specifica numai legii binomiale, adicalege=bino , parame-trul n fiind parametrul cel de la legea� �n ���. Dacax si n sunt scalari, se returneazaın P raportul acestora, dacax este vector sin este scalar, se va returna ınP fiecareelement a luix ımpartit lan, iar dacax si n sunt vectori de aceleasi dimensiuni,P vacontine rapoartele pe componente ale luix si n.

Mai remarcam ca pentru prima data ıntalnim legea lui Bernoulli, care reprezintacazul particular al legii binomiale,� �����. Dacalege=bernoulli , atuncix , de-sigur, trebuie sa contina numai valorile0 si 1.

Functia 5.3.44. Vom scrie o functie, care genereazan numere aleatoare ce urmeazauna din legile de probabilitate: uniforma discreta, Poisson, uniforma, normala, Ga-mma, exponentiala, Weibull si Rayleigh. Se va apela aceasta functie pentru obtinereaestimatiilor de verosimilitate maxima ale parametrilorlegii de probabilitate conside-rate. De asemenea, se va reprezenta grafic, pe aceeasi figur˘a, functia de repartitie alegii de probabilitate considerata, ımpreuna cu functia de repartitie a aceleasi legi, daravand parametrii precizati ınlocuiti cu estimatiileacestora.

function veros(lege,n)switch legecase ’unid’

P1=input(’N=’);case ’poiss’

P1=input(’lambda=’);case ’unif’

P1(1)=input(’a=’); P1(2)=input(’b=’);case ’norm’

P1(1)=input(’mu=’); P1(2)=input(’sigma=’);case ’gam’

P1(1)=input(’a=’); P1(2)=input(’b=’);case ’exp’

P1=input(’mu=’);case ’beta’

P1(1)=input(’a=’); P1(2)=input(’b=’);case ’weib’

P1(1)=input(’a=’); P1(2)=input(’b=’);

Page 290: Stat_Matlab.PDF

280 Teoria estimatiei

case ’rayl’P1=input(’b=’);

otherwiseerror(’Eroare’)

endif length(P1)==1

x=random(lege,P1,1,n);else

x=random(lege,P1(1),P1(2),1,n);endP2=mle(lege,x); xx=min(x):0.01:max(x);if length(P1)==1

F1=cdf(lege,xx,P1); F2=cdf(lege,xx,P2);else

F1=cdf(lege,xx,P1(1),P1(2)); F2=cdf(lege,xx,P2(1),P2 (2));endplot(xx,F1,’k-.’,xx,F2,’k-’)legend(’Functia de repartitie teoretica’,...

’Functia de repartitie estimata’,2)

Apelul functieiveros se face prin>>veros(’lege’,n)

unde valorile pentrun si lege , fie ca sunt precizate ın acest apel, fie sunt precizateınainte. De exemplu, comanda

>>veros(’poiss’,50)

are ca efect apelul functiei pentru legea lui Poisson, iar pe ecran se va cere introduce-rea parametruluilambda , dupa care pe ecran va fi reprezentat graficul din Figura 5.6,ın cazul ın carelambda=7 . Sa remarcam totusi ca la un nou apel, cu aceeasi para-metri, graficul difera, deoarece sunt generate alte numerealeatoare.

Daca se considera comanda>>veros(’norm’,50)

are ca efect apelul functiei pentru legea normala, iar pe ecran se va cere introdu-cerea parametrilormu si sigma , dupa care pe ecran va fi reprezentat graficul dinFigura 5.7, ın cazul ın caremu=10 si sigma=2 .

Functiile normlike, gamalike,betalike si weiblike

Functiile normlike , gamlike , betalike si weiblike sunt specifice pentruStatistics toolboxsi se pot apela cu una din comenzile

L=numef(par,x)[L,cov]=numef(par,x)

undenumef reprezinta numele uneia din cele patru functii.Parametrulpar contine respectiv parametrii legilor normala, gamma, beta si

Weibull, iarx este un vector, care contine datele de selectie.

Page 291: Stat_Matlab.PDF

5.3. Metode pentru estimarea parametrilor 281

2 4 6 8 10 12 140

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1Functia de repartitie teoreticaFunctia de repartitie estimata

Figura 5.6: Legea�� ���

4 5 6 7 8 9 10 11 12 13 140

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1Functia de repartitie teoreticaFunctia de repartitie estimata

Figura 5.7: Legea� ������

Page 292: Stat_Matlab.PDF

282 Teoria estimatiei

Prima forma returneaza ınL valoarea logaritmului functiei de verosimilitate deparametrii precizati prinpar , ınmultita cu -1.

Daca se foloseste a doua forma, se mai returneaza matriceavar , care reprezintavaloarea asimptotica a matricei covariantelor estimatorilor parametrilor legii consi-derate, cand s–au considerat parametrii de intrarepar , ca fiind estimatiile de vero-similitate maxima ale acestora. Remarcam faptul cavar reprezinta inversa matriceiinformatiei lui Fisher, cand volumul selectiei tinde lainfinit.

Functiile binofit, poissfit,unifit, normfit,gamfit, expfit, betafit, raylfit si weibfit

Functiile Matlab din aceasta categorie returneaza estimatii punctuale si intervale deıncredere pentru parametrii respectiv ai legilor de probabilitate binomiala , Poisson,uniforma, normala, Gamma, exponentiala, Beta, Rayleigh si Weibull.

Apelul acestor functii nu are o sintaxa generala.Pentru functiabinofit se pot folosi comenzile

P=binofit(x,n)[P,int]=binofit(x,n)[P,int]=binofit(x,n,alpha)

parametrulx fiind un vector, iarn precizeaza parametrul ıntreg pozitiv al legii bino-miale� �n ���. Pentru functiilepoiss si exp , respectiv pentrugam, beta , raylsi weib , apelurile sunt de forma:

P=numef(x)[P,int]=numef(x,alpha)

unde parametrulnumef reprezinta numele functiei, iarx este fie un vector, fie omatrice, pentru prima grupa de functii, iar pentru a doua,numai vector. Dacax estematrice, atunci functia opereaza pentru fiecare coloanaın parte.

Pentru legileunif si norm , apelurile sunt:[par1,par2,int1,int2]=unifit(x)[par1,par2,int1,int2]=normfit(x,alpha)

undex poate fi vector sau matrice.In al doilea caz, operatiunea se executa pentrufiecare coloana ın parte.

De regula, estimatiile punctuale returnate, sunt obtinute prin metoda verosimili-tatii maxime, folosindu–se datele continute ın parametrul x , ın parametriiP, par1si par2 . Intervalele de ıncredere sunt returnate ın parmetriiint , int1 si int2 , sisunt determinate folosind probabilitatea de ıncredere1-alpha . Valoarea implicitapentrualpha fiind alpha=0.05 .

Pentru legileunif si norm , ın comenzile de apel pot lipsiint2 , int1 si par2 ,caz ın care sunt returnate numai valorile parametrilor ramasi.

Mai remarcam faptul caint , int1 si int2 au cate doua componente, extre-mitatile intervalului de ıncredere corespunzator.

Page 293: Stat_Matlab.PDF

5.3. Metode pentru estimarea parametrilor 283

Functia 5.3.45. Vom scrie o functie, care genereazan numere aleatoare, ce urmeazauna din legile Gamma, Beta, Weibull si Rayleigh. Folosind aceste numere, se vorda estimatii punctuale pentru parametrii acestora, precum si intervale de ıncredere,considerand o probabilitate de ıncredere1-alpha specificata. Folosind estimatiilepunctuale obtinute pentru parametri, se vor reprezenta grafic densitatile de proba-bilitate, folosind parametrii estimati si respectiv parametrii considerati la generareanumerelor aleatoare. De asemenea, se vor afisa intervalelede ıncredere obtinute.

function estimat(lege,n,alpha)switch legecase ’gam’

a=input(’a=’); b=input(’b=’);x=gamrnd(a,b,n,1); [P,I]=gamfit(x,alpha);

case ’beta’a=input(’a=’); b=input(’b=’);x=betarnd(a,b,n,1); [P,I]=betafit(x,alpha);

case ’weib’a=input(’a=’); b=input(’b=’);x=weibrnd(a,b,n,1); [P,I]=weibfit(x,alpha);

case ’rayl’b=input(’b=’); x=raylrnd(b,n,1);[P,I]=raylfit(x,alpha);

otherwiseerror(’Eroare’)

endt=min(x):0.01:max(x);if length(P)==1

y=pdf(lege,t,P); yy=pdf(lege,t,b);fprintf(’ bbarat=%6.3f\n’,P)fprintf(’ (b1,b2)=(%6.3f,%6.3f)\n’,I)

elsey=pdf(lege,t,P(1),P(2)); yy=pdf(lege,t,a,b);fprintf(’ abarat=%6.3f, bbarat=%6.3f\n’,P)fprintf(’ (a1,a2)=(%6.3f,%6.3f)\n’,I(1,1),I(2,1))fprintf(’ (b1,b2)=(%6.3f,%6.3f)\n’,I(1,2),I(2,2))

endplot(t,y,’k-’,t,yy,’k-.’), plot(t,y,’k-’,t,yy,’k-.’)legend(’Legea estimata’, ’Legea teoretica’)

Apelul functieiestimat se face prin>>estimat(’lege’,n,alpha)

unde valorile pentrun, lege si alpha , fie ca sunt precizate ın acest apel, fie suntprecizate ınainte. De exemplu, comanda

>>estimat(’beta’,500,0.01)

are ca efect apelul functiei pentru legea Beta, iar pe ecranse va cere introducereaparametrilora si b, dupa care pe ecran va fi reprezentat graficul din Figura 5.8,ıncazul ın carea=3 si b=7 . Sa remarcam totusi ca la un nou apel, cu aceeasi parametri,graficul difera, deoarece sunt generate alte numere aleatoare. De asemenea, se vorafisate si estimatiile punctuale, respectiv intervalele de ıncredere:

Page 294: Stat_Matlab.PDF

284 Teoria estimatiei

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.80

0.5

1

1.5

2

2.5

3Legea estimataLegea teoretica

Figura 5.8: Legea���� �����

abarat= 2.925, bbarat= 7.130(a1,a2)=( 2.431, 3.418)(b1,b2)=( 5.928, 8.333)

Page 295: Stat_Matlab.PDF

Capitolul 6

Verificarea ipotezelor statistice

6.1 Concepte de baza

Fie colectivitatea�

cercetata din punct de vedere al caracteristicii�, care are le-gea de probabilitate data prin functia de probabilitate� �����, ce reprezinta functiade frecventa ın cazul discret, respectiv densitatea de probabilitate ın cazul continuu,pentru variabila aleatoare�.

Definitia 6.1.1. Numimipoteza statisticao presupunere relativa la legea de probabi-litate pe care o urmeaza caracteristica�.

Definitia 6.1.2. Metoda de stabilire a veridicitatii unei ipoteze statistice, se numestetest (criteriu) de verificarea ipotezei statistice.

Definitia 6.1.3. Cand ipoteza statistica se refera la parametri de care depinde legeade probabilitate a caracteristicii� se obtine untest parametric, iar ın caz contrar seobtine untest neparametric.

Observatia 6.1.4.Pentru testele parametrice vom considera ca� � � � �� � ��,

unde�� � �� � �. Ipoteza�� � � �� o vom numi ipoteza nula, iar ipoteza

�� � ��� o vom numiipoteza alternativa.

Definitia 6.1.5. O ipoteza parametrica se numesteipoteza simpla, daca multimea lacare se presupune ca apartine parametrul necunoscut este formata dintr-un singurelement, iarın caz contrar se numesteipoteza compusa.

Observatia 6.1.6. Ipoteza nula este aceea care o intuim a fi cea apropriata de rea-litate, intuitie pe care o obtinem din informatiile pe care le detinem referitoare lacaracteristica cercetata�.

285

Page 296: Stat_Matlab.PDF

286 Verificarea ipotezelor statistice

Observatia 6.1.7.Construirea unui test revine la obtinerea unui domeniu� � �� ,numit regiune critica, pentru unnivel de semnificatie (probabilitate de risc)� dat,astfel ıncat

� ������ � � � �

���� �� ����� � ��

unde����� � � � �

��� sunt variabilele de selectie corespunzatoare unei selectii devolum� considerata.

Folosind datele de selectie si regiunea critica� astfel determinata, avem ca ipo-teza nula

�� va fi admisa (acceptata) daca������ � � � �

���� ��� , iar ın caz contrar vafi respinsa, altfel spus ipoteza alternativa

�� va fi admisa (acceptata) ın al doilea caz.

6.2 Testul�

privind media teoretica

Se considera caracteristica� care urmeaza legea normala� �����, unde

� � �

este necunoscut, iar� ��

este cunoscut.Relativ la media teoretica

� � � ��� facem ipoteza nula�� � ���, cu una

din alternativele:

�� � ���� (testul� bilateral),

�� � ��� (testul� unilateral dreapta),

�� � ��� (testul� unilateral stanga).

Pentru verificare ipotezei nule�� cu una din alternativele precizate mai ınainte,

consideram o selectie repetata de volum� si un nivel de semnificatie� � ��� ��.Se cunoaste ca statistica

� ��� ��

��� �

urmeaza legea normala� ��� ��. Prin urmare, pentru� � ��� ��, putem determina un

interval numeric������� astfel ıncat

� ��� � � � �� � ��� � � ���� �� ���� � ����

Intervalul ������� nu este determinat ın mod unic, dar avand ın vedere alternativa�� considerata, adaugam conditia suplimentara:

�� ����, daca

�� � ����, adica� �����

� ���� , unde���� � ��;

�� ���� �� � ����, unde

� ������ � ����, daca

�� � ���;

Page 297: Stat_Matlab.PDF

6.2. Testul� privind media teoretica 287

�� � �� � �� � ��, unde� ����� � �

���, daca

�� � ���.

Corespunzator celor trei alternative definim regiunea critica respectiv prin:

� � ������� � � � �

���� � �� ����� �� ��� ���� � ����

��

� � ������� � � � �

���� � �� ������ ������ � ������

� � ������� � � � �

���� � �� ������ ������ � ��

��

Aici s-a folosit notatia�� � �� �������.

Intr-adevar, pentru fiecare din cele trei regiunui criticescrise mai ınainte, avemca� ������ � � � �

���� � � � ��� � �� Modul ın care am ales regiunea critica neconduce respectiv la testul� bilateral, unilateral dreapta si unilateral stanga.

Mai tarziu va fi fundamentata riguros modalitatea de construire a regiunii criticepentru alternativele considerate.

Odata construita regiunea critica� , ipoteza nula va fi admisa daca datele deselectie satisfac conditia������ � � � �

���� ��� , iar ın caz contrar va fi respinsa.Remarcam de asemenea ca regiunea critica� corespunde multimii complemen-

tare intervalului�������.

Etapele aplicarii testului �

1. Se dau:�� ����� � � � �

���� ��� �;

2. Se calculeaza intervalul������� astfel ıncat� ������ ���� � �

�� (dupa cum

s-a precizat mai ınainte);

3. Se calculeaza� ��� ������ �

unde �� � ��

�����

�� �

4. Concluzia: daca� � ������� ipoteza�� este admisa, ın caz contrar ipoteza

este respinsa.

Observatia 6.2.1.Testul� se poate aplica si ın cazul unei caracteristici� care nuurmeaza legea normala, daca volumul selectiei este mare (� � ��), considerandu-se media teoretica

� � � ��� necunoscuta si abaterea standard� � �� �� ���cunoscuta. Aceasta consideratie se bazeaza pe Teorema2.7.8.

Page 298: Stat_Matlab.PDF

288 Verificarea ipotezelor statistice

Exemplul 6.2.2. Caracteristica� reprezinta cheltuielile lunare ın mii lei pentru abo-namentele la ziare si reviste ale unei familii. Sa se verifice, cu nivelul de semnificatie� � �

��, daca media acestor cheltuieli lunare pentru o familie este de�� mii lei,stiind ca abaterea standard� � �mii lei si avand o selectie repetata de volum� � ��,care ne da distributia empirica de selectie

��� �� �� �� �� ��

� � �� �� �

��

Deoarece� � �� � �� si abaterea standard� � � este cunoscuta, vom folosi testul� pentru verificarea ipotezei nule

�� � � � ��� � ��� cu ipoteza alternativa�� � �� ��.

Pentru� � ��

��, folosindAnexa I, se determina���� � ������, astfel ıncat

� �������� � ���

�� �

�����

Anume, se obtine ca������ � ����, care ne da intervalul numeric������ � �����

pentru statistica notata prin:

� ��� ��

���

Calculam succesiv

�� � ��

�����

�� � ��� �� ��� � �� � �� �� � �� ��� � ��� � ���

��

� ��� ������ � ���

� � ������

���

� ���

�� ��

�����

Deoarece� ���

���� � ������ � �����, rezulta ca se accepta ipoteza ca cheltuielilemedii lunare ale unei familii pentru abonamentele la ziare s¸i reviste sunt de 16 miilei, cu nivelul de semnificatie

��

��.

Programul 6.2.3. Programul Matlab, care urmeaza, executa aceste calcule s¸i afiseazaintervalul de ıncredere, ımpreuna cu valoarea calculata a statsiticii�.

x=[11 13 15 17 20]; f=[4 6 12 10 8];z=(sum(x.*f)/40-16)/(3/sqrt(40));z1=norminv(0.005,0,1); z2=norminv(0.995,0,1);fprintf(’ (z1,z2)=(%6.3f,%6.3f)\n’,z1,z2)fprintf(’ z=%6.3f,%6.3f)’,z)

Page 299: Stat_Matlab.PDF

6.2. Testul� privind media teoretica 289

In urma executarii programului, s–au obtinut rezultatele:

(z1,z2)=(-2.576, 2.576)z=-0.422,

Observatia 6.2.4. Avand ın vedere ca functia�

a lui Laplace este monotoncrescatoare si ca pentru determinarea intervalului������� este necesara inversareafunctiei lui Laplace, se poate renunta la inversarea acesteia. Pentru aceasta se deter-mina ceea ce se numestevaloare critica si pe care o notam prin�. Vom analiza perand cele trei alternative.

Daca se considera testul bilateral, facand notatia

�� �

�� � ��� �� �

adica � � �� �� ��� �� �

ipoteza nula va fi respinsa daca�� �

� � �� �

� , adica� � �.Pentru testul unilateral dreapta, se noteaza

��

� � ���� ��� �

adica � � ���� ��� �

iar ipoteza nula este respinsa, daca��

� � ���, adica, la fel ca mai ınainte, daca

� � �.Un rationament analog, pentru testul unilateral stanga ne conduce la valoarea cri-

tica, calculata dupa formula� � ���� ���. Drept urmare, ipoteza nula este respinsa,

daca� � �.In rezumat, ipoteza nula este respinsa, daca� � �, unde

� �

�������������

�� �� ��� ��� daca

�� � ���� ����� ���� daca

�� � ��� �

���� ���� daca

�� � ����

Pentru datele din Exemplul 6.2.2, se obtine

� �

���������

������ pentru testul bilateral

������� pentru testul unilateral dreapta

������� petru testul unilateral stanga�

Page 300: Stat_Matlab.PDF

290 Verificarea ipotezelor statistice

6.2.1 Functiilezscore si ztest

Sistemul Matlab, prinStatistics toolbox, dispune de functiilezscore si ztest , cuaplicabilitate la testul�. Apelarea acestor functii se face prin:

z=zscore(d)h=ztest(x,m0,sigma)h=ztest(x,m0,sigma,alpha)h=ztest(x,m0,sigma,alpha,tail)[h,c,ci,zc]=ztest(x,m0,sigma,alpha,tail)

In urma executarii primei instructiuni, dacad este un vector, se calculeaza abaterilecomponentelor vectorului de la valorea medie a componentelor, raportate la abatereastandard a componentelor, adicax � � d���d��d

Dacad este matrice, atunci operatiaeste executata pentru fiecare coloana ın parte.

Celelalte instructiuni se refera la functiaztest si efectueaza testul� asupradatelor continute ın vectorulx , folosind nivelul de semnificatiealpha , care are va-loarea implicitaalpha=0.05 .

Parametrultail specifica una din cele trei alternative, care conduc la tes-tul bilateral (tail=0 , implicit), unilateral dreapta (tail=1 ) si unilateral stanga(tail=-1 ). Dacah=1 , atunci ipoteza nula va fi respinsa, respectiv dacah=0 , ipo-teza nu poate fi respinsa.

Ultima forma de apel permite, de asemenea, obtinerea valorii critice c , a valoriizc a statisticii�, precum si a intervalului de ıncredere pentru media teoretica, cores-punzator probabilitatii de ıncredere1-alpha , obtinut ın vectorul cu doua compo-nenteci .

Programul 6.2.5. Programul Matlab, ce urmeaza, rezolva problema din Exem-plul 6.2.2. Mai mult, se considera si testele unilateral dreapta si unilateral stanga,precum si obtinerea intervalelor de ıncredere.

x=[11*ones(1,4),13*ones(1,6),15*ones(1,12),...17*ones(1,10),20*ones(1,8)];

fprintf(’ h c ci z\n’)fprintf(’____________________________________\n’)for i=-1:1

[h,c,ci,zc]=ztest(x,16,3,0.01,i);fprintf(’ %d %5.4f (%4.2f,%4.2f) %6.4f\n’,...

h,c,ci,zc)end

In urma executarii programului, se obtin rezultatele:

h c ci z____________________________________

0 0.3366 (-Inf,16.90) -0.42160 0.6733 (14.58,17.02) -0.42160 0.6634 (14.70, Inf) -0.4216

Page 301: Stat_Matlab.PDF

6.3. Puterea unui test 291

Se observa ca pentrutail=-1 si tail=1 , se construiesc intervale nemarginite,respectiv la stanga si la dreapta.

6.3 Puterea unui test

Definitia 6.3.1. Daca se considera un test relativ la ipoteza nula�� cu alternativa

��, se numesteeroare de genul (speta) ıntairespingerea unei ipoteze adevarate, iarprobabilitatea acestei erori se numesterisc de speta ıntai (risc al furnizorului)si estedata de nivelul� de semnificatie, adica

� � � ������ � � � �

���� �� �����

Definitia 6.3.2. Se numesteeroare de genul (speta) al doileaadmiterea unei ipotezefalse, iar probabilitatea acestei erori se numesterisc de speta a doua (risc al benefi-ciarului) si este notata

�,

� � � ������ � � � �

���� ��� �����

Observatia 6.3.3. Producerea unei erori de genul al doilea este mai grava decˆat aunei erori de genul ıntai, cand verificam concentratiaunui medicament, care pesteun anumit grad de concentratie devine daunator. Pe de alta parte, producerea uneierori de genul ıntai este mai grava decat cea a unei eroride genul doi, cand verificamcalitatea unui articol de ımbracaminte.

Definitia 6.3.4. Numimputerea unui testprobabilitatea respingerii unei ipoteze false,adica � ��� � � �� �

��� � ������� � � � �

���� �� ��� � ��

�cand

�este parametrul asupra caruia se face ipoteza statistica, iar � este regiunea

critica construita sub ipoteza nula cu nivelul de semnificatie� � ��� �� fixat.

Observatia 6.3.5. Daca testul considerat se refera la ipoteza nula�� � � �� cu

ipoteza alternativa�� � � ��, atunci� ���� � � si � ���� � �

���

Aplicatia 6.3.6. Calculam ın continuare puterea testului�, cand avem ipoteza alter-nativa

�� � ��� ����.Dupa cum am vazut la testul� regiunea critica ın acest caz este

� � ������� � � � �

���� � �� ����� �� ��� ���� � ����

��

Page 302: Stat_Matlab.PDF

292 Verificarea ipotezelor statistice

Pentru calculul puterii� ���� a testului avem

� ���� � � ������ � � � �

���� �� ����� � �

��� �� ��� ����� � ���� ��������

Daca se considera evenimentul contrar, vom putea scrie succesiv

� ��� � ���� � �

��� �� ��� ����� � ���� �������

����

���� ��� ������ � �� ������ � ���� ����

�����

��� ������ �

���� ��� ������ �

�� ������ � ���� ��������

de unde avem ca

(6.3.1)� � ��

�� ������ � ����� ����� ������ �

������

adica

(6.3.2) � ���� � ����

�� ������ � ����� ����� ������ �

������

Deoarece� ���� � �

�� si� ���� � ��

��, rezulta ca pentru� � �, vomavea

� � �, adica� ���� � �. Asadar, putem determina, din relatia precedenta

valoarea lui� (volumul selectiei) astfel ıncat puterea testului (corespunzator risculde speta a doua) sa fie atinsa pentru acel�.

Exemplul 6.3.7. Relativ la caracteristica� s-a efectuat o selectie de volum� � ��,obtinandu-se datele de selectie

� � ��� �� �� ��� ��� ��� �� �� ��� �� ���� � �� �� ��� � � �� ���� ��� �� ��� � � �

Stiind ca� urmeaza legea normala� ����� cu abaterea standard teoretica cunos-

cuta� � �� �� ��� � ���, vrem sa verificam ipoteza nula

�� � � ���, candse considera ipoteza alternativa

�� � �� ���, cu nivelul de semnificatie� � ��

��,iar apoi sa calculam puterea testului, cand

� � ���� ���� ���� ���, si sa determinamvolumul � optim al selectiei cand se considera alternativa

�� � � ���, si riscul despeta a doua

� � ��

��.

Page 303: Stat_Matlab.PDF

6.3. Puterea unui test 293

Cand se considera alternativa�� � �� ��� se foloseste testul� bilateral. Se

determina cuantila

���� � ���� din relatia

� ������ �

��

��

��

���� �

�����

Pe de alta parte avem ca

�� � ��

�����

�� � ��� ����� � ��

�� � � ����� � �����astfel ca

� ��� ������ � ���� � ������

���� ��

����

Deoarece�� � � ���� � �

��� � ���� , ipoteza�� � � ��� este admisa.

Formula de calcul a puterii testului� bilateral este (6.3.2). Prin urmare, se obtine

� ����� � ��� ��

���� � ����

�� ��

����� �

���� �

���� ����� � ��� ������ �� ������� � �

���� ����� � ��� ���

����� ����

�� ���

����� �

���� �

���� ����� � ��� ���

���� ����

��� ���

���� �

���� �

���

Pentru determinarea volumului optim al selectiei, cand se considera alternativa�� � � ���, se foloseste formula (6.3.1). Astfel se obtine

��

�� � � �������������

��� �

���� �� �����������

��� �

������

������ �

���� �� ������ �

���� �

Cand� este astfel ıncat����� �

��� � �, se observa ca valoarea

� � ��

�� nu poatefi atinsa. Daca

������

��� � �, atunci� � ���, astfel avem

� ����� �

�����

���.

Prin urmare, pentru determinarea lui� optim avem relatia� �

���� �

���� � �

����si folosindAnexa Ise obtine

����� �

��� � ����, adica�� � � ���

�� � �����, deunde se obtine� � ���.Programul 6.3.8. Programul Matlab, ce urmeaza, pe langa faptul ca va efectua cal-culele din exemplul precedent, va reprezenta grafic si functia putere. Punctele de pecurba puterii, ale caror valori au fost calculate ın exemplul de mai sus, sunt marcateprin cerculete ın Figura 6.1.

Page 304: Stat_Matlab.PDF

294 Verificarea ipotezelor statistice

clear,clfx=[3.59,4.27,2.83,2.28,3.69,2.81,3.16,3.03,3.65,...

3.84,4.32,3.21,3.20,3.32,3.82,3.27,3.77,3.56,...3.29,4.08,2.97,3.29,3.78,3.58];

z=(mean(x)-3.5)/(0.5/sqrt(24));z1=norminv(0.005,0,1); z2=norminv(0.995,0,1);fprintf(’ z=%6.3f\n z1=%6.3f\n z2=%6.3f\n’,z,z1,z2)m=3:0.01:4; m1=3.4:0.1:3.7;c1=norminv(0.005,0,1); c2=norminv(0.995,0,1);pib=1-normcdf((3.5-m)./(0.5/sqrt(24))+c2,0,1)...

+normcdf((3.5-m)./(0.5/sqrt(24))+c1,0,1);pib1=1-normcdf((3.5-m1)./(0.5/sqrt(24))+c2,0,1)...

+normcdf((3.5-m1)./(0.5/sqrt(24))+c1,0,1);plot(m,pib,’k-’,m1,pib1,’o’), grid on, len=length(m1);for i=1:len

fprintf(’ pi(%3.1f)=%5.3f\n’,m1(i),pib1(i))endza=norminv(0.005,0,1); zb=norminv(0.95,0,1);n=ceil(0.5ˆ2*(zb-za)ˆ2/(3.5-3.4)ˆ2);fprintf(’ nopt=%3d’,n)

Rezultatele obtinute, ın urma executarii programului,sunt urmatoarele:z=-0.567z1=-2.576z2= 2.576pi(3.4)=0.055pi(3.5)=0.010pi(3.6)=0.055pi(3.7)=0.269nopt=446

Lema 6.3.9 (Neyman–Pearson).Fie caracteristica� cu legea de probabilitate dataprin � �����, unde

� � � � � este parametrul necunoscut asupra caruia se faceipoteza nula simpla

�� � � ��, cu ipoteza alternativa simpla�� � � �� �� ��.

Se considera o selectie repetata de volum� relativa la caracteristica� si nivelul desemnificatie dat� � ��� ��, atunci

����� ����� � �

���� �� ����� ����

� � �� �� ����� � �

���� �� ����� � �

�� � �����

� � �

���� � �

� ����

regiunea critica�

� , fiind definita prin

� � ����� � � �

���� � �� ����� ���� � � �

�������� ���� � � �

������� ��� �

���

Page 305: Stat_Matlab.PDF

6.3. Puterea unui test 295

3 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9 40

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Figura 6.1: Curba functiei putere

unde

� ���� � � �

������ ������� ��� ��� �

Demonstratie.Facem demonstratia ın doua etape.In prima etapa, consideram ca se cunoaste constanta

�� �

�si aratam ca

��� � � ����

� � �

���� �� ����� � � �����

� � �

���� � �

� ����

� �

� ���

Pentru aceasta, daca notam� � � � �

� , obtinem succesiv

�� � �

��� ���� � � �

���������� � � �

��� � � ����� � �

���� �� ����� � �

� � ������ � �

���� � �

� ����

� �

� � �

���� ���� � � �

���������� � � �

��� �de unde avem ca

�� � �

����

� ���� � � �

���������� � � �

��� � �� � �

��

� ���� � � �

���������� � � �

���� �

� � �

�����

� ���� � � �

���������� � � �

����� �

� � �

��

� ���� � � �

���������� � � �

��� �

Page 306: Stat_Matlab.PDF

296 Verificarea ipotezelor statistice

adica

(6.3.3)

�� � �

����

� ���� � � �

���������� � � �

�����

� � �

�����

� ���� � � �

���������� � � �

����

Putem trece acum la calculul diferentei

���� � ��� �� � � ������� �����

� � �

���� � �

� ����

�� ����� � �

���� �� �����

��� � �

���� ���� � � �

���������� � � �

��� � �� � �

��� ���� � � �

���������� � � �

�����

� � �

�����

� ���� � � �

���������� � � �

���� �

� � �

����

� ���� � � �

���������� � � �

����

Scriem aceata diferenta sub forma

� � �� ��� � �

�����

� ���� � � �

�������� ���� � � �

������� � ���� � � �

���������� � � �

�����

� � �

����

� ���� � � �

�������� ���� � � �

������� � ���� � � �

���������� � � �

����

Pentru fiecare integrala din membrul drept aplicam formula de medie. Prin urmareexista������ � � � �

���� � �

��� si ������ � � � �

���� ���� astfel ıncat

� � �� �� ���� � � �

�������� ���� � � �

������� � � � �

�����

� ���� � � �

���������� � � �

����� ���� � � �

�������� ���� � � �

������� � � � �

����

� ���� � � �

���������� � � �

����

Folosind relatia (6.3.3), stabilita mai ınainte, avem ca

� � �� ��� ���� � � �

�������� ���� � � �

�������� � ���� � � �

�������� ���� � � �

��������

��� � �

����

� ���� � � �

���������� � � �

����

Page 307: Stat_Matlab.PDF

6.3. Puterea unui test 297

Dar integrala din membrul drept este pozitiva, iar din modul cum s-a definit regiuneacritica

� avem ca

� ���� � � �

�������� ���� � � � �

������� ��� �

� ���� � � �

�������� ���� � � �

��������

deci����

��

si ca urmare����

� ���

. Ceea ce ıncheie partea ıntai a demonstratiei.In partea a doua aratam existenta constantei

�� �

�.

Notam prin� ��� urmatoarea regiune

� ��� � ����� � � �

���� � �� �� � ���� � � �

������� � �� ���� � � �

���������

si prin� ���, urmatoarea probabilitate

� ����� ����� � �

������ ��� ������ � � �

����� � ���� � � �

���������� � � �

����

Se observa ca� ���� � �

, iar

� ��� � �� � �

��� � ���� � � �

���������� � � �

��� � ��

De asemenea, avem ca functia� ��� este monoton descrescatoare. Prin urmare,

pentru� � ��� �� fixat, exista�� �

�astfel ıncat

� ���� � �, adica

� ����� � �

���� � � ���� ���� � ��

Ceea ce ıncheie demonstratia lemei.

Observatia 6.3.10.Demonstratia lemei Neyman–Pearson a fost facuta ın cazul con-tinuu. In mod analog se demonstreaza si pentru cazul discret, integralele multiplecare apar fiind ınlocuite cu sume multiple.

Definitia 6.3.11. Testul pentru care puterea este maxima ıl numimcel mai puternictest.

Definitia 6.3.12. Testul pentru care are loc inegalitatea

��� � � ������ � � � �

���� �� ���� � � ������ � � � �

���� �� ���� � ��

adica puterea testului este mai mare decat riscul de spetaıntai se numestetest nede-plasat.

Page 308: Stat_Matlab.PDF

298 Verificarea ipotezelor statistice

Proprietatea 6.3.13.Cel mai puternic test dat de lema Neyman–Pearson este un testnedeplasat, adica �

� ��� �.

Demonstratie.Cu notatiile de la lema Neyman–Pearson, avem ca

�� � �

���� ���� � � �

���������� � � �

��� � �� �

� � �

���� ���� � � �

���������� � � �

����

Distingem doua cazuri.Daca avem

�� � �, atunci obtinem

�� �� � �

� � �

���� ���� � � �

���������� � � �

���� �

� �� � �

���� ���� � � �

���������� � � �

���� �

� � �

���� ���� � � �

���������� � � �

��� � ��

de unde�� ��

� �.In cazul cand

��� �, avem

�� � �� � �

����� ���� � � �

���������� � � �

���� �

� �� � �

����� ���� � � �

���������� � � �

���� �

� � �

����� ���� � � �

���������� � � �

��� � ����

de unde�� ��

� �, ceea ce trebuie demonstrat.

Observatia 6.3.14.Prin micsorarea riscului de speta ıntai, pentru� fixat, creste con-stanta

�� si prin urmare scade puterea testului,�

� ��, deci creste riscul de speta a

doua.

Aplicatia 6.3.15. Fie caracteristica� ce urmeaza legea normala� �����, unde

� � � este necunoscut si� ��

este cunoscut. Fie ipoteza nula�� � � ��, cu

ipoteza alternativa�� � � �� �� ��. Vrem sa determinam cel mai puternic test

pentru verificarea acestei ipoteze nule.Pentru aceasta aplicam lema Neyman-Pearson.Prima data determinam regiunea critica

� .Deoarece

� ������ � � � �

������ ��

������� ����� �

�������� ��� ������

Page 309: Stat_Matlab.PDF

6.3. Puterea unui test 299

rezulta ca

� ������ � � � �

�������� ������ � � � �

������� � ���� ����

� ����� ��� ����� �

����� ��� �����

��

Conditia care defineste regiunea critica�

�� ������ � � � �

�������� ������ � � � �

������� ����

devine prin logaritmare����� ��� ����� �

����� ��� ����� � ���ln �

��

sau� ��� ����

�����

�� �� ��� ���� ��� ���� � ���ln ���

adica� ��� ����

�����

�� � ���ln ���� ��� ���� ��� ����

Distingem ın continuare doua cazuri.Daca

�� ���, avem

��

�����

�� � �� � ��ln ��

��� �������� ���

��

si notand constanta din membrul drept prin�

�, avem ca�� � ��. Asadar regiunea

critica a celui mai puternic test este�

� � ������� � � � �

���� � �� � �� �����

Daca�� ���, procedand analog, se ajunge la regiunea critica

� � ������� � � � �

���� � �� �� �� ��

���

Pentru determinarea constantei�

� (cazul�� ���), se scrie relatia

� � � ������� � � � �

���� � �

� ����

� � �� ��

� � �� �

sau

�� �� ������ � ��

������ ������� � ��

Page 310: Stat_Matlab.PDF

300 Verificarea ipotezelor statistice

Prin urmare,�

� se va determina astfel ıncat���������� � � ��

unde functia�

a lui

Laplace este cea definita prin

� ��� � ���� � �

�� ��� ���Asadar avem cuantila��, ca fiind�� �

��������

�de unde

�� ��� � �����.

In acest fel, regiunea critica se poate scrie�

� �������� � � � �

���� � �� �� ����� � ��

���

��������� � � � �

���� � �� ���� ���

��� � ���

In cazul�� ���, procedand la fel, se ajunge la

� �������� � � � �

���� � �� �� �� ��� � ��

������

�������� � � � �

���� � �� ���� ������ � ������

Observatia 6.3.16. In aplicatia precedenta, regiunea critica�

� nu depinde de��

numai prin faptul ca�� � ��, respectiv

�� ���. Drept urmare, ipoteza

�� sepoate ınlocui, pentru cele doua situatii prin

�� � ���, ceea ce ne conduce

la testul� unilateral dreapta, respectiv�� � � ��, care ne conduce la testul�

unilateral stanga. Aceasta confirma justetea alegerii regiunilor critice ın cazul testului� unilateral dreapta si respectiv stanga.

Observatia 6.3.17.Cand se considera ipoteza alternativa�� � �� �� (testul�

bilateral), utilizand lema Neyman–Pearson, nu putem construi un cel mai puternictest. Alta metoda va fi prezentata pentru construirea acestuia ın acest caz.

Aplicatia 6.3.18. Vrem sa determinam ın continuare puterea testului� stabilit laAplicatia 6.3.15.

Din nou distingem cele doua cazuri.Daca

�� ���, avem succesiv� ���� � �� �� � � ������� � � � �

���� � �

� ��� ���

� ���� ��� � �� ��

���������

� �� �������� ��� ������ � �� ��

����� � ���� ������ � ����

Page 311: Stat_Matlab.PDF

6.3. Puterea unui test 301

unde functia�

a lui Laplace este cea din Aplicatia 6.3.15.Daca

�� ���, de asemenea, avem

� ���� � �� �� � � ������� � � � �

���� � �

� ��� ���

� ���� ��� � ���� ��

��������

� �� �������� ��������� � ���� ���������

����������� �������

Se vede, ınca odata, ın ambele cazuri, ca� ���� � �, cand� ��, adica�� � �

.Sa ıncheiem prin modul de determinare a volumului� al selectiei, pentru a se

atinge o putere a testului (sau un risc de speta a doua) apriori fixata. Desigur ca�este considerat de asemenea dat.

In cazul�� �

��, din � ������� � � � �

���� � �

� ����

� ��

am determinat�

� � �� � ����� � Pe de alta parte,� ������� � � � �

���� � �

� ����

� �

���se

rescrie ın felul urmator

�� �� ������ � ��

������ ����� � �

� �� �adica

���������� � � �

� �� �

de unde se obtine o alta relatie ce ıl contine pe�

�, anume��������

� ����� � Com-

parand cele doua relatii ce ıl contin pe�

�, avem ca�� � ����� � �� � �������� �

de unde se obtine

(6.3.4) � ��� ������ � ��

���� �����

In cazul�� ���, avem urmatoarele doua relatii, care ıl contin pe

��,

�� ��� � ��

����� si

�������� � �

���

de unde se obtine

(6.3.5) � ��� ���� � �����

��� �����

Page 312: Stat_Matlab.PDF

302 Verificarea ipotezelor statistice

Exemplul 6.3.19.Sa consideram aceleasi date de selectie de la Exemplul 6.3.7. Vomverifica ipoteza nula

�� � � ���, cand se considera respectiv ipotezele alternative�� � � ���, �� � � ���, iar nivelul de semnificatie este� � �

��. Vomcalcula puterea pentru fiecare din testele considerate, cand

� � ���� ���� ���� ���,iar apoi vom determina volumul� optim al selectiei cand se considera alternativa�� � � ���, respectiv

�� � � ���, cu riscul de speta a doua fixat� � �

��.Cand se considera alternativa

�� � � ��� se foloseste testul� unilateraldreapta.In acest caz, cuantila���� � �

��� se determina din� ������� �

�����

����

Deoarece� ���

��� � ���� � ����, rezulta ca ipoteza nula este admisa.

Pentru alternativa�� � � ��� se foloseste testul� unilateral stanga. Se deter-

mina�� ���

��� din relatia� ����� � �

��� � �

���� Deoarece are loc inegalitatea� �

����� �

����� � ��, se admite ipoteza

�� si ın acest ultim caz.Pentru testul� unilateral dreapta, formula de calcul a puterii este

� ��� � ���� �

�� ��

��� � ����� �

si prin urmare

� ����� � ���� ��

����� ����

��� � ����� � �

��� ���

����� ����

��

���� ����� � �

��� ��������

��� � ����� � ���� ���

���� ����

��

����

In cazul testului� unilateral stanga, avem

� ��� � ���� �

�� ����� � ��� �

deci

� ����� � ���� ��

����� �

�����

��� � ����� � ���� ���

����� �

������

� ����� � ���� ���������

��� � ����� � ���� ���

���� �

�����

Pentru determinarea volumului optim al selectiei, cand folosim testul unilateralstanga, cu alternativa

�� � � ���, se utilizeaza formula (6.3.4):

� � �� ����� � ������� ����� �

��

�� ����� � ������

���������� �

de unde se obtine� � ���.

Page 313: Stat_Matlab.PDF

6.3. Puterea unui test 303

Pentru determinarea volumului optim al selectiei, cand folosim testul unilateraldreapta, cu alternativa

�� � � ���, se utilizeaza formula (6.3.5). Astfel volumuloptim� al selectiei se calculeaza cu formula:

� � �� ��� � ��������� ����� �

��

�� ������� �

���������

������

� ������

de unde se obtine� � ��.

Programul 6.3.20. Programul Matlab urmator, efectueaza calculele din exemplulprecedent, iar ın plus, reprezinta grafic curbele putere,ın cazul celor doua alterna-tive. Punctele de pe curbele putere, care au fost calculate ˆın exemplul precedent, suntmarcate pe Figura 6.2 prin cerculete.

clear,clfx=[3.59,4.27,2.83,2.28,3.69,2.81,3.16,3.03,3.65,...

3.84,4.32,3.21,3.20,3.32,3.82,3.27,3.77,3.56,...3.29,4.08,2.97,3.29,3.78,3.58];

z=(mean(x)-3.5)/(0.5/sqrt(24));fprintf(’ z=%6.3f\n’,z)z1=norminv(0,0,1); z2=norminv(0.99,0,1);fprintf(’ m gt 3.5\n’)fprintf(’ z1=%6.3f, z2=%6.3f\n’,z1,z2)z1=norminv(0.01,0,1); z2=norminv(1,0,1);fprintf(’ m lt 3.5\n’)fprintf(’ z1=%6.3f, z2=%6.3f\n’,z1,z2)m=3:0.01:4; m1=3.4:0.1:3.7;c2=norminv(0.99,0,1);pib=1-normcdf(c2+(3.5-m)./(0.5/sqrt(24)),0,1);pib1(1,:)=1-normcdf(c2+(3.5-m1)./(0.5/sqrt(24)),0,1 );subplot(2,1,1)plot(m,pib,’k-’,m1,pib1(1,:),’o’), grid onc1=norminv(0.01,0,1);pib=normcdf(c1+(3.5-m)./(0.5/sqrt(24)),0,1);pib1(2,:)=normcdf(c1+(3.5-m1)./(0.5/sqrt(24)),0,1);subplot(2,1,2)plot(m,pib,’k-’,m1,pib1(2,:),’o’), grid onlen=length(m1);for i=1:len

for j=1:2fprintf(’ pi(%3.1f)=%5.3f ’,m1(i),pib1(j,i))

endfprintf(’\n’)

endzb=norminv(0.95,0,1); za=norminv(0.01,0,1);nr=ceil(0.5ˆ2*(zb-za)ˆ2/(3.5-3.4)ˆ2);zb=norminv(0.05,0,1); za=norminv(0.99,0,1);nl=ceil(0.5ˆ2*(zb-za)ˆ2/(3.5-3.7)ˆ2);fprintf(’ nr=%3d, nl=%3d’,nr,nl)

Page 314: Stat_Matlab.PDF

304 Verificarea ipotezelor statistice

In urma executarii programului, pe langa graficele curbelor de putere, sunt afisate siurmatoarele rezultate:

z=-0.567m gt 3.5

z1= -Inf, z2= 2.326m lt 3.5

z1=-2.326, z2= Infpi(3.4)=0.000 pi(3.4)=0.089pi(3.5)=0.010 pi(3.5)=0.010pi(3.6)=0.089 pi(3.6)=0.000pi(3.7)=0.357 pi(3.7)=0.000nr=395, nl= 99

care reprezinta intervalele numerice(z1,z2) si volumul optim, cand se consideracele doua alternative.

3 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9 40

0.2

0.4

0.6

0.8

1

3 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9 40

0.2

0.4

0.6

0.8

1

Figura 6.2: Curbele functiilor putere

6.4 Testul�

(Student) privind media teoretica

Fie caracteristica� ce urmeaza legea normala� �����, cu ambii parametri

� � �

si � ��

necunoscuti. Relativ la valoarea medie a acestei caracteristici, se face ipotezanula

�� � ���, cu una din alternativele�� � ����, cand obtinemtestul� bilateral,�� � �

��, cand obtinemtestul� unilateral dreapta,

Page 315: Stat_Matlab.PDF

6.4. Testul� (Student) privind media teoretica 305

�� � ���, cand obtinemtestul� unilateral stanga.

Pentru verificarea acestei ipoteze se considera o selectie repetata de volum�, cu da-tele de selectie��� � � �

��� si corespunzator variabilele de selectie���� � �

���. Con-form Proprietatii 4.2.26, statistica

� ��� ��

���� ��� ��� ��

����

unde�� � �

������

� � ��� � ���

�����

�� � �� �� � �

��

���� �

urmeaza legea Student cu��

�grade de libertate.Prin urmare, pentru nivelul de semnificatie� � ��� �� dat, se poate determina

intervalul numeric���� ��� astfel ıncat

� � � ���� ��� ����� � ���� ���� ����� ���� � �

���

unde

�� ��� �� � �

��

���� ��� � �

�����

�������� ��� � � � �

este functia de repartitie pentru legea Student cu�

grade de libertate (tabelata ınAnexa II, pentru anumite valori).

Intervalul numeric���� ��� pentru statistica� nu este determinat ın mod unic dinconditia de mai sus.In functie de alternativa

�� aleasa, se considera suplimentar:

�� � ���� �� � �������� , daca

�� � ����,�� � ��� �

� � ��������, daca�� � �

��,�� � ������ � �

� � ��, daca�� � ���,

unde���� este cuantila de ordin� a legii Student cu

grade de libertate, adica

�� ����� � � � �

Corespunzator intervalului���� ��� se considera respectiv regiunea critice� definiteprin:

� �������� � � � �

���� � �� ����� �� ��� �

����� � ����������

Page 316: Stat_Matlab.PDF

306 Verificarea ipotezelor statistice

� �������� � � � �

���� � �� ������ ���

����� � ����������

� �������� � � � �

���� � �� ������ ���

����� � ��������

Aici s-au utilizat notatiile�� � �� �������, respectiv���� � �

��� ����� ��� � �����

Se verifica imediat ca� ������ � � � �

���� � � ���� � ��iar cele trei moduri de

definire a regiunii critice� ne conduc respectiv la testul� bilateral, unilateral dreaptasi unilateral stanga.

Odata construita regiunea critica� , folosind datele de selectie����� � � � �

���,ipoteza nula

�� va fi admisa daca������ � � � �

���� �� � , iar ın caz contrar va firespinsa. Remarcam de asemenea ca regiunea critica� corespunde multimii comple-mentare intervalului���� ���.Etapele aplicarii testului

1. Se dau:�� ����� � � � �

���� ���

2. Se calculeaza intervalul���� ��� astfel ıncat���� ���� � ���� ���� � ����

(dupa cum s-a prezentat ınainte);

3. Se calculeaza

� � �� ������� �

unde �� � ��

�����

�� � ��� � ���

����� ��� � ���� �

4. Concluzia: daca� � ���� ��� ipoteza

�� este admisa, ın caz contrar ipoteza esterespinsa.

Observatia 6.4.1.Cand numarul gradelor de libertate tinde la infinit, conform teo-remei limita centrala, avem ca legea Student converge ın repartitie la legea normala� ��� ��. Prin urmare, daca volumul� al selectiei este mare�� � ��� se poate utilizatestul� pentru verificarea ipotezei nule

�� � ���, prin utilizarea statisticii� ınloc de statistica�. Toate rezultatele de la testul� raman, asadar, adevarate ın acestcaz.

Observatia 6.4.2.Avand ın vedere ca functia de repartitie a legii Student este strictcrescatoare, iar pentru determinarea intervalului���� ��� este necesara inversareaacestei functii, se poate renunta la operatia de inversare. Pentru aceasta se determinaceea ce se numestevaloare critica, ca si la testul�, si pe care o notam prin�. Vomanaliza pe rand cele trei alternative.

Page 317: Stat_Matlab.PDF

6.4. Testul� (Student) privind media teoretica 307

Daca se considera testul bilateral, facand notatia

�� �

�� ���� ��� �� �

adica � � � ������� ��� ��� �

ipoteza nula va fi respinsa daca�� �

� � �� �

� , adica� � �.Pentru testul unilateral dreapta, se noteaza

��

� � ���� ��� �adica � � �

����� ��� �

iar ipoteza nula este respinsa, daca��

� � ���, adica, la fel ca mai ınainte, daca

� � �.Un rationament analog, pentru testul unilateral stanga ne conduce la valoarea cri-

tica, calculata dupa formula� � ���� ���. Drept urmare, ipoteza nula este respinsa,daca� � �.

In rezumat, ipoteza nula este respinsa, daca� � �, unde

� �

���������

� ������� ��� ���� daca�� � ���� �

������ ���� daca

�� � ��� �

���� ���� daca�� � ���

6.4.1 Functiattest

Sistemul Matlab, prinStatistics toolbox, dispune de functiattest , cu aplicabilitatela testul� . Apelarea acestei functii se face prin:

h=ttest(x,m0)h=ttest(x,m0,alpha)h=ttest(x,m0,alpha,tail)[h,c,ci]=ttest(x,m0,alpha,tail)

In urma executarii acestor instructiuni, se efectueazatestul� asupra datelor continuteın vectorulx , folosind nivelul de semnificatiealpha , care are valoarea implicitaalpha=0.05 .

Parametrultail specifica una din cele trei alternative, care conduc la tes-tul bilateral (tail=0 , implicit), unilateral dreapta (tail=1 ) si unilateral stanga(tail=-1 ). Dacah=1 , atunci ipoteza nula va fi respinsa, respectiv dacah=0 , ipo-teza nu poate fi respinsa.

Ultima forma de apel permite, de asemenea, obtinerea valorii critice c , precumsi a intervalului de ıncredere pentru media teoretica, corespunzator probabilitatii deıncredere1-alpha , obtinut ın vectorul cu doua componenteci .

Programul 6.4.3. Programul Matlab, ce urmeaza, aplica testul� , pentru dateledin Exemplul 6.2.2, considerand ca dispersia este necunoscuta. Ipoteza nula este

Page 318: Stat_Matlab.PDF

308 Verificarea ipotezelor statistice

� � � ��, iar ca ipoteze alternative se considera, pe rand, cele trei, care con-duc, respectiv la testele bilateral, unilateral stanga si unilateral dreapta. Programul vadetermina, de asemenea, intervalele de ıncredere pentru media teoretica, ın cele treicazuri, folosindalpha=0.01 .

x=[11*ones(1,4),13*ones(1,6),15*ones(1,12),...17*ones(1,10),20*ones(1,8)];

fprintf(’ h c ci \n’)fprintf(’___________________________\n’)for i=-1:1

[h,c,ci]=ttest(x,16,0.01,i);fprintf(’ %d %5.4f (%4.2f,%4.2f) \n’,h,c,ci)

end

In urma executarii programului, se obtin rezultatele:

h c ci___________________________

0 0.3261 (-Inf,16.87)0 0.6522 (14.61,16.99)0 0.6739 (14.73, Inf)

Se observa ca pentrutail=-1 si tail=1 , se construiesc intervale nemarginite,respectiv la stanga si la dreapta.

6.5 Testul raportului verosimilit atilor

Fie caracteristica� cu legea de probabilitate� �����, unde parametrul necunoscut� � � � �� . Relativ la parametrul�, se considera ipoteza nula

�� � � �� cualternativa

�� � �����. Se considera o selectie repetata de volum� cu ajutorulcareia se construieste statistica

�� � ������� � �

���� � ������ � ����� � �

����������� � ����

� � �

�������

unde

� ���� � � �

������ ������� ��� ���

este functia de verosimilitate. Din felul cum a fost definita statistica��, avem ca� � �� � �, iar ipoteza

�� va putea fi acceptata daca��

este apropiata de�. Fo-losind aceasta observatie, pentru un nivel de semnificatie � � ��� �� dat, se determina

regiunea critica din relatia� ��� � �� ����

� ��

unde�� este cuantila de ordin�,

pentru legea de probabilitate a statisticii��.

Page 319: Stat_Matlab.PDF

6.5. Testul raportului verosimilitatilor 309

Exemplul 6.5.1. Fie caracteristica� ce urmeaza legea normala� �����, unde pa-

rametrii� � � si � �

�sunt necunoscuti. Vrem sa verificam urmatoarea ipoteza

nula�� �� � �� �� �

��, cu alternativa�� �� �� �� �� �

��. Pentru aceastaconsideram o selectie repetata de volum� si nivelul de semnificatie� � ��� �� fixat.Functia de verosimilitate este data prin

� ���� � � �

�������� ��

������� ��� �� �

�������� ��� ����

Cand ipoteza�� este adevarata, atunci estimatorul de verosimilitate maxima pentru�

este dat prin

��� �������

����� ��� �����

Obtinem astfel, ın acest caz, ca

������ � ����� � �

������ ��� ��

��������� ��� �� �

���������� ��� �����

��

���e�

���� ��� �������

Pe de alta parte, pentru determinarea numitorului statisticii��, vom cauta estima-

torii de verosimilitate maxima pentru parametrii� � � si � �

�necunoscuti.

Sistemul de verosimilitate maxima

�������

�ln � ������ � � � �

���������� � �

�ln � ������ � � � �

���������� � ��

ne da estimatorii de verosimilitate maxima pentru�

si �, anume

�� � ��

������

� � �� �

�� �������

�����

�� � �� �� � ���� �

Page 320: Stat_Matlab.PDF

310 Verificarea ipotezelor statistice

Obtinem astfel ca

��������� � ������ � � � �

�������� ��

��������� ��� �� �����

�����

�� � �� ��

��

���e�

���� �� � �� ����

Putem scrie acum statistica raportului verosimilitatilor

�� �� �����

�� � �� ��� ����� ��� ��� ����

Folosind formula lui Konig (Observatia 3.3.23):����� ��� ����� �

�����

�� � �� �� ��� �� ��� �� �

avem ca�� �

��� �� �� ��� ��

����� �� � �� ����� �

Daca se introduce statistica� definita prin

� ��� ���

���� ��� ���

� ���� ����� �� � ������

atunci�� �

��

�� � �����

Regiunea critica� , pentru� � ��� ��, se obtine din� ��� � �� ����

� �, care este

acelasi lucru cu� �� � � � ��� ���� � �

��. Altfel spus, determinarea cuantilei

�� revine la determinarea lui

��

�, astfel ıncat� �� � � � ��

� ���� � ���.

Dar statistica� , ın ipoteza��, urmeaza legea Student cu�

�� grade de libertate

(Proprietatea 4.2.26), deci� � �������� , adica cuantila de ordin�

� �

� a legii Studentcu�

�� grade de libertate. Putem scrie ın final regiunea critica:

� � � ������ � � � �

���� � �� ������� ��� �

���� � ����������

adica chiar regiunea critica de la testul� bilateral. Prin urmare, cu aceasta metodaobtinem testul� bilateral.

Page 321: Stat_Matlab.PDF

6.5. Testul raportului verosimilitatilor 311

Teorema 6.5.2. Fie statistica��

a raportului verosimilitatilor, atunci statistica��ln��

urmeaza legea�� cu � grade de libertate, cand � � �, � fiind numarulparametrilor necunoscuti.

Demonstratie.Vom considera numai cazul� � �.Folosind formula lui Taylor cu doi termeni avem ca

ln � ����� � �

������� � ln � ����

� � �

�������

� ��� � ���� ln � ����� � �

��������� � �

� ��� � ���� �� ln � ����� � �

��������� �

unde� � ��� � ��� sau

� � �������. Dar��

este estimator de verosimilitate maximapentru

�, prin urmare �

ln � ����� � �

��������� � �

deci avem ca��

ln�� � ���� � ���� �� ln � ����

� � �

���������

Pe de alta parte, daca ipoteza�� � � �� este adevarata, se stie ca

�� a.s.�� ��, deci� a.s.�� ��, cand� ��. Putem scrie atunci ca�� ln � ����� � �

��������� ��

�� ln � ����� � �

����������

������

�� ln � ��� ������� � � ��

�����

�� ln � ��� �������

Folosind legea numerelor mari avem ca

��

�����

�� ln � ��� ������� a.s.�� ���� ln � �� �

������� ��������

de unde �� ln � ����� � �

��������� ��

�������� � ��� �����

sau ��ln���� ��� � ��

� �� ���� �

Conform Observatiei 5.3.11, statistica���������� ���� urmeaza legea normala

� ��� ��,cand� � �, de unde avem ca statistica��� � ������ ���� urmeaza legea�� cu ungrad de libertate, ceea ce trebuia aratat.

Page 322: Stat_Matlab.PDF

312 Verificarea ipotezelor statistice

6.6 Testul��

privind dispersia teoretica

Fie caracteristica� ce urmeaza legea normala� �����, unde�� � �

�� ��� estenecunoscuta si

� � �, de asemenea necunoscut.Relativ la dispersia teoretica se face ipoteza nula

�� �� � ���, cu una dinalternativele:

�� �� �� ��� � cand obtinemtestul�� bilateral,

�� �� � ��� � cand obtinemtestul�� unilateral dreapta,

�� �� � ��� � cand obtinemtestul�� unilateral stanga.

Pentru verificarea ipotezei nule��, cu una din alternativele

�� precizate, se con-sidera o selectie repetata de volum�, cu datele de selectie����� � � � �

��� si cores-punzator variabilele de selectie����� � � � �

���. Conform Proprietatii 4.2.25, avemca statistica

�� � ���

�����

�� � �� �� � �� � �� �����

urmeaza legea�� cu��

�grade de libertate.Folosind un nivel de semnificatie� � ��� �� dat, se poate determina un interval

numeric�������� astfel ıncat

� �� � �������� ����� � ���� ���� ����� ���� � �

���

unde

�� ��� � ��� � �

�� � �

��� ���� ���� � �

��

este functia de repartitie pentru legea�� cu�

grade de libertate (tabelata pentruanumite valori ınAnexa III).

Intervalul numeric�������� pentru statistica�� nu este determinat ın mod unic

din conditia de mai sus.In functie de alternativa�� aleasa se considera suplimentar:

��� � ������� � ��� � �������� � daca�� �� �� ��� �

��� � �� ��� � ��������� �daca

�� �� � ��� ���� � ������� � ��� � ���

daca�� �� � ��� �

unde ����� este cuantila de ordin� a legii �� cu�

grade de libertate, adica�� ������ � �.

Page 323: Stat_Matlab.PDF

6.6. Testul�� privind dispersia teoretica 313

Cu ajutorul intervalului numeric��������, astfel determinat, se considera respec-

tiv regiunile critice:

� � � ������ � � � �

���� � �� ��������

����� ��� � ���� �� �������� ����������

��

� � � ������ � � � �

���� � �� ��������

����� ��� � ���� � �����������

� � � ������ � � � �

���� � �� ��������

����� ��� � ���� � ���������

Usor se verifica faptul ca� ������ � � � �

���� � � ���� � ��iar cele trei moduri

de definire a regiunii critice� ne conduc respectiv la testul�� bilateral, unilateraldreapta si unilateral stanga.

Odata construita regiunea critica� , folosind datele de selectie, ipoteza nula��

va fi admisa daca������ � � � �

���� �� � , iar ın caz contrar va fi respinsa. Remarcamde asemenea ca regiunea critica� corespunde multimii complementare intervalului��������.Etapele aplicarii testului ��

1. Se dau:�� ����� � � � �

���� � � ���2. Se determina intervalul

�������� astfel ıncat���� ��������� ���� � ����

(dupa cum s-a precizat ınainte);

3. Se calculeaza�� � ����

����� ��� � �� �� �

unde �� � ��

�����

�� �

4. Concluzia: daca�� � �������� ipoteza�� este admisa, ın caz contrar este

respinsa.

Exemplul 6.6.1. Se considera caracteristica� ce urmeaza legea normala� �����

cu parametrii� � � si � �

�necunoscuti. Relativ la caracteristica� se considera o

selectie repetata de volum� � ��. Fie datele de selectie��� �� ��� ��� ��� ��� ��� ��� ���� ������� � ��� ���� ����

Vrem sa verificam ipoteza nula�� � � ��

�, cu fiecare din urmatoarele alternative

�� � �� ��

�,�� � � ��

�,�� � � ��

�, cand se considera� � �

��. Vom calculaapoi valorile functiei putere pentru� � ���� ���� ���� ��

�� ��

�, pentru fiecare din

alternativele considerate.

Page 324: Stat_Matlab.PDF

314 Verificarea ipotezelor statistice

Cand�� � �� ��

�avem testul�� bilateral. Se calculeaza cuantilele

������� � ���������� � ���� si ��������� � ���������� � ������

Pe de alta parte avem

�� � ��

�����

�� � ��� ����

�� � ���

�� � � ���

��� � ������

��� � ����

����� ������ ��� �

�� �����

���������� � � � �

�����

��������������

���

Deoarece�� � �� � �� ���

���� �� ��

����

��� ���� �� ������������ �

ipoteza�� este respinsa.

Cand�� � � ��

�, avem testul�� unilateral dreapta si se calculeaza cuantila

��������� � ��������� � �����. Astfel, avand ın vedere ca�� � ���� � �����, ipotezanula este admisa.

Cand�� � � ��

�, avem testul�� unilateral stanga.In acest caz se calculeaza

cuantila������� � ��������� � ���� si deoarece�� � ���� � ����, ipoteza nula esterespinsa.

Cand se considera testul�� bilateral, puterea se obtine din

�� � ��� � � � �

�������� � �� � �� ���

���� ��������� ����

���� �

������

������� � �� � �� �����

� �����

��������� ������� �

deci � ��� � ������ ������ ���������� � ���� ������ �������� �

In cazul de fata, obtinem

� ����� � �����

���

��

���� ������ � ������

��

���� ����� � ������

� ����� � �����

���

��

���� ������ � ������

��

���� ����� � ��

����

� ����� � �����

���

��

���� ������ � ������

��

���� ����� � ��

����

Page 325: Stat_Matlab.PDF

6.6. Testul�� privind dispersia teoretica 315

� ���

�� � �����

���

��

��

�� ������ � ������

��

��

�� ����� � ��

����

� ���

�� � �����

���

��

��

�� ������ � ������

��

��

�� ����� � ��

����

Pentru testul unilateral dreapta, ın mod analog, se ajungela

� ��� � ������ ������ ���������� �

de unde

� ����� � �����

���

��

���� ������ � ��

����

� ����� � �����

���

��

���� ������ � ��

����

� ����� � �����

���

��

���� ������ � ��

����

� ���

�� � �����

���

��

��

�� ������ � ��

����

� ���

�� � �����

���

��

��

�� ������ � ��

����

Cand se considera testul�� unilateral stanga, se obtine

� ��� � ���� ������ �������� �

deci

� ����� � ������

��

���� ����� � ��

���� � ���

�� � ������

��

��

�� ����� � ��

����

� ����� � ������

��

���� ����� � ������ � ���

�� � ������

��

��

�� ����� � ��

����

� ����� � ������

��

���� ����� � ��

����

Programul 6.6.2. Programul urmator, efectueaza calculele cerute ın exemplul pre-cedent.In plus, reprezinta grafic functia putere, cea din Figura 6.3, ın cazul testuluibilateral, marcand prin cerculete punctele curbei putere, care au fost determinate ınexemplu.

Page 326: Stat_Matlab.PDF

316 Verificarea ipotezelor statistice

clfx=[24.03,25.92,26.92,23.04,25.44,26.31,...

26.13,25.97,24.44,24.82,24.17,25.53,...23.78,26.06,24.29];

x2=14*var(x)/1.8ˆ2;c1=chi2inv(0.025,14); c2=chi2inv(0.975,14);fprintf(’ x2=%6.3f\n’,x2)fprintf(’ sigma ne 1.8\n’)fprintf(’ c1=%6.3f, c2=%6.3f\n’,c1,c2)c1=chi2inv(0,14); c2=chi2inv(0.95,14);fprintf(’ sigma gt 1.8\n’)fprintf(’ c1=%6.3f, c2=%6.3f\n’,c1,c2)c1=chi2inv(0.05,14); c2=chi2inv(1,14);fprintf(’ sigma lt 1.8\n’)fprintf(’ c1=%6.3f, c2=%6.3f\n’,c1,c2)s=1.2:0.01:2.4; s1=1.5:0.1:1.9;c1=1.8ˆ2*chi2inv(0.025,14); c2=1.8ˆ2*chi2inv(0.975,1 4);pib=1-chi2cdf(c2./s.ˆ2,14)+chi2cdf(c1./s.ˆ2,14);pib1(1,:)=1-chi2cdf(c2./s1.ˆ2,14)+chi2cdf(c1./s1.ˆ2 ,14);plot(s,pib,’k-’,s1,pib1(1,:),’o’), grid onc1=1.8ˆ2*chi2inv(0,14); c2=1.8ˆ2*chi2inv(0.95,14);pib=1-chi2cdf(c2./s.ˆ2,14)+chi2cdf(c1./s.ˆ2,14);pib1(2,:)=1-chi2cdf(c2./s1.ˆ2,14)+chi2cdf(c1./s1.ˆ2 ,14);c1=1.8ˆ2*chi2inv(0.05,14); c2=1.8ˆ2*chi2inv(1,14);pib=1-chi2cdf(c2./s.ˆ2,14)+chi2cdf(c1./s.ˆ2,14);pib1(3,:)=1-chi2cdf(c2./s1.ˆ2,14)+chi2cdf(c1./s1.ˆ2 ,14);len=length(s1);for i=1:len

for j=1:3fprintf(’ pi(%3.1f)=%5.3f ’,s1(i),pib1(j,i))

endfprintf(’\n’)end

In urma executarii programului s–au obtinut rezultatele:

x2= 5.446sigma ne 1.8

c1= 5.629, c2=26.119sigma gt 1.8

c1= 0.000, c2=23.685sigma lt 1.8

c1= 6.571, c2= Infpi(1.5)=0.117 pi(1.5)=0.002 pi(1.5)=0.200pi(1.6)=0.073 pi(1.6)=0.008 pi(1.6)=0.128pi(1.7)=0.052 pi(1.7)=0.022 pi(1.7)=0.080pi(1.8)=0.050 pi(1.8)=0.050 pi(1.8)=0.050pi(1.9)=0.068 pi(1.9)=0.095 pi(1.9)=0.031

Page 327: Stat_Matlab.PDF

6.6. Testul�� privind dispersia teoretica 317

1 1.5 20

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

0.45

Figura 6.3: Curba functiei putere - cazul bilateral

Observatia 6.6.3.Cand caracteristica� nu urmeaza legea normala, pentru a veri-fica ipoteza nula de forma dinainte, cu una din alternativele precizate, unde dispersiateoretica este�� � �

�� ���, se tine seama de faptul ca statistica

�� � ��� � �������

unde ��� � ���

�����

�� � �� �� �

urmeaza legea normala� ��� ��, cand� ��.

De exemplu, daca ipoteza alternativa este�� �� �� ���, se va ajunge la regiunea

critica

� � � ������ � � � �

���� � �� ������� ���� � ��� ������

� ������

unde���� este cuantila de ordin�� �

� de la legea normala� ��� ��.

Observatia 6.6.4.Daca se considera statistica

�� � ����� �

��� � ����

�����

�� � �� �� �

atunci ıntre statisticile�� si �� exista relatia�� � �� � ����.

Deoarece se cunoaste legea de probabilitate pentru statistica��(legea�� cu���

grade de libertate), se poate determina si legea de probabilitate a statisticii��. Sunt

manuale care contin tabelata legea de probabilitate a lui��. Descrierea testului��,

folosind statistica��, urmeaza aceeasi cale ca cea cand se foloseste statistica��.

Page 328: Stat_Matlab.PDF

318 Verificarea ipotezelor statistice

Observatia 6.6.5.Cand se cunoaste parametrul� � � (ceea ce se ıntampla mai rar)

se poate considera statistica

�� � ���

����� ��� ���� �

�����

��� ��� ��

Deoarece����� urmeaza legea normala� ��� ��, avem ca statistica�� urmeaza le-

gea�� cu � grade de libertate. Cele prezentate mai ınainte pot fi rescrise cu aceastastatistica.

6.7 Testul� (Fisher–Snedecor)pentru compararea dispersiilor

Se considera doua populatii independente� �

si� ��

cercetate din punct de vedere alaceleasi caracteristici. Aceasta caracteristica este� �

pentru� �

si urmeaza legea nor-mala

� ��� ���� si respectiv� ��pentru

� ��si urmeaza legea normala

� ���� �����.Relativ la dispersiile teoretice ale celor doua caracteristici se face ipoteza nula com-pusa

�� �� � ���, cu una din alternativele:

�� �� �� ���, cand obtinemtestul� bilateral,

�� ��� ���

, cand obtinemtestul� unilateral dreapta,

�� �� � ���, cand obtinemtestul� unilateral stanga.

Pentru verificarea ipotezei nule��, cu una din alternativele

�� considerate, se e-fectueaza cate o selectie repetata de volume respectiv�

�si �

��din cele doua populatii

� �si� ��

. Notam datele de selectie prin������

��� � �

���� si respectiv�

��� ����

��� � �

����� �

cu variabilele de selectie� ���� �

��� � �

�� �� si � ��� �� ��

��� � �

�� ��� � Conform Pro-

prietatii 4.2.30, statistica

� ��� �� �� �� ��

��� �

unde

�� � � ��� � �

�����

� �� � �� ��� � �� � � ���

������

�� �

�� �� � ���� � �

�����

� ��� � �� ���� � �� �� � ����

������

��� �

Page 329: Stat_Matlab.PDF

6.7. Testul� (Fisher–Snedecor) pentru compararea dispersiilor 319

urmeaza legea Fisher–Snedecor cu� � �

� �� si � � �

�� ��grade de libertate.

Pentru un nivel de semnificatie� � ��� �� fixat, se poate determina un intervalnumeric�������, astfel ca�

� � ������� ����� � ���� ��������� ���� � �

���

unde

���� �� � ���

� �� � � ��

�� �

��� �

�� � �

�������� �

������� ��� � �

��

este functia de repartitie pentru legea Fisher–Snedecorcu�

si � grade de libertate(tabelata pentru anumite valori ınAnexa IV). Intervalul de ıncredere������� pentrustatistica� nu este unic determinat.In functie de alternativa

�� aleasa, se considerasuplimentar:

�� � ������ � �� � �������� � daca�� �� �� ��� �

�� � �� �� � ���������daca

�� ��� ��� �

�� � ������� �� � ���daca

�� �� � ����

Cu ajutorul intervalului numeric������� astfel determinat, se considera respectiv re-giunile critice

� �� ���� � � �

��� ���� � � �

��� � � �� � ������������

�� ������� �����������

� �� ���� � � �

��� ���� � � �

��� � � �� � ������������ � ����������

� �� ���� � � �

��� ���� � � �

��� � � �� � ������������

� �������

S-au folosit notatiile

���� � ��� � �

����� ��� � ���� � �� � �

��

�����

�� �

���� � ���� �

����� ��� � ���� � �� � �

���

�����

���

Se verifica imediat ca� � ���� �

��� � �

�� �� �� ��� �� ��

��� � �

�� ���� � � ���� � ��

iarcele trei alternative ne conduc la cele trei regiuni critice, care definesc respectiv testul� bilateral, unilateral dreapta si unilateral stanga.

Odata construita regiunea critica� , folosind datele de selectie, ipoteza nula va fiadmisa daca

������

��� � �

���� ��

��� ����

��� � �

������ ��� �

iar ın caz contrar va fi respinsa.Remarcam de asemenea ca regiunea critica� corespunde multimii complementareintervalului �������.

Page 330: Stat_Matlab.PDF

320 Verificarea ipotezelor statistice

Etapele aplicarii testului�

1. Se dau:�� ������

��� � �

���� � �

��� ����

��� � �

����� �

2. Se determina intervalul������� astfel ıncat���� ���� � ���� ���� � ��

�(dupa cum s-a prezentat ınainte);

3. Se calculeaza� � �� ��� �� � unde

�� � � ��� � �

�����

��� � �� ��� � �� � � ���

�����

��� �

�� �� � ���� �

�����

���� � �� ���� � �� �� � ����

�����

���� �

4. Concluzia: daca� � ������� ipoteza�� este admisa, ın caz contrar este res-

pinsa.

Observatia 6.7.1.Daca se noteaza prin� � �� , atunci ipoteza nula se poate rescrie

�� �� � �, iar ipotezele alternative se scriu corespunzator�� �� �� �, �� �� � �,

respectiv�� ����, iar statistica� , se scrie sub forma� � �

� �� �� Exemplul 6.7.2. Se cerceteaza precizia cu care doua masini produc conserve deacelasi tip. Pentru aceasta, se considera cate un esantion din conservele produse decele doua masini si se masoara greutatea acestora. Fie� �

greutatea ın grame a uneiconserve produsa de prima masina, respectiv� ��

pentru a doua masina. Masuratorileobtinute sunt:

� � ���� ��� ��� ���� ���� ��� ���� ��� ��� ���� ����

���� ��� ���� ���� ����� �� ���� ��� ��� ���� ���� ���� ���� ��� ���� ���� ���

Considerand nivelul de semnificatie� � ��

��, vrem sa verificam ipoteza nula com-pusa

�� �� � ���, respectiv cu fiecare din alternativele

�� �� �����,�� ��

����,

�� �� ����. Vom considera ca cele doua caracteristici� �

si � ��sunt independente

si ca urmeaza legile normale� ��� ���� si respectiv

� ���� �����.Se considera statistica

� ��� ���� �� ��

��� �

Page 331: Stat_Matlab.PDF

6.7. Testul� (Fisher–Snedecor) pentru compararea dispersiilor 321

ce urmeaza legea Fisher–Snedecor cu� � �

� �� si � � �

�� �� grade de libertate,

care ne conduce la testul� . Pentru aceasta avem

�� � � ���

�����

��� � ��� ������ ��� � � ����� � �������

�� �� � ����

�����

���� � ��� ����� � ��� � � ���� � �������

�� � � ��� � �

�����

��� � �� ��� � ���

������� �������� � � ����� � ���������

� �������

�� �� � ���� � �

�����

���� � �� ���� � ���

������ � �������� � � ���� � ���������

� �������

Valoarea calculata a statisticii� este

� � �� ��� �� �

������������ � �����

De asemenea, avem calculate, conformAnexei IV, cuantilele

������ � ���������

� ������������� �

���

��� �

����

�������� � ������������ � ����� �������� � ����������� � ��

��������� � �

�������� � ������������ �

����� � �

����

Cand se considera alternativa�� �� �� ���

, avem testul� bilateral. Deoarece

� � ���� � ����������� � ������� ��������� �

ipoteza�� este admisa.

Pentru alternativa�� ��

� ���, avem testul� unilateral dreapta. Astfel ca

� � ���� � ��

�� � ���������prin urmare ipoteza

�� este admisa.De asemenea, pentru alternativa

�� �� � ���, se obtine testul� unilateral

stanga. Deoarece avem� � ���� � ���� � ������ �

ipoteza�� este admisa.

Page 332: Stat_Matlab.PDF

322 Verificarea ipotezelor statistice

Programul 6.7.3. Programul Matlab, care urmeaza, efectueaza calculele din exem-plul precedent, dupa care afiseaza valoareaf a statisticii� , precum si intervalelenumerice(f1,f2) , pentru fiecare din cele trei alterantive.

x1=[1021,980,988,1017,1005,998,1014,985,995,...1004,1030,1015,995,1023,1008,1013];

x2=[1003,988,993,1013,1006,1002,1014,997,...1002,1010,975];

f=var(x1)/var(x2);fprintf(’ Bilateral\n’)f1=finv(0.025,15,10); f2=finv(0.975,15,10);fprintf(’ f=%7.3f, (f1,f2)=(%5.3f,%5.3f)\n’,f,f1,f2)fprintf(’ Unilateral dreapta\n’)f1=finv(0,15,10); f2=finv(0.95,15,10);fprintf(’ f=%7.3f, (f1,f2)=(%5.3f,%5.3f)\n’,f,f1,f2)fprintf(’ Unilateral stanga\n’)f1=finv(0.05,15,10); f2=finv(1,15,10);fprintf(’ f=%7.3f, (f1,f2)=(%5.3f,%5.3f)\n’,f,f1,f2)

In urma executarii programului se obtin rezultatele:

Bilateralf= 1.567, (f1,f2)=(0.327,3.522)

Unilateral dreaptaf= 1.567, (f1,f2)=(0.000,2.845)

Unilateral stangaf= 1.567, (f1,f2)=(0.393, Inf)

6.8 Teste pentru compararea mediilor

Se considera doua populatii independente� �

si� ��

, cercetate din punct de vedereal aceleasi caracteristici. Aceasta caracteristica este � �

pentru� �

si urmeaza legeanormala

� ��� ���� si respectiv� ��pentru

� ��si urmeaza legea normala

� ���� �����.Relativ la mediile teoretice ale celor doua caracteristici independente, se face

ipoteza nula�� �� ����

, cu una din alternativele:

�� �� �����, cand obtinem untest bilateral,

�� ������

, cand obtinem untest unilateral dreapta,

�� �� ����, cand obtinem untest unilateral stanga.

Ca si ın cazul testului� se considera cate o selectie repetata de volum��

sirespectiv�

��. Pastram ın continuare notatiile de la testul� .

Distingem trei cazuri.

Page 333: Stat_Matlab.PDF

6.8. Teste pentru compararea mediilor 323

6.8.1 Dispersii cunoscute

Dispersiile��si ���

sunt cunoscute.In acest caz se considera statistica

(6.8.1) � � �� � � �� ��� � ��� �����

��� � ���

care urmeaza legea normala� ��� ��.

Se aplica prin urmare testul� pentru compararea celor doua medii teoretice.Pentru nivelul de semnificatie� � ��� �� dat, se obtin regiunile critice corespun-

zatoare celor trei alternative:

� ������ � � �

��� ���� � � �

��� � � �� � ����� �� � �� ���� � �� � ����

��

� ������ � � �

��� ���� � � �

��� � � �� � ������ � ����� � �� � ���� ��

� ������ � � �

��� ���� � � �

��� � � �� � ������ � ����� � ��

� ���

Etapele aplicarii testului �

1. Se dau:�� ������

��� � �

����; �

��� ����

��� � �

����� � ��

, ���;

2. Se determina intervalul�������astfel ıncat� ������ ���� � �

���

unde� ���

este functia lui Laplace tabelata ınAnexa I. Intervalul numeric������� este res-

pectiv pentru cele trei alternative considerate:������ �����

, ���������,

��� ����;

3. Se calculeaza� ��� � � �� ��

��� � ���unde�� � � �

��

�����

��� � �� �� � ����

�����

���� �

4. Concluzia: daca� � ������� ipoteza�� este admisa, ın caz contrar este res-

pinsa.

Exemplul 6.8.1. La o unitate de ımbuteliere a laptelui exista doua masini care efec-tueaza aceasta operatie ın sticle de� litru. Pentru a cerceta reglajul de ımbutelierela cele doua masini s–au efectuat doua selectii relative la sticlele ımbuteliate de celedoua masini si s–au obtinut datele de selectie:

Page 334: Stat_Matlab.PDF

324 Verificarea ipotezelor statistice

� � �ın ml� ��� �� ���� ��� ����

� � � � �� � ,

� � �ın ml

� �� ��� �� ���� ��� ����� � � � � � �

Folosind nivelul de semnificatie� � ��

��, vrem sa verificam daca mediile deumplere a sticlelor de catre cele doua masini sunt aceleasi, ın cazul ın care abaterilestandard sunt�� � �ml si ��� � ���ml.

Caracteristicile� �si � ��

, ce reprezinta cantitatea de lapte (ın ml) continuta deo sticla ımbuteliata de prima masina, respectiv de a doua masina, se considera caurmand legile de probabilitate normale

� ��� ��� si� ���� � ����.

Verificarea ipotezei nule�� �� � ���

, cu alternativa�� �� �� ���

, se vaface cu testul�, deoarece sunt cunoscute abaterile standard.

Folosind nivelul de semnificatie� � ��

��, se determina dinAnexa Ivaloarea

���� � ������ � astfel ıncat� �����

� �

��

�� �

�����

Anume, se obtine ca������ � ����, care ne da intervalul������ � ����� pentru sta-

tistica�, data prin formula (6.8.1).Se calculeaza succesiv:

�� � � ���

�����

��� � ��� �� ��� � � ��� � � � ����� � ��������

�� �� � ����

�����

��� � ��� �� ��� � � ��� � � � ����� � ��������

� ��� � � �� ��

�� � � � �����

����� ����������

��� �������

� ��

���������� � ��

���Deoarece� � ��

��� � ������ � �����, rezulta ca mediile de umplere a sticlelor nudifera semnificativ pentru cele doua masini.

Programul 6.8.2. Programul Matlab, care urmeaza, efectueaza calculele din exem-plul precedent.

x1=[990*ones(1,7),995*ones(1,9),1000*ones(1,11),...1005*ones(1,8),1010*ones(1,5)];

x2=[985*ones(1,5),990*ones(1,5),995*ones(1,6),...1000*ones(1,7),1005*ones(1,6),1010*ones(1,4)];

ma1=mean(x1); ma2=mean(x2);z=(ma1-ma2)/sqrt(6ˆ2/40+7.5ˆ2/33);z2=norminv(0.995); z1=-z2;fprintf(’ z=%7.3f\n z1=%6.3f\n z2=%6.3f’,z,z1,z2)

Page 335: Stat_Matlab.PDF

6.8. Teste pentru compararea mediilor 325

Rezultatele obtinute ın urma executarii programului sunt:

z= 1.209z1=-2.576z2= 2.576

6.8.2 Dispersii egale necunoscute

Dispersiile��si ���

sunt necunoscute si�� � ��� � ��. Se considera statistica

(6.8.2) � � �� � � �� ��� � ��� ��������� � �� �� � � ���� � �� �� ����

� ���� � �

�� �

��

care urmeaza, conform Proprietatii 4.2.28, legea Student cu� � �� �

��� � �

gradede libertate.

In acest caz se va aplica testul� . Pentru nivelul de semnificatie� � ��� �� dat, seobtin regiunile critice corespunzatoare celor trei alternative:

� ������ � � �

��� ���� � � �

��� � � �� � ��� � �� � �� � � ������

��

� ������ � � �

��� ���� � � �

��� � � �� � ��� ��� � ��� � ������ ��

� ������ � � �

��� ���� � � �

��� � � �� � ��� ��� � ��� � ����

��

unde

�� � ���

�����

�� � �� � ����

�����

�� � � � ����� � �� ���� � ���� � �� ����

���

� ���

���� � ��� � �

����� ��� � ���� � ���� � �

��� � �

����� ��� � ���� �

Etapele aplicarii testului�

1. Se dau:�� ������

��� � �

����; �

��� ����

��� � �

����� �

2. Se determina intervalul���� ��� astfel ıncat�� ���� � �� ���� � ����

unde�� ��� este functia de repartitie pentru legea Student cu� � �

� ���� � �

grade de libertate, iar intervalul numeric���� ��� este respectiv, pentru cele trei

alternative considerate,�������� � ������

, ���� �������, ���������;

Page 336: Stat_Matlab.PDF

326 Verificarea ipotezelor statistice

3. Se calculeaza� � �� � � �� ��

���� � �� �� � � ���� � �� �� ����� �

��� � �

�� �

��

�unde

�� � � ��� �

�����

��� � �� ��� � �� � � ���

�����

��� �

�� �� � ���� � �

�����

���� � �� ���� � �� �� � ����

�����

���� �

4. Concluzia: daca� � ���� ��� ipoteza

�� este admisa, ın caz contrar este res-pinsa.

Exemplul 6.8.3. Se cerceteaza doua loturi de ulei pentru automobile, din punct devedere al vascozitatii, obtinandu–se datele de selectie

� � ���� ���� ���� ���� ���� � � � �

pentru primul lot, respectiv

� � ���� ���� ���� ���� ����� � � � �

pentru al doilea lot.Analizele facandu–se cu acelasi aparat, se considera c˘a abaterile standard sunt

aceleasi. Considerand nivelul de semnificatie� � ��

��, sa se verifice daca mediilede vascozitate pentru cele doua loturi nu difera semnificativ.

Caracteristicile� �si � ��

, ce reprezinta vascozitatile pentru cele doua loturide ulei, se considera ca urmeaza fiecare legea normala, respectiv

� ��� ��� si� ���� ���, cu abaterea standard� �

�necunoscuta.

Verificarea ipotezei nule�� �� � ���

, cu alternativa�� �� �� ���

, se vaface cu testul� , deoarece abaterea standard� este necunoscuta.

Folosind nivelul de seminficatie� � ��

��, se determina, dinAnexa II, valoarea������ , astfel ıncat�� �������

� �

� �

� , unde numarul gradelor de libertate este

� � �� �

��� � � � � � � � � � ��. Adica, se determina

��������� astfel ıncat��� ����������� � �

���, obtinandu–se��������� �

�����. In acest mod, s–a obtinut

intervalul ������� � ������ pentru statistica data prin formula (6.8.2), care urmeaz˘alegea Student cu� � �

� ���� � �

grade de libertate.Se calculeaza pe rand

�� � � ���

�����

��� � �� �� ���

�� � � ���

�� � � � ������ � ���

����

Page 337: Stat_Matlab.PDF

6.8. Teste pentru compararea mediilor 327

�� �� � ����

�����

���� � �� �� ���

�� � � ���

�� � � � ������ � ���

������ � � �

�� � �

�����

��� � �� ��� � ���� ���� ��� �� � �

��� �

�����

���� � �� ���� � ��

�� ���� �� � �� � � �� ��

���� � �� �� � � ���� � �� �� �� ��� �

��� � �

�� �

��

� ���

����

���

��������

���� ���

���� ���� � ����� �

��� �����

���

��� ��� �

������

Deoarece� � ��

��� � ������� � ������, rezulta ca vascozitatile medii ale celordoua loturi de ulei nu difera semnificativ.

Programul 6.8.4. Programul Matlab urmator efectueaza calculele de mai sus, dupacare afiseaza valoareat a statisticii� , ımpreuna cu capetele intervalului(t1,t2) .

x1=[10.27*ones(1,3),10.28*ones(1,2),10.29,10.3,10.3 2];x2=[10.26,10.26,10.27,10.29,10.3,10.31*ones(1,3)];ma1=mean(x1); ma2=mean(x2);v1=var(x1); v2=var(x2);t=(ma1-ma2)/sqrt(7*v1+7*v2)*sqrt(14/(1/8+1/8));t2=tinv(0.975,14); t1=-t2;fprintf(’ t=%7.3f\n t1=%6.3f\n t2=%6.3f’,t,t1,t2)

In urma executarii programului, se obtin rezultatele:

t= -0.372t1=-2.145t2= 2.145

6.8.3 Functiattest2

Sistemul Matlab, prinStatistics toolbox, dispune de functiattest2 , cu aplicabi-litate la testul� pentru compararea a doua medii, cand dispersiile sunt egale, darnecunoscute. Apelarea acestei functii se face prin:

h=ttest2(x,y)h=ttest2(x,y,alpha)h=ttest2(x,y,alpha,tail)[h,c,ci]=ttest(x,y,alpha,tail)

Page 338: Stat_Matlab.PDF

328 Verificarea ipotezelor statistice

In urma executarii acestor instructiuni, se efectueazatestul� asupra datelor continuteın vectoriix si y , folosind nivelul de semnificatiealpha , care are valoarea implicitaalpha=0.05 .

Parametrultail specifica una din cele trei alternative, care conduc la tes-tul bilateral (tail=0 , implicit), unilateral dreapta (tail=1 ) si unilateral stanga(tail=-1 ). Dacah=1 , atunci ipoteza nula va fi respinsa, respectiv dacah=0 , ipo-teza nu poate fi respinsa.

Ultima forma de apel permite, de asemenea, obtinerea valorii critice c , precum sia intervalului de ıncredere pentru diferenta mediilor teoretice, corespunzator probabi-litatii de ıncredere1-alpha , obtinut ın vectorul cu doua componenteci . Valoareacritica c are aceeasi semnificatie cu cea precizata la Observatia6.4.2 si se calculeazacu formulele prezentate acolo.

Programul 6.8.5. Programul Matlab, ce urmeaza, aplica testul� , pentru dateledin Exemplul 6.8.3. Mai mult, se considera si testele unilateral dreapta si unilateralstanga, precum si obtinerea intervalelor de ıncredere, candalpha=0.05 .

x=[10.27*ones(1,3),10.28*ones(1,2),10.29,10.3,10.32 ];y=[10.26*ones(1,2),10.27,10.29,10.3,10.31*ones(1,3) ];fprintf(’ h c ci \n’)fprintf(’___________________________\n’)for i=-1:1

[h,c,ci]=ttest2(x,y,0.05,i);fprintf(’ %d %5.4f (%4.2f,%4.2f) \n’,h,c,ci)

end

In urma executarii programului, se obtin rezultatele:

h c ci___________________________

0 0.3577 (-Inf,0.01)0 0.7154 (-0.03,0.02)0 0.6423 (-0.02, Inf)

Se observa ca pentrutail=-1 si tail=1 , se construiesc intervale nemarginite,respectiv la stanga si la dreapta.

6.8.4 Dispersii diferite necunoscute

Dispersiile��si ���

sunt necunoscute si diferite.Se va considera statistica

(6.8.3) � � �� � � �� ��� � ��� �����

��� � � �� ��

Page 339: Stat_Matlab.PDF

6.8. Teste pentru compararea mediilor 329

care urmeaza legea Student cu� grade de libertate. Numarul� al gradelor de libertatese calculeaza cu formula

(6.8.4)��� ���� � �

� ��� ������ � �

�unde � �

�� ��� � ��� �

����� ����� ��

S–a ajuns la testul� , care pentru nivelul de semnificatie� � ��� �� dat, conducela regiunile critice corespunzatoare alternativelor considerate, respectiv:

� ������ � � �

��� ���� � � �

��� � � �� � ����� �� � �� ������ � ���� �

��������

� ������ � � �

��� ���� � � �

��� � � �� � ������ � ������� � ���� �

������ ��

� ������ � � �

��� ���� � � �

��� � � �� � ������ � ����� �� � �� ��

� �����

Etapele aplicarii testului�

1. Se dau:�� ������

��� � �

����; �

��� ����

��� � �

����� �

2. Se determina intervalul���� ��� astfel ıncat�� ���� � �� ���� � ����

unde�� ��� este functia de repartitie pentru legea Student cu� grade de liber-tate calculat cu formula (6.8.4), iar intervalul numeric���� ��� este respec-

tiv, pentru cele trei alternative considerate,�������� � ������

, ���� �������,

����� ����;3. Se calculeaza

� � �� � � �� ��

��� � � �� ��unde

�� � � ��� � �

�����

��� � �� ��� � �� � � ���

�����

��� �

�� �� � ���� � �

�����

���� � �� ���� � �� �� � ����

�����

���� �

4. Concluzia: daca� � ���� ��� ipoteza

�� este admisa, ın caz contrar este res-pinsa.

Page 340: Stat_Matlab.PDF

330 Verificarea ipotezelor statistice

Exemplul 6.8.6. Se cerceteaza capacitatea fiolelor farmaceutice de���ml, care pro-vin de la doua fabrici.In acest scop, se considera cate o selectie pentru doua loturide fiole provenite respectiv de la cele doua fabrici. Select¸iile obtinute au distributiileempirice de selectie

� �

�� ��� ��� ��� ��� ��� ��� ��� ��� ��� ���

� � � � � � � � � �

�� �

respectiv, pentru� ��: ���, ���, ���, ���, ���, ���, ���, ���, ���, ���, ���, ���,

���, ���, ���, ���, ���, ���, ���, ���.Folosind nivelul de semnificatie� � �

��, vom compara dispersiile celor doua

caracteristici. Apoi, pe baza acestui rezultat, vom compara mediile celor doua carac-teristici, utilizand acelasi nivel de semnificatie� � �

��.

Vom considera ca cele doua caractersitici� �si � ��

sunt repartizate normal, res-pectiv

� ������� si

� ���������. Se poate aplica testul� , pentru compararea disper-

siilor teoretice�� si ���

.Calculam pe rand:

�� � � ���

�����

���� ��� �� ��� � � � ������������ �� ��� �

���

�����

���������

��

�� � � ��� � �

�����

��� � �� ��� � ����� �� �� � ���� � �

�����

������� ���� � �������

Deoarece�� � � �� �� , se considera statistica� � �� � �

�� � �care urmeaza legea

Fisher–Snedecor cu����� � ���� �

���� ��� � ��� � ��� grade de libertate.

Daca se considera ipoteza nula�� �� � ��� �

cu alternativa�� �� �� ��� �

avem ca� � �� �� � ���������� � �����

Pe de alta parte, pentru� � ��

��, avem dinAnexa IVca

�������� � ����������� � ����� ������ � ����������� � �

������������ �

��

�� � �����

In acest fel, am obtinut intervalul����� � �����, pentru statistica� .Deoarece� � ���� �� ����� � �����, respingem ipoteza ca�� � ���

.Avand ın vedere ca dispersiile teoretice��

si ��� sunt necunoscute, iar conform

rezultatului precedent difera ın mod semnificativ, folosim testul� pentru comparareamediilor

��si���

. Statistica� , ce se considera, ın acest caz, este cea data prin for-mula (6.8.3), care urmeaza legea Student cu� grade de libertate, unde� se calculeazadin relatia (6.8.4).

Page 341: Stat_Matlab.PDF

6.8. Teste pentru compararea mediilor 331

Astfel, pentru determinarea lui�, avem succesiv

� �������

������� ������

��� �

���� si���

�������� � ��� �

�������� � �

��������de unde� � ��. FolosindAnexa II, se obtine ca

�������� � �

����, prin urmare inter-valul pentru statistica� este������� � ������.

Pe de alta parte, avem ca

� � �� � � �� ��

��� � � �� �

� �������

����

���

���� � ������� �����

��

��� ������

Deoarece� � �

���� �� ������� � ������, respingem ipoteza ca mediile teoreticepentru fiolele produse de cele doua fabrici nu difera semnificativ.

Programul 6.8.7. Calculele din exemplul de mai sus, se pot efectua cu urmatorulprogram Matlab:

x1=[100,101,102*ones(1,2),103*ones(1,3),...104*ones(1,4),105*ones(1,5),106*ones(1,4),...107,108*ones(1,3),109];

x2=[110,101,112,120,117,105,109,111,118,113,...106,108,115,113,112,100,116,112,114,112];

f=var(x2)/var(x1);c1=finv(0.01,19,24); c2=finv(0.99,19,24);fprintf(’ f=%6.2f, c1=%5.2f, c2=%5.2f\n’,f,c1,c2)ma1=mean(x1); ma2=mean(x2);v1=var(x1); v2=var(x2); c=(v1/25)/(v1/25+v2/20);n=cˆ2/24+(1-c)ˆ2/19; n=ceil(1/n);t=(ma1-ma2)/sqrt(v1/25+v2/20);t2=tinv(0.99,n); t1=-t2;fprintf(’ t=%7.3f, t1=%6.3f, t2=%6.3f’,t,t1,t2)

Rezultatele obtinute, ın urma executarii programului,sunt:f= 5.31, c1= 0.34, c2= 2.76t= -5.116, t1=-2.485, t2= 2.485

Observatia 6.8.8.Daca se noteaza prin� ��� ����

, atunci ipoteza compusa nuladevine

�� ���, iar ipotezele alternative se rescriu dupa cum urmeaza:

�� � �� �,

�� � ��si respectiv

�� � � ��iar statisticile care au fost date mai ınainte se pot

rescrie cu acest nou parametru necunoscut�.

Observatia 6.8.9. Cand selectiile sunt de volum mare,�� ����� ��, pentru legi de

probabilitate oarecari, respectiv�� �����

��, pentru legi de probabilitate normale,

statistica

� � �� � � �� ��� � ��� �����

��� � � �� ��

Page 342: Stat_Matlab.PDF

332 Verificarea ipotezelor statistice

poate fi considerata ca urmand legea normala� ��� ��. Asadar ın acest caz se poate

aplica testul�.

6.8.5 Observatii perechi

Daca cele doua selectii sunt de tip pereche, adica variabilele de selectie sunt perechile�� �� �� ��� �, � � ���, atunci se pot considera diferentele�� �� �� �� ��� , pentru care� ���� �� ��� ����

, oricare a fi� � ���.

Problema poate fi reformulata.Se considera o populatie

�, pentru care se cerceteaza caracteristica�, care ur-

meaza legea normala� �����, cu� �

�necunoscut.

Vrem sa verificam ipoteza nula�� � � �

, cu una din alternativele�� � �� �

, cand obtinemtestul� bilateral,�� � �

�, cand obtinemtestul� unilateral dreapta,

�� � � �, cand obtinemtestul� unilateral stanga.

Conform Proprietatii 4.2.26, statistica

� ��� ������� �

unde

�� � ��

������

� ������

� �� �� ��� � � ��� � ���

�����

�� � �� �� �

urmeaza legea Student cu��

�grade de libertate.Prin urmare, pentru nivelul de semnificatie� � ��� �� dat, se poate determina

intervalul numeric���� ��� astfel ıncat

� � � ���� ��� ����� � ���� ���� ����� ���� � �

���

unde

�� ��� �� � �

��

���� ��� � �

�����

�������� ��� � � � �

este functia de repartitie pentru legea Student cu�

grade de libertate (tabelata ınAnexa II, pentru anumite valori).

Intervalul numeric���� ��� pentru statistica� nu este determinat ın mod unic dinconditia de mai sus.In functie de alternativa

�� aleasa, se considera suplimentar:

Page 343: Stat_Matlab.PDF

6.8. Teste pentru compararea mediilor 333

�� � ���� �� � �������� , daca

�� � �� �,

�� � ��� �� � ��������, daca

�� � ��,

�� � ������ � �� � ��, daca

�� � � �,

unde������ este cuantila de ordin� a legii Student cu�

��grade de libertate.

Etapele aplicarii testului�

1. Se dau:�� ������

��� � �

����� ���� ����

��� � �

������

2. Se calculeaza intervalul���� ��� astfel ıncat���� ���� � ���� ���� � ����

(dupa cum s-a prezentat ınainte);

3. Se calculeaza

� �������� � �� � �

�����

�� � ��

�����

��� ������ � ���� � ���

�����

�� � ���� �4. Concluzia: daca

� � ���� ��� ipoteza�� este admisa, ın caz contrar ipoteza este

respinsa.

Programul 6.8.10. Vom scrie un program, care genereazan vectori aleatori, careurmeaza legea normala bidimensionala. Folosind testul� pentru perechi, vom veri-fica ipoteza nula, ca mediile celor doua variabile sunt egale, precum si intervalul deıncredere pentru diferenta mediilor, respectiv cand seaplica testele bilateral, unilate-ral dreapta si unilateral stanga. Nivelul de semnificatie folosit estealpha=0.05 .

mu(1)=input(’m1=’); mu(2)=input(’m2=’);v(1,1)=input(’sigma1ˆ2=’);v(2,2)=input(’sigma2ˆ2=’);v(1,2)=input(’Cov(X,Y)=’); v(2,1) =v(1,2);if det(v) <= 0

error(’Matricea v nu e pozitiv definita!’)endn=input(’n=’); Z=mvnrnd(mu,v,n);d=diff(Z,1,2);fprintf(’ h c ci \n’)fprintf(’___________________________\n’)for i=-1:1

[h,c,ci]=ttest(d,0,0.05,i);fprintf(’ %d %5.4f (%4.2f,%4.2f) \n’,h,c,ci)

end

Rezultatele obtinute, pentrumu1=mu2=10, v ��2 22 3� si n=30 , sunt

Page 344: Stat_Matlab.PDF

334 Verificarea ipotezelor statistice

h c ci___________________________

0 0.6715 (-Inf,0.35)0 0.6570 (-0.26,0.41)0 0.3285 (-0.20, Inf)

Deoareceh=0 , pentru fiecare alternativa ın parte, testul� nu respinge ipoteza ca celedoua medii sunt egale. Acest lucru se vede si din faptul cavaloarea critica satisfaceinegalitateac�alpha=0.05 .

Programul mai calculeaza intervalul de ıncredere pentrudiferenta celor doua me-dii. Se observa ca acesta difera, ın functie de parametrul tail=-1,0,1 . De aseme-nea, se observa ca am considerat nivelul de semnificatiealpha=0.05 , dar acestapoate fi usor modificat ın apelul functieittest .

6.9 Testul��

pentru concordanta

Se considera colectivitatea�

cercetata din punct de vedere al caracteristicii� can-titativa sau calitativa. Fie

�numarul claselor caracteristicii� si �� evenimentul ca

un individ luat la ıntamplare din colectivitatea�

sa apartina clasei cu numarul deordine

�.

Notand�� � � ����, � � ���, atunci������� � �.

Relativ la caracteristica� facem ipoteza nula�� �� � � ���� ,

� � ���, cu ipoteza

alternativa��: exista

�� astfel ıncat����� � ����� .

Pentru a verifica aceasta ipoteza se considera o selectie repetata de volum�. Fiedatele de selectie����� � � � �

���. Folosind aceste date de selectie se obtin frecventeleabsolute ale claselor caracteristicii�. Vom nota prin�� frecventa absoluta a claseicu numarul de ordine

�. Altfel spus,�� numara de cate ori a aparut evenimentul�� ın

selectia considerata.Corespunzator frecventelor absolute��,

� � ���, avem variabilele aleatoare (deselectie)

��,� � ���, ce iau aceste valori.

Asadar, pornind de la caracteristica�, care poate fi si calitativa, s-a ajuns lavariabilele de selectie

��,� � ���, care sunt componentele unui vector aleator

�-

dimensional� � ������ � � � �

����, ce urmeaza legea multinomiala. Anume, avem:

� ��� � ����� � ���� � �

��� � ��� � ��

�����

�� � ��� �

���� ��� � � �

���� �

unde� � �� � �� � � ��, �� � ���,

� � ���, �� ��� � ��� � �.Daca privim ipoteza nula

��, constatam ca aceasta se refera laparametrii uneilegi multinomiale.

Page 345: Stat_Matlab.PDF

6.9. Testul�� pentru concordanta 335

Proprietatea 6.9.1. Cu notatiile dinainte avem ca statistica

�� ������

���������

���

urmeaza legea�� cu� �

�grade de libertate, cand� ��.

Demonstratie.Se porneste de la formula lui Stirling����������e��. Astfel,

avem ca

� ��� � ����� � ���� � �

��� � ��� ��������e��

�����

������ �

��� e�����

��� ��� � � �

���� �

sau

� ��� � ����� � ���� � �

��� � ��� ����

���

����

�� ��� � ��

unde�

este o constanta pozitiva. Logaritmand aceasta relatie obtinem

ln � ��� � ����� � ���� � �

��� � ��� �� ln� �

�����

��� � �

�� ln���

��

si notand�� � ��

����

����

�adica

��

���� ��

��

����

�rezulta ca

ln � ��� � ����� � ���� � �

��� � ��� �� ln� �

�����

��� � �

�� ln

���

��

�����

Pastrand primii doi termeni din dezvoltarea ın serie a logaritmului avem

ln

���

��

����� �� ��

����

� �������

deci

ln � ���� ������ ���� � �

���� ����� ln� �

�����

��� � �

�� � ��

����

� ��������

� ln� �

�����

���� � ��

���� � �

�� � ��

����

� ��������

�� ln� �

�����

������ �

�����

Page 346: Stat_Matlab.PDF

336 Verificarea ipotezelor statistice

Dar avem ca �����

������ �

�����

�������� � �

�� � ��

deci

ln � ��� � ����� � ���� � �

��� � ��� �� ln� � �

�����

���

sau� ��� � ����� � ��

�� � �

��� � ��� ���e� � ������� �Daca se noteaza�� � ���������� , obtinem

� ��� � ����� � ���� � �

��� � ��� ���e� ������ �� �adica vectorul aleator

������ � � � �

���� ���� �����

��� ��� �������� �

� � �

��� �������� ��

pentru� ��, urmeaza o lege normala�

dimensionala degenerata, deoarece fiecarecomponenta�� se poate exprima ca si combinatie liniara a celorlalte componente.

Din teoria probabilitatilor se cunoaste ca suma patratelor componentelor unuivector aleator ce urmeaza legea normala si ıntre care exista o legatura liniara esteo variabila aleatoare ce urmeaza legea�� cu numarul gradelor de libertate dat denumarul componentelor vectorului mai putin unu. Ceea ce trebuie demonstrat.

Pe baza proprietatii precedente, pentru nivelul de semnificatie� � ��� �� dat, sepoate determina cuantila��������� astfel ıncat

���� ���������� � � �� � ��������� ����� � ����

unde���� noteaza functia de repartitie a legii�� cu� �

�grade de libertate.Regiunea critica� se poate scrie si ın acest caz, anume

� � ������� � � � �

���� � �� ����

�����

������ ����

�� ����

� ��������� � �����

�� � �

��

Astfel, pentru� mare, are loc relatia� ������ � � � �

���� � � ���� � �, deciipoteza

�� va fi admisa daca������ � � � �

���� �� � , respectiv va fi respinsa ın caz

contrar.

Page 347: Stat_Matlab.PDF

6.9. Testul�� pentru concordanta 337

Etapele aplicarii testului ��

1. Se dau:�� ����� � � � �

���� �� � � ����� � � ���. (sirul datelor de selectie

����� � � � �

��� este un sir avand ca elemente evenimentele��,� � ���, din

care se obtin frecventele absolute����� � � � �

���);

2. Se calculeaza��������� astfel ıncat���� ���������� � ����

3. Se calculeaza�� ������

������ ���� ��� ���� �

4. Concluzia: daca�� � ��������� ipoteza�� este admisa, ın caz contrar ipoteza

este respinsa.

Observatia 6.9.2.La utilizarea testului�� privind concordanta trebuie ca sa fie ın-deplinite conditiile��� � �, cand

�� �, iar daca numarul claselor

� � �, atunci���

sa fie mult mai mare decat�. Cand aceste conditii nu sunt ındeplinite, se efectueazao regrupare a datelor de selectie.

Exemplul 6.9.3. S-a aruncat un zar de�� de ori si s-au obtinut urmatoarele rezultate:

Fata� � �

Frecventa� � � �� � ��

Folosind nivelul de semnificatie� � ��

��, sa verificam daca zarul respectiv este falssau nu.

Se aplica testul��, privind parametrii legii multinomiale.Intr-adevar, evenimen-tul �� reprezinta aparitia fetei cu numarul

�,� � ���. Se face ipoteza nula

�� �� � ��� � � ���� adica zarul nu este fals

cu alternativa

�� � �� astfel ıncat����� �

��

adica zarul este fals�

Se calculeaza valoarea statisticii��, care are� �

� � � grade de libertate, anume

��������

������ ����

�� ����

������

����

�� ��

���� ����

�� ��

� ������

����

�� ��

������

Pe de alta parte, dinAnexa III, avem cuantila��������� � �������� � ����, decirezulta�� � ���� � ���� � ��������, ceea ce conduce la respingerea ipotezei nule,adica acceptam ipoteza ca zarul este fals.

Page 348: Stat_Matlab.PDF

338 Verificarea ipotezelor statistice

Programul 6.9.4. Programul Matlab, care urmeaza, efectueaza calculele din exem-plul precedent:

x=1:6; f=[15,7,4,11,6,17]; p=1/6*ones(1,6);x2=sum((f-60*p).ˆ2./(60*p));cuant=chi2inv(0.95,5);fprintf(’ xˆ2= %6.1f\n cuant= %5.2f’,x2,cuant)

iar rezultatele obtinute sunt:

xˆ2= 13.6cuant= 11.07

Aplicatia 6.9.5. (Testul�� neparametric privind concordanta). Fie caracteristica�,care urmeaza legea de probabilitate cu functia de repartitie � necunoscuta. Relativla legea de probabilitate, se face ipoteza nula

�� � � ��, cu ipoteza alternativa�� � �� ��. Cand consideram testul�� neparametric, functia de repartitie�� nudepinde de nici un parametru necunoscut.

Daca domeniul valorilor caracteristicii� este, sa zicem, intervalul��� �� si dacavom considera clasele obtinute prin punctele� � �� �

�� � � �� � �, atunci

apar parametrii necunoscuti�� � � ����� �� ���� � � ���� �� ������ � � � ����

De asemenea, evenimentul�� va fi evenimentul ca un individ luat la ıntamplare dincolectivitatea cercetata sa apartina clasei���������. Prin urmare, s-a ajuns la aplicareatestului�� privind concordanta. Ipoteza nula, mai sus precizata, devine ın acest fel�� �� � � ���� ,

� � ���, iar ipoteza alternativa se va rescrie��: exista

�� astfel ıncat����� � ����� , unde� ���� � � ����� �� �

�� ���� � �� ���� ��� ������ �

Etapele aplicarii testului �� neparametric

1. Se dau:�� ����� � � � �

���� �� ����� � �

��� � ��;

2. Se calculeaza frecventele absolute��,� � ���, si probabilitatile� ���� � �� ���� ��� ������ � � � ����

3. Se calculeaza��������� astfel ıncat���� ���������� � ��

�� ���� fiind

functia de repartitie a legii�� cu� �

�grade de libertate;

4. Se calculeaza�� ������

������ ����

�� �����

Page 349: Stat_Matlab.PDF

6.9. Testul�� pentru concordanta 339

5. Concluzia: daca�� � ��������� se admite ipoteza ca legea de probabilitate acaracteristicii� este data de functia de repartitie��, ın caz contrar ipoteza esterespinsa.

Exemplul 6.9.6. Fie caracteristica� ce reprezinta numarul fetelor dintr–o familie cupatru copii. Pentru verificarea ipotezei ca� urmeaza o lege binomiala de parametru� � �

� , s-a efectuat o selectie de volum� � ��. Distributia selectiei lui� este

���

� � � � �� �� � � �

��

Folosind nivelul de semnificatie� � ��

��, sa verificam daca� urmeaza legea bino-miala. Daca� urmeaza legea binomiala cu� � �

�, atunci are distributia teoretica

���

� � � � ���� �

���

��

���

��

Ipoteza privind faptul ca� urmeaza legea binomiala, se scrie sub forma

�� �� � �� � ���

� �� � �� � �� � �� � ��

Se va aplica testul�� neparametric, unde numarul gradelor de libertate este datde

� �� � �

�� � �. Valoarea calculata a caracteristicii�� este

�����

���

������ ����

�� ����

����� ���

����

����

����� ����

�� ��

� ����� ���

����

��������

Cum�� � ��� � ���� � �������� � ��������� �

avem ca ipoteza nula este admisa.

Programul 6.9.7. Prin executarea programului Matlab:

x=0:4; f=[4,10,8,7,3];p=[1/16,1/4,3/8,1/4,1/16];x2=sum((f-32*p).ˆ2./(32*p));cuant=chi2inv(0.95,4);fprintf(’ xˆ2= %6.1f\n cuant= %5.2f’,x2,cuant)

se obtine

xˆ2= 4.5cuant= 9.49

Page 350: Stat_Matlab.PDF

340 Verificarea ipotezelor statistice

Aplicatia 6.9.8. (Testul�� neparametric privind exponentialitatea). Relativ la ca-racteristica� se face ipoteza nula

�� � � ��, unde�� ��� � ��

���� , � ��

siparametrul� �

�cunoscut, adica� urmeaza legea exponentiala.

Deoarece domeniul valorilor caracteristicii� este intervalul������, se consi-dera clasele caracteristicii� date prin

� � �� ��� � � �� � ��. Astfel

avem:� ���� � �� ���� ��� ������ � �� ������ � �� ���� � � � ��� � � si� ���� � �� ������ �Etapele aplicarii testului

1. Se dau:�� ����� � � � �

���� ����� � � � �

������ �;

2. Se calculeaza frecventele absolute��,� � ���, si probabilitatile� ���� � �

��� ���� � � ���� � �� ������ � �� ���� � � � ��� � �� � ���� � �� ������ �

3. Se calculeaza��������� astfel ıncat���� ���������� � ����

4. Se calculeaza�� ������

������ ����

�� �����

5. Concluzia: daca�� � ��������� se accepta ipoteza ca� urmeaza legea expo-nentiala de parametru

�, ın caz contrar ipoteza este respinsa.

Aplicatia 6.9.9. (Testul�� parametric privind concordanta). Se considera caracte-ristica� care urmeaza legea de probabilitate cu functia de repartitie � necunoscuta.Relativ la legea de probabilitate se face ipoteza nula

�� � � �� cu ipoteza alter-nativa

�� � �� ��. Fata de cazul neparametric, functia de repartitie�� se consi-dera ca depinde de

�parametri necunoscuti. Fie acesti parametri

����� � � � �

���, adica

�� � �� �������� � � � �

����.

In acest caz, fata de cazul neparametric, la ınceput se estimeaza parametrii ne-cunoscuti, folosind datele de selectie considerate, cu ajutorul metodei verosimilitatiimaxime. Fie estimatiile de verosimilitate maxima ale parametrilor mai sus precizati,respectiv

������� � � � �

����.

In continuare, cele expuse la cazul neparametric raman neschimbate cu doua ob-servatii.In primul rand, probabilitatile claselor considerate se calculeaza prin formula� ���� � � ������� �

�� ����� �� ��� �������� � � � �

����

��� �

������������ � � � �

����

pentru� � ���. In al doilea rand, legea��, ın acest caz, are

� � � � � grade delibertate.

Page 351: Stat_Matlab.PDF

6.9. Testul�� pentru concordanta 341

Etapele aplicarii testului �� parametric

1. Se dau:�� ����� � � � �

���� �� ����� � �

��� � �� � �� �������� � � � �

���� �

2. Se determina estimatiile de verosimilitate maxima������� � � � �

���� pentru para-

metrii����� � � � �

���;

3. Se calculeaza frecventele absolute��,� � ���, si probabilitatile� ���� � �� �

�� �������� � � � �

����

��� �

������������ � � � �

����

� � � ����

4. Se calculeaza����������� astfel ıncat������ ������������ � ���;

5. Se calculeaza�� ������

������ ����

�� �����

6. Concluzia: daca�� � ����������� se accepta ipoteza ca� urmeaza legea de

probabilitate data prin functia de repartitie�� � �� ���������� � � � �

����

�ın caz

contrar ipoteza este respinsa.

Exemplul 6.9.10.O substanta radioactiva este observata ın���� intervale de timp de

lungimi egale (��� secunde). Pentru fiecare interval de timp este ınregistratnumarulparticulelor emise. Rezultatele obtinute sunt:

Nr. part.� � � � � � � � ��

�� � � � ��� � �� � � ��

Notand cu� caracteristica ce reprezinta numarul de particule emiseıntr-un intervalde timp de lungime��� secunde, vrem sa verificam daca� urmeaza legea lui Poisson,folosind nivelul de semnificatie� � �

��.Folosim testul�� parametric privind concordanta, deoarece parametrul legii lui

Poisson,� � � ���, este necunoscut. Asadar, numarul gradelor de libertateva fi� � � � � � ��

���

� � �. Avem ca estimatorul de verosimilitate maxima pentru

�este media de selectie. Prin urmare avem

�� � ��

�����

���� � ����� �� �� � � ��� � � �� ��� � ��

���

Se calculeaza apoi probabilitatile de la legea lui Poisson, cu parametrul�� � ��

��,adica� ���� � ���

�� ���� � � � �� ���� � � � � Astfel se obtin valorile:

Page 352: Stat_Matlab.PDF

342 Verificarea ipotezelor statistice

� � � � � � � � ������� ���� ����� ��� � ��� ���� ��� � ����� ��� � ���� ����� �����

de unde

�� �������

������ ����

�� ����

� ���

��

Pe de alta parte, folosindAnexa III, avem cuantila�������� � ���� si prin urmare�� � ���

� � ���� � ��������, deci ipoteza ca� urmeaza legea lui Poisson esteacceptata.

Programul 6.9.11. Ilustrarea calculelor este facuta prin programul Matlab

x=0:10;f=[57,203,383,525,532,408,273,139,45,27,16];la=sum(f.*x)/2608; p=poisspdf(x,la);x2=sum((f-2608*p).ˆ2./(2608*p));cuant=chi2inv(0.99,9);fprintf(’ xˆ2= %6.1f\n cuant= %5.2f’,x2,cuant)

care prin executare conduce la urmatoarele rezultate:

xˆ2= 14.9cuant= 21.67

Aplicatia 6.9.12. (Testul�� parametric privind normalitatea). Relativ la caracteris-tica� se considera ipoteza nula

�� � � ��, unde

�� ��� � �� ������� � ����� � �

�� �� ������ ��� � � � �� � � si � �

�sunt parametri necunoscuti, adica faptul ca� urmeaza legea normala

cu cei doi parametri necunoscuti.Folosind metoda verosimilitatii maxime se determina, pe baza datelor de selectie

����� � � � �

���, estimatiile de verosimilitate maxima pentru�

si respectiv�, anume

�� � ��

�����

�� � �� si�� �

������

�����

���� ���� � ����

(a se vedea Exemplul 5.3.7). Deoarece domeniul valorilor caracteristicii� este� seconsidera clasele date prin

�� � �� � �� � � �� � ��

Pe de alta parte probabilitatile corespunzatoare acestor clase se obtin cu formulele� ���� � �� �� � �������� ��� ����� �������� � � � ����

Page 353: Stat_Matlab.PDF

6.9. Testul�� pentru concordanta 343

Avand ın vedere ca

�� ������� � ���� �� ��

� � �

unde�

este functia lui Laplace, adica

� ��� � ���� � �

� e�� ���rezulta ca � ���� � � �

��� ������ � �� �

���� � ������ � � � � ����

Etapele aplicarii testului

1. Se dau:�� ����� � � � �

���� ����� � � � �

�����;

2. Se calculeaza frecventele absolute��,� � ���, estimatiile

�� � ��

�����

�� � ��� � ��

�����

���� ����

si probabilitatile� ���� ����� �

�� � ������ � � � ���� � �

��� �

���� � ������ � �

� ���� ���

��� ������ � �� �

���� � ������ � � � � ��� � ��

3. Se calculeaza��������� astfel ıncat���� ���������� � ���;

4. Se calculeaza�� ������

������ ����

�� �����

5. Concluzia: daca�� � ��������� se accepta ipoteza ca� urmeaza legea nor-mala

� ���������, ın caz contrar ipoteza este respinsa.

Exemplul 6.9.13. Se considera caracteristica�, ce reprezinta rezistenta, ın��, a

unor tronsoane de ceramica acoperite cu carbon. Sa se verifice normalitatea lui�,folosind o selectie de volum� � ���, pentru care s–au obtinut datele de selectie

clasa���� ��� � ���� � ����� ������ ��� � ���� � ����� ������ ��� �

frecv.�� �� �� �� ��

Page 354: Stat_Matlab.PDF

344 Verificarea ipotezelor statistice

���� � ����� ������ ��� � ���� � ���� ��������� � �� �

utilizand testul de concordanta��, cu nivelul de semnificatie� � ��

��.Prima data se estimeaza parametrii de la legea normala

� �����, adica mediateoretica

� � � ��� si abaterea standard teoretica� � �� �� ���, folosind metodade verosimilitate maxima. Se cunoaste ca estimatiile de verosimilitate maxima pentru�

si � sunt respectiv

�� � ���

�����

�� � ��� �� �������

�����

���� �� �� � ���� �

(a se vedea Exemplul 5.3.7). Avem distributia empirica deselectie pentru caracteris-tica�

��� ����� ����� ����� ����� ��

��� ��

��� ��

��� ��

��� �����

�� �� �� �� �� �� �� �� �

��

de unde calculam

�� ��� � ��

�����

�� � ���� ��� ����� � �� ����� � � � ������ � ��

���

�� ����� �������

�����

���� �� �� � �

�����

Se considera valoarea numerica

�� ������

��� �����������

unde�

este numarul claselor (� � �

, ın cazul de fata),�� este frecventa clasei�, iar

��� este dat prin��� � � �

��� ���� � �� �

���� � ���� � �

subintervalul ��������� definind clasa�. Dupa cum este cunoscut,�� este valoarea

unei variabile aleatoare care urmeaza legea�� cu� ��� �grade de libertate,

�fiind

numarul parametrilor estimati.In cazul de fata avem ca� � �

, deci avem����� � �

grade de libertate.

Page 355: Stat_Matlab.PDF

6.9. Testul�� pentru concordanta 345

Se determina intervalul������������, pentru statistica��, folosind Anexa III.

Anume, se obtine ca��������� � �������� � �����, adica intervalul numeric pentrustatistica�� este�� � ������.

Calculele pentru valoarea numerica�� se aranjeaza ın urmatorul tabel:

�� �� ������� � �������� � ��� ���� ����������������� �� ����� ������� ����� ������� ���������� �� ����� ���� ������ ������� ���� ��� �� ��� ����� ����� ������� ��� ������ �� ����� ������ ����� ������ �� � ��� �� �� ����� ������ ������ ���������� �� ���� ���� ������ ����� �������� � ��� ����� ������ ���� ��������� �� ��� ����� ����� ��� �� �� ���� � �� �� ��� ��� �� ����� �����

� �� � �

Valorile functiei lui Laplace�

se iau dinAnexa Isi se are ın vedere ca functia�

esteimpara, adica

� ���� � �� ���. De asemenea, facem observatia ca

��� � � ��� � ���� � �� �

�� � ���� � � � ������ �� ����

� ������� � �

�� � ��

�����

Deoarece�� � ��� � �� � ������, rezulta ca se accepta ipoteza normalitatii caracte-risticii �.

Programul 6.9.14. Toate calculele din tabelul precedent pot fi efectuate prin progra-mul Matlab:

x=1.625:0.05:2.025; f=[11,14,17,17,18,16,13,10,8];ma=sum(f.*x)/124; s=sqrt(sum(f.*(x-ma).ˆ2)/124);a=[-inf,1.65:0.05:2,inf];F=normcdf(a,ma,s); p=diff(F);x2=sum((f-124*p).ˆ2./(124*p));cuant=chi2inv(0.95,6);fprintf(’ xˆ2= %6.1f\n cuant= %5.2f’,x2,cuant)

Rezultatele obtinute ın urma executarii programului sunt:

xˆ2= 3.3cuant= 12.59

Page 356: Stat_Matlab.PDF

346 Verificarea ipotezelor statistice

6.10 Testul��

pentru comparareamai multor caracteristici

Se considera colectivitatile��,

� � ���, independente, cercetate din punct de vedere alaceleasi caracteristici (calitative sau cantitative). Fie aceasta caracteristica�� pentrucolectivitatea

��. Relativ la caracteristicile��,

� � ���, se face ipoteza nula��,

ca acestea urmeaza aceeasi lege de probabilitate. Se noteaza cu�

numarul claselorcaracteristicii cercetate si�� evenimentul ca un individ luat la ıntamplare din una dincolectivitatile cercetate sa apartina clasei cu num˘arul de ordine�.

Daca se noteaza prin��� � � ��� � ���, adica probabilitatea ca un individ luatla ıntamplare din colectivitatea

�� sa apartina clasei cu numarul de ordine�, atunci

ipoteza nula se poate rescrie�� ��� � �� � � � ��� � � � ���.

Probabilitatile astfel definite satisfac relatiile�

����

��� � �� � � ��� �

iar cand ipoteza�� este satisfacuta, avem de asemenea������� � ��

Pentru a verifica aceasta ipoteza se considera cate o selectie repetata de volum��,� � ���. Datele de selectie sunt trecute ın tabelul urmator.

Selectia Vol. selectiei �� �� �� Total�� �� ��� ��� � � � ��� ��� � ���� �� ��� ��� � � � ��� ��� � ��...

......

......

...�� �� ��� ��� � � � ��� ��

� � ��

Total � ��� ��� � � � ��� ��� � �

Elementul��� al tabelului reprezinta frecventa absoluta a aparitiei clasei�

ın selectia�� , iar

��� � �

����

��� � � � ��� � ��� � �����

��� � � � ���� ��� � �����

��� � �

����

��� �

Proprietatea 6.10.1.Estimatiile de verosimilitate maxima pentru parametrii necu-noscuti�� , � � ���, sunt date prin

��� � ����

� � � ����

Page 357: Stat_Matlab.PDF

6.10. Testul�� pentru compararea mai multor caracteristici 347

Demonstratie.Functia de verosimilitate are expresia

� ���

���

�����

������ ���

���

�����

����� ���

���

� �����

����� � � �����

����� �

cand ipoteza nula�� este adevarata. Avand ın vedere relatia dintre probabilitatile �� ,

� � ���, se obtine ca

� ���� ����

��������� ����

��������

sau prin logaritmare, se ajunge la

ln � � ���ln���

�������

��� � �������

��� ln�� �

Sistemul ecuatiilor de verosimilitate maxima va fi�ln ���� � � ���

����������� � ����� � �� � � ��� � ��

de unde rezulta ca����� � ����

� � � ����sau, avand ın vedere proprietati ale sirului de rapoarte egale, se obtine

����� � �

�� � � ����

S-a ajuns astfel la estimatiile

��� � ����

� � � ����

Observatia 6.10.2.Daca se are ın vedere ca��� sunt valorile unor variabile aleatoarebinomiale

��� , rezulta ca statistica

�� ���

���

� �

����

���� ������� ��������

���

���

����

��� � ���������

��������

cu�

����

��� � ��� � � ��� ���

������ � ��� � � � ����

����

��� � �����

��� � ��� � ��

Page 358: Stat_Matlab.PDF

348 Verificarea ipotezelor statistice

urmeaza o lege��. Pentru a stabili numarul�

al gradelor de libertate se tine seamade faptul ca numarul variabilelor aleatoare

��� este��, numarul legaturilor ıntre���

este�, iar numarul parametrilor estimati este�� �. Prin urmare, numarul gradelor de

libertate este� � �

� ��� �� � �� � �� � �� �� � �� �

Etapele aplicarii testului

1. Se dau:�; ��� , � � ���, � � ���;

2. Se calculeaza��� � �

����

��� , � � ���, ��� � �����

��� , � � ���;

3. Se calculeaza�������, astfel ıncat�� �������� � ����

4. Se calculeaza�� ���

���

����

��� � �������

���������

5. Concluzia: daca�� � ������� se accepta ipoteza nula��, ın caz contrar se

respinge.

Observatia 6.10.3.Cand probabiliatile�� , � � ���, sunt cunoscute (caz mai rarıntalnit), deci nu se cere a fi estimate, atunci statistica

�� ���

���

����

���� ������ �������

urmeaza legea�� cu� � �

� �� � � �� � �� grade de libertate. Aplicarea testului,

ın acest caz, se adapteaza ın mod corespunzator.

Exemplul 6.10.4. S-au considerat trei loturi de bolnavi de emfizem pulmonar, ˆınfunctie de numarul tigarilor fumate zilnic: mai putinde un pachet, unul sau douapachete si respectiv mai mult de doua pachete. Pentru emfizemul pulmonar sunt con-siderate� stadii notate de la I la IV. Rezultatele cercetarilor sunt trecute ın urmatorultabel sistematizat

Categoria�

Stadiul I II III IV

� �pachet

�� � � �����

pachete� ��� �� �� ��

� pachete

� � � � ����� ��� �� ���

Page 359: Stat_Matlab.PDF

6.11. Testul�� pentru tabele de contingenta 349

Vrem sa sa verificam, cu nivelul de semnificatie� � ��

��, ipoteza ca numarulde tigari fumate zilnic nu influenteaza repartizarea bolnavilor ın cele patru stadiiale bolii. Verificam ipoteza facuta cu ajutorul testului�� privind compararea ace-luiasi atribut, dar pentru populatii diferite. Numarulgradelor de libertate este datprin formula ����� ����� � ����� ����� � �� pentru care se obtine cuantila���������������� � ���

�.

Se calculeaza apoi valoarea

�� ���

���

����

��� � �������

���������

���� ����

�����

������

�����

�� � ������������

����������� �

�� � ������

�����

������

���� ������

Deoarece�� � ����� � ���

� � �������, se respinge ipoteza ca repartizarea pe celepatru stadii ale bolii nu depinde de numarul tigarilor fumate zilnic.

Programul 6.10.5. Programul Matlab

f=[41,28,25,6;24,116,46,14;4,50,34,12];fip=sum(f’); fpj=sum(f); x2=0;for i=1:3

for j=1:4t=fip(i)*fpj(j)/400;x2=x2+(f(i,j)-t)ˆ2/t;

endendcuant=chi2inv(0.99,6);fprintf(’ xˆ2= %6.1f\n cuant= %5.2f’,x2,cuant)

ın urma executarii, conduce la rezultatele din exemplul precedent:

xˆ2= 64.4cuant= 16.81

6.11 Testul��

pentru tabele de contingenta

Se considera colectivitatea�

cercetata din punct de vedere a doua caracteristici� si�(calitative sau cantitative). Se pune problema independentei celor doua caracteris-

tici. Fie � numarul claselor pentru caracteristica� si respectiv�

pentru caracteristica�. Notam cu�� evenimentul ca un individ luat la ıntamplare din colectivitatea

�sa

apartina clasei cu numarul de ordine�

ın raport cu� si notam cu�� evenimentul caun individ luat la ıntamplare din

�sa apartina clasei cu numarul de ordine� ın raport

Page 360: Stat_Matlab.PDF

350 Verificarea ipotezelor statistice

cu�

. Fie��� � � ��� ��� �, � � ���, � � ���. Daca se noteaza��� � �

����

��� � � � ��� si � �� � �����

��� � � � ����

atunci ipoteza nula relativa la independenta celor dou˘a caracteristici se scrie

�� ��� � ���� �� � � � ��� � � � ����cu ipoteza alternativa

��, ca�� este falsa.

Pentru verificarea acestei ipoteze se considera datele de selectie��� ����, � � ���.Datele de selectie sunt sistematizate ın tabelul de contingenta

� � � �� �� � � � ��

�� ��� ��� � � � ��� ����� ��� ��� � � � ��� ���...

......

......

�� ��� ��� � � � ��� ���

��� ��� � � � ��� ��� � �

unde��� reprezinta frecventa absoluta a clasei���� �, iar

��� � �

����

��� � � � ��� � ��� � �����

��� � � � ����

Proprietatea 6.11.1.Estimatiile de verosimilitate maxima pentru parametrii necu-noscuti���, � � ���, si� �� , � � ���, sunt date prin formulele:

���� � ����

� � � ��� � �� �� � ����

� � � ����

Demonstratie.Functia de verosimilitate are expresia

� ���

���

�����

���� ���� � �����

�����

����� ������ � � �����

������ �� �����

������ ����� ����

���������� �������������� �� ��

��������� ��

cand ipoteza nula�� este adevarata. Prin logaritmare se obtine

ln � � ���ln

��� ����

������� � ����

������ln��� � ln

� �����

������ ��

Page 361: Stat_Matlab.PDF

6.11. Testul�� pentru tabele de contingenta 351

de unde se ajunge la sistemul ecuatiilor de verosimilitatemaxima�ln ���� � � ��

���������� ��� � ������ � �� � � ��� � ��

sau������ � ������ � � � ��� �

Avand ın vedere proprietatile unui sir de rapoarte egale se obtine ca

������ � �

�� � � ��� � deci

���� � ����

� � � ��� �

In mod analog se obtine si faptul ca

�� �� � ����

� � � ����

Observatia 6.11.2.Valoarea numerica

�� ���

���

����

���� �������� ������� �

�����

����

��� � �������

���������

este cea a unei variabile aleatoare ce urmeaza legea�� cu�� ����� ����� grade

de libertate. Numarul�

al gradelor de libertate s-a determinat avand ın vedere c˘a aufost estimati�� � ��� �� � �� parametri, iar ıntre��� si� �� exista o singura legatura

�����

��� � �

����

� �� � �� adica��

���

����

��� � ��

Asadar� � �

� � �� � �� � �� � �� � � � �� � �� �� � ��.Etapele aplicarii testului

1. Se dau:�; ��� , � � ���, � � ���;

2. Se calculeaza:��� � �

����

��� , � � ���, ��� � �����

��� , � � ���;

3. Se calculeaza�������, astfel ıncat�� �������� � ����

Page 362: Stat_Matlab.PDF

352 Verificarea ipotezelor statistice

4. Se calculeaza�� ���

���

����

��� � �������

���������

5. Concluzia: daca�� � ������� se accepta ipoteza nula��, ın caz contrar se

respinge.

Observatia 6.11.3. Cand probabilitatile��� si � �� sunt cunoscute (caz mai rarıntalnit), avem ca

�� ���

���

����

���� ����� ������

� �����

���� ����������� �

����

���� ��� �� ���� ��

este valoarea unei variabile aleatoare ce urmeaza legea�� cu� � ����� �����

grade de libertate. Aceasta rezulta din faptul ca prima suma corespunde unei legi��cu �

� � � grade de libertate, a doua suma corespunde unei legi�� cu ��

� grade delibertate, iar a treia unei legi�� cu

� � �grade de libertate. Prin urmare

� � �� � ��� �� � �� � �� � �� de unde

� � �� � �� �� � �� �

Aplicarea testului, ın acest caz, se face prin adaptarea corespunzatoare a cazului pre-cedent.

Observatia 6.11.4.Testul�� pentru tabele de contingenta si respectiv pentru com-pararea mai multor caracteristici, pare sa fie acelasi . Dar, remarcam faptul ca proble-mele de la care se porneste sunt complet diferite.

Exemplul 6.11.5. Pentru cercetarea dependentei dintre culoarea� a ochilor si cu-loarea� a parului, s-a considerat un esantion format din���� indivizi. Rezultatelesunt trecute ın tabelul sistematizat urmator

A�

B Blonzi Sateni Bruneti Roscati

Albastri���� ��� ��� �� ���

Gri sau verzi��� ��� ��� �

Caprui�� �� �� �� � ��� � � ��� ����

Folosind nivelul de semnificatie� � ��

��, vom verifica ipoteza ca cele doua carac-teristici (atribute) sunt independente.

Se foloseste testul�� pentru tabele de contingenta cu numarul gradelor de liber-tate

� � �� � �� �� � �� � �� � �� �� � �� � �.

Page 363: Stat_Matlab.PDF

6.12. Testul de concordanta al lui Kolmogorov 353

Pe de o parte avem ca

�� ���

���

����

��� � �������

���������

����� � ����������

��� ��

�������������

��� � ������������� ��

�������������

� ��� � �

���������� ��

���

��������

� �����

Pe de alta parte, avem cuantila�������� � ���

� � ���� � ��, deci se respinge ipotezaca cele doua atribute sunt independente.

Programul 6.11.6. Calculele din exemplul precedent pot fi efectuate cu programulMatlab

f=[1768,807,189,47;946,1387,746,53;115,438,288,16];fip=sum(f’); fpj=sum(f); x2=0;for i=1:3

for j=1:4t=fip(i)*fpj(j)/6800;x2=x2+(f(i,j)-t)ˆ2/t;

endendcuant=chi2inv(0.99,6);fprintf(’ xˆ2= %6.1f\n cuant= %5.2f’,x2,cuant)

In urma executarii acestui program, se obtin rezultatele:xˆ2= 1073.5cuant= 16.81

6.12 Testul de concordanta al lui Kolmogorov

Se considera caracteristica� de tip continuu cu functia teoretica de repartitie�necunoscuta. Relativ la functia� se face ipoteza nula

�� � � ��, cu una din

(1)�� � �� �� (testul lui Kolmogorov bilateral),

(2)�� � � �� (testul lui Kolmogorov unilateral dreapta),

(3)�� � � �� (testul lui Kolmogorov unilateral stanga).

Pentru verificarea ipotezei nule��, cu una din alternativele precizate, se consi-

dera o selectie repetata de volum�, cu datele de selectie����� � � � �

���, respectivvariabilele de selectie��, ��, . . . ,�� corespunzatoare. Se considera statisticile

�� � ����� � � ��� ��� ��� ��� �� �

Page 364: Stat_Matlab.PDF

354 Verificarea ipotezelor statistice

� � � ���

�� ���� ��� ��� ��� � �

��� � ����� ��� ��� � ��� ��� � �

unde ��� ��� este functia de repartitie de selectie.Conform teoremei lui Kolmogorov (Teorema 4.2.38) statistica

�� � ����� � ��� ��� ��� ��� ��

urmeaza o lege de probabilitate data prin legea lui Kolmogorov, cand� � �. Anu-me, avem ca

������� ���� � � ��

��� �� ��� ��� ������ ����� e���� � � �

��

functia� ��� a lui Kolmogorov fiind tabelata pentru anumite valori ınAnexa V.

De asemenea,

������� ���

� � �� � ������� �

���� � �� ��� ��� � ��

���� � � ���

ce poarta numele de lege� cu doua grade de libertate.Pentru un nivel de semnificatie� � ��� �� fixat, se pot determina cuantilele

����si����� astfel ıncat

� ���� � ����� � �

���

adica� ������ � �

���

pentru testul bilateral al lui Kolmogorov,

� ���

� � ��

���� � ��� si � �

���� � ������ � �

���

adica�� ������ � �

��, pentru testele unilaterale dreapta si stanga ale lui Kolmo-

gorov.Corespunzator celor trei alternative, ipoteza

�� va fi admisa cand valorile calcu-late ��, � � , ��� , pe baza datelor de selectie����� � � � �

��� ale statisticilor��, � � ,

��� , satisfac respectiv conditiile

(1)�� �� � ����, cand

�� � � ��,

(2)�� � � � ��

���, cand�� � � ��,

(3)�� ��� � ��

���, cand�� � � ��,

iar ın caz contrar va fi respinsa.Prezentam, ın cele ce urmeaza, ımpreuna, cele trei teste (bilateral, unilateral

dreapta, unilateral stanga) ale lui Kolmogorov. Remarcam ca cele trei teste sunt testedistincte, alegerea unuia dintre ele se face apriori.

Page 365: Stat_Matlab.PDF

6.12. Testul de concordanta al lui Kolmogorov 355

Etapele aplicarii testului lui Kolmogorov

1. Se dau:�; ����� � � � �

���; � � ��;

2. Se determina

(1)���� astfel ıncat

� ������ � ���, cand

�� � �� ��,

(2)����� astfel ıncat

�� ������ � ���, cand

�� � � ��,

(3)����� astfel ıncat

�� ������ � ���, cand

�� � � ��;

3. Se calculeaza

(1)� � �� ��, cand

�� � �� ��,

(2)� � �� � � , cand

�� � � ��,

(3)� � �� ��� , cand

�� � � ��;

4. Concluzia: daca

(1)� � ���� ipoteza

�� este admisa, cand�� � �� ��,

(2)� � ��

��� ipoteza�� este admisa, cand

�� � � ��,

(3)� � ��

��� ipoteza�� este admisa, cand

�� � � ��,

Observatia 6.12.1.Avand ın vedere ca functiile (de repartitie)�

si��

sunt mo-noton crescatoare si ca pentru determinarea cuantilelor

���� si����� este necesara

inversarea acestor functii de repartitie, se poate evitaaceasta operatie. Pentru aceastase determina valorile functiilor

�si��

pe valorile calculate ale statisticilor��,� � , ��� , adica se calculeaza respectiv�

�� � � ������, � � � � �

� ���� � �,��� ��

� ������ �. Astfel, se va respinge ipoteza nula��, daca� � �, � numindu–

sevaloare critica.

Observatia 6.12.2.Pentru calculul valorilor statisticilor��, � � , ��� putem con-

sidera ca datele de selectie sunt ordonate crescator, adica �� � �� �� � �

� ��,altfel se poate face o astfel de ordonare. De asemnea, remarcam faptul ca are loc�� � ��� ��

� ���� �.Folosind aceste precizari, precum si faptul ca atat functia de repartitie de selectie���, cat si functia de repartitie�� sunt functii nedescrescatoare, obtinem urmatoarele

Page 366: Stat_Matlab.PDF

356 Verificarea ipotezelor statistice

formule de calcul

� � � ����� � ��� ��� ��� ��� �� �������� � ��� ���� ��� �����

� �������� ���

��� ����

� ���� � ���

�� ��� ��� � ��� ��� �� �������� ��� ���� � ��� ��� � ���� �������� ��� ���� �

� ��

� ��� � ��� �� � ���� � �

Observatia 6.12.3.Cand datele sunt grupate, avand clasele date prin punctele

� � �� � �� � � �� � ��

atunci se folosesc formulele

�� � �������� ����� ���� ��� ���� ��

�� � � ��������� ��� ���� ��� ��������� � ����������� ���� � ��� ������

Exemplul 6.12.4. Rezultatele masuratorilor asupra diametrului�, pentru���� depiese de acelasi tip (ın mm), sunt cele ce urmeaza

Diam.���� ���� ��� ����� ���� ���� ��� ����� ���� �����

Frecv.� �� �� � � ���

���� ������ ����� ����� ���� ������ ����� ���� ��� ����� �� �� �� ��

Folosind nivelul de semnificatie� � ��

��, stiind� � � ��� � ����

��mm siabaterea standard� � �� �� ��� � �mm, se cere verificarea normalitatii caracte-risticii �, cu ajutorul testului lui Kolmogorov bilateral, iar apoi cuajutorul testului�� neparametric.

Ipoteza care se face este ca functia de repartitie a lui� este

�� ��� � ����� � �

�� �� ������ ��� � � � �

Page 367: Stat_Matlab.PDF

6.12. Testul de concordanta al lui Kolmogorov 357

unde� � ����

��, � � �. Pentru verificarea acestei ipoteze, folosind criteriul luiKolmogorov, se calculeaza

�� � ����� ��

��� ��� ��� ������ ��������� ��

��� ���� ��� �������

unde�� � ����� � ��� �

,� � �� ��, iar ��� ��� � ������ ��� este functia de repartitie

de selectie.Pentru calculul valorilor functiei de repartitie�� se tine seama de faptul ca

�� ��� � ����� � �

�� �� ������ �� � ���� �� ��

� � � ���� �� � ����

��� �

cu functia lui Laplace� ��� tabelata ınAnexa I.

Pe de alta parte, valorile functiei de repartitie de selectie se calculeaza cu formula

������ ���� � �����

����

�� � pentru� � �� ���

Calculele sunt aranjate ın urmatorul tabel.

�� �� �� �� � ���� ����� ���� � ����� ���� �� ���� �����

— �� ����� ����� �������� � ��� ���� ���� ���������� �� ��� ������ ����� �������� �� ���� ��� �� ��� ��������� � � ��� ���� ��� �����

���� ��� ��� �� ��� ����� ����������� �� �� ����� ���� ���� ���� �� ��� ����� ���� ���������� �� �� ��� ���� ��������� �� �� ����� ���� �������� � ����� ����� �����

Din calculele facute avem ca����� � ��

����, de unde rezulta ca�� �� � ����� ����� � ��

��� ��

���� � ������

Din Anexa V, se determina cuantila���� � ����� � ���� si admitem ipoteza de

normalitate pentru caracteristica�, deoarece�� �� � �

���� � ���� �����.

Page 368: Stat_Matlab.PDF

358 Verificarea ipotezelor statistice

Pentru a verifica normalitatea caracteristicii�, cu testul�� neparametric, cal-culam prima data probabilitatile� ���� � � ����� �� �

�� �� � ��� � � ������ �� ����� ��� � � � �� ���

unde�� � �� si ��� � ��. Astfel avem� ������� ������ ������ ��� ���� ��� ���� ������� ��� ����

����� ���� ������ ������ ������ ����� ����� ������

������� ��� ���� ��� ����

������ ������ ����

de unde

�� �������

������ ����

�� ����

� ���� ���

�����

�� ��� � ������ � � ��� � ��

�����

�� ��

���

Pe de alta parte, avem cuantila��������� � �������� � ���

�, conform Anexei III.

Deoarece�� � ��

�� � ���

� � ��������, rezulta ca ipoteza de normalitate esteacceptata.

Programul 6.12.5. Vom scrie un program Matlab, pentru aplicarea testului lui Kol-mogorov si a testului��, ın cazul datelor din exemplul precedent.

% Testul lui Kolmogorova=97.75:0.5:102.75;n=[0,21,47,87,158,181,201,142,97,41,25];F0=normcdf(a,100.25,1); Fn=cumsum(n)/1000;dn=max(abs(F0-Fn)); ks=sqrt(1000)*dn;fprintf(’ ks= %6.4f\n’,ks)% Testul chiˆ2F0(1)=0; F0(end)=1;n=n(2:end);p0=diff(F0); x2=sum((n-1000*p0).ˆ2./(1000*p0));cuant=chi2inv(0.95,9);fprintf(’ xˆ2= %6.4f\n’,x2)fprintf(’ cuant=%6.2f’,cuant)

Rezultatele obtinute ın urma executarii programului sunt:ks= 0.1964xˆ2= 3.2117cuant= 16.92

Ceea ce confirma rezultatele mai sus obtinute.

Exemplul 6.12.6. Se tin sub observatie� � �� motoare electrice pana la defectareaultimului dintre ele. Se considera caracteristica�, ce reprezinta numarul miilor deore de functionare pana la defectare. Rezultatele observatiilor sunt date ın tabelulurmator

Page 369: Stat_Matlab.PDF

6.12. Testul de concordanta al lui Kolmogorov 359

Durata��� ���� ����� ����� ���� � � ����� ������

Frecv.� �� �

Sa se cerceteze exponentialitatea caracteristicii�, folosind testul�� cu nivelulde semnificatie� � �

��, iar apoi folosind testul lui Kolmogorov cu acelasi nivel desemnificatie.

Legea exponentiala are functia de repartitie

� ����� � ��

e��� � � ��� � �

�parametru necunoscut�

Folosind metoda verosimilitatii maxime avem estimatiapentru��� � �� � �

�� ��� �� � �� �� � � � ���� � �����

Se calculeaza prima data probabilitatile:� ���� � � ���� �� �

�� ��� � ��� � �� ��� �

��� ��� ��������� � � � ����

unde�� ������ � �

�e���� � �

�e� �

���

��

Rezultatele sunt trecute ın tabelul urmator� ������ ������ ������ ��� ���� ��� ���� ������� ��� ���

����� ���� ������ ����� ������ ������ ��� � ������

si care conduce la

��������

������ ����

�� ����

� ������ ��

�������� ��

����� � ����� ��������

�� ������ ���

����

Din Anexa III obtinem cuantila��������� � �������� � ���

��. Deoarece avem valoa-rea calculata�� � �

��� � ���

�� � ��������� acceptam ipoteza exponentialitatii.Pentru aplicarea testului lui Kolmogorov, dinAnexa Vse determina cuantila���� � ����� � ����. Ipoteza exponentialitatii lui� va fi acceptata daca

�� �� � �� ���

����� ����� ���� ��� ��� �

���������� �

Aici �� � ��, iar ��� este functia de repartitie de selectie. Calculele sunt efectuateın tabelul urmator.

Page 370: Stat_Matlab.PDF

360 Verificarea ipotezelor statistice

�� � �� �� �� � � ��� ���� � �� �

������ ��� ���� �� � ���� ���� ���� �

� ��� ���� ���� ������ ����� ������ ���� ��� �� ��� ����������� ��� ������ ����� ������ ��� � ��� �� ��� ������ ������

Asadar avem ca�� �� � �

�� ��

���� � ����� � ���� � ���� �

deciexponentialitatea lui� este admisa.

Programul 6.12.7. Vom scrie un program Matlab, care efectueaza calculele dinexemplul precedent:

% Testul chiˆ2cleara=[0:30:180,300]; f=[13,10,5*ones(1,4),7];mij=[15:30:165,240]; mu=sum(mij.*f)/50;F0=expcdf(a,mu);F0(end)=1; p0=diff(F0);x2=sum((f-50*p0).ˆ2./(50*p0));cuant=chi2inv(0.95,5);fprintf(’ xˆ2= %6.4f\n’,x2)fprintf(’ cuant= %4.2f\n’,cuant)% Testul lui KolmogorovF0=F0(2:end);F0(end)=expcdf(a(end),mu);Fn=cumsum(f)/50;dn=max(abs(F0-Fn)); ks=sqrt(50)*dn;fprintf(’ ks= %6.4f’,ks)

In urma executarii programului se obtine:

xˆ2= 2.8770cuant= 11.07ks= 0.4181

6.12.1 Functiakstest

Statistics toolboxcontine functiakstest , care efectueaza testul lui Kolmogorov.Apelul functiei se poate face cu una din instructiunile:

h=kstest(x)h=kstest(x,cdf)h=kstest(x,cdf,alpha)h=kstest(x,cdf,alpha,tail)[h,c,ks]=kstest(x,cdf,alpha,tail)

Comenzile de acest tip lanseaza executia testului lui Kolmogorov bilateral (candtail=0 , valoare implicita), unilateral dreapta (candtail=1 ), respectiv unilateralstanga (candtail=-1 ), prin considerarea datelor continute de vectorulx , iar functia

Page 371: Stat_Matlab.PDF

6.12. Testul de concordanta al lui Kolmogorov 361

de repartitie ipotezata fiind precizata prin prametrulcdf . Implicit se consideracdfcorespunzand legii normale standard.

Daca parametrulcdf este prezent, trebuie sa fie o matrice cu doua coloane, carecontine ın coloana a doua valorile functiei de repartitie ipotezate pe punctele precizateın prima coloana. Ar fi de dorit ca prima coloana a matriceicdf sa coincida cuvectorulx , altfel functia va efectua un proces de interpolare pentrucalculul valorilorfunctiei ipotezate pe punctele luix , folosind punctele precizate prin matriceacdf .Din acest motiv, se impune ca toate componentele luix sa aiba valorile continute ınintervalul determinat de valoare minima si valoarea maxima a componentelor primeicoloane a luicdf .

Parametrulalpha (implicit alpha=0.05 ) reprezinta nivelul de semnificatie.Rezultatele obtinute au urmatoarele semnificatii. Dac˘a h=1 ipoteza nula se res-

pinge, ceea ce corespunde faptului ca valoarea criticac satisface relatiac�

alpha ,iar dacah=0 , ipoteza nula nu poate fi respinsa. Mai remarcam faptul c˘a ks vacontine respectiv valoarea calculata a statisticilor��, �

� si ��� , si verifica relatiile

c � �� � ��n���, pentru testul bilateral, respectivc � �

� �� ��n� � � si,c � �

��� ��n��� � pentru testele unilaterale.

Programul 6.12.8. Sa aplicam testele lui Kolmogorov (bilateral, unilateral dreaptasi unilateral stanga) pentru datelex=-2:1:4 , considerand legea ipotezata ca fiindlegea normala standard si nivelul de semnificatiealpha=0.05 . Programul ce ur-meaza, sa reprezinte grafic si functia de repartitie deselectie, ımpreuna cu functia derepartitie ipotezata.

x=-2:4;fprintf(’ h c ks\n’)fprintf(’__________________\n’)for i=-1:1

[h,c,ks]=kstest(x,[],0.05,i);fprintf(’ %d %5.4f %4.2f \n’,h,c,ks)

endcdfplot(x), hold on, title([])t=-3:0.01:3; plot(t,normcdf(t,0,1),’k--’)

In urma executarii programului, se obtin rezultatele:

h c ks__________________

0 0.0682 0.410 0.1363 0.410 0.7753 0.13

respectiv graficele din Figura 6.4 Se observa, ın mod surprinzator, ipoteza nula nupoate fi respinsa. Acest lucru se datoreaza faptului ca testul lui Kolmogorov este bazatpe un rezultat asimptotic, adica se aplica pentru valori mari ale volumului selectiei.

Page 372: Stat_Matlab.PDF

362 Verificarea ipotezelor statistice

−3 −2 −1 0 1 2 3 40

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

x

F(x)

Figura 6.4: Testul lui Kolmogorov

6.12.2 Functialillietest

Functia lillietest efectueaza testul Lilliefors, care reprezinta o modificare atestului lui Kolmogorov, ın care ipoteza nula presupune ca functia de repartitie estecea de la legea normala, dar parametrii nu mai sunt precizat¸i, ci sunt estimati folosinddatele de selectie.

Apelul functiei se poate face cu una din comenzile

h=lillietest(x)h=lillietest(x,alpha)[h,c,ls]=lillietest(x,alpha)

Comenzile de acest tip lanseaza executia testului Lilliefors, prin considerarea datelorcontinute de vectorulx , iar functia de repartitie ipotezata fiind cea de la legeanormala� ���� ���.

Parametrulalpha (implicit alpha=0.05 ) reprezinta nivelul de semnificatie.Rezultatele obtinute au urmatoarele semnificatii. Dac˘a h=1 ipoteza nula se res-

pinge, ceea ce corespunde faptului ca valoarea criticac satisface relatiac�

alpha ,iar dacah=0 , ipoteza nula nu poate fi respinsa.

Mai remarcam faptul cals va contine respectiv valoarea calculata a statisticii��, iar c estevaloarea critica, care se calculeaza cu ajutorul luils , folosindu–setabelele construite de Lilliefors. Daca ın aceste tabelenu se afla valoarea corespun-zatoare, atuncic=NaN, darh indica ınca daca ipoteza nula este respinsa sau nu.

Programul 6.12.9. Sa aplicam testul lui Lilliefors pentrun numere aleatoare ce ur-meaza legea normala

� �����, continute de vectorulx , cu nivelul de semnificatie

Page 373: Stat_Matlab.PDF

6.13. Testul Kolmogorov–Smirnov 363

alpha=0.05 . Programul ce urmeaza sa reprezinte grafic si functia derepartitie deselectie, ımpreuna cu functia de repartitie ipotezata, adica cea de la legea normala� ���� ���.

clfn=input(’n=’); mu=input(’mu=’); s=input(’sigma=’);x=normrnd(mu,s,1,n);[h,c,ls]=lillietest(x);fprintf( ’ h=%d\n c= %5.4f\n ls=%5.4f’,h,c,ls)ma=mean(x); va=sqrt(var(x));cdfplot(x), hold on, title([])t=ma-3*va:0.01:ma+3*va;plot(t,normcdf(t,ma,va),’k--’)

In urma executarii programului pentrun=10 , mu=100 si sigma=2 , se obtin rezul-tatele:

h=0c= 0.1433ls=0.1093

si graficele din Figura 6.5

4 6 8 10 12 14 160

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

x

F(x)

Figura 6.5: Testul Lilliefors

6.13 Testul Kolmogorov–Smirnov

Se considera doua caracteristici independente� si�

de tip continuu cu functiileteoretice de repartitie�� si �� necunoscute. Privind cele doua caracteristici vremsa verificam daca sunt identic repartizate. Astfel, consideram ipoteza nula data prin�� �� ��� , cu una din alternativele:

Page 374: Stat_Matlab.PDF

364 Verificarea ipotezelor statistice

(1)�� �� �� �� (testul Kolmogorov–Smirnov bilateral),

(2)�� �� � �� (testul Kolmogorov–Smirnov unilateral dreapta),

(3)�� �� � �� (testul Kolmogorov–Smirnov unilateral stanga).

Pentru verificarea ipotezei nule��, cu una din alternativele precizate, se con-

sidera cate o selectie repetata de volum�� si respectiv��, cu datele de selectie����� � � � �

���� si variabilele de selectie����� � � � �

����, corespunzatoare pen-tru caracteristica� si datele de selectie

����� � � � �

��� si variabilele de selectie����� � � � �

���, corespunzatoare pentru caracteristica�

.Se considera statisticile

���� � ����� � � ��� ��� � ��� ��� �� �

� ��� � ���

�� � ��� ��� � ��� ��� � �

����� � ����� � ��� ��� � ��� ��� � �

unde ��� si ��� sunt functiile de repartitie de selectie.Pentru����� � �, functiile de repartitie ale acestor functii de selectie au

urmatoarele comportari asimptotice:

������������

������ � �� �

��� � �� �� ��� ��� ������ ����� e���� � � �

��

functia lui Kolmogorov� ���, fiind tabelata pentru anumite valori ınAnexa V, res-

pectiv

������������

������ � �� �

��� � �� � ����������

������

�� � �� ����� � ��

��� ��� � ��

e��� � � ���

ce poarta numele de lege� cu doua grade de libertate.Pentru un nivel de semnificatie� � ��� �� fixat, se pot determina cuantilele

����,� ��� si

����� astfel ıncat

���

������ � �� �

��� ����� ����

��� � ����

adica� ������ � �

���

pentru testul bilateral Kolmogorov–Smirnov,

���

������ � �� �

��� �

� ��� ����

��� � ����

adica�� � ���� � �

���

Page 375: Stat_Matlab.PDF

6.13. Testul Kolmogorov–Smirnov 365

pentru testul unilateral dreapta Kolmogorov–Smirnov,

���

������ � �� �

���� � ����� ������� � �

���

adica�� ������ � �

���

pentru testul unilateral stanga Kolmogorov–Smirnov,Corespunzator celor trei alterantive, ipoteza

�� va fi admisa cand valorile cal-culate����, � ���, ����� pe baza datelor de selectie��� � � �

���� si���

� � �

���, alestatisticilor����, �

���, satisfac respectiv conditiile

(1)

�����

�� � ������ � ����, cand

�� �� �� �� ,

(2)

�����

�� � ��� ��� � �

���, cand�� �� � �� ,

(3)

�����

�� � ������� � �����, cand

�� �� � �� ,

iar ın caz contrar va fi respinsa.Prezentam, ın cele ce urmeaza, ımpreuna cele trei teste (bilateral, unilateral

dreapta si unilateral stanga) Kolmogorov–Smirnov. Remarcam ca cele trei teste suntteste distincte, alegerea unuia dintre ele se face apriori.

Etapele aplicarii testului lui Kolmogorov–Smirnov

1. Se dau:�; ����� � � � �

����; ����� � � � �

���;2. Se determina

(1)���� astfel ıncat

� ������ � ���, cand

�� �� �� �� ,

(2)� ��� astfel ıncat

�� � ���� � ���, cand

�� �� � �� ;

(3)����� astfel ıncat

�� ������ � ���, cand

�� �� � �� ;

3. Se calculeaza

(1)� � � ����� � ����, cand

�� �� �� �� ,

(2)� � � ����� � � ���, cand

�� �� � �� ;

(3)� � � ����� � �����, cand

�� �� � �� ;

4. Concluzia: daca

Page 376: Stat_Matlab.PDF

366 Verificarea ipotezelor statistice

(1)� � ���� ipoteza

�� este admisa, cand�� �� �� �� ,

(2)� � �

��� ipoteza�� este admisa, cand

�� �� � �� ,

(3)� � ����� ipoteza

�� este admisa, cand�� �� � �� ,

Observatia 6.13.1.Avand ın vedere ca functiile (de repartitie)�

si��

sunt mo-noton crescatoare si ca pentru determinarea cuantilelor

����,� ��� si

����� este ne-cesara inversarea acestor functii de repartitie, se poate evita aceasta operatie. Pentruaceasta se determina valorile functiilor

�si��

pe valorile calculate ale statisticilor

����, � ���, �����, adica se calculeaza, respectiv�

�� � � �� ����� �����

,

��

� ��� �� ����� �� ���

, ��

� ��� �� ����� ������. Astfel, se va respinge

ipoteza nula�� dacavaloarea critica � satisface inegalitatea� � �.

6.13.1 Functiakstest2

Statistics toolboxcontine functiakstest2 , care efectueaza testul Kolmogorov–Smirnov. Apelul functiei se poate face cu una din instructiunile:

h=kstest(x,y)h=kstest(x,y,alpha)h=kstest(x,y,alpha,tail)[h,c,ks]=kstest(x,y,alpha,tail)

Comenzile de acest tip lanseaza executia testului Kolmogorov–Smirnov bilateral(candtail=0 , valoare implicita), unilateral dreapta (candtail=1 ), respectiv uni-lateral stanga (candtail=-1 ), prin considerarea datelor continute ın vectoriix si y .

Parametrulalpha (implicit alpha=0.05 ) reprezinta nivelul de semnificatie.Rezultatele obtinute au urmatoarele semnificatii. Dac˘a h=1 , ipoteza nula se res-

pinge, ceea ce corespunde faptului ca valoarea criticac satisface relatiac�

alpha ,iar dacah=0 , ipoteza nula nu poate fi respinsa. Mai remarcam faptul c˘aks va continerespectiv valoarea calculata a statisticilor�����,�

���� si������, si verifica relatiile

c � �� � ��n���, pentru testul bilateral, respectivc � �

� �� ��n� � � sic � �

��� ��n��� �, pentru testele unilaterale.

Programul 6.13.2. Sa aplicam testele Kolmogorov–Smirnov (bilateral, unilateraldreapta si unilateral stanga) pentru datelex=-1:1:5 si y reprezentand20 de nu-mere aleatoare, ce urmeaza legea normala standard, iar nivelul de semnificatie sa fiealpha=0.05 . Programul ce urmeaza, sa reprezinte grafic si cele douafunctii derepartitie de selectie.

clfx=-1:5; y=randn(1,20);fprintf(’ h c ks\n’)fprintf(’__________________\n’)for i=-1:1

Page 377: Stat_Matlab.PDF

6.13. Testul Kolmogorov–Smirnov 367

[h,c,ks]=kstest2(x,y,[],i);fprintf(’ %d %5.4f %4.2f\n’,h,c,ks)

endh1=cdfplot(x); hold on, h2=cdfplot(y);title(’Functiile de repartitie de selectie’)set(h1,’linestyle’,’--’)set(h2,’linestyle’,’-’)

In urma executarii programului, se obtin rezultatele:h c ks

__________________1 0.0110 0.611 0.0219 0.610 0.9783 0.04

respectiv graficele din Figura 6.6. Testul Kolmogorov–Smirnov este bazat pe un re-

−2 −1 0 1 2 3 4 50

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

x

F(x)

Functiile de repartitie de selectie

Figura 6.6: Testul Kolmogorov–Smirnov

zultat asimptotic, adica se aplica pentru valori mari alevolului selectiei, dar aici s–aufolosit selectii de volum mic, ın mod special pentru a urm˘ari pe figura modul de calcula celor trei statistici�����, � ���� si ������.

Page 378: Stat_Matlab.PDF

368 Verificarea ipotezelor statistice

Page 379: Stat_Matlab.PDF

Anexe 369

Anexa I (Functia lui Laplace)� ��� � ���� � �

� e�� ��� � ���� � �� ���

Sutimi ale lui�� � � � � � � ���� ������ ���� ���� ��� ���� ���� �� ��� ��� � ���� ����� ��� ���� � �� � � � �� ��� ��� ���� �� �� ����� �� ���� ���� ���� ���� ��� ���� ��� ������ ������ ��� � �� �� ��� ���� ��� ���� � ����� ��� � � �� ��� ���� ���� ��� ��� ���� ���� ������ ����� �� � ��� ��� � � ��� � � � ��� ���� �� � �� � � �� � � � ��� �� ����� �� �� ��� �� �� �� �� ��� ��� � � ��� ����� ��� �� ��� �� � � � ��� ��� ����� ��� � ��� � � �� �� � �� � ����� ���� �� ��� �� �� � � �� �� ����� ���� �� ��� ��� �� ��� ��� ��� ��� ���� ����� ��� ��� ��� � ��� �� ��� ��� ��� �� ���� ���� ���� ��� ���� ��� ��� ���� ��� ������� ����� ��� � �� � � �� ��� �� ��� ����� ��� �� � � ��� �� ��� ���� ���� ��� ������� ���� ��� ���� ���� ��� � � � � � � � � ��� ��� � � �� � � � � � �� � �� ���� ���� �� ����� ������ ���� �� � ���� ���� ���� ���� ��� ���� ������� ����� ���� ��� �� ��� ���� �� � �� � ���� ������ ����� ���� ��� ���� ��� ���� ��� ���� ��� ������ ����� ��� ��� ��� ��� ��� ���� �� � �� � �� �� ������ ���� ���� ���� ��� ���� ���� ���� ���� ����� ����� ���� ���� ���� ���� ���� ���� ���� ��� ������ ������ ��� �� �� ��� ��� ��� �� ��� ���� ����� ��� ���� ��� ��� ���� ���� ���� �� � �� �� ���� �� �� � �� � �� � ���� ���� ��� ��� ������ ����� ���� ���� ���� ���� ���� ���� ��� ��� ������ ������ ��� ���� ���� ���� ���� ���� ���� ���� ������ ������ ��� ��� ��� ���� ���� ��� ��� ���� ������ ������ ���� ���� ���� ���� ���� ���� ���� ���� ������ ������ ���� ���� ���� ��� ��� ��� ��� ��� ���� ����� ��� ���� ���� ���� ���� ���� ��� ��� ��� � ����� ��� ���� ���� ���� ���� ���� ���� ���� ������ ������ ���� ���� ���� ���� ���� ���� ���� ���� ����� ������ ���� ���� ���� ���� ���� ���� ���� ���� ������ ������ ���� ���� ���� ���� ���� ���� ���� ���� ����

Page 380: Stat_Matlab.PDF

370 Anexe

Anexa II (Legea Student)�� ����� � �� � �

��

���� �

�� � �

��������

��

� ����� �� � �

� ���� ��� ���� ��� ���� ��� ���� ���� ���� � �

���� ���� ����� ���� ���� ���� ���� ����� ���� ��� � ����� ����� ����� ���� ����� ��� ��� ���� ��� �� �� ���� ����� �� � ���� � ��� �� �� ����� �� �� ����� ����� ����� �� �� ���� ���� ����� �� � ���� ���� ��� � ����� ��� � �� �� ���� �� ����� ����� ���� ����� ���� ���� ��� ����� �� �� ����� ����� ����� ���� ���� �� ���� � ��� �� �� ����� ����� ����� ���� ����� ��� ���� � � �� �� ���� ���� ����� ��� ��� �� ��� � ��� �� � ����� ����� ���� ��� ���� �� ���� ������ �� �� ����� ����� ����� ��� ����� ��� ���� ����� �� � ����� ���� ���� �� � ���� ���� ���� �� � �� � ����� ����� ����� �� � ����� ���� �� � ����� �� � ���� ����� ����� ��� ����� ��� �� ����� �� � ����� ����� ����� ���� ��� ��� ��� ������ �� ����� ���� ����� ��� ����� ��� � �� ����� �� � ����� ���� ����� �� ����� ���� � �� ������ �� � ����� ���� ����� ��� ���� ���� � ������ �� ����� ����� ����� ��� ���� ��� � �� ����� �� ����� ����� ����� �� ��� ���� � � ��� � �� ����� ��� � ���� �� ���� ���� � �� ��� �� ����� ��� � ����� ��� ����� ���� � �� ���� �� ���� ��� � ����� ��� ����� ���� � �� ����� �� � ���� ��� � ��� � ���� ����� ���� ��� ���� �� � ����� ��� � ��� � ���� ����� ���� ��� ����� �� � ����� ��� � ��� � ��� ����� �� � ���� ����� �� � ����� ��� ��� � ���� ���� �� ��� ����� �� � ���� ��� ��� � ��� ����� ���� ���� ���� �� � ���� ��� � ��� ���� ����� ��� ��� �� �� �� � ���� ��� � ��� ���� ����� ��� �� � �� � �� � ���� ��� ��� ���� ����� ��� ��� ����� �� � ����� ��� � ��� � ��� ����� ��� �� ��� � �� � ����� ����� ����� ���� ����� ���� ��� ������ �� � ����� ����� ����� ���� ����� ���� ��� ������ �� � ����� ����� ����� ���� ����� ���� ��� ������ �� � ����� ���� ����� ���� ��� � ����� � � ����� �� � ����� ���� ���� ��� ���� ��� � �� � ��

Page 381: Stat_Matlab.PDF

Anexe 371

Anexa III (Legea��) �� ������ � ��� � �

�� � �

�������� �� � �

� ���� ����� ��� ��� � ����� ����� ��� � ���� ����� ���� � �

���� ����� ����� ����� ����� ����� ��� ��� �� ��� ����

����� ���� ��� � ���� ���� ���� ��� ��� ��� ����� ���� ���� ���� �� �� �� �� ���� �� ���� ����� ���� ���� ����� ����� ���� ���� ���� ����� ��� ����� ���� �� � ���� ��� ���� ��� ����� ��� � ��� ���� � ����� ���� ��� ���� �� ����� �� � ���� ����� ��� � ����� ��� ���� ��� �� ��� ����� ����� ����� ���� ��� ��� ��� �� ��� ��� � � � ��� ���� ��� � ��� ��� ��� � ���� ����� ���� ���� ���� � ��� ��� � � � ��� ���� � ��� ���� ���� �� ����� ��� �� �� �� � � � ���� ����� ��� ��� ����� ��� � � ���� � ��� ��� ��� �� �� ���� � � ���� ��� ��� ���� ����� �� ���� ���� ����� ���� ���� �� �� � ���� ���� ��� ��� ���� ��� ���� � ��� ��� �� �� ��� ���� �� � ����� ��� ��� ���� ���� ��� � � ��� ��� ��� ����� ��� ���� �� � ���� ����� ���� �� � ���� ��� ���� ��� ���� �� ��� ����� ��� ���� �� ���� ������ ���� ��� ���� ���� ���� ��� ���� �� ���� �� �� ��� ��� �� � ���� ���� ���� ���� ���� �� � ������ ��� ���� ��� ���� ��� ��� ��� ��� ��� ����� ���� �� � ���� �� ����� ���� �� ���� ���� ���� ��� ��� ���� ��� ���� ��� ��� ���� ����� ������ ���� ���� ��� ��� � ��� �� ��� ��� ���� � � � ��� ��� ��� ���� ����� ��� ��� ���� ���� ����� ��� �� ��� � �� ���� � � ���� ���� � ��� ����� ���� ��� ���� ��� ����� ���� ����� ���� ����� ������ �� ��� � � ���� ����� ��� ���� ����� ���� ����� ��� ��� ���� ���� ����� ���� �� � � �� ��� � ��� ��� � �� ���� ��� ���� ���� ���� ����� ���� ��� ��� ��� ��� � ��� ���� ���� � �� ����� ��� � ��� �� ��� ��� �� �� ��� ������ � �� ��� �� ��� ���� ���� �� ���� ����

Page 382: Stat_Matlab.PDF

372 Anexe

Anexa IV (Legea Fisher–Snedecor)

���� ������� �� ���

� � � ��

�� �

�� � �

�� � ������

��� �� ���

������ ����

� � � � � �� � �

�������� ����� ���� �� � � � ����� � ��� ��� ��� ��� � �� ��� � ����� �� ���� �� � ��� � � �� ������ ��� � ����� ����� ��� ���� ��� ��� �������� �� ��� �� �� �� �� ��� ������� ����� ����� ����� ��� ���� ��� ��� ������� ���� �� ��� ��� ���� ���� ���� ��� ���� ���� ���� � �� � �� ���� ���� ���� ��� ���� ��� ���� ���� ���� ��� ���� ��� ������� ����� ���� �� � ��� ��� ���� ���� �������� � �� ���� ���� ���� ��� ��� ���� �������� ��� ����� ����� � ��� � � � �� � �� �������� ���� ��� ��� ��� �� ��� ���� ������� ���� ��� ���� ��� ��� ���� ��� �������� ���� ��� ���� ���� ����� ����� ��� ������� ��� ��� ���� �� ��� ��� ��� ��� ���� � ���� ��� ���� �� ��� �� ��� ������� ���� ����� ���� ��� ��� ���� ��� ������� � � ���� �� ��� ��� ��� ��� ������ � ���� �� � ��� � �� �� ���� �������� �� �� ��� ��� ��� ���� ���� ������� � ���� ���� ��� ��� � � � � ������� � �� � ���� �� �� ��� ��� �� ������� ���� ��� �� � ���� ��� ��� ���� ������ �� ��� ��� �� ��� �� �� ����� � ��� ��� ��� ��� ���� �� ��� �������� ��� � ��� ���� ��� ���� ��� ��� ������ ���� ���� ��� ��� � � ��� ������� �� ���� ��� ��� ���� ��� ���� �� �� ���� ����� �� � �� ��� ��� �� �� ������ ���� ��� � � �� �� ��� ��� �� ���� �� ��� �� ��� ��� ���� ��� ��� ������� ��� ��� �� ��� � ��� ���� ����

Page 383: Stat_Matlab.PDF

Anexe 373

Anexa IV (continuare)

� � � � � �� � �

�������� ��� ��� ��� �� ��� ��� ��� �� ���� � �� ��� ���� ��� ��� �� ��� � ����� �� ��� �� ��� ��� ��� �� � �� ���� ���� ��� ��� ��� �� �� �� ������� � ���� ���� �� ���� ��� ��� ��� ������ ���� ���� ��� �� ���� ��� ���� ������ ���� ��� �� ��� ��� �� ��� ������� �� ��� ���� ��� ��� ��� � � �� ������ ���� �� � � � ��� ���� ���� ��� ������� �� � ��� �� ��� ��� ��� ��� ������� � ��� ���� ��� ��� � � ��� �� ������ ���� ��� �� ���� �� � �� ���� ������� ���� �� �� ��� �� ��� ��� � ����� �� ��� ���� ���� �� � � �� � ������ �� �� �� ���� ���� ��� ��� ������ ��� � � �� ��� ��� ��� ��� � ���� �� ���� ��� ���� ��� ��� �� ��� ������� ���� ���� ��� ���� ��� ���� �� ������ ���� � ��� �� ��� ��� � � � ����� �� ��� �� � �� ��� �� � ��� ������� ��� ���� ��� �� � �� ���� ��� ������ ��� � �� ��� ��� �� � � ������� �� �� �� � ��� � � � ��� �� ������� ���� �� ��� �� � ���� ��� ��� ����� �� ��� ��� ��� ��� ��� � � �� ���� � ��� ���� ��� � � �� �� ��� ������� ���� �� ���� ��� ���� ��� ��� � ���� �� ��� ��� ��� ��� � � ��� ������ � �� ��� �� ��� � ��� ��� ������� ��� ��� ���� ��� ���� ��� ��� � ���� ��� ��� �� �� ��� � ��� ������� ��� ��� ��� ��� � �� �� ������� ��� �� ��� ��� ��� ��� � � �� ��� ��� �� �� ��� ��� � ��� ������ �� �� �� ��� ��� �� ��� ������� ���� ��� ���� ��� ��� ��� � � ������ ��� ��� ��� ��� �� � � �� ������ � �� �� �� �� �� ��� ��� ������� ��� ��� ��� �� ��� ��� � � ��

Page 384: Stat_Matlab.PDF

374 Anexe

Anexa IV (continuare)

� � �� �� � � �� � ��� � �

�������� ���� ���� ���� ���� ���� ���� ���� �������� ��� ��� ��� ��� ��� ��� ��� ������� ���� ���� ���� ���� ���� ���� ���� ������� ���� ���� ���� ���� ��� ���� ���� �������� ��� ���� ���� ��� ��� ��� ��� ������� �� ��� ��� ��� ��� ��� ��� ������ ���� ��� ��� ��� ��� ��� ��� ������� � ���� ���� ���� ��� ��� ���� ���� �������� ���� ��� ���� ���� ��� ��� ��� ������ ���� ���� ���� ���� ���� ���� ��� �������� ���� ��� �� � �� ���� ���� ��� �������� ��� ���� ���� ���� ��� ���� ��� ������� ���� ���� ��� ���� ��� ��� ��� ������ � � ��� ��� �� � �� �� � ���� ���� ���� ���� ��� ���� ���� �� � �� ��� ��� ��� ��� � � � � � � ������� � ��� ���� ���� ���� ��� ���� �� � �� ����� ��� ��� �� � ���� ���� ��� ��� ������ �� � �� �� �� �� � ������ � ��� ��� ��� ��� ���� ��� ���� �������� ��� ��� �� ��� ��� � � � ������ ��� ��� ��� ��� �� �� ��� ������� � ��� ��� ��� ��� �� ��� ��� ������� � �� ��� ��� �� ��� ���� ������ �� ��� ��� ��� ��� ��� �� ������ �� ��� �� ��� �� � � � � � ����� ���� ��� ���� ���� ��� ���� �� � �� ��� ��� �� �� ��� ��� ��� �� ������� �� � � � ��� �� �� �� � ������ ��� �� � ���� ���� ��� ��� �� ������ ��� �� �� ��� ��� ��� �� ������� � ��� �� � �� �� �� ��� �� ���� ��� ��� �� ���� ���� ��� ���� ������ ��� ��� �� ��� � � � � � ����� � �� � �� �� �� ��� �� ������ ���� ���� ��� ��� ��� ��� �� ������ �� ��� � � � � � ��� ��� ������� �� �� �� ��� �� ��� ��� �� ������ ��� ��� ��� ��� �� ��� ��� ��

Page 385: Stat_Matlab.PDF

Anexe 375

Anexa IV (continuare)

� � �� �� � � �� � ��� � �

�������� � � � � � � ��� �� �� ��� ������ � �� ��� ��� ��� �� ��� ��� ������� ��� ��� �� ��� ��� � � � ������ � � ��� ��� �� ��� �� � ����� �� �� ��� �� ��� �� �� ��� ������� ��� ��� �� � � � �� ��� ����� ��� �� ��� �� � � �� ������ �� ��� �� ��� �� ��� �� �� ������� ��� � � � ��� ��� � �� ����� ��� ��� �� �� �� �� �� � ���� �� �� ��� ��� ��� �� ��� ��� ������� ��� � � �� �� � �� � ������ �� �� �� �� �� �� � ������ �� ��� �� ��� �� ��� �� �� � ����� � �� �� �� �� ��� �� ����� �� � �� �� � � �� ������� � ��� ��� �� ��� ��� ��� � � � ���� ��� �� �� � ��� �� ��� �� ��� �� � �� � � �� ��� ������� � ��� �� ��� ��� ��� � � � � ����� ��� �� �� ��� �� ��� �� ������ �� �� �� � �� ��� �� ������ ��� ��� �� ��� � � � � � ������� � �� ��� �� ��� �� ��� ������ � �� � �� ��� �� �� ������� �� ��� �� � � � � � ��� ������� �� �� ��� ��� �� ��� �� ������ �� � �� ��� �� �� ��� ������� � ��� ��� � � � � � � ��� ��� ������� �� ��� ��� �� ��� �� ��� ��

Page 386: Stat_Matlab.PDF

376 Anexe

Anexa V (Functia lui Kolmogorov)� ��� �

������ ����� �����

Sutimi ale lui�� � � � � � � ��� ������ ���� ���� ���� ��� ��� ��� ���� ��� ������� ����� ��� �� � ��� ���� �� ���� ��� ��� ����� ����� ��� � � � � ���� ���� ��� ���� ��� ����� ��� � ��� �� ���� ��� ��� � � � ����� ����� � � �� � �� ��� ��� �� �� ��� ��� � ��� ���� �� �� �� ��� �� ��� ���� ����� ��� �� ��� ���� �� ���� ���� ���� ������� ����� ��� � �� ���� ���� ���� ���� ���� ���� ������ ��� ��� �� ��� � � � �� ���� ���� ��� ���� ������ ��� ���� ��� ���� ��� ���� �� �� ���� ����� � ��� ���� ���� ���� � � � � � � � ����� ����� ��� ��� ��� ��� ���� ���� ��� ���� ������ ������ ���� ��� ���� �� ��� ���� �� ���� ������ ������ ���� ���� ���� ���� ��� ���� ��� ��� ����� ����� ��� ���� ���� �� �� � �� � ��� ���� ������� ������ ���� ��� ��� ���� ���� ���� ���� ��� ������� ����� ���� ���� ���� ���� ���� ���� ���� ��� ����� ����� ���� ���� ��� ��� ���� ���� ���� ���� ������ ������ ���� ���� ���� ���� ���� ���� ���� ���� ����

Page 387: Stat_Matlab.PDF

Bibliografie

[1] Abramowitz, M., Stegun, I. A.,Handbook of Mathematical Functions with For-mulas, Graphs, and Mathematical Tables, tenth ed., Dover Publications, Inc.,New York, 1972.

[2] Blaga, P., Calculul probabilitatilor. Culegere de probleme, Universitatea”Babes–Bolyai”, Cluj–Napoca, 1984.

[3] , Metode statisticeın modelarea cu calculatorul. Lucrari de laborator,Universitatea ”Babes–Bolyai”, Cluj–Napoca, 1993.

[4] , Calculul probabilitatilor si statistica matematica. Vol. II. Curs si cule-gere de probleme, Universitatea ”Babes–Bolyai”, Cluj–Napoca, 1994.

[5] , Statistica matematica. Lucrari de laborator, Universitatea ”Babes–Bolyai”, Cluj–Napoca, 1999.

[6] , Statistica matematica, Universitatea ”Babes–Bolyai”, Cluj–Napoca,2000.

[7] , Statistica matematica (editia II), Universitatea ”Babes–Bolyai”, Cluj–Napoca, 2001.

[8] Blaga, P., Lupas, A., Muresan A. S.,Matematici aplicate, Vol.I–II, PromediaPlus, Cluj–Napoca, 1999.

[9] Blaga, P., Muresan A. S.,Matematici aplicateın economie, Vol.I–II, Transilva-nia Press, Cluj–Napoca, 1996.

[10] Blaga, P., Radulescu, M.,Calculul probabilitatilor, Universitatea ”Babes–Bolyai”, Cluj–Napoca, 1987.

[11] Ciucu, G.,Elemente de teoria probabilitatilor si statistica matematica, Edituradidactica si pedagogica, Bucuresti, 1963.

377

Page 388: Stat_Matlab.PDF

378 Bibliografie

[12] Ciucu, G., Craiu, V.,Probleme de statistica matematica, Editura didactica sipedagogica, Bucuresti, 1968.

[13] , Teoria estimatiei si verificarea ipotezelor statistice, Editura didacticasi pedagogica, Bucuresti, 1968.

[14] , Introducereın teoria probabilitatilor si statistica matematica, Edituradidactica si pedagogica, Bucuresti, 1971.

[15] , Inferenta statistica, Editura didactica si pedagogica, Bucuresti, 1974.

[16] Ciucu, G., Craiu, V., Stefanescu, A.,Statistica matematica si cercetari operati-onale, Vol. I, Editura didactica si pedagogica, Bucuresti, 1974.

[17] Ciucu, G., Tudor, C.,Probabilitati si procese stochastice. Vol. I, Editura Aca-demiei, Bucuresti, 1978.

[18] Craiu, V., Verificarea ipotezelor statistice, Editura stiintifica si enciclopedica,Bucuresti, 1972.

[19] Craiu, V., Enache, R., Basca, O.,Teste de concordanta cu programeın FOR-TRAN, Editura stiintifica si enciclopedica, Bucuresti, 1974.

[20] Cramer, H.,Mathematical methods of statistics, Princeton University Press,Princeton, 1951.

[21] Dacunha–Castelle, D., Duflo, M.,Exercises de probabilites et statistiques.1. Problemesa temps fixe. Tome 1, Masson, Paris, 1990.

[22] , Probabilites et statistiques. 1. Problemesa temps fixe. Tome 1, Mas-son, Paris, 1990.

[23] Deak, I.,Random number generators and simulation, Akademiai Kiado, Buda-pest, 1990.

[24] Dumitrescu, M., Florea, D., Tudor, C.,Probleme de teoria probabilitatilor sistatistica matematica, Editura Tehnica, Bucuresti, 1985.

[25] Enders, W.,Applied econometric. Time series, John Wiley & Sons, 1995.

[26] Ermakov, S. M.,Metoda Monte Carlo si problemeınrudite, Editura Tehnica,Bucuresti, 1976.

[27] Feller, W.,An introduction to probability theory and its applications. Vol. I,John Wiley, New York, 1957.

Page 389: Stat_Matlab.PDF

Bibliografie 379

[28] , An introduction to probability theory and its applications. Vol. II, JohnWiley, New York, 1966.

[29] Gnedenko, B. V.,The theory of probability, Mir Publishers, Moscow, 1976.

[30] Good, Ph. I.,Resampling Methods. A Practical Guide to Data Analysis,Birkhauser, Boston� Basel� Berlin, 1999.

[31] Griffiths, D. F., An Introduction to Matlab, Version 2.1, University of Dundee,1997.

[32] Grinstead, Ch. M., Snell, J. L.,Introduction in probability, Second edition, Ame-rican Mathematical Society, 1997.

[33] Gurskiı, E. I.,Culegere de probleme pentru teoria probabilitatilor si statisticamatematica (l. rusa), Edit. Inv. superior Minsk, Minsk, 1984.

[34] Hoel, P. J.,Introduction to mathematical statistics, Fourth edition, John Wiley& Sons, New York–London–Sydney–Toronto, 1971.

[35] , Statistique mathematique, Tome II, Armand Colin, Paris, 1991.

[36] Hoffmann–Jørgensen, J.,Probability with a view toward statistics, Vol. I-II,Chapman & Hall, New York–London, 1994.

[37] Iosifescu, M., Mihoc, Gh., Theodorescu, R.,Teoria probabilitatilor si statisticamatematica, Editura Tehnica, Bucuresti, 1966.

[38] Iosifescu, M., Moineanu, C., Trebici, V., Ursianu, E.,Mica enciclopedie de sta-tistica, Editura stiintifica si enciclopedica, Bucuresti, 1985.

[39] Jansson, B.,Random number generators, Victor Petterson Bokindustri Aktie-bolag, Stockholm, 1966.

[40] Johnson, N. L., Kotz, S.,Distributions in statistics. Discrete distributions, Hou-ghton Mifflin Company, Boston, 1969.

[41] Kendall, M. G., Stuart, A.,The advanced theory of statistics. Vol. 1. Distributiontheory, Second edition, Charles Griffin & Company Limited, London, 1961.

[42] , The advanced theory of statistics. Vol. 2. Inference and relationship,Charles Griffin & Company Limited, London, 1963.

[43] , The advanced theory of statistics. Vol. 3. Design and analysis, andtime–series, Charles Griffin & Company Limited, London, 1966.

Page 390: Stat_Matlab.PDF

380 Bibliografie

[44] Knuth, D. E.,The art of computer programming, Vol. II. Seminumerical algori-thms, Addison-Wesley, Mass., 1969.

[45] Lebart, L., Morineau, M. G., Fenelon, J.-P.,Traitment des donnees statistiques.methodes et programmes, Dunod, Paris, 1982.

[46] Lecoutre, J.-P., Tassi, Ph.,Statistique non parametrique et robustesse, Econo-mica, Paris, 1987.

[47] Lehmann, E. L.,Testing statistical hypotheses, Second edition, Springer, NewYork–Berlin, 1997.

[48] Malita, M., Zidaroiu, C.,Incertitudine si decizie, Editura stiintifica si enciclo-pedica, Bucuresti, 1980.

[49] Mihoc, Gh., Ciucu, G., Craiu, V.,Teoria probabilitatilor si statistica matema-tica, Editura didactica si pedagogica, Bucuresti, 1970.

[50] Mihoc, Gh., Ciucu, G., Muja, A.,Modele matematice ale asteptarii , EdituraAcademiei, Bucuresti, 1973.

[51] Mihoc, Gh., Craiu, V.,Tratat de statistica matematica. Vol. I. Selectie siestimatie, Editura Academiei, Bucuresti, 1976.

[52] , Tratat de statistica matematica. Vol. II. Verificarea ipotezelor statis-tice, Editura Academiei, Bucuresti, 1977.

[53] Mihoc, Gh., Firescu, D.,Statistica matematica, Editura didactica si pedagogica,Bucuresti, 1966.

[54] Mihoc, I., Calculul probabilitatilor si statistica matematica. Part. I, II, lito.Univ. “Babes–Bolyai”, Cluj–Napoca, 1994,1995.

[55] Nakamura, S.,Numerical Analysis and Graphic Visualization with MATLAB,Prentice Hall PTR, Upper Saddle River, New Jersey, 1996.

[56] Oancea, E., Radulescu, M.,Calculul probabilitatilor si statistica matematica,lito. Univ. “Babes–Bolyai”, Cluj–Napoca, 1974.

[57] Ogden, R. T.,Essential wavelets for statistical applications and data analysis,Birkhauser, Boston� Basel� Berlin, 1997.

[58] Onicescu, O.,Numere si sisteme aleatoare, Editura Academiei, Bucuresti, 1962.

Page 391: Stat_Matlab.PDF

Bibliografie 381

[59] Onicescu, O., Botez, M. C.,Incertitudine si modelare economica (econometrieinformationala), Editura stiintifica si enciclopedica, Bucuresti, 1985.

[60] Parzen, E.,Modern probability theory and its applications, John Wiley, NewYork–London, 1960.

[61] Press, W. H., Flannery, B. P., Teukolsky, S. A., Vetterling, W. T., NumericalRecipes. The Art of Scientific Computing, Cambridge University Press, Cam-bridge, 1986.

[62] Rancu, N., Tovissi, L.,Statistica matematica cu aplicatii ın productie, EdituraAcademiei, Bucuresti, 1963.

[63] Rao, M. M.,Probability theory with applications, Academic Press, New York,1984.

[64] Renyi, A.,Probability theory, Akademiai Kiado, Budapest, 1970.

[65] Rumsiski, L. Z.,Prelucrarea matematica a datelor experimentale, Editura Teh-nica, Bucuresti, 1974.

[66] Saporta, G.,Probabilites, analyse des donnees et statistique, Editions Technip,Paris, 1990.

[67] Schervish, M. J.,Theory of statistics, Springer, New York–Berlin, 1995.

[68] Shiryaev, A. N.,Probability, Springer, New York–Berlin, 1995.

[69] Sigmon, K.,Matlab Primer, Third edition, University of Florida, 1993.

[70] Snedecor, G. W, Cochran, W. G.,Statistical methods, Iowa State UniversityPress, 1989.

[71] Stapleton, J. H.,Linear statistical models, John Wiley & Sons, New York–Chichester–Brisbane, 1995.

[72] Stark, H., Woods, J. W.,Probability, random processes, and estimation theoryfor engineers, Prentice-Hall, New Jersey, 1986.

[73] Stoyanov, J., Mirazchiiski, I., Ignatov, Z., Tanushev, M., Exercise manual inprobability theory, Kluwer Academic Publishers, Dordrecht–Boston–London,1988.

[74] Sacuiu, I., Zorilescu, D.,Numere aleatoare. Aplicatiiın economie, industrie sistudiul fenomenelor naturale, Editura Academiei, Bucuresti, 1978.

Page 392: Stat_Matlab.PDF

382 Bibliografie

[75] Sveshnikov, A. A.,Problems in probability theory, mathematical statistics andtheory of random functions, W. B. Saunders Company, Philadelphia–London–Toronto, 1968.

[76] Tassi, Ph.,Methodes statistiques,��

edition, Economica, Paris, 1989.

[77] Vaduva, I.,Analiza dispersionala, Editura Tehnica, Bucuresti, 1970.

[78] , Modele de simulare cu calculatorul, Editura Tehnica, Bucuresti, 1977.

[79] Wahba, G.,Spline models for observational data, Society for Industrial andApplied Mathematics, Philadelphia, 1990.

[80] Yule, G. U., Kendall, M. G.,Introducereın teoria statisticii, Editura stiintifica,Bucuresti, 1969.

Page 393: Stat_Matlab.PDF

Index

Abaterecuartilica, 152medie absoluta, 152medie patratica, 152standard, 107, 152

abs , 9acos , 9acosh , 9acot , 9acoth , 9acsc , 9acsch , 9all , 15Amplitudinea, 152

clasei, 120and , 14angle , 9ans , 12any , 14asec , 9asech , 9Asimetrie, 103, 154asin , 9asinh , 9atan , 9atan2 , 9atanh , 9Atribut, 114axis , 23

bar , 31, 65, 134, 138bar3 , 58

bar3h , 58barh , 31beta , 80betafit , 282betalike , 280bino , 68binofit , 282boxplot , 164

Camp de evenimente, 62Camp de probabilitate, 62calendar , 6Cantitate de informatie, 232Caracteristica, 114

calitativa (atribut), 114cantitativa, 114continua, 115discreta, 115

caseread , 127casewrite , 127cd , 4, 10cdf , 65, 66, 74, 107cdfplot , 223ceil , 9Centile, 104, 151Centru de greutate, 174chi2 , 83cla , 23Clase, 120clear , 11clf , 23clock , 6

383

Page 394: Stat_Matlab.PDF

384 Index

Coeficientiilui Fisher, 154lui Pearson, 154

Coeficient de asimetrieintercuartil, 154

Coeficient de corelatie, 95al lui Pearson, 167al rangurilor, 187de selectie, 207

Coeficient de regresie, 174Coeficient de variatie, 154

intercuartil, 154Coeficientul

lui Kendall, 189lui Spearman, 187

Coeficientul de concordantaal lui Kendall, 194

Colectivitate, 114colormap , 27combnk , 10Concatenare, 9conj , 9contour , 54contourf , 55Convergenta

ın probabilitate, 108ın repartitie, 108

CorectiileSheppard, 158

Corelatie, 95, 165Corp borelian, 62corrcoef , 180cos , 9cosh , 9cot , 9coth , 9cov , 179Covarianta, 95crosstab , 126

csc , 9csch , 9Cuantila, 104Cuartila, 104, 150

inferioara, 104, 150superioara, 104, 150

cumprod , 157cumsum, 157Curba de regresie, 103, 170

date , 6Date de selectie, 198dbclear , 16dbcont , 16dbdown , 16dbmex, 17dbquit , 17dbstack , 16dbstatus , 16dbstep , 16dbstop , 16dbtype , 16dbup , 17Decile, 104, 151delete , 17demo, 4Densitate de probabilitate, 73, 74

marginala, 89det , 10diag , 10Diagrama

cumulativa ascendenta, 129integrala cumulativa, 132prin batoane (bare), 129

diary , 11, 43diff , 157dir , 4disp , 10Dispersie, 95, 152

conditionata, 101, 170

Page 395: Stat_Matlab.PDF

Index 385

de selectie, 206Distributie, 64

statistica, 123Distributie marginala, 88disttool , 107Drepte de regresie, 173

Esantion, 197echo , 48edit , 16Eficienta, 242eps , 6eq , 14erf , 76Eroare

de speta ıntai, 291de speta a doua, 291

Estimatie, 236absolut corecta, 237consistenta, 236corecta, 239cu�� minim, 256de verosimilitate maxima, 252nedeplasata, 236

Estimator, 236absolut corect, 237consistent, 236corect, 239cu�� minim, 256de verosimilitate maxima, 252nedeplasat, 236optimal, 247

Evenimentcert, sigur, 62

Exces, 103exit , 2exp , 9, 79Experiment, 62expfit , 282eye , 6

ezcontour , 56ezcontourf , 57ezmesh , 57ezmeshc , 57ezplot , 35ezplot3 , 51ezpolar , 25ezsurf , 57ezsurfc , 57

f , 85factor , 10factorial , 10feval , 47Fisiere script, 15, 43figure , 23file , 17fill , 35fix , 9floor , 9flops , 48format , 5Formula lui Daniels, 193fplot , 33fprintf , 13Frecventa

absoluta, 120, 124cumulata

ascendenta, 123descendenta, 123

relativa, 123Functia eroare, 76Functia Laplace, 76, 77Functia lui Euler

de speta ıntai, 80de speta a doua, 78

Functie caracteristica, 103Functie de estimatie, 236

absolut corecta, 237corecta, 239

Page 396: Stat_Matlab.PDF

386 Index

eficienta, 242nedeplasata, 236

Functie de probabilitate, 65Functie de repartitie, 63–65, 74

conditionata, 89de selectie, 216marginala, 88

Functie de selectie, 198Functie de supravietuire, 93Functie de verosimilitate, 229Functie hazard, 93Functie nucleu, 131

Gaussian, 131parabolic (Epanechnikov), 131

Functie wavelet, 29mama, 29

Functii Matlab, 43Functiile lui Haar, 29

gam, 78gamfit , 282gamlike , 280gcd , 10ge , 14geo , 73geomean, 149ginput , 13gline , 181global , 44gplotmatrix , 146grid , 24grpstats , 163Grupare, 120gscatter , 144gt , 14gtext , 24

harmmean, 149help , 2, 44helpdesk , 4

helpwin , 3hist , 138, 139histc , 139, 140histfit , 278Histograma, 129hold , 22hyge , 69

i , 6icdf , 104, 107imag , 9Indicatorul

de verosimilitate, 257lui Berkson, 257lui Kullbach, 257lui Neyman, 257lui Pearson, 257

Indicede dilatare, 29de translatare, 29

inf , 6input , 13Instructiunea

break , 42de atribuire, 12error , 43for , 40if , 37pause , 42return , 42switch , 38try...catch , 41while , 39

Instructiunide citire, 13de scriere, 13

Intervalintercuartilic, 152

Interval de ıncredere, 185, 187, 257inv , 10

Page 397: Stat_Matlab.PDF

Index 387

Ipoteza statistica, 285alternativa, 285compusa, 285nula, 285simpla, 285

iqr , 155

j , 6

kstest , 360kstest2 , 366kurtosis , 155

lcm , 10ldivide , 8le , 14Lege de probabilitate

de tip continuu, 74clasica, 74statistica, 81

de tip discret, 64clasica, 67

Legea��, 83

necentrata, 85arcsin, 80Bernoulli, 67beta, 80binomiala, 68binomiala negativa, 72Cauchy, 81evenimentelor rare, 71exponentiala, 71, 79F (Fisher–Snedecor), 85

necentrata, 86gamma, 78geometrica, 73hipergeometrica, 69lognormala, 78normala, 76normala multidimensionala, 90

Pascal, 72Poisson, 70Rayleigh, 80t (Student), 81

necentrata, 82uniforma, 74

discreta, 68Weibull, 80

Legea numerelor mari, 109legend , 24length , 10lillietest , 362load , 11log , 9log10 , 9log2 , 9logn , 78lookfor , 3, 44lsline , 181lt , 14

mad, 155magic , 6Matrice vida, 12Matricea covariantelor, 95Matricea informatiei lui Fisher, 232max, 156mean, 149median , 150Mediana, 104, 149Medie

aritmetica, 148armonica, 149geometrica, 148

Medie de selectie, 199mesh, 52meshgrid , 52Metoda ferestrei mobile, 130Metode de selectie

nerepetate, 198

Page 398: Stat_Matlab.PDF

388 Index

repetate(bernoulliene), 198min , 156minus , 8mkdir , 4, 10mldivide , 8mle , 278Mod, 151Moment, 151, 166

centrat, 103, 152, 167centrat de seletie, 203de seelctie, 201initial, 103

moment, 155mpower, 8mrdivide , 9mtimes , 8mvnrnd , 117mvtrnd , 117

NaN, 6nanmax, 158nanmean, 158nanmedian , 158nanmin , 158nanstd , 158nansum, 158nargin , 44nargout , 44nbin , 72ncf , 86nchoosek , 10nct , 82ncx2 , 85ndims , 10ne , 14Nivel de semnificatie, 286nlinfit , 185nlintool , 186Nor statistic, 133norm , 76

normfit , 282normlike , 280normspec , 87not , 14Numere

aleatoare, 116pseudoaleatoare, 117

Observarecurenta, 115partiala, 115periodica, 115totala, 115

ones , 6or , 14

pdf , 65, 66, 74, 107perms , 10pi , 6pie , 147pie3 , 147plot , 17, 25, 28, 65, 74, 138plot3 , 49plotmatrix , 145plus , 8poiss , 70poissfit , 282polar , 25poly , 183polyfit , 182polytool , 184polyval , 183polyvalm , 183Populatie, 114power , 8prctile , 151primes , 10Proba, 62Probabilitate, 62Probabilitate de ıncredere, 185

Page 399: Stat_Matlab.PDF

Index 389

Proceduri Matlab, 43prod , 157Puterea unui test, 291

quit , 2

rand , 118randn , 118random , 117randperm , 119randtool , 147range , 155rank , 10Raport de corelatie, 171rayl , 80raylfit , 282rdivide , 8real , 9realmax , 6realmin , 6refcurve , 182refline , 181Regiune critica, 286Regula lui Sturges, 120rem, 9Repartitie, 64reshape , 7Risc

de speta ıntai, 291de speta a doua, 291

roots , 183round , 9

save , 11, 43scatter , 142scatter3 , 143sec , 9sech , 9Selectie, 197

cu probabilitati egale, 198sistematica, 197

stratificata, 198tipica, 198

shading , 53sign , 9sin , 9sinh , 9Sistemul ecuatiilor

de verosimilitate maxima, 253size , 10skewness , 155Sondaj, 197sort , 156sortrows , 156Spatiul probelor, 62sqrt , 9stairs , 28, 65, 134Statistica, 198

completa, 249suficienta, 229

std , 155Subfunctii Matlab, 45subplot , 32sum, 157surf , 52

t , 81Tabel de contingenta, 124, 349Tabel de corelatie, 124Tabel statistic

nesistematizat, 119sistematizat, 119, 120

tabulate , 125tan , 9tanh , 9tblread , 128tblwrite , 128Teorema limita

centrala, 110Moivre–Laplace, 110

Test, 285

Page 400: Stat_Matlab.PDF

390 Index

cel mai puternic, 297nedeplasat, 297neparametric, 285parametric, 285

Testul� , 318, 321

bilateral, 318, 321unilateral dreapta, 318, 321unilateral stanga, 318, 321

� , 304, 325, 329bilateral, 304, 310, 332unilateral dreapta, 304, 332unilateral stanga, 304, 332

�, 286, 323bilateral, 286unilateral dreapta, 286unilateral stanga, 286

��, 312, 334, 346, 349bilateral, 312neparametric, 338parametric, 340, 342unilateral dreapta, 312unilateral stanga, 312

Fisher–Snedecor, 318bilateral, 318unilateral dreapta, 318unilateral stanga, 318

Kolmogorov, 353bilateral, 353unilateral dreapta, 353unilateral stanga, 353

Kolmogorov-Smirnov, 363bilateral, 363unilateral dreapta, 364unilateral stanga, 364

raportului verosimilitatilor, 308Student, 304

bilateral, 304, 332unilateral dreapta, 304, 332

unilateral stanga, 304, 332text , 24tic , 49times , 8title , 24toc , 49trace , 10transpose , 10trimmean , 149ttest , 307ttest2 , 327

unid , 68unif , 74unifit , 282

Valoare medie, 94, 95conditionata, 99, 170

Valoarea functiei de selectie, 198var , 155Variatie

intercuartilica, 152Variabila

nominala, 114ordinala, 114

Variabila aleatoare, 62(absolut) continua, 73de tip continuu, 63de tip discret, 63simpla, 63

Variabile aleatoareindependente, 64

Variabile de selectie, 198Varianta, 95

conditionata, 101Vector aleator, 63

(absolut) continuu, 74version , 4Volumul

colectivitatii, 114

Page 401: Stat_Matlab.PDF

Index 391

weib , 80weibfit , 282weiblike , 280what , 17which , 17who, 11whos, 11workspace , 43

xlabel , 24xor , 14

ylabel , 24

zeros , 6zoom, 25zscore , 290ztest , 290

Page 402: Stat_Matlab.PDF

392 Index