Mract Curs 2 Estimatii Punctuale Si Intervale

17
2. Elemente de teoria estimaţiei 2.1 Generalităţi În toate aplicaţiile statisticii matematice în economie, în tehnică şi, în general, în ştiinţele experimentale, este necesar să cunoaştem legitatea după care are loc evoluţia fenomenului studiat, adică legea de repartiţie a variabilei aleatoare, prin intermediul căreia este cuantificată caracteristica studiată a fenomenului. Adesea, cunoştinţele teoretice sau experienţa practică în domeniul investigat ne dau dreptul să admitem că forma legii de repartiţie este cunoscută. Pentru a utiliza efectiv o astfel de lege de repartiţie, va trebui cunoscut care dintre funcţiile de repartiţie din familia celor de o formă dată este cea care trebuie efectiv utilizată. Cu alte cuvinte, trebuie precizată valoarea numerică a parametrului (sau valorile numerice ale parametrilor, în cazul unei legi de repartiţie ce depinde de mai mulţi parametri). Pentru a înţelege mai bine cum stau lucrurile să dăm unele exemple. Exemplul 2.1.1. Dacă variabila aleatoare X reprezintă numărul de apeluri la o centrală telefonică, într-un interval de timp determinat, ales ca unitate, atunci X are o lege de repartiţie Poisson ce depinde de parametrul : 0 a > : , 0,1,2,3,... ! x a x X x a e x = , adică ( ) ; ! x a a PX xa e x = = , pentru . 0,1,2,3,... x = În cadrul unui proces de producţie, o caracteristică importantă o constituie procentul p de rebut. Dacă X este variabila aleatoare ce dă numărul de produse corespunzătoare ce se obţin într-o selecţie repetată de volum n, atunci: ( ) ( ) ; 1 , 0,1, 2,.., n x x x n PX xp C p p x n = = = . Să mai considerăm un alt exemplu, cu o variabilă aleatoare care admite o densitate de repartiţie. Fie T o variabilă aleatoare ce reprezintă durata de funcţionare fără căderi a unei anumite componente. În multe situaţii, variabila T este caracterizată de densitatea de repartiţie: ( ) 1 , 0 ; 0, 0 t T e t f t t θ > θ= θ , unde parametrul 0 θ > . Este vorba de o lege de repartiţie de formă exponenţială cu un singur parametru . 0 θ> În fine, dacă X reprezintă abaterile unei piese prelucrate de la cotă nominală menţionată în fişa tehnologică, atunci X urmează o lege normală ( ) N , m σ , a cărei densitate de repartiţie este: ( ) ( ) 2 2 2 1 ; , , 2 x m f xm e x ⋅σ σ= σ⋅ ⋅π R , care este o lege de repartiţie cu doi parametri . ( ) ( , 0 m σ∈ × R ) , În toate aceste exemple s-a specificat forma, fără a se preciza care anume repartiţie este, adică valorile exacte ale parametrilor care intervin. Ori de câte ori avem forma funcţiei prin care se exprimă legea de repartiţie, spunem că avem o problemă specificată. Cunoaşterea valorilor parametrilor conduce la cunoaşterea completă a legii de repartiţie, adică avem o problemă complet specificată. Operaţia de evaluare a parametrilor poartă numele de estimare a parametrilor, care se face pe baza unei selecţii de volum n: X 1 , X 2 ,.., X n , extrasă din populaţia caracterizată de variabila aleatoare X, cu legea de repartiţie specificată. Valorile parametrilor unic determinate pe baza selecţiei le vom numi estimaţii punctuale. Valorile parametrilor le estimăm cu ajutorul unei

description

Estimatii Punctuale

Transcript of Mract Curs 2 Estimatii Punctuale Si Intervale

  • 2. Elemente de teoria estimaiei

    2.1 Generaliti n toate aplicaiile statisticii matematice n economie, n tehnic i, n general, n tiinele

    experimentale, este necesar s cunoatem legitatea dup care are loc evoluia fenomenului studiat, adic legea de repartiie a variabilei aleatoare, prin intermediul creia este cuantificat caracteristica studiat a fenomenului. Adesea, cunotinele teoretice sau experiena practic n domeniul investigat ne dau dreptul s admitem c forma legii de repartiie este cunoscut.

    Pentru a utiliza efectiv o astfel de lege de repartiie, va trebui cunoscut care dintre funciile de repartiie din familia celor de o form dat este cea care trebuie efectiv utilizat. Cu alte cuvinte, trebuie precizat valoarea numeric a parametrului (sau valorile numerice ale parametrilor, n cazul unei legi de repartiie ce depinde de mai muli parametri).

    Pentru a nelege mai bine cum stau lucrurile s dm unele exemple. Exemplul 2.1.1. Dac variabila aleatoare X reprezint numrul de apeluri la o central

    telefonic, ntr-un interval de timp determinat, ales ca unitate, atunci X are o lege de repartiie

    Poisson ce depinde de parametrul : 0a > : , 0,1,2,3,...!

    xa

    xX xae

    x

    = , adic

    ( );!

    xa aP X x a e

    x= = , pentru . 0,1,2,3,...x =

    n cadrul unui proces de producie, o caracteristic important o constituie procentul p de rebut. Dac X este variabila aleatoare ce d numrul de produse corespunztoare ce se obin ntr-o selecie repetat de volum n, atunci: ( ) ( ); 1 , 0,1, 2,..,n xx xnP X x p C p p x n= = = .

    S mai considerm un alt exemplu, cu o variabil aleatoare care admite o densitate de repartiie. Fie T o variabil aleatoare ce reprezint durata de funcionare fr cderi a unei anumite componente. n multe situaii, variabila T este caracterizat de densitatea de

    repartiie: ( ) 1 , 0; 0, 0

    t

    Te tf tt

    > = , unde parametrul 0 > .

    Este vorba de o lege de repartiie de form exponenial cu un singur parametru . 0 >n fine, dac X reprezint abaterile unei piese prelucrate de la cot nominal menionat n

    fia tehnologic, atunci X urmeaz o lege normal ( )N ,m , a crei densitate de repartiie este: ( ) ( )

    2

    221; , , 2

    x m

    f x m e x = R , care este o lege de repartiie cu doi parametri

    . ( ) (, 0m R ),n toate aceste exemple s-a specificat forma, fr a se preciza care anume repartiie este,

    adic valorile exacte ale parametrilor care intervin. Ori de cte ori avem forma funciei prin care se exprim legea de repartiie, spunem c

    avem o problem specificat. Cunoaterea valorilor parametrilor conduce la cunoaterea complet a legii de repartiie, adic avem o problem complet specificat.

    Operaia de evaluare a parametrilor poart numele de estimare a parametrilor, care se face pe baza unei selecii de volum n: X1, X2,.., Xn, extras din populaia caracterizat de variabila aleatoare X, cu legea de repartiie specificat. Valorile parametrilor unic determinate pe baza seleciei le vom numi estimaii punctuale. Valorile parametrilor le estimm cu ajutorul unei

  • statistici (o funcie cu datele de selecie) construite pe baza seleciei X1, X2,.., Xn i pe care o vom nota . ( )1 2, ,..,n nT X X X

    Pentru a preciza ideile, vom presupune c selecia de volum n s-a efectuat dintr-o populaie caracterizat de o variabil aleatoare X, care admite legea de repartiie dat de ( );f x , aceasta fiind o densitate de repartiie, n cazul n care exist densitate sau, n cazul

    unei variabile discrete, fiind . Cu ajutorul funciei de selecie (numit estimator)

    dorim s estimm parametrul . Este clar c dispunem numai de o informaie parial asupra populaiei i, ca atare, cu ct volumul de selecie crete, cu att informaia este mai bogat. Deci,

    ( ;P X x= ))n( 1 2, ,..,nT X X X

    ( )1 2, ,..,nT X X X n trebuie s se apropie tot mai mult de valoarea parametrului , fiind vorba aici de un proces de convergen. Aceast convergen trebuie s aib loc n probabilitate, adic: ( )( )1 2lim , ,.., 1n nn P T X X X < =

    Valoarea luat de , pentru valori bine determinate ale variabilelor X1, X2,.., Xn, o vom numi estimaie a parametrului . Din cele prezentate rezult c funcia de estimaie este de natur teoretic, n timp ce estimaia este de natur empiric.

    ( 1 2, ,..,nT X X X )n

    Dac ( )1 2, ,.., Pn n nT X X X spunem c ( )1 2, ,..,nT X X X n este o estimaie consistent a parametrului .

    Cum exist o infinitate de funcii ( )1 2, ,..,nT X X X n care converg n probabilitate ctre , pentru a mri precizia, vom recurge la convergene mai tari, care asigur convergena n probabilitate. O atare convergen este convergena n medie ptratic, ce prezint avantajul c este comod n calcul. Funcia de estimaie ( )1 2, ,..,nT X X X n

    )n

    este o funcie de variabilele aleatoare independente X1, X2,.., Xn i, deci, o variabil aleatoare cu funcia ei de repartiie. Dac presupunem c operm cu convergena n medie ptratic, se admite implicit c

    are momente de ordinul doi cel puin. ( 1 2, ,..,nT X X XDefiniia 2.1.1. Spunem c statistica ( )1 2, ,..,nT X X X n este un estimator nedeplasat al

    parametrului , dac ( )( )1 2, ,..,n nM T X X X = . Spunem c statistica este un estimator deplasat al parametrului , dac ( 1 2, ,..,nT X X X )n( )( ) ( )1 2, ,..,n nM T X X X h n= + , unde funcia h(n) numit deplasare a estimatorului are

    proprietatea c ( ) 0n

    h n .

    Este clar c ntre eroarea de estimaie i deplasare exist o net deosebire. n timp ce eroarea de estimaie este ( 1 2, ,..,nT X X X )n i este o variabil aleatoare, deplasarea

    este o funcie numeric, ce depinde de volumul de selecie i, eventual, de parametrul de estimat i care reprezint o eroare sistematic n procesul de estimare.

    ( ) ( )( 1 2, ,..,n nh n M T X X X= )

    )nDac spunem c este pozitiv deplasat, iar dac ( ) 0h n > ( 1 2, ,..,nT X X X ( ) 0h n < spunem c este negativ deplasat. ( 1 2, ,..,nT X X X )n

    Exemple de estimaii nedeplasate sau deplasate putem pune imediat n eviden pe baza unor rezultate pe care le-am obinut deja.

  • Aa de exemplu, ( )1 21

    1, ,..,n

    n nj

    T X X X X Xn =

    = = j este o estimaie nedeplasat a mediei teoretice m a unei variabile aleatoare, deoarece ( )M X m= .

    De asemenea, frecvena relativ kn

    este o estimare nedeplasat a probabilitii, p, de

    apariie a unui eveniment n cazul unei repartiii binomiale:

    ( )1k n pM M k pn n n

    = = =

    Am vzut, de asemenea, c ( ) 222M n = i ( )2 2M s = . Aceasta dovedete c 2 este o estimaie negativ deplasat pentru dispersia teoretic 2 ,

    n timp ce s2 este o estimaie nedeplasat pentru 2 . Definiia 2.1.2. Spunem c ( )1 2, ,..,nT X X X n este o estimaie absolut corect a

    parametrului dac: ( )( )1 2, ,..,n nM T X X X = i ( )( )2 1 2, ,.., 0n n nD T X X X . Spunem c este o estimaie corect pentru dac:

    ( )( ) ( ) ( )1 2, ,.., , 0n n nM T X X X h n h n = + i ( )( )2 1 2, ,.., 0n n nD T X X X . Din rezultatele obinute anterior se deduce c momentul de selecie de ordin r, rM este o

    estimaie absolut corect pentru momentul teoretic de acelai ordin, . ntr-adevr: ( )rM X( ) ( )r rM M M X= , ( ) ( ) ( )222 0r rr nM X M XD M n = n particular X este o estimaie absolut corect pentru ( )M X m= , oricare ar fi repartiia

    variabilei aleatoare X, pentru care exist ( )M X i ( )2D X . Din faptul c ( )2 2M s = i ( )2 2 42 01 nD s n = precum i ( )

    22

    2M n = i

    ( ) ( )2 2 22 1 0nnD n = 4 rezult c s2 este o estimaie absolut corect pentru , n timp ce

    22 este numai corect pentru (n selecii dintr-o populaie normal ). 2 ( ),N m

    Din rezultatele menionate mai sus, este clar c vom prefera totdeauna s avem o estimaie nedeplasat pentru un parametru .

    Dar, pot exista, pentru acelai parametru , mai multe estimaii nedeplasate i, deci, este natural s o preferm pe aceea care are dispersia cea mai mic, ntruct valorile statisticii

    se vor grupa mai bine n jurul valorii . n felul acesta, ne punem problema existenei unei estimaii nedeplasate, care s aib cea mai mic dispersie i ct de mic poate s fie dispersia unei estimaii.

    ( 1 2, ,..,nT X X X )n

    )n

    n acest sens, avem binecunoscuta teorem a minimului dispersiei, cunoscut sub numele de teorema Rao-Cramer.

    Teorema 2.1.1. (Rao-Cramer) Dac este o estimaie absolut corect pentru parametrul din repartiia

    dat de f(x;) a variabilei aleatoare X (discret sau continu), atunci: ( 1 2, ,..,nT X X X

  • ( )( ) ( )2 1 2 1, ,..,n nD T X X X n I , unde ( )I este cantitatea de informaie pe o observaie i are expresia: ( ) ( ) ( )

    2 2

    2

    ln , ln ,f X f XI M M

    = = .

    Definiia 2.1.3. Spunem c estimaia ( )1 2, ,..,nT X X X n este eficient pentru parametrul dac ( )( ) ( )2 1 2 1, ,..,n nD T X X X n I= .

    Dac este o estimaie absolut corect oarecare, vom nota: ( 1 2, ,..,nT X X X )n

    ( )( ) ( )( )( )1 2 2 1 21

    , ,..,, ,..,n n n n

    n Ie T X X X

    D T X X X =

    i vom numi eficiena estimaiei (( 1 2, ,..,ne T X X X ))n ( )1 2, ,..,nT X X X n pentru parametrul . Din teorema Rao-Cramer se obine imediat c: ( )( )1 20 , ,..,n ne T X X X 1 i c

    este eficient dac ( 1 2, ,..,nT X X X )n ( )( )1 2, ,.., 1n ne T X X X = . Cum eficiena este o funcie de volumul n al seleciei i cum la limit trebuie s obinem

    cea mai mare informaie posibil rezult c ( )( )1 2lim , ,.., 1n nn e T X X X = i n acest caz vom spune c este o estimaie asimptotic eficient. ( 1 2, ,..,nT X X X )n

    3.2.2. Metode de estimare a parametrilor

    Am vzut, aadar, cum putem s analizm estimaiile parametrilor n funcie de

    proprietile pe care le au i, deci, s clasificm estimaiile. Vom cuta acum s punem n eviden modaliti (metode) de obinere a unor estimaii.

    n cele ce urmeaz ne vom opri asupra a dou metode de obinere a estimaiilor, pe care le vom numi estimaii punctuale: metoda momentelor i metoda verosimilitii maxime.

    3.2.2.1. Metoda momentelor Am vzut c momentele de selecie de ordinul r, sunt estimaii absolut corecte ale

    momentelor teoretice de acelai ordin, adic:

    ( ) (r r )M M M X= i ( ) ( ) ( )222 0r rr nM X M XD M n = . Este natural ca, pentru n suficient de mare, s lum n locul momentului teoretic,

    momentul empiric de acelai ordin. S presupunem c am efectuat o selecie de volum n: X1,X2,..,Xn, dintr-o populaie

    caracterizat de variabila aleatoare X, care are legea de repartiie dat de ,

    unde este densitatea de repartiie, dac aceasta exist, sau

    dac variabila X este de tip discret.

    ( )1 2; , ,.., kf x ( 1 2; , ,.., kf x )

    )( 1 2; , ,.., kP X x= Am considerat, desigur, cazul cnd variabila X este unidimensional i legea depinde de

    k parametri.

  • Admitem c variabila aleatoare X are momente cel puin pn la ordinul k inclusiv. Atunci ( 1 2, ,..,SM X )k sunt funcii de parametrii necunoscui 1 2, ,.., k , . 1s Alctuim sistemul de ecuaii: ( )1 2, ,.., , 1SS kM X M s k = , unde

    1

    1 n sS j

    jX

    n == M .

    Presupunnd c sistemul de ecuaii considerat admite soluii reale, se obin: ( )1 2 , ,.., , 1ks s M M M s = k i acestea vor fi estimaiile parametrilor prin metoda momentelor. S observm c nu este necesar s se ia neaprat primele k momente, ci din contr, putem lua alte momente, inclusiv momente centrate, care s constituie ns un sistem de k ecuaii cu necunoscutele

    1 2, ,.., k

    1 2, ,.., k i din care s se obin ct mai uor posibil soluia cutat.

    3.2.2.2. Metoda verosimilitii maxime Metoda momentelor, pe care am prezentat-o, este simpl i uor de aplicat. Prezint totui

    o serie de neajunsuri n ceea ce privete calitile estimaiilor obinute pe aceast cale. De aceea statisticienii au cutat alte metode de obinere a estimaiilor. Una dintre acestea este metoda verosimilitii maxime elaborat de R.A. Fisher ea prezentnd avantajul unui plus de eficacitate.

    S considerm, pentru nceput, cazul unui singur parametru i c legea de repartiie a variabilei X, ce caracterizeaz populaia din care s-a efectuat selecia de volum n: X1, X2,.., Xn este dat de ( );f x .

    Atunci, repartiia vectorului aleator ( )1 2, ,.., nX X X este , pe care o considerm ca funcie de .

    ( ) (1 21

    , ,.., ; ;n

    n jj

    P x x x f x=

    = )

    )Valorile X1, X2,.., Xn, fiind considerate date, ele fiind rezultatul experienei, vom

    considera ca valoarea cea mai verosimil a parametrului , valoarea pentru care probabilitatea devine maxim, ceea ce conduce la faptul c estimaia de verosimilitate

    maxim , este obinut ca soluie a ecuaiei: ( 1 2, ,.., ,nP X X X

    ( )1 2, ,.., ; 0nP X X X = Funcia poart numele de funcie de verosimilitate. ( 1 2, ,.., ;nP X X X )ntruct i ( )1 2, ,.., ;nP X X X ( )1 2ln , ,.., ;nP X X X sunt n acelai timp cresctoare sau

    descresctoare, estimaia de verosimilitate maxim se poate obine ca soluie a ecuaiei ( )1 2ln , ,.., ; 0nP X X X = . Funcia o vom numi tot funcie

    de verosimilitate. Se demonstreaz c soluia obinut este un punct de maxim pentru P i deci i pentru .

    ( ) ( ) (1 2 1 21

    , ,.., ; ln , ,.., ; ln ;n

    n nj

    L X X X P X X X f X=

    = = )j

    )k

    ln Pn cazul cnd repartiia unidimensional depinde de mai muli parametrii,

    , funcia de verosimilitate devine : ( 1 2; , ,.., kf x ( ) ( )1 2 1 2 1 2

    1, ,.., ; , ,.., ln ; , ,..,

    n

    n k jj

    L X X X f X=

    = iar estimaiile de verosimilitate maxim se obin ca soluii ale sistemului de ecuaii:

  • ( )1 2 1 2, ,.., ; , ,.., 0,n kr

    L X X X1 r k

    = Rezolvnd acest sistem de ecuaii se obin ( )1 2 , ,.., ,r r nX X X 1 r k = , ce vor fi

    estimaiile de verosimilitate maxim ale parametrilor 1 2, ,.., k . Ecuaiile 0,

    r

    L 1 r k = le vom numi ecuaii de verosimilitate.

    i n acest caz se poate arta c matricea hessian 2

    1 ,r s r s k

    L

    este matricea unei

    funcionale ptratice negativ definite. Fr a intra n amnunte, vom sublinia unele proprieti ale estimaiilor de verosimilitate

    maxim, proprieti ce le recomand pentru aplicaii. n cazul unui singur parametru , estimaia de verosimilitate maxim este consistent n probabilitate, iar pentru valori mari ale lui n, repartiia ei este aproximativ normal cu media ( )M = i cu dispersia

    ( ) ( )2 21 ln ;D f Xn M = .

    Altfel spus, estimaia obinut prin metoda verosimilitii maxime este asimptotic eficient, n sensul c nu exist o alt estimaie asimptotic normal cu dispersie mai mic.

    Dac parametrul admite o estimaie eficient, atunci aceasta se obine n mod unic,

    rezolvnd ecuaia de verosimilitate. 3.2.2.3. Intervale de ncredere S considerm variabila aleatoare X, caracterizat de familia de repartiii ( );f x , ce

    depinde de parametrul a crui valoarea bine determinat nu o cunoatem i pe care dorim s o estimm, pe baza unei selecii de volum n: X1,X2,..,Xn.

    Metoda punctual de estimare caut o funcie de selecie ( )1 2, ,..,n nT X X X , care s ndeplineasc condiia , i pe care am numit-o funcie de estimaie

    pentru parametrul . ( )1 2, ,.., Pn n nT X X X

    ntruct variaz ca precizie, este de dorit s dispunem de o indicaie asupra preciziei sale, iar metoda intervalelor de ncredere, pe care o punem n eviden n cele ce urmeaz, are astfel de virtui.

    ( 1 2, ,..,nT X X X )n

    S presupunem c pe baza seleciei menionate, se pot determina dou funcii de selecie i ( )1 1 2, ,.., nX X X ( )2 1 2, ,.., nX X X astfel nct :

    ( ) ( )( )1 1 2 2 1 2, ,.., , ,..,n nP X X X X X X = )

    cu independent de . Numrul (0,1 ( )0,1 se alege ct mai apropiat de valoarea 1, ceea ce nseamn c inegalitatea este ndeplinit n majoritatea cazurilor. 1 2

    Pentru o selecie efectuat, ( )1 1 2, ,.., nX X X i ( )2 1 2, ,.., nX X X iau valori bine determinate i, prin urmare, am gsit un interval ( ) ( )1 1 2 2 1 2, ,.., ; , ,..,n nX X X X X X care

  • acoper adevrata valoare a parametrului cu probabilitate apropiat de 1. Cu ct lungimea acestui interval este mai mic i probabilitatea este mai apropiat de 1, cu att vom avea o indicaie mai precis asupra valorii parametrului .

    Intervalul ( ) ( )1 1 2 2 1 2, ,.., ; , ,..,nX X X X X X n )

    l vom numi interval de ncredere, iar

    numrul nivel de ncredere. Numrul (0,1 1 = va fi numit nivel de semnificaie. Subliniem faptul c afirmaia intervalul [ ]1 2; acoper valoarea parametrului cu

    probabilitatea este cea corect, deoarece este fixat (dei necunoscut), iar 1 2, capetele intervalului sunt aleatoare, ele depinznd de variabilele de selecie X1,X2,..,Xn.

    S vedem acum care ar fi modalitatea obinerii unui interval de ncredere. Exist mai multe metode de determinare a intervalelor de ncredere, ns noi ne vom opri asupra unui mod simplu i uor de aplicat, mai ales n seleciile din populaii normale.

    Presupunem c putem determina o funcie de datele de selecie X1,X2,..,Xn i de parametrul , notat ( 1 2, ,.., ;nU X X X ) (U poate s depind i explicit de n) cu proprietile:

    a) este continu i strict monoton n raport cu ; ( 1 2, ,.., ;nU X X X )b) Funcia de repartiie a variabilei aleatoare ( )1 2, ,.., ;nU X X X nu depinde de sau ali

    parametrii necunoscui ( ) ( )( 1 2, ,.., ; , U nF x P U X X X x x= < \) este independent de . n aceast situaie, pentru orice ( )0,1 fixat, putem determina dou numerele reale

    i ( )1 ( )2 astfel nct: ( ) ( ) ( )( )1 1 2 2, ,.., ;nP U X X X = S folosim acum faptul c ( 1 2, ,.., ;nU X X X ) este continu i strict monoton n raport

    cu . Pentru a ne fixa ideile, s presupunem c este strict cresctoare n raport cu . n acest caz evenimentul ( ) ( ) ( )( 1 1 2 2, ,.., ;nU X X X )

    ))n este echivalent cu evenimentul

    i, ca evenimente echivalente, au aceeai

    probabilitate, adic:

    ( ) (( 1 1 2 2 1 2, ,.., ; , ,.., ;nX X X X X X ( ) ( )( )1 1 2 2 1 2, ,.., , , ,.., ,n nP X X X X X X =

    Am determinat astfel un interval ( ) ( )1 1 2 2 1 2, ,.., ; ; , ,.., ;n nX X X X X X cu capete aleatoare, care acoper adevrata valoare a parametrului cu o probabilitate fixat.

    3.2.4. Intervale de ncredere pentru parametrii m i 2 , dintr-o repartiie normal N(m,) Presupunem c s-a efectuat o selecie de volum n: X1,X2,..,Xn dintr-o populaie normal

    N(m,). Pe baza seleciei efectuate s construim, mai nti, un interval de ncredere pentru

    parametrul m. Vom avea de luat n considerare dou cazuri, n funcie de parametrul , care poate fi cunoscut sau necunoscut.

    3.2.4.1. Interval de ncredere pentru parametrul m cnd este cunoscut

    Considerm funcia de selecie ( )1 2, ,.., ;n X mU X X X mn

    = .

  • Selecia fiind efectuat dintr-o populaie normal N(m, ), variabila aleatoare X m

    n

    am

    vzut c are o repartiie normal N(0;1), adic funcia ei de repartiie nu depinde de parametrul m.

    Pe de alt parte X m

    n

    este continu i strict descresctoare n raport cu variabila m.

    Din faptul c X m

    n

    are o repartiie normal N(0;1) rezult c, pentru orice ( )0,1

    fixat i apropiat de 1, putem determina numerele z1 i z2 astfel nct:

    ( ) ( )2 221

    1 2 21

    12x

    z

    z

    X mP z z e dx z z

    n

    = = =

    Dar evenimentul 1X mz

    n

    2z este echivalent cu: 2 1X z m X zn n

    i deci au aceeai probabilitate: 2 1P X z m X zn n =

    Am determinat aadar intervalul 2 1;X z X zn n care, cu probabilitatea ,

    acoper adevrata valoarea a parametrului m. Pentru fixat, se pot determina o infinitate de numere z1, z2, care s satisfac

    condiia .

    (0,1 )( ) ( )2 1z z =

    Cum pe noi ne intereseaz s obinem o precizie ct mai bun, pentru un volum al seleciei n dat, aceasta se obine cnd lungimea intervalului este minim. Urmeaz s

    determinm minimul funciei ( ) (1 2 2 1,L z z z zn )= (lungimea intervalului de ncredere) cu

    legtura 2

    2

    1

    212

    xz

    ze dx = .

    Aplicnd metoda multiplicatorilor lui Lagrange, vom cuta minimul funciei:

    ( ) ( )2

    2

    1

    21 2 2 1

    1, ,2

    xz

    zH z z z z e dx

    n = +

    Din sistemul 1

    0Hz

    = ; 20H

    z = ; 0

    H = se obine:

  • 212 0

    2

    z

    en

    = ; 222 0

    2

    z

    en

    + = i de aici: 2 21 22 2e2 2z z

    en n

    = = ; 2 21 22 2z z

    e= 22e adic 21z z= sau 1 2z z= . Cum , soluia 0 > 1z z2= nu convine i, deci 1 2z z= ; 2z z= .

    n acest caz intervalul devine ; X z X zn n +

    , iar z se determin din ecuaia , de unde obinem: ( ) ( )z z =

    ( )2 1z = , ( ) 1 1 1 12 2 2z + + = = = , 1

    12

    12

    z z = = , care se afl din

    tabelele pentru repartiia normal N(0;1). n final, intervalul de ncredere pentru parametrul m, cnd este cunoscut, cu nivelul de

    ncredere este: 1 = 1 1

    2 2

    ; X z X zn n

    + .

    3.2.4.2. Interval de ncredere pentru parametrul m cnd este necunoscut n acest caz se consider funcia de selecie

    ( ) ( )( )

    2

    1

    2 2

    1 2 2 12, , 1

    1 112

    nt

    t

    ns xH t t t t dx

    n nn n

    = + +

    unde

    ( )221

    11

    n

    jj

    s Xn =

    = X . Dup cum s-a vzut, variabila X ms

    n

    urmeaz o lege de repartiie Student cu grade

    de libertate.

    1n

    Cum funcia de repartiie Student nu depinde de m i n plus X msn

    este funcie continu

    i strict descresctoare n raport cu m, pentru orice ( )0,1 fixat, putem determina numerele reale t1 i t2 astfel nct:

    ( )2

    1

    2 2

    1 22 1

    1 112

    nt

    t

    nX m xP t t dxs n nn

    n

    = + =

  • Cum evenimentul 1X mt s

    n

    2t este echivalent cu 2 1s sX t m X tn n

    ,

    nseamn c au aceeai probabilitate, adic: 2 1sP X t m X tn n

    s = i deci am

    determinat intervalul de ncredere 2 1 ; sX t X tn n

    s care, cu probabilitatea , acoper parametrul m.

    Ca i n cazul anterior, punem condiia ca lungimea intervalului s fie minim, cu

    restricia: ( )

    2

    1

    2 22 11 11

    2

    nt

    t

    nx dx

    n nn

    + = .

    Aplicnd metoda multiplicatorilor lui Lagrange se obine din

    ( ) ( )( )

    2

    1

    2 2

    1 2 2 12, , 1

    1 112

    nt

    t

    ns xH t t t t dx

    n nn n

    = + +

    i 1

    0Ht

    = ,

    2

    0Ht

    = c , 1 2t t= 2 1 2t t = , iar intervalul de ncredere devine:

    1 12 2

    ; s sX t X tn n

    + .

    3.2.4.3. Interval de ncredere pentru parametrul 2

    Se consider statistica ( ) ( ) 221 2 21, ,.., ;n n sU X X X = care, dup cum s-a vzut, are o lege de repartiie (( )

    21n 2 cu grade de libertate). 1n

    Atunci, pentru fixat, se pot determina dou numere (1 0 = ),1 21 i 22 astfel nct: ( ) 22

    21

    2 1 12 2 2 21 2 12

    2

    1 112

    2

    n x

    n

    n sP x

    n

    = = e dx

    Cum funcia de repartiie a variabilei ( ) 221n s este independent de i n plus 2( ) 2

    2

    1n s este continu i strict descresctoare n raport cu

    2 , nseamn c statistica aleas ndeplinete condiiile pentru a putea construi un interval de ncredere pentru . 2

    Evenimentele ( ) 22 21 221n s

    i ( ) ( )2 2222 1

    1 1n s n s 2

    fiind echivalente,

    au aceeai probabilitate i deci:

  • ( ) ( )2 222 22 1

    1 1n s n sP =

    adic am determinat intervalul ( ) ( )2 22 22 1

    1 1;

    n s n s

    care, cu o probabilitate fixat,

    acoper parametrul . 2Numerele 21 i 22 depind de i, ca atare, s le stabilim valoarea cnd este dat. Densitatea de repartiie a unei variabile ( )

    2k , nemaifiind simetric i lund numai valori

    pozitive, nu vom mai putea adopta ca metod minimizarea lungimii intervalului, cu restricii.

    Vom adopta n acest caz regula: ( )2 21 2P < = ; ( )2 22 2P > = , numit regula cozilor egale.

    x

    f(x)

    12

    2

    Avnd n vedere modul cum sunt construite tabelele pentru funcia de repartiie a unei variabile ( )

    2k , obinem: ( )

    2 21 1 ,

    2n

    = ; ( )2 22 1 ,1

    2n

    = i cu acestea intervalul

    ( )( )

    ( )2 22 2

    1 ,1 ( 1),2 2

    1 1,

    n n

    n s n s

    care, cu o probabilitate , acoper parametrul 2 .

    Uneori ne intereseaz interval de ncredere pentru (nu pentru 2 ). Atunci folosim faptul c funcia de selecie 1n s are densitate de repartiie:

    ( ) 22 23

    2

    0,

    1 ,12

    2

    xn

    n

    x 0

    f x x e x 0n

    = >

    Pentru fixat, se pot determina dou numere U1 i U2 astfel nct: 1 = 2

    2

    1

    2 21 2 3

    2

    1 112

    2

    xUn

    nU

    n sP U U x e dxn

    = =

    Se obine astfel intervalul: 2 1

    1 1,n s n sU U

    care, cu o probabilitate , acoper

    parametrul .

  • Valorile numerice se pot determina fie folosind cuantilele repartiiei ( )2k , fie prin

    integrare numeric pe calculator. 3.2.4.4. Selecii din dou populaii normale N(m1,1) i N(m2, 2) S presupunem c s-au efectuat dou selecii, una de volum n1 din populaia N(m1, 1) i

    una de volum n2 din populaia N(m2, 2). 11 11 12 1: , ,..., nn X X X i 22 21 22 2: , ,..., nn X X X

    Pe baza acestor dou selecii se obin funciile de selecie: 1

    1 111

    1 nj

    jX X

    n == ;

    ( )1 22 11 111

    11

    n

    jj

    s X Xn =

    = ; 2

    2 212

    1 nj

    jX X

    n == ; ( )2 22 22 2

    12

    11

    n

    jj

    s Xn =

    = X2

    .

    Construim un interval de ncredere pentru 1m m n cazul n care 1 i 2 sunt cunoscute.

    Pentru aceasta considerm statistica:

    ( ) ( )1 2 1 2 1 211 12 1 21 22 2 1 2 2 21 2

    1 2

    , ,.., , , ,.., ;n nX X m m

    U X X X X X X m m

    n n

    = +

    care este repartizat normal N(0;1),de unde urmeaz, parcurgnd punct cu punct calea parcurs n cazul unei singure selecii, intervalul de ncredere de nivel 1 = :

    2 2 2 21 2 1 2

    1 2 1 21 1

    1 2 1 22 2

    ;X X z X X zn n n n

    + + +

    Intervalul de ncredere pentru 1m m2 n cazul n care 1 i 2 sunt necunoscute, dar . 2 2 21 2 = =

    n acest scop se consider statistica:

    ( )( )

    ( ) ( )1 2

    1 2 1 2

    1 211 12 1 21 22 2 1 2 2 2

    1 1 2

    1 2

    1 1

    , ,.., , , ,.., ;1 1

    2

    n n

    X X m m

    n nU X X X X X X m m

    n s n sn n

    +

    =2 +

    +

    care are o repartiie Student cu grade de libertate. 1 2 2n n+ Atunci, procednd ca n cazul unei singure selecii dintr-o populaie normal N(m,),

    obinem, pentru fixat, intervalul de ncredere: 1 = ( ) ( )

    1 2

    2 21 1 21 2

    1 21 ; 2

    1 2 1 22

    1 1;

    2n nn s n sn nX X t

    n n n n +

    2 + + +

    ( ) ( )1 2

    2 21 1 2 21 2

    1 21 ; 2

    1 2 1 22

    1 12n n

    n s n sn nX X tn n n n +

    + + + +

    Acest interval acoper, cu probabilitatea , valoarea 1 2m m .

  • Interval de ncredere pentru raportul 2122

    .

    Se consider funcia de selecie:

    ( )1 2222 2

    2 2 2 111 12 1 21 22 2 1 2 2 2 2

    1 2 121

    , ,.., , , ,.., , ,n n

    ssU X X X X X X

    s s 22 = =

    Aceast funcie de selecie are o repartiie Snedecor cu 2 1n i 1 1n grade de libertate. Notm, ca de obicei,

    2 1

    2 21 2

    1; 1 2 22 1

    n nsFs

    = .

    Variabila aleatoare are o funcie de repartiie independent de 2 11; 1n n

    F 2122

    , iar ca funcie

    de 2122

    este continu i strict cresctoare. Pentru fixat, putem determina numerele reale 1 = ( )1F i astfel nct

    .

    ( )2F( ) ( )( )2 11 21; 1n nP F F F = n ipoteza c adoptm cozi egale, se obine:

    2 12 1 2 1

    1; 11; 1, 1; 1,12 2

    n nn n n nP F F F =

    Cum evenimentele:

    2 1 2 1

    2 21 22 21; 1, 1; 1,12 12 2

    n n n n

    sF Fs

    ,

    2 1 2 1

    2 2 21 1 12 2 21; 1, 1; 1,12 2 22 2

    n n n n

    s sF Fs s

    sunt echivalente, au aceeai probabilitate i am obinut intervalul:

    2 1 2 1

    2 21 12 21; 1, 1; 1,12 22 2

    ; n n n n

    s sF Fs s

    care acoper valoarea parametrului 2122

    , cu probabilitatea .

    3.2.4.5. Intervale de ncredere pentru parametri n cazul seleciilor de volum mare

    Dup cum s-a vzut, determinarea unui interval de ncredere pentru parametrul , care

    apare n legea de repartiie , se baza pe construirea unei funcii de selecie, care s depind de datele de selecie X1,X2,..,Xn, de volumul de selecie n i de parametrul estimat . De asemenea, se presupunea c funcia de repartiie a statisticii nu depinde de parametrul estimat. ns, n multe situaii, aflarea funciei de repartiie a statisticii este o problem dificil, dar se poate determina repartiia asimptotic a statisticii care conine parametrul necunoscut i se poate utiliza repartiia asimptotic, dac n este suficient de mare, caz n care erorile comise sunt neglijabile.

    ( ;f x )

    Fie variabila aleatoare X cu densitatea de repartiie ( );f x ce caracterizeaz o populaie C, din care se efectueaz selecia de volum n: X1,X2,..,Xn. n ipoteza c valorile de selecie

  • sunt independente, se obine funcia de verosimilitate: .

    Rezult:

    ( ) ( )1 21

    , ,.., ; ;n

    n jj

    P X X X f X=

    = ( )

    1

    ln ;ln n jj

    f XP=

    = . Notnd ( )ln ;

    , 1jjf X

    Y j

    n= obinem:

    ( ) ( ) ( ) ( )ln ; ln ; ; 0j f X f xM Y M f x dx

    = = = Presupunem c:

    ( ) ( ) ( )22 ln ;0 ;j f xM Y f x dx

    < = <

    Atunci ( ) ( ) ( )2 2 2 ln ;j j f XD Y M Y M = = , iar variabila: ( ) ( )

    ( ) ( )1 1

    1

    22

    1

    ln ; ln ;ln ln

    ln ln ;

    n nj j n

    ij ji

    n jj

    j

    f X f XP P MM Y

    P n D Yf XD D

    = = =

    =

    = =

    este asimptotic

    N(0;1), conform teoremei limit central.

    Deci ( )2

    1 21lim2

    n

    xbii

    n aj

    YP a b e dx

    n D Y=

    < < =

    i, prin urmare, pentru n suficient de

    mare, statistica: ( ) ( )11 ln

    n

    ii

    j j

    Y Pn D Y n D Y

    = =

    urmeaz aproximativ o lege de repartiie

    N(0;1).

    Dac, n plus, ln P este strict monoton n raport cu , atunci se poate construi un interval de ncredere pentru q, oricare ar fi nivelul de semnificaie ( )0,1 .

    Aplicaii

    1. Pe baza seleciei 1 2, , , nX X X s se estimeze parametrul al repartiiei Poisson: ( ) , 0,1,2,

    !

    keP X k kk

    = = = i s se analizeze estimatorul obinut. Rezolvare: Utiliznd metoda momentelor avem ecuaia ( )M X X= . Cum ( )M X = se obine estimatorul ( )1 2

    1

    1, , ,n

    n ni

    iX X X X Xn

    == = . Utiliznd metoda verosimilitii maxime

    avem funciile de verosimilitate

    ( ) ( ) ( ) ( )1 2 1 1, , , ; ; ! !i iX Xn n

    nn i

    i i i i

    eP X X X P X X e1

    n

    iX X

    = == = = =

    =,

  • ( ) ( ) (1 2 1 21

    , , , ; ln , , , ; ln ln !n

    n n ii

    L X X X P X X X n X X =

    = = + ( ) )i i ecuaia de verosimilitate ( )1 2, , , ; 0nL X X X

    = , deci

    1

    1 0n

    ii

    n X= + = se obine estimatorul ( )1 2

    1

    1, , ,n

    n ni

    iX X X Xn

    == = X (acelai ca i la metoda momentelor, totui nu este obligatoriu

    ca ambele metode s dea acelai estimator). Pentru analiza estimatorului vom folosi faptul c ( )M X = i ( )D X = . Avem

    ( )( ) ( )1 21

    1, , ,n

    n n ii

    M X X X M X M Xn

    =

    = = = ( ) ( )1 11 1n n

    ii i

    M X M Xn n= =

    = 1

    1 1n

    in

    n n

    == = = ,

    deci este nedeplasat;

    cum i ( )( ) ( )1 2 21

    1, , ,n

    n n ii

    D X X X D Xn

    =

    = = 2 0nn nn

    = rezult c este estimator

    absolut corect;

    cum ( )ln ; ln ln ln !!

    Xef X XX

    = = +

    X , ( )ln ; 1f X X = + ,

    ( )22 2

    ln ;f X X

    = , ( )( )22 2

    ln ; 1f X XI M M

    = = =

    se verific faptul c ( )( ) ( )1 21, , ,n nD X X X n n I

    = = , deci este estimator eficient, are

    eficiena ( )( ) ( )( )( )( )1 2 1 21

    , , ,, , ,n n n n

    n Ie X X X

    D X X X

    = = 1. 2. Pe baza seleciei 1 2, , , nX X X , s se determine estimatorul de maxim verosimilitate pentru parametrul 0 > din distribuia (densitatea) de probabilitate ( ) ( ) 1; , 0,1,2,1

    x

    xf x x += =+ , i s se arate c este absolut corect.

    Rezolvare: Avem ecuaia de verosimilitate ( )1ln ; 0

    n

    ii

    f X = = ,

    ( ) ( ) ( )( )11 1ln ln 1 ln 11i

    i

    Xn n

    i iXi i

    X X += = = + + + =

    ( )1 11 1 01 1

    n ni i

    ii i

    X X X n = =+ = + +

    = , se obine estimatorul

    ( )1 21

    1, , ,n

    n ni

    iX X X Xn

    =X= =

    Avem ( ) ( ) 110 11 1

    1 11

    xx

    xx x

    M X x x t

    += == = = + ++ S , unde ( )0,11t

    = + i

    11

    1 1 1lim lim

    k kx x x =

    k kx x xS x t x t t x t

    = = =

    = = = '' 1

    1lim lim

    1

    kkx

    k kx

    t tt t tt

    +

    =

    = = ( )( ) ( )

    ( )1 22 2 2

    1 1 1lim

    1 1 11

    k k

    k

    k t k t ttt t

    +

    + + + = = +

    = + , rezult

  • ( ) ( )211M X = + =+ . Pentru a calcula ( )2M X trebuie calculat suma 22 1 xxS x

    == t ;

    pentru aceasta procedm astfel: derivm n raport cu t, deci 1S

    ( )( ) ( )

    ( )' 2

    '' 2 11 2 1 2 4

    1

    1 2 1,

    1 1x

    x

    t t ttS x t S t S t tt t

    =

    = = = = = ( )

    2

    31t tt+ = , ( )( )22 1 = + +

    ( ) ( )2 2 2210 1 211x

    xx

    M X x S

    +== = = +++ , ( ) ( ) ( )2 2 2D X M X M X = = + . Aadar,

    ( )( ) ( )1 21

    1, , ,n

    n n ii

    M X X X M X M Xn

    =

    = = = ( ) ( )1 11 1n n

    ii i

    M X M Xn n= =

    = 1

    1 1n

    in

    n n

    == = = ,

    deci estimatorul este nedeplasat, i cum

    ( )( ) ( ) ( )1 2 2 21

    1 1, , ,n

    n n ii

    D X X X D X n D Xn n

    =

    = = = 2 0nn

    + rezult c estimatorul

    este absolut corect. 3. Pe baza seleciei 1 2, , , nX X X s se estimeze parametrul , 0, > din densitatea de repartiie: ( ) 2; ,

    xxf x e x = > 0 i s se analizeze estimatorul obinut. Precizai estimaia n

    cazul seleciei de volum 15 i de valori: 4, 5, 5, 2, 3, 4, 5, 3, 4, 2, 3, 2, 5, 4, 3.

    Rezolvare: Folosind metoda momentelor avem: ( ) ( )0

    M X x f x dx

    = = ( )2 22

    0 0

    3 2x

    yx e dx y e dy = = = , deci ecuaia ( )M X X= ne d estimatorul ( )1 2

    1

    1 1, , ,2 2

    n

    n ni

    iX X X X Xn

    == = .

    Folosind metoda verosimilitii maxime avem: ( )1ln ; 0,

    n

    ii

    f X = =

    21ln

    iXni

    i

    X e

    =

    = 21 12ln 2 ln

    n ni i

    ii i

    X XX = = = + = 2 1

    2 1 0n

    ii

    n X = + =0

    , se obine

    ecuaia , de unde rezult estimatorul 1

    2n

    ii

    n X=

    + = ( )1 21

    1, , ,2 2

    n

    n ni

    iXX X X X

    n

    == = .

    Avem ( )( ) ( )1 21

    1, , ,2

    n

    n n ii

    M X X X M Xn

    =

    = = ( )1 1 22 2

    M X = = , deci estimatorul

    este nedeplasat. Cum ( ) ( )2 20

    M X x f x dx

    = = 3

    20

    xx e dx

    =2( )2 3 2 2

    0

    4 3! 6yy e dy = = = obinem ( ) ( ) ( )2 2D X M X M X= =

    2 26 4 2 2 = i ( )( ) ( ) ( )1 2 2 21

    1 1, , ,4 4

    n

    n n ii

    D X X X D X n D Xn n

    =

    = = = 2

    21 24 2 nn n

    = 0 , deci estimatorul este absolut corect. Pentru a calcula eficiena

  • estimatorului, ( )( ) ( )( )(( ))1 2 1 21

    , , ,, , ,n n n n

    n Ie X X X

    D X X X

    = , procedm astfel:

    ( )ln ; ln 2ln Xf X X = = 2

    2 ,X + ( )2

    2 ln ;f X = 2 2

    2 23

    2X X + = ,

    ( ) ( )2 2 2 3ln , 2 2f X XI M M

    = = =

    ( )2 3 2 3 22 2 2 2 22M X + = + = ,

    ( )( ) ( )( )2

    1 2 2

    2, , , 1

    2n nn

    e X X Xn

    = ,= aadar, estimatorul este eficient. Pentru selecia dat

    estimaia este ( )1 21

    1 54, , , 1,82 30

    n

    n n ii

    X X X Xn

    =

    = = =

    Nr. saci 5 10 10 11 8 10 6 4

    4. Se consider c greutatea unor saci cu cafea are o repartiie normal cu dispersia 12. Cntrind la ntmplare 64 saci se obin greutile (n kg):

    Greutatea 82 80 81 77 78 79 80,5 78,5 S se construiasc intervalul de ncredere cu o probabilitate de 0,98 pentru greutatea medie. Cum este corect s se scrie pe sac: 80 kg 2% sau 80 kg 3% ?

    i m greutateRezolvare: Fie X greutatea unui sac a medie. Avem

    ( ) ( )12, ~ 0,1X mX Z Nn

    ( )64,n D= = = i = 0,98P Z < < = . Cum ( ) ( ) ( ) ( )2 1F F = 0,98P Z F < < = rezult =

    1 1,982

    F = = ( ) 2,33= 1 0,99F

    Din inegalitatea 2,33 Zn < = obinem intervalul cutat 2,33

    X m <

    2,33X m Xn n

    2,33 . Cum < < + 79,34375X = se o tervalul bine in( )78,3348; 80,35267I = . Intervalul dat de inscripionarea 80 2% este ( ) ( )80 0,02 80; 80 8J = + el d scr 80 3% este (

    0,02 0 78,4; 81,6= , iar c iat de in pionarea ) ( )80 0,03 80; 80 0,03 80 77,6; 82,4H = + = , cum I H i I J corect este

    inscripionarea 80 kg 3%