Statistica analitica

50
Statistica analitica Statistica analitica

Transcript of Statistica analitica

Page 1: Statistica analitica

Statistica analiticaStatistica analitica

Page 2: Statistica analitica

ProbabilitatiProbabilitati

• Probabilitatea unui eveniment specificat Probabilitatea unui eveniment specificat este fractiunea sau proportia din toate este fractiunea sau proportia din toate evenimentele posibile ale evenimentului evenimentele posibile ale evenimentului specificat intr-o succesiune aproape specificat intr-o succesiune aproape nelimitata a probelor in conditii similare.nelimitata a probelor in conditii similare.

• Probabilitatea unui eveniment nu poate Probabilitatea unui eveniment nu poate fi mai mare de 1 (100%) sau mai mica fi mai mare de 1 (100%) sau mai mica decat 0 (0%).decat 0 (0%).

Page 3: Statistica analitica

AplicatiiAplicatii

• Valorile probabile intr-o populatie Valorile probabile intr-o populatie sunt distribuite intr-o maniera sunt distribuite intr-o maniera definita care poate fi folosita pentru definita care poate fi folosita pentru a analiza populatia.a analiza populatia.

• Valorile probabile care nu urmeaza o Valorile probabile care nu urmeaza o distributie pot fi analizate folosind distributie pot fi analizate folosind metode neparametrice. metode neparametrice.

Page 4: Statistica analitica

TipuriTipuri

• Cele mai uzuale distributii de Cele mai uzuale distributii de probabilitate sunt:probabilitate sunt:

a. distributia binomialaa. distributia binomiala

b. distributia normalab. distributia normala

c. distributia “t”c. distributia “t”

d. distributia d. distributia 22ַאַא (Chi)(Chi)

Page 5: Statistica analitica

CalculCalcul

• Probabilitatea unui eveniment este Probabilitatea unui eveniment este determinata de formula:determinata de formula:

Pr (A) = n/NPr (A) = n/NPr (A) = probabilitatea evenimentului APr (A) = probabilitatea evenimentului An = nr. de cate ori evenimentul A s-a n = nr. de cate ori evenimentul A s-a

produsprodusN = nr. de cate ori evenimentul A este N = nr. de cate ori evenimentul A este

posibil sa se produca (nr. total de posibil sa se produca (nr. total de evenimente posibile)evenimente posibile)

Page 6: Statistica analitica

Reguli de calcul a Reguli de calcul a probabilitatilorprobabilitatilor

• Regula aditiva: daca avem cel putin Regula aditiva: daca avem cel putin doua evenimente mutual exclusive doua evenimente mutual exclusive sau “disjuncte” (realizarea unuia sau “disjuncte” (realizarea unuia inseamna automat nerealizarea inseamna automat nerealizarea celuilalt) atunci probabilitatea lui A celuilalt) atunci probabilitatea lui A sau B se calculeaza prin insumarea sau B se calculeaza prin insumarea probabilitatilor fiecarui eveniment.probabilitatilor fiecarui eveniment.

• Calcul: Pr(A sau B)=Pr(A)+Pr (B)Calcul: Pr(A sau B)=Pr(A)+Pr (B)

Page 7: Statistica analitica

Reguli de calcul a Reguli de calcul a probabilitatilorprobabilitatilor

• Regula multiplicativa: se aplica in Regula multiplicativa: se aplica in situatia a 2 sau mai multe situatia a 2 sau mai multe evenimente independente care se evenimente independente care se produc concomitent si consta in produc concomitent si consta in multiplicarea probabilitatilor multiplicarea probabilitatilor individuale ale evenimentelor.individuale ale evenimentelor.

• Calcul: Pr(A si B)=Pr(A)xPr(B)Calcul: Pr(A si B)=Pr(A)xPr(B)

Page 8: Statistica analitica

Ipoteza nulaIpoteza nula

• HH0 0 este ipoteza care postuleaza faptul este ipoteza care postuleaza faptul ca esantioanele sau populatiile pe ca esantioanele sau populatiile pe care le avem de comparat in cadrul care le avem de comparat in cadrul unui studiu, experiment sau test sunt unui studiu, experiment sau test sunt similare, sau cu alte cuvinte, orice similare, sau cu alte cuvinte, orice diferenta este atribuita sansei si nu diferenta este atribuita sansei si nu unui anumit factor.unui anumit factor.

Page 9: Statistica analitica

Aplicatii si caracteristiciAplicatii si caracteristici

• Ipoteza nula postuleaza absenta unor Ipoteza nula postuleaza absenta unor deosebiri care pot aparea in orice deosebiri care pot aparea in orice problema de comparare statistica.problema de comparare statistica.

• Este folosita pentru a defini semnificatia Este folosita pentru a defini semnificatia diferentei. Semnificatia diferentei, numita diferentei. Semnificatia diferentei, numita si semnificatie statistica, este concluzia ca si semnificatie statistica, este concluzia ca diferenta intre esantioane, populatii sau diferenta intre esantioane, populatii sau ambele, este datorata unor factori altora ambele, este datorata unor factori altora decat sansa.decat sansa.

• Diferenta semnificativa apare cand ipoteza Diferenta semnificativa apare cand ipoteza nula este respinsa. nula este respinsa.

Page 10: Statistica analitica

• Cand ipoteza nula este respinsa, cel putin Cand ipoteza nula este respinsa, cel putin una din ipotezele alternative este una din ipotezele alternative este acceptata, deci diferenta poate fi explicata acceptata, deci diferenta poate fi explicata prin alt factor decat sansa.prin alt factor decat sansa.

• Cand nici o diferenta nu poate fi sustinuta Cand nici o diferenta nu poate fi sustinuta intre 2 populatii, inseamna ca se accepta intre 2 populatii, inseamna ca se accepta ipoteza nula, dar nu inseamna ca mediile ipoteza nula, dar nu inseamna ca mediile populatiilor sunt identice.populatiilor sunt identice.

• Valoarea probabilitatii pentru care diferenta Valoarea probabilitatii pentru care diferenta se datoreaza numai sansei se numeste nivel se datoreaza numai sansei se numeste nivel de semnificatie. Daca el este de maximum de semnificatie. Daca el este de maximum 5% atunci ipoteza nula este respinsa si o 5% atunci ipoteza nula este respinsa si o ipoteza alternativa este acceptata; spunem ipoteza alternativa este acceptata; spunem ca diferenta este statistic semnificativa. ca diferenta este statistic semnificativa.

Page 11: Statistica analitica

• Nivelul de semnificatie se noteaza cu Nivelul de semnificatie se noteaza cu αα sau p-value si este ales de sau p-value si este ales de cercetator a priori.cercetator a priori.

• In orice procedeu de comparare se In orice procedeu de comparare se pot emite 2 tipuri de erori:pot emite 2 tipuri de erori:

• Eroarea de speta I care reprezinta Eroarea de speta I care reprezinta decizia de a respinge ipoteza nula decizia de a respinge ipoteza nula cand ea este adevarata;cand ea este adevarata;

• Eroarea de spata aII-a care Eroarea de spata aII-a care reprezinta decizia de a accepta reprezinta decizia de a accepta ipoteza nula cand aceasta este falsa.ipoteza nula cand aceasta este falsa.

Page 12: Statistica analitica

• Probabilitatile erorilor asociate sunt:Probabilitatile erorilor asociate sunt:Pr (respHPr (respH00/H/H00=adevarat)==adevarat)=αα=riscul erorii de =riscul erorii de

speta Ispeta IPr(acceptHPr(acceptH00/H/H00=fals)==fals)=ββ=riscul erorii de speta =riscul erorii de speta

aII-aaII-a1- 1- ββ = puterea testului = puterea testului• Pe baza acestei interpretari, in spatiul Pe baza acestei interpretari, in spatiul

esantioanelor multimea valorilor posibile esantioanelor multimea valorilor posibile calculate se divide in 2 intervale:calculate se divide in 2 intervale:

• Intervalul de acceptare sau “intervalul critic” Intervalul de acceptare sau “intervalul critic” reprezinta multimea valorilor pentru care reprezinta multimea valorilor pentru care daca o valoare a statisticii calculate se daca o valoare a statisticii calculate se inscrie printre valorile sale, se accepta inscrie printre valorile sale, se accepta ipoteza nula.ipoteza nula.

• Intervalul de respingere reprezinta multimea Intervalul de respingere reprezinta multimea valorilor pentru care daca o valoare a valorilor pentru care daca o valoare a statisticii calculate prin test se inscrie printre statisticii calculate prin test se inscrie printre valorile sale se respinge ipoteza nula.valorile sale se respinge ipoteza nula.

Page 13: Statistica analitica

• Diferentele statistic semnificative pot Diferentele statistic semnificative pot sa nu fie semnificative clinic, si sa nu fie semnificative clinic, si diferentele clinic importante pot sa diferentele clinic importante pot sa nu fie statistic semnificative.nu fie statistic semnificative.

• Ipoteza nula poate fi testata fie prin Ipoteza nula poate fi testata fie prin test unilateral “one-tailed test” sau test unilateral “one-tailed test” sau bilateral “two-tailed test”bilateral “two-tailed test”

Page 14: Statistica analitica

Testul unilateralTestul unilateral

• Este acel test pentru care intervalul Este acel test pentru care intervalul de respingere este format (dupa de respingere este format (dupa distributia normala) dintr-o singura distributia normala) dintr-o singura coada stanga sau dreapta testul fiind coada stanga sau dreapta testul fiind unilateral stang sau drept.unilateral stang sau drept.

• Este folosit pentru a testa o ipoteza Este folosit pentru a testa o ipoteza nula pentru care ipoteza alternativa nula pentru care ipoteza alternativa este directionata, comparatia este directionata, comparatia facandu-se intr-un singur sens , si facandu-se intr-un singur sens , si este mai puternic ca un test bilateral.este mai puternic ca un test bilateral.

Page 15: Statistica analitica

Testul bilateralTestul bilateral

• Este acel test pentru care intervalul de Este acel test pentru care intervalul de respingere este format din 2 “cozi”-in respingere este format din 2 “cozi”-in stanga si in dreapta curbeistanga si in dreapta curbei

• Este folosit pentru a testa o ipoteza nula Este folosit pentru a testa o ipoteza nula nefiind necesara nici o presupunere nefiind necesara nici o presupunere privind ipoteza alternativaprivind ipoteza alternativa

• Se folosesc cand generam ipotezele Se folosesc cand generam ipotezele alternative si sunt mai utilizate in alternative si sunt mai utilizate in comparatie cu testele unilateralecomparatie cu testele unilaterale

Page 16: Statistica analitica

CalculCalcul

• HH00:P:P11-P-P00=0 sau P=0 sau P11=P=P00

• HHaa:P:P11-P-P00=0 sau P=0 sau P11=P=P00

Unde PUnde P11 este probabilitatea este probabilitatea caracteristicii studiate in esantion, iar caracteristicii studiate in esantion, iar PP0 0 este probabilitatea aceleiasi este probabilitatea aceleiasi caracteristici in populatie sau o caracteristici in populatie sau o probabilitate teoretica sau din probabilitate teoretica sau din literatura.literatura.

Page 17: Statistica analitica

Tabele de contingenta si grade Tabele de contingenta si grade de libertatede libertate

• Reprezinta o clasificare a datelor in functie Reprezinta o clasificare a datelor in functie de 2 criterii in cadrul carora datele sunt in de 2 criterii in cadrul carora datele sunt in continuare divizate in 2 sau mai continuare divizate in 2 sau mai multecategorii discrete si mutual exclusive.multecategorii discrete si mutual exclusive.

• Tabelul de contingenta in care sunt mai Tabelul de contingenta in care sunt mai mult de 2 categorii pentru fiecare din cele mult de 2 categorii pentru fiecare din cele 2 criterii este numit “tabelul rxc”.2 criterii este numit “tabelul rxc”.

• Un tabel de contingenta in care avem Un tabel de contingenta in care avem numai 2 categorii pentru fiecare din cele 2 numai 2 categorii pentru fiecare din cele 2 criterii de grupare este numit “tabelul 2x2”criterii de grupare este numit “tabelul 2x2”

Page 18: Statistica analitica

AplicatiiAplicatii

• Este o metoda simpla de prezentare Este o metoda simpla de prezentare a datelor si mult folosita cand a datelor si mult folosita cand aplicam testul chi patrat sau alte aplicam testul chi patrat sau alte teste neparametrice.teste neparametrice.

• Tabelul 2x2 se foloseste in domeniul Tabelul 2x2 se foloseste in domeniul epidemiologiei.epidemiologiei.

Page 19: Statistica analitica

Grade de libertateGrade de libertate

• Este un numar legat de efectivul valorilor Este un numar legat de efectivul valorilor dintr-o serie sau o distributie; el poate fi in dintr-o serie sau o distributie; el poate fi in mod liber atribuit cand suma valorilor este mod liber atribuit cand suma valorilor este fixata.fixata.

• Intr-un tabel de contingenta, gradele de Intr-un tabel de contingenta, gradele de libertate reprezinta numarul celulelor din libertate reprezinta numarul celulelor din tabel carora li se pot atribui in mod liber tabel carora li se pot atribui in mod liber valori, presupunand totalul si valorile valori, presupunand totalul si valorile marginale stabilite.marginale stabilite.

• Daca valorile din aceste celule au fost Daca valorile din aceste celule au fost stabilite, valorile tuturor celulelor ramase stabilite, valorile tuturor celulelor ramase din tabel sunt determinate in mod automat.din tabel sunt determinate in mod automat.

Page 20: Statistica analitica

Aplicatie si calculAplicatie si calcul• In cadrul unor distributii de probabilitate, In cadrul unor distributii de probabilitate,

cum ar fi distributia “t” si distributia “cum ar fi distributia “t” si distributia “ 22ַאַא “ “

valorile probabilitatilor de respingere a valorile probabilitatilor de respingere a ipotezei nule variaza in functie de numarul ipotezei nule variaza in functie de numarul de grade de libertate ale esantionului.de grade de libertate ale esantionului.

• Calcul: cand distributia are fie o singura Calcul: cand distributia are fie o singura linie, fie o singura coloana, numarul de linie, fie o singura coloana, numarul de grade de libertate este determinat prin grade de libertate este determinat prin formula: df=c-1, daca r=1 sau df=r-1, formula: df=c-1, daca r=1 sau df=r-1, daca c=1daca c=1

• Cand tabelul are cel putin 2 linii si/sau cel Cand tabelul are cel putin 2 linii si/sau cel putin 2 coloane, nr. de grade de libertate putin 2 coloane, nr. de grade de libertate este determinat de formula: df=(r-1)x(c-1)este determinat de formula: df=(r-1)x(c-1)

Page 21: Statistica analitica

Distributia unui esantion de 100 Distributia unui esantion de 100 nou-nascuti in functie de sex si de nou-nascuti in functie de sex si de mediul de rezidentamediul de rezidenta

Criteriul A (sex)Criteriul A (sex)

Criteriul B Criteriul B (mediu)(mediu)

MasculinMasculin Feminin Feminin TotalTotal

UrbanUrban a (21)a (21) b (19)b (19) a+b (40)a+b (40)

RuralRural c (32)c (32) d (28)d (28) c+d (60)c+d (60)

TotalTotal a+c (53)a+c (53) b+d (47)b+d (47) n (100)n (100)

Page 22: Statistica analitica

Distributia binomialaDistributia binomiala• Este acea distributie a rezultatelor Este acea distributie a rezultatelor

obtinute in cadrul unui experiment, obtinute in cadrul unui experiment, cand acestea au numai valori discrete cand acestea au numai valori discrete si mutual exclusive.si mutual exclusive.

• Aplicatii: este folosita cand ne referim Aplicatii: este folosita cand ne referim la probabilitatea a 2 rezultate mutual la probabilitatea a 2 rezultate mutual exclusive intr-un numar cunoscut de exclusive intr-un numar cunoscut de probe. Probabilitatea fiecaruia dintre probe. Probabilitatea fiecaruia dintre cele 2 rezultate este aceeasi in fiecare cele 2 rezultate este aceeasi in fiecare proba, dar rezultatul fiecarei probe este proba, dar rezultatul fiecarei probe este independent de rezultatul altei probe.independent de rezultatul altei probe.

Page 23: Statistica analitica

CalculCalcul• Pentru o distributie binomiala, probabilitatea este Pentru o distributie binomiala, probabilitatea este

data de formula:data de formula:f(x) =[n!/x!(n-x)!]pf(x) =[n!/x!(n-x)!]pxxqqn-xn-x

f(x)= probabilitatea obtinerii valorii x in probef(x)= probabilitatea obtinerii valorii x in probep=probabilitatea unuia din cele 2 rezultate posibile p=probabilitatea unuia din cele 2 rezultate posibile

(un succes) intr-o singura proba(un succes) intr-o singura probaq=probabilitatea celuilalt rezultat posibil (un esec) q=probabilitatea celuilalt rezultat posibil (un esec)

intr-o singura probaintr-o singura proban=nr. total de probe din cadrul experimentuluin=nr. total de probe din cadrul experimentuluix=nr. de succese obtinute in cadrul unui x=nr. de succese obtinute in cadrul unui

experiment de n probeexperiment de n proben-x=numarul de esecuri obtinute in cadrul aceluiasi n-x=numarul de esecuri obtinute in cadrul aceluiasi

experimentexperiment!=semnul factorial !=semnul factorial

Page 24: Statistica analitica

• Distributia binomiala se refera deci la o Distributia binomiala se refera deci la o variabila aleatorie discreta x pentru care variabila aleatorie discreta x pentru care valoarea medie si dispersia sunt date de valoarea medie si dispersia sunt date de formulele:formulele:

µµxx=np=np22ּסּס =npq=npq

Pentru diverse valori ale lui n si p se obtinPentru diverse valori ale lui n si p se obtindiverse curbe reprezentative pentrudiverse curbe reprezentative pentruprobabilitatile f(x).probabilitatile f(x).Pentru np>10 si nq>10, curbele devinPentru np>10 si nq>10, curbele devin

insuficient de simetrice in jurul valorii lui µinsuficient de simetrice in jurul valorii lui µx x si sesi sepoate asimila distributia binomiala cu o poate asimila distributia binomiala cu o

distributiedistributienormala. normala.

Page 25: Statistica analitica

• Daca in cazul distributiei binomiale Daca in cazul distributiei binomiale consideram n foarte mare si probabilitatea p consideram n foarte mare si probabilitatea p foarte mica, astfel ca produsul np=foarte mica, astfel ca produsul np=θθ=x devin:=x devin:

f(x)=ef(x)=e- - θθ. . ΘΘxx/x! probabilitati care conduc la /x! probabilitati care conduc la distributia Poisson. Se demonstreaza ca distributia Poisson. Se demonstreaza ca valoarea medie si dispersia pentru aceasta valoarea medie si dispersia pentru aceasta distributie sunt: µdistributie sunt: µxx= = θθ

22ּסּס xx= = θθ

Prin cresterea lui Prin cresterea lui θθ se obtin curbe cat mai se obtin curbe cat maisimetrice, astfel pentru simetrice, astfel pentru θθ>20 sau >20 sau θθ=20, =20,

distributiadistributialui Poisson poate fi asimilata cu o distributielui Poisson poate fi asimilata cu o distributienormala. normala.

Page 26: Statistica analitica

Distributia normala (Gauss Distributia normala (Gauss Laplace)Laplace)

• Este o distributie teoretica, continua, Este o distributie teoretica, continua, simetrica, unimodala, si poate, teoretic, simetrica, unimodala, si poate, teoretic, sa varieze intre – infinit si +infinit.sa varieze intre – infinit si +infinit.

• Curba distributiei normale are doua cozi Curba distributiei normale are doua cozi simetrice si este determinata prin media simetrice si este determinata prin media µ si deviatia standard a populatiei µ si deviatia standard a populatiei ּסּס..

• Media, mediana si modulul unei populatii Media, mediana si modulul unei populatii distribuite normal sunt egale.distribuite normal sunt egale.

Page 27: Statistica analitica

AplicatiiAplicatii

• Poate fi folosita pentru a studia multe Poate fi folosita pentru a studia multe populatii si esantioane, esantioanele populatii si esantioane, esantioanele trebuie sa fie de minimum 30 de trebuie sa fie de minimum 30 de cazuri.cazuri.

• Distributia normala si aproximarea Distributia normala si aproximarea normala constituie bazele unui normala constituie bazele unui numar de teste analitice, cum ar fi numar de teste analitice, cum ar fi testul t sau chi patrat.testul t sau chi patrat.

Page 28: Statistica analitica

Raportul critic sau scorul zRaportul critic sau scorul z

• Este numarul deviatiilor standard ce Este numarul deviatiilor standard ce separa un indicator calculat in esantion de separa un indicator calculat in esantion de parametrul corespunzator intr-o populatie parametrul corespunzator intr-o populatie normala.normala.

• Cresterea raportului critic corespunde Cresterea raportului critic corespunde descresterii probabilitatii de acceptare a descresterii probabilitatii de acceptare a ipotezei nuleipotezei nule

• Pot fi calculate si listate proportiile Pot fi calculate si listate proportiile populatiei in interiorul intervalului si/sau in populatiei in interiorul intervalului si/sau in afara intervalului.afara intervalului.

Page 29: Statistica analitica

• Intr-o populatie distribuita normal, Intr-o populatie distribuita normal, aproximativ 68% din populatie este aproximativ 68% din populatie este situata in interiorul unui raport critic, situata in interiorul unui raport critic, aproximativ 95% din populatie este aproximativ 95% din populatie este situata in interiorul a 2 rapoarte critice situata in interiorul a 2 rapoarte critice ale mediei si in jur de 99,7% este ale mediei si in jur de 99,7% este situata in interiorul a 3 rapoarte critice situata in interiorul a 3 rapoarte critice mediei.mediei.

• In esantioanele numeroase, raportul In esantioanele numeroase, raportul critic este folosit pentru a calcula critic este folosit pentru a calcula intervalele de incredere in jurul mediei intervalele de incredere in jurul mediei de esantion.de esantion.

Page 30: Statistica analitica

CalculCalcul

• z=z=lx-µl/lx-µl/ּסּס

z=raportul criticz=raportul critic

x=valoarea de testatx=valoarea de testat

µ=media populatieiµ=media populatiei

deviatia standard a populatiei=deviatia standard a populatiei=ּסּס

Page 31: Statistica analitica

Testul t (student)Testul t (student)

• Este bazat pe distributia t, distributie Este bazat pe distributia t, distributie care reflecta o mai mare variatie care reflecta o mai mare variatie datorata sansei in comparatie cu datorata sansei in comparatie cu distributia normala.distributia normala.

• Este continua, simetrica, unimodala, Este continua, simetrica, unimodala, variaza de la –infinit la +infinit, este variaza de la –infinit la +infinit, este mult mai larga in comparatie cu mult mai larga in comparatie cu distributia normala.distributia normala.

Page 32: Statistica analitica

• Este utilizata pentru a analiza Este utilizata pentru a analiza esantioane mici.esantioane mici.

• Cand volumele esantioanelor cresc, Cand volumele esantioanelor cresc, distributia t se apropie de distributia distributia t se apropie de distributia normala, astfel ca pentru un numar normala, astfel ca pentru un numar infinit de grade de libertate cele 2 infinit de grade de libertate cele 2 distributii sunt identice si valorile distributii sunt identice si valorile critice ale lui t sunt egale cu raportul critice ale lui t sunt egale cu raportul critic al distributiei normale.critic al distributiei normale.

Page 33: Statistica analitica

Testul t pentru un esantion Testul t pentru un esantion micmic

• Testul t pentru un singur esantion Testul t pentru un singur esantion mic compara o singura medie (x) a mic compara o singura medie (x) a esantionului cu media populatiei.esantionului cu media populatiei.

Page 34: Statistica analitica

Aplicatii si caracteristiciAplicatii si caracteristici• Sunt folosite pentru a evalua ipoteza nula pentru Sunt folosite pentru a evalua ipoteza nula pentru

variabile cantitative, pentru esantioane de volum variabile cantitative, pentru esantioane de volum mai mic de 30 de cazuri.mai mic de 30 de cazuri.

• Sunt utilizate in analiza pentu care SD din Sunt utilizate in analiza pentu care SD din esantioane sunt substituite ca estimatii pentru SD esantioane sunt substituite ca estimatii pentru SD din populatii.din populatii.

• Valoarea probabilitatii de respingere a ipotezei Valoarea probabilitatii de respingere a ipotezei nule, cand aceasta este adevarata nule, cand aceasta este adevarata αα=p-value =p-value este obtinuta din tabela t corespunzatoare lui este obtinuta din tabela t corespunzatoare lui df=n-1 grade de libertate.df=n-1 grade de libertate.

• In cazul esantioanelor mici, sub 30 de cazuri, In cazul esantioanelor mici, sub 30 de cazuri, distributia t este folosita pentru a calcula distributia t este folosita pentru a calcula intervalele de incredere in jurul mediei intervalele de incredere in jurul mediei esantioniului. esantioniului.

Page 35: Statistica analitica

CalculCalcul

• Valoarea calculata a testului pentru compararea Valoarea calculata a testului pentru compararea mediei esantionului cu media populatiei este mediei esantionului cu media populatiei este determinata prin formula:determinata prin formula:

• t(df)=t(df)=lx-µl/(SD/√n)lx-µl/(SD/√n)• t(df)=valoarea calculata a testului la df. gr. de t(df)=valoarea calculata a testului la df. gr. de

libertatelibertate• df=nr. de grade de libertatedf=nr. de grade de libertate• x=valoarea medie a esantionuluix=valoarea medie a esantionului• µ=media populatieiµ=media populatiei• SD=deviatia standardSD=deviatia standard• n=volumul esantionuluin=volumul esantionului• Numitorul ecuatiei se numeste eroarea standard a Numitorul ecuatiei se numeste eroarea standard a

mediei esantionului.mediei esantionului.

Page 36: Statistica analitica

Testul t pentru esantioane Testul t pentru esantioane independenteindependente

• Compara valori medii a 2 esantioane Compara valori medii a 2 esantioane mici.mici.

• Utilitatea si restrictiile sunt aceleasi Utilitatea si restrictiile sunt aceleasi cu exceptia ca esantioanele trebuie cu exceptia ca esantioanele trebuie sa fie sub 30 de cazuri.sa fie sub 30 de cazuri.

• Este nepotrivit cand avem de Este nepotrivit cand avem de comparat mai multe valori medii.comparat mai multe valori medii.

Page 37: Statistica analitica

CalculCalcul

• t(df)=t(df)=lx-yl/SDp√1/nlx-yl/SDp√1/n11+1/n+1/n22

• SDp=√SDp=√ΣΣ(x(xii-x)-x)22+ + ΣΣ(y(yii-y)-y)22/(n/(n11-1)+(n-1)+(n22-1)-1)

• SDp=deviatia standard ponderata a SDp=deviatia standard ponderata a celor 2 esantioanecelor 2 esantioane

Page 38: Statistica analitica

Testul t pentru esantioane Testul t pentru esantioane perechiperechi

• Compara valorile medii a 2 esantioane Compara valorile medii a 2 esantioane perechi.perechi.

• In acest caz numarul de perechi In acest caz numarul de perechi trebuie sa fie sub 30.trebuie sa fie sub 30.

• t(df)=d /(SDp/t(df)=d /(SDp/√n)√n)• SDp= √SDp= √ΣΣ(d(dii-d)-d)22/(n-1)/(n-1)

• ddii=diferentele in cadrul fiecarei perechi=diferentele in cadrul fiecarei perechi• d=valoarea medie a diferentelord=valoarea medie a diferentelor

Page 39: Statistica analitica

• Numitorul testului t pe perechi este Numitorul testului t pe perechi este eroarea standard a diferentei mediilor.eroarea standard a diferentei mediilor.

• Valoarea calculata a testului t este Valoarea calculata a testului t este folosita pentru a stabili probabilitatea folosita pentru a stabili probabilitatea ca diferenta intre esantioanele perechi, ca diferenta intre esantioanele perechi, la gradele de libertate respective sa se la gradele de libertate respective sa se datoreze sau nu sansei.datoreze sau nu sansei.

Page 40: Statistica analitica

Eroarea standard si limitele de Eroarea standard si limitele de incredereincredere

• Este bazata pe un esantion al populatiei si Este bazata pe un esantion al populatiei si este o estimatie a deviatiei standard a este o estimatie a deviatiei standard a masuratorilor pentru populatie.masuratorilor pentru populatie.

• Este o masura a acuratetei mediei Este o masura a acuratetei mediei esantionului ca o estimatie a mediei esantionului ca o estimatie a mediei populatiei.populatiei.

• Este raportul dintre deviatia standard si Este raportul dintre deviatia standard si radical de ordinul 2 din volumul radical de ordinul 2 din volumul esantionului.esantionului.

• Este folosita pentru a construi limitele de Este folosita pentru a construi limitele de incredere in jurul mediei esantionului.incredere in jurul mediei esantionului.

• Este folosita la testul t.Este folosita la testul t.• SEM=SD/SEM=SD/√n unde n=nr. de obs. in esantion√n unde n=nr. de obs. in esantion

Page 41: Statistica analitica

Limitele de incredere ale valorii Limitele de incredere ale valorii mediimedii

• Definesc valorile probabile pentru un Definesc valorile probabile pentru un parametru al populatiei, pe baza volumului parametru al populatiei, pe baza volumului esantionului si a valorii erorii standard.esantionului si a valorii erorii standard.

• Intervalele de incredere sunt exprimate in Intervalele de incredere sunt exprimate in termenii probabilitatii bazate pe eroarea termenii probabilitatii bazate pe eroarea αα..

• Un interval de incredere (1- Un interval de incredere (1- αα), exprima ), exprima faptul ca probabilitatea ca parametrul faptul ca probabilitatea ca parametrul populatiei sa se gaseasca in intervalul de populatiei sa se gaseasca in intervalul de incredere este 1- incredere este 1- αα, iar probabilitatea ca , iar probabilitatea ca parametrul populatiei sa se gaseasca in parametrul populatiei sa se gaseasca in afara intervalului de incredere este afara intervalului de incredere este αα..

Page 42: Statistica analitica

• Limitele de incredere ale mediei Limitele de incredere ale mediei populatiei (populatiei (µ) definesc intervalul de µ) definesc intervalul de incredere pentru media populatiei pe incredere pentru media populatiei pe baza mediei esantionului.baza mediei esantionului.

• Pentru esantioane mai mari sau egale Pentru esantioane mai mari sau egale cu 30 limitele de incredere sunt cu 30 limitele de incredere sunt bazate pe raportul critic bazate pe raportul critic corespunzator probabilitatii asociate.corespunzator probabilitatii asociate.

• Pentru esantioane mici sub 30 limitele Pentru esantioane mici sub 30 limitele de incredere sunt bazate pe valorile de incredere sunt bazate pe valorile lui t din tabele, corespunzator lui t din tabele, corespunzator numarului de grade de libertate si numarului de grade de libertate si probabilitatii asociate. probabilitatii asociate.

Page 43: Statistica analitica

UtilitateUtilitate

• Sunt folosite pentru a estima media Sunt folosite pentru a estima media populatiei pe baza mediei populatiei pe baza mediei esantionului extras din populatie.esantionului extras din populatie.

• Cel mai des folosite sunt limitele de Cel mai des folosite sunt limitele de incredere de 95%, care indica faptul incredere de 95%, care indica faptul ca probabilitatea ca valoarea mediei ca probabilitatea ca valoarea mediei necunoscuta din populatie sa se afle necunoscuta din populatie sa se afle intre aceste limite este de 95%, iar in intre aceste limite este de 95%, iar in afara lor este de 5%.afara lor este de 5%.

Page 44: Statistica analitica

CalculCalcul

• Pentru esantioane mariPentru esantioane mari

Limitele de incredere (1- Limitele de incredere (1- αα)=x±z)=x±zααSEMSEM

• Pentru esantioane miciPentru esantioane mici

Limitele de incredere Limitele de incredere (1- (1- αα)=x±t)=x±tdf,df,ααSEMSEM

Page 45: Statistica analitica

Testul chi patrat Testul chi patrat 22אא

• Compara o distributie de frecvente absolute Compara o distributie de frecvente absolute observate cu o distributie teoretica observate cu o distributie teoretica (asteptata) de frecvente absolute pe baza (asteptata) de frecvente absolute pe baza distributiei de probabilitate chi patrat.distributiei de probabilitate chi patrat.

• Este o distributie continua, simetrica si se Este o distributie continua, simetrica si se bazeaza pe aproxiamtia normala a bazeaza pe aproxiamtia normala a distributiei binomiale. Distributia chi patrat distributiei binomiale. Distributia chi patrat cu 1 grad de libertate este identica cu cu 1 grad de libertate este identica cu distributia patratului raportului critic.distributia patratului raportului critic.

Page 46: Statistica analitica

Aplicatii si caracteristiciAplicatii si caracteristici

• Testul chi patrat de tip rxc este folosit pentru a Testul chi patrat de tip rxc este folosit pentru a compara o distributie observata cu o distributie compara o distributie observata cu o distributie teoretica sau compara 2 sau mai multe distributii teoretica sau compara 2 sau mai multe distributii observate.observate.

• Categoriile de date folosite trebuie sa fie mutual Categoriile de date folosite trebuie sa fie mutual exclusive si discrete.exclusive si discrete.

• Trebuie folosite numai valori absolute.Trebuie folosite numai valori absolute.• Frecventele teoretice trebuie sa fie mai mari decat 5, Frecventele teoretice trebuie sa fie mai mari decat 5,

cele observate pot fi mai mici decat 5.cele observate pot fi mai mici decat 5.• Valorile probabilitatii pentru respingerea ipotezei nule Valorile probabilitatii pentru respingerea ipotezei nule

sunt obtinute din tabele speciale pentru distributia chi sunt obtinute din tabele speciale pentru distributia chi patrat corespunzator numarului de grade de libertate.patrat corespunzator numarului de grade de libertate.

Page 47: Statistica analitica

Corectia YatesCorectia Yates

• Deoarece distributia chi patrat este Deoarece distributia chi patrat este bazata pe aproximatia normala a bazata pe aproximatia normala a distributiei binomiale, se impune o distributiei binomiale, se impune o corectie de continuitate numita corectie de continuitate numita corectia Yates, aceasta consta intr-o corectia Yates, aceasta consta intr-o modificare in formula de calcul a modificare in formula de calcul a testului chi patrattestului chi patrat

• Corectia Yates se foloseste pentru Corectia Yates se foloseste pentru esantioane mici si scade valoarea lui esantioane mici si scade valoarea lui chi patrat, deci scade probabilitatea chi patrat, deci scade probabilitatea respingerii ipotezei nule. respingerii ipotezei nule.

Page 48: Statistica analitica

CalculCalcul

• 22אאcc(df)=(df)=ΣΣ (|O (|Oii-E-Eii|-1/2)|-1/2)22/E/Eii

• 22א א cc(df)=valoarea calculata a testului (df)=valoarea calculata a testului

chi patrat cu corecta Yateschi patrat cu corecta Yates• OOii=frecventele absolute observate din =frecventele absolute observate din

fiecare celula a tabeluluifiecare celula a tabelului• EEii=frecventele teoretice =frecventele teoretice

corespunzatoare frecventelor observatecorespunzatoare frecventelor observate• ½=corectia yates½=corectia yates

Page 49: Statistica analitica

Testul chi patrat 2x2Testul chi patrat 2x2

• Este un caz particular si se aplica Este un caz particular si se aplica pantru tabelele de contingenta de tip pantru tabelele de contingenta de tip 2x2 si are un grad de libertate.2x2 si are un grad de libertate.

• 22אאcc(1)=n(|ad-bc|-n/2)(1)=n(|ad-bc|-n/2)22/(a+b)(c+d)/(a+b)(c+d)

(a+c)(b+d)(a+c)(b+d)

Page 50: Statistica analitica

Testul McNemarTestul McNemar

• Este un test chi patrat 2x2 specific Este un test chi patrat 2x2 specific pentru compararea esantioanelor pentru compararea esantioanelor perechi.perechi.

• Ipoteza nula care este de testat este Ipoteza nula care este de testat este aceea ca frecventele asteptate pentru aceea ca frecventele asteptate pentru perechile discordante sunt egale.perechile discordante sunt egale.

• Testul are un grad de libertae si se Testul are un grad de libertae si se poate calcula dupa formula:poate calcula dupa formula:

• 22אאcc=(|f-g|-1)=(|f-g|-1)22/f+g unde f si g sunt /f+g unde f si g sunt

valorile perechilor discordantevalorile perechilor discordante