1. 2. 3. 4. 5.
-
Upload
valeria-cojocaru -
Category
Documents
-
view
291 -
download
3
Transcript of 1. 2. 3. 4. 5.
1.Obiectivul proiectului.
In prima parte a acestui proiect am lucrat asupra problemelor descriptive ale statisticii,iar in a doua parte,asupra problemelor statisticii inferential,si anume:am sistematizat si prezentat datele in tabele si grafice;am calculat indicatori ai tendintei central,ai dispersiei,ai asimetriei,boltirii si concentrarii;am estimat parametrii unei populatii;am testat ipoteze;ANOVA,anliza de regresie si corelatie,toate cu scopul obtinerii de informatii necesare fundamentarii unor decizii asupra fenomenului studiat.
Precizez ca am cules datele din Anuarul Statistic al Romaniei 2008,domeniul Educatie,si anume Invatamantul prescolar pe regiuni de dezvoltare si judete,in anul 2007/2008.Am ales aceasta tema deoarece reprezinta o problema actuala din cauza insuficientei de locuri in gradinite,mamele fiind nevoite din timp sa solicite un loc,iar obtinerea lui ramanand totusi nesigura.
Pentru a evita obtinerea unei medii nereprezentative pentru populatie am eliminat macroregiunea Bucuresti-Ilfov. Datele le-am prezentate in Tebelul 1.
Cu scopul observarii si prelucrarii ulterioare,din colectivitatea totala am extras aleator simplu nerepetat un esantion de 20 de inregistrari pe care l-am prezentat in Tabelul 2.
Ca prima variabila categoriala am ales “Regiuni de dezvoltare”,iar pe a doua am obtinut-o prin deducere,efectuand urmatorii pasi:
Am ales variabila numerica “Copii inscrisi”; Am calculat media copiilor inscrisi:
x=∑ x i
n=308417
20=154421 ;
Am recodificat “Copii inscrisi” in doua categorii : { ¿medie ;peste medie ;
Ca variabile numerice am ales “Gradinite de copii” si “Copii inscrisi”,intre ele existand o relatie directa,in sensul ca o crestere a numarului de gradinite determina o crestere a numarului de copii inscrisi.
Tabel 1.INVATAMANTUL PRESCOLAR PE REGIUNI DE DEZVOLTARE SI JUDETE,IN ANUL 2007/2008
Nr. Judetul Regiune de dezvoltare Gradinite de copii Copii inscrisi1. Bihor Nord-Vest 52 197522. Bistrita-Nasaud Nord-Vest 20 118603. Cluj Nord-Vest 59 201704. Maramures Nord-Vest 41 169555. Satu Mare Nord-Vest 25 134576. Salaj Nord-Vest 26 94717. Alba Centru 43 117438. Brasov Centru 69 158149. Covasna Centru 11 866810. Harghita Centru 40 1325411. Mures Centru 80 2176012. Sibiu Centru 50 1459413. Bacau Nord-Est 41 1392014. Botosani Nord-Est 27 1623715. Iasi Nord-Est 64 1871416. Neamt Nord-Est 10 1555017. Suceava Nord-Est 29 2528118. Vaslui Nord-Est 21 1751119. Braila Sud-Est 32 1074320. Buzau Sud-Est 25 1442721. Constanta Sud-Est 104 2072022. Galati Sud-Est 70 1730323. Tulcea Sud-Est 9 845824. Vrancea Sud-Est 19 1088425. Arges Sud-Muntenia 40 1947526. Calarasi Sud-Muntenia 28 924327. Dambovita Sud-Muntenia 20 1479628. Giurgiu Sud-Muntenia 6 716029. Ialomita Sud-Muntenia 21 849730. Prahova Sud-Muntenia 55 2134231. Teleorman Sud-Muntenia 54 1128832. Dorj Sud-VestOltenia 39 2039133. Gorj Sud-VestOltenia 7 1308134. Mehedinti Sud-VestOltenia 14 869835. Olt Sud-VestOltenia 30 1428836. Valcea Sud-VestOltenia 29 1272537. Arad Vest 31 1301438. Caras-Severin Vest 27 955739. Hunedoara Vest 40 1235240. Timis Vest 67 19699- TOTAL: - 1731 650324
2.Crearea bazei de date.
Din colectivitatea totala,cu scopul observarii ,am extras un esantion de 20 de inregistrari pe care l-am prezentat in tabelul de mai jos.
“Regiune de dezvoltatre” si “Nr.copii inscrisi categorial” reprezinta variabilele categoriale,iar “Gradinite de copii” si “Copii inscrisi” variabile numerice.
Tabel 2. INVATAMANTUL PRESCOLAR PE REGIUNI DE DEZVOLTARE SI JUDETE, IN ANUL 2007/2008
Judetul Regiune de dezvoltare
Gradinite de copii
Copii inscrisi
Nr.copii inscrisi categorial
Bihor NV 52 19752 peste medieBistrita-Nasaud NV 20 11860 sub medieCluj NV 59 20170 peste medieMaramures NV 41 16955 peste medieHarghita C 40 13254 sub medieAlba C 43 11743 sub medieSibiu C 50 14594 sub medieBacau NE 41 13920 sub medieBotosani NE 27 16237 peste medieIasi NE 64 18714 peste medieVaslui NE 21 17511 peste medieBuzau SE 25 14427 sub medieArges S 40 19475 peste medieDambovita S 20 14796 sub mediePrahova S 55 21342 peste medieTeleorman S 54 11288 sub medieOlt SV 30 14288 sub medieValcea SV 29 12725 sub medieArad V 31 13014 sub medieHunedoara V 40 12352 sub medieTOTAL: - 782 308417 -
**Datele le-am introdus in editorul de date folosind programul statistic Excell.
3.Descrierea statistica a variabilelor.
a.1) Pentru prima variabila categoriala ‘Regiune de dezvoltare’ determinam proportiile,valoarea dominanta,diagram de structura,giagrama Pareto.
Tabelul de mai jos preznta efectivul ‘n’ dupa variabila categoriala ‘regiune de dezvoltare’(col.2)
Calculam frecventele relative dupa formula:
f i =n i
∑ ni , ∑ f i=1 ,(col.3)
Introducem datele in table. Observam ca valoarea dominanta e 4.
Mai jos am reprezentat diagram de structura.
20%
15%
20%5%
20%
10%
10%
Diagrama de structura 1.
Nord-VestCentruNord-EstSud-EstSud-MunteniaSud-VestVest
Regiune de dezvoltare
Efectivulni
frecventa relativa fi
Nord-Vest 4 0.2Centru 3 0.15Nord-Est 4 0.2Sud-Est 1 0.05Sud-Muntenia 4 0.2Sud-Vest 2 0.1Vest 2 0.1TOTAL: 20 1
Pentru diagrama Pareto,urmam urmatorii pasi:a) Intr-un nou table,sortam dupa frecventa de aparitie in ordine
descrescatoare.(col.2)b) In col.4 calculam efectivul cumulat.
c) In col.3 aplicam formula: N i
∑ N i
∗100;
d) Tabelul ia forma:e)f)
g) Diagrama
Pareto am reprezentat-o mai jos:
Nord-Vest
Nord-Es
t
Sud-M
untenia
Centru
Sud-Vest Vest
Sud-Es
t02468
101214161820
0%10%20%30%40%50%60%70%80%90%100%
Diagrama Pareto 1.
Efectivul niFrecventa cumulata%
Regiune de dezvoltare
Efectivul ni
Frecventa cumulata%
Efectivul cumulate Ni
Nord-Vest 4 20% 4Nord-Est 4 40% 8Sud-Muntenia 4 60% 12Centru 3 75% 15Sud-Vest 2 85% 17Vest 2 95% 19Sud-Est 1 100% 20TOTAL: 20 - -
a.2) Pentru a doua variabila categoriala ‘nr de copii inscrisi categorial’ determinam proportiile,valoarea dominanta,diagram de structura,giagrama Pareto.
Tabelul de mai jos preznta efectivul ‘n’ dupa variabila categoriala ‘Nr de copii inscrisi,categorial’(col.2)
Calculam frecventele relative dupa formula:
f i =n i
∑ ni , ∑ f i=1 ,(col.3)
Introducem datele in tabel. Observam ca valoarea dominanta e 12.
Mai jos am reprezentat diagrama de structura:
40%
60%
Diagrama de structura 2.
peste mediesub medie
Nr de copii inscrisi categorial
Efectivul ni
Frecventa relative fi
peste medie 8 0.4sub medie 12 0.6TOTAL: 20 1
Pentru diagrama Pareto,urmam urmatorii pasi:a) Intr-un nou table,sortam dupa frecventa de aparitie in ordine
descrescatoare.(col.2)b) In col.4 calculam efectivul cumulat.c) In col.3 aplicam formula:
N i
∑ N i
∗100;
d) Tabelul ia forma:
Nr de copii inscrisi categorial
Efectivul ni
Frecventa cumulata%
Efectivul cumulate Ni
peste medie 8 40% 8sub medie 12 100% 20TOTAL: 20 - -
e) Diagrama Pareto am reprezentat-o mai jos:
Frecventa de aparitie Frecventa cumulata%13579
1113151719
0102030405060708090100
Diagrama Pareto 2.
peste mediesub medie
3.b)Pentru variabila numerica ‘nr de gradinite’ calculam nivelul mediu,dispersia,forma distributiei,concentrare si graficele specifice.
1) Pentru sistematizarea datelor,cu scopul prelucrarii,am grupat datele pe 5 intervale egale.Marimea intervalului am stabilit-o urmand urmatorii pasi:
Calculam amplitudinea de variatie:A=xmax-xmin=¿ 64-20=44
Calculam marimea intervalului:
l= Ak =
445 =8.8 ≈ 9
2) Media e valoarea ce ar purta-o fiecare unitate statistica daca distributia ar fi omogena.
Pentru calculul mediei,vom calcula mai intai xi’ dupa formula:
x1’=xi−1+x i
2=20+29
2=24.5
Calculam ¿¿) ; Calculam media dupa formula:
x=∑ x i'∗ni
∑ ni
=80520
=40.25
Interpretare: In medie fiecare judet are 40 de gradinite.
3) Modul este valoarea cea mai frecvent observata in distributie,adica valoarea ce corespunde frecventei maxime
Aflam frecventa maxima: nmax=6 ;
Citim intervalul care-I corespunde: [38;47) Determinam modul prin interpolare in interval:
Mo=x i−1+d∆1
∆1+∆2
unde: x i−1−limita inferioaraa intervalului ;
d – marimea intervalului modal: d=29-20=9 ∆1=ni−ni−1; ∆1=6−3=3 ; ∆2=ni−ni+1 ; ∆2=6−4=2 ;
Mo=38+9* 33+2=43.40
Interpretare:Numarul de gradinite cel mai frecvent intalnit este 43.
Histograma si curba frecventelor.
4) Mediana e acea valoare a caracteristicii unei serii ordonate,pana la care si peste care sunt distribuite in numar egal unitatile colectivitatii: jumatate au valori mai mici ca mediana,iar jumatate din unitati au valori mai mari.
Calculam unitatea mediana:
U Me=∑ ni+12
, pentru (n=20 )<100 ;
Calculam frecventa cumulata crescator Ni↓; Aflam prima frecventa mai mare ca U Me :
(Ni↓=14)>(U Me=10.5) Citim din tabel intervalul ce corespunde (Ni↓=14): [38;47) Calculam media prin interpolare:
Me=x i−1+dU Me−N i−1
ni
;
unde: x i−1−limita inferioaraa intervalului ;
d – marimea intervalului median:
47-38=9;
Me=38+910.5−86=41.75
Interpretare: 50 la suta din regiuni au un numar de gradinite mai mic de 41.75,cealalta jumatate au peste .
5) Quartilele sunt in numar de trei Q1,Q2,Q3 si se defines ca valori ale caracteristicii ce impart volumul colectivitatii in patru parti egale. Se determina dupa relatiile:
Q1=x i−1+dUQ1−N i−1
nQ 1; unde : UQ1=
∑ ni
4;
Q2=Me;
Q3=x i−1+dUQ3−N i−1
nQ3
; unde: UQ3=3∑ ni
4;
Obtinem: Q1=29.75; Q2=41.75; Q3=50.94;
Diagrama box-plot.
20 64
Interpretare: 25 la suta dintre judete au un nr de gradinite de pana la 29.75;jumatate din judete au pana la 41.75;75 la suta dintre judete au un numar de gradinite de pana la 50.94.
6) Mediala este un indicator de pozitie egal cu acel nivel al caracteristicii xi care imparte suma termenilor seriei in doua parti egale.
Calculam unitatea mediala:
U Ml=∑ x i∗¿ni
2=8052
=402.5¿
Aflam (Li=475)>(U Me=402.5¿ ;
Citim intervalul corespunzator : [38;47) Calculam medial prin interpolare:
Ml=x i−1+dU Me−Li−1
x i'∗ni
=38+9 402.5−223255
=44.33
Interpretare:Valoarea care imparte suma termenilor in doua parti egale este 44.33.
7) Dispersia ne arata gradul de imprastiere a valorilor individuale ale unei distributii in jurul valorii central si este datorata influientelor factorilor aleatori.
Se calculeaza ca media aritmetica a patratelor abaterilor individuale fata de media lor:
S2=∑ d i2∗ni
∑ ni
=∑ (x i'¿−x)2∗ni
∑ ni
;¿
S2=2733.7520
=136.69 ;
Interpretare: Nu se interpreteaza!
8) Intervalul mediu de variatie are urmatoarele limite :
x± s={x−sx+s
;
unde: s=√s2=√136.69=11.69
x± s={40.25−11.69=28.5640.25+11.69=51.94
Interpretare: 68.27 la suta dintre judete au in medie intre 28.56 si 51.94 de gradinite.
9) Coeficientu de variatie se calculeaza dupa formula:
γ= sx∗100 ;
γ=11.6940.25
=29.04
Interpretare: Am obtinut (γ=29.04%¿∈ [17% ;35% ] , decimedia este moderat reprezentativa.
10) Asimetria reprezinta o deviatie de la forma simetrica de distributie. Pentru aprecierea asimetriei folosim : x ,Me , Mo :
x=40.25 ;Me=41.75 ;Mo=43.40;
Avem relatia: x<Me<Mo→asimetrie la stinga; Calculam asimetria dupa formula:
As=x−Mo=40.25−43.40=−3.15
Interpretare: Deoarece x este cea mai mica,avem asimetrie negative (As<0),adica o extindere a frecventelor spre stinga.
Coeficientul Yule (Cay) masoara asimetria in functie de pozitia quartilelor(Q1,Q2,Q3). Se calculeaza dupa formula:
Cay=q2−q1q2+q1
=Q1+Q 3−2MeQ 3−Q 1 =
29.75+50.94−2∗41.7550.94−29.75
=−0.13
Interpretare: Am obtinut Cay<0,deci distributia e asimetrica la stinga. Deoarece Cay se apropie de 0.1 reiese ca distributia e moderat asimetrica.
Coeficientul empiric de asimetrie Pearson (Cas) se calculeaza dupa formula:
Cas=Ass
=−3.1511.69
=−0.27
Interpretare: Am obtinut Cas<0,deci distributia e asimetrica la stinga.
11) Boltirea se defineste prin raportatrea unei distributii empirice la distributia
normala sub aspectul variatiei variabilei de distributie x si a frecventei f i¿¿ .
Coeficientul de boltire Pearson(β2):
β2=μ4μ22=
μ4s4
;
μ4=714431.39
20=35721.57
s4=18684.16
β2=35721.5718684.16
=1.91
Interpretare: Am obtinut β2<3,deci distributia e platicurtica.
Coeficientul de boltire Fisher (Y 2) masoara excesul fata de boltire a unei distributii normale:
Y 2=β2−3=1.91−3=−1.09
Interpretare: daca β2<3 ,Y 2<0 ,atunci distributia e platicurtica.
12) Concentrarea arata aglomerarea unitatilor unei colectivitati a unei distributii in jurul unii valori a unei caracteristici de grupare.
Coeficientul de concentrare ∆ M%:
∆ M%= Ml−MeAx
=44.33−41.7565−20
=2.5845
=0.0573
Interpretare: In cazul considerat,mediana fiind egala cu 41.75,iar medial egala cu 44.33,rezulta o abatere mediana-mediala de 2.58. In comparative cu amplitudinea de variatie a carateristicii egala cu 45,∆ M%arata o concentrare slaba a numarului de gradinite pe regiuni si anume de 5.73% din marimea acesteia.
Curba de concentrare Se calculeaza pi si qi dupa formulele:
pi=¿
∑ ¿ ;. qi=Li
∑ xi∗¿ ;
Reprezentam grafic:
13) Calculele le-am prezentat in tabelul de mai jos:
xi ni xi' xi'*ni Ni↓ Li↓ (xi'-x) (x¿¿ i'−x)2∗¿¿ (x¿¿ i'−x)4∗¿¿ pi qi
[20-29) 5 24.5 122.5 5 122.5 -15.75 1240.31 307675.01 0.25 0.15[29-38) 3 33.5 100.5 8 223 -6.75 136.68 6227.82 0.4 0.28[38-47) 6 42.5 255 14 478 2.25 30.37 153.77 0.7 0.60[47-56) 4 51.5 206 18 684 11.25 506.25 64072.26 0.9 0.85[56-65) 2 60.5 121 20 805 20.25 820.12 336302.50 1 1TOTAL: 20 - 805 - - - 2733.75 714431.39 - - media
40.25 Distributia dupa numarul de gradinite a unui esantion de 20 de judete din Romania.
4.Inferenta statistica.
4.a) Estimarea prin interval de incredere a unei medii presupune aflarea limitelor de incredere ale intervalului care acopera valoarea adevarata a mediei populatiei.
Pentru un esantion (n=20)<30 ,in cazul unui sondaj aleator simplu repetat,aplicam formula:
(x± t a2;n−i
s√n
∗√ N−nN
)
t a2;n−i este valoarea statisticii t care urmeaza o distributie de probabilitate
Student cu (n-1)grade de libertate. Pentru un risc a=0.10 si (n-1)=20-1=19 obtinem: t teor=¿ t 0.05 ;19=1.729;
Calculamintervalul de incredere :
(40.25±1.72911.69√20
∗√ 40−2040)=(37.08;43.42)
Interpretare: Cu o probabilitate de 0.90 se poate considera ca numarul mediu de gradinite la nivelul populatiei din care s-a extras esantionul e acoperit de intervalul(37.08;43.42). Ne asumam un risc de 0.10 sau 10 % ca valoarea adevarata a numarului de gradinite sa fie acoperit de acest interval.
4.b) Estimarea prin interval de incredere a unei proportii. Constat ca numarul de copii inscrisi la gradinite aflat peste medie este de 8.Vreau sa estimez prin interval de incredere proportia acestei categorii,la nivelul intregii populatii N=40,considerand un risc de a=0.10.
Pentru un esantion (n=20)<30 ,in cazul unui sondaj aleator simplu repetat,aplicam formula:
(f± t a2; n−i√ f (1−f )
n∗√ N−n
N)
t a2;n−i este valoarea statisticii t care urmeaza o distributie de probabilitate
Student cu (n-1)grade de libertate. Pentru un risc a=0.10 si (n-1)=20-1=19 obtinem: t 0.05 ;19=1.729;
Calculam proportia la nivelul esantionului: f=nA
n= 820
=0.4
Calculam intervalul de incredere:
(0.4±1.729√ 0.4 (1−0.4 )20∗√ 40−2040
)=(0.27;0.53);
Interpretare: Cu o probabilitate de 0.90 se poate considera ca proportia numarului aflat peste medie,la nivelul populatiei este acoperit de intervalul (27%;53%). Ne asumam un risc de 0.10 sau 10 % ca valoarea adevarata a numarului aflat peste medie sa fie acoperit de acest interval.
4.c)Testarea unei valori medii cu valoare fixa. Dispunem de urmatorele informatii:n=20,x=40.25,s=11.69,a=0.10,μ0=43.28 ;
Ipoteze statistice: H 0 : μ=μ0; H 1: μ≠ μ0
Statistica t Student: t calc=x−μ0s /√n
=40.25−43.2811.69 /√20
=−1.16
Valoarea teoretica a statisticii test:t 0.05 ;19=1.729
Decizie:|t calc=−1.16|<(t 0.05 ;19=1.729) in acest caz se accepta ipoteza H o ;
Interpretare: In aceste conditii ,se poate garanta cu o probabilitate de 0.90 ca nu exista diferente semnificative intre numarul mediu de gradinite la nivel de esantion si nr mediu la nivel de populatie.
4.d)Testarea unei proportii cu valoare fixa.Dispunem de urmatoarele informatii: proportia numarului de copii inscrisi la gradinite aflat peste medie f=0.4; a=0.10;p0=0.33 ;
Ipoteze statistice: H 0 : p=p0 ; H 1: p≠ p0
Statistica t Student: t calc=f−p0
√ f (1− f ) /√n= 0.4−0.33
√0.4(1−0.4)/√20=0.7
Valoarea teoretica a statisticii test: t 0.05 ;19=1.729
Decizie:|t calc=0.7|<(t 0.05 ;19=1.729) in acest caz se accepta ipoteza H o
Interpretare: In aceste conditii ,se poate garanta cu o probabilitate de 0.90 ca nu exista diferente semnificative intre proportia numarul de gradinite aflat peste medie la nivel de esantion si proportia lui la nivel de populatie.
5.Analiza statistica a legaturilor dintre variabile.
a) Analiza variantei(ANOVA).
Anova consta in descompunerea variatiei totale ,inregistrate pentru variabila x,in component definite dupa sursa variatiei si compararea aestora pentru a stabili daca factorul considerat cauza(in cazul meu Regiunea) are influienta semnificativa asupra variabilei x.
Cu ajutorul programului Excell,am introdus datele intr-un tabel de forma:
Nord-Vest CentruNord-Est Sud-Est Sud
Sud-Vest Vest
52 40 41 25 40 30 3120 43 27 20 29 4059 50 64 55 41 21 54
Demersul:Tools→Data Analysis→ANOVA:single factor→OK→in fereastra deschisa,la Imput range→selectam tabelul;bifam Lables in firs row→OK, obtinem:
Anova: Single Factor
SUMMARY
Groups Count Sum AverageVarianc
eNord-Vest 4 172 43 290
Centru 3 13344.3333
326.3333
3
Nord-Est 4 153 38.25364.916
7Sud-Est 1 25 25 #DIV/0!
Sud 4 169 42.25266.916
7Sud-Vest 2 59 29.5 0.5Vest 2 71 35.5 40.5
ANOVASource of Variation SS df MS F P-value F crit
Between Groups
594.6333 6
99.10556
0.450611
0.832126
2.915272
Within Groups2859.16
7 13219.935
9
Total 3453.8 19
Pentru interpretarea rezultatului consideram un risc a=0.05.
Ipoteze statistice:H 0 : μ1=μ2=μ3=…=μ7
H 1: numarulmediude gradinite din cel putindouaregiuni difera .
Raportul F este:
F=SE2
SR2=
99.106219.936
=0.451
Valoarea teoretica a statisticii F o citesc din Tabela Fisher pentru un risc a=0.05 si v1=6 , v2=13 grade de libertate:
F0.05 ;6 ;13=2.915 .
Decizie:Deoarece (F calc=0.451)<(Fa;v 1 ;v 2 ;=2.915) sau (Sig.=0.832)>(a=0.05) se accepta ipoteza H 0 .
Interpretare: Se poate garanta cu o probabilitate de 0.95 ca factorul “Regiune” nu are o influienta semnificativa asupra numarului de gradinite.
b) Analiza de corelatie si asociere.
Analiza de corelatie e o metoda statistica prin care se masoara intensitatea legaturii dintre variabile.
Demersul:Tools→Data Analysis→Correlation→OK→in fereastra deschisa,la Imput range→selectam ambele variabile numerice; bifam Lables in firs row→OK, obtinem:
Gradinite de copii Copii inscrisiGradinite de copii 1Copii inscrisi 0.427774216 1
Observam din table ca coeficientul de corelatie: r yx=0.428
Pentru interpretarea rezultatului consideram un risc a=0.05. Ipoteze statistice:
H 0 : ρ=0H 1: ρ≠0
Valoarea calculate a statisticii test t Student este:
t calc=r yx√n−2
√1−r yx2=0.428√20−2
√1−0.4282=2.008
Valoarea teoretica a statisticii t o citesc din Tabela Student pentru un risc a=0.05 si v=n−2=18 gradede libertate:
t 0.025; 18=2.101
Decizie:Deoarece (t calc=2.008)< (t 0.025; 18=2.101), se accepta ipoteza H 0 .
Interpretare: Coeficientul de corelatie nu este semnificativ diferit de zero,intre variabilele X si Y exista o legatura slaba.Se poate garanta acest rezultat cu o probabilitate de 0.95.
c) Analiza de regresie.
Analiza de regresie e o metoda statistica prin care se incearca,pe baza datelor din esantion,sa se estimeze relatia matematica dintre doua sau mai multe variabile.
Demersul:Tools→Data Analysis→Regression→OK→in fereastra deschisa,la Imput Y range→selectam variabila dependent,iar la Imput X range cea depandenta; bifam Lables ; la Confidence level 95%→
OK, obtinem:
SUMMARY OUTPUT
Regression StatisticsMultiple R 0.427774216R Square 0.18299078Adjusted R Square 0.137601379Standard Error 2914.170866Observations 20
ANOVA
df SS MS FSignificance
F
Regression 134237715.5
5 34237716 4.031575 0.05990638Residual 18 152863053 8492392
Total 19187100768.
6
Coefficients Std Error t Stat P-value Lower 95%Upper 95%
Intercept 11527.8845 2045.41952 5.635951 2.4E-05 7230.61423 15825.15
Gradinite de copii 99.5643349449.5868384
4 2.007878 0.059906 -4.6138275 203.7425
Din tabel oservam ca:
Raportul de determinatie R square=0.183; Intervalul de increder pentru β0 este(7230.61 ;15825.15); Intervalul de incredere pentru β1 este (−4.61 ;203.74 ) ;
Pentru interpretarea rezultatului consideram un risc a=0.05. Ipoteze statistice:
H 0 : β0=0H 1: β0≠0
Valoarea calculata a statisticii test t Student este:
t calc=bsβ̂
=5.64 ;
Valoarea teoretica a statisticii test o citesc din Tabela Student pentru un risc de a=0.05 si v=n-2=18 grade de libertate: t 0.025; 18=¿2.101;
Decizie pentru β0:Deoarece (t calc=5.64)> (t 0.025; 18=2.101), se respinge ipoteza H 0 , se acceptaipotezaH 1 ;
Interpretare: Cu o probabilitate de 0.95 se poate garanta ca valoarea parametrului β0este acoperita de intervalul (7230.61;15825.15),precum si ca parametrul e semnificativ diferit de zero,iar intre cele doua variabile exista o legatura directa.
Bibliografie:
Anuarul Statistic al Romaniei 2008. www.insse.ro ; Jaba,Elisabeta -Statistica,Ed.a 3-a,rev-Bucuresti;
Editura economica,2002; Jaba,Elisabeta,Pintilescu,Carmen –Statistica:teste grile si
problem.Ed.a 2-a rev.-Iasi:Sedcom Libris,2007. Jaba,Elisabeta,Grama,Ana, -Analiza statistica cu SPSS sub
Windows,Ed.Polirom,Iasi,2004.