Coeficientul de Corelatie Pearson

23
Coeficientul de Coeficientul de corelatie Pearson corelatie Pearson

description

pearson

Transcript of Coeficientul de Corelatie Pearson

Page 1: Coeficientul de Corelatie Pearson

Coeficientul de corelatie Coeficientul de corelatie PearsonPearson

Page 2: Coeficientul de Corelatie Pearson

IntroducereIntroducere Notele Z fac posibila analiza legaturii Notele Z fac posibila analiza legaturii

dintre doua variabiledintre doua variabile Corelatia indica existenta unei legaturi Corelatia indica existenta unei legaturi

intre variabile, legatura care poate fi:intre variabile, legatura care poate fi: Pozitiva: Pozitiva:

Scoruri mari -> Scoruri mariScoruri mari -> Scoruri mari Scoruri medii -> Scoruri mediiScoruri medii -> Scoruri medii Scoruri mici -> Scoruri miciScoruri mici -> Scoruri mici

NegativaNegativa Scoruri mari -> Scoruri miciScoruri mari -> Scoruri mici Scoruri medii -> Scoruri mediiScoruri medii -> Scoruri medii Scoruri mici -> Scoruri mariScoruri mici -> Scoruri mari

Poate sa nu apara nicio legaturaPoate sa nu apara nicio legatura

Page 3: Coeficientul de Corelatie Pearson

IntroducereIntroducere

Coeficientul de corelatie = rCoeficientul de corelatie = r si si indica gradul in care apare patternul indica gradul in care apare patternul unei relatii intre cele doua variabile;unei relatii intre cele doua variabile; r r ϵϵ [-1; +1] [-1; +1] Corelatie pozitiva r Corelatie pozitiva r ϵϵ (0; +1] (0; +1] Corelatie negativa r Corelatie negativa r ϵϵ [-1; 0) [-1; 0) Lipsa corelatie r = 0Lipsa corelatie r = 0

Page 4: Coeficientul de Corelatie Pearson

Painea este periculoasaPainea este periculoasa Avertisment important pentru consumatorii de paineAvertisment important pentru consumatorii de paine

1. Mai mult de 98% dintre detinutii condamnati sunt consumatori 1. Mai mult de 98% dintre detinutii condamnati sunt consumatori de paine.de paine.

2. Aproape JUMATATE dintre copiii care cresc in gospodarii unde se 2. Aproape JUMATATE dintre copiii care cresc in gospodarii unde se consuma paine au scoruri sub medie la testele standardizate.consuma paine au scoruri sub medie la testele standardizate.

3. In secolul 18, cand aproape toata painea se cocea acasa, 3. In secolul 18, cand aproape toata painea se cocea acasa, speranta medie de viata era de 50 de ani; ratele de moarte speranta medie de viata era de 50 de ani; ratele de moarte spontana erau inacceptabil de mari; numeroase femei mureau la spontana erau inacceptabil de mari; numeroase femei mureau la nastere; si boli precum febra tifoida, febra galbena si gripa faceau nastere; si boli precum febra tifoida, febra galbena si gripa faceau ravagii in intreaga populatie. ravagii in intreaga populatie.

4. Mai mult de 90% dintre crimele violente sunt comise la mai 4. Mai mult de 90% dintre crimele violente sunt comise la mai putin de 24 de ore de la consumul de paine. putin de 24 de ore de la consumul de paine.

5. Painea este realizata dintr-o substanta numita aluat. S-a dovedit 5. Painea este realizata dintr-o substanta numita aluat. S-a dovedit ca 500 de grame de aluat sunt suficiente pentru a sufoca un ca 500 de grame de aluat sunt suficiente pentru a sufoca un soarece. Romanul mediu consuma mai mult decat aceasta soarece. Romanul mediu consuma mai mult decat aceasta cantitate intr-o luna. cantitate intr-o luna.

Page 5: Coeficientul de Corelatie Pearson

Painea este periculoasaPainea este periculoasa 6. Triburile primitive care nu consumau paine prezinta o 6. Triburile primitive care nu consumau paine prezinta o

incidenta scazuta a cancerului, boala Alzheimer, Parkinson si incidenta scazuta a cancerului, boala Alzheimer, Parkinson si osteoporoza.osteoporoza.

7. S-a dovedit ca painea da dependenta. Subiectii care au fost 7. S-a dovedit ca painea da dependenta. Subiectii care au fost privati de paine si carora li s-a dat doar apa au implorat pentru privati de paine si carora li s-a dat doar apa au implorat pentru paine dupa numai doua zile.paine dupa numai doua zile.

8. Sugarii se pot ineca de la paine. 8. Sugarii se pot ineca de la paine. 9. Majoritatea romanilor care consuma paine nu pot distinge 9. Majoritatea romanilor care consuma paine nu pot distinge

intre date stiintifice semnificative si aberatii statistice fara intre date stiintifice semnificative si aberatii statistice fara sens. sens.

In lumina acestor statistici inspaimantatoare, recomandam In lumina acestor statistici inspaimantatoare, recomandam urmatoarele restrictii:urmatoarele restrictii: Sa nu se vanda paine minorilor.Sa nu se vanda paine minorilor. O campanie nationala “Spuneti nu painii!” completata cu O campanie nationala “Spuneti nu painii!” completata cu

sustinerea unor celepritati TV si cu abtibilduri.sustinerea unor celepritati TV si cu abtibilduri. O taxa de 300% pe toata productia de paine care sa fie O taxa de 300% pe toata productia de paine care sa fie

directionata pentru prevenirea bolilor care sunt asociate cu painea.directionata pentru prevenirea bolilor care sunt asociate cu painea. Stabilirea zonelor fara paine in jurul scolilor.Stabilirea zonelor fara paine in jurul scolilor.

Page 6: Coeficientul de Corelatie Pearson

IntroducereIntroducere

!!!Observatie:!!!Observatie: analiza corelatiei dintre analiza corelatiei dintre doua variabile nu permite stabilirea doua variabile nu permite stabilirea relatiei de cauzalitate intre aceste relatiei de cauzalitate intre aceste variabile.variabile.

Fie x poate fi cauza pt yFie x poate fi cauza pt y Fie y poate fi cauza pt xFie y poate fi cauza pt x Fie a aparut o a treia var care a determinat Fie a aparut o a treia var care a determinat

aparitia simultana a celor doua variabileaparitia simultana a celor doua variabile

Page 7: Coeficientul de Corelatie Pearson

Pragul de semnificatie (p)Pragul de semnificatie (p)

Pragul de semnificatie p, ne indica in ce Pragul de semnificatie p, ne indica in ce masura ne inselam atunci cand afirmam ceva.masura ne inselam atunci cand afirmam ceva.

In cazul corelatiei p indica daca exista o In cazul corelatiei p indica daca exista o legatura intre doua sau mai multe variabile.legatura intre doua sau mai multe variabile.

In cercetarea stiintifica se lucreaza de obicei In cercetarea stiintifica se lucreaza de obicei cu doua praguri de semnificatie, cu doua praguri de semnificatie, corespunzatoare procentajului de eroarecorespunzatoare procentajului de eroare p ≤ 0.010 (gresim in mai putin de 1% din cazuri)p ≤ 0.010 (gresim in mai putin de 1% din cazuri) P ≤ 0.050 (gresim in mai putin de 5% din cazuri)P ≤ 0.050 (gresim in mai putin de 5% din cazuri)

Page 8: Coeficientul de Corelatie Pearson

Tipuri de eroareTipuri de eroare

EvenimentulEvenimentul

ApareApare Nu apareNu apare

Predictia Predictia evenimeevenime

ntuluintului

Apare Apare CorectCorectEroarea I Eroarea I (minciuna(minciuna

))

Nu apareNu apareEroarea IIEroarea II

(ignoranta(ignoranta))

CorectCorect

Page 9: Coeficientul de Corelatie Pearson

Tipuri de ipotezeTipuri de ipoteze

Ipoteze non-directionale:Ipoteze non-directionale: nu se nu se precizeaza tipul de relatie intre precizeaza tipul de relatie intre variabile.variabile. Probabilitatea de eroare se imparte la Probabilitatea de eroare se imparte la

cele doua extremitati ale distributiei => cele doua extremitati ale distributiei => test de semnificatie TWO TAILEDtest de semnificatie TWO TAILED

Ex: Exista o legatura intre salariul initial Ex: Exista o legatura intre salariul initial si cel final al subiectilor.si cel final al subiectilor.

Page 10: Coeficientul de Corelatie Pearson

Tipuri de ipotezeTipuri de ipoteze

Ipoteze directionale:Ipoteze directionale: sunt cele in care sunt cele in care se precizeaza tipul de relatie, se precizeaza tipul de relatie, cercetatorul se astepta la un anumit cercetatorul se astepta la un anumit rezultat.rezultat. Probabilitatea de eroare se stabileste la una Probabilitatea de eroare se stabileste la una

din extremitatile distributiei.din extremitatile distributiei. Testul de semnificatie este ONE – TAILEDTestul de semnificatie este ONE – TAILED Ex: Legatura dintre slariul initial si final este Ex: Legatura dintre slariul initial si final este

pozitiva, cu cat salariul initial este mai mare pozitiva, cu cat salariul initial este mai mare cu atat salariul final va fi mai mare.cu atat salariul final va fi mai mare.

Page 11: Coeficientul de Corelatie Pearson

Calcularea corelatiei Pearson cu Calcularea corelatiei Pearson cu ajutoru SPSSajutoru SPSS

Baza de date: sondaj cu privire la dormitoarele de Baza de date: sondaj cu privire la dormitoarele de camincamin

S-au adunat raspunsuri de la chestionarele a cinci S-au adunat raspunsuri de la chestionarele a cinci intrebari privind conditiile din dormitoarele de camin intrebari privind conditiile din dormitoarele de camin de la 10 studenti de anul I.de la 10 studenti de anul I.

Chestionarul evalueaza atitudinea fata de zgomot, Chestionarul evalueaza atitudinea fata de zgomot, mobila, zona de studiu, si intimitatea precum si mobila, zona de studiu, si intimitatea precum si nivelul venitului parintilor acestor studenti.nivelul venitului parintilor acestor studenti.

Ipoteza: Exista o legatura intre gradul de satisfactie Ipoteza: Exista o legatura intre gradul de satisfactie fata de mediul de locuit al universitatii si situatia fata de mediul de locuit al universitatii si situatia materiala a studentilor.materiala a studentilor.

Chestionarul contine cinci intrebari cu privire la Chestionarul contine cinci intrebari cu privire la satisfactie. Acestora li s-au dat raspunsuri pe o scara satisfactie. Acestora li s-au dat raspunsuri pe o scara de 5 puncte gen Likert (de la foarte nemultumit pana de 5 puncte gen Likert (de la foarte nemultumit pana la foarte multumit).la foarte multumit).

Page 12: Coeficientul de Corelatie Pearson

Pasul 1.Pasul 1. Da click pe Analyze  Da click pe Analyze (analizeaza), apoi Correlate (analizeaza), apoi Correlate (coreleaza), apoi Bivariate (coreleaza), apoi Bivariate (bidimensional).(bidimensional).Pasul 2.Pasul 2. Muta variabilele pe care  Muta variabilele pe care doresti sa le corelezi in campul doresti sa le corelezi in campul Variables (variabile).Variables (variabile).Pasul 3.Pasul 3.  Daca doresti sa listezi mediile Daca doresti sa listezi mediile si abaterile standard, da apoi click pe si abaterile standard, da apoi click pe Options si selecteaza statisticile dorite.Options si selecteaza statisticile dorite. Apoi da click pe Continue si apoi pe OK. Apoi da click pe Continue si apoi pe OK.

Page 13: Coeficientul de Corelatie Pearson

Calcularea corelatiei Pearson cu Calcularea corelatiei Pearson cu ajutoru SPSSajutoru SPSS

Correlations

nivel venit parinti in miisatisfactie nivel zgomot in

camin

nivel venit parinti in mii Pearson Correlation 1 -.772**

Sig. (2-tailed)

. .009

N 10 10

satisfactie nivel zgomot in camin Pearson Correlation -.772** 1

Sig. (2-tailed)

.009

N10 10

**. Correlation is significant at the 0.01 level (2-tailed).

1

2 34 5

Page 14: Coeficientul de Corelatie Pearson

Explicare outputExplicare output Randul 1:Randul 1: Pearson correlation – valorile Pearson correlation – valorile

coeficientilor de corelatie dintre doua coeficientilor de corelatie dintre doua variabilevariabile

Randul 2:Randul 2: Sig (2 –TAILED) probabilitatea de Sig (2 –TAILED) probabilitatea de eroare la respingerea ipotezei de nul si eroare la respingerea ipotezei de nul si acceptarea ipotezei de cercetareacceptarea ipotezei de cercetare

Randul 3:Randul 3: N contine numarul de subiecti N contine numarul de subiecti care au scoruri la ambele variabilecare au scoruri la ambele variabile

Celula 4:Celula 4: corelatia dintre var venit parinti corelatia dintre var venit parinti cu ea insasi; corelatie perfecta dar lipsita de cu ea insasi; corelatie perfecta dar lipsita de semnificatiesemnificatie

Celula 5:Celula 5: corelatia dintre var zgomot si var corelatia dintre var zgomot si var venit parintivenit parinti

Page 15: Coeficientul de Corelatie Pearson

Interpretare outputInterpretare output

Semnul corelatiei: Semnul corelatiei: arata natura legaturiiarata natura legaturii r>0 r>0 => legatura pozitiva; scorurile => legatura pozitiva; scorurile micimici de la de la

prima var. se asociaza cu scorurile prima var. se asociaza cu scorurile micimici de la a 2a de la a 2a var.; sc. var.; sc. mediimedii de la prima var. se asociaza cu sc. de la prima var. se asociaza cu sc. mediimedii de la a 2a var.; sc. de la a 2a var.; sc. marimari de la prima var. se de la prima var. se asociaza cu sc. asociaza cu sc. marimari de la a 2a var. de la a 2a var.

r<0r<0 => legatura negativa; scorurile => legatura negativa; scorurile micimici de la de la prima var. se asociaza cu scorurile prima var. se asociaza cu scorurile marimari de la a 2a de la a 2a var.; sc. var.; sc. mediimedii de la prima var. se asociaza cu sc. de la prima var. se asociaza cu sc. medii medii de la a 2a var.; sc. de la a 2a var.; sc. marimari de la prima var. se de la prima var. se asociaza cu sc. asociaza cu sc. micimici de la a 2a var. de la a 2a var.

Page 16: Coeficientul de Corelatie Pearson

Interpretare outputInterpretare output

Marimea absoluta a Marimea absoluta a coeficientului:coeficientului: descrie taria descrie taria legaturii care apare intre variabile.legaturii care apare intre variabile.

|r| < 0.30|r| < 0.30 => legatura slaba => legatura slaba 0.30 < |r| < 0.500.30 < |r| < 0.50 => legatura medie => legatura medie |r| > 0.50|r| > 0.50 => legatura puternica => legatura puternica

Page 17: Coeficientul de Corelatie Pearson

Interpretare outputInterpretare output

Pragul de semnificatie:Pragul de semnificatie:

p ≤ 0.050 => exista o relatie p ≤ 0.050 => exista o relatie semnificativa intre cele 2 var. semnificativa intre cele 2 var. (probabilitatea de a gresi este mai mica (probabilitatea de a gresi este mai mica de 5%)de 5%)

!Obs: p = .000 => p<0.001; p<0.01!Obs: p = .000 => p<0.001; p<0.01 P > 0.050 => nu exista o relatie P > 0.050 => nu exista o relatie

semnificativa intre cele doua variabilesemnificativa intre cele doua variabile

Page 18: Coeficientul de Corelatie Pearson

Interpretare outputInterpretare output

Proportia de variantaProportia de varianta = r = r² explica la ce procent din populatie apare relatia

Relatia gasita este prezenta la x% din populatie

Page 19: Coeficientul de Corelatie Pearson

Rezolvare exercitiuRezolvare exercitiu r = - 0.772r = - 0.772 p = 0.009 < 0.01p = 0.009 < 0.01 N = 10N = 10 Semnul corelatiei:Semnul corelatiei: r = - 0.772 < 0; r = - 0.772 < 0; semnul semnul

este negativeste negativ => => legatura dintre var legatura dintre var venit parinti si var zgomot este venit parinti si var zgomot este negativanegativa ceea ce inseamna ca un venit ceea ce inseamna ca un venit ridicat al parintilor se asociaza cu un nivel ridicat al parintilor se asociaza cu un nivel scazut al satisfactiei la zgomot, un venit scazut al satisfactiei la zgomot, un venit mediu al parintilor se asociaza cu un nivel mediu al parintilor se asociaza cu un nivel mediu al satisfactiei la zgomot si un nivel mediu al satisfactiei la zgomot si un nivel scazut al venitului parintilor se asociaza cu scazut al venitului parintilor se asociaza cu un nivel ridicat al satisfactiei la zgomot.un nivel ridicat al satisfactiei la zgomot.

Page 20: Coeficientul de Corelatie Pearson

Rezolvare exercitiuRezolvare exercitiu

Marimea absoluta a coef de Marimea absoluta a coef de corelatie:corelatie: |r| = 0.772 > 0.50 => taria legaturii intre |r| = 0.772 > 0.50 => taria legaturii intre

venitul parintilor si satisfactia la zgomotul venitul parintilor si satisfactia la zgomotul din camin este puternicadin camin este puternica

Pragul de semnificatie:Pragul de semnificatie: p = 0.009 < 0.01 => putem spune ca p = 0.009 < 0.01 => putem spune ca

exista o legatura semnificativa intre exista o legatura semnificativa intre variabilele venitul parintilor si nivelul de variabilele venitul parintilor si nivelul de satisfactie la zgomotul din camin.satisfactie la zgomotul din camin.

Page 21: Coeficientul de Corelatie Pearson

Rezolvare exercitiuRezolvare exercitiu

Proportia de varianta:Proportia de varianta:

rr² = 0.59 * 100 = 59 => relatia gasita este prezenta la 59% dintre subiecti

Page 22: Coeficientul de Corelatie Pearson

Crerea unei diagrame de dispersie Crerea unei diagrame de dispersie pentru perechi de variabilepentru perechi de variabile

O diagrama de dispersie este o reprezentare grafica bi-O diagrama de dispersie este o reprezentare grafica bi-dimensionala a relatiei dintre doua variabile. Acest grafic te dimensionala a relatiei dintre doua variabile. Acest grafic te ajuta sa evaluezi natura si gradul de relatie dintre variabilele ajuta sa evaluezi natura si gradul de relatie dintre variabilele tale.tale.

Pasul 1.Pasul 1. Pentru a crea o diagrama de dispersie pentru datele  Pentru a crea o diagrama de dispersie pentru datele tale, sa spunem intre variabila de venit si cea de zgomot, da tale, sa spunem intre variabila de venit si cea de zgomot, da click pe Graphs (grafice) si apoi pe Scatter (disperseaza).click pe Graphs (grafice) si apoi pe Scatter (disperseaza).Pasul 2.Pasul 2. In meniul Scatterplot, da click pe Simple si apoi pe  In meniul Scatterplot, da click pe Simple si apoi pe Define (defineste).Define (defineste).Pasul 3.Pasul 3. Acum muta variabilele pe axele potrivite. In cazul  Acum muta variabilele pe axele potrivite. In cazul de fata, ai putea dori sa muti variabila de zgomot in campul de fata, ai putea dori sa muti variabila de zgomot in campul axei Y iar variabila de venit in campul axei X. Odata ce ai axei Y iar variabila de venit in campul axei X. Odata ce ai facut asta, da click pe OKfacut asta, da click pe OK

Dupa cum poti vedea, acest grafic tinde sa indice o Dupa cum poti vedea, acest grafic tinde sa indice o satisfactie descrescatoare pe masura ce venitul pe familie al satisfactie descrescatoare pe masura ce venitul pe familie al participantului creste. participantului creste.

Page 23: Coeficientul de Corelatie Pearson

Grafic corelatieGrafic corelatie