Normalizarea Distributiilor

download Normalizarea Distributiilor

of 9

description

normalizare

Transcript of Normalizarea Distributiilor

  • NORMALIZAREA DISTRIBUIILOR

    Normalitatea distribuiei datelor este foarte important pentru majoritateatehnicilor statistice n care se pornete de la premisa unei distribuii normale.

    Cnd acest aspect nu se verific avem la dispoziie dou soluii: Renunm la aplicarea metodei respective i folosim tehnici non-parametrice; Transformm datele pentru a normaliza pe ct posibil distribuia.

    Distribuiile non-normale ridic probleme diferite: unele distribuii suntplaticurtice, altele puternic asimetrice pozitiv (nclinate la stnga) sau asimetricenegativ (nclinate la dreapta). n cazuri grave apar apr att devieri ale boltirii ct i aleoblicitii.

    Asimetrie pozitiv moderat Asimetrie negativ moderatRdcina ptrat Rdcina ptrat din numrul reflectat

    (Aten ie: se schimb ordinea scorurilor!)

    Asimetrie pozitiv sever Asimetrie negativ severLogaritm natural Logaritm natural din numrul reflectat

    Asimetrie pozitiv extrem (I) Asimetrie negativ extrem (J)Inversul numrului (1/x)

    (Aten ie: se schimb ordinea scorurilor!)Inversul numrului reflectat

    (Aten ie: se revine la ordinea ini ial ascorurilor!)

    Dup transformare, se obine o normalizare aproximativ a distribuiei, i se potfolosi orice fel de statistici care au drept premis distribuia normal.

    Obs: Singurul lucru care se pierde este unitatea de msur a variabileitransformate

    Ex. Dac venitul exprimat n RON are o distribuie asimetric pozitiv carenecesit logaritmare, valorile transformate reprezentnd venitul vor avea ca unitate demsur RON logaritmai

    n psihologie rezultatele brute la un test nu au o unitate de msur clar, iarefectul asupra unitii de msur nu exist.

    Reflectarea datelor: Se adun 1 la valoarea maxim observat. Din valoareaobinut se scade fiecare valoare observat. (1 + X max) X

    O distribuie platicurtic (aplatizat) se normalizeaz prin radical.O distribuie leptocurtic ridicarea la ptrat sau la cub, pentru a se mprtia

    valorile.

    1

  • Skewness pozitiv Skewness negativ

    2

  • ANALIZA NORMALITII DISTRIBUIEI N SPSS

    Coeficienii de asimetrie (Skewness) i de boltire (Kurtosis)

    ntr-o distribuie perfect normal aceti coeficieni sunt zero.

    Coeficientul de asimetrie exprim gradul de asimetrie a distribuiei unei variabilei

    comparativ cu o distribuie normal:

    valori negative ale Skewness indic o asimetrie negativ,

    valori pozitive ale Skewness indic o asimetrie pozitiv.

    Coeficientul de boltire exprim gradul de grupare a observaiilor n jurul valorii

    centrale.

    Cnd coeficientul Kurtosis este mai mare ca zero, curba este mai boltit (nalt);

    Cnd coeficientul Kurtosis este mai mic dect zero curba este mai puin boltit

    comparativ cu cea a unei distribuii normale.

    Calcularea acestor coeficieni, precum i erorile lor standard, n SPSS:Calea n SPSS este: Analyze Descriptive Statistics Explore.

    Trecem variabila comportament prosocial n cmpul Dependent List, apoi activm

    butonul Plots iar aici selectm opiunea Normality plots with tests, click Continue i click

    OK.

    3

  • Rezultatele relevante se regsesc n tabelele Descriptives i Tests of Normality de

    mai jos. Din tabelul Descriptives ne vor interesa coeficienii Skewness i Kurtosis i

    erorile lor standard.

    Descriptives

    54,37 ,5353,33

    55,40

    54,3755,00

    55,2487,43

    327543

    10,75-,054 ,172-,133 ,342

    MeanLower BoundUpper Bound

    95% ConfidenceInterval for Mean

    5% Trimmed MeanMedianVarianceStd. DeviationMinimumMaximumRangeInterquartile RangeSkewnessKurtosis

    comportament prosocialStatistic Std. Error

    4

  • Metode de testare a normalitii distribuiei

    1. Dac 1 Skewness sau 80.0 Skewness , distribuia difer de o

    distribuie normal (Morgan, Leech, Gloeckner & Barrett, 2004).

    2. Transformarea coeficienilor Skewness i Kurtosis n note z.

    Unii cercettori (Field, 2000, Leech, Barrett & Morgan, 2005) recomand

    transformarea celor doi coeficieni n note z, astfel:

    skewnessskewness SE

    Sz 0kurtosis

    kurtosis SEKz 0

    Dac una dintre notele z astfel obinute n valoare absolut este mai mare dect

    1.96 (pentru eantioane mici) sau 2.58 (pentru cazul unor eantioane mari), atunci

    distribuia difer semnificativ de o distribuie normal.

    Problema n acest caz este c eroarea standard a asimetriei (SE) depinde de

    mrimea eantionului, iar n cazul unor eantioane foarte mari de cele mai multe ori am

    putea trage concluzia (greit) c variabile nu sunt normal distribuite. n cazul datelor

    noastre, 313.

    172.054.

    skewneesz i

    388.0342.133.

    kurtosisz; prin urmare variabila este

    normal distribuit.

    3. Luarea n calcul a erorii standard pentru Skewness i Kurtosis

    ntr-o distribuie normal,

    ]2,[-2SE Skewness Skewness Skewness SE (pentru o precizie de 95%)

    ]1,[-1SE Skewness Skewness Skewness SE (pentru o precizie de 99%)

    i la fel i pentru Kurtosis

    ]2,[-2SE Kurtosis Kurtosis Kurtosis SE (pentru o precizie de 95%)

    ]1,[-1SE Kurtosis Kurtosis Kurtosis SE (pentru o precizie de 99%).

    Dac aceti coeficieni nu aparin intervalelor menionate, atunci distribuia difersemnificativ de o distribuie normal!

    5

  • 4. Testul Kolmogorov-Smirnov pentru un eantion

    Acest test compar distribuia scorurilor variabilei pe eantion cu o distribuie

    normal avnd aceeai medie i deviaie standard. Dac rezultatul la acest test este

    nesemnificativ statistic (p > .05), atunci distribuia variabilei pe eantion nu difer

    semnificativ de o distribuie normal i prin urmare variabila este normal distribuit.

    Calea n SPSS este: Analyze Nonparametric tests 1-Sample K-S.

    Trecem variabila comportament prosocial n cmpul Test Variable List, bifm

    opiunea Normal i click OK.

    6

  • Rezultatele la testul Kolmogorov-Smirnov sunt prezentate n tabelul One-Sample

    Kolmogorov-Smirnov Test. Observm c rezultatul la testul K-S este nesemnificativ

    statistic, z = .757, p = .616, prin urmare distribuia variabilei comportament prosocial nu

    difer semnificativ de o distribuie normal. Inspectnd i repartizarea scorurilor sub

    forma unei histograme constatm c distribuia scorurilor urmeaz o distribuie normal.

    One-Sample Kolmogorov-Smirnov Test

    20054,377,43,054,040

    -,054,757,616

    NMeanStd. Deviation

    Normal Parameters a,b

    AbsolutePositiveNegative

    Most ExtremeDifferences

    Kolmogorov-Smirnov ZAsymp. Sig. (2-tailed)

    comportament prosocial

    Test distribution is Normal.a.

    Calculated from data.b.

    7

  • 5. Testul Shapiro-Wilk

    i acest test verific normalitatea unei distribuii, fiind asemntor testului

    Kolmogorov-Smirnov. n general, testul Shapiro-Wilk este mai puternic dect testul

    Kolmogorov-Smirnov (Field, 2000, Iacobucci, D., 2001).

    Testul Shapiro-Wilk este disponibil doar n programele SPSS aparute dup

    varianta 10.0. Calea n SPSS este: Analyze Descriptive Statistics Explore.

    Trecem variabila comportament prosocial n cmpul Dependent List, apoi activm

    butonul Plots iar aici selectm opiunea Normality plots with tests, click Continue i click

    OK.

    n tabelul Tests of Normality sunt prezentate rezultatele la testele Shapiro-Wilk (S-

    W) i Kolmogorov-Smirnov (K-S); acestea trebuie s fie nesemnificative statistic (p > .

    05) pentru ca variabila s fie normal distribuit n populaie. Observm c rezultatul la

    testul K-S este K-S (200) = .054, p = .200 iar rezultatul la testul S-W este S-W (200) = .

    8

  • 995, p = .914. Cum rezultatele la ambele teste sunt nesemnificative statistic rezult c

    variabila este normal distribuit.

    Tests of Normality

    ,054 200 ,200* ,995 200 ,814comportament prosocialStatistic df Sig. Statistic df Sig.

    Kolmogorov-Smirnova Shapiro-Wilk

    This is a lower bound of the true significance.*.

    Lilliefors Significance Correctiona.

    9