Curs informatica statistica medicala

19
Analiza unui lot de date: 1. Sortarea datelor (SORT& Fil t er) 2. Indicatorii de tendinţă centrală (medie, mod, mediană) 3. Indicatorii de formă (asimetria şi boltirea) 4. Indicatorii de dispersie (simpl ii şi sintetici ) 5. Gr uparea datelor pe inte rvale: 6. Reprezentarea grafică a datelor

description

curs

Transcript of Curs informatica statistica medicala

  • Analiza unui lot de date:

    1. Sortarea datelor (SORT& Filter)

    2. Indicatorii de tendin central (medie, mod, median)

    3. Indicatorii de form (asimetria i boltirea)

    4. Indicatorii de dispersie (simplii i sintetici)

    5. Gruparea datelor pe intervale:

    6. Reprezentarea grafic a datelor

  • 1. Sortarea datelor Home tab Sort & Filter:

    Sort smallest to largest

    Sort largest to smallest

    Custom sort:

    My data has headers

    Sort by (columns)

    Add / Delete level

    Order: A to Z, Z to A

  • 2. Indicatorii de tendin central Media aritmetic: suma valorilor mprit la numrul

    de elemente.

    Este folosit cnd valorile sunt distribuite uniform de fiecare parte a mediei distribuie normal.

    tine seama de toate cazurile si este afectata de valorile lor;

    poate fi calculata fara ordonarea prealabila a datelor

    =average(ir de celule)

  • 2. Indicatorii de tendin central Mediana: Valoarea care mparte un ir ordonat

    cresctor sau descresctor n dou grupe egal populate

    Este folosit pentru a reprezenta media cnd datele nu sunt simetrice (distribuie asimetric). Mediana coincide cu media n cazul unei distributii teoretice normale si se ndeparteaza mult de aceasta daca distributia este asimetrica.

    Pentru a calcula mediana n cazul distributiei simple a datelor exista doua situatii: cnd n este impar locul medianei se stabileste astfel: loc mediana = (n+1) / 2 cnd n este par sunt adunate valorile din centrul seriei si

    se mpart la doi.

  • 2. Indicatorii de tendin central =median(ir)

    tine seama de toate cazurile, dar nu este afectata de cazurile (valorile) extreme;

    necesita ordonarea sirului de date.

  • 2. Indicatorii de tendin central Modul: Valoarea cu frecvena cea mai mare.

    Distribuia poate fi uni-, bi- sau multimodal

    =mode(ir)

  • nu tine seama dect de masurile cele mai reprezentative; necesita ordonarea datelor corespunde unuia sau mai multor elemente ale seriei (n caz de frecvente

    egale).

  • 3. Indicatorii de form Asimetria: indicator folosit n analiza unui lot de

    date ca indicator al simetriei / asimetriei; arat devierea de la o distribuie normal:

    =skew(ir) > 0 -> majoritatea valorilor sunt concentrate n partea

    stng a mediei cu valori extreme la dreapta;

    < 0 -> majoritatea valorilor sunt concentrate la dreapta mediei cu valori extreme la stnga;

    = 0 media=mediana, distribuia este simetric n jurul mediei (distribuie normal teoretic).

    +/-1.96 = distribuie relativ normal

  • 3. Indicatorii de form Boltirea: indicator folosit n analiza unui lot de

    date ca msura a gradului de aplatizare sau ascuire a unei distribuii:

    =kurt(ir) > 3 Distribuie leptocurtic mai ascuit dect

    distribuia normal, cu valori concentrate n jurul mediei. Arat o probabilitate ridicat a valorilor extreme.

    < 3 distribuie platicurtic mai aplatizat dect distribuia normal. Probabilitate mai mic de valori extreme iar valorile sunt la distan de medie.

    = 3 distribuie mezocurtic distribuie normal.

    +/-1.96 = distribuie relativ normal

  • 4. Indicatorii de dispersie (simpli)

    Valoarea cea mai mare

    Valoarea cea mai mic

    Amplitudinea variaiei:

    Ax = Xmax Xmin _

    Variaia individual: di=xi - X

  • 4. Indicatorii de dispersie (sintetici)

    Deviaia (abaterea) standard este o msura a gradului de dispersie a valorilor n jurul mediei aritmetice.

    Abaterea standard a unei mulimi de numere este rdcina medie ptrat a mulimii abaterilor fiecrui element de la media mulimii.

  • 4. Indicatorii de dispersie (sintetici)

    Media 1 SD =68.2% din valori.

    Media 2 SD =95.4% din valori.

    Media 3 SD =99.7% din valori.

    Un singur maxim pt graficul functiei

    =stdev(ir)

  • 5. Gruparea datelor pe intervale

    STURGES:

    i = (Xmax-Xmin) / (1+ 3.322 * lnN)

    Criterii clinice / fiziopatologice

    10 / decade ani / uniti de msur

  • 6. Reprezentarea grafic a datelor

    Columns / Bars

    Pie

    X / Y