AMD Doctorat 2009

download AMD Doctorat 2009

of 134

Transcript of AMD Doctorat 2009

  • 8/3/2019 AMD Doctorat 2009

    1/134

    Academia de Studii Economice

    Scoala Doctorala

    Prof. univ. dr. Gheorghe RUXANDA

    ANALIZAMULTIDIMENSIONALA A

    DATELOR

    Bucureti

    2009

  • 8/3/2019 AMD Doctorat 2009

    2/134

    1

    Tema 1. Probleme ale m|sur|riii cuantific|rii economico-sociale

    1.1 Necesitatea i rolul analizei datelor

    Cunoaterea tiinific| din orice domeniu de activitate uman| presupune, indiferent de natura i specificul obiectivelorconcrete urm|rite, o complex|i riguroas| analiz| cantitativ| a fenomenelori proceselor care fac obiectul cercet|rii. Estevizibil pentru oricine, i din ce n ce mai mult, c| n epoca modern| aproape or ice individ angrenat ntr-o activitate uman| seocup|, ntr-un fel sau altul, n mod direct sau indirect, cu date i informaii, cu colectarea, prelucrarea i interpretarea acestora.

    Desf|urarea oric|rei activit|i umane implic| o producie continu| de date sau informaii, care se acumuleaz| n timp icare pot fi folosite pentru cunoaterea structural|i evolutiv| a fenomenelor la care se refer| aceste informaii, n scopulfundament|rii corecte i eficiente a deciziilor care trebuie luate. Mai mult dect a tt, desf|urarea activit|ilor umane nici m|carnu poate fi conceput| n zilele noastre f|r| un consum co ntinuu, din ce n ce mai mare, de informaie. Din acest punct de vedere,se poate spune c| informaia a devenit unul dintre factorii de producie importani i activi, un factor de progres i civilizaie.

    Totdeauna, mulimile de date conin, ntr-un mod amalgamat i invizibil, att aspecte semnificative, ct i aspectenesemnificative, ale manifest|rii fenomenelor. Deoarece cunoaterea tiinific| vizeaz| n mod exclusiv aspectele infor-ma ionale semnificative, apare necesitatea utiliz|rii unor metode i tehnici specifice analizei datelor, cu ajutorul c|rora informa-

    ia semnificativ| s| poate fi detectat|, separat| de informaia nesemnificativ|i exprimat| sub o form| clar|i interpretabil|.Metodele i tehnicile de analiz| a datelor sunt cele mai adecvate instrumente utilizabile pentru identificarea unor structuricauzale, pentru decelarea unor tendine i configuraii specifice pe mulimea datelor analizate i obinerea unorreprezent|risimplificate ale informaiilor de mare com plexitate.

    Utilitatea i eficiena utiliz|rii metodelori tehnicilor de analiz| a datelor sunt maxime n situaiile n care informaiilesupuse studiului sunt n cantit|i foarte mari. Din acest punct de vedere, domeniul economic poate fi considerat ca fiind undomeniu privilegiat. n cea mai mare p arte a lor, metodele i tehnicile de analiz| a datelor au natur| multidimernsional|, astfelnct, comparativ cu metodele i tehnicile de analiz| statistic| descriptiv|, ele permit i investigarea leg|turilor iinterdependenelorevideniate la nivelul mulimilor de date.

    Materia prim| utilizat| n orice activitate de analiz| a datelor este reprezentat| de o colecie sau mulime de date sauinformaii cantitative, referitoare la st|rile sau evoluiile unei mulimi de fenomene. Aceste date pot fi obinute fie pe caleobservaional|, fie pe cale experimental|.

    Din punct de vedere al analizei datelor, orice mulime de informaii supus| studiului este privit| ca fiind o reprezentarecodificat|, ntr-o form| mai mult sau mai puin implicit|, a unor aspecte informa ionale referitoare la niveluri i variaii ale unorfenomene, evoluii i tendine relevante, leg|turi i influene semnificative, ierarhii i configuraii structurale specifice.

    Datele supuse unui proces de analiz| nu evideniaz|,n mod direct i explicit, prin ele nsele, informaia util|i semni-ficativ|. De regul|, datele conin informaia util| i semnificativ| sub o form| mascat|, ascuns|, amestecat| ntr-un modnedifereniat i f|r| o logic| aparent|, cu informaia nesemnificativ|, rezultat| din influene accidentale i marginale. n acestsens, se poate spune c| la nivelul datelor primare supuse analizei, informaia semnificativ| se g|sete sub o form|diluat|idisipat| ntr-o mulime informaional| complex|, neordonat|i nestructurat| dup| vreun criteriu logic existent aprioric.

    Rolul analizei datelor este acela de a prelucra i filtra informaiile coninute n datele supuse studiului, cu scopul de a captasau de a extrage esena informaional| coninut| n aceste date i de a evidenia aceast| esen| informaional| ntr-o form| dereprezentare inteligibil|,sugestiv|,simplificat|isintetizatoare. Atingerea acestui scop presupune realizarea unei succesiunide transform|ri efectuate asupra datelor primare i implic| utilizarea unor metode i tehnici specifice. Aceste transform|ri auscopul de a maximiza relevana i interpretabilitatea datelori presupun, printre altele, eliminarea informaiilor redundantesau lipsite de semnificaie i generalitate, care au natur| accidental| sau marginal|. Din acest punct de vedere, procesul deanaliz| a datelor apare ca fiind un pro ces specific de transformare informaional|, proces care are ca intr|ri datele primare, iarca ieiri informaii sintetizatoare.

    Avnd n vedere mod ul n care se efectueaz|, precum i natura instrumentelor pe care le folosete, analiza datelor este, prinexcelen|, o analiz| de tip multidimensional, reprezentnd, n comparaie cu analiza simpl|, unidimensional|, o schimbare denatur| calitativ|. Analiza statistic| descriptiv| permite reprezentarea unor colecii foarte mari de da te ntr-o manier| sugestiv|i asimilabil|, simplificat|i schematizant|. Spre deosebire de aceasta, analiza multidimensional| constituie o generalizarenatural| a logicii i informaiilor referitoare la mai multe variabile sau dimensiuni.

    Activit|ile de manipulare a datelori informaiilor, de prelucrare i interpretare corect|i eficient| a acestora, presupunexistena unui cadru conceptual adecvat i utilizarea unor me tode i instrumente specifice. Att cadrul conceptual necesar, cti metodele i tehnicile utilizabile n prelucrarea, analiza i interpretarea datelori informaiilor, sunt subsumate de obiectul uneidiscipline tiinifice numit|analiza datelor.

    1.2 Specificitatea domeniului economico-sociali modalit|i de abordare

    Dei metodele i tehnicile de analiz| a datelor sunt utilizate n majoritatea dom eniilor activit|ii umane, putem afirma c|analiza datelor are cea mai larg| utilizare n domeniul econom ico-social, iar eficiena utiliz|rii ei n acest domeniu are o eficiena

    extrem de ridicat|. Aa cum cum o s| ar|t|m n continuare, activitatea de cunoatere tiinific| din domeniul economico-socialeste caracterizat| de anumite accente specifice, n comparaie cu alte domenii ale cunoaterii umane. n virtutea acestor elementede specificitate, domeniul economico-social pare a fi cel mai potrivit domeniu pentru utilizarea metodelori tehnicilor de analiz|

  • 8/3/2019 AMD Doctorat 2009

    3/134

    2

    multidimensional| a datelor.Dintre toate elementele de specificitate a domeniului economico-social, dou| consider|m a fi mai importante i mai

    relevante din punct de ved ere al utiliz|rii analizei datelor: complexitatea ridicat| a fenomenelor economico-sociale i naturacantitativ| a acestor fenomene. mpreun| cu multe alte caracteristici specifice, aceste dou| caracteristici fundamentale impunmodalit|i specifice de abordare pentru cunoaterea tiinific| din domeniul economico-social.

    Necesitatea de a sintetiza i de a simplifica n procesul de cunoatere a realit|ii, este impus| att de faptul c| dateleutilizabile ntr-o analiz| mascheaz|, ascund, anumite aspecte, ci i de faptul c| realitatea analizat| este caracterizat| de ocomplexitate foarte ridicat|, care nu poate fi cuprins|i neleas| numai pe baza intuiiei.

    n activitatea de analiz| cantitativ|, pe care se bazeaz| n mod direct cunoaterea tiinific| din cele mai multe domenii deactivitate, sunt implicate trei categorii eseniale de elemente: teorii i principii teoretice generale i specifice domeniuluiinvestigat, informaii cantitative i calitative referitoare la fenomenele supuse studiului, metode i tehnici de cuantificare,evaluare, estimare i testare a m|rimilor specifice i a relaiilor existente la nivelul realit|ii investigate.

    Teoriile i principiileteoretice care stau la baza oric|rei analize cantitative sunt reprezentate de mulimea cunotiinelortiinifice acumulate n decursul timpului, de realiz|rile obinute pe plan tiinific, att la nivelul general al cunoaterii umane,ct i la nivelul cunoaterii n domeniul abordat.

    Informaiile cantitative i calitative referitoare la fenomenele i procesele studiate exprim| o mulime de st|ri i evoluiiconcrete din realitatea investigat|i sunt rezultatul unui laborios proces de observare, m|surare i evaluare, proces n careintervin o serie de norme, principii, metodologii i instrumente specifice procesului de m|surare. Informaiile obinute dinrealitatea investigat|, n urma unor procese de observare i de m|surare, sunt cunoscute sub numele de date. Datele reprezint|materialul brut, empiric, care st| la baza tuturor deciziilor din orice domeniu de ac tivitate, iar de calitatea acestora depinde , nmod direct, calitatea respectivelor decizii.

    Metodele i tehnicile reprezint| un set de reguli,principiiiproceduri de analiz|,prelucrare i interpretare a datelor.n

    analiza datelor, metodele i tehnicile se refer| la cuantificare, evaluare, estimare i testare, i sunt reprezentate de o mulimeextins| i variat| de proceduri i instrumente statistico-matematice. Aceste proceduri sunt aplicate, sub o form| sau alta,informaiilor cantitative i calitative, datelor de intrare, n scopul deducerii anumitor rezultate i concluzii. De calitateametodelori tehnicilor utilizate ntr-o activitate de analiz|i de eficiena utiliz|rii lor depind, n mod direct i ntr-o proporiefoarte mare, att semnificaia i validitatea concluziilor obinute, ct i calitatea rezultatelor obinute.

    Combinarea, la nivelul analizei cantitative, a celor trei categorii de elemente menionate anterior, conduce la ob inerea unorrezultatei concluzii, care contribuie la adncirea procesului de cunoatere a realit|ii studiate i care se pot concretiza sub maimulte forme:

    obinerea de informaii relevante suplimentare privind starea, evoluia i conexiunile componentelor realit|ii investigate; relevarea unor noi principii i legit|i care guverneaz| micarea fenomenelori proceselor din aceast| realitate;formularea unor concluzii cu privire la existena unor leg|turi i specificit|i ce caracterizeaz| realitatea studiat|; validarea unor ipoteze formulate cu privire la populaiile reprezentate de fenomenele i procesele studiate; identificarea unor tipologiii structuri specificepe mulimea de fenomene i procese analizate; estimarea unor efecte i influene caracteristice interdependenelor dintre fenomene i procese;

    deducerea unor modele statistico-matematice, care s| descrie comportamentul fenomenelori proceselor; efectuarea de predicii cu privire la evoluia fenomenelori proceselor; efectuarea de simul|ri privind evoluia fenomenelori a interdependeelor manifestate ntre acestea.Fenomenele economico-sociale i micarea acestora n timp i spaiu, adic| procesele, au o caracteristic| ce le face s| se

    deosebeasc| n mod esenial, fundamental, de fenomene i procese specifice altor domenii d e activitate. Aceast| caracteristic|este dat| de faptul c| manifestarea la nivel observabil a acestor fenomene i a mic|rii lor, este extrem de complex|i mbrac|o deosebit de mare v arietate de forme, fiecare fenomen sau proces economico-social existnd subform| multiplicat| pe o scar|foarte mare . Proprietatea de mu ltiplicitate la o scar| foarte mare, pe care o au existena i manifestarea fenomene lor economicei sociale, este cunoscut| n literatura domeniului sub numele de caracter de mas|al fenomenelor economico-sociale.

    Formele sub care se manifest| fenomenele economice i sociale apar, de regul|, ca o amalgamare de aspecte esen iale ineeseniale, legate direct sau indirect de coninutul fenomenului, de ceea ce este esenial i stabil n comportamentul acestuia,fiind caracterizate n timp, cel pu in la suprafa|, de un grad relativ ridicat de instabilitate. Partea consistent|, semnificativ|istabil| a unui fenomen econo mico-social este, de obicei, ascuns| de aceast| multitudine de manifest|ri, astfel nct cunoatereaacesteia nu se poate face dect rareori prin observare direct|, fiind necesar, de cele mai multe ori, un deme rs logic extrem de

    complex, n cadrul c|ruia se urm|rete eliminarea a ceea ce este accidental, conjunctural, neesen ial i nesemnificativ nmanifestarea fenomenului, reinndu-se ceea ce este trainic, cu caracter de regularitate, esenial i semnificativ.O alt| caracteristic| a fenomenelor econ omico-sociale este cea legat| de multitudinea i eterogenitatea acestor fenomene,

    de dimensiunile la care are loc desf|urarea acestora, de numeroasele leg|turi funcionale existente ntre acestea i de multipleleinterdependene i condiion|ri dintre fenomenele economico-sociale i fenomenele specifice altor domenii. Gradul ridicat deinterconectare a elementelori multitudinea factorilor de influen|, implicai n manifestarea relaiilor de cauzalitate, reprezint|caracteristici definitorii pentru majoritatea fenomene lori proceselor de natur| socio-economic|.

    Amploarea complexit|ii din domeniul economico -social rezult|i din faptul c|natura i intensitatea relaiilor de interde-penden| cunosc o mare variabilitate n timpispaiu, c|sensul relaiilor de cauzalitate este reversibil, chiar contradictoriu,i c|, din cauza gradului ridicat de interconectare, manifestarea cauzalit|ii are loc, n multe situaii, sub forma unor "reaciin lan". Specificitatea domeniului economico-social i caracteristicile care l fac s| se diferenieze fundamental de celelaltedomenii de activitate, impun ca procesul de cunoatere n acest dom eniu, investigarea tiinific| a fenomenelori proceselorde natur| economico-social| s| poarte o amprent| specific|, particular|.

    Caracterul complex al manifest|rii fenomenelor economice i sociale face ca activitatea de cunoatere n acest domeniu

    s| fie puternic condiionat| att de modalitatea concret| de abordare a obiectului studiat, ct i de natura i puterea metodelor,tehnicilori instrumentelorde investigare utilizate.Faptul c| fenomenele economice i sociale se caracterizeaz| printr-un grad de complex itate foarte ridicat face ca activitatea

  • 8/3/2019 AMD Doctorat 2009

    4/134

    3

    Definiie : Fenomenul stohastic este acel fenomen observabil, ale c|rui manifest|ri particulare sunt incerte, dar careevideniaz| o anumit| regularitate a formelor de manifestare, o anumit|leg|tur|ntre aceste forme de manifestare.

    de investigare a comportamen tului acestora s| fie deosebit de dificil|i rezultatele acesteia s| aib| ungrad ridicat de relativitatedin punct de vedere al semnificaiei i exactit|ii. n aceste condiii, succesul investigaiilor socio-economice, valabilitatea istabilitatea concluziilor rezultate din analizele efectuate, depind n m od direct de co mpatibilitatea dintre natura instrumentelorde investigare folosite i specificul fenomenelor investigate.

    Alegerea modalit|ilor de abordare i a celor mai potrivite metode i tehnici de analiz| sau predicie reprezint| condiiade baz| pentru obinerea unor rezultate satisf|c|toare n activitatea de cu noatere a fenomenelor din domeniul economico-social.n ceea ce privete modalit|ile de abordare, cele mai des utilizate n analiza datelor sunt: abordarea sistemic|, abordareastatistic|i abordarea bazat| pe modelarea matematic|i informatic|.

    1.2.1 Abordarea sistemic|O principal| modalitate de abordare, esenial| pentru orice proces de investigare tiinific|, impus| cu necesitate mai ales

    n cazurile n care domeniul vizat este caracterizat de un grad ridicat de complexitate, este cea cunoscut| sub numele deabordare sistemic|.

    Att n sens teoretic, ct i n sens practic, abordarea sistemic| se detaeaz| ca metod| general|, universal| utilizat| ninvestigarea tiinific|, indiferent de domeniul conc ret al investig|rii tiinifice. n cazul particular al analizei datelor, abordareasistemic| are o importan| special|, att n faza de analiz| propriu-zis|, ct i n faza de interpretare sa rezultatelor.

    1.2.2 Abordarea statistic|Caracterul de mas| pe care l au fenomenele economice i sociale determin| ca manifestarea acestora, n timp i spaiu,

    s| intre sub incidena unuiprincipiu universal de regularitate i stabilitate, specific fenomenelor cu frecven| foarte mare deexisten|i apariie, principiu sintetizat sub forma uneia din cele mai importante legi din dom eniul cunoaterii umane: legea

    numerelor mari.Regularitatea i stabilitatea comportamentului fenomenelor economice i sociale sunt asigurate, n virtutea acestuiprincipiu, de tendina de compensare a influenelor cu sensuri contrarii, pozitive i negative, exercitate de factorii neeseniali,nesemnificativi i accidentali implicai n determinarea relaiilor de cauzalitate dintre fenomenele socio-economice.

    O consecin| direct|i imediat| a acestui principiu const| n faptul c| investigarea comportamen tului fenomenelor econ o-mice i sociale i formularea de concluzii sintetizatoare cu privire la am ploarea sau sensul evolu iei acestor fenomenesunt cumult mai uor de realizati caracterizate de un grad mult m ai ridicat de semnificaie i exactitate n cazul n care sunt supusestudiului colectivit|i mari de fenomene comparativ cu situaia n care studiul vizeaz| fenomene individuale, izolate.

    Necesitatea de a fructifica n procesul cunoa terii fenomenelori proceselor economice sau sociale facilit|ile ce rezult|din faptul c| acestea au caracter de mas|, impune ca n ntreaga activitate de analiz| a datelor din domeniul economico-socials| prevaleze modalitatea deabordare statistic|ifolosirea metodelori tehnicilor oferite de teoria probabilit|ilori statisticamatematic|.

    Moda litatea de abordare statistic| este impus| ca modalitate de investigare a fenomenelor de natur| socio-economic|ide faptul c| manifestarea acestora este caracterizat| de ungrad ridicat de incertitudine i imprevizibilitate.

    Elementele vizate n mod direct n cadrul investigaiilortiinifice bazate pe utilizarea metodelori tehnicilor propriianalizei datelor, sunt reprezentate de fenomenele cu natur| stohastic|, adic| de fenomenele al c|ror comportament are caracteraleatoriu, dar care manifest| o anumit|regularitate mai mult sau mai puin evident|.

    Necesitatea utiliz |rii n procesul de investigare a fenomenelor economice i sociale a modalit|ii de abo rdare statistic| estedeterminat|i de caracterul de relativitate, parialitate i inexactitate al informaiei din acest domeniu.

    Imposibilitatea de a obine informaii cu caracter exhaustiv despre desf|urarea fenomenelor economice i sociale impuneca activitatea de cunoatere a ansamblului acestei desf|ur|ri s| se bazeze pe informaii cu caracter parial, obinute pe baz|de sondaj. Extinderea concluziilor rezultate din analiza informaiilor obinute prin sondaj la nivelul ntregului ansamblu defenomene investigate de sondaj se bazeaz| pe metodele i tehnicile inferenei statistice. Una din cerinele de baz| impuse de modalitatea de abordare statistic| oric|rui demers tiinific ce are ca obiectinvestigarea comportamentului unor fenomene i procese economice sau sociale poate fi exprimat| prin necesitatea de a studiavariabilele ce d escriu acest comportament, n interdependenaisimultaneitatea lor.

    Analiza izolat| a comportamentului fiec|rei variabile este incompatibil| cu modalitatea de aborda re sistemic|i duce lao pierdere important| de informaie semnificativ| n cazul n care variabilele sunt interdependente. Mai mult dect att,concluziile pariale desprinse n urma unei astfel de analize nu pot fi generalizate i nu au valabilitate la nivelul compor-tamentului "legat" al v ariabilelor, influena interaciunii dintre acestea fiind, de cele mai multe o ri, covritoare.

    De regul|, analiza comportamentului individual al unui fenomen, n sensul s|u unidimensional, face obiectul analizei statistice descriptive. Analiza statistic| descriptiv| permite reprezentarea unor colecii foarte mari de date ntr-o manier|sugestiv|i asimilabil|, simplificat|i schematizant|.

    Considernd o mulime de variabile aleatoare ce descriu un anumit fenomen economic sau social, vom ob ine rezultate totaldiferite dac| vom studia, de exemplu, repartiia fiec|reia dintre ele izolat, separatde celelalte, comparativ cu situaia n caren studiu ar fi vizat| repartiia comun|, legat| a acestor variabile. Studiul comportamentului simultan, interdependent, al uneimulimi de variabile presupune metode i tehnici de comp lexitate i rafinament mult mai ridicate dect studiul comportamentuluiizolat al acestora i face obiectul unei discipline aparte, i anume analiza statistic| multidimensional|saumultivariat|.

    1.2.3 Abordarea bazat| pe modelarea matematic|i informatic|Aa cum am ar|tat anterior, complexitatea ridicat| ce caracterizeaz| domeniul economico-social i celelalte elemente despecificitate ale fenomenelor aparinnd acestuia, determin| ca orice demers tiinific ntreprins n scopul adncirii cunoaterii

  • 8/3/2019 AMD Doctorat 2009

    5/134

    4

    Definiie : Prin proces de m|surare se nelege totalitatea activit|ilor de atribuire a unor valori numerice pentrucaracteristicile fenomenului analizat.

    n acest domeniu s| presupun|, cu necesitate, utilizarea unor metode i tehnici de lucru corespunz|toare.Din rndul instrumentelor de investigare tiinific|, a c|ror utilitate n contracararea d ificult|ilor ridicate de gradul sporit

    de comp lexitate al domeniului studiat este de nenlocuit i a c|ror utilizare nsoete ast|zi demersul tiinific din aproape oricaredomeniu al cunoaterii umane, se detaeaz|modelarea matematic|i tehnica de calcul.

    Ca unul dintre cele mai u tile i eficiente instrumente de cunoatere a realit|ii, modelarea matematic|reprezint| procesulde descriere a comportamentului unor fenomene din natur|i societate sub o form| sintetic|, logic|i formalizat| matematic.Descrierea sub o form| matematic| a comportamentului fenomenelori proceselor din cele mai diverse dom enii de activitatea devenit ast|zi dorina i, de cele mai multe ori, scopul oric|rui cercet|tor, indiferent de domeniul n care acesta activeaz|.

    Surprinderea interdependenelor, a legit|ilori funcionalit|ilor ce caracterizeaz| fenomenele sau procesele din lumeace ne nconjoar|, sub forma sintetic| a unui model matematic, este, probabil, cea mai relevant| m|sur| a nivelului la care a ajunsgradul de cunoatere uman|.

    Din punct de vedere informaional, modelul matematic, n forma sa final|, poate fi privit ca un "concentrat informaional",avnd att calitatea de acum ulator al informaiei receptate din segmentul de realitate economic| sau social| pe care l descrie,ct i de generator de informa ie nou|, inexistent| n momentul co nstruirii lui.

    1.3 M|surarea i cuantificarea n domeniul economico-social

    Posibilitatea efectu|rii analizelor sau prediciilor din domeniul economico -social este strict condiionat| de existena uneibaze informaionale care s| cuprind| informaiile necesare cu privire la nivelul, structura sau evoluia n timp a fenomenelori proceselor supuse investig|rii, sau cu privire la condiion|rile cauzale ale acestor fenomene i procese.

    Ob inerea informaiilor necesare pentru activitatea de analiz| a datelor este, de regul|, rezultatul unor procese de observarei m|surare a fenomenelori proceselor supuse studiului i presupune existena unor instrumente adecvate.

    Informaiile referitoare la un anumit fenomen supus studiului, informaii necesare analizei comportamentului respectivuluifenomen, reprezint| rezultatul unui proces de m|surare. Acest proces reprezint|, de fapt, o aciune de atribuire de valorinumerice pentru caracteristicile respectivului fenomen.

    n cea mai mare parte a lor, informaiile necesare efectu|rii analizelor sau prediciilor din domeniul economico-socialtrebuie s| aib| natur| cantitativ|, s| reprezinteexprimarea sub form| numeric|a caracteristicilor specifice fenomeneloranalizate. Aceast| condiie presupune, n mo d implicit, necesitatea existenei unorunit|i de m|sur|, prin intermediul c|roradiferitele caracteristici ale fenomenelor economice sau sociale s| poat| fi exprimate, a unor instrumente adecvate pentrum|surarea caracteristicilor fenomenelori a unormodalit|i de exprimare numeric|.

    Din nefericire ns|, att unit|ile de m|sur|, ct i instrumentele utilizate pentru exprimarea sub o form| cantitativ| acaracteristicilor fenomenelor econo mice i sociale, sunt caracterizate de inexactitate i instabilitate, iar utilizarea acestora estegeneratoarea unei multitudini de erori cu natur| extrem de variat|.

    Exprimarea sub o form| numeric| a caracteristicilor fenomenelori proceselor economice sau sociale presupune un procesde observare a formelor individuale prin intermediul c|rora se manifest| acestea i de nregistrare a valorilor pe care le iauaceste caracteristici n momentul observ|rii.

    Odat| cu activitatea de nregistrare a m|rimilor caracteristicilor fenomenelori proceselor economico-sociale, adic| avalorilor luate de variabilele supuse studiului, are loc i un proces implicit de m|surare, de cuantificare, proces ce presupunefolosirea unor unit|i de m|sur| specifice i instrumente de lucru adecvate. De regul|, informaia rezultat| n urma acestui proceseste o informaie brut|, primar|, care este cunoscut| sub numele de dat|.

    Cele mai dificile probleme cu ca re este confruntat| investigarea fenomenelor econom ice sau sociale, de-a lungul ntreguluiir de procese de culegere, prelucrare i interpretare a informaiilor referitoare la aceste fenomene, apar tocmai n cadrulprocesului de observare i nregistrare, de m|surare i cuantificare a caracteristicilor fenomenelor. n general, putem spun e c|m|surarea i cuantificarea din domeniul socio-economic au ca obiective principale:

    stabilirea nivelului sau volumuluifenomenelor economice i sociale; evidenierea alc|tuirii lor structurale; caracterizarea evoluiei lor n timp sau spaiu;

    exprimarea leg|turilor acestora cu alte fenomene sau procese.Din punct de ved ere conceptual, toate aspectele fenomenelor sau pro ceselor care fac obiectul m|sur|rii i cuantific|rii sunt

    reunite sub termenul generic de caracteristiciale acestor fenomene sau procese.n activitatea de m|surare i cuantificare din domeniul economico-social apar o serie de dificult|i, determinate de

    specificitatea acestui domeniu, cum ar fi: problema unit|ilor de m|sur|, parialitatea informaiilor, problema erorilor, problemaimposibilit|ii m|sur|rii directe etc.

    1.3.1 Unit|ile de m|sur|O problem| dificil|i complex| care apare n mod frecvent n procesul de m|surare din domeniul economico-social, este

    cea dat| de faptul c| unit|ile de m|sur| utilizate pentru exprimarea sub form| numeric| a caracteristicilor unui anumit fenomennu sunt stabile. Cu o problem| de acest fel este confruntat|, n special, activitatea de m|surare i cuantificare din domeniuleconomic.

    Spre deosebire de cele ma i multe domenii ale tiinei, n domeniul economic, unit|ile de m|sur| cunosc modific|ri sub-staniale n timp, modific|ri ce confer| rezultatelor m|sur|torilor un puternic caracter de instabilitate. De cele m ai multe ori,

    variaia unit|ilor de m|sur| este indus| chiar de modific|ri, de un anumit tip, ale fenomenelor i proceselor studiate, alefenomenelor cu care acestea sunt, direct sau indirect, legate sau chiar a unor fenomene independente de fenomenele studiate.

  • 8/3/2019 AMD Doctorat 2009

    6/134

    5

    Definiie :Eroarea cu caracter sistematic poate fi definit | ca reprezentnd diferena dintre valoarea adev|rat|a uneim|rimi la nivel de populaiei valoarea obinut| pentru aceast| m|rime n urma m|sur|rii tuturor unit|ilor elementareale populaiei.

    Definiie : Eroarea cu caracter accidental, aleatorpoate fi definit| ca reprezentnd diferena dintre valoarea uneim|rimi calculate pe baza unit|ilor aparinnd unui eantioni valoarea aceleiai m|rimi calculat| pe baza tuturorunit|ilor populaiei .

    1.3.2 Parialitatea informaiilorO alt| problem| ce ridic| o serie de dificult|i n m|surarea i cuantificarea din domeniul economico-social, este cea legat|

    de parialitatea informaiilordisponibile pentru activit|ile de analiz| a datelor.Complexitatea fenomenelor economice i sociale, multitudinea a formelor de manifestare n timp i spaiu a acestora, fac

    ca obinerea de informaii printr-o observare com plet| a desf|ur|rii acestor fenomene s| fie de cele mai multe ori imposibil|.n aceste condiii, modalitatea cea mai comod|, dari cea mai eficient|, de obinere a informaiilor necesare efectu|rii analizelorsau realiz|rii prediciilor este cea a observ|rii selective a manifest|rii fenomenelor.

    Aceast| modalitate de investigare se bazeaz| pe faptul c|, n anumite condiii, cunoaterea carac teristicilor ntregii populaii

    poate fi ob inut| prin studierea direct| numai a unui anumit num|r de unit|i ce intr| n componena acesteia, num|r care estemult mai redus n comparaie cu volumul total al populaiei. Alegerea unit|ilor ce vor fi efectiv supuse procesului de m|surarei nregistrare se face dup| criterii i reguli foarte precise, fundamentate riguros din punct de vedere statistico-matematic.Valorile pe care le iau ca racteristicile unit|ilor studiate prin intermediul acestui procedeu alc|tuiesc aa-numitul eantion deobservaii.

    Investigarea fenomenelori proceselor economice sau sociale pe baza informaiilor provenite din observ|ri selective iconcluziile rezultate n urma acestei investig|ri sunt puternic influenate de gradul n care informa iile ce alc|tuiesc eantionulsunt reprezentative la nivelul ntregii populaii de la care au fost obinute. De regul|, gradul de reprezentativitate al unui eantioneste invers proporional cu gradul de eterogenitate a popu laiei i direct proporional cu num|rul de unit|i incluse n eantion.

    n condiiile n care informaiile obinute de la unit|ile selectate n eantion nu reproduc ntr-o m|sur| acceptabil| compor-tamentul fenomenului la nivelul ntregii popula ii, rezultatele analizelor efectuate vor fi incorecte, iar conc luziile formulate pebaza acestora vor fi eronate. De aceea, n toate cazu rile n care baza informaional| utilizat| n procesele de analiz| a dateloreste obinut| pe calea observ|rii selective, este necesar| o laborioas| activitate de verificare a semn ificaiei rezultatelori d evalidare a concluziilor desprinse pe baza acestor rezultate.

    Implicaiile negative ale caracterului de parialitate a informaiilor din domeniul economico-social asupra valabilit|iiconcluziilor formulate n urma prelucr|rii acestor informaii, pot fi mult diminuate, dac| organizarea cercet|rii selective estef|cut|innd cont de o serie de principii de baz| ale teoriei seleciei, dac| n procesul de prelucrare a informa iilor sunt utilizatemetodele i tehnicile statistico-matematice cele mai potrivite i dac| n extinderea rezultatelor nu sunt nc|lcate o serie deprincipii statistice e lementare.

    Respectarea cu strictee a cerinelor de acest tip poate conduce la ob inerea unor rezultate cu adev|rat excepionale, chiaratunci cnd cantitatea de informaie disponibil| este neglijabil| n raport cu dimensiunea i proporiile fenomenului studiat.

    1.3.3 ErorileImpactul numeroaselor imperfeciuni legate de m|surarea i cuantificarea din domeniul economico-social este concretizat,

    din punct de vedere al proceselor de analiz| a datelor, n manifestarea unor d istorsiuni i inexactit|i informaionale.n mai toate cazurile, informaiile disponibile pentru efectuarea unor analize sau prognoze sunt afectate de erori. Faptul

    c| informaiile disponibile sunt puternic afectate de erori, ale c|ror surse sunt numeroase, variate i dificil de controlat, impuneutilizarea unor modalit|i specifice de abordare i a unor instrumente de lucru corespunz|toare.

    Erorile ce nsoesc observaiile rezultate din m|surarea i cuantificarea fenomenelori proceselor economice sau socialepot fi grupate n dou| mari categorii: erori cu caracter sistematic i erori cu caracter accidental, aleator.

    Erorile cu caracter sistematicSunt erorile care afecteaz| n mod substanial, semnificativ, natura i semnificaia informaiilori care pot determina

    denaturarea drastic| a rezultatelor obinute i formularea unor concluzii fundamental eronate.Sursele erorilor cu caracter sistematic sunt numeroase i extrem de variate: gradul redus de reprezentativitate a

    informaiilor obinute pe baz| de eantionare, imperfeciunile metodologice specifice calculului unor indicatori economici,raport|rile incorecte determinate de interesele de natur| fiscal| ale agenilor economici,falsific|rile informaionale la nivelguvernamentaletc.

    Problema cea mai dificil| legat| de impactul negativ al erorilor cu caracter sistematic este aceea c |, spre deosebire deerorile cu caracter ntmpl|tor, n cazul acestor erori nu se manifest| tendina de compensare, astfel nct distorsionareainformaiei determinat| de aceste ero ri are loc numai ntr-un sens.

    n cazul erorilor de natur| sistematic|, influena negativ| a acestora nu mai poate fi estompat| de caracterul de mas| alfenomenelor economico-sociale, care n cazul altor tipuri de erori poate conduce la compensarea efectelor erorilor.

    Erorile cu caracter accidentalSunt erorile a c|ror influen| asupra semnificaiei informaiilor este neglijabil|; distorsiunile provoca te de acest tip de e rori

    la nivelul datelor ce descriu comportamentul fenomenelor economice sau sociale sunt, de regul|, de sens opus, astfel nct nnumeroase situaii are loc o compensare a influenelor acestora.

    Faptul c| erorile de acest tip sunt distribuite dup| legea de probabilitate normal| ofer| posibilitatea abord|rii statistice a

    influenelor cu caracter distorsionant pe care le pot avea acestea asupra datelor.Pe de alt| parte, n virtutea legii numerelor mari, are loc un efect de compensare a erorilor de tip accidental, impactul

    negativ al acestora asupra calit|ii informaiilor utilizate n analiz| devenind neglijabil.

  • 8/3/2019 AMD Doctorat 2009

    7/134

    6

    n principal, sursele erorilor cu caracter accidental, ntmpl|tor, in de o serie de factori cum ar fi: imperfeciunile instru-mentelor de m|surare, deficien e n nregistrarea valorilor caracteristicilor urm|rite, efectuarea inexact| a unor calcule etc.

    O nsemn|tate cu adev|rat excepional| pentru procesele de m|surare i cuantificare n care intervin erori cu caracterntmpl|tor, o are faptul c| erorile de acest tip sunt distribuite dup|legea normal|, de medie nul|.

    Aceast| proprietate este deosebit de util| att pentru m|surarea impactului pe care e rorile l au asupra informaiilor obinuten urma proceselor de m|surare, de cuantificare i de analiz| a datelor, ct i pentru dezvoltarea unor procedu ri specifice careau ca scop minimizarea influenei erorilor asupra rezultatelor ob inute n analiza datelor.

    Formarea valorii unei m|sur|tori individuale, sub influena erorilor sistematice i accidentale, poate fi descris| cu ajutorul

    relaiei urm|toare:

    Efectuarea analizelor de date n condiiile existenei i manifest|rii erorilor de tip accidental, determin| necesitatea utiliz|riiunor metode i tehnici adecvate, de natur| statistico-matematic|.

    1.3.4 M|surarea indirect|n numeroase situaii din investigarea tiinific|, este imposibil| m|surarea direct| a unor fenomene sau procese specifice

    domeniului economico-social. Situaiile de acest fel sunt ntlnite n cazul existenei factorilor lateni sau ascuni, care aucaracter neobservabil i care, n mod implicit, nu pot fi supui unui proces direct de m|surare.

    Factorii lateni sunt expresia manifest|rii unor fenomene de maxim| generalitate, cu semnificaie i consisten| foarteimportante, caracterizate printr-o mare stabilitate a m anifest|rilor lor. Ei reprezint|agreg|ri ale manifest|rilor unei multitudinicomplexe de fenomene cu natur| particular|. Datorit| semnificaiei i importanei prin care factorii lateni se detaeaz| de

    fenomenele care reprezint| forme particulare de manifestare ale acestora, n numeroase investigaii tiinifice scopurile urm|ritesunt direct i strns legate ntr-o m|sur| mult mai mare de existena factorilor lateni, n comparaie cu manifest|rile particulareale acestora. Dei au caracter neobservabil, factorii lateni se manifest| totdeauna n mod indirect, prin intermediul unor formeparticulare de manifestare, forme care po t avea caracter observabil i care pot fi supuse unui proces de m|surare.

    n analiza datelor, se consider| c| formele particulare prin care se man ifest| factorii lateni reprezint|indicatori ai factorilorlateni. n acest fel, informaiile disponibile cu privire la aceti indicatori pot fi folosite pentru a deduce informaii cantitativei calitative despre factorii lateni.

    Problema m|sur|rii indirecte, prin intermediul unor indicatori specifici, a factorilor cu natur| latent|, apare n mod frecventn cazul investig|rii unor caracteristici psihosociale, n cercet|rile legate de cuantificarea nivelului de dezvoltare economic|,nivelului de dezvoltare social| sau nivelului progresului tehnic, n construirea unor indicatori agrega i etc. n aceste cazuri, seapeleaz| la proceduri speciale de estimare, la metode i tehnici de m|surare indirect| sau la metode de analiz| multi-dimensional|, cum ar fi: analiza componentelor principale, analiza factorial| sau analiza corespondenelor.

    1.4. Definirea analizei datelor

    Analiza datelor are ca obiectiv fundamental extragerea informaiei relevante, semnificative, care este coninut| n date,n informaia primar|. Aceast| informaie este utilizat|, n continuare, pentru rezolvarea unor probleme s pecifice ale analizeidatelor: testare, estimare, interpretare, predicii etc.

    Conceptul de analiz| a datelor este un concept extrem de cuprinz|tori dificil de definit din punct de vedere al sferei decuprindere, iar metodele i tehnicile utilizate n analiza datelor variaz| de la cele mai simple modalit|i de prezentare grafic|a datelori calcul al u nor indicatori statistici specifici, pn| la cele mai sofisticate metode de analiz| multidimensional|.

    Definiie :Activitatea de analiz| a datelorpoate fi definit| ca reprezentnd osuccesiune de operaii de prelucrare iinterpretare, operaii efectuate asupra unor informaii primare referitoare la fenomene i procese din realitatea econo-

    mico-social|i bazate pe o mare varietate de metode i tehnici specifice, n scopul adncirii cunoaterii comportamentului

    acestor fenomene i procese i al formul|rii unor concluzii cu privire la specificitatea manifest|rii lor.

    n figura urm|toare, este evideniat| o reprezentare simplificat| a procesului general de analiz| cantitativ|, a modului ncare intervin cele trei elemente menionate anteriori a principalelor faze ale acestui proces.

    Figura 1.1: Reprezentarea simplificat| a unui proces general de analiz| cantitativ|

  • 8/3/2019 AMD Doctorat 2009

    8/134

    7

    Privit ntr-un mod foarte genera l, procesul de analiz| a datelor poate fi prezentat ca o succesiune de operaii sintetizate subforma urm|toarelor activit|i:

    formularea ipotezelor cu privire la compo rtamentul fenomenului ce constituie obiectul studiului; organizarea experimentelornecesare m|sur|rii caracteristicilor fenomenului studiat; culegerea datelorprivind comportamentul fenomenului ; analiza i interpretarea datelordisponibile;formularea concluziilor, efectuarea predic iilori luarea deciziilor.

    Scopul urm|rit n cele mai multe probleme de analiz| a datelor este legat de crearea condiiilor informaionale necesare

    pentru efectuarea de prediciicu privire la comportamentul fenomene lor investigate.Dei ntre activitatea de analiz| a datelori activitatea de predicie exist| numeroase deosebiri, legate n primul rnd de

    natura celor dou| activit|i, totui, ntre cele dou| genuri de activit|i exist| o important| suprapunere. Aceast| suprapunereeste determinat| de existena unor modalit|i comune de abordare, de utilizarea unor concepte teoretice identicei de folosireaaceleiai game de instrumente de lucru.

    Cu toate c| obiectivele intermediare urm|rite n activitatea de predicie sunt similare celor urm|rite n analiza d atelor,totui, scopul final al oric|rei activit|i de predicie este legat n mod direct de p refigurarea evoluiei viitoare a fenomeneloriproceselor economice sau sociale, a mo dific|rilor structurale ce pot fi nregistrate n viitor de aceste fenom ene i procese.

    Atingerea acestui scop este ns| condiionat| de desf|urarea unei laborioase activit|i de analiz| a datelor cu privire larealitatea fenomenului care face obiectul prediciei, activitate care, de regul|, precede procesul de predicie propriu-zis.

    Coninutul activit|ii de analiz| a datelor din domeniul econom ico-social este strns legat de natura claselor de pro blemesupuse rezolv|rii. n funcie de aceast| natur|, analiza datelor poate presupune o anumit| succedare de activit|i specifice,utilizarea unei anumite game de metode i tehnici de lucru, urm|rirea anumitor obiective.

    n rndul categoriilor de probleme a c|ror rezolvare conduce la efectuarea unui proces de analiz| a datelor menion|m:

    identificarea legit|ilor ce guverneaz| micarea fenomenelori proceselor economice sau sociale, a principalelortendine i regularit|i specifice evoluiei acestora; identificarea principalilor factori sub a c|ror influen| se formeaz| comportamentul unor fenomene i procese; stabilirea sensului i intensit|ii leg|turilor cauzale manifestate ntre diferite fenomene i procese; determinarea gradului n care o mulime de factori de influen| contribuie la formarea unui anumit efect; verificarea unor ipoteze cu p rivire la existena unor leg|turi de tip cauzal, la po sibilitatea ca anumite caracteristici

    ale unor fenomene s| nregistreze anumite valori specifice etc; ierarhizarea factorilor ce determin| un anumit efect n funcie de importana i semnificaia influenei acestora; stabilirea modului n care comportamentul fenomenelor este afectat de anumite decizii sau m |suri de politic|

    economic|i social|; identificarea principalelor posibilit|i prin intermediul c|rora comportamentul fenomenelor s| poat| fi influenat ntr-

    un sens dorit; determinarea sensurilor n care comportamen tul unui anumit fenomen po ate evolua, a st|rilor posibile n care acesta

    se poate afla n spaiu i timp sau efectuarea de predicii privind st|rile i evoluia acestui fenomen.

    n funcie de specificul fiec|reia din aceste clase de probleme, activitatea de analiz| a datelor se poate co ncretiza printr-unanumit gen de operaii de mode lare statistico-matematic|i prelucrare informaional| viznd:simplificarea i sintetizarea relaiilor de cauzalitate; m| surarea interdependenelor, cuantificarea influenelori verificarea semnificaiei acestora; descrierea statistico-matematic| a comportamentului fenomenelor; efectuarea de predicii; m|surarea gradului de omogenitate sau eterogenitate pentru anumite categorii de fenomene; clasificarea i ierarhizarea fenomenelor.

    Fiecare din aceste tipuri de operaii presupune utilizarea unor instrumente de lucru corespunz|toare, eficiente n raport cuspecificul problemei considerate. Dintre principalele metode i tehnici proprii analizei multidimensionale a datelori utilizatepentru rezolvarea problemelor enumerate anterior men ion|m: analiza componentelor principale, analiza factorial|, analizacorespondenelor, tehnicile de scalare m ultidimensional|, metodele i tehnicile de estimare , analiza corelaiilor canonice,analiza varianei, analiza regresiei liniare i neliniare, metodele i tehnicile de recunoatere a formelor.

    1.5 Clasificarea metodelor de analiz| a datelor

    n general, n analiza de date, obiectul studiului este reprezentat de c|tre o mulime de date structurat| sub forma unuianumit num|r de variabile i a unui anumit num|r de observaii. Aceast| structur| informaional| este reprezentat| prinintermediul unei entit|i cunoscute sub numele de matrice de observaii.

    n funcie de natura va riabilelor analizate i de informaiile existente aprioric cu privire la natura leg|turilor cauz|-efectn care sunt implicate variabilele, metodele de analiz| a datelor pot fi grupate n dou| mari categorii: metode de analiz| adependenei i metode de analiz| a interdependenei.

    Metodele de analiz| a dependeneisunt metode statistice utilizate n cazul n care variabilele considerate n cadrul uneianalize pot fi grupate n dou|submulimii au ca scop testarea prezenei sau absenei unor interdependene ntre cele dou|submulimi de variabile.

    n situaia n care exist| informaiile necesare, astfel nct, variabilelor dintr-un set li se poate atribui semnificaia devariabile dependente, iar variabilelor din cel|lalt set li se poate atribui semn ificaia de variabile independente, metodele deanaliz| a dependenei au ca scop de a determina dac|i cum variabilele independente influeneaz| variabilele dependente, att

    n manier|individual|, ct i n manier|comun|,simultan|.De regul|, dndu-se o mulime de date reprezentate de observaiile efectuate asupra unor variabile, cu ajutorul metodelorstatistice se poate verifica doar dac| exist| leg|turi, interdependene ntre variabile, putndu-se, eventual, determina sensul

  • 8/3/2019 AMD Doctorat 2009

    9/134

    8

    leg|turilor (directe sau inverse) sau chiar m|sura intensitatea acestor leg|turi. Ceea ce nu se poa te stabili cu ajutorul metodelori tehnicilor statistice este natura, sensul rela iilor de cauzalitate, respectiv, care sunt variabilele dependente i care suntvariabilele independente ce determin| evoluia, micarea celor depend ente. Pentru a stabili cu exactitate relaia cauz|-efectestenevoie de informaii suplimentare, apriorice, exogene n raport cu metodele i tehnicile statistice utilizate.

    Exist| un anumit context al analizei datelor, n cadrul c|ruia delimitarea variabilelor dependente de variabilele independenteeste foarte clar|, neechivoc|. Acest context este ntlnit n cadrul experimentelor controlate, cnd, n urma stabilirii unorcombinaii de nivele ale variabilelor independente, sunt m|surate nivelele nregistrate pentru variabilele depend ente, ca urmarea influenei exercitate de fiecare combina ie de nivele ale variabilelor dependente.

    n multe situaii, analiza datelor este efectuat| pe mulimi de variabile pentru care nu exist| nici interesul i nici po sibilitateaconceptual| de a separa din mulimea variabilelor analizate o submulime care s| reprezinte variabilele dependente i o alt|submulime care s| reprezinte variabile independente. n aceste situaii, sunt utilizate metode d e analiz| specifice, cunoscutesub numele de metode de analiz| a interdependenei.

    Metodele de analiz| a interdependenei sunt metodele statistice utilizate n cazul n care nu exist| posibilitatea de aidentifica n mulimea variabilelor analizate variabile dependente i variabile independente i care au scopul de a stabili din cecauz|i n ce m|sur| variabilele analizate sunt legate ntre ele. Utilizarea acestor metod e are o mare varietate de scop uri, dintrecare, printre cele mai importante, amintim: m|surarea gradului de interdependen |, identificarea variabilelor cu semnificaierelevant|, identificarea unor categorii sau clase de variabile.

    1.5.1 Metode de analiz| a dependeneiMetodele de analiz| a dependenei pot fi clasificate n func ie de mai multe criterii, dintre care cele mai importante sunt

    urm|toarele: num|rul de variabile dependente: o singur| variabil| dependent|sau mai multe variabile dependente;

    num|rul de variabile independente: o singur| variabil| independent|sau mai multe variabile independente; tipul scalei pe care sunt m|surate variabilele dependente:scal| non-metric| sauscal| metric|; tipul scalei pe care sunt m|surate variabilele independente:scal| non-metric| sauscal| metric|;

    Metodele de analiz| a dependenei pot fi clasificate n func ie de num|rul de variabile dependente i de num|rul devariabile independente n dou| grupe:

    metode unidimensionale de analiz| a dependenei; metode multidimensionale de analiz| a dependenei.

    n categoria metodelor unidimensionale se ncadreaz| analiza regresiei simple, analiza d iscriminantului, procedurile unidi-mensionale de verificare a unor ipoteze e tc.

    Metodele de analiz| multidimensional| a dependenei se mpart, n func ie de num|rul variabilelor dependente, n dou|categorii:

    metode de analiz| multidimensional| cu o singur| variabil| dependent|; metode de analiz| multidimensional| cu mai m ulte variabile dependente.

    n rndul metodelor de analiz| multidimensional| cu o singur| variabil| dependent| pot fi menionate: analiza regresiei

    multiple, analiza discriminantului, analiza varianei etc.Ca metode de analiz| multidimensional| cu mai multe variabile dependente putem meniona: analiza corelaiilor canonice,analiza multidimensional| a varianei etc. O clasificare sintetic| a metodelor de analiz| a dependenei, n funcie de criteriilede mai sus, este prezentat| n tabelul urm|tor.

    Clasificarea metodelor de analiz| a dependenei

    Nu m|rvariabile

    independente

    Nu m|r variabile dependente

    O variabil| Mai multe variabile

    Scal| non-metric| Scal| metric| Scal| non-metric| Scal| metric|

    O variabil|

    Scal| non-metric|

    Analiza discrimi-nantului (discret|)

    testul t Analiza multigrup adiscriminantului

    (discret|)

    Analiza multidi-mensional| a varianei

    (MANOVA)

    Scal|metric|

    Analizadiscriminantului Regresie logistic|

    Regresiesimpl|

    Analiza multigrup adiscriminantului

    Analiza corelaiilorcanonice

    Mai multevariabile

    Scal| non-metric|

    Analiza discrimi-nantului (discret|) Analiza simultan|(MONANOVA)

    AnalizaANOVA

    Analiza multigrup adiscriminantului(discret|)

    Analiza multidi-mensional| a varianei(MANOVA)

    Scal|metric|

    Analizadiscriminantului Regresie logistic|

    Regresiemultipl|

    Analiza multigrup adiscriminantului

    Analiza corelaiilorcanonice

    1.5.2 Metode de analiz| a interdependeneiAnaliza interdependenei are ca scop s| identifice i s| evidenieze situaiile n care variabilele sunt corelate ntre ele i s|explice modul n care are loc corelarea variabilelor supuse analizei. n funcie de num|rul de variabile analizate, metodele de

  • 8/3/2019 AMD Doctorat 2009

    10/134

    9

    analiz| a interdependenei se mpart n dou| categorii: metode de analiz| a interdependenei dintre dou| variabile; metode de analiz| a interdependenei dintre mai m ulte variabile.

    n cadrul metodelor de analiz| a interdependenei dintre dou| variabile putem meniona: analiza corelaiei simple, analizabazat| pe tabele de contingen| etc.

    Dintre metodele de analiz| a interdependenei dintre mai multe variabile putem meniona: analiza componentelor principale,analiza factorial|, analiza corespondenelor, analiza cluster etc. n tabelul urm|tor este prezentat| sintetic clasificarea metod elori tehnicilor de analiz| a interdependenei.

    Clasificarea metodelor de analiz| a interdependenelor

    Nu m|rvariabile

    Tipul scalei

    Scal| non-metric| Scal| metric|

    Dou| variabile Tabele de contingen|(bidimensionale) Modele log-liniare

    Analiza corelaiei simple

    Mai multe

    variabile

    Analiza corespondenelor Modele log-liniare Tabele de contingen|(multidimensionale)

    Analiza componentelorprincipale Analiza factorial|

    1.6 Analiza preliminar| a datelor

    Una din cele mai importante etape ale procesului de analiz| a datelor din domeniul economico-social este cea a analizeipreliminare, cunoscut| i sub numele de analiz| exploratorie a datelor. Analiza preliminar| este o activitate anterioar|,preg|titoare, a analizei propriu-zise a datelor, care are ca scop ini ializareaprocesului de analiz |. n cadrul acestei etape, infor-ma iile primare disponibile sunt supuse unui proces de prelucrare n cadrul c|ruia are loc o filtrare a informaiilor din punct devedere al semnificaiei i utilit|ii pe care le au acestea n raport cu scopurile urm|rite. Activitatea de analiz| preliminar| adatelor presupune utilizarea unei game variate de metode i tehnici statistico-matematice n scopul obinerii unei sugestivecaracteriz|ri statistice a a cestor informaii.

    Preponderent| ca utilizare n faza de analiz| preliminar| a datelori cu o utilitate de necontestat pentru activitatea tiinific|din aceast| etap|, este analiza grafic|. Utilizarea tehnicilor de analiz| grafic| n faza preliminar| a analizei datelor vizeaz|,n principal, urm|toarele categorii de probleme:

    identificarea principalelor tendine manifestate la nivelul observa iilor disponibile; depistarea principalelor leg|turi existente ntre variabilele supuse analizei; detectarea valorilor extreme, izolate, a c|ror apariie n mulimea datelor analizate nu se justific| din punct devedere statistic.

    Exist| n prezent numeroase instrumente software, cu ajutorul c|rora pot fi efectuate, ntr-o manier| comod|i eficient|,cele mai complexe reprezent|ri grafice.

    1.7 Suportul software n analiza datelor

    Apariia calculatoarelor bazate pe microprocesoare i larga accesibilitate a acestora din punct de vedere al preului isoftware-ului aplicativ au f|cut ca, n prezent, s| nu existe domeniu de cerce tare n care calculatorul electronic s| nu fie instru-mentul cel mai frecvent folosit pentru rezolvarea celor mai diverse probleme. Prelucrarea unui volum uria de informaii, pebaza unor algoritmi de o complexitate deoseb it|i n condiii de precizie ridicat|, nu se poate realiza dect cu ajutorul calcula-torului electronic, chiar a unui calculator electronic pe rformant.

    n domeniul analizei datelor, exist| zeci i zeci de produse software, de dat| mai mult sau mai puin recent|. O inventariere,pe care nu o putem pretinde a fi exhaustiv|, dar care poate fi considerat| ca fiind minimal|, pe care am f|cut-o n anul 2005,cu privire la instrumentele software existente n lume la acest moment, ne-a condus la identificarea a peste 100 de astfel deinstrumente software specializate. Num|rul lor este cu att mai semnificativ cu ct aceste produse software sunt de notorietatemondial|, avnd o larg| utilizare n domeniul analizei datelor.

    Printre cele mai noi i mai performante instrumente software existente n prezent, destinate, total sau parial, activit|ilorde analiz| a datelor, putem meniona:

    SPSS 10.0, SPSS Inc., Chicago, IL, USA, 1999;STATISTICA 6.0, StatSoft Inc., Tulsa, OK, USA,2001;S-PLUS 2000, MathSoft Inc., Seattle, Washington, USA, 1999;SAS 8.2, SAS Institute Inc., Cary, NC, USA, 2001;SYSTAT 9.0, SPSS Inc., Chicago, IL, USA, 1999;MATHEMATICA 4.0 , Wolfram Research, Champaign, IL, USA,1999;EVIEWS 3.0, Quantitative Micro Software, Irvine, CA, USA, 2000.

    n afar| de existena unei mari variet|i de instrumente software destinate analizei datelor, n prezent se poate identificao tendin| de dezvoltare exploziv| a preocup|rilor din acest domeniu, tendin| determinat| de necesit|ile informaionale totmai mari i mai rafinate ale indivizilori entit|ilor economice i sociale.

  • 8/3/2019 AMD Doctorat 2009

    11/134

    10

    Definiie:Datele reprezint| expresii cantitative i calitative ale unor fenomene i procese din realitatea nconjur|toare.

    Definiie: Populaia sau colectivitatea general|este reprezentat| de mulimea tuturor m|sur|torilor efective sauconceptuale care prezint| interes pentru cercet|tor sau experimentator.

    Definiie:Eantionul reprezint| o submulime de m|sur|tori selectate dintr-o populaie, o submulime a populaieistatistice supus| investigaiei tiinifice.

    Tema 2. Concepte i operaii specifice econometrieii analizei datelor

    2.1 Concepte fundamentale ale analizei datelor

    Teoria i practica analizei datelor se bazeaz| pe o serie de concepte fundamentale, a c|ror definire este deosebit deimportant| pentru nelegerea demersului tiinific presupus de acest tip de analiz|, pentru definirea i nelegerea procedurilori instrumentelor specifice ale acestei discipline, pentru desf|urarea eficient| a organiz|rii i proiect|rii activit|tilor de analiz|i pentru interpretarea rezultatelor obinute din analiz|.

    Conceptele utilizate n analiza datelori definirea riguroas| a acestora prezint| importan| nu numai pentru a facilitadefinirea i nelegerea procedurilor, metodelori tehnicilor de analiz| a datelor, ci i pentru asigurarea unei modalit|i coerentei sugestive de interpretare i prezentare a concluziilor rezultate din analiz|. Pe lng| conceptele p roprii, specifice, n analizadatelor sunt utilizate numeroase concepte care in de domenii nrudite cu analiza datelor, cum ar fi: teoria probabilit|iloristatistica, econometria, teoria economic|, informatica etc. Din acest motiv, mulimea conceptelor cu care se opereaz| ndomeniul analizei datelor este extrem de cup rinz|toare i extrem de variat|.

    2.1.1 DataConceptul cel mai important i cel mai frecvent ntlnit n analiza d atelor, care, de fapt, intr|i n alc|tuirea numelui acestui

    tip de activitate tiinific|, este reprezentat de da t|. Importana acestui concept pentru domeniul analizei datelor este, cuadev|rat, covritoare, deoarece el este cel care definete att intr|rile oric|rui proces de analiz| a datelor, materia prim|supus|prelucr|rii, ct i, ntr-un sens general, ieirile sale, rezultatele i concluziile obinute.

    Datele pot fi privite ca reprezentnd semnale i mesaje provenite din realitatea nconjur|toare, pe baza c|rora receptoruli poate forma o anumit| imagine despre respectiva realitate, poate ob ine un anumit grad de cunoatere a acelei realit|i.Imaginea format| este cu att mai fidel| n raport cu realitatea, cu ct cantitatea semna lelori mesajelor este mai mare, respec tiv,cu ct acestea sunt mai puin afectate de perturbaii i de distorsiuni. De regul|, datele nu sunt recepionate n mod pasiv debeneficiarul lor, f|r| nici un efort din partea acestuia. Aproape f|r| excepie, obinerea datelor necesare pen tru orice activitatede analiz| constituie un proces costisitori laborios.

    n analiza datelor, datele reprezint| expresia cantitativ| sau calitativ| a unor fapte reale, care sunt manifest|ri alefenomenelori proceselor investigate. Eterogenitatea fenomenelori a manifest|rii concrete a acestora face ca datele referitoarela ele s| fie extrem de variate.

    Datele pot s| difere n funcie de mai muli factori: de sursa care le-a generat, de tipuli de natura lor. Indiferent devarietatea lor, datele pot fi grupate n trei categorii fundamentale: date cantitative , date calitative i date mixte. Toate cele treitipuri de date po t fi, ns|, exprimate sub form| cantitativ|.

    2.1.2 Populaia i eantionulUnul din conceptele fundam entale ale analizei datelor, de care este legat| definirea multora dintre conceptele uzuale ale

    acestei discipline este cel de populaie statistic|.n raport cu acest concept fundam ental sunt definite majoritatea celorlalte concepte utilizate n analiza datelor: eantion,

    caracteristici, variabile, observaii, parametri, grade de libertate.

    n general, se poate spune c|populaia statistic|reprezint|, obiectul de studiu global al analizei datelor. Aceasta deoarecemajoritatea tehnicilori instrumentelor de analiz| a datelor au ca scop deducerea unor legit|i care guverneaz| populaia

    statistic|, ob inerea unor estimaii pentru o serie de m|rimi specifice aceleiai populaii statistice, efectuarea de prediciireferitoare la structurarea pe tipologii sau la evoluia populaiei statistice.

    Dei populaia reprezint| obiectul investigaiei tiinifice, totui, analiza datelor vizeaz| n mod direct, aproape exclusiv,observaiile de la nivelul eantionului.

    Populaia statistic|poate fi definit| ca reprezentnd totalitatea observaiilor posibile dintr-un studiu. Generic, o unitatecomponent| a unei populaii statistice se nu mete unitate elementar|, element, individ,subiect, obiect,profil,form|, articolsau caz. Ca exemple de unit|i elementare ale unei populaii statistice putem meniona: cump|r|torul, firma, locuitorul unei |risau al unui ora, produsul, familia etc.

    n funcie de num|rul, finit sau infinit, al elementelor din care este alc|tuit| o populaie statistic|, aceasta poate fi de dou|tipuri:populaie finit|ipopulaie infinit|.

    Teoretic, ntr-o problem| de analiz| a datelor po t fi studiate, fie toate observa iile posibile, adic| ntreaga populaie, fieo parte, mai mare sau ma i mic| a acestora, numit|eantion.

    Eantionul are o importan| fundamental| n analiza datelor deoarece acesta, i nu populaia total|, reprezint|, de fapt, bazainformaional| utilizat| n procesele de analiz| a datelor. Informaiile primare manipulate n activitatea de ana liz| a datelor sunt

  • 8/3/2019 AMD Doctorat 2009

    12/134

    11

    Figura 2.1: Ilustrarea relaiei dintre eantion i populaie

    Definiie: Variabilele calitative sunt variabile ce difer| prin tip, se refer| la propriet|inenumerice ale unit|ilorelementare aparinnd unei populaii i nu pot fi exprimate numeric .

    Definiie: Variabilele cantitative sunt variabile care difer| prin m|rime,se refer| la propriet|i numerice ale unit|ilorelementare dintr-o populaie i sunt exprimate n unit|i numerice: de lungime, de greutate, valorice etc.

    de fapt rezultatele m|sur|torilor efectuate la nivel de eantion.O modalitate de vizualizare a rela iei, a raportului n care se g|sete eantionul fa| de populaia statistic| este prezentat|

    n figura urm|toare.

    O foarte mare importan| principial| pentru analizele cantitative bazate pe studiul eantioanelor, o a re postulatul statisticn conformitate cu care un eantion exprim| informaional ntr-o oarecare m|sur| populaia din care a fost extras,propriet|ilei structura populaiei fiind cu att mai fidel exprimate de eantion cu ct volumul acestuia este mai m are.

    2.1.3 Caracteristicii variabile

    Din punct de vedere al informaiei statistice, o pop ulaie statistic| prezint| interes nu n raport cu unit|ile, ca atare, dincare este alc|tuit| populaia, ci n raport cu tr|s|turile, propriet|ile acestor unit|i.

    Propriet|ile unit|ilor elementare aparinnd unei populaii statistice sunt numite n analiza datelorcaracteristici sauatribute. Fiecare unitate elementar| a populaiei investigate poate avea o singur| caracteristic| sau mai multe caracteristici. ncel de-al doilea caz, n studierea popu laiei statistice apare necesitatea abord|rii multidimensionale, necesitatea utiliz|rii unorinstrumente i tehnici de analiz| specifice caracterului multidimensional.

    n funcie de natura lor, caracteristicile unit|ilor unei populaii pot fi de dou| tipuri: caracteristici calitative icaracteristici cantitative.

    Caracteristicile sau atributele unit|ilor elementare ce alc|tuiesc o anumit| populaie sunt elemente ale unei realit|i date,de natur| empiric|. De regul|, n activitatea tiinific| nu se opereaz| cu elementele realit|ii ca atare, ci cusimboluricare suntreprezent|ri abstracte ale realit|ii.

    M|surarea caracteristicilor unit|ilor unei populaii este echivalent| cu atribuirea de simboluri, numerice sau nenumerice,acelor caracteristici. n general, simbolurile care pot s| ia o varietate de valori se numesc variabile.

    n cadrul demersurilor tiinifice care au ca scop investigarea fenomenelor i proceselor economice sau sociale,

    caracteristicile unit|ilor unei populaii sunt reflectate prin intermediul conceptului de variabile, tocmai pentru a sugera naturaschimb|toare a ace stora, variabilitatea lor n timp i spaiu. Variabila este, poate, cel mai important concept vehiculat n cadruloric|rui proces de analiz| a datelor, n raport cu care se d efinete ntreaga succesiune de operaii de prelucrare specifice acestuiproces.

    Informaiile care sunt elemente de intrare n procesele de analiz| a datelor, reprezint|, aproape f|r| excepie, m|sur|toriasupra unor caracteristici, m|sur|tori care definesc valori ale variabilelor ce simbolizeaz| caracteristicile populaiei analizate.

    Definiie: Variabila reprezint| o abstractizare a m ulimii de valori posibile pe care le p oate nregistra o caracteristic|a unui anumit fenomen.

    Varietatea fenomenelor economico-sociale i modalit|ile diferite de exprimare a caracteristicilor acestora fac ca variabileleprin intermediul c|rora sunt descrise aceste carac teristici s| aib| natur| diferit|. Ca i caracteristicile populaiilor, dup| naturape care o au, variabilele pot fi de dou| tipuri: variabile calitativei variabile cantitative.

    n analiza datelor apare n ecesitatea trat|rii difereniate a datelor de tip calitativ i cantitativ deoarece exist| diferene subs-taniale ntre aceste tipuri de date att din punct de vedere al modalit|ilor de abordare i interpretare, ct i din punct de vedereal metodelori tehnicilor utilizate n analiz|. Din aceste motive, se face o deosebire net| ntre variabilele de tip c alitativ ivariabilele de tip cantitativ.

    n cazul n care, n mod convenional, valorile lor sunt codificate prin numere, aceast| exprimare nu este relevant|numeric. Variabile calitative sunt: sexul, op iunea cump|r|torului, opiunea aleg|torului, profesia, starea civil| etc.

    Variabile cantitative sunt: pre ul unu i produs, cheltuielile lunare ale unei familii, salariul mediu lunar, venitul naional,volumul fizic al produciei etc.

    n funcie de natura valorilor pe care le iau, variabilele se mpart n dou| categorii: variabile de tip discreti variabile detip continuu.

    Definiie: Variabilele de tip discretsunt variabile care pot lua o mulime limitat|, finit| de valorii care se mai numesci variabile categoriale.

    Valorile luate de variabilele discrete se numesc alternative, categorii, variante sau modalit|i. De regul|, variabilele

  • 8/3/2019 AMD Doctorat 2009

    13/134

    12

    Definiie: Observaia este reprezentat| de valoarea sausetul de valori nregistrate pentru o anumit| unitate elementar|a populaiei, la una sau mai multe ca racteristici ale acesteia.

    Definiie :Datele experimentale reprezint| informaii obinute prin organizarea unorexperimente controlate, n careinfluenele factorilor asupra efectului sunt controlate n mod direct, prin fixarea unor combina ii precise de influene.

    calitative sunt variabile de tip discret. Variabile de tip discret pot fi ns|i unele variabile cantitative.

    Definiie: Variabilele de tip continuu sunt variabile care pot lua valori aparinnd unui interval continuu .

    Practic, mulimea valorilor posibile ale variabilelor de tip continuu este o m ulime infinit|. De regul|, variabilele calitativenu sunt variabile de tip continuu.

    2.1.4 ObservaiiStrns legat de conceptul de variabil|, este un alt concept, la fel de important i frecvent utilizat n analiza da telor, i anume,

    conceptul de observaie.

    De fapt, observaiile sunt valori pe care le iau variabilele supuse analizei, valori care sunt rezultate din m |sur|torileefectuate asupra ca racteristicilor unit|ilor aparinnd populaiei investigate.

    Observaia reprezint| n procesul de analiz| a datelor unitatea elementar| de informaie utilizat| n procesele de prelucrare,mulimea observaiilor constituind baza informaional|a analizei datelor. Practic, mulimea de observaii supuse procesuluide analiz| este echivalent| cu eantionul, care, la rndul s|u, nu este altceva dect tot o mulime de observaii.

    De cele mai multe ori, prin observa ie se nelege chiar entitatea elementar| care intr| n alc|tuirea populaiei analizate ide la care se obin informaii. n acest sens, observaia este sinonim| cu cazul, obiectul, individul, subiectul, articolul.

    2.2 Tipuri de date primare

    n funcie de modul n care sunt obinute, datele primare pot fi clasificate n mai multe categorii. Vom prezenta, ncontinuare, dou| dintre clasific|rile cele mai impo rtante ale datelor primare: clasificarea n funcie de natura contextului n careacestea sunt obinute i clasificarea n funcie de modul de obinere a acestora.

    2.2.1 Date experimentale i date non-experimentaleDin punct de vedere al naturii contextului n care datele sunt obinute, al modului n care investigatorul controleaz| sau

    nu, n procesul obinerii datelor, populaia supus| studiului, datele pot fi grupate n dou| categorii: date experimentale; date non-experimentale sau date observaionale.

    Diferenele dintre datele experimentale i non-experimentale in nu numai de natura con textului n care ele sunt obinute,ci i de modul n ca re ele sunt utilizate n analiza datelor, de metodele, instrumentele i procedurile utilizate pentru prelucrareaacestora.

    2.2.1.1 Date experimentaleDatele experimentale sunt datele obinute prin organizarea unorexperimente de tip controlat, desf|urate n condiii clare

    i prestabilite. Contextul obinerii datelor de tip experimen tal este restricionat, prin impunerea unor reguli specifice.n general, organizarea unui experiment controlat presupune, n primul rnd , izolarea fenomenelori proceselor studiate,

    precum i eliminarea, n ct mai mare m|sur|, a influenelor externe, care nu prezint| interes pentru analiz|. O alt| etap|important| a experimentului controlat este aceea a stabilirii factorilori cauzelorimportante, cu semnificaie, care i exercit|influena asupra m|rimilor exogene, precum i a alegerii nivelelorla care influena acestora va fi urm|rit|. Cea de-a treia etap|a procesului de obinere a datelor experimentale const| n desf|urarea experimentului propriu-zis, etap| n care sunt dozai,n condiii specifice, factorii de influen|. n aceast| etap|, s e fixeaz| nivele concrete pentru fiecare din factorii de influen |,se creaz| condiiile necesarepentru exercitarea influen elor factorilori se m|soar| efectulinfluenei factorilor asupra m|rimiisau m|rimilor de ieire.

    Datele obinute n urma unui astfel de proces, adic| datele experimentale, sunt reprezentate de dou| categorii de informaii:valorile fixate pentru nivelurile factorilorde influen|i valorile rezultate pentru variabila sau variabilele dependente , n urmaexercit|rii acestor influene.

    Datele experimentale sunt caracteristice doar unor domenii de cercetare, i anume acelor d omenii n care pot fi organizateexperimente specifice, necesare obinerii acestor date. Experimentarea este posibil| doar n anumite domenii ale cunoaterii,cum ar fi, de exemplu, domeniul tiinelor naturale: fizic|, chimie, biologie etc.

    ntr-o alt| modalitate de exprimare, se poate spune c| datele experimentale sunt date de laborator, prin laboratornelegnd aici o serie de condiii speciale, care se refer| att la o serie de restricii i instrumente specifice de m|surare, ct lamodalitatea de desf|urare a unor procese cauzale specifice.

    Spre deosebire de ace ste domenii, n domeniul economico-social experimentarea este fie total imposibil|, fie posibil|, darnumai foarte rari n condiii foarte restrictive i costisitoare.

    2.2.1.2 Date non-experimentaleDatele non-experimentale , care se mai numesc i date observaionale, sunt datele obinute prin observarea fenomenelor

    i proceselor n micarea lornatural|, liber|, f|r| impunerea unor restricii, f|r| a se exercita un control de un anumit fel asupra

    fenomenelori proceselor investigate.

  • 8/3/2019 AMD Doctorat 2009

    14/134

    13

    Definiie : Datele non-experimentale reprezint| informaii obinute prin observarea liber| a m ic|rii fenomeneloriproceselor studiate, f|r| intervenia direct| a investigatorului asupra condiiilor n care se desf|oar| acest| micare.

    Definiie : Datele de tip profilreprezint| informaii obinute prin m|sur|tori de natur|static|, efectuate asupracaracteristicilor unor unit|i ale unei populaii, la acelai moment de timp.

    Definiie :Datele de tip serii de timp sauseriile crono logice reprezint| informaii obinute prin m|sur|tori de natur|dinamic|, efectuate asupra caracteristicilor unei unit|i a unei populaii la momente sau n intervale succesive de timp .

    Definiie :Datele de tip panelreprezint| informaii obinute prin m|sur|tori mixte, de natur|static|i de natur|dina-mic|, efectuate asupra caracteristiciloracelorai unit|i ale unei populaii la momente sau n intervale succesive de timp .

    Ob inerea datelor de tip non-experimental reprezint| rezultatul observ|rii pasive, constat|rii . Intervenia observatorului,a celui care face m|sur|torile, este de tip ex-post, are loc dup| ce desf|urarea fenomenelori proceselor reale a avut loc.

    Datele de tip non-experimental sunt datele specifice domeniului economico-social, domeniu n care organizarea deexperimente este fie dificil|, fie imposibil|. Mai mult dect att, complexitatea influenelor din domeniul economico-social,multitudinea interaciunilor din acest domeniu, determin| o relevan| foarte sc|zut| pentru eventualele date de natur|

    experimental|.

    2.2.2 Date de tip profil, serii de timp i date panelDin punct de vedere cronologic, observarea unei populaii de fenomene sau procese, n scopul obinerii informaiilor

    necesare, poate avea loc sub dou| forme diferite:statici dinamic. Din acest punct de vedere, datele primare pot s| constituiefie o imagine de tip static a populaiei, n care aceste date s| reprezinte informaii legate de starea unit|ilor populaiei la unmoment dat, fie o imagine de tip dinamic, evolutiv, n care datele s| reprezinte informaii legate de evoluia n timp a unei sauunor unit|i ale populaiei.

    Avnd n vedere aceste dou| modalit|i de a observa unit|ile unei populaii, datele primare po t fi grupate n trei categorii: date de tip profil; date de tip serii de timp ; date de tip panel;

    Ca i n cazul datelor experimentale, analiza datelor difereniaz| semnificativ modalit|ile de abordare, n raport cu fiecaredin aceste categorii de date. Din acest motiv, consider|m c| este necesar| o scurt| prezentare a acestor trei tipuri de date.

    2.2.2.1 Date de tip profilDatele de tipprofilreprezint| rezultate ale unor m|sur|tori efectuate, la un moment dat, asupra uneia sau mai multor

    caracteristici, de-a lungulunit|ilor populaiei, adic| pe mulimea unit|ilor sau obiectelor care sunt supuse studiului.Datele de tip profil se mai numesc date de tipsecven| sau date de tip seciune i reprezit| t|ieturi informaionale

    efectuate ntr-o anumit| populaie la un moment dat, t|ieturi care sunt de tip transversal, n raport cu axa timpului.

    O observaie n contextul datelor de tip profil este reprezentat| de valoarea sau de valorile unei singure entit|i, ale uneisingure unit|i din populaie. Num|rul de observaii coincide, n cazul datelor de tip profil, cu num|rul de unit|i observate inregistrate. Datele de tip profil nu ncorporeaz| n semnificaia pe care acestea o poart|, influena timpului asupra form|riicaracteristicilor la nivelul populaiei i sensul scurgerii timpului, nici n mod explicit i nici n mod imp licit.

    Ca exemple de d ate de tip profil, putem meniona: datele referitoare la salariul individual dintr-o lun| al lucr|torilor unei

    firme; datele referitoare la populaia medie a statelor lumii ntr-un anumit an; datele referitoare la rata inflaiei nregistrat| de|rile lumii ntr-o anumit| perioad|; sexul cump|r|torilor ce cump|r| un anumit bun ntr-o anumit| perioad|; num|rul mediunregistrat de populaia judeelor unei |ri ntr-un anumit an; volumul anual al vnz|rilor unor m|rci de autoturisme, num|rulvoturilor nregistrate de partidele nscrise ntr-o campanie electoral| etc.

    De regul|, datele de tip profil se refer| la starea pe care o au la un anumit moment indivizii ap arinnd unor anumitecolectivit|i, gospod|riile, firmele, ramurile, unit|ile administrativ-teritoriale, |rile lumii etc.

    2.2.2.2 Date de tip serii de timpDatele de tipserii de timp, numite i serii cronologice sau, puri simplu, serii de timp, reprezint| rezultate ale unor

    m|sur|tori efectuate asupra caracteristicilor unei unit|i a populaiei studiate, de-a lungul timpului, la momente succesive aleevoluiei acesteia, la anumite intervale de timp.

    Intervalele de timp pentru care se fac m|sur|torile pot fi reprezentate de: ore sau fraciuni de ore, zile, s|pt|mni, decade,luni, trimestre, semestre, ani. Deoarece intervalele sunt egale i reprezint| scurgerea timpului, observaiile rezultate n urmaacestor m|sur|tori suntsuccesivei, de regul|, echidistante n timp.

    Datele reprezentate de seriile de timp se refer| la evoluia n timp a st|rii unui individ, gospod|rii, zone geografice, |rietc. Datele de acest tip pot fi date de tip intervalsau date de tip moment.

    Datele de tip intervalsunt datele care se refer| la caracteristici care sunt m|rimi de tipstoc, n timp ce datele de tip momentsunt date care se refer| la caracteristici care sunt m|rimi de tip flux. i n acest caz, datele de tipul seriilor de timp pot fi priviteca reprezentnd seciuni informaionale, ns| aceste seciuni sunt de-a lungul axei timpului, de-a lungul evoluiei , adic| suntseciuni longitudinale n raport cu axa timpului.

    2.2.2.3 Date de tip panelDatele de tip panelsunt date care reprezint|combinaii, mixturi ale datelor de tip profil i datelor de tipul se riilor de timp.

    Ele sunt rezultate ale m|sur|torilor efectuate asupra caracteristicilor unor unit|i individuale, att de-a lungul unit|ilorindividuale, ct i de-a lungul timpului.

    Datele de tip panel pot fi imaginate ca reprezentnd t|ieturi informaionale mixte, transversale i longitudinale, n raport

  • 8/3/2019 AMD Doctorat 2009

    15/134

    14

    Definiie: Oscal| reprezint| un etalon corespunz|tor, care stabilete modul dup| care sunt atribuite valori variabilelor;a defini o scal| de m|surare este echivalent cu:

    a stabili o mulime de valori posibile ale variabilei, mulime numit|i spaiu de selecie; a preciza regulile dup| care sunt atribuite simboluri pentru elementele unei realit|i date, adic| a defini o struc-tur| a spaiului de selecie.

    Definiie: Scala nominal|este o scal|non-metric|, prin intermediul c|reia valorilor posibile ale caracteristicilorm|surate li se atribuie simboluri f|r| relevan| numeric|, n funcie de natura acestor valori.

    cu axa timpului. n cazul datelor de tip panel, observarea se face ntr-o not| de simultaneitate : att asupra mai multor unit|iale populaiei, ct i asupra evoluiei n timp a acestor unit|i. Exemplul cel mai sugestiv pentru datele de tip panel este cel albugetelor de familie, n contextul c|rora se fac nregistr|ri pe perioade de mai muli ani a ven iturilori cheltuielilor tuturorfamiliilor care alc|tuiesc eantionul respectiv.

    2.2.3 Scala de m|surare a variabilelorAa cum am menionat anterior, materia prim| n analiza datelor este reprezentat| de m|sur|torile efectuate asupra unor

    caracteristici ale populaiei statistice. n analiza da telor, aceste m|sur|tori sunt considerate a reprezenta valori ale unor variabile

    definite n raport cu caracteristicile analizate. Indiferent de tipul ei, valoarea nregistrat| de o caracteristic| la nivelul unui obiecteste totdeauna rezultatul exprim|rii univoce a valorii respectivei caracteristici n funcie de gradaiileunei anumitescale.

    2.2.3.1 Definirea scaleiM|surarea reprezint| un proces prin intermediul c|ruia se asociaz| numere sau simboluri unor caracteristici sau propriet|i

    ale unor obiecte sau ale unor subiec i, care con stituie obiectul studiului.Atribuirea de numere sau simboluri pentru caracteristicile sau propriet|ile unor obiecte se face pe baza respect|rii unor

    reguli prestabilitei prin utilizarea un or proceduri specifice. De exemplu, dac| obiectul studiului este reprezentat de indivizicare sunt poteniali cump|r|tori ai unui anumit produs, atunci caracteristicile c|rora este necesar a li se atribui numere sausimboluri pot fi: vrsta, venitul, sexul, profesia etc.

    M|surarea caracteristicilor sau propriet|ilor unor obiecte sau subieci este totdeauna caracterizat| de o anumit|specificitate, determinat| de natura caracteristicii m|surate, i presupune, cu n ecesitate, existena unor repere, a uno r sistemede referin|, cunoscute sub numele descal|. Ca element fundamental al procesului de m|surare a caracteristicilor fenomenelori proceselor econom ice, scala poate fi definit| sub forma urm|toare.

    n funcie de natura variabilelor exprimate cu ajutorul lor, exist| patru tipuri de scale, pe care le von defini n cele ceurmeaz|.

    2.2.3.2 Tipuri de scaleCa i procesul de m|surare ca atare, scala sau sistemul de referin| este, de asemenea, specific| naturii pe care o are

    caracteristica supus| procesului de m|surare. Din acest punct de vedere, exist| mai multe tipuri de scale de m|surare:scalanominal|, scala ordinal|, scala intervaliscala raport. Primele dou| tipuri de scale suntscale de tip non-metric, iar ultimeledou| suntscale de tipmetric.

    2.2.3.2.1 Scala nominal|Scala nominal| este o scal|non-metric|, pe baza c|reia valorile variabilelor sunt d efinite prin intermediul simbolurilor

    nenumerice. M|surarea variabilelor pe scala nominal| este echivalent| cu procesul de codificare a variabilelor. Chiar n cazuln care pentru co dificare sunt folosite numere, aceste numere sunt, totui, pur convenionale.

    Scala nominal| este utilizat| pentru a m|sura caracteristici ale c|ror valori sunt de natur|calitativ|, necuantificabil|.Valorile pe care pot s| le ia caracteristicile de acest tip sunt cunoscute sub numele de categoriisau alternative. Variabilelem|surate pe scala nominal| se numesc variabile nominalei sunt variabile a c|ror form| de exprimare este de tip atributiv icare pot fi folosite numai pen tru stabilirea apartenen ei la o anumit| clas| a entit|ii descrise prin intermediul variabilei.

    O clas| special| a variabilelor de tip nominal o reprezint|variabilele binare, care sunt variabile ce pot s| ia doar dou|valori de tip nenumeric.

    Variabilele de tip nominal sunt variabile discrete i pot fi utilizate numai n scopuri de clasificare de tip c alitativ, naturanenumeric| a acestor variabile f|cnd imposibil| utilizarea lor pentru comparaii, ierarhiz|ri sau ordon|ri.

    n cazul m|sur|rii pe scala nominal|, valorilor pe care pot s| le ia caracteristicile supuse m|sur|rii, respectiv categoriilorsau alternativelor, li se atribuie simboluri, care sunt de natur| nenumeric|.

    Pe scala nominal|, dou| valori diferite ale caracteristicii m|surate sunt evideniate prin intermediul a dou| simboluridiferite. Elementele scalei nominale, diviziunile acesteia, sunt reprezentate d e simbolurile atribuite valorilor carac teristiciistudiate, sau, mai exact, de categoriile respectivei caracteristici. Scala nominal| este reprezentat| chiar de mulimea acestorsimboluri. De exemplu, mulimile:

    ,

    ,

    ,

    reprezint| scale de tip nominal utilizate pentru a m|sura caracteristici cum ar fi sexul, domen iul de activitate, categoria social|,profesia.

    Ceea ce este carac teristic scalei nominale este faptul c| subiecii studiai nu pot fi comparai din punct de vedere al valorii

    pe care o nregistreaz| la caracteristica m|surat| pe aceast| scal|. Pe baza valorilor nregistrate pe scara nominal| nu se poateafirma care subiect este mai bine situat din punct de vedere al caracteristicii studiate sau, cu att mai puin, n ce m|sur|un subiect este situat mai bine dect altul.

  • 8/3/2019 AMD Doctorat 2009

    16/134

    15

    Definiie :Scala ordinal| este o scal| non-metric|, prin intermediul c|reia valorilor posibile ale caracteristicilor li seatribuie numere de ordine sau ranguri, n funcie de poziia acestor valori ntr-o ierarhie.

    Tot pe aceast| scal|, caracteristicilor li se pot atribui i numere, numai c| aceste numere nu au sensul propriu-zis de num|r,avnd practic aceeai semnificaie ca i simbolurile. Att simbolurile propriu-zise, ct i numerele cu rol de simbol, atribuitecaracteristicilor pe aceast| scal| de m|surare, au numai rol de clasificare n anumite grupe a subiecilor sau de contorizare anum|rului de subieci din fiecare categorie, neputnd fi folosite n nici un tip de calcul numeric. Prin intermediul valorilorm|surate pe scala nominal| subiecii se difereniaz| ntre ei doar din punct de vedere al apartenenei la o anumit| clas|sau alapartenenei la o anumit| categorie. Aceasta nseamn| c| utilizarea scalei nominale pentru m|surarea caracteristicilorm|surabile pe aceast| scal| genereaz|clase sau categorii de subieci.

    Pentru caracteristicile m|surate pe scala nominal|, poate fi calculat un num|r limitat de indicatori statistici, care reprezint|,

    de fapt, contoriz|ri ale simbolurilor ap|rute pe scala nominal|. Aceti indicatori sunt modulul i frecvena. n cazulcaracteristicilor m|surate pe scala nominal| poate fi evideniat|i distribuia de frecven|.ntr-o analiz| de date, variabilele nominale pot fi reprezentate de o serie de variabile cu m ar fi:sexul, categoria social|,

    tipul familiei,profesia, marca unui produs etc.Unica transformare de tip invariant a scalei nominale este reprezentat| de operaia de recodificare , aceast| operaie

    neafectnd apartenena la o anumit| clas| a valorilor m|surate pe acest| scal|.

    2.2.3.2.2 Scala ordinal|Scala ordinal| este o scal|non-metric|, similar| scalei nominale, adic| o scal| de codificare cu deosebirea c|pe aceast|

    scal| este posibil|ordonarea valorilor variabilelor. Aceast| scal| este folosit| cu prec|dere pentru m| surarea preferinelorconsumatorilor.

    Scala ordinal| permite clasificarea valorilor unei variabile n funcie de rangul acestora, ns|diferenele ntre ranguri nu sunt relevante i nu au sens. Acest tip de scal| nu d| posibilitatea stabilirii gradului n care caracteristicile a dou| entit|idistincte difer| ntre ele (mai mult, mai puin).

    Variabilele m|surate pe aceast| scal| se numesc variabile ordinale, sunt variabile calitative de tip discret i nu pot fiexprimate sub o form| numeric| real|. Ca exemple de variabile ordinale putem men iona: categoria de venit(mic, mediu, mare),nivelul studiilor(elementare, medii, superioare),preferina consumatorilor pentru un anumit produs (foarte mare, mare, mic|,foarte mic|, deloc), nivelul calitativ al unui produs sau serviciu (inferior, mediu, superior), starea economic| (recesiune,stagnare, expansiune) etc.

    Scala ordinal| este utilizat| n cazul n care caracteristica subiecilor supui analizei determin| o difereniere a subiecilordin punct de vedere al poziiei pe care fiecare dintre acetia o ocup| ntr-o ierarhie, ntr-o ordonare, adic| n cazul n carecaracteristica ia valori de tip ordinal. Valorile pe care pot s| le ia carac teristicile m|surate pe scala ordinal| sunt valori ordinalesau note, cunoscute i sub numele de ranguri. Acestor valori li se atribuie fie numere de ordine, fiesimboluri care evideniaz|o anumit| ordine a valorilor caracteristicii.

    Pe scala ordinal|, dou| valori diferite ale unei caracteristici sunt evideniate prin intermediul a dou|ranguri diferite, adic|

    prin intermediul a dou| poziii diferite n cadrul ierarhiei. Elementele scalei ordinale, diviziunile acesteia, sunt reprezentatede numerele sau de simbolurile folosite pentru reprezentarea rangurilor, respectiv de poziiile posibile n respectiva ordonare.Scala nominal| este reprezentat| chiar de mulimea acestor numere sau simboluri.

    Cu toate c| valorile caracteristicilor de tip ordinal nu sunt numere propriu-zise, ele difereniaz|, totui, poziia unui subiectn raport cu un alt subiect, spun ceva despre aceast| poziie. Valorile unei carac teristici m|surate pe scala ordinal| permit doarordonarea subiecilor din punct de vedere al ace stei caracteristici, determinnd o ierarhizare a subiecilor sau obiectelor.

    Prin intermediul valorilor pe care le pot lua ca racteristicile m|surate pe scala ordinal|, indivizii se difereniaz| ntre ei doardin punct de vedere al rangului , al locului pe care l ocup| n ierarhia generat| de scala ordinal|. Aceasta nseamn| c|utilizarea scalei ordinale pentru m|surarea caracteristicilor m|surabile pe aceast| scal| genereaz| ierarhii, ordon|ri alesubiecilor.

    M|surarea pe scala ordinal|permite compara ii ntre subieci din punct de vedere al caracteristicii m|surate, dar acestecomparaii se refer| numai la modul n care un subiect este situat n raport cu altul, f|r| a se putea spune i n ce m|sur|subiecii difer| ntre ei dup| caracteristica respectiv|. Diferenele dintre dou| valori succesive de pe scala ordinal| nu pot ficonsiderate ca fiind egale, ele nedeterminnd o distanare egal| ntre indivizi, astfel nct s| se poat| afirma, de exemplu, c|subiectul situat pe primul loc este de trei ori ma i bun dect subiectul situat pe locul al treilea.

    Pentru caracteristicile m|surate pe scala ordinal|, pot fi calculai o serie de indicatori statistici cum ar fi: modulul, mediana,coeficientul de corelaie a rangurilor, frecvena. De asemenea, pentru caracteristicile de tip ordinal se poate eviden ia idistribuia de frecven|. Este important s| se fac|, n acest context, precizarea c|media i diferenele valorilor variabilelorordinale sunt nerelevante, nu au sens informaional i nici sens logic.

    Singura transformare invariant| a scalei ordinale este translaia , adic| transformarea care p|streaz| ordinea valorilor uneivariabile. Analitic, acest tip de transformare invariant| a scalei ordinale poate fi definit astfel:

    unde a este o constant|, pozitiv| sau negativ|, care d| sensul i m|rimea translaiei valorilor scalei ordinale, valori reprezentatede x.

    2.2.3.2.3 Scala intervalEste o scal|quasi-metric| pe care se poa te defini un punct de referin|, dar acest punct nu este o origine "zero" real|, c i

    convenional|, arbitrar|. Valoarea "zero" pe ace st tip de scal| nu indic| nicidecum absena fenomenului m|surat. Deci, pentruscala de tip interval, originea scalei este arbitrar|, avnd importan| doarscalarea valorilor n interiorul intervalului.

    Aceast| sc