Analiza Datelor Si SAS DAFI 2010 Part1

download Analiza Datelor Si SAS DAFI 2010 Part1

of 68

Transcript of Analiza Datelor Si SAS DAFI 2010 Part1

Academia de Studii Economice Masterat DAFI

Prof. univ. dr. Gheorghe RUXANDA

ANALIZA DATELORSI

SAS

Bucuresti 2010

Tema 1. Probleme ale m|sur|rii i cuantific|rii economico-sociale1.1 Necesitatea i rolul analizei datelorCunoa terea tiin ific | din orice domeniu de activitate uman | presupune, indiferent de natura i specificul obiectivelor concrete urm |rite, o complex | i riguroas | analiz | cantitativ | a fenomenelor i proceselor care fac obiectul cercet|rii. Este vizibil pentru oricine, i din ce n ce mai mult, c | n epoca modern | aproape orice individ angrenat ntr-o activitate uman | se ocup |, ntr-un fel sau altul, n mod direct sau indirect, cu date i informa ii, cu colectarea, prelucrarea i interpretarea acestora. Desf |urarea oric |rei activit|i umane implic | o produc ie continu | de date sau informa ii, care se acumuleaz | n timp i care pot fi folosite pentru cunoa terea structural| i evolutiv | a fenomenelor la care se refer | aceste informa ii, n scopul fundament |rii corecte i eficiente a deciziilor care trebuie luate. M ai mult dect att, desf |urarea activit|ilor umane nici m |car nu poate fi conceput| n zilele noastre f|r | un consum continuu, din ce n ce mai mare, de informa ie. Din acest punct de vedere, se poate spune c | informa ia a devenit unul dintre factorii de produc ie importan i i activi, un factor de progres i civiliza ie. Totdeauna, mulimile de date con in, ntr-un mod amalgamat i invizibil, att aspecte semnificative, ct i aspecte nesemnificative, ale manifest |rii fenomenelor. Deoarece cunoa terea tiin ific | vizeaz | n mod exclusiv aspectele informa ionale semnificative, apare necesitatea utiliz |rii unor metode i tehnici specifice analizei datelor, cu ajutorul c |rora informaia semnificativ | s | poate fi detectat|, separat| de informa ia nesemnificativ | i exprimat | sub o form | clar | i interpretabil|. Metodele i tehnicile de analiz | a datelor sunt cele mai adecvate instrumente utilizabile pentru identificarea unor structuri cauzale, pentru decelarea unor tendin e i configura ii specifice pe mulimea datelor analizate i ob inerea unor reprezent|ri simplificate ale informa iilor de mare complexitate. Utilitatea i eficien a utiliz |rii metodelor i tehnicilor de analiz | a datelor sunt maxime n situa iile n care informa iile supuse studiului sunt n cantit |i foarte mari. Din acest punct de vedere, domeniul economic poate fi considerat ca fiind un domeniu privilegiat. n cea mai mare parte a lor, metodele i tehnicile de analiz | a datelor au natur | multidimernsional|, astfel nct, comparativ cu metodele i tehnicile de analiz | statistic | descriptiv |, ele permit i investigarea leg |turilor i interdependen elor eviden iate la nivelul mulimilor de date. Materia prim | utilizat| n orice activitate de analiz | a datelor este reprezentat| de o colec ie sau mulime de date sau informa ii cantitative, referitoare la st |rile sau evolu iile unei mulimi de fenomene. Aceste date pot fi ob inute fie pe cale observa ional|, fie pe cale experimental|. Din punct de vedere al analizei datelor, orice mulime de informa ii supus | studiului este privit| ca fiind o reprezentare codificat|, ntr-o form | mai mult sau mai pu in implicit |, a unor aspecte informa ionale referitoare la niveluri i varia ii ale unor fenomene, evolu ii i tendin e relevante, leg |turi i influen e semnificative, ierarhii i configura ii structurale specifice. Datele supuse unui proces de analiz | nu eviden iaz |,n mod direct i explicit, prin ele nsele, informa ia util | i semnificativ |. De regul|, datele con in informa ia util| i semnificativ | sub o form | mascat|, ascuns |, amestecat| ntr-un mod nediferen iat i f|r | o logic | aparent|, cu informa ia nesemnificativ |, rezultat| din influen e accidentale i marginale. n acest sens, se poate spune c | la nivelul datelor primare supuse analizei, informa ia semnificativ | se g |se te sub o form | diluat| i disipat| ntr-o mulime informa ional| complex |, neordonat| i nestructurat| dup | vreun criteriu logic existent aprioric. Rolul analizei datelor este acela de a prelucra i filtra informa iile con inute n datele supuse studiului, cu scopul de a capta sau de a extrage esen a informa ional| con inut| n aceste date i de a eviden ia aceast| esen | informa ional| ntr-o form | de reprezentare inteligibil|, sugestiv |, simplificat| i sintetizatoare. Atingerea acestui scop presupune realizarea unei succesiuni de transform |ri efectuate asupra datelor primare i implic | utilizarea unor metode i tehnici specifice. Aceste transform |ri au scopul de a maximiza relevan a i interpretabilitatea datelor i presupun, printre altele, eliminarea informa iilor redundante sau lipsite de semnifica ie i generalitate, care au natur | accidental| sau marginal|. Din acest punct de vedere, procesul de analiz | a datelor apare ca fiind un proces specific de transformare informa ional|, proces care are ca intr |ri datele primare, iar ca ie iri informa ii sintetizatoare. Avnd n vedere modul n care se efectueaz |, precum i natura instrumentelor pe care le folose te, analiza datelor este, prin excelen |, o analiz | de tip multidimensional, reprezentnd, n compara ie cu analiza simpl |, unidimensional|, o schimbare de natur | calitativ |. Analiza statistic | descriptiv | permite reprezentarea unor colec ii foarte mari de date ntr-o manier | sugestiv | i asimilabil|, simplificat| i schematizant |. Spre deosebire de aceasta, analiza multidimensional| constituie o generalizare natural| a logicii i informa iilor referitoare la mai multe variabile sau dimensiuni. Activit|ile de manipulare a datelor i informa iilor, de prelucrare i interpretare corect| i eficient | a acestora, presupun existen a unui cadru conceptual adecvat i utilizarea unor metode i instrumente specifice. Att cadrul conceptual necesar, ct i metodele i tehnicile utilizabile n prelucrarea, analiza i interpretarea datelor i informa iilor, sunt subsumate de obiectul unei discipline tiin ifice numit| analiza datelor.

1.2 Specificitatea domeniului economico-social i modalit|i de abordareDe i metodele i tehnicile de analiz | a datelor sunt utilizate n majoritatea domeniilor activit|ii umane, putem afirma c | analiza datelor are cea mai larg | utilizare n domeniul economico-social, iar eficien a utiliz |rii ei n acest domeniu are o eficien a extrem de ridicat|. A a cum cum o s | ar|t|m n continuare, activitatea de cunoa tere tiin ific | din domeniul economico-social este caracterizat| de anumite accente specifice, n compara ie cu alte domenii ale cunoa terii umane. n virtutea acestor elemente de specificitate, domeniul economico-social pare a fi cel mai potrivit domeniu pentru utilizarea metodelor i tehnicilor de analiz | 1

multidimensional| a datelor. Dintre toate elementele de specificitate a domeniului economico-social, dou | consider |m a fi mai importante i mai relevante din punct de vedere al utiliz |rii analizei datelor: complexitatea ridicat| a fenomenelor economico-sociale i natura cantitativ | a acestor fenomene. mpreun | cu multe alte caracteristici specifice, aceste dou | caracteristici fundamentale impun modalit|i specifice de abordare pentru cunoa terea tiin ific | din domeniul economico-social. Necesitatea de a sintetiza i de a simplifica n procesul de cunoa tere a realit|ii, este impus | att de faptul c | datele utilizabile ntr-o analiz | mascheaz |, ascund, anumite aspecte, ci i de faptul c | realitatea analizat| este caracterizat| de o complexitate foarte ridicat|, care nu poate fi cuprins | i n eleas| numai pe baza intuiiei. n activitatea de analiz | cantitativ |, pe care se bazeaz | n mod direct cunoa terea tiin ific | din cele mai multe domenii de activitate, sunt implicate trei categorii esen iale de elemente: teorii i principii teoretice generale i specifice domeniului investigat, informa ii cantitative i calitative referitoare la fenomenele supuse studiului, metode i tehnici de cuantificare, evaluare, estimare i testare a m |rimilor specifice i a rela iilor existente la nivelul realit|ii investigate. Teoriile i principiile teoretice care stau la baza oric |rei analize cantitative sunt reprezentate de mulimea cuno tiin elor tiin ifice acumulate n decursul timpului, de realiz |rile ob inute pe plan tiin ific, att la nivelul general al cunoa terii umane, ct i la nivelul cunoa terii n domeniul abordat. Inform a iile cantitative i calitative referitoare la fenomenele i procesele studiate exprim | o mulime de st |ri i evolu ii concrete din realitatea investigat| i sunt rezultatul unui laborios proces de observare, m |surare i evaluare, proces n care intervin o serie de norme, principii, metodologii i instrumente specifice procesului de m |surare. Informa iile ob inute din realitatea investigat|, n urma unor procese de observare i de m |surare, sunt cunoscute sub numele de date. Datele reprezint| materialul brut, empiric, care st | la baza tuturor deciziilor din orice domeniu de activitate, iar de calitatea acestora depinde, n mod direct, calitatea respectivelor decizii. Metodele i tehnicile reprezint| un set de reguli, principii i proceduri de analiz|, prelucrare i interpretare a datelor.n analiza datelor, metodele i tehnicile se refer | la cuantificare, evaluare, estimare i testare, i sunt reprezentate de o mulime extins | i variat| de proceduri i instrumente statistico-matematice. Aceste proceduri sunt aplicate, sub o form | sau alta, informa iilor cantitative i calitative, datelor de intrare, n scopul deducerii anumitor rezultate i concluzii. De calitatea metodelor i tehnicilor utilizate ntr-o activitate de analiz | i de eficien a utiliz |rii lor depind, n mod direct i ntr-o propor ie foarte mare, att semnifica ia i validitatea concluziilor ob inute, ct i calitatea rezultatelor ob inute. Combinarea, la nivelul analizei cantitative, a celor trei categorii de elemente men ionate anterior, conduce la ob inerea unor rezultate i concluzii, care contribuie la adncirea procesului de cunoa tere a realit|ii studiate i care se pot concretiza sub mai multe forme: ob inerea de informa ii relevante suplimentare privind starea, evolu ia i conexiunile componentelor realit|ii investigate; relevarea unor noi principii i legit|i care guverneaz | micarea fenomenelor i proceselor din aceast | realitate; formularea unor concluzii cu privire la existen a unor leg |turi i specificit|i ce caracterizeaz | realitatea studiat|; validarea unor ipoteze formulate cu privire la popula iile reprezentate de fenomenele i procesele studiate; identificarea unor tipologii i structuri specifice pe mulimea de fenomene i procese analizate; estimarea unor efecte i influen e caracteristice interdependen elor dintre fenomene i procese; deducerea unor modele statistico-matematice, care s | descrie comportamentul fenomenelor i proceselor; efectuarea de predic ii cu privire la evolu ia fenomenelor i proceselor; efectuarea de simul|ri privind evolu ia fenomenelor i a interdepende elor manifestate ntre acestea. Fenomenele economico-sociale i micarea acestora n timp i spa iu, adic | procesele, au o caracteristic | ce le face s | se deosebeasc | n mod esen ial, fundamental, de fenomene i procese specifice altor domenii de activitate. Aceast | caracteristic | este dat| de faptul c | manifestarea la nivel observabil a acestor fenomene i a mic |rii lor, este extrem de complex | i mbrac | o deosebit de mare varietate de forme, fiecare fenomen sau proces economico-social existnd sub form | multiplicat| pe o scar| foarte m are. Proprietatea de multiplicitate la o scar | foarte mare, pe care o au existen a i manifestarea fenomenelor economice i sociale, este cunoscut| n literatura domeniului sub numele de caracter de mas | al fenom enelor econom ico-sociale. Formele sub care se manifest | fenomenele economice i sociale apar, de regul|, ca o amalgamare de aspecte esen iale i neesen iale, legate direct sau indirect de con inutul fenomenului, de ceea ce este esen ial i stabil n comportamentul acestuia, fiind caracterizate n timp, cel pu in la suprafa |, de un grad relativ ridicat de instabilitate. Partea consistent |, semnificativ | i stabil| a unui fenomen economico-social este, de obicei, ascuns | de aceast | multitudine de manifest |ri, astfel nct cunoa terea acesteia nu se poate face dect rareori prin observare direct|, fiind necesar, de cele mai multe ori, un demers logic extrem de complex, n cadrul c |ruia se urm |re te eliminarea a ceea ce este accidental, conjunctural, neesen ial i nesemnificativ n manifestarea fenomenului, re inndu-se ceea ce este trainic, cu caracter de regularitate, esen ial i semnificativ. O alt| caracteristic | a fenomenelor economico-sociale este cea legat| de multitudinea i eterogenitatea acestor fenomene, de dimensiunile la care are loc desf |urarea acestora, de numeroasele leg |turi func ionale existente ntre acestea i de multiplele interdependen e i condiion |ri dintre fenomenele economico-sociale i fenomenele specifice altor domenii. Gradul ridicat de interconectare a elementelor i multitudinea factorilor de influen |, implica i n manifestarea rela iilor de cauzalitate, reprezint| caracteristici definitorii pentru majoritatea fenomenelor i proceselor de natur | socio-economic |. Amploarea complexit|ii din domeniul economico-social rezult| i din faptul c | natura i intensitatea rela iilor de interdependen | cunosc o m are variabilitate n tim p i spa iu, c | sensul rela iilor de cauzalitate este reversibil, chiar contradictoriu, i c |, din cauza gradului ridicat de interconectare, manifestarea cauzalit|ii are loc, n multe situa ii, sub forma unor "reac ii n lan ". Specificitatea domeniului economico-social i caracteristicile care l fac s | se diferen ieze fundamental de celelalte domenii de activitate, impun ca procesul de cunoa tere n acest domeniu, investigarea tiin ific | a fenomenelor i proceselor de natur | economico-social| s | poarte o amprent| specific |, particular |. Caracterul complex al manifest |rii fenomenelor economice i sociale face ca activitatea de cunoa tere n acest domeniu s | fie puternic condiionat| att de m odalitatea concret| de abordare a obiectului studiat, ct i de natura i puterea metodelor, tehnicilor i instrumentelor de investigare utilizate. Faptul c | fenomenele economice i sociale se caracterizeaz | printr-un grad de complexitate foarte ridicat face ca activitatea

2

de investigare a comportamentului acestora s | fie deosebit de dificil| i rezultatele acesteia s | aib | un grad ridicat de relativitate din punct de vedere al semnifica iei i exactit|ii. n aceste condiii, succesul investiga iilor socio-economice, valabilitatea i stabilitatea concluziilor rezultate din analizele efectuate, depind n mod direct de compatibilitatea dintre natura instrumentelor de investigare folosite i specificul fenomenelor investigate. Alegerea modalit|ilor de abordare i a celor mai potrivite metode i tehnici de analiz | sau predic ie reprezint| condiia de baz | pentru ob inerea unor rezultate satisf|c |toare n activitatea de cunoa tere a fenomenelor din domeniul economico-social. n ceea ce prive te modalit|ile de abordare, cele mai des utilizate n analiza datelor sunt: abordarea sistemic |, abordarea statistic | i abordarea bazat| pe modelarea matematic | i informatic |.

1.2.1 Abordarea sistemic|O principal | modalitate de abordare, esen ial| pentru orice proces de investigare tiin ific |, impus | cu necesitate mai ales n cazurile n care domeniul vizat este caracterizat de un grad ridicat de complexitate, este cea cunoscut| sub numele de abordare sistem ic |. Att n sens teoretic, ct i n sens practic, abordarea sistemic | se deta eaz | ca metod | general|, universal | utilizat | n investigarea tiin ific |, indiferent de domeniul concret al investig |rii tiin ifice. n cazul particular al analizei datelor, abordarea sistemic | are o importan | special|, att n faza de analiz | propriu-zis |, ct i n faza de interpretare sa rezultatelor.

1.2.2 Abordarea statistic|Caracterul de mas | pe care l au fenomenele economice i sociale determin | ca manifestarea acestora, n timp i spa iu, s | intre sub inciden a unui principiu universal de regularitate i stabilitate, specific fenomenelor cu frecven | foarte mare de existen | i apariie, principiu sintetizat sub forma uneia din cele mai importante legi din domeniul cunoa terii umane: legea num erelor mari. Regularitatea i stabilitatea comportamentului fenomenelor economice i sociale sunt asigurate, n virtutea acestui principiu, de tendin a de com pensare a influen elor cu sensuri contrarii, pozitive i negative, exercitate de factorii neesen iali, nesemnificativi i accidentali implica i n determinarea rela iilor de cauzalitate dintre fenomenele socio-economice. O consecin | direct| i imediat| a acestui principiu const | n faptul c | investigarea comportamentului fenomenelor economice i sociale i formularea de concluzii sintetizatoare cu privire la amploarea sau sensul evolu iei acestor fenomene sunt cu mult mai u or de realizat i caracterizate de un grad mult mai ridicat de semnifica ie i exactitate n cazul n care sunt supuse studiului colectivit |i mari de fenomene comparativ cu situa ia n care studiul vizeaz | fenomene individuale, izolate. Necesitatea de a fructifica n procesul cunoa terii fenomenelor i proceselor economice sau sociale facilit|ile ce rezult| din faptul c | acestea au caracter de mas |, impune ca n ntreaga activitate de analiz | a datelor din domeniul economico-social s | prevaleze m odalitatea de abordare statistic | i folosirea metodelor i tehnicilor oferite de teoria probabilit|ilor i statistica m atem atic |. Modalitatea de abordare statistic | este impus | ca modalitate de investigare a fenomenelor de natur | socio-economic | i de faptul c | manifestarea acestora este caracterizat| de un grad ridicat de incertitudine i im previzibilitate. Elementele vizate n mod direct n cadrul investiga iilor tiin ifice bazate pe utilizarea metodelor i tehnicilor proprii analizei datelor, sunt reprezentate de fenomenele cu natur | stohastic |, adic | de fenomenele al c |ror comportament are caracter aleatoriu, dar care manifest | o anumit| regularitate mai mult sau mai pu in evident |. Definiie: Fenom enul stohastic este acel fenomen observabil, ale c |rui manifest |ri particulare sunt incerte, dar care eviden iaz | o anumit| regularitate a formelor de manifestare, o anumit| leg |tur | ntre aceste forme de manifestare. Necesitatea utiliz |rii n procesul de investigare a fenomenelor economice i sociale a modalit|ii de abordare statistic | este determinat| i de caracterul de relativitate, par ialitate i inexactitate al informa iei din acest domeniu. Imposibilitatea de a ob ine informa ii cu caracter exhaustiv despre desf |urarea fenomenelor economice i sociale impune ca activitatea de cunoa tere a ansamblului acestei desf|ur |ri s| se bazeze pe informa ii cu caracter par ial, ob inute pe baz | de sondaj. Extinderea concluziilor rezultate din analiza informa iilor ob inute prin sondaj la nivelul ntregului ansamblu de fenomene investigate de sondaj se bazeaz | pe metodele i tehnicile inferen ei statistice. Una din cerin ele de baz | impuse de modalitatea de abordare statistic | oric |rui demers tiin ific ce are ca obiect investigarea comportamentului unor fenomene i procese economice sau sociale poate fi exprimat | prin necesitatea de a studia variabilele ce descriu acest comportament, n interdependen a i sim ultaneitatea lor. Analiza izolat| a comportamentului fiec |rei variabile este incompatibil| cu modalitatea de abordare sistemic | i duce la o pierdere important | de informa ie semnificativ | n cazul n care variabilele sunt interdependente. Mai mult dect att, concluziile par iale desprinse n urma unei astfel de analize nu pot fi generalizate i nu au valabilitate la nivelul comportamentului "legat" al variabilelor, influen a interac iunii dintre acestea fiind, de cele mai multe ori, covr itoare. De regul|, analiza comportamentului individual al unui fenomen, n sensul s|u unidimensional, face obiectul analizei statistice descriptive. Analiza statistic | descriptiv | permite reprezentarea unor colec ii foarte mari de date ntr-o manier | sugestiv | i asimilabil|, simplificat| i schematizant |. Considernd o mulime de variabile aleatoare ce descriu un anumit fenomen economic sau social, vom ob ine rezultate total diferite dac | vom studia, de exemplu, reparti ia fiec |reia dintre ele izolat, separat de celelalte, comparativ cu situa ia n care n studiu ar fi vizat| reparti ia comun |, legat| a acestor variabile. Studiul comportamentului simultan, interdependent, al unei mulimi de variabile presupune metode i tehnici de complexitate i rafinament mult mai ridicate dect studiul comportamentului izolat al acestora i face obiectul unei discipline aparte, i anume analiza statistic | multidim ensional| sau m ultivariat|.

1.2.3 Abordarea bazat| pe modelarea matematic| i informatic|A a cum am ar |tat anterior, complexitatea ridicat| ce caracterizeaz | domeniul economico-social i celelalte elemente de specificitate ale fenomenelor apar innd acestuia, determin | ca orice demers tiin ific ntreprins n scopul adncirii cunoa terii 3

n acest domeniu s | presupun |, cu necesitate, utilizarea unor metode i tehnici de lucru corespunz |toare. Din rndul instrumentelor de investigare tiin ific |, a c |ror utilitate n contracararea dificult|ilor ridicate de gradul sporit de complexitate al domeniului studiat este de nenlocuit i a c |ror utilizare nso e te ast|zi demersul tiin ific din aproape oricare domeniu al cunoa terii umane, se deta eaz | m odelarea matem atic | i tehnica de calcul. Ca unul dintre cele mai utile i eficiente instrumente de cunoa tere a realit|ii, m odelarea matem atic | reprezint| procesul de descriere a comportamentului unor fenomene din natur | i societate sub o form | sintetic |, logic | i formalizat| matematic. Descrierea sub o form | matematic | a comportamentului fenomenelor i proceselor din cele mai diverse domenii de activitate a devenit ast |zi dorin a i, de cele mai multe ori, scopul oric |rui cercet|tor, indiferent de domeniul n care acesta activeaz |. Surprinderea interdependen elor, a legit|ilor i func ionalit|ilor ce caracterizeaz | fenomenele sau procesele din lumea ce ne nconjoar |, sub forma sintetic | a unui model matematic, este, probabil, cea mai relevant | m |sur | a nivelului la care a ajuns gradul de cunoa tere uman |. Din punct de vedere informa ional, modelul matematic, n forma sa final|, poate fi privit ca un "concentrat informa ional", avnd att calitatea de acumulator al informa iei receptate din segmentul de realitate economic | sau social| pe care l descrie, ct i de generator de informa ie nou |, inexistent | n momentul construirii lui.

1.3 M|surarea i cuantificarea n domeniul economico-socialPosibilitatea efectu |rii analizelor sau predic iilor din domeniul economico-social este strict condiionat| de existen a unei baze informa ionale care s | cuprind | informa iile necesare cu privire la nivelul, structura sau evolu ia n timp a fenomenelor i proceselor supuse investig |rii, sau cu privire la condiion |rile cauzale ale acestor fenomene i procese. Ob inerea informa iilor necesare pentru activitatea de analiz | a datelor este, de regul|, rezultatul unor procese de observare i m |surare a fenomenelor i proceselor supuse studiului i presupune existen a unor instrumente adecvate. Informa iile referitoare la un anumit fenomen supus studiului, informa ii necesare analizei comportamentului respectivului fenomen, reprezint| rezultatul unui proces de m |surare. Acest proces reprezint|, de fapt, o ac iune de atribuire de valori numerice pentru caracteristicile respectivului fenomen. Definiie: Prin proces de m |surare se n elege totalitatea activit|ilor de atribuire a unor valori numerice pentru caracteristicile fenomenului analizat. n cea mai mare parte a lor, informa iile necesare efectu |rii analizelor sau predic iilor din domeniul economico-social trebuie s | aib | natur | cantitativ |, s | reprezinte exprim area sub form | num eric | a caracteristicilor specifice fenomenelor analizate. Aceast | condiie presupune, n mod implicit, necesitatea existen ei unor unit|i de m |sur |, prin intermediul c |rora diferitele caracteristici ale fenomenelor economice sau sociale s | poat | fi exprimate, a unor instrum ente adecvate pentru m |surarea caracteristicilor fenomenelor i a unor m odalit|i de exprim are numeric |. Din nefericire ns |, att unit|ile de m |sur |, ct i instrumentele utilizate pentru exprimarea sub o form | cantitativ | a caracteristicilor fenomenelor economice i sociale, sunt caracterizate de inexactitate i instabilitate, iar utilizarea acestora este generatoarea unei multitudini de erori cu natur | extrem de variat|. Exprimarea sub o form | numeric | a caracteristicilor fenomenelor i proceselor economice sau sociale presupune un proces de observare a formelor individuale prin intermediul c |rora se manifest | acestea i de nregistrare a valorilor pe care le iau aceste caracteristici n momentul observ |rii. Odat| cu activitatea de nregistrare a m |rimilor caracteristicilor fenomenelor i proceselor economico-sociale, adic | a valorilor luate de variabilele supuse studiului, are loc i un proces implicit de m |surare, de cuantificare, proces ce presupune folosirea unor unit|i de m |sur | specifice i instrumente de lucru adecvate. De regul|, informa ia rezultat| n urma acestui proces este o informa ie brut|, primar |, care este cunoscut| sub numele de dat|. Cele mai dificile probleme cu care este confruntat| investigarea fenomenelor economice sau sociale, de-a lungul ntregului ir de procese de culegere, prelucrare i interpretare a informa iilor referitoare la aceste fenomene, apar tocmai n cadrul procesului de observare i nregistrare, de m |surare i cuantificare a caracteristicilor fenomenelor. n general, putem spune c | m |surarea i cuantificarea din domeniul socio-economic au ca obiective principale: stabilirea nivelului sau volumului fenomenelor economice i sociale; eviden ierea alc |tuirii lor structurale; caracterizarea evolu iei lor n timp sau spa iu; exprimarea leg |turilor acestora cu alte fenomene sau procese. Din punct de vedere conceptual, toate aspectele fenomenelor sau proceselor care fac obiectul m |sur |rii i cuantific |rii sunt reunite sub termenul generic de caracteristici ale acestor fenomene sau procese. n activitatea de m |surare i cuantificare din domeniul economico-social apar o serie de dificult|i, determinate de specificitatea acestui domeniu, cum ar fi: problema unit|ilor de m |sur |, par ialitatea informa iilor, problema erorilor, problema imposibilit|ii m |sur |rii directe etc.

1.3.1 Unit|ile de m|sur|O problem | dificil| i complex | care apare n mod frecvent n procesul de m |surare din domeniul economico-social, este cea dat| de faptul c | unit|ile de m |sur | utilizate pentru exprimarea sub form | numeric | a caracteristicilor unui anumit fenomen nu sunt stabile. Cu o problem | de acest fel este confruntat|, n special, activitatea de m |surare i cuantificare din domeniul economic. Spre deosebire de cele mai multe domenii ale tiin ei, n domeniul economic, unit|ile de m |sur | cunosc modific |ri substan iale n timp, modific |ri ce confer | rezultatelor m |sur |torilor un puternic caracter de instabilitate. De cele mai multe ori, varia ia unit|ilor de m |sur | este indus | chiar de modific |ri, de un anumit tip, ale fenomenelor i proceselor studiate, ale fenomenelor cu care acestea sunt, direct sau indirect, legate sau chiar a unor fenomene independente de fenomenele studiate.

4

1.3.2 Parialitatea informaiilorO alt| problem | ce ridic | o serie de dificult|i n m |surarea i cuantificarea din domeniul economico-social, este cea legat| de par ialitatea informa iilor disponibile pentru activit|ile de analiz | a datelor. Complexitatea fenomenelor economice i sociale, multitudinea a formelor de manifestare n timp i spa iu a acestora, fac ca ob inerea de informa ii printr-o observare complet| a desf |ur |rii acestor fenomene s | fie de cele mai multe ori imposibil|. n aceste condiii, modalitatea cea mai comod |, dar i cea mai eficient |, de ob inere a informa iilor necesare efectu |rii analizelor sau realiz |rii predic iilor este cea a observ |rii selective a manifest |rii fenomenelor. Aceast | modalitate de investigare se bazeaz | pe faptul c |, n anumite condiii, cunoa terea caracteristicilor ntregii popula ii poate fi ob inut| prin studierea direct| numai a unui anumit num |r de unit|i ce intr | n componen a acesteia, num |r care este mult mai redus n compara ie cu volumul total al popula iei. Alegerea unit|ilor ce vor fi efectiv supuse procesului de m |surare i nregistrare se face dup | criterii i reguli foarte precise, fundamentate riguros din punct de vedere statistico-matematic. Valorile pe care le iau caracteristicile unit|ilor studiate prin intermediul acestui procedeu alc |tuiesc a a-numitul e antion de observa ii. Investigarea fenomenelor i proceselor economice sau sociale pe baza informa iilor provenite din observ |ri selective i concluziile rezultate n urma acestei investig |ri sunt puternic influen ate de gradul n care informa iile ce alc |tuiesc e antionul sunt reprezentative la nivelul ntregii popula ii de la care au fost ob inute. De regul|, gradul de reprezentativitate al unui e antion este invers propor ional cu gradul de eterogenitate a popula iei i direct propor ional cu num |rul de unit|i incluse n e antion. n condiiile n care informa iile ob inute de la unit|ile selectate n e antion nu reproduc ntr-o m |sur | acceptabil| comportamentul fenomenului la nivelul ntregii popula ii, rezultatele analizelor efectuate vor fi incorecte, iar concluziile formulate pe baza acestora vor fi eronate. De aceea, n toate cazurile n care baza informa ional| utilizat| n procesele de analiz | a datelor este ob inut| pe calea observ |rii selective, este necesar | o laborioas | activitate de verificare a semnifica iei rezultatelor i de validare a concluziilor desprinse pe baza acestor rezultate. Implica iile negative ale caracterului de par ialitate a informa iilor din domeniul economico-social asupra valabilit|ii concluziilor formulate n urma prelucr|rii acestor informa ii, pot fi mult diminuate, dac | organizarea cercet|rii selective este f|cut | innd cont de o serie de principii de baz | ale teoriei selec iei, dac | n procesul de prelucrare a informa iilor sunt utilizate metodele i tehnicile statistico-matematice cele mai potrivite i dac | n extinderea rezultatelor nu sunt nc |lcate o serie de principii statistice elementare. Respectarea cu stricte e a cerin elor de acest tip poate conduce la ob inerea unor rezultate cu adev |rat excep ionale, chiar atunci cnd cantitatea de informa ie disponibil| este neglijabil| n raport cu dimensiunea i propor iile fenomenului studiat.

1.3.3 ErorileImpactul numeroaselor imperfec iuni legate de m |surarea i cuantificarea din domeniul economico-social este concretizat, din punct de vedere al proceselor de analiz | a datelor, n manifestarea unor distorsiuni i inexactit|i informa ionale. n mai toate cazurile, informa iile disponibile pentru efectuarea unor analize sau prognoze sunt afectate de erori. Faptul c | informa iile disponibile sunt puternic afectate de erori, ale c |ror surse sunt numeroase, variate i dificil de controlat, impune utilizarea unor modalit|i specifice de abordare i a unor instrumente de lucru corespunz |toare. Erorile ce nso esc observa iile rezultate din m |surarea i cuantificarea fenomenelor i proceselor economice sau sociale pot fi grupate n dou | mari categorii: erori cu caracter sistematic i erori cu caracter accidental, aleator.

Erorile cu caracter sistematicSunt erorile care afecteaz | n mod substan ial, semnificativ, natura i semnifica ia informa iilor i care pot determina denaturarea drastic | a rezultatelor ob inute i formularea unor concluzii fundamental eronate. Sursele erorilor cu caracter sistematic sunt numeroase i extrem de variate: gradul redus de reprezentativitate a informa iilor ob inute pe baz | de e antionare, imperfec iunile metodologice specifice calculului unor indicatori economici, raport|rile incorecte determinate de interesele de natur | fiscal| ale agen ilor economici, falsific |rile informa ionale la nivel guvernamental etc. Definiie: Eroarea cu caracter sistematic poate fi definit| ca reprezentnd diferen a dintre valoarea adev |rat| a unei m |rimi la nivel de popula ie i valoarea ob inut| pentru aceast| m |rime n urma m |sur |rii tuturor unit|ilor elementare ale popula iei. Problema cea mai dificil | legat | de impactul negativ al erorilor cu caracter sistematic este aceea c |, spre deosebire de erorile cu caracter ntmpl|tor, n cazul acestor erori nu se manifest | tendin a de compensare, astfel nct distorsionarea informa iei determinat| de aceste erori are loc numai ntr-un sens. n cazul erorilor de natur | sistematic |, influen a negativ | a acestora nu mai poate fi estompat | de caracterul de mas | al fenomenelor economico-sociale, care n cazul altor tipuri de erori poate conduce la compensarea efectelor erorilor.

Erorile cu caracter accidentalSunt erorile a c |ror influen | asupra semnifica iei informa iilor este neglijabil|; distorsiunile provocate de acest tip de erori la nivelul datelor ce descriu comportamentul fenomenelor economice sau sociale sunt, de regul|, de sens opus, astfel nct n numeroase situa ii are loc o compensare a influen elor acestora. Definiie: Eroarea cu caracter accidental, aleator poate fi definit| ca reprezentnd diferen a dintre valoarea unei m |rimi calculate pe baza unit|ilor apar innd unui e antion i valoarea aceleia i m |rimi calculat| pe baza tuturor unit|ilor popula iei. Faptul c | erorile de acest tip sunt distribuite dup | legea de probabilitate normal| ofer | posibilitatea abord |rii statistice a influen elor cu caracter distorsionant pe care le pot avea acestea asupra datelor. Pe de alt| parte, n virtutea legii numerelor mari, are loc un efect de compensare a erorilor de tip accidental, impactul negativ al acestora asupra calit|ii informa iilor utilizate n analiz | devenind neglijabil. 5

n principal, sursele erorilor cu caracter accidental, ntmpl|tor, in de o serie de factori cum ar fi: imperfec iunile instrumentelor de m |surare, deficien e n nregistrarea valorilor caracteristicilor urm |rite, efectuarea inexact| a unor calcule etc. O nsemn |tate cu adev |rat excep ional| pentru procesele de m |surare i cuantificare n care intervin erori cu caracter ntmpl|tor, o are faptul c | erorile de acest tip sunt distribuite dup | legea normal|, de medie nul|. Aceast | proprietate este deosebit de util| att pentru m |surarea impactului pe care erorile l au asupra informa iilor ob inute n urma proceselor de m |surare, de cuantificare i de analiz | a datelor, ct i pentru dezvoltarea unor proceduri specifice care au ca scop minimizarea influen ei erorilor asupra rezultatelor ob inute n analiza datelor. Formarea valorii unei m |sur |tori individuale, sub influena erorilor sistematice i accidentale, poate fi descris | cu ajutorul rela iei urm |toare:

Efectuarea analizelor de date n condiiile existen ei i manifest |rii erorilor de tip accidental, determin | necesitatea utiliz |rii unor metode i tehnici adecvate, de natur | statistico-matematic |.

1.3.4 M|surarea indirect|n numeroase situa ii din investigarea tiin ific |, este imposibil| m |surarea direct| a unor fenomene sau procese specifice domeniului economico-social. Situa iile de acest fel sunt ntlnite n cazul existen ei factorilor laten i sau ascun i, care au caracter neobservabil i care, n mod implicit, nu pot fi supu i unui proces direct de m |surare. Factorii laten i sunt expresia manifest |rii unor fenomene de maxim | generalitate, cu semnifica ie i consisten | foarte importante, caracterizate printr-o mare stabilitate a manifest |rilor lor. Ei reprezint| agreg |ri ale manifest |rilor unei multitudini complexe de fenomene cu natur | particular |. Datorit | semnifica iei i importan ei prin care factorii laten i se deta eaz | de fenomenele care reprezint| forme particulare de manifestare ale acestora, n numeroase investiga ii tiin ifice scopurile urm |rite sunt direct i strns legate ntr-o m |sur | mult mai mare de existen a factorilor laten i, n compara ie cu manifest |rile particulare ale acestora. De i au caracter neobservabil, factorii laten i se manifest | totdeauna n mod indirect, prin intermediul unor forme particulare de manifestare, forme care pot avea caracter observabil i care pot fi supuse unui proces de m |surare. n analiza datelor, se consider | c | formele particulare prin care se manifest | factorii laten i reprezint| indicatori ai factorilor laten i. n acest fel, informa iile disponibile cu privire la ace ti indicatori pot fi folosite pentru a deduce informa ii cantitative i calitative despre factorii laten i. Problema m |sur |rii indirecte, prin intermediul unor indicatori specifici, a factorilor cu natur | latent |, apare n mod frecvent n cazul investig |rii unor caracteristici psihosociale, n cercet|rile legate de cuantificarea nivelului de dezvoltare economic |, nivelului de dezvoltare social| sau nivelului progresului tehnic, n construirea unor indicatori agrega i etc. n aceste cazuri, se apeleaz | la proceduri speciale de estimare, la metode i tehnici de m |surare indirect| sau la metode de analiz| multidimensional|, cum ar fi: analiza componentelor principale, analiza factorial| sau analiza coresponden elor.

1.4. Definirea analizei datelorAnaliza datelor are ca obiectiv fundamental extragerea informa iei relevante, semnificative, care este con inut| n date, n informa ia primar |. Aceast | informa ie este utilizat|, n continuare, pentru rezolvarea unor probleme specifice ale analizei datelor: testare, estimare, interpretare, predic ii etc. Conceptul de analiz | a datelor este un concept extrem de cuprinz |tor i dificil de definit din punct de vedere al sferei de cuprindere, iar metodele i tehnicile utilizate n analiza datelor variaz | de la cele mai simple modalit|i de prezentare grafic | a datelor i calcul al unor indicatori statistici specifici, pn | la cele mai sofisticate metode de analiz | multidimensional|. Definiie: Activitatea de analiz| a datelor poate fi definit| ca reprezentnd o succesiune de opera ii de prelucrare i interpretare, opera ii efectuate asupra unor informa ii primare referitoare la fenomene i procese din realitatea economico-social| i bazate pe o mare varietate de metode i tehnici specifice, n scopul adncirii cunoa terii comportamentului acestor fenomene i procese i al formul|rii unor concluzii cu privire la specificitatea manifest |rii lor. n figura urm |toare, este eviden iat| o reprezentare simplificat| a procesului general de analiz | cantitativ |, a modului n care intervin cele trei elemente men ionate anterior i a principalelor faze ale acestui proces.

Figura 1.1: Reprezentarea simplificat| a unui proces general de analiz | cantitativ | 6

Privit ntr-un mod foarte general, procesul de analiz | a datelor poate fi prezentat ca o succesiune de opera ii sintetizate sub forma urm |toarelor activit|i: form ularea ipotezelor cu privire la comportamentul fenomenului ce constituie obiectul studiului; organizarea experim entelor necesare m |sur|rii caracteristicilor fenomenului studiat; culegerea datelor privind comportamentul fenomenului ; analiza i interpretarea datelor disponibile; form ularea concluziilor, efectuarea predic iilor i luarea deciziilor. Scopul urm |rit n cele mai multe probleme de analiz | a datelor este legat de crearea condiiilor informa ionale necesare pentru efectuarea de predic ii cu privire la comportamentul fenomenelor investigate. De i ntre activitatea de analiz | a datelor i activitatea de predic ie exist| numeroase deosebiri, legate n primul rnd de natura celor dou | activit|i, totu i, ntre cele dou | genuri de activit|i exist| o important | suprapunere. Aceast | suprapunere este determinat| de existen a unor modalit|i comune de abordare, de utilizarea unor concepte teoretice identice i de folosirea aceleia i game de instrumente de lucru. Cu toate c | obiectivele intermediare urm |rite n activitatea de predic ie sunt similare celor urm |rite n analiza datelor, totu i, scopul final al oric |rei activit|i de predic ie este legat n mod direct de prefigurarea evolu iei viitoare a fenomenelor i proceselor economice sau sociale, a modific |rilor structurale ce pot fi nregistrate n viitor de aceste fenomene i procese. Atingerea acestui scop este ns | condiionat| de desf |urarea unei laborioase activit|i de analiz | a datelor cu privire la realitatea fenomenului care face obiectul predic iei, activitate care, de regul|, precede procesul de predic ie propriu-zis. Con inutul activit|ii de analiz | a datelor din domeniul economico-social este strns legat de natura claselor de probleme supuse rezolv |rii. n func ie de aceast | natur |, analiza datelor poate presupune o anumit| succedare de activit|i specifice, utilizarea unei anumite game de metode i tehnici de lucru, urm |rirea anumitor obiective. n rndul categoriilor de probleme a c |ror rezolvare conduce la efectuarea unui proces de analiz | a datelor men ion |m: identificarea legit|ilor ce guverneaz | micarea fenomenelor i proceselor economice sau sociale, a principalelor tendin e i regularit |i specifice evolu iei acestora; identificarea principalilor factori sub a c |ror influen | se formeaz | comportamentul unor fenomene i procese; stabilirea sensului i intensit|ii leg |turilor cauzale manifestate ntre diferite fenomene i procese; determinarea gradului n care o mulime de factori de influen | contribuie la formarea unui anumit efect; verificarea unor ipoteze cu privire la existen a unor leg |turi de tip cauzal, la posibilitatea ca anumite caracteristici ale unor fenomene s | nregistreze anumite valori specifice etc; ierarhizarea factorilor ce determin | un anumit efect n func ie de importan a i semnifica ia influen ei acestora; stabilirea modului n care comportamentul fenomenelor este afectat de anumite decizii sau m |suri de politic | economic | i social|; identificarea principalelor posibilit|i prin intermediul c |rora comportamentul fenomenelor s| poat | fi influen at ntrun sens dorit; determinarea sensurilor n care comportamentul unui anumit fenomen poate evolua, a st |rilor posibile n care acesta se poate afla n spa iu i timp sau efectuarea de predic ii privind st|rile i evolu ia acestui fenomen. n func ie de specificul fiec |reia din aceste clase de probleme, activitatea de analiz | a datelor se poate concretiza printr-un anumit gen de opera ii de modelare statistico-matematic | i prelucrare informa ional| viznd: simplificarea i sintetizarea rela iilor de cauzalitate; m |surarea interdependen elor, cuantificarea influen elor i verificarea semnifica iei acestora; descrierea statistico-matematic | a comportamentului fenomenelor; efectuarea de predic ii; m |surarea gradului de omogenitate sau eterogenitate pentru anumite categorii de fenomene; clasificarea i ierarhizarea fenomenelor. Fiecare din aceste tipuri de opera ii presupune utilizarea unor instrumente de lucru corespunz |toare, eficiente n raport cu specificul problemei considerate. Dintre principalele metode i tehnici proprii analizei multidimensionale a datelor i utilizate pentru rezolvarea problemelor enumerate anterior men ion |m: analiza componentelor principale, analiza factorial|, analiza coresponden elor, tehnicile de scalare multidimensional|, metodele i tehnicile de estimare, analiza corela iilor canonice, analiza varian ei, analiza regresiei liniare i neliniare, metodele i tehnicile de recunoa tere a formelor.

1.5 Clasificarea metodelor de analiz| a datelorn general, n analiza de date, obiectul studiului este reprezentat de c |tre o mulime de date structurat| sub forma unui anumit num |r de variabile i a unui anumit num |r de observa ii. Aceast | structur | informa ional| este reprezentat| prin intermediul unei entit|i cunoscute sub numele de matrice de observa ii. n func ie de natura variabilelor analizate i de informa iile existente aprioric cu privire la natura leg |turilor cauz |-efect n care sunt implicate variabilele, metodele de analiz | a datelor pot fi grupate n dou | mari categorii: metode de analiz| a dependen ei i metode de analiz| a interdependen ei. Metodele de analiz| a dependen ei sunt metode statistice utilizate n cazul n care variabilele considerate n cadrul unei analize pot fi grupate n dou | submulimi i au ca scop testarea prezen ei sau absen ei unor interdependen e ntre cele dou | submulimi de variabile. n situa ia n care exist| informa iile necesare, astfel nct, variabilelor dintr-un set li se poate atribui semnifica ia de variabile dependente, iar variabilelor din cel|lalt set li se poate atribui semnifica ia de variabile independente, metodele de analiz | a dependen ei au ca scop de a determina dac | i cum variabilele independente influen eaz| variabilele dependente, att n manier | individual|, ct i n manier | comun |, simultan |. De regul|, dndu-se o mulime de date reprezentate de observa iile efectuate asupra unor variabile, cu ajutorul metodelor statistice se poate verifica doar dac | exist| leg |turi, interdependen e ntre variabile, putndu-se, eventual, determina sensul 7

leg |turilor (directe sau inverse) sau chiar m |sura intensitatea acestor leg |turi. Ceea ce nu se poate stabili cu ajutorul metodelor i tehnicilor statistice este natura, sensul rela iilor de cauzalitate, respectiv, care sunt variabilele dependente i care sunt variabilele independente ce determin | evolu ia, micarea celor dependente. Pentru a stabili cu exactitate rela ia cauz|-efect este nevoie de informa ii suplimentare, apriorice, exogene n raport cu metodele i tehnicile statistice utilizate. Exist| un anumit context al analizei datelor, n cadrul c |ruia delimitarea variabilelor dependente de variabilele independente este foarte clar |, neechivoc |. Acest context este ntlnit n cadrul experimentelor controlate, cnd, n urma stabilirii unor combina ii de nivele ale variabilelor independente, sunt m |surate nivelele nregistrate pentru variabilele dependente, ca urmare a influen ei exercitate de fiecare combina ie de nivele ale variabilelor dependente. n multe situa ii, analiza datelor este efectuat| pe mulimi de variabile pentru care nu exist| nici interesul i nici posibilitatea conceptual| de a separa din mulimea variabilelor analizate o submulime care s | reprezinte variabilele dependente i o alt| submulime care s | reprezinte variabile independente. n aceste situa ii, sunt utilizate metode de analiz | specifice, cunoscute sub numele de metode de analiz| a interdependen ei. Metodele de analiz| a interdependen ei sunt metodele statistice utilizate n cazul n care nu exist| posibilitatea de a identifica n mulimea variabilelor analizate variabile dependente i variabile independente i care au scopul de a stabili din ce cauz| i n ce m |sur | variabilele analizate sunt legate ntre ele. Utilizarea acestor metode are o mare varietate de scopuri, dintre care, printre cele mai importante, amintim: m |surarea gradului de interdependen |, identificarea variabilelor cu semnifica ie relevant|, identificarea unor categorii sau clase de variabile.

1.5.1 Metode de analiz| a dependeneiMetodele de analiz | a dependen ei pot fi clasificate n func ie de mai multe criterii, dintre care cele mai importante sunt urm |toarele: num |rul de variabile dependente: o singur | variabil| dependent| sau mai multe variabile dependente; num |rul de variabile independente: o singur | variabil| independent| sau mai multe variabile independente; tipul scalei pe care sunt m |surate variabilele dependente: scal| non-metric | sau scal| metric |; tipul scalei pe care sunt m |surate variabilele independente: scal| non-metric | sau scal| metric |; Metodele de analiz | a dependen ei pot fi clasificate n func ie de num |rul de variabile dependente i de num |rul de variabile independente n dou | grupe: metode unidimensionale de analiz| a dependen ei; metode multidimensionale de analiz| a dependen ei. n categoria metodelor unidimensionale se ncadreaz | analiza regresiei simple, analiza discriminantului, procedurile unidimensionale de verificare a unor ipoteze etc. Metodele de analiz | multidimensional| a dependen ei se mpart, n func ie de num |rul variabilelor dependente, n dou | categorii: metode de analiz| multidimensional| cu o singur | variabil| dependent|; metode de analiz| multidimensional| cu mai multe variabile dependente. n rndul metodelor de analiz | multidimensional| cu o singur | variabil| dependent | pot fi men ionate: analiza regresiei multiple, analiza discriminantului, analiza varian ei etc. Ca metode de analiz | multidimensional| cu mai multe variabile dependente putem men iona: analiza corela iilor canonice, analiza multidimensional| a varian ei etc. O clasificare sintetic | a metodelor de analiz | a dependen ei, n func ie de criteriile de mai sus, este prezentat| n tabelul urm |tor. Clasificarea metodelor de analiz | a dependen ei Num |r variabile independente Num |r variabile dependente O variabil| Scal| non-metric| Scal| nonmetric | Scal| metric | Scal| nonmetric | Analiza discriminantului (discret|) Scal| metric| testul t Mai multe variabile Scal| non-metric| Analiza multigrup a discriminantului (discret|) Analiza multigrup a discriminantului Analiza multigrup a discriminantului (discret|) Analiza multigrup a discriminantului Scal| metric| Analiza multidimensional| a varianei (MANOVA) Analiza corelaiilor canonice Analiza multidimensional| a varianei (MANOVA) Analiza corelaiilor canonice

O variabil|

Analiza Regresie discriminantului simpl| Regresie logistic| Analiza discrimi- Analiza nantului (discret|) ANOVA Analiza simultan| (MONANOVA) Analiza Regresie discriminantului multipl| Regresie logistic|

Mai multe variabile

Scal| metric |

1.5.2 Metode de analiz| a interdependeneiAnaliza interdependen ei are ca scop s | identifice i s| eviden ieze situa iile n care variabilele sunt corelate ntre ele i s| explice modul n care are loc corelarea variabilelor supuse analizei. n func ie de num |rul de variabile analizate, metodele de 8

analiz | a interdependen ei se mpart n dou | categorii: metode de analiz| a interdependen ei dintre dou | variabile; metode de analiz| a interdependen ei dintre mai multe variabile. n cadrul metodelor de analiz | a interdependen ei dintre dou | variabile putem men iona: analiza corela iei simple, analiza bazat| pe tabele de contingen | etc. Dintre metodele de analiz| a interdependen ei dintre mai multe variabile putem men iona: analiza componentelor principale, analiza factorial|, analiza coresponden elor, analiza cluster etc. n tabelul urm |tor este prezentat| sintetic clasificarea metodelor i tehnicilor de analiz | a interdependen ei. Clasificarea metodelor de analiz | a interdependen elor Num |r variabile Dou | variabile Tabele de contingen| (bidimensionale) Modele log-liniare Analiza corespondenelor Modele log-liniare Tabele de contingen| (multidimensionale) Tipul scalei Scal| non-metric | Scal| metric | Analiza corelaiei simple

Mai multe variabile

Analiza componentelor principale Analiza factorial|

1.6 Analiza preliminar| a datelorUna din cele mai importante etape ale procesului de analiz | a datelor din domeniul economico-social este cea a analizei prelim inare, cunoscut| i sub numele de analiz| exploratorie a datelor. Analiza preliminar| este o activitate anterioar |, preg |titoare, a analizei propriu-zise a datelor, care are ca scop iniializarea procesului de analiz |. n cadrul acestei etape, informa iile primare disponibile sunt supuse unui proces de prelucrare n cadrul c |ruia are loc o filtrare a informa iilor din punct de vedere al semnifica iei i utilit|ii pe care le au acestea n raport cu scopurile urm |rite. Activitatea de analiz | preliminar| a datelor presupune utilizarea unei game variate de metode i tehnici statistico-matematice n scopul ob inerii unei sugestive caracteriz |ri statistice a acestor informa ii. Preponderent| ca utilizare n faza de analiz | preliminar| a datelor i cu o utilitate de necontestat pentru activitatea tiin ific | din aceast | etap |, este analiza grafic |. Utilizarea tehnicilor de analiz | grafic | n faza preliminar| a analizei datelor vizeaz |, n principal, urm |toarele categorii de probleme: identificarea principalelor tendin e manifestate la nivelul observa iilor disponibile; depistarea principalelor leg |turi existente ntre variabilele supuse analizei; detectarea valorilor extreme, izolate, a c |ror apari ie n mulimea datelor analizate nu se justific | din punct de vedere statistic. Exist| n prezent numeroase instrumente software, cu ajutorul c |rora pot fi efectuate, ntr-o manier | comod | i eficient |, cele mai complexe reprezent |ri grafice.

1.7 Suportul software n analiza datelorApariia calculatoarelor bazate pe microprocesoare i larga accesibilitate a acestora din punct de vedere al pre ului i software-ului aplicativ au f|cut ca, n prezent, s | nu existe domeniu de cercetare n care calculatorul electronic s | nu fie instrumentul cel mai frecvent folosit pentru rezolvarea celor mai diverse probleme. Prelucrarea unui volum uria de informa ii, pe baza unor algoritmi de o complexitate deosebit| i n condiii de precizie ridicat|, nu se poate realiza dect cu ajutorul calculatorului electronic, chiar a unui calculator electronic performant. n domeniul analizei datelor, exist| zeci i zeci de produse software, de dat| mai mult sau mai pu in recent|. O inventariere, pe care nu o putem pretinde a fi exhaustiv |, dar care poate fi considerat| ca fiind minimal |, pe care am f|cut-o n anul 2005, cu privire la instrumentele software existente n lume la acest moment, ne-a condus la identificarea a peste 100 de astfel de instrumente software specializate. Num |rul lor este cu att mai semnificativ cu ct aceste produse software sunt de notorietate mondial|, avnd o larg | utilizare n domeniul analizei datelor. Printre cele mai noi i mai performante instrumente software existente n prezent, destinate, total sau par ial, activit|ilor de analiz | a datelor, putem men iona: SPSS 10.0, SPSS Inc., Chicago, IL, USA, 1999; STATISTICA 6.0, StatSoft Inc., Tulsa, OK, USA,2001; S-PLUS 2000, MathSoft Inc., Seattle, W ashington, USA, 1999; SAS 8.2, SAS Institute Inc., Cary, NC, USA, 2001; SYSTAT 9.0, SPSS Inc., Chicago, IL, USA, 1999; MATHEMATICA 4.0, W olfram Research, Champaign, IL, USA,1999; EVIEWS 3.0, Quantitative Micro Software, Irvine, CA, USA, 2000. n afar | de existen a unei mari variet|i de instrumente software destinate analizei datelor, n prezent se poate identifica o tendin | de dezvoltare exploziv | a preocup |rilor din acest domeniu, tendin | determinat| de necesit|ile informa ionale tot mai mari i mai rafinate ale indivizilor i entit|ilor economice i sociale. 9

Tema 2. Concepte i operaii specifice econometriei i analizei datelor2.1 Concepte fundamentale ale analizei datelorTeoria i practica analizei datelor se bazeaz | pe o serie de concepte fundamentale, a c |ror definire este deosebit de important | pentru n elegerea demersului tiin ific presupus de acest tip de analiz |, pentru definirea i n elegerea procedurilor i instrumentelor specifice ale acestei discipline, pentru desf |urarea eficient| a organiz |rii i proiect|rii activit|tilor de analiz | i pentru interpretarea rezultatelor ob inute din analiz |. Conceptele utilizate n analiza datelor i definirea riguroas | a acestora prezint| importan | nu numai pentru a facilita definirea i n elegerea procedurilor, metodelor i tehnicilor de analiz | a datelor, ci i pentru asigurarea unei modalit|i coerente i sugestive de interpretare i prezentare a concluziilor rezultate din analiz |. Pe lng | conceptele proprii, specifice, n analiza datelor sunt utilizate numeroase concepte care in de domenii nrudite cu analiza datelor, cum ar fi: teoria probabilit|ilor i statistica, econometria, teoria economic |, informatica etc. Din acest motiv, mulimea conceptelor cu care se opereaz | n domeniul analizei datelor este extrem de cuprinz |toare i extrem de variat|.

2.1.1 DataConceptul cel mai important i cel mai frecvent ntlnit n analiza datelor, care, de fapt, intr | i n alc |tuirea numelui acestui tip de activitate tiin ific |, este reprezentat de dat|. Importan a acestui concept pentru domeniul analizei datelor este, cu adev |rat, covr itoare, deoarece el este cel care define te att intr |rile oric |rui proces de analiz | a datelor, materia prim | supus | prelucr|rii, ct i, ntr-un sens general, ie irile sale, rezultatele i concluziile ob inute. Datele pot fi privite ca reprezentnd semnale i mesaje provenite din realitatea nconjur |toare, pe baza c |rora receptorul i poate forma o anumit| imagine despre respectiva realitate, poate ob ine un anumit grad de cunoa tere a acelei realit|i. Imaginea format| este cu att mai fidel| n raport cu realitatea, cu ct cantitatea semnalelor i mesajelor este mai mare, respectiv, cu ct acestea sunt mai pu in afectate de perturba ii i de distorsiuni. De regul |, datele nu sunt recep ionate n mod pasiv de beneficiarul lor, f|r | nici un efort din partea acestuia. Aproape f|r | excep ie, ob inerea datelor necesare pentru orice activitate de analiz | constituie un proces costisitor i laborios. n analiza datelor, datele reprezint| expresia cantitativ | sau calitativ | a unor fapte reale, care sunt manifest |ri ale fenomenelor i proceselor investigate. Eterogenitatea fenomenelor i a manifest |rii concrete a acestora face ca datele referitoare la ele s | fie extrem de variate. Definiie: Datele reprezint| expresii cantitative i calitative ale unor fenomene i procese din realitatea nconjur |toare. Datele pot s| difere n func ie de mai muli factori: de sursa care le-a generat, de tipul i de natura lor. Indiferent de varietatea lor, datele pot fi grupate n trei categorii fundamentale: date cantitative, date calitative i date mixte. Toate cele trei tipuri de date pot fi, ns |, exprimate sub form | cantitativ |.

2.1.2 Populaia i eantionulUnul din conceptele fundamentale ale analizei datelor, de care este legat| definirea multora dintre conceptele uzuale ale acestei discipline este cel de popula ie statistic |. n raport cu acest concept fundamental sunt definite majoritatea celorlalte concepte utilizate n analiza datelor: e antion, caracteristici, variabile, observa ii, parametri, grade de libertate. Definiie: Popula ia sau colectivitatea general| este reprezentat| de mulimea tuturor m |sur |torilor efective sau conceptuale care prezint| interes pentru cercet|tor sau experimentator. n general, se poate spune c | popula ia statistic | reprezint|, obiectul de studiu global al analizei datelor. Aceasta deoarece majoritatea tehnicilor i instrumentelor de analiz | a datelor au ca scop deducerea unor legit|i care guverneaz | popula ia statistic |, ob inerea unor estima ii pentru o serie de m |rimi specifice aceleia i popula ii statistice, efectuarea de predic ii referitoare la structurarea pe tipologii sau la evolu ia popula iei statistice. De i popula ia reprezint| obiectul investiga iei tiin ifice, totu i, analiza datelor vizeaz | n mod direct, aproape exclusiv, observa iile de la nivelul e antionului. Popula ia statistic | poate fi definit| ca reprezentnd totalitatea observa iilor posibile dintr-un studiu. Generic, o unitate component | a unei popula ii statistice se nume te unitate elementar |, element, individ, subiect, obiect, profil, form |, articol sau caz. Ca exemple de unit|i elementare ale unei popula ii statistice putem men iona: cump |r |torul, firma, locuitorul unei |ri sau al unui ora , produsul, familia etc. n func ie de num |rul, finit sau infinit, al elementelor din care este alc |tuit | o popula ie statistic |, aceasta poate fi de dou | tipuri: popula ie finit| i popula ie infinit|. Teoretic, ntr-o problem | de analiz | a datelor pot fi studiate, fie toate observa iile posibile, adic | ntreaga popula ie, fie o parte, mai mare sau mai mic | a acestora, numit| e antion. Definiie: E antionul reprezint| o submulime de m |sur |tori selectate dintr-o popula ie, o submulime a popula iei statistice supus | investiga iei tiin ifice. E antionul are o importan | fundamental| n analiza datelor deoarece acesta, i nu popula ia total|, reprezint|, de fapt, baza informa ional| utilizat| n procesele de analiz | a datelor. Informa iile primare manipulate n activitatea de analiz | a datelor sunt 10

de fapt rezultatele m |sur |torilor efectuate la nivel de e antion. O modalitate de vizualizare a rela iei, a raportului n care se g |se te e antionul fa | de popula ia statistic | este prezentat| n figura urm |toare.

Figura 2.1: Ilustrarea rela iei dintre e antion i popula ie O foarte mare importan | principial| pentru analizele cantitative bazate pe studiul e antioanelor, o are postulatul statistic n conformitate cu care un e antion exprim | informa ional ntr-o oarecare m |sur | popula ia din care a fost extras, propriet|ile i structura popula iei fiind cu att mai fidel exprimate de e antion cu ct volumul acestuia este mai mare.

2.1.3 Caracteristici i variabileDin punct de vedere al informa iei statistice, o popula ie statistic | prezint| interes nu n raport cu unit|ile, ca atare, din care este alc |tuit | popula ia, ci n raport cu tr |s |turile, propriet|ile acestor unit|i. Propriet|ile unit|ilor elementare apar innd unei popula ii statistice sunt numite n analiza datelor caracteristici sau atribute. Fiecare unitate elementar | a popula iei investigate poate avea o singur | caracteristic | sau mai multe caracteristici. n cel de-al doilea caz, n studierea popula iei statistice apare necesitatea abord |rii multidimensionale, necesitatea utiliz |rii unor instrumente i tehnici de analiz | specifice caracterului multidimensional. n func ie de natura lor, caracteristicile unit |ilor unei popula ii pot fi de dou | tipuri: caracteristici calitative i caracteristici cantitative. Caracteristicile sau atributele unit|ilor elementare ce alc |tuiesc o anumit| popula ie sunt elemente ale unei realit|i date, de natur | empiric |. De regul|, n activitatea tiin ific | nu se opereaz | cu elementele realit|ii ca atare, ci cu sim boluri care sunt reprezent|ri abstracte ale realit|ii. M |surarea caracteristicilor unit|ilor unei popula ii este echivalent | cu atribuirea de simboluri, numerice sau nenumerice, acelor caracteristici. n general, simbolurile care pot s| ia o varietate de valori se numesc variabile. n cadrul demersurilor tiin ifice care au ca scop investigarea fenomenelor i proceselor economice sau sociale, caracteristicile unit|ilor unei popula ii sunt reflectate prin intermediul conceptului de variabile, tocmai pentru a sugera natura schimb |toare a acestora, variabilitatea lor n timp i spa iu. Variabila este, poate, cel mai important concept vehiculat n cadrul oric |rui proces de analiz | a datelor, n raport cu care se define te ntreaga succesiune de opera ii de prelucrare specifice acestui proces. Informa iile care sunt elemente de intrare n procesele de analiz | a datelor, reprezint|, aproape f|r | excep ie, m |sur |tori asupra unor caracteristici, m |sur |tori care definesc valori ale variabilelor ce simbolizeaz | caracteristicile popula iei analizate. Definiie: Variabila reprezint| o abstractizare a mulimii de valori posibile pe care le poate nregistra o caracteristic | a unui anumit fenomen. Varietatea fenomenelor economico-sociale i modalit|ile diferite de exprimare a caracteristicilor acestora fac ca variabilele prin intermediul c |rora sunt descrise aceste caracteristici s| aib | natur | diferit|. Ca i caracteristicile popula iilor, dup | natura pe care o au, variabilele pot fi de dou | tipuri: variabile calitative i variabile cantitative. n analiza datelor apare necesitatea trat|rii diferen iate a datelor de tip calitativ i cantitativ deoarece exist| diferen e substan iale ntre aceste tipuri de date att din punct de vedere al modalit|ilor de abordare i interpretare, ct i din punct de vedere al metodelor i tehnicilor utilizate n analiz |. Din aceste motive, se face o deosebire net| ntre variabilele de tip calitativ i variabilele de tip cantitativ. Definiie: Variabilele calitative sunt variabile ce difer | prin tip, se refer | la propriet|i nenumerice ale unit|ilor elementare apar innd unei popula ii i nu pot fi exprimate numeric. n cazul n care, n mod conven ional, valorile lor sunt codificate prin numere, aceast| exprimare nu este relevant| numeric. Variabile calitative sunt: sexul, op iunea cump |r |torului, op iunea aleg |torului, profesia, starea civil | etc. Definiie: Variabilele cantitative sunt variabile care difer | prin m |rime, se refer| la propriet|i numerice ale unit|ilor elementare dintr-o popula ie i sunt exprimate n unit|i numerice: de lungime, de greutate, valorice etc. Variabile cantitative sunt: pre ul unui produs, cheltuielile lunare ale unei familii, salariul mediu lunar, venitul na ional, volumul fizic al produc iei etc. n func ie de natura valorilor pe care le iau, variabilele se mpart n dou | categorii: variabile de tip discret i variabile de tip continuu. Definiie: Variabilele de tip discret sunt variabile care pot lua o mulime limitat|, finit| de valori i care se mai numesc i variabile categoriale. Valorile luate de variabilele discrete se numesc alternative, categorii, variante sau m odalit|i. De regul|, variabilele

11

calitative sunt variabile de tip discret. Variabile de tip discret pot fi ns | i unele variabile cantitative. Definiie: Variabilele de tip continuu sunt variabile care pot lua valori apar innd unui interval continuu. Practic, mulimea valorilor posibile ale variabilelor de tip continuu este o mulime infinit |. De regul|, variabilele calitative nu sunt variabile de tip continuu.

2.1.4 ObservaiiStrns legat de conceptul de variabil|, este un alt concept, la fel de important i frecvent utilizat n analiza datelor, i anume, conceptul de observa ie. Definiie: Observa ia este reprezentat| de valoarea sau setul de valori nregistrate pentru o anumit| unitate elementar | a popula iei, la una sau mai multe caracteristici ale acesteia. De fapt, observa iile sunt valori pe care le iau variabilele supuse analizei, valori care sunt rezultate din m |sur |torile efectuate asupra caracteristicilor unit|ilor apar innd popula iei investigate. Observa ia reprezint| n procesul de analiz | a datelor unitatea elementar | de informa ie utilizat| n procesele de prelucrare, mulimea observa iilor constituind baza informa ional| a analizei datelor. Practic, mulimea de observa ii supuse procesului de analiz | este echivalent | cu e antionul, care, la rndul s|u, nu este altceva dect tot o mulime de observa ii. De cele mai multe ori, prin observa ie se n elege chiar entitatea elementar | care intr | n alc |tuirea popula iei analizate i de la care se ob in informa ii. n acest sens, observa ia este sinonim | cu cazul, obiectul, individul, subiectul, articolul.

2.2 Tipuri de date primaren func ie de modul n care sunt ob inute, datele primare pot fi clasificate n mai multe categorii. Vom prezenta, n continuare, dou | dintre clasific |rile cele mai importante ale datelor primare: clasificarea n func ie de natura contextului n care acestea sunt ob inute i clasificarea n func ie de modul de ob inere a acestora.

2.2.1 Date experimentale i date non-experimentaleDin punct de vedere al naturii contextului n care datele sunt ob inute, al modului n care investigatorul controleaz | sau nu, n procesul ob inerii datelor, popula ia supus | studiului, datele pot fi grupate n dou | categorii: date experim entale; date non-experim entale sau date observa ionale. Diferen ele dintre datele experimentale i non-experimentale in nu numai de natura contextului n care ele sunt ob inute, ci i de modul n care ele sunt utilizate n analiza datelor, de metodele, instrumentele i procedurile utilizate pentru prelucrarea acestora.

2.2.1.1 Date experimentaleDatele experimentale sunt datele ob inute prin organizarea unor experimente de tip controlat, desf |urate n condiii clare i prestabilite. Contextul ob inerii datelor de tip experimental este restric ionat, prin impunerea unor reguli specifice. n general, organizarea unui experiment controlat presupune, n primul rnd, izolarea fenomenelor i proceselor studiate, precum i eliminarea, n ct mai mare m |sur |, a influen elor externe, care nu prezint | interes pentru analiz |. O alt| etap | important | a experimentului controlat este aceea a stabilirii factorilor i cauzelor importante, cu semnifica ie, care i exercit| influen a asupra m |rimilor exogene, precum i a alegerii nivelelor la care influen a acestora va fi urm |rit |. Cea de-a treia etap | a procesului de ob inere a datelor experimentale const | n desf|urarea experimentului propriu-zis, etap | n care sunt doza i, n condiii specifice, factorii de influen |. n aceast | etap |, se fixeaz | nivele concrete pentru fiecare din factorii de influen |, se creaz| condiiile necesare pentru exercitarea influen elor factorilor i se m |soar | efectul influen ei factorilor asupra m |rimii sau m |rimilor de ie ire. Datele ob inute n urma unui astfel de proces, adic | datele experimentale, sunt reprezentate de dou | categorii de informa ii: valorile fixate pentru nivelurile factorilor de influen | i valorile rezultate pentru variabila sau variabilele dependente, n urma exercit|rii acestor influen e. Definiie: Datele experim entale reprezint| informa ii ob inute prin organizarea unor experimente controlate, n care influen ele factorilor asupra efectului sunt controlate n mod direct, prin fixarea unor combina ii precise de influen e. Datele experimentale sunt caracteristice doar unor domenii de cercetare, i anume acelor domenii n care pot fi organizate experimente specifice, necesare ob inerii acestor date. Experimentarea este posibil| doar n anumite domenii ale cunoa terii, cum ar fi, de exemplu, domeniul tiin elor naturale: fizic |, chimie, biologie etc. ntr-o alt| modalitate de exprimare, se poate spune c | datele experimentale sunt date de laborator, prin laborator n elegnd aici o serie de condiii speciale, care se refer | att la o serie de restric ii i instrumente specifice de m |surare, ct la modalitatea de desf |urare a unor procese cauzale specifice. Spre deosebire de aceste domenii, n domeniul economico-social experimentarea este fie total imposibil|, fie posibil|, dar numai foarte rar i n condiii foarte restrictive i costisitoare.

2.2.1.2 Date non-experimentaleDatele non-experimentale, care se mai numesc i date observa ionale, sunt datele ob inute prin observarea fenomenelor i proceselor n micarea lor natural|, liber |, f|r | impunerea unor restric ii, f|r | a se exercita un control de un anumit fel asupra fenomenelor i proceselor investigate.

12

Definiie: Datele non-experim entale reprezint| informa ii ob inute prin observarea liber | a mic |rii fenomenelor i proceselor studiate, f|r | interven ia direct| a investigatorului asupra condiiilor n care se desf |oar | acest | micare. Ob inerea datelor de tip non-experimental reprezint| rezultatul observ |rii pasive, constat|rii. Interven ia observatorului, a celui care face m |sur |torile, este de tip ex-post, are loc dup | ce desf |urarea fenomenelor i proceselor reale a avut loc. Datele de tip non-experimental sunt datele specifice domeniului economico-social, domeniu n care organizarea de experimente este fie dificil|, fie imposibil|. Mai mult dect att, complexitatea influen elor din domeniul economico-social, multitudinea interac iunilor din acest domeniu, determin | o relevan | foarte sc |zut | pentru eventualele date de natur | experimental|.

2.2.2 Date de tip profil, serii de timp i date panelDin punct de vedere cronologic, observarea unei popula ii de fenomene sau procese, n scopul ob inerii informa iilor necesare, poate avea loc sub dou | forme diferite: static i dinamic. Din acest punct de vedere, datele primare pot s| constituie fie o imagine de tip static a popula iei, n care aceste date s | reprezinte informa ii legate de starea unit|ilor popula iei la un moment dat, fie o imagine de tip dinamic, evolutiv, n care datele s | reprezinte informa ii legate de evolu ia n timp a unei sau unor unit|i ale popula iei. Avnd n vedere aceste dou | modalit|i de a observa unit|ile unei popula ii, datele primare pot fi grupate n trei categorii: date de tip profil; date de tip serii de tim p; date de tip panel; Ca i n cazul datelor experimentale, analiza datelor diferen iaz | semnificativ modalit|ile de abordare, n raport cu fiecare din aceste categorii de date. Din acest motiv, consider |m c | este necesar | o scurt| prezentare a acestor trei tipuri de date.

2.2.2.1 Date de tip profilDatele de tip profil reprezint| rezultate ale unor m |sur |tori efectuate, la un moment dat, asupra uneia sau mai multor caracteristici, de-a lungul unit|ilor popula iei, adic | pe mulimea unit|ilor sau obiectelor care sunt supuse studiului. Datele de tip profil se mai numesc date de tip secven | sau date de tip sec iune i reprezit| t|ieturi informa ionale efectuate ntr-o anumit| popula ie la un moment dat, t|ieturi care sunt de tip transversal, n raport cu axa timpului. Definiie: Datele de tip profil reprezint| informa ii ob inute prin m |sur |tori de natur | static |, efectuate asupra caracteristicilor unor unit|i ale unei popula ii, la acela i moment de timp. O observa ie n contextul datelor de tip profil este reprezentat| de valoarea sau de valorile unei singure entit|i, ale unei singure unit|i din popula ie. Num |rul de observa ii coincide, n cazul datelor de tip profil, cu num |rul de unit|i observate i nregistrate. D atele de tip profil nu ncorporeaz | n semnifica ia pe care acestea o poart|, influen a timpului asupra form |rii caracteristicilor la nivelul popula iei i sensul scurgerii timpului, nici n mod explicit i nici n mod implicit. Ca exemple de date de tip profil, putem men iona: datele referitoare la salariul individual dintr-o lun | al lucr|torilor unei firme; datele referitoare la popula ia medie a statelor lumii ntr-un anumit an; datele referitoare la rata infla iei nregistrat| de |rile lumii ntr-o anumit| perioad |; sexul cump |r |torilor ce cump |r | un anumit bun ntr-o anumit| perioad |; num |rul mediu nregistrat de popula ia jude elor unei |ri ntr-un anumit an; volumul anual al vnz |rilor unor m |rci de autoturisme, num |rul voturilor nregistrate de partidele nscrise ntr-o campanie electoral| etc. De regul|, datele de tip profil se refer | la starea pe care o au la un anumit moment indivizii apar innd unor anumite colectivit|i, gospod |riile, firmele, ramurile, unit|ile administrativ-teritoriale, |rile lumii etc.

2.2.2.2 Date de tip serii de timpDatele de tip serii de tim p, numite i serii cronologice sau, pur i simplu, serii de tim p, reprezint| rezultate ale unor m |sur |tori efectuate asupra caracteristicilor unei unit|i a popula iei studiate, de-a lungul timpului, la momente succesive ale evolu iei acesteia, la anumite intervale de timp. Intervalele de timp pentru care se fac m |sur |torile pot fi reprezentate de: ore sau frac iuni de ore, zile, s |pt|mni, decade, luni, trimestre, semestre, ani. Deoarece intervalele sunt egale i reprezint| scurgerea timpului, observa iile rezultate n urma acestor m |sur |tori sunt succesive i, de regul|, echidistante n timp. Definiie: Datele de tip serii de tim p sau seriile cronologice reprezint| informa ii ob inute prin m |sur |tori de natur | dinamic |, efectuate asupra caracteristicilor unei unit|i a unei popula ii la momente sau n intervale succesive de timp. Datele reprezentate de seriile de timp se refer | la evolu ia n timp a st|rii unui individ, gospod |rii, zone geografice, |ri etc. Datele de acest tip pot fi date de tip interval sau date de tip moment. Datele de tip interval sunt datele care se refer | la caracteristici care sunt m |rimi de tip stoc, n timp ce datele de tip moment sunt date care se refer | la caracteristici care sunt m |rimi de tip flux. i n acest caz, datele de tipul seriilor de timp pot fi privite ca reprezentnd sec iuni informa ionale, ns | aceste sec iuni sunt de-a lungul axei timpului, de-a lungul evolu iei, adic | sunt sec iuni longitudinale n raport cu axa timpului.

2.2.2.3 Date de tip panelDatele de tip panel sunt date care reprezint| combina ii, mixturi ale datelor de tip profil i datelor de tipul seriilor de timp. Ele sunt rezultate ale m |sur |torilor efectuate asupra caracteristicilor unor unit|i individuale, att de-a lungul unit|ilor individuale, ct i de-a lungul timpului. Definiie: Datele de tip panel reprezint| informa ii ob inute prin m |sur |tori mixte, de natur | static | i de natur | dinamic |, efectuate asupra caracteristicilor acelora i unit|i ale unei popula ii la momente sau n intervale succesive de timp. Datele de tip panel pot fi imaginate ca reprezentnd t|ieturi informa ionale mixte, transversale i longitudinale, n raport 13

cu axa timpului. n cazul datelor de tip panel, observarea se face ntr-o not| de simultaneitate: att asupra mai multor unit|i ale popula iei, ct i asupra evolu iei n timp a acestor unit|i. Exemplul cel mai sugestiv pentru datele de tip panel este cel al bugetelor de familie, n contextul c |rora se fac nregistr |ri pe perioade de mai muli ani a veniturilor i cheltuielilor tuturor familiilor care alc |tuiesc e antionul respectiv.

2.2.3 Scala de m|surare a variabilelorA a cum am men ionat anterior, materia prim | n analiza datelor este reprezentat| de m |sur |torile efectuate asupra unor caracteristici ale popula iei statistice. n analiza datelor, aceste m |sur |tori sunt considerate a reprezenta valori ale unor variabile definite n raport cu caracteristicile analizate. Indiferent de tipul ei, valoarea nregistrat| de o caracteristic | la nivelul unui obiect este totdeauna rezultatul exprim |rii univoce a valorii respectivei caracteristici n func ie de grada iile unei anumite scale.

2.2.3.1 Definirea scaleiM |surarea reprezint| un proces prin intermediul c |ruia se asociaz | numere sau simboluri unor caracteristici sau propriet|i ale unor obiecte sau ale unor subiec i, care constituie obiectul studiului. Atribuirea de numere sau simboluri pentru caracteristicile sau propriet|ile unor obiecte se face pe baza respect|rii unor reguli prestabilite i prin utilizarea unor proceduri specifice. De exemplu, dac | obiectul studiului este reprezentat de indivizi care sunt poten iali cump |r |tori ai unui anumit produs, atunci caracteristicile c |rora este necesar a li se atribui numere sau simboluri pot fi: vrsta, venitul, sexul, profesia etc. M |surarea caracteristicilor sau propriet|ilor unor obiecte sau subiec i este totdeauna caracterizat| de o anumit| specificitate, determinat| de natura caracteristicii m |surate, i presupune, cu necesitate, existen a unor repere, a unor sisteme de referin |, cunoscute sub numele de scal|. Ca element fundamental al procesului de m |surare a caracteristicilor fenomenelor i proceselor economice, scala poate fi definit| sub forma urm |toare. Definiie: O scal| reprezint| un etalon corespunz |tor, care stabile te modul dup | care sunt atribuite valori variabilelor; a defini o scal| de m |surare este echivalent cu: a stabili o mulime de valori posibile ale variabilei, mulime numit| i spa iu de selec ie; a preciza regulile dup | care sunt atribuite simboluri pentru elementele unei realit|i date, adic | a defini o structur | a spa iului de selec ie. n func ie de natura variabilelor exprimate cu ajutorul lor, exist| patru tipuri de scale, pe care le von defini n cele ce urmeaz |.

2.2.3.2 Tipuri de scaleCa i procesul de m |surare ca atare, scala sau sistemul de referin | este, de asemenea, specific | naturii pe care o are caracteristica supus | procesului de m |surare. Din acest punct de vedere, exist | mai multe tipuri de scale de m |surare: scala nominal|, scala ordinal|, scala interval i scala raport. Primele dou | tipuri de scale sunt scale de tip non-m etric, iar ultimele dou | sunt scale de tip m etric.

2.2.3.2.1 Scala nominal|Scala nominal| este o scal| non-m etric |, pe baza c |reia valorile variabilelor sunt definite prin intermediul simbolurilor nenumerice. M |surarea variabilelor pe scala nominal| este echivalent | cu procesul de codificare a variabilelor. Chiar n cazul n care pentru codificare sunt folosite numere, aceste numere sunt, totu i, pur conven ionale. Definiie: Scala nominal| este o scal| non-metric |, prin intermediul c |reia valorilor posibile ale caracteristicilor m |surate li se atribuie simboluri f|r | relevan | numeric |, n func ie de natura acestor valori. Scala nominal| este utilizat| pentru a m |sura caracteristici ale c |ror valori sunt de natur | calitativ |, necuantificabil|. Valorile pe care pot s| le ia caracteristicile de acest tip sunt cunoscute sub numele de categorii sau alternative. Variabilele m |surate pe scala nominal| se numesc variabile nom inale i sunt variabile a c |ror form | de exprimare este de tip atributiv i care pot fi folosite numai pentru stabilirea apartenen ei la o anumit| clas | a entit|ii descrise prin intermediul variabilei. O clas | special| a variabilelor de tip nominal o reprezint| variabilele binare, care sunt variabile ce pot s | ia doar dou | valori de tip nenumeric. Variabilele de tip nominal sunt variabile discrete i pot fi utilizate numai n scopuri de clasificare de tip calitativ, natura nenumeric | a acestor variabile f|cnd imposibil| utilizarea lor pentru compara ii, ierarhiz |ri sau ordon |ri. n cazul m |sur |rii pe scala nominal|, valorilor pe care pot s| le ia caracteristicile supuse m |sur |rii, respectiv categoriilor sau alternativelor, li se atribuie sim boluri, care sunt de natur | nenumeric |. Pe scala nominal|, dou | valori diferite ale caracteristicii m |surate sunt eviden iate prin intermediul a dou | simboluri diferite. Elementele scalei nominale, diviziunile acesteia, sunt reprezentate de simbolurile atribuite valorilor caracteristicii studiate, sau, mai exact, de categoriile respectivei caracteristici. Scala nominal| este reprezentat| chiar de mulimea acestor simboluri. De exemplu, mulimile: , , , reprezint| scale de tip nominal utilizate pentru a m |sura caracteristici cum ar fi sexul, domeniul de activitate, categoria social|, profesia. Ceea ce este caracteristic scalei nominale este faptul c | subiec ii studia i nu pot fi compara i din punct de vedere al valorii pe care o nregistreaz | la caracteristica m |surat| pe aceast | scal|. Pe baza valorilor nregistrate pe scara nominal| nu se poate afirma care subiect este mai bine situat din punct de vedere al caracteristicii studiate sau, cu att mai pu in, n ce m |sur | un subiect este situat mai bine dect altul.

14

Tot pe aceast | scal|, caracteristicilor li se pot atribui i numere, numai c | aceste numere nu au sensul propriu-zis de num |r, avnd practic aceea i semnifica ie ca i simbolurile. Att simbolurile propriu-zise, ct i numerele cu rol de simbol, atribuite caracteristicilor pe aceast | scal| de m |surare, au numai rol de clasificare n anumite grupe a subiec ilor sau de contorizare a num |rului de subiec i din fiecare categorie, neputnd fi folosite n nici un tip de calcul numeric. Prin intermediul valorilor m |surate pe scala nominal| subiec ii se diferen iaz | ntre ei doar din punct de vedere al apartenen ei la o anumit| clas | sau al apartenen ei la o anumit| categorie. Aceasta nseamn | c | utilizarea scalei nominale pentru m |surarea caracteristicilor m |surabile pe aceast | scal| genereaz | clase sau categorii de subiec i. Pentru caracteristicile m |surate pe scala nominal|, poate fi calculat un num |r limitat de indicatori statistici, care reprezint|, de fapt, contoriz |ri ale simbolurilor ap |rute pe scala nominal|. Ace ti indicatori sunt modulul i frecven a. n cazul caracteristicilor m |surate pe scala nominal| poate fi eviden iat| i distribu ia de frecven |. ntr-o analiz | de date, variabilele nominale pot fi reprezentate de o serie de variabile cum ar fi: sexul, categoria social|, tipul familiei, profesia, marca unui produs etc. Unica transformare de tip invariant a scalei nominale este reprezentat| de opera ia de recodificare, aceast| opera ie neafectnd apartenen a la o anumit| clas | a valorilor m |surate pe acest| scal|.

2.2.3.2.2 Scala ordinal|Scala ordinal| este o scal| non-m etric |, similar | scalei nominale, adic | o scal| de codificare cu deosebirea c | pe aceast| scal| este posibil| ordonarea valorilor variabilelor. Aceast | scal| este folosit| cu prec |dere pentru m |surarea preferin elor consumatorilor. Scala ordinal| permite clasificarea valorilor unei variabile n func ie de rangul acestora, ns | diferen ele ntre ranguri nu sunt relevante i nu au sens. Acest tip de scal| nu d | posibilitatea stabilirii gradului n care caracteristicile a dou | entit|i distincte difer | ntre ele (mai mult, mai pu in). Definiie: Scala ordinal| este o scal| non-metric |, prin intermediul c |reia valorilor posibile ale caracteristicilor li se atribuie numere de ordine sau ranguri, n func ie de pozi ia acestor valori ntr-o ierarhie. Variabilele m |surate pe aceast | scal| se numesc variabile ordinale, sunt variabile calitative de tip discret i nu pot fi exprimate sub o form | numeric | real|. Ca exemple de variabile ordinale putem men iona: categoria de venit (mic, mediu, mare), nivelul studiilor (elementare, medii, superioare), preferin a consumatorilor pentru un anumit produs (foarte mare, mare, mic |, foarte mic |, deloc), nivelul calitativ al unui produs sau serviciu (inferior, mediu, superior), starea economic | (recesiune, stagnare, expansiune) etc. Scala ordinal| este utilizat| n cazul n care caracteristica subiec ilor supu i analizei determin | o diferen iere a subiec ilor din punct de vedere al poziiei pe care fiecare dintre ace tia o ocup | ntr-o ierarhie, ntr-o ordonare, adic | n cazul n care caracteristica ia valori de tip ordinal. Valorile pe care pot s| le ia caracteristicile m |surate pe scala ordinal| sunt valori ordinale sau note, cunoscute i sub numele de ranguri. Acestor valori li se atribuie fie numere de ordine, fie simboluri care eviden iaz | o anumit| ordine a valorilor caracteristicii. Pe scala ordinal|, dou | valori diferite ale unei caracteristici sunt eviden iate prin intermediul a dou | ranguri diferite, adic | prin intermediul a dou | pozi ii diferite n cadrul ierarhiei. Elementele scalei ordinale, diviziunile acesteia, sunt reprezentate de numerele sau de simbolurile folosite pentru reprezentarea rangurilor, respectiv de poziiile posibile n respectiva ordonare. Scala nominal| este reprezentat| chiar de mulimea acestor numere sau simboluri. Cu toate c | valorile caracteristicilor de tip ordinal nu sunt numere propriu-zise, ele diferen iaz |, totu i, pozi ia unui subiect n raport cu un alt subiect, spun ceva despre aceast | pozi ie. Valorile unei caracteristici m |surate pe scala ordinal| permit doar ordonarea subiec ilor din punct de vedere al acestei caracteristici, determinnd o ierarhizare a subiec ilor sau obiectelor. Prin intermediul valorilor pe care le pot lua caracteristicile m |surate pe scala ordinal|, indivizii se diferen iaz | ntre ei doar din punct de vedere al rangului, al locului pe care l ocup | n ierarhia generat| de scala ordinal|. Aceasta nseamn | c | utilizarea scalei ordinale pentru m |surarea caracteristicilor m |surabile pe aceast | scal| genereaz | ierarhii, ordon |ri ale subiec ilor. M |surarea pe scala ordinal| permite compara ii ntre subiec i din punct de vedere al caracteristicii m |surate, dar aceste compara ii se refer | numai la modul n care un subiect este situat n raport cu altul, f|r | a se putea spune i n ce m |sur | subiec ii difer | ntre ei dup | caracteristica respectiv |. Diferen ele dintre dou | valori succesive de pe scala ordinal| nu pot fi considerate ca fiind egale, ele nedeterminnd o distan are egal| ntre indivizi, astfel nct s| se poat | afirma, de exemplu, c | subiectul situat pe primul loc este de trei ori mai bun dect subiectul situat pe locul al treilea. Pentru caracteristicile m |surate pe scala ordinal|, pot fi calcula i o serie de indicatori statistici cum ar fi: modulul, mediana, coeficientul de corela ie a rangurilor, frecven a. De asemenea, pentru caracteristicile de tip ordinal se poate eviden ia i distribu ia de frecven |. Este important s| se fac |, n acest context, precizarea c | media i diferen ele valorilor variabilelor ordinale sunt nerelevante, nu au sens informa ional i nici sens logic. Singura transformare invariant | a scalei ordinale este transla ia, adic | transformarea care p |streaz | ordinea valorilor unei variabile. Analitic, acest tip de transformare invariant | a scalei ordinale poate fi definit astfel: unde a este o constant |, pozitiv | sau negativ |, care d | sensul i m |rimea transla iei valorilor scalei ordinale, valori reprezentate de x.

2.2.3.2.3 Scala intervalEste o scal| quasi-m etric | pe care se poate defini un punct de referin |, dar acest punct nu este o origine "zero" real|, ci conven ional|, arbitrar |. Valoarea "zero" pe acest tip de scal| nu indic | nicidecum absen a fenomenului m |surat. Deci, pentru scala de tip interval, originea scalei este arbitrar |, avnd importan | doar scalarea valorilor n interiorul intervalului. Aceast | scal| permite scalarea valorilor unei variabile n cadrul unui interval de valori reale, f|r | a avea ns | o origine precis | a acestor valori. Cu valorile m |surate pe aceast | scal| pot fi efectuate diferen e, raporturi ale diferen elor, dar nu are sens determinarea raportului a dou | valori. 15

D