Analiza Componentelor Principale

13
Analiza Componentelor Principale (ACP) Uhali Artur Anul 1 Master SPMK

description

eef

Transcript of Analiza Componentelor Principale

Page 1: Analiza Componentelor Principale

Analiza Componentelor Principale (ACP)

Uhali ArturAnul 1 Master SPMK

Page 2: Analiza Componentelor Principale

Ce este ACP?

• Analiza componentelor principale are ca obiectiv prezentarea sintetică a unui tabel de date în care unităţile sunt descrise prin multiple variabile cantitative.

• O sinteză a informaţiei, variabilele descriptive sunt regrupate în factori sintetici, denumiţi componente principale, astfel încât pierderea de informaţie să fie minimă.

Page 3: Analiza Componentelor Principale

Ce este ACP?

• Reducerea variabilelor iniţiale poate fi utilizată pentru uşurarea interpretării (avem un număr mai restrâns de factori) şi de asemenea poate servi ca fază intermediară de calcul prealabil în utilizarea altor metode de analiză multidimensională.

• Scopul A.C.P. constă în determinarea acelor direcţii ce maximizează informaţia totală reţinută

Page 4: Analiza Componentelor Principale

Progresul tehnologic (2005)

• In analiza respectiva au fost luate in considerare 24 de tari: Kazakhstan, Colombia, Thailand, China, Turkey, Peru, Ecuador, Philippines, Tunisia, Iran, Paraguay, Sri Lanka, El Salvador, Nepal, Madagascar, Vietnam, Indonesia, Nicaragua, Egypt, Bolivia, India, Pakistan, Bangladesh, South Africa

Page 5: Analiza Componentelor Principale

Progresul tehnologic (2005)

• Printre variabile au fost:• alfabetizare- Gradul de alfabetizare a adultilor de peste 15 ani in anul 2005;• linii_telefonice - Numarul de linii de telefonice la 1000 de persoane in 2005;• abonati_tel_mobil - numarul de telefoane mobile la 1000 de persoane in 2005;• utilizatori_internet - numarul utilizatorilor de internet la 1000 de persoane in

2005;• cercetatori – numar de cercetatori la milionul de locuitori in 2005;• consum_energie- consumul de energie pe cap de locuitor(%) din totalul de

energie consumata in 2005; • PIB – miliarde $ (us) 2005;• indicele saracie- indicele de saracie umana, valoare procentuala in 2005( cu cat

valoarea sa este mai mare cu atat poporul e mai sarac);• populatie_urbana- % din totalul populatiei 2005;• numar_angajati- numarul de angajati (mii) in anul 2005.

Page 6: Analiza Componentelor Principale

Progresul tehnologic (2005)Component Matrixa

Component

1 2 3

Zscore(alfabetizare) .761 -.211 -.174

Zscore(linii_telefonie) .856 .288 -.184

Zscore(abonati_tel_mobil) .665 -.414 .303

Zscore(utilizatori_internet) .721 -.100 -.018

Zscore(cercetatori) .546 .262 -.062

Zscore(consum_energie) .323 .609 -.664

Zscore: PIB($) .360 .811 .437

Zscore(indicele_saracie) -.867 .240 .119

Zscore(Populatie_urbana) .659 -.563 .302

Zscore(numar_angajati) .242 .858 .404

Extraction Method: Principal Component Analysis.

a. 3 components extracted.

• Prima componenta principala este puternic negativ influientata de indicele de saracie, deoarece, cu cat tara are un indice de saracie mai mare cu atat este mai putin inclinata spre folosirea de tehnologie.

• Componenta a doua este puternica influentata de nivelul PIB-ului si a numarului de angajati. Reiese astfel, in urma unei ordonari crescatoare, ca China, India si Vietnam sunt tarile cu nivelul cel mai ridicat al produsului intern brut si cu numarul cel mai mare de angajati.

• A treia componenta principala indica pe bogatia monetara a tarilor considerate, fiind influientata atat de PIB si numarul de angajati cat si de economisirea de energie electrica, nivelul dezvoltarii populatiei in mediul urban, numarul de abonati la telefonia mobila.

Page 7: Analiza Componentelor Principale

Progresul tehnologic (2005)Rotated Component Matrixa

Component

1 2 3

Zscore(alfabetizare) .753 -.053 .291

Zscore(linii_telefonie) .634 .358 .566

Zscore(abonati_tel_mobil).808 .030 -.227

Zscore(utilizatori_internet).691 .111 .203

Zscore(cercetatori) .380 .320 .353

Zscore(consum_energie)-.039 .193 .937

Zscore: PIB($) .049 .978 .143

Zscore(indicele_saracie) -.867 .015 -.267

Zscore(Populatie_urbana).863 -.089 -.298

Zscore(numar_angajati) -.081 .963 .154

Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization.

a. Rotation converged in 5 iterations.

Tabelul Rotated Component Matrix foloseste tehnica rotirii axelor, tehnica Varimax, si are drept scop obtinerea unor coeficienti de corelatie cat mai mici pe una din componentele principale.

Page 8: Analiza Componentelor Principale

Progresul tehnologic (2005)Concluzii

Topul tarilor in functie de prima componenta principala, componenta ce indica accesului populaţiei la întreaga gamă de servicii oferite de dezvoltarea tehnologiilor informa ţionale.

Tara FACT_2China 3.597186India 1.392008Vietnam 1.013131Bangladesh 0.598077Nepal 0.587538Iran 0.408052Pakistan 0.244297Sri Lanka 0.2331Egypt 0.121975Thailand -0.0258Indonesia -0.03121Kazakhstan -0.05825Madagascar -0.07117Turkey -0.43819Tunisia -0.45884Nicaragua -0.66802El Salvador -0.67436Paraguay -0.69184Philippines -0.78346Ecuador -0.82296Bolivia -0.82909South Africa -0.87484Colombia -0.88103Peru -0.88629

Tara FACT_1Turkey 1.692055China 1.649365Iran 1.140779Colombia 0.893408Tunisia 0.689404Kazakhstan 0.526592Thailand 0.497049Peru 0.488084Vietnam 0.441834Ecuador 0.435171South Africa 0.404341El Salvador 0.196265Paraguay 0.089999Philippines 0.073668Bolivia -0.04832Indonesia -0.07209Egypt -0.15825Nicaragua -0.52321Sri Lanka -0.62418India -0.94564Pakistan -1.39979Madagascar -1.65462Bangladesh -1.86178Nepal -1.93013

Topul tarilor in functie de a doua componenta principala, ordonata crescator, deoarece indica, intr-un fel bogatia tarilor respective.

Tara FACT_3China 1.642949South Africa 1.486478India 1.213454Philippines 0.526857Nicaragua 0.50377Pakistan 0.43059Bolivia 0.426051Peru 0.414433Madagascar 0.401167Colombia 0.370185Tunisia 0.320675El Salvador 0.232681Indonesia 0.208636Ecuador 0.142021Turkey 0.103563Bangladesh -0.10371Paraguay -0.23572Egypt -0.37094Nepal -0.42547Thailand -0.78275Kazakhstan -0.96234Iran -1.05085Sri Lanka -1.27032Vietnam -3.22141

Topul tarilor in functie de cea de-a treia componenta principala, componenta ce indica nivelul dezvoltarii economice a tarilor considerate.

Page 9: Analiza Componentelor Principale

Analiza in firmelor producatoare de mobila

• In analiza respectiva au fost luate in considerare 25 de firme care produc mobila: DUMBRAVA SA, ELBAC SA, FAMOS SA, FURNIMOB SA, ILEFOR SA, IMIX SA, LEMEXIM SA, MONTANA SA, METAL LEMN SA, MOBAR SA, MOBIRIS SA, MOBAM SA, MOBEX SA, MOBILEXTRA SA, MOBIHAR SA, MOBILA RAD SA, MOBICRASNA, MOBILA BAR SA, MOBICOR SA, MOV SA, SAMUS MEX SA, SIMEX SA, SAMOBIL SA, SPECIAL SA, VICTORIAMOB SA

Page 10: Analiza Componentelor Principale

Analiza in firmelor producatoare de mobila

Factor Loadings (Unrotated)

Factor 1 Factor 2

CA 0,506 0,829

VT 0,888 -0,379

VE 0,890 -0,386

SAL 0,777 0,525

AI 0,804 -0,034

AC 0,925 -0,129

Expl. Var 3,94 1,27

Prp. Totl 0,65 0,21

Component Matrix

• Componenta principala 1 este puternic corelata (pozitiv) cu indicatorul financiar-contabil AC (Active Circulante)

• A doua componenta principala este mai greu de interpretat, ea avand un coeficient de corelatie relativ mare (pozitiv) cu indicatorul CA (Cifra de afaceri), dar nu inregistreaza un coeficient de corelatie mic cu cealaltă componenta principala.

Page 11: Analiza Componentelor Principale

Analiza in firmelor producatoare de mobila

Factor Loadings (Rotated)

Factor 1 Factor 2CA 0,043 0,970

VT 0,961 0,096

VE 0,966 0,091

SAL 0,428 0,835

AI 0,721 0,358

AC 0,872 0,333

Expl. Var 3,32 1,89

Prp. Totl 0,55 0,31

Rotated Component Matrix • Componenta principală 1 poate fi interpretata in termenii indicatorul VT sau eventual VE (corelaţie pozitiva), dar cum matricea corelatiilor ne arată că aceştia sunt puternic corelati între ei, coeficientul de corelatie alor având valoarea de 0,997, putem aşa bine să renuntam la unul dintre ei, astfel renuntam la indicatorul VE deoarece el intra si în alcătuirea indicatorului VT.

• Componenta principală 2 este cum a fost interpretată şi mai devreme, tot în termenii indicatorului CA (corelaţie pozitivă), adică este un indicator sintetic reprezentând volumul tuturor încasărilor de pe urma rezultatelor obţinute în activitatea de exploatare a întreprinderii şi este unul dintre cei mai reprezentativi indicatori ai volumului de activitate al unei întreprinderi.

Page 12: Analiza Componentelor Principale

Analiza in firmelor producatoare de mobila Concluzii

Cele 25 de firme în planul indicatorilor CA şi VT se clasifica astfel:

• Clasa 1. Contine firmele F3, F4, F16, F22 care au scoruri bune pe ambele componente;

• Clasa 2. Contine firmele F5, F8, F13 care au scoruri bune la indicatorul Cifra de afaceri dar au o situatie mai proasta la indicatorul Venit total;

• Clasa 3. Contine firmele F9, F17, F21, F23, F25 care au scoruri mai slabe la indictorul Cifra de afaceri dar o situatie mai bună la indicatorul Venit total;

• Clasa 4. Contine firmele F1, F2, F6, F7, F10, F11, F12, F14, F15, F18, F19, F20, F24 care au scoruri slabe la ambii indicatori de sinteza, atat la Venit total cat si la Cirfa de afaceri.

Page 13: Analiza Componentelor Principale

Bibliografie

• Liliana SPIRCU – Analiza datelor. Aplicatii economice , Editura ASE, Bucuresti, 2005

• Ruxanda GHEORGHE – Analiza multidimensionala a datelor, Editura ASE, Bucuresti 2009

• Saporta G., Stefanescu V., Analiza datelor & informatica, Ed. Economica, Bucuresti, 1996