Analiza Datelor Proiect Final

download Analiza Datelor Proiect Final

of 25

Transcript of Analiza Datelor Proiect Final

  • 8/13/2019 Analiza Datelor Proiect Final

    1/25

    Metodele si tehnicile de analiza a datelor sunt cele mai adecvate instrumente utilizabile

    pentru identificarea unor structuri cauzale ce apar peste tot in jurul nostru, mai ales in mediul

    economic.Procesul de analiza a datelor apare ca fiind un proces specific de transformare

    informationala, proces care are ca intrari datele primare, iar ca iesiri informatii sintetizatoare.

    Conceptul cel mai important si cel mai frecvent intalnit in analiza datelor, care, de fapt, intrasi in alcatuirea numelui acestui tip de activitate stiintifica, este reprezentat de data. Datele reprezinta

    expresii cantitative si calitative ale unor fenomene si procese din realitatea inconjuratoare.

    Proiectul de fata isi propune sa analizeze anumiti indicatori financiari ai firmelor cotate peBursa de Valori Bucuresti, cu scopul de a defini indicatorii cei mai reprezentativi care ilustreaza

    performanta financiara a companiilor listate.

    Datele folosite pentru analiza au preluate de pe site-ului Bursei de Valori Bucuresti si de pe

    site-ul .!td.ro,pentru anul "##$ si privesc %& de companii listate pe bursa la una din cele "cate'orii. Variabilele (indicatorii financiari ai firmelor) luate in considerare au fost (pentru fiecare

    firma)*

    - Cifra de afaceri- +r. de salariati

    - Profit net- ndice de lichiditate

    - entabilitatea economica

    - ndicele P (Price arnin' atio)/- ndicele P0 (arnin' per 0hare)/

    Valorile initiale ale datelor folosite in analiza sunt prezentate in tabelul de mai jos*

    Indicator

    Cifra deafaceri (miiRON)

    Nr.salariati

    Profit net(mii RON) Lichiditate

    Rentabilitateeconomica (%)PER EPS (RON)

    Companii Simbol

    1Aerostar Bacau ARS 152697.74 1609 9503.72 2.34 0.0622 7.03 0.0811

    2Alro Slatina ALR 1968015.55 3908 247226.96 1.42 0.1256 3.64 0.3464

    3Amonil Slobozia AMO 216879.37 859 6927.94 1.11 0.0319 2.23 0.0062

    4Antibiotice asi A! 215805.95 1523 10572.76 1.82 0.049 15.49 0.0232

    5Azomures !". #ures A"O 1144100.22 2494 50540.75 3.35 0.0442 1.61 0.0961

    6Bermas Sucea$a !RM 23072.06 258 917.52 1.49 0.0398 7.94 0.0426

    7

    Casa %eBuco$ina Club %e#unte !CM 4689.44 76 650.19 1.71 0.1386 14.41 0.0039

    8

    C&!''

    !ranselectricaBucuresti EL 2924508.22 2188 41943.08 1.28 0.0143 19.22 0.5722

    9Comel( Bistrita CM# 125959.06 1096 2086.94 1.02 0.0166 53.29 0.0891

    10Compa S. A.Sibiu CMP 310818.16 1840 439.64 1.35 0.0014 47.28 0.002

    11Con%ma" SA COMI 145313.19 917 8890.13 2.02 0.0612 4.59 0.0514

    12Contor )roup SA C$C 44533.91 376 981.91 1.19 0.022 15.38 0.0063

    13*a(ora SA#e%ias A#R 269018.68 1112 2736.32 1.38 0.0102 13.91 0.0028

    1

    http://www.ktd.ro/http://www.ktd.ro/http://www.ktd.ro/
  • 8/13/2019 Analiza Datelor Proiect Final

    2/25

    14'ner"opetrolCampina ENP 23928.02 241 103.58 1.19 0.0043 31.28 0.0512

    15

    +lamin"onternationalBucuresti #LA 1057166.76 249 402.7 1.17 0.0004 58.04 0.0005

    16

    mpact *e$eloper

    , Contractor S.A. IMP 151688.18 160 8258.69 2.91 0.0544 0.76 0.0413

    17#ec-el!ar"o$iste COS 1107164.18 3513 106330.96 1.64 0.096 1.17 1.5444

    18#e(in Sinaia ME# 27405.43 611 165 2.26 0.006 36.57 0.0312

    19il !erminalConstanta OIL 134573.36 1273 1025.68 0.86 0.0076 90.86 0.0018

    20/etrom SNP 16750726.46 29861 1022387.5 1.48 0.061 10.03 0.018

    21/ro%plastBucuresti PPL 66132.79 279 5151.06 7.59 0.0779 24.25 0.1361

    22Santierul &a$alrso$a SNO 125966.96 778 15404.01 1.87 0.1223 2.94 1.3485

    23Sinteza ra%ea S" 12287.24 108 52.47 7.16 0.0043 327.58 0.0008

    24Siretul /ascani SR 14224.37 373 310.18 3.67 0.0218 15.56 0.002

    25S&!)&!A&S)A SA $N 1119389.99 4918 239007.09 1.72 0.2135 6.01 20.2998

    26Socep Constanta SOCP 58818.01 626 7613.71 10.79 0.1294 7.22 0.0222

    27!eraplast SA RP 194916.1 540 19322.14 2.12 0.0991 6.17 0.0649

    28!!A& S.A. MPN 294472.57 964 9794.49 0.63 0.0333 15.85 0.024

    29

    !ransil$aniaConstructii SAClu COR 58939.83 347 5532.68 2.16 0.0939 3.85 7.7978

    30!urism +eli S.A.Baile +eli E 55448.04 844 9639.95 1.08 0.1739 8.75 0.0194

    31

    !urism -otelurirestaurante#area &ea"ra E#O 39232.58 589 11811.75 8.07 0.3011 9.48 0.0612

    32C# esita &CM 146012.01 2298 1095.44 0.85 0.0075 19.36 0.0116

    33ae ApcaromBuzau APC 87390.13 243 2137.55 1.92 0.0245 15.19 0.029

    34rancart A%u% 'NC 115072.96 989 5743.1 1.32 0.0499 6.43 0.0083

    nainte de a fi utilizate in analiza, datele initiale au fost normalizate prin raportarea diferentei

    dintre fiecare variabila si media sa la varianta acesteia. Valorile normalizate care au fost preluate in020 sunt prezentate in tabelul de mai jos*

    +irma Cifraafaceri Nrsalariati Profitnet Lichiditate RentabeconPER EPS

    ARS 10.0863775 13.14867646 10.202239 34.720389 31.481985 15.825 8.91123

    ALR 9.455731048 12.69377274 8.8878534 35.111845 30.547941 15.8848 8.83906

    AMO 10.06408062 13.29707915 10.216481 35.243748 31.928381 15.9097 8.93161

    A! 10.06445353 13.1656933 10.196328 34.941647 31.676454 15.6756 8.92698

    A"O 9.741961521 12.97356128 9.9753429 34.290639 31.74717 15.9207 8.90715

    !RM 10.13140982 13.41599917 10.249713 35.08206 31.811994 15.8089 8.92171

    !CM 10.13779599 13.45201156 10.251191 34.988451 30.356418 15.6947 8.93223

    "

  • 8/13/2019 Analiza Datelor Proiect Final

    3/25

    EL 9.123442838 13.03410958 10.02288 35.171414 32.187674 15.6098 8.77763

    CM# 10.09566659 13.2501839 10.243247 35.282043 32.153789 15.0083 8.90906

    CMP 10.03144602 13.10296843 10.252355 35.141629 32.377724 15.1144 8.93275

    COMI 10.08894291 13.28560267 10.205632 34.856548 31.496717 15.8681 8.91931

    C$C 10.12395391 13.39265048 10.249357 35.209708 32.074233 15.6776 8.93158

    A#R 10.04596728 13.24701797 10.239656 35.128864 32.248077 15.7035 8.93253

    ENP 10.13111245 13.41936297 10.254213 35.209708 32.334999 15.3968 8.91937

    #LA 9.772162446 13.41778001 10.252559 35.218218 32.392456 14.9244 8.93316

    IMP 10.08672822 13.43539046 10.209123 34.477857 31.596898 15.9357 8.92206

    COS 9.754793204 12.77193149 9.6668756 35.018236 30.984024 15.9284 8.51315

    ME# 10.12990439 13.34615097 10.253873 34.754429 32.309954 15.3035 8.92481

    OIL 10.09267396 13.21516086 10.249115 35.350122 32.286382 14.345 8.93281

    SNP 4.320176233 7.558445952 4.6019461 35.086315 31.499664 15.772 8.9284

    PPL 10.1164504 13.4118439 10.226305 32.486541 31.250684 15.521 8.89627

    SNO 10.09566384 13.31310664 10.169616 34.920372 30.596558 15.8972 8.56644S" 10.13515649 13.44567971 10.254496 32.669503 32.334999 10.1656 8.93308

    SR 10.13448353 13.39324409 10.253071 34.154481 32.07718 15.6744 8.93275

    $N 9.750545924 12.49392378 8.9333016 34.984196 29.25295 15.843 3.41079

    SOCP 10.11899157 13.34318292 10.212689 31.124957 30.491957 15.8216 8.92726

    RP 10.07171072 13.36019976 10.147952 34.813998 30.938354 15.8402 8.91564

    MPN 10.03712453 13.27630277 10.200631 35.447986 31.907755 15.6693 8.92677

    COR 10.11894925 13.39838872 10.224195 34.796978 31.014963 15.8811 6.81193

    E 10.12016231 13.3000472 10.201486 35.256513 29.836359 15.7946 8.92802

    E#O 10.12579561 13.35050412 10.189478 32.282303 27.962379 15.7817 8.91665

    &CM 10.08870014 13.01234385 10.248729 35.354377 32.287855 15.6073 8.93014

    APC 10.10906554 13.41896723 10.242967 34.899097 32.037402 15.6809 8.92541

    'NC 10.09944845 13.27135602 10.223032 35.154394 31.663195 15.8356 8.93104

    Analiza corelatiilor dintre variabile (descrierea bidimensionala)

    %

  • 8/13/2019 Analiza Datelor Proiect Final

    4/25

    mpiric, am observat existenta anumitor le'aturi intre variabilele analizate, insa 'radulcorelatiei poate fi mai bine identificat prin calculul urmatorilor indicatori*

    - coeficientul de corelatie Pearson/- covarianta.

    Corelatia dintre variabile conduce la redundanta informationala, lucru care poate distorsionaanaliza, precum si concluziile acesteia. 3nul dintre obiectivele analizei multidimensionale a datelor

    este tocmai reducerea acestei redundante. n cazul corelarii variabilelor, reprezentarea 'eometrica a

    acestora nu este una orto'onala iar interpretarea distantelor dintre obiecte in acest spatiu estealterata.

    4utput-ul obtinut prin rularea pro'ramului in 020 este dupa cum urmeaza*

    !-e C /roce%ure

    Partial 'ariables* &rsalariati /' '/S

    + 'ariables* Ci(raa(aceri /ro(itnet entabecon ic-i%itate

    Sim,le Statistics

    'ariable N Mean Std e- Sm Minimm Ma/imm Partial'ariance

    PartialStd e-

    Label

    Nrsalariati 34 13.07096 1.00000 444.41264 13.45201 7.55845 &rsalariati

    PER 34 15.48001 1.00000 526.32025 15.93568 10.16564 /'

    EPS 34 8.67055 1.00000 294.79873 8.93316 3.41079 '/S

    Cifraafaceri 34 9.84121 1.00000 334.60103 10.13780 4.32018 0.03174 0.17815 Ci(raa(aceri

    Profitnet 34 9.95317 1.00000 338.40793 10.25450 4.60195 0.02863 0.16921 /ro(itnet

    Rentabecon 34 31.44546 1.00000 1069 32.39246 27.96238 0.84299 0.91814 entabecon

    Lichiditate 34 34.66558 1.00000 1179 35.44799 31.12496 1.00658 1.00328 ic-i%itate

    n tabloul 0imple 0tatistic, se calculeaza pentru fiecare din cele 5 variabile media,

    abaterea standard, valoarea minima si maxima, varianta partiala si abaterea standard partiala.0e remarca ca pentru toate variabilele valoare 06DV71, deoarece variabilele modelului au

    fost normalizate initial.

    &

  • 8/13/2019 Analiza Datelor Proiect Final

    5/25

    Pearson Partial Correlation Coefficients0 N 1 +Prob 2 3r3 nder 45* Partial Rho15

    Cifraafaceri Profitnet Rentabecon Lichiditate

    Cifra_afaceri_ 1.#####

    #."%$#&

    #.185"

    -#.1###%

    #.98"&

    #.##9"1

    #.855$

    Profit_net #."%$#&

    #.185"

    1.#####

    #.%:195

    #.#&95

    #.19:95

    #.#%

    Rentab_econ -#.1###%

    #.98"&

    #.%:195

    #.#&95

    1.#####

    #.9981&

    #.##11

    Lichiditate #.##9"1

    #.855$

    #.19:95

    #.#%

    #.9981&

    #.##11

    1.#####

    Din analiza matricea de corelatii Pearson din tabloul ;Pearson Partial Correlation

    Coefficients; observam ca variabilele sunt putin corelate intre ele, sin'ura corelatie mai

    puternica fiind intre entab

  • 8/13/2019 Analiza Datelor Proiect Final

    6/25

    :

  • 8/13/2019 Analiza Datelor Proiect Final

    7/25

    5

  • 8/13/2019 Analiza Datelor Proiect Final

    8/25

    Analiza componentelor principale

    2naliza componentelor principale este o tehnica de analiza multidimensionala ce urmareste

    descompunerea variabilitatii din spatiul cauzal initial intr-un numar mai redus de componente/

    aceste componente nu se suprapun informational si redau cu pierderi minime continutul factorilor

    considerati la inceput.Pentru acest proiect analiza componentelor principale trebuie sa sintetizeze distinctiile dintre

    firmele listate la bursa, existente la nivelul celor 5 factori studiati, printr-un numar mic de

    componente ce au avantajul necorelarii.Componentele principale sunt combinatii liniare ale variabilelor ori'inale extrase pe criteriul

    maximizarii variantei (varianta fiind o masura a cantitatii de informatie retinuta). 2ceasta

    modalitate de obtinere sprijina obiectivul optimalitatii* pierderea cu care se face transformareavariabilelor initiale sa fie minima.

    2m pornit de la un numar de %& de observatii pentru fiecare analizand cate 5 variabile.

    ezultatele obtinute in urma rularii analizei componentelor principale in 020 sunt urmatoarele*

    Re6ltate Anali6a Com,onentelor Princi,ale

    Obser-ations 34

    'ariables 7

    Media si varianta pentru fiecare dintre cele 5 variabile sunt redate in tabelul de mai jos*

    Sim,le Statistics

    Cifraafaceri Nrsalariati Profitnet Lichiditate Rentabecon PER EPS

    Mean 9.841206729 13.07096000 9.953174291 34.66557540 31.44545654 15.48000741 8.670550923

    St 1.000000000 1.00000000 1.000000000 1.00000000 1.00000000 1.00000000 1.000000000

    Matricea de covarianta este redata in tabelul de mai jos. 0e remarca ca varianta totala este

    e'ala cu numarul de variabile, respectiv 5.

    Co-ariance Matri/

    Cifraafaceri Nrsalariati Profitnet Lichiditate Rentabecon PER EPS

    Cifraafaceri 1.000000000 0.982417621 0.966643680 0.116063880 0.005245987 0.075948423 0.000776150

    Nrsalariati 0.982417621 0.999999999 0.983599602 0.126512001 0.044432509 0.095456419 0.077070303

    Profitnet 0.966643680 0.983599602 1.000000000 0.105090675 0.127585829 0.101241468 0.156207488

    Lichiditate 0.116063880 0.126512001 0.105090675 0.999999999 0.372595168 0.270928644 0.069740490

    $

  • 8/13/2019 Analiza Datelor Proiect Final

    9/25

    Co-ariance Matri/

    Cifraafaceri Nrsalariati Profitnet Lichiditate Rentabecon PER EPS

    Rentabecon 0.005245987 0.044432509 0.127585829 0.372595168 1.000000002 0.296137974 0.409586392

    PER 0.075948423 0.095456419 0.101241468 0.270928644 0.296137974 1.000000000 0.099927176

    EPS 0.000776150 0.077070303 0.156207488 0.069740490 0.409586392 0.099927176 1.000000000

    otal 'ariance 7.0000000007

    Componentele principale sunt ordonate in tabelul ;i'envalues of the Covariance Matrix? in

    ordine descrescatoare a informatiei retinute, procent din varianta totala.n tabelul ;i'envalues of the Covariance Matrix? coloana ;Proportion? releva procentul din

    informatia initiala a fiecarei variabile care se re'aseste sintetizata in componentele principaleextrase. Dupa cum putem observa, cele mai mari cantitati extrase sunt pentru Cifra din varianta totala, iar cea de-a patra

    explica 1".1> din varianta totala.

    0e observa ca primele % componente au valori proprii mai mari decat 1 (Coloana

    ei'envalue), acestea sunt retinute pentru analiza. le cumuleaza $%,91> din informatia totala.2dau'area unei noi componente ar mari acest procent la 89,:#>.

    Ei7en-ales of the Co-ariance Matri/

    Ei7en-ale ifference Pro,ortion Cmlati-e

    8 3.01094821 1.43669959 0.4301 0.4301

    9 1.57424862 0.31404618 0.2249 0.6550

    1.26020244 0.41331133 0.1800 0.8351

    + 0.84689111 0.56796502 0.1210 0.9560

    : 0.27892609 0.26094675 0.0398 0.9959

    ; 0.01797933 0.00717513 0.0026 0.9985

    < 0.01080421 0.0015 1.0000

    i'envectors reda coeficientii variabilelor ori'inale in ecuatiile liniare ale componentelor

    principale. n acelasi timp, ea su'ereaza natura componentelor prin evidentierea puternicei corelatii

    8

  • 8/13/2019 Analiza Datelor Proiect Final

    10/25

    cu anumite variabile iniale. 2stfel, componenta 1 se afla in le'atura cu Cifra

  • 8/13/2019 Analiza Datelor Proiect Final

    11/25

    Dupa al doilea punct de pe 'rafic ce simbolizeaza cea de-a doua componenta, panta sereduce si forma 'raficului se aplatizeaza.

    raficul de mai jos reprezinta 'raficul primelor " componente principale si poate fi utilizat

    pentru a determina anumite trenduri urmate de variabile. 0e remarca ca 0+P este in extrema dreapta

    a 'raficului inre'istrand valori ridicate pentru cifra de afaceri si profitul net, in timp de D2 seafla in extrema stan'a cu valori mult mai reduse pentru cifra de afaceri si profitul net. 2dmitand ca

    primele doua componente principale sunt dintr-o distributie normala, 'raficul su'ereaza ca punctele

    de extrem (0+P, 6+, 4) ar putea fi eliminate din analiza.

    11

  • 8/13/2019 Analiza Datelor Proiect Final

    12/25

    Analiza factoriala

    2naliza factoriala isi propune identificarea unor factori ascunsi, necuantificabili, care sa

    explice variabilele considerate initial.ntr-o prima varianta, toate variabilele explicative sunt supuse testului de identificare a

    factorilor comuni.

    he #ACOR Procedrenitial +actor #et-o%: /rincipal +actors

    Prior Commnalit= Estimates* SMC

    Cifraafaceri Profitnet Rentabecon Lichiditate Nrsalariati PER EPS

    0.97417168 0.97949979 0.55562171 0.37898420 0.98339848 0.28796072 0.41353694

    Ei7en-ales of the Redced Correlation Matri/* otal 1 +.:

  • 8/13/2019 Analiza Datelor Proiect Final

    13/25

    4 (actors ;ill be retaine% b< t-e #&')'& criterion.

    Din tabelul ;Prior Communalit stimates? se evidentiaza 0MC (0Euared MultipleCorrelation) pentru fiecare variabila.

    Din tabelul ;i'envalues of the educed Correlation Matrix? in care este explicata varianta

    totala ni se su'ereaza ca doar & factori vor fi retinuti de criteriul M++.

    eprezentarea 'rafica este redata mai jos*

    nitial +actor #et-o%: /rincipal +actors

    Scree Plot of Eigenvalues|

    3.0 + 1|||||

    2.5 +|||||

    2.0 +||

    E |i |g |e 1.5 +n |v |a |l |u | 2e 1.0 +

    s ||||| 3

    0.5 +||| 4||

    0.0 + 5 6||| 7||

    -0.5 +---------+---------+---------+---------+---------+---------+---------+---------+---------

    0 1 2 3 4 5 6 7

    Nu!er

    1%

  • 8/13/2019 Analiza Datelor Proiect Final

    14/25

    orma initiala a matricii factor este redata in tabelul ;actor Pattern?, iar varianta explicata

    de fiecare din factori este redata in tabelul ;Variance xplained b ach actor?. 6abelul ;inal

    Communalit stimates? exprima proportia variantei variabilelor retinute de factorii comuni.

    #actor Pattern

    #actor8 #actor9 #actor #actor+

    Cifraafaceri Cifraafaceri 0.97791 0.12563 0.08414 0.06941

    Profitnet Profitnet 0.99023 0.05942 0.03561 0.06637

    Rentabecon Rentabecon 0.08173 0.79116 0.07485 0.12148

    Lichiditate Lichiditate 0.13668 0.29927 0.59842 0.06439

    Nrsalariati Nrsalariati 0.99220 0.04956 0.04011 0.00168

    PER PER 0.12712 0.25272 0.44477 0.28780

    EPS EPS 0.11168 0.51312 0.22501 0.34209

    'ariance E/,lained b= Each #actor

    #actor8 #actor9 #actor #actor+

    2.9753215 1.0644344 0.6221209 0.2279856

    #inal Commnalit= Estimates* otal 1 +.>>?>;

    Cifraafaceri Profitnet Rentabecon Lichiditate Nrsalariati PER EPS

    0.98399855 0.98976186 0.65297735 0.47049895 0.98851977 0.36068147 0.44342455

    nitial +actor #et-o%: /rincipal Components/rior Communalit< 'stimates: &'

    1&

  • 8/13/2019 Analiza Datelor Proiect Final

    15/25

    Ei7en-ales of the Correlation Matri/* otal1 < A-era7e 1 8

    Ei7en-ale ifference Pro,ortion Cmlati-e

    8 3.01094821 1.43669959 0.4301 0.4301

    9 1.57424862 0.31404618 0.2249 0.6550

    1.26020244 0.41331133 0.1800 0.8351

    + 0.84689111 0.56796502 0.1210 0.9560

    : 0.27892609 0.26094675 0.0398 0.9959

    ; 0.01797933 0.00717513 0.0026 0.9985

    < 0.01080421 0.0015 1.0000

    2 (actors ;ill be retaine% b< t-e &+AC! criterion.

    Doar " factori vor fi retinuti de analiza factoriala.

    #actor Pattern

    #actor8 #actor9

    Cifraafaceri Cifraafaceri 0.97608 0.14057

    Profitnet Profitnet 0.99006 0.01414

    Rentabecon Rentabecon 0.10622 0.90892

    Lichiditate Lichiditate 0.18028 0.37277

    Nrsalariati Nrsalariati 0.98920 0.07600

    PER PER 0.18111 0.37948

    19

  • 8/13/2019 Analiza Datelor Proiect Final

    16/25

    #actor Pattern

    #actor8 #actor9

    EPS EPS 0.15133 0.66289

    'ariance E/,lained b= Each#actor

    #actor8 #actor9

    3.0109482 1.5742486

    #inal Commnalit= Estimates* otal 1 +.:>:8? CL A! 3 0.0003 .999 . . 218 3.1

    9< CL8 APC 3 0.0003 .999 . . 206 2.0

    9; CL5 MPN 4 0.0004 .998 . . 183 2.9

    9: ENP ME# 2 0.0005 .998 . . 168 .

    9+ CL9? #LA 3 0.0005 .997 . . 158 2.2

    9 SNO RP 2 0.0006 .997 . . 151 .

    99 CL9> IMP 4 0.0007 .996 . . 143 3.9

    98 CL9< &CM 4 0.0007 .995 . . 137 3.5

    95 !CM CL9 3 0.0008 .994 . . 133 1.4

    8? CL98 CL9: 6 0.0010 .994 . . 128 2.4

    8> A"O SR 2 0.0013 .992 . . 120 .

    8< CL9+ OIL 4 0.0016 .991 . . 113 4.2

    8; ALR COS 2 0.0022 .988 . . 103 .

    8: CL9; CL8? 10 0.0024 .986 . . 96.1 5.7

    8+ CL99 CL8> 6 0.0025 .984 . . 92.1 4.3

    8 CL95 E 4 0.0025 .981 . . 90.6 3.7

    89 CL8: EL 11 0.0044 .977 . . 83.8 6.8

    88 PPL SOCP 2 0.0055 .971 . . 77.6 .

    85 CL8+ CL89 17 0.0087 .963 . . 68.5 8.7

    ? CL8; CL8 6 0.0094 .953 . . 63.5 6.2

    "#

  • 8/13/2019 Analiza Datelor Proiect Final

    21/25

    Clster 4istor=

    NCL Clsters oined #RED SPRSD RSD ERSD CCC PS# PS9 ie

    > CL85 CL8< 21 0.0137 .939 . . 57.6 10.0

    < CL? COR 7 0.0162 .923 . . 54.1 5.2

    ; CL88 E#O 3 0.0251 .898 .714 12.7 49.4 4.6

    : CL> CL< 28 0.0520 .846 .667 10.3 39.9 19.0

    + CL; S" 4 0.1206 .725 .604 4.78 26.4 7.9

    CL: $N 29 0.1551 .570 .507 1.82 20.6 33.9

    9 CL CL+ 33 0.1697 .401 .355 1.04 21.4 12.2

    8 CL9 SNP 34 0.4007 .000 .000 0.00 . 21.4

    raficul urmator prezinta trei statistici pentru estimarea numarului de clustere. Varfurile

    'raficului CCC cu valori mai mari decat " sau % indica clustere bune. Valorile intre # si " indicaposibile clustere.

    4 alta metoda de stabilire a numarului de clustere este prin statistica pseudo . Valorile

    relativ mari indica un numar bun de clustere.

    "1

  • 8/13/2019 Analiza Datelor Proiect Final

    22/25

    Dendo'rama este 'raficul care evidentiaza structura clusterelor, componenta lor si etapele

    de a're'are in urma carora au fost obtinute. 2ceasta ne poate ajuta sa decidem asupra numaruluioptim de clase ce trebuie retinute in analiza, prin aparitia unor 'ap-uri.

    ""

  • 8/13/2019 Analiza Datelor Proiect Final

    23/25

    3n astfel de 'ap este evidentiat si in 'raficul urmator prin linia rosie* ea intersecteaza

    dendo'rama in : puncte, ceea ce ne su'ereaza formarea a sase clustere.

    "%

  • 8/13/2019 Analiza Datelor Proiect Final

    24/25

    "&

  • 8/13/2019 Analiza Datelor Proiect Final

    25/25

    irmele din cele : 'rupe sunt*

    rupa 1 * 0+P

    rupa " * 06I

    rupa % * 4, 04CP, PP=

    rupa & * 6+

    rupa 9 * C46, 63, 6P, 0+4, BCM, C40, 2=

    rupa : * 4=, =2, CMP, CM, 6=, M, +P, 3CM, 2PC, D2, CC,

    MP+, V+C, BM, 2M4, 06, 2I4, MP, 26B, C4M, 20