Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania

download Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania

of 43

Transcript of Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania

  • 7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania

    1/43

    Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic

    Analiza Datelor

    Proiect Analiza datelor pentru piaaaeniilor de publicitate online din !om"nia

    #aura$%dlina %oiseSpecializare& Cibernatic

    'rupa& ()*+

  • 7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania

    2/43

    Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic

    1. IntroducereCa domeniu relati nou pe piaa rom"neasc, publicitatea online deine un

    sector de interes tot mai mare pentru oamenii de afaceri locali- Conform unuistudiu(realizat la niel mondial, aloarea pietei internaionale a publicitii online arputea s depeasc ()) de miliarde de dolari p"n .n /)(0- Piaa de publicitate

    online din !om"nia a atins 1*,2 milioane lei 3circa () milioane de euro4 .n primelease luni din /)((, .n cretere cu 15 fa de perioada similar a anului precedent-6eine, astfel, necesar s se cunoasc .n ce relaie se a7 anumii parametri ce inde actiitatea aeniilor de publicitate online cu radul de pro8tabilitate al acestora-

    6atele alese spre studiere se refer la cei mai importani indicatori pentru oaenie de publicitate online din !om"nia- 6atele au fost culese de pe site$uridedicate precum 999-refres:-ro/, 999-i;ads-ro, site$urile aeniilor studiate isurse proprii-

    / Pro8t @ Pierderi

    6iferena dintre

    enitul total alaeniei ic:eltuielile totaleale acesteia din

    anul /)()

    Euro

    >*

  • 7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania

    3/43

    Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic

    >1 >ec:ime

  • 7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania

    4/43

    Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic

    clienii medii.mprit la

    numrul acestora

    >()Buet mediu @

    Clieni mici

    Suma bueteloralocate pentru

    clienii mici.mprit lanumrul acestora

    Euro

  • 7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania

    5/43

    Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic

    2. Statistici descriptive

    %edia este indicatorul de baz al tendinei de localizare i s$a calculat, .nacest caz, ca medie aritmetic a alorilor studiate- Spre eGemplu, se poate constataca media buetelor medii per client mare .n anul /)() a fost de aproape (*)())euro- Abaterea standard a unei mulimi de numere este rdcina medie ptrat amulimii abaterilor 8ecrui element de la media mulimii-

    =n indicator se9ness poziti arat 3cazul primelor nou indicatori4 arat oalunire a distribuiei la dreapta, .n timp ce un astfel de indicator cu aloareneati indic o distribuie alunit la st"na-

    Indicatorul urtosis cu aloare mai mare dec"t * 3cazurile >, >H4, arat caceasta are o form leptourtic, mai ascuit dec"t forma unei distibuii normale,a"nd mai multe alori concentrate .n urul mediei i cozi mai roase, ceea ce

    .nseamn probabiliti ridicate pentru alorile eGtreme-

    Jn cazul alorilor indicatorului urtosis mai mici de c"t *, ne confruntm cu odistribuie platicurtic, mai plat dec"t distribuia normal- Probabilitatea pentrualorile eGtreme este mai mic dec"t cea din distribuia normal i alorile sunt mairsp"ndite .n urul mediei-

  • 7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania

    6/43

    Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic

  • 7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania

    7/43

    Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic

    K :istoram este o diaram care rezum distribuia datelor- Pornind de la o.mprtiere .n interale de clase, :istorama este o mulime de dreptun:iuri a"ndca baze interalele de clase i ariile proporionale cu numrul de obseraiiaparin"nd interalelor de clas- Astfel, .nlimea unui dreptun:i este calculat caraportul dintre numrul de obseraii din interalul de clas i lunimea

    respectiului interal- AGa ertical a unei :istorame este astfel o scal dedensitate-

    Jn cazul indicatorului >, maoritatea alorilor sunt concentrate .n interalulL)M 0N, .n timp ce pentru aloari .n interalul L(HM //N nu eGist .nreistrri- Pentruindicatorul >H, aproape 2)5 din .nreistrri au alori cuprinse .ntre ) i (/)-)))-

  • 7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania

    8/43

    Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic

    #imitele cutiei sunt trasate la alorile cuartilei ( Oi *- #inia roas dininteriorul cutiei reprezint mediana- #iniile de deasupra Oi dedesubt de cutieimarc:eaz limitele de la care alorile sunt considerate eGtreme- Aceste limite sunttrasate la (, interale inter;uatile de limitele cutiei 3cuartile4- Prin conen?ie,alorile care se a7 la distan? mai mare de * interale inter;uartile de cuartilele (Oi * sunt considerate aberante-

  • 7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania

    9/43

    Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic

    3. Matricea de corelaie i matricea de covarian

    6at 8ind c unitile de msura ariaz, o standardizare a datelor a fostnecesar- Kperaia de standardizare a alorilor unei ariabile const .n substituireaalorilor 8ecrei operaii cu o nou aloare reprezent"nd raportul dintre aloareacentrat a respectiei operaii i abaterea standard a respectiei ariabile&

    xti

    S

    =xti

    C

    St

    =xtix i

    St

    unde x i reprezint media celei de$a i$a ariabile, iar St reprezint abaterea

    standard a ariabilei xt -

    %atricea de corelaie se prezint conform 8urii de mai os-

    Cu c"t alorile sunt mai apropiate de (, respecti $(, cu at"t letura estemai puternic, semnul indic"nd sensul leturii 3direct sau iners4- Jn acest sens,se poate obsera cum cifra de afaceri 3>(4 depinde mai mult de numrul de clienimari 3>4, .n timp ce pro8tul@pierderile depind@e .n mare msur de buetul mediuper client mare-

    =n fapt interesant .l reprezint letura iners dintre ec:imea aeniei 3>14i buetul mediu pe client mare acest lucru indic un comportament ce presupunec potenialii clieni care sunt dispui s inesteasc cel puin )-))) pe an pentruo campanie pltesc cu at"t mai puin cu c"t ec:imea aeniei este mai mare- Cu

    alte cuinte, se prefer elementul de noutate .n faa eGperienei .n domeniu-

  • 7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania

    10/43

    Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic

    6in matricea de coarian se poate remarca letura iners, slab, .ntrepro8t@pierderi 3>/4 i numrul de clieni medii 3>04- Acest lucru are semni8caia cun numr mare de clieni medii face ca pro8tul s scad, .n timp ce un numr micde clieni medii face ca pro8tul s creasc- Acest lucru se .nt"mpl, totui, .ntr$omic msur, dat 8ind apropierea de aloarea )-

  • 7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania

    11/43

    Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic

    4. Analiza componentelor principale

    Componentele principale sunt noi ariabile care sistematizeaz informaia dinariabilele iniiale, reduc"nd redundana informaional i dimensionalitatea dateloriniiale- Analiza componentelor principale presupune nu doar calculul noilor

    ariabile, ci i interpretarea acestora i a modului .n care datele eGprimate prin noileariabile pot auta la clasi8carea aeniilor analizate-

    In 8ura de mai os, .n prima coloan se sesc alorile proprii ce eGprimarianta eGplicat prin 8ecare nou component principal i corelaia dintre nouaariabil i ariabilele ec:i- A doua coloan reprezint diferena dintre /componente consecutie-

    Jn cea de$a treia coloan este eGprimat procentul din ineria total a noruluide puncte reinut pe 8ecare aG- Jn a patra coloan este eGprimat procentulcumulati al componentelor anterioare-

    Conform principiului lui aiser, alorile proprii mai mari dec"t ( sintetizeazdin punct de edere informaional toate cele () ariabile oriinale- Jn acest caz,

    este orba de primele * componente principale-Prin intermediul primei componente principale se asiura conserarea a*+,(*5 din arianta total- >arianta celei de$a doua componente principale esteeala cu aloarea proprie i reine /),)5 din arianta total, iar cumulati cuprima componenta reine +,(H5din arianta total-

    >ectorii proprii corespunztori alorilor proprii anterioare se sesc .n 8urade mai os-

  • 7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania

    12/43

    Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic

    Prin ra8cul de tip Scree Plot reprezentat mai sus, se poate obsera proporia.n care alorile proprii preiau informaia din ariabilele iniiale, at"t indiidual c"t icumulat- 'ra8cul din partea dreapta eGprima leatura dintre componenteleprincipale si arianta cumulata pe care acestea o consera-

    Conform principiului lui aiser si criteriului pantei putem a8rma c primeletrei component sunt componentele principale si eGplica o parte din mulimea noruluide puncte-

  • 7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania

    13/43

    Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic

    Pentru a determina modul .n care aceste component cuanti8c ariaia dinariabilele iniiale, se a analiza 8ura de mai os care prezint relaiacomponentelor principale cu ariabilele iniiale-

    Jn cadranele de pe diaonala principal sunt prezente :istorame pentru

    8ecare component principal- Se remarc distribuia puternic asimetric la st"na,.n cazul componentei principale ( i distribuia similar cu cea normal a celei de$a

    doua componente-

    Jn cadranele care nu sunt pe diaonala principal sunt reprezentate datele

    iniiale .n sistemele de coordonate 3(,/4, 3(,*,4, 3/,(4, 3/,*4, 3*,(4, 3*,/4, unde (, / ,*

    reprezint cele * componente principale-

    Grac 3.Component scores matriG

  • 7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania

    14/43

    Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic

  • 7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania

    15/43

    Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic

    'radul de corelare al ariabilelor oriinale cu componentele principale estedat de 8ura de mai sus- Astfel >( este puternic corelat cu component principal (,>1 este puternic corelat componenta principal /, iar >/ i >1 sunt corelate .naceeai msur cu componenta principal *-

    6in reprezentrile Component Pattern se poate concluziona c&

    $ >( este puternic corelat cu componenta principal (M$ >1 este puternic corelat cu componenta principal /M$ >/ i >1 sunt corelate .n aceeai msur cu componenta principal *-

  • 7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania

    16/43

    Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic

  • 7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania

    17/43

    Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic

  • 7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania

    18/43

    Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic

  • 7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania

    19/43

    Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic

  • 7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania

    20/43

    Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic

  • 7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania

    21/43

    Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic

  • 7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania

    22/43

    Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic

  • 7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania

    23/43

    Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic

  • 7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania

    24/43

    Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic

    !. Analiza "luster

    Analiza cluster se deosebete .n mod fundamental de procedurile de naturstatistic, cum ar 8 cele care au ca scop eri8carea semni8caiei, prin faptul c eanu se bazeaz i nu presupune .ndeplinirea aprioric a nici unei ipoteze speci8ce- Jn

    consecin, prin esena sa, analiza cluster constituie un important i e8cientinstrument de analiz eGploratorie- Se poate spune c scopul eneral al analizelorde tip cluster este acela de creare a aa$numitelor taGonomii sau tipoloii-

    Construcia tipoloiilor este bazat pe analiza asemnrilor i deosebiriloreGistente .ntre obiectele unei mulimi date-

    Clusterul este o submulime format din obiecte care au proprietatea cradul de disimilaritate dintre oricare dou obiecte aparin"nd clusterului este maimic dec"t radul de disimilaritate dintre orice obiect care aparine clusterului iorice obiect care nu aparine clusterului respecti-

    6at 8ind c unitile de msura ariaz, o standardizare a datelor a fostnecesar- Kperaia de standardizare a alorilor unei ariabile const .n substituireaalorilor 8ecrei operaii cu o nou aloare reprezent"nd raportul dintre aloareacentrat a respectiei operaii i abaterea standard a respectiei ariabile&

    xti

    S

    =xti

    C

    St

    =xtix i

    St

    unde x i reprezint media celei de$a i$a ariabile, iar St reprezint abaterea

    standard a ariabilei xt -

    Ca metode pentru analiza cluster se or folosi .n continuare metoda Qard imetoda Aerae-

    !.1. Metoda #ard

    %etoda lui Qard, cunoscut i sub numele de metoda minimei arianeintracluster, este una dintre cele mai cunoscute i mai e8ciente metode declasi8care ierar:ic prin areare- Jn irtutea acestei metode atribuirea unui obiect

    la un cluster se face numai dac aceast atribuire minimizeaz ariana din cadrulclusterului- Pe post de criteriu eneral de afectare a obiectelor la clustere esteconsiderat minimizarea sumelor elementelor de pe diaonala matricii comune decoarian a clusterelor, adic minimizarea trasei matricii de coarian intraclase-

    %etoda lui Qard este o metod de ealuare a distanei dintre dou clusterecare se bazeaz pe maGimizarea radului de omoenitate a clusterelor-

  • 7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania

    25/43

    Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic

    Conform primului ra8c din 8ura de mai sus se poate obsera c eGist unnumr mare de outliere .n baza de date, lucru eideniat de alorile preponderantneatie

    Jn ultimul ra8c al 8urii de mai sus, obserm c aloarea maGim Pseudo D$

    S;uared se obine pentru un numr de * clustere, fapt ce duce la concluzia caeniile studiate pot 8 .mprite .n / clase, lucru ce poate 8 aea semni8caia

    ra8c a unei tieturi transersale care .nt"lneOte de dou ori ra8cul enerat-

    Putem alee astfel clasa ( ca 8ind compus din aenii pro8tabile i clasa / ca 8ind

    aenii .n dezoltare-

  • 7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania

    26/43

    Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic

    Conform de8niiei %etodei lui Qard, dendorama eGprimat .n 8urade mai sus arat felul .n care s$a realizat clusterizarea aeniilor studiate- Jn 8ecareetap a clusterizrii s$au comasat acele dou clustere pentru care suma ptratelorabaterilor la nielul clusterului rezultat din comasare este cea mai mic, .ncomparaie cu alte perec:i de clustere-

    Jn cazul nostru, suma ptratelor abaterilor la nielul clusterului format

    din clusterul %cCann P! i

  • 7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania

    27/43

    Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic

    Ferseta e$consultincabinet C#* *2 ( )%ediatic 6iital C#* *2 ( )C#* C#*1 * / ),)))())H1(Fred Knline C#*1 *2 ( )aleidoscope 6iital C#** *2 ( )

    TK Communication C#/0 *2 ( )'olin arris P! C#/ *2 ( )

    D:e Practice C#/ *2 ( )C#/2 C#/1 /2 * ),))(//*+)1C#*0 C#/1 *0 / ,(0*+E$)Aanta

  • 7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania

    28/43

    Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic

    C#/+ C#(( /+ / ),)))2*(2(+C#(1 C#(( (1 ),))HH(**B6! Associates 'roup C#() *2 ( )C#( C#() ( / ),))0H)02*C#(( C#+ (( 2 ),)(2)*/0)*C#// C#+ // / ),))*)()/

    C#/) C#H /) ),))1/222((C#*1 C#H *1 * ),)))/(2/HC#+ C#2 + + ),)(HH2(0+1KilR P! C#2 *2 ( )C#2 C#0 2 () ),)*1+H/2(C#(0 C#0 (0 / ),))020/+*C#() C# () * ),)(21+2C#(* C# (* / ),))++/0/1C#(2 C#1 (2 * ),)))2/+C#0 C#1 0 (/ ),)1*+1(2*(C#H C#* H H ),)(+/)+)12C#(/ C#* (/ + ),)(/++(/+

    C#* C#/ * (2 ),)H+H0())2C#1 C#/ 1 ( ),)0/(/12H0C#/ C#( / */ ),(0/0(*21(C# C#( ),)0(+0112C#( ( *2 ),*+(+1*1H/

    !.2. Metoda

    distanei medii /ntre clase

    %etoda distanei medii dintre perec:ile de obiecte ealueaz distana dintre

    dou clustere prin intermediul distanei medii dintre toate perec:ile posibile deobiecte care aparin celor dou clustere-

    %etoda distanei medii dintre perec:i ealueaz distana dintre dou clustereca medie a distanelor dintre oricare dou obiecte care aparin celor dou clustere,unul primului cluster, iar cellalt din celui de$al doilea cluster-

    Pentru ealuarea distanelor dintre obiectele celor dou clustere, poate 8utilizat oricare dintre metodele cunoscute de calcul al distanelor dintre obiecte-

  • 7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania

    29/43

    Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic

    Conform primului ra8c din 8ura de mai sus se poate obsera c eGist unnumr mare de outliere .n baza de date, lucru eideniat de alorile neatie

    Jn ultimul ra8c al 8urii de mai sus, obserm c aloarea maGim Pseudo D$S;uared se obine pentru un numr de 0 clustere, fapt ce duce la concluzia caeniile studiate pot 8 .mprite .n clase-

  • 7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania

    30/43

    Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic

    Conform de8niiei %etodei distanei medii .ntre clase, dendorama eGprimat.n 8ura de mai sus arat felul .n care s$a realizat clusterizarea aeniilor studiate-%etoda distanei medii din perec:i ealueaz distana dintre dou clustere ca medie

    a distanelor dintre oricare obiecte care aparin celor dou clustere, unul primuluicluster, cellalt celui de$al doilea cluster- Ealuarea distanei dintre dou clustere cuautorul metodei distanei medii .ntre perec:ile de obiecte se face pe baza datelordin matricea distanelor dintre obiectele din cele dou clustere, calcul"nd mediaacestor distane-

    Jn cazul nostru, distana medie dintre %cCann P! i TK Communication-

    c4 "lasa 3& KilR P!-d4 "lasa 4& B6! Associates 'roup, 6C Communication, 'raRlin !omania-e4 "lasa !& i#eo %aretin Interactie, %cCann P!,

  • 7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania

    31/43

    Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic

    DreeQors C#*( *2 ( )In8nit %edia Solutions C#*) *2 ( )Sil9eb C#*) *2 ( )6iital Star %aretin C#/+ *2 ( )Senior Interactie C#/+ *2 ( )C#*) C#/H *) / ),(1(1+*

    C#*0 C#/H *0 / ),)1*((1H+Pua C#/2 *2 ( )!omnet C#/2 *2 ( )C#*( C#/0 *( * ),(*H//210C#/H C#/0 /H 1 ),(20)10(Rperactie C#/ *2 ( )>TK Communication C#/ *2 ( )'olin arris P! C#/1 *2 ( )

    D:e Practice C#/1 *2 ( )Aanta

  • 7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania

    32/43

    Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic

    C#H C#0 H (H ),01)H1(2+*C#(/ C#0 (/ + ),**0(1H1i#eo %aretinInteractie C# *2 ( )C#+ C# + / ),+22+(00HC#0 C#1 0 /2 ),2*0(+21//

    C#(H C#1 (H * ),*+(0/HH/C#2 C#* 2 * ),2/+22(2(C# C#* * ),+(+0*0+C#1 C#/ 1 *) ),+210*0021KilR P! C#/ *2 ( )C#/ C#( / *( (,(/010H(+HC#* C#( * 0 (,)*()H101(C#( ( *2 (,1+H((/10

    !.3. Metoda #ardpentru componentele principale

    Jn urma aplicrii metodei Qard pentru cele * componente principaledeterminate anterior, se obser, asemeni cazului studiului anterior, c eGist unnumr mare de outliere-

  • 7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania

    33/43

    Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic

    Uin"nd cont de faptul c numai 2(,H 5 din informaie este preluat de cele *componente principale i c .n aplicarea metodei Qard s$au luat .n considerare toicei () indicatori, se poate obsera c rezultatul este diferit fa de cel la care s$aauns anterior prin aplicarea aceleai metode-

    Componena celor 1 clase const .n&

    a4 "lasa 1& Aanta

  • 7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania

    34/43

    Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic

    !.4. Metoda

    distanei medii /ntre clase pentru componentele principale

    Jn urma aplicrii metodei distanei medii .ntre clase pentru cele *componente principale determinate anterior, se obser, asemeni cazului studiuluianterior, c eGist un numr mare de outliere-

  • 7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania

    35/43

    Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic

    Componena celor * clase const .n&

    a0 "lasa 1& Aanta

  • 7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania

    36/43

    Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic

    nu mai au loc sc:imbri .n centrele rupurilor sau p.n c"nd este atinsnumrulmaGim de iteraii-

  • 7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania

    37/43

    Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic

    Cum Cubic Clusterin Criterion are o aloare neati, .neleem c nu aemde$a face cu clustere VbuneW-

    . Analiza discriminant

    Analiza discriminant se refer la posibilitatea interrii unui obiect nouintrodus .n analiz .ntr$una dintre clasele dea formate prin cunoaOterea alorilorcorespunztoare obiectelor pentru ariabile ini?iale-

    Jn analiza aeniilor de publicitate se a introduce un nou obiect const"nd .n

    aenia eadertisin cu datele de mai os*-

    Analiza discriminant se poate realiza prin metoda clasi8catorului Fis:er care

    se refer la calculul unor func?ii discriminante 3numrul lor depinde de numrul de

    clase apriori stabilite4 care creeaz planuri de separa?ie .ntre clase- Astfel datele

    nou introduse .n analiz or respecta rela?ia corespunztoare unei sinure clase, .n

    care a 8 .ncadrat noul obiect- Jn cazul de fa? obiectele or 8 .mpr?ite .n dou

    * Dopul celor mai pro8tabile aenii online din /)()&:ttp&@@refres:-ro@/)((@)+@topurile$aentiilor$din$romania$/)()$pr$interactie$publicitate@

    http://refresh.ro/2011/09/topurile-agentiilor-din-romania-2010-pr-interactive-publicitate/http://refresh.ro/2011/09/topurile-agentiilor-din-romania-2010-pr-interactive-publicitate/http://refresh.ro/2011/09/topurile-agentiilor-din-romania-2010-pr-interactive-publicitate/http://refresh.ro/2011/09/topurile-agentiilor-din-romania-2010-pr-interactive-publicitate/
  • 7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania

    38/43

    Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic

    clase 3ob?inute .n urma aplicrii aloritmului Qard, aenii pro8tabile i aenii .n

    curs de dezoltare4- %etoda clasi8catorului Fis:er a consta .n calculul unei sinure

    func?ii discriminante care a .mpr?i spa?iul datelor .n dou pr?i dintre care doar

    una a 8 eri8cat de datele eGtrase pentru eadertisin- Aceast func?ie este de

    forma

    = =

    =8

    1

    8

    1

    )(i i

    iiixiCxD

    , unde GiC este aloare centrat pentru ariabila >i, iar

    ectorul 3X(, X/-- XH4 este ectorul propriu asociat celei mai mari alori proprii a

    matricei Y9$(Yb-

  • 7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania

    39/43

    Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic

    Pentru a patra matrice din 8ura de mai os se calculeaz ectorul propriu

    asociat celei mai mari alori proprii- Calcul"nd ectorii proprii asocia?i celei mai mari

    alori proprii a acestei matrici, am ob?inut ectorul 3),)))))0/, ),)))))0H+,

    ),)))))+//, ),)))))(H2, ),)))))114- Acesta respect rela?ia c func?ia

    discriminant calculat pentru ectorul centroid al datelor ini?iale este )- Cele douclase se or a7a de o parte Oi de alta a punctului )- >eri8c"nd rela?ia, obserm c

    pentru ?rile din prima clas se ob?ine o aloarea poziti pentru func?ia

    discriminant iar pentru cele din rupa a doua o aloare neati-

    6atele eGtrase pentru aenia eadertisin ofer pentru func?ia discriminant un

    scor poziti, ceea ce ne permite .ncadrarea acestei ?ri .n prima rup de aenii-

    . Analiza %actorAnaliza factorilor este o te:nic statistic multiariat care are ca scop

    eGtraerea unui numr mic de factori ascuni 3lateni4 responsabili de corelaiiledintre ariabilele oriinale-6ac aceste corelaii sunt semni8catie, se poatepresupune ca ar 8 cuzate de eGperiana unuia sau mai multor factori VascuniWcomuni tuturor ariabilelor-Analiza factorilor ne permite s con8rmm statistic unrezultat priind modul de rupare al ariabilelor oriinale->ariabilele care serupeaz .mpreun i, ca atare, pot 8 priite ca form"nd un rup omoen, or 8considerate asociate unui acelai factor-

    Analiza factorial poate 8 priit ca o modalitate de a eGplica i interpretaleturile dintre anumite ariabile obserabile 3ariabile indicator4 .n termeni demrimi care nu pot 8 direct obserabile 3factori4- 6e eGemplu, rezultatele

    .nreistrate la anumite teste de performan, care au natura obserabil i directmsurabil, pot 8 eGplicate i interpretate .n termenii unui factor abstract ineobserabil .n mod direct, care este nielul de intelien al celor testai-

    Analiza factorial ne permite s con8rmm statistic un rezultat priind modulde rupare al ariabilelor oriinale-

  • 7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania

    40/43

    Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic

    Jn 8ura de mai sus se obser alorile proprii calculate .n analiza factorial,

    precum i proporiile indiiduale i cumulatie ale ariabilitii eGplicate de factorii

    comuni din ariabilitatea total- Se a alee un numr optim de / factori pe baza

    criteriului lui aiser deoarece pentru aceste alori proprii este mai mare dec"t (4-

    Jn 8ura de mai sus sunt eideniate alorile proprii i proporia .n care

    acestea preiau informaia din ariabilele iniiale, at"t indiidual c"t i cumulat-

    Se cunoate faptul c ariabilele indicator .nreistreaz suprapuneri

    informaionale 3conform matricii de corelaie prezentate anterior4-

  • 7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania

    41/43

    Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic

    Jn cadrul 8urii de mai os remarcm c proporia ariabilitii eGplicare pe

    baza factorilor comuni este de aproGimati H1-15-

    Se poate considera c radul de pro8tabilitate al unei aenii depinde de

    factori comuni precum numrul clienilor i radul de pro8tabilitate- Jn acest

    moment, ne propunem ca prin analiza factorial s con8rmm interpretabilitatea

    rezultatelor sub aceast form, precum i s a7m intensitile factorilor comuni

    considerai i scorurile aeniilor studiate- K parte a matricei factor este redat mai

    os-

    Jn acest tabel obserm c o parte din rezultate nu corespund interpretrii

    considerate pentru cei doi factori comuni- Este necesar .n acest momentefectuarea unei proceduri care s asiure acelai rad de acoperire a ariabilitii

    totale, asociind factorilor intensiti neneatie-

    !ezultate obinute eideniaz c noile alori calculate respect proporia

    comunalitii prin reducerea importanei primului factor i creterea importanei

    celui de al doilea .n aceeai msur-

    %atricea ortoonal de rotaie este redat .n mai os prin aplicarea funciei

    arccos arumentului de pe diaonala principal, putem concluziona c rotirea

    optim s$a fcut sub un un:i de aproGimati /*Z-

  • 7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania

    42/43

    Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic

    Conform ra8cului !otated Factor Pattern 3prezentat anterior4 se obser c

    primul factor comun are o intensitate mai mare .n cadrul ariabilelor indicator >,

    >0, >2 , fc"nd posibil atribuirea acestui factor a semni8caiei de factor comun cu

    priire la numrul clienilor, .n timp ce factorul doi eGplic .ntr$o mai mare msur

    ariabilitatea testelor >/, >H i >(, ceea ce ne con8rm semni8caia de factor al

    pro8tabilitii aeniilor-

    6escompunerea ariabiltii se face .n analiza factorial .n componenta

    numit comunalitate 3informaia comun tuturor ariabilelor care de8nesc spaiul

    cauzal4, componenta unicitate 3informaia semni8cati de natur speci8c4 iariabilitatea residual- Comunalitatea se formeaz sub in7uena factorilor comuni

    f( i f/ i poate 8 calculat ca suma ptratelor celor doi factori din tabelul !otated

    factor pattern-

  • 7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania

    43/43

    Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic

    Scorurile factor pot 8 calculate pe baza coe8cienilor rezultai din output$ul

    SAS din tabelul de mai os, .nmulind ectorial aceast matrice cu alorile

    ariabilelor iniiale-