7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania
1/43
Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic
Analiza Datelor
Proiect Analiza datelor pentru piaaaeniilor de publicitate online din !om"nia
#aura$%dlina %oiseSpecializare& Cibernatic
'rupa& ()*+
7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania
2/43
Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic
1. IntroducereCa domeniu relati nou pe piaa rom"neasc, publicitatea online deine un
sector de interes tot mai mare pentru oamenii de afaceri locali- Conform unuistudiu(realizat la niel mondial, aloarea pietei internaionale a publicitii online arputea s depeasc ()) de miliarde de dolari p"n .n /)(0- Piaa de publicitate
online din !om"nia a atins 1*,2 milioane lei 3circa () milioane de euro4 .n primelease luni din /)((, .n cretere cu 15 fa de perioada similar a anului precedent-6eine, astfel, necesar s se cunoasc .n ce relaie se a7 anumii parametri ce inde actiitatea aeniilor de publicitate online cu radul de pro8tabilitate al acestora-
6atele alese spre studiere se refer la cei mai importani indicatori pentru oaenie de publicitate online din !om"nia- 6atele au fost culese de pe site$uridedicate precum 999-refres:-ro/, 999-i;ads-ro, site$urile aeniilor studiate isurse proprii-
/ Pro8t @ Pierderi
6iferena dintre
enitul total alaeniei ic:eltuielile totaleale acesteia din
anul /)()
Euro
>*
7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania
3/43
Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic
>1 >ec:ime
7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania
4/43
Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic
clienii medii.mprit la
numrul acestora
>()Buet mediu @
Clieni mici
Suma bueteloralocate pentru
clienii mici.mprit lanumrul acestora
Euro
7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania
5/43
Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic
2. Statistici descriptive
%edia este indicatorul de baz al tendinei de localizare i s$a calculat, .nacest caz, ca medie aritmetic a alorilor studiate- Spre eGemplu, se poate constataca media buetelor medii per client mare .n anul /)() a fost de aproape (*)())euro- Abaterea standard a unei mulimi de numere este rdcina medie ptrat amulimii abaterilor 8ecrui element de la media mulimii-
=n indicator se9ness poziti arat 3cazul primelor nou indicatori4 arat oalunire a distribuiei la dreapta, .n timp ce un astfel de indicator cu aloareneati indic o distribuie alunit la st"na-
Indicatorul urtosis cu aloare mai mare dec"t * 3cazurile >, >H4, arat caceasta are o form leptourtic, mai ascuit dec"t forma unei distibuii normale,a"nd mai multe alori concentrate .n urul mediei i cozi mai roase, ceea ce
.nseamn probabiliti ridicate pentru alorile eGtreme-
Jn cazul alorilor indicatorului urtosis mai mici de c"t *, ne confruntm cu odistribuie platicurtic, mai plat dec"t distribuia normal- Probabilitatea pentrualorile eGtreme este mai mic dec"t cea din distribuia normal i alorile sunt mairsp"ndite .n urul mediei-
7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania
6/43
Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic
7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania
7/43
Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic
K :istoram este o diaram care rezum distribuia datelor- Pornind de la o.mprtiere .n interale de clase, :istorama este o mulime de dreptun:iuri a"ndca baze interalele de clase i ariile proporionale cu numrul de obseraiiaparin"nd interalelor de clas- Astfel, .nlimea unui dreptun:i este calculat caraportul dintre numrul de obseraii din interalul de clas i lunimea
respectiului interal- AGa ertical a unei :istorame este astfel o scal dedensitate-
Jn cazul indicatorului >, maoritatea alorilor sunt concentrate .n interalulL)M 0N, .n timp ce pentru aloari .n interalul L(HM //N nu eGist .nreistrri- Pentruindicatorul >H, aproape 2)5 din .nreistrri au alori cuprinse .ntre ) i (/)-)))-
7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania
8/43
Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic
#imitele cutiei sunt trasate la alorile cuartilei ( Oi *- #inia roas dininteriorul cutiei reprezint mediana- #iniile de deasupra Oi dedesubt de cutieimarc:eaz limitele de la care alorile sunt considerate eGtreme- Aceste limite sunttrasate la (, interale inter;uatile de limitele cutiei 3cuartile4- Prin conen?ie,alorile care se a7 la distan? mai mare de * interale inter;uartile de cuartilele (Oi * sunt considerate aberante-
7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania
9/43
Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic
3. Matricea de corelaie i matricea de covarian
6at 8ind c unitile de msura ariaz, o standardizare a datelor a fostnecesar- Kperaia de standardizare a alorilor unei ariabile const .n substituireaalorilor 8ecrei operaii cu o nou aloare reprezent"nd raportul dintre aloareacentrat a respectiei operaii i abaterea standard a respectiei ariabile&
xti
S
=xti
C
St
=xtix i
St
unde x i reprezint media celei de$a i$a ariabile, iar St reprezint abaterea
standard a ariabilei xt -
%atricea de corelaie se prezint conform 8urii de mai os-
Cu c"t alorile sunt mai apropiate de (, respecti $(, cu at"t letura estemai puternic, semnul indic"nd sensul leturii 3direct sau iners4- Jn acest sens,se poate obsera cum cifra de afaceri 3>(4 depinde mai mult de numrul de clienimari 3>4, .n timp ce pro8tul@pierderile depind@e .n mare msur de buetul mediuper client mare-
=n fapt interesant .l reprezint letura iners dintre ec:imea aeniei 3>14i buetul mediu pe client mare acest lucru indic un comportament ce presupunec potenialii clieni care sunt dispui s inesteasc cel puin )-))) pe an pentruo campanie pltesc cu at"t mai puin cu c"t ec:imea aeniei este mai mare- Cu
alte cuinte, se prefer elementul de noutate .n faa eGperienei .n domeniu-
7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania
10/43
Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic
6in matricea de coarian se poate remarca letura iners, slab, .ntrepro8t@pierderi 3>/4 i numrul de clieni medii 3>04- Acest lucru are semni8caia cun numr mare de clieni medii face ca pro8tul s scad, .n timp ce un numr micde clieni medii face ca pro8tul s creasc- Acest lucru se .nt"mpl, totui, .ntr$omic msur, dat 8ind apropierea de aloarea )-
7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania
11/43
Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic
4. Analiza componentelor principale
Componentele principale sunt noi ariabile care sistematizeaz informaia dinariabilele iniiale, reduc"nd redundana informaional i dimensionalitatea dateloriniiale- Analiza componentelor principale presupune nu doar calculul noilor
ariabile, ci i interpretarea acestora i a modului .n care datele eGprimate prin noileariabile pot auta la clasi8carea aeniilor analizate-
In 8ura de mai os, .n prima coloan se sesc alorile proprii ce eGprimarianta eGplicat prin 8ecare nou component principal i corelaia dintre nouaariabil i ariabilele ec:i- A doua coloan reprezint diferena dintre /componente consecutie-
Jn cea de$a treia coloan este eGprimat procentul din ineria total a noruluide puncte reinut pe 8ecare aG- Jn a patra coloan este eGprimat procentulcumulati al componentelor anterioare-
Conform principiului lui aiser, alorile proprii mai mari dec"t ( sintetizeazdin punct de edere informaional toate cele () ariabile oriinale- Jn acest caz,
este orba de primele * componente principale-Prin intermediul primei componente principale se asiura conserarea a*+,(*5 din arianta total- >arianta celei de$a doua componente principale esteeala cu aloarea proprie i reine /),)5 din arianta total, iar cumulati cuprima componenta reine +,(H5din arianta total-
>ectorii proprii corespunztori alorilor proprii anterioare se sesc .n 8urade mai os-
7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania
12/43
Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic
Prin ra8cul de tip Scree Plot reprezentat mai sus, se poate obsera proporia.n care alorile proprii preiau informaia din ariabilele iniiale, at"t indiidual c"t icumulat- 'ra8cul din partea dreapta eGprima leatura dintre componenteleprincipale si arianta cumulata pe care acestea o consera-
Conform principiului lui aiser si criteriului pantei putem a8rma c primeletrei component sunt componentele principale si eGplica o parte din mulimea noruluide puncte-
7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania
13/43
Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic
Pentru a determina modul .n care aceste component cuanti8c ariaia dinariabilele iniiale, se a analiza 8ura de mai os care prezint relaiacomponentelor principale cu ariabilele iniiale-
Jn cadranele de pe diaonala principal sunt prezente :istorame pentru
8ecare component principal- Se remarc distribuia puternic asimetric la st"na,.n cazul componentei principale ( i distribuia similar cu cea normal a celei de$a
doua componente-
Jn cadranele care nu sunt pe diaonala principal sunt reprezentate datele
iniiale .n sistemele de coordonate 3(,/4, 3(,*,4, 3/,(4, 3/,*4, 3*,(4, 3*,/4, unde (, / ,*
reprezint cele * componente principale-
Grac 3.Component scores matriG
7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania
14/43
Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic
7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania
15/43
Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic
'radul de corelare al ariabilelor oriinale cu componentele principale estedat de 8ura de mai sus- Astfel >( este puternic corelat cu component principal (,>1 este puternic corelat componenta principal /, iar >/ i >1 sunt corelate .naceeai msur cu componenta principal *-
6in reprezentrile Component Pattern se poate concluziona c&
$ >( este puternic corelat cu componenta principal (M$ >1 este puternic corelat cu componenta principal /M$ >/ i >1 sunt corelate .n aceeai msur cu componenta principal *-
7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania
16/43
Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic
7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania
17/43
Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic
7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania
18/43
Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic
7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania
19/43
Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic
7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania
20/43
Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic
7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania
21/43
Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic
7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania
22/43
Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic
7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania
23/43
Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic
7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania
24/43
Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic
!. Analiza "luster
Analiza cluster se deosebete .n mod fundamental de procedurile de naturstatistic, cum ar 8 cele care au ca scop eri8carea semni8caiei, prin faptul c eanu se bazeaz i nu presupune .ndeplinirea aprioric a nici unei ipoteze speci8ce- Jn
consecin, prin esena sa, analiza cluster constituie un important i e8cientinstrument de analiz eGploratorie- Se poate spune c scopul eneral al analizelorde tip cluster este acela de creare a aa$numitelor taGonomii sau tipoloii-
Construcia tipoloiilor este bazat pe analiza asemnrilor i deosebiriloreGistente .ntre obiectele unei mulimi date-
Clusterul este o submulime format din obiecte care au proprietatea cradul de disimilaritate dintre oricare dou obiecte aparin"nd clusterului este maimic dec"t radul de disimilaritate dintre orice obiect care aparine clusterului iorice obiect care nu aparine clusterului respecti-
6at 8ind c unitile de msura ariaz, o standardizare a datelor a fostnecesar- Kperaia de standardizare a alorilor unei ariabile const .n substituireaalorilor 8ecrei operaii cu o nou aloare reprezent"nd raportul dintre aloareacentrat a respectiei operaii i abaterea standard a respectiei ariabile&
xti
S
=xti
C
St
=xtix i
St
unde x i reprezint media celei de$a i$a ariabile, iar St reprezint abaterea
standard a ariabilei xt -
Ca metode pentru analiza cluster se or folosi .n continuare metoda Qard imetoda Aerae-
!.1. Metoda #ard
%etoda lui Qard, cunoscut i sub numele de metoda minimei arianeintracluster, este una dintre cele mai cunoscute i mai e8ciente metode declasi8care ierar:ic prin areare- Jn irtutea acestei metode atribuirea unui obiect
la un cluster se face numai dac aceast atribuire minimizeaz ariana din cadrulclusterului- Pe post de criteriu eneral de afectare a obiectelor la clustere esteconsiderat minimizarea sumelor elementelor de pe diaonala matricii comune decoarian a clusterelor, adic minimizarea trasei matricii de coarian intraclase-
%etoda lui Qard este o metod de ealuare a distanei dintre dou clusterecare se bazeaz pe maGimizarea radului de omoenitate a clusterelor-
7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania
25/43
Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic
Conform primului ra8c din 8ura de mai sus se poate obsera c eGist unnumr mare de outliere .n baza de date, lucru eideniat de alorile preponderantneatie
Jn ultimul ra8c al 8urii de mai sus, obserm c aloarea maGim Pseudo D$
S;uared se obine pentru un numr de * clustere, fapt ce duce la concluzia caeniile studiate pot 8 .mprite .n / clase, lucru ce poate 8 aea semni8caia
ra8c a unei tieturi transersale care .nt"lneOte de dou ori ra8cul enerat-
Putem alee astfel clasa ( ca 8ind compus din aenii pro8tabile i clasa / ca 8ind
aenii .n dezoltare-
7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania
26/43
Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic
Conform de8niiei %etodei lui Qard, dendorama eGprimat .n 8urade mai sus arat felul .n care s$a realizat clusterizarea aeniilor studiate- Jn 8ecareetap a clusterizrii s$au comasat acele dou clustere pentru care suma ptratelorabaterilor la nielul clusterului rezultat din comasare este cea mai mic, .ncomparaie cu alte perec:i de clustere-
Jn cazul nostru, suma ptratelor abaterilor la nielul clusterului format
din clusterul %cCann P! i
7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania
27/43
Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic
Ferseta e$consultincabinet C#* *2 ( )%ediatic 6iital C#* *2 ( )C#* C#*1 * / ),)))())H1(Fred Knline C#*1 *2 ( )aleidoscope 6iital C#** *2 ( )
TK Communication C#/0 *2 ( )'olin arris P! C#/ *2 ( )
D:e Practice C#/ *2 ( )C#/2 C#/1 /2 * ),))(//*+)1C#*0 C#/1 *0 / ,(0*+E$)Aanta
7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania
28/43
Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic
C#/+ C#(( /+ / ),)))2*(2(+C#(1 C#(( (1 ),))HH(**B6! Associates 'roup C#() *2 ( )C#( C#() ( / ),))0H)02*C#(( C#+ (( 2 ),)(2)*/0)*C#// C#+ // / ),))*)()/
C#/) C#H /) ),))1/222((C#*1 C#H *1 * ),)))/(2/HC#+ C#2 + + ),)(HH2(0+1KilR P! C#2 *2 ( )C#2 C#0 2 () ),)*1+H/2(C#(0 C#0 (0 / ),))020/+*C#() C# () * ),)(21+2C#(* C# (* / ),))++/0/1C#(2 C#1 (2 * ),)))2/+C#0 C#1 0 (/ ),)1*+1(2*(C#H C#* H H ),)(+/)+)12C#(/ C#* (/ + ),)(/++(/+
C#* C#/ * (2 ),)H+H0())2C#1 C#/ 1 ( ),)0/(/12H0C#/ C#( / */ ),(0/0(*21(C# C#( ),)0(+0112C#( ( *2 ),*+(+1*1H/
!.2. Metoda
distanei medii /ntre clase
%etoda distanei medii dintre perec:ile de obiecte ealueaz distana dintre
dou clustere prin intermediul distanei medii dintre toate perec:ile posibile deobiecte care aparin celor dou clustere-
%etoda distanei medii dintre perec:i ealueaz distana dintre dou clustereca medie a distanelor dintre oricare dou obiecte care aparin celor dou clustere,unul primului cluster, iar cellalt din celui de$al doilea cluster-
Pentru ealuarea distanelor dintre obiectele celor dou clustere, poate 8utilizat oricare dintre metodele cunoscute de calcul al distanelor dintre obiecte-
7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania
29/43
Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic
Conform primului ra8c din 8ura de mai sus se poate obsera c eGist unnumr mare de outliere .n baza de date, lucru eideniat de alorile neatie
Jn ultimul ra8c al 8urii de mai sus, obserm c aloarea maGim Pseudo D$S;uared se obine pentru un numr de 0 clustere, fapt ce duce la concluzia caeniile studiate pot 8 .mprite .n clase-
7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania
30/43
Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic
Conform de8niiei %etodei distanei medii .ntre clase, dendorama eGprimat.n 8ura de mai sus arat felul .n care s$a realizat clusterizarea aeniilor studiate-%etoda distanei medii din perec:i ealueaz distana dintre dou clustere ca medie
a distanelor dintre oricare obiecte care aparin celor dou clustere, unul primuluicluster, cellalt celui de$al doilea cluster- Ealuarea distanei dintre dou clustere cuautorul metodei distanei medii .ntre perec:ile de obiecte se face pe baza datelordin matricea distanelor dintre obiectele din cele dou clustere, calcul"nd mediaacestor distane-
Jn cazul nostru, distana medie dintre %cCann P! i TK Communication-
c4 "lasa 3& KilR P!-d4 "lasa 4& B6! Associates 'roup, 6C Communication, 'raRlin !omania-e4 "lasa !& i#eo %aretin Interactie, %cCann P!,
7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania
31/43
Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic
DreeQors C#*( *2 ( )In8nit %edia Solutions C#*) *2 ( )Sil9eb C#*) *2 ( )6iital Star %aretin C#/+ *2 ( )Senior Interactie C#/+ *2 ( )C#*) C#/H *) / ),(1(1+*
C#*0 C#/H *0 / ),)1*((1H+Pua C#/2 *2 ( )!omnet C#/2 *2 ( )C#*( C#/0 *( * ),(*H//210C#/H C#/0 /H 1 ),(20)10(Rperactie C#/ *2 ( )>TK Communication C#/ *2 ( )'olin arris P! C#/1 *2 ( )
D:e Practice C#/1 *2 ( )Aanta
7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania
32/43
Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic
C#H C#0 H (H ),01)H1(2+*C#(/ C#0 (/ + ),**0(1H1i#eo %aretinInteractie C# *2 ( )C#+ C# + / ),+22+(00HC#0 C#1 0 /2 ),2*0(+21//
C#(H C#1 (H * ),*+(0/HH/C#2 C#* 2 * ),2/+22(2(C# C#* * ),+(+0*0+C#1 C#/ 1 *) ),+210*0021KilR P! C#/ *2 ( )C#/ C#( / *( (,(/010H(+HC#* C#( * 0 (,)*()H101(C#( ( *2 (,1+H((/10
!.3. Metoda #ardpentru componentele principale
Jn urma aplicrii metodei Qard pentru cele * componente principaledeterminate anterior, se obser, asemeni cazului studiului anterior, c eGist unnumr mare de outliere-
7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania
33/43
Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic
Uin"nd cont de faptul c numai 2(,H 5 din informaie este preluat de cele *componente principale i c .n aplicarea metodei Qard s$au luat .n considerare toicei () indicatori, se poate obsera c rezultatul este diferit fa de cel la care s$aauns anterior prin aplicarea aceleai metode-
Componena celor 1 clase const .n&
a4 "lasa 1& Aanta
7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania
34/43
Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic
!.4. Metoda
distanei medii /ntre clase pentru componentele principale
Jn urma aplicrii metodei distanei medii .ntre clase pentru cele *componente principale determinate anterior, se obser, asemeni cazului studiuluianterior, c eGist un numr mare de outliere-
7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania
35/43
Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic
Componena celor * clase const .n&
a0 "lasa 1& Aanta
7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania
36/43
Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic
nu mai au loc sc:imbri .n centrele rupurilor sau p.n c"nd este atinsnumrulmaGim de iteraii-
7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania
37/43
Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic
Cum Cubic Clusterin Criterion are o aloare neati, .neleem c nu aemde$a face cu clustere VbuneW-
. Analiza discriminant
Analiza discriminant se refer la posibilitatea interrii unui obiect nouintrodus .n analiz .ntr$una dintre clasele dea formate prin cunoaOterea alorilorcorespunztoare obiectelor pentru ariabile ini?iale-
Jn analiza aeniilor de publicitate se a introduce un nou obiect const"nd .n
aenia eadertisin cu datele de mai os*-
Analiza discriminant se poate realiza prin metoda clasi8catorului Fis:er care
se refer la calculul unor func?ii discriminante 3numrul lor depinde de numrul de
clase apriori stabilite4 care creeaz planuri de separa?ie .ntre clase- Astfel datele
nou introduse .n analiz or respecta rela?ia corespunztoare unei sinure clase, .n
care a 8 .ncadrat noul obiect- Jn cazul de fa? obiectele or 8 .mpr?ite .n dou
* Dopul celor mai pro8tabile aenii online din /)()&:ttp&@@refres:-ro@/)((@)+@topurile$aentiilor$din$romania$/)()$pr$interactie$publicitate@
http://refresh.ro/2011/09/topurile-agentiilor-din-romania-2010-pr-interactive-publicitate/http://refresh.ro/2011/09/topurile-agentiilor-din-romania-2010-pr-interactive-publicitate/http://refresh.ro/2011/09/topurile-agentiilor-din-romania-2010-pr-interactive-publicitate/http://refresh.ro/2011/09/topurile-agentiilor-din-romania-2010-pr-interactive-publicitate/7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania
38/43
Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic
clase 3ob?inute .n urma aplicrii aloritmului Qard, aenii pro8tabile i aenii .n
curs de dezoltare4- %etoda clasi8catorului Fis:er a consta .n calculul unei sinure
func?ii discriminante care a .mpr?i spa?iul datelor .n dou pr?i dintre care doar
una a 8 eri8cat de datele eGtrase pentru eadertisin- Aceast func?ie este de
forma
= =
=8
1
8
1
)(i i
iiixiCxD
, unde GiC este aloare centrat pentru ariabila >i, iar
ectorul 3X(, X/-- XH4 este ectorul propriu asociat celei mai mari alori proprii a
matricei Y9$(Yb-
7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania
39/43
Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic
Pentru a patra matrice din 8ura de mai os se calculeaz ectorul propriu
asociat celei mai mari alori proprii- Calcul"nd ectorii proprii asocia?i celei mai mari
alori proprii a acestei matrici, am ob?inut ectorul 3),)))))0/, ),)))))0H+,
),)))))+//, ),)))))(H2, ),)))))114- Acesta respect rela?ia c func?ia
discriminant calculat pentru ectorul centroid al datelor ini?iale este )- Cele douclase se or a7a de o parte Oi de alta a punctului )- >eri8c"nd rela?ia, obserm c
pentru ?rile din prima clas se ob?ine o aloarea poziti pentru func?ia
discriminant iar pentru cele din rupa a doua o aloare neati-
6atele eGtrase pentru aenia eadertisin ofer pentru func?ia discriminant un
scor poziti, ceea ce ne permite .ncadrarea acestei ?ri .n prima rup de aenii-
. Analiza %actorAnaliza factorilor este o te:nic statistic multiariat care are ca scop
eGtraerea unui numr mic de factori ascuni 3lateni4 responsabili de corelaiiledintre ariabilele oriinale-6ac aceste corelaii sunt semni8catie, se poatepresupune ca ar 8 cuzate de eGperiana unuia sau mai multor factori VascuniWcomuni tuturor ariabilelor-Analiza factorilor ne permite s con8rmm statistic unrezultat priind modul de rupare al ariabilelor oriinale->ariabilele care serupeaz .mpreun i, ca atare, pot 8 priite ca form"nd un rup omoen, or 8considerate asociate unui acelai factor-
Analiza factorial poate 8 priit ca o modalitate de a eGplica i interpretaleturile dintre anumite ariabile obserabile 3ariabile indicator4 .n termeni demrimi care nu pot 8 direct obserabile 3factori4- 6e eGemplu, rezultatele
.nreistrate la anumite teste de performan, care au natura obserabil i directmsurabil, pot 8 eGplicate i interpretate .n termenii unui factor abstract ineobserabil .n mod direct, care este nielul de intelien al celor testai-
Analiza factorial ne permite s con8rmm statistic un rezultat priind modulde rupare al ariabilelor oriinale-
7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania
40/43
Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic
Jn 8ura de mai sus se obser alorile proprii calculate .n analiza factorial,
precum i proporiile indiiduale i cumulatie ale ariabilitii eGplicate de factorii
comuni din ariabilitatea total- Se a alee un numr optim de / factori pe baza
criteriului lui aiser deoarece pentru aceste alori proprii este mai mare dec"t (4-
Jn 8ura de mai sus sunt eideniate alorile proprii i proporia .n care
acestea preiau informaia din ariabilele iniiale, at"t indiidual c"t i cumulat-
Se cunoate faptul c ariabilele indicator .nreistreaz suprapuneri
informaionale 3conform matricii de corelaie prezentate anterior4-
7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania
41/43
Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic
Jn cadrul 8urii de mai os remarcm c proporia ariabilitii eGplicare pe
baza factorilor comuni este de aproGimati H1-15-
Se poate considera c radul de pro8tabilitate al unei aenii depinde de
factori comuni precum numrul clienilor i radul de pro8tabilitate- Jn acest
moment, ne propunem ca prin analiza factorial s con8rmm interpretabilitatea
rezultatelor sub aceast form, precum i s a7m intensitile factorilor comuni
considerai i scorurile aeniilor studiate- K parte a matricei factor este redat mai
os-
Jn acest tabel obserm c o parte din rezultate nu corespund interpretrii
considerate pentru cei doi factori comuni- Este necesar .n acest momentefectuarea unei proceduri care s asiure acelai rad de acoperire a ariabilitii
totale, asociind factorilor intensiti neneatie-
!ezultate obinute eideniaz c noile alori calculate respect proporia
comunalitii prin reducerea importanei primului factor i creterea importanei
celui de al doilea .n aceeai msur-
%atricea ortoonal de rotaie este redat .n mai os prin aplicarea funciei
arccos arumentului de pe diaonala principal, putem concluziona c rotirea
optim s$a fcut sub un un:i de aproGimati /*Z-
7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania
42/43
Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic
Conform ra8cului !otated Factor Pattern 3prezentat anterior4 se obser c
primul factor comun are o intensitate mai mare .n cadrul ariabilelor indicator >,
>0, >2 , fc"nd posibil atribuirea acestui factor a semni8caiei de factor comun cu
priire la numrul clienilor, .n timp ce factorul doi eGplic .ntr$o mai mare msur
ariabilitatea testelor >/, >H i >(, ceea ce ne con8rm semni8caia de factor al
pro8tabilitii aeniilor-
6escompunerea ariabiltii se face .n analiza factorial .n componenta
numit comunalitate 3informaia comun tuturor ariabilelor care de8nesc spaiul
cauzal4, componenta unicitate 3informaia semni8cati de natur speci8c4 iariabilitatea residual- Comunalitatea se formeaz sub in7uena factorilor comuni
f( i f/ i poate 8 calculat ca suma ptratelor celor doi factori din tabelul !otated
factor pattern-
7/21/2019 Proiect - Analiza Datelor Pentru Piata Agentiilor de Publicitate Online Din Romania
43/43
Academia de Studii Economice BucuretiFacultatea de Cibernetic, Statistic i Informatic Economic
Scorurile factor pot 8 calculate pe baza coe8cienilor rezultai din output$ul
SAS din tabelul de mai os, .nmulind ectorial aceast matrice cu alorile
ariabilelor iniiale-
Top Related