Analiza univariata

9
Cap. 19. ANALIZA UNIVARIATĂ A DATELOR ÎN CERCETĂRILE DE MARKETING În strategia unei cercetări de marketing, o atenţie deosebită trebuie acordată deciziei privitoare la modalitatea de analiză a datelor culese. Analiza reprezintă un proces complex şi sistematic de aplicare a tehnicilor statistico-matematice, în scopul extragerii din baza de date constituită a tuturor informaţiilor necesare procesului decizional. Metodologia de analiză a fenomenelor de marketing a cunoscut în ultimele trei decenii, pe plan internaţional, o adevărată revoluţie, paralel cu dezvoltarea tehnologiei de măsurare, culegere şi prelucrare a informaţiilor. Aceasta s-a datorat, în mare măsură şi progreselor înregistrate în folosirea pe scară tot mai largă a calculatoarelor electronice. Numeroasele metode de analiză care constituie bogatul arsenal metodologic pot fi grupate după criterii foarte diferite, cum sunt: tipul de scală utilizat (nominală, ordinală, interval sau proporţională); numărul eşantioanelor cercetate (unul, două sau mai mult de două); natura relaţiei dintre aceste eşantioane (independente sau dependente); numărul variabilelor considerate o dată (una, două sau mai mult de două). Printre obiectivele urmărite în procesul de analiză a datelor se înscriu, de obicei, următoarele: 511

description

Analiza univariata

Transcript of Analiza univariata

Page 1: Analiza univariata

Cap. 19. ANALIZA UNIVARIATĂ A DATELOR ÎN CERCETĂRILE DE MARKETING

În strategia unei cercetări de marketing, o atenţie deosebită trebuie acordată deciziei privitoare la modalitatea de analiză a datelor culese.

Analiza reprezintă un proces complex şi sistematic de aplicare a tehnicilor statistico-matematice, în scopul extragerii din baza de date constituită a tuturor informaţiilor necesare procesului decizional.

Metodologia de analiză a fenomenelor de marketing a cunoscut în ultimele trei decenii, pe plan internaţional, o adevărată revoluţie, paralel cu dezvoltarea tehnologiei de măsurare, culegere şi prelucrare a informaţiilor. Aceasta s-a datorat, în mare măsură şi progreselor înregistrate în folosirea pe scară tot mai largă a calculatoarelor electronice.

Numeroasele metode de analiză care constituie bogatul arsenal metodologic pot fi grupate după criterii foarte diferite, cum sunt:

tipul de scală utilizat (nominală, ordinală, interval sau proporţională); numărul eşantioanelor cercetate (unul, două sau mai mult de două); natura relaţiei dintre aceste eşantioane (independente sau dependente); numărul variabilelor considerate o dată (una, două sau mai mult de

două).

Printre obiectivele urmărite în procesul de analiză a datelor se înscriu, de obicei, următoarele:

determinarea tendinţei centrale a variabilelor considerate; caracterizarea variaţiei şi a repartiţiei acestora; măsurarea gradului de asociere dintre ele; realizarea unor estimări şi previziuni; evaluarea diferenţelor dintre variabile sau grupuri de variabile; evidenţierea legăturilor cauzale dintre ele.

19.1. Modalităţi de determinare a tendinţei centrale

Pentru determinarea tendinţei centrale a variabilelor considerate, punctul de plecare îl constituie considerarea tipului de scală utilizat pentru măsurarea acestora. După cum s-a evidenţiat într-un capitol anterior, tendinţa centrală se caracterizează diferit, funcţie de nivelul la care s-a realizat măsurarea (vezi tabelul nr.19.1.).

511

Page 2: Analiza univariata

Cercetări de marketing

Tabelul 19.1. Modul de caracterizare a tendinţei centrale funcţie de tipul de scală utilizat

Tipuri de scale

Indicatori ai tendinţei centraleGrupul modal

(valoarea modală)Mediana Media

aritmeticăMedia

geometricăNominală x - - -Ordinală x x - -Interval x x x -Proporţională x x x x

Dacă datele sunt negrupate, valoarea modală, primul indicator al tendinţei centrale, este cea care prezintă cea mai mare frecvenţă de apariţie. Să presupunem că într-o cercetare directă a preferinţelor populaţiei capitalei pentru turismul de sfârşit de săptămână, eşantionul investigat cuprinde 400 persoane care practică frecvent această formă de turism, distribuite după statutul socio-profesional astfel (vezi tabelul nr.19.2):

Tabelul 19.2. Repartizarea pe categorii socio-profesionale a persoanelor care practică frecvent turismul de sfârşit de săptămână

Categoria socio-profesională Număr de persoaneMuncitori 120Maiştri-tehnicieni 70Liber întreprinzători 30Funcţionari 30Cadre cu studii superioare 90Elevi-studenţi 120Casnice 10Pensionari 15Alte categorii 15

Se observă cu uşurinţă că valoarea modală este 120, ea corespunzând categoriei muncitori şi categoriei elevi-studenţi.

După cum se cunoaşte, în cazul distribuţiilor de frecvenţe specifice datelor grupate, grupul modal este constituit din grupul care cuprinde cele mai multe componente comparativ cu celelalte grupuri.

Să presupunem că acelaşi eşantion format din cele 400 persoane se distribuie, pe grupe de vârstă, după cum urmează (vezi tabelul nr.19.3.):

512

Page 3: Analiza univariata

Analiza univariată a datelor în cercetările de marketing

Tabelul 19.3. Repartizarea pe grupe de vârstă a persoanelor care practică frecvent turismul de sfârşit de săptămână

Grupe de vârstă (ani) Număr de persoanesub 14 1514-18 4519-24 11025-30 9031-40 8041-50 3051-60 20

61 şi peste 10

Rezultă clar că grupul modal este reprezentat de grupul care cuprinde persoanele în vârstă de 19-24 ani. Acest grup cuprinde 27,5 % din persoanele care practică frecvent turismul de sfârşit de săptămână. Valoarea modală se situează undeva în jurul vârstei de 22 ani.

Mediana, un alt indicator al tendinţei centrale, reprezintă după cum se cunoaşte valoarea deasupra şi dedesubtul căreia se situează câte o jumătate din observaţii.

Dacă datele sunt negrupate, dacă sunt aranjate în ordine, de la valoarea cea mai mică la valoarea cea mai mare, sau invers şi dacă numărul de observaţii este fără soţ, valoarea mediană se stabileşte fără nici o dificultate (vezi tabelul nr.19.4.):

Tabelul 19.4. Numărul de porţii dintr-un preparat culinar vândute într-o zi în şapte restaurante

Restaurantul Numărul de porţiiR1 60R2 70R3 110R4 120 MedianaR5 130R6 130R7 150

În situaţia în care există un număr de observaţii cu soţ, mediana se consideră în mod convenţional că este situată la jumătate, între cele două valori centrale.

Dacă datele sunt grupate, mediana se calculează astfel: numărul total de observaţii (frecvenţe) se împarte la 2 şi astfel rezultă câte observaţii trebuie să fie deasupra şi câte dedesubtul medianei; după aceasta se determină frecvenţele cumulate pentru a stabili în care grupă se situează mediana; în final, se calculează valoarea medianei.

513

Page 4: Analiza univariata

Cercetări de marketing

Considerând datele din tabelul cu repartiţia pe grupe de vârstă rezultă că valoarea medianei se situează undeva în grupa de vârstă de 25-30 ani. Pentru a ne situa la jumătatea numărului observaţiilor (200), se ponderează mărimea intervalului acestei grupe (5), cu numărul de observaţii adiţionale necesare (110/260) iar valoarea obţinută se adaugă la 25. Rezultă că mediana este situată la categoria de vârstă de 27 ani.

Aşa cum s-a arătat, datelor măsurate în scală metrică li se poate calcula tendinţa centrală şi sub forma mediei aritmetice (începând cu scala interval) sau chiar sub forma mediei geometrice (în cazul scalei proporţionale).

Media aritmetică, , a unei variabile x despre care se cunosc n observaţii într-un eşantion investigat, se calculează astfel:

n

xx

n

ii

1

Dacă vânzările a cinci puncte de desfacere situate pe plajă au fost într-o anumită zi de: 170; 220; 270; 320 şi respectiv 370 mil. lei, rezultă că media desfacerilor în ziua respectivă este:

Deseori, în calculul mediei aritmetice, apare necesitatea unei ponderări. Să presupunem că într-o cercetare a imaginii unui grup de 200 turişti,

amplasamentul unui camping a fost apreciat pe o diferenţială semantică cu 5 trepte, astfel:

foarte favorabil 70 45 35 30 20 foarte nefavorabil

Pentru o evaluare sintetică a acestor aprecieri se calculează o medie a lor, pornind de la nota 5 atribuită, pe scara respectivă, aprecierilor foarte favorabile, descrescând până la nota 1 pentru aprecierile foarte nefavorabile. Aprecierea medie se calculează astfel:

575,3200

120230335445570

x

Dacă datele sunt grupate, pentru calculul mediei aritmetice se foloseşte următoarea relaţie:

n

mfx

n

iii

1

unde: fi – reprezintă frecvenţa grupului i;mi – punctul de mijloc al intervalului unui grup;n – numărul total de observaţii cuprinse în eşantion.

514

Page 5: Analiza univariata

Analiza univariată a datelor în cercetările de marketing

În tabelul nr.19.5 se ilustrează, printr-un exemplu, modul de calcul al mediei aritmetice în acest caz.

Tabelul 19.5. Desfacerile zilnice ale unor cabane, situate pe trasee turistice montane (calculul mediei aritmetice)

Desfaceri(mil. lei)

Număr de unităţi (fi)

Mijlocul intervalului(mi)

fi mi

15-20 7 17,5 122,520-25 12 22,5 270,025-30 15 27,5 412,530-35 11 32,5 357,535-40 5 37,5 187,5

TOTAL 50 1350,0

leimilx .2750

1350

Atunci când pentru măsurare s-a folosit o scală proporţională, pentru caracterizarea tendinţei centrale, se poate calcula chiar şi media geometrică (aceasta este totuşi destul de rar utilizată în cercetările de marketing). Formula de calcul este următoarea:

nn

iiG xx

1

sau în forma logaritmică

n

xx

n

ii

G

1

loglog

19.2. Modalităţi de caracterizare a variaţiei şi repartiţiei variabilelor

Caracterizarea variaţiei, un alt obiectiv obişnuit al analizei datelor culese prin cercetările de marketing, se poate face în mod diferenţiat, în funcţie de nivelul de măsurare realizat printr-un tip de scală sau altul (vezi tabelul nr.19.6.)

Foarte adesea, datele, indiferent de tipul de scală utilizat, sunt caracterizate prin prezentarea distribuţiei de frecvenţe atât în formă tabelară (frecvenţele se pot prezenta în valori absolute, simple sau cumulate, sau prin folosirea procentelor1), cât şi în formă grafică (poligoane de frecvenţe, histograme, ogive etc.).

1 Pentru calculul procentelor cumulate sunt necesare date cel puţin de natură ordinală.

515

Page 6: Analiza univariata

Cercetări de marketing

Tabelul 19.6. Caracterizarea variaţiei funcţie de nivelul de măsurare realizat

Indicatori ai Tipuri de scalevariaţiei Nominale Ordinale Interval Proporţionale

Distribuţia de frecvenţe x x x xProcente x x x xDecile - x x xCentile - x x xCuartile - x x xAmplitudinea variaţiei - - x xAbaterea medie - - x xVarianţa - - x xAbaterea standard - - x x

Mai rar, în procesul analizei datelor se calculează şi cuartilele, decilele sau centilele. Cuartilele reprezintă două valori stabilite astfel ca o pătrime din observaţii să se afle sub prima cuartilă, denumită şi cuartilă inferioară şi o pătrime din observaţii să se afle deasupra celei de-a doua cuartile, denumită şi cuartilă superioară. Celelalte două pătrimi din observaţii se află între valorile celor două cuartile şi mediană. În mod similar, numărul de observaţii se poate împărţi la 10 sau 100 cu ajutorul decilelor şi respectiv centilelor.

Destul de frecvent, în caracterizarea datelor se foloseşte amplitudinea variaţiei, care se poate calcula în formă absolută (diferenţa dintre observaţia cu valoarea cea mai mare şi cea cu valoarea cea mai mică) sau în formă relativă (raportul dintre amplitudinea absolută şi medie).

De câte ori nivelul de măsurare conduce la date de natură metrică, pentru caracterizarea variaţiei acestora se pot folosi, alături de amplitudinea variaţiei şi trei indicatori ai variaţiei, respectiv, abaterea medie (media aritmetică a valorilor absolute ale abaterilor termenilor eşantionului de la media lor), varianţa (media aritmetică a pătratelor abaterilor individuale ale termenilor eşantionului de la medie) precum şi abaterea standard (radical cu semnul plus din varianţă).

Pentru caracterizarea variaţiei şi a repartiţiei unei singure variabile, deosebit de utile sunt şi metodele bazate pe cunoscutele tipuri de repartiţii normale, Poisson, binomiale etc., precum şi cele care presupun abordarea bayesiană aplicată unei singure variabile.

516