Gruparea Datelor În Clase Şi Determinarea Frecvenţelor Caracteristice (1)

4
LUCRAREA - 03 Fiabilitate şi terotehnică 1 3. GRUPAREA DATELOR ÎN CLASE ŞI DETERMINAREA FRECVENŢELOR CARACTERISTICE 3.1. Noţiuni teoretice privind gruparea şirurilor de valori în clase Indicatorii statistici nu oferă în totalitate informaţii privind evaluarea de fiabilitate. Determinările bazate pe observaţii discrete, permit efectuarea unor asocieri, care nu alterează setul de valori s au interpretarea rezultatelor. Determinarea unei normalităţi a distribuţiei valorilor, este necesară pentru a putea fi interpretate seturi mai mari de date. În acest scop, datele sunt condensate ordonat, în aşa numite clase de valori. caracteristic acestor clase este tendinţa tuturor valorilor din interiorul unei clase, de a converge spre o valoare centrală din interiorul intervalului de clasă. Există situaţii specifice în determinările statistice de fiabilitate, când redistribuirea valorilor nu este în măsură să ofere rezultate concludente. De aceea tehnica de grupare în clase este de cele mai multe ori utilizată pentru evaluarea normalităţii distribuţiei valorilo r. Ordonarea şi gruparea datelor, se face prin distribuirea acestora în clase de valori, care cuprind toate rezultatele observaţiei sau măsurătorilor efectuate, ce se încadrează într -un interval de mărime impus. Numărul k de clase în care se grupează valorile supuse unei prelucrări statistice, se determină funcţie de mărimea N a eşantionului. Relaţia recomandată pentru determinarea numărului de clase este: ) N lg( 332 , 3 1 k (3.1) Pentru un număr redus de date (sub 25 de valori), gruparea în clase este puţin semnificativă, suplimentul de informaţie obţinut fiind neconcludent. Numărul de clase efectiv k e reprezintă partea întreagă a valorii k calculate. În MathCAD există relaţia: floor(k) prin care se extrage partea întreagă dintr -un număr real. În cazul în care setul de valori este relativ ridicat (>100), este recomandată pentru determinarea numărului de clase relaţia: 5 1 2 1 ) ) 1 N ( 75 , 0 ( 4 k (3.2) Shapiro-Wald, recomandă în cazul eşantioanelor statistice de volum mare, relaţia: 4 N k 2 (3.3) Valori orientative ale numărului de clase, determinat funcţie de dimensiunea N a eşantionului prelucrat, pentru date de volum distinct, se prezintă în tabelul 1. Alegerea uneia din cele trei valori recomandate pentru numărul claselor de grupare, se face funcţie de dimensiunea N a eşantionului. Uzual sunt agreate valorile k şi k 1 , valorile k 2 fiind mai rar utilizate în determinările de fiabilitate.

description

fiabilitate si terotehnica

Transcript of Gruparea Datelor În Clase Şi Determinarea Frecvenţelor Caracteristice (1)

Page 1: Gruparea Datelor În Clase Şi Determinarea Frecvenţelor Caracteristice (1)

LUCRAREA - 03Fiabilitate şi terotehnică

1

3. GRUPAREA DATELOR ÎN CLASE ŞI DETERMINAREAFRECVENŢELOR CARACTERISTICE

3.1. Noţiuni teoretice privind gruparea şirurilor de valori în clase

Indicatorii statistici nu oferă în totalitate informaţii privind evaluarea de fiabilitate. Determinărilebazate pe observaţii discrete, permit efectuarea unor asocieri, care nu alterează setul de valori sauinterpretarea rezultatelor. Determinarea unei normalităţi a distribuţiei valorilor, este necesară pentrua putea fi interpretate seturi mai mari de date. În acest scop, datele sunt condensate ordonat, în aşanumite clase de valori. caracteristic acestor clase este tendinţa tuturor valorilor din interiorul uneiclase, de a converge spre o valoare centrală din interiorul intervalului de clasă.

Există situaţii specifice în determinările statistice de fiabilitate, când redistribuirea valorilornu este în măsură să ofere rezultate concludente. De aceea tehnica de grupare în clase este de celemai multe ori utilizată pentru evaluarea normalităţii distribuţiei valorilor.

Ordonarea şi gruparea datelor, se face prin distribuirea acestora în clase de valori, carecuprind toate rezultatele observaţiei sau măsurătorilor efectuate, ce se încadrează într-un interval demărime impus.

Numărul k de clase în care se grupează valorile supuse unei prelucrări statistice, sedetermină funcţie de mărimea N a eşantionului. Relaţia recomandată pentru determinarea număruluide clase este:

)Nlg(332,31k (3.1)

Pentru un număr redus de date (sub 25 de valori), gruparea în clase este puţin semnificativă,suplimentul de informaţie obţinut fiind neconcludent.

Numărul de clase efectiv ke reprezintă partea întreagă a valorii k calculate.

În MathCAD există relaţia: floor(k) prin care se extrage partea întreagă dintr-un număr real.

În cazul în care setul de valori este relativ ridicat (>100), este recomandată pentrudeterminarea numărului de clase relaţia:

5

12

1 ))1N(75,0(4k (3.2)

Shapiro-Wald, recomandă în cazul eşantioanelor statistice de volum mare, relaţia:

4

Nk 2 (3.3)

Valori orientative ale numărului de clase, determinat funcţie de dimensiunea N a eşantionuluiprelucrat, pentru date de volum distinct, se prezintă în tabelul 1.

Alegerea uneia din cele trei valori recomandate pentru numărul claselor de grupare, se facefuncţie de dimensiunea N a eşantionului.

Uzual sunt agreate valorile k şi k1, valorile k2 fiind mai rar utilizate în determinările defiabilitate.

Page 2: Gruparea Datelor În Clase Şi Determinarea Frecvenţelor Caracteristice (1)

LUCRAREA - 03Fiabilitate şi terotehnică

2

Gruparea valorilor în clase de repartiţie necesită stabilirea unor intervale restrictive în caredatele din eşantion vor fi încadrate. Intervalele astfel determinate exprimă o tendinţă a valorilor de aconverge „local”, spre valoarea centrală a fiecărei clase.

Amplitudinea a (lungimea intervalului de clasă), ce caracterizează intervalul unei clase, sedetermină cu relaţia:

k

xxa minmax (3.4)

unde: xmax este valoarea cea mai mare din şirul de date; xmin - valoarea cea mai mică din şirul de date.Intervalul unei clase va fi deci mărginit de două valori: limita inferioară şi superioară, de forma:

all

;lljinf

jsup

1jsup

jinf

(3.5)

unde: j = 1 … k reprezintă ordinal clasei.Valoarea centrală j

cl a clasei de repartiţie de ordin j se determină cu relaţia:

2/all jinf

jc (3.6)

Se face specificarea că limita inferioară a primului interval este valoarea minimă din şir, iar limitasuperioară a ultimului interval este valoarea maximă din şirul ordonat de valori.Tendinţa privind modul de variaţie a unui fenomen analizat prin evaluări statistice este dată deindicatorul frecvenţă de repartiţie. Sunt două tipuri de frecvenţe care oferă informaţii distincteprivind comportarea şirului de date:

- frecvenţa de repartiţie a valorilor aleatorii;- frecvenţa cumulată de repartiţie a datelor.

Numărul nj de date conţinute într-o clasă, reprezintă frecvenţa de apariţie în clase a valorilor.

jj nf (3.7)

Pentru determinarea frecvenţei de repartiţie se va crea următorul algoritm:- se introduc noi variabile tip şir de forma:

u: = 1 .. k;j: = 1 .. k+1;

Valorile limită ale claselor vor fi date de relaţia:

a1jx:int minj

)x(int,hist:f

Cu această relaţie s-a determinat frecvenţa de apariţie în clase a datelor. Prin apelarea lareprezentarea grafică, se poate vizualiza modul de grupare a datelor în intervalele caracteristice.

Page 3: Gruparea Datelor În Clase Şi Determinarea Frecvenţelor Caracteristice (1)

LUCRAREA - 03Fiabilitate şi terotehnică

3

Raportul dintre numărul de date conţinut în clasă şi numărul total al datelor din eşantionreprezintă frecvenţa relativă. Se determină cu relaţia:

N

ff j

rj (3.8)

Frecvenţa cumulată reprezintă suma frecvenţelor absolute sau relative, a setului de date.

k

1irjcj ff (3.9)

Frecvenţa relativă, precum şi frecvenţa cumulată sunt întâlnite sub formă procentuală, exprimaremai aproape de domeniul statistic decât de cel al probabilităţilor.

Pentru determinarea frecvenţelor cumulate este necesară utilizarea declaraţiilor de şiranterioare, de iniţializare a şirului. Etapele de algoritm parcurse pentru obţinerea frecvenţelorcumulate sunt:

u1uu

11

fFcum:Fcum

;f:Fcum

Tabelul 3.1. Valori pentru numărul de clase,determinate funcţie de mărimea eşantionului

3.2. Cerinţele lucrării

1. Algoritmarea relaţiilor matematice propuse pentru efectuarea calculelor;2. Efectuarea grupării în clase pentru şirul de date, prelucrat de fiecare student în lucrarea anterioară;3. Determinarea frecvenţei relative procentual;4. Evaluarea diferenţelor înregistrate la calculul valorii k cu diferite relaţii date în lucrare şicompararea cu datele din tabelul 3.1;5. Trasarea graficelor de repartiţie pentru frecvenţele calculate;6. Completarea concluziilor rezultate din evaluarea statistică (din lucrarea precedentă), cu cele cedecurg în urma grupării în clase şi a tendinţei de variaţie, dată de frecvenţele calculate.

Mărimea eşantionuluiN<150

kN>150

k1

N>150(Shapiro-Wald)

k2

Nr. valori Nr. clase Nr. valori Nr. clase Nr. valori Nr. clase<23 5 - - <200 30

24-27 6 150 28 200 4048-76 7 200 31 250 50

77-150 8 250 34 300 60- 400 41 350 70- 500 45 450 90

Page 4: Gruparea Datelor În Clase Şi Determinarea Frecvenţelor Caracteristice (1)

LUCRAREA - 03Fiabilitate şi terotehnică

4

Comentarii ajutătoare© Pentru a crea un algoritm, este necesar ca relaţiile 3.5 şi 3.6 din lucrare să fie transpuse

astfel încât utilizând eficienţa indicelui de control a şirului de date, calculul valorilorsolicitate să se facă global.

© La trasarea grafică nu uitaţi să marcaţi ce reprezentaţi pe fiecare din axele de coordonate,cu unităţile de măsură aferente. Specific evaluărilor de statistică a frecvenţelor relative şicumulate sunt reprezentările de tip: „bar”, respectiv „step”.

În Anexa B.2, se prezintă o modalitate de rezolvare propusă a aplicaţiei în mediul MathCAD.

Anexa B. 2.Algoritmul MathCAD de rezolvare a aplicaţiei A. 2.2.

În cazul acestei aplicaţii, se pot utiliza funcţii predefinite ale mediului MathCAD, care vor scurtamult timpul de rezolvare a aplicaţiei.

Pasul Relaţia mathCAD Obs.Identificarea valoriiminime a şirului

xmin:vmin Cu x s-a notat şirul iniţial de date

Identificarea valoriimaxime a şirului xmax:vmax

Calculul numărului declase şi extragerea părţiiîntregi

nlog322.31floor:k

Instrucţiunea „floor” returnează valoarea întreagă a unuinumăr natural;În MathCAD, logaritmul zecimal este recunoscut cuinstrucţiunea „log”

Calculul amplitudineiintervalelor de clasă k

vv:d minmax

iniţiere variabilă tip şirpentru numărul de clase 1k1:q

k1:j

Constituie baza iteraţiei pentu gruparea celor n valori înk clase

Calculul limitelor şivalorii centrale pentrucele k clase

2

dinfl:lc

djv:supl

d1jv:infl

jj

minj

minj

Calculul grupării celor nvalori în clase

d1qinfl:int qq Iteraţia q permite identificarea şi a valorii primei clase,dar şi a clasei de ordin k

Identificarea grupăriicelor n valori în cele kclase de repartiţie

xint,hist:f Instrucţiunea hist are valoare de grupare în intervale aunui şir de valori

Calculul frecvenţeirelative n

f:fr

jj

Calculul frecvenţeicumulate

t1tt

11

ffcum:fcum.III

f:fcum.II

k2:t.I

Algoritmul este în 3 paşi:I. declararea unei noi variabile;II. declararea explicită a primei valori care în cazulfrecvenţei cumulate este identică cu frecvenţa absolutăIII. scrierea relaţiei care să cumuleze la valoareaprecedenta indicele curent de creştere

Calculul frecvenţeicumulate relative n

fcum:fcrel

jj

Reprezentări grafice şiafişare liste de valoricalculate

plotYXgraphinsert Se face referire la succesiunea alegerii opţiunilor dinbara de meniu