129565689 52409259 Intoxicatia Cu Plante Ce Contin Glicozizi Digitalici
Contin Gencia
-
Upload
javier-munoz -
Category
Documents
-
view
21 -
download
0
Transcript of Contin Gencia
-
147
GestinAeronutica:EstadsticaTericaFacultadCienciasEconmicasyEmpresarialesDepartamentodeEconomaAplicadaProfesor:SantiagodelaFuenteFernndez
PRINCIPALESAPLICACIONESDELACHICUADRADOAl analizar en una poblacin un carcter cualitativo o cuantitativo el estudio resultamuy tedioso por el gran nmero de elementos del que consta la poblacin.
Generalmente, se examina una muestra tomada de la poblacin, lo que lleva a tener unaserie de datos, y ver hasta qu punto la muestra se pude considerar perteneciente auna distribucin terica conocida.
Siempre existirn desviaciones entre la distribucin emprica u observada y ladistribucin terica. Se plantea la cuestin de saber si estas desviaciones son debidasal azar o al haber tomado una distribucin terica inadecuada.
CONTRASTEDEBONDADDELAJUSTEEl objetivo del contraste de bondad del ajuste es saber si una muestra procede de unapoblacin terica con determinada distribucin de probabilidad.
Sea una poblacin, donde se analiza un carcter X con 1 2 k(x , x , , x ) modalidadesexcluyentes, denotando por in es el nmero de elementos que presenta la modalidad ix
(frecuencia observada de ix ), k
ii 1
n n
Por otra parte, sea i ie n . p la frecuencia esperada o terica de cada modalidad ix
Se origina la TABLADECONTINGENCIA:
X 1x 2x ix kxFrecuencia observada 1n 2n in knFrecuencia esperada 1(e ) 2(e ) i(e ) k(e )
Se plantea la hiptesis nula 0La distribucin terica representa a H :la distribucin emprica u observada
Para un nivel de significacin (o riesgo) :
Se acepta 0H : 2k
i i 2, (k 1)
ii 1
(n e )e
estadsticoobservado estadstico
terico
Se rechaza 0H : 2k
i i 2, (k 1)
ii 1
(n e )e
estadsticoobservado estadstico
terico
-
148
El estadstico 2 2k k
i i i
i ii 1 i 1
(n e ) nn
e e
(tilenelclculo)OBSERVACIONESDELAAPLICACIN
a) El test de la 2 se puede aplicar en situaciones donde se desea decidir si una seriede datos (observaciones) se ajusta o no a una funcin terica previamentedeterminada (Binomial, Poisson, Normal, etc.)
b) Es necesario que las frecuencias esperadas de las distintas modalidades no seainferior a cinco. Si alguna modalidad tiene una frecuencia esperada menor que cincose agrupan dos o ms modalidades contiguas en una sola hasta conseguir que lafrecuencia esperada sea mayor que cinco.
c) Los grados de libertad de la 2 dependen del nmero de parmetros que senecesitan hallar para obtener las frecuencias esperadas. En este sentido, si serequieren hallar p parmetros, los grados de libertad son (k p) si las modalidadesson independientes y (k p 1) cuando las modalidades son excluyentes.
TABLASCONTIGENCIA:CONTRASTEDEDEPENDENCIAOINDEPENDENCIA
Cuando se desea comparar dos caracteres (X, Y) en una misma poblacin que admitenlas modalidades: 1 2 i k 1 2 j mX(x , x , , x , , x ) Y(y , y , , y , , y ) , se toma una muestrade tamao n, representando por ijn el nmero de elementos de la poblacin que
presentan la modalidad ix de X e jy de Y.
Y X 1
y 2y jy mym
ij 1
n
1x 11n 12n 1jn 1mn 1n 2x 21n 22n 2jn 2mn 2n
ix i1n i2n ijn imn in
kx k1n k2n kjn kmn kn k
ji 1
n 1n 2n jn mn n
Se plantea la hiptesis nula 0No existe diferencia entre las H :distribuciones empricas de X e Y
-
149
Bajo la hiptesis nula, cada frecuencia observada ijn (i 1, , k ; j 1, , m) de latabla de contingencia x(k m) hay una frecuencia esperada ij( e ) que se obtienemediante la expresin:
i jij ijxn n
e p . nn
, donde i jij xn n
pn n
Agrupando frecuencias observadas y esperadas en la tabla de contingencia x(k m) :
Y X 1
y 2y jy mym
ij 1
n
1x11n
11( e )12n
12( e ) 1j
n
1j( e ) 1m
n
1m( e )1n
2x21n
21( e )22n
22( e ) 2j
n
2j( e ) 2m
n
2m( e )2n
ixi1n
i1( e )i2n
i2( e ) ij
n
ij( e ) im
n
im( e )in
kxk1n
k1( e )k2n
k2( e ) kj
n
kj( e ) km
n
k m( e )kn
k
ji 1
n 1n 2n jn mn n
El estadstico de contraste observado: 2k m
ij ij 2(k 1) . (m 1)
iji 1 j 1
(n e )e
que sigueaproximadamente una chi-cuadrado con x(k 1) (m 1) grados de libertad si es ciertala hiptesis nula 0H con ije 5 , en caso contrario es necesario agrupar filas o columnascontiguas.
Para un nivel de significacin se puede contrastar la diferencia significativa entrelas dos distribuciones empricas o la independencia de las distribuciones empricas.
-
150
CONTRASTEDEHOMOGENEIDAD
Se acepta oH si : 2k m
ij ij 2, (k 1) . (m 1)
iji 1 j 1
(n e )e
estadstico observado
estadstico terico
Se rechaza oH si : 2k m
ij ij 2, (k 1) . (m 1)
iji 1 j 1
(n e )e
estadstico observado
estadstico terico
CONTRASTEDEINDEPENDENCIA
Hiptesis nula 0H : Las distribuciones empricas X e Y son independientes
Se acepta oH si : 2k m
ij ij 2, (k 1) . (m 1)
iji 1 j 1
(n e )e
estadstico observado
estadstico terico
Se rechaza oH si : 2k m
ij ij 2, (k 1) . (m 1)
iji 1 j 1
(n e )e
estadstico observado
estadstico terico
TABLASCONTIGENCIA2x2y2x3
Para las tablas de contingencia 2x2 y 2x3 se obtienen frmulas sencillas de la 2utilizando nicamente las frecuencias observadas
Y X 1
y 2y
1x 11n 12n 1n
2x 21n 22n 2n
1n 2n n
211 22 12 212
11 2 1 2
n (n . n n . n )n . n . n . n
Se acepta 0H : 2 21 ,1 Se rechaza 0H : 2 21 ,1
Y X 1
y 2y 3y
1x 11n 12n 13n 1n
2x 21n 22n 23n 2n
1n 2n 3n n
-
151
2 2 2 2 2 211 12 13 21 22 232
21 1 2 3 2 1 2 3
n n n n n nn n nn n n n n n n n
Se acepta 0H : 2 22 ,2 Se rechaza 0H : 2 22 ,2
COEFICIENTEDECONTINGENCIA
Es una medida del grado de relacin o dependencia entre dos caracteres en la tabla decontingencia, se define:
2
2C n
Mayor valor de C indica un grado de dependencia mayor entre X e Y
-
152
CONTRASTENOPARAMTRICODEBONDADDEAJUSTE
1.- Para comprobar si los operarios encontraban dificultades con una prensa manual deimprimir, se hizo una prueba a cuatro operarios anotando el nmero de atascos sufridosal introducir el mismo nmero de hojas, dando lugar a la siguiente tabla:
Operario A B C D TotalObstrucciones 6 7 9 18 40
Con un nivel de significacin del 5%, existe diferencia entre los operarios?
Solucin:
Estableciendo la hiptesis nula :H0 'no existe diferencia entre los operarios'
La probabilidad de que se atascase una hoja sera 4/1 para todos los operarios.De este modo, el nmero de atascos esperados para cada uno de ellos sera
i i 1, , 4(e 10) .
Tenemos, la tabla de contingencia 1 x 4:
Operario A B C D Total
Obstrucciones 6(10)7
(10)9
(10)18
(10)40
(40)
Se acepta la hiptesis nula, a un nivel de significacin si
tericooestadstic2
1k;
k
1i i
2i
contrasteoestadstic
k
1i i
2ii2
1k nen
e)en(
ervalosintnmerok
o bien, la regin de rechazo de la hiptesis nula: 2k
i i 2; k 1
ii 1
(n e )R
e
con lo cual,
24 2 2 2 2i2
3ii 1
n 6 7 9 18n 40 9e 10 10 10 10
Con el nivel de significacin ( 05,0 ), el estadstico terico: 815,72 3;05,0 siendo 2 3;05,0
23 815,79 se verifica la regin de rechazo.
En consecuencia, se rechaza la hiptesis nula, concluyendo que existe diferenciasignificativa entre los operarios respecto al nmero de atascos en la prensa deimprimir.
-
153
CONTRASTENOPARAMTRICODEBONDADDEAJUSTEAUNAPOISSONCONPARMETRODESCONOCIDO.
2.- En un laboratorio se observ el nmero de partculas que llegan a unadeterminada zona procedentes de una sustancia radiactiva en un corto espacio detiempo siempre igual, obtenindose los siguientes resultados:
Nmero partculas 0 1 2 3 4 5Nmero perodos de tiempo 120 200 140 20 10 2
Se pueden ajustar los datos obtenidos a una distribucin de Poisson, con un nivel designificacin del 5%?
Solucin:
Se establece la hiptesis nula 'PoissonlaaajustaseempricandistribuciLa':H0
La hiptesis nula se acepta, a un nivel de significacin si2 2k k
i i i2 2k p 1 ; k p 1
i ii 1 i 1estadstico terico
estadstico contraste
(n e ) nn
e e
donde estimaraparmetrosnmeroervalosintnmero
pk
o bien, la regin de rechazo de la hiptesis nula: 2k
i i 2; k p 1
ii 1
(n e )R
e
La distribucin de Poisson se caracteriza porque slo depende del parmetro quecoincide con la media.
Sea la variable aleatoria X = 'nmero de partculas' y in = 'nmero de perodos detiempo'
ix in i ix n i iP(x k ) p 0 120 0 0,30121 200 200 0,36142 140 280 0,21693 20 60 0,08674 10 40 0,02605 2 10 0,0062
i ix n 590x 1,2n 492
1,2 enconsecuencia,
k1,2
i1,2P(x k) ek!
k 0, ,5
n=492 590
-
154
Las probabilidades con que llegan las partculas k 0, 1, , 5 se obtienensustituyendo los valores de k en
k1.2
i1,2P(x k) ek!
, o bien en las tablas con 2,1
Para verificar si el ajuste de los datos a una distribucin de Poisson se acepta o no,mediante una 2 , hay que calcular las frecuencias esperadas i i(e n . p )
ix 0 1 2 3 4 5
Frecuencias120
1e = 148,2)(200
2(e = 177,8)140
3(e = 106,7)20
4(e = 42,7)10
5(e = 12,8)2
6(e = 3, 05)
1e = 492.0,3012 = 148,2 2e = 492.0,3614 = 177,8 3e = 492.0,2169 = 106,7 4e = 492.0,0867 = 42,7 5e = 492.0,0260= 12,8 6e = 492.0,0062 = 3,05
dando lugar a una tabla de contingencia 1 x 6, en donde hay que agrupar las dos ltimascolumnas por tener la ltima columna frecuencias esperadas menores que cinco.
Por tanto, se tiene la tabla de contingencia 1 x 5:
ix 0 1 2 3 4y5
Frecuencias120
1e = 148,2)(200
2(e = 177,8)140
3(e = 106,7)20
4(e = 42,7)12
(e = 15,8)5
As, los grados de libertad son tres )31151pk(
El estadstico de contraste:2 25 5 2 2 2 2 2
i i i23
i ii 1 i 1
(n e ) n 120 200 140 20 12n 492 32,31e e 148,2 177,8 106,27 42,7 15,8
El estadstico terico: 20,05 ; 3 7,815
El estadstico de contraste (bondad de ajuste) es mayor que el estadstico terico)815,7( , rechazndose la hiptesis nula, es decir, la distribucin NO se puede ajustar
a una distribucin de Poisson a un nivel de significacin del 5%.
Se verifica la regin de rechazo: 2k i i 2 ; k p 1ii 1
(n e )R 32,31 7,815
e
-
155
CONTRASTENOPARAMTRICODEBONDADDEAJUSTEAUNANORMALCONPARMETROSDESCONOCIDOS.
3.- Para una muestra aleatoria simple de 350 das, el nmero de urgencias tratadasdiariamente en un hospital A queda reflejado en la siguiente tabla:
Nurgencias 05 510 1015 1520 2025 2530 TotaldasNdas 20 65 100 95 60 10 350
Contrastar, con un nivel de significacin del 5%, si la distribucin del nmero deurgencias tratadas diariamente en el hospital A se ajusta a una distribucin normal.
Solucin:
Para ajustar los datos obtenidos a una distribucin normal N( , ) de parmetrosdesconocidos, se necesitan estimar los dos parmetros recurriendo a los estimadoresmximo-verosmiles: 2 2x ( x , ) , donde la variable aleatoria X = ' nmero deurgencias diarias'.
Se establece la hiptesis nula 'normallaaajustaseempricandistribuciLa':H0
Se acepta la hiptesis nula, a un nivel de significacin si2 2k k
i i i2 2k p 1 ; k p 1
i ii 1 i 1estadstico terico
estadstico contraste
( n e ) nn
e e
donde
nmero intervalos
nmero parmetros a estimar
kp
Se obtiene la media y la desviacin tpica:
Intervalos ix in i ix .n2i ix . n
05 2,5 20 50 125510 7,5 65 487,5 3656,251015 12,5 100 1250 156251520 17,5 95 1662,5 29093,752025 22,5 60 1350 303752530 27,5 10 275 7562,5
6 ii=1
n = n = 350 6 i ii=1
x n = 5075 .6 2i ii=1
x n = 86437,5
6 i ii=1
x nx = = 14,5
350
. 6 62 2i i i i2 2i=1 i=1x
(x x) n x n = = ( x ) = 36,71
350 350 x = 6,06
-
156
Se procede al ajuste de una distribucin normal N(14,5 ; 6,06) , hallando lasprobabilidades de cada uno de los intervalos:
Intervalos in ip i ie = p . n2
i i(n e ) 2i i i(n e ) / e05 20 0,0498 17,43 6,6 0,38510 65 0,1714 59,99 25,1 0,421015 100 0,3023 105,81 33,76 0,321520 95 0,2867 100,35 28,62 0,292025 60 0,1396 48,86 124,1 2,542530 10 0,0366 12,81 7,9 0,62
n = 350 6 2i i ii=1
(n e ) / e = 4,57
0 14,5 x 14,5 5 14,5
P(0 < x < 5) = P < < = P(2,39 < z < 1,57) =6,06 6,06 6,06
= P(1,57 < z < 2,39) = P(z > 1,57) P(z > 2,39) = 0, 0582 0, 00842 = 0, 04978
5 14,5 x 14,5 10 14,5
P(5 < x < 10) = P < < = P(1,57 < z < 0,74) =6,06 6,06 6,06
= P(0,74 < z < 1,57) = P(z > 0,74) P(z > 1,57) = 0,2296 0, 0582 = 0,1714
10 14,5 x 14,5 15 14,5
P(10 < x < 15) = P < < = P(0,74 < z < 0,08) =6,06 6,06 6,06
= P(0,08 < z < 0,74) = 1 P(z > 0,74) P(z > 0,08) = 1 0,4681 0,2296 = 0,3023
15 14,5 x 14,5 20 14,5
P(15 < x < 20) = P < < = P( 0,08 < z < 0,91) =6,06 6,06 6,06
= P(z > 0,08) P(z > 0,91) = 0,4681 0,1814 = 0,2867
20 14,5 x 14,5 25 14,5
P(20 < x < 25) = P < < = P( 0,91 < z < 1,73) =6,06 6,06 6,06
= P(z > 0,91) P(z > 1,73) = 0,1814 0,0418 = 0,1396
25 14,5 x 14,5 30 14,5
P(25 < x < 30) = P < < = P( 1,73 < z < 2,56) =6,06 6,06 6,06
= P(z > 1,73) P(z > 2,56) = 0,0418 0,0052 = 0,0366
Se calculan las frecuencias esperadas, multiplicando las probabilidades por elnmero total de datos n.pe ii
Se calcula el estadstico de contraste 2 , donde el nmero de grados de libertad es31261)estimaraparmetrosn()ervalosintn(1pk , con lo cual,
-
157
26i i2
3ii 1
(n e )4,57
e
Por otra parte, el estadstico terico 20,05 ; 3 7,815
Como 2 23 0,05 ; 34,57 7,815 , se acepta la hiptesis nula a un nivel de significacindel 5%. En consecuencia, la variable aleatoria nmero de urgencias en el hospital Asigue una distribucin N(14,5 ; 6,06) .
-
158
CONTRASTEDEHOMOGENEIDAD.
4.- Para conocer la opinin de los ciudadanos sobre la actuacin del alcalde de unadeterminada ciudad, se realiza una encuesta a 404 personas, cuyos resultados serecogen en la siguiente tabla:
Desacuerdo Deacuerdo NocontestanMujeres 84 78 37Varones 118 62 25
Contrastar, con un nivel de significacin del 5%, que no existen diferencias de opininentre hombres y mujeres ante la actuacin del alcalde.
Solucin:
Se trata de un contraste de homogeneidad en el que se desea comprobar si lasmuestras proceden de poblaciones distintas.
Se tienen dos muestras clasificadas en tres niveles, donde se desea conocer si loshombres y mujeres proceden de la misma poblacin, es decir, si se comportan demanera semejante respecto a la opinin de la actuacin del alcalde.
La hiptesis nula: 0H : 'Noexistediferenciaentrehombresymujeresrespectoalaopinin'
Regin de rechazo de la hiptesis nula: 2 2rechazo (k 1) . (m 1) ; (k 1) .(m 1)R Se forma una tabla de contingencia 2 x 3: En cada frecuencia observada
ij i 1, ,k ; j 1, ,m( n ) en la tabla de contingencia se tiene una frecuencia terica o esperada
ije que se calcula mediante la expresin: i j
ij ij
xn ne p . n
n , donde ijp son las
probabilidades de que un elemento tomado de la muestra presente las modalidades ix
de X e jy de Y.
Desacuerdo Deacuerdo Nocontestan inMujeres 84
11(e = 99, 5)78
12(e = 68,96)37
13(e = 30,53)199
Varones 11821(e = 102, 5)
6222(e = 71, 03)
2523(e = 31, 46)
205
jn 202 140 62 n= 404
11 199 . 202e = 99,5404 12199 . 140
e = = 68,96404
13199 . 62
e = = 30,53404
-
159
21205 . 202
e = = 102,5404
22205 . 140
e = = 71,03404
23205 . 62
e = = 31,46404
El estadstico de contraste:22 3
ij ij 2 2(2 1) . (3 1) 2
iji 1 j 1
(n e )e
, con lo que,
22 3 2 2 2 2 2ij ij22iji=1 j=1
2
(n e ) (84 99,5) (78 68,96) (37 30,53) (118 102,5) (62 71,03) = = + + + + +e 99,5 68,96 30,53 102,5 71,03
(25 31,46)+ = 9,76
31,46
sigue una 2 con dos grados de libertad si es cierta la hiptesis nula con 5eij j,i ;en caso contrario sera necesario agrupar filas o columnas contiguas.
El estadstico de contraste: 2 2k m k m
ij ij ij2(k 1) . (m 1)
ij iji 1 j 1 i 1 j 1
(n e ) nn
e e
22 3 2 2 2 2 2 2ij
i ji=1 j=1
n 84 78 37 118 62 25 n = + + + + + 404 = 9,76e 99,5 68,96 30,53 102,5 71,03 31,46
El estadstico terico 20,05 ; 2 5,991
Como 991,576,9 2 2;05,022 se cumple la regin de rechazo, concluyendo que las
muestras no son homogneas, es decir, no proceden de la misma poblacin, hombres ymujeres no opinan lo mismo.
-
160
CONTRASTEDEINDEPENDENCIA.
5.- Novecientos cincuenta escolares se clasificaron de acuerdo a sus hbitosalimenticios y a su coeficiente intelectual:
CoeficienteIntelectual
-
161
2181 . 276
e = = 23,53950
2281 . 255
e = = 21,74950
2381 . 190
e = = 16,2950
2481 . 229
e = = 19,52950
El estadstico de contraste:
22 4 2 2 2 2 2 2 2 2ij23i ji=1 j=1
n 245 228 177 219 31 27 13 10 = n = + + + + + + + 950 = 9,75e 252,46 233,25 173,8 209,47 23,53 21,74 16,2 19,52
bien,
22 4 2 2 2 2ij ij23iji=1 j=1
2 2 2 2
(n e ) (245 252,46) (228 233,25) (177 173,8) (219 209,47) = = + + + +e 252,46 233,25 173,8 209,47
(31 23,53) (27 21,74) (13 16,2) (10 19,52)+ + + + = 9,75
23,53 21,74 16,2 19,52
sigue una 2 con tres grados de libertad si es cierta la hiptesis nula con 5eij j,i ;en caso contrario sera necesario agrupar filas o columnas contiguas.
El estadstico terico 20,10 ; 3 6,251
Como 2 23 0,10 ; 39, 75 6,251 se cumple la regin de rechazo, concluyendo que serechaza la independencia, habiendo por tanto dependencia estadstica entre elcoeficiente intelectual y la alimentacin.
6.- Tres mtodos de empaquetado de tomates fueron probados durante un perodo decuatro meses; se hizo un recuento del nmero de kilos por 1000 que llegaronestropeados, obtenindose los siguientes datos:
Meses A B C Total1 6 10 10 262 8 12 12 323 8 8 14 304 9 14 16 39
Total 31 44 52 127
a) Observando simplemente los datos, qu se puede inferir sobre el experimento?
b) Con un nivel de significacin de 0,05, comprobar que los tres mtodos tienen la misma eficacia.
Solucin:
-
162
a) Con la simple observacin de los datos, el empaquetado A parece ser el mejor, yaque es el que menos kilos de tomates estropeados tuvo. Ahora bien, esta situacinpuede ser engaosa, ya que hay que tener en cuenta el nmero de kilos que seempaquetaron.
Para tomar una decisin sobre si hay diferencia entre los diferentes mtodos deempaquetado, se contrasta la hiptesis nula
0H :'No existe diferencia entre los mtodos de empaquetado'
b) La hiptesis nula 0H :'No existe diferencia entre los mtodos de empaquetado'
Se acepta 0H si: 2k mij2 2
(k 1) . (m 1) ; (k 1) . (m 1)iji 1 j 1
nn
e
Se forma la tabla de contingencia 3 x 4 , donde i jijxn n
en
EmpaquetadoMeses A B C Total
16
11(e 6, 35)10
12(e 9, 01)10
13(e 10, 62)26(26)
28
21(e 7, 81)12
22(e 11, 09)12
23(e 13, 10)32(32)
38
31(e 7, 32)8
32(e 10, 39)14
33(e 12, 28)30(30)
49
41(e 9, 52)14
42(e 13, 51)16
43(e 15, 97)39(39)
Total 31 44 52 127
1126 . 31
e 6, 35127
21 32 . 31e 7, 81127 3130 . 31
e 7, 32127
41 39 . 31e 9, 52127
1226 . 44
e 9, 01127
22 32 . 44e 11, 09127 3230 . 44
e 10, 39127
42 39 . 44e 13, 51127
1326 . 52
e 10, 65127
23 32 . 52e 13, 10127 3330 . 52
e 12, 28127
43 39 . 52e 15, 97127
Estadstico de contraste: 23 4ij2 2
(3 1) . (4 1) 6iji 1 j 1
nn 128,24 127 1,24
e
El estadstico terico o esperado: 20,05 ; 6 12,592
-
163
Siendo 2 26 0,05 ; 61,24 12,592 , el estadstico observado es menor que elestadstico terico o esperado, por tanto, no se cumple la regin de rechazo,concluyendo que los tres mtodos de empaquetado tienen la misma eficiencia.
7.- Una empresa multinacional desea conocer si existen diferencias significativasentre sus trabajadores en distintos pases en el grado de satisfaccin en el trabajo-Para ello se toman muestran aleatorias simples de trabajadores, obteniendo lossiguientes resultados:
SatisfaccineneltrabajoMuysatisfecho Satisfecho Insatisfecho Muyinsatisfecho
Espaa 200 300 300 100Francia 300 400 350 150Italia 350 300 250 150
Puede admitirse con un nivel de significacin del 5% que la satisfaccin en el trabajoes similar en los tres pases?
Solucin:
La hiptesis nula :H0 'Las proporciones de los trabajadores con los distintos grados de satisfaccin son iguales en los tres pases'
Se acepta :H0
2 2k m k mij ij ij2 2
(k 1) . (m 1) ; (k 1) . (m 1)ij iji 1 j 1 i 1 j 1
( n e ) nn
e e
Regin de rechazo de la hiptesis nula: 2 2rechazo (k 1) . (m 1) ; (k 1) . (m 1)R Se forma la tabla de contingencia 3 x 4 donde cada frecuencia observada
m,,1j;k,,1iij)n( tiene una frecuencia terica o esperada i j
ij
xn ne
n
-
164
SatisfaccineneltrabajoMuysatisfecho Satisfecho Insatisfecho Muyinsatisfecho Total
Espaa 20011(e 242,86)
30012(e 285, 71)
30013(e 257, 14)
10014(e 114, 29)
900(900)
Francia 30021(e 323, 81)
40022(e 380, 95)
35023(e 342, 86)
15024(e 152, 38)
1200(1200)
Italia 35031(e 283, 33)
30032(e 333, 33)
25033(e 300)
15034(e 133, 33)
1050(1050)
Total 850 1000 900 400 3150
Estadstico observado: 2 23 4 3 4
ij ij ij2(3 1) . (4 1)
ij iji 1 j 1 i 1 j 1
(n e ) nn
e e
2 2 2 2 2 2 2 2200 300 300 100 300 400 350 150
242,86 285,71 257,14 114,29 323,81 380,95 342,86 152,38
2 2 2 2350 300 250 1503150 49,55
283,33 333,33 300 133,33
Estadstico terico: 2 20,05 ; (3 1) .(4 1) 0,05 ; 6 12,592
Como 226 0,05 ; 649,55 12,592 se rechaza la hiptesis nula de homogeneidad delas tres muestras.Es decir, la satisfaccin en el trabajo de los empleados de los tres pases essignificativamente distinta.
8.- Las compaas de seguros de automviles suelen penalizar en sus primas a losconductores ms jvenes, con el criterio que stos son ms propensos a tener un mayornmero de accidentes. En base a la tabla adjunta, con un nivel de significacin del 5%,contrastar si el nmero de accidentes es independiente de la edad del conductor.
NmerodeaccidentesalaoEdaddelconductor0 1 2 3 4
25omenos 10 10 20 40 702635 20 10 15 20 30msde36 60 50 30 10 5
Solucin:
Hiptesis nula :H0 'El nmero de accidentes sufridos por los conductores no depende de la edad del conductor'
-
165
Se acepta :H02 2k m k m
ij ij ij2 2(k 1) . (m 1) ; (k 1) . (m 1)
ij iji 1 j 1 i 1 j 1
(n e ) nn
e e
Regin de rechazo de la hiptesis nula: 2 2rechazo (k 1) . (m 1) ; (k 1) . (m 1)R Se forma la tabla de contingencia 3 x 5 donde cada frecuencia observada
m,,1j;k,,1iij)n( tiene una frecuencia terica o esperada en caso de independencia
i jij
xn ne
n
NmerodeaccidentesporaoEdaddelconductor 0 1 2 3 4
m
ij 1
n
25omenos 1011e 33,75
1012e 26,25
2013e 24,37
4014e 26,25
7015e 39,37
150)150(
2635 2021e 21,37
1022e 16,62
1523e 15,44
2024e 16,62
3025e 24,94
95)95(
msde36 6031e 34,87
5032e 27,12
3033e 25,19
1034e 27,12
535e 40,69
155)155(
k
ji 1
n 90 70 65 70 105 400
11150 . 90
e 33,75400
12150 . 70
e 26,25400
13150 . 65
e 24,37400
14150 . 70
e 26,25400
15150 . 105
e 39,37400
21
95 . 90e 21,37
400
22
95 . 70e 16,62
400
23
95 . 65e 15, 44
400
24
95 . 70e 16,62
400 25
95 . 105e 24,94
400
31
155 . 90e 34,87
400 32
155 . 70e 27,12
400 33
155 . 65e 25,19
400 34
155 . 70e 27,12
400 35
155 . 105e 40,69
400
Estadstico observado: 2 23 5 3 5
ij ij ij2 2(3 1) . (5 1) 8
ij iji 1 j 1 i 1 j 1
( n e ) nn
e e
2 2 2 2 2 2 2 2 2 210 10 20 40 70 20 10 15 20 30
33,75 26,25 24,37 26,25 39,37 21,37 16,62 15,44 16,62 24,94
2 2 2 2 260 50 30 10 5400 143,51
34,87 27,12 25,19 27,12 40,69
Estadstico terico: 2 20,05 ; (3 1) . (5 1) 0,05;8 15,507
-
166
Como 228 0,05 ; 8143,51 15,507 se rechaza la hiptesis nula de independencia entrela edad del conductor y el nmero de accidentes.En consecuencia, la edad influye significativamente en el nmero de accidentes al ao.
COEFICIENTEDECONTINGENCIA
9.- En dos ciudades, A y B, se observ el color del pelo y de los ojos de sus habitantes,encontrndose las siguientes tablas:
CiudadA CiudadBPelo
Ojos Rubio NoRubioPelo
Ojos Rubio NoRubioAzul 47 23 Azul 54 30Noazul 31 93 Noazul 42 80
a) Hallar los coeficientes de contingencia de las dos ciudades.
b) En cul de las dos ciudades podemos afirmar que hay mayor dependencia entre elcolor del pelo y de los ojos?
Solucin:
a) Se calculan los valores de la 2 correspondientes a las dos observaciones, siendo lafrecuencia esperada i jij
xn ne
n
CiudadAPelo
Ojos Rubio NoRubio Total
Azul 4711(e 28, 14)
2312(e 41,85)
70(70)
Noazul 3121(e 49, 85)
93)14,74e( 22
124(124)
Total 78 116 194
1170 . 78
e 28,14194
1270 . 116
e 41,85194
21124 . 78
e 49,85194
22124 . 116
e 74,14194
Estadstico de contraste:
22 2 2 2 2 2ij2 2
1(2-1) . (2-1)iji=1 j=1
n 47 23 31 93 = = -n = + + + -194 =33,07e 28,14 41,85 49,85 74,14
El coeficiente de contingencia: 3816,019407,33
07,33CA
-
167
En la poblacin B, la tabla de contingencia 2 x 2:
CiudadBPelo
Ojos Rubio NoRubio Total
Azul 5411(e = 39, 15)
30
12(e = 44,85)84(84)
Noazul 4221(e = 56, 85)
80
22(e = 65, 15)122(122)
Total 96 110 206
1184 . 96
e 39,15206
1284 . 110
e 44,85206
2196 . 122
e 56,85206
22110 . 122
e 65,15206
Estadstico de contraste:
22 2 2 2 2 2ij2 2
(2 1) . (2 1) 1iji 1 j 1
n 54 30 42 80n 206 17,82e 39,15 44,85 56,85 65,15
El coeficiente de contingencia: 282,0
20682,1782,17CB
b) Como el coeficiente de contingencia mide el grado de relacin o dependencia entrelas variables, afirmamos que en la poblacin A hay mayor dependencia entre el colorde los ojos y del pelo.