Contin Gencia

download Contin Gencia

of 21

Transcript of Contin Gencia

  • 147

    GestinAeronutica:EstadsticaTericaFacultadCienciasEconmicasyEmpresarialesDepartamentodeEconomaAplicadaProfesor:SantiagodelaFuenteFernndez

    PRINCIPALESAPLICACIONESDELACHICUADRADOAl analizar en una poblacin un carcter cualitativo o cuantitativo el estudio resultamuy tedioso por el gran nmero de elementos del que consta la poblacin.

    Generalmente, se examina una muestra tomada de la poblacin, lo que lleva a tener unaserie de datos, y ver hasta qu punto la muestra se pude considerar perteneciente auna distribucin terica conocida.

    Siempre existirn desviaciones entre la distribucin emprica u observada y ladistribucin terica. Se plantea la cuestin de saber si estas desviaciones son debidasal azar o al haber tomado una distribucin terica inadecuada.

    CONTRASTEDEBONDADDELAJUSTEEl objetivo del contraste de bondad del ajuste es saber si una muestra procede de unapoblacin terica con determinada distribucin de probabilidad.

    Sea una poblacin, donde se analiza un carcter X con 1 2 k(x , x , , x ) modalidadesexcluyentes, denotando por in es el nmero de elementos que presenta la modalidad ix

    (frecuencia observada de ix ), k

    ii 1

    n n

    Por otra parte, sea i ie n . p la frecuencia esperada o terica de cada modalidad ix

    Se origina la TABLADECONTINGENCIA:

    X 1x 2x ix kxFrecuencia observada 1n 2n in knFrecuencia esperada 1(e ) 2(e ) i(e ) k(e )

    Se plantea la hiptesis nula 0La distribucin terica representa a H :la distribucin emprica u observada

    Para un nivel de significacin (o riesgo) :

    Se acepta 0H : 2k

    i i 2, (k 1)

    ii 1

    (n e )e

    estadsticoobservado estadstico

    terico

    Se rechaza 0H : 2k

    i i 2, (k 1)

    ii 1

    (n e )e

    estadsticoobservado estadstico

    terico

  • 148

    El estadstico 2 2k k

    i i i

    i ii 1 i 1

    (n e ) nn

    e e

    (tilenelclculo)OBSERVACIONESDELAAPLICACIN

    a) El test de la 2 se puede aplicar en situaciones donde se desea decidir si una seriede datos (observaciones) se ajusta o no a una funcin terica previamentedeterminada (Binomial, Poisson, Normal, etc.)

    b) Es necesario que las frecuencias esperadas de las distintas modalidades no seainferior a cinco. Si alguna modalidad tiene una frecuencia esperada menor que cincose agrupan dos o ms modalidades contiguas en una sola hasta conseguir que lafrecuencia esperada sea mayor que cinco.

    c) Los grados de libertad de la 2 dependen del nmero de parmetros que senecesitan hallar para obtener las frecuencias esperadas. En este sentido, si serequieren hallar p parmetros, los grados de libertad son (k p) si las modalidadesson independientes y (k p 1) cuando las modalidades son excluyentes.

    TABLASCONTIGENCIA:CONTRASTEDEDEPENDENCIAOINDEPENDENCIA

    Cuando se desea comparar dos caracteres (X, Y) en una misma poblacin que admitenlas modalidades: 1 2 i k 1 2 j mX(x , x , , x , , x ) Y(y , y , , y , , y ) , se toma una muestrade tamao n, representando por ijn el nmero de elementos de la poblacin que

    presentan la modalidad ix de X e jy de Y.

    Y X 1

    y 2y jy mym

    ij 1

    n

    1x 11n 12n 1jn 1mn 1n 2x 21n 22n 2jn 2mn 2n

    ix i1n i2n ijn imn in

    kx k1n k2n kjn kmn kn k

    ji 1

    n 1n 2n jn mn n

    Se plantea la hiptesis nula 0No existe diferencia entre las H :distribuciones empricas de X e Y

  • 149

    Bajo la hiptesis nula, cada frecuencia observada ijn (i 1, , k ; j 1, , m) de latabla de contingencia x(k m) hay una frecuencia esperada ij( e ) que se obtienemediante la expresin:

    i jij ijxn n

    e p . nn

    , donde i jij xn n

    pn n

    Agrupando frecuencias observadas y esperadas en la tabla de contingencia x(k m) :

    Y X 1

    y 2y jy mym

    ij 1

    n

    1x11n

    11( e )12n

    12( e ) 1j

    n

    1j( e ) 1m

    n

    1m( e )1n

    2x21n

    21( e )22n

    22( e ) 2j

    n

    2j( e ) 2m

    n

    2m( e )2n

    ixi1n

    i1( e )i2n

    i2( e ) ij

    n

    ij( e ) im

    n

    im( e )in

    kxk1n

    k1( e )k2n

    k2( e ) kj

    n

    kj( e ) km

    n

    k m( e )kn

    k

    ji 1

    n 1n 2n jn mn n

    El estadstico de contraste observado: 2k m

    ij ij 2(k 1) . (m 1)

    iji 1 j 1

    (n e )e

    que sigueaproximadamente una chi-cuadrado con x(k 1) (m 1) grados de libertad si es ciertala hiptesis nula 0H con ije 5 , en caso contrario es necesario agrupar filas o columnascontiguas.

    Para un nivel de significacin se puede contrastar la diferencia significativa entrelas dos distribuciones empricas o la independencia de las distribuciones empricas.

  • 150

    CONTRASTEDEHOMOGENEIDAD

    Se acepta oH si : 2k m

    ij ij 2, (k 1) . (m 1)

    iji 1 j 1

    (n e )e

    estadstico observado

    estadstico terico

    Se rechaza oH si : 2k m

    ij ij 2, (k 1) . (m 1)

    iji 1 j 1

    (n e )e

    estadstico observado

    estadstico terico

    CONTRASTEDEINDEPENDENCIA

    Hiptesis nula 0H : Las distribuciones empricas X e Y son independientes

    Se acepta oH si : 2k m

    ij ij 2, (k 1) . (m 1)

    iji 1 j 1

    (n e )e

    estadstico observado

    estadstico terico

    Se rechaza oH si : 2k m

    ij ij 2, (k 1) . (m 1)

    iji 1 j 1

    (n e )e

    estadstico observado

    estadstico terico

    TABLASCONTIGENCIA2x2y2x3

    Para las tablas de contingencia 2x2 y 2x3 se obtienen frmulas sencillas de la 2utilizando nicamente las frecuencias observadas

    Y X 1

    y 2y

    1x 11n 12n 1n

    2x 21n 22n 2n

    1n 2n n

    211 22 12 212

    11 2 1 2

    n (n . n n . n )n . n . n . n

    Se acepta 0H : 2 21 ,1 Se rechaza 0H : 2 21 ,1

    Y X 1

    y 2y 3y

    1x 11n 12n 13n 1n

    2x 21n 22n 23n 2n

    1n 2n 3n n

  • 151

    2 2 2 2 2 211 12 13 21 22 232

    21 1 2 3 2 1 2 3

    n n n n n nn n nn n n n n n n n

    Se acepta 0H : 2 22 ,2 Se rechaza 0H : 2 22 ,2

    COEFICIENTEDECONTINGENCIA

    Es una medida del grado de relacin o dependencia entre dos caracteres en la tabla decontingencia, se define:

    2

    2C n

    Mayor valor de C indica un grado de dependencia mayor entre X e Y

  • 152

    CONTRASTENOPARAMTRICODEBONDADDEAJUSTE

    1.- Para comprobar si los operarios encontraban dificultades con una prensa manual deimprimir, se hizo una prueba a cuatro operarios anotando el nmero de atascos sufridosal introducir el mismo nmero de hojas, dando lugar a la siguiente tabla:

    Operario A B C D TotalObstrucciones 6 7 9 18 40

    Con un nivel de significacin del 5%, existe diferencia entre los operarios?

    Solucin:

    Estableciendo la hiptesis nula :H0 'no existe diferencia entre los operarios'

    La probabilidad de que se atascase una hoja sera 4/1 para todos los operarios.De este modo, el nmero de atascos esperados para cada uno de ellos sera

    i i 1, , 4(e 10) .

    Tenemos, la tabla de contingencia 1 x 4:

    Operario A B C D Total

    Obstrucciones 6(10)7

    (10)9

    (10)18

    (10)40

    (40)

    Se acepta la hiptesis nula, a un nivel de significacin si

    tericooestadstic2

    1k;

    k

    1i i

    2i

    contrasteoestadstic

    k

    1i i

    2ii2

    1k nen

    e)en(

    ervalosintnmerok

    o bien, la regin de rechazo de la hiptesis nula: 2k

    i i 2; k 1

    ii 1

    (n e )R

    e

    con lo cual,

    24 2 2 2 2i2

    3ii 1

    n 6 7 9 18n 40 9e 10 10 10 10

    Con el nivel de significacin ( 05,0 ), el estadstico terico: 815,72 3;05,0 siendo 2 3;05,0

    23 815,79 se verifica la regin de rechazo.

    En consecuencia, se rechaza la hiptesis nula, concluyendo que existe diferenciasignificativa entre los operarios respecto al nmero de atascos en la prensa deimprimir.

  • 153

    CONTRASTENOPARAMTRICODEBONDADDEAJUSTEAUNAPOISSONCONPARMETRODESCONOCIDO.

    2.- En un laboratorio se observ el nmero de partculas que llegan a unadeterminada zona procedentes de una sustancia radiactiva en un corto espacio detiempo siempre igual, obtenindose los siguientes resultados:

    Nmero partculas 0 1 2 3 4 5Nmero perodos de tiempo 120 200 140 20 10 2

    Se pueden ajustar los datos obtenidos a una distribucin de Poisson, con un nivel designificacin del 5%?

    Solucin:

    Se establece la hiptesis nula 'PoissonlaaajustaseempricandistribuciLa':H0

    La hiptesis nula se acepta, a un nivel de significacin si2 2k k

    i i i2 2k p 1 ; k p 1

    i ii 1 i 1estadstico terico

    estadstico contraste

    (n e ) nn

    e e

    donde estimaraparmetrosnmeroervalosintnmero

    pk

    o bien, la regin de rechazo de la hiptesis nula: 2k

    i i 2; k p 1

    ii 1

    (n e )R

    e

    La distribucin de Poisson se caracteriza porque slo depende del parmetro quecoincide con la media.

    Sea la variable aleatoria X = 'nmero de partculas' y in = 'nmero de perodos detiempo'

    ix in i ix n i iP(x k ) p 0 120 0 0,30121 200 200 0,36142 140 280 0,21693 20 60 0,08674 10 40 0,02605 2 10 0,0062

    i ix n 590x 1,2n 492

    1,2 enconsecuencia,

    k1,2

    i1,2P(x k) ek!

    k 0, ,5

    n=492 590

  • 154

    Las probabilidades con que llegan las partculas k 0, 1, , 5 se obtienensustituyendo los valores de k en

    k1.2

    i1,2P(x k) ek!

    , o bien en las tablas con 2,1

    Para verificar si el ajuste de los datos a una distribucin de Poisson se acepta o no,mediante una 2 , hay que calcular las frecuencias esperadas i i(e n . p )

    ix 0 1 2 3 4 5

    Frecuencias120

    1e = 148,2)(200

    2(e = 177,8)140

    3(e = 106,7)20

    4(e = 42,7)10

    5(e = 12,8)2

    6(e = 3, 05)

    1e = 492.0,3012 = 148,2 2e = 492.0,3614 = 177,8 3e = 492.0,2169 = 106,7 4e = 492.0,0867 = 42,7 5e = 492.0,0260= 12,8 6e = 492.0,0062 = 3,05

    dando lugar a una tabla de contingencia 1 x 6, en donde hay que agrupar las dos ltimascolumnas por tener la ltima columna frecuencias esperadas menores que cinco.

    Por tanto, se tiene la tabla de contingencia 1 x 5:

    ix 0 1 2 3 4y5

    Frecuencias120

    1e = 148,2)(200

    2(e = 177,8)140

    3(e = 106,7)20

    4(e = 42,7)12

    (e = 15,8)5

    As, los grados de libertad son tres )31151pk(

    El estadstico de contraste:2 25 5 2 2 2 2 2

    i i i23

    i ii 1 i 1

    (n e ) n 120 200 140 20 12n 492 32,31e e 148,2 177,8 106,27 42,7 15,8

    El estadstico terico: 20,05 ; 3 7,815

    El estadstico de contraste (bondad de ajuste) es mayor que el estadstico terico)815,7( , rechazndose la hiptesis nula, es decir, la distribucin NO se puede ajustar

    a una distribucin de Poisson a un nivel de significacin del 5%.

    Se verifica la regin de rechazo: 2k i i 2 ; k p 1ii 1

    (n e )R 32,31 7,815

    e

  • 155

    CONTRASTENOPARAMTRICODEBONDADDEAJUSTEAUNANORMALCONPARMETROSDESCONOCIDOS.

    3.- Para una muestra aleatoria simple de 350 das, el nmero de urgencias tratadasdiariamente en un hospital A queda reflejado en la siguiente tabla:

    Nurgencias 05 510 1015 1520 2025 2530 TotaldasNdas 20 65 100 95 60 10 350

    Contrastar, con un nivel de significacin del 5%, si la distribucin del nmero deurgencias tratadas diariamente en el hospital A se ajusta a una distribucin normal.

    Solucin:

    Para ajustar los datos obtenidos a una distribucin normal N( , ) de parmetrosdesconocidos, se necesitan estimar los dos parmetros recurriendo a los estimadoresmximo-verosmiles: 2 2x ( x , ) , donde la variable aleatoria X = ' nmero deurgencias diarias'.

    Se establece la hiptesis nula 'normallaaajustaseempricandistribuciLa':H0

    Se acepta la hiptesis nula, a un nivel de significacin si2 2k k

    i i i2 2k p 1 ; k p 1

    i ii 1 i 1estadstico terico

    estadstico contraste

    ( n e ) nn

    e e

    donde

    nmero intervalos

    nmero parmetros a estimar

    kp

    Se obtiene la media y la desviacin tpica:

    Intervalos ix in i ix .n2i ix . n

    05 2,5 20 50 125510 7,5 65 487,5 3656,251015 12,5 100 1250 156251520 17,5 95 1662,5 29093,752025 22,5 60 1350 303752530 27,5 10 275 7562,5

    6 ii=1

    n = n = 350 6 i ii=1

    x n = 5075 .6 2i ii=1

    x n = 86437,5

    6 i ii=1

    x nx = = 14,5

    350

    . 6 62 2i i i i2 2i=1 i=1x

    (x x) n x n = = ( x ) = 36,71

    350 350 x = 6,06

  • 156

    Se procede al ajuste de una distribucin normal N(14,5 ; 6,06) , hallando lasprobabilidades de cada uno de los intervalos:

    Intervalos in ip i ie = p . n2

    i i(n e ) 2i i i(n e ) / e05 20 0,0498 17,43 6,6 0,38510 65 0,1714 59,99 25,1 0,421015 100 0,3023 105,81 33,76 0,321520 95 0,2867 100,35 28,62 0,292025 60 0,1396 48,86 124,1 2,542530 10 0,0366 12,81 7,9 0,62

    n = 350 6 2i i ii=1

    (n e ) / e = 4,57

    0 14,5 x 14,5 5 14,5

    P(0 < x < 5) = P < < = P(2,39 < z < 1,57) =6,06 6,06 6,06

    = P(1,57 < z < 2,39) = P(z > 1,57) P(z > 2,39) = 0, 0582 0, 00842 = 0, 04978

    5 14,5 x 14,5 10 14,5

    P(5 < x < 10) = P < < = P(1,57 < z < 0,74) =6,06 6,06 6,06

    = P(0,74 < z < 1,57) = P(z > 0,74) P(z > 1,57) = 0,2296 0, 0582 = 0,1714

    10 14,5 x 14,5 15 14,5

    P(10 < x < 15) = P < < = P(0,74 < z < 0,08) =6,06 6,06 6,06

    = P(0,08 < z < 0,74) = 1 P(z > 0,74) P(z > 0,08) = 1 0,4681 0,2296 = 0,3023

    15 14,5 x 14,5 20 14,5

    P(15 < x < 20) = P < < = P( 0,08 < z < 0,91) =6,06 6,06 6,06

    = P(z > 0,08) P(z > 0,91) = 0,4681 0,1814 = 0,2867

    20 14,5 x 14,5 25 14,5

    P(20 < x < 25) = P < < = P( 0,91 < z < 1,73) =6,06 6,06 6,06

    = P(z > 0,91) P(z > 1,73) = 0,1814 0,0418 = 0,1396

    25 14,5 x 14,5 30 14,5

    P(25 < x < 30) = P < < = P( 1,73 < z < 2,56) =6,06 6,06 6,06

    = P(z > 1,73) P(z > 2,56) = 0,0418 0,0052 = 0,0366

    Se calculan las frecuencias esperadas, multiplicando las probabilidades por elnmero total de datos n.pe ii

    Se calcula el estadstico de contraste 2 , donde el nmero de grados de libertad es31261)estimaraparmetrosn()ervalosintn(1pk , con lo cual,

  • 157

    26i i2

    3ii 1

    (n e )4,57

    e

    Por otra parte, el estadstico terico 20,05 ; 3 7,815

    Como 2 23 0,05 ; 34,57 7,815 , se acepta la hiptesis nula a un nivel de significacindel 5%. En consecuencia, la variable aleatoria nmero de urgencias en el hospital Asigue una distribucin N(14,5 ; 6,06) .

  • 158

    CONTRASTEDEHOMOGENEIDAD.

    4.- Para conocer la opinin de los ciudadanos sobre la actuacin del alcalde de unadeterminada ciudad, se realiza una encuesta a 404 personas, cuyos resultados serecogen en la siguiente tabla:

    Desacuerdo Deacuerdo NocontestanMujeres 84 78 37Varones 118 62 25

    Contrastar, con un nivel de significacin del 5%, que no existen diferencias de opininentre hombres y mujeres ante la actuacin del alcalde.

    Solucin:

    Se trata de un contraste de homogeneidad en el que se desea comprobar si lasmuestras proceden de poblaciones distintas.

    Se tienen dos muestras clasificadas en tres niveles, donde se desea conocer si loshombres y mujeres proceden de la misma poblacin, es decir, si se comportan demanera semejante respecto a la opinin de la actuacin del alcalde.

    La hiptesis nula: 0H : 'Noexistediferenciaentrehombresymujeresrespectoalaopinin'

    Regin de rechazo de la hiptesis nula: 2 2rechazo (k 1) . (m 1) ; (k 1) .(m 1)R Se forma una tabla de contingencia 2 x 3: En cada frecuencia observada

    ij i 1, ,k ; j 1, ,m( n ) en la tabla de contingencia se tiene una frecuencia terica o esperada

    ije que se calcula mediante la expresin: i j

    ij ij

    xn ne p . n

    n , donde ijp son las

    probabilidades de que un elemento tomado de la muestra presente las modalidades ix

    de X e jy de Y.

    Desacuerdo Deacuerdo Nocontestan inMujeres 84

    11(e = 99, 5)78

    12(e = 68,96)37

    13(e = 30,53)199

    Varones 11821(e = 102, 5)

    6222(e = 71, 03)

    2523(e = 31, 46)

    205

    jn 202 140 62 n= 404

    11 199 . 202e = 99,5404 12199 . 140

    e = = 68,96404

    13199 . 62

    e = = 30,53404

  • 159

    21205 . 202

    e = = 102,5404

    22205 . 140

    e = = 71,03404

    23205 . 62

    e = = 31,46404

    El estadstico de contraste:22 3

    ij ij 2 2(2 1) . (3 1) 2

    iji 1 j 1

    (n e )e

    , con lo que,

    22 3 2 2 2 2 2ij ij22iji=1 j=1

    2

    (n e ) (84 99,5) (78 68,96) (37 30,53) (118 102,5) (62 71,03) = = + + + + +e 99,5 68,96 30,53 102,5 71,03

    (25 31,46)+ = 9,76

    31,46

    sigue una 2 con dos grados de libertad si es cierta la hiptesis nula con 5eij j,i ;en caso contrario sera necesario agrupar filas o columnas contiguas.

    El estadstico de contraste: 2 2k m k m

    ij ij ij2(k 1) . (m 1)

    ij iji 1 j 1 i 1 j 1

    (n e ) nn

    e e

    22 3 2 2 2 2 2 2ij

    i ji=1 j=1

    n 84 78 37 118 62 25 n = + + + + + 404 = 9,76e 99,5 68,96 30,53 102,5 71,03 31,46

    El estadstico terico 20,05 ; 2 5,991

    Como 991,576,9 2 2;05,022 se cumple la regin de rechazo, concluyendo que las

    muestras no son homogneas, es decir, no proceden de la misma poblacin, hombres ymujeres no opinan lo mismo.

  • 160

    CONTRASTEDEINDEPENDENCIA.

    5.- Novecientos cincuenta escolares se clasificaron de acuerdo a sus hbitosalimenticios y a su coeficiente intelectual:

    CoeficienteIntelectual

  • 161

    2181 . 276

    e = = 23,53950

    2281 . 255

    e = = 21,74950

    2381 . 190

    e = = 16,2950

    2481 . 229

    e = = 19,52950

    El estadstico de contraste:

    22 4 2 2 2 2 2 2 2 2ij23i ji=1 j=1

    n 245 228 177 219 31 27 13 10 = n = + + + + + + + 950 = 9,75e 252,46 233,25 173,8 209,47 23,53 21,74 16,2 19,52

    bien,

    22 4 2 2 2 2ij ij23iji=1 j=1

    2 2 2 2

    (n e ) (245 252,46) (228 233,25) (177 173,8) (219 209,47) = = + + + +e 252,46 233,25 173,8 209,47

    (31 23,53) (27 21,74) (13 16,2) (10 19,52)+ + + + = 9,75

    23,53 21,74 16,2 19,52

    sigue una 2 con tres grados de libertad si es cierta la hiptesis nula con 5eij j,i ;en caso contrario sera necesario agrupar filas o columnas contiguas.

    El estadstico terico 20,10 ; 3 6,251

    Como 2 23 0,10 ; 39, 75 6,251 se cumple la regin de rechazo, concluyendo que serechaza la independencia, habiendo por tanto dependencia estadstica entre elcoeficiente intelectual y la alimentacin.

    6.- Tres mtodos de empaquetado de tomates fueron probados durante un perodo decuatro meses; se hizo un recuento del nmero de kilos por 1000 que llegaronestropeados, obtenindose los siguientes datos:

    Meses A B C Total1 6 10 10 262 8 12 12 323 8 8 14 304 9 14 16 39

    Total 31 44 52 127

    a) Observando simplemente los datos, qu se puede inferir sobre el experimento?

    b) Con un nivel de significacin de 0,05, comprobar que los tres mtodos tienen la misma eficacia.

    Solucin:

  • 162

    a) Con la simple observacin de los datos, el empaquetado A parece ser el mejor, yaque es el que menos kilos de tomates estropeados tuvo. Ahora bien, esta situacinpuede ser engaosa, ya que hay que tener en cuenta el nmero de kilos que seempaquetaron.

    Para tomar una decisin sobre si hay diferencia entre los diferentes mtodos deempaquetado, se contrasta la hiptesis nula

    0H :'No existe diferencia entre los mtodos de empaquetado'

    b) La hiptesis nula 0H :'No existe diferencia entre los mtodos de empaquetado'

    Se acepta 0H si: 2k mij2 2

    (k 1) . (m 1) ; (k 1) . (m 1)iji 1 j 1

    nn

    e

    Se forma la tabla de contingencia 3 x 4 , donde i jijxn n

    en

    EmpaquetadoMeses A B C Total

    16

    11(e 6, 35)10

    12(e 9, 01)10

    13(e 10, 62)26(26)

    28

    21(e 7, 81)12

    22(e 11, 09)12

    23(e 13, 10)32(32)

    38

    31(e 7, 32)8

    32(e 10, 39)14

    33(e 12, 28)30(30)

    49

    41(e 9, 52)14

    42(e 13, 51)16

    43(e 15, 97)39(39)

    Total 31 44 52 127

    1126 . 31

    e 6, 35127

    21 32 . 31e 7, 81127 3130 . 31

    e 7, 32127

    41 39 . 31e 9, 52127

    1226 . 44

    e 9, 01127

    22 32 . 44e 11, 09127 3230 . 44

    e 10, 39127

    42 39 . 44e 13, 51127

    1326 . 52

    e 10, 65127

    23 32 . 52e 13, 10127 3330 . 52

    e 12, 28127

    43 39 . 52e 15, 97127

    Estadstico de contraste: 23 4ij2 2

    (3 1) . (4 1) 6iji 1 j 1

    nn 128,24 127 1,24

    e

    El estadstico terico o esperado: 20,05 ; 6 12,592

  • 163

    Siendo 2 26 0,05 ; 61,24 12,592 , el estadstico observado es menor que elestadstico terico o esperado, por tanto, no se cumple la regin de rechazo,concluyendo que los tres mtodos de empaquetado tienen la misma eficiencia.

    7.- Una empresa multinacional desea conocer si existen diferencias significativasentre sus trabajadores en distintos pases en el grado de satisfaccin en el trabajo-Para ello se toman muestran aleatorias simples de trabajadores, obteniendo lossiguientes resultados:

    SatisfaccineneltrabajoMuysatisfecho Satisfecho Insatisfecho Muyinsatisfecho

    Espaa 200 300 300 100Francia 300 400 350 150Italia 350 300 250 150

    Puede admitirse con un nivel de significacin del 5% que la satisfaccin en el trabajoes similar en los tres pases?

    Solucin:

    La hiptesis nula :H0 'Las proporciones de los trabajadores con los distintos grados de satisfaccin son iguales en los tres pases'

    Se acepta :H0

    2 2k m k mij ij ij2 2

    (k 1) . (m 1) ; (k 1) . (m 1)ij iji 1 j 1 i 1 j 1

    ( n e ) nn

    e e

    Regin de rechazo de la hiptesis nula: 2 2rechazo (k 1) . (m 1) ; (k 1) . (m 1)R Se forma la tabla de contingencia 3 x 4 donde cada frecuencia observada

    m,,1j;k,,1iij)n( tiene una frecuencia terica o esperada i j

    ij

    xn ne

    n

  • 164

    SatisfaccineneltrabajoMuysatisfecho Satisfecho Insatisfecho Muyinsatisfecho Total

    Espaa 20011(e 242,86)

    30012(e 285, 71)

    30013(e 257, 14)

    10014(e 114, 29)

    900(900)

    Francia 30021(e 323, 81)

    40022(e 380, 95)

    35023(e 342, 86)

    15024(e 152, 38)

    1200(1200)

    Italia 35031(e 283, 33)

    30032(e 333, 33)

    25033(e 300)

    15034(e 133, 33)

    1050(1050)

    Total 850 1000 900 400 3150

    Estadstico observado: 2 23 4 3 4

    ij ij ij2(3 1) . (4 1)

    ij iji 1 j 1 i 1 j 1

    (n e ) nn

    e e

    2 2 2 2 2 2 2 2200 300 300 100 300 400 350 150

    242,86 285,71 257,14 114,29 323,81 380,95 342,86 152,38

    2 2 2 2350 300 250 1503150 49,55

    283,33 333,33 300 133,33

    Estadstico terico: 2 20,05 ; (3 1) .(4 1) 0,05 ; 6 12,592

    Como 226 0,05 ; 649,55 12,592 se rechaza la hiptesis nula de homogeneidad delas tres muestras.Es decir, la satisfaccin en el trabajo de los empleados de los tres pases essignificativamente distinta.

    8.- Las compaas de seguros de automviles suelen penalizar en sus primas a losconductores ms jvenes, con el criterio que stos son ms propensos a tener un mayornmero de accidentes. En base a la tabla adjunta, con un nivel de significacin del 5%,contrastar si el nmero de accidentes es independiente de la edad del conductor.

    NmerodeaccidentesalaoEdaddelconductor0 1 2 3 4

    25omenos 10 10 20 40 702635 20 10 15 20 30msde36 60 50 30 10 5

    Solucin:

    Hiptesis nula :H0 'El nmero de accidentes sufridos por los conductores no depende de la edad del conductor'

  • 165

    Se acepta :H02 2k m k m

    ij ij ij2 2(k 1) . (m 1) ; (k 1) . (m 1)

    ij iji 1 j 1 i 1 j 1

    (n e ) nn

    e e

    Regin de rechazo de la hiptesis nula: 2 2rechazo (k 1) . (m 1) ; (k 1) . (m 1)R Se forma la tabla de contingencia 3 x 5 donde cada frecuencia observada

    m,,1j;k,,1iij)n( tiene una frecuencia terica o esperada en caso de independencia

    i jij

    xn ne

    n

    NmerodeaccidentesporaoEdaddelconductor 0 1 2 3 4

    m

    ij 1

    n

    25omenos 1011e 33,75

    1012e 26,25

    2013e 24,37

    4014e 26,25

    7015e 39,37

    150)150(

    2635 2021e 21,37

    1022e 16,62

    1523e 15,44

    2024e 16,62

    3025e 24,94

    95)95(

    msde36 6031e 34,87

    5032e 27,12

    3033e 25,19

    1034e 27,12

    535e 40,69

    155)155(

    k

    ji 1

    n 90 70 65 70 105 400

    11150 . 90

    e 33,75400

    12150 . 70

    e 26,25400

    13150 . 65

    e 24,37400

    14150 . 70

    e 26,25400

    15150 . 105

    e 39,37400

    21

    95 . 90e 21,37

    400

    22

    95 . 70e 16,62

    400

    23

    95 . 65e 15, 44

    400

    24

    95 . 70e 16,62

    400 25

    95 . 105e 24,94

    400

    31

    155 . 90e 34,87

    400 32

    155 . 70e 27,12

    400 33

    155 . 65e 25,19

    400 34

    155 . 70e 27,12

    400 35

    155 . 105e 40,69

    400

    Estadstico observado: 2 23 5 3 5

    ij ij ij2 2(3 1) . (5 1) 8

    ij iji 1 j 1 i 1 j 1

    ( n e ) nn

    e e

    2 2 2 2 2 2 2 2 2 210 10 20 40 70 20 10 15 20 30

    33,75 26,25 24,37 26,25 39,37 21,37 16,62 15,44 16,62 24,94

    2 2 2 2 260 50 30 10 5400 143,51

    34,87 27,12 25,19 27,12 40,69

    Estadstico terico: 2 20,05 ; (3 1) . (5 1) 0,05;8 15,507

  • 166

    Como 228 0,05 ; 8143,51 15,507 se rechaza la hiptesis nula de independencia entrela edad del conductor y el nmero de accidentes.En consecuencia, la edad influye significativamente en el nmero de accidentes al ao.

    COEFICIENTEDECONTINGENCIA

    9.- En dos ciudades, A y B, se observ el color del pelo y de los ojos de sus habitantes,encontrndose las siguientes tablas:

    CiudadA CiudadBPelo

    Ojos Rubio NoRubioPelo

    Ojos Rubio NoRubioAzul 47 23 Azul 54 30Noazul 31 93 Noazul 42 80

    a) Hallar los coeficientes de contingencia de las dos ciudades.

    b) En cul de las dos ciudades podemos afirmar que hay mayor dependencia entre elcolor del pelo y de los ojos?

    Solucin:

    a) Se calculan los valores de la 2 correspondientes a las dos observaciones, siendo lafrecuencia esperada i jij

    xn ne

    n

    CiudadAPelo

    Ojos Rubio NoRubio Total

    Azul 4711(e 28, 14)

    2312(e 41,85)

    70(70)

    Noazul 3121(e 49, 85)

    93)14,74e( 22

    124(124)

    Total 78 116 194

    1170 . 78

    e 28,14194

    1270 . 116

    e 41,85194

    21124 . 78

    e 49,85194

    22124 . 116

    e 74,14194

    Estadstico de contraste:

    22 2 2 2 2 2ij2 2

    1(2-1) . (2-1)iji=1 j=1

    n 47 23 31 93 = = -n = + + + -194 =33,07e 28,14 41,85 49,85 74,14

    El coeficiente de contingencia: 3816,019407,33

    07,33CA

  • 167

    En la poblacin B, la tabla de contingencia 2 x 2:

    CiudadBPelo

    Ojos Rubio NoRubio Total

    Azul 5411(e = 39, 15)

    30

    12(e = 44,85)84(84)

    Noazul 4221(e = 56, 85)

    80

    22(e = 65, 15)122(122)

    Total 96 110 206

    1184 . 96

    e 39,15206

    1284 . 110

    e 44,85206

    2196 . 122

    e 56,85206

    22110 . 122

    e 65,15206

    Estadstico de contraste:

    22 2 2 2 2 2ij2 2

    (2 1) . (2 1) 1iji 1 j 1

    n 54 30 42 80n 206 17,82e 39,15 44,85 56,85 65,15

    El coeficiente de contingencia: 282,0

    20682,1782,17CB

    b) Como el coeficiente de contingencia mide el grado de relacin o dependencia entrelas variables, afirmamos que en la poblacin A hay mayor dependencia entre el colorde los ojos y del pelo.