Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva....

69
Universidad de Sevilla Dpto. Ecuaciones Diferenciales y An´alisis Num´ erico Res´ umenes te´oricos de la asignatura Matem´atica Aplicada y Estad´ ıstica Grado en Farmacia 20011-12 Primer curso: Parte 2

Transcript of Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva....

Page 1: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

Universidad de Sevilla

Dpto. Ecuaciones Diferenciales y Analisis Numerico

Resumenes teoricos de la asignatura

Matematica Aplicada y Estadıstica

Grado en Farmacia 20011-12

Primer curso: Parte 2

Page 2: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

2

Page 3: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

Indice general

5. Estadıstica descriptiva 635.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 635.2. Distribuciones estadısticas. Representaciones graficas . . . . . . . . . . . . . . . 63

5.2.1. Conceptos fundamentales . . . . . . . . . . . . . . . . . . . . . . . . . . 635.2.2. Tablas estadısticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 645.2.3. Representaciones graficas . . . . . . . . . . . . . . . . . . . . . . . . . . 66

5.3. Medidas de posicion y dispersion . . . . . . . . . . . . . . . . . . . . . . . . . . 715.3.1. Medidas de tendencia central . . . . . . . . . . . . . . . . . . . . . . . . 725.3.2. Medidas de dispersion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75

6. Variables estadısticas bidimensionales 796.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 796.2. Tablas de doble entrada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 796.3. Relaciones entre las variables X e Y . . . . . . . . . . . . . . . . . . . . . . . . 81

7. Probabilidad. Variables aleatorias y distribuciones de probabilidad 877.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 877.2. Variable aleatoria y probabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . 887.3. Distribuciones discretas. La distribucion binomial . . . . . . . . . . . . . . . . . 907.4. Distribuciones continuas. La distribucion normal y la t de Student . . . . . . . 91

7.4.1. La distribucion Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . 927.4.2. La distribucion t de Student . . . . . . . . . . . . . . . . . . . . . . . . . 97

8. Teorıa de muestras y diseno de experimentos 1018.1. Tipos de muestreo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101

8.1.1. Muestreo aleatorio simple . . . . . . . . . . . . . . . . . . . . . . . . . . 1018.1.2. Muestreo aleatorio estratificado . . . . . . . . . . . . . . . . . . . . . . . 1018.1.3. Muestreo aleatorio sistematico . . . . . . . . . . . . . . . . . . . . . . . 1028.1.4. Muestreo por conglomerados y areas . . . . . . . . . . . . . . . . . . . . 102

8.2. Distribucion de la proporcion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1028.3. Distribucion en el muestreo de la media . . . . . . . . . . . . . . . . . . . . . . 1038.4. Distribucion en el muestreo de la diferencia de medias . . . . . . . . . . . . . . 1058.5. Ensayos clınicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

3

Page 4: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

INDICE GENERAL 61

8.5.1. El grupo de control. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1078.5.2. Concepto de ensayo clınico. . . . . . . . . . . . . . . . . . . . . . . . . . 1078.5.3. Control del sesgo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1088.5.4. Disenos de un ensayo clınico . . . . . . . . . . . . . . . . . . . . . . . . . 1098.5.5. Metodos de asignacion aleatoria del tratamiento . . . . . . . . . . . . . 1108.5.6. Otros conceptos relacionados con el ensayo clınico . . . . . . . . . . . . 110

9. Inferencia estadıstica 1139.1. La inferencia Estadıstica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1139.2. Estimacion puntual: parametro y estadıstico . . . . . . . . . . . . . . . . . . . . 1149.3. Estimacion por intervalos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1149.4. Intervalo de confianza para una proporcion . . . . . . . . . . . . . . . . . . . . 1169.5. Intervalo de confianza para la media poblacional . . . . . . . . . . . . . . . . . 1179.6. Intervalo de confianza para la diferencia de medias . . . . . . . . . . . . . . . . 1199.7. Relacion entre error admisible, tamano de la muestra y nivel de confianza . . . 120

10.Contraste de hipotesis 12110.1. Contraste de hipotesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12110.2. Contrastes de hipotesis sobre la media de una distribucion . . . . . . . . . . . . 12310.3. Contrastes de hipotesis para la proporcion . . . . . . . . . . . . . . . . . . . . . 12510.4. Contraste de hipotesis para la diferencia de medias de dos muestras . . . . . . . 125

Page 5: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

62 INDICE GENERAL

Page 6: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

Tema 5

Estadıstica descriptiva

5.1. Introduccion

En un curso general de Matematica Aplicada suele haber, por necesidades de sus recep-tores, un bloque de estadıstica. La estadıstica pretende extraer informacion relevante a partirde una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a vecesexisten relaciones entre los mismos, medidas caracterısticas que apuntan a cierta direccion, oque senalan cuanto se ha alejado la muestra de un valor central.

El objetivo de este y los siguientes temas es poder obtener este tipo de informacion detablas dadas.

5.2. Distribuciones estadısticas. Representaciones graficas

5.2.1. Conceptos fundamentales

La Estadıstica es el conjunto de metodos necesarios para recoger, clasificar, representar yresumir datos (Estadıstica Descriptiva), ası como de obtener consecuencias cientıficas a partirde estos datos (Inferencia Estadıstica).

Poblacion es el conjunto de todos los elementos observados al realizar un experimento.Muestra es cualquier subconjunto de la poblacion.Individuo es cada uno de los elementos de la poblacion.Tamano de la muestra es el numero de elementos de la muestra.Un caracter estadıstico es cualquier propiedad que permite clasificar a los individuos

de una poblacion. Se clasifican en cualitativos y en cuantitativos.Modalidad de un caracter es cada una de las diferentes situaciones que puede presentar

un caracter. Estas en un mismo caracter son incompatibles. Por ejemplo, el caracter sexo,presenta dos modalidades: masculino y femenino.

Variable estadıstica es la correspondencia que a cada modalidad de un caracter cuan-titativo le asocia un numero real. Se clasifican en discretas (por ejemplo, el numero de hijasde una familia, el numero de obreros en una fabrica) y continuas (temperaturas registradasen un observatorio, la presion sanguınea de enfermos). Se suelen representar por X, Y o Z.

63

Page 7: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

64 TEMA 5. ESTADISTICA DESCRIPTIVA

Distribucion de frecuencias. Los datos recogidos se van a clasificar y representar enuna tabla en la que aparecen distintas frecuencias.

Sean N el tamano de la muestra, C el caracter a analizar presentando las modalidadesC1, C2, ..., Ck.

Sea ni la frecuencia absoluta de Ci, es decir, el numero de individuos que presentan lamodalidad Ci.

La frecuencia relativa de Ci es fi = niN .

El porcentaje relativo a 100 individuos de Ci es pi = 100fi.

Se verifica quek∑

i=1ni = N,

k∑i=1

fi = 1.

La frecuencia absoluta acumulada es Ni =i∑

j=1nj y la frecuencia relativa acumu-

lada Fi =i∑

j=1fj =

i∑j=1

NiN . Entonces Nk = N , Fk = 1.

El porcentaje relativo acumulado es Pi =i∑

j=1pj .

5.2.2. Tablas estadısticas

Muestra de tamano N para analizar un caracter cualitativo

Supongamos dada la siguiente tabla, donde las variables C1, C2, ..., Ck son posibles modal-idades.

Modalidades F. abs. F. relativas PorcentajesC1 n1 f1 100f1

C2 n2 f2 100f2...

......

...Ck nk fk 100fk

Total N 1 100%

(5.1)

Ejemplo: Distribucion del color de los ojos en una muestra de 50 personas:

Modalidades F. abs. F. relativas PorcentajesAzules 16 0′32 32%Verdes 12 0′24 24%

Marrones 14 0′28 28%Negros 8 0′16 16%Total 50 1 100%

(5.2)

Page 8: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

5.2. DISTRIBUCIONES ESTADISTICAS. REPRESENTACIONES GRAFICAS 65

Tabla estadıstica para una variable discreta

En una muestra de tamano N se ordenan de menor a mayor los valores de la variable,x1 < x2 < ... < xk, y se anaden la frecuencias absolutas y relativas junto con los porcentajes.

Valores F. abs. F. relativas Porcentajesx1 n1 f1 100f1

x2 n2 f2 100f2...

......

...xk nk fk 100fk

Total N 1 100%

(5.3)

Se puede completar la tabla con las frecuencias acumuladas para facilitar posteriores calcu-los.

Ejemplo: Distribucion del numero de hijos en una muestra de 100 familias espanolas:

xi ni Ni fi Fi pi

0 14 14 0′14 0′14 14%1 26 40 0′26 0′40 26%2 30 70 0′30 0′70 30%3 16 86 0′16 0′86 16%≥ 4 14 100 0′14 1 14%

Total 100 1 100%

(5.4)

Tabla estadıstica para una variable continua

Los datos se agrupan en clases, que van a ser intervalos semiabiertos, [e0, e1), [e1, e2),· · ·, [ek−1, ek). Se considera que todos los individuos de una misma clase tienen el valor quesenala la marca de clase, siendo

ci =ei−1 + ei

2, i = 1, · · ·, k. (5.5)

La amplitud de la clase [ei−1, ei) es ai = ei − ei−1.

Ventaja: menor numero de calculos.Desventaja: perdida de informacion.

Clases Marcas ni Ni fi Fi pi Pi

[e0, e1) c1 n1 N1 f1 F1 p1 P1

[e1, e2) c2 n2 N2 f2 F2 p2 P2...

......

......

......

...[ek−1, ek) ck nk Nk fk Fk pk Pk

Total N 1 100%

(5.6)

Page 9: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

66 TEMA 5. ESTADISTICA DESCRIPTIVA

Ejemplo: Pesos en miligramos de 40 pastillas de ciertos medicamentos:

Peso [200, 210) [210, 215) [215, 220) [220, 230)ni 3 10 14 13

(5.7)

5.2.3. Representaciones graficas

Van a completar la informacion recogida en la tabla estadıstica.Dependiendo de la naturaleza del caracter estudiado hay diferentes tipos de representa-

ciones.

Graficas para caracteres cualitativos

Diagramas de barras. Sobre un sistema de ejes cartesianos en uno de los ejes serepresentan las distintas modalidades y en el otro los valores de la frecuencia. Sobre cadamodalidad se levantan rectangulos de la misma base y altura proporcional (normalmenteigual) a la frecuencia.

Ejemplo. Distribucion del estado civil de 150 personas:

Estado Solt. Cas. V. Div. Rel. No declaraFr.abs. 20 78 15 26 7 4

(5.8)

Page 10: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

5.2. DISTRIBUCIONES ESTADISTICAS. REPRESENTACIONES GRAFICAS 67

Diagramas de sectores. Se traza una circunferencia de radio arbitrario y se divide sucırculo en sectores. Cada sector se asocia a una modalidad siendo el angulo correspon-diente de cada sector proporcional a la frecuencia de cada modalidad.

Pictogramas. Cada modalidad se representa por una figura no geometrica de tamanoproporcional a su frecuencia, o bien se toma un dibujo como modelo y se repite unnumero de veces proporcional a la frecuencia de la modalidad correspondiente1.

1Tomado de la pagina web: http://www.me.gov.ve/SegundaEtapa/Glosario/matematica.htm

Page 11: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

68 TEMA 5. ESTADISTICA DESCRIPTIVA

Graficas para caracteres cuantitativos

Variable discretaDiagramas de barras. Cuando la variable es discreta y toma pocos valores, el grafico

adecuado es el diagrama de barras o rectangulos. Se construye de la misma forma que paralos caracteres cualitativos pero ahora sobre el eje X se situan los valores de la variable.

Uniendo los extremos superiores de las barras o los puntos medios de los lados superioresde los rectangulos se obtiene el polıgono de frecuencias simples.

Ejemplo: Distribucion del numero de hijos en una muestra de 100 familias espanolas:

xi ni fi

0 14 0′141 26 0′262 30 0′303 16 0′16≥ 4 14 0′14

(5.9)

El diagrama de barras es el siguiente:

Los polıgonos de frecuencias simples para ni y fi (para ser precisos, y dado que cualquiercolumna proporcional es valida en estas representaciones, se aclara que polıgono de frecuenciasse esta construyendo: absolutas, relativas o porcentuales) vienen dados simplemente por:

Page 12: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

5.2. DISTRIBUCIONES ESTADISTICAS. REPRESENTACIONES GRAFICAS 69

Variable continua

Histogramas. Como los datos usados en este caso proceden de una variable continua, semantiene el tamano real de la base de cada modalidad para no generar graficas equıvocas.Precisamente por ello serıa igualmente tendencioso poner una altura proporcional a la fre-cuencia absoluta o cualquier otra (un intervalo con ni grande puede deberse simplemente aser demasiado grande). De modo que sobre cada intervalo de clase se levanta un rectangulode area igual o proporcional a la frecuencia del correspondiente intervalo. Esto implicaque leer meramente las alturas en un histograma es incorrecto, la informacion esta codificadaen las areas.

Si las amplitudes son iguales, entonces las alturas se toman iguales a las frecuencias.

Amplitudes diferentes: En la clase [ei−1, ei), considerando area igual a la frecuencia absolu-ta (tambien valdrıa cualquier otra columna proporcional: la relativa o la porcentual), tenemoshi = ni

ai, donde hi es la altura del rectangulo correspondiente a esa clase, y ai la amplitud.

Ejemplo: Tabla, histograma y polıgono de frecuencias acumuladas en las calificacionesde 200 alumnos:

Notas ni pi hi

[0, 3) 48 24% 8[3, 5) 69 34′5% 17′25[5, 7) 55 27′5% 13′75[7, 9) 20 10% 5[9, 10) 8 4% 4

(5.10)

Page 13: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

70 TEMA 5. ESTADISTICA DESCRIPTIVA

Uniendo los puntos medios de los lados superiores de los rectangulos se obtiene el polıgonode frecuencias simples enmarcado en el histograma: para ser precisos, y dado quecualquier columna proporcional es valida en estas representaciones, se aclara que polıgono defrecuencias se esta construyendo (absolutas, relativas o porcentuales), en este caso el de losporcentajes relativos.

Polıgono de frecuencias acumuladas. En el eje X se representan los extremos delas clases. A e0 se le asigna ordenada 0 y a cada extremo derecho de las clases se le asignacomo ordenada la frecuencia acumulada (absoluta, relativa o porcentual) de dicha marca.La poligonal que une dichos puntos es el polıgono de frecuencias acumuladas. El hecho detomar ahora la poligonal de los extremos a la derecha de los rectangulos es que, suponiendouniformemente distribuido el numero de individuos en cada clase, dicha poligonal deberıareflejar al final de cada intervalo el total de individuos en el contenido.

Page 14: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

5.3. MEDIDAS DE POSICION Y DISPERSION 71

Aplicacion: supuesto conocido el polıgono de frecuencias acumuladas y fijado un valorx0 de la variable, la ordenada correspondiente, que se obtiene por interpolacion lineal, es elporcentaje acumulado de individuos de la muestra para los que la variable es menor o igualque x0.

Ejemplo: Peso en kg de 100 personas:

Peso [20, 40) [40, 60) [60, 80) [80, 100)Pi 10 59 91 100

(5.11)

Porcentaje de individuos cuyo peso es menor o igual que 69: como 69 ∈ [60, 80), se calculala recta que pasa por (60, 59) y (80, 91) y se sustituye la abscisa por 69:

y = 59 +91− 5980− 60

(69− 60) = 73′4%. (5.12)

5.3. Medidas de posicion y dispersion

Una vez agrupados los datos en distribuciones de frecuencias, se calculan unos valores quesintetizan la informacion. Estudiaremos dos grandes secciones:

Medidas de tendencia central o de posicion: situacion de los valores alrededor delos cuales fluctuan los demas.

Page 15: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

72 TEMA 5. ESTADISTICA DESCRIPTIVA

Medidas de dispersion: grado de desviacion de los datos respecto de las medidas detendencia central.

Acabaremos este resumen con el proceso de tipificacion de una variable aleatoria.

5.3.1. Medidas de tendencia central

Estudiaremos la media aritmetica y la mediana.

Media aritmetica

Se suele representar por x, aunque tambien por µ e incluso abusando de la notacionprobabilista EX (esperanza de la variable X). Es el valor de tendencia central de mayorinteres.

Caso discreto

Sea X una variable discreta que toma los valores x1, x2, · · ·, xk con frecuencias absolutasn1, n2, · · ·, nk resp. La media aritmetica de X viene dada por

x =

k∑i=1

xini

N=

k∑

i=1

xifi. (5.13)

Ejemplo. Calificaciones de 20 alumnos en Matematicas:

xi ni Ni Pi

2 3 3 154 6 9 455 5 14 706 3 17 858 1 18 9010 2 20 100

(5.14)

La nota media es x = 2·3+4·6+5·5+6·3+8·1+10·220 = 5′05.

Propiedades

1) La suma de todas las desviaciones a la media es cero:k∑

i=1(xi − x)ni = 0.

2) Si X toma los valores x1, x2, . . . , xk, e Y los valores yi = xi + c, i = 1, 2, . . . , k, c ∈ R,entonces y = x + c.

3) Si X toma los valores x1, x2, . . . , xk, e Y los valores yi = cxi, i = 1, 2, . . . , k, c ∈ R,entonces y = cx.

Page 16: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

5.3. MEDIDAS DE POSICION Y DISPERSION 73

Aplicacion: si X toma los valores x1, x2, . . . , xk, y Z los valores zi = xi−cd , i = 1, 2, . . . , k,

con c, d ∈ R, d 6= 0, entonces z = x−cd , lo cual facilita a veces los calculos cambiando de

variable. Por ejemplo, se quiere calcular el diametro medio de 100 embolos cuyas medidas enmm son:

(xi) 153′7 153′8 153′9 154′0 154′1 154′2 154′3ni 10 15 19 21 14 13 8

(5.15)

Definimos Z = X−1540′1 cuya distribucion de frecuencias es

Diametro (zi) −3 −2 −1 0 1 2 3ni 10 15 19 21 14 13 8

(5.16)

La media de Z es z = −0′15, luego x = 0′1z + 154 = 153′985.

Caso continuo

Si la variable aleatoria es continua, para simplificar se calculara la media aritmetica deuna variable discreta cuyos valores son las marcas de clase de cada uno de los intervalos y lasfrecuencias absolutas las de cada clase. Con ello se pierde precision, porque solo se tendra encuenta el numero de valores que esta dentro de un intervalo de clase pero no la forma en laque estan repartidos.

Ventajas de la media aritmetica:

- Contiene toda la informacion de los datos de la distribucion, por lo que es representativa.

- Siempre puede ser determinada, es facil de calcular y admite operaciones aritmeticas.

Desventaja: presenta una gran sensibilidad a valores extremos.

Percentiles. Caso particular: la mediana

Se suponen los valores de la variable ordenados en orden creciente. Si n ∈ N, con 1 ≤ n ≤100, el percentil de rango n es el valor de la variable estad’ıstica que deja por debajo de elal n% de los valores y al resto por encima. La mediana es el percentil de rango 50 (dividea la muestra en dos partes iguales; al menos la mitad de la muestra cumple estar por debajodel valor destacado).

Estudiaremos el valor de la variable correspondiente a un percentil dado; y dado un valorde la variable calcularemos el percentil correspondiente.

Page 17: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

74 TEMA 5. ESTADISTICA DESCRIPTIVA

Caso discreto

Se realiza en primer lugar la tabla de frecuencias porcentuales acumuladas (f.p.a.).

a) Si el porcentaje n no figura en la columna de f.p.a. se toma como percentil de rango nel primer valor de la variable cuya f.p.a. sobrepasa a n.

b) Si el porcentaje n coincide con la f.p.a. de algun valor xi, se toma como percentil derango n el valor xi+xi+1

2 .

Ejemplo. Consideramos de nuevo la tabla dada en la pagina 72 sobre las calificaciones de20 alumnos en Matematicas.

La mediana es 5, el percentil de rango 84 es 6, mientras que el percentil de rango 85 es6+82 = 7.

Caso continuo

Se construye el polıgono de frecuencias porcentuales acumuladas (no debe construirsesobre el histograma, sino solo, pues las alturas deben reflejar el porcentaje correspondienteindependientemente de la amplitud de cada clase). La abscisa correspondiente a la ordenadan es el percentil de rango n. El calculo se hace por interpolacion suponiendo que todos losindividuos de un intervalo de clase estan distribuidos homogeneamente.

Ejemplo. Peso en kg de 100 personas:

Peso [20, 40) [40, 60) [60, 80) [80, 100)Pi 10 59 91 100

(5.17)

10

59

91100

Pi

20 40 60 80 100peso

Page 18: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

5.3. MEDIDAS DE POSICION Y DISPERSION 75

Recuerdese que la recta que pasa por los puntos (x0, y0) y (x1, y1) viene dada, por ejemplo,como y − y0 = y1−y0

x1−x0(x− x0).

En este caso la mediana esta en el intervalo [40, 60). Es aquel x tal que

50− 10 =59− 1060− 40

(x− 40) ⇒ x = 56′32. (5.18)

El percentil de rango 91 es 80.

5.3.2. Medidas de dispersion

La dispersion de una distribucion es la mayor o menor separacion de sus datos respectode una de las caracterısticas de tendencia central, pretendiendo medir la representatividad dedicha caracterıstica.

Ejemplo. Calificaciones de 28 alumnos:

Fısica 3 9ni 14 14

Biologıa 3 6 9ni 5 6 7

(5.19)

La calificacion media en ambas asignaturas es de 6 puntos, pero ¿donde es mas represen-tativa?

Estudiaremos

el recorrido,

la desviacion media,

la varianza,

la desviacion tıpica y

el coeficiente de variacion de Pearson.

Recorrido

Viene definido comoR = max(xi)−min(xi). (5.20)

Proporciona una primera informacion de la variabilidad de la distribucion, pero es insufi-ciente ya que si la variable toma un valor muy alto o muy bajo en relacion con el resto, puedeinducir a engano (de nuevo, como ocurrıa con la media, es muy sensible a valores extremos).

Page 19: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

76 TEMA 5. ESTADISTICA DESCRIPTIVA

Desviacion media

Dada una caracterıstica de tendencia central C, los valores |xi−C| representan la desviaciona C. Estas cantidades definen una variable estadıstica que se usa como medida de dispersion.En concreto, la desviacion media es la media aritmetica de las desviaciones a la media:

Dx =

k∑i=1

|xi − x|ni

N. (5.21)

Problema: los valores absolutos no son muy adecuados para realizar calculos y posterioresestudios.

Varianza

Se define como la media aritmetica de los cuadrados de las desviaciones a la media:

s2X =

k∑i=1

(xi − x)2ni

N. (5.22)

Si la varianza es nula, todos los valores de la variable coinciden con la media, es decir,dispersion nula. Cuanto mas alejadas esten las observaciones de la media, mayor sera la vari-anza. A veces tambien aparece (por ejemplo en muchas calculadoras) expresada como σ2

n.

Propiedades: Sea X una variable, c, d ∈ R, d 6= 0.

1) Si Y = dX, entonces s2Y = d2s2

X .

2) Si Y = X + c, entonces s2Y = s2

X .

Teorema 5.1 (de Konig). la varianza es la diferencia entre la media de los cuadrados y elcuadrado de la media, es decir,

k∑i=1

(xi − x)2ni

N=

k∑i=1

xi2ni

N− x2 (5.23)

Problema: como todas las desviaciones estan elevadas al cuadrado, la unidad de medidade la varianza viene dada en cuadrados de las unidades de los datos originales.

Desviacion tıpica

Se define como la raız cuadrada positiva de la varianza:

sX =

k∑i=1

(xi − x)2ni

N

1/2

. (5.24)

Page 20: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

5.3. MEDIDAS DE POSICION Y DISPERSION 77

Esto aparece representado en muchas calculadoras como σn.

Propiedades: Sea X una variable, c, d ∈ R, d 6= 0.

1) Si Y = dX, entonces sY = dsX .

2) Si Y = X + c, entonces sY = sX .

3) Usando de nuevo el Teorema de Konig:

sX =

k∑i=1

xi2ni

N− x2

1/2

(5.25)

Ejemplo. Calificaciones de 20 alumnos en Matematicas:

xi ni (xi − x)2 (xi − x)2ni x2i x2

i ni

2 3 9’3025 27’9075 4 124 6 1’1025 6’6150 16 965 5 0’0025 0’0125 25 1256 3 0’9025 2’7075 36 1088 1 8’7025 8’7025 64 6410 2 24’5025 49’0050 100 200

Total 20 94’95 605

(5.26)

Sabemos que x = 5′05.

Usando la definicion, s2X =

kPi=1

(xi−x)2ni

N = 94′9520 = 4′7475, y sX = 2′1788.

Usando el Teorema de Konig, s2X =

kPi=1

xi2ni

N − x2 = 60520 − (5′05)2 = 4′7475.

Coeficiente de variacion de Pearson

A veces hay que comparar las dispersiones de dos distribuciones expresadas en distintasunidades. Es por ello que estudiamos una medida relativa de la variabilidad de la distribucionmediante un numero abstracto independiente de las unidades de medida de las variables. Elcoeficiente de variacion de Pearson es

CV =sX

x. (5.27)

Multiplicandolo por cien permite usar el lenguaje de porcentajes. Cuanto mayor sea CVmenor sera la representatividad de la media. Su valor mınimo es cero, cuando sX = 0, en cuyocaso, obviamente, no hay dispersion.

Page 21: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

78 TEMA 5. ESTADISTICA DESCRIPTIVA

Tipificacion de la variable

En ocasiones interesa deducir el valor relativo de un dato respecto al grupo que pertenece,usando para ello la media y desviacion tıpica del grupo.

Ejemplo. Se quiere asignar un puesto de trabajo entre dos candidatos. La plaza la consigueel que obtenga mejor calificacion en una prueba que ambos realizaron en sus ciudades de proce-dencia. El candidato A obtuvo 55 puntos sobre 80, el candidato B 7 sobre 10 puntos. Son cono-cidas las medias y las desviaciones tıpicas de ambas pruebas: xA = 45, sA = 12; xB = 6, sB = 2.

¿Quien consigue entonces el puesto de trabajo? O dicho mas generalmente: ¿como com-parar datos de dos muestras distintas asociadas a un mismo tipo de estudio? Se hace unreescalamiento, denominado tipificacion.

Se llama tipificacion de la variable X, que toma los valores x1, x2, . . . , xk, a la trans-formacion

zi =xi − x

sX. (5.28)

A la variable Z que toma los valores z1, z2, . . . , zk, se le llama variable tipificada.

Gracias a las propiedades de la media y desviacion tıpica, la variable tipificada tiene medianula y desviacion tıpica uno (y ahora sı podemos compararlas).

Notamos ZA y ZB a dos nuevas variables estadısticas, las tipificaciones de las calificacioneshabidas en las respectivas ciudades. Ası, las notas de ambos individuos “tipificadas” son:

zA =xA − xA

sA= 0′83; zB =

xB − xB

sB= 0′5. (5.29)

Estos valores ahora sı son comparables, y elegimos el valor mayor, es decir, el candidato de laciudad A como el mas apto.

Page 22: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

Tema 6

Variables estadısticasbidimensionales

6.1. Introduccion

Los individuos de una poblacion pueden ser clasificados atendiendo a dos caracteres si-multaneamente. Por ejemplo, pulso y temperatura de los enfermos de un hospital, producciony venta de una fabrica, etc.

El objetivo de este tema sera mostrar algunos resultados sobre el estudio de la relacionentre dos caracterısticas dadas en el mismo problema y como diagnosticar posibles valoresesperados (cabe decir que al contrario que la interpolacion dada en el primer bloque de laasignatura, ahora se usaran tecnicas de aproximacion).

Consideremos una muestra de N individuos, que clasificamos atendiendo a dos caracteresX e Y, que presentan, respectivamente, las modalidades x1, x2, . . . , xp e y1, y2, . . . , yq. Por nij

representamos al numero de individuos que presenta la modalidad xi de X y la modalidadyj de Y. Es decir, nij es la frecuencia absoluta del par (xi, yj). Y fij = nij

N es la frecuenciarelativa. Entonces

p∑

i=1

q∑

j=1

nij = N,

p∑

i=1

q∑

j=1

fij = 1. (6.1)

Representando los pares (xi, yj) se obtiene un conjunto de puntos en el plano llamadodiagrama de dispersion o nube de puntos. Nuestro objetivo en este tema es analizar,dada una nube de puntos, si existe una relacion lineal entre las dos caracterısticas estudiadas.

6.2. Tablas de doble entrada

Mediante ellas vamos a representar las variables bidimensionales. En la primera columnase colocan las modalidades de X y en la primera fila las de Y . La interseccion de la fila dondeesta xi con la columna donde esta yj corresponde a nij .

79

Page 23: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

80 TEMA 6. VARIABLES ESTADISTICAS BIDIMENSIONALES

X\Y y1 · · · yj · · · yq Totalx1 n11 · · · n1j · · · n1q n1·...

......

...xi ni1 · · · nij · · · niq ni·...

......

...xp np1 · · · npj · · · npq np·

Total n·1 · · · n·j · · · n·q

(6.2)

ni· =q∑

j=1nij es la frecuencia absoluta marginal de X, y n·j =

p∑i=1

nij es la frecuencia

absoluta marginal de Y.

Se verifica que

p∑

i=1

ni· = N,

q∑

j=1

n·j = N. (6.3)

Se pueden definir las medias, varianzas y desviaciones tıpicas marginales de X e Y, pero enla practica vamos a simplificar los calculos pues toda tabla de doble entrada va a poderseescribir como una tabla simple.

Veamoslo con el ejemplo siguiente: estudiamos el numero de toneladas de sandıas y demelones producidos en 50 granjas. X es el numero de toneladas de sandias e Y el numero detoneladas de melones. La tabla de doble entrada

X\Y 0 1 2 3 4 5 6 Total0 2 0 4 3 1 0 0 101 3 0 9 0 0 3 0 152 0 6 0 6 0 0 1 133 1 4 0 0 2 1 0 84 0 0 2 0 1 0 0 35 0 0 0 1 0 0 0 1

Total 6 10 15 10 4 4 1 50

(6.4)

Page 24: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

6.3. RELACIONES ENTRE LAS VARIABLES X E Y 81

la convertimos en una tabla simple (donde cambiamos los subındices)

xi yi ni

0 0 2

0 2 4

0 3 3

0 4 1

1 0 3

1 2 9

1 5 3

2 1 6

2 3 6

2 6 1

3 0 1

3 1 4

3 4 2

3 5 1

4 2 2

4 4 1

5 3 1

(6.5)

En la tabla de doble entrada se puede calcular, por ejemplo,

x =0 · 10 + 1 · 15 + 2 · 13 + 3 · 8 + 4 · 3 + 5 · 1

50= 1′64,

s2X =

∑ki=1 xi

2ni·N

− x2 = 1′55. (6.6)

6.3. Relaciones entre las variables X e Y

1- El primer indicador del grado de relacion entre las variables va a ser la covarianza ovarianza conjunta de las variables X e Y .

La covarianza de la variable bidimensional (X,Y ), es decir, la que toma los valores(x1, y1), (x2, y2), . . . , (xk, yk) con frecuencias absolutas n1, n2, . . . , nk es

sXY =

k∑i=1

(xi − x)(yi − y)ni

N=

k∑i=1

xiyini

N− xy. (6.7)

Page 25: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

82 TEMA 6. VARIABLES ESTADISTICAS BIDIMENSIONALES

(Esta ultima igualdad se comprueba simplemente desarrollando el producto previo.)

2- Curva de regresion. Buscamos una curva y = f(x) cuya grafica se adapte lo masposible a la nube de puntos, de manera que conocido el valor de una de las variables podamosobtener un valor aproximado de la otra mediante esta curva. Ası podemos encontrar regresionlineal, parabolica, exponencial, etc.

Vamos principalmente a analizar la regresion lineal, es decir, el caso de la recta que mascerca pase de los puntos dados (esto se hace midiendo y minimizando la distancia, encierto sentido, de la recta a la nube de puntos; segun que se minimice se pueden obtenerdistintas rectas).

La recta de regresion de Y sobre X y la de X sobre Y son, respectivamente,

y − y =sXY

s2X

(x− x), x− x =sXY

s2Y

(y − y). (6.8)

Ejemplo. Las calificaciones en Matematicas (X) y Quımica (Y ) de 15 alumnos de Far-macia son

X 8 8 6 6 7 8 5 6 7 7 8 7 8 6 8Y 4 6 3 5 4 6 4 4 6 4 5 7 6 5 6

(6.9)

Graficamente vemos su distribucion:

4 4.5 5 5.5 6 6.5 7 7.5 8 8.5 92

3

4

5

6

7

8

Nos planteamos el siguiente problema: mediante la recta de regresion de Y sobre X,determinar la nota que tendra un alumno en Quımica que tiene un 8 en Matematicas.

Page 26: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

6.3. RELACIONES ENTRE LAS VARIABLES X E Y 83

Calculamos para ello las medias, varianzas y covarianza de las variables:

x = 7; s2X = 0′93; y = 5; s2

Y = 1′2; sXY = 0′53. (6.10)

La recta de regresion de Y sobre X es

y − 5 =0′530′93

(x− 7) ⇒ y = 0′57x + 1′01. (6.11)

4 4.5 5 5.5 6 6.5 7 7.5 8 8.5 92

3

4

5

6

7

8

Esta recta, que minimiza la distancia (en el sentido de mınimos cuadrados) de la nubede puntos a ella mas que cualquier otra recta, sirve para “aventurar” aproximaciones devalores buscados esten o no en los datos iniciales.

Por ejemplo, la nota “mas esperada” por esta vıa en Quımica para un alumno con un 8en Matematicas sera 0′57 · 8 + 1′01 = 5′57.

Tambien podemos, por ejemplo, plantearnos la regresion exponencial. Se trata de hallarla curva exponencial de la forma y = cax, con a ∈ (0, 1)∪ (1,∞), que pase mas cerca delos puntos que forman la nube de puntos.

Para calcular dicha curva tenemos entonces que hallar las constantes c y a. La idea estransformar la curva exponencial en una recta tomando logaritmos, es decir,

y = cax ⇒ log y = log(cax) = log c + x log a

Page 27: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

84 TEMA 6. VARIABLES ESTADISTICAS BIDIMENSIONALES

con lo que si hacemos el cambio de variables z = log y, entonces z = (log a)x + log c, esdecir, lo que tendremos que calcular es la recta de regresion para las variables (x, z) ydespues deshacer el cambio (tomando exponenciales) para finalmente obtener los valoresde a y c.Ejemplo. El ingreso de ventas, en billones de dolares, de una determinada marca deordenadores viene dada por la siguiente tabla, donde t representa anos medidos desdeel ano 2000:

t 0 2 4 7y 3 4 11 25

(6.12)

Obtener la curva exponencial de regresion que mejor se ajuste a los datos anteriores.

Para ello, consideramos la tabla siguiente

t 0 2 4 7z 0.4771 0.6020 1.0413 1.3979

(6.13)

donde z esta representando el logaritmo de x (en este ejemplo se esta usando el logaritmoen base diez).

Calculando la recta de regresion lineal correspondiente a la tabla anterior, obtenemosz = 0,13907x + 0,42765, con lo que entonces

c = 100,42765 = 2,677, a = 100,13907 = 1,3774

y ası la curva de regresion exponencial que se ajusta a los datos dados es y = 2,677(1,3774)x.

3- La correlacion es la teorıa que analiza el grado de intensidad de la relacion entre lasdos variables. Diremos

Correlacion positiva si la curva de regresion es creciente.

Correlacion negativa si la curva de regresion es decreciente.

Correlacion nula si no existe ninguna relacion entre las variables (variables incorreladas).

Correlacion de tipo funcional cuando todos los puntos de la nube de puntos pertenecena la curva de regresion.

Supongamos que la regresion es lineal. Analizamos como ındice de la correlacion entre lasvariables X e Y el coeficiente de correlacion lineal de Pearson:

r =sXY

sXsY. (6.14)

Se puede probar que −1 ≤ r ≤ 1. Ademas:

Si r = 0, entonces las rectas de regresion son y = y, x = x, es decir, paralelas alos ejes, no habiendo ningun tipo de dependencia entre ellas. Corresponde a variablesincorreladas.

Page 28: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

6.3. RELACIONES ENTRE LAS VARIABLES X E Y 85

Si |r| = 1, ambas rectas de regresion son iguales y hay regresion de tipo funcional entrelas variables.

Si −1 < r < 0, la correlacion es negativa siendo mayor la intensidad cuanto mas seaproxima r a −1.

Si 0 < r < 1, la correlacion es positiva siendo mayor la intensidad cuanto mas seaproxima r a 1.

Ejemplo. En el ejemplo anterior, r = sXYsXsY

= 0′530′97,1·1 = 0′5, por tanto, la correlacion es

positiva pero no muy fuerte, y de ahı que la prediccion realizada no es muy fiable.

Page 29: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

86 TEMA 6. VARIABLES ESTADISTICAS BIDIMENSIONALES

Page 30: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

Tema 7

Probabilidad. Variables aleatorias ydistribuciones de probabilidad

7.1. Introduccion

En este tema trataremos algunas cuestiones basicas sobre Probabilidad. Tanto la Pro-babilidad como la Estadıstica son dos campos de las Matematicas que proporcionan utilesherramientas para el estudio de las ciencias de la vida. Muchos fenomenos de la naturaleza noson deterministas, es decir, conllevan una aleatoriedad. La teorıa de la Probabilidad estudialas leyes que modelan esa aleatoriedad mientras que la teorıa estadıstica analiza los datosconcretos obtenidos de los experimentos; ambas son las caras de una misma moneda quedeben conocerse para entender mejor la realidad que se estudia en su conjunto.

Los primeros investigadores de la probabilidad de sucesos, sobre todo aplicada a los juegosde azar, fueron los franceses Pierre Fermat (1601-1665) y Blaise Pascal (1623-1662).

El nombre de azar proviene de los juegos de dados, donde aparecıa pintada la flor deazahar y estaba asociada a la buena suerte, significaba una buena partida. Incluso el nombrede suceso aleatorio, es decir, suceso del cual es imposible predecir el resultado, proviene dellatın “aleas”que significa dado. Sin embargo, ya un siglo antes Galileo estudio problemassencillos como porque es mejor apostar a sacar un 10 que a sacar un 9 en una tirada de tresdados. Antes que Galileo tambien se dedico al estudio de estos problemas Cardano, quienincluso escribio un libro sobre los juegos de dados en el que llega a explicar como hacertrampas para ganar.

La introduccion de Pascal y Fermat en este tema vino de la amistad de Pascal con unjugador profesional, conocido como Caballero de Mere, quien propuso a Pascal una serie deproblemas sobre distintas situaciones en las apuestas de dados. Pascal enviaba los problemas aFermat, con quien le unıa una buena amistad y ası mantuvieron una continua correspondenciasobre ideas y metodos. Pierre Simon Laplace (1749-1827) construyo la formulacion definitivade la teorıa general de la probabilidad. Laplace definio el calculo de probabilidades como “elsentido comun expresado con numeros”.

Llamamos experimento a cualquier proceso que genera un conjunto de datos. Un ex-

87

Page 31: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

88TEMA 7. PROBABILIDAD. VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD

perimento se dice aleatorio cuando se puede repetir en las mismas condiciones, sus posiblesresultados son conocidos previamente y el resultado de cada prueba depende del azar. Unexperimento se dice determinista cuando al repetirlo en las mismas condiciones, producesiempre el mismo resultado.

Son experimentos aleatorios:

- El lanzamiento de un dado.

- El lanzamiento de una moneda.

- La extraccion de un naipe de la baraja.

- El tiempo de espera de una persona en la parada del autobus.

- El numero de hijos de una pareja, el sexo del mayor, su estatura o el numero de anosque vivira.

- El numero de veces que hay que lanzar una moneda hasta que salga cara.

7.2. Variable aleatoria y probabilidad

El espacio muestral, que se denota por Ω, es el conjunto de todos los posibles resultadosde un experimento aleatorio. Cualquier subconjunto del espacio muestral se denomina suceso.Se llama suceso elemental al constituido por un solo punto del espacio muestral.

En el lanzamiento del dado una vez, Ω = 1, 2, 3, 4, 5, 6 es el espacio muestral. Un sucesoelemental es, por ejemplo, “que salga el 4”, es decir, A = 4. Un suceso no elemental es “quesalga un numero impar”, que se representara como B = 1, 3, 5.

Un espacio muestral puede ser discreto (formado por puntos sueltos) o continuo. Losespacios discretos pueden tener un numero finito o infinito de valores. Algunos ejemplos:

- Lanzamiento de una moneda, Ω = C,X.- Numero de veces que hay que lanzar una moneda hasta que salga cara, Ω = 1, 2, ..., n, ....- Tiempo de espera de una persona en la parada del autobus, Ω = [0, 40] (si la frecuencia

del autobus es de 40 minutos).

Consideremos el experimento que consiste en lanzar un dado, lo repetimos, por ejemplo 20veces, anotamos los resultados y construimos la tabla de frecuencias relativas:

X 1 2 3 4 5 6fi 2/20 1/20 4/20 4/20 5/20 4/20

Aquı, X es una variable estadıstica en el sentido de la Estadıstica Descriptiva de los temasanteriores y el experimento esta realizado para una muestra de tamano N = 20. Si imaginamosuna infinidad de pruebas para este experimento (y que el dado esta bien construido), haciendoun proceso de abstraccion, los conceptos de muestra, frecuencia relativa y variable estadısticapasan a ser los conceptos teoricos de universo o poblacion, probabilidad y variable aleatoria.En nuestro ejemplo, el resultado obtenido serıa el siguiente:

Page 32: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

7.2. VARIABLE ALEATORIA Y PROBABILIDAD 89

X 1 2 3 4 5 6P 1/6 1/6 1/6 1/6 1/6 1/6

Se dice que la probabilidad de que la variable aleatoria, X, tome el valor i para i = 1, 2, 3, 4, 5, 6es 1/6 y se escribe, por ejemplo, P (X = 3) = 1/6.

Definicion 7.1. Se llama variable aleatoria a toda regla que asocia a cada elemento de unespacio muestral, Ω, un numero real y solo uno.

Veamos otro ejemplo. Se considera el experimento de lanzar tres monedas al aire (o unamoneda tres veces) y se considera la variable aleatoria ‘numero de caras que aparecen”. Elespacio muestral es

Ω = (CCC), (CCX), (CXC), (XCC), (CXX), (XCX), (XXC), (XXX),

el valor de la variable aleatoria asociado a cada suceso elemental es, respectivamente, 3, 2, 2,2, 1, 1, 1, 0 y la distribucion de probabilidades es

X 0 1 2 3P 1/8 3/8 3/8 1/8

Observese que a cada suceso le corresponde un valor de la variable aleatoria pero el recıprocono es cierto.

La teorıa de la probabilidad se ocupa de medir la posibilidad de que ocurra un suceso,hasta que punto se puede esperar que ocurra un suceso. La definicion de probabilidad es:

Definicion 7.2. Se llama probabilidad a una regla que asocia a cada suceso, A, del espacio desucesos, un numero, que representamos por P (A) y llamamos probabilidad de A y que cumplelos siguientes axiomas:

1. P (A) ≥ 0 cualquiera que sea A.

2. P (Ω) = 1.

3. Si A y B son dos sucesos disjuntos (es decir, incompatibles), entonces

P (A ∪B) = P (A) + P (B).

Del mismo modo en que la funcion de probabilidad es considerada como una abstraccionde la frecuencia relativa de las variables estadısticas, se puede definir una funcion llamada dedistribucion que lo es respecto de la frecuencia acumulada. Asimismo, se puede generalizar elconcepto de media, varianza y desviacion tıpica. Estos ultimos conceptos cobran una especialrelevancia para las variables aleatorias porque proporcionan un “resumen”del comportamientode la variable conocida su distribucion.

Las variables aleatorias pueden ser discretas y continuas. A cada una de ellas y los ejemplosmas relevantes dedicamos las siguientes preguntas.

Page 33: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

90TEMA 7. PROBABILIDAD. VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD

7.3. Distribuciones discretas. La distribucion binomial

Una variable aleatoria se llama discreta cuando solo puede tomar valores en un conjuntofinito o numerable.

Definicion 7.3. Si X es una variable aleatoria discreta que toma los valores x1, x2, ..., xn, ...,se llama funcion de probabilidad de X a P (X = xi), i ≥ 1 y funcion de distribucion de X aF (x) =

∑xi≤x P (X = xi).

Graficamente, la funcion de distribucion es escalonada.Ejemplo: Definimos la variable aleatoria X = “numero de caras obtenidas en el lanza-

miento de dos monedas”

Ω X P (X = xi) F (x) = P (X ≤ xi)(XX) 0 1/4 F (0) = P (X = 0) = 1/4(XC)(CX)

1 2/4 F (1) = P (X = 0) + P (X = 1) = 1/4 + 1/2 = 3/4

(CC) 2 1/4 F (2) = P (X = 0) + P (X = 1) + P (X = 2) = 1/4 + 1/2 + 1/4 = 1

Definicion 7.4. Si X es una variable aleatoria discreta que toma los valores x1, x2, ..., xn,se llama media, valor esperado o esperanza matematica a

µ = E(X) =n∑

i=1

xiP (X = xi),

varianza a

σ2 = V AR(X) = E(X2)− E(X)2 =n∑

i=1

x2i P (X = xi)−

(n∑

i=1

xiP (X = xi)

)2

y desviacion tıpica, σ, a la raız cuadrada de esta ultima.

Una variable aleatoria queda perfectamente definida por su funcion de probabilidad, su es-peranza y su varianza.

El ejemplo mas importante de este tipo de variable es el siguiente. Supongamos un expe-rimento aleatorio con las siguientes caracterısticas:

1. En cada prueba del experimento solo son posibles dos resultados a los que se suele llamarexito y fracaso.

2. El resultado obtenido en cada prueba es independiente de los resultados anteriores.

3. La probabilidad del exito es constante, esto es, no varıa de una prueba a otra. Serepresenta por p.

Page 34: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

7.4. DISTRIBUCIONES CONTINUAS. LA DISTRIBUCION NORMAL Y LA T DE STUDENT91

Se dice que cada prueba de este experimento es de tipo Bernouilli y a la variable aleatoria queexpresa el numero de exitos obtenidos en n pruebas, se la llama variable aleatoria binomialy se la representa por B(n, p), siendo n y p los parametros de dicha distribucion. Su funcionde probabilidad viene dada por

P (X = k) =(

nk

)pk(1− p)n−k k = 0, 1, 2..., n.

Se prueba que E(X) = np y σ2 = np(1− p).Ejemplos:

- Lanzamiento de una moneda n veces. Solo dos resultados son posibles cada vez, cara ocruz.

- Estudio del numero de tornillos defectuosos en una caja de n tornillos. Solo dos posibi-lidades hay para cada uno de ellos, defectuoso o no defectuoso.

7.4. Distribuciones continuas. La distribucion normal y la t deStudent

Una variable aleatoria se llama continua cuando puede tomar todos los valores posiblesdentro de un cierto intervalo de la recta real. En este caso, no tiene sentido hablar de laprobabilidad de que tome exactamente un valor concreto, se admite que esta es 0. Por ejemplo,no tiene sentido hablar de que una persona mida 1.657321....., diremos que mide 1.65 si nollega a 1.66, por ello el interes esta en conocer la probabilidad correspondiente a un intervalo.Los intervalos ahora desempenan el mismo papel en el caso continuo que los puntos en el casodiscreto.

Recordemos que en el histograma relativo a una variable estadıstica continua, el area delos rectangulos levantados sobre cada intervalo representa la frecuencia relativa (por ejemplo)correspondiente. El polıgono de frecuencias no acumulativo se obtiene uniendo los puntosmedios de las bases superiores de los rectangulos. Consideraremos ademas que sus extremosse unen con puntos sobre el eje OX. Si aumentamos el numero de elementos de la muestray hacemos tender a cero la amplitud de los intervalos, la linea poligonal tiende a convertirseen una curva. Esta curva, f(x), se llama funcion de densidad. Sus ordenadas no representanla probabilidad sino la densidad de probabilidad, por ello, podemos definir P (a < x ≤ b)mediante el area determinada bajo la curva y = f(x) entre x = a y x = b

Definicion 7.5. Se llama funcion de densidad de una variable aleatoria continua a unafuncion, f(x), definida de manera que

P (a < x ≤ b) =∫ b

af(x) dx ∀a, b ∈ R, a < b.

La funcion de densidad debe cumplir las siguientes propiedades:

1. f(x) ≥ 0 en todo su dominio de definicion.

Page 35: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

92TEMA 7. PROBABILIDAD. VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD

2. El area encerrada bajo la grafica de f(x) es la unidad (cuando a = −∞ y b = +∞).

Haciendo una abstraccion analoga para el polıgono de frecuencias acumulado, se introduce elconcepto de funcion de distribucion.

Definicion 7.6. Se llama funcion de distribucion de una variable aleatoria, X, a la funciondefinida por

F (x) = P [X ≤ x] =∫ x

−∞f(x) ∀x ∈ R.

La funcion de distribucion de una variable aleatoria continua tiene las siguientes propiedades:

1. Es continua y derivable.

2. F (−∞) = 0; F (+∞) = 1.

3. Es no decreciente.

Se extienden tambien las definiciones de media y varianza para el caso de estas variables.

Definicion 7.7. Si X es una variable aleatoria continua que toma los valores en el intervalo(a, b) (a puede ser −∞ y/o b puede ser +∞), se llama media, valor esperado o esperanzamatematica a

µ = E(X) =∫ b

axf(x) dx,

varianza a

σ2 = V AR(X) = E[(X − µ)2] =∫ b

ax2f(x) dx− µ2

y desviacion tıpica, σ, a la raız cuadrada de esta ultima.

7.4.1. La distribucion Normal

El ejemplo mas importante de variable aleatoria continua es la llamada distribucionnormal, llamada ası porque en un tiempo se creyo que describıa el comportamiento “nor-mal”de los fenomenos. En todo caso, describe multitud de fenomenos en biologıa, pedagogıa,psicologıa,.., y esto es ası por varios motivos:

1. En gran numero de situaciones hay una fuerte influencia a eliminar por igual a lo que sedesvıan en analoga medida de la media, sea esta desviacion por arriba o sea por debajo.

2. Se observa que muchos fenomenos son sumas de efectos parciales independientes, queestos efectos parciales pueden estar sesgados, pero que la suma sı se ajusta a una dis-tribucion simetrica que va disminuyendo de forma regular al alejarse de la normal. Porejemplo, en el peso de las personas de una poblacion, influye la componente genetica, elclima, la alimentacion,..; algunas de estas influencias puede no distribuirse normalmente,pero sı lo hace el peso. Este hecho fue justificado matematicamente en un importanteteorema llamado Teorema Central del Lımite, que nos dice que si se suman unnumero grande de variables aleatorias independientes, identicamente distribuidas conmedia y varianza finitas, entonces tras un cambio de variable adecuado, la distribucionde la variable resultante es aproximadamente, la normal.

Page 36: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

7.4. DISTRIBUCIONES CONTINUAS. LA DISTRIBUCION NORMAL Y LA T DE STUDENT93

Definicion 7.8. La funcion de densidad de una variable aleatoria, X, con distribucion Normalde parametros µ y σ, que denotaremos N(µ, σ) es

f(x) =1

σ√

2πe−

12

(x−µσ

)2 −∞ < x < +∞.

El parametro µ es la media y el parametro σ2 es la varianza.

La grafica de f(x) se conoce como campana de Gauss.

Puede observarse que la funcion de densidad f(x) tiene ademas las siguientes propiedades:

1. Es simetrica respecto de la recta x = µ.

2. El maximo esta en x = µ.

3. La funcion tiene dos puntos de inflexion en x = µ− σ y x = µ + σ.

Por lo que se ha dicho antes

P (a ≤ X ≤ b) = F (b)− F (a) =1

σ√

∫ b

ae−

12

(x−µσ

)2 dx,

pero esta integral solo puede aproximarse numericamente.

Page 37: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

94TEMA 7. PROBABILIDAD. VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD

Existe una tabla que contiene los valores de estas integrales, de la que hablamos en laSeccion siguiente, para la normal N(0, 1). Para el caso general de una variable normal X demedia µ y desviacion tıpica σ, se hace el cambio de variable

Z =X − µ

σ,

que es ya una variable normal estandar. Ası

F (x) = P (X ≤ x) = P (σZ + µ ≤ x) = P

(Z ≤ x− µ

σ

),

que se puede obtener mediante la tabla.

Page 38: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

7.4. DISTRIBUCIONES CONTINUAS. LA DISTRIBUCION NORMAL Y LA T DE STUDENT95

Ejercicio: Usando las tablas, obtener:

1. P (Z ≤ 1,43) (Resp. 0’9236),

2. P (Z ≤ −1,34) (Resp. 0’0901),

3. P (1,18 ≤ Z ≤ 1,56) (Resp. 0’0596),

4. P (−1,65 ≤ Z ≤ −1,24) (Resp. 0’058),

5. P (−0,18 ≤ Z ≤ 1,73) (Resp. 0’5287),

Page 39: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

96TEMA 7. PROBABILIDAD. VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD

6. k tal que P (Z ≤ k) = 0,75 (Resp. 0’67)

7. k tal que P (Z ≤ k) = 0,35 (Resp. -0’67),

Es importante hacer notar que muchas distribuciones discretas se aproximan a una Normalcuando n es grande. Ası por ejemplo, una distribucion binomial de probabilidad de exito p seaproxima, cuando n > 30 y 0,1 < p < 0,9, a una distribucion Normal de media np y desviaciontıpica

√np(1− p):

B(n, p) ≈ N(np,√

np(1− p)).

Cuando se hace la aproximacion de una variable discreta binomial, X, por una normal,Y, es necesario dar un sentido a P (X = k), (recordemos que para una variable continua seasume que es cero pero para una discreta no). Se aplica un cambio llamado corrector de mediopunto o correcion de continuidad. Concretamente, P (X = k) = P (k − 0,5 ≤ Y ≤ k + 0,5).Se observa entonces que el histograma de probabilidad de una variable binomial cuando n esgrande y p no esta proximo a 0 ni a 1, es aproximadamente campaniforme, se aproxima a lacurva de Gauss.

Cualesquiera que sean a, b (a < b) en el intervalo (0, n), la aproximacion toma la forma:

P (a ≤ X ≤ b) = P ((a− 0,5)− np√

npq≤ Z ≤ (b + 0,5)− np√

npq)

P (a < X ≤ b) = P ((a + 0,5)− np√

npq≤ Z ≤ (b + 0,5)− np√

npq)

P (a ≤ X < b) = P ((a− 0,5)− np√

npq≤ Z ≤ (b− 0,5)− np√

npq)

P (a < X < b) = P ((a + 0,5)− np√

npq≤ Z ≤ (b− 0,5)− np√

npq)

donde q = 1− p representa la probabilidad de fracaso.

Page 40: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

7.4. DISTRIBUCIONES CONTINUAS. LA DISTRIBUCION NORMAL Y LA T DE STUDENT97

7.4.2. La distribucion t de Student

Existe otro ejemplo importante de variable aleatoria continua que se usara en el temasiguiente. Esta variable aleatoria tiene una funcion de densidad cuya expresion matematicaes complicada y recibe el nombre de distribucion t de Student. 1

Esta distribucion depende de un parametro, n, llamado grados de libertad de la distribu-cion. Su funcion de densidad es simetrica respecto de la recta x = µ, es de forma parecida a lanormal aunque mas aplastada y se acerca a la funcion de densidad de esta cuando n aumenta.Existen tablas de la misma que permite calcular la funcion de distribucion.

Existen tablas de la misma que permite calcular la funcion de distribucion, la siguiente es unejemplo de una tabla.

1Fue descubierta por Gosset (1908), y presenta la curiosidad de que como Gosset trabajaba en la Guiness,empresa que prohibıa a sus empleados la publicacion de artıculos cientıficos a raız de una difusion previa desecretos industriales, publico la nueva distribucion con el seudonimo de Student, marca de la pluma con la quetrabajaba.

Page 41: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

98TEMA 7. PROBABILIDAD. VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD

Page 42: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

7.4. DISTRIBUCIONES CONTINUAS. LA DISTRIBUCION NORMAL Y LA T DE STUDENT99

Ejercicio: Usando las tablas, obtener:

1. Con n = 25, calcula t para que P (−t ≤ T ≤ t) = 0,9 (Resp. 1.7081)

2. Con n = 15, calcula t para que P (T ≤ t) = 0,05 (Resp: -1.7531)

3. Con n = 16, calcula t para que P (T ≤ −t) = 0,05 (Resp: 1.7459)

4. Con n = 9, calcula P (T ≤ 0,25) (Resp: 0.596)

5. Con n = 15, calcula P (T ≥ 2,45) (Resp: 0.014)

6. Con n = 6, calcula P (T ≤ −1,45) (resp: 0.099)

7. Con n = 25, calcula P (0,75 ≤ T ≤ 1,25) (Resp: 0.119)

Page 43: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

100TEMA 7. PROBABILIDAD. VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD

Page 44: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

Tema 8

Teorıa de muestras y diseno deexperimentos

Cuando realizamos un experimento, el conjunto de elementos que es objetivo de nuestrointeres se llama poblacion. Estos elementos pueden ser personas, esparragos, chinchetas,animales, etc. Con la Inferencia Estadıstica se pretende estudiar alguna caracterıstica de lapoblacion ahorrando tiempo y dinero, por lo que se elige una parte de la poblacion, a la quellamamos muestra, sobre la que se realiza el estudio para posteriormente inferir resultadossobre toda la poblacion. El proceso mediante el cual se extrae una muestra de una poblacionde llama muestreo.

Para que el estudio sea fiable, la muestra tendra que ser realmente representativa de lapoblacion. Por ejemplo, ultimamente se utiliza con mucha frecuencia la realizacion de sondeosde opinion llamando por telefono. Esta claro que este tipo de muestreo da mas oportunidadesa aquellas personas que tienen mas de un telefono. Una muestra como esta, obtenida por unprocedimiento que no contempla que todos los individuos de la poblacion tengan la mismaoportunidad de ser elegidos se denomina muestra sesgada. Las conclusiones obtenidas apartir de ella son poco fiables.

8.1. Tipos de muestreo

8.1.1. Muestreo aleatorio simple

En el muestreo aleatorio simple todos los elementos de la poblacion tienen la mismaprobabilidad de ser elegidos para formar parte de la muestra.

Ejemplo: Para realizar una encuesta sobre la intencion de voto en una ciudad se elige, alazar, una muestra formada por 1000 personas.

8.1.2. Muestreo aleatorio estratificado

En el muestreo aleatorio estratificado la poblacion se divide en grupos homogeneosque llamamos estratos, y, posteriormente, se extrae una muestra aleatoria simple de cadaestrato.

101

Page 45: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

102 TEMA 8. TEORIA DE MUESTRAS Y DISENO DE EXPERIMENTOS

Ejemplo: En una ciudad de sabe que el 60 % son mujeres y el 40% hombres. Se quiererealizar una encuesta sobre la intencion de voto escogiendo una muestra de 1000 personas.Para ello, previamente se divide la poblacion en dos estratos: mujeres y hombres, y luego, seextrae de cada estrato una muestra proporcional, es decir, en este caso, 600 mujeres y 400hombres.

8.1.3. Muestreo aleatorio sistematico

En el muestreo aleatorio sistematico se selecciona al azar un elemento de la poblacion,y a partir de el, se seleccionan de k en k los siguientes elementos.

Ejemplo: En una carretera se va a hacer un control de alcoholemia. Se elige al azar alconductor de un vehıculo y se le hace pasar el control, a continuacion, se seleccionan de 50 en50 los siguientes conductores (aquı se ha elegido k = 50).

8.1.4. Muestreo por conglomerados y areas

En el muestreo por conglomerados y areas se divide la poblacion en secciones o con-glomerados. Se eligen luego al azar algunas de estas secciones y se toman todos los elementosde las secciones elegidas para formar la muestra.

Ejemplo: Para realizar una encuesta entre los alcaldes de Espana, se consideran las provin-cias de Espana. Se eligen al azar algunas provincias y la muestra estara formada por todoslos alcaldes de las provincias elegidas (claramente en este ejemplo las secciones son todas lasprovincias de Espana).

En los temas siguientes plantearemos problemas de Inferencia Estadıstica que consistenen obtener informacion de la poblacion observando el comportamiento de muestras obtenidasde ella. Por ello, estudiamos a continuacion el comportamiento de algunos valores estadısticosde la muestra como la proporcion, la media muestral o la diferencia de muestras.

8.2. Distribucion de la proporcion

Consideremos el siguiente ejemplo: los fabricantes de una determinada marca de chinchetasquieren saber cuantas salen defectuosas. Sea p la proporcion de chinchetas buenas, es decir,las que no presentan defectos. Ya que no se conoce p, la idea es aproximar su valor de algunamanera. Para ello, se toma una muestra aleatoria de 100 chinchetas y se observa que 86 de ellasestan bien, al valor 86/100 lo denotamos p1. Si consideramos otra muestra de 100 elementos,obtendremos otro valor p2 y sucesivamente p3, p4, ...... Los distintos valores de pi dan lugar auna variable aleatoria que representamos por P . La distribucion de P se llama distribucionde la proporcion muestral o distribucion en el muestreo de la proporcion. Se puededemostrar que:

Teorema 8.1. Si en una poblacion, la probabilidad de que un individuo muestre una ciertacaracterıstica es p, la variable aleatoria, P , que da la proporcion de individuos que presentandicha caracterıstica en muestras de tamano n, sigue una distribucion binomial de media p

Page 46: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

8.3. DISTRIBUCION EN EL MUESTREO DE LA MEDIA 103

y desviacion tıpica

√p(1− p)

n. Cuando n es “grande”, esta distribucion se aproxima a la

Normal correspondiente, siempre que p no sea proximo ni a 0 ni a 1 (np > 5, n(1− p) > 5),es decir, P sigue una

N

(p,

√p(1− p)

n

).

Este resultado puede justificarse recordando la definicion de variable aleatoria Binomial ysu aproximacion a una Normal. En efecto, por definicion, si X representa el numero de indi-viduos que tienen la caracterıstica mencionada, seguira una B(n, p). Ası pues, la proporcion,P , ha de seguir una distribucion como la de X, dividida por n. Puesto que en una B(n, p)la media es np y la desviacion tıpica es

√np(1− p), la media y desviacion tıpica para P son

respectivamente, p y√

p(1−p)n .

Ejemplo: Se sabe que un nuevo farmaco ha curado al 85 % de los enfermos a los que seles ha aplicado. Calcular la distribucion en el muestreo de la proporcion de enfermos curadospara muestras de tamano 30, 100 y 1000 personas.

La proporcion de enfermos curados es p = 0′85, ası que la media es 0′85. Discutamos elvalor de la desviacion tıpica y la distribucion muestral segun el valor n en cada muestra:

1. n = 30. Entonces σ =√

0′85 0′1530 = 0′065, y la distribucion muestral sigue la ley

N(0′85, 0′065).

2. n = 100. En este caso, σ = 0′036, y la distribucion muestral sigue la ley N(0′85, 0′036).

3. n = 100. En este caso, σ = 0′011, y la distribucion muestral sigue la ley N(0′85, 0′011).

8.3. Distribucion en el muestreo de la media

Consideremos el siguiente ejemplo: los fabricantes de envasado de esparragos desean saberla longitud media de los esparragos. La longitud media la representaremos por µ y por σ ladesviacion tıpica. Elegimos una muestra aleatoria formada por 40 esparragos, y se obtieneque:

La longitud media muestral es x1 = 17′3 cm,

La desviacion tıpica muestral es s1 = 0′8 cm.

Si elegimos otras muestras de tamano 40 y calculamos sus medias y desviaciones tıpicas,obtendremos: x2, x3, · · · y s2, s3, · · ·.

Los distintos valores de xi dan lugar a una variable aleatoria que representamos por X.La distribucion de X se llama distribucion de las medias muestrales o distribucion enel muestreo de la media. Para estudiar su comportamiento damos el Teorema Centraldel Lımite:

Page 47: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

104 TEMA 8. TEORIA DE MUESTRAS Y DISENO DE EXPERIMENTOS

Teorema 8.2. Dada una poblacion de media µ y desviacion tıpica σ (cualquiera que seasu distribucion), la distribucion de las medias de las muestras de tamano n, tiene la mismamedia que la poblacion, µ, su desviacion tıpica es σ√

ny cuando n es “grande”, es practicamente

Normal

Tambien cuando la distribucion de partida es normal, la distribucion de las medias esnormal. Es decir, las medias muestrales siguen una distribucion Normal, N(µ, σ√

n), si:

O bien, la poblacion de partida es Normal, cualquiera que sea el tamano de las muestra,n.

O bien, n es mayor que 30, cualquiera que sea la distribucion de partida.

El termino “grande” es relativo y puede depender de la poblacion considerada pero es bastantecomun tomarlo como mayor que 30.

Cuando se desconoce la desviacion tıpica poblacional, es util el siguiente resultado que seobtiene a partir del Teorema de Fisher y de la definicion de la distribucion t-Student:

Teorema 8.3. Si X se distribuye normalmente, la variable aleatoria

T =X − µ

s/√

n

sigue una distribucion t de Student de n− 1 grados de libertad donde s es la cuasidesviaciontıpica muestral

s =

√∑ni=1(xi − x)2

n− 1= s

√n

n− 1,

siendo x y s la media y la desviacion tıpica muestral, respectivamente.

Ejemplo: Se supone que la distribucion de la temperatura del cuerpo humano tiene demedia µ = 37 grados y de desviacion tıpica σ = 0′85 grados. Se elige una muestra de 105personas. Hallar las siguientes probabilidades:

1. Que la media muestral sea inferior o igual a 36′9.

2. Que la media muestral este comprendida entre 36′5 y 37′5.

En este caso, la distribucion de la media muestral es

N

(µ,

σ√n

)= N

(37,

0′85√105

)= N(37, 0′083).

Entonces, recordando que denotamos como Z a la variable aleatoria que sigue un distribu-cion N(0, 1),

1.

P (X ≤ 36′9) = P

(Z ≤ 36′9− 37

0′083

)= P (Z ≤ −1′2) = 1−P (Z ≤ 1′2) = 1−0′8849 = 0′115.

Page 48: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

8.4. DISTRIBUCION EN EL MUESTREO DE LA DIFERENCIA DE MEDIAS 105

2.

P (36′5 ≤ X ≤ 37′5) = P (36′5− 36′9

0′083≤ Z ≤ 37′5− 36′9

0′083) = P (−4′82 ≤ Z ≤ 7′23) = 1.

Ejemplo: El cociente intelectual (CI) de unos universitarios se distribuye normalmentecon media 100 y desviacion tıpica 11.

1. Se elige una persona al azar. Hallar la probabilidad de que su CI este entre 100 y 103.

2. Se elige al azar una muestra de 25 de los universitarios. Encontrar la probabilidad deque la media de sus CI este entre 100 y 103.

1. La distribucion de partida es N(100, 11).

P (100 ≤ X ≤ 103) = P

(100− 100

11≤ Z ≤ 103− 100

11

)= P (0 ≤ Z ≤ 0′27) = 0′1064.

2. La distribucion de la media muestral, como procede de una poblacion de partida Normal,es Normal cualquiera que sea el valor de n.

Los parametros de esta distribucion son:

µ = 100,σ√n

=11√25

= 2′2.

Por tanto, X ∈ N(100, 2′2), y entonces,

P (100 ≤ X ≤ 103) = P (100− 100

2′2≤ Z ≤ 103− 100

2′2) = P (0 ≤ Z ≤ 1′36) = 0′4131.

8.4. Distribucion en el muestreo de la diferencia de medias

Consideremos el siguiente ejemplo: supongamos que los esparragos de La Rioja tienende media µ1 y desviacion tıpica σ1, y que los esparragos de Aranjuez tienen de media µ2 ydesviacion tıpica σ2.

Tomamos una muestra de tamano n1 de esparragos de La Rioja y una muestra de tamanon2 de esparragos de Aranjuez. Sean x1 y x2 sus longitudes medias respectivas.

Si elegimos otras muestras de tamanos n1 y n2 respectivamente, y calculamos sus mediasy las diferencias de las medias, obtenemos:

x′1 − x′2, x′′1 − x′′2, x′′′1 − x′′′2 , · · ·Estos valores dan lugar a una variable aleatoria que representaremos por X1 − X2. La

distribucion de X1 − X2 se llama distribucion en el muestreo de la diferencia de lasmedias. Se puede demostrar que:

Page 49: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

106 TEMA 8. TEORIA DE MUESTRAS Y DISENO DE EXPERIMENTOS

Teorema 8.4. La variable aleatoria X1−X2 tiene media µ1−µ2, desviacion tıpica

√σ2

1

n1+

σ22

n2,

y cuando n1 y n2 son grandes se aproxima a la Normal correspondiente. Tambien se aproximaa la Normal si las poblaciones son Normales, independientemente del tamano de las mismas.

Ası,

X1 − X2 ∈ N

µ1 − µ2,

√σ2

1

n1+

σ22

n2

.

Ejemplo: Supongamos que los salarios de dos poblaciones, una de hombres y otra demujeres, siguen una distribucion Normal N(914, 42) y N(883, 30) respectivamente. Escojamosal azar una muestra de 40 hombres y una muestra de 30 mujeres. ¿Cual es la probabilidad deque la diferencia de los sueldos medios sea mayor que 36 euros?

X1 − X2 sigue una distribucion

N

(914− 883,

√422

40+

302

30

)= N(31, 8′61).

Por tanto, tipificando la variable,

P (X1 − X2 > 36) = P (Z1 − Z2 >36− 31

8′61) = P (Z1 − Z2 > 0′58) = 1− P (Z1 − Z2 ≤ 0′58) =

= 1− 0′719 = 0′281.

Cuando se desconoce el valor de la desviacion tıpica de las poblaciones es necesario testarsi estas son iguales o no y dependiendo de ello, se elige la variable aleatoria, T , para tomardecisiones sobre la diferencia de medias.

Teorema 8.5. Sean s1 y s2 las cuasidesviaciones tıpicas muestrales respectivas para las vari-ables aleatorias X1 y X2, de distribucion normal y medias poblacionales µ1 y µ2, respectiva-mente.

Si se asume que las varianzas poblacionales son iguales, se define la cuasivarianza con-junta como

s2p =

(n1 − 1)s21 + (n2 − 1)s2

2

n1 + n2 − 2,

entonces la variable

T =(X1 − X2)− (µ1 − µ2)√

s2p(

1n1

+ 1n2

)

sigue una t-Student de n1 + n2 − 2 grados de libertad.

Si se asume que las varianzas poblacionales no son iguales, entonces la variable

T =(X1 − X2)− (µ1 − µ2)√

s21

n1+ s2

2n2

Page 50: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

8.5. ENSAYOS CLINICOS 107

sigue una t-Student de γ grados de libertad donde

γ =

(s21

n1+ s2

2n2

)2

s21n1

2

n1−1 +

s22n2

2

n2−1

.

8.5. Ensayos clınicos

El objetivo que persigue un ensayo clınico es planificar las experiencias de modo que,de ocurrir la significacion, ella solo pueda deberse al tratamiento aplicado a cada grupo deindividuos y no a cualquier otra caracterıstica no controlada. Esto conlleva que los grupos deindividuos que forman parte de las dos muestras han de ser comparables en todo lo relevanteexcepto en el tratamiento aplicado a cada uno de ellos.

La palabra tratamiento debe ser entendida en sentido amplio.Ejemplo: Si se compara un grupo de madres gestantes con otro de madres no gestantes,

la gestacion sera considerada un tratamiento.

8.5.1. El grupo de control.

Son frecuentes ciertos razonamientos tendentes a probar la importancia de un determina-do agente respecto a una cierta enfermedad o accidente. Por ejemplo, puede afirmarse queel alcohol predispone a un accidente de automovil, puesto que el 10 % de los conductoresaccidentados habıan consumido alcohol. Esta afirmacion es cierta, pero no por la razon quese esgrime: resulta evidente que los conductores accidentados habran tomado leche en el de-sayuno, tendran hermanos o llevaran dinero en el bolsillo y, sin embargo, nadie senala talesvariables como responsables del accidente. Lo que llevara a ratificar la conclusion inicial sera lacomparacion de los porcentajes de los individuos que han tomado bebidas alcoholicas en ungrupo de accidentados y en otro de no accidentados.

Se hace, por tanto, necesaria la existencia de un grupo de control de individuos que,tomados de la poblacion general que no sufre accidentes, permita la comparacion de dichosporcentajes.

De modo general, la investigacion medica es, por naturaleza, comparativa. El problemade estudio debe implicar al menos dos grupos: un grupo de pacientes tratados con ciertotratamiento (por ejemplo, tener un accidente) ha de ser comparado con otro grupo de pacientesno tratados llamado grupo de control (los que no tienen accidente). Eventualmente, puedehaber ademas uno o mas grupos de pacientes tratados con otro/s tratamiento/s (nuevo oestandar).

8.5.2. Concepto de ensayo clınico.

Segun Meinert (1986): “Un ensayo clınico es un diseno experimentalmente planificadopara verificar la eficacia de un tratamiento en humanos a traves de la comparacion de losresultados obtenidos en dos grupos de pacientes que reciben uno el tratamiento problemay el otro un tratamiento alternativo (nuevo o clasico) o ningun tratamiento, ambos grupos

Page 51: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

108 TEMA 8. TEORIA DE MUESTRAS Y DISENO DE EXPERIMENTOS

tomados, tratados y seguidos durante igual periodo de tiempo y obtenidos por la particion alazar en dos grupos de un grupo inicial unico”. El segundo grupo es el grupo de control.

Las caracterısticas que en la definicion aparecen sobre un ensayo clınico son las siguientes:

se realizan con humanos (no con animales),

ambos grupos son seguidos durante igual periodo de tiempo (si el grupo de control constade individuos diagnosticados y tratados con anterioridad al estudio actual (controleshistoricos) no son validos),

particion al azar del grupo unico en los dos grupos, lo que implica que el tratamientoha de estar controlado (a cada individuo de la muestra inicial se le debe poder asignarun tratamiento u otro a voluntad del investigador).

8.5.3. Control del sesgo

En un ensayo clınico los dos grupos deben ser comparables en todas sus caracterısticas ex-cepto en el tratamiento recibido. Por lo complejo del ser humano, esto no es facil de conseguir.Las diferencias observadas entre los dos grupos pueden deberse a las siguientes razones:

a) azar en la toma de muestras: lo controla la estadıstica,

b) diferencias entre los individuos distintas del tratamiento y previas a su aplicacion: locontrola el diseno de ensayo,

c) diferencias en la evaluacion y manipulacion de los grupos: lo controla el tipo de ensayo,

d) diferencias en los efectos de los dos tratamientos: es el objetivo del ensayo.

Control del sesgo ocurrido por la aplicacion de los tratamientos: tipos de ensayosclınicos.

Para evitar que las diferencias obtenidas en el tratamiento se deban al “rito” y no altratamiento en sı, a ambos grupos se le deben aplicar las mismas tecnicas fısicas. En estecaso, el grupo de control pasa a llamarse grupo placebo, por aplicarse un tratamientoplacebo (ficticio). Esta tecnica debe complementarse con la tecnica de simple ciego en laque el paciente no sabe si recibe el tratamiento efectivo o el placebo. Tambien se puede usar latecnica de doble ciego, en la que ni el paciente ni el investigador conocen que enfermos sontratados con uno u otro tratamiento. Existe tambien la tecnica de triple ciego (en la que niel paciente, ni el investigador, ni el comite que monitoriza el estudio conocen el tratamiento),pero es bastante complicada de aplicar.

Senalar tambien que, para evitar que la significacion sea debida a distinta pericia en laaplicacion de los tratamiento, los dos tratamientos han de ser aplicados por el mismo equipoy con un similar entrenamiento en ambos.

De ese modo, podemos distinguir los siguientes tipos de ensayo:

a) con grupo control

Page 52: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

8.5. ENSAYOS CLINICOS 109

b) con grupo placebo

c) tecnica de simple ciego

d) tecnica de doble ciego

e) tecnica de triple ciego

Control del sesgo ocurrido por la seleccion de los individuos: seleccion de lasmuestras.

En los estudios clınicos,

a) el ensayo ha de ser experimental o controlado (el investigador decide acerca deque tratamiento debe recibir cada paciente), evitando los estudios observacionales (elinvestigador no tiene control sobre el tratamiento a aplicar, por ejemplo, cuando unospacientes se prestan a ser grupo de tratamiento o grupo de control dependiendo de susmiedos, antecedentes medicos, experiencias, etc.),

b) el ensayo ha de ser concurrente, es decir, realizado en el mismo periodo de tiempo.Los controles historicos presentan problemas ya que la enfermedad varıa con el tiem-po (especialmente las infecciosas) y los criterios de seleccion de los pacientes tambien(evolucion de las tecnicas de diagnostico, tratamientos mas especializados,...).

c) el ensayo ha de ser aleatorizado, es decir, la asignacion del tratamiento se hace por unmecanismo de sorteo. En cualquier caso, debe incluirse la ficha tecnica de las muestrasutilizadas, incluyendo toda la informacion pertinente sobre la distribucion en cada mues-tra de todos los posibles factores de riesgo, especialmente la edad y el sexo. Convienesenalar que la asignacion aleatoria (proceso mediante el cual se asignan individuos alos grupos que son sometidos a tratamiento en un determinado ensayo) es diferente dela seleccion aleatoria (proceso mediante el cual se se selecciona al azar una muestrade individuos a partir de una poblacion). Los ensayos clınicos rara vez imponen unaseleccion al azar, ya que lo que hace el investigador es aceptar los pacientes disponiblespara el estudio (siempre y cuando cumplan los requisitos de inclusion en el mismo).

8.5.4. Disenos de un ensayo clınico

Tan importante como un adecuado tratamiento es una correcta planificacion de laexperiencia a realizar. Existen varios modos de planificar un ensayo clınico (tambien validospara el diseno de experimentos en general):

a) en muestras independientes (cada individuo recibe un unico tratamiento) o apareadas(cada individuo recibe los dos tratamientos).

b) disenos cruzados (en muestras apareadas): la mitad de los individuos reciben lostratamientos en un orden y la otra mitad en el orden contrario.

Page 53: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

110 TEMA 8. TEORIA DE MUESTRAS Y DISENO DE EXPERIMENTOS

c) disenos estratificados: es un metodo a medio camino entre las muestras independi-entes y las apareadas. Se aparea parcialmente en base a una estratificacion de uno omas factores de riesgo (edad, sexo, etc.).

Por ejemplo: Cuando la variable es cualitativa (sexo), hay dos estratos (varon y hem-bra). Cuando la variable es cuantitativa (edad) los estratos se consiguen por una agru-pacion por clases (jovenes, adultos, ancianos,...)

d) disenos factoriales: los individuos reciben combinaciones de tratamientos (puedenrecibir los dos tratamientos, uno o ninguno).

e) disenos secuenciales: los individuos van entrando uno a uno en la experiencia y concada entrada se realiza un test para decidir si se toma una decision o un nuevo individuo.Los disenos no secuenciales saben de antemano el tamano del ensayo o se van incluyendoalternativamente individuos en el ensayo hasta que alguna circunstancia ajena a laefectividad de los tratamientos en los individuos ya tratados le aconseja detenerlo (coste,tiempo,..).

8.5.5. Metodos de asignacion aleatoria del tratamiento

La aleatorizacion debe realizarse con una tabla de numeros aleatorios. Si p es la probabili-dad de asignar el tratamiento A a un individuo (B es el otro tratamiento), el proceso consisteen tomar un grupo de numeros de la tabla, convertirlos en decimales y asignar A si el numeroresultante es menor o igual que p (si la muestra es apareada, es que el individuo empiezarecibiendo el tratamiento A).

Consideramos n1 la cantidad de individuos que reciben el tratamiento A y n2 la cantidadde individuos que reciben el tratamiento B, con N = n1 + n2. La aleatorizacion puede ser:

a) con asignacion igual (n1 = n2) o desigual (n1 6= n2), siendo r = n1/N la razon deasignacion.

b) con asignacion fija (no adaptativa) o adaptativa: segun la probabilidad p seaconstante o no a lo largo del proceso de asignacion.

c) con asignacion adaptativa (antes de la aplicacion del tratamiento) o a larespuesta: segun p varıe en funcion de factores medidos antes o despues de la aplicaciondel tratamiento.

d) estratificada o no estratificada: segun el tipo de diseno de base.

8.5.6. Otros conceptos relacionados con el ensayo clınico

El ensayo clınico ideal.

Es aquel que es aleatorizado a doble ciego con diseno cruzado.

Page 54: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

8.5. ENSAYOS CLINICOS 111

Medida de la respuesta

Para determinar la eficacia relativa de los tratamientos a comparar es crucial decidirque tipo de resultado va a medirse. La medida de la respuesta al tratamiento puede ser unsuceso clınico (curacion, muerte, mejorıa manifiesta,...) o una medida indirecta (resultadonumerico de un test psicologico, cambio en la presion sanguınea, nivel de lıpidos en suero,...),y debe tener las siguientes caracterısticas deseables:

ser facil de diagnosticar,

estar libre de errores de medida,

poder ser observada con independencia del tratamiento,

tener relevancia clınica,

ser elegida antes de comenzar la recoleccion de datos.

Tamano de la muestra

Depende del diseno estadıstico utilizado, del tipo de respuesta medida (cualitativa o cuanti-tativa), de la distribucion estadıstica de la respuesta, de si se desea probar que los tratamientosson distintos o si son iguales, de la razon de asignacion, de si el test es de una cola o de dos, delerror α del test, de la mınima diferencia δ importante que se desea detectar entre los valoresde los parametros que son objeto de test en las dos poblaciones,...

Duracion del ensayo

Depende del tiempo requerido hasta observar la respuesta, del tamano de las muestras ydel numero de centros participantes.

Etica de los ensayos clınicos

Son eticamente admisibles por ser el unico mecanismo cientıfico valido para probar laeficacia de un tratamiento. Requieren del consentimiento informativo del paciente.

Los ensayos clınicos en la legislacion espanola.

La legislacion espanola (BOE del 13/05/1993) entiende por tal a toda evaluacion experi-mental de una sustancia o medicamento en el ser humano. Los divide en cuatro tipo (segunsus objetivos):

De Fase I: estudios, generalmente en individuos sanos, para evaluar preliminarmente elefecto, seguridad y dosificacion del producto.

Page 55: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

112 TEMA 8. TEORIA DE MUESTRAS Y DISENO DE EXPERIMENTOS

De Fase II: estudios en enfermos para evaluar la eficacia del producto y ampliar lainformacion sobre su seguridad y dosificacion.

De Fase III: estudios, en un grupo representativo de enfermos, para evaluar la eficacia yseguridad del tratamiento frente a otros alternativos y en condiciones de uso habituales.

De Fase IV: estudios con medicamentos ya comercializados para valorar nuevos aspectosde los mismos.

Page 56: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

Tema 9

Inferencia estadıstica

9.1. La inferencia Estadıstica

Para estudiar una determinada caracterıstica de una poblacion serıa necesario sondeara todos y cada uno de sus individuos. Evidentemente, en algunos casos esto es imposible,no obstante, se intenta dar respuestas aproximadas sin hacer un estudio exhaustivo de lapoblacion. Una forma de hacerlo es extraer una muestra aleatoria que nos permita inferirque va a ocurrir, es decir, inferir informacion sobre la poblacion basandonos en la informacioncontenida en una muestra.

La inferencia estadıstica es el conjunto de metodos que permiten obtener una conclusionacerca de una poblacion a traves de la informacion proporcionada por una muestra. Veamoslos tres tipos de problemas que podemos encontrar a la hora de relacionar informacion sobreuna muestra y la poblacion de la que se procede:

1. Se conoce la poblacion y a partir de ella se deduce el comportamiento de las muestras.Este es el tipo de problemas que hemos resuelto en el tema anterior y resulta menosinteresante que los dos siguientes.

2. Se conoce una muestra y a partir de ella se pretende deducir el comportamiento dealguno de los parametros de la poblacion. Se trata de un problema de estimacion. Unaprimera idea es considerar que el parametro desconocido de la poblacion, por ejemplo,la media poblacional, tiene un valor parecido a alguno dado por la muestra, en nuestroejemplo, la media muestral (estimacion puntual). Sin embargo, esta estimacion es pocoutil si se desconoce el grado de aproximacion que hay entre ellas, por esta razon, esmas habitual hacer la estimacion por intervalos; se considera un intervalo, llamadointervalo de confianza, construido con informacion dada por la muestra, dentro delcual confiamos que este el parametro poblacional desconocido (en nuestro ejemplo, lamedia poblacional), considerando la probabilidad de que tal cosa ocurra. Este tipo deestudio es el que haremos en el presente tema.

3. Se tiene una hipotesis sobre el valor del parametro pero no se tienen garantıas de quesea cierta. Para contrastarlo, se extrae una muestra y a partir de ella debemos deducir

113

Page 57: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

114 TEMA 9. INFERENCIA ESTADISTICA

si la hipotesis es o no admisible. Este es un problema de decision o de contraste dehipotesis y sera objeto de estudio en el tema siguiente.

9.2. Estimacion puntual: parametro y estadıstico

Distinguimos entre poblacion (conjunto de todos y cada uno de los individuos) y muestra(conjunto formado por algunos individuos elegidos de forma “aleatoria”). Se pretende estudiaruna caracterıstica de la poblacion a traves de una caracterıstica de la muestra. El valornumerico que describe una caracterıstica de la poblacion se denomina parametro.

Dada una poblacion, mediante una variable aleatoria, X, y una muestra de tamano n,es decir, una sucesion de variables aleatorias, X1, X2,...,Xn , replicas de X; se entiende porestadıstico, cualquier variable aleatoria que se defina a partir de las n variables que integrandicha muestra y como tal, tendra su correspondiente distribucion de probabilidad. Cuandoel estadıstico se va a utilizar para estimar un parametro desconocido poblacional, se llamaestimador puntual del parametro. Una estimacion puntual es el valor numerico que tomael estimador para una muestra determinada.

Ejemplo: Cuando n es muy grande, se toma como estimador de la media poblacional,µ, la media muestral X, y de la varianza poblacional, σ2, la cuasivarianza muestral, S2. Siextraemos una muestra y hallamos su media aritmetica, esta sera una estimacion puntual dela media poblacional.

Citaremos dos propiedades deseables que pueden poseer o no los estimadores:

El estimador se llama insesgado cuando su media coincide con el valor del parametroque se va a estimar y se llama sesgado en caso contrario.

El estimador se dice que es tanto mas eficiente cuanto menor sea su varianza.

En el ejemplo anterior, ambos estimadores son insesgados y eficientes.

9.3. Estimacion por intervalos

Supongamos que un paciente acude a tres analistas diferentes para efectuarse el mismoanalisis y estos le informan de que los valores obtenidos para una cierta sustancia son, respec-tivamente, A1=85 mg/dl, A2=75 mg/dl y A3=90 mg/dl. El paciente podrıa desconfiar deestos valores por la diversidad de los resultados obtenidos; a simple vista parecerıan bastantediferentes. Sin embargo, si los resultados se hubiesen dado en la forma: A1 (85 ± 15) mg/dl;A2 (75 ± 4) mg/dl y A3 (90 ± 20) mg/dl, se entiende que A1 se encuentra entre 70 y 100,A2 se encuetra entre 71 y 79 y A3 se encuetra entre 70 y 110. Hay una zona comun entre lostres intervalos, cosa imposible de obtener mediante estimadores puntuales.

En la practica, la industria farmaceutica, suele trabajar con lımites superiores e inferioresen las composiciones quımicas de los medicamentos, tanto para el proceso productivo, comopara su posterior control de calidad. La idea es siempre informar o establecer la probabilidadde que el verdadero valor caiga dentro del intervalo dado. Por tanto, la forma mas prudentede informar es utilizando intervalos.

Describimos entonces los siguientes conceptos asociados a la estimacion por intevalos:

Page 58: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

9.3. ESTIMACION POR INTERVALOS 115

1. Intervalo de confianza: intervalo que contiene el valor del parametro con una ciertaprobabilidad.

2. Nivel de confianza o coeficiente de confianza: se denota por 1 − α y se suele dar en%.Es la probabilidad de que el valor del parametro este dentro del intervalo de confianza.

3. Valores crıticos: Son valores de la abscisa, zα o zα/2, que se buscan en tablas y sirvenpara obtener el intervalo.

El tipo de intervalo que se quiere determinar depende de la situacion en concreto quequeramos resolver:

Si la variable X representa el nivel de glucosa en sangre, lo que nos interesa es conocer unlımite superior del parametro que nos permita decidir si un individuo es o no diabetico,es decir, en este caso buscamos un intervalo no acotado de la forma (−∞, b).

Si lo que se considera es el numero de espermatozoides por mm3, interesa buscar unlımite inferior por debajo del cual el individuo sera considerado esteril, es decir, elintervalo es no acotado y se escribe (a,+∞).

Si estamos considerando la concentracion de potasio en plasma, es vital conocer tanto ellımite inferior como uno superior fuera de los cuales el individuo corre peligro. Aquı elintervalo es del tipo (a, b) para a y b finitos.

En los dos primeros casos se llaman intervalos de un cola y el punto crıtico correspondiente lodenotaremos como zα y en el tercer caso se denomina intervalo de dos colas y el punto crıticose denota como zα/2. Supongamos, por ejemplo, que Z sigue una N(0, 1). Para obtener unpunto crıtico, dada una probabilidad 1− α, se halla respectivamente,

zα tal que P (Z < zα) = 1− α. Observese que P (Z < zα) = P (−zα < Z) = 1− α.

zα/2 tal que P (−zα/2 < Z < zα/2) = 1− α. En este caso, como

1− α = P (−zα/2 < Z < zα/2) = P (Z < zα/2)− P (Z < −zα/2)= P (Z < zα/2)− P (Z > zα/2) = 2P (Z < zα/2)− 1,

lo que se ha de buscar en las tablas es un valor zα/2 que cumpla que P (Z < zα/2) =1− α/2.

Page 59: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

116 TEMA 9. INFERENCIA ESTADISTICA

En la siguiente tabla presentamos los valores crıticos, zα o zα/2, para los porcentajes mashabituales en el caso de una y dos colas.

N. de confianza Pto. crıtico una cola Pto. crıtico dos colas1− α zα zα/2

99’95% 3’29 3’8999’90% 3’09 3’2999’50% 2’58 3’0999’00% 2’33 2’5897’50% 1’96 2’3395’00% 1’65 1’96

9.4. Intervalo de confianza para una proporcion

Se desea estimar la proporcion, p, de individuos de una poblacion que presentan unadeterminada caracterıstica. Para ello, se recurre a una muestra de tamano n, en la que encon-tramos una proporcion muestral p igual al numero de elementos que presenta la caracterısticadividido por n. Sabemos que la variable aleatoria P , que da la proporcion de individuos quepresentan dicha caracterıstica en muestras de tamano n, (siendo np > 5 y n(1−p) > 5), sigue

una distribucion N

(p,

√p(1− p)

n

), por tanto, el intervalo de confianza de dos colas para el

parametro p, con un nivel de confianza 1− α, viene dado por

IC =

(p− zα/2

√p(1− p)

n, p + zα/2

√p(1− p)

n

)

donde zα/2 se busca en la tabla de la normal para una probabilidad 1− α/2.

Ejercicio: Se desea hacer un estudio de mercado sobre el nivel de aceptacion de un tipode desodorante. Para ello se toma una muestra aleatoria de 60 personas de las cuales 45

Page 60: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

9.5. INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL 117

son asiduas usuarias del mismo. Hallar un intervalo de confianza al nivel del 99 % para laproporcion de usuarios del citado.

9.5. Intervalo de confianza para la media poblacional

Se pretende aproximar un parametro desconocido de la poblacion, la media µ, conociendola media de una muestra, x, de tamano n. El modo de proceder es el siguiente: Dado 1− α,hallamos un intervalo de confianza, IC, que depende de n, x y σ o s tal que P (µ ∈ IC) = 1−α.Dado un IC determinado, µ puede estar en el o no. Concretamente, lo que podemos afirmares que el 1 − α por ciento de los intervalos que se pueden considerar, contienen a µ, por esarazon se habla de nivel de confianza y no de probabilidad. El IC puede ser de una o dos colas.

Ejemplo: Supongamos que X ∈ N(µ, σ) y σ es conocida. Queremos hallar el intervalode confianza de dos colas para la media, µ. Sabemos que X ∈ N(µ, σ/

√n) y por tanto que

Z =X − µ

σ/√

n∈ N(0, 1). Dado 1−α, se busca el punto crıtico zα/2 tal que P (Z < zα/2) = 1−α/2

en la tabla de la N(0, 1). Ası, para el valor z =x− µ

σ/√

nde Z obtenido a partir de x, tenemos

que

1−α = P (−zα/2 < z < zα/2) = P (−x−zα/2σ√n

< −µ < −x+zα/2σ√n

) = P (x−zα/2σ√n

< µ < x+zα/2σ√n

).

Por tanto, tenemos un nivel de confianza de 1− α de que

µ ∈ (x− zα/2σ√n

, x + zα/2σ√n

).

De modo analogo se pueden deducir los demas casos posibles que vemos a continuacion, portanto,

1. Si la poblacion de partida sigue una distribucion normal N(µ, σ) sabemos que X es una

variable aleatoria que sigue una N

(µ,

σ√n

).

a) Caso en el que se conoce la varianza σ2:

IC =(

x− zα/2σ√n

, x + zα/2σ√n

),

donde zα/2 se busca en la tabla de la normal tal que P (Z < zα/2) = 1− α/2.b) Caso en el que no se conoce la varianza:

IC =(

x− tα/2s√n

, x + tα/2s√n

),

donde tα/2 se busca en la tabla de la t-Student de n− 1 grados de libertad tal queP (T < tα/2) = 1− α/2 y s es la cuasidesviacion tıpica muestral. Recordemos que

s2 = s2 n

n− 1,

siendo s la desviacion tıpica de la muestra.

Page 61: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

118 TEMA 9. INFERENCIA ESTADISTICA

2. Supongamos que X es un distribucion de media µ y desviacion tıpica σ y que la n esgrande, n > 30. Entonces, los intervalos de confianza son los mismos que antes:

a) Se conoce la varianza, σ2:

IC =(

x− zα/2σ√n

, x + zα/2σ√n

)

b) Se desconoce la varianza:

IC =(

x− tα/2s√n

, x + tα/2s√n

),

pero en este caso, cuando n es grande, lo que hacemos es una aproximacion al compor-tamiento de una normal, por ello, la probabilidad de que la media poblacional este enel intervalo es solo aproximadamente (no exactamente, como antes) igual a 1− α.

Ejemplo: Se toma una muestra de sangre de tamano 50 y determina la creatinina. Conlos valores medidos se obtiene un promedio de 10 mg/dl y se conoce que la desviacion tıpicapoblacional es de 2’2 mg/dl. Obtener un intervalo de confianza al 95 % para el valor medioreal.

En este caso podemos decir que la variable aleatoria correspondiente a la media sigue unadistribucion Normal de media 10 y desviacion 2′2/

√50. Por tanto el intervalo de confianza es

(10− zα/2

2′2√50

, 10 + zα/22′2√50

)= (9′39, 10′60)

En la figura 27, vemos el intervalo de confianza que hemos calculado.

Figura 27: Intervalo de confianza.

Ejercicio: Comprobar que los intervalos de confianza de una cola cuando la variable Xes normal y se conoce la varianza poblacional son los siguientes:

IC =(−∞, x + zα

σ√n

), IC =

(x− zα

σ√n

, +∞)

para zα tal que P (Z < zα) = 1− α.

Page 62: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

9.6. INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS 119

9.6. Intervalo de confianza para la diferencia de medias

Supongamos que tenemos dos poblaciones que siguen N(µ1, σ1) y N(µ2, σ2), respectiva-mente. De cada una de ellas, elegimos una muestra de tamano n1 y n2 respectivamente, y demedias x1 y x2 respectivamente. El intervalo de confianza de dos colas para µ1 − µ2 con unnivel de confianza 1− α viene dado del modo siguiente:

1. Si se conocen las varianzas poblacionales, σ21 y σ2

2, entonces,

IC =

x1 − x2 − zα/2

√σ2

1

n1+

σ22

n2, x1 − x2 + zα/2

√σ2

1

n1+

σ22

n2

donde zα/2 se busca en la tabla de la normal para una probabilidad 1− α/2.

2. Si no se conocen las varianzas de las dos poblaciones, pero pueden suponerse iguales,entonces,

IC =

(x1 − x2 − tα/2

√s2p

(1n1

+1n2

), x1 − x2 + tα/2

√s2p

(1n1

+1n2

)), (9.1)

siendo s21 y s2

2 las cuasivarianzas de cada muestra,

s2p =

(n1 − 1)s21 + (n2 − 1)s2

2

n1 + n2 − 2

la cuasivarianza conjunta y tα/2 tal que P (T < tα/2) = 1 − α/2 en una tabla de lat-Student con n1 + n2 − 2 grados de libertad.

3. Si no se conocen las varianzas poblacionales, y no pueden suponerse iguales. En estecaso,

IC =

x1 − x2 − tα/2

√s21

n1+

s22

n2, x1 − x2 + tα/2

√s21

n1+

s22

n2

,

donde tα/2 se obtiene como antes para

γ =

( s21

n1+

s22

n2

)2

1n1 − 1

( s21

n1

)2+

1n2 − 1

( s22

n2

)2

grados de libertad.

Ejercicio: Se tomo una muestra aleatoria de la presion sistolica de 200 ninos cuyos padresson hipertensos, obteniendose una media de 107 mmHg y una desviacion tıpica de 7 mmHg.Luego se tomo una muestra de 100 ninos cuyos padres tiene la presion sanguınea normal, y seobtuvo una media de 98 mmHg con una desviacion tıpica de 6 mmHg. Obtener el intervalode confianza al 95 % a la diferencia de medias.

Page 63: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

120 TEMA 9. INFERENCIA ESTADISTICA

9.7. Relacion entre error admisible, tamano de la muestra ynivel de confianza

Consideramos, por ejemplo, el siguiente intervalo de confianza para la media µ:

IC =(

x− zα/2σ√n

, x + zα/2σ√n

).

Sabemos que el (1−α) · 100% de las muestras cumplen que |x−µ| < zα/2σ√n

. Denominamos

error maximo admisible aE = zα/2

σ√n

.

E depende de n y de 1 − α. Para disminuir el error se puede, o bien aumentar n, o biendisminuir 1−α. Concretamente, para obtener un error E, con 1−α dado, el tamano mınimode la muestra deber ser:

n =(zα/2 σ

E

)2

y para tener E con n dado, se determina zα/2 =E√

n

σ, se busca en las tablas P (Z < zα/2) y

se tomaα = 2(1− P (Z < zα/2)).

Page 64: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

Tema 10

Contraste de hipotesis

10.1. Contraste de hipotesis

Un problema que se presenta frecuentemente en la investigacion cientıfica es el de tenerque decidir a partir de los datos aportados por un experimento sobre la validez o no deun planteamiento previamente establecido. Para ello, el investigador necesita establecer unpostulado llamado hipotesis nula, denotada por H0, que deseamos contrastar. Ante estepostulado inicial, plantea otro alternativo, la hipotesis alternativa, denotada por H1, yrealiza una prueba o experiencia con una muestra representativa de la poblacion. La hipotesisnula se rechaza a menos que los datos indiquen lo contrario, en tal caso, se asume en su lugarla hipotesis alternativa. Por muy poderosa que sean las razones que le inclinen en uno u otrosentido, el investigador debe tener siempre claro que, a no ser que examine toda la poblacion,no hay certeza de que su decision sea correcta, puesto que siempre se trabaja con un margende error.

Los elementos que tiene un contraste de hipotesis son los siguientes:

1. El nivel de significacion del contraste. Es un numero, α, que se elige a voluntad delinvestigador para construir el contraste de tal modo que la probabilidad de cometer elerror de rechazar H0 cuando en realidad es cierta, no sea superior a α. Debe fijarse antesde tomar la muestra sobre la que se realizara dicho contraste.

2. El estadıstico de contraste. Es una variable aleatoria en la que se sustituye informacionobtenida de la muestra para discernir cual de las dos hipotesis, H0 o H1, es mas verosımil.Debe conocerse la distribucion del estadıstico de contraste cuando H0 es cierta.

3. La region crıtica o zona de rechazo. Es el conjunto de valores del estadıstico de contrastepara los que se rechaza la hipotesis nula con un nivel de significacion dado.La region crıtica esta limitada por uno o dos valores crıticos que se determinan a partirdel estadıstico de contraste considerado.

El modo de proceder es el siguiente:

1. Planteamiento de la hipotesis nula. Consiste en atribuir un valor o una zona devalores al parametro de la poblacion que se quiere testar. La igualdad ha de formar

121

Page 65: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

122 TEMA 10. CONTRASTE DE HIPOTESIS

parte de ella. Se formula con la esperanza de que sea posible rechazar H0 y por tanto,aceptar H1.

2. Construir la region crıtica (RC). Si la hipotesis nula fuera cierta, el estadısticocorrespondiente se distribuye de forma conocida. Elegimos un nivel de significacion, α(suele ser 0.05 pero tambien se usan 0.01 y 0.10), un tamano de muestra, n, y consid-eramos un intervalo acotado o la union de dos intervalos no acotados (region crıtica)determinados de manera que la probabilidad de que se rechace H0 siendo cierta seamenor o igual que α. Las areas de rechazo de la hipotesis nula cuando H0 : µ = µ0

corresponden a las dos colas que podemos ver en la figura 29.

Figura 29: Colas o areas de rechazo.

3. Obtencion de informacion muestral. Se elige una muestra representativa de lapoblacion y de ella, el correspondiente valor fijo del estadıstico.

4. Decision. Si dicho valor cae dentro de la region crıtica, se rechaza la hipotesis nula yse acepta la hipotesis alternativa con un nivel de significacion α y en caso contrario seacepta la hipotesis nula por el hecho de no tener argumentos suficientes para rechazarla.

5. Error cometido. Al hacer un contraste de hipotesis se pueden cometer dos tipos deerrores:

Error de tipo I: Se rechaza la hipotesis nula cuando en realidad esta es cierta.

Error de tipo II: Se acepta la hipotesis nula cuando en realidad esta es falsa.

En siguiente cuadro recoge las distintas alternativas y los posibles resultados:

Situacion RealH0 es cierta H1 es cierta

Decision tras Aceptar H0 Decision correcta Error de tipo IIel contraste Rechazar H0 Error de tipo I Decision correcta

Page 66: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

10.2. CONTRASTES DE HIPOTESIS SOBRE LA MEDIA DE UNA DISTRIBUCION 123

La probabilidad de cometer el error de tipo I es α puesto que, siendo cierta la hipotesisnula, se rechazan el α · 100% de los casos. Esta probabilidad no depende del tamano dela muestra.La probabilidad del error de tipo II depende del valor real de la media, µ, y de n. Vienedado por el area que queda bajo la funcion de densidad de la distribucion con media µ,para los valores del intervalo de aceptacion (construido con la media µ0).

10.2. Contrastes de hipotesis sobre la media de una distribu-cion

Suponiendo cualquiera de los tres casos siguientes:

1. H0 : µ = µ0 frente a H1 : µ 6= µ0 (contraste bilateral),

2. H0 : µ ≤ µ0 frente a H1 : µ > µ0 (contraste unilateral por la derecha),

3. H0 : µ ≥ µ0 frente a H1 : µ < µ0 (contraste unilateral por la izquierda),

el estadıstico de contraste, para muestras grandes (n ≥ 30), es

Z =X − µ0

σ/√

n∈ N(0, 1).

Recordando que zα/2 y zα se buscan en la tabla de la normal para P (Z < zα/2) = 1− α/2 yP (Z < zα) = 1α, las respectivas regiones crıticas son

1. RC=(−∞,−zα/2) ∪ (zα/2, +∞),

2. RC= (zα, +∞),

3. RC=(−∞,−zα).

Ejemplo: Un fabricante de baterıas recibe la oferta de la patente de un nuevo proceso defabricacion, que le permitira mejorar notablemente la vida media de las mismas y, por tanto,su calidad. El fabricante es conocedor de la vida media de las baterıas que produce su empresa,es mas, sabe que sigue una distribucion normal de media µ = 4950 horas y desviacion tıpicaσ = 350 horas.

Para decidir si el nuevo proceso de produccion supone una mejorıa en la calidad, ha dis-puesto de una muestra de 100 de las nuevas baterıas que, una vez probadas, han dado unaduracion media de x = 5025 horas.

Por lo tanto, el problema que se le plantea al fabricante es el de averiguar si el valor de5025 horas puede ser debido unicamente al error propio del muestreo, en cuyo caso no sepodrıa concluir que la vida media de las baterıas en el nuevo proceso es diferente de la que seobtiene con el proceso tradicional, o bien, si el resultado de 5025 horas es suficiente garantıapara invertir en la patente que le ofrecen.

Planteamiento del problema como contraste de hipotesis.

Page 67: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

124 TEMA 10. CONTRASTE DE HIPOTESIS

1.-Establecimiento de la hipotesis nula y alternativa para un contraste bilteral.Partimos de la hipotesis de que la vida media de la poblacion de baterıas con el nuevo

proceso no varıa. Esta hipotesis corresponde a la hipotesis nula y se denota por H0. Enterminos estadısticos, se formula como sigue:

H0 ≡ µ = 4950

Aceptar esta hipotesis supone admitir que la muestra, cuya media es igual a 5025, es unamuestra que procede de una poblacion de media 4950, de forma que la diferencia entre el valorestimado 5025 y el valor del parametro es debida al error del muestreo.

Frente a esta hipotesis, se plantea la hipotesis alternativa que denotamos por H1, que eneste caso va a ser

H1 ≡ µ 6= 4950.

El significado de esta alternativa supone admitir que la diferencia entre el valor del esti-mador y el valor del parametro no se debe a un error de muestreo, sino que la hipotesis nulano es correcta. En otras palabras, si la hipotesis nula fuera correcta, se habrıa producido unsuceso suficientemente improbable como para rechazar dicha hipotesis, lo cual supone admitirque la muestra seleccionada pertenece a otra poblacion con una media distinta de 4950.

2.-Construccion de la zona de crıtica para el contraste bilateralElegimos, por ejemplo, un nivel de significacion α = 0′05, la region crıtica son los valores

menores que −1′96 y mayores que 1′96.3.-Informacion muestralEn este caso, x = 5025 y el valor correspondiente del estadıstico es Z =

5025− 4950350/

√100

=

2′14.4.-DecisionComo 2′14 cae en la region crıtica, se rechaza la hipotesis.

Vamos a plantear ahora, un contraste de hipotesis unilateral, por ejemplo, a la derecha.Vamos a contrastar la hipotesis de que la vida media de las baterıas no aumenta.

1.-Establecimiento de la hipotesis nula y alternativa para un contraste unilat-eral a la derecha.

La hipotesis nula esH0 ≡ µ ≤ 4950

y la hipotesis alternativa esH1 ≡ µ > 4950.

2.-Construccion de la region crıtica para el contraste unilateral a la derechaMantenemos el nivel de significacion α = 0′05, entonces zα = 1′65 la region crıtica es

(1′65, +∞).4.-DecisionComo 2′14 pertenece a la zona crıtica, se rechaza la hipotesis.

Page 68: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

10.3. CONTRASTES DE HIPOTESIS PARA LA PROPORCION 125

10.3. Contrastes de hipotesis para la proporcion

En cualquiera de los tres casos siguientes

1. H0 : p = p0 frente a H1 : p 6= p0 (contraste bilateral),

2. H0 : p ≤ p0 frente a H1 : p > p0 (contraste unilateral por la derecha),

3. H0 : p ≥ p0 frente a H1 : p < p0 (contraste unilateral por la izquierda),

si la muestra es grande, el estadıstico de contraste es

Z =P − p0√p0q0/n

∈ N(0, 1),

donde q0 = 1− p0 y las regiones crıticas son las mismas que en el caso anterior.Veamos un ejemplo: Tres partidos, A, B y C, se presentan a unas elecciones. Los sondeos

indican que A obtendra el 40% de los votos, B, el 40% o mas y C, el 40% o menos. Se tomauna muestra de 250 electores, en la que se obtienen las siguientes votaciones: 132 a favor deA, 88 a favor de B y 30, a favor de C. Vamos a hacer el contraste de hipotesis adecuado acada partido con un nivel de significacion del 5 %.

Partido AHipotesis: H0 : p = 0,4 H1 : p 6= 0,4Zona de rechazo: RC=(−∞,−1′96) ∪ (1, 96, +∞)Como Z = 132/250−0′4q

0′4·0′6250

= 4, 13 pertenece a la zona de crıtica, se rechaza la hipotesis nula.

Partido B.Hipotesis: H0 : p ≥ 0,4 H1 : p < 0,4Zona de rechazo: (−∞,−1′65).Como Z = 88/250−0′4q

0′4·0′6250

= −1, 55 no esta en la zona crıtica, no podemos rechazar la

hipotesis nula. Se admite la hipotesis alternativa.

Partido C.Hipotesis: H0 : p ≤ 0,4 H1 : p > 0,4Zona de rechazo: (1′65, +∞).Como Z = 30/250−0′4q

0′4·0′6250

= −9′03 no esta en la zona crıtica, no podemos rechazar la

hipotesis nula. Se admite la hipotesis alternativa.

10.4. Contraste de hipotesis para la diferencia de medias dedos muestras

El contraste de la diferencia de medias de dos poblaciones es un problema muy frecuenteen todas las areas que se sirven de la estadıstica como instrumento de trabajo. Por ejemplo,

Page 69: Resumenes¶ te¶oricos de la asignaturade una serie de experimentos realizados de forma repetitiva. Dada una tabla de valores, a veces existen relaciones entre los mismos, medidas

126 TEMA 10. CONTRASTE DE HIPOTESIS

podemos estar interesados en averiguar la diferencia en la presion sistolica de ninos que tienenpadres hipertensos con ninos cuyos padres tienen una presion normal, o determinar si ciertofarmaco sigue siendo efectivo, etc.

En todos los casos, hay un modelo comun de trabajo, que consiste en seleccionar dosmuestras, una formada por individuos de la poblacion en los que se va a ensayar la nuevaexperiencia, por lo que recibe el nombre de grupo experimental y otra segunda muestra a laque se le aplica un metodo clasico y que se utiliza para contrastar los resultados, por lo quese llama grupo de contraste. Supongamos que las muestras independientes son de tamanosrespectivos n1 y n2, consideramos las dos variables aleatorias que siguen las distribucionesN(µ1, σ1) y N(µ2, σ2) y planteamos el contraste

H0 : µ1 − µ2 = δ0 frente a H1 : µ1 − µ2 6= δ0

(contraste bilateral), para un valor δ0 dado. El estadıstico en este caso es

Z =X1 −X2 − δ0√

σ21

n1+

σ22

n2

∈ N(0, 1).

Las regiones crıticas son las mismas que en los casos anteriores.Veamos el siguiente ejemplo:Se tomo una muestra aleatoria de presion sistolica a 200 ninos cuyos padres son hiperten-

sos, obteniendose una media de 107 mmHg. Luego, se tomo una muestra de 100 ninos cuyospadres tiene la presion sanguınea normal, y se obtuvo una media de 98 mmHg. Se sabe que ladesviacion tıpica poblacional en cualquier caso es de 8 mmHg.

Nuestro interes se centra en discernir si la diferencia µ1 − µ2 entre las medias de las dospoblaciones, que se suponen distribuidas normalmente, es igual a cero, o no, luego la hipotesisnula y la alternativa son:

H0 ≡ µ1 − µ2 = 0 H1 ≡ µ1 − µ2 6= 0

Consideramos α = 0,05, por tanto zα/2 = 1′96 y la zona de rechazo es (−∞,−1′96) ∪(1′96, +∞). Al suponer cierta la hipotesis nula, el valor del estadıstico es

Z =107− 98√64200

+64100

= 9′18

que pertenece a la region crıtica, por tanto, se rechaza la hipotesis, se admite que la diferenciade medias no se debe al azar, sino que es real. Se deduce que la hipertension de los padresinfluye en la presion sistolica de sus hijos.