Tema 3-Intervalos de confianza.pdf - Google Drive

1 downloads 162 Views 205KB Size Report
Problema 1: Las estaturas de los soldados de un regimiento tienen una media. μ =175 y una desviación típica de σ = 5
Tema 3: Inferencia Estadística. Intervalos de confianza 1. Introducción Hemos visto en el tema anterior que la Estadística es la ciencia que se preocupa de la recogida de datos, su organización y análisis, así como de las predicciones que, a partir de esos datos pueden hacerse Los aspectos anteriores hacen que pudiese hablarse de dos tipos de Estadística: Descriptiva e Inferencial La Estadística Descriptiva se ocupa de tomar los datos de un conjunto dado, organizarlos en tablas o representaciones gráficas y del cálculo de unos números que nos informen de manera global del conjunto estudiado. No utiliza la Probabilidad Para la recogida de datos, hemos visto el Muestreo Estadístico, en el que hemos estudiado algunas formas de tomar una muestra de la población en estudio La Estadística Inferencial trata sobre la elaboración de conclusiones para una población, partiendo de los resultados de una muestra y del grado de fiabilidad de las conclusiones. Utiliza la Probabilidad. Una vez hecho el muestreo estadístico, el siguiente paso en nuestro estudio es la elaboración de conclusiones para la población a partir de los datos recogidos en la muestra. Como hemos visto, esto lo llevará a cabo la Estadística Inferencia o también conocida como la Inferencia Estadística. Vamos a analizar tres situaciones parecidas, pero muy distintas: • Problema 1: Las estaturas de los soldados de un regimiento tienen una media µ = 175 y una desviación típica de σ = 5 . (Ambos parámetros son poblacionales). ¿Cuál es la probabilidad de que la estatura media de 32 soldados que deben hacer guardia esta noche esté comprendida entre 174,4 y 175,6? (los 32 soldados son una muestra de la población) Conocemos Nos preguntamos La media de la La media x de una Población. µ = 175 muestra. ¿ P (174, 4 < x < 175, 6) ? • Problema 2: La estatura media de los 32 soldados que han sido seleccionados para hacer guardia es x = 175 cm ¿Cuál es la probabilidad de que la media, µ , de todos los soldados del regimiento esté en el intervalo (174,4;175,6)? Conocemos Nos preguntamos La media de la La media µ de una muestra. x = 175

muestra. ¿ P (174, 4 < µ < 175, 6) ?

• Problema 3: Afirman que la media de las estaturas de los soldados de un regimiento es µ = 175 . Para comprobarlom, extraemos una muestra de 32 soldados y calculamos su media, x = 175,8 . ¿Es razonable admitir la hipótesis de que µ = 175 ?

Conocemos La media de la muestra

Nos preguntamos ¿Es admisible la afirmación de que µ = 175 ?

En el problema 1, conocemos la población. A partir de ahí pretendemos deducir el comportamiento de las muestras. Esto no es lo más habitual, pero comenzaremos desde esta situación para comprender mejor la inferencia estadística. En el problema 2, conocemos una muestra y, a partir de ella, pretendemos deducir aspectos de la población. En concreto, pretendemos inferir el valor de la media de la población a partir del conocimiento de la media de una muestra. Este problema es el que nos planteamos como objetivo inicial en este tema. Este problema es un típico problema de inferencia estadística, estimar el valor de un parámetro de la población a partir de una muestra. En el problema 3, tenemos una afirmación, una hipótesis, la media de la población es µ = 175 . Pero no tenemos garantías de que sea cierto. Para contrastarlo, extraemos una muestra y, a partir de su resultado x = 175,8 , debemos decidir si la hipótesis si la hipótesis es o no admisible. Este problema lo resuelve también la inferencia estadística mediante los contrastes de hipótesis, que estudiaremos en el siguiente tema. 2. Intervalos característicos. 2.1.

Intervalos característicos

Definición (intervalo característico): Sea X una V.A. que se distribuye según una normal de media µ (media poblacional conocida). Llamaremos intervalo característico correspondiente a una probabilidad p, a un intervalo centrado en la media de la forma (µ − k , µ + k ) Es decir, la probabilidad de que un valor de la variable X pertenezca a dicho intervalo es p y lo expresaremos P ( µ − k < X < µ + k ) = p

Ejemplo: Hallemos el intervalo característico en una distribución N(0,1) correspondiente a una probabilidad 0,9. Sabemos que este caso µ = 0 y por tanto tenemos que P (0 − k < X < 0 + k ) = 0,9 . Gráficamente tenemos que

Tenemos que determinar el intervalo, es decir, k. Luego a partir del gráfico, tenemos que P ( X > k ) = 0, 05 ⇒ P ( X ≤ k ) = 0,95 . Si buscamos en la tabla de la normal de forma inversa tenemos que k=1,645. Luego el intervalo es (-1,645,1,645), es decir P (−1, 645 < X < 1, 645) = 0,9 Vamos a usar con mucha frecuencia intervalos característicos donde X siga una N(0,1) (gráfico) Entonces llamaremos k el valor crítico correspondiente a p (que no es más que un valor de la variable). Y lo denotaremos por zα / 2 . Por tanto, con esta nueva notación tenemos:

P( Z > zα / 2 ) = α / 2

P(− zα / 2 < Z < zα / 2 ) = p = 1 − α

y

Los valores críticos correspondientes a las probabilidades 0,9 0,95 y 0,99 son los más utilizados y son 1,645 1,96 y 2,575 respectivamente.

Ejemplo: Calcular los valores críticos correspondientes a la probabildad 0,95. (Es decir, tenemos que calcular zα /2 = k ) Sabemos que α = 0, 05 ⇒ α / 2 = 0, 025 , por tanto

P( Z > zα /2 ) = 1 − P( Z < zα /2 ) ⇒ P( Z < zα / 2 ) = 1 − P( Z > zα /2 ) = 0,975 A continuación miramos la tabla de la normal de forma inversa y obtenemos el valor crítico zα / 2 =1,96

2.2.

Intervalos característicios para N ( µ , σ )

Sea X una V.A. que se distribuye según una normal N ( µ , σ ) , si queremos determinar el intervalo característico para esta variable lo primero que tendremos que hacer es tipificar por tanto ( µ − k , µ + k ) ⇒ (− zα / 2 , zα /2 ) y tenemos que

P(− zα /2 < Z < zα / 2 ) = 1 − α Como sabemos Z =

X −µ

σ

⇒ P (− zα / 2
”número de miopes en la muestra ”, entonces X sigue una distribución Binomial B(40,0,15). Teniendo en cuente el teorema central del límite podemos aproximar la distribución binomial a una distribución Normal N(np, npq ). Por tanto X->N(6,2,26). Teniendo en cuenta que la proporción de miopes de la muestra es p=

n º miopesdelamuestra x = 40 40

Podemos definir una nueva variable aleatoria P=X/n->N( >N( p,

n npq , ). p n

Es decir, P-

pq ). n

Si en una población la proporción de individuos que posee una cierta característica C es p, la proporción p, de individuos con dicha característica en las muestras de tamaño n sigue una distribución normal de media p y desviación típica

6.1.

pq . n

Intervalo de confianza para la proporción. Relación entre el error máximo admisible, nivel de confianza y tamaño de la muestra.

Si se desea estimar la proporción P, de individuos con una cierta característica que hay en una población. Para ello, se recurre a una muestra de tamaño n, en la que se obtiene la proporción muestral p. El intervalo de confianza de P con un nivel de confianza (1 − α ) ⋅100% es

( p − z1−α /2

pq , p + z1−α /2 n

pq ) n

Para este intervalo, se define el error máximo admisible como E= z1−α / 2

pq n