¡Descarga Estadística Inferencial: Prueba de Hipótesis y más Diapositivas en PDF de Estadística solo en Docsity!
DESARROLLO SUSTENTABLE
ALDO ARTURO NAVA ZALDIVAR
M. EN C. MONICA RANGEL VILLAFRANCO
ESTADÍSTICA INFERENCIAL
GRUPO: 801
SAN FELIPE DEL PROGRESO, MEXICO, A MAYO DEL
4.1 PRUEBA DE HIPÓTESIS
- (^) Proceso mediante el cual, a partir de los valores de una muestra aleatoria se decide si se rechaza o no el supuesto que plantea el investigador para el parámetro o parámetros de la población o poblaciones bajo estudio, pero con cierta probabilidad de error (riesgo) por tomar una decisión
- (^) Pueden mostrar si una declaración tentativa se ve apoyada o rechazada por la evidencia de la muestra.
- (^) estimar parámetros de manera puntual y con intervalos;
- (^) Probar si una hipótesis a cerca de una muestra parece razonable o no
- (^) Una hipótesis estadística es una afirmación o conjetura acerca del valor de un parámetro o parámetros de una población. Tal declaración se considera tentativa pues, a menos que examinemos a toda la población, los verdaderos valores de los parámetros en cuestión se desconocen. Las pruebas de hipótesis pueden mostrar si una declaración tentativa se ve apoyada o rechazada por la evidencia de la muestra.
- Para realizar una prueba de hipótesis se pueden seguir los siguientes pasos
- (^) 1. Identificar el patrón de distribución de la población que se ilustra en el problema ¿Se trata de una distribución discreta o continua? ¿Es una distribución binomial, normal o se sigue algún otro patrón de distribución?
- (^) 2. Planteamiento de la hipótesis Para realizar una prueba de hipótesis se deben plantear realmente dos hipótesis.
- (^) La primera de ellas es la hipótesis nula (H0), una declaración tentativa de que un parámetro de la población es igual a un valor específico. Por lo regular, la hipótesis nula se plantea de manera que no hay diferencia o cambio en el parámetro de la población, pues el objetivo de la prueba es rechazarla. Por otro lado tenemos la hipótesis alternativa (H1), una declaración tentativa de que el valor del parámetro de la población tiene un valor diferente al planteado por la hipótesis nula. La hipótesis alternativa se acepta cuando la hipótesis nula se rechaza.
- (^) la hipótesis de que el parámetro sea menor que el de la hipótesis nula, en este caso el nivel de significancia se carga todo hacia el lado izquierdo , para definir las regiones de aceptación y de rechazo.
- (^) la hipótesis de un valor mayor en el parámetro que el de la hipótesis nula, en este caso el nivel de significancia se carga todo hacia el lado derecho , para definir las regiones de aceptación y de rechazo.
- (^) 2. De una cola, o unilateral Ho; μ = 50 Este último puede ser de cola derecha o izquierda. Región de rechazo de Ho = α (^) Región de rechazo de Ho = α Región de aceptación Región de aceptación de Ho de Ho
Errores de Tipo I y II. 1.Error de tipo I: Se comete cuando se decide rechazar la hipótesis nula H 0 que en realidad es verdadera. La probabilidad de cometer ese error es α****. P [ Rechazar H 0 / H 0 es verdadera ] = α 2.Error de tipo II: Se comete cuando se decide no rechazar la hipótesis nula H 0 que en realidad es falsa. La probabilidad de cometer ese error es β. P [ No rechazar H 0 / H 0 es falsa ] = β Por tanto,
- 1 - α es la probabilidad de tomar una decisión correcta cuando H 0 es verdadera.
- 1 - β es la probabilidad de tomar una decisión correcta cuando H 0 es falsa. El siguiente cuadro resume las ideas:
Especificar el nivel de significación
Las diferencias entre muestras extraídas de la misma población se deben al azar y rara vez son idénticas. Supóngase: H0: μ = 25 años Y una hipótesis alternativa H1: μ = 22 años Para probar esta hipótesis, se extrae una muestra y se calcula su media. Sabemos que difícilmente la muestra tendrá una media igual a 25. ¿Qué tanto más pequeña deberá ser una media muestral que la media esperada para justificar o rechazar la hipótesis nula? La respuesta depende del nivel de error que se desee tolerar, es decir, de la probabilidad de que la muestra haya proporcionado una media lo suficientemente mayor que el valor hipotético debido a factores aleatorios. El nivel de significación es la probabilidad de rechazar una hipótesis nula verdadera o de cometer lo que se denomina error tipo I. A esta probabilidad se le denomina con la letra α. Ya que α es la probabilidad de cometer un error tipo I, ¿por qué no seleccionar el menor valor posible? Observa en la ilustración 7 que conforme α disminuye (desplazando la línea roja hacia la línea verde punteada), aumenta la probabilidad de aceptar una hipótesis nula falsa
El error de no rechazar la hipótesis nula cuando es falsa se denomina error tipo II y por lo general se representa con la letra β. En la gráfica, el área bajo la curva azul, correspondiente a H1, aumenta al disminuir el área α bajo la curva roja correspondiente a H0. El valor de β puede determinarse solamente si la hipótesis alternativa es exacta (de la forma μ = X y no de la forma μ < X o μ > X).
4.2 COMPARACIÓN DE DOS POBLACIONES
- (^) Ahora consideramos dos variables normales (por ejemplo, la estatura de dos poblaciones diferentes; la efectividad de un tratamiento 1 y un tratamiento 2…)
- (^) Se parte de dos muestras aleatorias simples (x1,x2,...,xn)(x1,x2,...,xn) e (y1,y2,...,ym),(y1,y2,...,ym), de las variables X ∈N(μ1,σ1)X∈N(μ1,σ1) e Y∈N(μ2,σ2),Y∈N(μ2,σ2), respectivamN(μ1,σ1)X ∈N(μ1,σ1)X∈N(μ1,σ1) e Y∈N(μ2,σ2),Y∈N(μ2,σ2), respectivamN(μ1,σ1) e Y ∈N(μ1,σ1)X∈N(μ1,σ1) e Y∈N(μ2,σ2),Y∈N(μ2,σ2), respectivamN(μ2,σ2),Y ∈N(μ1,σ1)X∈N(μ1,σ1) e Y∈N(μ2,σ2),Y∈N(μ2,σ2), respectivamN(μ2,σ2), respectivam ente (los tamaños de la muestra no tienen por qué ser iguales).
- (^) Llamamos ¯xx¯ a la media de la muestra de la primera variable (XX) e ¯yy¯ a la media de la muestra de la otra variable; ^Sn−1S^n−1 es la cuasi- desviación típica de la primera muestra y ^Sm−1S^m−1 la de la segunda muestra.
Ejemplos 1. Un investigador quiere saber si una propuesta fiscal es acogida de igual forma por hombres y mujeres. H0 : pH = pM H1 : pH 6≠ pM pH = proporción de hombres que acogen favorablemente la propuesta pM = proporción de mujeres que acogen favorablemente la propuesta
Efecto nivel social, educativo, economico, tendencia política:
aleatorizar
- Prueba T para muestras independientes ; en este procedimiento se compara la media de dos poblaciones normales e independientes. Para realizar dicho contraste los sujetos deben asignarse aleatoriamente a las dos poblaciones, de forma que cualquier diferencia en la respuesta sea debida al tratamiento (o falta de tratamiento) y no a otros factores.
- El procedimiento Prueba T para muestras independientes mediante SPSS contrasta si la diferencia de las medias de dos poblaciones normales e independientes difiere de una constante especificada. Para obtener una Prueba T para muestras independiente se selecciona, en el menú principal, Analizar/Comparar medias/Prueba T para muestras independientes...
4.2.1 Dos poblaciones independientes (prueba de t)
- (^) Por ejemplo, supongamos que se quiere estudiar el efecto de un medicamento, sobre la hipertensión, a un grupo de 20 individuos. El experimento se podría planificar de dos formas:
- (^) Aplicando el medicamento a 10 de estos individuos y dejando sin tratamiento al resto. Transcurrido un tiempo se miden las presiones sanguíneas de ambos grupos y se contrasta la hipótesis H 0 : μ 1 = μ 2 vs H 1 : μ 1 <>μ 2 para evaluar si las medias son iguales o no. Como las muestras están formadas por individuos distintos sin relación entre sí, se dirá que son muestras independientes.
- (^) Aplicando el medicamento a los 20 individuos disponibles y anotando su presión sanguínea antes y después de la administración del mismo. En este caso los datos vienen dados por parejas, presión antes y después y tales datos están relacionados entre sí. Las muestras son apareadas
- (^) Distribución del estadístico
- (^) El estadístico t0 se aproxima a una distribución t con grados de libertad (GL) =n1+n2–2. Las propiedades de la distribución t son las siguientes:
- Tiene media cero.
- Es simétrica con respecto a la media poblacional μ.
- Tiene una varianza mayor que 1, pero ésta tiende hacia 1, a medida que el tamaño de muestra se hace grande.
- La variable t, toma valores desde menos infinito hasta infinito. Cabe señalar que la distribución t es una familia de distribuciones, ya que se tiene una distribución diferente según los grados de libertad. Por otro lado, si se compara con la distribución normal, la distribución t es menos alta en el centro y tiene colas más largas. Para ilustrar el procedimiento de comprobación de hipótesis, se
2. Cálculo del estadístico de
prueba Calcular el valor de t a
partir de la tabla de resultados