Unidad 4 Pruebas de hipótesis

Una hipótesis estadística o simplemente hipótesis es una pretensión o aseveración sobre el valor de un solo parámetro (característica de la población o característica de una distribución de la población) o sobre los valores de varios parámetros (Devore, 2008, página 285) (Anderson et al., 2008, página 340).

En cualquier problema de prueba de hipótesis, existen dos hipótesis contradictorias consideradas, la hipótesis nula y la alternativa.

4.1 Concepto

La hipótesis nula denotada por \(H_0\), es la pretensión de que inicialmente se supone cierta (la pretensión de “creencia previa”). La hipótesis alternativa denotada por \(H_1\) (o \(H_a\)), es la aseveración contradictoria a \(H_0\). La hipótesis nula será rechazada en favor de la hipótesis alternativa solo si la evidencia muestral sugiere que \(H_0\) es falsa. Si la muestra no contradice fuertemente a \(H_0\), se continuará creyendo en la verdad de la hipótesis nula. Las dos posibles conclusiones derivadas de un análisis de prueba de hipótesis son entonces rechazar \(H_0\) o no rechazar \(H_0\).

4.1.1 Elaboración

En algunas aplicaciones no parece obvio cómo formular la hipótesis nula y alternativa. Se debe tener cuidado en estructurar la hipótesis apropiadamente de manera que la conclusión de la prueba de hipótesis proporcione la información que el investigador o la persona encargada de tomar las decisiones desea. A partir de la situación, las pruebas de hipótesis pueden tomar tres formas

Caso 1 Caso 2 Caso 3
\(H_0\): \(\theta =\theta_0\) \(H_0\): \(\theta =\theta_0\) \(H_0\): \(\theta =\theta_0\)
\(H_1\): \(\theta \ne \theta_0\) \(H_1\): \(\theta > \theta_0\) \(H_1\): \(\theta <\theta_0\)

En diversas ocasiones, \(H_1\) se conoce como la hipótesis del investigador, puesto que es la pretensión que al investigador en realidad le gustaría validar. La palabra nulo significa sin valor, la que sugieres que \(H_0\) no deberá ser identificada con la hipótesis de ningún cambio.

Ejemplo 01: Considérese, que el 10% de todas las tarjetas de un circuito producidas por un cierto fabricante durante un periodo de tiempo estaban defectuosas. Un ingeniero ha sugerido un cambio en el proceso de producción con la creencia de que dará por resultado una proporción menor con respecto al porcentaje original.

La hipótesis alternativa (posición del investigador) es \(H_1\): \(p<0.10\), la pretensión de que la modificación del procesos redujo la proporción de las tarjetas defectuosas. Una opción natural para \(H_0\) en esta situación es la pretensión contraria a la establecida en \(H_1\), es decir, \(p≥0.1\). En su lugar se considera \(H_0\): \(p=0.1\) contra \(H_1\): \(p<0.1\), tal como se expuso en la tabla anterior.

Ejemplo 02: El gerente de Danvers-Hilton Resort afirma que la cantidad media que gastan los huéspedes en un fin de semana es menos de $600 dólares. Un miembro del equipo de contadores observó que en los últimos meses habían aumentado tales cantidades. El contador emplea una muestra de cuentas de fin de semana para probar la afirmación del gerente.

  1. ¿Qué forma de hipótesis deberá usar para probar la afirmación del gerente? Explique.
Caso 1 Caso 2 Caso 3
\(H_0\): \(\mu =600\) \(H_0\): \(\mu=600\) \(H_0\): \(\mu =600\)
\(H_1\): \(\mu \ne 600\) \(H_1\): \(\mu > 600\) \(H_1\): \(\mu < 600\)
  1. ¿Cuál es la conclusión apropiada cuando no se puede rechazar la hipótesis nula \(H_0\)?
  2. ¿Cuál es la conclusión apropiada cuando se puede rechazar la hipótesis nula \(H_0\)?

Ejercicio 01: El gerente de un negocio de venta de automóviles está pensando en un nuevo plan de bonificaciones, con objeto de incrementar el volumen de ventas. Al presente, el volumen medio de ventas es 14 automóviles por mes. El gerente desea realizar un estudio para ver si el plan de bonificaciones incrementa el volumen de ventas. Para recolectar los datos, una muestra de vendedores venderá durante un mes bajo el nuevo plan de bonificaciones.

  1. Dé las hipótesis nula y alternativa más adecuadas para este estudio.
  2. Comente la conclusión resultante en el caso en que \(H_0\) no pueda rechazarse.
  3. Comente la conclusión que se obtendrá si\(H_0\) puede rechazarse.

Ejercicio 02: Debido a los costos y al tiempo de adaptación de la producción, un director de fabricación antes de implantar un nuevo método de fabricación, debe convencer al gerente de que ese nuevo método de fabricación reducirá los costos. El costo medio del actual método de producción es $220 por hora. En un estudio se medirá el costo del nuevo método durante un periodo muestral de producción,

  1. Dé las hipótesis nula y alternativa más adecuadas para este estudio.
  2. Haga un comentario sobre la conclusión cuando \(H_0\) no pueda rechazarse.
  3. Dé un comentario sobre la conclusión cuando \(H_0\) pueda rechazarse.

4.1.2 Errores tipo \(I\) y \(II\)

Las hipótesis nula y alternativa son afirmaciones opuestas acerca de la población. Una de las dos, ya sea la hipótesis nula o la alternativa es verdadera, pero no ambas. Lo ideal es que la prueba de hipótesis lleve a la aceptación de \(H_0\) cuando \(H_0\) sea verdadera y al rechazo de \(H_0\) cuando \(H_1\) sea verdadera. Por desgracia, las conclusiones correctas no siempre son posibles. Como la prueba de hipótesis se basa en una información muestral debe tenerse en cuenta que existe la posibilidad de error.

Los dos tipos de errores que se pueden cometer son:

  1. Error tipo I: Rechazar \(H_0\) cuando \(H_0\) es verdadera.

  2. Error tipo II: No rechazar \(H_0\) cuando \(H_0\) es falsa.

Es posible establecer la probabilidad de cometer un error tipo I o II, pero no ambos. El nivel de significancia es la probabilidad de cometer un error tipo I cuando la hipótesis nula es verdadera. Para denotar el nivel de significancia se usa la letra griega \(α\), y los valores que se suelen usar para \(α\) son por los general 0.05 y 0.01.

Ejercicio: Nielsen informó que los hombres jóvenes estadounidenses ven diariamente 56.2 minutos de televisión en las horas de mayor audiencia (The Wall Street Journal Europe, 18 de noviembre de 2003). Un investigador cree que en Alemania, los hombres jóvenes ven más tiempo la televisión en las horas de mayor audiencia. Este investigador toma una muestra de hombres jóvenes alemanes y registra el tiempo que ven televisión en un día. Los resultados muestrales se usan para probar las siguientes hipótesis nula y alternativa.

\[\begin{equation} \notag \begin{split} H_0&: \mu = 56.2\\ H_1&: \mu > 56.2\\ \end{split} \end{equation}\]

  1. En esta situación, ¿cuál es el error tipo I? ¿Qué consecuencia tiene cometer este error?
  2. En esta situación, ¿cuál es el error tipo II? ¿Qué consecuencia tiene cometer este error?

Ejercicio: Suponga que se va a implantar un nuevo método de producción si mediante una prueba de hipótesis se confirma la conclusión de que el nuevo método de producción reduce el costo medio de operación por hora.

  1. Dé las hipótesis nula y alternativa adecuadas si el costo medio de producción actual por hora es $220.

  2. En esta situación, ¿cuál es el error tipo I? ¿Qué consecuencia tiene cometer este error?

  3. En esta situación, ¿cuál es el error tipo II? ¿Qué consecuencia tiene cometer este error?

4.1.3 Procedimiento de prueba

Para decidir si \(H_0\) es finalmente rechazada es posible ocupar dos métodos.

  1. Método del \(\text{valor-p}\). Consiste en \(\text{Rechazar } H_0 \text{, si el valor-p }\leq \alpha\)

  2. Método del valor crítico. Consiste en comparar el estadístico de prueba con un número fijo llamado valor crítico. El valor crítico es un punto de referencia para determinar si el valor del estadístico de prueba es lo suficientemente pequeño para rechazar la hipótesis nula. El valor crítico corresponde a una porción del área bajo la curva, llamada \(α\) (el cual es definido por el investigador).

4.2 Pruebas de hipótesis para la media

Tenemos dos casos.

4.2.1 Pruebas de hipótesis para la media de una distribución normal con varianza poblacional conocida

Aun cuando la suposición de que el valor de \(\sigma^2\) es conocido, rara vez se cumple en la práctica. Este caso proporciona un buen punto de partida debido a la facilidad con que los procedimientos generales y sus propiedades pueden ser desarrollados. La hipótesis nula en los tres casos propondrá que \(\mu\) tiene un valor numérico particular, el valor nulo, el cual será denotado por \(\mu_0\).

Criterios de rechazo para la prueba de una media con varianza poblacional conocida

Hipótesis nula Estadístico de prueba
\(H_0: \mu = \mu_0\) \(Z_0 = \displaystyle\frac{\bar{x}-\mu_0}{\sigma/\sqrt{n}}\)
Hipótesis alternativa Criterio de rechazo
\(H_1: \mu \neq \mu_0\) \(|Z_0| \geq Z_{1-\alpha/2}\)
\(H_1: \mu \gt \mu_0\) \(Z_0 \geq Z_{1-\alpha}\)
\(H_1: \mu \lt \mu_0\) \(Z_0 \leq Z_{\alpha}\)

Ejemplo: El índice Rockwell de dureza para acero se determina al presionar una punta de diamante en el acero y medir la profundidad de la penetración, el cual tiene un varianza de medición de 6. Para 50 especímenes de una aleación de acero, el índice Rockwell de dureza promedió 62. El fabricante dice que esta aleación tiene un índice de dureza promedio menor a 64. Asumiendo que el índice de dureza sigue una distribución normal, ¿hay suficiente evidencia para refutar lo dicho por el fabricante con un nivel de significancia de 1%?

Al plantear la prueba de hipótesis se debe tener en cuenta que la hipótesis del investigador ha de estar reflejada en \(H_1\), tal como se muestra a continuación.

\[\begin{equation} \notag \begin{split} H_0&: \mu = 64\\ H_1&: \mu < 64 \end{split} \end{equation}\]

Luego, se desarrolla la expresión del estadístico de prueba, para conocer su valor numérico.

\[\begin{equation} \notag Z_0 = \frac{\bar{x} - \mu_0}{\sigma/\sqrt{n}} = \displaystyle\frac{62 - 64}{\sqrt{6}/\sqrt{50}} = -5.774 \end{equation}\]

Ocupando el método del valor crítico, escribimos el criterios de rechazo correspondiente. Sin embargo, aún está la tarea de determinar el valor crítico.

\[\begin{equation} \notag \begin{split} Z_0 &\leq Z_{\alpha}\\ -5.774 &\leq Z_{0.01}\\ \end{split} \end{equation}\]

Para determinar el valor de \(Z_{0.01}\), se busca en tabla \(Z\), o bien usando R.

qnorm(p = 0.01)
## [1] -2.326348

Es claro que−5.774 es menor a −2.32, es decir, que al cumplirse la condición de rechazo, esto implica que se rechaza \(H_0\). Por lo tanto, existe suficiente evidencia estadística para rechazar la hipótesis nula, es decir, se apoya la postura del fabricante respecto a un indice de dureza promedio menor a 64, con una significancia del 1% (o confianza del 99%)

Ejercicio 1. Un fabricante de cajas de cartón afirma que sus cajas tienen un peso promedio de 5 kg. Para verificar esta afirmación, un cliente selecciona al azar 25 cajas y encuentra que el peso promedio es de 4.8 kg con una desviación estándar conocida de 0.5 kg. ¿Hay suficiente evidencia para rechazar la afirmación del fabricante al nivel de significancia del 5%?

Ejercicio 2. ¿Se puede concluir con evidencia estadística suficiente que la duración media de las baterías (290 horas) ha mejorado significativamente después de aplicar una nueva fórmula en su fabricación, si se sabe que la duración de las baterías sigue una distribución normal con una varianza poblacional conocida de 64 horas, se tomó una muestra aleatoria de 36 dispositivos móviles y se registró una duración media muestral de 280 horas, con un nivel de significancia del 5% en la prueba de hipótesis de una cola y con la hipótesis nula de que la duración media de las baterías sigue siendo la misma que antes de la nueva fórmula?

Ejercicio 3. Un cirujano afirma que sus pacientes se recuperan en un promedio de 5 días después de una cirugía. Para probar su afirmación, el cirujano toma una muestra aleatoria de 20 pacientes y encuentra que la duración promedio de recuperación es de 6 días, con una desviación estándar conocida de 1.5 días. ¿Hay suficiente evidencia para rechazar la afirmación del cirujano al nivel de significancia del 10%?

Ejercicio 4. Se cree que la cantidad promedio de cafeína en una taza de café es de 100 mg. Para probar esta hipótesis, se toma una muestra aleatoria de 50 tazas de café y se encuentra que la cantidad promedio de cafeína es de 105 mg, con una desviación estándar conocida de 15 mg. ¿Hay suficiente evidencia para rechazar la hipótesis nula al nivel de significancia del 5%?

Ejercicio 5. Se desea evaluar si la altura promedio de una población de girasoles es de 150 cm. Para ello, se selecciona una muestra aleatoria de 30 girasoles y se encuentra que la altura promedio es de 155 cm, con una desviación estándar conocida de 5 cm. ¿Hay suficiente evidencia para rechazar la hipótesis nula al nivel de significancia del 1%?

4.2.2 Prueba de hipótesis para la media de una distribución normal con varianza poblacional desconocida

De igual manera a lo expuesto en el primer caso, los pasos a seguir para probar una hipótesis son los mismos, y se mantendrá así para cualquier caso.

  1. Plantear las hipótesis nula y alternativa
  2. Identificar o establecer el nivel de significancia.
  3. Identificar los datos muestrales y poblacionales con los que se cuenta.
  4. Utilizar alguna de las reglas de decisión (Estadístico de prueba, valor-p o intervalo de confianza).
  5. Concluir

En la situación de una prueba de hipótesis de la media, en la cual lo datos distribuyen normal y la varianza poblacional es desconocida, los criterios de rechazo son similares a los vistos anteriormente, sin embargo, cambia la distribución del estadístico de prueba, tal como se muestra en la tabla

Criterios de rechazo para la prueba de una media con varianza poblacional conocida

Hipótesis nula Estadístico de prueba
\(H_0: \mu = \mu_0\) \(t_0 = \displaystyle\frac{\bar{x}-\mu_0}{S/\sqrt{n}}\)
Hipótesis alternativa Criterio de rechazo
\(H_1: \mu \neq \mu_0\) \(|t_0| \geq t_{1-\alpha/2, n-1}\)
\(H_1: \mu \gt \mu_0\) \(t_0 \geq t_{1-\alpha,n-1}\)
\(H_1: \mu \lt \mu_0\) \(t_0 \leq t_{\alpha,n-1}\)

donde \(n\) corresponde al tamaño de la muestra.

Ejemplo:

Supongamos que estamos interesados en probar si la media de las calificaciones de un examen en un grupo de estudiantes es diferente de 75 puntos. Los siguientes son los puntajes obtenidos por una muestra de 10 estudiantes:

\[78, 74, 72, 77, 73, 76, 75, 80, 74, 77\]

pje = c(78, 74, 72, 77, 73, 76, 75, 80, 74, 77)

t.test(x = pje, 
       conf.level = 0.95, 
       alternative = "two.sided",
       mu = 75)
## 
##  One Sample t-test
## 
## data:  pje
## t = 0.77174, df = 9, p-value = 0.46
## alternative hypothesis: true mean is not equal to 75
## 95 percent confidence interval:
##  73.84126 77.35874
## sample estimates:
## mean of x 
##      75.6

Este resultado sugiere que, estadísticamente, la media de las calificaciones del examen para esta muestra de estudiantes no es significativamente diferente de 75 puntos.

4.2.3 Prueba de hipótesis con respecto a una proporción

Hipótesis nula Estadístico de prueba
\(H_0: p = p_0\) \(Z_c = \displaystyle\frac{(\hat{p}-p_0)}{\sqrt{p_0\cdot q_0}}\cdot \sqrt{n}\)
Hipótesis alternativa Criterio de rechazo
\(H_1: p \neq p_0\) \(|Z_c| \geq Z_{1-\alpha/2}\)
\(H_1: p \gt p_0\) \(Z_c \geq Z_{1-\alpha}\)
\(H_1: p \lt p_0\) \(Z_c \leq Z_{\alpha}\)

Ejemplo: En una comuna del país históricamente un 60% de los adultos mayores esta con problemas de enfermedades crónicas no controladas. Se inicia una campaña del servicio de salud de la municipalidad para reducir este porcentaje. Después de un tiempo se escoge al azar una muestra de 200 adultos mayores, de ellos, 105 declaran enfermedades crónicas no controladas. Con un nivel de significación del 5% ¿Se logró el objetivo que se planteó el servicio de salud en su campaña?