Conceptos de Estadística Inferencial


1. Algunos conceptos

  1. Margen de error (ME): Es la medida de la precisión de una estimación estadística. Representa la amplitud (tambien pueden decir: radio) de un intervalo alrededor de un valor estimado dentro del cual se espera que esté el verdadero valor con cierto nivel de confianza. Se puede decir también: la distancia entre el valor estimado y los límites superior o inferior del intervalo de confianza.
  2. Error estándar (EE): Es una medida de la variabilidad de una estimación estadística debido a la aleatoriedad en los datos de muestra. Representa la desviación estándar (correcto Tadeo cuando lo dijiste) de la distribución de las estimaciones de una cantidad de interés a partir de múltiples muestras (múltiples muestras es justamente como que varios investigadores hacen el experimento).
  3. Intervalo de confianza (IC): Es un rango de valores dentro del cual se espera que esté el verdadero valor de un parámetro poblacional con cierto nivel de confianza.
  4. Nivel de confianza: Es la probabilidad de que el intervalo de confianza contenga el verdadero valor del parámetro poblacional. Por ejemplo, un nivel de confianza del 95% indica que hay un 95% de probabilidad de que el intervalo de confianza contenga el verdadero valor del parámetro.
  5. Estimación puntual: Es un único valor que se utiliza para estimar un parámetro poblacional, como la media, la proporción o la desviación estándar.
  6. Estimador: Es una regla o fórmula utilizada para calcular una estimación puntual a partir de los datos de muestra.
  7. Distribución muestral: Es la distribución de una estadística muestral, como la media o la proporción, calculada a partir de múltiples muestras de la misma población.
  8. Varianza muestral: Es una medida de la dispersión de los datos en una muestra. Generalmente se utiliza para estimar la varianza poblacional.
  9. Error de muestreo: Es la diferencia entre una estimación obtenida a partir de una muestra y el verdadero valor del parámetro poblacional. Se debe a la variabilidad inherente al proceso de muestreo.
  10. Estadístico de prueba: Es una medida utilizada para tomar decisiones sobre una hipótesis nula en pruebas de significancia estadística (Como nuestro estadístico Z que puede salir en la región de aceptación o rechazo de la hipótesis nula)
  11. Hipótesis nula (H0): Es una afirmación que se prueba para su refutación. Por lo general, es la creencia previa, y lo que los investigadores generalmente quieren rechazar (encontrar suficiente diferencia – efecto, en su experimento para poder rechazarla).
  12. Hipótesis alternativa (H1 o Ha): Es la hipótesis que queda si se rechaza la hipótesis nula. La contraria a la nula. Generalmente la que el investigador quiere tener evidencia de apoyarla.
  13. Prueba de hipótesis: Es un procedimiento estadístico utilizado para tomar decisiones sobre la validez de una afirmación basada en datos de muestra.
  14. Valor p: Es la probabilidad de obtener un resultado al menos tan extremo como el observado, suponiendo que la hipótesis nula es verdadera. Se utiliza en pruebas de significancia para tomar decisiones sobre la hipótesis nula. Por ejemplo, si el valor P es 7% cuando la significancia que hemos decidido tolerar es de 5%, entonces debemos aceptar H0; porque solo aceptamos/toleramos probabilidad de 5% de equivocarnos, y 7% esta más grande (no lo toleramos).
  15. Error tipo I: Alpha. Ocurre cuando se rechaza incorrectamente la hipótesis nula cuando es verdadera. Se denota como α y es la probabilidad de cometer este tipo de error. (ver más adelante un ejemplo serio)
  16. Error tipo II: Beta. Ocurre cuando se acepta incorrectamente la hipótesis nula cuando es falsa. Se denota como β y está relacionado con la potencia de la prueba. (ver más adelante un ejemplo serio)

2. Entendiendo errores tipo 1 y tipo 2 (por si acaso) (muy interesante):

¿Qué son? En las pruebas de hipótesis, los errores de Tipo I y Tipo II son dos conceptos que se relacionan con las pruebas de hipótesis, y los errores que se pueden cometer cuando se acepta o rechaza la hipótesis nula.

Error tipo I (falso positivo):

  • El error tipo I ocurre cuando la hipótesis nula (Ho) se rechaza cuando realmente sí es cierta.
  • La probabilidad de cometer un error de Tipo I se indica con el símbolo [math] \alpha [/math], y normalmente se establece como el nivel de significancia de la prueba. Los niveles de significancia comunes suelen ser 0,05 o 0,01.
  • Reducir el nivel de significancia reduce la probabilidad de error de Tipo I pero aumenta la posibilidad de error de Tipo II.

Error tipo II (Falso negativo):

  • El error tipo II ocurre cuando la hipótesis nula (Ho) no se rechaza cuando realmente sí es falsa.
  • En otras palabras, es el error de no detectar un efecto o diferencia significativa cuando realmente sí existe.
  • La probabilidad de cometer un error de Tipo II se indica con el símbolo [math] \beta [/math]. El poder de una prueba estadística es [math] 1−\beta [/math], que representa la probabilidad de rechazar correctamente una hipótesis nula falsa.

Comprendiéndolo con un ejemplo en diagnóstico médico (esto es muy serio)

Consideremos una prueba de diagnóstico médico para una enfermedad en particular, donde la hipótesis nula (Ho) es que el paciente no padece la enfermedad, y la hipótesis alternativa (Ha) es que el paciente sí tiene la enfermedad.

Ho: El paciente NO padece la enfermedad
Ha: El paciente SÍ padece la enfermedad (lo que el test médico esta diseñado para probar)

Error Tipo I (Falso Positivo):

SituaciónConsecuencia
Un paciente que no padece la enfermedad recibe un resultado positivo de la prueba.¡Pobre paciente!, se va a preocupar injustamente. El paciente puede someterse a pruebas, tratamientos o angustia emocional adicionales innecesarios debido a al diagnóstico incorrecto

Error Tipo II (Falso Negativo):

SituaciónConsecuencia
Un paciente que realmente tiene la enfermedad recibe un resultado negativo de la pruebaEl paciente quizá sale alegre de la prueba, pero es un peligro. Es posible que el paciente no reciba el tratamiento o seguimiento necesario, lo que lleva a un diagnóstico tardío, progresión de la enfermedad o daño potencial. Si la enfermedad es contagiosa, pueden imaginar lo malo que es un falso negativo (alguien con la enfermedad que piensa que no la tiene).

3. Una tablita de fórmulas relevantes

Intervalo de ConfianzaMargen de ErrorError EstandarNombre del Estadístico de PruebaFórmula del Estadístico de Prueba (para las p. de hipótesis)
Para media con desvacion poblacional conocidaLimites [math] = \bar{x} \pm z_{{\alpha}/{2}} \frac{\sigma} { \sqrt{n} } [/math][math] z_{{\alpha}/{2}} \frac{\sigma} { \sqrt{n} } [/math] [math] \frac{\sigma} { \sqrt{n} } [/math]Z (Distribución Normal) [math] Z=\frac{\bar{x}-\mu}{ \frac{\sigma} { \sqrt{n} }} [/math]
Para media con desvacion poblacional desconocidaLimites [math] = \bar{x} \pm t_{{\alpha}/{2}} \frac{s} { \sqrt{n} } [/math][math] t_{{\alpha}/{2}} \frac{s} { \sqrt{n} } [/math] [math] \frac{s} { \sqrt{n} } [/math]t (Distribución t de Student)[math] t=\frac{\bar{x}-\mu}{ \frac{s} { \sqrt{n} }} [/math]
Para proporcionesLimites [math] = p \pm z_{{\alpha}/{2}} \sqrt{\frac{p(1-p)}{n}} [/math][math] z_{{\alpha}/{2}} \sqrt{\frac{p(1-p)}{n}} [/math][math]\sqrt{\frac{p(1-p)}{n}} [/math]Z (Distribución Normal)[math] Z=\frac{\bar{p}-p}{ \sqrt{\frac{p(1-p)}{n}}} [/math]