En estadística, ¿qué es un error tipo 1 y tipo 2?

Siempre que intentamos comprender el error de Tipo I y Tipo II, siempre vemos la tabla a continuación. Si ve la tabla solo e intenta comprender el concepto de error Tipo I y Tipo II, obtendrá muchas confusiones. Lea este https://www.quora.com/How-would-… para comprender la intuición detrás de las pruebas de hipótesis y el valor P.

Error tipo 1 = [matemática] \ alpha [/ matemática] = P (Rechazar la hipótesis nula | cuando es verdadera)

Error tipo 2 = [matemática] \ beta [/ matemática] = P (no puede rechazar la hipótesis nula | cuando es falsa)

En las pruebas de hipótesis recolectamos una muestra de tamaño de n de la población. Con base en la estimación de la muestra, hacemos una inferencia sobre la población.

Por ejemplo: tengo una moneda de 10 rupias y voy a hacer una prueba de hipótesis que la moneda que tengo es una moneda imparcial (significa que la probabilidad de obtener la cabeza y la cola son iguales).

[matemáticas] H_ {0}: P = 0.5 \ etiqueta {1} [/ matemáticas]

[matemáticas] H_ {1}: P ≠ 0.5 \ etiqueta {2} [/ matemáticas]

P es la probabilidad de obtener la cabeza.

Entonces, voy a tirar la moneda 10 veces para estimar la probabilidad de obtener cara. Cuando lanzas una moneda 10 veces, “esperas” 5 caras y 5 colas, pero no te sorprende en absoluto obtener números diferentes. Quizás puedas obtener 6 y 4. . . o quizás 4 y 6. La razón detrás de esto es que no volteamos la moneda de manera similar cada vez y también que tantos factores desconocidos influyen cada vez que el resultado del lanzamiento de la moneda. Este fenómeno se conoce como variabilidad aleatoria. Pero, gracias al teorema del límite central, al usarlo, podemos definir una distribución teórica para el lanzamiento de la moneda que captura la variabilidad aleatoria del lanzamiento de la moneda. Según el teorema del límite central, la distribución teórica de la probabilidad de obtener una cabeza sigue la distribución normal. Para saber más sobre el teorema del límite central, lea https://www.quora.com/How-do-you…. La distribución teórica se muestra en la figura siguiente y su media es 0.5.

Entendimos que, no es necesario que la probabilidad de obtener una cara sea exactamente igual a 0.5, incluso si la moneda es imparcial. Obtendremos diferentes valores de probabilidad debido a la variabilidad aleatoria. Todo lo que necesitamos hacer es calcular una estimación de la probabilidad utilizando la muestra que recolectamos y ubicar ese valor en la distribución teórica. Si la probabilidad estimada es tan cercana a la media, podemos decir con mayor confianza que la moneda es imparcial. Si la probabilidad estimada está muy lejos de la media, no estamos seguros de que la moneda sea imparcial o no, porque es posible que obtenga ese valor debido a la variabilidad aleatoria. Entonces, permítanme fijar algún nivel en la distribución teórica anterior para hacer un juicio correcto, cuando la estimación de probabilidad está muy lejos de la media de distribución teórica. Los niveles están por encima de 0.9 y por debajo de 0.1. Si la estimación de probabilidad cae por encima de 0.9 o por debajo de 0.1, entonces concluiremos que la moneda está sesgada. El nivel se llama nivel de significancia o [math] \ alpha [/ math] o error de Tipo I. Lo llamamos error porque podría ser posible que arrojáramos una moneda sesgada y obtuviera una estimación superior a 0.9 o inferior a 0.1 debido a la variabilidad aleatoria.

Error tipo II

Hay dos distribuciones en el diagrama anterior. El primero es la distribución teórica de la hipótesis nula. Supongamos que hemos elegido una moneda sesgada para la prueba de hipótesis y su media de distribución teórica es 0.8 . Por lo tanto, la segunda es la distribución teórica del escenario real. La región sombreada por el color verde indica un error de Tipo I. La región sombreada por el color rojo indica error de tipo II. En este escenario, es posible que obtengamos una estimación de probabilidad cercana a 0.5 debido a la variabilidad aleatoria. Entonces, no podemos concluir que la moneda está sesgada. Este tipo de error se llama error de Tipo II.

Ya sabíamos que la hipótesis alternativa es opuesta a la hipótesis nula. Por lo tanto, podemos considerar una distribución teórica de escenario real como Distribución de hipótesis alternativa.

Si el error Tipo I o [matemática] \ alpha [/ matemática] = 0.05, significa que en promedio 100 de 5 veces serán significativas (Rechazamos la hipótesis nula) cuando se deben solo a una variabilidad aleatoria. Por lo general, elegimos el valor [math] \ alpha [/ math] como 0.01 o 0.05 para la prueba de hipótesis. Es imposible elegir el error de Tipo II o [matemática] \ beta [/ matemática] como error de Tipo I o [matemática] \ alfa [/ matemática] porque depende de tres factores como el tamaño del efecto (diferencia entre las medias de dos grupos) , ruido en el sistema ([math] \ sigma [/ math]) y tamaño de muestra. Pero, es necesario equilibrar tanto [math] \ alpha [/ math] como [math] \ beta [/ math] para una buena prueba de hipótesis. Podemos elegir un buen valor [matemático] \ beta [/ matemático] eligiendo un tamaño de muestra apropiado para la prueba de hipótesis. El análisis de potencia ayuda a decidir un buen tamaño de muestra para la prueba de hipótesis.

Es muy importante para cualquier analista o profesional de la ciencia de datos conocer estos conceptos de memoria para asegurarse de que está obteniendo ideas significativas de los datos.

Déjame hablar sobre la hipótesis primero.

¿Qué es una hipótesis? – Una explicación o suposición de un evento dado que puede o no ser cierto. Ejemplos: las ventas han caído debido a un precio más alto o un empleado se fue debido a su jefe.

Hipótesis nula, H0 (Campeón) – Hipótesis que estamos probando para rechazar o refutar

Hipótesis alternativa Ha (Challenger) : hipótesis que aceptamos si rechazamos la hipótesis nula

Ahora hablemos de los errores de Tipo I y Tipo II

El error tipo I es el error “Falso positivo” . Por ejemplo, cuando un acusado no es culpable, pero fue declarado culpable por el jurado o los jueces. La probabilidad de este error se denota por Alpha.

El error tipo II es el error “Falso negativo”. Sobre la base del ejemplo anterior, un acusado es culpable, pero fue declarado inocente por el jurado o los jueces. La probabilidad de este error se denota por Beta.

Vea los gráficos a continuación para ver imágenes y otros conceptos relacionados.

Espero que esto ayude.

¡Salud!

Gracias por sus votos a favor de antemano. Me mantienen en marcha! ¡Gracias!

Descargo de responsabilidad: Las opiniones expresadas aquí son únicamente las del escritor en su capacidad privada.

Cada vez que realizamos pruebas de hipótesis, tomamos la decisión de rechazar la hipótesis nula o de rechazar la hipótesis nula en el nivel alfa de significancia, pero en realidad no tenemos idea de si la decisión que tomamos es verdadera o no.

Como casi siempre tomamos muestras de la población para hacer inferencias y los resultados basados ​​en la muestra no siempre son representativos de toda la población y, en general, asumimos las probabilidades normales que no son precisas, es decir, la distribución casi sigue la distribución normal no perfectamente . Entonces, factores como este afectan la precisión de nuestra decisión.

Además, en realidad nunca podemos saber cuál es el verdadero parámetro subyacente. Entonces, según la decisión que tomamos, tenemos la siguiente clasificación de cuatro vías:

El error tipo I básicamente rechaza la hipótesis nula cuando en realidad es cierta. También se denomina nivel de significación.

Y el error de Tipo II no puede rechazar la hipótesis nula cuando en realidad la hipótesis alternativa es verdadera. El error de tipo II es el complemento de la potencia de la prueba que se define como la probabilidad de rechazar hipótesis nula cuando la hipótesis alternativa es verdadera.

Ahora, no es posible minimizar ambos, ya que uno se reduce con el costo de otro.

Digamos, por ejemplo, si reducimos el nivel de significancia, se hace difícil rechazar la hipótesis nula, lo que aumentará el error de tipo II.

Entonces, uno tiene que decidir qué es más importante para minimizar entre los errores de tipo I o tipo II y esto difiere de una situación a otra.

Veamos algunos ejemplos:

Supongamos que un estudiante actuarial realiza un estudio donde toma muestras aleatorias de estudiantes de Kolkata para examinar la proporción de estudiantes que sienten que el maestro (específico) aclara todas sus dudas sobre el tema ct4 y luego realiza una prueba de hipótesis donde las dos afirmaciones en competencia fueron:

Hipótesis nula: el profesor aclara todas las dudas de los alumnos.

Hipótesis alternativa: el profesor no aclara todas las dudas de sus alumnos.

Aquí, en este caso, el error tipo II es más peligroso que el error tipo I para cualquier estudiante que busque matrícula para ct4.

Tomemos otro ejemplo.

En un juicio en la corte hay dos hipótesis:

Hipótesis nula: el defensor es inocente

Hipótesis alternativa: el acusado es culpable

En este ejemplo, el error tipo I es mucho más peligroso que el tipo II.

Entonces, dependiendo de la situación, uno tiene que decidir cuál de ellos debe tener más importancia que el otro.

Espero que esto haya ayudado.

En las pruebas de hipótesis estadísticas, los errores “tipo I” y “tipo II” son, respectivamente, el rechazo incorrecto de una hipótesis nula verdadera y la incapacidad de rechazar una hipótesis nula falsa.

En otras palabras:

  • Un error de tipo I está detectando un efecto que no está presente.
  • Un error de tipo II no puede detectar un efecto presente.

Más detalles:

  • Errores tipo I y tipo II
  • Errores tipo I y II
  • ¿Cuál es la diferencia entre los errores de prueba de hipótesis tipo I y tipo II?
  • Errores tipo I y II
  • Prueba de hipótesis estadísticas

Cuando enciendes tostadas u obtienes algo de humo del horno (humo pero no fuego) y se apaga, es una falsa alarma o un error de Tipo I.

Cuando su casa se incendia porque la alarma de humo no detectó un incendio, es un error de Tipo II.

Suponiendo que la alarma de humo funcione correctamente, los errores de Tipo II deberían ser muy raros, pero tienen el costo de muchos errores de Tipo I. El humo pero sin fuego también es (afortunadamente) mucho más común que el fuego real.

En el caso de una alarma de humo, un error tipo I se considera menos grave que un error tipo II. Sin embargo, no son gratuitos. Demasiados errores de Tipo I llevan a las personas a quitar la batería de su alarma de humo. En este caso, nunca comete un error de Tipo I, pero esto conlleva el costo de cometer siempre errores de Tipo II.

El problema es que, para un nivel dado de tecnología y tasa de eventos de fondo, los errores de Tipo I y Tipo II se compensan. Disminuir una tasa automáticamente implica aumentar la otra. Ver teoría de detección .

Tampoco puede ignorar los costos de los diferentes tipos de errores.

En otros contextos, tiene el sesgo opuesto que es deseable. Un ejemplo sería el centro de operaciones de un buque de guerra en aguas hostiles. No querrá perderse un enfoque hostil potencial y, por lo tanto, querrá mirar con mucho cuidado y desafiar.

Además, las consecuencias de una decisión dada son importantes. Si su único recurso es disparar a cualquier enfoque hostil declarado, eso realmente cambia lo que hace. Lo mismo para la alarma de humo. Una prueba de detección es similar. Por lo general, la tasa de error Tipo II se controla estrictamente porque la acción posterior es utilizar una prueba más precisa pero costosa.

Tipo 1: falso positivo.
Tipo 2: falso negativo.

Más allá de esto, un error tipo 2 no necesariamente nos hace cambiar nuestras creencias, ya que una interpretación razonable de un hallazgo negativo es “se necesita más evidencia”.

Por otro lado, un error tipo 1 nos hace cambiar nuestras creencias, ya que rechazamos una hipótesis nula a favor de una alternativa solo cuando hay suficiente evidencia para hacerlo. Por lo tanto, un error tipo 1 se considera más peligroso, aunque esto obviamente depende de la situación.

Una explicación simple sería:

Hipótesis nula: usted es una persona médicamente en forma

Error tipo I: se hace una prueba de VIH y resulta positiva, pero en realidad no tiene VIH. ( Falso positivo )

O, rechazo incorrecto de una hipótesis nula verdadera.

Error tipo II: se hace una prueba de VIH y resulta negativa, pero en realidad tiene VIH. ( Falso negativo )

O, que retiene incorrectamente una hipótesis nula falsa.


Se produce un error de tipo I cuando la hipótesis nula es verdadera, pero se rechaza.

Se produce un error de tipo II cuando la hipótesis nula es falsa, pero no se rechaza.

Considera lo siguiente:

Estoy acusado de un delito. La hipótesis nula es que soy inocente, ya que creemos en el principio de “inocente hasta que se demuestre lo contrario”.

Se produciría un error tipo I si, de hecho, soy inocente, pero un jurado me condena.

Un error tipo II ocurriría si de hecho soy culpable, pero soy absuelto por un jurado.

O este ejemplo:

La alarma de incendios se apaga. Como nunca he estado en una situación en la que una alarma de incendio haya indicado un incendio, mi hipótesis nula es que es una falsa alarma.

Un error tipo I ocurriría si, a pesar de mi creencia, salgo corriendo del edificio en pánico cuando no hay un incendio del que escapar.

Ocurriría un error de tipo II si mantengo mi creencia y me quedo quieto, poco después quemándome hasta morir porque de hecho hubo un incendio.

Dado que la hipótesis nula suele ser que no sucede nada:

Error tipo I: decir que algo está sucediendo cuando no es
Error de tipo II: no se puede decir que algo está sucediendo cuando es así.

pero lo peor es

Error tipo III: resolver el problema incorrecto

(No sé por qué, pero generalmente se escriben con números romanos)