¿Qué significa regresión logística?
La regresión logística es un algoritmo de aprendizaje supervisado utilizado en el aprendizaje automático para predecir la probabilidad de un resultado binario. Un resultado binario se limita a uno de dos resultados posibles. Algunos ejemplos son sí/no, 0/1 y verdadero/falso.
La regresión lógica se utiliza en el modelado predictivo para analizar grandes conjuntos de datos en los que una o más variables independientes pueden determinar un resultado. El resultado se expresa como una variable dicotómica que tiene uno de dos posibles resultados.
Esencialmente, la regresión logística funciona estimando la probabilidad matemática de que una instancia pertenezca o no a una clase específica.
Definición de regresión logística
La regresión logística utiliza una función llamada Sigmoide para asignar predicciones y sus probabilidades. En un gráfico, si la probabilidad estimada es mayor que un umbral de aceptación predefinido, el modelo predice que la instancia pertenece a esa clase.
Si la probabilidad estimada es inferior al umbral predefinido en el gráfico, el modelo predecirá que la instancia no pertenece a la clase.
En estadística, existen tres tipos básicos de regresión logística:
- Regresión logística binaria: útil para predecir la relación entre una variable dependiente binaria (Y) y una variable independiente (X).
- Regresión logística multinomial: útil para hacer predicciones cuando la variable dependiente tiene dos o más resultados discretos y el orden de los resultados no importa.
- Regresión logística ordinal: útil para hacer predicciones cuando la variable dependiente tiene más de dos resultados discretos y el orden de los resultados tiene cierta importancia.