Sesgo de las Máquinas

Fiabilidad

¿Qué es el sesgo en aprendizaje automático o machine learning?

El sesgo es la tendencia de un modelo de machine learning a hacer predicciones inexactas o injustas porque hay errores sistemáticos en el modelo de ML o en los datos utilizados para entrenar el modelo.

El sesgo en el machine learning puede deberse a diversos factores. Algunas causas comunes incluyen:

  1. Datos de entrenamiento limitados.
  2. Elección de un modelo de machine learning que no se adapta bien al problema o no tiene capacidad suficiente para captar la complejidad de los datos.
  3. Sesgo humano introducido en los procesos de recopilación de datos, etiquetado o asignación de atributos.

El sesgo de la máquina suele ser el resultado de que un científico o ingeniero de datos sobrestime o subestime la importancia de un hiperparámetro concreto durante la asignación de atributos y el proceso de ajuste algorítmico. Un hiperparámetro es un parámetro de machine learning cuyo valor se elige antes de entrenar el algoritmo de aprendizaje. El ajuste es el proceso de selección de los hiperparámetros que minimizarán las funciones de pérdida de un algoritmo de aprendizaje y proporcionarán los resultados más precisos.

Es importante señalar que el sesgo de máquina puede utilizarse para mejorar la interpretabilidad de un modelo ML en determinadas situaciones. Por ejemplo, un modelo lineal simple con un sesgo alto será más fácil de entender y explicar que un modelo complejo con un sesgo bajo.

Sin embargo, cuando un modelo de machine learning o aprendizaje automático debe realizar predicciones y tomar decisiones, el sesgo puede hacer que los algoritmos de aprendizaje automático produzcan resultados subóptimos que pueden ser perjudiciales. Esto es especialmente cierto en el caso de la puntuación de crédito, la contratación, el sistema judicial y la asistencia sanitaria. En estos casos, el sesgo puede dar lugar a un trato injusto o discriminatorio de determinados grupos y tener graves consecuencias en el mundo real.

Diccionario Techopedia: Sesgo de las máquinas

El sesgo en el aprendizaje automático es un tema complicado porque a menudo está entrelazado con otros factores, como la calidad de los datos. Para garantizar que un modelo de ML sigue siendo justo e imparcial, es importante evaluar continuamente el rendimiento del modelo en producción.

Los algoritmos de machine learning utilizan lo que aprenden durante el entrenamiento para hacer predicciones sobre nuevos datos de entrada. Cuando a algunos tipos de información se les asigna erróneamente más -o menos- importancia de la que merecen, los resultados del algoritmo pueden estar sesgados.

Por ejemplo, los sistemas judiciales de algunas partes del mundo utilizan software de machine learening para recomendar cuánto tiempo debe permanecer en prisión un delincuente condenado. Los estudios han descubierto que cuando los datos sobre la raza, la educación y el estado civil de un delincuente se ponderan demasiado, es probable que el resultado algorítmico esté sesgado y el software recomiende sentencias significativamente diferentes para delincuentes que han sido condenados por el mismo delito.

Ejemplos de sesgo en machine learning

El sesgo puede manifestarse de varias formas, como por ejemplo:

  • Sesgo predictivo: es más probable que el modelo haga predicciones específicas para determinados grupos demográficos de individuos.
  • Sesgo de representación: durante el entrenamiento, determinados datos demográficos están infrarrepresentados o excluidos.
  • Sesgo de medición: el modelo se entrena utilizando datos poco fiables, incompletos o sesgados.
  • Sesgo algorítmico: el diseño del modelo o el algoritmo utilizado para entrenarlo está intrínsecamente sesgado debido a un error humano.

A continuación se exponen algunos ejemplos de noticias en las que personas o empresas se han visto perjudicadas por la inteligencia artificial:

Una investigación realizada en 2016 por ProPublica descubrió que COMPAS, un sistema de IA adoptado por el estado de Florida, tenía el doble de probabilidades de señalar a los acusados negros como futuros reincidentes que a los acusados blancos. Esto planteó preocupaciones sobre el uso de la IA en la policía y la justicia penal.

En 2018, se informó que la tecnología de reconocimiento facial de Amazon, conocida como Rekognition, tenía una mayor tasa de imprecisiones para las mujeres con tonos de piel más oscuros. Esto planteó preocupaciones sobre el potencial de la tecnología para ser utilizada de maneras que podrían perjudicar a las comunidades marginadas.

En 2020, se descubrió que un chatbot utilizado por el Servicio Nacional de Salud del Reino Unido (NHS) para clasificar a los pacientes durante la pandemia de COVID-19 proporcionaba información incorrecta y dirigía a las personas a buscar tratamiento en lugares equivocados. Esto suscitó dudas sobre la seguridad de utilizar IA para tomar decisiones médicas.

En 2021, una investigación de The Markup descubrió que los prestamistas tenían un 80% más de probabilidades de denegar préstamos hipotecarios a personas de color que a blancos con características financieras similares. Esto suscitó preocupación por el uso de algoritmos de IA en la aprobación de hipotecas.

En 2022, se descubrió que iTutorGroup, un grupo de empresas que ofrece servicios de tutoría en inglés a estudiantes chinos, había programado su software de selección de personal en línea para rechazar automáticamente a solicitantes de 55 años o más y a solicitantes de 60 años o más. Esto suscitó preocupación por la discriminación por edad y dio lugar a que la Comisión para la Igualdad de Oportunidades en el Empleo de Estados Unidos (EEOC) interpusiera una demanda.

Cómo detectar el sesgo en machine learning

Hay varios métodos que se pueden utilizar para detectar el sesgo de la máquina en un modelo de machine learning:

  1. Análisis de datos: Los datos utilizados para entrenar el modelo se analizan para detectar cualquier fuente potencial de sesgo, como clases desequilibradas o datos que faltan.
  2. Métricas de equidad: Las métricas de imparcialidad, como la paridad demográfica o la igualdad de oportunidades, se utilizan para evaluar las predicciones del modelo para diferentes grupos de individuos.
  3. Análisis contrafáctico: El análisis contrafáctico se utiliza para evaluar cómo cambiarían las predicciones del modelo si ciertas características del modelo fueran diferentes.
  4. Inspección del modelo: Los parámetros del modelo y los límites de decisión se inspeccionan para detectar patrones que puedan indicar un sesgo.
  5. Evaluación del rendimiento: El rendimiento del modelo se evalúa utilizando un conjunto diverso de datos para detectar disparidades en el rendimiento de los distintos grupos.
  6. Enfoque humano: Expertos humanos evalúan las predicciones del modelo y buscan resultados sesgados.

Cómo evitar el sesgo automático

Existen varias técnicas que pueden utilizarse para fomentar una IA receptiva y evitar el sesgo de máquina en los modelos de machine learning. Se recomienda utilizar varios métodos y combinarlos haciendo lo siguiente:

  1. Diversificar los datos de entrenamiento.
  2. Utilizar restricciones de equidad como la paridad demográfica y la igualdad de oportunidades.
  3. Utilizar algoritmos de corrección de sesgos.
  4. Utilizar técnicas de regularización como la regularización L1 y L2 para reducir la complejidad del modelo y promover la generalización.
  5. Auditar e interpretar periódicamente las predicciones del modelo para detectar y corregir los sesgos.
  6. Incorporar la retroalimentación y la intervención humana en el proceso de predicción del modelo para garantizar decisiones imparciales.

Sesgo y varianza o divergencia de una máquina

El sesgo y la varianza o divergencia son dos conceptos que se utilizan para describir el rendimiento y la precisión de un modelo de aprendizaje automático. Un modelo con un sesgo y una varianza o divergencia bajos es probable que funcione bien con datos nuevos, mientras que un modelo con un sesgo y una varianza o divergencias altos es probable que funcione mal.

  • Los errores de sesgo se introducen al aproximar un problema del mundo real con un modelo de ML demasiado simple. Un modelo con un sesgo alto suele ajustarse mal a los datos porque el modelo no es capaz de captar la complejidad del problema.
  • La varianza se refiere al error que se introduce cuando un modelo ML presta tanta atención a los datos de entrenamiento que no puede hacer generalizaciones precisas sobre nuevos datos. Un modelo de alta varianza suele ajustarse en exceso a los datos.

En la práctica, encontrar el equilibrio óptimo entre sesgo y varianza puede resultar complicado. Técnicas como la regularización y la validación cruzada pueden utilizarse para gestionar el sesgo y la varianza del modelo y ayudar a mejorar su rendimiento.

Temas relacionados

Margaret Rouse
Senior Editor
Margaret Rouse
Experta en tecnología

Margaret Rouse es una galardonada escritora técnica y profesora conocida por su habilidad para explicar temas técnicos complejos a una audiencia de negocios no técnica. Durante los últimos veinte años, sus explicaciones han aparecido en sitios web de TechTarget y ha sido citada como autoridad en artículos del New York Times, Time Magazine, USA Today, ZDNet, PC Magazine y Discovery Magazine. La idea de diversión de Margaret es ayudar a profesionales de TI y negocios a aprender a hablar los idiomas altamente especializados de cada uno. Si tienes una sugerencia para una nueva definición o cómo mejorar una explicación técnica,…