Machine Bias

Por que confiar em nós

A seguir, ao decorrer desse artigo, saiba o que é Machine Bias – O que significa Machine Bias – Como funciona Machine Bias e qual o seu significado.

O que significa Machine Bias?

Machine Bias é a tendência de um modelo de aprendizado de máquina fazer previsões imprecisas ou injustas porque há erros sistemáticos no modelo de ML ou nos dados usados para treinar o modelo.

O viés no aprendizado de máquina pode ser causado por uma variedade de fatores. Algumas causas comuns incluem:

  1. Dados de treinamento limitados.
  2. Escolha de um modelo de aprendizado de máquina que não seja adequado ao problema ou que não tenha capacidade suficiente para capturar a complexidade dos dados.
  3. Viés humano introduzido nos processos de coleta de dados, rotulagem ou engenharia de recursos.

O viés do modelo de aprendizado de máquina ocorre quando um cientista ou engenheiro de dados superestima ou subestima a importância de um determinado parâmetro durante o processo de engenharia de recursos e ajuste do algoritmo.

Os parâmetros de aprendizado de máquina são valores escolhidos antes do algoritmo ser treinado e o ajuste é o processo de seleção dos parâmetros que resultarão em uma maior precisão do algoritmo.

Embora a tendência possa ser benéfica em certas situações, como melhorar a compreensão e explicação do modelo simples, pode levar a resultados prejudiciais em outros casos, como em decisões importantes como pontuação de crédito, contratação e saúde.

Isso ocorre porque o viés pode resultar em um tratamento injusto ou discriminatório de determinados grupos, tendo consequências graves no mundo real.

A Techopedia explica o viés de máquina

O viés no aprendizado de máquina é um tópico complicado porque geralmente está entrelaçado com outros fatores, como a qualidade dos dados.

Para garantir que um modelo de ML permaneça justo e imparcial, é importante avaliar continuamente o desempenho do modelo na produção.

Os algoritmos de aprendizado de máquina usam o que aprenderam durante o treinamento para fazer previsões sobre novas entradas.

Quando alguns tipos de informações recebem, por engano, mais ou menos importância do que merecem, os resultados do algoritmo podem ser tendenciosos.

Por exemplo, o software de aprendizado de máquina é usado por sistemas judiciais em algumas partes do mundo para recomendar a duração da prisão de um criminoso condenado.

Estudos descobriram que, quando os dados sobre a raça, a educação e o estado civil de um criminoso são muito ponderados, o resultado do algoritmo provavelmente será tendencioso e o software recomendará sentenças significativamente diferentes para criminosos que foram condenados pelo mesmo crime.

Exemplos de Machine Bias

O Machine Bias pode se manifestar de várias maneiras, como, por exemplo:

  • Viés preditivo: o modelo tem maior probabilidade de fazer previsões específicas para determinados grupos demográficos de indivíduos.
  • Viés de representação: durante o treinamento, determinados dados demográficos são sub-representados ou excluídos.
  • Viés de medição: o modelo é treinado usando dados não confiáveis, incompletos ou distorcidos.
  • Viés algorítmico: o design do modelo ou o algoritmo usado para treiná-lo é inerentemente tendencioso devido a erro humano.

Aqui estão alguns exemplos de histórias nas notícias em que pessoas ou empresas foram prejudicadas pela IA:

Uma investigação de 2016 da ProPublica constatou que o COMPAS, um sistema de IA adotado pelo estado da Flórida, tinha duas vezes mais probabilidade de marcar réus negros como futuros reincidentes do que réus brancos. Isso levantou preocupações sobre o uso da IA no policiamento e na justiça criminal.

Em 2018, foi relatado que a tecnologia de reconhecimento facial da Amazon, conhecida como Rekognition, tinha uma taxa mais alta de imprecisões para mulheres com tons de pele mais escuros. Isso levantou preocupações sobre a possibilidade de a tecnologia ser usada de forma a prejudicar comunidades marginalizadas.

Em 2020, descobriu-se que um chatbot usado pelo Serviço Nacional de Saúde (NHS) do Reino Unido para fazer a triagem de pacientes durante a pandemia de COVID-19 estava fornecendo informações incorretas e orientando as pessoas a buscar tratamento nos lugares errados. Isso levantou preocupações sobre a segurança do uso de IA para tomar decisões médicas.

Em 2021, uma investigação do The Markup descobriu que os credores tinham 80% mais chances de negar empréstimos imobiliários a pessoas de cor do que a pessoas brancas com características financeiras semelhantes. Isso levantou preocupações sobre como os algoritmos de IA de caixa preta estavam sendo usados nas aprovações de hipotecas.

Em 2022, descobriu-se que o iTutorGroup, um grupo de empresas que fornece serviços de tutoria em inglês para estudantes na China, programou seu software de recrutamento on-line para rejeitar automaticamente candidatos do sexo feminino com 55 anos ou mais e candidatos do sexo masculino com 60 anos ou mais. Esse fato levantou preocupações sobre discriminação por idade e resultou na abertura de um processo judicial pela Comissão de Oportunidades Iguais de Emprego (EEOC) dos EUA.

Como detectar o Machine Bias

Há vários métodos que podem ser usados para detectar a tendência da máquina em um modelo de aprendizado de máquina:

  1. Análise de dados: Os dados usados para treinar o modelo são analisados para detectar quaisquer fontes potenciais de viés, como classes desequilibradas ou dados ausentes.
  2. Métricas de justiça: As métricas de justiça, como paridade demográfica ou igualdade de oportunidades, são usadas para avaliar as previsões do modelo para diferentes grupos de indivíduos.
  3. Análise contrafactual: A análise contrafatual é usada para avaliar como as previsões do modelo mudariam se determinados recursos do modelo fossem diferentes.
  4. Inspeção do modelo: Os parâmetros do modelo e os limites de decisão são inspecionados para detectar padrões que possam indicar viés.
  5. Avaliação do desempenho: O desempenho do modelo é avaliado com o uso de um conjunto diversificado de dados para detectar disparidades no desempenho de diferentes grupos.
  6. Abordagem humana no circuito: Especialistas humanos avaliam as previsões do modelo e procuram resultados tendenciosos.

Como evitar o Machine Bias

Há várias técnicas que podem ser usadas para promover a IA responsiva e evitar o Machine Bias nos modelos de aprendizado de máquina. Recomenda-se usar vários métodos e combiná-los da seguinte forma:

  1. Diversificar os dados de treinamento.
  2. Use restrições de justiça, como paridade demográfica e igualdade de oportunidades.
  3. Use algoritmos de correção de viés.
  4. Use técnicas de regularização, como a regularização L1 e L2, para reduzir a complexidade do modelo e promover a generalização.
  5. Auditar e interpretar regularmente as previsões do modelo para detectar e tratar a tendência.
  6. Incorporar feedback e intervenção humana no processo de previsão do modelo para garantir decisões imparciais.

Machine Bias vs. variação

Viés e variação são dois conceitos usados para descrever o desempenho e a precisão de um modelo de aprendizado de máquina. Um modelo com baixa polarização e baixa variação provavelmente terá um bom desempenho em novos dados, enquanto um modelo com alta polarização e alta variação provavelmente terá um desempenho ruim.

  • Os erros de viés são introduzidos pela aproximação de um problema do mundo real com um modelo de ML que é muito simples. Um modelo com alto viés geralmente não se ajusta aos dados porque o modelo não é capaz de capturar a complexidade do problema.
  • A variância refere-se ao erro introduzido quando um modelo de ML presta tanta atenção aos dados de treinamento que não consegue fazer generalizações precisas sobre novos dados. Um modelo de alta variância geralmente se ajusta demais aos dados.

Na prática, encontrar o equilíbrio ideal entre a tendência e a variação pode ser um desafio.

Técnicas como regularização e validação cruzada podem ser usadas para gerenciar a tendência e a variação do modelo e ajudar a melhorar seu desempenho.

Related Terms

Margaret Rouse
Technology Specialist
Margaret Rouse
Especialista em Tecnologia

Margaret é uma premiada redatora e professora conhecida por sua habilidade de explicar assuntos técnicos complexos para um público empresarial não técnico. Nos últimos vinte anos, suas definições de TI foram publicadas pela Que em uma enciclopédia de termos tecnológicos e citadas em artigos do New York Times, Time Magazine, USA Today, ZDNet, PC Magazine e Discovery Magazine. Ela ingressou na Techopedia em 2011. A ideia de Margaret de um dia divertido é ajudar os profissionais de TI e de negócios a aprenderem a falar os idiomas altamente especializados uns dos outros.