Aprendizado de Máquina (machine learning)

Por que confiar em nós

Aprendizado de máquina (ML) é um subconjunto da inteligência artificial (IA) que usa algoritmos matemáticos e dados para imitar a maneira como os humanos aprendem com a experiência. Em seguida, saiba o que é aprendizado de máquina (machine learning), como funciona e o que significa ML.

O que é aprendizado de máquina (ML)?

O objetivo do aprendizado de máquina é tomar decisões ou previsões informadas com base em interações passadas com tipos semelhantes de dados. Assim, fazer melhores previsões ou decisões à medida que mais dados se tornam disponíveis.

Muitos dos algoritmos de aprendizado de máquina em uso hoje são projetados para fazer previsões.

Eles analisam dados para identificar padrões e correlações e, então, usam esses padrões para prever eventos futuros ou estimar valores desconhecidos.

Algoritmos de aprendizado de máquina mais sofisticados podem tomar decisões usando previsões em conjunto com regras ou políticas predefinidas.

Esse tipo de algoritmo é frequentemente usado para fazer recomendações ou disparar ações diretamente.

Techopedia explica o significado de aprendizado de máquina

Quando cientistas de dados e engenheiros de aprendizado de máquina discutem definições de aprendizado de máquina, eles estão se referindo a algoritmos que podem processar dados, identificar padrões e usá-los para tomar decisões ou fazer previsões sobre novos dados.

Neste contexto, a palavra máquina é sinônimo de programa de computador e a palavra aprendizado descreve como alguns tipos de algoritmos podem usar suas próprias saídas para melhorar iterativamente os cálculos que estão usando para fazer previsões ou tomar decisões.

História da aprendizagem de máquina

No início da década de 1940 , Warren McCulloch e Walter Pitts foram coautores de um artigo inovador que inspirou Alan Turing e outros matemáticos a se interessarem pelo potencial da inteligência artificial de se tornar mais do que apenas um conceito teórico.

O artigo deles, intitulado “ A Logical Calculus of the Ideas Immanent in Nervous Activity ”, introduziu a ideia de que a atividade no cérebro humano pode ser entendida em termos de lógica binária . Isso foi importante porque abriu a porta para entender a inteligência em termos algorítmicos.

Na década de 1950 , o trabalho de Arthur Samuel introduziu o conceito de que a lógica binária, como a inteligência humana, poderia melhorar com a experiência. Na mesma época, Frank Rosenblatt introduziu o Perceptron , uma máquina que podia aprender a reconhecer padrões visuais simples.

O trabalho de Samuel e Rosenblatt abriu caminho para o desenvolvimento de algoritmos mais sofisticados trinta anos depois.

Em 1986 , David E. Rumelhart, Geoffrey Hinton e Ronald J. Williams publicaram um artigo intitulado “ Learning Representations by Back-propagating Errors .”

Este artigo forneceu exemplos claros e demonstrou a eficácia prática de algoritmos de camadas para treinar redes neurais. 

O trabalho deles ajudou a reacender o interesse generalizado em IA e estabeleceu as bases para o que viria a ser conhecido como aprendizado profundo .

Na virada do século, os pesquisadores conseguiram usar o aprendizado profundo para treinar redes neurais muito maiores, o que levou a avanços em tarefas como reconhecimento de imagem e visão computacional.

Avanços posteriores foram alimentados mais tarde pela crescente disponibilidade de big data e computação de GPU .

Como funciona o aprendizado de máquina

O aprendizado de máquina usa algoritmos para analisar entradas de dados, analisá-las e fazer previsões ou tomar decisões.

Aqui está uma explicação simplificada de como o processo normalmente funciona:

  1. Coleção de Dados

    O processo começa com a coleta de grandes quantidades de dados relevantes para a tarefa em questão.
  2. Preparação de Dados

    O próximo passo é limpar os dados coletados e dividi-los em um conjunto de treinamento e um conjunto de teste. A automação de processos robóticos (RPA) pode ser usada para automatizar partes do fluxo de trabalho de pré-processamento de dados.
  3. Escolhendo um algoritmo de Aprendizagem

    Existem muitas abordagens diferentes para projetar algoritmos de aprendizado de máquina, e a escolha depende do tipo de tarefa para a qual o algoritmo será usado.
  4. Treinamento do modelo de aprendizado de máquina

    O processo de treinamento envolve executar o algoritmo em dados de treinamento até que ele entenda padrões nos dados e possa fazer previsões precisas sobre novos dados. Durante o processo de treinamento, o algoritmo usa suas próprias saídas para ajustar parâmetros internos. A versão final do algoritmo após o treinamento é chamada de modelo de aprendizado de máquina.
  5. Avaliação

    Após o treinamento, o modelo é avaliado. Isso envolve usar o conjunto de testes para ver o quão bem o modelo de ML se sai em dados não vistos. Métricas como exatidão, precisão e recall podem ser usadas para medir o desempenho.
  6. Ajuste o Modelo

    Após a avaliação, o modelo pode precisar de ajuda humana para ajustar parâmetros ou mudar para um algoritmo de aprendizado de máquina diferente.
  7. Fazer Previsões

    Depois de treinado e ajustado, o modelo pode ser usado para fazer previsões ou tomar decisões com base em novos dados.

Algoritmos de Aprendizado de Máquina

Os algoritmos de aprendizado de máquina podem ser amplamente classificados pelas tarefas para as quais foram projetados e pela maneira como usam dados para aprender como concluir a tarefa.

Aqui está uma visão geral dos principais tipos de algoritmos de aprendizado de máquina e alguns exemplos notáveis ​​dentro de cada categoria:

Aprendizagem supervisionada

Algoritmos de aprendizado supervisionado são treinados com entradas de dados rotuladas e saídas correspondentes.

Durante o processo de treinamento, esse tipo de algoritmo analisa relacionamentos entre exemplos de entrada e saída.

É assim que ele aprende a prever os valores de saída corretos para novas entradas.

Exemplos desse tipo de algoritmo de aprendizagem incluem:

  • Regressão linear
  • Regressão Logística
  • Máquinas de vetores de suporte (Support Vector Machines)
  • Decision Trees
  • Random Forests

Aprendizagem não supervisionada

Algoritmos de aprendizado não supervisionado recebem quantidades massivas de dados não rotulados durante o treinamento.

Durante o processo de treinamento, esse tipo de algoritmo analisa os dados para procurar padrões e estruturas e, então, usa o que aprende para prever resultados para novos dados.

Exemplos incluem:

  • Agrupamento de K-Means
  • Algoritmos de Associação

Aprendizagem semi-supervisionada

Algoritmos de aprendizado semi-supervisionados usam dados rotulados e não rotulados para treinamento. Normalmente, o processo de treinamento terá uma pequena quantidade de dados rotulados e uma quantidade maior de dados não rotulados. Esse tipo de algoritmo é útil quando o custo de aquisição de dados rotulados é muito alto para implementar o aprendizado totalmente supervisionado.

Aprendizagem por reforço

Algoritmos de aprendizado por reforço agem como um agente que observa o estado de um ambiente durante o treinamento, toma uma decisão e recebe feedback positivo ou negativo sobre a decisão. O agente usa o feedback para criar e ajustar uma política que pode ser usada para dados novos e não vistos.

Exemplos notáveis ​​incluem:

  • Q-aprendizagem
  • Aprendizagem por reforço profundo

Aprendizagem profunda

Algoritmos de aprendizado profundo colocam algoritmos em camadas uns sobre os outros em uma rede neural. Cada camada processa a entrada realizando cálculos e então passa os resultados para a próxima camada. Quando os dados chegam à camada final, a rede terá transformado os dados de entrada em saída que pode ser usada para fazer previsões ou decisões. O aprendizado profundo é particularmente eficaz no processamento de dados não estruturados, como imagens e vídeo, fala e texto.

Exemplos incluem:

  • Redes Neurais Convolucionais (CNNs)
  • Redes Neurais Recorrentes (RNNs)

Aprendizado de máquina vs. Aprendizado profundo vs. IA

Artigos de notícias e cultura pop frequentemente usam “IA” como um termo geral, mesmo quando se referem a tipos específicos de IA, como aprendizado de máquina ou aprendizado profundo. Termos como “aprendizado”, “algoritmo” e “dados” são usados ​​em todos os três campos, o que pode fazê-los parecer mais semelhantes do que realmente são.

Para diferenciá-los, pode ser útil pensar em como cada um desses termos no significado do aprendizado de máquina se relaciona com o outro.

Simplificando, o aprendizado profundo é um tipo específico de aprendizado de máquina, e o aprendizado de máquina é um tipo específico de inteligência artificial.

    Tipos de implantação de aprendizado de máquina

    O machine learning pode ser implantado internamente, na nuvem e na borda de uma rede . Cada tipo de implantação tem vantagens e desafios, e a escolha geralmente depende das necessidades específicas do aplicativo em termos de velocidade, custo, segurança e requisitos de conformidade regulatória.

    Aqui estão alguns tipos comuns de implantações de aprendizado de máquina:

    1. Implantação no local1. Implantação baseada em nuvem3. Implantação de Borda4. Implantação Híbrida

    Essa abordagem envolve a implantação de modelos de machine learning diretamente na infraestrutura de TI de uma organização. Esse tipo de implantação permite que uma organização tenha controle total sobre o ambiente de hardware e software.

    Muitas organizações optam por implementar seus modelos de machine learning na nuvem devido à flexibilidade, escalabilidade e redução de overhead que ela oferece. Provedores de nuvem como AWS , Google Cloud e Microsoft Azure podem fornecer plataformas poderosas que darão suporte a todo o ciclo de vida do machine learning, desde o pré-processamento de dados e treinamento de modelos até a implementação e monitoramento.

    Nessa implementação, modelos de machine learning são usados ​​em dispositivos de ponta como smartphones,  Internet das Coisas (IoT) ou servidores locais . Essa abordagem é útil para aplicativos que exigem processamento em tempo real e precisam tomar decisões sem a latência que pode advir da comunicação bidirecional com um servidor central.

    Uma abordagem híbrida combina implantações no local e na nuvem . Por exemplo, dados e computações críticas podem ser manipulados no local por motivos de segurança, enquanto tarefas menos sensíveis são transferidas para a nuvem para se beneficiar de sua escalabilidade, eficiência e custo relativamente baixo.

    Aprendizado de máquina como serviço

    O aprendizado de máquina como serviço (MLaaS) é uma tendência de rápido crescimento na qual provedores de serviços terceirizados ou provedores de serviços gerenciados oferecem recursos de aprendizado de máquina por meio de um modelo de assinatura ou de preço por uso.

    Essa abordagem permite que as empresas usem tecnologias de aprendizado de máquina sem a necessidade de investir e manter a infraestrutura ou a equipe subjacentes.

    O MLaaS pode ser uma opção econômica para organizações que desejam experimentar aprendizado de máquina ou implementar recursos de ML rapidamente, mas não têm conhecimento profundo e/ou infraestrutura subjacente.

    O que causa viés no aprendizado de máquina?

    O viés da máquina é uma questão complexa que pode ser influenciada por uma combinação de fatores humanos, algorítmicos e relacionados a dados .

    Quando os dados usados ​​para treinar um modelo não refletem com precisão a diversidade do mundo real, ou se contêm vieses históricos, o modelo aprenderá esses vieses e os replicará.

    Os parâmetros que um modelo ajusta autonomamente durante o treinamento também podem causar viés. Se recursos importantes que podem influenciar as saídas forem omitidos, ou se recursos irrelevantes receberem muito peso, a precisão e a imparcialidade do modelo podem ser comprometidas.

    Erros humanos na escolha de algoritmos, sua interpretação e sua implantação também desempenham um grande papel no viés da máquina. Priorizar certas métricas em detrimento de outras pode influenciar como um modelo é ajustado e, consequentemente, como ele se desempenha em vários grupos.

    Lidar com o viés do aprendizado de máquina não é simples. Assim, requer atenção à qualidade e representatividade dos dados, o desenvolvimento de algoritmos que podem mitigar o viés, ferramentas de transparência que podem entender o raciocínio por trás das decisões do modelo e supervisão humana contínua para identificar e corrigir o viés que o modelo perpetua.

    Exemplos e aplicações de aprendizado de máquina 

    As aplicações de aprendizado de máquina são versáteis e o impacto da tecnologia pode ser sentido em praticamente todos os aspectos do ambiente de trabalho atual, em muitos setores da economia.

    Assistência médica

    Aplicação : Diagnóstico de doenças

    Descrição : Analisar imagens médicas para detectar e diagnosticar doenças.

    Aplicação : Descoberta de Medicamentos

    Descrição : Acelere o desenvolvimento de medicamentos e reduza os custos experimentais.

    Finanças

    Aplicação : Detecção de Fraude

    Descrição : Analise o comportamento de gastos para identificar transações fraudulentas em tempo real.

    Aplicação : Negociação Algorítmica

    Descrição : Preveja mudanças no mercado de ações e execute negociações nos momentos ideais.

    Varejo

    Aplicação : Recomendações Personalizadas

    Descrição : Analisar o comportamento do cliente para recomendar produtos.

    Aplicação : Gestão de estoque

    Descrição : Prever a demanda do produto para otimizar os níveis de estoque.

    Automotivo e Transporte

    Aplicação : Veículos Autônomos

    Descrição : Planeje caminhos, evite obstáculos e tome decisões em tempo real.

    Aplicação : Otimização de Rotas

    Descrição : Otimize as rotas de entrega considerando o trânsito, o clima e outras variáveis.

    Tecnologia e Entretenimento

    Aplicação : Reconhecimento de Fala

    Descrição : Permita que assistentes virtuais processem e respondam a comandos de voz.

    Aplicação : Recomendação de conteúdo

    Descrição : Recomendar mídia com base nas preferências e hábitos individuais do usuário.

    Agricultura

    Aplicação : Previsão de rendimento

    Descrição : Analise dados de sensores para prever o rendimento das colheitas.

    Aplicação : Detecção de doenças e pragas

    Descrição : Analise imagens de drones ou dispositivos terrestres para detectar doenças e pragas em plantações.

    Educação

    Aplicação : Sistemas de Aprendizagem Adaptativos

    Descrição : Reúna e adapte o conteúdo para acomodar o ritmo e os estilos de aprendizagem de cada aluno.

    Prós e contras do aprendizado de máquina

    O aprendizado de máquina oferece muitas vantagens, mas também traz muitos desafios.

    Uma das vantagens mais significativas é a capacidade da tecnologia de processar e analisar grandes quantidades de dados muito mais rápido e eficientemente do que os humanos.

    Essa capacidade permite que as empresas obtenham insights de seus dados proprietários que antes eram impossíveis ou financeiramente impraticáveis ​​de obter.

    Como os sistemas de machine learning podem aprender com novos dados , eles podem melhorar seu próprio desempenho com intervenção humana mínima.

    Além de facilitar a tomada de decisões orientada por dados , seu uso ajudará as organizações a aumentar a eficiência e os funcionários a melhorar sua produtividade pessoal .

    É importante lembrar, no entanto, que o aprendizado de máquina também tem suas desvantagens.

    Uma grande preocupação envolve a quantidade e a qualidade dos dados usados ​​para treinar algoritmos.

    Se os dados de treinamento forem tendenciosos ou incompletos, o modelo provavelmente terá um desempenho ruim ou perpetuará vieses existentes, o que pode levar a resultados injustos ou prejudiciais.

    Isso é particularmente importante em softwares de aprendizado de máquina usados ​​em gestão de recursos humanos ou aplicação da lei , onde decisões tendenciosas de IA podem ter sérias implicações na vida das pessoas.

    Outra desvantagem é que alguns tipos de modelos de aprendizado de máquina, como modelos de grandes linguagens (LLMs), exigem muito poder computacional, o que pode ser caro e ambientalmente exigente .

    A complexidade de modelos sofisticados também os torna difíceis de entender e interpretar, o que pode levar a modelos de caixa preta , uma condição na qual o processo de previsão e/ou tomada de decisão é opaco e não facilmente explicável .

    A falta de transparência pode ser uma barreira em setores onde entender o processo de tomada de decisão é importante para determinar a responsabilidade legal se as saídas de um modelo de aprendizado de máquina forem falhas.

    Por último, e talvez o mais importante, o aprendizado de máquina pode aumentar os riscos de segurança se a tecnologia não for bem projetada e/ou implementada.

    Ataques cibernéticos em dados de treinamento e modelos de machine learning podem ser difíceis de detectar e impactar severamente os resultados.

    O gerenciamento de segurança desempenha um papel importante tanto no desenvolvimento de machine learning quanto nas operações de machine learning (MLops).

    MLOps

    Operações de aprendizado de máquina são uma abordagem para gerenciar o ciclo de vida do modelo de aprendizado de máquina que é modelada após DevOps , uma abordagem bem estabelecida para gerenciar holisticamente os ciclos de desenvolvimento de software.

    As melhores práticas de MLOps visam preencher a lacuna entre o desenvolvimento, a implantação e a manutenção do machine learning em ambientes de produção.

    O objetivo é garantir que os modelos evitem desvios de modelo e continuem a fornecer previsões precisas e a tomar decisões úteis sob condições de mudança.

    O ideal é que as equipes de MLOps sejam formadas por cientistas de dados , engenheiros de dados , desenvolvedores de software , engenheiros de aprendizado de máquina e equipe de gerenciamento de operações de TI .

    Para serem mais eficazes, as equipes de MLOps também devem ajudar a garantir que os modelos de ML que desenvolvem, implementam e oferecem suporte sejam escaláveis, reproduzíveis e transparentes.

    Como se tornar um engenheiro de aprendizado de máquina

    Engenheiros de aprendizado de máquina desempenham um papel importante em MLOps.

    Candidatos a empregos bem remunerados em aprendizado de máquina devem ter diploma em ciência da computação ou área relacionada e sólida formação em matemática e estatística.

    Essa função normalmente exige habilidades de programação em linguagens como Python ou R e exige que os candidatos tenham conhecimento prático de TensorFlow e PyTorch .

    Também é importante que os candidatos a emprego entendam todos os tipos de algoritmos de machine learning, bem como diferentes tipos de modelos de implantação.

    Experiência prática pode ser adquirida por meio de projetos pessoais, estágios ou contribuições para projetos de machine learning de código aberto no GitHub .

    O aprendizado de máquina tem tantas aplicações no mundo real que, à medida que os engenheiros de ML ganham mais experiência, eles frequentemente se especializam em uma área de nicho da tecnologia que requer habilidades específicas.

    Os candidatos interessados ​​em processamento de linguagem natural (NLP) ou visão computacional , por exemplo, devem ter um conhecimento prático de redes neurais e aprendizado profundo e considerar adquirir certificações para ambas as áreas de especialização.

    Resultado Final

    O aprendizado de máquina é um subconjunto poderoso da inteligência artificial que usa algoritmos para aprender com dados e fazer previsões ou decisões sem ser explicitamente programado para todas as possibilidades.

    O aprendizado de máquina está sendo cada vez mais usado para obter insights de big data, automatizar fluxos de trabalho e tomar decisões baseadas em dados em tempo real.

    Manter sistemas de aprendizado de máquina em produção requer esforços contínuos para garantir que as saídas do modelo permaneçam precisas, úteis e imparciais conforme os dados de entrada e as condições mudam.

    Perguntas Frequentes

    O que é aprendizado de máquina em termos simples?

    Qual é a diferença entre IA e ML?

    Quais são os quatro princípios básicos do aprendizado de máquina?

    Qual é o principal objetivo do aprendizado de máquina?

    Related Terms

    Margaret Rouse
    Technology Specialist
    Margaret Rouse
    Especialista em Tecnologia

    Margaret é uma premiada redatora e professora conhecida por sua habilidade de explicar assuntos técnicos complexos para um público empresarial não técnico. Nos últimos vinte anos, suas definições de TI foram publicadas pela Que em uma enciclopédia de termos tecnológicos e citadas em artigos do New York Times, Time Magazine, USA Today, ZDNet, PC Magazine e Discovery Magazine. Ela ingressou na Techopedia em 2011. A ideia de Margaret de um dia divertido é ajudar os profissionais de TI e de negócios a aprenderem a falar os idiomas altamente especializados uns dos outros.