Aprendizagem federada, também conhecida como aprendizagem colaborativa, é uma nova abordagem de aprendizado de máquina (ML). Assim, para saber como funciona e o que é aprendizagem federada, leia o artigo abaixo.
O que é Aprendizagem Federada?
Aprendizagem federada, também conhecida como aprendizagem colaborativa, é uma nova abordagem de aprendizado de máquina (ML) que aproveita o poder de fontes de dados descentralizadas, permitindo que modelos sejam treinados colaborativamente em dispositivos ou nós, mantendo os dados localizados, permitindo assim o desenvolvimento eficiente e com preservação da privacidade.
Sob uma abordagem de aprendizado federado, cada dispositivo conectado usará o modelo de inteligência artificial (IA) para processar dados armazenados localmente, que ele usa para atualizar os parâmetros do modelo antes de enviar os resultados de volta ao servidor central. O modelo principal então agrega os resultados juntamente com a saída encaminhada por outros dispositivos na rede.
Processar dados dessa maneira significa que os modelos de IA não precisam ser treinados em um único conjunto de dados localizado em um único servidor, data warehouse ou data lake.
O Google popularizou o aprendizado federado pela primeira vez em 2016 como uma abordagem alternativa ao aprendizado de máquina com o lançamento do Communication-Efficient Learning of Deep Networks from Decentralized Data , um artigo de pesquisa escrito por uma equipe de cientistas pesquisadores do Google.
Como funciona a Aprendizagem Federada?
Em seu primeiro artigo de pesquisa sobre o tópico, o Google explicou que com o aprendizado federado, “cada cliente tem um conjunto de dados de treinamento local que nunca é carregado no servidor. Em vez disso, cada cliente calcula uma atualização para o modelo global atual mantido pelo servidor, e apenas essa atualização é comunicada.”
Um esboço básico da interação entre o servidor central e os dispositivos downstream é descrito abaixo:
- Uma organização implanta um modelo pré-treinado ou não treinado em um servidor central;
- Eles então distribuem o modelo global de IA para clientes, dispositivos ou servidores downstream;
- Os clientes treinam o modelo em dados armazenados localmente sem enviá-los de volta para a nuvem;
- O cliente envia os parâmetros do modelo atualizados de volta ao servidor central (esse processo pode ser criptografado para segurança extra);
- O modelo global de IA agrega os parâmetros encaminhados pelos clientes e atualiza seu processo de tomada de decisão;
- O servidor envia o modelo atualizado de volta para todos os dispositivos e servidores downstream.
Conduzir ML dessa maneira significa que os modelos de IA podem ser treinados continuamente em um conjunto de dados descentralizado com base em dados gerados em tempo real pelos dispositivos do usuário final, mesmo que eles não estejam conectados à Internet.
Isso também significa que as organizações podem combinar o poder computacional de dispositivos distribuídos para acelerar a velocidade e o desempenho do treinamento de modelos.
Por que a Aprendizagem Federada é importante?
O aprendizado federado é uma inovação importante no aprendizado de máquina por vários motivos.
Um dos principais motivos é que ele permite que as organizações movam o treinamento do modelo de IA para a borda da rede. Treinar um modelo de IA centralizado em dados descentralizados armazenados em vários dispositivos significa que insights podem ser extraídos de dispositivos de borda, como servidores, smartphones, dispositivos IoT e wearables.
Ao mesmo tempo, o aprendizado federado é valioso porque sua ausência de processamento centralizado de dados em um servidor de nuvem ajuda a minimizar a quantidade de dados pessoais transferidos e processados por terceiros. A ausência de armazenamento centralizado de dados mantém a privacidade enquanto dá aos usuários mais controle sobre como seus dados são usados e processados.
Nesse sentido, as organizações podem usar o aprendizado federado para reduzir a chance de não conformidade com regulamentações de proteção de dados, como o Regulamento Geral de Proteção de Dados (GDPR) da UE ou a Lei de Portabilidade e Responsabilidade de Seguros de Saúde (HIPAA).
Também é muito útil para organizações que buscam conduzir aprendizado de máquina em setores altamente regulamentados, como os setores financeiro ou de saúde, que precisam ser extremamente cautelosos ao processar informações de identificação pessoal (PII), informações de saúde de pacientes, detalhes de pagamento ou outros dados regulamentados.
Aprendizagem federada centralizada vs. descentralizada
Existem dois tipos principais de aprendizado federado: centralizado e descentralizado. O aprendizado federado centralizado (o tipo mais comum de aprendizado federado descrito acima) é onde os dispositivos na borda da rede usam um modelo centralizado para processar dados armazenados localmente, enviando atualizações para um servidor centralizado.
Em contraste, em vez de usar um servidor central para agregar um modelo de IA, o aprendizado federado descentralizado usa uma rede de dispositivos conectados para agregar parâmetros coletivamente. Essencialmente, cada dispositivo baixa um modelo de IA pré-desenvolvido e o usa para processar dados locais antes de enviar os resultados para outros dispositivos para agregação.
Recurso | Aprendizagem federada centralizada | Aprendizagem Federada Descentralizada |
Abordagem de agregação de modelos | Um servidor central agrega os parâmetros do modelo de todos os dispositivos para processamento e envio de atualizações. | Uma rede de dispositivos conectados agrega coletivamente os parâmetros do modelo. |
Ponto unico de falha | Sim, o servidor central é um ponto único de falha. Se o servidor central cair, a agregação do modelo será interrompida. | Não, não há um único ponto de falha. Se um nó cair, então o resto dos nós podem identificar que ele está inacessível e continuar agregando os resultados do modelo. |
Desempenho | Pode ser lento devido à dependência de um único servidor. | Desempenho geral mais eficiente devido à carga de trabalho distribuída. |
Precisão do modelo | Pode ser mais preciso do que o aprendizado federado descentralizado se o servidor central tiver acesso a muitos dados. | A precisão depende da qualidade dos dados armazenados em cada dispositivo e das capacidades de computação e processamento que eles possuem. |
Latência de processamento | Possível devido ao processamento do servidor central. | Geralmente menor devido à carga de trabalho distribuída. |
Casos de uso | Ideal para casos de uso em que é importante ter um alto grau de precisão, como diagnósticos médicos. | Ideal para casos de uso em que é importante ser resiliente a interrupções, como dispositivos domésticos inteligentes . |
Quais são os benefícios do aprendizado federado?
Há uma série de benefícios essenciais oferecidos pelo aprendizado federado para organizações modernas. Eles incluem:
- As organizações podem criar modelos de IA centralizados e, ao mesmo tempo, atender às regulamentações de conformidade com a privacidade de dados;
- Gere insights de dispositivos na borda da rede;
- Escale para coletar dados de milhões de dispositivos;
- A ausência da necessidade de conexão a um servidor central leva a um treinamento mais rápido do modelo;
- O processamento de dados pode ocorrer localmente em dispositivos sem conexão à Internet;
- Reduza o risco de um servidor central ser alvo ou comprometido.
Resultado Final
A Aprendizagem Federada se tornou uma abordagem crítica ao desenvolvimento de IA para organizações que desejam coletar insights da borda da rede enquanto se protegem de riscos regulatórios.
Se implantado corretamente, o aprendizado federado pode ajudar as organizações a terem confiança para extrair insights de seus dados sem correr o risco de violar regulamentações locais ou internacionais de proteção de dados.