¿Qué es el aprendizaje federado?
El aprendizaje federado, también conocido como aprendizaje colaborativo, es un enfoque novedoso del aprendizaje automático que aprovecha la potencia de las fuentes de datos descentralizadas, permitiendo que los modelos se entrenen de forma colaborativa a través de dispositivos o nodos, manteniendo los datos localizados, lo que permite preservar la privacidad y desarrollar modelos eficientes.
Con un enfoque de aprendizaje federado, cada dispositivo conectado utilizará el modelo de inteligencia artificial (IA) para procesar los datos almacenados localmente, que utilizará para actualizar los parámetros del modelo antes de enviar los resultados al servidor central. A continuación, el modelo principal agrega los resultados a los enviados por otros dispositivos de la red.
Procesar los datos de este modo significa que los modelos de IA no necesitan entrenarse en un único conjunto de datos ubicado en un único servidor, almacén de datos o lago de datos.
Google popularizó por primera vez el aprendizaje federado en 2016 como un enfoque alternativo al aprendizaje automático con la publicación de Communication-Efficient Learning of Deep Networks from Decentralized Data, un trabajo de investigación escrito por un equipo de científicos de investigación de Google.
¿Cómo funciona el aprendizaje federado?
En su primer artículo de investigación sobre el tema, Google explica que, con el aprendizaje federado, “cada cliente tiene un conjunto de datos de entrenamiento local que nunca se carga en el servidor. En su lugar, cada cliente calcula una actualización del modelo global actual mantenido por el servidor, y sólo se comunica esta actualización”.
A continuación se presenta un esquema básico de la interacción entre el servidor central y los dispositivos posteriores:
- Una organización despliega un modelo preentrenado o sin entrenar en un servidor central;
- A continuación, distribuye el modelo global de IA a los clientes, dispositivos o servidores posteriores;
- Los clientes proceden a entrenar el modelo con los datos almacenados localmente sin enviarlos de vuelta a la nube;
- El cliente envía los parámetros actualizados del modelo al servidor central (este proceso puede cifrarse para mayor seguridad);
- El modelo global de IA agrega los parámetros enviados por los clientes y actualiza su proceso de toma de decisiones;
- El servidor envía el modelo actualizado a todos los dispositivos y servidores posteriores.
Llevar a cabo el ML de esta manera significa que los modelos de IA pueden entrenarse continuamente en un conjunto de datos descentralizado basado en los datos generados en tiempo real por los dispositivos de los usuarios finales, incluso si no están conectados a Internet.
También significa que las organizaciones pueden combinar la potencia computacional de los dispositivos distribuidos para acelerar la velocidad y el rendimiento del entrenamiento de los modelos.
¿Por qué es importante el aprendizaje federado?
El aprendizaje federado es una innovación importante en el aprendizaje automático por varias razones.
Una de las principales es que permite a las organizaciones trasladar el entrenamiento de los modelos de IA a los extremos de la red. Entrenar un modelo de IA centralizado en datos descentralizados almacenados en múltiples dispositivos significa que se pueden extraer conocimientos de los dispositivos periféricos, como servidores, smartphones, dispositivos IoT y wearables.
Al mismo tiempo, el aprendizaje federado es valioso porque su falta de procesamiento de datos centralizado en un servidor en la nube ayuda a minimizar la cantidad de datos personales transferidos y procesados por terceros. La falta de almacenamiento centralizado de datos mantiene la privacidad al tiempo que ofrece a los usuarios un mayor control sobre cómo se utilizan y procesan sus datos.
En este sentido, las organizaciones pueden utilizar el aprendizaje federado para reducir la posibilidad de incumplimiento de las normativas de protección de datos, como el Reglamento General de Protección de Datos (GDPR) de la UE o la Ley de Portabilidad y Responsabilidad del Seguro Médico (HIPAA).
También es muy útil para las organizaciones que buscan llevar a cabo el aprendizaje automático en sectores muy regulados, como el financiero o el sanitario, que deben ser extremadamente cautelosos a la hora de procesar información de identificación personal (PII), información sanitaria de pacientes, detalles de pagos u otros datos regulados.
Aprendizaje federado centralizado frente a descentralizado
Existen dos tipos principales de aprendizaje federado: centralizado y descentralizado. El aprendizaje federado centralizado (el tipo más común de aprendizaje federado descrito anteriormente) es aquel en el que los dispositivos situados en el borde de la red utilizan un modelo centralizado para procesar los datos almacenados localmente, enviando las actualizaciones a un servidor centralizado.
En cambio, en lugar de utilizar un servidor central para agregar un modelo de IA, el aprendizaje federado descentralizado utiliza una red de dispositivos conectados para agregar parámetros colectivamente. Esencialmente, cada dispositivo descarga un modelo de IA predesarrollado y lo utiliza para procesar datos locales antes de enviar los resultados a otros dispositivos para su agregación.
Característica | Aprendizaje Federado Centralizado | Aprendizaje Federado Descentralizado |
---|---|---|
Enfoque de agregación del modelo | Un servidor central agrega los parámetros del modelo de todos los dispositivos para procesarlos y enviar actualizaciones. | Una red de dispositivos conectados agrega colectivamente los parámetros del modelo. |
Punto único de fallo | Sí, el servidor central es un punto único de fallo. Si se cae el servidor central, la agregación del modelo se detendrá. | No, no hay un punto único de fallo. Si un nodo se cae, el resto de los nodos pueden identificar que es inalcanzable y continuar agregando los resultados del modelo. |
Rendimiento | Puede ser lento debido a la dependencia de un solo servidor. | Rendimiento general más eficiente debido a que la carga de trabajo está distribuida. |
Precisión del modelo | Puede ser más precisa que el aprendizaje federado descentralizado si el servidor central tiene acceso a muchos datos. | La precisión depende de la calidad de los datos almacenados en cada dispositivo y de las capacidades de cálculo y procesamiento que poseen. |
Latencia de procesamiento | Posible debido al procesamiento del servidor central. | Generalmente menor debido a la carga de trabajo distribuida. |
Casos de uso | Ideal para casos de uso donde es importante tener un alto grado de precisión, como el diagnóstico médico. | Ideal para casos de uso donde es importante ser resistente a interrupciones, como dispositivos inteligentes para el hogar. |
¿Cuáles son las ventajas del aprendizaje federado?
El aprendizaje federado ofrece una serie de ventajas fundamentales a las organizaciones modernas. Entre ellas se incluyen:
- Las organizaciones pueden crear modelos de IA centralizados a la vez que cumplen las normativas de privacidad de datos;
- Generar conocimientos a partir de dispositivos en el borde de la red;
- Escalar para recopilar datos de millones de dispositivos;
- La falta de necesidad de conectarse a un servidor central conduce a un entrenamiento más rápido del modelo;
- El procesamiento de datos puede realizarse localmente en dispositivos sin conexión a Internet;
- Reducir el riesgo de que un servidor central se convierta en objetivo o se vea comprometido.
Conclusión
El aprendizaje federado se ha convertido en un enfoque fundamental del desarrollo de la IA para las organizaciones que desean recopilar información desde el extremo de la red y, al mismo tiempo, protegerse de los riesgos normativos.
Si se despliega correctamente, el aprendizaje federado puede ayudar a las organizaciones a tener la confianza necesaria para extraer información de sus datos sin arriesgarse a infringir las normativas locales o internacionales de protección de datos.