¿Qué es el aprendizaje federado de Inteligencia Artificial?
El aprendizaje federado es una técnica de aprendizaje automático (machine learning) en la que múltiples fuentes de datos (por ejemplo, dispositivos o servidores) colaboran para entrenar un modelo compartido, sin necesidad de centralizar los datos.
En lugar de enviar los datos originales a un servidor central, cada fuente (“cliente”) realiza el entrenamiento localmente con sus propios datos, y solo comparte las actualizaciones del modelo (como los gradientes o los pesos).
Tipos de arquitecturas y modalidades del aprendizaje federado
El aprendizaje federado puede organizarse de varias formas. Algunas de las más destacadas:
Federated Learning con servidor central: existe un servidor coordinador que distribuye un modelo inicial a cada cliente, estos lo entrenan localmente y devuelven sus actualizaciones (pesos, gradientes), que son agregadas para formar el modelo global que luego se redistribuye.
Aprendizaje federado descentralizado (DFL, Decentralized FL): no hay servidor central. Los dispositivos clientes intercambian directamente sus actualizaciones entre ellos en una arquitectura de peer-to-peer.
También se pueden clasificar entre los sistemas horizontales y los verticales, según el tipo de información que se esté tratando. Si se trata de una información jerarquizada o en estructura horizontal.
Casos de uso relevantes del aprendizaje federado:
En el sector sanitario, este tipo de programación pueden construir modelos de IA basados en datos de múltiples entidades sin necesidad de compartir datos clínicos sensibles.
Otro de los casos de uso es el reconocimiento de voz y teclados predictivos, o el transporte autónomo mediante el entrenamiento de modelos de reconocimiento de entornos reales.
¿El aprendizaje federado garantiza que no se compartan datos privados o personales?
No, aunque el aprendizaje federado comparte datos en bruto, ya que se limita a compartir gradientes o pesos cambiados, en algunos casos se puede reconstruir parcialmente la información introducida. Siendo necesario aplicar medidas de privacidad adicionales cuando corresponda.
¿Se puede aplicar el aprendizaje federado a cualquier tipo de modelo de inteligencia artificial?
Siempre que el modelo y el tipo de datos permitan entrenamiento distribuido. Pero la eficacia del FL depende del volumen, la heterogeneidad y la capacidad computacional de los participantes. Para modelos extremadamente grandes o cuando la coherencia de datos entre participantes es muy distinta, puede resultar más desafiante.
¿Se puede combinar con otros métodos de privacidad?
Sí. Es habitual combinar el aprendizaje federado con otras PETs (Privacy Enchancing Technologies) como la privacidad diferencial (añadir ruido controlado), cifrado homomórfico, agregación segura entre partes, entornos de ejecución confiables (TEE), etc., para reforzar la protección de los datos y los modelos.
¿Cuándo no conviene usar aprendizaje federado?
Cuando los costos de comunicación son demasiado elevados, cuando los dispositivos clientes no tienen capacidad computacional, cuando los datos de los participantes son tan heterogéneos que la convergencia es difícil, o cuando las ventajas de privacidad no compensan la complejidad añadida frente a un enfoque centralizado controlado y regulado.
El aprendizaje federado es un modo de optimizar costes tan solo actualizando parámetros en entrenamientos distribuidos. En Forlopd ayudamos a empresas y profesionales a adaptar los procesos internos referentes a las exigencias normativas según su actividad profesional. Si necesitas saber si tu entidad cumple, puedes solicitarnos un análisis sin coste aquí.












