Fiabilidad

¿Ayudan las Redes Generativas Adversariales (GAN) a entrenar modelos de IA?

Resumen

Los modelos de IA que pretenden simular la inteligencia humana requieren un entrenamiento continuo y nuevos datos para producir resultados de alta calidad. La inteligencia humana es compleja e impredecible, lo que la convierte en un reto para los modelos de IA. Las Redes Generativas Adversariales (GAN) utilizan un método adversarial para entrenar los modelos de IA, lo que les permite evolucionar y mejorar con el tiempo. Aunque las GAN tienen muchos casos de uso práctico y son eficaces para entrenar modelos de IA, su aplicación práctica también tiene limitaciones.

Los modelos de IA que intentan simular la inteligencia humana dependen en gran medida del entrenamiento continuo y de nuevos datos para evitar que se deteriore la calidad del resultado. La inteligencia humana es un asunto complejo de entender porque es impredecible, evoluciona constantemente, se adapta e implica pensamiento creativo, por mencionar sólo algunas de sus características.

Por tanto, los modelos de IA deben evolucionar rápidamente para simular la inteligencia humana, para lo que necesitan datos y la validación de sus resultados. Las Redes Generativas Adversariales (GAN) entrenan los modelos de IA mediante un método adversarial que se describirá más adelante en este artículo para permitir que los modelos evolucionen constantemente y sean mejores.

Las GAN se utilizan ampliamente en el ámbito de la IA y tienen muchos casos de uso. Muchos expertos mencionan que los GAN son eficaces para entrenar modelos de IA, pero también tienen limitaciones prácticas.

¿Qué son las Redes Generativas Adversariales (GAN)?

Intentemos comprender el concepto de Redes Adversariales Generativas (GAN) con un ejemplo sencillo.

Estás aprendiendo a dibujar paisajes bajo la tutela de un profesor de arte que también está aprendiendo a dibujar pero sabe más que tú. Creas una obra de arte y, tras revisarla, el profesor te da algunos comentarios críticos. Vuelves a tu dibujo y lo mejoras en consecuencia.

Mientras has estado trabajando con tu profesor, éste también ha estado aprendiendo a revisar obras de arte, dibujos y otras cosas relacionadas. Mejoras tu dibujo y el profesor, basándose en un mayor aprendizaje, te da más comentarios. El proceso continúa hasta que el profesor considera que el dibujo es suficientemente bueno.

Así es exactamente como funcionan las Redes Adversariales Generativas (GAN). Las Redes Adversariales Generativas (GAN) tienen dos componentes: un generador y un discriminador. Piensa en el generador como el estudiante de arte y en el discriminador como el profesor de arte. El generador toma datos y produce una salida, por ejemplo, la imagen de una montaña. El discriminador revisa los datos y envía comentarios críticos. Sin embargo, el discriminador también revisa la salida basándose en los datos limitados que ha adquirido.

Compara la salida con la salida real y envía sus comentarios. En el proceso, el discriminador aprende mucho sobre los datos del mundo real y el generador aprende mucho de la retroalimentación. El proceso continúa hasta que se produce una salida de alta calidad. Puedes pensar que el generador y el discriminador son adversarios que compiten entre sí para mejorar sus respectivos resultados. En el proceso, se produce una salida mejor.

¿Cómo pueden los GAN entrenar modelos de IA?

Las GAN ejecutan un proceso o flujo estándar para entrenar los modelos de IA. El flujo se describe a continuación.

Inicialización del generador y del discriminador
Inicializar significa poner en marcha tanto el generador como el discriminador con valores o parámetros aleatorios que constituyen la salida. Por ejemplo, la salida puede ser una imagen y los parámetros pueden ser el recuento de píxeles, los valores RGB de los colores y algunos datos del patrón de la imagen. Los datos se eligen aleatoriamente para evitar la posibilidad de cualquier sesgo.

  • Entrenamiento del generador

El generador acepta ruido aleatorio como datos o entradas y genera las muestras de datos sintéticos como salida. Algunos entrenamientos pueden tener ya la salida original para comprobar si el generador puede generar una salida que se aproxime a la original.

  • Entrenamiento del discriminador

El discriminador acepta tanto la salida de datos sintéticos que produce el generador como los datos reales, de modo que pueda comparar ambos para encontrar discrepancias, si las hay. El discriminador se entrena para encontrar discrepancias, pero en sus primeras etapas, es natural esperar que no detecte las discrepancias tan bien como se espera. Sin embargo, los generadores evolucionan rápidamente basándose en sus aprendizajes a partir de los datos que consume regularmente, y con el tiempo, es capaz de evaluar mejor los datos sintéticos.

  • Bucle de retroalimentación adversarial

Un bucle de retroalimentación adversarial significa que tanto el generador como el discriminador aprenden el uno del otro y mejoran. El generador mejora continuamente aplicando la retroalimentación del discriminador, mientras que el discriminador mejora continuamente evaluando la salida de datos sintéticos que produce el generador.

  • Convergencia

Es la etapa final del flujo. La convergencia significa que el generador ya puede producir una salida de datos sintéticos idéntica a la salida de datos reales. El discriminador, tras un entrenamiento riguroso, será incapaz de detectar cualquier desajuste entre la salida de datos reales y la sintética.

Caso práctico

El modelo de IA de NVIDIA Research ha supuesto un avance significativo en el nicho de los GAN. Funciona más rápido y con mayor precisión que la mayoría de los GAN que se utilizan en la industria. El modelo de IA puede recrear las obras de arte de pintores famosos y generar imágenes de células cancerosas con gran precisión. El nombre del modelo de IA es NVIDIA StyleGAN2 y utiliza una innovadora técnica de entrenamiento neuronal para generar obras de arte del Museo Metropolitano de Arte que parecen originales. Esto demuestra que las GAN han evolucionado rápidamente y que pueden entrenar modelos de IA para producir datos sintéticos exactamente iguales a los reales.

Limitaciones

Las GAN tienen algunas limitaciones significativas en lo que se refiere a las dependencias para un rendimiento óptimo.

  • Cuando alimentas con grandes volúmenes de datos tanto al generador como al discriminador, tienden a competir entre sí como adversarios. Aunque ésta es una condición necesaria para el entrenamiento de modelos de IA, el volumen de datos y el procesamiento necesario pueden ejercer una enorme presión sobre las máquinas que puede conducir al fracaso.
  • Las GAN son una propuesta cara debido al coste recurrente de infraestructura y datos. Adquirir datos es costoso debido a cuestiones de propiedad, legales y éticas. En el pasado, las organizaciones han tenido dificultades para obtener datos.
  • El factor coste hace que las GAN sean inaccesibles para organizaciones relativamente pequeñas con limitaciones presupuestarias. Esto puede dar lugar a un desarrollo insuficiente de la tecnología GAN.

Conclusión

Las Redes Generativas Adversariales (GAN) son sin duda una propuesta apasionante y han avanzado rápidamente. Tiene múltiples casos de uso y puede ser increíblemente útil, sobre todo en el sector médico, donde puede ayudar a recrear imágenes y datos para la investigación médica.

Sin embargo, el coste de mantenimiento, los problemas de infraestructura y los enormes problemas de adquisición de datos han resultado ser un obstáculo.

Es necesario que exista un marco consolidado y cohesionado de adquisición de datos que se comprometa con el uso ético de los datos y tenga en cuenta también el coste de la adquisición. Esto es importante para las organizaciones más pequeñas que intentan entrar en el nicho de las GAN.

Temas relacionados

Kaushik Pal
Editor

Kaushik es un arquitecto técnico y consultor de software con más de 23 años de experiencia en análisis de software, desarrollo, arquitectura, diseño, pruebas e industria de capacitación. Tiene interés en nuevas tecnologías y áreas de innovación, centrándose en arquitectura web, tecnologías web, Java/J2EE, código abierto, WebRTC, big data y tecnologías semánticas. Ha demostrado su experiencia en análisis de requisitos, diseño e implementación de arquitecturas, preparación de casos de uso técnico y desarrollo de software. Su experiencia ha abarcado diferentes sectores como seguros, banca, aerolíneas, envíos, gestión de documentos y desarrollo de productos, entre otros. Ha trabajado con una amplia…