Aprendizaje de disparo cero, un disparo y pocos disparos

Fiabilidad

¿Qué significa aprendizaje de disparo cero, un disparo y pocos disparos?

El aprendizaje cero, el aprendizaje de pocos disparos y el aprendizaje de un solo disparo son técnicas que permiten a un modelo de aprendizaje automático hacer predicciones para nuevas clases con datos etiquetados limitados. La elección de la técnica depende del problema específico y de la cantidad de datos etiquetados disponibles para nuevas categorías o etiquetas (clases).

Aprendizaje único: cada nueva clase tiene un ejemplo etiquetado. El objetivo es hacer predicciones para las nuevas clases basándose en este único ejemplo.

Aprendizaje de pocos ejemplos: hay un número limitado de ejemplos etiquetados para cada nueva clase. El objetivo es hacer predicciones para las nuevas clases basándose en unos pocos ejemplos de datos etiquetados.

Aprendizaje de cero disparos: no hay absolutamente ningún dato etiquetado disponible para las nuevas clases. El objetivo es que el algoritmo haga predicciones sobre nuevas clases utilizando el conocimiento previo sobre las relaciones que existen entre las clases que ya conoce. En el caso de los grandes modelos lingüísticos (LLM) como ChatGPT, por ejemplo, es probable que el conocimiento previo incluya similitudes semánticas.

Definición de aprendizaje de cero, un disparo y pocos disparos

El aprendizaje de disparo cero, de pocos disparos y de un solo disparo son conceptos importantes en la investigación de la IA porque, cuando se ejecutan con éxito, permiten que los sistemas de IA sean más flexibles, escalables y eficaces en escenarios del mundo real.

Entre los distintos enfoques del aprendizaje sin disparos, con pocos disparos y con un solo disparo se incluyen:

Enfoques basados en atributos: el modelo utiliza las relaciones entre atributos para generalizar sus conocimientos y aplicarlos a nuevas clases, en lugar de basarse en ejemplos etiquetados.

Enfoques basados en la incrustación: el modelo infiere información sobre nuevas clases basándose en su proximidad a clases conocidas en el espacio de incrustación.

Enfoques generativos: el modelo genera ejemplos sintéticos de categorías desconocidas basándose en su representación semántica.

Modelos basados en métricas: el modelo aprende una métrica de similitud entre las características de los datos de entrada y las características de cada clase y, a continuación, utiliza esta métrica para hacer predicciones sobre clases nuevas y desconocidas.

Modelos basados en redes neuronales: el modelo utiliza redes neuronales convolucionales (CNN) o redes neuronales recurrentes (RNN) para aprender sobre las correlaciones entre los datos de entrada y las predicciones de clase.

Modelos basados en el aprendizaje por transferencia: el modelo se entrena previamente con cantidades ingentes de datos de entrenamiento de uso general y luego se ajusta con datos etiquetados específicos para una tarea concreta.

Importancia del aprendizaje cero, uno y pocos disparos

En muchos escenarios del mundo real, no es factible recopilar y etiquetar grandes cantidades de datos para cada clase o concepto posible que pueda encontrar un modelo. Permitir que los modelos manejen clases nuevas y desconocidas con pocos o ningún dato etiquetado adicional puede mejorar la escalabilidad y ayudar a reducir los costes asociados con el etiquetado y la anotación de datos.

Temas relacionados

Margaret Rouse
Technology Specialist
Margaret Rouse
Experta en tecnología

Margaret Rouse es una galardonada escritora técnica y profesora conocida por su habilidad para explicar temas técnicos complejos a una audiencia de negocios no técnica. Durante los últimos veinte años, sus explicaciones han aparecido en sitios web de TechTarget y ha sido citada como autoridad en artículos del New York Times, Time Magazine, USA Today, ZDNet, PC Magazine y Discovery Magazine. La idea de diversión de Margaret es ayudar a profesionales de TI y negocios a aprender a hablar los idiomas altamente especializados de cada uno. Si tienes una sugerencia para una nueva definición o cómo mejorar una explicación técnica,…