El problema de la necesidad de datos al entrenar modelos de inteligencia artificial
Cada vez la población hace un uso mayor en su día a día de dispositivos tecnológicos que utilizan inteligencia artificial. Entre estos dispositivos se incluyen las smart TV, teléfonos inteligentes, altavoces inteligentes, dispositivos de salud autónomos, etc. Ya son parte de nuestra vida, haciéndola más sencilla, independientemente de la edad.
Todos estos dispositivos se basan en algoritmos de distinto tipo. Para desarrollar estos algoritmos hacen falta grandes bases de datos de las que los modelos aprenden. Éstas necesitan ser recolectadas y etiquetadas. Éste es un proceso costoso, tanto en tiempo como en recursos. Por ejemplo, es muy difícil tener muchos datos correspondientes a un fallo de caldera, ya que estos ocurren muy pocas veces, pero es necesario saber qué datos recogen los sensores antes y durante un fallo para poder prevenirlo de manera inteligente. Si tenemos esta previsión podemos tener un mantenimiento predictivo de calderas para evitar con antelación un posible fallo o error en el sistema.
Cómo estos sucesos apenas ocurren, es complicado entrenar modelos que predigan el error correctamente. Para conseguir entrenar los modelos podemos generar nuevos datos sintéticos. De esta manera, aumentamos los datos escasos, difíciles de conseguir y no necesitamos de bases de datos tan grandes.
Redes generativas adversarias para crear datos sintéticos
Existen distintas maneras de generar datos sintéticos (completamente nuevos, pero que no se diferencian de los reales). Una de las más famosas en los últimos años son las generative adversarial networks o GANs. Estas son redes neuronales que son capaces de generar nuevos datos que pertenezcan a la distribución de los datos reales. Antes de explicarlas, veamos rápidamente qué es una red neuronal.
¿Qué es una red neuronal?
Las redes neuronales son modelos computacionales que usan un conjunto de funciones matemáticas interconectadas para transformar datos de entrada y devolver datos de salida. Buscan comportarse de la misma forma que lo hace el cerebro humano, de ahí su nombre. Están compuestas por capas de neuronas conectadas entre sí. Cada neurona es una operación matemática, determinada por unos parámetros modificables y entrenables. Las redes neuronales pueden tener millones de parámetros y ser capaces de resolver problemas muy complejos y diversos. Destacan en problemas de comprensión del lenguaje natural (similar a un lingüista) y de visión artificial (comprensión y análisis de imágenes y vídeos).
¿Qué es una red generativa adversaria o GAN?
Las redes neuronales generativas adversarias (GANs) son uno de los principales modelos generativos existentes, proporcionando un método potente de generación de nuevos datos. Las GANs, como la mayoría de modelos, parten de un conjunto de datos, un dataset. El objetivo a la hora de entrenar una GAN es conseguir que aprenda la distribución definida por este dataset para que, dado un vector de valores aleatorio, se genere un nuevo dato similares a los reales.
Las GANs se componen de dos partes: generador y discriminador. Cada una de ellas formada por una red neuronal. La función del generador es crear datos similares a los del dataset de entrenamiento, mientras que la del discriminador es distinguir si un dato es original o creado por el generador. Ambos tienen objetivos antagónicos y por ello son difíciles de entrenar. El generador busca engañar al discriminador y el discriminador distinguir si el dato es real o falso.
Arquitectura clásica de una GAN.
Aplicaciones de las GANs
Como ya se ha mencionado, el mayor caso de uso de las GANs es generar datos sintéticos que permitan tener mejores modelos de IA. Esto es aplicable a cualquier caso de uso y/o proyecto donde conseguir datos sea complejo y actualmente se utiliza en distintos campos y áreas, desde las más comerciales hasta la investigación más especializada.
Uno de las aplicaciones más conocida es DALL-E, desarrollada por la compañía OpenAI. Esta aplicación es capaz de generar imágenes sintéticas a partir de texto y crear imágenes con estilos de cuadros famosos o figuras que solo existen en nuestra imaginación.
Ejemplo generado por DALL-E.
Por: Ian de la Oliva – AI Researcher en Pixelabs
Share your thoughts
No Comments
Sorry, the comment form is closed at this time.