La Inteligencia Artificial Generativa ha escrito con éxito artículos de noticias, creado obras de arte realistas y compuesto música estéticamente agradable.
IA Generativa: ¿qué es? La Inteligencia Artificial Generativa se refiere a la inteligencia artificial que se puede utilizar para crear contenido nuevo, como palabras, imágenes, música, código o vídeos. Aplicaciones de IA Generativa como ChatGPT, un chatbot que responde preguntas con respuestas escritas detalladas; y DALL-E, que crea imágenes y arte realistas basados en indicaciones / prompts de texto; se volvió muy popular a partir de 2022, cuando las empresas lanzaron versiones de sus aplicaciones que el público, no solo los expertos, podían utilizar fácilmente.
Los sistemas de IA generativa son poderosos porque están entrenados en conjuntos de datos extremadamente grandes, que potencialmente podrían aprovechar casi toda la información en Internet. Los modelos de Inteligencia Artificial Generativa actuales producen contenido que a menudo es indistinguible del creado por humanos.
IA Generativa: ¿qué es?
Los científicos e ingenieros han utilizado varios enfoques para crear aplicaciones de IA Generativa. Los modelos destacados incluyen generative adversarial networks, o GAN; variational autoencoders, o VAE; modelos de difusión; y modelos basados en transformadores.
- Las GAN suelen trabajar con datos de imágenes y utilizan dos componentes: un “generador” para crear contenido nuevo basado en datos de entrenamiento, y un “discriminador” para decidir si el contenido generado es real o falso. El generador y el discriminador funcionan como adversarios, muy parecido a un falsificador que intenta engañar a un autenticador. Si el discriminador decide que la salida es falsa, esto proporciona retroalimentación al generador para mejorar la salida. Los dos pasan por múltiples iteraciones hasta que el discriminador no puede determinar si el resultado es real o falso.
- Los VAE se crearon para aprender la representación eficiente de los datos (las formas en que se almacenan, procesan y transmiten los datos) y se utilizan para fines como la compresión de datos (modificar los datos para reducir su tamaño) y la reducción del ruido (eliminar el ruido de las señales de datos). Hacen uso de un “codificador”, que analiza un conjunto de datos y reduce su complejidad sin dejar de preservar las características esenciales de los datos, y un “decodificador”, que utiliza la representación reducida de los datos para recrear algo casi idéntico al original. Para adaptar esto a aplicaciones generativas, los VAE introducen intencionalmente variaciones (como pequeños errores) en el paso de codificación. Cuando los decodificadores intentan recrear los datos originales, encuentran variaciones y “accidentalmente” generan contenido nuevo.
- Los modelos de difusión se utilizan en aplicaciones como DALL-E y Stable Diffusion. Están inspirados en el movimiento aleatorio de átomos y moléculas. Piense en la forma en que el colorante alimentario se dispersa cuando se vierte en un vaso de agua. A medida que el color se difunde, podemos mapear cómo se mueven las moléculas individuales a través del espacio y modelar ese movimiento en sentido inverso a la gota original desde la que comenzó. En las aplicaciones de IA generativa, los modelos de difusión se entrenan con imágenes en lugar de gotas de colorante alimentario. Dentro de esas imágenes, permiten que los píxeles se muevan digitalmente aplicando las leyes físicas de difusión, destruyendo así la imagen original y creando un campo de estática borrosa. Luego, el modelo analiza esa «difusión» de una imagen clara a una estática. A medida que el modelo aplica esta técnica a muchas imágenes de una categoría particular (como fotografías de tortugas), se convierte en un experto en rastrear el movimiento del conjunto borroso de píxeles hacia atrás hasta la imagen clara original. Luego, el modelo puede tomar una imagen estática aleatoria, mover los píxeles según lo que ha aprendido y generar una nueva imagen de una tortuga.
- Los modelos basados en transformadores, como el modelo Transformador generativo preentrenado (GPT) utilizado por ChatGPT, se centran en la secuencia de datos y el contexto en lugar de puntos de datos individuales por sí solos. En el caso del lenguaje, por ejemplo, estos modelos se entrenan en una gran variedad de pasajes de texto de libros, así como en recursos como Wikipedia. Analizan dónde tienden a aparecer las palabras en las oraciones y cómo se usan en asociación con otras palabras a su alrededor. Esto hace que los modelos basados en transformadores estén bien adaptados para predecir qué palabras podrían aparecer a continuación en una oración, traducir texto o generar texto nuevo.
La IA Generativa ha escrito con éxito artículos de noticias, creado obras de arte realistas y compuesto música estéticamente agradable.
Si bien estas aplicaciones a veces cometen errores evidentes (a veces denominados alucinaciones), se utilizan para muchos propósitos, como diseño de productos, arquitectura urbana y atención médica.
Sin embargo, el desarrollo de modelos de IA Generativa requiere mucha potencia informática, lo que puede resultar costoso. Durante el entrenamiento se debe almacenar una gran cantidad de datos y las aplicaciones requieren una potencia de procesamiento significativa. Esto ha dado como resultado que empresas más grandes, como Google y OpenAI – respaldada por Microsoft – lideren el camino en el desarrollo de aplicaciones.
El auge de la IA Generativa también plantea amenazas potenciales, incluida la difusión de información errónea y la creación de falsificaciones profundas. A medida que esta tecnología se vuelve más sofisticada, los especialistas en ética advierten que se deben desarrollar en paralelo directrices para su uso ético.
Leído en: