Un novedoso marco de IA genera imágenes de la nada

2024-01-11 18:38:28

Un nuevo marco de inteligencia artificial potencialmente revolucionario llamado "Blackout Diffusion" genera imágenes a partir de una imagen completamente vacía, lo que significa que, a diferencia de otros modelos de difusión generativa, el algoritmo de aprendizaje automático no requiere iniciar una "semilla aleatoria" para comenzar.

AI revolution: Creating images from thin air — Un nuevo modelo de IA generativa puede crear imágenes a partir de un marco en blanco.Crédito: Laboratorio Nacional de Los Álamos

Blackout Diffusion, presentado en la reciente Conferencia Internacional sobre Aprendizaje Automático, genera muestras que son comparables a los modelos de difusión actuales, como DALL-E o Midjourney, pero requieren menos recursos computacionales que estos modelos.

"El modelado generativo está trayendo la próxima revolución industrial con su capacidad de ayudar en muchas tareas, como la generación de código de software,documentos legales, e incluso arte", dijo Javier Santos, investigador de IA en el Laboratorio Nacional de Los Álamos y coautor de Blackout Diffusion.

"El modelado generativo podría aprovecharse para hacerdescubrimientos científicos, y el trabajo de nuestro equipo sentó las bases y los algoritmos prácticos para aplicar modelos de difusión generativa a problemas científicos que no son continuos por naturaleza".

Los modelos de difusión crean muestras similares a los datos con los que se entrenan.Funcionan tomando una imagen y agregando ruido repetidamente hasta que la imagen es irreconocible.A lo largo del proceso, el modelo intenta aprender cómo revertirlo a su estado original.

Los modelos actuales requieren ruido de entrada, lo que significa que necesitan algún tipo de datos para comenzar a producir imágenes.

"Demostramos que la calidad de las muestras generadas por Blackout Diffusion es comparable a lamodelos actualesutilizando un espacio computacional más pequeño", dijo Yen-Ting Lin, el físico de Los Álamos que dirigió la colaboración Blackout Diffusion.

Otro aspecto único de Blackout Diffusion es el espacio en el que funciona. Los modelos de difusión generativa existentes funcionan en espacios continuos, lo que significa que el espacio en el que funcionan es denso e infinito.Sin embargo, trabajar en espacios continuos limita su potencial para aplicaciones científicas.

"Para ejecutar los modelos de difusión generativa existentes, matemáticamente hablando, la difusión tiene que vivir en un dominio continuo; no puede ser discreta", dijo Lin.

Por otro lado, el marco teórico del equipo funciona en espacios discretos (lo que significa que cada punto en el espacio está aislado de los demás por cierta distancia), lo que abre oportunidades para diversas aplicaciones, como texto y aplicaciones científicas.

El equipo probó Blackout Diffusion en varios conjuntos de datos estandarizados, incluida la base de datos modificada del Instituto Nacional de Estándares y Tecnología;el conjunto de datos CIFAR-10, que tiene imágenes de objetos de 10 clases diferentes;y el conjunto de datos de atributos de CelebFaces, que consta de más de 200.000 imágenes de rostros humanos.

Además, el equipo utilizó la naturaleza discreta de Blackout Diffusion para aclarar varios conceptos erróneos ampliamente concebidos sobre cómo la difusión modela internamente, proporcionando una comprensión crítica de los modelos de difusión generativa.

También proporcionanprincipios de diseñopara futuras aplicaciones científicas."Esto demuestra el primer estudio fundamental sobre modelado de difusión de estado discreto y señala el camino hacia futuras aplicaciones científicas con datos discretos", dijo Lin.

El equipo explica que generativodifusiónEl modelado puede potencialmente acelerar drásticamente el tiempo dedicado a ejecutar muchas simulaciones científicas en supercomputadoras, lo que respaldaría el progreso científico y reduciría la huella de carbono de la ciencia computacional.Algunos de los diversos ejemplos que mencionan son la dinámica de los yacimientos subterráneos, los modelos químicos paradescubrimiento de drogasy expresión de genes unicelulares y moleculares para comprender los mecanismos bioquímicos en los organismos vivos.

El estudio espublicadoen elarXivservidor de preimpresión.

Más información:Javier E Santos et al, Difusión de apagón: modelos de difusión generativa en espacios de estado discreto,arXiv(2023).DOI: 10.48550/arxiv.2305.11089

Información de la revista: arXiv

Citación:El novedoso marco de IA genera imágenes de la nada (11 de enero de 2024)recuperado el 11 de enero de 2024de https://techxplore.com/news/2024-01-ai-framework-generates-images.html

Este documento está sujeto a derechos de autor.Aparte de cualquier trato justo con fines de estudio o investigación privados, noparte puede ser reproducida sin el permiso por escrito.El contenido se proporciona únicamente con fines informativos.