Programming light propagation creates highly efficient neural networks
La programación de la propagación óptica para una tarea computacional se logra mediante el flujo de trabajo representado.Crédito:Fotónica avanzada(2024).DOI: 10.1117/1.AP.6.1.016002

Los modelos actuales de inteligencia artificial utilizan miles de millones de parámetros entrenables para lograr tareas desafiantes.Sin embargo, esta gran cantidad de parámetros conlleva un coste considerable.Entrenar e implementar estos enormes modelos requiere un inmenso espacio de memoria y capacidad informática que solo pueden proporcionar centros de datos del tamaño de un hangar en procesos que consumen energía equivalente a las necesidades de electricidad de las ciudades medianas.

ElActualmente está haciendo esfuerzos para repensar tanto el hardware informático relacionado como los algoritmos de aprendizaje automático para mantener de manera sostenible el desarrollo deal ritmo actual.La implementación óptica de arquitecturas de redes neuronales es una vía prometedora debido a la implementación de baja potencia de las conexiones entre las unidades.

Nueva investigaciónreportado enFotónica avanzadacombina la propagación de la luz dentro de fibras multimodo con una pequeña cantidad de parámetros programables digitalmente y logra el mismo rendimiento en tareas de clasificación de imágenes con sistemas totalmente digitales con más de 100 veces más parámetros programables.Esteagiliza el requisito de memoria y reduce la necesidad de procesos digitales que consumen mucha energía, al tiempo que logra el mismo nivel de precisión en una variedad de tareas de aprendizaje automático.

El corazón de este trabajo, dirigido por los profesores Demetri Psaltis y Christophe Moser de EPFL (Instituto Federal Suizo de Tecnología en Lausana), radica en el control preciso de pulsos ultracortos dentro de fibras multimodo a través de una técnica conocida como conformación de frente de onda.Esto permite la implementación de cálculos ópticos no lineales con microvatios de potencia óptica promedio, alcanzando un paso crucial en la realización del potencial de las redes neuronales ópticas.

"En este estudio, descubrimos que con un pequeño grupo de parámetros, podemos seleccionar un conjunto específico de pesos modelo del banco de pesos que proporciona la óptica y emplearlo para la tarea informática deseada. De esta manera, utilizamos fenómenos que ocurren naturalmente comoun hardware informático sin tener que tomarse la molestia de fabricar y operar un dispositivo especializado para este fin", afirma Ilker Oguz, coautor principal del trabajo.

Este resultado marca un paso significativo para abordar los desafíos que plantea la creciente demanda de modelos de aprendizaje automático más grandes.Aprovechando el poder computacional deA través de fibras multimodo, los investigadores han allanado el camino para soluciones de hardware altamente eficientes y de bajo consumo de energía en inteligencia artificial.

Como se muestra en el experimento de óptica no lineal informado, este marco computacional también se puede utilizar para programar de manera eficiente diferentes fenómenos no lineales de alta dimensión para realizar tareas de aprendizaje automático y puede ofrecer una solución transformadora a la naturaleza intensiva en recursos de los modelos de IA actuales.

Más información:Ilker Oguz et al, Programación de propagación no lineal para máquinas de aprendizaje óptico eficientes,Fotónica avanzada(2024).DOI: 10.1117/1.AP.6.1.016002

Citación:La programación de la propagación de la luz crea redes neuronales altamente eficientes (25 de enero de 2024)recuperado el 25 de enero de 2024de https://techxplore.com/news/2024-01-propagation-highly-ficient-neural-networks.html

Este documento está sujeto a derechos de autor.Aparte de cualquier trato justo con fines de estudio o investigación privados, noparte puede ser reproducida sin el permiso por escrito.El contenido se proporciona únicamente con fines informativos.