New computing scheme could enhance machine learning, facilitate breakthroughs in AI
IMC único y IMC dual.Crédito:Dispositivo(2024).DOI: 10.1016/j.device.2024.100546

Los modelos de inteligencia artificial (IA) como ChatGPT se ejecutan con algoritmos y tienen un gran apetito por los datos, que procesan mediante el aprendizaje automático, pero ¿qué pasa con los límites de sus capacidades de procesamiento de datos?Investigadores dirigidos por el profesor Sun Zhong de la Escuela de Circuitos Integrados y el Instituto de Inteligencia Artificial de la Universidad de Pekín se propusieron resolver el cuello de botella de von Neumann que limita el procesamiento de datos.

en su periódicopublicadoen el diarioDispositivoEl 12 de septiembre de 2024, el equipo desarrolló el esquema dual-IMC (computación en memoria), que no solo acelera laproceso, sino que también mejora la eficiencia energética de las operaciones de datos tradicionales.

Al seleccionar algoritmos,y los científicos informáticos se basan en operaciones de datos conocidas como multiplicación de vectores de matrices (MVM), que respaldan.Una red neuronal es una arquitectura informática que se encuentra a menudo en los modelos de IA y que imita la función y estructura de un cerebro humano.

A medida que la escala de los conjuntos de datos crece rápidamente, el rendimiento informático a menudo se ve limitado por el movimiento de datos y el desajuste de velocidad entre el procesamiento y la transferencia de datos.Esto se conoce como el cuello de botella de von Neumann.La solución convencional es un esquema de computación en memoria única (IMC único), en el que los pesos de la red neuronal se almacenan en el chip de memoria mientras que la entrada (como imágenes) se proporciona externamente.

Sin embargo, la desventaja del IMC único es el cambio entre el transporte de datos dentro y fuera del chip, así como el uso de convertidores de digital a analógico (DAC), que generan una gran huella de circuito y un alto consumo de energía.

New computing scheme could enhance machine learning, facilitate breakthroughs in AI
La informática dual en memoria permite operaciones MVM totalmente en memoria.Crédito:Dispositivo(2024).DOI: 10.1016/j.device.2024.100546

Para aprovechar plenamente el potencial del principio IMC, el equipo desarrolló un esquema de IMC dual que almacena tanto el peso como la entrada de una red neuronal en la matriz de memoria, realizando así operaciones de datos totalmente en memoria.

Luego, el equipo probó el IMC dual en dispositivos de memoria resistiva de acceso aleatorio (RRAM) para la recuperación de señales y el procesamiento de imágenes.Estos son algunos de los beneficios del esquema IMC dual cuando se aplica a operaciones MVM:

  1. Se logra una mayor eficiencia gracias a los cálculos totalmente en memoria, lo que ahorra tiempo y energía debido a la memoria de acceso aleatorio dinámica (DRAM) fuera del chip y la memoria de acceso aleatorio estática (SRAM) en el chip.
  2. El rendimiento informático se optimiza a medida que el movimiento de datos, que era un factor limitante, se elimina de forma totalmente en memoria.
  3. Menor costo de producción debido a la eliminación de DAC, que son requeridos en el esquema de IMC único.Esto también significa ahorrar en área de chip, latencia informática y requisitos de energía.

Con una demanda en rápido crecimiento de-procesamiento en la era digital actual, los descubrimientos realizados en esta investigación podrían generar nuevos avances en la arquitectura informática y la inteligencia artificial.

Más información:Shiqing Wang et al, Computación dual en memoria de multiplicación de matriz-vector para acelerar redes neuronales,Dispositivo(2024).DOI: 10.1016/j.device.2024.100546

Citación:El esquema informático acelera el aprendizaje automático al tiempo que mejora la eficiencia energética de las operaciones de datos tradicionales (26 de septiembre de 2024)recuperado el 28 de septiembre de 2024de https://techxplore.com/news/2024-09-scheme-machine-energy-efficiency-traditional.html

Este documento está sujeto a derechos de autor.Aparte de cualquier trato justo con fines de estudio o investigación privados, noparte puede ser reproducida sin el permiso por escrito.El contenido se proporciona únicamente con fines informativos.