image of computer screen with ai screen on it connected to a big energy source
Crédito: imagen generada por IA

Un equipo de ingenieros de la empresa de tecnología de inferencia de IA BitEnergy AI informa sobre un método para reducir las necesidades energéticas de las aplicaciones de IA en un 95%.El grupo ha publicado unpapeldescribiendo su nueva técnica en elarXivservidor de preimpresión.

A medida que las aplicaciones de IA se han generalizado, su uso ha aumentado drásticamente, lo que ha provocado un aumento notable de las necesidades y los costos energéticos.Los LLM como ChatGPT requieren mucha potencia informática, lo que a su vez significa que se necesita mucha electricidad para ejecutarlos.

Como solo un ejemplo, ChatGPT ahora requiere aproximadamente 564 MWh diarios, o suficiente para alimentar a 18.000 hogares estadounidenses.A medida que la ciencia continúa avanzando y este tipo de aplicaciones se vuelven más populares, los críticos han sugerido que las aplicaciones de IA podrían utilizar alrededor de 100 TWh al año en tan solo unos años, a la par de las operaciones mineras de Bitcoin.

En este nuevo esfuerzo, el equipo de BitEnergy AI afirma haber encontrado una manera de reducir drásticamente la cantidad de computación necesaria para ejecutar aplicaciones de IA que no resulte en una reducción del rendimiento.

La nueva técnica es básica: en lugar de utilizar una multiplicación compleja de punto flotante (FPM), el método utiliza la suma de enteros.Las aplicaciones utilizan FPM para manejar números extremadamente grandes o pequeños, lo que permite a las aplicaciones realizar cálculos utilizándolos con extrema precisión.También es la parte que consume más energía del cálculo numérico de la IA.

Researchers find a way to reduce energy needs of AI by 95%
Números de punto flotante de 16 bits y 8 bits definidos en IEEE 754 y en diversos hardware para cálculos de tensores, y el número entero de 16 bits.MSB significa bit más significativo y LSB significa bit menos significativo.Crédito:arXiv(2024).DOI: 10.48550/arxiv.2410.00907

Los investigadores llaman a su nuevo método Multiplicación de complejidad lineal: funciona aproximando FPM mediante la suma de enteros.Afirman que las pruebas, hasta ahora, han demostrado que el nuevo enfoque reduceen un 95%.

El único inconveniente que tiene es que requiere diferentesque el actualmente en uso.Pero el equipo de investigación también señala que el nuevo tipo de hardware ya ha sido diseñado, construido y probado.

Sin embargo, todavía no está claro cómo se licenciaría dicho hardware: actualmente, el fabricante de GPU Nvidia domina el mercado de hardware de IA.La forma en que respondan a esta nueva tecnología podría tener un impacto importante en el ritmo al que se adopte, si se verifican las afirmaciones de la empresa.

Más información:Hongyin Luo et al, La adición es todo lo que necesita para modelos de lenguaje energéticamente eficientes,arXiv(2024).DOI: 10.48550/arxiv.2410.00907

Información de la revista: arXiv

© 2024 Red Ciencia X

Citación:El algoritmo de suma de enteros podría reducir las necesidades energéticas de la IA en un 95% (2024, 12 de octubre)recuperado el 12 de octubre de 2024de https://techxplore.com/news/2024-10-integer-addition-algorithm-energy-ai.html

Este documento está sujeto a derechos de autor.Aparte de cualquier trato justo con fines de estudio o investigación privados, noparte puede ser reproducida sin el permiso por escrito.El contenido se proporciona únicamente con fines informativos.