El mercado de la inteligencia artificial (IA) está en pleno auge, lo que ha provocado un aumento masivo de la demanda de chips personalizados.
Sin embargo, la oferta no está a la altura de la demanda, ni mucho menos.
A los chips personalizados de dispositivos como smartphones y ordenadores se unen ahora más necesidades: desde hardware de reconocimiento facial hasta IA para el Internet de las cosas (IoT).
Los chips suelen dividirse en dos categorías: generales y personalizados. Los chips generales son los fabricados por empresas como Intel y AMD, y atienden a múltiples casos de uso, como el procesamiento de imágenes y el multihilo.
Sinopsis en una entrada de blog lo sitúa así:
“Las cargas de trabajo de la IA son masivas y exigen una cantidad significativa de ancho de banda y potencia de procesamiento. Como resultado, los chips de IA requieren una arquitectura única compuesta por los procesadores óptimos, matrices de memoria, seguridad y conectividad de datos en tiempo real.
Las CPU tradicionales suelen carecer del rendimiento de procesamiento necesario, pero son ideales para realizar tareas secuenciales. Las GPU, por su parte, pueden manejar el paralelismo masivo de las funciones multiacumulativas de la IA y pueden aplicarse a aplicaciones de IA. Las GPU pueden servir como aceleradores de IA, mejorando el rendimiento de las redes neuronales y cargas de trabajo similares”.
El auge de la IA generativa ha sido uno de los principales factores del aumento de la demanda de chips personalizados. Las herramientas de IA generativa, que se han disparado en el último año, pueden generar contenidos personalizados en forma de texto, imágenes, vídeo u otros medios en respuesta a indicaciones.
Organizaciones como Amazon, Microsoft y Google son conscientes de que los chips personalizados son fundamentales para la IA generativa y se han centrado en el desarrollo de chips personalizados propios, sobre todo cuando el actor dominante, NVidia, ya ha agotado sus existencias hasta 2024.
Mientras empresas como Amazon se unen a la contienda con chips como Inferentia, muchas startups han estado trabajando frenéticamente en el desarrollo de chips.
Por ejemplo, D-Matrix es una startup que recaudó 110 millones de dólares para desarrollar una plataforma de computación por inferencia. Según el socio de Playground Global Sasha Ostojic, que apoya a D-Matrix, “D-Matrix es la empresa que hará comercialmente viable la IA generativa”.
Según Jensen Huang, fundador y CEO de NVIDIA, “Un billón de dólares de la infraestructura mundial instalada de centros de datos pasará de la computación de propósito general a la acelerada a medida que las empresas se apresuren a aplicar la IA generativa en cada producto, servicio y proceso empresarial. Estamos aumentando significativamente nuestra oferta para satisfacer la creciente demanda”.
Dada la situación, las grandes empresas han invertido en el desarrollo interno de chips y muchas startups han reunido capital para desarrollar plataformas y chips de inferencia computacional que abastezcan el mercado.
Resumen
La carrera por los chips personalizados podría dividir el mundo de la tecnología en dos partes, al menos durante algún tiempo: los que tienen un suministro de chips personalizados y la capacidad de desarrollarlos internamente, y los que no.
La acumulación de IA generativa en manos de unos pocos podría ser una cartelización de la IA generativa.
Los gobiernos de todo el mundo, en especial las grandes potencias, deben desconfiar de la concentración del desarrollo de IA generativa en manos de unos pocos.
Hasta entonces, dejemos que las fichas caigan donde caigan.