De markt voor kunstmatige intelligentie (AI) groeit explosief, waardoor de vraag naar op maat gemaakte chips enorm toeneemt.
Het aanbod komt echter niet overeen met de vraag, verre van dat zelfs. Aangepaste chips in apparaten zoals smartphones en computers worden nu namelijk vergezeld door meer behoeften – van hardware voor gezichtsherkenning tot AI voor het Internet of Things (IoT).
Je kunt chips meestal in twee categorieën verdelen: algemene en klantspecifieke. De algemene chips worden gemaakt door bedrijven als Intel en AMD en zijn geschikt voor meerdere gebruikssituaties, zoals beeldverwerking en multi-threading.
Synopsis plaatst het in een blogpost als volgt:
“AI workloads zijn massaal en vragen om een aanzienlijke hoeveelheid bandbreedte en verwerkingskracht. Als gevolg hiervan vereisen AI-chips een unieke architectuur die bestaat uit de optimale processors, geheugenarrays, beveiliging en real-time gegevensconnectiviteit.
Traditionele CPU’s missen meestal de benodigde verwerkingsprestaties, maar zijn ideaal voor het uitvoeren van sequentiële taken. GPU’s daarentegen kunnen het enorme parallellisme van AI’s vermenigvuldigingsfuncties aan en kunnen worden toegepast op AI-toepassingen. GPU’s kunnen dienen als AI-versnellers, waardoor de prestaties van neural networks en vergelijkbare workloads worden verbeterd.
De opkomst van generatieve AI is een van de belangrijkste factoren achter de toegenomen vraag naar aangepaste chips. Generatieve AI-tools, die het afgelopen jaar een enorme vlucht hebben genomen, kunnen aangepaste inhoud genereren in de vorm van tekst, afbeeldingen, video of andere media als reactie op aanwijzingen.
Organisaties als Amazon, Microsoft en Google beseffen dat aangepaste chips cruciaal zijn voor generatieve AI en hebben zich gericht op het ontwikkelen van eigen aangepaste chips, vooral nu de dominante speler, NVIDIA, al uitverkocht is tot 2024.
Terwijl bedrijven als Amazon zich in de strijd mengen met chips als Inferentia, zijn veel startups hard bezig met het ontwikkelen van chips.
D-Matrix is bijvoorbeeld een startup die 110 miljoen dollar heeft opgehaald om een inference computing platform te ontwikkelen. Volgens Playground Global partner Sasha Ostojic, die D-Matrix steunt, “is D-Matrix het bedrijf dat generatieve AI commercieel levensvatbaar zal maken.”
Volgens Jensen Huang, oprichter en CEO van NVIDIA, “zal een biljoen dollar aan geïnstalleerde wereldwijde datacenterinfrastructuur overgaan van algemeen gebruik naar versneld computergebruik, terwijl bedrijven in een race verwikkeld zijn om generatieve AI toe te passen in elk product, elke service en elk bedrijfsproces. We zijn ons aanbod aanzienlijk aan het vergroten om aan de stijgende vraag te voldoen.”
Gezien de situatie hebben grote bedrijven geïnvesteerd in interne chipontwikkeling en hebben veel startups kapitaal opgehaald om inference-computing platforms en chips te ontwikkelen om aan de markt te voldoen.
Conclusie
De race om aangepaste chips kan de technologiewereld in twee delen opsplitsen, althans voor enige tijd: zij met een voorraad aangepaste chips en de mogelijkheid om zelf aangepaste chips te ontwikkelen en zij zonder.
De toename van generatieve AI in de handen van enkelen zou een kartelvorming van generatieve AI kunnen zijn.
Regeringen over de hele wereld, vooral de grootmachten, moeten op hun hoede blijven voor de concentratie van generatieve AI-ontwikkeling in de handen van enkelen.
Laat tot die tijd de chips vallen waar ze vallen.