Teknikindustrin spenderar miljarder dollar på grafikprocessorer för AI. 95 % är inaktiva
När covid-19-pandemin började flög toalettpapper och jäst ut från snabbköpet. Papper för att det är en basvara, men jäst för att alla skulle göra mycket bröd hemma. Det var prognosen, men vi skulle verkligen behöva se hur många av oss som slutade med att baka bröd.
Något liknande händer i datacenter för närvarande. Hyperscalers har spenderat miljarder och miljarder dollar på GPU:er för AI, och enligt en rapport är 95 % inaktiva för det mesta. Och allt på grund av rädslan för att bli utanför.
Kubernetes. Innan man går in i saken finns det ett koncept man måste landa på.
Det är kubernetes. Det är ett slags "operativsystem" i datacenter, arbetsledaren som organiserar och övervakar all mjukvara som används. Föreställ dig att ett datacenter är en stormarknad, hyllorna är servrarna och produkterna är apparna.
Exempel på kontrollpanel Det denna arbetsledare gör är att hitta den perfekta hyllan för att placera produkten på ett så optimalt sätt som möjligt. Dessutom övervakar han hela tiden alla hyllor i syfte att inte missa något och se till att dataflödet är perfekt. Det är kort och gott en mjukvara som hanterar många fysiska servrar på ett mycket optimerat sätt och dygnet runt.
I Xataka Det finns ingen energi för så många datacenter och konsekvensen är tydlig: hälften av de planerade till 2026 i USA är i fara.
Vad händer. Som sagt, 2026 State of Kubernetes Optimization Report som utarbetats av Cast AI har just avslöjat något: datacenters enorma ineffektivitet. De har analyserat cirka 23 000 kubernetes-kluster i jättar som AWS (Amazon), Azure (Microsoft) och GCP (Google) och har upptäckt att det genomsnittliga GPU-utnyttjandet av dessa datacenter bara är 5 %.
Detta översätts på ett annat sätt: 95 % är inaktiva för det mesta, vilket innebär att dessa företag betalar för att få 20 gånger mer datorkapacitet än de verkligen behöver. Just nu kanske du undrar om det var värt att förstöra RAM- och SSD-marknaden, göra datorer, mobiltelefoner, konsoler och praktiskt taget allt dyrare. Och det är en fråga som är vettig i världen, men det finns ett annat intressant faktum.
Till värre. Som vi ser i TechRadar påpekar de ansvariga för Cast AI att det är "tredje året som vi publicerade den här rapporten och siffrorna blir sämre." Specifikt talar vi om att CPU-användningen minskade från 10 % förra året till 8 % för närvarande, medan minnesanvändningen sjönk från 23 % till 20 %.
Överdimensionerade behov. Något som rapporten också påpekar är att även om användningen av utrustning minskar jämfört med föregående år, fortsätter hyperskalare att köpa som om världen skulle gå under.
CPU-överprovisionering, som de beskriver det, ökade från 40 % till 69 %. När det gäller minne gick det till 79%.
FOMO. För några veckor sedan påpekade en av ledarna för SMIC, Kinas stora gjuteri, redan att Big Tech köpte alla resurser de kommer att behöva, eller tror att de kommer att behöva, under det kommande decenniet... men inom bara ett par år. De investerar en förmögenhet på att skapa breda motorvägar när det inte finns några bilar eller verklig efterfrågan, och från Cast AI pekar de i samma riktning.
Hyperscalers köper bitvis på grund av rädsla för att bli utanför. Det är det som kallas FOMO eller rädsla för att missa, något som gäller många scenarier, men här har det att göra med att man inte vill komma sist i loppet som flyttar många miljoner från en plats till en annan. Denna hamstringsinstinkt underblåser en cykel av komponentbrist som påverkar konsumenterna, men också industrin själv.
Enligt rapporten är det meningsfullt att vilja köpa allt så snart som möjligt eftersom leveranstiderna är långa, men det är just så för att alla köper mer kapacitet än de behöver. I Xataka är datacentren riktiga "värmare". Och de bosätter sig i områden som är lika heta som Aragon.
Matematiken fungerar inte. I analysen påpekar de också att det finns kluster som inte har så dåliga prestanda och att det finns några som använder 49% av sin H200 eller 30% av sin H100, långt över de tidigare nämnda 5%, men det är inte normen. Och förutom att ha exploderat komponentmarknaden är konsekvensen av att ha så mycket utrustning inaktiv att de förlorar pengar på att de inte är lönsamma.
Enligt beräkningar kostar en oanvänd CPU några cent per timme, men en ledig GPU kostar flera dollar. Och däri ligger en annan nyckel till hela denna fråga. Amazon eller Azure datacenter tjänar till att tillfredsställa kraven från sina egna företag, men de hyr också ut datorkraft till den som behöver den.
Och eftersom det kostar pengar att stoppa GPU:erna, har det under de senaste månaderna rapporterats att priserna på dessa hyror mångdubblas. När ska allt ta slut? Cast AI är inte optimistiska, eftersom de hävdar att de flesta hyperscalers föredrar att stå för kostnaderna snarare än att ändra sina vanor av rädsla för att detta kommer att ta fart en dag och fånga dem på fel fot.
Översättningen är att... Jag kommer aldrig att ha min Steam Machine, eftersom alla är fokuserade på att göra AI-hårdvara. Bild | NVIDIA i Xataka | Det finns datacenter som övervakas och bevakas av robothundar eftersom framtiden tydligen redan är nuet
Originalkälla
Publicerad av Xataka
22 april 2026, 16:16
Denna artikel har översatts automatiskt från spanska. Klicka på länken ovan för att läsa originaltexten.
Visa originaltext (spanska)
Rubrik
La industria tecnológica se está fundiendo miles de millones de dólares en GPUs para la IA. El 95% están inactivas
Beskrivning
Cuando comenzó la pandemia del COVID-19, el papel higiénico y la levadura volaron del supermercado. El papel porque es un bien básico, pero la levadura porque todo el mundo iba a hacer mucho pan en su casa. Esa era la previsión, pero realmente habría que ver cuántos terminamos haciendo pan. Pues algo similar está ocurriendo en los centros de datos actualmente. Los hiperescaladores se han gastado miles y miles de millones de dólares en GPU para la IA y, según un informe, el 95% están inactivas la mayor parte del tiempo. Y todo por el miedo a quedarse fuera. Kubernetes. Antes de entrar en materia, hay un concepto que hay que aterrizar. Es el de los kubernetes. Se trata de una especie de "sistema operativo" en los centros de datos, el capataz que organiza y vigila todo el software que se está utilizando. Imagina que un centro de datos es un supermercado, las estanterías son los servidores y los productos son las apps. Ejemplo de un panel de control Lo que hace este capataz es encontrar la estantería perfecta para colocar el producto de la forma más óptima posible. Además, está todo el rato vigilando todas las estanterías todo el tiempo con el objetivo de no perderse nada y que el flujo de datos sea perfecto. Es, en definitiva, un software que gestiona muchos servidores físicos de manera optimizadísima y 24/7. En Xataka No hay energía para tanto centro de datos y la consecuencia es clara: la mitad de los previstos para 2026 en EEUU corren peligro Qué pasa. Dicho esto, el Informe 2026 sobre el Estado de la Optimización de Kubernetes elaborado por Cast AI acaba de arrojar un dato: la tremenda ineficiencia de los centros de datos. Han analizado unos 23.000 clústeres de kubernetes en gigantes como AWS (Amazon), Azure (Microsoft) y GCP (Google) y han descubierto que el uso medio de GPU de estos centros de datos es de apenas el 5%. Esto se traduce de otro modo: el 95% están inactivas la mayor parte del tiempo, lo que implica que estas empresas están pagando por hacerse con 20 veces más capacidad de cómputo de la que necesitan realmente. Ahora mismo te estarás preguntando si ha valido la pena destrozar el mercado de la RAM y los SSD, encareciendo ordenadores, móviles, consolas y prácticamente todo. Y es una pregunta con todo el sentido del mundo, pero hay otro dato interesante. A peor. Como vemos en TechRadar, los responsables de Cast AI apuntan que es “el tercer año que publicamos este informe y los números van a peor”. Concretamente, hablamos de que el uso de las CPU cayó del 10% del año anterior al 8% actualmente, mientras que el uso de memoria bajó del 23% al 20%. {"videoId":"x9ycpe8","autoplay":true,"title":"De IMPORTAR a PRODUCIR GAS: así está siendo el cambio de CHINA para convertirse en autosuficiente", "tag":"Webedia-prod", "duration":"872"} Necesidades sobredimensionadas. Algo que también apunta el informe es que, aunque el uso de los equipos baje respecto al año anterior, los hiperescaladores siguen comprando como si el mundo se fuera a acabar. El sobreaprovisionamiento, como lo describen ellos, de CPU aumentó del 40% al 69%. En el caso de la memoria, pasó al 79%. FOMO. Hace unas semanas, uno de los mandamases de SMIC, la gran fundición de China, ya apuntó que las Big Tech estaban comprando todos los recursos que necesitarán, o que creen que necesitarán, durante la próxima década… pero en apenas un par de años. Están invirtiendo un dineral en crear autopistas anchas cuando no hay coches ni una demanda real, y desde Cast AI apuntan en esa misma dirección. Los hiperescaladores están comprando a destajo debido al miedo a quedarse fuera. Es lo conocido como FOMO o fear of missing out, algo que se aplica a muchos escenarios, pero que aquí tiene que ver con no querer llegar el último a la carrera que está moviendo muchísimos millones de un lado para otro. Ese instinto de acaparamiento está alimentando un ciclo de escasez de componentes que afecta a consumidores, pero también a la propia industria. Según el informe, tiene cierto sentido querer comprarlo todo cuanto antes porque los plazos de entrega son largos, pero precisamente lo son porque todos están comprando más capacidad de la que necesitan. En Xataka Los centros de datos son auténticas "calefacciones". Y se están instalando en regiones tan calurosas como Aragón Las matemáticas no funcionan. En el análisis también apuntan que hay clústeres que no tienen un desempeño tan malo y que hay algunos que están utilizando el 49% de sus H200 o el 30% de sus H100, muy por encima del mencionado 5%, pero no es la norma. Y más allá de haber reventado el mercado de componentes, la consecuencia de tener tanto equipo parado es que están perdiendo dinero porque no le sacan rentabilidad. Según los cálculos, una CPU que no se usa cuesta unos céntimos por horas, pero una GPU inactiva cuesta varios dólares. Y ahí está otra clave de todo este asunto. Los centros de datos de Amazon o Azure sirven para satisfacer las demandas de sus propias compañías, pero también alquilan potencia de cálculo a quien la necesite. Y como tener las GPU paradas les cuesta dinero, estos últimos meses se está reportando que los precios de esos alquileres se están multiplicando. ¿Cuándo terminará todo? Cast AI no es optimista, ya que afirman que la mayoría de los hiperescaladores prefieren asumir los costes antes que cambiar de hábitos por el miedo a que esto despegue algún día y los pille con el pie cambiado. La traducción es que… nunca tendré mi Steam Machine, ya que todos están centrados en hacer hardware para la IA. Imagen | NVIDIA En Xataka | Hay centros de datos siendo vigilados y custodiados por perros-robot porque al parecer el futuro ya es el presente (function() { window._JS_MODULES = window._JS_MODULES || {}; var headElement = document.getElementsByTagName('head')[0]; if (_JS_MODULES.instagram) { var instagramScript = document.createElement('script'); instagramScript.src = 'https://platform.instagram.com/en_US/embeds.js'; instagramScript.async = true; instagramScript.defer = true; headElement.appendChild(instagramScript); } })(); - La noticia La industria tecnológica se está fundiendo miles de millones de dólares en GPUs para la IA. El 95% están inactivas fue publicada originalmente en Xataka por Alejandro Alcolea .