Google har skruvat upp ambitionerna rejält på årets Cloud Next-konferens. Här presenterade företaget sin åttonde generation av TPU-chip, alltså specialbyggda AI-processorer som ska driva både träning av stora modeller och de snabba svar vi möter i moderna AI-tjänster.
Den mest uppmärksammade nyheten är TPU 8i, som är riktad mot inference — alltså den del där AI ska svara, reagera och utföra uppgifter i realtid. Enligt Google levererar den upp till 80 procent bättre prestanda per dollar än föregående generation. Samtidigt har chipet tre gånger mer on-chip SRAM, vilket ska göra det bättre för stora och krävande AI-modeller med låg latens.
Vid sidan av den lanserar Google även TPU 8t, som är byggd för de tyngsta träningsuppgifterna. Här uppger företaget att chipet kan leverera upp till 2,7 gånger bättre prestanda per dollar för storskalig träning jämfört med Ironwood-generationen. Det är den typen av förbättring som kan göra en tydlig skillnad för företag som tränar stora modeller och vill få mer beräkningskraft för pengarna.
Båda chipen är också ett försök att göra AI mindre energikrävande. Google uppger att TPU 8t och TPU 8i ger upp till dubbelt så bra prestanda per watt som föregångaren. Det är centralt i en tid där AI inte bara handlar om rå kraft, utan också om energiförbrukning, datacenter och kapacitet i stor skala.
Google går från chatbot till agent
Chipnyheten står dock inte ensam. Google använder också Cloud Next för att markera att nästa stora AI-kamp inte bara handlar om modeller, utan om agenter. Det vill säga system som inte bara genererar text, utan kan arbeta över flera verktyg, minnas kontext, hämta data och utföra uppgifter mer självständigt.
Därför lanserar Google även Gemini Enterprise Agent Platform, som samlar utveckling, drift, säkerhet, utvärdering och styrning av AI-agenter i en och samma plattform. Målet är att göra det enklare för företag att bygga agentlösningar utan att projekten fastnar i integrationer och komplexitet.
Google betonar samtidigt att plattformen inte enbart ska fungera med egna modeller. Dokumentationen visar att den även stödjer partnermodeller, vilket kan göra lösningen mer attraktiv för företag som vill undvika att låsa sig till ett enda AI-ekosystem.
AI är inte längre ett experiment
Budskapet från Google är överlag att företagens användning av AI har gått vidare från pilotprojekt och tester. Företaget lyfter fram att många kunder nu använder AI i skarp drift, och hela lanseringen är tydligt fokuserad på att AI ska skapa konkreta resultat — inte bara demonstreras i mötesrum.
För vanliga användare är det kanske inte TPU-namnen som spelar störst roll just nu. Men konsekvenserna kan bli tydliga: snabbare AI-tjänster, kortare väntetider, mer avancerade funktioner och på sikt digitala assistenter som kan hantera betydligt mer på egen hand. Det är den framtid Google nu försöker bygga infrastrukturen för.
De nya TPU 8t- och 8i-lösningarna är märkta som “coming soon” och väntas bli tillgängliga senare i år.