• Om Oss
  • Meddela
  • Sekretesspolicy
  • Kontakta oss
MasterTrend Info - Teknologi, nyheter och handledningar
  • HEM
    • BLOGG
  • Tutorials
  • Hårdvara
  • Gaming
  • Mobil
  • Säkerhet
  • Windows
  • IA
  • Programvara
  • Nätverk
  • Vad är nytt
  • sv_SESwedish
    • es_ESSpanish
    • en_USEnglish
    • pt_BRPortuguese
    • fr_FRFrench
    • it_ITItalian
    • de_DEGerman
    • ko_KRKorean
    • jaJapanese
    • zh_CNChinese
    • ru_RURussian
    • thThai
    • pl_PLPolish
    • tr_TRTurkish
    • id_IDIndonesian
    • hi_INHindi
    • arArabic
    • nl_NLDutch
Inga resultat
Se alla resultat
  • HEM
    • BLOGG
  • Tutorials
  • Hårdvara
  • Gaming
  • Mobil
  • Säkerhet
  • Windows
  • IA
  • Programvara
  • Nätverk
  • Vad är nytt
  • sv_SESwedish
    • es_ESSpanish
    • en_USEnglish
    • pt_BRPortuguese
    • fr_FRFrench
    • it_ITItalian
    • de_DEGerman
    • ko_KRKorean
    • jaJapanese
    • zh_CNChinese
    • ru_RURussian
    • thThai
    • pl_PLPolish
    • tr_TRTurkish
    • id_IDIndonesian
    • hi_INHindi
    • arArabic
    • nl_NLDutch
Inga resultat
Se alla resultat
MasterTrend Info - Teknologi, nyheter och handledningar
Inga resultat
Se alla resultat
Hem Hårdvara

Groq 3 LPU och Nvidias nya inferensstrategi

MasterTrend Insikter av MasterTrend Insikter
23 april 2026
i Hårdvara
Läsning tid:6 min läsa
0
Nvidias Groq 3 LPU och Rubin GPU jämförda i bild, som visar chipdesignen för artificiell intelligens-inferens och Nvidias nya strategi inom AI-acceleratorhårdvara.

Groq 3 LPU och Nvidias nya inferensstrategi: En visuell jämförelse mellan Nvidias Rubin GPU och Groq 3 LPU-chipet, som belyser skillnaderna i arkitektur, prestanda och effektivitet för AI-arbetsbelastningar. En titt på framtiden för specialiserad AI-inferenshårdvara, högpresterande acceleratorer och datacenter optimerade för generativa modeller och LLM:er.

50
DELAD
140
Visningar
Dela på FacebookDela på Twitter

Innehåll

  1. Groq 3 LPU och det strategiska skiftet på Rubin
  2. Groq 3 och funktionen i Rubin
  3. Vad händer med Rubin CPX?
  4. Konsolidering av marknaden för inferenschip
  5. Anpassad kisel i hyperskalare

Groq 3 LPU och det strategiska skiftet på Rubin

Avtäckningen av Groq 3 på GTC 2026 är mer än bara en teknisk lansering: den markerar ett strategiskt skifte i hur Nvidia strukturerar sin inferensplattform. Mer än bara ett nytt chip omdefinierar det Rubins interna hierarki och föregriper en tydlig fas i konkurrensen om specialiserat kisel.

Vid GTC 2026, som hölls i San Jose, presenterade Nvidia inferensacceleratorn Groq 3: det första chipet som kommer från deras licens- och talangavtal på 20 miljarder dollar som undertecknades den 24 december 2025. Det är en LPU (språkbehandlingsenhet) baserat på SRAM som Nvidia Den är integrerad i Vera Rubin-plattformen som en dedikerad hjälpprocessor för avkodningsfasen. Tillverkaren tillkännagav ett förväntat leveransdatum under tredje kvartalet 2026; produktionen kommer att hanteras av Samsung på en 4nm-nod. Det är också Nvidias första rackskaliga produkt designad kring icke-GPU-kisel, och dess ankomst har lett till en omordning av sina egna komponenter i färdplanen.

Hjärtat i Groq 3 LPX är LP30-chippet: 512 MB SRAM per chipp och 150 TB/s minnesbandbredd per chip. För att sätta detta i perspektiv erbjuder en Rubin GPU med 288 GB HBM4 cirka 22 TB/s; skillnaden i storleksordning är inte en nyans utan ett arkitektoniskt val. Ett komplett LPX-rack rymmer 256 LPU:er, totalt 128 GB SRAM och 40 PB/s aggregerad bandbredd. Nvidia hävdar att, i kombination med en Rubin NVL72, levererar ett LPX-rack upp till 35 gånger prestandan per megawatt jämfört med en ensam NVL72 i biljonparametermodeller, med ett driftskostnadsmål på 45 dollar per miljon tokens.

Groq 3 och funktionen i Rubin

Rubin-rackrendering som illustrerar SuperPOD-arkitekturen
Nvidia presenterade sin strategi med sju chip, Rubin SuperPOD, på GTC 2026. (Bildkälla: Nvidia)

I den planerade operationen hanterar Rubin-GPU:er förfyllningsfasen – bearbetning av långa kontexter och beräkningar med hög densitet – medan Groq-LPU:er hanterar avkodning och tokengenerering med reducerad latens. Dynamo orkestrerar denna heterogena distribution och tilldelar uppgifter baserat på batchstorlek och parallellitet för att balansera prestanda och energikostnad.

Groqs ursprungliga LPU-design prioriterade determinism: en VLIW-pipeline (Very Long Instruction Word) med stora SRAM-banker och en kompilator som förplanerade exekveringen, vilket eliminerade cachemissar och oväntade stopp. Detta resulterade i mycket höga token-hastigheter per användare, men avslöjade ett kapacitetsproblem: tidigare generationer med 230 MB SRAM per chip krävde många chips för att rymma medelstora modeller, och arkitektur Det föddes inriktat på faltningsnätverk snarare än moderna språkmodeller.

LP30 mildrar några av dessa begränsningar med 512 MB SRAM per chippe och 1,23 PFLOPS FP8-beräkningskapacitet. Samsung har skalat upp produktionen – från cirka 9 000 till cirka 15 000 wafers, enligt tillkännagivandena – genom att gå från prover till kommersiell tillverkning. På GTC tillkännagavs också att AWS kommer att driftsätta Groq 3 LPU:er tillsammans med mer än en miljon Nvidia GPU:er som en del av sin infrastrukturutbyggnad.

Utöver LP30 nämnde Nvidia en produktplan: en LP35 med NVFP4-stöd avsedd att anpassas till Rubin Ultra-generationen, och en LP40 planerad för Feynman-arkitekturcykeln senare.

Vad händer med Rubin CPX?

Vid GTC, avsaknaden av Rubin CPX, inferensacceleratorn baserad på GDDR7 som Nvidia Den hade tillkännagivits i september 2025. Den varken syntes på huvudbilderna eller på scenen. Allt tyder – utan fullständig officiell bekräftelse – på att CPX har tagits bort från färdplanen och ersatts i plattformshierarkin av LPX Groq 3.

CPX utformades ursprungligen som ett billigare alternativ för att accelerera kontextfasen med hjälp av GDDR7, och utnyttja dess större tillgänglighet inför brist på HBM. Groqs LPU:er eliminerar dock behovet av stora externa minnesmoduler och erbjuder betydligt högre bandbredd per krets – en tydlig fördel på en marknad där HBM-utbudet är fortsatt begränsat och GDDR7-produktionen fortfarande skalas upp. Medan CPX-enheter som redan är avsedda för kunder kan fortsätta att levereras, verkar den strategiska preferensen nu skifta mot LPU-integration.

Det finns också en operativ analogi med förvärvet av Mellanox 2019: startup-teknologier som i slutändan bildar nya arkitektoniska lager inom Nvidias infrastruktur – i deras fall NVLink/InfiniBand – och i detta scenario skulle Groq kunna bli en liknande strukturell komponent inom Rubins ekosystem.

Konsolidering av marknaden för inferenschip

Affären med Groq var den mest synliga delen av en konsolideringsvåg 2025 med fokus på inferenschips. Samma år förvärvade AMD Untether AI-teamet, Nvidia förvärvade Enfabricas utrustning och IP för över 900 miljoner dollar, Meta köpte Rivos, och det fördes samtal – som slutligen övergavs – mellan Intel och SambaNova som resulterade i en investering och ett partnerskap på 350 miljoner dollar. Detta drag återspeglar det faktum att det innebär allvarliga ekonomiska utmaningar att konkurrera oberoende mot Nvidias CUDA-ekosystem och skala, även när tekniken har tekniska fördelar.

Det återkommande mönstret är att de stora aktörerna absorberar talang och teknologi. Groq, till exempel, förväntade sig en omsättning på cirka 500 miljoner euro år 2025, men den siffran var inte tillräcklig för att behålla sitt oberoende inför strategiskt tryck från dominerande tillverkare. Analytiker påpekar att icke-exklusiva licensavtal bevarar sken av konkurrens, men i praktiken neutraliserar konkurrenter genom att integrera deras teknologi i köparens plattform.

Anpassad kisel i hyperskalare

Meta MTIA-färdplandiagram för inferensacceleratorer
Meta presenterade sin MTIA-färdplan nyligen. (Bildkälla: Meta)

Medan startups integreras i större företag, driver stora molnleverantörer sina egna kiselinferenspipelines.

Meta tillkännagav successiva generationer av MTIA, utvecklade med Broadcom: från MTIA 300 – redan i produktion för rangordning och rekommendation – till MTIA 500, inriktad på generativ inferens och planerad för massdistribution 2027. Google behåller sin TPU-linje (Ironwood v7) med TFLOPS-figurer och storskaliga poddar, och AWS fortsätter att utveckla Trainium och Inferentia, även om interna data fram till 2024 visade relativt låg användning jämfört med GPU:er i AWS egen infrastruktur.

Branschundersökningar och prognoser förstärker diversifieringen: I november 2025 rankade Futurum Group XPU-acceleratorer som det snabbast växande segmentet inom datacenterutgifter för 2026, och TrendForce förutspådde en märkbar ökning av leveranser av anpassade ASIC-kretsar från molnleverantörer för samma år.

Nvidias reaktion har varit tydlig: att säkra närvaron av icke-GPU-kisel i sin plattform innan tredje part gör det. Groq 3 LPU är den konkreta manifestationen av den strategin; framtiden för Rubin CPX är dock fortfarande osäker för tillfället.

Dela detta:
FacebookLinkedInPinterestXRedditTumblrBlueskyTrådarDelaChatGPTClaudeGoogle AIGrok
Taggar: EvergreenContentGPUNvidia
Tidigare Offentliggörande

C2 botnätsinfrastruktur: effekter efter den internationella operationen

Nästa publikation

Minecraft på E Ink: verkliga skärmgränser

MasterTrend Insikter

MasterTrend Insikter

Vår redaktion aktier ett djupt dyk analys, handledningar och rekommendationer för att få ut det mesta av dina enheter och digitala verktyg.

RelateradePublikationer

AMD UDNA-arkitektur för PS6 och Xbox Next, detalj av nästa generations GPU-chip med avancerad design för högpresterande spelkonsoler.
Hårdvara

UDNA-arkitektur i PS6 och Xbox Next: mer än bara siffror

4 maj 2026
136
FSR 4.1 AMD: Reklamillustration av FidelityFX Super Resolution med en futuristisk röd och svart design, som lyfter fram prestanda- och kvalitetsförbättringar i RDNA 4 GPU:er.
Hårdvara

FSR 4.1 AMD: Verkliga förbättringar och begränsningar i RDNA 4

4 maj 2026
206
ThinkPad X9-14 Gen 1 bärbar dator utan förpackning med Windows 11-skärm och Copilot, förstklassig ultratunn design, bakgrundsbelyst tangentbord och teknisk analys av prestanda och viktiga köpbeslut.
Hårdvara

ThinkPad X9-14 Gen 1 Teknisk analys och viktiga beslut

18 februari 2026
211
Mantenimiento ThinkPad T14 Gen 4 AMD en uso real, portátil abierto y en funcionamiento durante revisión técnica en entorno profesional.
Hårdvara

ThinkPad T14 Gen 4 AMD-underhåll i verklig användning

28 april 2026
166
Termopastans varaktighet - Applicera termopasta på processorn för att förbättra kylningen och förklara hur länge termopastan håller på processorn.
Hårdvara

Termopastans livslängd och dess inverkan på datorns prestanda

28 januari 2026
419
Är det vettigt att investera i PCIe 7.0 idag? – PCI-SIG tillkännager de slutgiltiga PCIe 7.0-specifikationerna, som lyfter fram den nya PCI Express-standarden med hastigheter upp till 128 GT/s för nästa generations datoranvändning.
Hårdvara

Är det vettigt att investera i PCIe 7.0 idag? Verkliga effekter och scenarier

28 januari 2026
199
Nästa publikation
Minecraft på E Ink: Minecraft körs på en surfplatta med en E Ink-gråskaleskärm, vilket visar de verkliga begränsningarna med e-bläck vad gäller prestanda och bildkvalitet under spel.

Minecraft på E Ink: verkliga skärmgränser

5 1 rösta
Artikel Betyg
Prenumerera
Tillträde
Meddela i
gäst
gäst
0 Kommentarer
Äldsta
Den nyaste De flesta röstade
I linje kommentarer
Se alla recensioner

Håll Kontakten

  • 976 Fans
  • 118 Anhängare
  • 1.4 k Anhängare
  • 1.8 k Prenumeranter
  • Trender
  • Kommentarer
  • Sista
🖥️ Hur öppna Enheter och skrivare " i Windows 11: 4 enkla steg

🌟 Hur öppna Enheter och skrivare " i Windows 11: ¡Fantastiska trick!

21 juni 2026
Windows 11 Permanent klocka: Alternativ för att visa en permanent klocka, begränsningar och praktiska beslut, med blå bakgrund, Windows-ikon och minimalistisk analog klocka.

Windows 11 Persistent Clock: Alternativ, begränsningar och verkliga beslut

21 juni 2026
Ethernet fungerar inte i Windows 11: 9 enkla knep

Ethernet fungerar inte i Windows 11: 3-minuterslösning ⚡🌐

13 november 2025
Hur för att spara spelet i REPO

Hur för att spara spelet i REPO 🔥 Upptäcka hemligheten med att inte förlora framsteg

7 juli 2025
Funktioner i Gmail för Android: Spara tid med 5 tips

Funktioner i Gmail i Android: du 5 knep du inte vet! 📱✨

12
Reparation av moderkort i en bärbar dator: internvy med moderkort, kylsystem, fläktar och viktiga komponenter för kontroll i en öppen bärbar dator

Reparation av moderkort i bärbar dator – Steg-för-steg-diagnos

10
Installera Windows 11 Hem utan Internet

Installera Windows 11 Hem utan Internet

10
Hur backup-drivrutiner i Windows 11/10 i 4 steg!

Hur backup-drivrutiner i Windows 11/10 Det Förhindrar fel! 🚨💾

10
Sekretess i Windows 11 - Kvinna som använder en bärbar dator hemma och konfigurerar sekretessalternativ i Windows 11 med O&O ShutUp10++, visar säkerhetsinställningar och datakontroll på skärmen.

Sekretess i Windows 11 med O&O ShutUp10++

21 juni 2026
Valfria Windows 11-funktioner - Kvinna som arbetar på en bärbar dator med Windows 11 och aktiverar valfria funktioner i systeminställningarna; guide om när man aktiverar eller inaktiverar valfria Windows 11-funktioner i en modern kontorsmiljö.

Valfria funktioner i Windows 11: när du ska slå på eller av dem

21 juni 2026
Saros slut: A. Devraj i futuristisk Soltari-rustning i en mörk och dramatisk scen, analys av videospelets huvudslut och hemliga slut.

Saros slut: Analys av huvud- och hemligheten

14 juni 2026
AMD UDNA-arkitektur för PS6 och Xbox Next, detalj av nästa generations GPU-chip med avancerad design för högpresterande spelkonsoler.

UDNA-arkitektur i PS6 och Xbox Next: mer än bara siffror

4 maj 2026

Senaste Nyheterna

Sekretess i Windows 11 - Kvinna som använder en bärbar dator hemma och konfigurerar sekretessalternativ i Windows 11 med O&O ShutUp10++, visar säkerhetsinställningar och datakontroll på skärmen.

Sekretess i Windows 11 med O&O ShutUp10++

21 juni 2026
59
Valfria Windows 11-funktioner - Kvinna som arbetar på en bärbar dator med Windows 11 och aktiverar valfria funktioner i systeminställningarna; guide om när man aktiverar eller inaktiverar valfria Windows 11-funktioner i en modern kontorsmiljö.

Valfria funktioner i Windows 11: när du ska slå på eller av dem

21 juni 2026
65
Saros slut: A. Devraj i futuristisk Soltari-rustning i en mörk och dramatisk scen, analys av videospelets huvudslut och hemliga slut.

Saros slut: Analys av huvud- och hemligheten

14 juni 2026
97
AMD UDNA-arkitektur för PS6 och Xbox Next, detalj av nästa generations GPU-chip med avancerad design för högpresterande spelkonsoler.

UDNA-arkitektur i PS6 och Xbox Next: mer än bara siffror

4 maj 2026
136
MasterTrend Info-logotyp

MasterTrend Info är din källa till information i teknik: upptäck nyheter, tutorials, och analys av hårdvara, mjukvara, spel, mobil, och artificiell intelligens. Prenumerera på vårt nyhetsbrev för att inte missa någon trend.

Följ oss

Bläddra efter Kategori

  • Gaming
  • Hårdvara
  • IA
  • Mobil
  • Vad är nytt
  • Nätverk
  • Säkerhet
  • Programvara
  • Tutorials
  • Windows

Senaste Nyheterna

Sekretess i Windows 11 - Kvinna som använder en bärbar dator hemma och konfigurerar sekretessalternativ i Windows 11 med O&O ShutUp10++, visar säkerhetsinställningar och datakontroll på skärmen.

Sekretess i Windows 11 med O&O ShutUp10++

21 juni 2026
Valfria Windows 11-funktioner - Kvinna som arbetar på en bärbar dator med Windows 11 och aktiverar valfria funktioner i systeminställningarna; guide om när man aktiverar eller inaktiverar valfria Windows 11-funktioner i en modern kontorsmiljö.

Valfria funktioner i Windows 11: när du ska slå på eller av dem

21 juni 2026
  • Om Oss
  • Meddela
  • Sekretesspolicy
  • Kontakta oss

Upphovsrätt © 2025 https://mastertrend.info/ - Alla rättigheter förbehållna. Alla varumärken tillhör sina respektive ägare.

We've detected you might be speaking a different language. Do you want to change to:
es_ES Spanish
es_ES Spanish
en_US English
pt_BR Portuguese
fr_FR French
it_IT Italian
ru_RU Russian
de_DE German
zh_CN Chinese
ko_KR Korean
ja Japanese
th Thai
hi_IN Hindi
ar Arabic
tr_TR Turkish
pl_PL Polish
id_ID Indonesian
nl_NL Dutch
sv_SE Swedish
Change Language
Close and do not switch language
Inga resultat
Se alla resultat
  • sv_SESwedish
    • es_ESSpanish
    • en_USEnglish
    • pt_BRPortuguese
    • fr_FRFrench
    • it_ITItalian
    • de_DEGerman
    • ko_KRKorean
    • jaJapanese
    • zh_CNChinese
    • ru_RURussian
    • pl_PLPolish
    • id_IDIndonesian
    • tr_TRTurkish
    • hi_INHindi
    • thThai
    • arArabic
    • nl_NLDutch
  • Gaming
  • Hårdvara
  • IA
  • Mobil
  • Vad är nytt
  • Nätverk
  • Säkerhet
  • Programvara
  • Tutorials
  • Windows

Upphovsrätt © 2025 https://mastertrend.info/ - Alla rättigheter förbehållna. Alla varumärken tillhör sina respektive ägare.

wpDiscuz
RedditBlueskyXMastodonHacker News
Dela detta:
MastodonVKWhatsAppTelegramSMSLinjeMessengerFlipboardHacker NewsBlandaIntill hotelletFörvirringXingYummly
Din Mastodon Exempel