OpenAI i Broadcom: Novi val prilagođenih AI čipova mijenja pravila igre

OpenAI i Broadcom: Novi val prilagođenih AI čipova mijenja pravila igre OpenAI prelazi iz faze razvoja modela u eru vertikalne integracije – od softvera do vlastitog hardvera. Prema više izvora,...

OpenAI i Broadcom: Novi val prilagođenih AI čipova mijenja pravila igre

OpenAI prelazi iz faze razvoja modela u eru vertikalne integracije – od softvera do vlastitog hardvera. Prema više izvora, tvrtka će u partnerstvu s Broadcomom razviti vlastite AI čipove, a masovna proizvodnja trebala bi započeti već iduće godine, gledano iz perspektive rujna 2025., dok se prvi javni plasman očekuje 2026. Ovo nije eksperiment ili prototip za pokazivanje – riječ je o ozbiljnoj proizvodnji i integraciji, gdje Broadcom donosi stručnost u poluvodičima i mrežama, a OpenAI vlastite modele i radna opterećenja.

Zašto je ovo važno upravo sada? Lanci opskrbe su pod političkim pritiscima, cijene računalnih resursa rastu, a dostupnost GPU-ova postala je ključna prepreka za svaki veći AI projekt. Ako OpenAI i Broadcom uspješno isporuče vlastiti ASIC, to bi moglo redefinirati trošak po tokenu i performanse po vatu za inferenciju – pa čak i treniranje – na razini interneta.

OpenAI i Broadcom logotipi na pozadini podatkovnog centra
OpenAI i Broadcom logotipi na pozadini podatkovnog centra

Signali s puta: što znamo, a što još čekamo

Prvi izvještaji sugeriraju da će masovna proizvodnja krenuti 2026., uz mogućnost ranijih uzoraka, što se uklapa u tipični 12–18-mjesečni ciklus razvoja prilagođenih ASIC-ova. No, ključne tehničke specifikacije još nisu objavljene: procesna tehnologija, kapacitet HBM memorije, tipovi međusobnog povezivanja, numerički formati (FP8/FP16/INT8) i potrošnja energije ostaju nepoznanica. Bez tih podataka, teško je procijeniti radi li se o čipovima za treniranje, inferenciju ili hibridnim rješenjima za optimizaciju ukupnog troška vlasništva (TCO).

“Smanjenje ovisnosti o NVIDIJI” – izričit je strateški cilj koji pokreće ovaj razvoj.

Vertikalna integracija donosi prednosti u kontroli troškova i performansi. Su-dizajn hardvera i modela može smanjiti latenciju, optimizirati memorijske tokove i standardizirati ključne operatore, što rezultira boljim omjerom cijene i performansi za produkcijske AI zadatke. No, time OpenAI preuzima i rizike – od životnog ciklusa hardvera, preko održavanja firmwarea i drivera, do dugoročne podrške za developere.

NVIDIA i dalje dominira tržištem, s CUDA/cuDNN ekosustavom koji stvara visoke troškove prelaska. Ipak, Broadcomova kombinacija ASIC-ova i mrežnih rješenja omogućuje im da ponude integrirane pakete – računalnu snagu i povezivanje u jednom. Ako OpenAI-ovi čipovi ispune očekivanja, dio tržišta mogao bi se odmaknuti od GPU-centric dizajna. U međuvremenu, izvozna ograničenja oblikuju tko može kupiti što i gdje.

Geopolitika je postala tehnička specifikacija. NVIDIA je u drugom kvartalu 2025. zabilježila nula prodaja H20 GPU-ova Kini zbog američkih izvoznih ograničenja, dok je za to tržište razvijen B30 model. Kineska domaća izgradnja AI infrastrukture je ogromna – procjenjuje se na 50 milijardi dolara u bliskoj budućnosti i čak 3–4 bilijuna dolara do 2030. Lokalni proizvođači poput Cambricona bilježe rast prihoda od čak 4.300% u prvoj polovici 2025., što pokazuje koliko politika može brzo promijeniti tržišne odnose.

Financijska tržišta reagiraju unaprijed. Broadcom (AVGO) je do rujna 2025. porastao 28% YTD, analitičari očekuju EPS od 1,66 dolara i prihode od 15,82 milijardi dolara za Q3, a uprava je odobrila otkup dionica vrijedan 10 milijardi dolara. Ipak, dio izvještaja nosi napomene da su AI-generirani ili nepotpuno provjereni – što znači da sentiment često ide ispred stvarnih rezultata.


Specijalizacija protiv fleksibilnosti: trendovi i protuteže

Trend je jasan: specijalizacija dobiva na važnosti. Veliki cloud igrači koji pokreću masovne inferencijske zadatke najviše profitiraju od ASIC-ova prilagođenih njihovim modelima. Kontrola nad kompilatorom i silicijem omogućuje optimizaciju svakog sloja modela prema mogućnostima čipa.

No, fleksibilnost još uvijek pobjeđuje u istraživačkim sprintovima. GPU-ovi su i dalje nezamjenjivi za razvoj novih arhitektura, brzu iteraciju i široku podršku ekosustava. Kupci koji razmatraju ASIC-ove suočavaju se s klasičnom dilemom – niži TCO za stabilne produkcijske zadatke nasuprot agilnosti za nove modele. Većina će birati kombinaciju, a ne potpunu zamjenu.

Drugi trend je integracija: Broadcomova mrežna rješenja omogućuju prodaju računalne snage, povezivanja i telemetrije u paketu. To može povećati iskorištenost klastera i smanjiti latenciju, posebno kod distribuirane inferencije.

No, vremenski okviri mogu odlučiti pobjednika. Ako OpenAI i Broadcom ne isporuče validirani silicij, drivere i kompilatore do 2026., postojeći lideri dobit će dodatno vrijeme za jačanje softverske prednosti i dugoročne ugovore.

Pokretači Ograničenja
Eksplozija troškova AI-a Nedostatak tehničkih specifikacija
Ograničena dostupnost GPU-a Zrelost alata u odnosu na CUDA
Potreba za boljim perf/watt Integracija u podatkovne centre
Geopolitička fragmentacija Nepotpune objave i nesigurnost
Broadcomov kapital i portfelj
Podijeljena karta svijeta s lancima opskrbe čipovima i izvoznim barijerama
Podijeljena karta svijeta s lancima opskrbe čipovima i izvoznim barijerama

Prilike i rizici za ključne aktere

Što OpenAI i Broadcom mogu dobiti ili izgubiti

  • Prilika: Smanjenje troška po tokenu za stabilnu inferenciju u velikim razmjerima. ASIC optimiziran za poznate operatore i memorijske tokove može nadmašiti opće GPU-ove u performansama po vatu i ukupnom trošku vlasništva.
  • Rizik: Softver određuje usvajanje. Kompilatori, alati za kvantizaciju, kernel biblioteke, alati za debuggiranje i performanse moraju biti na razini produkcije. Stabilnost firmwarea i putovi za oporavak od grešaka bit će ključni za povjerenje kupaca.
  • Rizik: Izvršenje programa. Zatvaranje RTL-a, fizički dizajn, validacija i upravljanje iskoristivošću pod pritiskom lokalizacije lanca opskrbe mogu produžiti rokove. Rezervacije kapaciteta u vodećim tvornicama (još nepoznate) su ograničavajući faktor.

NVIDIA i GPU ekosustav: prijetnje i prilike

  • Prilika: Ako OpenAI cilja inferenciju, potražnja za GPU-ovima za treniranje može ostati visoka ili čak rasti, jer se razvijaju novi modeli. NVIDIA bi mogla dodatno učvrstiti softversku prednost.
  • Rizik: Ako OpenAI pokaže znatno bolje performanse po vatu ili trošku po tokenu u idućih 18 mjeseci, veliki kupci će tražiti niže cijene GPU-ova, diversificirati nabavu i zahtijevati veću interoperabilnost.

Investitori: visoka očekivanja, ali i volatilnost

  • Prilika: Snažni signali Broadcoma – +28% YTD, EPS 1,66 dolara, prihodi 15,82 milijardi dolara, otkup dionica od 10 milijardi – ukazuju na povjerenje uprave. Ako prihodi od AI ASIC-a krenu već u fiskalnoj 2026., postoji potencijal za rast.
  • Rizik: Ishod je binaran. Kašnjenja ili manji doprinos prihodu mogu uzrokovati korekcije cijene dionica. Neki izvještaji su djelomično AI-generirani – volatilnost treba promatrati kao sentiment, a ne temeljnu vrijednost dok ne stignu službeni podaci.

Poduzeća i cloud pružatelji: balansiranje između inovacije i fragmentacije

  • Prilika: Višedobavljački stackovi smanjuju geopolitičke i opskrbne rizike te omogućuju arbitražu troškova između specijaliziranih i općih akceleratora. Ugovori će sve češće dijeliti radna opterećenja po klasi hardvera.
  • Rizik: Trošak fragmentacije. Održavanje više alata, kernela i runtime okruženja povećava integracijske i kadrovske troškove. Rizik od zaključavanja raste ako su čipovi vezani uz vlasničke runtime sustave.

Scenariji za sljedećih 24 mjeseca: što očekivati

Kratkoročno (6–12 mjeseci)

  • Osnovni scenarij: Inženjerski prekretnice su ostvarene; pojavljuju se prvi uzorci silicija ili emulacije; preliminarni prikazi kompilatora i alata za odabrane partnere. Komunikacija jasno definira ciljana radna opterećenja (vjerojatno inferenciju).
  • Negativni scenarij: Kašnjenje u kapacitetima tvornica ili validaciji; ograničena transparentnost; developeri oklijevaju zbog nezrelosti alata.

Srednjoročno (12–24 mjeseca, do kraja 2026.)

  • Pozitivni ishod: Mjerljiva poboljšanja u performansama po vatu i trošku po tokenu na vodećim OpenAI modelima; integrirani paketi računalne snage i mreže; prvi vanjski korisnici putem cloud API-ja.
  • Neutralni ishod: Paritet s konkurencijom na nekim metrikama, ali trenje u ekosustavu ograničava širu primjenu izvan OpenAI-jevih radnih opterećenja; GPU-ovi zadržavaju većinu tržišta za treniranje.
  • Negativni ishod: Kašnjenja, skromna poboljšanja ili nedostatak alata zadržavaju tržište oko GPU-ova; postojeći lideri učvršćuju poziciju kroz softver i ugovore.

Ključne preporuke i otvorena pitanja za 2025.

Što se događa?
OpenAI i Broadcom ulaze u masovnu proizvodnju prilagođenih AI čipova s lansiranjem 2026. i mogućim ranim uzorcima. Cilj je čvršća integracija hardvera i softvera te smanjenje ovisnosti o NVIDIJI.

Zašto je to važno?
Troškovi i kapacitet definiraju granice AI-a. Specijalizirani silicij mogao bi omogućiti povoljniju ekonomiju za produkcijski AI. Broadcomova mrežna rješenja čine integrirane podatkovne centre realnom opcijom. Geopolitika ubrzava eru višedobavljačkih rješenja.

Što dalje pratiti?
– Objavu tehničkih specifikacija: procesna tehnologija, HBM, međupovezivanje, numerički formati, potrošnja energije.
– Softverski ekosustav: kompilatori, alati za kvantizaciju, kernel biblioteke, vodiči za migraciju.
– Financijske izvještaje: prihodi od AI čipova, kapitalna ulaganja, signali o korisničkoj bazi.

Otvorena pitanja:
– Hoće li prva generacija biti optimizirana za treniranje ili inferenciju?
– Koje tvornice i procesni čvorovi će se koristiti, i gdje će se proizvodnja odvijati?
– Koliko će softver biti prenosiv – hoće li postojati podrška za CUDA, ONNX/TVM ili novi runtime?
– Kakvi su komercijalni uvjeti – ekskluzivnost, licenciranje, dugoročna podrška?
– Kako će se uskladiti s izvoznim režimima i regionalnim varijantama proizvoda?

Preporučene akcije:
CTO-ovi: Pokrenite dvostruku strategiju – testirajte ASIC-ove i GPU-ove na vlastitim zadacima; planirajte budžet za evaluaciju alata i pilot klastere u 2026.
CFO-ovi: Modelirajte osjetljivost na poboljšanja troška po tokenu i diversifikaciju nabave; izbjegavajte dugoročne ugovore s jednim dobavljačem.
Razvojni inženjeri: Ulažite u prenosive grafičke IR-ove i apstrakcijske slojeve (ONNX/MLIR/TVM); stabilizirajte skup operatora radi lakšeg portanja.
Investitori: Budite oprezni prema senzacionalističkim naslovima; tražite konkretne podatke, pilot projekte i korisničke reference prije procjene višegodišnjih prihoda.


Zaključak: Prava kombinacija specijalizacije i fleksibilnosti

Ako OpenAI i Broadcom uspješno pretvore najave u validirani silicij, težište produkcijskog AI-a moglo bi se pomaknuti s paradigme “GPU po defaultu” prema “pravi silicij za pravi zadatak”. Pobjednici će biti oni koji znaju gdje specijalizacija donosi najveći povrat, a gdje je fleksibilnost ekosustava presudna.


Table of Contents

OpenAI i Broadcom: Novi val prilagođenih AI čipova mijenja pravila igre OpenAI prelazi iz faze razvoja modela u eru vertikalne integracije – od softvera do vlastitog hardvera. Prema više izvora,...

More Info

Greatly hearted has who believe. Drift allow green son walls years for blush. Sir margaret drawings repeated recurred exercise.

You have been successfully Subscribed! Ops! Something went wrong, please try again.

Quick Links

Services

About Me

Projects

Contact

Address

© 2025 Created by dolenec