Pievienojieties pasākumam, kuru uzņēmuma vadītāji uzticas gandrīz divas desmitgades. VB Remodel apvieno cilvēkus, kas veido reālu uzņēmumu AI stratēģiju. Uzziniet vairāk
Cimdi nokrita plkst Otrdiena VB Transformācija 2025 Kā alternatīvi mikroshēmu veidotāji paneļa laikā tieši apstrīdēja Nvidia dominējošo stāstījumu par secinājumiem, atklājot fundamentālu pretrunu: kā var būt AI secinājumi Apmeklēta “rūpnīca” un komanda 70% bruto robežas?
Džonatans Ross, izpilddirektors Grostanemazināja vārdus, apspriežot Nvidia rūpīgi izstrādāto ziņojumapmaiņu. “AI rūpnīca ir tikai mārketinga veids, kā padarīt AI skaņu mazāk biedējošu,” paneļa laikā sacīja Ross. Šons melo, CTO Cerebraskonkurents, bija tikpat tiešs: “Es nedomāju, ka Nvidia Minds ir visi pakalpojumu sniedzēji, kas to cīnās par katru pēdējo santīmu, kamēr viņi tur sēž ērti ar 70 punktiem.”
Uz spēles ir simtiem miljardu infrastruktūras investīciju un uzņēmuma AI arhitektūras nākotnes arhitektūra. CISO un AI līderiem, kas šobrīd ir ieslodzīti iknedēļas sarunās ar Openai un citiem pakalpojumu sniedzējiem, lai iegūtu lielāku jaudu, komisija atklāja nepatīkamas patiesības par to, kāpēc viņu AI iniciatīvas turpina trāpīt ceļa blokus.
>> Skatiet visu mūsu transformācijas 2025 pārklājumu šeit <<Jaudas krīze, par kuru neviens nerunā
“Ikviens, kurš patiesībā ir liels šo Gen AI modeļu lietotājs, zina, ka jūs varat doties uz Openai vai kā tas ir, un viņi faktiski nevarēs jums kalpot pietiekami daudz marķieri,” skaidroja Dilans Patels, dibinātājs Dilans Patels PusianalīzeApvidū Starp dažiem no lielākajiem AI lietotājiem un viņu modeļu pakalpojumu sniedzējiem notiek iknedēļas sanāksmes, lai mēģinātu pārliecināt viņus piešķirt lielāku jaudu. Pēc tam notiek iknedēļas sanāksmes starp šiem modeļa nodrošinātājiem un viņu aparatūras nodrošinātājiem. ”
Paneļa dalībnieki arī norādīja uz marķieru trūkumu kā rūpnīcas analoģijas pamatnes nepilnību. Tradicionālā ražošana reaģē uz pieprasījuma signāliem, pievienojot jaudu. Tomēr, ja uzņēmumiem ir nepieciešama 10 reizes lielāka secinājuma jauda, viņi atklāj, ka piegādes ķēde nevar saliekties. GPU ir nepieciešams divu gadu vadības laiks. Datu centriem ir vajadzīgas atļaujas un jaudas nolīgumi. Infrastruktūra netika veidota eksponenciālai mērogošanai, liekot pakalpojumu sniedzējiem piekļūt devējiem, izmantojot API ierobežojumus.
Pēc Patel teiktā, Antropisks Tikai sešu mēnešu laikā pieauga no USD 2 miljardiem līdz USD 3 miljardiem ARR. Kursors Pārgāja no būtībā nulles līdz USD 500 miljoniem ARR. Openai šķērsoja USD 10 miljardus. Tomēr uzņēmumi joprojām nevar iegūt nepieciešamos žetonus.
Kāpēc “rūpnīcas” domāšana pārtrauc AI ekonomiku
Jensena Huanga’s “AI rūpnīca”Koncepcija nozīmē standartizāciju, komercializāciju un efektivitātes ieguvumus, kas samazina izmaksas. Guess panelis atklāja trīs pamatus, kā šī metafora sadalās:
Pirmkārt, secinājumi nav vienādi. “Pat šodien, teiksim, DeepSeek secinājumam, ir vairāki pakalpojumu sniedzēji gar sava veida līkni, cik ātri viņi nodrošina par kādu cenu,” atzīmēja Patels. DeepSeek kalpo savam modelim par viszemākajām izmaksām, guess nodrošina tikai 20 žetonus sekundē. “Neviens nevēlas izmantot modeli ar 20 žetoniem sekundē. Es runāju ātrāk nekā 20 žetonus sekundē.”
Otrkārt, kvalitāte atšķiras mežonīgi. Ross uzzīmēja vēsturisku paralēli standarta eļļai: “Kad sākās standarta eļļa, eļļai bija atšķirīga kvalitāte. Jūs varētu iegādāties eļļu no viena pārdevēja, un tā varētu aizdedzināt jūsu māju.” Mūsdienu AI secinājumu tirgus saskaras ar līdzīgām kvalitātes variācijām, un pakalpojumu sniedzēji izmanto dažādas metodes, lai samazinātu izmaksas, kas netīšām kompromitē izlaides kvalitāti.
Treškārt, un kritiskāk, ekonomika ir apgriezta. “Viena no lietām, kas ir neparasta AI, ir tā, ka jūs nevarat tērēt vairāk, lai iegūtu labākus rezultātus,” skaidroja Ross. “Jums nevar būt tikai programmatūras lietojumprogramma, teiksim, es tērēšu divreiz vairāk, lai mitinātu savu programmatūru, un lietojumprogrammas var kļūt labākas.”
Kad Ross pieminēja, ka Marks Zuckerbergs uzslavēja Groq par to, ka viņi ir “vienīgie, kas to uzsāka ar pilnu kvalitāti”, viņš netīšām atklāja nozares kvalitātes krīzi. Tā nebija tikai atzīšana. Tā bija apsūdzība par visiem citiem nodrošinātājiem, kas griež stūrus.
Ross izteica mehāniku: “Daudzi cilvēki veic daudz triku, lai samazinātu kvalitāti, nevis ar nodomu, guess gan samazinātu izmaksas, uzlabot ātrumu.” Metodes izklausās tehniskas, taču ietekme ir vienkārša. Kvantēšana samazina precizitāti. Atzarošana noņem parametrus. Katra optimizācijas noārdās modeļa veiktspēja tādā veidā, kā uzņēmumi var neatklāt, kamēr ražošana neizdodas.
Standarta eļļas paralēlais Ross Drew apgaismo likmes. Mūsdienu secinājumu tirgus saskaras ar tādu pašu kvalitātes dispersijas problēmu. Pakalpojumu sniedzēji derēja, ka uzņēmumi nepamanīs atšķirību starp 95% un 100% precizitāti ir derības pret tādiem uzņēmumiem kā meta, kuriem ir sarežģītība izmērīt degradāciju.
Tas rada tūlītēju prasību uzņēmuma pircējiem.
- Pirms pakalpojumu sniedzēju izvēles izveidojiet kvalitatīvus etalonus.
- Revīzija esošie secinājumu partneri neizpaužām optimizācijām.
- Pieņemiet, ka augstākās kvalitātes cenu noteikšana par pilnīgu modeļa precizitāti tagad ir pastāvīga tirgus īpašība. Uzņemšanās funkcionālās ekvivalences laikmets starp secinājumu sniedzējiem beidzās, kad Zuckerbergs izsauca atšķirību.
1 miljona dolāru marķiera paradokss
Atklājošākais brīdis pienāca, kad panelis apsprieda cenu noteikšanu. Meli uzsvēra nozares neērto patiesību: “Ja šie miljonu žetonu ir tik vērtīgi, cik mēs uzskatām, ka tie var būt, pareizi? Tas nav par vārdu pārvietošanu. Jums nav jāmaksā 1 USD par vārdu pārvietošanu. Es savam advokātam maksāju 800 USD par stundu, lai uzrakstītu divu lappušu piezīmi.”
Šis novērojums samazinās AI cenu atklāšanas problēmas centrā. Nozare sacenšas, lai virzītu marķieru izmaksas zem 1,50 USD par miljonu, vienlaikus apgalvojot, ka šie žetoni pārveidos visus uzņēmējdarbības aspektus. Panelis netieši vienojās viens ar otru, ka matemātika nesummējas.
“Diezgan daudzi, tāpat kā visi šie strauji augošie jaunuzņēmumi, tērē summu, ko viņi tērē žetonos, kā pakalpojums gandrīz atbilst viņu ieņēmumiem viens pret vienu,” atklāja Ross. Šis 1: 1 tēriņu attiecība AI marķieriem salīdzinājumā ar ieņēmumiem ir neilgtspējīgs biznesa modelis, kuru paneļu dalībnieki uzskata “rūpnīcas” stāstījumu, kas ērti ignorē.
Veiktspēja maina visu
Cerebras un Groq ne tikai konkurē par cenu; Viņi arī sacenšas par sniegumu. Viņi būtiski maina to, kas ir iespējams secinājumu ātruma ziņā. “Izmantojot Vafer mēroga tehnoloģiju, kuru mēs esam izveidojuši, mēs dodam iespēju 10 reizes, dažreiz 50 reizes, ātrāku sniegumu nekā pat ātrākais GPU šodien,” sacīja Lie.
Tas nav pieaugošs uzlabojums. Tas ļauj pilnīgi jauniem lietošanas gadījumiem. “Mums ir klienti, kuriem ir aģentu darbplūsma, kas varētu ilgt 40 minūtes, un viņi vēlas, lai šīs lietas darbotos reālā laikā,” skaidroja meli. “Šīs lietas vienkārši nav pat iespējamas, pat ja esat gatavs maksāt prime dolāru.”
Ātruma diferenciālis rada divkāršu tirgu, kas izaicina rūpnīcas standartizāciju. Uzņēmumiem, kuriem nepieciešami reāllaika secinājumi, kas saistīti ar klientiem vērstām lietojumprogrammām, nevar izmantot to pašu infrastruktūru kā tie, kas darbojas nakti partiju procesos.
Īsts sašaurinājums: enerģijas un datu centri
Kamēr visi koncentrējas uz mikroshēmu piegādi, komisija atklāja faktisko ierobežojumu, kas aizraujas ar AI izvietošanu. “Datu centra ietilpība ir liela problēma. Jūs patiešām nevarat atrast datu centra vietu ASV,” sacīja Patels. “Jauda ir liela problēma.”
Infrastruktūras izaicinājums pārsniedz mikroshēmu ražošanu līdz pamatviesu ierobežojumiem. Kā paskaidroja Patels, “TSMC Taivānā spēj nopelnīt vairāk nekā 200 miljonu dolāru vērtas mikroshēmas, vai ne? Tas nav pat… tas ir ātrums, kādā viņi palielinās, ir smieklīgi.”
Guess mikroshēmu ražošana neko nenozīmē bez infrastruktūras. “Iemesls, kāpēc mēs redzam šos lielos Tuvo Austrumu darījumus, un daļēji kāpēc abiem šiem uzņēmumiem ir lielas klātbūtnes Tuvajos Austrumos, tas ir spēks,” atklāja Patels. Globālajam skaitļošanas motociklam ir uzņēmumi “došanās pa visu pasauli, lai iegūtu visur, kur pastāv enerģija, kur vien datu centra ietilpība pastāv, lai kur arī būtu elektriķi, kas var veidot šīs elektriskās sistēmas”.
Google “veiksmes katastrofa” kļūst par ikviena realitāti
Ross dalījās ar Google vēstures anekdoti: “Bija termins, kas 2015. gadā kļuva ļoti populārs Google, ko sauca par veiksmes katastrofu. Dažas no komandām bija izveidojušas AI lietojumprogrammas, kas pirmo reizi sāka darboties labāk nekā cilvēki, un pieprasījums pēc aprēķināšanas bija tik augsts, un viņiem vajadzēja ātri dubultoties vai trīskāršot globālo datu centra nospiedumu.”
Šis modelis tagad atkārto katru uzņēmuma AI izvietošanu. Lietojumprogrammas vai nu neizdodas iegūt vilci, vai arī pieredzē hokeja nūju augšanu, kas nekavējoties sasniedz infrastruktūras robežas. Nav vidusceļa, nav vienmērīgas mērogošanas līknes, ko rūpnīcas ekonomika paredzētu.
Ko tas nozīmē uzņēmuma AI stratēģijai
CIO, CISO un AI vadītājiem paneļa atklāsmes prasa stratēģisku atkārtotu kalibrēšanu:
Kapacitātes plānošanai nepieciešami jauni modeļi. Tradicionālā IT prognozēšana pieņem lineāru izaugsmi. AI darba slodze pārkāpj šo pieņēmumu. Kad veiksmīgas lietojumprogrammas palielina marķieru patēriņu par 30% mēnesī, gada jaudas plāni ceturtdaļās noveco. Uzņēmumiem jānovirzās no statiskā iepirkuma cikliem uz dinamiskās jaudas pārvaldību. Veidojiet līgumus ar pārsprāgšanas noteikumiem. Pārraugiet lietojumu nedēļā, nevis ceturksnī. Pieņemiet, ka AI mērogošanas modeļi atgādina vīrusu ieviešanas līkņu modeļus, nevis tradicionālo uzņēmumu programmatūras ieviešanu.
Ātruma prēmijas ir pastāvīgas. Ideja, ka secinājumi komerciāli izmantos vienotās cenas, ignorē milzīgās veiktspējas nepilnības starp pakalpojumu sniedzējiem. Uzņēmumiem ir nepieciešams budžets ātrumam tur, kur tas ir svarīgi.
Arhitektūra pārspēj optimizāciju. Groq un cerebras neuzvar, labāk veicot GPU. Viņi uzvar, pārdomājot AI Compute fundamentālo arhitektūru. Uzņēmumi, kas likmē visu, kas atrodas uz GPU balstītā infrastruktūrā, var iestrēgt lēnajā joslā.
Jaudas infrastruktūra ir stratēģiska. Ierobežojums nav mikroshēmas vai programmatūra, guess gan kilovati un dzesēšana. Viedie uzņēmumi jau bloķē enerģijas jaudu un datu centra vietu 2026. gadam un pēc tam.
Infrastruktūras realitātes uzņēmumi nevar ignorēt
Ekspertu grupa atklāja fundamentālu patiesību: AI rūpnīcas metafora nav tikai nepareiza, guess arī bīstama. Uzņēmumi veido stratēģijas, kas saistītas ar preču secinājumu cenu noteikšanu un standartizētu piegādi, plāno tirgū, kas neeksistē.
Reālais tirgus darbojas trīs brutālas realitātēs.
- Kapacitātes nepietiekamība rada spēka apgriezienus, ja piegādātāji diktē noteikumus un uzņēmumus, kas lūdz piešķīrumus.
- Kvalitātes dispersija, atšķirība starp 95% un 100% precizitāti, nosaka, vai jūsu AI lietojumprogrammas izdodas vai katastrofāli neizdodas.
- Infrastruktūras ierobežojumi, nevis tehnoloģija, nosaka saistīšanas robežas AI transformācijai.
CESO un AI vadītāju ceļš prasa pilnībā atteikties no rūpnīcas domāšanas. Tagad bloķējiet jaudas jaudu. Revīzijas secinājumu sniedzēji slēptai kvalitātes pasliktināšanai. Veidojiet pārdevēju attiecības, kuru pamatā ir arhitektūras priekšrocības, nevis robežizmaksu ietaupījumi. Kritiski pieņemiet, ka 70% peļņas maksāšana par uzticamiem, augstas kvalitātes secinājumiem var būt jūsu gudrākais ieguldījums.
Alternatīvie mikroshēmu veidotāji Remodel ne tikai izaicināja Nvidia stāstījumu. Viņi atklāja, ka uzņēmumi saskaras ar izvēli: maksājiet par kvalitāti un sniegumu vai pievienojas iknedēļas sarunu sanāksmēm. Paneļa vienprātība bija skaidra: panākumiem ir nepieciešams saskaņot īpašas darba slodzes atbilstošai infrastruktūrai, nevis jāveic visi piemērotie risinājumi.
avots