Home Tehnoloģija Pateicoties AI secinājumu darbam, mākoņdatošana var eksplodēt

Pateicoties AI secinājumu darbam, mākoņdatošana var eksplodēt

6
0

dem10/iStock/Getty Pictures Plus

Sekojiet ZDNET: Pievienojiet mūs kā vēlamo avotu Google tīklā.


ZDNET galvenās atziņas

  • CNCF vēršas pret mākoņdatošanu, kas darbojas roku rokā ar AI.
  • AI secinājums ir tehnoloģija, kas mākoņdatošanas uzņēmumiem nopelnīs simtiem miljardu.
  • Jau parādās jauni AI mākoņu veidi, piemēram, jaunmākoņi.

Plkst KubeCon Ziemeļamerika 2025 Atlantā, Cloud Native Computing Foundation (CNCF)Uzņēmuma vadītāji prognozēja milzīgu mākoņdatošanas pieaugumu, ko izraisīja AI secinājumu darba slodzes straujš pieaugums. Cik liela izaugsme? Viņi prognozē simtiem miljardu dolāru tēriņus nākamo 18 mēnešu laikā.

AI secinājumi ir course of, kurā apmācīts lielas valodas modelis (LLM) izmanto apgūto jauniem datiem, lai veiktu prognozes, lēmumus vai klasifikācijas. Praktiski course of norit šādi. Pēc tam, kad modelis ir apmācīts, piemēram, jaunais GPT 5.1, mēs to izmantojam secinājumu fāzē, kur tas analizē datus (piemēram, jaunu attēlu) un rada izvadi (identificējot attēla saturu), netiekot īpaši ieprogrammēts katram jaunajam attēlam. Šīs secinājumu darba slodzes mazina plaisu starp LLM un AI tērzēšanas robotiem un aģentiem.

Arī: Kubernetes, mākoņdatošanas dzinējs, tiek uzpūsts mākslīgajam intelektam

CNCF izpilddirektors Džonatans Braiss KubeCon preses konferencē paskaidroja, ka AI secinājums ir “posms, kurā jūs izmantojat šo modeli, jūs apkalpojat modeli un atbildat uz jautājumiem, veicat prognozes, ievadāt to sistēmās, lai iegūtu šo informāciju un savienotu to ar pasauli. Viņš uzsvēra, ka secinājums ietver apmācīta AI modeļa pārveidošanu par pakalpojumu, kas var reaģēt uz jauniem jautājumiem vai situācijām.

LLM izveide ir prātam neaptverami dārga. Pēc Braisa teiktā, OpenAI izpilddirektors Sems Altmans ir teicis, ka GPT-5 apmācības var izmaksāt līdz miljardam dolāru. Par laimi, lielākajai daļai uzņēmumu, sacīja Braiss, nav nepieciešams un viņiem pat nevajadzētu mēģināt veidot masveida LLM. Tā vietā viņiem vajadzētu izmantot “simtiem mazāku, precīzi noregulētu atvērtā pirmkoda modeļu konkrētiem uzdevumiem, piemēram, noskaņojuma analīzei, koda ģenerēšanai un līgumu pārskatīšanai”. Turklāt viņiem vajadzētu izmantot secinājumus, lai maksimāli palielinātu savu LLM un mazāko modeļu priekšrocības.

Braiss turpināja, ka ir desmitiem secinājumu dzinēju. Jo īpaši parādās jauns mākoņdatošanas dzinēju vilnis. Šie dzinēji ietver KServe, NVIDIA NIM, Parasail.io, AIBrixun llm-d. Viņiem visiem kopīgs ir tas, ka šīs platformas izvieto, pārvalda un mērogo AI ražošanā, izmantojot konteinerus un Kubernetes.

Kā arī: Kāpēc pat ASV tehnoloģiju gigants tagad sāk “suverēnu atbalstu” Eiropai

Saskaņā ar CNCF datiem šie specializētie traucējumu modeļi lietotājiem piedāvā vairākas priekšrocības. Tie ietver:

  • Izmaksu efektivitāte: ievērojami lētāk darboties un precizēt.
  • Efficiency: ātrāk un bieži vien precīzāk konkrētam domēnam.
  • Lētāka aparatūra: tiem nav nepieciešami lielākie, jaunākie un retākie GPU, lai veiktu secinājumus.
  • Drošība un privātums: tie var būt pašmitināti, lokāli vai mākonī.

Mākoņdatošana un mākslīgā intelekta secinājumi apvienojas tad, kad AI vairs nav atsevišķs ceļš no mākoņdatošanas. Tā vietā AI darba slodze, jo īpaši secinājumu veikšanas uzdevumi, veicina jaunu laikmetu, kurā viedajām lietojumprogrammām nepieciešama mērogojama un uzticama infrastruktūra.

Šis laikmets attīstās, jo, teica Braiss, “AI pāriet no dažiem” Apmācības superdatoriem” uz plaši izplatītu “Uzņēmuma secinājumu”. Tā būtībā ir mākoņdatošanas problēma. Jūs, platformas inženieri, esat tie, kas veidos atvērtā pirmkoda platformas, kas atbloķēs uzņēmuma AI.”

Arī: kodēšana ar AI? Mani 5 populārākie padomi, kā pārbaudīt tā rezultātus un izvairīties no problēmām

“Mākoņu un mākslīgā intelekta izstrāde saplūst, un tā patiešām ir neticama vieta, kurā mēs šobrīd atrodamies,” sacīja CNCF CTO Kriss Aniščiks. Dati apstiprina šo viedokli. Piemēram, Google ir ziņojis, ka tās iekšējās izsecināšanas darbi pēdējā laikā ir apstrādājuši 1,33 kvadriljonus marķieru mēnesī, salīdzinot ar 980 triljoniem tikai dažus mēnešus iepriekš.

Patiešām, ir jauna veida mākonis, kas pazīstams kā jaunmākoņikas veltīta AI. Neoclouds koncentrējas gandrīz tikai uz GPU kā pakalpojuma (GPUaaS) nodrošināšanu, tukša metāla veiktspēju un infrastruktūru, kas ir īpaši optimizēta mākslīgā intelekta apmācībai un, galvenais, secinājumiem.

Aniščiks piebilda, ka mākoņdatošanas projekti, jo īpaši Kubernetes, pielāgojas, lai veiktu secinājumu darba slodzi plašā mērogā: “Kubernetes acīmredzami ir viens no vadošajiem piemēriem pēdējā laidienā… dinamiskā resursu piešķiršanas funkcija nodrošina GPU un TPU aparatūras abstrakciju Kubernetes kontekstā.”

Lai labāk apmierinātu pieprasījumu, CNCF paziņoja par sertificētu Kubernetes AI atbilstības programmu, kuras mērķis ir padarīt AI darba slodzi tikpat pārnēsājamu un uzticamu kā tradicionālās mākoņdatošanas lietojumprogrammas.

Tāpat: uzņēmumi nav gatavi ļaunprātīgu AI aģentu pasaulei

“Tā kā mākslīgais intelekts pāriet uz ražošanu, komandām ir nepieciešama konsekventa infrastruktūra, uz kuru tās var paļauties,” savā galvenajā uzrunā norādīja Aniščiks. “Šī iniciatīva radīs kopīgus aizsargmargas, lai nodrošinātu, ka AI darba slodze dažādās vidēs darbojas paredzami. Tā balstās uz to pašu kopienas virzītu standartu procesu, ko esam izmantojuši kopā ar Kubernetes, lai palīdzētu nodrošināt konsekvenci kā AI ieviešanas skalas.”

Tas, ko visi šie centieni nozīmē uzņēmējdarbībai, ir tas, ka AI secinājumi, tēriņi mākoņdatošanas infrastruktūrai un pakalpojumiem nākamajos 18 mēnešos sasniegs simtiem miljardu. Šis ieguldījums ir tāpēc, ka CNCF vadītāji prognozē, ka uzņēmumi sacentīsies, lai iegūtu uzticamus, rentablus AI pakalpojumus. Viņi nav vienīgie, kas redz šo tendenci. Dominiks Vailds, Kubernetes izplatīšanas uzņēmuma SVP Mirantisintervijā sacīja, ka drīzumā būs Inference-as-a-Service mākoņpakalpojumi.

Es domāju, ka šiem ekspertiem ir taisnība. Pastāv dabiska sinerģija starp AI un mākoņdatošanu. Šis savienojums savukārt nozīmē, ka uzņēmumi, kas var vislabāk izmantot savienošanu pārī, var cerēt uz peļņu neatkarīgi no tā, vai tie piedāvā mākoņdatošanas/AI pakalpojumus vai izmanto tos savu biznesa plānu uzlabošanai.



avots

LEAVE A REPLY

Please enter your comment!
Please enter your name here