Tā kā AI jaunizveidotajos uzņēmumos ieplūst tik daudz naudas, ir pienācis laiks būt AI pētniekam ar ideju, ko izmēģināt. Un, ja ideja ir pietiekami jauna, varētu būt vieglāk iegūt nepieciešamos resursus kā neatkarīgam uzņēmumam, nevis kādā no lielajām laboratorijām.
Tas ir stāsts par Inception — jaunuzņēmumu, kas izstrādā uz difūziju balstītus mākslīgā intelekta modeļus, kas tikko piesaistīja $ 50 miljonus sākuma finansējuma, ko vadīja Menlo Ventures. Andrew Ng un Andrej Karpathy nodrošināja papildu eņģeļu finansējumu.
Projekta vadītājs ir Stenfordas profesors Stefano Ermons, kura pētījumi koncentrējas uz difūzijas modeļiem, kas rada rezultātus, izmantojot iteratīvu pilnveidošanu, nevis vārdu pa vārdam. Šie modeļi darbina uz attēliem balstītas mākslīgā intelekta sistēmas, piemēram, Steady Diffusion, Midjourney un Sora. Strādājot pie šīm sistēmām, pirms AI uzplaukums tās padarīja aizraujošas, Ermons izmanto Inception, lai piemērotu tos pašus modeļus plašākam uzdevumu klāstam.
Kopā ar finansējumu uzņēmums izlaida jaunu sava Mercury modeļa versiju, kas paredzēta programmatūras izstrādei. Mercury jau ir integrēts vairākos izstrādes rīkos, tostarp ProxyAI, Buildglare un Kilo Code. Vissvarīgākais ir tas, ka Ermons saka, ka difūzijas pieeja palīdzēs Inception modeļiem ietaupīt divus no vissvarīgākajiem rādītājiem: latentumu (reakcijas laiku) un aprēķina izmaksas.
“Šie uz difūziju balstītie LLM ir daudz ātrāki un daudz efektīvāki par to, ko šodien veido visi citi,” saka Ermons. “Tā ir tikai pilnīgi atšķirīga pieeja, kurā ir daudz jauninājumu, ko joprojām var piedāvāt.”
Lai izprastu tehniskās atšķirības, ir nepieciešama neliela pieredze. Difūzijas modeļi strukturāli atšķiras no automātiskās regresijas modeļiem, kas dominē teksta AI pakalpojumos. Automātiskās regresijas modeļi, piemēram, GPT-5 un Gemini, darbojas secīgi, paredzot katru nākamo vārdu vai vārda fragmentu, pamatojoties uz iepriekš apstrādāto materiālu. Izkliedēšanas modeļi, kas apmācīti attēlu ģenerēšanai, izmanto holistiskāku pieeju, pakāpeniski mainot atbildes vispārējo struktūru, līdz tā atbilst vēlamajam rezultātam.
Parastā gudrība ir izmantot automātiskās regresijas modeļus teksta lietojumprogrammām, un šī pieeja ir bijusi ļoti veiksmīga pēdējās AI modeļu paaudzēs. Taču arvien vairāk pētījumu liecina, ka difūzijas modeļi var darboties labāk, ja modelis ir tāds liela teksta daudzuma apstrāde vai datu ierobežojumu pārvaldīšana. Kā stāsta Ermons, šīs īpašības kļūst par reālu priekšrocību, veicot darbības salīdzinājumā ar lielām kodu bāzēm.
Techcrunch pasākums
Sanfrancisko
|
2026. gada 13.–15. oktobris
Difūzijas modeļiem ir arī lielāka elastība attiecībā uz aparatūras izmantošanu, kas ir īpaši svarīga priekšrocība, jo kļūst skaidras AI infrastruktūras prasības. Ja automātiskās regresijas modeļiem ir jāizpilda darbības viena pēc otras, difūzijas modeļi var apstrādāt daudzas operācijas vienlaicīgi, ļaujot ievērojami mazāku latentumu sarežģītos uzdevumos.
“Mūsu salīdzinājums ir vairāk nekā 1000 marķieru sekundē, kas ir daudz augstāks nekā jebkas, kas ir iespējams, izmantojot esošās autoregresīvās tehnoloģijas,” saka Ermons, “jo mūsu lieta ir veidota tā, lai tā būtu paralēla. Tā ir izveidota tā, lai tā būtu patiešām, ļoti ātra.”












