Home Tehnoloģija Fei-Fei Li’s World Labs paātrina pasaules modeļu sacīkstes ar Marble, savu pirmo...

Fei-Fei Li’s World Labs paātrina pasaules modeļu sacīkstes ar Marble, savu pirmo komerciālo produktu

27
0

AI pioniera Fei-Fei Li dibinātais starta uzņēmums World Labs laiž klajā savu pirmo komerciālo pasaules modeļa produktu. Marmors tagad ir pieejams, izmantojot freemium un maksas līmeņus, kas ļauj lietotājiem pārvērst teksta uzvednes, fotoattēlus, videoklipus, 3D izkārtojumus vai panorāmas rediģējamās, lejupielādējamās 3D vidēs.

Ģeneratīvās pasaules modeļa palaišana, pirmo reizi tika izlaists ierobežotā beta versijā priekšskatījums pirms diviem mēnešiem, nāk nedaudz vairāk nekā gadu pēc tam, kad World Labs slēpās ar 230 miljonu dolāru finansējumu, un izvirza jaunuzņēmumu priekšā konkurentiem, kas veido pasaules modeļus. Pasaules modeļi ir AI sistēmas, kas ģenerē iekšēju vides attēlojumu un var tikt izmantotas, lai prognozētu turpmākos rezultātus un plānotu darbības.

Jaunuzņēmumi, piemēram, Decart un Odyssey, ir izlaiduši bezmaksas demonstrācijas, un Google Genie joprojām ir ierobežotā izpētes priekšskatījumā. Marmors atšķiras no šiem — un pat no paša World Labs reāllaika modeļa, RTFM — jo tas rada noturīgu, lejupielādējamu 3D vidi, nevis ģenerē pasaules lidojuma laikā, kamēr jūs izpētāt. Uzņēmums norāda, ka tas rada mazāku pārveidošanu vai nekonsekvenci un ļauj lietotājiem eksportēt pasaules kā Gausa apzīmējumus, sietus vai videoklipus.

Marble ir arī pirmais šāda veida modelis, kas piedāvā mākslīgā intelekta rediģēšanas rīkus un hibrīdu 3D redaktoru, kas lietotājiem ļauj bloķēt telpiskās struktūras, pirms AI aizpilda vizuālās detaļas.

Attēlu kredīti:Pasaules laboratorijas

“Šī ir pavisam jauna modeļu kategorija, kas ģenerē 3D pasaules, un tas laika gaitā kļūs labāks. Tas ir kaut kas, ko mēs jau esam krietni uzlabojuši,” žurnālam TechCrunch stāstīja World Labs līdzdibinātājs Džastins Džonsons.

Pagājušā gada decembrī World Labs parādīja, kā tās agrīnie modeļi var radīt interaktīvas 3D ainas, pamatojoties uz vienu attēlu. Kaut arī nedaudz karikatūras ainas bija iespaidīgas, tās nebija pilnībā izpētāmas, jo kustības bija ierobežotas nelielā apgabalā un ik pa laikam tika pieļautas renderēšanas kļūdas.

Beta priekšskatījuma izmēģinājuma laikā es atklāju, ka Marble ģenerēja iespaidīgas pasaules, izmantojot tikai attēlu uzvednes — no spēlei līdzīgas vides līdz manas viesistabas fotoreālistiskām versijām. Ainas mainījās malās, lai gan šodienas palaišanas laikā tas acīmredzot ir uzlabots. Tomēr pasaule, ko es ģenerēju beta versijā, izmantojot vienu uzvedni, izskatījās labāk un vairāk atbilst manam nodomam nekā tagad.

Techcrunch pasākums

Sanfrancisko
|
2026. gada 13.–15. oktobris

Es vēl neesmu pārbaudījis rediģēšanas funkcijas, lai gan Džonsons saka, ka tie padara Marble praktisku īstermiņa spēļu, VFX un virtuālās realitātes (VR) projektiem.

“Viena no mūsu galvenajām Marble tēmām nākotnē ir radošā kontrole,” sacīja Džonsons. “Vienmēr ir jābūt ātram ceļam, lai kaut ko radītu, taču jums vajadzētu būt iespējai ienirt vēl dziļāk un iegūt lielu kontroli pār lietām, ko jūs ģenerējat. Jūs nevēlaties, lai iekārta vienkārši pārņemtu stūri un atrautu visu šo radošumu no jums.”

Marmora ievade izvades cauruļvadā.Attēlu kredīti:Pasaules laboratorijas

Marble radošā kontrole sākas ar ievades elastību. Beta versija pieņēma tikai atsevišķus attēlus, liekot modelim izgudrot neredzētas detaļas 360 grādu skatam. Pēc pilnīgas palaišanas lietotāji tagad var augšupielādēt vairākus attēlus vai īsus klipus, lai parādītu telpu no dažādiem leņķiem, un modelis ģenerē diezgan reālistiskus digitālos dvīņus.

Pēc tam mums ir Chisel — eksperimentāls 3D redaktors, kas ļauj lietotājiem bloķēt rupjus telpiskos izkārtojumus (domājiet par sienām, kastēm vai plaknēm) un pēc tam pievienot teksta uzvednes, lai vadītu vizuālo stilu. Marble ģenerē pasauli, atdalot struktūru no stila — līdzīgi kā HTML nodrošina vietnes struktūru un CSS piešķir krāsu. Atšķirībā no teksta rediģēšanas, Chisel ļauj tieši manipulēt ar objektiem.

Marmora kalts atdala struktūru no stila. Attēlu kredīti:Pasaules laboratorijas

“Es varu vienkārši ieiet tur un paķert 3D bloku, kas attēlo dīvānu, un pārvietot to kaut kur citur,” sacīja Džonsons.

Vēl viena jauna funkcija, kas sniedz lielāku rediģēšanas kontroli, ir iespēja paplašināt pasauli.

“Kad esat ģenerējis pasauli, varat to paplašināt līdz vienreiz,” sacīja Džonsons. “Kad jūs pārceļaties uz pasaules daļu, kas sāk sadalīties, jūs principā varat likt modelim paplašināties tur vai radīt vairāk pasaules jūsu pašreizējās atrašanās vietas tuvumā, un tad tas var pievienot sīkāku informāciju šajā reģionā.”

Lietotāji, kuri vēlas izveidot ārkārtīgi lielas telpas, var apvienot vairākas pasaules ar “komponista režīmu”. Džonsons man to demonstrēja ar divām pasaulēm, ko viņš jau bija uzbūvējis – no siera izgatavotu istabu ar vīnogu krēsliem un otru futūristisku sanāksmju telpu kosmosā.

Ceļš uz telpisko inteliģenci

Marmorā izveidota kosmosa kuģa vide ar teksta uzvedni. Ņemiet vērā, kā gaismas reālistiski atspoguļojas centrmezgla sienās.Attēlu kredīti:World Labs/TechCrunch

Marble ir pieejams četros abonēšanas līmeņos: bezmaksas (četras paaudzes no teksta, attēla vai panorāmas), standarta (20 $/mēnesī, 12 paaudzes plus vairāku attēlu/video ievade un uzlabota rediģēšana), Professional (35 $/mēnesī, 25 paaudzes ar ainas paplašināšanu un komerciālām tiesībām) un Max (95 $ mēnesī, visas funkcijas un 75 paaudzes).

Džonsons domā, ka sākotnējie Marble lietošanas gadījumi būs spēles, filmu vizuālie efekti un virtuālā realitāte.

Spēļu izstrādātājiem ir dalītas jūtas par tehnoloģiju. Nesens Spēļu izstrādātāju konferences aptauja atklāja, ka trešā daļa respondentu uzskata, ka ģeneratīvajam mākslīgajam intelektam ir negatīva ietekme uz spēļu nozari – par 12% vairāk nekā aptaujā tika norādīts gadu iepriekš. Intelektuālā īpašuma zādzības, enerģijas patēriņš un mākslīgā intelekta radītā satura kvalitātes pazemināšanās bija viena no galvenajām bažām. Un pagājušajā gadā a Vadu izmeklēšanā atklājās, ka spēļu studijas, piemēram, Activision Blizzard, izmanto mākslīgo intelektu, lai samazinātu stūrus un cīnītos ar nodilumu.

Spēļu jomā Džonsons redz, ka izstrādātāji izmanto Marble, lai ģenerētu fona vidi un apkārtējās telpas un pēc tam importētu šos līdzekļus spēļu dzinējos, piemēram, Unity vai Unreal Engine, lai pievienotu interaktīvus elementus, loģiku un kodu.

“Tas nav paredzēts, lai aizstātu visu esošo spēļu cauruļvadu, guess tikai sniegtu jums aktīvus, kurus varat ievietot šajā cauruļvadā,” viņš teica.

Veicot VFX darbu, Marble apiet nekonsekvenci un slikto kameras vadību, kas nomoka AI video ģeneratorus, norāda Džonsons. Tā 3D līdzekļi ļauj māksliniekiem iestudēt ainas un kontrolēt kameras kustības ar perfektu kadru precizitāti, viņš teica.

Lai gan Džonsons teica, ka World Labs šobrīd nekoncentrējas uz virtuālās realitātes (VR) lietojumprogrammām, viņš atzīmēja, ka nozare ir “izsalkusi pēc satura” un satraukti par palaišanu. Marble jau ir saderīgs ar Imaginative and prescient Professional un Quest 3 VR austiņām, un katru ģenerēto pasauli var skatīt VR šodien.

Marmoram var būt arī potenciāli robotikas izmantošanas gadījumi. Džonsons atzīmēja, ka atšķirībā no attēlu un video ģenerēšanas robotikai nav priekšrocības, ko sniedz liela apmācības datu krātuve. Taču ar tādiem ģeneratoriem kā Marble ir vieglāk simulēt treniņu vidi.

Saskaņā ar a nesenais manifests Fei-Fei Li, World Labs izpilddirektors un līdzdibinātājs, Marble ir pirmais solis ceļā uz “patiesi telpiski inteliģenta pasaules modeļa izveidi”.

Li uzskata, ka “nākamās paaudzes pasaules modeļi ļaus mašīnām sasniegt telpisko intelektu pilnīgi jaunā līmenī.” Ja lielie valodu modeļi var iemācīt mašīnām lasīt un rakstīt, Li cer, ka tādas sistēmas kā Marble var iemācīt tām redzēt un būvēt. Viņa saka, ka spēja izprast, kā lietas pastāv un mijiedarbojas trīsdimensiju telpās, galu galā var palīdzēt mašīnām gūt panākumus ārpus spēlēm un robotikas, un pat zinātnē un medicīnā.

“Mūsu sapņi par patiesi inteliģentām mašīnām nebūs pilnīgi bez telpiskās inteliģences,” rakstīja Li.

Vai jums ir sensitīvs padoms vai konfidenciāli dokumenti? Mēs ziņojam par AI nozares iekšējo darbību — no uzņēmumiem, kas veido tās nākotni, līdz cilvēkiem, kurus ietekmējuši viņu lēmumi. Sazinieties ar Rebeku Belanu plkst rebecca.bellan@techcrunch.com vai Rasels Brendoms, rakstot uz russell.brandom@techcrunch.com. Lai nodrošinātu drošu saziņu, varat sazināties ar viņiem, izmantojot signālu @rebeccabellan.491 un russelbrandom.49.

avots