Home Tehnoloģija Kā datu apstrādes problēma Lyft kļuva par pamatu iespējamajam

Kā datu apstrādes problēma Lyft kļuva par pamatu iespējamajam

6
0

Kad Iespējams Dibinātāji Sammy Sidhu un Jay Chia strādāja par programmatūras inženieriem Lyft autonomo transportlīdzekļu programmā, viņi bija liecinieki alus darīšanas datu infrastruktūras problēmai – un tādu, kas kļūs lielāka tikai ar AI pieaugumu.

Pašpiedziņas automašīnas rada tonnu nestrukturētu datu no 3D skenēšanas un fotoattēliem uz tekstu un audio. Lyft inženieriem nebija rīks, kas vienlaikus varēja saprast un apstrādāt visus dažādos datu veidus – un visus vienā vietā. Tas atstāja inženierus, lai garā procesā saliktu atvērtā koda rīkus ar uzticamības problēmām.

“Mums bija visi šie izcilie doktora grāda iegūšanai, izcili ļaudis visā nozarē, strādājot pie autonomiem transportlīdzekļiem, guess viņi tērē kā 80% laika, strādājot pie infrastruktūras, nevis veidojot savu galveno pielietojumu,” nesenā intervijā TechCrunch pastāstīja Sidhu, kurš ir iespējamais izpilddirektors. “Un lielākā daļa no šīm problēmām, ar kurām viņi saskārās, bija saistīta ar datu infrastruktūru.”

Sidhu un Chia palīdzēja izveidot iekšēju multimodālu datu apstrādes rīku Lyft. Kad Sidhu plānoja pieteikties uz citiem darbiem, viņš atklāja, ka intervētāji turpināja viņam jautāt par potenciāli veidot tādu pašu datu risinājumu saviem uzņēmumiem, un radās ideja, kas saistīta ar iespējamo.

Iespējams, ka izveidots python-vietējs atvērtā pirmkoda datu apstrādes dzinējs, kas pazīstams kā DAFT, kas ir paredzēts ātri darbam dažādos modālos, sākot no teksta līdz audio un video, un daudz ko citu. Sidhu sacīja, ka mērķis ir padarīt DAFT kā pārveidošanu nestrukturētā datu infrastruktūrā, jo SQL iepriekš bija tabulas datu kopas.

Uzņēmums tika dibināts 2022. gada sākumā, gandrīz gadu pirms Chatgpt atbrīvošanas, un pirms daudzi cilvēki zināja par šo datu infrastruktūras atšķirību. Viņi 2022. gadā uzsāka DAFT pirmo atvērtā pirmkoda versiju un trešajā ceturksnī gatavojas palaist uzņēmuma produktu.

“CHATGPT eksplozija, ko mēs redzējām, ir tikai daudzi citi ļaudis, kuri toreiz veido AI lietojumprogrammas ar dažāda veida modalitātēm,” sacīja Sidhu. “Tad visi sāka izmantot tādas lietas kā tādas lietas kā attēlus un dokumentus un video. Un tas ir tāds, kur mēs redzējām, lietošana vienkārši dramatiski palielinājās.”

Kamēr sākotnējā ideja, kas saistīta ar Daft ēku, izrietēja no autonomās transportlīdzekļu telpas, ir daudz citu nozaru, kas apstrādā multimodālus datus, ieskaitot robotiku, mazumtirdzniecības tehnoloģijas un veselības aprūpi. Uzņēmums tagad kā klienti uzskata Amazon, Cloudkitchens un kopā AI.

Iespējams, ka nesen astoņu mēnešu laikā tika piesaistītas divas finansējuma kārtas. Pirmais bija CRV vadībā 7,5 miljonu dolāru sēklu kārta. Pavisam nesen uzņēmums ieguva 20 miljonu dolāru sērijas A kārtu, kuru vadīja Felicis, piedaloties Microsoft M12 un Citi.

Šī jaunākā kārta tiks novirzīta uz iespējamo atvērtā pirmkoda piedāvājuma veidošanu, kā arī komerciāla produkta izveidi, kas klientiem ļaus izveidot AI lietojumprogrammas no šiem apstrādātajiem datiem.

Astasia Myers, Felicis ģenerāl partnere, sacīja TechCrunch, ka viņa atrada iespējamu, izmantojot tirgus kartēšanas vingrinājumu, kas ietvēra datu infrastruktūras meklēšanu, kas spētu atbalstīt pieaugošo multimodālo AI modeļu skaitu.

Myers sacīja, ka iespējamie izceļas par to, ka ir pirmais virzītājspēks telpā – kurš, iespējams, būs pārpildītāks – un, pamatojoties uz faktu, ka dibinātāji bija izskatījuši šo datu apstrādes problēmu no pirmavotiem. Viņa piebilda, ka iespējamais ir arī arvien pieaugoša problēma.

Paredzams, ka multimodālā AI nozare augs pie a 35% saliktā gada pieauguma temps Laikā no 2023. līdz 2028. gadam, saskaņā ar vadības konsultāciju firmas tirgiem unmarkets.

“Gada datu ģenerēšana pēdējo 20 gadu laikā ir palielinājusies 1000x un 90% pasaules datu tika iegūti pēdējos divos gados, un saskaņā ar IDC lielais vairums datu nav strukturēti,” sacīja Myers. “Daft iekļaujas šajā milzīgajā makro tendencē, ka ģeneratīvais AI tiek veidots ap tekstu, attēlu, video un balsi. Jums ir nepieciešams multimodāli vietējais datu apstrādes dzinējs.”

avots

LEAVE A REPLY

Please enter your comment!
Please enter your name here