Home Tehnoloģija Groq tikai padarīja apskāvienu Face Means ātrāk – un tas nāk AWS...

Groq tikai padarīja apskāvienu Face Means ātrāk – un tas nāk AWS un Google

5
0

Pievienojieties pasākumam, kuru uzņēmuma vadītāji uzticas gandrīz divas desmitgades. VB Remodel apvieno cilvēkus, kas veido reālu uzņēmumu AI stratēģiju. Uzziniet vairāk


Grostamākslīgā intelekta secinājumu startēšana, veido agresīvu spēli, lai izaicinātu, piemēram, mākoņu pakalpojumu sniedzēji Amazon tīmekļa pakalpojumi un Google Ar diviem galvenajiem paziņojumiem, kas varētu pārveidot, kā izstrādātāji piekļūst augstas veiktspējas AI modeļiem.

Uzņēmums pirmdien paziņoja, ka tas tagad atbalsta Alibaba QWEN3 32B valodas modelis Ar pilnu 131 000 taktu konteksta logu-tehniskās iespējas, kuras tā apgalvo, ka neviens cits ātrs secinājumu sniedzējs nevar sakrist. Vienlaikus Groq kļuva par oficiālu secinājumu sniedzēju Apskāviena sejas platformapotenciāli pakļaujot savu tehnoloģiju miljoniem izstrādātāju visā pasaulē.

Pārcelšanās ir Groq drosmīgākais mēģinājums, lai izveidotu tirgus daļu strauji paplašinātajā AI secinājumu tirgū, kur uzņēmumiem patīk AWS pamatiežaVerdzība Google Vertex AIun Microsoft Azure ir dominējuši, piedāvājot ērtu piekļuvi vadošajiem valodu modeļiem.

“Apskāviena sejas integrācija paplašina Groq ekosistēmu, kas nodrošina izstrādātāju izvēli un vēl vairāk samazina šķēršļus ienākšanai, pieņemot Groq ātru un efektīvu AI secinājumu,” VentureBeat pastāstīja Groq pārstāvis. “Groq ir vienīgais secinājumu sniedzējs, kas nodrošina pilnu 131K konteksta logu, ļaujot izstrādātājiem izveidot lietojumprogrammas mērogā.”

Kā apgalvo, ka Groq 131k konteksta logs ir pretrunā ar AI secinājumu konkurentiem

Groq apgalvojums par konteksta logiem – teksta daudzumu, ko var apstrādāt AI modelis, – streiki ar galveno ierobežojumu, kas ir nomocījis praktiskas AI lietojumprogrammas. Lielākā daļa secinājumu pakalpojumu sniedzēju cenšas saglabāt ātrumu un rentabilitāti, apstrādājot lielus konteksta logus, kas ir svarīgi tādiem uzdevumiem kā visu dokumentu analizēšana vai ilgas sarunu uzturēšana.

Neatkarīga etalonuzdevumu firma Mākslīgā analīze Izmērīts Groq QWEN3 32B izvietošana, kas darbojas ar aptuveni 535 žetoniem sekundē-ātrums, kas ļautu reāllaikā apstrādāt garus dokumentus vai sarežģītus spriešanas uzdevumus. Uzņēmums cenas nosaka pakalpojumu par USD 0,29 par miljonu ievades žetonu un USD 0,59 par miljonu izlaides žetonu – likmēm, kurām ir samazināta daudzi izveidoti pakalpojumu sniedzēji.

Groq un Alibaba Cloud ir vienīgie pakalpojumu sniedzēji, kas atbalsta QWEN3 32B pilnu 131 000-takenakta konteksta logu, liecina neatkarīgi mākslīgās analīzes etaloni. Lielākā daļa konkurentu piedāvā ievērojami mazākas robežas. (Kredīts: groq)

“Groq piedāvā pilnībā integrētu kaudzi, nodrošinot secinājumu aprēķināšanu, kas izveidots mērogam, kas nozīmē, ka mēs spējam turpināt uzlabot secinājumu izmaksas, vienlaikus nodrošinot arī veiktspēju, kas izstrādātājiem jāveido reālus AI risinājumus,” pārstāvis paskaidroja, kad viņam jautāja par masīva konteksta logu atbalstīšanas ekonomisko dzīvotspēju.

Tehniskā priekšrocība izriet no Groq pasūtījuma Valodas apstrādes vienības (LPU) arhitektūraīpaši paredzēts AI secinājumiem, nevis vispārējas nozīmes grafikas apstrādes vienībām (GPU), uz kurām lielākā daļa konkurentu paļaujas. Šī specializētā aparatūras pieeja ļauj Groq efektīvāk rīkoties ar atmiņu intensīvām darbībām, piemēram, lieliem konteksta logiem.

Kāpēc Groq apskāviena sejas integrācija varētu atbloķēt miljoniem jaunu AI izstrādātāju

Līdz Integrācija ar sejas apskaušanu atspoguļo varbūt nozīmīgāku ilgtermiņa stratēģisko gājienu. Sejas apskaušana ir kļuvusi par de facto platformu atvērtā koda AI attīstībai, mitinot simtiem tūkstošu modeļu un katru mēnesi apkalpojot miljoniem izstrādātāju. Kļūstot par oficiālu secinājumu nodrošinātāju, Groq iegūst piekļuvi šai plašajai izstrādātāja ekosistēmai ar racionalizētu norēķinu un vienotu piekļuvi.

Izstrādātāji tagad var izvēlēties groq kā pakalpojumu sniedzēju tieši Apskaužot sejas rotaļu laukumu vai APIar lietošanu rēķins par viņu apskaujošajiem sejas kontiem. Integrācija atbalsta virkni populāru modeļu, ieskaitot meta’s Lama sērijaGoogle Gemma modeļiun nesen pievienotais QWEN3 32BApvidū

“Šī sadarbība starp sejas un groq apskaušanu ir nozīmīgs solis uz priekšu, padarot augstas veiktspējas AI secinājumus pieejamākus un efektīvākus,” teikts kopīgā paziņojumā.

Partnerība varētu dramatiski palielināt Groq lietotāju bāzi un darījumu apjomu, taču tā arī rada jautājumus par uzņēmuma spēju saglabāt veiktspēju mērogā.

Vai Groq infrastruktūra var konkurēt ar AWS Bedrock un Google Vertex AI mērogā

Piespiežot par infrastruktūras paplašināšanas plāniem, lai apstrādātu potenciāli nozīmīgu jaunu satiksmi Apskaužot sejuGroq pārstāvis atklāja uzņēmuma pašreizējo globālo nospiedumu: “Pašlaik Groq globālajā infrastruktūrā ir datu centra atrašanās vietas visā ASV, Kanādā un Tuvajos Austrumos, kas kalpo vairāk nekā 20 m žetoniem sekundē.”

Uzņēmuma plāni turpināja starptautisko paplašināšanu, lai gan īpaša informācija netika sniegta. Šie globālā mērogošanas centieni būs izšķiroši, jo Groq saskaras ar pieaugošu labi finansētu konkurentu spiedienu ar dziļākiem infrastruktūras resursiem.

Amazones Pamatiežu servisspiemēram, piesaistīt AWS masīvo globālo mākoņu infrastruktūru, savukārt Google Virsotne AI ieguvumi no meklēšanas giganta pasaules datu centra tīkla. Microsoft Azure Openai Service ir līdzīgi dziļa infrastruktūras pamatne.

Tomēr Groq pārstāvis pauda pārliecību par uzņēmuma diferencēto pieeju: “Kā nozare mēs tikai sākam redzēt reālā pieprasījuma pēc secinājumiem aprēķināšanas sākumu. Pat ja Groq šogad vēl divreiz izvietotu plānoto infrastruktūras summu, šodien joprojām nebūtu pietiekami daudz spēju apmierināt pieprasījumu.”

Kā agresīva AI secinājumu noteikšana varētu ietekmēt Groq biznesa modeli

AI secinājumu tirgum ir raksturīga agresīva cenu noteikšana, un skuvekļa plānas, jo pakalpojumu sniedzēji sacenšas par tirgus daļu. Groq konkurētspējīgās cenas rada jautājumus par ilgtermiņa rentabilitāti, jo īpaši ņemot vērā specializētās aparatūras izstrādes un izvietošanas kapitālu intensīvu raksturu.

“Tā kā mēs redzam vairāk un tirgū nonāk jauni AI risinājumi un tiek pieņemti, secinājumu pieprasījums turpinās pieaugt ar eksponenciālu likmi,” pārstāvis sacīja, kad jautāja par ceļu uz rentabilitāti. “Mūsu galvenais mērķis ir mērogs, lai apmierinātu šo pieprasījumu, piesaistot mūsu infrastruktūru, lai palielinātu pēc iespējas zemāku secinājumu aprēķināšanas izmaksas un nodrošinātu turpmāko AI ekonomiku.”

Šī stratēģija – derības par milzīgu apjoma pieaugumu, lai sasniegtu rentabilitāti, neskatoties uz zemām robežām – spoguļo pieejas, kuras izvēlas citi infrastruktūras nodrošinātāji, lai gan panākumi nebūt nav garantēti.

Ko uzņēmuma AI pieņemšana nozīmē 154 miljardu dolāru secinājumu tirgum

Paziņojumi nāk kā AI secinājumu tirgus pieredzē sprādzienbīstamu izaugsmi. Pētniecības firma Grand View Analysis lēš, ka globālais AI secinājumu mikroshēmu tirgus līdz 2030. gadam sasniegs 154,9 miljardus USD, ko veicina AI lietojumprogrammu palielināšana dažādās nozarēs.

Uzņēmējdarbības lēmumu pieņēmējiem Groq gājieni atspoguļo gan iespējas, gan risku. Uzņēmuma darbības prasības, ja tās tiek apstiprinātas mērogā, varētu ievērojami samazināt AI smago lietojumprogrammu izmaksas. Tomēr paļaušanās uz mazāku pakalpojumu sniedzēju ievieš arī iespējamo piegādes ķēdi un nepārtrauktības riskus, salīdzinot ar noteiktiem mākoņu milžiem.

Tehniskā spēja rīkoties ar pilnu konteksta logiem varētu izrādīties īpaši vērtīga uzņēmuma lietojumprogrammām, kas saistītas ar dokumentu analīzi, juridiskiem pētījumiem vai sarežģītiem spriešanas uzdevumiem, ja konteksta uzturēšana ilgstošā mijiedarbībā ir būtiska.

Groq dubultā paziņojums ir aprēķināts azartspēle, kas specializēta aparatūra un agresīva cenu noteikšana var pārvarēt tehnoloģiju gigantu infrastruktūras priekšrocības. Tas, vai šī stratēģija izdodas, iespējams, būs atkarīga no uzņēmuma spējas saglabāt veiktspējas priekšrocības, vienlaikus mērogojot visā pasaulē – izaicinājums, kas ir izrādījies grūti daudziem infrastruktūras jaunuzņēmumiem.

Pagaidām izstrādātāji iegūst vēl vienu augstas veiktspējas iespēju aizvien konkurētspējīgākajā tirgū, savukārt uzņēmumi vēro, lai redzētu, vai Groq tehniskie solījumi pārvēršas uzticamā, ražošanas līmeņa pakalpojumā mērogā.


avots

LEAVE A REPLY

Please enter your comment!
Please enter your name here