Home Jaunumi DeepSeek mājienus jaunāko modeli atbalstīs Ķīnas “Nākamās paaudzes” mājās audzētās AI mikroshēmas

DeepSeek mājienus jaunāko modeli atbalstīs Ķīnas “Nākamās paaudzes” mājās audzētās AI mikroshēmas

12
0

Entonijs Kvans | Getty Photographs Information | Getty Photographs

Ķīniešu mākslīgā intelekta starta starta DeepSeek ir norādījis, ka Ķīnai drīz būs pašmāju “nākamās paaudzes” mikroshēmas, lai atbalstītu savus AI modeļus, vienlaikus paziņojot par atjauninājumu vienam no lielajiem valodas modeļiem.

Komentārā ar ziņu par tā oficiālais WeChat kontsDeepSeek sacīja, ka jaunizlaistā modeļa v3.1 modeļa “UE8M0 FP8” precizitātes formāts ir pielāgots nākamās paaudzes iekšzemes mikroshēmām, kuras drīz tiks palaistas.

Fp8 jeb 8 bitu peldošais punkts ir a Datu apstrādes formāts Tas var palielināt skaitļošanas efektivitāti apmācībai un lielo dziļo mācību modeļu secinājumiem.

DeepSeek pieminēšana par Ķīnas nākamās paaudzes mikroshēmām var signalizēt par plāniem ciešāk sadarboties ar Ķīnas jauno AI mikroshēmu ekosistēmu, ņemot vērā Vašingtonas uzlabotos pusvadītāju eksporta ierobežojumus un Pekinas centienus pēc mikroshēmas pašpietiekamības.

Komentāri rodas apmēram divas nedēļas pēc tam, kad Pekina, kā ziņots, mudināja ķīniešu AI izstrādātājus izmantot vietējās alternatīvas NVIDIA grafikas apstrādes vienībās, kuras izmanto AI apmācībā. Kamēr analītiķi saka, ka Ķīnas vietējie AI mikroshēmas veidotāji atpaliek no Nvidia tehnoloģiskajā attīstībā un mērogā, tādi spēlētāji kā Huawei ir guvuši panākumus.

Savā ceturtdienas amatā DeepSeek neatklāja mikroshēmas, kuras tās izmantoja, lai apmācītu v3.1, vai kādas vietējās mikroshēmas varētu būt saderīgas ar UE8M0 FP8.

DeepSeek satricināja tehnoloģiju pasauli šī gada sākumā pēc tam, kad tā izlaida savu R1 argumentācijas modeli, kas parādīja iespējas, kas ir salīdzināmas ar rietumu konkurentiem, piemēram, Openai, neskatoties uz to, ka ASV eksporta kontrole to ierobežo, izmantojot NVIDIA vismodernākos AI apmācības mikroshēmas.

Pirms tam decembrī uzņēmums izlaida savu V3 modeli, kas, pēc tās teiktā, bija apmācīts apmēram 2000 NVIDIA mazāk progresīvajām mikroshēmām.

Pēc DeepSeek modeļa izrāvieniem aprīlī ASV vēl vairāk pastiprināja eksporta ierobežojumus, efektīvi aizliedzot NVIDIA H20 mikroshēmas, kas bija īpaši izstrādātas, lai izpildītu iepriekšējos eksporta ierobežojumus Ķīnai.

Pagājušajā mēnesī Trumpa administrācijas amatpersonas paziņoja, ka plāno ļaut NVIDIA atsākt mikroshēmu nosūtīšanu uz Ķīnu. Tomēr H20 tagad tiek veikti ar rūpīgu pārbaudi Ķīnā, un regulatori, kā ziņots, prasa uzņēmumiem pirkt mikroshēmas, līdz tiek pabeigts nacionālās drošības pārskats.

Čipu analītiķi ir teikuši CNBC, ka tādi uzņēmumi kā Huawei, kuri ir mēģinājuši izveidot alternatīvu AI mikroshēmu ekosistēmu Ķīnā, varētu gūt labumu no NVIDIA H20 trūkuma tirgū.

Deepseek ceturtdien sacīja, ka tā V3.1 ir nācis ar “lielām izmaiņām”, ieskaitot ātrāku reakcijas laiku, un hibrīda argumentācijas arhitektūru, kas ļauj modelim atbalstīt gan argumentāciju, gan neatbilstošu režīmu. Argumentācijas modeļi var veikt sarežģītākus uzdevumus, izmantojot soli pa solim loģisko domāšanas procesu.

Sākot ar 6. septembri, uzņēmums arī koriģēs modeļa API izmantošanas cenu, kas ļauj citu lietotņu un tīmekļa izstrādājumu izstrādātājiem integrēt DeepSeek savās platformās.

avots