Home Tehnoloģija DeepSeek: Viss, kas jums jāzina par AI Chatbot lietotni

DeepSeek: Viss, kas jums jāzina par AI Chatbot lietotni

31
0

DeepSeek ir kļuvis vīrusu vīruss.

Ķīniešu AI Lab Deepseek šonedēļ ielauzās vispārizglītojošajā apziņā pēc tam, kad tās tērzēšanas lietotne pieauga uz Apple App Retailer diagrammu augšdaļu (un arī Google Play). DeepSeek AI modeļi, kas tika apmācīti, izmantojot aprēķinus efektīvus paņēmienus, ir vadījuši Volstrītas analītiķus un tehnologus, lai apšaubītu, vai ASV var saglabāt savu vadību AI sacīkstēs un vai pieprasījums pēc AI mikroshēmām notiks.

Wager no kurienes radās DeepSeek, un kā tā tik ātri pieauga uz starptautisko slavu?

DeepSeek tirgotāja pirmsākumi

DeepSeek atbalsta Excessive Flyer Capital Administration-Ķīnas kvantitatīvā riska ieguldījumu fonds, kas izmanto AI, lai informētu par saviem tirdzniecības lēmumiem.

AI entuziasts Liangs Venfengs 2015. gadā līdzdibināja augsto lidotāju. Wenfeng, kurš, kā ziņots, sāka nodarboties ar tirdzniecību, kamēr kāds college students Zhejiang universitātē uzsāka augstas lidojuma kapitāla pārvaldību kā riska ieguldījumu fonds 2019. gadā, koncentrējoties uz AI algoritmu attīstību un izvietošanu.

2023. gadā Excessive-Flyer sāka DeepSeek kā laboratoriju, kas bija paredzēta AI rīku izpētei, kas ir atsevišķi no tā finanšu biznesa. Tā kā ar lielu lidojumu kā vienu no tā investoriem laboratorija sākās savā uzņēmumā, ko sauc arī par DeepSeek.

Kopš pirmās dienas DeepSeek modeļa apmācībai izveidoja savas datu centra kopas. Wager tāpat kā citi AI uzņēmumi Ķīnā, arī DeepSeek ir ietekmējuši ASV eksporta aizliegumi aparatūrā. Lai apmācītu vienu no jaunākajiem modeļiem, uzņēmums bija spiests izmantot NVIDIA H800 mikroshēmas, kas ir mazāk jaudīga mikroshēmas versija H100, kas pieejama ASV uzņēmumiem.

Tiek teikts, ka DeepSeek tehniskā komanda ir Skew Younger. Uzņēmums Tiek ziņots, ka agresīvi pieņem darbā doktora AI pētnieki no augstākajām Ķīnas universitātēm. DeepSeek arī pieņem darbā cilvēkus bez datorzinātnes fona Lai palīdzētu tās tehnoloģijai labāk izprast plašu priekšmetu klāstu, Ņujorkas laikos.

DeepSeek spēcīgie modeļi

DeepSeek atklāja savu pirmo modeļu komplektu-DeepSeek Codeer, Deepseek LLM un DeepSeek tērzēšanu-2023. gada novembrī. Wager tikai pagājušā gada pavasarī, kad starta izlaida savu nākamā paaudzes DeepSeek-V2 modeļu ģimeni, AI nozare sāka pamanīt.

DeepSEEK-V2, vispārējas nozīmes teksta un attēlu analīzes sistēma, labi darbojās dažādos AI etalonos-un tolaik bija daudz lētāk nekā salīdzināmi modeļi. Tas piespieda DeepSeek vietējo konkurenci, tostarp Bytedance un Alibaba, samazināt dažu viņu modeļu lietošanas cenas un padarīt citus pilnīgi brīvus.

DeepSeek-V3, kas tika palaists 2024. gada decembrī, tikai papildināja DeepSeeka slavu.

Saskaņā ar DeepSeek iekšējo etalona testēšanu, DeepSeek V3 pārspēj gan lejupielādējamus, atklāti pieejamus modeļus, piemēram, Meta’s Llama, gan “slēgtus” modeļus, kuriem var piekļūt tikai caur API, piemēram, Openai GPT-4O.

Tikpat iespaidīgs ir DeepSeek R1 “argumentācijas” modelis. Janvārī izlaists Deepseek apgalvo, ka R1 veic, kā arī Openai O1 modeli galvenajos etalonos.

Tā kā R1 ir argumentācijas modelis, tas faktiski pārbauda sevi, kas palīdz tai izvairīties no dažām nepilnībām, kas parasti palielina modeļus. Gaidīšanas modeļi prasa nedaudz ilgāku laiku-parasti sekundes līdz minūtes ilgāk-, lai nonāktu pie risinājumiem, salīdzinot ar tipisku modeli, kas neatbilst. Augstums ir tas, ka tie mēdz būt uzticamāki tādās jomās kā fizika, zinātne un matemātika.

Tomēr ir mīnuss R1, DeepSeek V3 un citiem modeļiem Deepseek. Būdami ķīniešu attīstīti AI, viņi ir pakļauti etalonuzdevums pēc Ķīnas interneta regulatora, lai nodrošinātu, ka tās atbildes “iemieso sociālisma pamatvērtības”. Piemēram, DeepSeek tērzēšanas rādītājā R1 neatbildēs uz jautājumiem par Tiananmen Sq. vai Taiwan autonomiju.

Martā Deepseek pārspēja 16,5 miljonus apmeklējumu. Vai[F]Vai arī marts, Deepseek ir otrajā vietā, neskatoties uz to, ka satiksme samazinās par 25% no tā, kur tā bija februārī, pamatojoties uz ikdienas apmeklējumiem, ”TechCrunch sacīja Deivids Karrs, līdzīgi Internet redaktors. Tas joprojām ir palīgs, salīdzinot ar Chatgpt, kas martā palielinājās par 500 miljoniem iknedēļas aktīviem lietotājiem.

Maijā Deepseek izlaida atjauninātu sava R1 argumentācijas AI modeļa versiju izstrādātāju platformā, kas apskauj seju.

Graujoša pieeja

Ja DeepSeek ir biznesa modelis, nav skaidrs, kāds ir šis modelis. Uzņēmums cenas savus produktus un pakalpojumus krietni zem tirgus vērtības – un dod citus bez maksas. Tas arī neņem ieguldītāju naudu, neskatoties uz tonnu RK procentu.

Veids, kā to stāsta DeepSeek, efektivitātes izrāvieni ļāva tai saglabāt ārkārtas izmaksu konkurētspēju. Daži eksperti strīds Skaitļi, ko uzņēmums ir piegādājis, tomēr.

Jebkurā gadījumā izstrādātāji ir devušies uz DeepSeek modeļiem, kas nav atvērtā koda, jo frāze parasti ir saprotama, wager ir pieejamas saskaņā ar pieļaujamām licencēm, kas ļauj komerciālai lietošanai. Saskaņā ar Klemu Delangue, Hugging Face izpilddirektoru, kas ir viena no platformām, kas mitina DeepSeek modeļus, Izstrādātāji, kas saistīti ar sejas apskaušanu, ir izveidojuši vairāk nekā 500 “atvasinātu” R1 modeļu kas ir palielinājuši 2,5 miljonus lejupielāžu kopā.

DeepSeek panākumi pret lielākiem un vairāk iedibinātiem konkurentiem ir bijuši Aprakstīts kā “UPENTING AI” un “pārlieku hyped”. Uzņēmuma panākumi vismaz daļēji bija atbildīgi par NVIDIA akciju cenas samazināšanos par 18% janvārī un par Sabiedrības atbildes izraisīšana no Openai izpilddirektora Sam Altman. Martā ASV Tirdzniecības departamenta biroji sacīja darbiniekiem DeepSeek tiks aizliegts viņu valdības ierīcēspēc Reuters teiktā.

Microsoft paziņoja, ka DeepSeek ir pieejams savā Azure AI Foundry Service – Microsoft platformā, kas apvieno AI pakalpojumus uzņēmumiem ar vienu reklāmkarogu. Jautāts par Deepseek ietekmi uz Meta AI izdevumiem tā pirmā ceturkšņa ieņēmumu zvana laikā, izpilddirektors Marks Zuckerbergs sacīja, ka izdevumi AI infrastruktūrai joprojām būs “stratēģiska priekšrocība” meta. Martā Openai sauca DeepSeeku par “valsts subsidētu” un “valsts kontrolētu” un iesaka ASV valdībai apsvērt iespēju aizliegt modeļus no DeepSeek.

NVIDIA ceturtā ceturkšņa ieņēmumu zvana laikā izpilddirektors Jensens Huangs uzsvēra Deepseeka “izcilo inovāciju”, sakot, ka tas un citi “argumentācijas” modeļi ir lieliski piemēroti NVIDIA, jo viņiem ir nepieciešams tik daudz vairāk aprēķināt.

Tajā pašā laikā daži uzņēmumi aizliedz DeepSeek, un arī tas ir veseli valstis un valdības, ieskaitot Dienvidkoreju. Arī Ņujorkas štats aizliedza DeepSeek izmantot valdības ierīcēsApvidū

Maijā Microsoft priekšsēdētāja vietnieks un prezidents Breds Smits Senāta tiesas sēdē sacīja, ka Microsoft darbiniekiem nav atļauts izmantot DeepSeek datu drošības un propagandas problēmu dēļ.

Runājot par to, kāda varētu būt Deepseek nākotne, tas nav skaidrs. Uzlaboti modeļi ir doti. Wager šķiet, ka ASV valdība ir Arvien piesardzība par to, ko tā uztver kā kaitīgu ārvalstu ietekmiApvidū Martā Wall Road Journal to ziņoja ASV, visticamāk, aizliegs DeepSeek par valdības ierīcēmApvidū

Šis stāsts sākotnēji tika publicēts 2025. gada 28. janvārī, un tas tiks regulāri atjaunināts.

avots