Vai vēlaties gudrāku ieskatu iesūtnē? Reģistrējieties mūsu iknedēļas biļeteniem, lai iegūtu tikai to, kas ir svarīgi uzņēmuma AI, datu un drošības vadītājiem. Abonēt tūlīt
Arcee.aistartēšana, kas vērsta uz mazu AI modeļu izstrādi komerciālai un uzņēmuma izmantošanai, ir atvērties savs AFM-4,5B modelis ierobežotai bezmaksas lietošanai maziem uzņēmumiem-ievietošana Svari uz sejas apskaušanu un atļaujot uzņēmumus, kas gada ieņēmumus padara mazāk nekā 1,75 miljonus USD Pielāgota “Acree modeļa licence.Vai
Paredzēts reālās pasaules uzņēmuma izmantošanai, 4,5 miljardu parametru modelis-daudz mazāks nekā desmitiem miljardu līdz triljoniem vadošo robežu modeļu-apvieno izmaksu efektivitāti, regulatīvo atbilstību un spēcīgu sniegumu kompaktā pēdas nospiedumā.
AFM-4.5B bija Viena no divām daļām izlaiduma, ko pagājušajā mēnesī veica Acreeun tas jau ir “norādīts noregulēts” vai “instrukcijas” modelis, kas ir paredzēts tērzēšanai, iegūšanai un radošai rakstīšanai un kuru var nekavējoties izvietot šiem lietošanas gadījumiem uzņēmumos. Tajā laikā, kas netika noregulēts, tika izlaists arī vēl viens bāzes modelis, tikai iepriekš apmācīts, ļaujot klientiem lielāku pielāgojamību. Tomēr abi bija pieejami tikai ar komerciālu licencēšanas noteikumiem – līdz šim.
Acree galvenais tehnoloģiju virsnieks (CTO) Lucas Atkins arī atzīmēts a Ievietojiet uz x ka vairāk “Pa ceļam ir arī speciāli spriešanas un instrumentu izmantošanas modeļi,” arī.
AI trieciena sērija atgriežas Sanfrancisko – 5. augusts
Nākamais AI posms ir šeit – vai esat gatavs? Pievienojieties līderiem no Block, GSK un SAP, lai apskatītu, kā autonomi aģenti pārveido uzņēmumu darbplūsmas-no reālā laika lēmumu pieņemšanas līdz automatizācijai galīgai līdz galam.
Nostipriniet savu vietu tūlīt – telpa ir ierobežota:
“AFM-4.5B veidošana ir bijusi milzīga komandas cente, un mēs esam ļoti pateicīgi visiem, kas mūs atbalstīja, mēs nevaram gaidīt, lai redzētu, ko jūs ar to veidojat,” viņš rakstīja citā amatā. “Mēs tikai sākam darbu. Ja jums ir atsauksmes vai idejas, lūdzu, nevilcinieties ar kādu laiku uzrunāt.”
Modelis tagad ir pieejams izvietošanai dažādās vidēs – no mākoņa līdz viedtālruņiem līdz aparatūras malai.
Tas ir paredzēts arī Acree pieaugošajam uzņēmumu klientu un viņu vajadzību un vēlmju sarakstam – īpaši modelim, kas apmācīts, nepārkāpjot intelektuālo īpašumu.
Kā Acree savā sākotnējā AFM-4.5B paziņojuma ziņojumā rakstīja pagājušajā mēnesī: “Tika pieliktas milzīgas pūles, lai izslēgtu autortiesības aizsargātas grāmatas un materiālus ar neskaidru licencēšanu.”
Acree atzīmē, ka tā darbojās ar trešo personu datu kuratoru firmu Datoloģija Lai izmantotu tādas metodes kā avota sajaukšana, filtrēšana, kas balstīta uz iegulšanu, un kvalitātes kontroli-visu mērķis ir samazināt halucinācijas un IP riskus.
Koncentrējas uz uzņēmuma klientu vajadzībām
AFM-4.5B ir Arcee.ai reakcija uz to, ko tā uzskata par galvenajiem sāpju punktiem, uzņēmumā pieņemot ģeneratīvo AI: augstas izmaksas, ierobežotas pielāgojamības un normatīvās problēmas saistībā ar patentētiem lielo valodu modeļiem (LLM).
Pēdējā gada laikā ARCEE komanda rīkoja diskusijas ar vairāk nekā 150 organizācijām, sākot no jaunizveidotiem uzņēmumiem līdz Fortune 100 uzņēmumiem, lai izprastu esošo LLM ierobežojumus un definētu savus modeļa mērķus.
Pēc uzņēmuma teiktā, daudzi uzņēmumi atrada galvenos LLM-piemēram, Openai, antropic vai DeepSeek-pārāk dārgu un grūti pielāgojamu nozarei raksturīgām vajadzībām. Tikmēr, lai arī tādi mazāki atvērtā svara modeļi kā Lama, Mistral un Qwen piedāvāja lielāku elastību, viņi ieviesa bažas par licencēšanu, IP izcelsmi un ģeopolitisko risku.
AFM-4.5B tika izstrādāts kā alternatīva “bez tirdzniecības”: pielāgojama, atbilstoša un rentabla, nezaudējot modeļa kvalitāti vai lietojamību.
AFM-4.5B ir izstrādāts, ņemot vērā izvietošanas elastību. Tas var darboties mākonī, uz vietas, hibrīda vai pat malu vidē-pateicoties tā efektivitātei un savietojamībai ar atvērtiem ietvariem, piemēram, sejas transformatoru, lama.cpp un (gaidāmā izlaišanas) vllm apskaušanu.
Modelis atbalsta kvantētus formātus, ļaujot tam darboties ar zemāku RAM GPU vai pat CPU, padarot to praktisku lietojumprogrammām ar ierobežotiem resursiem.
Uzņēmuma redze nodrošina atbalstu
Arcee.ai plašākā stratēģija koncentrējas uz domēnu pieņemamu, mazu valodu modeļu (SLM) veidošanu, kas var darboties Daudzi lietošanas gadījumi tajā pašā organizācijā.
Kā izpilddirektors Marks Makquade paskaidroja VentureBeat intervijā pagājušajā gadā: “Jums nav jāiet tik lieli biznesa lietošanas gadījumiem.” Uzņēmums uzsver ātru iterāciju un modeļa pielāgošanu kā tā piedāvājuma pamatā.
Šis redzējums ieguva investoru atbalstu ar 24 miljonu dolāru sērijas A spherical 2024. gadā.
Iekšpusē AFM-4.5B arhitektūras un apmācības procesā
AFM-4.5B modelī tiek izmantota tikai dekodētāja transformatora arhitektūra ar vairākām optimizācijām veiktspējas un izvietošanas elastībai.
Tajā iekļauta sagrupēta vaicājuma uzmanība ātrākam secinājumam un relu² aktivācijai Sviglu vietā, lai atbalstītu spartifikāciju, nepazemojot precizitāti.
Apmācība sekoja trīsfāzu pieejai:
- Pirmsmainība uz 6,5 triljoniem žetonu vispārējo datu
- Vidusjūras uz 1,5 triljonu žetonu, uzsverot matemātiku un kodu
- Instrukcijas noregulēšana, izmantojot augstas kvalitātes instrukcijas sekojošās datu kopas un pastiprināšanas mācīšanos ar pārbaudāmu un uz preferencēm balstītu atgriezenisko saiti
Lai izpildītu stingru atbilstību un IP standartus, modelis tika apmācīts uz gandrīz 7 triljoniem žetonu datu, kas tika veidota tīrībai un licencēšanas drošībai.
Konkurences modelis, wager ne vadītājs
Neskatoties uz mazāku izmēru, AFM-4,5B darbojas konkurētspējīgi plašā etalonu diapazonā. Instrukcijas noregulētā versija vidēji vērtē 50,13 vērtēšanas apartamentus, piemēram, MMLU, MixEVAL, Triviaqa un Agieval, kas atbilst vai pārspēj līdzīga izmēra modeļus, piemēram, GEMMA-3 4B-IT, QWEN3-4B un SMOLLM3-3B.
Daudzvalodu pārbaude parāda, ka modelis nodrošina spēcīgu sniegumu vairāk nekā 10 valodās, ieskaitot arābu, mandarīnu, vācu un portugāļu valodā.
Pēc Arcee teiktā, papildu dialektu atbalsta pievienošana ir vienkārša, pateicoties tās modulārajai arhitektūrai.
AFM-4.5B ir parādījis arī spēcīgu agrīnu vilci sabiedriskās vērtēšanas vidē. Līderā, kas ierindo sarunvalodas modeļa kvalitāti, izmantojot lietotāju balsis un uzvaru līmeni, modelis ieņem trešo vietu, izsekojot tikai Claude Opus 4 un Gemini 2,5 Professional.
Tas lepojas ar uzvaru likmi 59,2% un visstraujākais jebkura augšdaļas modeļa latentums 0,2 sekundēs, pārī ar paaudzes ātrumu 179 žetonos sekundē.
Iebūvēts atbalsts aģentiem
Papildus vispārējām iespējām, AFM-4.5B ir iebūvēts atbalsts funkciju izsaukšanai un aģentu spriešanai.
Šī Funkciju mērķis ir vienkāršot AI aģentu un darbplūsmas automatizācijas rīku veidošanas procesusamazinot nepieciešamību pēc sarežģītiem uzvednes inženierijas vai orķestrēšanas slāņiem.
Šī funkcionalitāte atbilst Arcee plašākai stratēģijai, kas ļauj uzņēmumiem ātrāk izveidot pielāgotus, ražošanai gatavus modeļus, ar zemākām kopējām īpašumtiesību izmaksām (TCO) un vienkāršāku integrāciju uzņēmējdarbībā.
Kas notiks nākamais Acree?
AFM-4.5B apzīmē Arcee.ai centiens definēt jaunu uzņēmumu gatavu valodu modeļu kategoriju: mazu, izpildītāju un pilnībā pielāgojamu, bez kompromisiem, kas bieži nāk ar patentētiem LLM vai atvērtā svara SLM.
Izmantojot konkurences etalonus, daudzvalodu atbalstu, spēcīgus atbilstības standartus un elastīgas izvietošanas iespējas, modeļa mērķis ir apmierināt uzņēmuma vajadzības pēc ātruma, suverenitātes un mēroga.
Tas, vai Arcee var izdalīt ilgstošu lomu strauji mainīgajā ģeneratīvās AI ainavā, būs atkarīgs no tā spējas izpildīt šo solījumu. Wager ar AFM-4.5B uzņēmums ir izdarījis pārliecinātu pirmo soli.
avots