Microsoft ir ieviesis MU, jaunu mākslīgā intelekta (AI) modeli, kas var darboties lokāli ierīcē. Pagājušajā nedēļā Redmond bāzētais tehnoloģiju gigants izlaida jaunas Home windows 11 funkcijas Beta, starp kurām bija jaunā AI aģentu funkcija iestatījumos. Funkcija ļauj lietotājiem aprakstīt, ko viņi vēlas darīt izvēlnē Iestatījumi, un izmanto AI aģentus, lai vai nu pārietu uz opciju, vai arī autonomi veikt darbību. Uzņēmums tagad ir apstiprinājis, ka funkciju darbina MU mazās valodas modelis (SLM).
Microsoft MU AI modelis pilnvaro aģentus Home windows iestatījumos
A emuāra ierakststehnoloģiju gigants sīki aprakstīja savu jauno AI modeli. Pašlaik to pilnībā izvieto saderīgā kopilotā+ datoros, un tas darbojas ierīces neironu apstrādes blokā (NPU). Microsoft ir strādājis pie modeļa optimizācijas un latentuma un apgalvo, ka tas reaģē ar vairāk nekā 100 žetoniem sekundē, lai izpildītu “aģenta prasības prasības iestatījumos scenārijā”.
MU ir veidota uz transformatoru balstītu kodētāja-dekodētāja arhitektūru, kurā ir 330 miljoni žetonu parametru, padarot SLM par labu piemērotību maza mēroga izvietošanai. Šādā arhitektūrā kodētājs vispirms pārveido ievadi salasāmā fiksēta garuma attēlojumā, ko pēc tam analizē dekodētājs, kas arī ģenerē izvadi.
Microsoft sacīja, ka šī arhitektūra ir priekšroka augstas efektivitātes un optimizācijas dēļ, kas ir nepieciešama, darbojoties ar ierobežotu skaitļošanas joslas platumu. Lai tas būtu saskaņots ar NPU ierobežojumiem, uzņēmums izvēlējās arī slāņa izmērus un optimizētu parametru sadalījumu starp kodētāju un dekodētāju.
Destilēts no uzņēmuma PHI modeļiem, MU tika apmācīts, izmantojot A100 GPU Azure mašīnu apguvē. Parasti destilētiem modeļiem ir lielāka efektivitāte salīdzinājumā ar vecāku modeli. Microsoft vēl vairāk uzlaboja tā efektivitāti, savienojot modeli ar uzdevumam specifiskus datus un precīzi noregulēt ar zema līmeņa adaptācijas (LORA) metodēm. Interesanti, ka uzņēmums apgalvo, ka MU darbojas līdzīgā līmenī kā Phi-3,5 mini, neskatoties uz to, ka tas ir viens desmitais lielums.
MU optimizēšana Home windows iestatījumiem
Tehnoloģiju gigantam bija arī jāatrisina cita problēma, pirms modelis varēja darbināt AI aģentus iestatījumos – tam bija jāprot apstrādāt ievades un izvades žetonus, lai mainītu simtiem sistēmas iestatījumu. Tam bija nepieciešams ne tikai plašs zināšanu tīkls, wager arī zems latentums, lai gandrīz uzreiz veiktu uzdevumus.
Tādējādi Microsoft masveidā palielināja savus apmācības datus, pārejot no 50 iestatījumiem līdz simtiem, un izmantotas metodes, piemēram, sintētiskā marķēšana un trokšņa injekcija, lai iemācītu AI, kā cilvēki frāzē kopīgus uzdevumus. Pēc apmācības ar vairāk nekā 3,6 miljoniem piemēru, modelis kļuva pietiekami ātrs un precīzs, lai atbildētu mazāk nekā pussekundē, apgalvoja uzņēmums.
Viens svarīgs izaicinājums bija tas, ka MU labāk darbojās ar daudzvārdu vaicājumiem virs īsākām vai neskaidrām frāzēm. Piemēram, ierakstot “apakšējā ekrāna spilgtums naktī”, dod tam lielāku kontekstu nekā tikai “spilgtuma” rakstīšana. Lai to atrisinātu, Microsoft turpina parādīt tradicionālos uz atslēgvārdiem balstītus meklēšanas rezultātus, ja vaicājums ir pārāk neskaidrs.
Microsoft novēroja arī uz valodu balstītu spraugu. Gadījumos, kad iestatījums varētu attiekties uz vairāk nekā vienu funkcionalitāti (piemēram, “palielināt spilgtumu” varētu attiekties uz ierīces ekrānu vai ārēju monitoru). Lai novērstu šo plaisu, AI modelis šobrīd koncentrējas uz visbiežāk izmantotajiem iestatījumiem. Tas ir kaut kas, ko tehnoloģiju gigants turpina uzlabot.