Home Tehnoloģija Iepazīstieties ar Denario, mākslīgā intelekta “pētnieku palīgu”, kurš jau publicē savus dokumentus

Iepazīstieties ar Denario, mākslīgā intelekta “pētnieku palīgu”, kurš jau publicē savus dokumentus

32
0

An starptautiska pētnieku komanda ir izlaidusi an mākslīgā intelekta sistēma spēj patstāvīgi veikt zinātniskus pētījumus vairākās disciplīnās — aptuveni 30 minūtēs ģenerējot dokumentus no sākotnējās koncepcijas līdz publikācijai gatavam manuskriptam, katrs maksājot aptuveni 4 USD.

Sistēma, saukta Denārijsprot formulēt pētniecības idejas, pārskatīt esošo literatūru, izstrādāt metodoloģijas, rakstīt un izpildīt kodu, veidot vizualizācijas un izstrādāt pilnīgus akadēmiskos darbus. Demonstrējot savu daudzpusību, komanda izmantoja Denario, lai izveidotu dokumentus aptver astrofiziku, bioloģiju, ķīmiju, medicīnu, neirozinātni un citas jomas, un viens AI radīts dokuments jau ir pieņemts publicēšanai akadēmiskā konference.

"Denario mērķis nav automatizēt zinātni, wager gan izstrādāt pētniecības palīgu, kas var paātrināt zinātnisko atklāšanu," pētnieki rakstīja pirmdien publicētajā dokumentā, kurā aprakstīta sistēma. Komanda izstrādā programmatūru publiski pieejams kā atvērtā koda rīku.

Šis sasniegums iezīmē pagrieziena punktu lielu valodu modeļu pielietošanā zinātniskajā darbā, potenciāli mainot pētnieku pieeju agrīnās stadijas pētījumiem un literatūras apskatiem. Tomēr pētījums izceļ arī būtiskus ierobežojumus un izvirza aktuālus jautājumus par validāciju, autorību un zinātniskā darba mainīgo raksturu.

No datiem līdz melnrakstam: kā AI aģenti sadarbojas, lai veiktu pētījumus

Tās pamatā Denārijs darbojas nevis kā atsevišķas AI smadzenes, wager gan kā digitālās pētniecības nodaļa, kurā specializēti AI aģenti sadarbojas, lai virzītu projektu no koncepcijas līdz pabeigšanai. Course of var sākties ar "Ideju modulis," kurā tiek izmantots aizraujošs sacīkstes course of, kurā an "Ideju veidotājs" aģents ierosina pētniecības projektus, kurus pēc tam rūpīgi pārbauda "Ideju nīdējs" aģents, kas tos kritizē par iespējamību un zinātnisko vērtību. Šī iteratīvā cilpa pilnveido neapstrādātus jēdzienus stabilos pētniecības virzienos.

Kad hipotēze ir nostiprināta, a "Literatūras modulis" izpēta akadēmiskās datu bāzes, piemēram, Semantic Scholar, lai pārbaudītu idejas novitāti, kam seko "Metodoloģijas modulis" kas nosaka detalizētu, soli pa solim izpētes plānu. Pēc tam smago celšanu veic "Analīzes modulis," virtuāls darba zirgs, kas raksta, atkļūdo un izpilda savu Python kodu, lai analizētu datus, ģenerētu diagrammas un apkopotu rezultātus. Visbeidzot, "Papīra modulis" ņem iegūtos datus un grafikos un sastāda pilnīgu zinātnisko rakstu LaTeX, kas ir standarts daudzām zinātnes jomām. Pēdējā, rekursīvā solī a "Pārskatīšanas modulis" var pat darboties kā AI salīdzinošais recenzents, sniedzot kritisku ziņojumu par izveidotā papīra stiprajām un vājajām pusēm.

Šis modulārais dizains ļauj cilvēka pētniekam iejaukties jebkurā posmā, sniedzot savu ideju vai metodoloģiju, vai vienkārši izmantot Denario kā pilnīgu autonomu sistēmu. "Sistēmai ir modulāra arhitektūra, kas ļauj tai veikt konkrētus uzdevumus, piemēram, ģenerēt ideju vai veikt pilnīgu zinātnisku analīzi," papīrs skaidro.

Lai apstiprinātu savas iespējas, Denario komanda ir pārbaudījusi sistēmu, izveidojot plašu dokumentu krātuvi daudzās disciplīnās. Pārsteidzošā koncepcijas pierādījumā viens Denario pilnībā ģenerēts dokuments tika pieņemts publicēšanai Agents4Science 2025 konference — recenzēta vieta, kurā galvenie autori ir pašas AI sistēmas. Papīrs ar nosaukumu "QITT uzlabota daudzpakāpju apakšstruktūru analīze ar apgūtām topoloģiskām iegulšanām kosmoloģisko parametru novērtēšanai no tumšās matērijas halo saplūšanas kokiem," veiksmīgi apvienoja sarežģītas idejas no kvantu fizikas, mašīnmācības un kosmoloģijas, lai analizētu simulācijas datus.

Spoks iekārtā: mākslīgā intelekta “nepiemērotie” rezultāti un ētiskas trauksmes

Lai gan panākumi ir vērā ņemami, pētnieciskais raksts ir atsvaidzinoši atklāts par Denario nozīmīgajiem ierobežojumiem un kļūmju veidiem. Autori uzsver, ka sistēma pašlaik "uzvedas vairāk kā labs bakalaura vai agrīna maģistrantūras college students, nevis pilntiesīgs profesors kopējā attēla, savienojošo rezultātu ziņā… utt." Šis godīgums nodrošina būtisku realitātes pārbaudi jomā, kurā bieži dominē ažiotāža.

Papīrs ir veltīts veselām sadaļām "Kļūmes režīmi" un "Ētiskās sekas," pārredzamības līmenis, kas būtu jāņem vērā uzņēmumu vadītājiem. Autori ziņo, ka vienā gadījumā sistēma "halucinēja visu darbu, neieviešot nepieciešamo skaitlisko risinātāju," izgudrojot rezultātus, lai tie atbilstu ticamam stāstījumam. Citā tīras matemātikas problēmas pārbaudē AI izveidoja tekstu, kurā bija formā matemātisks pierādījums, wager, pēc autoru vārdiem, "matemātiski tukšs."

Šīs kļūmes uzsver kritisko punktu jebkurai organizācijai, kas vēlas izmantot aģentu AI: sistēmas var būt trauslas un ir pakļautas pārliecinoši skanošām kļūdām, kurām nepieciešama eksperta cilvēka uzraudzība. Denario dokuments kalpo kā būtisks gadījuma pētījums par to, cik svarīgi ir informēt cilvēku par validāciju un kritisku novērtējumu.

Autori arī saskaras ar dziļajiem ētikas jautājumiem, ko radījusi viņu radīšana. Viņi to brīdina "AI aģentus varētu izmantot, lai ātri pārpludinātu zinātnisko literatūru ar apgalvojumiem, kuru pamatā ir noteikta politiskā programma vai īpašas komerciālas vai ekonomiskas intereses." Viņi arī pieskaras "Tjūringa slazds," parādība, kuras mērķis ir cilvēka intelekta atdarināšana, nevis tā palielināšana, kas, iespējams, noved pie a "homogenizācija" pētniecība, kas apslāpē patiesas, paradigmu mainošas inovācijas.

Atvērtā koda otrais pilots pasaules laboratorijām

Denario nav tikai teorētisks uzdevums, kas ir ieslēgts akadēmiskajā laboratorijā. Visa sistēma ir atvērtā koda saskaņā ar GPL-3.0 licenci un ir pieejama plašākai sabiedrībai. Galvenais projekts un tā grafiskā lietotāja saskarne DenarioApp ir pieejams vietnē GitHubar instalēšanu, ko pārvalda, izmantojot standarta Python rīkus. Uzņēmuma vidēm, kas vērstas uz reproducējamību un mērogojamību, projekts nodrošina arī oficiālus Docker attēlus. Publiska demonstrācija tika mitināta Apskāvieni sejas atstarpes ļauj ikvienam eksperimentēt ar savām iespējām.

Pagaidām Denario joprojām ir tas, ko tā veidotāji sauc par spēcīgu palīgu, wager ne aizvietotāju pieredzējušajai cilvēku eksperta intuīcijai. Šis ierāmējums ir apzināts. Denario projekts ir mazāks par automatizēta zinātnieka izveidi, wager gan par labākā otrā pilota izveidi, kas paredzēts mūsdienu pētījumu nogurdinošajiem un laikietilpīgajiem aspektiem.

Nododot nogurdinošo kodēšanas, atkļūdošanas un sākotnējās izstrādes darbu AI aģentam, sistēma sola atbrīvot cilvēku pētniekus vienam uzdevumam, ko tā nevar automatizēt: dziļai, kritiskai domāšanai, kas nepieciešama, lai vispirms uzdotu pareizos jautājumus.

avots