Indijas Tehnoloģiju institūta Bombejas (IIT Bombay) pētnieki ir izstrādājuši mākslīgā intelekta (AI) modeli, kas ļauj mašīnām interpretēt satelīta un dronu attēlus, izmantojot ikdienas valodas pamudinājumus, potenciāli pārveidojot lietojumprogrammas katastrofu reakcijā, uzraudzībai, pilsētplānošanai un lauksaimniecībai.
Modeli, ko sauc par adaptīvo modalitāti vadītu vizuālo zemu (AMVG), ir izstrādājusi komanda, kuru vada profesors Biplab Banerjee no IIT Bombejas pētījumu centra resursu inženierijas jomā.
Kaķa pamanīšana viesistabā varētu būt viegla mākslīgajam intelektam, bet sarežģītu, augstas izšķirtspējas satelītattēlu dekodēšana, kas balstīta uz dabiskās valodas instrukcijām, jau sen ir izaicinājums, sacīja Šabnam Choudhury, vadošais autors un doktors. IIT Bombejas pētnieks. AMVG mērķis ir novērst šo plaisu, ļaujot lietotājiem barot uzvednes, piemēram, “atrast visas bojātās ēkas netālu no applūdušās upes”, un dažu minūšu laikā saņemt mērķtiecīgus rezultātus pat no simtiem pārblīvētu attēlu.
Pētījums, kas publicēts Starptautiskajā fotogrammetrijas un attālās izpētes biedrībā fotogrammetrijas un attālās izpētes žurnālā, liek domāt, ka AMVG varētu padarīt attēlu analīzi ātrāku, intuitīvāku un pieejamāku aģentūrām un pētniekiem.
“Attālo sensoru attēli ir bagāti ar detaļām, bet ārkārtīgi izaicinoši automātiski interpretēt. Esošie modeļi cīnās ar neskaidrībām un kontekstuālajām komandām,” skaidroja Choudhury kundze.
AMVG ievieš jauninājumu kombināciju – ieskaitot daudzpakāpju marķētu kodētāju un uzmanības izlīdzināšanas zudumu (AAL), kas palīdz modelim precīzāk noteikt objektus, pamatojoties uz kontekstuālo izpratni. Jo īpaši AAL darbojas kā “virtuāls treneris”, mācot sistēmai koncentrēties uz attiecīgajiem attēlu reģioniem, interpretējot komandas. “Kad cilvēks nolasa” balto kravas automašīnu blakus degvielas tvertnei “, mūsu acis zina, kur meklēt. Aal māca mašīnai rīkoties tāpat,” sacīja Choudhury kundze.
Komanda paredz plašu lietojumprogrammu klāstu. Reaģējot uz katastrofām, aģentūras varētu ātri atrast bojātu infrastruktūru pēc plūdiem vai zemestrīcēm. Drošības organizācijas varētu identificēt maskētus transportlīdzekļus, kas atrodas jutīgos apgabalos, savukārt lauksaimnieki varēja uzraudzīt ražas veselību, vienkārši lūdzot modeli izcelt dzelteno plāksterus.
Tomēr profesors Banerjee paskaidroja, ka AMVG vēl nav pārbaudīts reālās pasaules katastrofas scenārijos. Runājot ar Hinduviņš teica: “Mēs esam veikuši dažus provizoriskus pētījumus, bet, ņemot vērā reālās pasaules pamatapraides katastrofu pārvaldībai, mēs nevarējām veikt pilna mēroga novērtējumu. Šādas datu kopas izstrādāšana ir viens no mūsu nākotnes plāniem.”
Pēc komandas domām, AMVG pārspēj esošās pieejas, nosakot bojātas ēkas, slēptus transportlīdzekļus vai ražas modeļus sarežģītā reljefā, lai gan joprojām tiek izskatīts visaptverošāks etalona pētījums.
Vaicāts, vai AMVG varētu palīdzēt valdībām un NVO plūdu, zemestrīču vai ugunsgrēku laikā, sniedzot reāllaika atziņas, profesors Banerjee bija optimistisks, “tas noteikti. Tas ir viens no spēcīgākajiem lietošanas gadījumiem, ko mēs domājam”.
Pētnieki arī pēta sadarbību, lai ieviestu AMVG operatīvā lietošanā. “Mēs jau esam strādājuši ar ISRO pie dažām līdzīgām problēmām,” atklāja profesors Banerjee. “Drīzumā sāksies jauna sadarbības kārta ar ISRO, un šādi redzes valodas modeļi tur tiks stingri apsvērti.”
AMVG ir parādījusi iedrošinošus rezultātus dažādos attēlos no satelītiem, droniem un lidmašīnām balstītiem sensoriem. Nākamais pētījumu posms ir modeļa izvietošana dažādos ģeogrāfiskos un vides scenārijos, lai novērtētu tā pielāgojamību.
Ievērojamā solī laukumā IIT Bombay komanda ir arī atklājusi AMVG ieviešanu GitHub. “Atklātā avota joprojām ir reti sastopama attālajā izpētē. Mēs gribējām veicināt caurspīdīgumu un paātrināt progresu,” sacīja Choudhury kundze.
Kamēr modelis parāda solījumu, komanda atzīst ierobežojumus. AMVG pašlaik ir atkarīgs no augstas kvalitātes anotētām datu kopām un prasa optimizāciju reāllaika izvietošanai. Notiek darbs ar sensoriem informētiem versijām un kompozīcijas zemēšanas metodēm, lai uzlabotu pielāgošanās spēju dažādās ainavās.
“Mūsu mērķis ir izveidot vienotu attālās izpētes izpratnes sistēmu – tādu, kas var ievietot, aprakstīt, izgūt un saprātīgi par jebkuru attēlu, izmantojot dabisko valodu,” sacīja Choudhury kundze.
Publicēts – 2025. gada 4. septembris 04:55 PM IST