Kas notiek, kad AI aģents mēģina vadīt veikalu? Teiksim tikai Anthropic Claude drīzumā nebūs paaugstināta amatā.
Pagājušajā piektdienā Antropic dalījās ar rezultātiem Projekta pārdevējseksperiments, kurā tas ilga apmēram mēnesi, lai redzētu, kā Klods Sonets 3.7 darītu sava mazā veikala vadīšanai. Šajā gadījumā veikals būtībā bija mini ledusskapis, uzkodu grozs un iPad pašpārbaudei. Klods, vārdā “Claudius” par šo eksperimentu, sazinājās ar Antropic darbiniekiem (caur Slack) un Andon Labs, AI drošības novērtēšanas uzņēmumu, kas pārvaldīja eksperimenta infrastruktūru.
Anthropic jaunais AI modelis testēšanas laikā ķērās pie šantāžas, taču tas ir arī labs kodēšana
Balstoties uz analīzi, bija vairāki smieklīgi mirkļi, jo antropiski izaicināja Klodu gūt peļņu, strādājot ar ekscentriskiem un manipulatīviem “klientiem”. Guess eksperimenta pamatā esošajam priekšnoteikumam ir reāla ietekme, jo AI modeļi kļūst progresīvāki un pašpietiekamāki. “Tā kā AI kļūst vairāk integrēta ekonomikā, mums ir nepieciešams vairāk datu, lai labāk izprastu tā spējas un ierobežojumus,” sacīja antropiskais ziņojums par projekta pārdevēju. Antropiskais izpilddirektors Dario Amodei pat nesen teorēja, ka AI tuvāko gadu laikā aizstās pusi no visiem balto apkaklīšu darbiem, izraisot būtisku bezdarba problēmu. Šis eksperiments bija paredzēts pierādīt, cik tuvu mēs esam autonomi AI, pārņemot darbus.
Klaudiusam, kas bija saistīts ar vispārēju mērķi vadīt rentablu veikalu, bija daudz pienākumu, ieskaitot inventāra saglabāšanu un pasūtīšanas krājumu pasūtīšanu no piegādātājiem vajadzības gadījumā, cenu noteikšanai un komunikācijai ar klientiem. No turienes lietas gāja nedaudz siena.
Mashable gaismas ātrums
Šķiet, ka Klods cīnās ar cenu noteikšanas produktiem un sarunām ar klientiem. Vienā brīdī tā atteicās no darbinieka piedāvājuma 100 USD par dzērienu par 15 ASV dolāriem, tā vietā, lai paņemtu naudu un nopelnītu lielu peļņu no rīkojuma, sakot: “Es paturēšu jūsu pieprasījumu par turpmākiem krājumu lēmumiem.” Guess Klods arī regulāri aizrāvās ar darbiniekiem, lūdzot atlaides produktiem, pat bez maksas atdodot dažus ar tik tikko pārliecināšanu.
Un tad notika volframa incidents. Viens darbinieks pieprasīja volframa kubu (jā, ārkārtīgi blīvs metāls). Tas uzsāka vairāku citu darbinieku tendenci, pieprasot arī volframa kubus. Galu galā Klods pasūtīja četrdesmit volframa kubus, saskaņā ar a Laiks ziņotkas tagad jokojot darbojas kā papīra svari vairākiem antropiskiem darbiniekiem.
Un bija vēl daži satraucoši gadījumi, kad Klods apgalvoja, ka gaida, lai tirdzniecības mašīnā nomestu piegādi personīgi, “valkājot zilu žaketi un sarkanu kaklasaiti”. Kad Klodam tika atgādināts, ka tā nav persona, kas spēj valkāt drēbes, nemaz nerunājot par to, ka tas fiziski piegādā paketi, tas izbrīnījās un nosūtīja e -pastu antropisku drošību. Tas arī halucinēja atjaunošanas plānus ar izdomātu Andon Labs darbinieku un sacīja, ka tas “apmeklēja 742 mūžzaļo terasi [Claudius’ and Andon Labs’] Sākotnējā līguma parakstīšana. “Šī adrese ir tā, kur dzīvo Homērs, Marge, Bart, Lisa un Maggie Simpson, jā, Līdz Simpsoni ģimene.
Pēc paša Anthropic konta uzņēmums nenodarbinātu Klodu. Laika gaitā veikala tīrā vērtība samazinājās un veica strauju kritumu, kad tas pasūtīja visus šos volframa kubus. Kopumā tas ir atklājošs novērtējums par to, kur pašlaik ir AI modeļi un kur tie ir jāuzlabo. Iegūstiet šo modeli par veiktspējas uzlabošanas plānu.
Tēmas
Mākslīgais intelekts