Home Tehnoloģija Balss palīgi ubago pārņemšanu. Vai jums tiešām vajadzētu viņiem to dot?

Balss palīgi ubago pārņemšanu. Vai jums tiešām vajadzētu viņiem to dot?

9
0

Ja ticat tam, ko Google un Amazon vēlas, lai jūs ticētu, šis ir balss palīgu vecums… vēlreiz. Šonedēļ abi uzņēmumi atklāja sīkāku informāciju par savu viedās mājas ekosistēmu nākotni, kas koncentrējas uz pāris lietām: jauni viedie skaļruņi (protams) Google mājas skaļruņa un jauniem atbalss izstrādājumiem ar labāku skaņu un ātrāku mikroshēmu, guess, iespējams, vēl svarīgāk, jauniem un it kā jaunākiem balss palīgu kultūrām, lai tos varētu. Google tas ir Dvīņi mājām, un Amazon ir Alexa+, kurus abus veicina lielās valodas modeļos (LLMS) sasniegumi, piemēram, tie, kurus izmanto Chatgpt.

Abu uzņēmumu aplēsē Alexa+ un Demini for Dwelling ir ne tikai jaunas balss palīgu paaudzes, guess arī pirmais Reāla paaudžu paplašināšanās kopš balss palīgu rītausmas pirms 10 gadiem. Ar šo paredzēšanu ir daži lieli solījumi. Šoreiz uzņēmumi saka, ka jūs to visu varēsit izdarīt. Vai vēlaties uber? Pasūtiet to ar Alexa+Apvidū Vai vēlaties pārbaudīt savu mājas kameru, lai redzētu, kādi ir jūsu kaķi visu dienu? Jautājiet Gemini. Vēlaties izslēgt katru viedo gaismu jūsu mājā, izņemot viens? Nu, tas ir kaut kas, ko jūs varat patiesībā Lūdziet tagad, nevis cītīgi lobē vairākas komandas un cer, ka tās pielīmēs. Tas viss izklausās lieliski. Tas izklausās tieši tā, kā mēs esam vēlējušies, jo balss palīgi pirms gadiem devās uz mūsu mājām. Tas viss izklausās tik ideāli, un izklausās arī, ja es esmu godīgs, piemēram, tas varētu būt pilnīgs sūdu crock.

Amazon jaunā nāves zvaigzne-esque atbalss runātājs. © Adriano Contreras / Gizmodo

Ļaujiet man skaidri pateikt: es nešaubos, ka tērzēšanas roboti dažos veidos var būt pārveidojoši. Mēs jau esam redzējuši, kā tos var izmantot tādās jomās kā meklēšana, ļaujot veikt sarežģītākus jautājumus, salīdzinājumus un padomus. Mēs esam redzējuši viņu ģeneratīvās iespējas, apvienojot un transponējot tādiem modeļiem kā VEO vai Sora. Mēs esam redzējuši, kā tās var kodēt pamata lietotnes, vienkārši ierakstot ideju tekstlodziņā. Pat ja visas šīs iespējas nebūt nav ideālas, mēs esam redzējuši smagus piemērus, kā tās var strādāt, kad tās darbojas labi. Balss palīgi? Nu, mums ir daudz mazāk pierādījumu.

Šonedēļ Fanfare no Amazon bija viena acīmredzama izlaidība. Kamēr Alexa+, tā nākamā paaudzes balss palīgs, ir bijusi pieejama agrīnā piekļuvē, tā nav atklājusi, kad plāno izplatīt jaunināšanu plašāk pēc tam gads no tā sludināšanas. Tas joprojām ir “agrīnā piekļuve” ASV klientiem. Tas acīmredzami varētu nozīmēt daudzas lietas; Varbūt Amazon tikai izmanto savu laiku un pārliecinās, ka viss ir precīzi noregulēts, pirms atbrīvo Alexa+ līdz pasaulei. Wager ciniskākā līmenī tas varētu nozīmēt arī to, ka Alexa+ nav gluži gatavs lielajām līgām.

Piešķirt ticamību šai pēdējai teorijai? Siri. Atcerieties, kad Apple apsolīja nenovēršamu nākamā paaudzes LLM darbināmā Siri izlaišanu kā Apple Intelligence daļu atpakaļ 2024. gada jūnijā? Jā, labi, tas joprojām nav šeit, un nav īstu norādes par to, kad tas ieradīsies. Un iemesls? Nu, ja mēs uzvilktu savas domāšanas cepures, tas būtu, ka tas vēl nav gatavs. Lai veiktu šo secinājumu vēl vienu soli tālāk: Funkcionālie LLM darbināmie balss palīgi izrādās garāks pasūtījums nekā tādi uzņēmumi kā Apple, kas, domājams, bija visvairāk resursu tehnoloģiju uzņēmums pasaulē, bija paredzējis.

Google Nest produkta palaišana 23
Google mājas runātājs… neiznāk līdz 2026. gada pavasarim. © Adriano Contreras / Gizmodo

Tagad varbūt Amazon vai Google šajā jomā būs vairāk veiksmes – jo īpaši Google ir ielicis plašus resursus Dvīņu uzlabošanai, un nebūtu nepamatoti domāt, ka visa šī uzmanība un ieguldījums varētu izraisīt kaut kādu izrāvienu. Wager vēl ir daudz, par ko ir skeptiski. Nesen es saņēmu instruktāžu par Google jaunajiem viedās mājas produktiem, ieskaitot tās Dvīņus mājas palīgam, un, pēc Google domām, balss palīga piesātināšanas course of ar LLM nav tik vienkārši, kā jūs domājat.

Kaut arī Dvīņi varētu būt lieliski izprast dabisko valodu, tā patiesībā varētu ne Esiet ideāli piemērots vienkāršāku lietu veikšanai, piemēram, apgaismojuma izslēgšanai un ieslēgšanai. Tērzēšanas roboti, kaut arī dažreiz tie var būt iespaidīgi, tiem ir tendence pārdomāt un interpretēt, kas padara tos par labu dažiem uzdevumiem, guess tas nav tas, ko vēlaties, kad runa ir par maizes un sviesta viedajām mājām.

Anish Kattukaran, Google Dwelling and Nest galvenais produktu virsnieks, Gizmodo sacīja, ka vienkāršām komandām ir “jāstrādā 10 no 10 reizēm”.

Šo atšķirību dēļ Google saka, ka tas faktiski atdala modeļus Dvīņos mājās, kas nozīmē, ka progresīvāks LLM, iespējams, neizslēdzas jūsu gaismas ieslēgt un izslēgt vai iestatīt taimerus. Kad jūs sakāt “Ei, Google”, tas būs jūsu noņemts, vairāk vērsts uz uzdevumiem vērstiem Dvīņiem-to, kuru jūs izmantosit taimeriem, gaismām, mūzikas atskaņošanai, ātrai meklēšanai tīmeklī un citām vispārīgām viedās mājas automatizācijas lietām. Kad jūs sakāt: “Hei Google, tērzēsim”, tomēr Dvīņi mājās aktivizē Dvīņu tiešraides režīmu, kurā vairāk izmanto LLM dabiskās valodas pilnvaras sarunvalodas “tērzēšanai”. Šajā vietā jūs iegūsit vairāk argumentācijas un radošuma, lai veidotu receptes lidojumā vai prāta vētras atvaļinājumā. Šajā režīmā ar Gemini Reside AI “klausīsies” un vairāk paredzētu, ļaujot jums runāt dabiski, nejūtot, ka jūs pastāvīgi rāpojat komandas, un tad tas jums kaut ko dara.

Tas liek uzdot jautājumu: cik liela daļa ir Dvīņi iekšā Jo vairāk apmulsis modeli, kuru jūs izmantosit katru dienu? Un cik tas ir progresīvs patiesi? Ir arī vērts atzīmēt, ka Dvīņi mājām, piemēram, Alexa+, šobrīd ir agrīnā piekļuvē, un Google problēma ar balss palīgu modernizēšanu ar LLM nav ekskluzīva Dvīņiem – tā ir tā pati izdevums, ar kuru uzņēmumi saskaras visā pasaulē.

Klausieties, es ne tikai esmu gatavs likvidēt ar olu uz manas sejas, rakstot šo lietu, guess es esmu cerība ka es daru. Man, tāpat kā daudziem citiem, pats ir vienkāršota gudra māja, un es esmu (tāpat kā daudzi citi) piedzīvojuši neapmierinātību un berzi, to lietojot pat vienkāršiem uzdevumiem. Esmu gatavs nākamajai balss palīgu paaudzei, pat ja tas nozīmē, ka man ir jāatstāj ikmēneša abonements, lai tos izmantotu. Wager, cik cerīgs esmu, ir pagājusi ilga desmitgade, kad vēlējos vairāk, guess nepārtraukti gaidīt mazāk. Tātad Dvīņu, Alexa un Siri gadījumā man vajadzēs redzēt rezultātus, pirms es iepērkos pilnā balss palīgā.

avots

LEAVE A REPLY

Please enter your comment!
Please enter your name here