Sisällysluettelo:
- Mikä on Google Duplex?
- Eikö tämä ole kuin puhe tekstistä?
- Kuinka duplex toimii?
- Entä turvallisuus ja yksityisyys?
- Milloin puhelin on kaksipuolinen?
- Mistä voin oppia lisää?
Google I / O 2018 -tapahtumassa näimme esittelyn Googlen uusimmasta uudesta, Duplexista. 60 metrin näytöllä näkyvä lava näytti miltä näyttää Google Assistant -sovellukseltasi, kun Assistant soittaa riviltä riville soittamalla kampaajalle ja määrittämällä tapaamisen, taukot, ummit ja ahhhs sekä loput ominaispiirteistä, jotka seuraavat ihmisen puhetta. Ajanvarauksen tehnyt henkilö ei tuntunut tietävän puhuvansa tietokoneen kanssa, koska se ei kuulostanut tietokoneelta. Ei edes vähän.
Tällainen demo näyttää hämmästyttävältä (ja ehkä hieman kammolta), mutta entä yksityiskohdat? Mikä on kaksipuolinen, tarkalleen ottaen? Kuinka se edes toimii? Meillä kaikilla on kysymyksiä, kun näemme jotain tätä erilaista, ja vastausten löytäminen Internetissä on tuskaa. Katsotaanpa sitten, mitä tiedämme toistaiseksi Google Duplexista.
Mikä on Google Duplex?
Se on uusi Googlen työkalu, jonka tarkoituksena on käyttää tekoälyä (AI) "suorittaa reaalimaailman tehtäviä puhelimitse" Googlen AI-tutkijoiden ja -kehittäjien mukaan. Toistaiseksi se tarkoittaa hyvin erityisiä tehtäviä, kuten tapaamisten tekemistä, mutta tekniikkaa kehitetään silmällä pitäen laajentumista muille alueille. Miljoonien kulutus hienon tavan tekemiseen illallisvarauksiksi kuulostaa Google: n tekemältä, mutta se ei tarkoita suurta ajan tai rahaa.
Duplex on myös enemmän kuin näimme demossa ja jos se koskaan poistuu laboratoriosta, on paljon enemmän kuin mitä näemme tai kuulemme loppupäässämme. Tietoihin on valtavia pankkeja ja sitä käsitteleviä tietokoneita, jotka eivät ole läheskään yhtä viileitä kuin lopputulos. Mutta ne ovat välttämättömiä, koska tietokoneen tekeminen puhumaan ja ajattelemaan reaaliajassa kuin henkilö on vaikeaa.
Eikö tämä ole kuin puhe tekstistä?
Ei. Ei edes lähelle. Ja siksi se on iso juttu.
Kaksipuolinen tulostus on suunniteltu muuttamaan tapaa, jolla tietokone puhuu puhelimessa.
Duplexin tavoitteena on saada asiat kuulostamaan luonnolliselta ja avustaja ajattelee lennossa löytääkseen sopivan tapaamisajan. Jos Joe sanoo: "Joo, siitä - minulla ei ole mitään auki ennen 10: tä, eikö niin?" Assistentin on ymmärrettävä, mitä Joe sanoo, selvittää, mitä tämä tarkoittaa, ja ajateltava, toimiiko se, mitä Joe tarjoaa, sinulle. Jos olet kiireinen kaupungin yli kello 10 ja kuluu 40 minuuttia ajaa Joen autotalliin, avustajan on kyettävä selvittämään se ja sanomaan, että kello 11:15 olisi hyvä.
Yhtä tärkeää Googlelle on, että Duplex vastaa ja kuulostaa henkilöltä. Google on ilmoittanut haluavansa puhelimessa olevan henkilön tietämättä puhua tietokoneen kanssa, vaikkakin lopulta olisi parasta ilmoittaa heille. Kun puhumme ihmisten kanssa, puhumme nopeammin ja epämuodollisemmin (lue: epäjohdonmukainen kiusaaminen tietokoneen näkökulmasta) kuin silloin, kun puhumme Assistentin kanssa puhelimellamme tai tietokoneella DMV: llä, kun soitamme sisään. Kaksipuolisen on ymmärrettävä tämä ja luo se vastaamalla.
Viimeisenä, ja mikä on vaikuttavinta, on se, että Kaksipuolisen on ymmärrettävä konteksti. Perjantai, ensi perjantai ja ensi viikon jälkeen perjantai ovat kaikkia termejä, joita minä ja ymmärrän. Kaksipuolisen on ymmärrettävä myös heidät. Jos puhuisimme samalla tavalla kuin kirjoitamme, tämä ei olisi ongelma, mutta emme tiedä, ettet tiedä, koska se kuulostaa vain kuulostavan niin tylsältä, niin se ei ole kuin hämmentävä, vaikka olemme kuulleet sen koko elämämme ja olemme tottuneet siihen ei meillä ei ole ongelmia, joiden tiedät ymmärtäväsi tai mitään sellaista.
Annan ensiapua toimittajalle kirjoittamisen jälkeen, kun sanot sen ääneen, joten näet mitä tämä tarkoittaa.
Kuinka duplex toimii?
Käyttäjän kannalta on niin helppoa kuin käskeä avustajaa tekemään jotain. Toistaiseksi, kuten mainittiin, jotakin rajoittuu tapaamisten tekemiseen, joten sanoisimme: "Hei Google varaa minulle tapaamisen öljynvaihtoon Joen autotallissa tiistaiaamuna", ja (sen jälkeen kun se muistutti meitä sanomaan kiitos) se soittaisi ylös Joe's Garage ja määritä asiat, lisää se sitten kalenteriin.
Melko näppärä. Mutta mitä tapahtuu kamerasta pois päältä, on vielä hienompaa.
Duplex käyttää niin kutsuttua toistuvaa hermoverkkoa. Se on rakennettu Googlen TensorFlow Extended -teknologialla. Google koulutti verkon kaikissa niissä nimettömissä puheposteissa ja Google Voice -keskusteluissa, joissa suositit antavan sen kuunnella, jos valitset puheentunnistusohjelmiston ja kyvyn ottaa huomioon keskustelun historia ja yksityiskohdat, kuten kellonaika ja sijainti molemmat osapuolet.
Pohjimmiltaan koko suuritehoisten tietokoneiden verkko pirskaa tietoja pilvessä ja puhuu puhelimesi tai muun tuotteen, jolla on avustaja, Assistentin kautta.
Entä turvallisuus ja yksityisyys?
Siinä on yksi yksinkertainen asia: luotatko Googleen. Laitteiden koneiden älykkyys on todellinen asia, tosin rajoitettu ja suhteellisen uusi. Google on kehittänyt ML-Kitin auttamaan kehittäjiä tekemään enemmän tällaisia asioita itse laitteessa, mutta kaikki on kyse laskentateholla. Hiusten nimittäminen tällä tavalla vie uskomattoman määrän laskelmia, eikä sitä voida tehdä puhelimellasi tai Google-etusivulla.
Sinun on luotettava tietoihisi Googleen käyttämään älykkäitä tuotteita, ja Duplex ei eroa toisistaan.
Googlen on käytettävä suurta osaa henkilökohtaisista tietoistasi tehdäksesi erityisiä asioita, jotka Assistentti voi tehdä juuri nyt, ja Duplex ei muuta sitä. Uutta on se, että nyt mukana on toinen osapuoli, joka ei nimenomaisesti antanut Googlelle lupaa kuunnella heidän keskusteluaan.
Jos / kun Duplexista tulee todellinen kuluttajatuote kenelle tahansa käytettäväksi, odota sitä kritisoivan ja riitauttavan tuomioistuimissa. Ja sen pitäisi olla; Annetaan Googlelle päättää, mikä on parasta yksityisyytellemme, kuten kahden kettujen ja kanan vanha sanonta ja kana, joka päättää mitä illalliselle.
Milloin puhelin on kaksipuolinen?
Kukaan ei tiedä nyt. Sitä ei voi koskaan tapahtua. Google innostuu, kun se voi tehdä tällaista fantastista asiaa, ja haluaa jakaa sen maailman kanssa. Tämä ei tarkoita, että se onnistuu tai siitä tulee koskaan todellinen tuote.
Duplexia testataan toistaiseksi suljetussa ja valvotussa ympäristössä. Jos kaikki menee hyvin, ensimmäinen kokeellinen julkaisu kuluttajille, jotka tekevät ravintolavarauksia, ajoittaa kampaaja tapaamisia ja saada loma-aikoja puhelimitse, tulee myöhemmin tänä vuonna käyttämällä Assistenttia vain puhelimissa.
Mistä voin oppia lisää?
Google on yllättävän avoin tekniikasta, jota se käyttää kaksipuolisen luomiseen. Löydät merkityksellistä tietoa seuraavista verkkosivustoista:
- Google AI-blogi (Google)
- Deepmind
- Tensorflow.org
- Cornellin yliopiston kirjasto
- Google-tutkimus (Google)
- Avainsana (Google)
- ML-paketti (Google)
Seuraamme tietysti myös Duplexia tiiviisti, ja kuulet viimeisimmät kehitysyhteydet täällä heti, kun ne ovat saatavilla.