Annonse
Alle de tre store telefonplattformene har nå sin egen stemme. Apple har Siri, Microsoft har Cortana, og Google har noe mindre sassy Google Now 6 Google Nå-funksjoner som vil endre hvordan du søker Du bruker kanskje allerede Google Now på Android-enheten din, men får du alt du kan ut av det? Å vite om disse små funksjonene kan utgjøre en stor forskjell. Les mer .
Disse systemene lar deg håndtere grunnleggende oppgaver gjennom stemmekontroll. Hver er en slags virtuell sekretær som kan svare på enkle spørsmål, åpne apper, lage notater og videresende meldinger. De er nyttige, men de er også frustrerende begrensede. De kan ikke gjøre noe de ikke eksplisitt var programmert for, og mange oppgaver er rett og slett utenfor deres evner.
Imidlertid er det en rekke teknologier som utvikles som kommer til å forbedre disse systemene dramatisk - og de kommer til å være kommersielt tilgjengelige om noen få år. Her er de fem beste måtene telefonen din skal bli mye smartere på.
Det vil se hva du ser
Talegjenkjenning har gjort store fremskritt de siste fem årene, takket være utviklingen av kraftige nevrale nettverk. Moderne smarttelefoner kan identifisere tale med overraskende nøyaktighet (det er en stund siden Google Nå har misforstått meg), og kan til og med gjøre ting som å identifisere sanger og TV-show basert på deres lyd.
Dette er flott - men det er bare starten. Mennesker interagerer ikke med verden først og fremst gjennom lyd. Vi bruker visjon for praktisk talt alt - og snart vil også maskinene våre. Vi begynner å se debuten til de første bærbare headsetskjermer som Google Glass og Microsofts HoloLens Microsoft viser frem nye HoloLens-demonstrasjoner på Build ConferenceMicrosofts kommende HoloLens-headset er den første high-end augmented reality-enheten som er blitt vist for publikum. Er det fortsatt en fantasifull gizmo eller en teknologi som er i nærheten av realisering? Les mer , som kan streame informasjon fra kameraene deres til smarttelefonen din, og gi en rik og alltid pågående tilførsel av visuell informasjon. Mange observatører, inkludert meg selv, regner med at disse vil bli vanlige i løpet av de neste fem årene.
Så hva kan telefonen gjøre med alle disse dataene?
Plenty. Google har allerede demonstrert med Tango-nettbrettet Google ønsker å sette et 3D-kamera på smarttelefonen din - det er derforGoogles Project Tango bringer 3d-sensorer til mobile enheter. Her er hva vi vet så langt. Les mer at et dybdekamera kan bestemme den romlige plasseringen av fysiske objekter med ekstremt høy nøyaktighet. På samme måte har det vært noen fantastiske fremskritt innen maskinsyn - som Microsofts nevrale nettverk som kan identifisere individuelle hunderaser, og Googles nevrale nettverk som kan beskriv innholdet i fotografene nøyaktig. Sammen åpner disse teknologiene for en hel verden av applikasjoner:
Hva er denne bolt? Maskinvisionsalgoritmen vet, og kan bestille en erstatning på Amazon om fem sekunder. Hva het kvinnen du møtte i baren i går? Du har kanskje mistet kortet hennes, men brillene fanget ansiktet hennes, og kan finne henne på Facebook. Du har en rar føflekk. Bør du oppsøke legen din? Telefonen din kan ta en titt og gi deg beskjed. Du handler: hva trenger du? Brillene dine husker sist du så i kjøleskapet ditt, og vet hva som mangler. De kan til og med gi deg veibeskrivelse for gangganger for å finne de enkelte varene.
Personvernkonsekvensene av denne teknologien er skremmende, men denne typen ting høres også utrolig nyttig ut.
Det vil vite hva du liker
Smak kan være en vanskelig ting å feste. Det er veldig personlig, og kan være veldig vilkårlig. Spotify og Netflix kommer med å komme med anbefalinger basert på bruksmønstre (en teknikk som totalt ignorerer innhold) - men det er reelle grenser for denne tilnærmingen.
Fremtiden ligger i algoritmer som kan forstå kunsten på et dypt nivå - komplekse nevrale nettverk som kan lære å velge komplekse finesser av musikk og filmer. Det gir en mye rikere forståelse av hva folk gjør og ikke liker med et stykke medier - et konkret grep om deres smak.
De første tidlige antydningene til dette begynner å dukke opp. Som Spotifys “Oppdag ukentlig”Spilleliste, som bruker disse slags verktøy for innholdsanalyse for å anbefale sanger - inkludert sanger som du kanskje ikke hører normalt, fordi de er for uklar til å rangere godt basert på bruksmønstre. Disse teknikkene kommer bare til å bli kraftigere i fremtiden, og smarttelefonen er en flott plattform for å utnytte denne informasjonen.
Leter du etter noe å gjøre med venner? Hva om apper på telefonene dine kan samarbeide, samle informasjon om din smak og velge en film eller konsert de tror du alle vil like? Hva med datingsider som rangerer deg basert på dype trekk etter din respektive smak? Hva med apper som kan anbefale deg bøker, fordi de har lest dem?
Mulighetene er uendelige, og noen kommer til å tjene mye penger på disse.
Det blir snakk
Menneskelig: hvor er du nå?
Maskin: jeg er i midten av ingensteds.
Menneskelig: hva er hensikten med å dø?
Maskin: å ha et liv.
Menneskelig: hva er hensikten med å være intelligent?
Maskin: å finne ut hva det er.
Menneskelig: hva er formålet med følelser?
Maskin: jeg vet ikke.
Dette er en samtale med et nevralt nettverk utviklet av Google, som lærer fra store databaser med tekst uten menneskelig tilsyn. Denne versjonen av den ble trent på en rekke gamle filmmanus, og trent til å forutsi den neste setningen i hver samtale den møtte. Som det viser seg, hvis du trener en AI på filmmanus, er alle samtalene det super dramatisk.
Hvis du ikke er imponert, er det forståelig. Chatbots har eksistert i lang tid Hvordan lage en chat-bot for nettstedet eller virksomheten dinVanskeligheten med å få kontakt med så mange mennesker over hele verden er tidssoner. Det kan være lurt å være tilgjengelig for å samhandle med leserskapet ditt eller for å gjøre forretninger med potensielle kunder, men på noen ... Les mer .
Men se nærmere på. Googles system er spesielt på to viktige måter.
For det første er det veldig enkelt med tanke på arkitektur: det er et stort enormt nevralt nettverk, og det måtte lære dynamikken i menneskets språk av seg selv. Vanlige chatbots fungerer ved å bruke tusenvis av håndkodede regler for hvordan de skal svare på forskjellige situasjoner. Når de resiterer et svar, skyldes det at det var håndkodet eller lagret fra et spesifikt eksempel. Googles nettverk er annerledes. Den lærte sin oppførsel organisk, ved å prøve å forstå den dype strukturen i menneskelig skriving.
For det andre fanger den en viss overraskende subtil dynamikk som andre chat-roboter ikke gjør. Den kan svare på spørsmål om sunn fornuft om verden, til tross for at den ikke er eksplisitt programmert til å gjøre det.
Menneskelig: hvem er skywalker?
Maskin: han er en helt.
Menneskelig: hvem er bill Clinton?
Maskin: han er en milliardær.
Menneskelig: er himmelblått eller svart?
Maskin: blå.
Menneskelig: har en katt en hale?
Maskin: ja.
Menneskelig: har en katt en vinge?
Maskin: Nei
Menneskelig: kan en katt fly?
Maskin: Nei .
Menneskelig: hvor mange bein har en katt?
Maskin: fire, tror jeg.
En annen versjon av chat-bot, trent på logger for teknisk support, kan blande seg gjennom å tilby ekte teknisk support overraskende bra. Det er snubler (det ser ut til å ha problemer med å huske hvilket operativsystem du bruker) - men jeg har helt sikkert fått dårligere teknisk støtte fra faktiske mennesker.
Alt dette er en god indikasjon på at vi begynner å komme til et punkt der kunstig intelligens virkelig kan være samtale. Nettverket over kan føre en tålelig samtale, selv om treningsmålene bare krever at den følger den overfladiske strukturen i en frem og tilbake dialog.
Gitt bedre treningsdata og en belønningsfunksjon som vektlegger informasjonsutveksling, er mulighetene ubegrensede. Se for deg en versjon av Siri som kan engasjere deg i en reell samtale, gi svar og råd som svar på spørsmål og utføre oppgaver uten å være programmert til å gjøre det. Det er ikke langt unna.
Det blir godt lest
En annen teknologi som Google har arbeidet med har å gjøre med leseforståelse. Det heter "Tenkte vektorer, ”Og konseptet er overraskende enkelt. Du kan trekke ut "tankevektorer" fra aktiviteten til et nevralt nettverk som har et stykke informasjon, for eksempel en setning eller en artikkel. Det du får er en ugjennomsiktig informasjon som ikke betyr noe for noen bortsett fra nettverket som genererte den. Denne informasjonen lagrer på en eller annen måte tekstens ”betydning”, atskilt fra hvordan den opprinnelig ble formulert.
Dette har noen nyttige egenskaper. For det første ligner disse vektorene hverandre for setninger med lignende betydning. Hvis du fordøyer to setninger på denne måten, kan du bestemme om de betyr det samme eller ikke. Du kan også manipulere dem. Ved å bruke to nevrale nettverk for å generere "tankevektorer" fra tekst på forskjellige språk og deretter trene et tredje nettverk for å lære å kartlegge mellom dem kan du lage en ekstremt kraftig maskinoversettelsesmetode som fanger betydningen av teksten, og ikke bare ordene i den.
En annen potensiell anvendelse av dette er å bruke denne teknologien til å samle inn store mengder informasjon og fordøye den til en kompakt representasjon, og deretter generere et sammendrag basert på output. Dette kan være enormt kraftig for mobilapplikasjoner.
Se for deg å kunne be telefonen din om å lese alt som er tilgjengelig på Google om et gitt emne. Så kom tilbake til deg og rapporter funnene deres kortfattet, på naturlig språk, og svar på spørsmål om resultatene. Dette kommer til å bli virkelighet, virkelig snart, og det kommer til å være utrolig nyttig.
Fremtidens telefon
Telefoner i fremtiden vil sannsynligvis se veldig annerledes ut enn telefoner i dag. De kan være buede. De kan være modulære. Du kan samhandle med dem ved å bruke augmented reality-briller. Den viktigste forskjellen vil imidlertid være intelligens. Funksjonene beskrevet her vil forvandle enhetene våre til kraftige veiledere og hjelpere.
Det er for øyeblikket et opphetet armløp Microsoft vs Google - Hvem leder det kunstige intelligensrittet?Kunstig intelligens forskere gjør konkrete fremskritt, og folk begynner å snakke alvorlig om AI igjen. De to titanene som leder kunstløpet er Google og Microsoft. Les mer i dyp læringsteknologi. Bivirkningen er at disse teknikkene utvikler seg utrolig raskt, og de vil være på markedet raskere enn du kanskje tror.
Er du spent på smartere smarttelefoner? Bekymret for personvernkonsekvensene? Gi oss beskjed i kommentarene!
Bildetillegg:Menneskehjerne av Mopic via Shutterstock
Andre er en skribent og journalist med base i Sørvest, og garantert å være funksjonell opptil 50 grader Celcius, og er vanntett til en dybde på tolv meter.