Att prata med sin mobiltelefon för att ringa upp någon, få karthänvisningar eller diktera ett sms blir allt vanligare. Men att tala med sina prylar har fått ytterligare ett uppsving av uppkopplade produkter som smarta högtalare och heminredning. Med ett enkelt kommando kan man släcka ljuset, sätta på musik eller få reda på hur vädret är.
För techjättarna är det här bara början på en röstrevolution och Amazon, Apple och Google har alla släppt sin egen smarta högtalare med tillhörande röstassistenter. Däremot har det inte gått att prata svenska med dem.
Under onsdagen rullar Google ut sin röstassistent Google Assistant på svenska. Först för mobilen men även för högtalaren Google Home senare under året när den lanseras i Sverige. Behshad Behzadi, chefsingenjör på Google, har ansvarat för teamet som har tagit fram assistentens röstförståelse och är baserad i Zurich, Schweiz, där resan för assistenten började.
Läs även: Svenska Yubico utmanas av Google: ”Bästa erkännandet man kan få”
Med användning av artificiell intelligens har den utvecklats att förstå inte bara dialekter, uttryck och skämt, utan även kunna förstå undermeningen av den informationen man är ute efter – till en viss grad.
”Behöver jag ha en jacka på mig i Stockholm imorgon?”, frågar Behshad Behzadi mobilen som svarar:
”Nej, det kommer inte vara kallt i Stockholm. Det kommer att vara soligt med en högsta temperatur på 27 grader.”
Behshad Behzadi pratar inte svenska men Di Digital har testat tjänsten innan lansering och när det gäller vädret är svaren liknande.
”Målet för ingenjörerna på Google är att göra algoritmen språkoberoende. Vi kodar inte speciellt för engelska för att sen behöva koda om det till exempelvis svenska. Maskininlärning hjälper mycket med det”, säger Behshad Behzadi.
Vi har tagit oss över ribban där vi tror att det kommer att fungera, men det är många olösta utmaningar som kvarstår i alla dessa steg
Processen för röstassistenten är att först göra om det användaren säger till text, förstå andemeningen av texten, koppla ihop den med rätt tjänst och sedan ta fram den information som användaren är ute efter.
”Vi har gjort många framsteg i alla dessa steg men jag skulle fortfarande säga att vi bara är i början av utvecklingen. Vi har tagit oss över ribban där vi tror att det kommer att fungera, men det är många olösta utmaningar som kvarstår i alla dessa steg. Så det finns en jobbgaranti för mig och mitt team för en tid framöver”, säger han skämtsamt.
Samtidigt varierar uttryck och kultur mycket mellan olika språk och det är inte alltid som de generella algoritmerna räcker till för att ge användare den bästa upplevelsen. Ett exempel är sättet vi använder oss av så kallat "naturligt språk".
”På engelska finns det 10 000 olika sätt att fråga hur vädret kommer att bli i Stockholm imorgon. På samma sätt kan skämt på engelska i Indien skilja sig från hur man säger det i Storbritannien, så där måste vi ha lokala lösningar”, säger Behshad Behzadi.
Läs även: Wallenbergs FAM och EQT Ventures går in i AI-doldisen Peltarion
För de flesta Iphone-användare är Apples Siri den förinställda röstassistenten men Behshad Behzadi hoppas att användarna själva ska jämföra skillnaderna och avgöra vilken de föredrar.
För att bygga röstassistenten har man bland annat använt kunskapen från att ha byggt Googles sökfunktion, som dagligen används för att få svar på miljarder frågor. Det är också en fördel när det gäller Googles position på marknaden, enligt Behshad Behzadi.
Och hur man ställer frågor via Google sök och röstassistenten skiljer sig inte mycket förutom att man ofta behandlar röstassistenten mer som en människa.
”Det är roligt att se hur folk interagerar med teknologi på ett nytt sätt. Man skulle ju aldrig skriva tack efter att ha fått upp resultaten när man skrivit en fråga men ofta hör jag folk som tackar röstassistenten efter ett svar”, säger han.
Läs även: ”Därför borde Googles röstassistent inte lämnat teststadiet”