Stemmen kan bli din «nøkkel» til alt. Den norskbritiske startupen er allerede innenfor dørene hos noen av verdens ledende selskaper.
Annonse
I snart to år har de holdt det gående med finansiering fra egen lomme, spedd på med støtte fra Innovasjon Norge og EU. Nå har My Voice hentet 25 millioner norske kroner fra internasjonale investorer - en viktig milepæl for duoen Ivar Hauge Line og Nicola Andelic, og deres amerikanske medgründer, den anerkjente stemmegjenkjenningsteknologen David Morris Horowitz.
-- Vi er sikre på at det David har jobbet med, og som vi nå tar til markedet, er veldig unikt, sier en meget fornøyd Ivar Hauge Line da han møter Shifter for å fortelle om emisjonen og utviklingen i selskapet.
Gründerteamet har frem til nå kjørt i såkalt «stealth mode», og i stor grad holdt seg unna medienes søkelys. Nå letter de på sløret.
Annonse
MIT-teknologi
Den nevnte Horowitz har jobbet med «voice biometri» i over 15 år, helt siden han tok doktorgrad under den kjente professoren Dennis Klatt på MIT -- mannen som skapte stemmen til Stephen Hawking. Der leverte han avhandlingen med det ikke helt enkle navnet «Aspects of the Human Factors and Psychophysics of Speech Recognition and Audition in Rehabilitation Engineering and Clinical Medicine.”
Teknologien bak My Voice er hans «hjertebarn», kall det gjerne livsverk. Horowitz har identifisert 41 karakteristikker i stemmen, som igjen er lagt inn i en avansert algoritme som gjenkjenner den som snakker.
-- Dette er unik kjerneteknologi, og David er ranket som nummer tre eller fire i verden innen dette fagområdet. Men han trengte noen som kunne være med å kommersialisere det, komplettere det han kunne, sier Hauge Line.
Annonse
Horowitz sitt prosjekt hadde blant annet blitt støttet massivt av EUs Horizon 2020-program. Og det var nærmest uendelig med muligheter og applikasjoner man kunne se for seg teknologien i bruk.
-- Han hadde ikke helt den kommersielle legningen. Det at noe funker i en lab, betyr jo ikke at det virker kommersielt. Det må funke hos kunden, sier Hauge Line, og det var der han og Nicola Andelic kom inn.
Annonse
Line har tidligere vært med å gründe en rekke selskaper, blant dem 90-tallsfenomenet Infostream, det som blir beskrevet som et av de første internettselskapene her til lands, og som etter hvert gikk på børs.
Annonse
Porsche-testet
Det nåværende prosjektet My Voice har vekket oppmerksomheten hos flere store selskaper. Ivar Hauge Line og Nicola Andelic har tidligere deltatt i den prestisjetunge akseleratoren Berlin1435, i et tidligere stemmestyringsprosjekt de var en del av, før de startet å samarbeide med Horowitz. Gjennom denne deltagelsen kom de tett på store selskaper som Hewlett Packard, Borsch, Daimler og Porsche.
Kontakten med Porsche førte senere frem til at teknologien til Horowitz ble stresstestet i den legendariske bilfabrikantens forsknings- og utviklingssenter i Stuttgart. Der ble «reaksjonstiden» for stemmeautentifiseringen presset ned til under ett sekund. Startupen har også kjørt demoer for Daimler og Audi.
Ivar Hauge Line legger ikke skjul på at han lenge har hatt en «crush» på Siri, men beskriver Apples stemmestyringsteknologi som «hyssing og tape» i starten, som trengte lang tid på å lære brukeren å kjenne. En rekke selskaper kniver nå i front for å ta stemmestyring og bruken av dette til et mer modent nivå -- My Voice er blant disse.
-- Stemmestyringsteknologi må være friksjonsløst hvis man skal klare å gjøre det kommersielt, understreker Hauge Line.
Han beskriver en fremtid der passordenes tid er forbi, og vi bruker stemmen til å identifisere oss selv i alle mulige slags sammenhenger.
Ønsker seg Tesla
Foruten å demonstrere teknologien under stresstester i Porsches laboratorium i Tyskland, har de kjørt demoer for andre bilfabrikanter som britiske Aston Martin. Men Hauge Line og teamet har en fet fisk de har lyst til å lande - og han heter Elon Musk.
-- Foreløpig er vi for små til å være synlig for Tesla, men de hadde vært midt i smørøyet for oss. Det krever tid og posisjonering, og vi må bevise at dette virker gjennom de andre vi nå samarbeider med.
Konkurrentene i det globale markedet er selskaper som Nuance, Agnitio, Auraya, Validsoft og Voice Trust.
-- Nuance har for eksempel vært flinke til å kommersialisere teknologien og posisjonere seg for fortsatt å være store i markedet. Så langt er de «frace dependent», at du bare kan bruke visse setninger for at stemmegjenkjenningen skal virke. Det er ikke friksjonsfritt, slik vi vil ha det, sier Hauge Line.
Han viser til hvordan målet er at alt skal skje naturlig, at brukerne ikke engang skal måtte tenke på systemets innlæring av at «du er du». Som i bileksempelet handler det om at alle om bord i en bil på kort tid får verifisert sine profiler, og det gir grunnlag for hvem som får styre teknologien i bilen.
-- Det ultimate målet er at alle skal kunne eie sin egen informasjon, ikke være avhengig av brukernavn og passord hos den enkelte aktør. De kan i stedet ha en unik og sikker profil hvor enn de går, der de identifiserer seg med stemmen, enten det er i banken, butikken eller i andre sammenhenger.
Første kunde
For My Voice handler det nå om å ta intensjonsavtaler og piloter til større kommersielle avtaler.
Selskapet går imidlertid bredt ut når de ser etter samarbeidspartnere, og fokuserer også på sektorer som bank og telekom. Det er imidlertid en annen bransje der biometrigründernes har funnet sin første store kunde. Nylig signerte de en partneravtale med en større chip-produsent, som innebærer at teknologien kan bli å finne i kommunikasjonsenheter hos verditransportørene i Brinks. Selskapet er verdens største «cash management»-selskap og opererer i over 100 land, med 60.000 operatører og 11.500 pansrede biler. Brinks har høye krav til sikkerhet og autentifisering.
-- De ansatte opplever ofte å bli ranet, truet eller holdt som gissel. Vår teknologi kan sikre en friksjonsfri autentifisering uten koder og passord, når de skal utløse en «silent alarm». Den kan også oppdage nervøsitet i stemmen, og «heise flagg» på bakgrunn av dette.
Effektiv hverdagsteknologi
Hauge Line viser imidlertid til en rekke mindre dramatiske og mer hverdagslige områder som de stemmegjenkjennende algoritmene kan brukes. Som i kode- og nøkkelfri sykkellåser. Eller når du skal styre stereoanlegget i bilen, og du vil at far eller mor og ikke ungene skal bestemme musikken.
-- Tradisjonelt stemmegjenkjenning gjøres med tidkrevende maskinlæring basert på statistiske modeller. Våre algoritmer (ACV eller Acoustic Correlates of Voice) modellerer stemmen fysiologisk i tillegg til vår egen GMM (Gaussian mixture model). Det betyr at vi kan gjenkjenne uavhengig av innhold, språk, dialekt eller grammatikk, sier Hauge Line.
Han hevder at teknologien relativt sett er ti prosent sikrere i autentifiseringen enn lignende løsninger. Hauge Line viser til at My Voice har en egen «anti spoofing» og «playback detection» som betyr at det er svært vanskelig å hacke eller kompromittere «passordene».
Kjente rådgivere
De utenlandske investorene i såkornsrunden er i hovedsak «family offices» og enkeltstående teknologiinvestorer. Når runden lukkes i disse dager, vil et større VC-fond trolig også henge seg på, selv om runden egentlig var fulltegnet. My Voice ønsker de andre store VC-miljøene om bord i neste runde, som de forventer vil skje om seks til åtte måneder igjen.
Samtidig har My Voice fått inn noen tunge navn som rådgivere -- blant dem den tidligere Apple-toppen Byron Han. Han var direktør i selskapets avdeling for «Special Projects» i en årrekke. Av kjente navn fra det norske tech-miljøet i rådgiverkorpset er Villoid-gründer Jeanette Dyhre Kvisvik.
Planen nå er å utvide det tekniske teamet og gå nærmere inn i hvordan stemmegjenkjenningsteknologien kan implementeres i ulike enheter. I denne sammenhengen ser de etter kloke hoder med kompetanse innen stemmestyring, kunstig intelligens og DSP. Teamet vil i all hovedsak fortsatt være i London, der selskapet i dag har sin hovedbase med åtte ansatte.