Aan knopjes draaien is al lang voorbij en gooi die afstandsbediening ook maar uit het raam. Spraaktechnologie lijkt de interface van de toekomst. De razendsnelle ontwikkeling hiervan roept vragen op waarover we als samenleving nog nauwelijks hebben nagedacht. Hoogste tijd om dat wel te gaan doen, stelt Serf Doesborgh. Hij is een van de auteurs van het rapport Hoor wie het zegt, dat vandaag in het Engels verschijnt.
Typen, klikken, en swipen. Jarenlang hebben wij de taal van de computer moeten leren en nu leert voor het eerst de computer onze taal. Dat is een veel gehoorde belofte bij de ontwikkelaars en aanbieders van spraaktechnologie. Het GPS-systeem in je auto, de spraakassistent op je telefoon, de smartspeaker in je huis. Het zijn allemaal vormen van technologie die op een intuïtievere manier met ons beloven te interacteren: via spraak. Ontwikkelaars presenteren spraaktechnologie dan ook als de interface van de toekomst.
'Spraaktechnologie maakt onze stem toegankelijk als nieuwe databron voor bedrijven'
Hoe goed spraaktechnologie luistert en begrijpt wat je zegt, is afhankelijk van hoe duidelijk je praat, omgevingsgeluid, je accent en welke taal je spreekt. Met andere woorden: in welke mate spraaktechnologie je begrijpt, wordt bepaald door hoe ‘helder’ je zelf articuleert, maar hangt ook af van hoeveel data er over een taal, dialect, of accent beschikbaar zijn. Spraaktechnologie is dus lang niet voor iedereen toegankelijk.
Wat door spraaktechnologie wel toegankelijk wordt, is onze stem als nieuwe databron voor bedrijven. Door computers te laten luisteren, geven we ze onze stem. Stemmen bevatten veel informatie. In een telefoongesprek hoor je al snel of iemand een man of een vrouw is, een kind of volwassene, vrolijk of depressief, en of iemand gedronken heeft of niet. Bovendien herkennen we via de stem ook met wie we spreken.
Wetenschappers en bedrijven werken eraan om dit soort informatie ook uit onze stem te halen. Op dit moment wordt zelfs al geprobeerd om via de stem symptomen van COVID-19 te signaleren. Doordat de ziekte invloed op de longen en luchtwegen heeft, kunnen veranderingen in het stemgeluid ontstaan die opgevangen en geanalyseerd kunnen worden. Onze stem als nieuwe databron levert privacyrisico’s op, en de vraag: wat geef ik weg als ik iets zeg?
'In de VS commanderen kinderen op school hun vriendjes soms al net zo als thuis hun smartspeaker'
Een stem is meer dan een communicatiemiddel. Ze beïnvloedt ons gevoel en gedrag. In een experiment met spraaktechnologie omschreven Nederlandse senioren het hebben van een smartspeaker als: ‘het hebben van een vriendje in huis’. In Amerika, waar een kwart van de bevolking al een smartspeaker heeft, bleken sommige kinderen op school hun klasgenootjes net zo te commandeerden als thuis hun smartspeaker. Een baby sprak als eerste woordje niet papa of mama, maar Alexa, de naam van de spraakassistent van Amazon. Het onderscheid tussen mens en machine wordt steeds moeilijker te maken. Google demonstreerde in 2018 al zijn DUPLEX-functie waarbij een spraakassistent reserveringen kan maken bij een restaurant. De assistent klonk zo menselijk dat ‘hij’ niet meer te onderscheiden was van een mens.
Deze voorbeelden roepen ethische vragen op. Welke mate van toeschrijving van menselijkheid vinden we acceptabel of zelfs welkom? En op welk moment gaat de verwarring duidelijk te ver? Hoe kan spraaktechnologie op een menselijke manier worden ingezet met voldoende aandacht voor belangrijke waarden als inclusiviteit, privacy, betrouwbaarheid en autonomie?
Een stem voor mens en machine
In het rapport Hoor wie het zegt, roept het Rathenau Instituut op tot het starten van een ethische dialoog over spraaktechnologie. Zo moeten er afspraken komen over het recht op menselijk contact en hoe voorkomen kan worden dat spraaktechnologie mensen in verwarring brengt.
Het is belangrijk dat de overheid, bedrijven en burgers samen bijdragen aan spraaktechnologie die onze samenleving en sociale relaties niet verschraalt, maar juist verrijkt. Spraaktechnologie kan taken overnemen zoals het uitschrijven of vertalen van gesprekken, het beantwoorden van algemene vragen, of het verifiëren van een gebruiker met behulp van stemanalyse. Daarnaast kan het de digitale wereld toegankelijker maken voor groter groepen mensen.
Daarbij moeten we dus oog blijven houden voor maatschappelijke en ethische vraagstukken. Alleen op die manier geven we zowel de technologie als de mensen een stem.
Deze column van Serf Doesborgh verscheen eerder op iBestuur.nl.
rapport
Gerelateerde content:
Rathenau Instituut stelt 10 ontwerpeisen aan de digitale samenleving
Digitalisering
22 oktober 2020
Artikel
rapport
rapport