Veelgestelde vragen
Technologie die ervoor zorgt dat computers menselijke spraak kunnen herkennen, kunnen interpreteren en ook zelf kunnen spreken – samengevat als spraakherkenning, spraakinterpretatie en spraaksynthese (zie hoofdstuk twee in het rapport).
Niets is menselijker dan onze spraak. In onze gesprekken drukken we onszelf uit en ontwikkelen we omgangsvormen. Het is daarom van belang om spraaktechnologie in juiste banen te leiden. Daarnaast komt spraaktechnologie dichtbij ons: we installeren spraaksystemen in onze woonkamers en op onze kantoren. In de verkeerde handen is een spraakcomputer een surveillance-instrument waarmee onze geheimen ontsloten kunnen worden. Je kan zelfs stemmen klonen en iemand woorden in de mond leggen. Bovendien staat onze zelfbeschikking op het spel. Spraaktechnologie functioneert steeds meer als een gids die de gebruiker door de digitale wereld leidt. Maar deze gids wordt gemaakt door bedrijven die hun eigen belangen nastreven, en die sluiten niet per se aan bij de belangen en wensen van burgers.
De studie roept daarom op tot het ontwikkelen van ethische spraaktechnologie die, onder meer, inclusief is, ons privéleven respecteert en aangeboden wordt op een gezonde markt. De studie roept ook op tot maatschappelijke dialoog en politiek debat. De opkomst van spraaktechnologie brengt vragen met zich mee die we samen moeten beantwoorden. Willen we bijvoorbeeld gedisciplineerd worden door een spraakassistent? Voorheen zou deze vraag fantasierijk hebben geklonken, maar vandaag is hij reëel. Computers zijn gaan praten: tijd voor een goed gesprek.
De markt voor spraaktechnologie groeit momenteel snel. Zo heeft 6% van de Nederlandse huishoudens in 2018 een luidspreker aangeschaft die je met spraak kunt bedienen, en groeide dit percentage in 2019 tot 19% (Multiscope, 2020). En in Amerika en China gaan de ontwikkelingen nog harder (Kimmich, 2019). Volgens sommige analyses lijkt de opkomst van slimme luidsprekers daar zelfs sneller te gaan dan destijds de opkomst van mobiele telefoons – een apparaat dat je tegenwoordig ook steeds vaker met je stem kunt besturen (Kinsella & Mutchler, 2018). (Zie voor de gehele bronvermelding de publicatie.)
Ja, dit rapport over spraaktechnologie is het tweede rapport in de reeks over immersieve technologieën. Eind 2019 verscheen er al een studie naar Virtual Reality: 'Verantwoord virtueel - Bescherm consumenten in virtual reality'. Woensdag 21 oktober volgde de publicatie over augmented reality: Nep echt - verrijk de wereld met augmented reality.
Met de doorbraak van immersieve technologieën gaat de digitale samenleving een nieuwe fase in. De fysieke en digitale wereld raken meer dan ooit met elkaar verknoopt. Dat roept urgente maatschappelijke en politieke vragen op. Het Rathenau Instituut publiceerde daarom een manifest met tien ontwerpeisen aan de digitale samenleving van morgen.
Tijdens de Dutch Design Week organiseerden we een online talkshow: Enriching Reality: Designing human-centered AR, VR and Voice applications (Engelstalig gesprek). Tijdens deze talkshow ontvingen coördinator Rinie van Est en onderzoeker Jurriën Hamer inspirerende gasten, waarmee besproken werd hoe AR, VR en Voice de levens van mensen raken – en onder welke voorwaarden ze de samenleving kunnen verrijken. Kijk de talkshow terug op de website van de Dutch Design Week.
Op 26 november 2020 (15.30-17.00 uur) vindt ons jaarlijkse Rathenau Live evenement plaats. Dit jaar is het een online evenement dat volledig in het teken staat van Virtual Reality, Augmented Reality en Spraaktechnologie. Gezamenlijk gaan we in gesprek en ervaren we met elkaar wat deze technieken doen met onze perceptie van onszelf, anderen en de wereld om ons heen. Aanmelden en meer informatie op de evenementpagina.
Een computersysteem dat spraakherkenning, spraakinterpretatie en/of spraaksynthese kan uitvoeren, noemen we een spraaksysteem. Er zijn op de markt verschillende soorten spraaksystemen beschikbaar. De belangrijkste is de spraakassistent, een spraaksysteem dat doorgaans een breed aanbod van taken uit kan voeren. Bekende voorbeelden zijn Alexa van Amazon en de spraakassistent van Google. Deze assistenten kunnen op allerlei digitale apparaten, zoals een mobiele telefoon, een desktop pc, of een slimme luidspreker – een smart speaker – geïnstalleerd worden. De verkenning kijkt daarnaast ook naar andere spraaksystemen, zoals transcriptiesoftware en navigatiesystemen.
Spraakassistenten worden ook wel cognitieve of virtuele assistenten genoemd. Deze digitale systemen kunnen ook taken uitvoeren, en zijn doorgaans in staat om tekst te interpreteren. Ze hoeven niet gebaseerd te zijn op spraaktechnologie. In deze verkenning richten wij ons op systemen uitgerust met spraaktechnologie. We zullen daarom de term ‘spraakassistent’ gebruiken.