Nieuws
12 juli 2019 - Luc Meijs

Hey Google..? Het verhaal achter het afluisteren van Google Home gesprekken

We weten allemaal dat Alexa van Amazon laatst in het nieuws was omtrent het opnemen van privégesprekken. Het was zelfs een feit dat de Amazon Echo deze gesprekken zelfs verstuurd had naar een willekeurig persoon in het telefoonboek. Hier werd door het bedrijf benadrukt dat het apparaat enkel begint met opnemen indien het wake-up woord ‘’Alexa’’ gesproken wordt. En toch kwam Amazon in opspraak vanwege het opnemen van privégesprekken zonder deze voorwaarde. Na een onderzoek van het Belgische VRT NWS is het nu de beurt aan Google om hun verklaring af te leggen. Via Google Home worden ook gesprekken ‘’incidenteel‘’ opgenomen.
 
Privégesprekken, wat zijn dat?
 
Volgens een rapportage van het Belgische VRT NWS, neemt de Google Home ook gesprekken op buiten het commando ‘’Hey Google‘’. Deze gesprekken komen via de servers van Google bij verschillende (externe) vertalers terecht die dit soort berichten voor de Amerikaanse gigant vertalen om zo de AI van het apparaat te verbeteren. In de videoreportage van VRT NWS komen ze in contact met één van de vele vertalers voor Google, deze externe vertaler gaat onder de schuilnaam ‘Peter’. Peter luisterde in dit geval naar Nederlands en Vlaamse opnames vanaf de Google Assistant, ongeveer een 1000 audiofragmenten per week. Van al deze opnames waren er 153 ‘’ per ongeluk ‘’ opgenomen, deze onfortuinlijke opnames betroffen gesprekken die echt privé waren en totaal niet afgeluisterd mochten worden. Peter geeft aan dat hij in één van de audio-opnames een vrouwelijke stem in nood hoorde en zei hij dat er fysiek geweld in het spel was, ‘’En dan worden het echte mensen waarnaar je luistert, niet alleen stemmen'', zegt de vertaler.
 

Privacy policy
 
Tech-giganten als Google, Microsoft en Amazon hebben herhaaldelijk aangegeven dat het vertalen van audiofragmenten via een slimme assistent, essentieel is voor het ontwikkelen van hun eigen spraakherkenningstechnologie. De bedrijven geven ook aan dat enkel een minuscuul deel van alle opgenomen gesprekken, namelijk 0.2%, door menselijke vertalers worden beluisterd en omgezet. Wat ook benadrukt wordt is dat deze gesprekken nooit gevoelige of privé-informatie bevatten van de opgenomen personen in kwestie. Dit klinkt op papier natuurlijk prima, echter roept het direct vragen op. De gebruiker van een slimme assistent kan nog altijd zelf privé-informatie uitspreken tijdens een opname, dit is simpelweg niet tegen te houden door het apparaat. In de privacy policy van de Google Home staat ook nergens dat men gebruikmaakt van menselijke vertalers of dat het mogelijk is dat de Google Home per ongeluk opnames kan maken.
 

“You have to be very specific on what you’re implementing and how,”. “I think Google hasn’t done that because it would look creepy.” - Michael Veale
 
Micheal Veale, een onderzoeker van technologische privacy bij het Alan Turing Institute in London, zegt dat dit gebrek over explicite toestemming van gebruikers over audiofragmenten niet in overeenstemming komt met de normen die zijn vastgelegd in de GDPR-voorschriften van de EU. Het weerhouden van deze informatie naar de gebruikers toe kan nog wel eens flinke juridische gevolgen hebben voor de Amerikaanse Gigant.
 

Externe vertalers
 
Mensen zoals Peter de vertaler zijn er niet in kleine aantallen. Google heeft over de hele wereld mensen in externe vertaaldienst die allemaal een 1000 gesprekken per week te horen krijgen, deze gesprekken worden ook nog eens in het orignele format aangeleverd zonder vervorming van stemmen. Dit oppert dan ook de vraag, hoeveel gesprekken worden daadwerkelijk opgenomen/geluisterd, worden deze gesprekken bewaard of niet en hoe lang, wat gebeurt er met gevoelige informatie of audiofragmenten waarin fysiek geweld te horen is? VRT NWS heeft deze vragen dan ook aan Google (België) gesteld en het bedrijf kwam met de volgende verklaring;
 
We werken samen met taalexperts over de hele wereld om spraaktechnologie te verbeteren door transcripties te maken van een klein aantal audiofragmenten. Dit werk is van cruciaal belang voor de ontwikkeling van technologie die producten zoals de Google Assistant mogelijk maakt. Taalexperts beoordelen slechts ongeveer 0.2% van alle audio fragmenten, die niet worden gekoppeld aan persoonlijk identificeerbare informatie. - Michiel Sallaets, Google België.
 
Al blijkt dat het vinden van mensen uit de audiofragmenten helemaal niet moeilijk is. VRT NWS heeft met gemak een aantal personen gevonden uit relatief onschuldige fragmenten en benaderde deze met hun eigen audio-opnames die ‘’per ongeluk’’ waren opgenomen. De volledige video rapportage kun je hieronder bekijken.
 
Dit hele euvel baart mij toch wel wat zorgen omtrent de persoonlijke privacy. Ja, we delen vanalles met de wereld, echter is er ook privé of gevoelige informatie die we enkel binnen een bepaalde kring of helemaal niet willen delen. Hiervoor is de fabrikant nog niet doorzichtig genoeg qua regelgeving en algemene voorwaarden. Google heeft naar aanleiding van deze rapportage een onderzoek gestart naar de anonieme vertaler die volgens de fabrikant hun eigen security policy geschonden zou hebben, karma much..?
 
Bron: VRT NWS