Amazon: Des milliers d’employés écoutent les conversations enregistrées par l’assistante virtuelle Alexa

© getty

Une enquête de l’agence Bloomberg basée sur des témoignages qu’elle a recueillis révèle que certaines conversations des utilisateurs de l’assistante virtuelle Alexa d’Amazon sont écoutées par des employés de la société américaine.

Les enceintes connectées Amazon Echo ont débarqué en Europe, après avoir conquis des millions d’utilisateurs sur le marché américain. Leur principal atout se nomme Alexa, il s’agit de l’assistante virtuelle développée par le géant de l’e-commerce intégrée dans ses enceintes intelligentes et dans son application mobile. Sur le modèle des assistants virtuels intelligents Siri d’Apple ou Cortana de Microsoft, Alexa est censée répondre du mieux qu’elle peut à toutes les demandes vocales de l’utilisateur: recherche d’une recette, d’une chanson, vérification de la météo, du trafic…

On pourrait croire, ou plutôt espérer que ces échanges d’informations restent dans la sphère du privé. Ou du moins, que le “processus d’auto-apprentissage” de ce type d’intelligence artificielle était largement automatisé. Il n’en est rien. Il semble maintenant qu’une grande partie du travail d’amélioration de cet algorithme soit effectuée par des humains.

D’après une enquête réalisée par l’agence Bloomberg, qui s’est basée sur des témoignages de sept employés du géant de l’e-commerce, autant salariés qu’indépendants, certaines interactions avec Alexa enregistrées à domicile ou dans des bureaux sont ainsi décortiquées, dans le but d’améliorer ses qualités de reconnaissance vocale. Concrètement, des milliers de salariés dispersés dans des bureaux de la firme basés au Costa Rica en Inde ou encore en Roumanie, y tendent une oreille attentive afin d’isoler les termes les plus difficiles à comprendre par le logiciel dans les différentes langues utilisées. Un millier d’extraits sonores privés sont ainsi écoutés par chaque employé assigné à cette tâche sur une journée de neuf heures, rapporte Bloomberg. Les fichiers sont échangés par messagerie interne pour aider par exemple un collègue à mieux interpréter une phrase, précise BFMTV sur son site. Selon l’enquête de Bloomberg, certaines conversations font parfois l’objet de moqueries en interne.

Nous utilisons vos demandes à Alexa pour former nos systèmes de reconnaissance de la parole et de compréhension du langage naturel“, stipule de son côté Amazon dans une rubrique de questions/réponses sur son site, sans toutefois préciser que des employés en chair et en os sont amenés à écouter les conversations et à les annoter pour expliquer au système ce qu’il n’a pu comprendre par lui-même.

Dans les paramètres de confidentialité d’Alexa, l’entreprise offre aux utilisateurs la possibilité de désactiver l’utilisation de leurs enregistrements vocaux pour le développement de nouvelles fonctionnalités. Selon le site Web d’Amazon, aucun son n’est stocké sauf si le haut-parleur Echo détecte le mode réveil ou s’il est activé par erreur en appuyant sur un bouton.

“Qui a commis ce double meurtre?”

Selon un porte-parole d’Amazon cité par Bloomberg, seul un très petit échantillon des enregistrements d’Alexa est écouté. Il ajoute que les employés sont incapables de savoir d’où ils proviennent. “Nous prenons la sécurité et la confidentialité de nos clients très au sérieux. Nous utilisons un très faible échantillon des enregistrements d’Alexa pour améliorer l’expérience utilisateur“, se défend-il.

Une capture d’écran examinée par Bloomberg montre en effet que les enregistrements envoyés aux employés d’Alexa ne fournissent pas le nom et l’adresse complets d’un utilisateur mais sont associés à un numéro de compte, ainsi qu’au prénom de l’utilisateur et au numéro de série du dispositif.

Mais pour de nombreux observateurs, ces pratiques soulèvent de nombreuses questions et représentent une atteinte flagrante au respect de la vie privée et à la protection des données des utilisateurs.

Vous n’imaginez pas nécessairement qu’un autre être humain écoute ce que vous dites à votre assistant intelligent dans l’intimité de votre maison”, a déclaré à Bloomberg Florian Schaub, professeur à l’Université du Michigan qui a effectué des recherches sur les questions de protection de la vie privée liées aux logiciels intelligents. “Je pense que nous avons été conditionnés par l’hypothèse que ces machines ne font que de la magie. Mais le fait est qu’il y a toujours un traitement manuel“, constate-t-il.

Autre point sensible: si la plupart des conversations du quotidien sont assez banales, les auditeurs peuvent aussi être confrontés à des situations beaucoup plus délicates. Certains témoins racontent avoir entendu ce qui ressemblait clairement à une agression sexuelle. D’autres ont entendu des enfants appeler à l’aide, sans obtenir de réponse.

Amazon dit qu’elle a mis en place des procédures pour traiter ces enregistrements sensibles, mais les deux employés roumains qui ont témoigné disent de leur côté qu’ils ne reçoivent aucune consigne dans ce cas de figure et, qu’au contraire, on leur a dit qu’il n’appartenait pas à Amazon d’intervenir.

En novembre dernier, un juge a demandé à la société Amazon de lui fournir un extrait audio d’Alexa qui aurait enregistré la scène entière d’un double meurtre commis dans le New Hampshire en 2017. Amazon avait alors fait savoir via ses porte-parole que les enregistrements ne seraient pas livrés à la justice “sans une demande valide et contraignante”.

Le e-commerçant avait déjà été sollicité en 2017 pour une demande identique, dans le cadre d’une enquête sur un homicide ayant eu lieu en Arkansas. Amazon avait alors refusé de fournir les données personnelles par respect de la vie privée de ses clients. L’entreprise a finalement fourni les données, mais seulement après que le suspect et le propriétaire de l’enceinte Echo aient donné leur accord.

78 millions d’enceintes intelligentes

D’après Bloomberg, Amazon n’est pas la seule société à effectuer ce type d’écoute active des conversations de ses utilisateurs. C’est également le cas chez Google et chez Apple, qui disposent de leurs propres assistants virtuels Google Assistant et Siri.

Apple fait aussi appel à des employés pour évaluer si l’interprétation des demandes par l’assistant virtuel correspond à ce que la personne a réellement dit. Les enregistrements qu’ils examinent ne contiennent pas d’informations personnelles identifiables et sont conservés pendant six mois, selon Apple. Par la suite, les données sont dépouillées de leur information d’identification aléatoire, mais peuvent être conservées pendant de plus longues périodes afin d’améliorer la reconnaissance vocale de Siri.

Chez Google, certaines personnes peuvent accéder à des extraits audio à partir de l’assistant intelligent pour aider au développement et à l’amélioration du produit, mais il n’est associé à aucune information personnelle identifiable et l’audio est déformé, avance le géant du web.

Au niveau mondial, les consommateurs ont acheté 78 millions d’enceintes intelligentes l’an dernier, selon le bureau d’analyses Canalys. Des millions d’autres utilisent des logiciels vocaux pour interagir avec des assistants numériques sur leurs smartphones.

Vous avez repéré une erreur ou disposez de plus d’infos? Signalez-le ici

Partner Content