Quand les assistants vocaux s’enrouent

© isopix
Jérémie Lempereur Journaliste Trends-Tendances - retail, distribution, luxe

Les géants du Net ne cessent de perfectionner leurs assistants vocaux pour permettre à ces derniers de répondre à des demandes toujours plus précises. Mais ce business pourrait bien avoir une portée plus limitée que prévu. Coup de projecteur sur les contraintes liées à la voix.

“Ok Google, demande à Trends-Tendances les dernières infos économiques “, ” Alexa, allume la télévision “, ” Dis Siri, ajoute des spaghettis à ma liste de courses “… Et si demain, notre quotidien était fait de toutes ces petites injonctions vocales ? D’après l’entreprise d’analyse publicitaire comScore, entre un tiers et la moitié des accès au Web pourraient en effet se faire par la voix d’ici 2020. Alors les géants de la tech ne cessent de perfectionner leurs assistants personnels. Google et Google Home, Amazon et Alexa, Apple et Siri, Microsoft et Cortona, etc. : tous tentent d’inonder les foyers de leurs enceintes connectées. Leur promesse ? Un quotidien simplifié et des réponses personnalisées, au plus près des besoins.

S’ils sont encore loin d’avoir conquis le grand public, ces assistants personnels ont déjà touché le coeur de plusieurs marques. Dans les travées de l’IFA ( ce méga-salon de l’électronique grand public qui se tient chaque année à Berlin, Ndlr), chaque nouvel appareil connecté annonce fièrement à qui il fait allégeance. A Google ? A Amazon ? Aux deux ? ” Les assistants virtuels vont atteindre une phase d’adoption par le grand public d’ici deux ou cinq ans “, prédit le vice-président de la recherche au sein du cabinet Gartner. Ce dernier estime que la technologie traverse une période ” d’attente et d’excitation “, généralement suivie d’une légère retombée précédant la véritable démocratisation.

Sans trancher la question de savoir si la voix va parvenir à s’imposer dans nos vies, on peut déjà à ce stade relever toute une série de limites et de contraintes susceptibles de fragiliser ce mode d’interaction.

Des capacités techniques encore limitées

Il y a tout d’abord ce gap assez important entre la promesse faite par les constructeurs et la capacité technique des assistants vocaux. ” Si leur NLP ( Natural Language Processing, soit la capacité de comprendre le sens derrière une phrase, Ndlr) est très poussée, elle n’est toutefois pas encore au point, assure Sophie Gallay, consulting manager spécialisée en intelligence artificielle au sein de l’agence Artefact. On ne peut pas demander n’importe quoi. L’utilisateur rencontre assez rapidement les limites de l’outil. ” Il est de fait encore impossible de converser librement avec son assistant personnel. De plus, il suffit qu’il y ait trop de bruit ou que plusieurs personnes parlent en même temps pour que l’assistant déraille, se trompe ou fournisse une réponse non pertinente. ” A l’heure actuelle, les assistants vocaux peuvent répondre à des demandes bien circonscrites, embraie Hugues Bersini, directeur du laboratoire d’intelligence artificielle de l’ULB. On pense, par exemple, à des horaires de voyage. Dès lors que les informations que l’on traite sont présentes dans une base de données, c’est assez simple. Les commandes très stéréotypées sont faciles à comprendre, mais dès que l’on se dirige vers un dialogue, les assistants vocaux montrent leurs limites. On est encore très loin du test de Turing qui veut que la machine puisse vous confondre. ”

Sophie Gallay (agence Artefact)
Sophie Gallay (agence Artefact)” Il faut que les marques sautent le pas et développent leur application vocale. Le problème, c’est que cela coûte cher pour une technologie très récente et dont le taux d’équipement n’est pas monstrueux. “© pg

Une offre peu développée

Une deuxième contrainte liée aux assistants vocaux réside dans le décalage qui existe à ce stade entre l’offre technologique et l’offre de services. Concrètement, si plusieurs assistants vocaux sont aujourd’hui disponibles sur le marché, très peu de marques ont développé une application vocale compatible avec l’un ou l’autre appareil. Le risque est donc de se retrouver avec son enceinte connectée sans rien pouvoir en faire. Demander la météo une fois, c’est bien. Mais cela peut se révéler lassant à la longue… ” Les enceintes connectées permettent de faire très peu de choses, confirme la responsable d’Artefact. Je peux commander une ampoule Philips, lancer mon Spotify, mais je ne peux pas prendre rendez-vous chez Bouygues Telecom. Il faut que les marques sautent le pas et développent leur application vocale. Le problème, c’est que cela coûte cher pour une technologie très récente dont l’expérience n’est pas incroyable et dont le taux d’équipement n’est pas monstrueux. C’est donc une prise de risque que pas mal de marques ne souhaitent pas prendre à ce stade. ”

Une liberté de choix menacée

Outre ces limites techniques, on peut également citer des contraintes inhérentes au business de la voix en tant que tel. Des contraintes qui pourraient entamer la confiance des consommateurs. Il y a tout d’abord la question de la recommandation. Alors qu’une recherche sur Google fait apparaître plusieurs résultats, une demande vocale n’induit qu’une seule réponse. Sommes-nous dès lors prêts à accepter que Google et Amazon décident – par le jeu d’algorithmes pour le moins obscurs, mais surtout de marques ayant déboursé le plus pour être recommandées – ce qu’il est bon de nous proposer ? ” Amazon commercialise auprès des marques le fait que les consommateurs renoncent à préciser le nom de la marque, explique Brice Le Blevennec, co-CEO d’Emakina. La plupart commandent simplement ‘de la poudre à lessiver’. Pour Amazon, il s’agit de se tourner vers Dash, par exemple, en assurant à la marque de lui envoyer autant de consommateurs contre rémunération. Le problème, c’est que personne ne fait ses courses par la voix. ”

La question du choix se pose aussi concernant l’information. Reporters Sans Frontières estimait récemment que les assistants vocaux pouvaient être ” un risque pour le pluralisme de l’information “. ” L’assistant intelligent sélectionne les sources d’informations et limite le nombre de résultats parfois à un seul, selon des critères qui restent aujourd’hui largement opaques “, s’inquiète l’ONG.

Voilà qui fait dire à Sophie Gallay que la voix ne remplacera jamais les autres moyens d’interaction. ” Il s’agira simplement d’un élément de plus dans le parcours du consommateur, dit-elle. Ce n’est pas pour rien si les enceintes connectées disposent de plus en plus d’écrans intégrés. ” Des écrans permettant au passage d’insérer de la publicité…

A qui appartiennent les données ?

Brice Le Blévennec, co-CEO d'Emakina
Brice Le Blévennec, co-CEO d’Emakina” La voix, c’est fini. Elle est réservée à la transmission des émotions. Mais pour l’outil, c’est beaucoup trop lent et compliqué, limite moyenâgeux. “© belgaimage

Un autre paramètre pourrait bien mettre à plat la confiance des consommateurs : la question de l’utilisation des données personnelles. Certes, nos recherches sur Internet n’ont jamais rien eu de confidentiel. Mais la mise en réseau et la commande vocale de tous nos appareils ménagers vont permettre de récolter encore davantage de données sur nos modes de vie. ” Cela n’est pas lié aux assistants vocaux en particulier, précise Hugues Bersini. Que le contrôle se fasse par la voix, par écran ou par télécommande n’est pas la question. C’est la maison connectée en tant que telle qui est un puits de données. Reflet de notre vécu, ces données pourraient être utilisées à des fins d’enquête. Google et Amazon pourraient par ailleurs les utiliser de manière à nous profiler encore davantage. ”

La question est donc de savoir à qui appartiennent toutes ces données. Prenons un exemple concret. Vous rentrez chez vous, vous allumez la télévision par la voix et vous zappez de la même manière. Qui est propriétaire des traces que vous laissez ? Le fabricant de votre télévision ? Google, avec qui ce dernier a noué un partenariat ? Les chaînes de télé seraient sans aucun doute très intéressées par les données concernant le temps passé sur tel ou tel programme… ” C’est le fabricant qui recueillera les données les plus poussées, explique la responsable d’Artefact. Dans le cas d’une machine à laver, par exemple, il pourra connaître la proportion de programmes longs et de programmes courts et ainsi adapter ses machines. En fonction des demandes des clients, il pourra en outre ajouter telle ou telle fonctionnalité. Google, quant à lui, ne s’intéressera qu’aux phrases prononcées par les consommateurs. Ont-elles été comprises ? Il s’agira pour lui d’améliorer sa technologie de reconnaissance vocale. ”

Des usages de niche

Si les limites techniques et la question de la liberté de choix pourraient bien être résolues à l’avenir, il se pourrait bien que la voix ne perce pas… parce que c’est la voix. Ce moyen d’interaction est a priori plus simple et plus naturel d’un point de vue théorique, mais il est quasiment certain que nous aurons toujours besoin d’un visuel pour toute une série de tâches. ” Il restera plus simple d’ouvrir une application mobile pour comparer d’un coup d’oeil les horaires de train et acheter son billet “, assure Sophie Gallay.

Brice Le Blévennec, lui, est même plus tranché. S’il est persuadé que la voix parviendra à se frayer un chemin dans les usages des consommateurs, le co-CEO d’Emakina est certain qu’elle ne remplacera jamais ni l’écran, ni la souris. ” Elle sera dédiée à des usages de niche, estime-t-il. Ouvrir toutes les lumières d’un coup, demander les prochaines étapes d’une recette quand je suis en train de cuisiner, demander mon chemin quand je suis en train de courir, etc. Mais la voix ne sera pas la grande révolution que l’on dit. ” Il suffit d’après notre interlocuteur d’observer les jeunes et l’usage qu’ils font de l’écrit pour s’envoyer des messages. ” La voix, c’est fini, dit-il. Elle est réservée à la transmission des émotions. Mais pour l’outil, c’est beaucoup trop lent et compliqué, limite moyenâgeux. ”

Se pose ensuite un gros problème de confidentialité, estime notre interlocuteur. ” Les gens se plaignent déjà quand plusieurs personnes téléphonent l’une à côté de l’autre. Imaginez ce que cela donnerait si tout se faisait par la voix. Il n’y aurait aucune vie privée. Vous vous imaginez demandez à Alexa de vous lire votre agenda alors que vous avez rendez-vous avec votre amant ? “

Brice Le Blévennec soulève enfin la question de l’archivage. La voix rend en effet impossible l’archivage de nos recherches pour pouvoir les retrouver ensuite. ” Les paroles s’envolent, les écrits restent… ”

Pour percer durablement, les assistants vocaux devront donc créer de nouveaux usages et apporter une alternative plus simple à ce qui existe aujourd’hui. Dans le cas contraire, ils pourraient bien ne jamais trouver leur voie…

Des partenariats en veux-tu en “voix”-là !

Carrefour et Google

Le distributeur français a signé en juin dernier un accord de collaboration avec Google. Un accord qui doit permettre aux clients de Carrefour d’utiliser dès l’année prochaine l’assistant vocal de Google pour commander leurs courses, qui seront livrées soit à domicile, soit dans un point de retrait. Il sera donc possible de faire ses courses chez Carrefour avec n’importe quel appareil embarquant Google Assistant ( d’après Google, 500 millions d’appareils à travers le monde sont compatibles avec son assistant intel-ligent). Grâce à ce parte-nariat, les consommateurs auront aussi accès aux produits vendus par Carrefour via Google Shopping, une plateforme d’achats en ligne pour l’instant surtout consacrée aux produits technologiques.

Bosch et Amazon

Le géant mondial de l’électro a noué un partenariat avec Amazon en vue de connecter ses différents appareils à l’assistant vocal de la firme de Seattle. Plus de 200 produits de la marque peuvent déjà être contrôlés par la voix : machines à laver, lave-vaisselles, aspirateurs, etc. ” Imaginez que vous ayez les deux mains dans la pâte à cake et que vous vouliez lancer votre four, explique Gabriel Wetzel, CEO de Bosch Smart Home. Il vous suffit de lancer : ‘Alexa, préchauffe le four à 180 degrés.’ Et votre four se met à la bonne température. Imaginez maintenant que quelqu’un sonne à la porte. Personne ne voudrait toucher un écran dans pareil cas. Il suffit de dire : ‘Alexa, montre-moi l’image de la caméra extérieure’. Et Echo Spot vous montre qui est à la porte. ”

“Les Echos” et Google

Le quotidien économique français s’est allié à Google pour proposer un condensé de l’actualité via l’enceinte connectée Google Home. Trois phrases permettent d’accéder à l’application vocale du journal : ” Parler avec Les Echos “, ” Mets-moi en relation avec Les Echos ” ou encore ” Donne-moi Les Echos “. Dans sa première version, l’application permet d’écouter les principaux titres de l’information économique, hiérarchisés par la rédaction, ou d’avoir un aperçu des dernières infos.

Vous avez repéré une erreur ou disposez de plus d’infos? Signalez-le ici

Partner Content