C'est à New York, à quelques mètres de la célèbre High Line, que Sonos a dévoilé ce qui s'apparente déjà à une petite révolution dans le monde de la tech. Un nouvel assistant vocal baptisé "Sonos Voice Control". Sa mission : préserver la vie privée de ses utilisateurs. Ses signes distinctifs : il a la voix de l'acteur Giancarlo Esposito (connu pour son rôle de Gustavo Fring dans Breaking Bad), se concentre sur la lecture audio, et a été conçu par des Français.

Conçu pour la musique, pas pour commander des pizzas

Le lancement d'un nouvel assistant vocal peut sembler déroutant compte tenu de la popularité des options existantes, mais Sonos ne fait pas dans la demi-mesure. La pépite californienne place la barre très haut en termes de confidentialité et de réactivité. "Amazon, Apple et Google développent des assistants vocaux à usage général, qui ont finalement un objectif très différent : ils veulent répondre à toutes les questions, aborder tous les sujets, confie Alice Coucke, ancienne directrice chez Snips - une start-up française acquise par Sonos en 2019 - et désormais cheffe de l'apprentissage machine chez Sonos. Pour obtenir une expérience utilisateur satisfaisante, les GAFAM sont presque obligés de collecter des données à grande échelle. Nous, nous adoptons une approche différente, plus ciblée, qui ne nécessite pas la transmission ou le stockage de données audio provenant d'un client."

Comment ça fonctionne ?

Contrairement à Amazon, Apple et Google qui transfèrent vos enregistrements - et parfois vos conversations - dans le cloud pour être analysés, Sonos traite toutes les commandes vocales sur l'appareil. L'enregistrement n'est jamais stocké, ni localement, ni dans les serveurs. Seuls les noms de chansons, d'artistes, d'albums, de playlists ou de genres sont envoyés aux différents services musicaux compatibles (comme Apple Music, Deezer ou Tidal, mais pas encore Spotify). L'avantage pour la vie privée est évident, mais ce n'est pas le seul. Grâce au traitement local, la reconnaissance peut aussi se faire plus rapidement, selon Sonos. "Comme il n'y a pas d'allers-retours vers le cloud, on traite chaque fragment de son l'un après l'autre, sans attendre la fin de la phrase. Résultat : on gagne en réactivité", explique Alice Coucke. En effet, en lançant le mot d'éveil "Hey Sonos", il suffit d'édicter sa requête (par exemple : "lance ma playlist matinale") pour que l'enceinte s'exécute en une fraction de seconde. Autre avantage : en utilisant son propre assistant, Sonos permet également d'activer de nouvelles fonctionnalités, comme le transfert d'audio entre les haut-parleurs avec une simple commande vocale. "Vous pouvez, par exemple, mettre l'enceinte de votre chambre à coucher sur pause et poursuivre l'écoute dans la salle de bain ou le salon. Ou diffuser votre playlist dans toutes les pièces, en mode multiroom", illustre Alice Coucke.

Sonos Voice Control: l'assistant vocal qui respecte votre vie privée, pg
Sonos Voice Control: l'assistant vocal qui respecte votre vie privée © pg

En anglais US, pour le moment...

Conçu entre Paris et les Etats-Unis par une équipe de 60 ingénieurs, le "Sonos Voice Control" ne sera disponible qu'en anglais américain. Du moins, à son lancement, car une version francophone est déjà en préparation et sera dévoilée avant la fin de cette année. En attendant, l'assistant n'a eu aucun problème à comprendre nos requêtes en anglais. Même avec un accent français à couper au couteau ! "Pour s'assurer que l'assistant vocal de Sonos fonctionne bien pour tout le monde, les performances de notre moteur vocal ont été optimisées pour les locuteurs natifs et non natifs sur un très grand ensemble de données équilibrées en termes d'âge, de sexe et d'accent", confie Alice Coucke. De quoi rassurer celles et ceux qui ne maîtrisent pas le dialecte du Kentucky.

Notre verdict

Sonos tient un excellent argument avec son approche un brin plus restreinte, mais beaucoup plus soucieuse de la vie privée. Alors qu'Amazon et Google revendiquent la commande vocale comme l'évolution naturelle du Web 2.0, leurs enceintes connectées sont surtout utilisées pour l'écoute de la musique et les requêtes simples, comme les prévisions météo. Une enquête de VoiceBot a récemment révélé que 39,8 % des personnes utilisent quotidiennement des enceintes intelligentes pour la musique, contre seulement 4,9 % pour faire des achats, 5,4 % pour trouver des recettes culinaires et 6,7 % pour envoyer des messages. Tout cela suggère qu'il y a de la place pour les assistants vocaux qui sont moins ambitieux et plus axés sur une tâche spécifique. Cela dit, Sonos continuera à prendre en charge Alexa ou Google Assistant sur les enceintes Sonos Beam, Arc et One. Les utilisateurs pourront même alterner entre les commandes vocales "Hey Sonos" et "Alexa".

C'est à New York, à quelques mètres de la célèbre High Line, que Sonos a dévoilé ce qui s'apparente déjà à une petite révolution dans le monde de la tech. Un nouvel assistant vocal baptisé "Sonos Voice Control". Sa mission : préserver la vie privée de ses utilisateurs. Ses signes distinctifs : il a la voix de l'acteur Giancarlo Esposito (connu pour son rôle de Gustavo Fring dans Breaking Bad), se concentre sur la lecture audio, et a été conçu par des Français.Conçu pour la musique, pas pour commander des pizzasLe lancement d'un nouvel assistant vocal peut sembler déroutant compte tenu de la popularité des options existantes, mais Sonos ne fait pas dans la demi-mesure. La pépite californienne place la barre très haut en termes de confidentialité et de réactivité. "Amazon, Apple et Google développent des assistants vocaux à usage général, qui ont finalement un objectif très différent : ils veulent répondre à toutes les questions, aborder tous les sujets, confie Alice Coucke, ancienne directrice chez Snips - une start-up française acquise par Sonos en 2019 - et désormais cheffe de l'apprentissage machine chez Sonos. Pour obtenir une expérience utilisateur satisfaisante, les GAFAM sont presque obligés de collecter des données à grande échelle. Nous, nous adoptons une approche différente, plus ciblée, qui ne nécessite pas la transmission ou le stockage de données audio provenant d'un client."Comment ça fonctionne ?Contrairement à Amazon, Apple et Google qui transfèrent vos enregistrements - et parfois vos conversations - dans le cloud pour être analysés, Sonos traite toutes les commandes vocales sur l'appareil. L'enregistrement n'est jamais stocké, ni localement, ni dans les serveurs. Seuls les noms de chansons, d'artistes, d'albums, de playlists ou de genres sont envoyés aux différents services musicaux compatibles (comme Apple Music, Deezer ou Tidal, mais pas encore Spotify). L'avantage pour la vie privée est évident, mais ce n'est pas le seul. Grâce au traitement local, la reconnaissance peut aussi se faire plus rapidement, selon Sonos. "Comme il n'y a pas d'allers-retours vers le cloud, on traite chaque fragment de son l'un après l'autre, sans attendre la fin de la phrase. Résultat : on gagne en réactivité", explique Alice Coucke. En effet, en lançant le mot d'éveil "Hey Sonos", il suffit d'édicter sa requête (par exemple : "lance ma playlist matinale") pour que l'enceinte s'exécute en une fraction de seconde. Autre avantage : en utilisant son propre assistant, Sonos permet également d'activer de nouvelles fonctionnalités, comme le transfert d'audio entre les haut-parleurs avec une simple commande vocale. "Vous pouvez, par exemple, mettre l'enceinte de votre chambre à coucher sur pause et poursuivre l'écoute dans la salle de bain ou le salon. Ou diffuser votre playlist dans toutes les pièces, en mode multiroom", illustre Alice Coucke.En anglais US, pour le moment...Conçu entre Paris et les Etats-Unis par une équipe de 60 ingénieurs, le "Sonos Voice Control" ne sera disponible qu'en anglais américain. Du moins, à son lancement, car une version francophone est déjà en préparation et sera dévoilée avant la fin de cette année. En attendant, l'assistant n'a eu aucun problème à comprendre nos requêtes en anglais. Même avec un accent français à couper au couteau ! "Pour s'assurer que l'assistant vocal de Sonos fonctionne bien pour tout le monde, les performances de notre moteur vocal ont été optimisées pour les locuteurs natifs et non natifs sur un très grand ensemble de données équilibrées en termes d'âge, de sexe et d'accent", confie Alice Coucke. De quoi rassurer celles et ceux qui ne maîtrisent pas le dialecte du Kentucky.