À la découverte de l’entreprise montoise Acapela, créateur de voix artificielles

Remy Cadic, "VP sales" chez Acapela Group " Notre point fort, ce sont les bases de données audio que nous avons accumulées au cours des dernières années. " © Belga Image / Julien Leroy

L’entreprise montoise est le leader européen de la création de voix synthétiques. Le succès des assistants vocaux, des robots conversationnels et des enceintes connectées lui ouvre de nouvelles perspectives de croissance.

Sans le savoir, vous avez certainement déjà entendu une voix artificielle élaborée par les équipes d’Acapela. A la gare, lorsque la SNCB vous annonce l’arrivée (ou le retard) de votre train. Au volant, quand votre Coyote vous avertit de la présence d’un radar ou l’imminence d’un embouteillage. Au téléphone, quand vous contactez votre banque ou votre opérateur télécom et que vous êtes mis en communication avec son répondeur interactif, chargé de vous orienter vers le service adéquat.

Issue d’une spin-off de la faculté polytechnique de Mons, l’entreprise, qui occupe une quarantaine de personnes, crée des voix synthétiques depuis une vingtaine d’années. Elle est même devenue le leader européen de cette activité de niche. Mais aujourd’hui, son secteur est bousculé par l’arrivée de nouvelles technologies vocales qui prennent un essor considérable.

Neuf millions d’enceintes connectées

Sur nos appareils connectés, de plus en plus d’interactions se font non plus via le clavier, mais via notre voix. Les assistants comme Siri (Apple) ou Alexa (Amazon) nous permettent de consulter des sites internet, passer des commandes en ligne, écouter de la musique, etc. Aux Etats-Unis, 20 % des recherches sur Google se font déjà par la voix ! Les enceintes connectées, qui intègrent ces assistants vocaux, représentent un marché en pleine explosion. D’après le consultant spécialisé Canalys, 9 millions d’enceintes connectées (dont 2,5 millions d’Amazon Echo et 3,2 millions de Google Home) ont été vendues dans le monde au premier trimestre 2018. C’est trois fois plus que l’année dernière.

Cet engouement pour la commande vocale est une excellente nouvelle pour Acapela. ” Le sujet devient véritablement grand public, se réjouit Remy Cadic, VP sales chez Acapela Group. Cela permet de remettre en lumière la synthèse vocale, qui était associée aux serveurs vocaux interactifs ( les répondeurs avec listes de choix, Ndlr), mais qui va de plus en plus évoluer vers les robots conversationnels. ” Selon le responsable de la société montoise, les chatbots – ces robots capables de tenir une conversation avec un humain – vont progressivement s’imposer, même s’ils ne remplaceront pas totalement les systèmes classiques de répondeurs interactifs.

Actuellement, Acapela reçoit chaque jour au moins une demande émanant d’une société qui a une idée d’application dans le domaine de l’assistance vocale. Ce qui intéresse ces clients potentiels, c’est que l’entreprise montoise est capable de créer des voix synthétiques sur mesure. Elle a déjà développé un catalogue d’une centaine de voix standards et créé plus de 200 voix personnalisées dans une trentaine de langues différentes. Le développement des chatbots devrait soutenir cette demande dans les prochaines années.

Acapela a déjà développé un catalogue d’une centaine de voix standards et créé plus de 200 voix personnalisées dans une trentaine de langues différentes.

La société technologique belge possède deux bureaux de vente à l’étranger (Toulouse et Stockholm). Elle est très orientée vers l’international, d’où elle tire l’essentiel de ses revenus. Présente au salon Vivatech à Paris, elle a rencontré de grands groupes français comme TF1, BNP Paribas ou Orange. Tous souhaitent développer des systèmes d’assistants vocaux pour déployer de nouveaux services. Dans le secteur bancaire, des projets visent à équiper certaines agences de robots conversationnels, qui répondront aux clients et les orienteront vers le conseiller compétent ou répondront à certaines demandes de renseignement. ” Les agences coûtent cher aux banques. Elles cherchent à remplacer du temps humain par du temps automatisé “, explique Remy Cadic.

Du côté des opérateurs télécoms, on planche sur le développement d’assistants vocaux intégrés directement dans les box TV. Depuis son canapé, le consommateur pourra demander le programme du soir, lancer un programme de vidéo à la demande, voire interroger son opérateur sur sa facture. Orange travaille ainsi sur un assistant vocal appelé Djingo, qui intégrera certaines fonctionnalités vocales et, peut-être, une voix d’Acapela.

La société wallonne s’adresse à des clients qui veulent créer une voix personnalisée, correspondant à leurs besoins et à l’image qu’ils souhaitent véhiculer. ” Notre objectif est de créer une voix unique pour chaque client, précise Remy Cadic. Il y a une infinité de combinaisons possibles. ” Lors de la confection d’une voix artificielle, différents paramètres peuvent être réglés, comme le timbre (chaleureux, direct, etc.), l’intonation, la vitesse, la hauteur (aigu, grave), l’accent, etc.

Réseaux neuronaux

Pour obtenir une voix de très haute qualité, l’entreprise fait appel à des comédiens professionnels qui réalisent une quarantaine d’heures d’enregistrement. Ce genre de processus relativement lourd est nécessaire pour développer des voix utilisées dans des contextes particuliers comme les transports en commun (Acapela a notamment fourni une voix pour le réseau de la Stib à Bruxelles).

Mais toutes les entreprises n’ont pas les mêmes exigences. Grâce à de nouvelles technologies intégrant des outils d’intelligence artificielle (IA), la société montoise peut désormais créer des voix certes moins abouties, mais qui seront fournies plus rapidement et à moindre coût. Pour cela, elle utilise la technologie des réseaux neuronaux profonds, une branche de l’IA basée sur l’identification de certaines corrélations dans des bases de données. Dans le cas de la société montoise, cette technique est utilisée pour la transformation de texte en impulsion vocale. ” Notre point fort, ce sont les bases de données audio que nous avons accumulées au cours des dernières années, et qui vont ‘entraîner’ ces réseaux neuronaux pour les rendre plus performants “, détaille Remy Cadic. Alors qu’auparavant, les logiciels d’Acapela répondaient à des commandes ” logiques ” (une suite de lettres = un son), les nouvelles techniques se basent plutôt sur des corrélations statistiques, grâce à l’analyse de riches bases de données, le fameux big data.

Ces évolutions technologiques permettent à l’entreprise d’entrevoir de nouveaux développements et segments de marché. Elle commercialise depuis deux ans des voix de synthèse à destination de personnes malades, atteintes notamment de la maladie de Charcot, qui savent qu’elles perdront à terme l’usage de la voix. Acapela est capable de recréer la voix du patient à partir d’une série d’enregistrements. Les progrès de la robotique et de l’Internet des objets intéressent aussi l’entreprise. Certains robots Nao, ces petits androïdes mignons fabriqués par Softbank Robotics, intègrent des voix développées par Acapela. Des jouets interactifs, comme les dinosaures de Cognitoys, en sont également équipés.

Certains organes de presse en Suède et en Suisse ont également intégré une voix d’Acapela pour offrir la possibilité aux lecteurs d’écouter leurs journaux plutôt que de les lire. Demain peut-être, vous écouterez cet article dans la voiture, pendant votre jogging ou au petit-déjeuner, grâce à votre enceinte connectée.

Vous avez repéré une erreur ou disposez de plus d’infos? Signalez-le ici

Partner Content