Bonjour les assistants vocaux : les entreprises vont devoir apprendre l’art de la conversation

Amazon Echo, Google Home... l’irruption des enceintes connectées sur le marché grand public modifie les usages des consommateurs et va obliger les marques à prendre le train vocal. Doivent-elles pour autant jeter leur site web aux orties et dire adieu à leur chatbot fraichement programmé ?

« Allo, que puis-je pour vous ? », annonce au téléphone l’employée d’un salon de coiffure. « Bonjour, j’aimerais réserver », répond l’appelante. « Auriez-vous un créneau disponible aux alentours du 3 mai ? » Quelques secondes plus tard, un rendez-vous est pris et les deux personnes raccrochent. Sauf que l’appelante n’a rien d’humain. Il s’agit de l’intelligence artificielle (IA) vocale Google Duplex présentée lors de la conférence annuelle pour les développeurs de la firme américaine, en mai dernier. Une technologie capable de passer des coups de fil et de dialoguer dans la langue de Shakespeare en imitant parfaitement les intonations humaines. Interjections (oh !, ah !), sons signalant la réflexion comme « hmmm », pauses entre les répliques... l’IA de Google, toujours en cours de développement, semble déjà maîtriser l’art de la conversation à la perfection.

« Ces dispositifs intelligents de reconnaissance de la parole vont certainement bouleverser les moyens de communication écrits comme les sites web ou les chatbots sourds aux requêtes articulées », prédit Joël Drakes, expert chez Nuance Communications, entreprise pionnière dans le secteur de l’intelligence vocale. « La voix est l’interface la plus naturelle qu’il soit. Au lieu de passer par exemple du temps à taper un message et faire attention à ne pas commettre de fautes d’orthographe, il suffit maintenant de parler. Bien plus rapide et commode que l’écrit. » Aux États-Unis, la technologie vocale connaît ainsi un véritable boom depuis le lancement des enceintes intelligentes connectées Amazon Echo, HomePod et Google Home en 2017. Début janvier 2018, 35,6 millions d’Américains utilisaient déjà ces « smart speakers ». Et selon l’entreprise américaine d’analyse publicitaire comScore, 50 % des recherches mondiales sur le web seront vocales en 2020. Une évolution spectaculaire des usages rendue possible grâce à des bonds technologiques majeurs.

Bienvenue dans l’ère vocale

« Aujourd’hui, le taux de compréhension vocale des machines dépasse les 95 % », illustre Pierre Peladeau, associé du cabinet de conseil PwC Strategy&. Les IA sont donc capables de discuter aussi bien, voire mieux que des humains, qui ne comprennent pas environ 5 % des mots échangés pendant une discussion. Le spécialiste ajoute : « Il y a 5 ans, ce taux atteignait 90 % et rebutait les utilisateurs qui étaient incompris une fois sur dix par leur appareil.

« C’est l’adoption du deep learning (une méthode d’apprentissage informatique utilisant un réseau de neurones artificiels), la prolifération des données disponibles et la simple loi de Moore, qui ont permis de repousser les frontières techniques de la reconnaissance vocale. »

Pierre Peladeau, associé du cabinet de conseil PwC Strategy&

Ces technologies ont fait faire des pas de géants au traitement du langage oral par les machines, alimentées par des millions d’enregistrements en conversation naturelle. Au fil du temps, elles ont su reconnaître et mémoriser les phonèmes — les syllabes du son —, puis les mots et les phrases, et ont appris à les analyser... Jusqu’à pouvoir discuter avec un humain.

Cette avancée technologique a démocratisé les requêtes vocales auprès du grand public. « Les usages vont changer et obliger les marques à se mettre à la page », analyse Joël Drakes, de Nuance. « Les utilisateurs n’iront plus sur leur navigateur smartphone et le volume des visites sur les sites web va baisser. Ils sont d’ailleurs de plus en plus épurés : il y a moins d’onglets, moins de texte... l’étape suivante est de basculer vers la voix, encore plus intuitive pour l’internaute. » Yann Lechelle, directeur général de la start-up française Snips, spécialisée dans l’IA vocale, prévient : « Le risque de rater ce virage technologique, c’est d’être boudé par ses clients, qui iront voir la concurrence. Rappelez-vous l’arrivée d’Uber, qui a failli enterrer les taxis G7. Il se passera la même chose dans les prochaines années : on entre dans l’ère de la voix. »

Rendre la parole performative

Pour être sûres de ne pas rater le train vocal, certaines marques ont déjà développé des dispositifs dotés d’une ouïe futée auprès du grand public. C’est le cas de la banque néerlandaise ING, qui a doté son service d’une intelligence vocale, baptisée Inge. « Cette assistante, que nous avons développée chez Nuance, permet de réaliser des opérations sans les mains grâce à ses aptitudes de reconnaissance et d’authentification vocales, indispensables pour sécuriser le système », explique Joël Drakes. Consultation des comptes, ordre de virement... les personnes autrefois déroutées par le fonctionnement des smartphones et la jungle des onglets web, n’ont plus qu’à formuler leurs souhaits à voix haute pour qu’ils soient accomplis. « C’est lorsque la parole de l’utilisateur devient performative qu’un assistant vocal marque des points », relève Yann Lechelle. En clair, être compris par une machine, c’est bien. Mais être exaucé, c’est encore mieux.

La start-up française Snips créée en 2013, qui veut atteindre un chiffre d’affaires de plusieurs millions d’euros en 2019, a ainsi développé une vingtaine d’applications vocales spécialisées pour répondre aux demandes des entreprises. « Concevoir un assistant généraliste performant avec les bases de données actuelles relève pour l’instant du fantasme, explique Yann Lechelle. Nous préférons faire du sur mesure pour proposer des fonctionnalités concrètes. Il est par exemple possible de demander à l’une de nos IA d’afficher des documents spécifiques à l’écran ou lui demander de réaliser un graphique des bilans financiers de l’entreprise sur les 10 dernières années. » À la clé : beaucoup de temps gagné en recherche documentaire et en mise en forme des données.

« La prochaine étape des développeurs d’assistants vocaux sera de raccorder leur technologie à une galaxie de services, pour permettre à de nombreuses requêtes d’être concrétisées », ajoute Pierre Peladeau. Début 2018, le géant Amazon a ainsi racheté l’enseigne Bio Whole Foods pour la coquette somme de 13,7 milliards de dollars. De quoi effrayer les grands acteurs de la distribution comme Carrefour ou Auchan. « Il suffit de commander les courses que l’on souhaite acheter à Alexa, l’assistante vocale d’Amazon, pour être livré automatiquement dans la journée par les coursiers de la multinationale américaine », illustre Yann Lechelle. Et le tout sans bouger le petit doigt ou passer une heure devant son ordinateur à garnir son panier numérique. Un système redoutable d’efficacité.

Autre nouveau service vocal intéressant : le « Spotify voice » développé par la célèbre plateforme suédoise de musique en streaming. Seulement disponible en anglais, cet assistant comprend de nombreuses commandes. Il est par exemple possible, à la voix, de lancer un morceau aléatoire que l’on aime ou de jouer le dernier tube de son artiste préféré. Des fonctionnalités qui évitent à l’utilisateur d’explorer le catalogue pour trouver sa pépite musicale.

Les interfaces vocales ont le vent en poupe
Partager sur :

Bonne nouvelle : écrit et oral vont cohabiter

Pour autant, malgré l’essor du vocal, écrit et oral vont certainement cohabiter. D’abord parce qu’il y aura toujours des utilisateurs fidèles aux fenêtres de chat. La preuve avec les lecteurs toujours épris de vrai papier, malgré l’offre toujours plus étoffée de liseuses numériques. « Et parce que les usages s’adapteront aux différentes situations », décrypte Pierre Peladeau. « Parler à un assistant vocal dans son salon ne pose pas problème. Mais lui donner des ordres dans une rame de métro est plus délicat. » Sans évoquer la difficulté à être compris à cause du bruit, on n’aura pas toujours envie de passer pour un idiot auprès de ses semblables.

« C’est pourquoi nous avons créé un assistant omnicanal capable de traiter les requêtes clients formulées de différentes façons », avance l’expert de Nuance. « Notre chatbot Nina, adopté par Coca-Cola ou encore l’enseigne de restauration rapide Domino’s Pizza, traite les demandes clients écrites et orales. Les entreprises ont besoin de proposer un point de contact offrant un service homogène à leur clientèle. » Que ce soit une requête via l’application, le site ou le standard d’une société : les utilisateurs interagissent avec le même assistant numérique, peu importe leur mode de communication. Les chatbots ne sont pas voués à mourir s’ils évoluent avec leur époque et embarquent dans leur code la panoplie du parfait palabreur.

Sécuriser les données pour rassurer

Mais comment démarquer son assistance vocale de la concurrence ? En sécurisant notamment les informations personnelles et stratégiques captées. Une étude réalisée par Opinion Way, publiée en avril 2018, montre ainsi que 47 % des Français interrogés craignent de se faire pirater leurs données. 42 % redoutent de ne pas maîtriser leurs données. Tout aussi révélateur : un tiers d’entre eux ne supporterait pas d’avoir le sentiment d’être écouté en permanence. Et ils ont raison de se méfier.

« Les deux tiers des données stockées sont des informations concernant les humains. Un quart d’entre elles sont d’ailleurs détenues par Google. »

Pierre Peladeau, associé du cabinet de conseil PwC Strategy&

Récemment, une traductrice pour Cortana, l’assistante vocale du célèbre moteur de recherche américain, a ainsi révélé certaines actions douteuses réalisées par le smart speaker. « Souvent, Cortana enregistrait de façon non sollicitée », raconte la travailleuse indépendante, qui affirme n’avoir signé aucune clause de confidentialité. « Je ne sais pas pourquoi elle se déclenchait, mais on avait des conversations qui n’étaient pas censées être enregistrées à la base. Des gens qui discutaient dans leur voiture avec leurs enfants, à table... ou aux toilettes ! » Elle ajoute : « Les transcriptions étaient découpées en petites pistes et elles étaient anonymes pour les transcripteurs. Mais il y avait des détails qui passaient : des noms, des numéros de sécurité sociale... » Un témoignage qui montre que les conversations peuvent être épiées à l’insu des utilisateurs.

Les dirigeants de la start-up Snips ont décidé de rassurer les utilisateurs potentiels et gagner des parts de marché en misant sur la cyber-protection. « Pour garantir la sécurité des données à nos clients, nous créons des assistants vocaux embarqués qui fonctionnent en local », expose Yann Lechelle, DG de la start-up Snips. « Leur intelligence personnalisée en fonction des demandes du client est autarcique et n’émet pas vers l’extérieur pour trouver une réponse aux questions posées. » Une solution qui intéresse de nombreuses sociétés : « 50 prototypes sont en cours de création », se réjouit Yann Lechelle. « On discute en ce moment avec 800 boîtes... et on compte embaucher 40 personnes entre mai et la fin de l’année. » Pour l’instant, la jeune pousse fournit seulement des solutions logicielles aux entreprises, mais compte lancer un appareil pour le grand public en 2019. Le business des technologies vocales a de belles années devant lui.

PwC en direct

Contactez-nous

Pierre Péladeau

Associé Strategy&

Tel : +33 1 56 57 86 16

Suivez-nous !