Recherche
Magazine Relation Client
S'abonner à la newsletter S'abonner au magazine

DossierAssistants vocaux: sortir du lot

Publié par le

1 - La course au vocal

Les systèmes vocaux fondés sur l'IA rebattent les cartes dans la manière dont les marques se présentent, créent des tunnels de conversation avec les clients ou parviennent à être référencées dans ce nouvel univers.

  • Imprimer

La guerre commerciale que se livrent les fabricants d'enceintes connectées -Amazon et Google en tête- illustre à elle seule l'ampleur des enjeux autour de la voix et de la massification d'usages encore naissants. Plus ils s'installeront rapidement et massivement au domicile des consommateurs, plus ces assistants vocaux bardés d'intelligence artificielle pourront se rendre indispensables dans notre quotidien. Dans le monde des GAFA, la course en tête est donc lancée entre l'Assistant Google, Alexa d'Amazon, Cortana de Microsoft, Siri d'Apple...

Les utilisateurs se sont familiarisés avec la commande vocale, bien avant l'arrivée sur le marché français des enceintes intelligentes Google Home, Amazon Echo, HomePod et leurs déclinaisons. Une étude Capgemini de fin 2017 montre que 51% des consommateurs ont déjà utilisé un assistant vocal, pour 81 % d'entre eux via leur smartphone(1). Ils sont visiblement séduits puisque 40% se disent prêts, d'ici trois ans, à utiliser un assistant vocal au lieu d'une application mobile ou d'un site web. Selon l'agence d'études iligo(2), les Français plébiscitent leur disponibilité (80%), leur facilité d'utilisation (73%) et apprécient également la qualité des réponses données (65%).

"La reconnaissance vocale se montre très performante pour transcrire les requêtes dans les moteurs de recherche, le Natural Language Processing (NLP), qui permet de converser, n'est pas encore aussi performant", Olivier Vigneaux, directeur général de BETC Digital.

Pour les marques, le passage de l'écrit à la voix permet de moderniser l'expérience client, de diversifier les points de contacts et même de redonner un peu de chaleur à la relation client digitale. Les informations récupérées sont plus riches: un client prononce en moyenne 200 mots à la minute quand il en tape 70 sur un clavier. Pourtant, tout n'est pas encore optimal. "La reconnaissance vocale se montre très performante pour transcrire les requêtes dans les moteurs de recherche, le Natural Language Processing (NLP), qui permet de converser, n'est pas encore aussi performant, notamment pour aider la machine à affiner sa recherche lorsqu'elle ne comprend pas la question qui lui est posée", observe Olivier Vigneaux, directeur général de BETC Digital.

Les marques qui veulent anticiper l'évolution des usages ont commencé très tôt à mener des expérimentations ou à déployer des interfaces vocales, appelées skills sur l'assistant Alexa d'Amazon et services sur l'Assistant Google. Sephora prodigue des conseils beauté et ouvre la réservation de rendez-vous en institut, Monoprix propose de dicter sa liste de course, Legrand de fermer les volets et d'éteindre les lumières quand l'utilisateur quitte son domicile, Fnac Darty a testé l'achat à la voix sur téléphone et le paiement via le compte Fnac... Il commence à se créer, dans l'univers des applications vocales, ce qui s'est créé par le passé dans le mobile avec des applications dédiées à des usages précis.

Un nouvel univers à apprivoiser

Même avec les plus grandes ambitions, ne devient pas un champion de la voix qui veut! Tout doit être passé au crible: définir la question qui débutera la conversation, sonder l'état d'esprit de la personne qui peut avoir besoin d'aide ou être d'humeur à jouer, créer des tunnels de conversation avec les consommateurs dans le cadre d'un scénario, mais aussi imaginer tous les scénarii d'interaction possibles (y compris quand l'utilisateur pose une question qui n'a rien à voir avec l'univers de la marque, se montre familier ou même grossier), identifier si l'intention a changé, calibrer le temps que doit durer l'interaction vocale, savoir quand et comment relancer l'utilisateur quand il y a un blanc dans la conversation, définir la manière dont l'assistant met fin à la conversation et dit au revoir...

Une analyse fine des interactions entre les clients et l'assistant permet de comprendre le ressenti des utilisateurs dans l'interaction homme-machine, de voir où se situent les points de blocage, de repérer les réponses du bot qui créent de l'engagement, des allers-retours, de la sortie, à quel moment le système stagne... "Dans une logique de Minimum Valuable Project (MVP), les marques veulent mettre le produit le plus vite possible dans la main des utilisateurs. Si elles lancent trop vite leur assistant vocal, cela pourra être déceptif. Il faut essayer de ne pas être trop en avance de phase, mais le bon moment est toujours difficile à trouver", constate Lucie Buisson, VP Product chez ContentSquare.

Le travail sur le champ lexical de la marque oriente sa manière de prendre la parole. "Si le ton est bien choisi par rapport à la cible, le client va nourrir le ton de la marque et enrichir la base. S'il est mal choisi, ce sera une catastrophe. Dans la phase de démarrage, les marques ont tout intérêt à jouer la transparence et, par exemple, ne pas hésiter à signaler que l'outil est en phase d'apprentissage", ajoute-t-elle.

Choisir sa voix

C'est également tout un art que de trouver la voix adaptée à l'image que la marque veut projeter. "Si la voix est trop mécanique, elle ne génère pas d'émotion et on n'a pas envie de lui parler, remarque Olivier Vigneaux. Le rire et les interjections sont aussi des éléments qui créent de l'émotion. Beaucoup de start-up se positionnent sur le design de la voix et la création d'une personnalité de marque, en travaillant sur le champ sémantique, le timbre et le rythme de la voix." Il est par exemple utile de ralentir le débit de la parole quand l'assistant énonce un numéro de téléphone, pour que l'utilisateur ait bien le temps de le noter.

Autre choix crucial: l'assistant doit-il tutoyer ou vouvoyer l'utilisateur? "Il faut surtout voir en quoi ce choix sert la stratégie et l'image de la marque. Il peut paraître étrange qu'une marque qui n'est d'ordinaire pas familière avec ses clients se mette à les tutoyer sur les assistants vocaux. En revanche, cela peut être pertinent pour surprendre une cible jeunes", estime-t-il.

Les avis sont aussi partagés sur le fait de donner une personnalité à l'assistant vocal. On peut par exemple comprendre que ce ne soit pas nécessaire, ni même souhaité, pour un établissement financier. Meetic et Sephora ont clairement choisi de jouer la carte de la personnalisation: sur l'Assistant Google, c'est la coach de dating Lara Voice qui livre ses propositions et suggestions, tandis qu'Ora prodigue ses conseils beauté. "Créer une personnalité représente un coût supplémentaire, mais génère plus d'engagement, fait valoir Lucie Buisson. Il est difficile de travailler sur la personnalité de la marque en démarrant par le bot ou l'assistant vocal, sauf si on veut tester quelque chose sur une niche. Les marques qui ont déjà créé un univers cohérent autour de leur personnalité peuvent en revanche prendre plus de risques sur le ton."

Optimiser la recherche

La voix impacte tous les aspects du référencement naturel des marques. "Puisqu'elles ne contrôlent ni l'interface, ni l'algorithme d'intelligence artificielle qui intervient dans la commande vocale, elles doivent se concentrer sur la donnée qui alimente ces systèmes intelligents, quand une personne émet une requête dans l'univers sémantique de la marque. Pour optimiser le référencement naturel, il faut être capable de fournir à ces moteurs de recherche des données riches et structurées", note Franck Negro, directeur général Europe du Sud de Yext, une société qui travaille sur l'usage de la voix dans le référencement naturel.

La première étape consiste à identifier et à structurer les données publiques éparpillées dans différentes entités de l'entreprise. "La connaissance digitale des systèmes d'information interne pourra alors alimenter en temps réel les applications externes utilisées par les consommateurs, les GPS, les chatbots, les voicebots... et générer du trafic vers le site internet et le point de vente", poursuit-il.

Ces méthodes d'optimisation sont parfois décrites sous l'acronyme PASO pour "Personal Assistant Search Optimisation". "Proposer des interfaces vocales séduisantes avec une personnalisation propre et une bonne expérience est un gros chantier qui passe par le contenu pour être PASO Friendly", souligne Olivier Vigneaux.

Accélérer en toute indépendance

Les interfaces vocales changent aussi la donne sur les pratiques marketing. Les marques doivent notamment changer la manière dont elles poussent leurs offres, car la capacité de mémorisation de l'utilisateur est nettement plus limitée s'il entend une liste que s'il la lit. Attention aussi aux risques de cannibalisation: "Quand le consommateur a pris l'habitude d'appeler Alexa ou Google, la marque disparaît au profit du terminal transactionnel, pointe Yann Lechelle, directeur général de Snips. Grâce aux solutions des GAFA, la stratégie des marques sur les assistants vocaux peut se développer très vite. Elles gagnent donc à mettre rapidement en place une stratégie de désengagement et d'indépendance par rapport à ces acteurs. S'il est certain que l'interface de demain sera vocale, il faut être conscient de ce que l'on donne aux GAFA. C'est une question stratégique qui va bien au-delà du multicanal et de l'utilisation d'une technologie sympathique". Un point à prendre en compte par les marques pour notamment rassurer les clients sur l'utilisation de leurs données personnelles.

Pour contourner le risque de dépossession des données des clients, la start-up française Snips a développé une technologie propriétaire qui installe l'assistant vocal en marque blanche, sans passer par le cloud. La voix est ainsi traitée de manière industrielle, mais "en boucle locale", au plus près des besoins et du parcours du client. La technologie Snips peut être intégrée dans différents supports qui vont de l'application mobile à la borne interactive en magasin. Même si les enceintes connectées se développent, les smartphones, qui embarquent nativement Siri ou l'Assistant Google, vont demeurer le support de prédilection de la voix. "Sur mobile, il est plus pratique de poser une question en langage naturel, mais la restitution de la requête peut être visuelle: trois idées de restaurants sur une carte, des photos de menu, la photo d'un sac à main, d'une chambre d'hôtel... On se dirige vers des solutions où l'on n'aura pas du vocal de bout en bout, ce qui est d'ailleurs beaucoup plus riche en termes d'expérience client", affirme Franck Negro.

D'autres utilisations peuvent aussi s'envisager. "Les marques qui ont une égérie pourraient embarquer la voix de leur égérie dans l'assistant vocal, note Yann Lechelle. L'égérie pourrait non seulement converser sur l'interface, mais aussi assurer différents services pour la marque. La partie servicielle pourrait alors fusionner avec la relation client." Autant dire que, face à la technique qui va continuer à s'améliorer et aux cas d'usage qui continueront à se développer, le potentiel de la voix dans la relation client est encore loin d'avoir été totalement exploré.

(1) Capgemini, Conversational Commerce Survey, étude menée en octobre-novembre 2017 auprès de plus de 5000 consommateurs aux États-Unis, au Royaume-Uni, en France et en Allemagne.

(2) Iligo, Baromètre des Usages Multi-écrans, terrain réalisé du 14 mars 2018 au 23 mars 2018.


Christine Monfort

NEWSLETTER | Abonnez-vous pour recevoir nos meilleurs articles

Sur le même sujet

Retour haut de page