Mon compte Devenir membre Newsletters

Les technologies vocales renforcent leur attractivité

Publié le par

Longtemps promis à un bel avenir, le marché des technologies vocales semble enfin être entré en phase de maturité. Des acteurs désormais bien ancrés sur leur position, des projets plus vite déployés, une technologie mieux maîtrisée, des clients qui adhèrent?: autant de signes positifs pour un avenir serein.


Par “technologie vocale”, il faut entendre deux technologies principales?: la reconnaissance de la parole et la synthèse vocale. Autrement appelée la “reco”, la première est capable de reconnaître ce qui a été dit et de le convertir en langage d'informations via un moteur qui s'appuie sur des bases de données grammaticales et dirige l'appelant vers un service précis. La synthèse vocale, appelée Text To Speech (TTS), est un procédé qui consiste à convertir un fichier texte en son, via un moteur de synthèse. Jusqu'en 2003, le marché de la technologie vocale n'a pas véritablement connu l'essor spectaculaire attendu. D'une part, en raison de lacunes dans la technologie elle-même, et d'autre part, en raison d'une certaine frilosité des utilisateurs potentiels, comme le souligne Jean-Jacques Devaux, directeur marketing chez Telisma. « Le début des années 2000 était marqué par des périodes très longues entre la phase projet et le réel démarrage de ces projets, sans oublier des coûts quelque peu prohibitifs. Par ailleurs, la qualité de la technologie intrinsèque liée au vocal n'était pas complètement au point. » L'avance du marché américain en matière de technologie vocale s'explique, en partie, par la pratique d'une seule et même langue. A la différence de l'Europe où près d'une quinzaine de langues cohabitent. Avec les années 2004/2005, la période de doutes a, semble-t-il, laissé place aux certitudes. De la question “Est-ce que ça marche??”, nous sommes passés au stade du “Comment mettons-nous en place notre projet de technologie vocale??” Paradoxalement, la recherche de la réduction des coûts au sein des centres de contacts a également favorisé l'adoption de la technologie vocale qui, pourtant, s'avère plus coûteuse qu'un système classique à base de DTMF (utilisation des touches classiques de son téléphone), du moins, en termes d'investissement initial. Par réduction des coûts, il faut surtout avoir en tête l'idée d'automatisation des tâches à faible valeur ajoutée, afin de porter une attention plus soutenue sur les relations à forte valeur ajoutée avec les clients. Actuellement, un projet de reconnaissance vocale est environ de 30 à 50 % plus onéreux qu'un projet classique reposant sur le DTMF. « Cependant, la reconnaissance vocale n'a pas pour but de remplacer un projet DTMF, mais bel et bien d'apporter de nouveaux services. Les projets sont plus complémentaires que concurrentiels », insiste Patrice Vielpeau, responsable des ventes chez ScanSoft. Les grands projets demandeurs se trouvent souvent chez ceux qui, les premiers, ont intégré des projets de gestion de la relation client?: banques, assurances, télécoms, tourisme, mais également la grande distribution ou les administrations publiques. Sur un marché européen avoisinant les deux millions de positions, près de 40 % sont équipées de solutions vocales. Une proportion qui devrait évoluer rapidement à la hausse au cours des prochaines années. « A l'instar de nombreux secteurs d'activité, celui des éditeurs de solutions vocales s'est considérablement contracté au point de ne plus rassembler qu'une poignée d'éditeurs spécialisés », constate Denis Faivre, directeur Recherche et Développement chez Atos Worldline. Elan Speech, Babel Technologies et Babel Infovox se sont en effet rapprochées pour former en 2004 le Groupe Acapela. Toujours en 2004, Natural Touch avait donné une seconde vie à Dialoca en reprenant ses actifs. Et, désormais, ScanSoft et Nuance ne font plus qu'un, suite à la finalisation de la fusion en septembre 2005.

Les cas d'application

Un projet de reconnaissance ou de synthèse vocale est souvent appréhendé lorsque l'entreprise désire optimiser ses moyens d'accueillir les clients. « Il s'agit de se poser une question essentielle?: comment l'entreprise souhaite-t-elle réceptionner son client?? Aujourd'hui, le recours à un téléconseiller, un projet en système DTMF et/ou de reconnaissance vocale sont envisageables. Encore faut-il déterminer celui qui est le plus adapté à ses besoins », remarque Xavier Lapereyre, responsable marketing de Jet Multimédia. Qualification d'appels, gestion des débordements et/ou self-service sont des fonctions majeures liées à la reconnaissance vocale et au TTS. La qualification permet d'orienter le client vers le bon interlocuteur et le self-service contribue à ce que le client obtienne seul l'information désirée. Lorsqu'une liste de choix ou une arborescence propose plus de quatre à cinq possibilités pour orienter le client, la reconnaissance vocale se justifie pleinement. « Nous sommes en mesure d'apporter des services qui ne peuvent même pas être envisagés par un système DTMF classique, car il demanderait une arborescence de menus bien trop compliquée à mettre en place », insiste d'ailleurs Anne Lacouberie, responsable marketing et communication division contact client chez Prosodie. Il arrive cependant que le projet de reconnaissance vocale remplace les projets DTMF, comme c'est le cas au sein de certaines régions du Crédit Agricole. Une fois le stade de découverte passé et l'appréhension oubliée, un premier projet de reconnaissance vocale contribue à éduquer les clients pour leur apporter des services enrichis. De son côté, le développement des numéros courts a beaucoup favorisé l'émergence des technologies vocales. La simplification de l'accès aux entreprises qui en découle a permis l'émergence de portails qui fédèrent plusieurs services. La reconnaissance vocale va offrir ainsi l'accession via cinq ou six mots clés aux services du portail, à l'instar du service proposé par la SNCF, avec son 3635. Les services d'annuaires vocaux d'entreprises (soit internes, soit externes) se sont multipliés ces derniers mois. Ils consistent à mettre en relation une personne de l'entreprise avec l'appelant, en ne se basant que sur le nom de la personne visée. « Ce type de service commence à se développer puisqu'il est souvent plus facile de se souvenir d'un nom de personne que de son numéro de téléphone », explique Anne Lacourberie. Les services de liste longue sont également visés par la technologie vocale puisqu'elle permet d'éviter de taper une série de mots pour accéder à une information précise. C'est le cas notamment pour les entreprises de transport où la reconnaissance vocale sert à indiquer très rapidement au client où se trouve son colis.

Impressions des consommateurs

Les services transactionnels sont également visés par la technologie vocale, notamment en matière de vente par correspondance. La “reco” permet à l'acheteur de franchir les étapes de son processus d'achat jusqu'au moment où le téléconseiller va prendre la main pour le paiement. Pourtant le risque de perdre un client qui ne souhaite pas parler à une machine existe (environ 10 % des consommateurs). « La crainte provoquée par la reconnaissance vocale est toujours présente et le consommateur a tendance à raccrocher. Ce qui est dommageable, surtout pour une entreprise de vente à distance », regrette Anne Lacourberie. Autrement dit, la VPC doit jongler entre un processus d'automatisation consacré aux opérations à faible valeur ajoutée au risque de perdre le client, et l'apport en parallèle d'un service supérieur épaulé par un téléconseiller. Pour les centres de contacts, une technologie vocale permet de “désengorger” les plateaux, libérant les téléconseillers des tâches répétitives. Cette technique est, par conséquent, une bonne réponse pour faire face aux pics d'appels, ou pour combler un manque de disponibilité des téléopérateurs en dehors des jours classiques de travail et des heures d'ouverture. L'intégration des technologies vocales s'effectue généralement sous deux formes. La première?: l'entreprise utilise un speaker virtuel afin de générer des enregistrements en les intégrant dans un SVI virtuel. La seconde?: elle utilise un moteur de synthèse qui peut aussi bien s'appliquer sur une plate-forme propriétaire que sur un SVI VoiceXML. « Dans l'hypothèse où les besoins sont légers, le premier cas de figure est souhaitable. En revanche, avec un moteur de synthèse vocale, l'entreprise dispose de fonctionnalités plus étendues », commente Antoine Kauffeisen, directeur marketing du groupe Acapela. Le TTS est plus économique dans la mesure où toutes les phases d'enregistrement, de mises à jour et de maintenance sont absentes. Souffrant il y a encore quelques années d'une sensibilité trop importante face aux bruits ambiants, infligeant ainsi aux consommateurs de lourdes répétitions, la reconnaissance vocale a fortement progressé. A tel point que les fameux agents transparents, qui permettaient en cas de doutes du moteur de basculer sur un téléconseiller, sont de moins en moins utilisés. Néanmoins, la technologie vocale est encore perçue comme un frein par certaines personnes issues des systèmes d'information et son coût d'investissement initial reste un obstacle à surmonter. En revanche, la perception des consommateurs vis-à-vis des technologies vocales proposées par les centres d'appels, n'est pas aussi négative qu'il y paraît de prime abord, loin s'en faut. Surtout si l'on compare la “reco” avec les services à base DTMF. Ainsi, selon une étude menée par Gartner et ScanSoft en 2005, 47 % des personnes interrogées sont satisfaites avec la “reco” contre 15 % avec les touches du téléphone. Autre point intéressant, les consommateurs préfèrent être mis directement en ligne avec un système de “reco” plutôt que de devoir attendre un téléopérateur. Enfin, le sentiment d'être à l'aise face à la technologie vocale n'est pas usurpé, puisque près de 60 % des personnes interrogées estiment qu'elles seront autant à l'aise face au système, contre 30 % qui pensent pouvoir maîtriser davantage l'outil. Une étude récente similaire (mai 2005) menée par ACA Research en Australie pour Speech-Works, une division de ScanSoft, conforte ces premières impressions en matière de reconnaissance vocale. Non seulement 47 % des personnes interrogées sont satisfaites des applications vocales, mais elles considèrent également à hauteur de 80 % que cela contribue à améliorer leur expérience de consommateur avec l'entreprise. De même, en matière de self-service, la “reco” est la méthode préférée comparée à Internet ou aux touches DTMF, pour plus de 55 % des interviewés. Presque 70 % des personnes sondées sont convaincues que les applications vocales sont efficaces, rapides et faciles à utiliser. Enfin, la qualité d'un projet de technologie vocale se juge non seulement au travers de l'application, mais aussi de l'ergonomie de ce qui est proposé au client. « Concernant l'application, il est important de savoir si le moteur de reconnaissance est capable de reconnaître ce qu'on lui dit. », précise Patrice Vielpeau. Capital, mais pas suffisant si le taux de transaction n'est pas valorisé. En effet, ce second taux représente la faculté pour le client d'obtenir l'information qu'il souhaite. Or, le meilleur moteur de “reco” du monde sera bien impuissant si ce qui l'entoure, en l'occurrence l'ergonomie, n'est pas intuitive, ou du moins adaptée au service proposé.

Etude de cas. Chronopost

: reconnaissance et synthèse vocales en duo . En faisant appel à Telintrans (support IT de GeoPost) pour gérer la croissance de ses appels, Chronopost propose à ses clients un duo vocal. La qualité du service rendu et le gain de temps dégagé sont appréciés. Telintrans appartient au Groupe La Poste, plus précisément à GeoPost, holding Colis de La Poste, et constitue le support IT de cette branche dans laquelle est également présente Chronopost. En 1999, Telintrans s'est attelée à trouver une solution destinée à gérer la croissance des appels enregistrés par Chronopost. Nombre de clients appelaient pour obtenir un suivi de leur colis?; ce que seul le téléphone permettait à l'époque. Le réseau internet n'était pas encore très développé en France. « Le téléconseiller se contentait alors d'annoncer la situation du colis et ne restituait finalement pas une information à valeur ajoutée », note Nathalie Gueguen, responsable du département inno-vation au sein de la direction des programmes.

2000 voit aboutir une première solution…

En 2000, une première réflexion aboutit au lancement d'une solution à base de reconnaissance et de synthèse vocales. Un système automatisé était en mesure de demander au client son numéro de colis, afin de l'informer sur la situation de ce dernier. Le nouveau service était intégré au SVI existant tout en conservant le même numéro de téléphone pour le client. Une fois le numéro composé, une arborescence en touches DTMF permettait à la personne intéressée d'avoir accès au service de suivi des colis. « Le message vocal expliquait clairement au client qu'il devait parler pour annoncer son numéro de colis. L'important était de pouvoir l'accompagner quels que soient les cas de figure, même si le client n'arrivait pas à trouver ce fameux numéro », explique Nathalie Gueguen. A ce titre, Chronopost a déposé un brevet sur une ergonomie auto-adaptative, qui consiste à accompagner toute personne quel que soit son comportement face aux renseignements demandés. Même si l'objectif était de réduire le taux de transfert vers les téléopérateurs, la possibilité d'avoir en ligne un téléconseiller existait cependant.

… et 2003 le lancement d'un portail vocal

En 2003, est intervenu le lancement d'un portail vocal, basé sur le même numéro de téléphone. Nuance étant alors utilisé pour l'aspect reconnaissance vocale et Acapela pour la partie synthèse de la parole. L'appelant a désormais le choix entre deux options?: soit obtenir le SVI classique, soit être mis en relation avec un portail de services automatisé. Ce dernier offre un suivi complet du colis (l'équivalent du site web), des estimations de délais pour l'envoi ainsi que des conditions d'expédition sur certains pays, etc. Et ce, avec le même soin d'accompagnement du client que pour le projet précédent. D'autre part, la faculté de joindre un téléconseiller reste possible à tout moment. « Nous sommes convaincus de l'importance de pouvoir faire basculer un client d'un outil automatique au centre d'appels classique. Tout simplement parce qu'il existe encore un grand nombre de personnes ne pouvant utiliser les touches de téléphone », remarque Nathalie Gueguen. A ce titre, lorsqu'une personne entre en communication avec un téléconseiller, celui-ci n'a pas à redemander la raison de l'appel ou le numéro de suivi colis, puisque l'information a déjà été transmise automatiquement. Néanmoins, il faut savoir que le taux de transfert reste malgré tout minoritaire entre le système automatique et le centre d'appels. Il est intéressant de constater que le taux de qualité de service (celui qui permet d'avoir l'information désirée par l'appelant) est passé de 65 % à 90 % entre 1999 et 2005. D'un autre côté, le gain de temps, constaté par le client, lui permettant d'obtenir l'information voulue est jugé comme appréciable.

Etude de cas. La Maaf prend goût à la synthèse de la parole.Après une première expérience réussie de réception d'appels intégrant la synthèse vocale, la Maaf a décidé de déployer cette solution vers son service clients et ses produits d'assurance.

Mutuelle d'assurances essentiellement spécialisée dans les produits IARD (assurances habitations et automobiles grand public), sans oublier une cible privilégiée de petites entreprises et d'artisans, la Maaf s'appuie, pour la gestion de ses interactions clients, sur un réseau de six cents agences régionales et sept centres d'appels internalisés (rassemblant une cinquantaine de téléconseillers) répartis selon des compétences territoriales. « Chaque agence possède un rattachement géographique avec un centre d'appels », précise Erwan Joly, chef de projet télécom. La gestion des sinistres est quant à elle assurée par la direction AIS autour des centres d'appels.

L'épargne MaafVie, intègre le vocal, en 2003

Le premier service intégrant le vocal a été lancé en 2003. Il concernait les produits d'épargne Maaf Vie et était accessible via un numéro noir mnémonique. L'application impliquait une technologie à base de synthèse vocale avec pour principe la possibilité d'énoncer la valeur des produits d'épargne souscrits par les sociétaires. « L'objectif était de pouvoir soulager les plateaux téléphoniques en déportant les fonctions à faible valeur ajoutée sur des automates. Et ce, afin de rendre davantage disponibles les téléconseillers pour des tâches à plus forte valeur ajoutée et d'étendre les services en 24 heures sur 24 et 7 jours sur 7 », explique Erwan Joly. A partir de 2004, d'autres Serveurs Vocaux Interactifs sont déployés, basés sur un Numéro Indigo, pour le compte de Maaf Santé avec pour missions la réédition d'attestations d'assurance santé ou le renseignement de l'appelant sur l'état de ses remboursements de prestation santé. Concernant le compte Maaf Assurances, un projet pilote sur un centre d'appels, “Atlas”, est mis en route, avec pour mission, en plus des fonctionnalités Santé, la réédition d'attestations auto et habitation ou le renseignement de l'appelant sur l'agence la plus proche, avec les numéros de téléphone correspondants, les horaires d'ouverture, etc. Ce troisième projet a été généralisé sur l'ensemble des centres d'appels “Atlas” (rassemblant les sept plates-formes téléphoniques) durant le premier semestre 2005 en faisant appel à l'intégrateur NextiraOne qui commercialise la solution Phonic d'Idylic (devenue Datamedia) qui, elle-même, intègre le moteur de synthèse vocale d'Acapela.

20 000 appels par jour pour le SVI assurance

Le volume d'appels concernant le SVI Maaf Vie tourne autour de 250 appels par jour tandis que, pour la partie assurance, jusqu'à 20 000 appels par jour sont identifiés. « Via l'arborescence du SVI en DTMF, un menu filtre la direction des appels en fonction des besoins. L'idée étant de privilégier le client qualifié “d'utile” ou pertinent en le dirigeant vers un téléconseiller alors que la synthèse vocale va traiter les demandes à caractère administratif des sociétaires », remarque Erwan Joly. 15 % des appels considérés comme à faible valeur ajoutée sont traités par le SVI, ce qui permet aux téléconseillers de consacrer davantage de temps aux appels plus importants. « Les Serveurs Vocaux Interactifs “Atlas” ont été mis en œuvre afin de délester les centres d'appels et donc de permettre aux téléconseillers de recentrer leur activité sur leurs missions principales », rappelle Erwan Joly. Des missions constituées par la prise d'appels, avec pour objectif d'atteindre 80 % de décroché, mais également par la fourniture de réponses le jour même aux e-mails des clients et l'émission d'appels, avec la révision de contrats sur portefeuille ou la relance pour une prise de rendez-vous suite à un devis internet.