Recherche

Technologies vocales : la reconnaissance

Grâce à une technologie de plus en plus maîtrisée, les projets à base de reconnaissance vocale et synthèse de la parole se propagent doucement mais sûrement. Même si aucune étude ne permet de savoir ce qu'en pensent réellement les clients, le succès de la technologie vocale semble amorcé. Par Jérôme Pouponnot

Publié par le
Lecture
17 min
  • Imprimer


Les projets à base de technologie vocale sortent de l'ombre. Preuve de cet engouement, “Vocal Expo”, le premier salon consacré à ces technologies, qui s'est tenu durant le mois de juin dernier. De nombreux acteurs ont fait le déplacement et les visiteurs ont pu mettre à profit leurs rencontres pour dévoiler leurs projets. En ce qui concerne les acteurs eux-mêmes, la concentration continue son petit bonhomme de chemin et de multiples accords/partenariats sont régulièrement signés. Dans le domaine de la reconnaissance vocale, côté éditeurs, l'accord le plus important émane de la fusion réalisée, durant l'été 2005, entre Scansoft et Nuance. Fin 2005, cette fusion a donné naissance à la société Nuance Communications qui détient, sur le plan mondial, 75 % du marché de la reconnaissance vocale, devant IBM et Microsoft (selon Gartner). Nuance a également signé récemment un accord de partenariat avec la plate-forme Genesys. Sur le marché français, l'éditeur Telisma semble être le numéro un en matière de “reco” et amplifie ses partenariats. TLM Com, Prosodie, Tetco Technologie ou encore Eicon sont autant d'entreprises qui collaborent désormais avec cet éditeur. Seul Loquendo semble tirer son épingle du jeu entre les deux géants IBM et Microsoft. Dans le domaine de la synthèse de la parole – outre Nuance et Telisma également présents sur cette technologie –, Acapela fait preuve d'un certain dynamisme, n'hésitant pas non plus à collaborer avec les éditeurs précédemment cités. Toujours en matière d'éditeurs, mais avec une étiquette dite “spécifique”, avec services packagés, on retrouve TLM Com, Natural Touch ou Vecsys. Dans le domaine des opérateurs/hébergeurs/intégrateurs, Prosodie, Jet Multimédia ou Atos Worldline s'octroient la plupart des projets vocaux. Très en vue ces dernières années, les plates-formes de type Voice XML rassemblent des acteurs tels que VocaBase, Eloquant, Map Telecom, VoxPilot ou encore Genesys. Enfin, sur le plan des constructeurs, l'accord récent entre Eicon et Dialogic illustre une nouvelle fois la forte activité de ce domaine.

Un engouement qui s'accentue

Tous les acteurs de la profession s'accordent à dire que le marché lié aux technologies de la parole s'est considérablement développé, dans le sens où les entreprises ne se posent plus la question de savoir si elles vont mettre en place un projet, mais comment. « Un changement de mentalité s'est opéré : nous sommes passés de la période des “reco-sceptiques” à une phase où les enthousiastes se multiplient », estime Jean-Jacques Devaux, directeur marketing de Telisma. Il faut aussi se demander ce qui motive les entreprises à mettre en place un projet de reconnaissance ou de synthèse de la parole. « Les entreprises cherchent à optimiser la mise en relation entre l'appelant et le téléconseiller le plus pertinent. Et donc à s'appuyer sur la qualification des appels à partir de la “reco”, de façon à comprendre la raison de ces appels. Il s'agit d'un travail en amont avant la mise en relation éventuelle avec le téléconseiller », explique Jean-Jacques Devaux. En outre, les sociétés cherchent généralement à étendre leurs offres de produits/services, ce qui entraîne en conséquence une augmentation des raisons pour lesquelles les clients sont amenés à appeler leurs fournisseurs. Or, face à une logique où l'on autorise une seule entrée, via un seul numéro d'appel, il est nécessaire de filtrer et qualifier les appels. Une tâche qui peut très bien s'effectuer par un système de reconnaissance vocale. « En règle générale, un SVI (Serveur vocal interactif) s'appuyant sur du DTMF (utilisation des touches classiques de son téléphone), obtient un taux d'appels mal reroutés aux alentours de 30 %, chiffre abaissé à 1 % avec un service d'accueil en reconnaissance de la parole », précise Jean-Jacques Devaux. De moins en moins de limites dans le vocabulaire, beaucoup de souplesse dans la mise en place avec une réactivité importante : les projets vocaux attirent un nombre croissant d'adeptes. Une autre tendance apparaît avec la RVAO (Reconnaissance vocale assistée par opérateur), comme le souligne Patrice Vielpeau, directeur commercial, activité Network Speech de Nuance : « Depuis deux ans, le marché de la reconnaissance de la parole a fortement mûri, avec un nombre croissant de projets en RVAO, qui permettent de rassurer les consommateurs/clients. Ces projets sont fortement ancrés en France et en Espagne. » Deux cas de figure se présentent lors de la mise en place d'une RVAO. Soit l'appelant n'est jamais mis en relation avec un opérateur humain et, dans ce cas, l'opérateur l'oriente de façon transparente sans que le client s'en aperçoive. Soit un menu est proposé à l'appelant afin d'être mis en relation avec un téléopérateur et ce, quelle que soit la raison. Sur le marché américain, les projets de reconnaissance/ synthèse de la parole ont franchi une nouvelle étape. Ils ne se contentent plus simplement de poser des questions fermées, mais également des questions ouvertes. On parle ainsi de reco avec des modèles statistiques : outre le travail très évolué d'analyse de la syntaxe, en fonction de la réponse, l'appel est classé dans une certaine catégorie afin de le router efficacement. Par ailleurs, de nombreux projets vocaux voient le jour, car le marché est entré dans une phase de renouvellement des SVI mis en place à la fin des années 90. Les entreprises en profitent ainsi pour installer des platesformes reposant sur des standards tels que le Voice XML. A ce titre, la naissance d'un tel standard a permis de simplifier le développement des applicatifs et d'initier le déploiement à plus grande échelle des projets vocaux. Il est bon de souligner également que les projets à base de technologies vocales ne sont pas mis en place pour réduire des coûts ou supprimer des emplois, mais bien pour déployer des services qui n'auraient pas vu le jour avec un SVI classique. En matière de coût, les éventuelles réductions sont induites grâce à la plus grande efficacité des opérateurs, résultat d'une plus importante qualification des appels. En effet, ces projets entraînent une automatisation des tâches répétitives et permettent de consacrer davantage d'attention aux relations à plus forte valeur ajoutée. Concernant la synthèse de la parole, deux grands schémas se dégagent. Dans le premier, lorsque celle-ci n'a pas été intégrée dans le système d'information, elle est utilisée pour générer du contenu audio que l'on met à disposition à partir de serveurs d'information ou de sites web. Les annonceurs investissent alors dans un outil capable de transformer un texte en fichier son. Dans le second cas, l'intégration de la synthèse de la parole peut s'effectuer dans une application et les mises à jour de l'éditeur contribuent à rendre le projet de plus en plus performant. « Il est intéressant de souligner également que l'on assiste à une augmentation rapide des capacités des hébergeurs en matière de technologie vocale, aussi bien en synthèse qu'en reco pour répondre à la demande progressive des annonceurs », souligne Antoine Kauffeisen, directeur marketing d'Acapela.

UNE FRILOSITÉ QUI SE DISSIPE

Les plus grands annonceurs n'hésitent plus à se lancer désormais dans de vastes projets à base de reconnaissance vocale. Le dernier en date n'est autre qu'Air France qui propose désormais un numéro unique, le 3654, basé sur un système de reconnaissance de la parole, pour entrer en communication avec le groupe. Plus tôt dans l'année, France Télécom, avec son “3000”, et Darty s'étaient également lancées dans l'aventure reco. C'est également le cas pour la RATP et la SNCF qui proposent désormais des services très efficaces pour obtenir des horaires et des informations à base de reconnaissance vocale. Seule ombre, et pas des moindres, l'absence de communication (à l'exception d'Air France) sur ces nouveaux services auprès du grand public. Cette absence est-elle due à l'image encore trop présente de l'automatisation des tâches entraînant des suppressions d'emplois ? Il faudrait pourtant briser cette idée reçue, puisqu'aucun des projets vocaux mis en place, ces dernières années, n'a abouti à des suppressions d'emplois, mais en revanche à des revalorisations des tâches accomplies par les téléopérateurs. Toujours est-il que 2007 devrait confirmer le déploiement des projets vocaux… Sauf si les retours des premières enquêtes de satisfaction mettent en évidence un intérêt mitigé, voire négatif, de la part des clients. Face à l'absence de ces retours terrain, le ciel semble dégagé pour de nouveaux projets.

Les quatre grandes dimensions d'un projet de technologie vocale

L'identification des appelants en simplifiant le processus. Le routage intelligent : la mise en relation du client avec la bonne personne s'effectue grâce à un jeu de questions/réponses. La qualification des appels. L'accueil d'entreprise grâce aux annuaires.

Fidelia Assistance valorise ses chargés d'assistance.

Souhaitant rester à la pointe de la technologie et revaloriser le travail de ses chargés d'assistance, Fidelia Assistance a mis en place un serveur de reconnaissance vocale pour les sociétaires GMF. Fidelia Assistance, filiale d'AGMAA (GMF et Azur), est une société spécialisée dans l'assistance automobile, médicale et de proximité. Plusieurs plates-formes téléphoniques (rassemblant plus de trois cents chargés d'assistance) ont été créées pour prendre en compte les appels des clients et leur apporter le service dont ils peuvent bénéficier. Le projet vocal fut mis en place fin juillet dernier à destination des sociétaires GMF avec un numéro dédié. Avant ce projet, Fidelia Assistance disposait, depuis 2002, d'un SVI dans lequel les appelants avaient le choix entre deux menus, dont un mettait en relation un chargé d'assistance avec le client et l'autre permettait de joindre le service technique. « En juillet 2006, nous avons donc décidé de coupler ce service avec un projet de reconnaissance vocale pour faciliter encore plus l'accès à nos services », explique Valérie Gandet, adjointe auprès du directeur financier et chargée du projet de reconnaissance vocale. Ainsi, la solution de reconnaissance vocale de Telisma, mise en production par NextiraOne, propose à l'appelant de préciser “panne” ou “autre demande”. Les autres demandes aboutissant toujours au standard et les pannes au service technique. Pour ce dernier cas, il est demandé aux sociétaires d'énoncer le numéro de leur plaque d'immatriculation afin de faire remonter le dossier client, garantissant un gain de temps pour traiter l'appel. « Deux raisons expliquent cette évolution. Fidelia Assistance apprécie d'être novateur, d'une part, et nous avons souhaité, d'autre part, après vérification de l'exactitude des renseignements, que les chargés d'assistance puissent mettre en oeuvre plus rapidement leurs opérations », commente Valérie Gandet. Un métier qui consiste à apporter des services d'assistance et non à rechercher les clients dans une base de données. « L'idée n'est pas de supprimer des emplois, mais bien de revaloriser les fonctions des chargés d'assistance », précise Valérie Gandet. En outre, les clients appellent souvent à partir de leur portable, or un SVI à touches DTMF n'est pas pratique pour cette population, la parole étant plus naturelle. A ce jour, aucun retour de satisfaction ou de non-satisfaction n'est parvenu à la direction de Fidelia Assistance, un manque qui doit être comblé avant la fin de l'année via une enquête de satisfaction. Enfin, courant 2007, un projet visant à prendre en considération les contacts via les flux SMS et les e-mails devrait voir le jour.

« Les téléopérateurs ne doivent plus être “pollués” par des appels à faible valeur ajoutée »

Quelles sont vos impressions sur la première édition de VocalExpo ? Nous avions misé sur la venue d'environ dix-huit, dix-neuf acteurs du monde gravitant autour du vocal ; finalement vingt-six se sont déplacés. Même chose pour les dossiers de candidature aux Trophées, avec près d'une trentaine à examiner, comportants de très beaux projets. Nous avons eu plus de 400 visiteurs, presque tous avec un projet sous le bras. D'ailleurs, les exposants ont confirmé cette impression. On peut segmenter cette population en deux. D'un côté, des dirigeants et des cadres d'entreprises qui avaient une problématique d'évolution de systèmes. De l'autre, ceux qui n'étaient pas complètement persuadés de mettre en production un projet vocal, et qui ont été convaincus suite à leur passage dans les stands. A ce titre, j'ai appris que quatre projets ont pu voir le jour durant le salon. Ce fut aussi l'occasion pour certains professionnels de se rencontrer et d'avancer dans leurs discussions, collaborations, partenariats (Eicon et Telisma notamment). Enfin, on s'est aperçu que de nombreuses personnes avaient besoin de concret ; preuve en est, le succès des ateliers avec des témoignages clients, au détriment des conférences. Selon vous, quelles sont les raisons de se tourner vers un projet reposant sur une technologie vocale ? Il s'agit avant tout de rendre un service à ses clients. L'automatisation de la réception d'appels va permettre de rendre ce service plus rapide et plus fluide sans même se poser la question liée aux coûts de l'investissement. Par fluidité et rapidité, il s'agit de pouvoir répondre à une demande d'appels qui ne cesse de varier. Il faut préciser que les types d'appels résorbés par une automatisation sont des choses simples et récurrentes, où les compétences liées à l'intelligence humaine ne sont pas nécessaires. C'est encore plus vrai pour les entreprises sujettes à une saisonnalité importante. En outre, surdimensionner un serveur vocal coûte beaucoup moins cher que de surdimensionner un centre d'appels. La question du remplacement des personnes est-elle justifiée ? C'est un faux problème à mon sens car, en règle générale, la problématique des centres d'appels est d'abord d'être capables de traiter des flux et d'apporter une meilleure réponse client. Or, aujourd'hui, peu de centres de contacts sont en mesure d'être très disponibles. Il faut donc, non pas alléger les postes, mais faire en sorte que les téléopérateurs ne soient pas “pollués” par des appels à faible valeur ajoutée. La bonne question à se poser est donc la suivante : “est-ce que je n'ai pas plutôt intérêt à automatiser une partie de mes appels afin de me concentrer sur ceux à plus forte valeur ajoutée et ainsi faire monter mon personnel en compétence ?” Dans les centres de contacts, les véritables risques concernant l'emploi aujourd'hui sont davantage liés à la montée en puissance des pays en voie de développement qu'à l'automatisation des appels.

Mobil M refond son accueil téléphonique.

Afin de structurer l'ensemble de ses quatre sites, mutualiser les moyens et les compétences de chaque entité et élargir sa plage d'accueil, Mobil M a choisi une solution d'opératrice virtuelle à reconnaissance de la parole. Société créée en 1968, spécialisée en architecture et aménagement d'espaces commerciaux, plus particulièrement dans le domaine pharmaceutique, Mobil M se présente comme une structure à la pointe des nouveautés. « Notre philosophie s'appuie sur la performance et l'exception, par l'innovation et le design », déclare Rodolphe Thyboyeau, directeur des systèmes d'information. Mobil M dispose de onze concessions à travers la France et 50 % du chiffre d'affaires est réalisé à l'extérieur des frontières, notamment en Europe. Le souhait de Mobil M était d'apporter une compétence d'accueil disponible sur des plages d'horaires plus larges et opérationnelles. « Nous avons, d'un côté, nos conducteurs de travaux qui commencent très tôt le matin et, de l'autre, nos créatifs qui travaillent tard le soir. En outre, les pharmaciens ont l'habitude d'appeler à des horaires un peu décalés », souligne le directeur des systèmes d'information. Mobil M souhaitait également pouvoir mutualiser les moyens d'accueil, pour, à partir d'un seul système, pouvoir répartir des flux sur plusieurs sites (agences commerciales, unités de production, etc.). « Nous nous demandions comment procéder pour éviter d'avoir une opératrice sur chacun des sites, et nous devions également parvenir à être plus efficaces dans la prise en charge de nos appels, vis-à-vis de nos clients, partenaires prescripteurs et nos fournisseurs. Sans oublier de garder une bonne maîtrise des coûts », ajoute Rodolphe Thyboyeau. Le projet a été soumis à NextiraOne qui a mis la société en contact avec TLM Com. Ainsi, Mobil M a opté pour la solution d'opératrice virtuelle à reconnaissance de la parole, Wel'Com, avec une mise en production au mois de janvier 2006. Plus simple d'utilisation et plus conviviale que le DTMF, la solution traite chaque appel entrant, le qualifie et le redirige automatiquement. Un numéro unique a été mis en place pour les quatre sites afin de faire converger tous les flux. Grâce à la création d'un annuaire interne, les appels entre employés sont également facilités. L'installation de la solution s'est déroulée de façon fluide et rapide et permet, aujourd'hui, de gérer la plupart des appels. Wel'Com a été très bien accueillie en interne, en optimisant la communication entre les sites et en permettant aux standardistes de consacrer leur temps à des tâches à valeur ajoutée. « L'objectif de la solution n'est pas de supprimer du personnel, car la présence physique est indispensable, mais bien de valoriser les compétences des opératrices au-delà du simple aiguillage d'appels », précise Rodolphe Thyboyeau. En outre, à tout moment, l'appelant a la possibilité de joindre une personne à l'accueil. Egalement plébiscitée par les appelants extérieurs, la solution a réduit de façon significative les intermédiaires et les temps d'attente. « Globalement, les clients sont plutôt satisfaits, puisqu'ils peuvent joindre plus efficacement la personne désirée. Dans un premier temps, certains étaient cependant réfractaires à la technologie mais, au final, y trouvent de l'intérêt. Et il y a tous ceux qui ne se rendent même pas compte qu'ils sont en ligne avec un automate », constate Rodolphe Thyboyeau. Enfin, au travers du logiciel Outlook, un interfaçage permet d'obtenir une remontée de tous les messages vocaux, fax et bien sûr e-mails, directement sur le logiciel de messagerie.

Epson France souhaite optimiser le processus d'identification des appelants.

Soucieuse d'orienter et d'identifier ses clients plus rapidement, la société a mis en place un SVI. Par ailleurs, elle étudie un projet à base de reconnaissance de la parole. Près de 250 000 appels par an pour des demandes de renseignements techniques sur les produits en avant-vente et après-vente sont reçus par Epson. Le nombre de numéros téléphoniques et les contraintes de qualification par produit posaient à Epson des problèmes de traitement d'appels, notamment vis-à-vis des grands comptes possédant des produits de diverses catégories. Afin de mieux qualifier ces flux, Epson a décidé, en septembre 2006, de simplifier son accueil téléphonique et de confier à Prosodie la collecte des appels, le traitement et l'hébergement de son Serveur vocal interactif (SVI). L'objectif étant d'avoir l'arborescence la moins complexe possible sur la circulation de la communication au travers du SVI. « Nous avions besoin d'identifier clairement nos clients, nos types de clients et nos produits. Aussi, l'important était de mettre en place une arborescence via les différentes touches du terminal téléphonique et les messages enregistrés, pour permettre aux clients de joindre le bon téléconseiller du support technique », explique Patrick Blusseau, directeur service et support. Les services Epson sont accessibles via trois numéros, le SVI qualifiant ensuite les appels par gamme de produits et les dirigeant vers un des plateaux téléphoniques. Epson a prévu dans l'arborescence du SVI un accès privilégié pour les grands comptes et les revendeurs afin de faciliter le traitement de leurs diverses requêtes. De même, un service automatique de localisation téléphonique permet de connaître rapidement les coordonnées du centre réparateur Epson le plus proche. Jusqu'en juin 2006, Techcity gérait le support technique pour les clients du constructeur. Depuis cet été, Sellbytel a repris le flambeau avec, d'un côté, un centre de contacts pour les professionnels, situé à Lyon, et, de l'autre, un centre à Barcelone pour le grand public. Le processus de simplification des appels et surtout d'identification des appelants restent présents à l'esprit d'Epson, qui pourrait intégrer la reconnaissance de la parole. « Nous sommes en train de discuter sur un projet de reconnaissance de la parole afin d'identifier plus rapidement les clients qui nous appellent et avoir le meilleur interlocuteur joignable. Ce projet, s'il prend forme, ne se fera pas avant 2007 et suivra une stratégie de coordination au niveau européen », conclut Patrick Blusseau.

Par Jérôme Pouponnot

S'abonner
au magazine
Se connecter
Retour haut de page