Recherche

LES TECHNOLOGIES VOCALES SUR LA VOIE DU DEVELOPPEMENT

En retard sur d'autres pays, la France commence à s'ouvrir plus largement aux technologies vocales. La reconnaissance vocale, notamment, tend vers le langage naturel et les précurseurs, présents dans les secteurs banque et assurance, ouvrent la voie aux autres entreprises qui souhaitent améliorer la qualité de leurs services téléphoniques.

Publié par le
Lecture
34 min
  • Imprimer

«Le marché des technologies vocales a tendance à s'ouvrir mais il a souffert d'une mauvaise image due aux serveurs vocaux interactifs (SVI). En effet, ceux-ci ne sont pas appréciés du grand public et des entreprises, car leur ergonomie n'est pas toujours suffisamment pensée», constate Philippe Poux, créateur du salon VocalExpo et auteur du blogVocalNews. Alors que des pays comme les Etats-Unis ou le Japon ont investi très tôt dans la reconnaissance vocale, la France, elle, est en train de rattraper son retard. Frileuses et peu convaincues par la valeur ajoutée que pouvaient apporter ces technologies, de nombreuses entreprises ont préféré investir dans le self care sur Internet. «Les volumes de minutes ont diminué au profit des navigations web, notamment dans les secteurs de la vente par correspondance et du tourisme», explique Jean-Marc Saladian, directeur marketing des solutions CRM d'Orange Business Services. « Les prospects paraissent intéressés par le sujet, mais ils ne voient pas directement à quoi cela peut servir et quels en sont les bénéfices. Il faut donc être innovant», assure Xavier Durand, directeur associé d'Ellipsa, cabinet de conseil en stratégie et management spécialisé dans la distribution multicanal. Pour sa part, Delphine Weiskopf, responsable marketing produit Web, Voix & Mobile chez Atos Worldline, estime que «les entreprises sont globalement réceptives. Mais, pour se rassurer, elles se lancent dans des pilotes et des expérimentations qui leur permettent de découvrir les avantages de la technologie et de valider l'investissement.» Preuve du retard du marché, le système en DTMF («dual-tone multifrequency», avec une arborescence chiffrée : «Tapez 1, tapez 2... »), qui existe depuis vingt-cinq ans déjà, est encore largement utilisé dans de nombreuses sociétés. Sur le site d'Activeo, Frédéric Jurain, directeur associé, précise que, dès cette année, «environ 40 % des applications vocales intégreront la reconnaissance vocale. Cette technologie permet de concevoir des échanges homme-machine beaucoup plus riches qu'avec les traditionnels chiffres DTMF», écrit-il. La plupart des professionnels conseillent malgré tout de conserver le DTMF, quand l'arborescence reste simple, car la reconnaissance vocale nécessite de lourds investissements.

Philippe Poux (VocalExpo)
L'avantage du SVI est de pouvoir traiter des demandes assez simples et de laisser les opérateurs prendre en charge la valeur ajoutée.

Comment éviter le laborieux parcours du SVI

Le grand public semble apprécier les SVI en reconnaissance vocale : moins d'attente, moins d'étapes et plus de satisfaction au final. La plupart des entreprises qui se sont lancées dans l'expérience de la reconnaissance vocale ne regrettent d'ailleurs pas leur choix. Parmi ses avantages, la simplification du parcours et un meilleur routage assurent la satisfaction client. Certains l'ont d'ailleurs bien compris en créant, aux Etats-Unis, l'application iPhone «Dial Zero». Cet outil recense les astuces qui permettent d'éviter le laborieux parcours du SVI de certaines entreprises afin de tomber directement sur un agent. Sur son blog, Philippe Poux souligne que cette application commence à se faire connaître outre-Atlantique et est désormais perçue «comme le meilleur ami du consommateur». Ainsi, un serveur en reconnaissance vocale qui qualifie mieux et plus rapidement les appels peut s'avérer efficace en termes de satisfaction. En outre, il permet de regrouper tous les appels sur un numéro unique et de gérer d'importants flux.

Quant aux clients, ils apprécient davantage les systèmes automatisés que les agents pour certaines interactions, selon une étude réalisée par Forrester Consulting aux Etats-Unis et publiée par Nuance en janvier 2010. C'est le cas de petits services comme le renouvellement d'ordonnance (66 % pour l'automate contre 52 % pour un agent), la consultation de compte bancaire (59 % contre 36 %), les demandes d'informations (55 % contre 37 %) et le suivi des livraisons (53 % contre 47 %). De plus, 82 % des Américains ayant été en contact avec un système en reconnaissance vocale au cours de l'année acceptent aisément les systèmes téléphoniques automatisés comme service à la clientèle.

Delphine Weiskopf (Atos Worldline)
Pour se rassurer, les entreprises se lancent dans des expérimentations qu leur permettent de découvrir les avantages de la technologie et de valider l'investissement.

Anne Lacouberie (Prosodie)
L'année 2010 devrai avoir un effet de levier car les entreprises auront de réels retours d'expérience.

Reconnaissance vocale, les nouvelles applications

Aujourd'hui, la reconnaissance vocale se dirige déjà vers le langage naturel. Selon le principe de la question ouverte "Comment puis-je vous aider ?», le client répond naturellement par une phrase et le système en reconnaît les mots-clés pour le diriger vers la bonne compétence. Le dialogue devient alors quasiment humain. D'ailleurs, le client peine parfois à savoir s'il est en communication avec un véritable agent ou avec une machine. Anne Labouberie, responsable marketing de la division contact client de Prosodie, note à ce sujet : «Je suis assez surprise à l'écoute des appelants qui sont très à l'aise avec cette technologie. » Certains acteurs précisent qu'ils surprennent leurs clients à remercier la voix du serveur vocal. Prosodie a mis en oeuvre le langage naturel avec certains clients comme le Crédit Agricole de Normandie, Swisslife et Carrefour Services Financiers (voir p. 66). « 2009 a véritablement été l'année du langage naturel, particulièrement dans le monde bancaire, indique Anne Lacouberie. Aujourd'hui, le cahier des charges des entreprises prévoit systématiquement la reconnaissance vocale et le langage naturel. L'année 2010 devrait d'ailleurs avoir un effet de levier car les entreprises auront de réels retours d'expérience. » Le lancement d'une nouvelle technologie nécessite un pionnier. « Personne ne veut être le premier, mais tout le monde veut être le second », précise David Gérard, IT BID Manager de Sitel. Patrice Vielpeau, responsable des ventes de solutions vocales de Nuance, ajoute : «Dans le secteur bancaire, il y a d'ailleurs un phénomène d'entraînement. Les entreprises sont rassurées une fois que les autres grands comptes se sont lancés. » Certaines entreprises demeurent malgré tout réticentes et reviennent à ce qui les rassure. Elles maintiennent notamment le principe de la reformulation afin de vérifier l'exactitude de la requête. Le serveur reformule alors la demande du client, lequel doit la valider. «Trop d'entreprises sont encore timides et font appel à la reformulation qui est perçue comme agaçante par les utilisateurs », juge Philippe Poux. Pour autant, les acteurs du marché prévoient une interaction de plus en plus naturelle et des SVI en reconnaissance vocale de plus en plus performants. Cette année, Prosodie envisage de mettre en place un outil de détection de mots-clés. Le moteur pourrait ainsi repérer le nom d'un concurrent ou même détecter l'humeur d'un client.

En revanche, quand les acteurs du marché sont interrogés sur la substitution de l'homme par la machine, ils répondent unanimement que rien n'est engagé dans ce sens. « On ne remplacera jamais l'humain. L'avantage du SVL est de pouvoir traiter des demandes assez simples et de décharger les opérateurs pour leur laisser la prise en charge de la valeur ajoutée », souligne Philippe Poux. Même position pour David Gérard : « Ce genre de système permet de faire monter les collaborateurs en compétence.» Pour illustrer son propos, il évoque un exemple concret : « Dans le cadre d'un service de recouvrement, la solution du serveur automatique, déjà appliquée au Canada, vient d'être lancée en France. Le serveur appelle le client, lui pose quelques questions pour s'assurer de son identité. Il l'invite ensuite à régler sa facture directement par téléphone. Seulement 10 % des relances sont gérées de la sorte. Le robot permet de récupérer l'argent à moindre coût et laisse ainsi les agents se concentrer sur des cas plus complexes. »

La biométrie vocale a-t-elle un futur ?

A l'avenir, les professionnels du secteur bancaire envisagent le lancement de la biométrie ou signature vocale. Ils devraient particulièrement s'intéresser à cette solution pour identifier l'appelant, authentifier son identité et sécuriser ses transactions. La voix étant aussi fiable que des empreintes digitales, le client s'identife en prononçant un mot ou une phrase. De nombreux acteurs se montrent enthousiastes à l'évocation de cet outil. Mais celui-ci risque de rencontrer quelques obstacles. Encore une fois, une partie des entreprises et du grand public pourrait se montrer méfiante face à cette innovation. Pour Delphine Weiskopf « la technologie est mature et disponible, mais nous n'avons pas encore de clients aujourd'hui. L'écho n'est pas très fort pour deux raisons. D'une part, la technologie doit être utilisée pour renforcer une authentification, notamment dans le secteur bancaire. L'usage est donc plus ciblé que pour les autres technologies vocales. D'autre part, en termes de logistique, il va falloir retenir un premier "échantillon" de voix de chaque utilisateur pour l'identifier lors de l'appel Les clients peuvent avoir peur que ce soit trop lourd, ou encore refuser de participer. » En effet, pour mettre en place le système, le serveur doit d'abord enregistrer la voix du client plusieurs fois pour qualifier correctement l'empreinte vocale, ce qui peut représenter une étape trop longue et compliquée pour le client. Prosodie a conçu deux maquettes dans le secteur bancaire, dont la phase pilote devrait avoir lieu cette année.

Chez Orange Business Services, les ingénieurs d'Orange Lab travaillent sur des projets en lien avec l'empreinte vocale pour s'identifier plus rapidement : se logger dans les centres d'appels, éviter de donner son mot de passe, avoir accès à son compte en banque, etc. Dans le cadre de la relation client, aucune entreprise n'a mis en place cette technologie qui nécessite un accord de la Cnil. Aujourd'hui, seul le fabricant de pneumatiques Michelin a reçu un avis favorable, fin 2007, pour lancer ce système de reconnaissance vocale, dans le but d'identifier ses salariés en centres d'appels.

Où en est la synthèse vocale ?

Par Antoine Kauffeisen, directeur marketing et CEO d'Acapela
« Dans les années quatre-vingt, la synthèse vocale était compréhensible, mais entièrement synthétique et robotique, donc peu naturelle. Depuis 2000, la qualité a évolué avec de nouvelles voix et de nouvelles langues comme l'arabe (on en compte 25 aujourd'hui). Le recours croissant à cette technique a posé problème pour certaines entreprises, car elles possédaient une voix en commun. C'est notamment le cas des constructeurs BMW et Mercedes. aujourd'hui, de plus en plus de sociétés souhaitent des voix uniques. Désormais, nous signons plusieurs fois par an des voix propriétaires pour créer une véritable image de marque. D'un point de vue technologique, la réalisation de la synthèse émotionnelle [apporter de l'émotion dans la voix de synthèse NDLR] n'est pas encore concluante et, pour l'instant, nous n'avons rien de concret. La dernière grande tendance est la voix en tant que service (VaaS : Voice as a Service). Les clients se connectent au serveur d'Acapela et paient en fonction de leur utilisation. Nous proposons ce nouveau service depuis un an et demi auprès de clients dans de nombreux domaines (marketing viral, e-learning, annonces publiques, annonces en gares, etc.). D'ici cinq ans, plus de la moitié des clients devraient certainement utiliser le VaaS. »

LANGAGE NATUREL
Pass Services Financiers réduit son parcours client

Depuis un an, le centre d'appels des services financiers du groupe Carrefour est géré par un serveur vocal en langage naturel. Cette nouvelle expérience a permis à la relation client de gagner en efficacité et en qualité.


Pass Services Financiers (S2P), la filiale bancaire du groupe Carrefour, propose un éventail de produits et services financiers tels que la carte Pass, des offres de prêts personnels (travaux, auto, etc.), mais aussi des produits d'assurance-vie et d'épargne. En plus des espaces financiers en magasins et du site internet, une équipe de 80 collaborateurs assure le service après-vente par téléphone. Depuis sa création, ce service a toujours fonctionné avec les systèmes de Prosodie. Jusqu'en février 2009, S2P traitait ses appels en DTMF, serveur vocal classique de choix par système de touches. A cette même période, le service financier change de stratégie et transforme toutes ses cartes Pass et ses cartes de paiement Visa, en cartes de paiement Mastercard.
Pendant la phase de transition, qui a duré neuf mois, le centre d'appels a dû faire face à des clients dont les programmes différaient. L'arborescence en DTMF devenait trop complexe pour gérer correctement le traitement de la demande. « Nous devions simplifier le parcours des clients. Ceux-ci se font comprendre en s'exprimant naturellement. Nous leur avons donc donné la possibilité de s'affranchir de notre vocabulaire métier, tout en poursuivant l'évolution de notre offre», explique Sandra Corby responsable de la vente à distance de Pass Services financiers.


Un serveur vocal factice pour créer le moteur de recherche
Face à cette problématique, le langage naturel s'est révélé la solution la plus adaptée. Avant de mettre en place la nouvelle solution, les équipes de Prosodie ont investi dans un serveur vocal factice en langage naturel qui comportait un message d'accueil : "Bienvenue sur le nouveau serveur vocal des services financiers Pass. Exprimez naturellement la raison de votre appel". En réalité, toutes les phrases étaient enregistrées, puis les appels routés sans qualification, vers des chargés de clientèle. Durant cette période, près de 20 000 enregistrements ont été traités manuellement par le biais de la phonétique, puis analysés un à un afin de créer l'arborescence. «Pour le client, il y a d'infinies possibilités de s'exprimer au sujet d'un même produit. Grâce à l'enregistrement des demandes clients, nous nous sommes rendus compte que notre façon de communiquer au cours de notre travail était spécifique à nos métiers et quelques fois différente du langage de nos clients», souligne Sandra Corby. Une fois le projet lancé, des équipes ont continué d'écouter les expressions de ceux qui appellent. Ce qui a permis d'enrichir le moteur de recherche pour que le serveur vocal devienne plus autonome et qualifie mieux les appels.


Le langage naturel rend la relation client plus humaine
Concernant les réactions des clients face à ce nouveau système, Sandra Corby se réjouit. «Le serveur vocal interactif a été bien adopté et apporte un supplément d'âme à la relation client. Finalement, nous lui avons redonné sa dimension humaine. Ll est intéressant de constater que certains clients ne sont pas sûrs déparier à une machine. En effet, ils remercient à leur façon et avec leurs propres expressions la voix enregistrée, avant d'être dirigés vers un chargé de clientèle qualifié. Les clients sont satisfaits de ce nouveau serveur, car je pense qu'il y a une saturation des SVL à choix multiples», indique-t-elle. Le bilan s'avère donc assez positif. Le parcours client a quasiment été divisé par deux. Le taux de compréhension qui permet un routage vers le bon conseiller s'élève à 85 %. En termes de relation client, le résultat se révèle également efficace car les conseillers se retrouvent face à des clients qui ont moins attendu et de ce fait sont plus satisfaits. C. M.

Chiffres

Avec l'ancien serveur vocal, le client devait faire six choix en horizontal et jusqu'à neuf choix en vertical.


Le centre d'appels génère près de 25 % du chiffre d'affaires de la filiale du groupe Carrefour.

TEXT TO SPEECH
EasyJet présente ses voeux de vive voix

Le spécialiste des vols low cost sur Internet profite des différentes fêtes de l'année pour envoyer des cartes parlantes à ses clients. Partenaire d'Acapela depuis un an, la compagnie dresse un bilan positif de ces opérations virales.


Depuis plus d'un an, chaque événement est devenu une occasion pour easyjet de lancer une campagne d'eCards parlantes. Pour concrétiser ce projet, la compagnie a fait appel à Acapela et ses solutions de synthèse vocale. Cette campagne virale a démarré début 2009, lors d'un premier envoi de cartes de voeux vocales personnalisées. Le principe : souhaiter une bonne année à chaque client par le biais d'une mascotte parlante, puis lui proposer d'en faire de même auprès de ses contacts en créant un texte personnel. Tout au long de l'année, différentes eCards sont envoyées aux deux millions de clients et prospects : Saint-Valentin, fête des Mères, fête des Pères, etc. Quel que soit l'expéditeur, chaque destinataire reçoit une offre promotionnelle sur les vols de la compagnie après avoir réceptionné l'eCard. Plus les internautes transfèrent les eCards, plus la société gagne en visibilité. «Par le biais du parrainage, nous avons créé de la dynamique et de la vitalité et gagné de nouveaux clients », précise Elisabeth Le Gall, directrice marketing d'easyJet France, Belgique et Pays-Bas.


Donner une image plus chaleureuse
En ce début d'année, easyJet a réitéré l'expérience en envoyant des eCards de «bonnes résolutions 2010». Les destinataires étaient invités à envoyer des cartes personnalisées en fonction de leurs interlocuteurs : «pour mes amis», «pour mes collègues», «pour mon amour» ou «pour voyager». Dans un décor différent, une hôtesse de l'air ou un steward prononce le message écrit par l'internaute. Ces eCards ont été adressées aux clients néerlandais, italiens et français. Pour easyJet, dont le canal de vente majeur est le Web, elles améliorent la prise en considération de ses clients. «Etant donné que nous vendons 95 % de nos billets en ligne, ces eCards confèrent une image plus chaleureuse à la marque auprès des clients derrière leurs écrans», souligne Elisabeth Le Gall.
En termes d'acquisition, les retours semblent positifs. easyJet a enregistré 460 000 visites uniques sur le mini site eCard. Elisabeth Le Gall précise également que les tags installés sur les pages de confirmation ont permis de connaître le nombre de ventes générées (sans préciser les chiffres), avant d'ajouter que les résultats sur les ventes sont quasiment équivalents à ceux d'un e-mailing classique. «C'est surtout un moyen de communiquer différemment et de profiter de l'aspect viral, absent d'une campagne classique d'e-mailing», ajoute Elisabeth Le Gall et de préciser que «les utilisateurs apprécient la mascotte. De plus, ils peuvent envoyer des messages décalés et détourner la technologie. Par ailleurs, nous leur offrons un outil gratuit qui leur permet d'impressionner leur entourage car les eCards sonores sont encore assez rares.» A terme, easyJet prévoit de réutiliser la technique de synthèse vocale d'Acapela pour d'autres applications et opérations de communication. C. M.

Elisabeth Le Gall (easyJet)
L'eCard parlante est surtout un moyen de communiquer différemment e de profiter de l'aspect viral.

RECONNAISSANCE VOCALE
Un SVI à la hauteur d'une arborescence dense

Pour optimiser le routage des appels vers l'assistance téléphonique, Cegid a confié à nuance la conception d'un SVI en reconnaissance vocale. un système qui se révèle efficace pour gérer les demandes.


Chaque jour, Cegid doit répondre a plus de trois mille appels pour gérer l'assistance de ses 350 000 clients finaux. Les 11 centres d'appels du distributeur de solutions logicielles dédiées à la performance de l'entreprise traitent de nombreuses demandes. En plus de l'après-vente, ils sont chargés de la télévente, du télémarketing et du recouvrement. Jusqu'en 2007, plusieurs numéros étaient dédiés à chaque demande. Cegid faisait alors assurer le routage de ses appels par une opératrice qui qualifiait la requête du client. « Nous souhaitions apporter un service plus rapide et plus ciblé à nos clients. Etant donné la diversité des motifs d'appels et le nombre de solutions que nous commercialisons, nous avons tout de suite pensé à la reconnaissance vocale. », explique Pascale Cornil, responsable de projet au sein de la direction de l'organisation de Cegid.


Un routage moins long
Pour ce faire, Cegid a décidé de faire appel à l'intégrateur Activeo, son partenaire depuis 2003. En alliance avec Nuance, ce dernier s'est donc chargé du déploiement de la solution pour l'ensemble des appels concernant l'assistance téléphonique, accessible via un numéro unique. En amont, le serveur assure l'identification de l'appelant et du logiciel qu'il utilise ainsi que de l'orientation vers la bonne compétence. Cette solution opérationnelle et évolutive a permis de faire gagner du temps lors du routage des appels et donc d'accroître la satisfaction client. « Dans 90 % des cas, notre client est reconnu par son numéro de téléphone. Si ce n'est pas le cas, le SVL lui demande de s'identifier avec son numéro de client grâce à la reconnaissance vocale. Cette technologie nous paraissait la plus dynamique et la plus adaptée au profil de notre client », précise Pascale Cornil.
Le bilan s'avère plutôt positif, avec un taux d'identification du client de 92 % et un taux de reconnaissance de la demande et du logiciel de 90 %. Pascale Cornil ajoute que 70 % des appels reçus sont routés vers la compétence adaptée. Pour ce qui est de l'évolution de la solution : « Nous sommes toujours à l'affût pour que l'outil reste en phase avec Cegid et surtout avec les attentes de nos clients », conclut-elle. C. M.

CLAIRE MOREL

S'abonner
au magazine
Se connecter
Retour haut de page