jeudi 23 janvier 2014

DSI, investissez dans les technologies du langage ! par Bruno Mathis, Engagement manager chez Sterwen

A lire sur: http://www.infodsi.com/articles/145571/dsi-investissez-technologies-langage-bruno-mathis-engagement-manager-chez-sterwen.html

samedi 28 décembre 2013
Le traitement automatisé du langage, ou TAL, recouvre l’analyse sémantique, qui consiste à extraire le sens d’un texte, la synthèse sémantique, qui fabrique au contraire un texte à partir de données structurées, la reconnaissance automatique de la parole, qui transforme la parole en texte écrit (« speech-to-text »), et la synthèse vocale, qui crée à l’inverse de la parole artificielle à partir de n’importe quel texte.

Tout d’abord, l’analyse sémantique, ou « text-mining », par effet de symétrie au « data-mining » popularisé par SAS Institute dans les années 80, se développe aujourd’hui sur des applications où l’analyse lexicale, c’est-à-dire l’extraction de textes sur la base de mots-clefs et leurs synonymes, a atteint ses limites. Par exemple, l’analyse sémantique sait annoter du risque d’attrition les expressions « vous allez perdre un client » et « j’irai peut-être voir ailleurs », tandis que l’analyse lexicale s’avère inopérante.

Parmi les premiers cas d’usage, on compte l’analyse de brevets, le classement de CV, ou l’enrichissement de contenus, notamment pour « étiqueter » automatiquement la documentation de l’entreprise. Une deuxième vague d’applications apparait sur le cas d’usage de l’analyse des verbatims des clients de l’entreprise. Ces verbatims peuvent prendre la forme de réponses à des questions ouvertes, dans des enquêtes de satisfaction, des mails, des tweets ou des commentaires saisis lors d’un passage en caisse, dans un supermarché. L’analyse sémantique permet d’en extraire les sujets, mais aussi le sentiment de l’auteur. Elle est en train de s’imposer, dans le dépouillement des enquêtes, comme un outil de productivité qui permet de s’affranchir du traditionnel plan de codes, où, à raison de peut-être une minute par verbatim, un analyste annote chaque réponse d’un ou plusieurs codes appris par cœur. Les annotations produites peuvent alors servir une fonction de veille, comme chez Auchan, qui cherche les sources d’irritation ressentie par leurs clients durant leurs courses, ou une fonction de profilage relationnel du client, à travers ce qu’il révèle de lui dans le verbatim…

On peut encore aller plus loin et constituer une base de données : extraire de la jurisprudence les montants d’indemnisation de victimes en fonction de leur préjudice, comme le fait le Groupe Lefebvre, ou construire une notation du risque de crédit à partir de coupures de presse ou de documents internes, sont ainsi deux cas d’application particulièrement aboutis de l’analyse sémantique.

Autre discipline, la synthèse sémantique permet de créer automatiquement des comptes rendus d’entretien ou de rédiger des propositions commerciales, en s’appuyant sur des données structurées, issues par exemple du logiciel de gestion de la relation client (GRC). Les ressources du langage y sont exploitées pour personnaliser au maximum chaque texte et éviter la sécheresse des traditionnelles lettres-types. La publication d’analyses boursières, à partir de données de marché, est un autre cas d’usage, qui s’inscrit dans la recherche de gain de productivité. En France, Yseop est le plus connu des fournisseurs de ce type d’outil.

La technologie de la reconnaissance automatique de la parole, aussi appelée « reconnaissance vocale », gagne quant à elle les centres d’appels. Ces logiciels transcrivent la voix en texte et pour certains mesurent l’émotion du client à travers le débit et la fréquence de la voix. Leur capacité à éliminer les bruits de fond, les dysfluences (les « euh… »), et les recouvrements de voix, détermine la qualité de la transcription, a priori meilleure pour un message enregistré que pour une conversation.

Ces technologies, auxquelles il faut ajouter la traduction automatique, ont enregistré des progrès considérables, cette dernière décennie, depuis le « 3000 », mis en service par France Télécom en 2000, jusqu’au logiciel Siri, qu’Apple commercialise depuis 2012, et qui est emblématique du potentiel tiré de l’association du traitement de la parole, de l’écrit, et de la connaissance. A n’en pas douter, la combinaison des techniques d’analyse et de synthèse, de l’écrit et de la voix, vont bientôt faire émerger de nouvelles applications, en particulier dans le domaine de la relation client.

Imaginons l’exemple suivant : un client laisse un message sur une boite vocale, où il raconte, sur un ton véhément, qu’il lui est arrivé telle et telle chose avec un produit ou un service acheté à l’entreprise. L’enregistrement audio est d’abord transcrit en texte, associé d’un indicateur d’irritation, puis ce texte est soumis à un outil d’analyse sémantique, qui repère les sujets et en qualifie la technicité éventuelle. Après une interrogation du système de GRC qui révèle qu’il s’agit d’un client particulièrement rentable, un outil de synthèse sémantique s’appuie alors sur les annotations de l’analyseur sémantique ainsi que sur les deux indicateurs d’irritation et de rentabilité pour rédiger quelque chose comme « Nous avons bien pris note de votre message. Vous évoquez des problèmes sur tel et tel sujet. Nous comprenons votre irritation et nous en sommes désolés parce que vous êtes pour nous un client très privilégié. Nous avons transmis à tel service qui vous rappellera très prochainement ». Ce texte est alors envoyé sous forme de SMS, au numéro d’où le client avait appelé, le tout sans intervention humaine…

Cependant, les traitements de la voix et de l’écrit ne sont pas des sciences exactes. Et parce qu’une même idée peut être rendue par une infinie variété d’expressions, à l’écrit comme à l’oral, ces logiciels de TAL seront toujours soumis à des marges d’erreur. Les méthodes classiques de tests, conçues pour des applications de gestion, obéissant à des règles déterministes, et visant le zéro-défaut, ne sont pas adaptées. Il faut bâtir un corpus de référence, obéissant à des règles d’échantillonnage, pour servir de support aux tests et valider les résultats selon des indicateurs statistiques.

D’autre part, si les outils linguistiques savent manier syntaxe et grammaire, le choix des sujets, la spécification des règles fonctionnelles et du vocabulaire métier, la fixation des marges d’erreur et le montage du protocole de recette, relèvent de la responsabilité de l’entreprise. On ne déploie pas un outil de synthèse vocale comme un système classique de téléphonie ! L’entreprise doit donc se doter d’une assistance à maîtrise d’ouvrage (AMOA) pour accompagner ses projets de TAL. C’est sans doute un défaut de ce type de compétences qui a conduit certains projets d’avatars[1] de sites web, ou de FAQ dynamiques, à délivrer des résultats médiocres.
Enfin, elle doit allouer aux applications du TAL un budget d’investissement qui permette de prototyper correctement les offres disponibles sur le marché, puis de les intégrer au système d’information existant.

Ce sont donc de nouvelles méthodes, de nouveaux profils de compétences, de nouveaux moyens budgétaires qui sont requis. Mais alors que le TAL constitue depuis des années une discipline à part entière, dans le monde de la recherche, ces applications sont encore abordées au cas par cas par les directions informatiques, dans le monde de l’entreprise. La convergence de ces technologies, et le rôle clef qu’elles peuvent jouer dans une stratégie Big Data, méritent une approche plus cohérente et plus ambitieuse.

[1] Agent virtuel incarné par un personnage répondant aux questions de l’internaute


A propos du groupe SterWen
SterWen, créé en 1996, est un groupe indépendant de conseil en management et organisation. Le cabinet propose à ses clients un accompagnement sur mesure dans leurs grands programmes d’évolution et de transformation, que ce soit dans des contextes de lancement d’activités, de fusions et de rapprochements, de rationalisation ou d’industrialisation, de maîtrise des risques et d’adaptation réglementaire.
L’offre de SterWen couvre du conseil en stratégie jusqu’à l’accompagnement du changement et la formation, en passant par le pilotage de grands programmes et l’amélioration de l’efficacité opérationnelle.
Allianz, AXA, Binck Bank, BNP Paribas, Bouygues, BPCE, Brinks, Caisse des Dépôts, Cour des Comptes, Crédit Agricole, Dexia, GAN, GE, Humanis, La Banque Postale, Malakoff Médéric, Natixis, l’ONU, RCI Banque, Société Générale, ... sont quelques-unes des prestigieuses références clients de SterWen.


Aucun commentaire:

Publier un commentaire