Interview
Comment peut-on définir le data mining et quel est son rôle dans l'entreprise?
Il y a plusieurs mots-clés pour le qualifier. Il s'agit d'un outil d'aide à la décision, mais qui ne doit pas pour autant se substituer à la prise de décision, et qui s'appuie sur des formules mathématiques ou algorithmes afin de traduire une grande quantité de données en une information utile. Le data mining d'aujourd'hui n'est plus celui des années 1980. Autrefois, il répondait à des problématiques de processus industriel basique. Durant les années 1990, avec l'émergence des bases de données clients, on a commencé à appliquer le data mining à des problématiques marketing. Ensuite, les notions de globalité et de temps sont venues s'ajouter. Les données sont aujourd'hui présentes partout dans l'entreprise: marketing, ressources humaines, service gestion-comptabilité, service client, Web, e-mail, etc. Le data mining peut être utile pour trouver le profil adéquat pour créer un poste. On peut aussi, sur une chaîne de fabrication, déterminer quel est le meilleur procédé industriel pour la construction.
Quelles différences existent entre les algorithmes?
Je pense que seuls les éditeurs de niches arrivent à se distinguer par des algorithmes différents. Ils sont faits non seulement par des experts mais aussi à destination d'experts. Les gros éditeurs, en revanche, ne se différencient pas par leurs algorithmes de base mais par la facilité d'usage, l'ergonomie, davantage que la puissance des solutions. Ils vont également se différencier par les modules qui sont proposés: marketing, opérationnel, décisionnel.
Quelles qualités doit posséder l'outil?
Il doit pouvoir faire du data management, c'est-à-dire tout ce qui est préparation de données. Il doit proposer également un nombre élevé d'algorithmes préparamétrés, pour offrir une palette importante de fonctionnalités data mining. Il faut pouvoir avoir des restitutions de qualité, de manière à ce que les utilisateurs puissent avoir des informations exploitables rapidement. Dans ce domaine, la plupart des éditeurs doivent faire des efforts. Enfin, il est nécessaire de pouvoir intégrer l'outil facilement dans le système d'information, avec une mise à jour fréquente. Une grande partie des différences entre les éditeurs va notamment porter sur ce point.
«La qualité de ce que l'on fait entrer dans l'outil va impacter celle des résultats obtenus.»