“ Notre moteur de recherche d'entreprise permettra de faire de l'analyse d'impact sur le Web ”
François d'Hageleer est vice-président marketing de Sinequa, un spécialiste français des moteurs de recherche professionnels.
01net.
le 26/06/2008 à 17h31
01net. : Aujourd'hui, comment les entreprises utilisent-elles les moteurs de recherche ?
François d'Haegeleer : Prenons plusieurs exemples. Un responsable de centre d'appels a affaire à un client haut de gamme avec une demande très spécifique. Il doit pouvoir savoir très rapidement si quelqu'un a déjà été confronté à la demande et quelle solution a été trouvée. Et ce à partir d'un contenu qui n'est pas forcément structuré et quelle que soit la source de la donnée, progiciel, annuaire d'entreprise de type Active Directory, intranet, etc. On peut aussi utiliser le moteur de recherche pour faire de la veille aussi bien en interne que sur des sites Web d'autres entreprises, par exemple.
Il s'agit d'organiser la connaissance de l'entreprise et de la présenter en fonction du profil de chacun, tout en respectant les contraintes de sécurité de l'entreprise : tout le monde ne doit pas avoir accès à tous les documents.
Quels sont les contenus auxquels on accède ?
Ce sont des contenus de type texte, mais aussi audio comme des podcasts et des vidéos, ainsi que des images... Nous travaillons avec des entreprises dont le métier est d'indexer ce type de document, par exemple Vecsys, spécialisé dans le Speech to Text [traduire en texte des fichiers audios, NDLR], ou SGT, spécialiste du broadcasting.
Notre métier à nous est de fédérer tous ces contenus, quel que soit leur format, quelle que soit leur source, dans une seule interface qui soit simple et personnalisée. Par exemple, un spécialiste des ressources humaines aura une vue sur les compétences, tandis qu'un spécialiste du marketing aura une vue produit.
Quel est le futur de la recherche ?
Nous travaillons actuellement sur trois projets avec des partenaires, qui devraient se concrétiser dans quelques mois. Le premier d'entre eux est TextCoop. Il s'agit de s'affranchir des structures automatiques des documents. Par exemple, dans Word, vous avez des métadonnées comme l'auteur ou le titre du document. Ces données ne correspondent pas forcément à la réalité. Il faut pouvoir analyser le contenu du fichier pour recréer les bonnes métadonnées.
Blogoscopie est un autre de nos projets. Il s'agit d'analyser les tendances, les opinions, notamment dans les blogs ou les wiki. Leurs contenus ne sont ni contrôlés ni forcément formalisés. Il s'agit donc d'analyser et de contextualiser ces textes et d'identifier s'il s'agit d'une opinion positive ou négative.
Enfin, Piithie est une recherche sur le suivi d'impact. J'ai lancé un produit, je veux savoir qui en parle et en quel terme. Ce projet permettra aussi de détecter les plagiats par exemple.
Pour un futur plus lointain, nous travaillons sur des résumés multimédias, c'est le projet RPM2 – prendre des extraits pertinents de médias différents et les agréger –, et sur l'analyse ainsi que l'indexation du contenu des centres d'appels. Ce dernier développement s'appelle CallSurf infom@gic.
Ces technologies sont-elles accessibles aux PME ?
Oui. Pour une configuration composée d'un CPU, d'une source et pour une seule langue, il faut compter 30 000 euros. Avec cette configuration on peut effectuer des recherches sur plusieurs millions de documents.
Mais il faut surtout en avoir l'usage. Il ne sert à rien de prendre un marteau pour écraser une mouche. Ainsi, la plupart des PME sont des entreprises où les documents sont partagés entre peu de personnes et où il est aisé de retrouver un contenu. Mais ce n'est pas le cas de toutes. Nous avons aussi parmi nos clients des grands groupes dont les utilisateurs de Sinequa ne sont en fait que des petits groupes et que l'on peut assimiler à des PME.