Market Intelligence

Questions à Frédérique Segond "Extraire le maximum de données de qualité, et les mettre en relation à travers des liens qui ont du sens."


Cynthia Glock




Frédérique Segond. Directrice de la R&D des solutions de Market Intelligence chez Bertin IT, une French Tech spécialisée dans la Cyber Intelligence et Sécurité.


En quoi le métier de veilleur a-t-il fondamentalement évolué ? Quels sont les nouveaux besoins et comment y répondre ?

  • On assiste à une mutation du métier de veilleur.
    Auparavant la cellule de veille était composée de documentalistes ou d’analystes qui se focalisaient principalement sur la recherche et l’analyse de contenus, actions souvent réalisées à la main en créant des règles et en définissant des mots clés et des catégories. Maintenant ces cellules regroupent des professionnels de différents domaines en quête de tout type d’information. Ils ont besoin de trouver les informations qu’ils cherchent de façon rapide voire instantanée, conviviale, facilement partageable, mais aussi précise et fiable. 
     
  • Leur nouvel enjeu est la création de valeur via le partage de l’information avec toute la communauté d’utilisateurs internes à leur société.
    Ils ont donc besoin d’une interface « user friendly » qui leur permette d’automatiser facilement des tâches apportant peu de valeur ajoutée. Ils peuvent alors se concentrer sur l’extraction de données plus fines et qualitatives, telles que les entités nommées, c’est-à-dire des noms propres type lieux, personnes, dates célèbres, organisations. 
Les outils de veille de demain doivent permettre aux utilisateurs de faire des recherches plus conceptuelles comme par exemple « des tweets qui mentionnent des personnes, des dates, des endroits ».  L’enjeu n’est plus seulement de trouver l’information, mais aussi de savoir comment la traiter pour ensuite la partager aux bonnes personnes en interne.

L'IA est de plus en plus plébiscitée pour automatiser des tâches répétitives et faciliter l’utilisation des outils. Pouvez-vous nous en dire un peu plus sur son véritable apport ? Ses limites ?

  • Le terme IA est très à la mode, on parle de machine learning et de réseaux de neurones, autrement dit de combinaisons d’algorithmes en mesure d’apprendre, à partir d’exemples représentatifs, un certain nombre de choses pour accomplir ensuite automatiquement diverses tâches, comme par exemple détecter des personnes, des lieux, des dates.
     
  • Une fois ces éléments repérés dans du texte non structuré, on peut lier ces éléments entre eux de façon non ambiguë en utilisant le contexte. Par exemple nous pouvons relier entre elles les informations ayant trait à Orange en tant que compagnie d’une part et à Orange en tant que ville d’autre part, sans les confondre.  On peut également chercher à détecter des choses plus complexes telles que des événements, des signaux faibles. Nous travaillons par exemple sur « comment arriver à repérer une nouveauté ou une anomalie dans le flux d’un réseau social ? ».
     
  • Il est important pour de nombreuses applications d’être en mesure de détecter les nouveautés, les événements bien en avance de phase, quand très peu de gens en parlent, autrement dit quand il n’y a que très peu de données sur lesquelles apprendre. On utilise dans ce cas des règles que l’on peut également combiner avec des algorithmes. 
La méthode dépend donc à la fois des données et de la finalité.

La R&D représente 50% des effectifs chez Bertin IT. Quelles sont les grandes orientations actuelles ?

  • Dans notre environnement ultra-connecté, la vidéo devient le format le plus consommé. 
Il s’avère donc stratégique pour les veilleurs de pouvoir intégrer ce canal de communication au même titre que le contenu textuel pour enrichir leur veille.
Nous travaillons ainsi à l’amélioration de la transcription de la parole contenue dans de l’audio et des vidéos. Détecter différentes langues, segmenter le son par locuteurs - par exemple différencier deux personnes, des hommes ou des femmes etc. - mais aussi reconnaître les accents et les language switching (comme l’utilisation de mots d’anglais au milieu d’un texte en français, par exemple).
  • Un marché important pour ce type de technologie est celui des salles de trading dans la banque, où les échanges entre traders, de toutes nationalités, mêlent des accents très divers. Un autre marché est celui des centres d’appels.
Nos efforts portent aussi sur l’ergonomie de l’interface, ainsi que sur la facilitation de la collecte de sources et sur la vérification de leur fiabilité. 
A terme, l’objectif serait de pouvoir extraire toutes les informations possibles des documents issus d’Internet, donc de données non structurées, et les incrémenter dans des bases de connaissances structurées. La rapidité est essentielle, mais il s’agit surtout d’extraire le maximum de données de qualité, et de les mettre en relation à travers des liens qui ont du sens.   

Merci Frédérique Segond.

Propos recueillis par Cynthia Glock