Innovation et Connaissances

Traduction automatique / analyse de sentiments : GDLET ou la « Big Translation » au service de la recherche


Jacqueline Sala




 

Porté par Kalev Leetaru, chercheur à l’Université de Georgetown et entrepreneur américain passé par le programme Yahoo ! Fellow in Residence, le projet GDELT (Global Data on Events, Location and Tone)ambitionne de créer la plus importante plateforme de traduction en temps-réel de flux de « news »  et d’analyse de sentiments au monde. 
L’objectif : mapper l’ensemble des évènements de la planète, les récits et les émotions qui en découlent. GDELT se distingue ainsi par sa dimension « holistique ». Selon Kalev Leetaru, le projet revient fondamentalement à  coder la planète (« codify the entire planet »), plus exactement à enregistrer l’histoire du monde à travers la capture la plus exhaustive possible de flux médias, à la retranscrire dans des formats structurés et intelligibles aux machines pour promouvoir une nouvelle manière d’observer et comprendre la société dans sa globalité (« global society ») à l’aide des approches Big Data. 
En décembre 2015, Kalev Leetaru a ainsi publié une cartographie de l’humeur mondiale des terriens en 2015 réalisée en mappant plus de 200 millions d’articles de presse parus entre mars et décembre 2015 dans tous les pays du monde, 1.4 million de photographies, 89 millions d’événements, 1.48 million de données de géo-localisation, et 860 billions de verbatim « émotionnels ».