GDELT
GDELT enregistre dans une base de données les événements signalés dans les médias imprimés, radiodiffusés et en ligne dans plus de 100 langues et dans tous les pays du monde. Ses archives remontent au 1er janvier 1979 et sont mises à jour toutes les 15 minutes. L’accès aux données est gratuit et ouvert. Des outils de cartographie interactive et tableaux de bord analytiques sont disponibles.
Caractéristiques
GDELT (Global Database of Events, Language, and Tone) détecte et classe chaque événement en fonction de qui fait quoi, à qui, où et quand. Chaque événement est géolocalisé. GDELT attribue un score de sentiment aux articles (positif, négatif, neutre) et compare comment différents médias traitent un même sujet pour détecter les biais. Un suivi des tendances sur le temps long est possible (par exemple l’intérêt médiatique pour le changement climatique depuis 2000).
Il est possible de télécharger gratuitement le fichier de données brutes, de les visualiser à l’aide du service d’analyse de GDELT ou de les analyser à une échelle illimitée avec Google BigQuery.
GDELT est souvent combiné avec Media Cloud ou Google Trends pour une analyse plus complète des médias et de l’actualité. Il est devenu un outil majeur de vérification des faits, comme en témoignent les exemples de fact-checking présentés sur le blog du GDELT [https://blog.gdeltproject.org/].
Fonctionnement
Lancer une recherche
Il existe plusieurs manières d’analyser des données :
GDELT Summary permet de créer des tableaux de bord visuels résumant la couverture médiatique mondiale d’un sujet donné. On peut effectuer des recherches par mots-clés, sélectionner les ensembles de données à interroger et choisir les types de visualisations.
GDELT Analysis Service permet d’analyser les données GDELT de manière plus approfondie, avec des options de filtrage et de visualisation avancées :
- Event Record Exporter : exporte les données portant sur un sujet précis,
- Event Geographic Network : cartographie les lieux et pays concernés par un sujet,
- Event Heatmap Visualizer : crée une carte thermique interactive de la distribution des événements qui s’affiche dans une fenêtre de navigateur, ainsi qu’un fichier CSV pour l’importation dans un logiciel SIG,
- Event Timeline : crée une grille chronologique unique montrant l’intensité par jour des enregistrements correspondants,
- Event TimeMapper : crée un fichier .KML de Google Earth qui permet de visualiser les changements dans le temps et l’espace, ainsi qu’un fichier .CSV pour l’importation dans des logiciels SIG et des services de cartographie en ligne,
- GKG Network : crée un diagramme de réseau interactif qui s’affiche dans une fenêtre de navigateur, un tableau des "influenceurs" les plus importants et un fichier .GEXF pour l’analyse dans Gephi.
Explorer les données avec Google BigQuery
GDELT est intégré à Google BigQuery, ce qui permet d’effectuer des requêtes complexes sur de très grands ensembles de données. Cette méthode nécessite un compte Google Cloud et des compétences en SQL.
Téléchargement des données
GDELT met à disposition l’ensemble de ses données brutes pour téléchargement et analyse avec des outils tiers. Les données peuvent être exportées dans un large éventail de formats, dont CSV, KML et GEXF pour Gephi. Il est ainsi possible de profiter des capacités de visualisation d’applications tierces, par exemple pour construire un graphique réseau sur un sujet ou secteur.
Aide et tutoriels
Documentation officielle
Des tutoriels se trouvent sur le blog de GDELT
D’autres ont été publiés sous forme de vidéos.
Manuels et tutoriels
William Shakespeare : Utilisation de Gdelt 2 avec PHP pour analyser le monde
Ken Blake : A short intro to GDELT (en)
John King : GDELT Tutorial (en)
Alex Bresler : Introduction to Programming with gdeltr2 (en)
Vidéos
Kalev Leetaru, créateur de GDELT :
Porteurs et partenaires
GDELT (Global Database of Events, Language, and Tone) est un projet indépendant qui a été créé et est maintenu par Kalev Leetaru, chercheur spécialisé en analyse de données massives, intelligence artificielle et cybersécurité qui a travaillé au National Center for Supercomputing Applications.
La réalisation a été possible grâce au soutien de Google Ideas, Google Cloud, Google and Google News, the Yahoo ! Fellowship at Georgetown University, BBC Monitoring, the National Academies Keck Futures Program, Reed Elsevier’s LexisNexis Group, JSTOR, DTIC, Internet Archive ainsi que Patrick Brandt et la School of Economic, Political and Policy Sciences de l’université du Texas, Dallas.
Article publié le 5 mars 2025 Dernière mise à jour : 15 septembre 2025
