L’outil
  • Type : Logiciel, Application web
  • Licence : Logiciel open source/libre
Porteurs et partenaires
Accueil > Outils > Hyperbase

Hyperbase

Hyperbase est une application dédiée à la textométrie, permettant l’analyse de corpus et la visualisation des données. Elle donne accès à des corpus déjà constitués, permet le travail avec de nouveaux corpus et combine des outils d’exploration avec une interface ergonomique. Des algorithmes de deep learning sont disponibles dans l’application web. Ils étendent les possibilités d’explorations des textes, dont le repérage automatique de motifs linguistiques profonds.

Caractéristiques

Hyperbase est un logiciel d’analyse de données textuelles (ADT?) permettant de réaliser des enquêtes textométriques et statistiques. Il se distingue par sa capacité à transformer des corpus textuels en données exploitables. Les textes peuvent être rédigés en français, latin, anglais, espagnol, allemand, italien et portugais. La plateforme web offre des fonctionnalités IA.
Hyperbase propose une sélection de corpus textuels en accès libre ou restreint, selon les droits d’utilisation (corpus littéraires, historiques et scientifiques). L’utilisation de la plateforme en ligne avec des fonctionnalités IA nécessite une inscription.
Comme les logiciels TXM et Annis, Hyperbase privilégie l’analyse lexicométrique de corpus littéraires, historiques et scientifiques. Il est complémentaire à IRaMuTeQ, application spécialisée dans l’analyse statistique et quantitative de textes.

Fonctionnement

Importation et structuration des corpus
Les utilisateurs peuvent importer des corpus variés, qu’il s’agisse de textes littéraires, de correspondances, ou encore d’articles scientifiques. Hyperbase prend en charge plusieurs formats de fichiers (TXT, XML?, TEI, etc.) et intègre des outils pour structurer les données textuelles, notamment en segmentant les textes ou en ajoutant des métadonnées?.

Analyse lexicale et statistique
Hyperbase propose des outils d’analyse lexicale performants, tels que la fréquence des mots, l’identification des cooccurrences et le calcul de spécificités. Ces fonctionnalités permettent de repérer des tendances, des particularités linguistiques ou des thématiques récurrentes au sein d’un corpus.

Visualisation des données
L’application offre une large gamme de visualisations interactives, comme les nuages de mots, les graphes de cooccurrences ou les distributions temporelles. Ces visualisations permettent de mieux comprendre les relations et les dynamiques au sein des textes étudiés.

Recherche avancée dans les corpus
Hyperbase intègre un moteur de recherche puissant, permettant d’effectuer des requêtes grâce à des expressions régulières ou des critères linguistiques avancés. Les résultats peuvent être filtrés et analysés selon divers axes (temps, auteur, thème).

Annotation et enrichissement collaboratifs
Les utilisateurs peuvent annoter les textes, ajouter des commentaires ou marquer des passages spécifiques. Ces annotations enrichissent les corpus et facilitent les travaux collaboratifs. Hyperbase permet également de partager des projets avec d’autres utilisateurs pour une collaboration optimisée.

Export et compatibilité avec d’autres outils
Les résultats des analyses et les corpus enrichis peuvent être exportés dans différents formats pour être utilisés dans d’autres projets ou logiciels.

Personnalisation et extensibilité
La plateforme est hautement personnalisable : les chercheurs peuvent adapter les outils à leurs besoins spécifiques, créer des scripts ou intégrer des modules complémentaires pour des travaux spécifiques.

Aide et tutoriels

Documentation officielle
Présentation
Manuel pour Windows
Téléchargements (le logiciel, le manuel, 70 bases littéraires ou politiques)

Manuels et tutoriels
Laurent Vanni : Hyperbase Web. Analyse statistique de corpus en ligne
Véronique Magri-Mourgues, Université Nice Sophia Antipolis : Textométrie pour le texte littéraire : le logiciel hyperbase

Vidéos
Véronique Magri-Mourgues, Université Nice Sophia Antipolis : Textométrie : le logiciel Hyperbase

Porteurs et partenaires

Hyperbase est né en 1989, à l’occasion du Bicentenaire de la Révolution française, pour répondre à une demande du Centre Pompidou et mettre à la disposition du public les textes relatifs à la Révolution. Il a été développé sous l’égide de l’université Côte d’Azur par Étienne Brunet et Laurent Vanni au sein de l’UMR 7320 (Bases, Corpus, Langage) du CNRS. La Maison des Sciences de l’Homme et de la Société Sud-Est (MSHS Sud-Est) apporte un soutien logistique et méthodologique au projet.

Hyperbase est membre de plusieurs réseaux européens et internationaux, tels que CLARIN et DARIAH, pour favoriser l’interopérabilité et la standardisation des outils.
Des partenariats ont été établis avec

  • Inria, pour les contributions en intelligence artificielle et analyse de données textuelles,
  • OpenEdition, pour intégrer Hyperbase aux plateformes d’édition et d’annotation scientifique en ligne,
  • la Bibliothèque Nationale de France (BNF) et des bibliothèques universitaires qui fournissent des corpus et participent à l’évaluation des outils développés.

Article publié le 23 janvier 2025
Dernière mise à jour : 8 septembre 2025

Les logos et marques mentionnés sont la propriété de leurs titulaires respectifs. Leur utilisation sur ce site est uniquement à des fins d’information.