BnF

CBMA

Corpus Burgundiae Medii Aevi (2004-)

Porteuse : Eliana Magnani

Équipe : Coraline Rey, Nicolas Perreaux, Gabriel Castanho, Pierre Brochard 

Argumentaire : Débuté en 2004 et s’inscrivant dans la longue durée, le programme de recherche CBMA (Corpus Burgundiae Medii Aevi) numérise, enregistre et exploite la prolifique documentation écrite bourguignonne.

Avec une forte composante diplomatique, parmi laquelle figurent, entre autres, les chartes des emblématiques abbayes de Cluny et de Cîteaux, le programme incorpore, depuis 2017, d’autres types documentaires, en vue de constituer un corpus structuré et hétérogène de textes latins médiévaux (Bourgogne, Ve-XVe siècle). Portée par le LaMOP, cette transformation importante vise à accompagner les évolutions propres à la pratique de la recherche que l’analyse inédite de la masse de documents numérisés tend actuellement à bouleverser. Ainsi, en plus du corpus diplomatique (5 908 816 mots), deux sous-corpus principaux ont été constitués et renseignés avec des nombreuses métadonnées entre 2017 et 2019 – l’hagiographique (1 061 939 de mots) et l’épigraphique (61 842 de mots) –, avec le soutien du Labex Hastec (en partenariat avec l’IRHT, le Centre Jean Mabillon, LEM/CERCOR) et le Consortium Cosme2 de la TGIR Huma-Num du CNRS (en partenariat avec le CESCM de Poitiers). Parallèlement d’autres sous-corpus documentaires sont également constitués : normatif (251 398 mots), historiographique (221 427 mots), épistolaire (202 239 mots), administratif (118 192 mots), théologique (82 258 mots), liturgique (80593 mots). Ces chiffres correspondent à l’état du programme en janvier 2022 et sont en progression constante.

Les réalisations et les résultats du projet sont mis à la disposition via une plate-forme documentaire et une base de données librement accessibles sur Internet sous différents formats électroniques téléchargeables. Ce corpus, régulièrement enrichi, est lemmatisé et interrogeable avec des logiciels de fouille de texte, comme Philologic, TXM et NoSketchEngine. Il constitue un terrain expérimental de recherche à l’aide des outils informatiques.

En collaboration avec les Archives départementales de la Côte d’Or, le projet diffuse aussi plus d’une soixantaine de manuscrits originaux numérisés, dont des cartulaires, des livres de comptes ou encore les tablettes en cire de Cîteaux.

Le programme, qui s’appuie sur un large réseau de collaborateurs, conduit également une réflexion épistémologique sur les transformations dans la pratique de la recherche, induites par la numérisation massive de textes médiévaux et par l’usage du support électronique dans la reproduction des documents et manuscrits. Des expériences nouvelles sont menées pour mieux connaître la société médiévale, pour la connaître autrement, en faisant toute la place aux études de sémantique structurelle, aux approches statistiques et spatiales, ainsi qu’aux implications cognitives de la littératie, en tant que technologie graphique et visuelle.
Des journées d’études et des ateliers sont régulièrement réunis et les résultats intermédiaires des recherches publiés dans la « Collection CBMA ».

Le programme CBMA utilise les services de la TGIR Huma-Num du CNRS pour le stockage et l’archivage des données produites, ainsi que pour l’hébergement de son site web.

 

Projets intégrés aux CBMA :

 

  • « Un corpus structuré et hétérogène de textes latins médiévaux (Bourgogne, Ve-XVe siècle) »


Ce projet s'appuie sur un large réseau de chercheurs, ouvert à tous les intéressés,  est porté par le LaMOP (Laboratoire de Médiévistique Occidentale de Paris - UMR 8589), soutenue par le Labex HaStec en partenariat avec l’IRHT (Institut de recherche et d’histoire des textes – CNRS UPR 841), le CESOR (Centre d’Etudes de Sciences sociales du Religieux - UMR 8216), le Centre Jean Mabillon (EnC - EA 3624), LEM/CERCOR (Laboratoire d’Etudes sur les Monothéismes – UMR 8584 / Centre européen de recherche sur les congrégations et les ordres religieux).

Un corpus structuré et hétérogène de textes latins médiévaux (Bourgogne, Ve-XVe siècle) Le projet de constitution d’un corpus structuré et hétérogène de textes latins médiévaux vise à faire profondément évoluer le contenu de plate-forme documentaire d’actes diplomatiques bourguignons, les CBMA. Il s’agit de mettre à la disposition des chercheurs, en libre accès, un corpus hétérogène de textes latins médiévaux, et accompagner ainsi les évolutions propres à la pratique de la recherche que l’analyse inédite de la masse de documents numérisés tend actuellement à bouleverser. Orienté, dans une première phase d’élargissement, vers les écrits hagiographiques, le corpus qui sera réuni est à même d’aider à faire la part des techniques discursives et des évolutions sémantiques à l’intérieur d’un système social en grande partie polarisé par les sanctuaires et les reliques des « morts très spéciaux » que sont les saints. L’objectif du programme est de se donner les moyens de comprendre de manière raisonnée, dans une société hétéronome aspirée par l’au-delà, l’articulation de ses productions idéelles et matérielles.

Présentation du projet par Eliana Magnani (février 2017) (PDF, 589ko).

 

  • Groupe de travail « Lemmes » - Cosme2 (Consortium Sources Médiévales 2)

Organisation : Eliana Magnani

Présentation du projet : « Lemmes » est l’un des sept groupes de travail du COnsortium des Sources Médiévales - Cosme2 - soutenu et financé par le TGIR Huma-Num du CNRS pour œuvrer à la constitution de corpus et d'outils numériques, consacré aux sources médiévales et piloté depuis l'origine par Paul Bertrand au titre de l'IRHT (http://cosme.hypotheses.org/). Le groupe de travail « Lemmes » a pour dessein le développement des outils existants et la diffusion de corpus lemmatisés, mais ce sera au cours de ce premier atelier que seront précisées collectivement et progressivement les orientations de travail et les actions communes à mener. Dans cette perspective, ce premier atelier, est organisé autour des projets et des lemmatiseurs déjà créés, pour en faire un premier bilan : les objectifs qui ont présidé au développent de ces outils, les choix techniques, les paramètres adoptés, les interfaces, les évolutions en cours ou en projet, entre autres. Les présentations d’une heure maximum seront suivies de 20 minutes de discussions.

L’atelier est ouvert à tous les intéressés qui sont priés, pour des raisons d’organisation matérielle, de nous informer de leur participation (eliana.magnani@gmail.com).

Atelier 1

6 novembre 2017 - 10h-18h
Paris - IRHT - Salle Jeanne Vielliard - 40 avenue d’Iéna (métro Iéna)

Programme (PDF, 69ko)

Atelier 2

2 juin 2018  - 10h-18h
Paris - IRHT - Salle Jeanne Vielliard - 40 avenue d’Iéna (métro Iéna)

Programme (PDF, 63ko)

 

  • Ateliers « Corpus hagiographique bourguignon »

Organisation : Eliana Magnani

Ouverte à tous les intéressés, cette opération est portée par le LaMOP (Laboratoire de Médiévistique Occidentale de Paris - UMR 8589), soutenue par le Labex HaStec en partenariat avec l’IRHT (Institut de recherche et d’histoire des textes – CNRS UPR 841), le CESOR (Centre d’Etudes de Sciences sociales du Religieux - UMR 8216), le Centre Jean Mabillon (EnC - EA 3624), LEM/CERCOR (Laboratoire d’Etudes sur les Monothéismes – UMR 8584 / Centre européen de recherche sur les congrégations et les ordres religieux).

Atelier 1 (Vendredi 28 avril 2017, 14h-17h30)
Sorbonne, Bibliothèque du CRHM Salle G678 - Galerie Dumas -Escalier R - 2e étage (1, rue Victor Cousin - 75005 Paris)

Présentation du projet

Dans le cadre du programme des CBMA (Corpus Burgundiae Medii Aevi), et en contraste avec les plus de 29 000 actes diplomatiques déjà numérisés et enregistrés, nous lançons le projet de réalisation d'un corpus structuré et hétérogène de textes latins médiévaux. Le premier sous-corpus qui sera constitué concerne les textes hagiographiques bourguignons (Ve-XVe siècles).
Ce premier atelier vise à discuter, à partir d’un inventaire préliminaire des vies de saints qui sera communiqué aux participants au préalable, les métadonnées retenues pour renseigner le sous-corpus hagiographique. Il s'agira aussi de compléter et corriger la liste diffusée, en particulier les données relatives aux lieux et dates des textes retenus.

Atelier 2 - Débats et recherches (Mardi 19 juin 2018, 10h-18h)
Sorbonne, Bibliothèque du CRHM Salle G678 - Galerie Dumas -Escalier R - 2e étage (1, rue Victor Cousin - 75005 Paris)

Ce deuxième atelier vise à présenter et à débattre collectivement des premières réalisations : l’inventaire des textes hagiographiques et l’état des connaissances qu’il permet de dresser, ainsi que les problèmes rencontrés dans l’acquisition des métadonnées et les solutions à envisager. Il sera aussi l’occasion d’échanger autour des recherches récentes, en aval et en amont du corpus lui-même : les manuscrits, la transmission-transformation textuelle ainsi que les expériences des traitements statistiques.

Programme (PDF, 264ko)