Le projet Antonomaz, “ANalyse auTOmatique et NumérisatiOn des MAZarinades” vise à exploiter un corpus raisonné parmi les quelques 5000 écrits ayant pour objet les affaires politiques du cardinal Mazarin sous la régence d'Anne d'Autriche, et traditionnellement appelés “mazarinades”.
Depuis 2022, il est accessible en ligne et en cours d'enrichissement : https://antonomaz.huma-num.fr/
Le projet propose en accès libre les fac-similés numériques de 2/3 de ces écrits, en travaillant les métadonnées qui informent sur leur contexte.Il s'agit de permettre aux utilisateurs de naviguer dans ces documents par la recherche plein texte, et de reconstruire des corpus cohérents via l'outil numérique. D'autres ressources utiles sont développées sur le site (base de données des 286 imprimeurs actifs pendant la Fronde, frise chronologique des événements liés aux mazarinades associées, fiches repères sur les éléments majeurs de la Fronde et des libelles, etc.). Nous implémenterons ensuite des outils permettant des recherches linguistiques plus avancées.
Les textes sont produits par une reconnaissance automatique de caractères. Les textes sont encodés en XML-TEI et l'outil de publication utilisé est TEI-Publisher. La documentation technique détaillée est disponible sur le site du projet
NB : en italique, valeurs estimées
Date | PDF #docs | PDF #pages | XML #docs | XML #pages | XML #tokens | XML #types | Retranscrits #docs | XML #docs uniques |
02/06/2021 | 1.111 | 15.000 | 447 | 5.300 | 2.108.211 | 199.374 | 105 | |
02/07/2021 | 2.221 | 31.000 | 687 | 8.200 | 2.647.056 | 242.418 | 105 | |
22/07/2021 | 2.613 | 37.000 | 750 | 9.000 | 2.811.341 | 257.506 | 105 | |
27/09/2021 | 2.613 | 37.000 | 2.000 | 24.000 | 7.350.000 | 257.506 | 105 | |
25/10/2021 | 2.970 | 41.580 | 2.000 | 24.000 | 7.350.000 | 257.506 | 105 | |
07/12/2021 | 3.362 | |||||||
28/02/2022 | 3.555 | 49.770 | 3.270 | 39.240 | 12.017.250 | 257.506 | 105 | 1.156 |
26/10/2022 | 4.000 | 105 | 2.680 |
Liens vers les différents githubs créés pour les besoins du projet :
La ressource Moreau En Ligne vise à permettre diverses requêtes dans les métadonnées léguées par la tradition bibliographique. Le point de départ est la grande bibliographie de Célestin Moreau (1850-1851), qui, en l'absence de rénovation au XXe siècle, fait encore autorité pour l'identification des textes (numérotation Moreau) et de la tentative de recension exhaustive (elle rassemble 80 % des pièces connues à ce jour). Une nouvelle ressource est en cours d'élaboration à la bibliothèque Mazarine (Base Bibliographique des mazarinades) qui offrira à terme une nouvelle numérotation avec permalien et des métadonnées rénovées issues des archives Carrier, notamment. https://www.bibliotheque-mazarine.fr/fr/evenements/actualites/bibliographie-des-mazarinades-bm
“Ouvrage magnifique” (Jouhaud 2009: 37), la bibliographie de Moreau est autant un outil de travail indispensable qu'un ouvrage qui appartient à l'historiographie de la Fronde et de ses libelles, et qu'il convient de mettre en perspective. Outre les erreurs et oublis que les bibliographes suivants ont parfois corrigées (nous intégrons ces suppléments bibliographiques), Moreau accompagne son classement de jugements idéologiques et axiologiques. Nous faisons le choix de conserver ces commentaires, en tant qu'ils documentent l'histoire du regard sur les Mazarinades (en l'occurrence, celui d'un légitimiste du XIXe siècle) et non seulement les Mazarinades elles-mêmes.
L'objectif du tableur en cours de construction est d'être complété et amendé peu à peu par divers acquis de la recherche sur les métadonnées. Il s'agira d'abord d'intégrer les recherches d'H. Carrier, qui préparait une bibliographique et critique des Mazarinades. https://mazarinum.bibliotheque-mazarine.fr/expositions-virtuelles/item/17787-vii-enqueter-sur-les-mazarinades?oeuvre=19#page=1&viewer=picture&o=no&n=0&q= Si celle-ci n'a pas pu être achevée, les apports importants qu'elle devait contenir se trouvent parfois dans ses ouvrages critiques, et seront intégrés peu à peu à notre liste bibliographique, après dépouillement systématique de Carrier 1989 et 1991 et appui sur le travail de la Bibliothèque Mazarine, récipiendaire des archives Carrier, qui exploite ce fonds manuscrit pour mettre au point une base de données bibliographiques rénovées (https://mazarinades.bibliotheque-mazarine.fr/). L'enjeu est ainsi de répercuter les dernières connaissances bibliographiques sur le sujet, et de permettre aux utilisateurs diverses requêtes plein texte dans une liste aussi complète que possible des titres de Mazarinades. Aussi cette liste requêtable se veut-elle un expédient pour une des difficultés majeures de ce corpus : s'y retrouver.
Les sources bibliographiques intégrées dans le tableur interrogeable fugurent ci-dessous par ordre chronologique
MOREAU C. (1850-1851). Bibliographie des Mazarinades. 3 t. Paris : Jules Renouard.
MOREAU C. (1862). “Supplément à la Bibliographie des mazarinades”, In le Bulletin du Bibliophile et du bibliothécaire, p. 786–829. Paris: Techener.
MOREAU C. (1869). “Supplément à la Bibliographie des mazarinades”, In le Bulletin du Bibliophile et du bibliothécaire, p. 61–81. Paris : Techener
SOCARD E. (1876). “Supplément à la Bibliographie des Mazarinades”. Paris : H.Menu.
LABADIE E. (1904). “Nouveaux Suppléments à la bibliographie des Mazarinades”. In le Bulletin du Bibliophile et du bibliothécaire. Paris : Henri Leclerc.
Titres cités
CARRIER H. (1989). La Presse de la Fronde (1648-1653) : Les mazarinades, vol. I, La Conquête de l’opinion. Genève : Droz.
CARRIER H. (1991). La Presse de la Fronde (1648-1653) : Les mazarinades, vol. II, Les Hommes du livre. Genève : Droz.
JOUHAUD C. (1985. rééd. 2009). Mazarinades. La Fronde des mots. Paris : Aubier.
Actuels :
Anciens
Nous remercions l'OBVIL, le DIM STCN, l'initiative CORLI, la région Ile de France (projet PhD2), la bibliothèque Mazarine pour leur collaboration.
page officielle sur le site du DIM
Le projet a été labellisé par le Consortium CAHIER [https://cahier.hypotheses.org/membres] de la Tigr Huma-num (voir aussi [https://cahier.hypotheses.org/antonomaz]).
'Exploiter des modèles de langue pour évaluer des sorties de logiciels d’OCR pour des documents français du XVIIe siècle
', article accepté à RECITAL@TALN 2020, Jean-Baptiste Tanguy'Dating Ancient texts: an Approach for Noisy French Documents
', article accepté à “Language Technologies for Historical and Ancient Languages (LT4HALA), Anaëlle Baledent (GREYC, Normandie Université), Nicolas Hiebel et Gaël Lejeune'Analyse stylistique automatique : A la recherche d'indices efficaces et pertinents pour caractériser le style de Dumas
' Anaëlle Baledent et Gaël Lejeune, Phraseorom 2019.'Analyse automatique de documents anciens : tirer parti d'un corpus incomplet, hétérogène et bruité
' Karine Abiven et Gaël Lejeune, revue RIDOWS – Pdf