===== Descriptif du projet Antonomaz ===== Le projet Antonomaz, "ANalyse auTOmatique et NumérisatiOn des MAZarinades" vise à exploiter un corpus raisonné parmi les quelques 5000 écrits ayant pour objet les affaires politiques du cardinal Mazarin sous la régence d'Anne d'Autriche, et traditionnellement appelés "mazarinades". Depuis 2022, il est accessible en ligne et en cours d'enrichissement : https://antonomaz.huma-num.fr/ Le projet propose en accès libre les fac-similés numériques de 2/3 de ces écrits, en travaillant les métadonnées qui informent sur leur contexte.Il s'agit de permettre aux utilisateurs de naviguer dans ces documents par la recherche plein texte, et de reconstruire des corpus cohérents via l'outil numérique. D'autres ressources utiles sont développées sur le site (base de données des 286 imprimeurs actifs pendant la Fronde, frise chronologique des événements liés aux mazarinades associées, fiches repères sur les éléments majeurs de la Fronde et des libelles, etc.). Nous implémenterons ensuite des outils permettant des recherches linguistiques plus avancées. Les textes sont produits par une reconnaissance automatique de caractères. Les textes sont encodés en XML-TEI et l'outil de publication utilisé est TEI-Publisher. La documentation technique détaillée est disponible sur le [[https://antonomaz.huma-num.fr/exist/apps/Antonomaz/about/technical_documentation.html|site du projet]] ==== Actions en cours ==== * Poursuite de la mise en ligne de nouveaux documents et correction des métadonnées existantes [[https://antonomaz.huma-num.fr/exist/apps/Antonomaz/index.html?collection=corpus|dans le corpus en ligne du projet]] * Travail sur les [[https://antonomaz.huma-num.fr/exist/apps/Antonomaz/documentation/statistiques.html|statistiques]] (mazarinades par date, nombre d'anonymes, etc.) ==== Actions passées ==== * Collecte, océrisation, encodage semi-automatique et post-traitement de 3065 PDF (issus de Bibnum, GBooks, Gallica): [[https://github.com/Antonomaz/Corpus]] * Mise en ligne des numérisations en format IIIF de 814 mazarinades sur la [[https://bibnum.institutdefrance.fr/thematiques/item/24497-mazarinades?back=https%3A%2F%2Fbibnum.institutdefrance.fr%2Frecords%2Fdefault%3Fsearch%3D%26sort%3D_score%26page%3D1%26refine%5BCorpus_Parcours%5D%5B%5D%3DMazarinades%26refine%5BLocalisation%5D%5B%5D%3DBiblioth%25C3%25A8que%2520Mazarine|bibliothèque numérique de la bibliothèque Mazarine]] (numérisations financées par Antonomaz, via l'IUF et l'OBVIL en 2020-2022).(merci à l'OBVIL de s'en être fait l'écho [[https://obvil.sorbonne-universite.fr/actualite/mise-en-ligne-de-quatre-cent-mazarinades-projet-antonomaz/mer-18112020-0000|ici]]). * Exploitation de corpus cohérents taillés dans l'ensemble desdites "mazarinades". Premier laboratoire: écrits burlesques de la Fronde, et de corpus burlesques contrastifs (article dans la revue //[[https://journals.openedition.org/revuehn/2355|Humanités numériques]]//). * Mise en ligne de la bibliographie Moreau, et de ses suppléments, structurée en format texte et interrogeable par divers champ (numéro Moreau, date, mots de la notice Moreau, nombre de pages, etc.). Elle est obtenue par océrisation, d'où les scories dans le texte, qui n'entravent toutefois pas les principaux repérages. Une version (dernière mise à jour en juin 2023) de cette ressource se trouve ici:[[http://antonomaz.huma-num.fr/tools/Biblio_Moreau.html]]. Elle permet d'interroger 5107 références bibliographiques. Pour plus d'informations sur ces bibliographies, voir //infra.// ==== Volumétrie des données collectées==== NB : en italique, valeurs estimées |Date|PDF #docs|PDF #pages|XML #docs|XML #pages|XML #tokens|XML #types|Retranscrits #docs|XML #docs uniques| |02/06/2021|1.111|15.000|447|//5.300//|2.108.211|199.374|105| |02/07/2021|2.221|//31.000// |687 |//8.200//|2.647.056|242.418|105| |22/07/2021|2.613|//37.000// |750 |//9.000//|2.811.341|257.506|105| |27/09/2021|2.613|//37.000// |//2.000// |//24.000//|//7.350.000//|257.506|105| |25/10/2021|2.970|//41.580// |//2.000// |//24.000//|//7.350.000//|257.506|105| |07/12/2021|3.362| |28/02/2022|3.555|//49.770// |3.270|//39.240//|//12.017.250//|//257.506//|105|1.156| |26/10/2022|//4.000//| | | | | |105|2.680| ==== Githubs ==== Liens vers les différents //githubs// créés pour les besoins du projet : * Outils développés, antonomaz_tools : https://github.com/Antonomaz/tools * Encodage du corpus, Antonomaz : https://github.com/Antonomaz ==== Bibliographie Moreau En Ligne ==== La ressource Moreau En Ligne vise à permettre diverses requêtes dans les métadonnées léguées par la tradition bibliographique. Le point de départ est la grande bibliographie de Célestin Moreau (1850-1851), qui, en l'absence de rénovation au XXe siècle, fait encore autorité pour l'identification des textes (numérotation Moreau) et de la tentative de recension exhaustive (elle rassemble 80 % des pièces connues à ce jour). Une nouvelle ressource est en cours d'élaboration à la bibliothèque Mazarine (Base Bibliographique des mazarinades) qui offrira à terme une nouvelle numérotation avec permalien et des métadonnées rénovées issues des archives Carrier, notamment. [[https://www.bibliotheque-mazarine.fr/fr/evenements/actualites/bibliographie-des-mazarinades-bm|https://www.bibliotheque-mazarine.fr/fr/evenements/actualites/bibliographie-des-mazarinades-bm]] "Ouvrage magnifique" (Jouhaud 2009: 37), la bibliographie de Moreau est autant un outil de travail indispensable qu'un ouvrage qui appartient à l'historiographie de la Fronde et de ses libelles, et qu'il convient de mettre en perspective. Outre les erreurs et oublis que les bibliographes suivants ont parfois corrigées (nous intégrons ces suppléments bibliographiques), Moreau accompagne son classement de jugements idéologiques et axiologiques. Nous faisons le choix de conserver ces commentaires, en tant qu'ils documentent l'histoire du regard sur les Mazarinades (en l'occurrence, celui d'un légitimiste du XIXe siècle) et non seulement les Mazarinades elles-mêmes. L'objectif du tableur en cours de construction est d'être complété et amendé peu à peu par divers acquis de la recherche sur les métadonnées. Il s'agira d'abord d'intégrer les recherches d'H. Carrier, qui préparait une bibliographique et critique des Mazarinades. [[https://mazarinum.bibliotheque-mazarine.fr/expositions-virtuelles/item/17787-vii-enqueter-sur-les-mazarinades?oeuvre=19#page=1&viewer=picture&o=no&n=0&q=]] Si celle-ci n'a pas pu être achevée, les apports importants qu'elle devait contenir se trouvent parfois dans ses ouvrages critiques, et seront intégrés peu à peu à notre liste bibliographique, après dépouillement systématique de Carrier 1989 et 1991 et appui sur le travail de la Bibliothèque Mazarine, récipiendaire des archives Carrier, qui exploite ce fonds manuscrit pour mettre au point une base de données bibliographiques rénovées (https://mazarinades.bibliotheque-mazarine.fr/). L'enjeu est ainsi de répercuter les dernières connaissances bibliographiques sur le sujet, et de permettre aux utilisateurs diverses requêtes plein texte dans une liste aussi complète que possible des titres de Mazarinades. Aussi cette liste requêtable se veut-elle un expédient pour une des difficultés majeures de ce corpus : s'y retrouver. //Les sources bibliographiques intégrées dans le tableur interrogeable fugurent ci-dessous par ordre chronologique// ==== Bibliographie ==== MOREAU C. (1850-1851). //Bibliographie des Mazarinades//. 3 t. Paris : Jules Renouard. MOREAU C. (1862). "Supplément à la Bibliographie des mazarinades", In //le Bulletin du Bibliophile et du bibliothécaire//, p. 786–829. Paris: Techener. MOREAU C. (1869). "Supplément à la Bibliographie des mazarinades", In //le Bulletin du Bibliophile et du bibliothécaire//, p. 61–81. Paris : Techener SOCARD E. (1876). "Supplément à la Bibliographie des Mazarinades". Paris : H.Menu. LABADIE E. (1904). "Nouveaux Suppléments à la bibliographie des Mazarinades". In //le Bulletin du Bibliophile et du bibliothécaire//. Paris : Henri Leclerc. //Titres cités// CARRIER H. (1989). //La Presse de la Fronde (1648-1653) : Les mazarinades, vol. I, La Conquête de l’opinion//. Genève : Droz. CARRIER H. (1991). //La Presse de la Fronde (1648-1653) : Les mazarinades, vol. II, Les Hommes du livre//. Genève : Droz. JOUHAUD C. (1985. rééd. 2009). //Mazarinades. La Fronde des mots//. Paris : Aubier. ===== Informations ===== ==== Membres ==== Actuels : * [[https://www.iufrance.fr/les-membres-de-liuf/membre/1833-karine-abiven.html|Karine Abiven]] MCF en Langue Française * [[http://www.lejeunegael.fr/|Gaël Lejeune]] MCF en Informatique * Marie-Sophie Desmarest, stagiaire 2023 Anciens * [[https://jbtanguy.github.io/|Jean-Baptiste Tanguy]] Doctorant en Humanités Numériques, 2019-2022 * [[https://cv.archives-ouvertes.fr/alexandre-bartz|Alexandre Bartz]], Ingénieur, 2021-2022 * Margaux Faure, M2 TNAH (École nationale des chartes), stagiaire 2022 * Zoé Cappe, M2 TNAH (École nationale des chartes), stagiaire 2022 * Amélie Hip, vacataire (retranscriptions) 2021 * Mélanie Lecha, M2 Humanités Numériques, ENS Lyon/ENSSIB 2021 * Camille Roblin, M2 Humanités Numériques, Lyon 2/ENSSIB 2021 * Sylia Kecili, stagiaire (M1 TILDE, Paris 13) sur les problématiques d'OCR, 2019-2020 * Anaëlle Baledent, stagiaire (M2) sur la datation, actuellement en thèse d'Informatique à l'Université de Caen, 2018-2019 * Nicolas Hiebel, stagiaire (L3 SU) sur la datation, 2018-2019 * Jamiilah Patel, stagiaire (M1 SU), sur la correction des métadonnées Moreau, 2018-2019 ==== Partenaires ==== Nous remercions l'OBVIL, le DIM STCN, l'initiative CORLI, la région Ile de France (projet PhD2), la bibliothèque Mazarine pour leur collaboration. [[http://www.dim-humanites-numeriques.fr/projets/antonomaz/|page officielle sur le site du DIM]] Le projet a été labellisé par le Consortium CAHIER [https://cahier.hypotheses.org/membres] de la Tigr Huma-num (voir aussi [https://cahier.hypotheses.org/antonomaz]). ==== Publications et Réalisations associées ==== * 2023, Karine Abiven, « Entendre l’action politique derrière la chanson satirique : les couplets du chansonnier de Gaston d’Orléans pendant la Fronde », revue Littérales, numéro dirigé par Laurence Giavarini et Mathilde Bernard, « Auctorialité et pratiques groupales dans les conflits de plume (MA-XVIIIe siècles) », 2023. * 2023, Karine Abiven, « La formule dans la chanson d’actualité au XVIIe siècle : figement linguistique et politisation du vers », dans La littérature en formules, dir. O. Belin, A.-C. Bello et L. Radut-Gaghi, Fabula-LHT, 2023. * 2022, Karine Abiven, « “ À quoi sert une chanson, si elle est désarmée” : les chansons pendant la Fronde, armes ou récits ? », Revue Écrire l’histoire, n° 22, p.131-133. https://journals.openedition.org/elh/. * 2022: Alexandre Bartz, Jean-Baptiste Tanguy et Gaël Lejeune, « Vers une collection numérique des libelles de la Fronde ou comment relier des mazarinades », dans A. Réach-Ngô et R. Walter (dir.), « Circulation des écrits littéraires de la Première Modernité & Humanités numériques », Le Verger. https://cornucopia16.com/blog/2022/04/24/karine-abiven-alexandre-bartz-gael-lejeune-et-jean-baptiste-tanguy-vers-une-collection-numerique-des-libelles-parus-pendant-la-fronde-ou-comment-relier-des-mazarinades/ * 2021: Karine Abiven, « Viralité des mazarinades chantées et écrites : tubes et/ou éléments de langage ? », dans A. Fouqué, T. Gheeraert et M. Speyer (dir.), Les Recettes du succès. Stéréotypes compositionnels et littérarité au XVIIe siècle, actes du colloque de l’Université Rouen Normandie, 15 janvier 2021, Fabula / Les colloques, URL : http://www.fabula.org/colloques/document9080.php. * 2021 : Karine Abiven, Jean-Baptiste Tanguy et Gaël Lejeune, « Exploiter un corpus de données textuelles sans post-traitement : l’écriture burlesque de la Fronde », Revue Humanités numériques, n° 4. https://journals.openedition.org/revuehn/2355 * 28/06/20 : '''Exploiter des modèles de langue pour évaluer des sorties de logiciels d’OCR pour des documents français du XVIIe siècle''', article accepté à RECITAL@TALN 2020, Jean-Baptiste Tanguy * 10/03/20 : '''Dating Ancient texts: an Approach for Noisy French Documents''', article accepté à "Language Technologies for Historical and Ancient Languages (LT4HALA), Anaëlle Baledent (GREYC, Normandie Université), Nicolas Hiebel et Gaël Lejeune * 2019 : K. Abiven : « Le moment discursif des barricades d’août 1648 : quelle interprétation des récurrences dans le discours sur l’événement ? », Cahiers de Narratologie [En ligne], 35 | 2019, mis en ligne le 03 septembre 2019, URL : http://journals.openedition.org/narratologie/9264 * 29/11/19, K. Abiven: « La liste de noms propres dans les libelles de la Fronde : les revendications de prestige et leur satire », journées d’étude Listes de noms. Ordre social et ordre du livre, M. Roussillon et C. Schuwey, Université d’Artois, Arras. * 05/04/19 : [[http://obvil.sorbonne-universite.site/actualite/seminaire-de-lobvil-analyse-stylistique-de-textes-litteraires/ven-05042019-0000|Séminaire à l'OBVIL : analyse stylistique de textes littéraires]] * A. Baledent et G. Lejeune, "Automatic Stylistic Analysis; a search for efficient and interpretable descriptors to characterize individual writing style", in Phraséologie et stylistique de la langue littéraire, Ludwig Fesenmeier et Iva Novakova (eds.), Peter Lang, 2020, p. 329-342. * 14/03/19 : '''Analyse stylistique automatique : A la recherche d'indices efficaces et pertinents pour caractériser le style de Dumas''' Anaëlle Baledent et Gaël Lejeune, Phraseorom 2019. * 15/01/19 : '''Analyse automatique de documents anciens : tirer parti d'un corpus incomplet, hétérogène et bruité''' Karine Abiven et Gaël Lejeune, revue RIDOWS -- [[https://www.openscience.fr/Numero-1-444| Pdf]]