User Tools

Site Tools


antonomaz

Descriptif du projet Antonomaz

Le projet Antonomaz, “ANalyse auTOmatique et NumérisatiOn des MAZarinades” vise à exploiter un corpus raisonné parmi les quelques 5200 écrits ayant pour objet les affaires politiques du cardinal Mazarin sous la régence d'Anne d'Autriche, et traditionnellement appelés “mazarinades”.

Notre approche se situe dans le champ des études littéraires, de l'analyse du discours et des Humanités Numériques. Elle vise à fournir des méthodes automatiques, empruntant au Traitement Automatique des Langues et à la fouille de données, pour l'analyse de ces données par les spécialistes des divers domaines qu'intéressent ces textes (littéraires, linguistes, historiens, principalement).

Les premières étapes du projet visent à réfléchir à la notion de corpus, via cet objet complexe hérité d'une tradition bibliographique pluriséculaire et qu'il s'agit de défaire tout en reconstruisant des corpus cohérents via l'outil numérique.

Le projet a été labellisé par le Consortium CAHIER [https://cahier.hypotheses.org/membres] de la Tigr Huma-num (voir aussi [https://cahier.hypotheses.org/antonomaz]).

Actions en cours

  • Mise au point par océrisation d'un corpus textuel d'écrits burlesques de la Fronde, et de corpus burlesques contrastifs (article dans la revue Humanités numériques).
  • Préparation de corpus cohérents taillés dans l'ensemble desdites “mazarinades”. Premier laboratoire: après les écrits en “vers burlesques” (océrisation et encodage en Xml-TEI), les lettres, les pièces narratives, et les pièces en vers, notamment celles destinées à être chantées.

Volumétrie des données collectées

NB : en italique, valeurs estimées

Les données du 27 septembre seront prochainement mises à jour (valeurs réelles et non estimées).

DatePDF #docsPDF #pagesXML #docsXML #pagesXML #tokensXML #types)Retranscrits #docs
02/06/20211.11115.0004475.3002.108.211199.374105
02/07/20212.22131.000 687 8.2002.647.056242.418105
22/07/20212.61337.000 750 9.0002.811.341257.506105
27/09/20212.61337.000 2.000 24.0007.350.000257.506105

Githubs

Liens vers les différents githubs créés pour les besoins du projet :

Mise en ligne

  • Mise en ligne des numérisations en format IIIF d'un ensemble de libelles conservés à la Mazarine (1ere vague de 419 libelles dont le financement a été assuré par l'OBVIL pour Antonomaz) :

https://mazarinum.bibliotheque-mazarine.fr/a-propos/article/6-mazarinades (merci à l'OBVIL de s'en être aussi fait l'écho ici. 2e vague financée par l'IUF à suivre.

  • Mise en ligne de la bibliographie Moreau (“Moreau En Ligne”), et de ses suppléments, structurée en format texte et interrogeable par divers champ (numéro Moreau, date, mots de la notice Moreau, nombre de pages, etc.).

Une version (dernière mise à jour en juillet 2021) de cette ressource se trouve ici : http://memes.sorbonne-universite.fr/visualisation/Moreau/test.html

La ressource Moreau En Ligne vise à permettre diverses requêtes dans les métadonnées léguées par la tradition bibliographique. Le point de départ est la grande bibliographie de Célestin Moreau (1850-1851), qui, en l'absence de rénovation au XXe siècle, fait encore autorité pour l'identification des textes (numérotation Moreau) et de la tentative de recension exhaustive (elle rassemble 80 % des pièces connues à ce jour). Une nouvelle ressource est en cours d'élaboration à la bibliothèque Mazarine (Base Bibliographique des mazarinades) qui offrira à terme une nouvelle numérotation avec permalien et des métadonnées rénovées issues des archives Carrier, notamment. https://www.bibliotheque-mazarine.fr/fr/evenements/actualites/bibliographie-des-mazarinades-bm

“Ouvrage magnifique” (Jouhaud 2009: 37), la bibliographie de Moreau est autant un outil de travail indispensable qu'un ouvrage qui appartient à l'historiographie de la Fronde et de ses libelles, et qu'il convient de mettre en perspective. Outre les erreurs et oublis que les bibliographes suivants ont parfois corrigées (nous intégrons ces suppléments bibliographiques), Moreau accompagne son classement de jugements idéologiques et axiologiques. Nous faisons le choix de conserver ces commentaires, en tant qu'ils documentent l'histoire du regard sur les Mazarinades (en l'occurrence, celui d'un légitimiste du XIXe siècle) et non seulement les Mazarinades elles-mêmes.

L'objectif du tableur en cours de construction est d'être complété et amendé peu à peu par divers acquis de la recherche sur les métadonnées. Il s'agira d'abord d'intégrer les recherches d'H. Carrier, qui préparait une bibliographique et critique des Mazarinades. https://mazarinum.bibliotheque-mazarine.fr/expositions-virtuelles/item/17787-vii-enqueter-sur-les-mazarinades?oeuvre=19#page=1&viewer=picture&o=no&n=0&q= Si celle-ci n'a pas pu être achevée, les apports importants qu'elle devait contenir se trouvent parfois dans ses ouvrages critiques, et seront intégrés peu à peu à notre liste bibliographique, après dépouillement systématique de Carrier 1989 et 1991 et appui sur le travail de la Bibliothèque Mazarine, récipiendaire des archives Carrier, qui exploite ce fonds manuscrit pour mettre au point une base de données bibliographiques rénovées (https://mazarinades.bibliotheque-mazarine.fr/). L'enjeu est ainsi de répercuter les dernières connaissances bibliographiques sur le sujet, et de permettre aux utilisateurs diverses requêtes plein texte dans une liste aussi complète que possible des titres de Mazarinades. Aussi cette liste requêtable se veut-elle un expédient pour une des difficultés majeures de ce corpus : s'y retrouver.

Les sources bibliographiques intégrées dans le tableur interrogeable fugurent ci-dessous par ordre chronologique

Bibliographie

MOREAU C. (1850-1851). Bibliographie des Mazarinades. 3 t. Paris : Jules Renouard.

MOREAU C. (1862). “Supplément à la Bibliographie des mazarinades”, In le Bulletin du Bibliophile et du bibliothécaire, p. 786–829. Paris: Techener.

MOREAU C. (1869). “Supplément à la Bibliographie des mazarinades”, In le Bulletin du Bibliophile et du bibliothécaire, p. 61–81. Paris : Techener

SOCARD E. (1876). “Supplément à la Bibliographie des Mazarinades”. Paris : H.Menu.

LABADIE E. (1904). “Nouveaux Suppléments à la bibliographie des Mazarinades”. In le Bulletin du Bibliophile et du bibliothécaire. Paris : Henri Leclerc.

Titres cités

CARRIER H. (1989). La Presse de la Fronde (1648-1653) : Les mazarinades, vol. I, La Conquête de l’opinion. Genève : Droz.

CARRIER H. (1991). La Presse de la Fronde (1648-1653) : Les mazarinades, vol. II, Les Hommes du livre. Genève : Droz.

JOUHAUD C. (1985. rééd. 2009). Mazarinades. La Fronde des mots. Paris : Aubier.

Informations

Membres

Actuels :

  • Karine Abiven MCF en Langue Française
  • Gaël Lejeune MCF en Informatique
  • Jean-Baptiste Tanguy Doctorant en Humanités Numériques
  • Mélanie Lecha, M2 Humanités Numériques, ENS Lyon/ENSSIB
  • Camille Roblin, M2 Humanités Numériques, Lyon 2/ENSSIB
  • Alexandre Bartz, Ingénieur
  • Amélie Hip, vacataire (retranscriptions)

Anciens :

  • 2019-2020: Sylia Kecili, stagiaire (M1 TILDE, Paris 13) sur les problématiques d'OCR
  • 2018-2019 :
    • Anaëlle Baledent, stagiaire (M2) sur la datation, actuellement en thèse d'Informatique à l'Université de Caen
    • Nicolas Hiebel, stagiaire (L3) sur la datation, actuellement en M2 Langue et Informatique à Sorbonne Université
    • Jamiilah Patel, stagiaire (M1), sur la structuration des métadonnées, Masterante en Littérature à Sorbonne Université

Partenaires

Nous remercions l'OBVIL, le DIM STCN, l'initiative CORLI, la région Ile de France (projet PhD2), la bibliothèque Mazarine pour leur collaboration.

page officielle sur le site du DIM

Publications et Réalisations associées

  • 2021 tbp : Karine Abiven, Jean-Baptiste Tanguy et Gaël Lejeune, « Exploiter en corpus des données textuelles océrisées : l’écriture burlesque de la Fronde (1648-1652) », accepté, revue Humanités numériques, n°4 - Humanistica.
  • 28/06/20 : 'Exploiter des modèles de langue pour évaluer des sorties de logiciels d’OCR pour des documents français du XVIIe siècle', article accepté à RECITAL@TALN 2020, Jean-Baptiste Tanguy
  • 10/03/20 : 'Dating Ancient texts: an Approach for Noisy French Documents', article accepté à “Language Technologies for Historical and Ancient Languages (LT4HALA), Anaëlle Baledent (GREYC, Normandie Université), Nicolas Hiebel et Gaël Lejeune
  • 2019 : K. Abiven : « Le moment discursif des barricades d’août 1648 : quelle interprétation des récurrences dans le discours sur l’événement ? », Cahiers de Narratologie [En ligne], 35 | 2019, mis en ligne le 03 septembre 2019, URL : http://journals.openedition.org/narratologie/9264
  • 29/11/19, K. Abiven: « La liste de noms propres dans les libelles de la Fronde : les revendications de prestige et leur satire », journées d’étude Listes de noms. Ordre social et ordre du livre, M. Roussillon et C. Schuwey, Université d’Artois, Arras.
  • A. Baledent et G. Lejeune, “Automatic Stylistic Analysis; a search for efficient and interpretable descriptors to characterize individual writing style”, in Phraséologie et stylistique de la langue littéraire, Ludwig Fesenmeier et Iva Novakova (eds.), Peter Lang, 2020, p. 329-342.
  • 14/03/19 : 'Analyse stylistique automatique : A la recherche d'indices efficaces et pertinents pour caractériser le style de Dumas' Anaëlle Baledent et Gaël Lejeune, Phraseorom 2019.
  • 15/01/19 : 'Analyse automatique de documents anciens : tirer parti d'un corpus incomplet, hétérogène et bruité' Karine Abiven et Gaël Lejeune, revue RIDOWS – Pdf
  • 28/05/18 : 'Analyse Automatique des Mazarinades : tirer profit d'un corpus bruité' Karine Abiven et Gaël Lejeune Atelier ADOC
antonomaz.txt · Last modified: 2021/10/07 07:49 by abartz