Le projet Comparing Romance Languages through History (CoRaLHis): building a multilingual parallel diachronic corpus (13th-18th C.) vise à fournir une compréhension approfondie de la façon dont les langues divergent les unes des autres au fil du temps dans le domaine des langues romanes. Avec ce but, il présente un consortium de corpus déjà existants, qui sont intégrés dans un corpus numérique multilingue de textes comparables du XIIIe au XVIIIe pour les trois grands domaines de la Roumanie (gallo-, italo- et ibéro-romance), afin de permettre une analyse empirique à grande échelle et à grain fin des changements linguistiques dans les différentes langues romanes.
=== Partenaires === [ordre alphabétique]
==== Corpora ==== [ordre alphabétique]
ATLiSOr | [Sarde] | |
BFM, Base de Français Médieval | [Français] | |
Corpus Histórico do Português Tycho Brahe | [Portugais] | |
CICA, Corpus informatitzat del català antic | [Catalan] | |
CIPM, Corpus Informatizado do Português Medieval] | [Portuguese] | |
Digital Library of Old Spanish Texts, Hispanic Seminary of Medieval Studies | [Espagnol] | |
Corpus Francoprovençal | [Francoprovençal] | |
Corpus of Swiss legal texts | [Français (beaucoup de textes), Italien (assez de textes), Rhéto-roman (très peu de textes)] | |
Linguistic Corpus of Old Gascon | [Occitan] | |
MIDIA, Morfologia dell'Italiano in DIAcronia | [Italien] | |
Presto | [Français] | |
TMAO, Trésor Manuscrit Ancien Occitan | [Occitan] |
Un accord formel sera signé avec le responsable de chacun des corpus susmentionnés afin d'établir les termes et conditions de la collaboration, avec une attention particulière sur les questions juridiques découlant de l'utilisation des textes.
Après la première réunion en personne à Zurich en novembre 2019, une deuxième réunion (en ligne, en raison de la situation pandémique) a eu lieu en avril 2020, où plusieurs détails ont été réglés et un plan d'action concret a été convenu par les partenaires.
Pour des informations plus spécifiques sur les langues, les genres et le nombre de mots du corpus, voir ici.
Projet Emergence financé par l'Idex Super de l'Alliance Sorbonne Université. Plus d'info ici