User Tools

Site Tools


seminaire_lc

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
seminaire_lc [2020/09/11 08:20]
gael [Séminaires de l'équipe "Linguistique Computationnelle" 2020-2021]
seminaire_lc [2024/03/08 19:43]
gael
Line 1: Line 1:
-===== Séminaires ​de l'​équipe ​"​Linguistique Computationnelle" ​2020-2021 =====+===== Séminaires "Variation Linguistique et Linguistique Computationnelle" ​2023-2024 =====
  
-**Séminaire régulier le jeudi de 9h à 10h en salle 117** Maison de la recherche 28rue Serpente+Créneaux second semestre (salle 224) : 15/0214/03, 11/04 , 16/05 et 20/06
  
-Calendrier ​ :+Ce séminaire a vu le jour à l'​initiative d'​Alice Millour et Gaël Lejeune en 2018 (63 séminaires organisés depuis lors) sous le nom de séminaire de l'​équipe de Linguistique Computationnelle. Depuis janvier 2023, avec le concours de Gilles Couffignal il est renommé "​Variation Linguistique et Linguistique Computationnelle"​ afin d'​accueillir les recherches de l'axe transversal du même nom nouvellement créé au sein du laboratoire STIH.
  
-| 10/09| 8/10 | 15/10| 5/11| 3/12| +**Séminaires les jeudi de 9h à 10h en salle D117 (puis salle 224 à partir du 15/02)**
-| Collectif (speed-dating)| Karën Fort |Alice Millour| TBA | TBA|+
  
-Détails ​+|18/​01|15/​02|14/​03|11/​04|16/​05|20/​06| 
-| 15/​10|"​Construction de ressources langagières par myriadisation pour le traitement automatique des langues peu dotées"​ Pré-soutenance de thèse|A. Millour|...|| +|G.Dias / F.Maurel|M.Hernandez|**L. Moreno et G.Lejeune**|J.M. Torres-Moreno (Avignon)| | | 
-| 08/10|Le CNU (27) et la qualification MCF |K. Fort |...||+ 
 +|**Date**|**Titre**|**Intervenant**|**Mots-clés**|**Lien Diapos**| 
 +|07/​09|Speed Dating |Collectif|Séminaire de rentrée| | 
 +|26/​10|Gaël Lejeune|Rapprocher des éléments textuels similaires ​apports à la gestion des sauts qualitatifs en général et à la variation morphologique en particulier|Similarité,​ Classification,​ OCR, Corpus Multilingues|[[http://​www.lejeunegael.fr/​ressources_seminaire-LC/​20231026_Seminaire-LC_GL.pdf|Slides]]| 
 +|23/​11|Luis-Gil Moreno Jiménez|Utilisation de la rime et de l'​analyse sémantique pour la génération de phrases|Analyse Sémantique,​ Créativité Computationnelle,​ Rimes |[[http://​www.lejeunegael.fr/​ressources_seminaire-LC/​20231123_LuisMoreno.pdf|Slides]]| 
 +|21/​12|Iglika Nikolova-Stoupak|Abrégement des textes littéraires dans plusieurs langues : transformations grammaticales | Simplification,​ Abrègement,​ Accès aux données textuelles|[[http://​www.lejeunegael.fr/​ressources_seminaire-LC/​20231221_Iglika-Stouplak.pdf|Slides]] | 
 +|18/01|(I) G. Dias et (II) F. Maurel (Greyc)|Détection de la Dépression dans des textes (I) & Rôle de la sémantique morpho-dispositionnelle pour la compréhension active et non visuelle des documents numériques (II)|Classification,​ Dépression,​ Structure de Documents, Oralisation | [[http://​www.lejeunegael.fr/​ressources_seminaire-LC/​20240118_Gael-DIaspresentation-sante-ia.pdf|Slides G.Dias]]| 
 +|15/​02|Marceau Hernandez|MORDOR :​Myriadisation et Orchestration de Ramifications Divergentes pour l' Optimisation de Ressources textuelles|Scraping,​ OCR, ASR, fusion|[[http://​www.lejeunegael.fr/​ressources_seminaire-LC/​20240308_Marceau-Hernandez.pdf|Slides]] | 
 +|14/03|Luis Gil Moreno et G.Lejeune|**Approche stochastique pour la génération automatique de titres descriptifs**|Génération,​ Modèles de Langue| | 
 + 
 +===== Séminaires 2022-2023 (9) ===== 
 + 
 +|**Date**|**Titre**|**Intervenant**|**Mots-clés**|**Lien Diapos**| 
 +|15/​06|**Regrouper des Entités Nommées de Lieux issues d'​océrisation : Epimethee de l'OCR à la carte **(Mapping spatial named entities from noisy OCR output: Epimethee from OCR to map)|Caroline Koudoro-Parfait et Gaël Lejeune |variation, OCR, Reconnaissance d'​entités nommées, cartographie| [[http://​www.lejeunegael.fr/​ressources_seminaire-LC/​20230615_Caroline-Parfait.pdf|Slides]]| 
 +|11/​05|Reconnaissance de défigements dans des tweets en français par des mesures de similarité sur des alignements textuels|Julien Bezançon|variation,​ mesures similarité,​ corpus de tweets | [[http://​www.lejeunegael.fr/​ressources_seminaire-LC/​20230511_Bezancon.pdf|Slides]] | 
 +|13/​04|Correction automatique des interférences OCR dans la reconnaissance d’entités nommées spatiales : réel gain ou perte de l’information ?|Caroline Parfait et Ljdumila Petkovic|NER,​ OCR, évaluation| [[http://​www.lejeunegael.fr/​ressources_seminaire-LC/​20230413_Parfait-Petkovic.pdf|Slides]]| 
 +|30/​03|Synthèse vocale pour la langue Arabe : voix naturelle et manque de ressources|Oumaima Zine|Traitement de la Parole| | | 
 +|16/​02|Sauts qualitatifs dans les corpus : conséquences épistémologiques et techniques|Gilles Couffignal et Gaël Lejeune|OCR,​ LInguistique de Corpus, Variation| | | 
 +|15/​12|Détection des comportements anormaux dans les réseaux sociaux|Nour El Houda Ben Chaabene|Détection d’anomalie,​ Analyse des réseaux sociaux, Données multimodales,​ Réseau multidimensionnel,​ Détection de communautés|[[http://​www.lejeunegael.fr/​ressources_seminaire-LC/​20221215_Séminaire-Nour.pdf|Slides]]| 
 +|17/11|La double nature de la dématerialisation|Corina Chutaux|Humanités Numériques|...| 
 +|29/​09|Retour sur le DEFT2022: Notation automatique de copies d'​étudiant·e·s par combinaisons de méthodes de similarité|I. Ben Ltaifa, T.Boubehziz,​ A. Briglia, C. Chutaux, Y. Dupont, C. González-Gallardo,​ C.  Koudoro-Parfait,​ G. Lejeune|...|...| 
 +|08/​09|*Rencontres minutes Science* (3mn pour vous présenter)|Collectif|TAL,​ Humanités Numériques |[[http://​www.lejeunegael.fr/​ressources_seminaire-LC/​20220908_Speed-dating.pdf|Slides]] | 
 + 
 +===== Séminaires 2021-2022 (11) ===== 
 + 
 +|07/07|Art et littérature transhumanistes|Corina Chutaux|Humanités Numériques|...| 
 +|16/06|A New Representation Approaches based on Deep Learning to Improve the Semantic Information Retrieval|Ibtihel Ben Ltaifa|Semantic Information Retrieval|[[http://​www.lejeunegael.fr/​ressources_seminaire-LC/​2022-06-16_Ibtihel-Ben-Ltaifa.pdf|Slides]]| 
 +|19/​05|Quasi real-time simulation of a capsule in flow using data-driven Reduced-Order Model|Toufik Boubehziz|Data Analysis|...| 
 +|21/​04|Problématiques d'​élaboration d'un corpus de chansons situées temporellement|Gaël Lejeune|Constitution de Corpus, dédoublonnage,​ Web Scraping, API|[[http://​www.lejeunegael.fr/​ressources_seminaire-LC/​2022_Seminaire-Lejeune_chansons.pdf|Slides]]| 
 +|31/03|Doxa et contre-doxa dans la construction du territoire discursif du Front National (2000-2017)|Camille Bouzereau ( Université Côte d'​Azur)|Analyse du discours politique,​humanités numériques,​ lexicométrie,​ linguistique,​ discours politique|[[http://​www.lejeunegael.fr/​ressources_seminaire-LC/​20220331_Presentation_STIH_Bouzereau.pdf|Slides]]| 
 +|10/​03|Évaluation des résultats de NER sur des transcriptions OCR bruitées par élaboration de supports cartographiques|Caroline Parfait|Reconnaissance d'​Entités Nommées, Cartographie,​ OCR|[[http://​www.lejeunegael.fr/​ressources_seminaire-LC/​20220310_Caroline-Parfait.pdf|Slides]]| 
 +|20/​01|Antonomaz : Exploitation d'​Imprimés du XVIIème siècle Numérisés|Karine Abiven|Humanités Numériques,​ OCR| [[http://​www.lejeunegael.fr/​ressources_seminaire-LC/​20220102_Abiven-Bartz.pdf|Slides]]| 
 +|16/12|Ce que l'​annotation avec TreeTagger permet d'​apprendre sur les adverbes et adverbiaux dans les scripts d'​audiodescription|Eva Lacroix|Linguistique de Corpus, Analyse Syntaxique, Audiodescription |[[http://​www.lejeunegael.fr/​ressources_seminaire-LC/​20211216_Eva-Lacroix.pdf|Slides]]| 
 +|9/12 (report du 21/10)|Les biais dans les annotations manuelles|A. Baledent (Univ. Caen)|Annotation,​ Evaluation, Biais | | 
 +|18/​11|L'​enjeu de la représentation de grandes quantités de données langagières. Un cas d'​étude sur des suivis longitudinaux|Andrea Briglia|Données longitudinales,​ Apprentissage de la Langue | | 
 +|09/​09|Speed Dating (Vos travaux de recherche en 3mn)|Collectif |Humanités Numériques,​ TAL, TAP, Linguistique,​ Ethique, Corpus|[[http://​www.lejeunegael.fr/​ressources_seminaire-LC/​20210909_SemLC.pdf|Slides]]| 
 + 
 + 
 + 
 +===== Séminaires 2020-2021 (13) ===== 
 +|17/​06|Participation de STIH à Deft 2021 (indexation/​similarité)|Dupont el al.|Fouille de Textes, Indexation, Classification,​ Régression|| 
 +|20/​05|Clustering de textes pour l'​extraction de néologismes : justification du coût de construction d'un petit corpus|Manuela Yapomo|Néologismes,​ Linguistique de Corpus|| 
 +| 15/​04|Investigating dominant word-order on universal dependencies with graph rewriting|HeeSoo Choi|Universaux de Greenberg, Ordre Syntaxique|| 
 +| 01/​04|Détection d'​objets en temps réel|Fouad Aouinti|Détection d'​Objets,​ Humanités Numériques|| 
 +| 18/​03|Reconnaissance d'​entités nommées dans des textes de littérature française du 19ème : le poids du bruit ?|Caroline Parfait|Données Bruitées, Littérature,​ Entités Nommées|[[http://​www.lejeunegael.fr/​ressources_seminaire-LC/​20210318_Caroline-Parfait.pdf|Slides]]| 
 +| 18/02|La théorie de l'​information |Jean-Baptiste Tanguy|Théorie de l'​Information,​ OCR|| 
 +| 21/01|La reconnaissance automatique de la parole dans le contexte médical|Imed Laaridh|Débit de parole, parole pathologique |[[http://​www.lejeunegael.fr/​ressources_seminaire-LC/​20210121_Imed-Laaridh.pdf|Slides]]| 
 +| 17/​12|Articles "​doudou"​|Karën Fort et al.|Style et Science|[[http://​www.lejeunegael.fr/​ressources_seminaire-LC/​20201217_ArticlesDoudou.pdf|Slides]]| 
 +| 03/​12|Partitionnement des actualités avec MAJORCLUST et distances temporaires|Carlos González|Clustering,​ Multimedia|[[http://​www.lejeunegael.fr/​ressources_seminaire-LC/​20201203_Carlos-Gonzales.pdf|Slides]]| 
 +| 12/11|New Results in Multilingual Epidemic Surveillance |Gaël Lejeune|Classification,​ Extraction d'​Information|[[http://​www.lejeunegael.fr/​ressources_seminaire-LC/​20201112_Results-Epidemio.pdf|Slides]]| 
 +| 15/​10|"​Construction de ressources langagières par myriadisation pour le traitement automatique des langues peu dotées" ​(Pré-soutenance de thèse)|A. Millour|...|| 
 +| 08/10|Le CNU (27) et la qualification MCF |K. Fort |Qualification,​ CNU, Section 27, carrière|[[https://​www.schplaf.org/​kf/​pdf/​PresentationQualifCNU27_2020.pdf|Slides]]|
 | 10/09|Speed Dating (Vos travaux de recherche en 3mn)|Collectif |du TAL au TAP en passant par les ontologies et les Humanités Numériques|[[http://​www.lejeunegael.fr/​ressources_seminaire-LC/​20200910_SemLC.pdf|Slides]]| | 10/09|Speed Dating (Vos travaux de recherche en 3mn)|Collectif |du TAL au TAP en passant par les ontologies et les Humanités Numériques|[[http://​www.lejeunegael.fr/​ressources_seminaire-LC/​20200910_SemLC.pdf|Slides]]|
  
-===== Séminaires 2019-2020 =====+===== Séminaires 2019-2020 ​(11) =====
  
 |02/​07|Faire face à la variabilité en TAL: pistes épistémologiques et pratiques|Gaël Lejeune|Epistémologie,​ Paradigmes, Tokénisation,​ Analyse en Caractères|[[http://​www.lejeunegael.fr/​ressources_seminaire-LC/​Lejeune-Gael_202007.pdf|Slides]]| |02/​07|Faire face à la variabilité en TAL: pistes épistémologiques et pratiques|Gaël Lejeune|Epistémologie,​ Paradigmes, Tokénisation,​ Analyse en Caractères|[[http://​www.lejeunegael.fr/​ressources_seminaire-LC/​Lejeune-Gael_202007.pdf|Slides]]|
 |18/​06|Exploiter des modèles de langue pour évaluer des sorties de logiciels d’OCR pour des documents français du XVIIe siècle|Jean-Baptiste Tanguy|OCR, modèle de langue, évaluation,​ document historique, français pré-classique.|[[http://​www.lejeunegael.fr/​ressources_seminaire-LC/​TANGUY_JB_202006.pdf|Slides]]| |18/​06|Exploiter des modèles de langue pour évaluer des sorties de logiciels d’OCR pour des documents français du XVIIe siècle|Jean-Baptiste Tanguy|OCR, modèle de langue, évaluation,​ document historique, français pré-classique.|[[http://​www.lejeunegael.fr/​ressources_seminaire-LC/​TANGUY_JB_202006.pdf|Slides]]|
-|28/05|Il a cru j'​étais un second choix » : analyse syntaxique et sociolinguistique des constructions [CV. Ø CV.] en français parlé contemporain|Auphélie Ferreira (Lattice)| | |+|28/05|Il a cru j'​étais un second choix » : analyse syntaxique et sociolinguistique des constructions [CV. Ø CV.] en français parlé contemporain|Auphélie Ferreira (Lattice)|Langue parlée, Syntaxe ​|[[http://​www.lejeunegael.fr/​ressources_seminaire-LC/​Ferreira_presentation_260520.pdf|Slides]]|
 |06/​04|Sentiment Analysis for the Latinised Arabic (Arabizi)|Taha Tobaili (The Open University UK)|Sentiment Analysis, Tweets, Under Resourced Languages|[[http://​www.lejeunegael.fr/​ressources_seminaire-LC/​TOBAILI_Taha_20200406.pdf|Slides]]| |06/​04|Sentiment Analysis for the Latinised Arabic (Arabizi)|Taha Tobaili (The Open University UK)|Sentiment Analysis, Tweets, Under Resourced Languages|[[http://​www.lejeunegael.fr/​ressources_seminaire-LC/​TOBAILI_Taha_20200406.pdf|Slides]]|
 |26/​03|Analyse et classifications des dialectes arabes en se basant sur des techniques de Deep Learning ​          ​|Dhaou Ghoul            |Classification,​ Dialectes, Langue Arabe                                                                                                    |[[http://​www.lejeunegael.fr/​ressources_seminaire-LC/​GHOUL_Dhaou_20200326.pdf|Slides]] ​   | |26/​03|Analyse et classifications des dialectes arabes en se basant sur des techniques de Deep Learning ​          ​|Dhaou Ghoul            |Classification,​ Dialectes, Langue Arabe                                                                                                    |[[http://​www.lejeunegael.fr/​ressources_seminaire-LC/​GHOUL_Dhaou_20200326.pdf|Slides]] ​   |
Line 27: Line 77:
 |12/​09|Rencontres Minute Science ​                                                                                 |Collectif (3mn chacun) |Dans l'​ordre : G. Lejeune, A.Baledent, A.Boublenza,​ K.Fort, D.Ghoul, N.Hiebel, V.Lully, A.Millour, J.B.Tanguy, T.Tian, L.Vercruyssen,​ L.Zhu|[[http://​www.lejeunegael.fr/​ressources_seminaire-LC/​20190912_SemLC.pdf|Slides]] ​         | |12/​09|Rencontres Minute Science ​                                                                                 |Collectif (3mn chacun) |Dans l'​ordre : G. Lejeune, A.Baledent, A.Boublenza,​ K.Fort, D.Ghoul, N.Hiebel, V.Lully, A.Millour, J.B.Tanguy, T.Tian, L.Vercruyssen,​ L.Zhu|[[http://​www.lejeunegael.fr/​ressources_seminaire-LC/​20190912_SemLC.pdf|Slides]] ​         |
  
-===== Séminaires 2018-2019 =====+===== Séminaires 2018-2019 ​(10) =====
  
 |20/​06|Alice Millour|Unsupervised data augmentation for less-resourced languages with no standardized spelling|Less-resourced languages, Data Augmentation,​ Language Models|[[http://​www.lejeunegael.fr/​ressources_seminaire-LC/​MILLOUR_Alice_20190620.pdf|Slides]]| |20/​06|Alice Millour|Unsupervised data augmentation for less-resourced languages with no standardized spelling|Less-resourced languages, Data Augmentation,​ Language Models|[[http://​www.lejeunegael.fr/​ressources_seminaire-LC/​MILLOUR_Alice_20190620.pdf|Slides]]|
Line 41: Line 91:
  
  
-===== Séminaires 2017-2018 =====+===== Séminaires 2017-2018 ​(5)=====
  
 |02/​07|Eleni Kogkitsidou|Traduction Automatique de SMS                              |Normalisation de SMS, Traduction Automatique ​         || |02/​07|Eleni Kogkitsidou|Traduction Automatique de SMS                              |Normalisation de SMS, Traduction Automatique ​         ||
Line 47: Line 97:
 |17/​04|Alice Millour ​   |Crowdsourcing POS tags for Kréyòl Gwadloupéyen ​            ​|Création de Ressources, Myriadisation ​                || |17/​04|Alice Millour ​   |Crowdsourcing POS tags for Kréyòl Gwadloupéyen ​            ​|Création de Ressources, Myriadisation ​                ||
 |05/​04|Karën Fort       ​|Représentation des Femmes dans la recherche en TAL         ​|Ethique ​                                              || |05/​04|Karën Fort       ​|Représentation des Femmes dans la recherche en TAL         ​|Ethique ​                                              ||
-|08/​03|Gaël Lejeune ​    ​|Evaluation Intrinsèque et Extrinsèque de Web Scrapping ​    |Web Content Extraction, Collecte de Corpus, Evaluation||+|08/​03|Gaël Lejeune ​    ​|Evaluation Intrinsèque et Extrinsèque de Web Scraping ​    |Web Content Extraction, Collecte de Corpus, Evaluation||
seminaire_lc.txt · Last modified: 2024/04/09 17:21 by gael