User Tools

Site Tools


seminaire_lc

Séminaires "Variation Linguistique et Linguistique Computationnelle" 2024-2025

Créneaux premier semestre (salle D117) le jeudi à 9h. Second semestre : 20/02, 20/03, 24/04, 22/05, 19/06 et 10/07

Ce séminaire a vu le jour à l'initiative d'Alice Millour et Gaël Lejeune en 2018 (69 séminaires organisés depuis lors) sous le nom de séminaire de l'équipe de Linguistique Computationnelle. Depuis janvier 2023, avec le concours de Gilles Couffignal il est renommé “Variation Linguistique et Linguistique Computationnelle” afin d'accueillir les recherches de l'axe transversal du même nom nouvellement créé au sein du laboratoire STIH.

Séminaires 2024-2025 (2/11)

DateTitreIntervenantMots-clésLien Diapos
12/09Rencontres Minute CollectifSéminaire de rentrée
17/10Pour en finir avec les pré-traitementsGaël LejeuneNettoyage de données, FIltrage, Données bruitées Slides
21/11Lost in Variation : fouille de motifs lexico-syntaxiques dans des textes en Moyen ArabeRimane Karam et Julien BezançonArabic NLP, Figements, Style Formulaire
12/12 TBA Juan Manuel Torres Moreno (Univ. Avignon)
16/01Les adverbes comme marqueurs d'objectification de femmes dans l'audiodescription de cinéfilms anglaisEva Lacroixaudio description, objectivation, adverbes, films, Anglais

Séminaires 2023-2024 (8)

DateIntervenantTitreMots-clésLien Diapos
07/09Speed Dating CollectifSéminaire de rentrée
26/10Gaël LejeuneRapprocher des éléments textuels similaires : apports à la gestion des sauts qualitatifs en général et à la variation morphologique en particulierSimilarité, Classification, OCR, Corpus MultilinguesSlides
23/11Luis-Gil Moreno JiménezUtilisation de la rime et de l'analyse sémantique pour la génération de phrasesAnalyse Sémantique, Créativité Computationnelle, Rimes Slides
21/12Iglika Nikolova-StoupakAbrégement des textes littéraires dans plusieurs langues : transformations grammaticales Simplification, Abrègement, Accès aux données textuellesSlides
18/01(I) G. Dias et (II) F. Maurel (Greyc)Détection de la Dépression dans des textes (I) & Rôle de la sémantique morpho-dispositionnelle pour la compréhension active et non visuelle des documents numériques (II)Classification, Dépression, Structure de Documents, Oralisation Slides G.Dias
15/02Marceau HernandezMORDOR :Myriadisation et Orchestration de Ramifications Divergentes pour l' Optimisation de Ressources textuellesScraping, OCR, ASR, fusionSlides
14/03Luis Gil Moreno et G.LejeuneApproche stochastique pour la génération automatique de titres descriptifsGénération, Modèles de Langue
20/06Caroline ParfaitAnnoter un corpus bruité quelles difficultés et perspectives

Séminaires 2022-2023 (9)

DateTitreIntervenantMots-clésLien Diapos
15/06Regrouper des Entités Nommées de Lieux issues d'océrisation : Epimethee de l'OCR à la carte (Mapping spatial named entities from noisy OCR output: Epimethee from OCR to map)Caroline Koudoro-Parfait et Gaël Lejeune variation, OCR, Reconnaissance d'entités nommées, cartographie Slides
11/05Reconnaissance de défigements dans des tweets en français par des mesures de similarité sur des alignements textuelsJulien Bezançonvariation, mesures similarité, corpus de tweets Slides
13/04Correction automatique des interférences OCR dans la reconnaissance d’entités nommées spatiales : réel gain ou perte de l’information ?Caroline Parfait et Ljdumila PetkovicNER, OCR, évaluation Slides
30/03Synthèse vocale pour la langue Arabe : voix naturelle et manque de ressourcesOumaima ZineTraitement de la Parole
16/02Sauts qualitatifs dans les corpus : conséquences épistémologiques et techniquesGilles Couffignal et Gaël LejeuneOCR, LInguistique de Corpus, Variation
15/12Détection des comportements anormaux dans les réseaux sociauxNour El Houda Ben ChaabeneDétection d’anomalie, Analyse des réseaux sociaux, Données multimodales, Réseau multidimensionnel, Détection de communautésSlides
17/11La double nature de la dématerialisationCorina ChutauxHumanités Numériques
29/09Retour sur le DEFT2022: Notation automatique de copies d'étudiant·e·s par combinaisons de méthodes de similaritéI. Ben Ltaifa, T.Boubehziz, A. Briglia, C. Chutaux, Y. Dupont, C. González-Gallardo, C. Koudoro-Parfait, G. Lejeune
08/09*Rencontres minutes Science* (3mn pour vous présenter)CollectifTAL, Humanités Numériques Slides

Séminaires 2021-2022 (11)

07/07Art et littérature transhumanistesCorina ChutauxHumanités Numériques
16/06A New Representation Approaches based on Deep Learning to Improve the Semantic Information RetrievalIbtihel Ben LtaifaSemantic Information RetrievalSlides
19/05Quasi real-time simulation of a capsule in flow using data-driven Reduced-Order ModelToufik BoubehzizData Analysis
21/04Problématiques d'élaboration d'un corpus de chansons situées temporellementGaël LejeuneConstitution de Corpus, dédoublonnage, Web Scraping, APISlides
31/03Doxa et contre-doxa dans la construction du territoire discursif du Front National (2000-2017)Camille Bouzereau ( Université Côte d'Azur)Analyse du discours politique,humanités numériques, lexicométrie, linguistique, discours politiqueSlides
10/03Évaluation des résultats de NER sur des transcriptions OCR bruitées par élaboration de supports cartographiquesCaroline ParfaitReconnaissance d'Entités Nommées, Cartographie, OCRSlides
20/01Antonomaz : Exploitation d'Imprimés du XVIIème siècle NumérisésKarine AbivenHumanités Numériques, OCR Slides
16/12Ce que l'annotation avec TreeTagger permet d'apprendre sur les adverbes et adverbiaux dans les scripts d'audiodescriptionEva LacroixLinguistique de Corpus, Analyse Syntaxique, Audiodescription Slides
9/12 (report du 21/10)Les biais dans les annotations manuellesA. Baledent (Univ. Caen)Annotation, Evaluation, Biais
18/11L'enjeu de la représentation de grandes quantités de données langagières. Un cas d'étude sur des suivis longitudinauxAndrea BrigliaDonnées longitudinales, Apprentissage de la Langue
09/09Speed Dating (Vos travaux de recherche en 3mn)Collectif Humanités Numériques, TAL, TAP, Linguistique, Ethique, CorpusSlides

Séminaires 2020-2021 (13)

17/06Participation de STIH à Deft 2021 (indexation/similarité)Dupont el al.Fouille de Textes, Indexation, Classification, Régression
20/05Clustering de textes pour l'extraction de néologismes : justification du coût de construction d'un petit corpusManuela YapomoNéologismes, Linguistique de Corpus
15/04Investigating dominant word-order on universal dependencies with graph rewritingHeeSoo ChoiUniversaux de Greenberg, Ordre Syntaxique
01/04Détection d'objets en temps réelFouad AouintiDétection d'Objets, Humanités Numériques
18/03Reconnaissance d'entités nommées dans des textes de littérature française du 19ème : le poids du bruit ?Caroline ParfaitDonnées Bruitées, Littérature, Entités NomméesSlides
18/02La théorie de l'information Jean-Baptiste TanguyThéorie de l'Information, OCR
21/01La reconnaissance automatique de la parole dans le contexte médicalImed LaaridhDébit de parole, parole pathologique Slides
17/12Articles “doudou”Karën Fort et al.Style et ScienceSlides
03/12Partitionnement des actualités avec MAJORCLUST et distances temporairesCarlos GonzálezClustering, MultimediaSlides
12/11New Results in Multilingual Epidemic Surveillance Gaël LejeuneClassification, Extraction d'InformationSlides
15/10“Construction de ressources langagières par myriadisation pour le traitement automatique des langues peu dotées” (Pré-soutenance de thèse)A. Millour
08/10Le CNU (27) et la qualification MCF K. Fort Qualification, CNU, Section 27, carrièreSlides
10/09Speed Dating (Vos travaux de recherche en 3mn)Collectif du TAL au TAP en passant par les ontologies et les Humanités NumériquesSlides

Séminaires 2019-2020 (11)

02/07Faire face à la variabilité en TAL: pistes épistémologiques et pratiquesGaël LejeuneEpistémologie, Paradigmes, Tokénisation, Analyse en CaractèresSlides
18/06Exploiter des modèles de langue pour évaluer des sorties de logiciels d’OCR pour des documents français du XVIIe siècleJean-Baptiste TanguyOCR, modèle de langue, évaluation, document historique, français pré-classique.Slides
28/05Il a cru j'étais un second choix » : analyse syntaxique et sociolinguistique des constructions [CV. Ø CV.] en français parlé contemporainAuphélie Ferreira (Lattice)Langue parlée, Syntaxe Slides
06/04Sentiment Analysis for the Latinised Arabic (Arabizi)Taha Tobaili (The Open University UK)Sentiment Analysis, Tweets, Under Resourced LanguagesSlides
26/03Analyse et classifications des dialectes arabes en se basant sur des techniques de Deep Learning Dhaou Ghoul Classification, Dialectes, Langue Arabe Slides
27/02CamemBERT: Yet Another Cheese Strategy for Attaigning State-of-the-Art Yoann Dupont Modèles de Langue, Evaluation, BERT, Deep Learning
23/01Etudes des Mèmes textuels : hypothèses de travail Lichao Zhu théorie des mèmes, myriadisation, apprentissage automatique, projet MEMES Slides
19/12Redescription en analyse de données : exemples variés François Rioult (GREYC)Fouille de Données, Descripteurs Slides
14/11Adaptation au domaine et combinaison de modèles pour l'annotation de textes multi-sources et multi-domainesTian Tian POS tagging, Entités Nommées, Deep Learning, Mots non Standards Slides
17/10Ceci n'est pas un titre Gaël Lejeune Classification, Détection de Titres, Extraction de Table des Matières, Structure de Documents, FinTOC 2019 Slides
12/09Rencontres Minute Science Collectif (3mn chacun) Dans l'ordre : G. Lejeune, A.Baledent, A.Boublenza, K.Fort, D.Ghoul, N.Hiebel, V.Lully, A.Millour, J.B.Tanguy, T.Tian, L.Vercruyssen, L.ZhuSlides

Séminaires 2018-2019 (10)

20/06Alice MillourUnsupervised data augmentation for less-resourced languages with no standardized spellingLess-resourced languages, Data Augmentation, Language ModelsSlides
16/05Anaëlle BaledentPrésentation du projet de sujet de thèseObservables en linguistique et TAL, corpus bruitésSlides
18/04Dhaou GhoulClassification et grammaires des invariants lexicaux arabes en prévision d'un traitement informatique de cette langueCorpus, classification, désambiguïsation, langue arabe, invariants lexicaux, grammaire régulière, schémas de grammairesSlides
21/03Gaël LejeuneAntonomaz: Analyse Automatique des Mazarinades, tirer parti d’un corpus incomplet, hétérogène et bruitéCorpus Integrity, Analyse au grain caractère, Classification, Datation, Corpus Anciens, Erreurs d'OCRSlides
28/02Hélène GerardinConstituer un corpus oral en langue peu dotée : de la linguistique de terrain au traitement automatisé.Constitution de Corpus, Langues peu dotées
21/01Caroline LangletAnalyse de sentiments dans les conversations humain-agent. Vers un modèle des goûts de l'utilisateurAnalyse de Sentiments, Agents Conversationnels, ClassificationSlides
17/12Olga SeminckModèles cognitifs et computationnels de la résolution des pronomsAnaphores, Coréférence, Entropie, Théorie de l'information, Modélisation cognitive, PronomsSlides
19/11Karën FortQuestions de catégorisationCatégorisation, Annotation, Accords inter-annotateursSlides
22/10Vincent LullyExplorer la synergie entre le Web sémantique et la vision par ordinateur pour la personnalisation dans le e-tourismeWeb Sémantique, Systèmes de Recommandation, Vision par Ordinateur, Profils UtilisateursSlides
24/09Gaël LejeuneSimplexité et Complexité en TALEpistémologie, Classification, MultilinguismeSlides

Séminaires 2017-2018 (5)

02/07Eleni KogkitsidouTraduction Automatique de SMS Normalisation de SMS, Traduction Automatique
05/06Pauline Delhaye Zoosemiotics of Emotions : a New Model and its ApplicationsZoosémiotique
17/04Alice Millour Crowdsourcing POS tags for Kréyòl Gwadloupéyen Création de Ressources, Myriadisation
05/04Karën Fort Représentation des Femmes dans la recherche en TAL Ethique
08/03Gaël Lejeune Evaluation Intrinsèque et Extrinsèque de Web Scraping Web Content Extraction, Collecte de Corpus, Evaluation
seminaire_lc.txt · Last modified: 2024/11/21 13:04 by gael