This is an old revision of the document!
Séminaire régulier le jeudi de 9h à 10h en salle 117 Maison de la recherche 28, rue Serpente
Calendrier :
10/09 | 8/10 | 15/10 | 5/11 | 3/12 |
Collectif (speed-dating) | Karën Fort | Alice Millour | TBA | TBA |
Détails :
15/10 | Pré-soutenance de thèse | A. Millour | … | ||
08/10 | Conseils pour la qualification (à confirmer) | K. Fort | … | ||
10/09 | Speed Dating (Vos travaux de recherche en 3mn) | Collectif | du TAL au TAP en passant par les ontologies et les Humanités Numériques | [ressources_seminaire-LC/20200910_SemLC.pdf | Slides] |
02/07 | Faire face à la variabilité en TAL: pistes épistémologiques et pratiques | Gaël Lejeune | Epistémologie, Paradigmes, Tokénisation, Analyse en Caractères | [http://www.lejeunegael.fr/ressources_seminaire-LC/Lejeune-Gael_202007.pdf | Slides] |
18/06 | Exploiter des modèles de langue pour évaluer des sorties de logiciels d’OCR pour des documents français du XVIIe siècle | Jean-Baptiste Tanguy | OCR, modèle de langue, évaluation, document historique, français pré-classique. | [http://www.lejeunegael.fr/ressources_seminaire-LC/TANGUY_JB_202006.pdf | Slides] |
28/05 | Il a cru j'étais un second choix » : analyse syntaxique et sociolinguistique des constructions [CV. Ø CV.] en français parlé contemporain | Auphélie Ferreira (Lattice) | |||
06/04 | Sentiment Analysis for the Latinised Arabic (Arabizi) | Taha Tobaili (The Open University UK) | Sentiment Analysis, Tweets, Under Resourced Languages | Slides | |
26/03 | Analyse et classifications des dialectes arabes en se basant sur des techniques de Deep Learning | Dhaou Ghoul | Classification, Dialectes, Langue Arabe | Slides | |
27/02 | CamemBERT: Yet Another Cheese Strategy for Attaigning State-of-the-Art | Yoann Dupont | Modèles de Langue, Evaluation, BERT, Deep Learning | ||
23/01 | Etudes des Mèmes textuels : hypothèses de travail | Lichao Zhu | théorie des mèmes, myriadisation, apprentissage automatique, projet MEMES | Slides | |
19/12 | Redescription en analyse de données : exemples variés | François Rioult (GREYC) | Fouille de Données, Descripteurs | Slides | |
14/11 | Adaptation au domaine et combinaison de modèles pour l'annotation de textes multi-sources et multi-domaines | Tian Tian | POS tagging, Entités Nommées, Deep Learning, Mots non Standards | Slides | |
17/10 | Ceci n'est pas un titre | Gaël Lejeune | Classification, Détection de Titres, Extraction de Table des Matières, Structure de Documents, FinTOC 2019 | Slides | |
12/09 | Rencontres Minute Science | Collectif (3mn chacun) | Dans l'ordre : G. Lejeune, A.Baledent, A.Boublenza, K.Fort, D.Ghoul, N.Hiebel, V.Lully, A.Millour, J.B.Tanguy, T.Tian, L.Vercruyssen, L.Zhu | Slides |
20/06 | Alice Millour | Unsupervised data augmentation for less-resourced languages with no standardized spelling | Less-resourced languages, Data Augmentation, Language Models | Slides |
16/05 | Anaëlle Baledent | Présentation du projet de sujet de thèse | Observables en linguistique et TAL, corpus bruités | Slides |
18/04 | Dhaou Ghoul | Classification et grammaires des invariants lexicaux arabes en prévision d'un traitement informatique de cette langue | Corpus, classification, désambiguïsation, langue arabe, invariants lexicaux, grammaire régulière, schémas de grammaires | Slides |
21/03 | Gaël Lejeune | Antonomaz: Analyse Automatique des Mazarinades, tirer parti d’un corpus incomplet, hétérogène et bruité | Corpus Integrity, Analyse au grain caractère, Classification, Datation, Corpus Anciens, Erreurs d'OCR | Slides |
28/02 | Hélène Gerardin | Constituer un corpus oral en langue peu dotée : de la linguistique de terrain au traitement automatisé. | Constitution de Corpus, Langues peu dotées | |
21/01 | Caroline Langlet | Analyse de sentiments dans les conversations humain-agent. Vers un modèle des goûts de l'utilisateur | Analyse de Sentiments, Agents Conversationnels, Classification | Slides |
17/12 | Olga Seminck | Modèles cognitifs et computationnels de la résolution des pronoms | Anaphores, Coréférence, Entropie, Théorie de l'information, Modélisation cognitive, Pronoms | Slides |
19/11 | Karën Fort | Questions de catégorisation | Catégorisation, Annotation, Accords inter-annotateurs | Slides |
22/10 | Vincent Lully | Explorer la synergie entre le Web sémantique et la vision par ordinateur pour la personnalisation dans le e-tourisme | Web Sémantique, Systèmes de Recommandation, Vision par Ordinateur, Profils Utilisateurs | Slides |
24/09 | Gaël Lejeune | Simplexité et Complexité en TAL | Epistémologie, Classification, Multilinguisme | Slides |
02/07 | Eleni Kogkitsidou | Traduction Automatique de SMS | Normalisation de SMS, Traduction Automatique | |
05/06 | Pauline Delhaye | Zoosemiotics of Emotions : a New Model and its Applications | Zoosémiotique | |
17/04 | Alice Millour | Crowdsourcing POS tags for Kréyòl Gwadloupéyen | Création de Ressources, Myriadisation | |
05/04 | Karën Fort | Représentation des Femmes dans la recherche en TAL | Ethique | |
08/03 | Gaël Lejeune | Evaluation Intrinsèque et Extrinsèque de Web Scrapping | Web Content Extraction, Collecte de Corpus, Evaluation |