Dernière mise à jour : 10/10/2022
Nous avons le plaisir d'annoncer qu'Aurélie Nomblot, doctorante au sein de notre équipe, a remporté le prix Créativité lors de la cérémonie de remise des prix du programme national Starthèse, qui s’est tenue le 14 novembre 2024.
Ce concours, porté par le ministère de l’Enseignement supérieur et de la Recherche, vise à encourager les jeunes chercheurs à explorer l’entrepreneuriat en mettant en valeur leurs compétences et leurs travaux de recherche. Il s’adresse aux doctorants et docteurs depuis moins de cinq ans, et cherche à promouvoir des solutions innovanes aux défis sociaux, économiques, culturels et environnemetntaux actuels.
Aurélie a été distinguée pour son projet de générateur de langues, une initiative prometteuse à la croisée de la linguistique et de l’innovation technologique. Ce prix récompense l’ingéniosité et la créativité dont elle a fait preuve dans le développement de ce projet.
Nous félicitons chaleureusement Aurélie pour cette belle reconnaissance de son travail et de son engagement, et nous lui souhaitons plein succès dans la suite de ses recherches et de son parcours entrepreneurial.
Nous sommes heureux de vous annoncer que le laboratoire CRIT participera à la Fête de la Science cette semaine avec un stand dédié à la découverte des sujets de recherches du laboratoire du CRIT.
📅 Date : Samedi 14 octobre 2024
🕒 Horaires : 14h - 18h
📍 Lieu : Village des sciences sur le Campus de la Bouloie
Venez rencontrer nos chercheurs, explorer nos projets de recherche et découvrir des démonstrations interactives dans une ambiance conviviale et ouverte à tous. Ce sera une excellente occasion de plonger dans l'univers fascinant de la science et d'échanger avec des experts passionnés !
🎟️ Entrée libre et gratuite.
Nous vous attendons nombreux pour une journée de découvertes scientifiques et d’échanges ! Pour plus d’informations, visitez : https://www.fetedelascience.fr/
Nous sommes ravis d’annoncer que Nicolas Gutehrlé, notre docteur en post-doc, du département TAL et du laboratoire CRIT participera à cette soirée exceptionnelle dédiée à la vulgarisation scientifique.
📅 Date : Vendredi 27 septembre 2024
🕒 Horaire : 19h - 23h
📍 Lieu : Frac Franche-Comté - Cité des arts de Besançon.
Venez découvrir les dernières avancées en Traitement Automatique des Langues et plonger dans l'univers fascinant de la recherche avec des présentations accessibles à tous. Ne manquez pas cette occasion unique de rencontrer des chercheurs et d'explorer leurs travaux dans une ambiance conviviale et interactive !
🎟️ Entrée gratuite.
Au plaisir de vous y voir nombreux pour une soirée de découverte et d’échange ! Pour plus d'information : https://nuitdeschercheurs-france.eu/
La réunion de rentrée du master TAL pour l'année 2024-2025 aura lieu le vendredi 06 septembre 2024 à partir de 14h en salle D02.
Du 25/06/2024 au 30/06/2024 : Dépôt des candidatures sur Mon Master
Retrouvez le calendrier des candidatures ici : Lien calendrier Mon Master.
Pour plus d'informations, consultez https://www.monmaster.gouv.fr/master/universite-de-besancon et contactez iana.atanassova@univ-fcomte.fr.
Nous avons le plaisir d'annoncer la soutenance de thèse de notre doctorant Nicolas Gutehrlé qui se tiendra le vendredi 21 juin à 14h au Grand Salon (UFR SLHS). La thèse porte sur l'Extraction d’informations appliquée aux documents non- structurés pour la valorisation de périodiques historiques - application au patrimoine de la région Bourgogne Franche-Comté en France et est dirigée par Iana Atanassova. Le jury sera composé de :
Le projet EMONTAL, porté par le CRIT et visant à faciliter l’exploration et l’exploitation des documents d’archives, est présenté dans le dernier numéro 312 de la revue En Direct !
L’article est consultable au lien suivant : https://tinyurl.com/2d8uypym
La deuxième session des soutenances des mémoires des étudiants en Master TAL a lieu le mardi 02 juillet à Préclin
Les soutenances des mémoires des étudiants en Master TAL auront lieu comme suit :
Les candidatures au Master TAL clôturent le 24 mars
Vendredi 12 avril 2024, MSHE
Quatrième édition de la journée d’étude TEDonnées
Échanger et innover : les SHS à l’horizon du numérique
Ces dernières années, l’accès aux collections de documents d’archives a été simplifié grâce aux campagnes de numérisations massives, menées par les bibliothèques et les archives, et a permis l’émergence de grands corpus en Sciences Humaines et Sociales (SHS). Le numérique a également poussé au développement de nouvelles méthodes de travail, comme la lecture distante, et l’émergence de domaines interdisciplinaires, tels que les Humanités Numériques ou la Géomatique. Récemment, l’intelligence artificielle et les modèles de langue avancés tels que ChatGPT ont apporté d’importantes innovations méthodologiques, comme l’aide à la rédaction ou la génération de contenus. Cependant, ces outils présentent des inconvénients, par exemple l’usage inapproprié, sans réelle compréhension, des contenus automatiquement créés, ou le risque de désinformation par la création de faux contenus informationnels (appelés « hallucinations »).
Ainsi, quel est l’impact de la prédominance numérique sur la recherche en Sciences Humaines et Sociales, notamment en littérature, histoire et linguistique ? En effet, le numérique impose des choix et des limitations méthodologiques forts qui peuvent bouleverser les approches traditionnelles. De plus, ces technologies évoluent très vite. Il est donc difficile de prendre du recul et de réfléchir à leur impact, tout comme il est difficile de s’y former et de les intégrer aux méthodes de recherche en SHS. Comment les SHS se positionnent-elles par rapport au numérique ? Comment et où peuvent-elles s’y former, et surtout, dans quelle mesure peuvent-elles l’intégrer à leurs méthodologies ?
La journée est gratuite et ouverte à tout public.
Inscription :
L'inscription à la journée d’études TEDonnées se fait au lien suivant : lien formulaire d'inscription
Lien vers la visio conférence : https://tinyurl.com/2hkm7psc
Pour plus d'informations : site web TEDonnées 2024
Vendredi 05 avril 2024, de 9h à 12h, salle Préclin
Hugues de Mazancourt
CTO, Co-fondateur de Datapolitics, Paris
Expert NLP et IA
1) Datapolitics: une startup spécialisée dans l’analyse de la parole publique
Résumé : Présentation de la technologie et des enjeux de l’analyse automatique des débats publics, collectés tant au niveau national qu’au niveau local: chaîne d’acquisition, conversion de textes ou de flux video, extraction d’information, identification des parties prenantes et des prises de position, synthèse, … Nous aborderons également les aspects métiers et éthiques des traitements mis en jeu.
2) Ethique et NLP
Résumé : L’IA, et plus particulièrement le traitement automatique des langues, soulèvent de plus en plus fréquemment des questions éthiques (et des peurs associées), sans que les concepts soient toujours clairement définis. Nous présenterons un panorama de ces questions sans nous restreindre aux sujets des « fake news » ou des biais des modèles de langue, qui éclipsent bien souvent des questions plus importantes, en particulier lorsqu’il s’agit de mettre en œuvre ces technologies à l’échelle industrielle.
Vendredi 29 mars 2024, de 9h à 12h, Salle Préclin
Frédéric Landragin
Directeur de recherche au CNRS, spécialisé en linguistique et en TAL, Lattice, ENS Paris, Université Sorbonne Nouvelle
Comment parle un robot ? Quand la Science-Fiction anticipe ChatGPT
Résumé:
- Les machines parlantes sont partout, dans la science-fiction – de Planète interdite jusqu’à Ex_Machina en passant par Star Wars et Terminator – et dans la vie de tous les jours, avec les androïdes Pepper ou Nao, les assistants vocaux Siri ou Cortana, et le fameux ChatGPT qui fait l’actualité, jusqu’à donner une visibilité inespérée au domaine de recherche qu’est le traitement automatique des langues. Comment se faire comprendre de ces machines ? Et comment, elles, nous comprennent-elles ? Quels sont les algorithmes informatiques en jeu ? Que penser des IA et des robots de la SF capables, à l’image de C-3PO, de maîtriser six millions de formes de communication ? La machine qui comprend tout et parle avec pertinence est-elle à portée de main ?
Vendredi 22 mars 2024, de 10h à 13h, D12
Dominique Mariko
Lead Data Scientist, Yseop, Paris
TAL et conformité logicielle
Résumé:
- Présentation de l'entreprise Yseop et de la stack hybride ;
- Discussion sur les problématiques de mise en production des systèmes d'IA pour l'industrie régulée et plus généralement, état des projets de lois et régulations à date ;
- En relation, présentation détaillée des problématiques liées à l'évaluation des modèles de langue en production et points techniques associés.
Mardi 12 mars 2024, de 9h à 12h, salle Préclin
Aurélie Nomblot
Doctorante en TAL, CRIT, Université de Franche-Comté
Vers la création d'un générateur de langues inventées : méthodologie et création de règles
Résumé:
Les langues inventées occupent une place de plus en plus significative dans les univers des séries télévisées, des films et des jeux vidéo, renforçant considérablement l'immersion des spectateurs et des joueurs. Ce séminaire explore les défis et les complexités que rencontrent les idéolinguistes dans la création de ces langues inventées. Nous explorerons les résultats d'une enquête détaillée qui vise à comprendre les méthodes, les besoins et les aspirations des idéolinguistes dans leurs processus d’invention de langues inventées. Par ailleurs, nous aborderons une méthode développée dans le cadre de cette thèse pour l'élaboration de règles linguistiques destinées à un outil de création automatique de langues.
Yagmur Ozturk
Doctorante en TAL, CRIT, Université de Franche-Comté
Morphosémantique du turc : création de ressources formalisées
Résumé:
En termes de ressources morphologiques, le turc se révèle être une langue sous-dotée dans le domaine de la morphologie dérivationnelle en Traitement Automatique des Langues (TAL) : il n'existe pas de ressources décrivant de manière formelle, en particulier en ce qui concerne les aspects sémantiques. Ce projet de recherche vise à décrire et à utiliser les ressources et études existantes pour développer un outil de TAL pour la dérivation nominale en turc. La première partie de notre étude présente les analyseurs morphologiques actuels, mettant en évidence une lacune dans la morphologie dérivationnelle des noms. Nous discutons ensuite de la manière dont les morphèmes dérivationnels, en particulier les morphèmes nominaux, sont décrits dans les études linguistiques et des problèmes que cela pose pour une étude systématique. Enfin, nous présentons les ressources formalisées que nous avons créées pour une étude systématique des morphèmes de nom à nom : Semantürk, une ontologie des catégories sémantiques adaptée du typage sémantique des noms (Huguin et. al, 2023) mise en place pour l'annotation de la ressource morphologique sur la langue française Démonette (Namer et. al, 2023) ; et DerivBaseTR, une base de données de morphèmes avec des caractéristiques spécifiques, comme les ressources formalisées que nous avons créées pour une étude systématique des morphèmes de nom à nom.
Références :
Namer, F., N. Hathout, D. Amiot, L. Barque, O. Bonami, G. Boyé, B. Calderone, J. Cattini, S. Dal Maso, A. Delaporte, G. Duboisdindien, A. Falaise, N. Grabar, P. Haas, F. Henry, M. Huguin, J. Nyoman, L. Liégeois, S. Lignon, L. Macchi, G. Manucharian, C. Masson, F. Montermini, N. Okinina, F. Sajous, D. Sanacore, M. Thi Tran, J. Thuilier, Y. Toussaint and D. Tribout. (2023). « Démonette-2, a derivational database for French with broad lexical coverage and fine-grained morphological descriptions. » Lexique 33: 6-40, DOI:10.54563/lexique.1242, hal-04363595.
Huguin, M., L. Barque, P. Haas and D. Tribout. (2023). « Typage sémantique des noms dans la ressource morphologique Démonette. » Lexique: 33: 41-56, DOI:10.54563/lexique.1086, hal-04369075.
Vendredi 15 mars 2024, de 9h à 12h, salle Préclin
Laure Cataldo
Maîtresse de Conférence, CRIT, Université de Franche-Comté
Analyse de corpus en linguistique anglaise – approches méthodologiques et perspectives
Résumé:
Cette présentation abordera l’ensemble des corpus préalablement traités ou en cours de traitement dans le cadre de mes recherches en linguistique anglaise, qui s’inscrivent principalement dans l’analyse de discours, et questionnera la possibilité d’une exploitation de ces corpus dans un travail collaboratif avec des collègues spécialistes en traitement automatique des langues.
Nicolas Gutehrlé
Doctorant en TAL, CRIT, Université de Franche-Comté
Extraction et Modélisation ONTologique des Acteurs et Lieux pour la valorisation du patrimoine de la Bourgogne Franche-Comté
Résumé:
Ces dernières années, les bibliothèques et archives ont mené de nombreuses campagnes de numérisation de leurs collections. Si ces campagnes ont facilité l'ouverture et l'accessibilité des documents d'archives à un public plus large, leur découvrabilité et la valorisation de leurs contenus restent des tâches difficiles en raison du manque de structure des contenus textuels. Afin de permettre l'exploration, l'exploitation et la valorisation des « données massives du passé » (Kaplan et Di Lenardo, 2017), il est nécessaire de structurer le contenu textuel des documents historiques par l’ajout d’annotations sémantiques.
Dans cette présentation, nous aborderons la tâche de l’extraction jointe d’entités et de relations (Joint Extraction of Relations and Entities), qui vise à extraire de façon jointe les entités nommées et leurs relations dans un contenu textuel. Nous présenterons l’approche ELIJERE (Extensible, Lightweight and Interpretable Joint Extraction of Relations and Entities), une nouvelle approche pour la tâche de l’extraction jointe d’entités et de relations. Cette approche repose l’emploi de ressources linguistiques permettant d’extraire et de catégoriser depuis une phrase les entités impliquées dans une relation.
Nous présenterons tout d’abord cette méthode, avant de présenter son évaluation sur un corpus de données contemporaine, puis sur un corpus de documents historiques publiés en Bourgogne et en Franche-Comté au 19ème et 20ème, collectés dans le cadre du projet EMONTAL. Cette présentation sera suivie par une discussion sur les futurs pistes de travail pour la tâche de l’extraction jointe d’entités et de relations.
Vendredi 08 mars 2024, de 9h à 12h en Amphi Petit
Panggih Kusuma Ningrum
Doctorante en TAL, CRIT, Université de Franche-Comté
Introducing UnScientify: A web application for detecting scientific uncertainty in scientific texts
Résumé:
The ANR InSciM project, in collaboration with GESIS, has culminated in the development of UnScientify, a web application designed to enhance the detection of scientific uncertainty in scholarly texts. This interactive system leverages a weakly supervised technique that incorporates a fine-grained annotation scheme to detect verbally formulated uncertainties in scientific documents. The core methodology of UnScientify is founded on a complex pipeline that integrates span patterns matching, complex sentence analysis and author reference checking. This approach streamlines the labelling and annotation processes essential for identifying scientific uncertainties, covering a variety of uncertainty expression types to support diverse applications including information retrieval, text mining and scientific document processing. UnScientify features interpretable results, allowing a deeper understanding of the nuances of scientific uncertainty identified in texts. The presentation will also include a live demonstration of UnScientify, demonstrating its capabilities and its potential to revolutionise the way scientific texts are analysed and understood.
Du 26/02/2024 au 24/03/2024 : Dépôt des candidatures sur Mon Master
Retrouvez le calendrier des candidatures ici : Lien calendrier Mon Master.
Pour plus d'informations, consultez http://tesniere.univ-fcomte.fr/master.html et contactez iana.atanassova@univ-fcomte.fr.
Vendredi 26 janvier 2024, de 10h à 13h au Grand Salon
Juyeon Kang
Head of Data Science, Fortia Financial Solutions, Paris
Extraction d’informations à partir des données non structurées
Résumé: Dans cette présentation seront abordés les différentes approches de l’extraction d’informations à base des techniques de l’IA. Nous prenons comme use case les problématiques rencontrées lors de l’extraction des informations dans les documents financiers. Nous pourrons également aborder le sujet de la construction des datasets ainsi que la méthode/outil d’annotation exploitée dans un contexte industriel.
Vendredi 15 décembre 2023, Session 3, Amphithéâtre MSHE
Dr. Iana Atanassova interviendra au Networking & Training Workshop sur la mise en place du projet portant sur l'incertitude ‘A Journey into Scientific Uncertainty: Building a Project of Excellence in the Human and Social Sciences’. Pour plus d'information : https://actu.univ-fcomte.fr/agenda/projet-greci-colloque-du-14-15-decembre-2023
Les doctorants en Traitement Automatique des Langues ont participé à une vidéo sur la valorisation du doctorat : cliquer ici.
Nous avons le plaisir d'annoncer la soutenance de thèse de notre doctorant Salah Yahiaoui qui se tiendra le 08 décembre à 8h30 au Grand Salon (UFR SLHS). La thèse porte sur l'Extraction et catégorisation de l’information temporelle de textes scientifiques et est dirigée par Iana Atanassova. Le jury sera composé de :
Mme Avrile LAUBERT, chargée de sensibilisation et d'accompagnement entrepreneurial, présentera le dispositif PEPITE BFC en faveur de l'entreprenariat le jeudi 05 octobre 2023 de 9h à 10h en salle H23.
La réunion de rentrée du master TAL pour l'année 2023-2024 aura lieu le jeudi 07 septembre 2023 de 14h à 16h en salle C23.
Toutes nos félicitations au docteur François-Claude Rey pour l'obtention d'un contrat post-doctoral d'un an comme docteur-entrepreneur ! Il rejoindra l'équipe du département TAL du C.R.I.T. à partir du 1er septembre 2023
Toutes nos félicitations à Yağmur Öztürk pour l'obtention d'un poste d'ATER en TAL au laboratoire C.R.I.T. !
Les soutenances des mémoires des étudiants en Master TAL auront lieu comme suit :
Nous sommes au regret d'annoncer que le séminaire Traitement automatique d’une langue peu dotée : l’exemple du quechua, par Johanna Cordova (ERTIM, INALCO) de ce jeudi 06 avril 2023 est annulé.
Nous ferons en sorte qu'il prenne place lors des séminaires en TAL du CRIT de l'année prochaine.
Nous nous excusons pour toutes gênes occasionnées.
Jeudi 06 avril 2023, de 14h à 16h30, E13
Johanna Cordova,
ERTIM, INALCO
Traitement automatique d’une langue peu dotée : l’exemple du quechua
Résumé: Les langues quechua sont parlées dans 7 pays d’Amérique du Sud et regroupent plus de 6 millions de locuteurs. Malgré sa grande expansion, le quechua est une langue peu dotée, et qui reste peu étudiée du point de vue du TAL. Nous présenterons quelques éléments de morphologie du quechua, langue de typologie agglutinante, et étudierons quelques solutions mises en place pour doter la langue des outils élémentaires pour le TA.
Nous sommes au regret d'annoncer que le séminaire En quoi est-ce complexe d'inventer une langue ? Du charabia vers une structure linguistiquement plausible, par Aurélie Nomblot (doctorante en Traitement Automatique des Langues, CRIT, université de Franche-Comté) et La sémantique des suffixes nominaux : création d’une ontologie pour le turc par Yağmur Öztürk (doctorante en Traitement Automatique des Langues, CRIT, université de Franche-Comté) de ce vendredi 31 mars est annulé.
Nous ferons en sorte qu'il prenne place lors des séminaires en TAL du CRIT de l'année prochaine.
Nous nous excusons pour toutes gênes occasionnées.
Vendredi 31 mars 2023, de 9h30 à 12h, Grand Salon
Aurélie Nomblot
doctorante en Traitement Automatique des Langues, CRIT, université de Franche-Comté
En quoi est-ce complexe d'inventer une langue ? Du charabia vers une structure linguistiquement plausible.
Résumé: Ce séminaire répond à cette question en examinant les choix de création pour les différents aspects d’une langue tels que la phonologie, la grammaire, le lexique et l'évolution de la langue. Il explore également la façon dont une langue créée peut refléter les traits d'un groupe fictif, et présente enfin une méthodologie pour créer un générateur de langues inventées.
Yağmur Öztürk
doctorante en Traitement Automatique des Langues, CRIT, université de Franche-Comté
La sémantique des suffixes nominaux : création d’une ontologie pour le turc.
Résumé: Ce séminaire portera sur la mise en place de ressources pour la réalisation d’une analyse morphosémantique des noms dérivés à partir d’une base nominale. Nous présenterons tout d’abord, la création d’un inventaire de morphèmes nominaux et la formalisation de leur description. Puis, nous nous concentrerons plus spécifiquement sur la représentation du(des) sens porté(s) par ces morphèmes. Pour cela, nous avons réalisé une expérimentation sur un ensemble de catégories sémantiques appliquées aux morphèmes dérivationnels, proposées par Bagasheva (2018) et décrites comme universelles, produit pour la description d’affixes dérivationnels. Suite à cette expérimentation, nous avons conclu que cet ensemble n’est pas suffisant pour la description des morphèmes dérivationnels du turc. Étant donné qu’il n’existe pas de ressources de catégories sémantiques pour la description des morphèmes dérivationnels, nous avons déduit la nécessité de construire une ontologie de catégories sémantiques, basée sur des critères spécifiques (dont l’interopérabilité des données) que nous présenterons durant ce séminaire.
Bagasheva, A.,« Comparative semantic concepts in affixation ». In: Salvador Valera & Juan Santana (eds.), Competing Patterns in English Affixation, 33-65. Peter Lang, 2018.
Nous sommes au regret d'annoncer que le séminaire Extraction d’informations à partir des données non structurées, par Juyeon Kang (Head of Data Science, Fortia Financial Solutions) de ce vendredi 24 mars est définitivement annulé.
Nous ferons en sorte qu'il prenne place lors des séminaires en TAL du CRIT de l'année prochaine.
Nous nous excusons pour toutes gênes occasionnées.
Notre doctorant Nicolas Gutehrlé présentera ses travaux de recherche produits dans le cadre du projet EMONTAL lors du festival de vulgarisation scientifique OVNI à Morteau le 01 avril de 14h à 18h. Venez nombreux !
Vendredi 24 mars 2023, de 9h30 à 12h, Salon Préclin
Juyeon Kang
Head of Data Science, Fortia Financial Solutions, Paris
Extraction d’informations à partir des données non structurées
Résumé: Dans cette présentation seront abordés les différentes approches de l’extraction d’informations à base des techniques de l’IA. Nous prenons comme use case les problématiques rencontrées lors de l’extraction des informations dans les documents financiers. Nous pourrons également aborder le sujet de la construction des datasets ainsi que la méthode/outil d’annotation exploitée dans un contexte industriel.
Vendredi 17 mars 2023, de 9h30 à 12h, Salon Préclin
Iana Atanassova
maître de conférence HDR, IUF, CRIT, université de Franche-Comté
La recherche en pratique : étude sur le multilinguisme des publications scientifiques
Résumé: Nous proposons une étude sur les langues utilisées dans la base plurilingue d'articles scientifiques ISTEX qui contient plus de 50 langues. Nous étudions les relations de citation qui existent entre ces langues. Les résultats montrent une grande préférence pour les citations en anglais, qui prédomine parmi les sources citées même dans les articles écrits en d'autres langues. Dans une perspective plus pédagogique, ce séminaire aura pour objectif de montrer toutes les étapes de la construction d'une étude scientifique, les problèmes rencontrés et leurs solutions en s'appuyant sur les contenus enseignés en master TAL.
Du 22/03/2023 au 18/04/2023 : Dépôt des candidatures sur Mon Master
Du 23/06/2023 au 21/07/2023 : Publication des résultats, confirmation et inscription.
Retrouvez le calendrier des candidatures ici : http://tesniere.univ-fcomte.fr/ressources/Calendrier_MM.pdf.
Pour plus d'informations, consultez http://tesniere.univ-fcomte.fr/master.html et contactez iana.atanassova@univ-fcomte.fr.
Vendredi 03 mars 2023, de 9h45 à 12h45, Salon Préclin
Luca Nobile
maître de conférence, CPTC, université de Bourgogne
L'iconicité phonologique dans tous ses états : expériences, descriptions, méthodes, théories, enjeux
Résumé: Le séminaire tentera de fournir un aperçu d’ensemble du domaine scientifique de l'iconicité phonologique. On essayera de réunir les principales évidences expérimentales et descriptives, d’exemplifier le débat contemporain entre neurosciences et sciences du langage, et d’esquisser un cadre théorique et méthodologique suffisamment complexe pour répondre aux défis posés par les faits observables… et par les observateurs les plus sceptiques. On proposera enfin une mise en perspective historico-épistémologique pour inviter à repenser le rapport entre arbitraire et motivation dans le cadre des grandes tendances qui animent l'histoire de la pensée occidentale, notamment en matière de rapport entre oralité et écriture, langage et réalité, et nature et culture.
Félicitations à notre doctorante Panggih Kusuma Ningrum pour l'obtention d'une bourse Chrysalide Mobilité Internationale des Doctorants (MID) ! Cette bourse permettra d'établir une coopération internationale avec le laboratoire GESIS de l'Institut Leibnitz en Allemagne
Bienvenue à nos deux nouveaux stagiaires en master TAL, Emel Dalgic de l’université catholique de Louvain et Bruno de Brito de l’université de Franche-Comté, qui nous accompagnerons pour une durée de 6 et 2 mois respectivement !
Vendredi 03 février 2023, de 9h30 à 12h, Grand Salon
Ali Sassane
maître de conférence HDR, Université 20 août 1955 de Skikda, Algérie
La psycholinguistique et la neurolinguistique entre théorie, pratique et perspectives
Résumé: La psycholinguistique et la neurolinguistique sont deux domaines d'étude scientifique interdisciplinaires qui collaborent régulièrement avec d’autres sciences à savoir, la linguistique, la psychologie et les neurosciences, etc. Ces deux disciplines ont l'ambition d’employer les nouvelles technologies les plus récentes (EEG, IRMf), ainsi que des techniques expérimentales approuvées telles que: l'écoute dichotique, amorçage sémantique, etc. J'aborderai ces disciplines au travers de mes propres recherches ainsi que de quelques publications pour mieux susciter leurs intérêts, notamment, par le biais de la Sémantique Cognitive.
Vendredi 27 janvier 2023, de 9h30 à 12h, Grand Salon
Marc BERTIN
ELICO, Université Claude Bernard Lyon-1
1) PNSO2 "Deuxième Plan national pour la science ouverte"
Résumé : Dans le cadre de la présentation du Deuxième Plan national pour la science ouverte nous évoquerons les différents axes afin de généraliser les science ouverte en France. Nous rappellerons que la science ouverte est la diffusion sans entrave des résultats, des méthodes et des produits de la recherche scientifique. Nous discuterons des opportunités que représente la mutation numérique pour développer l’accès ouvert aux publications, aux données, aux codes sources et aux méthodes de la recherche.
2) ANR TheoCite : analyse des citations
Résumé : L'accès aux publications en texte intégrale nous offre de nouvelles possibilités de fouille de corpus. Le projet ANR Théoscit présentera et discutera de la compréhension des citations dans leur contexte. Il s'agit d'un problème non résolu en science de l’information. La complexité de cet objet d’étude, impose un dialogue transdisciplinaire entre bibliométriciens, linguistes, sociologues et informaticiens. Ce projet vise à dresser une typologie des contextes de citations afin de mieux expliquer les actes de citations et d’établir les bases fonctionnelles de leurs utilisations. Ce dialogue transdisciplinaire conduira à la proposition d’un modèle conceptuel des actes de citation ainsi qu’à l’élaboration d’un prototype d’identification, d’extraction et de classification.
L'Université de Zadar (Département de Philologie Classique et Département des Sciences de l'Information), en coopération avec le Centre de Recherches Interdisciplinaires et Transculturelles (C.R.I.T.) de l'Université de Franche-Comté (Besançon) et l'association NooJ sont heureux de vous inviter à la 17ème Conférence Internationale NooJ 2023 qui se tiendra du 31 mai au 2 juin 2023 à Zadar (Croatie).
Retrouvez toutes les informations et l’appel à communication sur le site de l’événement.
Vendredi 20 janvier 2023, de 9h30 à 12h, Grand Salon
Panggih Kusuma Ningrum
doctorante, CRIT, université de Franche-Comté
Processing Scientific Uncertainty
Résumé : Scientific uncertainty is an integral part of the research process and inherent to the construction of new knowledge. We examine the ways uncertainty is expressed in articles and propose a new interdisciplinary annotation framework to categorize sentences that contain uncertainty.
20/04/2023 : Début des dépôts des candidatures eCandidat
23/05/2023 : Fin des dépôts des candidatures
21/06/2023 : Publication des résultats
28/06/2023 : Confirmation et inscription
Pour plus d'informations, consultez http://tesniere.univ-fcomte.fr/master.html et contactez iana.atanassova@univ-fcomte.fr.
Venez travailler avec nous sur la catégorisation de l'incertitude scientifique dans les publications en anglais. Nous proposons plusieurs stages sur le traitement de corpus scientifiques avec pour objectif le développement d'algorithmes pour l'extraction et la catégorisation des expressions d'incertitude. Vous travaillerez au sein d'une équipe internationale de chercheurs.
Ces stages s'adressent aux étudiants en Master TAL, Informatique ou disciplines similaires. Pour plus de détails, consultez http://tesniere.univ-fcomte.fr/ressources/offre-stage-InSciM-nov2022.pdf.
Plusieurs stages (de 4 à 6 mois) sont proposés par notre laboratoire en partenariat avec la start-up E-Cole. L’objectif du projet est de développer un algorithme de traitement de réponses aux exercices en texte libre, afin de proposer des fonctionnalités d’évaluation automatique.
Les stages sont ouverts aux étudiants de niveau Master avec une formation en Informatique et Traitement Automatique des Langues. Pour plus de détails, consultez http://tesniere.univ-fcomte.fr/ressources/offre-stage-ecole-nov2022.pdf.
Vendredi 08 avril 2022, de 9h30 à 12h, en présentiel (B16)
(https://rdv4.rendez-vous.renater.fr/seminaire-tal) Fouille sémantique de textes littéraires et médicaux : quelques réalisations
Motasem Alrahabi, , ingénieur de recherche et coordinateur scientifique de l'équipe-projet Obtic - Sorbonne Université
Durée : Trois mois
Lieu : Université de Bourgogne, Centre Interlangues – Texte, Image, Language (EA 4182)
et Université de Franche-Comté, Centre de Recherches Intertextuelles et Transculturelles, CRIT (EA 3224)
Cliquez ici pour voir l'annonce en détails
20/04/2022 : Début des dépôts des candidatures sur l’application Mon Master
23/05/2022 : Fin des dépôts des candidatures
21/06/2022 : Publication des résultats
28/06/2022 : Confirmation et inscription
Pour plus d'informations, contactez iana.atanassova@univ-fcomte.fr.