Nos projets

Projet EMONTAL - Extraction et Modélisation Ontologique des Acteurs et Lieux pour la valorisation du patrimoine de la Bourgogne Franche-Comté

http://tesniere.univ-fcomte.fr/projet-emontal

2020-2023 (Thèse financée, Région Bourgogne Franche-Comté)

Le numérique en SHS s’est imposé au cours de ces dernières années comme un élément indispensable dans le processus d’archivage pour permettre une meilleure préservation ainsi qu’une valorisation du patrimoine. Cette thèse propose de valoriser ces fonds patrimoniaux de la région Bourgogne Franche-Comté par l'identification des acteurs et des lieux. L’objectif est de proposer une méthodologie pour traiter automatiquement des fonds documentaires et d'archives de natures hétérogènes (journaux, chroniques, documents administratifs, comptes-rendus, etc.) à des fins de valorisations patrimoniales dédiées à un contexte socio-historique donné. Cela repose sur le développement d’analyses textuelles, qui relèvent du domaine du Traitement Automatique des Langues et de l’analyse du discours.

Projet Interreg DecRIPT - Détection des diverses Représentations de l'Information permettant d'identifier les données Personnelles contenues dans les Textes

http://tesniere.univ-fcomte.fr/projet-decript

2019-2022 (Interreg France-Suisse)

Assurer la sécurité des données est devenu incontournable pour leur collecte et leur exploitation, y compris pour les textes susceptibles de contenir des données personnelles. Le projet DecRIPT a pour objectifs de proposer un modèle linguistique-sémantique pour pouvoir identifier automatiquement les données personnelles dans les textes en langage naturel, et de traiter ces données textuelles pour leur sécurité, offuscation et gouvernance. Un modèle sémantique, méta-modèle, de repérage des données sera élaboré pour servir à l'automatisation de ces tâches.

Projet Interreg WEBSO+ : Plateforme de veille multifonctionnelle

http://tesniere.univ-fcomte.fr/projet-webso

2016-2017 (Interreg France-Suisse)

Dans un environnement international très compétitif, ainsi que dans un contexte général de changements technologiques accélérés et de surcharge informationnelle généralisée, le projet WebSO+ s’inscrit dans le développement de la veille et de l’intelligence économique, méthodes et outils permettant aux entreprises qui les maîtrisent de tirer parti des informations stratégiques, afin d’obtenir un avantage concurrentiel.

Le projet WebSO+ a pour objectif de mettre à disposition des entreprises un outil d’intelligence économique performant (complet, simple et à un coût modéré), qui offre une veille (technologique, de marchés, concurrentielle, réglementaire, e-réputation) visant à renforcer la capacité des organisations à agir dans un contexte complexe.

Système d'aide à la rédaction scientifique (SARS) dans le domaine biomédical

2015-2017 (Région Franche-Comté)

La rédaction scientifique est fortement liée au domaine : d'une part pour la structuration du discours, d'autre part pour les besoins terminologiques induits par les disciplines spécifiques. Pour répondre aux besoins précis de chercheurs francophones devant rédiger des textes scientifiques en anglais, notre projet vise à développer une aide informatisée à la rédaction, sous forme d'une interface interactive d'édition.

Projet MONOFACE

2015-2016

Le projet MONOFACE vise à développer un prototype préindustriel générique de moteur de recherche pour des domaines restreints. Un domaine restreint peut être un site d’e-commerce, des données de l’administration, des entreprises, des organisations ou des données qui ne sont pas indexées par des moteurs de recherche généralistes comme Google. L’introduction de l’analyse linguistique permet d’analyser finement le besoin de l’utilisateur pour ne retourner que les résultats pertinents à la requête. Comme la plupart des moteurs de recherche de domaine restreint fonctionne actuellement avec une approche par mots clés, ces moteurs de recherche ont tendance à retourner beaucoup de résultats qui ne sont pas pertinents. Par exemple en cherchant « ordinateur dell » dans un site d’e-commerce, même si les premiers résultats sont pertinents, en filtrant le résultat par « prix moins cher » (si ce filtre fourni) par exemple, les premiers articles sont généralement des accessoires. L’utilisateur doit fouiller encore dans les résultats triés.

Description du projet MONOFACE [PDF]

RuleCNL : Langage naturel contrôlé pour la spécification des règles métier

2014-2015

Ce projet avait pour but de mettre sur pied RuleCNL qui est un langage contrôlé pour la spécification des règles métier. Son noyau réside dans l'alignement de la définition de la règle métier avec le vocabulaire du métier. Ceci permet d’assurer la consistance et la traçabilité avec le domaine métier et ainsi de rendre RuleCNL indépendant du domaine métier. Le logiciel support associé fournit des éditeurs conviviaux qui aident les utilisateurs finaux dans le processus d'écriture. Il intègre aussi un moteur de transformation automatique des règles métier vers des modèles formels (logiques) afin de faciliter leur automatisation.

Description du projet RuleCNL [PDF]

Projet ANR Sensunique

http://tesniere.univ-fcomte.fr/projet-sensunique.html

2011-2012 (ANR - Emergence)

Pour une rédaction optimale de textes techniques de qualité assistée par un rédacticiel innovant.
Objectif : Faciliter la rédaction de textes techniques de qualité.
Le projet Sensunique répond aux besoins actuels d'amélioration de la qualité de l'information et de sécurité des usagers et des personnels, quelle que soit la branche d'activité. Il s'appuie sur le concept de Langue Contrôlée (LC) afin d'améliorer la qualité de textes techniques et d'en optimiser la rédaction.

Projet ANR "LiSe" - Linguistique et Sécurité

http://projet-lise.univ-fcomte.fr/

2007-2010 (ANR)

Linguistique, normes, traitement automatique des langues et Sécurité : du Data et Sense Mining aux langues contrôlées.
Le projet consiste, à partir de la théorie micro-systémique, à élaborer une méthodologie fondée sur des analyses linguistiques approfondies afin de dégager des normes linguistiques pour des applications de sécurité. Deux technologies novatrices et complémentaires, «Data et Sense Mining» et «langue contrôlée généralisante», seront développées pour des applications en matière de traitement de l’information (reconnaissance de messages et de leur sens, syntaxiquement ou sémantiquement anormaux ou normaux) et de diffusion (alertes, protocoles médicaux et messages d’urgence).
Les normes définies permettront d’analyser, de rédiger, de vérifier des messages, protocoles, alertes et également d’obtenir des traductions fiables et compréhensibles. Toutes les couches de la linguistique seront utilisées, signaux « forts » ou « faibles ».

Projet Européen MESSAGE

http://message-project.univ-fcomte.fr/

2007-2009 (European Commission - Directorate-General Justice, Freedom and Security)

Le projet MESSAGE (nom complet : Alert Messages and Protocols) a pour but le transfert de la méthodologie et technologie développées dans le cadre du projet LiSe au Centre Tesnière (coordinateur du projet) en collaboration avec l’industrie aéronautique, des professionnels de la santé et des services d’urgence. Le projet LiSe vise à établir des normes de rédaction de messages d’alerte et de protocoles pour des applications à haute sécurité, afin que ceux-ci puissent être compris et traduits aisément, rapidement et correctement. Veuillez consulter le site du projet LiSe pour plus de renseignements.

Projet Doxilog

Depuis 2002

http://doxilog.com/

La nouvelle application doxilog est en ligne en libre accès par les éditions La Valsainte avec le soutien de l'Association Doxilog à Vevey (Suisse)
L’application :
Une fois chargée, l’application consiste à prendre en photo n’importe quel texte en langue française. Elle donne

  • l’âge auquel le texte est accessible pour un élève francophone scolarisé en français
  • le niveau européen CECR (A1, A2, B1, etc.) auquel le texte est accessible pour un étudiant de Français Langue Etrangère (FLE)
  • la liste des mots difficiles du texte
  • la définition du dictionnaire des mots difficiles du texte
  • la traduction des mots difficiles du texte dans la langue choisie
L’application doxilog est accessible aussi aux aveugles et mal voyants

MultiCoDict

Dictionnaires multilingues de collocations de domaines spécialisés qui exploitent des propriétés mathématiques inhérentes au moyen de techniques de spécification formelle. Une approche à la gestion de la terminologie par le génie logiciel.

Description du projet MultiCoDict [PDF]

Traduction Automatique Centre Tesnière (TACT)

Systèmes de traduction automatique

Description du projet TACT [PDF]

LABELGRAM

Labelgram is a system for the automatic morphological disambiguated tagging of texts. In Labelgram, the overall systemic grammars are 'super' micro systems modelling the relationship between texts and morphologically disambiguated tagged texts. The source and variant system is the language (in the form of texts), the target and invariant system is the morphological disambiguated tagging of each text unit, and the relationship between the two is the (composite) system of linguistic data which implements this relationship.

Description du projet LABELGRAM [PDF]

Projet VRQ - Natural Language Processing Computational Linguistics

Traitement des langues naturelles, avec NlpLab, UQAM.