Présentation Objectifs Equipe Financement Publications

EMONTAL


Extraction et Modélisation ONTologique des Acteurs et Lieux pour la valorisation du patrimoine de Bourgogne Franche-Comté


Financement région Bourgogne Franche-Comté 2020 - 2023

Présentation

Le numérique en SHS s’est imposé au cours de ces dernières années comme un élément indispensable dans le processus d’archivage pour permettre une meilleure préservation ainsi qu’une valorisation du patrimoine. Cette thèse propose de valoriser les fonds patrimoniaux de la région Bourgogne Franche-Comté par l'identification des acteurs et des lieux.

La finalité de ce travail est de produire des données et outils permettant la fouille d’archives, par exemple pour retracer l’histoire personnelle d’un individu, d’un organisme, d’un commerce, etc. à l’échelle de la région. Ces données seront exploitables via des interfaces de navigation accessibles en ligne, permettant ainsi à l'usager de lier les informations provenant de sources hétérogènes et ainsi produire de nouvelles connaissances.

Le projet EMONTAL s'inscrit pleinement dans l'axe 1 « Sciences, langages, textualités » du laboratoire CRIT (EA 3224), et notamment dans le sous-axe 2 qui a pour objectif le développement de modèles et de méthodologies visant la compréhension, la génération et la représentation automatique de contenus textuels incluant la sémantique textuelle.

Objectifs

L’objectif du projet EMONTAL est de proposer une méthodologie pour traiter automatiquement des fonds documentaires et d'archives de natures hétérogènes (journaux, chroniques, documents administratifs, comptes-rendus, etc.) à des fins de valorisations patrimoniales dédiées à un contexte socio-historique donné. Cela repose sur le développement d’analyses textuelles, qui relèvent du domaine du Traitement Automatique des Langues et de l’analyse du discours.

Les outils et données produits seront mis à disposition du grand public mais aussi des documentalistes, chercheurs et acteurs du tissu socio-économique de la région, afin de faciliter la valorisation de ces fonds. Ce travail constituera un socle technologique pour de futurs projets, valorisant ainsi l’activité de recherche dans la région Bourgogne Franche-Comté.

Equipe

Dr Iana Atanassova

iana.atanassova@univ-fcomte.fr

Maître de conférences, H.D.R., IUF

Directrice du laboratoire C.R.I.T.

Porteuse du projet, directrice de thèse

Nicolas Gutehrlé

nicolas.gutehrle@univ-fcomte.fr

Doctorant

Financement

Publications

2024

Gutehrlé, N. (2024). Semantic Search in Archive Collections Through Interpretable and Adaptable Relation Extraction About Person and Places. In N. Goharian, N. Tonellotto, Y. He, A. Lipani, G. McDonald, C. Macdonald & I. Ounis (Éd.), Advances in Information Retrieval (p. 315-318). Springer Nature Switzerland. https://doi.org/10.1007/978-3-031-56069-9_37

2023

Gutehrlé, N., & Atanassova, I. (2023). Comprendre les archives : vers de nouvelles interfaces de recherche reposant sur l’annotation sémantique des documents Understanding Archives : Towards New Research Interfaces Relying on the Semantic Annotation of Documents. CiDE.23 : Document et archivage : pratiques formelles et informelles. https://hal.science/hal-04523110 https://hal.science/hal-04523110

2022

Gutehrlé, N., Doucet, A., & Jatowt, A. (2022). Archive TimeLine Summarization (ATLS): Conceptual Framework for Timeline Generation over Historical Document Collections. Proceedings of the 6th Joint SIGHUM Workshop on Computational Linguistics for Cultural Heritage, Social Sciences, Humanities and Literature, 13-23. https://aclanthology.org/2022.latechclfl-1.3 https://aclanthology.org/2022.latechclfl-1.3/

Gutehrlé, N., & Atanassova, I. (2022). Processing the structure of documents: Logical Layout Analysis of historical newspapers in French. Journal of Data Mining & Digital Humanities, NLP4DH. https://doi.org/10.46298/jdmdh.9093 https://jdmdh.episciences.org/9614/pdf

2021

Gutehrlé, N., & Atanassova, I. (2021). Logical Layout Analysis Applied to Historical Newspapers. Proceedings of the Workshop on Natural Language Processing for Digital Humanities, 85-94. https://aclanthology.org/2021.nlp4dh-1.10 https://aclanthology.org/2021.nlp4dh-1.10/

Gutehrlé, N., & Atanassova, I. (2021). Dataset for Logical-layout analysis on French historical newspapers (Version 1.0). Zenodo. https://doi.org/10.5281/zenodo.5752440 https://doi.org/10.5281/zenodo.5752440

Gutehrlé, N., Harlamov, O., Karimi, F., Wei, H., Jean-Caurant, A., & Pivovarova, L. (2021). SpaceWars: A Web Interface for Exploring the Spatio-temporal Dimensions of WWI Newspaper Reporting. HistoInformatics 2021 – 6th International Workshop on Computational History. https://ceur-ws.org/Vol-2981/paper3.pdf