Traitement Automatique des Langues : Unités d’enseignement libres (UEL)

Semestre 1 : Théories linguistiques et Traitement Automatique des Langues
Responsable : Izabella THOMAS

Avec le développement rapide de l’informatique, de nouveaux domaines de recherche se sont ouverts à la linguistique, et notamment, le Traitement Automatique des Langues (TAL), qui est un ensemble des techniques, linguistiques et informatiques, permettant à un ordinateur d'analyser, de comprendre et de produire le langage humain.

Le passage d’une langue naturelle à son informatisation exige un traitement à plusieurs niveaux : tout d’abord, une analyse linguistique rigoureuse en vue de la formalisation de données linguistiques, pour aboutir à leur implémentation informatique.

Les langues naturelles ne sont pas des objets informatiques comme les autres : elles sont par nature évolutives, ambiguës et implicites. De ce fait, il est nécessaire de comprendre leur nature pour tenter d’en proposer la description, puis la formalisation adéquate, cette étape intermédiaire entre le traitement linguistique et l’informatisation.

L’objectif de ce cours est de présenter aux étudiants la complexité des langues humaines et de les initier à la description de leurs propriétés. Ceci en s’appuyant sur les grandes théories linguistiques et en analysant leur apport au TAL. Seront abordés : le structuralisme, le distributionalisme, le fonctionnalisme, les grammaires génératives, les grammaires de dépendance et les grammaires lexicalisées.

Le cours est destiné aux étudiants souhaitant :

  • Comprendre le fonctionnement des langues humaines ;
  • Disposer des fondements théoriques pour analyser les différents phénomènes linguistiques ; 
  • Acquérir les méthodes d’analyse linguistique ;
  • S’initier au Traitement Automatique des Langues.

Semestre 2 : Initiation à la programmation pour le TAL
Responsable : Iana ATANASSOVA

Ce cours aborde le traitement informatique de données textuelles à travers la notion d'algorithme, de langage de programmation et de développement.

L'omniprésence des outils informatiques dans toutes les disciplines scientifiques crée un contexte dans lequel l'apprentissage de l'algorithmique et de la programmation est bénéfique pour tous les étudiants qui souhaitent prendre une part active dans l'expérimentation et le traitement des données ainsi que la conception de nouveaux outils informatiques.

Notre objectif est d'apporter aux étudiants de sciences humaines une connaissance de base en programmation afin de leur permettre de concevoir et de réaliser des programmes informatiques pour répondre aux besoins de leurs disciplines. Le traitement de données textuelles sera en lien avec le Traitement Automatique des Langues (TAL), qui présente un intérêt particulier pour les étudiants en sciences du langage.

Toutes les notions sont introduites d'abord de point de vue théorique, puis en pratique à travers l'étude d'un langage de programmation interprété (python). Les étudiants sont amenés à construire des algorithmes, lire, analyser et écrire des programmes pour résoudre des tâches liées aux traitements des textes.