corpus parallèle français-macédonien

Création de ressources lexicales bilingues français-macédonien, à partir de corpus parallèles

Nom: 
SONDERMEIJER
Prénom: 
-
Année: 
2005
Résumé du mémoire: 

Dans le présent mémoire nous proposons une méthodologie de création de ressources lexicales (glossaires, lexiques etc.) par extraction terminologique automatique à partir de corpus parallèles français-macédonien.

Une telle méthodologie contribuera à l'enrichissement du fond modeste des ressources lexicales existant pour ce couple de langues.

Dans un premier temps nous allons décrire le processus de constitution et de prétraitement du corpus. Ensuite, nous allons nous pencher sur l'extraction terminologique et l'alignement des candidats termes.

Nous présentons les outils de TAL utilisés à ce propos, leurs points forts et leurs limites. Les difficultés rencontrées lors de la démarche entreprise seront également traitées. Enfin nous allons dresser un bilan du travail effectué et de la possibilité d'automatisation du processus de création de ressources lexicales français-macédonien.

Syndiquer le contenu