extraction de termes

Traitement d’un corpus quadrilingue parallèle (anglais, polonais, français et allemand), portant sur le domaine de la programmation

Nom: 
NC
Prénom: 
-
Année: 
2004
Résumé du mémoire: 

Puisque les chercheurs se concentrent plus sur les corpus bilingues, nous nous intéressons dans un premier temps à la situation des outils de traitement des corpus multilingues (plus de trois langues), y compris les langues slaves. Les outils pris en compte concernent l'alignement et l'extraction des termes, mais nous nous intéressons aussi aux concordanciers. Dans un second temps, nous appliquons les outils accessibles à notre corpus pour observer les occurrences extraites du corpus dans leur contexte immédiat et ensuite, l'alignement effectué pour analyser des équivalences en traductions. A l’avenir, le traitement de ce corpus pourrait aboutir à un lexique quadrilingue spécialisé en programmation.

Glossaire bilingue anglais-français pour les aides techniques, la rééducation et la réadaptation fonctionnelles en ligne

Nom: 
BOGNAR
Prénom: 
-
Année: 
2005
Résumé du mémoire: 

La création d'un glossaire bilingue nécessite le choix judicieux du corpus à partir duquel la terminologie est extraite. Pour une extraction de terminologie efficace, les textes sont soigneusement préparés, segmentés avant qu'ils ne soient traités.
Une selection d'outils informatiques est accessible pour l'extraction de terminologie. L'efficacité de l'extraction dépend de la transformation du texte en format le mieux supporté par le logiciel et les réglages des paramétres de ce dernier. L'alignement des termes à l'aide des extracteurs actuels n'est pas au point.

Le nettoyage et la rationalisation des termes représentent un travail manuel important. La création d'un glossaire bilingue peut se faire également par l'alignement des textes bilingues. Elle nécessite non seulement la bonne préparation du texte mais un travail "manuel" important.

Php et Mysql sont des languages conviviaux pour la mise en ligne du glossaire bien préparé.

Syndiquer le contenu