collocations

Détection de relations morphologiques en corpus basée sur les cooccurrences

Nom: 
NC
Prénom: 
-
Année: 
2002
Résumé du mémoire: 

Notre thématique de recherche est le développement d’un outil pour la détection des variantes morphologiques dérivationnelles dans un corpus spécialisé ici un corpus médical.

Notre méthode pour construire une base morphologique dérivationnelle est basée sur le regroupement des mots morphologiquement proches qui se trouvent dans un corpus spécialisé. Cette méthode se fonde sur l’observation que les mots morphologiquement apparentés se trouvent à proximité, à une courte distance, dans une fenêtre textuelle d’une taille comparable à celle d’un paragraphe.

Les regroupements sont réalisés en utilisant une technique de cooccurrences en choisissant une fenêtre de n mots.

Les cooccurrences sont calculées par un filtrage statistique basé sur le rapport de vraisemblance(likelihood ratio). Un filtrage morphologique sur la « racine » commune permet ensuite de déterminer les mots morphologiquement apparentés. Cette méthode est appliquée à un corpus du domaine médical de 7 millions de mots.

L’utilisation de fonctions lexicales dans une ressource de collocations

Nom: 
NC
Prénom: 
-
Année: 
2004
Résumé du mémoire: 

Ce mémoire tente une analyse et une évaluation de l’utilisation de fonctions lexicales dans la constitution d’une ressource de collocations. Les fonctions lexicales utilisées s’inspirent des fonctions lexicales du Dictionnaire Explicatif et Combinatoire de Igor Mel’cuk et al. mais s’en éloignent. Ce travail explique la démarche adoptée pour la constitution de la ressource et évalue l’intérêt de l’utilisation des fonctions lexicales.

Syndiquer le contenu