traitement automatique des langues

Les nouvelles technologies au service de l’apprentissage des langues

Nom: 
NC
Prénom: 
-
Année: 
2003
Résumé du mémoire: 

Après avoir envahi la société industrielle, le développement des télécommunications et l’explosion du multimédia ont contribué à élargir les perspectives en matière de formation. Les enjeux économiques du domaine de la formation professionnelle sont tels que de plus en plus de nouvelles solutions sont envisagées. Petit à petit, lele-learning défini comme le processus d’apprentissage à distance et de mise à disposition de contenus pédagogiques reposant sur l’utilisation des nouvelles technologies s’est imposé comme un outil souple, accessible et applicable à de nombreux domaines.
Notre réflexion au fil de ce mémoire s’interessera à l’application du e-learning dans un domaine bien particulier, celui de l’apprentissage des langues. Comment peut-on envisager l’apprentissage / enseignement des langues dans un environnement en ligne ? Le e-learning en langues est-il concevable d’un point de vue linguistique, pédagogique et technologique ? Comment utiliser les nouvelles méthodes de communication, le multimédia et Internet pour transmettre le savoir ? De quel ordre sont les changements conceptuels entre formation linguistique traditionnelle et en ligne ?
Ainsi, après être revenus sur les particularités de l’apprentissage / enseignement des langues, nous nousintéresserons à la mise en place de projets de formation linguistique en ligne et à la nécessité d’y intégrer des outils de traitement automatique des langues. Nousillustrerons notre propos par la présentation d’applications existantes.

Traitement automatique de ressources textuelles pour l’indexation de l’image. Etude de cas : La collection du Musée International d’Art Naïf

Nom: 
NC
Prénom: 
-
Année: 
2004
Résumé du mémoire: 

L’objectif de notre étude est l’indexation d’un corpus d’images conservées dans une banque de données afin de les retrouver au travers de ressources textuelles qui leur sont liées. Le corpus est constitué de 897 photos d’objets d’art (tableaux, dessins, sculptures…) issus de la collection du Musée International d’Art Naïf de Vicq. Une typologie des textes et fragments textuels liés au corpus d’images a été établie, avant de définir des méthodes et outils de TAL pour leur traitement. L’outil principal créé est une hiérarchie de mots-clés. Il s’agit d’une version simplifiée et très réduite du thesaurus iconographique de François Garnier, réalisée après adaptation au corpus d’images et enrichissement au moyen d’un traitement automatique de ressources textuelles liées à ce corpus.

Les architectures de traitements linguistiques

Nom: 
NC
Prénom: 
-
Année: 
2004
Résumé du mémoire: 

Pour mener à bien des travaux de traitements linguistiques sur des données textuelles, de nombreux outils ont déjà été développés et permettent d'obtenir diverses informations, notamment morphosyntaxiques et sémantiques. La plupart de ces outils ne sont cependant pas conçus pour être combinés entre eux. Leur utilisation conjointe est par conséquent loin d'être triviale. En effet, de nombreux problèmes se posent: la plupart du temps, ce que fournit un outil en sortie ne correspond pas du tout à ce que nécessite un autre outil en entrée, aussi bien en terme de niveau d'information que de format des données. Notre objectif dans ce mémoire est de décrire l'intégration d'outils de TAL dans une plate-forme d'enrichissement de corpus en tenant compte des contraintes liées à leur adéquation. Nous présentons les problèmes qui peuvent être rencontrés aussi bien sur le plan théorique, comme par exemple l'adéquation des jeux d'étiquettes morphosyntaxiques utilisés, que sur le plan informatique, comme par exemple les très grands temps de calcul, ou la complexité du format d'annotations. Nous apportons également un regard critique sur l'enrichissement linguistique de corpus textuels, tout en nous appuyant sur des expériences menées autour d'outils et plate-formes déjà existants. Nous dressons dans la première partie du mémoire un état de l'art sur les plate-formes et outils d'analyse de corpus textuels. Puis, nous décrivons la plate-forme que nous avons élaborée dans le cadre du projet européen de moteur de recherche sémantique ALVIS. Enfin, dans une troisième partie, nous exposons les résultats de notre travail sur la plate-forme ALVIS. Nous avons utilisé une DTD XML afin de décrire l'ensemble des annotations linguistiques liées au corpus.

Syndiquer le contenu