Indexation automatique

Etude sur l’indexation automatique de documents dans un contexte de recherche d’information à caractère sensible

Nom: 
NC
Prénom: 
-
Année: 
2003
Résumé du mémoire: 

L’accroissement incessant des documents pouvant être accessibles aux utilisateurs rend les techniques de Recherche Documentaire (RD) toujours plus perfectibles et souvent exigeantes en ressources linguistiques et en traitements spécifiques. Par ailleurs, il est couramment admis que les outils de TAL pour la Recherche Documentaire requièrent de vastes connaissances linguistiques.

Nous étudierons en première partie, les techniques et méthodes actuelles souvent utilisées dans le domaine de la recherche d’information. Dans une deuxième partie, nous tenterons de montrer l’intérêt d’une lemmatisation tout en discutant les avantages et les inconvénients d’une telle méthode à travers différentes langues indo‑européennes et non indo‑européennes.

Enfin, dans une troisième et dernière partie nous dégagerons les méthodes adaptées à la spécificité du travail de la DST, où nous avons effectué notre stage. Nous présenterons dans une étude de faisabilité, l’enrichissement de l’indexeur Mnogosearch grâce à l’optimisation de la pertinence des requêtes et la recherche d’améliorations linguistiques. Ainsi, nous analyserons les performances linguistiques relevant de la technique de lemmatisation appliquée à un modèle statistique, compte tenu du caractère sensible des documents. Cette étude nous mènera à construire un prototype simple illustrant la méthode choisie.

L’indexation automatique de ressources pédagogiques numériques : élaboration d’une méthode d’application au projet Graines de Génie – Anglais

Nom: 
MALARET
Prénom: 
-
Année: 
2007
Résumé du mémoire: 

L'indexation s'inscrit dans le domaine de la documentation et plus particulièrement de la recherche d'information.

C'est un champ trés large dans lequel l'indexation manuelle a dû laisser sa place à l'indexation automatique, plus rapide et économique. Pourtant, certaines difficultés inhérentes au language naturel n'ont pas pu être contournées. L'indexation automatique semble n'être accéssible que grâce à des logiciels performants.

L'indexation du projet Graine de Genie propose un autre mode d'accès à l'indexation automatique tout en introduisant l'aspect pédagogique. En effet, un index destiné à un jeune public ne tiendra pas compte des mêmes exigences qu'un autre, employé par des adultes.

Syndiquer le contenu