grammaires

Recherche

自然语言处理曾长时间停留在单语应用,而当下纷繁交错的多语数码文件则给自然语言处理语言学家开阔了的新视野,同时更丰富了其科研前景。这一观念的转变反映在语言处理几个不同的层面, 从文字编码问题到数码文件形式和内容问题。我们的研究正是这些问题一个综合, 即从多学科的角度(语言,信息,文档)来对以上问题进行分析和处理。
因此,我们倡导的研究方案结合形态元素(文件结构,编码)和内容元素 (语义)这两个层面。这两个不可分离的层面既具有重大的理论意义, 又开拓了技术、教学及其他研究的范围。
多语言多媒体数码文件的性质是我们所面对的一项复杂课题, 其实质在于衡量这类文件所具有的应用前景。
问题1:多语现象的关键
1. 文字的编码,转码
该课题是CRIM/TIM科研组成立以来的基础研究之一. INaLCO学院内100种语言的编码、转码需求就足以证明该研究的意义。我们已开发了一些专用的编码/转码程序,包括特别针对阿拉伯语,西里尔语,希腊语以及非洲语言(如EVALDA,ATOS或ALPCU项目)... (阅读更多)
近几年的思考表明,针对多语现象,编码的多重多样性和应用的多样化等问题, 其解决方案在于对对象符号综合表现形式的运用。
数十年在多语种、多类文字背景下的研究,使我们从“文字即图形标志”这一定义发展认识到了另一复杂概念,即把文字作为虚拟对象(所有不同程度的属性)。

Syndiquer le contenu