Semantic Neology: the challenges for automatic identification

2014 
Depuis la fin des annees 1980 le recours a un corpus electronique fini est incontournable comme source de renseignements linguistiques dans le cadre de la lexicographie generale, et les centres de traduction et de terminologie s’y mettent aussi progressivement. Depuis la fin des annees 1990 l’informatique est suffisamment performante pour permettre le stockage de textes et leur traitement diachronique de telle sorte que la recherche automatisee de neologismes lexicaux est desormais possible. De nos jours, les equipes de recherche et les grandes maisons de dictionnaires se tournent systematiquement vers les corpus textuels afin d’en extraire les nouveaux repertoires. Cependant les linguistes ont besoin non seulement d’un acces automatise aux gisements de mots nouveaux mais aussi aux nouveaux usages de mots existants. Les dispositifs susceptibles d’automatiser cette collecte sont toutefois longs a developper. La raison principale en est que la qualite semantique d’un mot est generalement concue en tant que phenomene paradigmatique, mais les logiciels qui traitent les corpus textuels ne possedent que la dimension syntagmatique. La solution en est de faire de necessite vertu et d’identifier les modifications de sens en termes de traits textuels qui sont automatiquement reperables en surface. C’est de cette facon que la recherche en la matiere se fait aujourd’hui. Cet article vise d’abord a rendre compte de l’etat de la recherche en ce qui concerne les methodes exploitees par differents chercheurs, et a presenter ensuite notre systeme d’identification automatique de la neologie semantique qui remonte a 1990. Notre strategie repose sur l’hypothese qu’une modification significative du profil collocationnel d’un mot signale un nouveau sens. Notre but ici est d’evaluer la performance de cette demarche et de mettre en lumiere quelques difficultes que nous avons rencontrees en mettant en relation les logiciels et les statistiques qu’ils fournissent d’une part et les faits de distribution linguistique et le sens lexical de l’autre.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []