Semantic Neology: the challenges for automatic identification
2014
Depuis la fin des annees 1980 le recours a un corpus electronique fini est incontournable
comme source de renseignements linguistiques dans le cadre de la lexicographie generale,
et les centres de traduction et de terminologie s’y mettent aussi progressivement. Depuis la
fin des annees 1990 l’informatique est suffisamment performante pour permettre le stockage
de textes et leur traitement diachronique de telle sorte que la recherche automatisee de
neologismes lexicaux est desormais possible. De nos jours, les equipes de recherche et les
grandes maisons de dictionnaires se tournent systematiquement vers les corpus textuels afin
d’en extraire les nouveaux repertoires. Cependant les linguistes ont besoin non seulement
d’un acces automatise aux gisements de mots nouveaux mais aussi aux nouveaux usages
de mots existants. Les dispositifs susceptibles d’automatiser cette collecte sont toutefois
longs a developper. La raison principale en est que la qualite semantique d’un mot est
generalement concue en tant que phenomene paradigmatique, mais les logiciels qui traitent
les corpus textuels ne possedent que la dimension syntagmatique. La solution en est de
faire de necessite vertu et d’identifier les modifications de sens en termes de traits textuels
qui sont automatiquement reperables en surface. C’est de cette facon que la recherche
en la matiere se fait aujourd’hui. Cet article vise d’abord a rendre compte de l’etat de
la recherche en ce qui concerne les methodes exploitees par differents chercheurs, et a
presenter ensuite notre systeme d’identification automatique de la neologie semantique qui
remonte a 1990. Notre strategie repose sur l’hypothese qu’une modification significative
du profil collocationnel d’un mot signale un nouveau sens. Notre but ici est d’evaluer
la performance de cette demarche et de mettre en lumiere quelques difficultes que nous
avons rencontrees en mettant en relation les logiciels et les statistiques qu’ils fournissent
d’une part et les faits de distribution linguistique et le sens lexical de l’autre.
- Correction
- Source
- Cite
- Save
- Machine Reading By IdeaReader
0
References
0
Citations
NaN
KQI