La transcription du linguiste au miroir de l’intelligence artificielle : réflexions à partir de la transcription phonémique automatique

2020 
Les systemes de reconnaissance automatique de la parole atteignent desormais des degres de precision eleves sur la base d'un corpus d'entrainement limite a deux ou trois heures d'enregistrements transcrits (pour un systeme mono-locuteur), au lieu de dizaines d'heures pour les outils anterieurs. Au-dela de l'interet pratique que presentent ces avancees technologiques pour les tâches de documentation linguistique, se pose la question de leur apport pour la reflexion du linguiste. En effet, le logiciel realise son entrainement sur la base de transcriptions fournies en entree par le linguiste, transcriptions qui reposent sur un ensemble d'hypotheses plus ou moins elaborees, et plus ou moins explicites. Le modele acoustique, decalque (par des methodes statistiques) de l'ecrit du linguiste, peut-il etre interroge par ce dernier, en un jeu de miroir ? Que peut nous apprendre la confrontation ainsi renouvelee avec le signal acoustique ? La presente etude s'appuie sur des exemples de langue na (famille sino-tibetaine) pour illustrer la facon dont l'analyse d'erreurs permet une confrontation renouvelee avec les donnees. Quelques reflexions au sujet d'experiences de transcription automatique de la langue tsuut'ina (famille dene) sont egalement presentees.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    2
    Citations
    NaN
    KQI
    []