JEP-TALN 2004 - session on Arabic Language Processing A Review of Arabic Corpus Analysis Tools Un Examen d'Outils pour l'Analyse de Corpus Arabes

2004 
Dans ce papier nous presentons une vue d'ensemble critique d'outils disponibles pour l'analyse de corpus arabes, en nous concentrant sur la concordance (Monoconc : Barlow 2003), l’analyse morphologique et le marquage des categories grammaticales (Shaalan 1989, Ahmed 2000, Khoja 2001, Freeman 2001, Beesley 2001, Berri Zidoum et Atif 2001, Buckwalter 2002, Maamouri et Cieri 2002, Sakhr 2003, Darwish 2003), sur les dictionnaires sous forme exploitable par un ordinateur (Ajeeb 2003) et les outils de visualisation de corpus (Abu Shawar 2004). Nous suggerons qu'une etape essentielle pour les membres de la communaute de recherche d'analyse morphologique arabe devraient se mettre d’accord sur un objectif: choisir un corpus comme echantillon representatif de textes arabes et se mettre d’accord sur quelles annotations constituent un etalon-or, une sortie correcte decidee que des systemes devraient viser a repeter. En consequence, des systemes individuels peuvent etre evalues objectivement en mesurant leurs sorties contre un etalon-or. Le Coran est une norme possible, etant facile a trouver sous la forme de scriptes qui comprennent des signes diacritiques, que des linguistes peuvent enrichir en analyses.
    • Correction
    • Cite
    • Save
    • Machine Reading By IdeaReader
    11
    References
    12
    Citations
    NaN
    KQI
    []