FrenchSentiClass : un Système Automatisé pour la Classification de Sentiments en Français

2017 
Ce papier decrit le systeme FrenchSentiClass que nous avons utilise pour les tâches du defi de fouilles de texte (DEFT 2017). Cette treizieme edition du defi a porte sur l'analyse de l'opinion et du langage figuratif dans des tweets rediges en Francais. Le defi propose trois tâches : (i) la premiere concerne la classification des tweets non figuratifs selon leur polarite ; (ii) la deuxieme concerne l'identification du langage figuratif et (iii) la troisieme concerne la classification des tweets figuratifs et non figuratifs selon leur polarite. Nous avons propose un systeme automatise base sur les Machines a Vecteurs de Support (SVM). Le systeme choisit automatiquement a chaque niveau les meilleurs pretraitements, descripteurs syntaxiques et lexiques de sentiments en validation croisee sur l'ensemble d'apprentissage. Il effectue aussi une evaluation de l'apport de la selection d'attributs et un tuning du parametre de complexite du modele SVM. Par consequent, ce systeme permet de reduire considerablement le temps d'exploration des donnees et du choix de la meilleur representation de descripteurs. ABSTRACT FrenchSentiClass : an Automated System for French Sentiment Classification This paper describes the system we used on the tasks of the text mining challenge (DEFT 2017). This thirteenth edition of this challenge concerned the analysis of opinions and figurative language in French tweets. Three tasks have been proposed : (i) the first one concerns the classification of non-figurative tweets according to their polarity ; (ii) the second one concerns the identification of figurative language, while (iii) the third one concerns the classification of figurative and non-figurative tweets according to their polarity. We proposed an automated system based on Support Vector Machines (SVM). The system automatically chooses on each step the best preprocessing, syntactic features and sentiment lexicons by cross validation on the training set. Furthermore, it performs an evaluation of feature subset selection and a tuning SVM complexity parameter. Therefore, this system can significantly reduce the time necessary to explore the data and choose the best feature representation. MOTS-CLES : Analyse d'opinions, detection de polarite, langage figuratif.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []