Classificação Automática da Presença Social em Discussões Online Escritas em Português

2020 
Esta dissertacao de mestrado apresenta um metodo que permite a identificacao automatica de mensagens provenientes de foruns online de ensino a distância escritas em portugues brasileiro. Particularmente, analisa o problema da codificacao de mensagens de discussao segundo as categorias de presenca social, um importante construto do modelo de Comunidade de Investigacao amplamente utilizado na aprendizagem online. Apesar de existirem tecnicas de codificacao para a presenca social na lingua inglesa, a literatura ainda e carente em metodos para as demais linguas, como o portugues. O metodo aqui proposto utiliza-se de um conjunto de caracteristicas provenientes da frequencia de palavras e 158 caracteristicas extraidas de dois recursos, LIWC e Coh-Metrix, disponiveis para analise textual atraves de tecnicas de Mineracao de Texto, para criar um classificador para cada uma das tres categorias da presenca social (Afetiva, Interativa e Coesiva). Para isso foram utilizados tres tipos de algoritmos, Random Forest, AdaBoost e XGBoost onde o melhor modelo desenvolvido utilizou o algoritmo XGBoost atingindo 85,68% de acuracia e indice Kappa (k) de 0,71, o que representa uma concordância substancial, e esta bem acima do grau de puro acaso. Este trabalho tambem prove uma analise da natureza da presenca social, observando as caracteristicas de classificacao que foram mais relevantes para distinguir as tres categorias da presenca e uma analise comparativa sobre as principais caracteristicas identificadas nas fases da presenca social em diferentes dominios.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []