RECUPERAÇÃO DA INFORMAÇÃO E A IMPORTÂNCIA DO PRÉ-PROCESSAMENTO

2019 
A categorizacao de documentos consiste na classificacao dos mesmos em uma ou mais categorias existentes, de acordo com os assuntos ou conceitos presentes em seus conteudos. A aplicacao mais comum da categorizacao de documentos e a indexacao de documentos para os Sistemas de Recuperacao de Informacao visando uma melhor recuperacao destes documentos. Porem, sao tambem utilizados na categorizacao de mensagens e noticias. Para que a classificacao seja realizada de forma satisfatoria e necessario que os documentos a serem classificados passem por um processo de estruturacao, determinado pre-processamento, a fim de otimizar seu conteudo para analise dos algoritmos classificadores. A finalidade deste trabalho e demonstrar, por meio de experimentos, a importância do pre-processamento na categorizacao de documentos, uma vez que este influencia diretamente nos resultados classificadores. Para isto foram realizadas analises de um conjunto de documentos com as ferramentas Statistica12 para o pre-processamento e Weka para a classificacao. A importância do pre-processamento foi determinada com analise dos resultados obtidos por meios dos algoritmos classificadores SMO, Naive Bayes e J48.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    7
    References
    0
    Citations
    NaN
    KQI
    []