RECUPERAÇÃO DA INFORMAÇÃO E A IMPORTÂNCIA DO PRÉ-PROCESSAMENTO
2019
A categorizacao de documentos consiste na classificacao dos mesmos em uma ou mais categorias existentes, de acordo com os assuntos ou conceitos presentes em seus conteudos. A aplicacao mais comum da categorizacao de documentos e a indexacao de documentos para os Sistemas de Recuperacao de Informacao visando uma melhor recuperacao destes documentos. Porem, sao tambem utilizados na categorizacao de mensagens e noticias. Para que a classificacao seja realizada de forma satisfatoria e necessario que os documentos a serem classificados passem por um processo de estruturacao, determinado pre-processamento, a fim de otimizar seu conteudo para analise dos algoritmos classificadores. A finalidade deste trabalho e demonstrar, por meio de experimentos, a importância do pre-processamento na categorizacao de documentos, uma vez que este influencia diretamente nos resultados classificadores. Para isto foram realizadas analises de um conjunto de documentos com as ferramentas Statistica12 para o pre-processamento e Weka para a classificacao. A importância do pre-processamento foi determinada com analise dos resultados obtidos por meios dos algoritmos classificadores SMO, Naive Bayes e J48.
Keywords:
- Correction
- Source
- Cite
- Save
- Machine Reading By IdeaReader
7
References
0
Citations
NaN
KQI