Um estudo exploratório sobre a criação de modelos de predição cruzada de defeitos apoiada por uma medida de correlação

Samuel de Paula

Um estudo exploratório sobre a criação de modelos de predição cruzada de defeitos apoiada por uma medida de correlação

2016

Samuel de Paula

Predizer defeitos em software e uma tarefa dificil, principalmente quando o projeto alvo esta em fase inicial de desenvolvimento, pois nessa fase o projeto nao possui uma base de dados historica consolidada que possa ser utilizada para treinar um modelo de predicao. Neste caso, e preciso encontrar projetos semelhantes ao projeto alvo para que, a partir de seus dados historicos, modelos de predicao possam ser elaborados, essa tecnica recebe o nome de predicao cruzada de defeitos. Esse trabalho tem como objetivo analisar uma forma alternativa para o agrupamento de projetos. A proposta consiste em agrupar modelos de predicao de forma que possam compartilhar seus conjuntos de dados de treinamento. Os agrupamentos foram criados pelo algoritmo de clusterizacao BSAS (do ingles, Basic Sequential Algorithmic Scheme), utilizando uma medida de correlacao denominada MCC (do ingles, Matthews correlation coefficient) para calculo de semelhanca dos modelos. Uma vez agrupados, os dados de treinamento dos modelos podem formar um unico conjunto de treinamento, dando origem a modelos de predicao cruzada de defeitos. Os resultados obtidos atraves da analise dos valores de MCC obtidos pelos modelos de predicao indicam que os modelos criados possuem baixo desempenho preditivo enquanto que os indicadores utilizados em trabalhos semelhantes indicam modelos com bom desempenho. Portanto, conclui-se que, a medida de correlacao MCC e uma medida de desempenho mais robusta que as demais para analise de modelos de predicao e que ela contribui para a reducao do problema de desbalanceamento de classes.

Keywords:

Correction
Cite
Save
Machine Reading By IdeaReader

References

Citations