Prediction Performance and Problem Difficulty in Genetic Programming

2016 
La estimacion de la dificultad de problemas es un tema abierto en Programacion Genetica (GP). El objetivo de este trabajo es generar modelos que puedan predecir el desempeno esperado de un clasificador basado en GP cuando este es aplicado a tareas de prueba. Los problemas de clasificacion son descritos usando caracteristicas de un dominio especifico, algunas de las cuales son propuestas en nuestro trabajo y estas caracteristicas son dadas como entrada a los modelos predictivos. Nos referimos a estos modelos como predictores de desempeno esperado (PEPs, por sus siglas en ingles). Extendimos este enfoque usando un ensemble de predictores especializados (SPEPs, por sus siglas en ingles), dividiendo problemas de clasificacion en grupos especificos y elegimos su correspondiente SPEP. Los predictores propuestos son entrenados usando problemas de clasificacion sinteticos de 2D con conjunto de datos balanceados. Los modelos son entonces usados para predecir el desempeno de un clasificador de GP en problemas del mundo real antes no vistos los cuales son multidimensionales y desbalanceados. Ademas, este trabajo es el primero en proveer una prediccion de rendimiento para un clasificador de GP sobre datos de prueba, mientras en trabajos previos se han enfocado en predecir el rendimiento para datos de entrenamiento. Por lo tanto, planteados como un problema de regresion simbolica son generados modelos predictivos exactos los cuales son resueltos con GP. Estos resultados son alcanzados usando caracteristicas altamente descriptivas e incluyendo un paso de reduccion de dimensiones el cual simplifica el proceso de aprendizaje y prueba. El enfoque propuesto podria ser extendido a otros algoritmos de clasificacion y usarlo como base de un sistema experto de seleccion de algoritmos.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []