EspiNet V2: a region based deep learning model for detecting motorcycles in urban scenarios

2019 
Este articulo presenta "EspiNet V2", un modelo de aprendizaje profundo, fundamentado en el detector basado regiones Faster R-CNN. El modelo es usado para la deteccion de motocicletas en entornos urbanos, donde se presenta algun nivel de oclusion. Para el entrenamiento de dicho modelo, se utilizaron dos conjuntos de datos: el conjunto de datos de motocicletas urbanas (UMD-10K) que cuenta con 10,000 imagenes anotadas, y el nuevo conjunto de datos de motos de la Secretaria de Movilidad (SMMD), con 5,000 imagenes capturadas obtenidas del Sistema CCTV de Control de Trafico de la ciudad de Medellin (Colombia). Los resultados obtenidos en el conjunto de datos UMD-10K alcanzan el 88.8% en precision promedio (AP), incluso con niveles de oclusion de un 60 %, utilizando imagenes capturadas desde un angulo bajo y desde una camara en movimiento. Por otro lado se alcanza un AP de 79.5 % para conjunto de datos de motos de la Secretaria de Movilidad (SMMD). EspiNet V2 supera modelos populares como YOLO V3 y Faster R-CNN (basado en VGG16), siendo estos entrenados de extremo a extremo utilizando los conjuntos de datos mencionados.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    33
    References
    0
    Citations
    NaN
    KQI
    []