Atenção visual bottom-up guiada por otimização via algoritmos genéticos.
2007
A atencao visual e um mecanismo biologicamente inspirado, o qual corresponde a habilidade de selecionar e processar somente as regioes mais relevantes de uma cena visual. Para fins didaticos, a atencao visual pode ser dividida em duas categorias principais: bottom-up e top-down. A atencao visual bottom-up guia o foco de atencao a partir de caracteristicas primitivas (como descontinuidades de intensidade em diferentes escalas e orientacoes) computadas diretamente na imagem,sem qualquer informacao contextual. A atencao visual top-down, por outro lado, realiza uma busca por regioes de interesse a partir de caracteristicas de alto nivel, especificadas na forma de conhecimento previo na forma ou modelos sobre o que se esta buscando na cena. A principal questao de pesquisa que procuramos responder nessa dissertacao e a seguinte: como seria possivel agregar algum comportamento de alto nivel a um mecanismo tipico de atencao visual bottom-up (guiando dessa forma o foco de atencao para classes de regioes pre-estabelecidas)? O modelo mais conhecido de atencao visual bottom-up utiliza varios mapas de caracteristicas primitivas para formar um mapa de saliencia, o qual indica a importância do ponto de vista atencional das diferentes regioes de uma cena. Nesse trabalho, atribuimos pesos aos mapas de caracteristicas e desenvolvemos
um processo de otimizacao baseado em algoritmos geneticos simulados em uma grade computacional. Foram realizados experimentos com quatro classes de objetos (carros, faces de pessoas, objetos genericos e pistolas). Os resultados utilizando atencao bottom-up com otimizacao foram comparados com os resultados de um mecanismo sem otimizacao de pesos e com um sistema existente que implementa o difundido modelo de atencao visual proposto por Itti et al. [Itti et al., 1998]. Os resultados mostraram ganhos de ate 30% utilizando-se a abordagem proposta. Desta forma, este trabalho mostra que a atencao visual pode ser guiada para regioes pre-definidas, podendo ser utilizada como parte de sistemas de deteccao de objetos.
Keywords:
- Correction
- Cite
- Save
- Machine Reading By IdeaReader
0
References
2
Citations
NaN
KQI