본 논문에서는 서식 문서의 선과 숫자의 획이 접촉된 경우 숫자의 획을 접촉되기 전 상태의 원 이미지로 복원하는 방법을 제안한다. 제안하는 방법은 서식 문서에서 추출한 숫자열을 대상으로 열 단위로 복원한다. 과정은 우선 숫자열과 접촉된 선의 위치를 찾아내고, 선을 추적하면서 접촉으로 판정되는 영역을 유형별로 분류하여, 각 유형에 적합한 획 복원 방법을 제안한다. 또한 선에 숫자의 획이 완전히 포함된 경우의 복원 방법도 제안하여 현장에서의 서식 처리 과정에서 발생하는 문제점을 해결하고자 하였다. 제안하는 방법을 평가하기 위해서 은행 입출금전표, 신용카드 매출전표 및 NIST 필기 숫자열 데이타베이스 이미지를 사용하였다.
벡터양자화(Vector Quantization : VQ)등에 널리 사용되어 온 코호넨의 SOFM(Self-Organizing Feature Maps)는 고정된 크기와 구조의 네트워크를 사용하기 때문에 실제 패턴을 적절히 분류하지 못하는 문제가 있다. 반면, 이것은 기본적으로 빠른 점증 학습이 가능하여 다층 퍼셉트론의 단점을 보완할 수 있는 패턴분류기로 부각되고 있다. 본 논문에서는 네트워크의 구조도 학습과정에서 주어진 패턴에 적응적으로 변형되는 구조적응 자기조직화 신경망과 그 학습 알고리즘을 제안한다. 제안된 신경망은 기존의 SOFM에 구조적응 기능을 부여함으로써 주어진 패턴의 분류에 적합한 네트워크의 구조 및 크기를 자동적으로 찾는다. 여러가지 크기의 활자체에 대한 인쇄체 숫자인식에 적용한 결과 페턴분류에 적절한 구조가 생성되었으며, 보다 복잡한 필기체 인식문제에서도 그 가능성을 보여주었다.
이미지를 입력으로 사용하는 다양한 응용 분야에서, 이미지에 포함되어 있는 객체의 의미를 이해하는 것은 매우 중요하다. 이미지에 포함된 객체의 인식을 위해 우선적으로 관심 영역을 추출하는 경우, 인식하고자 하는 대상의 특징에 대한 사전 지식이나 입력된 이미지에서의 위치, 색, 그리고 크기 정보를 이용하는 것이 일반적이다. 그러나 이미지로부터 사전 지식이 전무한 불특정 다수의 객체에 대한 의미를 추론해야 하거나 그로부터 정보를 수집해야 하는 경우, 이러한 관심 영역 추출 방법은 효과적이지 않다. 본 논문에서는 이를 위해 컬러 이미지를 입력으로 사용하는 응용에서 이미지의 양자화 된 색 정보와 다중 저해상도 정보만을 이용하여 관심 객체가 될 가능성이 있는 후보 관심 영역들을 포함하는 최소 장방형 영역들을 구조적 정보와 함께 추출할 수 있는 방법을 제안한다.
본 연구는 기하학적인 특징 추출을 기반으로 얼굴 영상에서 얼굴표정을 인식하는 방법을 제시한다. 얼굴표정은 3가지 그룹으로 제한한다(무표정, 기쁨, 놀람). 표정에 관련된 기본 특징들을 추출하기 위하여 얼굴표정정영상에서 눈높이, 눈폭, 입높이, 입폭을 추출하여 데이터를 분석한다. 분석결과로 눈높이, 입폭, 입높이가 표정을 분별하는 주요 특징으로 추출되었다. 각 표정별 눈높이, 입폭, 입높이의 평균과 표준편차를 구하여 표정별 표준 템플릿을 작성하였다. 표정인식 방법은 최소 근접 분류기(nearest neighbor classifier)를 사용하였다. 새로운 얼굴표정 영상과 표준 템플릿간의 유클리드 거리를 계산하여 새로운 표정에 대하여 83%인식률을 얻었다.
주식시장에서 KOSPI200지수의 상승 또는 하락으로 분류 및 예측하는 정보는 선물 및 옵션시장에서 포토폴리오를 설계할때 의사결정을 위해 중요한 기준이 된다. 경제지표인 시계열 패턴들의 향후 추세는 가장 최근의 경제패턴에 매우 종속적이기 때문에 최근의 패턴들을 가장 우선적으로 학습해야 할 필요가 있다. 본 논문에서는 시계열분석, 신경회로망, 그리고 다양한 분야에서 각광을 받고 있는 SVM(Support Vector Machine)과 Fuzzy SVM 모형의 분류 및 예측성능을 비교하였다. 특히 학습 DB에 따라 시계열성 속성을 갖는 퍼지소속함수에 가장 적합한 차원을 제시함으로서 Fuzzy SVM이 우수함을 입증하였다.
This paper shows the application of P-N Learning [4] method in the soccer ball detection and improvement for increasing the speed of processing. In the P-N learning, the learning process is guided by positive (P) and negative (N) constraints which restrict the labeling of the unlabeled data, identify examples that have been classified in contradiction with structural constraints and augment the training set with the corrected samples in an iterative process. But for the long-view in the soccer game, P-N learning will produce so many ferns that more time is spent than other methods. We propose that color histogram of each frame is constructed to delete the unnecessary details in order to decreasing the number of feature points. We use the mask to eliminate the gallery region and Line Hough Transform to remove the line and adjust the P-N learning’s parameters to optimize accurate and speed.