PCA-optimized 필터뱅크 기반의 MFCC 특징파라미터 추출 및 한국어 4연숫자 전화음성에 대한 인식실험

2004 
각형 형태의 필터를 사용한다. 그러나 더 나은 인식성능을 위해 훈련 음성데이터의 스펙트럼에 PCA 를 적용하여 필터뱅크의 필터형태를 최적화하는 PCA-optimized 필터뱅크 방법이 Lee et al. 에 의해 제안되었다. 본 논문에서는 대용량의 4연숫자 전화음성 DB 를 사용하여 PCA-optimized 필터뱅크 기반의 MFCC 특징 파라미터를 추출하고 인식실험을 수행한 후, 기존의 삼각형 형태의 필터를 사용 하는 MFCC 와 각 대역별 로그에너지로 가중시켜서 얻어지는 MFCC 와의 인식성능을 비교하였다 실험결과, PCA -optimized 필터뱅크 기반의 MFCC 특정파라미터가 기존의 삼각형 형태의 필터뱅크 기반 MFCC 에 비해 조금 향상된 인식률을 나타내었지만, 각 대역별 로그에너지로 가중치를 주어 얻어지는 MFCC 보다는 인식률이 떨어졌다.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []