Merge-Weighted Dynamic Time Warping for Speech Recognition

2014 
从英语没被说的国家为很少使用的英语词和普通给定的名字获得训练材料由于过多的时间,存储和费用因素是困难的。由考虑个人隐私,有小说话者依赖者(SD ) 的 languageindependent (李) 自动语音识别(ASR ) 是一种方便选择解决这个问题。变弯的动态时间(DTW ) 算法是为为有有限存储和小词汇的即时应用的小脚印的 SD ASR 的最先进的算法。这些应用包括声音在车辆和机器人学上在移动设备,菜单驱动的识别,和声音控制上拨号。然而,传统的 DTW 有几限制,例如高计算的复杂性,限制导致的粗糙的近似,和不确问题。在这份报纸,我们介绍变弯的合并加权的动态时间(MWDTW ) 算法。这个方法为测量训练数据和严峻的数据合并的类似定义一个模板信心索引,当跟随核心 DTW 进程时。MWDTW 简单、有效、容易实现。与三代表性的 SD 语音识别数据集的广泛的实验,我们证明我们的方法超过 DTW,合并讲话数据上的 DTW,隐藏的 Markov 模型(唔) 显著地,并且总的来说也比 DTW 快六倍。
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []