ИСПОЛЬЗОВАНИЕ ПРЕОБРАЗОВАНИЯ ГИЛЬБЕРТА-ХУАНГА ДЛЯ ФОРМИРОВАНИЯ МОДЕЛЕЙ ФОНЕМ РУССКОГО ЯЗЫКА В ЗАДАЧЕ РАСПОЗНАВАНИЯ РЕЧИ

2013 
В статье исследуются возможности использования преобразования Гильберта-Хуанга для создания моделей фонем русского языка в системе преобразования речи в текст. Также производится сравнение предложенного метода с преобразованием Фурье и вейвлет-преобразованием. При проведении вычислительных экспериментов было обнаружено, что наибольшая производительность работы системы преобразования речи в текст достигается при выборе алгоритмов вейвлет-преобразования и Фурье-преобразования. При этом из этих двух алгоритмов наибольшей универсальностью в применении обладает вейвлет-преобразование. Расчеты показали, что метод Гильберта-Хуанга, несмотря на невосприимчивость к шумам и возможность выявления нелинейных изменений в сигнале, в первоначальном виде малопригоден для формирования признаков речевого сигнала (по крайней мере, в рамках нейросетевого подхода), качественно характеризующих его особенности при распознавании речи; для повышения качества его применения проводился смешанный анализ. Наилучшие результаты при распознавании фонем дали нейронные сети, обученные на речевых признаках, рассчитанных с применением вейвлет-преобразования и комбинированного варианта преобразования Гильберта-Хуанга и вейвлет-преобразования.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []