ИСПОЛЬЗОВАНИЕ ПРЕОБРАЗОВАНИЯ ГИЛЬБЕРТА-ХУАНГА ДЛЯ ФОРМИРОВАНИЯ МОДЕЛЕЙ ФОНЕМ РУССКОГО ЯЗЫКА В ЗАДАЧЕ РАСПОЗНАВАНИЯ РЕЧИ
2013
В статье исследуются возможности использования преобразования Гильберта-Хуанга для создания моделей фонем русского языка в системе преобразования речи в текст. Также производится сравнение предложенного метода с преобразованием Фурье и вейвлет-преобразованием. При проведении вычислительных экспериментов было обнаружено, что наибольшая производительность работы системы преобразования речи в текст достигается при выборе алгоритмов вейвлет-преобразования и Фурье-преобразования. При этом из этих двух алгоритмов наибольшей универсальностью в применении обладает вейвлет-преобразование. Расчеты показали, что метод Гильберта-Хуанга, несмотря на невосприимчивость к шумам и возможность выявления нелинейных изменений в сигнале, в первоначальном виде малопригоден для формирования признаков речевого сигнала (по крайней мере, в рамках нейросетевого подхода), качественно характеризующих его особенности при распознавании речи; для повышения качества его применения проводился смешанный анализ. Наилучшие результаты при распознавании фонем дали нейронные сети, обученные на речевых признаках, рассчитанных с применением вейвлет-преобразования и комбинированного варианта преобразования Гильберта-Хуанга и вейвлет-преобразования.
- Correction
- Source
- Cite
- Save
- Machine Reading By IdeaReader
0
References
0
Citations
NaN
KQI