ارائه الگوریتم جدید مبتنی بر مدل مخلوط گوسی با استفاده از ویژگیهای ضرایب کپسترال نرمالیزه شده توانِ بر مبنای فیلتر کاکلی در سیستم تصدیق هویت گوینده
2018
در این مقاله، یک الگوریتم استخراج ویژگی مبتنی بر سیستم شنوایی، بر اساس یک تبدیل زمانی- فرکانسی به نام تبدیل شنوایی (AT) و ضرایب کپسترال نرمالیزه شده توان(PNCC)، که یک ویژگی موفق در زمینه تشخیص گفتار و گوینده بوده است، پیشنهاد میگردد. به طور معمول عملکرد مدلهای صوتی که توسط دادههای بدون نویز(تمیز) آموزش داده میشوند، وقتی در شرایط نویزی مورد آزمایش قرار میگیرند به طور فزایندهای کاهش مییابد. ویژگی پیشنهادی که ضرایب کپسترال نرمالیزه شده توان مبتنی بر فیلتر کاکلی (CFPNCC) نامیده میشود تحت چنین شرایطی مقاومت بالایی را از خود بروز میدهد. ویژگی بارز الگوریتم پیشنهادی ترکیب مزیتهای فیلتر بانک کاکلی با مزایای ویژگی PNCC است که مقاومت توأم در مقابل نویزهای ایستان و غیر ایستان را به همراه دارد. بهگونهای که آزمایشهای انجامشده بر روی پایگاه دادگان استاندارد SSC نشان میدهد، در سیستم تصدیق گوینده مبتنی بر مدل مخلوط گوسی، این ویژگی بهتر از ویژگی PNCC عمل میکند و بهطور کلی نسبت به سایر ویژگیهای متداول در زمینه تشخیص گوینده مانند MFCC و RASTA-PLP در شرایط نویزی نرخ خطای پایینتری را داراست.
- Correction
- Source
- Cite
- Save
- Machine Reading By IdeaReader
0
References
0
Citations
NaN
KQI