ارائه الگوریتم جدید مبتنی بر مدل مخلوط گوسی با استفاده از ویژگیهای ضرایب کپسترال نرمالیزه شده توانِ بر مبنای فیلتر کاکلی در سیستم تصدیق هویت گوینده

2018 
در این مقاله، یک الگوریتم استخراج ویژگی مبتنی بر سیستم شنوایی، بر اساس یک تبدیل زمانی- فرکانسی به نام تبدیل شنوایی (AT) و ضرایب کپسترال نرمالیزه شده توان(PNCC)، که یک ویژگی موفق در زمینه تشخیص گفتار و گوینده بوده است، پیشنهاد می­گردد. به طور معمول عملکرد مدل­های صوتی که توسط داده­های بدون نویز(تمیز) آموزش داده می­شوند، وقتی در شرایط نویزی مورد آزمایش قرار می­گیرند به طور فزاینده­ای کاهش می­یابد. ویژگی پیشنهادی که ضرایب کپسترال نرمالیزه شده توان مبتنی بر فیلتر کاکلی (CFPNCC) نامیده ­می­شود تحت چنین شرایطی مقاومت بالایی را از خود بروز می­دهد. ویژگی بارز الگوریتم پیشنهادی ترکیب مزیت‌های فیلتر بانک کاکلی با مزایای ویژگی PNCC  است که مقاومت توأم در مقابل نویزهای ایستان و غیر ایستان را به همراه دارد. به­گونه‌ای که آزمایش‌های انجام‌شده بر روی پایگاه دادگان استاندارد SSC نشان می­دهد، در سیستم تصدیق گوینده مبتنی بر مدل مخلوط گوسی، این ویژگی بهتر از ویژگی PNCC عمل می­کند و به­طور کلی نسبت به سایر ویژگی­های متداول در زمینه تشخیص گوینده مانند MFCC و RASTA-PLP در شرایط نویزی نرخ خطای پایین­تری را داراست.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    0
    References
    0
    Citations
    NaN
    KQI
    []