شبکه عصبی عمیق برای پیشبینی تعامل انسان در ویدئو با استفاده از روابط فازی و شار نوری
2020
پیشبینی تعامل در ویدئو یکی از موضوعات فعال در بینایی کامپیوتر است، که هدف آن پیشبینی تعامل قبل از انجام کامل آن است. این موضوع به دلیل چالشهای موجود در این زمینه هنوز مورد توجه است. در این مقاله یک شبکه عصبی عمیق برای پیشبینی تعامل با استفاده از روابط فازی و شار نوری ارائهشده است. نوآوری این روش ایجاد دو تصویر فازی از یک ویدئو است. این تصاویر فازی بر مبنای گرادیان و شار نوری ایجاد میشود. توابع عضویت فازی مناسب برای روابط مکانی بین افراد در حال تعامل در تصاویر گرادیان و شار نوری ایجاد شده است. از طرفی یک تابع عضویت فاصله برای ارزشدهی به فریمها و یک تابع عضویت فاصله برای ارزشدهی به ناحیهی بین افراد در حال تعامل تعریف شده است. سپس ویژگیهای مناسب مکانی-زمانی از این تصاویر با استفاده از معماری شبکه عصبی کانولوشن استخراجشده است. نتایج این روش بر روی دو مجموعه داده استاندارد تشخیص تعامل، BIT و UT ارزیابی شده است. نتایج نشان میدهد ایجاد تصاویر فازی و استخراج ویژگیهای عمیق از آن تصاویر باعث افزایش دقت پیشبینی تعامل نسبت به روشهای پیشین شده است.
- Correction
- Source
- Cite
- Save
- Machine Reading By IdeaReader
0
References
0
Citations
NaN
KQI