- Info@SaminRay.Com
- 88866172 021
مقدمهای بر تشخیص چهره سهبعدی یا 3D-face recognition
تشخیص چهره به عنوان یکی از فعالترین و چالشیترین موضوعات تحقیقاتی شناخته میشوند که کاربردهای زیادی در زمینههای امنیتی، تائید هویت، نظارت خودکار و غیره دارد.
تشخیص چهره به عنوان یکی از فعالترین و چالشیترین موضوعات تحقیقاتی شناخته میشوند که کاربردهای زیادی در زمینههای امنیتی، تائید هویت، نظارت خودکار و غیره دارد. در چند سال گذشته، کارهای بسیاری در تشخیص چهره انجام شده است که بطور کلی میتوان آنها را بطور عمده به سه گروه تقسیم کرد: راهکارهای دو بعدی، راهکارهای سهبعدی و راهکارهای ترکیبی. اگرچه تحقیقات در حوزهی تشخیص چهره دو بعدی در سالهای اخیر پیشرفتهای چشمگیری داشته است، اما دقت آنها هنوز به شرایط نور محیط و وضعیت یا pose چهره بستگی دارد. به دلیل وجود این مشکلات، الگوریتمهای تشخیص چهره سهبعدی ارائه شدند. روند کلی روشهای تشخیص چهره سهبعدی مانند روشهای دو بعدی عبارتند از: اخذ اطلاعات از چهره، پیشپردازش، استخراج و تطبیق ویژگی. در مرحله تطبیق ویژگی، ویژگیهای چهره هدف با چهرههای ذخیره شده در پایگاه داده مقایسه میشوند و میزان تطبیق محاسبه خواهد شد. وقتی میزان تطبیق به اندازه کافی بالا بود، ادعا میشود چهره هدف شناسایی شده است.
- اکتساب اطلاعات از چهره سهبعدی:
دستیابی به اطلاعات سهبعدی چهره نیاز به تجهیزات سختافزاری ویژهای دارد که با توجه به فناوریهای مورد استفاده، میتوان آنها را به عنوان سیستمهای اکتساب فعال (در این حالت نور نامرئی مانند پرتوهای لیزر مادون قرمز برای روشن کردن چهره هدف ساطع میشود و سپس برای تعیین ویژگیهای اجزای صورت، نورهای انعکاس شده جمعآوری میشوند) و سیستمهای اکتساب غیرفعال (یک شبکه نوری مانند Kinect به صورت ساطع خواهد شد و سپس تغییر شکل الگوی نور اندازهگیری میشود تا شکل سطح محاسبه گردد) طبقهبندی کرد.
اسکنر Minolta vivid که حساس به زوایای انتشار و دریافت پرتو لیزری است و همینطور Bumblebee XB3 (سیستمهای تصویربرداری استریو) به ترتیب نمونهای از سیستمهای اکتساب فعال و غیرفعال به حساب میآیند. معمولاً سیستمهای غیرفعال سرعت و دقت بالاتری نسبت به سیستمهای فعال دارند.
- پیشپردازش اطلاعات دریافت شده از چهره:
بعضی از ویژگیها (گردن، مو، گوشواره، گردنبند و...) ممکن است فرایند تصمیمگیری را در الگوریتمهای پیشرفته تشخیص چهره سهبعدی دچار مشکل کنند به همین دلیل باید پیش از فرایند استخراج ویژگی، حذف شوند. اولین مرحله پیشپردازش، تشخیص pose صورت انسان مبتنی بر تغییرات هندسی (چرخش) چهره نسبت به محور دوربین است. نمونههای دادههای چهره از پیشپردازش شده اغلب در سه قالب تصویر عمق، ابر نقطه و مش قابل تفسیر هستند. این قالبها در شکل 1 نشان داده شدهاند.
مدلهای سهبعدی تفسیر چهره
- استخراج و تطبیق ویژگی:
سادهترین روند استخراج ویژگی این است که کل صورت را به عنوان یک بردار ویژگی واحد در نظر بگیریم که به آن رویکرد جهانی یا global میگویند. در این روش، کل صورت در پایگاه داده ذخیره میشود و سپس در مرحله تطبیق ویژگی، چهره هدف با چهرههای موجود در پایگاه داده با استفاده از توابع طبقهبندی آماری مقایسه میشود.
برخلاف رویکرد global، رویکردهای مبتنی بر ویژگیهای محلی و عملگرهای گراف، متمرکز بر بینی و چشمها هستند. هنگامی که یک چهره هدف برای شناسایی مورد بررسی قرار میگیرد، رویکردهای محلی و مبتنی بر عملگرهای گراف ابتدا بخشهای مربوطه را از چهرهها استخراج و سپس مجموعه همسان قطعات را از پایگاه داده ویژگی جستجو خواهند کرد. از طرفی دیگر، رویکردهای ترکیبی نیز وجود دارند که ویژگیهای مورداستفاده در رویکردهای جهانی و رویکردهای محلی را ترکیب میکند و با هزینه محاسباتی بیشتر، به دقت تشخیص بهتری دست مییابند.
- معیارهای عملکردی در سیستمهای شناسایی:
معیارهای عملکرد در این نوع سیستمها مانند مسئلة طبقهبندی عبارتاند از:
TP: تعداد نمونههای کلاس مثبت که بهعنوان کلاس مثبت پیشبینی شدند.
FN: تعداد نمونههای کلاس مثبت که بهعنوان کلاس منفی پیشبینی شدند.
FP: تعداد نمونههای کلاس منفی که بهعنوان کلاس مثبت پیشبینی شدند.
TN: تعداد نمونههای کلاس منفی که بهعنوان کلاس منفی پیشبینی شدند.
معیار دقت نیز اشاره به نسبت بین تعداد نمونههایی که بهدرستی طبقهبندی شدهاند و تعداد کل نمونهها برای مجموعهدادههای آزمایش اشاره دارد. معیار دقت نشاندهنده توانایی قضاوت طبقهبند نسبت به کل نمونهها است. به عبارت دیگر میتوان معیار دقت را بهصورت رابطه زیر مدل کرد.
با توجه به معیار دقت، میتوان معیار خطا را هم مانند رابطه زیر در نظر گرفت:
معیار صحت یا در ادبیات مهندسی (درستی میانگین) نیز به نسبت نمونههای مثبت واقعی در نمونههایی که توسط طبقهبندیکننده مثبت ارزیابی میشوند، اشاره دارد، یعنی اینکه چه تعداد از همه نمونههایی که توسط طبقهبند مثبت ارزیابی میشوند، نمونههای مثبت واقعی هستند. این معیار بهصورت رابطة زیر نشان داده شده است:
ارتباط بین معیار صحت و دقت را میتوان در شکل زیر ارائه کرد:
ارتباط بین معیار صحت و دقت
بازخوانی یا recall به نسبت نمونههای مثبتی که طبقهبند به درستی در کل نمونههای مثبت قضاوت میکند، اشاره دارد. یعنی اینکه چه تعداد از همه نمونههای مثبت توسط طبقهبند بهعنوان نمونههای مثبت طبقهبندی میشوند. رابطه بازخوانی در زیر نشان داده شده است:
معیار بهعنوان میانگین هارمونیک صحت و دقت به حساب میآید. این معیار در رابطهی زیر نشان داده شده است:
مقدار β که عدد ثابت بزرگتر از صفر است، نشاندهنده اهمیت نسبی صحت و recall در ارزیابی عملکرد است. هنگامی که 1 β =در نظر گرفته شود، معیار رایج F1 یا F1-score ایجاد میشود.