• Info@SaminRay.Com
  • 88866172 021
644

مقدمه‌ای بر تشخیص چهره سه‌بعدی یا 3D-face recognition

تشخیص چهره به عنوان یکی از فعال‌ترین و چالشی‌ترین موضوعات تحقیقاتی شناخته می‌شوند که کاربردهای زیادی در زمینه‌های امنیتی، تائید هویت، نظارت خودکار و غیره دارد.

 

تشخیص چهره به عنوان یکی از فعال‌ترین و چالشی‌ترین موضوعات تحقیقاتی شناخته می‌شوند که کاربردهای زیادی در زمینه‌های امنیتی، تائید هویت، نظارت خودکار و غیره دارد. در چند سال گذشته، کارهای بسیاری در تشخیص چهره انجام شده است که بطور کلی می‌توان آن‌ها را بطور عمده به سه گروه تقسیم کرد: راهکارهای دو بعدی، راهکارهای سه‌بعدی و راهکارهای ترکیبی. اگرچه تحقیقات در حوزه‌ی تشخیص چهره دو بعدی در سال‌های اخیر پیشرفت‌های چشم‌گیری داشته است، اما دقت آن‌ها هنوز به شرایط نور محیط و وضعیت‌ یا pose چهره بستگی دارد. به دلیل وجود این مشکلات، الگوریتم‌های تشخیص چهره سه‌بعدی ارائه شدند. روند کلی روش‌های تشخیص چهره سه‌بعدی مانند روش‌های دو بعدی عبارتند از: اخذ اطلاعات از چهره، پیش‌پردازش، استخراج و تطبیق ویژگی. در مرحله تطبیق ویژگی، ویژگی‌های چهره هدف با چهره‌های ذخیره شده در پایگاه داده مقایسه می‌شوند و میزان تطبیق محاسبه خواهد شد. وقتی میزان تطبیق به اندازه کافی بالا بود، ادعا می‌شود چهره هدف شناسایی شده است.

  • اکتساب اطلاعات از چهره سه‌بعدی:

دستیابی به اطلاعات سه‌بعدی چهره نیاز به تجهیزات سخت‌افزاری ویژه‌ای دارد که با توجه به فناوری‌های مورد استفاده، می‌توان آن‌ها را به عنوان سیستم‌های اکتساب فعال (در این حالت نور نامرئی مانند پرتوهای لیزر مادون قرمز برای روشن کردن چهره هدف ساطع می‌شود و  سپس برای تعیین ویژگی‌های اجزای صورت، نورهای انعکاس شده جمع‌آوری می‌شوند) و سیستم‌های اکتساب غیرفعال (یک شبکه نوری مانند Kinect به صورت ساطع خواهد شد و سپس تغییر شکل الگوی نور اندازه‌گیری می‌شود تا شکل سطح محاسبه گردد) طبقه‌بندی کرد.

اسکنر Minolta vivid  که حساس به زوایای انتشار و دریافت پرتو لیزری است و همین‌طور Bumblebee XB3 (سیستم‌های تصویربرداری استریو) به ترتیب نمونه‌ای از سیستم‌های اکتساب فعال و غیرفعال به حساب می‌آیند. معمولاً سیستم‌های غیرفعال سرعت و دقت بالاتری نسبت به سیستم‌های فعال دارند.

  • پیش‌پردازش اطلاعات دریافت شده از چهره:

بعضی از ویژگی‌ها (گردن، مو، گوشواره، گردن‌بند و...) ممکن است فرایند تصمیم‌گیری را در الگوریتم‌های پیشرفته تشخیص چهره سه‌بعدی دچار مشکل کنند به همین دلیل باید پیش از فرایند استخراج ویژگی، حذف شوند. اولین مرحله پیش‌پردازش، تشخیص pose صورت انسان مبتنی بر تغییرات هندسی (چرخش) چهره نسبت به محور دوربین است. نمونه‌های داده‌های چهره از پیش‌پردازش شده اغلب در سه قالب تصویر عمق، ابر نقطه و مش قابل تفسیر هستند. این قالب‌ها در شکل 1 نشان داده شده‌اند.

               

مدل‌های سه‌بعدی تفسیر چهره

  • استخراج و تطبیق ویژگی:

ساده‌ترین روند استخراج ویژگی این است که کل صورت را به عنوان یک بردار ویژگی واحد در نظر بگیریم که به آن رویکرد جهانی یا global می‌گویند. در این روش، کل صورت در پایگاه داده ذخیره می‌شود و سپس در مرحله تطبیق ویژگی، چهره هدف با چهره‌های موجود در پایگاه داده با استفاده از توابع طبقه‌بندی آماری مقایسه می‌شود.

برخلاف رویکرد global، رویکردهای مبتنی بر ویژگی‌های محلی و عملگرهای گراف، متمرکز بر بینی و چشم‌ها هستند. هنگامی که یک چهره هدف برای شناسایی مورد بررسی قرار می‌گیرد، رویکردهای محلی و مبتنی بر عملگرهای گراف ابتدا بخش‌های مربوطه را از چهره‌ها استخراج و سپس مجموعه همسان قطعات را از پایگاه داده ویژگی جستجو خواهند کرد. از طرفی دیگر، رویکردهای ترکیبی نیز وجود دارند که ویژگی‌های مورداستفاده در رویکردهای جهانی و رویکردهای محلی را ترکیب می‌کند و با هزینه محاسباتی بیشتر، به دقت تشخیص بهتری دست می‌یابند.

  • معیارهای عملکردی در سیستم‌های شناسایی:

معیارهای عملکرد در این نوع سیستم‌ها مانند مسئلة طبقه‌بندی عبارت‌اند از:

TP: تعداد نمونه‌های کلاس مثبت که به‌عنوان کلاس مثبت پیش‌بینی شدند.

FN: تعداد نمونه‌های کلاس مثبت که به‌عنوان کلاس منفی پیش‌بینی شدند.

FP: تعداد نمونه‌های کلاس منفی که به‌عنوان کلاس مثبت پیش‌بینی شدند.

TN: تعداد نمونه‌های کلاس منفی که به‌عنوان کلاس منفی پیش‌بینی شدند.

معیار دقت نیز اشاره به نسبت بین تعداد نمونه‌هایی که به‌درستی طبقه‌بندی شده‌اند و تعداد کل نمونه‌ها برای مجموعه‌داده‌های آزمایش اشاره دارد. معیار دقت نشان‌دهنده توانایی قضاوت طبقه‌بند نسبت به کل نمونه‌ها است. به عبارت دیگر می‌توان معیار دقت را به‌صورت رابطه زیر مدل کرد.

با توجه به معیار دقت، می‌توان معیار خطا را هم مانند رابطه زیر در نظر گرفت:

معیار صحت یا در ادبیات مهندسی (درستی میانگین) نیز به نسبت نمونه‌های مثبت واقعی در نمونه‌هایی که توسط طبقه‌بندی‌کننده مثبت ارزیابی می‌شوند، اشاره دارد، یعنی اینکه چه تعداد از همه نمونه‌هایی که توسط طبقه‌بند مثبت ارزیابی می‌شوند، نمونه‌های مثبت واقعی هستند. این معیار به‌صورت رابطة زیر نشان داده شده است:

ارتباط بین معیار صحت و دقت را می‌توان در شکل زیر ارائه کرد:

ارتباط بین معیار صحت و دقت

بازخوانی یا recall به نسبت نمونه‌های مثبتی که طبقه‌بند به درستی در کل نمونه‌های مثبت قضاوت می‌کند، اشاره دارد. یعنی اینکه چه تعداد از همه نمونه‌های مثبت توسط طبقه‌بند به‌عنوان نمونه‌های مثبت طبقه‌بندی می‌شوند. رابطه بازخوانی در زیر نشان داده شده است:

معیار  به‌عنوان میانگین هارمونیک صحت و دقت به حساب می‌آید. این معیار در رابطه‌ی زیر نشان داده شده است:

مقدار β که عدد ثابت بزرگتر از صفر است، نشان‌دهنده اهمیت نسبی صحت و recall در ارزیابی عملکرد است. هنگامی که 1  β =در نظر گرفته شود، معیار رایج F1 یا F1-score ایجاد می‌شود.

 

 

وبلاگ

برچسب های مطالب