روش viola-jones در تشخیص چهره

یکی از مهم ترین فعالیت های انجام شده در تشخیص چهره روش viola-jones در سال های 2001 و 2004 می باشد. که این روش بسیار موفق و سریع بشمار می آید.

viola و jones الگوریتم AdaBoost را با Cascade برای تشخیص چهره ترکیب کردند. الگوریتم پیشنهادی آنها می توانست چهره را داخل یک تصویر 288*384 با صرف زمانی معادل 0.067 ثانیه تشخیص بدهد. یعنی 15 بار سریع تر از آشکار سازی های state-of-the-art با دقتی بالاتر ،به طوری که این الگوریتم یکی از پیشرفته ترین الگوریتم های ماشین بینایی در دهه ی گذشته تا به حال بوده است. نقش AdaBoost در این الگوریتم به این صورت می باشد که در ابتدا تصویر مورد نظر به زیر تصاویر(24*24) تقسیم بندی می شود. هر دیر تصویر بیانگر یک بردار ویژگی می باشد. به دلیل اینکه محاسبات موثر و کارآمد باشد از یک سری ویژگی های خیلی ساده استفاده می کنیم. تمام مستطیل های ممکن داخل زیر تصویر بررسی می شوند، در هر مستطیل 4 نمونه ویژگی به کمک ماسک هایی که در شکل زیر آمده استخراج می شود. (4 ماسک ویژگی که برای هر مستطیل استفاده می شود.)

با هر یک از این ماسک ها، مجموع پیکسل های سطح خاکستری در نواحی سفید از مجموع پیکسل های نواحی سیاه، کم می شود، که این مقدار به عنوان یک ویژگی دز نظر گرفته می شود. پس می توانیم به این صورت بگوییم که داخل یک زیر تصویر (24*24) بالغ بر یک میلیون ویژگی می توانیم داشته باشیم ( البته این ویژگی ها خیلی سریع محاسبه می شوند و می توانند کمتر از یک میلیون ویژگی هم باشند مثلا" 160000 در هر زیر تصویر)

هر ویژگی به عنوان یک یادگیرنده ی ضعیف در نظر گرفته می شود یعنی :

الگوریتم یادگیری پایه تلاش می کند که بهترین کلاسیفایر ضعیف را که، کوچک ترین خطا را در کلاس بندی دارد پیدا کند.

مستطیل های چهره را به عنوان مثال های Positive در نظر می گیریم. ( مثال های آموزشی مثبت )

و مستطیل هایی که شامل تمام چهره نمی شوند، به عنوان مثال های آموزشی Negative تلقی می شوند. سپس الگوریتم AdaBoost را اعمال می کنیم، ایشان تعدادی یادگیرنده ی ضعیف را بر می گردانند، که هر کدام از اینها مربوط به یکی از یک میلیون ویژگی هایی هست که داریم. در واقع اینجا، AdaBoost می تواند به عنوان یک ابزار برای انتخاب ویژگی در نظر گرفته شود.

در ابتدا دو ویژگی و موقعیت مربوط به آنها در چهره انتخاب می شود. که هر دو ویژگی بصری هستند، که اولین ویژگی اختلاف مقدار شدت روشنایی نواحی چشم و قسمت های پایین تر از آن را اندازه گیری می کند و دومین ویژگی اختلاف مقدار شدت روشنایی نواحی چشم ها با نواحی بین چشم ها را اندازه می گیرد. با استفاده از ویژگی های انتخاب شده، یک درخت نا متعادل ساخته می شود که به آن کلاسیفایر Cascade می گویند. به شکل های ریر دقت کنید:

پارامتر در Cascade به طوری تنظیم می شود که در هر نود درخت، ما یک انشعاب not a face داریم و به این معنی است که، تصویر یک تصویر چهره نبوده و یا به عبارت دیگر نرخ false negative در حال به حداقل رسیدن می باشد. ایده ی این طرح در واقع شناسایی زودتر تصویر غیر چهره می باشد. به طور متوسط در هر زیر تصویر 10 تا ویژگی را مورد بررسی قرار می دهیم. انجام یک سری آزمایش viola-jones بر روی تصاویر:

منابع:

P. Viola and M. Jones, "Robust Real-time Face Detection," presented at Eighth IEEE International Conference on Computer Vision, vol. 2,pp. 747,January 2001. [

P. Viola, M. J. Jones, and D. Snow, "Detecting Pedestrians Using Patterns of Motion and Appearance," presented at Proceedings of the Ninth IEEE International Conference on Computer Vision(ICCV’03), 2003.

http://mathworks.ir/forum/9----/3256------

mahsa یکشنبه 8 اسفند 1395 ساعت 18:03

FER: Facial Expression Recognition

FER: Facial Expression Recognition