رابطه (۲- ۲۸) yΓ۱ (x) = (hd + ht ) (۱ – )۲ – ux – x2 ; – w0/2 < x < 0
yΓ۲ (x) = (hd + ht ) (۱ – )۲ + ux – x2 ; ۰ < x < w0/2
yΓ۳ (x) = hd (۱ – )۲ ; – wi /۲ < x < wi /۲
yΓ۴ (x) = hc (۱ – )۲ ; – wi /۲ < x < wi /۲
yΓ۵ (x) = – (hd + hc) (1 – )۲ ; –w0/2 < x < w0/2
ناحیه حفرهی دهانی بین لب پایینی و بالایی ۲/۳ hiwi است. ناحیه لبها به صورت
w0 R= 2/3 h0w0 + ( uw0 /۱۲) میباشد. پارامترها برای بیضی مدل شده برای زبان yton، که مرکز عمودی از زبان، hton ارتفاع زبان، wton پهنای زبان هستند. مساحت قابل مشاهده از زبان /۴ htonwton π است. برای سادگی تمام سهمیها به یک کانتور R ∂ Γϵ از الگوی انعطافپذیر گروهبندی میشوند.
رابطه (۲- ۲۹) () = ( x , yΓ (x) )T = (x() ,y() )T
که ϵ [۰,۱] و N گره که,…..,N} 1} n ϵ .
الگوی انعطافپذیر سعی در مینیمم سازی انرژی دارد. انرژیها میتوانند وابسته به درهها[۳۸] یا قلههای نواحی در تصویر تعریف شوند.
رابطه (۲- ۳۰) Ev = () dA
یا روی لبههای تصویر به شکل رابطه (۲- ۳۱) تعریف شود.
رابطه (۲- ۳۱) Ee = () d
e () , Фv (Ф پتانسیلهای لبه و درهها از تصویر هستند.
انرژی محدودیت داخلی ۲ Econ= k/2 (w0 – λh0)2 ; λ میباشد. پارامترهایی همچون، , w0 , h0) θ) توسط تابع انرژی Ev و بقیه پارامترها توسط مینیمم سازی انرژی لبه Ee تنظیم میشوند.
یکی دیگر از روشها برای شناسایی دیداری صحبت روش مبتنی بر تصویر است که روش پایین به بالا نیز نامیده می شود. در واقع این روش مبتنی بر شدت روشنایی پیکسلهای تصویر است و هر گونه پردازشی روی این مقادیر شدت روشنایی صورت میگیرد و ویژگیها از آنها استخراج میشود.
۲- ۶ موجک هار[۳۹]
یکی از روشهای مبتنی بر تصویر DWT میباشد که کاربردهای زیادی در حوزه استخراج ویژگی به خصوص از تصویر دارد و یکی از ویژگیهای مؤثر در شناسایی تصاویر میباشد. که مستقیما از خود این ضرایب استفاده شده یا از سایر ویژگیها و مشخصهها که از این ضرایب استخراج می شود استفاده شده است. از دیگر کاربردهای ویولت حذف نویز از سیگنالها و تصاویر با حذف محدوده خاصی از ضرایب موجک و فشردهسازی تصاویر میباشد.
یکی از سادهترین انواع این تبدیل ، ویولت هار میباشد که در [۱۶] این روش به کار گرفته شده و لب با بهره گرفتن از این تبدیل قطعهبندی شده و بردارهای ویژگی از نتیجه آن استخراج می شود. قطعهبندی لب در چند مرحله صورت گرفته است.
۲- ۶- ۱ پیش پردازش
شرایط نوری برای نرمالیزه کردن سطح روشنایی در تصویر اصلی با تابع لگاریتمی به صورت زیر تغییر داده شده است.
رابطه (۲- ۳۲)
که f(x , y) تصویر اصلی و g(x,y) تصویر پیش پردازش شده است. مجموعه پارامترهای (k , d , t) برای کنترل موقعیت و شکل منحنی تنظیم شده اند. در این مطالعه به طور نسبی (۲، ۰٫۵، ۱۲) در نظر گرفته شده اند.
۲ – ۶ – ۲ تبدیل رنگی
رنگ لب و ناحیه پوست معمولاً همپوشانی دارند بنابراین فضای رنگی خاصی باید برای نشان دادن تغییرهای کوچک انتخاب شود. از آنجا که فاصله بین هر دو نقطه در فضای رنگی متناسب با تفاوت رنگ آنها است. یک فضای رنگی یکنواخت نیاز است. تصویر رنگی به فضای رنگی CIEL*u*v* و CIEL*a*b* تبدیل میکنیم. بردار رنگی{ L*,a*,b*,v*,u*} برای هر تصویر با بهره گرفتن از معادلههایی که در [۱۷] ارجاع داده شده است محاسبه می شود. در اینجا فقط پارامترهای{ a*, u *} استفاده شده است چون تفاوت اصلی بین لب و ناحیه چهره رنگ قرمز لب میباشد و در دو بردار انتخاب شده این رنگ مؤثرتر است.
۲ - ۶ – ۳ قطعه بندی [۴۰]
بعد از پیش پردازش و تبدیل تصویر به فضای رنگی ذکر شده در بالا فرایند قطعهبندی به صورت زیر انجام می شود.
-
- دو مؤلفه برداری { a*, u*} به یکدیگر اضافه شده و اندازه تصویر برای تطابق با تصویر اصلی تغییر می کند.
-
- تبدیل هار صورت گرفته و ضرب انجام شده است و چهار ماتریس مختلف ( dA ,dH ,dV ,dD) مشخص میشوند.
ماتریس dA برای استخراج ناحیه لب کافی میباشد. پس سه ماتریس دیگر در نظر گرفته نشده است و در نهایت فیلترینگ شکل شناسی[۴۱] و پس پردازش برای افزایش دقت بکار برده شده است. شکل لب با این روش استخراج شده و ویژگیهایی همچون پهنا و ارتفاع و زوایای گوشه لب و میانگین فاصله عمودی بین نقاط محاسبه می شود.
۲ – ۷ آنالیز مؤلفه های خاص
عملکرد این روش به این صورت است که ابتدا میانگین داده ها ( بر روی هر بعد) را از داده ها کم می کند و داده های جدید با میانگین صفر تولید مینماید. سپس ماتریس کوواریانس داده های جدید محاسبه می شود. بردارهای ویژه یکه ماتریس کوواریانس را میتوان به عنوان بردار ویژگیها در نظر گرفت زیرا به نوعی پراکندگی داده ها را نشان میدهد. داده های نهایی، با ضرب بردارهای ویژگی در داده های با میانگین صفر به دست میآیند.
آنالیز مؤلفه های خاص برای فشردهسازی و استخراج ویژگی استفاده می شود. در [۱۸] نمایش منیفلد[۴۲] بر اساس آنالیز مؤلفه های خاص برای شناسایی دیداری صحبت ارائه شده است. داده ویدیویی زمان واقعی توسط آنالیز مؤلفه های خاص فشرده شده و نقاط با بعد کم برای هر فریم که منیفلد را تعریف کند محاسبه میشوند. سیستم شناسایی شامل سه مرحله میباشد. در اولین گام تصویرها با بهره گرفتن از مؤلفه شبه رنگ[۴۳] از داده RGB لبها استخراج میشوند [۱۹] و با روش آستانهگیری[۴۴] مبتنی بر هیستوگرام[۴۵] یا سابقهنما لبها قطعهبندی میشوند. دومین گام تولید ماکزیمم انتظار[۴۶] منیفلدها و انجام درونیابی و نمونه گیری دوباره از منیفلدها میباشد. سومین گام کلاسهبندی منیفلدها است.
۲- ۷ – ۱ زمینه ریاضی EM – PCA
ماکزیمم انتظار آنالیز مؤلفه های خاص تعمیمی از روش آنالیز مؤلفه های خاص به وسیله ترکیب مزایای الگوریتم Em در بخشهای تخمین مقادیر ماکزیمم احتمال برای اطلاعات از دست رفته میباشد. این روش در دو مرحله مجزا صورت میگیرد.
مرحله E : W = (VT V)-1V-1A
مرحله : M Vnew = AWT(W WT )-۱
W ماتریس حالتهای مجهول وV بردار داده و A داده مشاهده است.
۲- ۷- ۲ تولید منیفلد از تصویر ورودی
لبها در هر فریم قطعهبندی شدند و داده سطح خاکستری اطراف ناحیه لب استخراج می شود و برای تولید فضایی با بعد کم توسط فرایند EM – PCA استفاده می شود. سپس، داده سطح خاکستری روی این فضا طرحریزی[۴۷] شده و برای هر فریم یک نقطه یا بردار با بعد کم محاسبه می شود. نقاط ویژگی به دست آمده بعد از طرحریزی داده روی فضای EM-PCA با بعد کم، با مرتبسازی فریمها به صورت افزایشی نسبت به زمان توسط چندین خط به هم متصل میشوند. در شکل (۲- ۶) میبینیم.
شکل ۲- ۶ فرایند تولید منیفلد
منیفلدها مستقیماً برای شناسایی دنباله تصویر نمی توانند استفاده شوند به این دلیل که تعداد فریمهای موجود در دنباله ورودی متغیر است و وابسته به پیچیدگی کلمهی بیان شده است. برای حل این مشکل نیاز به درونیابی منیفلدها برای دستیابی به یک سطح پیوسته و نمونه گیری مجدد آن به طور یکنواخت با بهره گرفتن از تعدادی نقاط کلیدی از پیش تعیین شده داریم.
برای درونیابی از نوار باریک مکعبی[۴۸] استفاده شده است. که استفاده از آن باعث ایجاد سطح یکنواخت برای منیفلد و کاهش اثر نویز می شود. در شکل (۲- ۷) نمونه درونیابی شده (a) و نمونه گیری شده (b) نشان داده شده است.