binominal
تاریخانقضا-تاریخشروع-تاریخصدور- تاریخ ایجادحادثه
date
شمارهبیمهنامه
text
۳-۲-۱۳-عملیات انتخاب ویژگیهای موثرتر
در برخورد با برخی از الگوریتمها که با بیشتر شدن تعداد ویژگی پیچیدگی بیشتری نیز پیدا میکنند، مانند درختهای تصمیم، svm، Regression و شبکه های عصبی باید از ویژگی های کمتری استفاده کنیم. درکل انتخاب ویژگی برای استفاده در الگوریتم های دسته بندی تکنیک کارآمدی است. دراینجا ازتکنیکهای کاهش ویژگی و یا وزن دهی استفاده کرده و فیلدهای منتخبی که وزن بیشتری را دارند به عنوان ورودی الگوریتمها انتخاب گردیدند.
با توجه به اینکه احتمال ارزش دهی به یک ویژگی در تکنیکهای مختلف متغیر است و ممکن است ویژگی خاصی توسط یک تکنیک باارزش قلمداد شده و توسط تکنیکی دیگر بدون ارزش تلقی شود، نتیجه تمام تکنیکها Union, شده و فیلدهای حاصل به عنوان ورودی الگوریتم مشخص گردید.
۳-۳-نتایج اعمال الگوریتم PCA و الگوریتم های وزن دهی
نتایج حاصل از این تکنیک ها در شکل های ۳-۲ الی۳-۵ نمایش داده شده است.
شکل ۳-۲: نتایج الگوریتمPCA
در ارزشدهی به ویژگی ها
شکل ۳-۳: نتایج الگوریتم SVM Weighting
در ارزشدهی به ویژگی ها
شکل ۳-۴: نتایج الگوریتم
Weighting Deviation در ارزشدهی به ویژگی ها
شکل ۳-۵: نتایج الگوریتم Weighting Correlation
در ارزشدهی به ویژگی ها
۳-۴-ویژگی های منتخب جهت استفاده در الگوریتمهای حساس به تعداد ویژگی
لازم به توضیح است در تمام الگوریتمهایی که از ۲۴ ویژگی جدول ۳-۸ استفاده شده است از تمام ویژگی ها نیز استفاده شده و نتایج با هم مقایسه گردیده اند و مشخص شد که وجود برخی ویژگی ها که در آن جدول قرار ندارند باعث کاهش دقت الگوریتم شده و در برخی الگوریتم ها نیز تفاوتی میان دو مقایسه مشخص نشد.
جدول ۳-۸: نتایج حاصل از اجتماع فیلدهای با بالاترین وزن در الگوریتمهای مختلف
نام فیلد
نوع فیلد
تعهدمازاد- تعهدبدنی- تعهدمالی- نوعپلاک- ظرفیت- تعدادسیلندر- سال ساخت- مدت بیمه- تعداد زیاندیدگان مصدوم- تعداد زیاندیدگان متوفی
Integer
شرحمورداستفاده- سیستم- نوعوسیلهنقلیه- بیمه گر زیاندیده اول
polynominal
دیرکردجریمه- کداضافهنرخحقبیمه- حقبیمهدریافتی- مالیات- حقبیمهسرنشین- حقبیمهثالثقانونی- مبلغ خسارت
real
بیمهنامهسالقبل- کارمندی- صادرهتوسط شعبه
binominal