سیستم پیشنهاد دهنده اطلاعات با بهره گرفتن از روش ترکیبی مدل غذایابی بهینه و رتبه­بندی سه­گانه روابط معنایی داده­های متصل

 

 

 

اسفندماه 1391

 

 

 

 

 

 

 

 

 

 

است.

 

چکیده، حجم عظیم داده­های موجود در داده­های پیوندی باعث شده است که کاربر نتواند داده­های مورد نیازش را در زمان مناسب پیدا کند. برای رفع این معضل، سیستم­های بیشماری به منظور گزینش داده­ ها طراحی و پیاده­سازی شده است که همچنان نتوانسته­اند دقت و کارایی مناسبی داشته باشند. سازگار کردن الگوریتم­های موجود با ورودی و شرایط داده­های پیوندی می ­تواند دقت این سیستم­ها را بالا برد.

 

در این پایان ­نامه، سیستم­ پیشنهادگری طراحی و پیاده­سازی می­شود که با ورودی­ و مشخصات داده­های پیوندی سازگار باشند. روش پیشنهادی از دو الگوریتم به نام­های نظریه غذایابی بهینه و رتبه­بندی سه­گانه استفاده می­ کند و داده­ ها را از نظر تناسب با موضوع مورد علاقه کاربر رتبه­بندی می­ کند. رتبه­بندی سه­گانه داده­های پیوندی را تحلیل کرده و میزان ارتباط آن داده را نسبت به یک موضوع خاص محاسبه می­ کند. سپس، نظریه غذایابی بهینه نتایج حاصل از رتبه­بندی سه­گانه را گزینش کرده و پس از مرتب­سازی به کاربر ارئه می­ کند. پیشنهادهای ارائه شده توسط این سیستم هم از ارزش معنایی مناسبی برخوردار است و هم اینکه با ساختار و چگونگی شیوه یافتن و دریافت اطلاعات در انسان هماهنگ است.

 

روش پیشنهادی با الگوریتم استاندارد رتبه­بندی سه­گانه بر روی پنح مجموعه داده­ دیبی­پدیا مقایسه شده است. ارزیابی­ها نشان می­دهد که دقت روش پیشنهادی از روش استاندارد رتبه­بندی سه­گانه بیشتر بوده است، با این وجود روش استاندارد از کارایی زمان اجرای بهتری برخوردار است.

 

کلیدواژه­ها: سیستم­های پیشنهادگر، داده­های پیوندی، نظریه غذایابی بهینه، رتبه­بندی سه­گانه

 

 

 

فهرست مطالب

 

عنوان                                                                                                                                  صفحه

 

فصل یکم: کلیات تحقیق

 

1-1 مقدمه. 1

 

1-2 موضوع تحقیق 2

 

1-3 اهداف تحقیق 4

 

1-4 اهمیت و ارزش تحقیق بر روی داده‌های پیوندی 5

 

1-5   ساختار تحقیق 5

 

فصل دوم: معرفی سیستم‌های پیشنهاد دهنده

 

2-1 مقدمه. 6

 

2-2 سیستم‌های پیشنهاد دهنده. 7

 

2-3 بررسی‌های تاریخی 7

 

2-4 طبقه بندی 8

 

2-4-1 روش‌های همبستگی 9

 

2-4-1-1 الگوریتم‌های مبتنی بر حافظه. 9

 

2-4-1-2 الگوریتم‌های مبتنی بر مدل 11

 

2-4-1-3 نقاط ضعف روش های فیلتر همبستگی 12

 

2-4-2 روش مبنی بر محتوا 12

 

2-4-3 روش‌های مبتنی بر دانش 13

 

2-4-4 روش‌های آماری 14

 

2-4-5 روش‌های مبتنی بر سودمندی 15

 

2-4-6 روش‌های ترکیبی 16

 

2-5 سیستم های پیشنهاد دهنده مبتنی بر داده‌های پیوندی 17

 

2-6 جمع بندی 20

 

فصل سوم: مروری بر داده‌های پیوندی و نظریه غذایابی

 

3-1 مقدمه. 24

 

3-2 ایده اصلی RDF 23

 

3-2-1 منابع 24

 

3-2-2 ویژگی‌ها 25

 

3-2-3 گزاره‌ها 25

 

3-2-4 نمونه یک گزاره. 26

 

3-3 داده پیوندی 27

 

3-3-1 پشته تکنولوژی داده پیوندی 28

 

 

 

 

 

 

 

عنوان                                                                                                                                   صفحه

 

3-3-3 پروژه داده‌های باز پیوندی 29

 

3-3-4 انتخاب شناسه های همسان منابع و واژه نامه‌های RDF 30

 

3-4 نظریه ی چرای بهینه. 31

 

3-5 مدل محدوده­های وصله­ای 32

 

3-6 نظریه مقدار مرزی کارنوف. 34

 

3-7 مدل رژیم غذایی بهینه. 34

 

3-7-1 شرح مسئله روباه. 35

 

3-7-2 ساده سازی مسئله روباه. 35

 

3-7-3 روباه آسان­گیر. 36

 

3-7-4 روباه سخت­گیر. 37

 

3-7-5 روباه حسابگر. 37

 

3-8 مدل ریاضی انتخاب غذای بهینه. 37

 

3-9 الگوریتم انتخاب رژیم بهینه. 38

 

3-10 اصول انتخاب رژیم غذایی بهینه. 39

 

3-11 جمع­بندی 40

 

فصل چهارم: پیاده سازی مدل ترکیبی رتبه‌بندی سه‌گانه بهینه شده و غذایابی بهینه

 

4-1 مقدمه. 41

 

4-2 مدل رتبه‌بندی سه‌گانه. 43

 

4-2-1 جمع آوری داده ها 44

 

4-2-2 ساخت تنسور معادل گراف. 45

 

4-2-3 پیش پردازش 45

 

4-2-3-1 کاهش حجم داده ها از راه حذف خصوصیات غالب. 46

 

4-2-3-2 وزن­دهی خصوصیات. 47

 

4-2-4 تحلیل پارافک 47

 

4-3 تحلیل روش رتبه‌بندی سه‌گانه. 49

 

4-3-1 مرحله پیش پردازش 49

 

4-3-2 عملیات حذف. 49

 

4-3-3 عملیات وزن دهی 51

 

4-4 دسته بندی خصوصیات بر اساس دامنه. 52

 

4-4-1 خصوصیات تعریف شده در استاندارد RDF 52

 

4-4-2 خصوصیات تعریف شده درسطح منبع داده. 53

 

4-4-3 خصوصیات تعریفی یک حوزه خاص 54

 

 

 

 

 

عنوان                                                                                                                                   صفحه

 

4-4-4 مثالی از دسته­بندی خصوصیات. 54

 

4-4-5 رابطه تکرار خصوصیات با اهمیت آنها در موضوع. 55

 

4-4-6 خصوصیات ابهام آمیز. 56

 

4-4-7 خصوصیات زائد. 56

 

4-4-8  نتیجه بررسی خصوصیات. 57

 

4-5 اعمال پیش پردازش بر روی اسناد RDF 57

 

4-5-1 امتیازدهی و حذف خصوصیات. 58

 

4-5-2 انباره­ی خصوصیات از پیش تعریف شده. 58

 

4-5-3 امتیازدهی خصوصیات. 59

 

4-5-4 وب به عنوان  منبع امتیازدهی خصوصیات. 59

 

4-5-5 امتیازدهی پویا 62

 

4-5-6 ارسال جستار به گوگل 62

 

4-5-7 آماده سازی کلیدواژه های جستجو. 62

 

4-5-8 رفع ابهام از جستار. 63

 

4-5-9 پردازش صفحات بازگشتی 63

 

4-5-10 تحلیل آماری صفحات وب و محاسبه امتیاز خصوصیات. 64

 

4-6 تحلیل پارافک 65

 

4-7 افزودن خصوصیات جدید به انباره خصوصیات حذفی 67

 

4-8 کاربرد نظریه غذایابی بهینه در سیستم 68

 

4-9 تغییرات مورد نیاز روش انتخاب رژیم بهینه. 68

 

4-9-1 کاهش شباهت و تعداد نمونه ها با پیش پردازش 69

 

4-9-2 استفاده از نمونه به جای نوع. 70

 

4-10 تعریف بهره، هزینه و سودمندی 71

 

4-11 تنظیم الگوریتم و کنترل خروجی­ها 72

 

4-12 تحلیل عملکرد الگوریتم 72

 

4-13 جمع­بندی 72

 

فصل پنجم: پیاده سازی و ارزیابی

 

5-1 مقایسه نتایج با پیش پردازش استاندارد. 74

 

5-2 پیاده سازی 75

 

5-3 مقایسه عملیات پیش پردازش در دو روش 75

 

5-4 مقایسه نتایج نهایی 77

 

5-5 کارایی زمان اجرا 83

 

 

 

عنوان                                                                                                                                   صفحه

 

5-6 مقایسه نتایج پردازش شده و بدون پردازش با نظریه انتخاب بهینه رژیم غذایی 83

 

5-7 بررسی بیشترین داده­های قابل ارائه. 84

 

5-8 جمع­بندی 85

 

فصل ششم: نتیجه گیری و کارهای آینده

 

6-1 خلاصه راهکارهای ارائه شده. 86

 

6-2 راهکارهایی برای ادامه پژوهش 88

 

منابع و ماخذ 90

 

 

 

 

 

فهرست شکل­ها

 

عنوان                                                                                                                                   صفحه

 

شکل 1-1: ساختار انتزاعی داده‌های پیوندی 2

 

شکل 1-2: یک مدل از روابط در داده‌های پیوندی 3

 

شکل 2-1: ماتریس شباهت کاربران در روش همبستگی 11

 

شکل 2-2 :تعریف پروفایل کاربر در قالب FOAF 17

 

شکل 2-3 : معماری سیستم پیشنهادگر بر پایه FOAF 18

 

شکل 2-4 یک نمونه از پیشنهاد دهی دیبیرک. 19

 

شکل 2-5 یک نمونه از ارائه دلایل مربوط به یک پیشنهاد در دیبیرک. 19

 

شکل 3-1: نمونه ای از پیوندهای RDF 24

 

شکل 3-2: یک گزاره متشکل از دو منبع و یک صفت سازنده یک رابطه. 25

 

شکل 3-3: گزاره “امید رفیعی مالک صفحه وب است”. 26

 

شکل 3-4: نمونه یک RDF در قالب  XML 26

 

شکل 3-5 : شمایی از ابر داده های باز متصل در مارچ 2009. 30

 

شکل 3-6: مدل جستجوی غذا در بین محدوده ها توسط یک چرنده. 32

 

شکل 3-7: الگوریتم انتخاب رژیم غذایی بهینه. 39

 

شکل 4-1: مدل رتبه‌بندی سه‌گانه. 43

 

شکل 4-2: یک گراف ساده معنایی 44

 

شکل 4-3: تنسور معادل گراف معنایی شکل 4-2. 45

 

شکل 4-4: تجزیه تنسور T به 3 ماتریس عامل 48

 

شکل 4-5: یک RDF ساده  با خاصیت resource. 52

 

شکل 4-6: یک RDF ساده  با خاصیت type. 53

 

شکل 4-7: یک RDF ساده با خاصیت wordnet_type. 53

 

موضوعات: بدون موضوع  لینک ثابت


فرم در حال بارگذاری ...