پایان نامه مقطع کارشناسی ارشد رشته فناوری اطلاعات

دانشگاه شیراز

دانشکده آموزشهای الکترونیکی

پایان ­نامه کارشناسی ارشد در رشته مهندسی فناوری اطلاعات (مدیریت سیستمهای اطلاعاتی)

عنوان:

ارائه مدلی برای سیستم­های توصیه گر در شبکه های مبتنی بر اعتماد

 استاد راهنما :

دکتر ستار هاشمی

برای رعایت حریم خصوصی نام نگارنده درج نمی گردد

تکه هایی از متن به عنوان نمونه :

فهرست مطالب:

فصل اول : مقدمه­ای بر انواع سیستم توصیه­گر…………………………………………………1

شما می توانید تکه های دیگری از این مطلب را در شماره بندی انتهای صفحه بخوانید              

1-1- مقدمه…………………………………………………………………………………………………………….2

1-2- سیستمهای توصیه­گر…………………………………………………………………………………………..3

1-3- انواع سیستمهای توصیه­گر از لحاظ عملکردی……………………………………………………4

1-4- مزایا و اهمیت یک سیستم توصیه­گر کارآمد………………………………………………………5

1-5- معایب و معضلات کلی سیستمهای توصیه­گر……………………………………………………..6

1-6- انواع رویکردها و مدلهای موجود در زمینه پیاده­سازی سیستمهای توصیه­ گر…….7

1-7- تشریح و اظهار مسئله……………………………………………………………………………………..11

1-8- اهداف پژوهش………………………………………………………………………………………………12

1-9- سوالات و فرضیه­های پژوهش…………………………………………………………………………….13

1-10- مراحل پژوهش…………………………………………………………………………………………………14

1-11- فصول پایان نامه……………………………………………………………………………………………..15

فصل دوم : مروری بر ادبیات پژوهش و مبانی نظری پژوهش………………………………17

2-1- مقدمه ………………………………………………………………………………………………………..18

2-2- پالایش گروهی (Collaborative Filtering)…………………………………………….

2-2-1- پالایش گروهی مبتنی بر حافظه(Memory Based)…………………………….

2-2-1-1- روش پالایش گروهی مبتنی بر آیتم ………………………………………………………22

2-2-1-2- امتیازدهی به صورت پیش فرض……………………………………………………………..24

2-2-1-3- تشدید حالت(Case Amplification)……………………………………………….

2-2-2- پالایش گروهی مبتنی بر مدل(Model Based)……………………………………..

2-3- پالایش محتوایی (Content Based Filtering) ………………………………………

2-4- تکنیکهای ترکیبی……………………………………………………………………………………27

2-5- سیستمهای توصیه­گر مبتنی بر ارتباط اعتماد میان کاربران……………………………..28

2-5-1- چگونگی کارکرد سیستم توصیه­گر مبتنی بر اعتماد……………………………………30

2-5-2- مزایا و معایب………………………………………………………………………………………..31

2-5-3- انتشار اعتماد و تجمیع اعتماد…………………………………………………………….33

2-6- چالش ها و محدودیتهای موجود……………………………………………………………….33

2-6-1- نقصان و کاستی اطلاعات…………………………………………………………………….34

2-6-2- مشکل کاربران تازه وارد……………………………………………………………………….34

2-6-3- کلاهبرداری و تقلب………………………………………………………………………………..35

2-6-4- پیچیدگی های محاسباتی و زمانی……………………………………………………….36

2-7- معیارهای ارزیابی سیستمهای توصیه­گر……………………………………………………….37

2-7-1- خطای جذر میانگین مربعات (RMSE)…………………………………………………….

2-7-2- معیار درصد پوشش……………………………………………………………………………38

2-7-3- معیار دقت………………………………………………………………………………………..39

2-7-4- معیار F-Measure…………………………………………………………………………………….

فصل سوم : مروری بر مطالعات و تحقیقات پیشین…………………………………………..41

3-1- مقدمه………………………………………………………………………………………………………42

3-2- مرور کارهای گذشته…………………………………………………………………………………42

3-2-1- مدل MoleTrust………………………………………………………………………………………

3-2-2- مدل TidalTrust………………………………………………………………………………………

3-2-3- مدل دانه سیب………………………………………………………………………………….48

3-2-4- مدل ارائه شده توسط Anderson……………………………………………………………

3-2-5- مدل ارائه شده توسط O’Donovan………………………………………………………..

3-2-6- مدل TrustWalker………………………………………………………………………………….

3-2-6-1- ساختار مدل TrustWalker…………………………………………………………………

3-2-6-2- تشابه آیتم ها……………………………………………………………………………….51

3-2-6-3- خصوصیات ویژه مدل TrustWalker…………………………………………………..

3-2-6-3-1- فراگیری و عمومیت مدل……………………………………………………………….52

3-2-6-3-2- اطمینان به نتایج حاصل………………………………………………………………..53

3-2-6-3-3- تفسیرپذیری و قابل توضیح بودن نتایج…………………………………………..54

3-2-6-4- نمایش ماتریسی مدل TrustWalker………………………………………………….

3-2-6-5- نتیجه گیری در خصوص مدل TrustWalker…………………………………….

فصل چهارم : تشریح مدل ترکیبی پیشنهادی و چگونگی توسعه و بهبود مدل پایه…..56

4-1- مقدمه………………………………………………………………………………………………57

4-2- تشریح مدل کلی TrustWalker…………………………………………………………………..

4-2-1- علائم نشانه گذاری و متغیرهای مدل…………………………………………………….57

4-2-2- طریقه یک پیمایش تصادفی در شبکه……………………………………………………58

4-2-3- انتخاب تصادفی یک کاربر ……………………………………………………………….59

4-2-4- انتخاب یک آیتم مشابه…………………………………………………………………….59

4-2-5- تشابه آیتم ها………………………………………………………………………………..60

4-2-6- محاسبه احتمال ماندن در یک گره شبکه اعتماد ( )………………………..61

4-2-7- چگونگی انجام پیش­بینی امتیاز…………………………………………………………62

4-2-8- چگونگی محاسبه احتمال ……………………………………………………………..63

4-2-9- چگونگی محاسبه عملی ………………………………………………………………..64

4-2-10- شرط اتمام کلی مدل……………………………………………………………………64

4-3- بهبود و توسعه مدل TrustWalker………………………………………………………………

4-3-1- بهره گیری از فرمول jaccard جهت محاسبه تشابه آیتمها………………………….66

4-3-2- حذف میانگین از فرمول پیرسون………………………………………………………….67

4-3-3- بهره گیری از تکنیک مبتنی بر آیتم خالص……………………………………………..67

4-3-4- تعدیل و تفسیر نظرات کاربران…………………………………………………………68

4-3-5- محاسبه دقیق مقدار اعتماد یا امتیاز ارتباط میان دو کاربر……………………….71

4-3-6- محاسبه ترکیبی امتیاز ارتباط میان کاربران………………………………………..73

فصل پنجم : تشریح طریقه انجام آزمایشات و نتایج حاصل………………………………76

5-1- مقدمه…………………………………………………………………………………………77

5-2- معرفی مجموعه داده epinions……………………………………………………………..

5-2-1- ویژگیهای مجموعه داده epinions…………………………………………………….

5-2-2- آماده سازی و نحوه پالایش داده­ها………………………………………………81

5-2-3- ایجاد مجموعه داده نمونه…………………………………………………………………83

5-3- مجموعه داده movielens………………………………………………………………..

5-3-1- ویژگیهای مجموعه داده movielens……………………………………………….

5-4- نیازمندیهای نرم افزاری………………………………………………………………………85

5-5- نیازمندیهای سخت افزاری………………………………………………………………….85

5-6- متدولوژی نرم افزاری…………………………………………………………………………86

5-7- پارامترهای پیش فرض انجام آزمایشات……………………………………………..86

5-8- نتایج اجرای آزمایشات با مجموعه داده epinions و movielens……………..

شما می توانید مطالب مشابه این مطلب را با جستجو در همین سایت بخوانید                     

5-8-1- مطالعه تاثیر عمق پیمایش بر روی نتایج حاصل در خصوص کاربران تازه وارد…87

5-8-2- مطالعه تاثیر تاریخ اعلام نظرات توسط کاربران…………………………………88

5-8-3- مطالعه تاثیر تغییر فرمول محاسبه تشابه آیتمها………………………………..89

5-8-4- مطالعه تاثیر بکارگیری مکانیزم تفسیر و تعدیل نظرات کاربران……………….90

5-8-5- مطالعه تاثیر بکارگیری انواع روشهای ترکیبی برای انتخاب کاربران و پیمایش شبکه…..93

5-8-5-1- نحوه محاسبه امتیاز ارتباط موجود میان کاربران……………………………………..93

5-8-5-2- مطالعه تاثیر بکارگیری روشهای ترکیبی در عملکرد سیستم برای تمامی کاربران…….94

5-8-5-3- مطالعه تاثیر بکارگیری روشهای ترکیبی در عملکرد سیستم برای کاربران تازه وارد …..99

5-8-6- مطالعه تاثیر بکارگیری توام مکانیزم تفسیر امتیازات کاربران به همراه بهره گیری از روشهای ترکیبی انتخاب کاربران و پیمایش شبکه اعتماد……………………………………101

5-9- انجام آزمایشات با مجموعه داده movielens…………………………………..

5-9-1- نتایج حاصل از اجرای روشهای ترکیبی مورد بهره گیری در مدل توسعه یافته……107

فصل ششم : نتیجه گیری نهایی و کارهای آینده…………………………………………….110

6-1- مقدمه…………………………………………………………………………………111

6-2- عملکرد مدل توسعه یافته……………………………………………………………..112

6-2-1- عملکرد مدل توسعه یافته در خصوص تمامی کاربران……………………….112

6-2-2- عملکرد مدل توسعه یافته در خصوص کاربران تازه وارد……………………114

6-3- نتیجه گیری نهایی ……………………………………………………………………115

6-3-1- تحلیل نهایی نتایج حاصل از انجام آزمایشات بر روی مجموعه داده epinions………..

6-3-2- تحلیل نهایی نتایج حاصل از انجام آزمایشات بر روی مجموعه داده movielens……..

6-4- پیشنهادات کارهای آینده……………………………………………………118

اختصارات……………………………………………………………………………………….120

فهرست منابع………………………………………………………………………………..121

چکیده:

امروزه با گسترش و رشد روز افزون اطلاعات در فضای مجازی و وجود انبوهی از کالا یا خدماتی که در وب سایتهای تجاری و خدماتی ارائه می­گردند کاربران را با این مشکل مواجه نموده می باشد که چگونه کالا یا خدمت مورد نظر خود را به راحتی و با صرف کمترین زمان ممکن بیابند. در این بین سیستمهای توصیه­گر با هدف تسهیل و یاری رساندن به کاربران در زمینه انتخاب و یافتن کالای مورد نیاز ایشان با بهره گیری از علوم و روشهای مبتنی بر داده کاوی اطلاعات، ایجاد و توسعه یافته­اند. همچنین در سالهای اخیر ظهور و گسترش شبکه­های اجتماعی و شبکه­های مبتنی بر ارتباط اعتماد میان کاربران، باعث گشوده شدن افق جدیدی در ارائه سیستمهای توصیه­گر و توسعه نسل جدیدی از اینگونه سیستمها گردیده می باشد و آنرا به یکی از موضوعات جذاب و مورد توجه محققان تبدیل نموده می باشد.

از میان روشها و مدل­های موجود در زمینه سیستمهای توصیه­گر روش پالایش گروهی به لحاظ سادگی پیاده­سازی از محبوبیت قابل ملاحظه­ای برخوردار می باشد اما این روش در ارائه پیشنهادات مناسب و قابل قبول به کاربران تازه وارد دارای ضعف­های جدی می­باشد. سیستمهای توصیه­گر مبتنی بر اعتماد، با بهره­گیری از ارتباط اعتماد میان کاربران، در جهت رفع نقاط ضعف اظهار شده و خصوصا ارائه پیشنهادات مناسب به کاربران تازه وارد گامهای موثری برداشته­اند. در این پژوهش کوشش شده می باشد تا از تلفیق و ترکیب روش­های موجود در زمینه پالایش گروهی و همچنین مدلهای مبتنی بر اعتماد و مطالعه نقاط ضعف و قوت آنها مدلی جدید و توسعه یافته ارائه گردد که در آن نتایج از خطای کمتر و دقت بالاتری برخوردار بوده و با افزایش معیار پوشش بتوان به درصد بیشتری از کاربران پاسخ مناسب ارائه نمود. برای این مقصود در میان انواع روشهای پالایش گروهی، روش مبتنی بر آیتم و برای پیمایش شبکه اعتماد میان کاربران نیز از روش پیمایش تصادفی بهره گرفته شده می باشد، همچنین با تفسیر و تعدیل نظرات کاربران و اتخاذ شیوه­ای مناسب جهت محاسبه مقدار دقیق اعتماد میان کاربران و تغییر در نحوه پیمایش شبکه اعتماد میان ایشان کوشش در بهبود و کاهش خطاهای نتایج گردیده می باشد. در نهایت، جهت ارزیابی و برآورد مدل ترکیبی ارائه شده، نتایج و آمارهای حاصل از اجرای مدل پیشنهادی بر روی مجموعه داده های Epinions و Movielens و مقایسه آنها با نتایج مدل پایه TrustWalkerبه عنوان یکی از بهترین مدلهای ترکیبی ارائه شده در زمینه سیستمهای توصیه گر مبتنی بر اعتماد، ارائه می­گردد.

فصل اول: مقدمه ای بر انواع سیستم های توصیه گر

1-1- مقدمه

گسترش سریع و روز افزون اطلاعات ارائه شده بر روی شبکه جهانی اینترنت، کاربران را با معضلات عدیده و قابل تاملی در خصوص انتخاب منابع و اطلاعات مورد نیاز ایشان مواجه نموده می باشد و چه بسا که بدون راهنمایی و هدایت صحیح، کاربران در اخذ تصمیمات صحیح یا انتخاب کالا و خدمات مورد نیازشان دچار اشتباه شده که این امر تبعات عدیده­ای مانند نارضایتی، سلب اطمینان کاربران و مشتریان سایتهای موجود بر روی اینترنت را به همراه خواهد داشت. از اینرو وجود ابزار و سیستمهایی برای کمک به کاربران در انتخاب اطلاعات مناسب و مورد نیاز ایشان کاملا ضروری به نظر می­رسد. در سالهای اخیر برای برآورده سازی این نیازها سیستمهای توصیه­گرمطرح و توسعه یافته­اند و الگوریتمها ، مقالات و متون علمی بسیار متنوع و مختلفی در این زمینه مطرح گردیده می باشد .

در این بین، ایجاد و گسترش شبکه­های اجتماعی، شبکه­های اعتماد و وجود انواع روابط میان کاربران این شبکه­ها افق جدیدی را برروی محققان و توسعه دهندگان سیستمهای توصیه­گر گشوده می باشد تا با بهره­گیری از علوم اجتماعی و علوم روان شناختی حاکم در این شبکه­ها و خصوصا وجود ارتباط اعتماد میان کاربران بتوانند نسل جدیدی از سیستمهای توصیه­گر را تحت عنوان “سیستمهای توصیه­گر مبتنی بر اعتماد[1]“معرفی و عرضه نمایند. این سیستمها قادر هستند تا به درصد بیشتری از کاربران پاسخ مناسب را ارائه دهند و همچنین نتایج آنها از دقت بالاتری برخوردار می­باشد.

با در نظر داشتن کثرت کاربران و افراد عضو شبکه­های مبتنی بر اعتماد و شبکه­های اجتماعی، همچنین تنوع رفتار و ویژگی­های ایشان، تنها یک شیوه یا یک مدل قادر به پاسخگویی و ارائه پیشنهادات دقیق و قابل قبول نمی­باشد که این امر باعث ظهور سیستمهای توصیه­گر ترکیبی[2]گردیده می باشد. در این سیستمها کوشش شده می باشد تا با ترکیب انواع مختلفی از سیستمهای توصیه­گر بتوان سیستمی تولید نمود که دارای مزایای حداکثری و معایب حداقلی باشد.

در این پایان­نامه کوشش شده می باشد تا با تغییر، اصلاح، تلفیق و ترکیب تعدادی از روشها و الگوریتم­های مطرح و قابل قبول در سطح جهانی، مدلی ارائه گردد که نسبت به مدل­های پیشین دارای دقت و درصد پوشش بالاتری باشد و همچنین بتواند نقایص مدلهای پیشین خصوصا در ارتباط با ارائه پیشنهاد به کاربران تازه وارد[3] را تا حد قابل قبولی مرتفع نماید.

1-2- سیستمهای توصیه ­گر

تعاریف متفاوتی برای سیستم‌های توصیه‌گر ارائه شده‌می باشد. عده­ای از محققان سیستمهای توصیه­گر را زیرمجموعه‌ای از سیستمهای تصمیم­یار[4] می‌دانند و آنها را سیستم‌های اطلاعاتی[5] تعریف می‌کنند که توانایی تحلیل رفتارهای گذشته و ارائه توصیه‌هایی برای مسائل جاری را دارا می­باشند[1]. به زبان ساده‌تر در سیستم‌های توصیه‌گر کوشش بر این می باشد تا با حدس زدن شیوه تفکر کاربر به کمک اطلاعاتی که از نحوه رفتار وی یا کاربران مشابه و نظرات آنها داریم مناسب‌ترین و نزدیک‌ترین کالا یا خدمت به سلیقه او را شناسایی و پیشنهاد کنیم. این سیستم‌ها در حقیقت کوشش دارند فرایندی را که ما در زندگی روزمره خود بکار می‌بریم و طی آن کوشش می‌کنیم تا افرادی با سلایق نزدیک به خود را پیدا کرده و از آنها در مورد انتخاب‌هایمان نظر بخواهیم را شبیه سازی نمایند.

به صورت کلی­تر سیستمهای توصیه­گر زیر مجموعه­ای از سیستمهای پالایش اطلاعات[6]هستند که وظیفه آنها جستجو برای اظهار پیش­بینی امتیاز(درجه)[7] یا اظهار سلایق و ترجیحات[8] یک کاربر در خصوص یک موضوع[9] ( مانند موسیقی، کتاب یا فیلم) یا یک عنصر اجتماعی مانند افراد و گروهها می­باشد[2]–[4].

1-3- انواع سیستمهای توصیه ­گر از لحاظ عملکردی

سیستمهای توصیه­گر به لحاظ نحوه ارائه نتایج و پیشنهادات به کاربران خود، به شیوه های متفاوتی اقدام می نمایند که در ذیل به پاره­ ای از آنها به صورت فهرست وار تصریح می­گردد:

– پیشنهاد لیستی متشکل از n کالا یا محصول برتر (معمولا n برابر 10 می باشد )

– پیشنهادات فصلی و موردی مانند پیشنهاد یک هتل دارای تخفیف جهت تعطیلات

– اظهار درصد علاقه­مندی سایر کاربران به یک محصول خاص، به عنوان مثال: “80 درصد کاربران از خرید این محصول راضی بوده اند “

پیش بینی میزان امتیازی که یک کاربر به یک محصول خاص خواهد داد

در این پژوهش کوشش در ایجاد مدلی می باشد که بتواند نظر و امتیاز تخصیص داده شده توسط یک کاربر خاص به یک محصول یا آیتم خاص را پیش­بینی نماید.

1-4- مزایا و اهمیت یک سیستم توصیه ­گر کارآمد

طبق آمار رسمی ارائه شده توسط سایت فروش کتاب Amazon[10] ، 35 درصد از فروش این سایت به واسطه وجود سیستم توصیه­گر و ارائه پیشنهادات مناسب به علاقه­مندان کتاب می باشد[5] همچنین سایت اجاره فیلم Netflix برای بهبود 10 درصدی دقت سیستم توصیه­گر خود موسوم به Cinematch[11]جایزه ای بالغ بر یک میلیون دلار برای محققان در نظر گرفته می باشد. هر دو مثال فوق نشان دهنده اهمیت سیستمهای توصیه­گر و تأثیر آنها در تجارت می­باشد. در ذیل تعدادی از علت های اهمیت وجود یک سیستم توصیه­گر مناسب و کارآمد در یک سایت تجارت الکترونیک برشمرده می­گردد:

– راهنمایی کاربران و بازدید کنندگان در انتخاب کالا ، محصول یا خدمت مناسب

– تسریع در زمان انتخاب کالای مورد نظر مشتری مانند انتخاب یک فیلم مناسب در میان میلیونها فیلم موجود در سایت

– جمع­ آوری اطلاعات ارزشمند در خصوص سلایق و رفتار کاربران جهت برنامه­ ریزی­ های آتی

– جذب مشتریان و بازدید کنندگانی که برای اولین بار می باشد از سایت بازدید می­کنند

– افزایش میزان رضایتمندی کاربران و طبیعتا افزایش سود سرمایه گذاران تجاری

– ایجاد احساس اطمینان در مشتری با ارائه آمار نظرات سایر کاربران

– بهبود معیارهای سنجش رتبه و درجه پورتال یا سایت

– در نظر داشتن جنبه­ های روان­شناختی کاربران

– افزایش آگاهی کاربر در زمینه مورد علاقه وی

[1] Trust-Based Recommendation Systems(TBRS)

[2] Hybrid Recommender System

[3] Cold Start Users

[4] Decision Support Systems(DSS)

[5] Information Systems(IS)

[6] Information Filtering Systems

[7] Ratings

[8] Preferences

[9] Item

[10]http://www.amazon.com

[11] http://www.netflixprize.com

***ممکن می باشد هنگام انتقال از فایل اصلی به داخل سایت بعضی متون به هم بریزد یا بعضی نمادها و اشکال درج نشود اما در فایل دانلودی همه چیز مرتب و کامل و با فرمت ورد موجود می باشد***

متن کامل را می توانید دانلود نمائید

زیرا فقط تکه هایی از متن پایان نامه در این صفحه درج شده (به گونه نمونه)

اما در فایل دانلودی متن کامل پایان نامه

 با فرمت ورد word که قابل ویرایش و کپی کردن می باشند

موجود می باشد

تعداد صفحه : 149

قیمت : چهارده هزار و هفتصد تومان