پيشنهاد چارچوبي جهت تشخيص علل تاثيرگذار و درصد تاثير آنها در سود و زيان بيمه با داده كاوي

پنجشنبه ۲۷ مهر ۹۶ | ۰۴:۳۰ ۱۳ بازديد

پيشنهاد چارچوبي جهت تشخيص علل تاثيرگذار و درصد تاثير آنها در سود و زيان بيمه با داده كاوي

دسته: رشته فناوري اطلاعات (IT)
بازديد: 5 بار
فرمت فايل: doc
حجم فايل: 1305 كيلوبايت
تعداد صفحات فايل: 114

هدف از اين پايان‌نامه پيشنهاد چارچوبي جهت تشخيص علل تاثيرگذار و درصد تاثير آنها در سود و زيان بيمه با داده كاوي در شركت سهامي بيمه ايران مي باشد

قيمت فايل فقط 85,000 تومان

دانلود پايان‌نامه كارشناسي ارشد مهندسي فناوري اطلاعات

پيشنهاد چارچوبي جهت تشخيص علل تاثيرگذار و درصد تاثير آنها در سود و زيان بيمه با داده كاوي

(مطالعه موردي: شركت سهامي بيمه ايران)

چكيده

بررسي اطلاعات بيمه هاي اتومبيل نشان داده عواملي چون نوع استفاده خودرو، داشتن گواهينامه رانندگي، نوع گواهينامه و تطابق يا عدم تطابق آن با وسيله نقليه، مبلغ حق بيمه، ميزان تعهدات بيمه نامه، كيفيت خودروي خودرو سازان، سن راننده، سواد راننده، عدم تطابق حق بيمه با مورد بيمه، تاخيردرتمديد بيمه نامه، در سود و زيان شركت هاي بيمه تاثير داشته اند.

هدف اين پايان نامه شناخت عوامل اثرگذار و ضريب تاثير آنها در سود و زيان بيمه شخص ثالث خودرو شركت هاي بيمه با استفاده از روش داده كاوي و سپس انتخاب الگوريتمي كه بهترين ميزان دقت پيش بيني براي تشخيص اين عوامل را داشته اند مي باشد.نتيجه حاصل از اين پژوهش نشان مي دهد كه روشهاي داده كاوي با استفاده از الگوريتم هاي دسته بندي با دقت بالاي 91% و الگوريتم هاي درخت تصميم با دقت بالاي 96% و الگوريتم هاي خوشه بندي با ايجاد خوشه هاي قابل قبول قادر به ارائه مدلي براي تشخيص عوامل اثرگذار و تعيين ميزان اثر آنها در سود و زيان بيمه نامه شخص ثالث خودرو خواهند بود.

كليدواژگان:

داده كاوي

سود و زيان

بيمه شخص ثالث خودرو

مقدمه

شركتهاي تجاري و بازرگاني براي ادامه بقا و حفظ بازار همواره بر سود دهي و كاهش ضرر و زيان خود تاكيد دارند از اين رو روشهاي جذب مشتري و همچنين تكنيكهاي جلوگيري يا كاهش زيان در سرلوحه كاري اين شركتها قرار مي گيرد. از جمله شركتهايي كه بدلايل مختلف در معرض كاهش سود و يا افزايش زيان قرار مي گيرند شركتهاي بيمه اي مي باشند. عواملي همچون بازاريابي، وفاداري مشتريان، نرخ حق بيمه، تبليغات، تقلب، مي تواند باعث جذب يا دفع مشتري گردد كه در سود و زيان تاثير مستقيم و غير مستقيم دارد. پرداخت خسارت نيز به عنوان تعهد شركتهاي بيمه منجر به كاهش سود و در بعضي موارد موجب زيان يك شركت بيمه مي شود. خسارت مي تواند بدلايل مختلف رخ دهد و يا عملي ديگر به گونه اي خسارت جلوه داده شود كه در واقع اينچنين نيست[Derrig et. al 2006].

عواملي از قبيل فرهنگ رانندگي، داشتن گواهينامه رانندگي، نوع گواهينامه و تطابق يا عدم تطابق آن با وسيله نقليه، جاده هاي بين شهري و خيابانهاي داخل شهر كه شهرداري ها و ادارات راه را به چالش مي كشد، تقلب، وضعيت آب و هوا، كيفيت خودروي خودرو سازان، سن راننده، سواد راننده، عدم تطابق حق بيمه با مورد بيمه [Wilson 2003]، روزهاي تعطيل، مسافرتها و بسياري موارد ديگر مي توانند موجب خسارت و در نهايت افزايش زيان يك شركت بيمه اي گردند. بيمه صنعتي سودمند، ضروري و مؤثر در توسعه اقتصادي است. اين صنعت بدليل «افزايش امنيت در عرصه هاي مختلف زندگي و فعاليتهاي اقتصادي»، «افزايش سرمايه گذاري و اشتغال و رشد اقتصادي» و « ارتقاي عدالت اقتصادي و كاهش فقر ناشي از مخاطرات »، حائز جايگاه مهمي در پيشرفت و تعالي يك كشور است.

با وجود نقش مهم بيمه در بسترسازي و تأمين شرايط مساعد اقتصادي، وضعيت كنوني اين صنعت در اقتصاد ملي با وضعيت مطلوب آن فاصله زيادي دارد. عدم آشنايي عمومي و كم بودن تقاضا براي محصولات بيمه اي، دانش فني پايين در عرصه خدمات بيمه اي، عدم تطابق ريسك با حق بيمه، تفاوت فاحش در مقايسه معيارهاي تشخيص ريسك بيمه شخص ثالث با نوع بيمه معادل در كشورهاي توسعه يافته، وجود نارسايي ها در مديريت واحدهاي عرضه بيمه از دلايل عدم توسعه مناسب اين صنعت در كشور است. از آنجا كه بشر در طول تاريخ به كمك علم و تجربه رستگاري ها و توفيقات فراواني كسب كرده است، نگاه علمي تر به مشكلات اين صنعت و يافتن راه حل در بستر علم مي تواند راه گشا باشد. امروزه بوسيله روشهاي داده كاوي ارتباط بين فاكتورهاي مختلف موثر يا غير موثر در يك موضوع مشخص مي شود و با توجه به اينكه داده كاوي ابزاري مفيد در استخراج دانش از داده هاي انبوه مي باشد كه ارتباطات نهفته بين آنها را نشان مي دهد، شركتهاي تجاري بازرگاني رو به اين تكنيكها آورده اند. داده كاوي محدود به استفاده از فناوري ها نيست و از هرآنچه كه برايش مفيد واقع شود استفاده خواهد كرد. با اين وجود آمار و كامپيوتر پر استفاده ترين علوم و فناوري هاي مورد استفاده داده كاوي است.

فهرست مطالب

فصل اول: كليات

1-1 تعريف داده كاوي 3

1-2 تعريف بيمه 4

1-3 هدف پايان نامه 4

1-4 مراحل انجام تحقيق 4

1-5 ساختار پايان نامه 5

فصل دوم: ادبيات موضوع و تحقيقات پيشين

2-1 داده كاوي و يادگيري ماشين 7

2-2 ابزارها و تكنيك هاي داده كاوي 8

2-3 روشهاي داده كاوي 9

2-3-1 روشهاي توصيف داده ها 10

2-3-2 روشهاي تجزيه و تحليل وابستگي 10

2-3-3 روشهاي دسته بندي و پيشگويي 10

2-3-4 درخت تصميم 11

2-3-5 شبكه عصبي 12

2-3-6 استدلال مبتني بر حافظه 12

2-3-7 ماشين هاي بردار پشتيباني 13

2-3-8 روشهاي خوشه بندي 13

2-3-9 روش K-Means 13

2-3-10 شبكه كوهنن 14

2-3-11 روش دو گام 14

2-3-12 روشهاي تجزيه و تحليل نويز 14

2-4 دسته هاي نامتعادل]صنيعي آباده 1391[. 15

2-4-1 راهكار مبتني بر معيار 15

2-4-2 راهكار مبتني بر نمونه برداري 15

2-5 پيشينه تحقيق 16

2-6 خلاصه فصل 19

فصل سوم: شرح پژوهش

3-1 انتخاب نرم افزار 21

3-1-1 Rapidminer 21

3-1-2 مقايسه RapidMiner با ساير نرم افزار هاي مشابه 21

3-2 داده ها 25

3-2-1 انتخاب داده 25

3-2-2 فيلدهاي مجموعه داده صدور 25

3-2-3 كاهش ابعاد 25

3-2-4 فيلدهاي مجموعه داده خسارت 29

3-2-5 پاكسازي داده ها 29

3-2-6 رسيدگي به داده هاي از دست رفته 29

3-2-7 كشف داده دور افتاده 30

3-2-8 انبوهش داده 32

3-2-9 ايجاد ويژگي دسته 32

3-2-10 تبديل داده 32

3-2-11 انتقال داده به محيط داده كاوي 32

3-2-12 انواع داده تعيين شده 33

3-2-13 عمليات انتخاب ويژگيهاي موثرتر 34

3-3 نتايج اعمال الگوريتم PCA و الگوريتم هاي وزن دهي 34

3-4 ويژگي هاي منتخب جهت استفاده در الگوريتمهاي حساس به تعداد ويژگي 36

3-5 معيارهاي ارزيابي الگوريتمهاي دسته بندي 37

3-6 ماتريس درهم ريختگي 37

3-7 معيار AUC 38

3-8 روشهاي ارزيابي الگوريتم هاي دسته بندي 39

3-8-1 روش Holdout 39

3-8-2 روش Random Subsampling 39

3-8-3 روش Cross-Validation 40

3-8-4 روش Bootstrap 40

3-9 الگوريتمهاي دسته بندي 41

3-9-1 الگوريتم KNN 42

3-9-2 الگوريتم Naïve Bayes 42

3-9-3 الگوريتم Neural Network 43

3-9-4 الگوريتم SVM خطي 45

3-9-5 الگوريتم رگرسيون لجستيك 46

3-9-6 الگوريتم Meta Decision Tree 47

3-9-7 الگوريتم درخت Wj48 49

3-9-8 الگوريتم درخت Random forest 51

3-10 معيارهاي ارزيابي الگوريتم هاي مبتني بر قانون(كشف قوانين انجمني) 54

3-10-1 الگوريتم FPgrowth 55

3-10-2 الگوريتم Weka Apriori 55

3-11 معيارهاي ارزيابي الگوريتمهاي خوشه بندي 55

3-12 الگوريتم هاي خوشه بندي 57

3-12-1 الگوريتم K-Means 57

3-12-2 الگوريتم Kohonen 60

3-12-3 الگوريتم دوگامي 64

فصل چهارم: ارزيابي و نتيجه گيري

4-1 مقايسه نتايج 69

4-2 الگوريتمهاي دسته بندي 69

4-3 الگوريتم هاي دسته بندي درخت تصميم 70

4-4 الگوريتم هاي خوشه بندي 79

4-5 الگوريتم هاي قواعد تلازمي(مبتني بر قانون) 81

4-6 پيشنهادات به شركت هاي بيمه 81

4-7 پيشنهادات جهت ادامه كار 83

منابع و مأخذ

فهرست منابع فارسي 84

فهرست منابع انگليسي 85

فهرست جدول‌ها

جدول شماره 3-1: نتايج راي گيري استفاده از نرم افزارهاي داده كاوي 24

جدول شماره 3-2: فيلدهاي اوليه داده هاي صدور 26

جدول شماره 3-3: فيلدهاي نهايي داده هاي صدور 27

جدول شماره 3-4: فيلدهاي حذف شده داده هاي صدور و علت حذف آنها 28

جدول 3-5: فيلدهاي استخراج شده از داده هاي خسارت 28

جدول 3-6: نتايج نمودار boxplot 31

جدول 3-7: انواع داده استفاده شده 33

جدول 3-8: نتايج حاصل از اجتماع فيلدهاي با بالاترين وزن در الگوريتمهاي مختلف 37

جدول 3-9: ماتريس در هم ريختگي ركوردهاي تخميني(Predicted Records) 38

جدول 3-10: قوانين استخراج شده توسط الگوريتم Fpgrowth 55

جدول 3-11: قوانين استخراج شده توسط الگوريتم Weka Apriori 55

جدول 3-12: تنظيمات پارامترهاي الگوريتم K-Means 57

اجرا براي 9 خوشه در الگوريتم K-Means 60

جدول 3-13: تنظيمات پارامترهاي الگوريتم Kohonen 64

جدول 3-14: تنظيمات پارامترهاي الگوريتم دوگامي 69

جدول 4-1: مقايسه الگوريتم هاي دسته بند 70

جدول 4-2: مقايسه الگوريتم هاي دسته بند درخت تصميم 70

جدول 4-3: ماتريس آشفتگي قانون شماره 1 71

جدول 4-4: ماتريس آشفتگي قانون شماره 2 72

جدول 4-5: ماتريس آشفتگي قانون شماره 3 الف 72

جدول 4-6: ماتريس آشفتگي قانون شماره 3 ب 72

جدول 4-7: ماتريس آشفتگي قانون شماره 3 ج 73

جدول 4-8: ماتريس آشفتگي قانون شماره 3 د 73

جدول 4-9: ماتريس آشفتگي قانون شماره 3 ه 73

جدول 4-10: ماتريس آشفتگي قانون شماره 3 و 74

جدول 4-11: ماتريس آشفتگي قانون شماره 3 ز 76

جدول 4-12: ماتريس آشفتگي قانون شماره 4 76

جدول 4-13: ماتريس آشفتگي قانون شماره 5 77

جدول 4-14: ماتريس آشفتگي قانون شماره 6 الف 77

جدول 4-15: ماتريس آشفتگي قانون شماره 6 ب 78

جدول 4-16: ماتريس آشفتگي قانون شماره7 78

جدول 4-17: ماتريس آشفتگي قانون شماره8 79

جدول 4-18: مقايسه الگوريتم هاي خوشه بندي 79

جدول 4-19: فيلدهاي حاصل از الگوريتم هاي خوشه بندي 80

جدول 4-20: نتايج الگوريتم هاي FpGrowth, Weka Apriori 81

فهرست شكل‌ها

شكل شماره3-1: داده از دست رفته فيلد" نوع بيمه " پس از انتقال به محيط داده كاوي 33

شكل 3-2: نتايج الگوريتمPCA 34

شكل 3-3: نتايج الگوريتم SVM Weighting در ارزشدهي به ويژگي ها 35

شكل 3-4: نتايج الگوريتم Weighting Deviation در ارزشدهي به ويژگي ها 35

شكل 3-5: نتايج الگوريتم Weighting Correlation در ارزشدهي به ويژگي ها 36

شكل 3-6: نماي كلي استفاده از روشهاي ارزيابي 41

شكل 3-7: نماي كلي استفاده از يك مدل درون يك روش ارزيابي 42

شكل 3-8: نمودار AUC الگوريتم KNN 42

شكل 3-9: نمودار AUC الگوريتم Naïve Bayes 43

شكل 3-10: تبديل ويژگي هاي غير عددي به عدد در الگوريتم شبكه عصبي 44

شكل 3-11: نمودار AUC و ماتريس آشفتگي الگوريتم Neural Net 44

شكل 3-12: تبديل ويژگي هاي غير عددي به عدد در الگوريتم SVM خطي 45

شكل 3-13 : نمودار AUC الگوريتم SVM Linear 46

شكل 3-14 : نمودار AUC الگوريتم رگرسيون لجستيك 47

شكل 3-15 : نمودار AUC الگوريتم Meta Decision Tree 48

شكل 3-16 : قسمتي از نمودارtree الگوريتم Meta Decision Tree 49

شكل 3-17 : نمودار radial الگوريتم Meta Decision Tree 49

شكل 3-18: نمودار AUC الگوريتم Wj48 50

شكل 3-19 : نمودار tree الگوريتم Wj48 51

شكل 3-20 : نمودار AUC الگوريتم Random forest 52

شكل 3-21 : نمودار توليد 20 درخت در الگوريتم Random Forest 53

شكل 3-22 : يك نمونه درخت توليد شده توسط الگوريتم Random Forest 53

شكل 3-23 : رسيدن درصد خطا به صفر پس از 8مرتبه 57

شكل 3-24 : Predictor Importance for K-Means 58

شكل 3-25 : اندازه خوشه ها و نسبت كوچكترين خوشه به بزرگترين خوشه در الگوريتم

K-Means 59

شكل 3-26 : كيفيت خوشه ها در الگوريتمMeans K- 60

شكل 3-27 : Predictor Importance for Kohonen 61

شكل 3-28 : اندازه خوشه ها و نسبت كوچكترين خوشه به بزرگترين خوشه در الگوريتم

Kohonen 62

شكل 3-29 : كيفيت خوشه ها در الگوريتمMeans K- 63

شكل 3-30 : تعداد نرون هاي ورودي و خروجي در Kohonen 63

شكل 3-31 : Predictor Importance for دوگامي 64

شكل 3-32 : اندازه خوشه ها و نسبت كوچكترين خوشه به بزرگترين خوشه در

الگوريتم دوگامي 65

شكل 3-33 : كيفيت خوشه ها در الگوريتم دوگامي 66

شكل4-1: نمودارنسبت تخفيف عدم خسارت به خسارت 75

قيمت فايل فقط 85,000 تومان

برچسب ها : پيشنهاد چارچوبي جهت تشخيص علل تاثيرگذار و درصد تاثير آنها در سود و زيان بيمه با داده كاوي , بيمه شخص ثالث خودرو , پايان نامه ارشد داده كاوي , كاربرد داده كاوي در بيمه , تشخيص خسارت بيمه با داده كاوي , سود و زيان بيمه شخص ثالث خودرو با داده كاوي , شناسايي عوامل اثرگذار در سود و زيان بيمه شخص ثالث خودرو , پايان نامه نظري سود و زيان بيمه با داده كاوي

پيشنهاد چارچوبي جهت تشخيص علل تاثيرگذار و درصد تاثير آنها در سود و زيان بيمه با داده كاوي

پيشنهاد چارچوبي جهت تشخيص علل تاثيرگذار و درصد تاثير آنها در سود و زيان بيمه با داده كاوي

پيشنهاد چارچوبي جهت تشخيص علل تاثيرگذار و درصد تاثير آنها در سود و زيان بيمه با داده كاوي

دانلود پايان‌نامه كارشناسي ارشد مهندسي فناوري اطلاعات