پيشنهاد چارچوبي جهت تشخيص علل تاثيرگذار و درصد تاثير آنها در سود و زيان بيمه با داده كاوي
- پيشنهاد چارچوبي جهت تشخيص علل تاثيرگذار و درصد تاثير آنها در سود و زيان بيمه با داده كاوي
دسته: رشته فناوري اطلاعات (IT)
بازديد: 5 بار
فرمت فايل: doc
حجم فايل: 1305 كيلوبايت
تعداد صفحات فايل: 114هدف از اين پاياننامه پيشنهاد چارچوبي جهت تشخيص علل تاثيرگذار و درصد تاثير آنها در سود و زيان بيمه با داده كاوي در شركت سهامي بيمه ايران مي باشد
قيمت فايل فقط 85,000 تومان
دانلود پاياننامه كارشناسي ارشد مهندسي فناوري اطلاعات
پيشنهاد چارچوبي جهت تشخيص علل تاثيرگذار و درصد تاثير آنها در سود و زيان بيمه با داده كاوي
(مطالعه موردي: شركت سهامي بيمه ايران)
چكيده
بررسي اطلاعات بيمه هاي اتومبيل نشان داده عواملي چون نوع استفاده خودرو، داشتن گواهينامه رانندگي، نوع گواهينامه و تطابق يا عدم تطابق آن با وسيله نقليه، مبلغ حق بيمه، ميزان تعهدات بيمه نامه، كيفيت خودروي خودرو سازان، سن راننده، سواد راننده، عدم تطابق حق بيمه با مورد بيمه، تاخيردرتمديد بيمه نامه، در سود و زيان شركت هاي بيمه تاثير داشته اند.
هدف اين پايان نامه شناخت عوامل اثرگذار و ضريب تاثير آنها در سود و زيان بيمه شخص ثالث خودرو شركت هاي بيمه با استفاده از روش داده كاوي و سپس انتخاب الگوريتمي كه بهترين ميزان دقت پيش بيني براي تشخيص اين عوامل را داشته اند مي باشد.نتيجه حاصل از اين پژوهش نشان مي دهد كه روشهاي داده كاوي با استفاده از الگوريتم هاي دسته بندي با دقت بالاي 91% و الگوريتم هاي درخت تصميم با دقت بالاي 96% و الگوريتم هاي خوشه بندي با ايجاد خوشه هاي قابل قبول قادر به ارائه مدلي براي تشخيص عوامل اثرگذار و تعيين ميزان اثر آنها در سود و زيان بيمه نامه شخص ثالث خودرو خواهند بود.
كليدواژگان:
داده كاوي
سود و زيان
بيمه شخص ثالث خودرو
مقدمه
شركتهاي تجاري و بازرگاني براي ادامه بقا و حفظ بازار همواره بر سود دهي و كاهش ضرر و زيان خود تاكيد دارند از اين رو روشهاي جذب مشتري و همچنين تكنيكهاي جلوگيري يا كاهش زيان در سرلوحه كاري اين شركتها قرار مي گيرد. از جمله شركتهايي كه بدلايل مختلف در معرض كاهش سود و يا افزايش زيان قرار مي گيرند شركتهاي بيمه اي مي باشند. عواملي همچون بازاريابي، وفاداري مشتريان، نرخ حق بيمه، تبليغات، تقلب، مي تواند باعث جذب يا دفع مشتري گردد كه در سود و زيان تاثير مستقيم و غير مستقيم دارد. پرداخت خسارت نيز به عنوان تعهد شركتهاي بيمه منجر به كاهش سود و در بعضي موارد موجب زيان يك شركت بيمه مي شود. خسارت مي تواند بدلايل مختلف رخ دهد و يا عملي ديگر به گونه اي خسارت جلوه داده شود كه در واقع اينچنين نيست[Derrig et. al 2006].
عواملي از قبيل فرهنگ رانندگي، داشتن گواهينامه رانندگي، نوع گواهينامه و تطابق يا عدم تطابق آن با وسيله نقليه، جاده هاي بين شهري و خيابانهاي داخل شهر كه شهرداري ها و ادارات راه را به چالش مي كشد، تقلب، وضعيت آب و هوا، كيفيت خودروي خودرو سازان، سن راننده، سواد راننده، عدم تطابق حق بيمه با مورد بيمه [Wilson 2003]، روزهاي تعطيل، مسافرتها و بسياري موارد ديگر مي توانند موجب خسارت و در نهايت افزايش زيان يك شركت بيمه اي گردند. بيمه صنعتي سودمند، ضروري و مؤثر در توسعه اقتصادي است. اين صنعت بدليل «افزايش امنيت در عرصه هاي مختلف زندگي و فعاليتهاي اقتصادي»، «افزايش سرمايه گذاري و اشتغال و رشد اقتصادي» و « ارتقاي عدالت اقتصادي و كاهش فقر ناشي از مخاطرات »، حائز جايگاه مهمي در پيشرفت و تعالي يك كشور است.
با وجود نقش مهم بيمه در بسترسازي و تأمين شرايط مساعد اقتصادي، وضعيت كنوني اين صنعت در اقتصاد ملي با وضعيت مطلوب آن فاصله زيادي دارد. عدم آشنايي عمومي و كم بودن تقاضا براي محصولات بيمه اي، دانش فني پايين در عرصه خدمات بيمه اي، عدم تطابق ريسك با حق بيمه، تفاوت فاحش در مقايسه معيارهاي تشخيص ريسك بيمه شخص ثالث با نوع بيمه معادل در كشورهاي توسعه يافته، وجود نارسايي ها در مديريت واحدهاي عرضه بيمه از دلايل عدم توسعه مناسب اين صنعت در كشور است. از آنجا كه بشر در طول تاريخ به كمك علم و تجربه رستگاري ها و توفيقات فراواني كسب كرده است، نگاه علمي تر به مشكلات اين صنعت و يافتن راه حل در بستر علم مي تواند راه گشا باشد. امروزه بوسيله روشهاي داده كاوي ارتباط بين فاكتورهاي مختلف موثر يا غير موثر در يك موضوع مشخص مي شود و با توجه به اينكه داده كاوي ابزاري مفيد در استخراج دانش از داده هاي انبوه مي باشد كه ارتباطات نهفته بين آنها را نشان مي دهد، شركتهاي تجاري بازرگاني رو به اين تكنيكها آورده اند. داده كاوي محدود به استفاده از فناوري ها نيست و از هرآنچه كه برايش مفيد واقع شود استفاده خواهد كرد. با اين وجود آمار و كامپيوتر پر استفاده ترين علوم و فناوري هاي مورد استفاده داده كاوي است.
فهرست مطالب
فصل اول: كليات
1-1 تعريف داده كاوي 3
1-2 تعريف بيمه 4
1-3 هدف پايان نامه 4
1-4 مراحل انجام تحقيق 4
1-5 ساختار پايان نامه 5
فصل دوم: ادبيات موضوع و تحقيقات پيشين
2-1 داده كاوي و يادگيري ماشين 7
2-2 ابزارها و تكنيك هاي داده كاوي 8
2-3 روشهاي داده كاوي 9
2-3-1 روشهاي توصيف داده ها 10
2-3-2 روشهاي تجزيه و تحليل وابستگي 10
2-3-3 روشهاي دسته بندي و پيشگويي 10
2-3-4 درخت تصميم 11
2-3-5 شبكه عصبي 12
2-3-6 استدلال مبتني بر حافظه 12
2-3-7 ماشين هاي بردار پشتيباني 13
2-3-8 روشهاي خوشه بندي 13
2-3-9 روش K-Means 13
2-3-10 شبكه كوهنن 14
2-3-11 روش دو گام 14
2-3-12 روشهاي تجزيه و تحليل نويز 14
2-4 دسته هاي نامتعادل]صنيعي آباده 1391[. 15
2-4-1 راهكار مبتني بر معيار 15
2-4-2 راهكار مبتني بر نمونه برداري 15
2-5 پيشينه تحقيق 16
2-6 خلاصه فصل 19
فصل سوم: شرح پژوهش
3-1 انتخاب نرم افزار 21
3-1-1 Rapidminer 21
3-1-2 مقايسه RapidMiner با ساير نرم افزار هاي مشابه 21
3-2 داده ها 25
3-2-1 انتخاب داده 25
3-2-2 فيلدهاي مجموعه داده صدور 25
3-2-3 كاهش ابعاد 25
3-2-4 فيلدهاي مجموعه داده خسارت 29
3-2-5 پاكسازي داده ها 29
3-2-6 رسيدگي به داده هاي از دست رفته 29
3-2-7 كشف داده دور افتاده 30
3-2-8 انبوهش داده 32
3-2-9 ايجاد ويژگي دسته 32
3-2-10 تبديل داده 32
3-2-11 انتقال داده به محيط داده كاوي 32
3-2-12 انواع داده تعيين شده 33
3-2-13 عمليات انتخاب ويژگيهاي موثرتر 34
3-3 نتايج اعمال الگوريتم PCA و الگوريتم هاي وزن دهي 34
3-4 ويژگي هاي منتخب جهت استفاده در الگوريتمهاي حساس به تعداد ويژگي 36
3-5 معيارهاي ارزيابي الگوريتمهاي دسته بندي 37
3-6 ماتريس درهم ريختگي 37
3-7 معيار AUC 38
3-8 روشهاي ارزيابي الگوريتم هاي دسته بندي 39
3-8-1 روش Holdout 39
3-8-2 روش Random Subsampling 39
3-8-3 روش Cross-Validation 40
3-8-4 روش Bootstrap 40
3-9 الگوريتمهاي دسته بندي 41
3-9-1 الگوريتم KNN 42
3-9-2 الگوريتم Naïve Bayes 42
3-9-3 الگوريتم Neural Network 43
3-9-4 الگوريتم SVM خطي 45
3-9-5 الگوريتم رگرسيون لجستيك 46
3-9-6 الگوريتم Meta Decision Tree 47
3-9-7 الگوريتم درخت Wj48 49
3-9-8 الگوريتم درخت Random forest 51
3-10 معيارهاي ارزيابي الگوريتم هاي مبتني بر قانون(كشف قوانين انجمني) 54
3-10-1 الگوريتم FPgrowth 55
3-10-2 الگوريتم Weka Apriori 55
3-11 معيارهاي ارزيابي الگوريتمهاي خوشه بندي 55
3-12 الگوريتم هاي خوشه بندي 57
3-12-1 الگوريتم K-Means 57
3-12-2 الگوريتم Kohonen 60
3-12-3 الگوريتم دوگامي 64
فصل چهارم: ارزيابي و نتيجه گيري
4-1 مقايسه نتايج 69
4-2 الگوريتمهاي دسته بندي 69
4-3 الگوريتم هاي دسته بندي درخت تصميم 70
4-4 الگوريتم هاي خوشه بندي 79
4-5 الگوريتم هاي قواعد تلازمي(مبتني بر قانون) 81
4-6 پيشنهادات به شركت هاي بيمه 81
4-7 پيشنهادات جهت ادامه كار 83
منابع و مأخذ
فهرست منابع فارسي 84
فهرست منابع انگليسي 85
فهرست جدولها
جدول شماره 3-1: نتايج راي گيري استفاده از نرم افزارهاي داده كاوي 24
جدول شماره 3-2: فيلدهاي اوليه داده هاي صدور 26
جدول شماره 3-3: فيلدهاي نهايي داده هاي صدور 27
جدول شماره 3-4: فيلدهاي حذف شده داده هاي صدور و علت حذف آنها 28
جدول 3-5: فيلدهاي استخراج شده از داده هاي خسارت 28
جدول 3-6: نتايج نمودار boxplot 31
جدول 3-7: انواع داده استفاده شده 33
جدول 3-8: نتايج حاصل از اجتماع فيلدهاي با بالاترين وزن در الگوريتمهاي مختلف 37
جدول 3-9: ماتريس در هم ريختگي ركوردهاي تخميني(Predicted Records) 38
جدول 3-10: قوانين استخراج شده توسط الگوريتم Fpgrowth 55
جدول 3-11: قوانين استخراج شده توسط الگوريتم Weka Apriori 55
جدول 3-12: تنظيمات پارامترهاي الگوريتم K-Means 57
اجرا براي 9 خوشه در الگوريتم K-Means 60
جدول 3-13: تنظيمات پارامترهاي الگوريتم Kohonen 64
جدول 3-14: تنظيمات پارامترهاي الگوريتم دوگامي 69
جدول 4-1: مقايسه الگوريتم هاي دسته بند 70
جدول 4-2: مقايسه الگوريتم هاي دسته بند درخت تصميم 70
جدول 4-3: ماتريس آشفتگي قانون شماره 1 71
جدول 4-4: ماتريس آشفتگي قانون شماره 2 72
جدول 4-5: ماتريس آشفتگي قانون شماره 3 الف 72
جدول 4-6: ماتريس آشفتگي قانون شماره 3 ب 72
جدول 4-7: ماتريس آشفتگي قانون شماره 3 ج 73
جدول 4-8: ماتريس آشفتگي قانون شماره 3 د 73
جدول 4-9: ماتريس آشفتگي قانون شماره 3 ه 73
جدول 4-10: ماتريس آشفتگي قانون شماره 3 و 74
جدول 4-11: ماتريس آشفتگي قانون شماره 3 ز 76
جدول 4-12: ماتريس آشفتگي قانون شماره 4 76
جدول 4-13: ماتريس آشفتگي قانون شماره 5 77
جدول 4-14: ماتريس آشفتگي قانون شماره 6 الف 77
جدول 4-15: ماتريس آشفتگي قانون شماره 6 ب 78
جدول 4-16: ماتريس آشفتگي قانون شماره7 78
جدول 4-17: ماتريس آشفتگي قانون شماره8 79
جدول 4-18: مقايسه الگوريتم هاي خوشه بندي 79
جدول 4-19: فيلدهاي حاصل از الگوريتم هاي خوشه بندي 80
جدول 4-20: نتايج الگوريتم هاي FpGrowth, Weka Apriori 81
فهرست شكلها
شكل شماره3-1: داده از دست رفته فيلد" نوع بيمه " پس از انتقال به محيط داده كاوي 33
شكل 3-2: نتايج الگوريتمPCA 34
شكل 3-3: نتايج الگوريتم SVM Weighting در ارزشدهي به ويژگي ها 35
شكل 3-4: نتايج الگوريتم Weighting Deviation در ارزشدهي به ويژگي ها 35
شكل 3-5: نتايج الگوريتم Weighting Correlation در ارزشدهي به ويژگي ها 36
شكل 3-6: نماي كلي استفاده از روشهاي ارزيابي 41
شكل 3-7: نماي كلي استفاده از يك مدل درون يك روش ارزيابي 42
شكل 3-8: نمودار AUC الگوريتم KNN 42
شكل 3-9: نمودار AUC الگوريتم Naïve Bayes 43
شكل 3-10: تبديل ويژگي هاي غير عددي به عدد در الگوريتم شبكه عصبي 44
شكل 3-11: نمودار AUC و ماتريس آشفتگي الگوريتم Neural Net 44
شكل 3-12: تبديل ويژگي هاي غير عددي به عدد در الگوريتم SVM خطي 45
شكل 3-13 : نمودار AUC الگوريتم SVM Linear 46
شكل 3-14 : نمودار AUC الگوريتم رگرسيون لجستيك 47
شكل 3-15 : نمودار AUC الگوريتم Meta Decision Tree 48
شكل 3-16 : قسمتي از نمودارtree الگوريتم Meta Decision Tree 49
شكل 3-17 : نمودار radial الگوريتم Meta Decision Tree 49
شكل 3-18: نمودار AUC الگوريتم Wj48 50
شكل 3-19 : نمودار tree الگوريتم Wj48 51
شكل 3-20 : نمودار AUC الگوريتم Random forest 52
شكل 3-21 : نمودار توليد 20 درخت در الگوريتم Random Forest 53
شكل 3-22 : يك نمونه درخت توليد شده توسط الگوريتم Random Forest 53
شكل 3-23 : رسيدن درصد خطا به صفر پس از 8مرتبه 57
شكل 3-24 : Predictor Importance for K-Means 58
شكل 3-25 : اندازه خوشه ها و نسبت كوچكترين خوشه به بزرگترين خوشه در الگوريتم
K-Means 59
شكل 3-26 : كيفيت خوشه ها در الگوريتمMeans K- 60
شكل 3-27 : Predictor Importance for Kohonen 61
شكل 3-28 : اندازه خوشه ها و نسبت كوچكترين خوشه به بزرگترين خوشه در الگوريتم
Kohonen 62
شكل 3-29 : كيفيت خوشه ها در الگوريتمMeans K- 63
شكل 3-30 : تعداد نرون هاي ورودي و خروجي در Kohonen 63
شكل 3-31 : Predictor Importance for دوگامي 64
شكل 3-32 : اندازه خوشه ها و نسبت كوچكترين خوشه به بزرگترين خوشه در
الگوريتم دوگامي 65
شكل 3-33 : كيفيت خوشه ها در الگوريتم دوگامي 66
شكل4-1: نمودارنسبت تخفيف عدم خسارت به خسارت 75
قيمت فايل فقط 85,000 تومان
برچسب ها : پيشنهاد چارچوبي جهت تشخيص علل تاثيرگذار و درصد تاثير آنها در سود و زيان بيمه با داده كاوي , بيمه شخص ثالث خودرو , پايان نامه ارشد داده كاوي , كاربرد داده كاوي در بيمه , تشخيص خسارت بيمه با داده كاوي , سود و زيان بيمه شخص ثالث خودرو با داده كاوي , شناسايي عوامل اثرگذار در سود و زيان بيمه شخص ثالث خودرو , پايان نامه نظري سود و زيان بيمه با داده كاوي