امروزه نقش مشتریان از حالت پیروی از تولید کننده ،به هدایت سرمایه گذاران ، تولید کنند گان و حتی پژوهش گران و نوآوران مبدل گشته است ،به همین دلیل سازمان ها نیاز دارند مشتریان خود را بشناسند و برای آنان برنامه ریزی کنند .تاکنون از برخی روش های آماری و یادگیری ماشینی برای این منظور استفاده شده است که البته این روش ها به تنهایی دارای محدودیت هایی هستند که در این پژوهش سعی شده است تا با بهره گیری از روش های مختلف داده کاوی تا حد ممکن این محدودیت ها از بین برده و بر طبق آن ،چارچوبی برای شناسایی مشتریان بیمه بدنه اتومبیل ارایه شود . در واقع هدف این است تا مشتریانی را که بیشتر به یکدیگر شبیه هستند دسته بندی و با استفاده از این دسته ها و ویژگی های آن ،میزان خطر پذیری هر دسته را پیش بینی کرد . حال با استفاده از این معیار (میزان خطر پذیری هر دسته) و نوع بیمه نامه مشتری می توان میزان خسارت او را پیش بینی کرد که این معیار می تواند کمک شایانی برای شناسایی مشتریان و سیاست گذاری های تعرفه بیمه نامه باشد . برای این منظور، از روش داده کاوی ،درخت تصمیم برای ایجاد مدل پیش بینی خطر پذیری مشتریان در صنعت بیمه استفاده شده است .فن درخت تصمیم برای این منظور نتایج بهتری را به دست اورده است.
فهرست مطالب
چکیده1
1-1- مقدمه. 2
1-2- تاریخچه داده كاوی.. 2
1-3- روشهای پیشین و فعالیت های مرتبط با پژوهش... 4
1-4- مدیریت ذخیره سازی و دستیابی اطلاعات.. 5
1-5- ساختار بانک اطلاعاتی سازمان :7
1-6- داده کاوی :((Data Mining. 7
1-6-1- داده كاوی چیست؟. 7
1-6-2- مفاهیم پایه در داده کاوی.. 8
1-6-3- تعریف داده کاوی.. 8
1-6-4- برخی از این تعاریف عبارتند از :8
1-6-4-1- مراحل فرایند کشف دانش از پایگاه داده ها9
1-7- تفسیر نتیجه. 9
1-8- انبارش داده ها9
1-9- انتخاب داده ها10
1-10- تبدیل داده ها10
1-11- عملیات های داده کاوی.. 10
1-11-1- مدل سازی پیشگویی کننده11
1-11-2- تقطیع پایگاه داده ها12
1-11-3- تحلیل پیوند. 12
1-11-4- تشخیص انحراف.. 12
1-12- الگوریتم های داده کاوی.. 13
1-12-1- دسته بندی.. 14
1-12-2-رگرسیون. 15
1-12-3- سریهای زمانی.. 16
1-12-4- پیش بینی.. 16
1-12-5- تکنیک های روش توصیفی.. 16
1-12-6- قوانین انجمنی.. 16
1-12-7- خلاصه سازی (تلخیص)17
1-12-8- مدلسازی وابستگی (تحلیل لینک)17
1-12-9- خوشه بندی.. 18
1-12-9-1- معیارهای ارزیابی الگوریتمهای خوشه بندی.. 18
1-12-9-2- طبقه بندی روشهای خوشه بندی.. 19
1-12-10- الگوریتم Apriori19
1-12-11- الگوریتم K-Means20
1-12-11- 1-گام های الگوریتم k-means20
1-12-11-2- ویژگیهای الگوریتم k-means20
1-12-11-3- رفع اشکالات الگوریتم k-means:21
1-12-12- شبکه های عصبی.. 21
1-12-13- درخت تصمیم. 22
1-13- روش پیشنهادی.. 23
1-14- جامع آماری و نمونه آماری.. 23
1-15- مراحل پژوهش... 23
1-16-پیش پردازشداده ها25
1-17- معرفی مشخصه ها26
1-18- مشخصه هدف.. 27
1-19- انتخاب مشخصه. 27
1-20- نرم افزارهای داده کاوی.. 27
1-21- پیاده سازی مدل های داده کاوی.. 30
1-21-1- درخت تصمیم. 30
1-21-2- تحلیل درخت تصمیم. 30
منابع 34
شکل 1-1- دسته بندی پژوهش ها در زمینه ی داده کاوی.. 4
شکل 1-2- نمودار پردازش اطلاعات.. 6
شکل1-3- مدیریت داده ها6
شکل 1-4- ساختار بانک اطلاعاتی.. 7
شكل 1-5- تجزیه و تحلیل KDD. 8
شکل 1-6- یک شبکه عصبی با یک لایه پنهان. 22
شکل 1-7- مراحل پژوهش... 25
شکل 1-8- درخت تصمیم. 31
شکل 1-9- درخت تصمیم. 32
شکل 1-10- درخت تصمیم 33