مطالعه‌ای در مورد پیش‌بینی خرید بیمه خودرو با استفاده از یادگیری ماشینی

بر اساس این مقاله، نکات برجسته اصلی مؤثر بر شارژ مجدد خودکار در این مقاله استخراج شده است شارژ مجدد خودکار قابلیتی است که وقتی موجودی شما به زیر مقدار معینی می‌رسد، به طور خودکار حساب شما را با اعتبار پیامکی شارژ می‌کند. این قابلیت تضمین می‌کند که هرگز اعتبار شما تمام نمی‌شود و از وقفه غیر منتظره خدمات جلوگیری می‌کند. شارژ خودکار با کارت‌های اعتباری و پی‌پال کار می‌کند که این قابلیت در بیمه اطلاعات مربوط به پوشش تصادف را تشریح می‌کند؛ حتی محاسبه دستگاه بالابر، اندازه بالا رفتن را بررسی می‌کند.

به گزارش ریسک نیوز به نقل از نشریه بیمه داری نوین با پیشرفت مداوم هوش مصنوعی، پروژه‌هایی که از استراتژی‌های هوش مصنوعی برای بهره‌برداری از داده‌های موجود استفاده می‌کنند، به موضوعی داغ در ارزیابی شرکت‌های بیمه‌ای مهم تبدیل شده است.

بر اساس این مقاله، نکات برجسته اصلی مؤثر بر شارژ مجدد خودکار در این مقاله استخراج شده است شارژ مجدد خودکار قابلیتی است که وقتی موجودی شما به زیر مقدار معینی می‌رسد، به طور خودکار حساب شما را با اعتبار پیامکی شارژ می‌کند. این قابلیت تضمین می‌کند که هرگز اعتبار شما تمام نمی‌شود و از وقفه غیر منتظره خدمات جلوگیری می‌کند. شارژ خودکار با کارت‌های اعتباری و پی‌پال کار می‌کند که این قابلیت در بیمه اطلاعات مربوط به پوشش تصادف را تشریح می‌کند؛ حتی محاسبه دستگاه بالابر، اندازه بالا رفتن را بررسی می‌کند.

در این مقاله آمده است که بر اساس داده‌های آزمایشی، مدل LightGBM بالاترین فراوانی استفاده و محبوبیت بالایی دارد. عواملی مانند کانال تجاری حفاظت از خودرو، تخفیف بیمه، سن وسیله نقلیه و هزینه خرید یک وسیله نقلیه جدید تأثیر زیادی بر شارژ مجدد یا عدم شارژ مجدد بیمه دارند.

با افزایش تعداد خودروها در جاده‌ها، شرکت‌ها تأکید بیشتری بر بازاریابی دقیق برای جلب مشتریان جدید خواهند داشت. رقابت‌پذیری سازمان‌های بیمه‌گر بزرگ بر استخراج دانش و اطلاعات حیاتی از کاربران، کالاها و خدمات از داده‌های انبوه مشتریان و کسب منابع بیشتر از سوی مشتری متکی است. یک روش برای به دست آوردن مزیت رقابتی استفاده از یادگیری ماشینی و داده‌کاوی برای بهبود ارائه خدمات است.

یکی از رایج‌ترین استراتژی‌ها در پیش پردازش داده‌ها، استراتژی انتخاب ویژگی است. بر حذف ویژگی‌های اضافی یا زائد از اطلاعات و انتخاب تعدادی از ویژگی‌های کلیدی برای آسان کردن پردازش داده‌هاست. این استراتژی انتخاب مؤلفة جدید برای جست‌وجوی اطلاعات انباشته شده را پیشنهاد کرد. این مؤلفه سازگاری استثنایی دارد و برای داده‌های حفاظت در موقع حادثه اعمال می‌شود و با مشکل جمع‌آوری اطلاعاتی که بیان‌ آن دشوار است، سر و کار دارد. الشمسی و دیگران از محاسبات نامنظم که نوعی روش محاسبه و یادگیری ماشینی است برای کمک به سازمان‌های بیمه‌گر برای پیش‌بینی تصمیمات مشتری استفاده می‌کنند تا انواع کمک‌های بیشتر و بهتر را بتوانند ارائه کنند.

یانمی جیانگ و همکاران متوجه شدند که مدل LightGBM بهترین عملکرد را داشته است. این مقاله بیش از 60 هزار سوابق پوشش حوادث را بررسی می‌کند و از مدل محاسبه LightGBM برای شناسایی ویژگی‌های کلیدی که بر حفاظت از مشتری تأثیر می‌گذارد، استفاده می‌کند و به سازمان‌ها اجازه می‌دهد تا به طور مؤثرتر تاکتیک‌های تبلیغاتی را پرورش دهند.

 

تصفیه اطلاعات و تغییر نام ویژگی‌ها

ما داده‌ها را بر اساس حقایق تجاری فعلی تجزیه و تحلیل می‌کنیم تا اثراتی که هر جزء ارائه می‌دهد را درک کنیم؛ سپس اطلاعات از قبل پردازش می‌شود. وظایف اصلی عبارت‌اند از: حذف داده‌های نادرست، جبران کاهش ارزش و غیره. 28 عامل و 65 هزار و 535 داده خام در این مقاله استفاده شده است.

اطلاعات لازم برای حفاظت از مشتری به شرح زیر است است: برچسب منطقه، نوع مالکیت، نوع وسیله نقلیه، دلیل احساس نیاز به حفاظت از وسیله نقلیه، هزینه خرید وسیله نقلیه جدید، سن وسیله نقلیه، نوع حفاظت درخواستی برای وسیله نقلیه، تخفیف بیمه، درجه خطر (کمترین A، E بالاترین)، تاریخ شروع، روز آخر، امکان فعال کردن بیمه خودکار، برند وسایل نقلیه، شماره سری خودرو، آیا وسیله نقلیه از آسیب محافظت شود. آیا وسیله نقلیه از سرقت محافظت شود. میزان حفاظت، مبلغ قسط، تعداد اقساط، مقدار پولی که توافق شده است. پس از بررسی کامل داده‌ها، مشخص می‌شود که شماره نزدیک، تاریخ شروع، تاریخ پایان، نام تجاری خودرو و سری خودرو هیچ تأثیری بر حفاظت ندارند. برخی از عناصر به راحتی حذف می‌شوند.

 

مقدار مشخصه و جبران ارزش از دست رفته

چندین شکاف در بررسی اطلاعات وجود دارد که به شرح زیر پر می‌شود:

– از آنجایی که برای بیان دلیل نیاز به حفاظت از وسیله نقلیه و مبلغ پیشنهادی برای وسیله نقلیه وسیله نقلیه یک انگیزه مشخص وجود ندارد، می‌توانیم به راحتی این دو جزئیات را حذف کنیم.

– تخفیف بیمه حاوی 11 مشخصه مفقوده است و ما داده‌های نمونه‌ای را برای مقادیری که گم شده‌اند حذف می‌کنیم.

– تقریباً 50 هزار ویژگی در درجه‌بندی سطوح بیمه نقش دارند برای پر کردن داده‌های از دست رفته عدد صفر را انتخاب می‌کنیم.

– احتمالاً جهت‌گیری فرد محافظت شده نادیده گرفته می‌شود.

– مشتریان احتمالاً با فراوانی 50 درصد یا زن هستند یا مرد

– بسیاری از نکات برجسته متنی هستند و نمی‌توان آنها را در مدل گنجاند.

باید چند مقدار ویژه تعیین شود و ماتریس باید به چند دهانه تقسیم شود. یک مدل، فهرست ارزیابی اجرایی با استفاده از نرخ دقت توصیفی ایجاد می‌شود و فرض می‌شود که هر سطح بیمه تعهد مشخصی به این نرخ دارد.

این مقاله دارای نسبت 5:1 بین سطح صفر (خیر) و سطح یک (بله) است که نشان‌دهندة درجاتی از انحراف است. به منظور بررسی اجرای مدل، شاخص‌های ارزیابی شامل نرخ بررسی مثبت سطح F1 و AUC است که یک نمودار گرافیکی است که توانایی تشخیصی یک سیستم طبقه‌بندی‌کننده باینری را نشان می‌دهد؛ زیرا آستانه تمایز متفاوت است.

دسته‌های کوچک معمولاً برای آموزش الگوریتم‌های یادگیری ماشین استفاده می‌شوند، بدون محدودیت حافظه در کمیت داده‌های آموزشی. در هر تکرار، کل مجموعه آموزشی باید با استفاده از الگوریتم GBDT تکرار شود. هدف اصلی LightGBM حل مشکلات GBDT با مدیریت حجم زیادی از داده است. یک سیستم یادگیری مبتنی بر درخت تصمیم‌گیری به نام LightGBM از گرادیان بوستینگ برای ارائة آموزش موازی کارآمد با سرعت‌های آموزشی سریع‌تر، کاهش نیاز به حافظه، دقت بیشتر و پردازش سریع‌تر داده‌ها استفاده می‌کند. یک مجموعه آموزشی با استفاده از تخصص شرکت ایجاد شده است و داده‌ها به نمونه‌های آموزشی تبدیل شده است که مدل می‌تواند آنها را تشخیص دهد.

مدل محاسبه LightGBM در ارتباط بین این سه نشان‌گر ارزیابی، به غیر از ارزش F1 که به طور جزئی کمتر از برآورد RF است، پیشرفت خاصی دارد. شکل 2 انحراف ROC را نشان می‌دهد. محاسبه LightGBM، به طور متوسط، تأثیر بالاتری دارد.

همان‌طور که در شکل 3 نشان داده شده است، اجزای مؤثر بر بازسازی حفاظت خودرو بر اساس ارتباط در محاسبه LightGBM گروه‌بندی می‌شوند. همان‌طور که در نمودار نشان داده شده است، عناصری که تعمیر مجدد وسیله نقلیه را تعیین می‌کنند، در درجه اول کانالی برای محافظت از وسایل نقلیه تجاری، تخفیف بیمه، هزینة خرید وسیله نقلیه جدید و سن وسیله هستند. در نتیجه این یافته، شرکت‌های بیمه ممکن است از استراتژی‌های بازاریابی هدفمندتری برای افزایش درآمد خود استفاده کنند.

ما از طبقه‌بندی تصادفی برای تخمین احتمال اینکه خریداران بیمه سلامت، بیمه خودرو را از شرکت‌های بیمه دریافت کنند، استفاده کردیم. در حین کار بر روی تحقیق، با مسائل و چالش‌های ارزیابی یک مجموعه داده با استفاده از دو الگوریتم مواجه شده‌ایم. بیشترین مشکل را تصمیم‌گیری و انتخاب الگوریتمی داشت که می‌توان از آن به همراه افزایش دقت استفاده کرد. انتخاب یک الگوریتم خاص و ارزیابی مدل و همچنین یافتن گزینه‌های جایگزین برای انتخاب و پیکربندی ستون‌های مختلف و اجرای آزمایش دشوار بود. بیشترین مشکل را در تصمیم‌گیری و انتخاب الگوریتمی داشت که می‌توان از آن به همراه افزایش دقت استفاده کرد انتخاب یک الگوریتم خاص و ارزیابی مدل و همچنین کشف گزینه‌های جایگزین برای انتخاب و پیکربندی ستون‌های مختلف و اجرای آزمایش دشوار بود. علاوه بر این، در طول فرآیند تحلیل مدل با استفاده از یک یا چند الگوریتم، یک مشکل بسیار پیچیده ایجاد شد که باعث ایجاد مشکل در پیش‌بینی مدل شد.

اعتقاد بر این است که اگر پیش‌بینی با استفاده از داده‌های مؤثرتر و ستون‌های بیشتری نسبت به مدل موجود انجام شود، مدل بهتری ممکن است تولید شود تا یک مدل الگوریتم پیش‌بینی خرید بیمه خودرو دقیق‌تر و سریع‌تر تولید شود.

علاوه بر این، روش طبقه‌بندی تصادفی از مزیت تولید یک مدل پیش‌بینی سریع و ساده برخوردار است. در نتیجه، یک مدل پیش‌بینی با نتایج دقت بهبود یافته ممکن است توسعه یابد.

 

مترجم: نیلوفر ادیب‌نیا

 

منبع

https://www.irjmets.com/uploadedfiles/paper/issue_7_july_2022/27508/final/fin_irjmets1656843849.pdf

لینک کوتاهلینک کپی شد!
اخبار مرتبط
ارسال نظر

87  −  77  =