مطالعهای در مورد پیشبینی خرید بیمه خودرو با استفاده از یادگیری ماشینی
بر اساس این مقاله، نکات برجسته اصلی مؤثر بر شارژ مجدد خودکار در این مقاله استخراج شده است شارژ مجدد خودکار قابلیتی است که وقتی موجودی شما به زیر مقدار معینی میرسد، به طور خودکار حساب شما را با اعتبار پیامکی شارژ میکند. این قابلیت تضمین میکند که هرگز اعتبار شما تمام نمیشود و از وقفه غیر منتظره خدمات جلوگیری میکند. شارژ خودکار با کارتهای اعتباری و پیپال کار میکند که این قابلیت در بیمه اطلاعات مربوط به پوشش تصادف را تشریح میکند؛ حتی محاسبه دستگاه بالابر، اندازه بالا رفتن را بررسی میکند.

به گزارش ریسک نیوز به نقل از نشریه بیمه داری نوین با پیشرفت مداوم هوش مصنوعی، پروژههایی که از استراتژیهای هوش مصنوعی برای بهرهبرداری از دادههای موجود استفاده میکنند، به موضوعی داغ در ارزیابی شرکتهای بیمهای مهم تبدیل شده است.
بر اساس این مقاله، نکات برجسته اصلی مؤثر بر شارژ مجدد خودکار در این مقاله استخراج شده است شارژ مجدد خودکار قابلیتی است که وقتی موجودی شما به زیر مقدار معینی میرسد، به طور خودکار حساب شما را با اعتبار پیامکی شارژ میکند. این قابلیت تضمین میکند که هرگز اعتبار شما تمام نمیشود و از وقفه غیر منتظره خدمات جلوگیری میکند. شارژ خودکار با کارتهای اعتباری و پیپال کار میکند که این قابلیت در بیمه اطلاعات مربوط به پوشش تصادف را تشریح میکند؛ حتی محاسبه دستگاه بالابر، اندازه بالا رفتن را بررسی میکند.
در این مقاله آمده است که بر اساس دادههای آزمایشی، مدل LightGBM بالاترین فراوانی استفاده و محبوبیت بالایی دارد. عواملی مانند کانال تجاری حفاظت از خودرو، تخفیف بیمه، سن وسیله نقلیه و هزینه خرید یک وسیله نقلیه جدید تأثیر زیادی بر شارژ مجدد یا عدم شارژ مجدد بیمه دارند.
با افزایش تعداد خودروها در جادهها، شرکتها تأکید بیشتری بر بازاریابی دقیق برای جلب مشتریان جدید خواهند داشت. رقابتپذیری سازمانهای بیمهگر بزرگ بر استخراج دانش و اطلاعات حیاتی از کاربران، کالاها و خدمات از دادههای انبوه مشتریان و کسب منابع بیشتر از سوی مشتری متکی است. یک روش برای به دست آوردن مزیت رقابتی استفاده از یادگیری ماشینی و دادهکاوی برای بهبود ارائه خدمات است.
یکی از رایجترین استراتژیها در پیش پردازش دادهها، استراتژی انتخاب ویژگی است. بر حذف ویژگیهای اضافی یا زائد از اطلاعات و انتخاب تعدادی از ویژگیهای کلیدی برای آسان کردن پردازش دادههاست. این استراتژی انتخاب مؤلفة جدید برای جستوجوی اطلاعات انباشته شده را پیشنهاد کرد. این مؤلفه سازگاری استثنایی دارد و برای دادههای حفاظت در موقع حادثه اعمال میشود و با مشکل جمعآوری اطلاعاتی که بیان آن دشوار است، سر و کار دارد. الشمسی و دیگران از محاسبات نامنظم که نوعی روش محاسبه و یادگیری ماشینی است برای کمک به سازمانهای بیمهگر برای پیشبینی تصمیمات مشتری استفاده میکنند تا انواع کمکهای بیشتر و بهتر را بتوانند ارائه کنند.
یانمی جیانگ و همکاران متوجه شدند که مدل LightGBM بهترین عملکرد را داشته است. این مقاله بیش از 60 هزار سوابق پوشش حوادث را بررسی میکند و از مدل محاسبه LightGBM برای شناسایی ویژگیهای کلیدی که بر حفاظت از مشتری تأثیر میگذارد، استفاده میکند و به سازمانها اجازه میدهد تا به طور مؤثرتر تاکتیکهای تبلیغاتی را پرورش دهند.
تصفیه اطلاعات و تغییر نام ویژگیها
ما دادهها را بر اساس حقایق تجاری فعلی تجزیه و تحلیل میکنیم تا اثراتی که هر جزء ارائه میدهد را درک کنیم؛ سپس اطلاعات از قبل پردازش میشود. وظایف اصلی عبارتاند از: حذف دادههای نادرست، جبران کاهش ارزش و غیره. 28 عامل و 65 هزار و 535 داده خام در این مقاله استفاده شده است.
اطلاعات لازم برای حفاظت از مشتری به شرح زیر است است: برچسب منطقه، نوع مالکیت، نوع وسیله نقلیه، دلیل احساس نیاز به حفاظت از وسیله نقلیه، هزینه خرید وسیله نقلیه جدید، سن وسیله نقلیه، نوع حفاظت درخواستی برای وسیله نقلیه، تخفیف بیمه، درجه خطر (کمترین A، E بالاترین)، تاریخ شروع، روز آخر، امکان فعال کردن بیمه خودکار، برند وسایل نقلیه، شماره سری خودرو، آیا وسیله نقلیه از آسیب محافظت شود. آیا وسیله نقلیه از سرقت محافظت شود. میزان حفاظت، مبلغ قسط، تعداد اقساط، مقدار پولی که توافق شده است. پس از بررسی کامل دادهها، مشخص میشود که شماره نزدیک، تاریخ شروع، تاریخ پایان، نام تجاری خودرو و سری خودرو هیچ تأثیری بر حفاظت ندارند. برخی از عناصر به راحتی حذف میشوند.
مقدار مشخصه و جبران ارزش از دست رفته
چندین شکاف در بررسی اطلاعات وجود دارد که به شرح زیر پر میشود:
– از آنجایی که برای بیان دلیل نیاز به حفاظت از وسیله نقلیه و مبلغ پیشنهادی برای وسیله نقلیه وسیله نقلیه یک انگیزه مشخص وجود ندارد، میتوانیم به راحتی این دو جزئیات را حذف کنیم.
– تخفیف بیمه حاوی 11 مشخصه مفقوده است و ما دادههای نمونهای را برای مقادیری که گم شدهاند حذف میکنیم.
– تقریباً 50 هزار ویژگی در درجهبندی سطوح بیمه نقش دارند برای پر کردن دادههای از دست رفته عدد صفر را انتخاب میکنیم.
– احتمالاً جهتگیری فرد محافظت شده نادیده گرفته میشود.
– مشتریان احتمالاً با فراوانی 50 درصد یا زن هستند یا مرد
– بسیاری از نکات برجسته متنی هستند و نمیتوان آنها را در مدل گنجاند.
باید چند مقدار ویژه تعیین شود و ماتریس باید به چند دهانه تقسیم شود. یک مدل، فهرست ارزیابی اجرایی با استفاده از نرخ دقت توصیفی ایجاد میشود و فرض میشود که هر سطح بیمه تعهد مشخصی به این نرخ دارد.
این مقاله دارای نسبت 5:1 بین سطح صفر (خیر) و سطح یک (بله) است که نشاندهندة درجاتی از انحراف است. به منظور بررسی اجرای مدل، شاخصهای ارزیابی شامل نرخ بررسی مثبت سطح F1 و AUC است که یک نمودار گرافیکی است که توانایی تشخیصی یک سیستم طبقهبندیکننده باینری را نشان میدهد؛ زیرا آستانه تمایز متفاوت است.
دستههای کوچک معمولاً برای آموزش الگوریتمهای یادگیری ماشین استفاده میشوند، بدون محدودیت حافظه در کمیت دادههای آموزشی. در هر تکرار، کل مجموعه آموزشی باید با استفاده از الگوریتم GBDT تکرار شود. هدف اصلی LightGBM حل مشکلات GBDT با مدیریت حجم زیادی از داده است. یک سیستم یادگیری مبتنی بر درخت تصمیمگیری به نام LightGBM از گرادیان بوستینگ برای ارائة آموزش موازی کارآمد با سرعتهای آموزشی سریعتر، کاهش نیاز به حافظه، دقت بیشتر و پردازش سریعتر دادهها استفاده میکند. یک مجموعه آموزشی با استفاده از تخصص شرکت ایجاد شده است و دادهها به نمونههای آموزشی تبدیل شده است که مدل میتواند آنها را تشخیص دهد.
مدل محاسبه LightGBM در ارتباط بین این سه نشانگر ارزیابی، به غیر از ارزش F1 که به طور جزئی کمتر از برآورد RF است، پیشرفت خاصی دارد. شکل 2 انحراف ROC را نشان میدهد. محاسبه LightGBM، به طور متوسط، تأثیر بالاتری دارد.
همانطور که در شکل 3 نشان داده شده است، اجزای مؤثر بر بازسازی حفاظت خودرو بر اساس ارتباط در محاسبه LightGBM گروهبندی میشوند. همانطور که در نمودار نشان داده شده است، عناصری که تعمیر مجدد وسیله نقلیه را تعیین میکنند، در درجه اول کانالی برای محافظت از وسایل نقلیه تجاری، تخفیف بیمه، هزینة خرید وسیله نقلیه جدید و سن وسیله هستند. در نتیجه این یافته، شرکتهای بیمه ممکن است از استراتژیهای بازاریابی هدفمندتری برای افزایش درآمد خود استفاده کنند.
ما از طبقهبندی تصادفی برای تخمین احتمال اینکه خریداران بیمه سلامت، بیمه خودرو را از شرکتهای بیمه دریافت کنند، استفاده کردیم. در حین کار بر روی تحقیق، با مسائل و چالشهای ارزیابی یک مجموعه داده با استفاده از دو الگوریتم مواجه شدهایم. بیشترین مشکل را تصمیمگیری و انتخاب الگوریتمی داشت که میتوان از آن به همراه افزایش دقت استفاده کرد. انتخاب یک الگوریتم خاص و ارزیابی مدل و همچنین یافتن گزینههای جایگزین برای انتخاب و پیکربندی ستونهای مختلف و اجرای آزمایش دشوار بود. بیشترین مشکل را در تصمیمگیری و انتخاب الگوریتمی داشت که میتوان از آن به همراه افزایش دقت استفاده کرد انتخاب یک الگوریتم خاص و ارزیابی مدل و همچنین کشف گزینههای جایگزین برای انتخاب و پیکربندی ستونهای مختلف و اجرای آزمایش دشوار بود. علاوه بر این، در طول فرآیند تحلیل مدل با استفاده از یک یا چند الگوریتم، یک مشکل بسیار پیچیده ایجاد شد که باعث ایجاد مشکل در پیشبینی مدل شد.
اعتقاد بر این است که اگر پیشبینی با استفاده از دادههای مؤثرتر و ستونهای بیشتری نسبت به مدل موجود انجام شود، مدل بهتری ممکن است تولید شود تا یک مدل الگوریتم پیشبینی خرید بیمه خودرو دقیقتر و سریعتر تولید شود.
علاوه بر این، روش طبقهبندی تصادفی از مزیت تولید یک مدل پیشبینی سریع و ساده برخوردار است. در نتیجه، یک مدل پیشبینی با نتایج دقت بهبود یافته ممکن است توسعه یابد.
مترجم: نیلوفر ادیبنیا
منبع
https://www.irjmets.com/uploadedfiles/paper/issue_7_july_2022/27508/final/fin_irjmets1656843849.pdf