استفاده از کلاندادهها و هوش مصنوعی، میتواند طیف عظیمی از فرایندهای صنعت بیمه را از طریق تشخیص آن بخشی از زنجیره ارزش که بیشترین نیاز را برای تغییر و بهینه شدن دارند، بهبود بخشد. از جمله آن میتوان به بخش قیمتگذاری اشاره نمود، شرکتهای بیمه میتوانند با تکیه بر هوش مصنوعی به شکل رقابتیتری بر سیاستهای خود قیمت بگذارند.
به طور کلی شرکتهای بیمه با کمک متخصصان اکچوئری، قادر هستند تا همزمان با بسترسازی مناسب در راستای افزایش دانش استفاده از فنآوریها، از طریق همکاری با نهادهای قانونگذار، مانع دخالت در کلاندادهها شوند و لذا خدمات بهتر، دقیقتر و امنتری را به مشتریان خود ارائه نمایند.
در این مقاله به مسائل و مشکلات مربوط به استفاده از کلاندادهها در تخصص اکچوئرال پرداخته خواهد شد. علاوه بر این، راهکارهای حل مشکلات احتمالی از طریق همکاری با نهادهای قانونگذار نیز معرفی میگردند.
این مطالب، بنیانگذار بحثهای مفصلی درمورد میزان تأثیر کلاندادهها و هوش مصنوعی بر تجربه مصرفکنندگان خدمات و محصولات بیمهای است و همچنین چگونگی همکاری میان نهادهای قانونگذار و بیمهگران را در راستای برطرف نمودن تأثیرات مخرب [استفاده از کلاندادهها در الگوسازی اکچوئرال] مورد بحث و بررسی قرار میدهد، بهطوریکه استفاده از نوآوریها نیز نادیده گرفته نشود.
پیشینه پژوهش
الگوریتمهایی که با کلاندادهها پشتیبانی میشوند، زیرساخت هوش مصنوعی هستند. هوش مصنوعی تأثیر بسزایی بر روی مدل کسبوکار بیمه در زمینههای طراحی، بازاریابی، مقررات و خدمات و محصولات بیمهای دارد. برخی از این تأثیرها جزئی هستند و ماهیت تدریجی دارند در حالیکه مابقی، تحولساز بوده و پیامدهایی عمده و جدی را به همراه دارند. با اینکه بیمه کارکردهای مفید و اجتماعی بسیاری دارد، لیکن ممکن است در حین برآورده نمودن تمام توقعات مطلوب اجتماعی، نتواند پایدار و دردسترس نیز باقی بماند. در این مقاله، علاوه بر اینکه به طور خلاصه به تشریح مسائل مرتبط با تخصص اکچوئرال پرداخته شده، مسیری نیز برای کار با نهادهای قانونگذار ارائه شده است، بهطوریکه هم به سود بیمهگذاران بوده و هم چارچوبی نظارتی برای حمایت و تضمین آینده پویای صنعت بیمه به همراه داشته باشد.
چارچوب و مفاهیمی کلیدی که در زیر به آنها اشاره خواهد شد، بسترساز درک محدودیتهای سیستم بیمه در برقراری تعادل بین دو هدف مذکور است.
چارچوب
چارچوب بیمه سنتی بر اساس نیاز به مدیریت نوسان ریسک در سطح فردی و یا گروهی استوار است. به طور سنتی، ساختارهای حقبیمه و محصولات بیمهای، عناصر زیر را شامل میشوند:
· میانگین هزینه ریسک: میزان خسارتهای مورد انتظار.
· هزینه نوسان خسارتهای مورد انتظار: مبلغی که به عنوان جبران هزینههای اضافی برای بیمهگر در نظر گرفته
میشود تا زمانی که خسارتها بیش از موارد پیشبینیشده هستند، امکان جبران آنها از طریق منابع مالی اضافه وجود داشته باشد. به این ترتیب ناظران و سهامداران مطمئن میشوند که شرکت با در اختیار داشتن سرمایه اضافی، توانایی مقابله با پیشامدهای نامساعد را خواهد داشت. این مبلغ در واقع به مبالغ خسارت مورد انتظار افزوده میشود. زیرا معمولاً این نوع منابع مالی به عنوان «استقراضی» برای فروش بیمهنامه در نظر گرفته میشوند و در حکم هزینههای اضافی هستند که باید به کسانی که سرمایه مورد نیاز برای پشتیبانی از محصول بیمهای را فراهم کردهاند، بازگردانده شود.
· هزینهی عدماطمینان نسبت به میانگین و نوسان: زمانیکه برآورد هزینه ریسک مشکل و یا دقت آن بسیار کم باشد، میتوان با طراحی محصولات بیمهای خاص با پوشش محدود، استفاده از سود سهام، استفاده از عناصر غیرتضمینی و یا حقبیمههای ناشی از تمدید بیمهنامه، هزینههای احتمالی این نوع ریسکها را جبران نمود.
· هزینهی بازاریابی، فروش، طراحی، ارائه محصولات بیمهای، تأمین مالی (از جمله ریسک سرمایهگذاری)، نظارت بر هزینهی ریسکهای نوظهور و در نهایت افشای کارایی عملیات بیمهای: این هزینهها در هنگام تعیین حقبیمه برای پوششهای ارائهشده توسط خدمات بیمهای، به میانگین خسارتهای مورد انتظار افزوده میشود. همچنین، ممکن است در محاسبات سرمایه اضافی مورد نیاز نیز لحاظ شوند.
تأثیر کلاندادهها و هوش مصنوعی بر عناصر مذکور [برای تعیین حقبیمه و نوع محصولات بیمهای در روش سنتی بیمه] با توجه به ماهیت و نوع پوشش پیشنهادی، متفاوت خواهد بود. در صورت عدم پیشبینی این هزینهها در تعیین حقبیمه و طراحی محصول بیمهای، در طولانیمدت، بیمهگر توان ماندن در صنعت بیمه را نخواهد داشت [و در نتیجه از بازار رقابتی حذف خواهد شد]. در ایالات متحده آمریکا، کارشناسان نظارت بر بیمه، علاوه بر حصول اطمینان از در دسترس بودن محصولات بیمهای، معمولاً پایدار بودن آن را نیز مدنظر قرار میدهند.
مفاهیم کلیدی
1- الگوی کسبوکار بیمه تعیین میکند چه خدمات خاصی به بیمهگذاران ارائه خواهد شد. این الگو به ارزیابی اینکه کدام بخش از زنجیره ارزش مورد هدف کلاندادهها و هوش مصنوعی بوده [و با استفاده از آنها بهبود مییابد]، کمک میکند. در ادامه به رایجترین کاربردهای کلاندادهها و هوش مصنوعی اشاره میگردد.
· توزیع [محصولات بیمهای]: آیا هوش مصنوعی یا کلاندادهها قادر به تشخیص کاراترین افراد و یا روشها در ارائه و اجرای مؤثر امور بازاریابی بیمهگر هستند؟
· مشتریان بیمه: آیا استفاده از کلانداده و هوش مصنوعی در هنگام فروش و یا در سراسر مدت اعتبار بیمهنامه، تجربه رضایتبخشی برای مشتری به همراه خواهد داشت؟
· فروش بیمه: آیا کلانداده و هوش مصنوعی فرایند فروش را سادهتر و مؤثرتر کرده و به شبکههای توزیع در یافتن مشتری و فروش محصولات بیمهای (به افرادی که بیشترین نیاز را به آن را دارند) کمک مینماید؟
· پشتیبانی و ارائه خدمات (خسارتها، ارزیابی ریسک و صدور بیمهنامه و ذخائر): آیا کلاندادهها و هوش مصنوعی به بیمهگر در بهرهوری خدمات بیمهای کمک خواهد کرد؟
· تشخیص تقلب: آیا شناسایی دقیقتر تقلب در بیمه از طریق کلاندادهها و هوش مصنوعی امکانپذیر خواهد بود؟
· مدیریت ریسک توسط مشتری: آیا کلاندادهها و هوش مصنوعی میتوانند از طریق تشویق بیمهگذاران به سبک زندگی سالمتر ریسکهای آنها را کاهش دهند؟ (به عنوان مثال از طریق برنامههای سلامت).
· پیشبینی قیمت: با توجه به اینکه تعیین قیمت [و یا در واقع تعیین نرخ بیمهنامه و در نتیجه حقبیمه] یک عملیات «پیشبینی» است و از طریق بررسی دادهها، بررسی سوابق ریسک و پیشبینی احتمال وقوع خسارت انجام میشود، آیا بکارگیری کلاندادهها و هوش مصنوعی میتواند با ارائه تخمینهای بهتر و دقیقترِ میانگین و نوسان ریسک، در تعیین حقبیمههای پایینتر و پایدارتر کمک نماید؟
· نهادهای نظارتی بیمه: آیا کلاندادهها و هوش مصنوعی فرایند نظارت بر بیمه را مؤثرتر و کارآمدتر خواهد نمود؟
2- تفاوت ریسک و عدماطمینان (قطعیت) : تحقیقات یک اقتصاددان قرن بیستم به نام فرانک نایت توجه همگان را به تفاوت عدماطمینان و ریسک جلب نموده است. ریسک [و یا عدمقطعیت قابلاندازهگیری] به شرایطی اطلاق میشود که در آن از نتیجه اطلاعی در دسترس نیست، لیکن امکان سنجش صحیح احتمالات وجود دارد، درحالیکه عدمقطعیت [یا همان عدمقطعیت غیرقابلاندازهگیری] شرایطی است که فرد اساساً اطلاعات کافی برای سنجش دقیق احتمالات در دسترس ندارد.
تمامی پوششهای بیمهای که توسط بیمهگران ارائه میشوند، از یک سو با ریسک قابلسنجش و از سوی دیگر با عدمقطعیت احاطه شدهاند. بسته به اینکه ریسک بیمه موردنظر در کجای این طیف قرار گرفته است، ابزارهایی که برای تعیین قیمت و طراحی بیمه به کار میروند نیز متفاوت خواهد بود. از جمله موارد ریسک میتوان به بیمه عمر و بیمه اتومبیل اشاره نمود. بیمه عمر میتواند حقبیمه بلندمدتی را تضمین نماید، درحالیکه بیمه خودرو نیز میتواند پیشبینی نرخ بیمهنامه پایدارتری را ارائه دهد، زیرا ریسک تصادفات بیشتر از نوع حوادث با شدت کم و تواتر زیاد است. برخلاف موارد مذکور، پوششهای بیمهای دیگری نیز وجود دارند که فاجعهبار هستند و به دلیل کمبود تجربه و اطلاعات ناکافی در مورد آنها، از نوع عدم اطمینان به حساب میآیند.
3- بهرهوری در مقابل تحول [در روش ارائه محصولات بیمهای]: وقتی یک فرایند را میتوان به روشی دیگر، سریعتر و ارزانتر انجام داد، راهحل تحلیلی کلاندادهها بر بهرهوری (صرفهجویی در هزینهها( متمرکز شده و یا در چنین مواردی باید فرایند ارائه خدمات بیمهای را تغییر داد؟ این تغییر روش میتواند در بخش فروش، صدور بیمهنامه، قیمتگذاری یا سیاستها و رویههای اجرایی باشد (مانند آنچه در اوبر و لیفت و در بخش خدمات تاکسیرانی اتفاق افتاده است).
4- پیشبینی بهتر در مقابل قضاوت (تحلیل) بهتر: آیا کلاندادهها جایگزین افراد میشوند و یا به عنوان ابزاری برای افزایش کیفیت قضاوت، نوآوری و رفتارهای آنها استفاده خواهد شد؟
· آیا یادگیری ماشین (ML)، نحوه عملکرد و تحلیل متخصص اکچوئری، بیمهگر و مدیر بخش خسارات را تقلید مینماید و یا با استفاده از الگوریتم هوش مصنوعی، [بدون استفاده از دانش انسان] به نتیجه نهایی یک فرایند دست پیدا میکند؟ آیا یادگیری ماشین جایگزین افراد خواهند شد و یا تنها تواناییهای آنها را تقویت و بیشتر خواهند نمود؟
5- ارزیابی دارایی دادهها : درک یکپارچه از کیفیت دارایی دادهها، ملزومات موردنیاز برای سازماندهی و یا غنیسازی دادهها و سرمایهگذاری مداوم روی کیفیت آنها از جمله دغدغههای اساسی کاربردهای هوش مصنوعی و یادگیری ماشین در زمان حال و آینده است.
6- قانون و نظارت: نقش درست قانون برای تقویت و پرورش نوآوری و انجام معاملات همراه با حفظ حریم خصوصی بیمهشده چیست؟
نقش و کارکرد متخصص اکچوئری همگام با ابزارهایی که برای کار اکچوئرال استفاده میشود، تکامل مییابد. در حال حاضر، تخصص اکچوئری در مقایسه با زمانی که دادههای موجود در پوشههای اصلی شرکت، مبنای تنظیم فرضیات قرار میگرفتند، پیشرفتهای زیادی کرده است. با استفاده از کلاندادهها میتوانیم الگوهای رفتاری (که منجر به ایجاد ریسک بیمه شده) روش توزیع و ارائه پوشش مناسب را بررسی نماییم.
این استانداردها توسط هیئت استاندارد اکچوئرال (ASB) منتشر شده و راهنمای متخصصان اکچوئری بههنگام ارائه خدمات میباشد. استانداردهای مذکور به آنها میآموزد که به هنگام تبادل [و ارائه] اطلاعات درباره نتایج خدمات مربوطه چه مواردی را حتماً باید ذکر کنند. البته این استانداردها تمام مراحل مأموریت متخصص اکچوئری را شامل نمیشود و اتخاذ یک رویکرد یا کسب یک نتیجه خاص را به او دیکته نمینماید.
این استاندارها متخصص اکچوئری را ملزم مینماید تا در زمان انتخاب فرضیات، انتخاب دادههای مرتبط با آن و روشهای آماری پیشرفته، فرایند مشخصی را در قضاوت حرفهای خود دنبال کنند. این امکان وجود دارد که متخصصان اکچوئری مختلف با استفاده از دادهها و تکنیکهای آماری پیشرفته یکسان، به نتایجی برسند که به شکل معقولی، متفاوت اما درعینحال، منطقی و قابلتوجیه باشند. همچنین امکان دارد حتی با استفاده از فرضیات و تابع هدف یکسان، متخصصان اکچوئری به شکلی منطقی اما متفاوت دادهها را طراحی نمایند.
در ادامه به استانداردهای تخصص اکچوئرال، به عنوان راهنمایی سودمند برای متخصصان در هنگام استفاده از کلاندادهها و الگوریتمها اشاره شده است:
· استاندارد شماره 1: استاندارد آغازین تخصص اکچوئرال
· استاندارد شماره 2، هزینههای غیرتضمینی و یا سود حاصل از بیمهنامههای عمر و قردادهای مستمری سالیانه. این استاندارد در صورتی قابلاستفاده است که از کلاندادهها و هوش مصنوعی برای تشخیص عناصر تضمیننشده استفاده شود.
· استاندارد شماره 7، بررسی جریانهای نقدی بیمهگر برای بیمههای عمر، سلامت، اموال و تصادفات. این استاندارد در مواردی قابلاستفاده است که فرضیات اکچوئرال بر پایه روشهای پیشرفته تحلیلی باشد.
· استاندارد شماره 12، طبقهبندی ریسک (برای تمام حوزههای کاری). این استاندارد برای آن دسته از مدلهای طبقهبندی ریسک استفاده میشود که از روشهای یادگیری ماشین، مشتق شده باشند.
· استاندارد شماره 15، سود خریداران بیمه عمر، بیمههای مستمری سالیانه و بیمههای از کار افتادگی. این استاندارد زمانی به کار میرود که از یادگیری ماشین برای تنظیم فرضیات یا تعیین سود سهام استفاده میشود.
· استاندارد شماره 23، کیفیت دادهها. این استاندارد راهنمایی برای انتخاب دادهها، بازبینی دادهها، بهکارگیری دادهها و اعتماد به دادههای تهیهشده توسط دیگران در ارائه خدمات اکچوئرال است.
· استاندارد شماره 38، مدلسازی وقایع فاجعهآمیز. این استاندارد به هنگام مطالعه حوادثی با گستردگی و شدت زیاد و احتمال وقوع کم استفاده میشود. از جمله این حوادث میتوان به توفند، زلزله، پیچند، عملیات تروریستی و بیماریهای همهگیر اشاره نمود.
· استاندارد شماره 41، تبادل اطلاعات اکچوئرال. این مورد در واقع استانداردهای مهم تبادل نتایج اکچوئرال را بررسی میکند.
· استاندارد شماره 54، قیمتگذاری بیمه عمر و محصولات مستمری سالیانه. این استاندارد برای آن دسته از متخصصان اکچوئری مورد استفاده قرار میگیرد که خدماتی از قبیل تعیین قیمت (شامل نرخدهی، هزینهها و منافع) ارائه میکنند.
· استاندارد شماره 56، مدلسازی. این استاندارد راهنمایی برای اجرای خدمات اکچوئرال در زمینه طراحی، توسعه، گزینش، تعدیل، استفاده، بازبینی و ارزشیابی مدلها میباشد.
استفاده از کلاندادهها و الگوریتمها در تخصص اکچوئرال هنوز در مراحل اولیه است. هوش مصنوعی نیز هنوز در حال پیشرفت است و همچنان کاربردهای جدیدی از آن در بیمه پدیدار میشود.
به نظر میرسد، مجموعه استانداردهایی که در تخصص اکچوئرال مورد استفاده قرار میگیرند، برای در بر گرفتن کاربردهای آتی کلاندادهها و هوش مصنوعی، به اندازه کافی جامع و کامل نیستند و در آینده نیازمند بروزرسانی و الحاقیههای تکمیلی خواهند بود.
شایان ذکر است، استانداردهای تخصص اکچوئرال فقط راهنمای متخصصان اکچوئری هستند و برای دانشمندان دادههای غیراکچوئری (که از این دادهها برای ساخت سیستمهای طبقهبندی ریسک و مدل قیمتگذاری که نیازمند بازبینی نهاد قانونگذار هستند، استفاده میکنند) کاربردی ندارد. گاهی برخی از نهادهای قانونگذار از تأثیر بسزای این استانداردها در دقت کار متخصصان اکچوئری آگاه نیستند. این در حالی است که نهادهای مذکور، علاوه بر اینکه چالشی را پیشِپای متخصصان اکچوئری قرار میدهند، فرصتی نیز در اختیارشان میگذارند تا خود به عنوان مقام قانونگذار یا همراه با آن مقامات همکاری نمایند و از این طریق، استاندارد بالای محصولات کار اکچوئرال را تقویت نمایند.
برای جلب اعتماد ناظران، میتوان استانداردهایی برای بازبینی مدل هوش مصنوعی ابداع کرد که توقعات قانونگذاران را در انجمن ملی ناظران بیمه آمریکا (NAIC) برآورده سازد. این توقعات راهنمای اصول هوش مصنوعی هستند. بر اساس این راهنما، افرادی که هوش مصنوعی را برای هدایت صنعت بیمه میسازند، باید اصولی را در استفاده از کلاندادهها و هوش مصنوعی رعایت کنند.
انجمن ملی ناظران بیمه معتقد است که استفاده از کلاندادهها و هوش مصنوعی باید بر اساس اصول زیر باشد:
· عادلانه و مطابق با موازین اخلاقی: احترام به قوانین حقوقی و وضع راهحلهای موثق.
· مسئول بودن: به عهده گرفتن مسئولیت ابداع، اجرا و اثرات همه سیستمهای هوش مصنوعی.
· منطبق با قانون: داشتن دانش و منابع آماده برای تطبیق با تمام قوانین و مقررات بیمهای مرتبط.
· شفاف بودن: آمادگی برای توضیح مسئولانه در مورد سیستمهای هوش مصنوعی به افراد ذینفع و توانایی تفحص و بازبینی این افراد درباره تصمیمات بیمهای که به واسطهی هوش مصنوعی گرفته میشود.
· ایمن، بیخطر و استوار بودن: حصول اطمینان از اینکه مجموعه دادهها، فرایندها، تصمیمات اتخاد شده و اجرای مدیریت ریسک اصولی به میزان مناسبی قابلیت پیگیری باشند، تا به این وسیله بتوان ریسکهای مرتبط با حریم خصوصی، امنیت دیجیتال و تبعیضهای ناعادلانه را شناسایی و اصلاح کرد.
بسیار حائز اهمیت است که به قانونگذاران نشان داده شود که استانداردهای تخصص اکچوئرال در کجا با این اصول اشتراک داشته و بر هم تأثیر میگذارند، تا بهاینترتیب بتوان حوزههای مغایر را برطرف کرده و همکاری سالم را تسهیل و در نتیجه اعتماد عموم را جلب کرد.
موازین اخلاقی و هوش مصنوعی
ترویج استفاده اخلاقی از مدلسازی دادهها و هوش مصنوعی، با تعدادی از اصول بنیادین که در راهنمای هوش مصنوعی انجمن ملی ناظران بیمه آمریکا به آنها اشاره شده است، آغاز میشود. این اصول (که به بعضی از آنها در بخش استاندارهای تخصص اکچوئرال اشاره شده است) هنگام استفاده از کلاندادهها و هوش مصنوعی از طریق چند روش مهم در تولید برنامههای اکچوئرال اجرایی میشوند. در زیر بطور خلاصه به آنها اشاره میشود:
· شفافیت و حریم خصوصی: شفافیت به این معنا است که بیمهگر باید منابع دادهها و مهندسی (استخراج) ویژگی برای تبدیل دادهها به مدل دادههای ورودی را مشخص کند. ممکن است [منابع] دادههایی که مهندسی ویژگی روی آنها صورت گرفته است، برای مصرفکننده قابلشناسایی نباشند، و در نتیجه، توانایی اصلاح اشتباهات آن را نداشته باشند. مصرفکننده [محصولات بیمهای] باید بتواند به اطلاعاتی که بیمهگر از آن در تحلیل ریسک بیمهگذار و تعیین نرخ حقبیمه استفاده کرده است، دسترسی داشته باشد و آن را بررسی نماید و از درستی محاسبات مربوط به نرخ حقبیمهای که باید بپردازد، اطمینان حاصل کنند، تا در صورت نیاز، امکان تصحیح اطلاعات نادرست مهیا باشد. بیمهگران نیز باید با انجام اقداماتی، امنیت اطلاعات مصرف کننده را در برابر سوءاستفاده عوامل بد بیرونی و درونی تضمین نمایند.
· کیفیت دادهها: منابع دادهها باید خصوصیتهای زیر را داشته باشند:
۱. برای مدلسازی مناسب و بهروز باشند.
۲. قابلیت ممیزی و تحلیلهای تخصصی را داشته باشند.
۳. اعتبار، نمایهپذیری، تعادل و دقت آنها تست شده باشد.
۴. بررسی دقیق دادهها برای پیدا کردن سوگیریها و تعیین متغیرهای جانشین برای آن دسته از دادههایی که توسط سازمان نظارتی ممنوع شده، انجام شده باشد.
همه این موارد به این معنا است که دادههای مدل آموزشی باید قابلاطمینان [و همچنین نشانهگر مناسبی از کل جامعه آماری] بوده و با ریسکهایی که بیمه میشوند، ارتباطی تنگاتنگ داشته باشند.
· هدف مدل و محدودیتهای آن: در یک مدل باید به طور واضح و روشن به مواردی از قبیل هدف، نحوه استفاده درست از مدل و محدودیتهای آن پرداخته شده باشد. این موارد میتواند شامل مرتبط بودن دروندادهای مدل، انتخاب گروه آماری مناسب برای آن مدل، شرایطی که در آن از دادهها استفاده میشود و همچنین معیارهایی باشد که با علائم خاصی، عدم رعایت موارد مذکور را نشان دهد.
این مدلها نیازمند نظارت کارآمد انسانی برای کنترل دقیق هستند، تا [با نظارت مستمر و بهموقع] بتوانند در صورت مناسب نبودن مدل برای دادهها و مشکل موردنظر، [بلافاصله] هشدار تنظیمات [مجدد] را فعال نمایند.
· پژوهش مسئولانه: پژوهشهای مربوط به توسعه هوش مصنوعی باید بر اصول و شیوههای معتبر علمی استوار و بهطور کاملاً واضح پاسخگوی نیاز مدل باشند. به علاوه باید به اندازه کافی، مستند به یافتههای کنترلشده بوده و برای پیامدهای ناخواسته و سوگیریهای آماری تست شده باشند.
· همبستگی، رابطهی علت و معلولی و یکپارچگی: برای درک و برقراری ارتباط با شیوه تصمیمگیری مدل مورد استفاده، باید احتیاطهای لازم را اتخاذ و الگوهای تشخیصی آن مدل را بررسی و تعیین نمود، بهطوریکه بتوان تشخیص داد که ماهیت این روشها بر اساس رابطه پیوستگی و یا رابطه علت و معلولی [میان دادههای ورودی] انتخاب شدهاست. همبستگی با توان و کیفیت پیوستگی میان دادهها سنجیده میشود.
ارزیابی همبستگی از طریق تحقیقات، تجربه و رفتارهای نظارهگرانه صورت میگیرد، تا از کاذب نبودن آن اطمینان حاصل شود. استاندار طلایی ارزیابی رابطه علت و معلولی کارآزمایی تصادفی کنترلشده (RCT) است که در پزشکی مبتنی بر شواهد و برای اثبات اینکه درمان خاصی، بیماری را علاج خواهد کرد یا نه، به کار میرود.
اکثر مدلهای اکچوئرال به حد نصاب این استاندارد نمیرسند، زیرا کارآزمایی تصادفی کنترلشده، آزمایشاتی هستند که در دورههای طولانی و با موضوعات مورد مطالعه فراوان باید اجرا شوند. مدلهای پیشبینیگر به دنبال الگوهای رابطه پیوستگی و یا همبستگی در مدلسازی دادهها هستند، اما امکان تشخیص رابطه علت و معلولی برای آنها بهطور دقیق وجود ندارد و در نتیجه نمیتوان به آن اعتماد کرد. به علاوه بعضی الگوریتمهای مدلسازی پیشرفته در مواجهه با متغیرهای همبسته، ناپایدار میشوند و برای حذف آنها باید نهایت توجه و احتیاط را به کار بست.
· متغیرهای جانشین برای متغیرهای ممنوعه: متغیرهایی که بهظاهر بیطرف و خنثی هستند، زمانیکه به طور غیرعمدی از متغیرهای ممنوعهای که توسط نهادهای قانونگذار تعیین شده، تقلید کنند، مشکلساز میشوند. این متغیرها بهطور نامتناسبی به زیان بعضی طبقات اجتماعی حفاظتشده هستند. این نکته را هم باید در نظر گرفت که برخی متغیرهای ممنوعه در همه مناطق دنیا ممنوع نیستند. در واقع همین تفاوت در قوانین، منجر به تفاوت مدل یک شرکت خاص از ایالتی به ایالت دیگری میشود. متغیرهای یک مدل که توانایی پیشبینی خود را توسط رابطه همبستگی با یک ویژگی غیرقانونی به دست آوردهاند، لزوماً هدف بدی را دنبال نمیکنند. متغیرهای جانشین غیرآسیبزا، در شرایطی که برخی از ویژگیها به آسانی از طریق منابع داخلی شرکت یا منابع دادههای شخص ثالث به دست نمیآیند، نقش مفیدی را برای مدلسازی ایفا خواهند نمود.
· قابلیت تفسیر و توضیح: در فرهنگ اصطلاحات هوش مصنوعی، تفسیرپذیری به معنی سهولت در فهم یک مدل، بدون کمک گرفتن از منابع بیرونی است. توضیحپذیری، دقیقاً برعکس آن است، یعنی به دلیل دشواری موضوع، نیاز به کمک بیرونی دارد.
برای آزمایش کارآمدی خروجیهای الگوریتمها و تکرار نتایج، توضیحپذیری و تفسیرپذیری هر دو ضروری هستند. تأیید اعتبار مدل به این بستگی دارد که شیوههای کارآمد آزمودن و ممیزیهای مستند برای هدف، وابستگیها، کیفیت دادهها، تصمیمگیری، کنترل و ادارهی خروجیها و نتایج، پشت سر گذاشته شده باشند.
· تنوع در توسعه مدل و بازبینی: برای جلوگیری از ورود سوگیریهای برنامهنویسی به مدل و همچنین جلوگیری از منحرف شدن تدریجی آن، بهتر است که مجموعهای متنوع از بازرسان (مثلا بازرسانی با جنسیت، ملیت، نژاد، سن و تعلیمات مختلف) برای بازبینی ورودیهای مختلف هوش مصنوعی، تصمیمگیری و خروجیهای متناسب با هدف، در اختیار داشته باشیم. به این ترتیب، چشمانداز وسیعتری از سوگیریهای احتمالی و عواقب ناخواسته خواهیم داشت.
دو منبع اصلی سوگیری الگوریتمی، عبارتند از سوگیری دادههای آموزشی و سوگیری برنامه نویسان. اصلاح دادههای آموزشیِ سوگیرانه شاید آسانتر از متنوع کردن گروه مدلسازی باشد. تنوع، با تجارب چندکاره تمام متخصصان آن تجارت به اجرا درمیآید. گروه چندکاره باید شامل کارکردهای ذیل باشد: بیمهگران، تحلیلگران تجاری، متخصصان اکچوئری، آمارگران، برنامهنویسها و حتی مشاور قانونی برای کمک به بازبینی متغیرهای مدل (از تبعیض ناعادلانه جلوگیری شود).
طبقهبندی و قیمتگذاری سنتی ریسک اکچوئرال
در استاندارد شماره 12 تخصص اکچوئرال (در خصوص طبقهبندی)، هیئت استانداردهای تخصص مذکور، طبقهبندی ریسک را در این حرفه به عنوان ابزاری برای قیمتگذاری ریسک معرفی میکند. آکادمی اکچوئریهای آمریکا نیز هدف، طراحی و مدیریت شیوههای طبقهبندی ریسک را گسترش داده و در سال ۲۰۱۱ آن را در تکنگار خطمشیء عمومی خود در خصوص انتخاب ریسک منتشر نموده است.
فرایند طبقهبندی ریسک که یکی از اهداف آن قیمتگذاری عادلانه محصولات بیمهای است، دستهبندی ریسکهایی با ویژگیهای مشابه را شامل میشود. ریسکها برای تعیین میانگینها گروهبندی میشوند تا از این میانگینها برای یک ریسک خاص استفاده شود. سازمان هیئت استانداردهای اکچوئرال معتقد است که هدف از طبقهبندی ریسک، پاداشدهی یا تعیین جریمه برای گروههای خاصی از این ریسکها نمیباشد (بهخصوص وقتی این پاداش یا جریمه به قیمت از دست رفتن سایر گروهها باشد). همانطور که در تکنگار اشاره شد، بیانیه اصول طبقهبندی ریسک (SOP)، خواهان این موضوع است که سه هدف در طبقهبندی ریسک لحاظ شوند:
· حمایت از توانگری مالی صنعت بیمه.
· عادلانه بودن.
· استفاده از مشوقهای اقتصادی برای دسترسی فراگیر به پوششهای مختلف بیمهای.
بیانیه اصول طبقهبندی ریسک پنج اصل زیر را به منظور داشتن یک نظام طبقهبندی معتبر، ارائه مینماید:
· باید تفاوت در هزینههای مورد انتظار را شامل شود.
· باید بتواند ریسکها را بر اساس عوامل مرتبط با هزینه تفکیک کند.
· باید بیطرفانه انجام شود.
· باید کاربردی و مقرونبهصرفه باشد.
· باید موردقبول عموم باشد.
این اصول در زمینههای مناسب بودن نرخ بیمه، گران نبودن و تبعیضآمیز نبودن آن، با خواستههای نهاد قانونگذار منطبق است. به عنوان مثال، حقبیمه عمر بیشتری باید از بیمهگزاران سیگاری اخذ شود، زیرا سلامتی آنها به دلیل استعمال دخانیات بیشتر از افراد غیر سیگاری در خطر است و لذا ریسک این افراد بالاتر است.
طبقهبندی ریسک از نظر طراحی، ذاتاً یک ابزار رقابتی است. شرکتهای بیمهای که به بهترین وجه ممکن ریسکهای بهتر را از بدتر تشخیص میدهند، با قیمتگذاری مناسب میتوانند از سایر رقبای خود پیشی بگیرند. همانطور که در مورد استعمال دخانیات گفته شد، شرکتهایی که نرخهای افراد سیگاری و غیر سیگاری را تفکیک نکرده و یک نرخ کلی برای هر دو دسته تعیین نمودهاند، ناخواسته افراد غیر سیگاری را به سمت شرکتهای بیمهای که نرخهای پایینتری دارند، سوق خواهند داد، در نتیجه افراد پرریسک سیگاری بیشتری در سبد ریسک شرکت باقی خواهند ماند. این بدتر شدن تدریجی سبد ریسک بیمهگر به سمت بیمهگزاران پرریسکتر، در نهایت منجر به مارپیچ انتخاب ریسک نامطلوب خواهد شد.
شرکتهای بیمه عمر از دادههای زیستسنجی برای طبقهبندی ریسک استفاده میکنند. از جمله این دادهها میتوان به میزان فشار خون، سابقه خانوادگی، شاخص تودهی بدنی، میزان کلسترول و آزمایش خون و مایعات بدن، اشاره نمود. چند ابتلایی (که وجود همزمان چند مشکل سلامتی با هم است) نیز باید بررسی شود، زیرا وجود چند عامل ریسک، احتمال مرگ و میر را به شدت افزایش میدهد، که در این شرایط به دلیل بالا بودن ریسک، باید نرخ حقبیمه را افزایش داد.
تشخیص نادرست این بیماریها، منجر به نرخگذاری غیر استاندارد در بیمهنامههای عمر خواهد شد که این امر از طریق متناسب نبودن هزینهها و درآمدها، توانگری مالی بیمهگر را تحت تأثیر قرار خواهد داد و در نهایت کاهش تعداد صدور بیمهنامه را در پی خواهد داشت. اندازهگیری مناسب اطلاعات زیستسنجی باعث میشود که یک ریسک خاص در بخش ریسکهای مطلوب دستهبندی شده و در نتیجه حقبیمه کمتری برای آن لحاظ شود. ریسکهای شغلی و رفتاری نیز باید بر اساس نوع فعالیت و شغل فرد بیمهشده طبقهبندی شوند، در نتیجه خسارت مورد انتظار هر دسته از افراد شاغل در بخشهای مختلف و همچنین نرخ بیمهنامه دقیقتر سنجیده خواهد شد.
سابقه رانندگی پس از مصرف مواد مخدر یا الکل (DUI)، داشتن گواهینامه خلبانی یا اشتغال به حرفههای خطرناک (مانند حفر معدن و داشتن شغل نظامی) نمونههای بارزی از فعالیتها و پیشههایی هستند که باید در بخش فعالیتهای پُرریسک دستهبندی شوند. افشای این فعالیتها به هنگام تقاضای پوشش بیمه، احتمالاً نرخ حقبیمه دائمی یا موقت بالاتری را سبب خواهد شد (به عنوان مثال مقادیر ثابتی که به ازای سرمایه بیمهنامه خریداری شده به حقبیمه افزوده میشود) و یا حتی ممکن است بیمهگر از ارائه پوشش به بیمهگذار پُرریسک خودداری نماید.
طبقهبندی ریسک، یک فرایند کلی است، به این معنی که هر متغیر ریسک به تنهایی اهمیتی ندارد، بلکه هنگامی که به صورت کلی و در کنار سایر متغیرها قرار میگیرد، حائز اهمیت میشود. به عنوان مثال، دیابت یک عامل ریسک است که در صورت کنترل، ریسک آن به میزان قابلتوجهی کاهش مییابد. داشتن دیابت یک عامل ریسک منفی است، اما میتوان با کنترل وزن، شرایط را نسبت به فرد دیابتی غیرفعال بهبود بخشید و حقبیمه کمتری نیز پرداخت نمود. در یک مثال دیگر میتوان به خانههایی که در منطقه سیلخیز قرار دارند اشاره نمود. در این شرایط، خانههایی که در ارتفاع بیشتری هستند با ریسک کمتری مواجه هستند.
تکنیکهای انتخاب ریسک با کلاندادهها، برای شناسایی متغیرهای نرخگذاری مورد استفاده قرار میگیرند. تمام متغیرهای نرخگذاری ریسک باید توسط هیئت استاندارد اکچوئرال و استاندارد شماره 12 تخصص اکچوئرال بررسی شوند.
عدمانطباق یک مدل با این استانداردها، زنگ خطری است که نشاندهنده برآورده نشدن پیشنیازهای نهاد قانونگذار است. همانطور که قبلاً نیز به آن اشاره شد، نرخها باید مناسب بوده و گران و تبعیضآمیز نباشند، تا بتوانند انتظارات قانونگذاران را برآورده نمایند.
تأثیر استنباط رفتاری کلاندادهها بر روش سنتی:
شری ترکل دانشمند دانشگاه تکنولوژی ماساچوست اذعان نمود: «فناوری فقط چیزی که انجام میدهیم را تغییر نمیدهد، بلکه خود ما را تغییر میدهد.» این جمله به ما یادآوری میکند که باید در مورد تأثیرات رفتاری فناوری در شکلدهی دادههای مورد مطالعه و ساخت مدلها آگاه و مراقب باشیم. مثال بارز آن استفاده از دستگاههای خودسنجی پوشیدنی مثل فیتبیت است، که کاربران خود را از لحاظ روانی وادار مینماید تا قبل از خواب، حدود ۱۰ هزار قدم پیادهروی نمایند. این ابزار از لحاظ روانی چنان بر روی کاربران خود اثر میگذارد، که حتی اگر لازم باشد برای تکمیل 10 هزار قدم خود، دور اتاق ناهارخوری پیادهروی نمایند، آن را انجام خواهند داد. اگرچه تعداد 10 هزار قدم هیچ اعتبار علمی ندارد، اما به هر حال تبدیل به یک استاندارد در حفظ تناسب اندام شده است. اطلاعات خودسنجی چند خصوصیت رفتاری خوشایند را درباره بیمهگزاران ارائه میکند از جمله عزت نفس و خودتنظیمی. عزت نفس به معنی باور داشتن به تواناییهای خود برای رسیدن به هدف خاصی است. افرادی که عزت نفس بالایی دارند به چالشهای خودخواسته، مانند همان چالش ۱۰ هزار قدم در یک روز جذب میشوند و با کمترین محرکهای بیرونی آن را انجام خواهند داد.
در واقع، واسطههای داده، دادههای رفتاری را در بازار منتشر میکنند. این دادهها به مدلهای پیشبینیگر بیمه نیز راه یافتهاند، ولی بیمهگران توانایی محدودی در اعتبارسنجی، تعیین دقت و صحت این دادهها دارند.
بعضی شرکتها مثل لکسیس نکسیس، اکسپریان و اکزیوم از طریق پرسشنامه و منابع عمومی، به طور موردی بر روی ویژگیهای شخصیتی و نحوه زندگی افراد تحقیق کرده و از این طریق درآمدزایی مینمایند. شرکتهای بیمه از این اطلاعات به عنوان جزئی از مدلهای پیشبینیگر خود استفاده میکنند. البته استفاده از این دادهها در بعضی حوزهها ایجاد نگرانی میکند، که از جمله این نگرانیها میتوان به موارد زیر اشاره نمود:
· سوگیری نسبت به طبقات اجتماعی حفاظتشده. مقامات ایالتی درحالحاضر شرکتهای بیمه را از جمعآوری اطلاعات نژادی منع میکنند، اما واسطههای داده با چنین ممنوعیتهایی محدود نمیشوند. این افراد میتوانند دادههای نژادی را جمعآوری کرده و برای تولید متغیرهای جدید از آنها استفاده کنند. این کار اساساً حق طبقات حفاظتشده تبعیضآمیز است. هماکنون، هیچ نهاد قانونگذاری برای تأیید اعتبار کیفیت دادههای رفتاری و شیوه زندگی اشخاص ثالث وجود ندارد.
· دسترسی محدود به دادههای رفتاری، شیوه زندگی و دادههای فیزیولوژیکی معتبر - این دادهها برای اعتباربخشی به الگوی رفتاری واقعی و تعیین مقداری مناسبی از داده که برای تشخیص ویژگیهای رفتاری مورد نیاز است، استفاده میشود.
· فقدان شفافیت لازم در جمعآوری و مهندسی دادهها و روشهای تحلیلی واسطهها، که برای تشخیص سوگیرانه بودن یا نبودن دادهها نسبت به طبقات حفاظتشده استفاده میشود.
· نرمافزارهای تشخیص چهرهای که به زیان طبقات حفاظتشده سوگیری شدهاند. نرمافزارهایی که بیمهگران از آن برای تشخیص کلاهبرداری در نرمافزارهای آنلاین بیمه و درخواستهای خسارت استفاده میکنند.
· دادههای آموزشی و برنامهنویسی سوگیرانه، که به معضل اصلی مدلسازی پیشبینیگر و تکنولوژیهای هوش مصنوعی تبدیل شدهاند. زیرا، تأثیر غیرمنصفانه آنها به اثبات رسیده است. نگرانیهایی در مورد الگوریتمهای طراحیشده برای دادههای تاریخی نیز وجود دارند، زیرا الگوریتمهای مذکور سوگیریهای نژادی و جنسیتی دارند.
· فقدان سیاستهای قانونی سختگیرانه در مورد عملیات دیجیتال و تشخیص تبعیضآمیز بودن الگوریتمها. نبود محیط امن دیجیتال برای اجرای آزمایشات ضدتبعیض و فقدان پناهگاه امن دیجیتال که بتوان در آن از سوگیریهای آنلاین جلوگیری کرد.
· اصول اخلاقی بیمهگرانی که رفتار انسانی را از طریق اطلاعات شخصی بیمهگذاران مطالعه کرده و زیرنظر میگیرند تا برآوردی از میزان ریسک آنها داشته باشند. همیشه باید سلایق مشتریان خدمات بیمهای را از اطلاعات احتمالاً نادرست واسطههای داده تفکیک کرد تا منجر به اطلاق یک ویژگی شخصیتی اشتباه نشده و سلایق آنها را باید در اولویت قرار داد.
این مسائل باید بیشتر مورد مطالعه قرار بگیرند. بهعلاوه استفاده از استاندارد شماره ۲۳ و ۵۶ برای کسب اطمینان از اینکه دادهها و الگوها با کمترین میزان سوگیری تنظیم شدهاند، ضروری است. چشمانداز نهاد قانونگذار در تنظیم دستورالعمل تضمین حفاظت مصرفکننده بسیار مهم است. ضمن اینکه این راهنما باید از طریق بکارگیری منابع داده اضافی و روشهای پیشرفتهی مدلسازی، امکان تجربهی بهتری را برای مشتری فراهم آورد.
میزان اعتبار و نظارت بر منابع دادههای بیرونی
گسترس و پیشرفت فنآوری و توان محاسباتی، شرکتهای بیمه را به شناسایی و استفاده از انواع بیشتری از مجموعه دادهها قادر ساخته است. این دادهها که حاوی منابع دادههای خارجی میباشند، معمولاً بهصورت مجموعهای از پیشآمادهشده بوده و میتوانند بلافاصله توسط شرکت بیمه استفاده شوند. دادهها ممکن است به صورت کاملاً ساختاریافته، نیمه ساختاریافته و یا کاملاً غیرساختاری، ارائه شوند و امکان دارد برخی از آنها پردازشنشده و برخی نیز توسط نرمافزارهای بیرونی همانند برنامههای شخص ثالث مورد پردازش قرار گرفته باشند. دادههایی که از منابع بیرونی [شرکت] به دست آمدهاند، ممکن است حاوی سوگیری، خطا و یا مقادیر ازقلمافتاده باشند، که میتوان این کمبودها را اصلاح یا شناسایی کرد.
هدف و کیفیتی که دادهها به منظور آنها انتخاب شدهاند، باید با کاربردهای جدید احتمالی این دادهها هماهنگ باشد و این موضوع نیاز به بررسی و بازبینی دارد. دادههایی که با الگوریتم شخص ثالث پردازش شدهاند، ممکن است برای استفاده شرکت بیمه مناسب نباشند و ارزش پیشنهادی آن را به خطر اندازند. شرکتهایی که منابع بیرونی غیرسنتی کلانداده را استفاده میکنند، احتمالا نیاز به کنترل اولیه کمتری نسبت به زمان استفاده از منابع سنتی خواهند داشت. منابع گستردهای از دادهها ممکن است توسط نهادهای نظارتی مختلف، با قوانین و شیوههای قضایی گوناگون، بررسی شده و یا اصلاً کنترل نشده باشند. کمبود منبع اعتبارسنجی مستقل برای مدلهای نوظهور کلاندادهها، یکی از مشکلات اصلی در این بخش است، زیرا روشهای اعتبارسنجی سنتی دادهها شاید برای این مدلهای جدید قابلیت استفاده نداشته باشند. درحالحاضر، هیچ سازمان نظارتی برای قانونگذاری، اعتبارسنجی و تأیید قانونی منابع دادهای غیرسنتی در صنعت بیمه وجود ندارد.
اکچوئریها میتوانند برای دریافت راهنمایی لازم در خصوص وارد کردن دادههای جدید در مدلهای خود، به استاندارد شماره 23 تخصص اکچوئری مراجعه کنند. اصول استاندارد مذکور، راهنمای ارزشمندی برای شرکتهای بیمه، حتی برای غیراکچوئریها، در راستای ارزیابی کیفیت و تعیین میزان کاربردی بودن دادهها (قبل از استفاده از آنها) میباشد. این اصل مبین آن است، که دادهها باید برای مناسب بودن، مرتبط بودن، سازگاری و بهروز بودن جهت طبقهبندی ریسک و رویکردهای قیمتگذاری، اعتبارسنجی شوند.
سؤالاتی که در خصوص دادهها باید بررسی شوند عبارتند از:
۱. آیا میتوان برای یک هدف خاص، به این منابع داده تکیه کرد؟
۲. آیا این دادهها در رسیدن به هدف مدل، کمک خواهند کرد؟
شرکتها باید چارچوب حاکمیتی خود را طوری ارتقا دهند، که موارد زیر را شامل شود:
۱. اعتبارسنجی منابع دادههای بیرونی از لحاظ کیفیت.
۲. بازبینی شیوههای جمعآوری دادههای شخص ثالث.
۳. دستورالعمل تضمین کیفیت برای منابع دادههای خارجی.
۴. تحلیل دادهها برای انطباق آنها با الزامات قانونی موجود.
برای یک شرکت بیمه، دسترسی و توضیح روش پردازش دادههای داخلی و الگوریتمهای مورد استفاده تهیهکنندگان دادههای شخص ثالث، کار آسانی نیست. شرکت بیمه میتواند با اثبات زیانبار نبودن اطلاعات بیرونی برای مصرفکنندگان خدمات بیمهای و همچنین اثبات اینکه این دادهها حاوی متغیرهای جانشین برای متغیرهای ممنوعه نیستند، به این مشکل فائق آید. این کار موجب ایجاد اعتماد در میان ناظران قانونی و مصرفکنندگان خواهد شد.
کنترل اثرات نظاممند و عوامل اقتصادی اجتماعی
سوگیری از راههای بیشماری میتواند به فرایند مدلسازی وارد شود. در واقع، مرحله ساختن مجموعه دادهها، اولین نقطه ورود سوگیری است. اکثر مقالات تحقیقاتی تأیید نمودهاند که تمام مجموعه دادهها حاوی سوگیری هستند و علاوه بر آن، بیشتر مدلسازان از سوگیریهای ذاتی در مجموعه دادهها مطلع نیستند و یا دانش لازم برای برطرف کردن آن را ندارند. اگر چنانچه مدلسازان در مورد چگونگی ایجاد و پردازشهای دادههای مدلسازی تحقیق نکنند، ممکن است سوگیری در نتایج الگوسازی آنها نیز نفوذ کند.
چنانچه الگوریتمها به هنگام تفسیر نتایج حاصل از دادهها، به وجود متغیرهای مخدوشکننده توجه نداشته باشند، توانایی ردیابی الگوهای پیشبینی در دادهها را از دست خواهند داد. به عنوان مثال یک الگوریتم سلامتی که معیارش هزینه درمان است، ممکن است اشتباهاً برخی از گروههای جمعیتی را تنها به دلیل اینکه مراجعه کمتری به مراکز درمانی داشتهاند و در نتیجه هزینههای درمانی کمتری پرداخت کردهاند، به عنوان گروهی سالمتر از بقیه افراد در نظر بگیرد. اما این در حالی است که پایین بودن هزینههای درمان این دسته از افراد میتواند به دلیل مباحث سیستمی و نبود امکانات لازم برای دسترسی به مراکز درمانی باشد و لذا لزوماً دلیلی بر سالمتر بودن آنها نیست.
بررسی دادههای مدل میتواند با طرح سؤالاتی مانند موارد زیر آغاز شود:
۱. چه کسانی در این دادهها حذف شدهاند و پیامدهای حذف این افراد در نتایج مدل چیست؟
۲. دادهها تا چه حد نماینده جمعیتی هستند که مدل روی آنها پیاده میشود؟
۳. در دادهها چه سوگیریهای تاریخی وجود دارد؟
۴. چه سوگیریهای اجتماعی میتواند سوگیریهای تاریخی را تفسیر کند؟
۵. قبل از اینکه دادهها برای مدلسازی استفاده شوند، چه پردازشهایی روی آنها انجام شده است؟
۶. آیا دادهها برای انواع سوگیریها مثل سوگیری پاسخ، سوگیری انتخاب، سوگیری انحراف شیوه، سوگیری متغیرهای حذفشده و سوگیریهای اجتماعی مورد وارسی قرار گرفتهاند؟
تمرکز بر انجام تحقیقات روی دادهها بسیار مهم است، زیرا این دادهها هستند که الگوریتم را میسازند، ولی برعکس آن صادق نیست.
فرایند مدلسازی را میتوان به عنوان دومین نقطه ورود سوگیری دانست. برنامهنویسان با وارد نمودن فرضیات و تفسیرهای اشتباه خود در فرایند مدلسازی، ورود سوگیری را نیز سبب میشوند. متنوع نبودن اعضای گروه مدلسازی، میتواند در اشتباه بودن تفسیر نتایج مدل تأثیرگذار باشد، بهطوریکه میان استنباط علیت و پیشبینیهای مدل، شکاف حاصل شود. مدلسازی باید یک فعالیت چندجانبه باشد، بهطوریکه با بهرهگیری از تخصصهای متنوع (حتی بیش از حد نیاز) و در نتیجه فهم بهتر الگوریتمهای پیچیده ریاضی، بتواند نقطه ضعف خود را در مقابل متغیرهای علوم اجتماعی برطرف نماید. این موضوع در درک نتایج مدل از طریق تحقیق کیفی حائز اهمیت است.
استفاده از چشماندازهای متنوع در تحلیل نتایج مدل برای طراحان آن ضروری است، زیرا از این طریق میتوانند در تمام مراحل، از ورود سوگیری به فرایند مدلسازی جلوگیری نمایند.
سومین نقطه ورود سوگیری، در مرحله استفاده از خود مدل صورت میگیرد. یک جمله مشهور در مدلسازی پیشبینیگر بیان میدارد: «اگرچه تمام مدلها اشتباه هستند، اما برخی نیز مفید هستند». ریسک استفاده از یک مدل زمانی افزایش میباید که از آن برای مسئلهای نامرتبط و نادرست استفاده شود و یا دادههای آن از فرضیات نظری روش مدلسازی تبعیت نکنند. حتی زمانی که یک مدل کاملاً هماهنگ با دادهها باشد، امکان دارد محاسبات، اجرا و یا تفسیر آن به درستی صورت نگیرد و منجر به نتایج سوگیرانه شود. نتایجی که علیرغم سوگیرانه بودن، به عنوان نتایج حقیقی استفاده شوند. مدلها باید توسط گروهی مستقل و در عینحال متشکل از متخصصان مختلف (که در ساخت مدل دخیل نیستند)، به طرز سختگیرانهای اعتبارسنجی شوند. تنها کارکرد این گروه، حصول اطمینان از بینقص بودن ریاضیات مدلهایی است، که بزودی به چرخهی تولید وارد میشوند ( و از این طریق مطمئن میشوند که ریسکی متوجه شرکتها و مصرفکنندگان نخواهد بود).
این بحث زمینهساز چارچوبی اولیه برای ارزیابی چگونگی ورود سوگیریها به مدل هستند. ابداع ابزار ارزیابی و معیارهایی برای تشخیص سوگیری و رفع احتمالی آنها، در طول فرایند مدل سازی بسیار حائز اهمیت است.
دغدغههای نهاد قانونگذار و تأثیر آنها بر عملکرد اکچوئری
نهادهای قانونگذار، دغدغههای بسیاری درمورد استفاده از کلاندادهها، چگونگی اعتماد به منابع خارجی دادهها، بکارگیری منابع غیراکچوئری (در طراحی و ساخت فرضیات)، محاسبه و ارزیابی ریسک و در نهایت تعیین قیمت مدلها دارند.
امروزه، همراه با مجهز شدن مصرفکنندگان به تکنولوژی، توانا شدن آنها در خودسنجی و اتصال به پایگاههای رسانهای مجازی، دادههای غیرسنتی به منابع حیاتی برای صدور بیمهنامه تبدیل شدهاند. این منابع جدید دغدغههای مربوط به حریم خصوصی و مالکیت داده را افزایش داده است. مسئله مهم دیگر این است که معتبرسازی قانونی دادهها و تطابق آنها با استانداردهای نهاد قانونگذار، اهمیت بیشتری از کیفیت دادهها دارد. مسئلهی بعدی وقتی پیش میآید که یک مدل با استفاده از منابع بیرونی ساخته شده باشد و در شرکت، متخصصان داخلی کافی، برای اعتبارسنجی آن و اعتبارسنجی ورودیها و خروجیهای آن وجود نداشته باشد. قانونگذاران میخواهند از کیفیت دادهها و تبعیضآمیز نبودن الگوریتمها اطمینان حاصل کنند. مدلها باید متکی به اسناد و مدارک کافی باشند تا بتوان آنها را [در شرایط مشابه] تکرار کرد. طراحان مدل باید فرضیات و الگوریتمهای آن را نه فقط برای سهامداران اصلی بلکه بهمنظور ایجاد شفافیت، برای عموم نیز به خوبی توضیح دهند.
بیمهگران و نهاد قانونگذار باید با همکاری یکدیگر، فرایندهایی ایجاد نمایند که رضایت هر دو طرف را در بر داشته باشد، این فرایندها باید پاسخگوی موارد مهم زیر باشند:
۱. چطور باید از امنیت اطلاعات افراد بیمهشده و استفاده از آنها فقط بهمنظور خاص، اطمینان حاصل کرد.
۲. چگونه اطمینان حاصل نماییم که متغیرهای مهم در مدلهای اکچوئرال، ناعادلانه و تبعیضآمیز یا جانشین متغیرهای ممنوعه نهاد قانونگذار نیستند.
۳. چگونه سوگیریهای آماری را در دادههای مدلسازی شناسایی کرده و از مرتبط بودن ریسک بیمهشده با متغیرهای مهم، اطمینان حاصل کنیم.
۴. در صورتیکه شرکتهای بیمه، الگوریتمهای یادگیری ماشین را قبل از مدلهای خطی تعمیمیافته، پذیرفته باشند، چگونه از توضیحپذیری و تفسیرپذیری الگوریتمهای مدلسازی و نتایج آن اطمینان حاصل نماییم.
۵. چگونه میزان جزئیات مورد نیاز برای نتایج صدور بیمهنامه را (با رعایت این موضوع که ناخواسته منجر به تأثیرات نابرابرانه بر طبقات حفاظتشده نشود)، تعیین نماییم. شرکتهای بیمه موظفند که مناسب بودن متغیرهای مهم بهکاررفته در مدلهای خود را به تأیید برسانند و علاوه بر آن کیفیت دادهها را نیز توسط اکچوئریها و سایر متخصصان که از بازار بیمه، محصولات بیمهای و مسئولیتها مطلع هستند، مورد بازبینی قرار دهند.
۶. چگونه مطمئن شویم که شرکتها اجازه اجرای الگوریتمهای «جعبهی سیاه» را بدون نظارت انسانی نخواهند داد. نظارت انسانی تضمینگر این است که ابزارهای هدایت و معیارها درست کار میکنند و توانایی سنجش تناسب و هماهنگی مدلها را برای اهدفی که برایشان طراحی شدهاند، دارند.
بخشنامه شماره 1 بیمه ایالت نیویورک که در سال 2019 منتشر شدهاست، منبعی مفید و حاوی ملاحظات مهم قانونی
برای شرکتهای بیمه میباشد. این بخشنامه استفاده از دادههای خارجی و بعضی رویکردهای خاص در دادههای تحلیلی
و مدلهای پیشبینیگر را نیز در بر میگیرد. اگرچه کاربرد این بخشنامه بیشتر برای شرکتهای بیمه عمر (در زمینه
استفاده از منابع بیرونی و منابع اطلاعاتی در صدور بیمهنامه کاربرد دارد، اما میتوان از آن به عنوان راهنمایی برای اطلاعرسانی دیگر بخشهای صنعت بیمه نیز استفاده کرد. این راهنما استفاده از دادههای بیرونی را از منابع دادههای غیرسنتی تشخیص داده و مزایای احتمالی صدور بیمهنامه و فروش بیمه عمر را به روشی سادهتر نشان میدهد و باعث بهبود و گسترش صدور بیمهنامه میشود. این بخشنامه همچنین خاطرنشان میسازد که دادههای خارجی و الگوریتمها میتوانند تأثیر منفی بر مواردی از قبیل دردسترس بودن و مناسب بودن قیمت بیمه عمر برای مشتریان طبقات حفاظتشده داشته باشند. این مسأله با همکاری متقابل نهاد قانونگذار و بیمهگران میتواند بهطور مؤثری رفع شود.
تأثیر کلاندادهها بر تحول صنعت بیمه
شکی نیست که کل صنعت بیمه در معرض تحول ناشی از نوآوریهای فنآوری بیمه ، قدرت پیشبینیگر تحلیلی پیشرفته و هوش مصنوعی قرار دارد. اکچوئریها بر این باورند که به روز نمودن ابزار سنتی مورد استفاده در این حرفه، برای تحلیل دادهها جدیدی که توسط فنآوریهای نوین تولید میشوند و برای ارتقای طبقهبندی و قیمتگذاری ریسکهای کنونی و آینده ضروری است. تخصص اکچوئرال در حال تکامل و آمادهسازی متخصصان برای پذیرفتن فناوریهای جدید و تولید داده، همزمان با تمرکز بر روی بر یادگیری ماشینی در رشته دانشگاهی اکچوئرال میباشد.
با وجود همه مطالب ذکر شده، اکچوئریها نمیتوانند فعالیتهای بیمهای را بدون همکاری با نهاد قانونگذار (برای اثبات اینکه این نوآوریها به امنیت مصرفکننده لطمه نمیزنند) انجام دهند.
همراه با ورود فنآوریهای جدید بیمهای، میتوان همزمان شاهد تحول و همچنین تخریب صنعت بیمه باشیم. لذا بدیهی است که این تحول با ساختارشکنی عظیم همراه باشد. استفاده از روشهای یادگیری ماشین و کلاندادهها در مدلسازی اکچوئرال، باعث ایجاد نگرانیهایی برای نهاد قانونگذار در خصوص حفظ امنیت مصرفکننده شده است. سه نکته آموزشی که از این تجربه به دست میآید و برای حفظ هوشیاری صنعت بیمه اهمیت دارد، عبارتند است از:
۱. الگوریتمها نباید منجر به آسیب رساندن به مصرفکننده و به مخاطره انداختن اعتبار وی شوند. الگوریتمها و دادههای آموزشی باید مطابق با استانداردهای مورد نیاز باشند. گروههای مدلسازی نیز باید شامل افرادی با تخصصهای متنوع بوده، تا سوگیری نسبت به افراد طبقات حفاظتشده کاهش یابد.
۲. اگرچه پوششهای بیمه برای حل تمام مشکلات ساختاری و اجتماعی طراحی نشده است، اما در دسترس بودن و پایداری آن باید مورد توجه قرار گیرد، لیکن نباید با محدود کردن دسترسی به بیمه و گرانی محصولات آن، به این مشکلات دامن زده شود. استفاده از هوش مصنوعی و کلاندادههای همسو با سیاستهای قانونگذار، برای شناسایی کسانی که از بیمه خرد سود میبرند، مفید خواهد بود. همچنین این روشها برای شناسایی راهحلهای عمومی برای کاهش هزینه محافظت در برابر ریسک نیز سودمند میباشند.
۳. برای گسترش و بکارگیری هوش مصنوعی باید از رویکرد چندجانبه استفاده شود. شواهد فراوانی وجود دارد که نشان میدهند، رویکردهای متنوع و چندجانبه، به راهحلهای مؤثرتر، همراه با سوگیری کمتری میانجامند. در مقایسه با بسیاری از رشتههای فوقتخصصی، تخصص اکچوئرال به نسبت جمعیت، چندان متنوع نیست. تحقیقات نشان میدهند که کمبود تنوع در تخصصها، برای کاهش سوگیری الگوریتمی مشکلساز خواهد بود. وقتی تنوع و مهارتهای چندجانبه در گروههای مدلسازی کم باشند، اهمیت سایر معیارهای کاهنده سوگیری دوچندان میشود. این معیارها برای ایجاد اعتماد بین بیمهگران، عموم مردم و نهاد نظارتی قانونگذار لازم میباشند و شامل موارد زیر هستند:
الف. تحلیل متغیر هدف؛
ب. حسابرسی بیطرفانه نتایج؛
ج. تمرکز بر ساختار دادههای آموزشی؛
د. شفافیت بیشتر روششناسی الگوریتم و
هـ. معیارهای اعتبارسنجی برای کاهش نگرانی درمورد سوگیریهای الگوریتمی.
البته در بهترین شرایط نیز، احتمال ورود سوگیری به الگوریتمها وجود دارد. لذا تنها راه ممکن برای حفظ اعتماد، عزتنفس، جلب احترام نهاد قانونگذار و عامه مردم، هوشیاری و مراقبت آشکار برای شناسایی و رفع سوگیریهاست. نهاد قانونگذار نیز باید با فراهم کردن فناوری قانونگذاری امن، به بیمهگران اطمینان دهد که بدون فاش کردن اسرار تجاری شرکت، میتوانند با این نهاد صادق باشند. در این راستا، ضروریست که تکامل نهاد قانونگذار و صنعت بیمه، هر دو در جهت منافع عامه باشد.
مترجم: کریستین جانفزا، کارشناسی ارشد اقتصاد نظری، دانشگاه تهران؛ کارشناس اداره کشتی و پیاندآی، بیمه مرکزی جمهوری اسلامی ایران
از جمله این برنامههای سلامتی میتوان به دستگاههای پوشیدنی پایش سلامت همانند ساعتهای هوشمند اشاره نمود.
Data asset: A data asset may be a system or application output file, database, document, or webpage
Actuarial Standards of Practice
Actuarial Standards Board
National Association of Insurance Commissioners :
سازمان ملی هیئت بیمه بهطور یکپارچه اصول راهنمای هوش مصنوعی را پذیرفته و تأیید میکنند، 20ام ماه اوت سال 2020.
Feature Engineering : مهندسی ویژگی یا استخراج ویژگی یا کشف ویژگی، فرایند استفاده از دانش دامنه برای استخراج ویژگیها (مشخصات، خواص، صفتها) از دادههای خام است. انگیزه استفاده از این ویژگیهای اضافی برای بهبود کیفیت نتایج حاصل از فرایند یادگیری ماشین است، در مقایسه با ارائه تنها داده خام به فرایند یادگیری ماشین (منبع: ویکیپدیا)
اصطلاح پیوستگی به طور وسیعی به هرگونه ارتباطی اشاره دارد، درحالیکه اصطلاح محدودتر یعنی همبستگی بیشتر به رابطه خطی بین دو متغیر اشاره دارد.
Analysis of self-efficacy theory of behavioral change”; Cognitive Therapy and Research; 1977.
Nudge: Improving Decisions About Health, Wealth, and Happiness; Richard Thaler and Cass Sunstein; 2009.
Algorithmic bias detection and mitigation: Best practices and policies to reduce consumer harms; Brookings Institution; May 22, 2019
Ethics, Data and Insurance: 4 Developments Worth Watching”; nft.nu; April 2017.
Third-party software: برنامههای ثالث، برنامههایی هستند که برای کار درون سیستم عاملها نوشته شده، اما به وسیله افراد یا شرکتها به غیر از تولیدکننده سیستم عامل نوشته میشوند.
What Do We Do About the Biases in AI?”; Harvard Business Review; Oct. 25, 2019.
confounding variables : متغیرهایی مخدوشکننده، متغبرهایی هستند که بر روی رابطه علت و معلولی بین دو متغیر تأثیر می گذارند و باعث می شوند که رابطه علت و معلولی قویتر یا ضعیفتر از حد معمول جلوه کند.
این موضوع مطلبی به زبان ساده در مورد این سوگیریهاست.
Insurance Markets: Benefits and Challenges Presented by Innovative Uses of Technology; Government Accountability Office; June 7, 2019.
“Insurance Circular Letter No. 1 (2019)”; New York Department of Financial Services; Jan. 18, 2019.