عنوان گروه خبري / نوآوری و فن‌آوری بیمه . مدیریت ریسک . بیمه‌های زندگی . بیمه درمان . بیمه اتومبیل . بیمه حوادث . سایر .
  • ساعت : ۰۸:۴۵
  • تاريخ :
     ۱۴۰۱/۱۱/۱۰ 
  • تعداد بازدید : 225
نقش كلان‌داده‌ها و الگوریتم‌ها در الگو‌سازی بیم‌سنجی و تأثیرات آن بر مصرف‌كننده
مترجم: کریستین جانفزا
در دنیای کنونی همه صنایع تحت تأثیر پیشرفت سریع فن‌آوری‌های نوین قرار گرفته‌اند، صنعت بیمه نیز از جمله کسب و کارهای مهمی است که با ورود فن‌آوری‌های بیمه و استفاده از کلان‌داده‌ها، هوش مصنوعی و یادگیری ماشینی، دستخوش تحولات گسترده‌ای شده است.

استفاده از کلان‌داده‌ها و هوش مصنوعی، می‌تواند طیف عظیمی از فرایندهای صنعت بیمه را از طریق تشخیص آن بخشی از زنجیره ارزش که بیشترین نیاز را برای تغییر و بهینه شدن دارند، بهبود بخشد. از جمله آن می‌توان به بخش قیمت‌گذاری اشاره نمود، شرکت‌های بیمه می‌توانند با تکیه بر هوش مصنوعی به شکل رقابتی‌تری بر سیاست‌های خود قیمت بگذارند.

به طور کلی شرکت‌های بیمه با کمک متخصصان اکچوئری، قادر هستند تا هم‌زمان با بسترسازی مناسب در راستای افزایش دانش استفاده از فن‌آوری‌ها، از طریق همکاری با نهادهای قانون‌گذار، مانع دخالت در کلان‌داده‌ها شوند و لذا خدمات بهتر، دقیق‌تر و امن‌تری را به مشتریان خود ارائه نمایند.

در این مقاله به مسائل و مشکلات مربوط به استفاده از کلان‌داده‌ها در تخصص اکچوئرال پرداخته خواهد شد. علاوه بر این، راهکارهای حل مشکلات احتمالی از طریق همکاری با نهادهای قانون‌گذار نیز معرفی می‌‌گردند.

این مطالب، بنیان‌گذار بحث‌های مفصلی درمورد میزان تأثیر کلان‌داده‌ها و هوش مصنوعی بر تجربه‌ مصرف‌کنندگان خدمات و محصولات بیمه‌ای است و همچنین چگونگی همکاری میان نهادهای قانون‌گذار و بیمه‌گران را در راستای برطرف نمودن تأثیرات مخرب [استفاده از کلان‌داده‌ها در الگوسازی اکچوئرال] مورد بحث و بررسی قرار می‌دهد، به‌طوری‌که استفاده از نوآوری‌ها نیز نادیده گرفته نشود.

پیشینه پژوهش

الگوریتم‌هایی[1] ­که با کلان‌داده‌ها پشتیبانی می‌شوند، زیر‌ساخت هوش مصنوعی[2] هستند. هوش مصنوعی تأثیر بسزایی بر روی مدل کسب‌و‌کار بیمه در زمینه‌های طراحی، بازاریابی، مقررات و خدمات و محصولات بیمه‌ای دارد. برخی از این تأثیرها جزئی هستند و ماهیت تدریجی دارند در حالی‌که مابقی، تحول‌ساز بوده و پیامد‌هایی عمده و جدی را به همراه دارند. با اینکه بیمه کارکردهای مفید و اجتماعی بسیاری دارد، لیکن ممکن است در حین برآورده نمودن تمام توقعات مطلوب اجتماعی، نتواند پایدار و دردسترس نیز باقی بماند. در این مقاله، علاوه بر اینکه به طور خلاصه به تشریح مسائل مرتبط با تخصص اکچوئرال پرداخته شده، مسیری نیز برای کار با نهادهای قانون‌گذار ارائه شده است، به‌طوری‌که هم به سود بیمه‌گذاران بوده و هم چارچوبی نظارتی برای حمایت و تضمین آینده‌ پویای صنعت بیمه به همراه داشته باشد.

چارچوب و مفاهیمی کلیدی که در زیر به آن‌ها اشاره خواهد شد، بسترساز درک محدودیت‌های سیستم بیمه در برقراری تعادل بین دو هدف مذکور است.

چارچوب

چارچوب بیمه‌ ‌سنتی بر اساس نیاز به مدیریت نوسان ریسک در سطح فردی و یا گروهی استوار است. به طور سنتی، ساختارهای حق‌بیمه و محصولات بیمه‌ای، عناصر زیر را شامل می‌شوند:

· میانگین هزینه‌ ریسک: میزان خسارت‌های مورد انتظار.

· هزینه‌ نوسان خسارت‌های مورد انتظار: مبلغی که به عنوان جبران هزینه‌های اضافی‌ ‌برای بیمه‌گر در نظر گرفته

می‌شود تا زمانی که خسارت‌ها بیش از موارد پیش‌بینی‌شده هستند، امکان جبران آن‌ها از طریق منابع مالی اضافه وجود داشته باشد. به ‌این ‌ترتیب ناظران و سهامداران مطمئن می‌شوند که شرکت با در اختیار داشتن سرمایه اضافی، توانایی مقابله با پیشامدهای نامساعد را خواهد داشت. این مبلغ در واقع به مبالغ خسارت مورد انتظار افزوده می‌شود. زیرا معمولاً این نوع منابع مالی به عنوان «استقراضی» برای فروش بیمه‌نامه در نظر گرفته می‌شوند[3] و در حکم هزینه‌های اضافی هستند که باید به کسانی که سرمایه‌ مورد نیاز برای پشتیبانی از محصول بیمه‌ای را فراهم کرده‌اند، بازگردانده شود.

· هزینه‌ی عدم‌اطمینان نسبت به میانگین و نوسان: زمانی‌که برآورد هزینه ریسک مشکل و یا دقت آن بسیار کم باشد، می‌توان با طراحی محصولات بیمه‌ای خاص با پوشش محدود، استفاده از سود سهام[4]، استفاده از عناصر غیرتضمینی[5] و یا حق‌بیمه‌های ناشی از تمدید بیمه‌نامه، هزینه‌های احتمالی این نوع ریسک‌ها را جبران نمود.

· هزینه‌ی بازاریابی، فروش، طراحی، ارائه‌ محصولات بیمه‌ای، تأمین مالی (از جمله ریسک سرمایه‌گذاری)، نظارت بر هزینه‌‌ی ریسک‌های ‌نوظهور و در نهایت افشای کارایی عملیات بیمه‌ای: این هزینه‌ها در هنگام تعیین حق‌بیمه برای پوشش‌های ارائه‌شده توسط خدمات بیمه‌ای، به میانگین خسارتهای مورد انتظار افزوده می‌شود. همچنین، ممکن است در محاسبات سرمایه اضافی مورد نیاز نیز لحاظ شوند.

تأثیر کلان‌داده‌ها و هوش مصنوعی بر عناصر مذکور [برای تعیین حق‌بیمه و نوع محصولات بیمه‌ای در روش سنتی بیمه] با توجه به ماهیت و نوع پوشش پیشنهادی، متفاوت خواهد بود. در صورت عدم پیش‌بینی این هزینه‌ها در تعیین حق‌بیمه و طراحی محصول بیمه‌ای، در طولانی‌مدت، بیمه‌گر توان ماندن در صنعت بیمه را نخواهد داشت [و در نتیجه از بازار رقابتی حذف خواهد شد]. در ایالات متحده آمریکا، کارشناسان نظارت بر بیمه، علاوه بر حصول اطمینان از در دسترس بودن محصولات بیمه‌ای، معمولاً پایدار بودن آن را نیز مدنظر قرار می‌دهند.

مفاهیم کلیدی

1- الگوی کسب‌وکار بیمه[6] تعیین می‌کند چه خدمات خاصی به بیمه‌گذاران ارائه خواهد شد. این الگو به ارزیابی این‌که کدام بخش از زنجیره ارزش مورد هدف کلان‌داده‌ها و هوش مصنوعی بوده [و با استفاده از آنها بهبود می‌یابد]، کمک می‌کند. در ادامه به رایج‌ترین کاربردهای کلان‌داده‌ها و هوش مصنوعی اشاره می‌گردد.

· توزیع [محصولات بیمه‌ای]: آیا هوش مصنوعی یا کلان‌داده‌ها قادر به تشخیص کاراترین افراد و یا روش‌ها در ارائه‌ و اجرای مؤثر امور بازاریابی بیمه‌گر هستند؟

· مشتریان بیمه: آیا استفاده از کلان‌داده و هوش مصنوعی در هنگام فروش و یا در سراسر مدت اعتبار بیمه‌نامه، تجربه‌ رضایت‌بخشی برای مشتری به همراه خواهد داشت؟

· فروش بیمه: آیا کلان‌داده و هوش مصنوعی فرایند فروش را ساده‌تر و مؤثرتر کرده و به شبکه‌های توزیع در یافتن مشتری و فروش محصولات بیمه‌ای (به افرادی که بیشترین نیاز را به آن را دارند) کمک می‌نماید؟

· پشتیبانی و ارائه خدمات (خسارت‌ها، ارزیابی ریسک و صدور بیمه‌نامه و ذخائر): آیا کلان‌داده‌ها و هوش مصنوعی به بیمه‌گر در بهره‌وری خدمات بیمه‌ای کمک خواهد کرد؟

· تشخیص تقلب: آیا شناسایی دقیق‌تر تقلب در بیمه‌ از طریق کلان‌داده‌ها و هوش مصنوعی امکان‌پذیر خواهد بود؟

· مدیریت ریسک توسط مشتری: آیا کلان‌داده‌ها و هوش مصنوعی می‌توانند از طریق تشویق بیمه‌گذاران به سبک زندگی سالم‌تر ریسک‌های آن‌ها را کاهش دهند؟ (به عنوان مثال از طریق برنامه‌های سلامت).[7]

· پیش‌بینی قیمت: با توجه به اینکه تعیین قیمت [و یا در واقع تعیین نرخ بیمه‌نامه و در نتیجه حق‌بیمه] یک عملیات «پیش‌بینی» است و از طریق بررسی داده‌ها، بررسی سوابق ریسک و پیش‌بینی احتمال وقوع خسارت انجام می‌شود، آیا بکارگیری کلان‌داده‌ها و هوش مصنوعی می‌تواند با ارائه تخمین‌های بهتر و دقیق‌ترِ میانگین و نوسان ریسک، در تعیین حق‌بیمه‌های پایین‌تر و پایدارتر کمک نماید؟

· نهادهای نظارتی بیمه: آیا کلان‌داده‌ها و هوش مصنوعی فرایند نظارت بر بیمه را مؤثرتر و کارآمدتر خواهد نمود؟

2- تفاوت ریسک و عدم‌اطمینان (قطعیت)[8] : تحقیقات یک اقتصاددان قرن بیستم به نام فرانک نایت[9] توجه همگان را به تفاوت عدم‌اطمینان و ریسک جلب نموده است. ریسک [و یا عدم‌قطعیت قابل‌اندازه‌گیری] به شرایطی اطلاق می‌شود که در آن از نتیجه اطلاعی در دسترس نیست، لیکن امکان سنجش صحیح احتمالات وجود دارد، درحالی‌که عدم‌قطعیت [یا همان عدم‌قطعیت غیرقابل‌اندازه‌گیری] شرایطی است که فرد اساساً اطلاعات کافی برای سنجش دقیق احتمالات در دسترس ندارد.

‌تمامی پوشش‌های بیمه‌ای که توسط بیمه‌گران ارائه می‌شوند، از یک سو با ریسک قابل‌سنجش و از سوی دیگر با عدم‌قطعیت احاطه شده‌اند. بسته به اینکه ریسک بیمه مورد‌نظر در کجای این طیف قرار گرفته است، ابزارهایی که برای تعیین قیمت و طراحی بیمه‌ به کار می‌روند نیز متفاوت خواهد بود. از جمله موارد ریسک می‌توان به بیمه‌ عمر و بیمه اتومبیل اشاره نمود. بیمه عمر می‌تواند حق‌بیمه‌ بلندمدتی را تضمین نماید، درحالی‌که بیمه‌ خودرو نیز می‌تواند پیش‌بینی نرخ بیمه‌نامه پایدارتری را ارائه دهد، زیرا ریسک تصادفات بیشتر از نوع حوادث با شدت کم و تواتر زیاد است. برخلاف موارد مذکور، پوشش‌های بیمه‌ای دیگری نیز وجود دارند که فاجعه‌بار هستند و به دلیل کمبود تجربه و اطلاعات ناکافی در مورد آن‌ها، از نوع عدم اطمینان به حساب می‌آیند.  

3- بهره‌وری [10] در مقابل تحول [در روش ارائه محصولات بیمه‌ای]: وقتی یک فرایند را می‌توان به روشی دیگر، سریع‌تر و ارزان‌‌تر انجام داد، راه‌حل تحلیلی کلان‌داده‌ها بر بهره‌وری (صرفه‌جویی در هزینه‌ها( متمرکز شده و یا در چنین مواردی باید فرایند ارائه‌ خدمات بیمه‌ای را تغییر داد؟ این تغییر روش می‌تواند در بخش فروش، صدور بیمه‌نامه، قیمت‌گذاری یا سیاست‌ها و رویه‌های اجرایی باشد (مانند آنچه در اوبر و لیفت[11] و در بخش خدمات تاکسی‌رانی اتفاق افتاده است).

4- پیش‌بینی بهتر در مقابل قضاوت (تحلیل) بهتر: آیا کلان‌داده‌ها جایگزین افراد می‌شوند و یا به عنوان ابزاری برای افزایش کیفیت قضاوت، نوآوری و رفتارهای آن‌ها استفاده خواهد شد؟

· آیا یادگیری ماشین (ML)[12]، نحوه عملکرد و تحلیل‌ متخصص اکچوئری، بیمه‌گر و مدیر بخش خسارات را تقلید می‌نماید و یا با استفاده از الگوریتم هوش مصنوعی، [بدون استفاده از دانش انسان] به نتیجه‌ نهایی یک فرایند دست پیدا می‌کند؟ آیا یادگیری ماشین جایگزین افراد خواهند شد و یا تنها توانایی‌‌های آن‌ها را تقویت و بیشتر خواهند نمود؟

5- ارزیابی دارایی داده‌ها[13] : درک یکپارچه از کیفیت دارایی داده‌ها، ملزومات موردنیاز برای سازماندهی و یا غنی‌سازی داده‌ها و سرمایه‌گذاری مداوم روی کیفیت آن‌ها از جمله دغدغه‌های اساسی کاربردهای هوش مصنوعی و یادگیری ماشین در زمان حال و آینده است.

6- قانون و نظارت: نقش درست قانون برای تقویت و پرورش نوآوری و انجام معاملات همراه با حفظ حریم خصوصی بیمه‌شده چیست؟

نقش و کارکرد متخصص اکچوئری هم‌گام با ابزارهایی که برای کار اکچوئرال استفاده می‌شود، تکامل می‌یابد. در حال حاضر، تخصص اکچوئری در مقایسه با زمانی که داده‌های موجود در پوشه‌های اصلی شرکت، مبنای تنظیم فرضیات‌ قرار می‌گرفتند، پیشرفت‌های زیادی کرده است. با استفاده از کلان‌داده‌ها می‌توانیم الگو‌های رفتاری (که منجر به ایجاد ریسک بیمه شده) روش توزیع و ارائه پوشش مناسب را بررسی نماییم.

استاندارد‌های تخصص اکچوئرال (ASOPs)[14]:

این استانداردها توسط هیئت استاندارد اکچوئرال (ASB)[15] منتشر شده و راهنما‌ی متخصصان اکچوئری‌ به‌هنگام ارا‌ئه‌ خدمات می‌باشد. استانداردهای مذکور به آن‌ها می‌آموزد که به هنگام تبادل [و ارائه] اطلاعات درباره‌ نتایج خدمات مربوطه چه‌ مواردی را حتماً باید ذکر کنند. البته این استانداردها تمام مراحل مأموریت متخصص اکچوئری را شامل نمی‌شود و اتخاذ یک رویکرد یا کسب یک نتیجه‌ خاص را به او دیکته نمی‌نماید.

این استاندارها متخصص اکچوئری را ملزم می‌نماید تا در زمان انتخاب فرضیات، انتخاب داده‌های مرتبط با آن و روش‌های آماری پیشرفته، فرایند مشخصی را در قضاوت حرفه‌ای خود دنبال کنند. این امکان وجود دارد که متخصصان اکچوئری‌ مختلف با استفاده از داده‌ها و تکنیک‌های آماری پیشرفته‌ یکسان، به نتایجی برسند که به شکل معقولی، متفاوت اما درعین‌حال، منطقی و قابل‌توجیه باشند. همچنین امکان دارد حتی با استفاده از فرضیات و تابع هدف یکسان، متخصصان اکچوئری‌ به شکلی منطقی اما متفاوت داده‌ها را طراحی نمایند.

در ادامه به استانداردهای تخصص اکچوئرال، به عنوان راهنمایی سودمند برای متخصصان در هنگام استفاده از کلان‌داده‌ها و الگوریتم‌ها اشاره شده است:

· استاندارد شماره 1: استاندارد آغازین تخصص اکچوئرال

· استاندارد شماره 2، هزینه‌های غیرتضمینی  و یا سود حاصل از بیمه‌نامه‌های عمر و قرداد‌های مستمری سالیانه. این استاندارد در صورتی قابل‌استفاده است که از کلان‌داده‌ها و هوش مصنوعی برای تشخیص عناصر تضمین‌نشده استفاده شود.

· استاندارد شماره 7، بررسی جریان‌های نقدی بیمه‌‌گر برای بیمه‌های عمر، سلامت، اموال و تصادفات. این استاندارد در مواردی قابل‌استفاده است که فرضیات اکچوئرال بر پایه‌ روش‌های پیشرفته‌ تحلیلی باشد.

· استاندارد شماره 12، طبقه‌بندی ریسک (برای تمام حوزه‌های کاری). این استاندارد برای آن دسته از مدل‌های طبقه‌بندی ریسک استفاده می‌شود که از روش‌های یادگیری ماشین، مشتق شده‌ باشند.

· استاندارد شماره 15، سود[16] خریداران بیمه عمر، بیمه‌های مستمری سالیانه و بیمه‌ها‌ی از کار افتادگی. این استاندارد زمانی به کار می‌رود که از یادگیری ماشین برای تنظیم فرضیات یا تعیین سود سهام استفاده می‌شود.

· استاندارد شماره 23، کیفیت داده‌ها. این استاندارد راهنمایی برای انتخاب داده‌ها، بازبینی داده‌ها، به‌کارگیری داده‌ها و اعتماد به داده‌های تهیه‌شده توسط دیگران در ارائه‌ خدمات اکچوئرال ا‌ست.

· استاندارد شماره 38، مدل‌سازی وقایع فاجعه‌آمیز. این استاندارد به‌ هنگام مطالعه‌ حوادثی با گستردگی و شدت زیاد و احتمال وقوع کم استفاده می‌شود. از جمله این حوادث می‌توان به توفند[17]، زلزله، پیچند[18]، عملیات تروریستی و بیماری‌های همه‌گیر اشاره نمود.

· استاندارد شماره 41، تبادل اطلاعات اکچوئرال. این مورد در واقع استانداردهای مهم تبادل نتایج اکچوئرال را بررسی می‌کند.

· استاندارد شماره 54، قیمت‌گذاری بیمه‌ عمر و محصولات مستمری سالیانه. این استاندارد برای آن دسته از متخصصان اکچوئری‌ مورد استفاده قرار می‌گیرد که خدماتی از قبیل تعیین قیمت (شامل نرخ‌دهی، هزینه‌ها و منافع) ارائه می‌کنند.

· استاندارد شماره 56، مدل‌سازی. این استاندارد راهنمایی برای اجرای خدمات اکچوئرال در زمینه طراحی، توسعه، گزینش، تعدیل، استفاده، بازبینی و ارزشیابی مدل‌ها می‌باشد.

استفاده از کلان‌داده‌ها و الگوریتم‌ها در تخصص اکچوئرال هنوز در مراحل اولیه است. هوش مصنوعی نیز هنوز در حال پیشرفت است و همچنان کاربردهای جدیدی از آن در بیمه پدیدار می‌شود.

به نظر می‌رسد، مجموعه استانداردهایی که در تخصص اکچوئرال مورد استفاده قرار می‌گیرند، برای در بر گرفتن کاربردهای آتی کلان‌داده‌ها و هوش مصنوعی، به اندازه‌‌ کافی جامع و کامل نیستند و در آینده نیازمند بروزرسانی و الحاقیه‌های تکمیلی خواهند بود.

شایان ذکر است، استانداردهای تخصص اکچوئرال فقط راهنمای متخصصان اکچوئری هستند و برای دانشمندان داده‌های غیراکچوئری (که از این داده‌ها برای ساخت سیستم‌های طبقه‌بندی ریسک و مدل قیمت‌گذاری که نیازمند بازبینی نهاد قانون‌گذار هستند، استفاده می‌کنند) کاربردی ندارد. گاهی برخی از نهادهای قانون‌گذار از تأثیر بسزای این استانداردها در دقت کار متخصصان اکچوئری آگاه نیستند. این در حالی است که نهادهای مذکور، علاوه بر اینکه چالشی را پیشِ‌پای متخصصان اکچوئری قرار می‌دهند، فرصتی نیز در اختیارشان می‌گذارند تا خود به عنوان مقام قانون‌گذار یا همراه با آن مقامات همکاری نمایند و از این طریق، استاندارد‌ بالای محصولات کار اکچوئرال را تقویت نمایند.

برای جلب اعتماد ناظران، می‌توان استاندارد‌هایی برای بازبینی مدل هوش مصنوعی ابداع کرد که توقعات قانون‌گذاران را در انجمن ملی ناظران بیمه آمریکا (NAIC)[19] برآورده سازد. این توقعات راهنمای اصول هوش مصنوعی هستند. بر اساس این راهنما، افرادی که هوش مصنوعی را برای هدایت صنعت بیمه می‌سازند، باید اصولی را در استفاده از کلان‌داده‌ها و هوش مصنوعی رعایت کنند.

انجمن ملی ناظران بیمه معتقد است که استفاده از کلان‌داده‌ها و هوش مصنوعی باید بر اساس اصول زیر باشد: [20]

· عادلانه و مطابق با موازین اخلاقی: احترام به قوانین حقوقی و وضع راه‌حل‌های موثق.

· مسئول بودن: به عهده گرفتن مسئولیت ابداع، اجرا و اثرات همه سیستم‌های هوش مصنوعی.

· منطبق با قانون: داشتن دانش و منابع آماده برای تطبیق با تمام قوانین و مقررات بیمه‌ای مرتبط.

· شفاف بودن: آمادگی برای توضیح مسئولانه در مورد سیستم‌های هوش مصنوعی به افراد ذینفع و توانایی تفحص و بازبینی این افراد درباره‌ تصمیمات بیمه‌ای که به واسطه‌ی هوش مصنوعی گرفته می‌شود.

· ایمن، بی‌خطر و استوار بودن: حصول اطمینان از اینکه مجموعه‌ داده‌ها، فرایندها، تصمیمات اتخاد شده و اجرای مدیریت ریسک اصولی به میزان مناسبی قابلیت پیگیری باشند، تا به این وسیله بتوان ریسک‌های مرتبط با حریم خصوصی، امنیت دیجیتال و تبعیض‌های ناعادلانه را شناسایی و اصلاح کرد.

بسیار حائز اهمیت است که به قانون‌گذاران نشان داده شود که استانداردهای تخصص اکچوئرال در کجا با این اصول اشتراک داشته و بر هم تأثیر می‌گذارند، تا به‌این‌ترتیب بتوان حوزه‌های مغایر را برطرف کرده و همکاری سالم را تسهیل و در نتیجه اعتماد عموم را جلب کرد.

موازین اخلاقی و هوش مصنوعی

ترویج استفاده‌ اخلاقی از مدل‌سازی داده‌ها و هوش مصنوعی، با تعدادی از اصول بنیادین که در راهنمای هوش مصنوعی انجمن ملی ناظران بیمه آمریکا به آن‌ها اشاره شده است، آغاز می‌شود. این اصول (که به بعضی از آن‌ها در بخش استاندارهای تخصص اکچوئرال اشاره شده است) هنگام استفاده از کلان‌داده‌ها و هوش مصنوعی از طریق چند روش مهم در تولید برنامه‌های اکچوئرال اجرایی می‌شوند. در زیر بطور خلاصه به آن‌ها اشاره می‌شود:

· شفافیت و حریم خصوصی: شفافیت به این معنا است که بیمه‌گر باید منابع داده‌ها و مهندسی (استخراج) ویژگی[21] برای تبدیل داده‌ها به مدل داده‌های ورودی را مشخص کند. ممکن است [منابع] داده‌هایی که مهندسی ویژگی روی آن‌ها صورت گرفته است، برای مصرف‌کننده قابل‌شناسایی نباشند، و در نتیجه، توانایی اصلاح اشتباهات آن را نداشته باشند. مصرف‌کننده [محصولات بیمه‌ای] باید بتواند به اطلاعاتی که بیمه‌گر از آن در تحلیل ریسک بیمه‌گذار و تعیین نرخ حق‌بیمه استفاده کرده ‌است، دسترسی داشته باشد و آن را بررسی نماید و از درستی محاسبات مربوط به نرخ حق‌بیمه‌ای که باید بپردازد، اطمینان حاصل کنند، تا در صورت نیاز، امکان تصحیح اطلاعات نادرست مهیا باشد. بیمه‌گران نیز باید با انجام اقداماتی، امنیت اطلاعات مصرف کننده را در برابر سوء‌استفاده‌ عوامل بد بیرونی و درونی تضمین نمایند.

· کیفیت داده‌ها: منابع داده‌ها باید خصوصیت‌های زیر را داشته باشند:

 ۱. برای مدل‌سازی مناسب و به‌روز باشند.

 ۲. قابلیت ممیزی و تحلیل‌های تخصصی را داشته باشند.

 ۳. اعتبار، نمایه‌پذیری[22]، تعادل و دقت آن‌ها تست شده باشد.

 ۴. بررسی دقیق داده‌ها برای پیدا کردن سوگیری‌ها و تعیین متغیرهای ‌جانشین[23] برای آن دسته از داده‌هایی که توسط سازمان نظارتی ممنوع شده، انجام شده باشد.  

همه‌ این موارد به این معنا است که داده‌های مدل آموزشی باید قابل‌اطمینان [و همچنین نشانه‌گر مناسبی از کل جامعه آماری] بوده و با ریسک‌هایی که بیمه می‌شوند، ارتباطی تنگاتنگ داشته باشند.

· هدف مدل و محدودیت‌های آن: در یک مدل باید به طور واضح و روشن به مواردی از قبیل هدف، نحوه استفاده درست از مدل و محدودیت‌های آن پرداخته شده باشد. این موارد می‌تواند شامل مرتبط بودن درون‌دادهای مدل، انتخاب گروه آماری مناسب برای آن مدل، شرایطی که در آن از داده‌ها استفاده می‌شود و همچنین معیارهایی باشد که با علائم خاصی، عدم رعایت موارد مذکور را نشان دهد.

این مدل‌ها نیازمند نظارت کارآمد انسانی برای کنترل دقیق هستند، تا [با نظارت مستمر و به‌موقع] بتوانند در صورت مناسب نبودن مدل برای داده‌ها و مشکل مورد‌نظر، [بلافاصله] هشدار تنظیمات [مجدد] را فعال نمایند.

· پژوهش مسئولانه: پژوهش‌های مربوط به توسعه‌ هوش مصنوعی باید بر اصول و شیوه‌های معتبر علمی استوار و به‌طور کاملاً واضح پاسخگوی نیاز مدل باشند. به علاوه باید به اندازه کافی، مستند به یافته‌های کنترل‌شده‌ بوده و برای پیامدهای ناخواسته و سوگیری‌های آماری تست شده باشند.

· همبستگی[24]، رابطه‌ی علت و معلولی[25] و یکپارچگی: برای درک و برقراری ارتباط با شیوه‌ تصمیم‌گیری مدل مورد استفاده، باید احتیاط‌های لازم را اتخاذ و الگوهای تشخیصی آن مدل را بررسی و تعیین نمود، به‌طوری‌که بتوان تشخیص داد که ماهیت این روش‌ها بر اساس رابطه پیوستگی[26] و یا رابطه علت و معلولی [میان داده‌های ورودی] انتخاب شده‌است. همبستگی با توان و کیفیت پیوستگی[27] میان داده‌ها سنجیده می‌شود.

ارزیابی همبستگی از طریق تحقیقات، تجربه و رفتارهای نظاره‌گرانه صورت می‌گیرد، تا از کاذب نبودن آن اطمینان حاصل شود. استاندار طلایی[28] ارزیابی رابطه‌ علت و معلولی کارآزمایی تصادفی کنترل‌شده (RCT)[29] است که در پزشکی مبتنی‌ بر شواهد[30] و برای اثبات اینکه درمان خاصی، بیماری را علاج خواهد کرد یا نه، به کار می‌رود. [31]

اکثر مدل‌های اکچوئرال به حد نصاب این استاندارد نمی‌رسند، زیرا کارآزمایی تصادفی کنترل‌شده، آزمایشاتی هستند که در دوره‌های طولانی و با موضوعات مورد مطالعه فراوان باید اجرا ‌شوند. مدل‌های پیش‌بینی‌گر[32] به دنبال الگو‌های رابطه پیوستگی و یا همبستگی در مدل‌سازی داده‌ها هستند، اما امکان تشخیص رابطه علت و معلولی برای آن‌ها به‌طور دقیق وجود ندارد و در نتیجه نمی‌توان به آن اعتماد کرد. به‌ علاوه بعضی الگوریتم‌های مدل‌‌سازی پیشرفته در مواجهه با متغیرهای همبسته، ناپایدار می‌شوند و برای حذف آن‌ها باید نهایت توجه و احتیاط را به کار بست.

· متغیرهای جانشین برای متغیرهای ممنوعه[33]: متغیرهایی که به‌ظاهر بی‌طرف و خنثی هستند، زمانی‌که به طور غیرعمدی از متغیرهای ممنوعه‌ای که توسط نهادهای قانون‌گذار تعیین شده، تقلید ‌کنند، مشکل‌ساز می‌شوند. این متغیرها به‌طور نامتناسبی به زیان بعضی طبقات اجتماعی حفاظت‌شده هستند. این نکته را هم باید در نظر گرفت که برخی متغیرهای ممنوعه در همه مناطق دنیا ممنوع نیستند. در واقع همین تفاوت در قوانین، منجر به تفاوت مدل یک شرکت خاص از ایالتی به ایالت دیگری می‌شود. متغیرهای یک مدل که توانایی پیش‌بینی خود را توسط رابطه همبستگی با یک ویژگی غیرقانونی به دست آورده‌اند، لزوماً هدف بدی را دنبال نمی‌کنند. متغیرهای جانشین غیرآسیب‌زا، در شرایطی که برخی از ویژگی‌ها به ‌آسانی از طریق منابع داخلی شرکت یا منابع داد‌ههای شخص ثالث[34] به دست نمیآیند، نقش مفیدی را برای مدل‌سازی ایفا خواهند نمود.

· قابلیت تفسیر و توضیح: در فرهنگ اصطلاحات هوش مصنوعی، تفسیر‌پذیری[35] به معنی سهولت در فهم یک مدل، بدون کمک گرفتن از منابع بیرونی است. توضیح‌پذیری[36]، دقیقاً برعکس آن است، یعنی به دلیل دشواری موضوع، نیاز به کمک بیرونی دارد.

برای آزمایش کارآمدی خروجی‌های الگوریتم‌ها و تکرار[37] نتایج، توضیح‌پذیری و تفسیرپذیری هر دو ضروری هستند. تأیید اعتبار مدل به این بستگی دارد که شیوه‌های کارآمد آزمودن و ممیزی‌های مستند برای هدف، وابستگی‌ها، کیفیت داده‌ها، تصمیم‌گیری، کنترل و اداره‌ی خروجی‌ها و نتایج، پشت سر گذاشته شده باشند.

· تنوع در توسعه مدل و بازبینی: برای جلوگیری از ورود سوگیری‌های برنامه‌نویسی به مدل و همچنین جلوگیری از منحرف شدن تدریجی آن، بهتر است که مجموعه‌ای متنوع از بازرسان (مثلا بازرسانی با جنسیت‌، ملیت‌، نژاد، سن و تعلیمات مختلف) برای بازبینی ورودی‌های مختلف هوش مصنوعی، تصمیم‌گیری و خروجی‌های متناسب با هدف، در اختیار داشته باشیم. به ‌این ‌ترتیب، چشم‌انداز وسیع‌تری از سوگیری‌های احتمالی و عواقب ناخواسته خواهیم داشت.

دو منبع اصلی سوگیری‌ الگوریتمی، عبارتند از سوگیری داده‌های آموزشی و سوگیری برنامه نویسان. اصلاح داده‌های آموزشیِ سوگیرانه شاید آسان‌تر از متنوع کردن گروه مدل‌سازی باشد. تنوع، با تجارب چندکاره[38] تمام متخصصان آن تجارت به اجرا درمی‌آید. گروه چندکاره باید شامل کارکردهای ذیل باشد: بیمه‌گران، تحلیل‌گران تجاری، متخصصان اکچوئری‌، آمارگران، برنامه‌نویس‌ها و حتی مشاور قانونی برای کمک به بازبینی متغیرهای مدل (از تبعیض ناعادلانه جلوگیری شود).

طبقه‌بندی و قیمت‌گذاری سنتی ریسک اکچوئرال

در استاندارد شماره 12 تخصص اکچوئرال (در خصوص طبقه‌بندی)، هیئت استانداردهای تخصص مذکور، طبقه‌بندی ریسک را در این حرفه به عنوان ابزاری برای قیمت‌گذاری ریسک معرفی می‌کند. آکادمی اکچوئری‌های آمریکا[39] نیز هدف، طراحی و مدیریت شیوه‌های طبقه‌بندی ریسک را گسترش داده و در سال ۲۰۱۱ آن را در تک‌نگار[40] خط‌مشی‌ء عمومی خود در خصوص انتخاب ریسک منتشر نموده است. [41]

فرایند طبقه‌بندی ریسک که یکی از اهداف آن قیمت‌گذاری عادلانه محصولات بیمه‌ای است، دسته‌بندی ریسک‌هایی با ویژگی‌های مشابه را شامل می‌شود. ریسک‌ها برای تعیین میانگین‌ها گروه‌بندی می‌شوند تا از این میانگین‌ها برای یک ریسک خاص استفاده شود. سازمان هیئت استانداردهای اکچوئرال معتقد است که هدف از طبقه‌بندی ریسک، پاداش‌دهی یا تعیین جریمه برای گروه‌های خاصی از این ریسک‌ها نمی‌باشد (به‌خصوص وقتی این پاداش یا جریمه به قیمت از دست رفتن سایر گروه‌ها باشد). همان‌طور که در تک‌نگار اشاره شد، بیانیه اصول طبقه‌بندی ریسک (SOP)[42]، خواهان این موضوع است که سه هدف در طبقه‌بندی ریسک لحاظ شوند:

· حمایت از توانگری مالی صنعت بیمه.

· عادلانه بودن.

· استفاده از مشوق‌های اقتصادی برای دسترسی فراگیر به پوشش‌های مختلف بیمه‌ای.

بیانیه اصول طبقه‌بندی ریسک پنج اصل زیر را به منظور داشتن یک نظام طبقه‌بندی معتبر، ارائه می‌نماید:

· باید تفاوت در هزینه‌های مورد انتظار را شامل شود.

· باید بتواند ریسک‌ها را بر اساس عوامل مرتبط با هزینه‌ تفکیک کند.

· باید بی‌طرفانه انجام شود.

· باید کاربردی و مقرون‌به‌صرفه باشد.

· باید موردقبول عموم باشد.

این اصول در زمینه‌‌های مناسب بودن نرخ بیمه، گران نبودن و تبعیض‌آمیز نبودن آن، با خواسته‌های نهاد قانون‌گذار منطبق است. به عنوان مثال، حق‌بیمه‌ عمر بیشتری باید از بیمه‌گزاران سیگاری اخذ شود، زیرا سلامتی آن‌ها به دلیل استعمال دخانیات بیشتر از افراد غیر سیگاری در خطر است و لذا ریسک این افراد بالاتر است.

طبقه‌بندی ریسک از نظر طراحی، ذاتاً یک ابزار رقابتی است. شرکت‌های بیمه‌ای که به بهترین وجه ممکن ریسک‌های بهتر را از بدتر تشخیص می‌دهند، با قیمت‌گذاری مناسب می‌توانند از سایر رقبای خود پیشی بگیرند. همانطور که در مورد استعمال دخانیات گفته شد، شرکت‌هایی که نرخ‌های افراد سیگاری و غیر سیگاری را تفکیک نکرده و یک نرخ کلی برای هر دو دسته تعیین نموده‌اند، ناخواسته افراد غیر سیگاری را به سمت شرکت‌های بیمه‌ای که نرخ‌های پایین‌تری دارند، سوق خواهند داد، در نتیجه افراد پرریسک سیگاری بیشتری در سبد ریسک شرکت باقی خواهند ماند. این بدتر شدن تدریجی سبد ریسک بیمه‌گر به سمت بیمه‌گزاران پرریسک‌تر، در نهایت منجر به مارپیچ انتخاب ریسک نامطلوب خواهد شد.

شرکت‌های بیمه‌ عمر از داده‌های زیست‌سنجی[43] برای طبقه‌بندی ریسک استفاده می‌کنند. از جمله این داده‌ها می‌توان به میزان فشار خون، سابقه‌ خانوادگی، شاخص توده‌ی بدنی[44]، میزان کلسترول و آزمایش خون و مایعات بدن، اشاره نمود. چند ابتلایی[45] (که وجود هم‌زمان چند مشکل سلامتی با هم است) نیز باید بررسی شود، زیرا وجود چند عامل ریسک، احتمال مرگ ‌و میر را به ‌شدت افزایش می‌دهد، که در این شرایط به دلیل بالا بودن ریسک، باید نرخ حق‌بیمه را افزایش داد.

تشخیص نادرست این بیماری‌ها، منجر به نرخ‌گذاری غیر استاندارد در بیمه‌نامه‌های عمر خواهد شد که این امر از طریق متناسب نبودن هزینه‌ها و درآمدها، توانگری مالی بیمه‌گر را تحت تأثیر قرار خواهد داد و در نهایت کاهش تعداد صدور بیمه‌نامه را در پی خواهد داشت. اندازه‌گیری مناسب اطلاعات زیست‌سنجی باعث می‌شود که یک ریسک خاص در بخش ریسک‌های مطلوب دسته‌بندی شده و در نتیجه حق‌بیمه‌ کمتری برای آن لحاظ شود. ریسک‌های شغلی و رفتاری نیز باید بر اساس نوع فعالیت‌ و شغل فرد بیمه‌شده طبقه‌بندی شوند، در نتیجه خسارت مورد انتظار هر دسته از افراد شاغل در بخش‌های مختلف و همچنین نرخ بیمه‌نامه دقیق‌تر سنجیده خواهد شد.

سابقه‌ رانندگی پس از مصرف مواد مخدر یا الکل (DUI)[46]، داشتن گواهی‌نامه‌ خلبانی یا اشتغال به حرفه‌های خطرناک (مانند حفر معدن و داشتن شغل نظامی) نمونه‌های بارزی از فعالیت‌ها و پیشه‌هایی هستند که باید در بخش فعالیت‌های پُرریسک دسته‌بندی شوند. افشای این فعالیت‌ها به هنگام تقاضای پوشش بیمه، احتمالاً نرخ‌ حق‌بیمه دائمی یا موقت بالاتری را سبب خواهد شد (به عنوان مثال مقادیر ثابتی که به ازای سرمایه بیمه‌نامه خریداری شده به حق‌بیمه افزوده می‌شود) و یا حتی ممکن است بیمه‌گر از ارائه پوشش به بیمه‌گذار پُرریسک خودداری نماید.

طبقه‌بندی ریسک، یک فرایند کلی است، به این معنی که هر متغیر ریسک به تنهایی اهمیتی ندارد، بلکه هنگامی که به صورت کلی و در کنار سایر متغیرها قرار می‌گیرد، حائز اهمیت می‌شود. به عنوان مثال، دیابت یک عامل ریسک است که در صورت کنترل، ریسک آن به میزان قابل‌توجهی کاهش می‌یابد. داشتن دیابت یک عامل ریسک منفی است، اما می‌توان با کنترل وزن، شرایط را نسبت به فرد دیابتی غیرفعال بهبود ‌بخشید و حق‌بیمه کمتری نیز پرداخت نمود. در یک مثال دیگر می‌توان به خانه‌‌هایی که در منطقه‌ سیل‌خیز قرار دارند اشاره نمود. در این شرایط، خانه‌هایی که در ارتفاع بیشتری هستند با ریسک کمتری مواجه هستند.

تکنیک‌های انتخاب ریسک با کلان‌داده‌ها، برای شناسایی متغیرهای نرخ‌گذاری مورد استفاده قرار می‌گیرند. تمام متغیرهای نرخ‌گذاری ریسک باید توسط هیئت استاندارد اکچوئرال و استاندارد شماره 12 تخصص اکچوئرال بررسی شوند.

عدم‌انطباق یک مدل با این استانداردها، زنگ خطری ا‌ست که نشان‌دهنده برآورده نشدن پیش‌نیازهای نهاد قانون‌گذار است. همانطور که قبلاً نیز به آن اشاره شد، نرخ‌‌ها باید مناسب بوده و گران و تبعیض‌آمیز نباشند، تا بتوانند انتظارات قانون‌گذاران را برآورده نمایند.

تأثیر استنباط رفتاری[47] کلان‌داده‌ها بر روش سنتی:

شری ترکل[48] دانشمند دانشگاه تکنولوژی ماساچوست[49] اذعان نمود: «فناوری فقط چیزی که انجام می‌دهیم را تغییر نمی‌دهد، بلکه خود ما را تغییر می‌دهد.» [50] این جمله به ما یادآوری می‌کند که باید در مورد تأثیرات رفتاری فناوری در شکل‌دهی داده‌های مورد مطالعه و ساخت مدل‌ها آگاه و مراقب باشیم. مثال بارز آن استفاده از دستگاه‌های خودسنجی[51] پوشیدنی مثل فیت‌بیت[52] است، که کاربران خود را از لحاظ روانی وادار می‌نماید تا قبل از خواب، حدود ۱۰ هزار  قدم پیاده‌روی نمایند. این ابزار از لحاظ روانی چنان بر روی کاربران خود اثر می‌گذارد، که حتی اگر لازم باشد برای تکمیل 10 هزار قدم خود، دور اتاق ناهارخوری پیاده‌روی نمایند، آن را انجام خواهند داد. اگرچه تعداد 10 هزار قدم هیچ اعتبار علمی ندارد، اما به‌ هر حال تبدیل به یک استاندارد در حفظ تناسب اندام شده است. اطلاعات خودسنجی چند خصوصیت رفتاری خوشایند را درباره بیمه‌گزاران ارائه می‌کند از جمله عزت نفس[53] و خودتنظیمی.[54] عزت نفس به معنی باور داشتن به توانایی‌های خود برای رسیدن به هدف خاصی است.[55]  افرادی که عزت نفس بالایی دارند به چالش‌‌های خودخواسته‌، مانند همان چالش ۱۰ هزار قدم در یک روز جذب می‌شوند و با کمترین محرک‌های بیرونی آن را انجام خواهند داد. [56]

در واقع، واسطه‌های داده[57]، داده‌های رفتاری را در بازار منتشر می‌کنند. این داده‌ها به مدل‌های پیش‌بینی‌گر بیمه نیز راه یافته‌اند، ولی بیمه‌گران توانایی محدودی در اعتبارسنجی، تعیین دقت و صحت این داده‌ها دارند.

 بعضی شرکت‌ها مثل لکسیس نکسیس[58]، اکسپریان[59] و اکزیوم[60]  از طریق پرسشنامه و منابع عمومی، به طور موردی بر روی ویژگی‌های شخصیتی و نحوه‌ زندگی افراد تحقیق کرده و از این طریق درآمدزایی می‌نمایند. شرکت‌های بیمه از این اطلاعات به عنوان جزئی از مدل‌های پیش‌بینی‌گر خود استفاده می‌کنند. البته استفاده از این داده‌ها در بعضی حوزه‌ها ایجاد نگرانی می‌کند، که از جمله این نگرانی‌ها می‌توان به موارد زیر اشاره نمود:

· سوگیری نسبت به طبقات اجتماعی حفاظت‌شده. مقامات ایالتی درحال‌حاضر شرکت‌های بیمه را از جمع‌آوری اطلاعات نژادی منع می‌کنند، اما واسطه‌های داده‌ با چنین ممنوعیت‌هایی محدود نمی‌شوند. این افراد می‌توانند داده‌های نژادی را جمع‌آوری کرده و برای تولید متغیرهای جدید از آن‌‌ها استفاده کنند. این کار اساساً حق طبقات حفاظت‌‌شده تبعیض‌آمیز است. هم‌اکنون، هیچ نهاد قانون‌گذاری برای تأیید اعتبار کیفیت داده‌های رفتاری و شیوه‌ زندگی اشخاص ثالث وجود ندارد.

· دسترسی محدود به داده‌های رفتاری، شیوه‌ زندگی و داده‌های فیزیولوژیکی معتبر - این داده‌ها برای اعتبار‌بخشی به الگوی رفتاری واقعی و تعیین مقداری مناسبی از داده که برای تشخیص ویژگی‌های رفتاری مورد‌ نیاز است، استفاده می‌شود.

· فقدان شفافیت لازم در جمع‌آوری و مهندسی داده‌ها و روش‌های تحلیلی واسطه‌ها، که برای تشخیص سوگیرانه بودن یا نبودن داده‌ها نسبت به طبقات حفاظت‌‌شده استفاده می‌شود.

· نرم‌افزارهای تشخیص چهره‌ای که به زیان طبقات حفاظت‌‌شده سوگیری شده‌اند. نرم‌افزارهایی که بیمه‌گران از آن برای تشخیص کلاهبرداری در نرم‌افزارهای آنلاین بیمه و درخواست‌های خسارت استفاده می‌کنند.

· داده‌های آموزشی و برنامه‌نویسی سوگیرانه، که به معضل اصلی مدل‌‌سازی پیش‌بینی‌گر و تکنولوژی‌های هوش مصنوعی تبدیل شده‌اند. زیرا، تأثیر غیرمنصفانه آن‌ها به اثبات رسیده است.[61] نگرانی‌هایی در مورد الگوریتم‌های طراحی‌شده برای داده‌های تاریخی نیز وجود دارند، زیرا الگوریتم‌های مذکور سوگیری‌های نژادی و جنسیتی دارند.

· فقدان سیاست‌های قانونی سختگیرانه در مورد عملیات دیجیتال و تشخیص تبعیض‌آمیز بودن الگوریتم‌ها. نبود محیط امن دیجیتال برای اجرای آزمایشات ضدتبعیض و فقدان پناهگاه امن دیجیتال که بتوان در آن از سوگیری‌های آنلاین جلوگیری کرد.

· اصول اخلاقی بیمه‌‌گرانی که رفتار انسانی را از طریق اطلاعات شخصی بیمه‌گذاران مطالعه کرده و زیرنظر می‌گیرند تا برآوردی از میزان ریسک آن‌ها داشته باشند.[62]  همیشه باید سلایق مشتریان خدمات بیمه‌ای را از اطلاعات احتمالاً نادرست واسطه‌های داده تفکیک کرد تا منجر به اطلاق یک ویژگی شخصیتی اشتباه نشده و سلایق آنها را باید در اولویت قرار داد.

این مسائل باید بیشتر مورد مطالعه قرار بگیرند. به‌علاوه استفاده از استاندارد شماره‌ ۲۳ و ۵۶ برای کسب اطمینان از این‌که داده‌ها و الگو‌ها با کمترین میزان سوگیری تنظیم شده‌اند، ضروری است. چشم‌انداز نهاد قانون‌گذار در تنظیم دستورالعمل تضمین حفاظت مصرف‌کننده بسیار مهم است. ضمن اینکه این راهنما باید از طریق بکارگیری منابع داده اضافی و روش‌های پیشرفته‌ی مدل‌سازی، امکان تجربه‌ی بهتری را برای مشتری فراهم آورد.

میزان اعتبار و نظارت بر منابع داد‌ه‌های بیرونی

گسترس و پیشرفت فن‌آوری و توان محاسباتی، شرکت‌های بیمه را به شناسایی و استفاده از انواع بیشتری از مجموعه ‌داده‌ها قادر ساخته است. این داده‌ها که حاوی منابع داده‌های خارجی می‌باشند، معمولاً به‌صورت مجموعه‌ای از پیش‌آماده‌شده بوده و می‌توانند بلافاصله توسط شرکت بیمه استفاده شوند. داده‌ها ممکن است به صورت کاملاً ساختار‌یافته[63]، نیمه ساختاریافته[64] و یا کاملاً غیرساختاری[65]، ارائه شوند و امکان دارد برخی از آن‌ها پردازش‌نشده و برخی نیز توسط نرم‌افزار‌های بیرونی[66] همانند برنامه‌های شخص ثالث[67] مورد پردازش قرار گرفته باشند. داده‌هایی که از منابع بیرونی [شرکت] به دست آمده‌اند، ممکن است حاوی سوگیری، خطا و یا مقادیر ازقلم‌افتاده[68] باشند، که می‌توان این کمبود‌ها را اصلاح یا شناسایی کرد.

هدف و کیفیتی که داده‌ها به منظور آن‌‌ها انتخاب شده‌اند، باید با کاربردهای جدید احتمالی این داده‌ها هماهنگ باشد و این موضوع نیاز به بررسی و بازبینی دارد. داده‌هایی که با الگوریتم شخص ثالث پردازش شده‌اند، ممکن است برای استفاده‌ شرکت‌ بیمه مناسب نباشند و ارزش پیشنهادی[69] آن را به خطر اندازند. شرکت‌هایی که منابع بیرونی غیرسنتی کلان‌داده را استفاده می‌کنند، احتمالا ‌نیاز به کنترل اولیه کمتری نسبت به زمان استفاده از منابع سنتی خواهند داشت. منابع گسترده‌ا‌ی از داده‌ها ممکن است توسط نهاد‌های نظارتی مختلف، با قوانین و شیوه‌های قضایی گوناگون، بررسی شده و یا اصلاً کنترل نشده باشند. کمبود منبع اعتبارسنجی مستقل برای مدل‌های نوظهور کلان‌داده‌ها، یکی از مشکلات اصلی در این بخش است، زیرا روش‌های اعتبارسنجی سنتی داده‌ها شاید برای این مدل‌های جدید قابلیت استفاده نداشته باشند. درحال‌حاضر، هیچ سازمان نظارتی برای قانون‌گذاری، اعتبارسنجی و تأیید قانونی منابع داده‌ای غیرسنتی در صنعت بیمه وجود ندارد.

اکچوئری‌ها می‌توانند برای دریافت راهنمایی لازم در خصوص وارد کردن داده‌های جدید در مدل‌های خود، به استاندارد شماره 23 تخصص اکچوئری مراجعه کنند. اصول استاندارد مذکور، راهنمای ارزشمندی برای شرکت‌های بیمه، حتی برای غیراکچوئری‌ها، در راستای ارزیابی کیفیت و تعیین میزان کاربردی بودن داده‌ها (قبل از استفاده از آن‌ها) می‌باشد. این اصل مبین آن است، که داده‌ها باید برای مناسب بودن، مرتبط بودن، سازگاری و به‌روز بودن جهت طبقه‌بندی ریسک و رویکردهای قیمت‌گذاری، اعتبارسنجی شوند.

سؤالاتی که در خصوص داده‌ها باید بررسی ‌شوند عبارتند از:

 ۱. آیا می‌توان برای یک هدف خاص، به این منابع داده تکیه کرد؟

 ۲. آیا این داده‌ها در رسیدن به هدف مدل، کمک خواهند کرد؟

شرکت‌ها باید چارچوب حاکمیتی خود را طوری ارتقا دهند، که موارد زیر را شامل شود:

۱. اعتبارسنجی منابع داده‌های بیرونی از لحاظ کیفیت.

۲. بازبینی شیوه‌های جمع‌آوری داده‌های شخص ثالث.

۳. دستورالعمل تضمین کیفیت برای منابع داده‌های خارجی.

۴. تحلیل داده‌ها برای انطباق آن‌ها با الزامات قانونی موجود.

برای یک شرکت بیمه، دسترسی و توضیح روش پردازش‌ داده‌های داخلی و الگوریتم‌های مورد استفاده تهیه‌کنندگان داده‌های شخص ثالث، کار آسانی نیست. شرکت بیمه می‌تواند با اثبات زیان‌بار نبودن اطلاعات بیرونی برای مصرف‌کنندگان خدمات بیمه‌ای و همچنین اثبات اینکه این داده‌ها حاوی متغیرهای جانشین برای متغیرهای ممنوعه نیستند، به این مشکل فائق آید. این کار موجب ایجاد اعتماد در میان ناظران قانونی و مصرف‌کنندگان خواهد شد.

 کنترل اثرات نظام‌مند و عوامل ‌اقتصادی اجتماعی

سوگیری‌ از را‌ه‌های بی‌شماری می‌تواند به فرایند مدل‌سازی وارد شود. در واقع، مرحله‌ ساختن مجموعه‌ داده‌ها[70]، اولین نقطه‌ ورود سوگیری است. اکثر مقالات تحقیقاتی تأیید نموده‌اند که تمام مجموعه ‌داده‌ها حاوی سوگیری هستند و علاوه بر آن، بیشتر مدل‌سازان از سوگیری‌های ذاتی در مجموعه‌ داده‌ها مطلع نیستند و یا دانش لازم برای برطرف کردن آن را ندارند.[71]  اگر چنانچه مدل‌سازان در مورد چگونگی ایجاد و پردازش‌های داده‌های مدل‌سازی تحقیق نکنند، ممکن است سوگیری در نتایج الگو‌سازی آن‌ها نیز نفوذ کند.

چنانچه الگوریتم‌ها به هنگام تفسیر نتایج حاصل از داده‌ها، به وجود متغیرهای مخدوش‌کننده[72] توجه نداشته باشند، توانایی ردیابی الگوهای پیش‌بینی در داده‌ها را از دست خواهند داد. به عنوان مثال یک الگوریتم سلامتی که معیارش هزینه‌ درمان است، ممکن است اشتباهاً برخی از گروه‌های جمعیتی را تنها به دلیل اینکه مراجعه کمتری به مراکز درمانی داشته‌اند و در نتیجه هزینه‌های درمانی کمتری پرداخت کرده‌اند، به عنوان گروهی سالم‌تر از بقیه افراد در نظر بگیرد. اما این در حالی است که پایین بودن هزینه‌های درمان این دسته از افراد می‌تواند به دلیل مباحث سیستمی و نبود امکانات لازم برای دسترسی به مراکز درمانی باشد و لذا لزوماً دلیلی بر سالم‌تر بودن آن‌ها نیست.

 بررسی داده‌های مدل می‌تواند با طرح سؤالاتی مانند موارد زیر آغاز شود:

۱. چه کسانی در این داده‌ها حذف شده‌اند و پیامدهای حذف این افراد در نتایج مدل چیست؟

۲. داده‌ها تا چه حد نماینده‌ جمعیتی هستند که مدل روی آن‌ها پیاده می‌شود؟

۳. در داده‌ها چه سوگیری‌های تاریخی وجود دارد؟

۴. چه سوگیری‌های اجتماعی می‌تواند سوگیری‌های تاریخی را تفسیر کند؟

۵. قبل از اینکه داده‌ها برای مدل‌سازی استفاده شوند، چه پردازش‌هایی روی آن‌ها انجام شده است؟

۶. آیا داده‌‌ها برای انواع سوگیری‌ها مثل سوگیری پاسخ، سوگیری انتخاب، سوگیری انحراف شیوه، سوگیری متغیرهای حذف‌شده و سوگیری‌های اجتماعی مورد وارسی قرار گرفته‌اند؟[73]

تمرکز بر انجام تحقیقات روی داده‌ها بسیار مهم است، زیرا این داده‌ها هستند که الگوریتم را می‌سازند، ولی برعکس آن صادق نیست.

فرایند مدل‌سازی را می‌توان به عنوان دومین نقطه‌ ورود سوگیری دانست. برنامه‌نویسان با وارد نمودن فرضیات و تفسیرهای اشتباه خود در فرایند مدل‌سازی، ورود سوگیری را نیز سبب می‌شوند. متنوع نبودن اعضای گروه مدل‌سازی، می‌تواند در اشتباه بودن تفسیر نتایج مدل تأثیرگذار باشد، به‌طوری‌که میان استنباط علیت[74] و پیش‌بینی‌های مدل، شکاف حاصل شود. مدل‌سازی باید یک فعالیت چندجانبه باشد، به‌طوری‌که با بهره‌گیری از تخصص‌های متنوع (حتی بیش از حد نیاز) و در نتیجه فهم بهتر الگوریتم‌های پیچیده ریاضی، بتواند نقطه ضعف خود را در مقابل متغیرهای علوم اجتماعی برطرف نماید. این موضوع در درک نتایج مدل از طریق تحقیق کیفی حائز اهمیت است.

استفاده از چشم‌اندازهای متنوع در تحلیل نتایج مدل برای طراحان آن ضروری است، زیرا از این طریق می‌توانند در تمام مراحل، از ورود سوگیری به فرایند مدل‌سازی جلوگیری نمایند.

سومین نقطه‌ ورود سوگیری، در مرحله‌ استفاده از خود مدل صورت می‌گیرد. یک جمله مشهور در مدل‌سازی پیش‌بینی‌گر بیان می‌دارد: «اگرچه تمام مدل‌ها اشتباه هستند، اما برخی نیز مفید هستند». ریسک استفاده از یک مدل زمانی افزایش می‌باید که از آن برای مسئله‌ای‌ نامرتبط و نادرست استفاده شود و یا داده‌های آن از فرضیات نظری روش مدل‌سازی تبعیت نکنند. حتی زمانی که یک مدل کاملاً هماهنگ با داده‌ها باشد، امکان دارد محاسبات، اجرا و یا تفسیر آن به درستی صورت نگیرد و منجر به نتایج سوگیرانه‌ شود. نتایجی که علی‌رغم سوگیرانه بودن، به عنوان نتایج حقیقی استفاده شوند. مدل‌ها باید توسط گروهی مستقل و در عین‌حال متشکل از متخصصان مختلف (که در ساخت مدل دخیل نیستند)، به طرز سخت‌گیرانه‌ای اعتبارسنجی شوند. تنها کارکرد این گروه، حصول اطمینان از بی‌نقص بودن ریاضیات مدل‌هایی‌ است، که بزودی به چرخه‌ی تولید وارد می‌شوند ( و از این طریق مطمئن می‌شوند که ریسکی متوجه شرکت‌ها و مصرف‌کنندگان نخواهد بود).

این بحث زمینه‌ساز چارچوبی اولیه برای ارزیابی چگونگی ورود سوگیری‌ها به مدل هستند. ابداع ابزار ارزیابی و معیارهایی برای تشخیص سوگیری و رفع احتمالی آنها، در طول فرایند مدل سازی بسیار حائز اهمیت است.

دغدغه‌های نهاد قانون‌گذار و تأثیر آن‌ها بر عملکرد اکچوئری

نهادهای قانون‌گذار، دغدغه‌های بسیاری در‌مورد استفاده از کلان‌داده‌ها، چگونگی اعتماد به منابع خارجی داده‌‌ها، بکارگیری منابع غیراکچوئری (در طراحی و ساخت فرضیات)، محاسبه و ارزیابی‌ ریسک و در نهایت تعیین قیمت مدل‌ها دارند. [75]

امروزه، همراه با مجهز شدن مصرف‌کنندگان به تکنولوژی، توانا شدن آن‌ها در خودسنجی و اتصال به پایگاه‌های رسانه‌ای مجازی، داده‌های غیرسنتی به منابع حیاتی برای صدور بیمه‌نامه تبدیل شده‌اند. این منابع جدید دغدغه‌های مربوط به حریم خصوصی و مالکیت داده را افزایش داده است. مسئله مهم دیگر این است که معتبرسازی قانونی داده‌ها و تطابق آن‌ها با استانداردهای نهاد قانون‌گذار، اهمیت بیشتری از کیفیت داده‌ها دارد. مسئله‌ی بعدی وقتی پیش می‌آید که یک مدل با استفاده از منابع بیرونی ساخته شده باشد و در شرکت، متخصصان داخلی کافی، برای اعتبارسنجی آن و اعتبارسنجی ورودی‌ها و خروجی‌های آن وجود نداشته باشد. قانون‌گذاران می‌خواهند از کیفیت داده‌ها و تبعیض‌آمیز نبودن الگوریتم‌ها اطمینان حاصل کنند. مدل‌ها باید متکی به اسناد و مدارک کافی باشند تا بتوان آن‌ها را [در شرایط مشابه] تکرار کرد. طراحان مدل باید فرضیات و الگوریتم‌های آن را نه فقط برای سهامداران اصلی بلکه به‌منظور ایجاد شفافیت، برای عموم نیز به خوبی توضیح دهند.

بیمه‌گران و نهاد قانون‌گذار باید با همکاری یکدیگر، فرایندهایی ایجاد نمایند که رضایت هر دو طرف را در بر داشته باشد، این فرایندها باید پاسخگوی موارد مهم زیر باشند:

۱. چطور باید از امنیت اطلاعات افراد بیمه‌شده و استفاده از آن‌ها فقط به‌منظور خاص، اطمینان حاصل کرد.

۲. چگونه اطمینان حاصل نماییم که متغیرهای مهم در مدل‌های اکچوئرال، ناعادلانه و تبعیض‌آمیز یا جانشین متغیرهای ممنوعه نهاد قانون‌گذار نیستند.

۳. چگونه سوگیری‌های آماری را در داده‌های مدل‌سازی شناسایی کرده و از مرتبط بودن ریسک بیمه‌شده با متغیرهای مهم، اطمینان حاصل کنیم.

۴. در صورتی‌که شرکت‌های بیمه، الگوریتم‌های یادگیری ماشین را قبل از مدل‌های خطی تعمیم‌یافته[76]، پذیرفته باشند، چگونه از توضیح‌پذیری و تفسیرپذیری الگوریتم‌های مدل‌سازی و نتایج آن اطمینان حاصل نماییم.

۵. چگونه میزان جزئیات[77] مورد نیاز برای نتایج صدور بیمه‌نامه را (با رعایت این موضوع که ناخواسته منجر به تأثیرات نابرابرانه بر طبقات حفاظت‌شده نشود)، تعیین نماییم. شرکت‌های بیمه موظفند که مناسب بودن متغیرهای مهم به‌کاررفته در مدل‌‌های خود را به تأیید برسانند و علاوه بر آن کیفیت داده‌ها را نیز توسط اکچوئری‌ها و سایر متخصصان که از بازار بیمه، محصولات بیمه‌ای و مسئولیت‌‌ها مطلع هستند، مورد بازبینی قرار دهند.

۶. چگونه مطمئن شویم که شرکت‌ها اجازه اجرای الگوریتم‌های «جعبه‌ی سیاه»[78] را بدون نظارت انسانی نخواهند داد. نظارت انسانی تضمین‌گر این است که ابزارهای هدایت و معیارها درست کار می‌کنند و توانایی سنجش تناسب و هماهنگی مدل‌ها را برای اهدفی که برایشان طراحی شده‌اند، دارند.  

بخشنامه‌ شماره 1 بیمه‌ ایالت نیویورک که در سال 2019 منتشر شده‌است[79]، منبعی مفید و حاوی ملاحظات مهم قانونی

برای شرکت‌های بیمه می‌باشد. این بخشنامه استفاده از داده‌های خارجی و بعضی رویکردهای خاص در داده‌های تحلیلی

و مدل‌های پیش‌بینی‌گر را نیز در بر می‌گیرد. اگرچه کاربرد این بخشنامه بیشتر برای شرکت‌های بیمه عمر (در زمینه

استفاده از منابع بیرونی و منابع اطلاعاتی در صدور بیمه‌نامه کاربرد دارد، اما می‌توان از آن به عنوان راهنمایی برای اطلاع‌رسانی دیگر بخش‌های صنعت بیمه نیز استفاده کرد. این راهنما استفاده از داده‌های بیرونی را از منابع داده‌های غیرسنتی تشخیص داده و مزایای احتمالی صدور بیمه‌نامه و فروش بیمه عمر را به روشی ساده‌تر نشان می‌دهد و باعث بهبود و گسترش صدور بیمه‌نامه می‌شود. این بخشنامه همچنین خاطرنشان می‌سازد که داده‌های خارجی و الگوریتم‌ها می‌توانند تأثیر منفی بر مواردی از قبیل دردسترس بودن و مناسب بودن قیمت بیمه‌ عمر برای مشتریان طبقات حفاظت‌شده داشته باشند. این مسأله با همکاری متقابل نهاد قانون‌گذار و بیمه‌گران می‌تواند به‌طور مؤثری رفع شود.

تأثیر کلان‌داده‌ها بر تحول صنعت بیمه

شکی نیست که کل صنعت بیمه در معرض تحول ناشی از نوآوری‌های فن‌آوری بیمه[80] ، قدرت پیش‌بینی‌گر تحلیلی پیشرفته و هوش مصنوعی قرار دارد. اکچوئری‌ها بر این باورند که به روز نمودن ابزار سنتی مورد استفاده در این حرفه، برای تحلیل داده‌ها جدیدی که توسط فن‌آوری‌های نوین تولید می‌شوند و برای ارتقای طبقه‌بندی و قیمت‌گذاری ریسک‌های کنونی و آینده ضروری است. تخصص اکچوئرال در حال تکامل و آماده‌سازی متخصصان برای پذیرفتن فناوری‌های جدید و تولید داده، هم‌زمان با تمرکز بر روی بر یادگیری ماشینی در رشته دانشگاهی اکچوئرال می‌باشد.

با وجود همه مطالب ذکر شده، اکچوئری‌ها نمی‌توانند فعالیت‌های بیمه‌ای را بدون همکاری با نهاد قانون‌گذار (برای اثبات اینکه این نوآوری‌ها به امنیت مصرف‌کننده لطمه نمی‌زنند) انجام دهند.

همراه با ورود فن‌آوری‌های جدید بیمه‌ای، می‌توان هم‌زمان شاهد تحول و همچنین تخریب صنعت بیمه باشیم. لذا بدیهی است که این تحول با ساختارشکنی عظیم همراه باشد. استفاده از روش‌های یادگیری ماشین و کلان‌داده‌ها در مدل‌سازی اکچوئرال، باعث ایجاد نگرانی‌هایی برای نهاد قانون‌گذار در خصوص حفظ امنیت مصرف‌کننده شده است. سه نکته‌ آموزشی که از این تجربه به دست می‌آید و برای حفظ هوشیاری صنعت بیمه اهمیت دارد، عبارتند است از:

۱. الگوریتم‌ها نباید منجر به آسیب رساندن به مصرف‌کننده و به مخاطره انداختن اعتبار وی شوند. الگوریتم‌ها و داده‌های آموزشی باید مطابق با استاندارد‌های مورد نیاز باشند. گروه‌های مدل‌سازی نیز باید شامل افرادی با تخصص‌های متنوع بوده، تا سوگیری نسبت به افراد طبقات حفاظت‌‌‌­شده کاهش یابد.

۲. اگرچه پوشش‌های بیمه برای حل تمام مشکلات ساختاری و اجتماعی طراحی نشده است، اما در دسترس بودن و پایداری آن باید مورد توجه قرار گیرد، لیکن نباید با محدود کردن دسترسی به بیمه و گرانی محصولات آن، به این مشکلات دامن زده شود. استفاده از هوش مصنوعی و کلان‌داده‌های همسو با سیاست‌های قانون‌گذار، برای شناسایی کسانی که از بیمه خرد[81] سود می‌برند، مفید خواهد بود. همچنین این روش‌ها برای شناسایی راه‌حل‌های عمومی برای کاهش هزینه‌ محافظت در برابر ریسک نیز سودمند می‌باشند.

۳. برای گسترش و بکارگیری هوش مصنوعی باید از رویکرد چندجانبه استفاده شود. شواهد فراوانی وجود دارد که نشان می‌دهند، رویکردهای متنوع و چندجانبه، به راه‌حل‌های مؤثرتر، همراه با سوگیری کمتری می‌انجامند. در مقایسه با بسیاری از رشته‌های فوق‌تخصصی، تخصص اکچوئرال به نسبت جمعیت، چندان متنوع نیست. تحقیقات نشان می‌دهند که کمبود تنوع در تخصص‌ها، برای کاهش سوگیری الگوریتمی مشکل‌ساز خواهد بود. وقتی تنوع و مهارت‌های چندجانبه در گروه‌های مدل‌سازی کم باشند، اهمیت سایر معیارهای کاهنده سوگیری دوچندان می‌شود. این معیارها برای ایجاد اعتماد بین بیمه‌گران، عموم مردم و نهاد نظارتی قانون‌گذار لازم می‌باشند و شامل موارد زیر هستند:

الف. تحلیل متغیر هدف؛

ب. حسابرسی بی‌طرفانه‌ نتایج؛

ج. تمرکز بر ساختار داده‌های آموزشی؛

د. شفافیت بیشتر روش­شناسی الگوریتم و

هـ. معیارهای اعتبارسنجی برای کاهش نگرانی درمورد سوگیری‌های الگوریتمی.

البته در بهترین شرایط نیز، احتمال ورود سوگیری به الگوریتم‌ها وجود دارد. لذا تنها راه ممکن برای حفظ اعتماد، عزت‌نفس، جلب احترام نهاد قانون‌گذار و عامه‌ مردم، هوشیاری و مراقبت آشکار برای شناسایی و رفع سوگیری‌هاست. نهاد قانون‌گذار نیز باید با فراهم کردن فناوری قانون‌گذاری امن، به بیمه‌گران اطمینان دهد که بدون فاش کردن اسرار تجاری شرکت، می‌توانند با این نهاد صادق باشند. در این راستا، ضروری‌ست که تکامل نهاد قانون‌گذار و صنعت بیمه، هر دو در جهت منافع عامه باشد.

مترجم: کریستین جانفزا، کارشناسی ارشد اقتصاد نظری، دانشگاه تهران؛ کارشناس اداره کشتی و پی‌اند‌آی، بیمه مرکزی جمهوری اسلامی ایران

 

 


[1] Algorithm: الگوریتم در ریاضیات و علوم کامپیوتر به مجموعه ای از مراحل و فرایندهای متوالی برای حل یک مسئله و یا انجام محاسات گفته می‌شود.

Artificial Intelligence (AI) [2]: هوش مصنوعی شاخه‌ای از علوم رایانه است که هدف اصلی آن تولید ماشین‌های هوشمندی است که توانایی انجام وظایفی که نیازمند به هوش انسانی است را دارند. در واقع نوعی شبیه سازی هوش انسانی برای کامپیوتر است.

[3] These funds are typically “borrowed” in order to sell a policy.

[4]  Dividend

[5] Nonguaranteed elements.

[6] Business Model of Insurance

[7] از جمله این برنامه‌­های سلامتی می­توان به دستگاه­های پوشیدنی پایش سلامت همانند ساعت­های هوشمند اشاره نمود.

[8] Uncertainty.

[9] Frank Knight.

[10] Efficiency

[11] Uber & Lyft.

[12] Machine learning

[13] Data asset: A data asset may be a system or application output file, database, document, or webpage

[14] Actuarial Standards of Practice

[15] Actuarial Standards Board

[16] Dividend

[17]  Hurricane

[18] Tornado

[19] National Association of Insurance Commissioners :

[20] سازمان ملی هیئت بیمه  به‌طور یکپارچه اصول راهنمای هوش مصنوعی را پذیرفته و تأیید می‌کنند، 20ام ماه اوت سال 2020.

Feature Engineering [21]: مهندسی ویژگی یا استخراج ویژگی یا کشف ویژگی، فرایند استفاده از دانش دامنه برای استخراج ویژگی‌ها (مشخصات، خواص، صفت‌ها) از داده‌های خام است. انگیزه استفاده از این ویژگی‌های اضافی برای بهبود کیفیت نتایج حاصل از فرایند یادگیری ماشین است، در مقایسه با ارائه تنها داده خام به فرایند یادگیری ماشین (منبع: ویکی‌پدیا)

[22] Representativeness.

[23] Proxies.

[24] Correlation.

[25] Causation.

[26] Association.

[27] اصطلاح پیوستگی به طور وسیعی به هرگونه ارتباطی اشاره دارد، درحالیکه اصطلاح محدودتر یعنی همبستگی بیشتر به رابطه خطی بین دو متغیر اشاره دارد.

[28] Gold standard.

[29] Randomized control trial (RCT).

[30] Evidence based medicine

[31] Nickson, C. (2019, April 9). Randomized Control Trials. Retrieved from https://litfl.com/randomised-control-trials/.

[32] Predictive models.

[33] Disallowed Variables.

[34] Third-party data sources.

[35] Interpretability

[36] Explainability

[37] Replication

[38] Cross-functional.

[39]  American Academy of Actuaries

[40] Monograph.

[41] On Risk Classification; American Academy of Actuaries, November 2011.

[42] Risk Classification Statement of Principles (SOP)

[43] Biometric data.

[44] Body mass index (BMI).

[45] Co-morbidities.

[46] Driving under the influence.

[47] Behavioral inference

[48] Massachusetts Institute of Technology (MIT)

[49] Emerging risk

[50] Afterword: Reclaiming psychoanalysis: Sherry Turkle in conversation with the Editors”; Psychoanalytic Perspectives; 2017.

[51] Self-quantification

[52] Fitbit

[53] Self-efficacy

[54] Self-regulation

[55] Analysis of self-efficacy theory of behavioral change”; Cognitive Therapy and Research; 1977.

[56] Nudge: Improving Decisions About Health, Wealth, and Happiness; Richard Thaler and Cass Sunstein; 2009.

[57] Data broker

[58] LexisNexis

[59] Experian

[60] Acxiom

[61] Algorithmic bias detection and mitigation: Best practices and policies to reduce consumer harms; Brookings Institution; May 22, 2019

[62] Ethics, Data and Insurance: 4 Developments Worth Watching”; nft.nu; April 2017.

[63] Structured.

[64] Semi-structured.

[65] Unstructured.

[66] External software.

Third-party software[67]: برنامه‌های ثالث، برنامه‌هایی هستند که برای کار درون سیستم عامل‌ها نوشته شده، اما به وسیله افراد یا شرکت‌ها به غیر از تولیدکننده سیستم عامل نوشته می‌شوند.

[68] Missing values.

[69] Value proposition.

[70]  dataset

[71] What Do We Do About the Biases in AI?”; Harvard Business Review; Oct. 25, 2019.

confounding variables [72]: متغیرهایی مخدوش­کننده، متغبرهایی هستند که بر روی رابطه علت و معلولی بین دو متغیر تأثیر می گذارند و باعث می شوند که رابطه علت و معلولی قویتر یا ضعیفتر از حد معمول جلوه کند.

[73] این موضوع مطلبی به زبان ساده در مورد این سوگیری‌هاست.

[74] Causal inference.

[75] Insurance Markets: Benefits and Challenges Presented by Innovative Uses of Technology; Government Accountability Office; June 7, 2019.

[76]  Generalized Linear Modeling

[77] Granularity.      

[78] Black box.

[79] “Insurance Circular Letter No. 1 (2019)”; New York Department of Financial Services; Jan. 18, 2019.

[80] Insurtech.

[81]  Microinsurance

منبع خبر
منبع: دلویت، تاریخ انتشار: آبان ۱۴۰۱ (اکتبر 2022)
امتیاز :  ۰ |  مجموع :  ۰

برچسب ها

    6.1.7.0
    V6.1.7.0