深源恒际:简单、高效的AI-TPA系统,你了解多少? 关于AI-TPA系统的「快问速答」

深源恒际科技有限公司 2020-12-10 11:51:06

01

如何定义AI-TPA系统?


AI-TPA系统主要服务于健康险核赔理算业务场景。依托AI核心技术,结合多重规则引擎,在“机器识别为主,人工复核为辅”的理念下,基于计算机视觉算法实现医疗票据文字信息的自动识别与结构化提取,并结合人工对置信度较低的高风险信息进行复核与校正,以人机相辅相成的方式形成作业闭环,实现核赔理算全信息数字化录入。



从业务流转流程上看,当理赔案件进入系统后,算法模型首先对票据进行自动分类,并初步完成文字信息的自动识别与结构化提取;基于计算机视觉识别结果,系统将依据多重规则引擎筛选出置信度较低的字段信息并进行提示,进而转入人工辅助流程;人工将通过四点校正、补框、打字、录入等操作更好地辅助算法优化信息提取效果,进一步提升信息的完整性与精确度;基于精确的识别校正结果,算法模型和规则引擎计算输出最终结果,人工仅需简单复核即可完成理赔流程。


AI-TPA系统包括工作台、案件管理、任务管理、配置管理、系统管理五大管理功能模块。其中,工作台模块支持各作业环节下所完成案件量的统计;案件管理模块支持案件详情的查询与管理;任务管理模块支持与图像校正干预、检测干预和识别干预相关的任务操作管理;配置管理模块支持依案件所属地和任务类型按需配置人力;系统管理模块支持角色管理、用户管理和案件设置。

在AI-TPA服务流程中,八成以上的工作量由机器识别完成,辅以少量的人工复核作业,有效保障了理算信息的完整性与精确性,大幅优化提升理赔服务效率。


02

基于什么样的背景和契机研发了AI-TPA系统?


当下,“三医联动”(医疗、医保、医药改革联动)数据还未实现完全的开放与共享,险企之间的信息孤岛仍未打破,医疗信息无法在各机构、各部门间互联共通、实时快速流转,一定时间段内健康险的核赔理算仍需依赖票据信息的有效提取。


然而,在真实理赔业务场景中,医疗票据录入是一项依赖大量人力的重复性劳动,每年耗费成本近百亿。传统的人工录入作业方式存在两方面不足:一是理算过程中涉及的信息量十分庞杂,人工作业难免出现疏漏或删繁就简的情况,影响理算信息的准确性,进而发生理赔渗漏,给保险公司带来不必要的经济损失;二是投入大量人力从事相对重复的事务性工作,对保险机构而言,耗时费力、效率低下,相当于变相增加了运营成本。


同时,新冠疫情爆发以来,当前以人力为主的线下经营模式遭遇空前挑战。业内无论大型险企还是其他市场参与方都在尝试从人海战术模式挣脱出来,探索数字化转型发展新路径。在疫情倒逼下,加速推进保险业务线上化势在必行。 


在此契机下,深源恒际推出AI-TPA服务,基于AI技术以高效率、低成本的方式帮助健康险实现理算信息的数字化提取,助力理赔服务走向线上化,大幅提升理赔案件流转效率。


03

AI-TPA系统是如何优化健康险理赔业务流程的?


AI-TPA系统包括前端图像质量检测票据自动分类OCR识别与结构化提取信息智能校准与纠正四大核心服务模块。四大核心功能环环相扣,以信息数字化、电子化的方式替代人工录入作业,大幅缩短理算用时,优化理赔服务流程。


图像质量检测是在拍照端对图像质量进行检测和预处理的环节。基于图像智能处理技术,当用户上传票据信息时,系统会动态检测图像质量,一方面自动捕捉清晰度高的图片,自动对图像进行优化预处理(如倾斜矫正、去遮挡等);另一方面自动识别用户上传的文件是否符合规范,如身份证、银行卡是否为原件扫描件抑或其他影印件。


基于简单易用的前端操作,图像质量检测相当于在数据上传时同步完成图像质量把控,既降低了信息识别与提取的难度,也缩短了算法模型处理图像的时耗,提高识别准确率的同时也提升了识别速度。


完成图片质量检测后,票据自动分类模块主要基于OCR识别技术对理赔材料进行自动分类,身份证、银行卡、发票单据、入院记录、出院小结等将被智能分类归集,便于算法模型对不同模板的票据进行准确识别。


OCR识别与结构化提取,基于OCR识别技术,算法模型自动识别、提取用户所上传票据单证上的文字信息,包括身份证信息、银行卡信息、医疗发票(门诊发票、住院发票)、费用清单、出院小结等,实现核赔理算信息的结构化提取,有效提升信息录入效率,减少人工核算工作量,降低人力成本。


识别过程中存在诸多技术难题,如票面信息模糊、发票折叠畸变、内容重叠遮挡、信息串行等,都会对识别准确率造成干扰。为降低或消弭噪音,深源恒际在训练算法模型时结合了畸变纠正、断点补偿、字符修正等多种图像处理手段排除干扰因素,让医疗票据专用识别模型具备很好的抗干扰能力和鲁棒性。


信息智能校准与纠正,是确保理算信息准确无误的关键环节。基于字段间的逻辑关联关系,深源恒际研发了交叉校验规则引擎,系统会自动识别出置信度较低的、可能出错的数据,通过交叉校验对存疑信息进行启发式纠正、基于医疗词典库对模糊字段进行智能校准,综合多种校验方式提高信息校对速度,辅助人工完成信息复核与补录。


从前端图像质量检测、票据自动分类到OCR识别与结构化提取,再到信息智能校准与纠正,AI-TPA服务一方面通过自动化作业方式取代80%以上的人工录入,全面改进了传统票据录入作业流程,高效提升理赔服务效率;另一方面基于算法持续的自我迭代与优化,使得健康险票据信息处理作业不断走向标准化,进而实现理赔流程的优化提升。


04

AI-TPA系统的核心优势体现在哪里?


对传统TPA公司和保险机构而言,AI-TPA系统的核心优势主要体现在以下四个方面:一是作业效率高。基于算法模型,结合多重规则引擎,机器识别的大部分信息仅需复核确认无需二次修改。二是对人员要求低。作业人员仅需按照规则引擎提示完成简单的信息核对与校正工作。三是系统适配性强。系统支持根据作业难易程度按需配置人力,支持依据业务需求输出指定字段信息。四是作业系统操作体验好。作业页面经过多次迭代打磨,更符合人力作业习惯。


05

AI-TPA系统的落地应用将带来哪些潜在价值?


基于AI-TPA系统的落地应用实现信息数字化,一方面高效提升了健康险业务流程效率,另一方面在数据挖掘和数据分析上也体现出多元的价值,尤其在保险两核(核保/核赔)、保险精算产品定价产品设计风险管理乃至健康管理等方面,信息数字化具有极大的反哺价值。


在健康险投保环节,由信息不对称带来的逆向选择是保险公司长期面临的问题之一。投保时,被保险人未如实告知健康状况或通过一些手段故意隐瞒事实,将给保险公司承保带来潜在风险。基于AI-TPA数字化的用户诊疗信息,保险机构承保时,可通过查询数字化信息记录,降低信息不对称带来的道德风险,降低不合理理赔带来的损失。


在健康险理赔环节,涉及理赔金额高、投保时间太集中、投保不久就申请理赔、理赔频率过于频繁等可疑情形时,保险公司为核实出险的真实性与合理性,会对案件介入调查。而理赔调查的重中之重即核查用户的就医诊疗记录。基于AI-TPA系统数字化提取医疗信息,可以帮助保险机构更全面地梳理案情来龙去脉,并将案情记录在案,以便后续查证。


在风险管理层面,健康险费率厘定、产品设计、风险管控等都离不开数据支持。目前保险公司主要数据来源于客户提供的个人信息,而这些数据多以纸质版或影印版保存,相对分散、不够系统,很难为精算和风控提供有效的数据分析支持。AI-TPA系统帮助健康险机构实现关键数据的数字化和结构化,形成系统且完善的数据库,为精算、定价和风控提供数据分析支持。


最后,在健康管理方面,为降低赔付率、实现有效控费,健康管理逐渐成为保险公司的衍生服务。保险公司激励、敦促客户做好个人的健康管理,以提升用户健康状况、降低理赔发生的概率。基于数字化的用户诊疗信息,保险公司在健康管理服务中可以更充分地了解用户既往健康史,更好地为用户提供差异化的创新服务。


06

AI-TPA系统有何特色?


AI-TPA系统最大的特色在于它是一个可实现自动化迭代和不断自我进化的系统,这得益于深度学习神经网络



目前,AI-TPA系统主要以“机器识别为主,人工复核为辅,人机相辅相成”的作业模式实现其核心功能。其中,人工辅助作业包括四点校正、拉框、打字、录入等操作。四点校正是通过四点拉框操作,辅助算法完成图像畸变校正;拉框作业是修正算法漏检或检测效果较差的文字框,辅助算法提高识别准确率;打字和录入操作是结合业务需求,确认、复核算法返回的识别结果是否准确并完成纠正。以上干预操作的目的在于帮助算法模型更好地完成识别,优化提升算法模型的识别准确率,同时,建立形成满足人工智能技术使用标准的数据闭环。


如此一来,在真实业务场景的反复验证下,基于深度学习神经网络,AI-TPA系统的算法模型会在周而复始的反复学习中得到叠加训练,随着训练频次的积累加强,算法模型将在持续的反复训练与强化学习中实现自动化迭代,从外在表现来看,整个系统的性能表现会越来越稳定。


当AI-TPA系统在不断自我进化时,其性能也将随之不断优化、提升,在此过程中,保险理赔流程将逐步实现全面自动化,少量的人工辅助也将退出历史舞台。