CN117273963A - 基于车险场景的风险识别方法和装置 - Google Patents
基于车险场景的风险识别方法和装置 Download PDFInfo
- Publication number
- CN117273963A CN117273963A CN202311550781.7A CN202311550781A CN117273963A CN 117273963 A CN117273963 A CN 117273963A CN 202311550781 A CN202311550781 A CN 202311550781A CN 117273963 A CN117273963 A CN 117273963A
- Authority
- CN
- China
- Prior art keywords
- risk
- predicted
- scene
- model
- car
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 66
- 238000007781 pre-processing Methods 0.000 claims abstract description 17
- 238000004458 analytical method Methods 0.000 claims abstract description 16
- 238000000605 extraction Methods 0.000 claims description 26
- 238000012549 training Methods 0.000 claims description 23
- 230000006870 function Effects 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 16
- 238000012216 screening Methods 0.000 claims description 12
- 238000004140 cleaning Methods 0.000 claims description 8
- 238000009795 derivation Methods 0.000 claims description 8
- 238000003860 storage Methods 0.000 claims description 6
- 230000008569 process Effects 0.000 description 10
- 238000004364 calculation method Methods 0.000 description 9
- 238000012545 processing Methods 0.000 description 7
- 239000000463 material Substances 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000013473 artificial intelligence Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000011835 investigation Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 101150091111 ACAN gene Proteins 0.000 description 1
- 101150008122 Bcan gene Proteins 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 229920002430 Fibre-reinforced plastic Polymers 0.000 description 1
- 108010001267 Protein Subunits Proteins 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 238000003340 combinatorial analysis Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 239000011151 fibre-reinforced plastic Substances 0.000 description 1
- 238000005242 forging Methods 0.000 description 1
- 230000008571 general function Effects 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000002203 pretreatment Methods 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/08—Insurance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
Abstract
本申请涉及一种基于车险场景的风险识别方法和装置。所述方法包括:对获取到的车险场景预测数据集进行预处理,得到待预测特征;将所述待预测特征输入人工智能模型进行风险预测,得到是否为风险案件的结论;将被预测为所述风险案件的所述待预测特征送入可解释性模型进行分析,得到所述风险案件的建议检查点。采用本方法能够解决人工手段识别车险场景的风险效率低,准确性差的问题,实现对车险场景下风险案件的快速预测和对疑点的准确迅速定位。
Description
技术领域
本申请涉及识别保险欺诈技术领域,特别是涉及一种基于车险场景的风险识别方法和装置。
背景技术
随着道路上的车辆数量越来越多,车险行业也随之崛起,车险平台为加强风险管理,需对用户提交的资料进行风险审核,以确保平台及使用者的财产安全。
目前,基于车险场景的风险识别方案主要依靠人工手段实现,工作人员借助自身经验,从车险场景的资料中手动发现及筛选风险事件。
这种依赖人工手段识别风险的方法,存在人力耗费大、成本高、专业技能有限等问题,难以高效准确的识别风险事件。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高风险识别效率的基于车险场景的风险识别方法和装置。
第一方面,本申请提出一种基于车险场景的风险识别方法,所述方法包括:
对获取到的车险场景预测数据集进行预处理,得到待预测特征;
将所述待预测特征输入人工智能模型进行风险预测,得到是否为风险案件的结论;
将被预测为所述风险案件的所述待预测特征送入可解释性模型进行分析,得到所述风险案件的建议检查点。
在其中一个实施例中,所述方法还包括:
获取车险场景训练数据集,对所述车险场景训练数据集进行预处理,得到待训练特征;
将所述待训练特征送入学习模型进行训练,得到能够对车险场景下的风险进行识别的人工智能模型。
在其中一个实施例中,所述预处理,包括:数据清洗和特征衍生。
在其中一个实施例中,所述将被预测为所述风险案件的所述待预测特征送入可解释性模型进行分析,得到所述风险案件的建议检查点,包括:
将预测为所述风险案件的所述待预测特征输入可解释性模型的因子抽取模块,从所述待预测特征中提取反映所述风险案件信息的因子,得到因子集合;
将所述因子集合输入所述可解释性模型的可解释性生成模块,对所述因子集合进行分析,得到所述风险案件的建议检查点。
在其中一个实施例中,在所述从所述待预测特征中提取反映所述风险案件信息的因子之前,还包括:
获取用户新添加的抽取函数,基于新添加的所述抽取函数从所述待预测特征中提取反映所述风险案件信息的因子。
在其中一个实施例中,所述将所述因子集合输入所述可解释性模型的可解释性生成模块,对所述因子集合进行分析,得到所述风险案件的建议检查点,包括:
将所述因子集合输入所述可解释性模型的可解释性生成模块,基于预设的现有经验对所述因子集合中的所述因子进行排列组合,得到相应规则和每一条所述规则对应的一条解释性说明;
计算每一条所述规则的风险分数;从所述规则中筛选出所述风险系数高于预设阈值的被采纳规则,基于所述被采纳规则对应的所述解释性说明,得到所述风险案件的建议检查点。
在其中一个实施例中,所述计算每一条所述规则的风险分数;从所述规则中筛选出所述风险系数高于预设阈值的被采纳规则,基于所述被采纳规则对应的所述解释性说明,得到所述风险案件的建议检查点,包括:
所述因子集合中包括布尔型因子和数值型因子;
基于每个规则中所述布尔型因子和所述数值型因子的数值和个数,计算得到的每个规则的风险分数;
从所述规则中筛选出所述风险系数高于预设阈值的被采纳规则,基于所述被采纳规则对应的所述解释性说明,得到所述风险案件的建议检查点。
第二方面,本申请还提供了一种基于车险场景的风险识别装置,所述装置包括:
特征提取模块,对获取到的车险场景预测数据集进行预处理,得到待预测特征;
风险预测模块,将所述待预测特征输入人工智能模型进行风险预测,得到是否为风险案件的结论;
解释建议模块,将被预测为所述风险案件的所述待预测特征送入可解释性模型进行分析,得到所述风险案件的建议检查点。
第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现第一方面所述的基于车险场景的风险识别方法。
第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现第一方面所述的基于车险场景的风险识别方法。
上述基于车险场景的风险识别方法和装置,通过对获取到的车险场景预测数据集进行预处理,得到待预测特征;将所述待预测特征输入人工智能模型进行预测,得到是否为风险案件的结论;将预测为所述风险案件的所述待预测特征送入可解释性模型进行分析,得到所述风险案件的建议检查点;解决了人工手段识别车险场景的风险效率低,准确性差的问题,实现了对车险场景下风险案件的快速预测和对疑点的准确迅速定位。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为一个实施例中基于车险场景的风险识别方法的硬件结构框图;
图2为一个实施例中基于车险场景的风险识别方法的流程示意图;
图3为一个优选实施例中基于车险场景的风险识别方法的流程示意图;
图4为一个实施例中基于车险场景的风险识别装置的结构框图;
图5为另一个实施例中基于车险场景的风险识别装置的结构框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。基于本申请提供的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
显而易见地,下面描述中的附图仅仅是本申请的一些示例或实施例,对于本领域的普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图将本申请应用于其他类似情景。此外,还可以理解的是,虽然这种开发过程中所作出的努力可能是复杂并且冗长的,然而对于与本申请公开的内容相关的本领域的普通技术人员而言,在本申请揭露的技术内容的基础上进行的一些设计、制造或者生产等变更只是常规的技术手段,不应当理解为本申请公开的内容不充分。
在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域普通技术人员显式地和隐式地理解的是,本申请所描述的实施例在不冲突的情况下,可以与其它实施例相结合。
除非另作定义,本申请所涉及的技术术语或者科学术语应当为本申请所属技术领域内具有一般技能的人士所理解的通常意义。本申请所涉及的“一”、“一个”、“一种”、“该”等类似词语并不表示数量限制,可表示单数或复数。本申请所涉及的术语“包括”、“包含”、“具有”以及它们任何变形,意图在于覆盖不排他的包含;例如包含了一系列步骤或模块(单元)的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可以还包括没有列出的步骤或单元,或可以还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。本申请所涉及的“连接”、“相连”、“耦接”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电气的连接,不管是直接的还是间接的。本申请所涉及的“多个”是指两个或两个以上。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。本申请所涉及的术语“第一”、“第二”、“第三”等仅仅是区别类似的对象,不代表针对对象的特定排序。
在本实施例中提供的方法实施例可以在终端、计算机或者类似的运算装置中执行。比如在终端上运行,图1是本实施例的基于车险场景的风险识别方法的硬件结构框图。如图1所示,终端可以包括一个或多个(图1中仅示出一个)处理器102和用于存储数据的存储器104,其中,处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置。上述终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述终端的结构造成限制。例如,终端还可包括比图1中所示更多或者更少的组件,或者具有与图1所示出的不同配置。
存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如在本实施例中的基于车险场景的风险识别方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输设备106用于经由一个网络接收或者发送数据。上述的网络包括终端的通信供应商提供的无线网络。在一个实例中,传输设备106包括一个网络适配器(NetworkInterface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输设备106可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
在本实施例中提供了一种基于车险场景的风险识别方法,图2是本实施例的基于车险场景的风险识别方法的流程示意图,如图2所示,该流程包括如下步骤:
步骤S210,对获取到的车险场景预测数据集进行预处理,得到待预测特征。
具体的,车险场景预测数据集包括基于车险场景场得到的数据资料,可以为文件资料如保单、索赔材料等,也可以为事故现场和事故车辆的图像资料等,或与车险相关的其他形式的材料。一组车险场景预测数据集可以为针对一个车险案件上传的数据资料。
具体的,本实施例所用到的预处理方法可以包括数据清洗和特征衍生。通过数据清洗,使数据更适合进行分析和建模,提高数据的准确性和可靠性。特征衍生是指从原始数据中提取特征,例如文本特征、图像特征、声音特征等,以便将车险场景预测数据集中的原始数据转化为更具有表征性的待预测特征,从而提高模型性能和泛化能力。
步骤S220,将待预测特征输入人工智能模型进行风险预测,得到是否为风险案件的结论。
具体的,例如投保人利用车险平台的管理的漏洞,伪造保险单、重复投保等其他将会造成车险平台财产损失的情况都属于风险案件。利用预先训练好的人工智能模型可以对风险进行初步识别,快速筛选出风险案件。
步骤S230,将被预测为风险案件的待预测特征送入可解释性模型进行分析,得到风险案件的建议检查点。
具体的,为了提高对风险案件的可解释性,继续对风险案件进行二次识别,利用可解释性模型给出风险案件的具体疑点,进一步提高了风险识别的可靠性和准确性。也便于车险平台后续根据获取到的上述建议检查点进行落地调查。
上述基于车险场景的风险识别方法,通过对获取到的车险场景预测数据集进行预处理,得到待预测特征;将处理好的待预测特征输入人工智能模型进行预测,得到是否为风险案件的结论;将预测为风险案件的待预测特征送入可解释性模型进行分析,得到风险案件的建议检查点。解决了传统车险风险识别过程中,人工识别风险案件的效率低,准确性差的问题,方法实现了对车险场景下风险案件的快速预测和对疑点的准确迅速定位。尤其是针对疑难案件,避免了因为工作人员经验不够丰富,出现的漏检或风险定位不准的问题。
在其中一个实施例中,上述基于车险场景的风险识别方法还包括:
步骤S240,获取车险场景训练数据集,对车险场景训练数据集进行预处理,得到待训练特征。
步骤S250,将待训练特征送入学习模型进行训练,得到能够对车险场景下的风险进行识别的人工智能模型。
具体的,本实施例所用到的预处理方法与上述步骤S210中用到的预处理方法相同,也包括数据清洗和特征衍生,从而统一模型训练和模型预测应用两个过程中产生特征数据的处理方式,提人工智能模型进行高风险预测的鲁棒性。其中,学习模型包括机器学习模型或深度学习模型。
在本实施例中,通过车险场景训练数据集训练人工智能模型,从而得到适用于车险风险预测的人工智能模型。
在其中一个实施例中,基于上述步骤S230,将被预测为风险案件的待预测特征送入可解释性模型进行分析,得到风险案件的建议检查点,具体包括以下步骤:
步骤S310,将预测为风险案件的待预测特征输入可解释性模型的因子抽取模块,从待预测特征中提取反映风险案件信息的因子,得到因子集合。
具体的,因子抽取模块可以采用通用接口,可以对json格式的案件进行信息抽取,并输出所有因子汇总的表格。
具体的,因子抽取模块用于抽取案件基本信息,例如“报案时间是否为白天“、“车辆修理的配件中是否包含车灯”等。因子抽取模块包括多个预设的通用函数,例如车辆修理函数可以抽取已设置的车灯、车挡板、轮胎等信息;此外,抽取函数还可以根据用户需求添加新的抽取内容。经过因子抽取模块对待预测特征的处理,可以得到包括“是否白天”、“是否标的”、“维修配件数目”、“保单到期时间”等信息的因子集合。
进一步的,在从待预测特征中提取反映风险案件信息的因子之前,还包括:获取用户新添加的抽取函数,基于新添加的抽取函数从待预测特征中提取反映风险案件信息的因子。根据车险场景的特定,已在因子抽取中预设了多个通用函数。如果用户所需抽取信息在目前的函数中无法实现抽取,因子抽取模块还支持用户自行添加函数。
步骤S320,将因子集合输入可解释性模型的可解释性生成模块,对因子集合进行分析,得到风险案件的建议检查点。
具体的,可解释性生成模块可以采用评分模型,对因子集合中的因子进行处理分析,基于因子得到对风险案件的解释说明,从而确定风险案件的建议检查点。
在本实施例中,通过提取描述风险案件的信息因子以及对因子进行分析,能够针对简化后的数据集进行潜在信息的发掘,提高模型的计算效率。
在其中一个实施例中,基于上述步骤S320,将因子集合输入可解释性模型的可解释性生成模块,对因子集合进行分析,得到风险案件的建议检查点,具体包括以下步骤:
步骤S410,将因子集合输入可解释性模型的可解释性生成模块,基于预设的现有经验对因子集合中的因子进行排列组合,得到相应规则和每一条规则对应的一条解释性说明。
步骤S420,计算每一条规则的风险分数;从规则中筛选出风险系数高于预设阈值的被采纳规则,基于被采纳规则对应的解释性说明,得到风险案件的建议检查点。
具体的,预设的现有经验包括一系列预设规则和每个预设规则对应的预设解释。基于现有经验将散列的因子排列组合为规则,并且一条规则对应一条解释。其中,现有经验库可以根据经验的累积和扩展不同补充,用户可以自定义添加新的规则和规则对应的可解释性说明,以提高分析的性能。
在本实施例中,通过基于规则-解释形式的现有经验对因子进行组合分析,能够准确解释因子集合表达出的潜在风险。
在其中一个实施例中,基于上述步骤S420,计算每一条规则的风险分数;从规则中筛选出风险系数高于预设阈值的被采纳规则,基于被采纳规则对应的解释性说明,得到风险案件的建议检查点,具体包括以下步骤:
步骤S510,因子集合中包括布尔型因子和数值型因子;基于每个规则中布尔型因子和数值型因子的数值和个数,计算得到的每个规则的风险分数。
步骤S520,从规则中筛选出风险系数高于预设阈值的被采纳规则,基于被采纳规则对应的解释性说明,得到风险案件的建议检查点。
具体的,因子包括布尔型因子和数值型因子两类。例如,“是否白天”、“是否标的”等因子为布尔型因子,“维修配件数目”、“保单到期时间”、“定损金额”等因子为数值型因子。
具体的,筛选被采纳规则可以根据因子的重要性进行筛选,对因子设置相应权重,每一条规则中,所有因子的权重相加为1。对于数值型因子,可以通过函数计算分值,并通过归一化处理使得分值范围在[0,1]。
其中,风险分数的计算公式如下:
;
其中,risk为风险分数,当风险分数大于阈值时,则对应的规则被采纳,阈值预设0.5,也可由用户根据实际需求自行调节。
B risk 为强制权重,其值为0或1,表示规则中必须满足的条件;S risk 为分数权重,其值为分布在[0,1]中,表示规则中非必须满足的条件。
B risk 的计算公式如下:
;
其中,m为计算时涉及的布尔型因子数目,n为计算时涉及的数值型因子数目。x bbi 为布尔型因子F bbi 经过处理后的值,其中F bbi 为用于计算B risk 的第i个布尔型因子。x bni 为数值因子F bni 处理后的值,其中F bni 为用于计算B risk 的第i个数值因子。
F bbi 有两种处理方式,分别表示“F bbi ”和“!F bbi ”。
“F bbi ”对应的x bbi 计算方式为:
。
“!F bbi ”对应的x bbi 计算方式为:
。
x bni 的计算方式为:
;
其中,f bni 为计算函数,可以模型内置,也可以由用户自定义。a,b为任意实数,但需满足a<b,特别的,a可取-∞,b可取+∞。
S risk 的计算公式如下:
;
其中,k为布尔型变量的个数,l为数值型变量的个数;w sbi 为第i个布尔型变量的权重,x sbi 为第i个布尔型变量的分值,x sbi 的计算方式与x bbi 相同。w sni 为第i个数值型变量的权重,x sni 为第i个数值型变量的分值,其计算方式如下:
;
其中,f sni 为计算函数,可以模型内置,也可以由用户自定义。F sni 为用于计算S risk 的第i个数值因子,f sni_max 为在F sni 可能取值范围所求函数最大值,f sni_min 为在F sni 可能取值范围所求函数最小值。w sbi 和w sni 需满足下式:
。
由此可得risk为[0,1]间的实数,即为规则对应评分,若评分大于设置阈值,则该规则被采纳,即可输出其相应解释性说明。
下面通过优选实施例对本实施例进行描述和说明。
图3是本优选实施例的基于车险场景的风险识别方法的流程图。
本优选实施例中的基于车险场景的风险识别方法,包括训练流程和预测流程。
训练流程包括以下步骤:
步骤一,获取车险场景训练数据集。
步骤二,对车险场景训练数据集进行数据清洗和特征衍生,得到待训练特征。
步骤三,将处理好的待训练特征送入机器学习或深度学习模型进行训练,得到训练好的用于车险场景下的风险预测的人工智能模型。
预测流程包括以下步骤:
步骤一,获取车险场景预测数据集。
步骤二,按照训练模块中的处理方式,对车险场景预测数据集进行数据清洗和特征衍生,得到待预测特征。
步骤三,将处理好的待预测特征送入训练好的人工智能模型进行风险预测,得到是否为风险案件的结论。
步骤四,将被预测为风险案件的待预测特征送入可解释性模型进行分析,得到风险案件的建议检查点。
在本优选实施例中,考虑依靠到人工智能方法对车险风险进行,虽然具有较好的识别效率,但是缺乏可解释性,不利于案件调查和落地。因此在利用人工智能模型对特征进行分析的基础上,对识别出风险的案件利用可解释性模型进一步进行分析,帮助业务人员定位案件疑点,以便迅速开展案件调查和落地。
应该理解的是,虽然如上的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,在本实施例中还提供了一种基于车险场景的风险识别装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。以下所使用的术语“模块”、“单元”、“子单元”等可以实现预定功能的软件和/或硬件的组合。尽管在以下实施例中所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
在其中一个实施例中,如图4所示,提供了一种基于车险场景的风险识别装置,包括:特征提取模块41、风险预测模块42和解释建议模块43,其中:
特征提取模块41,对获取到的车险场景预测数据集进行预处理,得到待预测特征。
风险预测模块42,将待预测特征输入人工智能模型进行风险预测,得到是否为风险案件的结论。
解释建议模块43,将被预测为风险案件的待预测特征送入可解释性模型进行分析,得到风险案件的建议检查点。
在其中一个实施例中,参见图5,基于车险场景的风险识别装置还包括模型训练模块40:模型训练模块40用于获取车险场景训练数据集,对车险场景训练数据集进行预处理,得到待训练特征;将待训练特征送入学习模型进行训练,得到能够对车险场景下的风险进行识别的人工智能模型。
在其中一个实施例中,特征提取模块41或模型训练模块中的预处理,包括:数据清洗和特征衍生。
在其中一个实施例中,解释建议模块43还用于,将预测为风险案件的待预测特征输入可解释性模型的因子抽取模块,从待预测特征中提取反映风险案件信息的因子,得到因子集合;将因子集合输入可解释性模型的可解释性生成模块,对因子集合进行分析,得到风险案件的建议检查点。
在其中一个实施例中,解释建议模块43还用于,获取用户新添加的抽取函数,基于新添加的抽取函数从待预测特征中提取反映风险案件信息的因子。
在其中一个实施例中,解释建议模块43还用于,将所述因子集合输入所述可解释性模型的可解释性生成模块,基于预设的现有经验对所述因子集合中的所述因子进行排列组合,得到相应规则和每一条所述规则对应的一条解释性说明;计算每一条所述规则的风险分数;从所述规则中筛选出所述风险系数高于预设阈值的被采纳规则,基于所述被采纳规则对应的所述解释性说明,得到所述风险案件的建议检查点。
在其中一个实施例中,解释建议模块43还用于,所述用于组合出规则的因子集合中包括布尔型因子和数值型因子;基于每个规则中所述布尔型因子和所述数值型因子的数值和个数,计算得到的每个规则的风险分数;从所述规则中筛选出所述风险系数高于预设阈值的被采纳规则,基于所述被采纳规则对应的所述解释性说明,得到所述风险案件的建议检查点。
上述基于车险场景的风险识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在其中一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述任一实施例中基于车险场景的风险识别方法的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述任一实施例中基于车险场景的风险识别方法的步骤。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述任一实施例中基于车险场景的风险识别方法的步骤。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random AccessMemory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (10)
1.一种基于车险场景的风险识别方法,其特征在于,所述方法包括:
对获取到的车险场景预测数据集进行预处理,得到待预测特征;
将所述待预测特征输入人工智能模型进行风险预测,得到是否为风险案件的结论;
将被预测为所述风险案件的所述待预测特征送入可解释性模型进行分析,得到所述风险案件的建议检查点。
2.根据权利要求1所述的基于车险场景的风险识别方法,其特征在于,所述方法还包括:
获取车险场景训练数据集,对所述车险场景训练数据集进行预处理,得到待训练特征;
将所述待训练特征送入学习模型进行训练,得到能够对车险场景下的风险进行识别的人工智能模型。
3.根据权利要求1或权利要求2任一项所述的基于车险场景的风险识别方法,其特征在于,所述预处理,包括:数据清洗和特征衍生。
4.根据权利要求1所述的基于车险场景的风险识别方法,其特征在于,所述将被预测为所述风险案件的所述待预测特征送入可解释性模型进行分析,得到所述风险案件的建议检查点,包括:
将预测为所述风险案件的所述待预测特征输入可解释性模型的因子抽取模块,从所述待预测特征中提取反映所述风险案件信息的因子,得到因子集合;
将所述因子集合输入所述可解释性模型的可解释性生成模块,对所述因子集合进行分析,得到所述风险案件的建议检查点。
5.根据权利要求4所述的基于车险场景的风险识别方法,其特征在于,在所述从所述待预测特征中提取反映所述风险案件信息的因子之前,还包括:
获取用户新添加的抽取函数,基于新添加的所述抽取函数从所述待预测特征中提取反映所述风险案件信息的因子。
6.根据权利要求4所述的基于车险场景的风险识别方法,其特征在于,所述将所述因子集合输入所述可解释性模型的可解释性生成模块,对所述因子集合进行分析,得到所述风险案件的建议检查点,包括:
将所述因子集合输入所述可解释性模型的可解释性生成模块,基于预设的现有经验对所述因子集合中的所述因子进行排列组合,得到相应规则和每一条所述规则对应的一条解释性说明;
计算每一条所述规则的风险分数;从所述规则中筛选出风险系数高于预设阈值的被采纳规则,基于所述被采纳规则对应的所述解释性说明,得到所述风险案件的建议检查点。
7.根据权利要求6所述的基于车险场景的风险识别方法,其特征在于,所述计算每一条所述规则的风险分数;从所述规则中筛选出所述风险系数高于预设阈值的被采纳规则,基于所述被采纳规则对应的所述解释性说明,得到所述风险案件的建议检查点,包括:
所述因子集合中包括布尔型因子和数值型因子;
基于每个规则中所述布尔型因子和所述数值型因子的数值和个数,计算得到的每个规则的风险分数;
从所述规则中筛选出所述风险系数高于预设阈值的被采纳规则,基于所述被采纳规则对应的所述解释性说明,得到所述风险案件的建议检查点。
8.一种基于车险场景的风险识别装置,其特征在于,所述装置包括:
特征提取模块,对获取到的车险场景预测数据集进行预处理,得到待预测特征;
风险预测模块,将所述待预测特征输入人工智能模型进行风险预测,得到是否为风险案件的结论;
解释建议模块,将被预测为所述风险案件的所述待预测特征送入可解释性模型进行分析,得到所述风险案件的建议检查点。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至权利要求7中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至权利要求7中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311550781.7A CN117273963A (zh) | 2023-11-21 | 2023-11-21 | 基于车险场景的风险识别方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311550781.7A CN117273963A (zh) | 2023-11-21 | 2023-11-21 | 基于车险场景的风险识别方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117273963A true CN117273963A (zh) | 2023-12-22 |
Family
ID=89209097
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311550781.7A Pending CN117273963A (zh) | 2023-11-21 | 2023-11-21 | 基于车险场景的风险识别方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117273963A (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109191312A (zh) * | 2018-08-07 | 2019-01-11 | 阳光财产保险股份有限公司 | 一种理赔反欺诈风控方法及装置 |
CN109523117A (zh) * | 2018-10-11 | 2019-03-26 | 平安科技(深圳)有限公司 | 风险预测方法、装置、计算机设备和存储介质 |
CN109919783A (zh) * | 2019-01-31 | 2019-06-21 | 德联易控科技(北京)有限公司 | 车险理赔案件的风险识别方法、装置、设备及存储介质 |
CN111242315A (zh) * | 2020-01-08 | 2020-06-05 | 中保车服科技服务股份有限公司 | 车险人伤反欺诈方法、装置、计算机设备及存储介质 |
CN112561713A (zh) * | 2020-12-15 | 2021-03-26 | 中国人寿保险股份有限公司 | 一种保险行业理赔反欺诈识别方法及装置 |
CN113643141A (zh) * | 2021-08-30 | 2021-11-12 | 平安医疗健康管理股份有限公司 | 解释性结论报告生成方法、装置、设备及存储介质 |
CN114140025A (zh) * | 2021-12-13 | 2022-03-04 | 之江实验室 | 面向多模态数据的车险欺诈行为预测系统、方法和装置 |
CN114187125A (zh) * | 2021-12-17 | 2022-03-15 | 中国平安财产保险股份有限公司 | 理赔案件分流方法、装置、设备及存储介质 |
CN115936895A (zh) * | 2022-11-17 | 2023-04-07 | 中国平安财产保险股份有限公司 | 基于人工智能的风险评估方法、装置、设备及存储介质 |
CN116416073A (zh) * | 2023-04-13 | 2023-07-11 | 北京宏瓴科技发展有限公司 | 风险控制方法、系统、装置及存储介质 |
CN116562894A (zh) * | 2023-05-05 | 2023-08-08 | 平安科技(深圳)有限公司 | 车险理赔欺诈风险识别方法、装置、电子设备及存储介质 |
-
2023
- 2023-11-21 CN CN202311550781.7A patent/CN117273963A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109191312A (zh) * | 2018-08-07 | 2019-01-11 | 阳光财产保险股份有限公司 | 一种理赔反欺诈风控方法及装置 |
CN109523117A (zh) * | 2018-10-11 | 2019-03-26 | 平安科技(深圳)有限公司 | 风险预测方法、装置、计算机设备和存储介质 |
CN109919783A (zh) * | 2019-01-31 | 2019-06-21 | 德联易控科技(北京)有限公司 | 车险理赔案件的风险识别方法、装置、设备及存储介质 |
CN111242315A (zh) * | 2020-01-08 | 2020-06-05 | 中保车服科技服务股份有限公司 | 车险人伤反欺诈方法、装置、计算机设备及存储介质 |
CN112561713A (zh) * | 2020-12-15 | 2021-03-26 | 中国人寿保险股份有限公司 | 一种保险行业理赔反欺诈识别方法及装置 |
CN113643141A (zh) * | 2021-08-30 | 2021-11-12 | 平安医疗健康管理股份有限公司 | 解释性结论报告生成方法、装置、设备及存储介质 |
CN114140025A (zh) * | 2021-12-13 | 2022-03-04 | 之江实验室 | 面向多模态数据的车险欺诈行为预测系统、方法和装置 |
CN114187125A (zh) * | 2021-12-17 | 2022-03-15 | 中国平安财产保险股份有限公司 | 理赔案件分流方法、装置、设备及存储介质 |
CN115936895A (zh) * | 2022-11-17 | 2023-04-07 | 中国平安财产保险股份有限公司 | 基于人工智能的风险评估方法、装置、设备及存储介质 |
CN116416073A (zh) * | 2023-04-13 | 2023-07-11 | 北京宏瓴科技发展有限公司 | 风险控制方法、系统、装置及存储介质 |
CN116562894A (zh) * | 2023-05-05 | 2023-08-08 | 平安科技(深圳)有限公司 | 车险理赔欺诈风险识别方法、装置、电子设备及存储介质 |
Non-Patent Citations (3)
Title |
---|
DATAFUNTALK等: ""模型可解释性在保险理赔反欺诈中的实践"", 《INFOQ》 * |
JIAXI YANG等: ""Auto Insurance Fraud Detection with Multimodal Learning "", 《DATA INTELLIGENCE》, vol. 5, no. 2, pages 388 - 412 * |
卢冰洁等: ""机器学习模型在车险欺诈检测的研究进展"", 《计算机工程与应用》, vol. 58, no. 5, pages 34 - 49 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105574098B (zh) | 知识图谱的生成方法及装置、实体对比方法及装置 | |
CN110516910B (zh) | 基于大数据的保单核保模型训练方法和核保风险评估方法 | |
CN110781298B (zh) | 药品分类方法、装置、计算机设备及存储介质 | |
CN107770783B (zh) | 一种基站扩容改造方案设计方法及相关设备 | |
CN110995459B (zh) | 异常对象识别方法、装置、介质及电子设备 | |
CN107145516A (zh) | 一种文本聚类方法及系统 | |
CN114330713A (zh) | 卷积神经网络模型剪枝方法和装置、电子设备、存储介质 | |
CN113162787B (zh) | 电信网络中故障定位的方法、节点分类方法以及相关设备 | |
CN112328909A (zh) | 信息推荐方法、装置、计算机设备及介质 | |
CN113902010A (zh) | 分类模型的训练方法和图像分类方法、装置、设备和介质 | |
CN110909040B (zh) | 一种业务投放辅助方法、装置及电子设备 | |
CN110334720A (zh) | 业务数据的特征提取方法、装置、服务器和存储介质 | |
CN113094533B (zh) | 一种基于混合粒度匹配的图文跨模态检索方法 | |
CN114529747A (zh) | 保单检测方法、保单检测装置、电子设备及存储介质 | |
CN113807728A (zh) | 基于神经网络的绩效考核方法、装置、设备及存储介质 | |
CN111210158B (zh) | 目标地址确定方法、装置、计算机设备和存储介质 | |
CN112183303A (zh) | 变电设备图像分类方法、装置、计算机设备和介质 | |
CN115545085A (zh) | 微弱故障电流的故障类型识别方法、装置、设备和介质 | |
CN117273963A (zh) | 基于车险场景的风险识别方法和装置 | |
KR20210091591A (ko) | 원천 기술의 평가 방법을 포함하는 전자 장치 | |
CN116187675A (zh) | 任务分配方法、装置、设备及存储介质 | |
CN113656690B (zh) | 产品推荐方法、装置、电子设备及可读存储介质 | |
CN111782774A (zh) | 一种问题推荐的方法及装置 | |
CN115099934A (zh) | 一种高潜客户识别方法、电子设备和存储介质 | |
CN113204714A (zh) | 一种基于用户画像的任务推荐方法、装置、存储介质及终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |