CN113256434B

CN113256434B - 车险理赔行为识别方法、装置、设备及存储介质

Info

Publication number: CN113256434B
Application number: CN202110635315.3A
Authority: CN
Inventors: 朱磊; 徐赛奕; 张霖; 俞丽娟; 朱艳乔
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2021-06-08
Filing date: 2021-06-08
Publication date: 2021-11-23
Anticipated expiration: 2041-06-08
Also published as: WO2022257458A1; CN113256434A

Abstract

本发明涉及大数据领域，公开了一种车险理赔行为识别方法、装置、设备及存储介质。该方法包括：将历史车险理赔数据划分为正样本和负样本，近邻处理正样本得到扩充样本，下采样负样本得到子样本；将子样本分别与正样本和扩充样本组合，得到第一、第二数据集并输入行为识别模型进行识别，得到第一、第二行为识别结果，以此计算行为识别模型的误分率和第一、第二识别结果的相对熵损失；根据误分率和相对熵损失对行为识别模型进行更新，直到行为识别模型收敛时停止；最后将待识别车险理赔数据输入行为识别模型，识别待识别车险理赔数据对应的行为类别。本发明解决了车险反欺诈的数据集存储正负样本不平衡的情况，从而提升车险赔付异常识别的准确度。

Description

车险理赔行为识别方法、装置、设备及存储介质

技术领域

本发明涉及大数据领域，尤其涉及一种车险理赔行为识别方法、装置、设备及存储介质。

背景技术

车险是指对机动车辆由于自然灾害或意外事故所造成的人身伤亡或财产损失负赔偿责任的一种商业保险，汽车保险是伴随着汽车的出现和普及而产生和发展的。随着社会的发展，人民的生活质量提高，买车的人越来越多，但是有一部分违法分子通过办理车险，伪造事故现场，骗取保险公司的理赔金，诈骗的手段越来越多，骗保事件频发，尤其是针对车险这个领域，骗保的手段层出不穷，花样繁多，让车险公司随时惨重，骗保人员多以团伙作案，联合汽车维修公司甚至买通定损人员进行骗保。

现有车险反欺诈的数据集中，由于车险欺诈的行为相对于正常赔付行为仍为少数，即在采用数据集进行机器学习以鉴定车险赔付是否异常时，欺诈行为的案例和正常赔付行为的案例不平衡，导致正负样本的数量不平衡，在这种情况下，如果使用一般的机器学习的建模方法，得到的效果会非常差，模型会迎合数据的特点，倾向于把结果判断为样本数多的一类。即现有车险反欺诈的数据集存储正负样本不平衡的情况，导致车险赔付异常识别的模型训练准确度低。

发明内容

本发明的主要目的在于解决现有车险反欺诈的数据集存储正负样本不平衡的情况，导致车险赔付异常识别的模型训练准确度低的问题。

本发明第一方面提供了一种车险理赔行为识别方法，包括：获取历史车险理赔数据，并将所述历史车险理赔数据划分为正样本和负样本；对所述正样本进行近邻传播处理，得到多个扩充样本，以及对所述负样本进行下采样处理，得到多个子样本；将每个所述子样本分别与所述正样本和所述扩充样本进行组合，得到第一数据集和第二数据集；将所述第一数据集和所述第二数据集分别输入至预置的行为识别模型中进行行为类型的识别，得到与所述第一数据集对应的第一行为识别结果和与所述第二数据集对应的第二行为识别结果；根据所述第一行为识别结果和所述第一数据集对应的行为类型，计算所述行为识别模型对所述第一数据集的误分率，以及计算所述第一行为识别结果和所述第二行为识别结果之间的相对熵损失；根据所述误分率和所述相对熵损失对所述行为识别模型进行更新，直到所述行为识别模型收敛时停止；获取待识别车险理赔数据，并将所述待识别车险理赔数据输入所述行为识别模型，识别所述待识别车险理赔数据对应的行为类别。

可选的，在本发明第一方面的第一种实现方式中，所述对所述正样本进行近邻传播处理，得到多个扩充样本包括：依次计算每两个正样本之间的欧式距离，并根据所述欧式距离，确定每个正样本的近邻样本；随机筛选预置数量的近邻样本进行线性插值处理，并根据处理的结果构造扩充样本。

可选的，在本发明第一方面的第二种实现方式中，所述将所述第一数据集和所述第二数据集分别输入至预置的行为识别模型中进行行为类型的识别，得到与所述第一数据集对应的第一行为识别结果和与所述第二数据集对应的第二行为识别结果包括：将数据集分别输入至预置的行为识别模型中，其中，所述行为识别模型包括输入层和决策层，所述数据集包括所述第一数据集和所述第二数据集；通过所述输入层对所述数据集进行随机采样处理，得到多个特征子集；将各所述特征子集输入所述决策层中不同的学习器，并通过所述学习器对各所述特征子集进行识别，输出各所述学习器对对应特征子集的识别结果；根据各所述学习器输出的识别结果，确定所述行为识别模型对所述数据集的识别结果，其中，所述行为识别模型对所述数据集的识别结果包括第一行为识别结果和第二行为识别结果。

可选的，在本发明第一方面的第三种实现方式中，所述根据所述第一行为识别结果和所述第一数据集对应的行为类型，计算所述行为识别模型对所述第一数据集的误分率包括：对所述第一行为识别结果中行为类型进行统计，得到所述第一数据集中行为类型的第一分布概率；根据所述第一分布概率和所述第一数据集对应的行为类型，确定所述行为识别模型对所述第一数据集的误分样本数量；计算所述误分样本数量和所述第一数据集中总样本数量之间的比率，并将所述比率作为所述行为识别模型对所述第一数据集的误分率。

可选的，在本发明第一方面的第四种实现方式中，所述通过所述学习器对各所述特征子集进行识别，输出各所述学习器对对应特征子集的识别结果包括：通过当前学习器从所述特征子集中选取一个特征样本构建样本节点，并根据预设的特征选择参数，从选取的特征样本中选取m个特征属性；通过所述学习器从选取的m个特征属性中随机筛选出一个特征属性构建所述样本节点下的子节点；通过所述学习器重新从选取的特征样本中选取m个特征属性，并构建所述子节点下的下级子节点，直到所述子节点的数量为m时停止，得到对应的决策树；通过下一个学习器重新从所述特征子集中筛选一个未被选取的特征样本构建决策树，直到得到所述特征子集中各特征样本的决策树时停止；采用各所述决策树对所述特征子集中对应特征样本的行为类型进行识别，得到所述特征子集的识别结果。

可选的，在本发明第一方面的第五种实现方式中，所述根据所述误分率和所述相对熵损失对所述行为识别模型进行更新，直到所述行为识别模型收敛时停止包括：计算所述误分率和所述相对熵损失之间的交叉熵损失，并判断所述交叉熵损失和所述误分率是否满足预置损失条件；若不满足，则根据交叉熵损失和所述误分率，调整所述行为识别模型中的特征选择参数；根据调整后的特征选择参数，对所述行为识别模型进行更新，直到所述行为识别模型收敛时停止。

本发明第二方面提供了一种车险理赔行为识别装置，包括：扩充模块，用于获取历史车险理赔数据，并将所述历史车险理赔数据划分为正样本和负样本；对所述正样本进行近邻传播处理，得到多个扩充样本，以及对所述负样本进行下采样处理，得到多个子样本；组合模块，用于将每个所述子样本分别与所述正样本和所述扩充样本进行组合，得到第一数据集和第二数据集；训练模块，用于将所述第一数据集和所述第二数据集分别输入至预置的行为识别模型中进行行为类型的识别，得到与所述第一数据集对应的第一行为识别结果和与所述第二数据集对应的第二行为识别结果；更新模块，用于根据所述第一行为识别结果和所述第一数据集对应的行为类型，计算所述行为识别模型对所述第一数据集的误分率，以及计算所述第一行为识别结果和所述第二行为识别结果之间的相对熵损失；根据所述误分率和所述相对熵损失对所述行为识别模型进行更新，直到所述行为识别模型收敛时停止；识别模块，用于获取待识别车险理赔数据，并将所述待识别车险理赔数据输入所述行为识别模型，识别所述待识别车险理赔数据对应的行为类别。

可选的，在本发明第二方面的第一种实现方式中，所述扩充模块包括：距离计算单元，用于依次计算每两个正样本之间的欧式距离，并根据所述欧式距离，确定每个正样本的近邻样本；插值处理单元，用于随机筛选预置数量的近邻样本进行线性插值处理，并根据处理的结果构造扩充样本。

可选的，在本发明第二方面的第二种实现方式中，所述训练模块包括：输入单元，用于将数据集分别输入至预置的行为识别模型中，其中，所述行为识别模型包括输入层和决策层，所述数据集包括所述第一数据集和所述第二数据集；训练单元，用于通过所述输入层对所述数据集进行随机采样处理，得到多个特征子集；将各所述特征子集输入所述决策层中不同的学习器，并通过所述学习器对各所述特征子集进行识别，输出各所述学习器对对应特征子集的识别结果；输出单元，用于根据各所述学习器输出的识别结果，确定所述行为识别模型对所述数据集的识别结果，其中，所述行为识别模型对所述数据集的识别结果包括第一行为识别结果和第二行为识别结果。

可选的，在本发明第二方面的第三种实现方式中，所述更新模块包括：统计单元，用于对所述第一行为识别结果中行为类型进行统计，得到所述第一数据集中行为类型的第一分布概率；比率计算单元，用于根据所述第一分布概率和所述第一数据集对应的行为类型，确定所述行为识别模型对所述第一数据集的误分样本数量；计算所述误分样本数量和所述第一数据集中总样本数量之间的比率，并将所述比率作为所述行为识别模型对所述第一数据集的误分率。

可选的，在本发明第二方面的第四种实现方式中，所述训练单元还用于：通过当前学习器从所述特征子集中选取一个特征样本构建样本节点，并根据预设的特征选择参数，从选取的特征样本中选取m个特征属性；通过所述学习器从选取的m个特征属性中随机筛选出一个特征属性构建所述样本节点下的子节点；通过所述学习器重新从选取的特征样本中选取m个特征属性，并构建所述子节点下的下级子节点，直到所述子节点的数量为m时停止，得到对应的决策树；通过下一个学习器重新从所述特征子集中筛选一个未被选取的特征样本构建决策树，直到得到所述特征子集中各特征样本的决策树时停止；采用各所述决策树对所述特征子集中对应特征样本的行为类型进行识别，得到所述特征子集的识别结果。

可选的，在本发明第二方面的第五种实现方式中，所述更新模块还包括：损失计算单元，用于计算所述误分率和所述相对熵损失之间的交叉熵损失，并判断所述交叉熵损失和所述误分率是否满足预置损失条件；调整单元，用于若不满足，则根据交叉熵损失和所述误分率，调整所述行为识别模型中的特征选择参数；确定单元，用于根据调整后的特征选择参数，对所述行为识别模型进行更新，直到所述行为识别模型收敛时停止。

本发明第三方面提供了一种车险理赔行为识别设备，包括：存储器和至少一个处理器，所述存储器中存储有指令；所述至少一个处理器调用所述存储器中的所述指令，以使得所述车险理赔行为识别设备执行上述的车险理赔行为识别方法。

本发明的第四方面提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述的车险理赔行为识别方法。

本发明提供的技术方案中，通过对数量较少的正样本进行扩充，以及对数量较多的负样本进行下采样，解决正负样本不平衡的问题；然后通过将子样本分别与扩充样本和正样本进行组合，得到第一、第二数据集，并分别输入两个相同的行为识别模型进行训练，对应得到第一、第二分布概率；接着对输出结果进行处理，通过误分率衡量第一数据集的准确度，通过相对熵损失衡量第一数据集和第二数据集的差别，当准确度和两个数据集的差别均满足条件时，即可得到行为识别模型，充分削弱了样本不平衡带来的识别偏差；最后通过该行为识别模型识别待识别车险理赔的行为类别，得到的识别结果更准确。

附图说明

图1为本发明实施例中车险理赔行为识别方法的第一个实施例示意图；

图2为本发明实施例中车险理赔行为识别方法的第二个实施例示意图；

图3为本发明实施例中车险理赔行为识别方法的第三个实施例示意图；

图4为本发明实施例中车险理赔行为识别装置的一个实施例示意图；

图5为本发明实施例中车险理赔行为识别装置的另一个实施例示意图；

图6为本发明实施例中车险理赔行为识别设备的一个实施例示意图。

具体实施方式

本发明实施例提供了一种车险理赔行为识别方法、装置、设备及存储介质，将历史车险理赔数据划分为正样本和负样本，近邻处理正样本得到扩充样本，下采样负样本得到子样本；将子样本分别与正样本和扩充样本组合，得到第一、第二数据集并输入行为识别模型进行识别，得到第一、第二行为识别结果，以此计算行为识别模型的误分率和第一、第二分布概率的相对熵损失；根据误分率和相对熵损失对行为识别模型进行更新，直到行为识别模型收敛时停止；最后将待识别车险理赔数据输入行为识别模型，识别待识别车险理赔数据对应的行为类别。本发明解决了车险反欺诈的数据集存储正负样本不平衡的情况，从而提升车险赔付异常识别的准确度。

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等（如果存在）是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外，术语“包括”或“具有”及其任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

为便于理解，下面对本发明实施例的具体流程进行描述，请参阅图1，本发明实施例中车险理赔行为识别方法的第一个实施例包括：

101、获取历史车险理赔数据，并将历史车险理赔数据划分为正样本和负样本，对正样本进行近邻传播处理，得到多个扩充样本，以及对负样本进行下采样处理，得到多个子样本；

可以理解的是，本发明的执行主体可以为车险理赔行为识别装置，还可以是终端或者服务器，具体此处不做限定。本发明实施例以服务器为执行主体为例进行说明。

本实施例中，历史车险理赔指的是在过往企业对车险理赔的记录，包括正常的车险理赔记录，异常（比如骗保行为）的车险理赔记录，具体可以包括历史索赔记录、出险现场记录、维修记录、保单记录、被投保人信息，以及正常或异常车险理赔的标记等历史车险理赔信息。

其中，对于上述的历史车险理赔信息，先描述成一个个底层因子，以词汇进行描述。然后对该些底层因子进行加工，比如 LBS（Location Based Services，基于位置的服务）因子加工、WIFI因子扩充、其他欺诈关联相关因子加工。接着进一步对加工后的底层因子进行特征清洗，筛选符合数据饱和度要求和模型相关性要求的底层因子。最后通过特征工程对筛选出的底层因子进行编码处理，得到数值化的底层因子，即为第一数据集的最终表达形式。

进一步的，LBS因子加工指的是基于客户经纬度和POI（Point of Interest，感兴趣点）加工客户最近一段时间的生活轨迹；WIFI因子扩充指的是根据用户的WIFI链接信息，以及历史黑名单记录加工当前客户与骗保黑名单之间的相关性；其他欺诈关联相关因子加工可以包括出险地与维修厂之间的欧式距离，出险驾驶人与被保人是否同一人等。且特征工程可以通过数据特征归一化、数据分箱、离散特征数值化的方法对底层因子进行编码处理。

本实施例中，在历史车险理赔数据中，将正常的车险理赔记录的历史车险理赔数据作为负样本，将异常的车险理赔记录的历史车险理赔数据作为正样本，其中，正样本的数量相对于负样本的数量较少，直接进行模型训练，结果容易倾向于正常，故此处对正样本进行扩充，对负样本进行下采样，一方面增加正样本的数量，另一方面减少负样本的数量，使得两者的比例减少，降低模型识别的训练数据数量导致的倾向性结果影响。

102、将每个子样本分别与正样本和扩充样本进行组合，得到第一数据集和第二数据集；

本实施例中，车险理赔的行为识别模型训练由两个相同的训练模型堆叠组成，采用第一个模型训练第一数据集，用于预测各个样本中车险理赔的行为类型；采用第二个模型训练第二数据集，用于第一个模型的预测结果进行比较，对第一个模型进行迭代。

其中，在对正样本进行扩充时，可以通过K最近邻(K-Nearest Neighbor，KNN)分类算法计算每个正样本的K近邻，筛选可以用于合成新样本的正样本，比如接近分类边界的正样本，筛选的数量可以根据正样本和负样本的比例进行设置，然后与原正样本进行新的正样本的构建。

103、将第一数据集和第二数据集分别输入至预置的行为识别模型中进行行为类型的识别，得到与第一数据集对应的第一行为识别结果和与第二数据集对应的第二行为识别结果；

本实施例中，分别采用两个相同的行为识别模型分别对第一数据集和第二数据集进行训练，分别识别出第一数据集中每个样本的行为类型的识别分布概率，以及第二数据集中每个样本的行为类型的识别分布概率，然后分别对两个数据集对应的识别分布概率进行线性拟合，即可得到第一分布概率和第二分布概率。

具体的，行为识别模型可以采用随机森林（Random Forest）算法进行训练，第一数据集或者第二数据集中的每一个样本通过一个学习器进行训练，得到多棵决策树，即一个样本对应一颗决策树，决策树中的节点对应样本的特征属性，根据决策树，计算出每个样本中每个特征属性对应的行为类型的识别概率，并对各特征属性对应的识别概率进行拟合，即可得到每个样本的行为类型的识别分布概率。

104、根据第一行为识别结果和第一数据集对应的行为类型，计算行为识别模型对第一数据集的误分率，以及计算第一行为识别结果和第二行为识别结果之间的相对熵损失，并根据误分率和相对熵损失对行为识别模型进行更新，直到行为识别模型收敛时停止；

本实施例中，通过第一分布概率计算第一数据集中各样本的误分率，此处误分率指的是同一个样本在不同的学习器中预测正确的行为类型数量与总预测结果数量的比率。其中，将样本中相同预测结果最多的行为类型作为预测正确的行为类型，并将其他的行为类型作为预测错误的行为类型。

具体的，此处样本对应车险赔付的行为类型可以仅包括正常和异常，此处误分率的计算方式为：异常的特征属性数量/总特征属性数量。

105、获取待识别车险理赔数据，并将待识别车险理赔数据输入行为识别模型，识别待识别车险理赔数据对应的行为类别。

本实施例中，在训练完行为识别模型后，直接将待识别车险理赔的第二数据集输入该行为识别模型后，即可直接输出该待识别车险理赔的行为类型，行为类型可以仅包括正常或者异常。

本发明实施例中，通过对数量较少的正样本进行扩充，以及对数量较多的负样本进行下采样，解决正负样本不平衡的问题；然后通过将子样本分别与扩充样本和正样本进行组合，得到第一、第二数据集，并分别输入两个相同的行为识别模型进行训练，对应得到第一、第二分布概率；接着对输出结果进行处理，通过误分率衡量第一数据集的准确度，通过相对熵损失衡量第一数据集和第二数据集的差别，当准确度和两个数据集的差别均满足条件时，即可得到行为识别模型，充分削弱了样本不平衡带来的识别偏差；最后通过该行为识别模型识别待识别车险理赔的行为类别，得到的识别结果更准确。

请参阅图2，本发明实施例中车险理赔行为识别方法的第二个实施例包括：

201、获取历史车险理赔数据，将历史车险理赔数据划分为正样本和负样本，并对负样本进行下采样处理，得到多个子样本；

202、依次计算每两个正样本之间的欧式距离，并根据欧式距离，确定每个正样本的近邻样本；

203、随机筛选预置数量的近邻样本进行线性插值处理，并根据处理的结果构造扩充样本；

本实施例中，在对正样本进行扩充时，可以通过K最近邻(K-Nearest Neighbor，KNN)分类算法计算每个正样本的K近邻，筛选可以用于合成新样本的正样本，比如接近分类边界的正样本，筛选的数量可以根据正样本和负样本的比例进行设置，然后与原正样本进行新的正样本的构建。

具体的，在对负样本进行下采样时，可以对负样本按照预先设置的采样倍数进行放回式的随机采样，将负样本下采样至与正样本数量比例较为平衡的状态，其中，采样倍数可以根据正样本和负样本的比例进行设置。

204、将每个子样本分别与正样本和扩充样本进行组合，得到第一数据集和第二数据集；

205、将数据集分别输入至预置的行为识别模型中，其中，行为识别模型包括输入层和决策层，数据集包括第一数据集和第二数据集；

206、通过输入层对数据集进行随机采样处理，得到多个特征子集；

207、将各特征子集输入决策层中不同的学习器，并通过学习器对各特征子集进行识别，输出各学习器对对应特征子集的识别结果；

本实施例中，通过数据集保持正样本和负样本的数据平衡，然后再通过对数据集进一步的数据分割，得到多个特征子集，此时每个特征子集中正样本和负样本的数据跟数据集中的正样本和负样本一样可以保持数据的相对平衡。

另外，每一个学习器输出每一个样本中各特征属性的行为类型的识别概率，并进行拟合得到识别分布概率，再进一步拟合数据集的行为类型识别的分布概率。

进一步的，通过学习器对特征子集的训练过程具体包括以下步骤：

（1）通过当前学习器从特征子集中选取一个子样本、扩充样本或正样本构建样本节点，并根据预设的特征选择参数，从选取的子样本、扩充样本或正样本中选取m个特征属性；

（2）通过学习器从选取的多个样本属性中筛选出一个特征属性构建样本节点下的特征节点；

（3）通过学习器重新从选取的子样本、扩充样本或正样本中选取m个特征属性，并构建特征节点的下级特征节点，直到特征节点的数量为m时停止构建特征节点，得到对应的决策树；

（4）通过下一个学习器重新从特征子集中筛选一个未被选取的子样本、扩充样本或正样本构建样本节点构建决策树，直到构建得到特征子集中各子样本、扩充样本和/或正样本的决策树时停止；

（5）根据特征子集对应的多个决策树，通过学习器计算各学习器对应的行为类型的识别分布概率并输出。

本实施例中，在采用随机森林算法进行模型训练时，假设特征子集中包括有A个样本（子样本、扩充样本和正样本的总和），则有放回的从A各样本中随机选择1个样本，作为决策树根节点处的样本，即构建样本节点；若每个样本中包含有K个属性时，在决策树的每个样本节点需要分支延伸时，随机从K个属性中选取出k个特征属性，其中，k ≤K，从k个特征属性中采用预设的策略比如信息增益，选择1个特征属性作为该节点的分支属性，即构建特征节点；循环上述步骤，直到特征节点的数量为m时停止延伸；多个学习器得到的决策树组合即可构成整个随机森林。

208、根据各学习器输出的识别结果，确定行为识别模型对数据集的识别结果，其中，行为识别模型对数据集的识别结果包括第一行为识别结果和第二行为识别结果；

209、根据第一行为识别结果和第一数据集对应的行为类型，计算行为识别模型对第一数据集的误分率，以及计算第一行为识别结果和第二行为识别结果之间的相对熵损失，并根据误分率和相对熵损失对行为识别模型进行更新，直到行为识别模型收敛时停止；

210、获取待识别车险理赔数据，并将待识别车险理赔数据输入行为识别模型，识别待识别车险理赔数据对应的行为类别。

本发明实施例中，通过采样近邻样本的方法和线性插值处理，对数量较少的正样本进行扩充，得到扩充样本，以及对数量较多的负样本进行下采样，解决正负样本不平衡的问题，增加模型训练的准确度；并通过误分率和损失值衡量行为识别模型的输出准确度，确保样本不平衡的情况下，模型可以充分考虑到正样本的特征性，使得输出结果更准确。

请参阅图3，本发明实施例中车险理赔行为识别方法的第三个实施例包括：

301、获取历史车险理赔数据，将历史车险理赔数据划分为正样本和负样本，并对正样本进行近邻传播处理，得到多个扩充样本，以及对负样本进行下采样处理，得到多个子样本；

302、将每个子样本分别与正样本和扩充样本进行组合，得到第一数据集和第二数据集；

303、将第一数据集和第二数据集分别输入至预置的行为识别模型中进行行为类型的识别，得到与第一数据集对应的第一行为识别结果和与第二数据集对应的第二行为识别结果；

304、对第一行为识别结果中行为类型进行统计，得到第一数据集中行为类型的第一分布概率，并根据第一分布概率和第一数据集对应的行为类型，确定行为识别模型对第一数据集的误分样本数量；

305、计算误分样本数量和第一数据集中总样本数量之间的比率，并将比率作为行为识别模型对第一数据集的误分率，以及计算第一行为识别结果和第二行为识别结果之间的相对熵损失；

本实施例中，若车险赔付的行为类型包括正常和异常，样本1的包含A个特征属性，其中a₁为预测正常的特征属性数量，a₂为预测异常的特征属性数量，且a₁＞a₂，则该样本的的分类结果为正常，误分率则为：a₂/A。

306、计算误分率和相对熵损失之间的交叉熵损失，并判断交叉熵损失和误分率是否满足预置损失条件；

307、若不满足，则根据交叉熵损失和误分率，调整行为识别模型中的特征选择参数；

308、根据调整后的特征选择参数，对行为识别模型进行更新，直到行为识别模型收敛时停止；

本实施例中，第一分布概率和第二分布概率的相对熵损失用于衡量两个模型的预测结果的差异化程度，即在采用正样本和正样本扩充后的扩充样本进行模型训练时，两者的预测结果差异化程度，以用于对模型进行迭代更新。具体的，第一分布概率和第二分布概率的相对熵损失计算公式如下所示：

；

其中，R（P‖Q）为相对熵损失，λ为正样本扩充的平衡系数，p（x_i）为第一分布概率中的各概率值，q（x_i）为第二分布概率中的各概率值。

通过误分率衡量第一数据集的准确度，通过交叉熵损失衡量两个模型的差别，当准确度和两个模型的差别均满足条件时，即可判定该行为识别模型收敛，具体可以通过设置误分率阈值和交叉熵损失阈值来判定误分率和交叉熵损失是否均满足损失条件，其中，可先判别误分率是否满足损失条件，如果不满足，则第一数据集的准确度不足，无需进行后续的交叉熵损失判别。

309、获取待识别车险理赔数据，并将待识别车险理赔数据输入行为识别模型，识别待识别车险理赔数据对应的行为类别。

本发明实施例中，通过训练模型中的多个学习器学习数据集中的决策树，以此识别车险理赔行为的类别概率，减少样本不平衡带来的结果偏向，纠正模型输出的偏置问题。

上面对本发明实施例中车险理赔行为识别方法进行了描述，下面对本发明实施例中车险理赔行为识别装置进行描述，请参阅图4，本发明实施例中车险理赔行为识别装置一个实施例包括：

扩充模块401，用于获取历史车险理赔数据，并将所述历史车险理赔数据划分为正样本和负样本；对所述正样本进行近邻传播处理，得到多个扩充样本，以及对所述负样本进行下采样处理，得到多个子样本；

组合模块402，用于将每个所述子样本分别与所述正样本和所述扩充样本进行组合，得到第一数据集和第二数据集；

训练模块403，用于将所述第一数据集和所述第二数据集分别输入至预置的行为识别模型中进行行为类型的识别，得到与所述第一数据集对应的第一行为识别结果和与所述第二数据集对应的第二行为识别结果；

更新模块404，用于根据所述第一行为识别结果和所述第一数据集对应的行为类型，计算所述行为识别模型对所述第一数据集的误分率，以及计算所述第一行为识别结果和所述第二行为识别结果之间的相对熵损失；根据所述误分率和所述相对熵损失对所述行为识别模型进行更新，直到所述行为识别模型收敛时停止；

识别模块405，用于获取待识别车险理赔数据，并将所述待识别车险理赔数据输入所述行为识别模型，识别所述待识别车险理赔数据对应的行为类别。

请参阅图5，本发明实施例中车险理赔行为识别装置的另一个实施例包括：

具体的，所述扩充模块401包括：

距离计算单元4011，用于依次计算每两个正样本之间的欧式距离，并根据所述欧式距离，确定每个正样本的近邻样本；

插值处理单元4012，用于随机筛选预置数量的近邻样本进行线性插值处理，并根据处理的结果构造扩充样本。

具体的，所述训练模块403包括：

输入单元4031，用于将数据集分别输入至预置的行为识别模型中，其中，所述行为识别模型包括输入层和决策层，所述数据集包括所述第一数据集和所述第二数据集；

训练单元4032，用于通过所述输入层对所述数据集进行随机采样处理，得到多个特征子集；将各所述特征子集输入所述决策层中不同的学习器，并通过所述学习器对各所述特征子集进行识别，输出各所述学习器对对应特征子集的识别结果；

输出单元4033，用于根据各所述学习器输出的识别结果，确定所述行为识别模型对所述数据集的识别结果，其中，所述行为识别模型对所述数据集的识别结果包括第一行为识别结果和第二行为识别结果。

具体的，所述更新模块404包括：

统计单元4041，用于对所述第一行为识别结果中行为类型进行统计，得到所述第一数据集中行为类型的第一分布概率；

比率计算单元4042，用于根据所述第一分布概率和所述第一数据集对应的行为类型，确定所述行为识别模型对所述第一数据集的误分样本数量；计算所述误分样本数量和所述第一数据集中总样本数量之间的比率，并将所述比率作为所述行为识别模型对所述第一数据集的误分率。

具体的，所述训练单元还用于：

通过当前学习器从所述特征子集中选取一个特征样本构建样本节点，并根据预设的特征选择参数，从选取的特征样本中选取m个特征属性；

通过所述学习器从选取的m个特征属性中随机筛选出一个特征属性构建所述样本节点下的子节点；

通过所述学习器重新从选取的特征样本中选取m个特征属性，并构建所述子节点下的下级子节点，直到所述子节点的数量为m时停止，得到对应的决策树；

通过下一个学习器重新从所述特征子集中筛选一个未被选取的特征样本构建决策树，直到得到所述特征子集中各特征样本的决策树时停止；

采用各所述决策树对所述特征子集中对应特征样本的行为类型进行识别，得到所述特征子集的识别结果。

具体的，所述更新模块404还包括：

损失计算单元4043，用于计算所述误分率和所述相对熵损失之间的交叉熵损失，并判断所述交叉熵损失和所述误分率是否满足预置损失条件；

调整单元4044，用于若不满足，则根据交叉熵损失和所述误分率，调整所述行为识别模型中的特征选择参数；

确定单元4045，用于根据调整后的特征选择参数，对所述行为识别模型进行更新，直到所述行为识别模型收敛时停止。

本发明实施例中，通过采样近邻样本的方法和线性插值处理，对数量较少的正样本进行扩充，得到扩充样本，以及对数量较多的负样本进行下采样，解决正负样本不平衡的问题，增加模型训练的准确度；并通过误分率和损失值衡量行为识别模型的输出准确度，确保样本不平衡的情况下，模型可以充分考虑到正样本的特征性，使得输出结果更准确；另外，还通过训练模型中的多个学习器学习数据集中的决策树，以此识别车险理赔行为的类别概率，减少样本不平衡带来的结果偏向，纠正模型输出的偏置问题。

上面图4和图5从模块化功能实体的角度对本发明实施例中的车险理赔行为识别装置进行详细描述，下面从硬件处理的角度对本发明实施例中车险理赔行为识别设备进行详细描述。

图6是本发明实施例提供的一种车险理赔行为识别设备的结构示意图，该车险理赔行为识别设备600可因配置或性能不同而产生比较大的差异，可以包括一个或一个以上处理器（central processing units，CPU）610（例如，一个或一个以上处理器）和存储器620，一个或一个以上存储应用程序633或数据632的存储介质630（例如一个或一个以上海量存储设备）。其中，存储器620和存储介质630可以是短暂存储或持久存储。存储在存储介质630的程序可以包括一个或一个以上模块（图示没标出），每个模块可以包括对车险理赔行为识别设备600中的一系列指令操作。更进一步地，处理器610可以设置为与存储介质630通信，在车险理赔行为识别设备600上执行存储介质630中的一系列指令操作。

车险理赔行为识别设备600还可以包括一个或一个以上电源640，一个或一个以上有线或无线网络接口650，一个或一个以上输入输出接口660，和/或，一个或一个以上操作系统631，例如Windows Serve，Mac OS X，Unix，Linux，FreeBSD等等。本领域技术人员可以理解，图6示出的车险理赔行为识别设备结构并不构成对车险理赔行为识别设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

本发明还提供一种车险理赔行为识别设备，所述计算机设备包括存储器和处理器，存储器中存储有计算机可读指令，计算机可读指令被处理器执行时，使得处理器执行上述各实施例中的所述车险理赔行为识别方法的步骤。

本发明还提供一种计算机可读存储介质，该计算机可读存储介质可以为非易失性计算机可读存储介质，该计算机可读存储介质也可以为易失性计算机可读存储介质，所述计算机可读存储介质中存储有指令，当所述指令在计算机上运行时，使得计算机执行所述车险理赔行为识别方法的步骤。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统，装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器（read-only memory，ROM）、随机存取存储器（random access memory，RAM）、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种车险理赔行为识别方法，其特征在于，所述车险理赔行为识别方法包括：

获取历史车险理赔数据，并将所述历史车险理赔数据划分为正样本和负样本；

对所述正样本进行近邻传播处理，得到多个扩充样本，以及对所述负样本进行下采样处理，得到多个子样本，其中，在对所述负样本进行下采样时，根据正样本和负样本的比例设置负样本的采样倍数，并按照采样倍数进行放回式的随机采样；

将每个所述子样本分别与所述正样本和所述扩充样本进行组合，得到第一数据集和第二数据集；

将所述第一数据集和所述第二数据集分别输入至预置的行为识别模型中进行行为类型的识别，得到与所述第一数据集对应的第一行为识别结果和与所述第二数据集对应的第二行为识别结果；

根据所述第一行为识别结果和所述第一数据集对应的行为类型，计算所述行为识别模型对所述第一数据集的误分率，以及计算所述第一行为识别结果和所述第二行为识别结果之间的相对熵损失；

根据所述误分率和所述相对熵损失对所述行为识别模型进行更新，直到所述行为识别模型收敛时停止；

获取待识别车险理赔数据，并将所述待识别车险理赔数据输入所述行为识别模型，识别所述待识别车险理赔数据对应的行为类别；

其中，所述将所述第一数据集和所述第二数据集分别输入至预置的行为识别模型中进行行为类型的识别，得到与所述第一数据集对应的第一行为识别结果和与所述第二数据集对应的第二行为识别结果包括：

将数据集分别输入至预置的行为识别模型中，其中，所述行为识别模型包括输入层和决策层，所述数据集包括所述第一数据集和所述第二数据集；

通过所述输入层对所述数据集进行随机采样处理，得到多个特征子集；

将各所述特征子集输入所述决策层中不同的学习器，并通过所述学习器对各所述特征子集进行识别，输出各所述学习器对对应特征子集的识别结果；

根据各所述学习器输出的识别结果，确定所述行为识别模型对所述数据集的识别结果，其中，所述行为识别模型对所述数据集的识别结果包括第一行为识别结果和第二行为识别结果，第一数据集或者第二数据集中的每一个样本通过一个学习器进行训练，得到多棵决策树，一个样本对应一颗决策树，决策树中的节点对应样本的特征属性，根据决策树，计算出每个样本中每个特征属性对应的行为类型的识别概率，对各特征属性对应的识别概率进行拟合，即可得到每个样本的行为类型的识别分布概率并作为各所述学习器输出的识别结果。

2.根据权利要求1所述的车险理赔行为识别方法，其特征在于，所述对所述正样本进行近邻传播处理，得到多个扩充样本包括：

依次计算每两个正样本之间的欧式距离，并根据所述欧式距离，确定每个正样本的近邻样本；

随机筛选预置数量的近邻样本进行线性插值处理，并根据处理的结果构造扩充样本。

3.根据权利要求1所述的车险理赔行为识别方法，其特征在于，所述根据所述第一行为识别结果和所述第一数据集对应的行为类型，计算所述行为识别模型对所述第一数据集的误分率包括：

对所述第一行为识别结果中行为类型进行统计，得到所述第一数据集中行为类型的第一分布概率；

根据所述第一分布概率和所述第一数据集对应的行为类型，确定所述行为识别模型对所述第一数据集的误分样本数量；

计算所述误分样本数量和所述第一数据集中总样本数量之间的比率，并将所述比率作为所述行为识别模型对所述第一数据集的误分率。

4.根据权利要求1所述的车险理赔行为识别方法，其特征在于，所述通过所述学习器对各所述特征子集进行识别，输出各所述学习器对对应特征子集的识别结果包括：

5.根据权利要求1-4中任一项所述的车险理赔行为识别方法，其特征在于，所述根据所述误分率和所述相对熵损失对所述行为识别模型进行更新，直到所述行为识别模型收敛时停止包括：

计算所述误分率和所述相对熵损失之间的交叉熵损失，并判断所述交叉熵损失和所述误分率是否满足预置损失条件；

若不满足，则根据交叉熵损失和所述误分率，调整所述行为识别模型中的特征选择参数；

根据调整后的特征选择参数，对所述行为识别模型进行更新，直到所述行为识别模型收敛时停止。

6.一种车险理赔行为识别装置，其特征在于，所述车险理赔行为识别装置包括：

扩充模块，用于获取历史车险理赔数据，并将所述历史车险理赔数据划分为正样本和负样本；对所述正样本进行近邻传播处理，得到多个扩充样本，以及对所述负样本进行下采样处理，得到多个子样本，其中，在对所述负样本进行下采样时，根据正样本和负样本的比例设置负样本的采样倍数，并按照采样倍数进行放回式的随机采样；

组合模块，用于将每个所述子样本分别与所述正样本和所述扩充样本进行组合，得到第一数据集和第二数据集；

训练模块，用于将所述第一数据集和所述第二数据集分别输入至预置的行为识别模型中进行行为类型的识别，得到与所述第一数据集对应的第一行为识别结果和与所述第二数据集对应的第二行为识别结果；

更新模块，用于根据所述第一行为识别结果和所述第一数据集对应的行为类型，计算所述行为识别模型对所述第一数据集的误分率，以及计算所述第一行为识别结果和所述第二行为识别结果之间的相对熵损失；根据所述误分率和所述相对熵损失对所述行为识别模型进行更新，直到所述行为识别模型收敛时停止；

识别模块，用于获取待识别车险理赔数据，并将所述待识别车险理赔数据输入所述行为识别模型，识别所述待识别车险理赔数据对应的行为类别；

其中，所述训练模块包括：

输入单元，用于将数据集分别输入至预置的行为识别模型中，其中，所述行为识别模型包括输入层和决策层，所述数据集包括所述第一数据集和所述第二数据集；

训练单元，用于通过所述输入层对所述数据集进行随机采样处理，得到多个特征子集；将各所述特征子集输入所述决策层中不同的学习器，并通过所述学习器对各所述特征子集进行识别，输出各所述学习器对对应特征子集的识别结果；

输出单元，用于根据各所述学习器输出的识别结果，确定所述行为识别模型对所述数据集的识别结果，其中，所述行为识别模型对所述数据集的识别结果包括第一行为识别结果和第二行为识别结果，所述行为识别模型对所述数据集的识别结果包括第一行为识别结果和第二行为识别结果，第一数据集或者第二数据集中的每一个样本通过一个学习器进行训练，得到多棵决策树，一个样本对应一颗决策树，决策树中的节点对应样本的特征属性，根据决策树，计算出每个样本中每个特征属性对应的行为类型的识别概率，对各特征属性对应的识别概率进行拟合，即可得到每个样本的行为类型的识别分布概率并作为各所述学习器输出的识别结果。

7.根据权利要求6所述的车险理赔行为识别装置，其特征在于，所述扩充模块包括：

距离计算单元，用于依次计算每两个正样本之间的欧式距离，并根据所述欧式距离，确定每个正样本的近邻样本；

插值处理单元，用于随机筛选预置数量的近邻样本进行线性插值处理，并根据处理的结果构造扩充样本。

8.一种车险理赔行为识别设备，其特征在于，所述车险理赔行为识别设备包括：存储器和至少一个处理器，所述存储器中存储有指令；

所述至少一个处理器调用所述存储器中的所述指令，以使得所述车险理赔行为识别设备执行如权利要求1-5中任意一项所述的车险理赔行为识别方法。

9.一种计算机可读存储介质，所述计算机可读存储介质上存储有指令，其特征在于，所述指令被处理器执行时实现如权利要求1-5中任一项所述车险理赔行为识别方法。