WO2021004344A1

WO2021004344A1 - 基于数据分析的风险识别方法及相关设备

Info

Publication number: WO2021004344A1
Application number: PCT/CN2020/099556
Authority: WO
Inventors: 陈伟; 陈伟平; 马倩; 高瀚; 王辉
Original assignee: 平安科技（深圳）有限公司
Priority date: 2019-07-10
Filing date: 2020-06-30
Publication date: 2021-01-14
Also published as: CN110428091A; CN110428091B

Abstract

一种基于数据分析的风险识别方法及相关设备，可应用于智慧城市，如智慧交通领域，该方法包括：获取目标对象在目标场景下的风险数据（S101）；所述风险数据包括至少一个用于风险预测的标签；根据所述风险数据以及所述目标场景的风险预测模型，确定所述目标对象的风险预测结果（S102）；当所述风险预测结果指示所述目标对象存在风险时，将所述目标对象的信息添加至标记列表（S103）；采集所述目标对象在预设时间范围内的行为数据，并按照预设的行为评定规则确定所述行为数据所属的类别（S104）；生成包括所述目标对象的信息以及所述行为数据所属的类别的文件（S105）。上述方法可使风险识别过程更具有针对性，并提高风险识别的准确度。

Description

基于数据分析的风险识别方法及相关设备

本申请要求于2019年07月10日提交中国专利局、申请号为201910619081.6，发明名称为“基于数据分析的风险识别方法及相关设备”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及计算机技术领域，尤其涉及一种基于数据分析的风险识别方法及相关设备。

背景技术

目前，在风险识别过程中，为了提高风险识别速率，通常会大范围地对某一个或多个区域进行风险识别，如进行违规或犯罪等行为的预测。具体地，可以将待预测的区域划分为多个方格，根据该待预测区域的历史风险数据，如发生事故的事件的数量，采用地震领域中的随机除丛法和数理统计中的核密度估算法确定该多个方格中每个方格的风险情况。然而，发明人发现，该风险识别过程缺乏针对性，并且识别准确度较低。

技术问题

本申请实施例提供了一种基于数据分析的风险识别方法及相关设备，可以解决现有技术风险识别过程缺乏针对性，并且识别准确度较低的技术问题。

技术解决方案

第一方面，本申请实施例提供了一种基于数据分析的风险识别方法，包括：获取目标对象在目标场景下的风险数据；所述风险数据包括至少一个用于风险预测的标签；根据所述风险数据以及所述目标场景的风险预测模型，确定所述目标对象的风险预测结果；其中，所述风险预设模型根据所述目标场景下的至少一组组合标签构建，所述至少一组组合标签中每组组合标签包括多个标签；所述多个标签包括的各标签之间通过逻辑连接词连接；当所述风险预测结果指示所述目标对象存在风险时，将所述目标对象的信息添加至标记列表；采集所述目标对象在预设时间范围内的行为数据，并按照预设的行为评定规则确定所述行为数据所属的类别；生成包括所述目标对象的信息以及所述行为数据所属的类别的文件。

第二方面，本申请实施例提供了一种基于数据分析的风险识别装置，包括：获取单元，用于获取目标对象在目标场景下的风险数据；所述风险数据包括至少一个用于风险预测的标签；确定单元，用于根据所述风险数据以及所述目标场景的风险预测模型，确定所述目标对象的风险预测结果；其中，所述风险预设模型根据所述目标场景下的至少一组组合标签构建，所述至少一组组合标签中每组组合标签包括多个标签；所述多个标签包括的各标签之间通过逻辑连接词连接；添加单元，用于当所述风险预测结果指示所述目标对象存在风险时，将所述目标对象的信息添加至标记列表；处理单元，用于采集所述目标对象在预设时间范围内的行为数据，并按照预设的行为评定规则确定所述行为数据所属的类别，并生成包括所述目标对象的信息以及所述行为数据所属的类别的文件。

第三方面，本申请实施例提供了一种电子设备，包括处理器和存储器，所述处理器和所述存储器相互连接，其中，所述存储器用于存储计算机程序，所述计算机程序包括程序指令，所述处理器被配置用于调用所述程序指令，执行以下步骤：获取目标对象在目标场景下的风险数据；所述风险数据包括至少一个用于风险预测的标签；根据所述风险数据以及所述目标场景的风险预测模型，确定所述目标对象的风险预测结果；其中，所述风险预设模型根据所述目标场景下的至少一组组合标签构建，所述至少一组组合标签中每组组合标签包括多个标签；所述多个标签包括的各标签之间通过逻辑连接词连接；当所述风险预测结果指示所述目标对象存在风险时，将所述目标对象的信息添加至标记列表；采集所述目标对象在预设时间范围内的行为数据，并按照预设的行为评定规则确定所述行为数据所属的类别；生成包括所述目标对象的信息以及所述行为数据所属的类别的文件。

第四方面，本申请实施例提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行以实现以下步骤：获取目标对象在目标场景下的风险数据；所述风险数据包括至少一个用于风险预测的标签；根据所述风险数据以及所述目标场景的风险预测模型，确定所述目标对象的风险预测结果；其中，所述风险预设模型根据所述目标场景下的至少一组组合标签构建，所述至少一组组合标签中每组组合标签包括多个标签；所述多个标签包括的各标签之间通过逻辑连接词连接；当所述风险预测结果指示所述目标对象存在风险时，将所述目标对象的信息添加至标记列表；采集所述目标对象在预设时间范围内的行为数据，并按照预设的行为评定规则确定所述行为数据所属的类别；生成包括所述目标对象的信息以及所述行为数据所属的类别的文件。

有益效果

综上所述，电子设备可以获取目标对象在目标场景下的风险数据，并根据该风险数据以及该目标场景的风险预测模型，确定该目标对象的风险预测结果；电子设备可以当该风险预测结果指示该目标对象存在风险时，将该目标对象的信息添加至标记列表，并采集该目标对象在预设时间范围内的行为数据，按照预设的行为判定规则确定该行为数据所属的类别，并生成包括该目标对象的信息以及该行为数据所属的类别的文件，能够使得风险识别过程更具针对性，并提高风险识别的准确度。

附图说明

图1是本申请实施例提供的一种基于数据分析的风险识别方法的流程示意图。

图2是本申请实施例提供的另一种基于数据分析的风险识别方法的流程示意图。

图3是本申请实施例提供的一种基于数据分析的风险识别装置的结构示意图。

图4是本申请实施例提供的一种电子设备的结构示意图。

本发明的实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行描述。

请参阅图1，为本申请实施例提供的一种基于数据分析的风险识别方法的流程示意图。该方法可以应用于电子设备。电子设备可以为终端或服务器。终端可以为平板电脑、笔记本电脑、台式电脑。服务器可以为一个服务器或服务器集群。具体地，该方法可以包括以下步骤。

S101、获取目标对象在目标场景下的风险数据。

其中，该目标对象可以为任一对象，或还可以为处于该目标场景下的任一对象，或还可以为处于该目标场景下的需要风险识别的任一对象，或还可以为输入或搜索的处于该目标场景下的需要风险识别的任一对象。该对象包括但不限于人。该目标场景可以为任一场景，或还可以为需要进行风险监管的任一场景，或还可以为多个场景中事故发生频率大于或等于预设频率的场景。在一个实施例中，根据场景的不同，该对象还可以进一步细分。例如，在车祸风险场景下，该对象包括但不限于司机等对象。在反洗钱场景下，该对象包括但不限于相应机构的客户或工作人员等对象。在稽核场景下，该对象包括但不限于相应机构的客户或工作人员等对象。

其中，该风险数据包括至少一个用于风险预测的标签。例如，该标签可以为关键字。例如，车祸风险场景下的风险数据可以包括所在区域的天气、行车路况、驾驶人信息（如驾驶人车龄和/或车辆信息）等标签。

在一个实施例中，电子设备可以从目标场景对应的信息服务器，获取该目标对象在目标场景下的风险数据。例如，在车祸风险场景下，该信息服务器包括但不限于以下至少一项：交通管理服务器、气象服务器和地图服务器。电子设备可以从交通管理服务器获取驾驶人信息，从气象服务器获取所述目标对象所在区域的天气信息，从交通管理服务器或地图服务器获取行车路况信息。

在一个实施例中，电子设备可以发送风险数据获取请求至所述目标场景对应的信息服务器，并接收该信息服务器响应该风险数据获取请求返回的该目标对象在目标场景下的风险数据。

在一个实施例中，电子设备获取多个对象在目标场景下的风险数据，并从该多个对象在目标场景下的风险数据中，查询出目标对象在目标场景下的风险数据。

在一个实施例中，电子设备获取目标对象在目标场景下的风险信息集合，该风险信息集合包括至少一个用于风险预测的信息，电子设备可以对该风险信息集合中的各个信息进行标签提取，得到该目标对象在该目标场景下的风险数据。

在一个实施例中，电子设备可以从目标场景对应的信息服务器，获取该目标对象在目标场景下的风险信息集合。

S102、根据所述风险数据以及所述目标场景的风险预测模型，确定所述目标对象的风险预测结果。

其中，该风险预设模型根据该目标场景下的至少一组组合标签构建，该至少一组组合标签中每组组合标签包括多个标签；该多个标签包括的各标签之间通过逻辑连接词连接。在一个实施例中，该逻辑连接词可以为“并且”和/或“或者”。例如，该至少一组组合标签包括第一组组合标签和第二组组合标签。该第一组组合标签为(标签1且标签2且标签3)，该第二组组合标签为（标签1或标签2或标签3）。

在一个实施例中，该风险预测模型可以为该至少一组组合标签中每组组合标签和对应的风险预测结果之间的对应关系，或还可以为在将该至少一组组合标签以及该至少一组组合标签中每组组合标签对应的风险预测结果，输入到预设模型进行训练后，得到的训练后的该预设模型。其中，该风险预测结果可以为事故发生率。当该风险预测结果为事故发生率时，若事故发生率大于或等于预设值，则该风险预测结果指示该目标对象存在风险。该风险预测结果还可以为指示是否存在风险的结果或指示是否发生事故的结果，该结果包括但不限于以数字、文字、字母等形式呈现。当该风险预测结果为指示存在风险的结果或指示发生事故的结果时，该风险预测结果指示该目标对象存在风险。在一个实施例中，该风险预测结果还可以包括风险事故的类别。

在一个实施例中，电子设备根据该风险数据以及该目标场景的风险预测模型，确定该目标对象的风险预测结果，可以包括：电子设备从该每组组合标签和对应的风险预测结果之间的对应关系中，查询出该风险数据对应的风险预测结果，并将该风险数据对应的风险预测结果，确定为该目标对象的风险预测结果。本申请实施例通过查询对应关系，能够便捷地确定出该目标对象的风险预测结果。

在一个实施例中，电子设备根据该风险数据以及该目标场景的风险预测模型，确定该目标对象的风险预测结果，可以包括：电子设备将该风险数据输入到该训练后的该预设模型以进行风险预测，并通过该训练后的该预设模型输出该目标对象的风险预测结果。本申请实施例，通过模型得到目标对象的风险预测结果，能够快速准确地确定出该目标对象的风险预测结果。

S103、当所述风险预测结果指示所述目标对象存在风险时，将所述目标对象的信息添加至标记列表。

本申请实施例中，电子设备可以当该风险预测结果指示该目标对象存在风险时，将该目标对象的信息添加至标记列表。通过将该目标对象的信息添加至标记列表，可以将该目标对象列为重点监管对象，能够更好的对该目标场景下存在风险的对象进行统一管理，并有利于后续对该目标对象进行进一步跟进，掌握该目标对象的行为动向。

其中，该目标对象的信息可以包括该目标对象的标识，如该目标对象的姓名、图像（如头像）、身份证号、联系方式等用于唯一标识该目标对象的信息。在一个实施例中，该目标对象的信息还可以包括该目标对象的其他信息，如该目标对象的工作地点、居住地区等信息，本申请实施例在此不一一列举。其中，该标记列表可以用于记录该目标场景下存在风险的对象的信息。例如，该标记列表可以用于记录在车祸风险场景下存在车祸风险的用户的信息。

S104、采集所述目标对象在预设时间范围内的行为数据，并按照预设的行为评定规则确定所述行为数据所属的类别。

其中，该预设时间范围可以为任一时间范围，具体可以根据实际需求设置。例如，可以为以当前时间开始统计的过去三个月，和/或还可以为以当前时间开始统计的未来三个月。该行为数据根据场景的不同，可以存在不同。例如，在车祸风险场景下，该行为数据可以包括行车数据等数据。该行车数据包括但不限于拍摄或记录的该目标对象的行车记录，如行车违规数据。该行车违规数据包括但不限于以下至少一项：闯红灯记录、追尾记录、超速记录、闯人行横道记录。在反洗钱场景下，该行为数据可以包括交易数据等数据。可选地，该类别可以为等级，如一级、二级、三级。其中，一级指示的行为严重性低于二级指示的行为严重性，二级指示的行为严重性低于三级指示的行为严重性。再如，该类别还可以为失德、违法、入罪。

在一个实施例中，电子设备可以从信息服务器采集该目标对象在预设时间范围内的行为数据。例如，在车祸风险场景下，电子设备可以从交通管理服务器采集该目标对象的行车数据。

在一个实施例中，电子设备按照预设行为判定规则确定所述行为数据所属的类别，可以包括：电子设备将所述行为数据输入到预设的分类模型中，经由所述分类模型对所述行为数据进行分类，得到所述行为数据所属的类别。其中该，该分类模型可以是在利用搜集的行为数据训练集以及该行为数据训练集中各行为数据各自所属的类别，对指定模型进行训练后，得到的训练后的所述指定模型。采用上述方式，使得电子设备能够通过分类模型准确快速地确定行为数据所属的类别。

在一个实施例中，电子设备按照预设行为判定规则确定所述行为数据所属的类别，还可以包括：电子设备对所述行为数据进行命名实体识别以提取所述行为数据中各个实体，并对所述行为数据进行语义分析，得到各个实体间的关联关系，将所述各个实体、所述各个实体间的关联关系与不同类别下的行为判定数据进行匹配，根据匹配结果确定所述行为数据所属的类别。上述关联关系可以包括行为特征。该行为判定数据可以包括法律条文集合或法律规则集合。在一个实施例中，该行为判定数据还可以包括案例集合，或包括与该法律条文对应的案例集合，或包括与该法律规则对应的案例集合。

例如，行为数据为“司机A闯了红灯”，则对所述行为数据进行命名实体识别以提取该行为数据中的各实体：“司机A”和“红灯”，并对所述行为数据进行语义分析，得到各个实体间的关联关系“闯”。电子设备将“司机A”“闯”“红灯”与不同类别下的行为判定数据（如法律规则）进行匹配，根据匹配结果确定该行为数据所属的类别为违法。

在一个实施例中，该匹配结果可以为匹配到的法律条文或法律规则，电子设备可以将该匹配到的法律条文对应的类别或该法律规则对应的类别，确定为该行为数据所属的类别。在一个实施例中，该匹配到的法律条文或法律规则可以是确定出的与该行为数据匹配度最高的法律条文或法律规则。或，该匹配结果还可以为匹配到的案例，电子设备可以将该匹配到的案例对应的类别，确定为该行为数据所属的类别。在一个实施例中，该匹配到的案例可以是确定出的与该行为数据匹配度最高的案例。在一个实施例中，电子设备还可以将该匹配到的案例对应的法律条文或法律规则对应的类别，确定为该行为数据所属的类别。

在一个实施例中，该各个实体包括该行为数据中各条数据各自对应的主体和客体。该各个实体间的关联关系包括该行为数据中各条数据各自对应的主体和客体之间的关联关系。通过确定出各条数据对应的主体和客体，能够有效地避免对无用实体的识别，从而调高确定行为数据所属的类型的效率。

S105、生成包括所述目标对象的信息以及所述行为数据所属的类别的文件。

本申请实施例中，电子设备可以生成包括该目标对象的信息以及该行为数据所属的类别的文件，以便对该目标对象的信息以及该行为数据所属的类别进行存档和查询。其中，该文件的格式包括但不限于以下任一项：doc、docx、pdf、excel。在一个实施例中，该文件可以为分析报告。

在一个实施例中，该电子设备还可以生成包括该目标对象的信息、该目标对象的风险预测结果、该行为数据所属的类别的文件。

在一个实施例中，该电子设备还可以生成包括该目标对象的信息、该目标对象的风险预测结果、该行为数据所属的类别以及其它辅助判定数据的文件。其中，该其它辅助判定数据可以是指除了该行为数据之外的一些其它维度的数据。例如，在车祸风险场景下，该其它辅助判断数据可以包括拍摄到的酗酒视频、出入酒吧等场所的视频等数据。

在一个实施例中，该其它辅助判定数据可以用于辅助分析所述行为数据属于所述类别的原因。即，电子设备可以根据该其它辅助判定数据，确定该行为数据属于该类别的原因。或，该其它辅助判定数据还可以用于分析该行为数据属于该类别下的哪个子类别。即，电子设备还可以根据该其它辅助判定数据，确定该行为数据属于该类别下的目标子类别。

在一个实施例中，当电子设备为终端时，该电子设备可以显示该文件。当该电子设备为服务器时，该电子设备可以将该文件发送至相应设备进行显示。

在一个实施例中，电子设备还可以当该风险预测结果指示该目标对象存在风险时，输出第一警报信息以提示相关人员。电子设备还可以当确定所属行为数据所属的类别为指定类别时，输出第二警报信息以提示相关人员。

在一个实施例中，电子设备还可以当在预设事件表中查询到该目标对象的信息时，触发按照预设的行为判定规则确定该行为数据所属的类别的步骤。其中，该预设事件表记录了在该目标场景下发生了事故的对象的信息。采用上述方式，能够便于相关人员对于该事故进行定性。例如，在车祸风险场景下，该预设事件表可以为该交通管理服务器在预设时间段内记录的交通事故数据或立案数据等数据。

可见，图1所示的实施例中，电子设备可以获取目标对象在目标场景下的风险数据，并根据该风险数据以及该目标场景的风险预测模型，确定该目标对象的风险预测结果；电子设备可以当该风险预测结果指示该目标对象存在风险时，将该目标对象的信息添加至标记列表，并采集该目标对象在预设时间范围内的行为数据，按照预设的行为判定规则确定该行为数据所属的类别，并生成包括该目标对象的信息以及该行为数据所属的类别的文件，使得风险识别过程更具针对性，并提高了风险识别的准确度。

请参阅图2，为本申请实施例提供的另一种基于数据分析的风险识别方法的流程示意图。该方法可以应用于电子设备，该电子设备可以为终端或服务器。具体地，该方法可以包括以下步骤。

S201、获取目标场景的场景标识，根据预设的场景标识与因子列表的对应关系，确定所述目标场景的场景标识对应的目标因子列表。

其中，该场景标识可以为场景名称。该目标因子列表是指该目标场景对应的因子列表，该目标因子列表可以包括一个或多个因子。例如，车祸风险场景对应的目标因子列表可以包括以下至少一项：天气、路况、驾驶人、驾驶人车龄。在一个实施例中，上述因子可以理解为对一类标签的统称。例如，天气可以是对诸如晴天、阴天、小雨、暴雨等形容天气的标签的统称。

在一个实施例中，电子设备可以根据预设的场景标识与因子列表的对应关系，从因子库中确定出该目标场景的场景标识对应的目标因子列表。其中，该因子库保存了各场景对应的因子列表。

S202、从数据库中匹配出所述目标因子列表对应的标签列表。

其中，该数据库存有至少一个标签列表，以及该至少一个标签列表中每个标签列表与因子列表的对应关系。例如，该目标因子列表包括第一因子和第二因子，第一因子为路况，那么所述标签列表中与该第一因子相对应的标签可以为拥堵路况，流畅路况等路况，第二因子为驾驶人车龄，则所述标签列表中与该第二因子相对应的标签可以为驾驶人车龄2年、驾驶人车龄3年等驾驶人车龄。

本申请实施例中，电子设备可以根据数据库包括的该至少一个标签列表中每个标签列表与因子列表的对应关系，从数据库包括的至少一个标签列表中，确定出该目标因子列表对应的标签列表。

S203、对所述标签列表中各个标签进行组合处理，得到至少一组组合标签。

本申请实施例中，电子设备可以对标签列表中的各个标签进行组合处理，得到至少一组组合标签。

在一个实施例中，电子设备可以对该标签列表中各个标签进行随机采样，得到多组标签，该多组标签中每组标签包括多个标签；电子设备可以为该多组标签包括的各标签之间添加逻辑连接词，得到该多组标签中每组标签对应的至少一组组合标签。例如，多组标签包括第一组标签（标签1，标签2，标签3），为第一组标签中的各个标签之间添加连接词，至少可以得到第一组标签对应的以下两组组合标签：第一组组合标签（标签1且标签2且标签3），第二组组合标签（标签1或标签2或标签3）。可选地，上述随机采样可以是有放回采样。

可选地，考虑到有放回采样可能存在多组标签中有至少两组标签重复的问题，因此可以对所述多组标签进行去重处理。在一个实施例中，电子设备对所述标签列表中各个标签进行组合处理，得到至少一组组合标签，可以包括：电子设备对所述标签列表中各个标签进行随机采样，得到多组标签；所述多组标签中每组标签包括多个标签；电子设备对所述多组标签进行去重处理，得到至少一组标签；所述至少一组标签中各组标签之间存在不同；电子设备为所述至少一组标签中每组标签包括的各标签之间添加预设的逻辑连接词，得到所述每组标签对应的至少一组组合标签。其中，每组标签包括的各标签之间不重复。采用上述方式，能够有效地降低多组标签的重复率，进而降低每组标签对应的至少一组组合标签的重复率。

在一个实施例中，为了提高电子设备对某些标签的采样率，电子设备对所述标签列表中各个标签进行随机采样，可以包括：电子设备获取为所述标签列表中每个标签设置的权重；电子设备采用加权随机采样算法，根据为所述标签列表中每个标签设置的权重，对所述各个标签进行随机采样。在一个实施例中，权重越高，被采样的概率越高。

在一个实施例中，电子设备可以在去重处理过程中，每采样到一组标签，查询已保存的各组标签中是否包括该组标签；若已有的各组标签不包括该组标签，则保存该组标签；若已有的各组标签包括该组标签，则丢弃（如删除）该组标签。

在一个实施例中，电子设备对所述标签列表中各个标签进行组合处理，得到至少一组组合标签，可以包括：电子设备采用递归算法对所述标签列表中各个标签进行排列组合，得到多组标签，每组标签包括多个标签；电子设备为所述多组标签包括的各标签之间添加预设的逻辑连接词，得到每组标签对应的至少一组组合标签。本申请采用递归算法得到多组标签，可以提升得到多组标签的效率。

例如，该标签列表中包括n个标签，电子设备可以从中选取m个标签，并对这m个标签进行排列组合，得到这m个标签对应的多组标签，采用上述递归算法得到该多组标签的过程，可以包括：选取所述标签列表中的第一标签作为一组标签的第一个元素，并从所述标签列表的位于所述第一标签之后的其它标签中选取（m-1）个标签作为一组标签的剩余（m-1）个元素，以此类推，选取所述标签列表中的第2至（n-m+1）标签作为一组标签的第一个元素，并从所述标签列表中位于所述第2至（n-m+1）标签之后的其它标签中选取（m-1）个标签作为一组标签的剩余（m-1）个元素。

在一个实施例中，前述标签列表中各个标签可以是按照各自对应的因子进行分组后，得到的不同因子对应的至少一个标签。电子设备在随机采样的过程中，每次从每个因子对应的至少一个标签中抽取一个标签，以构建一组标签。因此，前述每组标签包括的多个标签中各个标签对应的因子不同。

在一个实施例中，电子设备还可以对该每组标签对应的至少一组组合标签进行去重处理。该去重处理的过程，可以为删除该至少一组组合标签中组合标签相同的组。

S204、利用所述至少一组组合标签，构建所述目标场景的风险预测模型。

本申请实施例中，电子设备可以利用该至少一组组合标签，构建该目标场景的风险预测模型。

在一个实施例中，电子设备利用所述至少一组组合标签，构建所述目标场景的风险预测模型，可以包括：电子设备建立所述至少一组组合标签中每组组合标签和对应的风险预测结果之间的对应关系，并将所述每组组合标签和对应的风险预测结果之间的对应关系，确定为所述目标场景的风险预测模型。将对应关系确定为风险预测模型，能够快速有效地确定风险预测模型。

在一个实施例中，电子设备利用所述至少一组组合标签，构建所述目标场景的风险预测模型，可以包括：电子设备将所述至少一组组合标签以及所述至少一组组合标签中每组组合标签对应的风险预测结果，输入到预设模型进行训练，得到训练后的所述预设模型，将所述训练后的所述预设模型确定为所述目标场景的风险预测模型。通过建模确定风险预测模型，能够提高该风险预测模型的可扩展性和预测准确度。

S205、获取目标对象在目标场景下的风险数据。

S206、根据所述风险数据以及所述目标场景的风险预测模型，确定所述目标对象的风险预测结果。

S207、当所述风险预测结果指示所述目标对象存在风险时，将所述目标对象的信息添加至标记列表。

S208、采集所述目标对象在预设时间范围内的行为数据，并按照预设的行为评定规则确定所述行为数据所属的类别。

S209、生成包括所述目标对象的信息以及所述行为数据所属的类别的文件。

其中，步骤S205-S209可参见图1实施例中的步骤S101-S105，本申请实施例中在此不做赘述。

可见，图2所示的实施例中，电子设备可以获取目标场景的场景标识，根据预设的场景标识与因子列表的对应关系，确定该目标场景的场景标识对应目标因子列表；电子设备可以从数据库中匹配出该目标因子列表对应的标签列表，以对该标签列表中各个标签进行组合处理，得到至少一组组合标签。从而利用该至少一组组合标签，构建该目标场景的风险预测模型，采用该方式能够快速有效地构建该目标场景的风险预测模型，实现了对该目标场景的风险预测模型的自动化智能化构建过程，提高了对该目标场景的风险预测模型的构建效率。

请参阅图3，为本申请实施例提供的一种基于数据分析的风险识别装置的结构示意图。该装置可以应用于电子设备。具体的，该装置可以包括以下单元。

获取单元301，用于获取目标对象在目标场景下的风险数据；所述风险数据包括至少一个用于风险预测的标签。

确定单元302，用于根据所述风险数据以及所述目标场景的风险预测模型，确定所述目标对象的风险预测结果；其中，所述风险预设模型根据所述目标场景下的至少一组组合标签构建，所述至少一组组合标签中每组组合标签包括多个标签；所述多个标签包括的各标签之间通过逻辑连接词连接。

添加单元303，用于当所述风险预测结果指示所述目标对象存在风险时，将所述目标对象的信息添加至标记列表。

处理单元304，用于采集所述目标对象在预设时间范围内的行为数据，并按照预设的行为评定规则确定所述行为数据所属的类别，并生成包括所述目标对象的信息以及所述行为数据所属的类别的文件。

在一种可选的实施方式中，确定单元302，还用于通过获取单元301获取目标场景的场景标识，根据预设的场景标识与因子列表的对应关系，确定所述目标场景的场景标识对应的目标因子列表；所述目标因子列表包括一个或多个因子。

在一种可选的实施方式中，处理单元304，还用于从数据库中匹配出所述目标因子列表对应的标签列表；所述数据库存有至少一个标签列表，以及所述至少一个标签列表中每个标签列表与因子列表的对应关系；对所述标签列表中各个标签进行组合处理，得到至少一组组合标签；利用所述至少一组组合标签，构建所述目标场景的风险预测模型。

在一种可选的实施方式中，处理单元304对所述标签列表中各个标签进行组合处理，得到至少一组组合标签，具体为对所述标签列表中各个标签进行随机采样，得到多组标签；所述多组标签中每组标签包括多个标签；对所述多组标签进行去重处理，得到至少一组标签；所述至少一组标签中各组标签之间存在不同；为所述至少一组标签中每组标签包括的各标签之间添加预设的逻辑连接词，得到所述每组标签对应的至少一组组合标签。

在一种可选的实施方式中，处理单元304对所述标签列表中各个标签进行随机采样，具体为获取为所述标签列表中每个标签设置的权重；采用加权随机采样算法，根据为所述标签列表中每个标签设置的权重，对所述各个标签进行随机采样。

在一种可选的实施方式中，处理单元304对所述标签列表中各个标签进行组合处理，得到至少一组组合标签，具体为采用递归算法对所述标签列表中各个标签进行排列组合，得到多组标签，每组标签包括多个标签；为所述多组标签包括的各标签之间添加预设的逻辑连接词，得到每组标签对应的至少一组组合标签。

在一种可选的实施方式中，处理单元304利用所述至少一组组合标签，构建所述目标场景的风险预测模型，具体为建立所述至少一组组合标签中每组组合标签和对应的风险预测结果之间的对应关系，并将所述每组组合标签和对应的风险预测结果之间的对应关系，确定为所述目标场景的风险预测模型；或，将所述至少一组组合标签以及所述至少一组组合标签中每组组合标签对应的风险预测结果，输入到预设模型进行训练，得到训练后的所述预设模型，将所述训练后的所述预设模型确定为所述目标场景的风险预测模型。

在一种可选的实施方式中，处理单元304按照预设行为判定规则确定所述行为数据所属的类别，具体为将所述行为数据输入到预设的分类模型中，经由所述分类模型对所述行为数据进行分类，得到所述行为数据所属的类别；或，对所述行为数据进行命名实体识别以提取所述行为数据中各个实体，并对所述行为数据进行语义分析，得到各个实体间的关联关系，将所述各个实体、所述各个实体间的关联关系与不同类别下的行为判定数据进行匹配，根据匹配结果确定所述行为数据所属的类别。

可见，图3所示的实施例中，电子设备可以获取目标对象在目标场景下的风险数据，并根据该风险数据以及该目标场景的风险预测模型，确定该目标对象的风险预测结果；电子设备可以当该风险预测结果指示该目标对象存在风险时，将该目标对象的信息添加至标记列表，并采集该目标对象在预设时间范围内的行为数据，按照预设的行为判定规则确定该行为数据所属的类别，并生成包括该目标对象的信息以及该行为数据所属的类别的文件，能够使得风险识别过程更具针对性，并提高风险识别的准确度。

请参阅图4，为本申请实施例提供的一种电子设备的结构示意图。其中，本实施例中所描述的电子设备可以包括处理器1000和存储器2000。处理器1000和存储器2000之间可以通过如图4所示的总线或其它方式连接。在一个实施例中，该电子设备还可以包括一个或多个输入设备3000、一个或多个输出设备4000。处理器1000、存储器2000、一个或多个输入设备3000和一个或多个输出设备4000之间可以通过总线或其它方式连接。在一个实施例中，输入设备3000包括但不限于触摸屏、录音器、传感器等设备。输出设备4000包括但不限于显示屏、扬声器等设备。该触摸屏和显示屏还可以替换为触摸显示屏。在一个实施例中，输入设备3000和输出设备4000可以包括标准的有线或无线通信接口。

处理器1000可以是中央处理模块(Central Processing Unit，CPU)，该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器2000可以是高速RAM存储器，也可为非不稳定的存储器（non-volatile memory），例如磁盘存储器。存储器2000用于存储一组程序代码，处理器1000、输入设备3000和输出设备4000可以调用存储器2000中存储的程序代码。具体地：处理器1000，用于获取目标对象在目标场景下的风险数据；所述风险数据包括至少一个用于风险预测的标签；根据所述风险数据以及所述目标场景的风险预测模型，确定所述目标对象的风险预测结果；其中，所述风险预设模型根据所述目标场景下的至少一组组合标签构建，所述至少一组组合标签中每组组合标签包括多个标签；所述多个标签包括的各标签之间通过逻辑连接词连接；当所述风险预测结果指示所述目标对象存在风险时，将所述目标对象的信息添加至标记列表；采集所述目标对象在预设时间范围内的行为数据，并按照预设的行为评定规则确定所述行为数据所属的类别；生成包括所述目标对象的信息以及所述行为数据所属的类别的文件。

可选地，处理器1000，还用于获取目标场景的场景标识，根据预设的场景标识与因子列表的对应关系，确定所述目标场景的场景标识对应的目标因子列表；所述目标因子列表包括一个或多个因子；从数据库中匹配出所述目标因子列表对应的标签列表；所述数据库存有至少一个标签列表，以及所述至少一个标签列表中每个标签列表与因子列表的对应关系；对所述标签列表中各个标签进行组合处理，得到至少一组组合标签；利用所述至少一组组合标签，构建所述目标场景的风险预测模型。

可选地，处理器1000对所述标签列表中各个标签进行组合处理，得到至少一组组合标签，具体为对所述标签列表中各个标签进行随机采样，得到多组标签；所述多组标签中每组标签包括多个标签；对所述多组标签进行去重处理，得到至少一组标签；所述至少一组标签中各组标签之间存在不同；为所述至少一组标签中每组标签包括的各标签之间添加预设的逻辑连接词，得到所述每组标签对应的至少一组组合标签。

可选地，处理器1000对所述标签列表中各个标签进行随机采样，具体为获取为所述标签列表中每个标签设置的权重；采用加权随机采样算法，根据为所述标签列表中每个标签设置的权重，对所述各个标签进行随机采样。

可选地，处理器1000对所述标签列表中各个标签进行组合处理，得到至少一组组合标签，具体为采用递归算法对所述标签列表中各个标签进行排列组合，得到多组标签，每组标签包括多个标签；为所述多组标签包括的各标签之间添加预设的逻辑连接词，得到每组标签对应的至少一组组合标签。

可选地，处理器1000利用所述至少一组组合标签，构建所述目标场景的风险预测模型，具体为建立所述至少一组组合标签中每组组合标签和对应的风险预测结果之间的对应关系，并将所述每组组合标签和对应的风险预测结果之间的对应关系，确定为所述目标场景的风险预测模型；或，将所述至少一组组合标签以及所述至少一组组合标签中每组组合标签对应的风险预测结果，输入到预设模型进行训练，得到训练后的所述预设模型，将所述训练后的所述预设模型确定为所述目标场景的风险预测模型。

可选地，处理器1000按照预设行为判定规则确定所述行为数据所属的类别，具体为将所述行为数据输入到预设的分类模型中，经由所述分类模型对所述行为数据进行分类，得到所述行为数据所属的类别；或，对所述行为数据进行命名实体识别以提取所述行为数据中各个实体，并对所述行为数据进行语义分析，得到各个实体间的关联关系，将所述各个实体、所述各个实体间的关联关系与不同类别下的行为判定数据进行匹配，根据匹配结果确定所述行为数据所属的类别。

具体实现中，本申请实施例中所描述的处理器1000、输入设备3000、输出设备4000可执行图1和图2实施例所描述的实现方式，也可执行本申请实施例所描述的实现方式，在此不再赘述。

在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采样硬件的形式实现，也可以采样软件功能单元的形式实现。

本申请实施例还提供了一种计算机可读存储介质，其中，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行以实现以下步骤：获取目标对象在目标场景下的风险数据；所述风险数据包括至少一个用于风险预测的标签；根据所述风险数据以及所述目标场景的风险预测模型，确定所述目标对象的风险预测结果；其中，所述风险预设模型根据所述目标场景下的至少一组组合标签构建，所述至少一组组合标签中每组组合标签包括多个标签；所述多个标签包括的各标签之间通过逻辑连接词连接；当所述风险预测结果指示所述目标对象存在风险时，将所述目标对象的信息添加至标记列表；采集所述目标对象在预设时间范围内的行为数据，并按照预设的行为评定规则确定所述行为数据所属的类别；生成包括所述目标对象的信息以及所述行为数据所属的类别的文件。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的计算机可读存储介质可为非易失性的，也可为易失性的。该计算机可读存储介质可为磁碟、光盘、只读存储记忆体（Read-Only Memory，ROM）或随机存储记忆体（Random Access Memory，RAM）等。

以上所揭露的仅为本申请一种较佳实施例而已，当然不能以此来限定本申请之权利范围，本领域普通技术人员可以理解实现上述实施例的全部或部分流程，并依本申请权利要求所作的等同变化，仍属于本申请所涵盖的范围。

Claims

一种基于数据分析的风险识别方法，其中，包括：

获取目标对象在目标场景下的风险数据；所述风险数据包括至少一个用于风险预测的标签；

根据所述风险数据以及所述目标场景的风险预测模型，确定所述目标对象的风险预测结果；其中，所述风险预设模型根据所述目标场景下的至少一组组合标签构建，所述至少一组组合标签中每组组合标签包括多个标签；所述多个标签包括的各标签之间通过逻辑连接词连接；

当所述风险预测结果指示所述目标对象存在风险时，将所述目标对象的信息添加至标记列表；

采集所述目标对象在预设时间范围内的行为数据，并按照预设的行为评定规则确定所述行为数据所属的类别；

生成包括所述目标对象的信息以及所述行为数据所属的类别的文件。
根据权利要求1所述的方法，其中，所述方法还包括：

获取目标场景的场景标识，根据预设的场景标识与因子列表的对应关系，确定所述目标场景的场景标识对应的目标因子列表；所述目标因子列表包括一个或多个因子；

从数据库中匹配出所述目标因子列表对应的标签列表；所述数据库存有至少一个标签列表，以及所述至少一个标签列表中每个标签列表与因子列表的对应关系；

对所述标签列表中各个标签进行组合处理，得到至少一组组合标签；

利用所述至少一组组合标签，构建所述目标场景的风险预测模型。
根据权利要求2所述的方法，其中，所述对所述标签列表中各个标签进行组合处理，得到至少一组组合标签，包括：

对所述标签列表中各个标签进行随机采样，得到多组标签；所述多组标签中每组标签包括多个标签；

对所述多组标签进行去重处理，得到至少一组标签；所述至少一组标签中各组标签之间存在不同；

为所述至少一组标签中每组标签包括的各标签之间添加预设的逻辑连接词，得到所述每组标签对应的至少一组组合标签。
根据权利要求3所述的方法，其中，所述对所述标签列表中各个标签进行随机采样，包括：

获取为所述标签列表中每个标签设置的权重；

采用加权随机采样算法，根据为所述标签列表中每个标签设置的权重，对所述各个标签进行随机采样。
根据权利要求2所述的方法，其中，所述对所述标签列表中各个标签进行组合处理，得到至少一组组合标签，包括：

采用递归算法对所述标签列表中各个标签进行排列组合，得到多组标签，每组标签包括多个标签；

为所述多组标签包括的各标签之间添加预设的逻辑连接词，得到每组标签对应的至少一组组合标签。
根据权利要求2所述的方法，其中，所述利用所述至少一组组合标签，构建所述目标场景的风险预测模型，包括：

建立所述至少一组组合标签中每组组合标签和对应的风险预测结果之间的对应关系，并将所述每组组合标签和对应的风险预测结果之间的对应关系，确定为所述目标场景的风险预测模型；或，

将所述至少一组组合标签以及所述至少一组组合标签中每组组合标签对应的风险预测结果，输入到预设模型进行训练，得到训练后的所述预设模型，将所述训练后的所述预设模型确定为所述目标场景的风险预测模型。
根据权利要求1所述的方法，其中，所述按照预设行为判定规则确定所述行为数据所属的类别，包括：

将所述行为数据输入到预设的分类模型中，经由所述分类模型对所述行为数据进行分类，得到所述行为数据所属的类别；或，

对所述行为数据进行命名实体识别以提取所述行为数据中各个实体，并对所述行为数据进行语义分析，得到各个实体间的关联关系，将所述各个实体、所述各个实体间的关联关系与不同类别下的行为判定数据进行匹配，根据匹配结果确定所述行为数据所属的类别。
一种基于数据分析的风险识别装置，其中，包括：

获取单元，用于获取目标对象在目标场景下的风险数据；所述风险数据包括至少一个用于风险预测的标签；

确定单元，用于根据所述风险数据以及所述目标场景的风险预测模型，确定所述目标对象的风险预测结果；其中，所述风险预设模型根据所述目标场景下的至少一组组合标签构建，所述至少一组组合标签中每组组合标签包括多个标签；所述多个标签包括的各标签之间通过逻辑连接词连接；

添加单元，用于当所述风险预测结果指示所述目标对象存在风险时，将所述目标对象的信息添加至标记列表；

处理单元，用于采集所述目标对象在预设时间范围内的行为数据，并按照预设的行为评定规则确定所述行为数据所属的类别，并生成包括所述目标对象的信息以及所述行为数据所属的类别的文件。
一种电子设备，其中，包括处理器和存储器，所述处理器和所述存储器相互连接，其中，所述存储器用于存储计算机程序，所述计算机程序包括程序指令，所述处理器被配置用于调用所述程序指令，执行以下步骤：

获取目标对象在目标场景下的风险数据；所述风险数据包括至少一个用于风险预测的标签；

根据所述风险数据以及所述目标场景的风险预测模型，确定所述目标对象的风险预测结果；其中，所述风险预设模型根据所述目标场景下的至少一组组合标签构建，所述至少一组组合标签中每组组合标签包括多个标签；所述多个标签包括的各标签之间通过逻辑连接词连接；

当所述风险预测结果指示所述目标对象存在风险时，将所述目标对象的信息添加至标记列表；

采集所述目标对象在预设时间范围内的行为数据，并按照预设的行为评定规则确定所述行为数据所属的类别；

生成包括所述目标对象的信息以及所述行为数据所属的类别的文件。
根据权利要求9所述的电子设备，其中，所述处理器，还用于获取目标场景的场景标识，根据预设的场景标识与因子列表的对应关系，确定所述目标场景的场景标识对应的目标因子列表；所述目标因子列表包括一个或多个因子；从数据库中匹配出所述目标因子列表对应的标签列表；所述数据库存有至少一个标签列表，以及所述至少一个标签列表中每个标签列表与因子列表的对应关系；对所述标签列表中各个标签进行组合处理，得到至少一组组合标签；利用所述至少一组组合标签，构建所述目标场景的风险预测模型。
根据权利要求10所述的电子设备，其中，所述处理器对所述标签列表中各个标签进行组合处理，得到至少一组组合标签，具体为对所述标签列表中各个标签进行随机采样，得到多组标签；所述多组标签中每组标签包括多个标签；对所述多组标签进行去重处理，得到至少一组标签；所述至少一组标签中各组标签之间存在不同；为所述至少一组标签中每组标签包括的各标签之间添加预设的逻辑连接词，得到所述每组标签对应的至少一组组合标签。
根据权利要求11所述的电子设备，其中，所述处理器对所述标签列表中各个标签进行随机采样，具体为获取为所述标签列表中每个标签设置的权重；采用加权随机采样算法，根据为所述标签列表中每个标签设置的权重，对所述各个标签进行随机采样。
根据权利要求10所述的电子设备，其中，所述处理器对所述标签列表中各个标签进行组合处理，得到至少一组组合标签，具体为采用递归算法对所述标签列表中各个标签进行排列组合，得到多组标签，每组标签包括多个标签；为所述多组标签包括的各标签之间添加预设的逻辑连接词，得到每组标签对应的至少一组组合标签。
根据权利要求10所述的电子设备，其中，所述处理器利用所述至少一组组合标签，构建所述目标场景的风险预测模型，具体为建立所述至少一组组合标签中每组组合标签和对应的风险预测结果之间的对应关系，并将所述每组组合标签和对应的风险预测结果之间的对应关系，确定为所述目标场景的风险预测模型；或，将所述至少一组组合标签以及所述至少一组组合标签中每组组合标签对应的风险预测结果，输入到预设模型进行训练，得到训练后的所述预设模型，将所述训练后的所述预设模型确定为所述目标场景的风险预测模型。
根据权利要求9所述的电子设备，其中，所述处理器按照预设行为判定规则确定所述行为数据所属的类别，具体为将所述行为数据输入到预设的分类模型中，经由所述分类模型对所述行为数据进行分类，得到所述行为数据所属的类别；或，对所述行为数据进行命名实体识别以提取所述行为数据中各个实体，并对所述行为数据进行语义分析，得到各个实体间的关联关系，将所述各个实体、所述各个实体间的关联关系与不同类别下的行为判定数据进行匹配，根据匹配结果确定所述行为数据所属的类别。
一种计算机可读存储介质，其中，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行以实现以下步骤：

获取目标对象在目标场景下的风险数据；所述风险数据包括至少一个用于风险预测的标签；

根据所述风险数据以及所述目标场景的风险预测模型，确定所述目标对象的风险预测结果；其中，所述风险预设模型根据所述目标场景下的至少一组组合标签构建，所述至少一组组合标签中每组组合标签包括多个标签；所述多个标签包括的各标签之间通过逻辑连接词连接；

当所述风险预测结果指示所述目标对象存在风险时，将所述目标对象的信息添加至标记列表；

采集所述目标对象在预设时间范围内的行为数据，并按照预设的行为评定规则确定所述行为数据所属的类别；

生成包括所述目标对象的信息以及所述行为数据所属的类别的文件。
根据权利要求16所述的计算机可读存储介质，其中，所述计算机程序被处理器执行，还用于实现以下步骤：

获取目标场景的场景标识，根据预设的场景标识与因子列表的对应关系，确定所述目标场景的场景标识对应的目标因子列表；所述目标因子列表包括一个或多个因子；

从数据库中匹配出所述目标因子列表对应的标签列表；所述数据库存有至少一个标签列表，以及所述至少一个标签列表中每个标签列表与因子列表的对应关系；

对所述标签列表中各个标签进行组合处理，得到至少一组组合标签；

利用所述至少一组组合标签，构建所述目标场景的风险预测模型。
根据权利要求17所述的计算机可读存储介质，其中，在对所述标签列表中各个标签进行组合处理，得到至少一组组合标签时，所述计算机程序被处理器执行以实现以下步骤：

对所述标签列表中各个标签进行随机采样，得到多组标签；所述多组标签中每组标签包括多个标签；

对所述多组标签进行去重处理，得到至少一组标签；所述至少一组标签中各组标签之间存在不同；

为所述至少一组标签中每组标签包括的各标签之间添加预设的逻辑连接词，得到所述每组标签对应的至少一组组合标签。
根据权利要求18所述的计算机可读存储介质，其中，在对所述标签列表中各个标签进行随机采样时，所述计算机程序被处理器执行以实现以下步骤：

获取为所述标签列表中每个标签设置的权重；

采用加权随机采样算法，根据为所述标签列表中每个标签设置的权重，对所述各个标签进行随机采样。
根据权利要求17所述的计算机可读存储介质，其中，在对所述标签列表中各个标签进行组合处理，得到至少一组组合标签时，所述计算机程序被处理器执行以实现以下步骤：

采用递归算法对所述标签列表中各个标签进行排列组合，得到多组标签，每组标签包括多个标签；

为所述多组标签包括的各标签之间添加预设的逻辑连接词，得到每组标签对应的至少一组组合标签。