CN117151460A

CN117151460A - 一种基于通话数据的企业风险度分析方法及其装置

Info

Publication number: CN117151460A
Application number: CN202310989746.9A
Authority: CN
Inventors: 连婉欣; 王劲鹏; 吴凯; 邓荣欣; 李振滢; 黄一诺; 庞亚淳; 许永涛; 吕祥钊; 黄汉颖; 刘祖妍
Original assignee: China Mobile Communications Group Co Ltd; China Mobile Internet Co Ltd
Current assignee: China Mobile Communications Group Co Ltd; China Mobile Internet Co Ltd
Priority date: 2023-08-07
Filing date: 2023-08-07
Publication date: 2023-12-01

Abstract

本申请提出了一种基于通话数据的企业风险度分析方法及其装置，涉及数据分析技术领域，通过收集目标企业在目标时段的通话数据，并对通话数据进行处理分析，获取目标企业在每个通话指标下对应的指标值；针对任一通话指标，获取其对应的指标值所属的目标指标区间，以及确定目标指标区间所对应的指标健康等级；获取在目标时段下每个通话指标对应的目标权重；根据每个通话指标对应的目标权重、每个通话指标对应的指标健康等级以及每个指标健康等级对应的等级分值，获取目标企业对应的企业健康度。本申请能够量化和评估该企业的通话风险，在系统层面尽早主动发现异常并预警，以加强对企业的管控，对打击和减少行业诈骗具有积极作用。

Description

一种基于通话数据的企业风险度分析方法及其装置

技术领域

本申请涉及云计算大数据边缘计算、数据分析技术领域，尤其涉及一种基于通话数据的企业风险度分析方法及其装置。

背景技术

随着社会信息化程度的不断提高和通信行业的快速发展，越来越多的场景使用通信技术进行沟通联系。外呼系统、语音专线等相关技术逐渐成为企业的新宠，能够有效地帮助企业与客户进行沟通，并提供更优质的服务。然而，这些先进的通信技术和服务也给不法分子提供了进行电信诈骗的工具。通信管控的焦点由个人转变为企业，因此运营商必须加强对政企业务的管控，特别是对诈骗电话的识别和防范。

目前存在的问题是，在大规模的通信流量中准确识别和过滤掉潜在的诈骗电话是一项挑战性任务。传统的防骚扰技术主要依赖于黑名单、关键词匹配等简单的规则，无法应对日益复杂和多样化的诈骗手段和方式。

发明内容

本公开提供一种基于通话数据的企业风险度分析方法及其装置，以至少解决相关技术中如何在大规模的通信流量中准确识别和过滤掉潜在的诈骗电话企业的问题。

本申请第一方面实施例提出了一种基于通话数据的企业风险度分析方法，包括：收集目标企业在目标时段的通话数据，并对通话数据进行处理分析，获取目标企业在每个通话指标下对应的指标值；针对任一通话指标，获取其对应的指标值所属的目标指标区间，以及确定目标指标区间所对应的指标健康等级；获取在目标时段下每个通话指标对应的目标权重；根据每个通话指标对应的目标权重、每个通话指标对应的指标健康等级以及每个指标健康等级对应的等级分值，获取目标企业对应的企业健康度，企业健康度用于描述目标企业的通话风险程度。

根据本申请的一个实施例，获取在目标时段下每个通话指标对应的目标权重，包括：获取预先储存的候选时段与候选通话指标权重集之间的映射关系，候选通话指标权重集中包括每个通话指标的权重；根据目标时段，查询映射关系，获取与目标时段相匹配的目标候选时段；将目标候选时段对应的候选通话指标权重集作为目标候选通话指标权重集，并将目标候选通话指标权重集所包含的每个通话指标的权重作为在目标时段下每个通话指标对应的目标权重。

根据本申请的一个实施例，候选时段与候选通话指标权重集之间的映射关系的获取方法，包括：收集多个样本企业对应的第一样本通话数据，并根据第一样本通话数据，获取每个通话指标对应的第一权重；基于样本企业的业务数据，将一天划分为多个候选时段；针对每个候选时段，根据处于该候选时段内的第一样本通话数据，获取每个通话指标层对应的第二权重，其中，每个通话指标层包括至少一个通话指标；针对每个候选时段，基于第一权重和第二权重，确定在候选时段下每个通话指标对应的权重，并构建候选时段与候选通话指标权重集之间的映射关系。

根据本申请的一个实施例，根据处于该候选时段内的第一样本通话数据，获取每个通话指标层对应的第二权重，包括：对处于该候选时段内的第一样本通话数据进行分析，获取每个通话指标层的重要程度；对通话指标层的重要程度进行两两分析，构造通话指标层对应的判断矩阵；基于判断矩阵，确定每个通话指标层对应的第二权重。

根据本申请的一个实施例，针对任一通话指标，获取其对应的指标值所属的目标指标区间，包括：针对任一通话指标，获取该通话指标对应的合格参考值与预设标准差；基于合格参考值与预设标准差，生成多个候选指标区间；将该通话指标对应的指标值与每个候选指标区间进行对比，将指标值所属的候选指标区间作为目标指标区间。

根据本申请的一个实施例，根据第一样本通话数据，获取每个通话指标对应的第一权重，包括：基于熵权法对第一样本通话数据进行分析，获取每个通话指标对应的第一权重。

根据本申请的一个实施例，获取目标企业对应的企业健康度之后，还包括：对多个目标企业各自对应的企业健康度进行排序；基于排序后生成的排序结果生成企业风险榜单。

根据本申请的一个实施例，收集目标企业在目标时段的通话数据之前，还包括：确定目标企业对应的多个通话指标。

根据本申请的一个实施例，通话指标包括无效通话率、通话接通率、平均通话时长、高频主叫号码占比、同主叫同中间号的主叫号码占比、高频被叫号码占比、高频被叫中间号占比、高频号显中间号占比、主叫非手机号占比、百分百主叫号码占比、百分百被叫号码占比、短时订单占比、回拨订单占比。

根据本申请的一个实施例，确定目标企业对应的多个通话指标之后，还包括：收集健康样本企业对应的第二样本通话数据以及风险样本企业对应的第三样本通话数据；基于第二样本通话数据和第三样本通话数据，结合朴素贝叶斯分类方法，对多个通话指标进行有效性验证。

本申请第二方面实施例提出了一种基于通话数据的企业风险度分析装置，包括：第一获取模块，用于收集目标企业在目标时段的通话数据，并对通话数据进行处理分析，获取目标企业在每个通话指标下对应的指标值；第二获取模块，用于针对任一通话指标，获取其对应的指标值所属的目标指标区间，以及确定目标指标区间所对应的指标健康等级；第三获取模块，用于获取在目标时段下每个通话指标对应的目标权重；风险分析模块，用于根据每个通话指标对应的目标权重、每个通话指标对应的指标健康等级以及每个指标健康等级对应的等级分值，获取目标企业对应的企业健康度，企业健康度用于描述目标企业的通话风险程度。

根据本申请的一个实施例，第三获取模块，还用于：获取预先储存的候选时段与候选通话指标权重集之间的映射关系，候选通话指标权重集中包括每个通话指标的权重；根据目标时段，查询映射关系，获取与目标时段相匹配的目标候选时段将目标候选时段对应的候选通话指标权重集作为目标候选通话指标权重集，并将目标候选通话指标权重集所包含的每个通话指标的权重作为在目标时段下每个通话指标对应的目标权重。

根据本申请的一个实施例，基于通话数据的企业风险度分析装置还包括映射关系获取模块，映射关系获取模块，用于：收集多个样本企业对应的第一样本通话数据，并根据第一样本通话数据，获取每个通话指标对应的第一权重；基于样本企业的业务数据，将一天划分为多个候选时段；针对每个候选时段，根据处于该候选时段内的第一样本通话数据，获取每个通话指标层对应的第二权重，其中，每个通话指标层包括至少一个通话指标；针对每个候选时段，基于第一权重和第二权重，确定在候选时段下每个通话指标对应的权重，并构建候选时段与候选通话指标权重集之间的映射关系。

根据本申请的一个实施例，映射关系获取模块，还用于：对处于该候选时段内的第一样本通话数据进行分析，获取每个通话指标层的重要程度；对通话指标层的重要程度进行两两分析，构造通话指标层对应的判断矩阵；基于判断矩阵，确定每个通话指标层对应的第二权重。

根据本申请的一个实施例，第二获取模块，还用于：针对任一通话指标，获取该通话指标对应的合格参考值与预设标准差；基于合格参考值与预设标准差，生成多个候选指标区间；将该通话指标对应的指标值与每个候选指标区间进行对比，将指标值所属的候选指标区间作为目标指标区间。

根据本申请的一个实施例，映射关系获取模块，还用于：基于熵权法对第一样本通话数据进行分析，获取每个通话指标对应的第一权重。

根据本申请的一个实施例，基于通话数据的企业风险度分析装置还包括：排序模块，用于对多个目标企业各自对应的企业健康度进行排序；榜单生成模块，用于基于排序后生成的排序结果生成企业风险榜单。

根据本申请的一个实施例，基于通话数据的企业风险度分析装置还包括：通话指标确定模块，用于确定目标企业对应的多个通话指标。

根据本申请的一个实施例，通话指标确定模块，还用于：收集健康样本企业对应的第二样本通话数据以及风险样本企业对应的第三样本通话数据；基于第二样本通话数据和第三样本通话数据，结合朴素贝叶斯分类方法，对多个通话指标进行有效性验证。

本申请第三方面实施例提出了一种电子设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以实现如本申请第一方面实施例所述的基于通话数据的企业风险度分析方法。

本申请第四方面实施例提出了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于实现如本申请第一方面实施例所述的基于通话数据的企业风险度分析方法。

本申请第五方面实施例提出了一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现如本申请第一方面实施例所述的基于通话数据的企业风险度分析方法。

本公开的实施例提供的技术方案至少带来以下有益效果：本申请通过对目标企业的通话数据进行处理和分析，结合目标指标区间、指标健康等级和权重，最终得出企业健康度，并能够量化和评估该企业的通话风险，在系统层面尽早主动发现异常并预警，以加强对企业的管控，及时进行人工干预或进行业务下线，对打击和减少行业诈骗具有积极作用。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中：

图1是本申请示出的一种基于通话数据的企业风险度分析方法的示例性实施方式的示意图。

图2是本申请示出的朴素贝叶斯分类模型的示意图。

图3是本申请示出的一种获取在目标时段下每个通话指标对应的目标权重的示例性实施方式的示意图。

图4是本申请示出的上述13个通话指标为例构建的3个通话指标层的示意图。

图5是本申请示出的一种基于通话数据的企业风险度分析方法的示例性实施方式的整体流程示意图。

图6是本申请示出的一种基于通话数据的企业风险度分析装置的示意图。

图7是本申请一个实施例示出的一种电子设备的示意图。

具体实施方式

下面详细描述本申请的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，旨在用于解释本申请，而不能理解为对本申请的限制。

需要说明的是，本公开中所有获取信息、权限，提供服务的动作都是在遵照所在地国家相应的数据保护法规政策的前提下，并获得由相应装置所有者给予授权的情况下进行的，均符合相关法律法规的规定，且不违背公序良俗。

图1是本申请示出的一种基于通话数据的企业风险度分析方法的示例性实施方式的示意图，如图1所示，该基于通话数据的企业风险度分析方法，包括以下步骤：

S101，收集目标企业在目标时段的通话数据，并对通话数据进行处理分析，获取目标企业在每个通话指标下对应的指标值。

确定目标企业对应的待进行分析的多个通话指标，并收集目标企业在目标时段的通话数据。其中，目标时段可根据实际情况进行设置，比如说，一般情况下在上午8点至中午12点目标企业的通话数据较多，为获取目标企业在上午8点至中午12点时段内的通话健康程度，则将上午8点至中午12点作为目标时段，获取上午8点至中午12点目标企业的通话数据。

示例性的，本申请中，通话指标包括无效通话率、通话接通率、平均通话时长、高频主叫号码占比、同主叫同中间号的主叫号码占比、高频被叫号码占比、高频被叫中间号占比、高频号显中间号占比、主叫非手机号占比、百分百主叫号码占比、百分百被叫号码占比、短时订单占比、回拨订单占比。

其中，中间号是一种基于通信运营商网络的虚拟码号服务，用户通过平台绑定中间号，在服务方需要与用户进行电话沟通时，通过临时分配的中间号码建立起双方通话，隐藏真实号码、保护双方隐私。一通经过中间号的通话，除了有主被叫号码、中间号号码等基础信息外，还有中间号平台为通话双方进行通话绑定的信息，当A号码通话中间号X号码打电话给B号码，AXB就形成了一条订单信息。

下面对上述各个通话指标进行具体介绍：

1、在目标时段内目标企业的无效通话率的计算公式为：

上式中，ΔC为在目标时段内该目标企业的所有通话数量，ΔC₀为在目标时段内该目标企业的通话时长在预设无效通话区间内的通话数量，示例性的，由于可疑场景、诈骗场景的通话往往会被用户较快挂断，本申请中，预设无效通话区间可设置为[0_S，6_S]，也即，将接通之后6秒内挂掉的电话视为无效通话。

2、在目标时段内目标企业的通话接通率的计算公式为：

上式中，ΔC为在目标时段内该目标企业的所有通话数量，ΔC₁为在目标时段内该目标企业的通话时长大于0的通话数量。

3、在目标时段内目标企业的平均通话时长的计算公式为：

上式中，ΔC为在目标时段内该目标企业的所有通话数量，ΔT为在目标时段内该目标企业的所有通话记录的通话时长之和。

4、在目标时段内目标企业的高频主叫号码占比的计算公式为：

上式中，ΔNR为在目标时段内该目标企业的所有主叫号码数量，ΔNR₀为在目标时段内该目标企业的高频主叫号码数量。其中，统计在目标时段内该目标企业的每个号码的通话次数，将通话次数超过NUM_max1则标记为高频主叫号码，示例性的，可设置NUM_max1＝50。

5、在目标时段内目标企业的同主叫同中间号的主叫号码占比的计算公式为：

上式中，ΔNR为在目标时段内该目标企业的所有主叫号码数量，ΔNR₁为在目标时段内该目标企业的高频同主叫同中间号的号码数量，高频同主叫同中间号的号码判定方法如下：在目标时段内，使用相同中间号进行呼叫且呼叫次数超过NUM_max2次的号码标记为高频同主叫同中间号的号码，示例性的，可设置NUM_max2＝20。

6、在目标时段内目标企业的高频被叫号码占比的计算公式为：

上式中，ΔNE为在目标时段内该目标企业的所有被叫号码数量，ΔNE₀为在目标时段内该目标企业的高频被叫号码数量，高频被叫号码判定方法如下：统计在目标时段内被叫的通话次数，当通话次数超过NUM_max3则标记为高频被叫号码，经大量线上数据统计分析，该阈值NUM_max3＝20对高频被叫占比指标的计算取得最优。

7、在目标时段内目标企业的高频被叫中间号占比的计算公式为：

上式中，ΔNM为在目标时段内该目标企业的所有中间号数量，ΔNM₀为在目标时段内该目标企业的高频被叫中间号数量，高频被叫中间号判定方法如下：统计中间号在目标时段内的被叫次数，当被叫次数超过NUM_max4则标记为高频被叫中间号，经大量线上数据统计分析，该阈值NUM_max4＝200对高频被叫中间号占比指标的计算取得最优。

8、在目标时段内目标企业的高频号显中间号占比的计算公式为：

上式中，ΔNM为在目标时段内该目标企业的所有中间号数量，ΔNM₁为在目标时段内该目标企业的高频号显中间号数量，高频号显中间号判定方法如下：统计中间号在目标时段内作为号显的次数，当作为号显的次数超过NUM_max5则标记为高频号显中间号，经大量线上数据统计分析，该阈值NUM_max5＝200对高频号显中间号占比指标的计算取得最优。

9、在目标时段内目标企业的主叫非手机号占比的计算公式为：

上式中，ΔC为在目标时段内该目标企业的所有通话数量，ΔNR₂为在目标时段内该目标企业的主叫真实号码不为手机号的通话数量，也可以理解为，主叫真实号码为座机、固定电话或其他类型的电话号码而非手机号的通话数量，这里主要是考虑到大多营销外呼的诈骗电话都是固话所拨打的。

10、在目标时段内目标企业的百分百主叫号码占比的计算公式为：

上式中，ΔNR为在目标时段内该目标企业的所有主叫号码数量，ΔNE为在目标时段内该目标企业的所有被叫号码数量，ΔNR₃为在目标时段内该目标企业只做主叫的真实号码数量。

11、在目标时段内目标企业的百分百被叫号码占比的计算公式为：

上式中，ΔNR为在目标时段内该目标企业的所有主叫号码数量，ΔNE为在目标时段内该目标企业的所有被叫号码数量，ΔNE₁为在目标时段内该目标企业只做被叫的真实号码数量。

12、在目标时段内目标企业的短时订单占比的计算公式为：

上式中，ΔC为在目标时段内该目标企业的所有通话数量，ΔS为在目标时段内该目标企业的企业绑定时长小于TIM_max的订单数量。经大量线上数据统计分析，该阈值TIM_max＝10s对短时订单占比指标的计算取得最优。其中，中间号为通话双方进行通话绑定的信息，当A号码通话中间号X号码打电话给B号码，AXB就形成了一条订单信息，这条订单是具有有效期的，其有效期即为企业绑定时长。

13、在目标时段内目标企业的回拨订单占比的计算公式为：

上式中，ΔC为在目标时段内该目标企业的所有通话数量，ΔCB产生回拨的订单量，当一个绑定关系AXB，既存在A打X的话单，又存在X打A是话单，则判断为回拨订单。

对上述收集到的目标企业在目标时段的通话数据进行处理分析，获取目标企业在上述13个通话指标下各自对应的指标值。

不难理解的，若与本方案的方案构思相同，但只取本方案所说的13个通话指标中的某几个通话指标进行企业健康度的判定的方案，也落入本方案的保护范围。

S102，针对任一通话指标，获取其对应的指标值所属的目标指标区间，以及确定目标指标区间所对应的指标健康等级。

针对每个通话指标，为其设置多个指标区间，每个指标区间都有其对应的指标健康等级。比如说，可设置4个指标区间分别对应指标健康等级的优良中差，针对任一通话指标，将其对应的指标值所属的指标区间作为目标指标区间，并确定该目标指标区间所对应的指标健康等级，将该指标健康等级作为该通话指标对应的指标健康等级。

S103，获取在目标时段下每个通话指标对应的目标权重。

本申请中，在不同的时段下，每个通话指标对应的权重可能不同，本申请中，通过查询预设的候选时段与候选通话指标权重集之间的映射关系，确定在目标时段下每个通话指标对应的目标权重。其中，候选通话指标权重集中包括每个通话指标的权重。

S104，根据每个通话指标对应的目标权重、每个通话指标对应的指标健康等级以及每个指标健康等级对应的等级分值，获取目标企业对应的企业健康度，企业健康度用于描述目标企业的通话风险程度。

获取由各个通话指标的指标健康等级构成的指标矩阵D，获取每个通话指标对应的目标权重组成的目标通话指标权重集向量M，获取每个指标健康等级对应的等级分值向量P，则目标企业对应的企业健康度C＝W×D×P^T。

根据企业健康度，设定不同的企业健康度范围或等级。例如，可以将企业健康度划分为优秀、良好、一般和风险等级。

本申请实施例提出了一种基于通话数据的企业风险度分析方法，通过收集目标企业在目标时段的通话数据，并对通话数据进行处理分析，获取目标企业在每个通话指标下对应的指标值；针对任一通话指标，获取其对应的指标值所属的目标指标区间，以及确定目标指标区间所对应的指标健康等级；获取在目标时段下每个通话指标对应的目标权重；根据每个通话指标对应的目标权重、每个通话指标对应的指标健康等级以及每个指标健康等级对应的等级分值，获取目标企业对应的企业健康度，企业健康度用于描述目标企业的通话风险程度。本申请通过对目标企业的通话数据进行处理和分析，结合目标指标区间、指标健康等级和权重，最终得出企业健康度，并能够量化和评估该企业的通话风险，在系统层面尽早主动发现异常并预警，以加强对企业的管控，及时进行人工干预或进行业务下线，对打击和减少行业诈骗具有积极作用。

可选的，为确保所确定的通话指标真实可靠地反映目标企业的情况，在上述确定目标企业对应的多个通话指标之后，还需要对所确定的通话指标进行有效性验证。

具体的：收集健康样本企业对应的通话数据作为第二样本通话数据，以及，收集风险样本企业对应的通话数据作为第三样本通话数据。基于第二样本通话数据和第三样本通话数据，结合朴素贝叶斯分类方法，对多个通话指标进行有效性验证。

图2是本申请示出的朴素贝叶斯分类模型的示意图，如图2所示，具体的：假设D＝{A₁,A₂,...,A₁₃,C}为企业数据样本集，其中，A₁到A₁₃分别为企业的十三个指标值，类别C的取值c₁＝1表示企业健康，c₂＝0表示其企业不健康。令a_i(j＝1,2,...,n)为指标A_j的具体取值，那么实例X＝{a₁,a₂,...,a₁₃}属于类别c_i的概率由贝叶斯公式可表示为

＝αP(a₁,a₂,...,a₁₃|c_i)P(c_i)

朴素贝叶斯假设实例X各指标间相互独立，根据概率的乘法定理，上式可转化为

取线上健康样本企业对应的通话数据作为第二样本通话数据，以及，收集风险样本企业对应的通话数据作为第三样本通话数据，根据上述公式计算在每个类变量c_i在该企业样本数据下的后验概率P(c_i|X)，若该概率大于0.5说明该企业可判断为类别c_i，可证明这十三个企业指标能有效地对企业健康情况进行评价。

进一步的，图3是本申请示出的一种获取在目标时段下每个通话指标对应的目标权重的示例性实施方式的示意图，如图3所示，获取在目标时段下每个通话指标对应的目标权重，包括以下步骤：

S301，获取预先储存的候选时段与候选通话指标权重集之间的映射关系，候选通话指标权重集中包括每个通话指标的权重。

其中，候选时段与候选通话指标权重集之间的映射关系的获取方法，包括以下步骤：

S3011，收集多个样本企业对应的第一样本通话数据，并根据第一样本通话数据，获取每个通话指标对应的第一权重。

可选的，基于熵权法对第一样本通话数据进行分析，获取每个通话指标对应的第一权重，以更客观地判断指标特征对整体健康度的影响，减少人为主观的判定。具体的：假设给了13个通话指标：

X₁,X₂,...,X₁₃

其中：

X_i＝{x₁,x₂,...,x_n}

假设对各通话指标标准化后的值为：

Y₁,Y₂,...,Y₁₃

那么：

根据信息熵定义求得信息熵为：

其中：

通过信息熵可计算各通话指标的权重：

其中，这里k指的是指标个数，即k＝13。

将上述通过信息熵计算的各通话指标的权重作为每个通话指标对应的第一权重。

S3012，基于样本企业的业务数据，将一天划分为多个候选时段。

由于企业业务量在一天的时间范围内呈现出的业务曲线变化较大，在不同阶段不同通话指标层对健康度的影响程度不同，本申请中，基于样本企业的业务数据，将一天划分为多个候选时段，并基于所有通话指标，构建通话指标层，其中，每个通话指标层包括至少一个通话指标。

图4是本申请示出的上述13个通话指标为例构建的3个通话指标层的示意图，如图4所示，3个通话指标层分别为主被叫健康度通话指标层K1、中间号健康度通话指标层K2和通话健康度通话指标层K3，主被叫健康度通话指标层K1包括高频主叫号码占比、主叫非手机号占比、高频被叫号码占比、百分百主叫号码占比和百分百被叫号码占比；中间号健康度通话指标层K2包括同主叫同中间号的主叫号码占比、高频被叫中间号占比和高频号显中间号占比；通话健康度通话指标层K3包括无效通话率、通话接通率、平均通话时长、短时订单占比、回拨订单占比。

S3013，针对每个候选时段，根据处于该候选时段内的第一样本通话数据，获取每个通话指标层对应的第二权重。

具体的，对处于该候选时段内的第一样本通话数据进行分析，获取每个通话指标层的重要程度；对通话指标层的重要程度进行两两分析，构建R-K1、K2、K3对应的判断矩阵，如表1所示。

表1R-K1、K2、K3的判断矩阵

R	K₁	K₂	K₃
				K₁	k₁₁	k₁₂	k₁₃
K₂	k₂₁	k₂₂	k₂₃
				K₃	k₃₁	k₃₂	k₃₃

判断矩阵中数字的取值见判断尺度表(表2)，若K_i和K_j同样重要，则k_ij＝1，k_ji＝1；

若K_i比K_j稍微重要，则k_ij＝5，k_ji＝1/5，以此类推构造出判断矩阵。

表2判断尺度表

取值	说明
		1	A和B同样重要
5	A比B稍微重要
		10	A比B重要得多
2、3、4、6、7、8	介于以上判断尺度之间

基于判断矩阵，计算判断矩阵K每行中所有元素的乘积

计算m_i的n次方根：

对向量进行归一化处理：

则归一化之后的W_i＝{W₁,W₂,W₃}即为计算所得的3个通话指标层的权重向量，由此确定每个通话指标层对应的第二权重。

S3014，针对每个候选时段，基于第一权重和第二权重，确定在候选时段下每个通话指标对应的权重。

具体的，针对每个通话指标，将该通话指标对应的第一权重与该通话指标所属的通话指标层对应的第二权重的乘积，作为该通话指标最终对应的权重。

并根据每个候选时段与在候选时段下每个通话指标对应的权重的关系，构建候选时段与候选通话指标权重集之间的映射关系，并将该映射关系进行储存以方便后续查询。

S302，根据目标时段，查询映射关系，获取与目标时段相匹配的目标候选时段。

S303，将目标候选时段对应的候选通话指标权重集作为目标候选通话指标权重集，并将目标候选通话指标权重集所包含的每个通话指标的权重作为在目标时段下每个通话指标对应的目标权重。

本申请实施例通过收集样本企业的通话数据，结合多时段划分和细分通话指标权重，该方案能够实现个性化权重设定、全面分析不同时段的通话数据、提供定制化的分析和决策支持。

图5是本申请示出的一种基于通话数据的企业风险度分析方法的示例性实施方式的整体流程示意图，如图5所示，该基于通话数据的企业风险度分析方法，包括以下步骤：

S501，收集目标企业在目标时段的通话数据，并对通话数据进行处理分析，获取目标企业在每个通话指标下对应的指标值。

关于步骤S501的具体实现方式，可参照上述实施例中相关部分的具体介绍，在此不再进行赘述。

S502，针对任一通话指标，获取该通话指标对应的合格参考值与预设标准差。

示例性的，假设主叫非手机号占比的合格参考值为5％，预设标准差为1％。

示例性的，假设平均通话时长的合格参考值为15s，预设标准差为2s。

其中，合格参考值与预设标准差可基于大量线上样本分析获得或者自定义设置。

S503，基于合格参考值与预设标准差，生成多个候选指标区间。

表3为候选指标区间与指标健康等级的综合对应表，其中，T为对应指标的合格参考值，σ为对应指标的预设标准差。

表3指标区间与指标健康等级的对应表

指标区间	对应层级
		T～T±2σ	优
T～T±σ	良
		T～T±σ	差
T～T±2σ	危

示例性的，假设主叫非手机号占比的合格参考值为5％，预设标准差为1％，占比越大越危险，则判断主叫非手机号占比处于3％～4％为优，处于4％～5％为良，处于5％～6％为优，处于6％以上为危险。

示例性的，假设平均通话时长的合格参考值为15s，预设标准差为2s，平均时长越小越危险，则判断平均通话时长处于15s-17s为良，处于13-15s为差。

即，当指标值越大越好时，T+标准差为良，当指标越大越不好时，T+标准差为差。基于表3，生成各个通话指标各自对应的指标区间与指标健康等级的对应表。

S504，将该通话指标对应的指标值与每个候选指标区间进行对比，将指标值所属的候选指标区间作为目标指标区间。

针对任一通话指标，将该通话指标对应的指标值与该通话指标对应的每个候选指标区间进行对比，将指标值所属的候选指标区间作为目标指标区间。

S505，确定目标指标区间所对应的指标健康等级。

确定通话指标的指标值对应的目标指标区间之后，查询该通话指标对应的指标区间与指标健康等级的对应表，获取该通话指标对应的指标健康等级。

S506，获取预先储存的候选时段与候选通话指标权重集之间的映射关系，候选通话指标权重集中包括每个通话指标的权重。

S507，根据目标时段，查询映射关系，获取与目标时段相匹配的目标候选时段。

S508，将目标候选时段对应的候选通话指标权重集作为目标候选通话指标权重集，并将目标候选通话指标权重集所包含的每个通话指标的权重作为在目标时段下每个通话指标对应的目标权重。

关于步骤S506～S508的具体实现方式，可参照上述实施例中相关部分的具体介绍，在此不再进行赘述。

S509，根据每个通话指标对应的目标权重、每个通话指标对应的指标健康等级以及每个指标健康等级对应的等级分值，获取目标企业对应的企业健康度，企业健康度用于描述目标企业的通话风险程度。

指标健康等级集为[优，良，差，危]，对指标健康等级集的[优，良，差，危]分别赋值相对应等级分值P＝[1 0.7 0.5 0.25]，由此获取由各个通话指标的指标健康等级构成的指标矩阵D，获取每个通话指标对应的目标权重组成的目标通话指标权重集向量M，获取每个指标健康等级对应的等级分值向量P，则目标企业对应的企业健康度C＝W×D×P^T。

S510，对多个目标企业各自对应的企业健康度进行排序。

S511，基于排序后生成的排序结果生成企业风险榜单。

基于排序后生成的企业健康度排序结果，生成企业风险榜单。企业风险榜单可以根据企业的健康度得分来确定。通常，得分较低的企业可能面临较高的风险，而得分较高的企业则相对较为稳定。可以将每个企业的得分与其相应的排名一同呈现，以便更清楚地了解企业的风险程度。同时，还可以提供详细的数据和指标信息，以便进一步分析和评估企业的风险因素。

本申请实施例通过对目标企业的通话数据进行处理和分析，结合目标指标区间、指标健康等级和权重，最终得出企业健康度，并能够量化和评估该企业的通话风险，在系统层面尽早主动发现异常并预警，以加强对企业的管控，及时进行人工干预或进行业务下线，对打击和减少行业诈骗具有积极作用。

图6是本申请示出的一种基于通话数据的企业风险度分析装置的示意图，如图6所示，该基于通话数据的企业风险度分析装置600，包括第一获取模块601、第二获取模块602、第三获取模块603和风险分析模块604，其中：

第一获取模块601，用于收集目标企业在目标时段的通话数据，并对通话数据进行处理分析，获取目标企业在每个通话指标下对应的指标值；

第二获取模块602，用于针对任一通话指标，获取其对应的指标值所属的目标指标区间，以及确定目标指标区间所对应的指标健康等级；

第三获取模块603，用于获取在目标时段下每个通话指标对应的目标权重；

风险分析模块604，用于根据每个通话指标对应的目标权重、每个通话指标对应的指标健康等级以及每个指标健康等级对应的等级分值，获取目标企业对应的企业健康度，企业健康度用于描述目标企业的通话风险程度。

本装置通过对目标企业的通话数据进行处理和分析，结合目标指标区间、指标健康等级和权重，最终得出企业健康度，并能够量化和评估该企业的通话风险，在系统层面尽早主动发现异常并预警，以加强对企业的管控，及时进行人工干预或进行业务下线，对打击和减少行业诈骗具有积极作用。

进一步的，第三获取模块603，还用于：获取预先储存的候选时段与候选通话指标权重集之间的映射关系，候选通话指标权重集中包括每个通话指标的权重；根据目标时段，查询映射关系，获取与目标时段相匹配的目标候选时段将目标候选时段对应的候选通话指标权重集作为目标候选通话指标权重集，并将目标候选通话指标权重集所包含的每个通话指标的权重作为在目标时段下每个通话指标对应的目标权重。

进一步的，基于通话数据的企业风险度分析装置600还包括映射关系获取模块605，映射关系获取模块605，用于：收集多个样本企业对应的第一样本通话数据，并根据第一样本通话数据，获取每个通话指标对应的第一权重；基于样本企业的业务数据，将一天划分为多个候选时段；针对每个候选时段，根据处于该候选时段内的第一样本通话数据，获取每个通话指标层对应的第二权重，其中，每个通话指标层包括至少一个通话指标；针对每个候选时段，基于第一权重和第二权重，确定在候选时段下每个通话指标对应的权重，并构建候选时段与候选通话指标权重集之间的映射关系。

进一步的，映射关系获取模块605，还用于：对处于该候选时段内的第一样本通话数据进行分析，获取每个通话指标层的重要程度；对通话指标层的重要程度进行两两分析，构造通话指标层对应的判断矩阵；基于判断矩阵，确定每个通话指标层对应的第二权重。

进一步的，第二获取模块602，还用于：针对任一通话指标，获取该通话指标对应的合格参考值与预设标准差；基于合格参考值与预设标准差，生成多个候选指标区间；将该通话指标对应的指标值与每个候选指标区间进行对比，将指标值所属的候选指标区间作为目标指标区间。

进一步的，映射关系获取模块605，还用于：基于熵权法对第一样本通话数据进行分析，获取每个通话指标对应的第一权重。

进一步的，基于通话数据的企业风险度分析装置600还包括：排序模块606，用于对多个目标企业各自对应的企业健康度进行排序；榜单生成模块607，用于基于排序后生成的排序结果生成企业风险榜单。

进一步的，基于通话数据的企业风险度分析装置600还包括：通话指标确定模块608，用于确定目标企业对应的多个通话指标。

进一步的，通话指标包括无效通话率、通话接通率、平均通话时长、高频主叫号码占比、同主叫同中间号的主叫号码占比、高频被叫号码占比、高频被叫中间号占比、高频号显中间号占比、主叫非手机号占比、百分百主叫号码占比、百分百被叫号码占比、短时订单占比、回拨订单占比。

进一步的，通话指标确定模块608，还用于：收集健康样本企业对应的第二样本通话数据以及风险样本企业对应的第三样本通话数据；基于第二样本通话数据和第三样本通话数据，结合朴素贝叶斯分类方法，对多个通话指标进行有效性验证。

为了实现上述实施例，本申请实施例还提出一种电子设备700，如图7所示，该电子设备700包括：处理器701和处理器通信连接的存储器702，存储器702存储有可被至少一个处理器执行的指令，指令被至少一个处理器701执行，以实现如上述实施例所示的基于通话数据的企业风险度分析方法。

为了实现上述实施例，本申请实施例还提出一种存储有计算机指令的非瞬时计算机可读存储介质，其中，计算机指令用于使计算机实现如上述实施例所示的基于通话数据的企业风险度分析方法。

为了实现上述实施例，本申请实施例还提出一种计算机程序产品，包括计算机程序，计算机程序在被处理器执行时实现如上述实施例所示的基于通话数据的企业风险度分析方法。

在本申请的描述中，需要理解的是，术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”、“顺时针”、“逆时针”、“轴向”、“径向”、“周向”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本申请和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本申请的限制。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本申请的描述中，“多个”的含义是两个或两个以上，除非另有明确具体的限定。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

尽管上面已经示出和描述了本申请的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本申请的限制，本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims

1.一种基于通话数据的企业风险度分析方法，其特征在于，包括：

收集目标企业在目标时段的通话数据，并对所述通话数据进行处理分析，获取所述目标企业在每个通话指标下对应的指标值；

针对任一所述通话指标，获取其对应的指标值所属的目标指标区间，以及确定所述目标指标区间所对应的指标健康等级；

获取在所述目标时段下每个所述通话指标对应的目标权重；

根据每个所述通话指标对应的所述目标权重、每个所述通话指标对应的所述指标健康等级以及每个所述指标健康等级对应的等级分值，获取所述目标企业对应的企业健康度，所述企业健康度用于描述所述目标企业的通话风险程度。

2.根据权利要求1所述的方法，其特征在于，所述获取在所述目标时段下每个所述通话指标对应的目标权重，包括：

获取预先储存的候选时段与候选通话指标权重集之间的映射关系，所述候选通话指标权重集中包括每个通话指标的权重；

根据所述目标时段，查询所述映射关系，获取与所述目标时段相匹配的目标候选时段；

将所述目标候选时段对应的候选通话指标权重集作为目标候选通话指标权重集，并将所述目标候选通话指标权重集所包含的每个通话指标的权重作为在所述目标时段下每个所述通话指标对应的目标权重。

3.根据权利要求2所述的方法，其特征在于，所述候选时段与候选通话指标权重集之间的映射关系的获取方法，包括：

收集多个样本企业对应的第一样本通话数据，并根据所述第一样本通话数据，获取每个所述通话指标对应的第一权重；

基于所述样本企业的业务数据，将一天划分为多个候选时段；

针对每个所述候选时段，根据处于该候选时段内的第一样本通话数据，获取每个通话指标层对应的第二权重，其中，每个所述通话指标层包括至少一个所述通话指标；

针对每个所述候选时段，基于所述第一权重和所述第二权重，确定在所述候选时段下每个所述通话指标对应的权重，并构建候选时段与候选通话指标权重集之间的映射关系。

4.根据权利要求3所述的方法，其特征在于，所述根据处于该候选时段内的第一样本通话数据，获取每个通话指标层对应的第二权重，包括：

对处于该候选时段内的第一样本通话数据进行分析，获取每个所述通话指标层的重要程度；

对所述通话指标层的重要程度进行两两分析，构造所述通话指标层对应的判断矩阵；

基于所述判断矩阵，确定每个所述通话指标层对应的所述第二权重。

5.根据权利要求1或4所述的方法，其特征在于，所述针对任一所述通话指标，获取其对应的指标值所属的目标指标区间，包括：

针对任一所述通话指标，获取该通话指标对应的合格参考值与预设标准差；

基于所述合格参考值与所述预设标准差，生成多个候选指标区间；

将该通话指标对应的指标值与每个所述候选指标区间进行对比，将所述指标值所属的候选指标区间作为所述目标指标区间。

6.根据权利要求3所述的方法，其特征在于，所述根据所述第一样本通话数据，获取每个所述通话指标对应的第一权重，包括：

基于熵权法对所述第一样本通话数据进行分析，获取每个所述通话指标对应的第一权重。

7.根据权利要求5所述的方法，其特征在于，所述获取所述目标企业对应的企业健康度之后，还包括：

对多个目标企业各自对应的所述企业健康度进行排序；

基于排序后生成的排序结果生成企业风险榜单。

8.根据权利要求5所述的方法，其特征在于，所述收集目标企业在目标时段的通话数据之前，还包括：

确定所述目标企业对应的多个通话指标。

9.根据权利要求8所述的方法，其特征在于，所述通话指标包括无效通话率、通话接通率、平均通话时长、高频主叫号码占比、同主叫同中间号的主叫号码占比、高频被叫号码占比、高频被叫中间号占比、高频号显中间号占比、主叫非手机号占比、百分百主叫号码占比、百分百被叫号码占比、短时订单占比、回拨订单占比。

10.根据权利要求8或9所述的方法，其特征在于，所述确定所述目标企业对应的多个通话指标之后，还包括：

收集健康样本企业对应的第二样本通话数据以及风险样本企业对应的第三样本通话数据；

基于所述第二样本通话数据和所述第三样本通话数据，结合朴素贝叶斯分类方法，对所述多个通话指标进行有效性验证。

11.一种基于通话数据的企业风险度分析装置，其特征在于，包括：

第一获取模块，用于收集目标企业在目标时段的通话数据，并对所述通话数据进行处理分析，获取所述目标企业在每个通话指标下对应的指标值；

第二获取模块，用于针对任一所述通话指标，获取其对应的指标值所属的目标指标区间，以及确定所述目标指标区间所对应的指标健康等级；

第三获取模块，用于获取在所述目标时段下每个所述通话指标对应的目标权重；

风险分析模块，用于根据每个所述通话指标对应的所述目标权重、每个所述通话指标对应的所述指标健康等级以及每个所述指标健康等级对应的等级分值，获取所述目标企业对应的企业健康度，所述企业健康度用于描述所述目标企业的通话风险程度。

12.根据权利要求11所述的装置，其特征在于，所述第三获取模块，还用于：

13.根据权利要求12所述的装置，其特征在于，所述装置还包括映射关系获取模块，所述映射关系获取模块，用于：

14.根据权利要求13所述的装置，其特征在于，所述映射关系获取模块，还用于：

15.根据权利要求11或14所述的装置，其特征在于，所述第二获取模块，还用于：

16.根据权利要求13所述的装置，其特征在于，所述映射关系获取模块，还用于：

17.根据权利要求15所述的装置，其特征在于，所述装置还包括：

排序模块，用于对多个目标企业各自对应的所述企业健康度进行排序；

榜单生成模块，用于基于排序后生成的排序结果生成企业风险榜单。

18.根据权利要求15所述的装置，其特征在于，所述装置还包括：

通话指标确定模块，用于确定所述目标企业对应的多个通话指标。

19.根据权利要求18所述的装置，其特征在于，所述通话指标包括无效通话率、通话接通率、平均通话时长、高频主叫号码占比、同主叫同中间号的主叫号码占比、高频被叫号码占比、高频被叫中间号占比、高频号显中间号占比、主叫非手机号占比、百分百主叫号码占比、百分百被叫号码占比、短时订单占比、回拨订单占比。

20.根据权利要求18或19所述的装置，其特征在于，所述通话指标确定模块，还用于：

21.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-10中任一项所述的方法。

22.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1-10中任一项所述的方法。

23.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1-10中任一项所述的步骤。