CN112399021A

CN112399021A - 语音呼叫数据处理方法、装置、计算机设备及存储介质

Info

Publication number: CN112399021A
Application number: CN202011209871.6A
Authority: CN
Inventors: 李海翔
Original assignee: Ping An Life Insurance Company of China Ltd
Current assignee: Ping An Life Insurance Company of China Ltd
Priority date: 2020-11-03
Filing date: 2020-11-03
Publication date: 2021-02-23
Anticipated expiration: 2040-11-03
Also published as: CN112399021B

Abstract

本发明公开一种语音呼叫数据处理方法、装置、计算机设备及存储介质。该方法包括：获取待呼叫客户的至少一个待呼叫数据，待呼叫数据包括N个目标特征对应的待呼特征值；基于N个目标特征对应的待呼特征值查询呼叫信息记录表，确定待呼叫数据所属的呼叫特征集合；根据呼叫特征集合对应的Y个第二特征集合的呼叫优先系数和呼叫时机特征对应的分组特征值，确定待呼叫数据对应的目标呼叫时段；在目标呼叫时段，对待呼叫数据对应的待呼叫客户进行呼叫，获取待呼叫数据对应的呼叫结果数据；根据呼叫结果数据，对呼叫特征集合的呼叫优先系数进行更新，更新呼叫信息记录表。该方法可保障呼叫时段配置的时效性和有效性，有助于提高语音呼叫的呼叫接通率。

Description

语音呼叫数据处理方法、装置、计算机设备及存储介质

技术领域

本发明涉及数据处理技术领域，尤其涉及一种语音呼叫数据处理方法、装置、计算机设备及存储介质。

背景技术

语音呼叫系统是采用人工智能技术实现语音呼叫的系统，是采用机器人替代人工向客户拨打呼叫电话所形成的系统。一般来说，语音呼叫系统安排呼叫任务时，需对历史呼叫数据进行特征分析处理，确定何时呼叫接通率最高，以便制定合理的呼叫策略。现有技术中，一般采用统计分析方法(如透视表分析)，通过人工调整特征的特征分箱阈值进行统计，对统计结果进行数据可视化，从而确定黄金分割点，再利用黄金分割点调整呼叫策略。该黄金分割点为呼叫接通率最高的特征分箱阈值。这种统计分析方法存在效率低和有效性低等问题。

发明内容

本发明实施例提供一种语音呼叫数据处理方法、装置、计算机设备及存储介质，以解决采用统计分析方法分析确定呼叫策略存在的效率低和有效性低的问题。

一种语音呼叫数据处理方法，包括：

获取待呼叫客户的至少一个待呼叫数据，所述待呼叫数据包括N个目标特征对应的待呼特征值；

基于N个所述目标特征对应的待呼特征值查询系统数据库中存储的呼叫信息记录表，确定每一所述待呼叫数据所属的第一特征集合为呼叫特征集合；

根据所述呼叫特征集合对应的Y个第二特征集合的呼叫优先系数和呼叫时机特征对应的分组特征值，确定所述待呼叫数据对应的目标呼叫时段，其中，Y≧2；

在所述待呼叫数据对应的目标呼叫时段，对所述待呼叫数据对应的待呼叫客户进行呼叫，获取所述待呼叫数据对应的呼叫结果数据；

根据所述待呼叫数据对应的呼叫结果数据，对所述呼叫特征集合的呼叫优先系数进行更新，更新所述系统数据库中存储的呼叫信息记录表。

一种语音呼叫数据处理装置，包括：

待呼叫数据获取模块，用于获取待呼叫客户的至少一个待呼叫数据，所述待呼叫数据包括N个目标特征对应的待呼特征值；

呼叫特征集合确定模块，用于基于N个所述目标特征对应的待呼特征值查询系统数据库中存储的呼叫信息记录表，确定每一所述待呼叫数据所属的第一特征集合为呼叫特征集合；

目标呼叫时段获取模块，用于根据所述呼叫特征集合对应的Y个第二特征集合的呼叫优先系数和呼叫时机特征对应的分组特征值，确定所述待呼叫数据对应的目标呼叫时段，其中，Y≧2；

呼叫结果数据获取模块，用于在所述待呼叫数据对应的目标呼叫时段，对所述待呼叫数据对应的待呼叫客户进行呼叫，获取所述待呼叫数据对应的呼叫结果数据；

呼叫信息记录表更新模块，用于根据所述待呼叫数据对应的呼叫结果数据，对所述呼叫特征集合的呼叫优先系数进行更新，更新所述系统数据库中存储的呼叫信息记录表。

一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述语音呼叫数据处理方法。

一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述语音呼叫数据处理方法。

上述语音呼叫数据处理方法、装置、计算机设备及存储介质，根据待呼叫数据中N个目标特征对应的待呼特征值查询呼叫信息记录表，可快速确定其所属的呼叫特征集合，保证呼叫策略调整的时效性，节省处理耗时；再所述呼叫特征集合对应的Y个所述第二特征集合的呼叫优先系数和呼叫时机特征对应的分组特征值，确定所述待呼叫数据对应的目标呼叫时段，以保证在目标呼叫时段对待呼叫数据对应的待呼叫客户进行呼叫的呼叫接通率，有助于提高呼叫策略的有效性；最后，需基于待呼叫数据对应的呼叫结果数据，实时更新呼叫信息记录表中的呼叫优先系数，以保证后续呼叫策略调整的实时性和准确性。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明一实施例中语音呼叫数据处理方法的一应用环境示意图；

图2是本发明一实施例中语音呼叫数据处理方法的一流程图；

图3是本发明一实施例中语音呼叫数据处理方法的另一流程图；

图4是本发明一实施例中语音呼叫数据处理方法的另一流程图；

图5是本发明一实施例中语音呼叫数据处理方法的另一流程图；

图6是本发明一实施例中语音呼叫数据处理方法的另一流程图；

图7是本发明一实施例中语音呼叫数据处理方法的另一流程图；

图8是本发明一实施例中语音呼叫数据处理方法的另一流程图；

图9是本发明一实施例中语音呼叫数据处理装置的一示意图；

图10是本发明一实施例中计算机设备的一示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明实施例提供的语音呼叫数据处理方法，该语音呼叫数据处理方法可应用如图1所示的应用环境中。具体地，该语音呼叫数据处理方法应用在语音呼叫系统中，该语音呼叫系统包括如图1所示的客户端和服务器，客户端与服务器通过网络进行通信，用于实现对历史呼叫数据进行分析处理，以确定其所属的呼叫特征集合和对应的呼叫优先系数，根据呼叫优先系数确定目标呼叫时段，以便在目标呼叫时段进行呼叫，提高呼叫成功率；并根据呼叫结果数据，实时更新呼叫信息记录表，以保障呼叫策略调整的实时性和准确性。其中，客户端又称为用户端，是指与服务器相对应,为客户提供本地服务的程序。客户端可安装在但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备上。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一实施例中，提供一种语音呼叫数据处理方法，以该方法应用在图1所示的服务器为例进行说明，该方法具体包括如下步骤：

S201：获取待呼叫客户的至少一个待呼叫数据，待呼叫数据包括N个目标特征对应的待呼特征值。

其中，待呼叫数据是指需要呼叫的数据，即需要进行呼叫策略调整以确定呼叫时段的数据。目标特征是预先分析确定的分类条件对应的特征，该目标特征为具有可控性且与呼叫结果关联性较强的用户画像特征和呼叫目的特征等特征中的至少一个。待呼特征值是指待呼叫数据中与目标特征相对应的具体数值。在目标特征为用户画像特征和呼叫目的特征中的至少一个时，将其具体数值确定为待呼特征值。

S202：基于N个目标特征对应的待呼特征值查询系统数据库中存储的呼叫信息记录表，确定每一待呼叫数据所属的第一特征集合为呼叫特征集合。

其中，呼叫信息记录表是在系统当前时间之前对历史呼叫数据进行分组统计分析所确定的信息表。在呼叫信息记录表中存储多个分组特征集合以及每一分组特征集合对应的分组特征值、历史呼叫量、历史接通率和呼叫优先系数等内容。分组特征集合是指基于呼叫时机特征对应的分组特征值和N个目标特征值对应的分组特征值所形成的组合。其中，分组特征值是指预先基于分组特征进行分组划分的特征值或特征值范围,该分组特征值可由用户根据实际需要自主设置。历史呼叫量是指归属于某一分组特征集合中的历史呼叫数据的数据量。历史接通率是指归属于某一分组特征集合的所有历史呼叫数据中，携带呼叫成功标识的数据量占历史呼叫量的比率。呼叫优先系数是预先统计分析确定的用于反映某一分组特征集合的呼叫优先级的系数。

作为一示例，服务器根据每一待呼叫数据中N个目标特征对应的待呼特征值，将N个目标特征对应的待呼特征值，分别与N个目标特征对应的分组特征值进行匹配处理，将所有目标特征对应的待呼特征值均匹配的分组特征值对应的分组特征集合确定为呼叫特征集合，具体将所有目标特征对应的待呼特征值均匹配的分组特征值对应的第一特征集合作为呼叫特征集合。

S203：根据呼叫特征集合对应的Y个第二特征集合的呼叫优先系数和呼叫时机特征对应的分组特征值，确定待呼叫数据对应的目标呼叫时段。

由于呼叫优先系数是预先统计分析确定的用于反映某一分组特征集合的呼叫优先级的系数，呼叫优先系数越高，其对应的呼叫时段(即呼叫时机特征对应的分组特征值)进行呼叫的接通率越高，因此，服务器可基于对同一呼叫特征集合对应的Y个第二特征集合的呼叫优先系数，即同一第一依据呼叫优先系数的大小，将较大的呼叫优先系数对应的第二特征集合的呼叫时机特征对应的分组特征值，确定待呼叫数据对应的目标呼叫时段，从而保障在目标呼叫时段对待呼叫数据对应的待呼叫客户进行呼叫的接通率，以实现最优化调整。

S204：在待呼叫数据对应的目标呼叫时段，对待呼叫数据对应的待呼叫客户进行呼叫，获取待呼叫数据对应的呼叫结果数据。

作为一示例，服务器控制智能机器人，在待呼叫数据对应的目标呼叫时段，对所有待呼叫数据对应的待呼叫客户进行呼叫，获取待呼叫数据对应的呼叫结果数据，该呼叫结果数据包括呼叫成功和呼叫失败两种结果。可理解地，在每一待呼叫数据的呼叫结果数据为呼叫成功时，可给该待呼叫数据携带呼叫成功标识；在每一待呼叫数据的呼叫结果数据为呼叫失败时，可给该待呼叫数据携带呼叫失败标识。

S205：根据待呼叫数据对应的呼叫结果数据，对呼叫特征集合的呼叫优先系数进行更新，更新系统数据库中存储的呼叫信息记录表。

由于系统数据库中存储的呼叫信息记录表中包含多个分组特征集合以及每一分组特征集合对应的分组特征值、历史呼叫量、历史接通率和呼叫优先系数等，该呼叫优先系数是指根据系统当前时间之前所形成的历史呼叫数据形成的系数。在基于所有待呼叫数据进行呼叫后，可获取呼叫结果数据，此时，可根据所有待呼叫数据对应的呼叫结果数据，实时对呼叫特征集合的呼叫优先系数进行更新，更新系统数据库中存储的呼叫信息记录表。例如，若基于某一呼叫特征集合对应的所有待呼叫数据的呼叫结果数据确定其实际接通率大于历史接通率，则需调高呼叫特征集合在目标呼叫时段的呼叫优先系数；若其实际接通率不大于历史接通率，则需调低呼叫特征集合在目标呼叫时段的呼叫优先系数，以保证呼叫信息记录表的实时性，有助于提高后续进行呼叫策略调整的准确性和有效性。

本发明实施例提供的语音呼叫数据处理方法中，根据待呼叫数据中N个目标特征对应的待呼特征值查询呼叫信息记录表，可快速确定其所属的呼叫特征集合，保证呼叫策略调整的时效性，节省处理耗时；再呼叫特征集合对应的Y个第二特征集合的呼叫优先系数和呼叫时机特征对应的分组特征值，确定待呼叫数据对应的目标呼叫时段，以保证在目标呼叫时段对待呼叫数据对应的待呼叫客户进行呼叫的呼叫接通率，有助于提高呼叫策略的有效性；最后，需基于待呼叫数据对应的呼叫结果数据，实时更新呼叫信息记录表中的呼叫优先系数，以保证后续呼叫策略调整的实时性和准确性。

在一实施例中，如图3所示，步骤S203，即根据呼叫特征集合对应的Y个第二特征集合的呼叫优先系数和呼叫时机特征对应的分组特征值，确定待呼叫数据对应的目标呼叫时段，具体包括如下步骤：

S301：对呼叫特征集合对应的Y个第二特征集合的呼叫优先系数进行降序排序，获取优先级序列，将优先级序列中的第一个呼叫优先系数对应的第二特征集合，确定为初始特征集合，将初始特征集合中呼叫时机特征对应的分组特征值，确定为初始呼叫时段。

例如，呼叫信息记录表中记录的第一特征集合A、B、C和D中，第一特征集合A、B、C和D对应的呼叫优先系数分别为S(A)＝0.54、S(B)＝0.44、S(C)＝0.56和S(D)＝0.54。若呼叫时机特征的分组特征值为T1、T2、T3和T4，则依据4个呼叫时机特征对应的分组特征值可将第一特征集合A划分为四个第二特征集合A1、A2、A3和A4，第二特征集合A1、A2、A3和A4的呼叫优先系数S(A1)＝0.56、S(A2)＝0.52、S(A3)＝0.54和S(A4)＝0.46。本示例中，将待呼叫数据中的N个目标特征对应的待呼特征值与N个目标特征对应的分组特征值进行匹配处理，确定其归属于第一特征集合A，则将第一特征集合A确定为呼叫特征集合，将呼叫特征集合A所划分出的4个第二特征集合A1、A2、A3和A4的呼叫优先系数进行降序排序，将优先级序列中的第一个呼叫优先系数对应的第二特征集合，确定为初始特征集合，将初始特征集合中呼叫时机特征对应的分组特征值，确定为初始呼叫时段。例如，第二特征集合A1、A2、A3和A4的呼叫优先系数S(A1)＝0.56、S(A2)＝0.52、S(A3)＝0.54和S(A4)＝0.46时，可将第二特征集合A1确定为初始特征集合，将初始特征集合A1对应的分组特征值T1确定为初始呼叫时段，说明与待呼叫数据的N个目标特征对应的历史呼叫数据在初始呼叫时段的兼顾数据稳定性和呼叫接通率，可以理解为与待呼叫数据的用户画像相类似的历史呼叫数据在初始呼叫时段的呼叫接通率较高，因此，在初始呼叫时段对待呼叫数据对应的待呼叫客户进行呼叫，有助于保障或提高其呼叫接通率。

由于同一呼叫特征集合对应的至少两个第二特征集合的呼叫优先系数可能相同，在降序排序过程中，若至少两个呼叫优先系数相同，可以依据至少两个第二特征集合中呼叫时机特征对应的分组特征值的先后进行升序排序，即至少两个呼叫优先系数相同时，呼叫时机特征对应的分组特征值越小，则其排在优先级序列的越前面。

S302:统计同一初始呼叫时段对应的所有待呼叫数据对应的待呼数据量。

由于服务器每次接收到的待呼叫数据较多，在基于N个目标特征进行分组确定对应呼叫特征集合之后，由于每一呼叫特征集合均对应一个初始呼叫时段，若所有待呼叫数据均在同一初始呼叫时段进行呼叫，可能会导致部分呼叫资源堵塞而影响呼叫效果，因此，服务器需先统计同一初始呼叫时段对应的所有待呼叫数据对应的待呼数据量。该待呼叫数据量为需要在初始呼叫时段进行呼叫的所有待呼叫数据的数量。

作为一示例，服务器在获取到所有初始呼叫时段之后，需确定同一初始呼叫时段对应的所有呼叫特征集合，统计归属到所有呼叫特征集合中的所有待呼叫数据对应的数量，确定为初始呼叫时段对应的待呼数据量。例如，呼叫特征集合A所确定的初始呼叫时段为T1；呼叫特征集合B所确定的初始呼叫时段为T2；呼叫特征集合C所确定的初始呼叫时段为T1；呼叫特征集合D所确定的初始呼叫时段为T2；则初始呼叫时段T1对应的待呼数据量为归属到呼叫特征集合A和呼叫特征集合C的所有待呼叫数据的总和，即Sum(A)+Sum(C)；初始呼叫时段T2对应的待呼数据量为归属到呼叫特征集合B和呼叫特征集合D的所有待呼叫数据的总和，即Sum(B)+Sum(D)。

S303：若初始呼叫时段对应的待呼数据量小于初始呼叫时段对应的可呼数据量，则将初始呼叫时段确定为确定待呼叫数据对应的目标呼叫时段。

其中，初始呼叫时段对应的可呼数据量是指语音呼叫系统在初始呼叫时段可以呼叫的数量，由系统资源确定。例如，若每一初始呼叫时段T1对应的可呼叫数据为1000，则说明在此初始呼叫时段进行语音呼叫时，可以呼叫1000个而不会导致呼叫堵塞或者其他影响正常呼叫的情况出现。

作为一示例，服务器在任一初始呼叫时段对应的待呼数据量小于初始呼叫时段对应的可呼数据量时，说明语音呼叫系统在初始呼叫时段有足够的系统资源，可对所有归属于该初始呼叫时段对应的初始特征集合中的待呼叫数据对应的待呼叫客户进行呼叫，可将将初始呼叫时段确定为确定待呼叫数据对应的目标呼叫时段，以在目标呼叫时段对待呼叫数据对应的待呼叫客户进行呼叫，避免呼叫过程出现堵塞或者其他影响正常呼叫的情况，保证呼叫过程正常进行。

S304:若待呼数据量不小于初始呼叫时段对应的可呼数据量，则基于呼叫特征集合对应的呼叫优先系数，对初始呼叫时段对应的所有待呼叫数据进行排序，确定每一待呼叫数据对应的目标呼叫时段。

作为一示例，服务器在待呼数据量不小于初始呼叫时段对应的可呼数据量时，可基于呼叫特征集合对应的呼叫优先系数，对初始呼叫时段对应的待呼叫数据进行降序排序，获取数据排序顺序，将与可呼数据量相匹配的顺序在前的待呼叫数据对应的初始呼叫时段，确定为待呼叫数据对应的目标呼叫时段；更新与可呼数据量相匹配的顺序在后的所有待呼叫数据所属的呼叫特征集合对应的优先级序列，即删除优先级序列中的第一个呼叫优先系数，重复执行将优先级序列中的第一个呼叫优先系数对应的第二特征集合，确定为初始特征集合，将初始特征集合中呼叫时机特征对应的分组特征值，确定为初始呼叫时段。

例如，若每一初始呼叫时段T1对应的可呼叫数据为1000，初始呼叫时段T1对应的待呼数据量为归属到呼叫特征集合A和呼叫特征集合C的所有待呼叫数据的总和，则Sum(A)+Sum(C)＝700+800>1000，此时，需基于呼叫特征集合A和C对应的呼叫优先系数S(A)＝0.54和S(C)＝0.56，对初始呼叫时段对应的所有待呼叫数据进行排序，确定所有待呼叫数据对应的数据排序顺序，再基于待呼叫数据对应的数据排序顺序，确定待呼叫数据对应的目标呼叫时段。本示例中，由于S(C)＝0.56>S(A)＝0.54，说明呼叫特征集合C的优先级高于呼叫特征集合A的优先级，此时，可将呼叫特征集合C中所有待呼叫数据的目标呼叫时段为T1；由于1000-800＝200，此时，可从呼叫特征集合A中随机选取与剩余可用量200相匹配的待呼叫数据的目标呼叫时段确定为T1；更新剩余的呼叫特征集合对应的优先级序列，重复执行步骤S301中的将优先级序列中的第一个呼叫优先系数对应的第二特征集合，确定为初始特征集合，将初始特征集合中呼叫时机特征对应的分组特征值，确定为初始呼叫时段。例如，在更新处理之后，可将第二特征集合A3确定为初始特征集合，重复执行步骤S301，即重复执行将优先级序列中的第一个呼叫优先系数对应的第二特征集合，确定为初始特征集合，将初始特征集合中呼叫时机特征对应的分组特征值，确定为初始呼叫时段。

本实施例所提供的语音呼叫数据处理方法中，先基于同一呼叫特征集合对应的Y个呼叫优先系数确定初始特征集合和对应的初始呼叫时段，以使初始特征集合对应的初始呼叫时段的呼叫接通率较高，有助于提高对待呼叫数据对应的待呼叫客户进行呼叫的有效性；再将同一初始呼叫时段对应的待呼数据量与依据其系统资源确定的可呼数据量进行比较，在待呼数据量小于可呼数据量时，直接将初始呼叫时段确定为目标呼叫时段，以使归属于同一呼叫特征集合的所有待呼叫数据均在目标呼叫时段进行呼叫，提高呼叫有效性；在待呼数据量不小于可呼数据量时，需基于呼叫特征集合对应的呼叫优先系数，对初始呼叫时段对应的待呼叫数据进行排序，确定每一待呼叫数据对应的目标呼叫时段，以保障对待呼叫客户进行呼叫的成功率，使得呼叫策略调整具有灵活性、缩短呼叫策略制定的耗时，提高呼叫策略调整处理效率和准确性。

在一实施例中，如图4所示，步骤S205，即根据待呼叫数据对应的呼叫结果数据，对呼叫特征集合的呼叫优先系数进行更新，更新系统数据库中存储的呼叫信息记录表，包括如下步骤：

S401:根据所有待呼叫数据对应的呼叫结果数据，获取所有呼叫特征集合对应的实际呼叫量和实际接通率。

其中，呼叫特征集合对应的实际呼叫量是指对归属一呼叫特征集合对应的所有待呼叫数据对应的待呼叫客户进行实际呼叫的数量。呼叫特征集合对应的实际接通率是指对归属一呼叫特征集合对应的所有待呼叫数据对应的待呼叫客户进行实际呼叫时，确定呼叫成功的数量与实际呼叫量的实际比例。

S402:若实际呼叫量大于预设呼叫量，则基于实际接通率和呼叫信息记录表中记录的所有历史接通率，获取实际提升均值和最大提升均值。

其中，预设呼叫量是指预先设置的呼叫量，可以理解为可以进行后续调整处理的最小呼叫量。本示例中，只有实际呼叫量大于预设呼叫量时，才需执行基于实际接通率和呼叫信息记录表中记录的所有历史接通率，实际提升均值和最大提升均值以及其后续步骤，以避免实际呼叫量过少，可能会导致对呼叫优先系数进行调整的稳定性较低。

作为一示例，服务器实时获取在系统当前时间之前记录在呼叫信息记录表中，与呼叫特征集合和目标呼叫时段相匹配的所有历史接通率PR_j,1≤j≤m，PR_j表示第j个历史接通率，m为呼叫信息记录表中记录的历史接通率的数量。首先，从所有历史接通率中确定最大接通率PR_max和最小接通率PR_min；根据最大接通率PR_max和最小接通率PR_min的差值，确定最大提升均值Maxlift，即最大提升均值Maxlift＝PR_max-PR_min。接着，分别计算实际接通率NR与所有所有历史接通率PR_j的差值，再将所有差值的均值确定为实际提升均值Avglift，即实际提升均值

S403：根据最大提升均值和最大提升均值，确定调整系数，根据调整系数对呼叫特征集合对应的呼叫优先系数进行调整，获取更新的呼叫优先系数，根据更新的呼叫优先系数、实际呼叫量和实际接通率，更新呼叫信息记录表。

作为一示例，服务器先根据最大提升均值Maxlift和实际提升均值Avglift的差值，确定调整系数AR，即调整系数AR＝Maxlift-Avglift；再采用优先系数调整公式S(k)’＝S(k)*w_k±AR*w_a对调整系数和呼叫特征集合对应的呼叫优先系数进行处理，获取更新的呼叫优先系数，其中，S(k)’为更新的呼叫优先系数，S(k)为呼叫信息记录表中记录的呼叫优先系数，w_k为呼叫优先系数的权重，w_a为调整系数的权重，±取决于实际接通率与所有历史接通率的均值的大小，一般来说，若实际接通率大于所有历史接通率的均值，则取“+”；若实际接通率不大于所有历史接通率的均值，则取“-”。接着，服务器将更新的呼叫优先系数、实际呼叫量和实际接通率记录在呼叫信息记录表中，更新呼叫信息记录表。

本实施例所提供的语音呼叫数据处理方法中，根据所有待呼叫数据对应的呼叫结果数据，获取所有呼叫特征集合对应的实际呼叫量和实际接通率，对所有呼叫特征集合对应的呼叫优先系数进行调整，有助于保障呼叫信息记录表的实时性，有助于提高后续进行呼叫策略调整的准确性和有效性。

在一实施例中，如图5所示，在步骤S201之前，语音呼叫数据处理方法包括如下步骤：

S501：获取历史呼叫数据，历史呼叫数据包括呼叫结果标识、呼叫时机特征对应的历史特征值和K个原始特征对应的历史特征值，其中，K≧2。

历史呼叫数据是与历史呼叫相关的信息，即系统当前时间之前，通过语音呼叫系统向任一客户呼叫所形成的数据。每一历史呼叫数据与一数据标识相关联。

呼叫结果标识是呼叫结果相对应的标识，该呼叫结果用于反映历史呼叫是否接通。该呼叫结果标识包括呼叫成功标识和呼叫失败标识，顾名思义，呼叫成功标识是指通过语音呼叫系统向客户呼叫成功时生成的标识；相应地，呼叫失败标识是指通过语音呼叫系统向客户呼叫失败时生成的标识。

呼叫时机特征是指特征名称为呼叫时机对应的特征。该呼叫时机特征对应的历史特征值为用于反映与历史呼叫的时间相关的值，可以为历史呼叫的呼叫时间戳，也可以为历史呼叫所属的呼叫时间段。该呼叫时间戳是历史呼叫对应的时间戳，具体为通过语音呼叫系统向客户呼叫时的时间戳，由语音呼叫系统自动记录。该呼叫时间段是指系统预先划分配置的时间段，在通过语音呼叫系统向客户呼叫时，根据其呼叫时间戳确定其对应的呼叫时间段。可理解地，由于呼叫策略调整过程中，主要考虑呼叫时机与呼叫资源调度等情况，每一历史呼叫数据均应当包括与呼叫时机相关的信息，即呼叫时机特征及其历史特征值。

原始特征是用于对历史呼叫数据进行分类的特征，可以理解为原始特征的名称。K为原始特征的数量，其中，K≧2。原始特征对应的历史特征值是指历史呼叫数据中与原始特征相对应的具体数值。

本示例中，原始特征除了包括呼叫时机特征外，还可以包括用户画像特征和呼叫目的特征中的至少一个。该用户画像特征是与被呼叫客户的用户画像相关的特征，包括但不限于年龄、性别、学历、职业和收入等特征。该呼叫目的特征是与历史呼叫对应的呼叫目的相关的特征。例如，若历史呼叫是为了进行保单催收，则其呼叫目的为保单，与呼叫目的相关的特征包括但不限于保单保费、保单险种类型、保单自保件类型和缴费期限等特征。

作为一示例，服务器可从语音呼叫系统对应的系统数据库中，获取系统当前时间之前所有历史呼叫所形成的历史呼叫数据，对所有历史呼叫数据进行分析处理。一般来说，服务器获取的历史呼叫数据的数量需大于预设数量阈值，以保证后续分析结果的有效性。该预设数量阈值是预先设置的用于评估历史呼叫数据的数量是否达到有效分析所需数量的阈值。

S502：对K个原始特征对应的历史特征值进行可控性分析，从K个原始特征中确定L个可控特征，其中，2≦L≦K。

其中，可控性分析是用于分析所有历史呼叫数据对应的原始特征是否具有可控性，以实现保留可控特征，去除不可控特征的过程。可控特征是具有可控性的原始特征；相应地，不可控特征是不具有可控性的原始特征。L为可控特征的数量，其中，2≦L≦K。

本示例中的可控性是指所有历史呼叫数据中，同一原始特征对应的历史特征值具有可控性，即所有历史呼叫数据中同一原始特征对应的历史特征值的完整度达标且不存在频繁变动的情况。例如，服务器获取的历史呼叫数据的数量为10000，若10000个历史呼叫数据中的原始特征A对应的历史特征值不为空值的非空数量大于第一预设数量，则认定所有历史呼叫数据中原始特征A对应的完整度达标；若所有原始特征A对应的历史特征值在预设评估周期内发生变动的变动数量小于第二预设数量，则认定不存在频繁变动情况；因此，认定原始特征A具有可控性，为可控特征。又例如，若10000个历史呼叫数据中的原始特征B对应的历史特征值不为空值的非空数量不大于第一预设数量，则认定所有历史呼叫数据中原始特征B对应的完整度不达标，即有大于第一预设数量的历史呼叫数据中原始特征B对应的历史特征值为空值，若后续将原始特征B作为目标特征这一分组特征时，会导致无法顺利分类或者分类结果不准确，因此，认定原始特征B不具有可控性，为不可控特征。又例如，若所有原始特征C对应的历史特征值在预设评估周期内发生变动的变动数量不小于第二预设数量，即在预设评估周期内，有大于第二预设数量的历史呼叫数据中，原始特征C对应的历史特征值发生变动，因此，认定原始特征C对应的历史特征值存在频繁变动情况，即原始特征C不具有可控性，为不可控特征。

作为一示例，服务器采用可控性分析逻辑对所有历史呼叫数据中，K个原始特征对应的历史特征值进行分析，获取每一原始特征对应的可控性分析结果；若原始特征对应的可控性分析结果为具有可控性，则将原始特征确定为可控特征；若原始特征对应的可控性分析结果为不具有可控性，则将原始特征确定为不可控特征，以实现从K个原始特征中确定L个可控特征的目的，以排除不可控特征的干扰，有助于保障基于目标特征进行分组的可按性和准确性。该可控性分析逻辑为预先设置的用于进行可控性分析的处理逻辑。

S503：采用呼叫结果标识对L个可控特征对应的历史特征值进行关联性分析，从L个可控特征中确定N个目标特征，其中，2≦N≦L。

其中，关联性分析是用于分析所有历史呼叫数据对应的原始特征与呼叫结果的关联性，以保留关联性较强的目标特征的目的。该目标特征可以理解为关联性达标的可控特征。N为目标特征的数量，其中，2≦N≦L。

本示例中的关联性是指所有历史呼叫数据中，同一原始特征对应的历史特征值与呼叫结果正相关或者负相关的相关程度。例如，若某一原始特征对应的历史特征值越大，则其呼叫成功的概率越大，则正相关的关联性越强；相应地，若某一原始特征对应的历史特征值越大，则其呼叫成功的概率越小，则负相关的关联性越强。

作为一示例，服务器采用关联性分析逻辑对所有历史呼叫数据中，K个原始特征对应的历史特征值及其呼叫结果标识进行关联性分析，获取每一原始特征对应的特征关联性；从L个可控特征中选取特征关联性较高的前N个可控特征，确定为目标特征，该目标特征为后续作为历史呼叫数据的分组特征。

S504：基于呼叫时机特征、N个目标特征和呼叫结果标识，对历史呼叫数据进行分组，获取分组特征集合，并统计每一分组特征集合对应的历史呼叫量和历史接通率，分组特征集合为呼叫时机特征和N个目标特征对应的分组特征值的集合。

其中，分组特征集合是指分组特征对应的分组特征值的集合，具体为基于呼叫时机特征对应的分组特征值和N个目标特征值对应的分组特征值所形成的组合。其中，分组特征值是指预先基于分组特征进行分组划分的特征值或特征值范围,该分组特征值可由用户根据实际需要自主设置。该分组特征是指分组统计分析所需采用的用于进行分组的特征，该分组特征具体为呼叫时机特征和N个目标特征。历史呼叫量是指归属到某一分组特征集合中所有历史呼叫数据的数量。历史接通率是指归属到某一分组特征集合的所有历史呼叫数据中，携带呼叫成功标识的数量占所有数量的比率。

S505：基于每一分组特征集合对应的历史呼叫量和历史接通率，获取每一分组特征集合对应的呼叫优先系数，基于分组特征集合对应的分组特征值、历史呼叫量、历史接通率和呼叫优先系数，形成呼叫信息记录表。

其中，呼叫优先系数是预先统计分析确定的用于反映其呼叫优先级的系数。

作为一示例，服务器采用优先系数生成公式S(k)＝P1(k)*w1+P2(k)*w2对每一分组特征集合对应的历史呼叫量和历史接通率进行处理，获取每一分组特征集合对应的呼叫优先系数；其中，S(k)为第k个分组特征集合的呼叫优先系数；P1(k)为第k个分组特征集合的呼叫量比率，

s1(k)为第k个分组特征集合的历史呼叫量，

为同一层级对应的x个分组特征集合的历史呼叫量的总和；w1为历史呼叫量的预设权重；P2(k)为第k个分组特征集合的历史接通率，

s1(k)为第k个分组特征集合的呼叫成功标识的数量；w2为历史接通率的预设权重。

例如，设历史呼叫量的预设权重w1为40％，历史接通率的预设权重w2为60％，将10000条历史呼叫数据划分到四个第一特征集合A、B、C和D中，其数量分别为3000、2000、3500和1500；且归属于第一特征集合A、B、C和D中的所有历史呼叫数据中，携带呼叫成功标识的数量分别为2100、1200、2100和1200，则计算第一特征集合A的呼叫优先系数S(A)＝(3000/10000)*40％+(2100/3000)*60％＝0.54，依次获取第一特征集合B、C和D的呼叫优先系数S(B)＝0.44、S(C)＝0.56和S(D)＝0.54。若呼叫时机特征的分组特征值为T1、T2、T3和T4，则依据4个分组特征值可将第一特征集合A划分为四个第二特征集合A1、A2、A3和A4，其数量分别为600、750、900和750，且携带呼叫成功标识的数量分别为480、525、630和450，则计算第二特征集合A1的呼叫优先系数S(A1)＝(600/3000)*40％+(480/600)*60％＝0.56，依次计算第二特征集合A2、A3和A4的呼叫优先系数S(A2)＝0.52，S(A3)＝0.54和S(A4)＝0.46。

作为一示例，服务器在获取每一分组特征集合的呼叫优先系数之后，将所有分组特征集合对应的分组特征值及其对应的呼叫优先系数关联存储在系统数据库的呼叫信息记录表中，以便后续利用该呼叫信息记录表中的呼叫优先系数控制不同待呼叫数据在适合的目标呼叫时段进行外呼，以提高其呼叫接通率。

本实施例所提供的语音呼叫数据处理方法，对原始特征对应的历史特征值进行可控性分析，以确定可控特征，以排除不可控特征的干扰，从而保障后续生成的目标决策树的处理效率；对所有可控特征对应的历史特征值和呼叫结果标识进行关联性分析，获取与呼叫结果标识关联性较强的目标特征，有助于保障后续生成的目标决策树的处理效率和结果关联性，以保证后续进行呼叫策略调整的准确性；再基于呼叫时机特征、N个目标特征和呼叫结果标识进行分组和统计，确定每一分组特征集合对应的历史呼叫量和历史接通率，确定每一分组特征集合的呼叫优先系数，以便基于所有分组特征命令对应的呼叫优先系数；再基于分组特征集合对应的分组特征值、历史呼叫量、历史接通率和呼叫优先系数，形成呼叫信息记录表，从而利用呼叫信息记录表进行语音呼叫策略调整，保障在保障在适合的目标呼叫时段进行外呼，以提高其呼叫接通率。

在一实施例中，在步骤S505之后，即在基于每一分组特征集合对应的历史呼叫量和历史接通率，获取每一分组特征集合对应的呼叫优先系数，基于分组特征集合对应的分组特征值、历史呼叫量、历史接通率和呼叫优先系数，形成呼叫信息记录表之后，语音呼叫数据处理方法还包括：采用可视化工具对呼叫信息记录表进行可视化处理，获取可视化统计结果。

其中，可视化工具是用于实现可视化处理的工具。

作为一示例，服务器可采用python这一可视化工具对呼叫信息记录表进行可视化处理，以获取可视化统计结果，并在客户端上显示可视化统计结果，以实现将所有分组特征集合对应的分组特征值、历史呼叫量、历史接通率和呼叫优先系数进行可视化显示，以便基于可视化统计结果进行呼叫策略调整。本示例中，通过可视化统计结果可以可视化显示器不同呼叫时机特征对应的分组特征值(即不同呼叫时段)对应的历史接通量和历史接通率，确定接通量峰值点和接通率峰值点，以便利用接通量峰值点和接通率峰值点进行语音呼叫策略调整。例如，由于接通率峰值点的接通率最高，后续进行语音呼叫调整调整时，可在接通量峰值点对应的呼叫时段进行加呼叫；又由于接通量峰值点的接通量最大，说明此时可得到最大数据支持，稳定性最高。

本实施例所提供的语音呼叫数据处理方法中，在确定呼叫信息记录表之后，采用python这一可视化工具对呼叫信息记录表进行可视化，以使用户可以根据可视化统计结果，直观反映所有分类特征对应的分组特征值、历史呼叫量、历史接通率和呼叫优先系数，以便进行呼叫策略调整，保证呼叫策略调整的灵活性、缩短呼叫策略制定的耗时，提高呼叫策略调整处理效率和准确性；而且，可视化统计结果的显示，使得语音呼叫策略调整的可解释性强大且易于表达。

在一实施例中，如图6所示，步骤S502，即对K个原始特征对应的历史特征值进行可控性分析，从K个原始特征中确定L个可控特征，包括：

S601：对所有历史呼叫数据中同一原始特征对应的历史特征值进行完整度统计，获取原始特征对应的特征完整度。

其中，原始特征对应的特征完整度是用于反映所有历史呼叫数据中同一原始特征中包含非空特征值的概率。非空特征值是指不为空的特征值。

作为一示例，服务器获取所有历史呼叫数据对应的历史样本数量，对所有历史呼叫数据中同一原始特征对应的非空特征值进行统计，将原始特征对应的非空特征值的数量确定所原始特征对应的非空数量；将原始特征对应的非空数量与历史样本数量的商值，确定为原始特征对应的特征完整度，以避免后续基于特征完整度较小的目标特征进行分组时存在过拟合和泛化能力不足的问题，从而保证后续确定的目标特征的准确性。例如，服务器获取的历史呼叫数据的历史样本数量为10000，若原始特征A对应的非空数量为9000，则原始特征A的特征完整度为90％，说明有90％的历史呼叫数据均包含原始特征A对应的非空特征值。

S602：对所有历史呼叫数据中同一原始特征对应的历史特征值在预设评估周期内的变动概率进行统计，获取原始特征对应的特征变动概率。

其中，预设评估周期是用于评估原始特征对应的历史特征值是否频繁变动的周期，该预设评估周期可根据实际情况自主确定，例如，可设置为1个月。特征变动概率是用于反映所有历史呼叫数据中同一原始特征对应的历史特征值发生变动的概率。

作为一示例，服务器获取所有历史呼叫数据对应的历史样本数量，对所有历史呼叫数据中同一原始特征对应的历史特征值发生变动的数量进行统计，获取每一原始特征对应的变动数量，该原始特征对应的变动数量为原始特征对应的历史特征值在预设评估周期内存在变动的数量；将原始特征对应的变动数量与历史样本数量的商值，确定为原始特征对应的特征变动概率。例如，服务器获取的历史呼叫数据的历史样本数量为10000，预设评估周期为1个月，若在系统当前时间之前的1个月内，若原始特征A对应的历史特征值发生变动的变动数量为100，则该原始特征对应的特征变动概率为1％。可以理解地，原始特征对应的历史特征值是否变动，可基于历史呼叫数据对应的数据标识查询系统数据库中与历史呼叫数据相关的历史记录，以确定原始特征对应的历史特征值在预设评估周期内存在变动，以避免后续基于频繁变动的目标特征进行分组时存在影响准确性的问题。

S603：若特征完整度大于完整度阈值，且特征变动概率小于变动概率阈值，则将原始特征确定为可控特征。

其中，完整度阈值是用于评估完整度是否达标的阈值。变动概率是用于评估变动概率是否达标的阈值。

作为一示例，若特征完整度大于完整度阈值，且特征变动概率小于变动概率阈值，则认定原始特征具有可控性，将原始特征确定为可控特征。相应地，若特征完整度不大于完整度阈值，或者特征变动概率不小于变动概率阈值，则认定原始特征不具有可控性，将原始特征确定为不可控特征。

本实施例所提供的语音呼叫数据处理方法中，将特征完整度大于完整度阈值且特征变动概率小于变动概率阈值的原始特征确定为可控特征，以避免将特征完整度不达标而导致最终确定的目标特征进行数据分组时存在过拟合，泛化能力不足；或者避免将特征变动概率过高的原始特征确定为可控特征，导致最终确定的目标特征进行数据分组时存在不确定性，影响后续呼叫策略调整的准确性。

作为一示例，如图7所示，步骤S503，采用呼叫结果标识对L个可控特征对应的历史特征值进行关联性分析，从L个可控特征中确定N个目标特征，包括如下步骤：

S701：采用呼叫结果标识对所有历史呼叫数据中同一可控特征对应的历史特征值进行处理，获取可控特征对应的信息增益。

作为一示例，步骤S701具体包括：(1)服务器先采用呼叫结果标识对所有历史呼叫数据中同一可控特征对应的历史特征值进行处理，确定每一可控特征对应的经验熵。例如，对于所有历史呼叫数据所形成的样本集合D中，可基于每一可控特征对应的特征分类区间，将其划分为k个类别{C₁、C₂……C_k}，每个类别对应的概率为

其中，|C_k|为类别C_k的样本个数，|D|为样本集合D的样本总数，则每个可控特征对应的经验熵为

(2)服务器根据每一可控特征的经验熵，确定可控特征对应的信息增益。服务器利用每一可控特征对应的特征分类区间对所有历史呼叫数据进行划分分类，基于划分前后的经验熵的差值确定该可控特征对应的信息增益，即g(D,A)＝H(D)-H(D|A)，其中，g(D,A)为信息增益，H(D)为划分前的经验熵，H(D|A)为划分后的经验熵，以便利用该信息增益g(D,A)衡量该可控特征对整个历史呼叫数据所形成的样本集合D的划分效果好坏。可以理解地，对于由历史呼叫数据形成的样本集合D而言，其划分前的经验熵H(D)是一定的，但划分后的经验熵H(D|A)不确定，经验熵H(D|A)越大，说明使用此可控特征划分得到的子集的不确定性越小，与呼叫结果的关联性越强。

S702：对L个可控特征对应的信息增益进行排序，将信息增益较大的前N个可控特征确定为目标特征。

作为一示例，服务器对L个可控特征对应的信息增益进行排序，将信息增益较大的前N个可控特征确定为目标特征，以实现将与呼叫结果关联性较大的前N个可控特征确定为目标特征，以排除与呼叫结果关联性较弱的其他可控特征，从而保障目标特征对呼叫策略调整进行的准确性。

在一实施例中，如图8所示，步骤S504，即基于呼叫时机特征、N个目标特征和呼叫结果标识，对历史呼叫数据进行分组，获取分组特征集合，并统计每一分组特征集合对应的历史呼叫量和历史接通率，分组特征集合为呼叫时机特征和N个目标特征对应的分组特征值的集合，包括如下步骤：

S801:基于N个目标特征对应的分组特征值，形成X个第一特征集合。

S802:基于呼叫时机特征对应的分组特征值，对每一第一特征集合进行分组，形成每一第一特征集合相对应的Y个第二特征集合。

S803：基于分组特征集合，对历史呼叫数据进行分组统计，获取每一分组特征集合对应的历史呼叫量和历史接通率，分组特征集合包括第一特征集合和第二特征集合。

其中，历史呼叫量是指归属于某一分组特征集合中的历史呼叫数据的数据量。历史接通率是指归属于某一分组特征集合的所有历史呼叫数据中，携带呼叫成功标识的数据量占历史呼叫量的比率。本示例中，服务器先基于N个目标特征对应的分组特征值，形成X个第一特征集合，例如，N个目标特征对应的分组特征值的数量分别为Si，1≦i≦N，则X＝S1*S2*…*Si*Si+1*…*SN。接着，服务器基于呼叫时机特征对应的分组特征值，对每一第一特征集合进行分组，形成每一第一特征集合相对应的Y个第二特征集合，例如，呼叫时机特征对应的分组特征值的数量为Y＝8时，即将一天可呼叫时段划分为8个呼叫时机特征对应的分组特征值；再对每一第一特征集合，依据8个呼叫时机特征对应的分组特征值进行分组，形成每一第一特征集合相对应的8个第二特征集合。本示例中，分组特征集合包括第一特征集合和第二特征集合。

例如，目标特征的数量N＝2，2个目标特征对应的分组特征值分别为2和3时，则基于2个目标特征对应的分组特征值，会形成X＝2*3＝6个第一特征集合；在呼叫时机特征对应的分组特征值的数量Y＝4时，可分别对6个第一特征集合进行依据呼叫时机特征对应的分组特征值进行分类，形成Z＝6*4个第二特征集合。

本示例中，服务器将所有历史呼叫数据中每一分组特征对应的历史特征值(包括每一目标特征对应的历史特征值与呼叫时机特征对应的历史特征值)分别相应的分组特征对应的分组特征值进行比较，以确定每一历史呼叫数据所属的分组特征集合；再对归属到每一分组特征集合中的历史呼叫数据进行分组统计，获取分组统计结果，即获取每一分组特征集合对应的历史呼叫量和历史接通率。例如，在对所有历史呼叫数据进行分组统计时，可统计X个第一特征集合对应的历史呼叫量和历史接通率；并进一步统计将每一第一特征集合划分成Y个第二特征集合之后，统计每一Y个第二特征集合对应的历史呼叫量和历史接通率。

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本发明实施例的实施过程构成任何限定。

在一实施例中，提供一种语音呼叫数据处理装置，该语音呼叫数据处理装置与上述实施例中语音呼叫数据处理方法一一对应。如图9所示，该语音呼叫数据处理装置包括待呼叫数据获取模块901、呼叫特征集合确定模块902、目标呼叫时段获取模块903、呼叫结果数据获取模块904和呼叫信息记录表更新模块905。各功能模块详细说明如下：

待呼叫数据获取模块901，用于获取待呼叫客户的至少一个待呼叫数据，待呼叫数据包括N个目标特征对应的待呼特征值。

呼叫特征集合确定模块902，用于基于N个目标特征对应的待呼特征值查询系统数据库中存储的呼叫信息记录表，确定每一待呼叫数据所属的呼叫特征集合。

目标呼叫时段获取模块903，用于根据呼叫特征集合对应的Y个第二特征集合的呼叫优先系数和呼叫时机特征对应的分组特征值，确定待呼叫数据对应的目标呼叫时段，其中，Y≧2。

呼叫结果数据获取模块904，用于在待呼叫数据对应的目标呼叫时段，对待呼叫数据对应的待呼叫客户进行呼叫，获取待呼叫数据对应的呼叫结果数据。

呼叫信息记录表更新模块905，用于根据待呼叫数据对应的呼叫结果数据，对呼叫特征集合的呼叫优先系数进行更新，更新系统数据库中存储的呼叫信息记录表。

优选地，目标呼叫时段获取模块903，包括：

初始呼叫时段确定单元，用于对呼叫特征集合对应的Y个第二特征集合的呼叫优先系数进行降序排序，获取优先级序列，将优先级序列中的第一个呼叫优先系数对应的第二特征集合，确定为初始特征集合，将初始特征集合中呼叫时机特征对应的分组特征值，确定为初始呼叫时段。

待呼数据量统计单元，用于统计同一初始呼叫时段对应的所有待呼叫数据对应的待呼数据量。

第一目标时段确定单元，用于若初始呼叫时段对应的待呼数据量小于初始呼叫时段对应的可呼数据量，则将初始呼叫时段确定为确定待呼叫数据对应的目标呼叫时段。

第二目标时段确定单元，用于若待呼数据量不小于初始呼叫时段对应的可呼数据量，则基于呼叫特征集合对应的呼叫优先系数，对初始呼叫时段对应的所有待呼叫数据进行排序，确定每一待呼叫数据对应的目标呼叫时段。

优选地，呼叫信息记录表更新模块905，包括：

实际数据获取单元，用于根据所有待呼叫数据对应的呼叫结果数据，获取所有呼叫特征集合对应的实际呼叫量和实际接通率。

提升数据获取单元，用于若实际呼叫量大于预设呼叫量，则基于实际接通率和呼叫信息记录表中记录的所有历史接通率，获取实际提升均值和最大提升均值。

呼叫优先系数更新单元，用于根据最大提升均值和最大提升均值，确定调整系数，根据调整系数对呼叫特征集合对应的呼叫优先系数进行调整，获取更新的呼叫优先系数，根据更新的呼叫优先系数、实际呼叫量和实际接通率，更新呼叫信息记录表。

优选地，语音呼叫数据处理装置还包括：

历史呼叫数据获取模块，用于获取历史呼叫数据，历史呼叫数据包括呼叫结果标识、呼叫时机特征对应的历史特征值和K个原始特征对应的历史特征值，其中，K≧2。

可控特征获取模块，用于对K个原始特征对应的历史特征值进行可控性分析，从K个原始特征中确定L个可控特征，其中，2≦L≦K。

目标特征获取模块，用于采用呼叫结果标识对L个可控特征对应的历史特征值进行关联性分析，从L个可控特征中确定N个目标特征，其中，2≦N≦L。

分组特征集合获取模块，用于基于呼叫时机特征、N个目标特征和呼叫结果标识，对历史呼叫数据进行分组，获取分组特征集合，并统计每一分组特征集合对应的历史呼叫量和历史接通率，分组特征集合为呼叫时机特征和N个目标特征对应的分组特征值的集合。

呼叫信息记录表形成模块，用于基于每一分组特征集合对应的历史呼叫量和历史接通率，获取每一分组特征集合对应的呼叫优先系数，基于分组特征集合对应的分组特征值、历史呼叫量、历史接通率和呼叫优先系数，形成呼叫信息记录表。

优选地，可控特征获取模块，包括：

特征完整度获取单元，用于对所有历史呼叫数据中同一原始特征对应的历史特征值进行完整度统计，获取原始特征对应的特征完整度。

特征变动概率获取单元，用于对所有历史呼叫数据中同一原始特征对应的历史特征值在预设评估周期内的变动概率进行统计，获取原始特征对应的特征变动概率。

可控特征确定单元，用于若特征完整度大于完整度阈值，且特征变动概率小于变动概率阈值，则将原始特征确定为可控特征。

优选地，目标特征获取模块，包括：

信息增益获取单元，用于采用呼叫结果标识对所有历史呼叫数据中同一可控特征对应的历史特征值进行处理，获取可控特征对应的信息增益。

目标特征确定单元，用于对L个可控特征对应的信息增益进行排序，将信息增益较大的前N个可控特征确定为目标特征。

优选地，分组特征集合获取模块，包括：

第一特征集合形成单元，用于基于N个目标特征对应的分组特征值，形成X个第一特征集合。

第二特征集合形成单元，用于基于呼叫时机特征对应的分组特征值，对每一第一特征集合进行分组，形成每一第一特征集合相对应的Y个第二特征集合。

分组特征集合统计单元，用于基于分组特征集合，对历史呼叫数据进行分组统计，获取每一分组特征集合对应的历史呼叫量和历史接通率，分组特征集合包括第一特征集合和第二特征集合。

关于语音呼叫数据处理装置的具体限定可以参见上文中对于语音呼叫数据处理方法的限定，在此不再赘述。上述语音呼叫数据处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于执行语音呼叫数据处理方法过程中采用或生成的数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种语音呼叫数据处理方法。

在一个实施例中，提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行计算机程序时实现上述实施例中语音呼叫数据处理方法，例如图2所示S201-S205，或者图3至图8中所示，为避免重复，这里不再赘述。或者，处理器执行计算机程序时实现语音呼叫数据处理装置这一实施例中的各模块/单元的功能，例如图9所示的待呼叫数据获取模块901、呼叫特征集合确定模块902、目标呼叫时段获取模块903、呼叫结果数据获取模块904和呼叫信息记录表更新模块905的功能，为避免重复，这里不再赘述。

在一实施例中，提供一计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现上述实施例中语音呼叫数据处理方法，例如图2所示S201-S205，或者图3至图8中所示，为避免重复，这里不再赘述。或者，该计算机程序被处理器执行时实现上述语音呼叫数据处理装置这一实施例中的各模块/单元的功能，例如图9所示的待呼叫数据获取模块901、呼叫特征集合确定模块902、目标呼叫时段获取模块903、呼叫结果数据获取模块904和呼叫信息记录表更新模块905的功能，为避免重复，这里不再赘述。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将所述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。

以上所述实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围，均应包含在本发明的保护范围之内。

Claims

1.一种语音呼叫数据处理方法，其特征在于，包括：

2.如权利要求1所述的语音呼叫数据处理方法，其特征在于，所述根据所述呼叫特征集合对应的Y个第二特征集合的呼叫优先系数和呼叫时机特征对应的分组特征值，确定所述待呼叫数据对应的目标呼叫时段，包括：

对所述呼叫特征集合对应的Y个所述第二特征集合的呼叫优先系数进行降序排序，获取优先级序列，将所述优先级序列中的第一个呼叫优先系数对应的所述第二特征集合，确定为初始特征集合，将所述初始特征集合中呼叫时机特征对应的分组特征值，确定为初始呼叫时段；

统计同一所述初始呼叫时段对应的所有待呼叫数据对应的待呼数据量；

若所述初始呼叫时段对应的待呼数据量小于所述初始呼叫时段对应的可呼数据量，则将所述初始呼叫时段确定为确定所述待呼叫数据对应的目标呼叫时段；

若所述待呼数据量不小于所述初始呼叫时段对应的可呼数据量，则基于所述呼叫特征集合对应的呼叫优先系数，对所述初始呼叫时段对应的所有所述待呼叫数据进行排序，确定每一所述待呼叫数据对应的目标呼叫时段。

3.如权利要求1所述的语音呼叫数据处理方法，其特征在于，所述根据所述待呼叫数据对应的呼叫结果数据，对所述呼叫特征集合的呼叫优先系数进行更新，更新所述系统数据库中存储的呼叫信息记录表，包括：

根据所有所述待呼叫数据对应的呼叫结果数据，获取所有所述呼叫特征集合对应的实际呼叫量和实际接通率；

若所述实际呼叫量大于预设呼叫量，则基于所述实际接通率和所述呼叫信息记录表中记录的所有历史接通率，获取实际提升均值和最大提升均值；

根据所述最大提升均值和所述最大提升均值，确定调整系数，根据所述调整系数对呼叫特征集合对应的呼叫优先系数进行调整，获取更新的呼叫优先系数，根据所述更新的呼叫优先系数、所述实际呼叫量和所述实际接通率，更新所述呼叫信息记录表。

4.如权利要求1所述的语音呼叫数据处理方法，其特征在于，在所述获取待呼叫客户的至少一个待呼叫数据之前，所述语音呼叫数据处理方法还包括：

获取历史呼叫数据，历史呼叫数据包括呼叫结果标识、呼叫时机特征对应的历史特征值和K个原始特征对应的历史特征值，其中，K≧2；

对K个原始特征对应的历史特征值进行可控性分析，从K个原始特征中确定L个可控特征，其中，2≦L≦K；

采用呼叫结果标识对L个可控特征对应的历史特征值进行关联性分析，从L个可控特征中确定N个目标特征，其中，2≦N≦L；

基于所述呼叫时机特征、N个所述目标特征和所述呼叫结果标识，对所述历史呼叫数据进行分组，获取分组特征集合，并统计每一分组特征集合对应的历史呼叫量和历史接通率，所述分组特征集合为所述呼叫时机特征和N个所述目标特征对应的分组特征值的集合；

基于每一所述分组特征集合对应的历史呼叫量和历史接通率，获取每一所述分组特征集合对应的呼叫优先系数，基于所述分组特征集合对应的分组特征值、历史呼叫量、历史接通率和呼叫优先系数，形成呼叫信息记录表。

5.如权利要求4所述的语音呼叫数据处理方法，其特征在于，所述对K个所述原始特征对应的历史特征值进行可控性分析，从K个所述原始特征中确定L个可控特征，包括：

对所有所述历史呼叫数据中同一所述原始特征对应的历史特征值进行完整度统计，获取所述原始特征对应的特征完整度；

对所有所述历史呼叫数据中同一所述原始特征对应的历史特征值在预设评估周期内的变动概率进行统计，获取所述原始特征对应的特征变动概率；

若所述特征完整度大于完整度阈值，且所述特征变动概率小于变动概率阈值，则将所述原始特征确定为可控特征。

6.如权利要求4所述的语音呼叫数据处理方法，其特征在于，所述采用所述呼叫结果标识对L个所述可控特征对应的历史特征值进行关联性分析，从L个所述可控特征中确定N个目标特征，包括：

采用所述呼叫结果标识对所有所述历史呼叫数据中同一所述可控特征对应的历史特征值进行处理，获取所述可控特征对应的信息增益；

对L个所述可控特征对应的信息增益进行排序，将所述信息增益较大的前N个所述可控特征确定为目标特征。

7.如权利要求4所述的语音呼叫数据处理方法，其特征在于，所述基于所述呼叫时机特征、N个所述目标特征和所述呼叫结果标识，对所述历史呼叫数据进行分组，获取分组特征集合，并统计每一分组特征集合对应的历史呼叫量和历史接通率，所述分组特征集合为所述呼叫时机特征和N个所述目标特征对应的分组特征值的集合，包括：

基于N个所述目标特征对应的分组特征值，形成X个第一特征集合；

基于所述呼叫时机特征对应的分组特征值，对每一所述第一特征集合进行分组，形成每一所述第一特征集合相对应的Y个第二特征集合；

基于分组特征集合，对所述历史呼叫数据进行分组统计，获取每一分组特征集合对应的历史呼叫量和历史接通率，所述分组特征集合包括第一特征集合和第二特征集合。

8.一种语音呼叫数据处理装置，其特征在于，包括：

9.一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述语音呼叫数据处理方法。

10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至7任一项所述语音呼叫数据处理方法。