CN112035625B

CN112035625B - 元件拆分与组合的语音文本数据分析方法及设备

Info

Publication number: CN112035625B
Application number: CN202011211142.4A
Authority: CN
Inventors: 李畅
Original assignee: Shanghai Huijie Intelligent Technology Co ltd
Current assignee: Huijie (Shanghai) Technology Co.,Ltd.
Priority date: 2020-11-03
Filing date: 2020-11-03
Publication date: 2021-03-02
Anticipated expiration: 2040-11-03
Also published as: CN112035625A

Abstract

本发明的目的是提供一种元件拆分与组合的语音文本数据分析方法及设备，为解决模型数量过多、字段过长及建模效率低的问题，本发明提出元件拆分与组合的数据分析方法，其基础原理为定义不同类别的元件将建模过程分拆后再重新组合，再通过数据分析设备运用重新组合后的元件来定义发生的事件，从而建立二维、三维、多维的元件矩阵，大大降低建模的难度和人力耗费。

Description

元件拆分与组合的语音文本数据分析方法及设备

技术领域

本发明涉及计算机领域，尤其涉及一种元件拆分与组合的语音文本数据分析方法及设备。

背景技术

在各大行业领域的大数据分析应用，基本是通过模型对客户意图、业务内容、服务方式及客户反馈情况进行分析，从而了解诸如客户需求的趋势变化，提升服务效率、客户满意度，或者是销售成功率这些数据。

在统计的过程中，通常以描述型分析，使用关键词及逻辑组合构造成模型，来定义所需要分析的目标事件。无论是传统的组合建模法，还是新兴的机器学习，都是穷举法的应用，需要投入大量的标注及监督学习资源。尤其是针对录音转写的对话内容，因为方言及说话方式，往往正确转写率低于90%，降低模型的准确性及产生较高的遗漏率，造成统计上的误差。

由于使用穷举法建模来表示各个事件，造成了进行大数据分析的如下三个问题：

一是模型数量会根据业务复杂度而成指数型增加；例如针对银行业信用卡客服的分析，模型数量约500+，而其零售银行由于包含保险与基金理财等更广泛的服务类别，因此模型数量将可能增加至信用卡的数倍。

二是由于单个模型需要人工进行所有关键词及其逻辑关系的罗列，单个模型字符数量甚至超过1万，以致人工建模成本巨大。

三是完成罗列的模型重复使用困难，导致数据分析效率低下，以当前广泛在金融领域的大数据分析为例，通常行业中仅仅选择特定业务场景进行分析，限制了进一步全面统计及环比对应分析的应用。

发明内容

本发明的一个目的是提供一种元件拆分与组合的语音文本数据分析方法及设备。

根据本发明的一个方面，提供了一种元件拆分与组合的语音文本数据分析方法，该方法包括：

对拟建模分析的样本语音文本数据中所包含的不同类别的元件进行拆分定义，基于所述拆分定义进行归类，得到业务节点元件和服务场景元件；

选择业务节点元件和/或服务场景元件，形成所选择的业务节点元件之间和/或服务场景元件之间的逻辑关系组合，并将业务节点元件之间和/或服务场景元件之间的逻辑关系组合作为描述不同的目标事件的模型；

获取待分析统计的客户语音文本数据，将描述不同的目标事件的模型与待分析统计的客户语音文本数据进行匹配，得到匹配的描述目标事件的模型；

将匹配到的描述目标事件的模型、所述待分析统计的客户语音文本数据、待分析统计的客户语音文本数据对应的原始的来电客户和服务人员的语音、待分析统计的客户语音文本数据的随录字段，通过界面进行展示，并反馈给对应的数据分析人员。

进一步的，上述方法中，待分析统计的客户语音文本数据的随录字段，包括：

客户ID、客户姓名、客户来电时间、服务人员工号和通话时长。

进一步的，上述方法中所选择的业务节点元件之间的逻辑关系组合和/或服务场景元件之间的逻辑关系组合，包括：

与、或、非、临近、间距关系中的一种或任意组合。

进一步的，上述方法中所述业务节点元件由一个第一关键词组成或由若干个第一关键词及其逻辑关系组合生成；

所述服务场景元件则由一个第二关键词或由若干个第二关键词及第二关键词的逻辑关系组合生成。

进一步的，上述方法中所述第一关键词的逻辑关系包括：与、或、非、临近、间距中的一种或任意组合；

所述第二关键词的逻辑关系包括：与、或、非、临近、间距中的一种或任意组合。

进一步的，上述方法中，获取待分析统计的客户语音文本数据，将描述不同的目标事件的模型与待分析统计的客户语音文本数据进行匹配，得到匹配的描述目标事件的模型，包括：

将从待分析统计的客户语音文本数据中提取到的关键词及所述关键词在待分析统计的客户语音文本数中的位置信息、时间信息，与元件组合形成的模型中所述的第一关键词及其逻辑关系和/或第二关键词及其逻辑关系进行匹配，得到匹配的描述目标事件的模型。

根据本发明的另一发明，还提供一种元件拆分与组合的语音文本数据分析设备，其中，该设备包括：

第一装置，用于对拟建模分析的样本语音文本数据中所包含的不同类别的元件进行拆分定义，基于所述拆分定义进行归类，得到业务节点元件和服务场景元件；

第二装置，用于选择业务节点元件和/或服务场景元件，形成所选择的业务节点元件之间和/或服务场景元件之间的逻辑关系组合，并将业务节点元件之间和/或服务场景元件之间的逻辑关系组合作为描述不同的目标事件的模型；

第三装置，用于获取待分析统计的客户语音文本数据，将描述不同的目标事件的模型与待分析统计的客户语音文本数据进行匹配，得到匹配的描述目标事件的模型；

第四装置，用于将匹配到的描述目标事件的模型、所述待分析统计的客户语音文本数据、待分析统计的客户语音文本数据对应的原始的来电客户和服务人员的语音、待分析统计的客户语音文本数据的随录字段，通过界面进行展示，并反馈给对应的数据分析人员。

根据本发明的另一方面，还提供一种基于计算的设备，其中，包括：

处理器；以及

被安排成存储计算机可执行指令的存储器，所述可执行指令在被执行时使所述处理器：

根据本发明的另一方面，还提供一种计算机可读存储介质，其上存储有计算机可执行指令，其中，该计算机可执行指令被处理器执行时使得该处理器：

与现有技术相比，为解决模型数量过多、字段过长及建模效率低的问题，本发明提出元件拆分与组合的数据分析方法，其基础原理为定义不同类别的元件将建模过程分拆后再重新组合，再通过数据分析设备运用重新组合后的元件来定义发生的事件，从而建立二维、三维、多维的元件矩阵，大大降低建模的难度和人力耗费。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述，本发明的其它特征、目的和优点将会变得更明显：

图1示出本发明的服务录音命中方法现有的服务录音命中方法的比较示意图；

图2示出本发明一实施例的服务录音命中方法的示意图；

图3示出本发明一实施例的模型定义过程与元件拆分组合的逻辑过程。

附图中相同或相似的附图标记代表相同或相似的部件。

具体实施方式

下面结合附图对本发明作进一步详细描述。

在本申请的一个典型配置中，终端、服务网络的设备和可信方均包括一个或多个处理器 (CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器 (RAM) 和/或非易失性内存等形式，如只读存储器 (ROM) 或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存 (PRAM)、静态随机存取存储器 (SRAM)、动态随机存取存储器 (DRAM)、其他类型的随机存取存储器 (RAM)、只读存储器 (ROM)、电可擦除可编程只读存储器 (EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘 (DVD) 或其他光学存储、磁盒式磁带，磁带磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括非暂存电脑可读媒体 (transitory media)，如调制的数据信号和载波。

本发明提供一种元件拆分与组合的语音文本数据分析方法，所述方法包括：

步骤S1，对拟建模分析的样本语音文本数据中所包含的不同类别的元件进行拆分定义，基于所述拆分定义进行归类，得到业务节点元件和服务场景（动作）元件；

例如，可以将金融行业的大数据传统方法所建的模型拆分为若干元件，由元件来进行业务事件所含元素的定义与描述。

元件拆分完成后，将所有拆分的元件进行若干归类，按照上述金融行业的举例，可归类为业务节点元件、服务场景（动作）元件两类。

按照上述举例，网上支付业务中的联网版支付、大众版支付、专业版支付、快捷支付、银联在线支付等可定义并归类为业务节点元件；业务开通、业务关闭、限制额度、系统报错等可定义并归类为服务场景（动作）元件。

步骤S2，选择业务节点元件和/或服务场景（动作）元件，形成所选择的业务节点元件之间的逻辑关系组合和/或服务场景（动作）元件之间的逻辑关系组合，并将业务节点元件之间和/或服务场景（动作）元件之间的逻辑关系组合，作为描述不同的目标事件的模型。

步骤S3，获取待分析统计的客户语音文本数据，将步骤S2形成的描述不同的目标事件的模型与待分析统计的客户语音文本数据进行匹配，得到匹配的描述目标事件的模型；

步骤S4，将匹配到的描述目标事件的模型、所述待分析统计的客户语音文本数据、待分析统计的客户语音文本数据对应的原始的来电客户和服务人员的语音、待分析统计的客户语音文本数据的随录字段（包括客户ID、客户姓名、客户来电时间、服务人员工号、通话时长等），通过界面进行展示，并反馈给对应的数据分析人员。

在此，为解决模型数量过多、字段过长及建模效率低的问题，本发明提出元件拆分与组合的数据分析方法，其基础原理为定义不同类别的元件将建模过程分拆后再重新组合，再通过数据分析设备运用重新组合后的元件来定义发生的事件，从而建立二维、三维、多维的元件矩阵，大大降低建模的难度和人力耗费。

可以将所述事件类型的匹配结果与对应的语音文本数据（包括来电客户和服务人员的语音、对应的转译出来的待分析统计的客户语音文本数据）、待分析统计的客户语音文本数据的随录字段（包括客户ID、客户姓名、客户来电时间、服务人员工号、通话时长等），一同通过数据分析设备的展示界面，并反馈给对应的数据分析人员。

数据分析人员可以再将以上数据进行多维度统计分析，举例来说，可以进行客户来电原因分析，获取海量语音文本数据中客户电话进线的实际原因，进行客户来电原因业务归类统计；可以建立服务标准类或质检类模型，可分析出未符合业务标准或不合规的服务人员，后续进行个性化培训；也可通过数据报表的形式进行产出，给不同部门以数据支撑等等。

按照上述举例，金融行业可将20个业务节点元件及10个服务场景（动作）元件用于定义最多200个事件，传统建模方式中人工定义200个模型的工作，在数据分析设备中降为20+10=30个元件，至少降低了85%以上的人力消耗，从而大大提高人力资源的运用效率，提升模型应用的精度与广度。

实际的应用场景中，模型的数量通常与需要进行数据分析的事件数量成正比，所以在复杂的组织机构及多元化的服务内容下，需要完成大量模型的建立，耗费对应的人力资源。

传统的分析方法，除了对人力资源的耗费以外，更重要是在定义每一个事件时，均需要建模人员完整的描述事件的所有要素，不但对建模人员垂直领域业务知识的要求很高，而且在描述不同事件时，过往所定义内容均无法共享使用。

为解决这个挑战，本发明跳出模型直接一对一代表目标事件这样的传统思维，将传统建模改变为首先定义拆分的模型元件，再将这些模型元件进行归类定义不同元件之间的逻辑关系（与、或、非、临近、间距等），生成不同元件之间的关系分析，通过数据分析设备再组合为描述不同目标事件的模型，这样定义的元件可在不同的事件描述建模过程中重复根据实际需求进行使用，元件可以按照需求灵活的组合成各种模型，可以提高覆盖度及建模的效率。

在此以某银行信用卡客服部、零售银行部建模情况作为案例进行说明：

案例一：信用卡客服部

按照传统描述型的建模方式，通常直接将具体的业务用模型进行一对一的描述；而按照本发明中的元件拆分组合建模法，首先将业务中所包含的内容拆分为若干类业务节点元件，再选取这些类别中的元件进行组合，形成模型来描述具体业务。

选择信用卡中的部分业务举例说明，元件拆分组合建模法将业务内容拆分为两类元件，第一类命名为服务场景（动作）元件，第二类命名为业务节点元件。传统建模法用模型直接描述业务，需要建立30个模型（6*5=30），具体如下表1：

表1

按照本发明中的元件拆分组合建模法，将拆分后的两类元件进行组合建模，需要分别建立两类元件的模型，其中，

第一类服务场景（动作）元件如表2：

表2

第二类业务节点元件如表3:

表3

因此，在本例中使用元件拆分组合建模法，需要定义11个元件即可，分别是5个第一类服务场景（动作）元件“查询、咨询、修改、办理、取消”与6个第二类业务节点元件“卡片申请、密码问题、卡片操作、额度相关、交易支付、增值业务”。

本发明的元件拆分与组合的语音文本数据分析方法一实例中，步骤S2中，所选择的业务节点元件之间的逻辑关系组合和/或服务场景（动作）元件之间的逻辑关系组合，包括：

与、或、非、临近、间距关系中的一种或任意组合。

在此，业务节点元件之间、服务场景（动作）元件之间、业务节点元件和服务场景（动作）元件之间均可采用若干逻辑关系（与、或、非、临近、间距等）的组合，用来表示金融行业的服务事件。

其中，逻辑关系的具体举例如下：

与：“元件A and 元件B”的组合表示一个语音文本数据中同时出现A和B；

或：“元件A or 元件B”的组合表示一个语音文本数据中至少出现A和B中的一个；

非：“not 元件A”的组合表示一个语音文本数据中不出现A；

临近：“元件A near 元件B”的组合表示一个语音文本数据中同时出现A和B，且A和B之间距离在约定的字符数量内；

间距：“元件A distance 元件B”的组合表示一个语音文本数据中同时出现A和B，且A和B之间距离大于约定的最小字符数量，同时小于约定的最大字符数量；

本发明的元件拆分与组合的语音文本数据分析方法一实例中，所述业务节点元件由一个第一关键词组成或由若干个第一关键词及其逻辑关系（与、或、非、临近、间距等）组合生成；

所述服务场景（动作）元件则由一个第二关键词或由若干个第二关键词及第二关键词的逻辑关系（与、或、非、临近、间距等）组合生成。

例如，如图3所示，“银联在线支付”的业务节点元件中的第一关键词包括：银联支付、认证支付、银联、在线、认证、支付、在线支付，共7个第一关键词，这些第一关键词通过逻辑关系如或（ı）和临近（#）进行连接。

本发明的元件拆分与组合的语音文本数据分析方法的上述一实例中，步骤S3，获取待分析统计的客户语音文本数据，将步骤S2形成的描述不同的目标事件的模型与待分析统计的客户语音文本数据进行匹配，得到匹配的描述目标事件的模型，包括：

将从待分析统计的客户语音文本数据中提取到的关键词及所述关键词在待分析统计的客户语音文本数中的位置信息、时间信息，与元件组合形成的模型中所述的第一关键词及其逻辑关系或第二关键词及其逻辑关系进行匹配，得到匹配的描述目标事件的模型。

上述过程中用于组合成为模型的单个元件可在不同的事件类型匹配过程中重复使用。通常将单个元件保存在语音分析设备中，并按照类别进行标识和存放，这些元件可供其他的语音文本数据分析过程中直接引用组合，这将降低这些分析过程的建模工作量，并能将不同建模人员定义的元件进行共享，可以提高模型的覆盖广度及新建模型的效率。

具体的，案例二：零售银行部

零售银行部的业务可以划分为若干大类，以其中网上支付这一大类为例，又可拆分为联网版支付、大众版支付、专业版支付、快捷支付、银联在线支付等若干小类；每个小类可再进一步细分为业务颗粒。传统的建模方式为了保证业务颗粒的描述准确性，每个业务颗粒一一建模，建模总数量等同于所有业务颗粒的累加数量。

按本发明提出的元件拆分与组合建模法，可将对每个描述业务颗粒的业务类别、服务场景（动作）拆分为多种元件，在此案例中，可拆分为两类元件，第一类定义为“支付节点元件”，第二类定义为“服务场景（动作）元件”。

支付节点元件包含联网版支付、大众版支付、专业版支付、快捷支付、银联在线支付；服务场景（动作）元件包含开通、关闭、限额、报错；为了简要说明，本案例中定义两类元件间的逻辑关系为“临近”，当两者满足临近关系时，则模型命中。

传统的描述型分析，零售银行业务中的网上支付这一大类业务共需要建立20个模型（5*4=20），具体如下表4：

表4

如图1所示，使用本发明提出的元件拆分组合建模法，需定义9个元件即可，分别是5个第一类支付节点元件“联网版支付、大众版支付、专业版支付、快捷支付、银联在线支付”与4个第二类服务场景（动作）元件“开通、关闭、限额、报错”。

如图1所示，假设有支付节点元件100个，服务场景（动作）元件10个：

传统建模法建模个数=100*10=1000个。

元件拆分组合建模法建模（元件）个数=100+10=110个。

该案例中按照上述计算方法，元件拆分组合建模法可减少89%的建模数量（减少建模890个）。

本案例中所定义的支付节点元件、服务场景（动作）元件如图2所示，按照图2的元件类别定义，举例说明模型命中的原理如下：

步骤S1，对拟建模分析的样本语音文本数据中所包含的不同类别的元件进行拆分定义与基于所述拆分定义进行归类，得到A支付节点元件和B服务场景（动作）元件，A支付节点元件包括“银联在线支付”等第一关键词；B服务场景（动作）元件包括 “功能开通”等第二关键词；

步骤S2，从数据分析设备中选择业务节点元件之间和/或服务场景（动作）元件，并采用数据分析设备中提供的图形工具进行定义，来形成支付节点元件之间和/或服务场景（动作）元件的逻辑关系（与、或、非、临近、间距等）组合，并将业务节点元件之间和/或服务场景（动作）元件的逻辑关系（与、或、非、临近、间距等）组合来作为描述不同的目标事件的模型，“银联在线支付”临近“开通渠道”组成了模型中的一个目标事件；

步骤S3，获取待服务客户的语音文本数据，数据分析设备采用步骤S2形成的描述不同的目标事件的模型，将这些描述不同的目标事件的模型，通过数据分析设备与待分析统计的客户语音文本数据进行匹配，得到匹配的描述目标事件的模型；

步骤S4，将匹配到的描述目标事件的模型、待分析统计的客户语音文本数据、待分析统计的客户语音文本数据对应的原始来电客户和服务人员的语音、待分析统计的客户语音文本数据的随录字段（包括客户ID、客户姓名、客户来电时间、服务人员工号、通话时长等），通过界面进行展示，并反馈给对应的数据分析人员。

一实施例中，模型定义过程与元件拆分组合的逻辑过程如图3所示。若按传统建模的方式描述业务“银联在线支付功能开通”时，需438种关键词逻辑组合，采用元件拆分组合建模方式后，分为支付节点元件和服务场景（动作）元件，举例来说，支付节点元件中名称为“银联在线支付”的元件有6种第一关键词组合，服务场景（动作）元件中名称为“功能开通”的元件有73种第二关键词组合。以传统建模法描述该业务，共6×73=438种关键词组合，而以元件拆分组合建模法描述该业务，仅需6+73=79种关键词组合。其中，原有的建模方式建的模型内容为：

通过上述案例一、案例二的分析，本发明提出的元件拆分组合建模法对比传统建模方法，能有效解决模型数量多、单个模型过于冗长、一个模型仅用于描述单一事件而无法重复利用、重新组合的三方面问题。

处理器；以及

本发明的各设备和存储介质实施例的详细内容，具体可参见各方法实施例的对应部分，在此，不再赘述。

显然，本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样，倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内，则本申请也意图包含这些改动和变型在内。

需要注意的是，本发明可在软件和/或软件与硬件的组合体中被实施，例如，可采用专用集成电路（ASIC）、通用目的计算机或任何其他类似硬件设备来实现。在一个实施例中，本发明的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地，本发明的软件程序（包括相关的数据结构）可以被存储到计算机可读记录介质中，例如，RAM存储器，磁或光驱动器或软磁盘及类似设备。另外，本发明的一些步骤或功能可采用硬件来实现，例如，作为与处理器配合从而执行各个步骤或功能的电路。

另外，本发明的一部分可被应用为计算机程序产品，例如计算机程序指令，当其被计算机执行时，通过该计算机的操作，可以调用或提供根据本发明的方法和/或技术方案。而调用本发明的方法的程序指令，可能被存储在固定的或可移动的记录介质中，和/或通过广播或其他信号承载媒体中的数据流而被传输，和/或被存储在根据所述程序指令运行的计算机设备的工作存储器中。在此，根据本发明的一个实施例包括一个装置，该装置包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器，其中，当该计算机程序指令被该处理器执行时，触发该装置运行基于前述根据本发明的多个实施例的方法和/或技术方案。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外，显然“包括”一词不排除其他单元或步骤，单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一，第二等词语用来表示名称，而并不表示任何特定的顺序。

Claims

1.一种元件拆分与组合的语音文本数据分析方法，其中，该方法包括：

将匹配到的描述目标事件的模型、所述待分析统计的客户语音文本数据、待分析统计的客户语音文本数据对应的原始的来电客户和服务人员的语音、待分析统计的客户语音文本数据的随录字段，通过界面进行展示，并反馈给对应的数据分析人员；

所述业务节点元件由一个第一关键词组成或由若干个第一关键词及其逻辑关系组合生成；

所述服务场景元件则由一个第二关键词或由若干个第二关键词及第二关键词的逻辑关系组合生成；

获取待分析统计的客户语音文本数据，将描述不同的目标事件的模型与待分析统计的客户语音文本数据进行匹配，得到匹配的描述目标事件的模型，包括：

2.根据权利要求1所述的方法，其中，待分析统计的客户语音文本数据的随录字段，包括：

3.根据权利要求1所述的方法，其中，所选择的业务节点元件之间的逻辑关系组合和/或服务场景元件之间的逻辑关系组合，包括：

与、或、非、临近、间距关系中的一种或任意组合。

4.根据权利要求1所述的方法，其中，所述第一关键词的逻辑关系包括：与、或、非、临近、间距中的一种或任意组合；

5.一种元件拆分与组合的语音文本数据分析设备，其中，该设备包括：

第一装置，用于对拟建模分析的样本语音文本数据中所包含的不同类别的元件进行拆分定义，基于所述拆分定义进行归类，得到业务节点元件和服务场景元件，所述业务节点元件由一个第一关键词组成或由若干个第一关键词及其逻辑关系组合生成；所述服务场景元件则由一个第二关键词或由若干个第二关键词及第二关键词的逻辑关系组合生成；

第三装置，用于获取待分析统计的客户语音文本数据，将描述不同的目标事件的模型与待分析统计的客户语音文本数据进行匹配，得到匹配的描述目标事件的模型，将从待分析统计的客户语音文本数据中提取到的关键词及所述关键词在待分析统计的客户语音文本数中的位置信息、时间信息，与元件组合形成的模型中所述的第一关键词及其逻辑关系和/或第二关键词及其逻辑关系进行匹配，得到匹配的描述目标事件的模型；

6.一种基于计算的设备，其中，包括：

处理器；以及

7.一种计算机可读存储介质，其上存储有计算机可执行指令，其中，该计算机可执行指令被处理器执行时使得该处理器：