CN109389971A

CN109389971A - 基于语音识别的保险录音质检方法、装置、设备和介质

Info

Publication number: CN109389971A
Application number: CN201810939070.1A
Authority: CN
Inventors: 张玉强
Original assignee: OneConnect Smart Technology Co Ltd
Current assignee: OneConnect Smart Technology Co Ltd
Priority date: 2018-08-17
Filing date: 2018-08-17
Publication date: 2019-02-26
Anticipated expiration: 2038-08-17
Also published as: EP3839942A1; WO2020034526A1; JP2021526242A; SG11202101542XA; EP3839942A4; CN109389971B; KR20210020007A; JP7025569B2

Abstract

本发明公开了一种基于语音识别的保险录音质检方法，包括以下步骤：接收保险录音质检请求，获取所述保险录音质检请求中包含的保单标识及所述保单标识关联的目标录音信息；将所述目标录音信息输入至预设语音识别模型，得到所述目标录音信息对应的目标文本信息；根据所述保单标识确定保险类型，获取所述保险类型对应的基础保单及所述基础保单中的保险信息，根据所述保险信息确定标准文本信息；将所述目标文本信息和所述标准文本信息进行比对得到比对结果，并根据所述比对结果，输出保险录音质检结果。本发明还公开了一种基于语音识别的保险录音质检装置、设备和介质。本发明通过语音识别的方式，实现高效自动地进行保险录音质检。

Description

基于语音识别的保险录音质检方法、装置、设备和介质

技术领域

本发明涉及信息处理领域，尤其涉及基于语音识别的保险录音质检方法、装置、设备和介质。

背景技术

随着保险业务的不断拓展，保险销售可能存在不规范的情况，中国保监会连手中国银监会下发了《关于进一步加强商业银行代理保险业务合规目标与风险管理的通知》部分保险销售必须全程录音，在后期可以通过录音进行保险质检，

一直以来保险录音质检因其工作繁重，重复性高，是各大保险公司投入人力物力相对较多的部门，传统人工质检主要是听录音，进行合规性检查。在质检的一般的流程为：根据用户选择的保单中所记录的保单号，查询出保单号相关录音信息，选择一条录音点击播放按钮进行录音播放。质检人员听录音以进行保险录音质检，这样的保险质检方法较为麻烦，且人力资源浪费严重，如何减少人力资源浪费，高效地进行保险录音质检成为了目前亟待解决的技术问题。

上述内容仅用于辅助理解本发明的技术方案，并不代表承认上述内容是现有技术。

发明内容

本发明的主要目的在于提供一种基于语音识别的保险录音质检方法、装置、设备和介质，旨在实现高效自动地进行保险录音质检。

为实现上述目的，本发明基于语音识别的保险录音质检方法，所述基于语音识别的保险录音质检方法包括以下步骤：

接收保险录音质检请求，获取所述保险录音质检请求中包含的保单标识及所述保单标识关联的目标录音信息；

将所述目标录音信息输入至预设语音识别模型，得到所述目标录音信息对应的目标文本信息；

根据所述保单标识确定保险类型，获取所述保险类型对应的基础保单及所述基础保单中的保险信息，根据所述保险信息确定标准文本信息；

将所述目标文本信息和所述标准文本信息进行比对得到比对结果，并根据所述比对结果，输出保险录音质检结果。

可选地，所述将所述目标录音信息输入至预设语音识别模型，得到所述目标录音信息对应的目标文本信息的步骤之前，包括：

分别采集预设方言语系和普通话语系朗读语音数据，并提取各所述语音数据对应的语音特征参数，将各所述语音特征参数组成语音特征集合；

抽取所述语音特征集合中预设比例的各所述语音特征参数，并通过各所述语音特征参数构建初始语音识别模型；

通过迭代算法训练所述初始语音识别模型，得到最优模型参数，并将训练得到所述最优模型参数对应的语音识别模型作为预设语音识别模型；

所述将所述目标录音信息输入至预设语音识别模型，得到所述目标录音信息对应的目标文本信息的步骤，包括：

将所述目标录音信息转化为声波图形，并获取所述声波图形对应的目标语音特征参数；

将所述目标语音特征参数输入预设语音识别模型，通过所述预设语音识别模型中的语系识别子模型，得到所述目标录音信息所属的目标语系；

获取所述预设语音识别模型中所述目标语系对应的语音识别子模型，通过所述语音识别子模型处理所述目标语音特征参数，得到所述目标录音信息对应的目标文本信息。

可选地，所述根据所述保单标识确定保险类型，获取所述保险类型对应的基础保单及所述基础保单中的保险信息，根据所述保险信息确定标准文本信息的步骤，包括：

解析所述保单标识，得到所述保单标识中的类别号，获取所述类别号对应的保险类型；

获取所述保险类型对应的基础保单及所述基础保单中的保险信息，将所述保险信息按预设权重规则进行处理，确定保险信息中的关键信息，并将所述关键信息作为标准文本信息。

可选地，所述将所述目标文本信息和所述标准文本信息进行比对得到比对结果，并根据所述比对结果，输出保险录音质检结果的步骤，包括：

按预设模糊匹配模型分别处理所述目标文本信息和所述标准文本信息，得到目标simhash序列和标准simhash序列；

将所述目标simhash序列与所述标准simhash序列进行比对确定相似度，并将所述相似度作为比对结果；

获取所述比对结果中的相似度，将所述相似度与预设阈值进行比较；

若所述相似度超过所述预设阈值，则输出保险录音质检结果为符合规范；

若所述相似度不超过所述预设阈值，则输出保险录音质检结果为不符合规范。

可选地，所述预设模糊匹配模型包含分词子算法和哈希子算法；

所述按预设模糊匹配模型分别处理所述目标文本信息和所述标准文本信息，得到目标simhash序列和标准simhash序列的步骤，包括：

将所述目标文本信息和所述标准文本信息按所述分词子算法处理，得到目标分词序列和标准分词序列；

通过所述哈希子算法处理所述目标分词序列和所述标准分词序列，得到目标哈希序列和标准哈希序列；

将所述目标哈希序列和所述标准哈希序列进行合并和降维处理，得到目标simhash序列和标准simhash序列。

可选地，所述将所述目标文本信息和所述标准文本信息进行比对得到比对结果，并根据所述比对结果，输出保险录音质检结果的步骤，还包括：

获取所述保单标识对应的标准文本信息，按预设分词法分别处理所述目标文本信息和所述标准文本信息，得到所述目标文本信息对应的目标关键字集合和所述标准文本信息对应的标准关键字集合；

将所述目标关键字集合和所述标准关键字集合进行比对，以判断所述标准关键字集合是否为所述目标关键字集合的子集；

若所述标准关键字集合是所述目标关键字集合的子集，则输出保险录音质检结果为符合规范；

若所述标准关键字集合不是所述目标关键字集合的子集，则输出保险录音质检结果为不符合规范。

可选地，所述将所述目标文本信息和所述标准文本信息进行比对得到比对结果，并根据所述比对结果，输出保险录音质检结果的步骤之后，包括：

将所述保险录音质检结果输入至预设质检模板中，得到所述保险录音质检请求对应的质检日志；

显示所述质检日志中的所述保险录音质检结果，以供质检人员查看。

此外，为实现上述目的，本发明还提供一种基于语音识别的保险录音质检装置，所述基于语音识别的保险录音质检装置包括：

获取模块，用于接收保险录音质检请求，获取所述保险录音质检请求中包含的保单标识及所述保单标识关联的目标录音信息；

输入识别模块，用于将所述目标录音信息输入至预设语音识别模型，得到所述目标录音信息对应的目标文本信息；

标准获取模块，用于根据所述保单标识确定保险类型，获取所述保险类型对应的基础保单及所述基础保单中的保险信息，根据所述保险信息确定标准文本信息；

比对输出模块，用于将所述目标文本信息和所述标准文本信息进行比对得到比对结果，并根据所述比对结果，输出保险录音质检结果。

此外，为实现上述目的，本发明还提供一种基于语音识别的保险录音质检设备；

所述基于语音识别的保险录音质检设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其中：

所述计算机程序被所述处理器执行时实现如上所述的基于语音识别的保险录音质检方法的步骤。

此外，为实现上述目的，本发明还提供计算机存储介质；

所述计算机存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如上述的基于语音识别的保险录音质检方法的步骤。

本发明实施例提出的一种基于语音识别的保险录音质检方法、装置、设备和介质，质检终端接收保险录音质检请求，获取所述保险录音质检请求中包含的保单标识及所述保单标识关联的目标录音信息；将所述目标录音信息输入至预设语音识别模型，得到所述目标录音信息对应的目标文本信息；根据所述保单标识确定保险类型，获取所述保险类型对应的基础保单及所述基础保单中的保险信息，根据所述保险信息确定标准文本信息；将所述目标文本信息和所述标准文本信息进行比对得到比对结果，并根据所述比对结果，输出保险录音质检结果，在本发明中在保险质检终端上预先设置语音识别模型，对保险销售时的录音信息进行识别，得到录音信息对应的文本信息，并根据识别得到的文本信息判断保险销售是否符合规范，实现了自动保险录音的质检，提高了保险质检的效率，减少了人力资源的浪费，与此同时，本发明中通过将文本信息和标准文本信息进行比对，提高了保险质检的准确率。

附图说明

图1是本发明实施例方案涉及的硬件运行环境的装置结构示意图；

图2为本发明基于语音识别的保险录音质检方法第一实施例的流程示意图；

图3为本发明基于语音识别的保险录音质检装置一实施例的功能模块示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

由于现有技术中只能通过质检人员听录音信息的方式，由质检人员人工判断录音信息中是否包含全部的用户须知信息，以得到保险录音质检结果。

本发明实施例的主要解决方案是：预先设置语音识别模型，通过语音识别模型将录音信息进行识别转换为对应的文本信息，并将转换得到的文本信息与标准文本信息进行比对，若文本信息与标准文本信息匹配(即，确定录音信息中包含有全部用户须知信息)，则质检终端判定保险录音质检结果为符合保险销售规范；若文本信息与标准文本信息不匹配，(即，确定录音信息中包含有部分用户须知信息，或者不包含用户须知信息)，则质检终端判定保险录音质检结果为不符合保险销售规范。

例如，将保单编号为0001的保险录音信息输入至预设语音识别模型，对保险录音信息进行语音和语义识别得到保险录音文本，从保险录音文本中识别得到的关键字为投保费用1000元，保险期限为2020年5月，保险赔偿额度为20000元，将各关键字与该保单标识对应的各标准关键字进比对，即，预设质检模型通过同义词识别，得到录音关键字集合中：投保费用1000元对应投保金额1000元，保险期限为2020年对应保险期限为2年，保险赔偿额度为20000元对应的赔偿额度为20000元。然后，获取保单编号为0001的对应的标准文本信息，获取标准文本信息中的各标准关键字：投保金额1000元，保险期限为2年，赔偿额度为20000元。通过将关键字集合中的关键字与标准文本信息中的各标准关键字进行比对，确定质检关键字集合中的关键字与各标准关键字匹配，保险录音的质检的结果为通过，反之。本发明提供一种解决方案将人工的保险质检转化为自动质检，提高了保险质检的效率，减少了人力资源和时间成本等的浪费。

如图1所示，图1是本发明实施例方案涉及的硬件运行环境的终端(又叫基于语音识别的保险录音质检设备，其中，基于语音识别的保险录音质检设备可以是由单独的基于语音识别的保险录音质检装置构成，也可以是由其他装置与基于语音识别的保险录音质检装置组合形成)结构示意图。

本发明实施例终端可以固定终端，也可以是移动终端，其中，固定终端如“物联网设备”、带联网功能的智能空调、智能电灯、智能电源等等；移动终端，如带联网功能的智能音箱、自动驾驶汽车、PC(personal computer)个人计算机，智能手机、平板电脑、电子书阅读器、便携计算机等具有显示功能的终端设备。

如图1所示，该终端可以包括：处理器1001，例如中央处理器Central ProcessingUnit，CPU)，网络接口1004，用户接口1003，存储器1005，通信总线1002。其中，通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard)，可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真WIreless-FIdelity，WIFI接口)。存储器1005可以是高速RAM存储器，也可以是稳定的存储器(non-volatile memory)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

可选地，终端还可以包括摄像头、RF(Radio Frequency，射频)电路，传感器、音频电路、WiFi模块；输入单元，比显示屏，触摸屏；网络接口可选除无线接口中除WiFi外，蓝牙、探针、3G/4G/5G(前面的数字表示的是蜂窝移动通信网络的代数。就是表示是第几代的网络。英文字母G表示generation)联网基站设备等等。其中，传感器比如光传感器、运动传感器以及其他传感器。具体地，光传感器可包括环境光传感器及接近传感器；当然，移动终端还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器，在此不再赘述。

本领域技术人员可以理解，图1中示出的终端结构并不构成对终端的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图1所示，该计算机软件产品存储在一个存储介质(存储介质：又叫计算机存储介质、计算机介质、可读介质、可读存储介质、计算机可读存储介质或者直接叫介质等，如RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法，作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及计算机程序。

在图1所示的终端中，网络接口1004主要用于连接后台服务器，与后台服务器进行数据通信；用户接口1003主要用于连接客户端(用户端)，与客户端进行数据通信；而处理器1001可以用于调用存储器1005中存储的计算机程序，并执行本发明以下实施例提供的基于语音识别的保险录音质检方法中的步骤。

参照图2，本发明基于语音识别的保险录音质检方法的第一实施例中，所述基于语音识别的保险录音质检方法包括：

步骤S10，接收保险录音质检请求，获取所述保险录音质检请求中包含的保单标识及所述保单标识关联的目标录音信息。

用户在质检终端(质检终端是指如图1所示的终端)上触发保险录音质检请求，触发保险录音质检请求的具体形式不做限定；质检终端接收保险录音质检请求，获取保险录音质检请求中包含的保单标识，其中，保单标识是指用唯一识别保险单的标识信息，例如，保单编号；然后，质检终端获取保单标识关联的目标录音信息。

其中，为了防止购买人在没有查看保险单和/或保险合同等，购买保险出现保险购买的纠纷等情况发生，保险销售人员在保险销售的过程中跟购买人详细说明保险产品信息，保险销售人员在保险销售的过程中需要进行全程录音，并在保险销售完成时的保存的保险销售录音信息，并将保险销售录音信息与保单标识进行关联保存至数据库，本实施例中将数据库中保险录音质检请求中保单标识关联保存的保险销售录音信息作为目标录音信息。

例如，质检人员输入保单号码CCBF1022xxx259触发保险录音质检请求，质检终端接收保险录音质检请求，质检终端获取保险录音质检请求中的保单号码CCBF1022xxx259，并获取CCBF1022xxx259关联的保险销售录音信息作为目标录音信息。

步骤S20，将所述目标录音信息输入至预设语音识别模型，得到所述目标录音信息对应的目标文本信息。

质检终端将目标录音信息输入至预设语音识别模型，其中，预设语音识别模型是指预先训练得到的语音识别模型，预设语音识别模型中包含不同的识别子模型，例如，语系识别子模型(用于识别目标录音信息对应的语系，即，语系识别子模型用于识别目标录音信息是吴方言、湘方言、客家方言、闽方言、粤方言、赣方言或者普通话)和语音识别子模型，其中，语音识别子模型包括：吴方言识别子模型、湘方言识别子模型、客家方言识别子模型，闽方言识别子模型等等，通过预设语音识别模型对目标录音信息进行识别，得到所述目标录音信息对应的目标文本信息。

其中，通过预设语音识别模型将目标录音信息转换为对应的目标文本信息的步骤包括:

质检终端将所述目标录音信息转化为声波图形，并获取声波图形中对应的语音特征参数，其中，目标语音特征参数是指声波图形上解析得到的参数，例如，声波图形的Mel频率倒谱系数；质检终端将所述目标语音特征参数输入预设语音识别模型，通过所述预设语音识别模型中的语系识别子模型，得到所述目标录音信息所属的目标语系；即，质检终端首先利用预设语音识别模型中的语系识别子模型处理目标语音特征参数，确定目标录音信息对应的语系；然后获取所述预设语音识别模型中所述目标语系对应的语音识别子模型，通过所述语音识别子模型处理所述目标语音特征参数，得到所述目标录音信息对应的目标文本信息，例如，质检终端得到目标录音信息为闽方言，则选择闽方言识别子模型处理目标语音特征参数，得到目标录音信息对应的目标文本信息。

本实施例中通过预设语音识别模型将录音信息转换为文本信息，可以有效地识别不同的语系，例如，湘方言、客家方言等等，使得语音识别更加准确，保险录音质检更加智能，不需要质检人员人工听取录音信息进行保险录音质检，减少了保险录音质检的人力资源的浪费。

步骤S30，根据所述保单标识确定保险类型，获取所述保险类型对应的基础保单及所述基础保单中的保险信息，根据所述保险信息确定标准文本信息。

质检终端根据所述保单标识确定保险类型，即，质检终端解析所述保单标识，得到所述保单标识中的类别号，获取所述类别号对应的保险类型，例如，保单标识为CCBF1022xxx259，则质检终端根据CCBF1022xxx259的编码设置规则，得到CCBF1022xxx259中的CCBF为保险销售机构，1为健康保险；0对应为投保额度为1000风险保额为100000；2对应为保险期限为2年等等；质检终端根据保单标识的解析结果，获取该保险类型对应的基础保单，获取基础保单中的保险信息，将所述保险信息按预设权重规则(其中，预设权重规则是指预先设置的权重设置规则)进行处理，确定保险信息中的关键信息，并将所述关键信息作为标准文本信息，即，质检终端将保险信息中的各个字段按预设权重规则设置对应权重，并将权重高于临界权重的关键信息作为标准文本信息。

本实施例中预先设置标准文本信息，并将标准文本信息作为目标录音信息的比对规则，有效地避免了人工质检出现的多重标准情况。

步骤S40，将所述目标文本信息和所述标准文本信息进行比对得到比对结果，并根据所述比对结果，输出保险录音质检结果。

质检终端将所述目标文本信息和所述标准文本信息进行比对，其中，质检终端将所述目标文本信息和所述标准文本信息可以采用不同的实现方式，例如，方式一：按照模糊匹配算法，确定目标文本信息和所述标准文本信息的相似度；方式二：质检终端解析目标文本信息，并将目标文本信息与标准文本信息进行比对，确定目标文本信息中是否包含标准文本信息。

质检终端获取比对结果，并根据所述比对结果，输出保险录音质检结果，例如，质检终端获取方式一得到的比对结果，若目标文本信息和所述标准文本信息的相似度高于80％，则保险录音质检结果为通过，若目标文本信息和所述标准文本信息的相似度小于等于80％，则保险录音质检结果为不通过；质检终端获取方式二得到的比对结果，若目标文本信息中包含标准文本信息，则保险录音质检结果为通过；若目标文本信息中不包含标准文本信息或者部分包含标准文本信息，则保险录音质检结果为不通过。

在本实施例中保险质检终端上预先设置语音识别模型，对保险销售时的录音信息进行识别，得到录音信息对应的文本信息，并根据识别得到的文本信息判断保险销售是否符合规范，在这个过程中不需要人工进行质检，提高了保险的质检效率，减少了人力资源的浪费，与此同时，本发明中通过将文本信息和标准文本信息进行比对，提高了保险质检的准确率。

进一步地，在本发明第一实施例之前，需要预先设置语音识别模型，其中，设置语音识别模型的步骤包括：

步骤S01，分别采集预设方言语系和普通话语系朗读语音数据，并提取各所述语音数据对应的语音特征参数，将各所述语音特征参数组成语音特征集合。

在本发明实施例中，模型构建终端采集多名测试者通过预设方言语系和普通话朗读保险合同条款信息对应的语音数据，其中，预设方言语系包括官话方言、吴方言、湘方言、客家方言、闽方言、粤方言和赣方言。

模型构建终端将各语音数据进行预处理，预处理主要包括预加重、加窗分帧处理、端点检测和降噪处理四个过程。其中，预加重处理是利用信号特性和噪声特性的差别来有效地对信号进行处理，对语音的高频部分进行加重，去除口鼻辐射的影响，增加语音的高频分辨率。加窗分帧处理包括加窗和分帧，其中，一般的分帧方法为交叠分段的方法，前一帧和后一帧的交叠部分称为帧移，而分帧是采用可移动的有限长度的窗口进行加权的方法来实现的，即，用窗函数处理形成加窗语音信号，其中窗函数一般采用汉明窗和矩形窗。端点检测是从一段给定的语音信号中找出语音的起始点和结束点，正确、有效的进行端点检测不仅可以减少计算量和缩短处理时间，而且还能排除无声段的噪声干扰、提高语音识别的正确率。语音降噪处理主要是通过自适应滤波器/谱减法/维纳滤波法等降噪算法来实现的，以提高性噪比。

模型构建终端提取预处理完成的语音数据对应的语音特征参数，其中，语音特征参数为MFCC(Mel频率倒谱系数)，并将各个语音特征参数进行汇总，组成语音特征集合。

步骤S02，抽取所述语音特征集合中预设比例的各所述语音特征参数，并通过各所述语音特征参数构建初始语音识别模型。

模型构建终端抽取所述语音特征集合中预设比例的各所述语音特征参数，其中，预设比例根据具体的情况设置，例如，预设比例设置为1％，模型构建终端利用提取的1％的语音特征参数构建初始语音识别模型。其中，初始语音识别模型可以是基于HMM(HiddenMarkov Model，隐马尔可夫模型)建立的。

步骤S03，通过迭代算法训练所述初始语音识别模型，得到最优模型参数，并将训练得到所述最优模型参数对应的语音识别模型作为预设语音识别模型。

模型构建终端利用99％的语音特征参数对构建的初始语音识别模型进行迭代算法训练，计算出语音识别模型的最优模型参数，并根据所述语音识别模型的最优模型参数得到所述训练好的预设语音识别模型。其中，迭代算法可以采用Baum–Welch(鲍姆韦尔奇)算法，也可以采用经K均值算法改进后的Baum–Welch算法，可提高模型的准确性。具体的，语音识别模型的训练过程如下：1)基于HMM模型构建语音是被模型，并设置语音识别模型的参数初始值，参数初始值可以通过等划分状态或者根据经验估计设置；2)设置最大的迭代次数和收敛阈值；3)采用Viterbi算法(Viterbi Algorithm，维特比算法)对输入的语音数据进行状态的分段操作；4)通过迭代算法(Baum-welch算法)对该语音识别模型的参数进行更新，并对语音数据进行迭代训练，不断地循环迭代，直到达到先前设置的迭代次数或已经收敛，此时，可得到该语音识别模型的最优模型参数，进而根据该最优模型参数获得训练好的语音识别模型。

需要补充说明的是，训练的语音识别模型中包含不同的识别子模型，例如，语系识别子模型(用于识别目标录音信息对应的语系，即，语系识别子模型用于识别目标录音信息是吴方言、湘方言、客家方言、闽方言、粤方言、赣方言或者普通话)和语音识别子模型，其中，语音识别子模型包括：吴方言识别子模型、湘方言识别子模型、客家方言识别子模型，闽方言识别子模型等等；本实施例中预先训练语音识别模型，实现机器的语音识别，保证语音识别的准确率，减少了由于语音识别不准确造成的保险录音质检结果的误差。

在本发明第一实施例的基础上，进一步提出了本发明基于语音识别的保险录音质检方法的本实施例。

本实施例是第一实施例中步骤S40的细化，在本实施例中给出了将所述目标文本信息和所述标准文本信息进行比对得到比对结果，并根据所述比对结果，输出保险录音质检结果的两种具体实现方式。

方式一：将文档信息转换为simhash数字，进行simhash数字的比较，得到保险录音质检结果，具体地：

步骤S41，按预设模糊匹配模型分别处理所述目标文本信息和所述标准文本信息，得到目标simhash序列和标准simhash序列；

质检终端按预设模糊匹配模型分别处理所述目标文本信息和所述标准文本信息，其中，预设模糊匹配模型是指预先设置的预设模糊匹配模型模型，预设模糊匹配模型中可包括：分词子算法和哈希子算法等等。

即，首先，质检终端将所述目标文本信息和所述标准文本信息按分词子算法进行分词，得到的目标文本信息对应的目标分词序列(又叫文本字段)和标准文本信息对应的标准分词序列；其次，质检终端通过所述哈希子算法处理所述目标分词序列和所述标准分词序列，得到目标哈希序列和标准哈希序列；即，质检终端将所述目标文本信息和所述标准文本信息对应的目标分词序列和所述标准分词序列按哈希子算法进行转化得到目标哈希序列和标准哈希；然后，质检终端将所述目标哈希序列和所述标准哈希序列进行合并和降维处理，得到目标simhash序列和标准simhash序列。

本实施例中将目标文本信息和标准文本信息，处理得到目标simhash序列和标准simhash序列，通过目标simhash序列和标准simhash序列实现文档信息的比对。

步骤S42，将所述目标simhash序列与所述标准simhash序列进行比对确定相似度，并将所述相似度作为比对结果。

质检终端将所述目标simhash序列与所述标准simhash序列进行比对，确定目标simhash序列和所述标准simhash序列的相似度，即，质检终端确定目标simhash序列与所述标准simhash序列的相似百分比，并将所述相似度作为比对结果。

步骤S43，获取所述比对结果中的相似度，将所述相似度与预设阈值进行比较。

质检终端获取所述比对结果中的相似度，质检终端将相似度与预设阈值进行比较，其中，预设阈值是指预先设置的相似度临界值，预设阈值可以根据具体情况设置，例如将预设阈值设置为80％。

步骤S44，若所述相似度超过所述预设阈值，则输出保险录音质检结果为符合规范，若所述相似度不超过所述预设阈值，则输出保险录音质检结果为不符合规范。

质检终端获取相似度与预设阈值的比对结果，若所述相似度超过所述预设阈值，则输出保险录音质检结果为符合规范，若所述相似度不超过所述预设阈值，则输出保险录音质检结果为不符合规范。

在本实施例中通过将文档信息转换为simhash数字，比较的是两个文档是否相似，提高了比对效率。

方式二，将目标文本信息和所述标准文本信息进行分词处理，并根据分词处理得到的关键字集合判断保险录音质检结果，具体地：

步骤S45，获取所述保单标识对应的标准文本信息，按预设分词法分别处理所述目标文本信息和所述标准文本信息，得到所述目标文本信息对应的目标关键字集合和所述标准文本信息对应的标准关键字集合。

质检终端获取所述保单标识对应的标准文本信息，按预设分词法分别处理所述目标文本信息和所述标准文本信息，其中，预设分词法设置预先设置的分词算法，得到所述目标文本信息对应的目标关键字集合和所述标准文本信息对应的标准关键字集合。

步骤S46，将所述目标关键字集合和所述标准关键字集合进行比对，以判断所述标准关键字集合是否为所述目标关键字集合的子集。

质检终端将所述目标关键字集合和所述标准关键字集合进行比对，即，质检终端将目标关键字集合中的各关键字与所述标准关键字集合中的各关键字进行比较，通过判断目标关键字集合中是否包含标准关键字集合中的全部关键字，确定所述标准关键字集合是否为所述目标关键字集合的子集。

步骤S47，若所述标准关键字集合是所述目标关键字集合的子集，则输出保险录音质检结果为符合规范；若所述标准关键字集合不是所述目标关键字集合的子集，则输出保险录音质检结果为不符合规范。

若所述标准关键字集合是所述目标关键字集合的子集，即，目标关键字集合中包含有标准关键字集合中的全部关键字，则输出保险录音质检结果为符合规范；若所述标准关键字集合不是所述目标关键字集合的子集，即，目标关键字集合中包含有标准关键字集合中的部分关键字，或者目标关键字集合中不包含标准关键字集合中的关键字，则输出保险录音质检结果为不符合规范。在本实施例中通过进行关键字比对的方法确定目标文本信息和所述标准文本信息的是否匹配，最终得到保险录音质检结果，使得保险质检更加智能。

需要补充说明的是：本实施例中给出的两种实现方式可以进行结合，将两种方式处理得到的结果进行加权并求取平均值，并最终确定保险录音质检结果，其中，方式一和方式二进行结合的具体情况本实施例中不做赘述。

进一步的，在上述实施例的基础上，提出了本发明基于语音识别的保险录音质检方法的第二实施例中。

本实施例中通过将录音质检结果进行输出显示，方便用户查看，具体地，所述基于语音识别的保险录音质检方法包括：

步骤S50，将所述保险录音质检结果输入至预设质检模板中，得到所述保险录音质检请求对应的质检日志。

质检终端将所述保险录音质检结果输入至预设质检模板中，其中，预设质检模板是指预先设置的质检文档，质检终端接收保险录音质检结果将保险录音质检结果输入预设质检模板对应位置，得到所述保险录音质检请求对应的质检日志。

步骤S60，显示所述质检日志中的所述保险录音质检结果，以供质检人员查看。

质检终端显示所述质检日志中的保险录音质检结果，以供质检人员查看质检日志，质检。在本实施例中将保险录音质检结果输入至预设质检模板中，得到保险录音质检请求对应的质检日志，使得保险质检人员的查看更加便捷。

此外，参照图3，本发明实施例还提出一种基于语音识别的保险录音质检装置，所述基于语音识别的保险录音质检装置包括：

获取模块10，用于接收保险录音质检请求，获取所述保险录音质检请求中包含的保单标识及所述保单标识关联的目标录音信息；

输入识别模块20，用于将所述目标录音信息输入至预设语音识别模型，得到所述目标录音信息对应的目标文本信息；

标准获取模块30，用于根据所述保单标识确定保险类型，获取所述保险类型对应的基础保单及所述基础保单中的保险信息，根据所述保险信息确定标准文本信息；

比对输出模块40，用于将所述目标文本信息和所述标准文本信息进行比对得到比对结果，并根据所述比对结果，输出保险录音质检结果。

可选地，所述基于语音识别的保险录音质检装置，包括：

采集模块，用于分别采集预设方言语系和普通话语系朗读语音数据，并提取各所述语音数据对应的语音特征参数，将各所述语音特征参数组成语音特征集合；

抽取构建模块，用于抽取所述语音特征集合中预设比例的各所述语音特征参数，并通过各所述语音特征参数构建初始语音识别模型；

模型确定模块，用于通过迭代算法训练所述初始语音识别模型，得到最优模型参数，并将训练得到所述最优模型参数对应的语音识别模型作为预设语音识别模型；

所述输入识别模块20，包括：

参数获取单元，用于将所述目标录音信息转化为声波图形，并获取所述声波图形对应的目标语音特征参数；

语系确定单元，用于将所述目标语音特征参数输入预设语音识别模型，通过所述预设语音识别模型中的语系识别子模型，得到所述目标录音信息所属的目标语系；

识别单元，用于获取所述预设语音识别模型中所述目标语系对应的语音识别子模型，通过所述语音识别子模型处理所述目标语音特征参数，得到所述目标录音信息对应的目标文本信息。

可选地，所述标准获取模块30，包括：

解析单元，用于解析所述保单标识，得到所述保单标识中的类别号，获取所述类别号对应的保险类型；

标准获取单元，用于获取所述保险类型对应的基础保单及所述基础保单中的保险信息，将所述保险信息按预设权重规则进行处理，确定保险信息中的关键信息，并将所述关键信息作为标准文本信息。

可选地，所述比对输出模块40，包括：

Simhash转化单元，用于按预设模糊匹配模型分别处理所述目标文本信息和所述标准文本信息，得到目标simhash序列和标准simhash序列；

比对单元，用于将所述目标simhash序列与所述标准simhash序列进行比对确定相似度，并将所述相似度作为比对结果；

获取比较单元，用于获取所述比对结果中的相似度，将所述相似度与预设阈值进行比较；

第一判定单元，用于若所述相似度超过所述预设阈值，则输出保险录音质检结果为符合规范；

第二判定单元，用于若所述相似度不超过所述预设阈值，则输出保险录音质检结果为不符合规范。

可选地，所述预设模糊匹配模型包含分词子算法和哈希子算法；所述Simhash转化单元，还用于：

可选地，所述比对输出模块40，还包括：

分词处理单元，用于获取所述保单标识对应的标准文本信息，按预设分词法分别处理所述目标文本信息和所述标准文本信息，得到所述目标文本信息对应的目标关键字集合和所述标准文本信息对应的标准关键字集合；

关键字比对单元，用于将所述目标关键字集合和所述标准关键字集合进行比对，以判断所述标准关键字集合是否为所述目标关键字集合的子集；

第一输出单元，用于若所述标准关键字集合是所述目标关键字集合的子集，则输出保险录音质检结果为符合规范；

第二输出单元，用于若所述标准关键字集合不是所述目标关键字集合的子集，则输出保险录音质检结果为不符合规范。

可选地，所述基于语音识别的保险录音质检装置，还包括：

日志生成模块，用于将所述保险录音质检结果输入至预设质检模板中，得到所述保险录音质检请求对应的质检日志；

日志显示模块，用于显示所述质检日志中的所述保险录音质检结果，以供质检人员查看。

其中，基于语音识别的保险录音质检装置的各个功能模块实现的步骤可参照本发明基于语音识别的保险录音质检方法的各个实施例，此处不再赘述。

此外，本发明实施例还提出一种计算机存储介质。

所述计算机存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现上述实施例提供的基于语音识别的保险录音质检方法中的操作。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体/操作/对象与另一个实体/操作/对象区分开来，而不一定要求或者暗示这些实体/操作/对象之间存在任何这种实际的关系或者顺序；术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

对于装置实施例而言，由于其基本相似于方法实施例，所以描述得比较简单，相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的，其中作为分离部件说明的单元可以是或者也可以不是物理上分开的。可以根据实际的需要选择中的部分或者全部模块来实现本发明方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，空调器，或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种基于语音识别的保险录音质检方法，其特征在于，所述基于语音识别的保险录音质检方法包括以下步骤：

2.如权利要求1所述的基于语音识别的保险录音质检方法，其特征在于，所述将所述目标录音信息输入至预设语音识别模型，得到所述目标录音信息对应的目标文本信息的步骤之前，包括：

3.如权利要求1所述的基于语音识别的保险录音质检方法，其特征在于，所述根据所述保单标识确定保险类型，获取所述保险类型对应的基础保单及所述基础保单中的保险信息，根据所述保险信息确定标准文本信息的步骤，包括：

4.如权利要求1所述的基于语音识别的保险录音质检方法，其特征在于，所述将所述目标文本信息和所述标准文本信息进行比对得到比对结果，并根据所述比对结果，输出保险录音质检结果的步骤，包括：

5.如权利要求4所述的基于语音识别的保险录音质检方法，其特征在于，所述预设模糊匹配模型包含分词子算法和哈希子算法；

6.如权利要求1所述的基于语音识别的保险录音质检方法，其特征在于，所述将所述目标文本信息和所述标准文本信息进行比对得到比对结果，并根据所述比对结果，输出保险录音质检结果的步骤，还包括：

7.如权利要求1所述的基于语音识别的保险录音质检方法，其特征在于，所述将所述目标文本信息和所述标准文本信息进行比对得到比对结果，并根据所述比对结果，输出保险录音质检结果的步骤之后，包括：

8.一种基于语音识别的保险录音质检装置，其特征在于，所述基于语音识别的保险录音质检装置包括：

9.一种基于语音识别的保险录音质检设备，其特征在于，所述基于语音识别的保险录音质检设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其中：

所述计算机程序被所述处理器执行时实现如权利要求1至7中任一项所述的基于语音识别的保险录音质检方法的步骤。

10.一种计算机存储介质，其特征在于，所述计算机存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的基于语音识别的保险录音质检方法的步骤。