CN109524009B

CN109524009B - 基于语音识别的保单录入方法和相关装置

Info

Publication number: CN109524009B
Application number: CN201811527496.2A
Authority: CN
Inventors: 罗柏发
Original assignee: Ping An Property and Casualty Insurance Company of China Ltd
Current assignee: Ping An Property and Casualty Insurance Company of China Ltd
Priority date: 2018-12-13
Filing date: 2018-12-13
Publication date: 2024-04-09
Anticipated expiration: 2038-12-13
Also published as: CN109524009A

Abstract

本发明提供用于基于语音识别的保单录入方法和相关装置，方法包括：接收语音采集终端发送的目标语音数据；对目标语音数据进行语音识别，得到目标语音数据对应的保单信息；根据保单信息以及目标保单项目确定目标保单项目对应的多个第一信息选项；将多个第一信息选项发送给语音采集终端，以使语音采集终端在保单录入用户对目标保单项目进行录入时，向保单录入用户显示多个第一信息选项；接收语音采集终端针对目标保单项目返回的保单项目信息，保单项目信息关联于多个第一信息选项中的至少一个信息选项；将保单项目信息作为目标保单项目对应的信息录入至保单信息存储系统，保单信息存储系统用于保存保单信息。该技术方案可以提高保单录入的效率。

Description

基于语音识别的保单录入方法和相关装置

技术领域

本发明涉及计算机技术领域，尤其涉及基于语音识别的保单录入方法和相关装置。

背景技术

保单是保险单的简称，是指保险人与投保人签订保险合同的书面证明，保单明确完整地记载了有关保险双方的权利和义务，其包含的内容主要有被保险人名称、保险标的名称及其存放地点或所处状态、保险金额、保险期限、保险费等双方对有关保险标的事项的说明，其包含的内容还可以包括保险条款或双方约定的其他条件以及保单变更、转让和注销等附加条件。

保险经纪人在确定与投保人签订保单后保险经纪人可以通过电子系统录入该保单中的信息以进行存档，在目前的方式中，在填完纸质档的保单后，需要保险经纪人或者保单录入人员在保单录入系统上手动录入保单中的信息，这样的问题在于：录入的效率低下。

发明内容

本发明实施例提供基于语音识别的保单录入方法和相关装置，解决手工录入保单的方式的录入效率低下的问题。

第一方面，提供一种基于语音识别的保单录入方法，包括：

接收语音采集终端发送的目标语音数据，所述目标语音数据为所述语音采集终端采集到的目标保单对应的语音数据；

对所述目标语音数据进行语音识别，得到所述目标语音数据对应的保单信息；

根据所述保单信息以及目标保单项目确定所述目标保单项目对应的多个第一信息选项，所述目标保单项目为待录入的保单项目；

将所述多个第一信息选项发送给所述语音采集终端，以使所述语音采集终端在保单录入用户对所述目标保单项目进行录入时，向所述保单录入用户显示所述多个第一信息选项；

接收所述语音采集终端针对所述目标保单项目返回的保单项目信息，所述保单项目信息关联于所述多个第一信息选项中的至少一个信息选项；

将所述保单项目信息作为所述目标保单项目对应的信息录入至保单信息存储系统，所述保单信息存储系统用于保存保单信息。

本发明实施例中，通过对目标保单对应的语音数据进行语音识别得到保单信息，然后针对要录入的保单项目生成多个信息选项并通过语音采集终端向保单录入用户显示这些信息选项，使得用户可以直接在这些信息选项进行选择或者在这些信息选项的基础上进行少许修改，即可完成对要录入的保单项目所对应的信息的录入，省去用户手动输入保单项目信息的过程，提高保单录入的效率。

结合第一方面，在一种可能的实现方式中，所述根据所述保单信息以及目标保单项目确定所述目标保单项目对应的多个第一信息选项，包括：根据所述保单信息生成多个信息选项；根据所述多个信息选项中的各个信息选项对应的语音片段数据在所述目标语音数据中的先后顺序分别确定所述各个信息选项的顺序；根据所述目标保单中的各个保单项目在预设的保单模板信息中的先后顺序确定目标保单项目的顺序；根据所述各个信息选项的顺序与目标保单项目的顺序确定目标保单项目对应的多个第一信息选项。通过分别确定各个信息选项的顺序和目标保单项目的顺序，可确定目标保单项目的多个信息选项。

结合第一方面，在一种可能的实现方式中，所述根据所述保单信息生成多个信息选项，包括：在所述保单信息中确定至少一个第一字符和至少一个第二字符，并确定所述第一字符对应的语音片段数据和所述第二字符对应的语音片段数据之间的停顿时长，所述第一字符对应的语音片段数据和所述第二字符对应的语音片段数据在所述目标语音数据中为相邻的语音片段数据；根据所述停顿时长以及所述保单信息生成多个信息选项。通过确定字符所对应的语音片段的停顿时长，可根据停顿时长和保单信息生成多个信息选项。

结合第一方面，在一种可能的实现方式中，所述在所述保单信息中确定至少一个第一字符和至少一个第二字符，包括：在所述保单信息中确定第三字符以及所述第三字符对应的第一等同字符，所述第一等同字符与所述第三字符对应所述目标语音数据中的同一语音片段数据；将所述第三字符以及所述第一等同字符确定为至少一个第一字符，并将第四字符以及所述第四字符对应的第二等同字符确定为至少一个第二字符，所述第四字符在所述保单信息中与所述第三字符或所述第一等同字符相邻，所述第二等同字符与所述第四字符对应所述目标语音数据中的同一语音片段数据。通过确定保单信息中同一语音片段数据对应的字符，可以确定相邻的两个语音片段数据所对应的字符。

结合第一方面，在一种可能的实现方式中，所述对所述目标语音数据进行语音识别，得到所述目标语音数据对应的保单信息，包括：通过基于统计模型的方法，或者，基于声道模型和语音知识的方法，或者，基于标准模板匹配的方法，或者，基于神经网络的方法对所述目标语音数据进行语音识别，得到所述目标语音数据对应的保单信息。通过上述语音识别的方式，可以实现对语音数据的识别。

结合第一方面，在一种可能的实现方式中，所述通过基于统计模型的方法对所述目标语音数据进行语音识别得到，得到所述目标语音数据对应的保单信息，包括：对所述目标语音数据进行预处理，得到所述目标语音数据对应的多个语音小段；对所述多个语音小段中的各个语音小段进行声学特征提取，得到M行*N列的观测序列，其中，M为声学特征的维度，N为所述语音小段的数量；将所述观测序列送入预先训练得到的基于隐马尔可夫模型的状态网络中，在所述状态网络中查找与所述观测序列的匹配度大于预设阈值的至少一个目标路径，将所述至少一个目标路径对应的文本内容确定为所述保单信息。

结合第一方面，在一种可能的实现方式中，所述保单信息存储系统为区块链系统，所述将所述保单项目信息作为所述目标保单项目对应的信息录入至保单信息存储系统包括：生成所述保单信息发布事务，所述保单信息发布事务包括所述保单项目信息；将所述保单信息发布事务发送给所述区块链系统中的背书节点进行事务背书，所述背书节点为基于智能合约设置的背书策略中的节点；当根据所述背书节点返回的背书结果确定已完成对所述保单信息发布事务的事务背书时，将所述保单信息发布事务发送给所述联盟链系统中的命令节点，以使所述命令节点对所述保单信息发布事务进行排序并形成所述保单信息发布事务对应的区块；接收所述命令节点发送的所述区块；在对所述区块的验证通过的情况下，在本地保存所述区块。将保单信息保存到区块链系统中起到了对保单信息进行备份的作用，区块链系统的不可篡改性保证了区块链系统中的保单信息的真实性和可靠性。

第二方面，提供一种基于语音识别的保单录入装置，包括：

语音数据接收模块，用于接收语音采集终端发送的目标语音数据，所述目标语音数据为所述语音采集终端采集到的目标保单对应的语音数据；

语音识别模块，用于对所述目标语音数据进行语音识别，得到所述目标语音数据对应的保单信息；

选项生成模块，用于根据所述保单信息以及目标保单项目确定所述目标保单项目对应的多个第一信息选项，所述目标保单项目为待录入的保单项目；

选项发送模块，用于将所述多个第一信息选项发送给所述语音采集终端，以使所述语音采集终端在保单录入用户对所述目标保单项目进行录入时，向所述保单录入用户显示所述多个第一信息选项；

信息接收模块，用于接收所述语音采集终端针对所述目标保单项目返回的保单项目信息，所述保单项目信息关联于所述多个第一信息选项中的至少一个信息选项；

信息录入模块，用于将所述保单项目信息作为所述目标保单项目对应的信息录入至保单信息存储系统，所述保单信息存储系统用于保存保单信息。

第三方面，提供另一种基于语音识别的保单录入装置，包括处理器、存储器以及通信接口，所述处理器、存储器和通信接口相互连接，其中，所述通信接口用于发送或接收数据，所述存储器用于存储基于语音识别的保单录入装置执行上述方法的应用程序代码，所述处理器被配置用于执行上述第一方面的方法。

第四方面，提供一种计算机存储介质，所述计算机存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被处理器执行时使所述处理器执行上述第一方面的方法。

本发明实施例中，通过对语音数据进行识别和处理形成信息选项供保单录入用户选择，省去用户手动输入保单项目信息的过程，提高保单录入的效率。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种保单录入系统的结构示意图；

图2是本发明实施例提供的一种场景示意图；

图3是本发明实施例提供的一种基于语音识别的保单录入方法的流程示意图；

图4是本发明实施例提供的一种保单的示意图；

图5是本发明实施例提供的保单录入服务器根据保单信息以及目标保单项目确定目标保单对应的多个第一信息选项的流程示意图；

图6是本发明实施例提供的一种将保单项目信息作为目标保单项目对应的信息录入至保单信息存储系统的流程示意图；

图7是本发明实施例提供的一种基于语音识别的保单录入装置的组成结构示意图；

图8是本发明实施例提供的另一种基于语音识别的保单录入装置的组成结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

参见图1，图1是本发明实施例提供的一种保单录入系统的结构示意图，如图所示，保单录入系统包括一个或多个语音采集终端101以及一个或多个保单录入服务器102。语音采集终端101可以用于采集保单录入用户的与保单有关的语音数据，然后将采集到的语音数据提交给保单录入服务器102；语音采集终端102还可以用于用户交互，获取保单录入用户在保单录入系统上的操作，响应用户操作，等等。语音采集终端101例如可以为手机、电脑、平板电脑，等等。语音采集终端101可以为保险机构的业务员持有的用户终端，保险机构的业务员可以通过语音采集终端101登录由保单录入服务器102提供后台支持的保单录入系统，然后通过语音采集终端101完成对保单的录入。保单录入服务器102用于根据语音采集终端101提交的语音数据，对与保单有关的语音数据进行识别以获取保单中的信息。保单录入服务器102可以为保险机构的服务器。在保单录入服务器102有多个的情况下，多个保单录入服务器102组成保单录入服务器组群。在一些实施方式中，该保单录入服务器组群中的多个保单录入服务器可以协同合作完成对保单的录入，各个保单录入服务器可以用于完成不同的操作。例如，该保单录入服务器组群中的第一保单录入服务器可以用于与语音采集终端101交互，接收语音采集终端发送的请求或数据，以及，向语音采集终端发送请求或数据；该保单录入服务器组群中的第二保单录入服务器可以用于对语音数据进行识别，得到该语音数据对应的信息；该保单录入服务器组群中的第三保单录入服务器可以用于保存保单信息；等等。在另一些实施方式中，该保单录入服务器组群中的多个保单录入服务器也可以具备相同的功能，用于完成相同的操作，即该保单录入服务器组群中的每个保单录入服务器均可以用于与语音采集终端交互，对语音数据进行识别，保存保单信息，等等。本发明实施例不做限制。

在一些可能的实现方式中，保单录入服务器组群可以为区块链系统。区块链系统例如可以为联盟链系统、私有链系统等。在保单录入服务器组群为联盟链系统的情况下，各个保单录入服务器102均为联盟链系统中的节点，其具体可以为联盟链系统的同等节点(peer)、背书节点(endorser)、命令节点(orderer)或确认节点(committer)这几种角色节点中的一种或多种角色节点。其中，各个保单录入服务器102均可以称之为同等节点，同等节点用于从命令节点处获取命令节点打包形成的区块并存储在本地的账本中；命令节点用于维护联盟链系统中的多条联盟链，接收经过背书策略后的事务消息并对事务进行排序后打包形成区块，然后传递给处于联盟链中的所有同等节点；背书节点和确认节点是同等节点中两种特殊的节点，背书节点用于在同等节点将事务发布到联盟链系统的过程中对事务进行背书，确认节点用于在同等节点将事务发布到联盟链系统的过程中将经过背书和排序的事务对应的区块保存到本地。

基于图1所示的保单录入系统，可以实现本发明实施例的方案，接下来介绍本发明实施例的具体应用场景和技术方案。

参见图2，图2示例性地示出了保单录入用户通过保单录入系统录入保单信息的场景示意图。首先，保单录入用户在语音采集终端上登录保单录入系统，登录成功后，选择进入至要录入的保单所对应的保单录入系统的首页，如图2中的①所示；接着，保单录入用户在保单录入系统的首页点击保单录入按钮，进入至保单录入系统的保单录入页面，保单录入页面上有一个或多个待录入的保单项目，如图2中的②所示；接着，保单录入用户针对保单录入页面上的保单项目说出保单项目对应的信息，语音采集终端采集这些保单项目对应的信息所对应的语音数据，如图2中的③所示；接着，语音采集终端将保单项目对应的信息所对应的语音数据发送给保单录入服务器，保单录入服务器对语音数据进行语音识别和处理，为待录入的保单项目生成多个信息选项，然后将待录入的保单项目对应的多个信息选项发送给语音采集终端，语音采集终端在用户对保单项目进行录入时，向用户显示要保单相对应的多个信息选项，如图2中④所示；最后，用户选择其中一个信息选项，语音采集终端将用户选择的信息选项发送给保单录入服务器，保单录入服务器将其确定为该保单项目对应的信息录入至保单存储系统中，如图2中的⑤所示。可选地，在图2中的阶段⑤中，用户选择其中一个信息选项后，还可以对该信息选项进行修改，语音采集终端还可以将用户对选择的信息选型进行修改得到的保单项目信息发送给保单录入服务器，然后保单服务器将其确定为该保单项目对应的信息录入至保单存储系统中。

从图2可以看出，对于要录入的保单项目，保单录入用户只需要在保单录入系统提供的信息选项中选择其中一个选项或者对该选项做少量的修改即可完成对保单信息的录入，操作简单，提高了保单录入的效率和用户体验。

以下介绍实现可以实现上述场景的技术方案。

参见图3，图3是本发明实施例提供的一种基于语音识别的保单录入方法的流程示意图，该方法可以实现在图1所示的保单录入服务器或保单录入服务器组群上，以下以保单录入服务器为执行主体进行介绍。如图所示，该方法包括如下步骤：

S301，保单录入服务器接收语音采集终端发送的目标语音数据，目标语音数据为语音采集终端采集到的目标保单对应的语音数据。

这里，目标保单为要录入的保单。具体地，目标保单可以包括保单名称、保单所属的保险公司、保单号等用于反馈目标保单的性质的保单信息。例如，该目标保单为平安保险公司的车险保单。目标保单也可以包括被保人名称、被保人身份证号码(组织机构代码)、被保人地址、被保人联系电话、投保人名称、投保人身份证号码、投保人地址、投保人联系电话、保险起始时间、保险截止时间、投保人名称、投保人身份证号码等与用户无关的需要将其对应的信息录入至保单信息存储系统的保单项目。目标保单还可以包括被保人名称信息、被保人身份证号码(组织机构代码)信息、被保人地址信息、被保人联系电话信息、投保人名称信息、投保人身份证号码信息、投保人地址信息、投保人联系电话信息、保险起始时间信息、保险截止时间信息、投保人名称信息、投保人身份证号码信息等与用户相关的保单项目信息。目标保单还可以包括注意事项、特别提示等条件说明信息，不限于这里的描述，在可选的实施方式中，目标保单还可以有更少或更多的信息，本发明实施例不做限制。示例性地，目标保单可以如图4所示，图4为保险类型为车险的保单。

具体地，当保单录入用户通过语音采集终端登录保单录入系统并在保单录入系统的保单录入页面说出该保单录入页面上显示的保单项目对应的信息时，语音采集终端可以采集到目标保单对应的语音数据，该语音数据与目标保单中的保单项目信息对应，保单录入服务器可以接收到语音采集终端发送的目标语音数据。

S302，保单录入服务器对目标语音数据进行语音识别，得到目标语音数据对应的保单信息。

具体地，保单录入服务器可以通过基于统计模型的方法，或者，基于声道模型和语音指示的方法，或者，基于标准模板匹配的方法，或者，基于神经网络的方法中的其中一种语音识别的方法对目标语音数据进行语音识别，得到目标语音数据对应的保单信息。

以下以语音识别的方法为基于统计模型的方法对保单录入服务器对目标语音数据进行语音识别，得到目标语音数据对应的保单信息的具体过程。

步骤一、保单录入服务器对目标语音数据进行预处理，得到该目标语音数据对应的多个语音小段。

具体地，保单录入服务器可以以预设的采样周期对目标语音数据进行采样，将连续的目标语音数据变换为离散化的语音信号S(n)，采样周期可以为根据奈奎斯特采样定理确定的周期；然后保单录入服务器通过传递函数为H(Z)＝1-αZ^-1的数字滤波器对离散后的语音信号进行滤波，增加语音信号的高频分辨率，α为预加重系数，α大于0.9小于1；最后，保单录入服务器可以利用窗函数对离散的语音信息进行分帧处理得到多个语音小段，其中，窗函数可以为矩形窗、汉明窗或汉宁窗中的任意一种窗函数。

可选地，保单录入服务器还可以通过端点检测剔除语音小段中的噪声和干扰。其中，保单录入服务器可以通过基于能量的端点检测、基于信息熵的端点检测或基于频带方差的端点检测等方式进行端点检测。

步骤二、在得到目标语音数据对应的多个语音小段后，保单录入服务器分别对各个语音小段进行特征提取，得到M行*N列的观测序列，其中，M为声学特征的维度，N为语音小段的数量。

具体地，保单录入服务器可以分别对各个语音小段进行线性预测倒谱系数(linear prediction cepstral coefficients，LPCC)特征提取或者梅尔频率倒谱系数(Mel-scale frequency cepstral coefficients，MFCC)特征提取，将各个语音小段转化为M维特征向量，该多个语音小段的M维特征向量组成了M行*N列的观测序列。

步骤三、在得到观测序列后，保单录入服务器将观测序列送入预先训练得到的基于隐马尔可夫模型(Hidden Markov Model，HMM)的状态网络中，在该状态网络中查找与该观测序列的匹配度大于预设阈值的目标路径，将该目标路径对应的文本内容确定为保单信息。

其中，该状态网络包括预先利用大量的语音数据训练得到的声学模型、语音模型、词典模型以及解码器，将该观测序列送入状态网络中后，解码器结合声学模型、语言模型以及词典模型找出概率大于预设阈值的路径，将该路径确定为与观测序列的匹配度大于预设阈值的目标路径。

这里，预设阈值可以为接近于90％、95％、98％等接近于1的值。

以下举例对确定保单信息进行说明，例如，预设路径为95％，将观测序列送入状态网络中后，该状态网络中概率大于95％的路径有3条，分别为路径1、路径2以及路径3，那么，将路径1对应的文本内容、路径2对应的文本内容以及路径3对应的文本内容均确定为保单信息。

S303，保单录入服务器根据目标语音数据对应的保单信息以及目标保单项目确定目标保单项目对应的多个第一信息选项，目标保单项目为待录入的保单项目。

步骤S303的具体实现方式可参见后续图5对应的实施例，此处不做过多描述。

S304，保单录入服务器将目标保单项目对应的多个第一信息选项发送给语音采集终端，以使语音采集终端在保单录入用户对目标保单项目进行录入时，向保单录入用户显示目标保单项目对应的多个第一信息选项。

具体地，语音采集终端在保单录入用户对目标保单项目进行录入时，可以通过下拉列表的方式、悬浮窗漂浮等方式向保单录入用户显示目标保单项目对应的多个第一信息选项。示例性地，语音采集终端向保单录入用户显示目标保单项目对应的多个第一信息选项可以如图2中的④所示。

S305，保单录入服务器接收语音采集终端针对目标保单项目返回的保单项目信息，保单项目信息关联于多个第一信息选项中的至少一个信息选项。

保单项目信息可以为多个第一选项中的其中一个信息选项，保单项目信息也可以为用户针对该其中一个信息选项进行修改后得到的信息。保单录入服务器接收语音采集终端针对目标保单项目返回的保单项目信息的具体情况可以如图2中的⑤所示。

S306，保单录入服务器将保单项目信息作为目标保单项目对应的信息录入至保单信息存储系统，保单信息存储系统用于保存保单信息。

这里，保单信息存储系统可以有两种情况：

第一种情况，保单信息存储系统为一个或多个保单录入服务器组成的分布式存储系统。

第二种情况，保单信息存储系统为一个或多个保单录入服务器组成的区块链系统。

在第一种情况下，保单录入服务器将保单项目信息作为目标保单项目对应的信息保存在本地后，可以将保单项目信息作为目标保单项目对应的信息备份至其他的保单录入服务器中。

在第二种情况下，保单录入服务器将保单项目信息作为目标保单项目对应的信息发布至区块链系统中保存，保单录入服务器将保单项目信息作为目标保单项目对应的信息发布至区块链系统中保存的具体实现方式可参考后续图7对应的实施例的描述，此处不做过多描述。

本发明实施例中，保单录入服务器通过对目标保单对应的语音数据进行语音识别得到保单信息，然后针对要录入的保单项目生成多个信息选项并通过语音采集终端向保单录入用户显示这些信息选项，使得用户可以直接选择在这些信息选项进行选择或者在这些信息选项的基础上进行少许修改，即可完成对要录入的保单项目所对应的信息的录入，省去用户手动输入保单项目信息的过程，提高保单录入的效率。

参见图5，图5是本发明实施例提供的保单录入服务器根据保单信息以及目标保单项目确定目标保单项目对应的多个第一信息选项的流程示意图，如图所示，该流程包括如下步骤：

S501，保单录入服务器根据目标语音数据对应的保单信息生成多个信息选项。

这里，根据保单录入服务器对目标保单进行得到保单信息中包含的对应于同一个语音片段数据的字符数量的不同，对应的目标路径的数量的不同，保单录入服务器根据目标语音数据对应的保单信息生成多个信息选项的情况不同。

情况一：保单信息中包含的对应于同一个语音片段数据的字符只有一个，即在上述步骤S302的步骤三中，在保单录入服务器确定目标路径的过程中，确定的目标路径的数量为一个。

保单录入服务器根据目标语音数据对应的保单信息生成多个信息选项具体为：保单录入服务器在目标语音数据对应的保单信息中确定第一字符和第二字符，并确定第一字符对应的语音片段数据和第二字符对应的语音片段数据之间的停顿时长，第一字符对应的语音片段数据和第二字符对应的语音片段数据在目标语音数据中为相邻的语音片段数据；保单录入服务器根据停顿时长以及保单信息生成多个保单项目信息。其中，如果第一字符对应的语音片段数据和第二字符对应的语音片段数据之间的停顿时长大于停顿时长阈值，则保单录入服务器确定第一字符和第二字符属于不同的保单项目信息，进而对保单信息进行拆分形成多个保单项目信息。停顿时长阈值为一个预设的时间长度值，例如可以为1s，2s，等等。

这里，第一字符和第二字符为保单信息中相邻的两个字符。

下面举例来对根据相邻的两个字符所对应的停顿时长和保单信息生成多个保单项目信息进行说明。例如，停顿时长阈值为1s，保单信息为“王XX女50”，其中，字符“王”对应的语音片段数据与字符“X”对应的语音片段数据之间的停顿时长为0.5s，字符“X”对应的语音片段数据与字符“X”对应的语音片段数据之间的停顿时长为0.6s，字符“X”对应的语音片段数据与字符“女”对应的语音片段数据之间的停顿时长为1.2s，字符“女”对应的语音片段数据与字符“5”对应的语音片段数据之间的停顿时长为1.3s，字符“5”对应的语音片段数据与字符“0”对应的语音片段数据之间的停顿时长为0.8s。由于字符“X”对应的语音片段数据与字符“女”对应的语音片段数据之间的停顿时长为1.2s，大于1s，则确定字符“X”与“女”属于不同的保单项目信息，进而在保单信息中将字符“X”与字符“女”拆分开。由于字符“女”对应的语音片段数据与字符“5”对应的语音片段数据之间的停顿时长为1.3s，大于1s，则确定字符“女”与字符“5”属于不同的保单项目信息，进而在保单信息中将字符“女”与字符“5”拆分开。经过两次拆分，保单信息可形成“王XX”、“女”以及“50”这几个保单项目信息。

情况二：保单信息中包含的对应于同一个语音片段数据的字符有多个，即在上述步骤S302的步骤三中，在保单录入服务器确定目标路径的过程中，确定的目标路径的数量为多个。

由于目标路径有多个，根据目标路径对应的文本内容得到保单信息中存在对应同一个语音片段数据的多个字符，即同音字。例如，目标语音数据的发音为“chéngjìngnǚwǔshí”，目标路径的数量为3，分别对应的文本内容为“程靖女50”、“程婧女50”以及“程静女50”，则保单信息为“程靖婧静女50”，在保单信息中，字符“靖”、“婧”以及“静”对应的均为发音“jìng”所对应的语音数据。

保单录入服务器根据目标语音数据对应的保单信息生成多个信息选项具体为：保单录入服务器在目标语音数据对应的保单信息中确定至少一个第一字符和至少一个第二字符，并确定第一字符对应的语音片段数据和第二字符对应的语音片段数据之间的停顿时长；保单录入服务器根据停顿时长以及保单信息生成多个保单项目信息。其中，如果第一字符对应的语音片段数据和第二字符对应的语音片段数据之间的停顿时长大于停顿时长阈值，则保单录入服务器确定第一字符和第二字符属于不同的保单项目信息，进而对保单信息进行拆分形成多个保单项目信息。停顿时长阈值为一个预设的时间长度值，例如可以为1s，2s，等等。

具体地，保单录入服务在保单信息中确定至少一个第一字符和至少一个第二字符具体为：保单录入服务器在保单信息中确定第三字符以及第三字符对应的第一等同字符，第一等同字符与第三字符对应目标语音数据中的同一语音片段数据；保单录入服务器将第三字符以及第一等同字符确定为至少一个第一字符；保单录入服务器将第四字符以及第四字符对应的第二等同字符确定为至少一个第二字符，第四字符与第三字符或第一等同字符相邻，第二等同字符与第四字符对应目标语音数据中的同一语音片段数据。例如，保单信息为“程靖婧静女50”，字符“靖”、“婧”以及“静”均对应的均为发音“jìng”所对应的语音数据，所以可将字符“靖”视为第三字符，将字符“婧”和字符“静”视为第一等同字符，即字符“靖”、“婧”以及“静”均为第一字符；字符“程”与字符“靖”相邻，字符“女”与字符“静”相邻，则可将字符“程”或字符“女”视为第四字符，即字符“程”或字符“女”为第二字符。

下面举例来对根据第一字符对应的语音片段数据和第二字符对应语音片段数据之间的停顿时长和保单信息生成多个保单项目信息进行说明。例如，停顿时长阈值为1s，保单信息为“程靖婧静女50”，字符“程”对应的语音片段数据与字符“靖”或字符“婧”或字符“静”(字符“靖”、“婧”以及“静”对应同一语音片段数据)对应的语音片段数据之间的停顿时长为0.5s，字符“靖”或字符“婧”或字符“静”对应的语音片段数据与字符“女”对应的语音片段数据之间的停顿时长为1.6s，字符“女”对应的语音片段数据与字符“5”对应的语音片段数据之间的停顿时长为1.3s，字符“5”对应的语音片段数据与字符“0”对应的语音片段数据之间的停顿时长为0.8s。由于字符“女”对应的语音片段数据与字符“靖”或字符“婧”或字符“静”对应的语音片段数据之间的停顿时长为1.6s，大于1s，则确定字符“女”与字符“靖”或字符“婧”以及字符“静”属于不同的保单项目信息，进而在保单信息中将字符“女”与字符“靖”、字符“婧”以及字符“静”拆分开。由于字符“5”对应的语音片段数据与字符“女”对应的语音片段数据之间的停顿时长为1.3s，大于1s，则确定字符“5”与字符“女”属于不同的保单项目信息，进而在保单信息中将字符“5”与字符“女”拆分开。经过两次拆分，保单信息可形成“程靖婧静”、“女”以及“50”这几个信息。由于字符“靖”、字符“婧”以及字符“静”对应的是同一个语音片段数据，则可将“程靖婧静”拆分为“程靖”、“程婧”以及“程静”，进而保单形成的信息选项分别为“程靖”、“程婧”、“程静”、“女”以及“50”。

S502，保单录入服务器根据多个信息选项中的各个信息选项对应的语音片段数据在目标语音数据中的先后顺序分别确定各个信息选项的顺序。

举例来进行说明，例如，多个信息选项分别为“程靖”、“程婧”、“程静”、“女”以及“50”，目标语音数据为发音为“chéngjìngnǚwǔshí”的语音数据，“程靖”、“程婧”、“程静”对应的语音片段数据为发音为“chéngjìng”的语音数据，“女”对应的语音片段数据为发音为“nǚ”的语音数据，“50”对应的语音片段数据为发音为“wǔshí”的语音数据。由于在目标语音数据中，发音为“chéngjìng”的语音数据在发音为“nǚ”的语音数据之前，发音为“nǚ”的语音数据在发音为“wǔshí”的语音数据之前，则确定信息选项“程靖”、“程婧”、“程静”的顺序为1，信息选项“女”的顺序为2，信息选项“50”的顺序为3。

S503，保单录入服务器根据目标保单中的各个保单项目在预设的保单模板信息中的先后顺序确定目标保单项目的顺序。

这里，预设的保单模板信息可以是指目标保单中固有的信息。例如，目标保单的格式如图4所示，则预设的保单模板信息可以为图4中如“被保险人”、“被保险机动车”等无需人工填写已经存在于保单中的信息。例如，预设的保单模板信息包括保单项目“投保人姓名”、“投保人性别”、“投保人年龄”，其中，“投保人姓名”在“投保人性别”之前，“投保人性别”在“投保人年龄”之前，则确定“投保人姓名”的顺序为1，“投保人性别”的顺序为2，“投保人年龄”的顺序为3。

预设的保单模板信息也可以是指语音采集终端上显示的信息，此时，各个保单项目在预设的保单模板信息中的先后顺序指保单项目在语音采集终端上的显示顺序。例如，预设的保单模板信息可以图2的③所示，预设的保单模板信息为“投保人姓名”、“投保人年龄”、“投保人性别”以及“投保人联系方式”，其分别对应的显示顺序为1，2，3，4。

S504，保单录入服务器根据各个信息选项的顺序与目标保单项目的顺序确定目标保单项目对应的多个第一信息选项。

在一种可能的实现方式中，保单录入服务器可以根据各个信息选项的顺序与目标保单项目的顺序将顺序与目标保单项目的顺序相同的信息选项确定为目标保单项目对应的多个第一信息选项。

例如，多个信息选项分别为“程靖”、“程婧”、“程静”、“女”以及“50”，其中，信息选项“程靖”、“程婧”、“程静”的顺序为1，信息选项“女”的顺序为2，信息选项“50”的顺序为3。目标保单项目为“投保人姓名”，“投保人姓名”的顺序为1，则将信息选项“程靖”、“程婧”、“程静”确定为“投保人姓名”对应的多个第一信息选项。

在另一种可能的实现方式中，保单录入服务器也可以根据各个信息选项的顺序与目标保单项目的顺序将顺序与目标保单项目的顺序的差值小于预设差值的信息选项确定为目标保单项目对应的多个第一信息选项。预设差值可以为1，2等数值。

例如，多个信息选项分别为“程靖”、“程婧”、“程静”、“女”以及“50”，其中，信息选项“程靖”、“程婧”、“程静”的顺序为1，信息选项“女”的顺序为2，信息选项“50”的顺序为3。目标保单项目为“投保人姓名”，“投保人姓名”的顺序为1，预设差值为1，则将信息选项“程靖”、“程婧”、“程静、“女”确定为“投保人姓名”对应的多个第一信息选项。

本发明实施例中，通过将保单信息拆分为多个信息选项并对信息选项进行排序，根据信息选项的顺序可以确定信息选项与目标保单项目之间的关联关系，从而可以确定目标保单项目对应的信息选项。

在一些可能的场景中，上述图3对应的实施例所涉及的保单信息存储系统可以为区块链系统，该区块链系统可以为私有链系统，也可以为联盟系统。以下以保单信息存储系统为联盟链系统为例介绍将保单项目信息作为目标保单项目对应的信息录入至保单信息存储系统的具体过程。图6是本发明实施例提供的一种将保单项目信息作为目标保单项目对应的信息录入至保单信息存储系统的流程示意图，如图所示，该流程包括：

S601，保单录入服务器生成保单信息发布事务，保单信息发布事务包括语音采集终端针对目标保单项目返回的保单项目信息。

保单录入服务器为联盟链系统中的同等节点。具体实现中，保单录入服务器可以通过软件开发工具包(software development kit，SDK)生成该保单信息发布事务。可选地，该保单信息发布事务除了包括该保单项目信息外，还可以包括目标保单项目和/或目标保单项目的标识信息、事务版本，等等。

S602，保单录入服务器将保单信息发布事务发送给联盟链系统中的背书节点，背书节点接收保单信息发布事务。

背书节点为基于智能合约设置的在保单录入服务器的背书策略中的节点，背书节点可以与保单录入服务器属于同一个联盟链通道。背书节点为图1所示的架构中的保单录入服务器组群的其中一个或多个保单录入服务器。

具体实现中，保单录入服务器可以通过组播的方式或者分别发送的方式将保单信息发布事务发送给联盟链系统中的背书节点，该背书节点用于对保单录入服务器发送的区块链事务进行事务背书，以保证该事务的真实性和合法性。

S603，背书节点对保单信息发布事务进行背书。

这里，背书节点对该保单信息发布事务进行背书的过程为：背书节点将该保单信息发布事务作为输入执行该智能合约得到输出结果，然后采用背书节点的私钥对输出结果进行签名得到背书结果。

S604，背书节点将对保单信息发布事务进行背书得到的背书结果发送给保单录入服务器，保单录入服务器接收背书结果。

保单录入服务器可以在接收到大部分同等节点发送的背书结果的情况下，确定对保单信息发布事务的事务背书完成。其中，具体需要接收到多少个同等节点的背书结果才确定对保单信息发布事务的事务背书完成可以根据具体情况设定。例如，当背书策略中的背书节点较少时，可以设计为当接收到90％以上的背书节点发送的背书结果时，则确定对保单信息发布事务的事务背书完成；当背书策略中的背书节点较多时，可以设计为当接收到80％以上的背书节点发送的背书结果时，则确定对保单信息发布事务的事务背书完成。

保单录入服务器在根据背书结果确定完成对保单信息发布事务的事务背书的情况下，执行步骤S605。

S605，保单录入服务器将保单信息发布事务发送给联盟链系统中的命令节点。

这里，保单录入服务器将保单信息发布事务和接收到的所有的背书结果打包发送给联盟链系统中的命令节点。

S606，命令节点根据该保单信息发布事务的时间对保单信息发布事务进行排序。

S607，命令节点生成保单信息发布事务对应的区块。

这里，命令节点按照时间顺序将当前在联盟链中产生的还未被打包的所有的事务进行打包构建形成区块，其中，未被打包的所有的事务包括该保单信息发布事务。

S608，命令节点将保单信息发布事务对应的区块发送给联盟链系统中的所有同等节点，联盟链上的所有同等节点接收保单信息发布事务对应的区块。

具体实现中，命令节点可以从同等节点中选择一个作为领导节点(leader peer)，将保单信息发布事务对应的区块发送给该领导节点，然后该领导节点基于Gossip协议随机地与联盟链中的部分同等节点进行通信以使该保单信息发布事务在联盟链的同等节点中同步，从而将保单信息发布事务对应的区块同步至联盟链上的所有同等节点。

S609，联盟链系统中的所有同等节点对保单信息发布事务对应的区块进行验证。

这里，同等节点对保单信息发布事务对应的区块进行验证是指对保单信息发布事务对应的区块中的所有事务的背书策略以及事务版本进行验证，验证的具体方式为：分别对该区块中的每个事务的背书结果中签名进行验证，验证该签名对应的背书节点是否为该事务对应的背书策略中的节点，验证每个事务的版本是否与本地的版本相同。如果对每个事务的背书结果以及事务版本的验证均通过，则确定对保单信息发布事务对应的区块的验证通过。

在对保单信息发布事务对应的区块的验证通过的情况下，同等节点执行步骤S610。

S610，同等节点将保单信息发布事务对应的区块保存到本地。

通过背书、排序以及验证三个环节，可以使发布至联盟链系统的保单信息得到验证，确保只有正确合法的保单信息才能发布至联盟链系统，保证了联盟链系统中的保单信息的真实性和可靠性，将保单信息发布至联盟链系统中起到了对保单信息进行备份的作用和防止保单信息被篡改的作用。

上面介绍了发明实施例的方法，下面介绍发明实施例的装置。

参见图7，图7是本发明实施例提供的一种基于语音识别的保单录入装置的组成结构示意图，该装置可以为上述图1所示的保单录入服务器或保单录入服务器群组，该装置70包括：

语音数据接收模块701，用于接收语音采集终端发送的目标语音数据，所述目标语音数据为所述语音采集终端采集到的目标保单对应的语音数据；

语音识别模块702，用于对所述目标语音数据进行语音识别，得到所述目标语音数据对应的保单信息；

选项生成模块703，用于根据所述保单信息以及目标保单项目确定所述目标保单项目对应的多个第一信息选项，所述目标保单项目为待录入的保单项目；

选项发送模块704，用于将所述多个第一信息选项发送给所述语音采集终端，以使所述语音采集终端在保单录入用户对所述目标保单项目进行录入时，向所述保单录入用户显示所述多个第一信息选项；

信息接收模块705，用于接收所述语音采集终端针对所述目标保单项目返回的保单项目信息，所述保单项目信息关联于所述多个第一信息选项中的至少一个信息选项；

信息录入模块706，用于将所述保单项目信息作为所述目标保单项目对应的信息录入至保单信息存储系统，所述保单信息存储系统用于保存保单信息。

在一种可能的设计中，所述选项生成模块703具体用于：

根据所述保单信息生成多个信息选项；

根据所述多个信息选项中的各个信息选项对应的语音片段数据在所述目标语音数据中的先后顺序分别确定所述各个信息选项的顺序；

根据所述目标保单中的各个保单项目在预设的保单模板信息中的先后顺序确定目标保单项目的顺序；

根据所述各个信息选项的顺序与目标保单项目的顺序确定目标保单项目对应的多个第一信息选项。

在一种可能的设计中，所述选项生成模块703具体用于：

在所述保单信息中确定至少一个第一字符和至少一个第二字符，并确定所述第一字符对应的语音片段数据和所述第二字符对应的语音片段数据之间的停顿时长，所述第一字符对应的语音片段数据和所述第二字符对应的语音片段数据在所述目标语音数据中为相邻的语音片段数据；

根据所述停顿时长以及所述保单信息生成多个信息选项。

在一种可能的设计中，所述选项生成模块703具体用于：

在所述保单信息中确定第三字符以及所述第三字符对应的第一等同字符，所述第一等同字符与所述第三字符对应所述目标语音数据中的同一语音片段数据；

将所述第三字符以及所述第一等同字符确定为至少一个第一字符，并将第四字符以及所述第四字符对应的第二等同字符确定为至少一个第二字符，所述第四字符在所述保单信息中与所述第三字符或所述第一等同字符相邻，所述第二等同字符与所述第四字符对应所述目标语音数据中的同一语音片段数据。

在一种可能的设计中，所述语音识别模块702具体用于：

通过基于统计模型的方法，或者，基于声道模型和语音知识的方法，或者，基于标准模板匹配的方法，或者，基于神经网络的方法对所述目标语音数据进行语音识别，得到所述目标语音数据对应的保单信息。

在一种可能的设计中，所述语音识别模块702具体用于：

对所述目标语音数据进行预处理，得到所述目标语音数据对应的多个语音小段；

对所述多个语音小段中的各个语音小段进行声学特征提取，得到M行*N列的观测序列，其中，M为声学特征的维度，N为所述语音小段的数量；

将所述观测序列送入预先训练得到的基于隐马尔可夫模型的状态网络中，在所述状态网络中查找与所述观测序列的匹配度大于预设阈值的至少一个目标路径，将所述至少一个目标路径对应的文本内容确定为所述保单信息。

在一种可能的设计中，所述信息录入模块706具体用于：

生成所述保单信息发布事务，所述保单信息发布事务包括所述保单项目信息；

将所述保单信息发布事务发送给所述区块链系统中的背书节点进行事务背书，所述背书节点为基于智能合约设置的背书策略中的节点；

当根据所述背书节点返回的背书结果确定已完成对所述保单信息发布事务的事务背书时，将所述保单信息发布事务发送给所述联盟链系统中的命令节点，以使所述命令节点对所述保单信息发布事务进行排序并形成所述保单信息发布事务对应的区块；

接收所述命令节点发送的所述区块；

在对所述区块的验证通过的情况下，在本地保存所述区块。

需要说明的是，图7对应的实施例中未提及的内容可参见方法实施例的描述，这里不再赘述。

本发明实施例中，基于语音识别的保单录入装置通过对目标保单对应的语音数据进行语音识别得到保单信息，然后针对要录入的保单项目生成多个信息选项并通过语音采集终端向保单录入用户显示这些信息选项，使得用户可以直接选择在这些信息选项进行选择或者在这些信息选项的基础上进行少许修改，即可完成对要录入的保单项目所对应的信息的录入，省去用户手动输入保单项目信息的过程，提高保单录入的效率。

参见图8，图8是本发明实施例提供的另一种基于语音识别的保单录入装置的组成结构示意图，该装置可以为上述图1所示的保单录入服务器或保单录入服务器群组，该装置80包括处理器801、存储器802以及通信接口803。处理器801连接到存储器802和通信接口803，例如处理器801可以通过总线连接到存储器802和通信接口803。

处理器801被配置为支持所述基于语音识别的保单录入装置执行图3-图6所述的基于语音识别的保单录入方法的方法中相应的功能。该处理器801可以是中央处理器(central processing unit，CPU)，网络处理器(network processor，NP)，硬件芯片或者其任意组合。上述硬件芯片可以是专用集成电路(application specific integratedcircuit，ASIC)，可编程逻辑器件(programmable logic device，PLD)或其组合。上述PLD可以是复杂可编程逻辑器件(complex programmable logic device，CPLD)，现场可编程逻辑门阵列(field-programmable gate array，FPGA)，通用阵列逻辑(generic array logic，GAL)或其任意组合。

存储器802存储器用于存储程序代码等。存储器802可以包括易失性存储器(volatile memory，VM)，例如随机存取存储器(random access memory，RAM)；存储器802也可以包括非易失性存储器(non-volatile memory，NVM)，例如只读存储器(read-onlymemory，ROM)，快闪存储器(flash memory)，硬盘(hard disk drive，HDD)或固态硬盘(solid-state drive，SSD)；存储器802还可以包括上述种类的存储器的组合。本发明实施例中，存储器802用于存储保单信息等。

所述通信接口803用于发送或接收数据。

处理器801可以调用所述程序代码以执行以下操作：

通过通信接口803接收语音采集终端发送的目标语音数据，所述目标语音数据为所述语音采集终端采集到的目标保单对应的语音数据；

通过通信接口803将所述多个第一信息选项发送给所述语音采集终端，以使所述语音采集终端在保单录入用户对所述目标保单项目进行录入时，向所述保单录入用户显示所述多个第一信息选项；

需要说明的是，各个操作的实现还可以对应参照图3-图6所示的方法实施例的相应描述；所述处理器801还可以与通信接口803配合执行上述方法实施例中的其他操作。

本发明实施例还提供一种计算机存储介质，所述计算机存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被计算机执行时使所述计算机执行如前述实施例所述的方法，所述计算机可以为上述提到的基于语音识别的保单录入装置的一部分。例如为上述的处理器801。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、ROM或RAM等。

以上所揭露的仅为本发明较佳实施例而已，当然不能以此来限定本发明之权利范围，因此依本发明权利要求所作的等同变化，仍属本发明所涵盖的范围。

Claims

1.一种基于语音识别的保单录入方法，其特征在于，包括：

根据所述保单信息以及目标保单项目确定所述目标保单项目对应的多个第一信息选项，所述目标保单项目为待录入的保单项目，包括：在目标语音数据对应的保单信息中确定至少一个第一字符和至少一个第二字符，并确定第一字符对应的语音片段数据和第二字符对应的语音片段数据之间的停顿时长，如果第一字符对应的语音片段数据和第二字符对应的语音片段数据之间的停顿时长大于停顿时长阈值，确定第一字符和第二字符属于不同的保单项目信息，对保单信息进行拆分形成多个保单项目信息生成多个信息选项，根据所述多个信息选项中的各个信息选项对应的语音片段数据在所述目标语音数据中的先后顺序分别确定所述各个信息选项的顺序，根据所述目标保单中的各个保单项目在预设的保单模板信息中的先后顺序确定目标保单项目的顺序，根据所述各个信息选项的顺序与目标保单项目的顺序确定目标保单项目对应的多个第一信息选项；

2.根据权利要求1所述的方法，其特征在于，所述根据所述保单信息生成多个信息选项，包括：

根据所述停顿时长以及所述保单信息生成多个信息选项。

3.根据权利要求2所述的方法，其特征在于，所述在所述保单信息中确定至少一个第一字符和至少一个第二字符，包括：

4.根据权利要求1-3任一项所述的方法，其特征在于，所述对所述目标语音数据进行语音识别，得到所述目标语音数据对应的保单信息，包括：

5.根据权利要求4所述的方法，其特征在于，所述通过基于统计模型的方法对所述目标语音数据进行语音识别得到，得到所述目标语音数据对应的保单信息，包括：

6.根据权利要求1所述的方法，其特征在于，所述保单信息存储系统为区块链系统，所述将所述保单项目信息作为所述目标保单项目对应的信息录入至保单信息存储系统包括：

当根据所述背书节点返回的背书结果确定已完成对所述保单信息发布事务的事务背书时，将所述保单信息发布事务发送给联盟链系统中的命令节点，以使所述命令节点对所述保单信息发布事务进行排序并形成所述保单信息发布事务对应的区块；

接收所述命令节点发送的所述区块；

在对所述区块的验证通过的情况下，在本地保存所述区块。

7.一种基于语音识别的保单录入装置，其特征在于，包括：

选项生成模块，用于根据所述保单信息以及目标保单项目确定所述目标保单项目对应的多个第一信息选项，所述目标保单项目为待录入的保单项目，所述选项生成模块还用于，在目标语音数据对应的保单信息中确定至少一个第一字符和至少一个第二字符，并确定第一字符对应的语音片段数据和第二字符对应的语音片段数据之间的停顿时长，如果第一字符对应的语音片段数据和第二字符对应的语音片段数据之间的停顿时长大于停顿时长阈值，确定第一字符和第二字符属于不同的保单项目信息，对保单信息进行拆分形成多个保单项目信息生成多个信息选项，根据所述多个信息选项中的各个信息选项对应的语音片段数据在所述目标语音数据中的先后顺序分别确定所述各个信息选项的顺序，根据所述目标保单中的各个保单项目在预设的保单模板信息中的先后顺序确定目标保单项目的顺序，根据所述各个信息选项的顺序与目标保单项目的顺序确定目标保单项目对应的多个第一信息选项；

8.一种基于语音识别的保单录入装置，包括处理器、存储器以及通信接口，所述处理器、存储器和通信接口相互连接，其中，所述通信接口用于发送或接收数据，所述存储器用于存储程序代码，所述处理器用于调用所述程序代码，执行如权利要求1-6任一项所述的方法。

9.一种计算机存储介质，其特征在于，所述计算机存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被处理器执行时使所述处理器执行如权利要求1-6任一项所述的方法。