CN109493868B

CN109493868B - 基于语音识别的保单录入方法和相关装置

Info

Publication number: CN109493868B
Application number: CN201811531587.3A
Authority: CN
Inventors: 罗柏发
Original assignee: Ping An Property and Casualty Insurance Company of China Ltd
Current assignee: Ping An Property and Casualty Insurance Company of China Ltd
Priority date: 2018-12-13
Filing date: 2018-12-13
Publication date: 2024-04-09
Anticipated expiration: 2038-12-13
Also published as: CN109493868A

Abstract

本发明提供用于基于语音识别的保单录入方法和相关装置，其中，方法包括：接收语音采集终端发送的目标语音数据，目标语音数据为语音采集到的目标保单对应的语音数据；对目标语音数据进行语音识别，得到目标语音数据对应的保单信息；根据保单信息生成多个保单项目信息；确定多个保单项目信息中的各个保单项目信息与目标保单中的保单项目的对应关系；根据对应关系在多个保单项目信息中确定第一保单项目对应的第一保单项目信息，将第一保单项目信息作为第一保单项目对应的信息录入至保单信息存储系统，保单信息存储系统用于保存保单信息。本发明的技术方案，可以省去用户手动输入保单项目信息的过程，提高保单录入的效率。

Description

基于语音识别的保单录入方法和相关装置

技术领域

本发明涉及计算机技术领域，尤其涉及基于语音识别的保单录入方法和相关装置。

背景技术

保单是保险单的简称，是指保险人与投保人签订保险合同的书面证明，保单明确完整地记载了有关保险双方的权利和义务，其包含的内容主要有被保险人名称、保险标的名称及其存放地点或所处状态、保险金额、保险期限、保险费等双方对有关保险标的事项的说明，其包含的内容还可以包括保险条款或双方约定的其他条件以及保单变更、转让和注销等附加条件。

保险经纪人在确定与投保人签订保单后保险经纪人可以通过电子系统录入该保单中的信息以进行存档，在目前的方式中，在填完纸质档的保单后，需要保险经纪人或者保单录入人员在保单录入系统上手动录入保单中的信息，这样的问题在于：录入的效率低下。

发明内容

本发明实施例提供基于语音识别的保单录入方法和相关装置，解决手工录入保单的方式的录入效率低下的问题。

第一方面，提供一种基于语音识别的保单录入方法，包括：

接收语音采集终端发送的目标语音数据，所述目标语音数据为所述语音采集到的目标保单对应的语音数据；

对所述目标语音数据进行语音识别，得到所述目标语音数据对应的保单信息；

根据所述保单信息生成多个保单项目信息；

确定所述多个保单项目信息中的各个保单项目信息与所述目标保单中的保单项目的对应关系；

根据所述对应关系在所述多个保单项目信息中确定第一保单项目对应的第一保单项目信息，将所述第一保单项目信息作为所述第一保单项目对应的信息录入至保单信息存储系统，所述保单信息存储系统用于保存保单信息。

本发明实施例中，通过对目标保单对应的语音数据进行语音识别得到保单信息，然后生成多个保单项目信息并确定保单项目信息与保单项目的对应关系，在对某个保单项目进行录入时，根据该对应关系确定与该保单项目对应的保单项目信息并对其进行录入，省去用户手动输入保单项目信息的过程，提高保单录入的效率。

结合第一方面，在一种可能的实现方式中，所述根据所述保单信息生成多个保单项目信息包括：在所述保单信息中确定第一字符和第二字符，并确定所述第一字符对应的语音片段数据和所述第二字符对应的语音片段数据之间的停顿时长，所述第一字符对应的语音片段数据和所述第二字符对应的语音片段数据在所述目标语音数据中为相邻的语音片段数据；根据所述停顿时长以及所述保单信息生成多个保单项目信息。通过确定两个相邻字符所对应的语音数据的停顿时长，可根据停顿时长将保单信息划分为多个保单项目信息。

结合第一方面，在一种可能的实现方式中，所述确定所述多个保单项目信息中的各个保单项目信息与所述目标保单中的保单项目的对应关系，包括：根据所述多个保单项目信息中的各个保单项目信息对应的语音片段数据在所述目标语音数据中的先后顺序分别确定所述各个保单项目信息的顺序；根据所述目标保单中的各个保单项目在预设的保单模板信息中的先后顺序分别确定所述各个保单项目的顺序；根据所述各个保单项目信息的顺序以及所述各个保单项目的顺序确定各个保单项目信息与所述各个保单项目的对应关系。通过分别确定保单项目信息的顺序和保单项目的顺序，可建立保单项目信息和保单项目之间的对应关系。

结合第一方面，在一种可能的实现方式中，所述对所述目标语音数据进行语音识别，得到所述目标语音数据对应的保单信息，包括：通过基于统计模型的方法，或者，基于声道模型和语音知识的方法，或者，基于标准模板匹配的方法，或者，基于神经网络的方法对所述目标语音数据进行语音识别，得到所述目标语音数据对应的保单信息。通过上述语音识别的方式，可以实现对语音数据的识别。

结合第一方面，在一种可能的实现方式中，所述通过基于统计模型的方法对所述目标语音数据进行语音识别得到，得到所述目标语音数据对应的保单信息，包括：对所述目标语音数据进行预处理，得到所述目标语音数据对应的多个语音小段；对所述多个语音小段中的各个语音小段进行声学特征提取，得到M行*N列的观测序列，其中，M为声学特征的维度，N为所述语音小段的数量；将所述观测序列送入预先训练得到的基于隐马尔可夫模型的状态网络中，在所述状态网络中查找与所述观测序列的匹配度大于预设阈值的目标路径，将所述目标路径对应的文本内容确定为所述保单信息。

结合第一方面，在一种可能的实现方式中，所述将所述第一保单项目信息作为所述第一保单项目对应的信息录入至保单信息存储系统之后，还包括：将所述第一保单项目信息以及第一保单项目信息与所述第一保单项目的对应关系发送给所述语音采集终端，以使所述语音采集终端在所述第一保单项目对应的信息显示位置显示所述第一保单项目信息；在接收到所述语音采集终端发送的保单信息修改请求的情况下，在所述保单信息存储系统中将所述第一保单项目信息修改为第二保单项目信息，所述保单信息修改请求用于请求修改所述第一保单项目对应的保单项目信息，所述保单信息修改请求包括所述第二保单项目信息。通过将已经录入的保单项目信息发送给声音采集终端进行显示，可以使保单录入用户对录入的信息进行核对和修改，保证录入的保单信息的准确性。

结合第一方面，在一种可能的实现方式中，所述保单信息存储系统为区块链系统，所述将所述保单项目信息作为所述第一保单项目对应的信息录入至保单信息存储系统包括：生成所述保单信息发布事务，所述保单信息发布事务包括所述保单项目信息；将所述保单信息发布事务发送给所述区块链系统中的背书节点进行事务背书，所述背书节点为基于智能合约设置的背书策略中的节点；当根据所述背书节点返回的背书结果确定已完成对所述保单信息发布事务的事务背书时，将所述保单信息发布事务发送给所述联盟链系统中的命令节点，以使所述命令节点对所述保单信息发布事务进行排序并形成所述保单信息发布事务对应的区块；接收所述命令节点发送的所述区块；在对所述区块的验证通过的情况下，在本地保存所述区块。将保单信息保存到区块链系统中起到了对保单信息进行备份的作用，区块链系统的不可篡改性保证了区块链系统中的保单信息的真实性和可靠性。

第二方面，提供一种基于语音识别的保单录入装置，包括：

语音数据接收模块，用于接收语音采集终端发送的目标语音数据，所述目标语音数据为所述语音采集到的目标保单对应的语音数据；

语音识别模块，用于对所述目标语音数据进行语音识别，得到所述目标语音数据对应的保单信息；

信息生成模块，用于根据所述保单信息生成多个保单项目信息；

关系确定模块，用于确定所述多个保单项目信息中的各个保单项目信息与所述目标保单中的保单项目的对应关系；

信息录入模块，用于根据所述对应关系在所述多个保单项目信息中确定第一保单项目对应的第一保单项目信息，将所述第一保单项目信息作为所述第一保单项目对应的信息录入至保单信息存储系统，所述保单信息存储系统用于保存保单信息。

第三方面，提供另一种基于语音识别的保单录入装置，包括处理器、存储器以及通信接口，所述处理器、存储器和通信接口相互连接，其中，所述通信接口用于接收或发送数据，所述存储器用于存储基于语音识别的保单录入装置执行上述方法的应用程序代码，所述处理器被配置用于执行上述第一方面的方法。

第四方面，提供一种计算机存储介质，所述计算机存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被处理器执行时使所述处理器执行上述第一方面的方法。

本发明实施例中，通过对目标保单对应的语音数据进行识别和处理，得到多个保单项目信息，然后自动将保单项目对应的信息录入，省去用户手动输入保单项目信息的过程，提高保单录入的效率。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种保单录入系统的结构示意图；

图2是本发明实施例提供的一种场景示意图；

图3是本发明实施例提供的一种基于图像识别的保单录入方法的流程示意图；

图4是本发明实施例提供的一种保单的示意图；

图5是本发明实施例提供的另一种基于图像识别的保单录入方法的流程示意图；

图6是本发明实施例提供的一种将保单项目信息录入至保单信息存储系统的流程示意图；

图7是本发明实施例提供的一种基于语音识别的保单录入装置的组成结构示意图；

图8是本发明实施例提供的另一种基于语音识别的保单录入装置的组成结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

参见图1，图1是本发明实施例提供的一种保单录入系统的结构示意图，如图所示，保单录入系统包括一个或多个语音采集终端101以及一个或多个保单录入服务器102。语音采集终端101可以用于采集保单录入用户的与保单有关的语音数据，然后将采集到的语音数据提交给保单录入服务器102；语音采集终端102还可以用于用户交互，获取保单录入用户在保单录入系统上的操作，响应用户操作，等等。语音采集终端101例如可以为手机、电脑、平板电脑，等等。语音采集终端101可以为保险机构的业务员持有的用户终端，保险机构的业务员可以通过语音采集终端101登录由保单录入服务器102提供后台支持的保单录入系统，然后通过语音采集终端101完成对保单的录入。保单录入服务器102用于根据语音采集终端101提交的语音数据，对与保单有关的语音数据进行识别以获取保单中的信息。保单录入服务器102可以为保险机构的服务器。在保单录入服务器102有多个的情况下，多个保单录入服务器102组成保单录入服务器组群。在一些实施方式中，该保单录入服务器组群中的多个保单录入服务器可以协同合作完成对保单的录入，各个保单录入服务器可以用于完成不同的操作。例如，该保单录入服务器组群中的第一保单录入服务器可以用于与语音采集终端101交互，接收语音采集终端发送的请求或数据，以及，向语音采集终端发送请求或数据；该保单录入服务器组群中的第二保单录入服务器可以用于对语音数据进行识别，得到该语音数据对应的信息；该保单录入服务器组群中的第三保单录入服务器可以用于保存保单信息；等等。在另一些实施方式中，该保单录入服务器组群中的多个保单录入服务器也可以具备相同的功能，用于完成相同的操作，即该保单录入服务器组群中的每个保单录入服务器均可以用于与语音采集终端交互，对语音数据进行识别，保存保单信息，等等。本发明实施例不做限制。

在一些可能的实现方式中，保单录入服务器组群可以为区块链系统。区块链系统例如可以为联盟链系统、私有链系统等。在保单录入服务器组群为联盟链系统的情况下，各个保单录入服务器102均为联盟链系统中的节点，其具体可以为联盟链系统的同等节点(peer)、背书节点(endorser)、命令节点(orderer)或确认节点(committer)这几种角色节点中的一种或多种角色节点。其中，各个保单录入服务器102均可以称之为同等节点，同等节点用于从命令节点处获取命令节点打包形成的区块并存储在本地的账本中；命令节点用于维护联盟链系统中的多条联盟链，接收经过背书策略后的事务消息并对事务进行排序后打包形成区块，然后传递给处于联盟链中的所有同等节点；背书节点和确认节点是同等节点中两种特殊的节点，背书节点用于在同等节点将事务发布到联盟链系统的过程中对事务进行背书，确认节点用于在同等节点将事务发布到联盟链系统的过程中将经过背书和排序的事务对应的区块保存到本地。

基于图1所示的保单录入系统，可以实现本发明实施例的方案，接下来介绍本发明实施例的具体应用场景和技术方案。

参见图2，图2示例性地示出了保单录入用户通过保单录入系统录入保单信息的场景示意图。首先，保单录入用户在语音采集终端上登录保单录入系统，登录成功后，选择进入至要录入的保单所对应的保单录入系统的首页，如图2中的①所示；接着，保单录入用户在保单录入系统的首页点击保单录入按钮，进入至保单录入系统的保单录入页面，保单录入页面上有一个或多个待录入的保单项目，如图2中的②所示；接着，保单录入用户针对保单录入页面上的保单项目说出保单项目对应的信息，语音采集终端采集这些保单项目对应的信息所对应的语音数据，如图2中的③所示；接着，语音采集终端将保单项目对应的信息所对应的语音数据发送给保单录入服务器，保单录入服务器对语音数据进行图像识别和处理，确定多个保单项目信息，并确定保单项目信息与保单项目之间的对应关系，根据该对应关系对应录入相应的保单项目，然后将保单项目与保单项目信息之间的对应关系以及保单项目信息发送给语音采集终端，语音采集终端根据该对应关系以及保单项目信息在保单项目对应的位置处显示与保单项目对应的信息，如图2中④所示。可选地，在图2中的阶段④中，用户可以对语音采集终端显示的保单项目信息进行修改，语音采集终端还可以将用户对保单项目信息进行修改得到的信息发送给保单录入服务器，然后保单服务器将其确定为该保单项目对应的信息对录入至保单存储系统中保单项目所对应的信息进行修改。

从图2可以看出，对于保单项目，保单录入用户只需要通过语音输入即可以实现对保单信息的录入，操作简单，提高了保单录入的效率和用户体验。

以下介绍实现可以实现上述场景的技术方案。

参见图3，图3是本发明实施例提供的一种基于图像识别的保单录入方法的流程示意图，该方法可以实现在图1所示的保单录入服务器或保单录入服务器组群上，以下以保单录入服务器为执行主体进行介绍。如图所示，该方法包括如下步骤：

S301，保单录入服务器接收语音采集终端发送的目标语音数据，目标语音数据为语音采集终端采集到的目标保单对应的语音数据。

这里，目标保单为要录入的保单。具体地，目标保单可以包括保单名称、保单所属的保险公司、保单号等用于反馈目标保单的性质的保单信息。例如，该目标保单为平安保险公司的车险保单。目标保单也可以包括被保人名称、被保人身份证号码(组织机构代码)、被保人地址、被保人联系电话、投保人名称、投保人身份证号码、投保人地址、投保人联系电话、保险起始时间、保险截止时间、投保人名称、投保人身份证号码等与用户无关的需要将其对应的信息录入至保单信息存储系统的保单项目。目标保单还可以包括被保人名称信息、被保人身份证号码(组织机构代码)信息、被保人地址信息、被保人联系电话信息、投保人名称信息、投保人身份证号码信息、投保人地址信息、投保人联系电话信息、保险起始时间信息、保险截止时间信息、投保人名称信息、投保人身份证号码信息等与用户相关的保单项目信息。目标保单还可以包括注意事项、特别提示等条件说明信息，不限于这里的描述，在可选的实施方式中，目标保单还可以有更少或更多的信息，本发明实施例不做限制。示例性地，目标保单可以如图4所示，图4为保险类型为车险的保单。

具体地，当保单录入用户通过语音采集终端登录保单录入系统并在保单录入系统的保单录入页面说出该保单录入页面上显示的保单项目对应的信息时，语音采集终端可以采集到目标保单对应的语音数据，该语音数据与目标保单中的保单项目信息对应，保单录入服务器可以接收到语音采集终端发送的目标语音数据。

S302，保单录入服务器对目标语音数据进行语音识别，得到目标语音数据对应的保单信息。

具体地，保单录入服务器可以通过基于统计模型的方法，或者，基于声道模型和语音指示的方法，或者，基于标准模板匹配的方法，或者，基于神经网络的方法中的其中一种语音识别的方法对目标语音数据进行语音识别，得到目标语音数据对应的保单信息。

以下以语音识别的方法为基于统计模型的方法对保单录入服务器对目标语音数据进行语音识别，得到目标语音数据对应的保单信息的具体过程。

步骤一、保单录入服务器对目标语音数据进行预处理，得到该目标语音数据对应的多个语音小段。

具体地，保单录入服务器可以以预设的采样周期对目标语音数据进行采样，将连续的目标语音数据变换为离散化的语音信号S(n)，采样周期可以为根据奈奎斯特采样定理确定的周期；然后保单录入服务器通过传递函数为H(Z)＝1-αZ^-1的数字滤波器对离散后的语音信号进行滤波，增加语音信号的高频分辨率，α为预加重系数，α大于0.9小于1；最后，保单录入服务器可以利用窗函数对离散的语音信息进行分帧处理得到多个语音小段，其中，窗函数可以为矩形窗、汉明窗或汉宁窗中的任意一种窗函数。

可选地，保单录入服务器还可以通过端点检测剔除语音小段中的噪声和干扰。其中，保单录入服务器可以通过基于能量的端点检测、基于信息熵的端点检测或基于频带方差的端点检测等方式进行端点检测。

步骤二、在得到目标语音数据对应的多个语音小段后，保单录入服务器分别对各个语音小段进行特征提取，得到M行*N列的观测序列，其中，M为声学特征的维度，N为语音小段的数量。

具体地，保单录入服务器可以分别对各个语音小段进行线性预测倒谱系数(linear prediction cepstral coefficients，LPCC)特征提取或者梅尔频率倒谱系数(Mel-scale frequency cepstral coefficients，MFCC)特征提取，将各个语音小段转化为M维特征向量，该多个语音小段的M维特征向量组成了M行*N列的观测序列。

步骤三、在得到观测序列后，保单录入服务器将观测序列送入预先训练得到的基于隐马尔可夫模型(Hidden Markov Model，HMM)的状态网络中，在该状态网络中查找与该观测序列的匹配度大于预设阈值的目标路径，将该目标路径对应的文本内容确定为保单信息。

其中，该状态网络包括预先利用大量的语音数据训练得到的声学模型、语音模型、词典模型以及解码器，将该观测序列送入状态网络中后，解码器结合声学模型、语言模型以及词典模型找出概率大于预设阈值的路径，将该路径确定为与观测序列的匹配度大于预设阈值的目标路径。

这里，预设阈值可以为接近于90％、95％、98％等接近于1的值。

具体地，目标路径可以为与观测序列的匹配度大于预设阈值的路径中与该观测序列的匹配度最高的路径，即概率大于预设阈值的路径中概率最大的路径。举例来说明，例如，预设阈值为90％，状态网络中有3条路径的概率大于90％，其中，路径1的概率为92％，路径2的概率为95％，路径3的概率为91％，则将路径2确定为目标路径。

S303，保单录入服务器根据目标语音数据对应的保单信息生成多个保单项目信息。

在一种可能的实现方式中，保单录入服务器根据目标语音数据对应的保单信息生成多个保单项目信息的方式为：保单录入服务器在目标语音数据对应的保单信息中确定第一字符和第二字符，并确定第一字符对应的语音片段数据和第二字符对应的语音片段数据之间的停顿时长，第一字符对应的语音片段数据和第二字符对应的语音片段数据在目标语音数据中为相邻的语音片段数据；保单录入服务器根据停顿时长以及保单信息生成多个保单项目信息。其中，如果第一字符对应的语音片段数据和第二字符对应的语音片段数据之间的停顿时长大于停顿时长阈值，则保单录入服务器确定第一字符和第二字符属于不同的保单项目信息，进而对保单信息进行拆分形成多个保单项目信息。停顿时长阈值为一个预设的时间长度值，例如可以为1s，2s，等等。

下面举例来对根据相邻的两个字符所对应的停顿时长和保单信息生成多个保单项目信息进行说明。例如，停顿时长阈值为1s，保单信息为“王XX女50”，其中，字符“王”对应的语音片段数据与字符“X”对应的语音片段数据之间的停顿时长为0.5s，字符“X”对应的语音片段数据与字符“X”对应的语音片段数据之间的停顿时长为0.6s，字符“X”对应的语音片段数据与字符“女”对应的语音片段数据之间的停顿时长为1.2s，字符“女”对应的语音片段数据与字符“5”对应的语音片段数据之间的停顿时长为1.3s，字符“5”对应的语音片段数据与字符“0”对应的语音片段数据之间的停顿时长为0.8s。由于字符“X”对应的语音片段数据与字符“女”对应的语音片段数据之间的停顿时长为1.2s，大于1s，则确定字符“X”与“女”属于不同的保单项目信息，进而在保单信息中将字符“X”与字符“女”拆分开。由于字符“女”对应的语音片段数据与字符“5”对应的语音片段数据之间的停顿时长为1.3s，大于1s，则确定字符“女”与字符“5”属于不同的保单项目信息，进而在保单信息中将字符“女”与字符“5”拆分开。经过两次拆分，保单信息可形成“王XX”、“女”以及“50”这几个保单项目信息。

在另一种可能的实现方式中，也可以预先建立基于自然语言处理(naturallanguage processing，NLP)的用于对保单中的保单信息进行分析的保单信息分词模型。保单录入服务器可以根据该保单分词模型将目标语音数据对应的保单信息划分为多个保单项目信息。其中，保单录入服务器可以将该保单信息分词模型输出的分词中不同于预设的保单模板信息的分词确定为待录入信息。例如，将待录入信息“王XX女50”输入保单信息分词模型后，保单信息分词模型依次输出“王XX”、“女”、“50”，则将“王XX”、“女”以及“50”分别确定为录入信息。

S304，保单录入服务器确定多个保单项目信息中的各个保单项目信息与目标保单中的各个保单项目的对应关系。

在一种可能的实现方式中，保单录入服务器确定多个保单项目信息中的各个保单项目信息与目标保单中的各个项目对应关系的方式具体可以为：保单录入服务器根据多个保单项目信息中的各个保单项目信息对应的语音片段数据在目标语音数据中的先后顺序分别确定各个保单项目信息的顺序；保单录入服务器根据目标保单中的各个保单项目在预设的保单模板信息中的先后顺序分别确定各个保单项目的顺序；保单录入服务器根据各个保单项目信息的顺序以及各个保单项目的顺序确定各个保单项目信息与各个保单项目的对应关系。其中，具备对应关系的保单项目和保单项目信息的顺序相同。这里，预设的保单模板信息为目标保单中固有的信息。例如，目标保单的格式如图4所示，则预设的保单模板信息可以为图4中如“被保险人”、“被保险机动车”等无需人工填写已经存在于保单中的信息。

举例来说明，例如，预设的保单模板信息包括保单项目“投保人姓名”、“投保人性别”、“投保人年龄”，其中，“投保人姓名”在“投保人性别”之前，“投保人性别”在“投保人年龄”之前，则确定“投保人姓名”的顺序为1，“投保人性别”的顺序为2，“投保人年龄”的顺序为3；保单项目信息分别为“王XX”、“女”以及“50”，其中，“王XX”对应的语音片段数据在目标语音数据中的顺序早于“女”对应的语音片段数据在目标语音数据中的顺序，“女”对应的语音片段数据在目标语音数据中的顺序早于“50”对应的语音片段数据，则确定“王XX”的顺序为1，“女”的顺序为2，“50”的顺序为3。由于“投保人姓名”的顺序与“王XX”的顺序均为1，则确定保单项目“投保人姓名”与保单项目信息“王XX”具备对应关系；由于“投保人性别”的顺序与“女”的顺序均为2，则确定保单项目“投保人性别”与保单项目信息“女”具备对应关系；由于“投保人年龄”与“50”的顺序均为3，则确定保单项目“投保人年龄”与保单项目信息“50”具备对应关系。

在另一种可能的实现方式中，保单录入服务器确定多个保单项目信息中的各个保单项目信息与目标保单中的各个项目对应关系的方式具体可以为：保单录入服务器根据多个保单项目信息中的各个保单项目信息对应的语音片段数据在目标语音数据中的先后顺序分别确定各个保单项目信息的顺序；保单录入服务器根据语音采集终端上显示的各个保单项目在该语音采集终端上显示顺序分别确定各个保单项目的顺序；保单录入服务器根据各个保单项目信息的顺序以及各个保单项目的顺序确定各个保单项目信息与各个保单项目的对应关系。其中，具备对应关系的保单项目和保单项目信息的顺序相同。

举例来说明，例如，语音采集终端上显示的保单项目“投保人姓名”、“投保人性别”、“投保人年龄”，其中，在语音采集终端上，“投保人姓名”显示在“投保人性别”之前，“投保人性别”显示在“投保人年龄”之前，则确定“投保人姓名”的顺序为1，“投保人性别”的顺序为2，“投保人年龄”的顺序为3；保单项目信息分别为“王XX”、“女”以及“50”，其中，“王XX”对应的语音片段数据在目标语音数据中的顺序早于“女”对应的语音片段数据在目标语音数据中的顺序，“女”对应的语音片段数据在目标语音数据中的顺序早于“50”对应的语音片段数据，则确定“王XX”的顺序为1，“女”的顺序为2，“50”的顺序为3。由于“投保人姓名”的顺序与“王XX”的顺序均为1，则确定保单项目“投保人姓名”与保单项目信息“王XX”具备对应关系；由于“投保人性别”的顺序与“女”的顺序均为2，则确定保单项目“投保人性别”与保单项目信息“女”具备对应关系；由于“投保人年龄”与“50”的顺序均为3，则确定保单项目“投保人年龄”与保单项目信息“50”具备对应关系。

S305，保单录入服务器根据各个保单项目信息与目标保单中的各个保单项目的对应关系在多个保单项目信息中确定第一保单项目对应的第一保单项目信息，将第一保单项目信息作为第一保单项目对应的信息录入至保单信息存储系统，保单信息存储系统用于保存保单信息。

这里，保单信息存储系统可以有两种情况：

第一种情况，保单信息存储系统为一个或多个保单录入服务器组成的分布式存储系统。

第二种情况，保单信息存储系统为一个或多个保单录入服务器组成的区块链系统。

在第一种情况下，保单录入服务器将第一保单项目信息作为第一保单项目对应的信息保存在本地后，可以将第一保单项目信息作为第一保单项目对应的信息备份至其他的保单录入服务器中。

在第二种情况下，保单录入服务器将第一保单项目信息作为第一保单项目对应的信息发布至区块链系统中保存，保单录入服务器将第一保单项目信息作为第一保单项目对应的信息发布至区块链系统中保存的具体实现方式可参考后续图6对应的实施例的描述，此处不做过多描述。

本发明实施例中，保单录入服务器通过对目标保单对应的语音数据进行语音识别得到保单信息，然后生成多个保单项目信息并确定保单项目信息与保单项目的对应关系，在对某个保单项目进行录入时，根据该对应关系确定与该保单项目对应的保单项目信息并对其进行录入，省去用户手动输入保单项目信息的过程，提高保单录入的效率。

在一些可能的场景中，在将保单项目信息录入至保单信息存储系统后，还可以向用户显示已经录入的保单项目信息，以便用户可以对录入的保单项目信息进行修改和核对。参见图5，图5是本发明实施例提供的另一种基于图像识别的保单录入方法的流程示意图，该方法可以实现在图1所示的保单录入服务器或保单录入服务器组群上。如图所示，该方法包括如下步骤：

S501，保单录入服务器接收语音采集终端发送的目标语音数据，目标语音数据为语音采集终端采集到的目标保单对应的语音数据。

S502，保单录入服务器对目标语音数据进行语音识别，得到目标语音数据对应的保单信息。

S503，保单录入服务器根据目标语音数据对应的保单信息生成多个保单项目信息。

S504，保单录入服务器确定多个保单项目信息中的各个保单项目信息与目标保单中的各个保单项目的对应关系。

S505，保单录入服务器根据各个保单项目信息与目标保单中的各个保单项目的对应关系在多个保单项目信息中确定第一保单项目对应的第一保单项目信息，将第一保单项目信息作为第一保单项目对应的信息录入至保单信息存储系统，保单信息存储系统用于保存保单信息。

这里，步骤S501～S505的具体实现方式可参考图3对应的实施例中步骤S301～S305的描述，此处不再赘述。

S506，保单录入服务器将第一保单项目信息以及第一保单项目信息与第一保单项目的对应关系发送给语音采集终端，以使语音采集终端在第一保单项目对应的信息显示位置显示第一保单项目信息。

具体地，保单录入服务器可以将第一保单项目信息以及第一保单项目的标识，或者，第一保单项目信息以及第一保单项目发送给图像终端，图像终端接收到第一保单项目信息以及第一保单项目的标识，或者，第一保单项目信息以及第一保单项目，可以确定第一保单信息为第一保单项目对应的信息，进而在第一保单项目对应的信息显示位置显示第一保单项目信息。示例性地，语音采集终端在第一保单项目对应的信息显示位置显示第一保单项目信息可参见图2中④所示。

S507，在接收到语音采集终端发送的保单信息修改请求的情况下，保单录入服务器在保单信息存储系统中将第一保单项目信息修改为第二保单项目信息，保单信息修改请求用于请求修改第一保单项目对应的信息，保单信息修改请求包括第二保单项目信息。

本发明实施例中，保单录入服务器在对语音采集终端采集到语音数据进行语音识别和处理得到保单项目信息并将保单项目信息对应录入至保单信息存储系统之后，还将处理得到的保单项目信息发送给语音采集终端上显示，可以使保单录入用户对已经录入的信息进行核对和修改，保证录入的保单信息的准确性。

在一些可能的场景中，上述图3或图5对应的实施例所涉及的保单信息存储系统可以为区块链系统，该区块链系统可以为私有链系统，也可以为联盟系统。以下以保单信息存储系统为联盟链系统为例介绍将第一保单项目信息录入至保单信息存储系统的具体过程。图6是本发明实施例提供的一种将保单项目信息录入至保单信息存储系统的流程示意图，如图所示，该流程包括：

S601，保单录入服务器生成保单信息发布事务，保单信息发布事务包括第一保单项目信息。

保单录入服务器为联盟链系统中的同等节点。具体实现中，保单录入服务器可以通过软件开发工具包(software development kit，SDK)生成保单信息发布事务。可选地，该保单信息发布事务除了包括该第一保单项目信息外，还可以包括第一保单项目和/或第一保单项目的标识信息、事务版本，等等。

S602，保单录入服务器将保单信息发布事务发送给联盟链系统中的背书节点，背书节点接收保单信息发布事务。

背书节点为基于智能合约设置的在保单录入服务器的背书策略中的节点，背书节点可以与保单录入服务器属于同一个联盟链通道。背书节点为图1所示的架构中的保单录入服务器组群的其中一个或多个保单录入服务器。

具体实现中，保单录入服务器可以通过组播的方式或者分别发送的方式将保单信息发布事务发送给联盟链系统中的背书节点，该背书节点用于对保单录入服务器发送的区块链事务进行事务背书，以保证该事务的真实性和合法性。

S603，背书节点对保单信息发布事务进行背书。

这里，背书节点对该保单信息发布事务进行背书的过程为：背书节点将该保单信息发布事务作为输入执行该智能合约得到输出结果，然后采用背书节点的私钥对输出结果进行签名得到背书结果。

S604，背书节点将对保单信息发布事务进行背书得到的背书结果发送给保单录入服务器，保单录入服务器接收背书结果。

保单录入服务器可以在接收到大部分同等节点发送的背书结果的情况下，确定对保单信息发布事务的事务背书完成。其中，具体需要接收到多少个同等节点的背书结果才确定对保单信息发布事务的事务背书完成可以根据具体情况设定。例如，当背书策略中的背书节点较少时，可以设计为当接收到90％以上的背书节点发送的背书结果时，则确定对保单信息发布事务的事务背书完成；当背书策略中的背书节点较多时，可以设计为当接收到80％以上的背书节点发送的背书结果时，则确定对保单信息发布事务的事务背书完成。

保单录入服务器在根据背书结果确定完成对保单信息发布事务的事务背书的情况下，执行步骤S605。

S605，保单录入服务器将保单信息发布事务发送给联盟链系统中的命令节点。

这里，保单录入服务器将保单信息发布事务和接收到的所有的背书结果打包发送给联盟链系统中的命令节点。

S606，命令节点根据该保单信息发布事务的时间对保单信息发布事务进行排序。

S607，命令节点生成保单信息发布事务对应的区块。

这里，命令节点按照时间顺序将当前在联盟链中产生的还未被打包的所有的事务进行打包构建形成区块，其中，未被打包的所有的事务包括该保单信息发布事务。

S608，命令节点将保单信息发布事务对应的区块发送给联盟链系统中的所有同等节点，联盟链上的所有同等节点接收保单信息发布事务对应的区块。

具体实现中，命令节点可以从同等节点中选择一个作为领导节点(leader peer)，将保单信息发布事务对应的区块发送给该领导节点，然后该领导节点基于Gossip协议随机地与联盟链中的部分同等节点进行通信以使该保单信息发布事务在联盟链的同等节点中同步，从而将保单信息发布事务对应的区块同步至联盟链上的所有同等节点。

S609，联盟链系统中的所有同等节点对保单信息发布事务对应的区块进行验证。

这里，同等节点对保单信息发布事务对应的区块进行验证是指对保单信息发布事务对应的区块中的所有事务的背书策略以及事务版本进行验证，验证的具体方式为：分别对该区块中的每个事务的背书结果中签名进行验证，验证该签名对应的背书节点是否为该事务对应的背书策略中的节点，验证每个事务的版本是否与本地的版本相同。如果对每个事务的背书结果以及事务版本的验证均通过，则确定对保单信息发布事务对应的区块的验证通过。

在对保单信息发布事务对应的区块的验证通过的情况下，同等节点执行步骤S610。

S610，同等节点将保单信息发布事务对应的区块保存到本地。

通过背书、排序以及验证三个环节，可以使发布至联盟链系统的保单信息得到验证，确保只有正确合法的保单信息才能发布至联盟链系统，保证了联盟链系统中的保单信息的真实性和可靠性，将保单信息发布至联盟链系统中起到了对保单信息进行备份的作用和防止保单信息被篡改的作用。

上面介绍了发明实施例的方法，下面介绍发明实施例的装置。

参见图7，图7是本发明实施例提供的一种基于语音识别的保单录入装置的组成结构示意图，该装置可以为上述图1所示的保单录入服务器或保单录入服务器群组，该装置70包括：

语音数据接收模块701，用于接收语音采集终端发送的目标语音数据，所述目标语音数据为所述语音采集到的目标保单对应的语音数据；

语音识别模块702，用于对所述目标语音数据进行语音识别，得到所述目标语音数据对应的保单信息；

信息生成模块703，用于根据所述保单信息生成多个保单项目信息；

关系确定模块704，用于确定所述多个保单项目信息中的各个保单项目信息与所述目标保单中的保单项目的对应关系；

信息录入模块705，用于根据所述对应关系在所述多个保单项目信息中确定第一保单项目对应的第一保单项目信息，将所述第一保单项目信息作为所述第一保单项目对应的信息录入至保单信息存储系统，所述保单信息存储系统用于保存保单信息。

在一种可能的设计中，所述信息生成模块703具体用于：

在所述保单信息中确定第一字符和第二字符，并确定所述第一字符对应的语音片段数据和所述第二字符对应的语音片段数据之间的停顿时长，所述第一字符对应的语音片段数据和所述第二字符对应的语音片段数据在所述目标语音数据中为相邻的语音片段数据；

根据所述停顿时长以及所述保单信息生成多个保单项目信息。

在一种可能的设计中，所述关系确定模块704具体用于：

根据所述多个保单项目信息中的各个保单项目信息对应的语音片段数据在所述目标语音数据中的先后顺序分别确定所述各个保单项目信息的顺序；

根据所述目标保单中的各个保单项目在预设的保单模板信息中的先后顺序分别确定所述各个保单项目的顺序；

根据所述各个保单项目信息的顺序以及所述各个保单项目的顺序确定各个保单项目信息与所述各个保单项目的对应关系。

在一种可能的设计中，所述语音识别模块702具体用于：

通过基于统计模型的方法，或者，基于声道模型和语音知识的方法，或者，基于标准模板匹配的方法，或者，基于神经网络的方法对所述目标语音数据进行语音识别，得到所述目标语音数据对应的保单信息。

在一种可能的设计中，所述语音识别模块702具体用于：

对所述目标语音数据进行预处理，得到所述目标语音数据对应的多个语音小段；

对所述多个语音小段中的各个语音小段进行声学特征提取，得到M行*N列的观测序列，其中，M为声学特征的维度，N为所述语音小段的数量；

将所述观测序列送入预先训练得到的基于隐马尔可夫模型的状态网络中，在所述状态网络中查找与所述观测序列的匹配度大于预设阈值的目标路径，将所述目标路径对应的文本内容确定为所述保单信息。

在一种可能的设计中，所述装置还包括：

信息发送模块706，用于将所述第一保单项目信息以及第一保单项目信息与所述第一保单项目的对应关系发送给所述语音采集终端，以使所述语音采集终端在所述第一保单项目对应的信息显示位置显示所述第一保单项目信息；

信息修改模块707，用于在接收到所述语音采集终端发送的保单信息修改请求的情况下，在所述保单信息存储系统中将所述第一保单项目信息修改为第二保单项目信息，所述保单信息修改请求用于请求修改所述第一保单项目对应的保单项目信息，所述保单信息修改请求包括所述第二保单项目信息。

在一种可能的设计中，所述信息录入模块705具体用于：生成所述保单信息发布事务，所述保单信息发布事务包括所述第一保单项目信息；

将所述保单信息发布事务发送给所述区块链系统中的背书节点进行事务背书，所述背书节点为基于智能合约设置的背书策略中的节点；

当根据所述背书节点返回的背书结果确定已完成对所述保单信息发布事务的事务背书时，将所述保单信息发布事务发送给所述联盟链系统中的命令节点，以使所述命令节点对所述保单信息发布事务进行排序并形成所述保单信息发布事务对应的区块；

接收所述命令节点发送的所述区块；

在对所述区块的验证通过的情况下，在本地保存所述区块。

需要说明的是，图7对应的实施例中未提及的内容可参见方法实施例的描述，这里不再赘述。

本发明实施例中，基于语音识别的保单录入装置通过对目标保单对应的语音数据进行语音识别得到保单信息，然后生成多个保单项目信息并确定保单项目信息与保单项目的对应关系，在对某个保单项目进行录入时，根据该对应关系确定与该保单项目对应的保单项目信息并对其进行录入，省去用户手动输入保单项目信息的过程，提高保单录入的效率。

参见图8，图8是本发明实施例提供的另一种基于语音识别的保单录入装置的组成结构示意图，该装置可以为上述图1所示的保单录入服务器或保单录入服务器群组，该装置80包括处理器801、存储器802以及通信接口803。处理器801连接到存储器802和通信接口803，例如处理器801可以通过总线连接到存储器802和通信接口803。

处理器801被配置为支持所述基于语音识别的保单录入装置执行图3-图6所述的基于语音识别的保单录入方法中相应的功能。该处理器801可以是中央处理器(centralprocessing unit，CPU)，网络处理器(network processor，NP)，硬件芯片或者其任意组合。上述硬件芯片可以是专用集成电路(application specific integrated circuit，ASIC)，可编程逻辑器件(programmable logic device，PLD)或其组合。上述PLD可以是复杂可编程逻辑器件(complex programmable logic device，CPLD)，现场可编程逻辑门阵列(field-programmable gate array，FPGA)，通用阵列逻辑(generic array logic，GAL)或其任意组合。

存储器802存储器用于存储程序代码等。存储器802可以包括易失性存储器(volatile memory，VM)，例如随机存取存储器(random access memory，RAM)；存储器802也可以包括非易失性存储器(non-volatile memory，NVM)，例如只读存储器(read-onlymemory，ROM)，快闪存储器(flash memory)，硬盘(hard disk drive，HDD)或固态硬盘(solid-state drive，SSD)；存储器802还可以包括上述种类的存储器的组合。本发明实施例中，该装置可以为上述图1所示的保单录入服务器或保单录入服务器群组。

所述通信接口803用于发送或接收数据。

处理器801可以调用所述程序代码以执行以下操作：

通过通信接口803接收语音采集终端发送的目标语音数据，所述目标语音数据为所述语音采集到的目标保单对应的语音数据；

根据所述保单信息生成多个保单项目信息；

需要说明的是，各个操作的实现还可以对应参照图3-图6所示的方法实施例的相应描述；所述处理器801还可以与通信接口803配合执行上述方法实施例中的其他操作。

本发明实施例还提供一种计算机存储介质，所述计算机存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被计算机执行时使所述计算机执行如前述实施例所述的方法，所述计算机可以为上述提到的基于语音识别的保单录入装置的一部分。例如为上述的处理器801。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、ROM或RAM等。

以上所揭露的仅为本发明较佳实施例而已，当然不能以此来限定本发明之权利范围，因此依本发明权利要求所作的等同变化，仍属本发明所涵盖的范围。

Claims

1.一种基于语音识别的保单录入方法，其特征在于，包括：

根据所述保单信息生成多个保单项目信息，包括：在所述保单信息中确定第一字符和第二字符，并确定所述第一字符对应的语音片段数据和所述第二字符对应的语音片段数据之间的停顿时长，所述第一字符对应的语音片段数据和所述第二字符对应的语音片段数据在所述目标语音数据中为相邻的语音片段数据；如果第一字符对应的语音片段数据和第二字符对应的语音片段数据之间的停顿时长大于停顿时长阈值，确定第一字符和第二字符属于不同的保单项目信息，对保单信息进行拆分形成多个保单项目信息；

确定所述多个保单项目信息中的各个保单项目信息与所述目标保单中的保单项目的对应关系，包括：根据所述多个保单项目信息中的各个保单项目信息对应的语音片段数据在所述目标语音数据中的先后顺序分别确定所述各个保单项目信息的顺序；根据语音采集终端上显示的各个保单项目在该语音采集终端上显示顺序分别确定各个保单项目的顺序；根据所述各个保单项目信息的顺序以及所述各个保单项目的顺序确定各个保单项目信息与所述各个保单项目的对应关系，具备对应关系的保单项目和保单项目信息的顺序相同；

2.根据权利要求1所述的方法，其特征在于，所述确定所述多个保单项目信息中的各个保单项目信息与所述目标保单中的保单项目的对应关系，包括：

3.根据权利要求1所述的方法，其特征在于，所述对所述目标语音数据进行语音识别，得到所述目标语音数据对应的保单信息，包括：

4.根据权利要求3所述的方法，其特征在于，所述通过基于统计模型的方法对所述目标语音数据进行语音识别得到，得到所述目标语音数据对应的保单信息，包括：

5.根据权利要求1-4任一项所述的方法，其特征在于，所述将所述第一保单项目信息作为所述第一保单项目对应的信息录入至保单信息存储系统之后，还包括：

将所述第一保单项目信息以及第一保单项目信息与所述第一保单项目的对应关系发送给所述语音采集终端，以使所述语音采集终端在所述第一保单项目对应的信息显示位置显示所述第一保单项目信息；

在接收到所述语音采集终端发送的保单信息修改请求的情况下，在所述保单信息存储系统中将所述第一保单项目信息修改为第二保单项目信息，所述保单信息修改请求用于请求修改所述第一保单项目对应的保单项目信息，所述保单信息修改请求包括所述第二保单项目信息。

6.根据权利要求1-4任一项所述的方法，其特征在于，所述保单信息存储系统为区块链系统，所述将所述第一保单项目信息作为所述第一保单项目对应的信息录入至保单信息存储系统包括：

生成所述保单信息发布事务，所述保单信息发布事务包括所述第一保单项目信息；

当根据所述背书节点返回的背书结果确定已完成对所述保单信息发布事务的事务背书时，将所述保单信息发布事务发送给联盟链系统中的命令节点，以使所述命令节点对所述保单信息发布事务进行排序并形成所述保单信息发布事务对应的区块；

接收所述命令节点发送的所述区块；

在对所述区块的验证通过的情况下，在本地保存所述区块。

7.一种基于语音识别的保单录入装置，其特征在于，包括：

信息生成模块，用于根据所述保单信息生成多个保单项目信息，所述信息生成模块还用于，在所述保单信息中确定第一字符和第二字符，并确定所述第一字符对应的语音片段数据和所述第二字符对应的语音片段数据之间的停顿时长，所述第一字符对应的语音片段数据和所述第二字符对应的语音片段数据在所述目标语音数据中为相邻的语音片段数据；如果第一字符对应的语音片段数据和第二字符对应的语音片段数据之间的停顿时长大于停顿时长阈值，确定第一字符和第二字符属于不同的保单项目信息，对保单信息进行拆分形成多个保单项目信息；

关系确定模块，用于确定所述多个保单项目信息中的各个保单项目信息与所述目标保单中的保单项目的对应关系，所述关系确定单元还用于，根据所述多个保单项目信息中的各个保单项目信息对应的语音片段数据在所述目标语音数据中的先后顺序分别确定所述各个保单项目信息的顺序；根据语音采集终端上显示的各个保单项目在该语音采集终端上显示顺序分别确定各个保单项目的顺序；根据所述各个保单项目信息的顺序以及所述各个保单项目的顺序确定各个保单项目信息与所述各个保单项目的对应关系，具备对应关系的保单项目和保单项目信息的顺序相同；

8.一种基于语音识别的保单录入装置，包括处理器、存储器以及通信接口，所述处理器、存储器和通信接口相互连接，其中，所述通信接口用于接收或发送数据，所述存储器用于存储程序代码，所述处理器用于调用所述程序代码，执行如权利要求1-6任一项所述的方法。

9.一种计算机存储介质，其特征在于，所述计算机存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被处理器执行时使所述处理器执行如权利要求1-6任一项所述的方法。