WO2020093720A1

WO2020093720A1 - 基于语音识别的信息查询方法和装置

Info

Publication number: WO2020093720A1
Application number: PCT/CN2019/095013
Authority: WO
Inventors: 车惯红
Original assignee: 平安医疗健康管理股份有限公司
Priority date: 2018-11-07
Filing date: 2019-07-08
Publication date: 2020-05-14
Also published as: CN109299227A; CN109299227B

Abstract

本申请提供确定基于语音识别的信息查询方法和装置，其中，所述方法包括：接收语音采集终端发送的信息查询请求，所述信息查询请求包括所述语音采集终端采集的语音数据；对所述语音数据进行语音识别得到信息查询语句；将所述信息查询语句作为关键字，在医疗保险文件存储系统中查找第一医疗保险文件，所述第一医疗保险文件的内容中包含所述关键字，所述医疗保险文件存储系统用于存储医疗保险文件；将所述第一医疗保险文件发送给所述语音采集终端，以使所述语音采集终端显示所述第一医疗保险文件。该方案可以帮助不会利用对医疗保险平台的进行搜索的用户获取医疗保险信息，提高用户体验。

Description

基于语音识别的信息查询方法和装置

本申请要求于2018年11月7日提交中国专利局、申请号为2018113232950、申请名称为“基于语音识别的信息查询方法和装置”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及医疗技术领域，尤其涉及基于语音识别的信息查询方法和装置。

背景技术

医疗保险是为了补偿劳动者因疾病风险造成的经济损失而建立的一项社会保险制度。随着互联网技术的发展，购买医疗保险的用户或医疗保险信息管理用户可以通过在基于互联网技术的医疗保险管理平台上查询想要了解的医疗保险政策、购买的医疗保险信息等与医疗保险相关的信息。

但是，对于一些文化水平较低的、年龄较高的用户来说，由于这些用户不会打字或者不会使用医疗保险管理平台的搜索功能，所以他们无法利用医疗保险管理平台进行医疗保险信息的查询。

申请内容

本申请实施例提供基于语音识别的信息查询方法和装置，解决使用医疗保险管理平台的搜索功能存在困难的用户无法获取医疗保险信息的问题。

第一方面，提供一种基于语音识别的信息查询方法，包括：

接收语音采集终端发送的信息查询请求，所述信息查询请求包括所述语音采集终端采集的语音数据；

对所述语音数据进行语音识别得到信息查询语句；

将所述信息查询语句作为关键字，在医疗保险文件存储系统中查找第一医疗保险文件，所述第一医疗保险文件的内容中包含所述关键字，所述医疗保险文件存储系统用于存储医疗保险文件；

将所述第一医疗保险文件发送给所述语音采集终端，以使所述语音采集终端显示所述第一医疗保险文件。

第二方面，提供一种基于语音识别的信息查询装置，包括：

请求接收模块，用于接收语音采集终端发送的信息查询请求，所述信息查询请求包括所述语音采集终端采集的语音数据；

语音识别模块，用于对所述语音数据进行语音识别得到信息查询语句；

文件查询模块，用于将所述信息查询语句作为关键字，在医疗保险文件存储系统中查找第一医疗保险文件，所述第一医疗保险文件的内容中包含所述关键字，所述医疗保险文件存储系统用于存储医疗保险文件；

文件发送模块，用于将所述第一医疗保险文件发送给所述语音采集终端，以使所述语音采集终端显示所述第一医疗保险文件。

第三方面，提供另一种基于语音识别的信息查询装置，包括处理器、存储器以及通信接口，所述处理器、存储器和通信接口相互连接，其中，所述通信接口用于接收或发送数据，所述存储器用于存储基于语音识别的信息查询装置执行上述方法的应用程序代码，所述处理器被配置用于执行上述第一方面的方法。

第四方面，提供一种计算机非易失性可读存储介质，所述计算机非易失性可读存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被处理器执行时使所述处理器执行上述第一方面的方法。

本申请实施例中，通过语音识别的方式实现了根据用户的语音进行医疗保险文件进行搜索的功能，用户只需要通过语音即可获取到想要查询的医疗保险信息，使得对医疗保险平台的操作存在困难的用户也能获取医疗保险信息，提高了用户体验。

附图说明

图1是本申请实施例提供的一种基于语音识别的医疗保险信息查询系统的结构示意图；

图2是本申请实施例提供的一种基于语音识别的信息查询方法的流程示意图；

图3是本申请实施例提供的语音采集终端显示医疗保险文件的示意图；

图4是本申请实施例提供的另一种确定药品报销信息异常的方法的流程示意图；

图5是本申请实施例提供的语音采集终端显示医疗保险文件的示意图；

图6是本申请实施例提供的一种基于语音识别的信息查询装置的组成结构示意图；

图7是本申请实施例提供的另一种基于语音识别的信息查询装置的组成结构示意图。

具体实施方式

下面将结合图1至图7，对本申请实施例提供的基于语音识别的信息查询方法和装置进行说明。

参见图1，图1是本申请实施例提供的一种基于语音识别的医疗保险信息查询系统的结构示意图，如图所示，该系统包括医疗保险信息查询服务器101和一个或多个语音采集终端102。语音采集终端102用于采集用户的语音数据，并将采集到的语音数据发送给医疗保险信息查询服务器101进行语音识别。语音采集终端102可以为电脑、平板电脑、智能终端设备，等等。语音采集终端102可以为医疗保险机构(如社保局、保险公司等)提供的供用户查询医疗保险信息的自助查询机。医疗保险信息查询服务器101用于接收语音采集终端102发送的查询请求，根据该查询请求查询与该查询请求对应的医疗保险信息发送给语音采集终端。

基于图1所示基于语音识别的医疗保险信息查询系统，可以实现本申请实施例的方案，接下来介绍本申请实施例的方案。

参见图2，图2是申请实施例提供的一种基于语音识别的信息查询方法的流程示意图，该方法可以实现在上述图1所示的医疗保险信息查询服务器上，如图所示，该方法包括：

S201，接收语音采集终端发送的信息查询请求，信息查询请求包括语音采集终端采集的语音数据。

可选地，信息查询请求还可以携带该语音采集终端的终端标识，该终端标识用于在上述医疗保险信息查询系统中唯一地标识该语音采集终端，语音采集终端的终端标识可以为该语音采集终端的互联网协议(Internet protocol，IP)地址、多媒体接入控制(media access control，MAC)地址或者医疗保险信息查询服务器为该语音采集终端分配的标识，等等。

语音采集终端可以在采集到该语音数据之后的一段时间内未采集到其他的语音数据时，发出信息查询请求，该一段时间的时长大于或等于第一时长阈值，第一时长阈值可以设置为30s，1分钟等时间长度。

S202，对语音采集终端采集的语音数据进行语音识别得到信息查询语句。

具体地，可以通过基于统计模型的方法，或者，基于声道模型和语音指示的方法，或者，基于标准模板匹配的方法，或者，基于神经网络的方法中的其中一种语音识别的方法对语音采集终端采集的语音数据进行语音识别，得到信息查询语句。

以下以语音识别的方法为基于统计模型的方法对语音采集终端采集的语音数据进行语音识别得到信息查询语句的具体过程。

1，首先，可以对语音采集终端采集的语音数据进行预处理，得到语音数据对应的多个语音小段。

具体地，可以以预设的采样周期对语音采集终端采集的语音数据进行采样，将连续的语音数据变换为离散化的语音信号S(n)，采样周期可以为根据奈奎斯特采样定理确定的周期；然后通过传递函数为H(Z)＝1-αZ ^-1的数字滤波器对离散后的语音信号进行滤波，增加语音信号的高频分辨率，α为预加重系数，α大于0.9小于1；最后，可以利用窗函数对离散的语音信息进行分帧处理得到多个语音小段，其中，窗函数可以为矩形窗、汉明窗或汉宁窗中的任意一种窗函数。

可选地，还可以通过端点检测剔除语音小段中的噪声和干扰。其中，可以通过基于能量的端点检测、基于信息熵的端点检测或基于频带方差的端点检测等方式进行端点检测。

2，在得到语音数据对应的多个语音小段后，可以分别对各个语音小段进行特征提取，得到M行*N列的观测序列，其中，M为声学特征的维度，N为语音小段的数量。

具体地，可以分别对各个语音小段进行线性预测倒谱系数(linear prediction cepstral coefficients)特征提取或者梅尔频率倒谱系数(Mel-scale frequency cepstral coefficients，MFCC)特征提取，将各个语音小段转化为M维特征向量，该多个语音小段的M维特征向量组成了M行*N列的观测序列。

3，在得到观测序列后，将观测序列送入预先训练得到的基于隐马尔可夫模型(Hidden Markov Model，HMM)的状态网络中，在该状态网络中查找与该观测序列的匹配度大于预设阈值的目标路径，将该目标路径对应的文本内容确定为信息查询语句。

其中，该状态网络包括预先利用大量的语音数据训练得到的声学模型、语音模型、词典模型以及解码器，将该观测序列送入状态网络中后，解码器结合声学模型、语言模型以及词典模型找出概率最大的路径，将该路径确定为与观测序列最匹配的目标路径。

S203，将信息查询语句作为关键字，在医疗保险文件存储系统中查找第一医疗保险文件，其中，第一医疗保险文件的内容中包含关键字，医疗保险文件存储系统用于存储医疗保险文件。

这里，医疗保险文件存储系统为存储有多个医疗保险文件的系统，医疗保险文件存储系统可以为医疗保险信息查询服务器本地的存储区域；医疗保险文件存储系统也可以为由多个医疗保险信息查询服务器组成的分布式存储系统，即多个医疗文件分布式存储在多个医疗保险信息查询服务器中。医疗保险文件存储系统中存储的医疗保险文件可以为医疗保险政策文件、个人医疗保险文件、参保人员待遇文件、医疗保险范围药品文件、医疗保险定点药店管理协议文件、医疗保险药品限定支付依据文件、床位医疗保险支付标准文件、医疗保险诊疗项目约定服务医院文件、慢特病管理政策文件、医保基金支付方式文件等与医疗保险信息相关的文件。

本申请实施例中，可以有两种在医疗保险文件存储系统中查找第一医疗保险文件的方式：

第一种方式，可以通过文件操作插件依次打开医疗保险文件存储系统中的医疗保险文件，并通过文件操作插件将该信息查询语句作为查询的关键字，在已经打开的医疗保险文件中查找该信息查询语句，如果在第二医疗保险文件中查询到该信息查询语句，则确定第二医疗保险文件中包含该信息查询语句，则将该第二医疗保险文件确定为第一医疗保险文件。

例如，信息查询语句为“高血压”，医疗保险文件存储系统存储中的医疗保险文件为医疗保险文件1～医疗保险文件100，则可以通过文件操作插件依次打开医疗保险文件1～医疗保险文件100，然后通过文件操作插件将“高血压”作为查询的关键字，分别在医疗保险文件1～医疗保险文件100查找“高血压”这一关键字，假设在医疗保险文件3～10中均查找到“高血压”这一个关键字，则将医疗保险文件3～10确定为第一医疗保险文件。

可选地，在通过文件操作插件对医疗保险文件存储系统中的每个医疗保险文件均执行完查找该信息查询语句之后，还可以通过该文件操作插件依次关闭已经打开的各个医疗保险文件。

第二种方式，可以对医疗保险文件存储系统的医疗保险文件进行标签提取，得到各个医疗保险文件的文件标签，然后将各个医疗保险文件的文件标签以及文件标签与医疗保险文件的对应关系保存到文件标签数据表中，其中，各个医疗保险文件的文件标签为该医疗保险文件中的内容。在查找包含信息查询语句的第一医疗保险文件时，可以遍历该文件标签数据表，直到找到与该信息查询语句相同或包含该信息查询语句的文件标签，将该与该信息查询语句相同或包含该信息查询语句的文件标签确定为目标文件标签，然后根据该文件标签数据表中存储的文件标签与医疗保险文件的对应关系将与该目标文件标签对应的医疗保险文件确定为第一医疗保险文件。

具体地，可以从各个医疗保险文件中提取专有名词(如慢特病、支付方式等)、疾病病种(如高血压、糖尿病等)或与疾病病种相关的一些名词或词语、药品名称(如康莱特等)或与药品名称相关的一些名词或词语等作为各个医疗保险文件的文件标签。

举例来进行说明，假设医疗保险文件存储系统的医疗保险文件为医疗保险文件1～医疗保险文件100，分别对医疗保险文件1～保险文件100提取得到的文件标签为文件标签1～文件标签100，其中，文件标签与保险文件的对应关系如表1所示。

标签编号	文件标签	医疗保险文件名称
1	文件标签1	医疗保险文件1，医疗保险文件3，医疗保险文件8，…
2	文件标签2	医疗保险文件5，医疗保险文件8，医疗保险文件10，…

…	…	…
100	文件标签100	医疗保险文件4，医疗保险文件8，医疗保险文件25，…

表1

假设信息查询语句为文件标签2，则遍历表1，当遍历至文件标签2时，文件标签2与信息查询语句相同，则确定文件标签2为目标标签，则将与文件标签2对应的医疗保险文件5，医疗保险文件8以及医疗保险文件10确定为第一医疗保险文件。

可选地，如果在查找包含信息查询语句的第一保险文件时，在遍历完该文件标签数据表之后，未查找到与该信息查询语句相同或包含该信息查询语句的目标文件标签时，可以按照上述第一种方式在医疗保险文件存储系统中查找第一医疗保险文件。

可选地，在通过上述第二种方式未查找到第一医疗保险文件，但是通过上述第一种方式查找到第一医疗保险文件时，可以将该信息查询语句作为该第一医疗保险文件的文件标签，该将信息查询语句以及该信息查询语句与第一医疗保险文件的对应关系保存到文件标签数据表中。通过这种方式，在后续将该信息查询语句作为关键字查询医疗保险文件时，可以根据该信息查询语句与医疗保险文件的对应关系直接确定包含该信息查询语句的第一医疗保险文件的名称，进而根据该第一医疗保险文件的名称在医疗保险文件存储系统中获取该第一医疗保险文件，而不用再依次打开医疗保险文件进行关键字搜索，提高查找医疗保险文件的效率。

例如，文件标签数据表如表1所示，信息查询语句与文件标签1～文件100均不相同，通过上述第一种方式查找到的第一医疗保险文件为医疗保险文件95，则将信息查询语句以及信息查询语句与医疗保险文件95的对应关系保存到文件标签数据表之后，文件标签数据表可以如表2所示。

标签编号	文件标签	医疗保险文件名称
1	文件标签1	医疗保险文件1，医疗保险文件3，医疗保险文件7，…
2	文件标签2	医疗保险文件5，医疗保险文件8，医疗保险文件10，…
…	…	…
100	文件标签100	医疗保险文件4，医疗保险文件9，医疗保险文件25，…
101	信息查询语句	医疗保险文件95

表2

可选地，在通过上述第二种方式未查找到第一医疗保险文件，但是通过上述第一种方式查找到第一医疗保险文件时，可以保存该信息查询语句，并统计该信息查询语句在第一时间段内作为关键字在医疗保险文件存储系统中查找第一医疗保险文件的第一统计次数，当第一统计次数大于预设第一次数时，将该信息查询语句作为该第一医疗保险文件的文件标签，并将该信息查询语句以及该信息查询语句与第一医疗保险文件的对应关系保存到文件标签数据表中。其中，第一时间段可以为一周、一个月等时间长度，第一次数可以为20次，30次，等等。通过这种方式，可以将经常被用作关键字的信息查询语句保存到文件标签数据表中，一方面，可以尽量减少文件标签的增加，另一方，将常用的关键字保存到文件标签数据表中也可以起到提高查找医疗保险文件的效率的作用。

例如，信息查询语句为“药品支付依据”，预设时间段为一个月，次数阈值为50次，如果在一个月内“药品支付依据”这一信息查询语句作为关键字在医疗保险文件存储系统中查找第一医疗保险文件的次数超过了50次，则将“药品支付依据”以及查找得到的包含“药品支付依据”这一信息查询语句的医疗保险文件的文件名称对应保存到文件标签数据表中。

可选地，还可以统计文件标签数据表中的各个文件标签在第二时间段内被用于确定第一医疗保险文件的第二统计次数，如果第一文件标签在第二时间段内被用于确定第一医疗保险文件的第二统计次数小于第二次数，则在文件标签数据表中删除第一文件标签以及第一文件标签与医疗保险文件的对应关系。第二时间段可以为1个月，2个月等时间长度；第二次数可以3次，5次等次数。通过在文件标签数据表中删除文件标签的方式，可以使文件标签数据表中的文件标签的数量维持在一个比较平衡的水平，一方面，可以起到节省存储空间的作用，另一方面，文件标签的减少可以提高遍历文件标签的速度，进而提高查找第一医疗保险文件的速度。

例如，第二时间段为3个月，第二次数为1次，文件标签数据表如表1所示，其中，文件标签1在3个月内被确定第一医疗保险文件的第二统计次数为0，则删除表2中文件标签2这一行的数据。

S204，将第一医疗保险文件发送给语音采集终端，以使语音采集终端显示第一医疗保险文件。

具体地，可以根据信息查询请求中的语音采集终端的终端标识，将第一医疗保险文件发送给语音采集终端。语音采集终端可以通过图标、列表等形式显示该第一医疗保险文件的名称，也可以将第一医疗保险文件打开后，显示该第一医疗保险文件的内容。

例如，第一医疗保险文件为慢特病管理政策文件，则语音采集终端显示的第一医疗保险文件可以如图3中的A或B所示。

本申请实施例中，通过对语音采集终端采集到的语音数据进行识别得到信息查询语句，将信息查询语句作为关键字在医疗保险文件存储系统中查找内容包含该关键字的医疗保险文件发送给语音采集终端，使得语音采集终端能够显示该医疗保险文件，实现了根据语音进行医疗保险文件的搜索以及显示的功能，用户只需要通过语音即可获取到想要查询的医疗保险信息，使得不会利用对医疗保险平台的进行搜索的用户也能获取医疗保险信息，提高了用户体验。

在一些可能的场景中，在利用文件标签数据表保存各个医疗保险文件的文件标签以及文件标签与医疗保险文件的对应关系的情况下，除了将用户要查询的医疗保险信息对应的医疗保险文件发送给语音采集终端进行显示外，还可以将与该医疗保险信息相关联的医疗保险信息对应的医疗保险文件发送给语音采集终端进行显示。参见图4，图4是本申请实施例提供的另一种确定药品报销信息异常的方法的流程示意图，如图所示，所述方法包括：

S301，接收语音采集终端发送的信息查询请求，信息查询请求包括语音采集终端采集的语音数据。

S302，对语音采集终端采集的语音数据进行语音识别得到信息查询语句。

S303，将信息查询语句作为关键字，在医疗保险文件存储系统中查找第一医疗保险文件，其中，第一医疗保险文件的内容中包含关键字，医疗保险文件存储系统用于存储医疗保险文件。

这里，步骤S301～S303的具体实现方式可参考上述步骤S201～S203的描述，此处不再赘述。

S304，根据文件标签数据表确定第一医疗保险文件的文件标签。

例如，文件标签数据表中的文件标签有文件标签1～文件标签8，医疗保险文件系统中存储的医疗保险文件为医疗保险文件10，文件标签数据表如3所示。

标签编号	文件标签	医疗保险文件名称
1	文件标签1	医疗保险文件1，医疗保险文件3，医疗保险文件8
2	文件标签2	医疗保险文件5，医疗保险文件8，医疗保险文件10
3	文件标签3	医疗保险文件3，医疗保险文件4，医疗保险文件5
4	文件标签4	医疗保险文件4，医疗保险文件8，医疗保险文件9
5	文件标签5	医疗保险文件1，医疗保险文件2，医疗保险文件5
6	文件标签6	医疗保险文件3，医疗保险文件6，医疗保险文件9
7	文件标签7	医疗保险文件2，医疗保险文件4，医疗保险文件7
8	文件标签8	医疗保险文件1，医疗保险文件5，医疗保险文件9

表3

假设第一医疗保险文件为医疗保险文件1，则根据表3可确定第一医疗保险文件的文件标签为文件标签1，文件标签5，文件标签8。

S305，根据文件标签与医疗保险文件的对应关系在医疗保险文件存储系统中查找第三医疗保险文件，第三医疗保险文件的文件标签中至少有一个文件标签与第一医疗保险文件的文件标签相同。

这里，可以根据第一医疗保险文件的文件标签确定第三医疗保险文件，将文件标签为第一医疗保险文件的文件标签的医疗保险文件确定为第三医疗保险文件。

例如，第一医疗保险文件为上述表3中的医疗保险文件1，医疗保险文件1的文件标签为文件标签1，文件标签5，文件标签8，则确定文件标签为文件标签1的医疗保险文件为医疗保险文件3，医疗保险文件8，文件标签为文件标签5的医疗保险文件为医疗保险文件2，医疗保险文件5，文件标签为文件标签8的医疗保险文件为医疗保险文件5，医疗保险文件9，进而确定医疗保险文件3，医疗保险文件8，医疗保险文件2，医疗保险文件5以及医疗保险文件9为第三医疗保险文件。

S306，将第一医疗保险文件和第三医疗保险文件发送给语音采集终端，以使语音采集终端在显示第一医疗保险文件的同时，关联显示第三医疗保险文件。

可选地，在第三医疗保险文件有多个的情况下，可以将多个第三医疗保险文件发送给语音采集终端；也可以在第三医疗保险文件中确定第四医疗保险文件，将第四医疗保险文件发送给语音采集终端，第四医疗保险文件为第三医疗保险文件中文件标签与第一医疗保险文件的文件标签相同的数量最多的第三医疗保险文件。

例如，在上述步骤S306确定的第三医疗保险文件中医疗保险文件3与医疗保险文件1的相同的文件标签为文件标签1，医疗保险文件8与医疗保险文件1的相同的文件标签为文件标签1，医疗保险文件2与医疗保险文件1的相同的文件标签为文件标签5，医疗保险文件5与医疗保险文件1的相同的文件标签为文件标签5和文件标签8，,医疗保险文件9与医疗保险文件1的相同的文件标签为文件标签8，则将医疗保险文件5确定为第四医疗保险文件。

这里，如果语音采集终端以图标、列表等形式显示第一医疗保险文件的名称，则语音采集终端可以在显示第一医疗保险文件的名称的同时，以图标或者列表的同时显示第三医疗保险文件的名称。如果语音采集终端将第一医疗保险文件打开后显示第一医疗保险文件的内容，则语音采集终端可以以悬浮球、弹框等形式将第三医疗保险文件的名称显示在未显示第一医疗保险文件的内容的区域上。

例如，第一医疗保险文件为慢特病管理政策文件，第三医疗保险文件为医疗保险药品限定支付依据文件，则语音采集终端显示的第一医疗保险文件的同时关联显示第三医疗保险文件可以如图5中的A或B所示。

本申请实施例中，通过根据对语音采集终端采集到的语音数据进行识别得到的信息查询语句在医疗保险文件存储系统中查找包含信息查询语句的第一医疗保险文件，并根据第一医疗保险文件的文件标签确定文件标签与第一医疗保险文件相同的第三医疗保险文件，将第一医疗保险文件和第三医疗保险文件发送给语音采集终端，使得语音采集终端能够显示第一医疗保险文件和第三医疗保险文件，实现了根据语音进行医疗保险文件的关联搜索以及显示，用户仅通过语音即可获取到想要查询的医疗保险信息和与其关联的医疗保险信息，提高了用户体验。

上面介绍了申请实施例的方法，下面介绍申请实施例的装置。

参见图6，图6是本申请实施例提供的一种基于语音识别的信息查询装置的组成结构示意图，该装置可以为图1所示的医疗保险信息查询服务器或该医疗保险信息查询服务器的一部分，该装置40包括：

请求接收模块401，用于接收语音采集终端发送的信息查询请求，所述信息查询请求包括所述语音采集终端采集的语音数据；

语音识别模块402，用于对所述语音数据进行语音识别得到信息查询语句；

文件查询模块403，用于将所述信息查询语句作为关键字，在医疗保险文件存储系统中查找第一医疗保险文件，所述第一医疗保险文件的内容中包含所述关键字，所述医疗保险文件存储系统用于存储医疗保险文件；

文件发送模块404，用于将所述第一医疗保险文件发送给所述语音采集终端，以使所述语音采集终端显示所述第一医疗保险文件。

在一种可能的设计中，所述文件查询模块403具体用于：

将所述信息查询语句作为关键字，遍历文件标签数据表，在所述文件标签数据表中查找目标文件标签，所述目标文件标签与所述关键字相同或包含所述关键字，所述文件标签数据表用于存储对所述医疗保险文件存储系统中的各个医疗保险文件进行标签提取得到的所述各个医疗保险文件的文件标签；

在查找到所述目标文件标签的情况下，根据文件标签与医疗保险文件的对应关系将与所述目标文件标签对应的医疗保险文件确定为第一医疗保险文件。

在一种可能的设计中，所述文件查询模块403还用于：

在未查找到所述目标文件标签的情况下，通过文件操作插件依次打开所述医疗保险文件存储系统中的医疗保险文件；

通过所述文件操作插件将所述关键字作为查询关键字在所述医疗保险文件中查找所述关键字；

将包含所述关键字的医疗保险文件确定为第一医疗保险文件。

在一种可能的设计中，所述文件查询模块403还用于：

将所述关键字作为所述第一医疗保险文件的文件标签，保存至文件标签数据表中。

在一种可能的设计中，所述装置40还包括：

文件标签确定模块405，用于根据所述文件标签数据表确定所述第一医疗保险文件的文件标签；

关联文件查找模块406，用于根据文件标签与医疗保险文件的对应关系在所述医疗保险文件存储系统中查找第三医疗保险文件，所述第三医疗保险文件的文件标签中至少有一个文件标签与所述第一医疗保险文件的文件标签相同；

所述文件发送模块404还用于将所述第三医疗保险文件发送给所述语音采集终端，以使所述语音采集终端在显示所述第一医疗保险文件的同时，关联显示所述第三医疗保险文件。

在一种可能的设计中，所述语音识别模块402具体用于：

通过基于统计模型的方法，或者，基于声道模型和语音知识的方法，或者，基于标准模板匹配的方法，或者，基于神经网络的方法对所述语音数据进行语音识别得到信息查询语句。

在一种可能的设计中，所述语音识别模块402具体用于：

对所述语音数据进行预处理，得到所语音数据对应的多个语音小段；

对所述多个语音小段中的各个语音小段进行声学特征提取，得到M行*N列的观测序列，其中，M为声学特征的维度，N为所述语音小段的数量；

将所述观测序列送入预先训练得到的基于隐马尔可夫模型的状态网络中，在所述状态网络中查找与所述观测序列的匹配度大于预设阈值的目标路径，将所述目标路径对应的文本内容确定为所述信息查询语句。

在一种可能的设计中，所述文件查询模块403，还用于：

统计在第一时间段内，所述信息查询语句被作为关键字在所述医疗保险文件存储系统中查找所述第一医疗保险文件的第一统计次数；

在所述第一统计次数大于预设的第一次数的情况下，将所述信息查询语句作为所述第一医疗保险文件的文件标签，并将所述信息查询语句，以及所述信息查询语句与所述第一医疗保险文件的对应关系保存在所述文件标签数据表中。

在一种可能的设计中，所述文件查询模块403，还用于：

统计在第二时间段内，所述文件标签数据表中的第一文件标签被用于作为关键字查找所述第一医疗保险文件的第二统计次数，所述第一文件标签为所述第一医疗保险文件对应的文件标签；

在所述第二统计次数小于预设的第二次数阈值的情况下，在所述文件标签数据表中删除所述第一文件标签，以及所述第一文件标签与所述第一医疗保险文件的对应关系。

需要说明的是，图6对应的实施例中未提及的内容可参见方法实施例的描述，这里不再赘述。

本申请实施例中，基于语音识别的信息查询装置通过对语音采集终端采集到的语音数据进行识别得到信息查询语句，将信息查询语句作为关键字在医疗保险文件存储系统中查找内容包含该关键字的医疗保险文件发送给语音采集终端，使得语音采集终端能够显示该医疗保险文件，实现了根据语音进行医疗保险文件的搜索以及显示的功能，用户只需要通过语音即可获取到想要查询的医疗保险信息，使得不会利用对医疗保险平台的进行搜索的用户也能获取医疗保险信息，提高了用户体验。

参见图7，图7是本申请实施例提供的另一种基于语音识别的信息查询装置的组成结构示意图，该装置50包括处理器501、存储器502以及通信接口503。处理器501连接到存储器502和通信接口503，例如处理器501可以通过总线连接到存储器502和通信接口503。

处理器501被配置为支持所述基于语音识别的信息查询装置执行图2-图5所述的基于语音识别的信息查询方法中相应的功能。该处理器501可以是中央处理器(central processing unit，CPU)，网络处理器(network processor，NP)，硬件芯片或者其任意组合。上述硬件芯片可以是专用集成电路(application specific integrated circuit，ASIC)，可编程逻辑器件(programmable logic device，PLD)或其组合。上述PLD可以是复杂可编程逻辑器件(complex programmable logic device，CPLD)，现场可编程逻辑门阵列(field-programmable gate array，FPGA)，通用阵列逻辑(generic array logic，GAL)或其任意组合。

存储器502存储器用于存储程序代码等。存储器502可以包括易失性存储器(volatile memory，VM)，例如随机存取存储器(random access memory，RAM)；存储器502也可以包括非易失性存储器(non-volatile memory，NVM)，例如只读存储器(read-only memory，ROM)，快闪存储器(flash memory)，硬盘(hard disk drive，HDD)或固态硬盘(solid-state drive，SSD)；存储器502还可以包括上述种类的存储器的组合。本申请实施例中，存储器502用于存储医疗保险文件、文件标签数据表等。

所述通信接口503用于发送或接收数据。

处理器501可以调用所述程序代码以执行以下操作：

通过通信接口503接收语音采集终端发送的信息查询请求，所述信息查询请求包括所述语音采集终端采集的语音数据；

对所述语音数据进行语音识别得到信息查询语句；

通过通信接口503将所述第一医疗保险文件发送给所述语音采集终端，以使所述语音采集终端显示所述第一医疗保险文件。

需要说明的是，各个操作的实现还可以对应参照图2-图5所示的方法实施例的相应描述；所述处理器501还可以与通信接口503配合执行上述方法实施例中的其他操作。

本申请实施例还提供一种计算机非易失性可读存储介质，所述计算机非易失性可读存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被计算机执行时使所述计算机执行如前述实施例所述的方法，所述计算机可以为上述提到的基于语音识别的信息查询装置的一部分。例如为上述的处理器501。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取非易失性可读存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的非易失性可读存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或随机存储记忆体(Random Access Memory，RAM)等。

以上所揭露的仅为本申请较佳实施例而已，当然不能以此来限定本申请之权利范围，因此依本申请权利要求所作的等同变化，仍属本申请所涵盖的范围。

Claims

一种基于语音识别的信息查询方法，其特征在于，包括：

接收语音采集终端发送的信息查询请求，所述信息查询请求包括所述语音采集终端采集的语音数据；

对所述语音数据进行语音识别得到信息查询语句；

将所述信息查询语句作为关键字，在医疗保险文件存储系统中查找第一医疗保险文件，所述第一医疗保险文件的内容中包含所述关键字，所述医疗保险文件存储系统用于存储医疗保险文件；

将所述第一医疗保险文件发送给所述语音采集终端，以使所述语音采集终端显示所述第一医疗保险文件。
根据权利要求1所述的方法，其特征在于，所述将所述信息查询语句作为关键字，在医疗保险文件存储系统中查找第一医疗保险文件，包括：

将所述信息查询语句作为关键字，遍历文件标签数据表，在所述文件标签数据表中查找目标文件标签，所述目标文件标签与所述关键字相同或包含所述关键字，所述文件标签数据表用于存储对所述医疗保险文件存储系统中的各个医疗保险文件进行标签提取得到的所述各个医疗保险文件的文件标签；

在查找到所述目标文件标签的情况下，根据文件标签与医疗保险文件的对应关系将与所述目标文件标签对应的医疗保险文件确定为第一医疗保险文件。
根据权利要求1或2所述的方法，其特征在于，所述方法还包括：

在未查找到所述目标文件标签的情况下，通过文件操作插件依次打开所述医疗保险文件存储系统中的医疗保险文件；

通过所述文件操作插件将所述关键字作为查询关键字在所述医疗保险文件中查找所述关键字；

将包含所述关键字的医疗保险文件确定为第一医疗保险文件。
根据权利要求3所述的方法，其特征在于，所述将包含所述关键字的医疗保险文件确定为第一医疗保险文件之后还包括：

将所述关键字作为所述第一医疗保险文件的文件标签，保存至所述文件标签数据表中。
根据权利要求2-4任一项所述的方法，其特征在于，所述将所述信息查询语句作为关键字，在医疗保险文件存储系统中查找第一医疗保险文件之后，还包括：

根据所述文件标签数据表确定所述第一医疗保险文件的文件标签；

根据文件标签与医疗保险文件的对应关系在所述医疗保险文件存储系统中查找第三医疗保险文件，所述第三医疗保险文件的文件标签中至少有一个文件标签与所述第一医疗保险文件的文件标签相同；

将所述第三医疗保险文件发送给所述语音采集终端，以使所述语音采集终端在显示所述第一医疗保险文件的同时，关联显示所述第三医疗保险文件。
根据权利要求1-5任一项所述的方法，其特征在于，所述对所述语音数据进行语音识别得到信息查询语句包括：

通过基于统计模型的方法，或者，基于声道模型和语音知识的方法，或者，基于标准模板匹配的方法，或者，基于神经网络的方法对所述语音数据进行语音识别得到信息查询语句。
根据权利要求6所述的方法，其特征在于，所述通过基于统计模型的方法对所述语音数据进行语音识别得到信息查询语句，包括：

对所述语音数据进行预处理，得到所述语音数据对应的多个语音小段；

对所述多个语音小段中的各个语音小段进行声学特征提取，得到M行*N列的观测序列，其中，M为声学特征的维度，N为所述语音小段的数量；

将所述观测序列送入预先训练得到的基于隐马尔可夫模型的状态网络中，在所述状态网络中查找与所述观测序列的匹配度大于预设阈值的目标路径，将所述目标路径对应的文本内容确定为所述信息查询语句。
根据权利要求1-7任一项所述的方法，其特征在于，所述方法还包括：

统计在第一时间段内，所述信息查询语句被作为关键字在所述医疗保险文件存储系统中查找所述第一医疗保险文件的第一统计次数；

在所述第一统计次数大于预设的第一次数的情况下，将所述信息查询语句作为所述第一医疗保险文件的文件标签，并将所述信息查询语句，以及所述信息查询语句与所述第一医疗保险文件的对应关系保存在所述文件标签数据表中。
根据权利要求1-8任一项所述的方法，其特征在于，所述方法还包括：

统计在第二时间段内，所述文件标签数据表中的第一文件标签被用于作为关键字查找所述第一医疗保险文件的第二统计次数，所述第一文件标签为所述第一医疗保险文件对应的文件标签；

在所述第二统计次数小于预设的第二次数阈值的情况下，在所述文件标签数据表中删除所述第一文件标签，以及所述第一文件标签与所述第一医疗保险文件的对应关系。
一种基于语音识别的信息查询装置，其特征在于，包括：

请求接收模块，用于接收语音采集终端发送的信息查询请求，所述信息查询请求包括所述语音采集终端采集的语音数据；

语音识别模块，用于对所述语音数据进行语音识别得到信息查询语句；

文件查询模块，用于将所述信息查询语句作为关键字，在医疗保险文件存储系统中查找第一医疗保险文件，所述第一医疗保险文件的内容中包含所述关键字，所述医疗保险文件存储系统用于存储医疗保险文件；

文件发送模块，用于将所述第一医疗保险文件发送给所述语音采集终端，以使所述语音采集终端显示所述第一医疗保险文件。
根据权利要求10所述的装置，其特征在于，所述文件查询模块，具体用于：

将所述信息查询语句作为关键字，遍历文件标签数据表，在所述文件标签数据表中查找目标文件标签，所述目标文件标签与所述关键字相同或包含所述关键字，所述文件标签数据表用于存储对所述医疗保险文件存储系统中的各个医疗保险文件进行标签提取得到的所述各个医疗保险文件的文件标签；

在查找到所述目标文件标签的情况下，根据文件标签与医疗保险文件的对应关系将与所述目标文件标签对应的医疗保险文件确定为第一医疗保险文件。
根据权利要求10或11所述的装置，其特征在于，所述文件查询模块，还用于：

在未查找到所述目标文件标签的情况下，通过文件操作插件依次打开所述医疗保险文件存储系统中的医疗保险文件；

通过所述文件操作插件将所述关键字作为查询关键字在所述医疗保险文件中查找所述关键字；

将包含所述关键字的医疗保险文件确定为第一医疗保险文件。
根据权利要求12所述的装置，其特征在于，所述文件查询模块，还用于：

将所述关键字作为所述第一医疗保险文件的文件标签，保存至所述文件标签数据表中。
根据权利要求10-13任一项所述的装置，其特征在于，所述装置还包括：

文件标签确定模块，用于根据所述文件标签数据表确定所述第一医疗保险文件的文件标签；

关联文件查找模块，用于根据文件标签与医疗保险文件的对应关系在所述医疗保险文件存储系统中查找第三医疗保险文件，所述第三医疗保险文件的文件标签中至少有一个文件标签与所述第一医疗保险文件的文件标签相同；

所述文件发送模块，还用于将所述第三医疗保险文件发送给所述语音采集终端，以使所述语音采集终端在显示所述第一医疗保险文件的同时，关联显示所述第三医疗保险文件。
根据权利要求10-14任一项所述的装置，其特征在于，所述语音识别模块具体用于：

通过基于统计模型的方法，或者，基于声道模型和语音知识的方法，或者，基于标准模板匹配的方法，或者，基于神经网络的方法对所述语音数据进行语音识别得到信息查询语句。
根据权利要求15所述的装置，其特征在于，所述语音识别模块，具体用于：

对所述语音数据进行预处理，得到所述语音数据对应的多个语音小段；

对所述多个语音小段中的各个语音小段进行声学特征提取，得到M行*N列的观测序列，其中，M为声学特征的维度，N为所述语音小段的数量；

将所述观测序列送入预先训练得到的基于隐马尔可夫模型的状态网络中，在所述状态网络中查找与所述观测序列的匹配度大于预设阈值的目标路径，将所述目标路径对应的文本内容确定为所述信息查询语句。
根据权利要求10-16任一项所述的装置，其特征在于，所述文件查询模块，还用于：

统计在第一时间段内，所述信息查询语句被作为关键字在所述医疗保险文件存储系统中查找所述第一医疗保险文件的第一统计次数；

在所述第一统计次数大于预设的第一次数的情况下，将所述信息查询语句作为所述第一医疗保险文件的文件标签，并将所述信息查询语句，以及所述信息查询语句与所述第一医疗保险文件的对应关系保存在所述文件标签数据表中。
根据权利要求10-17任一项所述的装置，其特征在于，所述文件查询模块，还用于：

统计在第二时间段内，所述文件标签数据表中的第一文件标签被用于作为关键字查找所述第一医疗保险文件的第二统计次数，所述第一文件标签为所述第一医疗保险文件对应的文件标签；

在所述第二统计次数小于预设的第二次数阈值的情况下，在所述文件标签数据表中删除所述第一文件标签，以及所述第一文件标签与所述第一医疗保险文件的对应关系。
一种基于语音识别的信息查询装置，包括处理器、存储器以及通信接口，所述处理器、存储器和通信接口相互连接，其中，所述通信接口用于传输数据，所述存储器用于存储程序代码，所述处理器用于调用所述程序代码，执行如权利要求1-9任一项所述的方法。
一种计算机非易失性可读存储介质，其特征在于，所述计算机非易失性可读存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被处理器执行时使所述处理器执行如权利要求1-9任一项所述的方法。