WO2013178002A1

WO2013178002A1 - 一种语音识别匹配的方法和设备，以及计算机程序和存储介质

Info

Publication number: WO2013178002A1
Application number: PCT/CN2013/074933
Authority: WO
Inventors: 翁玮文; 黄晓庆; 刘琨; 焦伟
Original assignee: 中国移动通信集团公司
Priority date: 2012-05-29
Filing date: 2013-04-28
Publication date: 2013-12-05
Also published as: CN103456297B; CN103456297A

Abstract

一种语音识别匹配的方法和设备，以及计算机程序和存储介质，其主要内容包括：在确定语音信息转化得到的拼音形式的字符信息（101）后，根据模糊匹配策略，从本地数据库中以拼音和汉字形式存储的字符信息中，对转化得到的字符信息根据拼音进行模糊匹配（102），将现有技术中采用单一的完全匹配策略扩展至对转化得到的拼音形式的字符信息根据拼音进行模糊匹配，有效地增加了对转化得到的字符信息的语音识别率，进而提高了语音识别技术的效率。

Description

一种语音识别匹配的方法和设备，以及计算机程序和存储介质

技术领域本发明涉及计算机科学中人工智能技术领域,尤其涉及一种语音识别匹配的方法和设备，以及计算机程序和存储介质。

背景技术

语音不仅是人类之间信息交流最自然、最有效、最方便的工具，而且也成为人与机器之间进行通信的重要工具。

随着科学技术的不断发展, 人工智能作为计算机科学的分支，致力于研发一种新的能以人类智能相似的方式做出反应的智能机器，该领域的研究包括机器人、语言识別、图像识别、自然语言处理和专家系统等，其中, 语音识別作为一个分支，以语音为研究对象，其目标是将人类的语音中的词汇内容转换为计算机可执行的输入符号进实现语音识别。

以移动终端根据用户的语音指令，查找移动终端中存储的联系人电话号码信息为例，说明现有技术中语音识別技术的应用。

第一步：接收用户发出的包舍联系人姓名的语音指令，并根据语音指令转化后的语音信号确定该语音指令对应的拼音信息。

第二步：根据拼音信息的完全匹配算法，从存储的联系人电话号码中确定该拼音信息对应的联系人姓名。

所述完全匹配算法是指将接收到的拼音信息与本地存储的拼音信息进行比较，确定接收到的拼音信息与本地存储的拼音信息是否完全一致。

具体地，利用拼音信息的完全匹配算法，将接收到的拼音信息与本地存储的拼音信息进^"比较，当比较结果为接收到的拼音信息与本地存储的拼音信息完全一致时，根据本地建立的拼音信息与联系人姓名之间的对应关系，将确定与接收到的拼音信息完全一致的本地存储的拼音信息对应的联系人姓名。

第三步：根据本地存储的联系人姓名和电话号码之间的对应关系，得到接收到的语音指令对应的联系人的电话号码信息。

由于中文自身的特殊性以及不同的地方方言的多样性，不同地方的用户针对同一中文词汇发出的语音指令也存在差异 , 在语音识别服务器将语音指令转化为拼音信息过.程中，并不能考虑到发出该语音指令的用户的口音特性，简单的侬据本地存储的大词汇表进行语音到拼音的转化，使得转化后的拼音相对于接收到的语音指令存在误差，而后再简单的根据拼音信息之间的对应关系确定联系人姓名 , 将使得语音识别率大大降低。

由此可见，在现有技术中, 语音识.别技术中存在语音识別率较低的问题。发明内容

本发明实施例提供了一种语音识別匹配的方法和设备，以及计算机程序和存储介质, 用于解决前语音识别技术中存在的语音识别率较低的问题。

一种语音识别匹配的方法，所述方法包括：

确定语音信息转化得到的拼音形式的字符信息；

根据模糊拼音匹配策略, 从本地数据库中以拼音和汉字形式存储的字符信息中，为转化得到的字符信息根据拼音进行模糊匹配，得到本地数据库中与转化后的字符信息匹配的汉字形式的字符信息。

—种语音识别匹配设备，所述设备包括：

确定模块，用于确定语音信息转化得到的拼音形式的字符信息；模糊匹配.模块，用于根据模糊拼音匹配策略，从本地数据库中以拼音和汉字形式存储的字符信息中，为转化得到的字符信息根据拼音进行模糊匹配 , 得到本地数据库中与转化后的字符信息匹配的汉字形式的字符信息。

本发明有益效莱如下：

本发明实施例在确定语音信息转化得到的拼音形式的字符信息后，根据模糊匹配策略, 从本地数据库中以拼音和汉字形式存储的字符信息中，对转化得到的字符信息根据拼音进行模糊匹配，得到本地数据库中与转化后的字符信息匹配的汉字形式的字符信息，将现有技术中采用单一的完全匹配策略扩展至对转化得到的拼音形式的字符信息根据拼音进行模糊匹配，有效地增加了对转化得到的字符信息的语音识别率 ,进而提高了语音识别技术的效率。附图说明

图 1为本发明实施例一的一种语音识别匹配的方法的流程图；

图 2为模糊完全匹配策略的流程图；

图 3为部分模糊匹配策略的流程示意图；

图 4为本发明实施例二的一种语音识別匹配的方法的流程图；

图 5为本发明实施例三的一种语音识别匹配设备的结构示意图。

为了实现本发明的目的,本发明实施例提供了一种语音识别匹配的方法和设备，以及计算机程序和存储介质，确定语音信息转化得到的拼音形式的字符信息，并根据模糊拼音匹配策略，从本地数据戽中以拼音和汉字形式存储的字符信息中，为转化得到的字符信息根据拼音进行模糊匹配，得到本地数据库中与转化后的字符信息匹配的汉字形式的字符信息。

与现有技术相比，在确定语音信息转化得到的拼音形式的字符信息后，根据模糊匹配策略,从本地数据库中存储的以拼音和汉字形式的字符信息中，对转化得到的字符信息根椐拼音进行模糊匹配，将现有技术中采用单一的完全匹配策略扩展至对转化得到的拼音形式的字符信息根据拼音进行模糊匹配, 有效地增加了对转化得到的字符信息的语音识别率 , 进而提高了语音识別技术的效率。

下面结合说明书附图对本发明各实施例进行详细描述。

实.施例一：

如图 1所示，为本发明实施例―的一种语音识别匹配的方法的流程图。该方法包括：步骤 101 : 确定语音信息转化得到的拼音形式的字符信息。

在步骤 101 中，用户向可识别语音信息的终端发出语音信息 , 终端在接收到该语音信息时，可以自身对该语音倌息进行解析，确定该语音信息转化得到的拼音形式的字符信息；还可以将接收到的语音信息上传至语音识别服务器, 由语音识别服务器对接收到的该语音信息进行解析，并将确定的语音信息转化得到的拼音形式的字符信息发送给终端

所述语音信息中包含了联系人信息和 /或当前待执行操作信息，例如：一条语音信息为: 给张三打电话, 其中, 张三属于联系人信息； "打电话"属于当前待 L.行操作信息。再例如一条语音信息为：去中关村广场，其中，中关村属于类似联系人信息； "去" 属于当前执行：作信息。

需要说明的是，所述语音信息可以是语音指令形式的信息, 这里不做具体限定。

具体地，终端和 /或语音识別服务器对接收到的语音信息进行解析、初步识別该语音信息，将其中表示联系人信息的语音信息转化为拼音形式的字符信息。

由于用户之间发音存在差别，以及汉语中一些文字在不同地区发音存在差异，因此，语音识别服务器对接收到的语音信息进行解析时，只能根据预先设定的声音模型对接收到的语音信息进行解析，存在将语音信息转化得到的拼音形式的字符信息与用户发出的语音信息不完全一致的情况，可能还存在采集的语音信息是不完整的，因此，在这里将由语音信息转化得到的拼音形式的字符信息看作是.椟糊的字符信息，即不确定的字符信息。

步驟 102: 根据模糊拼音匹配策略，从本地数据库中以拼音和汉字形式存储的字符信息中，为转化得到的字符信息根据拼音进行模糊匹配，得到本地数据库中与转化后的字符信息匹配的汉字形式的字符信息。

在步骤 102中，根据模糊拼音匹配策略，从本地数据库中以拼音和汉字形式存储的字符信息中，为转化得到的字符信息根据拼音进行模糊匹配的方式有两种: 一种方式是模糊完全匹配; 另一种方式是部分模糊匹配。

笫一种方式: 模糊完全匹配，如图所示，为模糊完全匹配策略的流程图，具体包括：

步骤 U : 根据确定的字符信息的字段数量，从本地数据库中查找出相同字段数量的拼音形式的字符信息。

所述字段是指拼音形式的字符信息中能唯一确定一个汉字形式的字符信息，例如： ong"确定一个汉字 "东"或者发相同音的其他汉字，此时， "dong" 被看作是措音形式的字符信息中的一个字段。

所述字段数量是指确定的字符信息中包含字的个数，例如： "dong xi mm bei" 是确定的字符信息，其中， "dong" 确定一个汉字; "xi" 确定一个汉字;

"纖" 确定一个汉字； "bei" 确定一个汉字；因此，该确定的字符信息中的字段数量为 4,

具体地，根据确定的字符信息的字段数量，从本地数据库中查找具有相同字段数量的拼音形式的字符信息。例如，查找具有 4个字段数量的拼音形式的字符信息。

步骤 12: 将确定的字符信息分别与查找出的字符信息进行相似度运算 , 从查找出的字符信息中，确定相似度满足第一阈值条件的字符信息。

其中，将确定的字符信息分別与查找出的字符倌息进行相似度运算的具体方式为：

第一步：将确定的字符信息中的每个字段与一个查找出的字符信息中的相应字段进行以下操作，直至荻得确定的字符信息中每个字段与查找出的字符信息中的相应字段的相似度:

首先：判断确定的字符信息中的一个字段是否与查找出的字符信息中的相应字段是否在预设的拼音对列表中。

所述预设的拼音对列表是指：中文拼音依据声韵母区分准则差别较大但发音特性相近或依据声韵母区分准则差别较小但发音差别很大的例外情况。例如：声母 1、 r通常认为比较相近，但是当它们带上韵母 i时， ri和 li的发音差别就很大，因此 {ri， li}属于一组拼音对，存储在拼音对列表中 , 其相似度较小，对应一个相似度值; 另外, hui和 fei其无论声母还是.韵母都不相同，但发音却很相近，因此 {hui, fei}也属于一组拼音对，存储在拼音对列表中，其相似 /复较大，对应一个相似度值。

其次：若判断结杲为是，则根据拼音对列表中为预设的拼音对设定的相似度，将该设定的相似度作为该字段与查找出的字符信息中的相应字段之间的相似度；

若判断结果为否，则分离该字段的声母和韵母，分别确定该字段与查找出的字符信息中的字段的声母相^度和韵母相 ^度，并得到该字段与查找出的字符信息中的相应字段之间的相似度。

其中，所述相应字段是指确定的字符信息中的一个字段在确定的字符信息中的位置与一个查找出的字符信息中的一个字段在查找出的字符信息中的位置. 对应， '例如： ^!bdongxi" 和 "torigsbi" , 其中, "dong" 和 Ixmg" 是字符信息中互为相应的字段， "dong"和 "shi" 不是字符信息中互为相应的字段。

所述为预设的拼音对列表设定的相 ^度是指根据实践中无法依椐声母韵母区分准则只能依椐读音确定某两个发音接近或相远的拼音之间的相似度，通过量化的数据表示，以表格的形式存储在本地，也可以通过概率的方式确定相似度，即确定某两个发音接近的拼音出错的概率。

例如：确定的字符信息中的一个字段为 "bill" , 查找出的字符信息中的相应字段为 "fei" ,根椐本地存储的拼音对列表中为预设的拼音对设定的相似度表，查找并确定 "hui" 与 "fei" 之间的相似度。

较优地，在分离该字段的声母和韵母之前，对确定的字符信息进行预处理，将其中包含的无法识別的拼音转化成可识別的拼音。例如：电脑拼音中经常用 u和 V指代汉语拼音中的 ii, 如 lv (吕）， yuan (元） , 为了处理方便, 统一将 ii对应成 v, 特殊地，在声母分別为 j q, x和 y时，韵母中包含 ϋ时，将 u转换.为 V、

分别分离确定的字符信息中每一个字段的声母和韵母与查找的字符信息中相应字段的声母和韵母，并根据本地存储的声母相似度表和韵母'相似度表，分别确定该字段与查找出的字符信息中的字段的声母相似度和韵母相似度，并将确定的声母相似度和韵母相似度进.行综合评估，得到该字段与查找出的字符信息中的相应字段之间的相似度。

所述综合评估的方式为可以进行加权求和得到综合相似度，也可以根据确定的声母相似度与韵母相似度之间的大小关系，确定综合评估结果：当确定的声母相似度与韵母相似度都属于相似度较高或至少有一项相似度较高时，則将声母相似度与韵母相似度进行加法运算得到综合评估结果；当确定的声母相似度与韵母相似度都较低时，則将声母相似度与韵母相似度进行加法运算同时加上一个加权因子得到综合评估结果。

假如相似度的馭值范围是 0〜1时，大于 0.6的为相似度较高，小于 0.4为相似度较低，

第二步：在荻得确定的字符信息中每个字段与查找出的字符信息中的相应字段的相似度后，根据各字段间的相度，确定字符信息间的相似度。

具体地，在获得确定的字符信息中每个字段与一个查找出的字符信息中的相应字符的相似度后 ,将得到的各字段间的相似度进行相似度的综合计算，得到确定的字符信息与一个查找出的字符信息之间的相似度。

第三步：从查找出的字符信息中，确定相似度满足第一阈值条件的字符信息。

具体地，所述第一阈值条件是指相似度达到设定的阈值。其中，设定的阈值可裉椐实践采集的数据确定，也可以根据语音模型的概率值确定，具体不做限定。

裉据上述步驟得到的确定的字符信息与至少一个查找出的字符信息之间的相似度与第一阈值条件进行比较，当得到的相似度满足第一阈值条件时，确定相似度满足第―阈值条件的查找出的字符信息; 当得到的相似度都不满足第一阈值条件时，可以继续第二种部分模糊匹配或者返回查找失败结杲。

步骤 13 : 将所述相^度满足第一阈值条件的字符信息转换为汉字形式，并将该汉字形式的字符信息作为所述匹配的汉字形式的字符信息。

第二种方式：部分模糊匹配，如图 3所示，为部分模糊匹配策略的流程示意图，具体包括：

步骤 21 : 根据确定的字符信息中的字段数量，从本地数据库中查找出不等于（大于或小于）所述字段数量的拼音形式的字符信息，当查找出的字符信息的字段数量大于确定的字符信息的字段数量时，执行步骤 22; 当查找出的字符信息的字段数量小于确定的字符信息的字段数量时，执行步驟 24。

在本步中，若查找的字符信息的字段数量大于确定的字符信息中的字段数量，即假设确定的字符信息中的字段数量为 4，那么从本地数据库中查找字段数量大于 4或者小于 4的拼音形式的字符信息。

步骤 22: 当查找出的字符信息的字段数量大于确定的字符信息的字段数量时，分别对查找出的字符信息进行拆分，其中，同一字符信息拆分后的每个分词内容不相同，且分词中的字段数量与确定的字符信息中的字段数量相同。

具体地，针对查找出的每一个大于所述字段数量的拼音形式的字符信息， U亍以下操作：

首先，将每一个查找出的字符信息进行拆分，其中，拆分的原则是同一字符信息拆分后的每个分词内容不相同，且分词中的字段数量与确定的字符信息中的字段数量相同。

例如：确定的字符信息为 "yong tao" , 查找出的一个字符信息为 "zhang yong tao "，将对查找出该字符信息进行拆分，拆分结果为： " zhangycmg "、 "zhangtao" 和 "yongtao" 三个分词'，其次，针对查找出的字符信息拆分后的分词，确定查找出的字符信息拆分后的每一个分词与确定的字符信息之间的相似度。

仍以确定的字符信息为 "yong tao" ,查找出的一个字符信息为 "zliang yong tao" , 4夺对查找出该字符信息进行拆分,拆分结果为: "zhaiigyong"、 "zhangtao" 和 "yongtao" 三个分词为倒，此时，

4 "zhaiigyong" 与 "yong tao" 进 ί亍相乂/¾¾算, 确定 "zhangyong" 的相似度 A1；

将 "zhangtao" 与 "yong tao" 进行相似度运算，确定 "zhangtao" 的相似度 A2;

将 "yongtao" 与 "yong tao" 进行相似度运算，确定 "yongtao" 的相 4¾ 度 A3。

由于拆分后得到的每一个分词只是查找到的字符信息的一部分，因此，将拆分后的每一个分词与确定的字符信息进行相似度运算, 得到拆分后每一个分词的相似度，从中选出相似度最高的一个分词的相似度作为查找出的字符信息与硝定的字符信息的相^度。

为了提高识别的精度，还可以依据查找出的字符信息的字段数量与确定的字符信息的字段数量之间差的数值大小选定一个加权系数，则查找出的字符信息与确定的字符信息的相似度通过拆分后每一个分词的相似度的进行加权运算得到。

所述加权系数确定的规则为：若查找出的字符信息的字段数量与确定的字符信息的字段数量之间差的数值越小，加权系数越小，若查找出的字符信息的字段数量与确定的字符信息的字段数量之间差的数值越大，则加权系数越大。

H i "zhangyong" , "zhangtao" 和 "yongtao" —三个分词与确定的字符信' 息的相似度为 AL A2和 A3 , 则 "zhangyongtao" 与确定的字符信息的最终相似度为 min{Al , A2, A3 加权系数。步骤 2,3 : 若查找出的字符信息拆分后的分词与确定的字符信息之间的相似度满足第二阈值条件，則将该查找出的字符信息转换为汉字形式，并将该汉字形式的字符信息作为所述匹配的汉字形式的字符信息。

具体地, 根椐确定查找出的字符信息拆分后的每一个分词与确定的字符信息之间的相似度，得到该查找出的字符信息与确定的字符信息的相似度，将得到的相似度与第二阈值条件进行比较，当得到的相似度满足第二阈值条件时，确定相似度满足第二阈值条件的查找出的字符信息，并将该查找出的字符信息转换为汉字形式，将该汉字形式的字符信息作为所述匹配的汉字形式的字符信息；当得到的相似度都不满足第二阈值条件时，返回查找失败结果，指示重新输入语音信息。

需要说明的是，所述第二阈值条件是指相似度达到设定的阈值。其中，设定的阐值可根据实践采集的数据确定 ,也可以根据语音模型的概率值确定，具体不傲限定。第一阈值条件与第二阈值条件中的 "第一'，和 "第二" 没有什么特别意义，只表示这是两个不同的阈值。

较优地，根据确定查找出的字符信息拆分后的每一个分词与确定的字符信息之间的相似度，判断查找出的字符信息拆分后的每一个分词与确定的字符信息之间的相似度是否都大于设定的门限值，若是，则确定大于设定的门限值的查找出的字符信息，并将该查找出的字符信息转换为汉字形式，将该汉字形式的字符信息作为所述匹配的汉字形式的字符信息; 否则，返回查找失败结果，指示重新输入语音信息。

所述设定的门限值是指相似度达到设定的数值。其中，设定的门限值可根据实践采集的数据确定，也可以根据语音模型的概率值确定，具体不做限定。

假设根椐确定查找出的字符信息拆分后的每一个分词与确定的字符信息之间的相似度，得到该查找出的字符信息与确定的字符信息的相似度，其中，存在两个查找出的字符信息与确定的字符信息的相似度相同, 此时，将查找出的字符信息中拆分得到的分词个数较少的字符信息优先进行比较。

步骤 24:当查找出的字符信息字段数量小于确定的字符信息字段数量时 , 则对确定的字符信息进行拆分，其中，同一字符信息拆分后的每个分词内容不相同，且分词中的字段数量与查找出的字符信息中的字段数量相同。

本步骤 24的具体实施方式与步骤 22的相同, 这里不再做具体描述。步骤 25: 若确定的字符信息拆分后的分词与查找出的字符信息之间的相似度满足第二阈值条件，則将该查找出的字符信息转换为汉字形式，并将该汉字形式的字符信息作为所述匹配的汉字形式的字符信息。

本步骤 25的具体实施方式与步骤 23的相同，这里不再做具体描述。需要说明的是，模糊完全匹配方式和部分模糊匹配方式可以是递进的关系，在通过.模糊完全匹配方式没有确定出相匹配的字符信息时，继续通过部分模糊匹配方式进.行字符信息匹配操作；模糊完全匹配方式和部分模糊匹配方式还可以是并列的关系，在为某语音信息转化得到的拼音形式的字符信息确定相应的汉字形式的字符信息时，选择其中一种方式进行匹配燥作。

通过实施例一的方案，在确定语音信息转化得到的拼音形式的字符信息后，采用了模糊完全匹配和 /或部分模糊匹配的方式，从本地数据库中查找与其匹配的汉字形式的字符信息；在利用模糊完全匹配方式进行模糊匹配时，不仅考虑到声母和韵母的相似度, 还考虑到中文语音中一些特殊字母在曰常生活中存在的发音的相似性，通过这样的模糊完全匹配方式进行语音识别，提高了语音识别的识别率，并且增强了由拼音形式的字符信息确定汉字形式的字符信息的准确性„

实施例二：

如图 4所示，为本发明实施例二的一种语音识別匹配的方法的流程图。本实施例二是实施例一中各步骤的详细描述，该方法具体包括:

步骤 201 : 确定语音信息转化得到的拼音形式的字符信息。

步驟 202: 判断是否能够对确定的字符信息进,行完全匹配搡作，若是，则返回硝定的字符信息对应的汉字形式的字符信息；否则，执行步驟 203。在本步骤 202中，将本地数据库中包含的所有的以拼音和汉字形式的字符信息，与转化得到的字符信息进行比较，确定本地数据库中是否存在字符信息与转化得到的字符信息一一对应，当存在完全匹配的字符信息时，将满足——对应关系的本地数据库中的拼音形式的字符信息对应的汉字形式的字符信息作为确定的字符信息对应的汉字形式的字符信息，返回给用户进行查看。

步骤 203: 判断是否能够对确定的字符信息进行部分完全匹配操作，若是，则返回确定的字符信息对应的汉字形式的字符信息，若否，执行步骤 204。

其中，所述部分完全匹配操.作包括：

根据确定的字符信息的字段数量，从本地数据库中查找出与所述字段数量不同的拼音形式的字符信息；

若查找出的字符信息字段数量大于确定的字符信息字段数量，对查找出的字符信息进行拆分，其中，同一字符信息拆分后的每个分词内容不相同，且分词中的字段数量与确定的字符信息中的字段数量相同，并确定查找出的字符信息拆分后的分词与确定的字符信息之间的相似度；

若查找出的字符信息字段数量小于确定的字符信息字段数量，则对确定的字符信息进行拆分，其中，同一字符信息拆分后的每个分词内容不相同，且分词中的字.段数量与查找出的字符信息中的字段数量相同 , 并确定查找出的字符信息与确定的字符信息拆分后的分词之间的相似度。

根据确定查找出的字符信息拆分后的每一个分词与确定的字符信息之间的相^度或者查找出的字符信息与确定的字符信息拆分后的分词之间的相似度，得到该查找出的字符信息与确定的字符信息的相似度, 将得到的相似度与第三阈值条件进行比较，当得到的相^度满足第三阈值条件时，确定相似度满足第三阈值条件的查找出的字符信息，并将该查找出的字符信息转换为汉字形式，将该汉字形式的字符信息作为所述匹配的汉字形式的字符信息；当得到的相似度都不满足第三阈值条件时，执行步驟 204。

需要说明的是，所述第三阈值条件是指相^度达到设定的阈值。其中，设定的阈值可根据实践采集的数据确定，也可以根据语音模型的概率值确定，具体不做限定。第一阈值条件，第二阈值条件和第二阈值条件中的 "第 ·一 "， "第二" 和 "第三" 没有什么特別意义，只表示这是三个不同的阈值。

步骤 204: 判断是否能够对确定的字符信息进行模糊完全匹配搡作，若是，則返回确定的字符信息对应的汉字形式的字符信息，若否，执行步骤 205。

其中，模糊完全匹配操作的具体实现方式见实施例一图 2对应的文字部分，这里不再做具体描述。

需要说明的是，在本实施方案中, 除了上述实施顺序外，步骤 203与步骤 204还可以是同时执行的 , 若步骤 203和 204同时执行，则返回满足第二阔值条件字符信息对应的汉字形式的字符信息和满足第三阈值条件的字符信息对应的汉字形式的字符信息。

步骤 205: 判断是否能够对确定的字符信息进—行部分模糊匹配操作，若是，则逸回确定的字符信息对应的汉字形式的字符信息 , 若否，返回匹配失败消息，指示重新发送语音信息。

其中，部分模糊匹配操作的具体实现方式见实施例一图 3对应的文字部分，这里不再做具体描述。

实施例三：

如图 5所示，为本发明实施例三的一种语音识別匹配设,备的结构示意图。所述语音识別匹配设备包括：确定模块 31和模糊匹配模块 32，其中：

确定模块 31 , 用于确定语音信息转化得到的拼音形式的字符信息；模糊匹配模块 32, 用于根据模糊拼音匹配策略，从本地数据库中以拼音和汉字形式存储的字符信息中，为转化得到的字符信息根据拼音进行模糊匹配，得到本地数据库中与转化后的字符信息匹配的汉字形式的字符信息。

所述模糊匹配模块 32，具体包括：第一字符信息查找单元 41 , 相似度计算单元 42和第一匹配结果确定单元 43，其中:

第一字符信息查找单元 41 , 用于根据确定的字符信息中的字段数量，从本地数据库中查找出相同字段数量的拼音形式的字符信息；

相似度计算单元 42，用于将确定的字符信息分别与查找出的字符信息进行相似度运算, 从查找出的字符信息中, 确定相似度满足第一阈值条件的字符信息；

第一匹配结果确定单元 43，用于将所述相似度满足第一阈值条件的字符信息转换为汉字形式，并将该汉字形式的字符信息作为所述匹配的汉字形式的字符信息。

所述相似度计算单元 42，具体用于将确定的字符信息中的每个字段与一个查找出的字符信息中的字段进行以下操作 _? 直至荻得确定的字符信息中每个字段与查找出的字符信息中的字段的相似度：

判断确定的字符信息中的一个字段与查找出的字符信息中的相应字段是否在预设的拼音对列表中；

若是，则根据拼音对列表为预设的拼音对设定的相似度，将该设定的相似度作为该字段与查找出的字符信息中的相应字段之间的相 · 度；

若否，则分离该字段的声母和韵母，分别确定该字段与查找出的字符信息中的字段的声母相似度和韵母相似度，并得到该字段与查找出的字符信息中的相应字段之间的相^度；

在获得确定的字符信息中每个字段与查找出的字符信息中的字段的相似度后，根据各字段间的相似度，确定字符信息间的相似度。

所述模糊匹配模块 32，还包括：第二字符信息查找单元 44、拆分单元 45和第二匹配结果确定单元 46，其中：

第二字符信息查找单元 44, 用于根据确定的字符信息中的字段数量，从本地数据库中查找出与所述字段数量不同的拼音形式的字符信息；

拆分单元 45 , 用于当查找出的字符信息字段数量大于确定的字符信息字段数量时，则对查找出的字符信息进行拆分，其中，同一字符信息拆分后的每个分词内容不相同，且分词中的字段数量与确定的字符信息中的字段数量相同，以及当查找出的字符信息字段数量小于确定的字符信息字段数量，則对确定的字符信息进行拆分，其中，同一字符信息拆分后的每个分词内容不相同，且分词中的字段数量与查找出的字符信息中的字段数量相同；

第二匹配结杲确定单元 46，用于当查找出的字符信息字段数量大于确定的字符信息字段数量时，若查找出的字符信息拆分后的分词与确定的字符信息之间的相似度满足第二阈值条件，则将该查找出的字符信息转换为汉字形式，并将该汉字形式的字符信息作为所述匹配的汉字形式的字符信息，以及当查找出的字符信息字段数量小于确定的字符信息字段数量时，若确定的字符信息拆分后的分词与查找中的字符信息之间的相似度满足第二阈值条件，则将该查找出的字符信息转换为汉字形式，并将该汉字形式的字符信息作为所述匹配的汉字形式的字符信息。

所述设备还包括：第一判断模块 33和第二判断模块 34, 其中：第一判断模块 33，用于在为转化得到的字符信息进行模糊匹配之前，判断是否能够对确定的字符信息进行完全匹配操作；

第二判断模块 34 , 周于在第一判断模块的判断结果为否时，进一步判断是否能够对确定的字符信息进行部分完全匹配操作，若否，則触发模糊匹配模块 12。

较优地，第二判断模块 34 , 用于在第一判断模块的判断结果为否时，触发模糊匹配模块 32 , 同时，执行对确定的字符信息进行部分完全匹配操作。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，則本发明也意图包含这些改动和变型在内。

Claims

1、一种语音识別匹配的方法，其特征在于，所述方法包括:

确定语音信息转化得到的拼音形式的字符信息；

根据模糊拼音匹配策略，从本地数据库中以拼音和汉字形式存储的字符信息中，为转化得到的字符信息根据拼音进.行模匹配，得到本地数据库中与转化后的字符信息匹配的汉字形式的字符信息。

2、如权利要求 1所述的语音识别匹配的方法，其特征在于，为转化得到的字符信息进行模糊匹配，具体包括：

根据确定的字符信息的字段数量，从本地数据库中查找出相同字段数量将确定的字符信息分别与查找出的字符信息进行相似度运算，从查找出的字符信息中，确定相似度满足第一阈值条件的字符信息；

将所述相似度满足第一阈值条件的字符信息转换为汉字形式，并将该汉字形式的字符信息作为所述匹配的汉字形式的字符信息。

3、如权利要求 2所述的语音识别匹配的方法，其特征在于，将确定的拼音形式的字符信息分别与查找出的字符信息进行相似度运算，具体包括：将确定的字符信息中的每个字段与一个查找出的字符信息中的相应字段进行以下搡作 , 直至获得确定的字符信息中每个字段与查找出的字符信息中的相应字段的相似度：

若是，则根据拼音对列表中为预设的拼音对设定的相似度，将该设定的相似度.作为该字段与査找出的字符信息中的相应字段之间的相似度；

若否，则分离该字段的声母和韵母，分别确定兹字段与查找出的字符信息中的字段的声母相似度和韵母相似度，并得到该字段与查找出的字符信息中的相应字段之间的相^度；

在获得确定的字符信息中每个字段与查找出的字符信息中的相应字段的相似度后, 根据各字段间的相似度, 确定字符信息间的相似度。

4、如权利要求 i或 2所述的语音识别匹配的方法，其特征在于，为转化得到的字符信息进行模糊匹配，具体还包括：

裉据确定的字符信息的字段数量，从本地数据戽中查找出与所述字段数量不同的措音形式的字符信息；

当查找出的字符信息的字段数量大于确定的字符信息的字段数量时，则对查找出的字符信息进行拆分，其中，同一字符信息拆分后的每个分词内容不相同, 且分词中的字段数量与确定的字符信息中的字段数量相同，若查找出的字符信息拆分后的分词与确定的字符信息之间的相似度满足第二阈值条件、則将该查找出的字符信息转换为汉字形式，并将该汉字形式的字符信息作为所述匹配的汉字形式的字符信息；

当查找出的字符信息字段数量小于确定的字符信息字段数量时，則对确定的字符信息进行拆分，其中，同一字符信息拆分后的每个分词内容不相同，且分词中的字段数量与查找出的字符信息中的字段数量相同，若确定的字符信息拆分后的分词与查找出的字符信息之间的相似度满足第二阈值条件，到将该查找出的字符信息转换为汉字形式，并将该汉字形式的字符信息作为所述匹配的汉字形式的字符信息。

5、如权利要求 i所述的语音识別匹配的方法，其特征在于，为转化得到的字符信息进行模糊匹配之前，所述方法还包括：

判断是否能够对确定的字符信息进行完全匹配操作；

若否，则进一步判断是否能够对确定的字符信息进行部分完全匹配搡作，若否，则执行对确定的字符信息进行模糊匹配搡作。

6、如权利要求 5所述的语音识別匹配的方法，其特征在于，所述部分完全匹配操作包括：

根据确定的字符信息的字段数量, 从本地数据库中查找出与所述字段数量不同的4^音形式的字符信息；

若查找出的字符信息字段数量大于确定的字符信息字段数量，则对查找出的字符信息进行拆分，其中，同一字符信息拆分后的每个分词内容不相同，且分词中的字段数量与确定的字符信息中的字段数量相同，并确定查找出的字符信息拆分后的分词与确定的字符信息之间的相似度;

若查找出的字符信息字段数量小于确定的字符信息字段数量，则对确定的字符信息进行拆分，其中，同一字符信息拆分后的每个分词内容不相同，且分词†的字段数量与查找出的字符信息中的字段数量相同，并确定查找出的字符信息与确定的字符信息拆分后的分词之间的相似度。

7、一种语音识別匹配设备，其特征在于，所述设备包括：

确定模块，用于确定语音信息转 -化得到的拼音形式的字符信息；模糊匹配模块，用于根据模糊拼音匹配策略，从本地数据库中以拼音和汉字形式存储的字符信息中，为转化得到的字符信息根据拼音进行模糊匹配，得到本地数据库中与转化后的字符信息匹配的汉字形式的字符信息。

8、如权利要求 7所述的语音识別匹配设备，其特征在于，所述模糊匹配模块，具体包括：

第一字符信息查找单元，用于根据确定的字符信息中的字段数量，从本地数据戽中查找出相同字段数量的拼音形式的字符信息；

相似度计算单元，用于将确定的字符信息分别与查找出的字符信息进行相似度运算，从查找出的字符信息中，确定相似度满足第一阈值条件的字符信息；

第一匹配结果确定单元，用于将所述相似度满足第一阈值条件的字符信息转换为汉字形式，并将该汉字形式的字符信息作为所述匹配的汉字形式的字符信息。 9、如权利要求 8所述的语音识别匹配设备，其特征在于，

所述相似度计算单元 , 具体用于将确定的字符信息中的每个字段与一个查找出的字符信息中的相应字段进行以下操作，直至获得确定的字符信息中每个字段与查找出的字符信息中的字段的相似度：

若是，则根据拼音对列表为预设的拼音对设定的相似度，将该设定的相似度作为该字段与查找出的字符信息中的相应字段之间的相似度；

若否，则分离该字段的声母和韵母，分別确定该字段与查找出的字符信息中的字段的声母相似度和韵母相似度，并得到该字段与查找出的字符信息中的相应字段之间的相似度；

ί0、如权利要求 7或 8所述的语音识别匹配设备，其特征在于, 所述模糊匹配模块，还包括：

第二字符信息查找单元，用于根据确定的字符信息中的字段数量，从本地数据库中查找出与所述字段数量不同的拼音形式的字符信息；

拆分单元，用于当查找出的字符信息字段数量大于确定的字符信息字段数量时，则对查找出的字符信息进行拆分，其中，同一字符信息拆分后的每个分词内容不相同，且分词中的字段数量与确定的字符信息中的字段数量相同，以及当查找出的字符信息字段数量小于确定的字符信息字段数量，则对确定的字符信息进行拆分，其中, 同一字符信息拆分后的每个分词内容不相同，且分词中的字段数量与查找出的字符信息中的字段数量相同；

第二匹配结果确定单元，用于当查找出的字符信息字段数量大于确定的字符信息字段数量时，若查找出的字符信息拆分后的分词与确定的字符信息之间的相^度满足第二阈值条件，剩将该查找出的字符信息转换为汉字形式，并将该汉字形式的字符信息作为所述匹配的汉字形式的字符信息，以及当查找出的字符信息字段数量小于确定的字符信息字段数量时，若确定的字符信息拆分后的分词与查找中的字符信息之间的相^度满足第二阈值条件，则将该查找出的字符信息转换为汉字形式，并将该汉字形式的字符信息作为所述匹配的汉字形式的字符信息。

11 , 如权利要求 7所述的语音识別匹配设备，其特征在于，所述设备还包括：第一判断模块和第二判断模块，其中：

第一判断模块，用于在为转化得到的字符信息进行模糊匹配之前，判断是否能够对确定的字符信息进行完全匹配操作；

第二判断模块，用于在第一判断模块的判断结果为否时，判断是否能够对确定的字符信息进行部分完全匹配操作 , 若否，则触发模糊匹配模块。

12. 一种包括指令的计算机程序，所述指令在由处理器执行时被设置成使所述处理器执行如权利要求 1-6中任一项所述的方法。

1 3, 一种存储了如权利要求 12所述计算机程序的存儲介质。