CN102867511A - 自然语音识别方法和装置 - Google Patents
自然语音识别方法和装置 Download PDFInfo
- Publication number
- CN102867511A CN102867511A CN2011101847581A CN201110184758A CN102867511A CN 102867511 A CN102867511 A CN 102867511A CN 2011101847581 A CN2011101847581 A CN 2011101847581A CN 201110184758 A CN201110184758 A CN 201110184758A CN 102867511 A CN102867511 A CN 102867511A
- Authority
- CN
- China
- Prior art keywords
- word
- message
- information
- target
- target information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
本发明公开一种自然语音识别方法和装置,涉及语音识别技术。以解决采用关键词的方式进行语音识别成功率较低的问题。包括:获取用户输入的语音信息对应的文字信息;采用预先设置的词典对文字信息进行分词处理,获取文字信息包含的词语,其中,词典用于存储待进行语音识别的目标词语;根据文字信息包含的词语查找目标信息数据库,从目标信息数据库中获取与文字信息包含的词语匹配度最高的目标信息。本发明实施例提供的技术方案可以应用在如导航、点歌以及联系人查询等信息服务系统中。
Description
技术领域
本发明涉及语音识别技术,尤其涉及一种自然语音识别方法和装置。
背景技术
在语音识别领域中,对于不同的语言,语音识别技术各不相同,例如:对于英文而言,句中的单词均由26个字母表中的字母构成,在进行语音识别时,语音识别系统需要对语句中的字母以及句子的语法结构进行识别,才能识别出语音信息对应的文本信息。
中文与英文最大的区别在于,中文汉字数量较大,目前,汉字的总数已经超过了8万,其中常用汉字大约有3500字左右,面对如此庞大的中文汉字库,传统的语音识别技术是基于关键词的,语音识别系统需要将用户发送的语音内容从头到尾按字/词的方式与词表中预先存储的文本内容进行逐一匹配,只有语音内容与词表中存储的某条文本内容完全匹配时,语音识别系统才能识别出用户发送的语音内容的含义,成功进行语音识别,否则,语音识别失败。
然而,在实际的生活中,语言表述形式是多种多样的,对于同一事物每个人或者同一人在不同时期的表述各不相同,例如:对母亲一词的表述可以包括:母亲、妈、妈妈、老妈、妈咪等等。为了提高语音识别的成功率与准确率,需要尽可能地将同一事物的所有表述形式均存储到语音识别系统的词表中,这使得语音识别系统的词表规模非常庞大,维护不方便,并且由于词表规模庞大,使得语音识别系统进行语音识别的速度较慢。另外,由于人们的语言表述形式千差万别,随着时代的发展,语言表达方式也在不断更新,无法在语音识别系统的词表中穷尽同一事物的所有表述形式,使得采用关键词方式进行语音识别的成功率较低。
在申请号为CN00130067.9、CN03123123.3以及CN03138149.9等中国专利中也公开了与语音识别相关的技术方案,然而上述技术方案只能进行语音合成或者将语音转换成文字,而无法实现对语音转换成文字信息的识别,并且,上述技术方案是针对英文语音识别设计的,根据以上分析可知,英文语言和中文语言从词语数量以及语法特点上大不相同,使得上述技术方案即使应用在中文语音识别中也无法进行有效的识别,语音识别的成功率较低;在申请号为CN99813093.1的中国专利中,公开了一种采用语音识别和自然语言处理的交互式用户界面,虽然能够实现对语音转换成文字信息的识别,然而该技术方案也是针对英文语言设计的,在进行语音识别的过程中需要考虑语法等因素的影响,仍然无法有效地应用在中文语音识别中。
发明内容
为解决上述技术问题,本发明的实施例提供一种自然语音识别方法和装置,能够提高中文语音识别速度,以及语音识别的成功率。
一种自然语音识别方法,包括:获取用户输入的语音信息对应的文字信息;采用预先设置的词典对所述文字信息进行分词处理,获取所述文字信息包含的词语,其中,所述词典用于存储待进行语音识别的目标词语;根据所述文字信息包含的词语查找目标信息数据库,从所述目标信息数据库中获取与所述文字信息包含的词语匹配度最高的目标信息。
一种自然语音识别装置,包括:
第一获取单元,用于获取用户输入的语音信息对应的文字信息;
分词处理单元,用于采用预先设置的词典对所述第一获取单元获取的文字信息进行分词处理,获取所述文字信息包含的词语,其中,所述词典用于存储待进行语音识别的目标词语;
查找单元,用于根据所述分词处理单元获取的文字信息包含的词语查找目标信息数据库,从所述目标信息数据库中获取与所述文字信息包含的词语匹配度最高的目标信息。
本发明实施例提供的自然语音识别方法和装置,采用文字信息包含的词语进行信息匹配,并将目标信息数据库中与文字信息包含的词语匹配度最高的信息作为对语音信息识别得到的目标信息,不需要对语音信息进行完全匹配即可获得目标信息,提高了语音识别的成功率,解决了现有技术采用对语音信息进行完全匹配方法进行语音识别,造成由于表述方式不一致而使语音识别失败,语音识别成功率低的问题,由于本发明实施例提供的技术方案采用词语匹配的方式进行语音识别,只需要在词典中存储目标词语并在目标信息数据库中存储标准信息即可,不需要对同一事物按照语言表述方式存储大量不同形式的文本信息,词典和目标信息数据库的数据规模较小,便于进行查找,进而提高了语音识别速度,解决了现有技术需要在词表中对同一事物存储大量不同表述形式的文本信息,造成词表规模庞大,不便于查找,进行语音识别的速度较慢的问题。本发明实施例提供的技术方案不同于英文语音识别技术,该技术方案针对中文语言文字量大,语句中词语连贯、无停顿的特点,采用对语句分词,并根据词语查找的方式进行语音识别,对中文语音识别的成功率以及识别速度较高。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的自然语音识别方法流程图一;
图2为图1所示的本发明实施例提供的自然语音识别方法步骤103的流程图一;
图3为图1所示的本发明实施例提供的自然语音识别方法步骤103的流程图二;
图4为本发明实施例提供的自然语音识别方法流程图二;
图5为本发明实施例提供的自然语音识别方法流程图三;
图6为本发明实施例提供的自然语音识别装置结构示意图一;
图7为本发明实施例提供的自然语音识别装置结构示意图二;
图8为本发明实施例提供的自然语音识别装置结构示意图三;
图9为本发明实施例提供的自然语音识别装置结构示意图四;
图10为图6所示的本发明实施例提供的自然语音识别装置中查找单元的结构示意图;
图11为本发明实施例提供的自然语音识别装置结构示意图五;
图12为本发明实施例提供的自然语音识别装置结构示意图六;
图13为本发明实施例提供的自然语音识别装置结构示意图七。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了解决采用关键词的方式进行语音识别成功率较低的问题,本发明实施例提供一种自然语音识别方法和装置。
如图1所示,本发明实施例提供的自然语音识别方法,包括:
步骤101,获取用户输入的语音信息对应的文字信息。
为了使本发明实施例提供的自然语音识别方法适用范围更广,能够识别出不同地域、不同口音的用户语音信息,在本实施例中,步骤101可以采用非特定人语音识别技术对用户输入的语音信息进行识别解析,获取该语音信息对应的文字信息。
步骤102,采用预先设置的词典对步骤101获取的文字信息进行分词处理,获取文字信息包含的词语,其中,词典用于存储待进行语音识别的目标词语。
在本实施例中,词典中存储的目标词语可以是广义范围的词语,具体地,可以从日常生活和工作能够接触到的信息中获取目标词语并形成词典,例如:可以从每天新闻报道的信息中提取词语,形成词典;词典中存储的目标词语也可以是狭义范围的词语,具体地,可以从目标信息数据库中存储的信息获取目标词语并形成词典,其中,目标信息数据库用于存储待进行识别的信息,例如:如果本发明实施例提供的自然语音识别方法应用在车辆导航领域中,目标信息数据库用于存储地理位置信息和/或目的地名称信息等。需要说明的是,不论是广义范围的词语还是狭义范围的词语,词典中的目标词语均是唯一的,各个目标词语之间不重复。
由于语音识别技术一般是在特定领域中使用的,例如:应用在导航、点歌或者查找联系人等领域,为了减小词典中目标词语的冗余量,节省存储空间,提高语音识别的速度,本发明实施例优选地将词典中的目标词语设置为根据目标信息数据库设置的狭义范围词语,但不限于上述设置方式,本领域技术人员公知的是,对于该识别技术所应用的每个行业领域,所述行业的技术人员均可根据其行业特点,进行合理设置其目标信息数据库。
在本实施例中,步骤102具体可以根据步骤101获取的文字信息查找词典,将文字信息中的字按照出现顺序与词典中包含的目标词语进行匹配,当查找到与目标词语完全匹配的词语时,将该词语从所述文字信息中分割出来,继续循环上述查找的动作,直到文字信息中的最后一个字为止,从而实现对文字信息的分词处理。
步骤103,根据步骤102获取的文字信息包含的词语查找目标信息数据库,从目标信息数据库中获取与文字信息包含的词语匹配度最高的目标信息。
在本实施例中,步骤103可以通过两种方法从目标信息数据库中获取与文字信息包含的词语匹配度最高的目标信息,下面对这两种方法进行分别介绍:
1、权重系数判决法
在本实施例中,如果词典还用于存储目标词语对应的权重等级n以及权重等级范围N,n、N均为整数,N≥2,n∈[1,N],第n级的目标词语在所述文字信息中的重要性要比第n+1级的目标词语在所述文字信息中的重要性大,当然,其重要性与权重等级n的关系也可以相反,本领域技术人员可以自己根据需要定义,本实施方式按照前者进行示例,则步骤103之前,还包括根据词典获取文字信息包含的每个词语对应的权重等级的步骤。
具体地,可以预先设置词典中词语的权重等级范围N,以及每个词语的权重等级n,例如可以将词典包含的目标词语的权重等级范围设置为3,其中,权重等级为1最高,权重等级为3最低,然后按照目标词语的专有性以及广泛性设置每个目标词语的权重等级,如,目标词语是地名时,权重等级设置为3,目标词语是非地理位置的专有指代名词(如小肥羊)时,权重等级设置为1,当然,所述领域技术人员可根据其他设置规则对上述目标词语进行权重等级划分,此处并不对每种情况进行一一赘述。在步骤102将文字信息划分成词语之后,从词典中获取每个词语的权重等级属性信息。
则此时,如图2所示,步骤103可以包括:
步骤1031,根据文字信息包含的词语查找目标信息数据库,从目标信息数据库中获取与文字信息包含的任意一个或多个词语匹配的信息组成的信息集合。
步骤1032,根据文字信息包含的每个词语对应的权重等级,对步骤1031获取的信息集合中的每条信息分别进行处理,获取每条信息的权重系数。
在本实施例中,步骤1032可以采用加权平均算法获取每条信息的权重系数,当然也可以采用其他算法获取每条信息的权重信息,此处不作一一赘述。
步骤1033,从步骤1031获取的信息集合中选取权重系数最高的信息为目标信息。
需要说明的是,为了保证步骤103获取的目标信息的准确性,提高语音识别质量,在本实施例中,步骤102对文字信息分词之后的词语中应包含至少一个权重等级为1的词语,如果经分词处理以后,文字信息包含的词语中不存在权重等级为1的词语,则在步骤103之前,还包括:重新对文字信息进行分词处理,获取至少一个权重等级为1的词语。
进一步地,本发明实施例提供的自然语音识别方法还可以包括:将重新分词之后获取的至少一个权重等级为1的词语添加到词典中。
需要说明的是,本发明实施例对权重等级高低的划分进行具体的举例,在实际的使用过程中还可以通过其他规则设置权重等级的高低属性,例如:当权重等级范围为3时,可以设置权重等级为3最高,权重等级为1最低,以上方法是本领域技术人员能够在不付出创造性劳动的前提下轻易联想到的,此处不再一一赘述。
2、嵌套查找法
如图3所示,步骤103可以包括:
步骤1034,对步骤102获取的文字信息包含的词语进行排序。
在本实施例中,步骤1034可以将词语按照在文字信息中出现的先后顺序进行排序,优选地,为了提高查找速度,步骤1034可以先获取文字信息包含的词语中的关键词,然后将文字信息包含的词语按照关键词、后辅助词和前辅助词的顺序进行排序。
其中,关键词是具有专有指代意义的词语,后辅助词是文字信息中位于关键词之后的词语,前辅助词是文字信息中位于关键词之前的词语。
在本实施例中,可以预先设置关键词表,该关键词表可以根据目标信息数据库中存储的信息设置,本发明实施例提供的技术方案在获取文字信息包含的词语后,对所包含的每个词语分别查找关键词表,获取与关键词表中存储的关键词匹配的词语为文字信息包含的关键词。
需要说明的是,如果经查找后获知文字信息包含的词语中不存在关键词,则步骤1034按照词语在文字信息中出现的先后顺序进行排序;如果经查找后获知文字信息中包含两个以上关键词,则后辅助词为文字信息包含的词语中第一个关键词以后的非关键词,步骤1034仍然按照关键词、后辅助词以及前辅助词的顺序进行排序。
本发明实施例通过将文字信息包含的词语按照关键词、后辅助词和前辅助词的顺序进行排序,使得后续步骤按照词语顺序进行查找匹配时,重点信息突出,能够大幅度的缩短词语查找匹配的时间,进行提高语音识别的速度。
步骤1035,按照步骤1034的排序结果,从文字信息包含的词语中获取第一个待查找词语,从目标信息数据库中获取与第一个待查找词语匹配的信息。
步骤1036,从文字信息包含的词语中获取第二个待查找词语,从与第一个待查找词语匹配的信息组成的信息集合中获取与第二个待查找词语匹配的信息。
以此类推,步骤1037,从文字信息包含的词语中获取最后一个待查找词语,从与最后一个待查找词语相邻的上一个词语匹配的信息组成的信息集合中获取与最后一个待查找词语匹配的目标信息。
需要说明的是,在以上步骤1035-1037中,如果未查找到与当前待查找词语匹配的信息,则可以将当前待查找词语的匹配信息设置为与该当前待查找词语相邻的上一个待查找词语匹配的信息,如果,当前待查找词语为第一个待查找词语,则该第一个待查找词语匹配的信息为整个目标信息数据库中包含的信息。
为了使本领域技术人员能够对以上所述的嵌套查找法有更深刻的认识,下面通过具体的例子对嵌套查找法的具体实现进行说明:
例如:当用户输入的语音信息经识别解析后获得的文字信息为:北京石景山区八角东路小肥羊火锅店时,经步骤102分词处理后获得的文字信息包含的词语可以为:北京,石景山区,八角,东路,小肥羊,火锅店,如果小肥羊是关键词,则按照关键词、后辅助词和前辅助词排序为:小肥羊;火锅店,北京,石景山区,八角,东路,当目标信息数据库包括:北京小肥羊超市,石景山区古城路小肥羊火锅店,北京东来顺火锅店,北京八角北路东来顺火锅店,北京八角小肥羊火锅店等信息时,按照上述嵌套查找法,首先,从目标信息数据库中获取与“小肥羊”匹配的信息,形成第一信息库,该第一信息库包括:北京小肥羊超市,石景山区古城路小肥羊火锅店,北京八角小肥羊火锅店,然后,从第一信息库中获取与“火锅店”匹配的信息,形成第二信息库,该第二信息库包括:石景山区古城路小肥羊火锅店,北京八角小肥羊火锅店,第三,从第二信息库中获取与“北京”匹配的信息,形成第三信息库,该第三信息库包括:北京八角小肥羊火锅店;第四,从第三信息库中获取与“八角”匹配的信息,形成第四信息库,该第四信息库包括:北京八角小肥羊火锅店,第五,从第四信息库中获取与“东路”匹配的目标信息,由于第四信息库中没有与“东路”匹配的信息,所以目标信息为第四信息库中包含的信息,即北京八角小肥羊火锅店。
通过以上所述的权重系数判决法以及嵌套查找法能够准确地查找到与文本信息包含的词语匹配度最高的目标信息,实现对用户输入的语音信息的识别。当然,在实际的使用过程中,还可以采用其他方法获取与文本信息包含的词语匹配度最高的目标信息,此处不作一一赘述。
进一步地,如果在步骤103中选取了两条以上目标信息,为了提高语音识别的准确定,如图4所示,步骤103之后还可以包括:
步骤104,获取用户发送的目标信息选取指示。
具体地,本发明实施例在步骤103之后可以将选取的两条以上目标信息显示给用户,步骤104接收用户通过语音或者按键或者文字输入等方式发送的目标信息选取指示。
步骤105,根据目标信息选取指示从两条以上目标信息中选取优选目标信息。
或者,如果在步骤103中选取了两条以上目标信息,如图5所示,步骤103之后还可以包括:
步骤106,获取用户的语音识别统计数据。
本发明实施例提供的自然语音识别方法可以对用户每次进行语音识别的信息进行统计,该统计可以是针对特定用户个人的,也可以是针对特定用户群体的。进一步地,该语音识别统计数据可以为对用户的一个或者多个目标信息进行语音识别的次数或者频率统计的结果,也可以为对多个用户最后一次进行语音识别的目标信息的统计结果,当然还可以为其他与语音识别相关的统计结果,此处不作一一赘述。
步骤107,根据语音识别统计数据从两条以上目标信息中选取优选目标信息。
例如:当语音识别统计数据为对用户的多个目标信息进行语音识别的次数进行统计的结果时,如果用户输入的语音信息对应的文本信息为小肥羊火锅店,步骤103获取了3条目标信息,包括:海淀区小肥羊火锅店,海淀区中关村小肥羊火锅店,石景山八角东路小肥羊火锅店时,步骤106可以获取所述3条目标信息对应的语音识别统计数据,如“海淀区小肥羊火锅店”进行语音识别3次,“海淀区中关村小肥羊火锅店”进行语音识别5次,“石景山八角东路小肥羊火锅店”进行语音识别40次,则步骤107可以根据统计结果,从3条目标信息中选取“石景山八角东路小肥羊火锅店”为优选目标信息。
可选地,为了进一步缩短语音识别的时间,提高语音识别速度,在本实施例中,步骤103之前,还可以包括根据文字信息包含的词语查找口语词库,根据查找结果,从文字信息包含的词语中删除口语词的步骤,其中,口语词库用于存储口语词,该口语词中不包括涉及到用户输入的语音信息中具有实质性含义的文字信息。
在本实施例中,可以采用统计的方法预先设置口语词库,该口语词库中可以包括人们日常使用的口语词,例如:“我想去”、“我想要”、“请问”、“是不是”、“对不对”、“可不可以”以及“怎么”等等,此处不对口语词库中包含的口语词进行一一赘述。
本发明实施例提供的自然语音识别方法,采用文字信息包含的词语进行信息匹配,并将目标信息数据库中与文字信息包含的词语匹配度最高的信息作为对语音信息识别得到的目标信息,不需要对语音信息进行完全匹配即可获得目标信息,提高了语音识别的成功率,解决了现有技术采用对语音信息进行完全匹配方法进行语音识别,造成由于表述方式不一致而使语音识别失败,语音识别成功率低的问题,由于本发明实施例提供的技术方案采用词语匹配的方式进行语音识别,只需要在词典中存储目标词语并在目标信息数据库中存储标准信息即可,不需要对同一事物按照语言表述方式存储大量不同形式的文本信息,词典和目标信息数据库的数据规模较小,便于进行查找,进而提高了语音识别速度,解决了现有技术需要在词表中对同一事物存储大量不同表述形式的文本信息,造成词表规模庞大,不便于查找,进行语音识别的速度较慢的问题。本发明实施例提供的技术方案不同于英文语音识别技术,该技术方案针对中文语言文字量大,语句中词语连贯、无停顿的特点,采用对语句分词,并根据词语查找的方式进行语音识别,对中文语音识别的成功率以及识别速度较高。
如图6所示,本发明实施例还提供一种自然语音识别装置,包括:
第一获取单元601,用于获取用户输入的语音信息对应的文字信息;
分词处理单元602,用于采用预先设置的词典对第一获取单元601获取的文字信息进行分词处理,获取文字信息包含的词语,其中,词典用于存储待进行语音识别的目标词语;
查找单元603,用于根据分词处理单元602获取的文字信息包含的词语查找目标信息数据库,从目标信息数据库中获取与文字信息包含的词语匹配度最高的目标信息。
进一步地,如图7所示,本发明实施例提供的自然语音识别装置还可以包括:
第二获取单元604,用于如果词典还用于存储目标词语对应的权重等级n以及权重等级范围N,根据词典获取分词处理单元602获取的文字信息包含的每个词语对应的权重等级,其中,n、N均为整数,N≥2,n∈[1,N],第n级的目标词语在所述文字信息中的重要性要比第n+1级的目标词语在所述文字信息中的重要性大,当然,其重要性与权重等级n的关系也可以相反,本领域技术人员可以自己根据需要定义,本实施方式按照前者进行示例;
则,查找单元603可以包括:
查找子单元6031,用于根据分词处理单元602获取的文字信息包含的词语查找目标信息数据库,从目标信息数据库中获取与文字信息包含的任意一个或多个词语匹配的信息组成的信息集合;
第一获取子单元6032,用于根据第二获取单元604获取的文字信息包含的每个词语对应的权重等级,对查找子单元6031获取的信息集合中的每条信息分别进行处理,获取每条信息的权重系数;
第二获取子单元6033,用于从查找子单元6031获取的信息集合中选取第一获取子单元6032获取的权重系数最高的信息为目标信息。
进一步地,如图8所示,本发明实施例提供的自然语音识别装置还可以包括:
重分词单元605,用于如果根据第二获取单元604获取的文字信息包含的每个词语对应的权重等级确定,文字信息包含的词语中不存在权重等级为1的词语,重新对第一获取单元601获取的文字信息进行分词处理,获取至少一个权重等级为1的词语。
则所述查找单元603还用于根据重分词单元605获取的文字信息包含的词语查找目标信息数据库,从目标信息数据库中获取与文字信息包含的词语匹配度最高的目标信息。
进一步地,如图9所示,本发明实施例提供的自然语音识别装置还可以包括:
更新单元606,用于将重分词单元605获取的至少一个权重等级为1的词语添加到所述词典中。
进一步地,如图10所示,查找单元603还可以包括:
排序子单元6034,用于对分词处理单元602获取的文字信息包含的词语进行排序;
第三获取子单元6035,用于按照所述排序子单元排序的结果,从文字信息包含的词语中获取第一个待查找词语,从目标信息数据库中获取与第一个待查找词语匹配的信息;
第四获取子单元6036,用于从文字信息包含的词语中获取第二个待查找词语,从第三获取子单元6035获取的与第一个待查找词语匹配的信息组成的信息集合中获取与第二个待查找词语匹配的信息;
以此类推,第五获取子单元6037,从文字信息包含的词语中获取最后一个待查找词语,从与最后一个待查找词语相邻的上一个词语匹配的信息组成的信息集合中获取与最后一个待查找词语匹配的目标信息。
进一步地,如图11所示,本发明实施例提供的自然语音识别装置还可以包括:
删除单元607,用于根据分词处理单元602获取的文字信息包含的词语查找口语词库,根据查找结果,从文字信息包含的词语中删除口语词,其中,口语词库用于存储口语词,该口语词中不包括涉及到所述用户输入的语音信息中具有实质性含义的文字信息。
进一步地,如图12所示,本发明实施例提供的自然语音识别装置还可以包括:
第三获取单元608,用于如果查找单元603查找到两条以上目标信息,获取用户发送的目标信息选取指示;
第一选取单元609,用于根据第三获取单元608获取的目标信息选取指示从查找单元603查找到的两条以上目标信息中选取优选目标信息。
进一步地,如图13所示,本发明实施例提供的自然语音识别装置还可以包括:
第四获取单元6010,用于如果查找单元603查找到两条以上目标信息,获取用户的语音识别统计数据;
第二选取单元6011,用于根据第四获取单元6010获取的语音识别统计数据从查找单元603查找到的两条以上目标信息中选取优选目标信息。
本发明实施例提供的自然语音识别装置的具体实现可以参见本发明实施例提供的自然语音识别方法所述,此处不再赘述。
本发明实施例提供的自然语音识别装置,采用文字信息包含的词语进行信息匹配,并将目标信息数据库中与文字信息包含的词语匹配度最高的信息作为对语音信息识别得到的目标信息,不需要对语音信息进行完全匹配即可获得目标信息,提高了语音识别的成功率,解决了现有技术采用对语音信息进行完全匹配方法进行语音识别,造成由于表述方式不一致而使语音识别失败,语音识别成功率低的问题,由于本发明实施例提供的技术方案采用词语匹配的方式进行语音识别,只需要在词典中存储目标词语并在目标信息数据库中存储标准信息即可,不需要对同一事物按照语言表述方式存储大量不同形式的文本信息,词典和目标信息数据库的数据规模较小,便于进行查找,进而提高了语音识别速度,解决了现有技术需要在词表中对同一事物存储大量不同表述形式的文本信息,造成词表规模庞大,不便于查找,进行语音识别的速度较慢的问题。本发明实施例提供的技术方案不同于英文语音识别技术,该技术方案针对中文语言文字量大,语句中词语连贯、无停顿的特点,采用对语句分词,并根据词语查找的方式进行语音识别,对中文语音识别的成功率以及识别速度较高。
本发明实施例提供的自然语音识别方法和装置可以应用在如导航、点歌以及联系人查询等信息服务系统中。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (18)
1.一种自然语音识别方法,其特征在于,包括:
获取用户输入的语音信息对应的文字信息;
采用预先设置的词典对所述文字信息进行分词处理,获取所述文字信息包含的词语,其中,所述词典用于存储待进行语音识别的目标词语;
根据所述文字信息包含的词语查找目标信息数据库,从所述目标信息数据库中获取与所述文字信息包含的词语匹配度最高的目标信息。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
如果所述词典还用于存储所述目标词语对应的权重等级n以及权重等级范围N,根据所述词典获取所述文字信息包含的每个词语对应的权重等级,其中,n、N均为整数,N≥2,n∈[1,N],第n级的目标词语在所述文字信息中的重要性要比第n+1级的目标词语在所述文字信息中的重要性大;
则所述根据所述文字信息包含的词语查找目标信息数据库,从所述目标信息数据库中获取与所述文字信息包含的词语匹配度最高的目标信息包括:
根据所述文字信息包含的词语查找目标信息数据库,从所述目标信息数据库中获取与所述文字信息包含的任意一个或多个词语匹配的信息组成的信息集合;
根据所述文字信息包含的每个词语对应的权重等级,对所述信息集合中的每条信息分别进行处理,获取每条信息的权重系数;
从所述信息集合中选取权重系数最高的信息为目标信息。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
如果所述文字信息包含的词语中不存在权重等级为1的词语,重新对所述文字信息进行分词处理,获取至少一个权重等级为1的词语。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
将所述至少一个权重等级为1的词语添加到所述词典中。
5.根据权利要求1所述的方法,其特征在于,所述根据所述文字信息包含的词语查找目标信息数据库,从所述目标信息数据库中获取与所述文字信息包含的词语匹配度最高的目标信息包括:
对所述文字信息包含的词语进行排序;
按照所述排序的结果,从所述文字信息包含的词语中获取第一个待查找词语,从所述目标信息数据库中获取与所述第一个待查找词语匹配的信息;
从所述文字信息包含的词语中获取第二个待查找词语,从所述与第一个待查找词语匹配的信息组成的信息集合中获取与所述第二个待查找词语匹配的信息;
以此类推,从所述文字信息包含的词语中获取最后一个待查找词语,从与所述最后一个待查找词语相邻的上一个词语匹配的信息组成的信息集合中获取与所述最后一个待查找词语匹配的目标信息。
6.根据权利要求5所述的方法,其特征在于,所述对所述文字信息包含的词语进行排序包括:
获取所述文字信息包含的词语中的关键词;
将所述文字信息包含的词语按照关键词、后辅助词以及前辅助词的顺序进行排序;
其中,后辅助词为所述文字信息中位于关键词之后的词语,前辅助词为所述文字信息中位于关键词之前的词语。
7.根据权利要求6所述的方法,其特征在于,如果所述文字信息包含的词语中有两个以上关键词,所述后辅助词为所述文字信息包含的词语中第一个关键词以后的非关键词。
8.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述文字信息包含的词语查找口语词库,根据查找结果,从所述文字信息包含的词语中删除口语词,其中,口语词库用于存储口语词,所述口语词中不包括涉及到所述用户输入的语音信息中具有实质性含义的文字信息。
9.根据权利要求1所述的方法,其特征在于,所述方法还包括:
如果查找到两条以上目标信息,获取用户发送的目标信息选取指示;
根据所述目标信息选取指示从所述两条以上目标信息中选取优选目标信息。
10.根据权利要求1所述的方法,其特征在于,所述方法还包括:
如果查找到两条以上目标信息,获取用户的语音识别统计数据;
根据所述语音识别统计数据从所述两条以上目标信息中选取优选目标信息。
11.一种自然语音识别装置,其特征在于,包括:
第一获取单元,用于获取用户输入的语音信息对应的文字信息;
分词处理单元,用于采用预先设置的词典对所述第一获取单元获取的文字信息进行分词处理,获取所述文字信息包含的词语,其中,所述词典用于存储待进行语音识别的目标词语;
查找单元,用于根据所述分词处理单元获取的文字信息包含的词语查找目标信息数据库,从所述目标信息数据库中获取与所述文字信息包含的词语匹配度最高的目标信息。
12.根据权利要求11所述的装置,其特征在于,所述装置还包括:
第二获取单元,用于如果所述词典还用于存储所述目标词语对应的权重等级n以及权重等级范围N,根据所述词典获取所述分词处理单元获取的文字信息包含的每个词语对应的权重等级,其中,n、N均为整数,N≥2,n∈[1,N],第n级的目标词语在所述文字信息中的重要性要比第n+1级的目标词语在所述文字信息中的重要性大;
则,所述查找单元包括:
查找子单元,用于根据所述分词处理单元获取的文字信息包含的词语查找目标信息数据库,从所述目标信息数据库中获取与所述文字信息包含的任意一个或多个词语匹配的信息组成的信息集合;
第一获取子单元,用于根据所述第二获取单元获取的文字信息包含的每个词语对应的权重等级,对所述查找子单元获取的信息集合中的每条信息分别进行处理,获取每条信息的权重系数;
第二获取子单元,用于从所述查找子单元获取的信息集合中选取第一获取子单元获取的权重系数最高的信息为目标信息。
13.根据权利要求12所述的装置,其特征在于,所述装置还包括:
重分词单元,用于如果根据所述第二获取单元获取的文字信息包含的每个词语对应的权重等级确定,所述文字信息包含的词语中不存在权重等级为1的词语,重新对所述第一获取单元获取的文字信息进行分词处理,获取至少一个权重等级为1的词语。
14.根据权利要求13所述的装置,其特征在于,所述装置还包括:
更新单元,用于将所述重分词单元获取的至少一个权重等级为1的词语添加到所述词典中。
15.根据权利要求11所述的装置,其特征在于,所述查找单元还包括:
排序子单元,用于对所述分词处理单元获取的文字信息包含的词语进行排序;
第三获取子单元,按照所述排序子单元排序的结果,从所述文字信息包含的词语中获取第一个待查找词语,从所述目标信息数据库中获取与所述第一个待查找词语匹配的信息;
第四获取子单元,用于从所述文字信息包含的词语中获取第二个待查找词语,从所述第三获取子单元获取的与第一个待查找词语匹配的信息组成的信息集合中获取与所述第二个待查找词语匹配的信息;
第五获取子单元,以此类推,从所述文字信息包含的词语中获取最后一个待查找词语,从与所述最后一个待查找词语相邻的上一个词语匹配的信息组成的信息集合中获取与所述最后一个待查找词语匹配的目标信息。
16.根据权利要求11所述的装置,其特征在于,所述装置还包括:
删除单元,用于根据所述分词处理单元获取的文字信息包含的词语查找口语词库,根据查找结果,从所述文字信息包含的词语中删除口语词,其中,口语词库用于存储口语词,所述口语词中不包括涉及到所述用户输入的语音信息中具有实质性含义的文字信息。
17.根据权利要求11所述的装置,其特征在于,所述装置还包括:
第三获取单元,用于如果所述查找单元查找到两条以上目标信息,获取用户发送的目标信息选取指示;
第一选取单元,用于根据所述第三获取单元获取的目标信息选取指示从所述查找单元查找到的两条以上目标信息中选取优选目标信息。
18.根据权利要求11所述的装置,其特征在于,所述装置还包括:
第四获取单元,用于如果所述查找单元查找到两条以上目标信息,获取用户的语音识别统计数据;
第二选取单元,用于根据所述第四获取单元获取的语音识别统计数据从所述查找单元查找到的两条以上目标信息中选取优选目标信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011101847581A CN102867511A (zh) | 2011-07-04 | 2011-07-04 | 自然语音识别方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011101847581A CN102867511A (zh) | 2011-07-04 | 2011-07-04 | 自然语音识别方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102867511A true CN102867511A (zh) | 2013-01-09 |
Family
ID=47446335
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2011101847581A Pending CN102867511A (zh) | 2011-07-04 | 2011-07-04 | 自然语音识别方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102867511A (zh) |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104881503A (zh) * | 2015-06-24 | 2015-09-02 | 郑州悉知信息技术有限公司 | 一种数据处理方法和装置 |
CN105161104A (zh) * | 2015-07-31 | 2015-12-16 | 北京云知声信息技术有限公司 | 一种语音处理方法及装置 |
CN106022357A (zh) * | 2016-05-11 | 2016-10-12 | 珠海市魅族科技有限公司 | 一种数据输入校准的方法及终端 |
CN106131278A (zh) * | 2016-07-15 | 2016-11-16 | 广州安望信息科技有限公司 | 一种精确寻找手机联系人的方法及装置 |
CN106251869A (zh) * | 2016-09-22 | 2016-12-21 | 浙江吉利控股集团有限公司 | 语音处理方法及装置 |
CN106356056A (zh) * | 2016-10-28 | 2017-01-25 | 腾讯科技(深圳)有限公司 | 语音识别方法和装置 |
CN106371711A (zh) * | 2015-07-20 | 2017-02-01 | 联想(北京)有限公司 | 一种信息输入方法及电子设备 |
CN107766455A (zh) * | 2017-09-21 | 2018-03-06 | 腾讯音乐娱乐科技(深圳)有限公司 | 歌词接龙方法、装置和计算机可读存储介质 |
CN108255956A (zh) * | 2017-12-21 | 2018-07-06 | 北京声智科技有限公司 | 基于历史数据及机器学习自适应获取词库的方法及系统 |
CN108777142A (zh) * | 2018-06-05 | 2018-11-09 | 上海木木机器人技术有限公司 | 一种基于机场环境的语音交互识别方法及语音交互机器人 |
CN109101484A (zh) * | 2018-07-06 | 2018-12-28 | 平安科技(深圳)有限公司 | 录音文件处理方法、装置、计算机设备及存储介质 |
CN109634448A (zh) * | 2019-01-17 | 2019-04-16 | 安徽咪鼠科技有限公司 | 一种基于智能鼠标的语音宏控制系统 |
CN110335509A (zh) * | 2019-07-09 | 2019-10-15 | 南阳理工学院 | 一种小学教学演示装置 |
CN110942775A (zh) * | 2019-12-20 | 2020-03-31 | 北京欧珀通信有限公司 | 数据处理方法、装置、电子设备及存储介质 |
CN112037792A (zh) * | 2020-08-20 | 2020-12-04 | 北京字节跳动网络技术有限公司 | 一种语音识别方法、装置、电子设备及存储介质 |
CN112559710A (zh) * | 2020-12-22 | 2021-03-26 | 鲁班(北京)电子商务科技有限公司 | 一种物料信息查询方法及查询装置 |
CN113539270A (zh) * | 2021-07-22 | 2021-10-22 | 阳光保险集团股份有限公司 | 一种位置识别方法、装置、电子设备和存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6999932B1 (en) * | 2000-10-10 | 2006-02-14 | Intel Corporation | Language independent voice-based search system |
CN101145289A (zh) * | 2007-09-13 | 2008-03-19 | 上海交通大学 | 基于代理技术的远程教育环境中语音答疑系统 |
CN101505328A (zh) * | 2008-02-04 | 2009-08-12 | 台达电子工业股份有限公司 | 应用语音识别的网络数据检索方法及其系统 |
CN101996195A (zh) * | 2009-08-28 | 2011-03-30 | 中国移动通信集团公司 | 音频文件中语音信息的搜索方法、装置及设备 |
-
2011
- 2011-07-04 CN CN2011101847581A patent/CN102867511A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6999932B1 (en) * | 2000-10-10 | 2006-02-14 | Intel Corporation | Language independent voice-based search system |
CN101145289A (zh) * | 2007-09-13 | 2008-03-19 | 上海交通大学 | 基于代理技术的远程教育环境中语音答疑系统 |
CN101505328A (zh) * | 2008-02-04 | 2009-08-12 | 台达电子工业股份有限公司 | 应用语音识别的网络数据检索方法及其系统 |
CN101996195A (zh) * | 2009-08-28 | 2011-03-30 | 中国移动通信集团公司 | 音频文件中语音信息的搜索方法、装置及设备 |
Cited By (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104881503A (zh) * | 2015-06-24 | 2015-09-02 | 郑州悉知信息技术有限公司 | 一种数据处理方法和装置 |
CN106371711A (zh) * | 2015-07-20 | 2017-02-01 | 联想(北京)有限公司 | 一种信息输入方法及电子设备 |
CN105161104A (zh) * | 2015-07-31 | 2015-12-16 | 北京云知声信息技术有限公司 | 一种语音处理方法及装置 |
CN106022357A (zh) * | 2016-05-11 | 2016-10-12 | 珠海市魅族科技有限公司 | 一种数据输入校准的方法及终端 |
CN106131278B (zh) * | 2016-07-15 | 2019-04-09 | 广州安望信息科技有限公司 | 一种精确寻找手机联系人的方法及装置 |
CN106131278A (zh) * | 2016-07-15 | 2016-11-16 | 广州安望信息科技有限公司 | 一种精确寻找手机联系人的方法及装置 |
CN106251869A (zh) * | 2016-09-22 | 2016-12-21 | 浙江吉利控股集团有限公司 | 语音处理方法及装置 |
US11011170B2 (en) | 2016-09-22 | 2021-05-18 | Zhejiang Geely Holding Group Co., Ltd. | Speech processing method and device |
CN106251869B (zh) * | 2016-09-22 | 2020-07-24 | 浙江吉利控股集团有限公司 | 语音处理方法及装置 |
CN106356056B (zh) * | 2016-10-28 | 2017-12-01 | 腾讯科技(深圳)有限公司 | 语音识别方法和装置 |
CN106356056A (zh) * | 2016-10-28 | 2017-01-25 | 腾讯科技(深圳)有限公司 | 语音识别方法和装置 |
CN107766455B (zh) * | 2017-09-21 | 2020-06-30 | 腾讯音乐娱乐科技(深圳)有限公司 | 歌词接龙方法、装置和计算机可读存储介质 |
CN107766455A (zh) * | 2017-09-21 | 2018-03-06 | 腾讯音乐娱乐科技(深圳)有限公司 | 歌词接龙方法、装置和计算机可读存储介质 |
CN108255956A (zh) * | 2017-12-21 | 2018-07-06 | 北京声智科技有限公司 | 基于历史数据及机器学习自适应获取词库的方法及系统 |
CN108777142A (zh) * | 2018-06-05 | 2018-11-09 | 上海木木机器人技术有限公司 | 一种基于机场环境的语音交互识别方法及语音交互机器人 |
CN109101484A (zh) * | 2018-07-06 | 2018-12-28 | 平安科技(深圳)有限公司 | 录音文件处理方法、装置、计算机设备及存储介质 |
CN109101484B (zh) * | 2018-07-06 | 2023-04-18 | 平安科技(深圳)有限公司 | 录音文件处理方法、装置、计算机设备及存储介质 |
CN109634448A (zh) * | 2019-01-17 | 2019-04-16 | 安徽咪鼠科技有限公司 | 一种基于智能鼠标的语音宏控制系统 |
CN110335509A (zh) * | 2019-07-09 | 2019-10-15 | 南阳理工学院 | 一种小学教学演示装置 |
CN110942775A (zh) * | 2019-12-20 | 2020-03-31 | 北京欧珀通信有限公司 | 数据处理方法、装置、电子设备及存储介质 |
CN110942775B (zh) * | 2019-12-20 | 2022-07-01 | 北京欧珀通信有限公司 | 数据处理方法、装置、电子设备及存储介质 |
CN112037792A (zh) * | 2020-08-20 | 2020-12-04 | 北京字节跳动网络技术有限公司 | 一种语音识别方法、装置、电子设备及存储介质 |
CN112559710A (zh) * | 2020-12-22 | 2021-03-26 | 鲁班(北京)电子商务科技有限公司 | 一种物料信息查询方法及查询装置 |
CN113539270A (zh) * | 2021-07-22 | 2021-10-22 | 阳光保险集团股份有限公司 | 一种位置识别方法、装置、电子设备和存储介质 |
CN113539270B (zh) * | 2021-07-22 | 2024-04-02 | 阳光保险集团股份有限公司 | 一种位置识别方法、装置、电子设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102867511A (zh) | 自然语音识别方法和装置 | |
CN102867512A (zh) | 自然语音识别方法和装置 | |
CN102254557A (zh) | 基于自然语音识别的导航方法和系统 | |
KR102417045B1 (ko) | 명칭을 강인하게 태깅하는 방법 및 시스템 | |
CN102479191B (zh) | 提供多粒度分词结果的方法及其装置 | |
CN101183281B (zh) | 一种输入法中候选词的相关词输入的方法及系统 | |
CN103294776B (zh) | 一种智能手机通讯录模糊搜索的方法 | |
CN104011712A (zh) | 对跨语言查询建议的查询翻译进行评价 | |
CN102750949B (zh) | 语音识别方法和装置 | |
CN105159996A (zh) | 基于人工智能的深度问答服务提供方法和装置 | |
CN103389988A (zh) | 一种引导用户进行信息搜索的方法及装置 | |
CN106202294B (zh) | 基于关键词和主题模型融合的相关新闻计算方法及装置 | |
CN103886034A (zh) | 一种建立索引及匹配用户的查询输入信息的方法和设备 | |
CN103365925A (zh) | 获取多音字拼音、基于拼音检索的方法及其相应装置 | |
CN102163198A (zh) | 提供新词或热词的方法及系统 | |
CN103150356B (zh) | 一种应用的泛需求检索方法及系统 | |
CN102322866A (zh) | 基于自然语音识别的导航方法和系统 | |
CN108038099B (zh) | 基于词聚类的低频关键词识别方法 | |
CN102236639A (zh) | 更新语言模型的系统和方法 | |
CN111488429A (zh) | 一种基于搜索引擎的短文本聚类系统及其短文本聚类方法 | |
CN106653006B (zh) | 基于语音交互的搜索方法和装置 | |
CN103377224A (zh) | 识别问题类型的方法及装置、建立识别模型的方法及装置 | |
CN102385597B (zh) | 一种poi的容错搜索方法 | |
CN102347026B (zh) | 基于自然语音识别的音频、视频或音视频点播方法和系统 | |
CN101655846A (zh) | 中文输入法标点关联方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
DD01 | Delivery of document by public notice |
Addressee: Yu Zhe Document name: Notification of Passing Examination on Formalities |
|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20130109 |