CN104238991B - 语音输入匹配方法及装置 - Google Patents

语音输入匹配方法及装置 Download PDF

Info

Publication number
CN104238991B
CN104238991B CN201310248487.0A CN201310248487A CN104238991B CN 104238991 B CN104238991 B CN 104238991B CN 201310248487 A CN201310248487 A CN 201310248487A CN 104238991 B CN104238991 B CN 104238991B
Authority
CN
China
Prior art keywords
word
phonetic
similar
mapping table
matched
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201310248487.0A
Other languages
English (en)
Other versions
CN104238991A (zh
Inventor
韩贵平
徐浩
褚攀
王飞
廖玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201310248487.0A priority Critical patent/CN104238991B/zh
Priority to PCT/CN2013/090468 priority patent/WO2014201834A1/en
Priority to US14/164,075 priority patent/US9437192B2/en
Publication of CN104238991A publication Critical patent/CN104238991A/zh
Application granted granted Critical
Publication of CN104238991B publication Critical patent/CN104238991B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/12Use of codes for handling textual entities
    • G06F40/126Character encoding
    • G06F40/129Handling non-Latin characters, e.g. kana-to-kanji conversion

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

本发明实施例公开了一种语音输入匹配方法及装置,涉及信息技术领域,可以提升语音输入的匹配精度,同时提升语音输入的匹配成功率。所述方法包括:首先接收语音输入指令,所述语音输入指令中携带有输入的语音信息,然后获取语音信息对应的文字和所述文字对应的拼音,并且根据文字发音相似度生成所述文字对应的至少一个相似拼音,最后从预置映射关系表中,获取与文字对应的拼音相匹配的文字或者与文字对应的至少一个相似拼音相匹配的文字。

Description

语音输入匹配方法及装置
技术领域
本发明涉及信息技术领域,特别涉及一种语音输入匹配方法及装置。
背景技术
随着终端设备的不断发展,终端设备的功能也越来越多样化。其中,终端设备可以根据用户输入的信息进行相应的操作。现有的文字输入方式主要分为键盘输入方式和非键盘输入方式,而在非键盘输入方式中,最常用的为语音输入方式。语音输入方式具体为终端设备将用户输入的语音信息,转换为对应的文字进行显示,进一步地,还可以根据用户输入的语音信息进行相应的操作。
然而当用户通过语音输入方式输入语音信息时,由于各地语言的发音差异,以及平翘舌、鼻边音等发音方式的不同,会使得用户输入的语音信息对应的文字与实际需要匹配的文字不相同,此时,终端设备只能提示本次语音输入匹配失败,从而造成现有语音输入匹配的成功率较低。
发明内容
本发明实施例提供一种语音输入匹配方法及装置,可以提升语音输入的匹配精度,同时,可以提升语音输入的匹配成功率。
本发明实施例采用的技术方案为:
第一方面,提供一种语音输入匹配方法,包括:
接收语音输入指令,所述语音输入指令中携带有输入的语音信息;
获取所述语音信息对应的文字和所述文字对应的拼音,并且根据文字发音相似度生成所述文字对应的至少一个相似拼音;
从预置映射关系表中,获取与所述文字对应的拼音相匹配的文字或者与所述文字对应的至少一个相似拼音相匹配的文字;
所述预置映射关系表中记录了待匹配文字数据库中每个文字对应的拼音和每个文字对应的至少一个相似拼音,以及所述拼音和所述至少一个相似拼音与所述待匹配文字数据库中对应的文字之间的映射关系。
第二方面,提供一种文字输入匹配装置,包括:
接收单元,用于接收语音输入指令,所述语音输入指令中携带有输入的语音信息;
获取单元,用于获取所述接收单元接收的所述语音信息对应的文字和所述文字对应的拼音;
生成单元,用于根据文字发音相似度生成所述文字对应的至少一个相似拼音;
所述获取单元,还用于从预置映射关系表中,获取与所述文字对应的拼音相匹配的文字或者与所述文字对应的至少一个相似拼音相匹配的文字;
所述预置映射关系表中记录了待匹配文字数据库中每个文字对应的拼音和每个文字对应的至少一个相似拼音,以及所述拼音和所述至少一个相似拼音与所述待匹配文字数据库中对应的文字之间的映射关系。
本发明实施例提供的语音输入匹配方法及装置,首先接收语音输入指令,所述语音输入指令中携带有输入的语音信息,然后获取语音信息对应的文字和所述文字对应的拼音,并且根据文字发音相似度生成所述文字对应的至少一个相似拼音,最后从预置映射关系表中,获取与文字对应的拼音相匹配的文字或者与文字对应的至少一个相似拼音相匹配的文字,与目前如果用户输入的语音信息对应的文字与实际需要匹配的文字不相同,终端设备只能提示本次语音输入匹配失败相比,本发明实施例通过终端设备进行语音信息对应的文字的拼音全匹配和拼音相似匹配的方式,可以提升语音输入的匹配精度,同时提升语音输入的匹配成功率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本发明实施例提供的一种语音输入匹配方法流程图;
图2为本发明实施例提供的另一种语音输入匹配方法流程图;
图3为本发明实施例提供的一种语音输入匹配装置结构示意图;
图4为本发明实施例提供的另一种语音输入匹配装置结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
为使本发明技术方案的优点更加清楚,下面结合附图和实施例对本发明作详细说明。
本发明实施例提供一种语音输入匹配方法,如图1所示,所述方法包括:
101、终端设备接收语音输入指令。
其中,所述语音输入指令中携带有输入的语音信息。例如,用户输入的语音信息为打电话给王五,此时终端设备就会根据该语音信息对应的文字在本地通信录中查询到联系人王五后,执行本次呼叫操作。
102、获取所述语音信息对应的文字和所述文字对应的拼音,并且根据文字发音相似度生成所述文字对应的至少一个相似拼音。
其中,终端设备获取语音信息对应的文字的方式可以包括:终端设备从后台服务器获取该语音信息对应的文字,及后台服务器将该语音信息转换为对应的文字;或者终端设备内部预先配置将语音信息转换为对应文字的软件,从而实现终端设备侧直接获取该语音信息对应的文字,本发明实施例不做限定。终端设备可以对文字发音采用不同的相似处理方式进行处理后,生成文字对应的不同相似等级的相似拼音。例如,可以通过对文字的发音进行平翘舌处理生成对应的一级相似拼音,还可以通过对文字的发音进行平翘舌与鼻边音的处理生成对应的二级相似拼音,本发明实施例不做限定。
103、从预置映射关系表中,获取与文字对应的拼音相匹配的文字或者与文字对应的至少一个相似拼音相匹配的文字。
其中,所述预置映射关系表中记录了待匹配文字数据库中每个文字对应的拼音和每个文字对应的至少一个相似拼音,以及所述拼音和所述至少一个相似拼音与所述待匹配文字数据库中对应的文字之间的映射关系。待匹配文字数据库中保存的文字可以包括通讯录的联系人名称、终端设备保存的歌曲名称等,本发明实施例不做限定。
具体地,首先从预置映射关系表中,获取与文字对应的拼音相匹配的拼音或者与文字对应的至少一个相似拼音相匹配的拼音,然后获取与相匹配的拼音对应的文字。
对于本发明实施例,具体可以按照文字发音相似度由高到低的顺序将待匹配文字数据库中的每个文字对应的相似拼音分为不同的相似等级。例如,将发音相同的拼音的等级配置为全匹配,将发音相似程度最高的拼音的等级配置为一级相似,依次类推,按照发音相似程度由高到低进一步配置剩余相似拼音的等级为二级相似、三级相似等。其中,一级相似的规则具体可以为对文字的发音进行平翘舌、鼻边音、混淆声母、或者混淆韵母处理后生成对应的相似拼音;二级相似的规则具体可以为对文字的发音进行平翘舌与鼻边音、平翘舌与混淆声母、平翘舌与混淆韵母、鼻边音与混淆声母、鼻边音与混淆韵母、或者混淆声母与混淆声母处理后生成对应的相似拼音;三级相似的规则具体可以为仅匹配首个汉字的发音后生成对应的相似拼音,例如仅匹配名字中的姓氏;四级相似的规则具体可以为对文字的发音进行平翘舌与鼻边音与混淆韵母、或者平翘舌与鼻边音与屏蔽声母处理后生成对应的相似拼音;五级相似的规则具体可以为对文字的发音进行平翘舌与鼻边音与屏蔽声母与混淆韵母处理后生成对应的相似拼音。
需要说明的是,本发明实施例中划分的相似拼音的相似等级的个数、以及每一个相似等级的定义规则可以根据实际需求进行灵活配置,本发明实施例不做限定。
本发明实施例提供的一种语音输入匹配方法,首先接收语音输入指令,所述语音输入指令中携带有输入的语音信息,然后获取语音信息对应的文字和所述文字对应的拼音,并且根据文字发音相似度生成所述文字对应的至少一个相似拼音,最后从预置映射关系表中,获取与文字对应的拼音相匹配的文字或者与文字对应的至少一个相似拼音相匹配的文字,与目前如果用户输入的语音信息对应的文字与实际需要匹配的文字不相同,终端设备只能提示本次语音输入匹配失败相比,本发明实施例通过终端设备进行语音信息对应的文字的拼音全匹配和拼音相似匹配的方式,可以提升语音输入的匹配精度,同时提升语音输入的匹配成功率。
进一步地,本发明实施例提供另一种文字输入匹配方法,如图2所示,所述方法包括:
201、终端设备建立预置映射关系表。
其中,所述预置映射关系表中记录了待匹配文字数据库中每个文字对应的拼音和每个文字对应的至少一个相似拼音,以及所述拼音和所述至少一个相似拼音与所述待匹配文字数据库中对应的文字之间的映射关系。待匹配文字数据库中保存的文字可以包括通讯录的联系人名称、终端设备保存的歌曲名称等,本发明实施例不做限定。
需要说明的是,本发明实施例中将待匹配文字数据库中的每个文字对应的相似拼音划分为不同的相似等级的具体方式可以参考图1中的对应描述,在此不再赘述。
步骤201具体可以为:首先将所述待匹配文字数据库中的每个文字转换为对应的拼音,然后根据文字发音相似度,生成所述每个文字对应的至少一个相似拼音,最后建立所述拼音和所述至少一个相似拼音与所述待匹配文字数据库中对应的文字之间的映射关系,并且将所述映射关系记录在所述预置映射关系表中。
优选地,步骤201之后还可以包括:建立与所述每个文字对应的拼音和对应的至少一个相似拼音相匹配的字典树。通过建立字典树,并且在字典树中查找与输入的文字对应的拼音以及对应的相似拼音相匹配的拼音,可以进一步提升文字输入的匹配效率。
优选地,还可以对待匹配文字数据库中保存的文字预先进行分类,例如,可以将属于通讯录联系人名称的文字与终端设备中保存的歌曲名称的文字分为不同类,并且按照文字类别建立与文字对应的拼音和对应的至少一个相似拼音相匹配的多个字典树,从而可以进一步提升文字输入的匹配效率。进一步地,还可以将每一个拼音的最后一个字母在字典树中对应的节点上,标识出该拼音对应的相似等级。
202、接收语音输入指令。
其中,所述语音输入指令中携带有输入的语音信息。例如,用户输入的语音信息为打电话给王五,此时终端设备就会根据该语音信息对应的文字在本地通信录中查询到联系人王五后,执行本次呼叫操作。
203、获取所述语音信息对应的文字和所述文字对应的拼音,并且根据文字发音相似度生成所述文字对应的至少一个相似拼音。
其中,终端设备可以采用以下相似处理方式中的任意一种或者任意组合对文字发音进行处理后,生成文字对应的不同相似等级的相似拼音,所述发音处理方式包括:平翘舌处理方式、鼻边音处理方式、混淆声母处理方式、混淆韵母处理方式、仅匹配首个汉字处理方式、屏蔽声母处理方式。
具体地,对输入的语音信息对应的文字的发音进行平翘舌处理,生成所述文字对应的相似拼音,例如,输入的语音信息对应的文字为张山峰,对应的拼音为zhangshanfeng,进行平翘舌处理后,将zh和sh替换为z和s,文字对应的相似拼音为zangsanfeng。
可替换地,对输入的语音信息对应的文字的发音进行鼻边音处理,生成所述文字对应的相似拼音,例如,输入的语音信息对应的文字为王妮,对应的拼音为wangni,进行鼻边音处理后,将n替换为l,文字对应的相似拼音为wangli,匹配的文字为王丽。
可替换地,对输入的语音信息对应的文字的发音进行混淆声母处理,生成所述文字对应的相似拼音,例如,输入的语音信息对应的文字为吃换,对应的拼音为chihuan,进行混淆声母处理后,将声母hu替换为声母f,文字对应的相似拼音为chifan,匹配的文字为吃饭。
可替换地,对输入的语音信息对应的文字的发音进行混淆韵母处理,生成所述文字对应的相似拼音,例如,输入的语音信息对应的文字为难和,对应的拼音为nanhe,进行混淆韵母处理后,将韵母an替换为韵母uan,文字对应的相似拼音为nuanhe,匹配的文字为暖和。
可替换地,对输入的语音信息对应的文字的发音进行仅匹配首个汉字处理,生成所述文字对应的相似拼音,例如,输入的语音信息对应的文字为张山峰,对应的拼音为zhangshanfeng,进行仅匹配首个汉字处理后,文字对应的相似拼音为zhang,匹配的文字为张,从而使得终端设备获取姓氏为张的所有人名进行匹配。
可替换地,对输入的语音信息对应的文字的发音进行屏蔽声母处理,生成所述文字对应的相似拼音,例如,输入的语音信息对应的文字为吃换,对应的拼音为chihuan,进行混淆屏蔽声母后,将拼音huan中的声母hu替换为一个特定标识符,具体可以为感叹号、星号等,此时文字对应的相似拼音为chi!an,匹配的文字为吃饭。
204、从预置映射关系表中,获取与文字对应的拼音相匹配的文字或者与文字对应的至少一个相似拼音相匹配的文字。
步骤204可以包括:首先按照文字发音相似度由高到低的顺序,依次判断与文字对应的拼音和对应的至少一个相似拼音中,是否存在与所述预置映射关系表中的拼音相匹配的拼音,若存在与所述预置映射关系表中的拼音相匹配的拼音,根据所述预置映射关系表获取所述相匹配的拼音对应的文字。可以看出,通过根据文字发音相似度由高到低的顺序进行拼音匹配,可以保证最终获取的文字最接近实际需要匹配的文字,从而提升了文字输入的匹配成功率。
优选地,步骤204还可以为:按照文字发音相似度由高到低的顺序,依次判断与文字对应的拼音和对应的至少一个相似拼音中,是否存在与所述字典树中的拼音相匹配的拼音,若存在与所述字典树中的拼音相匹配的拼音,根据所述映射关系表获取所述相匹配的拼音对应的文字。可以看出,通过根据文字发音相似度由高到低的顺序进行拼音匹配,可以保证最终获取的文字最接近实际需要匹配的文字,从而提升了文字输入的匹配成功率,并且通过在字典树中进行拼音匹配查找,还可以进一步提升文字输入的匹配效率。
对于本发明实施例的应用场景可以如下所示,但不限于此,包括:终端设备接收到的语音输入指令为:打电话给张山峰,终端设备获取到待匹配文字数据库中通讯录中的联系人为张三丰、张无忌、王五,首先终端设备将联系人名称文字转换为zhangsanfeng、zhangwuji、wangwu,并且按照文字发音相似度获取文字的至少一个相似拼音,具体地,按照不同相似等级的规则获取文字的相似拼音,例如,对文字发音进行平翘舌处理后,文字分别对应的相似拼音为zangsanfeng、zangwuji、wangwu,此时建立联系人名称文字与对应的拼音和对应的相似拼音的映射关系表,然后将用户输入的文字张山峰转换为拼音zhangshanfeng,并且判断映射关系表中没有与zhangshanfeng匹配的拼音,若采用现有语音输入匹配方式,此时终端设备会提示未找到匹配内容,从而造成本次语音输入匹配失败,而本发明实施例会对文字张山峰的发音进行平翘舌一级相似处理后,生成的相似拼音为zangsanfeng,此时判断映射关系表中存在与zangsanfeng匹配的拼音,并且映射关系表中zangsanfeng对应的文字为张三丰,从而成功获取到了与输入的语音信息相匹配的文字张三丰,提升了语音输入的匹配成功率。
本发明实施例提供的另一种语音输入匹配方法,首先接收语音输入指令,所述语音输入指令中携带有输入的语音信息,然后获取语音信息对应的文字和所述文字对应的拼音,并且根据文字发音相似度生成所述文字对应的至少一个相似拼音,最后从预置映射关系表中,获取与文字对应的拼音相匹配的文字或者与文字对应的至少一个相似拼音相匹配的文字,与目前如果用户输入的语音信息对应的文字与实际需要匹配的文字不相同,终端设备只能提示本次语音输入匹配失败相比,本发明实施例通过终端设备进行拼音全匹配和拼音相似匹配的方式,可以提升语音输入的匹配精度,同时提升语音输入的匹配成功率。
进一步地,作为图1所示方法的具体实现,本发明实施例提供一种语音输入匹配装置,如图3所示,所述装置可以应用于终端设备中,例如,应用于手机、计算机、电脑本等,所述装置包括:接收单元31、获取单元32、生成单元33。
接收单元31,可以用于接收语音输入指令,所述语音输入指令中携带有输入的语音信息。
获取单元32,可以用于获取所述接收单元31接收的所述语音信息对应的文字和所述文字对应的拼音。
生成单元33,可以用于根据文字发音相似度生成所述文字对应的至少一个相似拼音。
获取单元32,还可以用于从预置映射关系表中,获取与所述文字对应的拼音相匹配的文字或者与所述文字对应的至少一个相似拼音相匹配的文字,其中,所述预置映射关系表中记录了待匹配文字数据库中每个文字对应的拼音和每个文字对应的至少一个相似拼音,以及所述拼音和所述至少一个相似拼音与所述待匹配文字数据库中对应的文字之间的映射关系。
需要说明的是,本发明实施例提供的语音输入匹配装置中所涉及各功能单元的其他相应描述,可以参考图1中的对应描述,在此不再赘述。
再进一步地,作为图2所示方法的具体实现,本发明实施例提供另一种语音输入匹配装置,如图4所示,所述装置可以应用于终端设备中,例如,应用于手机、计算机、电脑本等,所述装置包括:接收单元41、获取单元42、生成单元43、建立单元44。
接收单元41,可以用于接收语音输入指令,所述语音输入指令中携带有输入的语音信息。
获取单元42,可以用于获取所述接收单元41接收的所述语音信息对应的文字和所述文字对应的拼音。
生成单元43,可以用于根据文字发音相似度生成所述文字对应的至少一个相似拼音。
获取单元42,还可以用于从预置映射关系表中,获取与所述文字对应的拼音相匹配的文字或者与所述文字对应的至少一个相似拼音相匹配的文字,其中,所述预置映射关系表中记录了待匹配文字数据库中每个文字对应的拼音和每个文字对应的至少一个相似拼音,以及所述拼音和所述至少一个相似拼音与所述待匹配文字数据库中对应的文字之间的映射关系。
建立单元44,可以用于在接收单元41接收语音输入指令之前,建立所述预置映射关系表。
建立单元44可以包括:
转换模块4401,可以用于将所述待匹配文字数据库中的每个文字转换为对应的拼音。
生成模块4402,可以用于根据文字发音相似度,生成所述每个文字对应的至少一个相似拼音。
建立模块4403,用于建立所述转换模块4401转换的所述拼音和所述生成模块4402生成的所述至少一个相似拼音与所述待匹配文字数据库中对应的文字之间的映射关系。
记录模块4404,可以用于将所述建立模块4403建立的所述映射关系记录在所述预置映射关系表中。
获取单元42可以包括:
判断模块4201,可以用于按照文字发音相似度由高到低的顺序,依次判断与输入的文字对应的拼音和对应的至少一个相似拼音中,是否存在与所述预置映射关系表中的拼音相匹配的拼音。
获取模块4202,可以用于若所述判断模块4201判断存在与所述预置映射关系表中的拼音相匹配的拼音,根据所述预置映射关系表获取所述相匹配的拼音对应的文字。
建立单元44,还可以用于建立与所述每个文字对应的拼音和对应的至少一个相似拼音相匹配的字典树。
判断模块4201,还可以用于按照文字发音相似度由高到低的顺序,依次判断与文字对应的拼音和对应的至少一个相似拼音中,是否存在与所述字典树中的拼音相匹配的拼音。
获取模块4202,还可以用于若存在与所述字典树中的拼音相匹配的拼音,根据所述映射关系表获取所述相匹配的拼音对应的文字。
生成单元43,可以用于对所述文字的发音进行平翘舌处理,生成所述文字对应的相似拼音;和/或对所述文字的发音进行鼻边音处理,生成所述文字对应的相似拼音;和/或对所述文字的发音进行混淆声母处理,生成所述文字对应的相似拼音;和/或对所述文字的发音进行混淆韵母处理,生成所述文字对应的相似拼音。
需要说明的是,本发明实施例提供的语音输入匹配装置中所涉及各功能单元的其他相应描述,可以参考图2中的对应描述,在此不再赘述。
本发明实施例提供的语音输入匹配装置,首先接收语音输入指令,所述语音输入指令中携带有输入的语音信息,然后获取语音信息对应的文字和所述文字对应的拼音,并且根据文字发音相似度生成所述文字对应的至少一个相似拼音,最后从预置映射关系表中,获取与文字对应的拼音相匹配的文字或者与文字对应的至少一个相似拼音相匹配的文字,与目前如果用户输入的语音信息对应的文字与实际需要匹配的文字不相同,终端设备只能提示本次语音输入匹配失败相比,本发明实施例通过拼音全匹配和拼音相似匹配的方式,可以提升语音输入的匹配精度,同时提升语音输入的匹配成功率。
本发明实施例提供的语音输入匹配装置可以实现上述提供的方法实施例,具体功能实现请参见方法实施例中的说明,在此不再赘述。本发明实施例提供的语音输入匹配方法及装置可以适用于信息技术领域,但不仅限于此。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (10)

1.一种语音输入匹配方法,其特征在于,包括:
接收语音输入指令,所述语音输入指令中携带有输入的语音信息;
获取所述语音信息对应的文字和所述文字对应的拼音,并且根据文字发音相似度生成所述文字对应的至少一个相似拼音;
从预置映射关系表中,获取与所述文字对应的拼音相匹配的文字或者与所述文字对应的至少一个相似拼音相匹配的文字;
所述预置映射关系表中记录了待匹配文字数据库中每个文字对应的拼音和每个文字对应的至少一个相似拼音,以及所述拼音和所述至少一个相似拼音与所述待匹配文字数据库中对应的文字之间的映射关系;
其中,所述从预置映射关系表中,获取与所述文字对应的拼音相匹配的文字或者与所述文字对应的至少一个相似拼音相匹配的文字的步骤包括:
按照文字发音相似度由高到低的顺序,依次判断与所述文字对应的拼音和与所述文字对应的至少一个相似拼音中,是否存在与所述预置映射关系表中的拼音相匹配的拼音;
若存在与所述预置映射关系表中的拼音相匹配的拼音,根据所述预置映射关系表获取所述相匹配的拼音对应的文字。
2.根据权利要求1所述的语音输入匹配方法,其特征在于,所述接收语音输入指令的步骤之前,还包括:
建立所述预置映射关系表;
所述建立所述预置映射关系表的步骤包括:
将所述待匹配文字数据库中的每个文字转换为对应的拼音;
根据文字发音相似度,生成所述每个文字分别对应的至少一个相似拼音;
建立所述拼音和所述至少一个相似拼音与所述待匹配文字数据库中对应的文字之间的映射关系,并且将所述映射关系记录在所述预置映射关系表中。
3.根据权利要求2所述的语音输入匹配方法,其特征在于,所述建立所述拼音和所述至少一个相似拼音与所述待匹配文字数据库中对应的文字之间的映射关系,并且将所述映射关系记录在所述预置映射关系表中的步骤之后,还包括:
建立与所述待匹配文字数据库中每个文字对应的拼音和对应的至少一个相似拼音相匹配的字典树。
4.根据权利要求3所述的语音输入匹配方法,其特征在于,所述从预置映射关系表中,获取与所述文字对应的拼音相匹配的文字或者与所述文字对应的至少一个相似拼音相匹配的文字的步骤包括:
按照文字发音相似度由高到低的顺序,依次判断与所述文字对应的拼音和与所述文字对应的至少一个相似拼音中,是否存在与所述字典树中的拼音相匹配的拼音;
若存在与所述字典树中的拼音相匹配的拼音,根据所述映射关系表获取所述相匹配的拼音对应的文字。
5.根据权利要求1-4任一项所述的语音输入匹配方法,其特征在于,所述根据文字发音相似度生成所述文字对应的至少一个相似拼音的步骤包括:
对所述文字的发音进行平翘舌处理,生成所述文字对应的相似拼音;和/或
对所述文字的发音进行鼻边音处理,生成所述文字对应的相似拼音;和/或
对所述文字的发音进行混淆声母处理,生成所述文字对应的相似拼音;和/或
对所述文字的发音进行混淆韵母处理,生成所述文字对应的相似拼音。
6.一种语音输入匹配装置,其特征在于,包括:
接收单元,用于接收语音输入指令,所述语音输入指令中携带有输入的语音信息;
获取单元,用于获取所述接收单元接收的所述语音信息对应的文字和所述文字对应的拼音;
生成单元,用于根据文字发音相似度生成所述文字对应的至少一个相似拼音;
所述获取单元,还用于从预置映射关系表中,获取与所述文字对应的拼音相匹配的文字或者与所述文字对应的至少一个相似拼音相匹配的文字;
所述预置映射关系表中记录了待匹配文字数据库中每个文字对应的拼音和每个文字对应的至少一个相似拼音,以及所述拼音和所述至少一个相似拼音与所述待匹配文字数据库中对应的文字之间的映射关系;
其中,所述获取单元包括:
判断模块,用于按照文字发音相似度由高到低的顺序,依次判断与所述文字对应的拼音和与所述文字对应的至少一个相似拼音中,是否存在与所述预置映射关系表中的拼音相匹配的拼音;
获取模块,用于若所述判断模块判断存在与所述预置映射关系表中的拼音相匹配的拼音,根据所述预置映射关系表获取所述相匹配的拼音对应的文字。
7.根据权利要求6所述的语音输入匹配装置,其特征在于,所述装置还包括:
建立单元,用于在接收单元接收语音输入指令之前,建立所述预置映射关系表;
所述建立单元包括:
转换模块,用于将所述待匹配文字数据库中的每个文字转换为对应的拼音;
生成模块,用于根据文字发音相似度,生成所述每个文字分别对应的至少一个相似拼音;
建立模块,用于建立所述转换模块转换的所述拼音和所述生成模块生成的所述至少一个相似拼音与所述待匹配文字数据库中对应的文字之间的映射关系;
记录模块,用于将所述建立模块建立的所述映射关系记录在所述预置映射关系表中。
8.根据权利要求7所述的语音输入匹配装置,其特征在于,
所述建立单元,还用于建立与所述待匹配文字数据库中每个文字对应的拼音和对应的至少一个相似拼音相匹配的字典树。
9.根据权利要求8所述的语音输入匹配装置,其特征在于,
所述判断模块,还用于按照文字发音相似度由高到低的顺序,依次判断与所述文字对应的拼音和与所述文字对应的至少一个相似拼音中,是否存在与所述字典树中的拼音相匹配的拼音;
所述获取模块,还用于若存在与所述字典树中的拼音相匹配的拼音,根据所述映射关系表获取所述相匹配的拼音对应的文字。
10.根据权利要求6-9任一项所述的语音输入匹配装置,其特征在于,
所述生成单元,用于对所述文字的发音进行平翘舌处理,生成所述文字对应的相似拼音;和/或
所述生成单元,用于对所述文字的发音进行鼻边音处理,生成所述文字对应的相似拼音;和/或
所述生成单元,用于对所述文字的发音进行混淆声母处理,生成所述文字对应的相似拼音;和/或
所述生成单元,用于对所述文字的发音进行混淆韵母处理,生成所述文字对应的相似拼音。
CN201310248487.0A 2013-06-21 2013-06-21 语音输入匹配方法及装置 Active CN104238991B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201310248487.0A CN104238991B (zh) 2013-06-21 2013-06-21 语音输入匹配方法及装置
PCT/CN2013/090468 WO2014201834A1 (en) 2013-06-21 2013-12-25 Method and device of matching speech input to text
US14/164,075 US9437192B2 (en) 2013-06-21 2014-01-24 Method and device of matching speech input to text

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310248487.0A CN104238991B (zh) 2013-06-21 2013-06-21 语音输入匹配方法及装置

Publications (2)

Publication Number Publication Date
CN104238991A CN104238991A (zh) 2014-12-24
CN104238991B true CN104238991B (zh) 2018-05-25

Family

ID=52103882

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310248487.0A Active CN104238991B (zh) 2013-06-21 2013-06-21 语音输入匹配方法及装置

Country Status (3)

Country Link
US (1) US9437192B2 (zh)
CN (1) CN104238991B (zh)
WO (1) WO2014201834A1 (zh)

Families Citing this family (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104750454B (zh) * 2015-03-24 2018-05-01 广东欧珀移动通信有限公司 一种控制音箱的方法及装置
CN105096944B (zh) * 2015-07-20 2017-11-03 百度在线网络技术(北京)有限公司 语音识别方法及装置
CN105161099B (zh) * 2015-08-12 2019-11-26 恬家(上海)信息科技有限公司 一种语音控制的遥控装置及其实现方法
CN105206274A (zh) * 2015-10-30 2015-12-30 北京奇艺世纪科技有限公司 一种语音识别的后处理方法及装置和语音识别系统
CN106683677B (zh) * 2015-11-06 2021-11-12 阿里巴巴集团控股有限公司 语音识别方法及装置
CN106205617A (zh) * 2016-06-28 2016-12-07 张和伟 一种计算机智能输入装置
CN106297799A (zh) * 2016-08-09 2017-01-04 乐视控股(北京)有限公司 语音识别处理方法及装置
CN106503033B (zh) * 2016-09-14 2021-03-19 国网山东省电力公司青岛供电公司 一种配电网工单地址的检索方法和装置
CN106548777B (zh) * 2016-11-25 2020-11-10 北京光年无限科技有限公司 一种用于智能机器人的数据处理方法及装置
CN108234735A (zh) * 2016-12-14 2018-06-29 中兴通讯股份有限公司 一种媒体显示方法及终端
CN107180084B (zh) * 2017-05-05 2020-04-21 上海木木聚枞机器人科技有限公司 词库更新方法及装置
CN107274894A (zh) * 2017-05-19 2017-10-20 杭州仁盈科技股份有限公司 一种提高嘈杂环境下语音识别率的方法
CN107273359A (zh) * 2017-06-20 2017-10-20 北京四海心通科技有限公司 一种文本相似度确定方法
CN107992523B (zh) * 2017-11-07 2020-07-03 中国平安人寿保险股份有限公司 移动应用的功能选项查找方法及终端设备
CN108597499B (zh) * 2018-04-02 2020-09-25 联想(北京)有限公司 语音处理方法以及语音处理装置
CN109741749B (zh) * 2018-04-19 2020-03-27 北京字节跳动网络技术有限公司 一种语音识别的方法和终端设备
CN109213994A (zh) * 2018-07-26 2019-01-15 深圳市元征科技股份有限公司 信息匹配方法及装置
CN109377993A (zh) * 2018-10-12 2019-02-22 上海庆科信息技术有限公司 智能语音系统及其语音唤醒方法及智能语音设备
CN109325105B (zh) * 2018-11-23 2021-06-29 泰康保险集团股份有限公司 代码匹配方法、装置及存储介质
CN109671436A (zh) * 2018-12-07 2019-04-23 陈包容 智能语音识别通讯录联系人人名的方法
CN111325194B (zh) * 2018-12-13 2023-12-29 杭州海康威视数字技术股份有限公司 一种文字识别方法、装置及设备、存储介质
CN109963022A (zh) * 2018-12-27 2019-07-02 广州云趣信息科技有限公司 一种基于soundex算法的语音电话本找人方法及流程
US11017771B2 (en) * 2019-01-18 2021-05-25 Adobe Inc. Voice command matching during testing of voice-assisted application prototypes for languages with non-phonetic alphabets
US10964322B2 (en) 2019-01-23 2021-03-30 Adobe Inc. Voice interaction tool for voice-assisted application prototypes
CN109947955A (zh) * 2019-03-21 2019-06-28 深圳创维数字技术有限公司 语音搜索方法、用户设备、存储介质及装置
CN110097880A (zh) * 2019-04-20 2019-08-06 广东小天才科技有限公司 一种基于语音识别的答题判定方法及装置
CN110033769B (zh) * 2019-04-23 2022-09-06 施永兵 一种录入语音处理方法、终端及计算机可读存储介质
CN110428839B (zh) * 2019-07-22 2022-05-31 深圳市同洲电子股份有限公司 一种基于语音识别的内容匹配方法
KR20210016767A (ko) * 2019-08-05 2021-02-17 삼성전자주식회사 음성 인식 방법 및 음성 인식 장치
CN111182161A (zh) * 2019-10-15 2020-05-19 腾讯科技(深圳)有限公司 一种社区通讯方法、装置、设备及存储介质
CN110970026A (zh) * 2019-12-17 2020-04-07 用友网络科技股份有限公司 语音交互匹配方法、计算机设备以及计算机可读存储介质
CN111369980B (zh) * 2020-02-27 2023-06-02 网易有道信息技术(江苏)有限公司 语音检测方法、装置、电子设备及存储介质
CN111414366A (zh) * 2020-03-26 2020-07-14 Tcl移动通信科技(宁波)有限公司 一种联系人保存及查找的方法
CN113539247B (zh) * 2020-04-14 2024-06-18 京东科技控股股份有限公司 语音数据处理方法、装置、设备及计算机可读存储介质
CN112185356A (zh) * 2020-09-29 2021-01-05 北京百度网讯科技有限公司 语音识别方法、装置、电子设备以及存储介质
CN112364212A (zh) * 2020-11-04 2021-02-12 北京致远互联软件股份有限公司 一种基于近似音识别的语音人名识别方法
CN113051923B (zh) * 2021-04-22 2023-03-21 平安普惠企业管理有限公司 数据验证方法、装置、计算机设备和存储介质
CN113326279A (zh) 2021-05-27 2021-08-31 阿波罗智联(北京)科技有限公司 语音搜索方法和装置、电子设备、计算机可读介质
CN113932518B (zh) * 2021-06-02 2023-08-18 海信冰箱有限公司 冰箱及其食材管理方法
CN113360623A (zh) * 2021-06-25 2021-09-07 达闼机器人有限公司 一种文本匹配方法、电子设备及可读存储介质
CN114049890A (zh) * 2021-11-03 2022-02-15 杭州逗酷软件科技有限公司 语音控制方法、装置以及电子设备
CN114758649B (zh) * 2022-04-06 2024-04-19 北京百度网讯科技有限公司 一种语音识别方法、装置、设备和介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101067780A (zh) * 2007-06-21 2007-11-07 腾讯科技(深圳)有限公司 智能设备的文字输入系统及方法
CN101206859A (zh) * 2007-11-30 2008-06-25 清华大学 语音点歌方法
CN101576901A (zh) * 2009-06-11 2009-11-11 腾讯科技(深圳)有限公司 搜索请求的产生方法及移动通信设备

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8249873B2 (en) * 2005-08-12 2012-08-21 Avaya Inc. Tonal correction of speech
US20080046824A1 (en) * 2006-08-16 2008-02-21 Microsoft Corporation Sorting contacts for a mobile computer device
US8024319B2 (en) * 2007-01-25 2011-09-20 Microsoft Corporation Finite-state model for processing web queries
US8365071B2 (en) * 2007-08-31 2013-01-29 Research In Motion Limited Handheld electronic device and associated method enabling phonetic text input in a text disambiguation environment and outputting an improved lookup window
CN101655837B (zh) * 2009-09-08 2010-10-13 北京邮电大学 一种对语音识别后文本进行检错并纠错的方法
US8706472B2 (en) * 2011-08-11 2014-04-22 Apple Inc. Method for disambiguating multiple readings in language conversion
CN102750267B (zh) * 2012-06-15 2015-02-25 北京语言大学 汉语音字转换方法及系统、区分性词典的构建方法
WO2014000267A1 (en) * 2012-06-29 2014-01-03 Microsoft Corporation Cross-lingual input method editor

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101067780A (zh) * 2007-06-21 2007-11-07 腾讯科技(深圳)有限公司 智能设备的文字输入系统及方法
CN101206859A (zh) * 2007-11-30 2008-06-25 清华大学 语音点歌方法
CN101576901A (zh) * 2009-06-11 2009-11-11 腾讯科技(深圳)有限公司 搜索请求的产生方法及移动通信设备

Also Published As

Publication number Publication date
CN104238991A (zh) 2014-12-24
WO2014201834A1 (en) 2014-12-24
US20140379335A1 (en) 2014-12-25
US9437192B2 (en) 2016-09-06

Similar Documents

Publication Publication Date Title
CN104238991B (zh) 语音输入匹配方法及装置
US8909536B2 (en) Methods and systems for speech-enabling a human-to-machine interface
US20230072352A1 (en) Speech Recognition Method and Apparatus, Terminal, and Storage Medium
CN109086303A (zh) 基于机器阅读理解的智能对话方法、装置、终端
US20140081643A1 (en) System and method for determining expertise through speech analytics
US20060025999A1 (en) Predicting tone pattern information for textual information used in telecommunication systems
CN106372059A (zh) 信息输入方法和装置
CN105469789A (zh) 一种语音信息的处理方法及终端
CN109256125B (zh) 语音的离线识别方法、装置与存储介质
JP2022540784A (ja) 自然言語理解フレームワークでの発言についての複数意味表現の導出
CN107977238A (zh) 应用启动方法及装置
CN106356057A (zh) 一种基于计算机应用场景语义理解的语音识别系统
CN110555440B (zh) 一种事件抽取方法及装置
CN108268637A (zh) 一种智能语音矫正识别方法、装置和用户终端
CN107967333A (zh) 语音搜索方法、语音搜索装置及电子设备
CN112579733B (zh) 规则匹配方法、规则匹配装置、存储介质及电子设备
US20160335267A1 (en) Method and apparatus for natural language search for variables
CN108345612A (zh) 一种问题处理方法和装置、一种用于问题处理的装置
KR20150041592A (ko) 피호출자의 전자 디바이스에서 연락처 정보를 업데이트하는 방법 및 전자 디바이스
CN108121455A (zh) 识别纠正方法及装置
CN110347901A (zh) 一种搜索方法以及一种应用该方法的电子装置
CN110246494A (zh) 基于语音识别的服务请求方法、装置及计算机设备
CN108595141A (zh) 语音输入方法及装置、计算机装置和计算机可读存储介质
CN110309252A (zh) 一种自然语言处理方法及装置
CN104243666B (zh) 语言处理方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant