CN102999639B - 一种基于语音识别字符索引的查找方法及系统 - Google Patents
一种基于语音识别字符索引的查找方法及系统 Download PDFInfo
- Publication number
- CN102999639B CN102999639B CN201310001330.8A CN201310001330A CN102999639B CN 102999639 B CN102999639 B CN 102999639B CN 201310001330 A CN201310001330 A CN 201310001330A CN 102999639 B CN102999639 B CN 102999639B
- Authority
- CN
- China
- Prior art keywords
- speech recognition
- character
- user
- speech
- event
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Machine Translation (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明公开了一种基于语音识别字符索引的查找方法和系统。该方法包括如下步骤:用户语音输入基本字符,识别出用户读出的各个基本字符组合的语音,转译成基本字符组合文本索引,并进一步转译成标准的按键事件、触屏事件或用户识别的自定义事件,通过标准的事件传递函数传递给需要进行查找的应用场景或界面,实现语音识别字符索引的查找。该系统包括语音识别引擎服务装置,用于识别用户语音输入的基本字符,以作为语音识别的字符索引;读取转译装置,转译识别装置和匹配装置。本发明实现了语音识别字符索引的快速查找功能。
Description
技术领域
本发明涉及移动通信领域,尤其涉及一种基于语音识别字符索引的快速查找方法及系统。
背景技术
随着移动通信领域技术的不断发展和成熟,在日益普及的移动终端中,特别是智能终端中软件功能越来越丰富,用户的个性化需求越来越多。但随着移动操作系统和硬件平台的日趋统一,软件功能的同质化也日趋严重。不断创新引入语音识别等新的交互方式成为保持终端产品竞争力的重要途径。
语音识别作为一种新的、重要的用户交互技术在移动终端中的应用越来越广泛。随着语音识别技术的不断发展和云端语音服务器的引入,语音识别率有了很大提升,但从目前移动终端中已推出的语音产品的实际性能看,使用效果并不理想,技术还没有完全成熟。特别是存在因为用户使用习惯、地域的不同,语言发音不用,国别不同等识别误差范围较大,准确率不高的问题。同时,依靠云端语音服务器的自然语言解析方式,依赖于网络,需要大量的数据交互操作,会引起用户网络流量的费用问题,而且当网络状态不好时,识别率会很低,用户使用场景受限。
号码查找功能是移动终端中的一项十分重要的,核心的功能。就目前已上市的产品来说,号码查找功能都是通过键盘或触屏虚拟键盘输入联系人名称或号码相关信息进行查找匹配,不支持通过语音识别进行字符索引快速查找的功能。
因此,为了弥补上述技术的不足,本发明提出一种新的,基于语音识别字符索引的快速查找方法及系统。
发明内容
为了克服现有技术中存在的缺陷或不足,本发明提供了一种基于语音识别字符索引的查找方法及系统。
为解决上述技术问题,本发明提供的技术方案为:一种基于语音识别字符索引的查找方法,该方法包括如下步骤:
用户语音输入基本字符,识别出用户读出的各个基本字符组合的语音,转译成基本字符组合文本索引,并进一步转译成标准的按键事件、触屏事件或用户识别的自定义事件,通过标准的事件传递函数传递给需要进行查找的应用场景或界面,实现语音识别字符索引的查找。
本发明还提供了一种基于语音识别字符索引的查找方法,该方法具体包括如下步骤:
步骤11:语音识别引擎服务启动;
步骤12:用户语音输入基本字符,作为语音识别的字符索引;
步骤13:语音识别引擎服务接收到用户语音后,读取语音特征库,遍历,获取与用户语音输入基本字符相匹配的语音特征文件,并将识别出的语音转译成文本字符;
步骤14:将上述文本字符转移为标准的按键或触屏事件或用户识别的自定义事件,调用标准的事件传递函数,传递给当前的快速查找应用场景或应用;
步骤15:进行文本字符模糊匹配,将匹配的结果信息通过界面或其他形式反馈给用户,提示用户当前的匹配状态;如果匹配结束或匹配结果为空,查找方法结束,执行步骤12;否则,转到步骤16;
步骤16:用户再次语音输入基本字符,转到步骤13。
优选的,语音识别引擎服务通过状态栏图标或者通知栏通知消息提示用户语音识别服务当前的状态,以此确认当前是否支持基于语音识别字符索引的快速查找功能。
优选的,步骤15中,如果匹配结束或匹配结果为空,查找方法结束后,执行步骤12前,还包括如下步骤:一段时间内没有执行步骤12,语音识别引擎服务休眠或关闭,该一段时间的长度由用户根据实际需求分等级设定。
优选的,语音识别的语音特征库包含各个基本字符的语音特征文件:字母A-Z,数字0~9,特殊符号*#+。
本发明还提供了一种基于语音识别字符索引的查找系统,该系统包括:
语音识别引擎服务装置,用于识别用户语音输入的基本字符,以作为语音识别的字符索引;
读取转译装置,用于读取语音特征库,遍历,获取与语音识别引擎服务装置识别的语音输入的基本字符匹配的语音特征文件,并将识别出的语音转译成文本字符;
转译识别装置,用于将上述文本字符转译为标准的按键或触屏事件或用户识别的自定义事件,调用标准的事件传递函数,传递给当前的快速查找应用场景或应用;
匹配装置,用于进行文本字符模糊匹配,将匹配的结果信息通过界面或其他形式反馈给用户,提示用户当前的匹配状态。
优选的,语音识别的语音特征库包含各个基本字符的语音特征文件:字母A-Z,数字0~9,特殊符号*#+。
本发明的有益效果在于:
1.本发明涉及的号码查找算法是基于基本字符语音特征库的,语音识别的计算量较小,识别准确率高,速度快,设计实现更简单,占用系统资源更少。
2.本发明涉及的号码查找算法通过将基本字符的语音转译成文本字符,并进一步转译成标准按键或触屏事件的方法,一方面引入了一种基于语音识别的新的号码查找的交互方式,另一方面该方法可以同按键和触屏等传统触碰式交互方式一起工作,互不影响,优势互补。
3.本发明涉及的号码查找算法基于语音识别,对于在比如高空作业、震动环境、有操作障碍等对按键或触屏等直接触控不方便的应用场景更为方便。
附图说明
图1为本发明提供的语音识别字符索引查找转译流程示意图。
图2为本发明提供的语音识别字符索引查找一个实施例的流程示意图。
图3为本发明提供的语音识别字符索引字符匹配一个实施例的流程示意图。
具体实施方式
下面结合附图对本发明做进一步说明。
本发明的核心思想是利用语音识别技术中对各个语言基本字符识别高效、准确、多种语言通用化的特点,应用语音识别技术识别出用户读出的各个基本字符组合的语音,转译成基本字符文本索引,并进一步转译成标准的按键事件、触屏事件或用户可以识别的自定义事件,通过标准的事件传递函数传递给需要进行快速查找的应用场景或界面,实现语音识别字符索引的快速查找功能。
字符索引的引入,用户可以根据实际需求自由组合基本字符作为字符索引,弥补了直接命令式语音操作的可扩展性差的问题。直接命令式的语音操作要扩展操作命令必须扩展直接命令语音库,这样会增加对用户存储空间和内存的使用,同时由于语音库的增加,遍历解析特定语音命令的响应时间会线性增加,会导致相应的语音操作越来越慢。
字符索引的引入,使得语音库只需要提供基本字符的语音特征文件,通过自由组合,在不需要云端语音识别服务器的前提下,理论上可以高准确率实现几乎所有可能的快速查找命令。同时字符索引的响应时间不会因快速查找命令数量的增加而线性增加。可以很好的满足在云端语音识别服务无法获取的情况下的语音识别的快速查找操作。
因为是基本字符范围的语音识别,所以语言的通用性相对较好,在没有相应多语言语音库时也可以工作。比如在只有英文字母的语音库时,同样可以实现通过汉语中对拼音的识别和使用。这对实现语音识别的查找或排序提供了便利。
当然,可以必须看到字符索引方式不是用户习惯的自然语言交互方式,需要依据预设规则记忆命令集。所以语音识别字符索引不能太多太复杂,层级不能太深。
基于语音识别字符索引的快速查找方法对于有操作障碍,提供了一种可以实现无障碍沟通的方便有效的方法。
本发明的一个优先实例的技术方案为:
1.本发明的语音识别的词汇表范围包含各个基本字符集:字母A-Z,数字0~9,特殊符号*#+。基本字符集同当前选择的语言相对应,由当前语言包含的基本字符集决定。用户可以根据实际需求配置裁剪。
2.本发明的语音识别的语音库包含各个基本字符的语音特征文件:字母A-Z,数字0~9,特殊符号*#+。
3.本发明可以通过一定的预设规则建立基本字符组合和各个查找应用场景的映关系。
4.本发明组成字符索引的字符个数不受限制,本发明推荐的个数是小于等于3个字符,以保证索引菜单命令的简单性。
5.本发明的语音字符索引通过转译为字符文本,并进一步转译为标准按键或触屏事件或用户可识别的自定义事件,调用标准的事件传递函数传递到快速查找的应用场景。
6.本发明的语音识别引擎服务的可以在开机过程中启动,或者通过任何快捷方式启动。
7.本发明的语音识别引擎服务可以通过状态栏图标或者通知栏通知消息提示用户语音识别服务当前的状态。以确认当前是否支持语音识别字符索引快速查找功能。
8.本发明的语音识别引擎服务当快速查找操作完成后一段时间内没有下一次的快速查找操作时,会自动休眠或关闭。时间长度可以由用户根据实际需求分等级设定。
参阅图1,本发明涉及的语音识别字符索引转译流程示意图。
字符索引转译流程核心步骤说明如下:
步骤11:语音识别引擎服务启动。
步骤12:用户语音输入基本字符,作为语音识别的字符索引。
步骤13:语音识别引擎服务接收到用户语音后,读取语音特征库,遍历,获取与用户语音输入基本字符匹配的语音特征文件,并将识别出的语音转译成文本字符。
步骤14:进一步将文本字符转移为标准的按键或触屏事件或用户可以识别的自定义事件,调用标准的事件传递函数,传递给当前的快速查找应用场景或应用。
步骤15:进行文本字符模糊匹配,将匹配的结果信息通过界面或其他形式反馈给用户,提示用户当前的匹配状态。如果匹配结束或匹配结果为空,快速查找流程结束。否则,转到步骤16.
步骤16:用户再次语音输入文本字符,转到步骤13。
参阅图2,本发明涉及的语音识别字符索引快速查找流程示意图。
下面以移动终端中电话本应用的号码查找为例说明。核心步骤说明如下:
步骤21:语音输入电话本索引菜单,进入到联系人列表界面。
步骤22:查找名字为BCB的联系人。
步骤23:用户语音输入B,输出首字母为B的联系人列表。如果查找结果为空,转到步骤26。
步骤24:用户语音输入C,输出前两个字母为BC的联系人列表。如果查找结果为空,转到步骤26。
步骤25:用户语音输入B,输出名字为BCB的联系人列表。如果查找结果为空,转到步骤26。
步骤26:查找操作完成。
参阅图3,语音识别字符索引号码匹配流程示意图。
联系人/号码匹配规则说明:首字母匹配规则,中文拼音首字母规则,大小写字母模糊匹配规则等。
号码匹配流程核心步骤说明如下:
步骤31:用户语音输入的字符转译为标准事件。
步骤32:如果为数字,转到步骤33,否则转到步骤34。
步骤33:进行号码匹配。
步骤34:进行名字匹配。
步骤35:显示匹配的结果。如果匹配结果为空,匹配结束。否则转到步骤31。
语音识别引擎服务会对能耗造成影响,所以需要考虑使用场景的设定和超时处理。本发明的一个实施方案类似屏幕背光的处理,当索引菜单操作后一段时间内没有下一次的所以操作,自动休眠或关闭。时间长度可以由用户根据实际需求分等级设定。
可能的应用场景举例:
拨号盘界面:语音输入号码,同时显示号码或名字匹配的联系人;
联系人列表界面快速查找;
任何应用界面快速查找联系人或号码。比如待机界面快速查找联系人。
本文出现的一些具有特定名称的实体/设备/装置/单元同样可以用具有相同或类似功能的实体/设备/装置/单元代替,不再赘述。
本发明还提供了一种基于语音识别字符索引的查找系统,该系统包括:
语音识别引擎服务装置,用于识别用户语音输入的基本字符,以作为语音识别的字符索引;
读取转译装置,用于读取语音特征库,遍历,获取与语音识别引擎服务装置识别的语音输入的基本字符匹配的语音特征文件,并将识别出的语音转译成文本字符;
转译识别装置,用于将上述文本字符转译为标准的按键或触屏事件或用户识别的自定义事件,调用标准的事件传递函数,传递给当前的快速查找应用场景或应用;
匹配装置,用于进行文本字符模糊匹配,将匹配的结果信息通过界面或其他形式反馈给用户,提示用户当前的匹配状态。
语音识别的语音特征库包含各个基本字符的语音特征文件:字母A-Z,数字0~9,特殊符号*#+
本发明的方法应用范围包含移动通信领域但不限于移动通信领域,不应理解为对本发明方法应用范围的限制。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.一种基于语音识别字符索引的查找方法,其特征在于,该方法包括如下步骤:
用户语音输入基本字符,识别出用户读出的各个基本字符组合的语音,转译成基本字符组合文本索引,并进一步转译成标准的按键事件、触屏事件或用户识别的自定义事件,通过标准的事件传递函数传递给需要进行查找的应用场景或界面,实现语音识别字符索引的查找。
2.根据权利要求1所述的基于语音识别字符索引的查找方法,其特征在于,该方法具体包括如下步骤:
步骤11:语音识别引擎服务启动;
步骤12:用户语音输入基本字符,作为语音识别的字符索引;
步骤13:语音识别引擎服务接收到用户语音后,读取语音特征库,遍历,获取与用户语音输入基本字符相匹配的语音特征文件,并将识别出的语音转译成文本字符;
步骤14:将上述文本字符转移为标准的按键或触屏事件或用户识别的自定义事件,调用标准的事件传递函数,传递给当前的快速查找应用场景或应用;
步骤15:进行文本字符模糊匹配,将匹配的结果信息通过界面或其他形式反馈给用户,提示用户当前的匹配状态;如果匹配结束或匹配结果为空,查找方法结束,执行步骤12;否则,转到步骤16;
步骤16:用户再次语音输入基本字符,转到步骤13。
3.根据权利要求2所述的基于语音识别字符索引的查找方法,其特征在于,语音识别引擎服务通过状态栏图标或者通知栏通知消息提示用户语音识别服务当前的状态,以此确认当前是否支持基于语音识别字符索引的快速查找功能。
4.根据权利要求2所述的基于语音识别字符索引的查找方法,其特征在于,步骤15中,如果匹配结束或匹配结果为空,查找方法结束后,执行步骤12前,还包括如下步骤:一段时间内没有执行步骤12,语音识别引擎服务休眠或关闭,该一段时间的长度由用户根据实际需求分等级设定。
5.根据权利要求2所述的基于语音识别字符索引的查找方法,其特征在于,语音识别的语音特征库包含各个基本字符的语音特征文件:字母A-Z,数字0~9,特殊符号*#+。
6.一种基于语音识别字符索引的查找系统,其特征在于,该系统包括:
语音识别引擎服务装置,用于识别用户语音输入的基本字符,以作为语音识别的字符索引;
读取转译装置,用于读取语音特征库,遍历,获取与语音识别引擎服务装置识别的语音输入的基本字符匹配的语音特征文件,并将识别出的语音转译成文本字符;
转译识别装置,用于将上述文本字符转译为标准的按键或触屏事件或用户识别的自定义事件,调用标准的事件传递函数,传递给当前的快速查找应用场景或应用;
匹配装置,用于进行文本字符模糊匹配,将匹配的结果信息通过界面或其他形式反馈给用户,提示用户当前的匹配状态。
7.根据权利要求6所述的基于语音识别字符索引的查找系统,其特征在于,语音识别的语音特征库包含各个基本字符的语音特征文件:字母A-Z,数字0~9,特殊符号*#+。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310001330.8A CN102999639B (zh) | 2013-01-04 | 2013-01-04 | 一种基于语音识别字符索引的查找方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310001330.8A CN102999639B (zh) | 2013-01-04 | 2013-01-04 | 一种基于语音识别字符索引的查找方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102999639A CN102999639A (zh) | 2013-03-27 |
CN102999639B true CN102999639B (zh) | 2015-12-09 |
Family
ID=47928205
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310001330.8A Active CN102999639B (zh) | 2013-01-04 | 2013-01-04 | 一种基于语音识别字符索引的查找方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102999639B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104462262B (zh) * | 2014-11-21 | 2017-10-31 | 北京奇虎科技有限公司 | 一种实现语音搜索的方法、装置和浏览器客户端 |
CN106372203A (zh) * | 2016-08-31 | 2017-02-01 | 北京智能管家科技有限公司 | 一种智能终端的信息响应方法、装置和智能终端 |
CN106407393B (zh) * | 2016-09-19 | 2020-01-31 | 北京儒博科技有限公司 | 一种用于智能设备的信息处理方法及装置 |
JP6618884B2 (ja) * | 2016-11-17 | 2019-12-11 | 株式会社東芝 | 認識装置、認識方法およびプログラム |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1960410A (zh) * | 2006-09-25 | 2007-05-09 | 宇龙计算机通信科技(深圳)有限公司 | 移动终端的联系人定位方法 |
CN101340672A (zh) * | 2008-06-20 | 2009-01-07 | 宇龙计算机通信科技(深圳)有限公司 | 一种联系人查找方法、系统及移动终端 |
CN101369215A (zh) * | 2008-09-28 | 2009-02-18 | 宇龙计算机通信科技(深圳)有限公司 | 一种联系人定位方法、系统及移动终端 |
CN102081634A (zh) * | 2009-11-27 | 2011-06-01 | 株式会社理光 | 语音检索装置和语音检索方法 |
CN102246587A (zh) * | 2008-12-16 | 2011-11-16 | 摩托罗拉移动公司 | 逐步细化基于语音的搜索 |
CN102830790A (zh) * | 2012-08-03 | 2012-12-19 | 青岛海信信芯科技有限公司 | 移动式电子设备及其自动休眠的方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ATE342563T1 (de) * | 2003-01-29 | 2006-11-15 | Harman Becker Automotive Sys | Verfahren und vorrichtung zur einschränkung des suchumfangs in einem lexikon für spracherkennung |
-
2013
- 2013-01-04 CN CN201310001330.8A patent/CN102999639B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1960410A (zh) * | 2006-09-25 | 2007-05-09 | 宇龙计算机通信科技(深圳)有限公司 | 移动终端的联系人定位方法 |
CN101340672A (zh) * | 2008-06-20 | 2009-01-07 | 宇龙计算机通信科技(深圳)有限公司 | 一种联系人查找方法、系统及移动终端 |
CN101369215A (zh) * | 2008-09-28 | 2009-02-18 | 宇龙计算机通信科技(深圳)有限公司 | 一种联系人定位方法、系统及移动终端 |
CN102246587A (zh) * | 2008-12-16 | 2011-11-16 | 摩托罗拉移动公司 | 逐步细化基于语音的搜索 |
CN102081634A (zh) * | 2009-11-27 | 2011-06-01 | 株式会社理光 | 语音检索装置和语音检索方法 |
CN102830790A (zh) * | 2012-08-03 | 2012-12-19 | 青岛海信信芯科技有限公司 | 移动式电子设备及其自动休眠的方法 |
Also Published As
Publication number | Publication date |
---|---|
CN102999639A (zh) | 2013-03-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4184567B2 (ja) | 予測エディタアプリケーションを有する通信ターミナル | |
CN101256462B (zh) | 基于全混合联想库的手写输入方法和装置 | |
AU2013270485C1 (en) | Input processing method and apparatus | |
CN101876878A (zh) | 单词预测输入系统及方法 | |
US20070157122A1 (en) | Communication Terminal Having A Predictive Editor Application | |
CN103037072A (zh) | 一种短信内容提取到场景应用的实现方法 | |
US9996586B2 (en) | Method and device for searching for contact object, and storage medium | |
CN102830924B (zh) | 一种调整输入法键盘的方法及装置 | |
WO2013170680A1 (zh) | Android系统快速匹配拨号的方法及其移动终端 | |
CN111490927B (zh) | 一种显示消息的方法、装置及设备 | |
CN103019530B (zh) | 基于手势识别的索引菜单的方法、装置及其终端 | |
CN103049571A (zh) | 基于语音识别的索引菜单的方法、装置及其终端 | |
CN101741948A (zh) | 信息收件人实现输入数字自动匹配联系人的方法 | |
CN101923401A (zh) | 一种电子设备输入方法 | |
CN107885826A (zh) | 多媒体文件播放方法、装置、存储介质及电子设备 | |
CN101287026A (zh) | 利用手写识别功能执行快捷拨号的系统和方法 | |
CN102999639B (zh) | 一种基于语音识别字符索引的查找方法及系统 | |
US20100149190A1 (en) | Method, apparatus and computer program product for providing an input order independent character input mechanism | |
CN103428341A (zh) | 手机联系人的搜索方法和装置 | |
CN103020306A (zh) | 一种基于手势识别字符索引的查找方法及系统 | |
CN101727204A (zh) | 一种通信终端上的文字输入系统、方法及通信终端 | |
CN1331027C (zh) | 汉字字符辅助输入方法及装置 | |
CN101887346A (zh) | 一种信息输入控制方法、装置及通信终端 | |
CN101616201A (zh) | 一种复杂通讯意图选择无缝切换系统 | |
KR101118530B1 (ko) | 스크린 또는 디지털 키패드에서의 스마트 문자 입력 시스템 및 문자 입력 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: A District No. 9018 Han innovation building in Nanshan District high tech Zone in Shenzhen city of Guangdong Province, North Central Avenue, 518000 floor 10 Applicant after: Nubian Technologies Ltd. Address before: A District No. 9018 Han innovation building in Nanshan District high tech Zone in Shenzhen city of Guangdong Province, North Central Avenue, 518000 floor 10 Applicant before: Shenzhen ZTE Mobile Tech Co., Ltd. |
|
COR | Change of bibliographic data | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |