CN105225665A - 一种语音识别方法及语音识别装置 - Google Patents
一种语音识别方法及语音识别装置 Download PDFInfo
- Publication number
- CN105225665A CN105225665A CN201510666620.3A CN201510666620A CN105225665A CN 105225665 A CN105225665 A CN 105225665A CN 201510666620 A CN201510666620 A CN 201510666620A CN 105225665 A CN105225665 A CN 105225665A
- Authority
- CN
- China
- Prior art keywords
- user
- information
- identification result
- voice identification
- acoustic information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种语音识别方法及语音识别装置,语音识别方法包括:录入用户的声音信息;获取用户所在的位置信息,并分析录入声音信息的特性以获取用户的场景信息;根据用户所在的位置信息确定对应的区域信息,并调用与该区域信息对应的语音数据库和语法数据库,对用户的声音信息进行识别,得到第一语音识别结果;根据用户的场景信息匹配语法模型或语言模型,并进行模式匹配算法对用户的声音信息进行识别,得到第二语音识别结果;对所述第一语音识别结果和所述第二语音识别结果进行整合,得到最终的语音识别结果,并输出该语音识别结果。通过本发明,能够根据声音信息所处的区域信息和场景信息,对声音信息进行识别,提高语音识别的准确性。
Description
技术领域
本发明涉及语音识别技术领域,具体涉及一种语音识别方法及语音识别装置。
背景技术
随着语音识别技术的发展进步,越来越多的设备(比如电视机、空调器等家用电器)可通过语音控制来执行相应的功能;比如,受控设备检测到语音控制指令时,可以根据检测到的语音控制指令来执行相应的操作。而语音识别技术很容易受到嘈杂的人声以及其它环境噪音的影响,且语音识别的准确率直接与环境噪音相关,比如当环境噪音较小时,语音识别率较高,但是当环境噪音很大或者周围一群人高声说话时,语音识别效果将会变得很差,甚至受控设备不能识别到对应的语音指令。
另外,对于不同地区的人,说话语音也会有所差别,这些因素都需要考虑,否则,也会影响到语音识别的准确性。
发明内容
本发明所要解决的技术问题是提供一种语音识别方法及语音识别装置,能够提高语音识别的准确性。
本发明解决上述技术问题的技术方案如下:
基于本发明的一个方面,提供了一种语音识别方法,所述方法包括:
S1、录入用户的声音信息;
S2、获取用户所在的位置信息,并分析录入声音信息的特性以获取用户的场景信息;
S3a、根据用户所在的位置信息确定对应的区域信息,并调用与该区域信息对应的语音数据库和语法数据库,对用户的声音信息进行识别,得到第一语音识别结果;
S3b、根据用户的场景信息匹配语法模型或语言模型,并进行模式匹配算法对用户的声音信息进行识别,得到第二语音识别结果;
S4、对所述第一语音识别结果和所述第二语音识别结果进行整合,得到最终的语音识别结果,并输出该语音识别结果。
基于本发明的另一个方面,提供了一种语音识别装置,所述装置包括:
录入模块,用于录入用户的声音信息;
位置信息获取模块,用于获取用户所在的位置信息;
场景信息获取模块,用于分析录入声音信息的特性以获取用户的场景信息;
第一识别模块,用于根据用户所在的位置信息确定对应的区域信息,并调用与该区域信息对应的语音数据库和语法数据库,对用户的声音信息进行识别,得到第一语音识别结果;
第二识别模块,用于根据用户的场景信息匹配语法模型或语言模型,并进行模式匹配算法对用户的声音信息进行识别,得到第二语音识别结果;
结果输出模块,用于对所述第一语音识别结果和所述第二语音识别结果进行整合,得到最终的语音识别结果,并输出该语音识别结果。
本发明提供的一种语音识别方法及语音识别装置,根据用户所在的位置信息确定对应的区域信息,并对录入的用户的声音信息进行分析以获取用户的场景信息,根据用户的区域信息和场景信息,分别对用户的声音信息进行语音识别,得到第一语音识别结果和第二语音识别结果,最后对两个识别结果进行整合,得到最终的语音识别结果并输出,本发明能够根据声音信息所处的区域信息和场景信息,对声音信息进行识别,提高语音识别的准确性。
附图说明
图1为本发明实施例1的一种语音识别方法流程图;
图2为本发明实施例2的一种语音识别装置示意图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
实施例1、一种语音识别方法。以下结合图1对本实施例提供的方法进行详细说明。
参见图1,本实施例提供的方法包括:
S1、录入用户的声音信息;
S2、获取用户所在的位置信息,并分析录入声音信息的特性以获取用户的场景信息;
S3a、根据用户所在的位置信息确定对应的区域信息,并调用与该区域信息对应的语音数据库和语法数据库,对用户的声音信息进行识别,得到第一语音识别结果;
S3b、根据用户的场景信息匹配语法模型或语言模型,并进行模式匹配算法对用户的声音信息进行识别,得到第二语音识别结果;
S4、对所述第一语音识别结果和所述第二语音识别结果进行整合,得到最终的语音识别结果,并输出该语音识别结果。
其中,所述获取用户的位置信息为用户所在移动终端自动检测得到的地理信息或者GPS定位信息,所述用户的场景信息为用户交互过程中的场景变化数据。
本实施例提供的方法还包括:为每一个区域信息建立对应的语音数据库和语法数据库,其中,每一个语法数据库中均有对应的语法文件。所述步骤S3a具体包括:根据区域信息,调用对应的语法数据库,并调用所述语法数据库中的语法文件,根据所述语法文件和语音数据库,对用户的声音信息进行识别,得到第一语音识别结果。
另外,对用户的声音信息开始识别时进行计时,对用户的声音信息识别结束时停止计时,记录对用户的声音信息识别的时间。
实施例2、一种语音识别装置。以下结合图2对本实施例提供的装置进行详细描述。
参见图2,本实施例提供的语音识别装置包括录入模块21、位置信息获取模块22、场景信息获取模块23、第一识别模块24、第二识别模块25和结果输出模块25。
其中,录入模块21,用于录入用户的声音信息。
位置信息获取模块22,用于获取用户所在的位置信息。
场景信息获取模块23,用于分析录入声音信息的特性以获取用户的场景信息。
第一识别模块24,用于根据用户所在的位置信息确定对应的区域信息,并调用与该区域信息对应的语音数据库和语法数据库,对用户的声音信息进行识别,得到第一语音识别结果。
第二识别模块25,用于根据用户的场景信息匹配语法模型或语言模型,并进行模式匹配算法对用户的声音信息进行识别,得到第二语音识别结果。
结果输出模块26,用于对所述第一语音识别结果和所述第二语音识别结果进行整合,得到最终的语音识别结果,并输出该语音识别结果。
其中,位置信息获取模块22获取用户的位置信息为用户所在移动终端自动检测得到的地理信息或者GPS定位信息,所述用户的场景信息为用户交互过程中的场景变化数据。
本实施例提供的语音识别装置还包括建立模块20,用于用于为每一个区域信息建立对应的语音数据库和语法数据库,其中,每一个语法数据库中均有对应的语法文件。所述第一识别模块24具体用于:根据区域信息,调用对应的语法数据库,并调用所述语法数据库中的语法文件,根据所述语法文件和语音数据库,对用户的声音信息进行识别,得到第一语音识别结果。
本实施例提供的装置还包括计时模块27,用于对用户的声音信息开始识别时进行计时,对用户的声音信息识别结束时停止计时,记录对用户的声音信息识别的时间。
本发明提供的一种语音识别方法及语音识别装置,根据用户所在的位置信息确定对应的区域信息,并对录入的用户的声音信息进行分析以获取用户的场景信息,根据用户的区域信息和场景信息,分别对用户的声音信息进行语音识别,得到第一语音识别结果和第二语音识别结果,最后对两个识别结果进行整合,得到最终的语音识别结果并输出,本发明能够根据声音信息所处的区域信息和场景信息,对声音信息进行识别,提高语音识别的准确性。
在本说明书的描述中,参考术语“实施例一”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体方法、装置或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、方法、装置或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (8)
1.一种语音识别方法,其特征在于,所述方法包括:
S1、录入用户的声音信息;
S2、获取用户所在的位置信息,并分析录入声音信息的特性以获取用户的场景信息;
S3a、根据用户所在的位置信息确定对应的区域信息,并调用与该区域信息对应的语音数据库和语法数据库,对用户的声音信息进行识别,得到第一语音识别结果;
S3b、根据用户的场景信息匹配语法模型或语言模型,并进行模式匹配算法对用户的声音信息进行识别,得到第二语音识别结果;
S4、对所述第一语音识别结果和所述第二语音识别结果进行整合,得到最终的语音识别结果,并输出该语音识别结果。
2.如权利要求1所述的语音识别方法,其特征在于,所述获取用户的位置信息为用户所在移动终端自动检测得到的地理信息或者GPS定位信息,所述用户的场景信息为用户交互过程中的场景变化数据。
3.如权利要求1所述的语音识别方法,其特征在于,所述方法还包括:
为每一个区域信息建立对应的语音数据库和语法数据库,其中,每一个语法数据库中均有对应的语法文件;
所述步骤S3a具体包括:
根据区域信息,调用对应的语法数据库,并调用所述语法数据库中的语法文件,根据所述语法文件和语音数据库,对用户的声音信息进行识别,得到第一语音识别结果。
4.如权利要求1-3任一项所述的语音识别方法,其特征在于,所述方法还包括:
对用户的声音信息开始识别时进行计时,对用户的声音信息识别结束时停止计时,记录对用户的声音信息识别的时间。
5.一种语音识别装置,其特征在于,所述装置包括:
录入模块,用于录入用户的声音信息;
位置信息获取模块,用于获取用户所在的位置信息;
场景信息获取模块,用于分析录入声音信息的特性以获取用户的场景信息;
第一识别模块,用于根据用户所在的位置信息确定对应的区域信息,并调用与该区域信息对应的语音数据库和语法数据库,对用户的声音信息进行识别,得到第一语音识别结果;
第二识别模块,用于根据用户的场景信息匹配语法模型或语言模型,并进行模式匹配算法对用户的声音信息进行识别,得到第二语音识别结果;
结果输出模块,用于对所述第一语音识别结果和所述第二语音识别结果进行整合,得到最终的语音识别结果,并输出该语音识别结果。
6.如权利要求5所述的语音识别装置,其特征在于,所述所述获取用户的位置信息为用户所在移动终端自动检测得到的地理信息或者GPS定位信息,所述用户的场景信息为用户交互过程中的场景变化数据。
7.如权利要求5所述的语音识别装置,其特征在于,所述装置还包括:
建立模块,用于为每一个区域信息建立对应的语音数据库和语法数据库,其中,每一个语法数据库中均有对应的语法文件;
所述第一识别模块具体用于:
根据区域信息,调用对应的语法数据库,并调用所述语法数据库中的语法文件,根据所述语法文件和语音数据库,对用户的声音信息进行识别,得到第一语音识别结果。
8.如权利要求5-7任一项所述的语音识别装置,其特征在于,所述装置还包括:
计时模块,用于对用户的声音信息开始识别时进行计时,对用户的声音信息识别结束时停止计时,记录对用户的声音信息识别的时间。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510666620.3A CN105225665A (zh) | 2015-10-15 | 2015-10-15 | 一种语音识别方法及语音识别装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510666620.3A CN105225665A (zh) | 2015-10-15 | 2015-10-15 | 一种语音识别方法及语音识别装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105225665A true CN105225665A (zh) | 2016-01-06 |
Family
ID=54994575
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510666620.3A Pending CN105225665A (zh) | 2015-10-15 | 2015-10-15 | 一种语音识别方法及语音识别装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105225665A (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105719649A (zh) * | 2016-01-19 | 2016-06-29 | 百度在线网络技术(北京)有限公司 | 语音识别方法及装置 |
CN106128462A (zh) * | 2016-06-21 | 2016-11-16 | 东莞酷派软件技术有限公司 | 语音识别方法及系统 |
CN106846803A (zh) * | 2017-02-08 | 2017-06-13 | 广西交通科学研究院有限公司 | 基于音频的交通事件检测装置及方法 |
CN107274885A (zh) * | 2017-05-31 | 2017-10-20 | 广东欧珀移动通信有限公司 | 语音识别方法及相关产品 |
CN107316635A (zh) * | 2017-05-19 | 2017-11-03 | 科大讯飞股份有限公司 | 语音识别方法及装置、存储介质、电子设备 |
CN107316637A (zh) * | 2017-05-31 | 2017-11-03 | 广东欧珀移动通信有限公司 | 语音识别方法及相关产品 |
CN109389970A (zh) * | 2018-12-28 | 2019-02-26 | 合肥凯捷技术有限公司 | 一种语音分析识别方法 |
CN110035301A (zh) * | 2019-04-15 | 2019-07-19 | 钟俊强 | 一种基于语音控制的播放进度调节方法 |
CN110473547A (zh) * | 2019-07-12 | 2019-11-19 | 云知声智能科技股份有限公司 | 一种语音识别方法 |
WO2020119541A1 (zh) * | 2018-12-11 | 2020-06-18 | 阿里巴巴集团控股有限公司 | 一种语音数据的识别方法、装置及系统 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090326945A1 (en) * | 2008-06-26 | 2009-12-31 | Nokia Corporation | Methods, apparatuses, and computer program products for providing a mixed language entry speech dictation system |
CN102074231A (zh) * | 2010-12-30 | 2011-05-25 | 万音达有限公司 | 语音识别方法和语音识别系统 |
CN102549654A (zh) * | 2009-10-21 | 2012-07-04 | 独立行政法人情报通信研究机构 | 语音翻译系统、控制装置以及控制方法 |
CN103077718A (zh) * | 2013-01-09 | 2013-05-01 | 华为终端有限公司 | 语音处理方法、系统和终端 |
CN103811000A (zh) * | 2014-02-24 | 2014-05-21 | 中国移动(深圳)有限公司 | 语音识别系统及方法 |
WO2014129033A1 (ja) * | 2013-02-25 | 2014-08-28 | 三菱電機株式会社 | 音声認識システムおよび音声認識装置 |
CN104240698A (zh) * | 2014-09-24 | 2014-12-24 | 上海伯释信息科技有限公司 | 一种语音识别的方法 |
-
2015
- 2015-10-15 CN CN201510666620.3A patent/CN105225665A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090326945A1 (en) * | 2008-06-26 | 2009-12-31 | Nokia Corporation | Methods, apparatuses, and computer program products for providing a mixed language entry speech dictation system |
CN102549654A (zh) * | 2009-10-21 | 2012-07-04 | 独立行政法人情报通信研究机构 | 语音翻译系统、控制装置以及控制方法 |
CN102074231A (zh) * | 2010-12-30 | 2011-05-25 | 万音达有限公司 | 语音识别方法和语音识别系统 |
CN103077718A (zh) * | 2013-01-09 | 2013-05-01 | 华为终端有限公司 | 语音处理方法、系统和终端 |
WO2014129033A1 (ja) * | 2013-02-25 | 2014-08-28 | 三菱電機株式会社 | 音声認識システムおよび音声認識装置 |
CN103811000A (zh) * | 2014-02-24 | 2014-05-21 | 中国移动(深圳)有限公司 | 语音识别系统及方法 |
CN104240698A (zh) * | 2014-09-24 | 2014-12-24 | 上海伯释信息科技有限公司 | 一种语音识别的方法 |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105719649B (zh) * | 2016-01-19 | 2019-07-05 | 百度在线网络技术(北京)有限公司 | 语音识别方法及装置 |
CN105719649A (zh) * | 2016-01-19 | 2016-06-29 | 百度在线网络技术(北京)有限公司 | 语音识别方法及装置 |
CN106128462A (zh) * | 2016-06-21 | 2016-11-16 | 东莞酷派软件技术有限公司 | 语音识别方法及系统 |
WO2017219495A1 (zh) * | 2016-06-21 | 2017-12-28 | 宇龙计算机通信科技(深圳)有限公司 | 语音识别方法及系统 |
CN106846803A (zh) * | 2017-02-08 | 2017-06-13 | 广西交通科学研究院有限公司 | 基于音频的交通事件检测装置及方法 |
CN106846803B (zh) * | 2017-02-08 | 2023-06-23 | 广西交通科学研究院有限公司 | 基于音频的交通事件检测装置及方法 |
CN107316635A (zh) * | 2017-05-19 | 2017-11-03 | 科大讯飞股份有限公司 | 语音识别方法及装置、存储介质、电子设备 |
CN107274885B (zh) * | 2017-05-31 | 2020-05-26 | Oppo广东移动通信有限公司 | 语音识别方法及相关产品 |
WO2018219105A1 (zh) * | 2017-05-31 | 2018-12-06 | Oppo广东移动通信有限公司 | 语音识别方法及相关产品 |
CN107316637A (zh) * | 2017-05-31 | 2017-11-03 | 广东欧珀移动通信有限公司 | 语音识别方法及相关产品 |
CN107274885A (zh) * | 2017-05-31 | 2017-10-20 | 广东欧珀移动通信有限公司 | 语音识别方法及相关产品 |
WO2020119541A1 (zh) * | 2018-12-11 | 2020-06-18 | 阿里巴巴集团控股有限公司 | 一种语音数据的识别方法、装置及系统 |
CN111312233A (zh) * | 2018-12-11 | 2020-06-19 | 阿里巴巴集团控股有限公司 | 一种语音数据的识别方法、装置及系统 |
CN109389970A (zh) * | 2018-12-28 | 2019-02-26 | 合肥凯捷技术有限公司 | 一种语音分析识别方法 |
CN110035301A (zh) * | 2019-04-15 | 2019-07-19 | 钟俊强 | 一种基于语音控制的播放进度调节方法 |
CN110473547A (zh) * | 2019-07-12 | 2019-11-19 | 云知声智能科技股份有限公司 | 一种语音识别方法 |
CN110473547B (zh) * | 2019-07-12 | 2021-07-30 | 云知声智能科技股份有限公司 | 一种语音识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105225665A (zh) | 一种语音识别方法及语音识别装置 | |
CN105374356B (zh) | 语音识别方法、语音评分方法、语音识别系统及语音评分系统 | |
CN202110564U (zh) | 结合视频通道的智能家居语音控制系统 | |
CN108573701A (zh) | 基于唇部检测的查询端点化 | |
CN108428448A (zh) | 一种语音端点检测方法及语音识别方法 | |
CN102298443A (zh) | 结合视频通道的智能家居语音控制系统及其控制方法 | |
CN106157956A (zh) | 语音识别的方法及装置 | |
CN103426428A (zh) | 语音识别方法及系统 | |
CN103165129B (zh) | 一种优化语音识别声学模型的方法及系统 | |
WO2016173132A1 (zh) | 语音识别方法、装置及用户设备 | |
CN105334743A (zh) | 一种基于情感识别的智能家居控制方法及其系统 | |
CN109036412A (zh) | 语音唤醒方法和系统 | |
CN102915731A (zh) | 一种个性化的语音识别的方法及装置 | |
ATE410768T1 (de) | System und verfahren zum betrieb eines spracherkennungssystems in einem fahrzeug | |
EP2587478A3 (en) | Speech recognition repair using contextual information | |
CN104036774A (zh) | 藏语方言识别方法及系统 | |
CN103578468A (zh) | 一种语音识别中置信度阈值的调整方法及电子设备 | |
CN103903611A (zh) | 一种语音信息的识别方法和设备 | |
CN106057203A (zh) | 一种精准语音控制方法及装置 | |
CN104078044A (zh) | 移动终端及其录音搜索的方法和装置 | |
CN103106061A (zh) | 语音输入方法和装置 | |
US10834501B2 (en) | Information processing method, information processing device, and recording medium | |
CN113129867B (zh) | 语音识别模型的训练方法、语音识别方法、装置和设备 | |
CN105374357B (zh) | 一种语音识别方法、装置及语音控制系统 | |
CN103885585A (zh) | 一种基于单人手势和语音信息的机器人人工导航方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160106 |