CN103106900A - 语音识别装置和语音识别方法 - Google Patents
语音识别装置和语音识别方法 Download PDFInfo
- Publication number
- CN103106900A CN103106900A CN2013100628463A CN201310062846A CN103106900A CN 103106900 A CN103106900 A CN 103106900A CN 2013100628463 A CN2013100628463 A CN 2013100628463A CN 201310062846 A CN201310062846 A CN 201310062846A CN 103106900 A CN103106900 A CN 103106900A
- Authority
- CN
- China
- Prior art keywords
- phonetic order
- threshold
- data
- speech
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
本发明提供了一种语音识别装置包括:语音识别单元,识别用户语音生成语音数据;第一查询单元,在第一语音识别库中查询相匹配的第一语音指令;第一判断单元,判断第一语音指令的置信度是否大于第一阈值;第二查询单元,在判定小于的情况下,在第二语音识别库中查询相匹配的第二语音指令;计算单元,计算第一语音指令与第二语音指令的相似性;第二判断单元,判断相似性是否大于第二阈值,若小于,则判定语音数据为噪音数据;指令执行单元,在第一判断单元或第二判断单元大于的情况下,执行第一语音指令。本发明还提出了一种语音识别方法。通过本发明的技术方案,通过二次识别语音数据,减少将噪音识别为语音命令的风险,提高执行命令的准确度。
Description
技术领域
本发明涉及语音识别技术领域,具体而言,涉及一种语音识别装置和语音识别方法。
背景技术
在数据库多维立方体查询时需要各种语音命令(有限的几个命令),但是在嘈杂的环境下通过现有的语音识别,可能把一个不相关的发音(噪音和其他的人的声音)翻译为语音命令。
在语音命令识别中,算法只是在语法树中找到发音最相似的问题,但是在现实生活中经常出现不在命令范围内的发音(噪音和其他人的声音)等,这时有相当大的风险会把背景声音识别为命令。
因此,需要一种新的语音识别技术,能够通过二次识别语音数据,减少将噪音识别为语音命令的风险,提高执行命令的准确度。
发明内容
本发明正是基于上述问题,提出了一种语音识别技术,能够通过二次识别语音数据,减少将噪音识别为语音命令的风险,提高执行命令的准确度。
有鉴于此,本发明提出了一种语音识别装置,包括:语音识别单元,用于识别用户语音生成语音数据;第一查询单元,用于根据所述语音数据在第一语音识别库中查询相匹配的第一语音指令;第一判断单元,用于判断所述第一语音指令的置信度是否大于第一阈值;第二查询单元,用于在所述第一判断单元的判断结果为否的情况下,根据所述语音数据在第二语音识别库中查询相匹配的第二语音指令;计算单元,用于通过预设算法计算所述第一语音指令与所述第二语音指令的相似性;第二判断单元,用于判断所述相似性是否大于第二阈值,若小于,则判定所述语音数据为噪音数据;指令执行单元,用于在所述第一判断单元或所述第二判断单元的判断结果为是的情况下,执行所述第一语音指令。
在该技术方案中,在第一语音识别库中查询到第一语音指令后,可以确定第一语音指令的置信度,即语音数据与第一语音指令的相似度,相似度越高,置信度越高,反之亦然,当置信度低于第一阈值时,则认为语音数据是噪音数据的可能性较大,从而在第二语音识别库中查询第二语音指令,然后计算第一语音指令与第二语音指令的相似性,如果该相似性大于第二阈值,则认为第一语音指令与第二语音指令差距较小,在较大程度上可以判定第一语音指令是准确的,如果该相似性小于第二阈值,说明第一语音指令与第二语音指令差距较大,第一语音指令很大可能由噪音数据错误生成,即判定上述语音数据为噪音数据。
通过二次识别语音数据,可以准确地判断语音数据是否是噪音数据,从而降低将噪音识别为语音命令的风险,提高执行命令的准确度。
在上述技术方案中,优选地,所述计算单元通过余弦相似性比较算法、修正的余弦相似性比较算法或相关相似性比较算法计算所述第一语音指令与所述第二语音指令的相似性。
在上述技术方案中,优选地,所述第二语音识别库中的词汇数据量大于所述第一语音识别库中的词汇数据量。
在该技术方案中,第一语音识别库可以是一个较小的语法库,比如指令语法库,在其中查询语音数据只能僵硬地生成语音指令数据,第二语音识别库可以是一个较大的语法库,比如自然语法库,在其中查询语音数据可以比较准确地生成相应的语音指令。
根据一条语音数据在指令语法库中进行查询可以生成一条指令,如果该指令的置信度小于第一阈值,则根据该语音数据在自然语法库中查询可以生成一段语句(不一定是指令),这段语句相对于上述指令更接近于该语音数据,当该语句与该指令的相似性大于第二阈值时,则可以判定该指令接近于语音数据,可以执行,如果小于第二阈值,则指令很大可能由噪音数据错误生成,即判定上述语音数据为噪音数据。
在上述任一技术方案中,优选地,还包括:设置单元,用于根据接收到的设置指令设置所述第一阈值和/或所述第二阈值。
在该技术方案中,用户可以根据具体情况设置第一阈值和/或第二阈值。
在上述任一技术方案中,优选地,还包括:显示单元,用于在所述第二判断单元判定所述语音数据为噪音数据时,显示所述第一语音指令与所述第二语音指令。
在该技术方案中,若第一语音指令与第二语音指令的相似度小于第二阈值,则可以显示第一语音指令与第二语音指令,以便用户人工判断语音数据是否的确为噪音。
本发明还提出了一种语音识别方法,包括:步骤202,识别用户语音生成语音数据,根据所述语音数据在第一语音识别库中查询相匹配的第一语音指令;步骤204,判断所述第一语音指令的置信度是否大于第一阈值,若大于,则执行所述第一语音指令,若小于,则根据所述语音数据在第二语音识别库中查询相匹配的第二语音指令;步骤206,通过预设算法计算所述第一语音指令与所述第二语音指令的相似性,并判断所述相似性是否大于第二阈值,若大于,则执行所述第一语音指令,若小于,则判定所述语音数据为噪音数据。
在该技术方案中,在第一语音识别库中查询到第一语音指令后,可以确定第一语音指令的置信度,即语音数据与第一语音指令的相似度,相似度越高,置信度越高,反之亦然,当置信度低于第一阈值时,则认为语音数据是噪音数据的可能性较大,从而在第二语音识别库中查询第二语音指令,然后计算第一语音指令与第二语音指令的相似性,如果该相似性大于第二阈值,则认为第一语音指令与第二语音指令差距较小,在较大程度上可以判定第一语音指令是准确的,如果该相似性小于第二阈值,说明第一语音指令与第二语音指令差距较大,第一语音指令很大可能由噪音数据错误生成,即判定上述语音数据为噪音数据。
通过二次识别语音数据,可以准确地判断语音数据是否是噪音数据,从而降低将噪音识别为语音命令的风险,提高执行命令的准确度。
在上述技术方案中,优选地,所述步骤206包括:通过余弦相似性比较算法、修正的余弦相似性比较算法或相关相似性比较算法计算所述第一语音指令与所述第二语音指令的相似性。
在上述技术方案中,优选地,所述第二语音识别库中的词汇数据量大于所述第一语音识别库中的词汇数据量。
在该技术方案中,第一语音识别库可以是一个较小的语法库,比如指令语法库,在其中查询语音数据只能僵硬地生成语音指令数据,第二语音识别库可以是一个较大的语法库,比如自然语法库,在其中查询语音数据可以比较准确地生成相应的语音指令。
根据一条语音数据在指令语法库中进行查询可以生成一条指令,如果该指令的置信度小于第一阈值,则根据该语音数据在自然语法库中查询可以生成一段语句(不一定是指令),这段语句相对于上述指令更接近于该语音数据,当该语句与该指令的相似性大于第二阈值时,则可以判定该指令接近于语音数据,可以执行,如果小于第二阈值,则指令很大可能由噪音数据错误生成,即判定上述语音数据为噪音数据。
在上述任一技术方案中,优选地,还包括:根据接收到的设置指令设置所述第一阈值和/或所述第二阈值。
在该技术方案中,用户可以根据具体情况设置第一阈值和/或第二阈值。
在上述任一技术方案中,优选地,还包括:在判定所述语音数据为噪音数据时,显示所述第一语音指令与所述第二语音指令。
在该技术方案中,若第一语音指令与第二语音指令的相似度小于第二阈值,则可以显示第一语音指令与第二语音指令,以便用户人工判断语音数据是否的确为噪音。
通过以上技术方案,可以通过二次识别语音数据,减少将噪音识别为语音命令的风险,提高执行命令的准确度。
附图说明
图1示出了根据本发明的实施例的语音识别装置的框图;
图2示出了根据本发明的实施例的语音识别方法的流程图;
图3示出了根据本发明的实施例的语音识别方法的具体流程图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
图1示出了根据本发明的实施例的语音识别装置的框图。
如图1所示,根据本发明的实施例的语音识别装置100包括:语音识别单元102,用于识别用户语音生成语音数据;第一查询单元104,用于根据语音数据在第一语音识别库中查询相匹配的第一语音指令;第一判断单元106,用于判断第一语音指令的置信度是否大于第一阈值;第二查询单元108,用于在第一判断单元106的判断结果为否的情况下,根据语音数据在第二语音识别库中查询相匹配的第二语音指令;计算单元110,用于通过预设算法计算第一语音指令与第二语音指令的相似性;第二判断单元112,用于判断相似性是否大于第二阈值,若小于,则判定语音数据为噪音数据;指令执行单元114,用于在第一判断单元106或第二判断单元112的判断结果为是的情况下,执行第一语音指令。
在第一语音识别库中查询到第一语音指令后,可以确定第一语音指令的置信度,即语音数据与第一语音指令的相似度,相似度越高,置信度越高,反之亦然,当置信度低于第一阈值时,则认为语音数据是噪音数据的可能性较大,从而在第二语音识别库中查询第二语音指令,然后计算第一语音指令与第二语音指令的相似性,如果该相似性大于第二阈值,则认为第一语音指令与第二语音指令差距较小,在较大程度上可以判定第一语音指令是准确的,如果该相似性小于第二阈值,说明第一语音指令与第二语音指令差距较大,第一语音指令很大可能由噪音数据错误生成,即判定上述语音数据为噪音数据。
通过二次识别语音数据,可以准确地判断语音数据是否是噪音数据,从而降低将噪音识别为语音命令的风险,提高执行命令的准确度。
优选地,计算单元110通过余弦相似性比较算法、修正的余弦相似性比较算法或相关相似性比较算法计算第一语音指令与第二语音指令的相似性。
优选地,第二语音识别库中的词汇数据量大于第一语音识别库中的词汇数据量。
第一语音识别库可以是一个较小的语法库,比如指令语法库,在其中查询语音数据只能僵硬地生成语音指令数据,第二语音识别库可以是一个较大的语法库,比如自然语法库,在其中查询语音数据可以比较准确地生成相应的语音指令。
根据一条语音数据在指令语法库中进行查询可以生成一条指令,如果该指令的置信度小于第一阈值,则根据该语音数据在自然语法库中查询可以生成一段语句(不一定是指令),这段语句相对于上述指令更接近于该语音数据,当该语句与该指令的相似性大于第二阈值时,则可以判定该指令接近于语音数据,可以执行,如果小于第二阈值,则指令很大可能由噪音数据错误生成,即判定上述语音数据为噪音数据。
优选地,还包括:设置单元116,用于根据接收到的设置指令设置第一阈值和/或第二阈值。用户可以根据具体情况设置第一阈值和/或第二阈值。
优选地,还包括:显示单元118,用于在第二判断单元112判定所述语音数据为噪音数据时,显示所述第一语音指令与所述第二语音指令。
若第一语音指令与第二语音指令的相似度小于第二阈值,则可以显示第一语音指令与第二语音指令,以便用户人工判断语音数据是否的确为噪音。
图2示出了根据本发明的实施例的语音识别方法的流程图。
如图2所示,根据本发明的实施例的语音识别方法包括:步骤202,识别用户语音生成语音数据,根据语音数据在第一语音识别库中查询相匹配的第一语音指令;步骤204,判断第一语音指令的置信度是否大于第一阈值,若大于,则执行第一语音指令,若小于,则根据语音数据在第二语音识别库中查询相匹配的第二语音指令;步骤206,通过预设算法计算第一语音指令与第二语音指令的相似性,并判断相似性是否大于第二阈值,若大于,则执行第一语音指令,若小于,则判定语音数据为噪音数据。
在第一语音识别库中查询到第一语音指令后,可以确定第一语音指令的置信度,即语音数据与第一语音指令的相似度,相似度越高,置信度越高,反之亦然,当置信度低于第一阈值时,则认为语音数据是噪音数据的可能性较大,从而在第二语音识别库中查询第二语音指令,然后计算第一语音指令与第二语音指令的相似性,如果该相似性大于第二阈值,则认为第一语音指令与第二语音指令差距较小,在较大程度上可以判定第一语音指令是准确的,如果该相似性小于第二阈值,说明第一语音指令与第二语音指令差距较大,第一语音指令很大可能由噪音数据错误生成,即判定上述语音数据为噪音数据。
通过二次识别语音数据,可以准确地判断语音数据是否是噪音数据,从而降低将噪音识别为语音命令的风险,提高执行命令的准确度。
优选地,步骤206包括:通过余弦相似性比较算法、修正的余弦相似性比较算法或相关相似性比较算法计算第一语音指令与第二语音指令的相似性。
优选地,第二语音识别库中的词汇数据量大于第一语音识别库中的词汇数据量。
第一语音识别库可以是一个较小的语法库,比如指令语法库,在其中查询语音数据只能僵硬地生成语音指令数据,第二语音识别库可以是一个较大的语法库,比如自然语法库,在其中查询语音数据可以比较准确地生成相应的语音指令。
根据一条语音数据在指令语法库中进行查询可以生成一条指令,如果该指令的置信度小于第一阈值,则根据该语音数据在自然语法库中查询可以生成一段语句(不一定是指令),这段语句相对于上述指令更接近于该语音数据,当该语句与该指令的相似性大于第二阈值时,则可以判定该指令接近于语音数据,可以执行,如果小于第二阈值,则指令很大可能由噪音数据错误生成,即判定上述语音数据为噪音数据。
优选地,还包括:根据接收到的设置指令设置第一阈值和/或第二阈值。用户可以根据具体情况设置第一阈值和/或第二阈值。
优选地,还包括:在判定语音数据为噪音数据时,显示第一语音指令与第二语音指令。
若第一语音指令与第二语音指令的相似度小于第二阈值,则可以显示第一语音指令与第二语音指令,以便用户人工判断语音数据是否的确为噪音。
图3示出了根据本发明的实施例的语音识别方法的具体流程图。
如图3所示,根据本发明的实施例的语音识别方法具体包括:
步骤302,识别用户语音,得到语音数据,并根据该语音数据在指令语法库中查询相应的语音指令;
步骤304,判断语音指令的置信度是否大于第一阈值,若大于,则进入步骤312;
步骤306,若小于,则根据语音数据,在自然语法库中查询相应的自然语句,其中,自然语法库包含指令语法库,即通过自然语法库查询到的自然语句,相对于通过指令语法库查询到的语音指令更接近于语音数据;
步骤308,通过余弦算法计算语音指令与自然语句的相似度;
步骤310,判断相似度是否大于第二阈值,其中,第一阈值和第二阈值在一定程度上反映了语音识别的准确性,阀值的准确性可以通过采集大量的实验数据进行合理的设置;
步骤312,若相似度大于第二阈值,说明语音指令和自然语句接近,判定语音指令是准确地,执行语音指令;
步骤314,若相似度小于第二阈值,说明说明语音指令和自然语句差距较大,判定语音指令是根据噪声数据误生成的,拒绝执行语音指令。
具体地,比如指令语法库包含以下命令集合:
NoCommand=“系统没能明白您说的话”;
ClearCommand=“清空”;
OpenHelpCommand=“语法帮助”;
OpenHelpCommand2=“打开语法帮助”;
CloseHelpCommand=“关闭语法帮助”;
PreTalkCommand=“上一个”;
NextTalkCommand=“下一个”;
PrePageCommand=“向前一页”;
NextPageCommand=“向后一页”;
RemoveOneCommand=“删除”;
ExportHistoryCommand=“导出历史记录”;
OkCommand=“确认”;
CancelCommand1=“取消”;
BackCommand=“返回”;
其中,第一阈值为0.7,第二阈值为0.8。当采集到用户所在环境中的一句话为:“吃饱了”,在指令语法库中查询到的最接近的语音命令为:“取消”。经过判断,该语音指令的置信度为0.3,小于第一阈值,则在自然语法库中进一步查询,得到最接近的单词是“知道了”,从发音上分析:实际发音chi bao le,与查询到的发音zhi dao le更为接近,然后通过余弦算法计算“知道了”和“取消”的相似性值为0.5,小于第二阈值,显然“取消”和“知道了”的差别较大,从而可以判断所识别到发音是一个噪音,拒绝执行命令。
以上结合附图详细说明了本发明的技术方案,考虑到相关技术中,在数据库多维立方体查询时需要各种语音命令,但是在嘈杂的环境下通过现有的语音识别,可能把一个不相关的发音(噪音)翻译为语音命令。通过本发明的技术方案,能够通过二次识别语音数据,减少将噪音识别为语音命令的风险,提高执行命令的准确度。
在本发明中,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性。术语“多个”指两个或两个以上,除非另有明确的限定。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种语音识别装置,其特征在于,包括:
语音识别单元,用于识别用户语音生成语音数据;
第一查询单元,用于根据所述语音数据在第一语音识别库中查询相匹配的第一语音指令;
第一判断单元,用于判断所述第一语音指令的置信度是否大于第一阈值;
第二查询单元,用于在所述第一判断单元的判断结果为否的情况下,根据所述语音数据在第二语音识别库中查询相匹配的第二语音指令;
计算单元,用于通过预设算法计算所述第一语音指令与所述第二语音指令的相似性;
第二判断单元,用于判断所述相似性是否大于第二阈值,若小于,则判定所述语音数据为噪音数据;
指令执行单元,用于在所述第一判断单元或所述第二判断单元的判断结果为是的情况下,执行所述第一语音指令。
2.根据权利要求1所述的语音识别装置,其特征在于,所述计算单元通过余弦相似性比较算法、修正的余弦相似性比较算法或相关相似性比较算法计算所述第一语音指令与所述第二语音指令的相似性。
3.根据权利要求1所述的语音识别装置,其特征在于,所述第二语音识别库中的词汇数据量大于所述第一语音识别库中的词汇数据量。
4.根据权利要求1至3中任一项所述的语音识别装置,其特征在于,还包括:
设置单元,用于根据接收到的设置指令设置所述第一阈值和/或所述第二阈值。
5.根据权利要求1至3中任一项所述的语音识别装置,其特征在于,还包括:
显示单元,用于在所述第二判断单元判定所述语音数据为噪音数据时,显示所述第一语音指令与所述第二语音指令。
6.一种语音识别方法,其特征在于,包括:
步骤202,识别用户语音生成语音数据,根据所述语音数据在第一语音识别库中查询相匹配的第一语音指令;
步骤204,判断所述第一语音指令的置信度是否大于第一阈值,若大于,则执行所述第一语音指令,若小于,则根据所述语音数据在第二语音识别库中查询相匹配的第二语音指令;
步骤206,通过预设算法计算所述第一语音指令与所述第二语音指令的相似性,并判断所述相似性是否大于第二阈值,若大于,则执行所述第一语音指令,若小于,则判定所述语音数据为噪音数据。
7.根据权利要求6所述的语音识别方法,其特征在于,所述步骤206包括:通过余弦相似性比较算法、修正的余弦相似性比较算法或相关相似性比较算法计算所述第一语音指令与所述第二语音指令的相似性。
8.根据权利要求6所述的语音识别方法,其特征在于,所述第二语音识别库中的词汇数据量大于所述第一语音识别库中的词汇数据量。
9.根据权利要求6至8中任一项所述的语音识别方法,其特征在于,还包括:根据接收到的设置指令设置所述第一阈值和/或所述第二阈值。
10.根据权利要求6至8中任一项所述的语音识别方法,其特征在于,还包括:在判定所述语音数据为噪音数据时,显示所述第一语音指令与所述第二语音指令。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310062846.3A CN103106900B (zh) | 2013-02-28 | 2013-02-28 | 语音识别装置和语音识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310062846.3A CN103106900B (zh) | 2013-02-28 | 2013-02-28 | 语音识别装置和语音识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103106900A true CN103106900A (zh) | 2013-05-15 |
CN103106900B CN103106900B (zh) | 2016-05-04 |
Family
ID=48314700
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310062846.3A Active CN103106900B (zh) | 2013-02-28 | 2013-02-28 | 语音识别装置和语音识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103106900B (zh) |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104103272A (zh) * | 2014-07-15 | 2014-10-15 | 无锡中星微电子有限公司 | 语音识别方法、装置和蓝牙耳机 |
CN104505102A (zh) * | 2014-12-31 | 2015-04-08 | 宇龙计算机通信科技(深圳)有限公司 | 身体状况检测的方法及装置 |
CN107316637A (zh) * | 2017-05-31 | 2017-11-03 | 广东欧珀移动通信有限公司 | 语音识别方法及相关产品 |
CN107919129A (zh) * | 2017-11-15 | 2018-04-17 | 百度在线网络技术(北京)有限公司 | 用于控制页面的方法和装置 |
CN108010523A (zh) * | 2016-11-02 | 2018-05-08 | 松下电器(美国)知识产权公司 | 信息处理方法以及记录介质 |
CN108028050A (zh) * | 2015-09-18 | 2018-05-11 | 高通股份有限公司 | 协同音频处理 |
CN108733304A (zh) * | 2018-06-15 | 2018-11-02 | 蒋渊 | 一种自动识别及处理手写字符方法、装置 |
CN108965967A (zh) * | 2018-05-25 | 2018-12-07 | 苏州浪潮智能软件有限公司 | 电视控制方法及装置、计算机可读存储介质、终端 |
CN109074808A (zh) * | 2018-07-18 | 2018-12-21 | 深圳魔耳智能声学科技有限公司 | 语音控制方法、中控设备和存储介质 |
CN109785825A (zh) * | 2018-12-29 | 2019-05-21 | 广东长虹日电科技有限公司 | 一种语音识别的算法及储存介质、应用其的电器 |
CN109949815A (zh) * | 2014-04-07 | 2019-06-28 | 三星电子株式会社 | 电子装置 |
CN110060687A (zh) * | 2016-09-05 | 2019-07-26 | 北京金山软件有限公司 | 一种语音信息转换、信息生成方法及装置 |
CN110907895A (zh) * | 2019-12-05 | 2020-03-24 | 重庆商勤科技有限公司 | 噪声监测识别定位方法、系统及计算机可读存储介质 |
CN113571069A (zh) * | 2021-08-03 | 2021-10-29 | 北京房江湖科技有限公司 | 一种信息处理的方法、装置和存储介质 |
CN114556353A (zh) * | 2019-12-16 | 2022-05-27 | 深圳市欢太科技有限公司 | 数据处理方法、装置、电子设备和存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020173955A1 (en) * | 2001-05-16 | 2002-11-21 | International Business Machines Corporation | Method of speech recognition by presenting N-best word candidates |
CN1509467A (zh) * | 2001-03-16 | 2004-06-30 | �Ҵ���˾ | 输入语音的转换和显示 |
CN101158947A (zh) * | 2006-09-22 | 2008-04-09 | 株式会社东芝 | 机器翻译的方法和装置 |
CN101188109A (zh) * | 2006-11-20 | 2008-05-28 | 富士通株式会社 | 语音识别装置、方法和记录有语音识别软件程序的记录介质 |
CN101256769A (zh) * | 2008-03-21 | 2008-09-03 | 广州汉音电子科技有限公司 | 语音识别装置及其方法 |
CN102024455A (zh) * | 2009-09-10 | 2011-04-20 | 索尼株式会社 | 说话人识别系统及其方法 |
CN102855875A (zh) * | 2012-09-07 | 2013-01-02 | 深圳市信利康电子有限公司 | 基于外部开启控制语音输入的网络语音转换控制系统和方法 |
-
2013
- 2013-02-28 CN CN201310062846.3A patent/CN103106900B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1509467A (zh) * | 2001-03-16 | 2004-06-30 | �Ҵ���˾ | 输入语音的转换和显示 |
US20020173955A1 (en) * | 2001-05-16 | 2002-11-21 | International Business Machines Corporation | Method of speech recognition by presenting N-best word candidates |
CN101158947A (zh) * | 2006-09-22 | 2008-04-09 | 株式会社东芝 | 机器翻译的方法和装置 |
CN101188109A (zh) * | 2006-11-20 | 2008-05-28 | 富士通株式会社 | 语音识别装置、方法和记录有语音识别软件程序的记录介质 |
CN101256769A (zh) * | 2008-03-21 | 2008-09-03 | 广州汉音电子科技有限公司 | 语音识别装置及其方法 |
CN102024455A (zh) * | 2009-09-10 | 2011-04-20 | 索尼株式会社 | 说话人识别系统及其方法 |
CN102855875A (zh) * | 2012-09-07 | 2013-01-02 | 深圳市信利康电子有限公司 | 基于外部开启控制语音输入的网络语音转换控制系统和方法 |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109949815A (zh) * | 2014-04-07 | 2019-06-28 | 三星电子株式会社 | 电子装置 |
CN109949815B (zh) * | 2014-04-07 | 2024-06-07 | 三星电子株式会社 | 电子装置 |
CN104103272B (zh) * | 2014-07-15 | 2017-10-10 | 无锡中感微电子股份有限公司 | 语音识别方法、装置和蓝牙耳机 |
CN104103272A (zh) * | 2014-07-15 | 2014-10-15 | 无锡中星微电子有限公司 | 语音识别方法、装置和蓝牙耳机 |
CN104505102A (zh) * | 2014-12-31 | 2015-04-08 | 宇龙计算机通信科技(深圳)有限公司 | 身体状况检测的方法及装置 |
CN108028050A (zh) * | 2015-09-18 | 2018-05-11 | 高通股份有限公司 | 协同音频处理 |
CN108028050B (zh) * | 2015-09-18 | 2021-10-22 | 高通股份有限公司 | 协同音频处理 |
CN110060687A (zh) * | 2016-09-05 | 2019-07-26 | 北京金山软件有限公司 | 一种语音信息转换、信息生成方法及装置 |
CN108010523A (zh) * | 2016-11-02 | 2018-05-08 | 松下电器(美国)知识产权公司 | 信息处理方法以及记录介质 |
CN107316637A (zh) * | 2017-05-31 | 2017-11-03 | 广东欧珀移动通信有限公司 | 语音识别方法及相关产品 |
CN107919129A (zh) * | 2017-11-15 | 2018-04-17 | 百度在线网络技术(北京)有限公司 | 用于控制页面的方法和装置 |
US11221822B2 (en) | 2017-11-15 | 2022-01-11 | Baidu Online Network Technology (Beijing) Co., Ltd. | Method and apparatus for controlling page |
CN108965967A (zh) * | 2018-05-25 | 2018-12-07 | 苏州浪潮智能软件有限公司 | 电视控制方法及装置、计算机可读存储介质、终端 |
CN108733304A (zh) * | 2018-06-15 | 2018-11-02 | 蒋渊 | 一种自动识别及处理手写字符方法、装置 |
CN109074808A (zh) * | 2018-07-18 | 2018-12-21 | 深圳魔耳智能声学科技有限公司 | 语音控制方法、中控设备和存储介质 |
CN109785825A (zh) * | 2018-12-29 | 2019-05-21 | 广东长虹日电科技有限公司 | 一种语音识别的算法及储存介质、应用其的电器 |
CN110907895A (zh) * | 2019-12-05 | 2020-03-24 | 重庆商勤科技有限公司 | 噪声监测识别定位方法、系统及计算机可读存储介质 |
CN114556353A (zh) * | 2019-12-16 | 2022-05-27 | 深圳市欢太科技有限公司 | 数据处理方法、装置、电子设备和存储介质 |
CN113571069A (zh) * | 2021-08-03 | 2021-10-29 | 北京房江湖科技有限公司 | 一种信息处理的方法、装置和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN103106900B (zh) | 2016-05-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103106900B (zh) | 语音识别装置和语音识别方法 | |
KR102339594B1 (ko) | 객체 인식 방법, 컴퓨터 디바이스 및 컴퓨터 판독 가능 저장 매체 | |
CN111279296B (zh) | 使用隐式路由来创建模块化对话 | |
GB201019835D0 (en) | Database system and methods | |
CN110689881B (zh) | 语音识别方法、装置、计算机设备和存储介质 | |
WO2012121809A1 (en) | System and method for recognizing environmental sound | |
WO2021127660A3 (en) | Machine and deep learning process modeling of performance and behavioral data | |
CN109448711A (zh) | 一种语音识别的方法、装置及计算机存储介质 | |
CN102708867A (zh) | 一种基于声纹和语音的防录音假冒身份识别方法及系统 | |
KR101863097B1 (ko) | 키워드 인식 장치 및 방법 | |
CN102915731A (zh) | 一种个性化的语音识别的方法及装置 | |
US11531789B1 (en) | Floor plan generation for device visualization and use | |
KR20190094301A (ko) | 인공 지능 기기 및 인공 지능 기기의 동작 방법 | |
KR101893768B1 (ko) | 음성 인식 트리거를 제공하기 위한 방법, 시스템 및 비일시성의 컴퓨터 판독 가능한 기록 매체 | |
US20140079295A1 (en) | Apparatus and method for discriminating disguised face | |
CN105549841A (zh) | 一种语音交互方法、装置及设备 | |
CN105225665A (zh) | 一种语音识别方法及语音识别装置 | |
CN103079258A (zh) | 一种提高语音识别准确性的方法及移动智能终端 | |
CN103236261A (zh) | 一种特定人语音识别的方法 | |
CN104103271A (zh) | 用于适配语音识别声学模型的方法和系统 | |
CN104778230A (zh) | 一种视频数据切分模型的训练、视频数据切分方法和装置 | |
KR20090089674A (ko) | 휴대 단말기의 소리 인식 방법 및 장치 | |
CN113091245B (zh) | 用于空调的控制方法、装置及空调 | |
CN113531806B (zh) | 用于控制空调的方法、装置及空调 | |
CN115147887A (zh) | 人脸识别率提高方法、门禁设备及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 100094 Haidian District North Road, Beijing, No. 68 Applicant after: Yonyou Network Technology Co., Ltd. Address before: 100094 Beijing city Haidian District North Road No. 68, UFIDA Software Park Applicant before: UFIDA Software Co., Ltd. |
|
COR | Change of bibliographic data | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |