CN105261363A - 一种语音识别的方法、装置及终端 - Google Patents
一种语音识别的方法、装置及终端 Download PDFInfo
- Publication number
- CN105261363A CN105261363A CN201510600314.XA CN201510600314A CN105261363A CN 105261363 A CN105261363 A CN 105261363A CN 201510600314 A CN201510600314 A CN 201510600314A CN 105261363 A CN105261363 A CN 105261363A
- Authority
- CN
- China
- Prior art keywords
- audio signal
- audio
- gain
- local
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 31
- 230000005236 sound signal Effects 0.000 claims abstract description 221
- 238000001914 filtration Methods 0.000 claims abstract description 10
- 230000002452 interceptive effect Effects 0.000 claims description 13
- 230000008569 process Effects 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 12
- 238000004590 computer program Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 238000003860 storage Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 210000005069 ears Anatomy 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000004075 alteration Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Circuit For Audible Band Transducer (AREA)
- Telephone Function (AREA)
Abstract
本发明提供了一种语音识别的方法、装置及终端,包括:接收音频输入信号;获取第一音频信号;获取第一增益/衰减系数;根据所述第一增益/衰减系数及所述第一音频信号确定第一干扰音频信号,所述第一干扰音频信号为本机音频输入装置接收到的由本机音频输出装置输出的音频信号;从所述音频输入信号中滤除所述第一干扰音频信号得到第二音频信号,所述第二音频信号为本机音频输入装置接收到的待识别音频信号;对所述第二音频信号进行语音识别处理。采用本发明的技术方案,能够有效提高了在本机音频输出装置有音频输出时进行语音识别的语音识别率。
Description
技术领域
本发明涉及音频分析或处理技术领域,特别涉及一种语音识别的方法、装置及终端。
背景技术
语音交互是指人与机器进行语音交流,让机器听懂人说的话。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。
目前的语音识别方案,在设备的扬声器有音频输出时(播放音乐或者输出声音)的情况下,语音交互的识别率就会大幅降低,尤其在音频的音量较大时,语音交互会出现没有识别反应或识别错误的情况。而现有的降噪技术,在设备扬声器有音频输出时的场景下是不生效的,存在语音识别率较低的问题,降噪效果有待进一步提升。
发明内容
本发明实施例提出了一种语音识别的方法、装置及终端,用以现有的语音识别技术在设备扬声器有音频输出时,存在的语音识别率较低的问题。
本发明实施例提供了一种语音识别的方法,应用于扬声器有音频输出时的语音识别,包括如下步骤:
一种语音识别的方法,其特征在于,包括如下步骤:
接收音频输入信号;
获取第一音频信号,所述第一音频信号为本机音频输出装置输出的音频信号;
获取第一增益/衰减系数,所述第一增益/衰减系数为所述第一音频信号在本机音频输入装置位置的各频点的增益或衰减;
根据所述第一增益/衰减系数及所述第一音频信号确定第一干扰音频信号,所述第一干扰音频信号为本机音频输入装置接收到的由本机音频输出装置输出的音频信号;
从所述音频输入信号中滤除所述第一干扰音频信号得到第二音频信号,所述第二音频信号为本机音频输入装置接收到的待识别音频信号;
对所述第二音频信号进行语音识别处理。
本发明实施例提供了一种语音识别的装置,应用于扬声器有音频输出时的语音识别设备,包括:
接收单元,用于接收音频输入信号;
获取单元,用于获取第一音频信号,所述第一音频信号为本机音频输出装置输出的音频信号;
获取单元进一步用于获取第一增益/衰减系数,所述第一增益/衰减系数为所述第一音频信号在本机音频输入装置位置的各频点的增益或衰减;
确定单元,用于根据所述第一增益/衰减系数及所述第一音频信号确定第一干扰音频信号,所述第一干扰音频信号为本机音频输入装置接收到的由本机音频输出装置输出的音频信号;
滤除单元,用于从所述音频输入信号中滤除所述第一干扰音频信号得到第二音频信号,所述第二音频信号为本机音频输入装置接收到的待识别音频信号;
识别处理单元,用于对所述第二音频信号进行语音识别处理。
本发明实施例提供了一种终端,包括:本机音频输入装置、本机音频输出装置及语音识别的装置,
所述本机音频输入装置,用于接收音频信号;
所述本机音频输出装置,用于输出音频信号;
所述语音识别的装置,用于根据所述本机音频输入装置接收到的音频信号及所述本机音频输出装置输出的音频信号,进行语音识别处理。
本发明有益效果如下:
本发明实施例提供的语音识别的方法、装置及终端,根据第一音频信号及第一增益/衰减系数确定第一干扰音频信号,进而从本机音频输入装置接收到的音频信号中滤除第一干扰音频信号,考虑到了本机音频输出装置与本机音频输入装置之间的音频传播路径及本机音频输出装置输出的音频信号经过该传播路径后的各频点的增益或损耗,可以准确得到第一干扰音频信号,有效提高了在本机音频输出装置有音频输出时进行语音识别的语音识别率。
附图说明
下面将参照附图描述本发明的具体实施例,
图1为本发明实施例中的语音识别的方法流程示意图;
图2为本发明实施例中的语音识别的装置结构示意图;
图3为本发明实施例中的终端结构示意图。
具体实施方式
为了使本发明的技术方案及优点更加清楚明白,以下结合附图对本发明的示例性实施例进行进一步详细的说明,显然,所描述的实施例仅是本发明的一部分实施例,而不是所有实施例的穷举。并且在不冲突的情况下,本说明书中的实施例及实施例中的特征可以互相结合。
图1为本发明实施例中的语音识别的方法流程示意图,如图1所示,语音识别的方法可以包括如下步骤:
步骤101:接收音频输入信号;
步骤102:获取第一音频信号,第一音频信号为本机音频输出装置输出的音频信号;
步骤103:获取第一增益/衰减系数,第一增益/衰减系数为第一音频信号在本机音频输入装置位置的各频点的增益或衰减;
步骤104:根据第一增益/衰减系数及第一音频信号确定第一干扰音频信号,第一干扰音频信号为本机音频输入装置接收到的由本机音频输出装置输出的音频信号;
步骤105:从音频输入信号中滤除第一干扰音频信号得到第二音频信号,第二音频信号为本机音频输入装置接收到的待识别音频信号;
步骤106:对第二音频信号进行语音识别处理。
具体实施中,该语音识别的方法可以应用于移动终端、个人电脑、机器人等设备。其中,本机音频输入装置为本机接收音频信号的装置,例如,目前本机音频输入装置可以是麦克风,也不排除未来的可能会出现的其他形式的可以接收音频信号的装置或器件。本机音频输出装置为本机输出音频信号的装置,例如,目前本机音频输出装置可以是扬声器,也不排除未来的可能会出现的其他形式的可以输出音频信号的装置或器件。
语音识别的时候,本机音频输入装置在接收待识别音频信号的同时,还会接收本机所处环境的背景噪音以及由本机音频输出装置输出的被本机音频输入装置接收到的音频信号。其中,滤除背景噪音已有较成熟的解决方案,可以用多个麦克风,一个麦克风采集携带背景噪音的音频信号,另一个或多个麦克风采集背景噪音,上述两种麦克风所拾取的背景噪声音量是基本相同的,而记录的人声会有6dB左右的音量差,对这些实时采样的数字信号进行频谱分析,在和背景噪音信息库进行比对后,让讲话者的声音频谱通过,而对背景噪音的频谱进行抑制,根据信号消除原理叠加在原有通话信号上以达到较明显的消除背景噪音的效果,从带背景噪音的语音信号中提取尽可能纯净的原始语音。而对于本机音频输出装置输出的音频信号造成对语音识别的干扰,上述方案则无法解决。
第一音频信号,即:本机音频输出装置输出的音频信号,经过一段距离被本机音频输入装置接收,由于第一音频信号经过一段距离的传输后,会产生一定的损耗。为了能够更为准确的获知第一干扰音频信号,需要获取第一音频信号及第一增益/衰减系数,但在具体实施中,对上述二者的获取时序不作具体限定,可以先获取第一音频信号,也可以先获取第一增益/衰减系数。
本发明实施例提供的语音识别的方法可以根据本机音频输出装置输出的音频信号在本机音频输入装置位置的各频点的增益或衰减及本机音频输出装置输出的音频信号,确定本机音频输出装置输出的音频信号造成对语音识别的干扰信号,进而从音频输入信号中滤除本机音频输出装置输出的音频信号造成对语音识别的干扰信号,以得到待识别音频信号。
本发明实施例提供的语音识别的方法,根据第一音频信号及第一增益/衰减系数确定第一干扰音频信号,进而从本机音频输入装置接收到的音频信号中滤除第一干扰音频信号,考虑到了本机音频输出装置与本机音频输入装置之间的音频传播路径及本机音频输出装置输出的音频信号经过该传播路径后的各频点的增益或损耗,可以准确得到第一干扰音频信号,有效提高了在本机音频输出装置有音频输出时进行语音识别的语音识别率。
实施中,获取第一增益/衰减系数,可以具体包括:
通过读取预设的第一增益/衰减系数,获取第一增益/衰减系数;或者,
通过计算第一增益/衰减系数,获取第一增益/衰减系数。
具体实施中,可以在实施语音识别的方法的设备或装置上,预设第一增益/衰减系数,并存在设备或装置的存储模块上,具体如何存储,这里不作具体限定。在实施语音识别时,从存储模块上获取第一增益/衰减系数。
也可以通过实时计算的方式来获取第一增益/衰减系数。
实施中,可以在获取第一音频信号的前一时刻,获取第一增益/衰减系数。
具体实施中,因为实施语音识别的装置或设备的位置可能随时变化,进而音频信号的传输环境也随着发生变化,经传输后的损耗也可能不同,因此实时取声音会得到更好的语音识别效果,保证语音识别的准确率,可以在可以在获取第一音频信号的前一时刻,获取第一增益/衰减系数。即,可以根据当前时刻的第一音频信号及前一时刻的第一增益/衰减系数确定当前时刻的第一干扰音频信号。
实施中,计算第一增益/衰减系数,可以具体包括:
获取第一音频信号;
获取第三音频信号,第三音频信号为本机音频输入装置接收到的由本机音频输出装置输出的音频信号;
根据第一音频信号及第三音频信号的关系,计算第一增益/衰减系数。
具体实施中,第一音频信号是由实施语音识别的设备或装置播放的,可以通过增加接口等方式来获取。第三音频信号可以在仅有本机音频输出装置输出的音频信号的情况下,同时获取本机音频输入装置接收到的音频信号得到,该过程中的背景噪音可以通过现有技术中的多麦克风等方案来滤除。
在获取了第一音频信号和第三音频信号后,就可以将二者进行比较计算,以得到第一增益/衰减系数。
实施中,根据第一音频信号及第三音频信号的关系,计算第一增益/衰减系数,具体可以包括:
根据第一音频信号及第三音频信号的关系,计算第一增益系数,如下:
其中,G为第一增益系数,V2(fi,t)为获取的频点为fi的第三音频信号,V1(fi,t)为获取的频点为fi的第一音频信号;或者,
根据第一音频信号及第三音频信号的关系,计算第一衰减系数,如下:
其中,A为第一衰减系数。
具体实施中,增益,一般而言就是放大倍数,在电子学上,通常为一个系统的信号输出与信号输入的比率,以输出信号同输入信号比值的常用的对数表示。
计算各频点第一增益系数,采用的计算公式具体可以如下:
G为第一增益系数,V2(fi,t)为获取的频点为fi的第三音频信号,V1(fi,t)为获取的频点为fi的第一音频信号。
音频信号是指人耳可以听到的频率在20HZ~20KHz之间的声音。具体实施中,本领域技术人员可以根据实际需要来确定各频点的具体频率。例如,最简单的,可以将20HZ~20KHz的频率范围进行等分而确定相应的频点,也可以根据人耳的音频敏感特性等来确定频点。
确定了频点后,获取第一音频信号在各个频点的信号分量及相应频点上的第三音频信号的信号分量后,采用上述公式即可计算得出第一增益系数。
信号在传输介质中传播时,将会有一部分能量转化成热能或者被传输介质吸收,从而造成信号强度不断减弱,这种现象称为损耗或衰减。本机音频输出装置输出的音频信号在空气介质中传输后被本机音频输入装置接收后的音频信号相对于本机音频输出装置输出的音频信号会存在一定的损耗或衰减。
同上述第一增益系数的计算方式,计算各频点第一衰减系数,可以如下:
通过上述计算,可以较为准确的获取本机音频输出装置输出的音频信号在本机音频输入装置位置的各频点的增益或损耗,进而为确定由本机音频输出装置输出的音频信号对语音识别时带来的干扰信号做好准备工作。
基于同一发明构思,本发明实施例中还提供了一种语音识别的装置,由于该装置解决问题的原理与一种语音识别的方法相似,因此该装置的实施可以参见方法的实施,重复之处不再赘述。
图2为本发明实施例中的语音识别的装置结构示意图,如图2所示,语音识别的装置可以包括:
接收单元201,用于接收音频输入信号;
获取单元202,用于获取第一音频信号,第一音频信号为本机音频输出装置输出的音频信号;
获取单元202进一步用于获取第一增益/衰减系数,第一增益/衰减系数为第一音频信号在本机音频输入装置位置的各频点的增益或衰减;
确定单元203,用于根据第一增益/衰减系数及第一音频信号确定第一干扰音频信号,第一干扰音频信号为本机音频输入装置接收到的由本机音频输出装置输出的音频信号;
滤除单元204,用于从音频输入信号中滤除第一干扰音频信号得到第二音频信号,第二音频信号为本机音频输入装置接收到的待识别音频信号;
识别处理单元205,用于对第二音频信号进行语音识别处理。
本发明实施例提供的语音识别的装置,可以
本发明实施例提供的语音识别的方法、装置及终端,根据第一音频信号及第一增益/衰减系数确定第一干扰音频信号,进而从本机音频输入装置接收到的音频信号中滤除第一干扰音频信号,考虑到了本机音频输出装置与本机音频输入装置之间的音频传播路径及本机音频输出装置输出的音频信号经过该传播路径后的各频点的增益或损耗,可以准确得到第一干扰音频信号,有效提高了在本机音频输出装置有音频输出时进行语音识别的语音识别率。
实施中,获取单元可以具体用于通过读取预设的第一增益/衰减系数,获取第一增益/衰减系数;或者,
通过计算第一增益/衰减系数,获取第一增益/衰减系数。
实施中,获取单元可以进一步用于在获取第一音频信号的前一时刻,获取第一增益/衰减系数。
实施中,获取单元可以进一步包括:
第一获取子单元,用于获取第一音频信号;
第二获取子单元,用于获取第三音频信号,第三音频信号为本机音频输入装置接收到的由本机音频输出装置输出的音频信号;
确定子单元,用于根据第一音频信号及第三音频信号的关系,计算第一增益/衰减系数。
实施中,确定子单元可以具体用于:
根据第一音频信号及第三音频信号的关系,计算各频点第一增益系数,如下:
其中,G为第一增益系数,V2(fi,t)为获取的频点为fi的第三音频信号的信号分量,V1(fi,t)为获取的频点为fi的第一音频信号的信号分量;或者,
根据第一音频信号及第三音频信号的关系,计算各频点第一衰减系数,如下:
其中,A为第一衰减系数。
基于同一发明构思,本发明实施例中还提供了一种终端。图3为本发明实施例中的终端结构示意图,如图3所示,终端可以包括:本机音频输入装置、本机音频输出装置及上述的语音识别的装置,
本机音频输入装置301,用于接收音频信号;
本机音频输出装置302,用于输出音频信号;
语音识别的装置303,用于根据本机音频输入装置接收到的音频信号及本机音频输出装置输出的音频信号,进行语音识别处理。
具体实施中,由于该终端包括了上述的语音识别的装置,可以在本机音频输出装置输出音频信号的情况下的语音识别时,根据本机音频输出装置输出的音频信号及本机音频输出装置输出的音频信号在本机音频输入装置位置的各频点的增益或衰减确定本机音频输入装置接收到的由本机音频输出装置输出的音频信号,进而从本机音频输入装置接收到的音频信号中滤除本机音频输出装置输出的音频导致的音频干扰信号,考虑到了本机音频输出装置与本机音频输入装置之间的音频传播路径及本机音频输出装置输出的音频信号经过该传播路径后的各频点的增益或损耗,可以准确得到本机音频输出装置输出的音频对本机音频输入装置的音频干扰信号,有效提高了在本机音频输出装置有音频输出时进行语音识别的语音识别率。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (11)
1.一种语音识别的方法,其特征在于,包括如下步骤:
接收音频输入信号;
获取第一音频信号,所述第一音频信号为本机音频输出装置输出的音频信号;
获取第一增益/衰减系数,所述第一增益/衰减系数为所述第一音频信号在本机音频输入装置位置的各频点的增益或衰减;
根据所述第一增益/衰减系数及所述第一音频信号确定第一干扰音频信号,所述第一干扰音频信号为本机音频输入装置接收到的由本机音频输出装置输出的音频信号;
从所述音频输入信号中滤除所述第一干扰音频信号得到第二音频信号,所述第二音频信号为本机音频输入装置接收到的待识别音频信号;
对所述第二音频信号进行语音识别处理。
2.如权利要求1所述的方法,其特征在于,所述获取第一增益/衰减系数,具体包括:
通过读取预设的所述第一增益/衰减系数,获取所述第一增益/衰减系数;或者,
通过计算所述第一增益/衰减系数,获取所述第一增益/衰减系数。
3.如权利要求1所述的方法,其特征在于,在获取第一音频信号的前一时刻,获取所述第一增益/衰减系数。
4.如权利要求2所述的方法,其特征在于,所述计算所述第一增益/衰减系数,具体包括:
获取所述第一音频信号;
获取第三音频信号,所述第三音频信号为本机音频输入装置接收到的由本机音频输出装置输出的音频信号;
根据所述第一音频信号及所述第三音频信号的关系,计算所述第一增益/衰减系数。
5.如权利要求4所述的方法,其特征在于,所述根据所述第一音频信号及所述第三音频信号的关系,计算各频点所述第一增益/衰减系数,具体包括:
根据所述第一音频信号及所述第三音频信号的关系,计算各频点所述第一增益系数,如下:
其中,G为所述第一增益系数,V2(fi,t)为获取的第三音频信号频点为fi的信号分量,V1(fi,t)为获取的第一音频信号频点为fi的信号分量;或者,
根据所述第一音频信号及所述第三音频信号的关系,计算各频点所述第一衰减系数,如下:
其中,A为所述第一衰减系数。
6.一种语音识别的装置,其特征在于,包括:
接收单元,用于接收音频输入信号;
获取单元,用于获取第一音频信号,所述第一音频信号为本机音频输出装置输出的音频信号;
获取单元进一步用于获取第一增益/衰减系数,所述第一增益/衰减系数为所述第一音频信号在本机音频输入装置位置的各频点的增益或衰减;
确定单元,用于根据所述第一增益/衰减系数及所述第一音频信号确定第一干扰音频信号,所述第一干扰音频信号为本机音频输入装置接收到的由本机音频输出装置输出的音频信号;
滤除单元,用于从所述音频输入信号中滤除所述第一干扰音频信号得到第二音频信号,所述第二音频信号为本机音频输入装置接收到的待识别音频信号;
识别处理单元,用于对所述第二音频信号进行语音识别处理。
7.如权利要求6所述的装置,其特征在于,所述获取单元具体用于通过读取预设的所述第一增益/衰减系数,获取所述第一增益/衰减系数;或者,
通过计算所述第一增益/衰减系数,获取所述第一增益/衰减系数。
8.如权利要求6所述的装置,其特征在于,所述获取单元进一步用于在获取第一音频信号的前一时刻,获取所述第一增益/衰减系数。
9.如权利要求7所述的装置,其特征在于,所述获取单元,进一步包括:
第一获取子单元,用于获取所述第一音频信号;
第二获取子单元,用于获取第三音频信号,所述第三音频信号为本机音频输入装置接收到的由本机音频输出装置输出的音频信号;
确定子单元,用于根据所述第一音频信号及所述第三音频信号的关系,计算所述第一增益/衰减系数。
10.如权利要求9所述的装置,其特征在于,所述确定子单元具体用于:
根据所述第一音频信号及所述第三音频信号的关系,计算各频点所述第一增益系数,如下:
其中,G为所述第一增益系数,V2(fi,t)为获取的第三音频信号频点为fi的信号分量,V1(fi,t)为获取的第一音频信号频点为fi的信号分量;或者,
根据所述第一音频信号及所述第三音频信号的关系,计算各频点所述第一衰减系数,如下:
其中,A为所述第一衰减系数。
11.一种终端,其特征在于,包括:本机音频输入装置、本机音频输出装置及权利要求6至10任一所述的语音识别的装置,
所述本机音频输入装置,用于接收音频信号;
所述本机音频输出装置,用于输出音频信号;
所述语音识别的装置,用于根据所述本机音频输入装置接收到的音频信号及所述本机音频输出装置输出的音频信号,进行语音识别处理。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510600314.XA CN105261363A (zh) | 2015-09-18 | 2015-09-18 | 一种语音识别的方法、装置及终端 |
PCT/CN2016/096217 WO2017045512A1 (zh) | 2015-09-18 | 2016-08-22 | 一种语音识别的方法、装置、终端及语音识别设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510600314.XA CN105261363A (zh) | 2015-09-18 | 2015-09-18 | 一种语音识别的方法、装置及终端 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105261363A true CN105261363A (zh) | 2016-01-20 |
Family
ID=55101022
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510600314.XA Pending CN105261363A (zh) | 2015-09-18 | 2015-09-18 | 一种语音识别的方法、装置及终端 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN105261363A (zh) |
WO (1) | WO2017045512A1 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017045512A1 (zh) * | 2015-09-18 | 2017-03-23 | 深圳前海达闼科技有限公司 | 一种语音识别的方法、装置、终端及语音识别设备 |
CN108600805A (zh) * | 2018-03-29 | 2018-09-28 | 珠海迈科智能科技股份有限公司 | 一种机顶盒及其去除电视节目声音源干扰的方法 |
CN108650584A (zh) * | 2018-05-31 | 2018-10-12 | 联想(北京)有限公司 | 音频装置、信息处理系统和声音处理方法 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108712624A (zh) * | 2018-08-08 | 2018-10-26 | 上海启诺信息科技有限公司 | 基于文字记录的录像存档装置及方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1202051A (zh) * | 1997-06-11 | 1998-12-16 | 冲电气工业株式会社 | 采用多段增益的回声消除器 |
JP2001044896A (ja) * | 1999-08-03 | 2001-02-16 | Matsushita Electric Ind Co Ltd | 通話装置および通話方法 |
CN1717720A (zh) * | 2003-09-05 | 2006-01-04 | 松下电器产业株式会社 | 声处理系统、声处理装置、声处理方法、声处理程序及存储媒体 |
CN101339769A (zh) * | 2007-07-03 | 2009-01-07 | 富士通株式会社 | 回音抑制器、回音抑制方法 |
US20090089054A1 (en) * | 2007-09-28 | 2009-04-02 | Qualcomm Incorporated | Apparatus and method of noise and echo reduction in multiple microphone audio systems |
CN102057428A (zh) * | 2008-06-11 | 2011-05-11 | 三菱电机株式会社 | 回声消除器 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105261363A (zh) * | 2015-09-18 | 2016-01-20 | 深圳前海达闼科技有限公司 | 一种语音识别的方法、装置及终端 |
-
2015
- 2015-09-18 CN CN201510600314.XA patent/CN105261363A/zh active Pending
-
2016
- 2016-08-22 WO PCT/CN2016/096217 patent/WO2017045512A1/zh active Application Filing
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1202051A (zh) * | 1997-06-11 | 1998-12-16 | 冲电气工业株式会社 | 采用多段增益的回声消除器 |
JP2001044896A (ja) * | 1999-08-03 | 2001-02-16 | Matsushita Electric Ind Co Ltd | 通話装置および通話方法 |
CN1717720A (zh) * | 2003-09-05 | 2006-01-04 | 松下电器产业株式会社 | 声处理系统、声处理装置、声处理方法、声处理程序及存储媒体 |
CN101339769A (zh) * | 2007-07-03 | 2009-01-07 | 富士通株式会社 | 回音抑制器、回音抑制方法 |
US20090089054A1 (en) * | 2007-09-28 | 2009-04-02 | Qualcomm Incorporated | Apparatus and method of noise and echo reduction in multiple microphone audio systems |
CN102057428A (zh) * | 2008-06-11 | 2011-05-11 | 三菱电机株式会社 | 回声消除器 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017045512A1 (zh) * | 2015-09-18 | 2017-03-23 | 深圳前海达闼科技有限公司 | 一种语音识别的方法、装置、终端及语音识别设备 |
CN108600805A (zh) * | 2018-03-29 | 2018-09-28 | 珠海迈科智能科技股份有限公司 | 一种机顶盒及其去除电视节目声音源干扰的方法 |
CN108650584A (zh) * | 2018-05-31 | 2018-10-12 | 联想(北京)有限公司 | 音频装置、信息处理系统和声音处理方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2017045512A1 (zh) | 2017-03-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10891931B2 (en) | Single-channel, binaural and multi-channel dereverberation | |
US10210883B2 (en) | Signal processing apparatus for enhancing a voice component within a multi-channel audio signal | |
CN103391347B (zh) | 一种自动录音的方法及装置 | |
KR20170053623A (ko) | 사운드 소스들을 향상시키기 위한 방법 및 장치 | |
US10755728B1 (en) | Multichannel noise cancellation using frequency domain spectrum masking | |
CN103428609A (zh) | 用于去除噪声的设备和方法 | |
CN111477238B (zh) | 一种回声消除方法、装置及电子设备 | |
CN104505099A (zh) | 去除语音信号中已知干扰的方法和设备 | |
CN106664472A (zh) | 信号处理设备、信号处理方法和计算机程序 | |
CN111796790B (zh) | 一种音效调节方法、装置、可读存储介质及终端设备 | |
CN105261363A (zh) | 一种语音识别的方法、装置及终端 | |
CN112992190B (zh) | 音频信号的处理方法、装置、电子设备和存储介质 | |
US20160163334A1 (en) | Voice signal processing device and voice signal processing method | |
WO2022256577A1 (en) | A method of speech enhancement and a mobile computing device implementing the method | |
Hosseini et al. | Speaker-independent brain enhanced speech denoising | |
US8254590B2 (en) | System and method for intelligibility enhancement of audio information | |
CN114302286A (zh) | 一种通话语音降噪方法、装置、设备及存储介质 | |
KR102378207B1 (ko) | 오디오 신호들을 정제하는 멀티 오럴 mmse 분석 기술들 | |
CN111028857B (zh) | 基于深度学习的多通道音视频会议降噪的方法及系统 | |
JP2006227328A (ja) | 音声処理装置 | |
CN116312621A (zh) | 时延估计方法、回声消除方法、训练方法和相关设备 | |
US20230360662A1 (en) | Method and device for processing a binaural recording | |
US8615075B2 (en) | Method and apparatus for removing noise signal from input signal | |
CN111354341A (zh) | 语音唤醒方法及装置、处理器、音箱和电视机 | |
CN111145770A (zh) | 音频处理方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160120 |