CN108449691B - 一种拾音装置及声源距离确定方法 - Google Patents
一种拾音装置及声源距离确定方法 Download PDFInfo
- Publication number
- CN108449691B CN108449691B CN201810420007.7A CN201810420007A CN108449691B CN 108449691 B CN108449691 B CN 108449691B CN 201810420007 A CN201810420007 A CN 201810420007A CN 108449691 B CN108449691 B CN 108449691B
- Authority
- CN
- China
- Prior art keywords
- sound
- distance
- microphone
- pickup
- frequency response
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/12—Circuits for transducers, loudspeakers or microphones for distributing signals to two or more loudspeakers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
Landscapes
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本申请提供了一种拾音装置,包括近讲拾音模块、麦克风阵列拾音模块和输出控制模块,近讲拾音模块至少包括近讲麦克风,麦克风阵列拾音模块至少包括麦克风阵列。输出控制模块用于,依据声源与拾音装置的距离,控制输出近讲拾音模块拾取的声音信号和/或麦克风阵列拾音模块拾取的声音信号。基于输出控制模块的功能,拾音装置能够在中场声源的情况下,将麦克风阵列输出的声音信号输出至语音转写装置,因此,能够避免因发言人远离近讲麦克风而导致的语音转写的准确性下降的问题。并且,拾音装置还可以将近讲拾音模块输出的声音信息输出至扩音装置,因此,在保证语音转写的准确性的同时,避免麦克风阵列输出的声音信号作为扩音源带来的回声干扰问题。
Description
技术领域
本申请涉及电子信息领域,尤其涉及一种拾音装置及声源距离确定方法。
背景技术
随语音识别技术的发展,语音转写技术有了突破性的进展,实时将语音转写为文字在众多场景下都有成功的应用。会议是语音转写应用的重要场景,通过在线或离线语音转写技术,把会议中的发言转换为文字形成详尽的会议记录,能够方便会议内容存储、查询、检索和传播。
目前,会议所使用的麦克风一般为近讲麦克风,需要发言人靠近麦克风+才能有效拾音,在此情况下,采集到的声音信号也能够满足语音转写的需求。然而,如果发言人距离近讲麦克风超过一定的距离,例如50厘米,采集到的语音信号较弱,会降低语音转写的准确性。
发明内容
本申请提供了一种拾音装置及声源距离确定方法,目的在于解决近讲麦克风导致的语音转写的准确性降低的问题。
为了实现上述目的,本申请提供了以下技术方案:
一种拾音装置,包括:
近讲拾音模块、麦克风阵列拾音模块和输出控制模块;
所述近讲拾音模块至少包括近讲麦克风;所述麦克风阵列拾音模块至少包括麦克风阵列;
所述输出控制模块用于,依据声源与所述拾音装置的距离,控制输出所述近讲拾音模块拾取的声音信号和/或所述麦克风阵列拾音模块拾取的声音信号。
可选的,还包括:
声源距离识别模块,用于依据所述近讲麦克风拾取的声音信号与所述麦克风阵列拾取的声音信号的低频响应差异,识别所述声源与所述拾音装置的距离。
可选的,所述声源距离识别模块用于依据所述近讲麦克风拾取的声音信号与所述麦克风阵列拾取的声音信号的低频响应差异,识别声源与所述拾音装置的距离,包括:
确定所述近讲麦克风拾取的声音信号与所述麦克风阵列拾取的声音信号的低频响应差异;
依据预设的频率响应差异与距离范围的对应关系,确定所述声源与所述拾音装置的距离范围。
可选的,所述声源距离识别模块还用于:
在所述确定所述近讲麦克风拾取的声音信号与所述麦克风阵列拾取的声音信号的低频响应差异之前,确定第一低频响应和第二低频响应,所述第一低频响应为所述近讲麦克风拾取的声音信号的低频响应,所述第二低频响应为所述麦克风阵列拾取的声音信号的低频响应;
确定第三低频响应和第四低频响应,所述第三低频响应为将所述第一低频响应进行预处理的结果,所述第四低频响应为将所述第二低频响应进行预处理的结果,所述预处理至少包括归一化处理;
所述声源距离识别模块用于确定所述近讲麦克风拾取的声音信号与所述麦克风阵列拾取的声音信号的低频响应差异包括:
确定所述第三低频响应与所述第四低频响应的差异值。
可选的,所述预处理还包括:
将所述第一低频响应在任意一个预设的频带内的均值,作为所述第一低频响应在该频带内的第一低频响应;
将所述第二低频响应在任意一个所述预设的频带内的均值,作为所述第二低频响应在该频带内的第二低频响应;
其中,所述预设的频带至少包括一个低频频带。
可选的,所述输出控制模块用于依据声源与所述拾音装置的距离,控制输出所述近讲拾音模块拾取的声音信号或者所述麦克风阵列拾音模块拾取的声音信号,包括:
所述输出控制模块具体用于,在所述距离属于预设的第一范围的情况下,控制输出所述近讲拾音模块输出的声音信号,在所述距离属于预设的第二范围的情况下,控制输出所述麦克风阵列拾音模块输出的声音信号,属于所述第二范围的距离大于属于所述第一范围的距离。
可选的,所述输出控制模块还用于:
在所述距离属于预设的第三范围的情况下,无输出;属于所述第三范围的距离大于属于所述第二范围的距离。
可选的,所述输出控制模块用于在所述距离属于预设的第一范围的情况下,控制输出所述近讲拾音模块输出的声音信号,包括:
所述输出控制模块具体用于,在所述距离属于所述预设的第一范围的情况下,控制输出所述近讲拾音模块输出的声音信号至语音转写装置;
所述输出控制模块用于在所述距离属于预设的第二范围的情况下,控制输出所述麦克风阵列拾音模块输出的声音信号,包括:
所述输出控制模块具体用于,在所述距离属于所述预设的第二范围的情况下,控制输出所述麦克风阵列拾音模块输出的声音信号至所述语音转写装置;
所述输出控制模块还用于:
在所述距离属于所述预设的第一范围的情况下,控制输出所述近讲拾音模块输出的声音信号至扩音装置。
可选的,所述拾音装置为鹅颈麦克风;
所述鹅颈麦克风的拾音元件包括所述近讲麦克风和所述麦克风阵列。
可选的,所述鹅颈麦克风包括电路板,所述电路板上设置数字信号处理芯片,所述数字信号处理芯片用于实现所述声源距离识别模块和所述输出控制模块的功能。
本申请所述的拾音装置,包括近讲拾音模块、麦克风阵列拾音模块和输出控制模块,其中,近讲拾音模块至少包括近讲麦克风,麦克风阵列拾音模块至少包括麦克风阵列。输出控制模块用于,依据声源与所述拾音装置的距离,控制输出近讲拾音模块拾取的声音信号和/或麦克风阵列拾音模块拾取的声音信号。基于输出控制模块的功能,上述拾音装置能够在中场声源的情况下,将麦克风阵列输出的声音信号输出至语音转写装置,因此,能够避免因发言人远离近讲麦克风而导致的语音转写的准确性下降的问题。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例公开的一种拾音装置的结构示意图;
图2(a)为指向型麦克风的频率响应曲线图;
图2(b)为全向型麦克风的频率响应曲线图;
图3为本申请实施例公开的识别声源与拾音装置的距离的方法的流程图;
图4为本申请实施例公开的又一种拾音装置的结构示意图;
图5为本申请实施例公开的鹅颈麦克风的结构示意图。
具体实施方式
申请人在研究的过程中发现,通过提高近讲麦克风的灵敏性,虽然能够提高对于中场声源(如声源距离麦克风的距离为0.3米至1米)的拾音效果,从而保证对于中场声源的转写准确性,但会引入以下新的问题:1、高灵敏性的近讲麦克风会给现场扩音带来自激啸叫的问题。2、拾取现场噪音的敏感性同时被加强,因此导致信噪比降低,对于近场声源(如声源距离麦克风的距离小于0.3米)的转写的准确性降低。
为了解决上述问题,申请人尝试使用麦克风阵列作为拾音装置,以提高中场声源的转写准确性,但仍然会引入新的问题:由于麦克风阵列拾取的声音信号需要经过处理才能够满足转写需求,而这个处理过程需要较长的时间,因此,麦克风阵列不能满足实时扩音输出的需求。
基于上述研究,本申请将近讲麦克风与麦克风阵列相结合,并依据声源与麦克风之间不同的距离,控制将近讲麦克风或者麦克风阵列拾取的声音作为语音转写的声源,使得随着声源距离的变化,切换语音转写的声源,从而保证语音转写的准确性。并且,将近讲麦克风拾取的声音作为扩音输出的声源,在保证语音转写准确性的同时,确保扩音的效果。
下面将结合本申请实施例中的附图,以会议场景为例,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
图1为本申请实施例公开的一种拾音装置,包括:近讲麦克风101、麦克风阵列102、声源距离识别模块103、输出控制模块104、第一声音处理模块105、以及第二声音处理模块106。
其中,近讲麦克风101为指向性麦克风。第一声音处理模块105用于对近讲麦克风101拾取的声音进行放大、滤波等处理并(处理的目的是输出幅值大小适于转写的信号)输出。
麦克风阵列102中包括至少两个麦克风。麦克风阵列102中的麦克风可以为全向型麦克风,也可以为指向型麦克风。第二声音处理模块106用于对麦克风阵列102拾取的声音进行处理(例如进行指向性拾音)以及放大输出等。
需要说明的是,第一声音处理模块105和第二声音处理模块106的具体功能实现可以参见现有技术,这里不再赘述。第一声音处理模块105和第二声音处理模块106可以为数字信号处理芯片,两者可以为独立设置的芯片,也可以集成设置在一个芯片中。
声源距离识别模块103用于依据近讲麦克风101拾取的声音信号与麦克风阵列102拾取的声音信号的低频响应差异,识别声源与拾音装置的距离。需要说明的是,本实施例中,声源的距离统一使用声源与拾音装置的距离,实质可能是声源与近讲麦克风101或麦克风阵列102的距离。
输出控制模块104用于依据声源与拾音装置的距离,控制输出近讲拾音模块拾取的声音信号和/或麦克风阵列拾音模块拾取的声音信号。
具体的,在声源距离识别模块103识别出的距离属于第一范围的情况下,输出控制模块104输出第一声音处理模块105输出的声音信号,可选的,将第一声音处理模块105输出的声音信号输出至语音转写装置。在声源距离识别模块103识别出的距离属于第二范围的情况下,输出控制模块104输出第二声音处理模块106输出的声音信号,可选的,将第二声音处理模块106输出的声音信号输出至语音转写装置。其中,属于第二范围距离值大于属于第一范围内的距离值,例如,第一范围可以为(0,30cm],第二范围可以为(30cm,100cm)。
可选的,输出控制模块104还用于在声源距离识别模块103识别出的距离属于第三范围的情况下,无输出。属于第三范围的距离值大于属于第二范围的距离值,例如,第三范围可以为大于100cm。也就是说,如果声源过远,声音信号的质量已经不适合进行语音转写,在此情况下,可以保持静音状态。
可选的,输出控制模块104还用于输出近讲拾音模块输出的声音信号至扩音装置,用于会议现场的扩音。可选的,在声源距离识别模块103识别出的距离属于第一范围的情况下,输出控制模块104将近讲拾音模块输出的声音信号输出至扩音装置,限定第一范围的目的在于,对于发言者不在近讲麦克风有效拾音范围内的讲话,不进行扩音。当然,也可以不限定第一范围,而始终将近讲拾音模块输出的声音信号输出至扩音装置。
综上所述,在声源距离识别模块103识别出的距离属于第一范围的情况下,输出控制模块104输出第一声音处理模块105输出的声音信号至扩音装置,同时,输出第一声音处理模块105输出的声音信号至语音转写装置。在声源距离识别模块103识别出的距离属于第二范围的情况下,输出控制模块104输出第二声音处理模块106输出的声音信号至语音转写装置。
因此,能够保证对于中场声源,使用麦克风阵列作为语音转写的拾音装置,以提高对于中场声源转写的准确性。并且,又不会引入自激啸叫和较大的噪声。同时,将近讲麦克风拾取的声音信号作为扩音的声源,又能够避免因麦克风阵列的延时输出而带来回声干扰问题。
可选的,在声源距离识别模块103识别出的距离属于第一范围的情况下,输出控制模块104也可以输出第二声音处理模块106输出的声音信号至语音转写装置,并同时输出第一声音处理模块105输出的声音信号至扩音装置,即始终使用麦克风阵列作为语音转写的拾音装置,使用近讲麦克风作为扩音的拾音装置。
可选的,在声源距离识别模块103识别出的距离属于第一范围的情况下,输出控制模块104还可以输出第一声音处理模块105和第二声音处理模块106输出的声音信号至语音转写装置,并同时输出第一声音处理模块105输出的声音信号至扩音装置。
图1中,输出控制模块以信道开关为例,但本实施例中并不将输出控制模块限定为信道开关。图1中,信道开关的中间的不动端不与其它部分连接,用于上述无输出的情况,即输出控制模块在声源距离识别模块103识别出的距离在第三范围的情况下,控制由动端连接到中间的不动端,实现无输出。
下面将对声源距离识别模块103依据近讲麦克风101拾取的声音信号与麦克风阵列102拾取的声音信号的低频响应差异,识别声源与拾音装置的距离的原理以及具体过程进行详细说明:
图2(a)为指向型麦克风(即近讲麦克风101)的频率响应曲线,图2(b)为全向型麦克风(即麦克风阵列102)的频率响应曲线。从图2可以看出,在近距离拾音的情况下,指向型麦克风(即近讲麦克风101)在低频段有显著的正向增益,即在小于1K赫兹的频段内灵敏度有显著的提升。声源距离近讲麦克风101越近,低频增益越大。而全向型麦克风在低频段则没有显著的正向增益,在小于1K赫兹的频段内,全向型麦克风的频率响应曲线可以近似为直线。
声源距离识别模块103正是利用近讲麦克风101与全向型麦克风的这种低频响应差异,识别声源与麦克风的距离。
图3为声源距离识别模块103识别声源与拾音装置的距离的具体过程,包括以下步骤:
S301:对近讲麦克风采集的声音信号进行快速傅里叶(Fast FourierTransformation,FFT)变换,得到近讲麦克风的频率响应Xd,并对麦克风阵列中的任意一个麦克风采集的声音信号进行FFT变换,得到麦克风阵列的频率响应Xo。
S302:计算Xd和Xo在预设的频带内的值。
本实施例中,预设的频带按照以下方式获得:
依据一倍频程将中心频率分别划分为:63赫兹(记为ω0)、125赫兹(记为ω1)、250赫兹(记为ω2)、500赫兹(记为ω3)、1000赫兹(记为ω4)、2000赫兹(记为ω5)和4000赫兹(记为ω6)。以上中心频率为预设的频带的中心频率。以上中心频率确定的子带为预设的频带。也可以依据经验设定其他子带划分。预设的频带(即上述子带)的宽度依据经验设定。
Xd在预设的频带中的值分别为Xd={Xd(ω0),Xd(ω1),…,Xd(ω6)},其中,Xd(ωi)为在中心频率为ωi的频段内的Xd的均值。Xo在预设的频带中的值分别为Xo={Xo(ω0),Xo(ω1),…,Xo(ω6)},其中,Xo(ωi)为在中心频率为ωi的频段内的Xo的均值。
划分频带的目的在于,使用一个频段内的多个频率响应的均值代替该频段内的多个频率响应,减少频率响应的数量,以降低后续的计算量。
以上所述的频带仅为示例,而不作为对预设的频带的限定,预设的频带包括人声集中的低频频带即可。预设频带的数量可以为一个,也可以为多个。
S303:将Xd与Xo在预设的频带中的值进行归一化处理。
归一化处理的目的在于,统一Xd与Xo的频率坐标,以得到准确的差异比较值。
考虑到语音中频丰富的特点,本实施例中,将1000赫兹为中心频率的频率响应作为归一化的基准,得到以下归一化结果:
表1
当然,上述中心频率小于1000赫兹的其它频带的频率响应也可以作为归一化的基准。
本实施例中,以先计算均值,再进行归一化处理为例,也可以先对Xd和Xo进行归一化处理,再对归一化处理的结果计算均值。
S304:计算归一化后的频率响应的差异值,即Xno与Xnd的差异值。
计算规则如下:
表2
其中,阈值-20(本实施例中,频率响应的单位均为dB)为频率响应的最小值,选择-20的原因为,通常语音的频率响应不会低于该阈值,当然,从图(2)可以看出,最低值也可以使用-15等数值。实际应用中,可以凭经验选取该阈值。
在小于上述阈值的情况下,可以认为声音信号中仅包括背景噪声,而无有效语音,因此,使用-60与Xnd(ωi)-Xno(ωi)相区分。
S305:依据频段内的频率响应差异与距离的对应关系,确定Xno与Xnd的差异值Xe对应的距离。
本实施例中,频段内的频率响应差异与距离的对应关系的一个示例为:
表3
Xe(125) | Xe(250) | Xe(500) | |
远距离≥100cm | (-12,3) | (-12,1) | (-12,-1) |
中距离(30cm-100cm) | [3,6) | [1,4) | [-1,2) |
近距离≤30cm | (6,12) | (4,12) | (2,12) |
例如,中心频率为125的频段内的频率响应差异Xe在范围(-12,3)内,属于远距离,在范围[3,6)内,属于中距离,在范围(6,12)内,属于近距离。
从表3的对应关系可以看出,表2中的-60也可以使用其它数值,小于-12的数值均可,也有可能跟随表3的对应关系的变化而变化,只要小于对应关系中远距离判定的最小差异值(表3中以-12为例)即可。
表3中列举了中心频率为125、250和500的频段的低频响应差异与距离的对应关系,依据表3,可以将Xnd(125)-Xno(125)、Xnd(250)-Xno(250)以及Xnd(500)-Xno(500)的值与表3中对应的频段的频率响应差值范围对比,例如,将Xnd(125)-Xno(125)与表3中Xe(125)对应的频率响应差值范围对比。如果Xnd(125)-Xno(125)落入[3,6),则确定为中距离。如果使用Xnd(250)-Xno(250)对比对应关系也得到中距离的结果,则确定声源距离拾音装置为中距离,即30cm-100cm。
需要说明的是,表3中以中心频率为125、250和500的频段为例的目的在于,这三个频段为语音较为集中的频段。当然可以选用其它低频频段,也可以在这三个频段的基础上,增加其它低频频段。在利用多个频段对比的情况下,可以选择一个频段的对比结果为最终的距离判定结果,也可以选择多数频段的对比结果作为最终的距离判定结果。
可选的,因为表3中仅选择了三个低频频段作为判定依据,因此,在S302中,预设的频段也可以仅选择这三个低频频段。
表3中的距离范围仅为示例,而不做限定。
图1中所述的拾音装置在会议场景中的使用过程为:
拾音装置的近讲麦克风101和麦克风阵列102分别进行拾音,近讲麦克风101拾取的声音一路输出至第一声音处理模块105,一路输出至声源距离识别模块103。经第一声音处理模块105处理后,输出至会场的扩音设备,由扩音设备进行扩音输出。
麦克风阵列102拾取的声音一路输出至第二声音处理模块106,一路输出至声源距离识别模块103。
声源距离识别模块103按照图3所示的方法确定声源距离拾音装置的距离范围后,将距离范围输出至输出控制模块104,输出控制模块104依据距离范围控制输出至语音转写装置的信号:距离范围为远距离(如≥100cm),无输出信号;距离范围为中距离(如30cm-100cm),输出第二声音处理模块106处理后的麦克风阵列102拾取的声音信号;距离范围为近距离(如≤30cm),输出第一声音处理模块105处理后的近讲麦克风101拾取的声音信号。
可见,图1所示的拾音装置,对于中距离的声源,使用麦克风阵列拾取的声音信号作为语音转写的声源,因为麦克风阵列对于中距离声源的拾音效果优于近讲麦克风,因此,与近讲麦克风相比,图1所示的拾音装置能够提高中距离声源的转写准确性。
并且,图1所示的拾音装置,仍然使用近讲麦克风拾取的声音信号进行扩音放大,因此,能够满足实时扩音播放的需求。
图4为本申请实施例公开的又一种拾音装置,包括:近讲麦克风101、麦克风阵列102、声源距离识别模块103以及输出控制模块104。其中,近讲麦克风101、麦克风阵列102、声源距离识别模块103的功能如前所述,这里不再赘述。
与图1所示的拾音装置的不同之处在于,不再设置第一声音处理模块和第二声音处理模块。因为第一声音处理模块和第二声音处理模块的功能为现有技术,因此,可以将这两个模块设置在拾音装置之外,对拾音装置输出的声音信号进行处理即可。
具体的,如图4所示,输出控制模块104分别与近讲麦克风101和麦克风阵列102相连,输出控制模块104包括两个可连接端口。第一声音处理模块通过第一可连接端口与拾音装置中的近讲麦克风101处于可连接状态,第二声音处理模块通过第二可连接端口与拾音装置中的麦克风阵列102处于可连接状态。输出控制模块104依据声源距离识别模块输出的距离范围,确定是否连接可连接端口:距离范围为中距离(如30cm-100cm),控制第二可连接端口连接,此时,第二声音处理模块接收麦克风阵列102拾取的声音信号,并将处理后的声音信号输出至语音转写装置;距离范围为近距离(如≤30cm),控制第一可连接端口连接,此时,第一声音处理模块接收近讲麦克101拾取的声音信号,并将处理后的声音信号分别输出至语音转写装置和扩音装置。可选的,距离范围为远距离(如≥100cm)的情况下,输出控制模块控制第一可连接端口和第二可连接端口均断开连接,以保证没有输出,从而不进行语音转写和扩音。
可见,图4所示的拾音装置,也能够实现现场实时扩音以及保证对中距离声源的语音转写的准确性,同时保证对近距离声源的实时扩音效果。
综上所述,图1所示的拾音装置包括第一声音处理模块和第二声音处理模块,图4所示的拾音装置不包括第一声音处理模块和第二声音处理模块,以此进行扩展,本申请实施例所述的拾音装置中,可以包括第一声音处理模块和第二声音处理模块中的至少一个,包括在拾音装置中的声音处理模块,与其它部分的连接方式可以参见如图1中相应的连接方式,不包括在拾音装置中的声音处理模块,与拾音装置的连接关系可以参见图4中相应的连接方式。
为了便于描述,可以将近讲麦克风和第一声音处理模块统称为近讲拾音模块,将麦克风阵列和第二声音处理模块统称为麦克风阵列拾音模块。如前所述,近讲拾音模块至少包括近讲麦克风,可以包括第一声音处理模块。麦克风阵列拾音模块至少包括麦克风阵列,可以包括第二声音处理模块。
可选的,图1和图4所示的拾音装置中,也可以不包括声源距离识别模块,输出控制模块接收现有的距离判定装置输出的距离即可。
图1和图4中的输出控制模块的具体形态仅为示例,而不作为限定,只要能实现在声源距离识别模块确定的距离在第一范围的情况下,控制输出近讲拾音模块拾取的声音信号,在声源距离识别模块确定的距离在第二范围的情况下,控制输出麦克风阵列拾音模块拾取的声音信号即可。
需要说明的是,图1、图4以及图5中的第一声音处理模块均为可选模块。在不包括第一声音处理模块的情况下,如果声源距离识别模块确定的距离范围为近距离,则直接将近讲麦克风拾取的声音信号作为语音转写的声源。因为近讲麦克风对近距离声源的拾音效果较好,因此,即使不进行处理,也能够满足语音转写的需求。
图5为本申请实施例公开的拾音装置的具体产品形态的示例。图5为一种鹅颈麦克风,其中,近讲麦克风与麦克风阵列一字排开,麦克风之间的间距可以为10毫米。可选的,与麦克风阵列相比,近讲麦克风更靠近自由端,以更好拾取近距离的发言者的声音。其中,自由端为与固定端相对的一端,固定端为用于固定麦克风(例如鹅颈麦克风的颈部)或者用于用户手持的一端,以更好拾取近距离的发言者的声音。
鹅颈麦克风还包括电路板,电路板上集成具有数字信号处理芯片,数字信号处理芯片具有声源距离识别模块以及输出控制模块的功能,可选的,数字信号处理芯片还具有第一声音处理模块和/或第二声音处理模块的功能。
本申请实施例方法所述的功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算设备可读取存储介质中。基于这样的理解,本申请实施例对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一台计算设备(可以是个人计算机,服务器,移动计算设备或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (11)
1.一种拾音装置,其特征在于,包括:
近讲拾音模块、麦克风阵列拾音模块和输出控制模块;
所述近讲拾音模块至少包括近讲麦克风;所述麦克风阵列拾音模块至少包括麦克风阵列;
所述输出控制模块用于,在声源与所述拾音装置的距离属于预设的第二范围的情况下,控制输出所述麦克风阵列拾音模块拾取的声音信号,其中,所述第二范围为超出所述近讲麦克风有效拾音范围的距离范围。
2.根据权利要求1所述的装置,其特征在于,还包括:
声源距离识别模块,用于依据所述近讲麦克风拾取的声音信号与所述麦克风阵列拾取的声音信号的低频响应差异,识别所述声源与所述拾音装置的距离。
3.根据权利要求2所述的装置,其特征在于,所述声源距离识别模块用于依据所述近讲麦克风拾取的声音信号与所述麦克风阵列拾取的声音信号的低频响应差异,识别声源与所述拾音装置的距离,包括:
确定所述近讲麦克风拾取的声音信号与所述麦克风阵列拾取的声音信号的低频响应差异;
依据预设的频率响应差异与距离范围的对应关系,确定所述声源与所述拾音装置的距离范围。
4.根据权利要求3所述的装置,其特征在于,所述声源距离识别模块还用于:
在所述确定所述近讲麦克风拾取的声音信号与所述麦克风阵列拾取的声音信号的低频响应差异之前,确定第一低频响应和第二低频响应,所述第一低频响应为所述近讲麦克风拾取的声音信号的低频响应,所述第二低频响应为所述麦克风阵列拾取的声音信号的低频响应;
确定第三低频响应和第四低频响应,所述第三低频响应为将所述第一低频响应进行预处理的结果,所述第四低频响应为将所述第二低频响应进行预处理的结果,所述预处理至少包括归一化处理;
所述声源距离识别模块用于确定所述近讲麦克风拾取的声音信号与所述麦克风阵列拾取的声音信号的低频响应差异包括:
确定所述第三低频响应与所述第四低频响应的差异值。
5.根据权利要求4所述的装置,其特征在于,所述预处理还包括:
将所述第一低频响应在任意一个预设的频带内的均值,作为所述第一低频响应在该频带内的第一低频响应;
将所述第二低频响应在任意一个所述预设的频带内的均值,作为所述第二低频响应在该频带内的第二低频响应;
其中,所述预设的频带至少包括一个低频频带。
6.根据权利要求1或2所述的装置,其特征在于,所述输出控制模块具体用于,在声源与所述拾音装置的距离属于预设的第一范围的情况下,控制输出所述近讲拾音模块输出的声音信号,在声源与所述拾音装置的距离属于预设的第二范围的情况下,控制输出所述麦克风阵列拾音模块输出的声音信号,属于所述第二范围的距离大于属于所述第一范围的距离。
7.根据权利要求6所述的装置,其特征在于,所述输出控制模块还用于:
在所述距离属于预设的第三范围的情况下,无输出;属于所述第三范围的距离大于属于所述第二范围的距离。
8.根据权利要求6所述的装置,其特征在于,所述输出控制模块用于在声源与所述拾音装置的距离属于预设的第一范围的情况下,控制输出所述近讲拾音模块输出的声音信号,包括:
所述输出控制模块具体用于,在声源与所述拾音装置的距离属于所述预设的第一范围的情况下,控制输出所述近讲拾音模块输出的声音信号至语音转写装置;
所述输出控制模块用于在声源与所述拾音装置的距离属于预设的第二范围的情况下,控制输出所述麦克风阵列拾音模块输出的声音信号,包括:
所述输出控制模块具体用于,在声源与所述拾音装置的距离属于所述预设的第二范围的情况下,控制输出所述麦克风阵列拾音模块输出的声音信号至所述语音转写装置;
所述输出控制模块还用于:
在声源与所述拾音装置的距离属于所述预设的第一范围的情况下,控制输出所述近讲拾音模块输出的声音信号至扩音装置。
9.根据权利要求1所述的装置,其特征在于,所述拾音装置为鹅颈麦克风;
所述鹅颈麦克风的拾音元件包括所述近讲麦克风和所述麦克风阵列。
10.根据权利要求2所述的装置,其特征在于,所述拾音装置为鹅颈麦克风;
所述鹅颈麦克风的拾音元件包括所述近讲麦克风和所述麦克风阵列。
11.根据权利要求10所述的装置,其特征在于,所述鹅颈麦克风包括电路板,所述电路板上设置数字信号处理芯片,所述数字信号处理芯片用于实现所述声源距离识别模块和所述输出控制模块的功能。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810420007.7A CN108449691B (zh) | 2018-05-04 | 2018-05-04 | 一种拾音装置及声源距离确定方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810420007.7A CN108449691B (zh) | 2018-05-04 | 2018-05-04 | 一种拾音装置及声源距离确定方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108449691A CN108449691A (zh) | 2018-08-24 |
CN108449691B true CN108449691B (zh) | 2021-05-04 |
Family
ID=63202936
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810420007.7A Active CN108449691B (zh) | 2018-05-04 | 2018-05-04 | 一种拾音装置及声源距离确定方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108449691B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109600703B (zh) * | 2018-12-27 | 2021-08-06 | 深圳市技湛科技有限公司 | 扩声系统及其扩声方法和计算机可读存储介质 |
CN112992169B (zh) * | 2019-12-12 | 2024-06-11 | 华为技术有限公司 | 语音信号的采集方法、装置、电子设备以及存储介质 |
CN112860065A (zh) * | 2021-02-05 | 2021-05-28 | Oppo广东移动通信有限公司 | 拾音控制方法、拾音控制装置、存储介质及电子设备 |
CN114172530B (zh) * | 2021-12-17 | 2023-06-16 | 海宁鐵三角科技有限公司 | 一种近距离无啸叫对讲机和对讲系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102077274A (zh) * | 2008-06-30 | 2011-05-25 | 杜比实验室特许公司 | 多麦克风语音活动检测器 |
US8238569B2 (en) * | 2007-10-12 | 2012-08-07 | Samsung Electronics Co., Ltd. | Method, medium, and apparatus for extracting target sound from mixed sound |
CN102938254A (zh) * | 2012-10-24 | 2013-02-20 | 中国科学技术大学 | 一种语音信号增强系统和方法 |
CN105897591A (zh) * | 2016-03-21 | 2016-08-24 | 安徽声讯信息技术有限公司 | 一种具有可移动的无线路由器和远场速记文字功能的装置 |
CN106371801A (zh) * | 2016-09-23 | 2017-02-01 | 安徽声讯信息技术有限公司 | 一种基于语音识别技术的语音鼠标系统 |
CN107018470A (zh) * | 2016-01-28 | 2017-08-04 | 讯飞智元信息科技有限公司 | 一种基于环形麦克风阵列的语音记录方法及系统 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1534973A (zh) * | 2003-04-01 | 2004-10-06 | 黄文义 | 可补偿麦克风灵敏度的音讯会议系统及其方法 |
WO2006006935A1 (en) * | 2004-07-08 | 2006-01-19 | Agency For Science, Technology And Research | Capturing sound from a target region |
TW200734888A (en) * | 2006-03-01 | 2007-09-16 | Univ Nat Chiao Tung | Visualization system of acoustic source energy distribution and the method thereof |
CN102045618B (zh) * | 2009-10-19 | 2015-03-04 | 联想(北京)有限公司 | 自动调整的麦克风阵列、方法和携带麦克风阵列的装置 |
CN204906560U (zh) * | 2015-08-20 | 2015-12-23 | 深圳市达威思智能科技有限公司 | 一种单设备双备份阵列话筒会议系统 |
US10469976B2 (en) * | 2016-05-11 | 2019-11-05 | Htc Corporation | Wearable electronic device and virtual reality system |
-
2018
- 2018-05-04 CN CN201810420007.7A patent/CN108449691B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8238569B2 (en) * | 2007-10-12 | 2012-08-07 | Samsung Electronics Co., Ltd. | Method, medium, and apparatus for extracting target sound from mixed sound |
CN102077274A (zh) * | 2008-06-30 | 2011-05-25 | 杜比实验室特许公司 | 多麦克风语音活动检测器 |
CN102938254A (zh) * | 2012-10-24 | 2013-02-20 | 中国科学技术大学 | 一种语音信号增强系统和方法 |
CN107018470A (zh) * | 2016-01-28 | 2017-08-04 | 讯飞智元信息科技有限公司 | 一种基于环形麦克风阵列的语音记录方法及系统 |
CN105897591A (zh) * | 2016-03-21 | 2016-08-24 | 安徽声讯信息技术有限公司 | 一种具有可移动的无线路由器和远场速记文字功能的装置 |
CN106371801A (zh) * | 2016-09-23 | 2017-02-01 | 安徽声讯信息技术有限公司 | 一种基于语音识别技术的语音鼠标系统 |
Also Published As
Publication number | Publication date |
---|---|
CN108449691A (zh) | 2018-08-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108449691B (zh) | 一种拾音装置及声源距离确定方法 | |
CN107464565B (zh) | 一种远场语音唤醒方法及设备 | |
US10319391B2 (en) | Impulsive noise suppression | |
US11404073B1 (en) | Methods for detecting double-talk | |
EP3350804B1 (en) | Collaborative audio processing | |
CN110265020B (zh) | 语音唤醒方法、装置及电子设备、存储介质 | |
US9813833B1 (en) | Method and apparatus for output signal equalization between microphones | |
US20110096915A1 (en) | Audio spatialization for conference calls with multiple and moving talkers | |
US9706300B2 (en) | Collaborative audio processing | |
WO2016086633A1 (zh) | 一种自适应调整语音识别率的方法、装置及存储介质 | |
US9241223B2 (en) | Directional filtering of audible signals | |
EP2158788A1 (en) | Sound discrimination method and apparatus | |
CN115762579A (zh) | 一种声音处理方法、装置与设备 | |
KR20240033108A (ko) | 음성인식 오디오 시스템 및 방법 | |
CN108028982A (zh) | 电子设备及其音频处理方法 | |
CN113949955B (zh) | 降噪处理方法、装置、电子设备、耳机及存储介质 | |
CN110956976B (zh) | 一种回声消除方法、装置、设备及可读存储介质 | |
CN112333602B (zh) | 信号处理方法、信号处理设备、计算机可读存储介质及室内用播放系统 | |
WO2023284402A1 (zh) | 音频信号处理方法、系统、装置、电子设备和存储介质 | |
WO2017045512A1 (zh) | 一种语音识别的方法、装置、终端及语音识别设备 | |
CN111800729B (zh) | 声音信号处理装置及声音信号处理方法 | |
JP3411648B2 (ja) | 車載用オーディオ装置 | |
US11581004B2 (en) | Dynamic voice accentuation and reinforcement | |
US11528556B2 (en) | Method and apparatus for output signal equalization between microphones | |
CN115410593A (zh) | 音频信道的选择方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |