CN110447239B - 拾音装置及拾音方法 - Google Patents
拾音装置及拾音方法 Download PDFInfo
- Publication number
- CN110447239B CN110447239B CN201880020245.7A CN201880020245A CN110447239B CN 110447239 B CN110447239 B CN 110447239B CN 201880020245 A CN201880020245 A CN 201880020245A CN 110447239 B CN110447239 B CN 110447239B
- Authority
- CN
- China
- Prior art keywords
- sound
- microphone
- signal
- level control
- ratio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/04—Circuits for transducers, loudspeakers or microphones for correcting frequency response
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0264—Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/08—Mouthpieces; Microphones; Attachments therefor
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
- H04R1/40—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
- H04R1/406—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R29/00—Monitoring arrangements; Testing arrangements
- H04R29/004—Monitoring arrangements; Testing arrangements for microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2201/00—Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
- H04R2201/40—Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
Abstract
拾音装置具有电平控制部。电平控制部与从第1传声器生成的第1拾音信号及从第2传声器生成的第2拾音信号的相关性超过阈值的频率成分的比例相应地进行所述第1拾音信号或者所述第2拾音信号的电平控制。
Description
技术领域
本发明的一个实施方式涉及使用传声器而取得声源的声音的拾音装置及拾音方法。
背景技术
在专利文献1至专利文献3中公开了下述方法,即,求出2个传声器的相干性,对说话者的声音等目标声音进行强调。
例如,专利文献1的方法使用2个无指向性传声器而求出2个信号的平均相干性,基于求出的平均相干性的值,对是否是目标语音进行判定。
专利文献1:日本特开2016-042613号公报
专利文献2:日本特开2013-061421号公报
专利文献3:日本特开2006-129434号公报
发明内容
现有的方法没有公开降低远方的杂音的内容。
因此,本发明的一个实施方式的目的在于,提供与以往相比能够高精度地降低远方的杂音的拾音装置及拾音方法。
拾音装置具有电平控制部。电平控制部与从第1传声器生成的第1拾音信号及从第2传声器生成的第2拾音信号的相关性超过阈值的频率成分的比例相应地进行所述第1拾音信号或者所述第2拾音信号的电平控制。
发明的效果
根据本发明的一个实施方式,能够与以往相比高精度地降低远方的杂音。
附图说明
图1是表示拾音装置1A的结构的概略图。
图2是表示传声器10A及传声器10B的指向性的俯视图。
图3是表示拾音装置1A的结构的框图。
图4是表示电平控制部15的结构的一个例子的图。
图5的(A)及图5的(B)是表示增益表的一个例子的图。
图6是表示变形例1所涉及的电平控制部15的结构的图。
图7的(A)是表示指向性形成部25及指向性形成部26的功能的结构的框图,图7的(B)是表示指向性的俯视图。
图8是表示变形例2所涉及的电平控制部15的结构的图。
图9是表示强调处理部50的功能的结构的框图。
图10是具有3个传声器(传声器10A、传声器10B及传声器10C)的拾音装置1B的外观图。
图11的(A)是表示指向性形成部的功能的结构的图,图11的(B)是表示指向性的一个例子的图。
图12的(A)是表示指向性形成部的功能的结构的图,图12的(B)是表示指向性的一个例子的图。
图13是表示电平控制部15的动作的流程图。
图14是表示变形例所涉及的电平控制部15的动作的流程图。
图15是表示与拾音装置连接的外部装置(PC)的结构例的框图。
图16是表示拾音装置的结构例的框图。
图17是表示将电平控制部设置于外部装置(服务器)的情况下的结构例的框图。
具体实施方式
本实施方式的拾音装置具有:第1传声器、第2传声器和电平控制部。电平控制部求出从所述第1传声器生成的第1拾音信号及从所述第2传声器生成的第2拾音信号的相关性,与该相关性超过阈值的频率成分的比例相应地进行所述第1拾音信号或者所述第2拾音信号的电平控制。
在附近的声音及远方的声音中至少包含有反射音,因此存在相干性极端地降低的频率。如果在计算值中包含有如上述的极端低的值,则有时平均值降低。但是,上述比例仅对大于或等于阈值的频率成分以何种程度存在产生影响,是小于阈值的相干性的值本身低的值、还是为高的值,这对电平控制完全没有影响。因此,拾音装置与比例相应地进行电平控制,由此能够高精度地强调目标声音,能够降低远方的杂音。
图1是表示拾音装置1A的结构的外观的概略图。在图1中,记载拾音所涉及的主结构,没有记载其他结构。拾音装置1A具有:圆筒形状的框体70、传声器10A及传声器10B。
传声器10A及传声器10B配置于框体70的上表面。但是,框体70的形状及传声器的配置方式为一个例子,并不限定于本例。
图2是表示传声器10A及传声器10B的指向性的俯视图。作为一个例子,传声器10A是在装置的前方(图中的左方向)的灵敏度最强,在后方(图中的右方向)没有灵敏度的指向性传声器。传声器10B是在全方向具有均一的灵敏度的无指向性传声器。但是,传声器10A及传声器10B的指向性的方式并不限定于本例。例如,传声器10A及传声器10B可以都是无指向性的传声器,也可以都是指向性的传声器。另外,传声器的数量并不限定于2个,例如可以具有大于或等于3个传声器。
图3是表示拾音装置1A的结构的框图。拾音装置1A具有:传声器10A、传声器10B、电平控制部15及接口(I/F)19。电平控制部15由CPU(Central Processing Unit)151将在作为存储介质的存储器152中存储的程序读出,由此作为软件的功能而实现。但是,电平控制部15也可以由FPGA(Field-Programmable Gate Array)等专用的硬件实现。另外,电平控制部15也可以由DSP(Digital Signal Processor)实现。
对电平控制部15输入传声器10A的拾音信号S1及传声器10B的拾音信号S2。电平控制部15对传声器10A的拾音信号S1或者传声器10B的拾音信号S2进行电平控制,输出至I/F19。I/F 19是USB或者LAN等通信接口。拾音装置1A经由I/F 19将拾音信号输出至其他装置。
图4是表示电平控制部15的功能性的结构的一个例子的图。电平控制部15具有:相干性计算部20、增益控制部21及增益调整部22。
对相干性计算部20输入传声器10A的拾音信号S1及传声器10B的拾音信号S2。相干性计算部20作为相关性的一个例子,对拾音信号S1及拾音信号S2的相干性进行计算。
增益控制部21基于相干性计算部20的计算结果,决定增益调整部22的增益。对增益调整部22输入拾音信号S2。增益调整部22对拾音信号S2的增益进行调整,输出至I/F 19。
此外,在本例中,成为对传声器10B的拾音信号S2的增益进行调整,输出至I/F 19的方式,但也可以设为对传声器10A的拾音信号S1的增益进行调整,输出至I/F 19的方式。但是,传声器10B是无指向性传声器,因此能够对整个周围的声音进行拾音。由此,优选对传声器10B的拾音信号S2的增益进行调整,输出至I/F 19。
相干性计算部20对拾音信号S1及拾音信号S2分别进行傅立叶变换,变换为频率轴的信号X(f,k)及Y(f,k)(S11)。“f”表示频率,“k”表示帧编号。相干性计算部20通过下面的算式1,对相干性(复交叉谱的时间平均值)进行计算(S12)。
[式1]
Cxy(f,k)=(1-α)Cxy(f,k-1)+αX(f,k)Y(f,k)*
Px(f,k)=(1-α)Px(f,k-1)+α|X(f,k)|2
Py(f,k)=(1-α)Py(f,k-1)+α|Y(f,k)|2
但是,上述算式1是一个例子。例如,相干性计算部20也可以按照下面的算式2或者算式3对相干性进行计算。
[式2]
[式3]
此外,“m”表示周期编号(表示由规定帧数构成的信号的汇总的识别编号),“T”表示1个周期的帧数。
增益控制部21基于上述相干性,决定增益调整部22的增益。例如,增益控制部21针对全频率(频率仓的数),求出相干性的振幅超过规定的阈值γth的频率仓的比例R(k)(S13)。
[式4]
阈值γth设定为例如γth=0.6。此外,上述算式4中的f0为下限频率仓,f1为上限频率仓。
增益控制部21根据该比例R(k),决定增益调整部22的增益(S14)。更具体地说,增益控制部21针对每个频率仓对相干性是否超过阈值γth进行判定,对超过该阈值的频率仓数进行合计,根据合计结果而决定增益。图5的(A)是表示增益表的一个例子的图。根据图5的(A)所示的例子的增益表,增益控制部21在比例R大于或等于规定值R1时,不衰减(增益=1)。增益控制部21设定为在比例R从规定值R1至R2为止,随着比例R的降低,增益衰减。增益控制部21在比例R小于R2的情况下,以最小增益值维持。最小增益值可以为0,但也可以设为比0稍大的值,设为稍微能够听到声音的状态。由此,用户不会误会为由于故障等而声音中断。
相干性在2个信号的相关性高的情况下,表示高的值。远方的声音是回响音成分多、到来方向不定的声音。例如,在传声器10A为指向性、传声器10B为无指向性的情况下,针对远方的声音的拾音性能大幅地不同。因此,相干性在被输入了远方的声源的声音的情况下变小,在被输入了与装置近的声源的声音的情况下变大。
由此,拾音装置1A不对从装置远离的声源的声音进行拾音,能够将与装置近的声源的声音作为目标声音而进行强调。
本实施方式的拾音装置1A示出了增益控制部21针对全频率,求出相干性超过规定的阈值γth的频率的比例R(k),与该比例相应地进行增益控制的例子。在附近的声音及远方的声音中包含有反射音,因此存在相干性极端地降低的频率。如果包含上述的极端地低的值,则有时平均值降低。但是,上述比例R(k)仅对大于或等于阈值的频率成分以何种程度存在产生影响,是小于阈值的相干性的值本身低的值、还是为高的值,对增益控制完全没有影响,因此通过与比例R(k)相应地进行增益控制,从而能够降低远方的杂音,能够高精度地强调目标声音。
此外,规定值R1及规定值R2可以设定为任意的值,但规定值R1与希望不衰减而拾音的最大范围相应地设定。例如,在声源的位置比半径约30cm远的情况下,在相干性的比例R的值降低的情况下,将距离成为约40cm时的相干性的比例R的值设定为规定值R1,至半径约40cm为止,能够不衰减地拾音。另外,规定值R2与希望衰减的最小范围相应地设定。例如,将距离成为100cm时的比例R的值设定为规定值R2,由此在距离大于或等于100cm时几乎不拾音,如果距离与100cm相比近,则增益逐渐地上升而被拾音。
另外,规定值R1及规定值R2可以不是固定值,而动态地变化。例如,电平控制部15求出在规定时间内的过去计算出的比例R的平均值R0(或者最大的值),设为规定值R1=R0+0.1、规定值R2=R0-0.1。由此,成为以当前的声源的位置为基准,比该声源的位置接近的范围的声音被拾音,比声源的位置远的范围的声音不被拾音的状态。
此外,图5的(A)的例子为从规定距离(例如30cm)起增益急剧地降低,大于或等于规定距离(例如100cm)的声源几乎不被拾音的方式,类似于限制器的功能。但是,增益表除此以外如图5的(B)所示,还可以考虑各种方式。在图5的(B)的例子中,是与比例R相应地增益逐渐地降低,从规定值R1起增益的降低程度变大,在大于或等于规定值R2时,增益再次逐渐地降低的方式,类似于压缩器的功能。
接下来,图6是表示变形例1所涉及的电平控制部15的结构的图。电平控制部15具有指向性形成部25及指向性形成部26。图13是表示变形例1所涉及的电平控制部15的动作的流程图。图7的(A)是表示指向性形成部25及指向性形成部26的功能的结构的框图。
指向性形成部25将传声器10B的输出信号M2直接作为拾音信号S2而输出。指向性形成部26如图7的(A)所示,具有减法部261及选择部262。
减法部261从传声器10B的输出信号M2减去传声器10A的输出信号M1而输入至选择部262。
选择部262将传声器10A的输出信号M1的电平与从传声器10B的输出信号M2减去传声器10A的输出信号M1得到的差分信号的电平进行比较,将高电平侧的信号作为拾音信号S1而输出(S101)。如图7的(B)所示,从传声器10B的输出信号M2减去传声器10A的输出信号M1得到的差分信号,成为将传声器10B的指向性反转后的状态。
设为上述方式,变形例1所涉及的电平控制部15即使在使用具有指向性(不对特定的方向的声音具有灵敏度)的传声器的情况下,也能针对装置的整个周围而具有灵敏度。在该情况下,拾音信号S1具有指向性,拾音信号S2为无指向性,因此针对远方的声音的拾音性能也不同。由此,变形例1所涉及的电平控制部15针对装置的整个周围具有灵敏度,并且不对从装置远离的声源的声音进行拾音,能够将与装置接近的声源的声音作为目标声音而进行强调。
指向性形成部25及指向性形成部26的方式并不限定于图7的(A)的例子。只要在拾音信号S1和拾音信号S2中,对于与框体70接近的声源的相关性高、且对于远方的声源的相关性降低的方式,就能够实现本实施方式的结构。
例如,图10是具有3个传声器(传声器10A、传声器10B及传声器10C)的拾音装置1B的外观图。图11的(A)是表示指向性形成部的功能的结构的图。图11的(B)是表示指向性的一个例子的图。
如图11的(B)所示,在本例中,传声器10A、传声器10B及传声器10C全部为指向性传声器。传声器10A、传声器10B及传声器10C在俯视观察时,各自在以120度为单位而不同的方向具有灵敏度。
图11的(A)中的指向性形成部26对传声器10A、传声器10B及传声器10C的信号的任1个进行选择,由此形成指向性的第1拾音信号。例如,上述指向性形成部26对传声器10A、传声器10B及传声器10C的信号的最高电平的信号进行选择。
图11的(A)中的指向性形成部25对传声器10A、传声器10B及传声器10C的信号的加权和进行计算,由此形成无指向性的第2拾音信号。
由此,拾音装置1B即使在具备全部具有指向性(在特定的方向没有灵敏度)的传声器的情况下,也能针对装置的整个周围而具有灵敏度。在该情况下,拾音信号S1具有指向性,拾音信号S2为无指向性,因此针对远方的声音的拾音性能也不同。由此,拾音装置1B针对装置的整个周围而具有灵敏度,并且能够不对从装置远离的声源的声音进行拾音,而是将与装置近的声源的声音作为目标声音而进行强调。
另外,即使例如全部传声器为无指向性传声器,例如如图12的(A)所示,通过由指向性形成部26求出延迟和,从而如图12的(B)所示,也能够生成在特定的方向具有强的灵敏度的拾音信号S1。在该情况下,是使用3个无指向性传声器的例子,但也能够使用2个或者大于或等于4个无指向性传声器而生成在特定的方向具有强的灵敏度的拾音信号S1。
接下来,图9是表示强调处理部50的功能的结构的框图。
人声成为针对每个规定的频率而具有峰值成分的谐波构造。因此,梳状滤波器设定部75如以下的算式5所示,求出使人声的峰值成分通过、将除了峰值成分以外的成分去除的增益特性G(f,t),作为梳状滤波器76的增益特性而设定。
[式5]
z(c,t)=DFTf→c{log|Z(f,t)|}
cpeak(t)=argmaxc{z(c,t)}
C(f,t)=G(f,t)ηZ(f,t)
即,梳状滤波器设定部75对拾音信号S2进行傅立叶变换,将对振幅进行了对数运算后的结果进一步进行傅立叶变换而求出倒谱z(c,t)。梳状滤波器设定部75对将该倒谱z(c,t)设为最大的c的值cpeak(t)=argmaxc{z(c,t)}进行提取。梳状滤波器设定部75在c的值为cpeak(t)及其近旁以外的情况下,设为倒谱值z(c,t)=0,对倒谱的峰值成分进行提取。梳状滤波器设定部75将该峰值成分zpeak(c,t)恢复为频率轴的信号,设为梳状滤波器76的增益特性G(f,t)。由此,梳状滤波器76成为对人声的谐波成分进行强调的滤波器。
此外,增益控制部21可以基于相干性计算部20的计算结果,对通过梳状滤波器76实现的强调处理的强度进行调整。例如,增益控制部21在上述的比例R(k)的值大于或等于规定值R1的情况下,将通过梳状滤波器76实现的强调处理开启,在上述的比例R(k)的值小于规定值R1的情况下,将通过梳状滤波器76实现的强调处理关闭。在该情况下,通过梳状滤波器76实现的强调处理也包含于与相关性的计算结果相应地进行拾音信号S2(或者拾音信号S1)的电平控制的一个方式。因此,拾音装置1也可以仅进行通过梳状滤波器76实现的目标声音的强调处理。
此外,电平控制部15例如可以对噪声成分进行推定,通过使用该推定出的噪声成分的谱减法,将噪声成分去除,由此执行对目标声音进行强调的处理。并且,电平控制部15也可以基于相干性计算部20的计算结果,对噪声去除处理的强度进行调整。例如,电平控制部15在上述的比例R(k)的值大于或等于规定值R1的情况下,将通过噪声去除处理实现的强调处理开启,在上述的比例R(k)的值小于规定值R1的情况下,将通过噪声去除处理实现的强调处理关闭。在该情况下,通过噪声去除处理实现的强调处理也包含于与相关性的计算结果相应地进行拾音信号S2(或者拾音信号S1)的电平控制的一个方式。
图15是表示与拾音装置连接的外部装置(PC:个人计算机)2的结构例的框图。PC 2具有:I/F 51、CPU 52、I/F 53及存储器54。I/F 51为例如USB接口,针对拾音装置1A的I/F19通过USB线缆而连接。I/F 53为LAN等通信接口,与网络7连接。CPU 52经由I/F 51从拾音装置1A被输入拾音信号。CPU 52将在存储器54中存储的程序读出,执行图15所示的VoIP(Voice over Internet Protocol)521的功能。VoIP 521将拾音信号变换为包数据。CPU 52将通过VoIP 521变换后的包数据经由I/F 53而输出至网络7。由此,PC 2能够与经由网络7连接的其他装置对拾音信号进行收发。因此,PC 2例如能够远程地进行声音会议。
图16是表示拾音装置1A的变形例的框图。在该变形例的拾音装置1A中,CPU 151从存储器152读出程序,执行VoIP 521的功能。在该情况下,I/F 19为LAN等通信接口,与网络7连接。CPU 151经由I/F 19将通过VoIP 521变换后的包数据,经由I/F 53输出至网络7。由此,拾音装置1A能够与经由网络7连接的其他装置对拾音信号进行收发。因此,拾音装置1A例如能够远程地进行声音会议。
图17是表示将电平控制部15的结构设置于外部装置(服务器)9的情况下的结构例的框图。服务器9具有:I/F 91、CPU 93及存储器94。I/F 91为例如USB接口,针对拾音装置1A的I/F 19而通过USB线缆进行连接。
在本例中,拾音装置1A不具有电平控制部15。CPU 151从存储器152读出程序,执行VoIP 521的功能。在本例中,VoIP 521将拾音信号S1及拾音信号S2分别变换为包数据。或者,VoIP 521将拾音信号S1及拾音信号S2变换为1个包数据。在变换为1个包数据的情况下,拾音信号S1及拾音信号S2也各自区分而作为彼此不同的数据而储存于包数据。
在本例中,I/F 19为LAN等通信接口,与网络7连接。CPU 151经由I/F 19将通过VoIP 521变换后的包数据,经由I/F 53而输出至网络7。
服务器9的I/F 53为LAN等通信接口,与网络7连接。CPU 52经由I/F 91而从拾音装置1A被输入包数据。CPU 52将在存储器54中存储的程序读出,执行VoIP 92的功能。VoIP 92将包数据变换为拾音信号S1及拾音信号S2。另外,CPU 95从存储器94读出程序,执行电平控制部95的功能。电平控制部95具有与电平控制部15相同的功能。CPU 93将通过电平控制部95进行电平控制后的拾音信号再次输出至VoIP 92。CPU 93在VoIP 92中将拾音信号变换为包数据。CPU 93将通过VoIP 92变换后的包数据经由I/F 91而输出至网络7。例如,CPU 93向拾音装置1A的通信目标发送包数据。因此,拾音装置1A能够将通过电平控制部95进行电平控制后的拾音信号发送至通信目标。
最后,应该认为本实施方式的说明的所有方面都是例示,且并不是限制性的内容。本发明的范围不是由上述的实施方式表示,而是由权利要求书表示。并且,本发明的范围包含与权利要求书等同的范围。
标号的说明
1A、1B…拾音装置
10A、10B、10C…传声器
15…电平控制部
19…I/F
20…相干性计算部
21…增益控制部
22…增益调整部
25、26…指向性形成部
50…强调处理部
57…频带分割部
59…频带合成部
70…框体
75…梳状滤波器设定部
76…梳状滤波器
261…减法部
262…选择部。
Claims (18)
1.一种拾音装置,其具有电平控制部,该电平控制部与从第1传声器生成的第1拾音信号及从第2传声器生成的第2拾音信号的相关性超过阈值的频率成分的比例相应地进行所述第1拾音信号或者所述第2拾音信号的电平控制,从而降低远方的杂音,
所述电平控制部针对每个频率对所述相关性是否超过所述阈值进行判定,基于在全部频率成分中对超过该阈值的频率的数进行合计得到的合计结果,求出所述频率成分的比例。
2.根据权利要求1所述的拾音装置,其中,
具有所述第1传声器和所述第2传声器。
3.根据权利要求1或2所述的拾音装置,其中,
具有指向性形成部,该指向性形成部根据由所述第1传声器及所述第2传声器输出的声音信号,生成所述第1拾音信号及所述第2拾音信号。
4.根据权利要求3所述的拾音装置,其中,
所述第1传声器及所述第2传声器为指向性传声器,
所述指向性形成部从所述第1传声器及所述第2传声器,生成具有指向性的所述第1拾音信号和无指向性的所述第2拾音信号。
5.根据权利要求3所述的拾音装置,其中,
所述指向性形成部通过求出由所述第1传声器及所述第2传声器输出的声音信号的延迟和,从而生成所述第1拾音信号或者所述第2拾音信号。
6.根据权利要求1或2所述的拾音装置,其中,
所述电平控制部对噪声成分进行推定,作为所述电平控制,进行将该推定出的噪声成分从所述第1拾音信号或者所述第2拾音信号中去除的处理。
7.根据权利要求6所述的拾音装置,其中,
所述电平控制部与所述比例相应地,将去除所述噪声成分的处理开启或者关闭。
8.根据权利要求1或2所述的拾音装置,其中,
所述电平控制部具有梳状滤波器,该梳状滤波器将基于人声的谐波成分去除。
9.根据权利要求8所述的拾音装置,其中,
所述电平控制部与所述比例相应地,将通过所述梳状滤波器实现的处理开启或者关闭。
10.根据权利要求1或2所述的拾音装置,其中,
所述电平控制部具有增益控制部,该增益控制部对所述第1拾音信号或者所述第2拾音信号的增益进行控制。
11.根据权利要求10所述的拾音装置,其中,
所述电平控制部在所述比例小于第1阈值的情况下,与所述比例相应地使所述增益衰减。
12.根据权利要求11所述的拾音装置,其中,
所述第1阈值是基于在规定时间内计算出的所述比例而决定的。
13.根据权利要求10所述的拾音装置,其中,
所述电平控制部在所述比例小于第2阈值的情况下,将所述增益设定为最小增益。
14.根据权利要求1或2所述的拾音装置,其中,
所述相关性包含相干性。
15.一种拾音方法,其与从第1传声器生成的第1拾音信号及从第2传声器生成的第2拾音信号的相关性超过阈值的频率成分的比例相应地进行所述第1拾音信号或者所述第2拾音信号的电平控制,从而降低远方的杂音,
针对每个频率对所述相关性是否超过所述阈值进行判定,基于在全部频率成分中对超过该阈值的频率的数进行合计得到的合计结果,求出所述频率成分的比例。
16.根据权利要求15所述的拾音方法,其中,
根据由所述第1传声器及所述第2传声器输出的声音信号,生成所述第1拾音信号及所述第2拾音信号。
17.根据权利要求16所述的拾音方法,其中,
从所述第1传声器及所述第2传声器,生成具有指向性的所述第1拾音信号和无指向性的所述第2拾音信号。
18.根据权利要求17所述的拾音方法,其中,
通过求出由所述第1传声器及所述第2传声器输出的声音信号的延迟和,从而生成所述第1拾音信号或者所述第2拾音信号。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017-059020 | 2017-03-24 | ||
JP2017059020 | 2017-03-24 | ||
PCT/JP2018/011318 WO2018174135A1 (ja) | 2017-03-24 | 2018-03-22 | 収音装置および収音方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110447239A CN110447239A (zh) | 2019-11-12 |
CN110447239B true CN110447239B (zh) | 2021-12-03 |
Family
ID=63585541
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201880020245.7A Active CN110447239B (zh) | 2017-03-24 | 2018-03-22 | 拾音装置及拾音方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US10873810B2 (zh) |
EP (1) | EP3606092A4 (zh) |
JP (1) | JP6849055B2 (zh) |
CN (1) | CN110447239B (zh) |
WO (1) | WO2018174135A1 (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115462058A (zh) * | 2020-05-11 | 2022-12-09 | 雅马哈株式会社 | 信号处理方法、信号处理装置及程序 |
US11386911B1 (en) * | 2020-06-29 | 2022-07-12 | Amazon Technologies, Inc. | Dereverberation and noise reduction |
US11259117B1 (en) * | 2020-09-29 | 2022-02-22 | Amazon Technologies, Inc. | Dereverberation and noise reduction |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH057392A (ja) * | 1991-06-25 | 1993-01-14 | Sony Corp | マイクロホン装置 |
JPH0667691A (ja) * | 1992-08-18 | 1994-03-11 | Nec Corp | 雑音除去装置 |
JPH1118193A (ja) * | 1997-06-23 | 1999-01-22 | Nippon Telegr & Teleph Corp <Ntt> | 受話状態検出方法およびその装置 |
CN1490787A (zh) * | 2003-09-12 | 2004-04-21 | 中国科学院声学研究所 | 基于语音增强的语音识别方法 |
CN103929707A (zh) * | 2014-04-08 | 2014-07-16 | 深圳市中兴移动通信有限公司 | 一种检测麦克风音频通道状况的方法和移动终端 |
CN104412616A (zh) * | 2012-04-27 | 2015-03-11 | 索尼移动通讯有限公司 | 基于麦克风阵列中的声音的相关性的噪声抑制 |
WO2016146301A1 (en) * | 2015-03-16 | 2016-09-22 | Qualcomm Technologies International, Ltd. | Correlation-based two microphone algorithm for noise reduction in reverberation |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS627298A (ja) | 1985-07-03 | 1987-01-14 | Nec Corp | 音響雑音除去装置 |
US7561700B1 (en) * | 2000-05-11 | 2009-07-14 | Plantronics, Inc. | Auto-adjust noise canceling microphone with position sensor |
WO2003013185A1 (en) | 2001-08-01 | 2003-02-13 | Dashen Fan | Cardioid beam with a desired null based acoustic devices, systems and methods |
US7171008B2 (en) | 2002-02-05 | 2007-01-30 | Mh Acoustics, Llc | Reducing noise in audio systems |
US7174022B1 (en) | 2002-11-15 | 2007-02-06 | Fortemedia, Inc. | Small array microphone for beam-forming and noise suppression |
JP4247037B2 (ja) * | 2003-01-29 | 2009-04-02 | 株式会社東芝 | 音声信号処理方法と装置及びプログラム |
JP4249729B2 (ja) | 2004-10-01 | 2009-04-08 | 日本電信電話株式会社 | 自動利得制御方法、自動利得制御装置、自動利得制御プログラム及びこれを記録した記録媒体 |
EP1732352B1 (en) | 2005-04-29 | 2015-10-21 | Nuance Communications, Inc. | Detection and suppression of wind noise in microphone signals |
JP2009005133A (ja) * | 2007-06-22 | 2009-01-08 | Sanyo Electric Co Ltd | 風雑音低減装置、及び、この風雑音低減装置を備えた電子機器 |
US8428275B2 (en) * | 2007-06-22 | 2013-04-23 | Sanyo Electric Co., Ltd. | Wind noise reduction device |
US8311236B2 (en) * | 2007-10-04 | 2012-11-13 | Panasonic Corporation | Noise extraction device using microphone |
JP5555987B2 (ja) * | 2008-07-11 | 2014-07-23 | 富士通株式会社 | 雑音抑圧装置、携帯電話機、雑音抑圧方法及びコンピュータプログラム |
JP5197458B2 (ja) * | 2009-03-25 | 2013-05-15 | 株式会社東芝 | 受音信号処理装置、方法およびプログラム |
JP5817366B2 (ja) | 2011-09-12 | 2015-11-18 | 沖電気工業株式会社 | 音声信号処理装置、方法及びプログラム |
JP5862349B2 (ja) * | 2012-02-16 | 2016-02-16 | 株式会社Jvcケンウッド | ノイズ低減装置、音声入力装置、無線通信装置、およびノイズ低減方法 |
JP6028502B2 (ja) | 2012-10-03 | 2016-11-16 | 沖電気工業株式会社 | 音声信号処理装置、方法及びプログラム |
US9106196B2 (en) | 2013-06-20 | 2015-08-11 | 2236008 Ontario Inc. | Sound field spatial stabilizer with echo spectral coherence compensation |
US20150281834A1 (en) | 2014-03-28 | 2015-10-01 | Funai Electric Co., Ltd. | Microphone device and microphone unit |
JP2016042613A (ja) | 2014-08-13 | 2016-03-31 | 沖電気工業株式会社 | 目的音声区間検出装置、目的音声区間検出方法、目的音声区間検出プログラム、音声信号処理装置及びサーバ |
US9800981B2 (en) | 2014-09-05 | 2017-10-24 | Bernafon Ag | Hearing device comprising a directional system |
US9906859B1 (en) | 2016-09-30 | 2018-02-27 | Bose Corporation | Noise estimation for dynamic sound adjustment |
EP3905718B1 (en) * | 2017-03-24 | 2024-03-13 | Yamaha Corporation | Sound pickup device and sound pickup method |
-
2018
- 2018-03-22 WO PCT/JP2018/011318 patent/WO2018174135A1/ja active Application Filing
- 2018-03-22 JP JP2019506958A patent/JP6849055B2/ja active Active
- 2018-03-22 CN CN201880020245.7A patent/CN110447239B/zh active Active
- 2018-03-22 EP EP18772153.5A patent/EP3606092A4/en active Pending
-
2019
- 2019-09-17 US US16/572,825 patent/US10873810B2/en active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH057392A (ja) * | 1991-06-25 | 1993-01-14 | Sony Corp | マイクロホン装置 |
JPH0667691A (ja) * | 1992-08-18 | 1994-03-11 | Nec Corp | 雑音除去装置 |
JPH1118193A (ja) * | 1997-06-23 | 1999-01-22 | Nippon Telegr & Teleph Corp <Ntt> | 受話状態検出方法およびその装置 |
CN1490787A (zh) * | 2003-09-12 | 2004-04-21 | 中国科学院声学研究所 | 基于语音增强的语音识别方法 |
CN104412616A (zh) * | 2012-04-27 | 2015-03-11 | 索尼移动通讯有限公司 | 基于麦克风阵列中的声音的相关性的噪声抑制 |
CN103929707A (zh) * | 2014-04-08 | 2014-07-16 | 深圳市中兴移动通信有限公司 | 一种检测麦克风音频通道状况的方法和移动终端 |
WO2016146301A1 (en) * | 2015-03-16 | 2016-09-22 | Qualcomm Technologies International, Ltd. | Correlation-based two microphone algorithm for noise reduction in reverberation |
Also Published As
Publication number | Publication date |
---|---|
US10873810B2 (en) | 2020-12-22 |
JP6849055B2 (ja) | 2021-03-24 |
EP3606092A4 (en) | 2020-12-23 |
WO2018174135A1 (ja) | 2018-09-27 |
US20200015010A1 (en) | 2020-01-09 |
JPWO2018174135A1 (ja) | 2020-01-16 |
CN110447239A (zh) | 2019-11-12 |
EP3606092A1 (en) | 2020-02-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110495184B (zh) | 拾音装置及拾音方法 | |
CN113453134B (zh) | 听力装置及其运行方法和相应数据处理系统 | |
US8238569B2 (en) | Method, medium, and apparatus for extracting target sound from mixed sound | |
EP2715725B1 (en) | Processing audio signals | |
EP2320675B1 (en) | Audio processing device | |
US9467775B2 (en) | Method and a system for noise suppressing an audio signal | |
CN110447239B (zh) | 拾音装置及拾音方法 | |
US9082411B2 (en) | Method to reduce artifacts in algorithms with fast-varying gain | |
KR20080059147A (ko) | 노이즈 환경에서 스피치 신호의 강건한 분리 | |
KR20090037692A (ko) | 혼합 사운드로부터 목표 음원 신호를 추출하는 방법 및장치 | |
EP3074975A1 (en) | Method of operating a hearing aid system and a hearing aid system | |
JP6631010B2 (ja) | マイク選択装置、マイクシステムおよびマイク選択方法 | |
TWI459381B (zh) | 語音增強方法 | |
CN115412803A (zh) | 音频信号补偿方法及装置、耳机、存储介质 | |
CN113299316A (zh) | 估计声音信号的直接混响比 | |
JP2020504966A (ja) | 遠距離音の捕捉 | |
CN116884429A (zh) | 一种基于信号增强的音频处理方法 | |
US20190035382A1 (en) | Adaptive post filtering | |
CN114420153A (zh) | 音质调整方法、装置、设备及存储介质 | |
CN112133320B (zh) | 语音处理装置及语音处理方法 | |
JP6361360B2 (ja) | 残響判定装置及びプログラム | |
US20220208206A1 (en) | Noise suppression device, noise suppression method, and storage medium storing noise suppression program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |