CN102801861A - 一种应用于手机的语音增强方法和装置 - Google Patents

一种应用于手机的语音增强方法和装置 Download PDF

Info

Publication number
CN102801861A
CN102801861A CN2012102787046A CN201210278704A CN102801861A CN 102801861 A CN102801861 A CN 102801861A CN 2012102787046 A CN2012102787046 A CN 2012102787046A CN 201210278704 A CN201210278704 A CN 201210278704A CN 102801861 A CN102801861 A CN 102801861A
Authority
CN
China
Prior art keywords
mobile phone
microphone
noise reduction
signal
microphone signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012102787046A
Other languages
English (en)
Other versions
CN102801861B (zh
Inventor
刘崧
李波
楼厦厦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Goertek Inc
Original Assignee
Goertek Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Goertek Inc filed Critical Goertek Inc
Priority to CN201210278704.6A priority Critical patent/CN102801861B/zh
Publication of CN102801861A publication Critical patent/CN102801861A/zh
Priority to KR1020147031212A priority patent/KR101639933B1/ko
Priority to DK13827147.3T priority patent/DK2835958T3/en
Priority to JP2014561283A priority patent/JP5952434B2/ja
Priority to US14/401,198 priority patent/US9437209B2/en
Priority to EP13827147.3A priority patent/EP2835958B1/en
Priority to PCT/CN2013/080634 priority patent/WO2014023183A1/zh
Application granted granted Critical
Publication of CN102801861B publication Critical patent/CN102801861B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/02Constructional features of telephone sets
    • H04M1/0202Portable telephone sets, e.g. cordless phones, mobile phones or bar type handsets
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/02Constructional features of telephone sets
    • H04M1/0202Portable telephone sets, e.g. cordless phones, mobile phones or bar type handsets
    • H04M1/026Details of the structure or mounting of specific components
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/60Substation equipment, e.g. for use by subscribers including speech amplifiers
    • H04M1/6008Substation equipment, e.g. for use by subscribers including speech amplifiers in the transmitter circuit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/12Details of telephonic subscriber devices including a sensor for measuring a physical value, e.g. temperature or motion

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Telephone Function (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Details Of Audible-Bandwidth Transducers (AREA)

Abstract

本发明公开了一种应用于手机的语音增强方法和装置。本发明这种在用户说话时对用户的手机握持状态进行检测,根据用户的手机握持状态采用不同的降噪处理方案,在用户正常握持手机时采用多麦克风降噪和单麦克风降噪结合的方案对稳态噪声和非稳态噪声都进行有效的抑制,而在用户异常握持手机时采用单麦克风降噪方案只对稳态噪声进行抑制,避免了多麦克风降噪对语音的损伤,保证了语音质量。

Description

一种应用于手机的语音增强方法和装置
技术领域
本发明涉及语音信号处理技术领域,特别涉及一种应用于手机的语音增强方法和装置。
背景技术
手机在人们的日常生活和工作中已经得到了广泛应用,解除了人们通讯的时空约束,为人们的生活和工作提供了极大的便利。但是人们进行通讯的环境是复杂多变的,其中包括吵杂的环境,噪声会使得通话的语音质量严重下降,因此应用于手机的抑制噪声的语音增强技术有着重要的意义。
目前手机中常用的语音增强技术中有单麦克风谱减语音增强技术,也叫单通道谱减语音增强技术,也可以成为单麦克风降噪技术,这种技术只能抑制稳态的噪声,对非稳态的噪声,如商场超市或餐厅里的周围人的说话声等,没有明显的抑制效果。
另一种更优的降噪技术是多麦克风阵列语音增强技术,也称为多麦克风降噪技术,这种技术又分为两类:
第一类是通过多麦克风信号处理形成固定的指向性,即保留来自一个指定方向的声音,抑制来自其它方向的声音,当处理形成的指向性指向使用者的嘴则能达到保护语音抑制周围噪声的效果。
第二类是利用多麦克风接收到信号的能量差来区分语音噪声从而进行降噪处理。图1是利用多麦克风接收到信号的能量差来区分语音噪声从而进行降噪处理方案的多麦克风的安装位置示意图。如图1所示,这里有两个麦克风,分别为主麦克风1和辅麦克风2,把主麦克风1安装到手机的底端靠近人嘴的位置,主麦克风1接收到的使用者的语音信号能量很大,辅麦克风2安装在手机的顶端远离人嘴的位置,辅麦克风2接收到的使用者的语音信号能量小。如图1所示,对于外界环境噪声两个麦克风接收到的能量接近,因此通过比较两个麦克风接收到的信号能量差异可以判断是语音信号还是噪声信号,从而保留语音成分抑制噪声成分,达到提高信噪比的效果。
多麦克风降噪技术优于单麦克风降噪技术的是可以有效抑制非稳态的噪声。但是多麦克风降噪技术对用户使用手机的方式会有严格约束,即用户握持手机的方式要受到限制。对于所述第一类利用指向性的技术来说,用户必须保持指向性对准人嘴的握持方式,否则若用户的握持方式有偏差就会导致人嘴偏离被保护的方向,语音就会被作为来自其他方向的噪声抑制;同样对于第二类利用能量差异的技术也要求用户保证主麦克靠近人嘴而辅麦克远离嘴握持方式,如图2所示,图2是用户正常握持手机状态示意图;当用户异常握持时,如手机被水平握持时,如图3所示,图3是用户异常握持手机状态示意图,两个麦克风到人嘴的距离接近,语音到两个麦克风的能量接近,语音同样会被当作噪声抑制。
发明内容
有鉴于此,本发明提供了一种应用于手机的语音增强方法和装置,以解决只采用单麦克风降噪只能一致稳态噪声,而采用多麦克风降噪虽然能抑制非稳态噪声但在用户异常握持手机时损伤语音信号的问题。
为达到上述目的,本发明的技术方案是这样实现的:
本发明公开了一种应用于手机的语音增强方法,在手机的底部设置主麦克风,在手机的远离主麦克风的位置设置一个或多个辅麦克风,则该方法包括:
根据主麦克风信号和各辅助麦克风信号判断用户处于说话状态还是处于接听状态;
当判断用户处于说话状态时,进一步检测用户的手机握持状态是正常握持手机还是异常握持手机;
当检测到用户正常握持手机时,采用多麦克风降噪和单麦克风降噪相结合的方式进行语音增强处理;
当检测到用户异常握持手机时,只采用单麦克风降噪方式进行语音增强处理。
在上述方法中,所述根据主麦克风信号和各辅助麦克风信号判断用户处于说话状态还是处于接听状态包括:
计算主麦克风信号与辅麦克风信号之间的相关值,如果该相关值大于第一阈值则判断用户处于说话状态,如果该相关值小于或等于第一阈值则判断用户处于接听状态;
计算主麦克风信号与辅麦克风信号之间的相关值为:计算主麦克风信号与每个辅麦克风信号之间的相关值,然后进行平均得到平均相关值,或者,计算主麦克风信号与其中一个辅麦克风信号之间的相关值。
在上述方法中,所述检测用户的手机握持状态是正常握持手机还是异常握持手机包括:
通过多麦克风检测语音的方向,若语音来自手机底部方向,则确定用户正常握持手机,若语音来自手机的侧向或顶部方向,则确定用户异常握持手机;
或者,计算主麦克风信号能量与辅麦克风信号能量的比值,如果该比值大于第二阈值,则确定用户正常握持手机,如果该比值小于或等于第二阈值,则确定用户异常握持手机。
该方法进一步包括:在根据主麦克风信号和各辅助麦克风信号判断用户处于说话状态还是处于接听状态之前,先对主麦克风信号和各辅助麦克风信号进行快速傅里叶变换处理;在进行语音增强处理之后,再对降噪后的信号进行逆快速傅里叶变换处理;
所述采用多麦克风降噪和单麦克风降噪相结合的方式进行语音增强处理包括:先进行多麦克风降噪处理,然后进行单麦克风降噪处理;
其中,先进行多麦克风降噪处理为:在每个频率子带上,计算主麦克风信号和辅麦克风信号在该频率子带上的能量比值,根据该能量比值确定抑噪函数在该频率子带上的取值;将抑噪函数与主麦克风信号进行相乘运算得到抑制非稳态噪声后的信号;
然后进行单麦克风降噪处理为:在每个频率子带上,通过滑动平均算法计算出所述抑制非稳态噪声后的信号在该频率子带上的平稳噪声能量,进而计算出语音成分比例函数在该频率子带上的取值;将语音成分比例函数与所述抑制非稳态噪声后的信号进行相乘运算,得到抑制非稳态噪声后又抑制了稳态噪声的信号;
所述只采用单麦克风降噪方式进行语音增强处理包括:在每个频率子带上,通过滑动平均算法计算出主麦克风信号在该频率子带上的平稳噪声能量,进而计算出语音成分比例函数在该频率子带上的取值;将语音成分比例函数与主麦克风信号进行相乘运算,得到抑制稳态噪声后的信号
该方法进一步包括:
当判断用户处于接听状态时,保持之前的语音增强处理方式不变。
本发明还公开了一种应用于手机的语音增强装置,在手机的底部设置有主麦克风,在手机的远离主麦克风的位置设置有一个或多个辅麦克风,则该装置包括:检测单元和降噪单元,其中:
检测单元,用于根据主麦克风信号和各辅助麦克风信号判断用户处于说话状态还是处于接听状态;当判断用户处于说话状态时,进一步检测用户的手机握持状态是正常握持手机还是异常握持手机,并通知给降噪单元;
降噪单元,用于在接收到用户正常握持手机的通知时,采用多麦克风降噪和单麦克风降噪相结合的方式进行语音增强处理;用于在接收到用户异常握持手机的通知时,只采用单麦克风降噪方式进行语音增强处理。
在上述装置中,所述检测单元包括:近场语音检测模块和握持状态检测模块;所述降噪单元包括:多麦克风降噪处理模块和单麦克风降噪处理模块;其中,
近场语音检测模块,用于接收主麦克风信号和各辅助麦克风信号,并根据主麦克风信号和各辅助麦克风信号判断用户处于说话状态还是处于接听状态,当判断用户处于说话状态时向握持状态检测模块发送通知,当判断用户处于接听状态时不向握持状态检测模块发送通知;
握持状态检测模块,用于接收主麦克风信号和各辅助麦克风信号,在收到近场语音检测模块的通知时,检测用户的手机握持状态是正常握持手机还是异常握持手机,当检测到用户正常握持手机时,将主麦克风信号和各辅助麦克风信号发送给多麦克风降噪处理模块,当检测到用户异常握持手机时,将主麦克风信号发送给单麦克风降噪处理模块;
多麦克风降噪处理模块,用于对所接收的信号进行多麦克风降噪处理后发送给单麦克风降噪处理模块;
单麦克风降噪处理模块,用于对所接收的信号进行单麦克风降噪处理后输出。
在上述装置中,所述近场语音检测模块,用于计算主麦克风信号与辅麦克风信号之间的相关值,如果该相关值大于第一阈值则判断用户处于说话状态,如果该相关值小于或等于第一阈值则判断用户处于接听状态;
其中,所述近场语音检测模块,计算主麦克风信号与每个辅麦克风信号之间的相关值,然后进行平均得到平均相关值,或者,计算主麦克风信号与其中一个辅麦克风信号之间的相关值。
在上述装置中,
所述握持状态检测模块,用于通过多麦克风检测语音的方向,若语音来自手机底部方向,则确定用户正常握持手机,若语音来自手机的侧向或顶部方向,则确定用户异常握持手机;
或者,
所述握持状态检测模块,用于计算主麦克风信号能量与辅麦克风信号能量的比值,如果该比值大于第二阈值,则确定用户正常握持手机,如果该比值小于或等于第二阈值,则确定用户异常握持手机。
该装置还包括:快速傅里叶变换模块和逆快速傅里叶变换模块,其中:
快速傅里叶变换模块,用于将主麦克风信号和各辅麦克风信号分别进行快速傅里叶变换处理后发送给近场语音检测模块和握持状态检测模块;
所述多麦克风降噪处理模块,用于在每个频率子带上,计算主麦克风信号和辅麦克风信号在该频率子带上的能量比值,根据该能量比值确定抑噪函数在该频率子带上的取值;用于将抑噪函数与主麦克风信号进行相乘运算得到抑制非稳态噪声后的信号后输出给单麦克风降噪处理模块;
所述单麦克风降噪处理模块,用于在每个频率子带上,通过滑动平均算法计算出所接收信号在该频率子带上的平稳噪声能量,进而计算出语音成分比例函数在该频率子带上的取值;将语音成分比例函数与所接收信号进行相乘运算得到抑制稳态噪声的信号后输出给逆快速傅里叶变换模块;
逆快速傅里叶变换模块,用于对所接收的信号进行逆快速傅里叶变换处理后输出。
由上述可见,本发明这种在用户说话时对用户的手机握持状态进行检测,根据用户的手机握持状态采用不同的降噪处理方案,在用户正常握持手机时采用多麦克风降噪和单麦克风降噪结合的方案对稳态噪声和非稳态噪声都进行有效的抑制,而在用户异常握持手机时采用单麦克风降噪方案只对稳态噪声进行抑制,避免了多麦克风降噪对语音的损伤,保证了语音质量。
附图说明
图1是利用多麦克风接收到信号的能量差来区分语音噪声从而进行降噪处理方案的多麦克风的安装位置示意图;
图2是用户正常握持手机状态示意图;
图3是用户异常握持手机状态示意图;
图4是本发明实施例中的一种应用于手机的语音增强装置的结构示意图。
具体实施方式
本发明是应用于手机的语音增强技术,本发明中采用了手机握持状态检测技术,对用户正常握持手机状态采用多麦克降噪与单麦克降噪结合处理的方案,从而能够保证在用户正确握持手机时能达到最优的降噪效果,对用户异常握持状态采用单通道降噪处理只对稳态噪声进行抑制以避免此时采用多麦克降噪处理对语音造成伤害。也就是说,本发明在多麦克风降噪的基础上加入用户手机握持状态的检测,从而能在不同的手机握持状态采用不同的降噪技术,保证最优降噪的同时也避免语音失真。
下面对本发明的技术方案进行详细分析介绍。
在嘈杂的环境中使用手机通话时往往会遇到这样的情况,自己的说话声被周围的噪声所掩盖导致对方难以听清,本发明所公开的就是一种消除这些噪声,保留清晰的语音,使得通话即使在吵闹的环境中仍然能够通畅清晰进行的多麦克风降噪技术,这里的多个麦克风包括两个或两个以上的麦克风。因此本技术适用于安装有两个或两个以上麦克风的手机。如图1是一种双麦克风手机示意图,其中安装在手机底部的是主麦克1,安装在手机背部上端位置的是辅麦克2。在其他情况下也可以使用3个或3个以上的麦克风,其中只有一个主麦克风安装在手机底部,其余多个辅麦克风安装在手机的远离主麦克风的位置,如手机的顶部或背部上端位置。
用户在使用手机通话时通常会有两种握持方式:
1、正常握持,手机底部的主麦克风1挨近用户的嘴,如图2所示。此时在本发明中采用多麦克风降噪和单麦克风降噪结合的降噪技术能够很好的消除噪声,同时语音质量不会受到损害;
2、异常握持,手机底部的主麦克风1远远偏离用户的嘴,如图3所示。此时若采用多麦克降噪技术在消除噪声的同时会把语音当作噪声消除,因此在本发明中只采用单麦克风降噪处理。
本发明的技术方案主要包括两大单元:检测单元和降噪单元。检测单元的作用是检测目前的通话状态,这些状态包括:用户在说话还是在接听,用户正常握持手机还是异常握持手机。其中用户的说话或接听状态由近场语音检测模块检测得到;用户的握持手机状态则进一步由握持状态检测模块检测得到。
近场语音检测模块的原理是:当用户使用手机时,不管是正常握持还是异常握持用户的嘴到手机上的麦克风距离都会小于20cm,可认为是近场声源,而周围的噪声源一般都会距离手机50cm以上,可认为是远场声源,因此可以通过检测声源的距离来判断是用户的说话还是用户没有说话只有周围噪声。若是近场声源,两个麦克风接收到的信号间的相关性强,若是远场声源,两个麦克风接收到的信号间的相关性弱。因此可以通过计算主辅麦克风信号间的相关性来判断信号是用户语音还是周围噪声。具体的检测步骤可以如下:
1、计算主麦克风信号与辅麦克风信号之间的相关值;可以计算主麦克风信号与每个辅麦克风信号之间的相关值,然后进行平均得到平均相关值,或者,也可以计算主麦克风信号与其中一个辅麦克风信号之间的相关值;
2、如该相关值小于或等于设定阈值则信号是远场噪声信号,用户处于接听状态;若该相关值大于设定阈值则信号是近场语音信号,用户处于说话状态。
若是用户处于说话状态,则进一步进行用户握持状态检测。在本发明中提供检测用户握持状态的两种方法:
第一种方法:通过多麦克风检测语音的方向,通过语音的方向来判断用户握持状态,若语音来自手机的底部则是正常握持,若语音来自手机的侧向或顶部方向则是异常握持。
第二种方法:通过多麦克风信号能量的差异来判断用户握持状态:若主麦克风信号能量与辅麦克风信号能量的比值大于设定的阈值,则是正确握持,若能量比值小于或等于设定的阈值,则是异常握持。
经过检测单元的判定后,降噪单元根据不同的状态采用对应的降噪处理:
1、若是正常握持,采用多麦克风降噪模式:即首先经过多麦克风降噪处理抑制大部分的噪声,然后再经过单麦克风降噪处理抑制残留的稳态噪声,从而达到最优降噪;
2、若是异常握持,采用单麦克风降噪模式:不经过多麦克风降噪处理,只经过单麦克风降噪处理抑制稳态噪声,从而保证最优的语音质量。
3、用户接听状态,保持降噪模式不变,即保持之前的语音增强处理方式不变。由于用户不说话,此时不确定用户的握持状态,因此认为上一次检测到的握持状态没有改变,所以降噪模式也不改变。
通过本发明可以根据用户使用手机时的握持状态采用不同的降噪模式,从而有效消除噪声,同时能够保证语音信号不会受到损伤。
为使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明中的应用于手机的语音增强装置进行详细描述。
以图1所示的具有两个麦克风的手机为例,其中主麦克风1在手机的底部,辅麦克风2在手机的背部上端位置,远离主麦克风1。当用户如图2所示正常握持手机时,主麦克风1到嘴的距离小于5cm,辅麦克风2到嘴的距离15cm~20cm。当用户如图3所示异常握持手机时,主麦克风1到嘴的距离大于10cm,辅麦克风2到嘴的距离15cm~20cm。因此用户正常握持时,主麦克风1接收到的语音能量与辅麦克风2接收到的语音能量的差异大于9dB以上;用户异常握持时,主麦克风1接收到的语音能量与辅麦克风2接收到的语音能量的差异在3dB以内。无论何种握持,主麦克风1接收到的噪声能量与辅麦克风2接收到的噪声能量的接近,也在3dB以内。因此正常握持时,能通过两个麦克风的能量差异来区分语音和噪声,采用多麦克风降噪能有效抑制噪声不损伤语音。但异常握持时,不能通过两个麦克风的能量差异来区分语音和噪声,采用多麦克风降噪会损伤语音,此时要保护语音只能采用单麦克风降噪抑制稳态噪声。
在本发明的实施例中,也可以在手机的底部设置1个主麦克风,在手机的远离主麦克风的位置,如在手机的顶部或背部上端设置2以上的多个辅麦克风,多个辅助麦克风可以相距较近地分布在手机的顶部或背部上端。
在本实施例中设有P(P为大于1的自然数)个麦克风:首先把主麦克风接收到的时域信号s1和多个辅麦克风接收到的时域信号s2,…,sP通过快速傅里叶变换(FFT)变换为频域信号S1,…,SP。频域信号输入近场语音检测模块,场语音检测模块通过主麦克风信号和辅麦克风信号的相关性判断输入的信号是近场语音还是远场噪声。若近场语音检测模块检测到的是近场语音信号,把频域信号输入到握持状态检测模块通过主麦克风信号和辅麦克风信号的总能量差异判断用户是正常握持还是异常握持。若用户是正常握持,M个麦克风的M路频域信号输入到多麦克风降噪处理模块进行降噪处理,然后再经过单麦克风降噪处理,最后输出一路经过降噪后的频域信号。若用户是异常握持,只把一路主麦克风的频域信号S1输入单麦克风降噪处理模块进行降噪处理,输出一路经过降噪后的频域信号。若近场语音检测模块检测到的是远场噪声信号,此时不能确定握持状态,因此保持此时的降噪模式。最后把经过降噪处理后的频域信号进行逆快速傅里叶变换(IFFT)变换成时域信号输出。详细的处理结构见图4。
图4是本发明实施例中的一种应用于手机的语音增强装置的结构示意图。参见图4,该装置包括:快速傅里叶变换模块41、检测单元42、降噪单元43和逆快速傅里叶变换模块44,其中:
快速傅里叶变换模块41、用于将主麦克风信号和各辅麦克风信号分别进行快速傅里叶变换处理后发送给检测单元42;
检测单元42,用于根据主麦克风信号和各辅助麦克风信号判断用户处于说话状态还是处于接听状态;当判断用户处于说话状态时,进一步检测用户的手机握持状态是正常握持手机还是异常握持手机,并通知给降噪单元43;
降噪单元43,用于在接收到用户正常握持手机的通知时,采用多麦克风降噪和单麦克风降噪相结合的方式进行语音增强处理;用于在接收到用户异常握持手机的通知时,只采用单麦克风降噪方式进行语音增强处理;
逆快速傅里叶变换模块44,用于将降噪单元43输出的信号进行逆快速傅里叶变换处理后输出。
如图4所示,检测单元42包括:近场语音检测模块421和握持状态检测模块422;降噪单元43包括:多麦克风降噪处理模块431和单麦克风降噪处理模块432;其中,
近场语音检测模块421,用于接收主麦克风信号和各辅助麦克风信号,并根据主麦克风信号和各辅助麦克风信号判断用户处于说话状态还是处于接听状态,当判断用户处于说话状态时向握持状态检测模块422发送通知;当判断用户处于接听状态时近场语音检测模块421不向握持状态检测模块422发送通知,这样握持状态检测模块422就会仍按照之前的握持状态判断结果向降噪单元43输入对应的信号,则降噪单元43仍保持之前的降噪模式;
握持状态检测模块422,用于接收主麦克风信号和各辅助麦克风信号,在收到近场语音检测模块421的通知时,检测用户的手机握持状态是正常握持手机还是异常握持手机,当检测到用户正常握持手机时,将主麦克风信号和各辅助麦克风信号发送给多麦克风降噪处理模块431,当检测到用户异常握持手机时,只将主麦克风信号发送给单麦克风降噪处理模块432;
多麦克风降噪处理模块431,用于对所接收的信号进行多麦克风降噪处理后发送给单麦克风降噪处理模块432;
单麦克风降噪处理模块432,用于对所接收的信号进行单麦克风降噪处理后输出。
下面对各个模块的具体处理过程进行详细介绍:
快速傅里叶变换模块41:首先对si进行分帧处理(i=1,…,P),每帧N个采样点,第m帧信号是di(m,n),其中0≤n<N,m≥0。相邻两帧有M个采样点的混叠,即当前帧的前M个采样点是前一帧的最后M个采样点,每帧只有L=N-M个采样点的新数据。因此第m帧数据为di(m,n)=si(m*L+n)。例如在本实施方案中取帧长N=256,混叠M=128,即50%的混叠。分帧处理后对每帧信号用窗函数win(n)进行加窗处理,加窗后的数据为wi(m,n)=win(n)*di(m,n)。窗函数可选择汉明窗,汉宁窗等窗函数,本实施方案选取汉宁窗:
win ( n ) = 0.5 ( 1 - cos ( 2 &pi;n N - 1 ) ) ,
加窗后的数据最后进行FFT转换到频域:
S i ( m , k ) = A i ( m , k ) e - j &phi; i ( m , k ) = &Sigma; n = 0 N - 1 w i ( m , n ) e - j 2 &pi;nk / N
其中,
Figure BDA00001984143200113
是频率子带,Ai(m,k)是幅度,φi(m,k)是相位。
近场语音检测模块421:用于计算主麦克风信号与各辅麦克风信号之间的相关值,如果该相关值大于第一阈值则判断用户处于说话状态,如果该相关值小于或等于第一阈值则判断用户处于接听状态;
在只有1个辅麦克风的情况下,可以直接计算主麦克风信号与辅麦克风信号之间的相关值。在有2个以上辅麦克风的情况下,近场语音检测模块421可以计算主麦克风信号与每个辅麦克风信号之间的相关值,然后进行平均得到平均相关值,或者,计算主麦克风信号与其中一个辅麦克风信号之间的相关值。
在本实施例中具体来说近场语音检测模块421在每个频率子带计算主麦克风信号S1和一个辅麦克风信号如S2的相关函数Coh12(m,k):
coh 12 ( m , k ) = ( abs ( conj ( S 1 ( m , k ) ) S 2 ( m , k ) ) abs ( S 1 ( m , k ) ) * abs ( S 2 ( m , k ) ) ) 2
其中,conj(●)是共轭运算,abs(●)是求模运算。然后计算全频带内相关函数的均值Mcoh12(m):
MCoh 12 ( m ) = 1 N &Sigma; k = 0 N - 1 Coh 12 ( m , k )
同样可以计算计算主麦克风信号S1和其他辅麦克风信号如S3之间的相关值Mcoh13(m),以此类推。最后再对主麦克风信号与各辅麦克风信号间的相关值进行求和平均,得到最后的相关值MCoh(m)。
MCoh(m)越大声源到两个麦克风的距离越小,通过MCoh(m)与设定的阈值Coh_th比较来确定声音是来自近场声源还是远场声源,进而确定声音是用户语音还是环境噪声,例如在本实施方案中Coh_th设定为0.5。MCoh(m)>Coh_th说明相关性足够大,信号是来自近场,是用户的语音,用户在讲话。若MCoh(m)≤Coh_th说明相关性较小,信号是来自远场,是周围的环境噪声,用户在接听。
握持状态检测模块422:用于计算主麦克风信号能量与辅麦克风信号能量的比值,如果该比值大于第二阈值,则确定用户正常握持手机,如果该比值小于或等于第二阈值,则确定用户异常握持手机。
具体来说握持状态检测模块422计算主麦克风信号S1和一个辅麦克风信号的如S2的总能量P1(m)和P2(m):
P i ( m ) = &Sigma; k = 0 N - 1 ( abs ( S i ( m , k ) ) ) 2 ;
然后计算两个总能量的比值
Figure BDA00001984143200123
同理可以计算主麦克风信号S1和其他辅麦克风信号如S3的总能量比值
Figure BDA00001984143200124
以此类推。最后对这些总能量比值进行求和平均得到最后的比值Pr(m)。在本发明的其他实施例中也可以先对各辅麦克风信号的能量进行求和平均,然后再与主麦克风信号能量相比得到比值Pr(m)。
Pr(m)越大表明主麦克风越接近人嘴,反之越小表明主麦克风距离人嘴越远,通过Pr(m)与阈值Pr_th进行比较来确定手机的握持状态,例如在本实施方案中Pr_th设定为2。Pr(m)>Pr_th为手机正常握持,Pr(m)≤Pr_th为手机异常握持。
在本发明的其他实施例中,握持状态检测模块422也可以通过多麦克风检测语音的方向,若语音来自手机底部方向,则确定用户正常握持手机,若语音来自手机的侧向或顶部方向,则确定用户异常握持手机。
多麦克风降噪处理模块431:用于在每个频率子带上,计算主麦克风信号和辅麦克风信号在该频率子带上的能量比值,根据该能量比值确定抑噪函数在该频率子带上的取值;用于将抑噪函数与主麦克风信号进行相乘运算得到抑制非稳态噪声后的信号后输出给单麦克风降噪处理模432。
具体来说多麦克风降噪处理模块431计算主麦克风信号S1和一个辅麦克风信号的如S2的在每个频率子带上的能量比值
Figure BDA00001984143200131
同理可以计算主麦克风信号S1和其他辅麦克风信号如S3的总能量比值
Figure BDA00001984143200132
以此类推可以得到主麦克风信号S1和最后一个辅麦克风信号SP的总能量比值
Figure BDA00001984143200133
最后对这些总能量比值进行求和平均得到最后的比值Pb(m,k)。在其他实施例中也可以先对各辅麦克风信号的能量进行求和平均,然后再与主麦克风信号能量相比得到比值Pb(m,k)。
Pb(m,k)越大表明第k个频率子带的信号成分是语音的几率越大,反之第k个频率子带的信号成分是噪声的几率越小。根据本实施方案中Pb(m,k)与设定的能量比值上限Pb_U(k)和能量比值下限Pb_L(k)进行比较,来判断第k个频率子带的成分是语音的几率,例如在本实施方案中Pb_U(k)设定为4,Pb_L(k)设定为2。若Pb(m,k)≥Pb_U(k),则此频率子带内的信号成分是语音的几率为1,抑噪函数Gd(m,k)=1;若Pb(m,k)≤Pb_L(k),则此频率子带内的信号成分是语音的几率为0,全是噪声,Gd(m,k)=RL,RL<1决定最大的降噪量。若Pb_U(k)>Pb(m,k)>Pb_L(k),则此频率子带内的信号成分有语音也有噪声不进行处理,此时RL<Gd(m,k)<1。最后通过Gd(m,k)*S1(m,k)运算抑制每个频率子带中的噪声成分,得到降噪后的信号Sd(m,k)。
单麦克风降噪处理模块432:用于在每个频率子带上,通过滑动平均算法计算出所接收信号在该频率子带上的平稳噪声能量,进而计算出语音成分比例函数在该频率子带上的取值;将语音成分比例函数与所接收信号进行相乘运算得到抑制稳态噪声的信号后输出给逆快速傅里叶变换模块44;
在本实施例中设单麦克风降噪处理模块432的输入是Ssi(m,k),此输入根据降噪模式会不同,当是多麦克风降噪模式时,Ssi(m,k)是多麦克降噪处理模块431降噪后的输出Sd(m,k);当是单麦克风降噪模式时,Ssi(m,k)是主麦克风信号S1(m,k)。本模块通过滑动平均的方法计算Ssi(m,k)在每个频率子带中的平稳噪声能量Pn(m,k):
Pn(m,k)=α*Pn(m,k)+(1-α)*Ps(m,k),
其中α是平滑参数,例如在本实施方案中α=0.98。Ps(m,k)是本模块输入信号的能量谱,
Ps(m,k)=(abs(Ssi(m,k)))2
因为平稳噪声的能量不会有大的变化,因此通过慢平滑平均可以估计出平稳噪声的能量大小。因此每个频率子带内的语音成分所占的比例是
G s ( m , k ) = P s ( m , k ) - P n ( m , k ) P s ( m , k ) .
最后通过Gs(m,k)*Ssi(m,k)达到保留每个频率子带中的语音成分,得到抑制噪声后的频域信号Sso(m,k)
逆快速傅里叶变换模块44:把单麦克风降噪处理模块432的输出频域信号Sso(m,k)经过逆快速傅立叶变换(IFFT)变换回时域,就得到经过降噪处理后的最终输出信号so(m,n):
S o ( m , n ) = 1 N &Sigma; k = 0 N - 1 S so ( m , k ) e j 2 &pi;nk / N
在本实施例中,当近场语音检测模块421检测出目前的信号中只有噪声时,此时用户处于接听状态,没有说话,因此不能判断用户的握持方式,也就不能准确判断目前应该采用何种降噪模式,因此本发明假设上一次检测到的握持方式到目前没有改变,从而保持原来的降噪模式,直到下一次用户说话能够准确判断用户的握持方式。
综上所述,本发明这种在用户说话时对用户的手机握持状态进行检测,根据用户的手机握持状态采用不同的降噪处理方案,在用户正常握持手机时采用多麦克风降噪和单麦克风降噪结合的方案对稳态噪声和非稳态噪声都进行有效的抑制,而在用户异常握持手机时采用单麦克风降噪方案只对稳态噪声进行抑制,避免了多麦克风降噪对语音的损伤,保证了语音质量。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (10)

1.一种应用于手机的语音增强方法,其特征在于,在手机的底部设置主麦克风,在手机的远离主麦克风的位置设置一个或多个辅麦克风,则该方法包括:
根据主麦克风信号和各辅助麦克风信号判断用户处于说话状态还是处于接听状态;
当判断用户处于说话状态时,进一步检测用户的手机握持状态是正常握持手机还是异常握持手机;
当检测到用户正常握持手机时,采用多麦克风降噪和单麦克风降噪相结合的方式进行语音增强处理;
当检测到用户异常握持手机时,只采用单麦克风降噪方式进行语音增强处理。
2.根据权利要求1所述的方法,其特征在于,所述根据主麦克风信号和各辅助麦克风信号判断用户处于说话状态还是处于接听状态包括:
计算主麦克风信号与辅麦克风信号之间的相关值,如果该相关值大于第一阈值则判断用户处于说话状态,如果该相关值小于或等于第一阈值则判断用户处于接听状态;
计算主麦克风信号与辅麦克风信号之间的相关值为:计算主麦克风信号与每个辅麦克风信号之间的相关值,然后进行平均得到平均相关值,或者,计算主麦克风信号与其中一个辅麦克风信号之间的相关值。
3.根据权利要求1所述的方法,其特征在于,所述检测用户的手机握持状态是正常握持手机还是异常握持手机包括:
通过多麦克风检测语音的方向,若语音来自手机底部方向,则确定用户正常握持手机,若语音来自手机的侧向或顶部方向,则确定用户异常握持手机;
或者,计算主麦克风信号能量与辅麦克风信号能量的比值,如果该比值大于第二阈值,则确定用户正常握持手机,如果该比值小于或等于第二阈值,则确定用户异常握持手机。
4.根据权利要求1所述的方法,其特征在于,
该方法进一步包括:在根据主麦克风信号和各辅助麦克风信号判断用户处于说话状态还是处于接听状态之前,先对主麦克风信号和各辅助麦克风信号进行快速傅里叶变换处理;在进行语音增强处理之后,再对降噪后的信号进行逆快速傅里叶变换处理;
所述采用多麦克风降噪和单麦克风降噪相结合的方式进行语音增强处理包括:先进行多麦克风降噪处理,然后进行单麦克风降噪处理;
其中,先进行多麦克风降噪处理为:在每个频率子带上,计算主麦克风信号和辅麦克风信号在该频率子带上的能量比值,根据该能量比值确定抑噪函数在该频率子带上的取值;将抑噪函数与主麦克风信号进行相乘运算得到抑制非稳态噪声后的信号;
然后进行单麦克风降噪处理为:在每个频率子带上,通过滑动平均算法计算出所述抑制非稳态噪声后的信号在该频率子带上的平稳噪声能量,进而计算出语音成分比例函数在该频率子带上的取值;将语音成分比例函数与所述抑制非稳态噪声后的信号进行相乘运算,得到抑制非稳态噪声后又抑制了稳态噪声的信号;
所述只采用单麦克风降噪方式进行语音增强处理包括:在每个频率子带上,通过滑动平均算法计算出主麦克风信号在该频率子带上的平稳噪声能量,进而计算出语音成分比例函数在该频率子带上的取值;将语音成分比例函数与主麦克风信号进行相乘运算,得到抑制稳态噪声后的信号。
5.根据权利要求1至4中任一项所述的方法,其特征在于,该方法进一步包括:
当判断用户处于接听状态时,保持之前的语音增强处理方式不变。
6.一种应用于手机的语音增强装置,其特征在于,在手机的底部设置有主麦克风,在手机的远离主麦克风的位置设置有一个或多个辅麦克风,则该装置包括:检测单元和降噪单元,其中:
检测单元,用于根据主麦克风信号和各辅助麦克风信号判断用户处于说话状态还是处于接听状态;当判断用户处于说话状态时,进一步检测用户的手机握持状态是正常握持手机还是异常握持手机,并通知给降噪单元;
降噪单元,用于在接收到用户正常握持手机的通知时,采用多麦克风降噪和单麦克风降噪相结合的方式进行语音增强处理;用于在接收到用户异常握持手机的通知时,只采用单麦克风降噪方式进行语音增强处理。
7.根据权利要求6所述的装置,其特征在于,所述检测单元包括:近场语音检测模块和握持状态检测模块;所述降噪单元包括:多麦克风降噪处理模块和单麦克风降噪处理模块;其中,
近场语音检测模块,用于接收主麦克风信号和各辅助麦克风信号,并根据主麦克风信号和各辅助麦克风信号判断用户处于说话状态还是处于接听状态,当判断用户处于说话状态时向握持状态检测模块发送通知,当判断用户处于接听状态时不向握持状态检测模块发送通知;
握持状态检测模块,用于接收主麦克风信号和各辅助麦克风信号,在收到近场语音检测模块的通知时,检测用户的手机握持状态是正常握持手机还是异常握持手机,当检测到用户正常握持手机时,将主麦克风信号和各辅助麦克风信号发送给多麦克风降噪处理模块,当检测到用户异常握持手机时,将主麦克风信号发送给单麦克风降噪处理模块;
多麦克风降噪处理模块,用于对所接收的信号进行多麦克风降噪处理后发送给单麦克风降噪处理模块;
单麦克风降噪处理模块,用于对所接收的信号进行单麦克风降噪处理后输出。
8.根据权利要求7所述的装置,其特征在于,
所述近场语音检测模块,用于计算主麦克风信号与辅麦克风信号之间的相关值,如果该相关值大于第一阈值则判断用户处于说话状态,如果该相关值小于或等于第一阈值则判断用户处于接听状态;
其中,所述近场语音检测模块,计算主麦克风信号与每个辅麦克风信号之间的相关值,然后进行平均得到平均相关值,或者,计算主麦克风信号与其中一个辅麦克风信号之间的相关值。
9.根据权利要求7所述的装置,其特征在于,
所述握持状态检测模块,用于通过多麦克风检测语音的方向,若语音来自手机底部方向,则确定用户正常握持手机,若语音来自手机的侧向或顶部方向,则确定用户异常握持手机;
或者,
所述握持状态检测模块,用于计算主麦克风信号能量与辅麦克风信号能量的比值,如果该比值大于第二阈值,则确定用户正常握持手机,如果该比值小于或等于第二阈值,则确定用户异常握持手机。
10.根据权利要求7所述的装置,其特征在于,该装置还包括:快速傅里叶变换模块和逆快速傅里叶变换模块,其中:
快速傅里叶变换模块,用于将主麦克风信号和各辅麦克风信号分别进行快速傅里叶变换处理后发送给近场语音检测模块和握持状态检测模块;
所述多麦克风降噪处理模块,用于在每个频率子带上,计算主麦克风信号和辅麦克风信号在该频率子带上的能量比值,根据该能量比值确定抑噪函数在该频率子带上的取值;用于将抑噪函数与主麦克风信号进行相乘运算得到抑制非稳态噪声后的信号后输出给单麦克风降噪处理模块;
所述单麦克风降噪处理模块,用于在每个频率子带上,通过滑动平均算法计算出所接收信号在该频率子带上的平稳噪声能量,进而计算出语音成分比例函数在该频率子带上的取值;将语音成分比例函数与所接收信号进行相乘运算得到抑制稳态噪声的信号后输出给逆快速傅里叶变换模块;
逆快速傅里叶变换模块,用于对所接收的信号进行逆快速傅里叶变换处理后输出。
CN201210278704.6A 2012-08-07 2012-08-07 一种应用于手机的语音增强方法和装置 Active CN102801861B (zh)

Priority Applications (7)

Application Number Priority Date Filing Date Title
CN201210278704.6A CN102801861B (zh) 2012-08-07 2012-08-07 一种应用于手机的语音增强方法和装置
KR1020147031212A KR101639933B1 (ko) 2012-08-07 2013-08-01 휴대 전화에 적용되는 음성 향상 방법 및 장치
DK13827147.3T DK2835958T3 (en) 2012-08-07 2013-08-01 Process and device for voice enhancement for mobile phone
JP2014561283A JP5952434B2 (ja) 2012-08-07 2013-08-01 携帯電話に適用する音声強調方法及び装置
US14/401,198 US9437209B2 (en) 2012-08-07 2013-08-01 Speech enhancement method and device for mobile phones
EP13827147.3A EP2835958B1 (en) 2012-08-07 2013-08-01 Voice enhancing method and apparatus applied to cell phone
PCT/CN2013/080634 WO2014023183A1 (zh) 2012-08-07 2013-08-01 一种应用于手机的语音增强方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210278704.6A CN102801861B (zh) 2012-08-07 2012-08-07 一种应用于手机的语音增强方法和装置

Publications (2)

Publication Number Publication Date
CN102801861A true CN102801861A (zh) 2012-11-28
CN102801861B CN102801861B (zh) 2015-08-19

Family

ID=47200818

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210278704.6A Active CN102801861B (zh) 2012-08-07 2012-08-07 一种应用于手机的语音增强方法和装置

Country Status (7)

Country Link
US (1) US9437209B2 (zh)
EP (1) EP2835958B1 (zh)
JP (1) JP5952434B2 (zh)
KR (1) KR101639933B1 (zh)
CN (1) CN102801861B (zh)
DK (1) DK2835958T3 (zh)
WO (1) WO2014023183A1 (zh)

Cited By (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103079148A (zh) * 2012-12-28 2013-05-01 中兴通讯股份有限公司 一种终端双麦克风降噪的方法及装置
WO2014023183A1 (zh) * 2012-08-07 2014-02-13 歌尔声学股份有限公司 一种应用于手机的语音增强方法和装置
CN103873980A (zh) * 2012-12-10 2014-06-18 联想(北京)有限公司 音频处理方法、装置及电子设备
WO2014094576A1 (zh) * 2012-12-17 2014-06-26 Jiang Hongming 手机声波传输的接受装置
WO2014127543A1 (en) * 2013-02-25 2014-08-28 Spreadtrum Communications(Shanghai) Co., Ltd. Detecting and switching between noise reduction modes in multi-microphone mobile devices
CN104158990A (zh) * 2013-05-13 2014-11-19 英特尔Ip公司 用于处理音频信号的方法和音频接收电路
CN104301537A (zh) * 2014-10-15 2015-01-21 龙旗电子(惠州)有限公司 一种降噪手机及降噪方法
CN104424953A (zh) * 2013-09-11 2015-03-18 华为技术有限公司 语音信号处理方法与装置
CN104427050A (zh) * 2013-09-10 2015-03-18 联想(北京)有限公司 一种信息处理方法及电子设备
CN104468908A (zh) * 2013-09-22 2015-03-25 联想(北京)有限公司 一种消除噪声的方法及电子设备
CN104575509A (zh) * 2014-12-29 2015-04-29 乐视致新电子科技(天津)有限公司 语音增强处理方法及装置
CN104754430A (zh) * 2013-12-30 2015-07-01 重庆重邮信科通信技术有限公司 终端麦克风降噪装置和方法
WO2015154424A1 (zh) * 2014-09-10 2015-10-15 中兴通讯股份有限公司 一种从多个麦克风中确定主副麦克风的方法和系统
CN105374364A (zh) * 2014-08-25 2016-03-02 联想(北京)有限公司 信号处理方法及电子设备
CN105872898A (zh) * 2016-04-12 2016-08-17 北京奇虎科技有限公司 基于双话筒的降噪处理方法及装置
CN106302905A (zh) * 2016-07-29 2017-01-04 努比亚技术有限公司 麦克风模式切换方法及移动终端
CN106303804A (zh) * 2016-07-28 2017-01-04 维沃移动通信有限公司 一种麦克风的控制方法及移动终端
CN106604183A (zh) * 2015-10-20 2017-04-26 华为终端(东莞)有限公司 控制终端的多麦克风降噪的拾音范围的方法和装置
CN106683684A (zh) * 2016-12-05 2017-05-17 上海木爷机器人技术有限公司 音频信号处理系统和音频信号处理方法
CN106686249A (zh) * 2017-01-17 2017-05-17 维沃移动通信有限公司 一种语音通话方法及移动终端
CN106816156A (zh) * 2017-02-04 2017-06-09 北京时代拓灵科技有限公司 一种音频质量增强的方法及装置
CN107369441A (zh) * 2017-09-08 2017-11-21 奇酷互联网络科技(深圳)有限公司 语音信号的消噪方法、装置及终端
CN107785025A (zh) * 2016-08-25 2018-03-09 上海英波声学工程技术股份有限公司 基于房间脉冲响应重复测量的噪声去除方法及装置
CN107910015A (zh) * 2017-12-12 2018-04-13 上海与德科技有限公司 一种终端设备降噪方法及终端设备
CN107993666A (zh) * 2017-12-19 2018-05-04 北京华夏电通科技有限公司 语音识别方法、装置、计算机设备及可读存储介质
CN108564961A (zh) * 2017-11-29 2018-09-21 华北计算技术研究所(中国电子科技集团公司第十五研究所) 一种移动通信设备的语音降噪方法
CN108712551A (zh) * 2018-06-04 2018-10-26 联想(北京)有限公司 一种通话控制方法及电子设备
CN108922555A (zh) * 2018-06-29 2018-11-30 北京小米移动软件有限公司 语音信号的处理方法及装置、终端
CN109327757A (zh) * 2018-09-30 2019-02-12 歌尔科技有限公司 一种双麦克风降噪耳机及其声音处理方法、装置
WO2019034154A1 (zh) * 2017-08-17 2019-02-21 西安中兴新软件有限责任公司 移动终端的降噪方法、装置和计算机存储介质
CN110428806A (zh) * 2019-06-03 2019-11-08 清华大学 基于麦克风信号的语音交互唤醒电子设备、方法和介质
CN110536193A (zh) * 2019-07-24 2019-12-03 华为技术有限公司 一种音频信号的处理方法及装置
CN111131646A (zh) * 2019-12-30 2020-05-08 Oppo广东移动通信有限公司 通话降噪方法、装置、存储介质及电子装置
CN117135280A (zh) * 2023-04-17 2023-11-28 荣耀终端有限公司 语音通话的方法和电子设备

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2118885B1 (en) * 2007-02-26 2012-07-11 Dolby Laboratories Licensing Corporation Speech enhancement in entertainment audio
JP6381062B2 (ja) * 2014-07-28 2018-08-29 ホアウェイ・テクノロジーズ・カンパニー・リミテッド 通信デバイスのための音声信号を処理するための方法及びデバイス
JP6446913B2 (ja) * 2014-08-27 2019-01-09 富士通株式会社 音声処理装置、音声処理方法及び音声処理用コンピュータプログラム
JP6524463B2 (ja) * 2014-12-26 2019-06-05 Kddi株式会社 自動ミキシング装置およびプログラム
US9736578B2 (en) 2015-06-07 2017-08-15 Apple Inc. Microphone-based orientation sensors and related techniques
KR101715198B1 (ko) * 2015-11-18 2017-03-10 광주과학기술원 가변 전력 예산을 이용한 음성 강화 방법
CN105391829B (zh) * 2015-11-26 2019-11-12 Tcl移动通信科技(宁波)有限公司 一种移动终端的通话音质改善方法及系统
KR20180023617A (ko) * 2016-08-26 2018-03-07 삼성전자주식회사 외부 기기를 제어하는 휴대 기기 및 이의 오디오 신호 처리 방법
RU2019120747A (ru) 2017-01-12 2021-01-15 Сони Корпорейшн Устройство обработки изображений и способ обработки изображений
US20200168317A1 (en) 2018-08-22 2020-05-28 Centre For Addiction And Mental Health Tool for assisting individuals experiencing auditory hallucinations to differentiate between hallucinations and ambient sounds
CN113571053A (zh) * 2020-04-28 2021-10-29 华为技术有限公司 语音唤醒方法和设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101015001A (zh) * 2004-09-07 2007-08-08 皇家飞利浦电子股份有限公司 提高了噪声抑制能力的电话装置
CN102300140A (zh) * 2011-08-10 2011-12-28 歌尔声学股份有限公司 一种通信耳机的语音增强方法、装置及降噪通信耳机
CN202957890U (zh) * 2012-08-07 2013-05-29 歌尔声学股份有限公司 一种应用于手机的语音增强装置

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050136848A1 (en) 2003-12-22 2005-06-23 Matt Murray Multi-mode audio processors and methods of operating the same
JP2005227511A (ja) * 2004-02-12 2005-08-25 Yamaha Motor Co Ltd 対象音検出方法、音信号処理装置、音声認識装置及びプログラム
US20060133621A1 (en) 2004-12-22 2006-06-22 Broadcom Corporation Wireless telephone having multiple microphones
JP2007089145A (ja) * 2005-08-26 2007-04-05 Sharp Corp 音声処理装置及びそれを備えた表示装置
US8345890B2 (en) * 2006-01-05 2013-01-01 Audience, Inc. System and method for utilizing inter-microphone level differences for speech enhancement
JP2008065904A (ja) * 2006-09-07 2008-03-21 Sony Corp 再生装置、再生方法及び再生プログラム
JP5197458B2 (ja) * 2009-03-25 2013-05-15 株式会社東芝 受音信号処理装置、方法およびプログラム
US8897455B2 (en) * 2010-02-18 2014-11-25 Qualcomm Incorporated Microphone array subset selection for robust noise reduction
US8538035B2 (en) * 2010-04-29 2013-09-17 Audience, Inc. Multi-microphone robust noise suppression
US8611552B1 (en) * 2010-08-25 2013-12-17 Audience, Inc. Direction-aware active noise cancellation system
US9031256B2 (en) * 2010-10-25 2015-05-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for orientation-sensitive recording control
US9330675B2 (en) * 2010-11-12 2016-05-03 Broadcom Corporation Method and apparatus for wind noise detection and suppression using multiple microphones
US9066169B2 (en) * 2011-05-06 2015-06-23 Etymotic Research, Inc. System and method for enhancing speech intelligibility using companion microphones with position sensors
US20130121498A1 (en) * 2011-11-11 2013-05-16 Qsound Labs, Inc. Noise reduction using microphone array orientation information
US8831686B2 (en) * 2012-01-30 2014-09-09 Blackberry Limited Adjusted noise suppression and voice activity detection
CN102611965A (zh) * 2012-03-01 2012-07-25 广东步步高电子工业有限公司 解决双麦克风消噪手机发送响度受手机与嘴距离影响的方法
CN102801861B (zh) 2012-08-07 2015-08-19 歌尔声学股份有限公司 一种应用于手机的语音增强方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101015001A (zh) * 2004-09-07 2007-08-08 皇家飞利浦电子股份有限公司 提高了噪声抑制能力的电话装置
CN102300140A (zh) * 2011-08-10 2011-12-28 歌尔声学股份有限公司 一种通信耳机的语音增强方法、装置及降噪通信耳机
CN202957890U (zh) * 2012-08-07 2013-05-29 歌尔声学股份有限公司 一种应用于手机的语音增强装置

Cited By (51)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9437209B2 (en) 2012-08-07 2016-09-06 Goertek, Inc. Speech enhancement method and device for mobile phones
WO2014023183A1 (zh) * 2012-08-07 2014-02-13 歌尔声学股份有限公司 一种应用于手机的语音增强方法和装置
CN103873980A (zh) * 2012-12-10 2014-06-18 联想(北京)有限公司 音频处理方法、装置及电子设备
CN103873980B (zh) * 2012-12-10 2017-11-28 联想(北京)有限公司 音频处理方法、装置及电子设备
WO2014094576A1 (zh) * 2012-12-17 2014-06-26 Jiang Hongming 手机声波传输的接受装置
WO2014101429A1 (zh) * 2012-12-28 2014-07-03 中兴通讯股份有限公司 一种终端双麦克风降噪的方法及装置
CN103079148B (zh) * 2012-12-28 2018-05-04 中兴通讯股份有限公司 一种终端双麦克风降噪的方法及装置
CN103079148A (zh) * 2012-12-28 2013-05-01 中兴通讯股份有限公司 一种终端双麦克风降噪的方法及装置
WO2014127543A1 (en) * 2013-02-25 2014-08-28 Spreadtrum Communications(Shanghai) Co., Ltd. Detecting and switching between noise reduction modes in multi-microphone mobile devices
CN104335600A (zh) * 2013-02-25 2015-02-04 展讯通信(上海)有限公司 多麦克风移动装置中检测及切换降噪模式的方法
US9736287B2 (en) 2013-02-25 2017-08-15 Spreadtrum Communications (Shanghai) Co., Ltd. Detecting and switching between noise reduction modes in multi-microphone mobile devices
CN104335600B (zh) * 2013-02-25 2017-08-08 展讯通信(上海)有限公司 多麦克风移动装置中检测及切换降噪模式的方法
CN104158990B (zh) * 2013-05-13 2017-05-31 英特尔Ip公司 用于处理音频信号的方法和音频接收电路
CN104158990A (zh) * 2013-05-13 2014-11-19 英特尔Ip公司 用于处理音频信号的方法和音频接收电路
CN104427050B (zh) * 2013-09-10 2018-04-27 联想(北京)有限公司 一种信息处理方法及电子设备
CN104427050A (zh) * 2013-09-10 2015-03-18 联想(北京)有限公司 一种信息处理方法及电子设备
CN104424953A (zh) * 2013-09-11 2015-03-18 华为技术有限公司 语音信号处理方法与装置
US9922663B2 (en) 2013-09-11 2018-03-20 Huawei Technologies Co., Ltd. Voice signal processing method and apparatus
WO2015035785A1 (zh) * 2013-09-11 2015-03-19 华为技术有限公司 语音信号处理方法与装置
CN104468908A (zh) * 2013-09-22 2015-03-25 联想(北京)有限公司 一种消除噪声的方法及电子设备
CN104754430A (zh) * 2013-12-30 2015-07-01 重庆重邮信科通信技术有限公司 终端麦克风降噪装置和方法
CN105374364A (zh) * 2014-08-25 2016-03-02 联想(北京)有限公司 信号处理方法及电子设备
CN105374364B (zh) * 2014-08-25 2019-08-27 联想(北京)有限公司 信号处理方法及电子设备
WO2015154424A1 (zh) * 2014-09-10 2015-10-15 中兴通讯股份有限公司 一种从多个麦克风中确定主副麦克风的方法和系统
CN104301537A (zh) * 2014-10-15 2015-01-21 龙旗电子(惠州)有限公司 一种降噪手机及降噪方法
CN104575509A (zh) * 2014-12-29 2015-04-29 乐视致新电子科技(天津)有限公司 语音增强处理方法及装置
CN106604183A (zh) * 2015-10-20 2017-04-26 华为终端(东莞)有限公司 控制终端的多麦克风降噪的拾音范围的方法和装置
CN105872898A (zh) * 2016-04-12 2016-08-17 北京奇虎科技有限公司 基于双话筒的降噪处理方法及装置
CN106303804A (zh) * 2016-07-28 2017-01-04 维沃移动通信有限公司 一种麦克风的控制方法及移动终端
CN106302905A (zh) * 2016-07-29 2017-01-04 努比亚技术有限公司 麦克风模式切换方法及移动终端
CN107785025A (zh) * 2016-08-25 2018-03-09 上海英波声学工程技术股份有限公司 基于房间脉冲响应重复测量的噪声去除方法及装置
CN106683684A (zh) * 2016-12-05 2017-05-17 上海木爷机器人技术有限公司 音频信号处理系统和音频信号处理方法
CN106686249A (zh) * 2017-01-17 2017-05-17 维沃移动通信有限公司 一种语音通话方法及移动终端
CN106686249B (zh) * 2017-01-17 2020-04-24 维沃移动通信有限公司 一种语音通话方法及移动终端
CN106816156A (zh) * 2017-02-04 2017-06-09 北京时代拓灵科技有限公司 一种音频质量增强的方法及装置
WO2019034154A1 (zh) * 2017-08-17 2019-02-21 西安中兴新软件有限责任公司 移动终端的降噪方法、装置和计算机存储介质
CN107369441A (zh) * 2017-09-08 2017-11-21 奇酷互联网络科技(深圳)有限公司 语音信号的消噪方法、装置及终端
CN108564961A (zh) * 2017-11-29 2018-09-21 华北计算技术研究所(中国电子科技集团公司第十五研究所) 一种移动通信设备的语音降噪方法
CN107910015A (zh) * 2017-12-12 2018-04-13 上海与德科技有限公司 一种终端设备降噪方法及终端设备
CN107993666A (zh) * 2017-12-19 2018-05-04 北京华夏电通科技有限公司 语音识别方法、装置、计算机设备及可读存储介质
CN108712551A (zh) * 2018-06-04 2018-10-26 联想(北京)有限公司 一种通话控制方法及电子设备
CN108922555A (zh) * 2018-06-29 2018-11-30 北京小米移动软件有限公司 语音信号的处理方法及装置、终端
CN109327757A (zh) * 2018-09-30 2019-02-12 歌尔科技有限公司 一种双麦克风降噪耳机及其声音处理方法、装置
CN109327757B (zh) * 2018-09-30 2020-10-02 歌尔科技有限公司 一种双麦克风降噪耳机及其声音处理方法、装置
CN110428806A (zh) * 2019-06-03 2019-11-08 清华大学 基于麦克风信号的语音交互唤醒电子设备、方法和介质
WO2020244402A1 (zh) * 2019-06-03 2020-12-10 清华大学 基于麦克风信号的语音交互唤醒电子设备、方法和介质
CN110428806B (zh) * 2019-06-03 2023-02-24 交互未来(北京)科技有限公司 基于麦克风信号的语音交互唤醒电子设备、方法和介质
CN110536193A (zh) * 2019-07-24 2019-12-03 华为技术有限公司 一种音频信号的处理方法及装置
CN111131646A (zh) * 2019-12-30 2020-05-08 Oppo广东移动通信有限公司 通话降噪方法、装置、存储介质及电子装置
CN117135280A (zh) * 2023-04-17 2023-11-28 荣耀终端有限公司 语音通话的方法和电子设备
CN117135280B (zh) * 2023-04-17 2024-05-31 荣耀终端有限公司 语音通话的方法和电子设备

Also Published As

Publication number Publication date
US9437209B2 (en) 2016-09-06
EP2835958A4 (en) 2015-05-06
CN102801861B (zh) 2015-08-19
KR20150017703A (ko) 2015-02-17
US20150142426A1 (en) 2015-05-21
DK2835958T3 (en) 2018-12-03
KR101639933B1 (ko) 2016-07-14
WO2014023183A1 (zh) 2014-02-13
EP2835958A1 (en) 2015-02-11
JP5952434B2 (ja) 2016-07-13
EP2835958B1 (en) 2018-10-03
JP2015517116A (ja) 2015-06-18

Similar Documents

Publication Publication Date Title
CN102801861A (zh) 一种应用于手机的语音增强方法和装置
JP5862349B2 (ja) ノイズ低減装置、音声入力装置、無線通信装置、およびノイズ低減方法
Naylor et al. Speech dereverberation
EP2725819B1 (en) Method and implementation apparatus for intelligently controlling volume of electronic device
EP2393463B1 (en) Multiple microphone based directional sound filter
US9516408B2 (en) Method and apparatus for wind noise detection
US8010355B2 (en) Low complexity noise reduction method
US7464029B2 (en) Robust separation of speech signals in a noisy environment
CN105324982B (zh) 用于抑制不需要的音频信号的方法和设备
CN101916567B (zh) 应用于双麦克风系统的语音增强方法
US20040111258A1 (en) Method and apparatus for noise reduction
CN101976565A (zh) 基于双麦克风语音增强装置及方法
CN104157295A (zh) 用于检测及抑制瞬态噪声的方法
CN107371079B (zh) 一种耳机的双麦克降噪系统及降噪方法
AU2009203194A1 (en) Noise spectrum tracking in noisy acoustical signals
US20140307886A1 (en) Method And A System For Noise Suppressing An Audio Signal
CN101964934A (zh) 二元麦克风微阵列语音波束形成方法
EP2996314A1 (en) Voice processing device, voice processing method, and computer program for voice processing
CN202957890U (zh) 一种应用于手机的语音增强装置
Nabi et al. A dual-channel noise reduction algorithm based on the coherence function and the bionic wavelet
KR20100009936A (ko) 음원 검출 시스템에서 돌발잡음 추정/제거 장치 및 방법
Lee et al. Multi-stage speech enhancement for automatic speech recognition
Borowicz et al. Incorporating auditory properties into generalised sidelobe canceller
Sarmiento et al. Generalized Method for Solving the Permutation Problem in Frequency-Domain Blind Source Separation of Convolved Speech Signals.
Guo et al. A Wind Noise Detection and Suppression Method in Digital Hearing Aid

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C56 Change in the name or address of the patentee
CP01 Change in the name or title of a patent holder

Address after: 261031 Dongfang Road, Weifang high tech Industrial Development Zone, Shandong, China, No. 268

Patentee after: Goertek Inc.

Address before: 261031 Dongfang Road, Weifang high tech Industrial Development Zone, Shandong, China, No. 268

Patentee before: Goertek Inc.