WO2014023183A1 - 一种应用于手机的语音增强方法和装置 - Google Patents

一种应用于手机的语音增强方法和装置 Download PDF

Info

Publication number
WO2014023183A1
WO2014023183A1 PCT/CN2013/080634 CN2013080634W WO2014023183A1 WO 2014023183 A1 WO2014023183 A1 WO 2014023183A1 CN 2013080634 W CN2013080634 W CN 2013080634W WO 2014023183 A1 WO2014023183 A1 WO 2014023183A1
Authority
WO
WIPO (PCT)
Prior art keywords
microphone
user
noise reduction
signal
microphone signal
Prior art date
Application number
PCT/CN2013/080634
Other languages
English (en)
French (fr)
Inventor
刘崧
李波
楼厦厦
Original Assignee
歌尔声学股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 歌尔声学股份有限公司 filed Critical 歌尔声学股份有限公司
Priority to DK13827147.3T priority Critical patent/DK2835958T3/en
Priority to KR1020147031212A priority patent/KR101639933B1/ko
Priority to EP13827147.3A priority patent/EP2835958B1/en
Priority to US14/401,198 priority patent/US9437209B2/en
Priority to JP2014561283A priority patent/JP5952434B2/ja
Publication of WO2014023183A1 publication Critical patent/WO2014023183A1/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/02Constructional features of telephone sets
    • H04M1/0202Portable telephone sets, e.g. cordless phones, mobile phones or bar type handsets
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/02Constructional features of telephone sets
    • H04M1/0202Portable telephone sets, e.g. cordless phones, mobile phones or bar type handsets
    • H04M1/026Details of the structure or mounting of specific components
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/60Substation equipment, e.g. for use by subscribers including speech amplifiers
    • H04M1/6008Substation equipment, e.g. for use by subscribers including speech amplifiers in the transmitter circuit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/12Details of telephonic subscriber devices including a sensor for measuring a physical value, e.g. temperature or motion

Definitions

  • multi-microphone array speech enhancement technology also known as multi-microphone noise reduction technology. This technology is divided into two categories:
  • a detecting unit configured to determine, according to the main microphone signal and each auxiliary microphone signal, whether the user is in a speaking state or in an answering state; when determining that the user is in a speaking state, further detecting the user's mobile phone
  • the holding state is whether the mobile phone is normally held or the mobile phone is abnormally held, and is notified to the noise reduction unit; when it is judged that the user is in the receiving state, there is no further operation, so that the noise enhancement unit maintains the previous voice enhancement processing mode unchanged; the noise reduction unit,
  • the voice enhancement processing is performed by combining the multi-microphone noise reduction and the single microphone noise reduction; for receiving the notification that the user abnormally holds the mobile phone, only Voice enhancement processing is performed using a single microphone noise reduction method.
  • the correlation value is less than or equal to the set threshold, the signal is a far-field noise signal, and the user is in the listening state; if the correlation value is greater than the set threshold, the signal is a near-field speech signal, and the user is in a speaking state.
  • the invention can use different noise reduction modes according to the holding state when the user uses the mobile phone, thereby effectively eliminating noise and ensuring that the voice signal is not damaged.
  • the voice enhancement device applied to the mobile phone in the present invention will be described in detail below with reference to the accompanying drawings.
  • FIG. 4 is a schematic structural diagram of a voice enhancement apparatus applied to a mobile phone according to an embodiment of the present invention.
  • the apparatus includes: a fast Fourier transform module 41, a detecting unit 42, a noise reduction unit 43, and an inverse fast Fourier transform module 44, where:
  • the noise reduction unit 43 is configured to perform voice enhancement processing by combining a multi-microphone noise reduction and a single microphone noise reduction when receiving a notification that the user normally holds the mobile phone; and for receiving the abnormality of the mobile phone when receiving the user When notifying, only the single microphone noise reduction method is used for voice enhancement processing;
  • the windowed data is finally FFT converted to the frequency domain:
  • the holding state detecting module 422 is configured to calculate a ratio of the energy of the primary microphone signal to the energy of the secondary microphone signal. If the ratio is greater than the second threshold, determine that the user normally holds the mobile phone. If the ratio is less than or equal to the second threshold, determine The user is holding the phone abnormally.
  • Pb(m,k) indicates that the signal component of the kth frequency subband is more likely to be speech, whereas the signal component of the kth frequency subband is less likely to be noise.
  • Pb(m,k) is compared with the set upper limit of energy ratio Pb_U(k) and the lower limit of energy ratio Pb_L(k) to determine that the component of the kth frequency subband is voiced.
  • Probability for example, in the present embodiment Pb - U (set to 4, Pb - L (k) is set to 2.
  • P s (m,k) is the energy spectrum of the input signal of this module.
  • the present invention detects the user's mobile phone holding state when the user speaks, and uses different noise reduction processing schemes according to the user's mobile phone holding state, and uses multiple microphones when the user normally holds the mobile phone.
  • the combination of noise reduction and single-microphone noise reduction effectively suppresses both steady-state noise and non-stationary noise.
  • the single-microphone noise reduction scheme only suppresses the steady-state noise, avoiding the Multi-microphone noise reduction damages speech, ensuring voice quality.

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Telephone Function (AREA)
  • Details Of Audible-Bandwidth Transducers (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

一种应用于手机的语音增强方法和装置,在用户说话时对用户的手机握持状态进行检测,根据用户的手机握持状态采用不同的降噪处理方案,在用户正常握持手机时采用多麦克风降噪和单麦克风降噪结合的方案对稳态噪声和非稳态噪声都进行有效的抑制,而在用户异常握持手机时采用单麦克风降噪方案只对稳态噪声进行抑制,避免了多麦克风降噪对语音的损伤,保证了语音质量。

Description

一种应用于手机的语音增强方法和装置 技术领域 本发明涉及语音信号处理技术领域, 特别涉及一种应用于手机的语音增强 方法和装置。 发明背景 手机在人们的日常生活和工作中已经得到了广泛应用, 解除了人们通讯的 时空约束, 为人们的生活和工作提供了极大的便利。 但是人们进行通讯的环境 是复杂多变的, 其中包括嘈杂的环境噪声, 环境噪声会使得通话的语音质量严 重下降, 因此应用于手机的抑制噪声的语音增强技术有着重要的意义。
目前手机中常用的语音增强技术中有单麦克风谱减语音增强技术, 也叫单 通道谱减语音增强技术, 也可以称为单麦克风降噪技术。 这种技术只能抑制稳 态的噪声, 对非稳态的噪声, 如商场超市或餐厅里的周围人的说话声等, 没有 明显的抑制效果。
另一种更优的降噪技术是多麦克风阵列语音增强技术, 也称为多麦克风降 噪技术, 这种技术又分为两类:
第一类是通过多麦克风信号处理形成固定的指向性, 即保留来自一个指定 方向的声音, 抑制来自其它方向的声音, 当处理形成的指向性指向使用者的嘴, 则能达到保护语音抑制周围噪声的效果。
第二类是利用多麦克风接收到信号的能量差来区分语音噪声从而进行降噪 处理。 图 1 是利用多麦克风接收到信号的能量差来区分语音噪声从而进行降噪 处理方案的多麦克风的安装位置示意图。 如图 1 所示, 这里有两个麦克风, 分 别为主麦克风 1和辅麦克风 2,把主麦克风 1安装到手机的底端靠近人嘴的位置, 主麦克风 1接收到的使用者的语音信号能量很大, 辅麦克风 2安装在手机的顶 端远离人嘴的位置, 辅麦克风 2接收到的使用者的语音信号能量小。 如图 1所 示, 对于外界环境噪声两个麦克风接收到的能量接近, 因此通过比较两个麦克 风接收到的信号能量差异可以判断是语音信号还是噪声信号, 从而保留语音成 分抑制噪声成分, 达到提高信噪比的效果。
多麦克风降噪技术优于单麦克风降噪技术的是, 多麦克风降噪技术可以有 效抑制非稳态的噪声。 但是多麦克风降噪技术对用户使用手机的方式会有严格 约束, 即用户握持手机的方式要受到限制。 对于所述第一类利用指向性的技术 来说, 用户必须保持指向性对准人嘴的握持方式, 否则若用户的握持方式有偏 差就会导致人嘴偏离被保护的方向, 语音就会被作为来自其他方向的噪声抑制; 同样对于第二类利用能量差异的技术, 也要求用户保证主麦克靠近人嘴而辅麦 克远离人嘴的握持方式, 如图 2所示, 图 2是用户正常握持手机状态示意图; 当用户异常握持时, 如手机被水平握持时, 如图 3所示, 图 3是用户异常握持 手机状态示意图, 两个麦克风到人嘴的距离接近, 语音到两个麦克风的能量接 近, 语音同样会被当作噪声抑制。 发明内容 有鉴于此, 本发明提供了一种应用于手机的语音增强方法和装置, 以解决 只釆用单麦克风降噪只能抑制稳态噪声, 而釆用多麦克风降噪虽然能抑制非稳 态噪声, 但在用户异常握持手机时存在损伤语音信号的问题。
为达到上述目的, 本发明的技术方案是这样实现的:
本发明公开了一种应用于手机的语音增强方法, 在手机的底部设置主麦克 风, 在手机的远离主麦克风的位置设置一个或多个辅麦克风, 则该方法包括: 根据主麦克风信号和辅助麦克风信号判断用户处于说话状态还是处于接听 状态;
当判断用户处于说话状态时, 进一步检测用户的手机握持状态是正常握持 手机还是异常握持手机; 当判断用户处于接听状态时, 保持之前的语音增强处 理方式不变;
当检测到用户正常握持手机时, 釆用多麦克风降噪和单麦克风降噪相结合 的方式进行语音增强处理;
当检测到用户异常握持手机时, 只釆用单麦克风降噪方式进行语音增强处 理。
本发明还公开了一种应用于手机的语音增强装置, 在手机的底部设置有主 麦克风, 在手机的远离主麦克风的位置设置有一个或多个辅麦克风, 则该装置 包括: 检测单元和降噪单元, 其中:
检测单元, 用于根据主麦克风信号和各辅助麦克风信号判断用户处于说话 状态还是处于接听状态; 当判断用户处于说话状态时, 进一步检测用户的手机 握持状态是正常握持手机还是异常握持手机, 并通知给降噪单元; 当判断用户 处于接听状态时无进一步操作, 使降噪单元保持之前的语音增强处理方式不变; 降噪单元, 用于在接收到用户正常握持手机的通知时, 釆用多麦克风降噪 和单麦克风降噪相结合的方式进行语音增强处理; 用于在接收到用户异常握持 手机的通知时, 只釆用单麦克风降噪方式进行语音增强处理。
在上述装置中, 所述检测单元包括: 近场语音检测模块和握持状态检测模 块; 所述降噪单元包括: 多麦克风降噪处理模块和单麦克风降噪处理模块; 其 中,
近场语音检测模块, 用于接收主麦克风信号和辅助麦克风信号, 并根据主 麦克风信号和辅助麦克风信号判断用户处于说话状态还是处于接听状态, 当判 断用户处于说话状态时向握持状态检测模块发送通知, 当判断用户处于接听状 态时不向握持状态检测模块发送通知;
握持状态检测模块, 用于接收主麦克风信号和各辅助麦克风信号, 在收到 近场语音检测模块的通知时, 检测用户的手机握持状态是正常握持手机还是异 常握持手机, 当检测到用户正常握持手机时, 将主麦克风信号和辅助麦克风信 号发送给多麦克风降噪处理模块, 当检测到用户异常握持手机时, 将主麦克风 信号发送给单麦克风降噪处理模块;
多麦克风降噪处理模块, 用于对所接收的信号进行多麦克风降噪处理后发 送给单麦克风降噪处理模块;
单麦克风降噪处理模块, 用于对所接收的信号进行单麦克风降噪处理后输 出。
由上述可见, 本发明这种在用户说话时对用户的手机握持状态进行检测, 根据用户的手机握持状态釆用不同的降噪处理方案, 在用户正常握持手机时釆 用多麦克风降噪和单麦克风降噪结合的方案对稳态噪声和非稳态噪声都进行有 效的抑制, 而在用户异常握持手机时釆用单麦克风降噪方案只对稳态噪声进行 抑制, 避免了多麦克风降噪对语音的损伤, 保证了语音质量。 附图简要说明 图 1是一种双麦克风手机麦克风的安装位置示意图;
图 2是用户正常握持手机状态示意图;
图 3是用户异常握持手机状态示意图; 图 4是本发明实施例中的一种应用于手机的语音增强装置的结构示意图。 实施本发明的方式 本发明是应用于手机的语音增强技术, 本发明中釆用了手机握持状态检测 技术, 对用户正常握持手机状态釆用多麦克降噪与单麦克降噪结合处理的方案, 从而能够保证在用户正确握持手机时能达到最优的降噪效果, 对用户异常握持 状态釆用单通道降噪处理技术, 只对稳态噪声进行抑制以避免此时釆用多麦克 降噪处理对语音造成伤害。 也就是说, 本发明在多麦克风降噪的基础上加入用 户手机握持状态的检测, 从而能在不同的手机握持状态釆用不同的降噪技术, 保证最优降噪的同时也避免语音失真。
下面对本发明的技术方案进行佯细分析介绍。
在嘈杂的环境中使用手机通话时往往会遇到这样的情况, 自己的说话声被 周围的噪声所掩盖导致对方难以听清。 本发明所公开的就是一种消除这些噪声, 保留清晰的语音, 使得通话即使在吵闹的环境中仍然能够通畅清晰进行的多麦 克风降噪技术。 这里的多个麦克风包括两个或两个以上的麦克风。 因此本技术 适用于安装有两个或两个以上麦克风的手机。 如图 1 是一种双麦克风手机麦克 风的安装位置示意图, 其中安装在手机底部的是主麦克 1 , 安装在手机背部上端 位置的是辅麦克 2。 在其他情况下也可以使用 3个或 3个以上的麦克风, 其中只 有一个主麦克风安装在手机底部, 其余多个辅麦克风安装在手机的远离主麦克 风的位置, 如手机的顶部或背部上端位置。
用户在使用手机通话时通常会有两种握持方式:
1、 正常握持, 手机底部的主麦克风 1挨近用户的嘴, 如图 2所示。 此时在 本发明中釆用多麦克风降噪和单麦克风降噪结合的降噪技术能够 4艮好的消除噪 声, 同时语音质量不会受到损害;
2、 异常握持, 手机底部的主麦克风 1远远偏离用户的嘴, 如图 3所示。 此 时若釆用多麦克降噪技术在消除噪声的同时会把语音当作噪声消除, 因此在本 发明中只釆用单麦克风降噪处理。
本发明的技术方案主要包括两大单元: 检测单元和降噪单元。 检测单元的 作用是检测目前的通话状态, 这些状态包括: 用户在说话还是在接听, 用户正 常握持手机还是异常握持手机。 其中用户的说话或接听状态由近场语音检测模 块检测得到; 用户的握持手机状态则进一步由握持状态检测模块检测得到。 近场语音检测模块的原理是: 当用户使用手机时, 不管是正常握持还是异 常握持,用户的嘴到手机上的麦克风的距离都会小于 20cm,可认为是近场声源, 而周围的噪声源一般都会距离手机 50cm以上, 可认为是远场声源, 因此可以通 过检测声源的距离来判断是用户的说话还是用户没有说话只有周围噪声。 若是 近场声源, 两个麦克风接收到的信号间的相关性强, 若是远场声源, 两个麦克 风接收到的信号间的相关性弱。 因此可以通过计算主辅麦克风信号间的相关性 来判断信号是用户语音还是周围噪声。 具体的检测步骤可以如下:
1、 计算主麦克风信号与辅麦克风信号之间的相关值; 可以计算主麦克风信 号与每个辅麦克风信号之间的相关值, 然后进行平均得到平均相关值, 或者, 也可以计算主麦克风信号与其中一个辅麦克风信号之间的相关值;
2、 如该相关值小于或等于设定阈值则信号是远场噪声信号, 用户处于接听 状态; 若该相关值大于设定阈值则信号是近场语音信号, 用户处于说话状态。
若是用户处于说话状态, 则进一步进行用户握持状态检测。 在本发明中提 供检测用户握持状态的两种方法:
第一种方法: 通过多麦克风检测语音的方向, 通过语音的方向来判断用户 握持状态, 若语音来自手机的底部则是正常握持, 若语音来自手机的侧向或顶 部方向则是异常握持。
第二种方法: 通过多麦克风信号能量的差异来判断用户握持状态: 若主麦 克风信号能量与辅麦克风信号能量的比值大于设定的阈值, 则是正确握持, 若 能量比值小于或等于设定的阈值, 则是异常握持。
经过检测单元的判定后, 降噪单元根据不同的状态釆用对应的降噪处理:
1、 若是正常握持, 釆用多麦克风降噪模式: 即首先经过多麦克风降噪处理 抑制大部分的噪声, 然后再经过单麦克风降噪处理抑制残留的稳态噪声, 从而 达到最优降噪;
2、 若是异常握持, 釆用单麦克风降噪模式: 不经过多麦克风降噪处理, 只 经过单麦克风降噪处理抑制稳态噪声, 从而保证最优的语音质量。
3、 用户接听状态, 保持降噪模式不变, 即保持之前的语音增强处理方式不 变。 由于用户不说话, 此时不确定用户的握持状态, 因此认为上一次检测到的 握持状态没有改变, 所以降噪模式也不改变。
通过本发明可以根据用户使用手机时的握持状态釆用不同的降噪模式, 从 而有效消除噪声, 同时能够保证语音信号不会受到损伤。 为使本发明的目的、 技术方案和优点更加清楚, 下面结合附图对本发明中 的应用于手机的语音增强装置进行佯细描述。
以图 1所示的具有两个麦克风的手机为例, 其中主麦克风 1在手机的底部, 辅麦克风 2在手机的背部上端位置, 远离主麦克风 1。 当用户如图 2所示正常握 持手机时,主麦克风 1到嘴的距离小于 5cm,辅麦克风 2到嘴的距离 15cm〜20cm。 当用户如图 3所示异常握持手机时, 主麦克风 1到嘴的距离大于 10cm, 辅麦克 风 2到嘴的距离 15cm〜20cm。 因此用户正常握持时, 主麦克风 1接收到的语音 能量与辅麦克风 2接收到的语音能量的差异大于 9dB以上; 用户异常握持时, 主麦克风 1接收到的语音能量与辅麦克风 2接收到的语音能量的差异在 3dB以 内。 无论何种握持, 主麦克风 1接收到的噪声能量与辅麦克风 2接收到的噪声 能量的接近, 也在 3dB以内。 因此正常握持时, 能通过两个麦克风的能量差异 来区分语音和噪声, 釆用多麦克风降噪能有效抑制噪声不损伤语音。 但异常握 持时, 不能通过两个麦克风的能量差异来区分语音和噪声, 釆用多麦克风降噪 会损伤语音, 此时要保护语音只能釆用单麦克风降噪抑制稳态噪声。
在本发明的实施例中, 也可以在手机的底部设置 1 个主麦克风, 在手机的 远离主麦克风的位置, 如在手机的顶部或背部上端设置 2以上的多个辅麦克风, 多个辅助麦克风可以相距较近地分布在手机的顶部或背部上端。
在本实施例中设有 P ( P为大于 1的自然数)个麦克风: 首先把主麦克风接 收到的时域信号 Sl和多个辅麦克风接收到的时域信号 s2, sP通过快速傅里 叶变换(FFT ) 变换为频域信号 Sl SP。 频域信号输入近场语音检测模块, 场语音检测模块通过主麦克风信号和辅麦克风信号的相关性判断输入的信号是 近场语音还是远场噪声。 若近场语音检测模块检测到的是近场语音信号, 把频 域信号输入到握持状态检测模块, 握持状态检测模块通过主麦克风信号和辅麦 克风信号的总能量差异判断用户是正常握持还是异常握持。 若用户是正常握持, P个麦克风的 P路频域信号输入到多麦克风降噪处理模块进行降噪处理,然后再 经过单麦克风降噪处理, 最后输出一路经过降噪后的频域信号。 若用户是异常 握持, 只把一路主麦克风的频域信号 Si输入单麦克风降噪处理模块进行降噪处 理, 输出一路经过降噪后的频域信号。 若近场语音检测模块检测到的是远场噪 声信号, 此时不能确定握持状态, 因此保持此时的降噪模式。 最后把经过降噪 处理后的频域信号进行逆快速傅里叶变换(IFFT ) 变换成时域信号输出。 佯细 的处理结构见图 4。 图 4是本发明实施例中的一种应用于手机的语音增强装置的结构示意图。 参见图 4, 该装置包括: 快速傅里叶变换模块 41、 检测单元 42、 降噪单元 43和 逆快速傅里叶变换模块 44, 其中:
快速傅里叶变换模块 41、 用于将主麦克风信号和各辅麦克风信号分别进行 快速傅里叶变换处理后发送给检测单元 42;
检测单元 42, 用于根据主麦克风信号和各辅助麦克风信号判断用户处于说 话状态还是处于接听状态; 当判断用户处于说话状态时, 进一步检测用户的手 机握持状态是正常握持手机还是异常握持手机, 并通知给降噪单元 43; 当判断 用户处于接听状态时无进一步操作, 使降噪单元 43保持之前的语音增强处理方 式不变;
降噪单元 43 , 用于在接收到用户正常握持手机的通知时, 釆用多麦克风降 噪和单麦克风降噪相结合的方式进行语音增强处理; 用于在接收到用户异常握 持手机的通知时, 只釆用单麦克风降噪方式进行语音增强处理;
逆快速傅里叶变换模块 44,用于将降噪单元 43输出的信号进行逆快速傅里 叶变换处理后输出。
如图 4所示, 检测单元 42包括: 近场语音检测模块 421和握持状态检测模 块 422; 降噪单元 43包括: 多麦克风降噪处理模块 431和单麦克风降噪处理模 块 432; 其中,
近场语音检测模块 421 , 用于接收主麦克风信号和各辅助麦克风信号, 并根 据主麦克风信号和各辅助麦克风信号判断用户处于说话状态还是处于接听状 态, 当判断用户处于说话状态时向握持状态检测模块 422发送通知; 当判断用 户处于接听状态时近场语音检测模块 421不向握持状态检测模块 422发送通知, 这样握持状态检测模块 422就会仍按照之前的握持状态判断结果向降噪单元 43 输入对应的信号, 则降噪单元 43仍保持之前的降噪模式;
握持状态检测模块 422, 用于接收主麦克风信号和各辅助麦克风信号, 在收 到近场语音检测模块 421 的通知时, 检测用户的手机握持状态是正常握持手机 还是异常握持手机, 当检测到用户正常握持手机时, 将主麦克风信号和各辅助 麦克风信号发送给多麦克风降噪处理模块 431 , 当检测到用户异常握持手机时, 只将主麦克风信号发送给单麦克风降噪处理模块 432;
多麦克风降噪处理模块 431 ,用于对所接收的信号进行多麦克风降噪处理后 发送给单麦克风降噪处理模块 432; 单麦克风降噪处理模块 432,用于对所接收的信号进行单麦克风降噪处理后 输出。
下面对各个模块的具体处理过程进行佯细介绍:
快速傅里叶变换模块 41: 首先对 S进行分帧处理(i = l, ... , P ), 每帧 N个釆 样点, 第 m帧信号是 di(m,n),其中 0≤n < N, m≥0。 相邻两帧有 M个釆样点的混 叠, 即当前帧的前 M个釆样点是前一帧的最后 M个釆样点, 每帧只有 L=N-M 个釆样点的新数据。 因此第 m帧数据为 (^(ιη,η^ ^ιη + η) » 例如在本实施方案 中取帧长 Ν=256, 混叠 Μ=128, 即 50%的混叠。 分帧处理后对每帧信号用窗函 数 win(n)进行加窗处理, 加窗后的数据为
Figure imgf000009_0001
窗函数可选择 汉明窗, 汉宁窗等窗函数, 本实施方案选取汉宁窗:
2πη
win(n) = 0.5 1— cos
N - l
加窗后的数据最后进行 FFT转换到频域:
N-1
Si(m,k) = Ai(m,k)e— (mk) = Wi(m,n)e— j2;rnk N
n-0
其中,0≤k≤ 是频率子带, Ai(m,k)是幅度, (m,k)是相位。 近场语音检测模块 421:用于计算主麦克风信号与各辅麦克风信号之间的相 关值, 如果该相关值大于第一阈值则判断用户处于说话状态, 如果该相关值小 于或等于第一阈值则判断用户处于接听状态;
在只有 1 个辅麦克风的情况下, 可以直接计算主麦克风信号与辅麦克风信 号之间的相关值。 在有 2个以上辅麦克风的情况下, 近场语音检测模块 421可 以计算主麦克风信号与每个辅麦克风信号之间的相关值, 然后进行平均得到平 均相关值, 或者, 计算主麦克风信号与其中一个辅麦克风信号之间的相关值。
在本实施例中具体来说近场语音检测模块 421 在每个频率子带计算主麦克 风信号 Si和一个辅麦克风信号如 S2的相关函数 Coh12(m^):
Figure imgf000009_0002
其中, conj( * )是共轭运算, abs( * )是求模运算。 然后计算全频带内相关函数的 均值 Mcoh12(m):
N-l
MCoh12 (m) =— Coh12 (m, k) 同样可以计算主麦克风信号 Si和其他辅麦克风信号如 s3之间的相关值 Mcoh13(m), 以此类推。 最后再对主麦克风信号与各辅麦克风信号间的相关值进 行求和平均, 得到最后的相关值 MCoh(m)。
MCoh(m)越大声源到两个麦克风的距离越小, 通过 MCoh(m)与设定的阈值 Coh— th 比较来确定声音是来自近场声源还是远场声源, 进而确定声音是用户语 音还是环境噪声, 例如在本实施方案中 Coh— th设定为 0.5。 MCoh(m)> Coh— th 说明相关性足够大,信号是来自近场,是用户的语音,用户在讲话。若 MCoh(m) Coh— th说明相关性较小, 信号是来自远场, 是周围的环境噪声, 用户在接听。
握持状态检测模块 422:用于计算主麦克风信号能量与辅麦克风信号能量的 比值, 如果该比值大于第二阈值, 则确定用户正常握持手机, 如果该比值小于 或等于第二阈值, 则确定用户异常握持手机。
具体来说握持状态检测模块 422计算主麦克风信号 Si和一个辅麦克风信号 的如 S2的总能量 P m)和 P2(
Figure imgf000010_0001
然后计算两个总能量的比值 Pr12(m) = ^^, 同理可以计算主麦克风信号 Si和其 他辅麦克风信号如 S3的总能量比值!¾ , 以此类推。 最后对这些总能
Figure imgf000010_0002
量比值进行求和平均得到最后的比值 Pr( )。 在本发明的其他实施例中也可以先 对各辅麦克风信号的能量进行求和平均, 然后再与主麦克风信号能量相比得到 比值 Pr(m)。
Pr(m)越大表明主麦克风越接近人嘴,反之越小表明主麦克风距离人嘴越远, 通过 Pr(m)与阈值 Pr— th进行比较来确定手机的握持状态, 例如在本实施方案中 Pr— th设定为 2。 Pr(m)>Pr— th为手机正常握持, Pr(m) Pr— th为手机异常握持。
在本发明的其他实施例中, 握持状态检测模块 422也可以通过多麦克风检 测语音的方向, 若语音来自手机底部方向, 则确定用户正常握持手机, 若语音 来自手机的侧向或顶部方向, 则确定用户异常握持手机。
多麦克风降噪处理模块 431: 用于在每个频率子带上, 计算主麦克风信号和 辅麦克风信号在该频率子带上的能量比值, 根据该能量比值确定抑噪函数在该 频率子带上的取值; 用于将抑噪函数与主麦克风信号进行相乘运算得到抑制非 稳态噪声后的信号后输出给单麦克风降噪处理模 432。
具体来说多麦克风降噪处理模块 431计算主麦克风信号 Si和一个辅麦克风 信号的如 S2的在每个频率子带上的能量比值 Pb12(m,k) = ^^, 同理可以计算
A2(m,k)
主麦克风信号 Si和其他辅麦克风信号如 S3的总能量比值 Pb13(m,k) = Al(mk) , 以
A3(m, k) 此类推可以得到主麦克风信号 Si和最后一个辅麦克风信号 sP的总能量比值
Pb1P(m,k) = Al(mk)。 最后对这些总能量比值进行求和平均得到最后的比值
Ap(m,k)
Pb(m,k)。 在其他实施例中也可以先对各辅麦克风信号的能量进行求和平均, 然 后再与主麦克风信号能量相比得到比值 Pb(m,k)。
Pb(m,k)越大表明第 k个频率子带的信号成分是语音的几率越大, 反之第 k 个频率子带的信号成分是噪声的几率越小。 根据本实施方案中 Pb(m,k)与设定的 能量比值上限 Pb— U(k)和能量比值下限 Pb— L(k)进行比较, 来判断第 k个频率子 带的成分是语音的几率, 例如在本实施方案中 Pb— U( 设定为 4, Pb— L(k)设定为 2。 若 Pb(m,k) > Pb— U(k), 则此频率子带内的信号成分是语音的几率为 1 , 抑噪 函数 Gd(m,k)=l ; 若 Pb(m,k) Pb—L(k), 则此频率子带内的信号成分是语音的几 率为 0 , 全是噪声 , Gd(m,k)=RL, RL<1 决定最大的降噪量。 若 Pb_U(k)>Pb(m,k)>Pb_L(k) , 则此频率子带内的信号成分有语音也有噪声不进行 处理, 此时 RL<Gd(m,k)<l。 最后通过 Gd m'k S^m'k)运算抑制每个频率子带中 的噪声成分, 得到降噪后的信号 Sd(m,k)。
单麦克风降噪处理模块 432: 用于在每个频率子带上, 通过滑动平均算法计 算出所接收信号在该频率子带上的平稳噪声能量, 进而计算出语音成分比例函 数在该频率子带上的取值; 将语音成分比例函数与所接收信号进行相乘运算得 到抑制稳态噪声的信号后输出给逆快速傅里叶变换模块 44;
在本实施例中设单麦克风降噪处理模块 432的输入是 Ssl(m,k), 此输入根据 降噪模式会不同, 当是多麦克风降噪模式时, Ssl(m,k)是多麦克降噪处理模块 431 降噪后的输出 Sd(m,k) ; 当是单麦克风降噪模式时, Ssl(m,k)是主麦克风信号 S m,]^ 本模块通过滑动平均的方法计算 Ssl(m,k)在每个频率子带中的平稳噪声 能量 Pn(m,k):
Pn(m,k) = a * Pn(m,k) + (1 - «) * Ps(m,k) ,
其中 α是平滑参数, 例如在本实施方案中 a=0.98。 Ps(m,k)是本模块输入信号的能 量谱,
Ps(m,k) = (abs(Ssi(m,k)))2
因为平稳噪声的能量不会有大的变化, 因此通过慢平滑平均可以估计出平稳噪 声的能量大小。 因此每个频率子带内的语音成分所占的比例是
G (m,kk) - P"m,k)。
Ps(m,k)
最后通过 Gs(m,k)*Ssl(m,k)达到保留每个频率子带中的语音成分, 得到抑制 噪声后的频域信号 Ss。(m,k)
逆快速傅里叶变换模块 44: 把单麦克风降噪处理模块 432的输出频域信号 Ss。(m,k)经过逆快速傅立叶变换 (IFFT)变换回时域, 就得到经过降噪处理后的最 终输出信号 s。( ,《):
S。(m,n) = ¾Ss。(m,k)e k/N 在本实施例中, 当近场语音检测模块 421检测出目前的信号中只有噪声时, 此时用户处于接听状态, 没有说话, 因此不能判断用户的握持方式, 也就不能 准确判断目前应该釆用何种降噪模式, 因此本发明假设上一次检测到的握持方 式到目前没有改变, 从而保持原来的降噪模式, 直到下一次用户说话能够准确 判断用户的握持方式。
综上所述, 本发明这种在用户说话时对用户的手机握持状态进行检测, 根 据用户的手机握持状态釆用不同的降噪处理方案, 在用户正常握持手机时釆用 多麦克风降噪和单麦克风降噪结合的方案对稳态噪声和非稳态噪声都进行有效 的抑制, 而在用户异常握持手机时釆用单麦克风降噪方案只对稳态噪声进行抑 制, 避免了多麦克风降噪对语音的损伤, 保证了语音质量。
以上所述仅为本发明的较佳实施例而已, 并非用于限定本发明的保护范围。 凡在本发明的精神和原则之内所作的任何修改、 等同替换、 改进等, 均包含在 本发明的保护范围内。

Claims

权利要求书
1、 一种应用于手机的语音增强方法, 在手机的底部设置主麦克风, 在手机 的远离主麦克风的位置设置一个或多个辅麦克风, 其特征在于, 该方法包括: 根据主麦克风信号和辅助麦克风信号判断用户处于说话状态还是处于接听 状态;
当判断用户处于说话状态时, 进一步检测用户的手机握持状态是正常握持 手机还是异常握持手机; 当判断用户处于接听状态时, 保持之前的语音增强处 理方式不变;
当检测到用户正常握持手机时, 釆用多麦克风降噪和单麦克风降噪相结合 的方式进行语音增强处理;
当检测到用户异常握持手机时, 只釆用单麦克风降噪方式进行语音增强处 理。
2、 根据权利要求 1所述的方法, 其特征在于, 所述根据主麦克风信号和辅 助麦克风信号判断用户处于说话状态还是处于接听状态包括:
计算主麦克风信号与辅麦克风信号之间的相关值, 如果该相关值大于第一 阈值则判断用户处于说话状态, 如果该相关值小于或等于第一阈值则判断用户 处于接听状态;
其中, 计算主麦克风信号与辅麦克风信号之间的相关值为: 计算主麦克风 信号与每个辅麦克风信号之间的相关值, 然后进行平均得到平均相关值, 或者, 计算主麦克风信号与其中一个辅麦克风信号之间的相关值。
3、 根据权利要求 1所述的方法, 其特征在于, 所述检测用户的手机握持状 态是正常握持手机还是异常握持手机包括:
通过多麦克风检测语音的方向, 若语音来自手机底部方向, 则确定用户正 常握持手机, 若语音来自手机的侧向或顶部方向, 则确定用户异常握持手机; 或者, 计算主麦克风信号能量与辅麦克风信号能量的比值, 如果该比值大 于第二阈值, 则确定用户正常握持手机, 如果该比值小于或等于第二阈值, 则 确定用户异常握持手机。
4、 根据权利要求 1所述的方法, 其特征在于,
在根据主麦克风信号和辅助麦克风信号判断用户处于说话状态还是处于接 听状态之前, 该方法还包括: 对主麦克风信号和辅助麦克风信号进行快速傅里 叶变换处理的步骤; 在进行语音增强处理之后, 该方法进一步包括: 对降噪后的信号进行逆快 速傅里叶变换处理的步骤。
5、 根据权利要求 4所述的方法, 其特征在于,
所述釆用多麦克风降噪和单麦克风降噪相结合的方式进行语音增强处理包 括: 先进行多麦克风降噪处理, 然后进行单麦克风降噪处理;
其中, 先进行多麦克风降噪处理为: 在每个频率子带上, 计算主麦克风信 号和辅麦克风信号在该频率子带上的能量比值, 根据该能量比值确定抑噪函数 在该频率子带上的取值; 将抑噪函数与主麦克风信号进行相乘运算得到抑制非 稳态噪声后的信号;
然后进行单麦克风降噪处理为: 在每个频率子带上, 通过滑动平均算法计 算出所述抑制非稳态噪声后的信号在该频率子带上的平稳噪声能量, 进而计算 出语音成分比例函数在该频率子带上的取值; 将语音成分比例函数与所述抑制 非稳态噪声后的信号进行相乘运算, 得到抑制非稳态噪声后又抑制了稳态噪声 的信号;
所述只釆用单麦克风降噪方式进行语音增强处理包括: 在每个频率子带上, 通过滑动平均算法计算出主麦克风信号在该频率子带上的平稳噪声能量, 进而 计算出语音成分比例函数在该频率子带上的取值; 将语音成分比例函数与主麦 克风信号进行相乘运算, 得到抑制稳态噪声后的信号。
6、 一种应用于手机的语音增强装置, 在手机的底部设置有主麦克风, 在手 机的远离主麦克风的位置设置有一个或多个辅麦克风, 其特征在于, 该装置包 括: 检测单元和降噪单元, 其中:
检测单元, 用于根据主麦克风信号和辅助麦克风信号判断用户处于说话状 态还是处于接听状态; 当判断用户处于说话状态时, 进一步检测用户的手机握 持状态是正常握持手机还是异常握持手机, 并通知给降噪单元; 当判断用户处 于接听状态时无进一步操作, 使降噪单元保持之前的语音增强处理方式不变; 降噪单元, 用于在接收到用户正常握持手机的通知时, 釆用多麦克风降噪 和单麦克风降噪相结合的方式进行语音增强处理; 用于在接收到用户异常握持 手机的通知时, 只釆用单麦克风降噪方式进行语音增强处理。
7、 根据权利要求 6所述的装置, 其特征在于, 所述检测单元包括: 近场语 音检测模块和握持状态检测模块; 所述降噪单元包括: 多麦克风降噪处理模块 和单麦克风降噪处理模块; 其中, 近场语音检测模块, 用于接收主麦克风信号和辅助麦克风信号, 并根据主 麦克风信号和辅助麦克风信号判断用户处于说话状态还是处于接听状态, 当判 断用户处于说话状态时向握持状态检测模块发送通知, 当判断用户处于接听状 态时不向握持状态检测模块发送通知;
握持状态检测模块, 用于接收主麦克风信号和辅助麦克风信号, 在收到近 场语音检测模块的通知时, 检测用户的手机握持状态是正常握持手机还是异常 握持手机, 当检测到用户正常握持手机时, 将主麦克风信号和辅助麦克风信号 发送给多麦克风降噪处理模块, 当检测到用户异常握持手机时, 将主麦克风信 号发送给单麦克风降噪处理模块;
多麦克风降噪处理模块, 用于对所接收的信号进行多麦克风降噪处理后发 送给单麦克风降噪处理模块;
单麦克风降噪处理模块, 用于对所接收的信号进行单麦克风降噪处理后输 出。
8、 根据权利要求 7所述的装置, 其特征在于,
所述近场语音检测模块, 用于计算主麦克风信号与辅麦克风信号之间的相 关值, 如果该相关值大于第一阈值则判断用户处于说话状态, 如果该相关值小 于或等于第一阈值则判断用户处于接听状态;
其中, 计算主麦克风信号与辅麦克风信号之间的相关值为: 计算主麦克风 信号与每个辅麦克风信号之间的相关值, 然后进行平均得到平均相关值, 或者, 计算主麦克风信号与其中一个辅麦克风信号之间的相关值。
9、 根据权利要求 7所述的装置, 其特征在于,
所述握持状态检测模块, 用于通过多麦克风检测语音的方向, 若语音来自 手机底部方向, 则确定用户正常握持手机, 若语音来自手机的侧向或顶部方向, 则确定用户异常握持手机;
或者,
所述握持状态检测模块, 用于计算主麦克风信号能量与辅麦克风信号能量 的比值, 如果该比值大于第二阈值, 则确定用户正常握持手机, 如果该比值小 于或等于第二阈值, 则确定用户异常握持手机。
10、 根据权利要求 7 所述的装置, 其特征在于, 该装置还包括: 快速傅里 叶变换模块和逆快速傅里叶变换模块, 其中:
所述快速傅里叶变换模块, 输入连接主麦克风和辅麦克风, 输出连接检测 单元, 用于将主麦克风信号和辅麦克风信号分别进行快速傅里叶变换处理后发 送给近场语音检测模块和握持状态检测模块;
所述多麦克风降噪处理模块, 用于在每个频率子带上, 计算主麦克风信号 和辅麦克风信号在该频率子带上的能量比值, 根据该能量比值确定抑噪函数在 该频率子带上的取值; 将抑噪函数与主麦克风信号进行相乘运算得到抑制非稳 态噪声后的信号后输出给单麦克风降噪处理模块;
所述单麦克风降噪处理模块, 用于在每个频率子带上, 通过滑动平均算法 计算出所接收信号在该频率子带上的平稳噪声能量, 进而计算出语音成分比例 函数在该频率子带上的取值; 将语音成分比例函数与所接收信号进行相乘运算 得到抑制稳态噪声的信号后输出给逆快速傅里叶变换模块;
所述逆快速傅里叶变换模块, 输入连接降噪单元, 用于对降噪后的信号进 行逆快速傅里叶变换处理后输出。
PCT/CN2013/080634 2012-08-07 2013-08-01 一种应用于手机的语音增强方法和装置 WO2014023183A1 (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
DK13827147.3T DK2835958T3 (en) 2012-08-07 2013-08-01 Process and device for voice enhancement for mobile phone
KR1020147031212A KR101639933B1 (ko) 2012-08-07 2013-08-01 휴대 전화에 적용되는 음성 향상 방법 및 장치
EP13827147.3A EP2835958B1 (en) 2012-08-07 2013-08-01 Voice enhancing method and apparatus applied to cell phone
US14/401,198 US9437209B2 (en) 2012-08-07 2013-08-01 Speech enhancement method and device for mobile phones
JP2014561283A JP5952434B2 (ja) 2012-08-07 2013-08-01 携帯電話に適用する音声強調方法及び装置

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201210278704.6A CN102801861B (zh) 2012-08-07 2012-08-07 一种应用于手机的语音增强方法和装置
CN201210278704.6 2012-08-07

Publications (1)

Publication Number Publication Date
WO2014023183A1 true WO2014023183A1 (zh) 2014-02-13

Family

ID=47200818

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2013/080634 WO2014023183A1 (zh) 2012-08-07 2013-08-01 一种应用于手机的语音增强方法和装置

Country Status (7)

Country Link
US (1) US9437209B2 (zh)
EP (1) EP2835958B1 (zh)
JP (1) JP5952434B2 (zh)
KR (1) KR101639933B1 (zh)
CN (1) CN102801861B (zh)
DK (1) DK2835958T3 (zh)
WO (1) WO2014023183A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016048302A (ja) * 2014-08-27 2016-04-07 富士通株式会社 音声処理装置、音声処理方法及び音声処理用コンピュータプログラム
JP2016126136A (ja) * 2014-12-26 2016-07-11 Kddi株式会社 自動ミキシング装置およびプログラム
EP3163850A4 (en) * 2014-07-28 2017-07-12 Huawei Technologies Co. Ltd. Acoustical signal processing method and device of communication device
WO2018131524A1 (ja) 2017-01-12 2018-07-19 ソニー株式会社 画像処理装置及び画像処理方法

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2118885B1 (en) * 2007-02-26 2012-07-11 Dolby Laboratories Licensing Corporation Speech enhancement in entertainment audio
CN102801861B (zh) * 2012-08-07 2015-08-19 歌尔声学股份有限公司 一种应用于手机的语音增强方法和装置
CN103873980B (zh) * 2012-12-10 2017-11-28 联想(北京)有限公司 音频处理方法、装置及电子设备
CN203243376U (zh) * 2012-12-17 2013-10-16 杭州惠道科技有限公司 手机声波传输的接受装置
CN103079148B (zh) * 2012-12-28 2018-05-04 中兴通讯股份有限公司 一种终端双麦克风降噪的方法及装置
CN104335600B (zh) * 2013-02-25 2017-08-08 展讯通信(上海)有限公司 多麦克风移动装置中检测及切换降噪模式的方法
US9100466B2 (en) * 2013-05-13 2015-08-04 Intel IP Corporation Method for processing an audio signal and audio receiving circuit
CN104427050B (zh) * 2013-09-10 2018-04-27 联想(北京)有限公司 一种信息处理方法及电子设备
CN104424953B (zh) * 2013-09-11 2019-11-01 华为技术有限公司 语音信号处理方法与装置
CN104468908A (zh) * 2013-09-22 2015-03-25 联想(北京)有限公司 一种消除噪声的方法及电子设备
CN104754430A (zh) * 2013-12-30 2015-07-01 重庆重邮信科通信技术有限公司 终端麦克风降噪装置和方法
CN105374364B (zh) * 2014-08-25 2019-08-27 联想(北京)有限公司 信号处理方法及电子设备
CN104270489A (zh) * 2014-09-10 2015-01-07 中兴通讯股份有限公司 一种从多个麦克风中确定主副麦克风的方法和系统
CN104301537A (zh) * 2014-10-15 2015-01-21 龙旗电子(惠州)有限公司 一种降噪手机及降噪方法
CN104575509A (zh) * 2014-12-29 2015-04-29 乐视致新电子科技(天津)有限公司 语音增强处理方法及装置
US9736578B2 (en) 2015-06-07 2017-08-15 Apple Inc. Microphone-based orientation sensors and related techniques
CN106604183B (zh) * 2015-10-20 2020-06-26 华为终端有限公司 控制终端的多麦克风降噪的拾音范围的方法和装置
KR101715198B1 (ko) * 2015-11-18 2017-03-10 광주과학기술원 가변 전력 예산을 이용한 음성 강화 방법
CN105391829B (zh) * 2015-11-26 2019-11-12 Tcl移动通信科技(宁波)有限公司 一种移动终端的通话音质改善方法及系统
CN105872898A (zh) * 2016-04-12 2016-08-17 北京奇虎科技有限公司 基于双话筒的降噪处理方法及装置
CN106303804B (zh) * 2016-07-28 2019-11-19 维沃移动通信有限公司 一种麦克风的控制方法及移动终端
CN106302905A (zh) * 2016-07-29 2017-01-04 努比亚技术有限公司 麦克风模式切换方法及移动终端
CN107785025B (zh) * 2016-08-25 2021-06-22 上海英波声学工程技术股份有限公司 基于房间脉冲响应重复测量的噪声去除方法及装置
KR20180023617A (ko) * 2016-08-26 2018-03-07 삼성전자주식회사 외부 기기를 제어하는 휴대 기기 및 이의 오디오 신호 처리 방법
CN106683684A (zh) * 2016-12-05 2017-05-17 上海木爷机器人技术有限公司 音频信号处理系统和音频信号处理方法
CN106686249B (zh) * 2017-01-17 2020-04-24 维沃移动通信有限公司 一种语音通话方法及移动终端
CN106816156B (zh) * 2017-02-04 2020-06-30 北京时代拓灵科技有限公司 一种音频质量增强的方法及装置
CN109413253A (zh) * 2017-08-17 2019-03-01 西安中兴新软件有限责任公司 一种实现移动终端的消噪方法及装置
CN107369441A (zh) * 2017-09-08 2017-11-21 奇酷互联网络科技(深圳)有限公司 语音信号的消噪方法、装置及终端
CN108564961A (zh) * 2017-11-29 2018-09-21 华北计算技术研究所(中国电子科技集团公司第十五研究所) 一种移动通信设备的语音降噪方法
CN107910015A (zh) * 2017-12-12 2018-04-13 上海与德科技有限公司 一种终端设备降噪方法及终端设备
CN107993666B (zh) * 2017-12-19 2021-01-29 北京华夏电通科技股份有限公司 语音识别方法、装置、计算机设备及可读存储介质
CN108712551A (zh) * 2018-06-04 2018-10-26 联想(北京)有限公司 一种通话控制方法及电子设备
CN108922555A (zh) * 2018-06-29 2018-11-30 北京小米移动软件有限公司 语音信号的处理方法及装置、终端
US20200168317A1 (en) 2018-08-22 2020-05-28 Centre For Addiction And Mental Health Tool for assisting individuals experiencing auditory hallucinations to differentiate between hallucinations and ambient sounds
CN109327757B (zh) * 2018-09-30 2020-10-02 歌尔科技有限公司 一种双麦克风降噪耳机及其声音处理方法、装置
CN110428806B (zh) * 2019-06-03 2023-02-24 交互未来(北京)科技有限公司 基于麦克风信号的语音交互唤醒电子设备、方法和介质
CN110536193B (zh) * 2019-07-24 2020-12-22 华为技术有限公司 一种音频信号的处理方法及装置
CN111131646A (zh) * 2019-12-30 2020-05-08 Oppo广东移动通信有限公司 通话降噪方法、装置、存储介质及电子装置
CN113571053A (zh) * 2020-04-28 2021-10-29 华为技术有限公司 语音唤醒方法和设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1794757A (zh) * 2004-12-22 2006-06-28 美国博通公司 一种电话及在该电话中处理音频信号的方法
CN1898725A (zh) * 2003-12-22 2007-01-17 索尼爱立信移动通讯股份有限公司 多模声频处理器及其操作方法
CN102300140A (zh) * 2011-08-10 2011-12-28 歌尔声学股份有限公司 一种通信耳机的语音增强方法、装置及降噪通信耳机
CN102611965A (zh) * 2012-03-01 2012-07-25 广东步步高电子工业有限公司 解决双麦克风消噪手机发送响度受手机与嘴距离影响的方法
CN102801861A (zh) * 2012-08-07 2012-11-28 歌尔声学股份有限公司 一种应用于手机的语音增强方法和装置
CN202957890U (zh) * 2012-08-07 2013-05-29 歌尔声学股份有限公司 一种应用于手机的语音增强装置

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005227511A (ja) * 2004-02-12 2005-08-25 Yamaha Motor Co Ltd 対象音検出方法、音信号処理装置、音声認識装置及びプログラム
WO2006027707A1 (en) * 2004-09-07 2006-03-16 Koninklijke Philips Electronics N.V. Telephony device with improved noise suppression
WO2007023954A1 (ja) * 2005-08-26 2007-03-01 Sharp Kabushiki Kaisha 音声処理装置及びそれを備えた表示装置
US8345890B2 (en) * 2006-01-05 2013-01-01 Audience, Inc. System and method for utilizing inter-microphone level differences for speech enhancement
JP2008065904A (ja) * 2006-09-07 2008-03-21 Sony Corp 再生装置、再生方法及び再生プログラム
JP5197458B2 (ja) * 2009-03-25 2013-05-15 株式会社東芝 受音信号処理装置、方法およびプログラム
US8897455B2 (en) * 2010-02-18 2014-11-25 Qualcomm Incorporated Microphone array subset selection for robust noise reduction
US8538035B2 (en) * 2010-04-29 2013-09-17 Audience, Inc. Multi-microphone robust noise suppression
US8611552B1 (en) * 2010-08-25 2013-12-17 Audience, Inc. Direction-aware active noise cancellation system
US9031256B2 (en) * 2010-10-25 2015-05-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for orientation-sensitive recording control
US9330675B2 (en) * 2010-11-12 2016-05-03 Broadcom Corporation Method and apparatus for wind noise detection and suppression using multiple microphones
US9066169B2 (en) * 2011-05-06 2015-06-23 Etymotic Research, Inc. System and method for enhancing speech intelligibility using companion microphones with position sensors
US20130121498A1 (en) * 2011-11-11 2013-05-16 Qsound Labs, Inc. Noise reduction using microphone array orientation information
US8831686B2 (en) * 2012-01-30 2014-09-09 Blackberry Limited Adjusted noise suppression and voice activity detection

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1898725A (zh) * 2003-12-22 2007-01-17 索尼爱立信移动通讯股份有限公司 多模声频处理器及其操作方法
CN1794757A (zh) * 2004-12-22 2006-06-28 美国博通公司 一种电话及在该电话中处理音频信号的方法
CN102300140A (zh) * 2011-08-10 2011-12-28 歌尔声学股份有限公司 一种通信耳机的语音增强方法、装置及降噪通信耳机
CN102611965A (zh) * 2012-03-01 2012-07-25 广东步步高电子工业有限公司 解决双麦克风消噪手机发送响度受手机与嘴距离影响的方法
CN102801861A (zh) * 2012-08-07 2012-11-28 歌尔声学股份有限公司 一种应用于手机的语音增强方法和装置
CN202957890U (zh) * 2012-08-07 2013-05-29 歌尔声学股份有限公司 一种应用于手机的语音增强装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3163850A4 (en) * 2014-07-28 2017-07-12 Huawei Technologies Co. Ltd. Acoustical signal processing method and device of communication device
US10204639B2 (en) 2014-07-28 2019-02-12 Huawei Technologies Co., Ltd. Method and device for processing sound signal for communications device
JP2016048302A (ja) * 2014-08-27 2016-04-07 富士通株式会社 音声処理装置、音声処理方法及び音声処理用コンピュータプログラム
JP2016126136A (ja) * 2014-12-26 2016-07-11 Kddi株式会社 自動ミキシング装置およびプログラム
WO2018131524A1 (ja) 2017-01-12 2018-07-19 ソニー株式会社 画像処理装置及び画像処理方法

Also Published As

Publication number Publication date
KR101639933B1 (ko) 2016-07-14
US9437209B2 (en) 2016-09-06
JP5952434B2 (ja) 2016-07-13
JP2015517116A (ja) 2015-06-18
DK2835958T3 (en) 2018-12-03
EP2835958A4 (en) 2015-05-06
EP2835958B1 (en) 2018-10-03
KR20150017703A (ko) 2015-02-17
CN102801861B (zh) 2015-08-19
US20150142426A1 (en) 2015-05-21
CN102801861A (zh) 2012-11-28
EP2835958A1 (en) 2015-02-11

Similar Documents

Publication Publication Date Title
WO2014023183A1 (zh) 一种应用于手机的语音增强方法和装置
US7464029B2 (en) Robust separation of speech signals in a noisy environment
US10535362B2 (en) Speech enhancement for an electronic device
US9520139B2 (en) Post tone suppression for speech enhancement
Jeub et al. Noise reduction for dual-microphone mobile phones exploiting power level differences
US9966067B2 (en) Audio noise estimation and audio noise reduction using multiple microphones
US8885850B2 (en) Cardioid beam with a desired null based acoustic devices, systems and methods
US10269369B2 (en) System and method of noise reduction for a mobile device
US9113241B2 (en) Noise removing apparatus and noise removing method
US7206418B2 (en) Noise suppression for a wireless communication device
US7983907B2 (en) Headset for separation of speech signals in a noisy environment
CN108447496B (zh) 一种基于麦克风阵列的语音增强方法及装置
JP2004502977A (ja) サブバンド指数平滑雑音消去システム
EP3757993B1 (en) Pre-processing for automatic speech recognition
Jin et al. Multi-channel noise reduction for hands-free voice communication on mobile phones
US9406293B2 (en) Apparatuses and methods to detect and obtain desired audio
JP2009094802A (ja) 通信装置
Freudenberger et al. Microphone diversity combining for in-car applications
CN202957890U (zh) 一种应用于手机的语音增强装置
Ngo et al. Variable speech distortion weighted multichannel wiener filter based on soft output voice activity detection for noise reduction in hearing aids
JP2020170986A (ja) エコー抑圧装置、エコー抑圧方法及びエコー抑圧プログラム
Jin et al. Multi-Channel Noise Reduction with Interference Suppression on Mobile Phones
Zhang et al. Speech enhancement using improved adaptive null-forming in frequency domain with postfilter
Wang et al. Blind dereverberation based on CMN and spectral subtraction by multi-channel LMS algorithm.
JP2014095769A (ja) 発話区間決定装置、発話区間決定方法、および発話区間決定プログラム

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 13827147

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2014561283

Country of ref document: JP

Kind code of ref document: A

ENP Entry into the national phase

Ref document number: 20147031212

Country of ref document: KR

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 2013827147

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 14401198

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE