CN105336339A - 一种语音频信号的处理方法和装置 - Google Patents

一种语音频信号的处理方法和装置 Download PDF

Info

Publication number
CN105336339A
CN105336339A CN201410242233.2A CN201410242233A CN105336339A CN 105336339 A CN105336339 A CN 105336339A CN 201410242233 A CN201410242233 A CN 201410242233A CN 105336339 A CN105336339 A CN 105336339A
Authority
CN
China
Prior art keywords
value
sampled value
signal
frequency signal
voice frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410242233.2A
Other languages
English (en)
Other versions
CN105336339B (zh
Inventor
刘泽新
苗磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to CN201410242233.2A priority Critical patent/CN105336339B/zh
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201910358522.1A priority patent/CN110097892B/zh
Priority to CA2951169A priority patent/CA2951169C/en
Priority to MX2016015950A priority patent/MX362612B/es
Priority to RU2016152224A priority patent/RU2651184C1/ru
Priority to EP19190663.5A priority patent/EP3712890B1/en
Priority to EP15802508.0A priority patent/EP3147900B1/en
Priority to KR1020207011385A priority patent/KR102201791B1/ko
Priority to KR1020167035690A priority patent/KR101943529B1/ko
Priority to BR112016028375-9A priority patent/BR112016028375B1/pt
Priority to AU2015271580A priority patent/AU2015271580B2/en
Priority to EP23184053.9A priority patent/EP4283614A3/en
Priority to PCT/CN2015/071017 priority patent/WO2015184813A1/zh
Priority to NZ727567A priority patent/NZ727567A/en
Priority to ES19190663T priority patent/ES2964221T3/es
Priority to SG11201610141RA priority patent/SG11201610141RA/en
Priority to JP2016570979A priority patent/JP6462727B2/ja
Priority to KR1020197002091A priority patent/KR102104561B1/ko
Priority to MYPI2016704486A priority patent/MY179546A/en
Publication of CN105336339A publication Critical patent/CN105336339A/zh
Priority to HK16108374.1A priority patent/HK1220543A1/zh
Priority to IL249337A priority patent/IL249337B/en
Priority to MX2019001193A priority patent/MX2019001193A/es
Priority to CL2016003121A priority patent/CL2016003121A1/es
Priority to US15/369,396 priority patent/US9978383B2/en
Priority to ZA2016/08477A priority patent/ZA201608477B/en
Priority to US15/985,281 priority patent/US10657977B2/en
Priority to JP2018242725A priority patent/JP6817283B2/ja
Publication of CN105336339B publication Critical patent/CN105336339B/zh
Application granted granted Critical
Priority to US16/877,389 priority patent/US11462225B2/en
Priority to JP2020213571A priority patent/JP7142674B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Noise Elimination (AREA)
  • Telephone Function (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

本发明实施例公开了一种恢复语音频信号噪声成分的方法及装置,方法包括:接收码流,解码所述码流得到语音频信号;根据所述语音频信号确定第一语音频信号;确定所述第一语音频信号中每个采样值的符号和每个所述采样值的幅度值;确定自适应归一化长度;根据所述自适应归一化长度和每个所述采样值的幅度值确定每个所述采样值的调整幅度值;根据每个所述采样值的符号和每个所述采样值的调整幅度值确定第二语音频信号。本发明实施例对于具有上升沿或下降沿的语音频信号,在恢复其噪声成分时不会造成语音频信号恢复噪声成分后的信号具有回声,提高语音频信号恢复噪声成分后的信号的听觉质量。

Description

一种语音频信号的处理方法和装置
技术领域
本发明涉及通信领域,尤其涉及一种语音频信号的处理方法和装置。
背景技术
为了达到更好的听觉质量,目前电子设备在进行语音频信号的编码信息解码时,会对解码得到的语音频信号进行噪声成分的恢复。
目前电子设备在恢复语音频信号的噪声成分时,一般都是通过在语音频信号中添加随机噪声信号来实现的。具体的,将语音频信号和随机噪声信号相加权,得到语音频信号恢复噪声成分后的信号;其中,语音频信号可以是时域信号、频域信号或激励信号,也可以是低频信号或高频信号等。
但是,发明人发现如果语音频信号是具有上升沿或下降沿的信号时,这种恢复语音频信号噪声成分的方法会造成语音频信号恢复噪声成分后得到的信号具有回声,影响恢复噪声成分后的信号的听觉质量。
发明内容
本发明实施例中提供了一种语音频信号的处理方法和装置,对于具有上升沿或下降沿的语音频信号,在恢复其噪声成分时不会造成语音频信号恢复噪声成分后的信号具有回声,提高恢复噪声成分后的信号的听觉质量。
第一方面,本发明实施例提供一种语音频信号的处理方法,所述方法包括:
接收码流,解码所述码流得到语音频信号;
根据所述语音频信号确定第一语音频信号,所述第一语音频信号是所述语音频信号中需要恢复噪声成分的信号;
确定所述第一语音频信号中每个采样值的符号和每个所述采样值的幅度值;
确定自适应归一化长度;
根据所述自适应归一化长度和每个所述采样值的幅度值确定每个所述采样值的调整幅度值;
根据每个所述采样值的符号和每个所述采样值的调整幅度值确定第二语音频信号,所述第二语音频信号是所述第一语音频信号恢复噪声成分后得到的信号。
结合第一方面,在第一方面第一种可能的实现方式中,所述根据所述自适应归一化长度和每个所述采样值的幅度值确定每个所述采样值的调整幅度值,包括:
根据每个所述采样值的幅度值以及所述自适应归一化长度计算每个所述采样值对应的幅度平均值,根据每个所述采样值对应的幅度平均值确定每个所述采样值对应的幅度扰动值;
根据每个所述采样值的幅度值及其对应的幅度扰动值计算每个所述采样值的调整幅度值。
结合第一方面第一种可能的实现方式,在第一方面第二种可能的实现方式中,所述根据每个所述采样值的幅度值以及所述自适应归一化长度计算每个所述采样值对应的幅度平均值,包括:
对于每个所述采样值,根据所述自适应归一化长度确定所述采样值所属的子带;
计算所述采样值所属子带内所有采样值的幅度值的平均值,将计算得到的平均值作为所述采样值对应的幅度平均值。
结合第一方面第二种可能的实现方式,在第一方面第三种可能的实现方式中,对于每个所述采样值,根据所述自适应归一化长度确定所述采样值所属的子带,包括:
将所有采样值按照预设顺序根据所述自适应归一化长度划分子带;对于每个所述采样值,将包括所述采样值的子带确定为所述采样值所属的子带;或者,
对于每个所述采样值,将所述采样值之前m个采样值、所述采样值、所述采样值之后n个采样值构成的子带确定为所述采样值所属的子带,m、n由所述自适应归一化长度确定,m是不小于0的整数,n是不小于0的整数。
结合第一方面第一种可能的实现方式,和/或第一方面第二种可能的实现方式,和/或第一方面第三种可能的实现方式,在第一方面第四种可能的实现方式中,所述根据每个所述采样值的幅度值及其对应的幅度扰动值计算每个所述采样值的调整幅度值,包括:
将每个所述采样值的幅度值与其对应的幅度扰动值相减得到两者的差值,将得到的差值作为每个所述采样值的调整幅度值。
结合第一方面,和/或第一方面第一种可能的实现方式,和/或第一方面第二种可能的实现方式,和/或第一方面第三种可能的实现方式,和/或第一方面第四种可能的实现方式中,在第一方面第五种可能的实现方式中,所述确定自适应归一化长度,包括:
将所述语音频信号中的低频带信号划分为N个子带;N为自然数;
计算每个所述子带的峰均比,并确定所述峰均比大于预设峰均比阈值的子带个数;
根据所述语音频信号中高频带信号的信号类型和所述子带个数,计算所述自适应归一化长度。
结合第一方面第五种可能的实现方式,在第一方面第六种可能的实现方式中,所述根据所述语音频信号中高频带信号的信号类型和所述子带个数,计算所述自适应归一化长度,包括:
根据公式L=K+α*M计算所述自适应归一化长度;
其中,L为所述自适应归一化长度;K为所述语音频信号中的高频带信号的信号类型对应的数值,不同高频带信号的信号类型对应的K的数值不同;M为峰均比大于预设峰均比阈值的子带个数;α为小于1的常数。
结合第一方面,和/或第一方面第一种可能的实现方式,和/或第一方面第二种可能的实现方式,和/或第一方面第三种可能的实现方式,和/或第一方面第四种可能的实现方式,在第一方面第七种可能的实现方式中,所述确定自适应归一化长度,包括:
计算所述语音频信号中低频带信号的峰均比,和所述语音频信号中高频带信号的峰均比;当所述低频带信号的峰均比和所述高频带信号的峰均比的差值的绝对值小于预设差值阈值时,将所述自适应归一化长度确定为预设第一长度值,当所述低频带信号的峰均比和所述高频带信号的峰均比的差值的绝对值不小于预设差值阈值时,将所述自适应归一化长度确定为预设第二长度值;所述第一长度值>所述第二长度值;或者,
计算所述语音频信号中低频带信号的峰均比,和所述语音频信号中高频带信号的峰均比;当所述低频带信号的峰均比小于所述高频带信号的峰均比时,将所述自适应归一化长度确定为预设第一长度值,当所述低频带信号的峰均比不小于所述高频带信号的峰均比时,将所述自适应归一化长度确定为预设第二长度值;或者,
根据所述语音频信号中高频带信号的信号类型确定所述自适应归一化长度,不同高频带信号的信号类型对应的自适应归一化长度不同。
结合第一方面,和/或第一方面第一种可能的实现方式,和/或第一方面第二种可能的实现方式,和/或第一方面第三种可能的实现方式,和/或第一方面第四种可能的实现方式,和/或第一方面第五种可能的实现方式,和/或第一方面第六种可能的实现方式,和/或第一方面第七种可能的实现方式,在第一方面第八种可能的实现方式中,所述根据每个所述采样值的符号和每个所述采样值的调整幅度值确定第二语音频信号,包括:
根据每个所述采样值的符号和调整幅度值确定每个所述采样值的新取值,得到所述第二语音频信号;或者,
计算修正因子;根据所述修正因子对所述采样值的调整幅度值中大于0的调整幅度值进行修正处理;根据每个所述采样值的符号和修正处理后的调整幅度值确定每个所述采样值的新取值,得到第二语音频信号。
结合第一方面第八种可能的实现方式,在第一方面第九种可能的实现方式中,所述计算修正因子,包括:
使用公式β=a/L计算所述修正因子;其中,β为所述修正因子,L为所述自适应归一化长度,a为大于1的常数。
结合第一方面第八种可能的实现方式,和/或第一方面第九种可能的实现方式,在第一方面第十种可能的实现方式中,所述根据所述修正因子对所述采样值的调整幅度值中大于0的调整幅度值进行修正处理,包括:
使用以下公式对所述采样值的调整幅度值中大于0的调整幅度值进行修正处理:
Y=y*(b-β);
其中,Y为修正处理后的调整幅度值,y为所述采样值的调整幅度值中大于0的调整幅度值,b为常数,0<b<2。
第二方面,本发明实施例提供一种恢复语音频信号噪声成分的装置,包括:
码流处理单元,用于接收码流,解码所述码流得到语音频信号;
信号确定单元,用于根据所述码流处理单元得到的所述语音频信号确定第一语音频信号,所述第一语音频信号是解码得到的所述语音频信号中需要恢复噪声成分的信号;
第一确定单元,用于确定所述信号确定单元确定的所述第一语音频信号中每个采样值的符号和每个所述采样值的幅度值;
第二确定单元,用于确定自适应归一化长度;
第三确定单元,用于根据所述第二确定单元确定的所述自适应归一化长度和所述第一确定单元确定的每个所述采样值的幅度值确定每个所述采样值的调整幅度值;
第四确定单元,用于根据所述第一确定单元确定的每个所述采样值的符号和所述第三确定单元确定的每个所述采样值的调整幅度值确定第二语音频信号,所述第二语音频信号是所述第一语音频信号恢复噪声成分后得到的信号。
结合第二方面,在第二方面第一种可能的实现方式中,所述第三确定单元包括:
确定子单元,用于根据每个所述采样值的幅度值以及所述自适应归一化长度计算每个所述采样值对应的幅度平均值,根据每个所述采样值对应的幅度平均值确定每个所述采样值对应的幅度扰动值;
调整幅度值计算子单元,用于根据每个所述采样值的幅度值及其对应的幅度扰动值计算每个所述采样值的调整幅度值。
结合第二方面第一种可能的实现方式,在第二方面第二种可能的实现方式中,所述确定子单元包括:
确定模块,用于对于每个所述采样值,根据所述自适应归一化长度确定所述采样值所属的子带;
计算模块,用于计算所述采样值所属子带内所有采样值的幅度值的平均值,将计算得到的平均值作为所述采样值对应的幅度平均值。
结合第二方面第二种可能的实现方式,在第二方面第三种可能的实现方式中,所述确定模块具体用于:
将所有采样值按照预设顺序根据所述自适应归一化长度划分子带;对于每个所述采样值,将包括所述采样值的子带确定为所述采样值所属的子带;或者,
对于每个所述采样值,将所述采样值之前m个采样值、所述采样值、所述采样值之后n个采样值构成的子带确定为所述采样值所属的子带,m、n由所述自适应归一化长度确定,m是不小于0的整数,n是不小于0的整数。
结合第二方面第一种可能的实现方式,和/或第二方面第二种可能的实现方式,和/或第二方面第三种可能的实现方式,在第二方面第四种可能的实现方式中,所述调整幅度值计算子单元具体用于:
将每个所述采样值的幅度值与其对应的幅度扰动值相减得到两者的差值,将得到的差值作为每个所述采样值的调整幅度值。
结合第二方面,和/或第二方面第一种可能的实现方式,和/或第二方面第二种可能的实现方式,和/或第二方面第三种可能的实现方式,和/或第二方面第四种可能的实现方式中,在第二方面第五种可能的实现方式中,所述第二确定单元包括:
划分子单元,用于将所述语音频信号中的低频带信号划分为N个子带;N为自然数;
个数确定子单元,用于计算每个所述子带的峰均比,并确定所述峰均比大于预设峰均比阈值的子带个数;
长度计算子单元,用于根据所述语音频信号中高频带信号的信号类型和所述子带个数,计算所述自适应归一化长度。
结合第二方面第五种可能的实现方式,在第二方面第六种可能的实现方式中,所述长度计算子单元具体用于:
根据公式L=K+α*M计算所述自适应归一化长度;
其中,L为所述自适应归一化长度;K为所述语音频信号中的高频带信号的信号类型对应的数值,不同高频带信号的信号类型对应的K的数值不同;M为峰均比大于预设峰均比阈值的子带个数;α为小于1的常数。
结合第二方面,和/或第二方面第一种可能的实现方式,和/或第二方面第二种可能的实现方式,和/或第二方面第三种可能的实现方式,和/或第二方面第四种可能的实现方式,在第二方面第七种可能的实现方式中,所述第二确定单元具体用于:
计算所述语音频信号中低频带信号的峰均比,和所述语音频信号中高频带信号的峰均比;当所述低频带信号的峰均比和所述高频带信号的峰均比的差值的绝对值小于预设差值阈值时,将所述自适应归一化长度确定为预设第一长度值,当所述低频带信号的峰均比和所述高频带信号的峰均比的差值的绝对值不小于预设差值阈值时,将所述自适应归一化长度确定为预设第二长度值;所述第一长度值>所述第二长度值;或者,
计算所述语音频信号中低频带信号的峰均比,和所述语音频信号中高频带信号的峰均比;当所述低频带信号的峰均比小于所述高频带信号的峰均比时,将所述自适应归一化长度确定为预设第一长度值,当所述低频带信号的峰均比不小于所述高频带信号的峰均比时,将所述自适应归一化长度确定为预设第二长度值;或者,
根据所述语音频信号中高频带信号的信号类型确定所述自适应归一化长度,不同高频带信号的信号类型对应的自适应归一化长度不同。
结合第二方面,和/或第二方面第一种可能的实现方式,和/或第二方面第二种可能的实现方式,和/或第二方面第三种可能的实现方式,和/或第二方面第四种可能的实现方式,和/或第二方面第五种可能的实现方式,和/或第二方面第六种可能的实现方式,和/或第二方面第七种可能的实现方式,在第二方面第八种可能的实现方式中,所述第四确定单元具体用于:
根据每个所述采样值的符号和调整幅度值确定每个所述采样值的新取值,得到所述第二语音频信号;或者,
计算修正因子;根据所述修正因子对所述采样值的调整幅度值中大于0的调整幅度值进行修正处理;根据每个所述采样值的符号和修正处理后的调整幅度值确定每个所述采样值的新取值,得到第二语音频信号。
结合第二方面第八种可能的实现方式,在第二方面第九种可能的实现方式中,所述第四确定单元具体用于:使用公式β=a/L计算所述修正因子;其中,β为所述修正因子,L为所述自适应归一化长度,a为大于1的常数。
结合第二方面第八种可能的实现方式,和/或第二方面第九种可能的实现方式,在第二方面第十种可能的实现方式中,所述第四确定单元具体用于:
使用以下公式对所述采样值的调整幅度值中大于0的调整幅度值进行修正处理:
Y=y*(b-β);
其中,Y为修正处理后的调整幅度值,y为将所述采样值的调整幅度值中大于0的调整幅度值,b为常数,0<b<2。
本实施例中,接收码流,解码所述码流得到语音频信号,根据所述语音频信号确定第一语音频信号,确定所述第一语音频信号中每个采样值的符号和每个所述采样值的幅度值,确定自适应归一化长度,根据所述自适应归一化长度和每个所述采样值的幅度值确定每个所述采样值的调整幅度值,根据每个所述采样值的符号和每个所述采样值的调整幅度值确定第二语音频信号。这一过程中,只是对第一语音频信号这一原有信号进行处理,并未在第一语音频信号中增加新的信号,从而恢复噪声成分后的第二语音频信号中并未增加新的能量,从而如果第一语音频信号具有上升沿或下降沿,不会增加第二语音频信号中的回声,从而提高了第二语音频信号的听觉质量。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例恢复语音频信号噪声成分的一种方法流程示意图;
图1A为本发明实施例采样值分组举例示意图;
图1B为本发明实施例采样值分组举例另一示意图;
图2为本发明实施例恢复语音频信号噪声成分的另一种方法流程示意图;
图3为本发明实施例恢复语音频信号噪声成分的另一种方法流程示意图;
图4为本发明实施例恢复语音频信号噪声成分的装置结构示意图;
图5为本发明实施例电子设备结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,为本发明实施例恢复语音频信号噪声成分的方法流程图,该方法包括:
步骤101:接收码流,解码所述码流得到语音频信号;
其中,具体如何解码码流得到语音频信号,这里不再赘述。
步骤102:根据所述语音频信号确定第一语音频信号;所述第一语音频信号是解码得到的所述语音频信号中需要恢复噪声成分的信号;
其中,所述第一语音频信号可以是解码得到的语音频信号中的低频带信号、高频带信号、或者全频带信号等。
所述解码得到的语音频信号可以包括一路低频带信号和一路高频带信号,或者也可以包括一路全频带信号。
步骤103:确定所述第一语音频信号中每个采样值的符号和每个所述采样值的幅度值;
其中,所述第一语音频信号具有不同实现时,所述采样值的实现方式也可能不同,例如如果所述第一语音频信号是频域信号,所述采样值可以为频谱系数;如果所述语音频信号是时域信号,所述采样值可以为样点值。
步骤104:确定自适应归一化长度;
其中,在确定自适应归一化长度时,可以根据所述解码得到的语音频信号的低频带信号和/或高频带信号的相关参数来确定。具体的,所述相关参数可以包括信号类型、峰均比等。例如,在一种可能的实现方式中,所述确定自适应归一化长度,可以包括:
将所述语音频信号中的低频带信号划分为N个子带;N为自然数;
计算每个所述子带的峰均比,并确定所述峰均比大于预设峰均比阈值的子带个数;
根据所述语音频信号中高频带信号的信号类型和所述子带个数,计算所述自适应归一化长度。
可选地,所述根据所述语音频信号中高频带信号的信号类型和所述子带个数,计算所述自适应归一化长度,可以包括:
根据公式L=K+α*M计算所述自适应归一化长度;
其中,L为所述自适应归一化长度;K为所述语音频信号中的高频带信号的信号类型对应的数值,不同高频带信号的信号类型对应的K的数值不同;M为峰均比大于预设峰均比阈值的子带个数;α为小于1的常数。
在另一种可能的实现方式中,也可以根据所述语音频信号中低频带信号的信号类型和所述子带个数,计算所述自适应归一化长度。具体的计算公式可以参见公式L=K+α*M,区别仅在于此时的K为所述语音频信号中的低频带信号的信号类型对应的数值,不同低频带信号的信号类型对应的K的数值不同。
在第三种可能的实现方式中,确定自适应归一化长度可以包括:
计算所述语音频信号中低频带信号的峰均比,和所述语音频信号中高频带信号的峰均比;当低频带信号的峰均比和高频带信号的峰均比差值的绝对值小于预设差值阈值时,将自适应归一化长度确定为预设第一长度值,当低频带信号的峰均比和高频带信号的峰均比差值的绝对值不小于预设差值阈值时,将自适应归一化长度确定为预设第二长度值。第一长度值>第二长度值,第一长度值和第二长度值也可以通过低频带信号的峰均比和高频带信号的峰均比的比值或差值计算得到,具体计算方法不限定。
在第四种可能的实现方式中,确定自适应归一化长度可以包括:
计算所述语音频信号中低频带信号的峰均比,和所述语音频信号中高频带信号的峰均比;当低频带信号的峰均比小于高频带信号的峰均比时,将自适应归一化长度确定为预设第一长度值,当低频带信号的峰均比不小于高频带信号的峰均比时,将自适应归一化长度确定为预设第二长度值。第一长度值>第二长度值,第一长度值和第二长度值也可以通过低频带信号的峰均比和高频带信号的峰均比的比值或差值计算得到,具体计算方法不限定。
在第五种可能的实现方式中,确定自适应归一化长度可以包括:根据语音频信号中高频带信号的信号类型确定自适应归一化长度,不同的信号类型对应不同的自适应归一化长度,如信号类型为谐波信号时,对应的自适应归一化长度为32,信号类型为普通信号时,对应的自适应归一化长度为16,信号类型为瞬态信号时,对应的自适应归一化长度为8等。
步骤105:根据所述自适应归一化长度和每个所述采样值的幅度值确定每个所述采样值的调整幅度值;
其中,所述根据所述自适应归一化长度和每个所述采样值的幅度值确定每个所述采样值的调整幅度值,可以包括:
根据每个所述采样值的幅度值以及所述自适应归一化长度计算每个所述采样值对应的幅度平均值,根据每个所述采样值对应的幅度平均值确定每个所述采样值对应的幅度扰动值;
根据每个所述采样值的幅度值及其对应的幅度扰动值计算每个所述采样值的调整幅度值。
其中,所述根据每个所述采样值的幅度值以及所述自适应归一化长度计算每个所述采样值对应的幅度平均值,可以包括:
对于每个所述采样值,根据所述自适应归一化长度确定所述采样值所属的子带;
计算所述采样值所属子带内所有采样值的幅度值的平均值,将计算得到的平均值作为所述采样值对应的幅度平均值。
其中,对于每个所述采样值,根据所述自适应归一化长度确定所述采样值所属的子带,可以包括:
将所有采样值按照预设顺序根据所述自适应归一化长度划分子带;对于每个所述采样值,将包括所述采样值的子带确定为所述采样值所属的子带。
其中,所述预设顺序例如可以为从低频到高频的顺序或者从高频到低频的顺序等,这里不限制。
例如,参见图1A所示,假设采样值从低到高分别为x1、x2、x3…xn,所述自适应归一化长度假设为5,则可以将x1~x5划分为一个子带,x6~x10划分为一个子带…以此类推,得到若干个子带,则对于x1~x5中的每个采样值而言,子带x1~x5就是每个采样值所属的子带,对于x6~x10中的每个采样值而言,子带x6~x10就是每个采样值所属的子带。
或者,对于每个所述采样值,根据所述自适应归一化长度确定所述采样值所属的子带,可以包括:
对于每个所述采样值,将所述采样值之前m个采样值、所述采样值、所述采样值之后n个采样值构成的子带确定为所述采样值所属的子带,m、n由所述自适应归一化长度确定,m是不小于0的整数,n是不小于0的整数。
例如,参见图1B所示,假设采样值从低到高分别为x1、x2、x3…xn,所述自适应归一化长度假设为5,m取值为2,n取值为2,则,对于采样值x3而言,x1~x5构成的子带就是采样值x3所属子带,对于采样值x4而言,x2~x6构成的子带就是采样值x4所述子带,以此类推。其中,对于采样值x1、x2而言,由于其之前没有足够的采样值构成其所属子带,对于采样值x(n-1)、xn而言,由于其之后没有足够的采样值构成其所属子带,因此,可以在实际应用中自主设定x1、x2、x(n-1)、xn所属子带,例如添加采样值自身补充子带中缺少的采样值等,举例来说,对于采样值x1,其之前不存在采样值,则可以将x1、x1、x1、x2、x3作为其所属子带等。
其中,根据每个所述采样值对应的幅度平均值确定每个所述采样值对应的幅度扰动值时,可以将每个所述采样值对应的幅度平均值直接作为每个所述采样值对应的幅度扰动值,也可以对每个所述采样值对应的幅度平均值做某一预设运算得到每个所述采样值对应的幅度扰动值,所述预设运算例如可以为为所述幅度平均值乘以一个数值,该数值一般大于0。
其中,所述根据每个所述采样值的幅度值及其对应的幅度扰动值计算每个所述采样值的调整幅度值,可以包括:
将每个所述采样值的幅度值与其对应的幅度扰动值相减得到两者的差值,将得到的差值作为每个所述采样值的调整幅度值。
步骤106:根据每个所述采样值的符号和每个所述采样值的调整幅度值确定第二语音频信号;所述第二语音频信号是所述第一语音频信号恢复噪声成分后得到的信号。
其中,在一种可能的实现方式中,可以根据每个采样值的符号和调整幅度值确定每个采样值的新取值,得到所述第二语音频信号;
在另一种可能的实现方式中,所述根据每个所述采样值的符号和每个所述采样值的调整幅度值确定第二语音频信号,可以包括:
计算修正因子;
根据所述修正因子对采样值的调整幅度值中大于0的调整幅度值进行修正处理;
根据每个采样值的符号和修正处理后的调整幅度值确定每个采样值的新取值,得到第二语音频信号。
在一种可能的实现方式中,得到的所述第二语音频信号可以包括所有采样值的新取值。
其中,所述修正因子可以根据所述自适应归一化长度计算,具体的,所述修正因子β可以等于a/L;其中,a为大于1的常数。
其中,所述根据所述修正因子对采样值的调整幅度值中大于0的调整幅度值进行修正处理,可以包括:
使用以下公式对采样值的调整幅度值中大于0的调整幅度值进行修正处理:
Y=y*(b-β);
其中,Y为修正处理后的调整幅度值,y为采样值的调整幅度值中大于0的调整幅度值,b为常数,0<b<2。
其中,步骤103中提取所述第一语音频信号中每个采样值的符号的步骤可以在步骤106之前的任意时刻处理,与步骤104、105之间没有必然的执行顺序。
其中,步骤103与步骤104之间的执行顺序不限制。
在现有技术中,当语音频信号是具有上升沿或下降沿的信号时,语音频信号的时域信号可能在一帧内,此时语音频信号中部分信号的样点值特别大,能量特别大,而语音频信号的其他部分信号的样点值特别小,能量特别小,此时,在频域对语音频信号添加随机噪声信号得到恢复噪声成分后的信号,由于随机噪声信号在一帧内时域上看能量是相当的,从而在将恢复噪声成分后的信号的频域信号转换为时域信号时,新添加的随机噪声信号往往会使得转换得到的时域信号中原来样点值特别小的部分信号的能量增加,这一部分信号的样点值也都相应变的比较大,这样就会造成恢复噪声成分后的信号具有一些回声,影响恢复噪声成分后的信号的听觉质量。
而本实施例中,根据语音频信号确定第一语音频信号,确定所述第一语音频信号中每个采样值的符号和每个所述采样值的幅度值,确定自适应归一化长度,根据所述自适应归一化长度和每个所述采样值的幅度值确定每个所述采样值的调整幅度值,根据每个所述采样值的符号和每个所述采样值的调整幅度值确定第二语音频信号。这一过程中,只是对第一语音频信号这一原有信号进行处理,并未在第一语音频信号中增加新的信号,从而恢复噪声成分后的第二语音频信号中并未增加新的能量,从而如果第一语音频信号具有上升沿或下降沿,不会增加第二语音频信号中的回声,从而提高了第二语音频信号的听觉质量。
参见图2,为本发明实施例恢复语音频信号噪声成分的方法另一种流程示意图,该方法包括:
步骤201:接收码流,解码所述码流得到语音频信号,解码得到的语音频信号包括低频带信号和高频带信号,将高频带信号确定为第一语音频信号。
其中,如何对码流进行解码,本发明并不限制。
步骤202:确定所述高频带信号中每个采样值的符号以及每个采样值的幅度值。
例如,高频带信号中某一采样值的系数为-4,则该采样值的符号为“-”,幅度值为4。
步骤203:确定自适应归一化长度;
其中,具体如何确定所述自适应归一化长度可以参考步骤104中的相关描述,这里不赘述。
步骤204:根据每个采样值的幅度值以及所述自适应归一化长度确定每个采样值对应的幅度平均值,根据每个采样值对应的幅度平均值确定每个采样值对应的幅度扰动值。
其中,如何确定每个采样值对应的幅度平均值请参考步骤105中的相关描述,这里不赘述。
步骤205:根据每个采样值的幅度值及其对应的幅度扰动值计算每个采样值的调整幅度值;
其中,如何计算每个采样值的调整幅度值可以参考步骤105中的相关描述,这里不赘述。
步骤206:根据每个采样值的符号和调整幅度值确定第二语音频信号。
所述第二语音频信号是所述第一语音频信号恢复噪声成分后得到的信号。
其中,本步骤的具体实现请参考步骤106中的相关描述,这里不赘述。
其中,步骤202中确定第一语音频信号中每个采样值的符号的步骤可以在步骤206之前的任意时刻执行,与步骤203、204、205之间没有必然的执行顺序。
其中,步骤202与步骤203之间的执行顺序不限制。
步骤207:将所述第二语音频信号和解码得到的语音频信号的低频带信号合并,得到输出信号。
其中,如果所述第一语音频信号为解码得到的语音频信号的低频带信号,则可以将所述第二语音频信号和所述解码得到的语音频信号的高频带信号合并,得到输出信号;
如果所述第一语音频信号为解码得到的语音频信号的高频带信号,则可以将所述第二语音频信号和所述解码得到的语音频信号的低频带信号合并,得到输出信号;
如果所述第一语音频信号为解码得到的语音频信号的全频带信号,则可以将所述第二语音频信号直接确定为所述输出信号。
本实施例中,通过对解码得到的语音频信号的高频带信号恢复噪声成分,从而最终恢复高频带信号中的噪声成分,得到第二语音频信号。从而如果高频带信号具有上升沿或下降沿,不会增加第二语音频信号中的回声,提高了第二语音频信号的听觉质量,进而提高了最终输出的所述输出信号的听觉质量。
参见图3,为本发明实施例恢复语音频信号噪声成分的方法另一种流程示意图,该方法包括:
步骤301~步骤305与步骤201~步骤205相同,这里不赘述。
步骤306:计算修正因子,根据所述修正因子对每个采样值的调整幅度值中大于0的调整幅度值进行修正处理;
其中,本步骤的具体实现请参考步骤106中的相关描述,这里不赘述。
步骤307:根据每个采样值的符号和修正处理后的调整幅度值确定第二语音频信号。
其中,本步骤的具体实现请参考步骤106中的相关描述,这里不赘述。
其中,步骤302中确定第一语音频信号中每个采样值的符号的步骤可以在步骤307之前的任意时刻执行,与步骤303、304、305、306之间没有必然的执行顺序。
其中,步骤302与步骤303之间的执行顺序不限制。
步骤308:将所述第二语音频信号和解码得到的语音频信号的低频带信号合并,得到输出信号。
本实施例相对于图2所示的实施例,在得到每个采样值的调整幅度值后,对调整幅度值中大于0的调整幅度值进一步进行修正,从而进一步提高了第二语音频信号的听觉质量,进而也进一步提高了最终输出的所述输出信号的听觉质量。
在图2和图3给出的本发明实施例恢复语音频信号噪声成分的方法示例中,都是将解码得到的语音频信号中的高频带信号确定为第一语音频信号,在其中恢复噪音成分,从而最终得到第二语音频信号,在实际应用中,还可以按照本发明实施例恢复语音频信号噪声成分的方法对解码得到的语音频信号的全频带信号恢复噪声成分,或者对解码得到的语音频信号的低频带信号恢复噪声成分,最终得到第二语音频信号,其实现过程可以参见图2和图3所示的方法示例,区别仅在于在确定第一语音频信号时将全频带信号或者低频带信号确定为所述第一语音频信号,这里不一一举例说明。
参见图4,为本发明实施例一种恢复语音频信号噪声成分的装置结构示意图,该装置可以设置于电子设备中,该装置400可以包括:
码流处理单元410,用于接收码流,解码所述码流得到语音频信号,所述第一语音频信号是解码得到的所述语音频信号中需要恢复噪声成分的信号;
信号确定单元420,用于根据所述码流处理单元410得到的所述语音频信号确定第一语音频信号;
第一确定单元430,用于确定所述信号确定单元420确定的所述第一语音频信号中每个采样值的符号和每个所述采样值的幅度值;
第二确定单元440,用于确定自适应归一化长度;
第三确定单元450,用于根据所述第二确定单元440确定的所述自适应归一化长度和所述第一确定单元430确定的每个所述采样值的幅度值确定每个所述采样值的调整幅度值;
第四确定单元460,用于根据所述第一确定单元430确定的每个所述采样值的符号和所述第三确定单元450确定的每个所述采样值的调整幅度值确定第二语音频信号,所述第二语音频信号是所述第一语音频信号恢复噪声成分后得到的信号。
可选地,所述第三确定单元450可以包括:
确定子单元,用于根据每个所述采样值的幅度值以及所述自适应归一化长度计算每个所述采样值对应的幅度平均值,根据每个所述采样值对应的幅度平均值确定每个所述采样值对应的幅度扰动值;
调整幅度值计算子单元,用于根据每个所述采样值的幅度值及其对应的幅度扰动值计算每个所述采样值的调整幅度值。
可选地,所述确定子单元可以包括:
确定模块,用于对于每个所述采样值,根据所述自适应归一化长度确定所述采样值所属的子带;
计算模块,用于计算所述采样值所属子带内所有采样值的幅度值的平均值,将计算得到的平均值作为所述采样值对应的幅度平均值。
可选地,所述确定模块具体可以用于:
将所有采样值按照预设顺序根据所述自适应归一化长度划分子带;对于每个所述采样值,将包括所述采样值的子带确定为所述采样值所属的子带;或者,
对于每个所述采样值,将所述采样值之前m个采样值、所述采样值、所述采样值之后n个采样值构成的子带确定为所述采样值所属的子带,m、n由所述自适应归一化长度确定,m是不小于0的整数,n是不小于0的整数。
可选地,所述调整幅度值计算子单元具体用于:
将每个所述采样值的幅度值与其对应的幅度扰动值相减得到两者的差值,将得到的差值作为每个所述采样值的调整幅度值。
可选地,所述第二确定单元440可以包括:
划分子单元,用于将所述语音频信号中的低频带信号划分为N个子带;N为自然数;
个数确定子单元,用于计算每个所述子带的峰均比,并确定所述峰均比大于预设峰均比阈值的子带个数;
长度计算子单元,用于根据所述语音频信号中高频带信号的信号类型和所述子带个数,计算所述自适应归一化长度。
可选地,所述长度计算子单元具体可以用于:
根据公式L=K+α*M计算所述自适应归一化长度;
其中,L为所述自适应归一化长度;K为所述语音频信号中的高频带信号的信号类型对应的数值,不同高频带信号的信号类型对应的K的数值不同;M为峰均比大于预设峰均比阈值的子带个数;α为小于1的常数。
可选地,所述第二确定单元440具体可以用于:
计算所述语音频信号中低频带信号的峰均比,和所述语音频信号中高频带信号的峰均比;当所述低频带信号的峰均比和所述高频带信号的峰均比的差值的绝对值小于预设差值阈值时,将所述自适应归一化长度确定为预设第一长度值,当所述低频带信号的峰均比和所述高频带信号的峰均比的差值的绝对值不小于预设差值阈值时,将所述自适应归一化长度确定为预设第二长度值;所述第一长度值>所述第二长度值;或者,
计算所述语音频信号中低频带信号的峰均比,和所述语音频信号中高频带信号的峰均比;当所述低频带信号的峰均比小于所述高频带信号的峰均比时,将所述自适应归一化长度确定为预设第一长度值,当所述低频带信号的峰均比不小于所述高频带信号的峰均比时,将所述自适应归一化长度确定为预设第二长度值;或者,
根据所述语音频信号中高频带信号的信号类型确定所述自适应归一化长度,不同高频带信号的信号类型对应的自适应归一化长度不同。
可选地,所述第四确定单元460具体可以用于:
根据每个所述采样值的符号和调整幅度值确定每个所述采样值的新取值,得到所述第二语音频信号;或者,
计算修正因子;根据所述修正因子对所述采样值的调整幅度值中大于0的调整幅度值进行修正处理;根据每个所述采样值的符号和修正处理后的调整幅度值确定每个所述采样值的新取值,得到第二语音频信号。
可选地,所述第四确定单元460具体可以用于:使用公式β=a/L计算所述修正因子;其中,β为所述修正因子,L为所述自适应归一化长度,a为大于1的常数。
可选地,所述第四确定单元460具体可以用于:
使用以下公式对所述采样值的调整幅度值中大于0的调整幅度值进行修正处理:
Y=y*(b-β);
其中,Y为修正处理后的调整幅度值,y为将所述采样值的调整幅度值中大于0的调整幅度值,b为常数,0<b<2。
本实施例中,根据语音频信号确定第一语音频信号,确定所述第一语音频信号中每个采样值的符号和每个所述采样值的幅度值,确定自适应归一化长度,根据所述自适应归一化长度和每个所述采样值的幅度值确定每个所述采样值的调整幅度值,根据每个所述采样值的符号和每个所述采样值的调整幅度值确定第二语音频信号。这一过程中,只是对第一语音频信号这一原有信号进行处理,并未在第一语音频信号中增加新的信号,从而恢复噪声成分后的第二语音频信号中并未增加新的能量,从而如果第一语音频信号具有上升沿或下降沿,不会增加第二语音频信号中的回声,从而提高了第二语音频信号的听觉质量。
参见图5,为本发明实施例电子设备结构图,该电子设备500包括:处理器510、存储器520、收发器530和总线540;
处理器510、存储器520、收发器530通过总线540相互连接;总线540可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图5中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器520,用于存放程序。具体地,程序可以包括程序代码,所述程序代码包括计算机操作指令。存储器520可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。
收发器530用于连接其他设备,并与其他设备进行通信。具体的所述收发器530可以用于:接收码流;
所述处理器510执行存储器520中存储的所述程序代码,用于解码所述码流得到语音频信号;根据所述语音频信号确定第一语音频信号;确定所述第一语音频信号中每个采样值的符号和每个所述采样值的幅度值;确定自适应归一化长度;根据所述自适应归一化长度和每个所述采样值的幅度值确定每个所述采样值的调整幅度值;根据每个所述采样值的符号和每个所述采样值的调整幅度值确定第二语音频信号。
可选地,所述处理器510具体可以用于:
根据每个所述采样值的幅度值以及所述自适应归一化长度计算每个所述采样值对应的幅度平均值,根据每个所述采样值对应的幅度平均值确定每个所述采样值对应的幅度扰动值;
根据每个所述采样值的幅度值及其对应的幅度扰动值计算每个所述采样值的调整幅度值。
可选地,所述处理器510具体可以用于:
对于每个所述采样值,根据所述自适应归一化长度确定所述采样值所属的子带;
计算所述采样值所属子带内所有采样值的幅度值的平均值,将计算得到的平均值作为所述采样值对应的幅度平均值。
可选地,所述处理器510具体可以用于:
将所有采样值按照预设顺序根据所述自适应归一化长度划分子带;对于每个所述采样值,将包括所述采样值的子带确定为所述采样值所属的子带;或者,
对于每个所述采样值,将所述采样值之前m个采样值、所述采样值、所述采样值之后n个采样值构成的子带确定为所述采样值所属的子带,m、n由所述自适应归一化长度确定,m是不小于0的整数,n是不小于0的整数。
可选地,所述处理器510具体可以用于:
将每个所述采样值的幅度值与其对应的幅度扰动值相减得到两者的差值,将得到的差值作为每个所述采样值的调整幅度值。
可选地,所述处理器510具体可以用于:
将所述语音频信号中的低频带信号划分为N个子带;N为自然数;
计算每个所述子带的峰均比,并确定所述峰均比大于预设峰均比阈值的子带个数;
根据所述语音频信号中高频带信号的信号类型和所述子带个数,计算所述自适应归一化长度。
可选地,所述处理器510具体可以用于:
根据公式L=K+α*M计算所述自适应归一化长度;
其中,L为所述自适应归一化长度;K为所述语音频信号中的高频带信号的信号类型对应的数值,不同高频带信号的信号类型对应的K的数值不同;M为峰均比大于预设峰均比阈值的子带个数;α为小于1的常数。
可选地,所述处理器510具体可以用于:
计算所述语音频信号中低频带信号的峰均比,和所述语音频信号中高频带信号的峰均比;当所述低频带信号的峰均比和所述高频带信号的峰均比的差值的绝对值小于预设差值阈值时,将所述自适应归一化长度确定为预设第一长度值,当所述低频带信号的峰均比和所述高频带信号的峰均比的差值的绝对值不小于预设差值阈值时,将所述自适应归一化长度确定为预设第二长度值;所述第一长度值>所述第二长度值;或者,
计算所述语音频信号中低频带信号的峰均比,和所述语音频信号中高频带信号的峰均比;当所述低频带信号的峰均比小于所述高频带信号的峰均比时,将所述自适应归一化长度确定为预设第一长度值,当所述低频带信号的峰均比不小于所述高频带信号的峰均比时,将所述自适应归一化长度确定为预设第二长度值;或者,
根据所述语音频信号中高频带信号的信号类型确定所述自适应归一化长度,不同高频带信号的信号类型对应的自适应归一化长度不同。
可选地,所述处理器510具体可以用于:
根据每个所述采样值的符号和调整幅度值确定每个所述采样值的新取值,得到所述第二语音频信号;或者,
计算修正因子;根据所述修正因子对所述采样值的调整幅度值中大于0的调整幅度值进行修正处理;根据每个所述采样值的符号和修正处理后的调整幅度值确定每个所述采样值的新取值,得到第二语音频信号。
可选地,所述处理器510具体可以用于:
使用公式β=a/L计算所述修正因子;其中,β为所述修正因子,L为所述自适应归一化长度,a为大于1的常数。
可选地,所述处理器510具体可以用于:
使用以下公式对所述采样值的调整幅度值中大于0的调整幅度值进行修正处理:
Y=y*(b-β);
其中,Y为修正处理后的调整幅度值,y为所述采样值的调整幅度值中大于0的调整幅度值,b为常数,0<b<2。
本实施例中,电子设备根据语音频信号确定第一语音频信号,确定所述第一语音频信号中每个采样值的符号和每个所述采样值的幅度值,确定自适应归一化长度,根据所述自适应归一化长度和每个所述采样值的幅度值确定每个所述采样值的调整幅度值,根据每个所述采样值的符号和每个所述采样值的调整幅度值确定第二语音频信号。这一过程中,只是对第一语音频信号这一原有信号进行处理,并未在第一语音频信号中增加新的信号,从而恢复噪声成分后的第二语音频信号中并未增加新的能量,从而如果第一语音频信号具有上升沿或下降沿,不会增加第二语音频信号中的回声,从而提高了第二语音频信号的听觉质量。
本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述的本发明实施方式,并不构成对本发明保护范围的限定。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (22)

1.一种语音频信号的处理方法,其特征在于,所述方法包括:
接收码流,解码所述码流得到语音频信号;
根据所述语音频信号确定第一语音频信号,所述第一语音频信号是所述语音频信号中需要恢复噪声成分的信号;
确定所述第一语音频信号中每个采样值的符号和每个所述采样值的幅度值;
确定自适应归一化长度;
根据所述自适应归一化长度和每个所述采样值的幅度值确定每个所述采样值的调整幅度值;
根据每个所述采样值的符号和每个所述采样值的调整幅度值确定第二语音频信号,所述第二语音频信号是所述第一语音频信号恢复噪声成分后得到的信号。
2.根据权利要求1所述的方法,其特征在于,所述根据所述自适应归一化长度和每个所述采样值的幅度值确定每个所述采样值的调整幅度值,包括:
根据每个所述采样值的幅度值以及所述自适应归一化长度计算每个所述采样值对应的幅度平均值,根据每个所述采样值对应的幅度平均值确定每个所述采样值对应的幅度扰动值;
根据每个所述采样值的幅度值及其对应的幅度扰动值计算每个所述采样值的调整幅度值。
3.根据权利要求2所述的方法,其特征在于,所述根据每个所述采样值的幅度值以及所述自适应归一化长度计算每个所述采样值对应的幅度平均值,包括:
对于每个所述采样值,根据所述自适应归一化长度确定所述采样值所属的子带;
计算所述采样值所属子带内所有采样值的幅度值的平均值,将计算得到的平均值作为所述采样值对应的幅度平均值。
4.根据权利要求3所述的方法,其特征在于,对于每个所述采样值,根据所述自适应归一化长度确定所述采样值所属的子带,包括:
将所有采样值按照预设顺序根据所述自适应归一化长度划分子带;对于每个所述采样值,将包括所述采样值的子带确定为所述采样值所属的子带;或者,
对于每个所述采样值,将所述采样值之前m个采样值、所述采样值、所述采样值之后n个采样值构成的子带确定为所述采样值所属的子带,m、n由所述自适应归一化长度确定,m是不小于0的整数,n是不小于0的整数。
5.根据权利要求2至4任一项所述的方法,其特征在于,所述根据每个所述采样值的幅度值及其对应的幅度扰动值计算每个所述采样值的调整幅度值,包括:
将每个所述采样值的幅度值与其对应的幅度扰动值相减得到两者的差值,将得到的差值作为每个所述采样值的调整幅度值。
6.根据权利要求1至5任一项所述的方法,其特征在于,所述确定自适应归一化长度,包括:
将所述语音频信号中的低频带信号划分为N个子带;N为自然数;
计算每个所述子带的峰均比,并确定所述峰均比大于预设峰均比阈值的子带个数;
根据所述语音频信号中高频带信号的信号类型和所述子带个数,计算所述自适应归一化长度。
7.根据权利要求6所述的方法,其特征在于,所述根据所述语音频信号中高频带信号的信号类型和所述子带个数,计算所述自适应归一化长度,包括:
根据公式L=K+α*M计算所述自适应归一化长度;
其中,L为所述自适应归一化长度;K为所述语音频信号中的高频带信号的信号类型对应的数值,不同高频带信号的信号类型对应的K的数值不同;M为峰均比大于预设峰均比阈值的子带个数;α为小于1的常数。
8.根据权利要求1至5任一项所述的方法,其特征在于,所述确定自适应归一化长度,包括:
计算所述语音频信号中低频带信号的峰均比,和所述语音频信号中高频带信号的峰均比;当所述低频带信号的峰均比和所述高频带信号的峰均比的差值的绝对值小于预设差值阈值时,将所述自适应归一化长度确定为预设第一长度值,当所述低频带信号的峰均比和所述高频带信号的峰均比的差值的绝对值不小于预设差值阈值时,将所述自适应归一化长度确定为预设第二长度值;所述第一长度值>所述第二长度值;或者,
计算所述语音频信号中低频带信号的峰均比,和所述语音频信号中高频带信号的峰均比;当所述低频带信号的峰均比小于所述高频带信号的峰均比时,将所述自适应归一化长度确定为预设第一长度值,当所述低频带信号的峰均比不小于所述高频带信号的峰均比时,将所述自适应归一化长度确定为预设第二长度值;或者,
根据所述语音频信号中高频带信号的信号类型确定所述自适应归一化长度,不同高频带信号的信号类型对应的自适应归一化长度不同。
9.根据权利要求1至8任一项所述的方法,其特征在于,所述根据每个所述采样值的符号和每个所述采样值的调整幅度值确定第二语音频信号,包括:
根据每个所述采样值的符号和调整幅度值确定每个所述采样值的新取值,得到所述第二语音频信号;或者,
计算修正因子;根据所述修正因子对所述采样值的调整幅度值中大于0的调整幅度值进行修正处理;根据每个所述采样值的符号和修正处理后的调整幅度值确定每个所述采样值的新取值,得到第二语音频信号。
10.根据权利要求9所述的方法,其特征在于,所述计算修正因子,包括:
使用公式β=a/L计算所述修正因子;其中,β为所述修正因子,L为所述自适应归一化长度,a为大于1的常数。
11.根据权利要求9或10所述的方法,其特征在于,所述根据所述修正因子对所述采样值的调整幅度值中大于0的调整幅度值进行修正处理,包括:
使用以下公式对所述采样值的调整幅度值中大于0的调整幅度值进行修正处理:
Y=y*(b-β);
其中,Y为修正处理后的调整幅度值,y为所述采样值的调整幅度值中大于0的调整幅度值,b为常数,0<b<2。
12.一种恢复语音频信号噪声成分的装置,其特征在于,包括:
码流处理单元,用于接收码流,解码所述码流得到语音频信号;
信号确定单元,用于根据所述码流处理单元得到的所述语音频信号确定第一语音频信号,所述第一语音频信号是解码得到的所述语音频信号中需要恢复噪声成分的信号;
第一确定单元,用于确定所述信号确定单元确定的所述第一语音频信号中每个采样值的符号和每个所述采样值的幅度值;
第二确定单元,用于确定自适应归一化长度;
第三确定单元,用于根据所述第二确定单元确定的所述自适应归一化长度和所述第一确定单元确定的每个所述采样值的幅度值确定每个所述采样值的调整幅度值;
第四确定单元,用于根据所述第一确定单元确定的每个所述采样值的符号和所述第三确定单元确定的每个所述采样值的调整幅度值确定第二语音频信号,所述第二语音频信号是所述第一语音频信号恢复噪声成分后得到的信号。
13.根据权利要求12所述的装置,其特征在于,所述第三确定单元包括:
确定子单元,用于根据每个所述采样值的幅度值以及所述自适应归一化长度计算每个所述采样值对应的幅度平均值,根据每个所述采样值对应的幅度平均值确定每个所述采样值对应的幅度扰动值;
调整幅度值计算子单元,用于根据每个所述采样值的幅度值及其对应的幅度扰动值计算每个所述采样值的调整幅度值。
14.根据权利要求13所述的装置,其特征在于,所述确定子单元包括:
确定模块,用于对于每个所述采样值,根据所述自适应归一化长度确定所述采样值所属的子带;
计算模块,用于计算所述采样值所属子带内所有采样值的幅度值的平均值,将计算得到的平均值作为所述采样值对应的幅度平均值。
15.根据权利要求14所述的装置,其特征在于,所述确定模块具体用于:
将所有采样值按照预设顺序根据所述自适应归一化长度划分子带;对于每个所述采样值,将包括所述采样值的子带确定为所述采样值所属的子带;或者,
对于每个所述采样值,将所述采样值之前m个采样值、所述采样值、所述采样值之后n个采样值构成的子带确定为所述采样值所属的子带,m、n由所述自适应归一化长度确定,m是不小于0的整数,n是不小于0的整数。
16.根据权利要求13至15任一项所述的装置,其特征在于,所述调整幅度值计算子单元具体用于:
将每个所述采样值的幅度值与其对应的幅度扰动值相减得到两者的差值,将得到的差值作为每个所述采样值的调整幅度值。
17.根据权利要求12至16任一项所述的装置,其特征在于,所述第二确定单元包括:
划分子单元,用于将所述语音频信号中的低频带信号划分为N个子带;N为自然数;
个数确定子单元,用于计算每个所述子带的峰均比,并确定所述峰均比大于预设峰均比阈值的子带个数;
长度计算子单元,用于根据所述语音频信号中高频带信号的信号类型和所述子带个数,计算所述自适应归一化长度。
18.根据权利要求17所述的装置,其特征在于,所述长度计算子单元具体用于:
根据公式L=K+α*M计算所述自适应归一化长度;
其中,L为所述自适应归一化长度;K为所述语音频信号中的高频带信号的信号类型对应的数值,不同高频带信号的信号类型对应的K的数值不同;M为峰均比大于预设峰均比阈值的子带个数;α为小于1的常数。
19.根据权利要求12至16任一项所述的装置,其特征在于,所述第二确定单元具体用于:
计算所述语音频信号中低频带信号的峰均比,和所述语音频信号中高频带信号的峰均比;当所述低频带信号的峰均比和所述高频带信号的峰均比的差值的绝对值小于预设差值阈值时,将所述自适应归一化长度确定为预设第一长度值,当所述低频带信号的峰均比和所述高频带信号的峰均比的差值的绝对值不小于预设差值阈值时,将所述自适应归一化长度确定为预设第二长度值;所述第一长度值>所述第二长度值;或者,
计算所述语音频信号中低频带信号的峰均比,和所述语音频信号中高频带信号的峰均比;当所述低频带信号的峰均比小于所述高频带信号的峰均比时,将所述自适应归一化长度确定为预设第一长度值,当所述低频带信号的峰均比不小于所述高频带信号的峰均比时,将所述自适应归一化长度确定为预设第二长度值;或者,
根据所述语音频信号中高频带信号的信号类型确定所述自适应归一化长度,不同高频带信号的信号类型对应的自适应归一化长度不同。
20.根据权利要求12至19任一项所述的装置,其特征在于,所述第四确定单元具体用于:
根据每个所述采样值的符号和调整幅度值确定每个所述采样值的新取值,得到所述第二语音频信号;或者,
计算修正因子;根据所述修正因子对所述采样值的调整幅度值中大于0的调整幅度值进行修正处理;根据每个所述采样值的符号和修正处理后的调整幅度值确定每个所述采样值的新取值,得到第二语音频信号。
21.根据权利要求20所述的装置,其特征在于,所述第四确定单元具体用于:使用公式β=a/L计算所述修正因子;其中,β为所述修正因子,L为所述自适应归一化长度,a为大于1的常数。
22.根据权利要求20或21所述的装置,其特征在于,所述第四确定单元具体用于:
使用以下公式对所述采样值的调整幅度值中大于0的调整幅度值进行修正处理:
Y=y*(b-β);
其中,Y为修正处理后的调整幅度值,y为将所述采样值的调整幅度值中大于0的调整幅度值,b为常数,0<b<2。
CN201410242233.2A 2014-06-03 2014-06-03 一种语音频信号的处理方法和装置 Active CN105336339B (zh)

Priority Applications (29)

Application Number Priority Date Filing Date Title
CN201910358522.1A CN110097892B (zh) 2014-06-03 2014-06-03 一种语音频信号的处理方法和装置
CN201410242233.2A CN105336339B (zh) 2014-06-03 2014-06-03 一种语音频信号的处理方法和装置
NZ727567A NZ727567A (en) 2014-06-03 2015-01-19 Method for processing speech/audio signal and apparatus
RU2016152224A RU2651184C1 (ru) 2014-06-03 2015-01-19 Способ обработки речевого/звукового сигнала и устройство
EP19190663.5A EP3712890B1 (en) 2014-06-03 2015-01-19 Method for processing speech/audio signal and apparatus
EP15802508.0A EP3147900B1 (en) 2014-06-03 2015-01-19 Method and device for processing audio signal
KR1020207011385A KR102201791B1 (ko) 2014-06-03 2015-01-19 오디오 신호를 처리하기 위한 방법 및 장치
MYPI2016704486A MY179546A (en) 2014-06-03 2015-01-19 Method for processing speech/audio signal and apparatus
BR112016028375-9A BR112016028375B1 (pt) 2014-06-03 2015-01-19 Método para processar sinal de fala/áudio e aparelho
AU2015271580A AU2015271580B2 (en) 2014-06-03 2015-01-19 Method for processing speech/audio signal and apparatus
EP23184053.9A EP4283614A3 (en) 2014-06-03 2015-01-19 Method for processing speech/audio signal and apparatus
PCT/CN2015/071017 WO2015184813A1 (zh) 2014-06-03 2015-01-19 一种语音频信号的处理方法和装置
MX2016015950A MX362612B (es) 2014-06-03 2015-01-19 Metodo para procesar señal de voz/audio y aparato.
ES19190663T ES2964221T3 (es) 2014-06-03 2015-01-19 Método para procesar señal de voz/audio y aparato
CA2951169A CA2951169C (en) 2014-06-03 2015-01-19 Method for processing speech/audio signal and apparatus
SG11201610141RA SG11201610141RA (en) 2014-06-03 2015-01-19 Method for processing speech/audio signal and apparatus
JP2016570979A JP6462727B2 (ja) 2014-06-03 2015-01-19 音声/オーディオ信号を処理するための方法および装置
KR1020167035690A KR101943529B1 (ko) 2014-06-03 2015-01-19 오디오 신호를 처리하기 위한 방법 및 장치
KR1020197002091A KR102104561B1 (ko) 2014-06-03 2015-01-19 오디오 신호를 처리하기 위한 방법 및 장치
HK16108374.1A HK1220543A1 (zh) 2014-06-03 2016-07-15 種語音頻信號的處理方法和裝置
IL249337A IL249337B (en) 2014-06-03 2016-12-01 Method and apparatus for processing speech/audio signals
MX2019001193A MX2019001193A (es) 2014-06-03 2016-12-02 Metodo para procesar señal de voz/audio y aparato.
CL2016003121A CL2016003121A1 (es) 2014-06-03 2016-12-02 Método y aparato para reconstruir un componente de ruido de una señal de voz/audio
US15/369,396 US9978383B2 (en) 2014-06-03 2016-12-05 Method for processing speech/audio signal and apparatus
ZA2016/08477A ZA201608477B (en) 2014-06-03 2016-12-08 Method for processing speech/audio signal and apparatus
US15/985,281 US10657977B2 (en) 2014-06-03 2018-05-21 Method for processing speech/audio signal and apparatus
JP2018242725A JP6817283B2 (ja) 2014-06-03 2018-12-26 音声/オーディオ信号を処理するための方法および装置
US16/877,389 US11462225B2 (en) 2014-06-03 2020-05-18 Method for processing speech/audio signal and apparatus
JP2020213571A JP7142674B2 (ja) 2014-06-03 2020-12-23 音声/オーディオ信号を処理するための方法および装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410242233.2A CN105336339B (zh) 2014-06-03 2014-06-03 一种语音频信号的处理方法和装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN201910358522.1A Division CN110097892B (zh) 2014-06-03 2014-06-03 一种语音频信号的处理方法和装置

Publications (2)

Publication Number Publication Date
CN105336339A true CN105336339A (zh) 2016-02-17
CN105336339B CN105336339B (zh) 2019-05-03

Family

ID=54766052

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201910358522.1A Active CN110097892B (zh) 2014-06-03 2014-06-03 一种语音频信号的处理方法和装置
CN201410242233.2A Active CN105336339B (zh) 2014-06-03 2014-06-03 一种语音频信号的处理方法和装置

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201910358522.1A Active CN110097892B (zh) 2014-06-03 2014-06-03 一种语音频信号的处理方法和装置

Country Status (19)

Country Link
US (3) US9978383B2 (zh)
EP (3) EP3712890B1 (zh)
JP (3) JP6462727B2 (zh)
KR (3) KR101943529B1 (zh)
CN (2) CN110097892B (zh)
AU (1) AU2015271580B2 (zh)
BR (1) BR112016028375B1 (zh)
CA (1) CA2951169C (zh)
CL (1) CL2016003121A1 (zh)
ES (1) ES2964221T3 (zh)
HK (1) HK1220543A1 (zh)
IL (1) IL249337B (zh)
MX (2) MX362612B (zh)
MY (1) MY179546A (zh)
NZ (1) NZ727567A (zh)
RU (1) RU2651184C1 (zh)
SG (1) SG11201610141RA (zh)
WO (1) WO2015184813A1 (zh)
ZA (1) ZA201608477B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106847299A (zh) * 2017-02-24 2017-06-13 喜大(上海)网络科技有限公司 延时的估计方法及装置
CN108133712A (zh) * 2016-11-30 2018-06-08 华为技术有限公司 一种处理音频数据的方法和装置

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110097892B (zh) 2014-06-03 2022-05-10 华为技术有限公司 一种语音频信号的处理方法和装置
RU2754497C1 (ru) * 2020-11-17 2021-09-02 федеральное государственное автономное образовательное учреждение высшего образования "Казанский (Приволжский) федеральный университет" (ФГАОУ ВО КФУ) Способ передачи речевых файлов по зашумленному каналу и устройство для его реализации
US20230300524A1 (en) * 2022-03-21 2023-09-21 Qualcomm Incorporated Adaptively adjusting an input current limit for a boost converter

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010008995A1 (en) * 1999-12-31 2001-07-19 Kim Jeong Jin Method for improvement of G.723.1 processing time and speech quality and for reduction of bit rate in CELP vocoder and CELP vococer using the same
CN101335003A (zh) * 2007-09-28 2008-12-31 华为技术有限公司 噪声生成装置、及方法
CN101483042A (zh) * 2008-03-20 2009-07-15 华为技术有限公司 一种噪声生成方法以及噪声生成装置
US20130121508A1 (en) * 2011-11-03 2013-05-16 Voiceage Corporation Non-Speech Content for Low Rate CELP Decoder

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6261312B1 (en) 1998-06-23 2001-07-17 Innercool Therapies, Inc. Inflatable catheter for selective organ heating and cooling and method of using the same
SE9803698L (sv) * 1998-10-26 2000-04-27 Ericsson Telefon Ab L M Metoder och anordningar i ett telekommunikationssystem
CA2252170A1 (en) * 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
US6631139B2 (en) * 2001-01-31 2003-10-07 Qualcomm Incorporated Method and apparatus for interoperability between voice transmission systems during speech inactivity
US6708147B2 (en) * 2001-02-28 2004-03-16 Telefonaktiebolaget Lm Ericsson(Publ) Method and apparatus for providing comfort noise in communication system with discontinuous transmission
US20030093270A1 (en) * 2001-11-13 2003-05-15 Domer Steven M. Comfort noise including recorded noise
EP1701340B1 (en) * 2001-11-14 2012-08-29 Panasonic Corporation Decoding device, method and program
US7536298B2 (en) * 2004-03-15 2009-05-19 Intel Corporation Method of comfort noise generation for speech communication
US7831421B2 (en) * 2005-05-31 2010-11-09 Microsoft Corporation Robust decoder
US7610197B2 (en) * 2005-08-31 2009-10-27 Motorola, Inc. Method and apparatus for comfort noise generation in speech communication systems
WO2008007700A1 (fr) 2006-07-12 2008-01-17 Panasonic Corporation Dispositif de décodage de son, dispositif de codage de son, et procédé de compensation de trame perdue
RU2460155C2 (ru) * 2006-09-18 2012-08-27 Конинклейке Филипс Электроникс Н.В. Кодирование и декодирование звуковых объектов
CN101320563B (zh) * 2007-06-05 2012-06-27 华为技术有限公司 一种背景噪声编码/解码装置、方法和通信设备
US8139777B2 (en) * 2007-10-31 2012-03-20 Qnx Software Systems Co. System for comfort noise injection
ES2401487T3 (es) * 2008-07-11 2013-04-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y procedimiento para la codificación/decodificación de una señal de audio utilizando un esquema de conmutación de generación de señal ajena
PL2146344T3 (pl) * 2008-07-17 2017-01-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Sposób kodowania/dekodowania sygnału audio obejmujący przełączalne obejście
CN101483048B (zh) 2009-02-06 2010-08-25 凌阳科技股份有限公司 光学储存装置及其回路增益值的自动校正方法
US9047875B2 (en) * 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension
CN102436820B (zh) * 2010-09-29 2013-08-28 华为技术有限公司 高频带信号编码方法及装置、高频带信号解码方法及装置
CN105825858B (zh) * 2011-05-13 2020-02-14 三星电子株式会社 比特分配、音频编码和解码
US8731949B2 (en) 2011-06-30 2014-05-20 Zte Corporation Method and system for audio encoding and decoding and method for estimating noise level
US20130006644A1 (en) * 2011-06-30 2013-01-03 Zte Corporation Method and device for spectral band replication, and method and system for audio decoding
CN102208188B (zh) * 2011-07-13 2013-04-17 华为技术有限公司 音频信号编解码方法和设备
US20130132100A1 (en) 2011-10-28 2013-05-23 Electronics And Telecommunications Research Institute Apparatus and method for codec signal in a communication system
US9305567B2 (en) 2012-04-23 2016-04-05 Qualcomm Incorporated Systems and methods for audio signal processing
CN110097892B (zh) * 2014-06-03 2022-05-10 华为技术有限公司 一种语音频信号的处理方法和装置
US20200333702A1 (en) 2019-04-19 2020-10-22 Canon Kabushiki Kaisha Forming apparatus, forming method, and article manufacturing method

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20010008995A1 (en) * 1999-12-31 2001-07-19 Kim Jeong Jin Method for improvement of G.723.1 processing time and speech quality and for reduction of bit rate in CELP vocoder and CELP vococer using the same
CN101335003A (zh) * 2007-09-28 2008-12-31 华为技术有限公司 噪声生成装置、及方法
CN101483042A (zh) * 2008-03-20 2009-07-15 华为技术有限公司 一种噪声生成方法以及噪声生成装置
US20130121508A1 (en) * 2011-11-03 2013-05-16 Voiceage Corporation Non-Speech Content for Low Rate CELP Decoder

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108133712A (zh) * 2016-11-30 2018-06-08 华为技术有限公司 一种处理音频数据的方法和装置
CN106847299A (zh) * 2017-02-24 2017-06-13 喜大(上海)网络科技有限公司 延时的估计方法及装置

Also Published As

Publication number Publication date
KR102104561B1 (ko) 2020-04-24
IL249337A0 (en) 2017-02-28
BR112016028375A2 (pt) 2017-08-22
WO2015184813A1 (zh) 2015-12-10
KR101943529B1 (ko) 2019-01-29
AU2015271580A1 (en) 2017-01-19
KR102201791B1 (ko) 2021-01-11
JP7142674B2 (ja) 2022-09-27
EP4283614A2 (en) 2023-11-29
US20180268830A1 (en) 2018-09-20
JP6462727B2 (ja) 2019-01-30
CN105336339B (zh) 2019-05-03
US20170084282A1 (en) 2017-03-23
MY179546A (en) 2020-11-10
US9978383B2 (en) 2018-05-22
MX362612B (es) 2019-01-28
US20200279572A1 (en) 2020-09-03
MX2016015950A (es) 2017-04-05
AU2015271580B2 (en) 2018-01-18
BR112016028375B1 (pt) 2022-09-27
ES2964221T3 (es) 2024-04-04
US11462225B2 (en) 2022-10-04
SG11201610141RA (en) 2017-01-27
EP3147900B1 (en) 2019-10-02
CN110097892B (zh) 2022-05-10
EP3147900A4 (en) 2017-05-03
US10657977B2 (en) 2020-05-19
CA2951169C (en) 2019-12-31
MX2019001193A (es) 2019-06-12
CL2016003121A1 (es) 2017-04-28
JP2021060609A (ja) 2021-04-15
KR20200043548A (ko) 2020-04-27
ZA201608477B (en) 2018-08-29
IL249337B (en) 2020-09-30
HK1220543A1 (zh) 2017-05-05
JP2017517034A (ja) 2017-06-22
RU2651184C1 (ru) 2018-04-18
EP4283614A3 (en) 2024-02-21
EP3712890A1 (en) 2020-09-23
KR20190009440A (ko) 2019-01-28
EP3147900A1 (en) 2017-03-29
JP2019061282A (ja) 2019-04-18
EP3712890B1 (en) 2023-08-30
JP6817283B2 (ja) 2021-01-20
CN110097892A (zh) 2019-08-06
KR20170008837A (ko) 2017-01-24
CA2951169A1 (en) 2015-12-10
NZ727567A (en) 2018-01-26

Similar Documents

Publication Publication Date Title
CN105336339A (zh) 一种语音频信号的处理方法和装置
CN101605111B (zh) 一种削波控制的方法和装置
EP2102861B1 (en) Systems and methods for dynamic normalization to reduce loss in precision for low-level signals
CN111694692B (zh) 一种数据存储纠删方法、装置、设备及可读存储介质
CN110858487A (zh) 一种音频信号缩放处理方法及装置
CN112398494B (zh) 路由器及其干扰消除装置、方法、及存储介质
CN111198673B (zh) 字长调整方法、装置、设备及存储介质
CN103856423A (zh) 通信终端和自干扰信号消除方法
CN111402905A (zh) 音频数据恢复方法、装置及蓝牙设备
CN111383643B (zh) 一种音频丢包隐藏方法、装置及蓝牙接收机
CN106464701A (zh) 一种数据处理设备和方法
CN107004117B (zh) 一种检测发送序列的方法、接收机和接收设备
US10250416B2 (en) Recursive difference filter realization of digital filters
CN112260698A (zh) Ldpc译码器中动态校正因子配置方法
CN104064192A (zh) 一种音频声波的编码及解码方法
CN110880957A (zh) 声波通信方法及装置、电子设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1220543

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant