JP6817283B2 - 音声/オーディオ信号を処理するための方法および装置 - Google Patents
音声/オーディオ信号を処理するための方法および装置 Download PDFInfo
- Publication number
- JP6817283B2 JP6817283B2 JP2018242725A JP2018242725A JP6817283B2 JP 6817283 B2 JP6817283 B2 JP 6817283B2 JP 2018242725 A JP2018242725 A JP 2018242725A JP 2018242725 A JP2018242725 A JP 2018242725A JP 6817283 B2 JP6817283 B2 JP 6817283B2
- Authority
- JP
- Japan
- Prior art keywords
- value
- audio
- sample value
- signal
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 title claims description 284
- 238000000034 method Methods 0.000 title claims description 88
- 238000012545 processing Methods 0.000 title claims description 23
- 230000003044 adaptive effect Effects 0.000 claims description 143
- 238000012937 correction Methods 0.000 claims description 54
- 238000004364 calculation method Methods 0.000 claims description 27
- 239000003607 modifier Substances 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 4
- 230000001174 ascending effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000002592 echocardiography Methods 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001568 sexual effect Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Noise Elimination (AREA)
- Telephone Function (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Description
ビットストリームを受信し、且つ、ビットストリームを復号して、音声/オーディオ信号を取得するステップと、
音声/オーディオ信号に従って、第1の音声/オーディオ信号を決定するステップであって、ここで、第1の音声/オーディオ信号は、音声/オーディオ信号内にあり、第1の音声/オーディオ信号の雑音成分は、再構築される必要がある、ステップと、
第1の音声/オーディオ信号における各サンプル値の符号および第1の音声/オーディオ信号における各サンプル値の振幅値を決定するステップと、
適応性のある正規化された長さを決定するステップと、
適応性のある正規化された長さおよび各サンプル値の振幅値に従って、各サンプル値の調整された振幅値を決定するステップと、
各サンプル値の符号および各サンプル値の調整された振幅値に従って、第2の音声/オーディオ信号を決定するステップであって、ここで、第2の音声/オーディオ信号は、第1の音声/オーディオ信号のための雑音成分を再構成することによって取得される信号である、ステップとを含む。
各サンプル値の振幅値および適応性のある正規化された長さに従って、各サンプル値に対応する平均振幅値を計算して、各サンプル値に対応する平均振幅値に従って、各サンプル値に対応する振幅外乱値を決定するステップと、
各サンプル値の振幅値に従って、且つ、各サンプル値に対応する振幅外乱値に従って、各サンプル値の調整された振幅値を計算するステップとを含む。
各サンプル値について、且つ、適応性のある正規化された長さに従って、サンプル値が属するサブバンドを決定するステップと、
サンプル値が属するサブバンド内の全てのサンプル値の振幅値の平均値を計算して、計算によって取得される平均値をサンプル値に対応する平均振幅値として使用するステップとを含む。
適応性のある正規化された長さに従って、事前に設定された順序で、全てのサンプル値に対してサブバンド分類を実行して、各サンプル値について、サンプル値を含むサブバンドをサンプル値が属するサブバンドとして決定するステップか、または、
各サンプル値について、サンプル値の前のm個のサンプル値、サンプル値およびサンプル値の後のn個のサンプル値からなるサブバンドを、サンプル値が属するサブバンドとして決定するステップであって、ここで、mおよびnは適応性のある正規化された長さに依存し、mは0よりも小さくない整数であり、nは0よりも小さくない整数である、ステップを含む。
各サンプル値の振幅値から、各サンプル値に対応する振幅外乱値を差し引いて、各サンプル値の振幅値と各サンプル値に対応する振幅外乱値との間の差を取得し、取得された差を、各サンプル値の調整された振幅値として使用するステップを含む。
音声/オーディオ信号内の低周波帯域信号をN個のサブバンドに分割するステップであって、ここで、Nは自然数である、ステップと、
各サブバンドのピーク対平均比を計算して、そのピーク対平均比が事前に設定されたピーク対平均比の閾値よりも大きいサブバンドの数を決定するステップと、
音声/オーディオ信号内の高周波帯域信号の信号タイプおよびサブバンドの数に従って、適応性のある正規化された長さを計算するステップとを含む。
式L=K+α×Mに従って、適応性のある正規化された長さを計算するステップであって、ここで、
Lは適応性のある正規化された長さであり、Kは音声/オーディオ信号内の高周波帯域信号の信号タイプに対応する数値であり、高周波帯域信号の異なる信号タイプは異なる数値Kに対応し、Mはそのピーク対平均比が事前に設定されたピーク対平均比の閾値よりも大きいサブバンドの数であり、αは1よりも小さい定数である、ステップを含む。
音声/オーディオ信号内の低周波帯域信号のピーク対平均比および音声/オーディオ信号内の高周波帯域信号のピーク対平均比を計算して、低周波帯域信号のピーク対平均比と高周波帯域信号のピーク対平均比との間の差の絶対値が事前に設定された差の閾値よりも小さいとき、適応性のある正規化された長さを事前に設定された第1の長さの値として決定するか、または、低周波帯域信号のピーク対平均比と高周波帯域信号のピーク対平均比との間の差の絶対値が事前に設定された差の閾値よりも小さくないとき、適応性のある正規化された長さを事前に設定された第2の長さの値として決定するステップであって、ここで、第1の長さの値は第2の長さの値よりも大きい、ステップか、または、
音声/オーディオ信号内の低周波帯域信号のピーク対平均比および音声/オーディオ信号内の高周波帯域信号のピーク対平均比を計算して、低周波帯域信号のピーク対平均比が高周波帯域信号のピーク対平均比よりも小さいとき、適応性のある正規化された長さを事前に設定された第1の長さの値として決定するか、または、低周波帯域信号のピーク対平均比が高周波帯域信号のピーク対平均比よりも小さくないとき、適応性のある正規化された長さを事前に設定された第2の長さの値として決定するステップか、または、
音声/オーディオ信号内の高周波帯域信号の信号タイプに従って、適応性のある正規化された長さを決定するステップであって、ここで、高周波帯域信号の異なる信号タイプは、異なる適応性のある正規化された長さに対応する、ステップを含む。
各サンプル値の符号および調整された振幅値に従って、各サンプル値の新しい値を決定して、第2の音声/オーディオ信号を取得するステップか、または、
修正因子を計算して、修正因子に従って、サンプル値の調整された振幅値内の、0よりも大きい調整された振幅値に対して、修正処理を実行して、各サンプル値の符号および修正処理の後に取得された調整された振幅値に従って、各サンプル値の新しい値を決定して、第2の音声/オーディオ信号を取得するステップを含む。
式β=a/Lを使用することによって、修正因子を計算するステップであって、ここで、βは修正因子であり、Lは適応性のある正規化された長さであり、aは1よりも大きい定数である、ステップを含む。
式Y=y×(b-β)を使用することによって、サンプル値の調整された振幅値内の、0よりも大きい調整された振幅値に対して修正処理を実行するステップであって、
ここで、Yは修正処理の後に取得された調整された振幅値であり、yは、サンプル値の調整された振幅値内の、0よりも大きい調整された振幅値であり、bは定数であるとともに0<b<2である、ステップを含む。
ビットストリームを受信し、且つ、ビットストリームを復号して、音声/オーディオ信号を取得するように構成されるビットストリーム処理ユニットと、
ビットストリーム処理ユニットによって取得された音声/オーディオ信号に従って、第1の音声/オーディオ信号を決定するように構成される信号決定ユニットであって、ここで、第1の音声/オーディオ信号は、復号によって取得された音声/オーディオ信号内にあり、第1の音声/オーディオ信号の雑音成分は、再構築される必要がある、信号決定ユニットと、
信号決定ユニットによって決定された第1の音声/オーディオ信号における各サンプル値の符号および信号決定ユニットによって決定された第1の音声/オーディオ信号における各サンプル値の振幅値を決定するように構成される第1の決定ユニットと、
適応性のある正規化された長さを決定するように構成される第2の決定ユニットと、
第2の決定ユニットによって決定された適応性のある正規化された長さおよび各サンプル値のものであるとともに第1の決定ユニットによって決定された振幅値に従って、各サンプル値の調整された振幅値を決定するように構成される第3の決定ユニットと、
各サンプル値のものであるとともに第1の決定ユニットによって決定された符号および各サンプル値のものであるとともに第3の決定ユニットによって決定された調整された振幅値に従って、第2の音声/オーディオ信号を決定するように構成される第4の決定ユニットであって、ここで、第2の音声/オーディオ信号は、第1の音声/オーディオ信号のための雑音成分を再構成することによって取得される信号である、第4の決定ユニットとを含む。
各サンプル値の振幅値および適応性のある正規化された長さに従って、各サンプル値に対応する平均振幅値を計算して、各サンプル値に対応する平均振幅値に従って、各サンプル値に対応する振幅外乱値を決定するように構成される決定サブユニットと、
各サンプル値の振幅値に従って、且つ、各サンプル値に対応する振幅外乱値に従って、各サンプル値の調整された振幅値を計算するように構成される調整された振幅値計算ユニットとを含む。
各サンプル値について、且つ、適応性のある正規化された長さに従って、サンプル値が属するサブバンドを決定するように構成される決定モジュールと、
サンプル値が属するサブバンド内の全てのサンプル値の振幅値の平均値を計算して、計算によって取得される平均値をサンプル値に対応する平均振幅値として使用するように構成される計算モジュールとを含む。
適応性のある正規化された長さに従って、事前に設定された順序で、全てのサンプル値に対してサブバンド分類を実行して、各サンプル値について、サンプル値を含むサブバンドをサンプル値が属するサブバンドとして決定するか、または、
各サンプル値について、サンプル値の前のm個のサンプル値、サンプル値およびサンプル値の後のn個のサンプル値からなるサブバンドを、サンプル値が属するサブバンドとして決定するように構成され、ここで、mおよびnは適応性のある正規化された長さに依存し、mは0よりも小さくない整数であり、nは0よりも小さくない整数である。
各サンプル値の振幅値から、各サンプル値に対応する振幅外乱値を差し引いて、各サンプル値の振幅値と各サンプル値に対応する振幅外乱値との間の差を取得し、取得された差を、各サンプル値の調整された振幅値として使用するように構成される。
音声/オーディオ信号内の低周波帯域信号をN個のサブバンドに分割するように構成される分割サブユニットであって、ここで、Nは自然数である、分割サブユニットと、
各サブバンドのピーク対平均比を計算して、そのピーク対平均比が事前に設定されたピーク対平均比の閾値よりも大きいサブバンドの数を決定するように構成される数決定サブユニットと、
音声/オーディオ信号内の高周波帯域信号の信号タイプおよびサブバンドの数に従って、適応性のある正規化された長さを計算するように構成される長さ計算サブユニットとを含む。
式L=K+α×Mに従って、適応性のある正規化された長さを計算するように構成され、ここで、
Lは適応性のある正規化された長さであり、Kは音声/オーディオ信号内の高周波帯域信号の信号タイプに対応する数値であり、高周波帯域信号の異なる信号タイプは異なる数値Kに対応し、Mはそのピーク対平均比が事前に設定されたピーク対平均比の閾値よりも大きいサブバンドの数であり、αは1よりも小さい定数である。
音声/オーディオ信号内の低周波帯域信号のピーク対平均比および音声/オーディオ信号内の高周波帯域信号のピーク対平均比を計算して、低周波帯域信号のピーク対平均比と高周波帯域信号のピーク対平均比との間の差の絶対値が事前に設定された差の閾値よりも小さいとき、適応性のある正規化された長さを事前に設定された第1の長さの値として決定するか、または、低周波帯域信号のピーク対平均比と高周波帯域信号のピーク対平均比との間の差の絶対値が事前に設定された差の閾値よりも小さくないとき、適応性のある正規化された長さを事前に設定された第2の長さの値として決定するか、または、
音声/オーディオ信号内の低周波帯域信号のピーク対平均比および音声/オーディオ信号内の高周波帯域信号のピーク対平均比を計算して、低周波帯域信号のピーク対平均比が高周波帯域信号のピーク対平均比よりも小さいとき、適応性のある正規化された長さを事前に設定された第1の長さの値として決定するか、または、低周波帯域信号のピーク対平均比が高周波帯域信号のピーク対平均比よりも小さくないとき、適応性のある正規化された長さを事前に設定された第2の長さの値として決定するか、または、
音声/オーディオ信号内の高周波帯域信号の信号タイプに従って、適応性のある正規化された長さを決定するように構成され、
ここで、第1の長さの値は第2の長さの値よりも大きく、
高周波帯域信号の異なる信号タイプは、異なる適応性のある正規化された長さに対応する。
各サンプル値の符号および調整された振幅値に従って、各サンプル値の新しい値を決定して、第2の音声/オーディオ信号を取得するか、または、
修正因子を計算して、修正因子に従って、サンプル値の調整された振幅値内の、0よりも大きい調整された振幅値に対して、修正処理を実行して、各サンプル値の符号および修正処理の後に取得された調整された振幅値に従って、各サンプル値の新しい値を決定して、第2の音声/オーディオ信号を取得するように構成される。
式Y=y×(b-β)を使用することによって、サンプル値の調整された振幅値内の、0よりも大きい調整された振幅値に対して修正処理を実行するように構成され、
ここで、Yは修正処理の後に取得された調整された振幅値であり、yは、サンプル値の調整された振幅値内の、0よりも大きい調整された振幅値であり、bは定数であるとともに0<b<2である。
音声/オーディオ信号内の低周波帯域信号をN個のサブバンドに分割するステップであって、ここで、Nは自然数である、ステップと、
各サブバンドのピーク対平均比を計算して、そのピーク対平均比が事前に設定されたピーク対平均比の閾値よりも大きいサブバンドの数を決定するステップと、
音声/オーディオ信号内の高周波帯域信号の信号タイプおよびサブバンドの数に従って、適応性のある正規化された長さを計算するステップとを含んでよい。
式L=K+α×Mに従って、適応性のある正規化された長さを計算するステップであって、ここで、
Lは適応性のある正規化された長さであり、Kは音声/オーディオ信号内の高周波帯域信号の信号タイプに対応する数値であり、高周波帯域信号の異なる信号タイプは異なる数値Kに対応し、Mはそのピーク対平均比が事前に設定されたピーク対平均比の閾値よりも大きいサブバンドの数であり、αは1よりも小さい定数である、ステップを含んでよい。
音声/オーディオ信号内の低周波帯域信号のピーク対平均比および音声/オーディオ信号内の高周波帯域信号のピーク対平均比を計算して、低周波帯域信号のピーク対平均比と高周波帯域信号のピーク対平均比との間の差の絶対値が事前に設定された差の閾値よりも小さいとき、適応性のある正規化された長さを事前に設定された第1の長さの値として決定するか、または、低周波帯域信号のピーク対平均比と高周波帯域信号のピーク対平均比との間の差の絶対値が事前に設定された差の閾値よりも小さくないとき、適応性のある正規化された長さを事前に設定された第2の長さの値として決定するステップを含んでよい。第1の長さの値は第2の長さの値よりも大きい。第1の長さの値および第2の長さの値はまた、低周波帯域信号のピーク対平均比と高周波帯域信号のピーク対平均比の比、または低周波帯域信号のピーク対平均比と高周波帯域信号のピーク対平均比との間の差を使用することによる計算によって取得されてもよい。具体的な計算方法は限定されない。
音声/オーディオ信号内の低周波帯域信号のピーク対平均比および音声/オーディオ信号内の高周波帯域信号のピーク対平均比を計算して、低周波帯域信号のピーク対平均比が高周波帯域信号のピーク対平均比よりも小さいとき、適応性のある正規化された長さを事前に設定された第1の長さの値として決定するか、または、低周波帯域信号のピーク対平均比が高周波帯域信号のピーク対平均比よりも小さくないとき、適応性のある正規化された長さを事前に設定された第2の長さの値として決定するステップを含んでよい。第1の長さの値は第2の長さの値よりも大きい。第1の長さの値および第2の長さの値はまた、低周波帯域信号のピーク対平均比と高周波帯域信号のピーク対平均比の比、または低周波帯域信号のピーク対平均比と高周波帯域信号のピーク対平均比との間の差を使用することによる計算によって取得されてもよい。具体的な計算方法は限定されない。
各サンプル値の振幅値および適応性のある正規化された長さに従って、各サンプル値に対応する平均振幅値を計算して、各サンプル値に対応する平均振幅値に従って、各サンプル値に対応する振幅外乱値を決定するステップと、
各サンプル値の振幅値に従って、且つ、各サンプル値に対応する振幅外乱値に従って、各サンプル値の調整された振幅値を計算するステップとを含んでよい。
各サンプル値について、且つ、適応性のある正規化された長さに従って、サンプル値が属するサブバンドを決定するステップと、
サンプル値が属するサブバンド内の全てのサンプル値の振幅値の平均値を計算して、計算によって取得される平均値をサンプル値に対応する平均振幅値として使用するステップとを含んでよい。
適応性のある正規化された長さに従って、事前に設定された順序で、全てのサンプル値に対してサブバンド分類を実行して、各サンプル値について、サンプル値を含むサブバンドをサンプル値が属するサブバンドとして決定するステップを含んでよい。
各サンプル値について、サンプル値の前のm個のサンプル値、サンプル値およびサンプル値の後のn個のサンプル値からなるサブバンドを、サンプル値が属するサブバンドとして決定するステップであって、ここで、mおよびnは適応性のある正規化された長さに依存し、mは0よりも小さくない整数であり、nは0よりも小さくない整数である、ステップを含んでよい。
各サンプル値の振幅値から、各サンプル値に対応する振幅外乱値を差し引いて、各サンプル値の振幅値と各サンプル値に対応する振幅外乱値との間の差を取得し、取得された差を、各サンプル値の調整された振幅値として使用するステップを含んでよい。
修正因子を計算するステップと
修正因子に従って、サンプル値の調整された振幅値内の、0よりも大きい調整された振幅値に対して、修正処理を実行するステップと、
各サンプル値の符号および修正処理の後に取得された調整された振幅値に従って、各サンプル値の新しい値を決定して、第2の音声/オーディオ信号を取得するステップとを含んでよい。
式Y=y×(b-β)を使用することによって、サンプル値の調整された振幅値内の、0よりも大きい調整された振幅値に対して修正処理を実行するステップであって、
ここで、Yは修正処理の後に取得された調整された振幅値であり、yは、サンプル値の調整された振幅値内の、0よりも大きい調整された振幅値であり、bは定数であるとともに0<b<2である、ステップを含んでよい。
ビットストリームを受信し、且つ、ビットストリームを復号して、音声/オーディオ信号を取得し、音声/オーディオ信号に従って、第1の音声/オーディオ信号を決定するように構成されるビットストリーム処理ユニット410であって、ここで、第1の音声/オーディオ信号は、復号によって取得された音声/オーディオ信号内にあり、第1の音声/オーディオ信号の雑音成分は、再構築される必要がある、ビットストリーム処理ユニット410と、
ビットストリーム処理ユニット410によって取得される音声/オーディオ信号に従って、第1の音声/オーディオ信号を決定するように構成される信号決定ユニット420と、
信号決定ユニット420によって決定された第1の音声/オーディオ信号における各サンプル値の符号および信号決定ユニット420によって決定された第1の音声/オーディオ信号における各サンプル値の振幅値を決定するように構成される第1の決定ユニット430と、
適応性のある正規化された長さを決定するように構成される第2の決定ユニット440と、
第2の決定ユニット440によって決定された適応性のある正規化された長さおよび各サンプル値のものであるとともに第1の決定ユニット430によって決定された振幅値に従って、各サンプル値の調整された振幅値を決定するように構成される第3の決定ユニット450と、
各サンプル値のものであるとともに第1の決定ユニット430によって決定された符号および各サンプル値のものであるとともに第3の決定ユニット450によって決定された調整された振幅値に従って、第2の音声/オーディオ信号を決定するように構成される第4の決定ユニット460であって、ここで、第2の音声/オーディオ信号は、第1の音声/オーディオ信号のための雑音成分を再構成することによって取得される信号である、第4の決定ユニット460とを含んでよい。
各サンプル値の振幅値および適応性のある正規化された長さに従って、各サンプル値に対応する平均振幅値を計算して、各サンプル値に対応する平均振幅値に従って、各サンプル値に対応する振幅外乱値を決定するように構成される決定サブユニットと、
各サンプル値の振幅値に従って、且つ、各サンプル値に対応する振幅外乱値に従って、各サンプル値の調整された振幅値を計算するように構成される調整された振幅値計算サブユニットとを含んでよい。
各サンプル値について、且つ、適応性のある正規化された長さに従って、サンプル値が属するサブバンドを決定するように構成される決定モジュールと、
サンプル値が属するサブバンド内の全てのサンプル値の振幅値の平均値を計算して、計算によって取得される平均値をサンプル値に対応する平均振幅値として使用するように構成される計算モジュールとを含んでよい。
適応性のある正規化された長さに従って、事前に設定された順序で、全てのサンプル値に対してサブバンド分類を実行して、各サンプル値について、サンプル値を含むサブバンドをサンプル値が属するサブバンドとして決定するか、または、
各サンプル値について、サンプル値の前のm個のサンプル値、サンプル値およびサンプル値の後のn個のサンプル値からなるサブバンドを、サンプル値が属するサブバンドとして決定するように構成されてよく、ここで、mおよびnは適応性のある正規化された長さに依存し、mは0よりも小さくない整数であり、nは0よりも小さくない整数である。
各サンプル値の振幅値から、各サンプル値に対応する振幅外乱値を差し引いて、各サンプル値の振幅値と各サンプル値に対応する振幅外乱値との間の差を取得し、取得された差を、各サンプル値の調整された振幅値として使用するように構成される。
音声/オーディオ信号内の低周波帯域信号をN個のサブバンドに分割するように構成される分割サブユニットであって、ここで、Nは自然数である、分割サブユニットと、
各サブバンドのピーク対平均比を計算して、そのピーク対平均比が事前に設定されたピーク対平均比の閾値よりも大きいサブバンドの数を決定するように構成される数決定サブユニットと、
音声/オーディオ信号内の高周波帯域信号の信号タイプおよびサブバンドの数に従って、適応性のある正規化された長さを計算するように構成される長さ計算サブユニットとを含んでよい。
式L=K+α×Mに従って、適応性のある正規化された長さを計算するように構成されてよく、ここで、
Lは適応性のある正規化された長さであり、Kは音声/オーディオ信号内の高周波帯域信号の信号タイプに対応する数値であり、高周波帯域信号の異なる信号タイプは異なる数値Kに対応し、Mはそのピーク対平均比が事前に設定されたピーク対平均比の閾値よりも大きいサブバンドの数であり、αは1よりも小さい定数である。
音声/オーディオ信号内の低周波帯域信号のピーク対平均比および音声/オーディオ信号内の高周波帯域信号のピーク対平均比を計算して、低周波帯域信号のピーク対平均比と高周波帯域信号のピーク対平均比との間の差の絶対値が事前に設定された差の閾値よりも小さいとき、適応性のある正規化された長さを事前に設定された第1の長さの値として決定するか、または、低周波帯域信号のピーク対平均比と高周波帯域信号のピーク対平均比との間の差の絶対値が事前に設定された差の閾値よりも小さくないとき、適応性のある正規化された長さを事前に設定された第2の長さの値として決定するか、または、
音声/オーディオ信号内の低周波帯域信号のピーク対平均比および音声/オーディオ信号内の高周波帯域信号のピーク対平均比を計算して、低周波帯域信号のピーク対平均比が高周波帯域信号のピーク対平均比よりも小さいとき、適応性のある正規化された長さを事前に設定された第1の長さの値として決定するか、または、低周波帯域信号のピーク対平均比が高周波帯域信号のピーク対平均比よりも小さくないとき、適応性のある正規化された長さを事前に設定された第2の長さの値として決定するか、または、
音声/オーディオ信号内の高周波帯域信号の信号タイプに従って、適応性のある正規化された長さを決定するように構成されてよく、
ここで、第1の長さの値は第2の長さの値よりも大きく、
高周波帯域信号の異なる信号タイプは、異なる適応性のある正規化された長さに対応する。
各サンプル値の符号および調整された振幅値に従って、各サンプル値の新しい値を決定して、第2の音声/オーディオ信号を取得するか、または、
修正因子を計算して、修正因子に従って、サンプル値の調整された振幅値内の、0よりも大きい調整された振幅値に対して、修正処理を実行して、各サンプル値の符号および修正処理の後に取得された調整された振幅値に従って、各サンプル値の新しい値を決定して、第2の音声/オーディオ信号を取得するように構成されてよい。
式Y=y×(b-β)を使用することによって、サンプル値の調整された振幅値内の、0よりも大きい調整された振幅値に対して修正処理を実行するように構成されてよく、
ここで、Yは修正処理の後に取得された調整された振幅値であり、yは、サンプル値の調整された振幅値内の、0よりも大きい調整された振幅値であり、bは定数であるとともに0<b<2である。
各サンプル値の振幅値および適応性のある正規化された長さに従って、各サンプル値に対応する平均振幅値を計算して、各サンプル値に対応する平均振幅値に従って、各サンプル値に対応する振幅外乱値を決定し、
各サンプル値の振幅値に従って、且つ、各サンプル値に対応する振幅外乱値に従って、各サンプル値の調整された振幅値を計算するように構成されてよい。
各サンプル値について、且つ、適応性のある正規化された長さに従って、サンプル値が属するサブバンドを決定し、
サンプル値が属するサブバンド内の全てのサンプル値の振幅値の平均値を計算して、計算によって取得される平均値をサンプル値に対応する平均振幅値として使用するように構成されてよい。
適応性のある正規化された長さに従って、事前に設定された順序で、全てのサンプル値に対してサブバンド分類を実行して、各サンプル値について、サンプル値を含むサブバンドをサンプル値が属するサブバンドとして決定するか、または、
各サンプル値について、サンプル値の前のm個のサンプル値、サンプル値およびサンプル値の後のn個のサンプル値からなるサブバンドを、サンプル値が属するサブバンドとして決定するように構成されてよく、ここで、mおよびnは適応性のある正規化された長さに依存し、mは0よりも小さくない整数であり、nは0よりも小さくない整数である。
各サンプル値の振幅値から、各サンプル値に対応する振幅外乱値を差し引いて、各サンプル値の振幅値と各サンプル値に対応する振幅外乱値との間の差を取得し、取得された差を、各サンプル値の調整された振幅値として使用するように構成されてよい。
音声/オーディオ信号内の低周波帯域信号をN個のサブバンドに分割し、
各サブバンドのピーク対平均比を計算して、そのピーク対平均比が事前に設定されたピーク対平均比の閾値よりも大きいサブバンドの数を決定し、
音声/オーディオ信号内の高周波帯域信号の信号タイプおよびサブバンドの数に従って、適応性のある正規化された長さを計算するように構成されてよく、ここで、Nは自然数である。
式L=K+α×Mに従って、適応性のある正規化された長さを計算するように構成されてよく、ここで、
Lは適応性のある正規化された長さであり、Kは音声/オーディオ信号内の高周波帯域信号の信号タイプに対応する数値であり、高周波帯域信号の異なる信号タイプは異なる数値Kに対応し、Mはそのピーク対平均比が事前に設定されたピーク対平均比の閾値よりも大きいサブバンドの数であり、αは1よりも小さい定数である。
音声/オーディオ信号内の低周波帯域信号のピーク対平均比および音声/オーディオ信号内の高周波帯域信号のピーク対平均比を計算して、低周波帯域信号のピーク対平均比と高周波帯域信号のピーク対平均比との間の差の絶対値が事前に設定された差の閾値よりも小さいとき、適応性のある正規化された長さを事前に設定された第1の長さの値として決定するか、または、低周波帯域信号のピーク対平均比と高周波帯域信号のピーク対平均比との間の差の絶対値が事前に設定された差の閾値よりも小さくないとき、適応性のある正規化された長さを事前に設定された第2の長さの値として決定するか、または、
音声/オーディオ信号内の低周波帯域信号のピーク対平均比および音声/オーディオ信号内の高周波帯域信号のピーク対平均比を計算して、低周波帯域信号のピーク対平均比が高周波帯域信号のピーク対平均比よりも小さいとき、適応性のある正規化された長さを事前に設定された第1の長さの値として決定するか、または、低周波帯域信号のピーク対平均比が高周波帯域信号のピーク対平均比よりも小さくないとき、適応性のある正規化された長さを事前に設定された第2の長さの値として決定するか、または、
音声/オーディオ信号内の高周波帯域信号の信号タイプに従って、適応性のある正規化された長さを決定するように構成されてよく、
ここで、第1の長さの値は第2の長さの値よりも大きく、
高周波帯域信号の異なる信号タイプは、異なる適応性のある正規化された長さに対応する。
各サンプル値の符号および調整された振幅値に従って、各サンプル値の新しい値を決定して、第2の音声/オーディオ信号を取得するか、または、
修正因子を計算して、修正因子に従って、サンプル値の調整された振幅値内の、0よりも大きい調整された振幅値に対して、修正処理を実行して、各サンプル値の符号および修正処理の後に取得された調整された振幅値に従って、各サンプル値の新しい値を決定して、第2の音声/オーディオ信号を取得するように構成されてよい。
式Y=y×(b-β)を使用することによって、サンプル値の調整された振幅値内の、0よりも大きい調整された振幅値に対して修正処理を実行するように構成されてよく、
ここで、Yは修正処理の後に取得された調整された振幅値であり、yは、サンプル値の調整された振幅値内の、0よりも大きい調整された振幅値であり、bは定数であるとともに0<b<2である。
420 信号決定ユニット
430 第1の決定ユニット
440 第2の決定ユニット
450 第3の決定ユニット
460 第4の決定ユニット
510 プロセッサ
520 メモリ
530 トランシーバ
Claims (22)
- 音声/オーディオ信号を処理するための方法であって、前記方法は、
ビットストリームを受信し、且つ、前記ビットストリームを復号して、前記音声/オーディオ信号を取得するステップと、
前記音声/オーディオ信号に従って、第1の音声/オーディオ信号を決定するステップであって、前記第1の音声/オーディオ信号は、前記音声/オーディオ信号内にあり、前記第1の音声/オーディオ信号の雑音成分は、再構築される必要がある、ステップと、
前記第1の音声/オーディオ信号における各サンプル値の符号および前記第1の音声/オーディオ信号における各サンプル値の振幅値を決定するステップと、
サンプル値の個数である適応性のある正規化された長さを決定するステップと、
前記適応性のある正規化された長さおよび各サンプル値の前記振幅値に従って、各サンプル値の調整された振幅値を決定するステップと、
各サンプル値の前記符号および各サンプル値の前記調整された振幅値に従って、第2の音声/オーディオ信号を決定するステップであって、前記第2の音声/オーディオ信号は、前記第1の音声/オーディオ信号のための前記雑音成分を再構成することによって取得される信号である、ステップと
を含む、方法。 - 前記適応性のある正規化された長さおよび各サンプル値の前記振幅値に従って、各サンプル値の調整された振幅値を決定する前記ステップは、
各サンプル値の前記振幅値および前記適応性のある正規化された長さに従って、各サンプル値に対応する平均振幅値を計算して、各サンプル値に対応する前記平均振幅値に従って、各サンプル値に対応する振幅外乱値を決定するステップと、
各サンプル値の前記振幅値に従って、且つ、各サンプル値に対応する前記振幅外乱値に従って、各サンプル値の前記調整された振幅値を計算するステップとを含む、請求項1に記載の方法。 - 各サンプル値の前記振幅値および前記適応性のある正規化された長さに従って、各サンプル値に対応する平均振幅値を計算する前記ステップは、
各サンプル値について、且つ、前記適応性のある正規化された長さに従って、前記サンプル値が属するサブバンドを決定するステップと、
前記サンプル値が属する前記サブバンド内の全てのサンプル値の振幅値の平均値を計算して、計算によって取得される前記平均値を前記サンプル値に対応する前記平均振幅値として使用するステップとを含む、請求項2に記載の方法。 - 各サンプル値について、且つ、前記適応性のある正規化された長さに従って、前記サンプル値が属するサブバンドを決定する前記ステップは、
前記適応性のある正規化された長さに従って、事前に設定された順序で、全てのサンプル値に対してサブバンド分類を実行して、各サンプル値について、前記サンプル値を含むサブバンドを前記サンプル値が属する前記サブバンドとして決定するステップか、または、
各サンプル値について、前記サンプル値の前のm個のサンプル値、前記サンプル値および前記サンプル値の後のn個のサンプル値からなるサブバンドを、前記サンプル値が属する前記サブバンドとして決定するステップであって、mおよびnは前記適応性のある正規化された長さに依存し、mは0よりも小さくない整数であり、nは0よりも小さくない整数である、ステップを含む、請求項3に記載の方法。 - 各サンプル値の前記振幅値に従って、且つ、各サンプル値に対応する前記振幅外乱値に従って、各サンプル値の前記調整された振幅値を計算する前記ステップは、
各サンプル値の前記振幅値から、各サンプル値に対応する前記振幅外乱値を差し引いて、各サンプル値の前記振幅値と各サンプル値に対応する前記振幅外乱値との間の差を取得し、前記取得された差を、各サンプル値の前記調整された振幅値として使用するステップを含む、請求項2乃至4のいずれか1項に記載の方法。 - 適応性のある正規化された長さを決定する前記ステップは、
前記音声/オーディオ信号内の低周波帯域信号をN個のサブバンドに分割するステップであって、Nは自然数である、ステップと、
各サブバンドのピーク対平均比を計算して、そのピーク対平均比が事前に設定されたピーク対平均比の閾値よりも大きいサブバンドの数を決定するステップと、
前記音声/オーディオ信号内の高周波帯域信号の信号タイプおよび前記サブバンドの前記数に従って、前記適応性のある正規化された長さを計算するステップとを含む、請求項1乃至5のいずれか1項に記載の方法。 - 前記音声/オーディオ信号内の高周波帯域信号の信号タイプおよび前記サブバンドの前記数に従って、前記適応性のある正規化された長さを計算する前記ステップは、
式L=K+α×Mに従って、前記適応性のある正規化された長さを計算するステップであって、
Lは前記適応性のある正規化された長さであり、Kは前記音声/オーディオ信号内の前記高周波帯域信号の前記信号タイプに対応する数値であり、高周波帯域信号の異なる信号タイプは異なる数値Kに対応し、Mはそのピーク対平均比が前記事前に設定されたピーク対平均比の閾値よりも大きい前記サブバンドの前記数であり、αは1よりも小さい定数である、ステップを含む、請求項6に記載の方法。 - 適応性のある正規化された長さを決定する前記ステップは、
前記音声/オーディオ信号内の低周波帯域信号のピーク対平均比および前記音声/オーディオ信号内の高周波帯域信号のピーク対平均比を計算して、前記低周波帯域信号の前記ピーク対平均比と前記高周波帯域信号の前記ピーク対平均比との間の差の絶対値が事前に設定された差の閾値よりも小さいとき、前記適応性のある正規化された長さを事前に設定された第1の長さの値として決定するか、または、前記低周波帯域信号の前記ピーク対平均比と前記高周波帯域信号の前記ピーク対平均比との間の差の絶対値が事前に設定された差の閾値よりも小さくないとき、前記適応性のある正規化された長さを事前に設定された第2の長さの値として決定するステップであって、前記第1の長さの値は前記第2の長さの値よりも大きい、ステップか、または、
前記音声/オーディオ信号内の低周波帯域信号のピーク対平均比および前記音声/オーディオ信号内の高周波帯域信号のピーク対平均比を計算して、前記低周波帯域信号の前記ピーク対平均比が前記高周波帯域信号の前記ピーク対平均比よりも小さいとき、前記適応性のある正規化された長さを事前に設定された第1の長さの値として決定するか、または、前記低周波帯域信号の前記ピーク対平均比が前記高周波帯域信号の前記ピーク対平均比よりも小さくないとき、前記適応性のある正規化された長さを事前に設定された第2の長さの値として決定するステップか、または、
前記音声/オーディオ信号内の高周波帯域信号の信号タイプに従って、前記適応性のある正規化された長さを決定するステップであって、高周波帯域信号の異なる信号タイプは、異なる適応性のある正規化された長さに対応する、ステップを含む、請求項1乃至5のいずれか1項に記載の方法。 - 各サンプル値の前記符号および各サンプル値の前記調整された振幅値に従って、第2の音声/オーディオ信号を決定する前記ステップは、
各サンプル値の前記符号および前記調整された振幅値に従って、各サンプル値の新しい値を決定して、前記第2の音声/オーディオ信号を取得するステップか、または、
修正因子を計算して、前記修正因子に従って、前記サンプル値の前記調整された振幅値内の、0よりも大きい調整された振幅値に対して、修正処理を実行して、各サンプル値の前記符号および前記修正処理の後に取得された調整された振幅値に従って、各サンプル値の新しい値を決定して、前記第2の音声/オーディオ信号を取得するステップを含む、請求項1乃至8のいずれか1項に記載の方法。 - 修正因子を計算する前記ステップは、
式β=a/Lを使用することによって、前記修正因子を計算するステップであって、βは前記修正因子であり、Lは前記適応性のある正規化された長さであり、aは1よりも大きい定数である、ステップを含む、請求項9に記載の方法。 - 前記修正因子に従って、前記サンプル値の前記調整された振幅値内の、0よりも大きい調整された振幅値に対して、修正処理を実行する前記ステップは、
式Y=y×(b-β)を使用することによって、前記サンプル値の前記調整された振幅値内の、0よりも大きい前記調整された振幅値に対して修正処理を実行するステップであって、
Yは前記修正処理の後に取得された前記調整された振幅値であり、yは、前記サンプル値の前記調整された振幅値内の、0よりも大きい前記調整された振幅値であり、bは定数であるとともに0<b<2である、ステップを含む、請求項10に記載の方法。 - 音声/オーディオ信号の雑音成分を再構成するための装置であって、
ビットストリームを受信し、且つ、前記ビットストリームを復号して、前記音声/オーディオ信号を取得するように構成されるビットストリーム処理ユニットと、
前記ビットストリーム処理ユニットによって取得された前記音声/オーディオ信号に従って、第1の音声/オーディオ信号を決定するように構成される信号決定ユニットであって、前記第1の音声/オーディオ信号は、復号によって取得された前記音声/オーディオ信号内にあり、前記第1の音声/オーディオ信号の雑音成分は、再構築される必要がある、信号決定ユニットと、
前記信号決定ユニットによって決定された前記第1の音声/オーディオ信号における各サンプル値の符号および前記信号決定ユニットによって決定された前記第1の音声/オーディオ信号における各サンプル値の振幅値を決定するように構成される第1の決定ユニットと、
サンプル値の個数である適応性のある正規化された長さを決定するように構成される第2の決定ユニットと、
前記第2の決定ユニットによって決定された前記適応性のある正規化された長さおよび各サンプル値のものであるとともに前記第1の決定ユニットによって決定された前記振幅値に従って、各サンプル値の調整された振幅値を決定するように構成される第3の決定ユニットと、
各サンプル値のものであるとともに前記第1の決定ユニットによって決定された前記符号および各サンプル値のものであるとともに前記第3の決定ユニットによって決定された前記調整された振幅値に従って、第2の音声/オーディオ信号を決定するように構成される第4の決定ユニットであって、前記第2の音声/オーディオ信号は、前記第1の音声/オーディオ信号のための前記雑音成分を再構成することによって取得される信号である、第4の決定ユニットと
を含む、装置。 - 前記第3の決定ユニットは、
各サンプル値の前記振幅値および前記適応性のある正規化された長さに従って、各サンプル値に対応する平均振幅値を計算して、各サンプル値に対応する前記平均振幅値に従って、各サンプル値に対応する振幅外乱値を決定するように構成される決定サブユニットと、
各サンプル値の前記振幅値に従って、且つ、各サンプル値に対応する前記振幅外乱値に従って、各サンプル値の前記調整された振幅値を計算するように構成される調整された振幅値計算サブユニットとを含む、請求項12に記載の装置。 - 前記決定サブユニットは、
各サンプル値について、且つ、前記適応性のある正規化された長さに従って、前記サンプル値が属するサブバンドを決定するように構成される決定モジュールと、
前記サンプル値が属する前記サブバンド内の全てのサンプル値の振幅値の平均値を計算して、計算によって取得される前記平均値を前記サンプル値に対応する前記平均振幅値として使用するように構成される計算モジュールとを含む、請求項13に記載の装置。 - 前記決定モジュールは、具体的には、
前記適応性のある正規化された長さに従って、事前に設定された順序で、全てのサンプル値に対してサブバンド分類を実行して、各サンプル値について、前記サンプル値を含むサブバンドを前記サンプル値が属する前記サブバンドとして決定するか、または、
各サンプル値について、前記サンプル値の前のm個のサンプル値、前記サンプル値および前記サンプル値の後のn個のサンプル値からなるサブバンドを、前記サンプル値が属する前記サブバンドとして決定するように構成され、mおよびnは前記適応性のある正規化された長さに依存し、mは0よりも小さくない整数であり、nは0よりも小さくない整数である、請求項14に記載の装置。 - 前記調整された振幅値計算サブユニットは、具体的には、
各サンプル値の前記振幅値から、各サンプル値に対応する前記振幅外乱値を差し引いて、各サンプル値の前記振幅値と各サンプル値に対応する前記振幅外乱値との間の差を取得し、前記取得された差を、各サンプル値の前記調整された振幅値として使用するように構成される、請求項13乃至15のいずれか1項に記載の装置。 - 前記第2の決定ユニットは、
前記音声/オーディオ信号内の低周波帯域信号をN個のサブバンドに分割するように構成される分割サブユニットであって、Nは自然数である、分割サブユニットと、
各サブバンドのピーク対平均比を計算して、そのピーク対平均比が事前に設定されたピーク対平均比の閾値よりも大きいサブバンドの数を決定するように構成される数決定サブユニットと、
前記音声/オーディオ信号内の高周波帯域信号の信号タイプおよび前記サブバンドの前記数に従って、前記適応性のある正規化された長さを計算するように構成される長さ計算サブユニットとを含む、請求項12乃至16のいずれか1項に記載の装置。 - 前記長さ計算サブユニットは、具体的には、
式L=K+α×Mに従って、前記適応性のある正規化された長さを計算するように構成され、
Lは前記適応性のある正規化された長さであり、Kは前記音声/オーディオ信号内の前記高周波帯域信号の前記信号タイプに対応する数値であり、高周波帯域信号の異なる信号タイプは異なる数値Kに対応し、Mはそのピーク対平均比が前記事前に設定されたピーク対平均比の閾値よりも大きい前記サブバンドの前記数であり、αは1よりも小さい定数である請求項17に記載の装置。 - 前記第2の決定ユニットは、具体的には、
前記音声/オーディオ信号内の低周波帯域信号のピーク対平均比および前記音声/オーディオ信号内の高周波帯域信号のピーク対平均比を計算して、前記低周波帯域信号の前記ピーク対平均比と前記高周波帯域信号の前記ピーク対平均比との間の差の絶対値が事前に設定された差の閾値よりも小さいとき、前記適応性のある正規化された長さを事前に設定された第1の長さの値として決定するか、または、前記低周波帯域信号の前記ピーク対平均比と前記高周波帯域信号の前記ピーク対平均比との間の差の絶対値が事前に設定された差の閾値よりも小さくないとき、前記適応性のある正規化された長さを事前に設定された第2の長さの値として決定するか、または、
前記音声/オーディオ信号内の低周波帯域信号のピーク対平均比および前記音声/オーディオ信号内の高周波帯域信号のピーク対平均比を計算して、前記低周波帯域信号の前記ピーク対平均比が前記高周波帯域信号の前記ピーク対平均比よりも小さいとき、前記適応性のある正規化された長さを事前に設定された第1の長さの値として決定するか、または、前記低周波帯域信号の前記ピーク対平均比が前記高周波帯域信号の前記ピーク対平均比よりも小さくないとき、前記適応性のある正規化された長さを事前に設定された第2の長さの値として決定するか、または、
前記音声/オーディオ信号内の高周波帯域信号の信号タイプに従って、前記適応性のある正規化された長さを決定するように構成され、
前記第1の長さの値は前記第2の長さの値よりも大きく、
高周波帯域信号の異なる信号タイプは、異なる適応性のある正規化された長さに対応する、請求項12乃至16のいずれか1項に記載の装置。 - 前記第4の決定ユニットは、具体的には、
各サンプル値の前記符号および前記調整された振幅値に従って、各サンプル値の新しい値を決定して、前記第2の音声/オーディオ信号を取得するか、または、
修正因子を計算して、前記修正因子に従って、前記サンプル値の前記調整された振幅値内の、0よりも大きい調整された振幅値に対して、修正処理を実行して、各サンプル値の前記符号および前記修正処理の後に取得された調整された振幅値に従って、各サンプル値の新しい値を決定して、前記第2の音声/オーディオ信号を取得するように構成される、請求項12乃至19のいずれか1項に記載の装置。 - 前記第4の決定ユニットは、具体的には、式β=a/Lを使用することによって、前記修正因子を計算するように構成され、βは前記修正因子であり、Lは前記適応性のある正規化された長さであり、aは1よりも大きい定数である、請求項20に記載の装置。
- 前記第4の決定ユニットは、具体的には、
式Y=y×(b-β)を使用することによって、前記サンプル値の前記調整された振幅値内の、0よりも大きい前記調整された振幅値に対して修正処理を実行するように構成され、
Yは前記修正処理の後に取得された前記調整された振幅値であり、yは、前記サンプル値の前記調整された振幅値内の、0よりも大きい前記調整された振幅値であり、bは定数であるとともに0<b<2である、請求項21に記載の装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410242233.2A CN105336339B (zh) | 2014-06-03 | 2014-06-03 | 一种语音频信号的处理方法和装置 |
CN201410242233.2 | 2014-06-03 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016570979A Division JP6462727B2 (ja) | 2014-06-03 | 2015-01-19 | 音声/オーディオ信号を処理するための方法および装置 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020213571A Division JP7142674B2 (ja) | 2014-06-03 | 2020-12-23 | 音声/オーディオ信号を処理するための方法および装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019061282A JP2019061282A (ja) | 2019-04-18 |
JP6817283B2 true JP6817283B2 (ja) | 2021-01-20 |
Family
ID=54766052
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016570979A Active JP6462727B2 (ja) | 2014-06-03 | 2015-01-19 | 音声/オーディオ信号を処理するための方法および装置 |
JP2018242725A Active JP6817283B2 (ja) | 2014-06-03 | 2018-12-26 | 音声/オーディオ信号を処理するための方法および装置 |
JP2020213571A Active JP7142674B2 (ja) | 2014-06-03 | 2020-12-23 | 音声/オーディオ信号を処理するための方法および装置 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016570979A Active JP6462727B2 (ja) | 2014-06-03 | 2015-01-19 | 音声/オーディオ信号を処理するための方法および装置 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020213571A Active JP7142674B2 (ja) | 2014-06-03 | 2020-12-23 | 音声/オーディオ信号を処理するための方法および装置 |
Country Status (19)
Country | Link |
---|---|
US (3) | US9978383B2 (ja) |
EP (3) | EP3147900B1 (ja) |
JP (3) | JP6462727B2 (ja) |
KR (3) | KR102201791B1 (ja) |
CN (2) | CN105336339B (ja) |
AU (1) | AU2015271580B2 (ja) |
BR (1) | BR112016028375B1 (ja) |
CA (1) | CA2951169C (ja) |
CL (1) | CL2016003121A1 (ja) |
ES (1) | ES2964221T3 (ja) |
HK (1) | HK1220543A1 (ja) |
IL (1) | IL249337B (ja) |
MX (2) | MX362612B (ja) |
MY (1) | MY179546A (ja) |
NZ (1) | NZ727567A (ja) |
RU (1) | RU2651184C1 (ja) |
SG (1) | SG11201610141RA (ja) |
WO (1) | WO2015184813A1 (ja) |
ZA (1) | ZA201608477B (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021060609A (ja) * | 2014-06-03 | 2021-04-15 | 華為技術有限公司Huawei Technologies Co.,Ltd. | 音声/オーディオ信号を処理するための方法および装置 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108133712B (zh) * | 2016-11-30 | 2021-02-12 | 华为技术有限公司 | 一种处理音频数据的方法和装置 |
CN106847299B (zh) * | 2017-02-24 | 2020-06-19 | 喜大(上海)网络科技有限公司 | 延时的估计方法及装置 |
RU2754497C1 (ru) * | 2020-11-17 | 2021-09-02 | федеральное государственное автономное образовательное учреждение высшего образования "Казанский (Приволжский) федеральный университет" (ФГАОУ ВО КФУ) | Способ передачи речевых файлов по зашумленному каналу и устройство для его реализации |
US20230300524A1 (en) * | 2022-03-21 | 2023-09-21 | Qualcomm Incorporated | Adaptively adjusting an input current limit for a boost converter |
Family Cites Families (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6261312B1 (en) | 1998-06-23 | 2001-07-17 | Innercool Therapies, Inc. | Inflatable catheter for selective organ heating and cooling and method of using the same |
SE9803698L (sv) * | 1998-10-26 | 2000-04-27 | Ericsson Telefon Ab L M | Metoder och anordningar i ett telekommunikationssystem |
CA2252170A1 (en) * | 1998-10-27 | 2000-04-27 | Bruno Bessette | A method and device for high quality coding of wideband speech and audio signals |
US6687668B2 (en) * | 1999-12-31 | 2004-02-03 | C & S Technology Co., Ltd. | Method for improvement of G.723.1 processing time and speech quality and for reduction of bit rate in CELP vocoder and CELP vococer using the same |
US6631139B2 (en) * | 2001-01-31 | 2003-10-07 | Qualcomm Incorporated | Method and apparatus for interoperability between voice transmission systems during speech inactivity |
US6708147B2 (en) * | 2001-02-28 | 2004-03-16 | Telefonaktiebolaget Lm Ericsson(Publ) | Method and apparatus for providing comfort noise in communication system with discontinuous transmission |
US20030093270A1 (en) * | 2001-11-13 | 2003-05-15 | Domer Steven M. | Comfort noise including recorded noise |
EP1701340B1 (en) * | 2001-11-14 | 2012-08-29 | Panasonic Corporation | Decoding device, method and program |
US7536298B2 (en) * | 2004-03-15 | 2009-05-19 | Intel Corporation | Method of comfort noise generation for speech communication |
US7831421B2 (en) * | 2005-05-31 | 2010-11-09 | Microsoft Corporation | Robust decoder |
US7610197B2 (en) * | 2005-08-31 | 2009-10-27 | Motorola, Inc. | Method and apparatus for comfort noise generation in speech communication systems |
WO2008007700A1 (fr) | 2006-07-12 | 2008-01-17 | Panasonic Corporation | Dispositif de décodage de son, dispositif de codage de son, et procédé de compensation de trame perdue |
EP2067138B1 (en) * | 2006-09-18 | 2011-02-23 | Koninklijke Philips Electronics N.V. | Encoding and decoding of audio objects |
CN101320563B (zh) * | 2007-06-05 | 2012-06-27 | 华为技术有限公司 | 一种背景噪声编码/解码装置、方法和通信设备 |
CN101335003B (zh) * | 2007-09-28 | 2010-07-07 | 华为技术有限公司 | 噪声生成装置、及方法 |
US8139777B2 (en) * | 2007-10-31 | 2012-03-20 | Qnx Software Systems Co. | System for comfort noise injection |
CN101483042B (zh) * | 2008-03-20 | 2011-03-30 | 华为技术有限公司 | 一种噪声生成方法以及噪声生成装置 |
MY152252A (en) * | 2008-07-11 | 2014-09-15 | Fraunhofer Ges Forschung | Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme |
PT2146344T (pt) | 2008-07-17 | 2016-10-13 | Fraunhofer Ges Forschung | Esquema de codificação/descodificação de áudio com uma derivação comutável |
CN101483048B (zh) | 2009-02-06 | 2010-08-25 | 凌阳科技股份有限公司 | 光学储存装置及其回路增益值的自动校正方法 |
US9047875B2 (en) * | 2010-07-19 | 2015-06-02 | Futurewei Technologies, Inc. | Spectrum flatness control for bandwidth extension |
CN102436820B (zh) * | 2010-09-29 | 2013-08-28 | 华为技术有限公司 | 高频带信号编码方法及装置、高频带信号解码方法及装置 |
KR102053900B1 (ko) * | 2011-05-13 | 2019-12-09 | 삼성전자주식회사 | 노이즈 필링방법, 오디오 복호화방법 및 장치, 그 기록매체 및 이를 채용하는 멀티미디어 기기 |
US20130006644A1 (en) * | 2011-06-30 | 2013-01-03 | Zte Corporation | Method and device for spectral band replication, and method and system for audio decoding |
US8731949B2 (en) | 2011-06-30 | 2014-05-20 | Zte Corporation | Method and system for audio encoding and decoding and method for estimating noise level |
CN102208188B (zh) * | 2011-07-13 | 2013-04-17 | 华为技术有限公司 | 音频信号编解码方法和设备 |
US20130132100A1 (en) | 2011-10-28 | 2013-05-23 | Electronics And Telecommunications Research Institute | Apparatus and method for codec signal in a communication system |
IN2014DN03022A (ja) * | 2011-11-03 | 2015-05-08 | Voiceage Corp | |
US20130282372A1 (en) | 2012-04-23 | 2013-10-24 | Qualcomm Incorporated | Systems and methods for audio signal processing |
CN105336339B (zh) | 2014-06-03 | 2019-05-03 | 华为技术有限公司 | 一种语音频信号的处理方法和装置 |
US12044962B2 (en) | 2019-04-19 | 2024-07-23 | Canon Kabushiki Kaisha | Forming apparatus, forming method, and article manufacturing method |
-
2014
- 2014-06-03 CN CN201410242233.2A patent/CN105336339B/zh active Active
- 2014-06-03 CN CN201910358522.1A patent/CN110097892B/zh active Active
-
2015
- 2015-01-19 EP EP15802508.0A patent/EP3147900B1/en active Active
- 2015-01-19 RU RU2016152224A patent/RU2651184C1/ru active
- 2015-01-19 ES ES19190663T patent/ES2964221T3/es active Active
- 2015-01-19 MY MYPI2016704486A patent/MY179546A/en unknown
- 2015-01-19 JP JP2016570979A patent/JP6462727B2/ja active Active
- 2015-01-19 AU AU2015271580A patent/AU2015271580B2/en active Active
- 2015-01-19 CA CA2951169A patent/CA2951169C/en active Active
- 2015-01-19 WO PCT/CN2015/071017 patent/WO2015184813A1/zh active Application Filing
- 2015-01-19 SG SG11201610141RA patent/SG11201610141RA/en unknown
- 2015-01-19 EP EP23184053.9A patent/EP4283614A3/en active Pending
- 2015-01-19 KR KR1020207011385A patent/KR102201791B1/ko active IP Right Grant
- 2015-01-19 BR BR112016028375-9A patent/BR112016028375B1/pt active IP Right Grant
- 2015-01-19 NZ NZ727567A patent/NZ727567A/en unknown
- 2015-01-19 EP EP19190663.5A patent/EP3712890B1/en active Active
- 2015-01-19 MX MX2016015950A patent/MX362612B/es active IP Right Grant
- 2015-01-19 KR KR1020197002091A patent/KR102104561B1/ko active IP Right Grant
- 2015-01-19 KR KR1020167035690A patent/KR101943529B1/ko active IP Right Grant
-
2016
- 2016-07-15 HK HK16108374.1A patent/HK1220543A1/zh unknown
- 2016-12-01 IL IL249337A patent/IL249337B/en active IP Right Grant
- 2016-12-02 MX MX2019001193A patent/MX2019001193A/es unknown
- 2016-12-02 CL CL2016003121A patent/CL2016003121A1/es unknown
- 2016-12-05 US US15/369,396 patent/US9978383B2/en active Active
- 2016-12-08 ZA ZA2016/08477A patent/ZA201608477B/en unknown
-
2018
- 2018-05-21 US US15/985,281 patent/US10657977B2/en active Active
- 2018-12-26 JP JP2018242725A patent/JP6817283B2/ja active Active
-
2020
- 2020-05-18 US US16/877,389 patent/US11462225B2/en active Active
- 2020-12-23 JP JP2020213571A patent/JP7142674B2/ja active Active
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021060609A (ja) * | 2014-06-03 | 2021-04-15 | 華為技術有限公司Huawei Technologies Co.,Ltd. | 音声/オーディオ信号を処理するための方法および装置 |
JP7142674B2 (ja) | 2014-06-03 | 2022-09-27 | 華為技術有限公司 | 音声/オーディオ信号を処理するための方法および装置 |
US11462225B2 (en) | 2014-06-03 | 2022-10-04 | Huawei Technologies Co., Ltd. | Method for processing speech/audio signal and apparatus |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6817283B2 (ja) | 音声/オーディオ信号を処理するための方法および装置 | |
KR101019398B1 (ko) | 오디오 코딩 및 디코딩에서의 여기의 프로세싱 | |
KR101736394B1 (ko) | 오디오 신호 인코딩/디코딩 방법 및 오디오 신호 인코딩/디코딩 장치 | |
JP6616470B2 (ja) | 符号化方法、復号化方法、符号化装置及び復号化装置 | |
US9779747B2 (en) | Coding/decoding method, apparatus, and system for audio signal | |
AU2014392351B2 (en) | Signal processing method and device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190124 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190124 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200323 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20200623 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20200817 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200923 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201124 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201224 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6817283 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |