JP2017062512A - オーディオ・データを処理するための方法、装置、及びシステム - Google Patents
オーディオ・データを処理するための方法、装置、及びシステム Download PDFInfo
- Publication number
- JP2017062512A JP2017062512A JP2016252612A JP2016252612A JP2017062512A JP 2017062512 A JP2017062512 A JP 2017062512A JP 2016252612 A JP2016252612 A JP 2016252612A JP 2016252612 A JP2016252612 A JP 2016252612A JP 2017062512 A JP2017062512 A JP 2017062512A
- Authority
- JP
- Japan
- Prior art keywords
- noise
- band
- sid
- current
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 156
- 238000012545 processing Methods 0.000 title claims abstract description 66
- 230000005236 sound signal Effects 0.000 claims abstract description 24
- 230000015572 biosynthetic process Effects 0.000 claims description 36
- 238000003786 synthesis reaction Methods 0.000 claims description 36
- 238000003780 insertion Methods 0.000 claims description 17
- 230000037431 insertion Effects 0.000 claims description 17
- 238000009499 grossing Methods 0.000 claims description 10
- 230000005540 biological transmission Effects 0.000 abstract description 135
- 230000007246 mechanism Effects 0.000 abstract description 61
- 238000004364 calculation method Methods 0.000 abstract description 11
- 238000004891 communication Methods 0.000 abstract description 6
- 238000000354 decomposition reaction Methods 0.000 abstract 1
- 230000008569 process Effects 0.000 description 70
- 238000001228 spectrum Methods 0.000 description 41
- 230000003595 spectral effect Effects 0.000 description 27
- 230000000694 effects Effects 0.000 description 12
- 230000007774 longterm Effects 0.000 description 12
- 238000003672 processing method Methods 0.000 description 10
- 230000005284 excitation Effects 0.000 description 7
- 239000000872 buffer Substances 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000009471 action Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000013139 quantization Methods 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 206010021403 Illusion Diseases 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
- G10L19/265—Pre-filtering, e.g. high frequency emphasis prior to encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Noise Elimination (AREA)
Abstract
【解決手段】 この方法は、オーディオ信号の雑音フレームを取得し、雑音フレームを雑音低帯域信号及び雑音高帯域信号に分解することと、第1の非連続送信機構を用いることによって雑音低帯域信号を符号化及び送信し、第2の非連続送信機構を用いることによって雑音高帯域信号を符号化及び送信することと、を含む。本発明に従って、高帯域信号及び低帯域信号に異なる処理方法を用い、コーデックの本質的な品質を低下させないという前提のもとに計算の複雑さを軽減して符号化ビットを節約することができ、節約したビットは、送信帯域幅を縮小するか又は全体的な符号化品質を向上させる目的の達成に役立てることができる。
【選択図】図1
Description
オーディオ信号の雑音フレームを取得し、当該雑音フレームを雑音低帯域信号及び雑音高帯域信号に分解する処理動作と、
第1の非連続送信機構を用いることによって当該雑音低帯域信号を符号化した上で、当該符号化された後の当該雑音低帯域信号を当該第1の非連続送信機構を使用して送信し、第2の非連続送信機構を用いることによって当該雑音高帯域信号を符号化した上で、当該符号化された後の当該雑音高帯域信号を当該第2の非連続送信機構を使用して送信する処理動作であって、当該第1の非連続送信機構の第1の無音挿入記述子フレーム(SID)を送出するためのポリシーが、当該第2の非連続送信機構の第2のSIDを送出するためのポリシーとは異なり、又は、当該第1の非連続送信機構の第1のSIDを符号化するためのポリシーが、当該第2の非連続送信機構の第2のSIDを符号化するためのポリシーとは異なる、処理動作と、
を含む。
デコーダによって、SIDを取得し、当該SIDが低帯域パラメータ及び/又は高帯域パラメータを含むことを判定する処理動作と、
当該SIDが当該低帯域パラメータを含む場合、当該SIDを復号化処理して雑音低帯域パラメータを取得し、雑音高帯域パラメータをローカルに発生し、当該復号化処理によって取得した雑音低帯域パラメータ及び当該ローカルに発生した雑音高帯域パラメータに従って第1の快適雑音(CN)フレームを取得する処理動作と、
当該SIDが高帯域パラメータを含む場合、当該SIDを復号化処理して雑音高帯域パラメータを取得し、雑音低帯域パラメータをローカルに発生し、当該復号化処理によって取得した雑音高帯域パラメータ及び当該ローカルに発生した雑音低帯域パラメータに従って第2のCNフレームを取得する処理動作と、
当該SIDが高帯域パラメータ及び低帯域パラメータを含む場合、当該SIDを復号化処理して雑音高帯域パラメータ及び雑音低帯域パラメータを取得し、当該復号化処理によって取得した雑音高帯域パラメータ及び雑音低帯域パラメータに従って第3のCNフレームを取得する処理動作と、
を含む。
オーディオ信号の雑音フレームを取得し、当該雑音フレームを雑音低帯域信号及び雑音高帯域信号に分解するように構成された取得モジュールと、
第1の非連続送信機構を用いることによって当該雑音低帯域信号を符号化した上で、当該符号化された後の当該雑音低帯域信号を当該第1の非連続送信機構を使用して送信し、第2の非連続送信機構を用いることによって当該雑音高帯域信号を符号化した上で、当該符号化された後の当該雑音高帯域信号を当該第2の非連続送信機構を使用して送信するように構成された送信モジュールであって、当該第1の非連続送信機構の第1のSIDを送出するためのポリシーが、当該第2の非連続送信機構の第2のSIDを送出するためのポリシーとは異なり、又は、当該第1の非連続送信機構の第1のSIDを符号化するためのポリシーが、当該第2の非連続送信機構の第2のSIDを符号化するためのポリシーとは異なる、送信モジュールと、
を含む。
SIDを取得し、当該SIDが低帯域パラメータ及び/又は高帯域パラメータを含むことを判定するように構成された取得モジュールと、
当該取得モジュールによって取得された当該SIDが低帯域パラメータを含む場合、当該SIDを復号化処理して雑音低帯域パラメータを取得し、雑音高帯域パラメータをローカルに発生し、当該復号化処理によって取得した雑音低帯域パラメータ及び当該ローカルに発生した雑音高帯域パラメータに従って第1のCNフレームを取得するように構成された第1の復号化モジュールと、
当該取得モジュールによって取得された当該SIDが高帯域パラメータを含む場合、当該SIDを復号化処理して雑音高帯域パラメータを取得し、雑音低帯域パラメータをローカルに発生し、当該復号処理によって取得した雑音高帯域パラメータ及び当該ローカルに発生した雑音低帯域パラメータに従って第2のCNフレームを取得するように構成された第2の復号化モジュールと、
当該取得モジュールによって取得された当該SIDが高帯域パラメータ及び低帯域パラメータを含む場合、当該SIDを復号化処理して雑音高帯域パラメータ及び雑音低帯域パラメータを取得し、当該復号化処理によって取得した当該雑音高帯域パラメータ及び当該雑音低帯域パラメータに従って第3のCNフレームを取得するように構成された第3の復号化モジュールと、
を含む。
雑音高帯域信号が予め設定されたスペクトル構造を有するか否かを判定し、これを有すると共に第2のSIDを送出するためのポリシーの送出条件を満たす場合は、第2のSIDを符号化するためのポリシーを用いることで雑音高帯域信号のSIDを符号化し、SIDを送出し、これを有しない場合は、雑音高帯域信号の符号化及び送信を行う必要がないと判定することを含む。
雑音高帯域信号のスペクトルを取得し、当該スペクトルを少なくとも2つのサブバンド(subband)に分割し、当該サブバンド内のいずれの第1のサブバンドの平均エネルギであっても当該サブバンド内の第2のサブバンドの平均エネルギより低くない場合には、雑音高帯域信号が予め設定されたスペクトル構造を有しないことを確定し、その他の場合においては、雑音高帯域信号が予め設定されたスペクトル構造を有することを確定する動作を含み、第2のサブバンドが位置する周波数帯域が第1のサブバンドが位置する周波数帯域よりも高いことを特徴とする。
第1の比率及び第2の比率に従って偏差程度値(deviation extent value)を発生する処理動作であって、第1の比率が、雑音フレームの雑音低帯域信号のエネルギに対する雑音フレームの雑音高帯域信号のエネルギの比率であり、第2の比率が、雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した時点での雑音低帯域信号のエネルギに対する雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した前記時点での雑音高帯域信号のエネルギの比率である、処理動作と、
偏差程度値が予め設定された閾値に達したか否かを判定し、これに達した場合は第2のSIDを符号化するためのポリシーを用いることによって雑音高帯域信号のSIDを符号化し、SIDを送出し、達しない場合は雑音高帯域信号の符号化及び送信を行う必要がないと判定する処理動作と、
を含む。
第1の比率を、雑音フレームの雑音低帯域信号の瞬時エネルギに対する雑音フレームの雑音高帯域信号の瞬時エネルギの比率とすることを含み、更に、
これに対応して、第2の比率を、雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した時点での雑音低帯域信号のエネルギに対する雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した前記時点での雑音高帯域信号のエネルギの比率とすることは、
第2の比率を、雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した時点での雑音低帯域信号の瞬時エネルギに対する雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した前記時点での雑音高帯域信号の瞬時エネルギの比率とすることを含む。
第1の比率を、雑音フレーム及びこの雑音フレームの前の雑音フレームの雑音低帯域信号の加重平均エネルギに対する雑音フレーム及びこの雑音フレームの前の雑音フレームの雑音高帯域信号の加重平均エネルギの比率とすることを含み、更に、
これに対応して、第2の比率を、雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した時点での雑音低帯域信号のエネルギに対する雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した前記時点での雑音高帯域信号のエネルギの比率とすることが、
第2の比率を、雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した前記時点での雑音フレーム及び雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した前記時点での前記雑音フレームの前の雑音フレームの低帯域信号の加重平均エネルギに対する、雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した前記時点での前記雑音フレーム及び雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した時点での前記雑音フレームの前の雑音フレームの高帯域信号の加重平均エネルギの比率とすることを含む。
第1の比率の対数値及び第2の比率の対数値を別個に計算する処理動作と、
第1の比率の対数値と第2の比率の対数値との間の差の絶対値を計算して偏差程度値を取得する処理動作と、
を含む。
雑音フレームの雑音高帯域信号のスペクトル構造が、雑音フレームの前の雑音高帯域信号の平均スペクトル構造に比べて、予め設定された条件を満たすか否かを判定し、これを満たす場合には、第2のSIDを符号化するためのポリシーを用いることによって雑音フレームの雑音高帯域信号のSIDを符号化し、SIDを送出し、これを満たさない場合には、雑音フレームの雑音高帯域信号の符号化及び送信を行う必要がないと判定する処理動作を含む。
図2を参照すると、この実施形態はオーディオ・データを処理するための方法を提供する。この方法は以下を含む。
当該デコーダが第1の快適雑音生成(CNG)状態にある場合、当該デコーダによって第2のCNG状態に入ることを更に含む。
当該デコーダが第2のCNG状態にある場合、デコーダによって第1のCNG状態に入ることを更に含む。
すなわち、上記判定する処理動作は、当該SIDのビット数が予め設定された第1の閾値よりも小さい場合、当該SIDが高帯域パラメータを含むことを確定し、当該SIDのビット数が予め設定された第1の閾値よりも大きく予め設定された第2の閾値よりも小さい場合、当該SIDが低帯域パラメータを含むことを確定し、当該SIDのビット数が予め設定された第2の閾値よりも大きく予め設定された第3の閾値よりも小さい場合、当該SIDが高帯域パラメータ及び低帯域パラメータを含むことを確定する動作、又は、
当該SIDが第1の識別子を含む場合、当該SIDが高帯域パラメータを含むことを確定し、当該SIDが第2の識別子を含む場合、当該SIDが低帯域パラメータを含むことを確定し、当該SIDが第3の識別子を含む場合、当該SIDが低帯域パラメータ及び高帯域パラメータを含むことを確定する動作、を含む。
SIDに対応する時点での雑音高帯域信号の加重平均エネルギ及び雑音高帯域信号の合成フィルタ係数を別個に取得する動作と、
SIDに対応する時点での雑音高帯域信号の取得した加重平均エネルギ及び雑音高帯域信号の取得した合成フィルタ係数に従って雑音高帯域信号を取得する動作と、
を含む。
当該復号化処理によって取得した雑音低帯域パラメータに従って第1のCNフレームの低帯域信号のエネルギを取得する動作と、
高帯域パラメータを含むSIDを先行するSIDの前に受信した時点における雑音低帯域信号のエネルギに対する雑音高帯域信号のエネルギの比率を計算して第1の比率を取得する動作と、
当該第1のCNフレームの低帯域信号のエネルギ及び当該第1の比率に従って、SIDに対応する時点での雑音高帯域信号のエネルギを取得することと、
当該SIDに対応する時点での雑音高帯域信号のエネルギ及びローカルにバッファリングされたCNフレームの高帯域信号のエネルギに対して加重平均を実行して、当該SIDに対応する時点での雑音高帯域信号の加重平均エネルギを取得する動作であって、当該SIDに対応する時点での雑音高帯域信号の加重平均エネルギを当該第1のCNフレームの高帯域信号エネルギとする、動作と、
を含む。
当該高帯域パラメータを含むSIDを当該先行するSIDの前に受信した時点における雑音低帯域信号の瞬時エネルギに対する雑音高帯域信号の瞬時エネルギの比率を計算して第1の比率を取得する動作、又は、
当該高帯域パラメータを含むSIDを当該先行するSIDの前に受信した時点における雑音低帯域信号の加重平均エネルギに対する雑音高帯域信号の加重平均エネルギの比率を計算して第1の比率を取得する動作、
を含む。
当該SIDよりも先行する予め設定された時間期間内の音声フレームから、最小の高帯域信号エネルギを有する音声フレームの高帯域信号を選択する動作と、
当該音声フレーム中で当該最小の高帯域信号エネルギを有する音声フレームの高帯域信号のエネルギに従って、当該SIDに対応する時点での雑音高帯域信号の加重平均エネルギを取得することであって、当該SIDに対応する時点での雑音高帯域信号の加重平均エネルギを第1のCNフレームの高帯域信号エネルギとする、動作と、を含み、又は、
当該SIDよりも先行する予め設定された時間期間内の音声フレームから、当該予め設定された閾値よりも小さい高帯域信号エネルギを有するN個の音声フレームの高帯域信号を選択する動作と、
当該N個の音声フレームの高帯域信号の加重平均エネルギに従って、当該SIDに対応する時点での雑音高帯域信号の加重平均エネルギを取得することであって、当該SIDに対応する時点での雑音高帯域信号の加重平均エネルギを第1のCNフレームの高帯域信号エネルギとする、動作と、
を含む。
イミタンス・スペクトル周波数(ISF:Immittance Spectral Frequency)係数又はISP係数又は線スペクトル周波数(LSF:Line Spectral Frequency)係数又は線スペクトル対(LSP:Line Spectral pair)係数の何れかであるM個の係数を、高帯域信号に対応する周波数範囲にわたって分散させることと、
上述したM個の係数に対してランダム化処理を実行する動作であって、当該ランダム化処理の特性が、当該M個の係数中に含まれる各係数を、当該各係数に対応する目標値に徐々に漸近させるものであり、当該目標値は当該係数の値に近接した予め設定された範囲内の値であり、当該M個の係数中に含まれる各係数の目標値がN個のフレームの各々毎に変化し、M及びNの双方が自然数である、動作と、
当該ランダム化処理によって取得したフィルタ係数に従って、当該SIDに対応する時点での雑音高帯域信号の合成フィルタ係数を取得することと、
を含む。
ローカルにバッファリングされた雑音高帯域信号のM個のISF係数又はISP係数又はLSF係数又はLSP係数を取得する動作と、
当該M個の係数に対してランダム化処理を実行することであって、当該ランダム化処理の特性が、当該M個の係数中に含まれる各係数を、当該各係数に対応する目標値に徐々に漸近させるものであり、当該目標値は当該係数の値に近接した予め設定された範囲内の値であり、当該M個の係数中に含まれる各係数の目標値がN個のフレームの各々毎に変化する、動作と、
当該ランダム化処理によって取得したフィルタ係数に従って、当該SIDに対応する時点での雑音高帯域信号の合成フィルタ係数を取得する動作と、
を含む。
これに対応して、当該復号化処理によって取得した雑音低帯域パラメータ及び当該ローカルに発生した雑音高帯域パラメータに従って第1のCNフレームを取得する動作が、
当該復号化処理によって取得した雑音低帯域パラメータ、当該SIDに対応する時点での雑音高帯域信号の合成フィルタ係数、及び当該ローカルに発生した雑音高帯域信号の新しい加重平均エネルギに従って、第4のCNフレームを取得する動作を含む。
この実施形態は、オーディオ・データを処理するための方法を提供する。符号化端においては、低帯域CNG雑音スペクトル又は高帯域CNG雑音スペクトルに関わらず、一般的に高調波構造が失われ、従ってCNG高帯域信号において、聴取に対して知覚的に有効であるのは主にCNG高帯域信号のエネルギであり、CNG高帯域信号のスペクトル構造ではない。従って、超広帯域信号のDTX送信では、多くの場合、SIDにおいて高帯域信号スペクトルを送信する必要はなく、適切な方法を用いて復号化端でローカルに高帯域スペクトルを構築すれば良い。ローカルに構築した高帯域スペクトルは、明らかな知覚的な歪みを生じない。このようにして、符号化端において高帯域スペクトルを計算及び符号化するための計算負荷及びビットが節約される。一方、他の雑音信号では、その高帯域信号に高調波構造が存在する場合があり、復号化端のみでローカルに高帯域スペクトルを構築することによってCNGセグメントと音声セグメントとの間の切り換えにおいて知覚的な品質低下の問題が生じる恐れがある。従って、かかる雑音では、SIDにおいてスペクトル・パラメータを送信する必要がある。効率及び品質の双方を考慮するDTX/CNGシステムは、背景雑音の高帯域特性に従って符号化端でSID内に高帯域スペクトル・パラメータを符号化すること、又は符号化しないこと、及び異なるタイプのSIDに応じて異なる復号化処理方法を用いることによって復号化端でCNGフレームを再構築する手段を適応的に選択可能でなければならないことがわかる。この実施形態では、オーディオ・データを処理するための方法が提供され、この方法は以下を含む。すなわち、雑音高帯域スペクトルを分析し分類する。デコーダは高帯域信号スペクトルを盲目的に構築する。SIDが高帯域エネルギ・パラメータを含まない場合、当該デコーダは高帯域信号エネルギを推定する。当該デコーダは異なるCNGモジュール間で切り換わる等である。特に図3を参照すると、この実施形態に従って符号化端(エンコーダ)においてオーディオ・データを処理するための方法は以下を含む。
この実施形態は、オーディオ・データを処理するための方法を提供する。符号化端(エンコーダ)での雑音信号の処理に比較すると、復号化端(デコーダ)は、受信したビット・ストリームに応じて、現在のフレームが符号化音声フレーム、又はSID、又はNO_DATAフレームのどれであるかを判定することができる。NO_DATAフレームは、符号化端が雑音期間においてSIDの符号化及び送出を行わないことを示すフレームである。現在のフレームがSIDである場合、デコーダは更に、SIDのビット数に応じて、SIDが低帯域及び/又は高帯域パラメータを含むことを判定することができる。任意選択的な構成としてデコーダは、SIDに挿入された特定の識別子に応じて、SIDが低帯域及び/又は高帯域パラメータを含むことを判定することができる。このためには、SIDを符号化した場合に追加の識別子ビットを加える必要がある。例えばSIDに第1の識別子が挿入された場合、これはSIDが高帯域パラメータのみを含むことを識別する。第2の識別子が挿入された場合、これはSIDが低帯域パラメータのみを含むことを識別する。第3の識別子が挿入された場合、これはSIDが高帯域パラメータ及び低帯域パラメータを含むことを識別する。現在のフレームが符号化音声フレームである場合、デコーダは音声フレームを復号化処理する。具体的な処理プロセスは従来技術のものと同様であり、この実施形態では詳細には説明しない。現在のフレームがSID又はNO_DATAフレームである場合、デコーダは、CNGの特定の動作状態に従って、CNフレームを再構築するための対応する方法を選択する。この実施形態では、CNGは2つの動作状態を有する。すなわち、小さいSIDフレームに対応する半復号化CNG状態すなわち第1のCNG状態と、大きいSIDフレームに対応する全復号CNG状態すなわち第2のCNG状態と、である。全復号化CNG状態において、デコーダは、大きいSIDフレームを復号化処理することによって取得した雑音高帯域パラメータ及び雑音低帯域パラメータに従ってCNフレームを再構築する。半復号化CNG状態において、デコーダは、小さいSIDフレームを復号化処理することによって取得した雑音低帯域パラメータ及びローカルに推定した雑音高帯域パラメータに従ってCNフレームを再構築する。復号化端における現在のフレームが大きいSIDフレームである場合、CNG動作状態フラグflagCNGが0である(半復号CNG状態を示す)ならば、CNG動作状態フラグflagCNGを1にセットする(全復号化CNG状態を示す)。他の場合、元の状態を不変のまま維持する。同様に、復号端における現在のフレームが小さいSIDフレームである場合、CNG作業状態フラグflagCNGが1であるならば、CNG動作状態フラグflagCNGを0にセットする。その他の場合、元の状態を不変のまま維持する。図4を参照すると、特にこの実施形態は、復号化端(デコーダ)においてオーディオ・データを処理するための方法を提供する。この方法は以下を含む。
次いでispd(i)、ed、lspd(i)、及びEdをバッファリングする。
e’CN=(1+0.000011・RND・eCN)・eCNである。ここで、RNDは〔−32767、32767〕の範囲内の乱数を表す。この実施形態では、320ポイント白色雑音シーケンスexc0(i)を生成する。ここでi=0、1、...319である。e’CNを用いてexc0(i)に利得調整を行ってexc’0(i)を取得する。すなわち、exc0(i)に利得係数G0を乗算するので、exc’0(i)のエネルギはe’CNに等しい。ここで
復号化処理によって取得した雑音低帯域パラメータに従って第1のCNフレームs’0の低帯域信号のエネルギE0を取得し、全復号化CNG状態における以前のCNフレームの高帯域信号のエネルギE1old及び低帯域信号のE0old及びE0に従って、SIDに対応する時点での雑音高帯域信号のエネルギE〜 1を推定する。ここで
この実施形態は、オーディオ・データを処理するための方法を提供する。実施形態2におけるオーディオ・データを処理するための方法と同じように、符号化端(エンコーダ)は、オーディオ信号の雑音フレームを取得し、雑音フレームを雑音低帯域信号及び雑音高帯域信号に分解する。しかしながら任意選択的な構成として、雑音フレームの高帯域信号が予め設定された符号化及び送信条件を満たすか否かを判定する処理動作が、雑音フレームの雑音高帯域信号のスペクトル構造が、雑音フレームの前の雑音高帯域信号の平均スペクトル構造に比べて、予め設定された条件を満たすか否かを判定し、これを満たす場合には第2のSIDを符号化するためのポリシーを用いることによって雑音フレームの雑音高帯域信号のSIDを符号化し、SIDを送出し、これを満たさない場合には雑音フレームの雑音高帯域信号の符号化及び送信を行う必要がないと判定する動作を含む。この実施形態では、雑音フレームの雑音高帯域信号のスペクトル構造が、雑音フレームの前の雑音高帯域信号の平均スペクトル構造に比べて、予め設定された条件を満たすか否かを判定することを、雑音高帯域信号の符号化及び送信を行うか否かを判定するための第3の条件として用いる。
図5を参照すると、この実施形態は、オーディオ・データを符号化するための装置を提供する。この装置は取得モジュール501及び送信モジュール502を含む。
雑音高帯域信号が予め設定されたスペクトル構造を有するか否かを判定し、これを有すると共に第2のSIDを送出するためのポリシーの送出条件を満たす場合は、第2のSIDを符号化するためのポリシーを用いることによって雑音高帯域信号のIDを符号化し、SIDを送出し、これを有しない場合は、雑音高帯域信号の符号化及び送信を行う必要がないと判定するように構成された第1の送信ユニット502aを含む。
雑音高帯域信号のスペクトルを取得し、スペクトルを少なくとも2つのサブバンドに分割し、サブバンド内のいずれの第1のサブバンドの平均エネルギがサブバンド内の第2のサブバンドの平均エネルギよりも低くない場合は雑音高帯域信号が予め設定されたスペクトル構造を有しないことを確定し、他の場合は雑音高帯域信号が予め設定されたスペクトル構造を有することを確定するように構成され、第2のサブバンドが位置する周波数帯域が第1のサブバンドが位置する周波数帯域よりも高い、第1の判定サブユニットを含む。
第1の比率及び第2の比率に従って偏差程度値を発生し、第1の比率が、雑音フレームの雑音低帯域信号のエネルギに対する雑音フレームの雑音高帯域信号のエネルギの比率であり、第2の比率が、雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した時点での雑音低帯域信号のエネルギに対する雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した時点での雑音高帯域信号のエネルギの比率であり、更に、偏差程度値が予め設定された閾値に達したか否かを判定し、これに達した場合は第2のSIDを符号化するためのポリシーを用いることによって雑音高帯域信号のSIDを符号化し、SIDを送出し、達しない場合は雑音高帯域信号の符号化及び送信を行う必要がないと判定するように構成された第2の送信ユニット502bを含む。
第1の比率が、雑音フレームの雑音低帯域信号の瞬時エネルギに対する雑音フレームの雑音高帯域信号の瞬時エネルギの比率であることを含み、更に、
これに対応して、第2の比率が、雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した時点での雑音低帯域信号のエネルギに対する雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した前記時点での雑音高帯域信号のエネルギの比率であることが、
第2の比率が、雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した前記時点での雑音低帯域信号の瞬時エネルギに対する雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した前記時点での雑音高帯域信号の瞬時エネルギの比率であることを含む。
第1の比率が、雑音フレーム及びこの雑音フレームの前の雑音フレームの雑音低帯域信号の加重平均エネルギに対する雑音フレーム及びこの雑音フレームの前の雑音フレームの雑音高帯域信号の加重平均エネルギの比率であることを含み、更に、
これに対応して、第2の比率が、雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した時点での雑音低帯域信号のエネルギに対する雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した前記時点での雑音高帯域信号のエネルギの比率であることが、
第2の比率が、雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した前記時点での雑音フレーム及び雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した前記時点でのこの雑音フレームの前の雑音フレームの低帯域信号の加重平均エネルギに対する雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した前記時点での雑音フレーム及び雑音高帯域パラメータを含むSIDを雑音フレームの前に最後に送出した前記時点でのこの雑音フレームの前の雑音フレームの高帯域信号の加重平均エネルギの比率であることを含む。
第1の比率の対数値及び第2の比率の対数値を別個に計算し、第1の比率の対数値と第2の比率の対数値との間の差の絶対値を計算して偏差程度値を取得するように構成された計算サブユニットを含む。
雑音フレームの雑音高帯域信号のスペクトル構造が、雑音フレームの前の雑音高帯域信号の平均スペクトル構造に比べて、予め設定された条件を満たすか否かを判定し、これを満たす場合は第2のSIDを符号化するためのポリシーを用いることによって雑音フレームの雑音高帯域信号のSIDを符号化し、SIDを送出し、これを満たさない場合は雑音フレームの雑音高帯域信号の符号化及び送信を行う必要がないと判定するように構成された第3の送信ユニット502cを含む。
図7を参照すると、この実施形態は、オーディオ・データを復号化するための装置を提供する。この装置は、取得モジュール601、第1の復号化モジュール602、第2の復号化モジュール603、及び第3の復号化モジュール604を含む。
SIDのビット数が予め設定された第1の閾値よりも小さい場合、SIDが高帯域パラメータを含むことを確定し、SIDのビット数が予め設定された第1の閾値よりも大きく予め設定された第2の閾値よりも小さい場合、SIDが低帯域パラメータを含むことを確定し、SIDのビット数が予め設定された第2の閾値よりも大きく予め設定された第3の閾値よりも小さい場合、SIDが高帯域パラメータ及び低帯域パラメータを含むことを確定するように構成された第1の確定ユニット、又は、
SIDが第1の識別子を含む場合、SIDが高帯域パラメータを含むことを確定し、SIDが第2の識別子を含む場合、SIDが低帯域パラメータを含むことを確定し、SIDが第3の識別子を含む場合、SIDが低帯域パラメータ及び高帯域パラメータを含むことを確定するように構成された第2の確定ユニット、
を含む。
SIDに対応する時点での雑音高帯域信号の加重平均エネルギ及び雑音高帯域信号の合成フィルタ係数を別個に取得するように構成された第1の取得ユニットと、
SIDに対応する時点での雑音高帯域信号の取得した加重平均エネルギ及び雑音高帯域信号の取得した合成フィルタ係数に従って雑音高帯域信号を取得するように構成された第2の取得ユニットと、
を含む。
復号によって取得した雑音低帯域パラメータに従って第1のCNフレームの低帯域信号のエネルギを取得するように構成された第1の取得サブユニットと、
高帯域パラメータを含むSIDをSIDの前に受信した時点での雑音低帯域信号のエネルギに対する雑音高帯域信号のエネルギの比率を計算して第1の比率を取得するように構成された計算サブユニットと、
第1のCNフレームの低帯域信号のエネルギ及び第1の比率に従って、SIDに対応する時点での雑音高帯域信号のエネルギを取得するように構成された第2の取得サブユニットと、
SIDに対応する時点での雑音高帯域信号のエネルギ及びローカルにバッファリングされたCNフレームの高帯域信号のエネルギに対して加重平均を実行して、SIDに対応する時点での雑音高帯域信号の加重平均エネルギを取得するように構成された第3の取得サブユニットであって、SIDに対応する時点での雑音高帯域信号の加重平均エネルギが第1のCNフレームの高帯域信号エネルギである、第3の取得サブユニットと、
を含む。
高帯域パラメータを含むSIDをSIDの前に受信した時点での雑音低帯域信号の瞬時エネルギに対する雑音高帯域信号の瞬時エネルギの比率を計算して第1の比率を取得する、又は、
高帯域パラメータを含むSIDをSIDの前に受信した時点での雑音低帯域信号の加重平均エネルギに対する雑音高帯域信号の加重平均エネルギの比率を計算して第1の比率を取得する、
ように構成されている。
SIDの前の予め設定された時間期間内の音声フレームから、最小の高帯域信号エネルギを有する音声フレームの高帯域信号を選択し、音声フレーム中で最小の高帯域信号エネルギを有する音声フレームの高帯域信号のエネルギに従って、SIDに対応する時点での雑音高帯域信号の加重平均エネルギを取得するように構成された第1の選択サブユニットであって、SIDに対応する時点での雑音高帯域信号の加重平均エネルギが第1のCNフレームの高帯域信号エネルギである、第1の選択サブユニット、又は、
SIDの前の予め設定された時間期間内の音声フレームから、予め設定された閾値よりも小さい高帯域信号エネルギを有するN個の音声フレームの高帯域信号を選択し、N個の音声フレームの高帯域信号の加重平均エネルギに従って、SIDに対応する時点での雑音高帯域信号の加重平均エネルギを取得するように構成された第2の選択ユニットであって、SIDに対応する時点での雑音高帯域信号の加重平均エネルギが第1のCNフレームの高帯域信号エネルギである、第2の選択ユニット、
を含む。
高帯域信号に対応する周波数範囲に、M個のイミタンス・スペクトル周波数ISF係数又はイミタンス・スペクトル対ISP係数又は線スペクトル周波数LSF係数又は線スペクトル対LSP係数を分散させるように構成された分散サブユニットと、
M個の係数にランダム化処理を実行するように構成された第1のランダム化処理サブユニットであって、ランダム化の特性が、M個の係数中の各係数を各係数に対応する目標値に徐々に近付かせるものであり、目標値が係数値に隣接した予め設定された範囲内の値であり、M個の係数中の各係数の目標値がN個のフレームごとに変化し、M及びNの双方が自然数である、第1のランダム化処理サブユニットと、
ランダム化処理によって取得したフィルタ係数に従って、SIDに対応する時点での雑音高帯域信号の合成フィルタ係数を取得するように構成された第4の取得サブユニットと、
を含む。
ローカルにバッファリングされた雑音高帯域信号のM個のISF係数又はISP係数又はLSF係数又はLSP係数を取得するように構成された第5の取得サブユニットと、
M個の係数にランダム化処理を実行するように構成された第2のランダム化処理サブユニットであって、ランダム化の特性が、M個の係数中の各係数を各係数に対応する目標値に徐々に近付かせるものであり、目標値が係数値に隣接した予め設定された範囲内の値であり、M個の係数中の各係数の目標値がN個のフレームごとに変化する、第2のランダム化処理サブユニットと、
ランダム化処理によって取得したフィルタ係数に従って、SIDに対応する時点での雑音高帯域信号の合成フィルタ係数を取得するように構成された第6の取得サブユニットと、
を含む。
第1の復号化モジュール602が第1のCNフレームを取得することの前に、SIDに隣接した履歴フレームが符号化音声フレームである場合、符号化音声フレームから復号された高帯域信号又は高帯域信号の一部の平均エネルギが、ローカルに発生した雑音高帯域信号又は雑音高帯域信号の一部の平均エネルギよりも小さいならば、SIDから開始して以降のL個のフレームの雑音高帯域信号を1よりも小さい平滑化係数で乗算して、ローカルに発生した雑音高帯域信号の新しい加重平均エネルギを取得するように構成された最適化モジュール605を更に含む。
図9を参照すると、この実施形態は、オーディオ・データを処理するための方法を提供する。このシステムは、オーディオ・データを符号化するための前述の装置500及びオーディオ・データを復号化するための前述の装置600を含む。
Claims (27)
- オーディオ・データを処理するための方法であって、
オーディオ信号の現在の雑音フレームから現在の雑音低帯域信号及び現在の雑音高帯域信号を生成するステップと、
第1の比率及び第2の比率に基づいて偏差を発生するステップであって、前記第1の比率は、前記現在の雑音高帯域信号のエネルギに対する前記現在の雑音低帯域信号のエネルギの比率を表わし、前記第2の比率は、前の時点での前の雑音高帯域信号のエネルギに対する前記前の時点での前の雑音低帯域信号のエネルギの比率を表わし、前記前の時点は、雑音高帯域パラメータを含む前記オーディオ信号の無音挿入記述子(SID)が前記現在の雑音フレームの前に送られた最後の時点に対応する、ステップと、
生成された前記偏差が予め設定された閾値より大きいかどうかを判定するステップと、
生成された前記偏差が前記予め設定された閾値より大きいときは、前記現在の雑音低帯域信号の雑音低帯域パラメータ及び前記現在の雑音高帯域信号の雑音高帯域パラメータを含む第1のSIDを符号化するステップと、
生成された前記偏差が前記予め設定された閾値より大きくないときは、前記現在の雑音低帯域信号の前記雑音低帯域パラメータを含み、かつ前記現在の雑音高帯域信号の雑音高帯域パラメータを含まない第2のSIDを符号化するステップと、
生成された前記偏差が前記予め設定された閾値より大きくないときは、前記第2のSIDを送信するステップとを含む、
方法。 - 前記現在の雑音低帯域信号のエネルギは前記現在の雑音低帯域信号の平滑化された平均エネルギを表わし、前記現在の雑音高帯域信号のエネルギは前記現在の雑音高帯域信号の平滑化された平均エネルギを表わし、前記前の時点での前記前の雑音低帯域信号のエネルギは前記前の時点での前記前の雑音低帯域信号の平滑化された平均エネルギを表わし、前記前の時点での前記前の雑音高帯域信号のエネルギは前記前の時点での前記前の雑音高帯域信号の平滑化された平均エネルギを表わす、請求項1記載の方法。
- 前記現在の雑音低帯域信号の前記平滑化された平均エネルギは、前記前の時点での前記前の雑音低帯域信号の前記平滑化された平均エネルギ及び前記現在の雑音低帯域信号の平均エネルギに基づいて得られ、前記現在の雑音高帯域信号の前記平滑化された平均エネルギは、前記前の時点での前記前の雑音高帯域信号の前記平滑化された平均エネルギ及び前記現在の雑音高帯域信号の平均エネルギに基づいて得られる、請求項2記載の方法。
- 前記現在の雑音低帯域信号の前記平滑化された平均エネルギは対数領域で得られ、前記現在の雑音高帯域信号の前記平滑化された平均エネルギは対数領域で得られる、請求項2記載の方法。
- 前記第1の比率及び前記第2の比率に基づいて前記偏差を発生することが、
前記第1の比率の対数値及び前記第2の比率の対数値を別個に計算する動作と、
前記第1の比率の前記対数値と前記第2の比率の前記対数値との間の差の絶対値を計算して前記偏差を取得する動作と、
を含む、請求項1ないし4のうちいずれか一項記載の方法。 - 前記第1の比率の前記対数値が:
前記現在の雑音低帯域信号の平滑化された平均エネルギの対数値を取得し、
前記現在の雑音高帯域信号の平滑化された平均エネルギの対数値を取得し、
前記現在の雑音低帯域信号の前記平滑化された平均エネルギの前記対数値と前記現在の雑音高帯域信号の平滑化された平均エネルギの前記対数値との間の差を計算することによって、前記第1の比率の前記対数値を取得することによって計算される、
請求項5記載の方法。 - 前記第2の比率の前記対数値が:
前記前の時点での前記前の雑音低帯域信号の平滑化された平均エネルギの対数値を取得し、
前記前の時点での前記前の雑音高帯域信号の平滑化された平均エネルギの対数値を取得し、
前記前の時点での前記前の雑音低帯域信号の平滑化された平均エネルギの前記対数値と前記前の時点での前記前の雑音高帯域信号の平滑化された平均エネルギの前記対数値との間の差を計算することによって、前記第1の比率の前記対数値を取得することによって計算される、
請求項5記載の方法。 - オーディオ・データを処理するための方法であって、
デコーダによって、現在の無音挿入記述子(SID)を取得するステップであって、前記現在のSIDは雑音低帯域パラメータを含む、ステップ;
前記現在のSIDが雑音高帯域パラメータを含むかどうかを判定するステップ;
前記現在のSIDが前記雑音高帯域パラメータを含まないとき、前記現在のSIDを復号化して、前記雑音低帯域パラメータを取得するステップと;
前記現在のSIDが前記雑音高帯域パラメータを含まないとき、雑音高帯域パラメータを外挿するステップと;
前記現在のSIDが前記雑音高帯域パラメータを含まないとき、前記復号化された雑音低帯域パラメータ及び前記外挿された雑音高帯域パラメータに基づいて第1の快適雑音(CN)フレームを取得するステップ;
前記現在のSIDが前記雑音高帯域パラメータを含むとき、前記現在のSIDを復号化して、前記雑音高帯域パラメータ及び前記雑音低帯域パラメータを取得するステップと;
前記現在のSIDが前記雑音高帯域パラメータを含むとき、前記復号化された雑音高帯域パラメータ及び前記復号化された雑音低帯域に基づいて第2のCNフレームを取得するステップとを含む、
方法。 - 前記現在のSIDが雑音高帯域パラメータを含むかどうかを判定することが:
前記現在のSIDが第1の識別子を含むときに前記現在のSIDが前記雑音高帯域パラメータを含むと判定し;
前記現在のSIDが第2の識別子を含むときに前記現在のSIDが前記雑音高帯域パラメータを含まないと判定することを含み、
前記第1の識別子及び前記第2の識別子は前記現在のSIDの一つのビットによって指示される、
請求項8記載の方法。 - 前記雑音高帯域パラメータを外挿することが:
前記現在のSIDに対応する現在の時点での雑音高帯域信号の加重平均エネルギを取得し;
前記現在の時点での前記雑音高帯域信号の合成フィルタ係数を取得し;
前記現在の時点での前記雑音高帯域信号の前記取得した加重平均エネルギ及び前記現在の時点での前記雑音高帯域信号の前記取得した合成フィルタ係数に基づいて前記雑音高帯域信号を取得することを含む、
請求項8記載の方法。 - 前記現在の時点での前記雑音高帯域信号の前記加重平均エネルギを前記取得することが、
復号化された前記雑音低帯域パラメータに基づいて前記第1のCNフレームの低帯域信号のエネルギを取得する動作と、
前の時点での雑音低帯域信号のエネルギに対する前記前の時点での雑音高帯域信号のエネルギの比率を表わす第1の比率を計算する動作であって、前記前の時点は、雑音高帯域パラメータを含む前のSIDが前記現在のSIDの前に受領された最後の時点に対応する、動作と、
前記第1のCNフレームの前記低帯域信号の前記エネルギ及び前記第1の比率に基づいて、前記現在の時点での前記雑音高帯域信号のエネルギを取得する動作と、
前記現在の時点での前記雑音高帯域信号の前記エネルギ及びローカルにバッファリングされたCNフレームの高帯域信号のエネルギに対して加重平均を実行して、前記現在の時点での前記雑音高帯域信号の前記加重平均エネルギを取得する動作であって、前記現在の時点での前記雑音高帯域信号の前記加重平均エネルギが前記第1のCNフレームの高帯域信号エネルギに対応する、動作と、
を含む、請求項10記載の方法。 - 前記第1の比率を取得することが、
前記前の時点での前記雑音低帯域信号の加重平均エネルギに対する前記前の時点での前記雑音高帯域信号の加重平均エネルギの比率を計算すること、又は、
前記前の時点での前記雑音低帯域信号の瞬時エネルギに対する前記前の時点での前記雑音高帯域信号の瞬時エネルギの比率を計算することを含む、
請求項11記載の方法。 - 前記第1のCNフレームを取得するのに先立って、前記方法がさらに、
前記現在のSIDに隣接した履歴フレームが符号化音声フレームである場合、前記符号化音声フレームから復号化された高帯域信号の一部又は高帯域信号の平均エネルギが、外挿された前記雑音高帯域信号又は雑音高帯域信号の平均エネルギよりも小さいならば、前記現在のSIDから開始して以降のL個のフレームの雑音高帯域信号に0よりも大きく1よりも小さい平滑化係数を乗算して、前記外挿された雑音高帯域信号の新しい加重平均エネルギを取得するステップを含み、
前記第1のCNフレームを取得することが、
復号化された前記雑音低帯域パラメータ、前記現在の時点での前記雑音高帯域信号の前記合成フィルタ係数、及び前記外挿された雑音高帯域信号の前記新しい加重平均エネルギに基づいて、前記第1のCNフレームを取得することを含む、請求項10記載の方法。 - コンピュータ実行可能命令を記憶している非一時的なメモリと;
前記非一時的なメモリに動作上結合されたプロセッサとを有するエンコーダであって、前記プロセッサは前記コンピュータ実行可能命令を実行して:
オーディオ信号の現在の雑音フレームから現在の雑音低帯域信号及び現在の雑音高帯域信号を生成するステップと、
第1の比率及び第2の比率に基づいて偏差を発生するステップであって、前記第1の比率は、前記現在の雑音高帯域信号のエネルギに対する前記現在の雑音低帯域信号のエネルギの比率を表わし、前記第2の比率は、前の時点での前の雑音高帯域信号のエネルギに対する前記前の時点での前の雑音低帯域信号のエネルギの比率を表わし、前記前の時点は、雑音高帯域パラメータを含む前記オーディオ信号の無音挿入記述子(SID)が前記現在の雑音フレームの前に送られた最後の時点に対応する、ステップと、
生成された前記偏差が予め設定された閾値より大きいかどうかを判定するステップと、
生成された前記偏差が前記予め設定された閾値より大きいときは、前記現在の雑音低帯域信号の雑音低帯域パラメータ及び前記現在の雑音高帯域信号の雑音高帯域パラメータを含む第1のSIDを符号化するステップと、
生成された前記偏差が前記予め設定された閾値より大きいときは、前記第1のSIDを送信するステップと、
生成された前記偏差が前記予め設定された閾値より大きくないときは、前記現在の雑音低帯域信号の前記雑音低帯域パラメータを含み、かつ前記現在の雑音高帯域信号の雑音高帯域パラメータを含まない第2のSIDを符号化するステップと、
生成された前記偏差が前記予め設定された閾値より大きくないときは、前記第2のSIDを送信するステップとを実行するよう構成されている、
エンコーダ。 - 前記現在の雑音低帯域信号のエネルギは前記現在の雑音低帯域信号の平滑化された平均エネルギを表わし、前記現在の雑音高帯域信号のエネルギは前記現在の雑音高帯域信号の平滑化された平均エネルギを表わし、前記前の時点での前記前の雑音低帯域信号のエネルギは前記前の時点での前記前の雑音低帯域信号の平滑化された平均エネルギを表わし、前記前の時点での前記前の雑音高帯域信号のエネルギは前記前の時点での前記前の雑音高帯域信号の平滑化された平均エネルギー表わす、請求項14記載のエンコーダ。
- 前記現在の雑音低帯域信号の前記平滑化された平均エネルギは、前記前の時点での前記前の雑音低帯域信号の前記平滑化された平均エネルギ及び前記現在の雑音低帯域信号の平均エネルギに基づいて得られ、前記現在の雑音高帯域信号の前記平滑化された平均エネルギは、前記前の時点での前記前の雑音高帯域信号の前記平滑化された平均エネルギ及び前記現在の雑音高帯域信号の平均エネルギに基づいて得られる、請求項15記載のエンコーダ。
- 前記現在の雑音低帯域信号の前記平滑化された平均エネルギは対数領域で得られ、前記現在の雑音高帯域信号の前記平滑化された平均エネルギは対数領域で得られる、請求項16記載のエンコーダ。
- 前記プロセッサが:
前記第1の比率の対数値及び前記第2の比率の対数値を別個に計算し、
前記第1の比率の前記対数値と前記第2の比率の前記対数値との間の差の絶対値を計算して前記偏差を取得するよう構成されている、
請求項14ないし17のうちいずれか一項記載のエンコーダ。 - 前記プロセッサが:
前記現在の雑音低帯域信号の平滑化された平均エネルギの対数値を取得し、
前記現在の雑音高帯域信号の平滑化された平均エネルギの対数値を取得し、
前記現在の雑音低帯域信号の前記平滑化された平均エネルギの前記対数値と前記現在の雑音高帯域信号の平滑化された平均エネルギの前記対数値との間の差を計算することによって、前記第1の比率の前記対数値を取得するよう構成されている、
請求項18記載のエンコーダ。 - 前記プロセッサが:
前記前の時点での前記前の雑音低帯域信号の平滑化された平均エネルギの対数値を取得し、
前記前の時点での前記前の雑音高帯域信号の平滑化された平均エネルギの対数値を取得し、
前記前の時点での前記前の雑音低帯域信号の平滑化された平均エネルギの前記対数値と前記前の時点での前記前の雑音高帯域信号の平滑化された平均エネルギの前記対数値との間の差を計算することによって、前記第1の比率の前記対数値を取得するよう構成されている、
請求項18記載のエンコーダ。 - コンピュータ実行可能命令を記憶している非一時的なメモリと;
前記非一時的なメモリに動作上結合されたプロセッサとを有するデコーダであって、前記プロセッサは前記コンピュータ実行可能命令を実行して:
現在の無音挿入記述子(SID)を取得するステップであって、前記現在のSIDは雑音低帯域パラメータを含む、ステップ;
前記現在のSIDが雑音高帯域パラメータを含むかどうかを判定するステップ;
前記現在のSIDが前記雑音高帯域パラメータを含まないとき、前記現在のSIDを復号化して、前記雑音低帯域パラメータを取得するステップと;
前記現在のSIDが前記雑音高帯域パラメータを含まないとき、雑音高帯域パラメータを外挿するステップと;
前記現在のSIDが前記雑音高帯域パラメータを含まないとき、前記復号化された雑音低帯域パラメータ及び前記外挿された雑音高帯域パラメータに基づいて第1の快適雑音(CN)フレームを取得するステップ;
前記現在のSIDが前記雑音高帯域パラメータ及び前記雑音低帯域パラメータを含むとき、前記現在のSIDを復号化して、前記雑音高帯域パラメータ及び前記雑音低帯域パラメータを取得するステップと;
前記現在のSIDが前記雑音高帯域パラメータ及び前記雑音低帯域パラメータを含むとき、前記復号化された雑音高帯域パラメータ及び前記復号化された雑音低帯域に基づいて第2のCNフレームを取得するステップとを実行するよう構成されている、
デコーダ。 - 前記プロセッサがさらに:
前記現在のSIDが第1の識別子を含むときに前記現在のSIDが前記雑音高帯域パラメータを含むと判定し;
前記現在のSIDが第2の識別子を含むときに前記現在のSIDが前記雑音高帯域パラメータを含まないと判定するよう構成されており、
前記第1の識別子及び前記第2の識別子は前記現在のSIDの一つのビットによって指示される、
請求項21記載のデコーダ。 - 前記プロセッサがさらに:
前記現在のSIDに対応する現在の時点での雑音高帯域信号の加重平均エネルギを取得し;
前記現在の時点での前記雑音高帯域信号の合成フィルタ係数を取得し;
前記現在の時点での前記雑音高帯域信号の前記取得した加重平均エネルギ及び前記現在の時点での前記雑音高帯域信号の前記取得した合成フィルタ係数に基づいて前記雑音高帯域信号を取得するよう構成されている、
請求項21記載のデコーダ。 - 前記プロセッサがさらに:
復号化された前記雑音低帯域パラメータに基づいて前記第1のCNフレームの低帯域信号のエネルギを取得する動作と、
前の時点での雑音低帯域信号のエネルギに対する前記前の時点での雑音高帯域信号のエネルギの比率を表わす第1の比率を計算する動作であって、前記前の時点は、雑音高帯域パラメータを含む前のSIDが前記現在のSIDの前に受領された最後の時点に対応する、動作と、
前記第1のCNフレームの前記低帯域信号の前記エネルギ及び前記第1の比率に基づいて、前記現在の時点での前記雑音高帯域信号のエネルギを取得する動作と、
前記現在の時点での前記雑音高帯域信号の前記エネルギ及びローカルにバッファリングされたCNフレームの高帯域信号のエネルギに対して加重平均を実行して、前記現在の時点での前記雑音高帯域信号の前記加重平均エネルギを取得する動作であって、前記現在の時点での前記雑音高帯域信号の前記加重平均エネルギが前記第1のCNフレームの高帯域信号エネルギに対応する、動作とを実行するよう構成されている、
請求項23記載のデコーダ。 - 前記プロセッサがさらに:
前記前の時点での前記雑音低帯域信号の加重平均エネルギに対する前記前の時点での前記雑音高帯域信号の加重平均エネルギの比率を前記第1の比率として計算する、又は、
前記前の時点での前記雑音低帯域信号の瞬時エネルギに対する前記前の時点での前記雑音高帯域信号の瞬時エネルギの比率を前記第1の比率として計算する
よう構成されている、請求項24記載のデコーダ。 - 前記プロセッサがさらに:
前記現在のSIDに隣接した履歴フレームが符号化音声フレームである場合、前記符号化音声フレームから復号化された高帯域信号の一部又は高帯域信号の平均エネルギが、外挿された前記雑音高帯域信号又は雑音高帯域信号の平均エネルギよりも小さいならば、前記現在のSIDから開始して以降のL個のフレームの雑音高帯域信号に0よりも大きく1よりも小さい平滑化係数を乗算して、前記外挿された雑音高帯域信号の新しい加重平均エネルギを取得し、
復号化された前記雑音低帯域パラメータ、前記現在の時点での前記雑音高帯域信号の前記合成フィルタ係数、及び前記外挿された雑音高帯域信号の前記新しい加重平均エネルギに基づいて、前記第1のCNフレームを取得するよう構成されている、
請求項23記載のデコーダ。 - コンピュータによって実行されたときに該コンピュータに請求項1乃至13の中のいずれか1項に記載されたステップを実行させるプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201110455836.7A CN103187065B (zh) | 2011-12-30 | 2011-12-30 | 音频数据的处理方法、装置和系统 |
CN201110455836.7 | 2011-12-30 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014549344A Division JP6072068B2 (ja) | 2011-12-30 | 2012-12-28 | オーディオ・データを処理するための方法、装置、及びシステム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017062512A true JP2017062512A (ja) | 2017-03-30 |
JP6462653B2 JP6462653B2 (ja) | 2019-01-30 |
Family
ID=48678198
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014549344A Active JP6072068B2 (ja) | 2011-12-30 | 2012-12-28 | オーディオ・データを処理するための方法、装置、及びシステム |
JP2016252612A Active JP6462653B2 (ja) | 2011-12-30 | 2016-12-27 | オーディオ・データを処理するための方法、装置、及びシステム |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014549344A Active JP6072068B2 (ja) | 2011-12-30 | 2012-12-28 | オーディオ・データを処理するための方法、装置、及びシステム |
Country Status (18)
Country | Link |
---|---|
US (6) | US9406304B2 (ja) |
EP (1) | EP2793227B1 (ja) |
JP (2) | JP6072068B2 (ja) |
KR (2) | KR101770237B1 (ja) |
CN (1) | CN103187065B (ja) |
AU (1) | AU2012361423B2 (ja) |
BR (1) | BR112014016153B1 (ja) |
CA (3) | CA3059322C (ja) |
ES (1) | ES2610783T3 (ja) |
HK (1) | HK1199543A1 (ja) |
IN (1) | IN2014KN01436A (ja) |
MX (1) | MX338445B (ja) |
MY (1) | MY173976A (ja) |
PT (1) | PT2793227T (ja) |
RU (3) | RU2617926C1 (ja) |
SG (2) | SG10201609338SA (ja) |
WO (1) | WO2013097764A1 (ja) |
ZA (2) | ZA201404996B (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103187065B (zh) * | 2011-12-30 | 2015-12-16 | 华为技术有限公司 | 音频数据的处理方法、装置和系统 |
CN106169297B (zh) * | 2013-05-30 | 2019-04-19 | 华为技术有限公司 | 信号编码方法及设备 |
US9136763B2 (en) * | 2013-06-18 | 2015-09-15 | Intersil Americas LLC | Audio frequency deadband system and method for switch mode regulators operating in discontinuous conduction mode |
CN111710342B (zh) * | 2014-03-31 | 2024-04-16 | 弗朗霍弗应用研究促进协会 | 编码装置、解码装置、编码方法、解码方法及程序 |
US10163453B2 (en) * | 2014-10-24 | 2018-12-25 | Staton Techiya, Llc | Robust voice activity detector system for use with an earphone |
GB2532041B (en) * | 2014-11-06 | 2019-05-29 | Imagination Tech Ltd | Comfort noise generation |
CN105681512B (zh) * | 2016-02-25 | 2019-02-01 | Oppo广东移动通信有限公司 | 一种降低语音通话功耗的方法及装置 |
CN105721656B (zh) * | 2016-03-17 | 2018-10-12 | 北京小米移动软件有限公司 | 背景噪声生成方法及装置 |
ES2745018T3 (es) | 2016-12-12 | 2020-02-27 | Kyynel Oy | Procedimiento versátil de selección de canal para red inalámbrica |
US10504538B2 (en) * | 2017-06-01 | 2019-12-10 | Sorenson Ip Holdings, Llc | Noise reduction by application of two thresholds in each frequency band in audio signals |
US10540983B2 (en) * | 2017-06-01 | 2020-01-21 | Sorenson Ip Holdings, Llc | Detecting and reducing feedback |
GB2595891A (en) * | 2020-06-10 | 2021-12-15 | Nokia Technologies Oy | Adapting multi-source inputs for constant rate encoding |
CN113571072B (zh) * | 2021-09-26 | 2021-12-14 | 腾讯科技(深圳)有限公司 | 一种语音编码方法、装置、设备、存储介质及产品 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004537739A (ja) * | 2000-10-18 | 2004-12-16 | ノキア コーポレーション | 音声コーデックにおける擬似高帯域信号の推定方法およびシステム |
JP2008139447A (ja) * | 2006-11-30 | 2008-06-19 | Mitsubishi Electric Corp | 音声符号化装置及び音声復号装置 |
US20080195383A1 (en) * | 2007-02-14 | 2008-08-14 | Mindspeed Technologies, Inc. | Embedded silence and background noise compression |
JP2009545779A (ja) * | 2006-07-31 | 2009-12-24 | クゥアルコム・インコーポレイテッド | 信号変化検出のためのシステム、方法、および装置 |
JP2011502287A (ja) * | 2007-11-02 | 2011-01-20 | 華為技術有限公司 | 音声復号化方法及び装置 |
JP2011514561A (ja) * | 2008-03-20 | 2011-05-06 | 華為技術有限公司 | 背景雑音生成方法および雑音処理装置 |
Family Cites Families (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7103065B1 (en) * | 1998-10-30 | 2006-09-05 | Broadcom Corporation | Data packet fragmentation in a cable modem system |
US6424938B1 (en) | 1998-11-23 | 2002-07-23 | Telefonaktiebolaget L M Ericsson | Complex signal activity detection for improved speech/noise classification of an audio signal |
EP1133886B1 (en) * | 1998-11-24 | 2008-03-12 | Telefonaktiebolaget LM Ericsson (publ) | Efficient in-band signaling for discontinuous transmission and configuration changes in adaptive multi-rate communications systems |
US6549587B1 (en) * | 1999-09-20 | 2003-04-15 | Broadcom Corporation | Voice and data exchange over a packet based network with timing recovery |
US6782360B1 (en) * | 1999-09-22 | 2004-08-24 | Mindspeed Technologies, Inc. | Gain quantization for a CELP speech coder |
AU1359601A (en) * | 1999-11-03 | 2001-05-14 | Tellabs Operations, Inc. | Integrated voice processing system for packet networks |
FI116643B (fi) * | 1999-11-15 | 2006-01-13 | Nokia Corp | Kohinan vaimennus |
US7920697B2 (en) | 1999-12-09 | 2011-04-05 | Broadcom Corp. | Interaction between echo canceller and packet voice processing |
US6615169B1 (en) * | 2000-10-18 | 2003-09-02 | Nokia Corporation | High frequency enhancement layer coding in wideband speech codec |
US6691805B2 (en) | 2001-08-27 | 2004-02-17 | Halliburton Energy Services, Inc. | Electrically conductive oil-based mud |
US7319703B2 (en) * | 2001-09-04 | 2008-01-15 | Nokia Corporation | Method and apparatus for reducing synchronization delay in packet-based voice terminals by resynchronizing during talk spurts |
US20030093270A1 (en) * | 2001-11-13 | 2003-05-15 | Domer Steven M. | Comfort noise including recorded noise |
CA2392640A1 (en) * | 2002-07-05 | 2004-01-05 | Voiceage Corporation | A method and device for efficient in-based dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems |
FR2859566B1 (fr) * | 2003-09-05 | 2010-11-05 | Eads Telecom | Procede de transmission d'un flux d'information par insertion a l'interieur d'un flux de donnees de parole, et codec parametrique pour sa mise en oeuvre |
JP4572123B2 (ja) * | 2005-02-28 | 2010-10-27 | 日本電気株式会社 | 音源供給装置及び音源供給方法 |
CN101087319B (zh) * | 2006-06-05 | 2012-01-04 | 华为技术有限公司 | 一种发送和接收背景噪声的方法和装置及静音压缩系统 |
US7809559B2 (en) * | 2006-07-24 | 2010-10-05 | Motorola, Inc. | Method and apparatus for removing from an audio signal periodic noise pulses representable as signals combined by convolution |
US8260609B2 (en) | 2006-07-31 | 2012-09-04 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband encoding and decoding of inactive frames |
CN101246688B (zh) | 2007-02-14 | 2011-01-12 | 华为技术有限公司 | 一种对背景噪声信号进行编解码的方法、系统和装置 |
CN101320563B (zh) * | 2007-06-05 | 2012-06-27 | 华为技术有限公司 | 一种背景噪声编码/解码装置、方法和通信设备 |
CN100555414C (zh) * | 2007-11-02 | 2009-10-28 | 华为技术有限公司 | 一种dtx判决方法和装置 |
DE102008009718A1 (de) * | 2008-02-19 | 2009-08-20 | Siemens Enterprise Communications Gmbh & Co. Kg | Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen |
DE102008009719A1 (de) | 2008-02-19 | 2009-08-20 | Siemens Enterprise Communications Gmbh & Co. Kg | Verfahren und Mittel zur Enkodierung von Hintergrundrauschinformationen |
CN101335000B (zh) | 2008-03-26 | 2010-04-21 | 华为技术有限公司 | 编码的方法及装置 |
CN102792760B (zh) * | 2010-02-25 | 2015-08-12 | 瑞典爱立信有限公司 | 为音乐关闭dtx |
US20110228946A1 (en) * | 2010-03-22 | 2011-09-22 | Dsp Group Ltd. | Comfort noise generation method and system |
JP2012215198A (ja) * | 2011-03-31 | 2012-11-08 | Showa Corp | 回転構造体 |
CN103187065B (zh) * | 2011-12-30 | 2015-12-16 | 华为技术有限公司 | 音频数据的处理方法、装置和系统 |
JP6180544B2 (ja) * | 2012-12-21 | 2017-08-16 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | オーディオ信号の不連続伝送における高スペクトル−時間分解能を持つコンフォートノイズの生成 |
-
2011
- 2011-12-30 CN CN201110455836.7A patent/CN103187065B/zh active Active
-
2012
- 2012-12-28 CA CA3059322A patent/CA3059322C/en active Active
- 2012-12-28 KR KR1020167036611A patent/KR101770237B1/ko active IP Right Grant
- 2012-12-28 SG SG10201609338SA patent/SG10201609338SA/en unknown
- 2012-12-28 SG SG11201403686SA patent/SG11201403686SA/en unknown
- 2012-12-28 BR BR112014016153-4A patent/BR112014016153B1/pt active IP Right Grant
- 2012-12-28 RU RU2016100179A patent/RU2617926C1/ru active
- 2012-12-28 ES ES12861377.5T patent/ES2610783T3/es active Active
- 2012-12-28 EP EP12861377.5A patent/EP2793227B1/en active Active
- 2012-12-28 KR KR1020147020836A patent/KR101693280B1/ko active Application Filing
- 2012-12-28 AU AU2012361423A patent/AU2012361423B2/en active Active
- 2012-12-28 RU RU2014131387/08A patent/RU2579926C1/ru active
- 2012-12-28 CA CA2861916A patent/CA2861916C/en active Active
- 2012-12-28 MY MYPI2014001949A patent/MY173976A/en unknown
- 2012-12-28 MX MX2014007968A patent/MX338445B/es active IP Right Grant
- 2012-12-28 PT PT128613775T patent/PT2793227T/pt unknown
- 2012-12-28 WO PCT/CN2012/087812 patent/WO2013097764A1/zh active Application Filing
- 2012-12-28 CA CA3181066A patent/CA3181066A1/en active Pending
- 2012-12-28 JP JP2014549344A patent/JP6072068B2/ja active Active
-
2014
- 2014-06-30 US US14/318,899 patent/US9406304B2/en active Active
- 2014-07-08 IN IN1436KON2014 patent/IN2014KN01436A/en unknown
- 2014-07-08 ZA ZA2014/04996A patent/ZA201404996B/en unknown
- 2014-12-31 HK HK14113112.0A patent/HK1199543A1/xx unknown
-
2016
- 2016-01-12 ZA ZA2016/00247A patent/ZA201600247B/en unknown
- 2016-06-21 US US15/188,518 patent/US9892738B2/en active Active
- 2016-12-27 JP JP2016252612A patent/JP6462653B2/ja active Active
-
2017
- 2017-04-18 RU RU2017113357A patent/RU2641464C1/ru active
-
2018
- 2018-01-11 US US15/867,977 patent/US10529345B2/en active Active
-
2019
- 2019-11-27 US US16/697,822 patent/US11183197B2/en active Active
-
2021
- 2021-10-21 US US17/507,200 patent/US11727946B2/en active Active
-
2023
- 2023-06-29 US US18/344,445 patent/US20230352035A1/en active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004537739A (ja) * | 2000-10-18 | 2004-12-16 | ノキア コーポレーション | 音声コーデックにおける擬似高帯域信号の推定方法およびシステム |
JP2009545779A (ja) * | 2006-07-31 | 2009-12-24 | クゥアルコム・インコーポレイテッド | 信号変化検出のためのシステム、方法、および装置 |
JP2008139447A (ja) * | 2006-11-30 | 2008-06-19 | Mitsubishi Electric Corp | 音声符号化装置及び音声復号装置 |
US20080195383A1 (en) * | 2007-02-14 | 2008-08-14 | Mindspeed Technologies, Inc. | Embedded silence and background noise compression |
JP2011502287A (ja) * | 2007-11-02 | 2011-01-20 | 華為技術有限公司 | 音声復号化方法及び装置 |
JP2011514561A (ja) * | 2008-03-20 | 2011-05-06 | 華為技術有限公司 | 背景雑音生成方法および雑音処理装置 |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6462653B2 (ja) | オーディオ・データを処理するための方法、装置、及びシステム | |
US10559313B2 (en) | Speech/audio signal processing method and apparatus | |
US20230037845A1 (en) | Truncateable predictive coding | |
JP6474874B2 (ja) | ハーモニックオーディオ信号の帯域幅拡張 | |
WO2023197809A1 (zh) | 一种高频音频信号的编解码方法和相关装置 | |
EP2127088A1 (en) | Audio quantization | |
CN115512711A (zh) | 语音编码、语音解码方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170106 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180327 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180621 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20181204 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20181227 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6462653 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |