JP7004474B2 - オーディオ信号の符号化および復号 - Google Patents
オーディオ信号の符号化および復号 Download PDFInfo
- Publication number
- JP7004474B2 JP7004474B2 JP2020526084A JP2020526084A JP7004474B2 JP 7004474 B2 JP7004474 B2 JP 7004474B2 JP 2020526084 A JP2020526084 A JP 2020526084A JP 2020526084 A JP2020526084 A JP 2020526084A JP 7004474 B2 JP7004474 B2 JP 7004474B2
- Authority
- JP
- Japan
- Prior art keywords
- frame
- information
- control data
- data item
- pitch
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 title claims description 154
- 238000000034 method Methods 0.000 claims description 93
- 238000005259 measurement Methods 0.000 claims description 76
- 230000006870 function Effects 0.000 claims description 22
- 238000005070 sampling Methods 0.000 claims description 19
- 238000006243 chemical reaction Methods 0.000 claims description 16
- 230000007774 longterm Effects 0.000 claims description 8
- 230000005284 excitation Effects 0.000 description 15
- 238000012545 processing Methods 0.000 description 13
- 238000004891 communication Methods 0.000 description 11
- 230000003595 spectral effect Effects 0.000 description 11
- 238000004590 computer program Methods 0.000 description 9
- 230000011664 signaling Effects 0.000 description 9
- 230000008878 coupling Effects 0.000 description 8
- 238000010168 coupling process Methods 0.000 description 8
- 238000005859 coupling reaction Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 6
- 230000004044 response Effects 0.000 description 6
- 238000003786 synthesis reaction Methods 0.000 description 6
- 238000001914 filtration Methods 0.000 description 5
- 230000000737 periodic effect Effects 0.000 description 5
- 238000012795 verification Methods 0.000 description 5
- 230000004913 activation Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 4
- 238000010200 validation analysis Methods 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 238000012952 Resampling Methods 0.000 description 3
- 238000013016 damping Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 230000001052 transient effect Effects 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000002238 attenuated effect Effects 0.000 description 2
- 238000005311 autocorrelation function Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000005314 correlation function Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012805 post-processing Methods 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000005562 fading Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 230000009131 signaling function Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
符号化されたオーディオ信号情報を読み取るように構成されたビットストリームリーダであって、
第1のフレームと第2のフレームのオーディオ信号の符号化された表現と、
第1のフレームの第1のピッチ情報、および第1の値を有する第1の制御データ項目と、
第2のフレームの第2のピッチ情報、および第1の値とは異なる第2の値を有する第2の制御データ項目と
を有するビットストリームリーダ、および
長期ポストフィルタLTPFを、
第2の制御データ項目が第2の値を有するとき、第2のピッチ情報を使用して第2のフレームのオーディオ信号の復号された表現をフィルタリングし、
第1の制御データ項目が第1の値を有するとき、第1のフレームのLTPFを非アクティブにする
ように制御すべく構成されたコントローラ
を備える装置が提供される。
オーディオ信号のピッチに関連するピッチ情報を取得するように構成されたピッチ推定器、
オーディオ信号のハーモニック性に関連するハーモニック性情報を取得するように構成された信号分析器、および
符号化されたオーディオ信号情報符号化フレームを準備してビットストリームに、
第1のフレーム、第2のフレーム、および第3のフレームのオーディオ信号の符号化された表現、
第1のフレームの第1のピッチ情報、および第1の値を有する第1の制御データ項目、
第2のフレームの第2のピッチ情報、および第1の値とは異なる第2の値を有する第2の制御データ項目、および
第1のフレーム、第2のフレーム、第3のフレームの第3の制御データ項目
を含めるように構成されたビットストリーム形成器を備え、
それにおいて、第1の値および第2の値は、ハーモニック性情報に関連付けられた第2の基準に依存し、
第1の値は、第1のフレームのオーディオ信号のハーモニック性に関する第2の基準を満たしていないことを示し、
第2の値は、第2のフレームのオーディオ信号のハーモニック性に関する第2の基準を満たしていることを示し、
それにおいて、第2の基準は、少なくとも1つの第2のハーモニック性測定値が少なくとも1つの第2の閾値より大きいときに満たされる少なくとも条件を含み、
第3の制御データ項目は、第3のフレームを第1および第2のフレームと区別する値を持つ1つの単一ビットに符号化され、第3のフレームは第1の基準が満たされない場合、符号化され、第1の基準が満たされた場合に、第1および第2のフレームが符号化され、第1の基準は少なくとも1つの第1のハーモニック性測定値が少なくとも1つの第1閾値より大きいときに満たされる少なくとも1つの条件を含み、それにおいて、ビットストリームでは、第1のフレームの場合、1つの単一ビットが第1の制御データ項目に予約され、固定データフィールドが第1のピッチ情報に予約され、
ビットストリームでは、第2のフレームについて、1つの単一ビットが第2の制御データ項目に予約され、固定データフィールドが第2のピッチ情報に予約され、
それにおいて、ビットストリームでは、第3のフレームについて、固定データフィールドおよび/または第1および第2の制御項目のためにビットが予約されていない装置が提供される。
第1のフレームと第2のフレームのオーディオ信号の符号化された表現と、
第1のフレームの第1のピッチ情報、および第1の値を有する第1の制御データ項目(16c)と、
第2のフレームの第2のピッチ情報、および第1の値とは異なる第2の値を有する第2の制御データ項目と
を含む符号化されたオーディオ信号情報を読み取ること、
第1の制御データ項目が第1の値を持っているという判定において、長期ポストフィルタLTPFの第1のピッチ情報を使用すること、および
第2の制御データ項目(17c)の第2の値の判定において、LTPFを非アクティブにすること
を含む方法が提供される。
オーディオ信号から測定値を取得すること、
第2の基準を満たしていることを検証することであって、第2の基準は測定値に基づいており、少なくとも1つの第2のハーモニック性測定値が第2の閾値より大きいときに満たされる少なくとも1つの条件を含む、検証すること、および
第1のフレームおよび第2のフレームおよび第3のフレームのオーディオ信号の符号化された表現、
第1のフレームの第1のピッチ情報と、第1の値を有する第1の制御データ項目および第3の制御データ項目、
第2のフレームの第2のピッチ情報および第1の値とは異なる第2の値を有する第2の制御データ項目および第3の制御データ項目を含む、フレームを有する符号化されたオーディオ信号情報を形成することを含み、
それにおいて第1の値および第2の値は、第2の基準に依存し、第1の値は、第1のフレームのオーディオ信号のハーモニック性に基づいて第2の基準を満たしていないことを示し、第2の値は、第2のフレームのオーディオ信号のハーモニック性に基づいて第2の基準が満たされていることを示し、
第3の制御データ項目は、第1の基準を満たしていることに関連して、第3のフレームを第1および第2のフレームから区別する値を有する1つの単一ビットであり、第3の制御データ項目が第1の基準を満たしていないことを示すとき、少なくとも1つの第1のハーモニック性測定値が少なくとも1つの第1の閾値よりも高いときに満たされる少なくとも1つの条件に基づいて、第3のフレームを識別し、
それにおいて符号化されたオーディオ信号情報は、第1のフレームについて、1つの単一ビットが第1の制御データ項目および第1のピッチ情報の固定データフィールド用に予約されるように形成され、
それにおいて符号化されたオーディオ信号情報は、第2のフレームについて、1つの単一ビットが第2の制御データ項目および第2のピッチ情報の固定データフィールド用に予約されるように形成され、
それにおいて符号化されたオーディオ信号情報は、第3のフレームについて、固定データフィールド用にビットが予約されず、ビットが第1の制御データ項目と第2の制御データ項目用に予約されない、
を含むフレームを有する符号化されたオーディオ信号情報を形成する方法が提供される。
オーディオ信号の符号化/復号をするための方法であって、
エンコーダで、オーディオ信号を符号化し、ハーモニック性情報および/またはピッチ情報を導出すること、
エンコーダで、ハーモニック性情報および/またはピッチ情報が少なくともLTPFおよび/または誤り隠蔽機能に適しているかどうかを判定すること、
デコーダからエンコーダに送信し、および/またはオーディオ信号のデジタル表現と、ハーモニック性に関連する情報を含むビットストリームをメモリに格納し、ピッチ情報がLTPFおよび/または誤り隠蔽に適合しているかどうかをシグナリングすること、
デコーダで、オーディオ信号のデジタル表現を復号し、ピッチ情報を使用して、シグナリングによるLTPFおよび/または誤り隠蔽がエンコーダを形成すること
を含む方法が提供される。
図1は装置10を示す。装置10は、信号を符号化するためのもの(エンコーダ)であってもよい。例えば、装置10は、オーディオ信号11を符号化して、符号化されたオーディオ信号情報(例えば、以下で使用される用語で、情報12、12’、12”)を生成することができる。
-第2の閾値および/または第2の基準は、LTPFに適したオーディオ信号とLTPFに適していないオーディオ信号を区別する。
-固定データフィールドが、第1および第2のピッチ情報16bおよび17bのそれぞれに予約されている。
式中、
はサンプリングレート6.4kHzのオーディオ信号、
は現在のフレームの長さ、
は現在のフレームのピッチ推定器によって取得されたピッチラグであり、
はラグ
の長さ
の信号
の正規化された相関である。
はピッチラグの整数部分、
はピッチラグの小数部分、および
は(例えば)12.8kHzでリサンプリングされた入力信号であり、
は
で得られるFIRローパスフィルタのインパルス応答であり、
は例えば、次の値から選択する。
+6.698858366939680e-03, +3.967114782344967e-02, +1.069991860896389e-01
+2.098804630681809e-01, +3.356906254147840e-01, +4.592209296082350e-01
+5.500750019177116e-01, +5.835275754221211e-01, +5.500750019177116e-01
+4.592209296082350e-01, +3.356906254147840e-01, +2.098804630681809e-01
+1.069991860896389e-01, +3.967114782344967e-02, +6.698858366939680e-03};
(mem_ltpf_active==0 && mem_nc>0.94 && nc>0.94) ||
(mem_ltpf_active==1 && nc>0.9) ||
(mem_ltpf_active==1 && abs(pit-mem_pit)<2 && (nc-mem_nc)>-0.1 && nc>0.84)
)
{
ltpf_active = 1;
}
else
{
ltpf_active = 0;
}
・第1の基準が満たされていない。
・ブロック21およびブロック22の出力21aおよび22aがともに「0」である。
・出力13a(「例えば、「ltpf_pitch_lag」)、24b(例えば、追加のハーモニック性情報、任意選択)、および22a(例えば、「ltpf_active」)は符号化されていない。
・第1の基準が満たされ、第2の基準が満たされていない。
・第1および第2の基準が満たされている。
・出力13a(例えば「ltpf_pitch_lag」)が符号化される。
・出力22a(例えば「ltpf_active」)の値「1」が符号化される。
・値「0」の第3の制御データ項目18e(例えば、21aから得られる「ltpf_pitch_lag_present」)、および
・オーディオ信号11の符号化された表現18a;
-第1のステータスの場合、以下のフィールドの第1のフレーム16”:
・値「1」の第3の制御データ項目18e(例えば、21aから得られる「ltpf_pitch_lag_present」);
・オーディオ信号11の符号化された表現16a;
・第1のフレーム16”の固定データフィールドにおける第1のピッチ情報16b(例えば、13aから得られる「ltpf_pitch_lag」)、および
・値「0」の第1の制御データ項目16c(例えば、22aから取得した「ltpf_active」)、および
-第2のステータスの場合、次のフィールドの第2のフレーム17”:
・値「1」の第3の制御データ項目18e(例えば、21aから得られる「ltpf_pitch_lag_present」);
・オーディオ信号11の符号化された表現17a;
・第2のフレーム17”の第2のピッチ情報17b(例えば、13aから得られる「ltpf_pitch_lag」);
・値「1」の第2の制御データ項目17c(例えば、22aから得られる「ltpf_active」)、および
・提供されている場合、(任意選択の)ハーモニック性情報17d(例えば、24bから取得)。
・第3のフレーム18は、第1のピッチ情報16b、第1の制御データ項目16c、第2のピッチ情報17b、および第2の制御データ項目17cを欠くフォーマットを有することができる。
-符号化されたオーディオ信号情報では、第1のフレーム16”について、1つの単一ビットが第1の制御データ項目16cに予約でき、固定データフィールド16bが第1のピッチ情報に予約され得る。および/または
-符号化されたオーディオ信号情報では、第2のフレーム17”について、1つの単一ビットが第2の制御データ項目17cに予約でき、固定データフィールド17bが第2のピッチ情報に予約され得る、および/または
-第1の制御データ項目16cおよび第2の制御データ項目17cは、符号化されたオーディオ信号情報の同じ部分またはデータフィールドに符号化され得る、および/または
-符号化されたオーディオ信号情報は、第3の制御データ項目18eを符号化する1つの第1のシグナリングビット、および/または第1のピッチ情報および/または第2のピッチ情報の存在を示す第3の制御データ項目の値の場合、第1の制御データ項目および第2の制御データ項目を符号化する第2のシグナリングビットを含み得る。
-前のフレームの場合、正規化された相関測定値nc(24a”)は、第3の閾値(例えば、0.94のような0.92と0.96の間の値)を上回っていたこと、および
-現在のフレームの場合、正規化された相関測定値nc(24a”)は第3の閾値(例えば、0.94のような0.92と0.96の間の値)より大きいこと。
-現在のフレームの場合、現在のピッチと前のピッチの間の距離が第5の閾値(例えば、1.8と2.2の間の値、例えば2)未満であるか、および
-現在のフレームの正規化された相関測定値nc(24a”)と前のフレームの正規化された相関測定値mem_ncの間の差が第6の閾値(例えば、-0.1などの-0.15から-0.05の間の値)より大きいか、および
-現在のフレームの場合、正規化された相関測定値nc(24a”)は、第7の閾値(例えば、0.84のような0.82と0.86の間の値)より大きいか。
S612でのチェックの結果が肯定的である場合、S614でltpf_activeが1に設定され、ステップS66(第2のフレーム17、17’、17”を符号化する)およびS67(符号化されたフレームを送信または格納する)がトリガーされる。
は、12.8kHzの固定サンプリングレートにリサンプリングされる。リサンプリングは、アップサンプリング+ローパスフィルタリング+ダウンサンプリングアプローチを使用して実行され、それは次のように定式化できる。
-2.043055832879108e-05, -4.463458936757081e-05, -7.163663994481459e-05,
-1.001011132655914e-04, -1.283728480660395e-04, -1.545438297704662e-04,
-1.765445671257668e-04, -1.922569599584802e-04, -1.996438192500382e-04,
-1.968886856400547e-04, -1.825383318834690e-04, -1.556394266046803e-04,
-1.158603651792638e-04, -6.358930335348977e-05, +2.810064795067786e-19,
+7.292180213001337e-05, +1.523970757644272e-04, +2.349207769898906e-04,
+3.163786496265269e-04, +3.922117380894736e-04, +4.576238491064392e-04,
+5.078242936704864e-04, +5.382955231045915e-04, +5.450729176175875e-04,
+5.250221548270982e-04, +4.760984242947349e-04, +3.975713799264791e-04,
+2.902002172907180e-04, +1.563446669975615e-04, -5.818801416923580e-19,
-1.732527127898052e-04, -3.563859653300760e-04, -5.411552308801147e-04,
-7.184140229675020e-04, -8.785052315963854e-04, -1.011714513697282e-03,
-1.108767055632304e-03, -1.161345220483996e-03, -1.162601694464620e-03,
-1.107640974148221e-03, -9.939415631563015e-04, -8.216921898513225e-04,
-5.940177657925908e-04, -3.170746535382728e-04, +9.746950818779534e-19,
+3.452937604228947e-04, +7.044808705458705e-04, +1.061334465662964e-03,
+1.398374734488549e-03, +1.697630799350524e-03, +1.941486748731660e-03,
+2.113575906669355e-03, +2.199682452179964e-03, +2.188606246517629e-03,
+2.072945458973295e-03, +1.849752491313908e-03, +1.521021876908738e-03,
+1.093974255016849e-03, +5.811080624426164e-04, -1.422482656398999e-18,
-6.271537303228204e-04, -1.274251404913447e-03, -1.912238389850182e-03,
-2.510269249380764e-03, -3.037038298629825e-03, -3.462226871101535e-03,
-3.758006719596473e-03, -3.900532466948409e-03, -3.871352309895838e-03,
-3.658665583679722e-03, -3.258358512646846e-03, -2.674755551508349e-03,
-1.921033054368456e-03, -1.019254326838640e-03, +1.869623690895593e-18,
+1.098415446732263e-03, +2.231131973532823e-03, +3.348309272768835e-03,
+4.397022774386510e-03, +5.323426722644900e-03, +6.075105310368700e-03,
+6.603520247552113e-03, +6.866453987193027e-03, +6.830342695906946e-03,
+6.472392343549424e-03, +5.782375213956374e-03, +4.764012726389739e-03,
+3.435863514113467e-03, +1.831652835406657e-03, -2.251898372838663e-18,
-1.996476188279370e-03, -4.082668858919100e-03, -6.173080374929424e-03,
-8.174448945974208e-03, -9.988823864332691e-03, -1.151698705819990e-02,
-1.266210056063963e-02, -1.333344579518481e-02, -1.345011199343934e-02,
-1.294448809639154e-02, -1.176541543002924e-02, -9.880867320401294e-03,
-7.280036402392082e-03, -3.974730209151807e-03, +2.509617777250391e-18,
+4.586044219717467e-03, +9.703248998383679e-03, +1.525124770818010e-02,
+2.111205854013017e-02, +2.715337236094137e-02, +3.323242450843114e-02,
+3.920032029020130e-02, +4.490666443426786e-02, +5.020433088017846e-02,
+5.495420172681558e-02, +5.902970324375908e-02, +6.232097270672976e-02,
+6.473850225260731e-02, +6.621612450840858e-02, +6.671322871619612e-02,
+6.621612450840858e-02, +6.473850225260731e-02, +6.232097270672976e-02,
+5.902970324375908e-02, +5.495420172681558e-02, +5.020433088017846e-02,
+4.490666443426786e-02, +3.920032029020130e-02, +3.323242450843114e-02,
+2.715337236094137e-02, +2.111205854013017e-02, +1.525124770818010e-02,
+9.703248998383679e-03, +4.586044219717467e-03, +2.509617777250391e-18,
-3.974730209151807e-03, -7.280036402392082e-03, -9.880867320401294e-03,
-1.176541543002924e-02, -1.294448809639154e-02, -1.345011199343934e-02,
-1.333344579518481e-02, -1.266210056063963e-02, -1.151698705819990e-02,
-9.988823864332691e-03, -8.174448945974208e-03, -6.173080374929424e-03,
-4.082668858919100e-03, -1.996476188279370e-03, -2.251898372838663e-18,
+1.831652835406657e-03, +3.435863514113467e-03, +4.764012726389739e-03,
+5.782375213956374e-03, +6.472392343549424e-03, +6.830342695906946e-03,
+6.866453987193027e-03, +6.603520247552113e-03, +6.075105310368700e-03,
+5.323426722644900e-03, +4.397022774386510e-03, +3.348309272768835e-03,
+2.231131973532823e-03, +1.098415446732263e-03, +1.869623690895593e-18,
-1.019254326838640e-03, -1.921033054368456e-03, -2.674755551508349e-03,
-3.258358512646846e-03, -3.658665583679722e-03, -3.871352309895838e-03,
-3.900532466948409e-03, -3.758006719596473e-03, -3.462226871101535e-03,
-3.037038298629825e-03, -2.510269249380764e-03, -1.912238389850182e-03,
-1.274251404913447e-03, -6.271537303228204e-04, -1.422482656398999e-18,
+5.811080624426164e-04, +1.093974255016849e-03, +1.521021876908738e-03,
+1.849752491313908e-03, +2.072945458973295e-03, +2.188606246517629e-03,
+2.199682452179964e-03, +2.113575906669355e-03, +1.941486748731660e-03,
+1.697630799350524e-03, +1.398374734488549e-03, +1.061334465662964e-03,
+7.044808705458705e-04, +3.452937604228947e-04, +9.746950818779534e-19,
-3.170746535382728e-04, -5.940177657925908e-04, -8.216921898513225e-04,
-9.939415631563015e-04, -1.107640974148221e-03, -1.162601694464620e-03,
-1.161345220483996e-03, -1.108767055632304e-03, -1.011714513697282e-03,
-8.785052315963854e-04, -7.184140229675020e-04, -5.411552308801147e-04,
-3.563859653300760e-04, -1.732527127898052e-04, -5.818801416923580e-19,
+1.563446669975615e-04, +2.902002172907180e-04, +3.975713799264791e-04,
+4.760984242947349e-04, +5.250221548270982e-04, +5.450729176175875e-04,
+5.382955231045915e-04, +5.078242936704864e-04, +4.576238491064392e-04,
+3.922117380894736e-04, +3.163786496265269e-04, +2.349207769898906e-04,
+1.523970757644272e-04, +7.292180213001337e-05, +2.810064795067786e-19,
-6.358930335348977e-05, -1.158603651792638e-04, -1.556394266046803e-04,
-1.825383318834690e-04, -1.968886856400547e-04, -1.996438192500382e-04,
-1.922569599584802e-04, -1.765445671257668e-04, -1.545438297704662e-04,
-1.283728480660395e-04, -1.001011132655914e-04, -7.163663994481459e-05,
-4.463458936757081e-05, -2.043055832879108e-05};
は、
を使用して2倍にダウンサンプリングできる、ただし
={0.1236796411180537、0.2353512128364889、0.2819382920909148、0.2353512128364889、0.1236796411180537}である。
の自己相関は、
によって計算され得る、ただし
と
は最小と最大のラグである。
は、重み付けされた自己相関を最大化するラグであり得る。
ピッチラグの第2の推定値
は、前のフレームで推定されたピッチラグの近傍で重み付けされていない自己相関を最大化するラグであり得る。
ただし、
、
、および
は、前のフレームで推定された最終ピッチラグである。
によって得られる。
pitch_presentが0の場合、それ以上ビットは符号化されず、1ビットのみのLTPFビットストリームになる(第3のフレーム18”を参照されたい)。
pitch_presentが1の場合、さらに2つのパラメータが符号化される。1つはピッチラグパラメータ(9ビットで符号化されるなど)、もう1つはLTPFのアクティブ化を通知する1ビットである(フレーム16”と17”を参照されたい)。その場合、LTPFビットストリーム(フレーム)は11ビットで構成され得る。
ピッチラグパラメータとアクティブ化ビットは、次のセクションで説明するように取得される。
[31] = {
-2.874561161519444e-03, -3.001251025861499e-03, +2.745471654059321e-03
+1.535727698935322e-02, +2.868234046665657e-02, +2.950385026557377e-02
+4.598334491135473e-03, -4.729632459043440e-02, -1.058359163062837e-01
-1.303050213607112e-01, -7.544046357555201e-02, +8.357885725250529e-02
+3.301825710764459e-01, +6.032970076366158e-01, +8.174886856243178e-01
+8.986382851273982e-01, +8.174886856243178e-01, +6.032970076366158e-01
+3.301825710764459e-01, +8.357885725250529e-02, -7.544046357555201e-02
-1.303050213607112e-01, -1.058359163062837e-01, -4.729632459043440e-02
+4.598334491135473e-03, +2.950385026557377e-02, +2.868234046665657e-02
+1.535727698935322e-02, +2.745471654059321e-03, -3.001251025861499e-03
-2.874561161519444e-03};
+6.698858366939680e-03, +3.967114782344967e-02, +1.069991860896389e-01
+2.098804630681809e-01, +3.356906254147840e-01, +4.592209296082350e-01
+5.500750019177116e-01, +5.835275754221211e-01, +5.500750019177116e-01
+4.592209296082350e-01, +3.356906254147840e-01, +2.098804630681809e-01
+1.069991860896389e-01, +3.967114782344967e-02, +6.698858366939680e-03};
if (
(mem_ltpf_active==0 && mem_nc>0.94 && nc>0.94) ||
(mem_ltpf_active==1 && nc>0.9) ||
(mem_ltpf_active==1 && abs(pit-mem_pit)<2 && (nc-mem_nc)>-0.1 && nc>0.84)
)
{
ltpf_active = 1;
}
else
{
ltpf_active = 0;
}
に従って設定できる。
図7は、装置70を示す。装置70は、デコーダであり得る。装置70は、符号化されたオーディオ信号情報12、12’、12”などのデータを取得することができる。装置70は、上および/または下で説明される動作を実行することができる。符号化されたオーディオ信号情報12、12’、12”は、例えば、装置10または10’などのエンコーダによって、または方法60を実行することによって生成された可能性がある。例において、符号化されたオーディオ信号情報12、12’、12”は、例えば、装置10または10’とは異なる、または方法60を実行しないエンコーダによって生成された可能性がある。装置70は、フィルタリングされた復号されたオーディオ信号情報76を生成し得る。
MDCT(修正離散コサイン変換)の合成、MDST(修正離散コサイン変換)の合成、または別の変換に基づく合成後の復号された信号は、パラメータがLTPFビットストリームデータ「pitch_index」と「ltpf_active」に依存する可能性があるIIRフィルタを使用して、時間領域でポストフィルタ処理できる。パラメータが1つのフレームから次のフレームに変化するときに不連続性を回避するために、移行メカニズムが第1の現在のフレームの4分の1に適用され得る。
と
は次のように、すなわち
ただし
で計算でき、
と
は
fs_idx = min(4,(
/8000-1));
if (nbits < 320 + fs_idx*80)
{
gain_ltpf = 0.4;
gain_ind = 0;
}
else if (nbits < 400 + fs_idx*80)
{
gain_ltpf = 0.35;
gain_ind = 1;
}
else if (nbits < 480 + fs_idx*80)
{
gain_ltpf = 0.3;
gain_ind = 2;
}
else if (nbits < 560 + fs_idx*80)
{
gain_ltpf = 0.25;
gain_ind = 3;
}
else
{
gain_ltpf = 0;
}
に従って得ることができ、
表
と
は事前に決定されている。
の例をここに示す(「fs」の代わりに、サンプリングレートが示されている)。
{6.023618207009578e-01,4.197609261363617e-01,-1.883424527883687e-02},
{5.994768582584314e-01,4.197609261363620e-01,-1.594928283631041e-02},
{5.967764663733787e-01,4.197609261363617e-01,-1.324889095125780e-02},
{5.942410120098895e-01,4.197609261363618e-01,-1.071343658776831e-02}};
double tab_ltpf_num_16000[4][3] = {
{6.023618207009578e-01,4.197609261363617e-01,-1.883424527883687e-02},
{5.994768582584314e-01,4.197609261363620e-01,-1.594928283631041e-02},
{5.967764663733787e-01,4.197609261363617e-01,-1.324889095125780e-02},
{5.942410120098895e-01,4.197609261363618e-01,-1.071343658776831e-02}};
double tab_ltpf_num_24000[4][5] = {
{3.989695588963494e-01,5.142508607708275e-01,1.004382966157454e-01,-1.278893956818042e-02,-1.572280075461383e-03},
{3.948634911286333e-01,5.123819208048688e-01,1.043194926386267e-01,-1.091999960222166e-02,-1.347408330627317e-03},
{3.909844475885914e-01,5.106053522688359e-01,1.079832524685944e-01,-9.143431066188848e-03,-1.132124620551895e-03},
{3.873093888199928e-01,5.089122083363975e-01,1.114517380217371e-01,-7.450287133750717e-03,-9.255514050963111e-04}};
double_tab_ltpf_num_32000[4][7] = {
{2.982379446702096e-01,4.652809203721290e-01,2.105997428614279e-01,3.766780380806063e-02,-1.015696155796564e-02,-2.535880996101096e-03,-3.182946168719958e-04},
{2.943834154510240e-01,4.619294002718798e-01,2.129465770091844e-01,4.066175002688857e-02,-8.693272297010050e-03,-2.178307114679820e-03,-2.742888063983188e-04},
{2.907439213122688e-01,4.587461910960279e-01,2.151456974108970e-01,4.350104772529774e-02,-7.295495347716925e-03,-1.834395637237086e-03,-2.316920186482416e-04},
{2.872975852589158e-01,4.557148886861379e-01,2.172126950911401e-01,4.620088878229615e-02,-5.957463802125952e-03,-1.502934284345198e-03,-1.903851911308866e-04}};
double tab_ltpf_num_48000[4][11] = {
{1.981363739883217e-01,3.524494903964904e-01,2.513695269649414e-01,1.424146237314458e-01,5.704731023952599e-02,9.293366241586384e-03,-7.226025368953745e-03,-3.172679890356356e-03,-1.121835963567014e-03,-2.902957238400140e-04,-4.270815593769240e-05},
{1.950709426598375e-01,3.484660408341632e-01,2.509988459466574e-01,1.441167412482088e-01,5.928947317677285e-02,1.108923827452231e-02,-6.192908108653504e-03,-2.726705509251737e-03,-9.667125826217151e-04,-2.508100923165204e-04,-3.699938766131869e-05},
{1.921810055196015e-01,3.446945561091513e-01,2.506220094626024e-01,1.457102447664837e-01,6.141132133664525e-02,1.279941396562798e-02,-5.203721087886321e-03,-2.297324511109085e-03,-8.165608133217555e-04,-2.123855748277408e-04,-3.141271330981649e-05},
{1.894485314175868e-01,3.411139251108252e-01,2.502406876894361e-01,1.472065631098081e-01,6.342477229539051e-02,1.443203434150312e-02,-4.254449144657098e-03,-1.883081472613493e-03,-6.709619060722140e-04,-1.749363341966872e-04,-2.593864735284285e-05}};
の例をここに示す(「fs」の代わりにサンプリングレートが示されている)。
{0.000000000000000e+00, 2.098804630681809e-01, 5.835275754221211e-01, 2.098804630681809e-01, 0.000000000000000e+00},
{0.000000000000000e+00, 1.069991860896389e-01, 5.500750019177116e-01, 3.356906254147840e-01, 6.698858366939680e-03},
{0.000000000000000e+00, 3.967114782344967e-02, 4.592209296082350e-01, 4.592209296082350e-01, 3.967114782344967e-02},
{0.000000000000000e+00, 6.698858366939680e-03, 3.356906254147840e-01, 5.500750019177116e-01, 1.069991860896389e-01}};
double_tab_ltpf_den_16000[4][5] = {
{0.000000000000000e+00, 2.098804630681809e-01, 5.835275754221211e-01, 2.098804630681809e-01, 0.000000000000000e+00},
{0.000000000000000e+00, 1.069991860896389e-01, 5.500750019177116e-01, 3.356906254147840e-01, 6.698858366939680e-03},
{0.000000000000000e+00, 3.967114782344967e-02, 4.592209296082350e-01, 4.592209296082350e-01, 3.967114782344967e-02},
{0.000000000000000e+00, 6.698858366939680e-03, 3.356906254147840e-01, 5.500750019177116e-01, 1.069991860896389e-01}};
double_tab_ltpf_den_24000[4][7] = {
{0.000000000000000e+00, 6.322231627323796e-02, 2.507309606013235e-01, 3.713909428901578e-01, 2.507309606013235e-01, 6.322231627323796e-02, 0.000000000000000e+00},
{0.000000000000000e+00, 3.459272174099855e-02, 1.986515602645028e-01, 3.626411726581452e-01, 2.986750548992179e-01, 1.013092873505928e-01, 4.263543712369752e-03},
{0.000000000000000e+00, 1.535746784963907e-02, 1.474344878058222e-01, 3.374259553990717e-01, 3.374259553990717e-01, 1.474344878058222e-01, 1.535746784963907e-02},
{0.000000000000000e+00, 4.263543712369752e-03, 1.013092873505928e-01, 2.986750548992179e-01, 3.626411726581452e-01, 1.986515602645028e-01, 3.459272174099855e-02}};
double_tab_ltpf_den_32000[4][9] = {
{0.000000000000000e+00, 2.900401878228730e-02, 1.129857420560927e-01, 2.212024028097570e-01, 2.723909472446145e-01, 2.212024028097570e-01, 1.129857420560927e-01, 2.900401878228730e-02, 0.000000000000000e+00},
{0.000000000000000e+00, 1.703153418385261e-02, 8.722503785537784e-02, 1.961407762232199e-01, 2.689237982237257e-01, 2.424999102756389e-01, 1.405773364650031e-01, 4.474877169485788e-02, 3.127030243100724e-03},
{0.000000000000000e+00, 8.563673748488349e-03, 6.426222944493845e-02, 1.687676705918012e-01, 2.587445937795505e-01, 2.587445937795505e-01, 1.687676705918012e-01, 6.426222944493845e-02, 8.563673748488349e-03},
{0.000000000000000e+00, 3.127030243100724e-03, 4.474877169485788e-02, 1.405773364650031e-01, 2.424999102756389e-01, 2.689237982237257e-01, 1.961407762232199e-01, 8.722503785537784e-02, 1.703153418385261e-02}};
double_tab_ltpf_den_48000[4][13] = {
{0.000000000000000e+00, 1.082359386659387e-02, 3.608969221303979e-02, 7.676401468099964e-02, 1.241530577501703e-01, 1.627596438300696e-01, 1.776771417779109e-01, 1.627596438300696e-01, 1.241530577501703e-01, 7.676401468099964e-02, 3.608969221303979e-02, 1.082359386659387e-02, 0.000000000000000e+00},
{0.000000000000000e+00, 7.041404930459358e-03, 2.819702319820420e-02, 6.547044935127551e-02, 1.124647986743299e-01, 1.548418956489015e-01, 1.767122381341857e-01, 1.691507213057663e-01, 1.352901577989766e-01, 8.851425011427483e-02, 4.499353848562444e-02, 1.557613714732002e-02, 2.039721956502016e-03},
{0.000000000000000e+00, 4.146998467444788e-03, 2.135757310741917e-02, 5.482735584552816e-02, 1.004971444643720e-01, 1.456060342830002e-01, 1.738439838565869e-01, 1.738439838565869e-01, 1.456060342830002e-01, 1.004971444643720e-01, 5.482735584552816e-02, 2.135757310741917e-02, 4.146998467444788e-03},
{0.000000000000000e+00, 2.039721956502016e-03, 1.557613714732002e-02, 4.499353848562444e-02, 8.851425011427483e-02, 1.352901577989766e-01, 1.691507213057663e-01, 1.767122381341857e-01, 1.548418956489015e-01, 1.124647986743299e-01, 6.547044935127551e-02, 2.819702319820420e-02, 7.041404930459358e-03}}
移行処理について言及しながら、5つの異なるケースを検討する。
第2のケース:ltpf_active=1およびmem_ltpf_active=0
第3のケース:ltpf_active=0およびmem_ltpf_active=1
ただし、
、
、
、および
は、前のフレームで計算されたフィルタパラメータである。
パケット損失の一隠蔽法(PLC)または誤り隠蔽の例をここに示す。
破損したフレームは正しい可聴出力を提供せず、破棄されるものである。
TCX時間領域隠蔽法は、時間領域で動作するピッチベースのPLCテクニックである。支配的なハーモニック性構造を持つ信号に最適である。手順の例は次のとおりである。最後の復号されたフレームの合成信号は、セクション8.2.1で説明されているようにLPフィルタで逆フィルタ処理され、セクション8.2.2で説明されているように周期信号を取得する。ランダム信号は、セクション8.2.3においてほぼ均一に分布するランダムジェネレーターによって生成される。セクション8.2.4で説明されているように、2つの励起信号を合計して合計励起信号を形成する。これは、セクション8.2.6で説明されている減衰係数で適応的にフェードアウトされ、最終的にLPフィルタでフィルタ処理されて、合成された隠蔽された時間信号を取得する。最後の良好なフレームでLTPFがアクティブであった場合、セクション8.3で説明されているように、LTPFはまた合成された隠蔽された時間信号にも適用される。失われたフレームの後の第1の良好なフレームと適切に重畳するために、時間領域エイリアスキャンセル信号がセクション8.2.5で生成される。
TCX時間領域隠蔽法は、励起領域で動作している。自己相関関数は、80の等距離周波数領域帯域で計算できる。エネルギーは固定されたプリエンファシス係数
でプリエンファシスされてい
を使用して遅延ウィンドウ処理され、
逆に均等にスタックされたDFTを使用して時間領域に変換される。最後に、Levinson Durbin操作を使用して、隠蔽されたフレームのLPフィルタ
を取得できる。以下に例を示す。
LPフィルタは、正常なフレームの後の第1の失われたフレームでのみ計算され、その後失われたフレームに残る。
最後に
復号された時間サンプルは、最初に、フィルタを使用してセクション8.2.1のプリエンファシス係数でプリエンファシスされ、
信号
を取得する、式中、
は、
であればピッチラグ値
または
である。値
と
は、ビットストリームで送信されるピッチラグ値である。
は、計算された逆LPフィルタでさらにフィルタ処理され、前の励起信号
を取得する。励起信号
を構成するために、現在の失われたフレームに対して、次のように
が繰り返し
でコピーされる
式中
は
の最後のサンプルに対応する。安定係数
が1未満の場合、第1のピッチサイクル
は、下の表に記載されている11タップの線形位相FIRフィルタで最初にローパスフィルタされる
は、1から開始してフレーム全体でサンプルごとに減衰され、減衰係数
で終了して
を取得する。ピッチの利得は、良好なフレームの後の第1の失われたフレームでのみ計算され、さらに連続するフレームの損失に対しては
が設定される。
励起のランダムな部分は、次のようにほぼ均一な分布を持つランダムジェネレーターで生成できる
式中、
は、この方法で隠蔽されたまさに第1のフレームに対して24607で初期化され、
は値の16LSBを抽出する。以降のフレームでは、
が保存され、次の
として使用される。
に依存したフェージング速度でノイズがフルバンドノイズにフェードできることを保証するために、励起
のランダムな部分は、フルバンド
と、ハイパスフィルタ版
との間の線形補間によって、
と構成される、式中
は良好なフレームの後の第1の失われたフレームに対し、
は第2のさらに続く連続するフレーム損失に対し、式中
は前の隠蔽されたフレームの
である。
は
のように計算され、セクション8.2.2の後の
の場合、
である。それ以外の場合、ノイズの第2の利得
は、上の式のように計算されるが、
は
である。続いて、
である。
は、
で、第1のサンプルからサンプル5まで、続いてフレームごとに、
で始まり
で終わるまで、サンプルごとに均一に減衰し、
を得る。ノイズの利得
は、良好なフレームの後の第1の失われたフレームでのみ計算され、さらに連続するフレームの損失に対しては
が設定される。
ランダム励起
は、周期的励起
に追加され、合計励起信号
を形成する。隠蔽されたフレームの最終的な合成信号は、セクション8.2.1のLPフィルタで全励起をフィルタリングすることにより取得され、ディエンファシスフィルタで後処理される。
次のフレームが良好なフレームである場合に適切な重畳加算を取得するために、時間領域エイリアスキャンセル部分
を生成することができる。そのために、上記と同じように
の追加のサンプルが作成され、
信号を取得する。その上で、タイム領域エイリアスのキャンセル部分は、次のステップで作成される。
構築された信号はゼロにフェードアウトする。フェードアウト速度は、前回の減衰係数
に依存する減衰係数
、最後に正しく受信されたフレームで計算されたピッチの利得
、連続して消去されたフレームの数
、および安定性
によって制御される。次の手順を使用して、減衰係数
を計算できる。
== 1)
=
if (
> 0.98)
= 0.98
else if (
< 0.925)
= 0.925
else if (
== 2)
= (0.63 + 0.35
)
if
< 0.919
= 0.919;
else if (
== 3)
= (0.652 + 0.328
)
else if (
== 4)
= (0.674 + 0.3
)
else if (
== 5) {
= (0.696 + 0.266
)
else
= (0.725 + 0.225
)
=
(最後の2つの隣接する換算係数ベクトル
と
の安定性)は、例えば、
式中、
および
は、最後の2つの隣接するフレームの換算係数ベクトルである。係数
は
によって制限され、
の値が大きいほど、より安定した信号に対応する。これにより、エネルギーとスペクトルエンベロープの変動が制限される。2つの隣接する換算係数ベクトルが存在しない場合、係数
は0.8に設定される。
隠蔽されたフレームでmem_ltpf_active=1の場合、隠蔽方法が符号スクランブルまたはTCX時間領域隠蔽を伴うMDCTフレームの繰り返しである場合、ltpf_activeは1に設定される。したがって、セクション5で説明されているように、合成後の時間領域信号に長期ポストフィルタが適用されるが、ただし
式中、
は前のフレームのLTPF利得であり、
は減衰係数である。LTPFに使用されるピッチ値
と
は、最後のフレームから再利用される。
図9は、(例えば、装置70の実装であり得る)例による、オーディオデコーダ300の概略ブロック図を示す。
方法100が図10に示されている。ステップS101で、フレーム(12、12’、12”)は、リーダ(71、320)によって復号されてもよい。例において、フレームは、(例えば、Bluetooth接続を介して)受信され、および/または記憶ユニットから取得されてもよい。
提案された解決策は、エンコーダ側に1つのピッチ検出器のみを保持し、LTPFまたはPLCがこの情報を必要とする場合は常にピッチラグパラメータを送信するものと見なすことができる。1ビットは、ピッチ情報がビットストリームに存在するかどうかを示すために使用される。LTPFがアクティブかどうかを通知するために、1つの追加ビットが使用される。
a.フレームにつき1つのピッチラグは、ピッチ検出アルゴリズムを使用して推定される。これは、複雑さを低減して精度を向上させるために3つのステップで実行できる。第1のピッチラグは、低減されたサンプリングレートで「開ループピッチ分析」を使用して大まかに推定される(例えば、例の[1]または[5]を参照されたい)。次に、ピッチラグの整数部分は、より高いサンプリングレートで相関関数を最大化することによって調整される。第3のステップは、ピッチラグの小数部分を、例えば内挿された相関関数を最大化することにより推定するものである。
例によると、ビットストリームシンタックスは図8aおよび図8bに示されている。
デコーダが破損していないフレームを正しく受信した場合:
a.LTPFデータはビットストリームから復号される
b.ltpf_pitch_lag_presentが0またはltpf_activeが0の場合、LTPFデコーダは、LTPF利得0で呼び出される(その場合、ピッチラグはない)。
a.ピッチベースのPLCを使用して、失われた/破損したフレームを隠蔽するかどうかを決定する。この決定は、最後の良好なフレームのLTPFデータと、おそらく他の情報に基づいている。
図11は、符号化装置10または10’を実装し、かつ/または方法60を実行することができるシステム110を示す。システム110は、プロセッサ111と、プロセッサ111によって実行されたときにプロセッサ111にピッチ推定113を実行させる(例えば、ピッチ推定器13を実装する)ことができる命令を格納する非一時的メモリユニット112、信号分析114(例えば、信号分析器14および/またはハーモニック性測定器24を実装するため)、およびビットストリーム形成115(例えば、ビットストリーム形成器15および/またはステップS62、S64、および/またはS66を実装するため)を備えることができる。システム110は、オーディオ信号(例えば、オーディオ信号11)を取得することができる入力ユニット116を含むことができる。したがって、プロセッサ111は、オーディオ信号の(例えば、フレーム12、12’、12”のフォーマットの)符号化された表現を取得するためのプロセスを実行することができる。この符号化された表現は、出力ユニット117を使用して外部ユニットに提供され得る。出力ユニット117は、例えば、(例えば、Bluetoothなどの無線通信を使用して)外部デバイスおよび/または外部記憶空間と通信するための通信ユニットを備えることができる。プロセッサ111は、オーディオ信号の符号化された表現をローカル記憶空間118に保存することができる。
Claims (13)
- フレームのシーケンスに分割されたオーディオ信号に関連するオーディオ信号情報(12、12’、12”)を復号するための装置(70、300)であって、フレームの前記シーケンスの各フレームは、第1のフレーム(16、16’、16”)、第2のフレーム(17、17’、17”)、および第3のフレーム(18”)の1つであり、前記装置は、符号化されたオーディオ信号情報(12、12’、12”、310)を読み取るように構成されたビットストリームリーダ(71、320)であって、前記符号化されたオーディオ信号情報は、前記第1のフレーム(16、16’、16”)、前記第2のフレーム(17、17’、17”)、および前記第3のフレーム(18”)用の前記オーディオ信号(11)の符号化された表現(16a、17a、18a、310)を有する符号化されたオーディオ信号表現(12、12’、12”、310)、
前記第1のフレーム(16、16’、16”)の第1のピッチ情報(16b)、および第1の値を有する第1の制御データ項目(16c)、および
前記第2のフレーム(17、17’、17”)の第2のピッチ情報(17b)、および前記第1の値とは異なる第2の値を有する第2の制御データ項目(17c)であって、前記第1の制御データ項目(16c)および前記第2の制御データ項目(17c)は同じフィールドにある第2の制御データ項目(17c)、および
前記第1のフレーム(16、16’、16”)、前記第2のフレーム(17、17’、17”)、および前記第3のフレーム(18”)の第3の制御データ項目(18e)であって、前記第1のピッチ情報(16b)および/または前記第2のピッチ情報(17b)の有無を示し、前記第3のフレーム(18”)を前記第1および第2のフレーム(16”、17”)と区別する値を有する1つの単一ビットにおいて符号化され、前記第3のフレーム(18”)は、前記第1のピッチ情報(16b)、前記第1の制御データ項目(16c)、前記第2のピッチ情報(17b)、および前記第2の制御データ項目(17c)を欠くフォーマットを有する第3の制御データ項目(18e)を有する、ビットストリームリーダ、および
長期ポストフィルタLTPF(73、376)を制御して、
フレームが第3のフレーム(18”)であるかどうかを確認するために前記第3の制御データ項目(18e)をチェックし(S103)、前記フレームが第3のフレーム(18”)でないことを確認した場合は、前記フレームが第1のフレーム(16、16’、16”)であるか第2のフレーム(17、17’、17”)であるかを確認するために前記第1の制御データ項目と第2の制御データ項目をチェックして(S105)、
前記第2の制御データ項目(17c)に前記第2の値があることが確認された場合、前記第2のピッチ情報(17b)を使用して前記第2のフレーム(17、17’、17”)の前記オーディオ信号の復号された表現(71a、372)をフィルタ処理し、後続の適切に復号されていないオーディオフレームを隠蔽するための前記第2のピッチ情報を格納(S104)し、
前記第1の制御データ項目(16c)に前記第1の値があることが確認された場合、前記第1のフレーム(16、16’、16”)の前記LTPF(73、376)を非アクティブ化するが、後続の適切に復号されていないオーディオフレームを隠蔽するための前記第1のピッチ情報を格納(S104)して、
前記フレームが第3のフレームであることが前記第3の制御データ項目(18e)から確認された場合は、前記LTPF(73、376)を非アクティブ化すること、および後続の正しく復号されていないオーディオフレームを隠蔽するためのピッチ情報を格納すること
を行うように構成されたコントローラ(72)を
含む、装置。 - 前記符号化されたオーディオ信号情報では、前記第1のフレーム(16”)について、1つの単一ビットが前記第1の制御データ項目(16c)に予約され、固定のデータフィールド(16b)が前記第1のピッチ情報に予約される、請求項1に記載の装置。
- 前記符号化されたオーディオ信号情報では、前記第2のフレーム(17”)について、1つの単一ビットが前記第2の制御データ項目(17c)に予約され、固定のデータフィールド(17b)が前記第2のピッチ情報に予約される、請求項1~2のいずれかに記載の装置。
- 前記第1および/または第2のピッチ情報(16b、17b)を使用して、後続の適切に復号されていないオーディオフレームを隠蔽するように構成された隠蔽ユニット(75、380)
をさらに含む、請求項1~3のいずれかに記載の装置。 - 前記隠蔽ユニット(75、380)は、
無効なフレームの復号の判定(S102)の場合、以前に正しく復号されたフレームに関するピッチ情報が格納されているかどうかをチェックし(S107)、
無効に復号されたフレームを、前記格納されたピッチ情報を使用して取得されたフレームで隠蔽する(S108)
ように構成される、請求項4に記載の装置。 - オーディオ信号(11)を符号化するための装置(10、10’)であって、
オーディオ信号(11)のピッチに関連するピッチ情報(13a)を取得するように構成されたピッチ推定器(13)、
前記オーディオ信号(11)のハーモニック性に関連するハーモニック性情報(14a、24a、24c)を取得するように構成された信号分析器(14)、および
符号化されたオーディオ信号情報(12”)符号化フレーム(16”、17”、18”)を準備してビットストリームに、
第1のフレーム(16”)、第2のフレーム(17”)、および第3のフレーム(18”)の前記オーディオ信号(11)の符号化された表現(16a、17a、18a)、
第1のフレーム(16”)の第1のピッチ情報(16b)、および第1の値を有する第1の制御データ項目(16c)、
第2のフレーム(17”)の第2のピッチ情報(17b)、および前記第1の値とは異なる第2の値を有する第2の制御データ項目(17c)、および
前記第1のフレーム、第2のフレーム、第3のフレームの第3の制御データ項目(18e)
を含めるように構成されたビットストリーム形成器(15)を備え、
それにおいて、前記第1の値(16c)および前記第2の値(17c)は、前記ハーモニック性情報(14a、24a、24c)に関連付けられた第2の基準(600)に依存し、
前記第1の値(16c)は、前記第1のフレーム(16”)の前記オーディオ信号(11)の前記ハーモニック性に関する前記第2の基準(600)を満たしていないことを示し、
前記第2の値(17c)は、前記第2のフレーム(17”)の前記オーディオ信号(11)の前記ハーモニック性に関する前記第2の基準(600)を満たしていることを示し、
それにおいて、前記第2の基準(600)は、少なくとも1つの第2のハーモニック性測定値(24a”)が少なくとも1つの第2の閾値より大きいときに満たされる少なくとも条件(S63)を含み、
前記第3の制御データ項目(18e)は、前記第3のフレーム(18”)を前記第1および第2のフレーム(16”、17”)と区別する値を持つ1つの単一ビットに符号化され、前記第3のフレーム(18”)は第1の基準(S61)が満たされない場合、符号化され、前記第1の基準(S61)が満たされた場合に、前記第1および第2のフレーム(16”、17”)が符号化され、前記第1の基準(S61)は少なくとも1つの第1のハーモニック性測定値(24a’)が少なくとも1つの第1閾値より大きいときに満たされる少なくとも1つの条件を含み、それにおいて、前記ビットストリームでは、前記第1のフレーム(16”)の場合、1つの単一ビットが前記第1の制御データ項目(16c)に予約され、固定データフィールド(16b)が前記第1のピッチ情報に予約され、
前記ビットストリームでは、前記第2のフレーム(17”)について、1つの単一ビットが前記第2の制御データ項目(17c)に予約され、固定データフィールド(17b)が前記第2のピッチ情報に予約され、
それにおいて、前記ビットストリームでは、前記第3のフレーム(18”)について、前記固定データフィールドおよび/または前記第1および第2の制御項目のためにビットが予約されていない装置。 - 前記第2の基準(600)は、前のフレームの少なくとも1つのハーモニック性測定値が少なくとも1つの追加の閾値より大きいときに満たされる少なくとも追加の条件を含む、請求項6に記載の装置。
- 前記第1および第2のハーモニック性測定値が異なるサンプリングレートで得られる、請求項6または7のいずれかに記載の装置。
- 前記ピッチ情報(13a)は、ピッチラグ情報を含む、請求項6~8のいずれかに記載の装置。
- 前記ハーモニック性情報(14a、24a、24a’、24a”、24c)は、自己相関値および/または正規化された自己相関値の少なくとも1つを含む、請求項6~9のいずれかに記載の装置。
- フレームのシーケンスに分割されたオーディオ信号に関連するオーディオ信号情報を復号するための方法(100)であって、各フレームは、第1のフレーム、第2のフレーム、および第3のフレームのうちの1つであって、前記方法は、
前記第1のフレーム(16”)および前記第2のフレーム(17”)の前記オーディオ信号(11)の符号化された表現(16a、17a)、
前記第1のフレーム(16”)の第1のピッチ情報(16b)および第1の値を有する第1の制御データ項目(16c)、
前記第2のフレーム(17”)の第2のピッチ情報(17b)および前記第1の値とは異なる第2の値を有する第2の制御データ項目(17c)であって、前記第1の制御データ項目(16c)および前記第2の制御データ項目(17c)が同じフィールドである第2の制御データ項目(17c)、
前記第1のフレーム(16、16’、16”)、前記第2のフレーム(17、17’、17”)、および前記第3のフレーム(18”)の第3の制御データ項目(18e)であって、前記第1のピッチ情報(16b)および/または前記第2のピッチ情報(17b)の有無を示し、前記第3のフレーム(18”)を前記第1および第2のフレーム(16”、17”)と区別する値を有する1つの単一ビットにおいて符号化され、前記第3のフレーム(18”)は、前記第1のピッチ情報(16b)、前記第1の制御データ項目(16c)、前記第2のピッチ情報(17b)、および前記第2の制御データ項目(17c)を欠くフォーマットを有する第3の制御データ項目(18e)
を含む、符号化されたオーディオ信号情報(12”)を読み取ること(S101)、
前記2の制御データ項目が前記第2の値を有するとの判定において、長期ポストフィルタLTPF、および誤り隠蔽機能のための前記第2のピッチ情報を使用すること、
前記第1の制御データ項目が前記第1の値を有するとの判定において、前記LTPFを非アクティブ化するが、前記誤り隠蔽機能のための前記第1のピッチ情報を使用すること、
および
前記フレームが第3のフレームであるとの判定において、前記LTPFを非アクティブ化し、前記誤り隠蔽機能のための前記オーディオ信号(11)の前記符号化された表現(16a、17a、18a、310)の前記使用を非アクティブ化すること
を含む、方法。 - フレームに分割された信号に関連付けられたオーディオ信号情報を符号化するための方法(60)であって、
オーディオ信号から測定値(24a、24a’、24a”)を取得すること(S60)、
第2の基準(600)を満たしていることを検証すること(S63、S610~S612)であって、前記第2の基準(600)は前記測定値(24a、24a’、24a”)に基づいており、少なくとも1つの第2のハーモニック性測定値(24a’)が第2の閾値より大きいときに満たされる少なくとも1つの条件を含む、検証すること、および
第1のフレーム(16”)および第2のフレーム(17”)および第3のフレーム(18”)の前記オーディオ信号(11)の符号化された表現(16a、17a)、
前記第1のフレーム(16”)の第1のピッチ情報(16b)と、第1の値を有する第1の制御データ項目(16c)および第3の制御データ項目(18e)、
前記第2のフレーム(17”)の第2のピッチ情報(17b)および前記第1の値とは異なる第2の値を有する第2の制御データ項目(17c)および第3の制御データ項目(18e)を含む、フレーム(16”、17”、18”)を有する符号化されたオーディオ信号情報(12、12’、12”)を形成すること(S64)を含み、
それにおいて前記第1の値(16c)および第2の値(17c)は、前記第2の基準(600)に依存し、前記第1の値(16c)は、前記第1のフレーム(16”)の前記オーディオ信号(11)のハーモニック性に基づいて前記第2の基準(600)を満たしていないことを示し、前記第2の値(17c)は、前記第2のフレーム(17)の前記オーディオ信号(11)のハーモニック性に基づいて前記第2の基準(600)が満たされていることを示し、
前記第3の制御データ項目(18e)は、第1の基準(S61)を満たしていることに関連して、前記第3のフレーム(18”)を前記第1および第2のフレーム(16”、17”)から区別する値を有する1つの単一ビットであり、前記第3の制御データ項目(18e)が前記第1の基準(S61)を満たしていないことを示すとき、前記第3のフレーム(18”)を識別し、前記第1の基準(S61)は、少なくとも1つの第1のハーモニック性測定値(24a’)が少なくとも1つの第1の閾値よりも高いときに満たされ、少なくとも1つの第1のハーモニック性測定値(24a’)が前記少なくとも1つの第1の閾値よりも小さいときに満たされず、
それにおいて前記符号化されたオーディオ信号情報は、前記第1のフレーム(16”)について、1つの単一ビットが前記第1の制御データ項目(16c)および前記第1のピッチ情報(16b)の固定データフィールド用に予約されるように形成され、
それにおいて前記符号化されたオーディオ信号情報は、前記第2のフレーム(17”)について、1つの単一ビットが前記第2の制御データ項目(17c)および前記第2のピッチ情報(17b)の固定データフィールド用に予約されるように形成され、
それにおいて前記符号化されたオーディオ信号情報は、前記第3のフレーム(18”)について、前記固定データフィールド用にビットが予約されず、ビットが前記第1の制御データ項目(16c)と前記第2の制御データ項目(17c)用に予約されない、方法。 - プロセッサによって実行されるとき、請求項11~12のいずれかに記載の方法を実行する命令を格納する非一時的メモリユニット。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP17201099.3A EP3483883A1 (en) | 2017-11-10 | 2017-11-10 | Audio coding and decoding with selective postfiltering |
EP17201099.3 | 2017-11-10 | ||
PCT/EP2018/080350 WO2019091980A1 (en) | 2017-11-10 | 2018-11-06 | Encoding and decoding audio signals |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021502605A JP2021502605A (ja) | 2021-01-28 |
JP7004474B2 true JP7004474B2 (ja) | 2022-01-21 |
Family
ID=60301910
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020526084A Active JP7004474B2 (ja) | 2017-11-10 | 2018-11-06 | オーディオ信号の符号化および復号 |
Country Status (17)
Country | Link |
---|---|
US (1) | US11217261B2 (ja) |
EP (2) | EP3483883A1 (ja) |
JP (1) | JP7004474B2 (ja) |
KR (1) | KR102460233B1 (ja) |
CN (1) | CN111566731B (ja) |
AR (1) | AR113481A1 (ja) |
AU (1) | AU2018363701B2 (ja) |
BR (1) | BR112020009184A2 (ja) |
CA (1) | CA3082274C (ja) |
ES (1) | ES2968821T3 (ja) |
MX (1) | MX2020004776A (ja) |
PL (1) | PL3707714T3 (ja) |
RU (1) | RU2741518C1 (ja) |
SG (1) | SG11202004228VA (ja) |
TW (1) | TWI698859B (ja) |
WO (1) | WO2019091980A1 (ja) |
ZA (1) | ZA202002524B (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5981408B2 (ja) * | 2013-10-29 | 2016-08-31 | 株式会社Nttドコモ | 音声信号処理装置、音声信号処理方法、及び音声信号処理プログラム |
EP2980798A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Harmonicity-dependent controlling of a harmonic filter tool |
BR112021013720A2 (pt) * | 2019-01-13 | 2021-09-21 | Huawei Technologies Co., Ltd. | Método implementado por computador para codificação de áudio, dispositivo eletrônico e meio legível por computador não transitório |
CN112289328B (zh) * | 2020-10-28 | 2024-06-21 | 北京百瑞互联技术股份有限公司 | 一种确定音频编码码率的方法及系统 |
CN113096685B (zh) * | 2021-04-02 | 2024-05-07 | 北京猿力未来科技有限公司 | 音频处理方法及装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016523380A (ja) | 2013-06-21 | 2016-08-08 | フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. | 改善されたパルス再同期化を採用するacelp型封じ込めにおける適応型コードブックの改善された封じ込めのための装置および方法 |
JP2017528752A (ja) | 2014-07-28 | 2017-09-28 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | ハーモニックフィルタツールのハーモニック依存制御 |
Family Cites Families (156)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE3639753A1 (de) | 1986-11-21 | 1988-06-01 | Inst Rundfunktechnik Gmbh | Verfahren zum uebertragen digitalisierter tonsignale |
US5012517A (en) | 1989-04-18 | 1991-04-30 | Pacific Communication Science, Inc. | Adaptive transform coder having long term predictor |
US5233660A (en) | 1991-09-10 | 1993-08-03 | At&T Bell Laboratories | Method and apparatus for low-delay celp speech coding and decoding |
JPH05281996A (ja) | 1992-03-31 | 1993-10-29 | Sony Corp | ピッチ抽出装置 |
IT1270438B (it) | 1993-06-10 | 1997-05-05 | Sip | Procedimento e dispositivo per la determinazione del periodo del tono fondamentale e la classificazione del segnale vocale in codificatori numerici della voce |
US5581653A (en) | 1993-08-31 | 1996-12-03 | Dolby Laboratories Licensing Corporation | Low bit-rate high-resolution spectral envelope coding for audio encoder and decoder |
JP3402748B2 (ja) | 1994-05-23 | 2003-05-06 | 三洋電機株式会社 | 音声信号のピッチ周期抽出装置 |
JPH0811644A (ja) | 1994-06-27 | 1996-01-16 | Nissan Motor Co Ltd | ルーフモール取付構造 |
US6167093A (en) | 1994-08-16 | 2000-12-26 | Sony Corporation | Method and apparatus for encoding the information, method and apparatus for decoding the information and method for information transmission |
EP0732687B2 (en) | 1995-03-13 | 2005-10-12 | Matsushita Electric Industrial Co., Ltd. | Apparatus for expanding speech bandwidth |
US5781888A (en) | 1996-01-16 | 1998-07-14 | Lucent Technologies Inc. | Perceptual noise shaping in the time domain via LPC prediction in the frequency domain |
WO1997027578A1 (en) | 1996-01-26 | 1997-07-31 | Motorola Inc. | Very low bit rate time domain speech analyzer for voice messaging |
US5812971A (en) | 1996-03-22 | 1998-09-22 | Lucent Technologies Inc. | Enhanced joint stereo coding method using temporal envelope shaping |
JPH1091194A (ja) | 1996-09-18 | 1998-04-10 | Sony Corp | 音声復号化方法及び装置 |
US6570991B1 (en) | 1996-12-18 | 2003-05-27 | Interval Research Corporation | Multi-feature speech/music discrimination system |
KR100261253B1 (ko) | 1997-04-02 | 2000-07-01 | 윤종용 | 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치 |
GB2326572A (en) | 1997-06-19 | 1998-12-23 | Softsound Limited | Low bit rate audio coder and decoder |
US6507814B1 (en) | 1998-08-24 | 2003-01-14 | Conexant Systems, Inc. | Pitch determination using speech classification and prior pitch estimation |
US7272556B1 (en) | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
US6735561B1 (en) | 2000-03-29 | 2004-05-11 | At&T Corp. | Effective deployment of temporal noise shaping (TNS) filters |
US7099830B1 (en) | 2000-03-29 | 2006-08-29 | At&T Corp. | Effective deployment of temporal noise shaping (TNS) filters |
US6665638B1 (en) | 2000-04-17 | 2003-12-16 | At&T Corp. | Adaptive short-term post-filters for speech coders |
US7395209B1 (en) | 2000-05-12 | 2008-07-01 | Cirrus Logic, Inc. | Fixed point audio decoding system and method |
US7353168B2 (en) | 2001-10-03 | 2008-04-01 | Broadcom Corporation | Method and apparatus to eliminate discontinuities in adaptively filtered signals |
US6785645B2 (en) | 2001-11-29 | 2004-08-31 | Microsoft Corporation | Real-time speech and music classifier |
US20030187663A1 (en) | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
US7447631B2 (en) | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
US7502743B2 (en) | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
US7433824B2 (en) | 2002-09-04 | 2008-10-07 | Microsoft Corporation | Entropy coding by adapting coding between level and run-length/level modes |
JP4287637B2 (ja) | 2002-10-17 | 2009-07-01 | パナソニック株式会社 | 音声符号化装置、音声符号化方法及びプログラム |
EP1595247B1 (en) | 2003-02-11 | 2006-09-13 | Koninklijke Philips Electronics N.V. | Audio coding |
KR20030031936A (ko) | 2003-02-13 | 2003-04-23 | 배명진 | 피치변경법을 이용한 단일 음성 다중 목소리 합성기 |
ATE503246T1 (de) | 2003-06-17 | 2011-04-15 | Panasonic Corp | Empfangsvorrichtung, sendevorrichtung und übertragungssystem |
WO2005027096A1 (en) | 2003-09-15 | 2005-03-24 | Zakrytoe Aktsionernoe Obschestvo Intel | Method and apparatus for encoding audio |
US7009533B1 (en) | 2004-02-13 | 2006-03-07 | Samplify Systems Llc | Adaptive compression and decompression of bandlimited signals |
DE102004009954B4 (de) | 2004-03-01 | 2005-12-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Verarbeiten eines Multikanalsignals |
DE102004009949B4 (de) | 2004-03-01 | 2006-03-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Ermitteln eines Schätzwertes |
CA2992097C (en) | 2004-03-01 | 2018-09-11 | Dolby Laboratories Licensing Corporation | Reconstructing audio signals with multiple decorrelation techniques and differentially coded parameters |
JP4744438B2 (ja) | 2004-03-05 | 2011-08-10 | パナソニック株式会社 | エラー隠蔽装置およびエラー隠蔽方法 |
BRPI0607646B1 (pt) * | 2005-04-01 | 2021-05-25 | Qualcomm Incorporated | Método e equipamento para encodificação por divisão de banda de sinais de fala |
US7539612B2 (en) | 2005-07-15 | 2009-05-26 | Microsoft Corporation | Coding and decoding scale factor information |
US7546240B2 (en) * | 2005-07-15 | 2009-06-09 | Microsoft Corporation | Coding with improved time resolution for selected segments via adaptive block transformation of a group of samples from a subband decomposition |
KR100888474B1 (ko) | 2005-11-21 | 2009-03-12 | 삼성전자주식회사 | 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법 |
US7805297B2 (en) | 2005-11-23 | 2010-09-28 | Broadcom Corporation | Classification-based frame loss concealment for audio signals |
WO2007070007A1 (en) | 2005-12-14 | 2007-06-21 | Matsushita Electric Industrial Co., Ltd. | A method and system for extracting audio features from an encoded bitstream for audio classification |
US8255207B2 (en) | 2005-12-28 | 2012-08-28 | Voiceage Corporation | Method and device for efficient frame erasure concealment in speech codecs |
EP1991986B1 (en) | 2006-03-07 | 2019-07-31 | Telefonaktiebolaget LM Ericsson (publ) | Methods and arrangements for audio coding |
US8150065B2 (en) | 2006-05-25 | 2012-04-03 | Audience, Inc. | System and method for processing an audio signal |
DE602007003023D1 (de) | 2006-05-30 | 2009-12-10 | Koninkl Philips Electronics Nv | Linear-prädiktive codierung eines audiosignals |
CN1983909B (zh) | 2006-06-08 | 2010-07-28 | 华为技术有限公司 | 一种丢帧隐藏装置和方法 |
US8015000B2 (en) | 2006-08-03 | 2011-09-06 | Broadcom Corporation | Classification-based frame loss concealment for audio signals |
DE602007012116D1 (de) | 2006-08-15 | 2011-03-03 | Dolby Lab Licensing Corp | Arbiträre formung einer temporären rauschhüllkurve ohne nebeninformation |
FR2905510B1 (fr) | 2006-09-01 | 2009-04-10 | Voxler Soc Par Actions Simplif | Procede d'analyse en temps reel de la voix pour le controle en temps reel d'un organe numerique et dispositif associe |
CN101140759B (zh) | 2006-09-08 | 2010-05-12 | 华为技术有限公司 | 语音或音频信号的带宽扩展方法及系统 |
DE102006049154B4 (de) | 2006-10-18 | 2009-07-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Kodierung eines Informationssignals |
KR101292771B1 (ko) | 2006-11-24 | 2013-08-16 | 삼성전자주식회사 | 오디오 신호의 오류은폐방법 및 장치 |
CN101548319B (zh) | 2006-12-13 | 2012-06-20 | 松下电器产业株式会社 | 后置滤波器以及滤波方法 |
FR2912249A1 (fr) | 2007-02-02 | 2008-08-08 | France Telecom | Codage/decodage perfectionnes de signaux audionumeriques. |
JP4871894B2 (ja) | 2007-03-02 | 2012-02-08 | パナソニック株式会社 | 符号化装置、復号装置、符号化方法および復号方法 |
JP5618826B2 (ja) | 2007-06-14 | 2014-11-05 | ヴォイスエイジ・コーポレーション | Itu.t勧告g.711と相互運用可能なpcmコーデックにおいてフレーム消失を補償する装置および方法 |
EP2015293A1 (en) * | 2007-06-14 | 2009-01-14 | Deutsche Thomson OHG | Method and apparatus for encoding and decoding an audio signal using adaptively switched temporal resolution in the spectral domain |
CN101325537B (zh) * | 2007-06-15 | 2012-04-04 | 华为技术有限公司 | 一种丢帧隐藏的方法和设备 |
JP4928366B2 (ja) | 2007-06-25 | 2012-05-09 | 日本電信電話株式会社 | ピッチ探索装置、パケット消失補償装置、それらの方法、プログラム及びその記録媒体 |
JP4572218B2 (ja) | 2007-06-27 | 2010-11-04 | 日本電信電話株式会社 | 音楽区間検出方法、音楽区間検出装置、音楽区間検出プログラム及び記録媒体 |
JP4981174B2 (ja) | 2007-08-24 | 2012-07-18 | フランス・テレコム | 確率テーブルの動的な計算によるシンボルプレーン符号化/復号化 |
ATE535904T1 (de) | 2007-08-27 | 2011-12-15 | Ericsson Telefon Ab L M | Verbesserte transformationskodierung von sprach- und audiosignalen |
CN100524462C (zh) | 2007-09-15 | 2009-08-05 | 华为技术有限公司 | 对高带信号进行帧错误隐藏的方法及装置 |
EP2207166B1 (en) | 2007-11-02 | 2013-06-19 | Huawei Technologies Co., Ltd. | An audio decoding method and device |
WO2009066869A1 (en) | 2007-11-21 | 2009-05-28 | Electronics And Telecommunications Research Institute | Frequency band determining method for quantization noise shaping and transient noise shaping method using the same |
WO2009084918A1 (en) | 2007-12-31 | 2009-07-09 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
WO2009150290A1 (en) | 2008-06-13 | 2009-12-17 | Nokia Corporation | Method and apparatus for error concealment of encoded audio data |
EP2144231A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme with common preprocessing |
PL2311034T3 (pl) | 2008-07-11 | 2016-04-29 | Fraunhofer Ges Forschung | Koder i dekoder audio do kodowania ramek próbkowanego sygnału audio |
EP2144230A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
CA2871252C (en) | 2008-07-11 | 2015-11-03 | Nikolaus Rettelbach | Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program |
US8577673B2 (en) | 2008-09-15 | 2013-11-05 | Huawei Technologies Co., Ltd. | CELP post-processing for music signals |
CN102177426B (zh) | 2008-10-08 | 2014-11-05 | 弗兰霍菲尔运输应用研究公司 | 多分辨率切换音频编码/解码方案 |
GB2466673B (en) | 2009-01-06 | 2012-11-07 | Skype | Quantization |
KR101316979B1 (ko) | 2009-01-28 | 2013-10-11 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 오디오 코딩 |
JP4945586B2 (ja) | 2009-02-02 | 2012-06-06 | 株式会社東芝 | 信号帯域拡張装置 |
JP4932917B2 (ja) | 2009-04-03 | 2012-05-16 | 株式会社エヌ・ティ・ティ・ドコモ | 音声復号装置、音声復号方法、及び音声復号プログラム |
FR2944664A1 (fr) | 2009-04-21 | 2010-10-22 | Thomson Licensing | Dispositif et procede de traitement d'images |
US8428938B2 (en) | 2009-06-04 | 2013-04-23 | Qualcomm Incorporated | Systems and methods for reconstructing an erased speech frame |
US8352252B2 (en) | 2009-06-04 | 2013-01-08 | Qualcomm Incorporated | Systems and methods for preventing the loss of information within a speech frame |
KR20100136890A (ko) | 2009-06-19 | 2010-12-29 | 삼성전자주식회사 | 컨텍스트 기반의 산술 부호화 장치 및 방법과 산술 복호화 장치 및 방법 |
CN101958119B (zh) | 2009-07-16 | 2012-02-29 | 中兴通讯股份有限公司 | 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法 |
PL2489041T3 (pl) | 2009-10-15 | 2020-11-02 | Voiceage Corporation | Jednoczesne kształtowanie szumu w dziedzinie czasu i w dziedzinie częstotliwości dla przekształcenia tdac |
TWI435317B (zh) | 2009-10-20 | 2014-04-21 | Fraunhofer Ges Forschung | 音訊信號編碼器、音訊信號解碼器、用以提供音訊內容之編碼表示型態之方法、用以提供音訊內容之解碼表示型態之方法及使用於低延遲應用之電腦程式 |
WO2011048099A1 (en) | 2009-10-20 | 2011-04-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder, method for encoding an audio information, method for decoding an audio information and computer program using a region-dependent arithmetic coding mapping rule |
US7978101B2 (en) | 2009-10-28 | 2011-07-12 | Motorola Mobility, Inc. | Encoder and decoder using arithmetic stage to compress code space that is not fully utilized |
US8207875B2 (en) | 2009-10-28 | 2012-06-26 | Motorola Mobility, Inc. | Encoder that optimizes bit allocation for information sub-parts |
WO2011065741A2 (ko) | 2009-11-24 | 2011-06-03 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
BR122021008583B1 (pt) | 2010-01-12 | 2022-03-22 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Codificador de áudio, decodificador de áudio, método de codificação e informação de áudio, e método de decodificação de uma informação de áudio que utiliza uma tabela hash que descreve tanto valores de estado significativos como limites de intervalo |
US20110196673A1 (en) | 2010-02-11 | 2011-08-11 | Qualcomm Incorporated | Concealing lost packets in a sub-band coding decoder |
EP2375409A1 (en) | 2010-04-09 | 2011-10-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction |
FR2961980A1 (fr) | 2010-06-24 | 2011-12-30 | France Telecom | Controle d'une boucle de retroaction de mise en forme de bruit dans un codeur de signal audionumerique |
CA3160488C (en) * | 2010-07-02 | 2023-09-05 | Dolby International Ab | Audio decoding with selective post filtering |
ES2828429T3 (es) | 2010-07-20 | 2021-05-26 | Fraunhofer Ges Forschung | Decodificador de audio, procedimiento de decodificación de audio y programa informático |
US9082416B2 (en) | 2010-09-16 | 2015-07-14 | Qualcomm Incorporated | Estimating a pitch lag |
US8738385B2 (en) | 2010-10-20 | 2014-05-27 | Broadcom Corporation | Pitch-based pre-filtering and post-filtering for compression of audio signals |
ES2534972T3 (es) | 2011-02-14 | 2015-04-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Predicción lineal basada en esquema de codificación utilizando conformación de ruido de dominio espectral |
US9270807B2 (en) | 2011-02-23 | 2016-02-23 | Digimarc Corporation | Audio localization using audio signal encoding and recognition |
MX2013010537A (es) * | 2011-03-18 | 2014-03-21 | Koninkl Philips Nv | Codificador y decodificador de audio con funcionalidad de configuracion. |
CN103620675B (zh) | 2011-04-21 | 2015-12-23 | 三星电子株式会社 | 对线性预测编码系数进行量化的设备、声音编码设备、对线性预测编码系数进行反量化的设备、声音解码设备及其电子装置 |
EP2707873B1 (en) | 2011-05-09 | 2015-04-08 | Dolby International AB | Method and encoder for processing a digital stereo audio signal |
FR2977439A1 (fr) | 2011-06-28 | 2013-01-04 | France Telecom | Fenetres de ponderation en codage/decodage par transformee avec recouvrement, optimisees en retard. |
FR2977969A1 (fr) | 2011-07-12 | 2013-01-18 | France Telecom | Adaptation de fenetres de ponderation d'analyse ou de synthese pour un codage ou decodage par transformee |
SG194706A1 (en) | 2012-01-20 | 2013-12-30 | Fraunhofer Ges Forschung | Apparatus and method for audio encoding and decoding employing sinusoidalsubstitution |
ES2571742T3 (es) | 2012-04-05 | 2016-05-26 | Huawei Tech Co Ltd | Método de determinación de un parámetro de codificación para una señal de audio multicanal y un codificador de audio multicanal |
US20130282372A1 (en) | 2012-04-23 | 2013-10-24 | Qualcomm Incorporated | Systems and methods for audio signal processing |
US9026451B1 (en) | 2012-05-09 | 2015-05-05 | Google Inc. | Pitch post-filter |
JP6088644B2 (ja) | 2012-06-08 | 2017-03-01 | サムスン エレクトロニクス カンパニー リミテッド | フレームエラー隠匿方法及びその装置、並びにオーディオ復号化方法及びその装置 |
GB201210373D0 (en) | 2012-06-12 | 2012-07-25 | Meridian Audio Ltd | Doubly compatible lossless audio sandwidth extension |
FR2992766A1 (fr) | 2012-06-29 | 2014-01-03 | France Telecom | Attenuation efficace de pre-echos dans un signal audionumerique |
CN102779526B (zh) | 2012-08-07 | 2014-04-16 | 无锡成电科大科技发展有限公司 | 语音信号中基音提取及修正方法 |
US9406307B2 (en) | 2012-08-19 | 2016-08-02 | The Regents Of The University Of California | Method and apparatus for polyphonic audio signal prediction in coding and networking systems |
US9293146B2 (en) | 2012-09-04 | 2016-03-22 | Apple Inc. | Intensity stereo coding in advanced audio coding |
EP2903004A4 (en) | 2012-09-24 | 2016-11-16 | Samsung Electronics Co Ltd | METHOD AND APPARATUS FOR HAMPERING FRAME ERRORS, AND METHOD AND APPARATUS FOR DECODING AUDIO DATA |
US9401153B2 (en) | 2012-10-15 | 2016-07-26 | Digimarc Corporation | Multi-mode audio recognition and auxiliary data encoding and decoding |
CN103886863A (zh) * | 2012-12-20 | 2014-06-25 | 杜比实验室特许公司 | 音频处理设备及音频处理方法 |
FR3001593A1 (fr) | 2013-01-31 | 2014-08-01 | France Telecom | Correction perfectionnee de perte de trame au decodage d'un signal. |
ES2881510T3 (es) | 2013-02-05 | 2021-11-29 | Ericsson Telefon Ab L M | Método y aparato para controlar la ocultación de pérdida de trama de audio |
TWI530941B (zh) * | 2013-04-03 | 2016-04-21 | 杜比實驗室特許公司 | 用於基於物件音頻之互動成像的方法與系統 |
EP2830061A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping |
EP2830055A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Context-based entropy coding of sample values of a spectral envelope |
CA2925734C (en) | 2013-10-18 | 2018-07-10 | Guillaume Fuchs | Coding of spectral coefficients of a spectrum of an audio signal |
US9906858B2 (en) | 2013-10-22 | 2018-02-27 | Bongiovi Acoustics Llc | System and method for digital signal processing |
PL3288026T3 (pl) * | 2013-10-31 | 2020-11-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Dekoder audio i sposób dostarczania zdekodowanej informacji audio z wykorzystaniem ukrywania błędów na bazie sygnału pobudzenia w dziedzinie czasu |
CA2927990C (en) | 2013-10-31 | 2018-08-14 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio bandwidth extension by insertion of temporal pre-shaped noise in frequency domain |
PL3355305T3 (pl) | 2013-10-31 | 2020-04-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Dekoder audio i sposób dostarczania zdekodowanej informacji audio z wykorzystaniem maskowania błędów modyfikującego sygnał pobudzenia w dziedzinie czasu |
AU2014350366B2 (en) | 2013-11-13 | 2017-02-23 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoder for encoding an audio signal, audio transmission system and method for determining correction values |
GB2524333A (en) | 2014-03-21 | 2015-09-23 | Nokia Technologies Oy | Audio signal payload |
US9396733B2 (en) | 2014-05-06 | 2016-07-19 | University Of Macau | Reversible audio data hiding |
NO2780522T3 (ja) | 2014-05-15 | 2018-06-09 | ||
EP2963646A1 (en) | 2014-07-01 | 2016-01-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder and method for decoding an audio signal, encoder and method for encoding an audio signal |
US9685166B2 (en) | 2014-07-26 | 2017-06-20 | Huawei Technologies Co., Ltd. | Classification between time-domain coding and frequency domain coding |
EP2980799A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing an audio signal using a harmonic post-filter |
EP3000110B1 (en) | 2014-07-28 | 2016-12-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selection of one of a first encoding algorithm and a second encoding algorithm using harmonics reduction |
CN107112022B (zh) | 2014-07-28 | 2020-11-10 | 三星电子株式会社 | 用于时域数据包丢失隐藏的方法 |
EP2980796A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for processing an audio signal, audio decoder, and audio encoder |
EP2988300A1 (en) | 2014-08-18 | 2016-02-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Switching of sampling rates at audio processing devices |
EP3067887A1 (en) | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
WO2016142002A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
US9886963B2 (en) | 2015-04-05 | 2018-02-06 | Qualcomm Incorporated | Encoder selection |
US10049684B2 (en) | 2015-04-05 | 2018-08-14 | Qualcomm Incorporated | Audio bandwidth selection |
JP6422813B2 (ja) | 2015-04-13 | 2018-11-14 | 日本電信電話株式会社 | 符号化装置、復号装置、これらの方法及びプログラム |
US9978400B2 (en) | 2015-06-11 | 2018-05-22 | Zte Corporation | Method and apparatus for frame loss concealment in transform domain |
US10847170B2 (en) | 2015-06-18 | 2020-11-24 | Qualcomm Incorporated | Device and method for generating a high-band signal from non-linearly processed sub-ranges |
US9837089B2 (en) | 2015-06-18 | 2017-12-05 | Qualcomm Incorporated | High-band signal generation |
KR20170000933A (ko) | 2015-06-25 | 2017-01-04 | 한국전기연구원 | 시간 지연 추정을 이용한 풍력 터빈의 피치 제어 시스템 |
US9830921B2 (en) | 2015-08-17 | 2017-11-28 | Qualcomm Incorporated | High-band target signal control |
KR20180040716A (ko) | 2015-09-04 | 2018-04-20 | 삼성전자주식회사 | 음질 향상을 위한 신호 처리방법 및 장치 |
US9978381B2 (en) | 2016-02-12 | 2018-05-22 | Qualcomm Incorporated | Encoding of multiple audio signals |
US10219147B2 (en) | 2016-04-07 | 2019-02-26 | Mediatek Inc. | Enhanced codec control |
US10283143B2 (en) | 2016-04-08 | 2019-05-07 | Friday Harbor Llc | Estimating pitch of harmonic signals |
CN107103908B (zh) | 2017-05-02 | 2019-12-24 | 大连民族大学 | 复调音乐多音高估计方法及伪双谱在多音高估计中的应用 |
-
2017
- 2017-11-10 EP EP17201099.3A patent/EP3483883A1/en not_active Withdrawn
-
2018
- 2018-11-06 EP EP18796060.4A patent/EP3707714B1/en active Active
- 2018-11-06 ES ES18796060T patent/ES2968821T3/es active Active
- 2018-11-06 MX MX2020004776A patent/MX2020004776A/es unknown
- 2018-11-06 AU AU2018363701A patent/AU2018363701B2/en active Active
- 2018-11-06 WO PCT/EP2018/080350 patent/WO2019091980A1/en unknown
- 2018-11-06 JP JP2020526084A patent/JP7004474B2/ja active Active
- 2018-11-06 SG SG11202004228VA patent/SG11202004228VA/en unknown
- 2018-11-06 CN CN201880085705.4A patent/CN111566731B/zh active Active
- 2018-11-06 PL PL18796060.4T patent/PL3707714T3/pl unknown
- 2018-11-06 KR KR1020207016224A patent/KR102460233B1/ko active IP Right Grant
- 2018-11-06 RU RU2020118949A patent/RU2741518C1/ru active
- 2018-11-06 BR BR112020009184-7A patent/BR112020009184A2/pt unknown
- 2018-11-06 CA CA3082274A patent/CA3082274C/en active Active
- 2018-11-07 TW TW107139530A patent/TWI698859B/zh active
- 2018-11-09 AR ARP180103273A patent/AR113481A1/es active IP Right Grant
-
2020
- 2020-05-06 US US16/868,057 patent/US11217261B2/en active Active
- 2020-05-07 ZA ZA2020/02524A patent/ZA202002524B/en unknown
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016523380A (ja) | 2013-06-21 | 2016-08-08 | フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. | 改善されたパルス再同期化を採用するacelp型封じ込めにおける適応型コードブックの改善された封じ込めのための装置および方法 |
JP2017528752A (ja) | 2014-07-28 | 2017-09-28 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | ハーモニックフィルタツールのハーモニック依存制御 |
Also Published As
Publication number | Publication date |
---|---|
CN111566731A (zh) | 2020-08-21 |
KR20200081467A (ko) | 2020-07-07 |
ZA202002524B (en) | 2021-08-25 |
EP3707714C0 (en) | 2023-11-29 |
US20200265855A1 (en) | 2020-08-20 |
CN111566731B (zh) | 2023-04-04 |
CA3082274C (en) | 2023-03-07 |
RU2741518C1 (ru) | 2021-01-26 |
AU2018363701A1 (en) | 2020-05-21 |
EP3707714B1 (en) | 2023-11-29 |
EP3483883A1 (en) | 2019-05-15 |
EP3707714A1 (en) | 2020-09-16 |
KR102460233B1 (ko) | 2022-10-28 |
JP2021502605A (ja) | 2021-01-28 |
AU2018363701B2 (en) | 2021-05-13 |
WO2019091980A1 (en) | 2019-05-16 |
SG11202004228VA (en) | 2020-06-29 |
US11217261B2 (en) | 2022-01-04 |
PL3707714T3 (pl) | 2024-05-20 |
CA3082274A1 (en) | 2019-05-16 |
BR112020009184A2 (pt) | 2020-11-03 |
ES2968821T3 (es) | 2024-05-14 |
AR113481A1 (es) | 2020-05-06 |
TW201923746A (zh) | 2019-06-16 |
MX2020004776A (es) | 2020-08-13 |
TWI698859B (zh) | 2020-07-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7004474B2 (ja) | オーディオ信号の符号化および復号 | |
CA2984017C (en) | Audio decoder and method for providing a decoded audio information using an error concealment modifying a time domain excitation signal | |
CN105765651B (zh) | 使用错误隐藏提供经解码的音频信息的音频解码器及方法 | |
CN104584120B (zh) | 生成舒适噪声 | |
US11380341B2 (en) | Selecting pitch lag | |
CN111312261B (zh) | 突发帧错误处理 | |
JP7073492B2 (ja) | 異なる損失隠蔽ツールのセットをサポートするオーディオデコーダ |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200705 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200705 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210622 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210625 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210921 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211130 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211229 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7004474 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |