JP7337966B2 - ステレオエンコーディング方法及び装置、並びにステレオデコーディング方法及び装置 - Google Patents
ステレオエンコーディング方法及び装置、並びにステレオデコーディング方法及び装置 Download PDFInfo
- Publication number
- JP7337966B2 JP7337966B2 JP2021577947A JP2021577947A JP7337966B2 JP 7337966 B2 JP7337966 B2 JP 7337966B2 JP 2021577947 A JP2021577947 A JP 2021577947A JP 2021577947 A JP2021577947 A JP 2021577947A JP 7337966 B2 JP7337966 B2 JP 7337966B2
- Authority
- JP
- Japan
- Prior art keywords
- channel signal
- pitch period
- secondary channel
- value
- estimated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 239
- 230000008569 process Effects 0.000 claims description 51
- 238000004458 analytical method Methods 0.000 claims description 27
- 238000003860 storage Methods 0.000 claims description 22
- 238000004364 calculation method Methods 0.000 claims description 21
- 238000004590 computer program Methods 0.000 claims description 8
- 238000012545 processing Methods 0.000 description 31
- 238000005070 sampling Methods 0.000 description 24
- 238000004891 communication Methods 0.000 description 22
- 238000010586 diagram Methods 0.000 description 20
- 238000013139 quantization Methods 0.000 description 17
- 238000012937 correction Methods 0.000 description 11
- 230000001934 delay Effects 0.000 description 11
- 230000006978 adaptation Effects 0.000 description 10
- 238000001514 detection method Methods 0.000 description 10
- 238000007781 pre-processing Methods 0.000 description 10
- 238000005311 autocorrelation function Methods 0.000 description 9
- 230000008447 perception Effects 0.000 description 9
- 238000005314 correlation function Methods 0.000 description 6
- 230000005284 excitation Effects 0.000 description 6
- 230000001052 transient effect Effects 0.000 description 6
- 238000001914 filtration Methods 0.000 description 5
- 230000003044 adaptive effect Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 238000003672 processing method Methods 0.000 description 3
- 230000008054 signal transmission Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000011946 reduction process Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/09—Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
- H04S1/002—Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0011—Long term prediction filters, i.e. pitch estimation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/03—Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
現在のフレームの左チャネル信号及び現在のフレームの右チャネル信号に対してダウンミックス処理を実行して、現在のフレームの一次チャネル信号及び現在のフレームの二次チャネル信号を取得することと、
二次チャネル信号のピッチ周期に対して差動エンコーディングを実行すると決定する場合に、一次チャネル信号の推定ピッチ周期値を使用することによって二次チャネル信号のピッチ周期に対して差動エンコーディングを実行して、二次チャネル信号のピッチ周期インデックス値を取得することであり、二次チャネル信号のピッチ周期インデックス値は、送信されるべきステレオエンコードされたビットストリームを生成するために使用される、ことと
を含む方法を提供する。
現在のフレームの一次チャネル信号をエンコードして、一次チャネル信号の推定ピッチ周期値を取得することと、
現在のフレームの二次チャネル信号に対して開ループピッチ周期解析を実行して、二次チャネル信号の推定開ループピッチ周期値を取得することと、
一次チャネル信号の推定ピッチ周期値と二次チャネル信号の推定開ループピッチ周期値との間の差が前もってセットされた二次チャネルピッチ周期差動エンコーディング閾値を超えるかどうかを決定することと、
差が二次チャネルピッチ周期差動エンコーディング閾値を超える場合には、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行すると決定し、あるいは、差が二次チャネルピッチ周期差動エンコーディング閾値を超えない場合には、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行することをスキップすると決定することと
を含む。
一次チャネル信号の推定ピッチ周期値に基づき二次チャネル信号閉ループピッチ周期探索を実行して、二次チャネル信号の推定ピッチ周期値を取得することと、
二次チャネル信号のピッチ周期探索範囲調整係数に基づき二次チャネル信号のピッチ周期インデックス値の上限を決定することと、
一次チャネル信号の推定ピッチ周期値、二次チャネル信号の推定ピッチ周期値、及び二次チャネル信号のピッチ周期インデックス値の上限に基づき、二次チャネル信号のピッチ周期インデックス値を計算することと
を含む。エンコーダ側は、二次チャネル信号の推定ピッチ周期値を決定するよう、二次チャネル信号の推定ピッチ周期値に基づき二次チャネル信号閉ループピッチ周期探索を実行し得る。二次チャネル信号のピッチ周期探索範囲調整係数は、二次チャネル信号のピッチ周期インデックス値の上限を決定するよう、二次チャネル信号のピッチ周期インデックス値を調整するために使用され得る。二次チャネル信号のピッチ周期インデックス値の上限は、二次チャネル信号のピッチ周期インデックス値が超えることができない上限値を示す。二次チャネル信号のピッチ周期インデックス値の上限は、二次チャネル信号のピッチ周期インデックス値を決定するために使用され得る。一次チャネル信号の推定ピッチ周期値、二次チャネル信号の推定ピッチ周期値、及び二次チャネル信号のピッチ周期インデックス値の上限を決定した後、エンコーダ側は、一次チャネル信号の推定ピッチ周期値、二次チャネル信号の推定ピッチ周期値、及び二次チャネル信号のピッチ周期インデックス値の上限に基づき差動エンコーディングを実行し、二次チャネル信号のピッチ周期インデックス値を出力する。
一次チャネル信号の推定ピッチ周期値と、現在のフレームの二次チャネル信号が分割されるサブフレームの数とに基づき、二次チャネル信号の閉ループピッチ周期基準値を決定することと、
整数精度及び分数精度を使用することによって、かつ、二次チャネル信号の閉ループピッチ周期基準値を二次チャネル信号閉ループピッチ周期探索の開始点として使用することによって、閉ループピッチ周期探索を実行して、二次チャネル信号の推定ピッチ周期値を取得することと
を含む。現在のフレームの二次チャネル信号が分割されるサブフレームの数は、二次チャネル信号のサブフレーム構成に基づき決定され得る。例えば、二次チャネル信号は、4つのサブフレーム又は3つのサブフレームに分割されてもよく、これは、具体的に、適応シナリオを参照して決定される。一次チャネル信号の推定ピッチ周期値が取得された後、一次チャネル信号の推定ピッチ周期値、及び二次チャネル信号が分割されるサブフレームの数が、二次チャネル信号の閉ループピッチ周期基準値を計算するために使用され得る。二次チャネル信号の閉ループピッチ周期基準値は、一次チャネル信号の推定ピッチ周期値に基づき決定された基準値である。二次チャネル信号の閉ループピッチ周期基準値は、一次チャネル信号の推定ピッチ周期値を基準として使用することによって決定される二次チャネル信号の閉ループピッチ周期を表す。
一次チャネル信号の推定ピッチ周期値に基づき、二次チャネル信号の閉ループピッチ周期整数部loc_T0及び二次チャネル信号の閉ループピッチ周期分数部loc_frac_primを決定することと、
次の方法:
f_pitch_prim=loc_T0+loc_frac_prim/N
で二次チャネル信号の閉ループピッチ周期基準値f_pitch_primを計算することと
を含み、Nは、二次チャネル信号が分割されるサブフレームの数を表す。具体的に、二次チャネル信号の閉ループピッチ周期整数部及び閉ループピッチ周期分数部が、最初に、一次チャネル信号の推定ピッチ周期値に基づき決定される。例えば、一次チャネル信号の推定ピッチ周期値の整数部は、二次チャネル信号の閉ループピッチ周期整数部として直接に使用され、一次チャネル信号の推定ピッチ周期値の分数部は、二次チャネル信号の閉ループピッチ周期分数部として使用される。代替的に、一次チャネル信号の推定ピッチ周期値は、補間法を使用することによって二次チャネル信号の閉ループピッチ周期整数部及び閉ループピッチ周期分数部にマッピングされ得る。例えば、上記の方法のいずれかに従って、二次チャネル信号の閉ループピッチ周期整数部loc_T0及び閉ループピッチ周期分数部loc_frac_primは取得され得る。
次の方法:
soft_reuse_index_high_limit=0.5+2Z
で二次チャネル信号のピッチ周期インデックス値の上限soft_reuse_index_high_limitを計算することを含み、Zは、二次チャネル信号のピッチ周期探索範囲調整係数である。
一次チャネル信号の推定ピッチ周期値に基づき、二次チャネル信号の閉ループピッチ周期整数部loc_T0及び二次チャネル信号の閉ループピッチ周期分数部loc_frac_primを決定することと、
次の方法:
soft_reuse_index=(N×pitch_soft_reuse+pitch_frac_soft_reuse)-(N×loc_T0+loc_frac_prim)+soft_reuse_index_high_limit/M
で二次チャネル信号のピッチ周期インデックス値soft_reuse_indexを計算することと
を含み、pitch_soft_reuseは、二次チャネル信号の推定ピッチ周期値の整数部を表し、pitch_frac_soft_reuseは、二次チャネル信号の推定ピッチ周期値の分数部を表し、soft_reuse_index_high_limitは、二次チャネル信号のピッチ周期インデックス値の上限を表し、Nは、二次チャネル信号が分割されるサブフレームの数を表し、Mは、二次チャネル信号のピッチ周期インデックス値の上限の調整係数を表し、Mは、非ゼロの実数であり、×は、乗算演算子を表し、+は、加算演算子を表し、-は、減算演算子を表す。
受け取られたステレオエンコードされたビットストリームに基づき、二次チャネル信号のピッチ周期に対して差動デコーディングを実行すべきかどうかを決定することと、
二次チャネル信号のピッチ周期に対して差動デコーディングを実行すると決定する場合に、ステレオエンコードされたビットストリームから、現在のフレームの一次チャネル信号の推定ピッチ周期値及び現在のフレームの二次チャネル信号のピッチ周期インデックス値を取得することと、
一次チャネル信号の推定ピッチ周期値及び二次チャネル信号のピッチ周期インデックス値に基づき二次チャネル信号のピッチ周期に対して差動デコーディングを実行して、二次チャネル信号の推定ピッチ周期値を取得することであり、二次チャネル信号の推定ピッチ周期値は、ステレオエンコードされたビットストリームをデコードするために使用される、ことと
を含む方法を更に提供する。
現在のフレームから二次チャネルピッチ周期差動エンコーディングフラグを取得することと、
二次チャネルピッチ周期差動エンコーディングフラグが前もってセットされた第1値である場合に、二次チャネル信号のピッチ周期に対して差動デコーディングを実行すると決定することと
を含む。本願のこの実施形態で、二次チャネルピッチ周期差動エンコーディングフラグは、複数の値を有し得る。例えば、二次チャネルピッチ周期差動エンコーディングフラグは、前もってセットされた第1値であってよい。例えば、二次チャネルピッチ周期差動エンコーディングフラグの値が1である場合に、差動デコーディングは二次チャネル信号のピッチ周期に対して実行される。
一次チャネル信号の推定ピッチ周期値と、現在のフレームの二次チャネル信号が分割されるサブフレームの数とに基づき、二次チャネル信号の閉ループピッチ周期基準値を決定することと、
二次チャネル信号のピッチ周期探索範囲調整係数に基づき二次チャネル信号のピッチ周期インデックス値の上限を決定することと、
二次チャネル信号の閉ループピッチ周期基準値、二次チャネル信号のピッチ周期インデックス値、及び二次チャネル信号のピッチ周期インデックス値の上限に基づき、二次チャネル信号の推定ピッチ周期値を計算することと
を含む。具体的に、二次チャネル信号の閉ループピッチ周期基準値は、一次チャネル信号の推定ピッチ周期値を使用することによって決定される。詳細については、上記の計算プロセスを参照されたい。二次チャネル信号のピッチ周期探索範囲調整係数は、二次チャネル信号のピッチ周期インデックス値の上限を決定するよう、二次チャネル信号のピッチ周期インデックス値を調整するために使用され得る。二次チャネル信号のピッチ周期インデックス値の上限は、二次チャネル信号のピッチ周期インデックス値が超えることができない上限値を示す。二次チャネル信号のピッチ周期インデックス値の上限は、二次チャネル信号のピッチ周期インデックス値を決定するために使用され得る。二次チャネル信号の閉ループピッチ周期基準値、二次チャネル信号のピッチ周期インデックス値、及び二次チャネル信号のピッチ周期インデックス値の上限を決定した後、デコーダ側は、二次チャネル信号の閉ループピッチ周期基準値、二次チャネル信号のピッチ周期インデックス値、及び二次チャネル信号のピッチ周期インデックス値の上限に基づき差動デコーディングを実行し、二次チャネル信号の推定ピッチ周期値を出力する。
次の方法:
T0_pitch=f_pitch_prim+(soft_reuse_index-soft_reuse_index_high_limit/M)/N
で二次チャネル信号の推定ピッチ周期値T0_pitchを計算することを含み、f_pitch_primは、二次チャネル信号の閉ループピッチ周期基準値を表し、soft_reuse_indexは、二次チャネル信号のピッチ周期インデックス値を表し、Nは、二次チャネル信号が分割されるサブフレームの数を表し、Mは、二次チャネル信号のピッチ周期インデックス値の上限の調整係数を表し、Mは、非ゼロの実数であり、/は、除算演算子を表し、+は、加算演算子を表し、-は、減算演算子を表す。
現在のフレームの左チャネル信号及び現在のフレームの右チャネル信号に対してダウンミックス処理を実行して、現在のフレームの一次チャネル信号及び現在のフレームの二次チャネル信号を取得するよう構成されるダウンミックスモジュールと、
二次チャネル信号のピッチ周期に対して差動エンコーディングを実行すると決定される場合に、一次チャネル信号の推定ピッチ周期値を使用することによって二次チャネル信号のピッチ周期に対して差動エンコーディングを実行して、二次チャネル信号のピッチ周期インデックス値を取得するよう構成される差動エンコーディングモジュールと
を含み、二次チャネル信号のピッチ周期インデックス値は、送信されるべきステレオエンコードされたビットストリームを生成するために使用される、装置を更に提供する。
現在のフレームの一次チャネル信号をエンコードして、一次チャネル信号の推定ピッチ周期値を取得するよう構成される一次チャネルエンコーディングモジュールと、
現在のフレームの二次チャネル信号に対して開ループピッチ周期解析を実行して、二次チャネル信号の推定開ループピッチ周期値を取得するよう構成される開ループ解析モジュールと、
一次チャネル信号の推定ピッチ周期値と二次チャネル信号の推定開ループピッチ周期値との間の差が前もってセットされた二次チャネルピッチ周期差動エンコーディング閾値を超えるかどうかを決定し、差が二次チャネルピッチ周期差動エンコーディング閾値を超える場合には、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行すると決定し、あるいは、差が二次チャネルピッチ周期差動エンコーディング閾値を超えない場合には、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行することをスキップすると決定するよう構成される閾値決定モジュールと
を更に含む。
二次チャネル信号のピッチ周期に対して差動エンコーディングを実行すると決定される場合に、現在のフレームにおける二次チャネルピッチ周期差動エンコーディングフラグを前もってセットされた第1値に設定するよう構成されるフラグ設定モジュールを更に含み、
ステレオエンコードされたビットストリームが、二次チャネルピッチ周期差動エンコーディングフラグを運び、第1値は、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行することを示すために使用される。
二次チャネル信号のピッチ周期に対して差動エンコーディングを実行することをスキップし、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用することをスキップすると決定される場合に、二次チャネル信号のピッチ周期と一次チャネル信号のピッチ周期とを別々にエンコードするよう構成される。
二次チャネル信号のピッチ周期に対して差動エンコーディングを実行することをスキップし、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用すると決定される場合に、二次チャネル信号ピッチ周期再利用フラグを前もってセットされた第4値に設定し、ステレオエンコードされたビットストリームを使用して二次チャネル信号ピッチ周期再利用フラグを運ぶよう構成されるフラグ設定モジュールを更に含み、第4値は、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用することを示すために使用される。
一次チャネル信号の推定ピッチ周期値に基づき二次チャネル信号閉ループピッチ周期探索を実行して、二次チャネル信号の推定ピッチ周期値を取得するよう構成される閉ループピッチ周期探索モジュールと、
二次チャネル信号のピッチ周期探索範囲調整係数に基づき二次チャネル信号のピッチ周期インデックス値の上限を決定するよう構成されるインデックス値上限決定モジュールと、
一次チャネル信号の推定ピッチ周期値、二次チャネル信号の推定ピッチ周期値、及び二次チャネル信号のピッチ周期インデックス値の上限に基づき、二次チャネル信号のピッチ周期インデックス値を計算するよう構成されるインデックス値計算モジュールと
を含む。
一次チャネル信号の推定ピッチ周期値と、現在のフレームの二次チャネル信号が分割されるサブフレームの数とに基づき、二次チャネル信号の閉ループピッチ周期基準値を決定し、
整数精度及び分数精度を使用することによって、かつ、二次チャネル信号の閉ループピッチ周期基準値を二次チャネル信号閉ループピッチ周期探索の開始点として使用することによって、閉ループピッチ周期探索を実行して、二次チャネル信号の推定ピッチ周期値を取得する
よう構成される。
一次チャネル信号の推定ピッチ周期値に基づき、二次チャネル信号の閉ループピッチ周期整数部loc_T0及び二次チャネル信号の閉ループピッチ周期分数部loc_frac_primを決定し、
次の方法:
f_pitch_prim=loc_T0+loc_frac_prim/N
で二次チャネル信号の閉ループピッチ周期基準値f_pitch_primを計算する
よう構成され、Nは、二次チャネル信号が分割されるサブフレームの数を表す。
次の方法:
soft_reuse_index_high_limit=0.5+2Z
で二次チャネル信号のピッチ周期インデックス値の上限soft_reuse_index_high_limitを計算するよう構成され、Zは、二次チャネル信号のピッチ周期探索範囲調整係数である。
一次チャネル信号の推定ピッチ周期値に基づき、二次チャネル信号の閉ループピッチ周期整数部loc_T0及び二次チャネル信号の閉ループピッチ周期分数部loc_frac_primを決定し、
次の方法:
soft_reuse_index=(N×pitch_soft_reuse+pitch_frac_soft_reuse)-(N×loc_T0+loc_frac_prim)+soft_reuse_index_high_limit/M
で二次チャネル信号のピッチ周期インデックス値soft_reuse_indexを計算する
よう構成され、pitch_soft_reuseは、二次チャネル信号の推定ピッチ周期値の整数部を表し、pitch_frac_soft_reuseは、二次チャネル信号の推定ピッチ周期値の分数部を表し、soft_reuse_index_high_limitは、二次チャネル信号のピッチ周期インデックス値の上限を表し、Nは、二次チャネル信号が分割されるサブフレームの数を表し、Mは、二次チャネル信号のピッチ周期インデックス値の上限の調整係数を表し、Mは、非ゼロの実数であり、×は、乗算演算子を表し、+は、加算演算子を表し、-は、減算演算子を表す。
受け取られたステレオエンコードされたビットストリームに基づき、二次チャネル信号のピッチ周期に対して差動デコーディングを実行すべきかどうかを決定するよう構成される決定モジュールと、
二次チャネル信号のピッチ周期に対して差動デコーディングを実行すると決定される場合に、ステレオエンコードされたビットストリームから、現在のフレームの一次チャネル信号の推定ピッチ周期値及び現在のフレームの二次チャネル信号のピッチ周期インデックス値を取得するよう構成される値取得モジュールと、
一次チャネル信号の推定ピッチ周期値及び二次チャネル信号のピッチ周期インデックス値に基づき二次チャネル信号のピッチ周期に対して差動デコーディングを実行して、二次チャネル信号の推定ピッチ周期値を取得するよう構成される差動デコーディングモジュールと
を含み、二次チャネル信号の推定ピッチ周期値は、ステレオエンコードされたビットストリームをデコードするために使用される、装置を更に提供する。
現在のフレームから二次チャネルピッチ周期差動エンコーディングフラグを取得し、
二次チャネルピッチ周期差動エンコーディングフラグが前もってセットされた第1値である場合に、二次チャネル信号のピッチ周期に対して差動デコーディングを実行すると決定する
よう構成される。
二次チャネル信号のピッチ周期に対して差動デコーディングを実行することをスキップし、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用することをスキップすると決定される場合に、ステレオエンコードされたビットストリームから二次チャネル信号のピッチ周期をデコードするよう構成される。
二次チャネル信号のピッチ周期に対して差動デコーディングを実行することをスキップし、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用すると決定される場合に、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として使用するよう構成される。
一次チャネル信号の推定ピッチ周期値と、現在のフレームの二次チャネル信号が分割されるサブフレームの数とに基づき、二次チャネル信号の閉ループピッチ周期基準値を決定するよう構成される基準値決定サブモジュールと、
二次チャネル信号のピッチ周期探索範囲調整係数に基づき二次チャネル信号のピッチ周期インデックス値の上限を決定するよう構成されるインデックス値上限決定サブモジュールと、
二次チャネル信号の閉ループピッチ周期基準値、二次チャネル信号のピッチ周期インデックス値、及び二次チャネル信号のピッチ周期インデックス値の上限に基づき、二次チャネル信号の推定ピッチ周期値を計算するよう構成される推定値計算サブモジュールと
を含む。
次の方法:
T0_pitch=f_pitch_prim+(soft_reuse_index-soft_reuse_index_high_limit/M)/N
で二次チャネル信号の推定ピッチ周期値T0_pitchを計算するよう構成され、f_pitch_primは、二次チャネル信号の閉ループピッチ周期基準値を表し、soft_reuse_indexは、二次チャネル信号のピッチ周期インデックス値を表し、Nは、二次チャネル信号が分割されるサブフレームの数を表し、Mは、二次チャネル信号のピッチ周期インデックス値の上限の調整係数を表し、Mは、非ゼロの実数であり、/は、除算演算子を表し、+は、加算演算子を表し、-は、減算演算子を表す。
現在のフレームの一次チャネル信号をエンコードして、一次チャネル信号の推定ピッチ周期値を取得することと、
現在のフレームの二次チャネル信号に対して開ループピッチ周期解析を実行して、二次チャネル信号の推定開ループピッチ周期値を取得することと、
一次チャネル信号の推定ピッチ周期値と二次チャネル周期の推定開ループピッチ周期値との間の差が前もってセットされた二次チャネルピッチ周期差動エンコーディング閾値を超えるかどうかを決定することと、
差が二次チャネルピッチ周期差動エンコーディング閾値を超える場合には、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行すると決定し、あるいは、差が二次チャネルピッチ周期差動エンコーディング閾値を超えない場合には、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行することをスキップすると決定することと
を含む。
二次チャネル信号のピッチ周期に対して差動エンコーディングを実行すると決定する場合に、現在のフレームにおける二次チャネルピッチ周期差動エンコーディングフラグを前もってセットされた第1値に設定することを更に含み、
ステレオエンコードされたビットストリームが、二次チャネルピッチ周期差動エンコーディングフラグを運び、第1値は、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行することを示すために使用される。
二次チャネル信号のピッチ周期に対して差動エンコーディングを実行することをスキップし、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用することをスキップすると決定する場合に、二次チャネル信号のピッチ周期と一次チャネル信号のピッチ周期とを別々にエンコードすることを更に含む。
二次チャネル信号のピッチ周期に対して差動エンコーディングを実行することをスキップし、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用すると決定する場合に、二次チャネル信号ピッチ周期再利用フラグを前もってセットされた第4値に設定し、ステレオエンコードされたビットストリームを使用して二次チャネル信号ピッチ周期再利用フラグを運ぶことを更に含み、
第4値は、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用することを示すために使用される。
二次チャネル信号のピッチ周期に対して差動エンコーディングを実行することをスキップすると決定する場合に、二次チャネルピッチ周期差動エンコーディングフラグを前もってセットされた第2値に設定することであり、ステレオエンコードされたビットストリームが、二次チャネルピッチ周期差動エンコーディングフラグを運び、第2値は、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行することをスキップすることを示すために使用される、ことと、
一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用することをスキップすると決定する場合に、二次チャネル信号ピッチ周期再利用フラグを前もってセットされた第3値に設定することであり、ステレオエンコードされたビットストリームが二次チャネル信号ピッチ周期再利用フラグを運び、第3値は、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用することをスキップすることを示すために使用される、ことと、
二次チャネル信号のピッチ周期及び一次チャネル信号のピッチ周期を別々にエンコードすることと
を更に含む。
二次チャネル信号のピッチ周期に対して差動エンコーディングを実行することをスキップすると決定する場合に、二次チャネルピッチ周期差動エンコーディングフラグを前もってセットされた第2値に設定することであり、ステレオエンコードされたビットストリームが、二次チャネルピッチ周期差動エンコーディングフラグを運び、第2値は、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行することをスキップすることを示すために使用される、ことと、
一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用すると決定する場合に、二次チャネル信号ピッチ周期再利用フラグを前もってセットされた第4値に設定することであり、ステレオエンコードされたビットストリームが二次チャネル信号ピッチ周期再利用フラグを運び、第4値は、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用することを示すために使用される、ことと
を更に含む。
一次チャネル信号の推定ピッチ周期値に基づき二次チャネル信号閉ループピッチ周期探索を実行して、二次チャネル信号の推定ピッチ周期値を取得することと、
二次チャネル信号のピッチ周期探索範囲調整係数に基づき二次チャネル信号のピッチ周期インデックス値の上限を決定することと、
一次チャネル信号の推定ピッチ周期値、二次チャネル信号の推定ピッチ周期値、及び二次チャネル信号のピッチ周期インデックス値の上限に基づき、二次チャネル信号のピッチ周期インデックス値を計算することと
を含む。
一次チャネル信号の推定ピッチ周期値と、現在のフレームの二次チャネル信号が分割されるサブフレームの数とに基づき、二次チャネル信号の閉ループピッチ周期基準値を決定することと、
整数精度及び分数精度を使用することによって、かつ、二次チャネル信号の閉ループピッチ周期基準値を二次チャネル信号閉ループピッチ周期探索の開始点として使用することによって、閉ループピッチ周期探索を実行して、二次チャネル信号の推定ピッチ周期値を取得することと
を含む。
一次チャネル信号の推定ピッチ周期値に基づき、二次チャネル信号の閉ループピッチ周期整数部loc_T0及び二次チャネル信号の閉ループピッチ周期分数部loc_frac_primを決定することと、
次の方法:
f_pitch_prim=loc_T0+loc_frac_prim/N
で二次チャネル信号の閉ループピッチ周期基準値f_pitch_primを計算することと
を含み、Nは、二次チャネル信号が分割されるサブフレームの数を表す。
次の方法:
soft_reuse_index_high_limit=0.5+2Z
で二次チャネル信号のピッチ周期インデックス値の上限soft_reuse_index_high_limitを計算することを含み、
Zは、二次チャネル信号のピッチ周期探索範囲調整係数であり、Zの値は、3、4、又は5である。
一次チャネル信号の推定ピッチ周期値に基づき、二次チャネル信号の閉ループピッチ周期整数部loc_T0及び二次チャネル信号の閉ループピッチ周期分数部loc_frac_primを決定することと、
次の方法:
soft_reuse_index=(N×pitch_soft_reuse+pitch_frac_soft_reuse)-(N×loc_T0+loc_frac_prim)+soft_reuse_index_high_limit/M
で二次チャネル信号のピッチ周期インデックス値soft_reuse_indexを計算することと
を含み、
pitch_soft_reuseは、二次チャネル信号の推定ピッチ周期値の整数部を表し、pitch_frac_soft_reuseは、二次チャネル信号の推定ピッチ周期値の分数部を表し、soft_reuse_index_high_limitは、二次チャネル信号のピッチ周期インデックス値の上限を表し、Nは、二次チャネル信号が分割されるサブフレームの数を表し、Mは、二次チャネル信号のピッチ周期インデックス値の上限の調整係数を表し、Mは、非ゼロの実数であり、×は、乗算演算子を表し、+は、加算演算子を表し、-は、減算演算子を表す。
現在のフレームから二次チャネルピッチ周期差動エンコーディングフラグを取得することと、
二次チャネルピッチ周期差動エンコーディングフラグが前もってセットされた第1値である場合に、二次チャネル信号のピッチ周期に対して差動デコーディングを実行すると決定することと
を含む。
二次チャネル信号のピッチ周期に対して差動デコーディングを実行することをスキップし、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用することをスキップすると決定する場合に、ステレオエンコードされたビットストリームから二次チャネル信号のピッチ周期をデコードすることを更に含む。
二次チャネル信号のピッチ周期に対して差動デコーディングを実行することをスキップし、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用すると決定する場合に、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として使用することを更に含む。
二次チャネルピッチ周期差動エンコーディングフラグが前もってセットされた第2値であり、ステレオエンコードされたビットストリームで運ばれた二次チャネル信号ピッチ周期再利用フラグが前もってセットされた第3値である場合に、二次チャネル信号のピッチ周期に対して差動デコーディングを実行しないと、かつ、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用しないと決定し、二次チャネル信号のピッチ周期をステレオエンコードされたビットストリームからデコードする。
二次チャネルピッチ周期差動エンコーディングフラグが前もってセットされた第2値であり、ステレオエンコードされたビットストリームで運ばれた二次チャネル信号ピッチ周期再利用フラグが前もってセットされた第4値である場合に、二次チャネル信号のピッチ周期に対して差動デコーディングを実行しないと決定し、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用する。
一次チャネル信号の推定ピッチ周期値と、現在のフレームの二次チャネル信号が分割されるサブフレームの数とに基づき、二次チャネル信号の閉ループピッチ周期基準値を決定することと、
二次チャネル信号のピッチ周期探索範囲調整係数に基づき二次チャネル信号のピッチ周期インデックス値の上限を決定することと、
二次チャネル信号の閉ループピッチ周期基準値、二次チャネル信号のピッチ周期インデックス値、及び二次チャネル信号のピッチ周期インデックス値の上限に基づき、二次チャネル信号の推定ピッチ周期値を計算することと
を含む。
次の方法:
T0_pitch=f_pitch_prim+(soft_reuse_index-soft_reuse_index_high_limit/M)/N
で二次チャネル信号の推定ピッチ周期値T0_pitchを計算することを含み、
f_pitch_primは、二次チャネル信号の閉ループピッチ周期基準値を表し、soft_reuse_indexは、二次チャネル信号のピッチ周期インデックス値を表し、Nは、二次チャネル信号が分割されるサブフレームの数を表し、Mは、二次チャネル信号のピッチ周期インデックス値の上限の調整係数を表し、Mは、非ゼロの実数であり、/は、除算演算子を表し、+は、加算演算子を表し、-は、減算演算子を表す。
H20Hz(z)
=(b0+b1z-1+b2z-2)/(1+a1z-1+a2z-2)
であり、b0=0.994461788958195、b1=-1.988923577916390、b2=0.994461788958195、a1=1.988892905899653、a2=-0.988954249933127、zはZ変換領域での変換係数である。
xL_HP(n)=b0×xL(n)+b1×xL(n-1)+b2×xL(n-2)-a1×xL_HP(n-1)-a2×xL_HP(n-2)
であり、つまり、離散フーリエ変換の長さは400サンプリングポイントである。この場合に、i番目のサブフレームの変換された左チャネル周波数領域信号は、Li(k)と表され得、k=0,1,・・・,L/2-1であり、i番目のサブフレームの変換された右チャネル周波数領域信号はRi(k)と表され得、k=0,1,・・・,L/2-1であり、kは周波数ビンインデックス値であり、iはサブフレームインデックス値であり、i=0,1,・・・,P-1である。
DIFF=|Σ(pitch[0])-Σ(pitch[1])|
であり、DIFFは、一次チャネル信号の推定ピッチ周期値と二次チャネル信号の推定開ループピッチ周期値との間の差を表す。|Σ(pitch[0])-Σ(pitch[1])|は、Σ(pitch[0])とΣ(pitch[1])との間の差の絶対値を表す。Σ(pitch[0])は、一次チャネル信号の推定ピッチ周期値を表し、Σ(pitch[1])は、二次チャネル信号の推定開ループピッチ周期値を表す。
soft_reuse_index_high_limit=2Z
を使用することによって計算され、ここで、Zは、二次チャネル信号のピッチ周期探索範囲調整係数である。この実施形態では、Z=3、4、又は5である。
soft_reuse_index=(4×pitch_soft_reuse+pitch_frac_soft_reuse)-(4×loc_T0+loc_frac_prim)+soft_reuse_index_high_limit/2
を使用することによって計算される。
f_pitch_prim=loc_T0+loc_frac_prim/4.0
を使用することによって計算される。
soft_reuse_index_high_limit=0.5+2Z
を使用することによって計算され、ここで、Zは、二次チャネル信号のピッチ周期探索範囲調整係数である。この実施形態では、Zは3、4、又は5であってよい。
T0_pitch=f_pitch_prim+(soft_reuse_index-soft_reuse_index_high_limit/2.0)/4.0
ここで、
T=INT(T0_pitch)、及び
T0_frac=(T0_pitch-T0)×4.0
である。
[外1]
と表され、現在のフレームの前処理された右チャネル時間領域信号は、
[外2]
と表され、nはサンプリングポイント数であり、n=0,1,・・・,N-1である。
ratio=rms_R/(rms_L+rms_R)
を満足する。
ratioqua=ratio_tabl[ratio_idx]
ここで、ratio_tablはスカラー量子化コードブックである。量子化及びエンコーディングは、本願の実施形態では任意のスカラー量子化方法、例えば、一様スカラー量子化又は非一様スカラー量子化を使用することによって、実行されてもよい。エンコーディングのために使用されるビット数は5ビットであり得る。具体的な方法はここでは記載されない。
現在のフレームの一次チャネル信号をエンコードして、一次チャネル信号の推定ピッチ周期値を取得するよう構成される一次チャネルエンコーディングモジュールと、
現在のフレームの二次チャネル信号に対して開ループピッチ周期解析を実行して、二次チャネル信号の推定開ループピッチ周期値を取得するよう構成される開ループ解析モジュールと、
一次チャネル信号の推定ピッチ周期値と二次チャネル信号の推定開ループピッチ周期値との間の差が前もってセットされた二次チャネルピッチ周期差動エンコーディング閾値を超えるかどうかを決定し、差が二次チャネルピッチ周期差動エンコーディング閾値を超える場合には、差動エンコーディングを実行すると決定し、あるいは、差が二次チャネルピッチ周期差動エンコーディング閾値を超えない場合には、差動エンコーディングを実行することをスキップすると決定するよう構成される閾値決定モジュールと
を含む。
二次チャネル信号のピッチ周期に対して差動エンコーディングを実行すると決定される場合に、現在のフレームにおける二次チャネルピッチ周期差動エンコーディングフラグを前もってセットされた第1値に設定するよう構成されるフラグ設定モジュールを更に含み、
ステレオエンコードされたビットストリームが、二次チャネルピッチ周期差動エンコーディングフラグを運び、第1値は、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行することを示すために使用される。
二次チャネル信号のピッチ周期に対して差動エンコーディングを実行することをスキップすると決定される場合に、二次チャネルピッチ周期差動エンコーディングフラグを前もってセットされた第2値に設定し、ステレオエンコードされたビットストリームが、二次チャネルピッチ周期差動エンコーディングフラグを運び、第2値は、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行しないことを示すために使用され、
一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用することをスキップすると決定される場合に、二次チャネル信号ピッチ周期再利用フラグを前もってセットされた第3値に設定し、ステレオエンコードされたビットストリームが二次チャネル信号ピッチ周期再利用フラグを運び、第3値は、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用しないことを示すために使用される
よう更に構成される。
二次チャネル信号のピッチ周期に対して差動エンコーディングを実行することをスキップし、かつ、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用すると決定される場合に、二次チャネル信号ピッチ周期再利用フラグを前もってセットされた第4値に設定し、ステレオエンコードされたビットストリームを使用して二次チャネル信号ピッチ周期再利用フラグを運ぶよう構成され、
第4値は、一次チャネル信号の推定ピッチ周期値を二次チャネル信号の前記ピッチ周期として再利用することを示すために使用される。
二次チャネル信号のピッチ周期に対して差動エンコーディングを実行することをスキップすると決定される場合に、二次チャネルピッチ周期差動エンコーディングフラグを前もってセットされた第2値に設定し、ステレオエンコードされたビットストリームが、二次チャネルピッチ周期差動エンコーディングフラグを運び、第2値は、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行しないことを示すために使用され、
一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用すると決定される場合に、二次チャネル信号ピッチ周期再利用フラグを前もってセットされた第4値に設定し、ステレオエンコードされたビットストリームを使用して二次チャネル信号ピッチ周期再利用フラグを運び、第4値は、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用することを示すために使用される
よう更に構成される。
一次チャネル信号の推定ピッチ周期値に基づき二次チャネル信号閉ループピッチ周期探索を実行して、二次チャネル信号の推定ピッチ周期値を取得するよう構成される閉ループピッチ周期探索モジュールと、
二次チャネル信号のピッチ周期探索範囲調整係数に基づき二次チャネル信号のピッチ周期インデックス値の上限を決定するよう構成されるインデックス値上限決定モジュールと、
一次チャネル信号の推定ピッチ周期値、二次チャネル信号の推定ピッチ周期値、及び二次チャネル信号のピッチ周期インデックス値の上限に基づき、二次チャネル信号のピッチ周期インデックス値を計算するよう構成されるインデックス値計算モジュールと
を含む。
一次チャネル信号の推定ピッチ周期値と、現在のフレームの二次チャネル信号が分割されるサブフレームの数とに基づき、二次チャネル信号の閉ループピッチ周期基準値を決定し、
整数精度及び分数精度を使用することによって、かつ、二次チャネル信号の閉ループピッチ周期基準値を二次チャネル信号閉ループピッチ周期探索の開始点として使用することによって、閉ループピッチ周期探索を実行して、二次チャネル信号の推定ピッチ周期値を取得する
よう構成される。
一次チャネル信号の推定ピッチ周期値に基づき、二次チャネル信号の閉ループピッチ周期整数部loc_T0及び二次チャネル信号の閉ループピッチ周期分数部loc_frac_primを決定し、
次の方法:
f_pitch_prim=loc_T0+loc_frac_prim/N
で二次チャネル信号の閉ループピッチ周期基準値f_pitch_primを計算する
よう構成され、
Nは、二次チャネル信号が分割されるサブフレームの数を表す。
soft_reuse_index_high_limit=0.5+2Z
で二次チャネル信号のピッチ周期インデックス値の前記上限soft_reuse_index_high_limitを計算するよう構成され、
Zは、二次チャネル信号のピッチ周期探索範囲調整係数であり、Zの値は、3、4、又は5である。
一次チャネル信号の推定ピッチ周期値に基づき、二次チャネル信号の閉ループピッチ周期整数部loc_T0及び二次チャネル信号の閉ループピッチ周期分数部loc_frac_primを決定し、
次の方法:
soft_reuse_index=(N×pitch_soft_reuse+pitch_frac_soft_reuse)-(N×loc_T0+loc_frac_prim)+soft_reuse_index_high_limit/M
で二次チャネル信号のピッチ周期インデックス値soft_reuse_indexを計算するよう構成され、
pitch_soft_reuseは、二次チャネル信号の推定ピッチ周期値の整数部を表し、pitch_frac_soft_reuseは、二次チャネル信号の推定ピッチ周期値の分数部を表し、soft_reuse_index_high_limitは、二次チャネル信号のピッチ周期インデックス値の上限を表し、Nは、二次チャネル信号が分割されるサブフレームの数を表し、Mは、二次チャネル信号のピッチ周期インデックス値の上限の調整係数を表し、Mは、非ゼロの実数であり、×は、乗算演算子を表し、+は、加算演算子を表し、-は、減算演算子を表す。
二次チャネル信号のピッチ周期に対して差動デコーディングを実行することをスキップし、かつ、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用することをスキップすると決定される場合に、ステレオエンコードされたビットストリームから二次チャネル信号のピッチ周期をデコードするよう構成される。
二次チャネルピッチ周期差動エンコーディングフラグが前もってセットされた第2値であり、かつ、ステレオエンコードされたビットストリームで運ばれた二次チャネル信号ピッチ周期再利用フラグが前もってセットされた第3値である場合に、二次チャネル信号のピッチ周期に対して差動デコーディングを実行しないと、かつ、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用しないと決定し、ステレオエンコードされたビットストリームから二次チャネル信号のピッチ周期をデコードするよう構成される。
二次チャネル信号のピッチ周期に対して差動デコーディングを実行することをスキップし、かつ、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用すると決定される場合に、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として使用するよう構成される。
二次チャネルピッチ周期差動エンコーディングフラグが前もってセットされた第2値であり、かつ、ステレオエンコードされたビットストリームで運ばれた二次チャネル信号ピッチ周期再利用フラグが前もってセットされた第4値である場合に、二次チャネル信号のピッチ周期に対して差動デコーディングを実行しないと決定し、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用するよう構成される。
一次チャネル信号の推定ピッチ周期値と、現在のフレームの二次チャネル信号が分割されるサブフレームの数とに基づき、二次チャネル信号の閉ループピッチ周期基準値を決定するよう構成される基準値決定サブモジュールと、
二次チャネル信号のピッチ周期探索範囲調整係数に基づき二次チャネル信号のピッチ周期インデックス値の上限を決定するよう構成されるインデックス値上限決定サブモジュールと、
二次チャネル信号の閉ループピッチ周期基準値、二次チャネル信号のピッチ周期インデックス値、及び二次チャネル信号のピッチ周期インデックス値の上限に基づき、二次チャネル信号の推定ピッチ周期値を計算するよう構成される推定値計算サブモジュールと
を含む。
T0_pitch=f_pitch_prim+(soft_reuse_index-soft_reuse_index_high_limit/M)/N
で二次チャネル信号の推定ピッチ周期値T0_pitchを計算するよう構成され、
f_pitch_primは、二次チャネル信号の閉ループピッチ周期基準値を表し、soft_reuse_indexは、二次チャネル信号のピッチ周期インデックス値を表し、Nは、二次チャネル信号が分割されるサブフレームの数を表し、Mは、二次チャネル信号のピッチ周期インデックス値の上限の調整係数を表し、Mは、非ゼロの実数であり、/は、除算演算子を表し、+は、加算演算子を表し、-は、減算演算子を表す。
受信器1201、送信器1202、プロセッサ1203、及びメモリ1204を含む(ステレオエンコーディング装置1200には1つ以上のプロセッサ1203に存在してもよく、1つのプロセッサが図12では例として使用されている)。本願のいくつかの実施形態において、受信器1201、送信器1202、プロセッサ1203、及びメモリ1204は、バスを通じて又は他の様態で接続されてもよい。図12では、バスを通じた接続が例として使用されている。
受信器1301、送信器1302、プロセッサ1303、及びメモリ1304を含む(ステレオデコーディング装置1300には1つ以上のプロセッサ1303に存在してもよく、1つのプロセッサが図13では例として使用されている)。本願のいくつかの実施形態において、受信器1301、送信器1302、プロセッサ1303、及びメモリ1304は、バスを通じて又は他の様態で接続されてもよい。図13では、バスを通じた接続が例として使用されている。
Claims (40)
- ステレオエンコーディング方法であって、
現在のフレームの左チャネル信号及び前記現在のフレームの右チャネル信号に対してダウンミックス処理を実行して、前記現在のフレームの一次チャネル信号及び前記現在のフレームの二次チャネル信号を取得することと、
前記二次チャネル信号のピッチ周期に対して差動エンコーディングを実行すると決定する場合に、前記一次チャネル信号の推定ピッチ周期値を使用することによって前記二次チャネル信号の前記ピッチ周期に対して差動エンコーディングを実行して、前記二次チャネル信号のピッチ周期インデックス値を取得することであり、前記二次チャネル信号の前記ピッチ周期インデックス値は、送信されるべきステレオエンコードされたビットストリームを生成するために使用される、ことと
を有し、
前記一次チャネル信号の推定ピッチ周期値を使用することによって前記二次チャネル信号の前記ピッチ周期に対して差動エンコーディングを実行して、前記二次チャネル信号のピッチ周期インデックス値を取得することは、
前記一次チャネル信号の前記推定ピッチ周期値に基づき二次チャネル信号閉ループピッチ周期探索を実行して、前記二次チャネル信号の推定ピッチ周期値を取得することと、
前記二次チャネル信号のピッチ周期探索範囲調整係数に基づき前記二次チャネル信号の前記ピッチ周期インデックス値の上限を決定することと、
前記一次チャネル信号の前記推定ピッチ周期値、前記二次チャネル信号の前記推定ピッチ周期値、及び前記二次チャネル信号の前記ピッチ周期インデックス値の前記上限に基づき、前記二次チャネル信号の前記ピッチ周期インデックス値を計算することと
を有する、
方法。 - 当該方法は、
前記現在のフレームの前記一次チャネル信号をエンコードして、前記一次チャネル信号の前記推定ピッチ周期値を取得することと、
前記現在のフレームの前記二次チャネル信号に対して開ループピッチ周期解析を実行して、前記二次チャネル信号の推定開ループピッチ周期値を取得することと、
前記一次チャネル信号の前記推定ピッチ周期値と前記二次チャネル信号の前記推定開ループピッチ周期値との間の差が前もってセットされた二次チャネルピッチ周期差動エンコーディング閾値を超えるかどうかを決定することと、
前記差が前記二次チャネルピッチ周期差動エンコーディング閾値を超える場合には、前記二次チャネル信号の前記ピッチ周期に対して差動エンコーディングを実行すると決定し、あるいは、前記差が前記二次チャネルピッチ周期差動エンコーディング閾値を超えない場合には、前記二次チャネル信号の前記ピッチ周期に対して差動エンコーディングを実行することをスキップすると決定することと
を更に有する、
請求項1に記載の方法。 - 前記二次チャネル信号の前記ピッチ周期に対して差動エンコーディングを実行すると決定される場合に、当該方法は、
前記現在のフレームにおける二次チャネルピッチ周期差動エンコーディングフラグを前もってセットされた第1値に設定することを更に有し、
前記ステレオエンコードされたビットストリームが、前記二次チャネルピッチ周期差動エンコーディングフラグを運び、前記第1値は、前記二次チャネル信号の前記ピッチ周期に対して差動エンコーディングを実行することを示すために使用される、
請求項1又は2に記載の方法。 - 当該方法は、
前記二次チャネル信号の前記ピッチ周期に対して差動エンコーディングを実行することをスキップし、前記一次チャネル信号の前記推定ピッチ周期値を前記二次チャネル信号の前記ピッチ周期として再利用することをスキップすると決定する場合に、前記二次チャネル信号の前記ピッチ周期と前記一次チャネル信号のピッチ周期とを別々にエンコードすることを更に有する、
請求項1乃至3のうちいずれか一項に記載の方法。 - 当該方法は、
前記二次チャネル信号の前記ピッチ周期に対して差動エンコーディングを実行することをスキップし、前記一次チャネル信号の前記推定ピッチ周期値を前記二次チャネル信号の前記ピッチ周期として再利用すると決定する場合に、二次チャネル信号ピッチ周期再利用フラグを前もってセットされた第4値に設定し、前記ステレオエンコードされたビットストリームを使用して前記二次チャネル信号ピッチ周期再利用フラグを運ぶことを更に有し、
前記第4値は、前記一次チャネル信号の前記推定ピッチ周期値を前記二次チャネル信号の前記ピッチ周期として再利用することを示すために使用される、
請求項1乃至3のうちいずれか一項に記載の方法。 - 前記一次チャネル信号の前記推定ピッチ周期値に基づき二次チャネル信号閉ループピッチ周期探索を実行して、前記二次チャネル信号の推定ピッチ周期値を取得することは、
前記一次チャネル信号の前記推定ピッチ周期値と、前記現在のフレームの前記二次チャネル信号が分割されるサブフレームの数とに基づき、前記二次チャネル信号の閉ループピッチ周期基準値を決定することと、
整数精度及び分数精度を使用することによって、かつ、前記二次チャネル信号の前記閉ループピッチ周期基準値を前記二次チャネル信号閉ループピッチ周期探索の開始点として使用することによって、閉ループピッチ周期探索を実行して、前記二次チャネル信号の前記推定ピッチ周期値を取得することと
を有する、
請求項1乃至5のうちいずれか一項に記載の方法。 - 前記一次チャネル信号の前記推定ピッチ周期値と、前記現在のフレームの前記二次チャネル信号が分割されるサブフレームの数とに基づき、前記二次チャネル信号の閉ループピッチ周期基準値を決定することは、
前記一次チャネル信号の前記推定ピッチ周期値に基づき、前記二次チャネル信号の閉ループピッチ周期整数部loc_T0及び前記二次チャネル信号の閉ループピッチ周期分数部loc_frac_primを決定することと、
次の方法:
f_pitch_prim=loc_T0+loc_frac_prim/N
で前記二次チャネル信号の前記閉ループピッチ周期基準値f_pitch_primを計算することと
を有し、
Nは、前記二次チャネル信号が分割される前記サブフレームの数を表す、
請求項6に記載の方法。 - 前記二次チャネル信号のピッチ周期探索範囲調整係数に基づき前記二次チャネル信号の前記ピッチ周期インデックス値の上限を決定することは、
次の方法:
soft_reuse_index_high_limit=0.5+2Z
で前記二次チャネル信号の前記ピッチ周期インデックス値の前記上限soft_reuse_index_high_limitを計算することを有し、
Zは、前記二次チャネル信号の前記ピッチ周期探索範囲調整係数である、
請求項1乃至5のうちいずれか一項に記載の方法。 - Zの値は、3、4、又は5である、
請求項8に記載の方法。 - 前記一次チャネル信号の前記推定ピッチ周期値、前記二次チャネル信号の前記推定ピッチ周期値、及び前記二次チャネル信号の前記ピッチ周期インデックス値の前記上限に基づき、前記二次チャネル信号の前記ピッチ周期インデックス値を計算することは、
前記一次チャネル信号の前記推定ピッチ周期値に基づき、前記二次チャネル信号の閉ループピッチ周期整数部loc_T0及び前記二次チャネル信号の閉ループピッチ周期分数部loc_frac_primを決定することと、
次の方法:
soft_reuse_index=(N×pitch_soft_reuse+pitch_frac_soft_reuse)-(N×loc_T0+loc_frac_prim)+soft_reuse_index_high_limit/M
で前記二次チャネル信号の前記ピッチ周期インデックス値soft_reuse_indexを計算することと
を有し、
pitch_soft_reuseは、前記二次チャネル信号の前記推定ピッチ周期値の整数部を表し、pitch_frac_soft_reuseは、前記二次チャネル信号の前記推定ピッチ周期値の分数部を表し、soft_reuse_index_high_limitは、前記二次チャネル信号の前記ピッチ周期インデックス値の前記上限を表し、Nは、前記二次チャネル信号が分割されるサブフレームの数を表し、Mは、前記二次チャネル信号の前記ピッチ周期インデックス値の前記上限の調整係数を表し、Mは、非ゼロの実数であり、×は、乗算演算子を表し、+は、加算演算子を表し、-は、減算演算子を表す、
請求項1乃至5のうちいずれか一項に記載の方法。 - 前記二次チャネル信号の前記ピッチ周期インデックス値の前記上限の前記調整係数の値は、2又は3である、
請求項10に記載の方法。 - 当該方法は、前記現在のフレームのエンコーディングレートが前もってセットされたレート閾値よりも低いステレオエンコーディングシナリオに適用され、
前記レート閾値は、次の値:13.2キロビット毎秒(kbps)、16.4kbps、又は24.4kbps、のうちの少なくとも1つである、
請求項1乃至11のうちいずれか一項に記載の方法。 - ステレオデコーディング方法であって、
受け取られたステレオエンコードされたビットストリームに基づき、二次チャネル信号のピッチ周期に対して差動デコーディングを実行すべきかどうかを決定することと、
前記二次チャネル信号の前記ピッチ周期に対して差動デコーディングを実行すると決定する場合に、前記ステレオエンコードされたビットストリームから、現在のフレームの一次チャネル信号の推定ピッチ周期値及び前記現在のフレームの前記二次チャネル信号のピッチ周期インデックス値を取得することと、
前記一次チャネル信号の前記推定ピッチ周期値及び前記二次チャネル信号の前記ピッチ周期インデックス値に基づき前記二次チャネル信号の前記ピッチ周期に対して差動デコーディングを実行して、前記二次チャネル信号の推定ピッチ周期値を取得することであり、前記二次チャネル信号の前記推定ピッチ周期値は、前記ステレオエンコードされたビットストリームをデコードするために使用される、ことと
を有し、
前記一次チャネル信号の前記推定ピッチ周期値及び前記二次チャネル信号の前記ピッチ周期インデックス値に基づき前記二次チャネル信号の前記ピッチ周期に対して差動デコーディングを実行することは、
前記一次チャネル信号の前記推定ピッチ周期値と、前記現在のフレームの前記二次チャネル信号が分割されるサブフレームの数とに基づき、前記二次チャネル信号の閉ループピッチ周期基準値を決定することと、
前記二次チャネル信号のピッチ周期探索範囲調整係数に基づき前記二次チャネル信号の前記ピッチ周期インデックス値の上限を決定することと、
前記二次チャネル信号の前記閉ループピッチ周期基準値、前記二次チャネル信号の前記ピッチ周期インデックス値、及び前記二次チャネル信号の前記ピッチ周期インデックス値の前記上限に基づき、前記二次チャネル信号の前記推定ピッチ周期値を計算することと
を有する、
方法。 - 受け取られたステレオエンコードされたビットストリームに基づき、二次チャネル信号のピッチ周期に対して差動デコーディングを実行すべきかどうかを決定することは、
前記現在のフレームから二次チャネルピッチ周期差動エンコーディングフラグを取得することと、
前記二次チャネルピッチ周期差動エンコーディングフラグが前もってセットされた第1値である場合に、前記二次チャネル信号の前記ピッチ周期に対して差動デコーディングを実行すると決定することと
を有する、
請求項13に記載の方法。 - 当該方法は、
前記二次チャネル信号の前記ピッチ周期に対して差動デコーディングを実行することをスキップし、前記一次チャネル信号の前記推定ピッチ周期値を前記二次チャネル信号の前記ピッチ周期として再利用することをスキップすると決定する場合に、前記ステレオエンコードされたビットストリームから前記二次チャネル信号の前記ピッチ周期をデコードすることを更に有する、
請求項14に記載の方法。 - 当該方法は、
前記二次チャネル信号の前記ピッチ周期に対して差動デコーディングを実行することをスキップし、前記一次チャネル信号の前記推定ピッチ周期値を前記二次チャネル信号の前記ピッチ周期として再利用すると決定する場合に、前記一次チャネル信号の前記推定ピッチ周期値を前記二次チャネル信号の前記ピッチ周期として使用することを更に有する、
請求項14に記載の方法。 - 前記二次チャネル信号の前記閉ループピッチ周期基準値、前記二次チャネル信号の前記ピッチ周期インデックス値、及び前記二次チャネル信号の前記ピッチ周期インデックス値の前記上限に基づき、前記二次チャネル信号の前記推定ピッチ周期値を計算することは、
次の方法:
T0_pitch=f_pitch_prim+(soft_reuse_index-soft_reuse_index_high_limit/M)/N
で前記二次チャネル信号の前記推定ピッチ周期値T0_pitchを計算することを有し、
f_pitch_primは、前記二次チャネル信号の前記閉ループピッチ周期基準値を表し、soft_reuse_indexは、前記二次チャネル信号の前記ピッチ周期インデックス値を表し、Nは、前記二次チャネル信号が分割される前記サブフレームの数を表し、Mは、前記二次チャネル信号の前記ピッチ周期インデックス値の前記上限の調整係数を表し、Mは、非ゼロの実数であり、/は、除算演算子を表し、+は、加算演算子を表し、-は、減算演算子を表す、
請求項13乃至16のうちいずれか一項に記載の方法。 - 前記二次チャネル信号の前記ピッチ周期インデックス値の前記上限の前記調整係数の値は、2又は3である、
請求項17に記載の方法。 - ステレオエンコーディング装置であって、
現在のフレームの左チャネル信号及び前記現在のフレームの右チャネル信号に対してダウンミックス処理を実行して、前記現在のフレームの一次チャネル信号及び前記現在のフレームの二次チャネル信号を取得するよう構成されるダウンミックスモジュールと、
前記二次チャネル信号のピッチ周期に対して差動エンコーディングを実行すると決定される場合に、前記一次チャネル信号の推定ピッチ周期値を使用することによって前記二次チャネル信号の前記ピッチ周期に対して差動エンコーディングを実行して、前記二次チャネル信号のピッチ周期インデックス値を取得するよう構成される差動エンコーディングモジュールと
を有し、前記二次チャネル信号の前記ピッチ周期インデックス値は、送信されるべきステレオエンコードされたビットストリームを生成するために使用され、
前記差動エンコーディングモジュールは、
前記一次チャネル信号の前記推定ピッチ周期値に基づき二次チャネル信号閉ループピッチ周期探索を実行して、前記二次チャネル信号の推定ピッチ周期値を取得するよう構成される閉ループピッチ周期探索モジュールと、
前記二次チャネル信号のピッチ周期探索範囲調整係数に基づき前記二次チャネル信号の前記ピッチ周期インデックス値の上限を決定するよう構成されるインデックス値上限決定モジュールと、
前記一次チャネル信号の前記推定ピッチ周期値、前記二次チャネル信号の前記推定ピッチ周期値、及び前記二次チャネル信号の前記ピッチ周期インデックス値の前記上限に基づき、前記二次チャネル信号の前記ピッチ周期インデックス値を計算するよう構成されるインデックス値計算モジュールと
を有する、
装置。 - 当該ステレオエンコーディング装置は、
前記現在のフレームの前記一次チャネル信号をエンコードして、前記一次チャネル信号の前記推定ピッチ周期値を取得するよう構成される一次チャネルエンコーディングモジュールと、
前記現在のフレームの前記二次チャネル信号に対して開ループピッチ周期解析を実行して、前記二次チャネル信号の推定開ループピッチ周期値を取得するよう構成される開ループ解析モジュールと、
前記一次チャネル信号の前記推定ピッチ周期値と前記二次チャネル信号の前記推定開ループピッチ周期値との間の差が前もってセットされた二次チャネルピッチ周期差動エンコーディング閾値を超えるかどうかを決定し、前記差が前記二次チャネルピッチ周期差動エンコーディング閾値を超える場合には、前記二次チャネル信号の前記ピッチ周期に対して差動エンコーディングを実行すると決定し、あるいは、前記差が前記二次チャネルピッチ周期差動エンコーディング閾値を超えない場合には、前記二次チャネル信号の前記ピッチ周期に対して差動エンコーディングを実行することをスキップすると決定するよう構成される閾値決定モジュールと
を更に有する、
請求項19に記載の装置。 - 当該ステレオエンコーディング装置は、
前記二次チャネル信号の前記ピッチ周期に対して差動エンコーディングを実行すると決定される場合に、前記現在のフレームにおける二次チャネルピッチ周期差動エンコーディングフラグを前もってセットされた第1値に設定するよう構成されるフラグ設定モジュールを更に有し、
前記ステレオエンコードされたビットストリームが、前記二次チャネルピッチ周期差動エンコーディングフラグを運び、前記第1値は、前記二次チャネル信号の前記ピッチ周期に対して差動エンコーディングを実行することを示すために使用される、
請求項19又は20に記載の装置。 - 当該ステレオエンコーディング装置は、独立エンコーディングモジュールを更に有し、
前記独立エンコーディングモジュールは、前記二次チャネル信号の前記ピッチ周期に対して差動エンコーディングを実行することをスキップし、前記一次チャネル信号の前記推定ピッチ周期値を前記二次チャネル信号の前記ピッチ周期として再利用することをスキップすると決定される場合に、前記二次チャネル信号の前記ピッチ周期と前記一次チャネル信号のピッチ周期とを別々にエンコードするよう構成される、
請求項19乃至21のうちいずれか一項に記載の装置。 - 前記フラグ設定モジュールは、前記二次チャネル信号の前記ピッチ周期に対して差動エンコーディングを実行することをスキップし、前記一次チャネル信号の前記推定ピッチ周期値を前記二次チャネル信号の前記ピッチ周期として再利用すると決定される場合に、二次チャネル信号ピッチ周期再利用フラグを前もってセットされた第4値に設定し、前記ステレオエンコードされたビットストリームを使用して前記二次チャネル信号ピッチ周期再利用フラグを運ぶよう更に構成され、
前記第4値は、前記一次チャネル信号の前記推定ピッチ周期値を前記二次チャネル信号の前記ピッチ周期として再利用することを示すために使用される、
請求項21に記載の装置。 - 前記閉ループピッチ周期探索モジュールは、
前記一次チャネル信号の前記推定ピッチ周期値と、前記現在のフレームの前記二次チャネル信号が分割されるサブフレームの数とに基づき、前記二次チャネル信号の閉ループピッチ周期基準値を決定し、
整数精度及び分数精度を使用することによって、かつ、前記二次チャネル信号の前記閉ループピッチ周期基準値を前記二次チャネル信号閉ループピッチ周期探索の開始点として使用することによって、閉ループピッチ周期探索を実行して、前記二次チャネル信号の前記推定ピッチ周期値を取得する
よう構成される、
請求項19乃至23のうちいずれか一項に記載の装置。 - 前記閉ループピッチ周期探索モジュールは、
前記一次チャネル信号の前記推定ピッチ周期値に基づき、前記二次チャネル信号の閉ループピッチ周期整数部loc_T0及び前記二次チャネル信号の閉ループピッチ周期分数部loc_frac_primを決定し、
次の方法:
f_pitch_prim=loc_T0+loc_frac_prim/N
で前記二次チャネル信号の前記閉ループピッチ周期基準値f_pitch_primを計算する
よう構成され、
Nは、前記二次チャネル信号が分割される前記サブフレームの数を表す、
請求項24に記載の装置。 - 前記インデックス値上限決定モジュールは、
次の方法:
soft_reuse_index_high_limit=0.5+2Z
で前記二次チャネル信号の前記ピッチ周期インデックス値の前記上限soft_reuse_index_high_limitを計算するよう構成され、
Zは、前記二次チャネル信号の前記ピッチ周期探索範囲調整係数である、
請求項19乃至23のうちいずれか一項に記載の装置。 - Zの値は、3、4、又は5である、
請求項26に記載の装置。 - 前記インデックス値計算モジュールは、
前記一次チャネル信号の前記推定ピッチ周期値に基づき、前記二次チャネル信号の閉ループピッチ周期整数部loc_T0及び前記二次チャネル信号の閉ループピッチ周期分数部loc_frac_primを決定し、
次の方法:
soft_reuse_index=(N×pitch_soft_reuse+pitch_frac_soft_reuse)-(N×loc_T0+loc_frac_prim)+soft_reuse_index_high_limit/M
で前記二次チャネル信号の前記ピッチ周期インデックス値soft_reuse_indexを計算する
よう構成され、
pitch_soft_reuseは、前記二次チャネル信号の前記推定ピッチ周期値の整数部を表し、pitch_frac_soft_reuseは、前記二次チャネル信号の前記推定ピッチ周期値の分数部を表し、soft_reuse_index_high_limitは、前記二次チャネル信号の前記ピッチ周期インデックス値の前記上限を表し、Nは、前記二次チャネル信号が分割されるサブフレームの数を表し、Mは、前記二次チャネル信号の前記ピッチ周期インデックス値の前記上限の調整係数を表し、Mは、非ゼロの実数であり、×は、乗算演算子を表し、+は、加算演算子を表し、-は、減算演算子を表す、
請求項19乃至23のうちいずれか一項に記載の装置。 - 前記二次チャネル信号の前記ピッチ周期インデックス値の前記上限の前記調整係数の値は、2又は3である、
請求項28に記載の装置。 - 当該ステレオエンコーディング装置は、前記現在のフレームのエンコーディングレートが前もってセットされたレート閾値よりも低いステレオエンコーディングシナリオに適用され、
前記レート閾値は、次の値:13.2キロビット毎秒(kbps)、16.4kbps、又は24.4kbps、のうちの少なくとも1つである、
請求項19乃至29のうちいずれか一項に記載の装置。 - ステレオデコーディング装置であって、
受け取られたステレオエンコードされたビットストリームに基づき、二次チャネル信号のピッチ周期に対して差動デコーディングを実行すべきかどうかを決定するよう構成される決定モジュールと、
前記二次チャネル信号の前記ピッチ周期に対して差動デコーディングを実行すると決定される場合に、前記ステレオエンコードされたビットストリームから、現在のフレームの一次チャネル信号の推定ピッチ周期値及び前記現在のフレームの前記二次チャネル信号のピッチ周期インデックス値を取得するよう構成される値取得モジュールと、
前記一次チャネル信号の前記推定ピッチ周期値及び前記二次チャネル信号の前記ピッチ周期インデックス値に基づき前記二次チャネル信号の前記ピッチ周期に対して差動デコーディングを実行して、前記二次チャネル信号の推定ピッチ周期値を取得するよう構成される差動デコーディングモジュールと
を有し、前記二次チャネル信号の前記推定ピッチ周期値は、前記ステレオエンコードされたビットストリームをデコードするために使用され、
前記差動デコーディングモジュールは、
前記一次チャネル信号の前記推定ピッチ周期値と、前記現在のフレームの前記二次チャネル信号が分割されるサブフレームの数とに基づき、前記二次チャネル信号の閉ループピッチ周期基準値を決定するよう構成される基準値決定サブモジュールと、
前記二次チャネル信号のピッチ周期探索範囲調整係数に基づき前記二次チャネル信号の前記ピッチ周期インデックス値の上限を決定するよう構成されるインデックス値上限決定サブモジュールと、
前記二次チャネル信号の前記閉ループピッチ周期基準値、前記二次チャネル信号の前記ピッチ周期インデックス値、及び前記二次チャネル信号の前記ピッチ周期インデックス値の前記上限に基づき、前記二次チャネル信号の前記推定ピッチ周期値を計算するよう構成される推定値計算サブモジュールと
を有する、
装置。 - 前記決定モジュールは、
前記現在のフレームから二次チャネルピッチ周期差動エンコーディングフラグを取得し、
前記二次チャネルピッチ周期差動エンコーディングフラグが前もってセットされた第1値である場合に、前記二次チャネル信号の前記ピッチ周期に対して差動デコーディングを実行すると決定する
よう構成される、
請求項31に記載の装置。 - 当該ステレオデコーディング装置は、独立デコーディングモジュールを更に有し、
前記独立デコーディングモジュールは、前記二次チャネル信号の前記ピッチ周期に対して差動デコーディングを実行することをスキップし、前記一次チャネル信号の前記推定ピッチ周期値を前記二次チャネル信号の前記ピッチ周期として再利用することをスキップすると決定される場合に、前記ステレオエンコードされたビットストリームから前記二次チャネル信号の前記ピッチ周期をデコードするよう構成される、
請求項32に記載の装置。 - 当該ステレオデコーディング装置は、ピッチ周期再利用モジュールを更に有し、
前記ピッチ周期再利用モジュールは、前記二次チャネル信号の前記ピッチ周期に対して差動デコーディングを実行することをスキップし、前記一次チャネル信号の前記推定ピッチ周期値を前記二次チャネル信号の前記ピッチ周期として再利用すると決定される場合に、前記一次チャネル信号の前記推定ピッチ周期値を前記二次チャネル信号の前記ピッチ周期として使用するよう構成される、
請求項32に記載の装置。 - 前記推定値計算サブモジュールは、
次の方法:
T0_pitch=f_pitch_prim+(soft_reuse_index-soft_reuse_index_high_limit/M)/N
で前記二次チャネル信号の前記推定ピッチ周期値T0_pitchを計算するよう構成され、
f_pitch_primは、前記二次チャネル信号の前記閉ループピッチ周期基準値を表し、soft_reuse_indexは、前記二次チャネル信号の前記ピッチ周期インデックス値を表し、Nは、前記二次チャネル信号が分割される前記サブフレームの数を表し、Mは、前記二次チャネル信号の前記ピッチ周期インデックス値の前記上限の調整係数を表し、Mは、非ゼロの実数であり、/は、除算演算子を表し、+は、加算演算子を表し、-は、減算演算子を表す、
請求項31乃至34のうちいずれか一項に記載の装置。 - 前記二次チャネル信号の前記ピッチ周期インデックス値の前記上限の前記調整係数の値は、2又は3である、
請求項35に記載の装置。 - 少なくとも1つのプロセッサを有し、
前記少なくとも1つのプロセッサは、メモリへ結合され、該メモリ内の命令を読み出して実行して、請求項1乃至12のうちいずれか一項に記載の方法を実装する、
ステレオエンコーディング装置。 - 少なくとも1つのプロセッサを有し、
前記少なくとも1つのプロセッサは、メモリへ結合され、該メモリ内の命令を読み出して実行して、請求項13乃至18のうちいずれか一項に記載の方法を実装する、
ステレオデコーディング装置。 - プログラムが記録されているコンピュータ可読記憶媒体であって、
前記プログラムは、コンピュータで実行される場合に、前記コンピュータに、請求項1乃至18のうちいずれか一項に記載の方法を実行させる、
コンピュータ可読記憶媒体。 - 媒体に記憶されたコンピュータプログラムであって、
コンピュータに請求項1乃至18のうちいずれか一項に記載の方法を実行させるよう構成されたコンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910581398.5 | 2019-06-29 | ||
CN201910581398.5A CN112233682B (zh) | 2019-06-29 | 2019-06-29 | 一种立体声编码方法、立体声解码方法和装置 |
PCT/CN2020/096296 WO2021000723A1 (zh) | 2019-06-29 | 2020-06-16 | 一种立体声编码方法、立体声解码方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022539571A JP2022539571A (ja) | 2022-09-12 |
JP7337966B2 true JP7337966B2 (ja) | 2023-09-04 |
Family
ID=74101099
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021577947A Active JP7337966B2 (ja) | 2019-06-29 | 2020-06-16 | ステレオエンコーディング方法及び装置、並びにステレオデコーディング方法及び装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20220122619A1 (ja) |
EP (1) | EP3975175B1 (ja) |
JP (1) | JP7337966B2 (ja) |
CN (1) | CN112233682B (ja) |
WO (1) | WO2021000723A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112151045B (zh) | 2019-06-29 | 2024-06-04 | 华为技术有限公司 | 一种立体声编码方法、立体声解码方法和装置 |
CN115497485B (zh) * | 2021-06-18 | 2024-10-18 | 华为技术有限公司 | 三维音频信号编码方法、装置、编码器和系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002099300A (ja) | 2000-09-26 | 2002-04-05 | Yrp Kokino Idotai Tsushin Kenkyusho:Kk | 音声符号化方法及び装置 |
US20030191635A1 (en) | 2000-09-15 | 2003-10-09 | Minde Tor Bjorn | Multi-channel signal encoding and decoding |
WO2006035705A1 (ja) | 2004-09-28 | 2006-04-06 | Matsushita Electric Industrial Co., Ltd. | スケーラブル符号化装置およびスケーラブル符号化方法 |
JP2009510514A (ja) | 2005-09-27 | 2009-03-12 | エルジー エレクトロニクス インコーポレイティド | マルチチャネルオーディオ信号の符号化/復号化方法及び装置 |
US20110029304A1 (en) | 2009-08-03 | 2011-02-03 | Broadcom Corporation | Hybrid instantaneous/differential pitch period coding |
JP2018533056A (ja) | 2015-09-25 | 2018-11-08 | ヴォイスエイジ・コーポレーション | ステレオ音声信号をプライマリチャンネルおよびセカンダリチャンネルに時間領域ダウンミックスするために左チャンネルと右チャンネルとの間の長期相関差を使用する方法およびシステム |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6584437B2 (en) * | 2001-06-11 | 2003-06-24 | Nokia Mobile Phones Ltd. | Method and apparatus for coding successive pitch periods in speech signal |
SE527670C2 (sv) * | 2003-12-19 | 2006-05-09 | Ericsson Telefon Ab L M | Naturtrogenhetsoptimerad kodning med variabel ramlängd |
CN101069232A (zh) * | 2004-11-30 | 2007-11-07 | 松下电器产业株式会社 | 立体声编码装置、立体声解码装置及其方法 |
CN101427307B (zh) * | 2005-09-27 | 2012-03-07 | Lg电子株式会社 | 编码/解码多声道音频信号的方法和装置 |
CN101981616A (zh) * | 2008-04-04 | 2011-02-23 | 松下电器产业株式会社 | 立体声信号变换装置、立体声信号逆变换装置及其方法 |
FR2966634A1 (fr) * | 2010-10-22 | 2012-04-27 | France Telecom | Codage/decodage parametrique stereo ameliore pour les canaux en opposition de phase |
EP3869506A1 (en) * | 2014-03-28 | 2021-08-25 | Samsung Electronics Co., Ltd. | Method and device for quantization of linear prediction coefficient and method and device for inverse quantization |
EP3067885A1 (en) * | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding or decoding a multi-channel signal |
CN107731238B (zh) * | 2016-08-10 | 2021-07-16 | 华为技术有限公司 | 多声道信号的编码方法和编码器 |
CN112151045B (zh) * | 2019-06-29 | 2024-06-04 | 华为技术有限公司 | 一种立体声编码方法、立体声解码方法和装置 |
-
2019
- 2019-06-29 CN CN201910581398.5A patent/CN112233682B/zh active Active
-
2020
- 2020-06-16 WO PCT/CN2020/096296 patent/WO2021000723A1/zh unknown
- 2020-06-16 JP JP2021577947A patent/JP7337966B2/ja active Active
- 2020-06-16 EP EP20835190.8A patent/EP3975175B1/en active Active
-
2021
- 2021-12-28 US US17/563,538 patent/US20220122619A1/en active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030191635A1 (en) | 2000-09-15 | 2003-10-09 | Minde Tor Bjorn | Multi-channel signal encoding and decoding |
JP2002099300A (ja) | 2000-09-26 | 2002-04-05 | Yrp Kokino Idotai Tsushin Kenkyusho:Kk | 音声符号化方法及び装置 |
WO2006035705A1 (ja) | 2004-09-28 | 2006-04-06 | Matsushita Electric Industrial Co., Ltd. | スケーラブル符号化装置およびスケーラブル符号化方法 |
JP2009510514A (ja) | 2005-09-27 | 2009-03-12 | エルジー エレクトロニクス インコーポレイティド | マルチチャネルオーディオ信号の符号化/復号化方法及び装置 |
US20110029304A1 (en) | 2009-08-03 | 2011-02-03 | Broadcom Corporation | Hybrid instantaneous/differential pitch period coding |
JP2018533056A (ja) | 2015-09-25 | 2018-11-08 | ヴォイスエイジ・コーポレーション | ステレオ音声信号をプライマリチャンネルおよびセカンダリチャンネルに時間領域ダウンミックスするために左チャンネルと右チャンネルとの間の長期相関差を使用する方法およびシステム |
Also Published As
Publication number | Publication date |
---|---|
EP3975175A4 (en) | 2022-07-20 |
EP3975175B1 (en) | 2024-07-31 |
WO2021000723A1 (zh) | 2021-01-07 |
CN112233682A (zh) | 2021-01-15 |
JP2022539571A (ja) | 2022-09-12 |
US20220122619A1 (en) | 2022-04-21 |
EP3975175A1 (en) | 2022-03-30 |
CN112233682B (zh) | 2024-07-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7244609B2 (ja) | ビットバジェットに応じて2サブフレームモデルと4サブフレームモデルとの間で選択を行うステレオ音声信号の左チャンネルおよび右チャンネルを符号化するための方法およびシステム | |
RU2608878C1 (ru) | Регулировка уровня во временной области для декодирования или кодирования аудиосигналов | |
US11640825B2 (en) | Time-domain stereo encoding and decoding method and related product | |
MX2013004673A (es) | Codificación de señales de audio genéricas a baja tasa de bits y a retardo bajo. | |
US11120807B2 (en) | Method for determining audio coding/decoding mode and related product | |
US20220122619A1 (en) | Stereo Encoding Method and Apparatus, and Stereo Decoding Method and Apparatus | |
US11887607B2 (en) | Stereo encoding method and apparatus, and stereo decoding method and apparatus | |
US20240153511A1 (en) | Time-domain stereo encoding and decoding method and related product | |
US11727943B2 (en) | Time-domain stereo parameter encoding method and related product | |
EP3806093B1 (en) | Stereo signal coding and decoding method and coding and decoding apparatus | |
JP7123911B2 (ja) | オーディオコーデックにおける長期予測のためのシステム及び方法 | |
WO2019173195A1 (en) | Signals in transform-based audio codecs |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220124 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220124 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230131 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230214 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230510 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230808 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230823 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7337966 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |