JP7337966B2 - ステレオエンコーディング方法及び装置、並びにステレオデコーディング方法及び装置 - Google Patents

ステレオエンコーディング方法及び装置、並びにステレオデコーディング方法及び装置 Download PDF

Info

Publication number
JP7337966B2
JP7337966B2 JP2021577947A JP2021577947A JP7337966B2 JP 7337966 B2 JP7337966 B2 JP 7337966B2 JP 2021577947 A JP2021577947 A JP 2021577947A JP 2021577947 A JP2021577947 A JP 2021577947A JP 7337966 B2 JP7337966 B2 JP 7337966B2
Authority
JP
Japan
Prior art keywords
channel signal
pitch period
secondary channel
value
estimated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021577947A
Other languages
English (en)
Other versions
JP2022539571A (ja
Inventor
シュロモ,エーヤル
ガオ,ユアン
ワン,ビン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Publication of JP2022539571A publication Critical patent/JP2022539571A/ja
Application granted granted Critical
Publication of JP7337966B2 publication Critical patent/JP7337966B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0011Long term prediction filters, i.e. pitch estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本願は、ステレオ技術の分野に、特に、ステレオエンコーディング方法及び装置、並びにステレオデコーディング方法及び装置に関する。
現在、モノオーディオでは、高品質オーディオに対する人々の要求を満足させることができない。モノオーディオと比較して、ステレオオーディオは、様々な音源の方向感覚及び分布感覚があり、情報の明りょう度、理解度、及び臨場感を高めることができるので、人々に人気がある。
限られたバンド幅でステレオ信号をより良く伝送するために、ステレオ信号は、通常、最初にエンコードされる必要があり、それから、エンコーディング処理されたビットストリームが、チャネルを通じてデコーダ側へ伝送される。デコーダ側は、デコードされたステレオ信号を再生のために取得するよう、受信されたビットストリームに基づきデコーディング処理を実行する。
ステレオエンコーディング及びデコーディング技術を実装するための多種多様な方法が存在する。例えば、時間領域信号は、エンコーダ側で2つのモノ信号にダウンミックスされる。一般に、左右のチャネルが、最初に、一次チャネル信号及び二次チャネル信号にダウンミックスされる。次いで、一次チャネル信号及び二次チャネル信号は、モノエンコーディング方法を使用することによってエンコードされる。一次チャネル信号は、通常、比較的に大量のビットでエンコードされ、二次チャネル信号は、通常、エンコードされない。デコーディング中、一次チャネル信号及び二次チャネル信号は、通常、受信されたビットストリームに基づきデコーディングを通じて別々に取得され、次いで、時間領域アップミックス処理が、デコードされたステレオ信号を取得するために実行される。
ステレオ信号については、それらをモノ信号と区別する重要な特徴は、音響が音響画像情報を備えており、それにより、音響がより強い空間感覚を有することである。ステレオ信号では、二次チャネル信号の正確さは、ステレオ信号の空間感覚をより良く反映することができ、二次チャネルエンコーディングの正確さはまた、ステレオ音響画像の安定性において重要な役割を果たす。
ステレオエンコーディングでは、ピッチ周期は、ヒトの音声生成の重要な特徴として、一次及び二次チャネル信号のエンコーディングのための重要なパラメータである。ピッチ周期パラメータの予測値の精度は、全体的なステレオエンコーディング品質に影響する。時間領域又は周波数領域でのステレオエンコーディングでは、ステレオパラメータ、一次チャネル信号、及び二次チャネル信号は、入力信号が解析された後で取得され得る。エンコーディングレートが比較的に低い(例えば、24.4kbps以下)である場合に、エンコーダは、通常、一次チャネル信号のみをエンコードし、二次チャネル信号をエンコードしない。例えば、一次チャネル信号のピッチ周期は、二次チャネル信号のピッチ周期として直接に使用される。二次チャネル信号はデコーディングを受けないので、デコードされたステレオ信号の空間感覚は貧しく、音響画像安定性は、一次チャネル信号のピッチ周期パラメータと二次チャネル信号の実際のピッチ周期パラメータとの間の差によって大いに影響を及ぼされる。その結果、ステレオエンコーディング性能は低下し、それに応じて、ステレオコーディング性能は低下する。
本願の実施形態は、ステレオエンコーディング及びデコーディング性能を改善するために、ステレオエンコーディング方法及び装置、並びにステレオデコーディング方法及び装置を提供する。
上記の技術的課題を解決するために、本願の実施形態は、次の技術的解決法を提供する。
第1の態様に従って、本願の実施形態は、ステレオエンコーディング方法であって、
現在のフレームの左チャネル信号及び現在のフレームの右チャネル信号に対してダウンミックス処理を実行して、現在のフレームの一次チャネル信号及び現在のフレームの二次チャネル信号を取得することと、
二次チャネル信号のピッチ周期に対して差動エンコーディングを実行すると決定する場合に、一次チャネル信号の推定ピッチ周期値を使用することによって二次チャネル信号のピッチ周期に対して差動エンコーディングを実行して、二次チャネル信号のピッチ周期インデックス値を取得することであり、二次チャネル信号のピッチ周期インデックス値は、送信されるべきステレオエンコードされたビットストリームを生成するために使用される、ことと
を含む方法を提供する。
本願のこの実施形態では、ダウンミックス処理が、現在のフレームの一次チャネル信号及び現在のチャネルの二次チャネル信号を取得するために、最初に、現在のフレームの左チャネル信号及び現在のフレームの右チャネル信号に対して実行され、そして、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行すると決定される場合に、差動エンコーディングが、二次チャネル信号のピッチ周期インデックス値を取得するために、一次チャネル信号の推定ピッチ周期値を使用することによって二次チャネル信号のピッチ周期に対して実行され、二次チャネル信号のピッチ周期インデックス値は、送信されるべきステレオエンコードされたビットストリームを生成するために使用される。本願のこの実施形態では、差動エンコーディングが、一次チャネル信号の推定ピッチ周期値を使用することによって二次チャネル信号のピッチ周期に対して実行されるので、差動エンコーディングのために二次チャネル信号のピッチ周期に割り当てられる必要があるビットリソースは少数である。二次チャネル信号のピッチ周期の差動エンコーディングを通じて、ステレオ信号の空間感覚及び音響画像安定性は改善され得る。更に、本願のこの実施形態では、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行するために使用されるビットリソースは、比較的に少数である。そのため、節約されたビットリソースが他のステレオエンコーディングパラメータのために使用されてもよく、それにより、二次チャネル信号のエンコーディング効率は改善され、最終的な全体のステレオエンコーディング品質は改善される。
可能な実施において、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行すべきかどうかを決定することは、
現在のフレームの一次チャネル信号をエンコードして、一次チャネル信号の推定ピッチ周期値を取得することと、
現在のフレームの二次チャネル信号に対して開ループピッチ周期解析を実行して、二次チャネル信号の推定開ループピッチ周期値を取得することと、
一次チャネル信号の推定ピッチ周期値と二次チャネル信号の推定開ループピッチ周期値との間の差が前もってセットされた二次チャネルピッチ周期差動エンコーディング閾値を超えるかどうかを決定することと、
差が二次チャネルピッチ周期差動エンコーディング閾値を超える場合には、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行すると決定し、あるいは、差が二次チャネルピッチ周期差動エンコーディング閾値を超えない場合には、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行することをスキップすると決定することと
を含む。
本願のこの実施形態で、エンコーディングは、一次チャネル信号の推定ピッチ周期値を取得するよう、一次チャネル信号に基づき実行され得る。現在のフレームの二次チャネル信号が取得された後、二次チャネル信号の推定開ループピッチ周期値を取得するために、開ループピッチ周期解析が二次チャネル信号に対して実行され得る。一次チャネル信号の推定ピッチ周期値及び二次チャネル信号の推定開ループピッチ周期値が取得された後、一次チャネル信号の推定ピッチ周期値と二次チャネル信号の推定開ループピッチ周期値との間の差が計算され得、次いで、その差が前もってセットされた二次チャネルピッチ周期差動エンコーディング閾値を超えるかどうかが決定される。二次チャネルピッチ周期差動エンコーディング閾値は前もってセットされてもよく、ステレオエンコーディングシナリオを参照して柔軟に設定されてもよい。差が二次チャネルピッチ周期差動エンコーディング閾値を超える場合には、差動エンコーディングを実行すると決定され、あるいは、差が二次チャネルピッチ周期差動エンコーディング閾値を超えない場合には、差動エンコーディングを実行しないと決定される。
可能な実施において、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行すると決定される場合に、方法は、現在のフレームにおける二次チャネルピッチ周期差動エンコーディングフラグを前もってセットされた第1値に設定することを更に含み、ステレオエンコードされたビットストリームが、二次チャネルピッチ周期差動エンコーディングフラグを運び、第1値は、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行することを示すために使用される。エンコーダ側は、二次チャネルピッチ周期差動エンコーディングフラグを取得する。二次チャネルピッチ周期差動エンコーディングフラグの値は、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行すべきかどうかに基づき設定され得る。二次チャネルピッチ周期差動エンコーディングフラグは、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行すべきかどうかを示すために使用される。二次チャネルピッチ周期差動エンコーディングフラグは、複数の値を有し得る。例えば、二次チャネルピッチ周期差動エンコーディングフラグは、前もってセットされた第1値又は第2値であってよい。以下は、二次チャネルピッチ周期差動エンコーディングフラグを設定する方法の例について記載する。二次チャネル信号のピッチ周期に対して差動エンコーディングを実行すると決定される場合に、二次チャネルピッチ周期差動エンコーディングフラグは第1値に設定される。
可能な実施において、方法は、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行することをスキップし、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用することをスキップすると決定する場合に、二次チャネル信号のピッチ周期と一次チャネル信号のピッチ周期とを別々にエンコードすることを更に含む。差動エンコーディングが二次チャネル信号のピッチ周期に対して実行されず、かつ、一次チャネル信号の推定ピッチ周期値が二次チャネル信号のピッチ周期として再利用されない場合に、二次チャネル信号のためのピッチ周期独立エンコーディング方法が、二次チャネル信号のピッチ周期をエンコードするために、本願のこの実施形態で使用されてもよく、それにより、二次チャネル信号のピッチ周期はエンコードされ得る。
可能な実施において、方法は、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行することをスキップし、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用すると決定する場合に、二次チャネル信号ピッチ周期再利用フラグを前もってセットされた第4値に設定し、ステレオエンコードされたビットストリームを使用して二次チャネル信号ピッチ周期再利用フラグを運ぶことを更に含み、第4値は、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用することを示すために使用される。差動エンコーディングが二次チャネル信号のピッチ周期に対して実行されない場合に、ピッチ周期再利用方法が本願のこの実施形態では使用されてもよい。具体的に言えば、エンコーダ側は、二次チャネル信号のピッチ周期をエンコードせず、ステレオエンコードされたビットストリームは、二次チャネル信号ピッチ周期再利用フラグを運ぶ。二次チャネル信号ピッチ周期再利用フラグは、二次チャネル信号のピッチ周期が一次チャネル信号の推定ピッチ周期値を再利用するかどうかを示すために使用される。二次チャネル信号のピッチ周期が一次チャネル信号の推定ピッチ周期値を再利用することを二次チャネル信号ピッチ周期再利用フラグが示す場合に、デコーダ側は、二次チャネル信号ピッチ周期再利用フラグに基づき、一次チャネル信号のピッチ周期を二次チャネル信号のピッチ周期としてデコーディングのために使用し得る。
可能な実施において、一次チャネル信号の推定ピッチ周期値を使用することによって二次チャネル信号のピッチ周期に対して差動エンコーディングを実行して、二次チャネル信号のピッチ周期インデックス値を取得することは、
一次チャネル信号の推定ピッチ周期値に基づき二次チャネル信号閉ループピッチ周期探索を実行して、二次チャネル信号の推定ピッチ周期値を取得することと、
二次チャネル信号のピッチ周期探索範囲調整係数に基づき二次チャネル信号のピッチ周期インデックス値の上限を決定することと、
一次チャネル信号の推定ピッチ周期値、二次チャネル信号の推定ピッチ周期値、及び二次チャネル信号のピッチ周期インデックス値の上限に基づき、二次チャネル信号のピッチ周期インデックス値を計算することと
を含む。エンコーダ側は、二次チャネル信号の推定ピッチ周期値を決定するよう、二次チャネル信号の推定ピッチ周期値に基づき二次チャネル信号閉ループピッチ周期探索を実行し得る。二次チャネル信号のピッチ周期探索範囲調整係数は、二次チャネル信号のピッチ周期インデックス値の上限を決定するよう、二次チャネル信号のピッチ周期インデックス値を調整するために使用され得る。二次チャネル信号のピッチ周期インデックス値の上限は、二次チャネル信号のピッチ周期インデックス値が超えることができない上限値を示す。二次チャネル信号のピッチ周期インデックス値の上限は、二次チャネル信号のピッチ周期インデックス値を決定するために使用され得る。一次チャネル信号の推定ピッチ周期値、二次チャネル信号の推定ピッチ周期値、及び二次チャネル信号のピッチ周期インデックス値の上限を決定した後、エンコーダ側は、一次チャネル信号の推定ピッチ周期値、二次チャネル信号の推定ピッチ周期値、及び二次チャネル信号のピッチ周期インデックス値の上限に基づき差動エンコーディングを実行し、二次チャネル信号のピッチ周期インデックス値を出力する。
可能な実施において、一次チャネル信号の推定ピッチ周期値に基づき二次チャネル信号閉ループピッチ周期探索を実行して、二次チャネル信号の推定ピッチ周期値を取得することは、
一次チャネル信号の推定ピッチ周期値と、現在のフレームの二次チャネル信号が分割されるサブフレームの数とに基づき、二次チャネル信号の閉ループピッチ周期基準値を決定することと、
整数精度及び分数精度を使用することによって、かつ、二次チャネル信号の閉ループピッチ周期基準値を二次チャネル信号閉ループピッチ周期探索の開始点として使用することによって、閉ループピッチ周期探索を実行して、二次チャネル信号の推定ピッチ周期値を取得することと
を含む。現在のフレームの二次チャネル信号が分割されるサブフレームの数は、二次チャネル信号のサブフレーム構成に基づき決定され得る。例えば、二次チャネル信号は、4つのサブフレーム又は3つのサブフレームに分割されてもよく、これは、具体的に、適応シナリオを参照して決定される。一次チャネル信号の推定ピッチ周期値が取得された後、一次チャネル信号の推定ピッチ周期値、及び二次チャネル信号が分割されるサブフレームの数が、二次チャネル信号の閉ループピッチ周期基準値を計算するために使用され得る。二次チャネル信号の閉ループピッチ周期基準値は、一次チャネル信号の推定ピッチ周期値に基づき決定された基準値である。二次チャネル信号の閉ループピッチ周期基準値は、一次チャネル信号の推定ピッチ周期値を基準として使用することによって決定される二次チャネル信号の閉ループピッチ周期を表す。
可能な実施において、一次チャネル信号の推定ピッチ周期値と、現在のフレームの二次チャネル信号が分割されるサブフレームの数とに基づき、二次チャネル信号の閉ループピッチ周期基準値を決定することは、
一次チャネル信号の推定ピッチ周期値に基づき、二次チャネル信号の閉ループピッチ周期整数部loc_T0及び二次チャネル信号の閉ループピッチ周期分数部loc_frac_primを決定することと、
次の方法:
f_pitch_prim=loc_T0+loc_frac_prim/N
で二次チャネル信号の閉ループピッチ周期基準値f_pitch_primを計算することと
を含み、Nは、二次チャネル信号が分割されるサブフレームの数を表す。具体的に、二次チャネル信号の閉ループピッチ周期整数部及び閉ループピッチ周期分数部が、最初に、一次チャネル信号の推定ピッチ周期値に基づき決定される。例えば、一次チャネル信号の推定ピッチ周期値の整数部は、二次チャネル信号の閉ループピッチ周期整数部として直接に使用され、一次チャネル信号の推定ピッチ周期値の分数部は、二次チャネル信号の閉ループピッチ周期分数部として使用される。代替的に、一次チャネル信号の推定ピッチ周期値は、補間法を使用することによって二次チャネル信号の閉ループピッチ周期整数部及び閉ループピッチ周期分数部にマッピングされ得る。例えば、上記の方法のいずれかに従って、二次チャネル信号の閉ループピッチ周期整数部loc_T0及び閉ループピッチ周期分数部loc_frac_primは取得され得る。
可能な実施において、二次チャネル信号のピッチ周期探索範囲調整係数に基づき二次チャネル信号のピッチ周期インデックス値の上限を決定することは、
次の方法:
soft_reuse_index_high_limit=0.5+2
で二次チャネル信号のピッチ周期インデックス値の上限soft_reuse_index_high_limitを計算することを含み、Zは、二次チャネル信号のピッチ周期探索範囲調整係数である。
可能な実施において、Zの値は、3、4、又は5である。
可能な実施において、一次チャネル信号の推定ピッチ周期値、二次チャネル信号の推定ピッチ周期値、及び二次チャネル信号のピッチ周期インデックス値の上限に基づき、二次チャネル信号のピッチ周期インデックス値を計算することは、
一次チャネル信号の推定ピッチ周期値に基づき、二次チャネル信号の閉ループピッチ周期整数部loc_T0及び二次チャネル信号の閉ループピッチ周期分数部loc_frac_primを決定することと、
次の方法:
soft_reuse_index=(N×pitch_soft_reuse+pitch_frac_soft_reuse)-(N×loc_T0+loc_frac_prim)+soft_reuse_index_high_limit/M
で二次チャネル信号のピッチ周期インデックス値soft_reuse_indexを計算することと
を含み、pitch_soft_reuseは、二次チャネル信号の推定ピッチ周期値の整数部を表し、pitch_frac_soft_reuseは、二次チャネル信号の推定ピッチ周期値の分数部を表し、soft_reuse_index_high_limitは、二次チャネル信号のピッチ周期インデックス値の上限を表し、Nは、二次チャネル信号が分割されるサブフレームの数を表し、Mは、二次チャネル信号のピッチ周期インデックス値の上限の調整係数を表し、Mは、非ゼロの実数であり、×は、乗算演算子を表し、+は、加算演算子を表し、-は、減算演算子を表す。
可能な実施において、方法は、現在のフレームのエンコーディングレートが前もってセットされたレート閾値よりも低いステレオエンコーディングシナリオに適用され、レート閾値は、次の値:13.2キロビット毎秒kbps、16.4kbps、又は24.4kbps、のうちの少なくとも1つである。レート閾値は、13.2kbps以下であってもよい。例えば、レート閾値は、代替的に、16.4kbps又は24.4kbpsであってもよい。レート閾値の具体的な値は、適応シナリオに基づき決定され得る。エンコーディングレートが比較的に低い(例えば、24.4kbps以下)場合に、独立エンコーディングは二次チャネル信号のピッチ周期に対して実行されず、一次チャネル信号の推定ピッチ周期値が基準値として使用される。差動エンコーディング方法は、ステレオエンコーディング品質を改善するよう、二次チャネル信号のピッチ周期のエンコーディングを実装するために使用される。
第2の態様に従って、本願の実施形態は、ステレオデコーディング方法であって、
受け取られたステレオエンコードされたビットストリームに基づき、二次チャネル信号のピッチ周期に対して差動デコーディングを実行すべきかどうかを決定することと、
二次チャネル信号のピッチ周期に対して差動デコーディングを実行すると決定する場合に、ステレオエンコードされたビットストリームから、現在のフレームの一次チャネル信号の推定ピッチ周期値及び現在のフレームの二次チャネル信号のピッチ周期インデックス値を取得することと、
一次チャネル信号の推定ピッチ周期値及び二次チャネル信号のピッチ周期インデックス値に基づき二次チャネル信号のピッチ周期に対して差動デコーディングを実行して、二次チャネル信号の推定ピッチ周期値を取得することであり、二次チャネル信号の推定ピッチ周期値は、ステレオエンコードされたビットストリームをデコードするために使用される、ことと
を含む方法を更に提供する。
本願のこの実施形態では、二次チャネル信号のピッチ周期に対して差動デコーディングを実行すべきかどうかが、最初に、受け取られたステレオエンコードされたビットストリームに基づき決定され、そして、二次チャネル信号のピッチ周期に対して差動デコーディングを実行すると決定される場合に、現在のフレームの一次チャネル信号の推定ピッチ周期値及び現在のフレームの二次チャネル信号のピッチ周期インデックス値が、ステレオエンコードされたビットストリームから取得され、差動デコーディングは、二次チャネル信号の推定ピッチ周期値を取得するために、一次チャネル信号の推定ピッチ周期値及び二次チャネル信号のピッチ周期インデックス値に基づき、二次チャネル信号のピッチ周期に対して実行され、二次チャネル信号の推定ピッチ周期値は、ステレオエンコードされたビットストリームをデコードするために使用される。本願のこの実施形態では、差動デコーディングが二次チャネル信号のピッチ周期に対して実行され得る場合に、一次チャネル信号の推定ピッチ周期値及び二次チャネル信号のピッチ周期インデックス値が、二次チャネル信号の推定ピッチ周期値を取得するように、二次チャネル信号のピッチ周期に対して差動デコーディングを実行するために使用されてもよく、そして、ステレオエンコードされたビットストリームは、二次チャネル信号の推定ピッチ周期値を使用することによってデコードされ得る。従って、ステレオ信号の空間感覚及び音響画像安定性は、改善され得る。
可能な実施において、受け取られたステレオエンコードされたビットストリームに基づき、二次チャネル信号のピッチ周期に対して差動デコーディングを実行すべきかどうかを決定することは、
現在のフレームから二次チャネルピッチ周期差動エンコーディングフラグを取得することと、
二次チャネルピッチ周期差動エンコーディングフラグが前もってセットされた第1値である場合に、二次チャネル信号のピッチ周期に対して差動デコーディングを実行すると決定することと
を含む。本願のこの実施形態で、二次チャネルピッチ周期差動エンコーディングフラグは、複数の値を有し得る。例えば、二次チャネルピッチ周期差動エンコーディングフラグは、前もってセットされた第1値であってよい。例えば、二次チャネルピッチ周期差動エンコーディングフラグの値が1である場合に、差動デコーディングは二次チャネル信号のピッチ周期に対して実行される。
可能な実施において、方法は、二次チャネル信号のピッチ周期に対して差動デコーディングを実行することをスキップし、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用することをスキップすると決定する場合に、ステレオエンコードされたビットストリームから二次チャネル信号のピッチ周期をデコードすることを更に含む。デコーダ側が、二次チャネル信号のピッチ周期に対して差動デコーディングを実行しないと、かつ、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用しないと決定する場合に、二次チャネル信号のためのピッチ周期独立デコーディング方法が、二次チャネル信号のピッチ周期をデコードするために、本願のこの実施形態では使用されてもよく、それにより、二次チャネル信号のピッチ周期はデコードされ得る。
可能な実施において、方法は、二次チャネル信号のピッチ周期に対して差動デコーディングを実行することをスキップし、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用すると決定する場合に、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として使用することを更に含む。デコーダ側が二次チャネル信号のピッチ周期に対して差動デコーディングを実行しないと決定する場合に、ピッチ周期再利用方法が本願のこの実施形態では使用されてもよい。例えば、二次チャネル信号のピッチ周期が一次チャネル信号の推定ピッチ周期値を再利用することを二次チャネル信号ピッチ周期再利用フラグが示す場合に、デコーダ側は、二次チャネル信号ピッチ周期再利用フラグに基づき、一次チャネル信号のピッチ周期を二次チャネル信号のピッチ周期として使用することによってデコーディングを実行し得る。
可能な実施において、一次チャネル信号の推定ピッチ周期値及び二次チャネル信号のピッチ周期インデックス値に基づき二次チャネル信号のピッチ周期に対して差動デコーディングを実行することは、
一次チャネル信号の推定ピッチ周期値と、現在のフレームの二次チャネル信号が分割されるサブフレームの数とに基づき、二次チャネル信号の閉ループピッチ周期基準値を決定することと、
二次チャネル信号のピッチ周期探索範囲調整係数に基づき二次チャネル信号のピッチ周期インデックス値の上限を決定することと、
二次チャネル信号の閉ループピッチ周期基準値、二次チャネル信号のピッチ周期インデックス値、及び二次チャネル信号のピッチ周期インデックス値の上限に基づき、二次チャネル信号の推定ピッチ周期値を計算することと
を含む。具体的に、二次チャネル信号の閉ループピッチ周期基準値は、一次チャネル信号の推定ピッチ周期値を使用することによって決定される。詳細については、上記の計算プロセスを参照されたい。二次チャネル信号のピッチ周期探索範囲調整係数は、二次チャネル信号のピッチ周期インデックス値の上限を決定するよう、二次チャネル信号のピッチ周期インデックス値を調整するために使用され得る。二次チャネル信号のピッチ周期インデックス値の上限は、二次チャネル信号のピッチ周期インデックス値が超えることができない上限値を示す。二次チャネル信号のピッチ周期インデックス値の上限は、二次チャネル信号のピッチ周期インデックス値を決定するために使用され得る。二次チャネル信号の閉ループピッチ周期基準値、二次チャネル信号のピッチ周期インデックス値、及び二次チャネル信号のピッチ周期インデックス値の上限を決定した後、デコーダ側は、二次チャネル信号の閉ループピッチ周期基準値、二次チャネル信号のピッチ周期インデックス値、及び二次チャネル信号のピッチ周期インデックス値の上限に基づき差動デコーディングを実行し、二次チャネル信号の推定ピッチ周期値を出力する。
可能な実施において、二次チャネル信号の閉ループピッチ周期基準値、二次チャネル信号のピッチ周期インデックス値、及び二次チャネル信号のピッチ周期インデックス値の上限に基づき、二次チャネル信号の推定ピッチ周期値を計算することは、
次の方法:
T0_pitch=f_pitch_prim+(soft_reuse_index-soft_reuse_index_high_limit/M)/N
で二次チャネル信号の推定ピッチ周期値T0_pitchを計算することを含み、f_pitch_primは、二次チャネル信号の閉ループピッチ周期基準値を表し、soft_reuse_indexは、二次チャネル信号のピッチ周期インデックス値を表し、Nは、二次チャネル信号が分割されるサブフレームの数を表し、Mは、二次チャネル信号のピッチ周期インデックス値の上限の調整係数を表し、Mは、非ゼロの実数であり、/は、除算演算子を表し、+は、加算演算子を表し、-は、減算演算子を表す。
可能な実施において、二次チャネル信号のピッチ周期インデックス値の上限の調整係数の値は、2又は3である。
第3の態様に従って、本願の実施形態は、ステレオエンコーディング装置であって、
現在のフレームの左チャネル信号及び現在のフレームの右チャネル信号に対してダウンミックス処理を実行して、現在のフレームの一次チャネル信号及び現在のフレームの二次チャネル信号を取得するよう構成されるダウンミックスモジュールと、
二次チャネル信号のピッチ周期に対して差動エンコーディングを実行すると決定される場合に、一次チャネル信号の推定ピッチ周期値を使用することによって二次チャネル信号のピッチ周期に対して差動エンコーディングを実行して、二次チャネル信号のピッチ周期インデックス値を取得するよう構成される差動エンコーディングモジュールと
を含み、二次チャネル信号のピッチ周期インデックス値は、送信されるべきステレオエンコードされたビットストリームを生成するために使用される、装置を更に提供する。
可能な実施において、ステレオエンコーディング装置は、
現在のフレームの一次チャネル信号をエンコードして、一次チャネル信号の推定ピッチ周期値を取得するよう構成される一次チャネルエンコーディングモジュールと、
現在のフレームの二次チャネル信号に対して開ループピッチ周期解析を実行して、二次チャネル信号の推定開ループピッチ周期値を取得するよう構成される開ループ解析モジュールと、
一次チャネル信号の推定ピッチ周期値と二次チャネル信号の推定開ループピッチ周期値との間の差が前もってセットされた二次チャネルピッチ周期差動エンコーディング閾値を超えるかどうかを決定し、差が二次チャネルピッチ周期差動エンコーディング閾値を超える場合には、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行すると決定し、あるいは、差が二次チャネルピッチ周期差動エンコーディング閾値を超えない場合には、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行することをスキップすると決定するよう構成される閾値決定モジュールと
を更に含む。
可能な実施において、ステレオエンコーディング装置は、
二次チャネル信号のピッチ周期に対して差動エンコーディングを実行すると決定される場合に、現在のフレームにおける二次チャネルピッチ周期差動エンコーディングフラグを前もってセットされた第1値に設定するよう構成されるフラグ設定モジュールを更に含み、
ステレオエンコードされたビットストリームが、二次チャネルピッチ周期差動エンコーディングフラグを運び、第1値は、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行することを示すために使用される。
可能な実施において、ステレオエンコーディング装置は、独立エンコーディングモジュールを更に有し、独立エンコーディングモジュールは、
二次チャネル信号のピッチ周期に対して差動エンコーディングを実行することをスキップし、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用することをスキップすると決定される場合に、二次チャネル信号のピッチ周期と一次チャネル信号のピッチ周期とを別々にエンコードするよう構成される。
可能な実施において、ステレオエンコーディング装置は、
二次チャネル信号のピッチ周期に対して差動エンコーディングを実行することをスキップし、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用すると決定される場合に、二次チャネル信号ピッチ周期再利用フラグを前もってセットされた第4値に設定し、ステレオエンコードされたビットストリームを使用して二次チャネル信号ピッチ周期再利用フラグを運ぶよう構成されるフラグ設定モジュールを更に含み、第4値は、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用することを示すために使用される。
可能な実施において、差動エンコーディングモジュールは、
一次チャネル信号の推定ピッチ周期値に基づき二次チャネル信号閉ループピッチ周期探索を実行して、二次チャネル信号の推定ピッチ周期値を取得するよう構成される閉ループピッチ周期探索モジュールと、
二次チャネル信号のピッチ周期探索範囲調整係数に基づき二次チャネル信号のピッチ周期インデックス値の上限を決定するよう構成されるインデックス値上限決定モジュールと、
一次チャネル信号の推定ピッチ周期値、二次チャネル信号の推定ピッチ周期値、及び二次チャネル信号のピッチ周期インデックス値の上限に基づき、二次チャネル信号のピッチ周期インデックス値を計算するよう構成されるインデックス値計算モジュールと
を含む。
可能な実施において、閉ループピッチ周期探索モジュールは、
一次チャネル信号の推定ピッチ周期値と、現在のフレームの二次チャネル信号が分割されるサブフレームの数とに基づき、二次チャネル信号の閉ループピッチ周期基準値を決定し、
整数精度及び分数精度を使用することによって、かつ、二次チャネル信号の閉ループピッチ周期基準値を二次チャネル信号閉ループピッチ周期探索の開始点として使用することによって、閉ループピッチ周期探索を実行して、二次チャネル信号の推定ピッチ周期値を取得する
よう構成される。
可能な実施において、閉ループピッチ周期探索モジュールは、
一次チャネル信号の推定ピッチ周期値に基づき、二次チャネル信号の閉ループピッチ周期整数部loc_T0及び二次チャネル信号の閉ループピッチ周期分数部loc_frac_primを決定し、
次の方法:
f_pitch_prim=loc_T0+loc_frac_prim/N
で二次チャネル信号の閉ループピッチ周期基準値f_pitch_primを計算する
よう構成され、Nは、二次チャネル信号が分割されるサブフレームの数を表す。
可能な実施において、インデックス値上限決定モジュールは、
次の方法:
soft_reuse_index_high_limit=0.5+2
で二次チャネル信号のピッチ周期インデックス値の上限soft_reuse_index_high_limitを計算するよう構成され、Zは、二次チャネル信号のピッチ周期探索範囲調整係数である。
可能な実施において、Zの値は、3、4、又は5である。
可能な実施において、インデックス値計算モジュールは、
一次チャネル信号の推定ピッチ周期値に基づき、二次チャネル信号の閉ループピッチ周期整数部loc_T0及び二次チャネル信号の閉ループピッチ周期分数部loc_frac_primを決定し、
次の方法:
soft_reuse_index=(N×pitch_soft_reuse+pitch_frac_soft_reuse)-(N×loc_T0+loc_frac_prim)+soft_reuse_index_high_limit/M
で二次チャネル信号のピッチ周期インデックス値soft_reuse_indexを計算する
よう構成され、pitch_soft_reuseは、二次チャネル信号の推定ピッチ周期値の整数部を表し、pitch_frac_soft_reuseは、二次チャネル信号の推定ピッチ周期値の分数部を表し、soft_reuse_index_high_limitは、二次チャネル信号のピッチ周期インデックス値の上限を表し、Nは、二次チャネル信号が分割されるサブフレームの数を表し、Mは、二次チャネル信号のピッチ周期インデックス値の上限の調整係数を表し、Mは、非ゼロの実数であり、×は、乗算演算子を表し、+は、加算演算子を表し、-は、減算演算子を表す。
可能な実施において、ステレオエンコーディング装置は、現在のフレームのエンコーディングレートが前もってセットされたレート閾値よりも低いステレオエンコーディングシナリオに適用され、レート閾値は、次の値:13.2キロビット毎秒kbps、16.4kbps、又は24.4kbps、のうちの少なくとも1つである。
本願の第3の態様では、ステレオエンコーディング装置の構成モジュールは、第1の態様及び可能な実施で記載されているステップを更に実行してもよい。詳細については、第1の態様及び可能な実施の上記の記載を参照されたい。
第4の態様に従って、本願の実施形態は、ステレオデコーディング装置であって、
受け取られたステレオエンコードされたビットストリームに基づき、二次チャネル信号のピッチ周期に対して差動デコーディングを実行すべきかどうかを決定するよう構成される決定モジュールと、
二次チャネル信号のピッチ周期に対して差動デコーディングを実行すると決定される場合に、ステレオエンコードされたビットストリームから、現在のフレームの一次チャネル信号の推定ピッチ周期値及び現在のフレームの二次チャネル信号のピッチ周期インデックス値を取得するよう構成される値取得モジュールと、
一次チャネル信号の推定ピッチ周期値及び二次チャネル信号のピッチ周期インデックス値に基づき二次チャネル信号のピッチ周期に対して差動デコーディングを実行して、二次チャネル信号の推定ピッチ周期値を取得するよう構成される差動デコーディングモジュールと
を含み、二次チャネル信号の推定ピッチ周期値は、ステレオエンコードされたビットストリームをデコードするために使用される、装置を更に提供する。
可能な実施において、決定モジュールは、
現在のフレームから二次チャネルピッチ周期差動エンコーディングフラグを取得し、
二次チャネルピッチ周期差動エンコーディングフラグが前もってセットされた第1値である場合に、二次チャネル信号のピッチ周期に対して差動デコーディングを実行すると決定する
よう構成される。
可能な実施において、ステレオデコーディング装置は、独立デコーディングモジュールを更に含み、独立デコーディングモジュールは、
二次チャネル信号のピッチ周期に対して差動デコーディングを実行することをスキップし、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用することをスキップすると決定される場合に、ステレオエンコードされたビットストリームから二次チャネル信号のピッチ周期をデコードするよう構成される。
可能な実施において、ステレオデコーディング装置は、ピッチ周期再利用モジュールを更に有し、ピッチ周期再利用モジュールは、
二次チャネル信号のピッチ周期に対して差動デコーディングを実行することをスキップし、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用すると決定される場合に、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として使用するよう構成される。
可能な実施において、差動デコーディングモジュールは、
一次チャネル信号の推定ピッチ周期値と、現在のフレームの二次チャネル信号が分割されるサブフレームの数とに基づき、二次チャネル信号の閉ループピッチ周期基準値を決定するよう構成される基準値決定サブモジュールと、
二次チャネル信号のピッチ周期探索範囲調整係数に基づき二次チャネル信号のピッチ周期インデックス値の上限を決定するよう構成されるインデックス値上限決定サブモジュールと、
二次チャネル信号の閉ループピッチ周期基準値、二次チャネル信号のピッチ周期インデックス値、及び二次チャネル信号のピッチ周期インデックス値の上限に基づき、二次チャネル信号の推定ピッチ周期値を計算するよう構成される推定値計算サブモジュールと
を含む。
可能な実施において、推定値計算サブモジュールは、
次の方法:
T0_pitch=f_pitch_prim+(soft_reuse_index-soft_reuse_index_high_limit/M)/N
で二次チャネル信号の推定ピッチ周期値T0_pitchを計算するよう構成され、f_pitch_primは、二次チャネル信号の閉ループピッチ周期基準値を表し、soft_reuse_indexは、二次チャネル信号のピッチ周期インデックス値を表し、Nは、二次チャネル信号が分割されるサブフレームの数を表し、Mは、二次チャネル信号のピッチ周期インデックス値の上限の調整係数を表し、Mは、非ゼロの実数であり、/は、除算演算子を表し、+は、加算演算子を表し、-は、減算演算子を表す。
可能な実施において、二次チャネル信号のピッチ周期インデックス値の上限の調整係数の値は、2又は3である。
本願の第4の態様では、ステレオデコーディング装置の構成モジュールは、第2の態様及び可能な実施で記載されているステップを更に実行してもよい。詳細については、第2の態様及び可能な実施の上記の記載を参照されたい。
第5の態様に従って、本願の実施形態は、ステレオ処理装置を提供する。ステレオ処理装置は、ステレオエンコーディング装置、ステレオデコーディング装置、又はチップなどのエンティティを含んでもよく、ステレオ処理装置はプロセッサを含む。任意に、ステレオ処理装置はメモリを更に含んでもよい、メモリは、命令を記憶するよう構成され、プロセッサは、メモリ内の命令を実行するよう構成され、それにより、ステレオ処理装置は、第1の態様又は第2の態様に従う方法を実行する。
第6の態様に従って、本願の実施形態は、コンピュータ可読記憶媒体を提供する。コンピュータ可読記憶媒体は命令を記憶し、命令がコンピュータで実行される場合に、コンピュータは、第1の態様又は第2の態様に従う方法を実行することを可能にされる。
第7の態様に従って、本願の実施形態は、命令を含むコンピュータプログラム製品を提供する。コンピュータプログラム製品がコンピュータで実行される場合に、コンピュータは、第1の態様又は第2の態様に従う方法を実行することを可能にされる。
第8の態様に従って、本願は、チップシステムを提供する。チップシステムは、上記の態様における機能を実装すること、例えば、上記の方法でデータ及び/又は情報を送信又は処理することにおいてステレオエンコーディング装置又はステレオデコーディング装置をサポートするよう構成されたプロセッサを含む。可能な設計で、チップシステムはメモリを更に含み、メモリは、ステレオエンコーディング装置又はステレオデコーディング装置に必要であるプログラム命令及びデータを記憶するよう構成される。チップシステムはチップを含んでもよく、あるいは、チップ及び他のディスクリート素子を含んでもよい。
本願の実施形態に従うステレオ処理システムの構成構造の概略図である。 本願の実施形態に従う端末デバイスに対するステレオエンコーダ及びステレオデコーダの適用の概略図である。 本願の実施形態に従う無線デバイス又はコアネットワークデバイスへのステレオエンコーダの適用の概略図である。 本願の実施形態に従う無線デバイス又はコアネットワークデバイスへのステレオデコーダの適用の概略図である。 本願の実施形態に従う端末デバイスへのマルチチャネルエンコーダ及びマルチチャネルデコーダの適用の概略図である。 本願の実施形態に従う無線デバイス又はコアネットワークデバイスへのマルチチャネルエンコーダの適用の概略図である。 本願の実施形態に従う無線デバイス又はコアネットワークデバイスへのマルチチャネルデコーダの適用の概略図である。 本願の実施形態に従うステレオエンコーディング装置とステレオデコーディング装置との間のインタラクションの略フローチャートである。 本願の実施形態に従うステレオ信号エンコーディングの略フローチャートである。 本願の実施形態に従うステレオ信号エンコーディングの略フローチャートである。 本願の実施形態に従う、一次チャネル信号のピッチ周期パラメータ及び二次チャネル信号のピッチ周期パラメータをエンコードするフローチャートである。 独立エンコーディングスキームを使用することによって取得されたピッチ周期量子化結果と、差動エンコーディングスキームを使用することによって取得されたピッチ周期量子化結果との間の比較の図である。 独立エンコーディングスキームが使用された後に固定コードブックに割り当てられたビットの数と、差動エンコーディングスキームが使用された後に固定コードブックに割り当てられたビットの数との間の比較の図である。 本願の実施形態に従う時間領域ステレオエンコーディング方法の概略図である。 本願の実施形態に従うステレオエンコーディング装置の構成構造の概略図である。 本願の実施形態に従うステレオデコーディング装置の構成構造の概略図である。 本願の実施形態に従う他のステレオエンコーディング装置の構成構造の概略図である。 本願の実施形態に従う他のステレオデコーディング装置の構成構造の概略図である。
本願の実施形態は、ステレオエンコーディング及びデコーディング性能を改善するために、ステレオエンコーディング方法及び装置、並びにステレオデコーディング方法及び装置を提供する。
以下は、添付の図面を参照して本願の実施形態について記載する。
本願の明細書、特許請求の範囲、及び添付の図面で、「第1」、「第2」などの用語は、類似したオブジェクトを区別するよう意図されるが、必ずしも特定の順序又は順番を示すわけではない。理解されるべきは、そのようにして使用される用語は適切な条件で同義である点である。これは、同じ属性を有しているオブジェクトが本願の実施形態で記載される場合に使用される区別方法にすぎない。更に、「含む」、「有している」、及びそれらのあらゆる他の変形の語は、非排他的な包含をカバーするよう意図され、それにより、一連のユニットを含むプロセス、方法、システム、製品、又はデバイスが必ずしもそれらのユニットに限定されず、明示されておらず、そのようなプロセス、方法、製品、又はデバイスに特有でもない他のユニットを含んでもよい。
本願の実施形態における技術的解決法は、様々なステレオ処理システムに適用され得る。図1は、本願の実施形態に従うステレオ処理システムの構成構造の概略図である。ステレオ処理システム100は、ステレオエンコーディング装置101及びステレオデコーディング装置102を含み得る。ステレオエンコーディング装置101は、ステレオエンコードされたビットストリームを生成するよう構成され得、それから、ステレオエンコードされたビットストリームは、オーディオ伝送チャネルを通じてステレオデコーディング装置102へ伝送され得る。ステレオデコーディング装置102は、ステレオエンコードされたビットストリームを受信し、次いで、ステレオデコーディング装置102のステレオデコーディング機能を実行して、最終的に、ステレオデコードされたビットストリームを取得し得る。
本願のこの実施形態で、ステレオエンコーディング装置は、オーディオ通信要件を有している様々な端末デバイス、並びにトランスコーディング要件を有している無線デバイス及びコアネットワークデバイスに適用され得る。例えば、ステレオエンコーディング装置は、上記の端末デバイス、無線デバイス、又はコアネットワークデバイスのステレオエンコーダであってもよい。同様に、ステレオデコーディング装置は、オーディオ通信要件を備えている様々な端末デバイス、並びにトランスコーディング要件を備えている無線デバイス及びコアネットワークデバイスに適用され得る。例えば、ステレオデコーディング装置は、上記の端末デバイス、無線デバイス、又はコアネットワークデバイスのステレオデコーダであってもよい。
図2aは、本願の実施形態に従う端末デバイスへのステレオエンコーダ及びステレオデコーダの適用の概略図である。各端末デバイスは、ステレオエンコーダ、チャネルエンコーダ、ステレオデコーダ、及びチャネルデコーダを含み得る。具体的に、チャネルエンコーダは、ステレオ信号に対してチャネルエンコーディングを実行するために使用され、チャネルデコーダは、ステレオ信号に対してチャネルデコーディングを実行するために使用される。例えば、第1端末デバイス20は、第1ステレオエンコーダ201、第1チャネルエンコーダ202、第1ステレオデコーダ203、及び第1チャネルデコーダ204を含み得る。第2端末デバイス21は、第2ステレオデコーダ211、第2チャネルデコーダ212、第2ステレオエンコーダ213、及び第2チャネルエンコーダ214を含み得る。第1端末デバイス20は、無線又は有線の第1ネットワーク通信デバイス22へ接続され、第1ネットワーク通信デバイス22は、無線又は有線の第2ネットワーク通信デバイス23へデジタルチャネルを通じて接続され、第2端末デバイス21は、無線又は有線の第2ネットワーク通信デバイス23へ接続される。上記の無線又は有線ネットワーク通信デバイスは、一般的に、信号伝送デバイス、例えば、通信基地局又はデータ交換デバイスを指すことができる。
オーディオ通信では、送信端として働く端末デバイスが、収集されたステレオ信号に対してステレオエンコーディングを実行し、次いで、チャネルエンコーディングを実行し、そして、無線ネットワーク又はコアネットワークを使用することによってデジタルチャネル上でステレオ信号を送信する。受信端として働く端末デバイスは、ステレオ信号エンコードされたビットストリームを取得するよう、受信された信号に基づきチャネルデコーディングを実行し、次いで、ステレオデコーディングを通じてステレオ信号を回復し、そして、受信端として働く端末デバイスは再生を実行する。
図2bは、本願の実施形態に従う無線デバイス又はコアネットワークデバイスへのステレオエンコーダの適用の概略図である。無線デバイス又はコアネットワークデバイス25は、チャネルデコーダ251、他のオーディオデコーダ252、ステレオエンコーダ253、及びチャネルエンコーダ254を含む。他のオーディオデコーダ252は、ステレオデコーダ以外のオーディオデコーダである。無線デバイス又はコアネットワークデバイス25では、デバイスに入った信号は、最初に、チャネルデコーダ251によってチャネルデコードされ、次いで、オーディオデコーディング(ステレオデコーディング以外)が他のオーディオデコーダ252によって実行され、次いで、ステレオエンコーディングが、ステレオエンコーダ253を使用することによって実行される。最終的に、ステレオ信号は、チャネルエンコーダ254を使用することによってチャネルエンコードされ、次いで、チャネルエンコーディングが完了した後に送信される。
図2cは、本願の実施形態に従う無線デバイス又はコアネットワークデバイスへのステレオデコーダの適用の概略図である。無線デバイス又はコアネットワークデバイス25は、チャネルデコーダ251、ステレオデコーダ255、他のオーディオエンコーダ256、及びチャネルエンコーダ254を含む。他のオーディオエンコーダ256は、ステレオエンコーダ以外のオーディオエンコーダである。無線デバイス又はコアネットワークデバイス25では、デバイスに入った信号は、最初に、チャネルデコーダ251によってチャネルデコードされ、次いで、受信されたステレオエンコードされたビットストリームは、ステレオデコーダ255によってデコードされ、次いで、オーディオエンコーディング(ステレオエンコーディング以外)が他のオーディオエンコーダ256を使用することによって実行される。最終的に、ステレオ信号は、チャネルエンコーダ254を使用することによってチャネルエンコードされ、次いで、チャネルエンコーディングが完了した後に送信される。無線デバイス又はコアネットワークデバイスで、トランスコーディングが実装される必要がある場合には、対応するステレオエンコーディング及びデコーディング処理が実行される必要がある。無線デバイスは、通信中の無線周波数関連デバイスであり、コアネットワークデバイスは、通信中のコアネットワーク関連デバイスである。
本願のいくつかの実施形態で、ステレオエンコーディング装置は、オーディオ通信要件を有している様々な端末デバイス、並びにトランスコーディング要件を有している無線デバイス及びコアネットワークデバイスに適用され得る。例えば、ステレオエンコーディング装置は、上記の端末デバイス、無線デバイス、又はコアネットワークデバイスのマルチチャネルエンコーダであってもよい。同様に、ステレオデコーディング装置は、オーディオ通信要件を備えている様々な端末デバイス、並びにトランスコーディング要件を有している無線デバイス及びコアネットワークデバイスに適用され得る。例えば、ステレオデコーディング装置は、上記の端末デバイス、無線デバイス、又はコアネットワークデバイスのマルチチャネルデコーダであってもよい。
図3aは、本願の実施形態に従う端末デバイスへのマルチチャネルエンコーダ及びマルチチャネルデコーダの適用の概略図である。各端末デバイスは、マルチチャネルエンコーダ、チャネルエンコーダ、マルチチャネルデコーダ、及びチャネルデコーダを含み得る。具体的に、チャネルエンコーダは、マルチチャネル信号に対してチャネルエンコーディングを実行するために使用され、チャネルデコーダは、マルチチャネル信号に対してチャネルデコーディングを実行するために使用される。例えば、第1端末デバイス30は、第1マルチチャネルエンコーダ301、第1チャネルエンコーダ302、第1マルチチャネルデコーダ303、及び第1チャネルデコーダ304を含み得る。第2端末デバイス31は、第2マルチチャネルデコーダ311、第2チャネルデコーダ312、第2マルチチャネルエンコーダ313、及び第2チャネルエンコーダ314を含み得る。第1端末デバイス30は、無線又は有線の第1ネットワーク通信デバイス32へ接続され、第1ネットワーク通信デバイス32は、デジタルチャネルを通じて無線又は有線の第2ネットワーク通信デバイス33へ接続され、第2端末デバイス31は、無線又は有線の第2ネットワーク通信デバイス33へ接続される。上記の無線又は有線のネットワーク通信デバイスは、一般的に、信号伝送デバイス、例えば、通信基地局又はデータ交換デバイスを指すことができる。オーディオ通信では、送信端として働く端末デバイスが、収集されたマルチチャネル信号に対してマルチチャネルエンコーディングを実行し、次いで、チャネルエンコーディングを実行し、そして、無線ネットワーク又はコアネットワークを使用することによってデジタルチャネル上でマルチチャネル信号を送信する。受信端として働く端末デバイスは、マルチチャネル信号エンコードされたビットストリームを取得するよう、受信された信号に基づきチャネルデコーディングを実行し、次いで、マルチチャネルデコーディングを通じてマルチチャネル信号を回復し、そして、受信端として働く端末デバイスは再生を実行する。
図3bは、本願の実施形態に従う無線デバイス又はコアネットワークデバイスへのマルチチャネルエンコーダの適用の概略図である。無線デバイス又はコアネットワークデバイス35は、チャネルデコーダ351、他のオーディオデコーダ352、マルチチャネルエンコーダ353、及びチャネルエンコーダ354を含む。図3bは図2bと同様であり、詳細はここで再び記載されない。
図3cは、本願の実施形態に従う無線デバイス又はコアネットワークデバイスへのマルチチャネルデコーダの適用の概略図である。無線デバイス又はコアネットワークデバイス35は、チャネルデコーダ351、マルチチャネルデコーダ355、他のオーディオエンコーダ356、及びチャネルエンコーダ354を含む。図3cは図2cと同様であり、詳細はここで再び記載されない。
ステレオエンコーディング処理は、マルチチャネルエンコーダの一部であってよく、ステレオデコーディング処理は、マルチチャネルデコーダの一部であってよい。例えば、収集されたマルチチャネル信号に対してマルチチャネルエンコーディングを実行することは、収集されたマルチチャネル信号に対して次元削減処理を実行してステレオ信号を取得し、取得されたステレオ信号をエンコードすることであってもよい。デコーダ側は、マルチチャネル信号エンコードされたビットストリームに基づきデコーディングを実行してステレオ信号を取得し、アップミックス処理後にマルチチャネル信号を回復する。従って、本願の実施形態は、端末デバイス、無線デバイス、又はコアネットワークデバイスにおけるマルチチャネルエンコーダ及びマルチチャネルデコーダにも適用され得る。無線デバイス又はコアネットワークデバイスで、トランスコーディングが実装される必要がある場合には、対応するマルチチャネルエンコーディング及びデコーディング処理が実行される必要がある。
本願の実施形態で、ピッチ周期エンコーディングは、ステレオエンコーディング方法における重要なステップである。有声音は準周期インパルス励振を通じて生成されるので、有線音の時間領域波形は明らかな周期性を示し、これはピッチ周期と呼ばれる。有線音が、ピッチ周期によって分けられたサンプリング点から成る準周期信号として特徴付けられるので、ピッチ周期は、高品質の有線音を生成する際に重要な役割を果たす。発話処理では、ピッチ周期は、周期内に含まれるサンプルの量によっても表される。この場合に、ピッチ周期はピッチ遅延と呼ばれる。ピッチ遅延は、適応コードブックの重要なパラメータである。
ピッチ周期推定は、主に、ピッチ周期を推定するプロセスを指す。従って、ピッチ周期推定の精度は、励振信号の正確さを直接に決定し、それに応じて、合成された発話信号の品質を決定する。中ビットレート及び低ビットレートでピッチ周期を示すために使用されるビットリソースは少量であり、これは、発話エンコーディングの品質劣化の理由の1つである。一次チャネル信号及び二次チャネル信号のピッチ周期は、非常に類似している。本願の実施形態では、ピッチ周期の類似性は、エンコーディング効率を改善するために適切に使用され得る。ピッチ周期推定の精度は、中レート及び低レートでの全体のステレオエンコーディング品質に作用する重要な因子である。
本願の実施形態において、周波数領域で又は時間と周波数との組み合わせの場合に実行されるパラメトリックステレオエンコーディングについては、一次チャネル信号のピッチ周期と二次チャネル信号のピッチ周期との間の相関が存在する。二次チャネル信号のピッチ周期のエンコーディングについては、二次チャネル信号のピッチ周期再利用条件が満足される場合に、二次チャネル信号のピッチ周期パラメータは合理的に予測され、差動エンコーディング方法を使用することによって差動エンコードされる。このようにして、ほんの少量のビットリソースしか、二次チャネル信号のピッチ周期の量子化及びエンコーディングのために割り当てられる必要がない。本願の実施形態は、ステレオ信号の空間感覚及び音響画像安定性を改善することができる。更に、本願の実施形態では、二次チャネル信号のピッチ周期のために使用されるビットリソースは比較的に少量であり、それにより、二次チャネル信号のピッチ周期予測の精度は確保される。残りのビットリソースは、他のステレオエンコーディングパラメータ、例えば、固定コードブックのために使用される。従って、二次チャネル信号のエンコーディング効率は改善され、最終的な全体のステレオエンコーディング品質は改善される。
本願の実施形態において、二次チャネル信号のピッチ周期差動エンコーディング方法は、二次チャネル信号のピッチ周期のエンコーディングのために使用され、一次チャネル信号のピッチ周期は基準値として使用され、ビットリソースは、ステレオエンコーディング品質を改善するために、二次チャネル信号に再割り当てされる。以下は、上記のシステムアーキテクチャ、ステレオエンコーディング装置、及びステレオデコーディング装置に基づき本願の実施形態で提供されるステレオエンコーディング方法及びステレオデコーディング方法について記載する。図4は、本願の実施形態に従う、ステレオエンコーディング装置とステレオデコーディング装置との間のインタラクションの略フローチャートである。次のステップ401からステップ403は、ステレオエンコーディング装置(簡潔に、以下では、エンコーダ側と呼ばれる)によって実行され得る。次のステップ411からステップ413は、ステレオデコーディング装置(簡潔に、以下では、デコーダ側と呼ばれる)によって実行され得る。インタラクションは、主に、次のプロセスを含む。
401:現在のフレームの左チャネル信号及び現在のフレームの右チャネル信号に対してダウンミックス処理を実行して、現在のフレームの一次チャネル信号及び現在のフレームの二次チャネル信号を取得する。
本願のこの実施形態は、現在のフレームは、エンコーディング処理がエンコーダ側で現在実行されているステレオ信号フレームである。現在のフレームの左チャネル信号及び現在のフレームの右チャネル信号が最初に取得され、ダウンミックス処理が、現在のフレームの一次チャネル信号及び現在のフレームの二次チャネル信号を取得するよう、左チャネル信号及び右チャネル信号に対して実行される。例えば、ステレオエンコーディング及びデコーディング技術の多種多様な実施が存在する。例えば、エンコーダ側は、時間領域信号を2つのモノ信号にダウンミックスする。左右のチャネル信号が最初に、一次チャネル信号及び二次チャネル信号にダウンミックスされ、Lは左チャネル信号を表し、Rは右チャネル信号を表す。この場合に、一次チャネル信号は、0.5×(L+R)であってよく、これは、2つのチャネルの間の相関に関する情報を示し、二次チャネル信号は、0.5×(L-R)であってよく、これは、2つのチャネルの間の差に関する情報を示す。
周期領域のステレオエンコーディングにおけるダウンミックスプロセス及び時間領域のステレオエンコーディングにおけるダウンミックスプロセスは、続く実施形態で詳細に記載されることが留意されるべきである。
本願のいくつかの実施形態において、エンコーダ側によって実行されるステレオエンコーディング方法は、現在のフレームのエンコーディングレートが前もってセットされたレート閾値よりも低いステレオエンコーディングシナリオに適用されてもよい。デコーダ側によって実行されるステレオデコーディング方法は、現在のフレームのデコーディングレートが前もってセットされたレート閾値よりも低いステレオデコーディングシナリオに適用されてもよい。現在のフレームのエンコーディングレートは、現在のフレームのステレオ信号によって使用されるエンコーディングレートであり、レート閾値は、ステレオ信号のために指定された最小レート値である。現在のフレームのエンコーディングレートが前もってセットされたレート閾値よりも低い場合に、本願のこの実施形態で提供されるステレオエンコーディング方法は実行され得る。現在のフレームのデコーディングレートが前もってセットされたレート閾値よりも低い場合に、本願のこの実施形態で提供されるステレオデコーディング方法は実行され得る。
更に、本願のいくつかの実施形態において、レート閾値は、次の値:13.2キロビット毎秒kbps、16.4kbps、又は24.4kbps、のうちの少なくとも1つである。
レート閾値は、13.2kbps以下であってもよい。例えば、レート閾値は、代替的に、16.4kbps又は24.4kbpsであってもよい。レート閾値の具体的な値は、適応シナリオに基づいて決定され得る。エンコーディングレートが比較的に低い(例えば、24.4kbps以下)場合に、独立エンコーディングは二次チャネル信号のピッチ周期に対して実行されず、一次チャネル信号の推定ピッチ周期値が基準値として使用される。差動エンコーディング方法は、ステレオエンコーディング品質を改善するよう、二次チャネル信号のピッチ周期のエンコーディングを実装するために使用される。
402:二次チャネル信号のピッチ周期に対して差動デコーディングを実行すべきかどうかを決定する。
本願のこの実施形態では、現在のフレームの一次チャネル信号及び現在のフレームの二次チャネル信号が取得された後、現在のフレームの一次チャネル信号及び二次チャネル信号に基づき、差動エンコーディングが二次チャネル信号のピッチ周期に対して実行可能であるかどうかが決定され得る。例えば、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行すべきかどうかは、現在のフレームの一次チャネル信号及び二次チャネル信号の信号特性に基づき決定される。他の例として、一次チャネル信号、二次チャネル信号、及び前もってセットされた決定条件は、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行すべきかどうかを決定するために使用されてもよい。差動エンコーディングを実行すべきかどうかを決定するために一次チャネル信号及び二次チャネル信号を使用する多数の方法があり、これらは別々に、続く実施形態で詳細に記載される。
本願のこの実施形態では、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行すべきかどうかを決定するステップ402は:
現在のフレームの一次チャネル信号をエンコードして、一次チャネル信号の推定ピッチ周期値を取得することと、
現在のフレームの二次チャネル信号に対して開ループピッチ周期解析を実行して、二次チャネル信号の推定開ループピッチ周期値を取得することと、
一次チャネル信号の推定ピッチ周期値と二次チャネル周期の推定開ループピッチ周期値との間の差が前もってセットされた二次チャネルピッチ周期差動エンコーディング閾値を超えるかどうかを決定することと、
差が二次チャネルピッチ周期差動エンコーディング閾値を超える場合には、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行すると決定し、あるいは、差が二次チャネルピッチ周期差動エンコーディング閾値を超えない場合には、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行することをスキップすると決定することと
を含む。
本願のこの実施形態では、現在のフレームの一次チャネル信号がステップ401で取得された後に、一次チャネル信号の推定ピッチ周期値を取得するために、一次チャネル信号に基づいてエンコーディングが実行され得る。具体的に、一次チャネルエンコーディングでは、ピッチ周期推定は、ピッチ周期推定の精度を改善するために、開ループピッチ解析及び閉ループピッチ探索の組み合わせを通じて実行される。発話信号のピッチ周期は、複数の方法を使用すること、例えば、自己相関関数を使用すること、又は短期平均振幅差を使用することによって、推定され得る。ピッチ周期推定アルゴリズムは自己相関関数に基づく。自己相関関数は、ピッチ周期の整数倍でピークを有し、この特徴は、ピッチ周期を推定するために使用可能である。ピッチ予測の精度を改善し、発話の実際のピッチ周期をより良く近似するために、1/3のサンプリング分解能を有する分数遅延が、ピッチ周期検出のために使用される。ピッチ周期推定の計算量を減らすために、ピッチ周期推定は、2つのステップ、つまり、開ループピッチ解析及び閉ループピッチ探索を含む。開ループピッチ解析は、候補整数遅延を取得するよう発話のフレームの整数遅延を大まかに推定するために使用される。閉ループピッチ探索は、整数遅延の近くでピッチ遅延を細かく推定するために使用され、閉ループピッチ探索は、サブフレームごとに一度実行される。開ループピッチ解析は、自己相関、正規化、及び最適な開ループ整数遅延を計算するよう、フレームごとに一度実行される。一次チャネル信号の推定ピッチ周期値は、上記のプロセスを使用することによって使用され得る。
現在のフレームの二次チャネル信号が取得された後、開ループピッチ周期解析が、二次チャネル信号の推定開ループピッチ周期値を取得するよう、二次チャネル信号に対して実行され得る。開ループピッチ周期解析の具体的なプロセスについては、詳細に記載されない。
本願のこの実施形態では、一次チャネル信号の推定ピッチ周期値及び二次チャネル信号の推定開ループピッチ周期値が取得された後、一次チャネル信号の推定ピッチ周期値と二次チャネル信号の推定開ループピッチ周期値との間の差が計算され得、次いで、差が前もってセットされた二次チャネルピッチ周期差動エンコーディング閾値を超えるかどうかが決定される。二次チャネルピッチ周期差動エンコーディング閾値は、前もってセットされてよく、ステレオエンコーディングシナリオを参照して柔軟に設定されてもよい。差が二次チャネルピッチ周期差動エンコーディング閾値を超える場合に、差動エンコーディングを実行すると決定され、あるいは、差が二次チャネルピッチ周期差動エンコーディング閾値を超えない場合には、差動エンコーディングを実行しないと決定される。
本願のこの実施形態では、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行すべきかどうか決定する方法は、差と二次チャネルピッチ周期差動エンコーディング閾値との比較による上記の決定に限定されないことが留意されるべきである。例えば、それは、代替的に、差を二次チャネルピッチ周期差動エンコーディング閾値で除した結果が1よりも小さいかどうかに基づき決定されてもよい。他の例として、一次チャネル信号の推定ピッチ周期値が、二次チャネル信号の推定開ループピッチ周期値で除されてもよく、得られた除算結果が二次チャネルピッチ周期差動エンコーディング閾値と比較される。更に、二次チャネルピッチ周期差動エンコーディング閾値の具体的な値は、適応シナリオを参照して決定されてもよい。これはここで限定されない。
例えば、二次チャネルエンコーディングでは、二次チャネル信号のピッチ周期差動エンコーディング決定は、一次チャネル信号の推定ピッチ周期値と、二次チャネル信号の推定開ループピッチ周期値とに基づき実行される。例えば、使用され得る決定条件は:DIFF=|Σ(pitch[0])-Σ(pitch[1])|である。
DIFFは、一次チャネル信号の推定ピッチ周期値と二次チャネル信号の推定開ループピッチ周期値との間の差を表す。|Σ(pitch[0])-Σ(pitch[1])|は、Σ(pitch[0])とΣ(pitch[1])との間の差の絶対値を表す。Σpitch[0]は、一次チャネル信号の推定ピッチ周期値を表し、Σpitch[1]は、二次チャネル信号の推定開ループピッチ周期値を表す。
本願のこの実施形態で使用され得る決定条件は、上記の式に限定されなくてもよい。例えば、|Σ(pitch[0])-Σ(pitch[1])|の計算結果が得られた後、補正係数が更にセットされてもよく、|Σ(pitch[0])-Σ(pitch[1])|に補正係数を乗じた結果が、最終的な出力されるDIFFとして使用されてもよい。他の例として、条件付き閾定数が、最終的なDIFFを得るために、式DIFF=|Σ(pitch[0])-Σ(pitch[1])|の右部分に加えられても、あるいは、それから減じられてもよい。
本願のこの実施形態では、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行すべきかどうかが決定された後、ステップ403を実行すべきかどうかが、上記の決定の結果に基づき決定される。二次チャネル信号のピッチ周期に対して差動エンコーディングを実行すると決定される場合に、続くステップ403が実行されるようトリガされる。
本願のいくつかの実施形態において、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行すべきかどうかを決定するステップ402の後、本願のこの実施形態で提供される方法は:
二次チャネル信号のピッチ周期に対して差動エンコーディングを実行すると決定する場合に、現在のフレームにおける二次チャネルピッチ周期差動エンコーディングフラグを前もってセットされた第1値に設定することを更に含み、
ステレオエンコードされたビットストリームが、二次チャネルピッチ周期差動エンコーディングフラグを運び、第1値は、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行することを示すために使用される。
エンコーダ側は、二次チャネルピッチ周期差動エンコーディングフラグを取得する。二次チャネルピッチ周期差動エンコーディングフラグの値は、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行すべきかどうかに基づき設定され得る。二次チャネルピッチ周期差動エンコーディングフラグは、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行すべきかどうかを示すために使用される。
本願のこの実施形態では、二次チャネルピッチ周期差動エンコーディングフラグは、複数の値を有し得る。例えば、二次チャネルピッチ周期差動エンコーディングフラグは、前もってセットされた第1値又は第2値であってよい。以下は、二次チャネルピッチ周期差動エンコーディングフラグを設定する方法の例について記載する。二次チャネル信号のピッチ周期に対して差動エンコーディングを実行すると決定される場合に、二次チャネルピッチ周期差動エンコーディングフラグは第1値に設定される。二次チャネルピッチ周期差動エンコーディングフラグが第1値を示すという事実に基づき、デコーダ側は、差動デコーディングが二次チャネル信号のピッチ周期に対して実行されてもよいと決定することができる。例えば、二次チャネルピッチ周期差動エンコーディングフラグの値は0又は1であってよく、第1値が1であり、第2値が0である。
例えば、二次チャネルピッチ周期差動エンコーディングフラグは、Pitch_reuse_flagによって示される。DIFF_THRは、前もってセットされた二次チャネルピッチ周期差動エンコーディング閾値である。異なるエンコーディングレートに基づき、二次チャネルピッチ周期差動エンコーディング閾値は{1,3,6}内の特定の値であることが決定される。例えば、DIFF>DIFF_THRであるとき、Pitch_reuse_flag=1であり、二次チャネル信号のピッチ周期差動エンコーディングが現在のフレームで使用されることが決定される。DIFF≦DIFF_THRであるとき、Pitch_reuse_flag=0である。この場合に、ピッチ周期差動エンコーディングは実行されず、二次チャネル信号の独立エンコーディングが使用される。
本願のいくつかの実施形態において、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行すべきかどうか決定するステップ402の後、本願のこの実施形態で提供される方法は:
二次チャネル信号のピッチ周期に対して差動エンコーディングを実行することをスキップし、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用することをスキップすると決定する場合に、二次チャネル信号のピッチ周期と一次チャネル信号のピッチ周期とを別々にエンコードすることを更に含む。
差動エンコーディングが二次チャネル信号のピッチ周期に対して実行されず、かつ、一次チャネル信号の推定ピッチ周期値が二次チャネル信号のピッチ周期として再利用されない場合に、二次チャネル信号のためのピッチ周期独立エンコーディング方法が、二次チャネル信号のピッチ周期をエンコードするために、本願のこの実施形態で使用されてもよく、それにより、二次チャネル信号のピッチ周期はエンコードされ得る。
本願のいくつかの実施形態において、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行すべきかどうか決定するステップ402の後、本願のこの実施形態で提供される方法は:
二次チャネル信号のピッチ周期に対して差動エンコーディングを実行することをスキップし、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用すると決定する場合に、二次チャネル信号ピッチ周期再利用フラグを前もってセットされた第4値に設定し、ステレオエンコードされたビットストリームを使用して二次チャネル信号ピッチ周期再利用フラグを運ぶことを更に含み、
第4値は、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用することを示すために使用される。
差動エンコーディングが二次チャネル信号のピッチ周期に対して実行されない場合に、ピッチ周期再利用方法が本願のこの実施形態では使用されてもよい。具体的に言えば、エンコーダ側は、二次チャネル信号のピッチ周期をエンコードせず、ステレオエンコードされたビットストリームは、二次チャネル信号ピッチ周期再利用フラグを運ぶ。二次チャネル信号ピッチ周期再利用フラグは、二次チャネル信号のピッチ周期が一次チャネル信号の推定ピッチ周期値を再利用するかどうかを示すために使用される。二次チャネル信号のピッチ周期が一次チャネル信号の推定ピッチ周期値を再利用することを二次チャネル信号ピッチ周期再利用フラグが示す場合に、デコーダ側は、二次チャネル信号ピッチ周期再利用フラグに基づき、一次チャネル信号のピッチ周期を二次チャネル信号のピッチ周期としてデコーディングのために使用し得る。
本願のいくつかの実施形態において、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行すべきかどうか決定するステップ402の後、本願のこの実施形態で提供される方法は:
二次チャネル信号のピッチ周期に対して差動エンコーディングを実行することをスキップすると決定する場合に、二次チャネルピッチ周期差動エンコーディングフラグを前もってセットされた第2値に設定することであり、ステレオエンコードされたビットストリームが、二次チャネルピッチ周期差動エンコーディングフラグを運び、第2値は、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行することをスキップすることを示すために使用される、ことと、
一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用することをスキップすると決定する場合に、二次チャネル信号ピッチ周期再利用フラグを前もってセットされた第3値に設定することであり、ステレオエンコードされたビットストリームが二次チャネル信号ピッチ周期再利用フラグを運び、第3値は、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用することをスキップすることを示すために使用される、ことと、
二次チャネル信号のピッチ周期及び一次チャネル信号のピッチ周期を別々にエンコードすることと
を更に含む。
二次チャネルピッチ周期差動エンコーディングフラグは、複数の値を有し得る。例えば、二次チャネルピッチ周期差動エンコーディングフラグは、前もってセットされた第1値又は第2値であってよい。以下は、二次チャネルピッチ周期差動エンコーディングフラグを設定する方法の例について記載する。二次チャネル信号のピッチ周期に対して差動エンコーディングを実行することをスキップすると決定される場合に、二次チャネルピッチ周期差動エンコーディングフラグは第2値に設定される。二次チャネルピッチ周期差動エンコーディングフラグが第2値を示すという事実に基づき、デコーダ側は、差動デコーディングが二次チャネル信号のピッチ周期に対して実行されなくてもよいと決定することができる。例えば、二次チャネルピッチ周期差動エンコーディングフラグの値は0又は1であってよく、第1値が1であり、第2値が0である。二次チャネルピッチ周期差動エンコーディングフラグ第2値を示すという事実に基づき、デコーダ側は、二次チャネル信号のピッチ周期に対して差動デコーディングを実行しないと決定することができる。
二次チャネル信号ピッチ周期再利用フラグは、複数の値を有し得る。例えば、第2チャネル信号ピッチ周期再利用フラグは、前もってセットされた第4値又は第3値であってよい。以下は、二次チャネル信号ピッチ周期再利用フラグを設定する方法の例について記載する。一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用することをスキップすると決定される場合に、二次チャネル信号ピッチ周期再利用フラグは第3値に設定される。二次チャネル信号ピッチ周期再利用フラグが第3値を示すという事実に基づき、デコーダ側は、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用しないと決定することができる。例えば、二次チャネル信号ピッチ周期再利用フラグの値は0又は1であってよく、第4値が0であり、第3値が0である。エンコーダ側が二次チャネル信号のピッチ周期に対して差動エンコーディングを実行することをスキップし、かつ、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用することをスキップすると決定する場合に、エンコーダ側は、独立エンコーディング方法を使用してもよく、つまり、二次チャネル信号のピッチ周期及び一次チャネル信号のピッチ周期を別々にエンコードする。
本願のこの実施形態では、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行しないと決定される場合に、二次チャネル信号のピッチ周期独立エンコーディング方法が、二次チャネル信号のピッチ周期をエンコードするために使用され得ることが留意されるべきである。更に、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行しないと決定される場合に、ピッチ周期再利用法が代替的に使用されてもよい。エンコーダ側によって実行されるステレオエンコーディング方法は、現在のフレームが前もってセットされたレート閾値よりも低いステレオエンコーディングシナリオに適用され得る。差動エンコーディングが二次チャネル信号のピッチ周期を使用することによって実行されない場合に、二次チャネル信号ピッチ周期再利用フラグが使用されてもよい。すなわち、二次チャネルピッチ周期はエンコーダ側でエンコードされず、ステレオエンコードされたビットストリームは二次チャネル信号ピッチ周期再利用フラグを運ぶ。二次チャネル信号ピッチ周期再利用フラグは、二次チャネル信号のピッチ周期が一次チャネル信号の推定ピッチ周期値を再利用するかどうかを示すために使用され、二次チャネル信号のピッチ周期が一次チャネル信号の推定ピッチ周期値を再利用することを二次チャネル信号ピッチ周期再利用フラグが示す場合に、デコーダ側は、二次チャネル信号ピッチ周期再利用フラグに基づき、一次チャネル信号のピッチ周期をデコーディングのために二次チャネル信号のピッチ周期として使用し得る。
本願のいくつかの実施形態において、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行すべきかどうかを決定するステップ402の後、本願のこの実施形態で提供される方法は:
二次チャネル信号のピッチ周期に対して差動エンコーディングを実行することをスキップすると決定する場合に、二次チャネルピッチ周期差動エンコーディングフラグを前もってセットされた第2値に設定することであり、ステレオエンコードされたビットストリームが、二次チャネルピッチ周期差動エンコーディングフラグを運び、第2値は、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行することをスキップすることを示すために使用される、ことと、
一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用すると決定する場合に、二次チャネル信号ピッチ周期再利用フラグを前もってセットされた第4値に設定することであり、ステレオエンコードされたビットストリームが二次チャネル信号ピッチ周期再利用フラグを運び、第4値は、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用することを示すために使用される、ことと
を更に含む。
二次チャネルピッチ周期差動エンコーディングフラグは、複数の値を有し得る。例えば、二次チャネルピッチ周期差動エンコーディングフラグは、前もってセットされた第1値又は第2値であってよい。以下は、二次チャネルピッチ周期差動エンコーディングフラグを設定する方法の例について記載する。二次チャネル信号のピッチ周期に対して差動エンコーディングを実行することをスキップすると決定される場合に、二次チャネルピッチ周期差動エンコーディングフラグは第2値に設定される。二次チャネルピッチ周期差動エンコーディングフラグが第2値を示すという事実に基づき、デコーダ側は、差動デコーディングが二次チャネル信号のピッチ周期に対して実行されなくてもよいと決定することができる。例えば、二次チャネルピッチ周期差動エンコーディングフラグの値は0又は1であってよく、第1値が1であり、第2値が0である。二次チャネルピッチ周期差動エンコーディングフラグ第2値を示すという事実に基づき、デコーダ側は、二次チャネル信号のピッチ周期に対して差動デコーディングを実行しないと決定することができる。
二次チャネル信号ピッチ周期再利用フラグは、複数の値を有し得る。例えば、第2チャネル信号ピッチ周期再利用フラグは、前もってセットされた第4値又は第3値であってよい。エンコーダ側が、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行することをスキップし、かつ、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用すると決定する場合に、二次チャネル信号ピッチ周期再利用フラグは第4値に設定される。以下は、二次チャネル信号ピッチ周期再利用フラグを設定する方法の例について記載する。一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用すると決定される場合に、二次チャネル信号ピッチ周期再利用フラグは第4値に設定される。二次チャネル信号ピッチ周期再利用フラグが第4値を示すという事実に基づき、デコーダ側は、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用すると決定することができる。例えば、二次チャネル信号ピッチ周期再利用フラグの値は0又は1であってよく、第4値が0であり、第3値が0である。
403:二次チャネル信号のピッチ周期に対して差動エンコーディングを実行すると決定する場合に、一次チャネル信号の推定ピッチ周期値を使用することによって二次チャネル信号のピッチ周期に対して差動エンコーディングを実行して、二次チャネル信号のピッチ周期インデックス値を取得し、このとき、二次チャネル信号のピッチ周期インデックス値は、送信されるべきステレオエンコードされたビットストリームを生成するために使用される。
本願のこの実施形態では、差動エンコーディングが二次チャネル信号のピッチ周期に対して実行されもよいことが決定される場合に、差動エンコーディングは、一次チャネル信号の推定ピッチ周期値を使用することによって二次チャネル信号のピッチ周期に対して実行され得る。一次チャネル信号の推定ピッチ周期値が差動エンコーディングで使用されるので、二次チャネル信号の推定ピッチ周期値は、一次チャネル信号と二次チャネル信号との間のピッチ周期類似性を考慮して差動エンコーディングを通じて正確にエンコードされる。二次チャネル信号は、二次チャネル信号の推定ピッチ周期値を使用することによってより正確にデコードされ得、それにより、ステレオ信号の空間感覚及び音響画像安定性は改善され得る。更に、二次チャネル信号のピッチ周期が独立してエンコードされる必要がある場合には、差動エンコーディングが、本願のこの実施形態では二次チャネル信号のピッチ周期に対して実行され、それにより、二次チャネル信号のピッチ周期を独立してエンコードするために使用されるビットリソースオーバヘッドは低減可能であり、節約されたビットは、正確な二次チャネルピッチ周期エンコーディングを実装しかつ全体的なステレオエンコーディング品質を改善するよう、他のステレオエンコーディングパラメータに割り当てられ得る。
本願のこの実施形態では、現在のフレームの一次チャネル信号がステップ401で取得された後に、一次チャネル信号の推定ピッチ周期値を取得するために、一次チャネル信号に基づいてエンコーディングが実行され得る。具体的に、一次チャネルエンコーディングでは、ピッチ周期推定は、ピッチ周期推定の精度を改善するために、開ループピッチ解析及び閉ループピッチ探索の組み合わせを通じて実行される。発話信号のピッチ周期は、複数の方法を使用すること、例えば、自己相関関数を使用すること、又は短期平均振幅差を使用することによって、推定され得る。ピッチ周期推定アルゴリズムは自己相関関数に基づく。自己相関関数は、ピッチ周期の整数倍でピークを有し、この特徴は、ピッチ周期を推定するために使用可能である。ピッチ予測の精度を改善し、発話の実際のピッチ周期をより良く近似するために、1/3のサンプリング分解能を有する分数遅延が、ピッチ周期検出のために使用される。ピッチ周期推定の計算量を減らすために、ピッチ周期推定は、2つのステップ、つまり、開ループピッチ解析及び閉ループピッチ探索を含む。開ループピッチ解析は、候補整数遅延を取得するよう発話のフレームの整数遅延を大まかに推定するために使用される。閉ループピッチ探索は、整数遅延の近くでピッチ遅延を細かく推定するために使用され、閉ループピッチ探索は、サブフレームごとに一度実行される。開ループピッチ解析は、自己相関、正規化、及び最適な開ループ整数遅延を計算するよう、フレームごとに一度実行される。一次チャネル信号の推定ピッチ周期値は、上記のプロセスを使用することによって使用され得る。
以下は、本願のこの実施形態での差動エンコーディングの具体的なプロセスについて記載する。具体的に、一次チャネル信号の推定ピッチ周期値を使用することによって二次チャネル信号のピッチ周期に対して差動エンコーディングを実行して、二次チャネル信号のピッチ周期インデックス値を取得することは:
一次チャネル信号の推定ピッチ周期値に基づき二次チャネル信号閉ループピッチ周期探索を実行して、二次チャネル信号の推定ピッチ周期値を取得することと、
二次チャネル信号のピッチ周期探索範囲調整係数に基づき二次チャネル信号のピッチ周期インデックス値の上限を決定することと、
一次チャネル信号の推定ピッチ周期値、二次チャネル信号の推定ピッチ周期値、及び二次チャネル信号のピッチ周期インデックス値の上限に基づき、二次チャネル信号のピッチ周期インデックス値を計算することと
を含む。
エンコーダ側は最初に、二次チャネル信号の推定ピッチ周期値を決定するよう、二次チャネル信号の推定ピッチ周期値に基づき二次チャネル信号閉ループピッチ周期探索を実行する。以下は、閉ループピッチ周期探索の具体的なプロセスについて詳細に記載する。本願のいくつかの実施形態において、一次チャネル信号の推定ピッチ周期値に基づき二次チャネル閉ループピッチ周期探索を実行して、二次チャネル信号の推定ピッチ周期値を取得することは:
一次チャネル信号の推定ピッチ周期値と、現在のフレームの二次チャネル信号が分割されるサブフレームの数とに基づき、二次チャネル信号の閉ループピッチ周期基準値を決定することと、
整数精度及び分数精度を使用することによって、かつ、二次チャネル信号の閉ループピッチ周期基準値を二次チャネル信号閉ループピッチ周期探索の開始点として使用することによって、閉ループピッチ周期探索を実行して、二次チャネル信号の推定ピッチ周期値を取得することと
を含む。
現在のフレームの二次チャネル信号が分割されるサブフレームの数は、二次チャネル信号のサブフレーム構成に基づき決定され得る。例えば、二次チャネル信号は、4つのサブフレーム又は3つのサブフレームに分割されてもよく、これは、具体的に、適応シナリオを参照して決定される。一次チャネル信号の推定ピッチ周期値が取得された後、一次チャネル信号の推定ピッチ周期値、及び二次チャネル信号が分割されるサブフレームの数が、二次チャネル信号の閉ループピッチ周期基準値を計算するために使用され得る。二次チャネル信号の閉ループピッチ周期基準値は、一次チャネル信号の推定ピッチ周期値に基づき決定された基準値である。二次チャネル信号の閉ループピッチ周期基準値は、一次チャネル信号の推定ピッチ周期値を基準として使用することによって決定される二次チャネル信号の閉ループピッチ周期を表す。例えば、1つの方法は、一次チャネル信号のピッチ周期を二次チャネル信号の閉ループピッチ周期基準値として直接に使用されることである。つまり、4つの値が、一次チャネル信号の5つのサブフレームのピッチ周期から、二次チャネル信号の4つのサブフレームの閉ループピッチ周期基準値として選択される。他の方法では、一次チャネル信号の5つのサブフレームのピッチ周期は、補間法を使用することによって、二次チャネル信号の4つのサブフレームの閉ループピッチ周期基準値にマッピングされる。
具体的に、閉ループピッチ周期探索は、整数精度及びダウンサンプリング分数精度を使用することによって、かつ、二次チャネル信号の閉ループピッチ周期基準値を二次チャネル信号閉ループピッチ周期探索の開始点として使用することによって、実行され、最終的に、補間された正規化相関が、二次チャネル信号の推定ピッチ周期値を得るよう計算される。二次チャネル信号の推定ピッチ周期値を計算するプロセスについては、続く実施形態における例を参照されたい。
二次チャネル信号のピッチ周期探索範囲調整係数は、二次チャネル信号のピッチ周期インデックス値の上限を決定するよう、二次チャネル信号のピッチ周期インデックス値を調整するために使用され得る。二次チャネル信号のピッチ周期インデックス値の上限は、二次チャネル信号のピッチ周期インデックス値が超えることができない上限値を示す
更に、本願のいくつかの実施形態において、一次チャネル信号の推定ピッチ周期値と、現在のフレームの二次チャネル信号が分割されるサブフレームの数とに基づき、二次チャネル信号の閉ループピッチ周期基準値を決定することは:
一次チャネル信号の推定ピッチ周期値に基づき、二次チャネル信号の閉ループピッチ周期整数部loc_T0及び二次チャネル信号の閉ループピッチ周期分数部loc_frac_primを決定することと、
次の方法:
f_pitch_prim=loc_T0+loc_frac_prim/N
で二次チャネル信号の閉ループピッチ周期基準値f_pitch_primを計算することと
を含み、Nは、二次チャネル信号が分割されるサブフレームの数を表す。
具体的に、二次チャネル信号の閉ループピッチ周期整数部及び閉ループピッチ周期分数部が、最初に、一次チャネル信号の推定ピッチ周期値に基づき決定される。例えば、一次チャネル信号の推定ピッチ周期値の整数部は、二次チャネル信号の閉ループピッチ周期整数部として直接に使用され、一次チャネル信号の推定ピッチ周期値の分数部は、二次チャネル信号の閉ループピッチ周期分数部として使用される。代替的に、一次チャネル信号の推定ピッチ周期値は、補間法を使用することによって二次チャネル信号の閉ループピッチ周期整数部及び閉ループピッチ周期分数部にマッピングされ得る。例えば、上記の方法のいずれかに従って、二次チャネル信号の閉ループピッチ周期整数部loc_T0及び閉ループピッチ周期分数部loc_frac_primは取得され得る。
Nは、二次チャネル信号が分割されるサブフレームの数を表す。例えば、Nの値は、3、4、5、などであってよい。具体的な値は、適応シナリオに依存する。二次チャネル信号の閉ループピッチ周期基準値は、上記の式を使用することによって計算され得る。本願のこの実施形態では、二次チャネル信号の閉ループピッチ周期基準値の計算は、上記の式に限定されなくてもよい。例えば、loc_T0+loc_frac_prim/Nの結果が得られた後、補正係数が更にセットされてもよい。補正係数にloc_T0+loc_frac_prim/Nを乗じた結果が、最終的な出力されるf_pitch_primとして使用されてもよい。他の例として、式f_pitch_prim=loc_T0+loc_frac_prim/Nの右側にあるNは、N-1で置換されてもよく、最終的なf_pitch_primが同様に計算され得る。
本願のいくつかの実施形態において、二次チャネル信号のピッチ周期探索範囲調整係数に基づき二次チャネル信号のピッチ周期インデックス値の上限を決定することは、
次の方法:
soft_reuse_index_high_limit=0.5+2
で二次チャネル信号のピッチ周期インデックス値の上限soft_reuse_index_high_limitを計算することを含み、
Zは、二次チャネル信号のピッチ周期探索範囲調整係数であり、Zの値は、3、4、又は5である。
差動エンコーディングにおける二次チャネル信号のピッチ周期インデックス上限を計算するために、二次チャネル信号のピッチ周期探索範囲調整係数Zは最初に決定される必要がある。次いで、soft_reuse_index_high_limitが、次の式:soft_reuse_index_high_limit=0.5+2を使用することによって取得される。例えば、Zは、3、4、又は5であってよく、Zの具体的な値は、適応シナリオに応じて、ここで限定されない。
一次チャネル信号の推定ピッチ周期値、二次チャネル信号の推定ピッチ周期値、及び二次チャネル信号のピッチ周期インデックス値の上限を決定した後、エンコーダ側は、一次チャネル信号の推定ピッチ周期値、二次チャネル信号の推定ピッチ周期値、及び二次チャネル信号のピッチ周期インデックス値の上限に基づき差動エンコーディングを実行し、そして、二次チャネル信号のピッチ周期インデックスを出力する。
更に、本願のいくつかの実施形態において、一次チャネル信号の推定ピッチ周期値、二次チャネル信号の推定ピッチ周期値、及び二次チャネル信号のピッチ周期インデックス値の上限に基づき、二次チャネル信号のピッチ周期インデックス値を計算することは:
一次チャネル信号の推定ピッチ周期値に基づき、二次チャネル信号の閉ループピッチ周期整数部loc_T0及び二次チャネル信号の閉ループピッチ周期分数部loc_frac_primを決定することと、
次の方法:
soft_reuse_index=(N×pitch_soft_reuse+pitch_frac_soft_reuse)-(N×loc_T0+loc_frac_prim)+soft_reuse_index_high_limit/M
で二次チャネル信号のピッチ周期インデックス値soft_reuse_indexを計算することと
を含み、
pitch_soft_reuseは、二次チャネル信号の推定ピッチ周期値の整数部を表し、pitch_frac_soft_reuseは、二次チャネル信号の推定ピッチ周期値の分数部を表し、soft_reuse_index_high_limitは、二次チャネル信号のピッチ周期インデックス値の上限を表し、Nは、二次チャネル信号が分割されるサブフレームの数を表し、Mは、二次チャネル信号のピッチ周期インデックス値の上限の調整係数を表し、Mは、非ゼロの実数であり、×は、乗算演算子を表し、+は、加算演算子を表し、-は、減算演算子を表す。
具体的に、二次チャネル信号の閉ループピッチ周期整数部loc_T0及び二次チャネル信号の閉ループピッチ周期分数部loc_frac_primが最初に、一次チャネル信号の推定ピッチ周期値に基づき決定される。詳細については、上記の計算プロセスを参照されたい。Nは、二次チャネル信号が分割されるサブフレームの数を表し、例えば、Nの値は、3、4、又は5であってよい。Mは、二次チャネル信号のピッチ周期インデックスの上限の調整係数を表し、Mは、非ゼロの実数であり、例えば、Mの値は2又は3であってよい。N及びMの値は、適応シナリオに依存し、ここで限定されない。
本願のこの実施形態では、二次チャネル信号のピッチ周期インデックスの計算は、上記の式に限定されなくてもよい。例えば、(N×pitch_soft_reuse+pitch_frac_soft_reuse)-(N×loc_T0+loc_frac_prim)+soft_reuse_index_high_limit/Mの結果が計算された後、補正係数が更にセットされてもよく、補正係数に(N×pitch_soft_reuse+pitch_frac_soft_reuse)-(N×loc_T0+loc_frac_prim)+soft_reuse_index_high_limit/Mを乗じることによって得られた結果が、最終的な出力されるsoft_reuse_indexとして使用され得る。
他の例として、補正係数は更に、式:soft_reuse_index=(N×pitch_soft_reuse+pitch_frac_soft_reuse)-(N×loc_T0+loc_frac_prim)+soft_reuse_index_high_limit/Mの右側に加えられてもよい。補正係数の具体的な値は、限定されず、最終的なsoft_reuse_indexが同様に計算され得る。
本願のこの実施形態では、エンコーダ側によって生成されたステレオエンコードされたビットストリームは、コンピュータ可読記憶媒体に記憶されてもよい。
本願のこの実施形態では、差動エンコーディングは、二次チャネル信号のピッチ周期インデックス値を取得するよう、一次チャネル信号の推定ピッチ周期値を使用することによって二次チャネル信号のピッチ周期に対して実行される。二次チャネル信号のピッチ周期インデックス値は、二次チャネル信号のピッチ周期を示すために使用される。二次チャネル信号のピッチ周期インデックス値が取得された後、二次チャネル信号のピッチ周期インデックス値は更に、送信されるべきステレオエンコードされたビットストリームを生成するために使用されてもよい。ステレオエンコードされたビットストリームを生成した後、エンコーダ側は、ステレオエンコードされたビットストリームを出力し、ステレオエンコードされたビットストリームをデコーダ側へオーディオ伝送チャネルを通じて送信してもよい。
411:受け取られたステレオエンコードされたビットストリームに基づき、二次チャネル信号のピッチ周期に対して差動デコーディングを実行すべきかどうかを決定する。
本願のこの実施形態では、受け取られたステレオエンコードされたビットストリームに基づき、二次チャネル信号のピッチ周期に対して差動デコーディングを実行すべきかどうかが決定される。例えば、デコーダ側は、ステレオエンコードされたビットストリームで運ばれた指示情報に基づき、二次チャネル信号のピッチ周期に対して差動デコーディングを実行すべきかどうかを決定してもよい。他の例として、ステレオ信号の伝送環境が事前設定された後、差動デコーディングを実行すべきかどうかが事前設定されてもよい。この場合に、デコーダ側は、事前設定の結果に基づき、二次チャネル信号のピッチ周期に対して差動デコーディングを実行すべきかどうかを更に決定してもよい。
本願のいくつかの実施形態において、受け取られたステレオエンコードされたビットストリームに基づき、二次チャネル信号のピッチ周期に対して差動デコーディングを実行すべきかどうかを決定するステップ411は:
現在のフレームから二次チャネルピッチ周期差動エンコーディングフラグを取得することと、
二次チャネルピッチ周期差動エンコーディングフラグが前もってセットされた第1値である場合に、二次チャネル信号のピッチ周期に対して差動デコーディングを実行すると決定することと
を含む。
本願のこの実施形態では、二次チャネルピッチ周期差動エンコーディングフラグは、複数の値を有し得る。例えば、二次チャネルピッチ周期差動エンコーディングフラグは、前もってセットされた第1値又は第2値であってよい。例えば、二次チャネルピッチ周期差動エンコーディングフラグの値は0又は1であってよく、第1値が1であり、第2値が0である。例えば、二次チャネルピッチ周期差動エンコーディングフラグの値が1である場合に、ステップ412はトリガされる。
例えば、二次チャネルピッチ周期差動エンコーディングフラグは、Pitch_reuse_flagである。例えば、二次チャネルデコーディング中に、二次チャネルピッチ周期差動エンコーディングフラグPitch_reuse_flagは取得される。差動デコーディングが二次チャネル信号のピッチ周期に対して実行され得る場合に、Pitch_reuse_flagは1であり、本願のこの実施形態での差動デコーディング方法が実行される。差動デコーディングが二次チャネル信号のピッチ周期に対して実行され得ない場合に、Pitch_reuse_flagは0であり、独立デコーディング方法が実行される。例えば、本願のこの実施形態では、ステップ412及びステップ413での差動デコーディングプロセスは、Pitch_reuse_flagが1である場合にのみ実行される。
本願のいくつかの実施形態において、本願のこの実施形態で提供される方法は:
二次チャネル信号のピッチ周期に対して差動デコーディングを実行することをスキップし、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用することをスキップすると決定する場合に、ステレオエンコードされたビットストリームから二次チャネル信号のピッチ周期をデコードすることを更に含む。
デコーダ側が、二次チャネル信号のピッチ周期に対して差動デコーディングを実行しないと、かつ、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用しないと決定する場合に、二次チャネル信号のためのピッチ周期独立デコーディング方法が、二次チャネル信号のピッチ周期をデコードするために、本願のこの実施形態では使用されてもよく、それにより、二次チャネル信号のピッチ周期はデコードされ得る。
本願のいくつかの実施形態において、本願のこの実施形態で提供される方法は:
二次チャネル信号のピッチ周期に対して差動デコーディングを実行することをスキップし、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用すると決定する場合に、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として使用することを更に含む。
デコーダ側が二次チャネル信号のピッチ周期に対して差動デコーディングを実行しないと決定する場合に、ピッチ周期再利用方法が本願のこの実施形態では使用されてもよい。例えば、二次チャネル信号のピッチ周期が一次チャネル信号の推定ピッチ周期値を再利用することを二次チャネル信号ピッチ周期再利用フラグが示す場合に、デコーダ側は、二次チャネル信号ピッチ周期再利用フラグに基づき、一次チャネル信号のピッチ周期を二次チャネル信号のピッチ周期として使用することによってデコーディングを実行し得る。
本願のいくつかの実施形態において、二次チャネルピッチ周期差動エンコーディングフラグの値に基づき、デコーダ側によって実行されるステレオデコーディング方法は、次のステップを更に含んでもよい:
二次チャネルピッチ周期差動エンコーディングフラグが前もってセットされた第2値であり、ステレオエンコードされたビットストリームで運ばれた二次チャネル信号ピッチ周期再利用フラグが前もってセットされた第3値である場合に、二次チャネル信号のピッチ周期に対して差動デコーディングを実行しないと、かつ、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用しないと決定し、二次チャネル信号のピッチ周期をステレオエンコードされたビットストリームからデコードする。
本願のいくつかの他の実施形態においては、二次チャネルピッチ周期差動エンコーディングフラグの値に基づき、デコーダ側によって実行されるステレオデコーディング方法は、次のステップを更に含んでもよい:
二次チャネルピッチ周期差動エンコーディングフラグが前もってセットされた第2値であり、ステレオエンコードされたビットストリームで運ばれた二次チャネル信号ピッチ周期再利用フラグが前もってセットされた第4値である場合に、二次チャネル信号のピッチ周期に対して差動デコーディングを実行しないと決定し、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用する。
二次チャネルピッチ周期差動エンコーディングフラグが第2値である場合に、ステップ412及びステップ413で差動デコーディングプロセスを実行しないと決定され、ステレオエンコードされたビットストリームで運ばれた二次チャネル信号ピッチ周期再利用フラグが更にパースされる。二次チャネル信号ピッチ周期再利用フラグは、二次チャネル信号のピッチ周期が一次チャネル信号の推定ピッチ周期値を再利用するかどうかを示すために使用される。二次チャネル信号ピッチ周期再利用フラグの値が第4値である場合に、それは、二次チャネル信号のピッチ周期が一次チャネル信号の推定ピッチ周期値を再利用することを示し、そして、デコーダ側は、二次チャネル信号ピッチ周期再利用フラグに基づき、一次チャネル信号のピッチ周期を二次チャネル信号のピッチ周期として使用することによってデコーディングを実行し得る。二次チャネル信号ピッチ周期再利用フラグの値が第3値である場合に、それは、二次チャネル信号のピッチ周期が一次チャネル信号の推定ピッチ周期値を再利用しないことを示し、そして、デコーダ側は、ステレオエンコードされたビットストリームから二次チャネル信号のピッチ周期をデコードする。二次チャネル信号のピッチ周期及び一次チャネル信号のピッチ周期は別々にデコードされてもよく、つまり、二次チャネル信号のピッチ周期は独立してデコードされる。デコーダ側は、ステレオエンコードされたビットストリームで運ばれた二次チャネルピッチ周期差動エンコーディングフラグに基づき、差動デコーディング方法又は独立デコーディング方法を実行することを決定し得る。
本願のこの実施形態では、二次チャネル信号のピッチ周期に対して差動デコーディングを実行しないと決定される場合に、二次チャネル信号のピッチ周期独立デコーディング方法が、二次チャネル信号のピッチ周期をデコードするために使用されてもよいことが留意されるべきである。更に、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行しないと決定される場合に、ピッチ周期再利用方法が代替的に使用されてもよい。デコーダ側によって実行されるステレオデコーディング方法は、現在のフレームのデコーディングレートが前もってセットされたレート閾値よりも低いステレオデコーディングシナリオに適用され得る。ステレオエンコードされたビットストリームが二次チャネル信号ピッチ周期再利用フラグを運ぶ場合に、二次チャネル信号ピッチ周期再利用フラグは、二次チャネル信号のピッチ周期が一次チャネル信号の推定ピッチ周期値を再利用するかどうかを示すために使用される。二次チャネル信号のピッチ周期が一次チャネル信号の推定ピッチ周期値を再利用することを二次チャネル信号ピッチ周期再利用フラグが示す場合に、デコーダ側は、二次チャネル信号ピッチ周期再利用フラグに基づき、一次チャネル信号のピッチ周期をデコーディングのために二次チャネル信号のピッチ周期として使用し得る。
412:二次チャネル信号のピッチ周期に対して差動デコーディングを実行すると決定される場合に、ステレオエンコードされたビットストリームから、現在のフレームの一次チャネルの推定ピッチ周期値及び現在のフレームの二次チャネルのピッチ周期インデックス値を取得する。
本願のこの実施形態では、エンコーダ側がステレオエンコードされたビットストリームを送った後、デコーダ側は最初に、ステレオエンコードされたビットストリームをオーディオ伝送チャネルを通じて受け取り、次いで、ステレオエンコードされたビットストリームに基づきチャネルデコーディングを実行する。差動デコーディングが二次チャネル信号のピッチ周期に対して実行される必要がある場合には、現在のフレームの二次チャネル信号のピッチ周期インデックス値が、ステレオエンコードされたビットストリームから取得されてもよく、現在のフレームの一次チャネル信号の推定ピッチ周期値が、ステレオエンコードされたビットストリームから取得されてもよい。
413:一次チャネル信号の推定ピッチ周期値及び二次チャネル信号のピッチ周期インデックス値に基づき二次チャネル信号のピッチ周期に対して差動デコーディングを実行して、二次チャネル信号の推定ピッチ周期値を取得し、ここで、二次チャネル信号の推定ピッチ周期値は、ステレオエンコードされたビットストリームをデコードするために使用される。
本願のこの実施形態では、ステップ411で、差動デコーディングが二次チャネル信号のピッチ周期に対して実行される必要があると決定される場合に、一次チャネル信号の推定ピッチ周期値及び二次チャネル信号のピッチ周期インデックス値が、二次チャネル信号のピッチ周期を正確にデコードしかつ全体的なステレオデコーディング品質を改善するよう、二次チャネル信号のピッチ周期に対して差動デコーディングを実行するために使用され得る。
以下は、本願のこの実施形態での具体的な差動デコーディングプロセスについて記載する。具体的に、一次チャネル信号の推定ピッチ周期値及び二次チャネル信号のピッチ周期インデックス値に基づき二次チャネル信号のピッチ周期に対して差動デコーディングを実行するステップ413は、
一次チャネル信号の推定ピッチ周期値と、現在のフレームの二次チャネル信号が分割されるサブフレームの数とに基づき、二次チャネル信号の閉ループピッチ周期基準値を決定することと、
二次チャネル信号のピッチ周期探索範囲調整係数に基づき二次チャネル信号のピッチ周期インデックス値の上限を決定することと、
二次チャネル信号の閉ループピッチ周期基準値、二次チャネル信号のピッチ周期インデックス値、及び二次チャネル信号のピッチ周期インデックス値の上限に基づき、二次チャネル信号の推定ピッチ周期値を計算することと
を含む。
例えば、二次チャネル信号の閉ループピッチ周期基準値は、一次チャネル信号の推定ピッチ周期値を使用することによって決定される。詳細については、上記の計算プロセスを参照されたい。二次チャネル信号のピッチ周期探索範囲調整係数は、二次チャネル信号のピッチ周期インデックス値の上限を決定するよう、二次チャネル信号のピッチ周期インデックス値を調整するために使用され得る。二次チャネル信号のピッチ周期インデックス値の上限は、二次チャネル信号のピッチ周期インデックス値が超えることができない上限値を示す。二次チャネル信号のピッチ周期インデックス値の上限は、二次チャネル信号のピッチ周期インデックス値を決定するために使用され得る。
二次チャネル信号の閉ループピッチ周期基準値、二次チャネル信号のピッチ周期インデックス値、及び二次チャネル信号のピッチ周期インデックス値の上限を決定した後、デコーダ側は、二次チャネル信号の閉ループピッチ周期基準値、二次チャネル信号のピッチ周期インデックス値、及び二次チャネル信号のピッチ周期インデックス値の上限に基づき差動デコーディングを実行し、二次チャネル信号の推定ピッチ周期値を出力する。
更に、本願のいくつかの実施形態において、二次チャネル信号の閉ループピッチ周期基準値、二次チャネル信号のピッチ周期インデックス値、及び二次チャネル信号のピッチ周期インデックス値の上限に基づき、二次チャネル信号の推定ピッチ周期値を計算することは、
次の方法:
T0_pitch=f_pitch_prim+(soft_reuse_index-soft_reuse_index_high_limit/M)/N
で二次チャネル信号の推定ピッチ周期値T0_pitchを計算することを含み、
f_pitch_primは、二次チャネル信号の閉ループピッチ周期基準値を表し、soft_reuse_indexは、二次チャネル信号のピッチ周期インデックス値を表し、Nは、二次チャネル信号が分割されるサブフレームの数を表し、Mは、二次チャネル信号のピッチ周期インデックス値の上限の調整係数を表し、Mは、非ゼロの実数であり、/は、除算演算子を表し、+は、加算演算子を表し、-は、減算演算子を表す。
具体的に、二次チャネル信号の閉ループピッチ周期整数部loc_T0及び二次チャネル信号の閉ループピッチ周期分数部loc_frac_primが最初に、一次チャネル信号の推定ピッチ周期値に基づき決定される。詳細については、上記の計算プロセスを参照されたい。Nは、二次チャネル信号が分割されるサブフレームの数を表し、例えば、Nの値は、3、4、又は5であってよい。Mは、二次チャネル信号のピッチ周期インデックスの上限の調整係数を表し、Mは、非ゼロの実数であり、例えば、Mの値は2又は3であってよい。N及びMの値は、適応シナリオに依存し、ここで限定されない。
本願のこの実施形態では、二次チャネル信号の推定ピッチ周期値の計算は、上記の式に限定されなくてもよい。例えば、f_pitch_prim+(soft_reuse_index-soft_reuse_index_high_limit/M)/Nの結果が計算された後、補正係数が更にセットされてもよく、補正係数にf_pitch_prim+(soft_reuse_index-soft_reuse_index_high_limit/M)/Nを乗じることによって得られた結果が、最終的な出力されるT0_pitchとして使用されてもよい。他の例として、補正係数は更に、式:T0_pitch=f_pitch_prim+(soft_reuse_index-soft_reuse_index_high_limit/M)/Nの右側に加えられてもよく、補正係数の具体的な値は限定されず、最終的なT0_pitchが同様に計算され得る。
二次チャネル信号の推定ピッチ周期値T0_pitchが計算された後、二次チャネル信号の推定ピッチ周期値の整数部T0及び推定ピッチ周期値の分数部T0_fracが更に、二次チャネル信号の推定ピッチ周期値T0_pitchに基づき計算されてもよい。例えば、T0=INT(T0_pitch)及びT0_frac=(T0_pitch―T0)×Nである。
INT(T0_pitch)は、T0_pitchを最も近い整数に切り下げることを示し、T0は、二次チャネル信号推定ピッチ周期値の整数部をデコードすることを示し、T0_fracは、二次チャネル信号推定ピッチ周期値の分数部をデコードすることを示す。
上記の実施形態の例の記載に従って、本願のこの実施形態では、一次チャネル信号の推定ピッチ周期値を使用することによって差動エンコーディングが二次チャネル信号のピッチ周期に対して実行されるので、差動エンコーディングのために二次チャネル信号のピッチ周期に割り当てられる必要があるビットリソースは少量である。二次チャネル信号のピッチ周期の差動エンコーディングを通じて、ステレオ信号の空間感覚及び音響画像安定性は改善され得る。更に、本願のこの実施形態では、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行するために使用されるビットリソースは比較的に少数である。従って、節約されたビットリソースは、他のステレオエンコーディングパラメータのために使用されてもよく、それにより、二次チャネル信号のエンコーディング効率は改善され、最終的に、全体的なステレオエンコーディング品質は改善される。更に、本願のこの実施形態では、差動デコーディングが二次チャネル信号のピッチ周期に対して実行され得る場合に、一次チャネル信号の推定ピッチ周期値及び二次チャネル信号のピッチ周期インデックス値が、二次チャネル信号の推定ピッチ周期値を取得するよう、二次チャネル信号のピッチ周期に対して差動デコーディングを実行するために使用されてもよく、ステレオエンコードされたビットストリームは、二次チャネル信号の推定ピッチ周期値を使用することによってデコードされ得る。従って、ステレオ信号の空間感覚及び音響画像安定性は改善され得る。
本願の実施形態における上記の解決法をより良く理解し実施するために、以下は、対応する適応シナリオの例を使用することによって詳細な説明を提供する。
本願のこの実施形態で提案される二次チャネル信号のピッチ周期エンコーディングソリューションに従って、二次チャネル信号のピッチ周期エンコーディングプロセスで、差動エンコーディングが二次チャネル信号のピッチ周期に対して実行され得るかどうかが決定され、差動エンコーディングが二次チャネル信号のピッチ周期に対して実行され得る場合に、二次チャネル信号のピッチ周期に向けられた差動エンコーディング方法が、二次チャネル信号のピッチ周期をエンコードするために使用される。差動エンコーディングのために使用されるビットリソースは少量であり、節約されたビットは、二次チャネル信号の正確なピッチ周期エンコーディングを達成しかつ全体的なステレオエンコーディング品質を改善するよう、他のステレオエンコーディングパラメータに割り当てられる。
本願のこの実施形態では、ステレオ信号は原ステレオ信号、又はマルチチャネル信号に含まれている信号の2つのチャネルによって形成されたステレオ信号、又はマルチチャネル信号に含まれている信号の複数のチャネルによって一緒に生成される信号の2つのチャネルによって形成されたステレオ信号であってよい。ステレオエンコーディング装置は、独立したステレオエンコーダを構成してもよく、あるいは、マルチチャネル信号に含まれている信号の複数のチャネルによって一緒に生成された信号の2つのチャネルを含むステレオ信号をエンコードするよう、マルチチャネルエンコーダにおけるコアエンコーディング部分で使用されてもよい。
本願のこの実施形態では、ステレオ信号のエンコーディングレートが24.4kbpsである例が、説明のために使用される。本願のこの実施形態は、24.4kbpsのエンコーディングレートでの実施に限定されず、より低いレートでのステレオエンコーディングに適用されてもよいことが理解され得る。
図5A及び図5Bは、本願の実施形態に従うステレオ信号エンコーディングの略フローチャートである。本願のこの実施形態は、ステレオコーディングにおけるピッチ周期エンコーディング決定方法を提供する。ステレオコーディングは、時間領域のステレオコーディングであってもよく、あるいは、周波数領域のステレオコーディングであってもよく、あるいは、時間と周波数とが組み合わされたステレオコーディングであってもよい。これは本願のこの実施形態で限定されない。例として周波数領域のステレオコーディングを使用すると、以下は、ステレオコーディングのエンコーディング/デコーディングプロセスについて記載し、後続のステップでの二次チャネル信号のコーディングにおけるピッチ周期のエンコーディングプロセスに焦点を当てる。
最初に、周波数領域のステレオコーディングのエンコーダ側が記載される。エンコーダ側の具体的な実施ステップは、次の通りである。
S01:左右チャネル時間領域信号に対して時間領域の前処理を実行する。
ステレオ信号エンコーディングは、一般に、フレーム分割により実行される。ステレオオーディオ信号のサンプリングレートが16KHzであり、信号の各フレームが20msであり、フレーム長さがNとして表される場合に、N=320であり、つまり、フレーム長さは320サンプリングポイントに等しい。現在のフレームのステレオ信号は、現在のフレームの左チャネル時間領域信号及び現在のフレームの右チャネル時間領域信号を含む。現在のフレームの左チャネル時間領域信号はx(n)と表され、現在のフレームの右チャネル時間領域信号はx(n)と表され、nはサンプリングポイント数であり、n=0,1,・・・,N-1である。現在のフレームの左右チャネル時間領域信号は、現在のフレームの左チャネル時間領域信号及び現在のフレームの右チャネル時間領域の省略である。
具体的に、現在のフレームの左右チャネル時間領域信号に対して時間領域の前処理を実行することは、現在のフレームの前処理された左右チャネル時間領域信号を取得するよう左右チャネル時間領域信号に対してハイパスフィルタリングを実行することを含んでもよい。現在のフレームの前処理された左チャネル時間領域信号はxL_HP(n)と表され、現在のフレームの前処理された右チャネル時間領域信号xR_HP(n)と表される。ここで、nはサンプリングポイント数であり、n=0,1,・・・,N-1である。現在のフレームの前処理された左右チャネル時間領域信号は、現在のフレームの前処理された左チャネル時間領域信号及び現在のフレームの前処理された右チャネル時間領域信号の省略である。ハイパスフィルタリングは、カットオフ周波数が20Hzである無限インパルス応答(infinite impulse response、IIR)フィルタによって実行されてもよく、あるいは、他のタイプのフィルタによって実行されてもよい。例えば、サンプリングレートが16KHzであって、20Hzのカットオフ周波数に対応するハイパスフィルタの伝達関数は:

20Hz(z)
=(b+b-1+b-2)/(1+a-1+a-2

であり、b=0.994461788958195、b=-1.988923577916390、b=0.994461788958195、a=1.988892905899653、a=-0.988954249933127、zはZ変換領域での変換係数である。
対応する時間領域フィルタは、次の通りである:

L_HP(n)=b×x(n)+b×x(n-1)+b×x(n-2)-a×xL_HP(n-1)-a×xL_HP(n-2)
現在のフレームの左右チャネル時間領域信号に対して時間領域の前処理を実行することは必須のステップではないことが理解され得る。時間領域の前処理ステップがない場合に、遅延推定のために使用される左右チャネル信号は、原ステレオ信号の左右チャネル信号である。ここで、原ステレオ信号の左右チャネル信号は、アナログ-デジタル変換後に得られたパルス符号変調(pulse code modulation,PCM)信号を指す。信号のサンプリングレートは、8KHz、16KHz、32KHz、44.1KHz、及び48KHzを含み得る。
更に、この実施形態で記載されているハイパスフィルタリングに加えて、前処理は、他の処理、例えば、プリエンファシス処理を更に含んでもよい。これは、本願のこの実施形態で限定されない。
S02:前処理された左右チャネル信号に基づき時間領域解析を実行する。
具体的に、時間領域解析は過渡検出などを含んでもよい。過渡検出は、現在のフレームの前処理された左右チャネル時間領域信号に対して別々にエネルギ検出を実行すること、例えば、現在のフレームで突然のエネルギ変化が起こるかどうかを検出することであってよい。例えば、現在のフレームの前処理された左チャネル時間領域信号のエネルギEcur_Lが計算され、過渡検出は、現在のフレームの前処理された左チャネル時間領域信号の過渡検出結果を取得するよう、前のフレームの前処理された左チャネル時間領域信号のエネルギEpre_Lと現在のフレームの前処理された左チャネル時間領域信号のエネルギEcur_Lとの間の差の絶対値に基づき実行される。同様に、同じ方法は、現在のフレームの前処理された右チャネル時間領域信号に対して過渡検出を実行するために使用されてもよい。時間領域解析は、過渡検出に加えて他の時間領域解析を含んでもよく、例えば、時間領域チャネル間時間差(inter-channel time difference,ITD)パラメータ、時間領域での遅延アライメント処理、及び周波数バンド拡張前処理を含んでもよい。
S03:左右チャネル周波数領域信号を得るよう、前処理された左右チャネル信号に対して時間-周波数変換を実行する。
具体的に、離散フーリエ変換が、左チャネル周波数領域信号を得るよう、前処理された左チャネル信号に対して実行されてもよく、離散フーリエ変換が、右チャネル周波数領域信号を得るよう、前処理された右チャネル信号に対して実行されてもよい。スペクトルエイリアシングの問題を解決するよう、重畳加算法が、離散フーリエ変換の2つの連続した時間の間の処理のために使用されてもよく、時々、ゼロが、離散フーリエ変換の入力信号に加えられてもよい。
離散フーリエ変換は、フレームごとに一度実行され得る。代替的に信号の各フレームはP個のサブフレームに分けられてもよく、離散フーリエ変換は、サブフレームごとに一度実行される。離散フーリエ変換がフレームごとに一度実行される場合に、変換された左チャネル周波数領域信号はL(k)と表され、k=0,1,・・・,L/2-1であり、Lはサンプリングポイントを表し、変換された右チャネル周波数領域信号はR(k)と表され得、k=0,1,・・・,L/2-1であり、kは周波数ビンインデックス値である。離散フーリエ変換がサブフレームごとに一度実行される場合に、i番目のサブフレームの変換された左チャネル周波数領域信号はL(k)と表され得、k=0,1,・・・,L/2-1であり、i番目のサブフレームの変換された右チャネル周波数領域信号はR(k)と表され得、k=0,1,・・・,L/2-1であり、kは周波数ビンインデックス値であり、iはサブフレームインデックス値であり、i=0,1,・・・,P-1である。例えば、この実施形態では、ワイドバンドが例として使用される。ワイドバンドは、エンコーディングバンド幅が8KHz以上であってよいことを意味し、左チャネル信号の各フレーム又は右チャネル信号の各フレームは20msであり、フレーム長さはNと表される。この場合に、N=320であり、つまり、フレーム長さは320サンプリングポイントである。信号の各フレームは2つのサブフレームに分けられ、つまり、P=2である。信号の各サブフレームは10msであり、サブフレーム長さは160サンプリングポイントである。離散フーリエ変換は、サブフレームごとに一度実行される。離散フーリエ変換の長さはLと表され、L=400
であり、つまり、離散フーリエ変換の長さは400サンプリングポイントである。この場合に、i番目のサブフレームの変換された左チャネル周波数領域信号は、L(k)と表され得、k=0,1,・・・,L/2-1であり、i番目のサブフレームの変換された右チャネル周波数領域信号はR(k)と表され得、k=0,1,・・・,L/2-1であり、kは周波数ビンインデックス値であり、iはサブフレームインデックス値であり、i=0,1,・・・,P-1である。
S04:ITDパラメータを決定し、ITDパラメータをエンコードする。
ITDパラメータを決定するための複数の方法がある。ITDパラメータは、周波数領域でのみ決定されても、時間領域でのみ決定されても、あるいは、時間-周波数領域で決定されてもよい。これは本願で限定されない。
例えば、ITDパラメータは、左右のチャネル間の相互相関係数を使用することによって時間領域で取り出されてもよい。例えば、0≦i<Tmaxについては、
Figure 0007337966000001
及び
Figure 0007337966000002
が計算される。
Figure 0007337966000003
である場合に、ITDパラメータ値は、max(Cn(i))に対応するインデックス値の逆数であり、ここで、max(Cn(i))値に対応するインデックステーブルは、デフォルトでコーデックで指定され、さもなければ、ITDパラメータ値は、max(Cp(i))に対応するインデックス値である。
ここで、iは、相互相関係数を計算するためのインデックス値であり、jは、サンプリングポイントのインデックス値であり、Tmaxは、異なるサンプリングレートでのITD値の最大値に対応し、Nは、フレーム長さである。ITDパラメータは、代替的に、左右チャネル周波数領域信号に基づき周波数領域で決定されてもよい。例えば、離散フーリエ変換(discrete Fourier transformation,DFT)、高速フーリエ変換(Fast Fourier Transformation,FFT)、及び修正離散コサイン変換(Modified Discrete Cosine Transform,MDCT)などの時間-周波数変換技術が、時間領域信号を周波数領域信号に変換するために使用されてもよい。この実施形態では、i番目のサブフレームのDFT変換された左チャネル周波数領域信号はL(k)であり、k=0,1,・・・,L/2-1であり、i番目のサブフレームの変換された右チャネル周波数領域信号はR(k)であり、k=0,1,・・・,L/2-1であり、i=0,1,・・・,P-1である。i番目のサブフレームの周波数領域相関係数XCORR(k)=L(k)×R (k)が計算される。R (i)は、i番目のサブフレームの時間-周波数変換された右チャネル周波数領域信号の共役である。周波数領域相互相関係数は、時間領域xcorr(n)に変換され、n=0,1,・・・,L-1であり、xcorr(n)の最大値は、i番目のサブフレームのIDTパラメータ値
Figure 0007337966000004
を得るよう、L/2-Tmax≦n≦L/2+Tmaxの範囲で探索される。
他の例として、最大値:
Figure 0007337966000005
は、i番目のサブフレームのDFT変換された左チャネル周波数領域信号及びi番目のサブフレームのDFT変換された右チャネル周波数領域信号に基づき、-Tmax≦j≦Tmaxの探索範囲内で計算されてもよく、ITDパラメータ値は、
Figure 0007337966000006
つまり、最大の大きさ値に対応するインデックス値である。
ITDパラメータが決定された後、残差エンコーディング及びエントロピエンコーディングが、エンコーダでITDパラメータに対して実行される必要があり、次いで、ITDパラメータは、ステレオエンコードされたビットストリームに書き込まれる。
S05:ITDパラメータに基づき左右チャネル周波数領域信号に対して時間シフト調整を実行する。
本願のこの実施形態では、時間シフト調整は、複数の方法で左右チャネル周波数領域信号に対して実行され、それらの方法は、例を用いて以下で記載される。
この実施形態では、信号の各フレームがP個のサブフレームに分けられ、P=2である例が、使用される。時間シフト調整後のi番目のサブフレームの左チャネル周波数領域信号は、L’(k)と表され、k=0,1,・・・,L/2-1である。時間シフト調整後のi番目のサブフレームの右チャネル周波数領域信号は、R’(k)と表され、k=0,1,・・・,L/2-1であり、kは周波数ビンインデックス値であり、i=0,1,・・・,P-1である。
Figure 0007337966000007
ここで、τは、i番目のサブフレームのITDパラメータ値であり、Lは、離散フーリエ変換の長さであり、L(k)は、i番目のサブフレームの時間-周波数変換された左チャネル周波数領域信号であり、R(k)は、i番目のサブフレームの変換された右チャネル周波数領域信号であり、iはサブフレームインデックス値であり、i=0,1,・・・,P-1である。
DFTがフレーム分割により実行されない場合には、時間シフト調整は、フレーム全体について一度実行され得る。フレーム分割後、時間シフト調整は各サブフレームに基づき実行される。フレーム分割が実行されない場合には、時間シフト調整は各フレームに基づき実行される。
S06:他の周波数領域ステレオパラメータを計算し、エンコーディングを実行する。
他の周波数領域ステレオパラメータは:チャネル間位相差(inter-channel phase difference,IPD)パラメータ、チャネル間レベル差(チャネル間振幅差とも呼ばれる)(inter-channel level difference,ILD)パラメータ、サブバンドサイドゲイン、などを含んでもよいが、これらに限られない。これは本願のこの実施形態で限定されない。他の周波数領域ステレオパラメータが計算により取得された後、残差エンコーディング及びエントロピエンコーディングが他の周波数領域ステレオパラメータに対して実行される必要があり、次いで、他の周波数領域ステレオパラメータは、ステレオエンコードされたビットストリームに書き込まれる。
S07:一次チャネル信号及び二次チャネル信号を計算する。
一次チャネル信号及び二次チャネル信号が計算される。具体的に、本願の実施形態における如何なる時間領域ダウンミックス処理又は周波数領域ダウンミックス処理も使用されてよい。例えば、現在のフレームの一次チャネル信号及び二次チャネル信号は、現在のフレームの左チャネル周波数領域信号及び現在のフレームの右チャネル周波数領域信号に基づき計算され得る。現在のフレームの前もってセットされた低周波バンドに対応する各サブバンドの一次チャネル信号及び二次チャネル信号は、現在のフレームの前もってセットされた低周波バンドに対応する各サブバンドの左チャネル周波数領域信号及び現在のフレームの前もってセットされた低周波バンドに対応する各サブバンドの右チャネル周波数領域信号に基づき計算され得る。代替的に、現在のフレームの各サブフレームの一次チャネル信号及び二次チャネル信号は、現在のフレームの各サブフレームの左チャネル周波数領域信号及び現在のフレームの各サブフレームの右チャネル周波数領域信号に基づき計算され得る。代替的に、現在のフレームの各サブフレーム内の前もってセットされた低周波バンドに対応する各サブバンドの一次チャネル信号及び二次チャネル信号は、現在のフレームの各サブフレーム内の前もってセットされた低周波バンドに対応する各サブバンドの左チャネル周波数領域信号及び現在のフレームの各サブフレーム内の前もってセットされた低周波バンドに対応する各サブバンドの右チャネル周波数領域信号に基づき計算され得る。一次チャネル信号は、現在のフレームの左チャネル時間領域信号と現在のフレームの右チャネル時間領域信号とを加算することによって取得されてもよく、二次チャネル信号は、左チャネル時間領域信号と右チャネル時間領域信号との間の差を計算することによって取得されてもよい。
この実施形態では、フレーム分割処理が信号の各フレームに対して実行されるので、各サブフレームの一次チャネル信号及び二次チャネル信号が、離散フーリエ変換の逆変換を通じて時間領域に変換され、重畳加算処理が、現在のフレームの時間領域の一次チャネル信号及び二次チャネル信号を得るよう、実行される。
ステップS07で一次チャネル信号及び二次チャネル信号を取得するプロセスは、ダウンミックス処理と呼ばれ、ステップS08から始まって、一次チャネル信号及び二次チャネル信号は処理されることが留意されるべきである。
S08:ダウンミックスされた一次チャネル信号及び二次チャネル信号をエンコードする。
具体的に、ビット割り当てが最初に、前のフレームの一次チャネル信号及び二次チャネル信号のエンコーディングで得られたパラメータ情報と、一次チャネル信号及び二次チャネル信号をエンコードするためのビットの総数とに基づき、一次チャネル信号のエンコーディング及び二次チャネル信号のエンコーディングに関して実行され得る。次いで、一次チャネル信号及び二次チャネル信号は、ビット割り当ての結果に基づき別々にエンコードされる。一次チャネル信号のエンコーディング及び二次チャネル信号のエンコーディングは、如何なるモノオーディオエンコーディング技術も使用することによって実施されてもよい。例えば、ACELPエンコーディング方法が、ダウンミックス処理を通じて取得される一次チャネル信号及び二次チャネル信号をエンコードするために使用される。ACELPエンコーディング方法は、一般的に:線形予測係数(linear prediction coefficient,LPC)を決定し、線形予測係数を量子化及びエンコーディングのために線スペクトル周波数(line spectral frequency,LSF)に変換することと、適応符号励振を探してピッチ周期及び適応コードブックゲインを決定し、ピッチ周期及び適応コードブックゲインに対して別々に量子化及びエンコーディングを実行することと、代数符号励振を探してパルスインデックス及び代数符号励振のゲインを決定し、パルスインデックス及び代数符号励振のゲインに対して別々に量子化及びエンコーディングを実行することとを含む。
図6は、本願の実施形態に従って、一次チャネル信号のピッチ周期パラメータ及び二次チャネル信号のピッチ周期パラメータをエンコードするフローチャートである。図6に示されるプロセスは、次のステップS09からS12を含む。一次チャネル信号のピッチ周期パラメータ及び二次チャネル信号のピッチ周期パラメータをエンコードするプロセスは、次の通りである。
S09:一次チャネル信号のピッチ周期を決定し、エンコーディングを実行する。
具体的に、一次チャネル信号のエンコーディング中、ピッチ周期推定は、ピッチ周期推定の精度を改善するために、開ループピッチ解析及び閉ループピッチ探索の組み合わせを通じて実行される。発話のピッチ周期は、複数の方法を使用すること、例えば、自己相関関数を使用すること、又は短期平均振幅差を使用することによって、推定され得る。ピッチ周期推定アルゴリズムは自己相関関数に基づく。自己相関関数は、ピッチ周期の整数倍でピークを有し、この特徴は、ピッチ周期を推定するために使用可能である。ピッチ予測の精度を改善し、発話の実際のピッチ周期をより良く近似するために、1/3のサンプリング分解能を有する分数遅延が、ピッチ周期検出のために使用される。ピッチ周期推定の計算量を減らすために、ピッチ周期推定は、2つのステップ、つまり、開ループピッチ解析及び閉ループピッチ探索を含む。開ループピッチ解析は、候補整数遅延を取得するよう発話のフレームの整数遅延を大まかに推定するために使用される。閉ループピッチ探索は、整数遅延の近くでピッチ遅延を細かく推定するために使用され、閉ループピッチ探索は、サブフレームごとに一度実行される。開ループピッチ解析は、自己相関、正規化、及び最適な開ループ整数遅延を計算するよう、フレームごとに一度実行される。
上記のステップを通じて取得される一次チャネル信号の推定ピッチ周期値は、一次チャネル信号のピッチ周期エンコーディングパラメータとして使用され、更には、二次チャネル信号のピッチ周期基準値として使用される。
S10:二次チャネルエンコーディングでピッチ周期差動エンコーディングを使用すべきかどうかを決定する。
二次チャネルエンコーディングでは、二次チャネル信号のピッチ周期差動エンコーディング決定は、一次チャネル信号の推定ピッチ周期値と、二次チャネル信号の推定開ループピッチ周期値とに基づき実行される。例えば、使用され得る決定条件は:

DIFF=|Σ(pitch[0])-Σ(pitch[1])|

であり、DIFFは、一次チャネル信号の推定ピッチ周期値と二次チャネル信号の推定開ループピッチ周期値との間の差を表す。|Σ(pitch[0])-Σ(pitch[1])|は、Σ(pitch[0])とΣ(pitch[1])との間の差の絶対値を表す。Σpitch[0]は、一次チャネル信号の推定ピッチ周期値を表し、Σpitch[1]は、二次チャネル信号の推定開ループピッチ周期値を表す。
二次チャネルピッチ周期差動エンコーディングフラグは、Pitch_reuse_flagによって示される。DIFF_THRは、前もってセットされた二次チャネルピッチ周期差動エンコーディング閾値である。異なるエンコーディングレートに基づき、二次チャネルピッチ周期差動エンコーディング閾値は{1,3,6}内の特定の値であることが決定される。例えば、DIFF>DIFF_THRであるとき、Pitch_reuse_flag=1であり、二次チャネル信号のピッチ周期差動エンコーディングが現在のフレームで使用されることが決定される。DIFF≦DIFF_THRであるとき、Pitch_reuse_flag=0である。この場合に、ピッチ周期差動エンコーディングは実行されず、二次チャネル信号の独立エンコーディングが使用される。
S11:ピッチ周期差動エンコーディングが実行されない場合に、二次チャネル信号のためにピッチ周期独立エンコーディング方法を使用することによって二次チャネル信号のピッチ周期をエンコードする。
二次チャネル信号のピッチ周期差動エンコーディングが使用されない場合に、二次チャネル信号のピッチ周期再利用法が使用されてもよく、つまり、二次チャネル信号のピッチ周期はエンコーダ側でエンコードされず、デコーダ側は、一次チャネル信号のピッチ周期をデコーディングのために二次チャネル信号のピッチ周期として使用する。これは限定されない。
S12:二次チャネル信号のピッチ周期に対して差動エンコーディングを実行する。
二次チャネル信号のピッチ周期に対して差動エンコーディングを実行する具体的なステップは、次を含む:
S121:一次チャネル信号の推定ピッチ周期値に基づき二次チャネル信号閉ループピッチ周期探索を実行して、二次チャネル信号の推定ピッチ周期値を取得する。
S12101:一次チャネル信号の推定ピッチ周期値に基づき二次チャネル信号の閉ループピッチ周期基準値を決定する。
この実施形態では、24.4kbpsのエンコーディングレートが例として使用される。ピッチ周期エンコーディングはサブフレームに基づき実行され、一次チャネル信号は5つのサブフレームに分割され、二次チャネル信号4つのサブフレームに分割される。二次チャネル信号のピッチ周期基準値は、一次チャネル信号のピッチ周期に基づき決定される。1つの方法は、一次チャネル信号のピッチ周期を二次チャネル信号のピッチ周期基準値として直接に使用することである。つまり、4つの値が、一次チャネル信号の5つのサブフレームのピッチ周期から、二次チャネル信号の4つのサブフレームのピッチ周期基準値として選択される。他の方法では、一次チャネル信号の5つのサブフレームのピッチ周期は、補間法を使用することによって、二次チャネル信号の4つのサブフレームのピッチ周期基準値にマッピングされる。上記の方法のいずれかに従って、二次チャネル信号の閉ループピッチ周期基準値は取得可能であり、ここで、整数部はloc_T0であり、分数部はloc_frac_primである。
S12102:二次チャネル信号のピッチ周期基準値に基づき二次チャネル信号閉ループピッチ周期探索を実行して、二次チャネル信号のピッチ周期を決定する。具体的に、閉ループピッチ周期探索は、整数精度及びダウンサンプリング分数精度を使用することによって、かつ、二次チャネル信号の閉ループピッチ周期基準値を二次チャネル信号閉ループピッチ周期探索の開始点として使用することによって、実行され、そして、補間された正規化相関が、二次チャネル信号の推定ピッチ周期値を得るよう計算される。
例えば、1つの方法は、二次チャネル信号のピッチ周期のエンコーディングのために2ビット(bits)を使用することである。これは、具体的には次の通りである。
整数精度探索は、loc_T0を探索開始点として使用することによって、[loc_T0-1,loc_T0+1]の範囲内の二次チャネル信号のピッチ周期に関して実行され、次いで、分数精度探索は、loc_frac_primを各探索点の初期値として使用することによって、[loc_frac_prim+2,loc_frac_prim+3]、[loc_frac_prim,loc_frac_prim-3]、又は[loc_frac_prim-2,loc_frac_prim+1]の範囲内の二次チャネル信号のピッチ周期に関して実行される。各探索点に対応する補間された正規化相関が計算され、1フレーム内の複数の探索点の類似度が計算される。補間された正規化相関の最大値が取得される場合に、その補間された正規化相関に対応する探索点が二次チャネル信号の最適な推定ピッチ周期値であり、このとき、整数部はpitch_soft_reuseであり、分数部はpitch_frac_soft_reuseである。
他の例として、他の方法は、二次チャネル信号のピッチ周期をエンコードするために2ビット乃至5ビットを使用することである。これは、具体的には次の通りである。
3ビット乃至5ビットが二次チャネル信号のピッチ周期をエンコードするために使用される場合に、探索範囲half_rangeは夫々1、2及び4である。整数精度探索は、loc_T0を探索開始点として使用されることによって、[loc_T0-half_range,loc_T0+half_range]の範囲内の二次チャネル信号のピッチ周期について実行され、次いで、各探索点に対応する補間された正規化相関は、loc_frac_primを各探索点の初期値として使用することによって、[loc_frac_prim,loc_frac_prim-1]、又は[loc_frac_prim,loc_frac_prim+3]の範囲内で計算される。補間された正規化相関の最大値が取得される場合に、その補間された正規化相関に対応する探索点が、二次チャネル信号の最適な推定ピッチ周期値であり、整数部はpitch_soft_reuseであり、分数部はpitch_frac_soft_reuseである。
S122:一次チャネル信号のピッチ周期及び二次チャネル信号のピッチ周期を使用することによって差動エンコーディングを実行する。具体的に、次のプロセスが含まれ得る。
S1221:差動エンコーディングにおける二次チャネル信号のピッチ周期インデックスの上限を計算する。
二次チャネル信号のピッチ周期インデックスの上限は、次の式:

soft_reuse_index_high_limit=2

を使用することによって計算され、ここで、Zは、二次チャネル信号のピッチ周期探索範囲調整係数である。この実施形態では、Z=3、4、又は5である。
S1222:差動エンコーディングにおける二次チャネル信号のピッチ周期インデックス値を計算する。
二次チャネル信号のピッチ周期インデックスは、上記のステップで得られた二次チャネル信号のピッチ周期基準値と二次チャネル信号の最適な推定ピッチ周期値との間の差に対して差動エンコーディングを実行した結果を表す。
二次チャネル信号のピッチ周期インデックス値soft_reuse_indexは、次の式:

soft_reuse_index=(4×pitch_soft_reuse+pitch_frac_soft_reuse)-(4×loc_T0+loc_frac_prim)+soft_reuse_index_high_limit/2

を使用することによって計算される。
S1223:二次チャネル信号のピッチ周期インデックスに対して差動エンコーディングを実行する。
例えば、残差エンコーディングが、二次チャネル信号のピッチ周期インデックスsoft_reuse_indexに対して実行される。
本願のこの実施形態では、二次チャネル信号のピッチ周期エンコーディング方法が使用される。夫々のコード化されたフレームは、4つのサブフレーム(subframe)に分割され、差動エンコーディングは、各サブフレームのピッチ周期に対して実行される。方法は、二次チャネル信号のピッチ周期独立エンコーディングと比較して22ビット又は18ビットを節約することができ、節約されたビットは、量子化及びエンコーディングのための他のエンコーディングパラメータに割り当てられ得る。例えば、節約されたビットオーバヘッドは、固定コードブック(fixed codebook)に割り当てられてもよい。
一次チャネル信号及び二次チャネル信号の他のパラメータのエンコーディングは、一次チャネル信号及び二次チャネル信号のエンコードされたビットストリームを取得するよう、本願のこの実施形態を使用することによって完了され、エンコードされたデータは、特定のビットストリームフォーマット要件に基づき、ステレオエンコードされたビットストリームに書き込まれる。
以下は、例を使用することによって、本願のこの実施形態で二次チャネル信号のエンコーディングオーバヘッドを低減する効果について記載する。二次チャネル信号のピッチ周期独立エンコーディングスキームについては、4つのサブフレームに割り当てられたピッチ周期エンコーディングビットの数は、夫々、10、6、9、及び6である。つまり、31ビットが、各フレームをエンコードするために必要とされる。しかし、本願のこの実施形態で提供される、二次チャネル信号のピッチ周期に向けられた差動エンコーディング方法に従って、3ビットしか、各サブフレームでの差動エンコーディングのために必要とされず、1ビットが更に、差動エンコーディングが二次チャネル信号のピッチ周期に対して実行されるかどうかを示すために必要とされる(その1ビットの値は0又は1であってよく、例えば、値が1である場合には、差動エンコーディングは実行される必要があり、あるいは、値が0である場合には、差動エンコーディングは実行されない)。従って、本願のこの実施形態における方法に従って、31-4×3=13ビットしか、各フレームについて、二次チャネル信号のピッチ周期をエンコードするために必要とされない。つまり、18ビットが節約されて、固定コードブックパラメータなどの他のエンコーディングパラメータに割り当てられ得る。
図8は、独立エンコーディングスキームが使用された後に固定コードブックに割り当てられたビットの数と、差動エンコーディングスキームが使用された後に固定コードブックに割り当てられたビットの数との間の比較の図である。実線は、独立エンコーディングの後に固定コードブックに割り当てられたビットの数を示し、破線は、差動エンコーディングの後に固定コードブックに割り当てられたビットの数を示す。図8からは、二次チャネル信号のピッチ周期に向けられた差動エンコーディングを使用することによって節約された多数のビットリソースが、固定コードブックの量子化及びエンコーディングのために割り当てられて、それにより、二次チャネル信号のエンコーディング品質が改善されることが分かる。
以下は、例を使用することによって、デコーダ側によって実行されるステレオデコーディングアルゴリズムについて記載しており、次のプロシージャが主に実行される。
S13:ビットストリームからPitch_reuse_flagを読み出す。
S14:次の条件:二次チャネル信号のエンコーディングレートが比較的に低くかつPitch_reuse_flag=1である、が満足される場合に、二次チャネル信号のピッチ周期差動デコーディングを実行し、そうでない場合には、二次チャネル信号のピッチ周期独立デコーディングを実行する。
次の条件:二次チャネル信号のエンコーディングレートが比較的に低くかつPitch_reuse_flag=1である、が満足されない場合に、二次チャネル信号ピッチ周期再利用フラグは、二次チャネル信号のピッチ周期が一次チャネル信号の推定ピッチ周期値を再利用することを示すために使用されてもよい。これは限定されない。この場合に、デコーダ側は、二次チャネル信号ピッチ周期再利用フラグに基づき、一次チャネル信号のピッチ周期をデコーディングのために二次チャネル信号のピッチ周期として使用し得る。
例えば、二次チャネル信号ピッチ周期再利用フラグは、Pitch_reuse_flagによって示される。DIFF_THRは、前もってセットされた二次チャネルピッチ周期差動エンコーディング閾値である。異なるエンコーディングレートに基づき、二次チャネルピッチ周期差動エンコーディング閾値は{1,3,6}内の特定の値であることが決定される。例えば、DIFF>DIFF_THRであるとき、Pitch_reuse_flag=1であり、二次チャネル信号のピッチ周期差動エンコーディングが現在のフレームで使用されることが決定される。DIFF≦DIFF_THRであるとき、Pitch_reuse_flag=0である。この場合に、ピッチ周期差動エンコーディングは実行されず、二次チャネル信号の独立エンコーディングが使用される。
S1401:ピッチ周期マッピングを実行する。
この実施形態では、ピッチ周期エンコーディングはサブフレームに基づき実行されており、一次チャネル信号は5つのサブフレームに分割され、二次チャネル信号は4つのサブフレームに分割される。二次チャネル信号のピッチ周期基準値は、一次チャネル信号の推定ピッチ周期値に基づき決定される。1つの方法は、一次チャネル信号のピッチ周期を二次チャネル信号のピッチ周期基準値として直接に使用することである。つまり、4つの値が、一次チャネル信号の5つのサブフレームのピッチ周期から、二次チャネル信号の4つのサブフレームのピッチ周期基準値として選択される。他の方法では、一次チャネル信号の5つのサブフレームのピッチ周期は、補間法を使用することによって、二次チャネル信号の4つのサブフレームのピッチ周期基準値にマッピングされる。上記の方法のいずれかに従って、二次チャネル信号の閉ループピッチ周期の整数部loc_T0及び分数部loc_frac_primは取得され得る。
S1402:二次チャネル信号の閉ループピッチ周期基準値を計算する。
二次チャネル信号の閉ループピッチ周期基準値f_pitch_primは、次の式:

f_pitch_prim=loc_T0+loc_frac_prim/4.0

を使用することによって計算される。
S1403:差動エンコーディングでの二次チャネル信号のピッチ周期インデックスの上限を計算する。
二次チャネル信号のピッチ周期インデックスの上限は、次の式:

soft_reuse_index_high_limit=0.5+2

を使用することによって計算され、ここで、Zは、二次チャネル信号のピッチ周期探索範囲調整係数である。この実施形態では、Zは3、4、又は5であってよい。
S1404:ビットストリームから二次チャネルのピッチ周期インデックス値soft_reuse_indexを読み出す。
S1405:二次チャネル信号の推定ピッチ周期を計算する。

T0_pitch=f_pitch_prim+(soft_reuse_index-soft_reuse_index_high_limit/2.0)/4.0

ここで、

T=INT(T0_pitch)、及び
T0_frac=(T0_pitch-T0)×4.0

である。
INT(T0_pitch)は、T0_pitchを最も近い整数に切り下げることを示し、T0は、二次チャネル信号推定ピッチ周期値の整数部をデコードすることを示し、T0_fracは、二次チャネル信号推定ピッチ周期値の分数部をデコードすることを示す。
周波数領域でのステレオエンコーディング及びデコーディングプロセスは、上記の実施形態で記載されている。本願の実施形態が時間領域のステレオエンコーディングに適用される場合には、上記の実施形態のステップS01からS07は、次のステップS21からS26で置換される。図9は、本願の実施形態に従う時間領域のステレオエンコーディング方法の概略図である。
S21:ステレオ時間領域信号に対して時間領域の前処理を実行して、前処理されたステレオ左右チャネル信号を取得する。
ステレオオーディオ信号のサンプリングレートが16KHzであり、信号の1フレームが20msであり、フレーム長さがNと表される場合に、N=320であり、つまり、フレーム長さは320サンプリングポイントに等しい。現在のフレームのステレオ信号は、現在のフレームの左チャネル時間領域信号及び現在のフレームの右チャネル時間領域信号を含む。現在のフレームの左チャネル時間領域信号はx(n)と表され、現在のフレームの右チャネル時間領域信号はx(n)と表され、nはサンプリングポイント数であり、n=0,1,・・・,N-1である。
現在のフレームの左右チャネル時間領域信号に対して時間領域の前処理を実行することは、具体的に、現在のフレームの左右チャネル時間領域信号に対してハイパスフィルタリングを実行して、現在のフレームの前処理された左右チャネル時間領域信号を取得することを含んでもよい。現在のフレームの前処理された左チャネル時間領域信号は、
[外1]
Figure 0007337966000008
と表され、現在のフレームの前処理された右チャネル時間領域信号は、
[外2]
Figure 0007337966000009
と表され、nはサンプリングポイント数であり、n=0,1,・・・,N-1である。
現在のフレームの左右チャネル時間領域信号に対して時間領域の前処理を実行することは必須のステップではないことが理解され得る。時間領域の前処理ステップがない場合に、遅延推定のために使用される左右チャネル信号は、原ステレオ信号の左右チャネル信号である。ここで、原ステレオ信号の左右チャネル信号は、A/D変換後に得られた集合PCM信号を指す。信号のサンプリングレートは、8KHz、16KHz、32KHz、44.1KHz、及び48KHzを含み得る。
更に、この実施形態で記載されているハイパスフィルタリングに加えて、前処理は、他の処理、例えば、プリエンファシス処理を更に含んでもよい。これは、本願のこの実施形態で限定されない。
S22:現在のフレームの前処理された左右チャネル時間領域信号に基づき遅延推定を実行して、現在のフレームの推定されたチャネル間遅延差を取得する。
具体的に、左右のチャネル間の相互相関関数が、現在のフレームの前処理された左右チャネル時間領域信号に基づき計算され得る。次いで、相互相関関数の最大値が、現在のフレームの推定されたチャネル間遅延差として探索される。
maxは、現在のサンプリングレートでのチャネル間遅延差の最大値に対応し、Tminは、現在のサンプリングレートでのチャネル間遅延差の最小値に対応する、と仮定される。Tmax及びTminは、前もってセットされた実数であり、Tmax>Tminである。この実施形態では、Tmaxは40に等しく、Tminは-40に等しく、左右のチャネル間の相互相関係数c(i)は、最大値に対応するインデックス値を取得するよう、Tmin≦i≦Tmaxの範囲内で探索され、インデックス値は、現在のフレームの推定されたチャネル間遅延差として使用され、cur_itdと表される。
本願のこの実施形態では多数の他の具体的な遅延推定方法が存在する。これは限定されない。例えば、左右のチャネル間の相互相関関数は、現在のフレームの前処理された左右チャネル時間領域信号に基づき、又は現在のフレームの左右チャネル時間領域信号に基づき計算されてもよい。次いで、長期平滑化が、左右のチャネル間の平滑化された相互相関関数を取得するよう、前のL個のフレーム(Lは1以上の整数である)の左右のチャネル間の相互相関関数と、現在のフレームの左右のチャネル間の計算された相互相関関数とに基づき、実行される。次いで、左右のチャネル間の平滑化された相互相関係数の最大値が、その最大値に対応するインデックス値を取得するよう、Tmin≦i≦Tmaxの範囲内で探索され、インデックス値は、現在のフレームの推定されたチャネル間遅延差として使用される。方法は、前のM個のフレーム(Mは1以上の整数である)のチャネル間遅延差と、現在のフレームの推定されたチャネル間遅延差とに対してフレーム間平滑化を実行することと、平滑化されたチャネル間遅延差を現在のフレームの最終的な推定されたチャネル間遅延差として使用することとを更に含んでもよい。本願のこの実施形態は、上記の遅延推定方法に限定されない。
現在のフレームの推定されたチャネル間遅延差については、左右のチャネル間の相互相関係数c(i)の最大値が、その最大値に対応するインデックス値を取得するよう、Tmin≦i≦Tmaxの範囲内で探索される。
S23:現在のフレームの推定されたチャネル間遅延差に基づきステレオ左右チャネル信号に対して遅延アライメントを実行して、遅延アライメントされたステレオ信号を取得する。
本願のこの実施形態では、ステレオ左右チャネル信号に対して遅延アライメントを実行する多数の方法が存在する。例えば、ステレオ左右チャネル信号の1つ又は2つのチャネルは、遅延アライメントされたステレオ信号の2つの信号にチャネル間遅延差が存在しないように、現在のフレームの推定されたチャネル間遅延差と、前のフレームのチャネル間遅延差とに基づき、圧縮又は伸長される。本願のこの実施形態は、上記の遅延アライメント方法に限定されない。
現在のフレームの遅延アライメントされた左チャネル時間領域信号は、x’(n)と表され、現在のフレームの遅延アライメントされた右チャネル時間領域信号は、x’(n)と表され、nはサンプリングポイント数であり、n=0,1,・・・,N-1である。
S24:現在のフレームの推定されたチャネル間遅延差を量子化及びエンコードする。
チャネル間遅延差を量子化する複数の方法が存在し得る。例えば、量子化処理は、量子化されたインデックスを取得するよう、現在のフレームの推定されたチャネル間遅延差に対して実行され、次いで、量子化されたインデックスはエンコードされる。量子化されたインデックスは、量子化された後のビットストリームに書き込まれる。
S25:遅延アライメントされたステレオ信号に基づきチャネル結合比率係数を計算し、チャネル結合比率係数に対して量子化及びエンコーディングを実行し、量子化及びエンコードされた結果をビットストリームに書き込む。
チャネル結合比率係数を計算する多数の方法がある。例えば、本願のこの実施形態でチャネル結合比率係数を計算する方法では、左右のチャネルのフレームエネルギが最初に、現在のフレームの遅延アライメントされた左右チャネル時間領域信号に基づき計算される。
現在のフレームの左チャネルのフレームエネルギrms_Lは:
Figure 0007337966000010
を満足し、現在のフレームの右チャネルのフレームエネルギrms_Rは:
Figure 0007337966000011
を満足し、ここで、x’(n)は、現在のフレームの遅延アライメントされた左チャネル時間領域信号であり、x’(n)は、現在のフレームの遅延アライメントされた右チャネル時間領域信号である。
次いで、現在のフレームのチャネル結合比率係数が、左右のチャネルのフレームエネルギに基づき計算される。
現在のフレームの計算されたチャネル結合比率係数は:

ratio=rms_R/(rms_L+rms_R)

を満足する。
最終的に、現在のフレームの計算されたチャネル結合比率係数は、比率係数に対応する量子化されたインデックスratio_idxと、現在のフレームの量子化されたチャネル結合比率係数ratioquaとを取得するよう、量子化される:

ratioqua=ratio_tabl[ratio_idx]

ここで、ratio_tablはスカラー量子化コードブックである。量子化及びエンコーディングは、本願の実施形態では任意のスカラー量子化方法、例えば、一様スカラー量子化又は非一様スカラー量子化を使用することによって、実行されてもよい。エンコーディングのために使用されるビット数は5ビットであり得る。具体的な方法はここでは記載されない。
本願のこの実施形態は、上記のチャネル結合比率係数の計算、量子化、及びエンコーディング方法に限定されない。
S26:チャネル結合比率係数に基づき、遅延アライメントされたステレオ信号に対して時間領域ダウンミックス処理を実行して、一次チャネル信号及び二次チャネル信号を取得する。
具体的に、本願の実施形態における如何なる時間領域ダウンミックス処理方法も使用されてもよい。ただし、対応する時間領域ダウンミックス処理方法は、遅延アライメントされたステレオ信号に対して時間領域ダウンミックス処理を実行して一次チャネル信号及び二次チャネル信号を取得するよう、チャネル結合比率係数を計算する方法に基づき選択される必要があることが留意されるべきである。
例えば、ステップ25でチャネル結合比率係数を計算する上記の方法が使用され、対応する時間領域ダウンミックス処理は、チャネル結合比率係数ratioに基づき時間領域ダウンミックス処理を実行することであってもよい。第1チャネル結合解に対応する時間領域ダウンミックス処理の後に取得される一次チャネル信号Y(n)及び二次チャネル信号X(n)は:
Figure 0007337966000012
を満足する。
本願のこの実施形態は、上記の時間領域ダウンミックス処理方法に限定されない。
S27:二次チャネル信号に対して差動エンコーディングを実行する。
ステップS27に含まれる内容については、上記の実施形態のステップS10からステップS12の記載を参照されたい。詳細はここで再び記載されない。
上記の例からは、本願のこの実施形態では、二次チャネル信号のピッチ周期の差動エンコーディングを使用すべきかどうかが決定され、差動エンコーディング方法では、二次チャネル信号のピッチ周期のエンコーディングオーバヘッドが低減され得ることが分かる。
簡潔な記載のために、上記の方法の実施形態は、一連の動作の組み合わせとして表現されていることが留意されるべきである。しかし、当業者であれば、本願が記載されている動作の順序に限定されないことを理解するはずである。これは、本願に従って、いくつかのステップが他の順序で又は同時に実行されてもよいからである
本願の実施形態における上記の解決法をより良く実施するために、以下は、上記の解決法を実装するよう構成された関連する装置を更に提供する。
図10に示されるように、本願の実施形態で提供されるステレオエンコーディング装置1000は、ダウンミックスモジュール1001、決定モジュール1002、及び差動エンコーディングモジュール1003を含み得る。
ダウンミックスモジュール1001は、現在のフレームの左チャネル信号及び現在のフレームの右チャネル信号に対してダウンミックス処理を実行して、現在のフレームの一次チャネル信号及び現在のフレームの二次チャネル信号を取得するよう構成される。
決定モジュール1002は、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行すべきかどうかを決定するよう構成される。
差動エンコーディングモジュール1003は、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行すると決定される場合に、一次チャネル信号の推定ピッチ周期値を使用することによって二次チャネル信号のピッチ周期に対して差動エンコーディングを実行して、二次チャネル信号のピッチ周期インデックス値を取得するよう構成され、このとき、二次チャネル信号のピッチ周期インデックス値は、送信されるべきステレオエンコードされたビットストリームを生成するために使用される。
本願のいくつかの実施形態において、決定モジュールは:
現在のフレームの一次チャネル信号をエンコードして、一次チャネル信号の推定ピッチ周期値を取得するよう構成される一次チャネルエンコーディングモジュールと、
現在のフレームの二次チャネル信号に対して開ループピッチ周期解析を実行して、二次チャネル信号の推定開ループピッチ周期値を取得するよう構成される開ループ解析モジュールと、
一次チャネル信号の推定ピッチ周期値と二次チャネル信号の推定開ループピッチ周期値との間の差が前もってセットされた二次チャネルピッチ周期差動エンコーディング閾値を超えるかどうかを決定し、差が二次チャネルピッチ周期差動エンコーディング閾値を超える場合には、差動エンコーディングを実行すると決定し、あるいは、差が二次チャネルピッチ周期差動エンコーディング閾値を超えない場合には、差動エンコーディングを実行することをスキップすると決定するよう構成される閾値決定モジュールと
を含む。
本願のいくつかの実施形態において、ステレオエンコーディング装置は、
二次チャネル信号のピッチ周期に対して差動エンコーディングを実行すると決定される場合に、現在のフレームにおける二次チャネルピッチ周期差動エンコーディングフラグを前もってセットされた第1値に設定するよう構成されるフラグ設定モジュールを更に含み、
ステレオエンコードされたビットストリームが、二次チャネルピッチ周期差動エンコーディングフラグを運び、第1値は、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行することを示すために使用される。
本願のいくつかの実施形態において、ステレオエンコーディング装置は、独立エンコーディングモジュールを更に含む。
独立エンコーディングモジュールは、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行することをスキップし、かつ、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用することをスキップすると決定される場合に、二次チャネル信号のピッチ周期と一次チャネル信号のピッチ周期とを別々にエンコードするよう構成される。
更に、本願のいくつかの実施形態では、フラグ設定モジュールが、
二次チャネル信号のピッチ周期に対して差動エンコーディングを実行することをスキップすると決定される場合に、二次チャネルピッチ周期差動エンコーディングフラグを前もってセットされた第2値に設定し、ステレオエンコードされたビットストリームが、二次チャネルピッチ周期差動エンコーディングフラグを運び、第2値は、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行しないことを示すために使用され、
一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用することをスキップすると決定される場合に、二次チャネル信号ピッチ周期再利用フラグを前もってセットされた第3値に設定し、ステレオエンコードされたビットストリームが二次チャネル信号ピッチ周期再利用フラグを運び、第3値は、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用しないことを示すために使用される
よう更に構成される。
独立エンコーディングモジュールは、二次チャネル信号のピッチ周期及び一次チャネル信号のピッチ周期を別々にエンコードするよう構成される。
本願のいくつかの実施形態において、フラグ設定モジュールは、
二次チャネル信号のピッチ周期に対して差動エンコーディングを実行することをスキップし、かつ、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用すると決定される場合に、二次チャネル信号ピッチ周期再利用フラグを前もってセットされた第4値に設定し、ステレオエンコードされたビットストリームを使用して二次チャネル信号ピッチ周期再利用フラグを運ぶよう構成され、
第4値は、一次チャネル信号の推定ピッチ周期値を二次チャネル信号の前記ピッチ周期として再利用することを示すために使用される。
更に、本願のいくつかの実施形態において、フラグ設定モジュールは、
二次チャネル信号のピッチ周期に対して差動エンコーディングを実行することをスキップすると決定される場合に、二次チャネルピッチ周期差動エンコーディングフラグを前もってセットされた第2値に設定し、ステレオエンコードされたビットストリームが、二次チャネルピッチ周期差動エンコーディングフラグを運び、第2値は、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行しないことを示すために使用され、
一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用すると決定される場合に、二次チャネル信号ピッチ周期再利用フラグを前もってセットされた第4値に設定し、ステレオエンコードされたビットストリームを使用して二次チャネル信号ピッチ周期再利用フラグを運び、第4値は、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用することを示すために使用される
よう更に構成される。
本願のいくつかの実施形態において、差動エンコーディングモジュールは:
一次チャネル信号の推定ピッチ周期値に基づき二次チャネル信号閉ループピッチ周期探索を実行して、二次チャネル信号の推定ピッチ周期値を取得するよう構成される閉ループピッチ周期探索モジュールと、
二次チャネル信号のピッチ周期探索範囲調整係数に基づき二次チャネル信号のピッチ周期インデックス値の上限を決定するよう構成されるインデックス値上限決定モジュールと、
一次チャネル信号の推定ピッチ周期値、二次チャネル信号の推定ピッチ周期値、及び二次チャネル信号のピッチ周期インデックス値の上限に基づき、二次チャネル信号のピッチ周期インデックス値を計算するよう構成されるインデックス値計算モジュールと
を含む。
本願のいくつかの実施形態において、閉ループピッチ周期探索モジュールは、
一次チャネル信号の推定ピッチ周期値と、現在のフレームの二次チャネル信号が分割されるサブフレームの数とに基づき、二次チャネル信号の閉ループピッチ周期基準値を決定し、
整数精度及び分数精度を使用することによって、かつ、二次チャネル信号の閉ループピッチ周期基準値を二次チャネル信号閉ループピッチ周期探索の開始点として使用することによって、閉ループピッチ周期探索を実行して、二次チャネル信号の推定ピッチ周期値を取得する
よう構成される。
本願のいくつかの実施形態において、閉ループピッチ周期探索モジュールは、
一次チャネル信号の推定ピッチ周期値に基づき、二次チャネル信号の閉ループピッチ周期整数部loc_T0及び二次チャネル信号の閉ループピッチ周期分数部loc_frac_primを決定し、
次の方法:

f_pitch_prim=loc_T0+loc_frac_prim/N

で二次チャネル信号の閉ループピッチ周期基準値f_pitch_primを計算する
よう構成され、
Nは、二次チャネル信号が分割されるサブフレームの数を表す。
本願のいくつかの実施形態において、インデックス値上限決定モジュールは、次の方法:

soft_reuse_index_high_limit=0.5+2

で二次チャネル信号のピッチ周期インデックス値の前記上限soft_reuse_index_high_limitを計算するよう構成され、
Zは、二次チャネル信号のピッチ周期探索範囲調整係数であり、Zの値は、3、4、又は5である。
本願のいくつかの実施形態において、インデックス値計算モジュールは、
一次チャネル信号の推定ピッチ周期値に基づき、二次チャネル信号の閉ループピッチ周期整数部loc_T0及び二次チャネル信号の閉ループピッチ周期分数部loc_frac_primを決定し、
次の方法:

soft_reuse_index=(N×pitch_soft_reuse+pitch_frac_soft_reuse)-(N×loc_T0+loc_frac_prim)+soft_reuse_index_high_limit/M

で二次チャネル信号のピッチ周期インデックス値soft_reuse_indexを計算するよう構成され、
pitch_soft_reuseは、二次チャネル信号の推定ピッチ周期値の整数部を表し、pitch_frac_soft_reuseは、二次チャネル信号の推定ピッチ周期値の分数部を表し、soft_reuse_index_high_limitは、二次チャネル信号のピッチ周期インデックス値の上限を表し、Nは、二次チャネル信号が分割されるサブフレームの数を表し、Mは、二次チャネル信号のピッチ周期インデックス値の上限の調整係数を表し、Mは、非ゼロの実数であり、×は、乗算演算子を表し、+は、加算演算子を表し、-は、減算演算子を表す。
本願のいくつかの実施形態において、ステレオエンコーディング装置は、現在のフレームのエンコーディングレートが前もってセットされたレート閾値よりも低いステレオエンコーディングシナリオに適用される。
レート閾値は、次の値:13.2キロビット毎秒kbps、16.4kbps、又は24.4kbps、のうちの少なくとも1つである。
図11に示されるように、本願の実施形態で提供されるステレオデコーディング装置1100は、決定モジュール1101、値取得モジュール1102、及び差動デコーディングモジュール1103を含み得る。
決定モジュール1101は、受け取られたステレオエンコードされたビットストリームに基づき、二次チャネル信号のピッチ周期に対して差動デコーディングを実行すべきかどうかを決定するよう構成される。
値取得モジュール1102は、二次チャネル信号のピッチ周期に対して差動デコーディングを実行すると決定される場合に、ステレオエンコードされたビットストリームから、現在のフレームの一次チャネルの推定ピッチ周期値及び現在のフレームの二次チャネルのピッチ周期インデックス値を取得するよう構成される。
差動デコーディングモジュール1103は、一次チャネルの推定ピッチ周期値及び二次チャネルのピッチ周期インデックス値に基づき二次チャネル信号のピッチ周期に対して差動デコーディングを実行して、二次チャネル信号の推定ピッチ周期値を取得するよう構成され、このとき、二次チャネル信号の推定ピッチ周期値は、ステレオエンコードされたビットストリームをデコードするために使用される。
本願のいくつかの実施形態において、決定モジュールは、現在のフレームから二次チャネルピッチ周期差動エンコーディングフラグを取得し、二次チャネルピッチ周期差動エンコーディングフラグが前もってセットされた第1値である場合に、二次チャネル信号の前記ピッチ周期に対して差動デコーディングを実行すると決定するよう構成される。
本願のいくつかの実施形態において、ステレオデコーディング装置は、独立デコーディングモジュールを更に含む。
独立デコーディングモジュールは、
二次チャネル信号のピッチ周期に対して差動デコーディングを実行することをスキップし、かつ、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用することをスキップすると決定される場合に、ステレオエンコードされたビットストリームから二次チャネル信号のピッチ周期をデコードするよう構成される。
更に、独立デコーディングモジュールは、
二次チャネルピッチ周期差動エンコーディングフラグが前もってセットされた第2値であり、かつ、ステレオエンコードされたビットストリームで運ばれた二次チャネル信号ピッチ周期再利用フラグが前もってセットされた第3値である場合に、二次チャネル信号のピッチ周期に対して差動デコーディングを実行しないと、かつ、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用しないと決定し、ステレオエンコードされたビットストリームから二次チャネル信号のピッチ周期をデコードするよう構成される。
本願のいくつかの実施形態において、ステレオデコーディング装置は、ピッチ周期再利用モジュールを更に含む。
ピッチ周期再利用モジュールは、
二次チャネル信号のピッチ周期に対して差動デコーディングを実行することをスキップし、かつ、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用すると決定される場合に、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として使用するよう構成される。
更に、ピッチ周期再利用モジュールは、
二次チャネルピッチ周期差動エンコーディングフラグが前もってセットされた第2値であり、かつ、ステレオエンコードされたビットストリームで運ばれた二次チャネル信号ピッチ周期再利用フラグが前もってセットされた第4値である場合に、二次チャネル信号のピッチ周期に対して差動デコーディングを実行しないと決定し、一次チャネル信号の推定ピッチ周期値を二次チャネル信号のピッチ周期として再利用するよう構成される。
本願のいくつかの実施形態において、差動デコーディングモジュールは:
一次チャネル信号の推定ピッチ周期値と、現在のフレームの二次チャネル信号が分割されるサブフレームの数とに基づき、二次チャネル信号の閉ループピッチ周期基準値を決定するよう構成される基準値決定サブモジュールと、
二次チャネル信号のピッチ周期探索範囲調整係数に基づき二次チャネル信号のピッチ周期インデックス値の上限を決定するよう構成されるインデックス値上限決定サブモジュールと、
二次チャネル信号の閉ループピッチ周期基準値、二次チャネル信号のピッチ周期インデックス値、及び二次チャネル信号のピッチ周期インデックス値の上限に基づき、二次チャネル信号の推定ピッチ周期値を計算するよう構成される推定値計算サブモジュールと
を含む。
本願のいくつかの実施形態において、推定値計算サブモジュールは、次の方法:

T0_pitch=f_pitch_prim+(soft_reuse_index-soft_reuse_index_high_limit/M)/N

で二次チャネル信号の推定ピッチ周期値T0_pitchを計算するよう構成され、
f_pitch_primは、二次チャネル信号の閉ループピッチ周期基準値を表し、soft_reuse_indexは、二次チャネル信号のピッチ周期インデックス値を表し、Nは、二次チャネル信号が分割されるサブフレームの数を表し、Mは、二次チャネル信号のピッチ周期インデックス値の上限の調整係数を表し、Mは、非ゼロの実数であり、/は、除算演算子を表し、+は、加算演算子を表し、-は、減算演算子を表す。
上記の実施形態の例の記載に従って、本願のこの実施形態では、一次チャネル信号の推定ピッチ周期値を使用することによって差動エンコーディングが二次チャネル信号のピッチ周期に対して実行されるので、差動エンコーディングのために二次チャネル信号のピッチ周期に割り当てられる必要があるビットリソースは少量である。二次チャネル信号のピッチ周期の差動エンコーディングを通じて、ステレオ信号の空間感覚及び音響画像安定性は改善され得る。更に、本願のこの実施形態では、二次チャネル信号のピッチ周期に対して差動エンコーディングを実行するために使用されるビットリソースは比較的に少数である。従って、節約されたビットリソースは、他のステレオエンコーディングパラメータのために使用されてもよく、それにより、二次チャネル信号のエンコーディング効率は改善され、最終的に、全体的なステレオエンコーディング品質は改善される。更に、本願のこの実施形態では、差動デコーディングが二次チャネル信号のピッチ周期に対して実行され得る場合に、一次チャネル信号の推定ピッチ周期値及び二次チャネル信号のピッチ周期インデックス値が、二次チャネル信号の推定ピッチ周期値を取得するよう、二次チャネル信号のピッチ周期に対して差動デコーディングを実行するために使用されてもよく、ステレオエンコードされたビットストリームは、二次チャネル信号の推定ピッチ周期値を使用することによってデコードされ得る。従って、ステレオ信号の空間感覚及び音響画像安定性は改善され得る。
装置のモジュール/ユニット間の情報交換及びそれらの実行プロセスなどの内容は、本願の方法の実施形態と同じ考えに基づいており、従って、本願の方法の実施形態と同じ技術的効果を奏することが留意されるべきである。具体的な内容については、本願の方法の実施形態における上記の記載を参照されたい。詳細はここで再び記載されない。
本願の実施形態はコンピュータ記憶媒体を更に提供する。コンピュータ記憶媒体はプログラムを記憶する。プログラムは、上記の方法の実施形態で示されているステップの一部又は全部を実行するよう実行される。
以下は、本願の実施形態で提供される他のステレオエンコーディング装置について記載する。図12に示されるように、ステレオエンコーディング装置1200は:
受信器1201、送信器1202、プロセッサ1203、及びメモリ1204を含む(ステレオエンコーディング装置1200には1つ以上のプロセッサ1203に存在してもよく、1つのプロセッサが図12では例として使用されている)。本願のいくつかの実施形態において、受信器1201、送信器1202、プロセッサ1203、及びメモリ1204は、バスを通じて又は他の様態で接続されてもよい。図12では、バスを通じた接続が例として使用されている。
メモリ1204は、リード・オンリー・メモリ及びランダム・アクセス・メモリを含み、プロセッサ1203のための命令及びデータを供給し得る。メモリ1204の一部は、不揮発性ランダム・アクセス・メモリ(non-volatile random access memory,NVRAM)を更に含んでもよい。メモリ1204は、オペレーティングシステム及びオペレーション命令、実行可能モジュール若しくはデータ構造、それらのサブセット、又はそれらの拡張セットを記憶している。オペレーション命令は、様々な動作を実装するための様々なオペレーション命令を含み得る。オペレーティングシステムは、様々な基本サービスを実装しかつハードウェアベースのタスクを処理するための様々なシステムプログラムを含み得る。
プロセッサ1203は、ステレオエンコーディング装置の動作を制御し、プロセッサ1203はまた、中央演算処理装置(central processing unit,CPU)とも呼ばれ得る。具体的な適用では、ステレオエンコーディング装置のコンポーネントは、バスシステムを使用することによって連結されている。データバスに加えて、バスシステムは電力バス、制御バス、ステータス信号バス、などを含む。しかし、明りょうな記載のために、図中の様々なバスは、バスシステムと呼ばれている。
本願の実施形態で開示されている方法は、プロセッサ1203に適用されても、又はプロセッサ1203によって実装されてもよい。プロセッサ1203は、集積回路チップであってもよく、信号処理機能を備えている。実装プロセスにおいて、上記の方法のステップは、プロセッサ1203内のハードウェア集積ロジック回路又はソフトウェアの形を取る命令を使用することによって、完了されてもよい。プロセッサ1203は、汎用プロセッサ、デジタル・シグナル・プロセッサ(digital signal processor,DSP)、特定用途向け集積回路(application-specific integrated circuit,ASIC)、フィールド・プログラマブル・ゲート・アレイ(field-programmable gate array,FPGA)若しくは他のプログラム可能なロジックデバイス、ディスクリートゲート若しくはトランジスタロジックデバイス、又はディスクリートハードウェア部品であってもよい。プロセッサは、本願の実施形態で開示されている方法、ステップ、及び論理ブロックを実装又は実行してもよい。汎用プロセッサはマイクロプロセッサであってもよく、あるいは、プロセッサは任意の従来のプロセッサなどであってもよい。本願の実施形態を参照して開示される方法のステップは、ハードウェアデコーディングプロセッサによって直接に実行及び完了されてもよく、あるいは、デコーディングプロセッサでハードウェア及びソフトウェアモジュールの組み合わせを使用することによって実行及び完了されてもよい。ソフトウェアモジュールは、当該技術での成熟した記憶媒体、例えば、ランダム・アクセス・メモリ、フラッシュメモリ、リード・オンリー・メモリ、プログラム可能リード・オンリー・メモリ、電気的消去可能なプログラム可能メモリ、又はレジスタに位置してもよい。記憶媒体はメモリ1204に位置し、プロセッサ1203は、メモリ1204内の情報を読み出し、プロセッサのハードウェアと組み合わせて上記の方法のステップを完了する。
受信器1201は、入力されたデジタル又は文字情報を受信し、ステレオエンコーディング装置の関連した設定及び機能制御に関係がある信号入力を生成するよう構成され得る。送信器1202は、表示スクリーンなどの表示デバイスを含んでもよく、送信器1202は、外部インターフェースを使用することによってデジタル又は文字情報を出力するよう構成され得る。
本願のこの実施形態では、プロセッサ1203は、上記の実施形態で図4に示されたステレオエンコーディング装置によって実行されたステレオエンコーディング方法を実行するよう構成される。
以下は、本願の実施形態で提供される他のステレオデコーディング装置について記載する。図13に示されるように、ステレオデコーディング装置1300は:
受信器1301、送信器1302、プロセッサ1303、及びメモリ1304を含む(ステレオデコーディング装置1300には1つ以上のプロセッサ1303に存在してもよく、1つのプロセッサが図13では例として使用されている)。本願のいくつかの実施形態において、受信器1301、送信器1302、プロセッサ1303、及びメモリ1304は、バスを通じて又は他の様態で接続されてもよい。図13では、バスを通じた接続が例として使用されている。
メモリ1304は、リード・オンリー・メモリ及びランダム・アクセス・メモリを含み、プロセッサ1303へ命令及びデータを供給し得る。メモリ1304の一部は、NVRAMを更に含んでもよい。メモリ1304は、オペレーティングシステム及びオペレーション命令、実行可能モジュール若しくはデータ構造、それらのサブセット、又はそれらの拡張セットを記憶している。オペレーション命令は、様々な動作を実装するための様々なオペレーション命令を含み得る。オペレーティングシステムは、様々な基本サービスを実装しかつハードウェアベースのタスクを処理するための様々なシステムプログラムを含み得る。
プロセッサ1303は、ステレオデコーディング装置の動作を制御し、プロセッサ1303はまた、CPUとも呼ばれ得る。具体的な適用では、ステレオデコーディング装置のコンポーネントは、バスシステムを使用することによって連結されている。データバスに加えて、バスシステムは電力バス、制御バス、ステータス信号バス、などを含む。しかし、明りょうな記載のために、図中の様々なバスは、バスシステムと呼ばれている。
本願の上記の実施形態で開示されている方法は、プロセッサ1303に適用されてもよく、あるいは、プロセッサ1303によって実装されてもよい。プロセッサ1303は、集積回路チップであってもよく、信号処理機能を備えている。実装プロセスにおいて、上記の方法のステップは、プロセッサ1303内のハードウェア集積ロジック回路を使用することによって、又はソフトウェアの形を取る命令を使用することによって、実装可能である。上記のプロセッサ1303は、汎用プロセッサ、DSP、ASIC、FPGA若しくは他のプログラム可能なロジックデバイス、ディスクリートゲート若しくはトランジスタロジックデバイス、又はディスクリートハードウェア部品であってもよい。プロセッサは、本願の実施形態で開示されている方法、ステップ、及び論理ブロックを実装又は実行してもよい。汎用プロセッサはマイクロプロセッサであってもよく、あるいは、プロセッサは任意の従来のプロセッサなどであってもよい。本願の実施形態を参照して開示される方法のステップは、ハードウェアデコーディングプロセッサによって直接に実行及び完了されてもよく、あるいは、デコーディングプロセッサでハードウェア及びソフトウェアモジュールの組み合わせを使用することによって実行及び完了されてもよい。ソフトウェアモジュールは、当該技術での成熟した記憶媒体、例えば、ランダム・アクセス・メモリ、フラッシュメモリ、リード・オンリー・メモリ、プログラム可能リード・オンリー・メモリ、電気的消去可能なプログラム可能メモリ、又はレジスタに位置してもよい。記憶媒体はメモリ1304に位置し、プロセッサ1303は、メモリ1304内の情報を読み出し、プロセッサのハードウェアと組み合わせて上記の方法のステップを完了する。
本願のこの実施形態では、プロセッサ1303は、上記の実施形態で図4に示されたステレオデコーディング装置によって実行されたステレオデコーディング方法を実行するよう構成される。
他の可能な設計では、ステレオエンコーディング装置又はステレオデコーディング装置が端末内のチップである場合に、チップは処理ユニット及び通信ユニットを含む。処理ユニットは、例えば、プロセッサであってもよい。通信ユニットは、例えば、入出力インターフェース、ピン、又は回路であってもよい。処理ユニットは、上記の第1の態様のいずれかの実施に従うステレオエンコーディング方法を実行することを端末内のチップに可能にするために、記憶ユニット記憶されているコンピュータ実行可能命令を実行してもよい。任意に、記憶ユニットは、チップ内の記憶ユニット、例えば、レジスタ又はバッファであってもよく、あるいは、記憶ユニットは、代替的に、チップの外にある端末内の記憶ユニット、例えば、リード・オンリー・メモリ(read-only memory,ROM)、静的情報及び命令を記憶することができる他のタイプの静的記憶デバイス、又はランダム・アクセス・メモリ(random access memory,RAM)であってもよい。
上記のプロセッサは、汎用の中央演算処理装置、マイクロプロセッサ、ASIC、又は第1の態様若しくは第2の態様に従う方法のプログラム実行を制御する1つ以上の集積回路であってもよい。
更に、記載されている装置の実施形態は例にすぎないことが留意されるべきである。別個の部分として記載されているユニットは、物理的に分離していてもしていなくてもよく、ユニットして表示されているユニットは、物理ユニットであってもなくてもよく、つまり、1つの場所に位置してもよく、あるいは、複数のネットワークユニット上に分布してもよい。いくつか又は全てのモジュールは、実施形態の解決法の目的を達成するよう実際のニーズに応じて選択されてもよい。更に、本願によって提供される装置の実施形態の添付の図面では、モジュール間の接続関係は、互いと通信接続を有していることを示し、これは、具体的に、1つ以上の通信バス又は信号ケーブルとして実装され得る。
上記の実施の記載に基づき、当業者であれば、本願が、必要な一般的ハードウェアと組み合わせてソフトウェアを使用することによって実装されてもよく、あるいは、確かに、専用の集積回路、専用のCPU、専用のメモリ、専用のコンポーネントなどを含む専用のハードウェアを使用することによって実装されてもよいと明らかに理解し得る。一般的に、コンピュータプログラムを使用することによって完了され得る如何なる機能も、対応するハードウェアを使用することによって非常に容易に実装可能である。更に、同じ機能を実装するために使用される特定のハードウェア構造は、様々な形をとり、例えば、アナログ回路、デジタル回路、専用回路、などの形をとり得る。しかし、本願に関しては、ソフトウェアプログラム実装は、ほとんどの場合に、より良い実施である。そのような理解に基づき、本願の技術的解決法は本質的に、又は従来技術に寄与する部分は、ソフトウェア製品の形で実装されてもよい。コンピュータソフトウェア製品は、コンピュータのフロッピーディスク、USBフラッシュドライブ、リムーバブルハードディスク、ROM、RAM、磁気ディスク、又は光ディスクなどの読み出し可能な記憶媒体に記憶され、本願の実施形態で記載される方法を実行するようにコンピュータデバイス(パーソナルコンピュータ、サーバ、ネットワークデバイス、などであってよい)に指示するいくつかの命令を含む。
上記の実施形態の全部又は一部は、ソフトウェア、ハードウェア、ファームウェア、又はそれらの任意の組み合わせを使用することによって実装されてもよい。ソフトウェアが実施形態を実装するために使用される場合に、実施形態の全部又は一部は、コンピュータプログラム製品の形で実装されてもよい。
コンピュータプログラム製品は、1つ以上のコンピュータ命令を含む。コンピュータプログラム命令がコンピュータでロードされ実行される場合に、本願の実施形態に従うプロシージャ又は機能は全て又は部分的に生成される。コンピュータは、汎用コンピュータ、専用コンピュータ、コンピュータネットワーク、又は他のプログラム可能な装置であってもよい。コンピュータ命令は、コンピュータ可読記憶媒体に記憶されてもよく、あるいは、コンピュータ可読記憶媒体から他のコンピュータ可読記憶媒体へ伝送されてもよい。例えば、コンピュータ命令は、ウェブサイト、コンピュータ、サーバ、又はデータセンターから他のウェブサイト、コンピュータ、サーバ、又はデータセンターへ有線(例えば、同軸ケーブル、光ファイバ、若しくはデジタル加入者回線(DSL))又は無線(例えば、赤外線、電波、若しくはマイクロ波)方式で伝送されてもよい。コンピュータ可読記憶媒体は、コンピュータによってアクセス可能な任意の使用可能な媒体、又は1つ以上の使用可能な媒体を組み込みサーバ又はデータセンターなどのデータ記憶デバイスであってもよい。使用可能な媒体は、磁気媒体(例えば、フロッピーディスク、ハードディスク、又は磁気テープ)、光学媒体(例えば、DVD)、半導体媒体(例えば、ソリッドステートドライブ(Solid State Disk,SSD))などであってもよい。
本願は、2019年6月29日付けで「STEREO ENCODING METHOD AND APPARATUS, AND STEREO DECODING METHOD AND APPARATUS」との発明の名称で中国国家知識産権局に出願された中国特許出願第201910581398.5号に対する優先権を主張するものである

Claims (40)

  1. ステレオエンコーディング方法であって、
    現在のフレームの左チャネル信号及び前記現在のフレームの右チャネル信号に対してダウンミックス処理を実行して、前記現在のフレームの一次チャネル信号及び前記現在のフレームの二次チャネル信号を取得することと、
    前記二次チャネル信号のピッチ周期に対して差動エンコーディングを実行すると決定する場合に、前記一次チャネル信号の推定ピッチ周期値を使用することによって前記二次チャネル信号の前記ピッチ周期に対して差動エンコーディングを実行して、前記二次チャネル信号のピッチ周期インデックス値を取得することであり、前記二次チャネル信号の前記ピッチ周期インデックス値は、送信されるべきステレオエンコードされたビットストリームを生成するために使用される、ことと
    を有し、
    前記一次チャネル信号の推定ピッチ周期値を使用することによって前記二次チャネル信号の前記ピッチ周期に対して差動エンコーディングを実行して、前記二次チャネル信号のピッチ周期インデックス値を取得することは、
    前記一次チャネル信号の前記推定ピッチ周期値に基づき二次チャネル信号閉ループピッチ周期探索を実行して、前記二次チャネル信号の推定ピッチ周期値を取得することと、
    前記二次チャネル信号のピッチ周期探索範囲調整係数に基づき前記二次チャネル信号の前記ピッチ周期インデックス値の上限を決定することと、
    前記一次チャネル信号の前記推定ピッチ周期値、前記二次チャネル信号の前記推定ピッチ周期値、及び前記二次チャネル信号の前記ピッチ周期インデックス値の前記上限に基づき、前記二次チャネル信号の前記ピッチ周期インデックス値を計算することと
    を有する、
    方法。
  2. 当該方法は、
    前記現在のフレームの前記一次チャネル信号をエンコードして、前記一次チャネル信号の前記推定ピッチ周期値を取得することと、
    前記現在のフレームの前記二次チャネル信号に対して開ループピッチ周期解析を実行して、前記二次チャネル信号の推定開ループピッチ周期値を取得することと、
    前記一次チャネル信号の前記推定ピッチ周期値と前記二次チャネル信号の前記推定開ループピッチ周期値との間の差が前もってセットされた二次チャネルピッチ周期差動エンコーディング閾値を超えるかどうかを決定することと、
    前記差が前記二次チャネルピッチ周期差動エンコーディング閾値を超える場合には、前記二次チャネル信号の前記ピッチ周期に対して差動エンコーディングを実行すると決定し、あるいは、前記差が前記二次チャネルピッチ周期差動エンコーディング閾値を超えない場合には、前記二次チャネル信号の前記ピッチ周期に対して差動エンコーディングを実行することをスキップすると決定することと
    を更に有する、
    請求項1に記載の方法。
  3. 前記二次チャネル信号の前記ピッチ周期に対して差動エンコーディングを実行すると決定される場合に、当該方法は、
    前記現在のフレームにおける二次チャネルピッチ周期差動エンコーディングフラグを前もってセットされた第1値に設定することを更に有し、
    前記ステレオエンコードされたビットストリームが、前記二次チャネルピッチ周期差動エンコーディングフラグを運び、前記第1値は、前記二次チャネル信号の前記ピッチ周期に対して差動エンコーディングを実行することを示すために使用される、
    請求項1又は2に記載の方法。
  4. 当該方法は、
    前記二次チャネル信号の前記ピッチ周期に対して差動エンコーディングを実行することをスキップし、前記一次チャネル信号の前記推定ピッチ周期値を前記二次チャネル信号の前記ピッチ周期として再利用することをスキップすると決定する場合に、前記二次チャネル信号の前記ピッチ周期と前記一次チャネル信号のピッチ周期とを別々にエンコードすることを更に有する、
    請求項1乃至3のうちいずれか一項に記載の方法。
  5. 当該方法は、
    前記二次チャネル信号の前記ピッチ周期に対して差動エンコーディングを実行することをスキップし、前記一次チャネル信号の前記推定ピッチ周期値を前記二次チャネル信号の前記ピッチ周期として再利用すると決定する場合に、二次チャネル信号ピッチ周期再利用フラグを前もってセットされた第4値に設定し、前記ステレオエンコードされたビットストリームを使用して前記二次チャネル信号ピッチ周期再利用フラグを運ぶことを更に有し、
    前記第4値は、前記一次チャネル信号の前記推定ピッチ周期値を前記二次チャネル信号の前記ピッチ周期として再利用することを示すために使用される、
    請求項1乃至3のうちいずれか一項に記載の方法。
  6. 前記一次チャネル信号の前記推定ピッチ周期値に基づき二次チャネル信号閉ループピッチ周期探索を実行して、前記二次チャネル信号の推定ピッチ周期値を取得することは、
    前記一次チャネル信号の前記推定ピッチ周期値と、前記現在のフレームの前記二次チャネル信号が分割されるサブフレームの数とに基づき、前記二次チャネル信号の閉ループピッチ周期基準値を決定することと、
    整数精度及び分数精度を使用することによって、かつ、前記二次チャネル信号の前記閉ループピッチ周期基準値を前記二次チャネル信号閉ループピッチ周期探索の開始点として使用することによって、閉ループピッチ周期探索を実行して、前記二次チャネル信号の前記推定ピッチ周期値を取得することと
    を有する、
    請求項1乃至5のうちいずれか一項に記載の方法。
  7. 前記一次チャネル信号の前記推定ピッチ周期値と、前記現在のフレームの前記二次チャネル信号が分割されるサブフレームの数とに基づき、前記二次チャネル信号の閉ループピッチ周期基準値を決定することは、
    前記一次チャネル信号の前記推定ピッチ周期値に基づき、前記二次チャネル信号の閉ループピッチ周期整数部loc_T0及び前記二次チャネル信号の閉ループピッチ周期分数部loc_frac_primを決定することと、
    次の方法:
    f_pitch_prim=loc_T0+loc_frac_prim/N
    で前記二次チャネル信号の前記閉ループピッチ周期基準値f_pitch_primを計算することと
    を有し、
    Nは、前記二次チャネル信号が分割される前記サブフレームの数を表す、
    請求項に記載の方法。
  8. 前記二次チャネル信号のピッチ周期探索範囲調整係数に基づき前記二次チャネル信号の前記ピッチ周期インデックス値の上限を決定することは、
    次の方法:
    soft_reuse_index_high_limit=0.5+2
    で前記二次チャネル信号の前記ピッチ周期インデックス値の前記上限soft_reuse_index_high_limitを計算することを有し、
    Zは、前記二次チャネル信号の前記ピッチ周期探索範囲調整係数である、
    請求項1乃至5のうちいずれか一項に記載の方法。
  9. Zの値は、3、4、又は5である、
    請求項に記載の方法。
  10. 前記一次チャネル信号の前記推定ピッチ周期値、前記二次チャネル信号の前記推定ピッチ周期値、及び前記二次チャネル信号の前記ピッチ周期インデックス値の前記上限に基づき、前記二次チャネル信号の前記ピッチ周期インデックス値を計算することは、
    前記一次チャネル信号の前記推定ピッチ周期値に基づき、前記二次チャネル信号の閉ループピッチ周期整数部loc_T0及び前記二次チャネル信号の閉ループピッチ周期分数部loc_frac_primを決定することと、
    次の方法:
    soft_reuse_index=(N×pitch_soft_reuse+pitch_frac_soft_reuse)-(N×loc_T0+loc_frac_prim)+soft_reuse_index_high_limit/M
    で前記二次チャネル信号の前記ピッチ周期インデックス値soft_reuse_indexを計算することと
    を有し、
    pitch_soft_reuseは、前記二次チャネル信号の前記推定ピッチ周期値の整数部を表し、pitch_frac_soft_reuseは、前記二次チャネル信号の前記推定ピッチ周期値の分数部を表し、soft_reuse_index_high_limitは、前記二次チャネル信号の前記ピッチ周期インデックス値の前記上限を表し、Nは、前記二次チャネル信号が分割されるサブフレームの数を表し、Mは、前記二次チャネル信号の前記ピッチ周期インデックス値の前記上限の調整係数を表し、Mは、非ゼロの実数であり、×は、乗算演算子を表し、+は、加算演算子を表し、-は、減算演算子を表す、
    請求項1乃至5のうちいずれか一項に記載の方法。
  11. 前記二次チャネル信号の前記ピッチ周期インデックス値の前記上限の前記調整係数の値は、2又は3である、
    請求項10に記載の方法。
  12. 当該方法は、前記現在のフレームのエンコーディングレートが前もってセットされたレート閾値よりも低いステレオエンコーディングシナリオに適用され、
    前記レート閾値は、次の値:13.2キロビット毎秒(kbps)、16.4kbps、又は24.4kbps、のうちの少なくとも1つである、
    請求項1乃至11のうちいずれか一項に記載の方法。
  13. ステレオデコーディング方法であって、
    受け取られたステレオエンコードされたビットストリームに基づき、二次チャネル信号のピッチ周期に対して差動デコーディングを実行すべきかどうかを決定することと、
    前記二次チャネル信号の前記ピッチ周期に対して差動デコーディングを実行すると決定する場合に、前記ステレオエンコードされたビットストリームから、現在のフレームの一次チャネル信号の推定ピッチ周期値及び前記現在のフレームの前記二次チャネル信号のピッチ周期インデックス値を取得することと、
    前記一次チャネル信号の前記推定ピッチ周期値及び前記二次チャネル信号の前記ピッチ周期インデックス値に基づき前記二次チャネル信号の前記ピッチ周期に対して差動デコーディングを実行して、前記二次チャネル信号の推定ピッチ周期値を取得することであり、前記二次チャネル信号の前記推定ピッチ周期値は、前記ステレオエンコードされたビットストリームをデコードするために使用される、ことと
    を有し、
    前記一次チャネル信号の前記推定ピッチ周期値及び前記二次チャネル信号の前記ピッチ周期インデックス値に基づき前記二次チャネル信号の前記ピッチ周期に対して差動デコーディングを実行することは、
    前記一次チャネル信号の前記推定ピッチ周期値と、前記現在のフレームの前記二次チャネル信号が分割されるサブフレームの数とに基づき、前記二次チャネル信号の閉ループピッチ周期基準値を決定することと、
    前記二次チャネル信号のピッチ周期探索範囲調整係数に基づき前記二次チャネル信号の前記ピッチ周期インデックス値の上限を決定することと、
    前記二次チャネル信号の前記閉ループピッチ周期基準値、前記二次チャネル信号の前記ピッチ周期インデックス値、及び前記二次チャネル信号の前記ピッチ周期インデックス値の前記上限に基づき、前記二次チャネル信号の前記推定ピッチ周期値を計算することと
    を有する、
    方法。
  14. 受け取られたステレオエンコードされたビットストリームに基づき、二次チャネル信号のピッチ周期に対して差動デコーディングを実行すべきかどうかを決定することは、
    前記現在のフレームから二次チャネルピッチ周期差動エンコーディングフラグを取得することと、
    前記二次チャネルピッチ周期差動エンコーディングフラグが前もってセットされた第1値である場合に、前記二次チャネル信号の前記ピッチ周期に対して差動デコーディングを実行すると決定することと
    を有する、
    請求項13に記載の方法。
  15. 当該方法は、
    前記二次チャネル信号の前記ピッチ周期に対して差動デコーディングを実行することをスキップし、前記一次チャネル信号の前記推定ピッチ周期値を前記二次チャネル信号の前記ピッチ周期として再利用することをスキップすると決定する場合に、前記ステレオエンコードされたビットストリームから前記二次チャネル信号の前記ピッチ周期をデコードすることを更に有する、
    請求項14に記載の方法。
  16. 当該方法は、
    前記二次チャネル信号の前記ピッチ周期に対して差動デコーディングを実行することをスキップし、前記一次チャネル信号の前記推定ピッチ周期値を前記二次チャネル信号の前記ピッチ周期として再利用すると決定する場合に、前記一次チャネル信号の前記推定ピッチ周期値を前記二次チャネル信号の前記ピッチ周期として使用することを更に有する、
    請求項14に記載の方法。
  17. 前記二次チャネル信号の前記閉ループピッチ周期基準値、前記二次チャネル信号の前記ピッチ周期インデックス値、及び前記二次チャネル信号の前記ピッチ周期インデックス値の前記上限に基づき、前記二次チャネル信号の前記推定ピッチ周期値を計算することは、
    次の方法:
    T0_pitch=f_pitch_prim+(soft_reuse_index-soft_reuse_index_high_limit/M)/N
    で前記二次チャネル信号の前記推定ピッチ周期値T0_pitchを計算することを有し、
    f_pitch_primは、前記二次チャネル信号の前記閉ループピッチ周期基準値を表し、soft_reuse_indexは、前記二次チャネル信号の前記ピッチ周期インデックス値を表し、Nは、前記二次チャネル信号が分割される前記サブフレームの数を表し、Mは、前記二次チャネル信号の前記ピッチ周期インデックス値の前記上限の調整係数を表し、Mは、非ゼロの実数であり、/は、除算演算子を表し、+は、加算演算子を表し、-は、減算演算子を表す、
    請求項13乃至16のうちいずれか一項に記載の方法。
  18. 前記二次チャネル信号の前記ピッチ周期インデックス値の前記上限の前記調整係数の値は、2又は3である、
    請求項17に記載の方法。
  19. ステレオエンコーディング装置であって、
    現在のフレームの左チャネル信号及び前記現在のフレームの右チャネル信号に対してダウンミックス処理を実行して、前記現在のフレームの一次チャネル信号及び前記現在のフレームの二次チャネル信号を取得するよう構成されるダウンミックスモジュールと、
    前記二次チャネル信号のピッチ周期に対して差動エンコーディングを実行すると決定される場合に、前記一次チャネル信号の推定ピッチ周期値を使用することによって前記二次チャネル信号の前記ピッチ周期に対して差動エンコーディングを実行して、前記二次チャネル信号のピッチ周期インデックス値を取得するよう構成される差動エンコーディングモジュールと
    を有し、前記二次チャネル信号の前記ピッチ周期インデックス値は、送信されるべきステレオエンコードされたビットストリームを生成するために使用され
    前記差動エンコーディングモジュールは、
    前記一次チャネル信号の前記推定ピッチ周期値に基づき二次チャネル信号閉ループピッチ周期探索を実行して、前記二次チャネル信号の推定ピッチ周期値を取得するよう構成される閉ループピッチ周期探索モジュールと、
    前記二次チャネル信号のピッチ周期探索範囲調整係数に基づき前記二次チャネル信号の前記ピッチ周期インデックス値の上限を決定するよう構成されるインデックス値上限決定モジュールと、
    前記一次チャネル信号の前記推定ピッチ周期値、前記二次チャネル信号の前記推定ピッチ周期値、及び前記二次チャネル信号の前記ピッチ周期インデックス値の前記上限に基づき、前記二次チャネル信号の前記ピッチ周期インデックス値を計算するよう構成されるインデックス値計算モジュールと
    を有する、
    装置。
  20. 当該ステレオエンコーディング装置は、
    前記現在のフレームの前記一次チャネル信号をエンコードして、前記一次チャネル信号の前記推定ピッチ周期値を取得するよう構成される一次チャネルエンコーディングモジュールと、
    前記現在のフレームの前記二次チャネル信号に対して開ループピッチ周期解析を実行して、前記二次チャネル信号の推定開ループピッチ周期値を取得するよう構成される開ループ解析モジュールと、
    前記一次チャネル信号の前記推定ピッチ周期値と前記二次チャネル信号の前記推定開ループピッチ周期値との間の差が前もってセットされた二次チャネルピッチ周期差動エンコーディング閾値を超えるかどうかを決定し、前記差が前記二次チャネルピッチ周期差動エンコーディング閾値を超える場合には、前記二次チャネル信号の前記ピッチ周期に対して差動エンコーディングを実行すると決定し、あるいは、前記差が前記二次チャネルピッチ周期差動エンコーディング閾値を超えない場合には、前記二次チャネル信号の前記ピッチ周期に対して差動エンコーディングを実行することをスキップすると決定するよう構成される閾値決定モジュールと
    を更に有する、
    請求項19に記載の装置。
  21. 当該ステレオエンコーディング装置は、
    前記二次チャネル信号の前記ピッチ周期に対して差動エンコーディングを実行すると決定される場合に、前記現在のフレームにおける二次チャネルピッチ周期差動エンコーディングフラグを前もってセットされた第1値に設定するよう構成されるフラグ設定モジュールを更に有し、
    前記ステレオエンコードされたビットストリームが、前記二次チャネルピッチ周期差動エンコーディングフラグを運び、前記第1値は、前記二次チャネル信号の前記ピッチ周期に対して差動エンコーディングを実行することを示すために使用される、
    請求項19又は20に記載の装置。
  22. 当該ステレオエンコーディング装置は、独立エンコーディングモジュールを更に有し、
    前記独立エンコーディングモジュールは、前記二次チャネル信号の前記ピッチ周期に対して差動エンコーディングを実行することをスキップし、前記一次チャネル信号の前記推定ピッチ周期値を前記二次チャネル信号の前記ピッチ周期として再利用することをスキップすると決定される場合に、前記二次チャネル信号の前記ピッチ周期と前記一次チャネル信号のピッチ周期とを別々にエンコードするよう構成される、
    請求項19乃至21のうちいずれか一項に記載の装置。
  23. 前記フラグ設定モジュールは、前記二次チャネル信号の前記ピッチ周期に対して差動エンコーディングを実行することをスキップし、前記一次チャネル信号の前記推定ピッチ周期値を前記二次チャネル信号の前記ピッチ周期として再利用すると決定される場合に、二次チャネル信号ピッチ周期再利用フラグを前もってセットされた第4値に設定し、前記ステレオエンコードされたビットストリームを使用して前記二次チャネル信号ピッチ周期再利用フラグを運ぶよう更に構成され、
    前記第4値は、前記一次チャネル信号の前記推定ピッチ周期値を前記二次チャネル信号の前記ピッチ周期として再利用することを示すために使用される、
    請求項21に記載の装置。
  24. 前記閉ループピッチ周期探索モジュールは、
    前記一次チャネル信号の前記推定ピッチ周期値と、前記現在のフレームの前記二次チャネル信号が分割されるサブフレームの数とに基づき、前記二次チャネル信号の閉ループピッチ周期基準値を決定し、
    整数精度及び分数精度を使用することによって、かつ、前記二次チャネル信号の前記閉ループピッチ周期基準値を前記二次チャネル信号閉ループピッチ周期探索の開始点として使用することによって、閉ループピッチ周期探索を実行して、前記二次チャネル信号の前記推定ピッチ周期値を取得する
    よう構成される、
    請求項19乃至23のうちいずれか一項に記載の装置。
  25. 前記閉ループピッチ周期探索モジュールは、
    前記一次チャネル信号の前記推定ピッチ周期値に基づき、前記二次チャネル信号の閉ループピッチ周期整数部loc_T0及び前記二次チャネル信号の閉ループピッチ周期分数部loc_frac_primを決定し、
    次の方法:
    f_pitch_prim=loc_T0+loc_frac_prim/N
    で前記二次チャネル信号の前記閉ループピッチ周期基準値f_pitch_primを計算する
    よう構成され、
    Nは、前記二次チャネル信号が分割される前記サブフレームの数を表す、
    請求項24に記載の装置。
  26. 前記インデックス値上限決定モジュールは、
    次の方法:
    soft_reuse_index_high_limit=0.5+2
    で前記二次チャネル信号の前記ピッチ周期インデックス値の前記上限soft_reuse_index_high_limitを計算するよう構成され、
    Zは、前記二次チャネル信号の前記ピッチ周期探索範囲調整係数である、
    請求項19乃至23のうちいずれか一項に記載の装置。
  27. Zの値は、3、4、又は5である、
    請求項26に記載の装置。
  28. 前記インデックス値計算モジュールは、
    前記一次チャネル信号の前記推定ピッチ周期値に基づき、前記二次チャネル信号の閉ループピッチ周期整数部loc_T0及び前記二次チャネル信号の閉ループピッチ周期分数部loc_frac_primを決定し、
    次の方法:
    soft_reuse_index=(N×pitch_soft_reuse+pitch_frac_soft_reuse)-(N×loc_T0+loc_frac_prim)+soft_reuse_index_high_limit/M
    で前記二次チャネル信号の前記ピッチ周期インデックス値soft_reuse_indexを計算する
    よう構成され、
    pitch_soft_reuseは、前記二次チャネル信号の前記推定ピッチ周期値の整数部を表し、pitch_frac_soft_reuseは、前記二次チャネル信号の前記推定ピッチ周期値の分数部を表し、soft_reuse_index_high_limitは、前記二次チャネル信号の前記ピッチ周期インデックス値の前記上限を表し、Nは、前記二次チャネル信号が分割されるサブフレームの数を表し、Mは、前記二次チャネル信号の前記ピッチ周期インデックス値の前記上限の調整係数を表し、Mは、非ゼロの実数であり、×は、乗算演算子を表し、+は、加算演算子を表し、-は、減算演算子を表す、
    請求項19乃至23のうちいずれか一項に記載の装置。
  29. 前記二次チャネル信号の前記ピッチ周期インデックス値の前記上限の前記調整係数の値は、2又は3である、
    請求項28に記載の装置。
  30. 当該ステレオエンコーディング装置は、前記現在のフレームのエンコーディングレートが前もってセットされたレート閾値よりも低いステレオエンコーディングシナリオに適用され、
    前記レート閾値は、次の値:13.2キロビット毎秒(kbps)、16.4kbps、又は24.4kbps、のうちの少なくとも1つである、
    請求項19乃至29のうちいずれか一項に記載の装置。
  31. ステレオデコーディング装置であって、
    受け取られたステレオエンコードされたビットストリームに基づき、二次チャネル信号のピッチ周期に対して差動デコーディングを実行すべきかどうかを決定するよう構成される決定モジュールと、
    前記二次チャネル信号の前記ピッチ周期に対して差動デコーディングを実行すると決定される場合に、前記ステレオエンコードされたビットストリームから、現在のフレームの一次チャネル信号の推定ピッチ周期値及び前記現在のフレームの前記二次チャネル信号のピッチ周期インデックス値を取得するよう構成される値取得モジュールと、
    前記一次チャネル信号の前記推定ピッチ周期値及び前記二次チャネル信号の前記ピッチ周期インデックス値に基づき前記二次チャネル信号の前記ピッチ周期に対して差動デコーディングを実行して、前記二次チャネル信号の推定ピッチ周期値を取得するよう構成される差動デコーディングモジュールと
    を有し、前記二次チャネル信号の前記推定ピッチ周期値は、前記ステレオエンコードされたビットストリームをデコードするために使用され
    前記差動デコーディングモジュールは、
    前記一次チャネル信号の前記推定ピッチ周期値と、前記現在のフレームの前記二次チャネル信号が分割されるサブフレームの数とに基づき、前記二次チャネル信号の閉ループピッチ周期基準値を決定するよう構成される基準値決定サブモジュールと、
    前記二次チャネル信号のピッチ周期探索範囲調整係数に基づき前記二次チャネル信号の前記ピッチ周期インデックス値の上限を決定するよう構成されるインデックス値上限決定サブモジュールと、
    前記二次チャネル信号の前記閉ループピッチ周期基準値、前記二次チャネル信号の前記ピッチ周期インデックス値、及び前記二次チャネル信号の前記ピッチ周期インデックス値の前記上限に基づき、前記二次チャネル信号の前記推定ピッチ周期値を計算するよう構成される推定値計算サブモジュールと
    を有する、
    装置。
  32. 前記決定モジュールは、
    前記現在のフレームから二次チャネルピッチ周期差動エンコーディングフラグを取得し、
    前記二次チャネルピッチ周期差動エンコーディングフラグが前もってセットされた第1値である場合に、前記二次チャネル信号の前記ピッチ周期に対して差動デコーディングを実行すると決定する
    よう構成される、
    請求項31に記載の装置。
  33. 当該ステレオデコーディング装置は、独立デコーディングモジュールを更に有し、
    前記独立デコーディングモジュールは、前記二次チャネル信号の前記ピッチ周期に対して差動デコーディングを実行することをスキップし、前記一次チャネル信号の前記推定ピッチ周期値を前記二次チャネル信号の前記ピッチ周期として再利用することをスキップすると決定される場合に、前記ステレオエンコードされたビットストリームから前記二次チャネル信号の前記ピッチ周期をデコードするよう構成される、
    請求項32に記載の装置。
  34. 当該ステレオデコーディング装置は、ピッチ周期再利用モジュールを更に有し、
    前記ピッチ周期再利用モジュールは、前記二次チャネル信号の前記ピッチ周期に対して差動デコーディングを実行することをスキップし、前記一次チャネル信号の前記推定ピッチ周期値を前記二次チャネル信号の前記ピッチ周期として再利用すると決定される場合に、前記一次チャネル信号の前記推定ピッチ周期値を前記二次チャネル信号の前記ピッチ周期として使用するよう構成される、
    請求項32に記載の装置。
  35. 前記推定値計算サブモジュールは、
    次の方法:
    T0_pitch=f_pitch_prim+(soft_reuse_index-soft_reuse_index_high_limit/M)/N
    で前記二次チャネル信号の前記推定ピッチ周期値T0_pitchを計算するよう構成され、
    f_pitch_primは、前記二次チャネル信号の前記閉ループピッチ周期基準値を表し、soft_reuse_indexは、前記二次チャネル信号の前記ピッチ周期インデックス値を表し、Nは、前記二次チャネル信号が分割される前記サブフレームの数を表し、Mは、前記二次チャネル信号の前記ピッチ周期インデックス値の前記上限の調整係数を表し、Mは、非ゼロの実数であり、/は、除算演算子を表し、+は、加算演算子を表し、-は、減算演算子を表す、
    請求項31乃至34のうちいずれか一項に記載の装置。
  36. 前記二次チャネル信号の前記ピッチ周期インデックス値の前記上限の前記調整係数の値は、2又は3である、
    請求項35に記載の装置。
  37. 少なくとも1つのプロセッサを有し、
    前記少なくとも1つのプロセッサは、メモリへ結合され、該メモリ内の命令を読み出して実行して、請求項1乃至12のうちいずれか一項に記載の方法を実装する、
    ステレオエンコーディング装置。
  38. 少なくとも1つのプロセッサを有し、
    前記少なくとも1つのプロセッサは、メモリへ結合され、該メモリ内の命令を読み出して実行して、請求項13乃至18のうちいずれか一項に記載の方法を実装する、
    ステレオデコーディング装置。
  39. プログラムが記録されているコンピュータ可読記憶媒体であって、
    前記プログラムは、コンピュータで実行される場合に、前記コンピュータに、請求項1乃至18のうちいずれか一項に記載の方法を実行させる、
    コンピュータ可読記憶媒体。
  40. 媒体に記憶されたコンピュータプログラムであって、
    コンピュータに請求項1乃至18のうちいずれか一項に記載の方法を実行させるよう構成されたコンピュータプログラム。
JP2021577947A 2019-06-29 2020-06-16 ステレオエンコーディング方法及び装置、並びにステレオデコーディング方法及び装置 Active JP7337966B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201910581398.5 2019-06-29
CN201910581398.5A CN112233682B (zh) 2019-06-29 2019-06-29 一种立体声编码方法、立体声解码方法和装置
PCT/CN2020/096296 WO2021000723A1 (zh) 2019-06-29 2020-06-16 一种立体声编码方法、立体声解码方法和装置

Publications (2)

Publication Number Publication Date
JP2022539571A JP2022539571A (ja) 2022-09-12
JP7337966B2 true JP7337966B2 (ja) 2023-09-04

Family

ID=74101099

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021577947A Active JP7337966B2 (ja) 2019-06-29 2020-06-16 ステレオエンコーディング方法及び装置、並びにステレオデコーディング方法及び装置

Country Status (5)

Country Link
US (1) US20220122619A1 (ja)
EP (1) EP3975175B1 (ja)
JP (1) JP7337966B2 (ja)
CN (1) CN112233682B (ja)
WO (1) WO2021000723A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112151045B (zh) 2019-06-29 2024-06-04 华为技术有限公司 一种立体声编码方法、立体声解码方法和装置
CN115497485B (zh) * 2021-06-18 2024-10-18 华为技术有限公司 三维音频信号编码方法、装置、编码器和系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002099300A (ja) 2000-09-26 2002-04-05 Yrp Kokino Idotai Tsushin Kenkyusho:Kk 音声符号化方法及び装置
US20030191635A1 (en) 2000-09-15 2003-10-09 Minde Tor Bjorn Multi-channel signal encoding and decoding
WO2006035705A1 (ja) 2004-09-28 2006-04-06 Matsushita Electric Industrial Co., Ltd. スケーラブル符号化装置およびスケーラブル符号化方法
JP2009510514A (ja) 2005-09-27 2009-03-12 エルジー エレクトロニクス インコーポレイティド マルチチャネルオーディオ信号の符号化/復号化方法及び装置
US20110029304A1 (en) 2009-08-03 2011-02-03 Broadcom Corporation Hybrid instantaneous/differential pitch period coding
JP2018533056A (ja) 2015-09-25 2018-11-08 ヴォイスエイジ・コーポレーション ステレオ音声信号をプライマリチャンネルおよびセカンダリチャンネルに時間領域ダウンミックスするために左チャンネルと右チャンネルとの間の長期相関差を使用する方法およびシステム

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6584437B2 (en) * 2001-06-11 2003-06-24 Nokia Mobile Phones Ltd. Method and apparatus for coding successive pitch periods in speech signal
SE527670C2 (sv) * 2003-12-19 2006-05-09 Ericsson Telefon Ab L M Naturtrogenhetsoptimerad kodning med variabel ramlängd
CN101069232A (zh) * 2004-11-30 2007-11-07 松下电器产业株式会社 立体声编码装置、立体声解码装置及其方法
CN101427307B (zh) * 2005-09-27 2012-03-07 Lg电子株式会社 编码/解码多声道音频信号的方法和装置
CN101981616A (zh) * 2008-04-04 2011-02-23 松下电器产业株式会社 立体声信号变换装置、立体声信号逆变换装置及其方法
FR2966634A1 (fr) * 2010-10-22 2012-04-27 France Telecom Codage/decodage parametrique stereo ameliore pour les canaux en opposition de phase
EP3869506A1 (en) * 2014-03-28 2021-08-25 Samsung Electronics Co., Ltd. Method and device for quantization of linear prediction coefficient and method and device for inverse quantization
EP3067885A1 (en) * 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multi-channel signal
CN107731238B (zh) * 2016-08-10 2021-07-16 华为技术有限公司 多声道信号的编码方法和编码器
CN112151045B (zh) * 2019-06-29 2024-06-04 华为技术有限公司 一种立体声编码方法、立体声解码方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030191635A1 (en) 2000-09-15 2003-10-09 Minde Tor Bjorn Multi-channel signal encoding and decoding
JP2002099300A (ja) 2000-09-26 2002-04-05 Yrp Kokino Idotai Tsushin Kenkyusho:Kk 音声符号化方法及び装置
WO2006035705A1 (ja) 2004-09-28 2006-04-06 Matsushita Electric Industrial Co., Ltd. スケーラブル符号化装置およびスケーラブル符号化方法
JP2009510514A (ja) 2005-09-27 2009-03-12 エルジー エレクトロニクス インコーポレイティド マルチチャネルオーディオ信号の符号化/復号化方法及び装置
US20110029304A1 (en) 2009-08-03 2011-02-03 Broadcom Corporation Hybrid instantaneous/differential pitch period coding
JP2018533056A (ja) 2015-09-25 2018-11-08 ヴォイスエイジ・コーポレーション ステレオ音声信号をプライマリチャンネルおよびセカンダリチャンネルに時間領域ダウンミックスするために左チャンネルと右チャンネルとの間の長期相関差を使用する方法およびシステム

Also Published As

Publication number Publication date
EP3975175A4 (en) 2022-07-20
EP3975175B1 (en) 2024-07-31
WO2021000723A1 (zh) 2021-01-07
CN112233682A (zh) 2021-01-15
JP2022539571A (ja) 2022-09-12
US20220122619A1 (en) 2022-04-21
EP3975175A1 (en) 2022-03-30
CN112233682B (zh) 2024-07-16

Similar Documents

Publication Publication Date Title
JP7244609B2 (ja) ビットバジェットに応じて2サブフレームモデルと4サブフレームモデルとの間で選択を行うステレオ音声信号の左チャンネルおよび右チャンネルを符号化するための方法およびシステム
RU2608878C1 (ru) Регулировка уровня во временной области для декодирования или кодирования аудиосигналов
US11640825B2 (en) Time-domain stereo encoding and decoding method and related product
MX2013004673A (es) Codificación de señales de audio genéricas a baja tasa de bits y a retardo bajo.
US11120807B2 (en) Method for determining audio coding/decoding mode and related product
US20220122619A1 (en) Stereo Encoding Method and Apparatus, and Stereo Decoding Method and Apparatus
US11887607B2 (en) Stereo encoding method and apparatus, and stereo decoding method and apparatus
US20240153511A1 (en) Time-domain stereo encoding and decoding method and related product
US11727943B2 (en) Time-domain stereo parameter encoding method and related product
EP3806093B1 (en) Stereo signal coding and decoding method and coding and decoding apparatus
JP7123911B2 (ja) オーディオコーデックにおける長期予測のためのシステム及び方法
WO2019173195A1 (en) Signals in transform-based audio codecs

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220124

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220124

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230131

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230214

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230510

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230808

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230823

R150 Certificate of patent or registration of utility model

Ref document number: 7337966

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150