JP7088450B2 - オーディオエンコーディング及びデコーディング方法並びに関連する製品 - Google Patents

オーディオエンコーディング及びデコーディング方法並びに関連する製品 Download PDF

Info

Publication number
JP7088450B2
JP7088450B2 JP2020529337A JP2020529337A JP7088450B2 JP 7088450 B2 JP7088450 B2 JP 7088450B2 JP 2020529337 A JP2020529337 A JP 2020529337A JP 2020529337 A JP2020529337 A JP 2020529337A JP 7088450 B2 JP7088450 B2 JP 7088450B2
Authority
JP
Japan
Prior art keywords
downmix mode
current frame
switching
downmix
mode
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020529337A
Other languages
English (en)
Other versions
JP2021504759A (ja
Inventor
リ、ハイティン
ワン、ビン
ミャオ、レイ
Original Assignee
ホアウェイ・テクノロジーズ・カンパニー・リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ホアウェイ・テクノロジーズ・カンパニー・リミテッド filed Critical ホアウェイ・テクノロジーズ・カンパニー・リミテッド
Publication of JP2021504759A publication Critical patent/JP2021504759A/ja
Application granted granted Critical
Publication of JP7088450B2 publication Critical patent/JP7088450B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本願は、オーディオエンコーディング及びデコーディング技術の分野、特に、オーディオエンコーディング及びデコーディング方法並びに関連する製品に関する。
生活品質が向上するにつれて、人々は、高品質のオーディオに対する要求が高くなっている。モノラルオーディオと比較して、ステレオオーディオは、様々な音響源の方向感覚及び分散感覚があり、情報の明確性、明瞭性及び即時性の検知を向上させることができ、したがって、人々に人気がある。
並列ステレオエンコーディング/デコーディング技術は、ステレオ信号がモノラル信号及び空間認識パラメータに変換され、マルチチャネル信号が圧縮される一般的なステレオエンコーディング/デコーディング技術である。しかしながら、並列ステレオエンコーディング/デコーディング技術では、空間認識パラメータは、通常、周波数領域において抽出される必要があり、時間-周波数変換が実行される必要があるので、コーデック全体の比較的大きな遅延につながる。したがって、遅延要件が比較的厳しい場合、時間領域ステレオエンコーディング技術がより良い選択である。
従来の時間領域ステレオエンコーディング技術では、信号が時間領域において2つのモノラル信号にダウンミックスされる。例えば、MSエンコーディング技術では、まず、左側チャネル信号と右側チャネル信号が中間チャネル(Mid channel)信号及びサイドチャネル(Side channel)信号にダウンミックスされる。例えば、Lは、左側チャネル信号を表し、Rは、右側チャネル信号を表す。この場合、中間チャネル信号は、0.5×(L+R)であり、中間チャネル信号は、左側チャネルと右側チャネルとの間の相関に関する情報を表し、サイドチャネル信号は、0.5×(L-R)であり、サイドチャネル信号は、左側チャネルと右側チャネルとの間の差に関する情報を表す。中間チャネル信号及びサイドチャネル信号は、モノラルエンコーディング方法を用いて別個にエンコードされ、中間チャネル信号は、通常、より多くのビットを用いてエンコードされ、サイドチャネル信号は、通常、より少ないビットを用いてエンコードされる。
来の時間領域ステレオエンコーディング技術が用いられる場合、プライマリ信号のエネルギーが、場合により、非常に小さい又は存在すらしないことを研究及び実務において見つけた。これは、最終的なエンコーディング品質を低下させる。
本願の実施形態は、オーディオエンコーディング及びデコーディング方法及び関連する製品を提供する。
第1態様によれば、本願の実施形態は、オーディオエンコーディング方法を提供し、当該方法は、現フレームに対するチャネルの組み合わせスキームを判定する段階と、前フレームのダウンミックスモードと、現フレームに対するチャネルの組み合わせスキームとに基づいて、現フレームのエンコーディングモードを判定する段階と、現フレームのエンコーディングモードに基づいて、現フレームの左側チャネル信号及び右側チャネル信号に対して時間領域のダウンミックス処理を実行して、現フレームのプライマリチャネル信号及びセカンダリチャネル信号を取得する段階と、現フレームの取得したプライマリチャネル信号及びセカンダリチャネル信号をエンコードする段階とを含む。
現フレームのステレオ信号は、例えば、現フレームの左側チャネル信号及び右側チャネル信号を含む。
現フレームに対するチャネルの組み合わせスキームは、複数のチャネルの組み合わせスキームのうちの1つである。例えば、複数のチャネルの組み合わせスキームは、逆相関信号チャネルの組み合わせスキーム及び相関信号チャネルの組み合わせスキームを含む。相関信号チャネルの組み合わせスキームは、ほぼ同じ位相の信号に対応するチャネルの組み合わせスキームである。逆相関信号チャネルの組み合わせスキームは、ほぼ位相のずれた信号に対応するチャネルの組み合わせスキームである。
ほぼ同じ位相の信号に対応するチャネルの組み合わせスキームが、ほぼ同じ位相の信号に適用可能であり、ほぼ位相のずれた信号に対応するチャネルの組み合わせスキームが、ほぼ位相のずれた信号に適用可能であることが理解され得る。
オーディオフレーム(例えば、前フレーム又は現フレーム)のダウンミックスモードは、複数のダウンミックスモードのうちの1つである。複数のダウンミックスモードは、ダウンミックスモードA、ダウンミックスモードB、ダウンミックスモードC及びダウンミックスモードDを含む。ダウンミックスモードA及びダウンミックスモードDは、相関信号ダウンミックスモードである。ダウンミックスモードB及びダウンミックスモードCは、逆相関信号ダウンミックスモードである。オーディオフレームのダウンミックスモードA、オーディオフレームのダウンミックスモードB、オーディオフレームのダウンミックスモードC及びオーディオフレームのダウンミックスモードDは、異なるダウンミックス行列に対応する。
ダウンミックス行列はアップミックス行列に対応するので、オーディオフレームのダウンミックスモードA、オーディオフレームのダウンミックスモードB、オーディオフレームのダウンミックスモードC及びオーディオフレームのダウンミックスモードDも異なるアップミックス行列に対応することが理解され得る。
前述のエンコーディング解決手段では、前フレームのダウンミックスモードと、現フレームに対するチャネルの組み合わせスキームとに基づいて、現フレームのエンコーディングモードが判定される必要があることが理解され得る。これは、現フレームの複数の可能なエンコーディングモードがあることを示す。したがって、1つのエンコーディングモードしかない従来の解決手段と比較して、これは、複数の可能なエンコーディングモード及びダウンミックスモードと、複数の可能なシナリオとの間のより良好な互換性及びマッチングを実現するのに役立つ。
さらに、第2態様によれば、本願の実施形態は、オーディオエンコーディングモードを判定するための方法を提供する。方法は、現フレームに対するチャネルの組み合わせスキームを判定する段階と、前フレームのダウンミックスモードと、現フレームに対するチャネルの組み合わせスキームとに基づいて、現フレームのエンコーディングモードを判定する段階とを含んでよい。
現フレームのエンコーディングモードは、複数のエンコーディングモードのうちの1つである。例えば、複数のエンコーディングモードは、ダウンミックスモード切り替えエンコーディングモード及びダウンミックスモード非切り替えエンコーディングモードなどを含んでよい。
具体的には、ダウンミックスモード非切り替えエンコーディングモードは、ダウンミックスモードAからダウンミックスモードAへのエンコーディングモード、ダウンミックスモードBからダウンミックスモードBへのエンコーディングモード、ダウンミックスモードCからダウンミックスモードCへのエンコーディングモード及びダウンミックスモードDからダウンミックスモードDへのエンコーディングモードを含んでよい。
具体的には、ダウンミックスモード切り替えエンコーディングモードは、ダウンミックスモードAからダウンミックスモードBへのエンコーディングモード、ダウンミックスモードAからダウンミックスモードCへのエンコーディングモード、ダウンミックスモードBからダウンミックスモードAへのエンコーディングモード、ダウンミックスモードBからダウンミックスモードDへのエンコーディングモード、ダウンミックスモードCからダウンミックスモードAへのエンコーディングモード、ダウンミックスモードCからダウンミックスモードDへのエンコーディングモード、ダウンミックスモードDからダウンミックスモードBへのエンコーディングモード及びダウンミックスモードDからダウンミックスモードCへのエンコーディングモードを含み得る。
前フレームのダウンミックスモードと、現フレームに対するチャネルの組み合わせスキームとに基づいて、現フレームのエンコーディングモードを判定する段階は、具体的には、様々な方式で実装されてよい。
例えば、いくつかの可能な実施例において、前フレームのダウンミックスモードと、現フレームに対するチャネルの組み合わせスキームとに基づいて、現フレームのエンコーディングモードを判定する段階は、
前フレームのダウンミックスモードがダウンミックスモードAであり、かつ、現フレームに対するチャネルの組み合わせスキームが相関信号チャネルの組み合わせスキームである場合、現フレームのダウンミックスモードがダウンミックスモードAであると判定し、現フレームのエンコーディングモードがダウンミックスモードAからダウンミックスモードAへのエンコーディングモードであると判定する段階、
前フレームのダウンミックスモードがダウンミックスモードBであり、かつ、現フレームに対するチャネルの組み合わせスキームが逆相関信号チャネルの組み合わせスキームである場合、現フレームのダウンミックスモードがダウンミックスモードBであると判定し、現フレームのエンコーディングモードがダウンミックスモードBからダウンミックスモードBへのエンコーディングモードであると判定する段階、
前フレームのダウンミックスモードがダウンミックスモードCであり、かつ、現フレームに対するチャネルの組み合わせスキームが逆相関信号チャネルの組み合わせスキームである場合、現フレームのダウンミックスモードがダウンミックスモードCであると判定し、現フレームのエンコーディングモードがダウンミックスモードCからダウンミックスモードCへのエンコーディングモードであると判定する段階、又は、
前フレームのダウンミックスモードがダウンミックスモードDであり、かつ、現フレームに対するチャネルの組み合わせスキームが相関信号チャネルの組み合わせスキームである場合、現フレームのダウンミックスモードがダウンミックスモードDであると判定し、現フレームのエンコーディングモードがダウンミックスモードDからダウンミックスモードDへのエンコーディングモードであると判定する段階
を含んでよい。
別の例として、いくつかの可能な実施例では前フレームのダウンミックスモードと、現フレームに対するチャネルの組み合わせスキームとに基づいて、現フレームのエンコーディングモードを判定する段階は、前フレームのダウンミックスモードと、現フレームのダウンミックスモード切り替えのコスト値と、現フレームに対するチャネルの組み合わせスキームとに基づいて、現フレームのエンコーディングモードを判定する段階を含んでよい。
現フレームのダウンミックスモード切り替えのコスト値は、例えば、現フレームのダウンミックスモード切り替えのコスト関数に基づいて計算された計算結果であってよい(例えば、より大きな結果は、より大きな切り替えのコストを示す)。ダウンミックスモード切り替えのコスト関数は、現フレームの少なくとも1つの時間領域ステレオパラメータ、前フレームの少なくとも1つの時間領域ステレオパラメータ及び現フレームの左側チャネル信号と右側チャネル信号のうちの少なくとも1つのパラメータに基づいて構成される。
代わりに、現フレームのダウンミックスモード切り替えのコスト値は、現フレームのチャネルの組み合わせ比率係数である。
ダウンミックスモード切り替えのコスト関数は、例えば、ダウンミックスモードAからダウンミックスモードBへの切り替えに対するコスト関数、ダウンミックスモードAからダウンミックスモードCへの切り替えに対するコスト関数、ダウンミックスモードDからダウンミックスモードBへの切り替えに対するコスト関数、ダウンミックスモードDからダウンミックスモードCへの切り替えに対するコスト関数、ダウンミックスモードBからダウンミックスモードAへの切り替えに対するコスト関数、ダウンミックスモードBからダウンミックスモードDへの切り替えに対するコスト関数、ダウンミックスモードCからダウンミックスモードAへの切り替えに対するコスト関数及びダウンミックスモードCからダウンミックスモードDへの切り替えに対するコスト関数などのうちの1つの切り替えのコスト関数である。
いくつかの可能な実施例では、前フレームのダウンミックスモードと、現フレームのダウンミックスモード切り替えのコスト値と、現フレームに対するチャネルの組み合わせスキームとに基づいて、現フレームのエンコーディングモードを判定する段階は、具体的には、
前フレームのダウンミックスモードがダウンミックスモードAであり、現フレームに対するチャネルの組み合わせスキームが逆相関信号チャネルの組み合わせスキームであり、かつ、現フレームのダウンミックスモード切り替えのコスト値が第1のダウンミックスモード切り替え条件を満たす場合、現フレームのダウンミックスモードがダウンミックスモードCであり、かつ、現フレームのエンコーディングモードがダウンミックスモードAからダウンミックスモードCへのエンコーディングモードであると判定する段階であって、ダウンミックスモード切り替えのコスト値は、ダウンミックスモード切り替えのコスト関数の値であり、第1のモード切り替え条件は、現フレームのダウンミックスモードAからダウンミックスモードBへの切り替えに対するコスト関数の値が、ダウンミックスモードAからダウンミックスモードCへの切り替えに対するコスト関数の値より大きい又はこれに等しいことである、段階、
前フレームのダウンミックスモードがダウンミックスモードAであり、現フレームに対するチャネルの組み合わせスキームが逆相関信号チャネルの組み合わせスキームであり、かつ、現フレームのダウンミックスモード切り替えのコスト値が第2のダウンミックスモード切り替え条件を満たす場合、現フレームのダウンミックスモードがダウンミックスモードBであり、かつ、現フレームのエンコーディングモードがダウンミックスモードAからダウンミックスモードBへのエンコーディングモードであると判定する段階であって、ダウンミックスモード切り替えのコスト値は、ダウンミックスモード切り替えのコスト関数の値であり、第2のモード切り替え条件は、現フレームのダウンミックスモードAからダウンミックスモードBへの切り替えに対するコスト関数の値が、ダウンミックスモードAからダウンミックスモードCへの切り替えに対するコスト関数の値より小さい又はこれに等しいことである、段階、
前フレームのダウンミックスモードがダウンミックスモードBであり、現フレームに対するチャネルの組み合わせスキームが相関信号チャネルの組み合わせスキームであり、かつ、現フレームのダウンミックスモード切り替えのコスト値が第3のダウンミックスモード切り替え条件を満たす場合、現フレームのダウンミックスモードがダウンミックスモードAであり、かつ、現フレームのエンコーディングモードがダウンミックスモードBからダウンミックスモードAへのエンコーディングモードであると判定する段階であって、ダウンミックスモード切り替えのコスト値は、ダウンミックスモード切り替えのコスト関数の値であり、第3のモード切り替え条件は、現フレームのダウンミックスモードBからダウンミックスモードAへの切り替えに対するコスト関数の値が、ダウンミックスモードBからダウンミックスモードDへの切り替えに対するコスト関数の値より小さい又はこれに等しいことである、段階と、
前フレームのダウンミックスモードがダウンミックスモードBであり、現フレームに対するチャネルの組み合わせスキームが相関信号チャネルの組み合わせスキームであり、かつ、現フレームのダウンミックスモード切り替えのコスト値が第4のダウンミックスモード切り替え条件を満たす場合、現フレームのダウンミックスモードがダウンミックスモードDであり、かつ、現フレームのエンコーディングモードがダウンミックスモードBからダウンミックスモードDへのエンコーディングモードであると判定する段階であって、ダウンミックスモード切り替えのコスト値は、ダウンミックスモード切り替えのコスト関数の値であり、第4のモード切り替え条件は、現フレームのダウンミックスモードBからダウンミックスモードAへの切り替えに対するコスト関数の値が、ダウンミックスモードBからダウンミックスモードDへの切り替えに対するコスト関数の値より大きい又はこれに等しいことである、段階、
前フレームのダウンミックスモードがダウンミックスモードCであり、現フレームに対するチャネルの組み合わせスキームが相関信号チャネルの組み合わせスキームであり、かつ、現フレームのダウンミックスモード切り替えのコスト値が第5のダウンミックスモード切り替え条件を満たす場合、現フレームのダウンミックスモードがダウンミックスモードDであり、かつ、現フレームのエンコーディングモードがダウンミックスモードCからダウンミックスモードDへのエンコーディングモードであると判定する段階であって、ダウンミックスモード切り替えのコスト値は、ダウンミックスモード切り替えのコスト関数の値であり、第5のモード切り替え条件は、現フレームのダウンミックスモードCからダウンミックスモードAへの切り替えに対するコスト関数の値が、ダウンミックスモードCからダウンミックスモードDへの切り替えに対するコスト関数の値より大きい又はこれに等しいことである、段階、
前フレームのダウンミックスモードがダウンミックスモードCであり、現フレームに対するチャネルの組み合わせスキームが相関信号チャネルの組み合わせスキームであり、かつ、現フレームのダウンミックスモード切り替えのコスト値が第6のダウンミックスモード切り替え条件を満たす場合、現フレームのダウンミックスモードがダウンミックスモードAであり、かつ、現フレームのエンコーディングモードがダウンミックスモードCからダウンミックスモードAへのエンコーディングモードであると判定する段階であって、ダウンミックスモード切り替えのコスト値は、ダウンミックスモード切り替えのコスト関数の値であり、第6のモード切り替え条件は、現フレームのダウンミックスモードCからダウンミックスモードAへの切り替えに対するコスト関数の値が、ダウンミックスモードCからダウンミックスモードDへの切り替えに対するコスト関数の値より小さい又はこれに等しいことである、段階、
前フレームのダウンミックスモードがダウンミックスモードDであり、現フレームに対するチャネルの組み合わせスキームが逆相関信号チャネルの組み合わせスキームであり、かつ、現フレームのダウンミックスモード切り替えのコスト値が第7のダウンミックスモード切り替え条件を満たす場合、現フレームのダウンミックスモードがダウンミックスモードBであり、かつ、現フレームのエンコーディングモードがダウンミックスモードDからダウンミックスモードBへのエンコーディングモードであると判定する段階であって、ダウンミックスモード切り替えのコスト値は、ダウンミックスモード切り替えのコスト関数の値であり、第7のモード切り替え条件は、現フレームのダウンミックスモードDからダウンミックスモードBへの切り替えに対するコスト関数の値が、ダウンミックスモードDからダウンミックスモードCへの切り替えに対するコスト関数の値より小さい又はこれに等しいことである、段階、又は、
前フレームのダウンミックスモードがダウンミックスモードDであり、現フレームに対するチャネルの組み合わせスキームが逆相関信号チャネルの組み合わせスキームであり、かつ、現フレームのダウンミックスモード切り替えのコスト値が第8のダウンミックスモード切り替え条件を満たす場合、現フレームのダウンミックスモードがダウンミックスモードCであり、かつ、現フレームのエンコーディングモードがダウンミックスモードDからダウンミックスモードCへのエンコーディングモードであると判定する段階であって、ダウンミックスモード切り替えのコスト値は、ダウンミックスモード切り替えのコスト関数の値であり、第8のモード切り替え条件は、現フレームのダウンミックスモードDからダウンミックスモードBへの切り替えに対するコスト関数の値が、ダウンミックスモードDからダウンミックスモードCへの切り替えに対するコスト関数の値より大きい又はこれに等しいことである、段階
を含んでよい。
いくつかの他の可能な実施例において、前フレームのダウンミックスモードと、現フレームのダウンミックスモード切り替えのコスト値と、現フレームに対するチャネルの組み合わせスキームとに基づいて現フレームのエンコーディングモードを判定する段階は、例えば、
前フレームのダウンミックスモードがダウンミックスモードAであり、現フレームに対するチャネルの組み合わせスキームが逆相関信号チャネルの組み合わせスキームであり、かつ、現フレームのダウンミックスモード切り替えのコスト値が第9のダウンミックスモード切り替え条件を満たす場合、現フレームのダウンミックスモードがダウンミックスモードCであり、かつ、現フレームのエンコーディングモードがダウンミックスモードAからダウンミックスモードCへのエンコーディングモードであると判定する段階であって、現フレームのダウンミックスモード切り替えのコスト値は、現フレームのチャネルの組み合わせ比率係数であり、第9のモード切り替え条件は、現フレームのチャネルの組み合わせ比率係数が、チャネルの組み合わせ比率係数の閾値S1より小さい又はこれに等しいことである、段階、
前フレームのダウンミックスモードがダウンミックスモードAであり、現フレームに対するチャネルの組み合わせスキームが逆相関信号チャネルの組み合わせスキームであり、かつ、現フレームのダウンミックスモード切り替えのコスト値が第10のダウンミックスモード切り替え条件を満たす場合、現フレームのダウンミックスモードがダウンミックスモードBであり、かつ、現フレームのエンコーディングモードがダウンミックスモードAからダウンミックスモードBへのエンコーディングモードであると判定する段階であって、現フレームのダウンミックスモード切り替えのコスト値は、現フレームのチャネルの組み合わせ比率係数であり、第10のモード切り替え条件は、現フレームのチャネルの組み合わせ比率係数が、チャネルの組み合わせ比率係数の閾値S1より大きい又はこれに等しいことである、段階、
前フレームのダウンミックスモードがダウンミックスモードBであり、現フレームに対するチャネルの組み合わせスキームが相関信号チャネルの組み合わせスキームであり、かつ、現フレームのダウンミックスモード切り替えのコスト値が第11のダウンミックスモード切り替え条件を満たす場合、現フレームのダウンミックスモードがダウンミックスモードAであり、かつ、現フレームのエンコーディングモードがダウンミックスモードBからダウンミックスモードAへのエンコーディングモードであると判定する段階であって、現フレームのダウンミックスモード切り替えのコスト値は、現フレームのチャネルの組み合わせ比率係数であり、第11のモード切り替え条件は、現フレームのチャネルの組み合わせ比率係数が、チャネルの組み合わせ比率係数の閾値S2より大きい又はこれに等しいことである、段階、
前フレームのダウンミックスモードがダウンミックスモードBであり、現フレームに対するチャネルの組み合わせスキームが相関信号チャネルの組み合わせスキームであり、かつ、現フレームのダウンミックスモード切り替えのコスト値が第12のダウンミックスモード切り替え条件を満たす場合、現フレームのダウンミックスモードがダウンミックスモードDであり、かつ、現フレームのエンコーディングモードがダウンミックスモードBからダウンミックスモードDへのエンコーディングモードであると判定する段階であって、現フレームのダウンミックスモード切り替えのコスト値は、現フレームのチャネルの組み合わせ比率係数であり、第12のモード切り替え条件は、現フレームのチャネルの組み合わせ比率係数が、チャネルの組み合わせ比率係数の閾値S2より小さい又はこれに等しいことである、段階、
前フレームのダウンミックスモードがダウンミックスモードCであり、現フレームに対するチャネルの組み合わせスキームが相関信号チャネルの組み合わせスキームであり、かつ、現フレームのダウンミックスモード切り替えのコスト値が第13のダウンミックスモード切り替え条件を満たす場合、現フレームのダウンミックスモードがダウンミックスモードDであり、かつ、現フレームのエンコーディングモードがダウンミックスモードCからダウンミックスモードDへのエンコーディングモードであると判定する段階であって、現フレームのダウンミックスモード切り替えのコスト値は、現フレームのチャネルの組み合わせ比率係数であり、第13のモード切り替え条件は、現フレームのチャネルの組み合わせ比率係数が、チャネルの組み合わせ比率係数の閾値S3より大きい又はこれに等しいことである、段階、
前フレームのダウンミックスモードがダウンミックスモードCであり、現フレームに対するチャネルの組み合わせスキームが相関信号チャネルの組み合わせスキームであり、かつ、現フレームのダウンミックスモード切り替えのコスト値が第14のダウンミックスモード切り替え条件を満たす場合、現フレームのダウンミックスモードがダウンミックスモードAであり、かつ、現フレームのエンコーディングモードがダウンミックスモードCからダウンミックスモードAへのエンコーディングモードであると判定する段階であって、現フレームのダウンミックスモード切り替えのコスト値は、現フレームのチャネルの組み合わせ比率係数であり、第14のモード切り替え条件は、現フレームのチャネルの組み合わせ比率係数が、チャネルの組み合わせ比率係数の閾値S3より小さい又はこれに等しいことである、段階、
前フレームのダウンミックスモードがダウンミックスモードDであり、現フレームに対するチャネルの組み合わせスキームが逆相関信号チャネルの組み合わせスキームであり、かつ、現フレームのダウンミックスモード切り替えのコスト値が第15のダウンミックスモード切り替え条件を満たす場合、現フレームのダウンミックスモードがダウンミックスモードBであり、かつ、現フレームのエンコーディングモードがダウンミックスモードDからダウンミックスモードBへのエンコーディングモードであると判定する段階であって、現フレームのダウンミックスモード切り替えのコスト値は、現フレームのチャネルの組み合わせ比率係数であり、第15のモード切り替え条件は、現フレームのチャネルの組み合わせ比率係数が、チャネルの組み合わせ比率係数の閾値S4より小さい又はこれに等しいことである、段階、又は、
前フレームのダウンミックスモードがダウンミックスモードDであり、現フレームに対するチャネルの組み合わせスキームが逆相関信号チャネルの組み合わせスキームであり、かつ、現フレームのダウンミックスモード切り替えのコスト値が第16のダウンミックスモード切り替え条件を満たす場合、現フレームのダウンミックスモードがダウンミックスモードCであり、かつ、現フレームのエンコーディングモードがダウンミックスモードDからダウンミックスモードCへのエンコーディングモードであると判定する段階であって、現フレームのダウンミックスモード切り替えのコスト値は、現フレームのチャネルの組み合わせ比率係数であり、第16のモード切り替え条件は、現フレームのチャネルの組み合わせ比率係数が、チャネルの組み合わせ比率係数の閾値S4より大きい又はこれに等しいことである、段階
を含んでよい。
現フレームのダウンミックスモードが前フレームのダウンミックスモードとは異なっている場合、現フレームのエンコーディングモードが、例えば、ダウンミックスモード切り替えエンコーディングモードであり得ると判定されてよい。この場合、現フレームのダウンミックスモードと、前フレームのダウンミックスモードとに基づいて、現フレームの左側チャネル信号及び右側チャネル信号に対して、セグメント化された時間領域のダウンミックス処理が実行されてよい。
現フレームの左側チャネル信号と右側チャネル信号に対して、セグメント化された時間領域のダウンミックス処理を実行するメカニズムは、現フレームに対するチャネルの組み合わせスキームが前フレームに対するチャネルの組み合わせスキームとは異なっている場合に導入される。セグメント化された時間領域のダウンミックス処理メカニズムは、チャネルの組み合わせスキームの円滑な移行を実施するのに役立つので、エンコーディング品質を向上させるのに役立つ。
いくつかの可能な実施例では、現フレームに対するチャネルの組み合わせスキームを判定する段階は、現フレームの左側チャネル信号及び右側チャネル信号を用いて、現フレームのステレオ信号のほぼ同じ位相の信号/ほぼ位相のずれた信号タイプを判定する段階と、現フレームのステレオ信号のほぼ同じ位相の信号/ほぼ位相のずれた信号タイプと、前フレームに対するチャネルの組み合わせスキームとに基づいて、現フレームに対するチャネルの組み合わせスキームを判定する段階を含んでよい。現フレームのステレオ信号のほぼ同じ位相の信号/ほぼ位相のずれた信号タイプは、ほぼ同じ位相の信号又はほぼ位相のずれた信号であってよい。現フレームのステレオ信号のほぼ同じ位相の信号/ほぼ位相のずれた信号タイプは、現フレームのほぼ同じ位相の信号/ほぼ位相のずれた信号タイプの識別子を用いて示されてよい。具体的には、例えば、現フレームのほぼ同じ位相の信号/ほぼ位相のずれた信号タイプの識別子の値が「1」である場合、現フレームのステレオ信号のほぼ同じ位相の信号/ほぼ位相のずれた信号タイプがほぼ同じ位相の信号である、又は、現フレームのほぼ同じ位相の信号/ほぼ位相のずれた信号タイプの識別子の値が「0」である場合、現フレームのステレオ信号のほぼ同じ位相の信号/ほぼ位相のずれた信号タイプがほぼ位相のずれた信号であり、逆もまた同様である。
オーディオフレーム(例えば、前フレーム又は現フレーム)に対するチャネルの組み合わせスキームは、オーディオフレームのチャネルの組み合わせスキーム識別子を用いて示されてよい。具体的には、例えば、オーディオフレームのチャネルの組み合わせスキーム識別子の値が「0」である場合、オーディオフレームに対するチャネルの組み合わせスキームが相関信号チャネルの組み合わせスキームであり、オーディオフレームのチャネルの組み合わせスキーム識別子の値が「1」である場合、それは、オーディオフレームに対するチャネルの組み合わせスキームが逆相関信号チャネルの組み合わせスキームであり、逆もまた同様である。
現フレームの左側チャネル信号及び右側チャネル信号を用いて、現フレームのステレオ信号のほぼ同じ位相の信号/ほぼ位相のずれた信号タイプを判定する段階は、現フレームの左側チャネル信号と右側チャネル信号との間の相関の値xorrを計算する段階と、xorrが第1閾値より小さい又はこれに等しい場合、現フレームのステレオ信号のほぼ同じ位相の信号/ほぼ位相のずれた信号タイプがほぼ同じ位相の信号であると判定する段階と、xorrが第1閾値より大きい場合、現フレームのステレオ信号のほぼ同じ位相の信号/ほぼ位相のずれた信号タイプがほぼ位相のずれた信号であると判定する段階とを含んでよい。さらに、現フレームのほぼ同じ位相の信号/ほぼ位相のずれた信号タイプの識別子が、現フレームのステレオ信号のほぼ同じ位相の信号/ほぼ位相のずれた信号タイプを示すために用いられる場合、現フレームのステレオ信号のほぼ同じ位相の信号/ほぼ位相のずれた信号タイプがほぼ同じ位相の信号であると判定されたときに、現フレームのほぼ同じ位相の信号/ほぼ位相のずれた信号タイプの識別子の値は、現フレームのステレオ信号のほぼ同じ位相の信号/ほぼ位相のずれた信号タイプがほぼ同じ位相の信号であることを示すように設定されてよい、又は、現フレームのほぼ同じ位相の信号/ほぼ位相のずれた信号タイプがほ位相のずれた信号であると判定された場合、現フレームのほぼ同じ位相の信号/ほぼ位相のずれた信号タイプの識別子の値は、現フレームのステレオ信号のほぼ同じ位相の信号/ほぼ位相のずれた信号タイプがほぼ位相のずれた信号であることを示すように設定されてよい。
具体的には、例えば、オーディオフレーム(例えば、前フレーム又は現フレーム)のほぼ同じ位相の信号/ほぼ位相のずれた信号タイプの識別子の値が「0」である場合、オーディオフレームのステレオ信号のほぼ同じ位相の信号/ほぼ位相のずれた信号タイプがほぼ同じ位相の信号である、又は、オーディオフレーム(例えば、前フレーム又は現フレーム)のほぼ同じ位相の信号/ほぼ位相のずれた信号タイプの識別子の値が「1」である場合、オーディオフレームのステレオ信号のほぼ同じ位相の信号/ほぼ位相のずれた信号タイプがほぼ位相のずれた信号である、などである。
現フレームのステレオ信号のほぼ同じ位相の信号/ほぼ位相のずれた信号タイプと、前フレームに対するチャネルの組み合わせスキームとに基づいて、現フレームに対するチャネルの組み合わせスキームを判定する段階は、例えば、
現フレームのステレオ信号のほぼ同じ位相の信号/ほぼ位相のずれた信号タイプがほぼ同じ位相の信号であり、かつ、前フレームに対するチャネルの組み合わせスキームが相関信号チャネルの組み合わせスキームである場合、現フレームに対するチャネルの組み合わせスキームが相関信号チャネルの組み合わせスキームであると判定する段階、又は、現フレームのステレオ信号のほぼ同じ位相の信号/ほぼ位相のずれた信号タイプがほぼ位相のずれた信号であり、かつ、前フレームに対するチャネルの組み合わせスキームが逆相関信号チャネルの組み合わせスキームである場合、現フレームに対するチャネルの組み合わせスキームが逆相関信号チャネルの組み合わせスキームであると判定する段階、
現フレームのステレオ信号のほぼ同じ位相の信号/ほぼ位相のずれた信号タイプがほぼ同じ位相の信号であり、かつ、前フレームに対するチャネルの組み合わせスキームが逆相関信号チャネルの組み合わせスキームである場合、現フレームの左側チャネル信号と右側チャネル信号の信号対雑音比が両方とも第2の閾値より小さい場合、現フレームに対するチャネルの組み合わせスキームが相関信号チャネルの組み合わせスキームであると判定する段階、又は、現フレームの左側チャネル信号の信号対雑音比及び/又は右側チャネル信号の信号対雑音比が第2閾値より大きい又はこれに等しい場合、現フレームに対するチャネルの組み合わせスキームが逆相関信号チャネルの組み合わせスキームであると判定する段階、又は、
現フレームのステレオ信号のほぼ同じ位相の信号/ほぼ位相のずれた信号タイプがほぼ位相のずれた信号であり、かつ、前フレームに対するチャネルの組み合わせスキームが相関信号チャネルの組み合わせスキームである場合、現フレームの左側チャネル信号及び右側チャネル信号の信号対雑音比が両方とも第2閾値より小さい又はこれに等しい場合、現フレームに対するチャネルの組み合わせスキームが逆相関信号チャネルの組み合わせスキームであると判定する段階、又は、現フレームの左側チャネル信号の信号対雑音比及び/又は右側チャネル信号の信号対雑音比が第2閾値より大きい又はこれに等しい場合、現フレームに対するチャネルの組み合わせスキームが相関信号チャネルの組み合わせスキームであると判定する段階
を含んでよい。
第3態様によれば、本願の実施形態は、オーディオデコーディング方法をさらに提供し、当該方法は、ビットストリームに基づいてデコーディングを実行して、現フレームのデコーディングされたプライマリチャネル信号及びセカンダリチャネル信号を取得する段階と、ビットストリームに基づいてデコーディングを実行して、現フレームのダウンミックスモードを判定する段階と、前フレームのダウンミックスモードと、現フレームのダウンミックスモードとに基づいて、現フレームのエンコーディングモードを判定する段階と、現フレームのエンコーディングモードに基づいて、現フレームのデコーディングされたプライマリチャネル信号及びセカンダリチャネル信号に対して時間領域のアップミックス処理を実行して、現フレームの再構築された左側チャネル信号及び右側チャネル信号を取得する段階とを含む。
現フレームに対するチャネルの組み合わせスキームは、複数のチャネルの組み合わせスキームのうちの1つである。例えば、複数のチャネルの組み合わせスキームは、逆相関信号チャネルの組み合わせスキーム及び相関信号チャネルの組み合わせスキームを含む。相関信号チャネルの組み合わせスキームは、ほぼ同じ位相の信号に対応するチャネルの組み合わせスキームである。逆相関信号チャネルの組み合わせスキームは、ほぼ位相のずれた信号に対応するチャネルの組み合わせスキームである。ほぼ同じ位相の信号に対応するチャネルの組み合わせスキームが、ほぼ同じ位相の信号に適用可能であり、ほぼ位相のずれた信号に対応するチャネルの組み合わせスキームが、ほぼ位相のずれた信号に適用可能であることが理解され得る。
時間領域のダウンミックスが時間領域のアップミックスに対応し、エンコードがデコーディングに対応しているので、時間領域のアップミックス処理(時間領域のアップミックス処理に用いられるアップミックス行列は、時間領域のダウンミックスのためにエンコーディング装置により用いられるダウンミックス行列に対応する)が、現フレームのエンコーディングモードに基づいて、現フレームのデコーディングされたプライマリチャネル信号及びセカンダリチャネル信号に対して実行されることで、現フレームの再構築された左側チャネル信号及び右側チャネル信号を取得し得ることが理解され得る。
いくつかの可能な実施例において、前フレームのダウンミックスモードと、現フレームのダウンミックスモードとに基づいて、現フレームのエンコーディングモードを判定する段階は、前フレームのダウンミックスモードがダウンミックスモードAであり、かつ、現フレームのダウンミックスモードがダウンミックスモードAである場合、現フレームのエンコーディングモードがダウンミックスモードAからダウンミックスモードAへのエンコーディングモードであると判定する段階、
前フレームのダウンミックスモードがダウンミックスモードAであり、かつ、現フレームのダウンミックスモードがダウンミックスモードBである場合、現フレームのエンコーディングモードがダウンミックスモードAからダウンミックスモードBへのエンコーディングモードであると判定する段階、
前フレームのダウンミックスモードがダウンミックスモードAであり、かつ、現フレームのダウンミックスモードがダウンミックスモードCである場合、現フレームのエンコーディングモードがダウンミックスモードAからダウンミックスモードCへのエンコーディングモードであると判定する段階、
前フレームのダウンミックスモードがダウンミックスモードBであり、かつ、現フレームのダウンミックスモードがダウンミックスモードBである場合、現フレームのエンコーディングモードがダウンミックスモードBからダウンミックスモードBへのエンコーディングモードであると判定する段階、
前フレームのダウンミックスモードがダウンミックスモードBであり、かつ、現フレームのダウンミックスモードがダウンミックスモードAである場合、現フレームのエンコーディングモードがダウンミックスモードBからダウンミックスモードAへのエンコーディングモードであると判定する段階、
前フレームのダウンミックスモードがダウンミックスモードBであり、かつ、現フレームのダウンミックスモードがダウンミックスモードDである場合、現フレームのエンコーディングモードがダウンミックスモードBからダウンミックスモードDへのエンコーディングモードであると判定する段階、
前フレームのダウンミックスモードがダウンミックスモードCであり、かつ、現フレームのダウンミックスモードがダウンミックスモードCである場合、現フレームのエンコーディングモードがダウンミックスモードCからダウンミックスモードCへのエンコーディングモードであると判定する段階、
前フレームのダウンミックスモードがダウンミックスモードCであり、かつ、現フレームのダウンミックスモードがダウンミックスモードAである場合、現フレームのエンコーディングモードがダウンミックスモードCからダウンミックスモードAへのエンコーディングモードであると判定する段階、
前フレームのダウンミックスモードがダウンミックスモードCであり、かつ、現フレームのダウンミックスモードがダウンミックスモードDである場合、現フレームのエンコーディングモードがダウンミックスモードCからダウンミックスモードDへのエンコーディングモードであると判定する段階、
前フレームのダウンミックスモードがダウンミックスモードDであり、かつ、現フレームのダウンミックスモードがダウンミックスモードDである場合、現フレームのエンコーディングモードがダウンミックスモードDからダウンミックスモードDへのエンコーディングモードであると判定する段階、
前フレームのダウンミックスモードがダウンミックスモードDであり、かつ、現フレームのダウンミックスモードがダウンミックスモードCである場合、現フレームのエンコーディングモードがダウンミックスモードDからダウンミックスモードCへのエンコーディングモードであると判定する段階、又は、
前フレームのダウンミックスモードがダウンミックスモードDであり、かつ、現フレームのダウンミックスモードがダウンミックスモードBである場合、現フレームのエンコーディングモードがダウンミックスモードDからダウンミックスモードBへのエンコーディングモードであると判定する段階
を含んでよい。
前述のデコーディング解決手段では、前フレームのダウンミックスモードと、現フレームのダウンミックスモードに基づいて、現フレームのエンコーディングモードが判定される必要があることが理解され得る。これは、現フレームの複数の可能なエンコーディングモードがあること示す。1つのエンコーディングモードしかない従来の解決手段と比較して、複数の可能なエンコーディングモード及びダウンミックスモードと、複数の可能なシナリオとの間のより良好な互換性及びマッチングを実現するのに役立つ。
第4態様によれば、本願の実施形態は、オーディオエンコーディングモードを判定するための方法をさらに提供し、当該方法は、ビットストリームに基づいてデコーディングを実行して、現フレームのデコーディングされたプライマリチャネル信号及びセカンダリチャネル信号を取得する段階と、ビットストリームに基づいてデコーディングを実行して、現フレームのダウンミックスモードを判定する段階と、前フレームのダウンミックスモードと、現フレームのダウンミックスモードとに基づいて、現フレームのエンコーディングモードを判定する段階とを含む。
以下では、例を用いて、様々なダウンミックスモード切り替えのコスト関数を説明する。実際の適用では、切り替えのコスト関数は、具体的には、様々な方式で構成されてよいが、必ずしも、以下の例示的な形態に限定されるわけではない。
例えば、現フレームのダウンミックスモードAからダウンミックスモードBへの切り替えに対するコスト関数は、
Figure 0007088450000001
であってよく、
α2_pre=1-α1_pre
α=1-α
であり、Cost_ABは、ダウンミックスモードAからダウンミックスモードBへの切り替えに対するコスト関数の値を表し、start_sample_Aは、ダウンミックスモードAからダウンミックスモードBへの切り替えに対するコスト関数の計算開始サンプリングポイントを表し、end_sample_Aは、ダウンミックスモードAからダウンミックスモードBへの切り替えに対するコスト関数の計算終了サンプリングポイントを表し、start_sample_Aは、0より大きく、かつ、N-1より小さい整数であり、end_sample_Aは、0より大きく、かつ、N-1より小さい整数であり、start_sample_Aは、end_sample_Aより小さく、
例えば、end_sample_A-start_sample_Aの値の範囲は、[60、200]であってよく、例えば、end_sample_A-start_sample_Aは、60、69、80、100、120、150、180、191、200又は別の値に等しく、
nは、サンプリングポイントのシーケンス番号を表し、Nはフレームの長さを表し、
(n)は、現フレームの左側チャネル信号を表し、X(n)は、現フレームの右側チャネル信号を表し、
α=ratio_SMであり、ratio_SMは、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表し、
α1_pre=tdm_last_ratioであり、tdm_last_ratioは、前フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表す。
別の例として、現フレームのダウンミックスモードAからダウンミックスモードCへの切り替えに対するコスト関数は、
Figure 0007088450000002
であってよく、
α2_pre=1-α1_pre
α=1-α
であり、Cost_ACは、ダウンミックスモードAからダウンミックスモードCへの切り替えに対するコスト関数の値を表し、start_sample_Aは、ダウンミックスモードAからダウンミックスモードCへの切り替えに対するコスト関数の計算開始サンプリングポイントを表し、end_sample_Aは、ダウンミックスモードAからダウンミックスモードCへの切り替えに対するコスト関数の計算終了サンプリングポイントを表し、start_sample_Aは、0より大きく、かつ、N-1より小さい整数であり、end_sample_Aは、0より大きく、かつ、N-1より小さい整数であり、start_sample_Aは、end_sample_Aより小さく、
nは、サンプリングポイントのシーケンス番号を表し、Nはフレームの長さを表し、
(n)は、現フレームの左側チャネル信号を表し、X(n)は、現フレームの右側チャネル信号を表し、
α=ratio_SMであり、ratio_SMは、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表し、
α1_pre=tdm_last_ratioであり、tdm_last_ratioは、前フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表す。
別の例として、現フレームのダウンミックスモードBからダウンミックスモードAへの切り替えに対するコスト関数は、
Figure 0007088450000003
であってよく、
α2_pre=1-α1_pre
α=1-α
であり、Cost_BAは、ダウンミックスモードBからダウンミックスモードAへの切り替えに対するコスト関数の値を表し、start_sample_Bは、ダウンミックスモードBからダウンミックスモードAへの切り替えに対するコスト関数の計算開始サンプリングポイントを表し、end_sample_Bは、ダウンミックスモードBからダウンミックスモードAへの切り替えに対するコスト関数の計算終了サンプリングポイントを表し、start_sample_Bは、0より大きく、かつ、N-1より小さい整数であり、end_sample_Bは、0より大きく、かつ、N-1より小さい整数であり、start_sample_Bは、end_sample_Bより小さく、
例えば、end_sample_B-start_sample_Bの値の範囲は、[60、200]であってよく、例えば、end_sample_B-start_sample_Bは、60、67、80、100、120、150、180、191、200又は別の値に等しく、
nは、サンプリングポイントのシーケンス番号を表し、Nはフレームの長さを表し、
(n)は、現フレームの左側チャネル信号を表し、X(n)は、現フレームの右側チャネル信号を表し、
α=ratioであり、ratioは、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表し、
α1_pre=tdm_last_ratioであり、tdm_last_ratio_SMは、前フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表す。
別の例として、現フレームのダウンミックスモードBからダウンミックスモードDへの切り替えに対するコスト関数は、
Figure 0007088450000004
であってよく、
α2_pre=1-α1_pre
α=1-α
であり、Cost_BDは、ダウンミックスモードBからダウンミックスモードDへの切り替えに対するコスト関数の値を表し、start_sample_Bは、ダウンミックスモードBからダウンミックスモードDへの切り替えに対するコスト関数の計算開始サンプリングポイントを表し、end_sample_Bは、ダウンミックスモードBからダウンミックスモードDへの切り替えに対するコスト関数の計算終了サンプリングポイントを表し、start_sample_Bは、0より大きく、かつ、N-1より小さい整数であり、end_sample_Bは、0より大きく、かつ、N-1より小さい整数であり、start_sample_Bは、end_sample_Bより小さく、
例えば、end_sample_B-start_sample_Bの値の範囲は、[60、200]であってよく、例えば、end_sample_B-start_sample_Bは、60、67、80、100、120、150、180、191、200又は別の値に等しく、
nは、サンプリングポイントのシーケンス番号を表し、Nはフレームの長さを表し
(n)は、現フレームの左側チャネル信号を表し、X(n)は、現フレームの右側チャネル信号を表し、
α=ratioであり、ratioは、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表し、
α1_pre=tdm_last_ratioであり、tdm_last_ratio_SMは、前フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表す。
別の例として、現フレームのダウンミックスモードCからダウンミックスモードDへの切り替えに対するコスト関数は、
Figure 0007088450000005
であってよく、
α2_pre=1-α1_pre
α=1-α
であり、Cost_CDは、ダウンミックスモードCからダウンミックスモードDへの切り替えに対するコスト関数の値を表し、start_sample_Cは、ダウンミックスモードCからダウンミックスモードDへの切り替えに対するコスト関数の計算開始サンプリングポイントを表し、end_sample_Cは、ダウンミックスモードCからダウンミックスモードDへの切り替えに対するコスト関数の計算終了サンプリングポイントを表し、start_sample_Cは、0より大きく、かつ、N-1より小さい整数であり、end_sample_Cは、0より大きく、かつ、N-1より小さい整数であり、start_sample_Cは、end_sample_Cより小さく、
例えば、end_sample_C-start_sample_Cの値の範囲は、[60、200]であってよく、例えば、end_sample_C-start_sample_Cは、60、71、80、100、120、150、180、191、200又は別の値に等しく、
nは、サンプリングポイントのシーケンス番号を表し、Nはフレームの長さを表し、
(n)は、現フレームの左側チャネル信号を表し、X(n)は、現フレームの右側チャネル信号を表し、
α=ratioであり、ratioは、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表し、
α1_pre=tdm_last_ratioであり、tdm_last_ratio_SMは、前フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表す。
別の例として、現フレームのダウンミックスモードCからダウンミックスモードAへの切り替えに対するコスト関数は、
Figure 0007088450000006
であってよく、
α2_pre=1-α1_pre
α=1-α
であり、Cost_CAは、ダウンミックスモードCからダウンミックスモードAへの切り替えに対するコスト関数の値を表し、start_sample_Cは、ダウンミックスモードCからダウンミックスモードAへの切り替えに対するコスト関数の計算開始サンプリングポイントを表し、end_sample_Cは、ダウンミックスモードCからダウンミックスモードAへの切り替えに対するコスト関数の計算終了サンプリングポイントを表し、start_sample_Cは、0より大きく、かつ、N-1より小さい整数であり、end_sample_Cは、0より大きく、かつ、N-1より小さい整数であり、start_sample_Cは、end_sample_Cより小さく、
例えば、end_sample_C-start_sample_Cの値の範囲は、[60、200]であってよく、例えば、end_sample_C-start_sample_Cは、60、71、80、100、120、150、180、191、200又は別の値に等しく、
nは、サンプリングポイントのシーケンス番号を表し、Nはフレームの長さを表し、
(n)は、現フレームの左側チャネル信号を表し、X(n)は、現フレームの右側チャネル信号を表し、
α=ratioであり、ratioは、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表し、
α1_pre=tdm_last_ratioであり、tdm_last_ratio_SMは、前フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表す。
別の例として、現フレームのダウンミックスモードDからダウンミックスモードCへの切り替えに対するコスト関数は、
Figure 0007088450000007
であってよく、
α2_pre=1-α1_pre
α=1-α
であり、Cost_DCは、ダウンミックスモードDからダウンミックスモードCへの切り替えに対するコスト関数の値を表し、start_sample_Dは、ダウンミックスモードDからダウンミックスモードCへの切り替えに対するコスト関数の計算開始サンプリングポイントを表し、end_sample_Dは、ダウンミックスモードDからダウンミックスモードCへの切り替えに対するコスト関数の計算終了サンプリングポイントを表し、start_sample_Dは、0より大きく、かつ、N-1より小さい整数であり、end_sample_Dは、0より大きく、かつ、N-1より小さい整数であり、start_sample_Dは、end_sample_Dより小さく、
例えば、end_sample_D-start_sample_Dの値の範囲は、[60、200]であってよく、例えば、end_sample_D-start_sample_Dは、60、73、80、100、120、150、180、191、200又は別の値に等しく、
nは、サンプリングポイントのシーケンス番号を表し、Nはフレームの長さを表し、
(n)は、現フレームの左側チャネル信号を表し、X(n)は、現フレームの右側チャネル信号を表し、
α=ratio_SMであり、ratio_SMは、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表し、
α1_pre=tdm_last_ratioであり、tdm_last_ratioは、前フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表す。
別の例として、現フレームのダウンミックスモードDからダウンミックスモードBへの切り替えに対するコスト関数は、
Figure 0007088450000008
であり、 α2_pre=1-α1_pre
α=1-α
であり、Cost_DBは、ダウンミックスモードDからダウンミックスモードBへの切り替えに対するコスト関数の値を表し、start_sample_Dは、ダウンミックスモードDからダウンミックスモードBへの切り替えに対するコスト関数の計算開始サンプリングポイントを表し、end_sample_Dは、ダウンミックスモードDからダウンミックスモードBへの切り替えに対するコスト関数の計算終了サンプリングポイントを表し、start_sample_Dは、0より大きく、かつ、N-1より小さい整数であり、end_sample_Dは、0より大きく、かつ、N-1より小さい整数であり、start_sample_Dは、end_sample_Dより小さく、
例えば、end_sample_D-start_sample_Dの値の範囲は、[60、200]であってよく、例えば、end_sample_D-start_sample_Dは、60、73、80、100、120、150、180、191、200又は別の値に等しく、
nは、サンプリングポイントのシーケンス番号を表し、Nはフレームの長さを表し、
(n)は、現フレームの左側チャネル信号を表し、X(n)は、現フレームの右側チャネル信号を表し、
α=ratio_SMであり、ratio_SMは、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表し、
α1_pre=tdm_last_ratioであり、tdm_last_ratioは、前フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表す。
以下では、例を用いて、現フレームの異なるダウンミックスモードに対応するいくつかのダウンミックス行列及びアップミックス行列を説明する。
例えば、M2Aは、現フレームのダウンミックスモードAに対応するダウンミックス行列を表し、M2Aは、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数に基づいて構成される。この場合、例えば、
Figure 0007088450000009
又は、
Figure 0007088450000010
であり、ratioは、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表す。
それに応じて、
Figure 0007088450000011
は、現フレームのダウンミックスモードAに対応するダウンミックス行列M2Aに対応するアップミックス行列を表し、
Figure 0007088450000012
は、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数に基づいて構成される。例えば、
Figure 0007088450000013
である、又は、
Figure 0007088450000014
である。
例えば、M2Bは、現フレームのダウンミックスモードBに対応するダウンミックス行列を表し、M2Bは、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数に基づいて構成される。例えば、
Figure 0007088450000015
であり、又は、
Figure 0007088450000016
であり、α=ratio_SMであり、α=1-ratio_SMであり、ratio_SMは、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表す。
それに応じて、
Figure 0007088450000017
は、現フレームのダウンミックスモードBに対応するダウンミックス行列M2Bに対応するアップミックス行列を表し、
Figure 0007088450000018
は、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数に基づいて構成される。例えば、
Figure 0007088450000019
であり、又は、
Figure 0007088450000020
であり、α=ratio_SMであり、α=1-ratio_SMであり、ratio_SMは、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表す。
例えば、M2Cは、現フレームのダウンミックスモードCに対応するダウンミックス行列を表し、M2Cは、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数に基づいて構成される。例えば、
Figure 0007088450000021
であり、又は、
Figure 0007088450000022
であり、α=ratio_SMであり、α=1-ratio_SMであり、ratio_SMは、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表す。
それに応じて、
Figure 0007088450000023
は、現フレームのダウンミックスモードCに対応するダウンミックス行列M2Cに対応するアップミックス行列を表し、
Figure 0007088450000024
は、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数に基づいて構成される。例えば、
Figure 0007088450000025
であり、又は、
Figure 0007088450000026
であり、α=ratio_SMであり、α=1-ratio_SMであり、ratio_SMは、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表す。
例えば、M2Dは、現フレームのダウンミックスモードDに対応するダウンミックス行列を表し、M2Dは、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数に基づいて構成される。例えば、
Figure 0007088450000027
であり、又は、
Figure 0007088450000028
であり、α=ratioであり、α=1-ratioであり、ratioは、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表す。
それに応じて、
Figure 0007088450000029
は、現フレームのダウンミックスモードDに対応するダウンミックス行列M2Dに対応するアップミックス行列を表し、
Figure 0007088450000030
は、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数に基づいて構成される。例えば、
Figure 0007088450000031
であり、又は、
Figure 0007088450000032
であり、α=ratioであり、α=1-ratioであり、ratioは、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表す。
以下では、例を用いて、前フレームに対するいくつかのダウンミックス行列及びアップミックス行列を説明する。
例えば、M1Aは、前フレームのダウンミックスモードAに対応するダウンミックス行列を表し、M1Aは、前フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数に基づいて構成される。この場合、例えば、
Figure 0007088450000033
であり、又は、
Figure 0007088450000034
であり、α1_pre=tdm_last_ratioであり、tdm_last_ratioは、前フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表す。
それに応じて、
Figure 0007088450000035
は、前フレームのダウンミックスモードAに対応するダウンミックス行列M1Aに対応するアップミックス行列を表し、(
Figure 0007088450000036
は、略して、前フレームのダウンミックスモードAに対応するアップミックス行列と称される)
Figure 0007088450000037
は、前フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数に基づいて構成される。例えば、
Figure 0007088450000038
であり、又は、
Figure 0007088450000039
であり、α1_pre=tdm_last_ratioであり、tdm_last_ratioは、前フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表す。
例えば、M1Bは、前フレームのダウンミックスモードBに対応するダウンミックス行列を表し、M1Bは、前フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数に基づいて構成される。例えば、
Figure 0007088450000040
であり、又は、
Figure 0007088450000041
であり、α1_pre=tdm_last_ratio_SMであり、α2_pre=1-α1_preであり、tdm_last_ratio_SMは、前フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表す。
それに応じて、
Figure 0007088450000042
は、前フレームのダウンミックスモードBに対応するダウンミックス行列M1Bに対応するアップミックス行列を表し、
Figure 0007088450000043
は、前フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数に基づいて構成される。例えば、
Figure 0007088450000044
であり、又は、
Figure 0007088450000045
であり、α1_pre=tdm_last_ratio_SMであり、α2_pre=1-α1_preであり、tdm_last_ratio_SMは、前フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表す。
例えば、M1Cは、前フレームのダウンミックスモードCに対応するダウンミックス行列を表し、M1Cは、前フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数に基づいて構成される。例えば、
Figure 0007088450000046
であり、又は、
Figure 0007088450000047
であり、α1_pre=tdm_last_ratio_SMであり、α2_pre=1-α1_preであり、tdm_last_ratio_SMは、前フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表す。
それに応じて、
Figure 0007088450000048
は、前フレームのダウンミックスモードCに対応するダウンミックス行列M1Cに対応するアップミックス行列を表し、
Figure 0007088450000049
は、前フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数に基づいて構成される。例えば、
Figure 0007088450000050
であり、又は、
Figure 0007088450000051
であり、α1_pre=tdm_last_ratio_SMであり、α2_pre=1-α1_preであり、tdm_last_ratio_SMは、前フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表す。
例えば、 1D は、前フレームのダウンミックスモードDに対応するダウンミックス行列を表し、M1Dは、前フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数に基づいて構成される。例えば、
Figure 0007088450000052
であり、又は、
Figure 0007088450000053
であり、α1_pre=tdm_last_ratioであり、α2_pre=1-α1_preであり、tdm_last_ratioは、前フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表す。
それに応じて、
Figure 0007088450000054
は、前フレームのダウンミックスモードDに対応するダウンミックス行列M1Dに対応するアップミックス行列を表し、
Figure 0007088450000055
は、前フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数に基づいて構成される。例えば、
Figure 0007088450000056
であり、又は、
Figure 0007088450000057
であり、α1_pre=tdm_last_ratioであり、α2_pre=1-α1_preでありtdm_last_ratioは、前フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表す。
ダウンミックス行列及びアップミックス行列についての前述の例示的な形態は、例であり、もちろん、実際の適用では、ダウンミックス行列及びアップミックス行列の他の形態があってもよいことが理解され得る。
第5態様によれば、本願の実施形態は、オーディオエンコーディング装置をさらに提供する。装置は、互いに連結されるプロセッサとメモリとを含んでよい。メモリは、コンピュータプログラムを格納する。プロセッサは、メモリに格納されたコンピュータプログラムを呼び出して、第1態様におけるいずれかのオーディオエンコーディング方法の一部又はすべての段階を実行する、又は、第2態様におけるオーディオエンコーディングモードを判定するための任意の方法の一部又はすべての段階を実行する。
第6態様によれば、本願の実施形態は、オーディオデコーディング装置をさらに提供する。装置は、互いに連結されるプロセッサとメモリを含んでよい。メモリは、コンピュータプログラムを格納する。プロセッサは、メモリに格納されたコンピュータプログラムを呼び出して、第3態様におけるオーディオデコーディング方法の一部又はすべての段階を実行する、又は、第4態様におけるオーディオエンコーディングモードを判定するための任意の方法の一部又はすべての段階を実行する。
第7態様によれば、本願の実施形態は、オーディオエンコーディング装置を提供し、当該装置は、第1態様又は第2態様における任意の方法を実施するように構成される1又は複数の機能的なユニットを含む。
第8態様によれば、本願の実施形態は、オーディオデコーディング装置を提供し、当該装置は、第3態様又は第4態様における任意の方法を実施するように構成される1又は複数の機能ユニットを含む。
第9態様によれば、本願の実施形態は、コンピュータ可読記憶媒体を提供する。コンピュータ可読記憶媒体は、プログラムコードを格納し、プログラムコードは、第1態様又は第2態様における任意の方法のうちの一部又はすべての段階を実行するための命令を含む。
第10態様によれば、本願の実施形態は、コンピュータ可読記憶媒体を提供する。コンピュータ可読記憶媒体は、プログラムコードを格納し、プログラムコードは、第3態様又は第4態様における任意の方法の一部又はすべての段階を実行するための命令を含む。
第11態様によれば、本願の実施形態は、コンピュータプログラム製品を提供する。コンピュータプログラム製品が、コンピュータ上で動作する場合、コンピュータは、第1態様又は第2態様における段階の任意の方法の一部又はすべてを実行することを可能にする。
第12態様によれば、本願の実施形態は、コンピュータプログラム製品を提供する。コンピュータプログラム製品が、コンピュータ上で動作する場合、コンピュータは、第3態様又は第4態様における任意の方法の段階のうちの一部又はすべてを実行することを可能にする。
以下では、本願の実施形態を説明するために必要な添付の図面を説明する。
本願の本実施形態に係るほぼ位相のずれた信号についての概略図である。
本願の本実施形態に係るエンコーディング方法の概略フローチャートである。
本願の実施形態に係るオーディオエンコーディングモードを判定するための方法の概略フローチャートである。
本願の実施形態に係るダウンミックスモード切り替えの概略フローチャートである。
本願の実施形態に係るダウンミックスモード切り替えの別のタイプの概略フローチャートである。
本願の実施形態に係るオーディオエンコーディングモードを判定するための方法の概略フローチャートである。
本願の実施形態に係るオーディオエンコーディングモードを判定するための別の方法の概略フローチャートである。
本願の本実施形態に係る時間領域のステレオパラメータを判定するための方法の概略フローチャートである。
本願の実施形態に係る別のオーディオエンコーディング方法の概略フローチャートである。 本願の実施形態に係る別のオーディオエンコーディング方法の概略フローチャートである。
現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を計算し、本願の本実施形態に係るエンコーディングを実行するための方法の概略フローチャートである。
本願の本実施形態に係る現フレームの左側チャネルと右側チャネルとの間の振幅相関の差のパラメータを計算するための方法の概略フローチャートである。
本願の本実施形態に係る、現フレームの左側チャネルと右側チャネルとの間の振幅相関の差のパラメータをチャネルの組み合わせ比率係数に変換するための方法の概略フローチャートである。
本願の本実施形態に係るデコーディング方法の概略フローチャートである。
本願の本実施形態に係る装置の概略図である。
本願の実施形態に係る別の装置の概略図である。
本願の実施形態に係る別の装置の概略図である。
本願の実施形態に係る別の装置の概略図である。
本願の実施形態に係る別の装置の概略図である。
本願の実施形態に係る別の装置の概略図である。
以下では、本願の実施形態における添付の図面に関する本願の実施形態を説明する。
本願の本明細書、特許請求の範囲及び添付の図面で言及される用語「含む」、「有する」又はその任意の他の変形語は、非排他的な包含をカバーすることを目的とする。例えば、一連の段階又はユニットを含むプロセス、方法、システム、製品又はデバイスは、列挙されている段階又はユニットに限定されるものではないが、列挙されていない段階又はユニットを任意でさらに含む、又は、プロセス、方法、製品又はデバイスの別の固有の段階又はユニットを任意でさらに含む。さらに、用語「第1」、「第2」、「第3」及び「第4」などは、異なる対象を区別するために用いられるが、特定の順序を説明するためではない。
本願の実施形態における解決手段は、時間領域シナリオに特有のものであるので、記述を簡略化するために、時間領域信号は、「信号」と称され得ることに留意されたい。例えば、左側チャネルの時間領域信号は、「左側チャネル信号」と称され得る。別の例として、右側チャネルの時間領域信号は、「右側チャネル信号」と称され得る。別の例として、モノラル時間領域信号は、「モノラル信号」と称され得る。別の例として、基準チャネル時間領域信号は、「基準チャネル信号」と称され得る。別の例として、プライマリチャネル時間領域信号は、「プライマリチャネル信号」と称され得、セカンダリチャネル時間領域信号は、「セカンダリチャネル信号」と称され得る。別の例として、中間チャネル(Mid channel)時間領域信号は、「中間チャネル信号」と称され得る。別の例として、サイドチャネル(Side channel)時間領域信号は、「サイドチャネル信号」と称され得る。別の場合が類推により推定され得る。
本願の実施形態において、左側チャネルの時間領域信号及び右側チャネルの時間領域信号は、まとめて「左側及び右側チャネルの時間領域信号」と称されてよい、又は、まとめて「左側チャネル信号及び右側チャネル信号」と称されてよいことに留意されたい。すなわち、左側チャネルの時間領域信号及び右側チャネルの時間領域信号は、左側チャネルの時間領域信号及び右側チャネルの時間領域信号を含む。別の例として、遅延調整処理を通じて取得される現フレームの左側チャネルの時間領域信号及び右側チャネルの時間領域信号は、現フレームの、遅延調整処理を通じて取得される左側チャネルの時間領域信号と、現フレームの、遅延調整処理を通じて取得される右側チャネルの時間領域信号とを含む。同様に、プライマリチャネル信号及びセカンダリチャネル信号は、まとめて「プライマリチャネル信号及びセカンダリチャネル信号」と称されてよい。すなわち、プライマリチャネル信号及びセカンダリチャネル信号は、プライマリチャネル信号及びセカンダリチャネル信号を含む。別の例として、デコーディングされたプライマリチャネル信号及びセカンダリチャネル信号は、デコードされたプライマリチャネル信号及びデコードされたセカンダリチャネル信号を含む。別の例として、再構築された左側チャネル信号及び右側チャネル信号は、再構築された左側チャネル信号及び再構築された右側チャネル信号を含む。別の場合が類推により推定され得る。
例えば、従来のMSエンコーディング技術では、まず、左側チャネル信号と右側チャネル信号が中間チャネル(Mid channel)信号及びサイドチャネル(Side channel)信号にダウンミックスされる。例えば、Lは、左側チャネル信号を表し、Rは、右側チャネル信号を表す。この場合、中間チャネル信号は、0.5×(L+R)であり、中間チャネル信号は、左側チャネルと右側チャネルとの間の相関に関する情報を表し、サイドチャネル信号は、0.5×(L-R)であり、サイドチャネル信号は、左側チャネルと右側チャネルとの間の差に関する情報を表す。中間チャネル信号及びサイドチャネル信号は、モノラルエンコーディング方法を用いて別個にエンコードされる。中間チャネル信号は、通常、より多くのビットを用いてエンコードされ、サイドチャネル信号は、通常、より少ないビットを用いてエンコードされる。
さらに、エンコーディング品質を向上させるために、いくつかの解決手段では、左側チャネルの時間領域信号と右側チャネルの時間領域信号が分析されて、時間領域のダウンミックス処理における左側チャネルと右側チャネルとの間の比率を示すために用いられる時間領域のステレオパラメータを抽出する。この方法で提案する目的は、ステレオ左側チャネル信号と右側チャネル信号との間に比較的大きなエネルギー差がある場合、時間領域のダウンミックスされた信号におけるプライマリチャネルのエネルギーを向上させ、セカンダリチャネルのエネルギーを低減させるためである。
例えば、Lは、左側チャネル信号を表し、Rは、右側チャネル信号を表す。この場合、プライマリチャネル(Primary channel)信号は、Yとして示され、Y=アルファ×L+ベータ×Rであり、Yは、2つのチャネル間の相関に関する情報を表し、セカンダリチャネル(Secondary channel)は、Xとして示され、X=アルファ×L-ベータ×Rであり、Xは2つのチャネル間の差に関する情報を表す。アルファ及びベータは、0と1との間の実数である。
図1は、左側チャネル信号及び右側チャネル信号の振幅変化の事例を示す。時間領域の特定の瞬間において、左側チャネル信号及び右側チャネル信号の対応するサンプリングポイントの振幅は、基本的には同じ絶対値を有するが、反対の符号、すなわち、典型的なほぼ位相のずれた信号である。図1は、単なるほぼ位相のずれた信号の典型的な例を示しているに過ぎない。実際には、ほぼ位相のずれた信号は、左側チャネル信号と右側チャネル信号との間の位相差が180°に近いステレオ信号である。例えば、左側チャネル信号と右側チャネル信号との間の位相差が[180-θ、180+θ]内にあるステレオ信号は、ほぼ位相のずれた信号と称され得る。θは、0°から90°の任意の角度であり得る。例えば、θは、0°、5°、15°、17°、20°、30°又は40°などの角度に等しくてよい。
同様に、ほぼ同じ位相の信号は、左側チャネル信号と右側チャネル信号との間の位相差が0°に近いステレオ信号である。例えば、左側チャネル信号と右側チャネル信号との間の位相差が[-θ、θ]内にあるステレオ信号は、ほぼ同じ位相の信号と称され得る。θは、0°から90°の任意の角度であってよい。例えば、θは、0°、5°、15°、17°、20°、30°又は40°などの角度に等しくてよい。
左側チャネル信号及び右側チャネル信号がほぼ同じ位相の信号を構成する場合、通常、時間領域のダウンミックス処理を通じて生成されるプライマリチャネル信号のエネルギーは、セカンダリチャネル信号のエネルギーよりも明らかに大きい。プライマリチャネル信号をエンコードするために、より多くのビットが用いられ、セカンダリチャネル信号をエンコードするために、より少ないビットが用いられる場合、これは、より良いエンコーディング効果を実現するのに役立つ。しかしながら、左側チャネル信号及び右側チャネル信号がほぼ位相のずれた信号を構成する場合に、同じ時間領域のダウンミックス処理方法が用いられると、生成されるプライマリチャネル信号のエネルギーは、非常に小さい又は存在すらしない。これは、最終的なエンコード品質を低下させる。
以下では、ステレオエンコーディング/デコーディング品質を向上させるのに役立ついくつかの技術的解決手段の議論を続ける。
本願の実施形態で言及されるオーディオエンコーディング装置及びオーディオデコーディング装置はそれぞれ、例えば、音声信号を収集する、格納する及び伝送するといった機能を有する装置であり得る。具体的には、オーディオエンコーディング装置及びオーディオデコーディング装置はそれぞれ、例えば、携帯電話、サーバ、タブレットコンピュータ、パーソナルコンピュータ又はノートブックコンピュータであってよい。
本願の解決手段では、左側チャネル信号及び右側チャネル信号が、ステレオ信号の左側チャネル信号及び右側チャネル信号であることが理解され得る。ステレオ信号は、元のステレオ信号であってよい、又は、マルチチャネル信号に含まれる2つの信号により構成されるステレオ信号であってよい、又は、マルチチャネル信号に含まれる複数の信号を組み合わることにより生成される2つの信号により構成されるオーディオステレオ信号であってよい。オーディオエンコーディング方法は、代わりに、マルチチャネルエンコーディングにおいて用いられるステレオエンコーディング方法であってよく、オーディオエンコーディング装置は、代わりに、マルチチャネルエンコーディング装置において用いられるステレオエンコーディング装置であってよい。同様に、オーディオデコーディング方法は、代わりに、マルチチャネルデコーディングにおいて用いられるステレオデコーディング方法であってよく、オーディオデコーディング装置は、代わりに、マルチチャネルデコーディング装置において用いられるステレオデコーディング装置であってよい。本願の実施形態におけるオーディオエンコーディング方法は、例えば、ステレオエンコーディングシナリオに固有のものである。本願の実施形態におけるオーディオデコーディング方法は、例えば、ステレオデコーディングシナリオに固有のものである。
以下では、まず、オーディオエンコーディングを判定するための方法を提供する。方法は、現フレームに対するチャネルの組み合わせスキームを判定する段階と、前フレームのダウンミックスモードと、現フレームに対するチャネルの組み合わせスキームとに基づいて、現フレームのエンコーディングモードを判定する段階と、現フレームのエンコーディングモードに基づいて、現フレームの左側チャネル信号と右側チャネル信号に対して時間領域のダウンミックス処理を実行して、現フレームのプライマリチャネル信号及びセカンダリチャネル信号を取得する段階と、現フレームの取得したプライマリチャネル信号及びセカンダリチャネル信号をエンコードする段階とを含んでよい。
図2は、本願の実施形態に係るオーディオエンコーディング方法の概略フローチャートである。オーディオエンコーディング方法の関連する段階は、エンコーディング装置により実施されてよい。例えば、方法は、以下の段階を含み得る。
201、現フレームに対するチャネルの組み合わせスキームを判定する。
現フレームに対するチャネルの組み合わせスキームは、複数のチャネルの組み合わせスキームのうちの1つである。例えば、複数のチャネルの組み合わせスキームは、逆相関信号チャネルの組み合わせスキーム(anticorrelated signal Channel Combination Scheme)及び相関信号チャネルの組み合わせスキーム(correlated signal Channel Combination Scheme)を含んでよい。相関信号チャネルの組み合わせスキームは、ほぼ同じ位相の信号に対応するチャネルの組み合わせスキームである。逆相関信号チャネルの組み合わせスキームは、ほぼ位相のずれた信号に対応するチャネルの組み合わせスキームである。ほぼ同じ位相の信号に対応するチャネルの組み合わせスキームが、ほぼ同じ位相の信号に適用可能であり、ほぼ位相のずれた信号に対応するチャネルの組み合わせスキームが、ほぼ位相のずれた信号に適用可能であることが理解され得る。
202、前フレームのダウンミックスモードと、現フレームに対するチャネルの組み合わせスキームとに基づいて、現フレームのエンコーディングモードを判定する。
さらに、現フレームが最初のフレームである(すなわち、現フレームに対する前フレームがない)場合、現フレームのダウンミックスモード及びエンコーディングモードは、現フレームに対するチャネルの組み合わせスキームに基づいて判定され得る。代わりに、デフォルトのダウンミックスモード及びエンコーディングモードが、現フレームのダウンミックスモード及びエンコーディングモードとして用いられてよい。
前フレームのダウンミックスモードは、以下の複数のダウンミックスモード、すなわち、ダウンミックスモードA、ダウンミックスモードB、ダウンミックスモードC及びダウンミックスモードDのうちの1つであってよい。ダウンミックスモードA及びダウンミックスモードDは、相関信号ダウンミックスモードである。ダウンミックスモードB及びダウンミックスモードCは、逆相関信号ダウンミックスモードである。前フレームのダウンミックスモードA、前フレームのダウンミックスモードB、前フレームのダウンミックスモードC及び前フレームのダウンミックスモードDは、異なるダウンミックス行列に対応する。
現フレームのダウンミックスモードは、以下の複数のダウンミックスモード、すなわち、ダウンミックスモードA、ダウンミックスモードB、ダウンミックスモードC及びダウンミックスモードDのうちの1つであってよい。ダウンミックスモードA及びダウンミックスモードDは、相関信号ダウンミックスモードである。ダウンミックスモードB及びダウンミックスモードCは、逆相関信号ダウンミックスモードである。現フレームのダウンミックスモードA、現フレームのダウンミックスモードB、現フレームのダウンミックスモードC及び現フレームのダウンミックスモードDは、異なるダウンミックス行列に対応する。
本願の一部の実施形態において、「時間領域のダウンミックス」は、場合により、「ダウンミックス」と称され、「時間領域のアップミックス」は、場合により、「アップミックス」と称される。例えば、「時間領域のダウンミックスモード」は「ダウンミックスモード」と称され、「時間領域のダウンミックス行列」は「ダウンミックス行列」と称され、「時間領域のアップミックスモード」は「アップミックスモード」と称され、「時間領域のアップミックス行列」は「アップミックス行列」と称され、「時間領域のアップミックス処理」は「アップミックス処理」と称され、「時間領域のダウンミックス処理」は「ダウンミックス処理」と称されるなどである。
本願の実施形態におけるオブジェクトの名称、例えば、エンコーディングモード、デコーディングモード、ダウンミックスモード、アップミックスモード及びチャネルの組み合わせスキームは例であり、実際の適用では、代わりに他の名称が用いられてよいことが理解され得る。
203、現フレームのエンコーディングモードに基づいて、現フレームの左側チャネル信号及び右側チャネル信号に対して時間領域のダウンミックス処理を実行して、現フレームのプライマリチャネル信号及びセカンダリチャネル信号を取得し、現フレームの取得したプライマリチャネル信号及びセカンダリチャネル信号をエンコードする。
時間領域のダウンミックス処理は、現フレームの左側チャネル信号及び右側チャネル信号に対して実行されて、現フレームのプライマリチャネル信号及びセカンダリチャネル信号を取得してよく、現フレームの取得したプライマリチャネル信号及びセカンダリチャネル信号は、さらにエンコードされて、ビットストリームを取得する。現フレームのチャネルの組み合わせスキーム識別子(現フレームのチャネルの組み合わせスキーム識別子は、現フレームに対するチャネルの組み合わせスキームを示すために用いられる)は、さらに、ビットストリームに書き込まれてよく、その結果、デコーディング装置は、現フレームの、ビットストリームに含まれるチャネルの組み合わせスキーム識別子に基づいて、現フレームに対するチャネルの組み合わせスキームを判定する。現フレームのダウンミックスモード識別子(現フレームのダウンミックスモード識別子は、現フレームのダウンミックスモードを示すために用いられる)は、さらに、ビットストリームに書き込まれてよく、その結果、デコーディング装置は、現フレームの、ビットストリームに含まれるダウンミックスモード識別子に基づいて、現フレームのダウンミックスモードを判定する。
前フレームのダウンミックスモードと、現フレームに対するチャネルの組み合わせスキームとに基づいて、現フレームのエンコーディングモードを判定する段階は、具体的には、様々な方式で実装されてよい。
具体的には、例えば、いくつかの可能な実施例において、前フレームのダウンミックスモードと、現フレームに対するチャネルの組み合わせスキームとに基づいて、現フレームのエンコーディングモードを判定する段階は、
前フレームのダウンミックスモードがダウンミックスモードAであり、かつ、現フレームに対するチャネルの組み合わせスキームが相関信号チャネルの組み合わせスキームである場合、現フレームのダウンミックスモードがダウンミックスモードAであると判定し、現フレームのエンコーディングモードがダウンミックスモードAからダウンミックスモードAへのエンコーディングモードであると判定する段階、
前フレームのダウンミックスモードがダウンミックスモードBであり、かつ、現フレームに対するチャネルの組み合わせスキームが逆相関信号チャネルの組み合わせスキームである場合、現フレームのダウンミックスモードがダウンミックスモードBであると判定し、現フレームのエンコーディングモードがダウンミックスモードBからダウンミックスモードBへのエンコーディングモードであると判定する段階、
前フレームのダウンミックスモードがダウンミックスモードCであり、かつ、現フレームに対するチャネルの組み合わせスキームが逆相関信号チャネルの組み合わせスキームである場合、現フレームのダウンミックスモードがダウンミックスモードCであると判定し、現フレームのエンコーディングモードがダウンミックスモードCからダウンミックスモードCへのエンコーディングモードであると判定する段階、又は、
前フレームのダウンミックスモードがダウンミックスモードDであり、かつ、現フレームに対するチャネルの組み合わせスキームが相関信号チャネルの組み合わせスキームである場合、現フレームのダウンミックスモードがダウンミックスモードDであると判定し、現フレームのエンコーディングモードがダウンミックスモードDからダウンミックスモードDへのエンコーディングモードであると判定する段階
を含んでよい。
別の例として、いくつかの可能な実施例では、前フレームのダウンミックスモードと、現フレームに対するチャネルの組み合わせスキームとに基づいえ、現フレームのエンコーディングモードを判定する段階は、前フレームのダウンミックスモードと、現フレームのダウンミックスモード切り替えのコスト値と、現フレームに対するチャネルの組み合わせスキームとに基づいて、現フレームのエンコーディングモードを判定する段階を含んでよい。
いくつかの可能な実施例において、ダウンミックスモード切り替えのコスト値は、ダウンミックスモード切り替えのコストを表し得る。例えば、より大きなダウンミックスモード切り替えのコスト値は、より大きなダウンミックスモード切り替えのコストを示す。
例えば、現フレームのダウンミックスモード切り替えのコスト値は、現フレームのダウンミックスモード切り替えのコスト関数に基づいて計算された計算結果であってよい(計算結果は、ダウンミックスモード切り替えのコスト関数の値である)。ダウンミックスモード切り替えのコスト関数は、例えば、現フレームの少なくとも1つの時間領域ステレオパラメータ(現フレームの少なくとも1つの時間領域ステレオパラメータは、例えば、現フレームのチャネルの組み合わせ比率係数を含む)、前フレームの少なくとも1つの時間領域ステレオパラメータ(前フレームの少なくとも1つの時間領域ステレオパラメータは、例えば、前フレームのチャネルの組み合わせ比率係数を含む)及び現フレームの左側チャネル信号及び右側チャネル信号のうちの少なくとも1つのパラメータに基づいて構成されてよい。
別の例として、現フレームのダウンミックスモード切り替えのコスト値は、現フレームのチャネルの組み合わせ比率係数であってよい。
例えば、ダウンミックスモード切り替えのコスト関数は、
ダウンミックスモードAからダウンミックスモードBへの切り替えに対するコスト関数、ダウンミックスモードAからダウンミックスモードCへの切り替えに対するコスト関数、ダウンミックスモードDからダウンミックスモードBへの切り替えに対するコスト関数、ダウンミックスモードDからダウンミックスモードCへの切り替えに対するコスト関数、ダウンミックスモードBからダウンミックスモードAへの切り替えに対するコスト関数、ダウンミックスモードBからダウンミックスモードDへの切り替えに対するコスト関数、ダウンミックスモードCからダウンミックスモードAへの切り替えに対するコスト関数及びダウンミックスモードCからダウンミックスモードDへの切り替えに対するコスト関数
のうちの1つの切り替えのコスト関数であってよい。
具体的には、例えば、図4の例において示されるように、いくつかの可能な実施例では、前フレームのダウンミックスモードと、現フレームのダウンミックスモード切り替えのコスト値と、現フレームに対するチャネルの組み合わせスキームとに基づいて、現フレームのエンコーディングモードを判定する段階は、
前フレームのダウンミックスモードがダウンミックスモードAであり、現フレームに対するチャネルの組み合わせスキームが逆相関信号チャネルの組み合わせスキームであり、かつ、現フレームのダウンミックスモード切り替えのコスト値が第1のダウンミックスモード切り替え条件を満たす場合、現フレームのダウンミックスモードがダウンミックスモードCであり、かつ、現フレームのエンコーディングモードがダウンミックスモードAからダウンミックスモードCへのエンコーディングモードであると判定する段階であって、ダウンミックスモード切り替えのコスト値は、ダウンミックスモード切り替えのコスト関数の値であり、第1のモード切り替え条件は、現フレームのダウンミックスモードAからダウンミックスモードBへの切り替えに対するコスト関数の値が、ダウンミックスモードAからダウンミックスモードCへの切り替えに対するコスト関数の値より大きい又はこれに等しいことである、段階、
前フレームのダウンミックスモードがダウンミックスモードAであり、現フレームに対するチャネルの組み合わせスキームが逆相関信号チャネルの組み合わせスキームであり、かつ、現フレームのダウンミックスモード切り替えのコスト値が第2のダウンミックスモード切り替え条件を満たす場合、現フレームのダウンミックスモードがダウンミックスモードBであり、かつ、現フレームのエンコーディングモードがダウンミックスモードAからダウンミックスモードBへのエンコーディングモードであると判定する段階であって、ダウンミックスモード切り替えのコスト値は、ダウンミックスモード切り替えのコスト関数の値であり、第2のモード切り替え条件は、現フレームのダウンミックスモードAからダウンミックスモードBへの切り替えに対するコスト関数の値が、ダウンミックスモードAからダウンミックスモードCへの切り替えに対するコスト関数の値より小さい又はこれに等しいことである、段階、
前フレームのダウンミックスモードがダウンミックスモードBであり、現フレームに対するチャネルの組み合わせスキームが相関信号チャネルの組み合わせスキームであり、かつ、現フレームのダウンミックスモード切り替えのコスト値が第3のダウンミックスモード切り替え条件を満たす場合、現フレームのダウンミックスモードがダウンミックスモードAであり、かつ、現フレームのエンコーディングモードがダウンミックスモードBからダウンミックスモードAへのエンコーディングモードであると判定する段階であって、ダウンミックスモード切り替えのコスト値は、ダウンミックスモード切り替えのコスト関数の値であり、第3のモード切り替え条件は、現フレームのダウンミックスモードBからダウンミックスモードAへの切り替えに対するコスト関数の値が、ダウンミックスモードBからダウンミックスモードDへの切り替えに対するコスト関数の値より小さい又はこれに等しいことである、段階と、
前フレームのダウンミックスモードがダウンミックスモードBであり、現フレームに対するチャネルの組み合わせスキームが相関信号チャネルの組み合わせスキームであり、かつ、現フレームのダウンミックスモード切り替えのコスト値が第4のダウンミックスモード切り替え条件を満たす場合、現フレームのダウンミックスモードがダウンミックスモードDであり、かつ、現フレームのエンコーディングモードがダウンミックスモードBからダウンミックスモードDへのエンコーディングモードであると判定する段階であって、ダウンミックスモード切り替えのコスト値は、ダウンミックスモード切り替えのコスト関数の値であり、第4のモード切り替え条件は、現フレームのダウンミックスモードBからダウンミックスモードAへの切り替えに対するコスト関数の値が、ダウンミックスモードBからダウンミックスモードDへの切り替えに対するコスト関数の値より大きい又はこれに等しいことである、段階、
前フレームのダウンミックスモードがダウンミックスモードCであり、現フレームに対するチャネルの組み合わせスキームが相関信号チャネルの組み合わせスキームであり、かつ、現フレームのダウンミックスモード切り替えのコスト値が第5のダウンミックスモード切り替え条件を満たす場合、現フレームのダウンミックスモードがダウンミックスモードDであり、かつ、現フレームのエンコーディングモードがダウンミックスモードCからダウンミックスモードDへのエンコーディングモードであると判定する段階であって、ダウンミックスモード切り替えのコスト値は、ダウンミックスモード切り替えのコスト関数の値であり、第5のモード切り替え条件は、現フレームのダウンミックスモードCからダウンミックスモードAへの切り替えに対するコスト関数の値が、ダウンミックスモードCからダウンミックスモードDへの切り替えに対するコスト関数の値より大きい又はこれに等しいことである、段階、
前フレームのダウンミックスモードがダウンミックスモードCであり、現フレームに対するチャネルの組み合わせスキームが相関信号チャネルの組み合わせスキームであり、かつ、現フレームのダウンミックスモード切り替えのコスト値が第6のダウンミックスモード切り替え条件を満たす場合、現フレームのダウンミックスモードがダウンミックスモードAであり、かつ、現フレームのエンコーディングモードがダウンミックスモードCからダウンミックスモードAへのエンコーディングモードであると判定する段階であって、ダウンミックスモード切り替えのコスト値は、ダウンミックスモード切り替えのコスト関数の値であり、第6のモード切り替え条件は、現フレームのダウンミックスモードCからダウンミックスモードAへの切り替えに対するコスト関数の値が、ダウンミックスモードCからダウンミックスモードDへの切り替えに対するコスト関数の値より小さい又はこれに等しいことである、段階、
前フレームのダウンミックスモードがダウンミックスモードDであり、現フレームに対するチャネルの組み合わせスキームが逆相関信号チャネルの組み合わせスキームであり、かつ、現フレームのダウンミックスモード切り替えのコスト値が第7のダウンミックスモード切り替え条件を満たす場合、現フレームのダウンミックスモードがダウンミックスモードBであり、かつ、現フレームのエンコーディングモードがダウンミックスモードDからダウンミックスモードBへのエンコーディングモードであると判定する段階であって、ダウンミックスモード切り替えのコスト値は、ダウンミックスモード切り替えのコスト関数の値であり、第7のモード切り替え条件は、現フレームのダウンミックスモードDからダウンミックスモードBへの切り替えに対するコスト関数の値が、ダウンミックスモードDからダウンミックスモードCへの切り替えに対するコスト関数の値より小さい又はこれに等しいことである、段階、又は、
前フレームのダウンミックスモードがダウンミックスモードDであり、現フレームに対するチャネルの組み合わせスキームが逆相関信号チャネルの組み合わせスキームであり、かつ、現フレームのダウンミックスモード切り替えのコスト値が第8のダウンミックスモード切り替え条件を満たす場合、現フレームのダウンミックスモードがダウンミックスモードCであり、かつ、現フレームのエンコーディングモードがダウンミックスモードDからダウンミックスモードCへのエンコーディングモードであると判定する段階であって、ダウンミックスモード切り替えのコスト値は、ダウンミックスモード切り替えのコスト関数の値であり、第8のモード切り替え条件は、現フレームのダウンミックスモードDからダウンミックスモードBへの切り替えに対するコスト関数の値が、ダウンミックスモードDからダウンミックスモードCへの切り替えに対するコスト関数の値より大きい又はこれに等しいことである、段階
を含んでよい。
具体的には、別の例として、図5の例に示されるように、いくつかの可能な実施例において、前フレームのダウンミックスモードと、現フレームのダウンミックスモード切り替えのコスト値と、現フレームに対するチャネルの組み合わせスキームとに基づいて、現フレームのエンコーディングモードを判定する段階は、
前フレームのダウンミックスモードがダウンミックスモードAであり、現フレームに対するチャネルの組み合わせスキームが逆相関信号チャネルの組み合わせスキームであり、かつ、現フレームのダウンミックスモード切り替えのコスト値が第9のダウンミックスモード切り替え条件を満たす場合、現フレームのダウンミックスモードがダウンミックスモードCであり、かつ、現フレームのエンコーディングモードがダウンミックスモードAからダウンミックスモードCへのエンコーディングモードであると判定する段階であって、現フレームのダウンミックスモード切り替えのコスト値は、現フレームのチャネルの組み合わせ比率係数であり、第9のモード切り替え条件は、現フレームのチャネルの組み合わせ比率係数が、チャネルの組み合わせ比率係数の閾値S1より小さい又はこれに等しいことである、段階、
前フレームのダウンミックスモードがダウンミックスモードAであり、現フレームに対するチャネルの組み合わせスキームが逆相関信号チャネルの組み合わせスキームであり、かつ、現フレームのダウンミックスモード切り替えのコスト値が第10のダウンミックスモード切り替え条件を満たす場合、現フレームのダウンミックスモードがダウンミックスモードBであり、かつ、現フレームのエンコーディングモードがダウンミックスモードAからダウンミックスモードBへのエンコーディングモードであると判定する段階であって、現フレームのダウンミックスモード切り替えのコスト値は、現フレームのチャネルの組み合わせ比率係数であり、第10のモード切り替え条件は、現フレームのチャネルの組み合わせ比率係数が、チャネルの組み合わせ比率係数の閾値S1より大きい又はこれに等しいことである、段階、
前フレームのダウンミックスモードがダウンミックスモードBであり、現フレームに対するチャネルの組み合わせスキームが相関信号チャネルの組み合わせスキームであり、かつ、現フレームのダウンミックスモード切り替えのコスト値が第11のダウンミックスモード切り替え条件を満たす場合、現フレームのダウンミックスモードがダウンミックスモードAであり、かつ、現フレームのエンコーディングモードがダウンミックスモードBからダウンミックスモードAへのエンコーディングモードであると判定する段階であって、現フレームのダウンミックスモード切り替えのコスト値は、現フレームのチャネルの組み合わせ比率係数であり、第11のモード切り替え条件は、現フレームのチャネルの組み合わせ比率係数が、チャネルの組み合わせ比率係数の閾値S2より大きい又はこれに等しいことである、段階、
前フレームのダウンミックスモードがダウンミックスモードBであり、現フレームに対するチャネルの組み合わせスキームが相関信号チャネルの組み合わせスキームであり、かつ、現フレームのダウンミックスモード切り替えのコスト値が第12のダウンミックスモード切り替え条件を満たす場合、現フレームのダウンミックスモードがダウンミックスモードDであり、かつ、現フレームのエンコーディングモードがダウンミックスモードBからダウンミックスモードDへのエンコーディングモードであると判定する段階であって、現フレームのダウンミックスモード切り替えのコスト値は、現フレームのチャネルの組み合わせ比率係数であり、第12のモード切り替え条件は、現フレームのチャネルの組み合わせ比率係数が、チャネルの組み合わせ比率係数の閾値S2より小さい又はこれに等しいことである、段階、
前フレームのダウンミックスモードがダウンミックスモードCであり、現フレームに対するチャネルの組み合わせスキームが相関信号チャネルの組み合わせスキームであり、かつ、現フレームのダウンミックスモード切り替えのコスト値が第13のダウンミックスモード切り替え条件を満たす場合、現フレームのダウンミックスモードがダウンミックスモードDであり、かつ、現フレームのエンコーディングモードがダウンミックスモードCからダウンミックスモードDへのエンコーディングモードであると判定する段階であって、現フレームのダウンミックスモード切り替えのコスト値は、現フレームのチャネルの組み合わせ比率係数であり、第13のモード切り替え条件は、現フレームのチャネルの組み合わせ比率係数が、チャネルの組み合わせ比率係数の閾値S3より大きい又はこれに等しいことである、段階、
前フレームのダウンミックスモードがダウンミックスモードCであり、現フレームに対するチャネルの組み合わせスキームが相関信号チャネルの組み合わせスキームであり、かつ、現フレームのダウンミックスモード切り替えのコスト値が第14のダウンミックスモード切り替え条件を満たす場合、現フレームのダウンミックスモードがダウンミックスモードAであり、かつ、現フレームのエンコーディングモードがダウンミックスモードCからダウンミックスモードAへのエンコーディングモードであると判定する段階であって、現フレームのダウンミックスモード切り替えのコスト値は、現フレームのチャネルの組み合わせ比率係数であり、第14のモード切り替え条件は、現フレームのチャネルの組み合わせ比率係数が、チャネルの組み合わせ比率係数の閾値S3より小さい又はこれに等しいことである、段階、
前フレームのダウンミックスモードがダウンミックスモードDであり、現フレームに対するチャネルの組み合わせスキームが逆相関信号チャネルの組み合わせスキームであり、かつ、現フレームのダウンミックスモード切り替えのコスト値が第15のダウンミックスモード切り替え条件を満たす場合、現フレームのダウンミックスモードがダウンミックスモードBであり、かつ、現フレームのエンコーディングモードがダウンミックスモードDからダウンミックスモードBへのエンコーディングモードであると判定する段階であって、現フレームのダウンミックスモード切り替えのコスト値は、現フレームのチャネルの組み合わせ比率係数であり、第15のモード切り替え条件は、現フレームのチャネルの組み合わせ比率係数が、チャネルの組み合わせ比率係数の閾値S4より小さい又はこれに等しいことである、段階、又は、
前フレームのダウンミックスモードがダウンミックスモードDであり、現フレームに対するチャネルの組み合わせスキームが逆相関信号チャネルの組み合わせスキームであり、かつ、現フレームのダウンミックスモード切り替えのコスト値が第16のダウンミックスモード切り替え条件を満たす場合、現フレームのダウンミックスモードがダウンミックスモードCであり、かつ、現フレームのエンコーディングモードがダウンミックスモードDからダウンミックスモードCへのエンコーディングモードであると判定する段階であって、現フレームのダウンミックスモード切り替えのコスト値は、現フレームのチャネルの組み合わせ比率係数であり、第16のモード切り替え条件は、現フレームのチャネルの組み合わせ比率係数が、チャネルの組み合わせ比率係数の閾値S4より大きい又はこれに等しいことである、段階
を含んでよい。
チャネルの組み合わせ比率係数の閾値S1の値の範囲は、例えば、[0.4、0.6]であってよい。例えば、S1は、0.4、0.42、0.45、0.5、0.55、0.58、0.6又は別の値に等しくてよい。
チャネルの組み合わせ比率係数の閾値S2の値の範囲は、例えば、[0.4、0.6]であってよい。例えば、S2は、0.4、0.42、0.45、0.5、0.55、0.57、0.6又は別の値に等しくてよい。
チャネルの組み合わせ比率係数の閾値S3の値の範囲は、例えば、[0.4、0.6]であってよい。例えば、S3は、0.4、0.42、0.45、0.5、0.55、0.59、0.6又は別の値に等しくてよい。
チャネルの組み合わせ比率係数の閾値S4の値の範囲は、例えば、[0.4、0.6]であってよい。例えば、S4は、0.4、0.43、0.45、0.5、0.55、0.58、0.6又は別の値に等しくてよい。
チャネルの組み合わせ比率係数の閾値S4の値の範囲についての前述の例は例であり、値の範囲が切り替え測定に基づいて柔軟に設定されてよいことが理解され得る。
現フレームのダウンミックスモードが前フレームのダウンミックスモードとは異なっている場合、現フレームのエンコーディングモードに基づいて、現フレームの左側チャネル信号及び右側チャネル信号に対してセグメント化された時間領域のダウンミックス処理が実行されてよい。現フレームの左側チャネル信号と右側チャネル信号に対してセグメント化された時間領域のダウンミックス処理を実行するメカニズムは、現フレームのダウンミックスモードが前フレームのダウンミックスモードとは異なっている場合に導入される。セグメント化された時間領域のダウンミックス処理メカニズムは、チャネルの組み合わせスキームの円滑な移行を実施するのに役立つので、エンコーディング品質を向上させるのに役立つ。
前述のエンコーディング解決手段では、現フレームに対するチャネルの組み合わせスキームが判定される必要があり、前フレームのダウンミックスモードと、現フレームに対するチャネルの組み合わせスキームとに基づいて、現フレームのエンコーディングモードが判定される必要があることが理解され得る。これは、現フレームに対して複数の可能なチャネルの組み合わせスキームがあり、現フレームの複数の可能なエンコーディングモードがあることを示す。1つのチャネル組み合わせスキーム及び1つのエンコーディングモードしかない従来の解決手段と比較して、これは、より良好な互換性を実現し、複数の可能なチャネルの組み合わせスキーム、複数のエンコーディングモード及び複数の可能なシナリオの間で一致させるのに役立つので、エンコーディング品質を向上させるのに役立つ。
さらに、ほぼ位相のずれた信号に対応するチャネルの組み合わせスキームが導入されるので、現フレームのステレオ信号がほぼ位相のずれた信号である場合、より多くの目標とされるチャネルの組み合わせスキーム及びエンコーディングモードがあり、これは、エンコーディング品質を向上させるのに役立つ。
さらに、2つの異なるダウンミックスモードが、相関信号チャネルの組み合わせスキーム及び逆相関信号チャネルの組み合わせスキームに導入される。したがって、対応するダウンミックス行列を適切に設計することは、切り替え位置に対する要件を用いることなく、ランダムな切り替えを実施するのに役立つ。
それに応じて、以下では、時間領域のステレオデコーディングシナリオを、例を用いて説明する。
図3を参照すると、以下では、オーディオデコーディング方法をさらに提供する。オーディオデコーディング方法の関連する段階は、デコーディング装置により実施され得る。方法は、具体的には、以下の段階を含み得る。
301、ビットストリームに基づいてデコーディングを実行して、現フレームのデコーディングされたプライマリチャネル信号及びセカンダリチャネル信号を取得する。
302、ビットストリームに基づいてデコーディングを実行して、現フレームのダウンミックスモードを判定する。
例えば、デコーディング装置は、現フレームのダウンミックスモード識別子(現フレームのダウンミックスモード識別子は、現フレームのダウンミックスモードを示す)をビットストリームに書き込む。この場合、デコーディングは、現フレームのダウンミックスモード識別子を取得するために、ビットストリームに基づいて実行されてよい。さらに、現フレームのダウンミックスモードは、現フレームの、デコーディングを通じて取得されるダウンミックスモード識別子に基づいて判定されてよい。もちろん、デコーディング装置は、代わりに、エンコーディング装置により用いられるものと類似する方式で、現フレームのダウンミックスモードを判定してよい、又は、ビットストリームに含まれる他の情報に基づいて、現フレームのダウンミックスモードを判定してよい。
前フレームのダウンミックスモードは、以下の複数のダウンミックスモード、すなわち、ダウンミックスモードA、ダウンミックスモードB、ダウンミックスモードC及びダウンミックスモードDのうちの1つであってよい。ダウンミックスモードA及びダウンミックスモードDは、相関信号ダウンミックスモードである。ダウンミックスモードB及びダウンミックスモードCは、逆相関信号ダウンミックスモードである。前フレームのダウンミックスモードA、前フレームのダウンミックスモードB、前フレームのダウンミックスモードC及び前フレームのダウンミックスモードDは、異なるダウンミックス行列に対応する。
現フレームのダウンミックスモードは、以下の複数のダウンミックスモード、すなわち、ダウンミックスモードA、ダウンミックスモードB、ダウンミックスモードC及びダウンミックスモードDのうちの1つであってよい。ダウンミックスモードA及びダウンミックスモードDは、相関信号ダウンミックスモードである。ダウンミックスモードB及びダウンミックスモードCは、逆相関信号ダウンミックスモードである。現フレームのダウンミックスモードA、現フレームのダウンミックスモードB、現フレームのダウンミックスモードC及び現フレームのダウンミックスモードDは、異なるダウンミックス行列に対応する。
異なるダウンミックス行列は、異なるアップミックス行列に対応することが理解され得る。
例えば、ダウンミックスモード識別子は、例えば、少なくとも2つのビットを含んでよい。例えば、ダウンミックスモード識別子の値が「00」である場合、現フレームのダウンミックスモードがダウンミックスモードAであることを示してよい。例えば、ダウンミックスモード識別子の値が「01」である場合、現フレームのダウンミックスモードがダウンミックスモードBであることを示してよい。例えば、ダウンミックスモード識別子の値が「10」である場合、現フレームのダウンミックスモードがダウンミックスモードCであることを示してよい。例えば、ダウンミックスモード識別子の値が「11」である場合、現フレームのダウンミックスモードがダウンミックスモードDであることを示してよい。
ダウンミックスモードA及びダウンミックスモードDが相関信号ダウンミックスモードであるので、現フレームの、デコーディングを通じて取得されたダウンミックスモード識別子に基づいて、現フレームのダウンミックスモードがダウンミックスモードA又はダウンミックスモードDであると判定された場合、現フレームに対するチャネルの組み合わせスキームは、相関チャネルの組み合わせスキームであると判定されてよいことが理解され得る。
同様に、ダウンミックスモードB及びダウンミックスモードCが逆相関信号ダウンミックスモードであるので、現フレームの、デコーディングを通じて取得されたダウンミックスモード識別子に基づいて現フレームのダウンミックスモードがダウンミックスモードB又はダウンミックスモードCであると判定された場合、現フレームに対するチャネルの組み合わせスキームが逆相関チャネルの組み合わせスキームであると判定されてよい。
303、前フレームのダウンミックスモードと、現フレームのダウンミックスモードとに基づいて、現フレームのエンコーディングモードを判定する。
前フレームのダウンミックスモードと、現フレームのダウンミックスモードとに基づいて、現フレームのエンコーディングモードが、ダウンミックスモード切り替えエンコーディングモード、又は、ダウンミックスモード非切り替えエンコーディングモードであり得ると判定される。具体的には、ダウンミックスモード非切り替えエンコーディングモードは、ダウンミックスモードAからダウンミックスモードAへのエンコーディングモード、ダウンミックスモードBからダウンミックスモードBへのエンコーディングモード、ダウンミックスモードCからダウンミックスモードCへのエンコーディングモード及びダウンミックスモードDからダウンミックスモードDへのエンコーディングモードを含んでよい。
具体的には、ダウンミックスモード切り替えエンコーディングモードは、ダウンミックスモードAからダウンミックスモードBへのエンコーディングモード、ダウンミックスモードAからダウンミックスモードCへのエンコーディングモード、ダウンミックスモードBからダウンミックスモードAへのエンコーディングモード、ダウンミックスモードBからダウンミックスモードDへのエンコーディングモード、ダウンミックスモードCからダウンミックスモードAへのエンコーディングモード、ダウンミックスモードCからダウンミックスモードDへのエンコーディングモード、ダウンミックスモードDからダウンミックスモードBへのエンコーディングモード及びダウンミックスモードDからダウンミックスモードCへのエンコーディングモードを含み得る。
具体的には、例えば、前フレームのダウンミックスモードと、現フレームのダウンミックスモードとに基づいて、現フレームのエンコーディングモードを判定する段階は、
前フレームのダウンミックスモードがダウンミックスモードAであり、かつ、現フレームのダウンミックスモードがダウンミックスモードAである場合、現フレームのエンコーディングモードがダウンミックスモードAからダウンミックスモードAへのエンコーディングモードであると判定する段階、
前フレームのダウンミックスモードがダウンミックスモードAであり、かつ、現フレームのダウンミックスモードがダウンミックスモードBである場合、現フレームのエンコーディングモードがダウンミックスモードAからダウンミックスモードBへのエンコーディングモードであると判定する段階、
前フレームのダウンミックスモードがダウンミックスモードAであり、かつ、現フレームのダウンミックスモードがダウンミックスモードCである場合、現フレームのエンコーディングモードがダウンミックスモードAからダウンミックスモードCへのエンコーディングモードであると判定する段階、
前フレームのダウンミックスモードがダウンミックスモードBであり、かつ、現フレームのダウンミックスモードがダウンミックスモードBである場合、現フレームのエンコーディングモードがダウンミックスモードBからダウンミックスモードBへのエンコーディングモードであると判定する段階、
前フレームのダウンミックスモードがダウンミックスモードBであり、かつ、現フレームのダウンミックスモードがダウンミックスモードAである場合、現フレームのエンコーディングモードがダウンミックスモードBからダウンミックスモードAへのエンコーディングモードであると判定する段階、
前フレームのダウンミックスモードがダウンミックスモードBであり、かつ、現フレームのダウンミックスモードがダウンミックスモードDである場合、現フレームのエンコーディングモードがダウンミックスモードBからダウンミックスモードDへのエンコーディングモードであると判定する段階、
前フレームのダウンミックスモードがダウンミックスモードCであり、かつ、現フレームのダウンミックスモードがダウンミックスモードCである場合、現フレームのエンコーディングモードがダウンミックスモードCからダウンミックスモードCへのエンコーディングモードであると判定する段階、
前フレームのダウンミックスモードがダウンミックスモードCであり、かつ、現フレームのダウンミックスモードがダウンミックスモードAである場合、現フレームのエンコーディングモードがダウンミックスモードCからダウンミックスモードAへのエンコーディングモードであると判定する段階、
前フレームのダウンミックスモードがダウンミックスモードCであり、かつ、現フレームのダウンミックスモードがダウンミックスモードDである場合、現フレームのエンコーディングモードがダウンミックスモードCからダウンミックスモードDへのエンコーディングモードであると判定する段階、
前フレームのダウンミックスモードがダウンミックスモードDであり、かつ、現フレームのダウンミックスモードがダウンミックスモードDである場合、現フレームのエンコーディングモードがダウンミックスモードDからダウンミックスモードDへのエンコーディングモードであると判定する段階、
前フレームのダウンミックスモードがダウンミックスモードDであり、かつ、現フレームのダウンミックスモードがダウンミックスモードCである場合、現フレームのエンコーディングモードがダウンミックスモードDからダウンミックスモードCへのエンコーディングモードであると判定する段階、又は、
前フレームのダウンミックスモードがダウンミックスモードDであり、かつ、現フレームのダウンミックスモードがダウンミックスモードBである場合、現フレームのエンコーディングモードがダウンミックスモードDからダウンミックスモードBへのエンコーディングモードであると判定する段階
を含んでよい。
304、現フレームのエンコーディングモードに基づいて、現フレームのデコーディングされたプライマリチャネル信号及びセカンダリチャネル信号に対して時間領域のアップミックス処理を実行して、現フレームの再構築された左側チャネル信号及び右側チャネル信号を取得する。
再構築された左側チャネル信号及び右側チャネル信号は、デコードされた左側チャネル信号及び右側チャネル信号であってよい、又は、遅延調整処理及び/又は時間領域の後処理は、再構築された左側チャネル信号及び右側チャネル信号に対して実行されることで、デコードされた左側チャネル信号及び右側チャネル信号を取得してよい。
ダウンミックスモードがアップミックスモードに対応し、エンコーディングモードがデコーディングモードに対応することが理解され得る。
例えば、現フレームのダウンミックスモードが前フレームのダウンミックスモードとは異なっている場合、現フレームのエンコーディングモードに基づいて、現フレームのデコーディングされたプライマリチャネル信号及びセカンダリチャネル信号に対して、セグメント化された時間領域のアップミックス処理が実行されてよい。現フレームのデコーディングされたプライマリチャネル信号及びセカンダリチャネル信号に対してセグメント化された時間領域のアップミックス処理を実行するメカニズムは、現フレームのダウンミックスモードが前フレームのダウンミックスモードとは異なっている場合に導入される。セグメント化された時間領域のアップミックス処理のメカニズムは、チャネルの組み合わせスキームの円滑な移行を実施するのに役立つので、エンコーディング品質を向上させるのに役立つ。
前述のデコーディング解決手段では、前フレームのダウンミックスモードと、現フレームのダウンミックスモードとに基づいて、現フレームのエンコーディングモードが判定される必要があることが理解され得る。これは、前フレーム及び現フレームの複数の可能なダウンミックスモードがあり、現フレームの複数の可能なエンコーディングモードがあることを示す。1つのダウンミックスモード及び1つのエンコーディングモードしかない従来の解決手段と比較して、これは、より良好な互換性を実現し、複数の可能なダウンミックスモード、複数のエンコーディングモード及び複数の可能なシナリオの間で一致させるのに役立つので、エンコーディング品質を向上させるのに役立つ。
さらに、ほぼ位相のずれた信号に対応するチャネルの組み合わせスキームが導入されるので、現フレームのステレオ信号がほぼ位相のずれた信号である場合、より多くの目標とされるチャネルの組み合わせスキーム及びエンコーディングモードがあり、これは、エンコーディング品質を向上させるのに役立つ。
以下では、エンコーディング装置により、現フレームに対するチャネルの組み合わせスキームを判定する段階のいくつかの具体的な実装の例を説明する。エンコーディング装置により、現フレームに対するチャネルの組み合わせスキームを判定する段階は、具体的には、様々な方式で実装され得る。
現フレームのダウンミックスモードが前フレームのダウンミックスモードとは異なっている場合、現フレームのエンコーディングモードが、例えば、ダウンミックスモード切り替えエンコーディングモードであり得ると判定されてよい。この場合、現フレームのダウンミックスモードと、前フレームのダウンミックスモードとに基づいて、現フレームの左側チャネル信号及び右側チャネル信号に対して、セグメント化された時間領域のダウンミックス処理が実行されてよい。
現フレームの左側チャネル信号と右側チャネル信号に対して、セグメント化された時間領域のダウンミックス処理を実行するメカニズムは、現フレームに対するチャネルの組み合わせスキームが前フレームに対するチャネルの組み合わせスキームとは異なっている場合に導入される。セグメント化された時間領域のダウンミックス処理メカニズムは、チャネルの組み合わせスキームの円滑な移行を実施するのに役立つので、エンコーディング品質を向上させるのに役立つ。
いくつかの可能な実施例では、現フレームに対するチャネルの組み合わせスキームを判定する段階は、現フレームの左側チャネル信号と右側チャネル信号を用いて、現フレームのステレオ信号のほぼ同じ位相の信号/ほぼ位相のずれた信号タイプを判定する段階と、現フレームのステレオ信号のほぼ同じ位相の信号/ほぼ位相のずれた信号タイプと、前フレームに対するチャネルの組み合わせスキームとに基づいて、現フレームに対するチャネルの組み合わせスキームを判定する段階とを含んでよい。現フレームのステレオ信号のほぼ同じ位相の信号/ほぼ位相のずれた信号タイプは、ほぼ同じ位相の信号又はほぼ位相のずれた信号であってよい。現フレームのステレオ信号のほぼ同じ位相の信号/ほぼ位相のずれた信号タイプは、現フレームのほぼ同じ位相の信号/ほぼ位相のずれた信号タイプの識別子を用いて示されてよい。具体的には、例えば、現フレームのほぼ同じ位相の信号/ほぼ位相のずれた信号タイプの識別子の値が「1」である場合、現フレームのステレオ信号のほぼ同じ位相の信号/ほぼ位相のずれた信号タイプが、ほぼ同じ位相の信号である、又は、現フレームのほぼ同じ位相の信号/ほぼ位相のずれた信号タイプの識別子の値が「0」である場合、それは、現フレームのステレオ信号のほぼ同じ位相の信号/ほぼ位相のずれた信号タイプが、ほぼ位相のずれた信号であり、逆もまた同様である。
オーディオフレーム(例えば、前フレーム又は現フレーム)に対するチャネルの組み合わせスキームは、オーディオフレームのチャネルの組み合わせスキーム識別子を用いて示されてよい。具体的には、例えば、オーディオフレームのチャネルの組み合わせスキーム識別子の値が「0」である場合、オーディオフレームに対するチャネルの組み合わせスキームが相関信号チャネルの組み合わせスキームで、又は、オーディオフレームのチャネルの組み合わせスキーム識別子の値が「1」である場合、それは、オーディオフレームに対するチャネルの組み合わせスキームが逆相関信号チャネルの組み合わせスキームであり、逆もまた同様である。
現フレームの左側チャネル信号及び右側チャネル信号を用いて、現フレームのステレオ信号のほぼ同じ位相の信号/ほぼ位相のずれた信号タイプを判定する段階は、現フレームの左側チャネル信号と右側チャネル信号との間の相関の値xorrを計算する段階と、xorrが第1閾値より小さい又はこれに等しい場合、現フレームのステレオ信号のほぼ同じ位相の信号/ほぼ位相のずれた信号タイプがほぼ同じ位相の信号であると判定する段階と、xorrが第1閾値より大きい場合、現フレームのステレオ信号のほぼ同じ位相の信号/ほぼ位相のずれた信号タイプがほぼ位相のずれた信号であると判定する段階とを含んでよい。さらに、現フレームのほぼ同じ位相の信号/ほぼ位相のずれた信号タイプの識別子が、現フレームのステレオ信号のほぼ同じ位相の信号/ほぼ位相のずれた信号タイプを示すために用いられる場合、現フレームのステレオ信号のほぼ同じ位相の信号/ほぼ位相のずれた信号タイプがほぼ同じ位相の信号であると判定されたときに、現フレームのほぼ同じ位相の信号/ほぼ位相のずれた信号タイプの識別子の値は、現フレームのステレオ信号のほぼ同じ位相の信号/ほぼ位相のずれた信号タイプがほぼ同じ位相の信号であることを示すように設定されてよい、又は、現フレームのほぼ同じ位相の信号/ほぼ位相のずれた信号タイプがほぼ位相のずれた信号であると判定された場合、現フレームのほぼ同じ位相の信号/ほぼ位相のずれた信号タイプの識別子の値は、現フレームのステレオ信号のほぼ同じ位相の信号/ほぼ位相のずれた信号タイプがほぼ位相のずれた信号であることを示すように設定されてよい。
第1閾値の値の範囲は、例えば、[0.5、1.0]であってよい。例えば、第1閾値は、0.85、0.75、0.65又は0.81に等しくてよい。
具体的には、例えば、オーディオフレーム(例えば、前フレーム又は現フレーム)のほぼ同じ位相の信号/ほぼ位相のずれた信号タイプの識別子の値が「0」である場合、オーディオフレームのステレオ信号のほぼ同じ位相の信号/ほぼ位相のずれた信号タイプがほぼ同じ位相の信号である、又は、オーディオフレーム(例えば、前フレーム又は現フレーム)のほぼ同じ位相の信号/ほぼ位相のずれた信号タイプの識別子の値が「1」である場合、オーディオフレームのステレオ信号のほぼ同じ位相の信号/ほぼ位相のずれた信号タイプがほぼ位相のずれた信号である、などである。
現フレームのステレオ信号のほぼ同じ位相の信号/ほぼ位相のずれた信号タイプと、前フレームに対するチャネルの組み合わせスキームとに基づいて、現フレームに対するチャネルの組み合わせスキームを判定する段階は、例えば、
現フレームのステレオ信号のほぼ同じ位相の信号/ほぼ位相のずれた信号タイプがほぼ同じ位相の信号であり、かつ、前フレームに対するチャネルの組み合わせスキームが相関信号チャネルの組み合わせスキームである場合、現フレームに対するチャネルの組み合わせスキームが相関信号チャネルの組み合わせスキームであると判定する段階、又は、現フレームのステレオ信号のほぼ同じ位相の信号/ほぼ位相のずれた信号タイプがほぼ位相のずれた信号であり、かつ、前フレームに対するチャネルの組み合わせスキームが逆相関信号チャネルの組み合わせスキームである場合、現フレームに対するチャネルの組み合わせスキームが逆相関信号チャネルの組み合わせスキームであると判定する段階、
現フレームのステレオ信号のほぼ同じ位相の信号/ほぼ位相のずれた信号タイプがほぼ同じ位相の信号であり、かつ、前フレームに対するチャネルの組み合わせスキームが逆相関信号チャネルの組み合わせスキームである場合、現フレームの左側チャネル信号と右側チャネル信号の信号対雑音比が両方とも第2の閾値より小さい場合、現フレームに対するチャネルの組み合わせスキームが相関信号チャネルの組み合わせスキームであると判定する段階、又は、現フレームの左側チャネル信号の信号対雑音比及び/又は右側チャネル信号の信号対雑音比が第2閾値より大きい又はこれに等しい場合、現フレームに対するチャネルの組み合わせスキームが逆相関信号チャネルの組み合わせスキームであると判定する段階、又は、
現フレームのステレオ信号のほぼ同じ位相の信号/ほぼ位相のずれた信号タイプがほぼ位相のずれた信号であり、かつ、前フレームに対するチャネルの組み合わせスキームが相関信号チャネルの組み合わせスキームである場合、現フレームの左側チャネル信号及び右側チャネル信号の信号対雑音比が両方とも第2閾値より小さい又はこれに等しい場合、現フレームに対するチャネルの組み合わせスキームが逆相関信号チャネルの組み合わせスキームであると判定する段階、又は、現フレームの左側チャネル信号の信号対雑音比及び/又は右側チャネル信号の信号対雑音比が第2閾値より大きい又はこれに等しい場合、現フレームに対するチャネルの組み合わせスキームが相関信号チャネルの組み合わせスキームであると判定する段階
を含んでよい。
第2閾値の値の範囲は、例えば、[0.8、1.2]であってよい。例えば、第2閾値は、0.8、0.85、0.9、1、1.1、1.18に等しくてよい。
現フレームのチャネルの組み合わせスキーム識別子は、tdm_SM_flagとして示されてよい。
前フレームのチャネルの組み合わせスキーム識別子は、tdm_last_SM_flagとして示されてよい。
前述の例では、現フレームに対するチャネルの組み合わせスキームを判定する段階についてのいくつかの実施例を提供したが、実際の適用では、前述の例示的な方式に限定されなくてよいことが理解され得る。
以下では、例を用いて様々なダウンミックスモード切り替えのコスト関数を説明する。ダウンミックスモード切り替えのコスト関数は、ダウンミックスモードAからダウンミックスモードBへの切り替えに対するコスト関数、ダウンミックスモードAからダウンミックスモードCへの切り替えに対するコスト関数、ダウンミックスモードDからダウンミックスモードBへの切り替えに対するコスト関数、ダウンミックスモードDからダウンミックスモードCへの切り替えに対するコスト関数、ダウンミックスモードBからダウンミックスモードAへの切り替えに対するコスト関数、ダウンミックスモードBからダウンミックスモードDへの切り替えに対するコスト関数、ダウンミックスモードCからダウンミックスモードAへの切り替えに対するコスト関数及びダウンミックスモードCからダウンミックスモードDへの切り替えに対するコスト関数のうちの1つの切り替えのコスト関数であってよい。例えば、ダウンミックスモード切り替えのコスト関数は、例えば、現フレームの少なくとも1つの時間領域ステレオパラメータ(現フレームの少なくとも1つの時間領域ステレオパラメータは、例えば、現フレームのチャネルの組み合わせ比率係数を含む)、前フレームの少なくとも1つの時間領域ステレオパラメータ(前フレームの少なくとも1つの時間領域ステレオパラメータは、例えば、前フレームのチャネルの組み合わせ比率係数を含む)及び現フレームの左側チャネル信号と右側チャネル信号のうちの少なくとも1つのパラメータに基づいて構成されてよい。
実際の適用では、切り替えのコスト関数は、具体的には、様々な方式で構成されてよい。以下では、例を用いて説明を提供する。
例えば、現フレームのダウンミックスモードAからダウンミックスモードBへの切り替えに対するコスト関数は、
Figure 0007088450000058
であってよく、
α2_pre=1-α1_pre
α=1-α
であり、Cost_ABは、ダウンミックスモードAからダウンミックスモードBへの切り替えに対するコスト関数の値を表し、start_sample_Aは、ダウンミックスモードAからダウンミックスモードBへの切り替えに対するコスト関数の計算開始サンプリングポイントを表し、end_sample_Aは、ダウンミックスモードAからダウンミックスモードBへの切り替えに対するコスト関数の計算終了サンプリングポイントを表し、start_sample_Aは、0より大きく、かつ、N-1より小さい整数であり、end_sample_Aは、0より大きく、かつ、N-1より小さい整数であり、start_sample_Aは、end_sample_Aより小さく、
例えば、end_sample_A-start_sample_Aの値の範囲は、[60、200]であってよく、例えば、end_sample_A-start_sample_Aは、60、69、80、100、120、150、180、191、200又は別の値に等しく、
nは、サンプリングポイントのシーケンス番号を表し、Nはフレームの長さを表し、
(n)は、現フレームの左側チャネル信号を表し、X(n)は、現フレームの右側チャネル信号を表し、
α=ratio_SMであり、ratio_SMは、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表し、
α1_pre=tdm_last_ratioであり、tdm_last_ratioは、前フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表す。
別の例として、現フレームのダウンミックスモードAからダウンミックスモードCへの切り替えに対するコスト関数は、
Figure 0007088450000059
であってよく、
α2_pre=1-α1_pre
α=1-α
であり、Cost_ACは、ダウンミックスモードAからダウンミックスモードCへの切り替えに対するコスト関数の値を表し、start_sample_Aは、ダウンミックスモードAからダウンミックスモードCへの切り替えに対するコスト関数の計算開始サンプリングポイントを表し、end_sample_Aは、ダウンミックスモードAからダウンミックスモードCへの切り替えに対するコスト関数の計算終了サンプリングポイントを表し、start_sample_Aは、0より大きく、かつ、N-1より小さい整数であり、end_sample_Aは、0より大きく、かつ、N-1より小さい整数であり、start_sample_Aは、end_sample_Aより小さく、
nは、サンプリングポイントのシーケンス番号を表し、Nはフレームの長さを表し、
(n)は、現フレームの左側チャネル信号を表し、X(n)は、現フレームの右側チャネル信号を表し、
α=ratio_SMであり、ratio_SMは、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表し、
α1_pre=tdm_last_ratioであり、tdm_last_ratioは、前フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表す。
別の例として、現フレームのダウンミックスモードBからダウンミックスモードAへの切り替えに対するコスト関数は、
Figure 0007088450000060
であってよく、
α2_pre=1-α1_pre
α=1-α
であり、Cost_BAは、ダウンミックスモードBからダウンミックスモードAへの切り替えに対するコスト関数の値を表し、start_sample_Bは、ダウンミックスモードBからダウンミックスモードAへの切り替えに対するコスト関数の計算開始サンプリングポイントを表し、end_sample_Bは、ダウンミックスモードBからダウンミックスモードAへの切り替えに対するコスト関数の計算終了サンプリングポイントを表し、start_sample_Bは、0より大きく、かつ、N-1より小さい整数であり、end_sample_Bは、0より大きく、かつ、N-1より小さい整数であり、start_sample_Bは、end_sample_Bより小さく、
例えば、end_sample_B-start_sample_Bの値の範囲は、[60、200]であってよく、例えば、end_sample_B-start_sample_Bは、60、67、80、100、120、150、180、191、200又は別の値に等しく、
nは、サンプリングポイントのシーケンス番号を表し、Nはフレームの長さを表し、
(n)は、現フレームの左側チャネル信号を表し、X(n)は、現フレームの右側チャネル信号を表し、
α=ratioであり、ratioは、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表し、
α1_pre=tdm_last_ratio_SMであり、tdm_last_ratio_SMは、前フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表す。
別の例として、現フレームのダウンミックスモードBからダウンミックスモードDへの切り替えに対するコスト関数は、
Figure 0007088450000061
であってよく、
α2_pre=1-α1_pre
α=1-α
であり、Cost_BDは、ダウンミックスモードBからダウンミックスモードDへの切り替えに対するコスト関数の値を表し、start_sample_Bは、ダウンミックスモードBからダウンミックスモードDへの切り替えに対するコスト関数の計算開始サンプリングポイントを表し、end_sample_Bは、ダウンミックスモードBからダウンミックスモードDへの切り替えに対するコスト関数の計算終了サンプリングポイントを表し、start_sample_Bは、0より大きく、かつ、N-1より小さい整数であり、end_sample_Bは、0より大きく、かつ、N-1より小さい整数であり、start_sample_Bは、end_sample_Bより小さく、
例えば、end_sample_B-start_sample_Bの値の範囲は、[60、200]であってよく、例えば、end_sample_B-start_sample_Bは、60、67、80、100、120、150、180、191、200又は別の値に等しく、
nは、サンプリングポイントのシーケンス番号を表し、Nはフレームの長さを表し
(n)は、現フレームの左側チャネル信号を表し、X(n)は、現フレームの右側チャネル信号を表し、
α=ratioであり、ratioは、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表し、
α1_pre=tdm_last_ratio_SMであり、tdm_last_ratio_SMは、前フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表す。
別の例として、現フレームのダウンミックスモードCからダウンミックスモードDへの切り替えに対するコスト関数は、
Figure 0007088450000062
であってよく、
α2_pre=1-α1_pre
α=1-α
であり、Cost_CDは、ダウンミックスモードCからダウンミックスモードDへの切り替えに対するコスト関数の値を表し、start_sample_Cは、ダウンミックスモードCからダウンミックスモードDへの切り替えに対するコスト関数の計算開始サンプリングポイントを表し、end_sample_Cは、ダウンミックスモードCからダウンミックスモードDへの切り替えに対するコスト関数の計算終了サンプリングポイントを表し、start_sample_Cは、0より大きく、かつ、N-1より小さい整数であり、end_sample_Cは、0より大きく、かつ、N-1より小さい整数であり、start_sample_Cは、end_sample_Cより小さく、
例えば、end_sample_C-start_sample_Cの値の範囲は、[60、200]であってよく、例えば、end_sample_C-start_sample_Cは、60、71、80、100、120、150、180、191、200又は別の値に等しく、
nは、サンプリングポイントのシーケンス番号を表し、Nはフレームの長さを表し、
(n)は、現フレームの左側チャネル信号を表し、X(n)は、現フレームの右側チャネル信号を表し、
α=ratioであり、ratioは、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表し、
α1_pre=tdm_last_ratio_SMであり、tdm_last_ratio_SMは、前フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表す。
別の例として、現フレームのダウンミックスモードCからダウンミックスモードAへの切り替えに対するコスト関数は、
Figure 0007088450000063
であってよく、
α2_pre=1-α1_pre
α=1-α
であり、Cost_CAは、ダウンミックスモードCからダウンミックスモードAへの切り替えに対するコスト関数の値を表し、start_sample_Cは、ダウンミックスモードCからダウンミックスモードAへの切り替えに対するコスト関数の計算開始サンプリングポイントを表し、end_sample_Cは、ダウンミックスモードCからダウンミックスモードAへの切り替えに対するコスト関数の計算終了サンプリングポイントを表し、start_sample_Cは、0より大きく、かつ、N-1より小さい整数であり、end_sample_Cは、0より大きく、かつ、N-1より小さい整数であり、start_sample_Cは、end_sample_Cより小さく、
例えば、end_sample_C-start_sample_Cの値の範囲は、[60、200]であってよく、例えば、end_sample_C-start_sample_Cは、60、71、80、100、120、150、180、191、200又は別の値に等しく、
nは、サンプリングポイントのシーケンス番号を表し、Nはフレームの長さを表し、
(n)は、現フレームの左側チャネル信号を表し、X(n)は、現フレームの右側チャネル信号を表し、
α=ratioであり、ratioは、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表し、
α1_pre=tdm_last_ratio_SMであり、tdm_last_ratio_SMは、前フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表す。
別の例として、現フレームのダウンミックスモードDからダウンミックスモードCへの切り替えに対するコスト関数は、
Figure 0007088450000064
であってよく、
α2_pre=1-α1_pre
α=1-α
であり、Cost_DCは、ダウンミックスモードDからダウンミックスモードCへの切り替えに対するコスト関数の値を表し、start_sample_Dは、ダウンミックスモードDからダウンミックスモードCへの切り替えに対するコスト関数の計算開始サンプリングポイントを表し、end_sample_Dは、ダウンミックスモードDからダウンミックスモードCへの切り替えに対するコスト関数の計算終了サンプリングポイントを表し、start_sample_Dは、0より大きく、かつ、N-1より小さい整数であり、end_sample_Dは、0より大きく、かつ、N-1より小さい整数であり、start_sample_Dは、end_sample_Dより小さく、
例えば、end_sample_D-start_sample_Dの値の範囲は、[60、200]であってよく、例えば、end_sample_D-start_sample_Dは、60、73、80、100、120、150、180、191、200又は別の値に等しく、
nは、サンプリングポイントのシーケンス番号を表し、Nはフレームの長さを表し、
(n)は、現フレームの左側チャネル信号を表し、X(n)は、現フレームの右側チャネル信号を表し、
α=ratio_SMであり、ratio_SMは、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表し、
α1_pre=tdm_last_ratioであり、tdm_last_ratioは、前フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表す。
別の例として、現フレームのダウンミックスモードDからダウンミックスモードBへの切り替えに対するコスト関数は、
Figure 0007088450000065
であり、 α2_pre=1-α1_pre
α=1-α
であり、Cost_DBは、ダウンミックスモードDからダウンミックスモードBへの切り替えに対するコスト関数の値を表し、start_sample_Dは、ダウンミックスモードDからダウンミックスモードBへの切り替えに対するコスト関数の計算開始サンプリングポイントを表し、end_sample_Dは、ダウンミックスモードDからダウンミックスモードBへの切り替えに対するコスト関数の計算終了サンプリングポイントを表し、start_sample_Dは、0より大きく、かつ、N-1より小さい整数であり、end_sample_Dは、0より大きく、かつ、N-1より小さい整数であり、start_sample_Dは、end_sample_Dより小さく、
例えば、end_sample_D-start_sample_Dの値の範囲は、[60、200]であってよく、例えば、end_sample_D-start_sample_Dは、60、73、80、100、120、150、180、191、200又は別の値に等しく、
nは、サンプリングポイントのシーケンス番号を表し、Nはフレームの長さを表し、
(n)は、現フレームの左側チャネル信号を表し、X(n)は、現フレームの右側チャネル信号を表し、
α=ratio_SMであり、ratio_SMは、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表し、
α1_pre=tdm_last_ratioであり、tdm_last_ratioは、前フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表す。
以下では、例を用いて、現フレームの異なるダウンミックスモードに対応するいくつかのダウンミックス行列及びアップミックス行列を説明する。
例えば、M2Aは、現フレームのダウンミックスモードAに対応するダウンミックス行列を表し、M2Aは、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数に基づいて構成される。この場合、例えば、
Figure 0007088450000066
又は、
Figure 0007088450000067
であり、ratioは、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表す。
それに応じて、
Figure 0007088450000068
は、現フレームのダウンミックスモードAに対応するダウンミックス行列M2Aに対応するアップミックス行列を表し、
Figure 0007088450000069
は、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数に基づいて構成される。例えば、
Figure 0007088450000070
である、又は、
Figure 0007088450000071
である。
例えば、M2Bは、現フレームのダウンミックスモードBに対応するダウンミックス行列を表し、M2Bは、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数に基づいて構成される。例えば、
Figure 0007088450000072
であり、又は、
Figure 0007088450000073
であり、α=ratio_SMであり、α=1-ratio_SMであり、ratio_SMは、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表す。
それに応じて、
Figure 0007088450000074
は、現フレームのダウンミックスモードBに対応するダウンミックス行列M2Bに対応するアップミックス行列を表し、
Figure 0007088450000075
は、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数に基づいて構成される。例えば、
Figure 0007088450000076
であり、又は、
Figure 0007088450000077
であり、α=ratio_SMであり、α=1-ratio_SMであり、ratio_SMは、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表す。
例えば、M2Cは、現フレームのダウンミックスモードCに対応するダウンミックス行列を表し、M2Cは、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数に基づいて構成される。例えば、
Figure 0007088450000078
であり、又は、
Figure 0007088450000079
であり、α=ratio_SMであり、α=1-ratio_SMであり、ratio_SMは、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表す。
それに応じて、
Figure 0007088450000080
は、現フレームのダウンミックスモードCに対応するダウンミックス行列M2Cに対応するアップミックス行列を表し、
Figure 0007088450000081
は、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数に基づいて構成される。例えば、
Figure 0007088450000082
であり、又は、
Figure 0007088450000083
であり、α=ratio_SMであり、α=1-ratio_SMであり、ratio_SMは、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表す。
例えば、M2Dは、現フレームのダウンミックスモードDに対応するダウンミックス行列を表し、M2Dは、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数に基づいて構成される。例えば、
Figure 0007088450000084
であり、又は、
Figure 0007088450000085
であり、α=ratio_SMであり、α=1-ratio_SMであり、ratioは、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表す。
それに応じて、
Figure 0007088450000086
は、現フレームのダウンミックスモードDに対応するダウンミックス行列M2Dに対応するアップミックス行列を表し、
Figure 0007088450000087
は、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数に基づいて構成される。例えば、
Figure 0007088450000088
であり、又は、
Figure 0007088450000089
であり、α=ratioであり、α=1-ratioであり、ratioは、は、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表す。
以下では、例を用いて、前フレームに対するいくつかのダウンミックス行列及びアップミックス行列を説明する。
例えば、M1Aは、前フレームのダウンミックスモードAに対応するダウンミックス行列を表し、M1Aは、前フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数に基づいて構成される。この場合、例えば、
Figure 0007088450000090
であり、又は、
Figure 0007088450000091
であり、α1_pre=tdm_last_ratioであり、tdm_last_ratioは、前フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表す。
それに応じて、
Figure 0007088450000092
は、前フレームのダウンミックスモードAに対応するダウンミックス行列M1Aに対応するアップミックス行列を表し、(
Figure 0007088450000093
は、略して、前フレームのダウンミックスモードAに対応するアップミックス行列と称される)
Figure 0007088450000094
は、前フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数に基づいて構成される。例えば、
Figure 0007088450000095
であり、又は、
Figure 0007088450000096
であり、α1_pre=tdm_last_ratioであり、tdm_last_ratio_SMは、前フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表す。
例えば、M1Bは、前フレームのダウンミックスモードBに対応するダウンミックス行列を表し、M1Bは、前フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数に基づいて構成される。例えば、
Figure 0007088450000097
であり、又は、
Figure 0007088450000098
であり、α1_pre=tdm_last_ratio_SMであり、α2_pre=1-α1_preであり、tdm_last_ratio_SMは、前フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表す。
それに応じて、
Figure 0007088450000099
は、前フレームのダウンミックスモードBに対応するダウンミックス行列M1Bに対応するアップミックス行列を表し、
Figure 0007088450000100
は、前フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数に基づいて構成される。例えば、
Figure 0007088450000101
であり、又は、
Figure 0007088450000102
であり、α1_pre=tdm_last_ratio_SMであり、α2_pre=1-α1_preであり、tdm_last_ratio_SMは、前フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表す。
例えば、M1Cは、前フレームのダウンミックスモードCに対応するダウンミックス行列を表し、M1Cは、前フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数に基づいて構成される。例えば、
Figure 0007088450000103
であり、又は、
Figure 0007088450000104
であり、α1_pre=tdm_last_ratio_SMであり、α2_pre=1-α1_preであり、tdm_last_ratio_SMは、前フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表す。
それに応じて、
Figure 0007088450000105
は、前フレームのダウンミックスモードCに対応するダウンミックス行列M1Cに対応するアップミックス行列を表し、
Figure 0007088450000106
は、前フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数に基づいて構成される。例えば、
Figure 0007088450000107
であり、又は、
Figure 0007088450000108
であり、α1_pre=tdm_last_ratio_SMであり、α2_pre=1-α1_preであり、tdm_last_ratio_SMは、前フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表す。
例えば、 1D は、前フレームのダウンミックスモードDに対応するダウンミックス行列を表し、M1Dは、前フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数に基づいて構成される。例えば、
Figure 0007088450000109
であり、又は、
Figure 0007088450000110
であり、α1_pre=tdm_last_ratioであり、α2_pre=1-α1_preであり、tdm_last_ratioは、前フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表す。
それに応じて、
Figure 0007088450000111
は、前フレームのダウンミックスモードDに対応するダウンミックス行列M1Dに対応するアップミックス行列を表し、
Figure 0007088450000112
は、前フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数に基づいて構成される。例えば、
Figure 0007088450000113
であり、又は、
Figure 0007088450000114
であり、α1_pre=tdm_last_ratioであり、α2_pre=1-α1_preであり、tdm_last_ratioは、前フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表す。
ダウンミックス行列及びアップミックス行列についての前述の例示的な形態は、例であり、もちろん、実際の適用では、ダウンミックス行列及びアップミックス行列の他の形態があってもよいことが理解され得る。
以下では、エンコーディングモードの異なるシナリオ及びデコーディングモードの対応するシナリオを、例を用いてさらに説明する。異なるエンコーディングモードは、通常、異なる時間領域のダウンミックス処理方式に対応し、各エンコーディングモードはまた、1又は複数の時間領域のダウンミックス処理方式に対応し得ることが理解され得る。
以下では、まず、例を用いて、現フレームのダウンミックスモードが、前フレームのダウンミックスモードと同じであるいくつかのエンコーディング/デコーディング事例を説明する。
まず、現フレームのエンコーディングモードがダウンミックスモードAからダウンミックスモードAへのエンコーディングモードである場合のエンコーディングシナリオ及びデコーディングシナリオが例を用いて説明される。
例えば、現フレームのエンコーディングモードは、ダウンミックスモードAからダウンミックスモードAへのエンコーディングモードである。この場合、いくつかの可能なエンコーディングの実施例において、現フレームのプライマリチャネル信号及びセカンダリチャネル信号を取得するために、現フレームのエンコーディングモードに基づいて、現フレームの左側チャネル信号と右側チャネル信号に対して、時間領域のダウンミックス処理が実行される場合、
Figure 0007088450000115
であり、X(n)は、現フレームの左側チャネル信号を表し、X(n)は、現フレームの右側チャネル信号を表し、Y(n)は、現フレームの、時間領域のダウンミックス処理を通じて取得されるプライマリチャネル信号を表し、X(n)は、現フレームの、時間領域のダウンミックス処理を通じて取得されるセカンダリチャネル信号を表し、nは、サンプリングポイントのシーケンス番号を表し、M2Aは、現フレームのダウンミックスモードAに対応するダウンミックス行列を表す。
それに応じて、対応するデコーディングシナリオでは、現フレームの再構築された左側チャネル信号及び右側チャネル信号を取得するために、現フレームのエンコーディングモードに基づいて、現フレームのデコーディングされたプライマリチャネル信号及びセカンダリチャネル信号に対して、時間領域のアップミックス処理が実行される場合、
Figure 0007088450000116
であり、nは、サンプリングポイントのシーケンス番号を表し、
Figure 0007088450000117
は、現フレームの再構築された左側チャネル信号を表し、
Figure 0007088450000118
は、現フレームの再構築された右側チャネル信号を表し、
Figure 0007088450000119
は、現フレームのデコードされたプライマリチャネル信号を表し、
Figure 0007088450000120
は、現フレームのデコードされたセカンダリチャネル信号を表し、
Figure 0007088450000121
は、現フレームのダウンミックスモードAに対応するアップミックス行列を表す。
別の例として、現フレームのエンコーディングモードは、ダウンミックスモードAからダウンミックスモードAへのエンコーディングモードである。この場合、いくつかの他の可能なエンコーディングの実施例において、現フレームのプライマリチャネル信号及びセカンダリチャネル信号を取得するために、現フレームのエンコーディングモードに基づいて、現フレームの左側チャネル信号と右側チャネル信号に対して、時間領域のダウンミックス処理が実行される場合、
Figure 0007088450000122
であり、
Figure 0007088450000123
であり、X(n)は、現フレームの左側チャネル信号を表し、X(n)は、現フレームの右側チャネル信号を表し、Y(n)は、現フレームの、時間領域のダウンミックス処理を通じて取得されるプライマリチャネル信号を表し、X(n)は、現フレームの、時間領域のダウンミックス処理を通じて取得されるセカンダリチャネル信号を表す。
それに応じて、現フレームの再構築された左側チャネル信号及び右側チャネル信号を取得するために、対応するデコーディングシナリオにおいて、現フレームのエンコーディングモードに基づいて、現フレームのデコーディングされたプライマリチャネル信号及びセカンダリチャネル信号に対して、時間領域のアップミックス処理が実行される場合、
Figure 0007088450000124
であり、
Figure 0007088450000125
であり、
nは、サンプリングポイントのシーケンス番号を表し、
Figure 0007088450000126
は、現フレームの再構築された左側チャネル信号を表し、
Figure 0007088450000127
は、現フレームの再構築された右側チャネル信号を表し、
Figure 0007088450000128
は、現フレームのデコードされたプライマリチャネル信号を表し、
Figure 0007088450000129
は、現フレームのデコードされたセカンダリチャネル信号を表し、upmixing_delayは、デコーディング遅延補償を表し、
delay_comは、エンコーディング遅延補償を表し、
nは、サンプリングポイントのシーケンス番号を表し、Nはフレームの長さ、例えば、n=0、1、・・・、N-1を表し、
1Aは、前フレームのダウンミックスモードAに対応するダウンミックス行列を表し、M2Aは、現フレームのダウンミックスモードAに対応するダウンミックス行列を表し、
Figure 0007088450000130
は、前フレームのダウンミックスモードAに対応するアップミックス行列を表し、
Figure 0007088450000131
、現フレームのダウンミックスモードAに対応するアップミックス行列を表す。
別の例として、現フレームのエンコーディングモードは、ダウンミックスモードAからダウンミックスモードAへのエンコーディングモードである。この場合、いくつかの他の可能な実施例において、現フレームnプライマリチャネル信号及びセカンダリチャネル信号を取得するために、現フレームのエンコーディングモードに基づいて、現フレームの左側チャネル信号と右側チャネル信号に対して、時間領域のダウンミックス処理が実行される場合、
Figure 0007088450000132
であり、
Figure 0007088450000133
であり、
Figure 0007088450000134
であり、
fade_in(n)は、フェードイン係数を表し、例えば、
Figure 0007088450000135
であり、もちろん、fade_in(n)は、代わりに、nについての別の機能的な関係性に基づくフェードイン係数であってよく、
fade_out(n)は、フェードアウト係数を表し、例えば、
Figure 0007088450000136
であり、もちろん、fade_out(n)は、代わりに、nについての別の機能的な関係性に基づくフェードアウト係数であってよい。
それに応じて、対応するデコーディングシナリオでは、現フレームの再構築された左側チャネル信号及び右側チャネル信号を取得するために、現フレームのエンコーディングモードに基づいて、現フレームのデコーディングされたプライマリチャネル信号及びセカンダリチャネル信号に対して、時間領域のアップミックス処理が実行される場合、
Figure 0007088450000137
であり、
Figure 0007088450000138
であり、
Figure 0007088450000139
であり、
fade_in(n)は、フェードイン係数を表し、例えば、
Figure 0007088450000140
であり、もちろん、fade_in(n)は、代わりに、nについての別の機能的な関係性に基づくフェードイン係数であってよく、
fade_out(n)は、フェードアウト係数を表し、例えば、
Figure 0007088450000141
であり、もちろん、fade_out(n)は、代わりに、nについての別の機能的な関係性に基づくフェードアウト係数であってよく、
NOVA_Aは、ダウンミックスモードAに対応する移行処理の長さを表し、NOVA_Aの値は、特定のシナリオの要件に基づいて設定されてよく、例えば、NOVA_Aは、3/Nに等しくてよい、又は、NOVA_Aは、Nより小さい別の値であってよい。
以下では、ダウンミックスモードBからダウンミックスモードBへのエンコーディングモードのシナリオを、例を用いて説明する。
例えば、現フレームのエンコーディングモードは、ダウンミックスモードBからダウンミックスモードBへのエンコーディングモードである。この場合、いくつかの可能な実施例において、現フレームのプライマリチャネル信号及びセカンダリチャネル信号を取得するために、現フレームのエンコーディングモードに基づいて、現フレームの左側チャネル信号と右側チャネル信号に対して、時間領域のダウンミックス処理が実行される場合、
Figure 0007088450000142
であり、X(n)は、現フレームの左側チャネル信号を表し、X(n)は、現フレームの右側チャネル信号を表し、Y(n)は、現フレームの、時間領域のダウンミックス処理を通じて取得されるプライマリチャネル信号を表し、X(n)は、現フレームの、時間領域のダウンミックス処理を通じて取得されるセカンダリチャネル信号を表し、nは、サンプリングポイントのシーケンス番号を表し、M2Bは、現フレームのダウンミックスモードBに対応するダウンミックス行列を表す。
別の例として、現フレームのエンコーディングモードは、ダウンミックスモードBからダウンミックスモードBへのエンコーディングモードである。この場合、いくつかの他の可能な実施例において、現フレームのプライマリチャネル信号及びセカンダリチャネル信号を取得するために、現フレームのエンコーディングモードに基づいて、現フレームの左側チャネル信号と右側チャネル信号に対して、時間領域のダウンミックス処理が実行される場合、
Figure 0007088450000143
であり、
Figure 0007088450000144
であり、X(n)は、現フレームの左側チャネル信号を表し、X(n)は、現フレームの右側チャネル信号を表し、Y(n)は、現フレームの、時間領域のダウンミックス処理を通じて取得されるプライマリチャネル信号を表し、X(n)は、現フレームの、時間領域のダウンミックス処理を通じて取得されるセカンダリチャネル信号を表し、
nは、サンプリングポイントのシーケンス番号を表し、Nはフレームの長さを表し、delay_comは、エンコーディング遅延補償を表す。
それに応じて、現フレームの再構築された左側チャネル信号及び右側チャネル信号を取得するために、対応するデコーディングシナリオにおいて、現フレームのエンコーディングモードに基づいて、現フレームのデコーディングされたプライマリチャネル信号及びセカンダリチャネル信号に対して、時間領域のアップミックス処理が実行される場合、
Figure 0007088450000145
であり、
Figure 0007088450000146
であり、
nは、サンプリングポイントのシーケンス番号を表し、
Figure 0007088450000147
は、現フレームの再構築された左側チャネル信号を表し、
Figure 0007088450000148
は、現フレームの再構築された右側チャネル信号を表し、
Figure 0007088450000149
は、現フレームのデコードされたプライマリチャネル信号を表し、
Figure 0007088450000150
は、現フレームのデコードされたセカンダリチャネル信号を表し、upmixing_delayは、デコーディング遅延補償を表し、
delay_comは、エンコーディング遅延補償を表し、
nは、サンプリングポイントのシーケンス番号を表し、Nはフレームの長さ、例えば、n=0、1、・・・、N-1を表し、
1Bは、前フレームのダウンミックスモードBに対応するダウンミックス行列を表し、M2Bは、現フレームのダウンミックスモードBに対応するダウンミックス行列を表し、
Figure 0007088450000151
は、前フレームのダウンミックスモードBに対応するアップミックス行列を表し、
Figure 0007088450000152
、現フレームのダウンミックスモードBに対応するアップミックス行列を表す。
別の例として、現フレームのエンコーディングモードは、ダウンミックスモードBからダウンミックスモードBへのエンコーディングモードである。この場合、いくつかの他の可能な実施例において、現フレームnプライマリチャネル信号及びセカンダリチャネル信号を取得するために、現フレームのエンコーディングモードに基づいて、現フレームの左側チャネル信号と右側チャネル信号に対して、時間領域のダウンミックス処理が実行される場合、
Figure 0007088450000153
であり、
Figure 0007088450000154
であり、
Figure 0007088450000155
であり、
fade_in(n)は、フェードイン係数を表し、例えば、
Figure 0007088450000156
であり、もちろん、fade_in(n)は、代わりに、nについての別の機能的な関係性に基づくフェードイン係数であってよく、
fade_out(n)は、フェードアウト係数を表し、例えば、
Figure 0007088450000157
であり、もちろん、fade_out(n)は、代わりに、nについての別の機能的な関係性に基づくフェードアウト係数であってよい。
それに応じて、対応するデコーディングシナリオでは、現フレームの再構築された左側チャネル信号及び右側チャネル信号を取得するために、現フレームのエンコーディングモードに基づいて、現フレームのデコーディングされたプライマリチャネル信号及びセカンダリチャネル信号に対して、時間領域のアップミックス処理が実行される場合、
Figure 0007088450000158
であり、
Figure 0007088450000159
であり、
Figure 0007088450000160
であり、
fade_in(n)は、フェードイン係数を表し、例えば、
Figure 0007088450000161
であり、もちろん、fade_in(n)は、代わりに、nについての別の機能的な関係性に基づくフェードイン係数であってよく、
fade_out(n)は、フェードアウト係数を表し、例えば、
Figure 0007088450000162
であり、もちろん、fade_out(n)は、代わりに、nについての別の機能的な関係性に基づくフェードアウト係数であってよく、
NOVA_Bは、ダウンミックスモードBに対応する移行処理の長さを表し、NOVA_Bの値は、特定のシナリオの要件に基づいて設定されてよく、例えば、NOVA_Bは、3/Nに等しくてよい、又は、NOVA_Bは、Nより小さい別の値であってよい。
以下では、ダウンミックスモードCからダウンミックスモードCへのエンコーディングモードのシナリオを、例を用いて説明する。
例えば、現フレームのエンコーディングモードは、ダウンミックスモードCからダウンミックスモードCへのエンコーディングモードである。この場合、いくつかの可能な実施例において、現フレームのプライマリチャネル信号及びセカンダリチャネル信号を取得するために、現フレームのエンコーディングモードに基づいて、現フレームの左側チャネル信号と右側チャネル信号に対して、時間領域のダウンミックス処理が実行される場合、
Figure 0007088450000163
であり、X(n)は、現フレームの左側チャネル信号を表し、X(n)は、現フレームの右側チャネル信号を表し、Y(n)は、現フレームの、時間領域のダウンミックス処理を通じて取得されるプライマリチャネル信号を表し、X(n)は、現フレームの、時間領域のダウンミックス処理を通じて取得されるセカンダリチャネル信号を表し、nは、サンプリングポイントのシーケンス番号を表し、M2Cは、現フレームのダウンミックスモードCに対応するダウンミックス行列を表す。
それに応じて、対応するデコーディングシナリオでは、現フレームの再構築された左側チャネル信号及び右側チャネル信号を取得するために、現フレームのエンコーディングモードに基づいて、現フレームのデコーディングされたプライマリチャネル信号及びセカンダリチャネル信号に対して、時間領域のアップミックス処理が実行される場合、
Figure 0007088450000164
であり、nは、サンプリングポイントのシーケンス番号を表し、
Figure 0007088450000165
は、現フレームの再構築された左側チャネル信号を表し、
Figure 0007088450000166
は、現フレームの再構築された右側チャネル信号を表し、
Figure 0007088450000167
は、現フレームのデコードされたプライマリチャネル信号を表し、
Figure 0007088450000168
は、現フレームのデコードされたセカンダリチャネル信号を表し、
Figure 0007088450000169
は、現フレームのダウンミックスモー対応するアップミックス行列を表す。
別の例として、現フレームのエンコーディングモードは、ダウンミックスモードCからダウンミックスモードCへのエンコーディングモードである。この場合、いくつかの他の可能な実施例では、現フレームのプライマリチャネル信号及びセカンダリチャネル信号を取得するために、現フレームのエンコーディングモードに基づいて、現フレームの左側チャネル信号と右側チャネル信号に対して、時間領域のダウンミックス処理が実行される場合、
Figure 0007088450000170
であり、
Figure 0007088450000171
であり、X(n)は、現フレームの左側チャネル信号を表し、X(n)は、現フレームの右側チャネル信号を表し、Y(n)は、現フレームの、時間領域のダウンミックス処理を通じて取得されるプライマリチャネル信号を表し、X(n)は、現フレームの、時間領域のダウンミックス処理を通じて取得されるセカンダリチャネル信号を表す。
それに応じて、現フレームの再構築された左側チャネル信号及び右側チャネル信号を取得するために、対応するデコーディングシナリオにおいて、現フレームのエンコーディングモードに基づいて、現フレームのデコーディングされたプライマリチャネル信号及びセカンダリチャネル信号に対して、時間領域のアップミックス処理が実行される場合、
Figure 0007088450000172
であり、
Figure 0007088450000173
であり、
nは、サンプリングポイントのシーケンス番号を表し、
Figure 0007088450000174
は、現フレームの再構築された左側チャネル信号を表し、
Figure 0007088450000175
は、現フレームの再構築された右側チャネル信号を表し、
Figure 0007088450000176
は、現フレームのデコードされたプライマリチャネル信号を表し、
Figure 0007088450000177
は、現フレームのデコードされたセカンダリチャネル信号を表し、upmixing_delayは、デコーディング遅延補償を表し、
delay_comは、エンコーディング遅延補償を表し、
nは、サンプリングポイントのシーケンス番号を表し、Nはフレームの長さ、例えば、n=0、1、・・・、N-1を表し、
1Cは、前フレームのダウンミックスモードCに対応するダウンミックス行列を表し、M2Cは、現フレームのダウンミックスモードCに対応するダウンミックス行列を表し、
Figure 0007088450000178
は、前フレームのダウンミックスモードCに対応するアップミックス行列を表し、
Figure 0007088450000179
、現フレームのダウンミックスモードCに対応するアップミックス行列を表す。
別の例として、現フレームのエンコーディングモードは、ダウンミックスモードCからダウンミックスモードCへのエンコーディングモードである。この場合、いくつかの他の可能な実施例において、現フレームnプライマリチャネル信号及びセカンダリチャネル信号を取得するために、現フレームのエンコーディングモードに基づいて、現フレームの左側チャネル信号と右側チャネル信号に対して、時間領域のダウンミックス処理が実行される場合、
Figure 0007088450000180
であり、
Figure 0007088450000181
であり、
Figure 0007088450000182
であり、
fade_in(n)は、フェードイン係数を表し、例えば、
Figure 0007088450000183
であり、もちろん、fade_in(n)は、代わりに、nについての別の機能的な関係性に基づくフェードイン係数であってよく、
fade_out(n)は、フェードアウト係数を表し、例えば、
Figure 0007088450000184
であり、もちろん、fade_out(n)は、代わりに、nについての別の機能的な関係性に基づくフェードアウト係数であってよい。
それに応じて、対応するデコーディングシナリオでは、現フレームの再構築された左側チャネル信号及び右側チャネル信号を取得するために、現フレームのエンコーディングモードに基づいて、現フレームのデコーディングされたプライマリチャネル信号及びセカンダリチャネル信号に対して、時間領域のアップミックス処理が実行される場合、
Figure 0007088450000185
であり、
Figure 0007088450000186
であり、
Figure 0007088450000187
であり、
fade_in(n)は、フェードイン係数を表し、例えば、
Figure 0007088450000188
であり、もちろん、fade_in(n)は、代わりに、nについての別の機能的な関係性に基づくフェードイン係数であってよく、
fade_out(n)は、フェードアウト係数を表し、例えば、
Figure 0007088450000189
であり、もちろん、fade_out(n)は、代わりに、nについての別の機能的な関係性に基づくフェードアウト係数であってよく、
NOVA_Cは、ダウンミックスモードCに対応する移行処理の長さを表し、NOVA_Cの値は、特定のシナリオの要件に基づいて設定されてよく、例えば、NOVA_Cは、3/Nに等しくてよい、又は、NOVA_Cは、Nより小さい別の値であってよい。
以下では、ダウンミックスモードDからダウンミックスモードDへのエンコーディングモードのシナリオを、例を用いて説明する。
例えば、現フレームのエンコーディングモードは、ダウンミックスモードDからダウンミックスモードDへのエンコーディングモードである。この場合、いくつかの可能な実施例において、現フレームのプライマリチャネル信号及びセカンダリチャネル信号を取得するために、現フレームのエンコーディングモードに基づいて、現フレームの左側チャネル信号と右側チャネル信号に対して、時間領域のダウンミックス処理が実行される場合、
Figure 0007088450000190
であり、X(n)は、現フレームの左側チャネル信号を表し、X(n)は、現フレームの右側チャネル信号を表し、Y(n)は、現フレームの、時間領域のダウンミックス処理を通じて取得されるプライマリチャネル信号を表し、X(n)は、現フレームの、時間領域のダウンミックス処理を通じて取得されるセカンダリチャネル信号を表し、nは、サンプリングポイントのシーケンス番号を表し、M2Dは、現フレームのダウンミックスモードDに対応するダウンミックス行列を表す。
それに応じて、対応するデコーディングシナリオでは、現フレームの再構築された左側チャネル信号及び右側チャネル信号を取得するために、現フレームのエンコーディングモードに基づいて、現フレームのデコーディングされたプライマリチャネル信号及びセカンダリチャネル信号に対して、時間領域のアップミックス処理が実行される場合、
Figure 0007088450000191
であり、nは、サンプリングポイントのシーケンス番号を表し、
Figure 0007088450000192
は、現フレームの再構築された左側チャネル信号を表し、
Figure 0007088450000193
は、現フレームの再構築された右側チャネル信号を表し、
Figure 0007088450000194
は、現フレームのデコードされたプライマリチャネル信号を表し、
Figure 0007088450000195
は、現フレームのデコードされたセカンダリチャネル信号を表し、
Figure 0007088450000196
は、現フレームのダウンミックスモードDに対応するアップミックス行列を表す。
別の例として、現フレームのエンコーディングモードは、ダウンミックスモードDからダウンミックスモードDへのエンコーディングモードである。この場合、いくつかの他の可能なエンコーディングの実施例において、現フレームのプライマリチャネル信号及びセカンダリチャネル信号を取得するために、現フレームのエンコーディングモードに基づいて、現フレームの左側チャネル信号と右側チャネル信号に対して、時間領域のダウンミックス処理が実行される場合、
Figure 0007088450000197
であり、
Figure 0007088450000198
であり、X(n)は、現フレームの左側チャネル信号を表し、X(n)は、現フレームの右側チャネル信号を表し、Y(n)は、現フレームの、時間領域のダウンミックス処理を通じて取得されるプライマリチャネル信号を表し、X(n)は、現フレームの、時間領域のダウンミックス処理を通じて取得されるセカンダリチャネル信号を表す。
それに応じて、現フレームの再構築された左側チャネル信号及び右側チャネル信号を取得するために、対応するデコーディングシナリオにおいて、現フレームのエンコーディングモードに基づいて、現フレームのデコーディングされたプライマリチャネル信号及びセカンダリチャネル信号に対して、時間領域のアップミックス処理が実行される場合、
Figure 0007088450000199
であり、
Figure 0007088450000200
であり、
nは、サンプリングポイントのシーケンス番号を表し、
Figure 0007088450000201
は、現フレームの再構築された左側チャネル信号を表し、
Figure 0007088450000202
は、現フレームの再構築された右側チャネル信号を表し、
Figure 0007088450000203
は、現フレームのデコードされたプライマリチャネル信号を表し、
Figure 0007088450000204
は、現フレームのデコードされたセカンダリチャネル信号を表し、upmixing_delayは、デコーディング遅延補償を表し、
delay_comは、エンコーディング遅延補償を表す。Nはフレームの長さを表し、例えば、n=0、1、・・・、N-1であり、
1Dは、前フレームのダウンミックスモードDに対応するダウンミックス行列を表し、M2Dは、現フレームのダウンミックスモードDに対応するダウンミックス行列を表し、
Figure 0007088450000205
は、前フレームのダウンミックスモードDに対応するアップミックス行列を表し、
Figure 0007088450000206
、現フレームのダウンミックスモードDに対応するアップミックス行列を表す。
別の例として、現フレームのエンコーディングモードは、ダウンミックスモードDからダウンミックスモードDへのエンコーディングモードである。この場合、いくつかの他の可能な実施例において、現フレームnプライマリチャネル信号及びセカンダリチャネル信号を取得するために、現フレームのエンコーディングモードに基づいて、現フレームの左側チャネル信号と右側チャネル信号に対して、時間領域のダウンミックス処理が実行される場合、
Figure 0007088450000207
であり、
Figure 0007088450000208
であり、
Figure 0007088450000209
であり、
fade_in(n)は、フェードイン係数を表し、例えば、
Figure 0007088450000210
であり、もちろん、fade_in(n)は、代わりに、nについての別の機能的な関係性に基づくフェードイン係数であってよく、
fade_out(n)は、フェードアウト係数を表し、例えば、
Figure 0007088450000211
であり、もちろん、fade_out(n)は、代わりに、nについての別の機能的な関係性に基づくフェードアウト係数であってよい。
それに応じて、対応するデコーディングシナリオでは、現フレームの再構築された左側チャネル信号及び右側チャネル信号を取得するために、現フレームのエンコーディングモードに基づいて、現フレームのデコーディングされたプライマリチャネル信号及びセカンダリチャネル信号に対して、時間領域のアップミックス処理が実行される場合、
Figure 0007088450000212
であり、
Figure 0007088450000213
であり、
Figure 0007088450000214
であり、
fade_in(n)は、フェードイン係数を表し、例えば、
Figure 0007088450000215
であり、もちろん、fade_in(n)は、代わりに、nについての別の機能的な関係性に基づくフェードイン係数であってよく、
fade_out(n)は、フェードアウト係数を表し、例えば、
Figure 0007088450000216
であり、もちろん、fade_out(n)は、代わりに、nについての別の機能的な関係性に基づくフェードアウト係数であってよく、
NOVA_Dは、ダウンミックスモードAに対応する移行処理の長さを表し、NOVA_Dの値は、特定のシナリオの要件に基づいて設定されてよく、例えば、NOVA_Dは、3/Nに等しくてよい、又は、NOVA_Dは、Nより小さい別の値であってよい。
以下では、現フレームのダウンミックスモードが、前フレームのダウンミックスモードとは異なるいくつかのエンコーディング/デコーディング事例を、例を用いて説明する。例えば、現フレームのダウンミックスモードが前フレームのダウンミックスモードとは異なる場合、デコーディング装置は、現フレームのエンコーディングモードに基づいて、現フレームの左側チャネル信号と右側チャネル信号に対してセグメント化された時間領域のアップミックス処理を実行してよい。例えば、現フレームのダウンミックスモードが前フレームのダウンミックスモードとは異なる場合、デコーディング/エンコーディング装置は、現フレームのエンコーディングモードに基づいて、現フレームのデコーディングされたプライマリチャネル信号及びセカンダリチャネル信号に対して、セグメント化された時間領域のアップミックス処理を実行してよい。
以下では、まず、ダウンミックスモードAからダウンミックスモードBへのエンコーディングモードのシナリオを、例を用いて説明する。
具体的には、例えば、現フレームのエンコーディングモードは、ダウンミックスモードAからダウンミックスモードBへのエンコーディングモードである。この場合、いくつかの他の可能な実施例において、現フレームnプライマリチャネル信号及びセカンダリチャネル信号を取得するために、現フレームのエンコーディングモードに基づいて、現フレームの左側チャネル信号と右側チャネル信号に対して、時間領域のダウンミックス処理が実行される場合、
Figure 0007088450000217
であり、
Figure 0007088450000218
であり、
Figure 0007088450000219
であり、
fade_in(n)は、フェードイン係数を表し、例えば、
Figure 0007088450000220
であり、もちろん、fade_in(n)は、代わりに、nについての別の機能的な関係性に基づくフェードイン係数であってよく、
fade_out(n)は、フェードアウト係数を表し、例えば、
Figure 0007088450000221
であり、もちろん、fade_out(n)は、代わりに、nについての別の機能的な関係性に基づくフェードアウト係数であってよく、
(n)は、現フレームの左側チャネル信号を表し、X(n)は、現フレームの右側チャネル信号を表し、Y(n)は、現フレームの、時間領域のダウンミックス処理を通じて取得されるプライマリチャネル信号を表し、X(n)は、現フレームの、時間領域のダウンミックス処理を通じて取得されるセカンダリチャネル信号を表す。
それに応じて、対応するデコーディングシナリオでは、現フレームの再構築された左側チャネル信号及び右側チャネル信号を取得するために、現フレームのエンコーディングモードに基づいて、現フレームのデコーディングされたプライマリチャネル信号及びセカンダリチャネル信号に対して、時間領域のアップミックス処理が実行される場合、
Figure 0007088450000222
であり、
Figure 0007088450000223
であり、
Figure 0007088450000224
であり、
fade_in(n)は、フェードイン係数を表し、例えば、
Figure 0007088450000225
であり、もちろん、fade_in(n)は、代わりに、nについての別の機能的な関係性に基づくフェードイン係数であってよく、
fade_out(n)は、フェードアウト係数を表し、例えば、
Figure 0007088450000226
であり、もちろん、fade_out(n)は、代わりに、nについての別の機能的な関係性に基づくフェードアウト係数であってよく、
nは、サンプリングポイントのシーケンス番号を表し、
Figure 0007088450000227
は、現フレームの再構築された左側チャネル信号を表し、
Figure 0007088450000228
は、現フレームの再構築された右側チャネル信号を表し、
Figure 0007088450000229
は、現フレームのデコードされたプライマリチャネル信号であり、
Figure 0007088450000230
は、現フレームのデコードされたセカンダリチャネル信号を表し、
NOVA_ABは、ダウンミックスモードAからダウンミックスモードBへの切り替えに対応する移行処理の長さを表し、NOVA_ABの値は、特定のシナリオの要件に基づいて設定されてよく、例えば、NOVA_ABは、3/Nに等しくてよい、又は、NOVA_ABは、Nより小さい別の値であってよい。Nはフレームの長さを表し、例えば、n=0、1、・・・、N-1であり、
delay_comは、エンコーディング遅延補償を表し、upmixing_delayは、デコーディング遅延補償を表し、
1Aは、前フレームのダウンミックスモードAに対応するダウンミックス行列を表し、M2Bは、現フレームのダウンミックスモードBに対応するダウンミックス行列を表し、
Figure 0007088450000231
は、前フレームのダウンミックスモードAに対応するアップミックス行列を表し、
Figure 0007088450000232
は、現フレームのダウンミックスモードBに対応するアップミックス行列を表す。
以下では、ダウンミックスモードAからダウンミックスモードCへのエンコーディングモードのシナリオを、例を用いて説明する。
具体的には、例えば、現フレームのエンコーディングモードは、ダウンミックスモードAからダウンミックスモードCへのエンコーディングモードである。この場合、いくつかの他の可能な実施例において、現フレームnプライマリチャネル信号及びセカンダリチャネル信号を取得するために、現フレームのエンコーディングモードに基づいて、現フレームの左側チャネル信号と右側チャネル信号に対して、時間領域のダウンミックス処理が実行される場合、
Figure 0007088450000233
であり、
Figure 0007088450000234
であり、
Figure 0007088450000235
であり、
fade_in(n)は、フェードイン係数を表し、例えば、
Figure 0007088450000236
であり、もちろん、fade_in(n)は、代わりに、nについての別の機能的な関係性に基づくフェードイン係数であってよく、
fade_out(n)は、フェードアウト係数を表し、例えば、
Figure 0007088450000237
であり、もちろん、fade_out(n)は、代わりに、nについての別の機能的な関係性に基づくフェードアウト係数であってよく、
(n)は、現フレームの左側チャネル信号を表し、X(n)は、現フレームの右側チャネル信号を表し、Y(n)は、現フレームの、時間領域のダウンミックス処理を通じて取得されるプライマリチャネル信号を表し、X(n)は、現フレームの、時間領域のダウンミックス処理を通じて取得されるセカンダリチャネル信号を表す。
それに応じて、対応するデコーディングシナリオでは、現フレームの再構築された左側チャネル信号及び右側チャネル信号を取得するために、現フレームのエンコーディングモードに基づいて、現フレームのデコーディングされたプライマリチャネル信号及びセカンダリチャネル信号に対して、時間領域のアップミックス処理が実行される場合、
Figure 0007088450000238
であり、
Figure 0007088450000239
であり、
Figure 0007088450000240
であり、
fade_in(n)は、フェードイン係数を表し、例えば、
Figure 0007088450000241
であり、もちろん、fade_in(n)は、代わりに、nについての別の機能的な関係性に基づくフェードイン係数であってよく、
fade_out(n)は、フェードアウト係数を表し、例えば、
Figure 0007088450000242
であり、もちろん、fade_out(n)は、代わりに、nについての別の機能的な関係性に基づくフェードアウト係数であってよく、
nは、サンプリングポイントのシーケンス番号を表し、
Figure 0007088450000243
は、現フレームの再構築された左側チャネル信号を表し、
Figure 0007088450000244
は、現フレームの再構築された右側チャネル信号を表し、
Figure 0007088450000245
は、現フレームのデコードされたプライマリチャネル信号であり、
Figure 0007088450000246
は、現フレームのデコードされたセカンダリチャネル信号を表し、
NOVA_ACは、ダウンミックスモードAからダウンミックスモードCへの切り替えに対応する移行処理の長さを表し、NOVA_ACの値は、特定のシナリオの要件に基づいて設定されてよく、例えば、NOVA_ACは、3/Nに等しくてよい、又は、NOVA_ACは、Nより小さい別の値であってよい。Nはフレームの長さを表し、例えば、n=0、1、・・・、N-1であり、
delay_comは、エンコーディング遅延補償を表し、upmixing_delayは、デコーディング遅延補償を表し、
1Aは、前フレームのダウンミックスモードAに対応するダウンミックス行列を表し、M2Cは、現フレームのダウンミックスモードCに対応するダウンミックス行列を表し、
Figure 0007088450000247
は、前フレームのダウンミックスモードAに対応するアップミックス行列を表し、
Figure 0007088450000248
は、現フレームのダウンミックスモードCに対応するアップミックス行列を表す。
以下では、ダウンミックスモードBからダウンミックスモードAへのエンコーディングモードのシナリオを、例を用いて説明する。
具体的には、例えば、現フレームのエンコーディングモードは、ダウンミックスモードBからダウンミックスモードAへのエンコーディングモードである。この場合、いくつかの他の可能な実施例において、現フレームnプライマリチャネル信号及びセカンダリチャネル信号を取得するために、現フレームのエンコーディングモードに基づいて、現フレームの左側チャネル信号と右側チャネル信号に対して、時間領域のダウンミックス処理が実行される場合、
Figure 0007088450000249
であり、
Figure 0007088450000250
であり、
Figure 0007088450000251
であり、
fade_in(n)は、フェードイン係数を表し、例えば、
Figure 0007088450000252
であり、もちろん、fade_in(n)は、代わりに、nについての別の機能的な関係性に基づくフェードイン係数であってよく、
fade_out(n)は、フェードアウト係数を表し、例えば、
Figure 0007088450000253
であり、もちろん、fade_out(n)は、代わりに、nについての別の機能的な関係性に基づくフェードアウト係数であってよく、
(n)は、現フレームの左側チャネル信号を表し、X(n)は、現フレームの右側チャネル信号を表し、Y(n)は、現フレームの、時間領域のダウンミックス処理を通じて取得されるプライマリチャネル信号を表し、X(n)は、現フレームの、時間領域のダウンミックス処理を通じて取得されるセカンダリチャネル信号を表す。
それに応じて、対応するデコーディングシナリオでは、現フレームの再構築された左側チャネル信号及び右側チャネル信号を取得するために、現フレームのエンコーディングモードに基づいて、現フレームのデコーディングされたプライマリチャネル信号及びセカンダリチャネル信号に対して、時間領域のアップミックス処理が実行される場合、
Figure 0007088450000254
であり、
Figure 0007088450000255
であり、
Figure 0007088450000256
であり、
fade_in(n)は、フェードイン係数を表し、例えば、
Figure 0007088450000257
であり、もちろん、fade_in(n)は、代わりに、nについての別の機能的な関係性に基づくフェードイン係数であってよく、
fade_out(n)は、フェードアウト係数を表し、例えば、
Figure 0007088450000258
であり、もちろん、fade_out(n)は、代わりに、nについての別の機能的な関係性に基づくフェードアウト係数であってよく、
nは、サンプリングポイントのシーケンス番号を表し、
Figure 0007088450000259
は、現フレームの再構築された左側チャネル信号を表し、
Figure 0007088450000260
は、現フレームの再構築された右側チャネル信号を表し、
Figure 0007088450000261
は、現フレームのデコードされたプライマリチャネル信号であり、
Figure 0007088450000262
は、現フレームのデコードされたセカンダリチャネル信号を表し、
NOVA_BAは、ダウンミックスモードBからダウンミックスモードAへの切り替えに対応する移行処理の長さを表し、NOVA_BAの値は、特定のシナリオの要件に基づいて設定されてよく、例えば、NOVA_BAは、3/Nに等しくてよい、又は、NOVA_BAは、Nより小さい別の値であってよい。Nはフレームの長さを表し、例えば、n=0、1、・・・、N-1であり、
delay_comは、エンコーディング遅延補償を表し、upmixing_delayは、デコーディング遅延補償を表し、
1Bは、前フレームのダウンミックスモードBに対応するダウンミックス行列を表し、M2Aは、現フレームのダウンミックスモードAに対応するダウンミックス行列を表し、
Figure 0007088450000263
は、前フレームのダウンミックスモードBに対応するアップミックス行列を表し、
Figure 0007088450000264
は、現フレームのダウンミックスモードAに対応するアップミックス行列を表す。
以下では、ダウンミックスモードBからダウンミックスモードDへのエンコーディングモードのシナリオを、例を用いて説明する。
具体的には、例えば、現フレームのエンコーディングモードは、ダウンミックスモードBからダウンミックスモードDへのエンコーディングモードである。この場合、いくつかの他の可能な実施例において、現フレームnプライマリチャネル信号及びセカンダリチャネル信号を取得するために、現フレームのエンコーディングモードに基づいて、現フレームの左側チャネル信号と右側チャネル信号に対して、時間領域のダウンミックス処理が実行される場合、
Figure 0007088450000265
であり、
Figure 0007088450000266
であり、
Figure 0007088450000267
であり、
fade_in(n)は、フェードイン係数を表し、例えば、
Figure 0007088450000268
であり、もちろん、fade_in(n)は、代わりに、nについての別の機能的な関係性に基づくフェードイン係数であってよく、
fade_out(n)は、フェードアウト係数を表し、例えば、
Figure 0007088450000269
であり、もちろん、fade_out(n)は、代わりに、nについての別の機能的な関係性に基づくフェードアウト係数であってよく、
(n)は、現フレームの左側チャネル信号を表し、X(n)は、現フレームの右側チャネル信号を表し、Y(n)は、現フレームの、時間領域のダウンミックス処理を通じて取得されるプライマリチャネル信号を表し、X(n)は、現フレームの、時間領域のダウンミックス処理を通じて取得されるセカンダリチャネル信号を表す。
それに応じて、対応するデコーディングシナリオでは、現フレームの再構築された左側チャネル信号及び右側チャネル信号を取得するために、現フレームのエンコーディングモードに基づいて、現フレームのデコーディングされたプライマリチャネル信号及びセカンダリチャネル信号に対して、時間領域のアップミックス処理が実行される場合、
Figure 0007088450000270
であり、
Figure 0007088450000271
であり、
Figure 0007088450000272
であり、
fade_in(n)は、フェードイン係数を表し、例えば、
Figure 0007088450000273
であり、もちろん、fade_in(n)は、代わりに、nについての別の機能的な関係性に基づくフェードイン係数であってよく、
fade_out(n)は、フェードアウト係数を表し、例えば、
Figure 0007088450000274
であり、もちろん、fade_out(n)は、代わりに、nについての別の機能的な関係性に基づくフェードアウト係数であってよく、
nは、サンプリングポイントのシーケンス番号を表し、
Figure 0007088450000275
は、現フレームの再構築された左側チャネル信号を表し、
Figure 0007088450000276
は、現フレームの再構築された右側チャネル信号を表し、
Figure 0007088450000277
は、現フレームのデコードされたプライマリチャネル信号であり、
Figure 0007088450000278
は、現フレームのデコードされたセカンダリチャネル信号を表し、
NOVA_BDは、ダウンミックスモードBからダウンミックスモードDへの切り替えに対応する移行処理の長さを表し、NOVA_BDの値は、特定のシナリオの要件に基づいて設定されてよく、例えば、NOVA_BDは、3/Nに等しくてよい、又は、NOVA_BAは、Nより小さい別の値であってよい。Nはフレームの長さを表し、例えば、n=0、1、・・・、N-1であり、
delay_comは、エンコーディング遅延補償を表し、upmixing_delayは、デコーディング遅延補償を表し、
1Bは、前フレームのダウンミックスモードBに対応するダウンミックス行列を表し、M2Dは、現フレームのダウンミックスモードDに対応するダウンミックス行列を表し、
Figure 0007088450000279
は、前フレームのダウンミックスモードBに対応するアップミックス行列を表し、
Figure 0007088450000280
は、現フレームのダウンミックスモードDに対応するアップミックス行列を表す。
以下では、ダウンミックスモードCからダウンミックスモードAへのエンコーディングモードのシナリオを、例を用いて説明する。
具体的には、例えば、現フレームのエンコーディングモードは、ダウンミックスモードCからダウンミックスモードAへのエンコーディングモードである。この場合、いくつかの他の可能な実施例において、現フレームnプライマリチャネル信号及びセカンダリチャネル信号を取得するために、現フレームのエンコーディングモードに基づいて、現フレームの左側チャネル信号と右側チャネル信号に対して、時間領域のダウンミックス処理が実行される場合、
Figure 0007088450000281
であり、
Figure 0007088450000282
であり、
Figure 0007088450000283
であり、
fade_in(n)は、フェードイン係数を表し、例えば、
Figure 0007088450000284
であり、もちろん、fade_in(n)は、代わりに、nについての別の機能的な関係性に基づくフェードイン係数であってよく、
fade_out(n)は、フェードアウト係数を表し、例えば、
Figure 0007088450000285
であり、もちろん、fade_out(n)は、代わりに、nについての別の機能的な関係性に基づくフェードアウト係数であってよく、
(n)は、現フレームの左側チャネル信号を表し、X(n)は、現フレームの右側チャネル信号を表し、Y(n)は、現フレームの、時間領域のダウンミックス処理を通じて取得されるプライマリチャネル信号を表し、X(n)は、現フレームの、時間領域のダウンミックス処理を通じて取得されるセカンダリチャネル信号を表す。
それに応じて、対応するデコーディングシナリオでは、現フレームの再構築された左側チャネル信号及び右側チャネル信号を取得するために、現フレームのエンコーディングモードに基づいて、現フレームのデコーディングされたプライマリチャネル信号及びセカンダリチャネル信号に対して、時間領域のアップミックス処理が実行される場合、
Figure 0007088450000286
であり、
Figure 0007088450000287
であり、
Figure 0007088450000288
であり、
fade_in(n)は、フェードイン係数を表し、例えば、
Figure 0007088450000289
であり、もちろん、fade_in(n)は、代わりに、nについての別の機能的な関係性に基づくフェードイン係数であってよく、
fade_out(n)は、フェードアウト係数を表し、例えば、
Figure 0007088450000290
であり、もちろん、fade_out(n)は、代わりに、nについての別の機能的な関係性に基づくフェードアウト係数であってよく、
nは、サンプリングポイントのシーケンス番号を表し、
Figure 0007088450000291
は、現フレームの再構築された左側チャネル信号を表し、
Figure 0007088450000292
は、現フレームの再構築された右側チャネル信号を表し、
Figure 0007088450000293
は、現フレームのデコードされたプライマリチャネル信号であり、
Figure 0007088450000294
は、現フレームのデコードされたセカンダリチャネル信号を表し、
NOVA_CAは、ダウンミックスモードCからダウンミックスモードAへの切り替えに対応する移行処理の長さを表し、NOVA_CAの値は、特定のシナリオの要件に基づいて設定されてよく、例えば、NOVA_CAは、3/Nに等しくてよい、又は、NOVA_CAは、Nより小さい別の値であってよく、
nは、サンプリングポイントのシーケンス番号を表し、
Nは、フレームの長さを表し、
delay_comは、エンコーディング遅延補償を表し、
upmixing_delayは、デコーディング遅延補償を表し、
1Cは、前フレームのダウンミックスモードCに対応するダウンミックス行列を表し、M2Aは、現フレームのダウンミックスモードAに対応するダウンミックス行列を表し、
Figure 0007088450000295
は、前フレームのダウンミックスモードCに対応するアップミックス行列を表し、
Figure 0007088450000296
は、現フレームのダウンミックスモードAに対応するアップミックス行列を表す。
以下では、ダウンミックスモードCからダウンミックスモードDへのエンコーディングモードのシナリオを、例を用いて説明する。
具体的には、例えば、現フレームのエンコーディングモードは、ダウンミックスモードCからダウンミックスモードDへのエンコーディングモードである。この場合、いくつかの他の可能な実施例において、現フレームnプライマリチャネル信号及びセカンダリチャネル信号を取得するために、現フレームのエンコーディングモードに基づいて、現フレームの左側チャネル信号と右側チャネル信号に対して、時間領域のダウンミックス処理が実行される場合、
Figure 0007088450000297
であり、
Figure 0007088450000298
であり、
Figure 0007088450000299
であり、
fade_in(n)は、フェードイン係数を表し、例えば、
Figure 0007088450000300
であり、もちろん、fade_in(n)は、代わりに、nについての別の機能的な関係性に基づくフェードイン係数であってよく、
fade_out(n)は、フェードアウト係数を表し、例えば、
Figure 0007088450000301
であり、もちろん、fade_out(n)は、代わりに、nについての別の機能的な関係性に基づくフェードアウト係数であってよく、
(n)は、現フレームの左側チャネル信号を表し、X(n)は、現フレームの右側チャネル信号を表し、Y(n)は、現フレームの、時間領域のダウンミックス処理を通じて取得されるプライマリチャネル信号を表し、X(n)は、現フレームの、時間領域のダウンミックス処理を通じて取得されるセカンダリチャネル信号を表す。
それに応じて、対応するデコーディングシナリオでは、現フレームの再構築された左側チャネル信号及び右側チャネル信号を取得するために、現フレームのエンコーディングモードに基づいて、現フレームのデコーディングされたプライマリチャネル信号及びセカンダリチャネル信号に対して、時間領域のアップミックス処理が実行される場合、
Figure 0007088450000302
であり、
Figure 0007088450000303
であり、
Figure 0007088450000304
であり、
fade_in(n)は、フェードイン係数を表し、例えば、
Figure 0007088450000305
であり、もちろん、fade_in(n)は、代わりに、nについての別の機能的な関係性に基づくフェードイン係数であってよく、
fade_out(n)は、フェードアウト係数を表し、例えば、
Figure 0007088450000306
であり、もちろん、fade_out(n)は、代わりに、nについての別の機能的な関係性に基づくフェードアウト係数であってよく、
nは、サンプリングポイントのシーケンス番号を表し、
Figure 0007088450000307
は、現フレームの再構築された左側チャネル信号を表し、
Figure 0007088450000308
は、現フレームの再構築された右側チャネル信号を表し、
Figure 0007088450000309
は、現フレームのデコードされたプライマリチャネル信号であり、
Figure 0007088450000310
は、現フレームのデコードされたセカンダリチャネル信号を表し、
NOVA_CDは、ダウンミックスモードCからダウンミックスモードDへの切り替えに対応する移行処理の長さを表し、NOVA_CDの値は、特定のシナリオの要件に基づいて設定されてよく、例えば、NOVA_CDは、3/Nに等しくてよい、又は、NOVA_CDは、Nより小さい別の値であってよい。Nはフレームの長さを表し、例えば、n=0、1、・・・、N-1であり、
delay_comは、エンコーディング遅延補償を表し、upmixing_delayは、デコーディング遅延補償を表し、
1Cは、前フレームのダウンミックスモードCに対応するダウンミックス行列を表し、M2Dは、現フレームのダウンミックスモードDに対応するダウンミックス行列を表し、
Figure 0007088450000311
は、前フレームのダウンミックスモードCに対応するアップミックス行列を表し、
Figure 0007088450000312
は、現フレームのダウンミックスモードDに対応するアップミックス行列を表す。
以下では、ダウンミックスモードDからダウンミックスモードCへのエンコーディングモードのシナリオを、例を用いて説明する。
具体的には、例えば、現フレームのエンコーディングモードは、ダウンミックスモードDからダウンミックスモードCへのエンコーディングモードである。この場合、いくつかの可能な実施例において、現フレームnプライマリチャネル信号及びセカンダリチャネル信号を取得するために、現フレームのエンコーディングモードに基づいて、現フレームの左側チャネル信号と右側チャネル信号に対して、時間領域のダウンミックス処理が実行される場合、
Figure 0007088450000313
であり、
Figure 0007088450000314
であり、
Figure 0007088450000315
であり、
fade_in(n)は、フェードイン係数を表し、例えば、
Figure 0007088450000316
であり、もちろん、fade_in(n)は、代わりに、nについての別の機能的な関係性に基づくフェードイン係数であってよく、
fade_out(n)は、フェードアウト係数を表し、例えば、
Figure 0007088450000317
であり、もちろん、fade_out(n)は、代わりに、nについての別の機能的な関係性に基づくフェードアウト係数であってよく、
(n)は、現フレームの左側チャネル信号を表し、X(n)は、現フレームの右側チャネル信号を表し、Y(n)は、現フレームの、時間領域のダウンミックス処理を通じて取得されるプライマリチャネル信号を表し、X(n)は、現フレームの、時間領域のダウンミックス処理を通じて取得されるセカンダリチャネル信号を表す。
それに応じて、対応するデコーディングシナリオでは、現フレームの再構築された左側チャネル信号及び右側チャネル信号を取得するために、現フレームのエンコーディングモードに基づいて、現フレームのデコーディングされたプライマリチャネル信号及びセカンダリチャネル信号に対して、時間領域のアップミックス処理が実行される場合、
Figure 0007088450000318
であり、
Figure 0007088450000319
であり、
Figure 0007088450000320
であり、
fade_in(n)は、フェードイン係数を表し、例えば、
Figure 0007088450000321
であり、もちろん、fade_in(n)は、代わりに、nについての別の機能的な関係性に基づくフェードイン係数であってよく、
fade_out(n)は、フェードアウト係数を表し、例えば、
Figure 0007088450000322
であり、もちろん、fade_out(n)は、代わりに、nについての別の機能的な関係性に基づくフェードアウト係数であってよく、
nは、サンプリングポイントのシーケンス番号を表し、
Figure 0007088450000323
は、現フレームの再構築された左側チャネル信号を表し、
Figure 0007088450000324
は、現フレームの再構築された右側チャネル信号を表し、
Figure 0007088450000325
は、現フレームのデコードされたプライマリチャネル信号であり、
Figure 0007088450000326
は、現フレームのデコードされたセカンダリチャネル信号を表し、
NOVA_DCは、ダウンミックスモードDからダウンミックスモードCへの切り替えに対応する移行処理の長さを表し、NOVA_DCの値は、特定のシナリオの要件に基づいて設定されてよく、例えば、NOVA_DCは、3/Nに等しくてよい、又は、NOVA_DCは、Nより小さい別の値であってよく、
nは、サンプリングポイントのシーケンス番号を表し
Nは、フレームの長さを表し、
delay_comは、エンコーディング遅延補償を表し、
upmixing_delayは、デコーディング遅延補償を表し、
1Dは、前フレームのダウンミックスモードDに対応するダウンミックス行列を表し、M2Cは、現フレームのダウンミックスモードCに対応するダウンミックス行列を表し、
Figure 0007088450000327
は、前フレームのダウンミックスモードDに対応するアップミックス行列を表し、
Figure 0007088450000328
は、現フレームのダウンミックスモードCに対応するアップミックス行列を表す。
以下では、ダウンミックスモードDからダウンミックスモードBへのエンコーディングモードのシナリオを例を用いて説明する。
具体的には、例えば、現フレームのエンコーディングモードは、ダウンミックスモードDからダウンミックスモードBへのエンコーディングモードである。この場合、いくつかの可能な実施例において、現フレームnプライマリチャネル信号及びセカンダリチャネル信号を取得するために、現フレームのエンコーディングモードに基づいて、現フレームの左側チャネル信号と右側チャネル信号に対して、時間領域のダウンミックス処理が実行される場合、
Figure 0007088450000329
であり、
Figure 0007088450000330
であり、
Figure 0007088450000331
であり、
fade_in(n)は、フェードイン係数を表し、例えば、
Figure 0007088450000332
であり、もちろん、fade_in(n)は、代わりに、nについての別の機能的な関係性に基づくフェードイン係数であってよく、
fade_out(n)は、フェードアウト係数を表し、例えば、
Figure 0007088450000333
であり、もちろん、fade_out(n)は、代わりに、nについての別の機能的な関係性に基づくフェードアウト係数であってよく、
(n)は、現フレームの左側チャネル信号を表し、X(n)は、現フレームの右側チャネル信号を表し、Y(n)は、現フレームの、時間領域のダウンミックス処理を通じて取得されるプライマリチャネル信号を表し、X(n)は、現フレームの、時間領域のダウンミックス処理を通じて取得されるセカンダリチャネル信号を表す。
それに応じて、対応するデコーディングシナリオでは、現フレームの再構築された左側チャネル信号及び右側チャネル信号を取得するために、現フレームのエンコーディングモードに基づいて、現フレームのデコーディングされたプライマリチャネル信号及びセカンダリチャネル信号に対して、時間領域のアップミックス処理が実行される場合、
Figure 0007088450000334
であり、
Figure 0007088450000335
であり、
Figure 0007088450000336
であり、
fade_in(n)は、フェードイン係数を表し、例えば、
Figure 0007088450000337
であり、もちろん、fade_in(n)は、代わりに、nについての別の機能的な関係性に基づくフェードイン係数であってよく、
fade_out(n)は、フェードアウト係数を表し、例えば、
Figure 0007088450000338
であり、もちろん、fade_out(n)は、代わりに、nについての別の機能的な関係性に基づくフェードアウト係数であってよく、
nは、サンプリングポイントのシーケンス番号を表し、
Figure 0007088450000339
は、現フレームの再構築された左側チャネル信号を表し、
Figure 0007088450000340
は、現フレームの再構築された右側チャネル信号を表し、
Figure 0007088450000341
は、現フレームのデコードされたプライマリチャネル信号であり、
Figure 0007088450000342
は、現フレームのデコードされたセカンダリチャネル信号を表し、
NOVA_DBは、ダウンミックスモードDからダウンミックスモードBへの切り替えに対応する移行処理の長さを表し、NOVA_DBの値は、特定のシナリオの要件に基づいて設定されてよく、例えば、NOVA_DBは、3/Nに等しくてよい、又は、NOVA_DBは、Nより小さい別の値であってよい。Nはフレームの長さを表し、例えば、n=0、1、・・・、N-1であり、
delay_comは、エンコーディング遅延補償を表し、upmixing_delayは、デコーディング遅延補償を表し、
1Dは、前フレームのダウンミックスモードDに対応するダウンミックス行列を表し、M2Bは、現フレームのダウンミックスモードBに対応するダウンミックス行列を表し、
Figure 0007088450000343
は、前フレームのダウンミックスモードDに対応するアップミックス行列を表し、
Figure 0007088450000344
は、現フレームのダウンミックスモードBに対応するアップミックス行列を表す。
前述の例示的なエンコーディング/デコーディングシナリオにおいて、異なるダウンミックスモードに対応する移行処理の長さは、互いに異なっていてよく、部分的に同じであってよく、又は、完全に同じであってよいことが理解され得る。例えば、NOVA_A、NOVA_B、NOVA_C、NOVA_D、NOVA_DB及びNOVA_DCは、互いに異なっていよい、部分的に同じであってよい、又は、完全に同じであってよい。別の場合が類推により推定され得る。
前述の例示的なシナリオにおいて、現フレームの左側チャネル信号と右側チャネル信号は、具体的には、現フレームの元の左側チャネル信号及び右側チャネル信号であってよい(元の左側チャネル信号及び右側チャネル信号は、時間領域の前処理を受けていない左側チャネル信号及び右側チャネル信号である、例えば、サンプリングを通じて取得された左側チャネル信号と右側チャネル信号であってよい)、又は、時間領域の前処理を通じて取得された現フレームの左側チャネル信号及び右側チャネル信号であってよい、又は、時間領域の遅延調整処理を通じて取得された現フレームの左側チャネル信号と右側チャネル信号であってよい。
具体的には、例えば、
Figure 0007088450000345
であり、又は、
Figure 0007088450000346
であり、又は、
Figure 0007088450000347
であり、X(n)は、現フレームの元の左側チャネル信号を表し、X(n)は、現フレームの元の右側チャネル信号を表し、xL_HP(n)は、現フレームの、時間領域の前処理を通じて取得された左側チャネル信号を表し、xR_HP(n)は、現フレームの、時間領域の前処理を通じて取得された右側チャネル信号を表し、x'(n)は、現フレームの、遅延調整処理を通じて取得された左側チャネル信号を表し、x'(n)は、現フレームの、遅延調整処理を通じて取得された右側チャネル信号を表す。
前述のシナリオの例は、異なるエンコーディングモードについて、時間領域のアップミックス及び時間領域のダウンミックス処理方式の例を提供する。もちろん、実際の適用では、代わりに、前述の例に類似する他の方式が時間領域のアップミックス処理及びダウンミックス処理に用いられてよい。本願の実施形態は、前述の例における時間領域のアップミックス及び時間領域のダウンミックス処理方式に限定されるものではない。
図6は、本願の実施形態に係るオーディオエンコーディングモードを判定するための方法の概略フローチャートである。オーディオエンコーディングモードを判定するための方法の関連する段階は、エンコーディング装置により実施され得る。例えば、方法は、以下の段階を含み得る。
601、現フレームに対するチャネルの組み合わせスキームを判定する。
エンコーディング装置により、現フレームに対するチャネルの組み合わせスキームを判定する段階についての具体的な実装については、他の実施形態において関連する説明を参照されたい。詳細はここでは再び説明しない。
602、前フレームのダウンミックスモードと、現フレームに対するチャネルの組み合わせスキームとに基づいて、現フレームのエンコーディングモードを判定する。
前フレームのダウンミックスモードと、現フレームに対するチャネルの組み合わせスキームとに基づいて、エンコーディング装置により、現フレームのエンコーディングモードを判定する段階についての具体的な実装は、他の実施形態において関連する説明を参照されたい。詳細はここでは再び説明しない。
前述のエンコーディングシナリオでは、現フレームに対するチャネルの組み合わせスキームが判定される必要があることが理解され得る。これは、現フレームに対する複数の可能なチャネルの組み合わせスキームがあることを示す。1つのチャネル組み合わせスキームしかない従来の解決手段と比較して、これは、より良好な互換性を実現し、複数の可能なチャネルの組み合わせスキームと複数の可能なシナリオとの間で一致させるのに役立つ。
前述のエンコーディングシナリオでは、前フレームのダウンミックスモードと、現フレームに対するチャネルの組み合わせスキームとに基づいて、現フレームのエンコーディングモードが判定される必要があることが理解され得る。これは、現フレームの複数の可能なエンコーディングモードがあることを示す。1つのエンコーディングモードしかない従来の解決手段と比較して、これは、複数の可能なエンコーディングモード及びダウンミックスモードと、複数の可能なシナリオとの間のより良好な互換性及びマッチングを実現するのに役立つ。
図7は、本願の実施形態に係るオーディオエンコーディングモードを判定するための方法の概略フローチャートである。オーディオデコーディングモードを判定するための方法の関連する段階は、エンコーディング装置により実施されてよい。例えば、方法は、以下の段階を含み得る。
701、ビットストリームに基づいてデコーディングを実行して、現フレームのダウンミックスモードを判定する。
例えば、デコーディングは、ビットストリームに基づいて実行されることで、現フレームの、ビットストリームに含まれるダウンミックスモード識別子(現フレームのダウンミックスモード識別子は、現フレームのダウンミックスモードを示す)を取得し、現フレームのダウンミックスモードは、取得した現フレームのダウンミックスモード識別子に基づいて判定される。
702、前フレームのダウンミックスモードと、現フレームとダウンミックスモードとに基づいて、現フレームのエンコーディングモードを判定する。
前フレームのダウンミックスモードと、現フレームのダウンミックスモードとに基づいて、現フレームのエンコーディングモードを判定する段階の具体的な実装については、他の実施形態において関連する説明を参照されたい。詳細はここでは再び説明しない。
前述のデコーディングシナリオにおいて、現フレームのエンコーディングモードは、前フレームのダウンミックスモードと、現フレームのダウンミックスモードとに基づいて判定される必要があることが理解され得る。これは、現フレームの複数の可能なエンコーディングモードがあることを示す。1つのエンコーディングモードしかない従来の解決手段と比較して、これは、複数の可能なエンコーディングモード及びダウンミックスモードと、複数の可能なシナリオとの間のより良好な互換性及びマッチングを実現するのに役立つ。
以下では、現フレーム又は前フレームのいくつかのステレオパラメータを説明する。
本願の一部の実施形態において、現フレームのステレオパラメータ(例えば、チャネルの組み合わせ比率係数及び/又はチャネル間時間差)は、固定値であってよい、又は、現フレームに対するチャネルの組み合わせスキーム(例えば、相関信号チャネルの組み合わせスキーム又は逆相関信号チャネルの組み合わせスキーム)に基づいて判定されてよい。
図8を参照して、以下では、時間領域のステレオパラメータを判定するための方法の例を説明する。時間領域のステレオパラメータを判定するための方法の関連する段階が、エンコーディング装置により実装されてよい。方法は、具体的には、以下の段階を含み得る。
801、現フレームに対するチャネルの組み合わせスキームを判定する。
802、現フレームに対するチャネルの組み合わせスキームに基づいて、現フレームの時間領域のステレオパラメータを判定し、時間領域のステレオパラメータは、チャネルの組み合わせ比率係数及びチャネル間時間差のうちの少なくとも一方を含む。
現フレームに対するチャネルの組み合わせスキームは、複数のチャネルの組み合わせスキームのうちの1つである。
例えば、複数のチャネルの組み合わせスキームは、逆相関信号チャネルの組み合わせスキーム及び相関信号チャネルの組み合わせスキームを含む。
相関信号チャネルの組み合わせスキームは、ほぼ同じ位相の信号に対応するチャネルの組み合わせスキームである。逆相関信号チャネルの組み合わせスキームは、ほぼ位相のずれた信号に対応するチャネルの組み合わせスキームである。ほぼ同じ位相の信号に対応するチャネルの組み合わせスキームが、ほぼ同じ位相の信号に適用可能であり、ほぼ位相のずれた信号に対応するチャネルの組み合わせスキームが、ほぼ位相のずれた信号に適用可能であることが理解され得る。
現フレームに対するチャネルの組み合わせスキームが、相関信号チャネルの組み合わせスキームであると判定された場合、現フレームの時間領域のステレオパラメータは、現フレームに対する相関信号チャネルの組み合わせスキームに対応する時間領域のステレオパラメータである、又は、現フレームに対するチャネルの組み合わせスキームが、逆相関信号チャネルの組み合わせスキームであると判定された場合、現現フレームの時間領域のステレオパラメータは、フレームに対する逆相関信号チャネルの組み合わせスキームに対応する時間領域のステレオパラメータである。
前述の解決手段において、現フレームに対するチャネルの組み合わせスキームが判定される必要があることが理解され得る。これは、現フレームに対する複数の可能なチャネルの組み合わせスキームが存在することを示す。1つのチャネル組み合わせスキームしかない従来の解決手段と比較して、これは、より良好な互換性を実現し、複数の可能なチャネルの組み合わせスキームと複数の可能なシナリオとの間で一致させるのに役立つ。現フレームの時間領域のステレオパラメータは、現フレームに対するチャネルの組み合わせスキームに基づいて判定される。これは、より良好な互換性を実現するのに役立ち、時間領域のステレオパラメータと複数の可能なシナリオとの間で一致させ、その結果、エンコーディング/デコーディング品質を向上させるのに役立つ。
いくつかの可能な実施例において、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応し、かつ、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数は、まず、別個に計算され得る。そして、現フレームに対するチャネルの組み合わせスキームが相関信号チャネルの組み合わせスキームであると判定された場合、現フレームの時間領域のステレオパラメータが、現フレームに対する相関信号チャネルの組み合わせスキームに対応する時間領域のステレオパラメータであると判定される、又は、現フレームに対するチャネルの組み合わせスキームが、逆相関信号チャネルの組み合わせスキームであると判定された場合、現フレームの時間領域のステレオパラメータが、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応する時間領域のステレオパラメータであると判定される。代わりに、現フレームに対する相関信号チャネルの組み合わせスキームに対応する時間領域のステレオパラメータが、まず、計算され得る。現フレームに対するチャネルの組み合わせスキームが、相関信号チャネルの組み合わせスキームであると判定された場合、現フレームの時間領域のステレオパラメータが、現フレームに対する相関信号チャネルの組み合わせスキームに対応する時間領域のステレオパラメータであると判定される。現フレームに対するチャネルの組み合わせスキームが、逆相関信号チャネルの組み合わせスキームであると判定された場合、次に、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応する時間領域のステレオパラメータが計算され、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応する計算された時間領域のステレオパラメータが、現フレームの時間領域のステレオパラメータとして判定される。
代わりに、現フレームに対するチャネルの組み合わせスキームが、まず判定され得る。現フレームに対するチャネルの組み合わせスキームが、相関信号チャネルの組み合わせスキームであると判定された場合、現フレームに対する相関信号チャネルの組み合わせスキームに対応する時間領域のステレオパラメータが計算される。この場合、現フレームの時間領域のステレオパラメータは、現フレームに対する相関信号チャネルの組み合わせスキームに対応する時間領域のステレオパラメータである。現フレームに対するチャネルの組み合わせスキームが、逆相関信号チャネルの組み合わせスキームであると判定された場合、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応する時間領域のステレオパラメータが計算される。この場合、現フレームの時間領域のステレオパラメータは、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応する時間領域のステレオパラメータである。
いくつかの可能な実施例において、現フレームに対するチャネルの組み合わせスキームに基づいて、現フレームの時間領域のステレオパラメータを判定する段階は、現フレームに対するチャネルの組み合わせスキームに基づいて、現フレームに対するチャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の初期値を判定する段階を含む。現フレームに対するチャネルの組み合わせスキーム(相関信号チャネルの組み合わせスキーム又は逆相関信号チャネルの組み合わせスキーム)に対応するチャネルの組み合わせ比率係数の初期値が修正される必要はない場合、現フレームに対するチャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数は、現フレームに対するチャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の初期値に等しい。現フレームに対するチャネルの組み合わせスキーム(相関信号チャネルの組み合わせスキーム又は逆相関信号チャネルの組み合わせスキーム)に対応するチャネルの組み合わせ比率係数の初期値が修正される必要がある場合、現フレームに対するチャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の初期値は、現フレームに対するチャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の修正された値を取得するために修正され、現フレームに対するチャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数は、現フレームに対するチャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の修正された値に等しい。
例えば、現フレームに対するチャネルの組み合わせスキームに基づいて、現フレームの時間領域のステレオパラメータを判定する段階は、現フレームの左側チャネル信号に基づいて、現フレームの左側チャネル信号のフレームエネルギーを計算する段階と、現フレームの右側チャネル信号に基づいて、現フレームの右側チャネル信号のフレームエネルギーを計算する段階と、現フレームの左側チャネル信号のフレームエネルギーと、現フレームの右側チャネル信号のフレームエネルギーとに基づいて、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の初期値を計算する段階とを含んでよい。
現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の初期値が修正される必要はない場合、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数は、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の初期値に等しい、又は、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数のコードインデックスは、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の初期値のコードインデックスに等しい。
現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の初期値が修正される必要がある場合、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の修正された値と、修正された値のコードインデックスとを取得するために、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の初期値と、初期値のコードインデックスとが修正される。現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数は、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の修正された値に等しく、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数のコードインデックスは、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の修正された値のコードインデックスに等しい。
具体的には、例えば、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の初期値と、初期値のコードインデックスとが修正される場合、
ratio_idx_mod=0.5×(tdm_last_ratio_idx+16)
であり、
ratio_modqua=ratio_tabl[ratio_idx_mod]
であり、tdm_last_ratio_idxは、前フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数のコードインデックスを表し、ratio_idx_modは、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の修正された値に対応するコードインデックスを表し、ratio_modquaは、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の修正された値を表す。
別の例として、現フレームに対するチャネルの組み合わせスキームに基づいて、現フレームの時間領域のステレオパラメータを判定する段階は、現フレームの左側チャネル信号及び右側チャネル信号に基づいて、現フレームの基準チャネル信号を取得する段階と、現フレームの左側チャネル信号と基準チャネル信号との間の振幅相関のパラメータを計算する段階と、現フレームの右側チャネル信号と基準チャネル信号との間の振幅相関のパラメータを計算する段階と、現フレームの左側チャネル信号と、基準チャネル信号との間の振幅相関のパラメータに基づいて、現フレームの左側チャネル信号と右側チャネル信号との間の振幅相関の差のパラメータ、及び、現フレームの右側チャネル信号と、基準チャネル信号との間の振幅相関のパラメータを計算する段階と、
現フレームの左側チャネル信号と右側チャネル信号との間の振幅相関の差のパラメータに基づいて、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を計算する段階と
を含む。
現フレームの左側チャネル信号と右側チャネル信号との間の振幅相関の差のパラメータに基づいて、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を計算する段階は、例えば、現フレームの左側チャネル信号と右側チャネル信号との間の振幅相関の差のパラメータに基づいて、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の初期値を計算する段階と、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の初期値を修正して、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を取得する段階とを含んでよい。現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の初期値が修正される必要はない場合、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数が、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の初期値に等しいことが理解され得る。
可能な実施例において、
Figure 0007088450000348
であり、
Figure 0007088450000349
であり、
Figure 0007088450000350
であり、
mono_i(n)は、現フレームの基準チャネル信号を表し、
Figure 0007088450000351
は、現フレームの、遅延調整処理を通じて取得される左側チャネル信号を表し、
Figure 0007088450000352
は、現フレームの、遅延調整処理を通じて取得される右側チャネル信号を表し、corr_LMは、現フレームの左側チャネル信号と、基準チャネル信号との間の振幅相関のパラメータを表し、corr_RMは、現フレームの右側チャネル信号と、基準チャネル信号との間の振幅相関のパラメータを表す。
いくつかの可能な実施例において、現フレームの左側チャネル信号と、基準チャネル信号との間の振幅相関のパラメータ、及び、現フレームの右側チャネル信号と、基準チャネル信号との間の振幅相関のパラメータに基づいて、現フレームの左側チャネル信号と右側チャネル信号との間の振幅相関の差のパラメータを計算する段階は、基準チャネル信号と、現フレームの、遅延調整処理を通じて取得される左側チャネル信号との間の振幅相関のパラメータに基づいて、基準チャネル信号と、現フレームの、長時間平滑化を通じて取得される左側チャネル信号との間の振幅相関のパラメータを計算する段階と、基準チャネル信号と、現フレームの、遅延調整処理を通じて取得される右側チャネル信号との間の振幅相関のパラメータに基づいて、基準チャネル信号と、現フレームの、長時間平滑化通じて取得される右側チャネル信号との間の振幅相関のパラメータを計算する段階と、基準チャネル信号と、現フレームの、長時間平滑化を通じて取得される左側チャネル信号との間の振幅相関のパラメータ、及び、基準チャネル信号と、現フレームの、長時間平滑化を通じて取得される右側チャネル信号との間の振幅相関のパラメータに基づいて、現フレームの左側チャネル信号と右側チャネル信号との間の振幅相関の差のパラメータを計算する段階とを含む。
様々な平滑化処理方式があり得る。例えば、
tdm_lt_corr_LM_SMcur=α×tdm_lt_corr_LM_SMpre+(1-α)corr_LM
であり、
tdm_lt_rms_L_SMcur=(1-A)×tdm_lt_rms_L_SMpre+A×rms_L
であり、Aは、現フレームの左側チャネル信号の長時間平滑化フレームエネルギーの更新係数を表し、tdm_lt_rms_L_SMcurは、現フレームの左側チャネル信号の長時間平滑化フレームエネルギーを表し、rms_Lは、現フレームの左側チャネル信号のフレームエネルギーを表し、tdm_lt_corr_LM_SMcurは、基準チャネル信号と、現フレームの、長時間平滑化を通じて取得される左側チャネル信号との間の振幅相関のパラメータを表し、tdm_lt_corr_LM_SMpreは、基準チャネル信号と、前フレームの、長時間平滑化を通じて取得される左側チャネル信号との間の振幅相関のパラメータを表し、αは、左側チャネルの平滑化係数を表す。
例えば、
tdm_lt_corr_RM_SMcur=β×tdm_lt_corr_RM_SMpre+(1-β)corr_LM
であり、
tdm_lt_rms_R_SMcur=(1-B)×tdm_lt_rms_R_SMpre+B×rms_R
であり、Bは、現フレームの右側チャネル信号の長時間平滑化フレームエネルギーの更新係数を表し、tdm_lt_corr_RM_SMpreは、現フレームの右側チャネル信号の長時間平滑化フレームエネルギーを表し、rms_Rは、現フレームの右側チャネル信号のフレームエネルギーを表し、tdm_lt_corr_RM_SMcurは、基準チャネル信号と、現フレームの、長時間平滑化を通じて取得される右側チャネル信号との間の振幅相関のパラメータを表し、tdm_lt_corr_RM_SMpreは、基準チャネル信号と、前フレームの、長時間平滑化を通じて取得される右側チャネル信号との間の振幅相関のパラメータを表し、βは、右側チャネルの平滑化係数を表す。
可能な実施例において、
diff_lt_corr=tdm_lt_corr_LM_SM-tdm_lt_corr_RM_SM
であり、tdm_lt_corr_LM_SMは、基準チャネル信号と、現フレームの、長時間平滑化を通じて取得される左側チャネル信号との間の振幅相関のパラメータを表し、tdm_lt_corr_RM_SM基準チャネル信号と、現フレームの、長時間平滑化を通じて取得される右側チャネル信号との間の振幅相関のパラメータを表し、diff_lt_corrは、現フレームの左側チャネル信号と右側チャネル信号との間の振幅相関の差のパラメータを表す。
いくつかの可能な実施例において、現フレームの左側チャネル信号と右側チャネル信号との間の振幅相関の差のパラメータに基づいて、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を計算する段階は、現フレームの左側チャネル信号と右側チャネル信号との間の振幅相関の差のパラメータに対して、マッピング処理を実行する段階であって、現フレームの左側チャネル信号と右側チャネル信号との間の振幅相関の差の、マッピング処理を通じて取得されたパラメータの値の範囲は、[MAP_MIN、MAP_MAX]である、段階と、左側チャネル信号と右側チャネル信号との間の振幅相関の差の、マッピング処理を通じて取得されたパラメータを、チャネルの組み合わせ比率係数に変換する段階とを含む。
いくつかの可能な実施例において、現フレームの左側チャネル信号と右側チャネル信号との間の振幅相関の差のパラメータに対して、マッピング処理を実行する段階は、現フレームの左側チャネル信号と右側チャネル信号との間の振幅相関の差のパラメータに対して、振幅制限処理を実行する段階と、現フレームの左側チャネル信号と右側チャネル信号との間の振幅相関の差の、振幅制限処理を通じて取得されるパラメータに対して、マッピング処理を実行する段階とを含む。
様々な振幅制限処理方式があり得る。具体的には、例えば、
Figure 0007088450000353
であり、RATIO_MAXは、現フレームの左側チャネル信号と右側チャネル信号との間の振幅相関の差の、振幅制限処理を通じて取得されるパラメータの最大値を表し、RATIO_MINは、現フレームの左側チャネル信号と右側チャネル信号との間の振幅相関の差の、振幅制限処理を通じて取得されるパラメータの最小値を表し、
RATIO_MAX>RATIO_MIN
である。
様々なマッピング処理方式があり得る。具体的には、例えば、
Figure 0007088450000354
であり、
Figure 0007088450000355
Figure 0007088450000356
であり、
=MAP_HIGH-RATIO_MAX×A
であり、
Figure 0007088450000357
Figure 0007088450000358
であり、
=MAP_MIN-RATIO_MIN×A
であり、
Figure 0007088450000359
Figure 0007088450000360
であり、
=MAP_LOW-RATIO_LOW×A
であり、
diff_lt_corr_mapは、現フレームの左側チャネル信号と右側チャネル信号との間の振幅相関の差の、マッピング処理を通じて取得されるパラメータを表し、MAP_MAXは、現フレームの左側チャネル信号と右側チャネル信号との間の振幅相関の差の、マッピング処理を通じて取得されるパラメータの最大値を表し、MAP_HIGHは、現フレームの左側チャネル信号と右側チャネル信号との間の振幅相関の差の、マッピング処理を通じて取得されるパラメータの高い閾値を表し、MAP_LOWは、現フレームの左側チャネル信号と右側チャネル信号との間の振幅相関の差の、マッピング処理を通じて取得されるパラメータの低い閾値を表し、MAP_MINは、現フレームの左側チャネル信号と右側チャネル信号との間の振幅相関の差の、マッピング処理を通じて取得されるパラメータの最小値を表し、
MAP_MAX>MAP_HIGH>MAP_LOW>MAP_MIN
であり、
RATIO_MAXは、現フレームの左側チャネル信号と右側チャネル信号との間の振幅相関の差の、振幅制限処理を通じて取得されるパラメータの最大値であり、RATIO_HIGHは、現フレームの左側チャネル信号と右側チャネル信号との間の振幅相関の差の、振幅制限処理を通じて取得されるパラメータの高い閾値を表し、RATIO_LOWは、現フレームの左側チャネル信号と右側チャネル信号との間振幅相関の差の、振幅制限処理を通じて取得されるパラメータの低い閾値を表し、RATIO_MINは、現フレームの左側チャネル信号と右側チャネル信号との間の振幅相関の差の、振幅制限処理を通じて取得されるパラメータの最小値を表し、
RATIO_MAX>RATIO_HIGH>RATIO_LOW>RATIO_MIN
である。
別の例として、
Figure 0007088450000361
であり、diff_lt_corr_limitは、現フレームの左側チャネル信号と右側チャネル信号との間の振幅相関の差の、振幅制限処理を通じて取得されるパラメータを表し、diff_lt_corr_mapは、現フレームの左側チャネル信号と右側チャネル信号との間の振幅相関の差の、マッピング処理を通じて取得されるパラメータを表し、
Figure 0007088450000362
であり、RATIO_MAXは、現フレームの左側チャネル信号と右側チャネル信号との間の振幅相関の差の最大振幅パラメータを表し、-RATIO_MAXは、現フレームの左側チャネル信号と右側チャネル信号との間の振幅相関の差の最小振幅パラメータを表す。
可能な実施例において、
Figure 0007088450000363
であり、diff_lt_corr_mapは、現フレームの左側チャネル信号と右側チャネル信号との間の振幅相関の差の、マッピング処理を通じて取得されるパラメータを表し、ratio_SMは、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表し、又は、ratio_SMは、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の初期値を表す。
本願のいくつかの実施例では、チャネルの組み合わせ比率係数が修正される必要がある場合、チャネルの組み合わせ比率係数は、エンコードされる前又はその後に修正され得る。具体的には、例えば、まず、現フレームのチャネルの組み合わせ比率係数(例えば、逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数又は相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数)の初期値が計算され、次に、チャネルの組み合わせ比率係数の初期値がエンコードされて、現フレームのチャネルの組み合わせ比率係数の初期のコードインデックスを取得し、そして、現フレームのチャネルの組み合わせ比率係数の取得した初期のコードインデックスが修正されて、現フレームのチャネルの組み合わせ比率係数のコードインデックスを取得する(現フレームのチャネルの組み合わせ比率係数のコードインデックスを取得するということは、現フレームのチャネルの組み合わせ比率係数を取得するということに相当する)。代わりに、現フレームのチャネルの組み合わせ比率係数の初期値が最初に計算されてよく、次に、現フレームのチャネルの組み合わせ比率係数の計算された初期値が修正されて、現フレームのチャネルの組み合わせ比率係数を取得し、現フレームの取得したチャネルの組み合わせ比率係数がエンコードされて、現フレームのチャネルの組み合わせ比率係数のコードインデックスを取得する。
現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の初期値は、様々な方式で修正され得る。例えば、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を取得するために、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の初期値が修正される必要がある場合、例えば、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の初期値が、前フレームのチャネルの組み合わせ比率係数と、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の初期値とに基づいて修正されてよい、又は、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の初期値が、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の初期値に基づいて修正されてよい。
例えば、まず、現フレームの左側チャネル信号の長時間平滑化フレームエネルギー、現フレームに対する右側チャネル信号の長時間平滑化フレームエネルギー、現フレームの左側チャネル信号のチャネル間のエネルギー差、履歴キャッシュにある前フレームのキャッシュされるエンコーディングパラメータ(例えば、プライマリチャネル信号のチャネル間の相関又はセカンダリチャネル信号チャネル間の相関)、現フレーム及び前フレームのチャネルの組み合わせスキーム識別子前フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数、及び、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の初期値に基づいて、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の初期値が修正される必要があるか否かが判定される。現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の初期値が修正される必要がある場合、前フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数は、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数として用いられ、そうでない場合、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の初期値は、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数として用いられる。
もちろん、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を取得するために、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の初期値を修正するためお具体的な実装は、前述の例に限定されるものではない。
803、現フレームの判定された時間領域のステレオパラメータをエンコードする。
いくつかの可能な実施例において、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応する判定されたチャネルの組み合わせ比率係数に対して、量子化エンコーディングが実行され、
ratio_init_SMqua=ratio_tabl_SM[ratio_idx_init_SM]
であり、ratio_tabl_SMは、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数のスカラー量子化のためのコードブックを表し、ratio_idx_init_SMは、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の初期のコードインデックスを表し、ratio_init_SMquaは、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の初期の量子化コード値を表す。
可能な実施例において、
ratio_idx_SM=ratio_init_SM
であり、
ratio_SM=ratio_tabl[ratio_idx_SM]
であり、
ratio_SMは、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表し、ratio_idx_SMは、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数のコードインデックスを表す、又は、
ratio_idx_SM=φ×ratio_idx_init_SM+(1-φ)×tdm_last_ratio_idx_SM
であり、
ratio_SM=ratio_tabl[ratio_idx_SM]
であり、
ratio_idx_SMは、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応する初期のコードインデックスを表し、tdm_last_ratio_idx_SMは、前フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の最終コードインデックスを表し、φは、逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の修正係数であり、ratio_SMは、前フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を表す。
いくつかの可能な実施例において、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を取得するために、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の初期値が修正される必要がある場合、代わりに、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の初期値に対して、量子化エンコーディングがまず実行されて、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の初期のコードインデックスを取得してよく、次に、前フレームのチャネルの組み合わせ比率係数のコードインデックスと、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の初期のコードインデックスとに基づいて、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の初期のコードインデックスが修正されてよい、又は、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の初期のコードインデックスに基づいて、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の初期のコードインデックスが修正されてよい。
例えば、まず、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応する初期のコードインデックスを取得するために、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の初期値に対して、量子化エンコーディングが実行され得る。そして、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の初期値が修正される必要がある場合、前フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数のコードインデックスは、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数のコードインデックスとして用いられ、そうでない場合、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の初期のコードインデックスは、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数のコードインデックスとして用いられる。最後に、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数のコードインデックスに対応する量子化されたコード値が、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数として用いられる。
さらに、時間領域のステレオパラメータがチャネル間の時間差を含む場合、現フレームに対するチャネルの組み合わせスキームに基づいて、現フレームの時間領域のステレオパラメータを判定する段階は、現フレームに対するチャネルの組み合わせスキームが相関信号チャネルの組み合わせスキームである場合に、現フレームのチャネル間の時間差を計算する段階を含んでよい。さらに、現フレームの計算されたチャネル間時間差は、ビットストリームに書き込まれてよい。現フレームに対するチャネルの組み合わせスキームが逆相関信号チャネルの組み合わせスキームである場合、現フレームのチャネル間の時間差として、デフォルトのチャネル間時間差(例えば、0)が用いられる。さらに、デフォルトのチャネル間時間差は、ビットストリームに書き込まれなくてもよく、デコーディング装置は、デフォルトのチャネル間時間差を用いてもよい。
さらに、いくつかの他の可能な実施例において、現フレームに対するチャネルの組み合わせスキームは、前フレームに対するチャネルの組み合わせスキームとは異なっており(例えば、現フレームのチャネルの組み合わせスキーム識別子は、前フレームのチャネルの組み合わせスキーム識別子とは異なる)、現フレームのチャネルの組み合わせ比率係数の値はまた、前フレームのチャネルの組み合わせ比率係数の値に設定されてよく、そうでない場合、現フレームのチャネルの組み合わせ比率係数は、遅延調整を通じて取得され、かつ、現フレームに対するチャネルの組み合わせスキームに対応する方法に係るチャネルの組み合わせスキームと、左側チャネル信号及び右側チャネル信号とに基づいて抽出されてエンコードされてよい。
以下では、例として、時間領域のステレオパラメータをエンコーディングするための方法をさらに提供する。例えば、方法は、現フレームに対するチャネルの組み合わせスキームを判定する段階と、現フレームに対するチャネルの組み合わせスキームに基づいて、現フレームの時間領域のステレオパラメータを判定する段階と、現フレームの判定された時間領域シナリオのパラメータをエンコーディングする段階であって、時間領域のステレオパラメータは、チャネルの組み合わせ比率係数及びチャネル間時間差のうちの少なくとも一方を含む、段階とを含んでよい。
それに応じて、デコーディング装置は、ビットストリームから現フレームの時間領域のステレオパラメータを取得し、現フレームの、ビットストリームから取得される時間領域のステレオパラメータに基づいて、関連するデコーディングをさらに実行してよい。
以下では、より多くの具体的なアプリケーションシナリオに関する例を用いて説明を行う。
図9-A1及び図9-A2は、本願の実施形態に係るオーディオエンコーディング方法の概略フローチャートである。本願の本実施形態において、オーディオエンコーディング方法は、エンコーディング装置により実施され得る。方法は、具体的には、以下の段階を含み得る。
901、現フレームの元の左側チャネル信号及び右側チャネル信号に対して時間領域の前処理を実行する。
例えば、ステレオオーディオ信号のサンプリングレートが16kHzである場合、信号のフレームは20msであり、フレームの長さはNとして示され、N=320の場合、フレームの長さが320個のサンプリングポイントであることを表す。現フレームのステレオ信号は、現フレームの左側チャネル信号及び現フレームの右側チャネル信号を含む。現フレームの元の左側チャネル信号は、X(n)として示され、現フレームの元の右側チャネル信号は、X(n)として示される。nはサンプリングポイントのシーケンス番号であり、n=0、1、・・・、N-1である。
例えば、現フレームの元の左側チャネル信号及び右側チャネル信号に対して、時間領域の前処理を実行する段階は、現フレームの元の左側チャネル信号及び右側チャネル信号に対して、ハイパスフィルタリング処理を実行して、時間領域の前処理を受けた現フレームの左側及び右側チャネル信号を取得する段階を含んでよく、現フレームの、時間領域の前処理を通じて取得される左側チャネル信号は、XL_HP(n)として示され、現フレームの、時間領域の前処理を通じて取得される右側チャネル信号は、XR_HP(n)として示される。nはサンプリングポイントのシーケンス番号であり、n=0、1、・・・、N-1である。ハイパスフィルタリング処理のために用いられるフィルタは、例えば、20Hzの遮断周波数を有する無限インパルス応答(Infinite Impulse Response、略して、IIR)フィルタであってよい、又は、別のタイプのフィルタが用いられてよい。
例えば、サンプリングレートは、16kHzであり、20Hzの遮断周波数を有する対応するハイパスフィルタの伝達関数は、
Figure 0007088450000364
であってよく、b=0.994461788958195、b=-1.988923577916390、b=0.994461788958195、a=1.988892905899653、a=-0.988954249933127であり、zは、Zの変換のための変換係数である。
対応する時間領域フィルタの伝達関数は、
L_HP(n)=b×x(n)+b×x(n-1)-a×xL_HP(n-1)-a×xL_HP(n-2)
R_HP(n)=b×x(n)+b×x(n-1)-a×xR_HP(n-1)-a×xR_HP(n-2)
のように表され得る。
902、時間領域の前処理を通じて取得される現フレームの左側チャネル信号及び右側チャネル信号に対して、遅延調整処理を実行して、遅延調整処理を受けた現フレームの左側チャネル信号及び右側チャネル信号を取得する。
遅延調整処理を通じて取得される信号は、略して「遅延調整済みの信号」と称され得る。例えば、遅延調整処理を通じて取得される左側チャネル信号は、略して「遅延調整済みの左側チャネル信号」と称され得、遅延調整処理を通じて取得される右側チャネル信号は、略して、「遅延調整済みの右側チャネル信号」と称され得る、などである。
具体的には、チャネル間の遅延パラメータは、現フレームの前処理された左側チャネル信号及び右側チャネル信号に基づいて抽出されてエンコードされてよく、遅延調整処理は、エンコードされたチャネル間の遅延パラメータに基づいて、左側チャネル信号及び右側チャネル信号に対して実行されて、遅延調整処理を受けた現フレームの左側チャネル信号及び右側チャネル信号を取得する。現フレームの、遅延調整処理を通じて取得される左側チャネル信号は、
Figure 0007088450000365
として示され、現フレームの、遅延調整処理を通じて取得される右側チャネル信号は、
Figure 0007088450000366
として示される。nはサンプリングポイントのシーケンス番号であり、n=0、1、・・・、N-1である。
具体的には、例えば、エンコーディング装置は、現フレームの前処理された左側チャネル信号及び右側チャネル信号に基づいて、左側チャネルと右側チャネルとの間の時間領域の相互相関関数を計算してよい。左側チャネルと右側チャネルとの間の時間領域の相互相関関数の最大値(又は、別の値)は、左側チャネル信号と右側チャネル信号との間の時間差を判定するために検索されてよい。左側チャネルと右側チャネルとの間の判定された時間差に対して、量子化エンコーディングが実行される。基準として、左側及び右側チャネルから選択された1つのチャネルの信号を用いて、量子化エンコーディングを通じて取得される左側チャネルと右側チャネルとの間の時間差に基づいて、他のチャネルの信号に対して、遅延調整が実行されて、遅延調整処理を受けた現フレームの左側チャネル信号及び右側チャネル信号を取得する。
遅延調整処理は、具体的には、複数の方法を用いて実施されてよく、具体的な遅延調整処理方法については、本願の本実施形態において限定されるものではないことに留意されたい。
903、遅延調整処理を通じて取得される現フレームの左側チャネル信号と右側チャネル信号に対して、時間領域分析を実行する。
具体的には、時間領域分析は、過渡検出などを含み得る。過渡検出は、遅延調整処理を通じて取得される現フレームの左側チャネル信号と右側チャネル信号に対して、エネルギー検出を別個に実行し得る(具体的には、現フレームがエネルギーの突然の変化を受けるか否かが検出され得る)。例えば、現フレームの、遅延調整処理を通じて取得される左側チャネル信号のエネルギーは、Ecur_Lとして表され、前フレームの、遅延調整を通じて取得される左側チャネル信号のエネルギーは、Epre_Lとして表され、この場合、過渡検出は、Epre_LとEcur_Lとの間の差の絶対値に基づいて実行され、現フレームの、遅延調整処理を通じて取得される左側チャネル信号の過渡検出結果を取得してよい。同様に、過渡検出は、現フレームの、遅延調整処理を通じて取得される右側チャネル信号に対して、同じ方法を用いて実行され得る。時間領域分析は、過渡検出以外の別の従来の方式における時間領域分析を含んでもよく、例えば、帯域拡張の前処理を含んでよい。
段階903は、段階902の後の任意の位置で実行されてよく、現フレームのプライマリチャネル信号及びセカンダリチャネル信号がエンコードされる前の任意の位置で実行されてもよいことが理解され得る。
904、遅延調整処理を通じて取得される現フレームの左側チャネル信号及び右側チャネル信号に基づいて、現フレームに対するチャネルの組み合わせスキームの判定を実行して、現フレームに対するチャネルの組み合わせスキームを判定する。
本実施形態において、2つの可能なチャネルの組み合わせスキームが例として用いられ、これらは、以下の説明において、相関信号チャネルの組み合わせスキーム及び逆相関信号チャネルの組み合わせスキームと称される。本実施形態において、相関信号チャネルの組み合わせスキームは、現フレームの(遅延調整を通じて取得される)左側チャネル信号及び右側チャネル信号がほぼ同じ位相の信号を構成する場合、かつ、逆相関信号チャネルの組み合わせスキームが現フレームの(遅延調整を通じて取得される)左側チャネル信号と右側チャネル信号が、ほぼ位相のずれた信号を形成する場合に対応する。もちろん、「相関信号チャネルの組み合わせスキーム」及び「逆相関信号チャネルの組み合わせスキーム」を用いて、2つの可能なチャネルの組み合わせスキームを表すことに加えて、実際の適用では、他の名称が、2つの異なるチャネルの組み合わせスキームに名付けられることに用いられてもよい。
本実施形態のいくつかの解決手段において、チャネルの組み合わせスキームを判定は、初期のチャネルの組み合わせスキームの判定及びチャネルの組み合わせスキームの修正の判定に分類されてよい。チャネルの組み合わせスキームの判定が、現フレームに対して実行されて、現フレームに対するチャネルの組み合わせスキームを判定することが理解され得る。現フレームに対するチャネルの組み合わせスキームを判定することについてのいくつかの例示的な実施例に関しては、前述の実施形態における関連する説明を参照されたい。詳細はここでは再び説明しない。
905、遅延調整処理を通じて取得される現フレームの左側チャネル信号及び右側チャネル信号と、現フレームのチャネルの組み合わせスキーム識別子とに基づいて、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を計算し、チャネルの組み合わせ比率係数をエンコードして、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の初期値と、初期値のコードインデックスとを取得する。
具体的には、例えば、まず、現フレームの左側チャネル信号及び右側チャネル信号のフレームエネルギーは、遅延調整処理を通じて取得される現フレームの左側チャネル信号及び右側チャネル信号に基づいて計算される。
現フレームの左側チャネル信号のrms_Lのフレームエネルギーは、次式
Figure 0007088450000367
を満たし、
現フレームの右側チャネル信号のフレームエネルギーrms_Rは、次式
Figure 0007088450000368
を満たし、
Figure 0007088450000369
は、現フレームの、遅延調整処理を通じて取得される左側チャネル信号を表し、
Figure 0007088450000370
は、現フレームの、遅延調整処理を通じて取得される右側チャネル信号を表す。
そして、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数が、現フレームの左側チャネルのフレームエネルギーと、現フレームの右側チャネルのフレームエネルギーとに基づいて計算される。現フレームに対する相関信号チャネルの組み合わせスキームに対応する計算されるチャネルの組み合わせ比率係数ratio_initは、次式、
Figure 0007088450000371
を満たす。
対応するコードインデックスratio_idx_initと、現フレームに対する相関信号チャネルの組み合わせスキームに対応し、量子化エンコーディングを通じて取得されるチャネルの組み合わせ比率係数ratio_initquaとを取得するために、現フレームに対する相関信号チャネルの組み合わせスキームに対応する計算されるチャネルの組み合わせ比率係数ratio_initに対して、量子化エンコーディングが実行され、
ratio_initqua=ratio_tabl[ratio_idx_init]
であり、
ratio_tablは、スカラー量子化のためのコードブックであり、任意の従来のスカラー量子化方法が、量子化エンコーディングのために用いられてよく、例えば、均一なスカラー量子化又は不均一なスカラー量子化が用いられてよく、コード化ビットの数は、例えば、5ビットであり、具体的なスカラー量子化方法については、ここでは詳細に説明しない。
現フレームに対する相関信号チャネルの組み合わせスキームに対応し、量子化エンコーディングを通じて取得されるチャネルの組み合わせ比率係数ratio_initquaは、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の取得した初期値である。コードインデックスratio_idx_intiは、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の初期値に対応するコードインデックスである。
さらに、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の初期値に対応するコードインデックスは、さらに、現フレームのチャネルの組み合わせスキーム識別子tdm_SM_flagの値に基づいて修正されてよい。
例えば、量子化エンコーディングは、5ビットのスカラー量子化である。この場合、tdm_SM_flag=1である場合、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の初期値に対応するコードインデックスratio_idx_initは、予め設定された値(例えば、15又は別の値)に修正される。さらに、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の初期値は、
ratio_initqua=ratio_tabl[15]
のように修正されてよい。
前述の計算方法に加えて、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数は、代わりに、従来の時間領域ステレオエンコーディング技術におけるものであり、かつ、チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を計算するために用いられる任意の方法にしたがって計算されてよいことに留意されたい。代わりに、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の初期値は、固定値(例えば、0.5又は別の値)に直接設定されてよい。
906、チャネルの組み合わせ比率係数修正識別子に基づいて、チャネルの組み合わせ比率係数が修正される必要があるか否かを判定する。
チャネルの組み合わせ比率係数が、修正される必要がある場合、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数と、チャネルの組み合わせ比率係数のコードインデックスとが修正されることで、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の修正された値と、修正された値のコードインデックスとを取得する。
現フレームのチャネルの組み合わせ比率係数修正識別子は、tdm_SM_modi_flagとして示される。例えば、チャネルの組み合わせ比率係数修正識別子の値が0である場合、チャネルの組み合わせ比率係数が修正される必要はな、又は、チャネルの組み合わせ比率係数修正識別子が1である場合、チャネルの組み合わせ比率係数が修正される必要がある。もちろん、チャネルの組み合わせ比率係数が修正される必要があるか否かを示すために、チャネルの組み合わせ比率係数修正識別子の別の異なる値が、代わりに用いられてよい。
例えば、チャネルの組み合わせ比率係数修正識別子に基づいて、チャネルの組み合わせ比率係数が修正される必要があるか否かを判定する段階は、具体的には、例えば、チャネルの組み合わせ比率係数修正識別子がtdm_SM_modi_flag=1である場合、チャネルの組み合わせ比率係数が修正される必要があると判定する段階、又は、別の例として、チャネルの組み合わせ比率係数修正識別子がtdm_SM_modi_flag=0である場合、チャネルの組み合わせ比率係数が修正される必要はないと判定する段階を含んでよい。
現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数と、チャネルの組み合わせ比率係数のコードインデックスとを修正する段階は、具体的には、
例えば、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の修正された値に対応するコードインデックスが、
ratio_idx_mod=0.5×(tdm_last_ratio_idx+16)
を満たし、
tdm_last_ratio_idxは、前フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数のコードインデックスであり、
この場合、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の修正された値ratio_modquaは、
ratio_modqua=ratio_tabl[ratio_idx_mod]
を満たす、段階を含んでよい。
907、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の初期値、初期値のコードインデックス、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の修正された値、修正された値のコードインデックス及びチャネルの組み合わせ比率係数修正識別子に基づいて、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数ratio及びコードインデックスratio_idxを判定する。
具体的には、例えば、相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数ratioを判定する段階は、次式、
Figure 0007088450000372
を満たし、
ratio_initquaは、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の初期値を表し、ratio_modquaは、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の修正された値を表し、tdm_SM_modi_flagは、現フレームのチャネルの組み合わせ比率係数修正識別子を表す。
相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数に対応する判定されたコードインデックスratio_idxは、次式
Figure 0007088450000373
を満たし、ratio_idx_initは、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の初期値に対応するコードインデックスを表し、ratio_idx_modは、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の修正された値に対応するコードインデックスを表す。
908、現フレームのチャネルの組み合わせスキーム識別子が逆相関信号チャネルの組み合わせスキームに対応するか否かを判定し、現フレームのチャネルの組み合わせスキーム識別子が逆相関信号チャネルの組み合わせスキームに対応する場合、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を計算し、チャネルの組み合わせ比率係数をエンコードして、逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数と、チャネルの組み合わせ比率係数のコードインデックスとを取得する。
まず、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を計算するために用いられる履歴キャッシュがリセットされる必要があるか否かが判定され得る。
例えば、現フレームのチャネルの組み合わせスキーム識別子tdm_SM_flagが1に等しく(例えば、tdm_SM_flagが、現フレームのチャネルの組み合わせスキーム識別子が逆相関信号チャネルの組み合わせスキームに対応することを示す1に等しい)、かつ、前フレームのチャネルの組み合わせスキーム識別子tdm_last_SM_flagが0に等しい(例えば、tdm_last_SM_flagが、前フレームのチャネルの組み合わせスキーム識別子が相関信号チャネルの組み合わせスキームに対応することを示す0に等しい)場合、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を計算するために用いられる履歴キャッシュがリセットされる必要がある。
現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を計算するために用いられる履歴キャッシュがリセットされる必要があるか否かを判定することは、代わりに、初期のチャネルの組み合わせスキームを判定し、チャネルの組み合わせスキームの修正を判定し、そして、履歴キャッシュのリセット識別子の値を判定している間に、履歴キャッシュのリセット識別子tdm_SM_reset_flagを判定することにより実施され得ることに留意されたい。例えば、tdm_SM_reset_flagが1である場合、現フレームのチャネルの組み合わせスキーム識別子が逆相関信号チャネルの組み合わせスキームに対応し、かつ、前フレームのチャネルの組み合わせスキーム識別子が相関信号チャネルの組み合わせスキームに対応する。例えば、履歴キャッシュのリセット識別子tdm_SM_reset_flagが1に等しい場合、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を計算するために用いられる履歴キャッシュがリセットされる必要がある。複数の特定のリセット方法がある。現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を計算するために用いられる履歴キャッシュ内のすべてのパラメータが、予め設定された初期値に基づいてリセットされてよい、又は、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を計算するために用いられる履歴キャッシュ内の一部のパラメータが、予め設定された初期値に基づいてリセットされてよい、又は、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を計算するために用いられる履歴キャッシュ内の一部のパラメータが、予め設定された初期値に基づいてリセットされてよく、他のパラメータが、相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を計算するために用いられる履歴キャッシュ内の対応するパラメータ値に基づいてリセットされる。
次に、現フレームのチャネルの組み合わせスキーム識別子tdm_SM_flagが逆相関信号チャネルの組み合わせスキームに対応するか否かがさらに判定される。逆相関信号チャネルの組み合わせスキームは、ほぼ位相のずれたステレオ信号に対して、時間領域ダウンミックスを実行するために、より適切なチャネルの組み合わせスキームである。本実施形態において、現フレームのチャネルの組み合わせスキーム識別子がtdm_SM_flag=1である場合、現フレームのチャネルの組み合わせスキーム識別子が、逆相関信号チャネルの組み合わせスキームに対応する、又は、現フレームのチャネルの組み合わせスキーム識別子がtdm_SM_flag=0である場合、現フレームのチャネルの組み合わせスキーム識別子が、相関信号チャネルの組み合わせスキームに対応する。
現フレームのチャネルの組み合わせスキーム識別子が、逆相関信号チャネルの組み合わせスキームに対応するか否かを判定する段階は、具体的には、
現クレームのチャネルの組み合わせスキーム識別子が1であるか否かを判定する段階であって、現フレームのチャネルの組み合わせスキーム識別子が、tdm_SM_flag=1である場合、現フレームのチャネルの組み合わせスキーム識別子が、逆相関信号チャネルの組み合わせスキームに対応し、この場合、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数は、計算及びエンコードされ得る、段階を含んでよい。
図9-Bを参照すると、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を計算及びエンコーディングする段階は、例えば、以下の段階9081から9085を含み得る。
9081、遅延調整処理を通じて取得される現フレームの左側チャネル信号と右側チャネル信号に対して、信号エネルギー分析を実行する。
現フレームの左側チャネル信号のフレームエネルギー、現フレームの右側チャネル信号のフレームエネルギー、現フレームの左側チャネルの長時間平滑化フレームエネルギー、現フレームの右側チャネルの長時間平滑化フレームエネルギー、現フレームの左側チャネルのチャネル間のエネルギー差、及び、現フレームの右側チャネルのチャネル間のエネルギー差が別個に取得される。
例えば、現フレームの左側チャネル信号のフレームエネルギーrms_Lは、次式、
Figure 0007088450000374
を満たし、
現フレームの右側チャネル信号のフレームエネルギーrms_Rは、次式、
Figure 0007088450000375
を満たし、
Figure 0007088450000376
は、現フレームの、遅延調整処理を通じて取得される左側チャネル信号を表し、
Figure 0007088450000377
は、現フレームの、遅延調整処理を通じて取得される右側チャネル信号を表す。
例えば、現フレームの左側チャネルの長時間平滑化フレームエネルギーtdm_lt_rms_L_SMcurは、次式、
tdm_lt_rms_L_SMcur=(1-A)×tdm_lt_rms_L_SMpre+A×rms_L
を満たし、
tdm_lt_rms_L_SMpreは、前フレームの左側チャネルの長時間平滑化フレームエネルギーを表し、Aは、左側チャネルの長時間平滑化フレームエネルギーの更新係数を表し、Aは、例えば、0と1との間の実数であってよく、例えば、Aは、0.4に等しくてよい。
例えば、現フレームの右側チャネルの長時間平滑化フレームエネルギーtdm_lt_rms_L_SMcurは、次式、
tdm_lt_rms_R_SMcur=(1-B)×tdm_lt_rms_R_SMpre+B×rms_R
を満たし、
tdm_lt_rms_R_SMpreは、前フレームの右側チャネルの長時間平滑化フレームエネルギーを表し、Bは、例えば、右側チャネルの長時間平滑化フレームエネルギーの更新係数を表し、Bの値は、0と1との間の実数であってよく、例えば、左側チャネルの長時間平滑化フレームエネルギーの更新係数の値に等しい又はこれとは異なっており、例えば、Bも0.4に等しくてよい。
例えば、現フレームの左側チャネルのチャネル間のエネルギー差ener_L_dtは、次式、
ener_L_dt=tdm_lt_rms_L_SMcur-tdm_lt_rms_L_SMpre
を満たす。
例えば、現フレームの右側チャネルのチャネル間のエネルギー差R_dtは、次式、
ener_R_dt=tdm_lt_rms_R_SMcur-tdm_lt_rms_R_SMpre
を満たす。
9082、遅延調整処理を通じて取得される現フレームの左側チャネル信号及び右側チャネル信号に基づいて、現フレームの基準チャネル信号を判定し、基準チャネル信号はまた、モノラル信号と称されてよく、基準チャネル信号が、モノラル信号と称される場合、基準チャネルに関連するすべての後続の説明及びパラメータ名において、基準チャネル信号は、モノラル信号とまとめて置き換えられてよい。
例えば、基準チャネル信号mono_i(n)は、次式、
Figure 0007088450000378
を満たし、
Figure 0007088450000379
は、現フレームの、遅延調整処理を通じて取得される左側チャネル信号であり、
Figure 0007088450000380
は、現フレームの、遅延調整処理を通じて取得される右側チャネル信号である。
9083、遅延調整処理を通じて取得される現フレームの左側チャネル信号及び右側チャネル信号のそれぞれと、基準チャネル信号との間の振幅相関のパラメータを計算する。
例えば、基準チャネル信号と、現フレームの、遅延調整処理を通じて取得される左側チャネル信号との間の振幅相関のパラメータcorr_LMは、次式、
Figure 0007088450000381
を満たし、
例えば、基準チャネル信号と、現フレームの、遅延調整処理を通じて取得される右側チャネル信号との間の振幅相関のパラメータcorr_RMは、次式、
Figure 0007088450000382
を満たし、
Figure 0007088450000383
は、現フレームの、遅延調整処理を通じて取得される左側チャネル信号を表し、
Figure 0007088450000384
は、現フレームの、遅延調整処理を通じて取得される右側チャネル信号を表し、mono_i(n)は、現フレームの基準チャネル信号を表し、
Figure 0007088450000385
は、絶対値を取ることを表す。
9084、基準チャネル信号と、現フレームの、遅延調整処理を通じて取得される左側チャネル信号との間の振幅相関のパラメータに基づいて、現フレームの左側チャネルと右側チャネルとの間の振幅相関の差のパラメータdiff_lt_corrと、基準チャネル信号と、現フレームの、遅延調整処理を通じて取得される右側チャネル信号との間の振幅相関のパラメータを計算する。
段階9081は、段階9082及び9083の前に実行されてよい、又は、段階9082及び9083の後で、段階9084の前に実行されてよいことが理解され得る。
図9-Cを参照すると、例えば、現フレームの左側チャネルと右側チャネルとの間の振幅相関の差のパラメータdiff_lt_corrは、具体的には、以下の段階90841及び90842を含み得る。
90841、基準チャネル信号と、現フレームの、遅延調整処理を通じて取得される左側チャネル信号との間の振幅相関のパラメータに基づいて、基準チャネル信号と、現フレームの、長時間平滑化を通じて取得される左側チャネル信号との間の振幅相関のパラメータを計算し、基準チャネル信号と、現フレームの、遅延調整処理を通じて取得される右側チャネル信号との間の振幅相関のパラメータに基づいて、基準チャネル信号と、現フレームの、長時間平滑化を通じて取得される右側チャネル信号との間の振幅相関のパラメータを計算する。
例えば、基準チャネル信号と、現フレームの、長時間平滑化を通じて取得される左側チャネル信号との間の振幅相関のパラメータと、基準チャネル信号と、現フレームの、長時間平滑化を通じて取得される右側チャネル信号との間の振幅相関のパラメータとを計算する段階は、基準チャネル信号と、現フレームの、長時間平滑化を通じて取得される左側チャネル信号との間の振幅相関のパラメータtdm_lt_corr_LM_SMが、次式、
tdm_lt_corr_LM_SMcur=α×tdm_lt_corr_LM_SMpre+(1-α)×corr_LM
を満たす段階であって、
tdm_lt_corr_LM_SMcurは、基準チャネル信号と、現フレームの、長時間平滑化を通じて取得される左側チャネル信号との間の振幅相関のパラメータを表し、tdm_lt_corr_LM_SMpreは、基準チャネル信号と、前フレームの、左側チャネルの平滑化係数を通じて取得される左側チャネル信号との間の振幅相関のパラメータを表し、αは、0と1との間の予め設定された実数、例えば、0.2、0.5又は0.8であってよく、αの値は、適用可能な計算を通じて取得されてよく、
例えば、基準チャネル信号と、現フレームの、長時間平滑化を通じて取得される右側チャネル信号との間の振幅相関のパラメータtdm_lt_corr_RM_SMは、次式、
tdm_lt_corr_RM_SMcur=β×tdm_lt_corr_RM_SMpre+(1-β)×corr_RM
を満たし、
tdm_lt_corr_RM_SMcurは、基準チャネル信号と、現フレームの、長時間平滑化を通じて取得される右側チャネル信号との間の振幅相関のパラメータを表し、tdm_lt_corr_RM_SMpreは、基準チャネル信号と、前フレームの、長時間平滑化を通じて取得される右側チャネル信号との間の振幅相関のパラメータを表し、βは、右側チャネルの平滑化係数を表し、βは、0と1との間の予め設定された実数であってよく、βは、左側チャネルの平滑化係数αの値に等しい又はこれとは異なっていてよく、例えば、βは、0.2、0.5又は0.8に等しくてよい、又は、βの値は、適用可能な計算を通じて取得されてよい、段階を含んでよい。
基準チャネル信号と、現フレームの、長時間平滑化を通じて取得される左側チャネル信号との間の振幅相関のパラメータ、及び、基準チャネル信号と、現フレームの、長時間平滑化を通じて取得される右側チャネル信号との間の振幅相関パラメータを計算するための別の方法では、以下の段階を含んでよい。
まず、基準チャネル信号と、現フレームの、遅延調整処理を通じて取得される左側チャネル信号との間の振幅相関のパラメータcorr_LMを修正して、現フレームの左側チャネル信号と、基準チャネル信号との間の振幅相関の修正されたパラメータcorr_LM_modを取得し、基準チャネル信号と、現フレームの、遅延調整処理を通じて取得される右側チャネル信号との間の振幅相関のパラメータcorr_RMを修正して、現フレームの右側チャネル信号と、基準チャネル信号との間の振幅相関の修正されたパラメータcorr_RM_modを取得する。
次に、現フレームの左側チャネル信号と、基準チャネル信号との間の振幅相関の修正されたパラメータcorr_LM_modと、現フレームの右側チャネル信号と、基準チャネル信号との間の振幅相関の修正されたパラメータcorr_RM_modと、基準チャネル信号と、前フレームの、長時間平滑化を通じて取得される左側チャネル信号との間の振幅相関のパラメータtdm_lt_corr_LM_SMpreと、基準チャネル信号と、前フレームの、長時間平滑化を通じて取得される右側チャネル信号との間の振幅相関のパラメータtdm_lt_corr_RM_SMpreとに基づいて、基準チャネル信号と、現フレームの、長時間平滑化を通じて取得される左側チャネル信号との間の振幅相関のパラメータdiff_lt_corr_LM_tmp、及び、基準チャネル信号と、現フレームの、長時間平滑化を通じて取得される右側チャネル信号との間の振幅相関のパラメータdiff_lt_corr_RM_tmpを判定する。
次に、基準チャネル信号と、現フレームの、長時間平滑化を通じて取得される左側チャネル信号との間の振幅相関のパラメータdiff_lt_corr_LM_tmpと、基準チャネル信号と、現フレームの、長時間平滑化を通じて取得される右側チャネル信号との間の振幅相関のパラメータdiff_lt_corr_RM_tmpとに基づいて、現フレームの左側チャネルと右側チャネルとの間の振幅相関の差のパラメータの初期値diff_lt_corr_SMを取得し、現フレームの左側チャネルと右側チャネルとの間の振幅相関の差のパラメータの取得した初期値diff_lt_corr_SMと、前フレームの左側チャネルと右側チャネルとの間の振幅相関の差のパラメータtdm_last_diff_lt_corr_SMとに基づいて、現フレームの左側チャネルと右側チャネルとの間の振幅相関の差のチャネル間の変化パラメータd_lt_corrを判定する。
最後に、現フレームの左側チャネルと右側チャネルとの間の振幅相関の差のチャネル間の変化パラメータ、現フレームの左側チャネル信号のフレームエネルギー、現フレームの右側チャネル信号のフレームエネルギー、現フレームの左側チャネルの長時間平滑化フレームエネルギー、現フレームの右側チャネルの長時間平滑化フレームエネルギー、現フレームの左側チャネルのチャネル間のエネルギー差、及び、信号エネルギー分析を通じて取得される現フレームの右側チャネルのチャネル間のエネルギー差に基づいて、異なる左側チャネルの平滑化係数及び右側チャネルの平滑化係数を適応的に選択し、基準チャネル信号と、現フレームの、長時間平滑化を通じて取得される左側チャネル信号との間の振幅相関のパラメータtdm_lt_corr_LM_SMと、基準チャネル信号と、現フレームの、長時間平滑化を通じて取得される右側チャネル信号との間の振幅相関のパラメータtdm_lt_corr_RM_SMを計算する。
前述した2つの例示的な方法に加えて、基準チャネル信号と、現フレームの、長時間平滑化を通じて取得される左側チャネル信号との間の振幅相関のパラメータと、基準チャネル信号と、現フレームの、長時間平滑化を通じて取得される右側チャネル信号との間の振幅相関のパラメータとを計算するための多くの他の方法があり得る。これは、本願において限定されるものではない。
90842、基準チャネル信号と、現フレームの、長時間平滑化を通じて取得される左側チャネル信号との間の振幅相関のパラメータ、基準チャネル信号と、現フレームの、長時間平滑化を通じて取得される右側チャネル信号との間の振幅相関のパラメータに基づいて、現フレームの左側チャネルと右側チャネルとの間の振幅相関の差のパラメータdiff_lt_corrを計算する。
例えば、現フレームの左側チャネルと右側チャネルとの間の振幅相関の差のパラメータdiff_lt_corrは、次式、
diff_lt_corr=tdm_lt_corr_LM_SM-tdm_lt_corr_RM_SM
を満たし、
tdm_lt_corr_LM_SMは、基準チャネル信号と、現フレームの、長時間平滑化を通じて取得される左側チャネル信号との間の振幅相関のパラメータを表し、tdm_lt_corr_RM_SMは、基準チャネル信号と、現フレームの、長時間平滑化を通じて取得される右側チャネル信号との間の振幅相関のパラメータを表す。
9085、現フレームの左側チャネルと右側チャネルとの間の振幅相関の差のパラメータdiff_lt_corrをチャネルの組み合わせ比率係数に変換し、チャネルの組み合わせ比率係数に対して量子化エンコーディングを実行して、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数と、チャネルの組み合わせ比率係数のコードインデックスとを判定する。
図9-Dを参照すると、現フレームの左側チャネルと右側チャネルとの間の振幅相関の差のパラメータをチャネルの組み合わせ比率係数に変換するための可能な方法は、具体的には、段階90851から90853を含み得る。
90851、左側チャネルと右側チャネルとの間の振幅相関の差のパラメータに対して、マッピング処理を実行することで、左側チャネルと右側チャネルとの間の振幅相関の差の、マッピング処理を通じて取得されるパラメータの値の範囲は、[MAP_MAXは、MIN、MAP_MAX]である。
左側チャネルと右側チャネルとの間の振幅相関の差のパラメータに対して、マッピング処理を実行するための方法は、以下の段階を含み得る。
まず、現フレームの左側チャネルと右側チャネルとの間の振幅相関の差のパラメータに対して、振幅制限処理を実行する。例えば、左側チャネルと右側チャネルとの間の振幅相関の差の、振幅制限処理を通じて取得されるパラメータdiff_lt_corr_limitは、次式、
Figure 0007088450000386
を満たし、RATIO_MAXは、左側チャネルと右側チャネルとの間の振幅相関の差の、振幅制限を通じて取得されるパラメータの最大値を表し、RATIO_MINは、左側チャネルと右側チャネルとの間の振幅相関の差の、振幅制限を通じて取得されるパラメータの最小値を表し、RATIO_MAXは、例えば、予め設定された経験的な値であり、RATIO_MAXは、例えば、1.5、3.0又は別の値であり、RATIO_MINは、例えば、予め設定された経験的な値であり、RATIO_MINは、例えば、-1.5、-3.0又は別の値であり、RATIO_MAX>RATIO_MINである。
次に、左側チャネルと右側チャネルとの間の振幅相関の差の、振幅制限処理を通じて取得されるパラメータに対して、マッピング処理を実行する。左側チャネルと右側チャネルとの間の振幅相関の差の、マッピング処理を通じて取得されるパラメータdiff_lt_corr_mapは、次式、
Figure 0007088450000387
を満たし、
Figure 0007088450000388
Figure 0007088450000389
又は、

Figure 0007088450000390
であり、
Figure 0007088450000391
Figure 0007088450000392
又は、

=MAP_MIN-RATIO_MIN×A
であり、
Figure 0007088450000393
Figure 0007088450000394
又は、
=MAP_LOW-RATIO_LOW×A
であり
MAP_MAXは、左側チャネルと右側チャネルとの間の振幅相関の差の、マッピング処理を通じて取得されるパラメータの最大値を表し、MAP_HIGHは、左側チャネルと右側チャネルとの間の振幅相関の差の、マッピング処理を通じて取得されるパラメータの高い閾値を表し、MAP_LOWは、左側チャネルと右側チャネルとの間の振幅相関の差の、マッピング処理を通じて取得されるパラメータの低い閾値を表し、MAP_MINは、左側チャネルと右側チャネルとの間の振幅相関の差の、マッピング処理を通じて取得されるパラメータの最小値を表し、
MAP_MAX>MAP_HIGH>MAP_LOW>MAP_MIN
であり、
例えば、本願の一部の実施形態において、MAP_MAXは2.0であってよく、MAP_HIGHは1.2であってよく、MAP_LOWは0.8であってよく、MAP_MINは0.0であってよく、もちろん、実際の適用は、これらの値の例に限定されるものではなく、
RATIO_MAXは、左側チャネルと右側チャネルとの間の振幅相関の差の、振幅制限を通じて取得されるパラメータの最大値を表し、RATIO_HIGHは、左側チャネルと右側チャネルとの間の振幅相関の差の、振幅制限を通じて取得されるパラメータの高い閾値を表し、RATIO_LOWは、左側チャネルと右側チャネルとの間の振幅相関の差の、振幅制限を通じて取得されるパラメータの低い閾値を表し、RATIO_MINは、左側チャネルと右側チャネルとの間の振幅相関の差の、振幅制限を通じて取得されるパラメータの最小値を表し、
RATIO_MAX>RATIO_HIGH>RATIO_LOW>RATIO_MIN
であり、
例えば、本願の一部の実施形態において、RATIO_MAXは1.5であり、RATIO_HIGHは0.75であり、RATIO_LOWは-0.75であり、RATIO_MINは-1.5であり、もちろん、実際の適用は、これらの値の例に限定されるものではない。
本願の一部の実施形態において、別の方法は以下のとおりである。すなわち、左側チャネルと右側チャネルとの間の振幅相関の差の、マッピング処理を通じて取得されるパラメータdiff_lt_corr_mapは、次式、
Figure 0007088450000395
を満たし、
diff_lt_corr_limitは、左側チャネルと右側チャネルとの間の振幅相関の差の、振幅制限処理を通じて取得されるパラメータを表し、
Figure 0007088450000396
であり、
RATIO_MAXは、左側チャネルと右側チャネルとの間の振幅相関の差の最大振幅パラメータを表し、-RATIO_MAXは、左側チャネルと右側チャネルとの間の振幅相関の差の最小振幅パラメータを表し、RATIO_MAXは、予め設定された経験的な値であってよく、例えば、RATIO_MAXは、1.5、3.0又は0より大きい別の実数であってよい。
90852、左側チャネルと右側チャネルとの間の振幅相関の差の、マッピング処理を通じて取得されるパラメータをチャネルの組み合わせ比率係数に変換する。
チャネルの組み合わせ比率係数ratio_SMは、次式、
Figure 0007088450000397
を満たし、
Figure 0007088450000398
は、コサイン演算を表す。
前述の方法に加えて、左側チャネルと右側チャネルとの間の振幅相関の差のパラメータは、代わりに、例えば、
逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を更新するか否かを、エンコーダの履歴キャッシュにある前フレームのキャッシュされるエンコーディングパラメータ(例えば、プライマリチャネル信号のチャネル間の相関パラメータ又はセカンダリチャネル信号のチャネル間の相関パラメータ)、現フレーム及び前フレームのチャネルの組み合わせスキーム識別子、及び、現フレーム及び前フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数に基づいて、かつ、現フレームの左側チャネルの長時間平滑化フレームエネルギー、現フレームの右側チャネルの長時間平滑化フレームエネルギー、及び、信号エネルギー分析を通じて取得される現フレームの左側チャネルのチャネル間のエネルギー差に基づいて判定する段階と、
逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数が更新される必要がある場合、前述の例示的な方法を用いて、左側チャネルと右側チャネルとの間の振幅相関の差のパラメータをチャネルの組み合わせ比率係数に変換する段階と、そうでない場合、
前フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数と、チャネルの組み合わせ比率係数のコードインデックスとを、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数及びチャネルの組み合わせ比率係数のコードインデックスとして直接用いる段階と
を含む別の方法を用いて、チャネルの組み合わせ比率係数に変換されてよい。
90853、変換を通じて取得されるチャネルの組み合わせ比率係数に対して量子化エンコーディングを実行して、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数を判定する。
具体的には、例えば、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応する初期のコードインデックスratio_idx_init_SM、及び、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応する、量子化エンコーディングを通じて取得されるチャネルの組み合わせ比率係数の初期値ratio_init_SMquaを取得するために、量子化エンコーディングは、変換を通じて取得されるチャネルの組み合わせ比率係数に対して実行され、
ratio_init_SMqua=ratio_tabl_SM[ratio_idx_init_SM]
であり、ratio_tabl_SMは、逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数のスカラー量子化のためのコードブックを表す。
従来技術における任意のスカラー量子化方法が、量子化エンコーディングのために用いられてよく、例えば、均一なスカラー量子化又は不均一なスカラー量子化が用いられてよい。コード化ビットの数は、5ビットであってよい。具体的な方法は、ここでは詳細に説明しない。逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数のスカラー量子化のためのコードブックは、相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数のスカラー量子化のためのコードブックと同じであってよい、又は、これとは異なっていてよい。コードブックが同じ場合、チャネルの組み合わせ比率係数のスカラー量子化のために用いられる1つのコードブックのみが格納される必要があり得る。この場合、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応し、量子化エンコーディングを通じて取得されるチャネルの組み合わせ比率係数の初期値ratio_init_SMquaは、
ratio_init_SMqua=ratio_tabl[ratio_idx_init_SM]
である。
例えば、方法は、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応し、量子化エンコーディングを通じて取得されるチャネルの組み合わせ比率係数の初期値を、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数として直接用いており、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の初期のコードインデックスを、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数のコードインデックスとして直接用いる。
現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数のコードインデックスratio_idx_SMは、
ratio_idx_SM=ratio_idx_init_SM
を満たす。
現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数は、次式、
ratio_SM=ratio_tabl[ratio_idx_SM]
を満たす。
別の方法は、前フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数のコードインデックス、又は、前フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数に基づいて、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応する、量子化エンコーディングを通じて取得されるチャネルの組み合わせ比率係数の初期値、及び、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応する初期のコードインデックスを修正し、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の修正されたコードインデックスを、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数のコードインデックスとして用い、逆相関信号チャネルの組み合わせスキームに対応する修正されたチャネルの組み合わせ比率係数を、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数として用いてよい。
現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数のコードインデックスratio_idx_SMは、
ratio_idx_SM=φ×ratio_idx_init_SM+(1-φ)×tdm_last_ratio_idx_SM
を満たし、ratio_idx_init_SMは、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応する初期のコードインデックスを表し、tdm_last_ratio_idx_Sは、前フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数のコードインデックスであり、φは、逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数の修正係数であり、φの値は、経験値であってよく、例えば、φは、0.8に等しくてよい。
この場合、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数は、次式、
ratio_SM=ratio_tabl[ratio_idx_SM]
を満たす。
さらに別の方法では、逆相関信号チャネルの組み合わせスキームに対応する量子化されていないチャネルの組み合わせ比率係数を、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数として用いている、すなわち、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数ratio_SMは、次式、
Figure 0007088450000399
を満たす。
さらに、第4の方法は、前フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数に基づいて、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応する量子化されていないチャネルの組み合わせ比率係数を修正する段階、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数として、逆相関信号チャネルの組み合わせスキームに対応する修正されたチャネルの組み合わせ比率係数を用いる段階、及び、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数に対して量子化エンコーディングを実行して、チャネルの組み合わせ比率係数のコードインデックスを取得する段階である。
前述の方法に加えて、左側チャネルと右側チャネルとの間の振幅相関の差のパラメータをチャネルの組み合わせ比率係数に変換し、チャネルの組み合わせ比率係数に対して量子化エンコーディングを実行するための多くの他の方法が存在してよい。同様に、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数と、チャネルの組み合わせ比率係数のコードインデックスとを判定するための多くの異なる方法も存在する。これは、本願において限定されるものではない。
909、前フレームのダウンミックスモードと、現フレームに対するチャネルの組み合わせスキームとに基づいて、現フレームのエンコーディングモードを判定する。
現フレームのチャネルの組み合わせスキーム識別子は、tdm_SM_flagとして示されてよい。
前フレームのチャネルの組み合わせスキーム識別子は、tdm_last_SM_flagとして示されてよい。
現フレームのダウンミックスモード識別子は、tdm_DM_flagとして示されてよい。
前フレームのダウンミックスモード識別子は、tdm_last_DM_flagとして示されてよい。
同様に、stereo_tdm_coder_typeは、現フレームのエンコーディングモードを示すために用いられてよい。
具体的には、例えば、stereo_tdm_coder_type=0は、現フレームのエンコーディングモードが、ダウンミックスモードAからダウンミックスモードAへのエンコーディングモードであることを示し、stereo_tdm_coder_type=1は、現フレームのエンコーディングモードが、ダウンミックスモードAからダウンミックスモードBへのエンコーディングモードであることを示し、stereo_tdm_coder_type=2は、現フレームのエンコーディングモードが、ダウンミックスモードAからダウンミックスモードCへのエンコーディングモードであることを示す。
具体的には、別の例として、stereo_tdm_coder_type=3は、現フレームのエンコーディングモードが、ダウンミックスモードBからダウンミックスモードBへのエンコーディングモードであることを示し、stereo_tdm_coder_type=4は、現フレームのエンコーディングモードが、ダウンミックスモードBからダウンミックスモードAへのエンコーディングモードであることを示し、stereo_tdm_coder_type=5は、現フレームのエンコーディングモードが、ダウンミックスモードBからダウンミックスモードDへのエンコーディングモードであることを示す。
具体的には、別の例として、stereo_tdm_coder_type=6は、現フレームのエンコーディングモードが、ダウンミックスモードBからダウンミックスモードCへのエンコーディングモードであることを示し、stereo_tdm_coder_type=7は、現フレームのエンコーディングモードが、ダウンミックスモードCからダウンミックスモードAへのエンコーディングモードであることを示し、stereo_tdm_coder_type=8は、現フレームのエンコーディングモードが、ダウンミックスモードCからダウンミックスモードDへのエンコーディングモードであることを示す。
具体的には、別の例として、stereo_tdm_coder_type=9は、現フレームのエンコーディングモードが、ダウンミックスモードDからダウンミックスモードDへのエンコーディングモードであることを示し、stereo_tdm_coder_type=10は、現フレームのエンコーディングモードが、ダウンミックスモードDからダウンミックスモードBへのエンコーディングモードであることを示し、stereo_tdm_coder_type=11は、現フレームのエンコーディングモードが、ダウンミックスモードDからダウンミックスモードCへのエンコーディングモードであることを示す。
前フレームのダウンミックスモードと、現フレームに対するチャネルの組み合わせスキームとに基づいて、現フレームのエンコーディングモードを判定する段階の具体的な実装については、他の実施形態において関連する説明を参照されたい。詳細はここでは再び説明しない。
910、現フレームに対するエンコーディングモードstereo_tdm_coder_typeを判定した後に、エンコーディング装置は、エンコーディングモードに基づいて、現フレームの左側チャネル信号及び右側チャネル信号に対して時間領域のダウンミックス処理を実行して、現フレームのプライマリチャネル信号及びセカンダリチャネル信号を取得する。
異なるエンコーディングモードで時間領域のダウンミックス処理を実行する実施例については、前述の実施形態における関連する例示的な実施形態を参照されたい。詳細はここでは再び説明しない。
911、エンコーディング装置は、プライマリチャネル信号及びセカンダリチャネル信号を別個にエンコードして、エンコードされたプライマリチャネル信号及びエンコードされたセカンダリチャネル信号を取得する。
具体的には、まず、前フレームのプライマリチャネル信号及び/又はセカンダリチャネル信号のエンコードから取得されたパラメータ情報と、プライマリチャネル信号及びセカンダリチャネル信号をエンコードするための総ビット数とに基づいて、プライマリチャネル信号及びセカンダリチャネル信号をエンコードするために、ビットが割り当てられてよい。次に、ビット割り当てに基づいて、プライマリチャネル信号及びセカンダリチャネル信号が別個にエンコードされ、その結果、プライマリチャネルのエンコーディング用のコードインデックス、及び、セカンダリチャネルのエンコーディング用のコードインデックスを取得する。プライマリチャネルのエンコーディング及びセカンダリチャネルのエンコーディングのために、任意のモノラルオーディオのエンコーディング技術が用いられてよい。詳細は、ここでは説明しない。
912、エンコーディング装置は、チャネルの組み合わせスキーム識別子に基づいて、チャネルの組み合わせ比率係数の対応するコードインデックスを選択し、コードインデックスをビットストリームに書き込み、エンコードされたプライマリチャネル信号、エンコードされたセカンダリチャネル信号及び現フレームのダウンミックスモード識別子tdm_DM_flagをビットストリームに書き込む。
具体的には、例えば、現フレームのチャネルの組み合わせスキーム識別子tdm_SM_flagが相関信号チャネルの組み合わせスキームに対応する場合、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数のコードインデックスratio_idxがビットストリームに書き込まれる、又は、現フレームのチャネルの組み合わせスキーム識別子tdm_SM_flagが逆相関信号チャネルの組み合わせスキームに対応する場合、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数のコードインデックスratio_idx_SMがビットストリームに書き込まれる。
例えば、tdm_SM_flag=0である場合、現フレームに対する相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数のコードインデックスratio_idxがビットストリームに書き込まれる、又は、tdm_SM_flag=1である場合、現フレームに対する逆相関信号チャネルの組み合わせスキームに対応するチャネルの組み合わせ比率係数のコードインデックスratio_idx_SMがビットストリームに書き込まれる。
さらに、エンコードされたプライマリチャネル信号、エンコードされたセカンダリチャネル信号、ダウンミックスモード識別子、現フレームのtdm_DM_flagなどがビットストリームに書き込まれる。ビットストリームに前述の情報を書き込むためのシーケンスが存在しないことが理解され得る。
それに応じて、以下では、例を用いて、時間領域のステレオデコーディングシナリオを説明する。
図10を参照すると、以下では、オーディオデコーディング方法をさらに提供する。オーディオデコーディング方法の関連する段階は、具体的には、デコーディング装置により実施され得る。方法は、具体的には、以下の段階を含み得る。
1001、ビットストリームに基づいてデコーディングを実行して、現フレームのデコーディングされたプライマリチャネル信号及びセカンダリチャネル信号を取得する。
1002、ビットストリームに基づいてデコーディングを実行して、現フレームの時間領域のステレオパラメータを取得する。
現フレームの時間領域のステレオパラメータは、現フレームのチャネルの組み合わせ比率係数を含み(ビットストリームは、現フレームのチャネルの組み合わせ比率係数のコードインデックスを含み、現フレームのチャネルの組み合わせ比率係数は、現フレームのチャネルの組み合わせ比率係数のコードインデックスに基づくデコーディングを通じて取得されてよい)、現フレームのチャネル間の時間差をさらに含む(例えば、ビットストリームは、現フレームのチャネル間の時間差のコードインデックスを含み、現フレームのチャネル間の時間差は、現フレームのチャネル間の時間差のコードインデックスに基づくデコーディングを通じて取得されてよい、又は、ビットストリームは、現フレームのチャネル間の時間差の絶対値のコードインデックスを含み、現フレームのチャネル間の時間差の絶対値は、現フレームのチャネル間の時間差の絶対値のコードインデックスに基づくデコーディングを通じて取得されてよい)などであってよい。
1003、ビットストリームに基づいて、現フレームの、ビットストリームに含まれるダウンミックスモード識別子を取得し、現フレームのダウンミックスモードを判定する。
1004.現フレームのダウンミックスモードと、前フレームのダウンミックスモードとに基づいて、現フレームのエンコーディングモードを判定する。
例えば、現フレームのダウンミックスモード識別子tdm_DM_flagが(00)である場合、現フレームのダウンミックスモードがダウンミックスモードAであり、現フレームのダウンミックスモード識別子tdm_DM_flagが(11)である場合、現フレームのダウンミックスモードがダウンミックスモードBであり、現フレームのダウンミックスモード識別子tdm_DM_flagが(01)である場合、現フレームのダウンミックスモードがダウンミックスモードCであり、又は、現フレームのダウンミックスモード識別子tdm_DM_flagが(10)である場合、現フレームのダウンミックスモードがダウンミックスモードDである。
段階1001、段階1002、段階1003及び1004を実行するために不可欠な順序がないことが理解される。
1005、現フレームの判定されるエンコーディングモードに基づいて、現フレームのデコーディングされたプライマリチャネル信号及びセカンダリチャネル信号に対して、時間領域のアップミックス処理を実行して、現フレームの再構築された左側チャネル信号及び右側チャネル信号を取得する。
異なるエンコーディングモードで時間領域のアップミックス処理を実行する関連する実施例については、前述の実施形態における関連する例示的な実施形態を参照されたい。詳細はここでは再び説明しない。
時間領域のアップミックス処理のために用いられるアップミックス行列は、現フレームの取得したチャネルの組み合わせ比率係数に基づいて構成される。
現フレームの再構築された左側チャネル信号及び右側チャネル信号は、現フレームのデコードされた左側チャネル信号及び右側チャネル信号として用いられてよい。
代わりに、さらに、現フレームのチャネル間の時間差に基づいて、現フレームの再構築された左側チャネル信号及び右側チャネル信号に対して、遅延調整がさらに実行されて、遅延調整を受けた現フレームの再構築された左側チャネル信号及び右側チャネル信号を取得してよい。遅延調整を通じて取得される現フレームの再構築された左側チャネル信号及び右側チャネル信号は、現フレームのデコードされた左側チャネル信号及び右側チャネル信号として用いられてよい。代わりに、さらに、遅延調整を通じて取得される現フレームの再構築された左側チャネル信号及び右側チャネル信号に対して、時間領域の後処理がさらに実行されてよい。時間領域の後処理を通じて取得される現フレームの再構築された左側チャネル信号及び右側チャネル信号は、現フレームのデコードされた左側チャネル信号及び右側チャネル信号として用いられてよい。
前述では、本願の実施形態における方法を詳細に説明している。以下では、本願の実施形態における装置を提供する。
図11-Aを参照すると、本願の実施形態は、装置1100を提供し、当該装置1100は、
互いに連結されるプロセッサ1110及びメモリ1120を含み、メモリ1110は、コンピュータプログラムを格納し、プロセッサ1120は、メモリに格納されたコンピュータプログラムを呼び出して、本願の実施形態において提供される任意の方法の段階の一部又はすべてを実行する。
メモリ1120は、限定されるものではないが、ランダムアクセスメモリ(Random Access Memory、略して、ROM)、リードオンリメモリ(Read-Only Memory、略して、RAM)、消去可能プログラマブルリードオンリメモリ(Erasable Programmable Read Only Memory、略して、EPROM)、又は、ポータブルリードオンリメモリ(Compact Disc Read-Only Memory、略して、CD-ROM)を含む。メモリ1120は、関連する命令及び関連するデータを格納するように構成される。
もちろん、装置1100は、データを送信及び受信するように構成される送受信機1130をさらに含んでよい。
プロセッサ1110は、1又は複数の中央演算処理装置(Central Processing Unit、略して、CPU)であってよい。プロセッサ1110が1つのCPUである場合、CPUは、シングルコアCPU又はマルチコアCPUであってよい。プロセッサ1110は、具体的には、デジタル信号プロセッサであってよい。
実施のプロセスにおいて、前述の方法における段階は、プロセッサ1110内のハードウェア統合論理回路を用いて、又は、ソフトウェアの形態で命令を用いて実施され得る。プロセッサ1110は、汎用プロセッサ、デジタル信号プロセッサ、アプリケーションに固有の集積回路、フィールドプログラマブルゲートアレイ又は別のプログラム可能な論理デバイス、ディスクリートゲート又はトランジスタ論理デバイス、又は、ディスクリートハードウェアコンポーネントであってよい。プロセッサ1110は、本発明の方法の実施形態における方法、段階及び論理ブロック図を実装又は実行してよい。汎用プロセッサは、マイクロプロセッサであってよい、又は、任意の従来のプロセッサなどであってよい。本発明の実施形態に関して開示される方法の段階は、ハードウェアデコーディングプロセッサを用いて、直接実行及び実現され得る、又は、デコーディングプロセッサ内のハードウェア及びソフトウェアモジュールの組み合わせを用いて実行及び実現され得る。
ソフトウェアモジュールは、従来の成熟した記憶媒体、例えば、ランダムアクセスメモリ、フラッシュメモリ、リードオンリメモリ、プログラマブルリードオンリメモリ、電気的消去可能プルグラマブルメモリ又はレジスタなどに配置されてよい。記憶媒体は、メモリ1120に配置される。例えば、プロセッサ1110は、メモリ1120から情報を読み出して、プロセッサ1110のハードウェアとの組み合わせで前述の方法における段階を遂行してよい。
さらに、装置1100は、送受信機1130をさらに含んでよい。送受信機1130は、関連するデータ(例えば、命令、チャネル信号又はビットストリーム)を送信及び受信するように構成され得る。
例えば、装置1100は、図2、図3、図6、図7、図8、図10及び図9-A1及び図9-A2から図9-Dのいずれか1つに示される実施形態における対応する方法の一部又はすべての段階を実行し得る。具体的には、例えば、装置1100が前述のエンコーディングに関する段階を実行する場合、装置1100は、エンコーディング装置(又は、オーディオエンコーディング装置)と称されてよい。装置1100が前述のデコーディングに関する段階を実行する場合、装置1100は、デコーディング装置(又は、オーディオデコーディング装置)と称されてよい。
図11-Bを参照すると、装置1100がエンコーディング装置である場合、装置1100は、例えば、マイク1140とアナログ-デジタル変換器1150とをさらに含んでよい。
マイク1140は、例えば、サンプリングを実行して、アナログオーディオ信号を取得するように構成されてよい。
アナログ-デジタル変換器1150は、例えば、アナログオーディオ信号をデジタルオーディオ信号に変換するように構成されてよい。
図11-Cを参照すると、装置1100がデコーディング装置である場合、装置1100は、例えば、拡声器1160と、デジタル-アナログ変換器1170とをさらに含んでよい。
デジタル-アナログ変換器1170は、例えば、デジタルオーディオ信号をアナログオーディオ信号に変換するように構成されてよい。
拡声器1160は、例えば、アナログオーディオ信号を再生するように構成されてよい。
さらに、図12-Aを参照すると、本願の実施形態は、装置1200を提供し、装置1200は、本願の実施形態において提供される任意の方法を実施するように構成される1又は複数の機能的なユニットを含む。
例えば、装置1200が、図2に示される実施形態において対応する方法を実行する場合、装置1200は、現フレームに対するチャネルの組み合わせスキームを判定し、前フレームのダウンミックスモードと、現フレームに対するチャネルの組み合わせスキームとに基づいて、現フレームのエンコーディングモードを判定するように構成される第1判定ユニット1210と、
現フレームのエンコーディングモードに基づいて、現フレームの左側チャネル信号と右側チャネル信号に対して時間領域のダウンミックス処理を実行して、現フレームのプライマリチャネル信号及びセカンダリチャネル信号を取得し、現フレームの取得したプライマリチャネル信号及びセカンダリチャネル信号をエンコードするように構成されるエンコードユニット1220とを含んでよい。
さらに、図12-Bを参照すると、装置1200は現フレームの時間領域のステレオパラメータを判定するように構成される第2判定ユニット1230をさらに含んでよい。エンコードユニット1220は、さらに、現フレームの時間領域のステレオパラメータをエンコードするように構成されてよい。
別の例として、図12-Cを参照すると、装置1200が、図3に示される実施形態における対応する方法を実行する場合、装置1200は、前フレームのダウンミックスモード及び現フレームのダウンミックスモードに基づいて、現フレームのエンコーディングモードを判定するように構成される第3判定ユニット1240と、
ビットストリームに基づいてデコーディングを実行して、現フレームのデコーディングされたプライマリチャネル信号及びセカンダリチャネル信号を取得し、ビットストリームに基づいてデコーディングを実行して、現フレームのダウンミックスモードを判定し、前フレームのダウンミックスモード及び現フレームのダウンミックスモードに基づいて、現フレームのエンコーディングモードを判定し、現フレームのエンコーディングモードに基づいて、現フレームのデコーディングされたプライマリチャネル信号及びセカンダリチャネル信号に対して、時間領域のアップミックス処理を実行して、現フレームの再構築された左側チャネル信号及び右側チャネル信号を取得するように構成されるデコードユニット1250と、
を含んでよい。
装置が別の方法を実行する場合も同様である。
本願の実施形態は、コンピュータ可読記憶媒体を提供する。コンピュータ可読記憶媒体は、プログラムコードを格納し、プログラムコードは、本願の実施形態において提供される任意の方法の一部又はすべての段階を実行するための命令を含む。
本願の実施形態は、コンピュータプログラム製品をさらに提供する。コンピュータプログラム製品がコンピュータ上で動作する場合、コンピュータは、本願の実施形態におおいて提供される任意の方法の一部又はすべての段階を実行することが可能となる。
前述の実施形態において、実施形態の説明は、それぞれ焦点を有する。実施形態において詳細に説明されていない部分については、他の実施形態における関連する説明を参照されたい。
本願において提供される1又は複数の実施形態にでは、開示される装置が別の方式で実装されてよいことを理解されたい。例えば、説明される装置の実施形態は、単なる例に過ぎない。例えば、ユニット区分は、論理的な機能区分に過ぎない、又は、実際の実装では、他の区分であってよい。例えば、複数のユニット又はコンポーネントは、組み合わされてよい、又は、別のシステムに統合されてよい、又は、いくつかの特徴が無視されてよい又は実行されなくてよい。さらに、表示又は説明される相互の間接的な結合又は直接的な結合又は通信接続は、いくつかのインタフェースを通じて実装されてよい。装置間又はユニット間の間接的な結合又は通信接続は、電子又は他の形態で実装されてよい。
別個の部品として説明されるユニットは、物理的に分離されてもよく、分離されていなくてもよく、ユニットとして表示される部分は、物理的なユニットであってもそうでなくともよく、1カ所に配置されてもよく、又は、複数のネットワークユニット上に分散されてもよい。ユニットの一部又はすべては、実施形態の解決手段の目的を実現するために、実際のニーズに基づいて選択されてよい。
さらに、本発明の実施形態における機能ユニットは、1つの処理ユニットに統合されてよい、又は、ユニットのそれぞれが物理的に単独で存在してよい、又は、2又はそれより多いユニットが1つのユニットに統合される。集積回路は、ハードウェアの形態で実装されてよい、又は、ソフトウェア機能ユニットの形態で実装されてよい。
集積回路がソフトウェア機能ユニットの形態で実装され、独立した製品として販売又は用いられる場合、集積回路は、コンピュータ可読記憶媒体に格納されてよい。そのような理解に基づいて、本発明の技術的解決手段は本質的に、又は、従来技術に対して貢献する部分、又は、技術的解決手段のすべて又は一部は、ソフトウェア製品の形態で実装されてよい。コンピュータソフトウェア製品は、記憶媒体に格納され、(パーソナルコンピュータ、サーバ又はネットワークデバイスなどであり得る)コンピュータデバイスに、本発明の実施形態において説明された方法の段階のすべて又は一部を実行するよう命令するための1又は複数の命令を含む。前述の記憶媒体は、プログラムコードを格納できる任意の媒体、例えば、USBフラッシュドライブ、リードオンリメモリ(ROM、Read-Only Memory)、ランダムアクセスメモリ(RAM、Random Access Memory)、リムーバブルハードディスク、磁気ディスク又は光ディスクを含む。

Claims (14)

  1. オーディオエンコーディング方法であって、
    現フレームの左側チャネル信号と右側チャネル信号との間の位相のずれを示すチャネル信号タイプを判定する段階と、
    前フレームのダウンミックスモードから前記現フレームのダウンミックスモードへの切替を、前記前フレームの前記ダウンミックスモードと前記現フレームの前記チャネル信号タイプとに基づいて判定する段階であって、前記ダウンミックスモードは前記左側チャネル信号及び前記右側チャネル信号からプライマリチャネル信号及びセカンダリチャネル信号を取得するためのモードである、段階と、
    前記切替に基づいて、前記現フレームの左側チャネル信号及び右側チャネル信号に対して時間領域のダウンミックス処理を実行して、前記現フレームの前記プライマリチャネル信号及び前記セカンダリチャネル信号を取得する段階と、
    前記現フレームの前記取得したプライマリチャネル信号及びセカンダリチャネル信号をエンコードしてビットストリームを取得する段階と
    を備え
    前記前フレームの前記ダウンミックスモードは、複数のダウンミックスモードのうちの1つであり、前記複数のダウンミックスモードは、ダウンミックスモードA、ダウンミックスモードB、ダウンミックスモードC及びダウンミックスモードDを有し、前記ダウンミックスモードA及び前記ダウンミックスモードDは、相関した左側及び右側チャネル信号のためのダウンミックスモードであり、前記ダウンミックスモードB及び前記ダウンミックスモードCは、逆相関した左側及び右側チャネル信号のためのダウンミックスモードであり、前記前フレームの前記ダウンミックスモードA、前記前フレームの前記ダウンミックスモードB、前記前フレームの前記ダウンミックスモードC及び前記前フレームの前記ダウンミックスモードDは、異なるダウンミックス行列に対応し、
    前フレームのダウンミックスモードと、前記現フレームの前記チャネル信号タイプとに基づいて、前記切替を判定する前記段階は、
    前記前フレームの前記ダウンミックスモードと、前記現フレームのダウンミックスモード切り替えのコスト値と、前記現フレームの前記チャネル信号タイプとに基づいて、前記切替を判定する段階を有し、
    前記現フレームの前記ダウンミックスモード切り替えのコスト値は、前記現フレームのダウンミックスモード切り替えのコスト関数に基づいて計算された計算結果であり、前記ダウンミックスモード切り替えのコスト関数は、前記現フレームの少なくとも1つの時間領域ステレオパラメータ、前記前フレームの少なくとも1つの時間領域ステレオパラメータ及び前記現フレームの前記左側チャネル信号及び前記右側チャネル信号のうちの少なくとも1つのパラメータに基づいて構成され、
    前記ダウンミックスモード切り替えのコスト関数は、ダウンミックスモードAからダウンミックスモードBへの切り替えに対するコスト関数、ダウンミックスモードAからダウンミックスモードCへの切り替えに対するコスト関数、ダウンミックスモードDからダウンミックスモードBへの切り替えに対するコスト関数、ダウンミックスモードDからダウンミックスモードCへの切り替えに対するコスト関数、ダウンミックスモードBからダウンミックスモードAへの切り替えに対するコスト関数、ダウンミックスモードBからダウンミックスモードDへの切り替えに対するコスト関数、ダウンミックスモードCからダウンミックスモードAへの切り替えに対するコスト関数及びダウンミックスモードCからダウンミックスモードDへの切り替えに対するコスト関数のうちの1つの切り替えのコスト関数であり、
    ダウンミックスモードAからダウンミックスモードBへの切り替えに対する前記コスト関数は、
    Figure 0007088450000400
    であり、
    α 2_pre =1-α 1_pre
    α =1-α
    であり、Cost_ABは、ダウンミックスモードAからダウンミックスモードBへの切り替えに対する前記コスト関数の値を表し、start_sample_Aは、ダウンミックスモードAからダウンミックスモードBへの切り替えに対する前記コスト関数の計算開始サンプリングポイントを表し、end_sample_Aは、ダウンミックスモードAからダウンミックスモードBへの切り替えに対する前記コスト関数の計算終了サンプリングポイントを表し、start_sample_Aは、0より大きく、かつ、N-1より小さい整数であり、end_sample_Aは、0より大きく、かつ、N-1より小さい整数であり、start_sample_Aは、end_sample_Aより小さく、
    nは、サンプリングポイントのシーケンス番号を表し、Nはフレームの長さを表し、
    (n)は、前記現フレームの前記左側チャネル信号を表し、X (n)は、前記現フレームの前記右側チャネル信号を表し、
    α =ratio_SMであり、ratio_SMは、前記現フレームの逆相関した左側及び右側チャネル信号を示すチャネル信号タイプに対応するチャネルの組み合わせ比率係数を表し
    α 1_pre =tdm_last_ratioであり、tdm_last_ratioは、前記前フレームの相関した左側及び右側チャネル信号を示すチャネル信号タイプに対応するチャネルの組み合わせ比率係数を表し、
    ダウンミックスモードAからダウンミックスモードCへの切り替えに対する前記コスト関数は、
    Figure 0007088450000401
    であり、
    α 2_pre =1-α 1_pre
    α =1-α
    であり、Cost_ACは、ダウンミックスモードAからダウンミックスモードCへの切り替えに対する前記コスト関数の値を表し、start_sample_Aは、ダウンミックスモードAからダウンミックスモードCへの切り替えに対する前記コスト関数の計算開始サンプリングポイントを表し、end_sample_Aは、ダウンミックスモードAからダウンミックスモードCへの切り替えに対する前記コスト関数の計算終了サンプリングポイントを表し、start_sample_Aは、0より大きく、かつ、N-1より小さい整数であり、end_sample_Aは、0より大きく、かつ、N-1より小さい整数であり、start_sample_Aは、end_sample_Aより小さく、
    nは、サンプリングポイントのシーケンス番号を表し、Nはフレームの長さを表し、
    (n)は、前記現フレームの前記左側チャネル信号を表し、X (n)は、前記現フレームの前記右側チャネル信号を表し、
    α =ratio_SMであり、ratio_SMは、前記現フレームの逆相関した左側及び右側チャネル信号を示す前記チャネル信号タイプに対応するチャネルの組み合わせ比率係数を表し、
    α 1_pre =tdm_last_ratioであり、tdm_last_ratioは、前記前フレームの相関した左側及び右側チャネル信号を示す前記チャネル信号タイプに対応するチャネルの組み合わせ比率係数を表し、
    ダウンミックスモードBからダウンミックスモードAへの切り替えに対する前記コスト関数は、
    Figure 0007088450000402
    であり、
    α 2_pre =1-α 1_pre
    α =1-α
    であり、Cost_BAは、ダウンミックスモードBからダウンミックスモードAへの切り替えに対する前記コスト関数の値を表し、start_sample_Bは、ダウンミックスモードBからダウンミックスモードAへの切り替えに対する前記コスト関数の計算開始サンプリングポイントを表し、end_sample_Bは、ダウンミックスモードBからダウンミックスモードAへの切り替えに対する前記コスト関数の計算終了サンプリングポイントを表し、start_sample_Bは、0より大きく、かつ、N-1より小さい整数であり、end_sample_Bは、0より大きく、かつ、N-1より小さい整数であり、start_sample_Bは、end_sample_Bより小さく、
    nは、サンプリングポイントのシーケンス番号を表し、Nはフレームの長さを表し、
    (n)は、前記現フレームの前記左側チャネル信号を表し、X (n)は、前記現フレームの前記右側チャネル信号を表し、
    α =ratioであり、ratioは、前記現フレームの相関した左側及び右側チャネル信号を示すチャネル信号タイプに対応するチャネルの組み合わせ比率係数を表し、
    α 1_pre =tdm_last_ratio_SMであり、tdm_last_ratio_SMは、前記前フレームの逆相関した左側及び右側チャネル信号を示すチャネル信号タイプに対応するチャネルの組み合わせ比率係数を表し、
    ダウンミックスモードBからダウンミックスモードDへの切り替えに対する前記コスト関数は、
    Figure 0007088450000403
    であり、
    α 2_pre =1-α 1_pre
    α =1-α
    であり、Cost_BDは、ダウンミックスモードBからダウンミックスモードDへの切り替えに対する前記コスト関数の値を表し、start_sample_Bは、ダウンミックスモードBからダウンミックスモードDへの切り替えに対する前記コスト関数の計算開始サンプリングポイントを表し、end_sample_Bは、ダウンミックスモードBからダウンミックスモードDへの切り替えに対する前記コスト関数の計算終了サンプリングポイントを表し、start_sample_Bは、0より大きく、かつ、N-1より小さい整数であり、end_sample_Bは、0より大きく、かつ、N-1より小さい整数であり、start_sample_Bは、end_sample_Bより小さく、
    nは、サンプリングポイントのシーケンス番号を表し、Nはフレームの長さを表し、
    (n)は、前記現フレームの前記左側チャネル信号を表し、X (n)は、前記現フレームの前記右側チャネル信号を表し、
    α =ratioであり、ratioは、前記現フレームの相関した左側及び右側チャネル信号を示す前記チャネル信号タイプに対応するチャネルの組み合わせ比率係数を表し、
    α 1_pre =tdm_last_ratio_SMであり、tdm_last_ratio_SMは、前記前フレームの逆相関した左側及び右側チャネル信号を示す前記チャネル信号タイプに対応するチャネルの組み合わせ比率係数を表し、
    ダウンミックスモードCからダウンミックスモードDへの切り替えに対する前記コスト関数は、
    Figure 0007088450000404
    であり、
    α 2_pre =1-α 1_pre
    α =1-α
    であり、Cost_CDは、ダウンミックスモードCからダウンミックスモードDへの切り替えに対する前記コスト関数の値を表し、start_sample_Cは、ダウンミックスモードCからダウンミックスモードDへの切り替えに対する前記コスト関数の計算開始サンプリングポイントを表し、end_sample_Cは、ダウンミックスモードCからダウンミックスモードDへの切り替えに対する前記コスト関数の計算終了サンプリングポイントを表し、start_sample_Cは、0より大きく、かつ、N-1より小さい整数であり、end_sample_Cは、0より大きく、かつ、N-1より小さい整数であり、start_sample_Cは、end_sample_Cより小さく、
    nは、サンプリングポイントのシーケンス番号を表し、Nはフレームの長さを表し
    (n)は、前記現フレームの前記左側チャネル信号を表し、X (n)は、前記現フレームの前記右側チャネル信号を表し、
    α =ratioであり、ratioは、前記現フレームの相関した左側及び右側チャネル信号を示す前記チャネル信号タイプに対応するチャネルの組み合わせ比率係数を表し、
    α 1_pre =tdm_last_ratio_SMであり、tdm_last_ratio_SMは、前記前フレームの逆相関した左側及び右側チャネル信号を示す前記チャネル信号タイプに対応するチャネルの組み合わせ比率係数を表し、
    ダウンミックスモードCからダウンミックスモードAへの切り替えに対する前記コスト関数は、
    Figure 0007088450000405
    であり、
    α 2_pre =1-α 1_pre
    α =1-α
    であり、Cost_CAは、ダウンミックスモードCからダウンミックスモードAへの切り替えに対する前記コスト関数の値を表し、start_sample_Cは、ダウンミックスモードCからダウンミックスモードAへの切り替えに対する前記コスト関数の計算開始サンプリングポイントを表し、end_sample_Cは、ダウンミックスモードCからダウンミックスモードAへの切り替えに対する前記コスト関数の計算終了サンプリングポイントを表し、start_sample_Cは、0より大きく、かつ、N-1より小さい整数であり、end_sample_Cは、0より大きく、かつ、N-1より小さい整数であり、start_sample_Cは、end_sample_Cより小さく、
    nは、サンプリングポイントのシーケンス番号を表し、Nはフレームの長さを表し、
    (n)は、前記現フレームの前記左側チャネル信号を表し、X (n)は、前記現フレームの前記右側チャネル信号を表し、
    α =ratioであり、ratioは、前記現フレームの相関した左側及び右側チャネル信号を示す前記チャネル信号タイプに対応するチャネルの組み合わせ比率係数を表し、
    α 1_pre =tdm_last_ratio_SMであり、tdm_last_ratio_SMは、前記前フレームの逆相関した左側及び右側チャネル信号を示す前記チャネル信号タイプに対応するチャネルの組み合わせ比率係数を表し、
    ダウンミックスモードDからダウンミックスモードCへの切り替えに対する前記コスト関数は、
    Figure 0007088450000406
    であり、
    α 2_pre =1-α 1_pre
    α =1-α
    であり、Cost_DCは、ダウンミックスモードDからダウンミックスモードCへの切り替えに対する前記コスト関数の値を表し、start_sample_Dは、ダウンミックスモードDからダウンミックスモードCへの切り替えに対する前記コスト関数の計算開始サンプリングポイントを表し、end_sample_Dは、ダウンミックスモードDからダウンミックスモードCへの切り替えに対する前記コスト関数の計算終了サンプリングポイントを表し、start_sample_Dは、0より大きく、かつ、N-1より小さい整数であり、end_sample_Dは、0より大きく、かつ、N-1より小さい整数であり、start_sample_Dは、end_sample_Dより小さく、
    nは、サンプリングポイントのシーケンス番号を表し、Nはフレームの長さを表し、
    (n)は、前記現フレームの前記左側チャネル信号を表し、X (n)は、前記現フレームの前記右側チャネル信号を表し、
    α =ratio_SMであり、ratio_SMは、前記現フレームの逆相関した左側及び右側チャネル信号を示す前記チャネル信号タイプに対応するチャネルの組み合わせ比率係数を表し、
    α 1_pre =tdm_last_ratioであり、tdm_last_ratioは、前記前フレームの相関した左側及び右側チャネル信号を示す前記チャネル信号タイプに対応するチャネルの組み合わせ比率係数を表し、
    ダウンミックスモードDからダウンミックスモードBへの切り替えに対する前記コスト関数は、
    Figure 0007088450000407
    であり、
    α 2_pre =1-α 1_pre
    α =1-α
    であり、Cost_DBは、ダウンミックスモードDからダウンミックスモードBへの切り替えに対する前記コスト関数の値を表し、start_sample_Dは、ダウンミックスモードDからダウンミックスモードBへの切り替えに対する前記コスト関数の計算開始サンプリングポイントを表し、end_sample_Dは、ダウンミックスモードDからダウンミックスモードBへの切り替えに対する前記コスト関数の計算終了サンプリングポイントを表し、start_sample_Dは、0より大きく、かつ、N-1より小さい整数であり、end_sample_Dは、0より大きく、かつ、N-1より小さい整数であり、start_sample_Dは、end_sample_Dより小さく、
    nは、サンプリングポイントのシーケンス番号を表し、Nはフレームの長さを表し、
    (n)は、前記現フレームの前記左側チャネル信号を表し、X (n)は、前記現フレームの前記右側チャネル信号を表し、
    α =ratio_SMであり、ratio_SMは、前記現フレームの逆相関した左側及び右側チャネル信号を示す前記チャネル信号タイプに対応するチャネルの組み合わせ比率係数を表し、
    α 1_pre =tdm_last_ratioであり、tdm_last_ratioは、前記前フレームの相関した左側及び右側チャネル信号を示す前記チャネル信号タイプに対応するチャネルの組み合わせ比率係数を表す、
    方法。
  2. 前記現フレームの前記チャネル信号タイプは、複数のチャネル信号タイプのうちの1つであり、前記複数のチャネル信号タイプは、逆相関信号のチャネル信号タイプ及び相関信号のチャネル信号タイプを有し、前記相関信号のチャネル信号タイプは、ほぼ同じ位相の左側及び右側チャネル信号に対応するチャネル信号タイプであり、前記逆相関信号のチャネル信号タイプは、ほぼ位相のずれた左側及び右側チャネル信号に対応するチャネル信号タイプである、請求項1に記載の方法。
  3. 前記前フレームの前記ダウンミックスモードと前記現フレームの前記チャネル信号タイプとに基づいて、前記切替を判定する前記段階は、
    前記前フレームの前記ダウンミックスモードが前記ダウンミックスモードAであり、かつ、前記現フレームの前記チャネル信号タイプが相関した左側及び右側チャネル信号を示すチャネル信号タイプである場合、前記現フレームのダウンミックスモードが前記ダウンミックスモードAであると判定し、前記切替がダウンミックスモードAからダウンミックスモードAへの切替であると判定する段階、
    前記前フレームの前記ダウンミックスモードが前記ダウンミックスモードBであり、かつ、前記現フレームの前記チャネル信号タイプが逆相関した左側及び右側チャネル信号を示すチャネル信号タイプである場合、前記現フレームのダウンミックスモードが前記ダウンミックスモードBであると判定し、前記切替がダウンミックスモードBからダウンミックスモードBへの切替であると判定する段階、
    前記前フレームの前記ダウンミックスモードが前記ダウンミックスモードCであり、かつ、前記現フレームの前記チャネル信号タイプが逆相関した左側及び右側チャネル信号を示す前記チャネル信号タイプである場合、前記現フレームのダウンミックスモードが前記ダウンミックスモードCであると判定し、前記切替がダウンミックスモードCからダウンミックスモードCへの切替であると判定する段階、又は、
    前記前フレームの前記ダウンミックスモードが前記ダウンミックスモードDであり、かつ、前記現フレームの前記チャネル信号タイプが相関した左側及び右側チャネル信号を示す前記チャネル信号タイプである場合、前記現フレームのダウンミックスモードが前記ダウンミックスモードDであると判定し、前記切替がダウンミックスモードDからダウンミックスモードDへの切替であると判定する段階
    を有する、請求項1又は2に記載の方法。
  4. 前記前フレームの前記ダウンミックスモードと、前記現フレームのダウンミックスモード切り替えのコスト値と、前記現フレームの前記チャネル信号タイプとに基づいて、前記切替を判定する前記段階は、
    前記前フレームの前記ダウンミックスモードが前記ダウンミックスモードAであり、前記現フレームの前記チャネル信号タイプが逆相関した左側及び右側チャネル信号を示すチャネル信号タイプであり、かつ、前記現フレームの前記ダウンミックスモード切り替えのコスト値が第1のダウンミックスモード切り替え条件を満たす場合、前記現フレームのダウンミックスモードが前記ダウンミックスモードCであり、かつ、前記切替がダウンミックスモードAからダウンミックスモードCへの切替であると判定する段階であって、前記ダウンミックスモード切り替えのコスト値は、ダウンミックスモード切り替えのコスト関数の値であり、前記第1のダウンミックスモード切り替え条件は、前記現フレームのダウンミックスモードAからダウンミックスモードBへの切り替えに対する前記コスト関数の値が、ダウンミックスモードAからダウンミックスモードCへの切り替えに対する前記コスト関数の値より大きい又はこれに等しいことである、段階、
    前記前フレームの前記ダウンミックスモードが前記ダウンミックスモードAであり、前記現フレームの前記チャネル信号タイプが逆相関した左側及び右側チャネル信号を示すチャネル信号タイプであり、かつ、前記現フレームの前記ダウンミックスモード切り替えのコスト値が第2のダウンミックスモード切り替え条件を満たす場合、前記現フレームのダウンミックスモードが前記ダウンミックスモードBであり、かつ、前記切替がダウンミックスモードAからダウンミックスモードBへの切替であると判定する段階であって、前記ダウンミックスモード切り替えのコスト値は、前記ダウンミックスモード切り替えのコスト関数の前記値であり、前記第2のダウンミックスモード切り替え条件は、前記現フレームのダウンミックスモードAからダウンミックスモードBへの切り替えに対する前記コスト関数の値が、ダウンミックスモードAからダウンミックスモードCへの切り替えに対する前記コスト関数の値より小さい又はこれに等しいことである、段階、
    前記前フレームの前記ダウンミックスモードが前記ダウンミックスモードBであり、前記現フレームの前記チャネル信号タイプが相関した左側及び右側チャネル信号を示すチャネル信号タイプであり、かつ、前記現フレームの前記ダウンミックスモード切り替えのコスト値が第3のダウンミックスモード切り替え条件を満たす場合、前記現フレームのダウンミックスモードが前記ダウンミックスモードAであり、かつ、前記切替がダウンミックスモードBからダウンミックスモードAへの切替であると判定する段階であって、前記ダウンミックスモード切り替えのコスト値は、前記ダウンミックスモード切り替えのコスト関数の前記値であり、前記第3のダウンミックスモード切り替え条件は、前記現フレームのダウンミックスモードBからダウンミックスモードAへの切り替えに対する前記コスト関数の値が、ダウンミックスモードBからダウンミックスモードDへの切り替えに対する前記コスト関数の値より小さい又はこれに等しいことである、段階と、
    前記前フレームの前記ダウンミックスモードが前記ダウンミックスモードBであり、前記現フレームの前記チャネル信号タイプが相関した左側及び右側チャネル信号を示す前記チャネル信号タイプであり、かつ、前記現フレームの前記ダウンミックスモード切り替えのコスト値が第4のダウンミックスモード切り替え条件を満たす場合、前記現フレームのダウンミックスモードが前記ダウンミックスモードDであり、かつ、前記切替がダウンミックスモードBからダウンミックスモードDへの切替であると判定する段階であって、前記ダウンミックスモード切り替えのコスト値は、前記ダウンミックスモード切り替えのコスト関数の前記値であり、前記第4のダウンミックスモード切り替え条件は、前記現フレームのダウンミックスモードBからダウンミックスモードAへの切り替えに対する前記コスト関数の値が、ダウンミックスモードBからダウンミックスモードDへの切り替えに対する前記コスト関数の値より大きい又はこれに等しいことである、段階、
    前記前フレームの前記ダウンミックスモードが前記ダウンミックスモードCであり、前記現フレームの前記チャネル信号タイプが相関した左側及び右側チャネル信号を示す前記チャネル信号タイプであり、かつ、前記現フレームの前記ダウンミックスモード切り替えのコスト値が第5のダウンミックスモード切り替え条件を満たす場合、前記現フレームのダウンミックスモードが前記ダウンミックスモードDであり、かつ、前記切替がダウンミックスモードCからダウンミックスモードDへの切替であると判定する段階であって、前記ダウンミックスモード切り替えのコスト値は、前記ダウンミックスモード切り替えのコスト関数の前記値であり、前記第5のダウンミックスモード切り替え条件は、前記現フレームのダウンミックスモードCからダウンミックスモードAへの切り替えに対する前記コスト関数の値が、ダウンミックスモードCからダウンミックスモードDへの切り替えに対する前記コスト関数の値より大きい又はこれに等しいことである、段階、
    前記前フレームの前記ダウンミックスモードが前記ダウンミックスモードCであり、前記現フレームの前記チャネル信号タイプが相関した左側及び右側チャネル信号を示す前記チャネル信号タイプであり、かつ、前記現フレームの前記ダウンミックスモード切り替えのコスト値が第6のダウンミックスモード切り替え条件を満たす場合、前記現フレームのダウンミックスモードが前記ダウンミックスモードAであり、かつ、前記切替がダウンミックスモードCからダウンミックスモードAへの切替であると判定する段階であって、前記ダウンミックスモード切り替えのコスト値は、前記ダウンミックスモード切り替えのコスト関数の前記値であり、前記第6のダウンミックスモード切り替え条件は、前記現フレームのダウンミックスモードCからダウンミックスモードAへの切り替えに対する前記コスト関数の値が、ダウンミックスモードCからダウンミックスモードDへの切り替えに対する前記コスト関数の値より小さい又はこれに等しいことである、段階、
    前記前フレームの前記ダウンミックスモードが前記ダウンミックスモードDであり、前記現フレームの前記チャネル信号タイプが逆相関した左側及び右側チャネル信号を示す前記チャネル信号タイプであり、かつ、前記現フレームの前記ダウンミックスモード切り替えのコスト値が第7のダウンミックスモード切り替え条件を満たす場合、前記現フレームのダウンミックスモードが前記ダウンミックスモードBであり、かつ、前記切替がダウンミックスモードDからダウンミックスモードBへの切替であると判定する段階であって、前記ダウンミックスモード切り替えのコスト値は、前記ダウンミックスモード切り替えのコスト関数の前記値であり、前記第7のダウンミックスモード切り替え条件は、前記現フレームのダウンミックスモードDからダウンミックスモードBへの切り替えに対する前記コスト関数の値が、ダウンミックスモードDからダウンミックスモードCへの切り替えに対する前記コスト関数の値より小さい又はこれに等しいことである、段階、又は、
    前記前フレームの前記ダウンミックスモードが前記ダウンミックスモードDであり、前記現フレームの前記チャネル信号タイプが逆相関した左側及び右側チャネル信号を示す前記チャネル信号タイプであり、かつ、前記現フレームの前記ダウンミックスモード切り替えのコスト値が第8のダウンミックスモード切り替え条件を満たす場合、前記現フレームのダウンミックスモードが前記ダウンミックスモードCであり、かつ、前記切替がダウンミックスモードDからダウンミックスモードCへの切替であると判定する段階であって、前記ダウンミックスモード切り替えのコスト値は、前記ダウンミックスモード切り替えのコスト関数の前記値であり、前記第8のダウンミックスモード切り替え条件は、前記現フレームのダウンミックスモードDからダウンミックスモードBへの切り替えに対する前記コスト関数の値が、ダウンミックスモードDからダウンミックスモードCへの切り替えに対する前記コスト関数の値より大きい又はこれに等しいことである、段階
    を有する、請求項1又は2に記載の方法。
  5. 前記前フレームの前記ダウンミックスモードと、前記現フレームのダウンミックスモード切り替えのコスト値と、前記現フレームの前記チャネル信号タイプとに基づいて、前記切替を判定する前記段階は、
    前記前フレームの前記ダウンミックスモードが前記ダウンミックスモードAであり、前記現フレームの前記チャネル信号タイプが逆相関した左側及び右側チャネル信号を示すチャネル信号タイプであり、かつ、前記現フレームの前記ダウンミックスモード切り替えのコスト値が第9のダウンミックスモード切り替え条件を満たす場合、前記現フレームのダウンミックスモードが前記ダウンミックスモードCであり、かつ、前記切替がダウンミックスモードAからダウンミックスモードCへの切替であると判定する段階であって、前記現フレームの前記ダウンミックスモード切り替えのコスト値は、前記現フレームのチャネルの組み合わせ比率係数であり前記第9のダウンミックスモード切り替え条件は、前記現フレームのチャネルの組み合わせ比率係数が、チャネルの組み合わせ比率係数の閾値S1より小さい又はこれに等しいことである、段階、
    前記前フレームの前記ダウンミックスモードが前記ダウンミックスモードAであり、前記現フレームの前記チャネル信号タイプが逆相関した左側及び右側チャネル信号を示す前記チャネル信号タイプであり、かつ、前記現フレームの前記ダウンミックスモード切り替えのコスト値が第10のダウンミックスモード切り替え条件を満たす場合、前記現フレームのダウンミックスモードが前記ダウンミックスモードBであり、かつ、前記切替がダウンミックスモードAからダウンミックスモードBへの切替であると判定する段階であって、前記現フレームの前記ダウンミックスモード切り替えのコスト値は、前記現フレームのチャネルの組み合わせ比率係数であり、前記第10のダウンミックスモード切り替え条件は、前記現フレームのチャネルの組み合わせ比率係数が、チャネルの組み合わせ比率係数の閾値S1より大きい又はこれに等しいことである、段階、
    前記前フレームの前記ダウンミックスモードが前記ダウンミックスモードBであり、前記現フレームの前記チャネル信号タイプが相関した左側及び右側チャネル信号を示すチャネル信号タイプであり、かつ、前記現フレームの前記ダウンミックスモード切り替えのコスト値が第11のダウンミックスモード切り替え条件を満たす場合、前記現フレームのダウンミックスモードが前記ダウンミックスモードAであり、かつ、前記切替がダウンミックスモードBからダウンミックスモードAへの切替であると判定する段階であって、前記現フレームの前記ダウンミックスモード切り替えのコスト値は、前記現フレームのチャネルの組み合わせ比率係数であり、前記第11のダウンミックスモード切り替え条件は、前記現フレームのチャネルの組み合わせ比率係数が、チャネルの組み合わせ比率係数の閾値S2より大きい又はこれに等しいことである、段階、
    前記前フレームの前記ダウンミックスモードが前記ダウンミックスモードBであり、前記現フレームの前記チャネル信号タイプが相関した左側及び右側チャネル信号を示す前記チャネル信号タイプであり、かつ、前記現フレームの前記ダウンミックスモード切り替えのコスト値が第12のダウンミックスモード切り替え条件を満たす場合、前記現フレームのダウンミックスモードが前記ダウンミックスモードDであり、かつ、前記切替がダウンミックスモードBからダウンミックスモードDへの切替であると判定する段階であって、前記現フレームの前記ダウンミックスモード切り替えのコスト値は、前記現フレームのチャネルの組み合わせ比率係数であり、前記第12のダウンミックスモード切り替え条件は、前記現フレームのチャネルの組み合わせ比率係数が、チャネルの組み合わせ比率係数の閾値S2より小さい又はこれに等しいことである、段階、
    前記前フレームの前記ダウンミックスモードが前記ダウンミックスモードCであり、前記現フレームの前記チャネル信号タイプが相関した左側及び右側チャネル信号を示す前記チャネル信号タイプであり、かつ、前記現フレームの前記ダウンミックスモード切り替えのコスト値が第13のダウンミックスモード切り替え条件を満たす場合、前記現フレームのダウンミックスモードが前記ダウンミックスモードDであり、かつ、前記切替がダウンミックスモードCからダウンミックスモードDへの切替であると判定する段階であって、前記現フレームの前記ダウンミックスモード切り替えのコスト値は、前記現フレームのチャネルの組み合わせ比率係数であり、前記第13のダウンミックスモード切り替え条件は、前記現フレームのチャネルの組み合わせ比率係数が、チャネルの組み合わせ比率係数の閾値S3より大きい又はこれに等しいことである、段階、
    前記前フレームの前記ダウンミックスモードが前記ダウンミックスモードCであり、前記現フレームの前記チャネル信号タイプが相関した左側及び右側チャネル信号を示す前記チャネル信号タイプであり、かつ、前記現フレームの前記ダウンミックスモード切り替えのコスト値が第14のダウンミックスモード切り替え条件を満たす場合、前記現フレームのダウンミックスモードが前記ダウンミックスモードAであり、かつ、前記切替がダウンミックスモードCからダウンミックスモードAへの切替であると判定する段階であって、前記現フレームの前記ダウンミックスモード切り替えのコスト値は、前記現フレームのチャネルの組み合わせ比率係数であり、前記第14のダウンミックスモード切り替え条件は、前記現フレームのチャネルの組み合わせ比率係数が、チャネルの組み合わせ比率係数の閾値S3より小さい又はこれに等しいことである、段階、
    前記前フレームの前記ダウンミックスモードが前記ダウンミックスモードDであり、前記現フレームの前記チャネル信号タイプが逆相関した左側及び右側チャネル信号を示す前記チャネル信号タイプであり、かつ、前記現フレームの前記ダウンミックスモード切り替えのコスト値が第15のダウンミックスモード切り替え条件を満たす場合、前記現フレームのダウンミックスモードが前記ダウンミックスモードBであり、かつ、前記切替がダウンミックスモードDからダウンミックスモードBへの切替であると判定する段階であって、前記現フレームの前記ダウンミックスモード切り替えのコスト値は、前記現フレームのチャネルの組み合わせ比率係数であり、前記第15のダウンミックスモード切り替え条件は、前記現フレームのチャネルの組み合わせ比率係数が、チャネルの組み合わせ比率係数の閾値S4より小さい又はこれに等しいことである、段階、又は、
    前記前フレームの前記ダウンミックスモードが前記ダウンミックスモードDであり、前記現フレームの前記チャネル信号タイプが逆相関した左側及び右側チャネル信号を示す前記チャネル信号タイプであり、かつ、前記現フレームの前記ダウンミックスモード切り替えのコスト値が第16のダウンミックスモード切り替え条件を満たす場合、前記現フレームのダウンミックスモードが前記ダウンミックスモードCであり、かつ、前記切替がダウンミックスモードDからダウンミックスモードCへの切替であると判定する段階であって、前記現フレームの前記ダウンミックスモード切り替えのコスト値は、前記現フレームのチャネルの組み合わせ比率係数であり、前記第16のダウンミックスモード切り替え条件は、前記現フレームのチャネルの組み合わせ比率係数が、チャネルの組み合わせ比率係数の閾値S4より大きい又はこれに等しいことである、段階
    を有する、請求項又はに記載の方法。
  6. Figure 0007088450000408
    であり、又は、
    Figure 0007088450000409
    であり、M2Aは、前記現フレームの前記ダウンミックスモードAに対応するダウンミックス行列を表し、ratioは、前記現フレームの相関した左側及び右側チャネル信号を示すチャネル信号タイプに対応するチャネルの組み合わせ比率係数を表し、
    Figure 0007088450000410
    であり、又は、
    Figure 0007088450000411
    であり、M2Bは、前記現フレームの前記ダウンミックスモードBに対応するダウンミックス行列を表し、
    α=ratio_SMであり、α=1-ratio_SMであり、ratio_SMは、前記現フレームの逆相関した左側及び右側チャネル信号を示すチャネル信号タイプに対応するチャネルの組み合わせ比率係数を表し、
    Figure 0007088450000412
    であり、又は、
    Figure 0007088450000413
    であり、M2Cは、前記現フレームの前記ダウンミックスモードCに対応するダウンミックス行列を表し、
    α=ratio_SMであり、α=1-ratio_SMであり、ratio_SMは、前記現フレームの逆相関した左側及び右側チャネル信号を示す前記チャネル信号タイプに対応するチャネルの組み合わせ比率係数を表し、
    Figure 0007088450000414
    であり、又は、
    Figure 0007088450000415
    であり、M2Dは、前記現フレームの前記ダウンミックスモードDに対応するダウンミックス行列を表し、
    α=ratioであり、α=1-ratioであり、ratioは、前記現フレームの相関した左側及び右側チャネル信号を示す前記チャネル信号タイプに対応するチャネルの組み合わせ比率係数を表し、
    前記ダウンミックス行列は、前記プライマリチャネル信号及び前記セカンダリチャネル信号を取得するために前記左側チャネル信号及び前記右側チャネル信号に適用される
    請求項からのいずれか一項に記載の方法。
  7. 互いに連結されるプロセッサとメモリとを備えるオーディオエンコーディング装置であって、前記メモリは、コンピュータプログラムを格納し、
    前記プロセッサは、前記メモリに格納された前記コンピュータプログラムを呼び出して、
    現フレームの左側チャネル信号と右側チャネル信号との間の位相のずれを示すチャネル信号タイプを判定する手順と、
    前フレームのダウンミックスモードから前記現フレームのダウンミックスモードへの切替を、前記前フレームの前記ダウンミックスモードと前記現フレームの前記チャネル信号タイプとに基づいて判定する手順であって、前記ダウンミックスモードは前記左側チャネル信号及び前記右側チャネル信号からプライマリチャネル信号及びセカンダリチャネル信号を取得するためのモードである、手順と、
    前記切替に基づいて、前記現フレームの左側チャネル信号及び右側チャネル信号に対して時間領域のダウンミックス処理を実行して、前記現フレームの前記プライマリチャネル信号及び前記セカンダリチャネル信号を取得する手順と、
    前記現フレームの前記取得したプライマリチャネル信号及びセカンダリチャネル信号をエンコードしてビットストリームを取得する手順と
    を実行
    前記前フレームの前記ダウンミックスモードは、複数のダウンミックスモードのうちの1つであり、前記複数のダウンミックスモードは、ダウンミックスモードA、ダウンミックスモードB、ダウンミックスモードC及びダウンミックスモードDを有し、前記ダウンミックスモードA及び前記ダウンミックスモードDは、相関した左側及び右側チャネル信号のためのダウンミックスモードであり、前記ダウンミックスモードB及び前記ダウンミックスモードCは、逆相関した左側及び右側チャネル信号のためのダウンミックスモードであり、前記前フレームの前記ダウンミックスモードA、前記前フレームの前記ダウンミックスモードB、前記前フレームの前記ダウンミックスモードC及び前記前フレームの前記ダウンミックスモードDは、異なるダウンミックス行列に対応し、
    前記前フレームの前記ダウンミックスモードと前記現フレームの前記チャネル信号タイプとに基づいて、前記切替を判定する前記手順は、前記前フレームの前記ダウンミックスモードと、前記現フレームのダウンミックスモード切り替えのコスト値と、前記現フレームの前記チャネル信号タイプとに基づいて、前記切替を判定する手順を有し、
    前記現フレームの前記ダウンミックスモード切り替えのコスト値は、前記現フレームのダウンミックスモード切り替えのコスト関数に基づいて計算された計算結果であり、前記ダウンミックスモード切り替えのコスト関数は、前記現フレームの少なくとも1つの時間領域ステレオパラメータ、前記前フレームの少なくとも1つの時間領域ステレオパラメータ及び前記現フレームの前記左側チャネル信号及び前記右側チャネル信号のうちの少なくとも1つのパラメータに基づいて構成され、
    前記ダウンミックスモード切り替えのコスト関数は、ダウンミックスモードAからダウンミックスモードBへの切り替えに対するコスト関数、ダウンミックスモードAからダウンミックスモードCへの切り替えに対するコスト関数、ダウンミックスモードDからダウンミックスモードBへの切り替えに対するコスト関数、ダウンミックスモードDからダウンミックスモードCへの切り替えに対するコスト関数、ダウンミックスモードBからダウンミックスモードAへの切り替えに対するコスト関数、ダウンミックスモードBからダウンミックスモードDへの切り替えに対するコスト関数、ダウンミックスモードCからダウンミックスモードAへの切り替えに対するコスト関数及びダウンミックスモードCからダウンミックスモードDへの切り替えに対するコスト関数のうちの1つの切り替えのコスト関数であり、
    ダウンミックスモードAからダウンミックスモードBへの切り替えに対する前記コスト関数は、
    Figure 0007088450000416
    であり、
    α 2_pre =1-α 1_pre
    α =1-α
    であり、Cost_ABは、ダウンミックスモードAからダウンミックスモードBへの切り替えに対する前記コスト関数の値を表し、start_sample_Aは、ダウンミックスモードAからダウンミックスモードBへの切り替えに対する前記コスト関数の計算開始サンプリングポイントを表し、end_sample_Aは、ダウンミックスモードAからダウンミックスモードBへの切り替えに対する前記コスト関数の計算終了サンプリングポイントを表し、start_sample_Aは、0より大きく、かつ、N-1より小さい整数であり、end_sample_Aは、0より大きく、かつ、N-1より小さい整数であり、start_sample_Aはend_sample_Aより小さく、
    nは、サンプリングポイントのシーケンス番号を表し、Nはフレームの長さを表し、
    (n)は、前記現フレームの前記左側チャネル信号を表し、X (n)は、前記現フレームの前記右側チャネル信号を表し、α =ratio_SMであり、ratio_SMは、前記現フレームの逆相関した左側及び右側チャネル信号を示すチャネル信号タイプに対応するチャネルの組み合わせ比率係数を表し、
    α 1_pre =tdm_last_ratioであり、tdm_last_ratioは、前記前フレームの相関した左側及び右側チャネル信号を示すチャネル信号タイプに対応するチャネルの組み合わせ比率係数を表し、
    ダウンミックスモードAからダウンミックスモードCへの切り替えに対する前記コスト関数は、
    Figure 0007088450000417
    であり、
    α 2_pre =1-α 1_pre
    α =1-α
    であり、Cost_ACは、ダウンミックスモードAからダウンミックスモードCへの切り替えに対する前記コスト関数の値を表し、start_sample_Aは、ダウンミックスモードAからダウンミックスモードCへの切り替えに対する前記コスト関数の計算開始サンプリングポイントを表し、end_sample_Aは、ダウンミックスモードAからダウンミックスモードCへの切り替えに対する前記コスト関数の計算終了サンプリングポイントを表し、start_sample_Aは、0より大きく、かつ、N-1より小さい整数であり、end_sample_Aは、0より大きく、かつ、N-1より小さい整数であり、start_sample_Aは、end_sample_Aより小さく、
    nは、サンプリングポイントのシーケンス番号を表し、Nはフレームの長さを表し、
    (n)は、前記現フレームの前記左側チャネル信号を表し、X (n)は、前記現フレームの前記右側チャネル信号を表し、
    α =ratio_SMであり、ratio_SMは、前記現フレームの逆相関した左側及び右側チャネル信号を示す前記チャネル信号タイプに対応するチャネルの組み合わせ比率係数を表し、
    α 1_pre =tdm_last_ratioであり、tdm_last_ratioは、前記前フレームの相関した左側及び右側チャネル信号を示す前記チャネル信号タイプに対応するチャネルの組み合わせ比率係数を表し、
    ダウンミックスモードBからダウンミックスモードAへの切り替えに対する前記コスト関数は、
    Figure 0007088450000418
    であり、
    α 2_pre =1-α 1_pre
    α =1-α
    であり、Cost_BAは、ダウンミックスモードBからダウンミックスモードAへの切り替えに対する前記コスト関数の値を表し、start_sample_Bは、ダウンミックスモードBからダウンミックスモードAへの切り替えに対する前記コスト関数の計算開始サンプリングポイントを表し、end_sample_Bは、ダウンミックスモードBからダウンミックスモードAへの切り替えに対する前記コスト関数の計算終了サンプリングポイントを表し、start_sample_Bは、0より大きく、かつ、N-1より小さい整数であり、end_sample_Bは、0より大きく、かつ、N-1より小さい整数であり、start_sample_Bは、end_sample_Bより小さく、
    nは、サンプリングポイントのシーケンス番号を表し、Nはフレームの長さを表し、
    (n)は、前記現フレームの前記左側チャネル信号を表し、X (n)は、前記現フレームの前記右側チャネル信号を表し、
    α =ratioであり、ratioは、前記現フレームの相関した左側及び右側チャネル信号を示すチャネル信号タイプに対応するチャネルの組み合わせ比率係数を表し、
    α 1_pre =tdm_last_ratio_SMであり、tdm_last_ratio_SMは、前記前フレームの逆相関した左側及び右側チャネル信号を示すチャネル信号タイプに対応するチャネルの組み合わせ比率係数を表し、
    ダウンミックスモードBからダウンミックスモードDへの切り替えに対する前記コスト関数は、
    Figure 0007088450000419
    であり、
    α 2_pre =1-α 1_pre
    α =1-α
    であり、Cost_BDは、ダウンミックスモードBからダウンミックスモードDへの切り替えに対する前記コスト関数の値を表し、start_sample_Bは、ダウンミックスモードBからダウンミックスモードDへの切り替えに対する前記コスト関数の計算開始サンプリングポイントを表し、end_sample_Bは、ダウンミックスモードBからダウンミックスモードDへの切り替えに対する前記コスト関数の計算終了サンプリングポイントを表し、start_sample_Bは、0より大きく、かつ、N-1より小さい整数であり、end_sample_Bは、0より大きく、かつ、N-1より小さい整数であり、start_sample_Bは、end_sample_Bより小さく、
    nは、サンプリングポイントのシーケンス番号を表し、Nはフレームの長さを表し、
    (n)は、前記現フレームの前記左側チャネル信号を表し、X (n)は、前記現フレームの前記右側チャネル信号を表し、
    α =ratioであり、ratioは、前記現フレームの相関した左側及び右側チャネル信号を示す前記チャネル信号タイプに対応するチャネルの組み合わせ比率係数を表し、
    α 1_pre =tdm_last_ratio_SMであり、tdm_last_ratio_SMは、前記前フレームの逆相関した左側及び右側チャネル信号を示す前記チャネル信号タイプに対応するチャネルの組み合わせ比率係数を表し
    ダウンミックスモードCからダウンミックスモードDへの切り替えに対する前記コスト関数は、
    Figure 0007088450000420
    であり、
    α 2_pre =1-α 1_pre
    α =1-α
    であり、Cost_CDは、ダウンミックスモードCからダウンミックスモードDへの切り替えに対する前記コスト関数の値を表し、start_sample_Bは、ダウンミックスモードCからダウンミックスモードDへの切り替えに対する前記コスト関数の計算開始サンプリングポイントを表し、end_sample_Cは、ダウンミックスモードBからダウンミックスモードDへの切り替えに対する前記コスト関数の計算終了サンプリングポイントを表し、start_sample_Cは、0より大きく、かつ、N-1より小さい整数であり、end_sample_Bは、0より大きく、かつ、N-1より小さい整数であり、start_sample_Cは、end_sample_Cより小さく、
    nは、サンプリングポイントのシーケンス番号を表し、Nはフレームの長さを表し、
    (n)は、前記現フレームの前記左側チャネル信号を表し、X (n)は、前記現フレームの前記右側チャネル信号を表し、
    α =ratioであり、ratioは、前記現フレームの相関した左側及び右側チャネル信号を示す前記チャネル信号タイプに対応するチャネルの組み合わせ比率係数を表し、
    α 1_pre =tdm_last_ratio_SMであり、tdm_last_ratio_SMは、前記前フレームの逆相関した左側及び右側チャネル信号を示す前記チャネル信号タイプに対応するチャネルの組み合わせ比率係数を表し、
    ダウンミックスモードCからダウンミックスモードAへの切り替えに対する前記コスト関数は、
    Figure 0007088450000421
    であり、
    α 2_pre =1-α 1_pre
    α =1-α
    であり、Cost_CAは、ダウンミックスモードCからダウンミックスモードAへの切り替えに対する前記コスト関数の値を表し、start_sample_Cは、ダウンミックスモードCからダウンミックスモードAへの切り替えに対する前記コスト関数の計算開始サンプリングポイントを表し、end_sample_Cは、ダウンミックスモードCからダウンミックスモードAへの切り替えに対する前記コスト関数の計算終了サンプリングポイントを表し、start_sample_Cは、0より大きく、かつ、N-1より小さい整数であり、end_sample_Cは、0より大きく、かつ、N-1より小さい整数であり、start_sample_Cは、end_sample_Cより小さく、
    nは、サンプリングポイントのシーケンス番号を表し、Nはフレームの長さを表し、
    (n)は、前記現フレームの前記左側チャネル信号を表し、X (n)は、前記現フレームの前記右側チャネル信号を表し、
    α =ratioであり、ratioは、前記現フレームの相関した左側及び右側チャネル信号を示す前記チャネル信号タイプに対応するチャネルの組み合わせ比率係数を表し、
    α 1_pre =tdm_last_ratio_SMであり、tdm_last_ratio_SMは、前記前フレームの逆相関した左側及び右側チャネル信号を示す前記チャネル信号タイプに対応するチャネルの組み合わせ比率係数を表し、
    ダウンミックスモードDからダウンミックスモードCへの切り替えに対する前記コスト関数は、
    Figure 0007088450000422
    であり、
    α 2_pre =1-α 1_pre
    α =1-α
    であり、Cost_DCは、ダウンミックスモードDからダウンミックスモードCへの切り替えに対する前記コスト関数の値を表し、start_sample_Dは、ダウンミックスモードDからダウンミックスモードCへの切り替えに対する前記コスト関数の計算開始サンプリングポイントを表し、end_sample_Dは、ダウンミックスモードDからダウンミックスモードCへの切り替えに対する前記コスト関数の計算終了サンプリングポイントを表し、start_sample_Dは、0より大きく、かつ、N-1より小さい整数であり、end_sample_Dは、0より大きく、かつ、N-1より小さい整数であり、start_sample_Dは、end_sample_Dより小さく、
    nは、サンプリングポイントのシーケンス番号を表し、Nはフレームの長さを表し、
    (n)は、前記現フレームの前記左側チャネル信号を表し、X (n)は、前記現フレームの前記右側チャネル信号を表し、
    α =ratio_SMであり、ratio_SMは、前記現フレームの逆相関した左側及び右側チャネル信号を示す前記チャネル信号タイプに対応するチャネルの組み合わせ比率係数を表し、
    α 1_pre =tdm_last_ratioであり、tdm_last_ratioは、前記前フレームの相関した左側及び右側チャネル信号を示す前記チャネル信号タイプに対応するチャネルの組み合わせ比率係数を表し、
    ダウンミックスモードDからダウンミックスモードBへの切り替えに対する前記コスト関数は、
    Figure 0007088450000423
    であり、
    α 2_pre =1-α 1_pre
    α =1-α
    であり、Cost_DBは、ダウンミックスモードDからダウンミックスモードBへの切り替えに対する前記コスト関数の値を表し、start_sample_Dは、ダウンミックスモードDからダウンミックスモードBへの切り替えに対する前記コスト関数の計算開始サンプリングポイントを表し、end_sample_Dは、ダウンミックスモードDからダウンミックスモードBへの切り替えに対する前記コスト関数の計算終了サンプリングポイントを表し、start_sample_Dは、0より大きく、かつ、N-1より小さい整数であり、end_sample_Dは、0より大きく、かつ、N-1より小さい整数であり、start_sample_Dは、end_sample_Dより小さく、
    nは、サンプリングポイントのシーケンス番号を表し、Nはフレームの長さを表し、
    (n)は、前記現フレームの前記左側チャネル信号を表し、X (n)は、前記現フレームの前記右側チャネル信号を表し、
    α =ratio_SMであり、ratio_SMは、前記現フレームの逆相関した左側及び右側チャネル信号を示す前記チャネル信号タイプに対応するチャネルの組み合わせ比率係数を表し、
    α 1_pre =tdm_last_ratioであり、tdm_last_ratioは、前記前フレームの相関した左側及び右側チャネル信号を示す前記チャネル信号タイプに対応するチャネルの組み合わせ比率係数を表す、
    装置。
  8. 前記現フレームの前記チャネル信号タイプは、複数のチャネル信号タイプのうちの1つであり、前記複数のチャネル信号タイプは、逆相関信号チャネルのチャネル信号タイプ及び相関信号チャネルのチャネル信号タイプを有し、前記相関信号チャネルのチャネル信号タイプは、ほぼ同じ位相の左側及び右側チャネル信号に対応するチャネル信号タイプであり、前記逆相関信号チャネルのチャネル信号タイプは、ほぼ位相のずれた左側及び右側チャネル信号に対応するチャネル信号タイプである、請求項に記載の装置。
  9. 前記前フレームの前記ダウンミックスモードと前記現フレームの前記チャネル信号タイプとに基づいて、前記切替を判定する前記手順は、
    前記前フレームの前記ダウンミックスモードが前記ダウンミックスモードAであり、かつ、前記現フレームの前記チャネル信号タイプが相関した左側及び右側チャネル信号を示すチャネル信号タイプである場合、前記現フレームのダウンミックスモードが前記ダウンミックスモードAであると判定し、前記切替がダウンミックスモードAからダウンミックスモードAへの切替であると判定する手順、
    前記前フレームの前記ダウンミックスモードが前記ダウンミックスモードBであり、かつ、前記現フレームの前記チャネル信号タイプが逆相関した左側及び右側チャネル信号を示すチャネル信号タイプである場合、前記現フレームのダウンミックスモードが前記ダウンミックスモードBであると判定し、前記切替がダウンミックスモードBからダウンミックスモードBへの切替であると判定する手順、
    前記前フレームの前記ダウンミックスモードが前記ダウンミックスモードCであり、かつ、前記現フレームの前記チャネル信号タイプが逆相関した左側及び右側チャネル信号を示す前記チャネル信号タイプである場合、前記現フレームのダウンミックスモードが前記ダウンミックスモードCであると判定し、前記切替がダウンミックスモードCからダウンミックスモードCへの切替であると判定する手順、又は、
    前記前フレームの前記ダウンミックスモードが前記ダウンミックスモードDであり、かつ、前記現フレームの前記チャネル信号タイプが相関した左側及び右側チャネル信号を示すチャネル信号タイプである場合、前記現フレームのダウンミックスモードが前記ダウンミックスモードDであると判定し、前記切替がダウンミックスモードDからダウンミックスモードDへの切替であると判定する手順
    を有する、請求項7又は8に記載の装置。
  10. 前記前フレームの前記ダウンミックスモードと、前記現フレームのダウンミックスモード切り替えのコスト値と、前記現フレームの前記チャネル信号タイプとに基づいて、前記切替を判定する前記手順は、
    前記前フレームの前記ダウンミックスモードが前記ダウンミックスモードAであり、前記現フレームの前記チャネル信号タイプが逆相関した左側及び右側チャネル信号を示すチャネル信号タイプであり、かつ、前記現フレームの前記ダウンミックスモード切り替えのコスト値が第1のダウンミックスモード切り替え条件を満たす場合、前記現フレームのダウンミックスモードが前記ダウンミックスモードCであり、かつ、前記切替がダウンミックスモードAからダウンミックスモードCへの切替であると判定する手順であって、前記ダウンミックスモード切り替えのコスト値は、ダウンミックスモード切り替えのコスト関数の値であり、前記第1のダウンミックスモード切り替え条件は、前記現フレームのダウンミックスモードAからダウンミックスモードBへの切り替えに対する前記コスト関数の値が、ダウンミックスモードAからダウンミックスモードCへの切り替えに対する前記コスト関数の値より大きい又はこれに等しいことである、手順、
    前記前フレームの前記ダウンミックスモードが前記ダウンミックスモードAであり、前記現フレームの前記チャネル信号タイプが逆相関した左側及び右側チャネル信号を示すチャネル信号タイプであり、かつ、前記現フレームの前記ダウンミックスモード切り替えのコスト値が第2のダウンミックスモード切り替え条件を満たす場合、前記現フレームのダウンミックスモードが前記ダウンミックスモードBであり、かつ、前記切替がダウンミックスモードAからダウンミックスモードBへの切替であると判定する手順であって、前記ダウンミックスモード切り替えのコスト値は、前記ダウンミックスモード切り替えのコスト関数の前記値であり、前記第2のダウンミックスモード切り替え条件は、前記現フレームのダウンミックスモードAからダウンミックスモードBへの切り替えに対する前記コスト関数の値が、ダウンミックスモードAからダウンミックスモードCへの切り替えに対する前記コスト関数の値より小さい又はこれに等しいことである、手順、
    前記前フレームの前記ダウンミックスモードが前記ダウンミックスモードBであり、前記現フレームの前記チャネル信号タイプが相関した左側及び右側チャネル信号を示すチャネル信号タイプであり、かつ、前記現フレームの前記ダウンミックスモード切り替えのコスト値が第3のダウンミックスモード切り替え条件を満たす場合、前記現フレームのダウンミックスモードが前記ダウンミックスモードAであり、かつ、前記切替がダウンミックスモードBからダウンミックスモードAへの切替であると判定する手順であって、前記ダウンミックスモード切り替えのコスト値は、前記ダウンミックスモード切り替えのコスト関数の前記値であり、前記第3のダウンミックスモード切り替え条件は、前記現フレームのダウンミックスモードBからダウンミックスモードAへの切り替えに対する前記コスト関数の値が、ダウンミックスモードBからダウンミックスモードDへの切り替えに対する前記コスト関数の値より小さい又はこれに等しいことである、手順と、
    前記前フレームの前記ダウンミックスモードが前記ダウンミックスモードBであり、前記現フレームの前記チャネル信号タイプが相関した左側及び右側チャネル信号を示すチャネル信号タイプであり、かつ、前記現フレームの前記ダウンミックスモード切り替えのコスト値が第4のダウンミックスモード切り替え条件を満たす場合、前記現フレームのダウンミックスモードが前記ダウンミックスモードDであり、かつ、前記切替がダウンミックスモードBからダウンミックスモードDへの切替であると判定する手順であって、前記ダウンミックスモード切り替えのコスト値は、前記ダウンミックスモード切り替えのコスト関数の前記値であり、前記第4のダウンミックスモード切り替え条件は、前記現フレームのダウンミックスモードBからダウンミックスモードAへの切り替えに対する前記コスト関数の値が、ダウンミックスモードBからダウンミックスモードDへの切り替えに対する前記コスト関数の値より大きい又はこれに等しいことである、手順、
    前記前フレームの前記ダウンミックスモードが前記ダウンミックスモードCであり、前記現フレームの前記チャネル信号タイプが相関した左側及び右側チャネル信号を示すチャネル信号タイプであり、かつ、前記現フレームの前記ダウンミックスモード切り替えのコスト値が第5のダウンミックスモード切り替え条件を満たす場合、前記現フレームのダウンミックスモードが前記ダウンミックスモードDであり、かつ、前記切替がダウンミックスモードCからダウンミックスモードDへの切替であると判定する手順であって、前記ダウンミックスモード切り替えのコスト値は、前記ダウンミックスモード切り替えのコスト関数の前記値であり、前記第5のダウンミックスモード切り替え条件は、前記現フレームのダウンミックスモードCからダウンミックスモードAへの切り替えに対する前記コスト関数の値が、ダウンミックスモードCからダウンミックスモードDへの切り替えに対する前記コスト関数の値より大きい又はこれに等しいことである、手順、
    前記前フレームの前記ダウンミックスモードが前記ダウンミックスモードCであり、前記現フレームの前記チャネル信号タイプが相関した左側及び右側チャネル信号を示すチャネル信号タイプであり、かつ、前記現フレームの前記ダウンミックスモード切り替えのコスト値が第6のダウンミックスモード切り替え条件を満たす場合、前記現フレームのダウンミックスモードが前記ダウンミックスモードAであり、かつ、前記切替がダウンミックスモードCからダウンミックスモードAへの切替であると判定する手順であって、前記ダウンミックスモード切り替えのコスト値は、前記ダウンミックスモード切り替えのコスト関数の前記値であり、前記第6のダウンミックスモード切り替え条件は、前記現フレームのダウンミックスモードCからダウンミックスモードAへの切り替えに対する前記コスト関数の値が、ダウンミックスモードCからダウンミックスモードDへの切り替えに対する前記コスト関数の値より小さい又はこれに等しいことである、手順、
    前記前フレームの前記ダウンミックスモードが前記ダウンミックスモードDであり、前記現フレームの前記チャネル信号タイプが逆相関した左側及び右側チャネル信号を示すチャネル信号タイプであり、かつ、前記現フレームの前記ダウンミックスモード切り替えのコスト値が第7のダウンミックスモード切り替え条件を満たす場合、前記現フレームのダウンミックスモードが前記ダウンミックスモードBであり、かつ、前記切替がダウンミックスモードDからダウンミックスモードBへの切替であると判定する手順であって、前記ダウンミックスモード切り替えのコスト値は、前記ダウンミックスモード切り替えのコスト関数の前記値であり、前記第7のダウンミックスモード切り替え条件は、前記現フレームのダウンミックスモードDからダウンミックスモードBへの切り替えに対する前記コスト関数の値が、ダウンミックスモードDからダウンミックスモードCへの切り替えに対する前記コスト関数の値より小さい又はこれに等しいことである、手順、又は、
    前記前フレームの前記ダウンミックスモードが前記ダウンミックスモードDであり、前記現フレームの前記チャネル信号タイプが逆相関した左側及び右側チャネル信号を示すチャネル信号タイプであり、かつ、前記現フレームの前記ダウンミックスモード切り替えのコスト値が第8のダウンミックスモード切り替え条件を満たす場合、前記現フレームのダウンミックスモードが前記ダウンミックスモードCであり、かつ、前記切替がダウンミックスモードDからダウンミックスモードCへの切替であると判定する手順であって、前記ダウンミックスモード切り替えのコスト値は、前記ダウンミックスモード切り替えのコスト関数の前記値であり、前記第8のダウンミックスモード切り替え条件は、前記現フレームのダウンミックスモードDからダウンミックスモードBへの切り替えに対する前記コスト関数の値が、ダウンミックスモードDからダウンミックスモードCへの切り替えに対する前記コスト関数の値より大きい又はこれに等しいことである、手順
    を有する、請求項7又は8に記載の装置。
  11. 前記前フレームの前記ダウンミックスモードと、前記現フレームのダウンミックスモード切り替えのコスト値と、前記現フレームの前記チャネル信号タイプとに基づいて、前記切替を判定する前記手順は、
    前記前フレームの前記ダウンミックスモードが前記ダウンミックスモードAであり、前記現フレームの前記チャネル信号タイプが逆相関した左側及び右側チャネル信号を示すチャネル信号タイプであり、かつ、前記現フレームの前記ダウンミックスモード切り替えのコスト値が第9のダウンミックスモード切り替え条件を満たす場合、前記現フレームのダウンミックスモードが前記ダウンミックスモードCであり、かつ、前記切替がダウンミックスモードAからダウンミックスモードCへの切替であると判定する手順であって、前記現フレームの前記ダウンミックスモード切り替えのコスト値は、前記現フレームのチャネルの組み合わせ比率係数であり前記第9のダウンミックスモード切り替え条件は、前記現フレームのチャネルの組み合わせ比率係数が、チャネルの組み合わせ比率係数の閾値S1より小さい又はこれに等しいことである、手順、
    前記前フレームの前記ダウンミックスモードが前記ダウンミックスモードAであり、前記現フレームの前記チャネル信号タイプが逆相関した左側及び右側チャネル信号を示すチャネル信号タイプであり、かつ、前記現フレームの前記ダウンミックスモード切り替えのコスト値が第10のダウンミックスモード切り替え条件を満たす場合、前記現フレームのダウンミックスモードが前記ダウンミックスモードBであり、かつ、前記切替がダウンミックスモードAからダウンミックスモードBへの切替であると判定する手順であって、前記現フレームの前記ダウンミックスモード切り替えのコスト値は、前記現フレームのチャネルの組み合わせ比率係数であり、前記第10のダウンミックスモード切り替え条件は、前記現フレームのチャネルの組み合わせ比率係数が、チャネルの組み合わせ比率係数の閾値S1より大きい又はこれに等しいことである、手順、
    前記前フレームの前記ダウンミックスモードが前記ダウンミックスモードBであり、前記現フレームの前記チャネル信号タイプが相関した左側及び右側チャネル信号を示すチャネル信号タイプであり、かつ、前記現フレームの前記ダウンミックスモード切り替えのコスト値が第11のダウンミックスモード切り替え条件を満たす場合、前記現フレームのダウンミックスモードが前記ダウンミックスモードAであり、かつ、前記切替がダウンミックスモードBからダウンミックスモードAへの切替であると判定する手順であって、前記現フレームの前記ダウンミックスモード切り替えのコスト値は、前記現フレームのチャネルの組み合わせ比率係数であり、前記第11のダウンミックスモード切り替え条件は、前記現フレームのチャネルの組み合わせ比率係数が、チャネルの組み合わせ比率係数の閾値S2より大きい又はこれに等しいことである、手順、
    前記前フレームの前記ダウンミックスモードが前記ダウンミックスモードBであり、前記現フレームの前記チャネル信号タイプが相関した左側及び右側チャネル信号を示すチャネル信号タイプであり、かつ、前記現フレームの前記ダウンミックスモード切り替えのコスト値が第12のダウンミックスモード切り替え条件を満たす場合、前記現フレームのダウンミックスモードが前記ダウンミックスモードDであり、かつ、前記切替がダウンミックスモードBからダウンミックスモードDへの切替であると判定する手順であって、前記現フレームの前記ダウンミックスモード切り替えのコスト値は、前記現フレームのチャネルの組み合わせ比率係数であり、前記第12のダウンミックスモード切り替え条件は、前記現フレームのチャネルの組み合わせ比率係数が、チャネルの組み合わせ比率係数の閾値S2より小さい又はこれに等しいことである、手順、
    前記前フレームの前記ダウンミックスモードが前記ダウンミックスモードCであり、前記現フレームの前記チャネル信号タイプが相関した左側及び右側チャネル信号を示すチャネル信号タイプであり、かつ、前記現フレームの前記ダウンミックスモード切り替えのコスト値が第13のダウンミックスモード切り替え条件を満たす場合、前記現フレームのダウンミックスモードが前記ダウンミックスモードDであり、かつ、前記切替がダウンミックスモードCからダウンミックスモードDへの切替であると判定する手順であって、前記現フレームの前記ダウンミックスモード切り替えのコスト値は、前記現フレームのチャネルの組み合わせ比率係数であり、前記第13のダウンミックスモード切り替え条件は、前記現フレームのチャネルの組み合わせ比率係数が、チャネルの組み合わせ比率係数の閾値S3より大きい又はこれに等しいことである、手順、
    前記前フレームの前記ダウンミックスモードが前記ダウンミックスモードCであり、前記現フレームの前記チャネル信号タイプが相関した左側及び右側チャネル信号を示すチャネル信号タイプであり、かつ、前記現フレームの前記ダウンミックスモード切り替えのコスト値が第14のダウンミックスモード切り替え条件を満たす場合、前記現フレームのダウンミックスモードが前記ダウンミックスモードAであり、かつ、前記切替がダウンミックスモードCからダウンミックスモードAへの切替であると判定する手順であって、前記現フレームの前記ダウンミックスモード切り替えのコスト値は、前記現フレームのチャネルの組み合わせ比率係数であり、前記第14のダウンミックスモード切り替え条件は、前記現フレームのチャネルの組み合わせ比率係数が、チャネルの組み合わせ比率係数の閾値S3より小さい又はこれに等しいことである、手順、
    前記前フレームの前記ダウンミックスモードが前記ダウンミックスモードDであり、前記現フレームの前記チャネル信号タイプが逆相関した左側及び右側チャネル信号を示すチャネル信号タイプであり、かつ、前記現フレームの前記ダウンミックスモード切り替えのコスト値が第15のダウンミックスモード切り替え条件を満たす場合、前記現フレームのダウンミックスモードが前記ダウンミックスモードBであり、かつ、前記切替がダウンミックスモードDからダウンミックスモードBへの切替であると判定する手順であって、前記現フレームの前記ダウンミックスモード切り替えのコスト値は、前記現フレームのチャネルの組み合わせ比率係数であり、前記第15のダウンミックスモード切り替え条件は、前記現フレームのチャネルの組み合わせ比率係数が、チャネルの組み合わせ比率係数の閾値S4より小さい又はこれに等しいことである、手順、又は、
    前記前フレームの前記ダウンミックスモードが前記ダウンミックスモードDであり、前記現フレームの前記チャネル信号タイプが逆相関した左側及び右側チャネル信号を示すチャネル信号タイプであり、かつ、前記現フレームの前記ダウンミックスモード切り替えのコスト値が第16のダウンミックスモード切り替え条件を満たす場合、前記現フレームのダウンミックスモードが前記ダウンミックスモードCであり、かつ、前記切替がダウンミックスモードDからダウンミックスモードCへの切替であると判定する手順であって、前記現フレームの前記ダウンミックスモード切り替えのコスト値は、前記現フレームのチャネルの組み合わせ比率係数であり、前記第16のダウンミックスモード切り替え条件は、前記現フレームのチャネルの組み合わせ比率係数が、チャネルの組み合わせ比率係数の閾値S4より大きい又はこれに等しいことである、手順
    を有する、請求項又はに記載の装置。
  12. Figure 0007088450000424
    であり、又は、
    Figure 0007088450000425
    であり、
    2Aは、前記現フレームの前記ダウンミックスモードAに対応するダウンミックス行列を表し、ratioは、前記現フレームの相関した左側及び右側チャネル信号を示すチャネル信号タイプに対応するチャネルの組み合わせ比率係数を表し、
    Figure 0007088450000426
    であり、又は、
    Figure 0007088450000427
    であり、M2Bは、前記現フレームの前記ダウンミックスモードBに対応するダウンミックス行列を表し、
    α=ratio_SMであり、α=1-ratio_SMであり、ratio_SMは、前記現フレームの逆相関した左側及び右側チャネル信号を示すチャネル信号タイプに対応するチャネルの組み合わせ比率係数を表し、
    Figure 0007088450000428
    であり、又は、
    Figure 0007088450000429
    であり、M2Cは、前記現フレームの前記ダウンミックスモードCに対応するダウンミックス行列を表し、
    α=ratio_SMであり、α=1-ratio_SMであり、ratio_SMは、前記現フレームの逆相関した左側及び右側チャネル信号を示す前記チャネル信号タイプに対応するチャネルの組み合わせ比率係数を表し、
    Figure 0007088450000430
    であり、又は、
    Figure 0007088450000431
    であり、M2Dは、前記現フレームの前記ダウンミックスモードDに対応するダウンミックス行列を表し、
    α=ratioであり、α=1-ratioであり、ratioは、前記現フレームの相関した左側及び右側チャネル信号を示す前記チャネル信号タイプに対応するチャネルの組み合わせ比率係数を表し、
    前記ダウンミックス行列は、前記プライマリチャネル信号及び前記セカンダリチャネル信号を取得するために前記左側チャネル信号及び前記右側チャネル信号に適用される
    請求項から11のいずれか一項に記載の装置。
  13. 記録されたプログラムを有するコンピュータ可読記憶媒体であって、前記プログラムは、コンピュータに、請求項1からのいずれか一項に記載の方法を実行させる、コンピュータ可読記憶媒体。
  14. コンピュータに、請求項1からのいずれか一項に記載の方法を実行させるように構成されるコンピュータプログラム。
JP2020529337A 2017-11-30 2018-11-29 オーディオエンコーディング及びデコーディング方法並びに関連する製品 Active JP7088450B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201711244330.5A CN109859766B (zh) 2017-11-30 2017-11-30 音频编解码方法和相关产品
CN201711244330.5 2017-11-30
PCT/CN2018/118301 WO2019105436A1 (zh) 2017-11-30 2018-11-29 音频编解码方法和相关产品

Publications (2)

Publication Number Publication Date
JP2021504759A JP2021504759A (ja) 2021-02-15
JP7088450B2 true JP7088450B2 (ja) 2022-06-21

Family

ID=66663812

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020529337A Active JP7088450B2 (ja) 2017-11-30 2018-11-29 オーディオエンコーディング及びデコーディング方法並びに関連する製品

Country Status (8)

Country Link
US (1) US11393482B2 (ja)
EP (1) EP3703050B1 (ja)
JP (1) JP7088450B2 (ja)
KR (1) KR102437451B1 (ja)
CN (1) CN109859766B (ja)
BR (1) BR112020010850A2 (ja)
TW (1) TWI705432B (ja)
WO (1) WO2019105436A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7207578B2 (ja) * 2019-07-10 2023-01-18 日本電気株式会社 話者埋め込み装置、方法、およびプログラム
CN112751792B (zh) * 2019-10-31 2022-06-10 华为技术有限公司 一种信道估计方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100079185A1 (en) 2008-09-25 2010-04-01 Lg Electronics Inc. method and an apparatus for processing a signal
US20120221343A1 (en) 2009-03-18 2012-08-30 Samsung Electronics Co., Ltd. Apparatus and method for encoding/decoding a multichannel signal
WO2017049396A1 (en) 2015-09-25 2017-03-30 Voiceage Corporation Method and system for time domain down mixing a stereo sound signal into primary and secondary channels using detecting an out-of-phase condition of the left and right channels
US20170270934A1 (en) 2016-03-18 2017-09-21 Qualcomm Incorporated Audio processing for temporally mismatched signals

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE0402652D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
US8032240B2 (en) 2005-07-11 2011-10-04 Lg Electronics Inc. Apparatus and method of processing an audio signal
JP4806031B2 (ja) * 2006-01-19 2011-11-02 エルジー エレクトロニクス インコーポレイティド メディア信号の処理方法及び装置
TWI342718B (en) * 2006-03-24 2011-05-21 Coding Tech Ab Decoder and method for deriving headphone down mix signal, receiver, binaural decoder, audio player, receiving method, audio playing method, and computer program
US8355921B2 (en) 2008-06-13 2013-01-15 Nokia Corporation Method, apparatus and computer program product for providing improved audio processing
CN101630509B (zh) * 2008-07-14 2012-04-18 华为技术有限公司 一种编解码方法、装置及系统
US9536529B2 (en) * 2010-01-06 2017-01-03 Lg Electronics Inc. Apparatus for processing an audio signal and method thereof
ES2555136T3 (es) * 2012-02-17 2015-12-29 Huawei Technologies Co., Ltd. Codificador paramétrico para codificar una señal de audio multicanal
CN104240712B (zh) * 2014-09-30 2018-02-02 武汉大学深圳研究院 一种三维音频多声道分组聚类编码方法及系统
CN109389987B (zh) * 2017-08-10 2022-05-10 华为技术有限公司 音频编解码模式确定方法和相关产品

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100079185A1 (en) 2008-09-25 2010-04-01 Lg Electronics Inc. method and an apparatus for processing a signal
US20120221343A1 (en) 2009-03-18 2012-08-30 Samsung Electronics Co., Ltd. Apparatus and method for encoding/decoding a multichannel signal
WO2017049396A1 (en) 2015-09-25 2017-03-30 Voiceage Corporation Method and system for time domain down mixing a stereo sound signal into primary and secondary channels using detecting an out-of-phase condition of the left and right channels
US20170270934A1 (en) 2016-03-18 2017-09-21 Qualcomm Incorporated Audio processing for temporally mismatched signals

Also Published As

Publication number Publication date
KR102437451B1 (ko) 2022-08-30
EP3703050A1 (en) 2020-09-02
CN109859766A (zh) 2019-06-07
TWI705432B (zh) 2020-09-21
EP3703050B1 (en) 2024-01-03
BR112020010850A2 (pt) 2020-11-10
JP2021504759A (ja) 2021-02-15
TW201926318A (zh) 2019-07-01
US20200294513A1 (en) 2020-09-17
US11393482B2 (en) 2022-07-19
CN109859766B (zh) 2021-08-20
EP3703050A4 (en) 2020-12-30
WO2019105436A1 (zh) 2019-06-06
KR20200090856A (ko) 2020-07-29

Similar Documents

Publication Publication Date Title
JP6974927B2 (ja) 時間領域ステレオエンコーディング及びデコーディング方法並びに関連製品
KR102387159B1 (ko) 오디오 코딩/디코딩 모드를 결정하는 방법 및 관련 제품
JP7088450B2 (ja) オーディオエンコーディング及びデコーディング方法並びに関連する製品
KR102637514B1 (ko) 시간-도메인 스테레오 인코딩 및 디코딩 방법 및 관련 제품
JP2023129450A (ja) 時間領域ステレオパラメータ符号化方法および関連製品

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200706

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200706

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210601

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210830

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220201

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220418

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220510

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220525

R150 Certificate of patent or registration of utility model

Ref document number: 7088450

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150