JP7311573B2

JP7311573B2 - 時間領域ステレオエンコーディング及びデコーディング方法並びに関連製品

Info

Publication number: JP7311573B2
Application number: JP2021180319A
Authority: JP
Inventors: 海▲ティン▼ 李; ▲賓▼ 王; 磊苗
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2017-08-10
Filing date: 2021-11-04
Publication date: 2023-07-19
Anticipated expiration: 2038-08-10
Also published as: US11640825B2; KR20220043246A; JP2022010020A; RU2020109715A; JP6974927B2; US20220139404A1; JP2023139041A; US11062715B2; TW201911888A; KR102493482B1; BR112020002682A2; KR20200035138A; EP3664087A1; EP4358083A2; US20200176000A1; KR20230018550A; SG11202001169WA; EP4358083A3; CN114005455A; KR102641952B1

Description

本出願は、オーディオエンコーディング及びデコーディング技術の分野に関し、詳細には、時間領域ステレオエンコーディング及びデコーディング方法並びに関連製品に関する。

生活の質が、向上したので、人々は、高品質オーディオに対するますます高い要求を有している。モノラルオーディオと比較して、ステレオオーディオは、様々な音源についての方向感及び分布感を有し、情報の明瞭性、了解度、及び存在感を改善することができ、したがって、人々に人気がある。

パラメトリックステレオエンコーディング及びデコーディング技術においては、ステレオ信号は、モノラル信号と空間認知パラメータとに変換され、マルチチャンネル信号は、圧縮される。これは、一般的なステレオエンコーディング及びデコーディング技術である。しかしながら、パラメトリックステレオエンコーディング及びデコーディング技術においては、空間認知パラメータは、通常、周波数領域において抽出される必要があり、時間領域変換が、実行される必要があるので、コーデック全体の遅延は、相対的に大きい。したがって、遅延について、相対的に厳しい要件が、存在するとき、時間領域ステレオエンコーディング技術が、より良い選択である。

従来の時間領域ステレオエンコーディング技術においては、信号は、時間領域において２つのモノラル信号を取得するために、ダウンミックスされる。例えば、ＭＳエンコーディング技術においては、ミッドチャンネル（Ｍｉｄｃｈａｎｎｅｌ）信号と、サイドチャンネル（Ｓｉｄｅｃｈａｎｎｅｌ）信号とを取得するために、左及び右チャンネル信号が、最初にダウンミックスされる。例えば、Ｌは、左チャンネル信号を示し、Ｒは、右チャンネル信号を示す。このケースにおいては、ミッドチャンネル信号は、０．５×（Ｌ＋Ｒ）であり、ミッドチャンネル信号は、左チャンネルと右チャンネルとの間の相関についての情報を示し、サイドチャンネル信号は、０．５×（Ｌ－Ｒ）であり、サイドチャンネル信号は、左チャンネルと右チャンネルとの間の差についての情報を示す。その後、ミッドチャンネル信号とサイドチャンネル信号は、モノラルエンコーディング方法を使用することによって、別々にエンコードされ、ミッドチャンネル信号は、通常、より多量のビットを使用することによってエンコードされ、サイドチャンネル信号は、通常、より少量のビットを使用することによってエンコードされる。

従来の時間領域ステレオエンコーディング技術が使用されるとき、ときどき、プライマリ信号のエネルギーは、きわめて小さく、又はエネルギーは、見当たりさえせず、最終的なエンコーディング品質の低下をもたらすことが研究及び実践を通して見出された。

本出願の実施形態は、時間領域ステレオエンコーディング方法及び関連製品を提供する。

第１の態様に従うと、本出願の実施形態は、時間領域ステレオエンコーディング方法を提供し、方法は、現在のフレームの符号化モードを決定するステップと、現在のフレームの符号化モードが反相関信号符号化モードであると決定されたとき、現在のフレームにおけるプライマリチャンネル信号（ｐｒｉｍａｒｙｃｈａｎｎｅｌｓｉｇｎａｌ）及びセカンダリチャンネル信号（ｓｅｃｏｎｄａｒｙｃｈａｎｎｅｌｓｉｇｎａｌ）を取得するために、反相関信号符号化モードに対応する時間領域ダウンミックス処理方式を使用することによって、現在のフレームにおける左及び右チャンネル信号に対して時間領域ダウンミックス処理を実行するステップであって、反相関信号符号化モードに対応する時間領域ダウンミックス処理方式は、反相関信号チャンネル組み合わせスキームに対応する時間領域ダウンミックス処理方式であり、反相関信号チャンネル組み合わせスキームは、逆位相に近い信号に対応するチャンネル組み合わせスキームである、ステップと、現在のフレームにおける取得されたプライマリ及びセカンダリチャンネル信号をエンコードするステップとを含み得る。

現在のフレームにおけるステレオ信号は、例えば、現在のフレームにおける左及び右チャンネル信号を含む。

現在のフレームの符号化モードは、複数の符号化モードのうちの１つであり得る。例えば、現在のフレームの符号化モードは、以下の符号化モード、即ち、相関信号符号化モード、反相関信号符号化モード、相関から反相関信号符号化への切り換えモード、及び反相関から相関信号符号化への切り換えモードのうちの１つであり得る。

上述のソリューションにおいては、現在のフレームの符号化モードは、決定される必要があり、これは、現在のフレームの符号化モードについて複数の可能性があることを示していることが理解され得る。ただ１つの符号化モードしかない従来のソリューションと比較して、複数の可能な符号化モードを有するこのソリューションは、複数の可能なシナリオとより相性が良く、調和することができる。加えて、逆位相に近い信号に対応するチャンネル組み合わせスキームが、導入されるので、現在のフレームにおけるステレオ信号が、逆位相に近い信号であるとき、より目標に合ったチャンネル組み合わせスキーム及び符号化モードが、存在し、これは、エンコーディング品質を改善する助けになる。

いくつかの可能な実装においては、方法は、現在のフレームの符号化モードが相関信号符号化モードであると決定されたとき、現在のフレームにおけるプライマリ及びセカンダリチャンネル信号を取得するために、相関信号符号化モードに対応する時間領域ダウンミックス処理方式を使用することによって、現在のフレームにおける左及び右チャンネル信号に対して時間領域ダウンミックス処理を実行するステップをさらに含み得る。相関信号符号化モードに対応する時間領域ダウンミックス処理方式は、相関信号チャンネル組み合わせスキームに対応する時間領域ダウンミックス処理方式であり、相関信号チャンネル組み合わせスキームは、同位相に近い信号に対応するチャンネル組み合わせスキームである。

いくつかの可能な実装においては、方法は、現在のフレームの符号化モードが相関から反相関信号符号化への切り換えモードであると決定されたとき、現在のフレームにおけるプライマリ及びセカンダリチャンネル信号を取得するために、相関から反相関信号符号化への切り換えモードに対応する時間領域ダウンミックス処理方式を使用することによって、現在のフレームにおける左及び右チャンネル信号に対して時間領域ダウンミックス処理を実行するステップをさらに含み得る。相関から反相関信号符号化への切り換えモードに対応する時間領域ダウンミックス処理方式は、相関信号チャンネル組み合わせスキームから反相関信号チャンネル組み合わせスキームへの移行に対応する時間領域ダウンミックス処理方式である。

いくつかの可能な実装においては、方法は、現在のフレームの符号化モードが反相関から相関信号符号化への切り換えモードであると決定されたとき、現在のフレームにおけるプライマリ及びセカンダリチャンネル信号を取得するために、反相関から相関信号符号化への切り換えモードに対応する時間領域ダウンミックス処理方式を使用することによって、現在のフレームにおける左及び右チャンネル信号に対して時間領域ダウンミックス処理を実行するステップをさらに含み得る。反相関から相関信号符号化への切り換えモードに対応する時間領域ダウンミックス処理方式は、反相関信号チャンネル組み合わせスキームから相関信号チャンネル組み合わせスキームへの移行に対応する時間領域ダウンミックス処理方式である。

異なる符号化モードに対応する時間領域ダウンミックス処理方式は、通常、異なることが理解されることができる。加えて、各符号化モードは、１つ又は複数の時間領域ダウンミックス処理方式に対応し得る。

例えば、いくつかの可能な実装においては、現在のフレームにおけるプライマリ及びセカンダリチャンネル信号を取得するために、反相関信号符号化モードに対応する時間領域ダウンミックス処理方式を使用することによって、現在のフレームにおける左及び右チャンネル信号に対して時間領域ダウンミックス処理を実行するステップは、現在のフレームにおけるプライマリ及びセカンダリチャンネル信号を取得するために、現在のフレームのための反相関信号チャンネル組み合わせスキームのチャンネル組み合わせ比係数に基づいて、現在のフレームにおける左及び右チャンネル信号に対して時間領域ダウンミックス処理を実行するステップ、又は現在のフレームにおけるプライマリ及びセカンダリチャンネル信号を取得するために、現在のフレームのための反相関信号チャンネル組み合わせスキームのチャンネル組み合わせ比係数、及び以前のフレームのための反相関信号チャンネル組み合わせスキームのチャンネル組み合わせ比係数に基づいて、現在のフレームにおける左及び右チャンネル信号に対して時間領域ダウンミックス処理を実行するステップを含み得る。

オーディオフレーム（例えば、現在のフレーム又は以前のフレーム）のためのチャンネル組み合わせスキーム（例えば、反相関信号チャンネル組み合わせスキーム又は相関信号チャンネル組み合わせスキーム）のチャンネル組み合わせ比係数は、事前設定された固定値であり得ることが理解されることができる。もちろん、オーディオフレームのチャンネル組み合わせ比係数は、オーディオフレームのためのチャンネル組み合わせスキームに基づいて決定されてもまたよい。

いくつかの可能な実装においては、オーディオフレームのチャンネル組み合わせ比係数に基づいて、対応するダウンミックス行列が、構築され得るし、現在のフレームにおけるプライマリ及びセカンダリチャンネル信号を取得するために、チャンネル組み合わせスキームに対応するダウンミックス行列を使用することによって、現在のフレームにおける左及び右チャンネル信号に対して、時間領域ダウンミックス処理が実行される。

例えば、現在のフレームにおけるプライマリ及びセカンダリチャンネル信号を取得するために、現在のフレームのための反相関信号チャンネル組み合わせスキームのチャンネル組み合わせ比係数に基づいて、現在のフレームにおける左及び右チャンネル信号に対して、時間領域ダウンミックス処理が実行されるとき、

である。

別の例について、現在のフレームにおけるプライマリ及びセカンダリチャンネル信号を取得するために、現在のフレームのための反相関信号チャンネル組み合わせスキームのチャンネル組み合わせ比係数、及び以前のフレームのための反相関信号チャンネル組み合わせスキームのチャンネル組み合わせ比係数に基づいて、現在のフレームにおける左及び右チャンネル信号に対して、時間領域ダウンミックス処理が実行されるとき、
０≦ｎ＜Ｎ－ｄｅｌａｙ＿ｃｏｍである場合、

であり、又は
Ｎ－ｄｅｌａｙ＿ｃｏｍ≦ｎ＜Ｎである場合、

であり、ここで、
ｄｅｌａｙ＿ｃｏｍは、エンコーディング遅延補償を示す。

であり、
Ｎ－ｄｅｌａｙ＿ｃｏｍ≦ｎ＜Ｎ－ｄｅｌａｙ＿ｃｏｍ＋ＮＯＶＡ＿１である場合、

であり、又は
Ｎ－ｄｅｌａｙ＿ｃｏｍ＋ＮＯＶＡ＿１≦ｎ＜Ｎである場合、

である。

本明細書において、ｆａｄｅ＿ｉｎ（ｎ）は、フェードイン係数を示し、例えば、

である。もちろん、ｆａｄｅ＿ｉｎ（ｎ）は、或いは、ｎに基づいた別の関数関係のフェードイン係数であってよい。

ｆａｄｅ＿ｏｕｔ（ｎ）は、フェードアウト係数を示し、例えば、

である。もちろん、ｆａｄｅ＿ｏｕｔ（ｎ）は、或いは、ｎに基づいた別の関数関係のフェードアウト係数であってよい。

本明細書において、ＮＯＶＡ＿１は、移行処理長を示す。ＮＯＶＡ＿１の値は、具体的なシナリオ要件に基づいて設定されてよい。例えば、ＮＯＶＡ＿１は、３／Ｎに等しくてよく、又はＮＯＶＡ＿１は、Ｎよりも小さい別の値であってよい。

別の例について、現在のフレームにおけるプライマリ及びセカンダリチャンネル信号を取得するために、相関信号符号化モードに対応する時間領域ダウンミックス処理方式を使用することによって、現在のフレームにおける左及び右チャンネル信号に対して、時間領域ダウンミックス処理が実行されるとき、

である。

上記の例において、Ｘ_L（ｎ）は、現在のフレームにおける左チャンネル信号を示し、Ｘ_R（ｎ）は、現在のフレームにおける右チャンネル信号を示し、Ｙ（ｎ）は、現在のフレーム内にあり、時間領域ダウンミックス処理を通して取得される、プライマリチャンネル信号を示し、Ｘ（ｎ）は、現在のフレーム内にあり、時間領域ダウンミックス処理を通して取得される、セカンダリチャンネル信号を示す。

上記の例において、ｎは、サンプリング点の番号を示す。例えば、ｎ＝０、１、．．．、Ｎ－１である。

上記の例において、ｄｅｌａｙ＿ｃｏｍは、エンコーディング遅延補償を示す。

Ｍ₁₁は、以前のフレームのための相関信号チャンネル組み合わせスキームに対応するダウンミックス行列を示し、Ｍ₁₁は、以前のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数に基づいて構築される。

Ｍ₁₂は、以前のフレームのための反相関信号チャンネル組み合わせスキームに対応するダウンミックス行列を示し、Ｍ₁₂は、以前のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数に基づいて構築される。

Ｍ₂₂は、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するダウンミックス行列を示し、Ｍ₂₂は、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数に基づいて構築される。

Ｍ₂₁は、現在のフレームのための相関信号チャンネル組み合わせスキームに対応するダウンミックス行列を示し、Ｍ₂₁は、現在のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数に基づいて構築される。

Ｍ₂₁は、複数の形式、例えば、

又は

を有し得る。

本明細書において、ｒａｔｉｏは、現在のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数を示す。

本明細書において、Ｍ₂₂は、複数の形式、例えば、

又は

を有し得る。

本明細書において、α₁＝ｒａｔｉｏ＿ＳＭ、α₂＝１－ｒａｔｉｏ＿ＳＭであり、ｒａｔｉｏ＿ＳＭは、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数を示す。

本明細書において、Ｍ₁₂は、複数の形式、例えば、

又は

を有し得る。

本明細書において、α_{1_pre}＝ｔｄｍ＿ｌａｓｔ＿ｒａｔｉｏ＿ＳＭ、α_{2_pre}＝１－ｔｄｍ＿ｌａｓｔ＿ｒａｔｉｏ＿ＳＭであり、ｔｄｍ＿ｌａｓｔ＿ｒａｔｉｏ＿ＳＭは、以前のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数を示す。

現在のフレームにおける左及び右チャンネル信号は、具体的には、現在のフレームにおける元の左及び右チャンネル信号であり得（元の左及び右チャンネル信号は、時間領域前処理を施されていない左及び右チャンネル信号であり、例えば、サンプリングを通して取得された左及び右チャンネル信号であり得る）、又は現在のフレームにおける時間前処理を施された左及び右チャンネル信号であり得るし、又は現在のフレームにおける遅延アラインメント処理を施された左及び右チャンネル信号であり得る。

具体的には、例えば、

又は

である。

本明細書において、ｘ_L（ｎ）は、現在のフレームにおける元の左チャンネル信号を示し、ｘ_R（ｎ）は、現在のフレームにおける元の右チャンネル信号を示し、ｘ_{L_HP}（ｎ）は、現在のフレームにおける時間領域前処理を施された左チャンネル信号を示し、ｘ_{R_HP}（ｎ）は、現在のフレームにおける時間領域前処理を施された右チャンネル信号を示し、ｘ’_L（ｎ）は、現在のフレームにおける遅延アラインメント処理を施された左チャンネル信号を示し、ｘ’_R（ｎ）ｘ_{R_HP}（ｎ）は、現在のフレームにおける遅延アラインメント処理を施された右チャンネル信号を示す。

第２の態様に従うと、本出願の実施形態は、時間領域ステレオデコーディング方法をさらに提供し、方法は、
現在のフレームにおけるデコードされたプライマリ及びセカンダリチャンネル信号を取得するために、ビットストリームをデコードするステップと、現在のフレームのデコーディングモードを決定するステップと、現在のフレームのデコーディングモードが反相関信号デコーディングモードであると決定されたとき、現在のフレームにおける再構成された左及び右チャンネル信号を取得するために、反相関信号デコーディングモードに対応する時間領域アップミックス処理方式を使用することによって、現在のフレームにおけるデコードされたプライマリ及びセカンダリチャンネル信号に対して時間領域アップミックス処理を実行するステップであって、反相関信号デコーディングモードに対応する時間領域アップミックス処理方式は、反相関信号チャンネル組み合わせスキームに対応する時間領域アップミックス処理方式であり、反相関信号チャンネル組み合わせスキームは、逆位相に近い信号に対応するチャンネル組み合わせスキームである、ステップ
を含み得る。

現在のフレームのデコーディングモードは、複数のデコーディングモードのうちの１つであり得る。例えば、現在のフレームのデコーディングモードは、以下のデコーディングモード、即ち、相関信号デコーディングモード、反相関信号デコーディングモード、相関から反相関信号デコーディングへの切り換えモード、及び反相関から相関信号デコーディングへの切り換えモードのうちの１つであり得る。

上述のソリューションにおいては、現在のフレームのデコーディングモードは、決定される必要があり、これは、現在のフレームのデコーディングモードについて複数の可能性があることを示していることが理解され得る。ただ１つのデコーディングモードしかない従来のソリューションと比較して、複数の可能なデコーディングモードを有するこのソリューションは、複数の可能なシナリオとより相性が良く、調和することができる。加えて、逆位相に近い信号に対応するチャンネル組み合わせスキームが、導入されるので、現在のフレームにおけるステレオ信号が、逆位相に近い信号であるとき、より目標に合ったチャンネル組み合わせスキーム及びデコーディングモードが、存在し、これは、デコーディング品質を改善する助けになる。

いくつかの可能な実装においては、方法は、
現在のフレームのデコーディングモードが相関信号デコーディングモードであると決定されたとき、現在のフレームにおける再構成された左及び右チャンネル信号を取得するために、相関信号デコーディングモードに対応する時間領域アップミックス処理方式を使用することによって、現在のフレームにおけるデコードされたプライマリ及びセカンダリチャンネル信号に対して時間領域アップミックス処理を実行するステップであって、相関信号デコーディングモードに対応する時間領域アップミックス処理方式は、相関信号チャンネル組み合わせスキームに対応する時間領域アップミックス処理方式であり、相関信号チャンネル組み合わせスキームは、同位相に近い信号に対応するチャンネル組み合わせスキームである、ステップ
をさらに含み得る。

いくつかの可能な実装においては、方法は、現在のフレームのデコーディングモードが相関から反相関信号デコーディングへの切り換えモードであると決定されたとき、現在のフレームにおける再構成された左及び右チャンネル信号を取得するために、相関から反相関信号デコーディングへの切り換えモードに対応する時間領域アップミックス処理方式を使用することによって、現在のフレームにおけるデコードされたプライマリ及びセカンダリチャンネル信号に対して時間領域アップミックス処理を実行するステップをさらに含み得る。相関から反相関信号デコーディングへの切り換えモードに対応する時間領域アップミックス処理方式は、相関信号チャンネル組み合わせスキームから反相関信号チャンネル組み合わせスキームへの移行に対応する時間領域アップミックス処理方式である。

いくつかの可能な実装においては、方法は、現在のフレームのデコーディングモードが反相関から相関信号デコーディングへの切り換えモードであると決定されたとき、現在のフレームにおける再構成された左及び右チャンネル信号を取得するために、反相関から相関信号デコーディングへの切り換えモードに対応する時間領域アップミックス処理方式を使用することによって、現在のフレームにおけるデコードされたプライマリ及びセカンダリチャンネル信号に対して時間領域アップミックス処理を実行するステップをさらに含み得る。反相関から相関信号デコーディングへの切り換えモードに対応する時間領域アップミックス処理方式は、反相関信号チャンネル組み合わせスキームから相関信号チャンネル組み合わせスキームへの移行に対応する時間領域アップミックス処理方式である。

異なるデコーディングモードに対応する時間領域アップミックス処理方式は、通常、異なることが理解されることができる。加えて、各デコーディングモードは、１つ又は複数の時間領域アップミックス処理方式に対応し得る。

例えば、いくつかの可能な実装においては、現在のフレームにおける再構成された左及び右チャンネル信号を取得するために、反相関信号デコーディングモードに対応する時間領域アップミックス処理方式を使用することによって、現在のフレームにおけるデコードされたプライマリ及びセカンダリチャンネル信号に対して時間領域アップミックス処理を実行するステップは、
現在のフレームにおける再構成された左及び右チャンネル信号を取得するために、現在のフレームのための反相関信号チャンネル組み合わせスキームのチャンネル組み合わせ比係数に基づいて、現在のフレームにおけるデコードされたプライマリ及びセカンダリチャンネル信号に対して時間領域アップミックス処理を実行するステップ、又は現在のフレームにおける再構成された左及び右チャンネル信号を取得するために、現在のフレームのための反相関信号チャンネル組み合わせスキームのチャンネル組み合わせ比係数、及び以前のフレームのための反相関信号チャンネル組み合わせスキームのチャンネル組み合わせ比係数に基づいて、現在のフレームにおけるデコードされたプライマリ及びセカンダリチャンネル信号に対して時間領域アップミックス処理を実行するステップ
を含む。

いくつかの可能な実装においては、オーディオフレームのチャンネル組み合わせ比係数に基づいて、対応するアップミックス行列が、構築され得るし、現在のフレームにおける再構成された左及び右チャンネル信号を取得するために、チャンネル組み合わせスキームに対応するアップミックス行列を使用することによって、現在のフレームにおけるデコードされたプライマリ及びセカンダリチャンネル信号に対して、時間領域アップミックス処理が実行される。

例えば、現在のフレームにおける再構成された左及び右チャンネル信号を取得するために、現在のフレームのための反相関信号チャンネル組み合わせスキームのチャンネル組み合わせ比係数に基づいて、現在のフレームにおけるデコードされたプライマリ及びセカンダリチャンネル信号に対して、時間領域アップミックス処理が実行されるとき、

である。

別の例について、現在のフレームにおける再構成された左及び右チャンネル信号を取得するために、現在のフレームのための反相関信号チャンネル組み合わせスキームのチャンネル組み合わせ比係数、及び以前のフレームのための反相関信号チャンネル組み合わせスキームのチャンネル組み合わせ比係数に基づいて、現在のフレームにおけるデコードされたプライマリ及びセカンダリチャンネル信号に対して、時間領域アップミックス処理が実行されるとき、
０≦ｎ＜Ｎ－ｕｐｍｉｘｉｎｇ＿ｄｅｌａｙである場合、

であり、又は
Ｎ－ｕｐｍｉｘｉｎｇ＿ｄｅｌａｙ≦ｎ＜Ｎである場合、

であり、
Ｎ－ｕｐｍｉｘｉｎｇ＿ｄｅｌａｙ≦ｎ＜Ｎ－ｕｐｍｉｘｉｎｇ＿ｄｅｌａｙ＋ＮＯＶＡ＿１である場合、

であり、又は
Ｎ－ｕｐｍｉｘｉｎｇ＿ｄｅｌａｙ＋ＮＯＶＡ＿１≦ｎ＜Ｎである場合、

である。

本明細書において、

は、現在のフレームにおける再構成された左チャンネル信号を示し、

は、現在のフレームにおける再構成された右チャンネル信号を示し、

は、現在のフレームにおけるデコードされたプライマリチャンネル信号を示し、

は、現在のフレームにおけるデコードされたセカンダリチャンネル信号を示す。

本明細書において、ＮＯＶＡ＿１は、移行処理長を示す。

であり、もちろん、ｆａｄｅ＿ｉｎ（ｎ）は、或いは、ｎに基づいた別の関数関係のフェードイン係数であってよい。

本明細書において、ｆａｄｅ＿ｏｕｔ（ｎ）は、フェードアウト係数を示し、例えば、

であり、もちろん、ｆａｄｅ＿ｏｕｔ（ｎ）は、或いは、ｎに基づいた別の関数関係のフェードアウト係数であってよい。

本明細書において、ＮＯＶＡ＿１は、移行処理長を示す。ＮＯＶＡ＿１の値は、具体的なシナリオ要件に基づいて設定されてよい。例えば、ＮＯＶＡ＿１は、３／Ｎに等しくあり得るし、又はＮＯＶＡ＿１は、Ｎよりも小さい別の値であり得る。

別の例について、現在のフレームにおける再構成された左及び右チャンネル信号を取得するために、現在のフレームのための相関信号チャンネル組み合わせスキームのチャンネル組み合わせ比係数に基づいて、現在のフレームにおけるデコードされたプライマリ及びセカンダリチャンネル信号に対して、時間領域アップミックス処理が実行されるとき、

である。

上記の例において、

上記の例において、ｕｐｍｉｘｉｎｇ＿ｄｅｌａｙは、デコーディング遅延補償を示す。

は、以前のフレームのための相関信号チャンネル組み合わせスキームに対応するアップミックス行列を示し、

は、以前のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数に基づいて構築される。

は、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するアップミックス行列を示し、

は、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数に基づいて構築される。

は、以前のフレームのための反相関信号チャンネル組み合わせスキームに対応するアップミックス行列を示し、

は、以前のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数に基づいて構築される。

は、現在のフレームのための相関信号チャンネル組み合わせスキームに対応するアップミックス行列を示し、

は、現在のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数に基づいて構築される。

は、複数の形式、例えば、

又は

を有し得る。

本明細書において、

は、複数の形式、例えば、

又は

を有し得る。

本明細書において、α_{1_pre}＝ｔｄｍ＿ｌａｓｔ＿ｒａｔｉｏ＿ＳＭ、α_{2_pre}＝１－ｔｄｍ＿ｌａｓｔ＿ｒａｔｉｏ＿ＳＭである。

本明細書において、ｔｄｍ＿ｌａｓｔ＿ｒａｔｉｏ＿ＳＭは、以前のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数を示す。

本明細書において、

は、複数の形式、例えば、

又は

を有し得る。

第３の態様に従うと、本出願の実施形態は、時間領域ステレオエンコーディング装置をさらに提供し、装置は、互いに結合された、プロセッサと、メモリとを含み得る。プロセッサは、第１の態様におけるいずれかのステレオエンコーディング方法のいくつか又は全てのステップを実行するように構成され得る。

第４の態様に従うと、本出願の実施形態は、時間領域ステレオデコーディング装置をさらに提供し、装置は、互いに結合された、プロセッサと、メモリとを含み得る。プロセッサは、第２の態様におけるいずれかのステレオエンコーディング方法のいくつか又は全てのステップを実行するように構成され得る。

第５の態様に従うと、本出願の実施形態は、第１の態様におけるいずれかの方法を実施するように構成されたいくつかの機能ユニットを含む、時間領域ステレオエンコーディング装置を提供する。

第６の態様に従うと、本出願の実施形態は、第２の態様におけるいずれかの方法を実施するように構成されたいくつかの機能ユニットを含む、時間領域ステレオデコーディング装置を提供する。

第７の態様に従うと、本出願の実施形態は、コンピュータ可読記憶媒体を提供し、コンピュータ可読記憶媒体は、プログラムコードを記憶し、プログラムコードは、第１の態様におけるいずれかの方法のいくつか又は全てのステップを実行するために使用される命令を含む。

第８の態様に従うと、本出願の実施形態は、コンピュータ可読記憶媒体を提供し、コンピュータ可読記憶媒体は、プログラムコードを記憶し、プログラムコードは、第２の態様におけるいずれかの方法のいくつか又は全てのステップを実行するために使用される命令を含む。

第９の態様に従うと、本出願の実施形態は、コンピュータプログラム製品を提供し、コンピュータプログラム製品が、コンピュータ上において実行されたとき、コンピュータは、第１の態様におけるいずれかの方法のいくつか又は全てのステップを実行することを可能にされる。

第１０の態様に従うと、本出願の実施形態は、コンピュータプログラム製品を提供し、コンピュータプログラム製品が、コンピュータ上において実行されたとき、コンピュータは、第２の態様におけるいずれかの方法のいくつか又は全てのステップを実行することを可能にされる。

以下に、本出願の実施形態又は背景を説明するのに必要とされる添付の図面について説明する。

本出願の実施形態に従った、逆位相に近い信号の概略図である。本出願の実施形態に従った、オーディオエンコーディング方法の概略フローチャートである。本出願の実施形態に従った、オーディオデコーディングモードを決定するための方法の概略フローチャートである。本出願の実施形態に従った、別のオーディオエンコーディング方法の概略フローチャートである。本出願の実施形態に従った、オーディオデコーディング方法の概略フローチャートである。本出願の実施形態に従った、別のオーディオエンコーディング方法の概略フローチャートである。本出願の実施形態に従った、別のオーディオデコーディング方法の概略フローチャートである。本出願の実施形態に従った、時間領域ステレオパラメータ決定方法の概略フローチャートである。本出願の実施形態に従った、別のオーディオエンコーディング方法の概略フローチャートである。本出願の実施形態に従った、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数を算出及びエンコードするための方法の概略フローチャートである。本出願の実施形態に従った、現在のフレームにおける左チャンネルと右チャンネルとの間の振幅相関差パラメータを算出するための方法の概略フローチャートである。本出願の実施形態に従った、現在のフレームにおける左チャンネルと右チャンネルとの間の振幅相関差パラメータをチャンネル組み合わせ比係数に変換するための方法の概略フローチャートである。本出願の実施形態に従った、別のオーディオデコーディング方法の概略フローチャートである。本出願の実施形態に従った、装置の概略図である。本出願の実施形態に従った、別の装置の概略図である。本出願の実施形態に従った、別の装置の概略図である。本出願の実施形態に従った、別の装置の概略図である。本出願の実施形態に従った、別の装置の概略図である。本出願の実施形態に従った、別の装置の概略図である。

以下では、本出願の実施形態における添付の図面を参照して、本出願の実施形態について説明する。

本出願の明細書、特許請求の範囲、及び添付の図面において述べられる「含む」、「有する」という語、及びそれらの他の任意の変形は、非排他的な包含を含むことが意図される。例えば、一連のステップ若しくはユニットを含む、処理、方法、システム、製品、又はデバイスは、列挙されたステップ又はユニットに限定されず、任意選択で、列挙されていないステップ若しくはユニットをさらに含み得るし、又は任意選択で、処理、方法、製品、若しくはデバイスの別の固有のステップ若しくはユニットをさらに含む。加えて、「第１の」、「第２の」、「第３の」、及び「第４の」などの語は、特定の順序を記述する代わりに、オブジェクトを区別するために使用される。

本出願の実施形態のソリューションは、説明を簡潔にするために、時間領域シナリオに特有であるので、時間領域信号は、簡潔に「信号」と呼ばれることがあることが留意されるべきである。例えば、左チャンネル時間領域信号は、簡潔に「左チャンネル信号」と呼ばれることがある。別の例について、右チャンネル時間領域信号は、簡潔に「右チャンネル信号」と呼ばれることがある。別の例について、モノラル時間領域信号は、簡潔に「モノラル信号」と呼ばれることがある。別の例について、参照チャンネル時間領域信号は、簡潔に「参照チャンネル信号」と呼ばれることがある。別の例について、プライマリチャンネル時間領域信号は、簡潔に「プライマリチャンネル信号」と呼ばれることがある。セカンダリチャンネル時間領域信号は、簡潔に「セカンダリチャンネル信号」と呼ばれることがある。別の例について、ミッドチャンネル（Ｍｉｄｃｈａｎｎｅｌ）時間領域信号は、簡潔に「ミッドチャンネル信号」と呼ばれることがある。別の例について、サイドチャンネル（Ｓｉｄｅｃｈａｎｎｅｌ）時間領域信号は、簡潔に「サイドチャンネル信号」と呼ばれることがある。他のケースは、類推によって推測されることができる。

本出願の実施形態においては、左チャンネル時間領域信号と右チャンネル時間領域信号は、一括して「左及び右チャンネル時間領域信号」と呼ばれることがあり、又は一括して「左及び右チャンネル信号」と呼ばれることがあることが留意されるべきである。言い換えると、左及び右チャンネル時間領域信号は、左チャンネル時間領域信号と、右チャンネル時間領域信号とを含む。別の例について、現在のフレームにおける遅延アラインメント処理を施された左及び右チャンネル時間領域信号は、現在のフレームにおける遅延アラインメント処理を施された左チャンネル時間領域信号と、現在のフレームにおける遅延アラインメント処理を施された右チャンネル時間領域信号とを含む。同様に、プライマリチャンネル信号とセカンダリチャンネル信号は、一括して「プライマリ及びセカンダリチャンネル信号」と呼ばれることがある。言い換えると、プライマリ及びセカンダリチャンネル信号は、プライマリチャンネル信号と、セカンダリチャンネル信号とを含む。別の例について、デコードされたプライマリ及びセカンダリチャンネル信号は、デコードされたプライマリチャンネル信号と、デコードされたセカンダリチャンネル信号とを含む。別の例について、再構成された左及び右チャンネル時間領域信号は、左チャンネル再構成信号と、右チャンネル再構成信号とを含む。残りは、類推によって推測されることができる。

例えば、従来のＭＳエンコーディング技術においては、ミッドチャンネル（Ｍｉｄｃｈａｎｎｅｌ）信号と、サイドチャンネル（Ｓｉｄｅｃｈａｎｎｅｌ）信号とを取得するために、左及び右チャンネル信号が、最初にダウンミックスされる。例えば、Ｌは、左チャンネル信号を示し、Ｒは、右チャンネル信号を示す。このケースにおいては、ミッドチャンネル信号は、０．５×（Ｌ＋Ｒ）であり、ミッドチャンネル信号は、左チャンネルと右チャンネルとの間の相関についての情報を示し、サイドチャンネル信号は、０．５×（Ｌ－Ｒ）であり、サイドチャンネル信号は、左チャンネルと右チャンネルとの間の差についての情報を示す。その後、ミッドチャンネル信号とサイドチャンネル信号は、モノラルエンコーディング方法を使用することによって、別々にエンコードされ、ミッドチャンネル信号は、通常、より多量のビットを使用することによってエンコードされ、サイドチャンネル信号は、通常、より少量のビットを使用することによってエンコードされる。

さらに、いくつかのソリューションにおいては、エンコーディング品質を改善するために、時間領域ダウンミックス処理において、左及び右チャンネル時間領域信号が、分析されて、右チャンネルに対する左チャンネルの比率を示すために使用される時間領域ステレオパラメータを抽出する。提案される方法の目的は、以下の通りであり、即ち、ステレオ左及び右チャンネル信号間のエネルギー差が、相対的に大きいとき、時間領域ダウンミックスされた信号において、プライマリチャンネルのエネルギーは、増加させることができ、セカンダリチャンネルのエネルギーは、減少させることができる。例えば、Ｌは、左チャンネル信号を示し、Ｒは、右チャンネル信号を示す。このケースにおいては、プライマリチャンネル（Ｐｒｉｍａｒｙｃｈａｎｎｅｌ）信号は、Ｙと表記され、Ｙ＝ａｌｐｈａ×Ｌ＋ｂｅｔａ×Ｒであり、Ｙは、２つのチャンネル間の相関についての情報を示し、セカンダリチャンネル（Ｓｅｃｏｎｄａｒｙｃｈａｎｎｅｌ）信号は、Ｘと表記され、Ｘ＝ａｌｐｈａ×Ｌ－ｂｅｔａ×Ｒであり、Ｘは、２つのチャンネル間の差についての情報を表す。本明細書において、ａｌｐｈａ及びｂｅｔａは、０から１までの実数である。

図１は、左チャンネル信号及び右チャンネル信号の振幅変化を示している。時間領域における瞬間において、特定の位置における左チャンネル信号のサンプリング点の振幅の絶対値と、対応する位置における右チャンネル信号のサンプリング点の振幅の絶対値は、基本的に同じであるが、振幅は、反対の符号を有する。これは、典型的な逆位相に近い信号である。図１は、逆位相に近い信号の典型例を単に示している。実際に、逆位相に近い信号は、左及び右チャンネル信号間の位相差が近似的に１８０°である、ステレオ信号である。例えば、左及び右チャンネル信号間の位相差が［１８０－θ，１８０＋θ］内に含まれるステレオ信号は、逆位相に近い信号と呼ばれることがあり、θは、０°から９０°の間の任意の角度であってよい。例えば、θは、０°、５°、１５°、１７°、２０°、３０°、又は４０°の角度に等しくてよい。

同様に、同位相に近い信号は、左及び右チャンネル信号間の位相差が近似的に０度である、ステレオ信号である。例えば、左及び右チャンネル信号間の位相差が［－θ，θ］内に含まれるステレオ信号は、同位相に近い信号と呼ばれることがある。θは、０°から９０°までの間の任意の角度であってよい。例えば、θは、０°、５°、１５°、１７°、２０°、３０°、又は４０°の角度に等しくてよい。

左及び右チャンネル信号が、同位相に近い信号であるとき、時間領域ダウンミックス処理を通して生成されるプライマリチャンネル信号のエネルギーは、通常、セカンダリチャンネル信号のエネルギーよりも著しく大きい。プライマリチャンネル信号が、より多量のビットを使用することによってエンコードされ、セカンダリチャンネル信号が、より少量のビットを使用することによってエンコードされる場合、より良好なエンコーディング効果が、取得されることができる。しかしながら、左及び右チャンネル信号が、逆位相に近い信号であるとき、同じ時間領域ダウンミックス処理方法が、使用される場合、生成されたプライマリチャンネル信号のエネルギーは、非常に小さいこと、又は失われさえすることがあり、最終的なエンコーディング品質の低下をもたらす。

以下では、引き続き、ステレオエンコーディング及びデコーディング品質を改善する助けになることができる、いくつかの技術的ソリューションについて説明する。

本出願の実施形態において述べられるエンコーディング装置及びデコーディング装置は、音声信号の収集、記憶、及び外部への送信などの機能を有する装置であり得る。具体的には、エンコーディング装置及びデコーディング装置は、例えば、モバイルフォン、サーバ、タブレットコンピュータ、パーソナルコンピュータ、又はノートブックコンピュータであり得る。

本出願のソリューションにおいては、左及び右チャンネル信号は、ステレオ信号の左及び右チャンネル信号であることが理解されることができる。ステレオ信号は、元のステレオ信号、又はマルチチャンネル信号内の信号の２つのチャンネルを含むステレオ信号、又はマルチチャンネル信号内の信号の複数のチャンネルによって共同で生成される信号の２つのチャンネルを含むステレオ信号であり得る。ステレオエンコーディング方法は、マルチチャンネルエンコーディングにおいて使用されるステレオエンコーディング方法でもあり得る。ステレオエンコーディング装置は、マルチチャンネルエンコーディング装置において使用されるステレオエンコーディング装置でもあり得る。ステレオデコーディング方法は、マルチチャンネルデコーディングにおいて使用されるステレオデコーディング方法でもあり得る。ステレオデコーディング装置は、マルチチャンネルデコーディング装置において使用されるステレオデコーディング装置でもあり得る。本出願の実施形態におけるオーディオエンコーディング方法は、例えば、ステレオエンコーディングシナリオに特有であり、本出願の実施形態におけるオーディオデコーディング方法は、例えば、ステレオデコーディングシナリオに特有である。

以下では、最初に、オーディオ符号化モードを決定するための方法を提供し、方法は、現在のフレームのためのチャンネル組み合わせスキームを決定するステップと、
以前のフレームのためのチャンネル組み合わせスキーム及び現在のフレームのためのチャンネル組み合わせスキームに基づいて、現在のフレームの符号化モードを決定するステップとを含み得る。

図２は、本出願の実施形態に従った、オーディオエンコーディング方法の概略フローチャートである。オーディオエンコーディング方法の関連ステップは、エンコーディング装置によって実施され得るし、例えば、以下のステップを含み得る。

２０１．現在のフレームのためのチャンネル組み合わせスキームを決定する。

現在のフレームのためのチャンネル組み合わせスキームは、複数のチャンネル組み合わせスキームのうちの１つである。例えば、複数のチャンネル組み合わせスキームは、反相関信号チャンネル組み合わせスキーム（ａｎｔｉｃｏｒｒｅｌａｔｅｄｓｉｇｎａｌＣｈａｎｎｅｌＣｏｍｂｉｎａｔｉｏｎＳｃｈｅｍｅ）と、相関信号チャンネル組み合わせスキーム（ｃｏｒｒｅｌａｔｅｄｓｉｇｎａｌＣｈａｎｎｅｌＣｏｍｂｉｎａｔｉｏｎＳｃｈｅｍｅ）とを含む。相関信号チャンネル組み合わせスキームは、同位相に近い信号に対応するチャンネル組み合わせスキームである。反相関信号チャンネル組み合わせスキームは、逆位相に近い信号に対応するチャンネル組み合わせスキームである。同位相に近い信号に対応するチャンネル組み合わせスキームは、同位相に近い信号に適用可能であり、逆位相に近い信号に対応するチャンネル組み合わせスキームは、逆位相に近い信号に適用可能であることが理解され得る。

２０２．以前のフレームのためのチャンネル組み合わせスキーム及び現在のフレームのためのチャンネル組み合わせスキームに基づいて、現在のフレームの符号化モードを決定する。

加えて、現在のフレームが、最初のフレーム（即ち、現在のフレームの以前のフレームが存在しない）である場合、現在のフレームの符号化モードは、現在のフレームのためのチャンネル組み合わせスキームに基づいて決定され得る。或いは、デフォルト符号化モードが、現在のフレームの符号化モードとして使用され得る。

現在のフレームの符号化モードは、複数の符号化モードのうちの１つである。例えば、複数の符号化モードは、相関から反相関信号符号化への切り換えモード（ｃｏｒｒｅｌａｔｅｄ－ｔｏ－ａｎｔｉｃｏｒｒｅｌａｔｅｄｓｉｇｎａｌｃｏｄｉｎｇｓｗｉｔｃｈｉｎｇｍｏｄｅ）、反相関から相関信号符号化への切り換えモード（ａｎｔｉｃｏｒｒｅｌａｔｅｄ－ｔｏ－ｃｏｒｒｅｌａｔｅｄｓｉｇｎａｌｃｏｄｉｎｇｓｗｉｔｃｈｉｎｇｍｏｄｅ）、相関信号符号化モード（ｃｏｒｒｅｌａｔｅｄｓｉｇｎａｌｃｏｄｉｎｇｍｏｄｅ）、及び反相関信号符号化モード（ａｎｔｉｃｏｒｒｅｌａｔｅｄｓｉｇｎａｌｃｏｄｉｎｇｍｏｄｅ）などを含み得る。

相関から反相関信号符号化への切り換えモードに対応する時間領域ダウンミックスモードは、例えば、「相関から反相関信号ダウンミックスへの切り換えモード」（ｃｏｒｒｅｌａｔｅｄ－ｔｏ－ａｎｔｉｃｏｒｒｅｌａｔｅｄｓｉｇｎａｌｄｏｗｎｍｉｘｓｗｉｔｃｈｉｎｇｍｏｄｅ）と呼ばれることがある。反相関から相関信号符号化への切り換えモードに対応する時間領域ダウンミックスモードは、例えば、「反相関から相関信号ダウンミックスへの切り換えモード」（ａｎｔｉｃｏｒｒｅｌａｔｅｄ－ｔｏ－ｃｏｒｒｅｌａｔｅｄｓｉｇｎａｌｄｏｗｎｍｉｘｓｗｉｔｃｈｉｎｇｍｏｄｅ）と呼ばれることがある。相関信号符号化モードに対応する時間領域ダウンミックスモードは、例えば、「相関信号ダウンミックスモード」（ｃｏｒｒｅｌａｔｅｄｓｉｇｎａｌｄｏｗｎｍｉｘｍｏｄｅ）と呼ばれることがある。反相関信号符号化モードに対応する時間領域ダウンミックスモードは、例えば、「反相関信号ダウンミックスモード」（ａｎｔｉｃｏｒｒｅｌａｔｅｄｓｉｇｎａｌｄｏｗｎｍｉｘｍｏｄｅ）と呼ばれることがある。

本出願のこの実施形態においては、符号化モード、デコーディングモード、及びチャンネル組み合わせスキームなど、オブジェクトの名前は、全て、例であり、実際の適用においては、他の名前が、使用されてもまたよいことが理解され得る。

２０３．現在のフレームにおけるプライマリ及びセカンダリチャンネル信号を取得するために、現在のフレームの符号化モードに対応する時間領域ダウンミックス処理に基づいて、現在のフレームにおける左及び右チャンネル信号に対して時間領域ダウンミックス処理を実行する。

現在のフレームにおけるプライマリ及びセカンダリチャンネル信号を取得するために、現在のフレームにおける左及び右チャンネル信号に対して、時間領域ダウンミックス処理が実行され得るし、プライマリ及びセカンダリチャンネル信号は、ビットストリームを取得するために、さらにエンコードされる。さらに、現在のフレームのチャンネル組み合わせスキームフラグ（現在のフレームのチャンネル組み合わせスキームフラグは、現在のフレームのためのチャンネル組み合わせスキームを示すために使用される）が、ビットストリーム内に書き込まれ得るし、デコーディング装置が、ビットストリーム内に含まれる現在のフレームのチャンネル組み合わせスキームフラグに基づいて、現在のフレームのためのチャンネル組み合わせスキームを決定するようにする。

以前のフレームのためのチャンネル組み合わせスキーム及び現在のフレームのためのチャンネル組み合わせスキームに基づいて、現在のフレームの符号化モードを決定する、様々な具体的な実装が、存在し得る。

具体的には、例えば、いくつかの可能な実装においては、以前のフレームのためのチャンネル組み合わせスキーム及び現在のフレームのためのチャンネル組み合わせスキームに基づいて、現在のフレームの符号化モードを決定することは、
以前のフレームのためのチャンネル組み合わせスキームが、相関信号チャンネル組み合わせスキームであり、現在のフレームのためのチャンネル組み合わせスキームが、反相関信号チャンネル組み合わせスキームであるとき、現在のフレームの符号化モードは、相関から反相関信号符号化への切り換えモードであると決定することであって、相関から反相関信号符号化への切り換えモードにおいては、相関信号チャンネル組み合わせスキームから反相関信号チャンネル組み合わせスキームへの移行に対応するダウンミックス処理方法を使用することによって、時間領域ダウンミックス処理が実行される、決定すること、又は
以前のフレームのためのチャンネル組み合わせスキームが、反相関信号チャンネル組み合わせスキームであり、現在のフレームのためのチャンネル組み合わせスキームが、反相関信号チャンネル組み合わせスキームであるとき、現在のフレームの符号化モードは、反相関信号符号化モードであると決定することであって、反相関信号符号化モードにおいては、反相関信号チャンネル組み合わせスキームに対応するダウンミックス処理方法を使用することによって、時間領域ダウンミックス処理が実行される、決定すること、又は
以前のフレームのためのチャンネル組み合わせスキームが、反相関信号チャンネル組み合わせスキームであり、現在のフレームのためのチャンネル組み合わせスキームが、相関信号チャンネル組み合わせスキームであるとき、現在のフレームの符号化モードは、反相関から相関信号符号化への切り換えモードであると決定することであって、反相関から相関信号符号化への切り換えモードにおいては、反相関信号チャンネル組み合わせスキームから相関信号チャンネル組み合わせスキームへの移行に対応するダウンミックス処理方法を使用することによって、時間領域ダウンミックス処理が実行され、反相関から相関信号符号化への切り換えモードに対応する時間領域ダウンミックス処理方式は、具体的には、セグメント化された時間領域ダウンミックス方式であり得るし、即ち、現在のフレームのためのチャンネル組み合わせスキーム及び以前のフレームのためのチャンネル組み合わせスキームに基づいて、現在のフレームにおける左及び右チャンネル信号に対して、セグメント化された時間領域ダウンミックス処理を実行する、決定すること、又は
以前のフレームのためのチャンネル組み合わせスキームが、相関信号チャンネル組み合わせスキームであり、現在のフレームのためのチャンネル組み合わせスキームが、相関信号チャンネル組み合わせスキームであるとき、現在のフレームの符号化モードは、相関信号符号化モードであると決定することであって、相関信号符号化モードにおいては、相関信号チャンネル組み合わせスキームに対応するダウンミックス処理方法を使用することによって、時間領域ダウンミックス処理が実行される、決定すること
を含み得る。

例えば、いくつかの可能な実装においては、現在のフレームの符号化モードが相関信号符号化モードであるとき、現在のフレームにおけるプライマリ及びセカンダリチャンネル信号を取得するために、相関信号符号化モードに対応する時間領域ダウンミックス処理方式を使用することによって、現在のフレームにおける左及び右チャンネル信号に対して、時間領域ダウンミックス処理が実行される。相関信号符号化モードに対応する時間領域ダウンミックス処理方式は、相関信号チャンネル組み合わせスキームに対応する時間領域ダウンミックス処理方式である。

別の例について、いくつかの可能な実装においては、現在のフレームの符号化モードが反相関信号符号化モードであると決定されたとき、現在のフレームにおけるプライマリ及びセカンダリチャンネル信号を取得するために、反相関信号符号化モードに対応する時間領域ダウンミックス処理方式を使用することによって、現在のフレームにおける左及び右チャンネル信号に対して、時間領域ダウンミックス処理が実行される。反相関信号符号化モードに対応する時間領域ダウンミックス処理方式は、反相関信号チャンネル組み合わせスキームに対応する時間領域ダウンミックス処理方式である。

別の例について、いくつかの可能な実装においては、現在のフレームの符号化モードが相関から反相関信号符号化への切り換えモードであると決定されたとき、現在のフレームにおけるプライマリ及びセカンダリチャンネル信号を取得するために、相関から反相関信号符号化への切り換えモードに対応する時間領域ダウンミックス処理方式を使用することによって、現在のフレームにおける左及び右チャンネル信号に対して、時間領域ダウンミックス処理が実行される。相関から反相関信号符号化への切り換えモードに対応する時間領域ダウンミックス処理方式は、相関信号チャンネル組み合わせスキームから反相関信号チャンネル組み合わせスキームへの移行に対応する時間領域ダウンミックス処理方式である。相関から反相関信号符号化への切り換えモードに対応する時間領域ダウンミックス処理方式は、具体的には、セグメント化された時間領域ダウンミックス方式であり得るし、即ち、現在のフレームのためのチャンネル組み合わせスキーム及び以前のフレームのためのチャンネル組み合わせスキームに基づいて、現在のフレームにおける左及び右チャンネル信号に対して、セグメント化された時間領域ダウンミックス処理を実行する。

別の例について、いくつかの可能な実装においては、現在のフレームの符号化モードが反相関から相関信号符号化への切り換えモードであると決定されたとき、現在のフレームにおけるプライマリ及びセカンダリチャンネル信号を取得するために、反相関から相関信号符号化への切り換えモードに対応する時間領域ダウンミックス処理方式を使用することによって、現在のフレームにおける左及び右チャンネル信号に対して、時間領域ダウンミックス処理が実行される。反相関から相関信号符号化への切り換えモードに対応する時間領域ダウンミックス処理方式は、反相関信号チャンネル組み合わせスキームから相関信号チャンネル組み合わせスキームへの移行に対応する時間領域ダウンミックス処理方式である。

例えば、いくつかの可能な実装においては、現在のフレームにおけるプライマリ及びセカンダリチャンネル信号を取得するために、反相関信号符号化モードに対応する時間領域ダウンミックス処理方式を使用することによって、現在のフレームにおける左及び右チャンネル信号に対して時間領域ダウンミックス処理を実行することは、現在のフレームにおけるプライマリ及びセカンダリチャンネル信号を取得するために、現在のフレームのための反相関信号チャンネル組み合わせスキームのチャンネル組み合わせ比係数に基づいて、現在のフレームにおける左及び右チャンネル信号に対して時間領域ダウンミックス処理を実行すること、又は現在のフレームにおけるプライマリ及びセカンダリチャンネル信号を取得するために、現在のフレームのための反相関信号チャンネル組み合わせスキームのチャンネル組み合わせ比係数、及び以前のフレームのための反相関信号チャンネル組み合わせスキームのチャンネル組み合わせ比係数に基づいて、現在のフレームにおける左及び右チャンネル信号に対して時間領域ダウンミックス処理を実行することを含み得る。

上述のソリューションにおいては、現在のフレームのためのチャンネル組み合わせスキームは、決定される必要があり、これは、現在のフレームのためのチャンネル組み合わせスキームについて複数の可能性があることを示していることが理解され得る。ただ１つのチャンネル組み合わせスキームしかない従来のソリューションと比較して、複数の可能なチャンネル組み合わせスキームを有するこのソリューションは、複数の可能なシナリオとより相性が良く、調和することができる。上述のソリューションにおいては、現在のフレームの符号化モードは、以前のフレームのためのチャンネル組み合わせスキーム及び現在のフレームのためのチャンネル組み合わせスキームに基づいて決定される必要があり、現在のフレームの符号化モードについて複数の可能性がある。ただ１つの符号化モードしかない従来のソリューションと比較して、複数の可能な符号化モードを有するこのソリューションは、複数の可能なシナリオとより相性が良く、調和することができる。

具体的には、例えば、現在のフレームのためのチャンネル組み合わせスキームが、以前のフレームのためのチャンネル組み合わせスキームと異なる場合、現在のフレームの符号化モードは、例えば、相関から反相関信号符号化への切り換えモード、又は反相関から相関信号符号化への切り換えモードであり得ると決定され得る。このケースにおいては、現在のフレームのためのチャンネル組み合わせスキーム及び以前のフレームのためのチャンネル組み合わせスキームに基づいて、現在のフレームにおける左及び右チャンネル信号に対して、セグメント化された時間領域ダウンミックス処理が実行され得る。

現在のフレームのためのチャンネル組み合わせスキームと、以前のフレームのためのチャンネル組み合わせスキームが、異なるとき、現在のフレームにおける左及び右チャンネル信号に対してセグメント化された時間領域ダウンミックス処理を実行するメカニズムが、導入される。セグメント化された時間領域ダウンミックス処理メカニズムは、チャンネル組み合わせスキームのスムーズな移行を実施する助けになり、さらにエンコーディング品質を改善する助けになる。

これに対応して、以下では、例を使用することによって、時間領域ステレオデコーディングシナリオについて説明する。

図３を参照すると、以下では、オーディオデコーディングモードを決定するための方法を提供する。オーディオデコーディングモードを決定するための方法の関連ステップは、デコーディング装置によって実施され得るし、方法は、具体的には、以下のステップを含み得る。

３０１．ビットストリーム内にある現在のフレームのチャンネル組み合わせスキームフラグに基づいて、現在のフレームのためのチャンネル組み合わせスキームを決定する。

３０２．以前のフレームのためのチャンネル組み合わせスキーム及び現在のフレームのためのチャンネル組み合わせスキームに基づいて、現在のフレームのデコーディングモードを決定する。

現在のフレームのデコーディングモードは、複数のデコーディングモードのうちの１つである。例えば、複数のデコーディングモードは、相関から反相関信号デコーディングへの切り換えモード（ｃｏｒｒｅｌａｔｅｄ－ｔｏ－ａｎｔｉｃｏｒｒｅｌａｔｅｄｓｉｇｎａｌｄｅｃｏｄｉｎｇｓｗｉｔｃｈｉｎｇｍｏｄｅ）、反相関から相関信号デコーディングへの切り換えモード（ａｎｔｉｃｏｒｒｅｌａｔｅｄ－ｔｏ－ｃｏｒｒｅｌａｔｅｄｓｉｇｎａｌｄｅｃｏｄｉｎｇｓｗｉｔｃｈｉｎｇｍｏｄｅ）、相関信号デコーディングモード（ｃｏｒｒｅｌａｔｅｄｓｉｇｎａｌｄｅｃｏｄｉｎｇｍｏｄｅ）、及び反相関信号デコーディングモード（ａｎｔｉｃｏｒｒｅｌａｔｅｄｓｉｇｎａｌｄｅｃｏｄｉｎｇｍｏｄｅ）などを含み得る。

相関から反相関信号デコーディングへの切り換えモードに対応する時間領域アップミックスモードは、例えば、「相関から反相関信号アップミックスへの切り換えモード」（ｃｏｒｒｅｌａｔｅｄ－ｔｏ－ａｎｔｉｃｏｒｒｅｌａｔｅｄｓｉｇｎａｌｕｐｍｉｘｓｗｉｔｃｈｉｎｇｍｏｄｅ）と呼ばれることがある。反相関から相関信号デコーディングへの切り換えモードに対応する時間領域アップミックススモードは、例えば、「反相関から相関信号アップミックスへの切り換えモード」（ａｎｔｉｃｏｒｒｅｌａｔｅｄ－ｔｏ－ｃｏｒｒｅｌａｔｅｄｓｉｇｎａｌｕｐｍｉｘｓｗｉｔｃｈｉｎｇｍｏｄｅ）と呼ばれることがある。相関信号デコーディングモードに対応する時間領域アップミックスモードは、例えば、「相関信号アップミックスモード」（ｃｏｒｒｅｌａｔｅｄｓｉｇｎａｌｕｐｍｉｘｍｏｄｅ）と呼ばれることがある。反相関信号デコーディングモードに対応する時間領域アップミックスモードは、例えば、「反相関信号アップミックスモード」（ａｎｔｉｃｏｒｒｅｌａｔｅｄｓｉｇｎａｌｕｐｍｉｘｍｏｄｅ）と呼ばれることがある。

いくつかの可能な実装においては、以前のフレームのためのチャンネル組み合わせスキーム及び現在のフレームのためのチャンネル組み合わせスキームに基づいて、現在のフレームのデコーディングモードを決定することは、
以前のフレームのためのチャンネル組み合わせスキームが、相関信号チャンネル組み合わせスキームであり、現在のフレームのためのチャンネル組み合わせスキームが、反相関信号チャンネル組み合わせスキームであるとき、現在のフレームのデコーディングモードは、相関から反相関信号デコーディングへの切り換えモードであると決定することであって、相関から反相関信号デコーディングへの切り換えモードにおいては、相関信号チャンネル組み合わせスキームから反相関信号チャンネル組み合わせスキームへの移行に対応するアップミックス処理方法を使用することによって、時間領域アップミックス処理が実行される、決定すること、又は
以前のフレームのためのチャンネル組み合わせスキームが、反相関信号チャンネル組み合わせスキームであり、現在のフレームのためのチャンネル組み合わせスキームが、反相関信号チャンネル組み合わせスキームであるとき、現在のフレームのデコーディングモードは、反相関信号デコーディングモードであると決定することであって、反相関信号デコーディングモードにおいては、反相関信号チャンネル組み合わせスキームに対応するアップミックス処理方法を使用することによって、時間領域アップミックス処理が実行される、決定すること、又は
以前のフレームのためのチャンネル組み合わせスキームが、反相関信号チャンネル組み合わせスキームであり、現在のフレームのためのチャンネル組み合わせスキームが、相関信号チャンネル組み合わせスキームであるとき、現在のフレームのデコーディングモードは、反相関から相関信号デコーディングへの切り換えモードであると決定することであって、反相関から相関信号デコーディングへの切り換えモードにおいては、反相関信号チャンネル組み合わせスキームから相関信号チャンネル組み合わせスキームへの移行に対応するアップミックス処理方法を使用することによって、時間領域アップミックス処理が実行される、決定すること、又は
以前のフレームのためのチャンネル組み合わせスキームが、相関信号チャンネル組み合わせスキームであり、現在のフレームのためのチャンネル組み合わせスキームが、相関信号チャンネル組み合わせスキームであるとき、現在のフレームのデコーディングモードは、相関信号デコーディングモードであると決定することであって、相関信号デコーディングモードにおいては、相関信号チャンネル組み合わせスキームに対応するアップミックス処理方法を使用することによって、時間領域アップミックス処理が実行される、決定すること
を含む。

例えば、現在のフレームのデコーディングモードは、反相関信号デコーディングモードであると決定したとき、デコーディング装置は、現在のフレームにおける再構成された左及び右チャンネル信号を取得するために、反相関信号デコーディングモードに対応する時間領域アップミックス処理方式を使用することによって、現在のフレームにおけるデコードされたプライマリ及びセカンダリチャンネル信号に対して時間領域アップミックス処理を実行する。

再構成された左及び右チャンネル信号は、デコードされた左及び右チャンネル信号であり得るし、又はデコードされた左及び右チャンネル信号を取得するために、再構成された左及び右チャンネル信号に対して、遅延調整処理及び／又は時間領域後処理が実行され得る。

反相関信号デコーディングモードに対応する時間領域アップミックス処理方式は、反相関信号チャンネル組み合わせスキームに対応する時間領域アップミックス処理方式であり、反相関信号チャンネル組み合わせスキームは、逆位相に近い信号に対応するチャンネル組み合わせスキームである。

現在のフレームのデコーディングモードは、複数のデコーディングモードのうちの１つである。例えば、現在のフレームのデコーディングモードは、以下のデコーディングモード、即ち、相関信号デコーディングモード、反相関信号デコーディングモード、相関から反相関信号デコーディングへの切り換えモード、及び反相関から相関信号デコーディングへの切り換えモードのうちの１つであり得る。

別の例について、現在のフレームのデコーディングモードが相関信号デコーディングモードであると決定されたとき、デコーディング装置は、現在のフレームにおける再構成された左及び右チャンネル信号を取得するために、相関信号デコーディングモードに対応する時間領域アップミックス処理方式を使用することによって、現在のフレームにおけるデコードされたプライマリ及びセカンダリチャンネル信号に対して時間領域アップミックス処理を実行する。相関信号デコーディングモードに対応する時間領域アップミックス処理方式は、相関信号チャンネル組み合わせスキームに対応する時間領域アップミックス処理方式であり、相関信号チャンネル組み合わせスキームは、同位相に近い信号に対応するチャンネル組み合わせスキームである。

別の例について、現在のフレームのデコーディングモードが相関から反相関信号デコーディングへの切り換えモードであると決定されたとき、デコーディング装置は、現在のフレームにおける再構成された左及び右チャンネル信号を取得するために、相関から反相関信号デコーディングへの切り換えモードに対応する時間領域アップミックス処理方式を使用することによって、現在のフレームにおけるデコードされたプライマリ及びセカンダリチャンネル信号に対して時間領域アップミックス処理を実行する。相関から反相関信号デコーディングへの切り換えモードに対応する時間領域アップミックス処理方式は、相関信号チャンネル組み合わせスキームから反相関信号チャンネル組み合わせスキームへの移行に対応する時間領域アップミックス処理方式である。

別の例について、現在のフレームのデコーディングモードが反相関から相関信号デコーディングへの切り換えモードであると決定されたとき、デコーディング装置は、現在のフレームにおける再構成された左及び右チャンネル信号を取得するために、反相関から相関信号デコーディングへの切り換えモードに対応する時間領域アップミックス処理方式を使用することによって、現在のフレームにおけるデコードされたプライマリ及びセカンダリチャンネル信号に対して時間領域アップミックス処理を実行する。反相関から相関信号デコーディングへの切り換えモードに対応する時間領域アップミックス処理方式は、反相関信号チャンネル組み合わせスキームから相関信号チャンネル組み合わせスキームへの移行に対応する時間領域アップミックス処理方式である。

上述のソリューションにおいては、現在のフレームのためのチャンネル組み合わせスキームは、決定される必要があり、これは、現在のフレームのためのチャンネル組み合わせスキームについて複数の可能性があることを示していることが理解され得る。ただ１つのチャンネル組み合わせスキームしかない従来のソリューションと比較して、複数の可能なチャンネル組み合わせスキームを有するこのソリューションは、複数の可能なシナリオとより相性が良く、調和することができる。上述のソリューションにおいては、現在のフレームのデコーディングモードは、以前のフレームのためのチャンネル組み合わせスキーム及び現在のフレームのためのチャンネル組み合わせスキームに基づいて、決定される必要があり、現在のフレームのデコーディングモードについて複数の可能性がある。ただ１つのデコーディングモードしかない従来のソリューションと比較して、複数の可能なデコーディングモードを有するこのソリューションは、複数の可能なシナリオとより相性が良く、調和することができる。

さらに、デコーディング装置は、現在のフレームにおける再構成された左及び右チャンネル信号を取得するために、現在のフレームのデコーディングモードに対応する時間領域アップミックス処理に基づいて、現在のフレームにおけるデコードされたプライマリ及びセカンダリチャンネル信号に対して時間領域アップミックス処理を実行する。

以下では、例を使用して、エンコーディング装置によって現在のフレームのためのチャンネル組み合わせスキームを決定するいくつかの具体的な実装について説明する。エンコーディング装置によって現在のフレームのためのチャンネル組み合わせスキームを決定する様々な具体的な実装が、存在する。

例えば、いくつかの可能な実装においては、現在のフレームのためのチャンネル組み合わせスキームを決定することは、現在のフレームのためのチャンネル組み合わせスキームを決定するために、少なくとも１回、現在のフレームのためのチャンネル組み合わせスキーム判定を実行することを含み得る。

具体的には、例えば、現在のフレームのためのチャンネル組み合わせスキームを決定することは、現在のフレームのための初期チャンネル組み合わせスキームを決定するために、現在のフレームのための初期チャンネル組み合わせスキーム判定を実行することと、現在のフレームのためのチャンネル組み合わせスキームを決定するために、現在のフレームのための初期チャンネル組み合わせスキームに基づいて、現在のフレームのためのチャンネル組み合わせスキーム修正判定を実行することとを含む。加えて、現在のフレームのための初期チャンネル組み合わせスキームは、現在のフレームのためのチャンネル組み合わせスキームとして直接的に使用されてもまたよい。言い換えると、現在のフレームのためのチャンネル組み合わせスキームは、現在のフレームのための初期チャンネル組み合わせスキーム判定が実行された後に決定される、現在のフレームのための初期チャンネル組み合わせスキームであり得る。

例えば、現在のフレームのための初期チャンネル組み合わせスキーム判定を実行することは、現在のフレームにおける左及び右チャンネル信号を使用することによって、現在のフレームにおけるステレオ信号の同位相／逆位相の信号タイプを決定することと、現在のフレームにおけるステレオ信号の同位相／逆位相の信号タイプ、及び以前のフレームのためのチャンネル組み合わせスキームに基づいて、現在のフレームのための初期チャンネル組み合わせスキームを決定することとを含み得る。現在のフレームにおけるステレオ信号の同位相／逆位相の信号タイプは、同位相に近い信号、又は逆位相に近い信号であり得る。現在のフレームにおけるステレオ信号の同位相／逆位相の信号タイプは、現在のフレームの同位相／逆位相の信号タイプフラグ（例えば、同位相／逆位相の信号タイプフラグは、ｔｍｐ＿ＳＭ＿ｆｌａｇによって表される）によって示され得る。具体的には、例えば、現在のフレームの同位相／逆位相の信号タイプフラグの値が、「１」であるとき、それは、現在のフレームにおけるステレオ信号の同位相／逆位相の信号タイプが、同位相に近い信号であることを示し、若しくは現在のフレームの同位相／逆位相の信号タイプフラグの値が、「０」であるとき、それは、現在のフレームにおけるステレオ信号の同位相／逆位相の信号タイプが、逆位相に近い信号であることを示し、又はそれの反対である。

オーディオフレーム（例えば、以前のフレーム又は現在のフレーム）のためのチャンネル組み合わせスキームは、オーディオフレームのチャンネル組み合わせスキームフラグによって示され得る。例えば、オーディオフレームのチャンネル組み合わせスキームフラグの値が、「０」であるとき、それは、オーディオフレームのためのチャンネル組み合わせスキームが、相関信号チャンネル組み合わせスキームであることを示し、若しくはオーディオフレームのチャンネル組み合わせスキームフラグの値が、「１」であるとき、それは、オーディオフレームのためのチャンネル組み合わせスキームが、反相関信号チャンネル組み合わせスキームであることを示し、又はそれの反対である。

同様に、オーディオフレーム（例えば、以前のフレーム又は現在のフレーム）のための初期チャンネル組み合わせスキームは、オーディオフレームの初期チャンネル組み合わせスキームフラグ（例えば、初期チャンネル組み合わせスキームフラグは、ｔｄｍ＿ＳＭ＿ｆｌａｇ＿ｌｏｃによって表される）によって示され得る。例えば、オーディオフレームの初期チャンネル組み合わせスキームフラグの値が、「０」であるとき、それは、オーディオフレームのための初期チャンネル組み合わせスキームが、相関信号チャンネル組み合わせスキームであることを示し、若しくは、別の例について、オーディオフレームの初期チャンネル組み合わせスキームフラグの値が、「１」であるとき、それは、オーディオフレームのための初期チャンネル組み合わせスキームが、反相関信号チャンネル組み合わせスキームであることを示し、又はそれの反対である。

現在のフレームにおける左及び右チャンネル信号を使用することによって、現在のフレームにおけるステレオ信号の同位相／逆位相の信号タイプを決定することは、現在のフレームにおける左及び右チャンネル信号間の相関値ｘｏｒｒを算出することと、ｘｏｒｒが、第１の閾値以下であるとき、現在のフレームにおけるステレオ信号の同位相／逆位相の信号タイプは、同位相に近い信号であると決定すること、又はｘｏｒｒが、第１の閾値よりも大きいとき、現在のフレームにおけるステレオ信号の同位相／逆位相の信号タイプは、逆位相に近い信号であると決定することとを含み得る。さらに、現在のフレームにおけるステレオ信号の同位相／逆位相の信号タイプを示すために、現在のフレームの同位相／逆位相の信号タイプフラグが、使用される場合、現在のフレームにおけるステレオ信号の同位相／逆位相の信号タイプが同位相に近い信号であると決定されたとき、現在のフレームの同位相／逆位相の信号タイプフラグの値は、現在のフレームにおけるステレオ信号の同位相／逆位相の信号タイプが、同位相に近い信号であることを示すように設定され得るし、又は現在のフレームにおけるステレオ信号の同位相／逆位相の信号タイプが逆位相に近い信号であると決定されたとき、現在のフレームの同位相／逆位相の信号タイプフラグの値は、現在のフレームにおけるステレオ信号の同位相／逆位相の信号タイプが、逆位相に近い信号であることを示すように設定され得る。

第１の閾値の値範囲は、例えば、（０．５，１．０）であり得るし、第１の閾値は、例えば、０．５、０．８５、０．７５、０．６５、又は０．８１に等しくてよい。

具体的には、例えば、オーディオフレーム（例えば、以前のフレーム若しくは現在のフレーム）の同位相／逆位相の信号タイプフラグの値が、「０」であるとき、それは、オーディオフレームのステレオ信号の同位相／逆位相の信号タイプが、同位相に近い信号であることを示し、若しくはオーディオフレーム（例えば、以前のフレーム若しくは現在のフレーム）の同位相／逆位相の信号タイプフラグの値が、「１」であるとき、それは、オーディオフレームのステレオ信号の同位相／逆位相の信号タイプが、逆位相に近い信号であることを示し、又はそれの反対である。

例えば、現在のフレームにおけるステレオ信号の同位相／逆位相の信号タイプ、及び以前のフレームのためのチャンネル組み合わせスキームに基づいて、現在のフレームのための初期チャンネル組み合わせスキームを決定することは、
現在のフレームにおけるステレオ信号の同位相／逆位相の信号タイプが、同位相に近い信号であり、以前のフレームのためのチャンネル組み合わせスキームが、相関信号チャンネル組み合わせスキームであるとき、現在のフレームのための初期チャンネル組み合わせスキームは、相関信号チャンネル組み合わせスキームであると決定すること、若しくは現在のフレームにおけるステレオ信号の同位相／逆位相の信号タイプが、逆位相に近い信号であり、以前のフレームのためのチャンネル組み合わせスキームが、反相関信号チャンネル組み合わせスキームであるとき、現在のフレームのための初期チャンネル組み合わせスキームは、反相関信号チャンネル組み合わせスキームであると決定すること、又は
現在のフレームにおけるステレオ信号の同位相／逆位相の信号タイプが、同位相に近い信号であり、以前のフレームのためのチャンネル組み合わせスキームが、反相関信号チャンネル組み合わせスキームであるとき、現在のフレームにおける左及び右チャンネル信号の信号対雑音比が、ともに、第２の閾値よりも小さい場合、現在のフレームのための初期チャンネル組み合わせスキームは、相関信号チャンネル組み合わせスキームであると決定すること、若しくは現在のフレームにおける左チャンネル信号の信号対雑音比及び／若しくは右チャンネル信号の信号対雑音比が、第２の閾値以上である場合、現在のフレームのための初期チャンネル組み合わせスキームは、反相関信号チャンネル組み合わせスキームであると決定すること、又は
現在のフレームにおけるステレオ信号の同位相／逆位相の信号タイプが、逆位相に近い信号であり、以前のフレームのためのチャンネル組み合わせスキームが、相関信号チャンネル組み合わせスキームであるとき、現在のフレームにおける左及び右チャンネル信号の信号対雑音比が、ともに、第２の閾値よりも小さい場合、現在のフレームのための初期チャンネル組み合わせスキームは、反相関信号チャンネル組み合わせスキームであると決定すること、若しくは現在のフレームにおける左チャンネル信号の信号対雑音比及び／若しくは右チャンネル信号の信号対雑音比が、第２の閾値以上である場合、現在のフレームのための初期チャンネル組み合わせスキームは、相関信号チャンネル組み合わせスキームであると決定すること
を含み得る。

第２の閾値の値範囲は、例えば、［０．８，１．２］であり得るし、第２の閾値は、例えば、０．８、０．８５、０．９、１、１．１、又は１．１８に等しくてよい。

現在のフレームのための初期チャンネル組み合わせスキームに基づいて、現在のフレームのためのチャンネル組み合わせスキーム修正判定を実行することは、以前のフレームのチャンネル組み合わせ比係数修正フラグ、現在のフレームにおけるステレオ信号の同位相／逆位相の信号タイプ、及び現在のフレームのための初期チャンネル組み合わせスキームに基づいて、現在のフレームのためのチャンネル組み合わせスキームを決定することを含み得る。

現在のフレームのためのチャンネル組み合わせスキームフラグは、ｔｄｍ＿ＳＭ＿ｆｌａｇと表記され得るし、現在のフレームのチャンネル組み合わせ比係数修正フラグは、ｔｄｍ＿ＳＭ＿ｍｏｄｉ＿ｆｌａｇと表記される。例えば、チャンネル組み合わせ比係数修正フラグの値が、０であるとき、それは、チャンネル組み合わせ比係数が、修正される必要がないことを示し、又はチャンネル組み合わせ比係数修正フラグの値が、１であるとき、それは、チャンネル組み合わせ比係数が、修正される必要があることを示す。もちろん、チャンネル組み合わせ比係数が、修正される必要があるかどうかを示すために、他の異なる値が、チャンネル組み合わせ比係数修正フラグとして使用されてよい。

具体的には、例えば、現在のフレームのための初期チャンネル組み合わせスキーム判定の結果に基づいて、現在のフレームのためのチャンネル組み合わせスキーム修正判定を実行することは、
以前のフレームのチャンネル組み合わせ比係数修正フラグが、チャンネル組み合わせ比係数が修正される必要があることを示す場合、現在のフレームのためのチャンネル組み合わせスキームとして、反相関信号チャンネル組み合わせスキームを使用すること、又は以前のフレームのチャンネル組み合わせ比係数修正フラグが、チャンネル組み合わせ比係数が修正される必要がないことを示す場合、現在のフレームが切り換え条件を満たすかどうかを決定し、現在のフレームが切り換え条件を満たすかどうかについての決定の結果に基づいて、現在のフレームのためのチャンネル組み合わせスキームを決定すること
を含み得る。

現在のフレームが切り換え条件を満たすかどうかについての決定の結果に基づいて、現在のフレームのためのチャンネル組み合わせスキームを決定することは、
以前のフレームのためのチャンネル組み合わせスキームが、現在のフレームのための初期チャンネル組み合わせスキームと異なり、現在のフレームが、切り換え条件を満たし、現在のフレームのための初期チャンネル組み合わせスキームが、相関信号チャンネル組み合わせスキームであり、以前のフレームのためのチャンネル組み合わせスキームが、反相関信号チャンネル組み合わせスキームであるとき、現在のフレームのためのチャンネル組み合わせスキームは、反相関信号チャンネル組み合わせスキームであると決定すること、又は
以前のフレームのためのチャンネル組み合わせスキームが、現在のフレームのための初期チャンネル組み合わせスキームと異なり、現在のフレームが、切り換え条件を満たし、現在のフレームのための初期チャンネル組み合わせスキームが、反相関信号チャンネル組み合わせスキームであり、以前のフレームのためのチャンネル組み合わせスキームが、相関信号チャンネル組み合わせスキームであり、以前のフレームのチャンネル組み合わせ比係数が、第１の比係数閾値よりも小さいとき、現在のフレームのためのチャンネル組み合わせスキームは、相関信号チャンネル組み合わせスキームであると決定すること、又は
以前のフレームのためのチャンネル組み合わせスキームが、現在のフレームのための初期チャンネル組み合わせスキームと異なり、現在のフレームが、切り換え条件を満たし、現在のフレームのための初期チャンネル組み合わせスキームが、反相関信号チャンネル組み合わせスキームであり、以前のフレームのためのチャンネル組み合わせスキームが、相関信号チャンネル組み合わせスキームであり、以前のフレームのチャンネル組み合わせ比係数が、第１の比係数閾値以上であるとき、現在のフレームのためのチャンネル組み合わせスキームは、反相関信号チャンネル組み合わせスキームであると決定すること、又は
現在まで（Ｐ－１）番目のフレーム（（Ｐ－１）ｔｈ－ｔｏ－ｃｕｒｒｅｎｔｆｒａｍｅ）のためのチャンネル組み合わせスキームが、現在までＰ番目のフレーム（Ｐｔｈ－ｔｏ－ｃｕｒｒｅｎｔｆｒａｍｅ）のための初期チャンネル組み合わせスキームと異なり、現在までＰ番目のフレームが、切り換え条件を満たさず、現在のフレームが、切り換え条件を満たし、現在のフレームにおけるステレオ信号の同位相／逆位相の信号タイプが、同位相に近い信号であり、現在のフレームのための初期チャンネル組み合わせスキームが、相関信号チャンネル組み合わせスキームであり、以前のフレームのためのチャンネル組み合わせスキームが、反相関信号チャンネル組み合わせスキームであるとき、現在のフレームのためのチャンネル組み合わせスキームは、相関信号チャンネル組み合わせスキームであると決定すること、又は
現在まで（Ｐ－１）番目のフレームのためのチャンネル組み合わせスキームが、現在までＰ番目のフレームのための初期チャンネル組み合わせスキームと異なり、現在までＰ番目のフレームが、切り換え条件を満たさず、現在のフレームが、切り換え条件を満たし、現在のフレームにおけるステレオ信号の同位相／逆位相の信号タイプが、逆位相に近い信号であり、現在のフレームのための初期チャンネル組み合わせスキームが、反相関信号チャンネル組み合わせスキームであり、以前のフレームのためのチャンネル組み合わせスキームが、相関信号チャンネル組み合わせスキームであり、以前のフレームのチャンネル組み合わせ比係数が、第２の比係数閾値よりも小さいとき、現在のフレームのためのチャンネル組み合わせスキームは、相関信号チャンネル組み合わせスキームであると決定すること、又は
現在まで（Ｐ－１）番目のフレームのためのチャンネル組み合わせスキームが、現在までＰ番目のフレームのための初期チャンネル組み合わせスキームと異なり、現在までＰ番目のフレームが、切り換え条件を満たさず、現在のフレームが、切り換え条件を満たし、現在のフレームにおけるステレオ信号の同位相／逆位相の信号タイプが、逆位相に近い信号であり、現在のフレームのための初期チャンネル組み合わせスキームが、反相関信号チャンネル組み合わせスキームであり、以前のフレームのためのチャンネル組み合わせスキームが、相関信号チャンネル組み合わせスキームであり、以前のフレームのチャンネル組み合わせ比係数が、第２の比係数閾値以上であるとき、現在のフレームのためのチャンネル組み合わせスキームは、反相関信号チャンネル組み合わせスキームであると決定すること
を含み得る。

本明細書において、Ｐは、１よりも大きい整数であり得る。例えば、Ｐは、２、３、４、５、６、又は別の値に等しくてよい。

第１の比係数閾値の値範囲は、例えば、［０．４，０．６］であり得るし、第１の比係数閾値は、例えば、０．４、０．４５、０．５、０．５５、又は０．６に等しくてよい。

第２の比係数閾値の値範囲は、例えば、［０．４，０．６］であり得るし、第２の比係数閾値は、例えば、０．４、０．４６、０．５、０．５６、又は０．６に等しくてよい。

いくつかの可能な実装においては、現在のフレームが切り換え条件を満たすかどうかを決定することは、以前のフレームにおけるプライマリチャンネル信号のフレームタイプ、及び／又は以前のフレームにおけるセカンダリチャンネル信号のフレームタイプに基づいて、現在のフレームが切り換え条件を満たすかどうかを決定することを含み得る。

いくつかの可能な実装においては、現在のフレームが切り換え条件を満たすかどうかを決定することは、
第１の条件、第２の条件、及び第３の条件が、全て満たされるとき、現在のフレームは、切り換え条件を満たすと決定すること、又は第２の条件、第３の条件、第４の条件、及び第５の条件が、全て満たされるとき、現在のフレームは、切り換え条件を満たすと決定すること、又は第６の条件が、満たされるとき、現在のフレームは、切り換え条件を満たすと決定すること
を含み得る。

第１の条件は、以前のフレームの以前のフレームにおけるプライマリチャンネル信号のフレームタイプが、以下のうちの、即ち、ＶＯＩＣＥＤ＿ＣＬＡＳフレーム（有声フレーム若しくは有声開始フレームの後に続く有声特徴を有するフレーム）、ＯＮＳＥＴフレーム（有声開始フレーム）、ＳＩＮ＿ＯＮＳＥＴフレーム（ハーモニックとノイズが混合された開始フレーム）、ＩＮＡＣＴＩＶＥ＿ＣＬＡＳフレーム（非アクティブ特徴を有するフレーム）、及びＡＵＤＩＯ＿ＣＬＡＳ（オーディオフレーム）のうちのいずれか１つであり、以前のフレームにおけるプライマリチャンネル信号のフレームタイプが、ＵＮＶＯＩＣＥＤ＿ＣＬＡＳフレーム（いくつかの特徴のうちの１つ、即ち、無声、非アクティブ、ノイズ、若しくは有声で終了させられるフレーム）、若しくはＶＯＩＣＥＤ＿ＴＲＡＮＳＩＴＩＯＮフレーム（有声音の後の移行を有するフレーム、フレームは、きわめて弱い有声特徴を有する）であること、又は以前のフレームの以前のフレームにおけるセカンダリチャンネル信号のフレームタイプが、以下のうちの、即ち、ＶＯＩＣＥＤ＿ＣＬＡＳフレーム、ＯＮＳＥＴフレーム、ＳＩＮ＿ＯＮＳＥＴフレーム、ＩＮＡＣＴＩＶＥ＿ＣＬＡＳフレーム、及びＡＵＤＩＯ＿ＣＬＡＳフレームのうちのいずれか１つであり、以前のフレームにおけるセカンダリチャンネル信号のフレームタイプが、ＵＮＶＯＩＣＥＤ＿ＣＬＡＳフレーム、若しくはＶＯＩＣＥＤ＿ＴＲＡＮＳＩＴＩＯＮフレームであることである。

第２の条件は、以前のフレームにおけるプライマリチャンネル信号及びセカンダリチャンネル信号の原符号化モード（ｒａｗｃｏｄｉｎｇｍｏｄｅ）が、どちらもＶＯＩＣＥＤ（有声フレームに対応する符号化タイプ）でないことである。

第３の条件は、以前のフレームによって使用されたチャンネル組み合わせスキームを使用する、以前のフレームの前の連続するフレームの量が、事前設定されたフレーム量閾値よりも大きいことである。フレーム量閾値の値範囲は、例えば、［３，１０］であり得る。例えば、フレーム量閾値は、３、４、５、６、７、８、９、又は別の値に等しくてよい。

第４の条件は、以前のフレームにおけるプライマリチャンネル信号のフレームタイプが、ＵＮＶＯＩＣＥＤ＿ＣＬＡＳであること、又は以前のフレームにおけるセカンダリチャンネル信号のフレームタイプが、ＵＮＶＯＩＣＥＤ＿ＣＬＡＳであることである。

第５の条件は、現在のフレームにおける左及び右チャンネル信号の長期２乗平均平方根エネルギー値が、エネルギー閾値よりも小さいことである。エネルギー閾値の値範囲は、例えば、［３００，５００］であり得る。例えば、エネルギー閾値は、３００、４００、４１０、４５１、４８２、５００、４１５、又は別の値に等しくてよい。

第６の条件は、以前のフレームにおけるプライマリチャンネル信号のフレームタイプが、音楽信号であり、以前のフレームにおけるプライマリチャンネル信号のより高い周波数バンドのエネルギーに対するより低い周波数バンドのエネルギーの比が、第１のエネルギー比閾値よりも大きく、以前のフレームにおけるセカンダリチャンネル信号のより高い周波数バンドのエネルギーに対するより低い周波数バンドのエネルギーの比が、第２のエネルギー比閾値よりも大きいことである。

第１のエネルギー比閾値の範囲は、例えば、［４０００，６０００］であり得る。例えば、第１のエネルギー比閾値は、４０００、４５００、５０００、５１０５、５２００、６０００、５８００、又は別の値に等しくてよい。

第２のエネルギー比閾値の範囲は、例えば、［４０００，６０００］であり得る。例えば、第２のエネルギー比閾値は、４０００、４５０１、５０００、５１０５、５２００、６０００、５８００、又は別の値に等しくてよい。

現在のフレームが切り換え条件を満たすかどうかを決定する様々な実装が、あり得るが、それらは、上で例として与えられた方式に限定されないことが理解され得る。

現在のフレームのためのチャンネル組み合わせスキームを決定するいくつかの実装が、上述の例において提供されたが、実際の適用は、上述の例における方式に限定されなくてよいことが理解され得る。

以下では、さらに、例を使用して、反相関信号符号化モードのためのシナリオについて説明する。

図４を参照すると、本出願の実施形態は、オーディオエンコーディング方法を提供する。オーディオエンコーディング方法の関連ステップは、エンコーディング装置によって実施され得るし、方法は、具体的には、以下のステップを含み得る。

４０１．現在のフレームの符号化モードを決定する。

４０２．現在のフレームの符号化モードが反相関信号符号化モードであると決定されたとき、現在のフレームにおけるプライマリ及びセカンダリチャンネル信号を取得するために、反相関信号符号化モードに対応する時間領域ダウンミックス処理方式を使用することによって、現在のフレームにおける左及び右チャンネル信号に対して時間領域ダウンミックス処理を実行する。

４０３．現在のフレームにおける取得されたプライマリ及びセカンダリチャンネル信号をエンコードする。

反相関信号符号化モードに対応する時間領域ダウンミックス処理方式は、反相関信号チャンネル組み合わせスキームに対応する時間領域ダウンミックス処理方式であり、反相関信号チャンネル組み合わせスキームは、逆位相に近い信号に対応するチャンネル組み合わせスキームである。

である。

本明細書において、ｆａｄｅ＿ｉｎ（ｎ）は、フェードイン係数を示す。例えば、

ｆａｄｅ＿ｏｕｔ（ｎ）は、フェードアウト係数を示す。例えば、

ＮＯＶＡ＿１は、移行処理長を示す。ＮＯＶＡ＿１の値は、具体的なシナリオ要件に基づいて設定されてよい。例えば、ＮＯＶＡ＿１は、３／Ｎに等しくてよく、又はＮＯＶＡ＿１は、Ｎよりも小さい別の値であってよい。

である。

Ｍ₂₁は、複数の形式、例えば、

又は

を有し得るし、
ｒａｔｉｏは、現在のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数を示す。

Ｍ₂₂は、複数の形式、例えば、

又は

を有し得るし、
α₁＝ｒａｔｉｏ＿ＳＭ、α₂＝１－ｒａｔｉｏ＿ＳＭであり、ｒａｔｉｏ＿ＳＭは、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数を示す。

Ｍ₁₂は、複数の形式、例えば、

又は

を有し得るし、
α_{1_pre}＝ｔｄｍ＿ｌａｓｔ＿ｒａｔｉｏ＿ＳＭ、α_{2_pre}＝１－ｔｄｍ＿ｌａｓｔ＿ｒａｔｉｏ＿ＳＭであり、ｔｄｍ＿ｌａｓｔ＿ｒａｔｉｏ＿ＳＭは、以前のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数を示す。

具体的には、例えば、

又は

であり、

は、現在のフレームにおける元の左及び右チャンネル信号を示し、

は、現在のフレームにおける時間領域前処理を施された左及び右チャンネル信号を示し、

は、現在のフレームにおける遅延アラインメント処理を施された左及び右チャンネル信号を示す。

これに対応して、以下では、例を使用して、反相関信号デコーディングモードのためのシナリオについて説明する。

図５を参照すると、本出願の実施形態は、オーディオデコーディング方法をさらに提供する。オーディオデコーディング方法の関連ステップは、デコーディング装置によって実施得るし、方法は、具体的には、以下のステップを含むことがある。

５０１．現在のフレームにおけるデコードされたプライマリ及びセカンダリチャンネル信号を取得するために、ビットストリームに基づいたデコーディングを実行する。

５０２．現在のフレームのデコーディングモードを決定する。

ステップ５０１及びステップ５０２を実行するための必要な順序はないことが理解され得る。

５０３．現在のフレームのデコーディングモードが反相関信号デコーディングモードであると決定されたとき、現在のフレームにおける再構成された左及び右チャンネル信号を取得するために、反相関信号デコーディングモードに対応する時間領域アップミックス処理方式を使用することによって、現在のフレームにおけるデコードされたプライマリ及びセカンダリチャンネル信号に対して時間領域アップミックス処理を実行する。

再構成された左及び右チャンネル信号は、デコードされた左及び右チャンネル信号であってよく、又は、遅延調整処理及び／若しくは時間領域後処理が、デコードされた左及び右チャンネル信号を取得するために、再構成された左及び右チャンネル信号に対して実行されてよい。

現在のフレームのデコーディングモードは、複数のデコーディングモードのうちの１つであってよい。例えば、現在のフレームのデコーディングモードは、以下のデコーディングモード、即ち、相関信号デコーディングモード、反相関信号デコーディングモード、相関から反相関信号デコーディングへの切り換えモード、及び反相関から相関信号デコーディングへの切り換えモード、のうちの１つであってよい。

上述のソリューションにおいては、現在のフレームのデコーディングモードは、決定される必要があり、これは、現在のフレームのデコーディングモードのための複数の可能性があることを示していることが理解され得る。１つのデコーディングモードのみがある従来のソリューションと比較して、複数の可能なデコーディングモードを有するこのソリューションは、複数の可能なシナリオとより相性が良く、調和することができる。加えて、逆位相に近い信号に対応するチャンネル組み合わせスキームが導入されるので、現在のフレームにおけるステレオ信号が逆位相に近い信号であるとき、より目標に合ったチャンネル組み合わせスキーム及びデコーディングモードがあり、これは、デコーディング品質を改善する助けになる。

いくつかの可能な実装においては、方法は、
現在のフレームのデコーディングモードが相関信号デコーディングモードであると決定されたとき、現在のフレームにおける再構成された左及び右チャンネル信号を取得するために、相関信号デコーディングモードに対応する時間領域アップミックス処理方式を使用することによって現在のフレームにおけるデコードされたプライマリ及びセカンダリチャンネル信号に対して時間領域アップミックス処理を実行することであって、相関信号デコーディングモードに対応する時間領域アップミックス処理方式は、相関信号チャンネル組み合わせスキームに対応する時間領域アップミックス処理方式であり、相関信号チャンネル組み合わせスキームは、同位相に近い信号に対応するチャンネル組み合わせスキームである、実行すること
をさらに含むことがある。

いくつかの可能な実装においては、方法は、現在のフレームのデコーディングモードが、相関から反相関信号デコーディングへの切り換えモードであると決定されたとき、現在のフレームにおける再構成された左及び右チャンネル信号を取得するために、相関から反相関信号デコーディングへの切り換えモードに対応する時間領域アップミックス処理方式を使用することによって、現在のフレームにおけるデコードされたプライマリ及びセカンダリチャンネル信号に対して時間領域アップミックス処理を実行することであって、相関から反相関信号デコーディングへの切り換えモードに対応する時間領域アップミックス処理方式は、相関信号チャンネル組み合わせスキームから反相関信号チャンネル組み合わせスキームへの移行に対応する時間領域アップミックス処理方式である、実行することをさらに含むことがある。

いくつかの可能な実装においては、方法は、現在のフレームのデコーディングモードが、反相関から相関信号デコーディングへの切り換えモードであると決定されたとき、現在のフレームにおける再構成された左及び右チャンネル信号を取得するために、反相関から相関信号デコーディングへの切り換えモードに対応する時間領域アップミックス処理方式を使用することによって、現在のフレームにおけるデコードされたプライマリ及びセカンダリチャンネル信号に対して時間領域アップミックス処理を実行することであって、反相関から相関信号デコーディングへの切り換えモードに対応する時間領域アップミックス処理方式は、反相関信号チャンネル組み合わせスキームから相関信号チャンネル組み合わせスキームへの移行に対応する時間領域アップミックス処理方式である、実行することをさらに含むことがある。

異なるデコーディングモードに対応する時間領域アップミックス処理方式は通常、異なることが理解されることができる。加えて、各デコーディングモードは、１つ又は複数の時間領域アップミックス処理方式に対応し得る。

例えば、いくつかの可能な実装においては、現在のフレームにおける再構成された左及び右チャンネル信号を取得するために、反相関信号デコーディングモードに対応する時間領域アップミックス処理方式を使用することによって、現在のフレームにおけるデコードされたプライマリ及びセカンダリチャンネル信号に対して時間領域アップミックス処理を実行することは、
現在のフレームにおける再構成された左及び右チャンネル信号を取得するために、現在のフレームのための反相関信号チャンネル組み合わせスキームのチャンネル組み合わせ比係数に基づいて現在のフレームにおけるデコードされたプライマリ及びセカンダリチャンネル信号に対して時間領域アップミックス処理を実行すること、又は、現在のフレームにおける再構成された左及び右チャンネル信号を取得するために、現在のフレームのための反相関信号チャンネル組み合わせスキームのチャンネル組み合わせ比係数及び以前のフレームのための反相関信号チャンネル組み合わせスキームのチャンネル組み合わせ比係数に基づいて、現在のフレームにおけるデコードされたプライマリ及びセカンダリチャンネル信号に対して時間領域アップミックス処理を実行すること
を含む。

いくつかの可能な実装においては、対応するアップミックス行列は、オーディオフレームのチャンネル組み合わせ比係数に基づいて構築されることがあり、時間領域アップミックス処理が、現在のフレームにおける再構成された左及び右チャンネル信号を取得するために、チャンネル組み合わせスキームに対応するアップミックス行列を使用することによって、現在のフレームにおけるデコードされたプライマリ及びセカンダリチャンネル信号に対して実行される。

例えば、時間領域アップミックス処理が、現在のフレームにおける再構成された左及び右チャンネル信号を取得するために、現在のフレームのための反相関信号チャンネル組み合わせスキームのチャンネル組み合わせ比係数に基づいて現在のフレームにおけるデコードされたプライマリ及びセカンダリチャンネル信号に対して実行されるとき、

である。

別の例について、時間領域アップミックス処理が、現在のフレームにおける再構成された左及び右チャンネル信号を取得するために、現在のフレームのための反相関信号チャンネル組み合わせスキームのチャンネル組み合わせ比係数及び以前のフレームのための反相関信号チャンネル組み合わせスキームのチャンネル組み合わせ比係数に基づいて現在のフレームにおけるデコードされたプライマリ及びセカンダリチャンネル信号に対して実行されるとき、
０≦ｎ＜Ｎ－ｕｐｍｉｘｉｎｇ＿ｄａｌｙである場合、

であり、又は
Ｎ－ｕｐｍｉｘｉｎｇ＿ｄａｌｙ≦ｎ＜Ｎである場合、

であり、
Ｎ－ｕｐｍｉｘｉｎｇ＿ｄａｌｙ≦ｎ＜Ｎ－ｕｐｍｉｘｉｎｇ＿ｄａｌｙ＋ＮＯＶＡ＿１である場合

であり、又は
Ｎ－ｕｐｍｉｘｉｎｇ＿ｄａｌｙ＋ＮＯＶＡ＿１≦ｎ＜Ｎである場合

である。

本明細書において、

ＮＯＶＡ＿１は、移行処理長を示す。

ｆａｄｅ＿ｉｎ（ｎ）は、フェードイン係数を示す。例えば、

ＮＯＶＡ＿１は、移行処理長を示す。ＮＯＶＡ＿１の値は、具体的なシナリオ要件に基づいて設定されてよい。例えば、ＮＯＶＡ＿１は３／Ｎに等しくてもよく、ＮＯＶＡ＿１は、Ｎよりも小さい別の値であってもよい。

別の例について、時間領域アップミックス処理が、現在のフレームにおける再構成された左及び右チャンネル信号を取得するために、現在のフレームのための相関信号チャンネル組み合わせスキームのチャンネル組み合わせ比係数に基づいて現在のフレームにおけるデコードされたプライマリ及びセカンダリチャンネル信号に対して実行されるとき、

である。

上述の例において、

は、現在のフレームにおける再構成された左チャンネル信号を示す。

は、現在のフレームにおける再構成された右チャンネル信号を示す。

は、現在のフレームにおけるデコードされたプライマリチャンネル信号を示す。

上記の例について、ｎは、サンプリング点の番号を示す。例えば、ｎ＝０，１，…，Ｎ－１である。

は、複数の形式、例えば、

又は

を有することがあり、ここで、
α₁＝ｒａｔｉｏ＿ＳＭ、α₂＝１－ｒａｔｉｏ＿ＳＭであり、ｒａｔｉｏ＿ＳＭは、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数を示す。

は、複数の形式、例えば、

又は

を有することがあり、ここで、
α_{1_pre}＝ｔｄｍ＿ｌａｓｔ＿ｒａｔｉｏ＿ＳＭ、α_{2_pre}＝１－ｔｄｍ＿ｌａｓｔ＿ｒａｔｉｏ＿ＳＭであり、
ｔｄｍ＿ｌａｓｔ＿ｒａｔｉｏ＿ＳＭは、以前のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数を示す。

は、複数の形式、例えば、

又は

を有することがあり、ここで、
ｒａｔｉｏは、現在のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数を示す。

以下は、例を使用して、相関から反相関信号符号化への切り換えモード及び反相関から相関信号符号化への切り換えモードのためのシナリオについて説明する。相関から反相関信号符号化への切り換えモード及び反相関から相関信号符号化への切り換えモードに対応する時間領域ダウンミックス処理方式は、例えば、セグメント化された時間領域ダウンミックス処理方式である。

図６を参照すると、本出願の実施形態は、オーディオエンコーディング方法を提供する。オーディオエンコーディング方法の関連ステップは、エンコーディング装置によって実施されてよく、方法は、具体的には、以下のステップを含むことがある。

６０１．現在のフレームのためのチャンネル組み合わせスキームを決定する。

６０２．現在のフレームのためのチャンネル組み合わせスキームが、以前のフレームのためのチャンネル組み合わせスキームとは異なるとき、現在のフレームにおけるプライマリ及びセカンダリチャンネル信号を取得するために、現在のフレームのためのチャンネル組み合わせスキーム及び以前のフレームのためのチャンネル組み合わせスキームに基づいて現在のフレームにおける左及び右チャンネル信号に対してセグメント化された時間領域ダウンミックス処理を実行する。

６０３．現在のフレームにおける取得されたプライマリ及びセカンダリチャンネル信号をエンコードする。

現在のフレームのためのチャンネル組み合わせスキームが、以前のフレームのためのチャンネル組み合わせスキームとは異なる場合、それは、現在のフレームの符号化モードが、相関から反相関信号符号化への切り換えモード又は反相関から相関信号符号化への切り換えモードであると決定されてよい。現在のフレームの符号化モードが、相関から反相関信号符号化への切り換えモード又は反相関から相関信号符号化への切り換えモードである場合、例えば、セグメント化された時間領域ダウンミックス処理が、現在のフレームのためのチャンネル組み合わせスキーム及び以前のフレームのためのチャンネル組み合わせスキームに基づいて、現在のフレームにおける左及び右チャンネル信号に対して実行されることがある。

具体的には、例えば、以前のフレームのためのチャンネル組み合わせスキームが相関信号チャンネル組み合わせスキームであり、現在のフレームのためのチャンネル組み合わせスキームが反相関信号チャンネル組み合わせスキームであるとき、現在のフレームの符号化モードが相関から反相関信号符号化への切り換えモードであると決定されることがある。別の例について、以前のフレームのためのチャンネル組み合わせスキームが反相関信号チャンネル組み合わせスキームであり、現在のフレームのためのチャンネル組み合わせスキームが相関信号チャンネル組み合わせスキームであるとき、現在のフレームの符号化モードが反相関から相関信号符号化への切り換えモードであると決定されることがある。残りは、類推によって推測されることができる。

セグメント化された時間領域ダウンミックス処理は、現在のフレームにおける左及び右チャンネル信号が少なくとも２つのセグメントに分割されると理解されてよく、異なる時間領域ダウンミックス処理方式は、各セグメントが時間領域ダウンミックス処理を実行するために使用される。非セグメント化時間領域ダウンミックス処理と比較して、セグメント化された時間領域ダウンミックス処理は、隣接するフレームのためのチャンネル組み合わせスキームが変化するとき、よりスムーズな移行を取得する可能性が高いことが理解されることができる。

上述のソリューションにおいては、現在のフレームのためのチャンネル組み合わせスキームが決定される必要があり、これは、現在のフレームのためのチャンネル組み合わせスキームにについて複数の可能性があることを示していることが理解され得る。ただ１つのチャンネル組み合わせスキームしかない従来のソリューションと比較して、複数の可能なチャンネル組み合わせスキームを有するこのソリューションは、複数の可能なシナリオとより相性が良く、調和することができる。加えて、現在のフレームのためのチャンネル組み合わせスキームと以前のフレームのためのチャンネル組み合わせスキームが異なるとき、現在のフレームにおける左及び右チャンネル信号に対してセグメント化された時間領域ダウンミックス処理を実行するメカニズムが導入される。セグメント化された時間領域ダウンミックス処理メカニズムは、チャンネル組み合わせスキームのスムーズな移行を実施し、さらにエンコーディング品質を改善する助けになる。

加えて、逆位相に近い信号に対応するチャンネル組み合わせスキームが導入されたので、現在のフレームにおけるステレオ信号が逆位相に近い信号であるとき、より目標に合ったチャンネル組み合わせスキーム及び符号化モードが、存在し、これは、エンコーディング品質を改善する助けになる。

例えば、以前のフレームのためのチャンネル組み合わせスキームは、相関信号チャンネル組み合わせスキームであってもよいし、反相関信号チャンネル組み合わせスキームであってもよい。現在のフレームのためのチャンネル組み合わせスキームは、相関信号チャンネル組み合わせスキームであってもよいし、反相関信号チャンネル組み合わせスキームであってもよい。したがって、現在のフレームのためのチャンネル組み合わせスキームと以前のフレームのためのチャンネル組み合わせスキームが異なる、いくつかの可能なケースがある。

具体的には、例えば、以前のフレームのためのチャンネル組み合わせスキームが相関信号チャンネル組み合わせスキームであり、現在のフレームのためのチャンネル組み合わせスキームが反相関信号チャンネル組み合わせスキームであるとき、現在のフレームにおける左及び右チャンネル信号は、左及び右チャンネル信号の開始セグメントと、左及び右チャンネル信号の中間セグメントと、左及び右チャンネル信号の終了セグメントとを含み、現在のフレームにおけるプライマリ及びセカンダリチャンネル信号は、プライマリ及びセカンダリチャンネル信号の開始セグメントと、プライマリ及びセカンダリチャンネル信号の中間セグメントと、プライマリ及びセカンダリチャンネル信号の終了セグメントとを含む。このケースでは、現在のフレームにおけるプライマリ及びセカンダリチャンネル信号を取得するために、現在のフレームのためのチャンネル組み合わせスキーム及び以前のフレームのためのチャンネル組み合わせスキームに基づいて現在のフレームにおける左及び右チャンネル信号に対してセグメント化された時間領域ダウンミックス処理を実行することは、
以前のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数及び以前のフレームのための相関信号チャンネル組み合わせスキームに対応する時間領域ダウンミックス処理方式を使用することによって、現在のフレームにおけるプライマリ及びセカンダリチャンネル信号の開始セグメントを取得するために、現在のフレームにおける左及び右チャンネル信号の開始セグメントに対して時間領域ダウンミックス処理を実行することと、
現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数及び現在のフレームのための反相関信号チャンネル組み合わせスキームに対応する時間領域ダウンミックス処理方式を使用することによって、現在のフレームにおけるプライマリ及びセカンダリチャンネル信号の終了セグメントを取得するために、現在のフレームにおける左及び右チャンネル信号の終了セグメントに対して時間領域ダウンミックス処理を実行することと、
以前のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数及び以前のフレームのための相関信号チャンネル組み合わせスキームに対応する時間領域ダウンミックス処理方式を使用することによって、プライマリ及びセカンダリチャンネル信号の第１の中間セグメントを取得するために、現在のフレームにおける左及び右チャンネル信号の中間セグメントに対して時間領域ダウンミックス処理を実行することと、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数及び現在のフレームのための反相関信号チャンネル組み合わせスキームに対応する時間領域ダウンミックス処理方式を使用することによって、プライマリ及びセカンダリチャンネル信号の第２の中間セグメントを取得するために、現在のフレームにおける左及び右チャンネル信号の中間セグメントに対して時間領域ダウンミックス処理を実行することと、現在のフレームにおけるプライマリ及びセカンダリチャンネル信号の中間セグメントを取得するために、プライマリ及びセカンダリチャンネル信号の第１の中間セグメント並びにプライマリ及びセカンダリチャンネル信号の第２の中間セグメントに対して重み付け和処理を実行することとを含むことがある。

現在のフレームにおける左及び右チャンネル信号の開始セグメント、左及び右チャンネル信号の中間セグメント、並びに左及び右チャンネル信号の終了セグメントの長さは、要件に基づいて設定されることがある。現在のフレームにおける左及び右チャンネル信号の開始セグメント、左及び右チャンネル信号の中間セグメント、及び左及び右チャンネル信号の終了セグメントの長さは、同じであってもよいし、部分的に同じであってもよいし、互いとは異なってもよい。

現在のフレームにおけるプライマリ及びセカンダリチャンネル信号の開始セグメント、プライマリ及びセカンダリチャンネル信号の中間セグメント、並びにプライマリ及びセカンダリチャンネル信号の終了セグメントの長さは、要件に基づいて設定されることがある。現在のフレームにおけるプライマリ及びセカンダリチャンネル信号の開始セグメント、プライマリ及びセカンダリチャンネル信号の中間セグメント、並びにプライマリ及びセカンダリチャンネル信号の終了セグメントの長さは、同じであってもよいし、部分的に同じであってもよいし、互いとは異なってもよい。

重み付け和処理が、プライマリ及びセカンダリチャンネル信号の第１の中間セグメント並びにプライマリ及びセカンダリチャンネル信号の第２の中間セグメントに対して実行されるとき、プライマリ及びセカンダリチャンネル信号の第１の中間セグメントに対応する重み付け率は、プライマリ及びセカンダリチャンネル信号の第２の中間セグメントに対応する重み付け率に等しくてもよいし、これに等しくなくてもよい。

例えば、重み付け和処理が、プライマリ及びセカンダリチャンネル信号の第１の中間セグメント並びにプライマリ及びセカンダリチャンネル信号の第２の中間セグメントに対して実行されるとき、プライマリ及びセカンダリチャンネル信号の第１の中間セグメントに対応する重み付け率はフェードアウト係数であり、プライマリ及びセカンダリチャンネル信号の第２の中間セグメントに対応する重み付け率はフェードイン係数である。

いくつかの可能な実装においては、

ここで、
Ｘ₁₁（ｎ）は現在のフレームにおけるプライマリチャンネル信号の開始セグメントを示し、Ｙ₁₁（ｎ）は現在のフレームにおけるセカンダリチャンネル信号の開始セグメントを示し、Ｘ₃₁（ｎ）は現在のフレームにおけるプライマリチャンネル信号の終了セグメントを示し、Ｙ₃₁（ｎ）は現在のフレームにおけるセカンダリチャンネル信号の終了セグメントを示し、Ｘ₂₁（ｎ）は現在のフレームにおけるプライマリチャンネル信号の中間セグメントを示し、Ｙ₂₁（ｎ）は現在のフレームにおけるセカンダリチャンネル信号の中間セグメントを示し、
Ｘ（ｎ）は現在のフレームにおけるプライマリチャンネル信号を示し、
Ｙ（ｎ）は現在のフレームにおけるセカンダリチャンネル信号を示す。

例えば、

である。

例えば、ｆａｄｅ＿ｉｎ（ｎ）はフェードイン係数を示し、ｆａｄｅ＿ｏｕｔ（ｎ）はフェードアウト係数を示す。例えば、ｆａｄｅ＿ｉｎ（ｎ）とｆａｄｅ＿ｏｕｔ（ｎ）の合計は１である。

具体的には、例えば、

及び

である。もちろん、ｆａｄｅ＿ｉｎ（ｎ）は、或いは、ｎに基づいた別の関数関係のフェードイン係数であってよい。もちろん、ｆａｄｅ＿ｏｕｔ（ｎ）は、或いは、ｎに基づいた別の関数関係のフェードアウト係数であってよい。

本明細書において、ｎは、サンプリング点の番号を示す。ｎ＝０，１，…，Ｎ－１であり、０＜Ｎ₁＜Ｎ₂＜Ｎ－１である。

例えば、Ｎ₁は、１００、１０７、１２０、１５０、又は別の値に等しい。

例えば、Ｎ₂は、１８０、１８７、２００、２０３、又は別の値に等しい。

本明細書において、Ｘ₂₁₁（ｎ）は現在のフレームにおけるプライマリチャンネル信号の第１の中間セグメントを示し、Ｙ₂₁₁（ｎ）は現在のフレームにおけるセカンダリチャンネル信号の第１の中間セグメントを示す。Ｘ₂₁₂（ｎ）は現在のフレームにおけるプライマリチャンネル信号の第２の中間セグメントを示し、Ｙ₂₁₂（ｎ）は現在のフレームにおけるセカンダリチャンネル信号の第２の中間セグメントを示す。

いくつかの可能な実装においては、
Ｎ₁≦ｎ＜Ｎ₂である場合、

であり、
Ｎ₁≦ｎ＜Ｎ₂の場合、

であり、
０≦ｎ＜Ｎ₁である場合、

であり、
Ｎ₂≦ｎ＜Ｎである場合、

であり、ここで、
Ｘ_L（ｎ）は現在のフレームにおける左チャンネル信号を示し、Ｘ_R（ｎ）は現在のフレームにおける右チャンネル信号を示し、Ｍ₁₁は、以前のフレームのための相関信号チャンネル組み合わせスキームに対応するダウンミックス行列を示し、Ｍ₁₁は、以前のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数に基づいて構築され、Ｍ₂₂は、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するダウンミックス行列を示し、Ｍ₂₂は、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数に基づいて構築される。

Ｍ₂₂は、複数の可能な形式を有することがあり、これらの形式は、具体的には、例えば、

又は

であり、ここで、
α₁＝ｒａｔｉｏ＿ＳＭ、α₂＝１－ｒａｔｉｏ＿ＳＭであり、ｒａｔｉｏ＿ＳＭは、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数を示す。

Ｍ₁₁は、複数の可能な形式を有することがあり、これらの形式は、具体的には、例えば、

又は

であり、ここで、
ｔｄｍ＿ｌａｓｔ＿ｒａｔｉｏは、以前のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数を示す。

具体的には、別の例について、以前のフレームのためのチャンネル組み合わせスキームが反相関信号チャンネル組み合わせスキームであり、現在のフレームのためのチャンネル組み合わせスキームが相関信号チャンネル組み合わせスキームであるとき、現在のフレームにおける左及び右チャンネル信号は、左及び右チャンネル信号の開始セグメントと、左及び右チャンネル信号の中間セグメントと、左及び右チャンネル信号の終了セグメントとを含み、現在のフレームにおけるプライマリ及びセカンダリチャンネル信号は、プライマリ及びセカンダリチャンネル信号の開始セグメントと、プライマリ及びセカンダリチャンネル信号の中間セグメントと、プライマリ及びセカンダリチャンネル信号の終了セグメントとを含む。このケースでは、現在のフレームにおけるプライマリ及びセカンダリチャンネル信号を取得するために、現在のフレームのためのチャンネル組み合わせスキーム及び以前のフレームのためのチャンネル組み合わせスキームに基づいて現在のフレームにおける左及び右チャンネル信号に対してセグメント化された時間領域ダウンミックス処理を実行することは、
以前のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数及び以前のフレームのための反相関信号チャンネル組み合わせスキームに対応する時間領域ダウンミックス処理方式を使用することによって、現在のフレームにおけるプライマリ及びセカンダリチャンネル信号の開始セグメントを取得するために、現在のフレームにおける左及び右チャンネル信号の開始セグメントに対して時間領域ダウンミックス処理を実行することと、
現在のフレームに対する相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数及び現在のフレームのための相関信号チャンネル組み合わせスキームに対応する時間領域ダウンミックス処理方式を使用することによって、現在のフレームにおけるプライマリ及びセカンダリチャンネル信号の終了セグメントを取得するために、現在のフレームにおける左及び右チャンネル信号の終了セグメントに対して時間領域ダウンミックス処理を実行することと、
以前のフレームに対する反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数及び以前のフレームに対する反相関信号チャンネル組み合わせスキームに対応する時間領域ダウンミックス処理方式を使用することによって、プライマリ及びセカンダリチャンネル信号の第３の中間セグメントを取得するために、現在のフレームにおける左及び右チャンネル信号の中間セグメントに対して時間領域ダウンミックス処理を実行することと、現在のフレームに対する相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数及び現在のフレームに対する相関信号チャンネル組み合わせスキームに対応する時間領域ダウンミックス処理方式を使用することによって、プライマリ及びセカンダリチャンネル信号の第４の中間セグメントを取得するために、現在のフレームにおける左及び右チャンネル信号の中間セグメントに対して時間領域ダウンミックス処理を実行することと、現在のフレームにおけるプライマリ及びセカンダリチャンネル信号の中間セグメントを取得するために、プライマリ及びセカンダリチャンネル信号の第３の中間セグメント並びにプライマリ及びセカンダリチャンネル信号の第４中間セグメントに対して重み付け和処理を実行することとを含むことがある。

重み付け和処理が、プライマリ及びセカンダリチャンネル信号の第３の中間セグメント並びにプライマリ及びセカンダリチャンネル信号の第４の中間セグメントに対して実行されるとき、プライマリ及びセカンダリチャンネル信号の第３の中間セグメントに対応する重み付け率は、プライマリ及びセカンダリチャンネル信号の第４の中間セグメントに対応する重み付け率に等しくてもよいし、これに等しくなくてもよい。

例えば、重み付け和処理が、プライマリ及びセカンダリチャンネル信号の第３の中間セグメント並びにプライマリ及びセカンダリチャンネル信号の第４の中間セグメントに対して実行されるとき、プライマリ及びセカンダリチャンネル信号の第３の中間セグメントに対応する重み付け率はフェードアウト係数であり、プライマリ及びセカンダリチャンネル信号の第４の中間セグメントに対応する重み付け率はフェードイン係数である。

いくつかの可能な実装においては、

であり、ここで、
Ｘ₁₂（ｎ）は現在のフレームにおけるプライマリチャンネル信号の開始セグメントを示し、Ｙ₁₂（ｎ）は現在のフレームにおけるセカンダリチャンネル信号の開始セグメントを示し、Ｘ₃₂（ｎ）は現在のフレームにおけるプライマリチャンネル信号の終了セグメントを示し、Ｙ₃₂（ｎ）は現在のフレームにおけるセカンダリチャンネル信号の終了セグメントを示し、Ｘ₂₂（ｎ）は現在のフレームにおけるプライマリチャンネル信号の中間セグメントを示し、Ｙ₂₂（ｎ）は現在のフレーム；におけるセカンダリチャンネル信号の中間セグメントを示し、
Ｘ（ｎ）は現在のフレームにおけるプライマリチャンネル信号を示し、
Ｙ（ｎ）は現在のフレームにおけるセカンダリチャンネル信号を示す。

例えば、

であり、ここで、
ｆａｄｅ＿ｉｎ（ｎ）はフェードイン係数を示し、ｆａｄｅ＿ｏｕｔ（ｎ）はフェードアウト係数を示し、ｆａｄｅ＿ｉｎ（ｎ）とｆａｄｅ＿ｏｕｔ（ｎ）の合計は１である。

具体的には、例えば、

及び

である。もちろん、ｆａｄｅ＿ｉｎ（ｎ）は、或いは、ｎに基づいた別の関数関係のフェードイン係数であってよい。もちろん、ｆａｄｅ＿ｏｕｔ（ｎ）は、或いは、ｎに基づいた別の関数関係のフェードイン係数であってよい。

本明細書において、ｎは、サンプリング点の番号を示す。例えば、ｎ＝０，１，…，Ｎ－１である。

本明細書において、０＜Ｎ₃＜Ｎ₄＜Ｎ－１である。

例えば、Ｎ₃は、１０１、１０７、１２０、１５０、又は別の値に等しい。

例えば、Ｎ₄は、１８１、１８７、２００、２０５、又は別の値に等しい。

Ｘ₂₂₁（ｎ）は現在のフレームにおけるプライマリチャンネル信号の第３の中間セグメントを示し、Ｙ₂₂₁（ｎ）は現在のフレームにおけるセカンダリチャンネル信号の第３の中間セグメントを示す。Ｘ₂₂₂（ｎ）は現在のフレームにおけるプライマリチャンネル信号の第４の中間セグメントを示し、Ｙ₂₂₂（ｎ）は現在のフレームにおけるセカンダリチャンネル信号の第４の中間セグメントを示す。

いくつかの可能な実装においては、
Ｎ₃≦ｎ＜Ｎ₄である場合、

であり、
Ｎ₃≦ｎ＜Ｎ₄である場合、

であり、
０≦ｎ＜Ｎ₃である場合、

であり、
Ｎ₄≦ｎ＜Ｎである場合、

であり、ここで、
Ｘ_L（ｎ）は現在のフレームにおける左チャンネル信号を示し、Ｘ_R（ｎ）は現在のフレームにおける右チャンネル信号を示す。

Ｍ₁₂は、以前のフレームに対する反相関信号チャンネル組み合わせスキームに対応するダウンミックス行列を示し、Ｍ₁₂は、以前のフレームに対する反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数に基づいて構築される。Ｍ₂₁は、現在のフレームに対する相関信号チャンネル組み合わせスキームに対応するダウンミックス行列を示し、Ｍ₂₁は、現在のフレームに対する相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数に基づいて構築される。

Ｍ₁₂は、複数の可能な形式を有することがあり、これらの形式は、具体的には、例えば、

又は

であり、ここで、
α_{1_pre}＝ｔｄｍ＿ｌａｓｔ＿ｒａｔｉｏ＿ＳＭ、α_{2_pre}＝１－ｔｄｍ＿ｌａｓｔ＿ｒａｔｉｏ＿ＳＭであり、
ｔｄｍ＿ｌａｓｔ＿ｒａｔｉｏ＿ＳＭは、以前のフレームに対する反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数を示す。

Ｍ₂₁は、複数の可能な形式を有することがあり、これらの形式は、具体的には、例えば、

又は

であり、ここで、
ｒａｔｉｏは、現在のフレームに対する相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数を示す。

いくつかの可能な実装においては、現在のフレームにおける左及び右チャンネル信号は、例えば、現在のフレームにおける元の左及び右チャンネル信号であってもよいし、時間領域前処理を施された左及び右チャンネル信号であってもよいし、遅延アラインメント処理を施された左及び右チャンネル信号であってもよい。

具体的には、例えば、

又は

であり、ここで、
ｘ_L（ｎ）は、現在のフレームにおける元の左チャンネル信号を示し（元の左チャンネル信号は、時間領域前処理を施されていない左チャンネル信号である）、ｘ_R（ｎ）は、現在のフレームにおける元の右チャンネル信号を示し（元の右チャンネル信号は、時間領域前処理を施されていない右チャンネル信号である）、
ｘ_{L_HP}（ｎ）は、現在のフレームにおける、時間領域前処理を施された左チャンネル信号を示し、ｘ_{R_HP}（ｎ）は、現在のフレームにおける、時間領域前処理を施された右チャンネル信号を示す。ｘ’_L（ｎ）は、現在のフレームにおける、遅延アラインメント処理を施された左チャンネル信号を示し、ｘ’_R（ｎ）は、現在のフレームにおける、遅延アラインメント処理を施された右チャンネル信号を示す。

上述の例におけるセグメント化された時間領域ダウンミックス処理方式は、全ての可能な実装であるとは限らないことがあり、実際の適用では、別のセグメント化された時間領域ダウンミックス処理方式も使用されてよいことが理解されることができる。

これに対応して、以下では、例を使用して、相関から反相関信号デコーディングへの切り換えモード及び反相関から相関信号デコーディングへの切り換えモードのためのシナリオについて説明する。相関から反相関信号デコーディングへの切り換えモード及び反相関から相関信号デコーディングへの切り換えモードに対応する時間領域ダウンミックス処理方式は、例えば、セグメント化された時間領域ダウンミックス処理方式である。

図７を参照すると、本出願の実施形態は、オーディオデコーディング方法を提供する。オーディオデコーディング方法の関連ステップは、デコーディング装置によって実施されてよく、方法は、具体的には、以下のステップを含むことがある。

７０１．現在のフレームにおけるデコードされたプライマリ及びセカンダリチャンネル信号を取得するために、ビットストリームに基づいたデコーディングを実行する。

７０２．現在のフレームのためのチャンネル組み合わせスキームを決定する。

ステップ７０１及びステップ７０２を実行するための必要な順序はないことが理解され得る。

７０３．現在のフレームに対するチャンネル組み合わせスキームが以前のフレームに対するチャンネル組み合わせスキームとは異なるとき、現在のフレームにおける再構成された左及び右チャンネル信号を取得するために、現在のフレームに対するチャンネル組み合わせスキーム及び以前のフレームに対するチャンネル組み合わせスキームに基づいて、現在のフレームにおけるデコードされたプライマリ及びセカンダリチャンネル信号に対してセグメント化された時間領域アップミックス処理を実行する。

現在のフレームに対するチャンネル組み合わせスキームは、複数のチャンネル組み合わせスキームのうちの１つである。

例えば、複数のチャンネル組み合わせスキームは、反相関信号チャンネル組み合わせスキームと、相関信号チャンネル組み合わせスキームとを含む。相関信号チャンネル組み合わせスキームは、同位相に近い信号に対応するチャンネル組み合わせスキームである。反相関信号チャンネル組み合わせスキームは、逆位相に近い信号に対応するチャンネル組み合わせスキームである。同位相に近い信号に対応するチャンネル組み合わせスキームは同位相に近い信号に適用可能であり、逆位相に近い信号に対応するチャンネル組み合わせスキームは逆位相に近い信号に適用可能であることが理解され得る。

セグメント化された時間領域アップミックス処理は、現在のフレームにおける左及び右チャンネル信号が少なくとも２つのセグメントに分割されると理解されてよく、異なる時間領域アップミックス処理方式は、各セグメントが時間領域アップミックス処理を実行するために使用される。非セグメント化された時間領域アップミックス処理と比較して、セグメント化された時間領域アップミックス処理は、隣接するフレームに対するチャンネル組み合わせスキームが変化するとき、よりスムーズな移行を取得する可能性が高いことが理解されることができる。

上述のソリューションにおいては、現在のフレームに対するチャンネル組み合わせスキームが決定される必要があり、これは、現在のフレームに対するチャンネル組み合わせスキームについて複数の可能性があることを示していることが理解され得る。ただ１つのチャンネル組み合わせスキームしかない従来のソリューションと比較して、複数の可能なチャンネル組み合わせスキームを有するこのソリューションは、複数の可能なシナリオとより相性が良く、調和することができる。加えて、現在のフレームに対するチャンネル組み合わせスキームと以前のフレームに対するチャンネル組み合わせスキームが異なるとき、現在のフレームにおける左及び右チャンネル信号に対してセグメント化された時間領域アップミックス処理を実行するメカニズムが導入される。セグメント化された時間領域アップミックス処理メカニズムは、チャンネル組み合わせスキームのスムーズな移行を実施する助けになり、さらにエンコーディング品質を改善する助けになる。

加えて、逆位相に近い信号に対応するチャンネル組み合わせスキームが導入されるので、現在のフレームにおけるステレオ信号が逆位相に近い信号であるとき、より目標に合ったチャンネル組み合わせスキーム及び符号化モードが、存在し、これは、エンコーディング品質を改善する助けになる。

例えば、以前のフレームに対するチャンネル組み合わせスキームは、相関信号チャンネル組み合わせスキームであってもよいし、反相関信号チャンネル組み合わせスキームであってもよい。現在のフレームに対するチャンネル組み合わせスキームは、相関信号チャンネル組み合わせスキームであってもよいし、反相関信号チャンネル組み合わせスキームであってもよい。したがって、現在のフレームに対するチャンネル組み合わせスキームと以前のフレームに対するチャンネル組み合わせスキームが異なる、いくつかの可能なケースがある。

具体的には、例えば、以前のフレームに対するチャンネル組み合わせスキームは相関信号チャンネル組み合わせスキームであり、現在のフレームに対するチャンネル組み合わせスキームは反相関信号チャンネル組み合わせスキームである。現在のフレームにおける再構成された左及び右チャンネル信号は、再構成された左及び右チャンネル信号の開始セグメントと、再構成された左及び右チャンネル信号の中間セグメントと、再構成された左及び右チャンネル信号の終了セグメントとを含む。現在のフレームにおけるデコードされたプライマリ及びセカンダリチャンネル信号は、デコードされたプライマリ及びセカンダリチャンネル信号の開始セグメントと、デコードされたプライマリ及びセカンダリチャンネル信号の中間セグメントと、デコードされたプライマリ及びセカンダリチャンネル信号の終了セグメントとを含む。このケースでは、現在のフレームにおける再構成された左及び右チャンネル信号を取得するために、現在のフレームに対するチャンネル組み合わせスキーム及び以前のフレームに対するチャンネル組み合わせスキームに基づいて、現在のフレームにおけるデコードされたプライマリ及びセカンダリチャンネル信号に対してセグメント化された時間領域アップミックス処理を実行することは、以前のフレームに対する相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数及び以前のフレームに対する相関信号チャンネル組み合わせスキームに対応する時間領域アップミックス処理方式を使用することによって、現在のフレームにおける再構成された左及び右チャンネル信号の開始セグメントを取得するために、現在のフレームにおけるデコードされたプライマリ及びセカンダリチャンネル信号の開始セグメントに対して時間領域アップミックス処理を実行することと、
現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数及び現在のフレームのための反相関信号チャンネル組み合わせスキームに対応する時間領域アップミックス処理方式を使用することによって、現在のフレームにおける再構成された左及び右チャンネル信号の終了セグメントを取得するために、現在のフレームにおけるデコードされたプライマリ及びセカンダリチャンネル信号の終了セグメントに対して時間領域アップミックス処理を実行することと、
以前のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数及び以前のフレームのための相関信号チャンネル組み合わせスキームに対応する時間領域アップミックス処理方式を使用することによって、再構成された左及び右チャンネル信号の第１の中間セグメントを取得するために、現在のフレームにおけるデコードされたプライマリ及びセカンダリチャンネル信号の中間セグメントに対して時間領域アップミックス処理を実行することと、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数及び現在のフレームのための反相関信号チャンネル組み合わせスキームに対応する時間領域アップミックス処理方式を使用することによって、再構成された左及び右チャンネル信号の第２の中間セグメントを取得するために、現在のフレームにおけるデコードされたプライマリ及びセカンダリチャンネル信号の中間セグメントに対して時間領域アップミックス処理を実行することと、現在のフレームにおける再構成された左及び右チャンネル信号の中間セグメントを取得するために、再構成された左及び右チャンネル信号の第１の中間セグメント並びに再構成された左及び右チャンネル信号の第２の中間セグメントに対して重み付け和処理を実行することと
を含む。

現在のフレームにおける再構成された左及び右チャンネル信号の開始セグメント、再構成された左及び右チャンネル信号の中間セグメント、並びに再構成された左及び右チャンネル信号の終了セグメントの長さは、要件に基づいて設定されることがある。現在のフレームにおける再構成された左及び右チャンネル信号の開始セグメント、再構成された左及び右チャンネル信号の中間セグメント、並びに再構成された左及び右チャンネル信号の終了セグメントの長さは、同じであってもよいし、部分的に同じであってもよいし、互いとは異なってもよい。

現在のフレームにおけるデコードされたプライマリ及びセカンダリチャンネル信号の開始セグメント、デコードされたプライマリ及びセカンダリチャンネル信号の中間セグメント、並びにデコードされたプライマリ及びセカンダリチャンネル信号の終了セグメントの長さは、要件に基づいて設定されることがある。現在のフレームにおけるデコードされたプライマリ及びセカンダリチャンネル信号の開始セグメント、デコードされたプライマリ及びセカンダリチャンネル信号の中間セグメント、並びにデコードされたプライマリ及びセカンダリチャンネル信号の終了セグメントの長さは、同じであってもよいし、部分的に同じであってもよし、互いとは異なってもよい。

重み付け和処理が、再構成された左及び右チャンネル信号の第１の中間セグメント並びに再構成された左及び右チャンネル信号の第２の中間セグメントに対して実行されるとき、再構成された左及び右チャンネル信号の第１の中間セグメントに対応する重み付け率は、再構成された左及び右チャンネル信号の第２の中間セグメントに対応する重み付け率に等しくてもよいし、これに等しくなくてもよい。

例えば、重み付け和処理が、再構成された左及び右チャンネル信号の第１の中間セグメント並びに再構成された左及び右チャンネル信号の第２の中間セグメントに対して実行されるとき、再構成された左及び右チャンネル信号の第１の中間セグメントに対応する重み付け率はフェードアウト係数であり、再構成された左及び右チャンネル信号の第２の中間セグメントに対応する重み付け率はフェードイン係数である。

いくつかの可能な実装においては、

であり、ここで、

は、現在のフレームにおける再構成された左チャンネル信号の開始セグメントを示し、

は、現在のフレームにおける再構成された右チャンネル信号の開始セグメントを示す。

は、現在のフレームにおける再構成された左チャンネル信号の終了セグメントを示し、

は、現在のフレームにおける再構成された右チャンネル信号の終了セグメントを示す。

は、現在のフレームにおける再構成された左チャンネル信号の中間セグメントを示し、

は、現在のフレームにおける再構成された右チャンネル信号の中間セグメントを示し、

例えば、

である。

具体的には、例えば、

及び

本明細書において、ｎはサンプリング点の番号を示し、ｎ＝０，１，…，Ｎ－１である。本明細書では、０＜Ｎ₁＜Ｎ₂＜Ｎ－１である。

は、現在のフレームにおける再構成された左チャンネル信号の第１の中間セグメントを示し、

は、現在のフレームにおける再構成された右チャンネル信号の第１の中間セグメントを示す。

は、現在のフレームにおける再構成された左チャンネル信号の第２の中間セグメントを示し、

は、現在のフレームにおける再構成された右チャンネル信号の第２の中間セグメントを示す。

であり、
Ｎ₁≦ｎ＜Ｎ₂である場合、

であり、
０≦ｎ＜Ｎ₁である場合、

であり、
Ｎ₂≦ｎ＜Ｎである場合、

であり、ここで、

は、現在のフレームにおけるデコードされたセカンダリチャンネル信号を示し、

は、以前のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数に基づいて構築され、

は、複数の可能な形式を有することがあり、これらの形式は、具体的には、例えば、

又は

である。

本明細書において、ｔｄｍ＿ｌａｓｔ＿ｒａｔｉｏは、以前のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数を示す。

具体的には、別の例について、以前のフレームのためのチャンネル組み合わせスキームは反相関信号チャンネル組み合わせスキームであり、現在のフレームのためのチャンネル組み合わせスキームは相関信号チャンネル組み合わせスキームである。現在のフレームにおける再構成された左及び右チャンネル信号は、再構成された左及び右チャンネル信号の開始セグメントと、再構成された左及び右チャンネル信号の中間セグメントと、再構成された左及び右チャンネル信号の終了セグメントとを含む。現在のフレームにおけるデコードされたプライマリ及びセカンダリチャンネル信号は、デコードされたプライマリ及びセカンダリチャンネル信号の開始セグメントと、デコードされたプライマリ及びセカンダリチャンネル信号の中間セグメントと、デコードされたプライマリ及びセカンダリチャンネル信号の終了セグメントとを含む。このケースでは、現在のフレームにおける再構成された左及び右チャンネル信号を取得するために、現在のフレームのためのチャンネル組み合わせスキーム及び以前のフレームのためのチャンネル組み合わせスキームに基づいて、現在のフレームにおけるデコードされたプライマリ及びセカンダリチャンネル信号に対してセグメント化された時間領域アップミックス処理を実行することは、
以前のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数及び以前のフレームのための反相関信号チャンネル組み合わせスキームに対応する時間領域アップミックス処理方式を使用することによって、現在のフレームにおける再構成された左及び右チャンネル信号の開始セグメントを取得するために、現在のフレームにおけるデコードされたプライマリ及びセカンダリチャンネル信号の開始セグメントに対して時間領域アップミックス処理を実行することと、
現在のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数及び現在のフレームのための相関信号チャンネル組み合わせスキームに対応する時間領域アップミックス処理方式を使用することによって、現在のフレームにおける再構成された左及び右チャンネル信号の終了セグメントを取得するために、現在のフレームにおけるデコードされたプライマリ及びセカンダリチャンネル信号の終了セグメントに対して時間領域アップミックス処理を実行することと、
以前のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数及び以前のフレームのための反相関信号チャンネル組み合わせスキームに対応する時間領域アップミックス処理方式を使用することによって、再構成された左及び右チャンネル信号の第３の中間セグメントを取得するために、現在のフレームにおけるデコードされたプライマリ及びセカンダリチャンネル信号の中間セグメントに対して時間領域アップミックス処理を実行することと、現在のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数及び現在のフレームのための相関信号チャンネル組み合わせスキームに対応する時間領域アップミックス処理方式を使用することによって、再構成された左及び右チャンネル信号の第４の中間セグメントを取得するために、現在のフレームにおけるデコードされたプライマリ及びセカンダリチャンネル信号の中間セグメントに対して時間領域アップミックス処理を実行することと、現在のフレームにおける再構成された左及び右チャンネル信号の中間セグメントを取得するために、再構成された左及び右チャンネル信号の第３の中間セグメント並びに再構成された左及び右チャンネル信号の第４の中間セグメントに対して重み付け和処理を実行することと
を含む。

重み付け和処理が、再構成された左及び右チャンネル信号の第３の中間セグメント並びに再構成された左及び右チャンネル信号の第４の中間セグメントに対して実行されるとき、再構成された左及び右チャンネル信号の第３の中間セグメントに対応する重み付け率は、再構成された左及び右チャンネル信号の第４の中間セグメントに対応する重み付け率に等しくてもよいし、これに等しくなくてもよい。

例えば、重み付け和処理が、再構成された左及び右チャンネル信号の第３の中間セグメント並びに再構成された左及び右チャンネル信号の第４の中間セグメントに対して実行されるとき、再構成された左及び右チャンネル信号の第３の中間セグメントに対応する重み付け率はフェードアウト係数であり、再構成された左及び右チャンネル信号の第４の中間セグメントに対応する重み付け率はフェードイン係数である。

いくつかの可能な実装においては、

であり、ここで、

は、現在のフレームにおける再構成された右チャンネル信号の開始セグメントを示し、

は、現在のフレームにおける再構成された右チャンネル信号の終了セグメントを示し、

は、現在のフレームにおける再構成された右チャンネル信号の中間セグメントを示す。

例えば、

である。

ｆａｄｅ＿ｉｎ（ｎ）はフェードイン係数を示し、ｆａｄｅ＿ｏｕｔ（ｎ）はフェードアウト係数を示し、ｆａｄｅ＿ｉｎ（ｎ）とｆａｄｅ＿ｏｕｔ（ｎ）の合計は１である。

具体的には、例えば、

及び

本明細書において、０＜Ｎ₃＜Ｎ₄＜Ｎ－１である。

は、現在のフレームにおける再構成された左チャンネル信号の第３の中間セグメントを示し、

は、現在のフレームにおける再構成された右チャンネル信号の第３の中間セグメントを示す。

は、現在のフレームにおける再構成された左チャンネル信号の第４の中間セグメントを示し、

は、現在のフレームにおける再構成された右チャンネル信号の第４の中間セグメントを示す。

であり、
Ｎ₃≦ｎ＜Ｎ₄である場合、

であり、
０≦ｎ＜Ｎ₃である場合、

であり、
Ｎ₄≦ｎ＜Ｎである場合、

であり、ここで、

又は

であり、ここで、
α_{1_pre}＝ｔｄｍ＿ｌａｓｔ＿ｒａｔｉｏ＿ＳＭ、α_{2_pre}＝１－ｔｄｍ＿ｌａｓｔ＿ｒａｔｉｏ＿ＳＭであり、
ｔｄｍ＿ｌａｓｔ＿ｒａｔｉｏ＿ＳＭは、以前のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数を示す。

又は

であり、ここで、
ｒａｔｉｏは、現在のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数を示す。

本出願のこの実施形態においては、現在のフレームのステレオパラメータ（例えば、チャンネル組み合わせ比係数及び／又はチャンネル間時間差）は、固定値であってもよいし、現在のフレームのためのチャンネル組み合わせスキーム（例えば、相関信号チャンネル組み合わせスキーム又は反相関信号チャンネル組み合わせスキーム）に基づいて決定されてもよい。

図８を参照すると、以下は、例を使用して、時間領域ステレオパラメータ決定方法について説明する。時間領域ステレオパラメータ決定方法の関連ステップは、エンコーディング装置によって実施され得るし、方法は、具体的には、以下のステップを含み得る。

８０１．現在のフレームのためのチャンネル組み合わせスキームを決定する。

８０２．現在のフレームに対してチャンネル組み合わせスキームに基づいて現在のフレームの時間領域ステレオパラメータを決定し、この時間領域ステレオパラメータは、チャンネル組み合わせ比係数及びチャンネル間時間差のうちの少なくとも１つを含むことがある。

現在のフレームのためのチャンネル組み合わせスキームは、複数のチャンネル組み合わせスキームのうちの１つである。

例えば、複数のチャンネル組み合わせスキームは、反相関信号チャンネル組み合わせスキームと、相関信号チャンネル組み合わせスキームとを含む。

相関信号チャンネル組み合わせスキームは、同位相に近い信号に対応するチャンネル組み合わせスキームである。反相関信号チャンネル組み合わせスキームは、逆位相に近い信号に対応するチャンネル組み合わせスキームである。同位相に近い信号に対応するチャンネル組み合わせスキームは同位相に近い信号に適用可能であり、逆位相に近い信号に対応するチャンネル組み合わせスキームは逆位相に近い信号に適用可能であることが理解され得る。

現在のフレームのためのチャンネル組み合わせスキームが相関信号チャンネル組み合わせスキームであると決定されたとき、現在のフレームの時間領域ステレオパラメータは、現在のフレームのための相関信号チャンネル組み合わせスキームに対応する時間領域ステレオパラメータである。又は、現在のフレームのためのチャンネル組み合わせスキームが反相関信号チャンネル組み合わせスキームであると決定されたとき、現在のフレームの時間領域ステレオパラメータは、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応する時間領域ステレオパラメータである。

上述のソリューションにおいては、現在のフレームのためのチャンネル組み合わせスキームが決定される必要があり、これは、現在のフレームのためのチャンネル組み合わせスキームについて複数の可能性があることを示していることが理解され得る。ただ１つのチャンネル組み合わせスキームしかない従来のソリューションと比較して、複数の可能なチャンネル組み合わせスキームを有するこのソリューションは、複数の可能なシナリオとより相性が良く、調和することができる。現在のフレームの時間領域ステレオパラメータは、現在のフレームのためのチャンネル組み合わせスキームに基づいて決定されるので、時間領域ステレオパラメータは、複数の可能なシナリオとより相性が良く、調和することができ、エンコーディング品質及びデコーディング品質がさらに改善可能である。

いくつかの可能な実装においては、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数及び現在のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数は、最初に別々に計算されてよい。その後、現在のフレームのためのチャンネル組み合わせスキームが相関信号チャンネル組み合わせスキームであると決定されたとき、現在のフレームの時間領域ステレオパラメータは、現在のフレームのための相関信号チャンネル組み合わせスキームに対応する時間領域ステレオパラメータであると決定され、又は、現在のフレームのためのチャンネル組み合わせスキームが反相関信号チャンネル組み合わせスキームであると決定されたとき、現在のフレームの時間領域ステレオパラメータは、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応する時間領域ステレオパラメータであると決定される。或いは、現在のフレームのための相関信号チャンネル組み合わせスキームに対応する時間領域ステレオパラメータが最初に計算されてよく、現在のフレームのためのチャンネル組み合わせスキームが相関信号チャンネル組み合わせスキームであると決定されたとき、現在のフレームの時間領域ステレオパラメータは、現在のフレームのための相関信号チャンネル組み合わせスキームに対応する時間領域ステレオパラメータであると決定されるか、又は、現在のフレームのためのチャンネル組み合わせスキームが反相関信号チャンネル組み合わせスキームであると決定されたとき、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応する時間領域ステレオパラメータが計算され、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応する時間領域ステレオパラメータは、現在のフレームの時間領域ステレオパラメータと決定される。

或いは、現在のフレームのためのチャンネル組み合わせスキームが最初に決定されてよい。現在のフレームのためのチャンネル組み合わせスキームが相関信号チャンネル組み合わせスキームであると決定されたとき、現在のフレームのための相関信号チャンネル組み合わせスキームに対応する時間領域ステレオパラメータが計算され、現在のフレームの時間領域ステレオパラメータは、現在のフレームのための相関信号チャンネル組み合わせスキームに対応する時間領域ステレオパラメータである。又は、現在のフレームのためのチャンネル組み合わせスキームが反相関信号チャンネル組み合わせスキームであると決定されたとき、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応する時間領域ステレオパラメータが計算され、現在のフレームの時間領域ステレオパラメータは、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応する時間領域ステレオパラメータである。

いくつかの可能な実装においては、現在のフレームのためのチャンネル組み合わせスキームに基づいて現在のフレームの時間領域ステレオパラメータを決定することは、現在のフレームのためのチャンネル組み合わせスキームに基づいて、現在のフレームのためのチャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の初期値を決定することを含む。現在のフレームのためのチャンネル組み合わせスキーム（相関信号チャンネル組み合わせスキーム又は反相関信号チャンネル組み合わせスキーム）に対応するチャンネル組み合わせ比係数の初期値が修正される必要がないとき、現在のフレームのためのチャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数は、現在のフレームのためのチャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の初期値に等しい。現在のフレームのためのチャンネル組み合わせスキーム（相関信号チャンネル組み合わせスキーム又は反相関信号チャンネル組み合わせスキーム）に対応するチャンネル組み合わせ比係数の初期値が修正される必要があるとき、現在のフレームのためのチャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の初期値は、現在のフレームのためのチャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の修正値を取得するように修正され、現在のフレームのためのチャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数は、現在のフレームのためのチャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の修正値に等しい。

例えば、現在のフレームのためのチャンネル組み合わせスキームに基づいて現在のフレームの時間領域ステレオパラメータを決定することは、現在のフレームにおける左チャンネル信号に基づいて現在のフレームにおける左チャンネル信号のフレームエネルギーを計算することと、現在のフレームにおける右チャンネル信号に基づいて現在のフレームにおける右チャンネル信号のフレームエネルギーを計算することと、現在のフレームにおける左チャンネル信号のフレームエネルギー及び現在のフレームにおける右チャンネル信号のフレームエネルギーに基づいて、現在のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の初期値を計算することとを含むことがある。

現在のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の初期値が修正される必要がないとき、現在のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数は、現在のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の初期値に等しく、現在のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数のエンコードされたインデックスは、現在のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の初期値のエンコードされたインデックスに等しい。

現在のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の初期値が修正される必要があるとき、現在のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の初期値及び初期値のエンコードされたインデックスは、現在のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の修正値及び修正値のエンコードされたインデックスを取得するように修正される。現在のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数は、現在のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の修正値に等しく、現在のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数のエンコードされたインデックスは、現在のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の修正値のエンコードされたインデックスに等しい。

具体的には、例えば、現在のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の初期値及び初期値のエンコードされたインデックスが修正され、
ｒａｔｉｏ＿ｉｄｘ＿ｍｏｄ＝０．５＊（ｔｄｍ＿ｌａｓｔ＿ｒａｔｉｏ＿ｉｄｘ＋１６）及び、
ｒａｔｉｏ＿ｍｏｄ_qua＝ｒａｔｉｏ＿ｔａｂｌ［ｒａｔｉｏ＿ｉｄｘ＿ｍｏｄ］であり、ここで、
ｔｄｍ＿ｌａｓｔ＿ｒａｔｉｏ＿ｉｄｘは、以前のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数のエンコードされたインデックスを示し、ｒａｔｉｏ＿ｉｄｘ＿ｍｏｄは、現在のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の修正値に対応するエンコードされたインデックスを示し、ｒａｔｉｏ＿ｍｏｄ_quaは、現在のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の修正値を示す。

別の例について、現在のフレームのためのチャンネル組み合わせスキームに基づいて現在のフレームの時間領域ステレオパラメータを決定することは、現在のフレームにおける左及び右チャンネル信号に基づいて現在のフレームにおける参照チャンネル信号を取得することと、現在のフレームにおける左チャンネル信号と参照チャンネル信号との間の振幅相関パラメータを計算することと、現在のフレームにおける右チャンネル信号と参照チャンネル信号との間の振幅相関パラメータを計算することと、現在のフレームにおける左チャンネル信号と参照チャンネル信号との間の振幅相関パラメータ及び現在のフレームにおける右チャンネル信号と参照チャンネル信号との間の振幅相関パラメータに基づいて、現在のフレームにおける左チャンネル信号と右チャンネル信号との間の振幅相関差パラメータを計算することと、現在のフレームにおける左チャンネル信号と右チャンネル信号との間の振幅相関差パラメータに基づいて、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数を計算することとを含む。

現在のフレームにおける左チャンネル信号と右チャンネル信号との間の振幅相関差パラメータに基づいて、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数を計算することは、例えば、現在のフレームにおける左チャンネル信号と右チャンネル信号との間の振幅相関差パラメータに基づいて、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の初期値を計算することと、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数を取得するために、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の初期値を修正することとを含むことがある。現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の初期値が修正される必要がないとき、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数は、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の初期値に等しいときことが理解され得る。

いくつかの可能な実装においては、

及び

であり、ここで、

であり、
ｍｏｎｏ＿ｉ（ｎ）は現在のフレームにおける参照チャンネル信号を示し、
ｘ’_L（ｎ）は、現在のフレームにおける、遅延アラインメント処理を施された左チャンネル信号を示し、ｘ’_R（ｎ）は、現在のフレームにおける、遅延アラインメント処理を施された右チャンネル信号を示し、ｃｏｒｒ＿ＬＭは、現在のフレームにおける左チャンネル信号と参照チャンネル信号との間の振幅相関パラメータを示し、ｃｏｒｒ＿ＲＭは、現在のフレームにおける右チャンネル信号と参照チャンネル信号との間の振幅相関パラメータを示す。

いくつかの可能な実装においては、現在のフレームにおける左チャンネル信号と参照チャンネル信号との間の振幅相関パラメータ及び現在のフレームにおける右チャンネル信号と参照チャンネル信号との間の振幅相関パラメータに基づいて、現在のフレームにおける左チャンネル信号と右チャンネル信号との間の振幅相関差パラメータを計算することは、現在のフレームにおける遅延アラインメント処理を施された左チャンネル信号と参照チャンネル信号との間の振幅相関パラメータに基づいて、現在のフレームにおける左チャンネル信号と参照チャンネル信号との間の長期平滑化された振幅相関パラメータを計算することと、現在のフレームにおける遅延アラインメント処理を施された右チャンネル信号と参照チャンネル信号との間の振幅相関パラメータに基づいて、現在のフレームにおける右チャンネル信号と参照チャンネル信号との間の長期平滑化された振幅相関パラメータを計算することと、現在のフレームにおける左チャンネル信号と参照チャンネル信号との間の長期平滑化された振幅相関パラメータ及び現在のフレームにおける右チャンネル信号と参照チャンネル信号との間の長期平滑化された振幅相関パラメータに基づいて、現在のフレームにおける左チャンネルと右チャンネルとの間の振幅相関差パラメータを計算することとを含む。

さまざまな平滑化方式、例えば、
ｔｄｍ＿ｌｔ＿ｃｏｒｒ＿ＬＭ＿ＳＭ_cur＝α＊ｔｄｍ＿ｌｔ＿ｃｏｒｒ＿ＬＭ＿ＳＭ_pre＋（１－α）ｃｏｒｒ＿ＬＭがあってよく、ここで、
ｔｄｍ＿ｌｔ＿ｒｍｓ＿Ｌ＿ＳＭ_cur＝（１－Ａ）＊ｔｄｍ＿ｌｔ＿ｒｍｓ＿Ｌ＿ＳＭ_pre＋Ａ＊ｒｍｓ＿Ｌであり、Ａは、現在のフレームにおける左チャンネル信号の長期平滑化されたフレームエネルギーの更新係数を示し、ｔｄｍ＿ｌｔ＿ｒｍｓ＿Ｌ＿ＳＭ_curは、現在のフレームにおける左チャンネル信号の長期平滑化されたフレームエネルギーを示し、ｒｍｓ＿Ｌは、現在のフレームにおける左チャンネル信号のフレームエネルギーを示し、ｔｄｍ＿ｌｔ＿ｃｏｒｒ＿ＬＭ＿ＳＭ_curは、現在のフレームにおける左チャンネル信号と参照チャンネル信号との間の長期平滑化された振幅相関パラメータを示し、ｔｄｍ＿ｌｔ＿ｃｏｒｒ＿ＬＭ＿ＳＭ_preは、以前のフレームにおける左チャンネル信号と参照チャンネル信号との間の長期平滑化された振幅相関パラメータを示し、αは左チャンネル平滑化係数を示す。

例えば、
ｔｄｍ＿ｌｔ＿ｃｏｒｒ＿ＲＭ＿ＳＭ_cur＝β＊ｔｄｍ＿ｌｔ＿ｃｏｒｒ＿ＲＭ＿ＳＭ_pre＋（１－β）ｃｏｒｒ＿ＬＭであり、ここで、
ｔｄｍ＿ｌｔ＿ｒｍｓ＿Ｒ＿ＳＭ_cur＝（１－Ｂ）＊ｔｄｍ＿ｌｔ＿ｒｍｓ＿Ｒ＿ＳＭ_pre＋Ｂ＊ｒｍｓ＿Ｒであり、Ｂは、現在のフレームにおける右チャンネル信号の長期平滑化されたフレームエネルギーの更新係数を示し、ｔｄｍ＿ｌｔ＿ｒｍｓ＿Ｒ＿ＳＭ_preは、現在のフレームにおける右チャンネル信号の長期平滑化されたフレームエネルギーを示し、ｒｍｓ＿Ｒは、現在のフレームにおける右チャンネル信号のフレームエネルギーを示し、ｔｄｍ＿ｌｔ＿ｃｏｒｒ＿ＲＭ＿ＳＭ_curは、現在のフレームにおける右チャンネル信号と参照チャンネル信号との間の長期平滑化された振幅相関パラメータを示し、ｔｄｍ＿ｌｔ＿ｃｏｒｒ＿ＲＭ＿ＳＭ_preは、以前のフレームにおける右チャンネル信号と参照チャンネル信号との間の長期平滑化された振幅相関パラメータを示し、βは右チャンネル平滑化係数を示す。

いくつかの可能な実装においては、
ｄｉｆｆ＿ｌｔ＿ｃｏｒｒ＝ｔｄｍ＿ｌｔ＿ｃｏｒｒ＿ＬＭ＿ＳＭ－ｔｄｍ＿ｌｔ＿ｃｏｒｒ＿ＲＭ＿ＳＭであり、ここで、
ｔｄｍ＿ｌｔ＿ｃｏｒｒ＿ＬＭ＿ＳＭは、現在のフレームにおける左チャンネル信号と参照チャンネル信号との間の長期平滑化された振幅相関パラメータを示し、ｔｄｍ＿ｌｔ＿ｃｏｒｒ＿ＲＭ＿ＳＭは、現在のフレームにおける右チャンネル信号と参照チャンネル信号との間の長期平滑化された振幅相関パラメータを示し、ｄｉｆｆ＿ｌｔ＿ｃｏｒｒは、現在のフレームにおける左チャンネル信号と右チャンネル信号との間の振幅相関差パラメータを示す。

いくつかの可能な実装においては、現在のフレームにおける左チャンネル信号と右チャンネル信号との間の振幅相関差パラメータに基づいて、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数を計算することは、現在のフレームにおける左チャンネル信号と右チャンネル信号の間にあってマッピング処理を施された振幅相関差パラメータの値範囲が、［ＭＡＰ＿ＭＩＮ，ＭＡＰ＿ＭＡＸ］であることを可能にするために、現在のフレームにおける左チャンネル信号と右チャンネル信号との間の振幅相関差パラメータに対してマッピング処理を実行することと、左チャンネル信号と右チャンネル信号との間にあってマッピング処理を施された振幅相関差パラメータを、チャンネル組み合わせ比係数へと変換することとを含む。

いくつかの可能な実装においては、現在のフレームにおける左チャンネルと右チャンネルとの間にある振幅相関差パラメータに対してマッピング処理を実行することは、現在のフレームにおける左チャンネル信号と右チャンネル信号との間の振幅相関差パラメータに対して振幅制限を実行することと、現在のフレームにおける左チャンネル信号と右チャンネル信号との間の振幅制限振幅相関差パラメータに対してマッピング処理を実行することとを含む。

さまざまな振幅制限方式があってよく、それらは、具体的には、例えば、

であり、ここで、
ＲＡＴＩＯ＿ＭＡＸは、現在のフレームにおける左チャンネル信号と右チャンネル信号との間の振幅制限振幅相関差パラメータの最大値を示し、ＲＡＴＩＯ＿ＭＩＮは、現在のフレームにおける左チャンネル信号と右チャンネル信号との間の振幅制限振幅相関差パラメータの最小値を示し、ＲＡＴＩＯ＿ＭＡＸ＞ＲＡＴＩＯ＿ＭＩＮである。

さまざまなマッピング処理方式があってよく、それらは、具体的には、例えば、

であり、ここで、

であり、
Ｂ₁＝ＭＡＰ＿ＭＡＸ－ＲＡＴＩＯ＿ＭＡＸ＊Ａ₁又はＢ₁＝ＭＡＰ＿ＨＩＧＨ－ＲＡＴＩＯ＿ＨＩＧＨ＊Ａ₁であり、

であり、
Ｂ₂＝ＭＡＰ＿ＬＯＷ－ＲＡＴＩＯ＿ＬＯＷ＊Ａ₂又はＢ₂＝ＭＡＰ＿ＭＩＮ－ＲＡＴＩＯ＿ＭＩＮ＊Ａ₂であり、

であり、
Ｂ₃＝ＭＡＰ＿ＨＩＧＨ－ＲＡＴＩＯ＿ＨＩＧＨ＊Ａ₃又はＢ₃＝ＭＡＰ＿ＬＯＷ－ＲＡＴＩＯ＿ＬＯＷ＊Ａ₃であり、
ｄｉｆｆ＿ｌｔ＿ｃｏｒｒ＿ｍａｐは、現在のフレームにおける左チャンネル信号と右チャンネル信号との間にあってマッピング処理を施された振幅相関差パラメータを示し、
ＭＡＰ＿ＭＡＸは、現在のフレームにおける左チャンネル信号と右チャンネル信号との間にあってマッピング処理を施された振幅相関差パラメータの最大値を示し、ＭＡＰ＿ＨＩＧＨは、現在のフレームにおける左チャンネル信号と右チャンネル信号との間にあってマッピング処理を施された振幅相関差パラメータの高閾値を示し、ＭＡＰ＿ＬＯＷは、現在のフレームにおける左チャンネル信号と右チャンネル信号との間にあってマッピング処理を施された振幅相関差パラメータの低閾値を示し、ＭＡＰ＿ＭＩＮは、現在のフレームにおける左チャンネル信号と右チャンネル信号との間にあってマッピング処理を施された振幅相関差パラメータの最小値を示し、
ＭＡＰ＿ＭＡＸ＞ＭＡＰ＿ＨＩＧＨ＞ＭＡＰ＿ＬＯＷ＞ＭＡＰ＿ＭＩＮであり、
ＲＡＴＩＯ＿ＭＡＸは、現在のフレームにおける左チャンネル信号と右チャンネル信号との間にある振幅制限振幅相関差パラメータの最大値を示し、ＲＡＴＩＯ＿ＨＩＧＨは、現在のフレームにおける左チャンネル信号と右チャンネル信号との間の振幅制限振幅相関差パラメータの高閾値を示し、ＲＡＴＩＯ＿ＬＯＷは、現在のフレームにおける左チャンネル信号と右チャンネル信号との間の振幅制限振幅相関差パラメータの低閾値を示し、ＲＡＴＩＯ＿ＭＩＮは、現在のフレームにおける左チャンネル信号と右チャンネル信号との間の振幅制限振幅相関差パラメータの最小値を示し、
ＲＡＴＩＯ＿ＭＡＸ＞ＲＡＴＩＯ＿ＨＩＧＨ＞ＲＡＴＩＯ＿ＬＯＷ＞ＲＡＴＩＯ＿ＭＩＮである。

別の例について、

であり、ここで、
ｄｉｆｆ＿ｌｔ＿ｃｏｒｒ＿ｌｉｍｉｔは、現在のフレームにおける左チャンネル信号と右チャンネル信号との間の振幅制限振幅相関差パラメータを示し、ｄｉｆｆ＿ｌｔ＿ｃｏｒｒ＿ｍａｐは、現在のフレーム左チャンネル信号と右チャンネル信号との間にあってマッピング処理を施された振幅相関差パラメータを示し、

であり、
ＲＡＴＩＯ＿ＭＡＸは、現在のフレームにおける左チャンネル信号と右チャンネル信号との間の振幅相関差パラメータの最大振幅を示し、－ＲＡＴＩＯ＿ＭＡＸは、現在のフレームにおける左チャンネル信号と右チャンネル信号との間の振幅相関差パラメータの最小振幅を示す。

いくつかの可能な実装においては、

であり、ここで、
ｄｉｆｆ＿ｌｔ＿ｃｏｒｒ＿ｍａｐは、現在のフレームにおける左チャンネル信号と右チャンネル信号との間にあってマッピング処理を施された振幅相関差パラメータを示し、ｒａｔｉｏ＿ＳＭは、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数を示すか、又は、ｒａｔｉｏ＿ＳＭは、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の初期値を示す。

本出願のいくつかの実装においては、チャンネル組み合わせ比係数が修正される必要があるシナリオにおいて、修正は、チャンネル組み合わせ比係数がエンコードされる前に実行されてもよいし、その後に実行されてもよい。具体的には、例えば、現在のフレームのチャンネル組み合わせ比係数（例えば、反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数又は相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数）の初期値が、計算を通して最初に取得されてよく、その後、チャンネル組み合わせ比係数の初期値が、現在のフレームのチャンネル組み合わせ比係数の初期エンコードされたインデックスを取得するためにエンコードされ、取得された現在のフレームのチャンネル組み合わせ比係数の初期エンコードされたインデックスが、現在のフレームのチャンネル組み合わせ比係数のエンコードされたインデックスを取得するように修正される（現在のフレームのチャンネル組み合わせ比係数のエンコードされたインデックスを取得することは、現在のフレームのチャンネル組み合わせ比係数を取得することに等しい）。或いは、現在のフレームのチャンネル組み合わせ比係数の初期値が、計算を通して最初に取得されてよく、その後、計算を通して取得された現在のフレームのチャンネル組み合わせ比係数の初期値が、現在のフレームのチャンネル組み合わせ比係数を取得するように修正され、取得された現在のフレームのチャンネル組み合わせ比係数が、現在のフレームのチャンネル組み合わせ比係数のエンコードされたインデックスを取得するようにエンコードされる。

現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の初期値を修正するさまざまな方式がある。例えば、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の初期値が、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数を取得するように修正される必要があるとき、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の初期値は、以前のフレームのチャンネル組み合わせ比係数及び現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の初期値に基づいて修正されることがある。又は現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の初期値は、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の初期値に基づいて修正されることがある。

例えば、最初に、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の初期値が修正される必要があるかどうかが、現在のフレームにおける左チャンネル信号の長期平滑化されたフレームエネルギー、現在のフレームにおける右チャンネル信号の長期平滑化されたフレームエネルギー、現在のフレームにおける左チャンネル信号のフレーム間エネルギー差、履歴バッファにおける以前のフレームのバッファされたエンコーディングパラメータ（例えば、プライマリチャンネル信号のフレーム間相関及びセカンダリチャンネル信号のフレーム間相関）、現在のフレーム及び以前のフレームのチャンネル組み合わせスキームフラグ、以前のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数、並びに現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の初期値に基づいて、決定される。修正される必要がある場合、以前のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数が、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数として使用される。そうでない場合、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の初期値が、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数として使用される。

もちろん、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数を取得するように現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の初期値を修正する具体的な実装は、上述の例に限定されない。

８０３．現在のフレームの決定された時間領域ステレオパラメータをエンコードする。

いくつかの可能な実装においては、量子化エンコーディングが、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応する決定されたチャンネル組み合わせ比係数に対して実行され、
ｒａｔｉｏ＿ｉｎｉｔ＿ＳＭ_qua＝ｒａｔｉｏ＿ｔａｂｌ［ｒａｔｉｏ＿ｉｄｘ＿ｉｎｉｔ＿ＳＭ］であり、ここで、
ｒａｔｉｏ＿ｔａｂｌ＿ＳＭは、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数のためのスカラー量子化を実行するためのコードブックを示し、ｒａｔｉｏ＿ｉｄｘ＿ｉｎｉｔ＿ＳＭは、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の初期エンコードされたインデックスを示し、ｒａｔｉｏ＿ｉｎｉｔ＿ＳＭ_quaは、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の量子化エンコードされた初期値を示す。

いくつかの可能な実装においては、
ｒａｔｉｏ＿ｉｄｘ＿ＳＭ＝ｒａｔｉｏ＿ｉｄｘ＿ｉｎｉｔ＿ＳＭ、及び
ｒａｔｉｏ＿ＳＭ＝ｒａｔｉｏ＿ｔａｂｌ［ｒａｔｉｏ＿ｉｄｘ＿ＳＭ］であり、ここで、
ｒａｔｉｏ＿ＳＭは、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数を示し、ｒａｔｉｏ＿ｉｄｘ＿ＳＭは、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数のエンコードされたインデックスを示す、又は
ｒａｔｉｏ＿ｉｄｘ＿ＳＭ＝φ＊ｒａｔｉｏ＿ｉｄｘ＿ｉｎｉｔ＿ＳＭ＋（１－φ）＊ｔｄｍ＿ｌａｓｔ＿ｒａｔｉｏ＿ｉｄｘ＿ＳＭ、及び
ｒａｔｉｏ＿ＳＭ＝ｒａｔｉｏ＿ｔａｂｌ［ｒａｔｉｏ＿ｉｄｘ＿ＳＭ］であり、ここで、
ｒａｔｉｏ＿ｉｄｘ＿ｉｎｉｔ＿ＳＭは、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応する初期エンコードされたインデックスを示し、ｔｄｍ＿ｌａｓｔ＿ｒａｔｉｏ＿ｉｄｘ＿ＳＭは、以前のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の最終的なエンコードされたインデックスを示し、

は、反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の修正係数であり、ｒａｔｉｏ＿ＳＭは、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数を示す。

いくつかの可能な実装においては、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の初期値が、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数を取得するように修正される必要があるとき、量子化エンコーディングは、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の初期エンコードされたインデックスを取得するために、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の初期値に対して最初に実行されることがある。次いで、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の初期エンコードされたインデックスが、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応する以前のフレームのチャンネル組み合わせ比係数のエンコードされたインデックス及びチャンネル組み合わせ比係数の初期エンコードされたインデックスに基づいて修正されることがある。又は、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の初期エンコードされたインデックスが、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の初期エンコードされたインデックスに基づいて修正されることがある。

例えば、量子化エンコーディングが、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応する初期エンコードされたインデックスを取得するために、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の初期値に対して最初に実行されることがある。その後、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の初期値が修正される必要があるとき、以前のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数のエンコードされたインデックスは、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数のエンコードされたインデックスとして使用される。そうでない場合は、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の初期エンコードされたインデックスは、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数のエンコードされたインデックスとして使用される。最後に、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数のエンコードされたインデックスに対応する量子化エンコードされた値が、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数として使用される。

加えて、時間領域ステレオパラメータがチャンネル間時間差を含むとき、現在のフレームのためのチャンネル組み合わせスキームに基づいて現在のフレームの時間領域ステレオパラメータを決定することは、現在のフレームのためのチャンネル組み合わせスキームが相関信号チャンネル組み合わせスキームであるとき、現在のフレームのチャンネル間時間差を計算することを含むことがある。加えて、計算を通して取得される現在のフレームのチャンネル間時間差は、ビットストリームへと書き込まれることがある。デフォルトチャンネル間時間差（例えば、０）は、現在のフレームのためのチャンネル組み合わせスキームが反相関信号チャンネル組み合わせスキームであるとき、現在のフレームのチャンネル間時間差として使用される。加えて、デフォルトチャンネル間時間差がビットストリームへと書き込まれないことがあり、デコーディング装置も、デフォルトチャンネル間時間差を使用する。

以下は、例を使用することによって、時間領域ステレオパラメータエンコーディング方法をさらに提供する。この方法は、例えば、現在のフレームのためのチャンネル組み合わせスキームを決定することと、現在のフレームのためのチャンネル組み合わせスキームに基づいて現在のフレームの時間領域ステレオパラメータを決定することと、現在のフレームの決定された時間領域ステレオパラメータをエンコードすることであって、時間領域ステレオパラメータは、チャンネル組み合わせ比係数及びチャンネル間時間差のうちの少なくとも１つを含むことがある、エンコードすることとを含むことがある。

これに対応して、デコーディング装置は、ビットストリームから現在のフレームの時間領域ステレオパラメータを取得し、ビットストリームから取得された現在のフレームの時間領域ステレオパラメータに基づいて関連デコーディングをさらに実行することがある。

以下は、より具体的な適用シナリオに関する例を使用することによって、説明を提供する。

図９－Ａは、本出願の実施形態に従った、オーディオエンコーディング方法の概略フローチャートである。本出願の本実施形態において提供されるオーディオエンコーディング方法は、エンコーディング装置によって実施されてよく、この方法は、具体的には、以下のステップを含むことがある。

９０１．現在のフレームにおける元の左及び右チャンネル信号に対して時間領域前処理を実行する。

例えば、ステレオオーディオ信号のサンプリングレートが１６ＫＨｚである場合、信号の１つのフレームは２０ｍｓであり、フレーム長はＮと表記され、Ｎ＝３２０であるとき、それは、フレーム長が３２０のサンプリング点であることを示す。現在のフレームにおけるステレオ信号は、現在のフレームにおける左チャンネル信号と、現在のフレームにおける右チャンネル信号とを含むことがある。現在のフレームにおける元の左チャンネル信号はｘ_L（ｎ）と表記され、現在のフレームにおける元の右チャンネル信号はｘ_R（ｎ）と表記され、ｎはサンプリング点の番号であり、ｎ＝０，１，…，Ｎ－１である。

例えば、現在のフレームにおける元の左及び右チャンネル信号に対して時間領域前処理を実行することは、現在のフレームにおける時間領域前処理を施された左及び右チャンネル信号を取得するために、現在のフレームにおける元の左及び右チャンネル信号のためのハイパスフィルタリング処理を実行することであって、現在のフレームにおける時間領域前処理を施された左チャンネル信号はｘ_{L_HP}（ｎ）と表記され、現在のフレームにおける時間領域前処理を施された右チャンネル信号はｘ_{R_HP}（ｎ）と表記される、実行することを含むことがある。本明細書において、ｎはサンプリング点の番号であり、ｎ＝０，１，…，Ｎ－１である。ハイパスフィルタリング処理において使用されるフィルタは、例えば、カットオフ周波数が２０Ｈｚである無限インパルス応答（ＩｎｆｉｎｉｔｅＩｍｐｕｌｓｅＲｅｓｐｏｎｓｅ、ＩＩＲ）フィルタであってもよいし、別のタイプのフィルタであってもよい。

例えば、サンプリングレートが１６ＫＨｚであり、２０Ｈｚのカットオフ周波数に対応するハイパスフィルタの伝達関数は、

であってよく、ここで、
ｂ₀＝０．９９４４６１７８８９５８１９５、ｂ₁＝－１．９８８９２３５７７９１６３９０、ｂ₂＝０．９９４４６１７８８９５８１９５、ａ₁＝１．９８８８９２９０５８９９６５３、ａ₂＝－０．９８８９５４２４９９３３１２７、ｚはＺトランスフォームのトランスフォーム係数である。

対応する時間領域フィルタの伝達関数は、
ｘ_{L_HP}（ｎ）＝ｂ₀＊ｘ_L（ｎ）＋ｂ₁＊ｘ_L（ｎ－１）＋ｂ₂＊ｘ_L（ｎ－２）－ａ₁＊ｘ_{L_HP}（ｎ－１）－ａ₂＊ｘ_{L_HP}（ｎ－２）、及び
ｘ_{R_HP}（ｎ）＝ｂ₀＊ｘ_R（ｎ）＋ｂ₁＊ｘ_R（ｎ－１）＋ｂ₂＊ｘ_R（ｎ－２）－ａ₁＊ｘ_{R_HP}（ｎ－１）－ａ₂＊ｘ_{R_HP}（ｎ－２）
と表されることがある。

９０２．現在のフレームにおける遅延アラインメント処理を施された左及び右チャンネル信号を取得するために、現在のフレームにおける時間領域前処理を施された左及び右チャンネル信号に対して遅延アラインメント処理を実行する。

遅延アラインメント処理を施された信号は、簡潔に、「遅延アラインメントされた信号」と呼ばれることがある。例えば、遅延アラインメント処理を施された左チャンネル信号は、簡潔に、「遅延アラインメントされた左チャンネル信号」と呼ばれることがあり、遅延アラインメント処理を施された右チャンネル信号は、簡潔に、「遅延アラインメント右チャンネル信号」と呼ばれることがあり、以下同様である。

具体的には、チャンネル間遅延パラメータは、現在のフレームにおける前処理された左及び右チャンネル信号に基づいて抽出され、その後エンコードされることがあり、遅延アラインメント処理は、現在のフレームにおける遅延アラインメント処理を施された左及び右チャンネル信号を取得するために、エンコードされたチャンネル間遅延パラメータに基づいて左及び右チャンネル信号に対して実行される。現在のフレームにおける遅延アラインメント処理を施された左チャンネル信号はｘ’_L（ｎ）と表記され、現在のフレームにおける遅延アラインメント処理を施された右チャンネル信号はｘ’_R（ｎ）と表記され、ここでｎはサンプリング点の番号であり、ｎ＝０，１，…，Ｎ－１である。

具体的には、例えば、エンコーディング装置は、現在のフレームにおける前処理された左及び右チャンネル信号に基づいて左チャンネル及び右チャンネルの時間領域相互相関関数を計算し、左チャンネル信号と右チャンネル信号との間の時間差を決定するために、左チャンネル及び右チャンネルの時間領域相互相関関数の最大値（又は別の値）を検索し、左チャンネルと右チャンネルとの間の決定された時間差に対して量子化エンコーディングを実行し、左チャンネル及び右チャンネルから選択された１つのチャンネルの信号を基準として使用し、現在のフレームにおける、遅延アラインメント処理を施された左及び右チャンネル信号を取得するために、左チャンネルと右チャンネルとの間の量子化エンコードされた時間差に基づいて他のチャンネルの信号のための遅延調整を実行することがある。

遅延アラインメント処理の多くの特定の実装方法があり、本実施形態においては、特定の遅延アラインメント処理方法が限定されないことが留意されるべきである。

９０３．現在のフレームにおける、遅延アラインメント処理を施された左及び右チャンネル信号のために時間領域分析を実行する。

具体的には、時間領域分析は、過渡検出などを含むことがある。過渡検出は、現在のフレームにおける遅延アラインメント処理を施された左及び右チャンネル信号上で実行されたエネルギー検出であることがある（具体的には、現在のフレームが突然のエネルギー変化を有するかどうかが検出され得る）。例えば、現在のフレームにおける遅延アラインメント処理を施された左チャンネル信号のエネルギーはＥ_{cur_L}と表され、以前のフレームにおける遅延アラインメントを施された左チャンネル信号のエネルギーはＥ_{pre_L}と表される。このケースでは、過渡検出は、現在のフレームにおける遅延アラインメント処理を施された左チャンネル信号の過渡検出結果を取得するために、Ｅ_{pre_L}とＥ_{cur_L}との間の差の絶対値に基づいて実行されることがある。同様に、過渡検出は、同じ方法を使用することによって、現在のフレームにおける遅延アラインメント処理を施された右チャンネル信号に対して実行されることがある。時間領域分析は、過渡検出以外の別の従来の方式の時間領域分析をさらに含むことがあり、例えば、周波数帯域拡張前処理を含むことがある。

ステップ９０３は、ステップ９０２の後で、現在のフレームにおけるプライマリ及びセカンダリチャンネル信号がエンコードされる前の、任意の時点で実行されてよいことが理解され得る。

９０４．現在のフレームのためのチャンネル組み合わせスキームを決定するために、現在のフレームにおける遅延アラインメント処理を施された左及び右チャンネル信号に基づいて現在のフレームのためのチャンネル組み合わせスキーム判定を実行する。

２つの可能なチャンネル組み合わせスキームは、本実施形態においては例として説明され、以下の説明では、それぞれ相関信号チャンネル組み合わせスキーム及び反相関信号チャンネル組み合わせスキームと呼ばれる。本実施形態においては、相関信号チャンネル組み合わせスキームは、現在のフレームにおける左及び右チャンネル信号（遅延アラインメント後に取得される）が同位相に近い信号であるケースに対応し、反相関信号チャンネル組み合わせスキームは、現在のフレームにおける左及び右チャンネル信号（遅延アラインメント後に取得される）が逆位相に近い信号であるケースに対応する。もちろん、「相関信号チャンネル組み合わせスキーム」及び「反相関信号チャンネル組み合わせスキーム」に加えて、他の名前も、実際の適用において２つの可能なチャンネル組み合わせスキームを表すために使用されてよい。

本実施形態のいくつかのソリューションでは、チャンネル組み合わせスキーム判定は、初期チャンネル組み合わせスキーム判定及びチャンネル組み合わせスキーム変更判定に分類されることがある。チャンネル組み合わせスキーム判定が、現在のフレームのためのチャンネル組み合わせスキームを決定するために現在のフレームに対して実行されることが理解されることができる。現在のフレームのためのチャンネル組み合わせスキームを決定する実装のいくつかの例については、上述の実施形態における関連説明を参照されたい。詳細は、本明細書では再度説明されない。

９０５．現在のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の初期値及び初期値のエンコードされたインデックスを取得するために、現在のフレームにおける遅延アラインメント処理を施された左及び右チャンネル信号及び現在のフレームのチャンネル組み合わせスキームフラグに基づいて、現在のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数を計算及びエンコードする。

具体的には、例えば、現在のフレームにおける左及び右チャンネル信号のフレームエネルギーが、現在のフレームにおける遅延アラインメント処理を施された左及び右チャンネル信号に基づいて最初に計算され、ここで、
現在のフレームにおける左チャンネル信号のフレームエネルギーｒｍｓ＿Ｌは

を満たし、
現在のフレームにおける右チャンネル信号のフレームエネルギーｒｍｓ＿Ｒは

を満たし、ここで、
ｘ’_L（ｎ）は、現在のフレームにおける遅延アラインメント処理を施された左チャンネル信号を示し、
ｘ’_R（ｎ）は、現在のフレームにおける遅延アラインメント処理を施された右チャンネル信号を示す。

その後、現在のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数が、現在のフレームにおける左チャンネルのフレームエネルギー及び右チャンネルのフレームエネルギーに基づいて計算される。計算を通して取得される、現在のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数ｒａｔｉｏ＿ｉｎｉｔは、

を満たす。

その後、量子化エンコーディングが、対応するエンコードされたインデックスｒａｔｉｏ＿ｉｄｘ＿ｉｎｉｔ及び量子化現在のフレームのための相関信号チャンネル組み合わせスキームに対応する量子化エンコードされたチャンネル組み合わせ比係数ｒａｔｉｏ＿ｉｎｉｔ_quaを取得するために、計算を通して取得される、現在のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数ｒａｔｉｏ＿ｉｎｉｔに対して実行される。
ｒａｔｉｏ＿ｉｎｉｔ_qua＝ｒａｔｉｏ＿ｔａｂｌ［ｒａｔｉｏ＿ｉｄｘ＿ｉｎｉｔ］

本明細書において、ｒａｔｉｏ＿ｔａｂｌは、スカラー量子化のためのコードブックである。量子化エンコーディングは、任意の従来のスカラー量子化方法、例えば、均一なスカラー量子化又は不均一なスカラー量子化を使用することによって、実行されてよい。エンコーディングに使用されるビットの量は、例えば、５ビットである。具体的なスカラー量子化方法は、本明細書では再度説明されない。

現在のフレームのための相関信号チャンネル組み合わせスキームに対応する量子化エンコードされたチャンネル組み合わせ比係数ｒａｔｉｏ＿ｉｎｉｔ_quaは、現在のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の取得された初期値であり、エンコードされたインデックスｒａｔｉｏ＿ｉｄｘ＿ｉｎｉｔは、現在のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の初期値に対応するエンコードされたインデックスである。

加えて、現在のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の初期値に対応するエンコードされたインデックスは、現在のフレームのチャンネル組み合わせスキームフラグｔｄｍ＿ＳＭ＿ｆｌａｇの値に基づいて、さらに修正されてよい。

例えば、量子化エンコーディングは、５ビットスカラー量子化である。ｔｄｍ＿ＳＭ＿ｆｌａｇ＝１であるとき、現在のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の初期値に対応するエンコードされたインデックスｒａｔｉｏ＿ｉｄｘ＿ｉｎｉｔは、あらかじめ設定された値（例えば、１５又は別の値）に修正され、現在のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の初期値は、ｒａｔｉｏ＿ｉｎｉｔ_qua＝ｒａｔｉｏ＿ｔａｂｌ［１５］に修正されることがある。

上述の計算方法に加えて、従来の時間領域ステレオエンコーディング技術におけるチャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数を計算するための任意の方法は、現在のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数を計算するために使用されてよいことが留意されるべきである。或いは、現在のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の初期値は、固定値（例えば、０．５又は別の値）に直接的に設定されてよい。

９０６．チャンネル組み合わせ比係数修正フラグに基づいて、チャンネル組み合わせ比係数が修正される必要があるかどうかを決定する。

修正される必要がある場合、現在のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数及びチャンネル組み合わせ比係数のエンコードされたインデックスは、現在のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の修正値と、この修正値のエンコードされたインデックスを取得するように修正される。

現在のフレームのチャンネル組み合わせ比係数修正フラグは、ｔｄｍ＿ＳＭ＿ｍｏｄｉ＿ｆｌａｇと表記される。例えば、チャンネル組み合わせ比係数修正フラグの値が０であるとき、それは、チャンネル組み合わせ比係数は修正される必要がないことを示す。又は、チャンネル組み合わせ比係数修正フラグの値が１であるとき、それは、チャンネル組み合わせ比係数が修正される必要があることを示す。もちろん、他の異なる値が、チャンネル組み合わせ比係数が修正される必要があるかどうかを示すために、チャンネル組み合わせ比係数修正フラグとして使用されてよい。

例えば、チャンネル組み合わせ比係数が修正される必要があるかどうかを、チャンネル組み合わせ比係数修正フラグに基づいて、決定することは、具体的には、例えば、チャンネル組み合わせ比係数修正フラグｔｄｍ＿ＳＭ＿ｍｏｄｉ＿ｆｌａｇ＝１である場合、チャンネル組み合わせ比係数が修正される必要があると決定される、を含むことがある。別の例について、チャンネル組み合わせ比係数修正フラグｔｄｍ＿ＳＭ＿ｍｏｄｉ＿ｆｌａｇ＝０である場合、チャンネル組み合わせ比係数は修正される必要がないと決定される。

現在のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数及びチャンネル組み合わせ比係数のエンコードされたインデックスを修正することは、具体的には、
例えば、現在のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の修正値に対応するエンコードされたインデックスは、ｒａｔｉｏ＿ｉｄｘ＿ｍｏｄ＝０．５＊（ｔｄｍ＿ｌａｓｔ＿ｒａｔｉｏ＿ｉｄｘ＋１６）を満たし、ここで、ｔｄｍ＿ｌａｓｔ＿ｒａｔｉｏ＿ｉｄｘは、以前のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数のエンコードされたインデックスであるということ、
を含むことがある。

現在のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の修正値ｒａｔｉｏ＿ｍｏｄ_quaは、ｒａｔｉｏ＿ｍｏｄ_qua＝ｒａｔｉｏ＿ｔａｂｌ［ｒａｔｉｏ＿ｉｄｘ＿ｍｏｄ］を満たす。

９０７．現在のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の初期値及び初期値のエンコードされたインデックス、現在のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の修正値及び修正値のエンコードされたインデックス、並びにチャンネル組み合わせ比係数修正フラグに基づいて、現在のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数ｒａｔｉｏ及びエンコードされたインデックスｒａｔｉｏ＿ｉｄｘを決定する。

具体的には、例えば、相関信号チャンネル組み合わせスキームに対応する決定されたチャンネル組み合わせ比係数ｒａｔｉｏは、

を満たし、ここで、
ｒａｔｉｏ＿ｉｎｉｔ_quaは、現在のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の初期値を示し、ｒａｔｉｏ＿ｍｏｄ_quaは、現在のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の修正値を示し、ｔｄｍ＿ＳＭ＿ｍｏｄｉ＿ｆｌａｇは、現在のフレームのチャンネル組み合わせ比係数修正フラグを示す。

相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数に対応する決定されたエンコードされたインデックスｒａｔｉｏ＿ｉｄｘは、

を満たし、ここで、
ｒａｔｉｏ＿ｉｄｘ＿ｉｎｉｔは、現在のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の初期値に対応するエンコードされたインデックスを示し、ｒａｔｉｏ＿ｉｄｘ＿ｍｏｄは、現在のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の修正値に対応するエンコードされたインデックスを示す。

９０８．現在のフレームのチャンネル組み合わせスキームフラグが反相関信号チャンネル組み合わせスキームに対応するかどうかを決定し、対応する場合、反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数及びエンコードされたインデックスを取得するために、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数を計算及びエンコードする。

最初に、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数を計算するために使用される履歴バッファがリセットされる必要があるかどうかが決定されることがある。

例えば、現在のフレームのチャンネル組み合わせスキームフラグｔｄｍ＿ＳＭ＿ｆｌａｇが１に等しく（例えば、ｔｄｍ＿ＳＭ＿ｆｌａｇが１に等しいことは、現在のフレームのチャンネル組み合わせスキームフラグが反相関信号チャンネル組み合わせスキームに対応することを示す）、以前のフレームのチャンネル組み合わせスキームフラグｔｄｍ＿ＳＭ＿ｆｌａｇが０に等しい（例えば、ｔｄｍ＿ＳＭ＿ｆｌａｇが０に等しいことは、以前のフレームのチャンネル組み合わせスキームフラグが相関信号チャンネル組み合わせスキームに対応することを示す）場合、それは、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数を計算するために使用される履歴バッファがリセットされる必要があることを示す。

履歴バッファリセットフラグｔｄｍ＿ＳＭ＿ｒｅｓｅｔ＿ｆｌａｇは、初期チャンネル組み合わせスキーム判定及びチャンネル組み合わせスキーム修正判定の処理において決定されることがあり、その後、履歴バッファリセットフラグの値が、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数を計算するために使用される履歴バッファがリセットされる必要があるかどうかを決定するように決定されることが留意されるべきである。例えば、ｔｄｍ＿ＳＭ＿ｒｅｓｅｔ＿ｆｌａｇが１であるとき、それは、現在のフレームのチャンネル組み合わせスキームフラグが反相関信号チャンネル組み合わせスキームに対応し、以前のフレームのチャンネル組み合わせスキームフラグが相関信号チャンネル組み合わせスキームに対応することを示す。例えば、履歴バッファリセットフラグｔｄｍ＿ＳＭ＿ｒｅｓｅｔ＿ｆｌａｇが１に等しいとき、それは、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数を計算するために使用される履歴バッファがリセットされる必要があることを示す。多くの具体的なリセット方法がある。現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数を計算するために使用される履歴バッファにおける全てのパラメータは、あらかじめ設定された初期値に基づいてリセットされることがある。或いは、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数を計算するために使用される履歴バッファにおけるいくつかのパラメータは、あらかじめ設定された初期値に基づいてリセットされることがある。或いは、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数を計算するために使用される履歴バッファにおけるいくつかのパラメータは、あらかじめ設定された初期値に基づいてリセットされることがあり、他のパラメータは、現在のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数を計算するために使用される履歴バッファにおける対応するパラメータに基づいてリセットされる。

その後、現在のフレームのチャンネル組み合わせスキームフラグｔｄｍ＿ＳＭ＿ｆｌａｇが反相関信号チャンネル組み合わせスキームに対応するかどうかがさらに決定される。反相関信号チャンネル組み合わせスキームは、逆位相に近いステレオ信号に対して時間領域ダウンミックスを実行することにより適したチャンネル組み合わせスキームである。本実施形態においては、現在のフレームのチャンネル組み合わせスキームフラグｔｄｍ＿ＳＭ＿ｆｌａｇ＝１であるとき、それは、現在のフレームのチャンネル組み合わせスキームフラグが反相関信号チャンネル組み合わせスキームに対応することを示す。現在のフレームのチャンネル組み合わせスキームフラグｔｄｍ＿ＳＭ＿ｆｌａｇ＝０であるとき、それは、現在のフレームのチャンネル組み合わせスキームフラグが相関信号チャンネル組み合わせスキームに対応することを示す。

現在のフレームのチャンネル組み合わせスキームフラグが反相関信号チャンネル組み合わせスキームに対応するかどうかを決定することは、具体的には、
現在のフレームのチャンネル組み合わせスキームフラグの値が１であるかどうかを決定することを含むことがあり、現在のフレームのチャンネル組み合わせスキームフラグｔｄｍ＿ＳＭ＿ｆｌａｇ＝１である場合、それは、現在のフレームのチャンネル組み合わせスキームフラグが反相関信号チャンネル組み合わせスキームに対応することを示し、このケースでは、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数は計算及びエンコードされることがある。

図９－Ｂを参照すると、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数を計算及びエンコードすることは、例えば、以下のステップ９０８１から９０８５を含むことがある。

９０８１．現在のフレームにおける、遅延アラインメント処理を施された左及び右チャンネル信号のために信号エネルギー分析を実行する。

現在のフレームにおける左チャンネル信号のフレームエネルギー、現在のフレームにおける右チャンネル信号のフレームエネルギー、現在のフレームにおける左チャンネルの長期平滑化されたフレームエネルギー、現在のフレームにおける右チャンネルの長期平滑化されたフレームエネルギー、現在のフレームにおける左チャンネルのフレーム間エネルギー差、及び現在のフレームにおける右チャンネルのフレーム間エネルギー差が別々に取得される。

例えば、現在のフレームにおける左チャンネル信号のフレームエネルギーｒｍｓ＿Ｌは

を満たし、ここで、
ｘ’_L（ｎ）は、現在のフレームにおける、遅延アラインメント処理を施された左チャンネル信号を示し、
ｘ’_R（ｎ）は、現在のフレームにおける、遅延アラインメント処理を施された右チャンネル信号を示す。

例えば、現在のフレームにおける左チャンネルの長期平滑化されたフレームエネルギーｔｄｍ＿ｌｔ＿ｒｍｓ＿Ｌ＿ＳＭ_curは、
ｔｄｍ＿ｌｔ＿ｒｍｓ＿Ｌ＿ＳＭ_cur＝（１－Ａ）＊ｔｄｍ＿ｌｔ＿ｒｍｓ＿Ｌ＿ＳＭ_pre＋Ａ＊ｒｍｓ＿Ｌを満たし、ここで、
ｔｄｍ＿ｌｔ＿ｒｍｓ＿Ｌ＿ＳＭ_preは、以前のフレームにおける左チャンネルの長期平滑化されたフレームエネルギーを示し、Ａは、左チャンネルの長期平滑化されたフレームエネルギーの更新係数を示し、Ａは、例えば、０から１までの実数であってよく、Ａは、例えば、０．４に等しくてよい。

例えば、現在のフレームにおける右チャンネルの長期平滑化されたフレームエネルギーｔｄｍ＿ｌｔ＿ｒｍｓ＿Ｒ＿ＳＭ_curは、
ｔｄｍ＿ｌｔ＿ｒｍｓ＿Ｒ＿ＳＭ_cur＝（１－Ｂ）＊ｔｄｍ＿ｌｔ＿ｒｍｓ＿Ｒ＿ＳＭ_pre＋Ｂ＊ｒｍｓ＿Ｒを満たし、ここで、
ｔｄｍ＿ｌｔ＿ｒｍｓ＿Ｒ＿ＳＭ_preは、以前のフレームにおける右チャンネルの長期平滑化されたフレームエネルギーを示し、Ｂは、右チャンネルの長期平滑化されたフレームエネルギーの更新係数を示し、Ｂは、例えば、０から１までの実数であってよく、Ｂは、例えば、左チャンネルの長期平滑化されたフレームエネルギーの更新係数と同じであってもよいし、これとは異なってもよい。例えば、Ｂは、０．４に等しくてもよい。

例えば、現在のフレームにおける左チャンネルのフレーム間エネルギー差ｅｎｅｒ＿Ｌ＿ｄｔは、
ｅｎｅｒ＿Ｌ＿ｄｔ＝ｔｄｍ＿ｌｔ＿ｒｍｓ＿Ｌ＿ＳＭ_cur－ｔｄｍ＿ｌｔ＿ｒｍｓ＿Ｌ＿ＳＭ_pre
を満たす。

例えば、現在のフレームにおける右チャンネルのフレーム間エネルギー差ｅｎｅｒ＿Ｒ＿ｄｔは、
ｅｎｅｒ＿Ｒ＿ｄｔ＝ｔｄｍ＿ｌｔ＿ｒｍｓ＿Ｒ＿ＳＭ_cur－ｔｄｍ＿ｌｔ＿ｒｍｓ＿Ｒ＿ＳＭ_pre
を満たす。

９０８２．現在のフレームにおける、遅延アラインメント処理を施された左及び右チャンネル信号に基づいて、現在のフレームにおける参照チャンネル信号を決定する。参照チャンネル信号は、モノラル信号と呼ばれることもある。参照チャンネル信号がモノラル信号と呼ばれる場合、参照チャンネルに関連する全ての説明及びパラメータ名について、参照チャンネル信号は、モノラル信号と交換されてよい。

例えば、参照チャンネル信号ｍｏｎｏ＿ｉ（ｎ）は、

を満たし、ここで、
ｘ’_L（ｎ）は、現在のフレームにおける、遅延アラインメント処理を施された左チャンネル信号であり、ｘ’_R（ｎ）は、現在のフレームにおける、遅延アラインメント処理を施された右チャンネル信号である。

９０８３．現在のフレームにおける、遅延アラインメント処理を施された左チャンネル信号と参照チャンネル信号との間の振幅相関パラメータと、現在のフレームにおける、遅延アラインメント処理を施された右チャンネル信号と参照チャンネル信号との間の振幅相関パラメータを別々に計算する。

例えば、現在のフレームにおける、遅延アラインメント処理を施された左チャンネル信号と参照チャンネル信号との間の振幅相関パラメータｃｏｒｒ＿ＬＭは、例えば、

を満たす。

例えば、現在のフレームにおける、遅延アラインメント処理を施された右チャンネル信号と参照チャンネル信号との間の振幅相関パラメータｃｏｒｒ＿ＲＭは、例えば、

を満たす。

本明細書において、ｘ’_L（ｎ）は、現在のフレームにおける、遅延アラインメント処理を施された左チャンネル信号を示し、ｘ’_R（ｎ）は、現在のフレームにおける、遅延アラインメント処理を施された右チャンネル信号を示し、ｍｏｎｏ＿ｉ（ｎ）は現在のフレームにおける参照チャンネル信号を示し、｜●｜は絶対値を採用することを示す。

９０８４．現在のフレームにおける遅延アラインメント処理を施された左チャンネル信号と参照チャンネル信号との間の振幅相関パラメータ及び現在のフレームにおける遅延アラインメント処理を施された右チャンネル信号と参照チャンネル信号との間の振幅相関パラメータに基づいて、現在のフレームにおける左チャンネルと右チャンネルとの間の振幅相関差パラメータｄｉｆｆ＿ｌｔ＿ｃｏｒｒを計算する。

ステップ９０８１は、ステップ９０８２及びステップ９０８３の前に実行されてもよいし、ステップ９０８２及びステップ９０８３の後でステップ９０８４の前に実行されてもよいことが理解され得る。

図９－Ｃを参照すると、例えば、現在のフレームにおける左チャンネルと右チャンネルとの間の振幅相関差パラメータｄｉｆｆ＿ｌｔ＿ｃｏｒｒを計算することは、具体的には、以下のステップ９０８４１と９０８４２とを含むことがある。

９０８４１．現在のフレームにおける遅延アラインメント処理を施された左チャンネル信号と参照チャンネル信号との間の振幅相関パラメータ及び現在のフレームにおける遅延アラインメント処理を施された右チャンネル信号と参照チャンネル信号との間の振幅相関パラメータに基づいて、現在のフレームにおける左チャンネル信号と参照チャンネル信号との間の長期平滑化された振幅相関パラメータと、現在のフレームにおける右チャンネル信号と参照チャンネル信号との間の長期平滑化された振幅相関パラメータを計算する。

例えば、現在のフレームにおける左チャンネル信号と参照チャンネル信号との間の長期平滑化された振幅相関パラメータ及び現在のフレームにおける右チャンネル信号と参照チャンネル信号との間の長期平滑化された振幅相関パラメータを計算するための方法は、現在のフレームにおける左チャンネル信号と参照チャンネル信号との間の長期平滑化された振幅相関パラメータｔｄｍ＿ｌｔ＿ｃｏｒｒ＿ＬＭ＿ＳＭは、
ｔｄｍ＿ｌｔ＿ｃｏｒｒ＿ＬＭ＿ＳＭ_cur＝α＊ｔｄｍ＿ｌｔ＿ｃｏｒｒ＿ＬＭ＿ＳＭ_pre＋（１－α）ｃｏｒｒ＿ＬＭ
を満たすことを含むことがある。

本明細書において、ｔｄｍ＿ｌｔ＿ｃｏｒｒ＿ＬＭ＿ＳＭ_curは、現在のフレームにおける左チャンネル信号と参照チャンネル信号との間の長期平滑化された振幅相関パラメータを示し、ｄｍ＿ｌｔ＿ｃｏｒｒ＿ＬＭ＿ＳＭ_preは、以前のフレームにおける左チャンネル信号と参照チャンネル信号との間の長期平滑化された振幅相関パラメータを示し、αは左チャンネル平滑化係数を示し、αは、あらかじめ設定された０から１までの実数、例えば、０．２、０．５、又は０．８であってよい。或いは、αの値は、適応計算を通して取得されてもよい。

例えば、現在のフレームにおける右チャンネル信号と参照チャンネル信号との間の長期平滑化された振幅相関パラメータｔｄｍ＿ｌｔ＿ｃｏｒｒ＿ＲＭ＿ＳＭは、
ｔｄｍ＿ｌｔ＿ｃｏｒｒ＿ＲＭ＿ＳＭ_cur＝β＊ｔｄｍ＿ｌｔ＿ｃｏｒｒ＿ＲＭ＿ＳＭ_pre＋（１－β）ｃｏｒｒ＿ＬＭ
を満たす。

本明細書において、ｔｄｍ＿ｌｔ＿ｃｏｒｒ＿ＲＭ＿ＳＭ_curは、現在のフレームにおける右チャンネル信号と参照チャンネル信号との間の長期平滑化された振幅相関パラメータを示し、ｔｄｍ＿ｌｔ＿ｃｏｒｒ＿ＲＭ＿ＳＭ_preは、を以前のフレームにおける右チャンネル信号と参照チャンネル信号との間の長期平滑化された振幅相関パラメータ示し、βは右チャンネル平滑化係数を示し、βは、あらかじめ設定された０から１までの実数であってよい。Βは、左チャンネル平滑化係数αの値と同じであってもよいし、これとは異なってもよく、βは、例えば、０．２、０．５、又は０．８に等しくてよい。或いは、βの値は、適応計算を通して取得されてもよい。

現在のフレームにおける左チャンネル信号と参照チャンネル信号との間の長期平滑化された振幅相関パラメータ及び現在のフレームにおける右チャンネル信号と参照チャンネル信号との間の長期平滑化された振幅相関パラメータを計算するための別の方法は、
最初に、現在のフレームにおける左チャンネル信号と参照チャンネル信号との間の修正された振幅相関パラメータｃｏｒｒ＿ＬＭ＿ｍｏｄを取得するために、現在のフレームにおける遅延アラインメント処理を施された左チャンネル信号と参照チャンネル信号との間の振幅相関パラメータｃｏｒｒ＿ＬＭを修正することと、現在のフレームにおける右チャンネル信号と参照チャンネル信号との間の修正された振幅相関パラメータｃｏｒｒ＿ＲＭ＿ｍｏｄを取得するために、現在のフレームにおける遅延アラインメント処理を施された右チャンネル信号と参照チャンネル信号との間の振幅相関パラメータｃｏｒｒ＿ＲＭを修正することと、
その後、現在のフレームにおける左チャンネル信号と参照チャンネル信号との間の修正された振幅相関パラメータｃｏｒｒ＿ＬＭ＿ｍｏｄ、現在のフレームにおける右チャンネル信号と参照チャンネル信号との間の修正された振幅相関パラメータｃｏｒｒ＿ＲＭ＿ｍｏｄ、以前のフレームにおける左チャンネル信号と参照チャンネル信号との間の長期平滑化された振幅相関パラメータｔｄｍ＿ｌｔ＿ｃｏｒｒ＿ＬＭ＿ＳＭ_pre、及び以前のフレームにおける右チャンネル信号と参照チャンネル信号との間の長期平滑化された振幅相関パラメータｔｄｍ＿ｌｔ＿ｃｏｒｒ＿ＲＭ＿ＳＭ_preに基づいて、現在のフレームにおける左チャンネル信号と参照チャンネル信号との間の長期平滑化された振幅相関差パラメータｄｉｆｆ＿ｌｔ＿ｃｏｒｒ＿ＬＭ＿ｔｍｐ及び現在のフレームにおける右チャンネル信号と参照チャンネル信号との間の長期平滑化された振幅相関差パラメータｄｉｆｆ＿ｌｔ＿ｃｏｒｒ＿ＲＭ＿ｔｍｐを決定することと、
その後、現在のフレームにおける左チャンネル信号と参照チャンネル信号との間の長期平滑化された振幅相関差パラメータｄｉｆｆ＿ｌｔ＿ｃｏｒｒ＿ＬＭ＿ｔｍｐ及び現在のフレームにおける右チャンネル信号と参照チャンネル信号との間の長期平滑化された振幅相関差パラメータｄｉｆｆ＿ｌｔ＿ｃｏｒｒ＿ＲＭ＿ｔｍｐに基づいて、現在のフレームにおける左チャンネルと右チャンネルとの間の振幅相関差パラメータの初期値ｄｉｆｆ＿ｌｔ＿ｃｏｒｒ＿ＳＭを取得することと、現在のフレームにおける左チャンネルと右チャンネルとの間の取得された振幅相関差パラメータの初期値ｄｉｆｆ＿ｌｔ＿ｃｏｒｒ＿ＳＭ及び以前のフレームにおける左チャンネルと右チャンネルとの間の振幅相関差パラメータｔｄｍ＿ｌａｓｔ＿ｄｉｆｆ＿ｌｔ＿ｃｏｒｒ＿ＳＭに基づいて、現在のフレームにおける左チャンネルと右チャンネルとの間の振幅相関差のフレーム間変動パラメータｄ＿ｌｔ＿ｃｏｒｒを決定することと、
最後に、信号エネルギー分析を通して取得された、現在のフレームにおける左チャンネル信号のフレームエネルギー、現在のフレームにおける右チャンネル信号のフレームエネルギー、現在のフレームにおける左チャンネルの長期平滑化されたフレームエネルギー、現在のフレームにおける右チャンネルの長期平滑化されたフレームエネルギー、現在のフレームにおける左チャンネルのフレーム間エネルギー差、及び現在のフレームにおける右チャンネルのフレーム間エネルギー差、並びに現在のフレームにおける左チャンネルと右チャンネルとの間の振幅相関差のフレーム間変動パラメータに基づいて、異なる左チャンネル平滑化係数及び右チャンネル平滑化係数を適応的に選択し、現在のフレームにおける左チャンネル信号と参照チャンネル信号との間の長期平滑化された振幅相関パラメータｔｄｍ＿ｌｔ＿ｃｏｒｒ＿ＬＭ＿ＳＭ及び現在のフレームにおける右チャンネル信号と参照チャンネル信号との間の期平滑化された振幅相関パラメータｔｄｍ＿ｌｔ＿ｃｏｒｒ＿ＲＭ＿ＳＭを計算することと
を含むことがある。

上記で例として与えられた２つの方法に加えて、現在のフレームにおける左チャンネル信号と参照チャンネル信号との間の長期平滑化された振幅相関パラメータ及び現在のフレームにおける右チャンネル信号と参照チャンネル信号との間の長期平滑化された振幅相関パラメータを計算するための多くの方法があり得る。これは、本出願では限定されない。

９０８４２．現在のフレームにおける左チャンネル信号と参照チャンネル信号との間の長期平滑化された振幅相関パラメータ及び現在のフレームにおける右チャンネル信号と参照チャンネル信号との間の長期平滑化された振幅相関パラメータに基づいて、現在のフレームにおける左チャンネルと右チャンネルとの間の振幅相関差パラメータｄｉｆｆ＿ｌｔ＿ｃｏｒｒを計算する。

例えば、現在のフレームにおける左チャンネルと右チャンネルとの間の振幅相関差パラメータｄｉｆｆ＿ｌｔ＿ｃｏｒｒは、
ｄｉｆｆ＿ｌｔ＿ｃｏｒｒ＝ｔｄｍ＿ｌｔ＿ｃｏｒｒ＿ＬＭ＿ＳＭ－ｔｄｍ＿ｌｔ＿ｃｏｒｒ＿ＲＭ＿ＳＭを満たし、ここで、
ｔｄｍ＿ｌｔ＿ｃｏｒｒ＿ＬＭ＿ＳＭは、現在のフレームにおける左チャンネル信号と参照チャンネル信号との間の長期平滑化された振幅相関パラメータを示し、ｔｄｍ＿ｌｔ＿ｃｏｒｒ＿ＲＭ＿ＳＭは、現在のフレームにおける右チャンネル信号と参照チャンネル信号との間の長期平滑化された振幅相関パラメータを示す。

９０８５．現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数及びチャンネル組み合わせ比係数のエンコードされたインデックスを決定するように、現在のフレームにおける左チャンネルと右チャンネルとの間の振幅相関差パラメータｄｉｆｆ＿ｌｔ＿ｃｏｒｒをチャンネル組み合わせ比係数へと変換し、エンコーディング及び量子化を実行する。

図９－Ｄを参照すると、現在のフレームにおける左チャンネルと右チャンネルとの間の振幅相関差パラメータをチャンネル組み合わせ比係数へと変換するための可能な方法は、具体的には、ステップ９０８５１から９０８５３を含むことがある。

９０８５１．左チャンネルと右チャンネルの間にあってマッピング処理を施された振幅相関差パラメータの値範囲が［ＭＡＰ＿ＭＩＮ，ＭＡＰ＿ＭＡＸ］であることを可能にするために、左チャンネルと右チャンネルとの間の振幅相関差パラメータに対してマッピング処理を実行する。

左チャンネルと右チャンネルとの間の振幅相関差パラメータに対してマッピング処理を実行するための方法は、以下のステップを含むことがある。

最初に、振幅制限が、左チャンネルと右チャンネルとの間の振幅相関差パラメータに対して実行される。例えば、左チャンネルと右チャンネルとの間の振幅制限振幅相関差パラメータｄｉｆｆ＿ｌｔ＿ｃｏｒｒ＿ｌｉｍｉｔは、

を満たす。

本明細書において、ＲＡＴＩＯ＿ＭＡＸは、左チャンネルと右チャンネルとの間の振幅制限振幅相関差パラメータの最大値を示し、ＲＡＴＩＯ＿ＭＩＮは、左チャンネルと右チャンネルとの間の振幅制限振幅相関差パラメータの最小値を示す。例えば、ＲＡＴＩＯ＿ＭＡＸは、あらかじめ設定された経験値であり、ＲＡＴＩＯ＿ＭＡＸは、１．５、３．０、又は別の値であってよい。ＲＡＴＩＯ＿ＭＩＮは、あらかじめ設定された経験値であり、ＲＡＴＩＯ＿ＭＩＮは、－１．５、－３．０、又は別の値であってよく、ここで、ＲＡＴＩＯ＿ＭＡＸ＞ＲＡＴＩＯ＿ＭＩＮである。

その後、マッピング処理が、左チャンネルと右チャンネルとの間の振幅制限振幅相関差パラメータに対して実行される。左チャンネルと右チャンネルとの間にあってマッピング処理を施された振幅相関差パラメータｄｉｆｆ＿ｌｔ＿ｃｏｒｒ＿ｍａｐは、

を満たし、ここで、

であり、
Ｂ₃＝ＭＡＰ＿ＨＩＧＨ－ＲＡＴＩＯ＿ＨＩＧＨ＊Ａ₃又はＢ₃＝ＭＡＰ＿ＬＯＷ－ＲＡＴＩＯ＿ＬＯＷ＊Ａ₃
である。

本明細書において、ＭＡＰ＿ＭＡＸは、左チャンネルと右チャンネルとの間にあってマッピング処理を施された振幅相関差パラメータの最大値を示し、ＭＡＰ＿ＨＩＧＨは、左チャンネルと右チャンネルとの間にあってマッピング処理を施された振幅相関差パラメータの高閾値を示し、ＭＡＰ＿ＬＯＷは、左チャンネルと右チャンネルとの間にあってマッピング処理を施された振幅相関差パラメータの低閾値を示し、ＭＡＰ＿ＭＩＮは、左チャンネルと右チャンネルとの間にあってマッピング処理を施された振幅相関差パラメータの最小値を示し、ここで、
ＭＡＰ＿ＭＡＸ＞ＭＡＰ＿ＨＩＧＨ＞ＭＡＰ＿ＬＯＷ＞ＭＡＰ＿ＭＩＮ
である。

例えば、本出願のいくつかの実施形態においては、ＭＡＰ＿ＭＡＸは２．０であってよく、ＭＡＰ＿ＨＩＧＨは１．２であってよく、ＭＡＰ＿ＬＯＷは０．８であってよく、ＭＡＰ＿ＭＩＮは０．０であってよい。もちろん、実際の適用では、値は、そのような例に限定されない。

ＲＡＴＩＯ＿ＭＡＸは、左チャンネルと右チャンネルとの間の振幅制限振幅相関差パラメータの最大値を示し、ＲＡＴＩＯ＿ＨＩＧＨは、左チャンネルと右チャンネルとの間の振幅制限振幅相関差パラメータの高閾値を示し、ＲＡＴＩＯ＿ＬＯＷは、左チャンネルと右チャンネルとの間の振幅制限振幅相関差パラメータの低閾値を示し、ＲＡＴＩＯ＿ＭＩＮは、左チャンネルと右チャンネルとの間の振幅制限振幅相関差パラメータの最小値を示し、ここで、
ＲＡＴＩＯ＿ＭＡＸ＞ＲＡＴＩＯ＿ＨＩＧＨ＞ＲＡＴＩＯ＿ＬＯＷ＞ＲＡＴＩＯ＿ＭＩＮ
である。

例えば、本出願のいくつかの実施形態においては、ＲＡＴＩＯ＿ＭＡＸは１．５、ＲＡＴＩＯ＿ＨＩＧＨは０．７５、ＲＡＴＩＯ＿ＬＯＷは－０．７５、ＲＡＴＩＯ＿ＭＩＮは－１．５である。もちろん、実際の適用では、値は、そのような例に限定されない。

本出願のいくつかの実施形態における別の方法は、次のとおりである。左チャンネルと右チャンネルとの間にあってマッピング処理を施された振幅相関差パラメータｄｉｆｆ＿ｌｔ＿ｃｏｒｒ＿ｍａｐは、

を満たす。

本明細書において、ｄｉｆｆ＿ｌｔ＿ｃｏｒｒ＿ｌｉｍｉｔは、左チャンネルと右チャンネルとの間の振幅制限振幅相関差パラメータを示し、ここで、

である。

本明細書において、ＲＡＴＩＯ＿ＭＡＸは、左チャンネルと右チャンネルとの間の振幅相関差パラメータの最大振幅を示し、－ＲＡＴＩＯ＿ＭＡＸは、左チャンネルと右チャンネルとの間の振幅相関差パラメータの最小振幅を示す。ＲＡＴＩＯ＿ＭＡＸは、あらかじめ設定された経験値であってよく、ＲＡＴＩＯ＿ＭＡＸは、例えば、１．５、３．０、又は０よりも大きい別の実数であってよい。

９０８５２．左チャンネルと右チャンネルとの間にあってマッピング処理を施された振幅相関差パラメータを、チャンネル組み合わせ比係数へと変換する。

チャンネル組み合わせ比係数ｒａｔｉｏ＿ＳＭは、

を満たし、ここで、
ｃｏｓ（・）はコサイン演算を示す。

上述の方法に加えて、別の方法が、左チャンネルと右チャンネルとの間の振幅相関差パラメータをチャンネル組み合わせ比係数へと変換するために使用され、例えば、
反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数が更新される必要があるかどうかは、信号エネルギー分析を通して取得される、現在のフレームにおける左チャンネルの長期平滑化されたフレームエネルギー、現在のフレームにおける右チャンネルの長期平滑化されたフレームエネルギー、及び現在のフレームにおける左チャンネルのフレーム間エネルギー差、エンコーダの履歴バッファにおける以前のフレームのバッファされたエンコーディングパラメータ（例えば、プライマリチャンネル信号のフレーム間相関パラメータ及びセカンダリチャンネル信号のフレーム間相関パラメータ）、現在のフレーム及び以前のフレームのチャンネル組み合わせスキームフラグ、並びに現在のフレーム及び以前のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数に基づいて決定される。

反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数が更新される必要がある場合、左チャンネルと右チャンネルとの間の振幅相関差パラメータは、上述の例における方法を使用することによってチャンネル組み合わせ比係数へと変換される。そうでない場合、以前のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数及びチャンネル組み合わせ比係数のエンコードされたインデックスは、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数及びチャンネル組み合わせ比係数のエンコードされたインデックスとして直接的に使用される。

９０８５３．変換後に取得されたチャンネル組み合わせ比係数に対して量子化エンコーディングを実行し、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数を決定する。

具体的には、例えば、量子化エンコーディングが、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応する初期エンコードされたインデックスｒａｔｉｏ＿ｉｄｘ＿ｉｎｉｔ＿ＳＭ及び現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の量子化エンコードされた初期値ｒａｔｉｏ＿ｉｎｉｔ＿ＳＭ_quaを取得するために、変換後に取得されたチャンネル組み合わせ比係数に対して実行され、ここで、
ｒａｔｉｏ＿ｉｎｉｔ＿ＳＭ_qua＝ｒａｔｉｏ＿ｔａｂｌ＿ＳＭ［ｒａｔｉｏ＿ｉｄｘ＿ｉｎｉｔ＿ＳＭ］
である。

本明細書において、ｒａｔｉｏ＿ｔａｂｌ＿ＳＭは、反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数に対してスカラー量子化を実行するためのコードブックを示す。量子化エンコーディングは、従来の技術における任意のスカラー量子化方法、例えば、均一なスカラー量子化又は不均一なスカラー量子化を使用することによって、実行されてよい。エンコーディングに使用されるビットの量は、５ビットであってよい。具体的な方法は、本明細書では説明されない。反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数に対してスカラー量子化を実行するためのコードブックは、相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数に対してスカラー量子化を実行するためのコードブックと同じであってもよいし、又はこれとは異なってもよい。コードブックが同じであるとき、チャンネル組み合わせ比係数に対してスカラー量子化を実行するために使用される１つのコードブックのみが記憶される必要がある。このケースでは、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の量子化エンコードされた初期値ｒａｔｉｏ＿ｉｎｉｔ＿ＳＭ_quaは、
ｒａｔｉｏ＿ｉｎｉｔ＿ＳＭ_qua＝ｒａｔｉｏ＿ｔａｂｌ［ｒａｔｉｏ＿ｉｄｘ＿ｉｎｉｔ＿ＳＭ］
である。

例えば、方法は、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の量子化エンコードされた初期値を、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数として直接的に使用し、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の初期エンコードされたインデックスを、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数のエンコードされたインデックスとして直接的に使用することである。

現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数のエンコードされたインデックスｒａｔｉｏ＿ｉｄｘ＿ＳＭは、
ｒａｔｉｏ＿ｉｄｘ＿ＳＭ＝ｒａｔｉｏ＿ｉｄｘ＿ｉｎｉｔ＿ＳＭ
を満たす。

現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数は、
ｒａｔｉｏ＿ＳＭ＝ｒａｔｉｏ＿ｔａｂｌ［ｒａｔｉｏ＿ｉｄｘ＿ＳＭ］
を満たす。

別の方法は、以前のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数のエンコードされたインデックス又は以前のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数に基づいて、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の量子化エンコードされた初期値及び現在のフレームのための反相関信号チャンネル組み合わせスキームに対応する初期エンコードされたインデックスを修正し、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の修正されたエンコードされたインデックスを、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数のエンコードされたインデックスとして使用し、反相関信号チャンネル組み合わせスキームに対応する修正されたチャンネル組み合わせ比係数を、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数として使用することであってよい。

現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数のエンコードされたインデックスｒａｔｉｏ＿ｉｄｘ＿ＳＭは、
ｒａｔｉｏ＿ｉｄｘ＿ＳＭ＝φ＊ｒａｔｉｏ＿ｉｄｘ＿ｉｎｉｔ＿ＳＭ＋（１－φ）＊ｔｄｍ＿ｌａｓｔ＿ｒａｔｉｏ＿ｉｄｘ＿ＳＭ
を満たす。

本明細書において、ｒａｔｉｏ＿ｉｄｘ＿ｉｎｉｔ＿ＳＭは、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応する初期エンコードされたインデックスを示し、ｔｄｍ＿ｌａｓｔ＿ｒａｔｉｏ＿ｉｄｘ＿ＳＭは、以前のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数のエンコードされたインデックスであり、

は、反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数の修正係数である。

の値は経験値であってよく、

は、例えば、０．８に等しくてよい。

別の方法は、反相関信号チャンネル組み合わせスキームに対応する量子化されていないチャンネル組み合わせ比係数を、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数として使用することである。言い換ると、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数ｒａｔｉｏ＿ＳＭは、

を満たす。

加えて、第４の方法は、以前のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数に基づいて現在のフレームのための反相関信号チャンネル組み合わせスキームに対応する量子化されていないチャンネル組み合わせ比係数を修正し、反相関信号チャンネル組み合わせスキームに対応する修正されたチャンネル組み合わせ比係数を、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数として使用し、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数のエンコードされたインデックスを取得するために、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数に対して量子化エンコーディングを実行することである。

上述の方法に加えて、左チャンネルと右チャンネルとの間の振幅相関差パラメータをチャンネル組み合わせ比係数へと変換し、エンコーディング及び量子化を実行するための多くの方法があることがある。同様に、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数及びチャンネル組み合わせ比係数のエンコードされたインデックスを決定するための多くの異なる方法があることがある。これは、本出願では限定されない。

９０９．現在のフレームの符号化モードを決定するために、以前のフレームのチャンネル組み合わせスキームフラグ及び現在のフレームのチャンネル組み合わせスキームフラグに基づいて符号化モード判定を実行する。

現在のフレームのチャンネル組み合わせスキームフラグはｔｍｄ＿ＳＭ＿ｆｌａｇと表記され、以前のフレームのチャンネル組み合わせスキームフラグはｔｍｄ＿ｌａｓｔ＿ＳＭ＿ｆｌａｇと表記され、以前のフレームのチャンネル組み合わせスキームフラグと現在のフレームのチャンネル組み合わせスキームフラグのジョイントフラグは（ｔｍｄ＿ｌａｓｔ＿ＳＭ＿ｆｌａｇ、ｔｍｄ＿ＳＭ＿ｆｌａｇ）と表記され得る。符号化モード判定は、ジョイントフラグに基づいて実行されることがある。詳細は、以下の例において与えられる。

相関信号チャンネル組み合わせスキームは０によって表され、反相関信号チャンネル組み合わせスキームは１によって表されると仮定される。このケースでは、以前のフレームと現在のフレームのチャンネル組み合わせスキームフラグのジョイントフラグは、以下の４つのケース即ち（０１）、（１１）、（１０）、及び（００）を有し、現在のフレームの符号化モードは、相関信号符号化モード、反相関信号符号化モード、相関から反相関信号符号化への切り換えモード、及び反相関から相関信号符号化への切り換えモードとして決定される。例えば、以前のフレーム及び現在のフレームのチャンネル組み合わせスキームフラグのジョイントフラグが（００）である場合、それは、現在のフレームの符号化モードが相関信号符号化モードであることを示す。以前のフレーム及び現在のフレームのチャンネル組み合わせスキームフラグのジョイントフラグが（１１）である場合、それは、現在のフレームの符号化モードが反相関信号符号化モードであることを示す。以前のフレーム及び現在のフレームのチャンネル組み合わせスキームフラグのジョイントフラグが（０１）である場合、それは、現在のフレームの符号化モードが相関から反相関信号符号化への切り換えモードであることを示す。又は、以前のフレーム及び現在のフレームのチャンネル組み合わせスキームフラグのジョイントフラグが（１０）である場合、それは、現在のフレームの符号化モードが反相関から相関信号符号化への切り換えモードであることを示す。

９１０．現在のフレームの符号化モードｓｔｅｒｅｏ＿ｔｄｍ＿ｃｏｄｅｒ＿ｔｙｐｅを取得した後、エンコーディング装置は、現在のフレームにおけるプライマリ及びセカンダリチャンネル信号を取得するために、現在のフレームの符号化モードに対応する時間領域ダウンミックス処理方法に基づいて現在のフレームにおける左及び右チャンネル信号に対して時間領域ダウンミックス処理を実行する。

現在のフレームの符号化モードは、複数の符号化モードのうちの１つである。例えば、複数の符号化モードは、相関から反相関信号符号化への切り換えモードと、反相関から相関信号符号化への切り換えモードと、相関信号符号化モードと、反相関信号符号化モードとを含むことがある。異なる符号化モードにおける時間領域ダウンミックス処理の実装については、上述の実施形態における例の関連説明を参照されたい。詳細は、本明細書では再度説明されない。

９１１．エンコーディング装置は、エンコードされたプライマリチャンネル信号及びエンコードされたセカンダリチャンネル信号を取得するために、プライマリチャンネル信号とセカンダリチャンネル信号を別々にエンコードする。

具体的には、ビット割り当ては、以前のフレームにおけるプライマリチャンネル信号及び／又はセカンダリチャンネル信号のエンコーディングにおいて取得されたパラメータ情報並びにプライマリ及びセカンダリチャンネル信号をエンコードするためのビットの総量に基づいて、プライマリチャンネル信号のエンコーディング及びセカンダリチャンネル信号のエンコーディングのために、最初に実行されることがある。その後、プライマリチャンネル信号とセカンダリチャンネル信号は、プライマリチャンネルエンコーディングのエンコードされたインデックス及びセカンダリチャンネルエンコーディングのエンコードされたインデックスを取得するために、ビット割り当ての結果に基づいて別々にエンコードされる。プライマリチャンネルエンコーディング及びセカンダリチャンネルエンコーディングは、任意のモノラルオーディオエンコーディング技術を使用することによって実施されてよく、このモノラルオーディオエンコーディング技術は、本明細書ではさらに説明されない。

９１２．エンコーディング装置は、チャンネル組み合わせスキームフラグに基づいてチャンネル組み合わせ比係数の対応するエンコードされたインデックスを選択し、エンコードされたインデックスをビットストリームへと書き込み、エンコードされたプライマリチャンネル信号、エンコードされたセカンダリチャンネル信号、及び現在のフレームのチャンネル組み合わせスキームフラグをビットストリームへと書き込む。

具体的には、例えば、現在のフレームのチャンネル組み合わせスキームフラグｔｄｍ＿ＳＭ＿ｆｌａｇが相関信号チャンネル組み合わせスキームに対応する場合、現在のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数のエンコードされたインデックスｒａｔｉｏ＿ｉｄｘがビットストリームへと書き込まれる。又は、現在のフレームのチャンネル組み合わせスキームフラグｔｄｍ＿ＳＭ＿ｆｌａｇが反相関信号チャンネル組み合わせスキームに対応する場合、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数のエンコードされたインデックスｒａｔｉｏ＿ｉｄｘ＿ＳＭがビットストリームへと書き込まれる。例えば、ｔｄｍ＿ＳＭ＿ｆｌａｇ＝０である場合、現在のフレームのための相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数のエンコードされたインデックスｒａｔｉｏ＿ｉｄｘがビットストリームへと書き込まれる。又は、ｔｄｍ＿ＳＭ＿ｆｌａｇ＝１である場合、現在のフレームのための反相関信号チャンネル組み合わせスキームに対応するチャンネル組み合わせ比係数のエンコードされたインデックスｒａｔｉｏ＿ｉｄｘ＿ＳＭがビットストリームへと書き込まれる。

加えて、エンコードされたプライマリチャンネル信号、エンコードされたセカンダリチャンネル信号、及び現在のフレームのチャンネル組み合わせスキームフラグが、ビットストリームへと書き込まれる。ビットストリーム書き込み動作を実行するための順序はないことが理解され得る。

これに対応して、以下は、例を使用することによって時間領域ステレオデコーディングシナリオについて説明する。

図１０を参照すると、以下は、オーディオデコーディング方法をさらに提供する。オーディオデコーディング方法の関連ステップは、具体的にはデコーディング装置によって実施されてよく、方法は、具体的には、以下のステップを含むことがある。

１００１．現在のフレームにおけるデコードされたプライマリ及びセカンダリチャンネル信号を取得するために、ビットストリームに基づいたデコーディングを実行する。

１００２．現在のフレームの時間領域ステレオパラメータを取得するために、ビットストリームに基づいてデコーディングを実行する。

現在のフレームの時間領域ステレオパラメータは、現在のフレームのチャンネル組み合わせ比係数を含み（ビットストリームは、現在のフレームのチャンネル組み合わせ比係数のエンコードされたインデックスを含み、デコーディングは、現在のフレームのチャンネル組み合わせ比係数を取得するために現在のフレームのチャンネル組み合わせ比係数のエンコードされたインデックスに基づいて実行されることがある）、現在のフレームのチャンネル間時間差などをさらに含んでよい（例えば、ビットストリームは、現在のフレームのチャンネル間時間差のエンコードされたインデックスを含み、デコーディングは、現在のフレームのチャンネル間時間差を取得するために、現在のフレームのチャンネル間時間差のエンコードされたインデックスに基づいて実行されることがある。又は、ビットストリームは、現在のフレームのチャンネル間時間差の絶対値のエンコードされたインデックスを含み、デコーディングは、現在のフレームのチャンネル間時間差の絶対値を取得するために、現在のフレームのチャンネル間時間差の絶対値のエンコードされたインデックスに基づいて実行されることがある）。

１００３．ビットストリームに基づいて、ビットストリーム内に含まれる現在のフレームのチャンネル組み合わせスキームフラグを取得し、現在のフレームのためのチャンネル組み合わせスキームを決定する。

１００４．現在のフレームのためのチャンネル組み合わせスキーム及び以前のフレームのためのチャンネル組み合わせスキームに基づいて、現在のフレームのデコーディングモードを決定する。

現在のフレームのためのチャンネル組み合わせスキーム及び以前のフレームのためのチャンネル組み合わせスキームに基づいて現在のフレームのデコーディングモードを決定することについては、ステップ９０９において現在のフレームの符号化モードを決定するための方法を参照されたい。現在のフレームのデコーディングモードは、複数のデコーディングモードのうちの１つである。例えば、複数のデコーディングモードは、相関から反相関信号デコーディングへの切り換えモードと、反相関から相関信号デコーディングへの切り換えモードと、相関信号デコーディングモードと、反相関信号デコーディングモードとを含むことがある。符号化モードとデコーディングモードは、１対１の対応をとる。

例えば、以前のフレーム及び現在のフレームのチャンネル組み合わせスキームフラグのジョイントフラグが（００）である場合、それは、現在のフレームのデコーディングモードが相関信号デコーディングモードであることを示す。以前のフレーム及び現在のフレームのチャンネル組み合わせスキームフラグのジョイントフラグが（１１）である場合、それは、現在のフレームのデコーディングモードが反相関信号デコーディングモードであることを示す。以前のフレーム及び現在のフレームのチャンネル組み合わせスキームフラグのジョイントフラグが（０１）である場合、それは、現在のフレームのデコーディングモードが相関から反相関信号デコーディングへの切り換えモードであることを示す。又は、以前のフレーム及び現在のフレームのチャンネル組み合わせスキームフラグのジョイントフラグが（１０）である場合、それは、現在のフレームのデコーディングモードが反相関から相関信号デコーディングへの切り換えモードであることを示す。

ステップ１００１、ステップ１００２、及びステップ１００３、及び１００４を実行するための必要な順序はないことが理解され得る。

１００５．現在のフレームにおける再構成された左及び右チャンネル信号を取得するために、現在のフレームの決定されたデコーディングモードに対応する時間領域アップミックス処理方式を使用することによって現在のフレームにおけるデコードされたプライマリ及びセカンダリチャンネル信号に対して時間領域アップミックス処理を実行する。

異なるデコーディングモードにおける時間領域アップミックス処理の関連実装については、上述の実施形態における例の関連説明を参照されたい。詳細は、本明細書では再度説明されない。

時間領域アップミックス処理のために使用されるアップミックス行列は、現在のフレームの取得されたチャンネル組み合わせ比係数に基づいて構築される。

現在のフレームにおける再構成された左及び右チャンネル信号は、現在のフレームにおけるデコードされた左及び右チャンネル信号として使用されることがある。

或いは、さらに、遅延調整が、現在のフレームにおける遅延調整を施された再構成された左及び右チャンネル信号を取得するために、現在のフレームのチャンネル間時間差に基づいて現在のフレームにおける再構成された左及び右チャンネル信号に対して実行されることがあり、現在のフレームにおける遅延調整を施された再構成された左及び右チャンネル信号は、現在のフレームにおけるデコードされた左及び右チャンネル信号として使用されることがある。或いは、さらに、時間領域後処理が、現在のフレームにおける遅延調整を施された再構成された左及び右チャンネル信号に対して実行されることがあり、現在のフレームにおける時間領域後処理を施された再構成された左及び右チャンネル信号は、現在のフレームにおけるデコードされた左及び右チャンネル信号として使用されることがある。

上述の内容は、本出願の実施形態における方法について詳細に説明する。以下は、本出願の実施形態における装置について説明する。

図１１－Ａを参照すると、本出願の実施形態は、装置１１００をさらに提供する。装置１１００は、
互いに結合されたプロセッサ１１１０とメモリ１１２０であって、プロセッサ１１１０は、本出願の実施形態において提供される任意の方法のいくつか又は全てのステップを実行することがあるように構成される、プロセッサ１１１０とメモリ１１２０と
を含むことがある。

メモリ１１２０は、限定されるものではないが、ランダムアクセスメモリ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ、ＲＡＭ）、読み出し専用メモリ（Ｒｅａｄ－ＯｎｌｙＭｅｍｏｒｙ、ＲＯＭ）、消去可能プログラマブル読み出し専用メモリ（ＥｒａｓａｂｌｅＰｒｏｇｒａｍｍａｂｌｅＲｅａｄＯｎｌｙＭｅｍｏｒｙ、ＥＰＲＯＭ）、又はコンパクトディスク読み出し専用メモリ（ＣｏｍｐａｃｔＤｉｓｃＲｅａｄ－ＯｎｌｙＭｅｍｏｒｙ、ＣＤ－ＲＯＭ）を含み得る。メモリ１１０２は、関連命令及び関連データを記憶するように構成される。

もちろん、装置１１００は、データを受信及び送信するように構成されたトランシーバ１１３０をさらに含むことがある。

プロセッサ１１１０は、１つ又は複数の中央処理ユニット（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ、ＣＰＵ）であってよい。プロセッサ１１１０が１つのＣＰＵであるとき、ＣＰＵは、シングルコアＣＰＵであってもよいし、マルチコアＣＰＵであってもよい。プロセッサ１１１０は、具体的には、デジタル信号プロセッサであってよい。

実装処理では、上述の方法におけるステップは、プロセッサ１１１０におけるハードウェア集積論理回路を使用することによって、又はソフトウェアの形式をした命令を使用することによって、実装可能である。プロセッサ１１１０は、汎用プロセッサであってもよいし、デジタル信号プロセッサであってもよいし、特定用途向け集積回路であってもよいし、フィールドプログラマブルゲートアレイ又は別のプログラマブル論理デバイスであってもよいし、ディスクリートゲート又はトランジスタ論理デバイスであってもよいし、ディスクリートハードウェア構成要素であってもよい。プロセッサ１１１０は、本発明の実施形態に開示されている方法、ステップ、及び論理ブロック図を実装又は実行してよい。汎用プロセッサはマイクロプロセッサであってもよいし、プロセッサは、任意の従来のプロセッサなどであってもよい。本発明の実施形態に関して開示される方法のステップは、ハードウェアデコーディングプロセッサを使用することによって直接的に実行され、成し遂げられてもよいし、デコーディングプロセッサにおけるハードウェアモジュールとソフトウェアモジュールの組み合わせを使用することによって実行され、成し遂げられてもよい。

ソフトウェアモジュールは、ランダムアクセスメモリ、フラッシュメモリ、読み出し専用メモリ、プログラマブル読み出し専用メモリ、電気消去可能プログラマブルメモリ、又はレジスタなどの、当技術分野における成熟した記憶媒体内に配置されてよい。記憶媒体は、メモリ１１２０内に配置される。例えば、プロセッサ１１１０は、メモリ１１２０における情報を読み出し、プロセッサ１１１０のハードウェアと組み合わせて、上述の方法におけるステップを完了してよい。

さらに、装置１１００は、トランシーバ１１３０をさらに含むことがある。トランシーバ１１３０は、例えば、関連データ（例えば、命令、チャンネル信号、又はビットストリーム）を受信及び送信するように構成されることがある。例えば、装置１１００は、図２から図９－Ｄに示される任意の実施形態における対応する方法のいくつか又は全てのステップを実行することがある。

具体的には、例えば、装置１１００が上述のエンコーディングの関連ステップを実行するとき、装置１１００は、エンコーディング装置（又はオーディオエンコーディング装置）と呼ばれることがある。装置１１００が上述のデコーディングの関連ステップを実行するとき、装置１１００は、デコーディング装置（又はオーディオデコーディング装置）と呼ばれることがある。

図１１－Ｂを参照すると、装置１１００がエンコーディング装置であるとき、例えば、装置１１００は、マイクロホン１１４０と、アナログ－デジタル変換器１１５０などをさらに含むことがある。

例えば、マイクロホン１１４０は、アナログオーディオ信号を取得するためにサンプリングを実行するように構成されることがある。

例えば、アナログ－デジタル変換器１１５０は、アナログオーディオ信号をデジタルオーディオ信号に変換するように構成されることがある。

図１１－Ｃを参照すると、装置１１００がエンコーディング装置であるとき、例えば、装置１１００は、スピーカ１１６０と、デジタル－アナログ変換器１１７０などをさらに含むことがある。

例えば、デジタル－アナログ変換器１１７０は、デジタルオーディオ信号をアナログオーディオ信号へと変換するように構成されることがある。

例えば、スピーカ１１６０は、アナログオーディオ信号を再生するように構成されることがある。

加えて、図１２－Ａを参照すると、本出願の実施形態は、本出願の実施形態において提供される任意の方法を実施するように構成されたいくつかの機能ユニットを含む装置１２００を提供する。

例えば、装置１２００が、図２に示される実施形態における対応する方法を実行するとき、装置１２００は、
現在のフレームのためのチャンネル組み合わせスキームを決定し、以前のフレームのためのチャンネル組み合わせスキーム及び現在のフレームのためのチャンネル組み合わせスキームに基づいて現在のフレームの符号化モードを決定するように構成された第１の決定ユニット１２１０と、
現在のフレームにおけるプライマリ及びセカンダリチャンネル信号を取得するために、現在のフレームの符号化モードに対応する時間領域ダウンミックス処理に基づいて現在のフレームにおける左及び右チャンネル信号に対して時間領域ダウンミックス処理を実行するように構成されたエンコーディングユニット１２２０と
を含むことがあることがある。

さらに、図１２－Ｂを参照すると、装置１２００は、現在のフレームの時間領域ステレオパラメータを決定するように構成された第２の決定ユニット１２３０をさらに含むことがある。エンコーディングユニット１２２０は、現在のフレームの時間領域ステレオパラメータをエンコードするようにさらに構成されることがある。

別の例では、図１２－Ｃを参照すると、装置１２００が、図３に示される実施形態における対応する方法を実行するとき、装置１２００は、
ビットストリーム内にある現在のフレームのチャンネル組み合わせスキームフラグに基づいて現在のフレームのためのチャンネル組み合わせスキームを決定し、以前のフレームのためのチャンネル組み合わせスキーム及び現在のフレームのためのチャンネル組み合わせスキームに基づいて現在のフレームのデコーディングモードを決定するように構成された第３の決定ユニット１２４０と、
現在のフレームにおけるデコードされたプライマリ及びセカンダリチャンネル信号を取得するためにビットストリームに基づいてデコーディングを実行し、現在のフレームにおける再構成された左及び右チャンネル信号を取得するために現在のフレームのデコーディングモードに対応する時間領域アップミックス処理に基づいて現在のフレームにおけるデコードされたプライマリ及びセカンダリチャンネル信号に対して時間領域アップミックス処理を実行するように構成されたデコーディングユニット１２５０と
を含むことがある。

装置が別の方法を実行するケースが、類推によって推測される。

本出願の実施形態は、コンピュータ可読記憶媒体を提供する。コンピュータ可読記憶媒体はプログラムコードを記憶し、このプログラムコードは、本出願の実施形態において提供される任意の方法におけるいくつか又は全てのステップを実行するための命令を含むことがある。

本出願の実施形態は、コンピュータプログラム製品を提供する。コンピュータプログラム製品がコンピュータ上で走らされるとき、コンピュータは、本出願の実施形態において提供される任意の方法におけるいくつか又は全てのステップを実行することが可能である。

上述の実施形態においては、全ての実施形態の説明は、それぞれの焦点を有する。実施形態において詳細に説明されない部分については、別の実施形態における関連説明を参照されたい。

本出願において提供されるいくつかの実施形態においては、開示される装置が別の方式で実施されてよいことが理解されるべきである。例えば、説明される装置実施形態は例にすぎない。例えば、ユニット分割は、論理機能分割にすぎず、又は実際の実装では他の分割であってよい。例えば、複数のユニット又は構成要素は組み合わされてもよいし、別のシステムへと統合されてもよく、又は、いくつかの特徴が無視されてもよいし、実行されなくてもよい。加えて、表示又は説明される相互の間接的な結合若しくは直接的な結合又は通信接続は、いくつかのインタフェースを使用することによって実施されてよい。装置若しくはユニット間の間接的な結合又は通信接続は、電子的形式で実施されてもよいし、他の形式で実施されてもよい。

別個の部分として説明されるユニットは、物理的に分離されてもよいし、物理的に分離されなくてもよく、ユニットとして表示される構成要素は、物理ユニットであってもよいし、物理ユニットでなくてもよい。具体的に言えば、構成要素は、１つの位置に配置されてもよいし、複数のネットワークユニット上に分散されてもよい。ユニットのうちのいくつか又は全ては、実施形態のソリューションの目的を達成するために、実際の必要性に従って選択されてよい。

加えて、本発明の実施形態における機能ユニットは１つの処理ユニットへと統合されてもよいし、又は、ユニットの各々が物理的に単独で存在してもよいし、又は、２つ以上のユニットが１つのユニットへと統合される。統合されたユニットは、ハードウェアの形式で実施されてもよいし、ソフトウェア機能ユニットの形式で実施されてもよい。

統合されたユニットがソフトウェア機能ユニットの形式で実施され、独立した製品として販売又は使用されるとき、統合されたユニットは、コンピュータ可読記憶媒体内に記憶されることがある。そのような理解に基づいて、本発明の技術的ソリューションは本質的に、又は従来技術に寄与する部分、又は技術的ソリューションの全て若しくは一部は、ソフトウェア製品の形式で実施されることがある。コンピュータソフトウェア製品は、記憶媒体内に記憶され、本発明の実施形態において説明される方法のステップの全て又は一部を実行するようにコンピュータデバイス（パーソナルコンピュータ、サーバ、ネットワークデバイスなどであってよい）指示するためのいくつかの命令を含む。上述の記憶媒体は、ＵＳＢフラッシュドライブ、読み出し専用メモリ（ＲＯＭ、Ｒｅａｄ－ＯｎｌｙＭｅｍｏｒｙ）、ランダムアクセスメモリ（ＲＡＭ、ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）、リムーバブルハードディスク、磁気ディスク、又は光ディスクなどの、プログラムコードを記憶することができる任意の媒体を含む。

Claims

音声信号エンコーダによって実行される音声信号符号化方法であって、前記方法は、
音声信号の現在のフレームの信号タイプを決定するステップであって、前記現在のフレームの前記信号タイプは、同位相に近いタイプ又は逆位相に近いタイプのいずれかである、ステップと、
前記現在のフレームの前記信号タイプに従って、現在のフレームの符号化モードを取得するステップと、
前記符号化モードに従って、前記現在のフレームのプライマリチャンネル信号及びセカンダリチャンネル信号を取得するステップと、
前記現在のフレームの前記取得されたプライマリ及びセカンダリチャンネル信号を符号化するステップと、
を含み、
前記符号化モードに従って、前記現在のフレームの前記プライマリチャンネル信号及び前記セカンダリチャンネル信号を取得する前記ステップは、
前記符号化モードに対応する第１の比係数に基づいて、前記現在のフレームの左チャンネル信号及び右チャンネル信号上での時間領域ミックス処理を実行して、前記プライマリ及びセカンダリチャンネル信号を取得ステップ、又は、
前記符号化モードに対応する第１の比係数、及び前のフレームの符号化モードに対応する第２の比係数に基づいて、前記現在のフレームの左チャンネル信号及び右チャンネル信号上での時間領域ミックス処理を実行して、前記現在のフレームの前記プライマリ及びセカンダリチャンネル信号を取得するステップ
を含み、
前記時間領域ミックス処理が前記第１の比係数及び前記第２の比係数に従って実行されるとき、前記現在のフレームの前記左及び右チャンネル信号と、前記現在のフレームの前記プライマリ及びセカンダリ信号とは、以下の式、即ち、
０≦ｎ＜Ｎ－ｄｅｌａｙ＿ｃｏｍである場合には、

又は、Ｎ－ｄｅｌａｙ＿ｃｏｍ≦ｎ＜Ｎである場合には、

を満たし、ここで、Ｘ _L （ｎ）は、前記左チャンネル信号を表し、Ｘ _R （ｎ）は、前記右チャンネル信号を表し、Ｙ（ｎ）は、前記プライマリチャンネル信号を表し、Ｘ（ｎ）は、前記セカンダリチャンネル信号を表し、
ｎは、サンプリング点の番号を表し、ｄｅｌａｙ＿ｃｏｍは、符号化遅延補償を表し、Ｍ ₂₂ は、前記現在のフレームの前記符号化モードに対応するミックス行列を表し、Ｍ ₂₂ は、前記第１の比係数に基づいて構築され、Ｍ ₁₂ は、前記前のフレームの前記符号化モードに対応するミックス行列を表し、Ｍ ₁₂ は、前記第２の比係数に基づいて構築される、
音声信号符号化方法。
音声信号エンコーダによって実行される音声信号符号化方法であって、前記方法は、
音声信号の現在のフレームの信号タイプを決定するステップであって、前記現在のフレームの前記信号タイプは、同位相に近いタイプ又は逆位相に近いタイプのいずれかである、ステップと、
前記現在のフレームの前記信号タイプに従って、現在のフレームの符号化モードを取得するステップと、
前記符号化モードに従って、前記現在のフレームのプライマリチャンネル信号及びセカンダリチャンネル信号を取得するステップと、
前記現在のフレームの前記取得されたプライマリ及びセカンダリチャンネル信号を符号化するステップと、
を含み、
前記符号化モードに従って、前記現在のフレームの前記プライマリチャンネル信号及び前記セカンダリチャンネル信号を取得する前記ステップは、
前記符号化モードに対応する第１の比係数に基づいて、前記現在のフレームの左チャンネル信号及び右チャンネル信号上での時間領域ミックス処理を実行して、前記プライマリ及びセカンダリチャンネル信号を取得ステップ、又は、
前記符号化モードに対応する第１の比係数、及び前のフレームの符号化モードに対応する第２の比係数に基づいて、前記現在のフレームの左チャンネル信号及び右チャンネル信号上での時間領域ミックス処理を実行して、前記現在のフレームの前記プライマリ及びセカンダリチャンネル信号を取得するステップ
を含み、
前記第１の比係数及び前記第２の比係数に従って時間領域ミックス処理が実行されるとき、前記現在のフレームの前記左及び右チャンネル信号と、前記現在のフレームの前記プライマリ及びセカンダリ信号とは、以下の式、即ち、
０≦ｎ＜Ｎ－ｄｅｌａｙ＿ｃｏｍである場合には、

又は、Ｎ－ｄｅｌａｙ＿ｃｏｍ≦ｎ＜Ｎ－ｄｅｌａｙ＿ｃｏｍ＋ＮＯＶＡ＿１である場合には、

又は、Ｎ－ｄｅｌａｙ＿ｃｏｍ＋ＮＯＶＡ＿１≦ｎ＜Ｎである場合には、

を満たし、ここで、ｆａｄｅ＿ｉｎ（ｎ）は、フェードイン係数を表し、

であり、ｆａｄｅ＿ｏｕｔ（ｎ）は、フェードアウト係数を表し、

であり、ＮＯＶＡ＿１は、移行処理長を表し、ｎは、サンプリング点の番号を表し、ｎ＝０，１，…，Ｎ－１であり、Ｘ_L（ｎ）は、前記左チャンネル信号を表し、Ｘ_R（ｎ）は、前記右チャンネル信号を表し、Ｙ（ｎ）は、前記プライマリチャンネル信号を表し、Ｘ（ｎ）は、前記セカンダリチャンネル信号を表し、ｄｅｌａｙ＿ｃｏｍは、符号化遅延補償を表し、Ｍ₂₂は、前記現在のフレームの前記符号化モードに対応するミックス行列を表し、Ｍ₂₂は、前記第１の比係数に基づいて構築され、Ｍ₁₂は、前記前のフレームの前記符号化モードに対応するミックス行列を表し、Ｍ₁₂は、前記第２の比係数に基づいて構築される、
音声信号符号化方法。
又は

又は

又は

又は

又は

であり、ここで、α₁＝ｒａｔｉｏ＿ＳＭ、α₂＝１－ｒａｔｉｏ＿ＳＭであり、ｒａｔｉｏ＿ＳＭは、前記第１の比係数を表す、
請求項１又は２に記載の方法。
又は

又は

又は

又は

又は

であり、ここで、α_{1_pre}＝ｔｄｍ＿ｌａｓｔ＿ｒａｔｉｏ＿ＳＭ、α_{2_pre}＝１－ｔｄｍ＿ｌａｓｔ＿ｒａｔｉｏ＿ＳＭであり、ｔｄｍ＿ｌａｓｔ＿ｒａｔｉｏ＿ＳＭは、前記第２の比係数を表す、
請求項１～３のいずれか１項に記載の方法。
又は

又は

であり、ここで、ｘ_L（ｎ）は、前記現在のフレームのオリジナルの左チャンネル信号を表し、ｘ_R（ｎ）は、前記現在のフレームのオリジナルの右チャンネル信号を表し、ｘ_{L_HP}（ｎ）は、時間領域前処理を受けた、前記現在のフレームの左チャンネル信号を表し、ｘ_{R_HP}（ｎ）は、時間領域前処理を受けた、前記現在のフレームの右チャンネル信号を表す、ｘ’_L（ｎ）は、遅延アライメントを受けた、前記現在のフレームの左チャンネル信号を表し、ｘ’_R（ｎ）は、遅延アライメントを受けた、前記現在のフレームの右チャンネル信号を表す、
請求項１～４のいずれか１項に記載の方法。
音声信号デコーダによって実行される音声信号デコーディング方法であって、前記方法は、
受信されたビットストリームに基づいて、音声信号の現在のフレームのデコードされたプライマリチャンネル信号及びセカンダリチャンネル信号を取得するステップと、
前記現在のフレームの信号タイプを取得するステップであって、前記現在のフレームの前記信号タイプは、同位相に近いタイプ又は逆位相に近いタイプのいずれかである、ステップと、
前記信号タイプに基づいて、前記現在のフレームのデコーディングモードを取得するステップと、
前記デコードされたプライマリチャンネル信号と、前記デコードされたセカンダリチャンネル信号と、前記デコーディングモードとに基づいて、前記現在のフレームの再構築された左チャンネル信号及び再構築された右チャンネル信号を取得するステップと、
を含み、
前記現在のフレームの再構築された左チャンネル信号及び再構築された右チャンネル信号を取得するステップは、
前記現在のフレームの前記デコーディングモードに対応する第１の比係数に基づいて、前記デコードされたプライマリ及びセカンダリチャンネル信号上での時間領域ミックス処理を実行して、前記再構築された左及び右チャンネル信号を取得するステップ、又は
前記現在のフレームの前記デコーディングモードに対応する第１の比係数、及び前のフレームのデコーディングモードに対応する第２の比係数に基づいて、前記デコードされたプライマリ及びセカンダリチャンネル信号上での時間領域ミックス処理を実行して、前記再構築された左及び右チャンネル信号を取得するステップ
を含み、
前記第１の比係数、及び前記第２の比係数に基づいて前記時間領域ミックス処理が実行されるとき、前記再構築された左及び右チャンネル信号と、前記デコードされたプライマリ及びセカンダリ信号は、以下の式、即ち、
０≦ｎ＜Ｎ－ｕｐｍｉｘｉｎｇ＿ｄｅｌａｙである場合には、

又は、Ｎ－ｕｐｍｉｘｉｎｇ＿ｄｅｌａｙ≦ｎ＜Ｎである場合には、

を満たし、ここで、

は、前記再構築された左チャンネル信号を表し、

は、前記再構築された右チャンネル信号を表し、

は、前記デコードされたプライマリチャンネル信号を表し、

は、前記デコードされたセカンダリチャンネル信号を表し、ｎは、サンプリング点の番号を表し、ｎ＝０，１，…，Ｎ－１であり、ｕｐｍｉｘｉｎｇ＿ｄｅｌａｙは、デコーディング遅延補償を表し、

は、前記現在のフレームの前記デコーディングモードに対応するミックス行列を表し、

は、前記第１の比係数に基づいて構築され、

は、前記前のフレームの前記デコーディングモードに対応するミックス行列を表し、

は、前記第２の比係数に基づいて構築される、
音声信号デコーディング方法。
音声信号デコーダによって実行される音声信号デコーディング方法であって、前記方法は、
受信されたビットストリームに基づいて、音声信号の現在のフレームのデコードされたプライマリチャンネル信号及びセカンダリチャンネル信号を取得するステップと、
前記現在のフレームの信号タイプを取得するステップであって、前記現在のフレームの前記信号タイプは、同位相に近いタイプ又は逆位相に近いタイプのいずれかである、ステップと、
前記信号タイプに基づいて、前記現在のフレームのデコーディングモードを取得するステップと、
前記デコードされたプライマリチャンネル信号と、前記デコードされたセカンダリチャンネル信号と、前記デコーディングモードとに基づいて、前記現在のフレームの再構築された左チャンネル信号及び再構築された右チャンネル信号を取得するステップと、
を含み、
前記現在のフレームの再構築された左チャンネル信号及び再構築された右チャンネル信号を取得するステップは、
前記現在のフレームの前記デコーディングモードに対応する第１の比係数に基づいて、前記デコードされたプライマリ及びセカンダリチャンネル信号上での時間領域ミックス処理を実行して、前記再構築された左及び右チャンネル信号を取得するステップ、又は
前記現在のフレームの前記デコーディングモードに対応する第１の比係数、及び前のフレームのデコーディングモードに対応する第２の比係数に基づいて、前記デコードされたプライマリ及びセカンダリチャンネル信号上での時間領域ミックス処理を実行して、前記再構築された左及び右チャンネル信号を取得するステップ
を含み、
前記第１の比係数、及び前記第２の比係数に基づいて時間領域ミックス処理が実行されるとき、前記再構築された左及び右チャンネル信号と、前記デコードされたプライマリ及びセカンダリチャンネル信号とは、以下の式、即ち、
０≦ｎ＜Ｎ－ｕｐｍｉｘｉｎｇ＿ｄｅｌａｙである場合には、

又は、Ｎ－ｕｐｍｉｘｉｎｇ＿ｄｅｌａｙ≦ｎ＜Ｎ－ｕｐｍｉｘｉｎｇ＿ｄｅｌａｙ＋ＮＯＶＡ＿１である場合には、

又は、Ｎ－ｕｐｍｉｘｉｎｇ＿ｄｅｌａｙ≦ｎ＜Ｎである場合には、

を満たし、ここで、

は、前記再構築された左チャンネル信号を表し、

は、前記再構築された右チャンネル信号を表し、

は、前記デコードされたプライマリチャンネル信号を表し、

は、前記デコードされたセカンダリチャンネル信号を表し、ＮＯＶＡ＿１は、移行処理長を表し、ｆａｄｅ＿ｉｎ（ｎ）は、フェードイン係数を表し、

であり、
ｆａｄｅ＿ｏｕｔ（ｎ）は、フェードアウト係数を表し、

であり、ｎは、サンプリング点の番号を表し、ｎ＝０，１，…，Ｎ－１であり、ｕｐｍｉｘｉｎｇ＿ｄｅｌａｙは、デコーディング遅延補償を表し、

は、前記現在のフレームの前記デコーディングモードに対応するミックス行列を表し、

は、前記第１の比係数に基づいて構築され、

は、前記前のフレームの前記デコーディングモードに対応するミックス行列を表し、

は、前記第２の比係数に基づいて構築される、
音声信号デコーディング方法。
又は

又は

又は

又は

又は

であり、ここで、α₁＝ｒａｔｉｏ＿ＳＭ、α₂＝１－ｒａｔｉｏ＿ＳＭであり、ｒａｔｉｏ＿ＳＭは、前記第１の比係数を表す、
請求項６又は７に記載の方法。
又は

又は

又は

又は

又は

であり、ここで、α_{1_pre}＝ｔｄｍ＿ｌａｓｔ＿ｒａｔｉｏ＿ＳＭ、α_{2_pre}＝１－ｔｄｍ＿ｌａｓｔ＿ｒａｔｉｏ＿ＳＭであり、ｔｄｍ＿ｌａｓｔ＿ｒａｔｉｏ＿ＳＭは、前記第２の比係数を表す、
請求項６～８のいずれか１項に記載の方法。
コンピュータ実行可能命令を格納するためのメモリと、
前記メモリに動作的に接続されたプロセッサと
を備え、前記プロセッサは、請求項１～５のいずれか１項に記載の方法を実行するために前記コンピュータ実行可能命令を実行するように構成される、
音声信号エンコーダ。
コンピュータ実行可能命令を格納するためのメモリと、
前記メモリに動作的に接続されたプロセッサと
を備え、前記プロセッサは、請求項６～９のいずれか１項に記載の方法を実行するために前記コンピュータ実行可能命令を実行するように構成される、
音声信号デコーダ。
そこに記録されたプログラムを有するコンピュータ可読記憶媒体であって、前記プログラムは、コンピュータに請求項１～５のいずれか１項に記載の方法を実行させる、
コンピュータ可読記憶媒体。
そこに記録されたプログラムを有するコンピュータ可読記憶媒体であって、前記プログラムは、コンピュータに請求項６～９のいずれか１項に記載の方法を実行させる、
コンピュータ可読記憶媒体。
請求項１～５のいずれか１項に記載の方法をコンピュータに実行させるように構成された、媒体上に格納されたコンピュータプログラム。
請求項６～９のいずれか１項に記載の方法をコンピュータに実行させるように構成された、媒体上に格納されたコンピュータプログラム。