JP5108772B2 - オーディオ信号のデコーディング方法及び装置 - Google Patents

オーディオ信号のデコーディング方法及び装置 Download PDF

Info

Publication number
JP5108772B2
JP5108772B2 JP2008531017A JP2008531017A JP5108772B2 JP 5108772 B2 JP5108772 B2 JP 5108772B2 JP 2008531017 A JP2008531017 A JP 2008531017A JP 2008531017 A JP2008531017 A JP 2008531017A JP 5108772 B2 JP5108772 B2 JP 5108772B2
Authority
JP
Japan
Prior art keywords
channel
audio signal
information
spatial information
cld
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008531017A
Other languages
English (en)
Other versions
JP2009508175A (ja
JP2009508175A5 (ja
Inventor
スク パン,ヒー
オ オー,ヒェン
ジェ ヒュン リム
スー キム,ドン
ウォン ジュン,ヤン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of JP2009508175A publication Critical patent/JP2009508175A/ja
Publication of JP2009508175A5 publication Critical patent/JP2009508175A5/ja
Application granted granted Critical
Publication of JP5108772B2 publication Critical patent/JP5108772B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing

Description

本発明は、オーディオ信号の処理に係り、より詳細には、オーディオ信号をデコーディングするオーディオ信号のデコーディング方法及び装置に関する。
一般的に、エンコーディング装置がオーディオ信号をエンコーディングする場合において、エンコーディングするオーディオ信号がマルチチャンネルオーディオ信号である場合、マルチチャンネルオーディオ信号を2チャンネルや1チャンネルにダウンミックスしてダウンミックスオーディオ信号を生成し、マルチチャンネルオーディオ信号から空間情報を抽出する。この空間情報は、ダウンミックスオーディオ信号からマルチチャンネルオーディオ信号にアップミキシングするのに使用できる情報である。一方、エンコーディング装置は、定められたツリー構造によってマルチチャンネルオーディオ信号をダウンミックスする。ここで、定められたツリー構造は、オーディオ信号のデコーディング装置とオーディオ信号のエンコーディング装置間で取り決められた構造になりうる。すなわち、定められたツリー構造のうち、どのタイプに該当するかを表す識別情報が存在すると、デコーディング装置は、アップミキシングされた後のオーディオ信号の構造、例えば、チャンネルの本数、各チャンネルの位置がわかる。
このように、エンコーディング装置が、定められたツリー構造によってマルチチャンネルオーディオ信号をダウンミックスすると、この過程で抽出された空間情報もその構造に従属する。したがって、デコーディング装置が、構造に従属した空間情報を用いてダウンミックスオーディオ信号をアップミックスする場合には、その構造によるマルチチャンネルオーディオ信号が生成される。
すなわち、デコーディング装置がエンコーディング装置により生成された空間情報をそのまま用いる場合、エンコーディング装置とデコーディング装置により取り決められた構造にのみアップミックスされるから、取り決められた構造以外の出力チャンネルオーディオ信号が生成されないという問題点があった。例えば、取り決められた構造によって決定されるチャンネルの本数と異なる(少ないまたは多い)チャンネル数のオーディオ信号にはアップミックスすることはできない。
本発明は上記の問題点を解決するためのもので、その目的は、エンコーディング装置で決定された構造以外の構造にオーディオ信号をデコーディングできるようにするオーディオ信号のデコーディング方法及び装置を提供することにある。
本発明の他の目的は、エンコーディングで生成された空間情報を変形した後、変形された空間情報を用いてオーディオ信号をデコーディングできるようにするオーディオ信号のデコーディング方法及び装置を提供することにある。
上記の目的を達成するための本発明の一側面によれば、オーディオ信号及び空間情報を受信する段階と、変形空間情報のタイプを識別する段階と、前記空間情報を用いて前記変形空間情報を生成する段階と、を含み、前記変形空間情報を用いて前記オーディオ信号をデコーディングする段階と、を含み、前記変形空間情報のタイプは、部分空間情報、組合せ空間情報、及び拡大空間情報のうち一つ以上を含むことを特徴とするオーディオ信号のデコーディング方法が提供される。
本発明の他の側面によれば、空間情報を受信する段階と、前記空間情報を用いて組合せ空間情報を生成する段階と、前記組合せ空間情報を用いてオーディオ信号をデコーディングする段階と、を含み、前記組合せ空間情報は、前記空間情報に含まれる空間パラメータを組み合わせて生成されたことを特徴とするオーディオ信号のデコーディング方法が提供される。
本発明のさらに他の側面によれば、一つ以上の空間パラメータを含む空間情報、及び一つ以上のフィルタパラメータを含む空間フィルタ情報を受信する段階と、前記空間パラメータ及び前記フィルタパラメータを組み合わせてサラウンド効果を持つ組合せ空間情報を生成する段階と、前記組合せ空間情報を用いてオーディオ信号を仮想サラウンド信号に変換する段階と、を含む、オーディオ信号のデコーディング方法が提供される。
本発明のさらに他の側面によれば、オーディオ信号を受信する段階と、ツリー構造情報及び空間パラメータを含む空間情報を受信する段階と、前記空間情報に拡張空間情報を追加して変形空間情報を生成する段階と、前記変形空間情報を用いてオーディオ信号をアップミキシングする段階と、を含み、前記アップミキシングする段階は、前記空間情報に基づいて前記オーディオ信号を1次アップミキシング信号に変換する段階と、前記拡張空間情報に基づいて、前記1次アップミキシングオーディオ信号を2次アップミキシングオーディオ信号に変換する段階と、を含むことを特徴とするオーディオ信号のデコーディング方法が提供される。
以下、添付の図面を参照しつつ、本発明の好適な実施例を詳細に説明する。ただし、本明細書及び請求の範囲に使われた用語や単語は、通常のまたは辞典に記載の意味に限定して解釈されてはならず、発明者は自分の発明を最善の方法で説明するために用語の概念を適切に定義することができるという原則に立ち、本発明の技術的思想に符合する意味と概念として解釈されなければならない。したがって、本明細書に記載された実施例と図面に示す構成は、本発明の最も好ましい一実施例に過ぎず、本発明の技術的思想を限定するものではないので、本出願時点においてこれらに取って代わる様々な均等物と変形例が可能であるということは明らかである。
なお、本発明で使われる用語は、可能なかぎり現在広く使われている一般的な用語を選定したが、特定の場合は、出願人が任意に選定した用語もあり、その場合には、該当する発明の説明部分で詳細にその意味を記載しておくので、単純な用語の名称ではなく用語が持つ意味で本発明を把握しなければならない。
本発明は、空間情報を用いて変形空間情報を生成した後、生成された変形空間情報を用いてオーディオ信号をデコーディングする。空間情報は、定められたツリー構造によってダウンミックスされる過程で抽出された空間情報で、変形空間情報は、空間情報を用いて新しく生成された空間情報である。
以下、図1を参照しながら、本発明について具体的に説明する。図1は、本発明の実施例によるオーディオ信号のエンコーディング装置及びデコーディング装置の構成を示す図である。図1を参照すると、オーディオ信号のエンコーディング装置(以下、エンコーディング装置という。)100は、ダウンミックス部110及び空間情報抽出部120を含み、オーディオ信号のデコーディング装置(以下、デコーディング装置という。)200は、出力チャンネル生成部210及び変形空間情報生成部220を含む。
エンコーディング装置100のダウンミックス部110は、マルチチャンネルオーディオ信号IN_Mをダウンミックスしてダウンミックスオーディオ信号dを生成する。ダウンミックスオーディオ信号dは、マルチチャンネルオーディオ信号IN_Mがダウンミックス部110によりダウンミックスされたものであっても良いが、マルチチャンネルオーディオ信号IN_Mが使用者により任意的にダウンミックスされた任意的ダウンミックスオーディオ信号であっても良い。
エンコーディング装置100の空間情報抽出部120は、マルチチャンネルオーディオ信号IN_Mから空間情報sを抽出する。ここで、空間情報は、ダウンミックスオーディオ信号dをマルチチャンネルオーディオ信号IN_Mにアップミックスするのに必要な情報である。一方、空間情報は、マルチチャンネルオーディオ信号IN_Mが定められたツリー構造によってダウンミックスされる過程で抽出された情報となりうる。ここで、定められたツリー構造とは、オーディオ信号のデコーディング装置とオーディオ信号のエンコーディング装置間で取り決められたツリー構造であるが、本発明はこれに限定されることはない。一方、空間情報(spatial information)は、ツリー構造情報、指示子、空間パラメータなどを含むことができる。ここで、ツリー構造情報とは、ツリー構造の類型に関する情報のことをいい、このツリー構造の類型によってマルチチャンネルの本数、チャンネル別ダウンミックス順序などが変わる。指示子は、拡張空間情報が存在するか否かなどを表す情報である。空間パラメータとしては、2本以上のチャンネルが2本以下のチャンネルにダウンミックスされる過程でのチャンネル間レベル差(channel level difference:以下、‘CLD’という。)、チャンネル間相関関係(inter channel coherences:以下、‘ICC’という。)、チャンネル予測係数(channel prediction coefficients:以下、‘CPC’という。)などが挙げられる。一方、空間情報抽出部120は、空間情報の他に、拡張空間情報をさらに抽出できる。ここで、拡張空間情報とは、ダウンミックスオーディオ信号dが空間パラメータによりアップミックスされた後に、追加的に拡張される場合に必要な情報のことで、拡張チャンネル構成情報及び拡張空間パラメータを含むことができる。後ほど説明される拡張空間情報は、空間情報抽出部120により抽出されたものに限定されない。
一方、エンコーディング装置100は、ダウンミックスオーディオ信号dをデコーディングしてダウンミックスオーディオビットストリームを生成するコアコーデックエンコーディング部(図示せず)、空間情報sをエンコーディングして空間情報ビットストリームを生成する空間情報エンコーディング部(図示せず)、及びダウンミックスオーディオビットストリーム及び空間情報ビットストリームを多重化し、オーディオ信号に関するビットストリームを生成する多重化部(図示せず)をさらに備えることができるが、本発明がこれに限定されることはない。
デコーディング装置200は、オーディオ信号に関するビットストリームを、ダウンミックスオーディオビットストリームと空間情報ビットストリームとに分離する逆多重化部(図示せず)、ダウンミックスオーディオビットストリームをデコーディングするコアコーデックデコーディング部(図示せず)、空間情報ビットストリームをデコーディングする空間情報デコーディング部(図示せず)をさらに含むことができるが、本発明はこれに限定されない。
デコーディング装置200の変形空間情報生成部220は、空間情報を用いて変形空間情報のタイプを識別し、空間情報に基づいて識別されたタイプの変形空間情報 (modified spatial information)s’を生成する。ここで、空間情報は、エンコーディング装置100から伝達された空間情報sとなりうる。変形空間情報(modified spatial information)とは、空間情報を用いて新しく生成された空間情報のことをいう。一方、変形空間情報のタイプ(type)は様々なものがあり、変形空間情報のタイプは、a)部分空間情報、b)組合せ空間情報、c)拡大空間情報のうち一つ以上を含むことができるが、本発明はこれに限定されない。部分空間情報は、空間パラメータの一部を含むもので、組合せ空間情報は空間パラメータを組み合わせて生成したもので、拡大空間情報は空間情報及び拡張空間情報を用いて生成したものである。変形空間情報生成部220が変形空間情報を生成する方法は、上のような変形空間情報のタイプによって変わる。各変形空間情報のタイプ別に変形空間情報を生成する方法についての説明は、後ほど具体的に説明する。
一方、変形空間情報の類型を決定する基準は、空間情報のうちのツリー構造情報、空間情報のうちの指示子、出力チャンネル情報などになりうる。ツリー構造情報及び指示子は、エンコーディング装置からの空間情報sに含めることができる。出力チャンネル情報は、デコーディング装置200と連携されているスピーカーに関する情報で、出力チャンネルの数、出力チャンネルのそれぞれの位置情報などを含むことができる。出力チャンネル情報は、製作者により既に入力されているものであっても良く、使用者により入力されるものであっても良い。このような情報を用いて変形空間情報の類型を決定する方法については、後ほどより具体的に説明する。
デコーディング装置200の出力チャンネル生成部210は、変形空間情報s’を用いてダウンミックスオーディオ信号dから出力チャンネルオーディオ信号OUT_Nを生成する。
デコーディング装置200の空間フィルタ情報230は、音響経路に関する情報で、変形空間情報生成部220に提供される。変形空間情報生成部220がサラウンド効果を持つ組合せ空間情報を生成する場合、この空間フィルタ情報を用いることができる。
以下、変形空間情報の類型別に変形空間情報を生成し、オーディオ信号をデコーディングする方法について、(1)部分空間情報、(2)組合せ空間情報、(3)拡大空間情報順に説明する。
(1)部分空間情報
空間パラメータは、マルチチャンネルオーディオ信号が定められたツリー構造にしたがってダウンミックスされる過程で計算されたものであるから、空間パラメータをそのまま用いてダウンミックスオーディオ信号をデコーディングすると、ダウンミックスされる前である元来のマルチチャンネルオーディオ信号に復元される。もし、マルチチャンネルオーディオ信号のチャンネル数(M)よりも出力チャンネルオーディオ信号のチャンネル数(N)を少なくしたい場合、空間パラメータの一部のみを適用してダウンミックスオーディオ信号をデコーディングすることができる。
このような方法は、エンコーディング装置でマルチチャンネルオーディオ信号がダウンミックスされる順序と方法、すなわち、ツリー構造の類型によって変えることができ、当該ツリー構造の類型は空間情報のツリー構造情報を用いて照会することができる。また、このような方法は、出力チャンネルの本数がいくつかによって変えることができ、この出力チャンネルの本数などは、出力チャンネル情報を用いて照会すれば良い。
以下、マルチチャンネルオーディオ信号のチャンネル数よりも出力チャンネルオーディオ信号のチャンネル数が小さい場合、空間パラメータのうち一部を含む部分空間情報を適用してオーディオ信号をデコーディングする方法について、様々なツリー構造を取り上げて説明する。
(1)−1.ツリー構造の第1例(5−2−5ツリー構造)
図2は、部分空間情報を適用する一例を概略的に示す図である。図2の左側を参照すると、チャンネル数が6本であるマルチチャンネルオーディオ信号(左側前方チャンネル(Left Front)L、左側サラウンドチャンネル(Left Surround)LS、センターチャンネルC、低周波チャンネルLFE、右側前方チャンネル(Right Front)R、右側サラウンドチャンネル(Right Surround)RS)が、ステレオダウンミックスチャンネルLo、Roにダウンミックスされる順序及び空間パラメータとの関係が示されている。
まず、左側チャンネルLと左側サラウンドチャンネルLS間のダウンミックスと、センターチャンネルC及び低周波チャンネルLFE間のダウンミックス、右側チャンネルR及び右側サラウンドチャンネルRS間のダウンミックスが行われる。このような第1次ダウンミックス過程で、左側トータルチャンネルLt、センタートータルチャンネルCt、右側トータルチャンネルRtが生成され、この第1次ダウンミックス過程で算出される空間パラメータはCLD2(ICC2含む)、CLD1(ICC1含む)、CLD0(ICC0含む)等である。1次ダウンミックス過程以降の2次ダウンミックス過程では、左側トータルチャンネルLt、センタートータルチャンネルCt、右側トータルチャンネルRtがダウンミックスされて左側チャンネルLo及び右側チャンネルRoが生成され、2次ダウンミックス過程で算出される空間パラメータはCLDTTT、CPCTTT、ICCTTTなどが含まれうる。言い換えると、合計6チャンネルのマルチチャンネルオーディオ信号が、上のような順序にしたがってダウンミックスされてステレオダウンミックスオーディオ信号Lo,Roを生成する。もし、このような順序にしたがって算出された空間パラメータ(CLD2,CLD1,CLD0,CLDTTT等)をそのまま用いる場合、ダウンミックスされた順序の逆順でアップミックスされ、チャンネル数6のマルチチャンネルオーディオ信号(左側前方チャンネルL、左側サラウンドチャンネルLS、センターチャンネルC、低周波チャンネルLFE、右側前方チャンネルR、右側サラウンドチャンネルRS)が生成される。
図2の右側に示すように、部分空間情報が空間パラメータ(CLD2、CLD1、CLD0、CLDTTT等)のうちCLDTTTである場合、左側トータルチャンネルLt、センタートータルチャンネルCt、及び右側トータルチャンネルRtにアップミックスした後、出力チャンネルオーディオ信号として左側トータルチャンネルLt、右側トータルチャンネルRtのみを選択すれば、2チャンネルの出力チャンネルオーディオ信号Lt,Rtを生成でき、出力チャンネルオーディオ信号として左側トータルチャンネルLt、センタートータルチャンネルCt、及び右側トータルチャンネルRtを選択すると、3チャンネルの出力チャンネルオーディオ信号Lt,Ct,Rtを生成できる。また、追加的にCLD1を使用してアップミックスした後、出力チャンネルオーディオ信号として左側トータルチャンネルLt、右側トータルチャンネルRt、センターチャンネルC及び低周波チャンネルLFEを選択すると、4チャンネルの出力チャンネルオーディオ信号Lt,Rt,C,LFEを生成できる。
(1)−2.ツリー構造の第2例(5−1−5ツリー構造)
図3は、部分空間情報を適用する他の例を概略的に示す図である。図3の左側を参照すると、チャンネル数が6のマルチチャンネルオーディオ信号(左側前方チャンネルL、左側サラウンドチャンネルLS、センターチャンネルC、低周波チャンネルLFE、右側前方チャンネルR、右側サラウンドチャンネルRS)が、モノダウンミックスオーディオ信号Mにダウンミックスされる順序及び空間パラメータとの関係が示されている。
ツリー構造の第1例と同様に、左側チャンネルLと左側サラウンドチャンネルLS間のダウンミックスと、センターチャンネルC及び低周波チャンネルLFE間のダウンミックス、右側チャンネルR及び右側サラウンドチャンネルRS間のダウンミックスが行われる。このような第1次ダウンミックス過程で、左側トータルチャンネルLt、センタートータルチャンネルCt、右側トータルチャンネルRtが生成され、第1次ダウンミックス過程で算出される空間パラメータはCLD3(ICC3含む)、CLD4(ICC4含む)、CLD5(ICC5含む)(ここでのCLDx、ICCxは、ツリー構造の第1例におけるCLDxとは区別される)等である。1次ダウンミックス過程以降の2次ダウンミックス過程では、左側トータルチャンネルLtとセンタートータルチャンネルCtとがダウンミックスされて左側センターチャンネルLCが生成され、センタートータルチャンネルCtと右側トータルチャンネルRtとがダウンミックスされて右側センターチャンネルRCが生成され、第2次ダウンミックス過程で算出される空間パラメータはCLD2(ICC2含む)、CLD1(ICC1含む)等である。その後、第3次ダウンミックス過程で左側センターチャンネルLCと右側センターチャンネルRCとがダウンミックスされてモノダウンミックスチャンネルMが生成され、第2次ダウンミックス過程で算出される空間パラメータはCLD0(ICC0含む)等である。
図3の右側に示すように、部分空間情報が空間パラメータ(CLD3,CLD4,CLD5,CLD1、CLD2,CLD0等)のうちCLD0である場合、左側センターチャンネルLC及び右側センターチャンネルRCを生成した後、出力チャンネルオーディオ信号として左側センターチャンネルLC及び右側センターチャンネルRCを選択すると、2チャンネルの出力チャンネルオーディオ信号LC,RCを生成できる。一方、部分空間情報が空間パラメータ(CLD3,CLD4,CLD5,CLD1,CLD2,CLD0等)のうちCLD0,CLD1,CLD2である場合、左側トータルチャンネルLt、センタートータルチャンネルCt、右側トータルチャンネルRtを生成した後、出力チャンネルオーディオ信号として左側トータルチャンネルLt及び右側トータルチャンネルRtを選択すると、2チャンネルの出力チャンネルオーディオ信号Lt,Rtを生成でき、出力チャンネルオーディオ信号として左側トータルチャンネルLt、センタートータルチャンネルCt及び右側トータルチャンネルRtを選択すると、3チャンネルの出力チャンネルオーディオ信号Lt,Ct,Rtを生成できる。また、部分空間情報が追加的にCLD4を含む場合、センターチャンネルC及び低周波チャンネルLFEまでアップミックスした後、出力チャンネルオーディオ信号として左側トータルチャンネルLt、右側トータルチャンネルRt、センターチャンネルC及び低周波チャンネルLFEを選択すると、4チャンネルの出力チャンネルオーディオ信号Lt,Rt、C、LFEを生成できる。
(1)−3.ツリー構造の第3例(5−1−5ツリー構造)
図4は、部分空間情報を適用するさらに他の例を概略的に示す図である。図4の左側を参照すると、チャンネル数6のマルチチャンネルオーディオ信号(左側前方チャンネルL、左側サラウンドチャンネルLS、センターチャンネルC、低周波チャンネルLFE、右側前方チャンネルR、右側サラウンドチャンネルRS)がモノダウンミックスオーディオ信号Mにダウンミックスされる順序及び空間パラメータとの関係が示されている。
ツリー構造の第1例及び第2例と同様に、左側チャンネルLと左側サラウンドチャンネルLS間のダウンミックスと、センターチャンネルC及び低周波チャンネルLFE間のダウンミックス、右側チャンネルR及び右側サラウンドチャンネルRS間のダウンミックスが行われる。このような第1次ダウンミックス過程で、左側トータルチャンネルLt、センタートータルチャンネルCt、右側トータルチャンネルRtが生成され、空間パラメータはCLD1(ICC1含む)、CLD2(ICC2含む)、CLD3(ICC3含む)等(ここでのCLDx,ICCxは、ツリー構造の第1例及び第2例におけるCLDx,ICCxとは区別される)が算出される。1次ダウンミックス過程以降の2次ダウンミックス過程では、左側トータルチャンネルLt、センタートータルチャンネルCt及び右側トータルチャンネルRtがダウンミックスされて左側センターチャンネルLC及び右側チャンネルRが生成され、空間パラメータはCLDTTT(ICCTTT含む)が算出される。その後、第3次ダウンミックス過程で左側センターチャンネルLCと右側チャンネルRがダウンミックスされてモノダウンミックスチャンネルMが生成され、空間パラメータはCLD0(ICC0含む)が算出される。
図4の右側に示すように、部分空間情報が空間パラメータ(CLD1、CLD2、CLD3、CLDTTT、CLD0等)のうちCLD0及びCLDTTTである場合、左側トータルチャンネルLt、センタートータルチャンネルCt、右側トータルチャンネルRtを生成した後、出力チャンネルオーディオ信号として左側トータルチャンネルLt及び右側トータルチャンネルRtを選択すると、2チャンネルの出力チャンネルオーディオ信号Lt,Rtを生成でき、出力チャンネルオーディオ信号として左側トータルチャンネルLt、センタートータルチャンネルCt及び右側トータルチャンネルRtを選択すると、3チャンネルの出力チャンネルオーディオ信号Lt,Ct,Rtを生成できる。また、部分空間情報が追加的にCLD2を含む場合、センターチャンネルC及び低周波チャンネルLFEまでアップミックスした後、出力チャンネルオーディオ信号として左側トータルチャンネルLt、右側トータルチャンネルRt、センターチャンネルC及び低周波チャンネルLFEを選択すると、4チャンネルの出力チャンネルオーディオ信号Lt,Rt,C、LFEを生成できる。
以上、3種類のツリー構造を取り上げて空間パラメータの一部のみを適用して出力チャンネルオーディオ信号を生成する過程について説明したが、上記のように部分空間情報を適用するに留まらず、これ以降さらに、組合せ空間情報を適用したり拡大空間情報を適用したりしても良い。このようにオーディオ信号に変形空間情報を適用する過程は、階層的に行われても良いが、一括的で且つ統合的に処理されても良い。
(2)組合せ空間情報
空間情報は、マルチチャンネルオーディオ信号が定められたツリー構造にしたがってダウンミックスされる過程で計算されたものであるから、ダウンミックスオーディオ信号を、空間情報の空間パラメータをそのまま用いてデコーディングすると、ダウンミックスされる前の元来のマルチチャンネルオーディオ信号に復元される。もし、マルチチャンネルオーディオ信号のチャンネル数Mが出力チャンネルオーディオ信号のチャンネル数Nと異なる場合、空間情報を組み合わせて新しい組合せ空間情報を生成した後、これを用いてダウンミックスオーディオ信号をアップミックスできる。具体的に、空間パラメータを変換公式に代入し、組合せ空間パラメータを生成できる。
このような方法は、エンコーディング装置でマルチチャンネルオーディオ信号がダウンミックスされる順序と方法によって変えることができるが、このダウンミックスされる順序と方法は、空間情報のツリー構造情報を用いて照会すれば良い。また、このような方法は、出力チャンネルの本数がいくつかによって変えることができるが、出力チャンネルの本数などは、出力チャンネル情報を用いて照会すれば良い。
以下では、空間情報を変形する方法の具体的な実施例について説明し、続いて、仮想3D効果を与えるための実施例についても説明する。
(2)−1.一般的な組合せ空間情報
空間情報の空間パラメータを組み合わせて組合空間パラメータを生成する方法は、ダウンミックス過程におけるツリー構造とは異なるツリー構造によってアップミックスするためのものであるから、ツリー構造情報によるツリー構造が何であろうとも、全てのダウンミックスオーディオ信号に適用可能である。
マルチチャンネルオーディオ信号が5.1チャンネルで、ダウンミックスオーディオ信号が1チャンネル(モノチャンネル)の場合、2チャンネルの出力チャンネルオーディオ信号を生成する過程について、下記の2つの例に挙げて説明する。
(2)−1−1.ツリー構造の第4例(5−1−51ツリー構造)
図5は、組合せ空間情報を適用する一例を概略的に示す図である。図5の左側に示すように、5.1チャンネルのマルチチャンネルオーディオ信号がダウンミックスされる過程で算出できる空間パラメータはそれぞれ、CLD0乃至CLD4、及びICC0乃至ICC4(図示せず)といえる。例えば、空間パラメータのうち、左側チャンネル信号Lと右側チャンネル信号Rのチャンネル間レベル差はCLD3で、チャンネル間相関関係はICC3であり、左側サラウンドチャンネルLS及び右側サラウンドチャンネルRSのチャンネル間レベル差はCLD2で、チャンネル間相関関係はICC2である。
これに対し、図5の右側を参照すると、モノダウンミックスオーディオ信号mに組合せ空間パラメータCLDα,ICCαを適用して左側チャンネル信号Lt及び右側チャンネル信号Rtを生成すると、モノチャンネルオーディオ信号mから直接ステレオ出力チャンネルオーディオ信号Lt,Rtを生成することができる。ここでの組合せ空間パラメータCLDα,ICCαは、空間パラメータCLD0乃至CLD4、及びICC0乃至ICC4を組み合わせて計算することができる。まず、空間パラメータのうち、CLD0乃至CLD4を組み合わせて組合せ空間パラメータの中CLDαを計算する過程について説明した後、空間パラメータのうち、CLD0乃至CLD4及びICC0乃至ICC4を組み合わせて組合せ空間パラメータの中ICCαを計算する過程について説明する。
(2)−1−1−a.CLDαの誘導
まず、CLDαは、左側出力信号Lt及び右側出力信号Rt間のレベル差であるから、CLDの定義式に左側出力信号Lt及び右側出力信号Rtを代入すると、次の通りになる。
[式1]
CLDα=10*log10(PLt/PRt)
LtはLtのパワー(power)、PRtはRtのパワーを表す。
[式2]
CLDα=10*log10(PLt+a/PRt+a)
LtはLtのパワー、PRtはRtのパワー、aは非常に小さい定数を表す。
CLDαは、上記式1または式2のように定義される。
一方、PLt及びPRtを空間パラメータCLD0乃至CLD4を用いて表現するためには、出力チャンネルオーディオ信号の左側出力信号Lt、右側出力信号Rt及びマルチチャンネル信号L,Ls,R,Rs,C,LFEとの関係式が必要であり、その関係式は次のように定義できる。
[式3]
Lt=L+Ls+C/√2+LFE/√2
Rt=R+Rs+C/√2+LFE/√2
式3のような関係式は、出力チャンネルオーディオ信号をどのように定義するかによって変わることができるので、式3とは異なる式でも定義できることは当然である。例えば、式3で、C/√2またはLFE/√2での1/√2因子が、‘0’にも‘1’にもなりうる。
式3から下記の式4のような関係式が誘導できる。
[式4]
PLt=PL+PLs+PC/2+PLFE/2
PRt=PR+PRs+PC/2+PLFE/2
CLDαが式1(または、式2)によってPLt及びPRtを用いて表現することができ、このようなPLt及びPRtは式4によってPL,PLs,PC,PLFE,PR,PRsを用いて表現することができるので、PL,PLs,PC,PLFE,PR,PRsを空間パラメータCLD0乃至CLD4を用いて表現できる関係式を求める必要がある。
一方、図5のようなツリー構造の場合、マルチチャンネルオーディオ信号L、R、C、LFE、Ls、Rs及びモノダウンミックスチャンネル信号mの関係は、次の通りになる。
Figure 0005108772
式5から、次の式6の関係式が誘導することができる。
Figure 0005108772
すなわち、式6を式4に代入し、式4を式1(または、式2)に代入することで、組合せ空間パラメータであるCLDαは、空間パラメータであるCLD0乃至CLD4を組み合わせて表現することができる。
一方、式4におけるPC/2+PLFE/2に式6を代入した展開式は、次の通りである。
[式7]
PC/2+PLFE/2=[(c1,OTT4)2+(c2,OTT4)2]*(c2,OTT1*c1,OTT0)2*m2/2
ここで、c1及びc2の定義によれば(式5参照)、(c1,x)2+(c2,x)2=1なので、(c1,OTT4)2+(c2,OTT4)2=1である。
したがって、式7は、次のように簡単にすることができる。
[式8]
PC/2+PLFE/2=(c2,OTT1*c1,OTT0)2*m2/2
要するに、式8及び式6を式4に代入し、式4を式1に代入することによって、組合せ空間パラメータであるCLDαは、空間パラメータであるCLD0乃至CLD4を組み合わせる方式で表現されることができる。
(2)−1−1−b.ICCαの誘導
まず、ICCαは、左側出力信号Lt及び右側出力信号Rt間の相関関係であるから、その定義式に左側出力信号Lt及び右側出力信号Rtを代入すると、次の通りになる。
Figure 0005108772
式9で、PLt、PRtは、式4、式6、及び式8によってCLD0乃至CLD4を用いて表現することができ、PLtRtは、次の式10のように展開することができる。
[式10]
PLtRt=PLR+PLsRs+PC/2+PLFE/2
式10で、PC/2+PLFE/2は、式6によってCLD0乃至CLD4で表現されることができ、PLRとPLsRsは、ICC定義によって次のように展開することができる。
[式11]
ICC3=PLR/√(PLPR)
ICC2=PLsRs/√(PLsPRs)
式11で、√(PLPR)(または、√(PLsPRs))を移項すると、次の式12となる。
[式12]
PLR=ICC3*√(PLPR)
PLsRs=ICC2*√(PLsPRs)
式12で、PL,PR,PLs,PRsはそれぞれ、式6によってCLD0乃至CLD4で表現することができる。式6を式12に代入すると、次の式13のようになる。
[式13]
PLR=ICC3 *c1,OTT3*c2,OTT3*(c1,OTT1*c1,OTT0)2*m2
PLsRs=ICC2*c1,OTT2*c2,OTT2*(c2,OTT0)2*m2
要するに、式6及び式13を式10に代入し、式10及び式4を式9に代入することで、組合せ空間パラメータであるICCαは、空間パラメータであるCLD0乃至CLD3及びICC2、ICC3で表現することができる。
(2)−1−2.ツリー構造の第5例(5−1−52ツリー構造)
図6は、組合せ空間情報を適用する他の例を概略的に示す図である。図6の左側に示すように、5.1チャンネルのマルチチャンネルオーディオ信号がダウンミックスされる過程で算出できる空間パラメータはそれぞれ、CLD0乃至CLD4、及びICC0乃至ICC4(図示せず)といえる。空間パラメータのうち、左側チャンネル信号Lと左側サラウンドチャンネル信号Lsのチャンネル間レベル差はCLD3で、チャンネル間相関関係はICC3であり、右側チャンネルR及び右側サラウンドチャンネルRSのチャンネル間レベル差はCLD4で、チャンネル間相関関係はICC4である。
これに対し、図6の右側を参照すると、モノダウンミックスオーディオ信号mに組合せ空間パラメータCLDβ,ICCβを適用して左側チャンネル信号Lt及び右側チャンネル信号Rtを生成すると、モノチャンネルオーディオ信号mから直接ステレオ出力チャンネルオーディオ信号Lt,Rtを生成することができる。ここでの組合せ空間パラメータCLDβ,ICCβは、空間パラメータCLD0乃至CLD4、及びICC0乃至ICC4を用いて計算できる。まず、空間パラメータのうちCLD0乃至CLD4を用いて、組合せ空間パラメータのうちCLDβを計算する過程について説明し、続いて、空間パラメータのうちCLD0乃至CLD4及びICC0乃至ICC4を用いて、組合せ空間パラメータのうちICCβを計算する過程について説明する。
(2)−1−2−a.CLDβの誘導
まず、CLDβは、左側出力信号Lt及び右側出力信号Rt間のレベル差であるから、その定義式に左側出力信号Lt及び右側出力信号Rtを代入すると、次の通りになる。
[式14]
CLDβ=10*log10(PLt/PRt)
LtはLtのパワーで、PRtはRtのパワーである。
[式15]
CLDβ=10*log10(PLt+a/PRt+a)
LtはLtのパワー、PRtはRtのパワー、aは非常に小さい数である。
CLDβは、上記の式14または式15のように定義される。
一方、PLt及びPRtを空間パラメータCLD0乃至CLD4を用いて表現するためには、出力チャンネルオーディオ信号の左側出力信号Lt、右側出力信号Rt及びマルチチャンネル信号L、Ls、R、Rs、C、LFEとの関係式が必要であり、その関係式は、式3と同様に次のように定義されることができる。
[式16]
Lt=L+Ls +C/√2+LFE/√2
Rt=R+Rs+C/√2+LFE/√2
式16のような関係式は出力チャンネルオーディオ信号をどのように定義するかによって変えることができるもので、よって、他の式でも定義できることは当然である。例えば、C/√2またはLFE/√2因子における1/√2が0にも1にもなりうる。
式16から次の式17のような関係式が誘導することができる。
[式17]
PLt=PL+PLs+PC/2+PLFE/2
PRt=PR+PRs+PC/2+PLFE/2
式14(または、式15)で、CLDβがPLt及びPRtを用いて表現可能であり、PLt及びPRtは、式15でPL、PLs、PC、PLFE、PR、PRsを用いて表現可能なので、PL、PLs、PC、PLFE、PR、PRsを、空間パラメータCLD0乃至CLD4を用いて表現できる関係式を求める必要がある。
一方、図6のようなツリー構造の場合、マルチチャンネルオーディオ信号L,R,C,LFE,Ls,Rs及びモノダウンミックスチャンネル信号mの関係は、次の通りである。
Figure 0005108772
式18から、次の式19のような関係式を誘導することができる。
Figure 0005108772
すなわち、式19を式17に代入し、式17を式14(または、式15)に代入することで、組合せ空間パラメータであるCLDβは、空間パラメータであるCLD0乃至CLD4を組み合わせる方式で表現することができる。
一方、式19を式17におけるPL+PLsに代入した展開式は、次の通りである。
[式20]
PL+PLs=[(c1,OTT3)2+(c2,OTT3)2](c1,OTT1*c1,OTT0)2*m2
ここで、c1及びc2の定義によれば(式5参照)、(c1,x)2+(c2,x)2=1なので、(c1,OTT3)2+(c2,OTT3)2=1である。
したがって、式20は、次のように簡単にすることができる。
[式21]
PL_=PL+PLs=(c1,OTT1*c1,OTT0)2*m2
一方、式19を式17におけるPR+PRsに代入した展開式は、次の通りである。
[式22]
PR+PRs=[(c1,OTT4)2+(c2,OTT4)2](c2,OTT1*c1,OTT0)2*m2
ここで、c1及びc2の定義によれば(式5参照)、(c1,x)2+(c2,x)2=1なので、(c1,OTT4)2+(c2,OTT4)2=1である。
したがって、式22は、次のように簡単にすることができる。
[式23]
PR_=PR+PRs=(c2,OTT1*c1,OTT0)2*m2
一方、式19を式17におけるPC/2+PLFE/2に代入した展開式は、次の通りである。
[式24]
PC/2+PLFE/2=[(c1,OTT2)2+(c2,OTT2)2](c2,OTT0)2*m2/2
ここで、c1及びc2の定義によれば(式5参照)、(c1,x)2+(c2,x)2=1なので、(c1,OTT2)2+(c2,OTT2)2=1である。
したがって、式24は、次のように簡単にすることができる。
[式25]
PC/2+PLFE/2=(c2,OTT0)2*m2/2
要するに、式21、式23及び式25を式17に代入し、式17を式14(または、式15)に代入することで、組合せ空間パラメータであるCLDβは、空間パラメータであるCLD0乃至CLD4を組み合わせる方式で表現することができる。
(2)−1−2−b.ICCβの誘導
まず、ICCβは、左側出力信号Lt及び右側出力信号Rt間の相関関係であるから、その定義式に左側出力信号Lt及び右側出力信号Rtを代入すると、次の通りになる。
Figure 0005108772
式26で、PLt、PRtは、式19によってCLD0乃至CLD4を用いて表現することができ、PLtRtは、次の式27のように展開することができる。
[式27]
PLtRt=PL_R_+PC/2+PLFE/2
式27で、PC/2+PLFE/2は、式19によってCLD0乃至CLD4で表現することができ、PL_R_は、ICC定義によって次のように展開することができる。
[式28]
ICC1=PL_R_/√(PL_PR_)
√(PL_PR_)を移項すると、次の式29のようになる。
[式29]
PL_R_=ICC1*√(PL_PR_)
式29で、PL_、PR_はそれぞれ、式21及び式23によってCLD0乃至CLD4で表現することができる。式21及び式23を式29に代入すると、次の式30となる。
[式30]
PL_R_=ICC1*c1,OTT1*c1,OTT0*c2,OTT1*c1,OTT0*m2
要するに、式30を式27に代入し、式27及び式17を式26に代入することで、組合空間パラメータであるICCβは、空間パラメータであるCLD0乃至CLD4及びICC1を組み合わせる方式で表現することができる。
上記の空間パラメータを変形する方法は一実施例で、上記の式は、PxまたはPxyを求める場合において、信号エネルギーの他、各チャンネル間の相関関係(例:ICC0等)をさらに考慮することによって様々な形態に変えることができる。
(2)−2.サラウンド効果を持つ組合せ空間情報
空間情報を組み合わせて組合せ空間情報を生成するに当たり、音響経路を考慮すると、仮想サラウンド効果を出すことができる。仮想サラウンド効果または仮想3D効果とは、実際にはサラウンドチャンネルのスピーカーがないにもかかわらず、サラウンドチャンネルのスピーカーがあるかのような効果を出すことで、例えば、2個のステレオスピーカーを介して5.1チャンネルオーディオ信号を出力することである。
音響経路は空間フィルタ情報とすることができ、空間フィルタ情報は、HRTF(Head−Related Tranfer Function)と呼ばれる関数を用いれば良いが、本発明がこれに限定されることはない。空間フィルタ情報は、フィルタパラメータを含むことができ、このフィルタパラメータ及び空間パラメータを変換公式に代入して組合せ空間パラメータを生成することができる。一方、生成された組合せ空間パラメータは、フィルタ係数(filter coefficients)を含むことができる。
以下では、マルチチャンネルオーディオ信号が5チャンネルで、3チャンネルの出力チャンネルオーディオ信号を生成する場合を取り上げ、サラウンド効果を持つ組合せ空間情報を生成するために音響経路を考慮する方法について説明する。
図7は、3チャンネルのスピーカーの位置、及び、スピーカーと聴き手までの音響経路を示す図である。図7を参照すると、3個のスピーカーSPK1,SPK2,SPK3の位置がそれぞれ、左側前L、センターC、右側Rであり、仮想サラウンドチャンネルの位置が左側サラウンドLs及び右側サラウンドRsであることがわかる。3個のスピーカーの位置L,C,R、及び、仮想サラウンドチャンネルの位置Ls,Rsから聴き手の左耳の位置l、聴き手の右耳の位置rに至るまでの音響経路が表示されている。Gx_yは、x位置からy位置に至る音響経路を表示する。例えば、GL_rは、左側前方の位置Lから聴き手の右耳の位置rに至る音響経路を表す。
もし、5つの位置にスピーカーが存在(すなわち、左側サラウンド(Ls)及び右側サラウンド(Rs)にもスピーカーが存在)し、聴き手が図7に示す位置に存在すると、聴き手の左耳に流入する信号L0及び聴き手の右耳に流入する信号R0は、次の通りである。
[式31]
LO=L*GL_l+C*GC_l+R*GR_l+Ls*GLs_l+Rs*GRs_l
RO=L*GL_r+C*GC_r+R*GR_r+Ls*GLs_r+Rs*GRs_r
ここで、L,C,R,Ls,Rsは、各位置のチャンネルを表し、Gx_yは、x位置からy位置に至る音響経路を表し、*はコンボリューションを表す。
しかし、上に言及したように、3つの位置L,C,Rにのみスピーカーが存在する場合、聴き手の左耳に流入する信号L0_real及び聴き手の右耳に流入する信号R0_realは、次の通りになる。
[式32]
LO_real=L*GL_l+C*GC_l+R*GR_l
RO_real=L*GL_r+C*GC_r+R*GR_r
式32に表示された信号は、サラウンドチャンネル信号Ls,Rsが考慮されないので、仮想サラウンド効果を出すことができない。仮想サラウンド効果を出すためには、左側サラウンドチャンネル信号Lsが元の位置Lsから出力されて聴き手の位置l,rに到達する時の信号と、元の位置Ls,Rsでない3つの位置L,C,Rのスピーカーを介して出力し、聴き手の位置l,rに到達する信号と同じにすれば良い。右側サラウンドチャンネル信号Rsの場合も同様である。
まず、左側サラウンドチャンネル信号Lsについて説明すると、左側サラウンドチャンネル信号Lsが元の位置である左側サラウンド位置Lsのスピーカーから出力される場合、聴き手の左耳l及び聴き手の右耳rに到達する信号はそれぞれ次の通りである。
[式33]
‘Ls*GLs_l’、‘Ls*GLs_r
また、右側サラウンドチャンネル信号Rsが元の位置である右側サラウンド位置Rsのスピーカーから出力される場合、聴き手の左耳l及び聴き手の右耳rに到達する信号はそれぞれ、次の通りである。
[式34]
‘Rs*GRs_l’、‘Rs*GRs_r
聴き手の左耳l及び聴き手の右耳rに到達する信号が式33及び式34の成分と同じなら、どんな位置のスピーカーから出力されるとしても(例えば、左側前方位置のスピーカーSPK1等から出力されるとしても)、聴き手は、左側サラウンドの位置Ls及び右側サラウンドの位置Rsにスピーカーが存在するかのように感じることができる。
一方、式33に表示された成分は、左側サラウンド位置Lsのスピーカーから出力される場合、それぞれ聴き手の左耳l及び聴き手の右耳rに到達する信号であるので、式33に表示された成分そのままに左側前方位置のスピーカーSPK1から出力すると、それぞれ聴き手の左耳l及び聴き手の右耳rに到達する信号は、次の通りになる。
[式35]
‘Ls*GLs_l*GL_l’、‘Ls*GLs_r*GL_r
式35では、左側前方位置Lから聴き手の左耳l(または、右耳r)までの音響経路に該当する成分である‘GL_l’(または、‘GL_r’)が追加される。しかし、聴き手の左耳l及び聴き手の右耳rに到達する信号は、式35に表示された成分ではなく式33に表示された成分でなければならない。このため、左側前位置Lのスピーカーから出力して聴き手に到達する場合、‘GL_l’(または、‘GL_r’)成分が追加されるため、式33に表された成分を左側前方位置LのスピーカーSPK1から出力する場合には、音響経路に‘GL_l’(または、‘GL_r’)の逆関数‘GL_l -1’(または、‘GL_r -1’)を考慮しなければならない。言い換えると、式33に該当する成分を左側前方位置LのスピーカーSPK1から出力する場合、次の式のように変形しなければならない。
[式36]
‘Ls*GLs_l*GL_l -1’、‘Ls*GLs_r*GL_r -1
そして、式34に該当する成分を左側前方位置LのスピーカーSPK1から出力する場合、次の式のように変形しなければならない。
[式37]
‘Rs*GRs_l*GL_l -1’、‘Rs*GRs_r*GL_l -1
したがって、左側前方位置LのスピーカーSPK1から出力される信号L’は、次のようにまとめることができる。
[式38]
L’=L+Ls*GLs_l*GL_l -1+Rs*GRs_l*GL_l -1
(Ls*GLs_r*GL_r -1及びRs*GRs_r*GL_l -1成分は省略される。)
式38に表示された信号が、左側前方位置のスピーカーSPK1から出力されて聴き手の左耳l位置に到達すると、音響経路‘GL_l’ファクターが追加されるので、式38における‘GL_l -1’項が相殺され、結果として式33及び式34に表示されたファクターが残る。
図8は、仮想サラウンド効果のために各位置から出力される信号を示す図である。
図8を参照すると、サラウンドの位置Ls,Rsから出力される信号Ls,Rsを、音響経路を考慮し、各スピーカー位置SPK1から出力される信号L’に含めると、式38のようになることがわかる。
式38で、GLs_l*GL_l -1をHLs_Lで簡略に表示すると、次の通りになる。
[式39]
L’=L+Ls*HLs_L+Rs*HRs_L
一方、センター位置CのスピーカーSPK2から出力される信号C’を、次のようにまとめることができる。
[式40]
C’=C+Ls*HLs_C+Rs*HRs_C
一方、右側前方位置RのスピーカーSPK3から出力される信号R’は、次のようにまとめることができる。
[式41]
R’=R+Ls*HLs_R+Rs*HRs_R
図9は、式38、式39、及び式40のように5チャンネル信号を用いて3チャンネル信号を生成する方法を概念的に示す図である。5チャンネル信号を用いて2チャンネル信号R’,L’を生成したり、サラウンドチャンネル信号Ls,Rsをセンターチャンネル信号C’に含めない場合、HLs_C及びHRs_Cは0となる。
実施の便宜上Hx_yの代わりにGx_yを使用しても良く、クロストーク(cross−talk)を考慮してHx_yを用いても良い等、Hx_yは様々な変形形態になりうる。
上記の説明は、サラウンド効果を持つ組合空間情報の一例で、空間フィルタ情報の適用方法によって様々な形態に変形できることは自明である。上述の過程を通じてスピーカーから出力される信号(上の例では、左側前方チャンネルL’、右側前方チャンネルR’、センターチャンネルC’)は、前述したように、組合せ空間情報の中でも特に組合せ空間パラメータを用いてダウンミックスオーディオ信号から生成可能である。
(3)拡大空間情報
空間情報に拡張空間情報を追加して拡大空間情報を生成することができる。そして、この拡大空間情報を用いてオーディオ信号をアップミキシングでき、このアップミキシングする段階は、空間情報に基づいてオーディオ信号を1次アップミキシングオーディオ信号に変換し、拡張空間情報に基づいて1次アップミキシングオーディオ信号を2次アップミキシングオーディオ信号に変換する。
ここで、拡張空間情報は、拡張チャンネル構成情報、拡張チャンネルマッピング情報及び拡張空間パラメータを含むことができる。拡張チャンネル構成情報とは、空間情報のツリー構造情報によって構成できるチャンネル以外に、構成できるチャンネルに関する情報のことで、分割識別子及び未分割識別子のうち一つ以上を含むことができる。これについての具体的な説明は後述する。拡張チャンネルマッピング情報は、拡張チャンネルを構成する各チャンネルの位置情報である。拡張空間パラメータは、1チャンネルが2以上のチャンネルにアップミックスされるのに必要な情報で、チャンネル間レベル差を含むことができる。
このような拡張空間情報は、i)エンコーディング装置により生成されたのち、空間情報に含まれたものであっても良く、ii)デコーディング装置自身により生成されたものであっても良い。拡張空間情報がエンコーディング装置により生成されたものである場合、拡張空間情報の存在の有無は、空間情報の指示子を基に判断することができる。拡張空間情報がデコーディング装置自身により生成されたものである場合、拡張空間情報の拡張空間パラメータは、空間情報の空間パラメータを用いて計算したものであっても良い。
一方、空間情報及び拡張空間情報に基づいて生成された拡大空間情報を用いてオーディオ信号をアップミックスする過程は、順次的で階層的に行われても良いが、一括的で統合的に処理されても良い。もし、拡大空間情報が、空間情報及び拡張空間情報に基づいて一つのマトリックスとして算出可能であると、前記マトリックスを用いることによって、一括的で直接的にダウンミックスオーディオ信号をマルチチャンネルオーディオ信号にアップミックスできるわけである。この時、マトリックスを構成する因子は、空間パラメータ、及び拡張空間パラメータによって定義されたものであれば良い。
まず、エンコーディング装置により生成された拡張空間情報を用いる場合について説明し、続いて、デコーディング装置で拡張空間情報を自体的に生成する場合について説明する。
(3)−1:エンコーディング装置により生成された拡張空間情報を用いる場合:任意ツリー構造(arbitrary tree configuration)
まず、拡大空間情報は、空間情報に拡張空間情報を追加して生成されるにおいてエンコーディング装置により生成されたものであり、デコーディング装置が拡張空間情報を受信した場合について説明する。一方、ここでの拡張空間情報は、エンコーディング装置がマルチチャンネルオーディオ信号をダウンミックスする過程で抽出したものであれば良い。
まず、上述したように、拡張空間情報は、拡張チャンネル構成情報、拡張チャンネルマッピング情報、拡張空間パラメータを含み、ここで、拡張チャンネル構成情報は、分割識別子及び未分割識別子を一つ以上含む。以下、分割識別子及び未分割識別子の配列を基に拡張チャンネルを構成する過程について具体的に説明する。
図10は、拡張チャンネル構成情報に基づいて拡張チャンネルが構成される一例を示す図である。図10の下段を参照すると、0と1が順番で繰り返し配列されているが、ここで、0は未分割識別子、1は分割識別子を表す。まず、1番目(1)に未分割識別子0が存在し、この1番目の未分割識別子0とマッチングされるチャンネルは、最上端に存在する左側チャンネルLである。したがって、未分割識別子0とマッチングされる左側チャンネルLを分割せず出力チャンネルとして選択する。そして、2番目(2)には、分割識別子1が存在し、この2番目の分割識別子0とマッチングされるチャンネルは、左側チャンネルLの次の左側サラウンドチャンネルLsである。したがって、分割識別子1とマッチングされる左側サラウンドチャンネルLsを2チャンネルに分割する。3番目(3)及び4番目(4)に未分割識別子(0)が存在するので、左側サラウンドチャンネルLsから分割された2チャンネルはそれぞれ分割せず、そのまま出力チャンネルとして選択する。このような過程を最後の順番(10)まで繰り返すことで、全体拡張チャンネルが構成される。
チャンネル分割過程は分割識別子1の個数だけ繰り返され、チャンネルを出力チャンネルとして選択する過程は、未分割識別子0の個数だけ繰り返される。したがって、チャンネル分割部AT0,AT1の個数は分割識別子1の個数(2個)と同一であり、拡張チャンネルの本数L,Lfs,Ls,R,Rfs,Rs,C,LFEは、未分割識別子0の個数(8個)と同一になる。
一方、拡張チャンネルを構成した後、拡張チャンネルマッピング情報を用いて各出力チャンネル別にその位置を再びマッピングさせることができる。図10の場合、左側フロントチャンネルL、左側フロントサイドチャンネルLfs、左側サラウンドチャンネルLs、右側フロントチャンネルR、右側フロントサイドチャンネルRfs、右側サラウンドチャンネルRs、センターチャンネルC、低周波チャンネルLFEの順にマッピングされる。
以上説明した如く、拡張チャンネル構成情報に基づいて拡張チャンネルが構成することができ、1チャンネルを2以上のチャンネルに分割するためのチャンネル分割部が必要である。このチャンネル分割部が、1チャンネルを2以上のチャンネルに分割する際に、拡張空間パラメータを用いることができる。この拡張空間パラメータは、チャンネル分割部の個数と同一なので、分割識別子の個数とも同一である。したがって、拡張空間パラメータは分割識別子の個数だけ抽出することができる。図11は、図10に示す拡張チャンネルの構成、及び拡張空間パラメータとの関係を示す図である。図11を参照すると、チャンネル分割部AT0,AT1が2個存在し、ここにそれぞれ適用される拡張空間パラメータATD0,ATD1が表示されている。拡張空間パラメータがチャンネル間レベル差である場合、チャンネル分割部はこのような拡張空間パラメータを用いて2つに分割されるチャンネルのそれぞれのレベルを決定することができる。上記のように拡張空間情報を追加してアップミキシングする過程において、拡張空間パラメータを全部でなく一部のみを適用しても良い。
(3)−2拡張空間情報を生成する場合:内挿/外挿(interpolation/extrapolation)
拡大空間情報は、空間情報に拡張空間情報を追加して生成することができ、拡張空間情報が空間情報を用いて生成された場合について説明する。空間情報のうち空間パラメータを用いて拡張空間情報を生成でき、この場合、内挿または外挿などの方法が用いることができる。
(3)−2−1.6.1チャンネルへの拡張
マルチチャンネルオーディオ信号が5.1チャンネルであるとき、6.1チャンネルの出力チャンネルオーディオ信号を生成したい場合に挙げて説明する。
図12は、5.1チャンネルのマルチチャンネルオーディオ信号の位置と6.1チャンネルの出力チャンネルオーディオ信号の位置を示す図である。図12の(a)を参照すると、5.1チャンネルのマルチチャンネルオーディオ信号のチャンネル位置がそれぞれ、左側前方チャンネルL、右側前方チャンネルR、センターチャンネルC、低周波チャンネルLFE(図示せず)、左側サラウンドチャンネルLs、右側サラウンドチャンネルRsであることがわかる。もし、このような5.1チャンネルのマルチチャンネルオーディオ信号がダウンミックスされたオーディオ信号である場合、このダウンミックスオーディオ信号に空間パラメータのみを適用すると、再び5.1チャンネルのマルチチャンネルオーディオ信号にアップミックスされる。しかし、図12の(b)のように、6.1チャンネルのマルチチャンネルオーディオ信号にアップミックスするためには、後方センター(rear center)RCのチャンネル信号をさらに生成しなければならない。
この後方センターRCのチャンネル信号は、後方の2チャンネル(左側サラウンドチャンネルLs及び右側サラウンドチャンネルRs)と関連した空間パラメータを用いて生成できる。具体的に、空間パラメータのうち、チャンネル間レベル差(CLD)は2チャンネル間のレベル差を表すが、2チャンネル間のレベル差を調整することによって、2チャンネル間に存在する仮想音源の位置を変化させることができる。
以下では、2チャンネル間のレベル差によって仮想音源の位置が変化する原理について説明する。
図13は、2チャンネル間のレベル差と仮想音源の位置との関係を示す図である。図13で、左側サラウンドチャンネルLsのレベルがaで、右側サラウンドチャンネルRsのレベルがbである。図13の(a)を参照すると、左側サラウンドチャンネルLsのレベルaが右側サラウンドチャンネルRsのレベルbよりも大きい場合、仮想音源の位置VSは、右側サラウンドチャンネルRsの位置よりも左側サラウンドチャンネルLsの位置に近いことがわかる。2チャンネルからオーディオ信号が出力される場合、聴き手は2チャンネル間に仮想音源が存在するかのように感じることになるが、この時、仮想音源の位置は、2チャンネルのうちレベルが相対的に高いチャンネルの位置に近い。図13の(b)の場合は、左側サラウンドチャンネルLsのレベルaが右側サラウンドチャンネルRsのレベルbと略同一なので、仮想音源の位置が左側サラウンドチャンネルLs及び右側サラウンドチャンネルRsの中間に存在するかのように聴き手は感じることになる。
このような原理を用いて後方センターRCのレベルの決定することができる。図14は、2つの後方チャンネルのレベル、及び後方センターチャンネルのレベルを示す図である。図14に示すように、後方センターチャンネルRCのレベルcは、左側サラウンドチャンネルLsのレベルa及び右側サラウンドチャンネルRsのレベルb間の差を内挿する方式で算出することができる。内挿方式としては、線形(linear)内挿だけでなく、非線形(non−linear)内挿方式も適用されることができる。線形内挿方式によって、2チャンネル(例:Ls,Rs)間に存在する新しいチャンネル(例:後方センターチャンネルRC)のレベルcを算出する式は、次の通りである。
[式40]
c=a*k+b*(1-k)
ここで、a、bは、2チャンネルのそれぞれのレベルを表す。
kは、aレベルのチャンネル及びbレベルのチャンネルとcレベルのチャンネル間の相対的位置を表す。
もし、cレベルのチャンネル(例:後方センターチャンネルRC)がaレベルのチャンネル(例:Ls)及びbレベルのチャンネルRsの真中央に位置する場合、kは0.5である。kが0.5の場合、式40は、次の式のようになる。
[式41]
c=(a+b)/2
式41によれば、cレベルのチャンネル(例:後方センターチャンネルRC)がaレベルのチャンネル(例:Ls)及びbレベルのチャンネルRsの真中央に位置する場合、新しいチャンネルのレベルcは、既存のチャンネルのレベルa,bの平均値となる。上の式40及び式41は一例に過ぎず、cレベルの決定だけでなく、aレベルとbレベルの値も再調整することが可能である。
(3)−2−2.7.1チャンネルへの拡張
マルチチャンネルオーディオ信号が5.1チャンネルである時、7.1チャンネルの出力チャンネルオーディオ信号を生成したい場合を例に挙げて説明する。
図15は、5.1チャンネルのマルチチャンネルオーディオ信号の位置と7.1チャンネルの出力チャンネルオーディオ信号の位置を示す図である。図15の(a)を参照すると、図12の(a)と同様に、5.1チャンネルのマルチチャンネルオーディオ信号のチャンネル位置がそれぞれ左側前方チャンネルL、右側前方チャンネルR、センターチャンネルC、低周波チャンネルLFE(図示せず)、左側サラウンドチャンネルLs、右側サラウンドチャンネルRsであることがわかる。もし、このような5.1チャンネルのマルチチャンネルオーディオ信号がダウンミックスされたオーディオ信号である場合、このダウンミックスオーディオ信号に空間パラメータのみを適用すると、同様に5.1チャンネルのマルチチャンネルオーディオ信号にアップミックスされる。しかし、図15の(b)のように7.1チャンネルのマルチチャンネルオーディオ信号にアップミックスするには、左側フロントサイドチャンネルLfs及び右側フロントサイドチャンネルRfsをさらに生成しなければならない。
左側フロントサイドチャンネルLfsは、左側前方チャンネルL及び左側サラウンドチャンネルLs間に位置するので、左側前方チャンネルLのレベル及び左側サラウンドチャンネルLsのレベルを用いて、内挿方式で左側フロントサイドチャンネルLfsのレベルを決定することができる。図16は、2つの左側チャンネルのレベル、及び左側フロントサイドチャンネルLfsのレベルを示す図である。図16を参照すると、左側フロントサイドチャンネルLfsのレベルcは、左側前方チャンネルLのレベルa及び左側サラウンドチャンネルLsのレベルbに基づいて線形的に内挿された値であることがわかる。
一方、左側フロントサイドチャンネルLfsは、左側前方チャンネルL及び左側サラウンドチャンネルLs間に位置してはいるが、左側前方チャンネルL、センターチャンネルC、及び右側前方チャンネルRの外側に位置してもいる。このため、左側前方チャンネルLのレベル、センターチャンネルCのレベル、及び右側前方チャンネルRのレベルを用いて、外挿方式で左側フロントサイドチャンネルLfsのレベルを決定しても良い。図17は、3つの前方チャンネルのレベル、及び左側フロントサイドチャンネルのレベルを示す図である。図17を参照すると、左側フロントサイドチャンネルLfsのレベルdは、左側前方チャンネルLのレベルa、センターチャンネルCのレベルc、及び右側前方チャンネルRのレベルbに基づいて線形的に外挿された値であることがわかる。
以上2つの場合を取り上げて、空間情報に拡張空間情報を追加して出力チャンネルオーディオ信号を生成する過程について説明した。上述の如く、拡張空間情報を追加してアップミキシングする過程において、拡張空間パラメータの全部ではなく一部のみを適用しても良い。このようにオーディオ信号に空間パラメータを適用する過程は、順次的・階層的に行われても良いが、一括的・統合的に処理されても良い。
本発明の一側面によれば、定められたツリー構造と異なる構造のオーディオ信号を生成できるため、多様な構造のオーディオ信号を生成することが可能になる。
本発明の他の側面によれば、定められたツリー構造と異なる構造のオーディオ信号を生成できるため、ダウンミックスされる前のマルチチャンネルの本数がスピーカーの個数より多いまたは少ない場合であっても、ダウンミックスオーディオ信号からスピーカーの個数と同じ本数の出力チャンネルを生成することが可能になる。
本発明のさらに他の側面によれば、マルチチャンネル数より少ない本数の出力チャンネルを生成する場合、ダウンミックスオーディオ信号からマルチチャンネルオーディオ信号にアップミックスした後、このマルチチャンネルオーディオ信号から出力チャンネルオーディオ信号をダウンミックスするのではなく、ダウンミックスオーディオ信号から直接マルチチャンネルオーディオ信号を生成するので、オーディオ信号のデコーディングにかかる演算量を顕著に減少させることが可能になる。
本発明のさらに他の側面によれば、組合せ空間情報の生成において音響経路を考慮できるため、サラウンドチャンネルを出力できない状況においても仮想(pseudo)でサラウンド効果を出すことが可能になる。
本発明によるオーディオ信号のエンコーディング装置及びデコーディング装置の構成図である。 部分空間情報を適用する一例を概略的に示す図である。 部分空間情報を適用する他の例を概略的に示す図である。 部分空間情報を適用するさらに他の例を概略的に示す図である。 組合せ空間情報を適用する一例を概略的に示す図である。 組合せ空間情報を適用する他の例を概略的に示す図である。 3チャンネルスピーカーの位置、及び、スピーカーから聴き手までの音響経路を示す図である。 サラウンド効果のためにスピーカーの各位置から出力される信号を示す図である。 5チャンネル信号を用いて3チャンネル信号を生成する方法を概念的に示す図である。 拡張チャンネル構成情報に基づいて拡張チャンネルが構成される一例を示す図である。 図10に示す拡張チャンネルの構成、及び、拡張空間パラメータとの関係を示す図である。 5.1チャンネルのマルチチャンネルオーディオ信号の位置と6.1チャンネルの出力チャンネルオーディオ信号の位置を示す図である。 2つのチャンネル間のレベル差及び仮想音源の位置との関係を示す図である。 2つの後方チャンネルのレベル、及び、後方センターチャンネルのレベルを示す図である。 5.1チャンネルのマルチチャンネルオーディオ信号の位置と7.1チャンネルの出力チャンネルオーディオ信号の位置を示す図である。 2つの左側チャンネルのレベル、及び、左側フロントサイドチャンネル(Lfs)のレベルを示す図である。 3つの前方チャンネルのレベル、及び、左側フロントサイドチャンネル(Lfs)のレベルを示す図である。

Claims (10)

  1. マルチチャンネルオーディオ信号をダウンミックスして生成されたオーディオ信号、及び前記マルチチャンネルオーディオ信号から抽出された空間情報を受信するステップと、
    前記空間情報を用いて組合せ空間情報を生成するステップと、
    前記組合せ空間情報を用いて前記オーディオ信号をデコーディングするステップと、
    を有し、
    前記組合せ空間情報を生成するステップは、
    前記空間情報に含まれる複数のチャンネル間レベル差を用いて、前記マルチチャンネルオーディオ信号のパワー値を生成するステップと、
    前記マルチチャンネルオーディオ信号の前記パワー値を用いて出力チャンネルオーディオ信号のパワー値を生成するステップと、
    前記出力チャンネルオーディオ信号の前記パワー値を用いて前記組合せ空間情報を生成するステップと、
    を有する、オーディオ信号のデコーディング方法。
  2. 前記組合せ空間情報は、前記空間情報をツリー構造情報に対応する所定の変換公式に代入して生成される、請求項1に記載のオーディオ信号のデコーディング方法。
  3. 前記オーディオ信号は、前記マルチチャンネルオーディオ信号をダウンミックスして生成された信号であり、
    前記組合せ空間情報に含まれるチャンネル間レベル差は、前記マルチチャンネルオーディオ信号の前記チャンネル間レベル差の全部または一部を組み合わせて算出される、請求項1に記載のオーディオ信号のデコーディング方法。
  4. 前記オーディオ信号は、前記マルチチャンネルオーディオ信号をダウンミックスして生成された信号であり、
    前記空間情報は、前記マルチチャンネルオーディオ信号の少なくとも2つのチャンネル間相関関係を含み、
    前記組合せ空間情報のチャンネル間相関関係は、前記マルチチャンネルオーディオ信号の前記チャンネル間相関関係を組み合わせて算出される、請求項1に記載のオーディオ信号のデコーディング方法。
  5. 前記組合せ空間情報の前記チャンネル間相関関係は、前記マルチチャンネルオーディオ信号の前記チャンネル間相関関係、及び、前記マルチチャンネルオーディオ信号の前記チャンネル間レベル差を組み合わせて算出される、請求項に記載のオーディオ信号のデコーディング方法。
  6. マルチチャンネルオーディオ信号をダウンミックスして生成されたオーディオ信号、及び前記マルチチャンネルオーディオ信号から抽出された空間情報を受信し、前記空間情報に含まれる複数のチャンネル間レベル差を用いて、前記マルチチャンネルオーディオ信号のパワー値を生成し、前記マルチチャンネルオーディオ信号の前記パワー値を用いて出力チャンネルオーディオ信号のパワー値を生成し、前記出力チャンネルオーディオ信号の前記パワー値を用いて組合せ空間情報を生成するよう構成された変形空間情報生成部と、
    前記組合せ空間情報を用いて前記オーディオ信号をデコーディングするよう構成された出力チャンネル生成部と、
    を有する、オーディオ信号のデコーディング装置。
  7. 前記組合せ空間情報は、前記空間情報をツリー構造情報に対応する所定の変換公式に代入して生成される、請求項に記載のオーディオ信号のデコーディング装置。
  8. 前記オーディオ信号は、前記マルチチャンネルオーディオ信号をダウンミックスして生成された信号であり、
    前記組合せ空間情報に含まれるチャンネル間レベル差は、前記マルチチャンネルオーディオ信号の前記チャンネル間レベル差の全部または一部を組み合わせて算出される、請求項に記載のオーディオ信号のデコーディング装置。
  9. 前記オーディオ信号は、前記マルチチャンネルオーディオ信号をダウンミックスして生成された信号であり、
    前記空間情報は、前記マルチチャンネルオーディオ信号の少なくとも2つのチャンネル間相関関係を含み、
    前記組合せ空間情報のチャンネル間相関関係は、前記マルチチャンネルオーディオ信号の前記チャンネル間相関関係を組み合わせて算出される、請求項に記載のオーディオ信号のデコーディング装置。
  10. 前記組合せ空間情報の前記チャンネル間相関関係は、前記マルチチャンネルオーディオ信号の前記チャンネル間相関関係、及び、前記マルチチャンネルオーディオ信号の前記チャンネル間レベル差を組み合わせて算出される、請求項に記載のオーディオ信号のデコーディング装置。
JP2008531017A 2005-09-14 2006-09-14 オーディオ信号のデコーディング方法及び装置 Active JP5108772B2 (ja)

Applications Claiming Priority (17)

Application Number Priority Date Filing Date Title
US71652405P 2005-09-14 2005-09-14
US60/716,524 2005-09-14
US75998006P 2006-01-19 2006-01-19
US60/759,980 2006-01-19
US76036006P 2006-01-20 2006-01-20
US60/760,360 2006-01-20
US77366906P 2006-02-16 2006-02-16
US60/773,669 2006-02-16
US77672406P 2006-02-27 2006-02-27
US60/776,724 2006-02-27
US78751606P 2006-03-31 2006-03-31
US60/787,516 2006-03-31
US81602206P 2006-06-22 2006-06-22
US60/816,022 2006-06-22
KR10-2006-0078300 2006-08-18
KR20060078300 2006-08-18
PCT/KR2006/003662 WO2007032648A1 (en) 2005-09-14 2006-09-14 Method and apparatus for decoding an audio signal

Publications (3)

Publication Number Publication Date
JP2009508175A JP2009508175A (ja) 2009-02-26
JP2009508175A5 JP2009508175A5 (ja) 2009-04-09
JP5108772B2 true JP5108772B2 (ja) 2012-12-26

Family

ID=37865187

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2008531017A Active JP5108772B2 (ja) 2005-09-14 2006-09-14 オーディオ信号のデコーディング方法及び装置
JP2008531018A Pending JP2009508176A (ja) 2005-09-14 2006-09-14 オーディオ信号のデコーディング方法及び装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2008531018A Pending JP2009508176A (ja) 2005-09-14 2006-09-14 オーディオ信号のデコーディング方法及び装置

Country Status (8)

Country Link
US (6) US20080228501A1 (ja)
EP (4) EP1946297B1 (ja)
JP (2) JP5108772B2 (ja)
KR (4) KR100857106B1 (ja)
AU (1) AU2006291689B2 (ja)
CA (1) CA2621664C (ja)
HK (1) HK1126306A1 (ja)
WO (4) WO2007032647A1 (ja)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2621664C (en) * 2005-09-14 2012-10-30 Lg Electronics Inc. Method and apparatus for decoding an audio signal
KR100888474B1 (ko) * 2005-11-21 2009-03-12 삼성전자주식회사 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법
US7965848B2 (en) * 2006-03-29 2011-06-21 Dolby International Ab Reduced number of channels decoding
EP2082397B1 (en) * 2006-10-16 2011-12-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for multi -channel parameter transformation
CA2874454C (en) * 2006-10-16 2017-05-02 Dolby International Ab Enhanced coding and parameter representation of multichannel downmixed object coding
CN101960514A (zh) 2008-03-14 2011-01-26 日本电气株式会社 信号分析控制系统及其方法、信号控制装置及其方法和程序
EP2214161A1 (en) * 2009-01-28 2010-08-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for upmixing a downmix audio signal
KR101283783B1 (ko) * 2009-06-23 2013-07-08 한국전자통신연구원 고품질 다채널 오디오 부호화 및 복호화 장치
CN102484547A (zh) 2009-09-01 2012-05-30 松下电器产业株式会社 数字广播发送装置、数字广播接收装置以及数字广播收发系统
US9042559B2 (en) 2010-01-06 2015-05-26 Lg Electronics Inc. Apparatus for processing an audio signal and method thereof
US9036843B2 (en) 2010-02-05 2015-05-19 2236008 Ontario, Inc. Enhanced spatialization system
CN102473417B (zh) 2010-06-09 2015-04-08 松下电器(美国)知识产权公司 频带扩展方法、频带扩展装置、集成电路及音频解码装置
US9154878B2 (en) * 2012-01-10 2015-10-06 Monster, Llc Interconnected speaker system
CN104054126B (zh) * 2012-01-19 2017-03-29 皇家飞利浦有限公司 空间音频渲染和编码
US9774974B2 (en) 2014-09-24 2017-09-26 Electronics And Telecommunications Research Institute Audio metadata providing apparatus and method, and multichannel audio data playback apparatus and method to support dynamic format conversion
GB201718341D0 (en) * 2017-11-06 2017-12-20 Nokia Technologies Oy Determination of targeted spatial audio parameters and associated spatial audio playback
GB2572650A (en) 2018-04-06 2019-10-09 Nokia Technologies Oy Spatial audio parameters and associated spatial audio playback
GB2574239A (en) 2018-05-31 2019-12-04 Nokia Technologies Oy Signalling of spatial audio parameters
EP4115633A4 (en) 2020-03-02 2024-03-06 Magic Leap Inc IMMERSIVE AUDIO PLATFORM

Family Cites Families (81)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5166685A (en) * 1990-09-04 1992-11-24 Motorola, Inc. Automatic selection of external multiplexer channels by an A/D converter integrated circuit
US5632005A (en) * 1991-01-08 1997-05-20 Ray Milton Dolby Encoder/decoder for multidimensional sound fields
DE4217276C1 (ja) 1992-05-25 1993-04-08 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung Ev, 8000 Muenchen, De
DE4236989C2 (de) 1992-11-02 1994-11-17 Fraunhofer Ges Forschung Verfahren zur Übertragung und/oder Speicherung digitaler Signale mehrerer Kanäle
JP2924539B2 (ja) 1993-01-29 1999-07-26 日本ビクター株式会社 音像定位制御方法
ES2165370T3 (es) 1993-06-22 2002-03-16 Thomson Brandt Gmbh Metodo para obtener una matriz decodificadora multicanal.
DE69433258T2 (de) * 1993-07-30 2004-07-01 Victor Company of Japan, Ltd., Yokohama Raumklangsignalverarbeitungsvorrichtung
ES2167046T3 (es) * 1994-02-25 2002-05-01 Henrik Moller Sintesis binaural, funcion de transferencia relacionada con una cabeza y su utilizacion.
JP3397001B2 (ja) 1994-06-13 2003-04-14 ソニー株式会社 符号化方法及び装置、復号化装置、並びに記録媒体
US5703584A (en) * 1994-08-22 1997-12-30 Adaptec, Inc. Analog data acquisition system
JPH08123494A (ja) 1994-10-28 1996-05-17 Mitsubishi Electric Corp 音声符号化装置、音声復号化装置、音声符号化復号化方法およびこれらに使用可能な位相振幅特性導出装置
JPH08202397A (ja) 1995-01-30 1996-08-09 Olympus Optical Co Ltd 音声復号化装置
JP3088319B2 (ja) * 1996-02-07 2000-09-18 松下電器産業株式会社 デコード装置およびデコード方法
US5912636A (en) * 1996-09-26 1999-06-15 Ricoh Company, Ltd. Apparatus and method for performing m-ary finite state machine entropy coding
KR100206333B1 (ko) 1996-10-08 1999-07-01 윤종용 두개의 스피커를 이용한 멀티채널 오디오 재생장치및 방법
US6711266B1 (en) * 1997-02-07 2004-03-23 Bose Corporation Surround sound channel encoding and decoding
JP3572165B2 (ja) 1997-04-04 2004-09-29 株式会社デノン 映像音響信号再生装置及び映像音響信号再生方法
US6307941B1 (en) * 1997-07-15 2001-10-23 Desper Products, Inc. System and method for localization of virtual sound
DK1072089T3 (da) 1998-03-25 2011-06-27 Dolby Lab Licensing Corp Fremgangsmåde og apparat til bearbejdning af audiosignaler
US6574339B1 (en) * 1998-10-20 2003-06-03 Samsung Electronics Co., Ltd. Three-dimensional sound reproducing apparatus for multiple listeners and method thereof
JP3346556B2 (ja) * 1998-11-16 2002-11-18 日本ビクター株式会社 音声符号化方法及び音声復号方法
EP1054575A3 (en) 1999-05-17 2002-09-18 Bose Corporation Directional decoding
KR100416757B1 (ko) 1999-06-10 2004-01-31 삼성전자주식회사 위치 조절이 가능한 가상 음상을 이용한 스피커 재생용 다채널오디오 재생 장치 및 방법
KR20010009258A (ko) 1999-07-08 2001-02-05 허진호 가상 멀티 채널 레코딩 시스템
US6864913B2 (en) * 1999-12-23 2005-03-08 Harry L. Tarnoff Method and apparatus for a reconfigurable digital processor for film conversion
US6973130B1 (en) * 2000-04-25 2005-12-06 Wee Susie J Compressed video signal including information for independently coded regions
US7212872B1 (en) 2000-05-10 2007-05-01 Dts, Inc. Discrete multichannel audio with a backward compatible mix
JP4304401B2 (ja) 2000-06-07 2009-07-29 ソニー株式会社 マルチチャンネルオーディオ再生装置
WO2004019656A2 (en) 2001-02-07 2004-03-04 Dolby Laboratories Licensing Corporation Audio channel spatial translation
JP3566220B2 (ja) 2001-03-09 2004-09-15 三菱電機株式会社 音声符号化装置、音声符号化方法、音声復号化装置及び音声復号化方法
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US7583805B2 (en) * 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
KR100480787B1 (ko) * 2001-11-27 2005-04-07 삼성전자주식회사 좌표 인터폴레이터의 키 값 데이터 부호화/복호화 방법 및 장치
AUPR955001A0 (en) * 2001-12-11 2002-01-24 Medivac Technology Pty Limited Compact waste treatment apparatus
EP1470550B1 (en) 2002-01-30 2008-09-03 Matsushita Electric Industrial Co., Ltd. Audio encoding and decoding device and methods thereof
EP1341160A1 (en) 2002-03-01 2003-09-03 Deutsche Thomson-Brandt Gmbh Method and apparatus for encoding and for decoding a digital information signal
KR100978018B1 (ko) 2002-04-22 2010-08-25 코닌클리케 필립스 일렉트로닉스 엔.브이. 공간 오디오의 파라메터적 표현
US7391869B2 (en) 2002-05-03 2008-06-24 Harman International Industries, Incorporated Base management systems
JP4296752B2 (ja) * 2002-05-07 2009-07-15 ソニー株式会社 符号化方法及び装置、復号方法及び装置、並びにプログラム
US6703584B2 (en) * 2002-05-13 2004-03-09 Seagate Technology Llc Disc clamp adjustment using heat
BRPI0305434B1 (pt) * 2002-07-12 2017-06-27 Koninklijke Philips Electronics N.V. Methods and arrangements for encoding and decoding a multichannel audio signal, and multichannel audio coded signal
EP1439524B1 (en) 2002-07-19 2009-04-08 NEC Corporation Audio decoding device, decoding method, and program
CN1219414C (zh) 2002-07-23 2005-09-14 华南理工大学 两扬声器虚拟5.1通路环绕声的信号处理方法
US20060100861A1 (en) 2002-10-14 2006-05-11 Koninkijkle Phillips Electronics N.V Signal filtering
ATE357043T1 (de) 2002-10-14 2007-04-15 Thomson Licensing Verfahren zum kodieren und dekodieren von der breite einer schallquelle in einer audioszene
US20060120534A1 (en) 2002-10-15 2006-06-08 Jeong-Il Seo Method for generating and consuming 3d audio scene with extended spatiality of sound source
JP4393383B2 (ja) 2002-10-15 2010-01-06 韓國電子通信研究院 ユーザの選好度によるオーディオ信号適応変換装置、および、その方法
KR101049751B1 (ko) 2003-02-11 2011-07-19 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩
KR100917464B1 (ko) 2003-03-07 2009-09-14 삼성전자주식회사 대역 확장 기법을 이용한 디지털 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치
US8054980B2 (en) * 2003-09-05 2011-11-08 Stmicroelectronics Asia Pacific Pte, Ltd. Apparatus and method for rendering audio information to virtualize speakers in an audio system
US7447317B2 (en) 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
KR20050060789A (ko) * 2003-12-17 2005-06-22 삼성전자주식회사 가상 음향 재생 방법 및 그 장치
US7394903B2 (en) 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
US7613306B2 (en) * 2004-02-25 2009-11-03 Panasonic Corporation Audio encoder and audio decoder
US7805313B2 (en) * 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
KR100773539B1 (ko) * 2004-07-14 2007-11-05 삼성전자주식회사 멀티채널 오디오 데이터 부호화/복호화 방법 및 장치
TWI393121B (zh) 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
SE0402650D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Improved parametric stereo compatible coding of spatial audio
US7787631B2 (en) * 2004-11-30 2010-08-31 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
KR100682904B1 (ko) * 2004-12-01 2007-02-15 삼성전자주식회사 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법
US7903824B2 (en) * 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
US7751572B2 (en) * 2005-04-15 2010-07-06 Dolby International Ab Adaptive residual audio coding
US7961890B2 (en) * 2005-04-15 2011-06-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. Multi-channel hierarchical audio coding with compact side information
AU2006255662B2 (en) * 2005-06-03 2012-08-23 Dolby Laboratories Licensing Corporation Apparatus and method for encoding audio signals with decoding instructions
US20070055510A1 (en) * 2005-07-19 2007-03-08 Johannes Hilpert Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding
US8654983B2 (en) * 2005-09-13 2014-02-18 Koninklijke Philips N.V. Audio coding
CA2621664C (en) * 2005-09-14 2012-10-30 Lg Electronics Inc. Method and apparatus for decoding an audio signal
RU2380767C2 (ru) 2005-09-14 2010-01-27 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способ и устройство для декодирования аудиосигнала
JP4740335B2 (ja) * 2005-09-14 2011-08-03 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
KR100888474B1 (ko) * 2005-11-21 2009-03-12 삼성전자주식회사 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법
JP2007143596A (ja) 2005-11-24 2007-06-14 Tekken Constr Co Ltd 遊技機等の取り付け枠
US20070121953A1 (en) * 2005-11-28 2007-05-31 Mediatek Inc. Audio decoding system and method
KR100803212B1 (ko) * 2006-01-11 2008-02-14 삼성전자주식회사 스케일러블 채널 복호화 방법 및 장치
CN101410891A (zh) * 2006-02-03 2009-04-15 韩国电子通信研究院 使用空间线索控制多目标或多声道音频信号的渲染的方法和装置
KR100773562B1 (ko) * 2006-03-06 2007-11-07 삼성전자주식회사 스테레오 신호 생성 방법 및 장치
WO2007111568A2 (en) * 2006-03-28 2007-10-04 Telefonaktiebolaget L M Ericsson (Publ) Method and arrangement for a decoder for multi-channel surround sound
US8266195B2 (en) * 2006-03-28 2012-09-11 Telefonaktiebolaget L M Ericsson (Publ) Filter adaptive frequency resolution
US7965848B2 (en) * 2006-03-29 2011-06-21 Dolby International Ab Reduced number of channels decoding
US8027479B2 (en) * 2006-06-02 2011-09-27 Coding Technologies Ab Binaural multi-channel decoder in the context of non-energy conserving upmix rules

Also Published As

Publication number Publication date
JP2009508175A (ja) 2009-02-26
EP1938312A4 (en) 2010-01-20
KR100857107B1 (ko) 2008-09-05
KR100857106B1 (ko) 2008-09-08
US20080255857A1 (en) 2008-10-16
EP1946295A1 (en) 2008-07-23
EP1946296A1 (en) 2008-07-23
AU2006291689B2 (en) 2010-11-25
EP1946297A1 (en) 2008-07-23
HK1126306A1 (en) 2009-08-28
US20110178808A1 (en) 2011-07-21
EP1946297A4 (en) 2010-01-20
EP1946297B1 (en) 2017-03-08
WO2007032647A1 (en) 2007-03-22
WO2007032650A1 (en) 2007-03-22
CA2621664A1 (en) 2007-03-22
WO2007032646A1 (en) 2007-03-22
KR100857108B1 (ko) 2008-09-05
KR20080049730A (ko) 2008-06-04
US20110182431A1 (en) 2011-07-28
AU2006291689A1 (en) 2007-03-22
WO2007032648A1 (en) 2007-03-22
CA2621664C (en) 2012-10-30
US20080228501A1 (en) 2008-09-18
US20110196687A1 (en) 2011-08-11
EP1946295A4 (en) 2010-01-20
EP1938312A1 (en) 2008-07-02
KR20080039474A (ko) 2008-05-07
JP2009508176A (ja) 2009-02-26
KR100857105B1 (ko) 2008-09-05
US20110246208A1 (en) 2011-10-06
US9747905B2 (en) 2017-08-29
KR20080041683A (ko) 2008-05-13
KR20080039475A (ko) 2008-05-07
EP1946295B1 (en) 2013-11-06
EP1946296A4 (en) 2010-01-20

Similar Documents

Publication Publication Date Title
JP5108772B2 (ja) オーディオ信号のデコーディング方法及び装置
JP4740335B2 (ja) オーディオ信号のデコーディング方法及び装置
JP5450085B2 (ja) オーディオ処理方法及び装置
RU2509442C2 (ru) Способ и устройство для применения реверберации к многоканальному звуковому сигналу с использованием параметров пространственных меток
US20080235006A1 (en) Method and Apparatus for Decoding an Audio Signal
US20080221907A1 (en) Method and Apparatus for Decoding an Audio Signal
JP4988718B2 (ja) オーディオ信号のデコーディング方法及び装置
RU2380767C2 (ru) Способ и устройство для декодирования аудиосигнала

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090210

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110531

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110831

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120424

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120723

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120911

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20121005

R150 Certificate of patent or registration of utility model

Ref document number: 5108772

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20151012

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250