JP6376127B2 - オーディオ信号出力装置および方法、並びにプログラム - Google Patents

オーディオ信号出力装置および方法、並びにプログラム Download PDF

Info

Publication number
JP6376127B2
JP6376127B2 JP2015519804A JP2015519804A JP6376127B2 JP 6376127 B2 JP6376127 B2 JP 6376127B2 JP 2015519804 A JP2015519804 A JP 2015519804A JP 2015519804 A JP2015519804 A JP 2015519804A JP 6376127 B2 JP6376127 B2 JP 6376127B2
Authority
JP
Japan
Prior art keywords
gain
audio signal
reproduction
speaker
distance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015519804A
Other languages
English (en)
Other versions
JPWO2014192603A1 (ja
Inventor
潤宇 史
潤宇 史
徹 知念
徹 知念
優樹 山本
優樹 山本
光行 畠中
光行 畠中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of JPWO2014192603A1 publication Critical patent/JPWO2014192603A1/ja
Application granted granted Critical
Publication of JP6376127B2 publication Critical patent/JP6376127B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • H04S5/02Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation  of the pseudo four-channel type, e.g. in which rear channel signals are derived from two-channel stereo signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0324Details of processing therefor
    • G10L21/034Automatic adjustment
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/301Automatic calibration of stereophonic sound system, e.g. with test microphone
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/308Electronic adaptation dependent on speaker or headphone connection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • H04S5/005Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation  of the pseudo five- or more-channel type, e.g. virtual surround

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

本技術はオーディオ信号出力装置および方法、並びにプログラムに関し、特に、より臨場感のあるオーディオ再生を行なうことができるようにしたオーディオ信号出力装置および方法、並びにプログラムに関する。
マルチチャンネルのオーディオ再生において、再生側のスピーカ配置は、音源の位置と完全に一致することが望ましいが、現実では再生側のスピーカ位置と音源の位置とが異なることが多い。
再生側のスピーカの配置位置と音源の位置が異なると、スピーカの位置にない音源が生じるので、このような音源の音声をどのように再生するかは重要な事項である。
また、任意の位置にある音源の音声を、任意の位置のスピーカから再生する方法としてVBAP(Vector Base Amplitude Pannning)と呼ばれる技術が提案されている(例えば、非特許文献1参照)。
VBAPでは、目標となる音像の定位位置が、その定位位置の周囲にある2つまたは3つのスピーカの方向を向くベクトルの線形和で表現される。そして、その線形和において各ベクトルに乗算されている係数が、各スピーカから出力されるオーディオ信号のゲインとして用いられてゲイン調整が行なわれ、目標となる位置に音像が定位するようになされる。
Ville Pulkki, "Virtual Sound Source Positioning Using Vector Base Amplitude Panning", Journal of AES, vol.45, no.6, pp.456-466, 1997
ところで、従来では音源のチャンネル数およびスピーカ配置と、再生側のスピーカのチャンネル数およびスピーカ配置が、それぞれ予め決められたチャンネル数とスピーカ配置となる場合、例えばいくつかの国際標準会議で推奨された7.1チャンネル配置と5.1チャンネル配置、5.1チャンネル配置と2.1チャンネル配置、または22.2チャンネル配置と5.1チャンネル配置のような場合については、音声の再生方法が提案されている。このような場合、ダウンミックス処理により各スピーカから適切なゲインで音声が出力され、臨場感のあるオーディオ再生を実現することができる。
しかしながら、上記以外の場合や、音源位置またはスピーカ配置位置が、予め定められた位置からずれた位置にある場合には、提案されている再生方法では、音声を再生することができなかったり、再生はできるものの音質と音像定義が大きく劣化してしまったりすることになる。
また、上述したVBAPではチャンネルベースの音源を再生する場合、チャンネルベースの音源の音像と音源が再生される理想のスピーカの位置が異なることがほとんどであるので、音像定義が大きく劣化することになる。
以上のように上述した技術では、臨場感のあるオーディオ再生を実現することが困難であった。
本技術は、このような状況に鑑みてなされたものであり、より臨場感のあるオーディオ再生を行なうことができるようにするものである。
本技術の一側面のオーディオ信号出力装置は、オーディオ信号を再生する理想的なスピーカの位置と、前記オーディオ信号を再生する実際のスピーカの位置との距離を計算する距離計算部と、前記距離に基づいて前記オーディオ信号の再生ゲインを計算するゲイン計算部と、入力された前記オーディオ信号に基づく入力音声の音圧の期待値、および前記再生ゲインに基づいて、前記再生ゲインによりゲイン調整された前記オーディオ信号に基づく出力音声の全体のパワーと、前記入力音声の全体のパワーとの比を算出し、前記比に基づいて前記再生ゲインを補正する全体ゲイン補正部と、補正された前記再生ゲインに基づいて前記オーディオ信号のゲイン調整を行なうゲイン調整部とを備える。
前記ゲイン計算部には、各前記距離に対する前記再生ゲインを得るためのカーブ情報に基づいて、前記再生ゲインを計算させることができる。
前記カーブ情報を、折れ線カーブまたは関数カーブを示す情報とすることができる。
前記ゲイン調整部には、前記理想的なスピーカが所定の基準点を中心とする単位円上にない場合、前記基準点から前記理想的なスピーカまでの距離と前記単位円の半径とに基づいて定められたゲインにより前記オーディオ信号のゲイン調整をさらに行なわせることができる。
前記ゲイン調整部には、前記基準点から前記理想的なスピーカまでの距離と前記単位円の半径とに基づいて定められた遅延時間に基づいて前記オーディオ信号を遅延させるようにすることができる。
前記ゲイン調整部には、前記実際のスピーカが所定の基準点を中心とする単位円上にない場合、前記基準点から前記実際のスピーカまでの距離と前記単位円の半径とに基づいて定められたゲインにより前記オーディオ信号のゲイン調整をさらに行なわせることができる。
前記ゲイン調整部には、前記基準点から前記実際のスピーカまでの距離と前記単位円の半径とに基づいて定められた遅延時間に基づいて前記オーディオ信号を遅延させるようにすることができる。
オーディオ信号出力装置には、理想的なセンタースピーカの位置と、前記実際のスピーカの位置との距離に基づいて、前記再生ゲインを補正するゲイン補正部をさらに設けることができる。
オーディオ信号出力装置には、前記再生ゲインが予め定められた下限値よりも小さい場合、前記再生ゲインを補正する下限値補正部をさらに設けることができる。
本技術の一側面のオーディオ信号出力方法またはプログラムは、オーディオ信号を再生する理想的なスピーカの位置と、前記オーディオ信号を再生する実際のスピーカの位置との距離を計算し、前記距離に基づいて前記オーディオ信号の再生ゲインを計算し、入力された前記オーディオ信号に基づく入力音声の音圧の期待値、および前記再生ゲインに基づいて、前記再生ゲインによりゲイン調整された前記オーディオ信号に基づく出力音声の全体のパワーと、前記入力音声の全体のパワーとの比を算出し、前記比に基づいて前記再生ゲインを補正し、補正された前記再生ゲインに基づいて前記オーディオ信号のゲイン調整を行なうステップを含む。
本技術の一側面においては、オーディオ信号を再生する理想的なスピーカの位置と、前記オーディオ信号を再生する実際のスピーカの位置との距離が計算され、前記距離に基づいて前記オーディオ信号の再生ゲインが計算され、入力された前記オーディオ信号に基づく入力音声の音圧の期待値、および前記再生ゲインに基づいて、前記再生ゲインによりゲイン調整された前記オーディオ信号に基づく出力音声の全体のパワーと、前記入力音声の全体のパワーとの比が算出され、前記比に基づいて前記再生ゲインが補正され、補正された前記再生ゲインに基づいて前記オーディオ信号のゲイン調整が行なわれる。
本技術の一側面によれば、より臨場感のあるオーディオ再生を行なうことができる。
本技術の概要について説明する図である。 折れ線カーブについて説明する図である。 関数カーブについて説明する図である。 再生ゲインについて説明する図である。 再生装置の構成例を示す図である。 ダウンミックス処理を説明するフローチャートである。 オーディオシステムの構成例を示す図である。 メタデータについて説明する図である。 符号化処理を説明するフローチャートである。 復号処理を説明するフローチャートである。 コンピュータの構成例を示す図である。
以下、図面を参照して、本技術を適用した実施の形態について説明する。
〈第1の実施の形態〉
〈本技術の概要について〉
本技術は、任意のチャンネルの音源を任意の数のスピーカで再生する再生方法と、その再生方法の実現に必要な情報(メタデータ)の符号化および復号技術に関するものである。
まず、本技術の概要について説明する。
例えば、複数の各チャンネルのオーディオ信号と、それらのオーディオ信号のメタデータとが再生装置に供給され、再生装置において、メタデータとオーディオ信号に基づいて、音声の再生を制御するものとする。
ここで、各チャンネルのオーディオ信号は、メタデータにより示される理想的な位置に配置されたスピーカにより再生されるものとして生成された信号であるものとする。以下では、メタデータにより示される位置にある、各チャンネルのオーディオ信号を再生する仮想のスピーカを、理想スピーカと称することとする。また、再生装置から出力されたオーディオ信号に基づいて音声を出力する実際のスピーカを再生スピーカと称することとする。
本技術では、全チャンネルのオーディオ信号が、LFE(Low Frequency Effect)用のオーディオ信号と、LFE用でないオーディオ信号とに分類される。すなわち、全理想スピーカがLFE用のスピーカと、LFE用でないスピーカとに分類される。同様に、再生スピーカも、LFE用のスピーカと、LFE用でないスピーカとに分類される。
まず、LFE用ではないチャンネルのオーディオ信号の再生について説明する。
LFE用ではないチャンネルのオーディオ信号の再生では、例えば図1に示すように、理想スピーカと再生スピーカとの距離に基づいて、オーディオ信号のゲイン調整が行なわれる。
図1では、視聴者であるユーザU11の位置を中心とする半径rの球PH11の表面上に理想スピーカVSP1と、再生スピーカRSP11−1乃至再生スピーカRSP11−3とが配置されている。理想スピーカVSP1および再生スピーカRSP11−1乃至再生スピーカRSP11−3はLFE用ではないスピーカである。
なお、以下、再生スピーカRSP11−1乃至再生スピーカRSP11−3を特に区別する必要のない場合、単に再生スピーカRSP11とも称する。また、この例では、1つの理想スピーカおよび3つの再生スピーカだけが図示されているが、実際には他の理想スピーカや再生スピーカも存在する。
例えば、理想スピーカVSP1に対応するチャンネルのオーディオ信号に基づく音声は、理想スピーカVSP1の位置に音像を定位させることが理想的である。
そこで、本技術では、理想スピーカVSP1と再生スピーカRSP11との距離に応じて各再生スピーカRSP11の再生ゲインを定め、それらの再生ゲインでオーディオ信号に基づく音声を各再生スピーカRSP11から出力させることで、理想スピーカVSP1の位置に音像を定位させる。
具体的には、理想スピーカVSP1と再生スピーカRSP11の距離は、ユーザU11を始点とし、理想スピーカVSP1方向を向くベクトルと、ユーザU11を始点とし、再生スピーカRSP11方向を向くベクトルとのなす角度とされる。
換言すれば、球PH11の表面上における理想スピーカVSP1と再生スピーカRSP11との距離、つまり2つのスピーカを結ぶ弧の長さが、理想スピーカVSP1と再生スピーカRSP11の距離とされる。
図1の例では、矢印A11と矢印A12とがなす角度が、理想スピーカVSP1と再生スピーカRSP11−1との距離DistM1とされている。同様に、矢印A11と矢印A13とがなす角度が、理想スピーカVSP1と再生スピーカRSP11−2との距離DistM2とされ、矢印A11と矢印A14とがなす角度が、理想スピーカVSP1と再生スピーカRSP11−3との距離DistM3とされている。
そして、例えば理想スピーカVSP1のチャンネルのオーディオ信号が、距離DistM1に基づいてゲイン調整されて再生スピーカRSP11−1で再生される。また、理想スピーカVSP1のチャンネルのオーディオ信号は、それぞれ距離DistM2および距離DistM3に基づいてゲイン調整され、再生スピーカRSP11−2および再生スピーカRSP11−3で再生される。
これにより、理想スピーカVSP1と再生スピーカRSP11との位置にずれがある場合であっても、それによって生じた音像のずれを軽減することができ、より臨場感のあるオーディオ再生を実現することができる。
次に、LFE用でないチャンネルのオーディオ信号の再生について、さらに詳細に説明していく。
ここでは、例えば具体的に、LFE用でないM個の理想スピーカ、つまりMチャンネルのオーディオ信号をダウンミックスしてNチャンネルのオーディオ信号とし、それらのNチャンネルのオーディオ信号をLFE用でないN個の再生スピーカにより再生する例について説明する。
ダウンミックス処理では、主に以下に示す6つの処理STE1乃至処理STE6が順番に行なわれる。
(処理STE1):理想スピーカと再生スピーカの距離を求める
(処理STE2):求めた距離と予め定めた減衰カーブに基づいて、理想スピーカごとに各再生スピーカの再生ゲインを求める
(処理STE3):再生スピーカの配置位置に応じて再生ゲインを補正する
(処理STE4):下限値に基づいて再生ゲインを補正する
(処理STE5):出力音声全体のエネルギが、入力音声全体のエネルギと近くなるように再生ゲインを補正する
(処理STE6):再生ゲインをオーディオ信号に適用し、ゲイン調整を行なう
続いて、これらの処理STE1乃至処理STE6について、さらに説明する。
〈処理STE1について〉
まず、処理STE1では、スピーカ間の距離が求められるが、各スピーカの位置は、水平方向角度θ(-180°≦θ≦+180°)、垂直方向角度γ(-90°≦γ≦+90°)、およびユーザからスピーカまでの距離r(0≦r≦+∞)により表現されるものとする。
例えば図1において、ユーザU11の位置を原点とし、x軸、y軸、およびz軸からなる3次元座標系を考えるとする。
ここで、図中、奥行き方向の直線と、図中、横方向の直線とを含む平面をxy平面とすると、xy平面において基準となる方向の直線、例えばy軸と、ユーザU11を始点とするスピーカ方向のベクトルとがxy平面上においてなす角度が水平方向角度θとされる。つまり、水平方向角度θは、図1中、水平方向の角度である。
また、ユーザU11を始点とするスピーカ方向のベクトルと、xy平面とがなす角度が垂直方向角度γとされ、ユーザU11とスピーカとを結ぶ直線の長さが距離rとされる。
各理想スピーカの位置を示す水平方向角度θ、垂直方向角度γ、および距離rは、オーディオ信号のメタデータとして再生装置に供給される。また、再生装置には、各再生スピーカの位置を示す水平方向角度θ、垂直方向角度γ、および距離rも供給される。
なお、以下では、特にM個の理想スピーカのうちのm番目の理想スピーカの水平方向角度θ、垂直方向角度γ、および距離rを、それぞれθim、γim、およびrimで表すこととする。同様に、以下、N個の再生スピーカのうちのn番目の再生スピーカの水平方向角度θ、垂直方向角度γ、および距離rを、それぞれθon、γon、およびronで表すこととする。
再生装置では、M個の理想スピーカごとに、それらの理想スピーカと、N個の各再生スピーカとの距離が求められる。
例えば、m番目の理想スピーカと、n番目の再生スピーカとの距離Dist(m,n)は、次式(1)により求められる。
Figure 0006376127
再生装置では、M個の理想スピーカとN個の再生スピーカの組み合わせごとに式(1)の計算が行なわれ、合計でM×N個の距離Dist(m,n)が計算される。
ところで、各理想スピーカや再生スピーカが半径rの単位円上、つまり図1に示した球PH11上に配置されていれば、各スピーカから出力された音声は、同時にユーザU11に到達する。しかし、一部のスピーカが球PH11上にない場合には、そのスピーカからの音声は、他のスピーカからの音声と比べてユーザU11に早くまたは遅く到達することになるだけでなく、ユーザに聞こえる音声の音圧も変化してしまう。
そこで、再生装置では、距離rim≠rである理想スピーカのオーディオ信号に対して、補正値SoundPressureCorrectionimにより音圧の補正が行なわれ、遅延時間Delayimにより遅延処理が施される。
これにより、理想スピーカが球PH11上に位置するものとして扱うことができるようになる。
具体的には、距離rimと半径rに基づいて次式(2)の計算が行なわれて、補正値SoundPressureCorrectionimが算出される。
Figure 0006376127
式(2)により求まる補正値SoundPressureCorrectionimは、理想スピーカ側、つまり再生装置に入力されたチャンネルmのオーディオ信号に対する補正に用いられる。以下、特に、再生装置に入力されたオーディオ信号を入力オーディオ信号とも称し、再生装置から出力されるオーディオ信号を出力オーディオ信号とも称することとする。
また、理想スピーカの入力オーディオ信号に対する遅延処理のための遅延時間Delayimは、距離rimと半径rに基づいて次式(3)により算出される。なお、rim>rの場合には遅延時間Delayimは負の値となり、遅延処理ではオーディオ信号が負の方向に遅延される、つまりオーディオ信号が時間的に前の方向にシフトされることになる。
Figure 0006376127
これらの補正値SoundPressureCorrectionimと遅延時間Delayimは、距離rim≠rである理想スピーカについて算出される。同様に、距離ron≠rである再生スピーカについても補正値SoundPressureCorrectiononと遅延時間Delayonが算出される。
すなわち、次式(4)により補正値SoundPressureCorrectiononが算出され、式(5)により遅延時間Delayonが算出される。
Figure 0006376127
Figure 0006376127
このようにして求められた補正値SoundPressureCorrectiononと遅延時間Delayonは、再生スピーカ側、つまり出力オーディオ信号に対する音圧の補正値と遅延時間である。再生装置では、距離ron≠rである再生スピーカに供給されるオーディオ信号に対して、補正値SoundPressureCorrectiononにより音圧の補正が行なわれ、遅延時間Delayonにより遅延処理が施される。
〈処理STE2について〉
続いて、処理STE2では、理想スピーカごとに各再生スピーカの再生ゲインが求められる。
まずは、M個の各理想スピーカについて、その理想スピーカとの距離Dist(m,n)が「0」となる再生スピーカが存在するか否かが特定され、各理想スピーカが、再生スピーカ位置にあるスピーカ、または再生スピーカ位置にないスピーカの何れかに分類される。
そして、再生スピーカ位置にあるスピーカとされたm番目の理想スピーカについては、そのm番目の理想スピーカに対応するチャンネルmのオーディオ信号についてのn番目の再生スピーカの再生ゲインMixGain(m,n)が次式(6)により算出される。
Figure 0006376127
式(6)では、距離Dist(m,n)が「0」である再生スピーカ、つまりm番目の理想スピーカと同じ位置にある再生スピーカの再生ゲインMixGain(m,n)は0dBとされる。また、距離Dist(m,n)が「0」でない再生スピーカ、つまりm番目の理想スピーカと異なる位置にある再生スピーカの再生ゲインMixGain(m,n)は-∞dBとされる。
これにより、m番目の理想スピーカに対応するチャンネルmのオーディオ信号は、その理想スピーカと同じ位置にある再生スピーカにおいて再生されることになる。つまり、他の再生スピーカからは、チャンネルmの音声成分は出力されない。
これに対して、再生スピーカ位置にないスピーカとされたm番目の理想スピーカについては、折れ線カーブか、または関数カーブの何れかの減衰カーブが用いられて、その理想スピーカについての各再生スピーカの再生ゲインMixGain(m,n)が求められる。
具体的には、再生装置に供給されるメタデータには、折れ線カーブ、または関数カーブの何れのカーブを用いて再生ゲインを求めるかを示すカーブ情報が含まれており、再生装置はメタデータに含まれるカーブ情報に示される種類のカーブを用いて再生ゲインを算出する。
また、メタデータにはカーブ情報に示される種類のカーブのうちの具体的にどのカーブを用いるかを示すカーブインデックスも含まれている。カーブインデックスは、再生装置には記録されていない新たなカーブを示す情報であることもある。
再生装置は、カーブインデックスが予め定められたカーブを示す情報である場合には、予め記録されている、係数等のカーブを得るための情報を用いて再生ゲインの算出を行なう。一方、カーブインデックスが新たなカーブを示す情報である場合には、再生装置は、メタデータから、新たなカーブを得るための情報を読み出し、その情報から得られるカーブを用いて再生ゲインを算出する。
例えば、再生ゲインの算出に用いられる折れ線カーブは、各距離Dist(m,n)に対する再生ゲインの値から構成される数列により表現される。
具体的には、再生ゲインの値の数列として、[0,-1.5,-4.5,-6,-9,-10.5,-12,-13.5,-15,-15,-16.5,-16.5,-18,-18,-18,-19.5,-19.5,-21,-21,-21,-∞,-∞,-∞,-∞,-∞,-∞](dB)が、再生ゲインを得るための情報とされているとする。
そのような場合、数列の始点の値が距離Dist(m,n)=0°のときの再生ゲインとされ、数列の終点の値が距離Dist(m,n)=180°のときの再生ゲインとされる。また、数列のk番目の点の値が、次式(7)に示す距離Dist(m,n)のときの再生ゲインとされる。
Figure 0006376127
また、数列の隣接する点の間は、距離Dist(m,n)によって再生ゲインが線形に変化するとされる。このような数列により得られる折れ線カーブは、再生ゲインMixGain(m,n)と、距離Dist(m,n)のマッピングを表すカーブである。
例えば、上述した数列によって図2に示す折れ線カーブが得られる。
図2では、縦軸は再生ゲインの値を示しており、横軸は理想スピーカと再生スピーカとの間の距離を示している。また、折れ線CV11が折れ線カーブを表しており、折れ線カーブ上の四角形は、再生ゲインの値の数列を構成する1つの数値を示している。
この例では、n番目の再生スピーカとm番目の理想スピーカとの距離Dist(m,n)がDistM1である場合には、そのn番目の再生スピーカの再生ゲインMixGain(m,n)は、折れ線カーブ上のDistM1におけるゲインの値である-3.5dBとされる。
また、距離Dist(m,n)がDistM2である再生スピーカの再生ゲインMixGain(m,n)は、折れ線カーブ上のDistM2におけるゲインの値である-8dBとされ、距離Dist(m,n)がDistM3である再生スピーカの再生ゲインMixGain(m,n)は、折れ線カーブ上のDistM3におけるゲインの値である-16.5dBとされる。
一方、再生ゲインの算出に用いられる関数カーブは、3つの係数coef1、係数coef2、および係数coef3と、予め定められた下限となるゲイン値MinGainにより表現される。
この場合、再生装置は係数coef1乃至係数coef3、ゲイン値MinGain、および距離Dist(m,n)により表現される、次式(8)に示す関数f(Dist(m,n))を用いて、以下の式(9)を計算し、m番目の理想スピーカについての各再生スピーカの再生ゲインMixGain(m,n)を算出する。
Figure 0006376127
Figure 0006376127
なお、式(9)において、Cut_threは、次式(10)を満たす最小値である。
Figure 0006376127
このような関数f(Dist(m,n))等により表される関数カーブは、例えば図3に示すカーブとなる。なお、図3において縦軸は再生ゲインの値を示しており、横軸は理想スピーカと再生スピーカとの間の距離を示している。また、曲線CV21が関数カーブを表している。
図3に示す関数カーブでは、関数f(Dist(m,n))により示される再生ゲインの値が始めて下限となるゲイン値MinGainより小さくなると、それ以降の各距離Dist(m,n)における再生ゲインの値は「-∞」とされている。なお、図中の点線は、各距離Dist(m,n)におけるもとの関数f(Dist(m,n))の値を示している。
この例では、n番目の再生スピーカとm番目の理想スピーカとの距離Dist(m,n)がDistM1である場合には、そのn番目の再生スピーカの再生ゲインMixGain(m,n)は、関数カーブ上のDistM1におけるゲインの値である-6dBとされる。
また、距離Dist(m,n)がDistM2である再生スピーカの再生ゲインMixGain(m,n)は、関数カーブ上のDistM2におけるゲインの値である-12dBとされ、距離Dist(m,n)がDistM3である再生スピーカの再生ゲインMixGain(m,n)は、関数カーブ上のDistM3におけるゲインの値である-18dBとされる。
なお、関数カーブにより再生ゲインMixGain(m,n)を求める場合、係数coef1乃至係数coef3の組み合わせ[coef1,coef2,coef3]は、例えば[8,-12,6]や、[1,-3,3]、[2,-5.3,4.2]などとされる。
以上の処理によって、M個の理想スピーカごとに、N個の各再生スピーカの再生ゲインMixGain(m,n)が得られることになる。これらの再生スピーカの再生ゲインの値は、理想スピーカとの距離Dist(m,n)が近いほど大きい値となり、その音声の音量も大きくなる。なお、再生ゲインMixGain(m,n)は、M>Nとなる場合にはミックスゲインとなる。
〈処理STE3について〉
さらに、処理STE3では、処理STE2で得られたM×N個の再生ゲインMixGain(m,n)に対して、n番目の再生スピーカの配置位置に応じて補正が行なわれる。
例えば、ユーザの前方に位置する音源からの音声が、ユーザの後方から聞こえると違和感が生じてしまう。これに対して、ユーザの後方に位置する音源からの音声が、ユーザの前方から聞こえても大きな違和感は生じない。
そこで、N個の各再生スピーカがユーザに対して前方や後方など、どこに位置しているかに応じて、各再生スピーカの再生ゲインを補正し、再生スピーカの位置によって出力される音声に違和感が生じないようになされる。すなわち、理想スピーカとの距離Dist(m,n)が同じである、ユーザの前方と後方にある2つの再生スピーカで、この理想スピーカのオーディオ信号を再生する場合、ユーザの後方にある再生スピーカの再生ゲインは、前方の再生スピーカの再生ゲインより小さくなるように補正が行なわれる。
具体的には、まず再生装置は、メタデータから再生スピーカの配置位置に応じた再生ゲインの補正が必要か否かを示す情報を取得し、取得した情報が、再生ゲインの補正が不要である旨の情報である場合には、処理STE3を行なわない。すなわち、処理STE2の後、処理STE3はスキップされて処理STE4が行なわれる。
一方、メタデータから取得した情報が、再生ゲインの補正が必要である旨の情報である場合には、再生装置は、式(1)と同様の計算を行なってN個の各再生スピーカと、空間原点Cとの距離Dist(n,C)を求める。
ここで、空間原点Cとは、再生スピーカが配置される空間上の基準となる位置であり、例えば空間原点Cの位置は、水平方向角度θ=0、垂直方向角度γ=0、および距離r=rにより表現される位置とされる。この場合、空間原点Cの位置は単位円、つまり図1の球PH11上にあり、かつユーザU11の正面に位置することになる。このような空間原点Cの位置は、理想的なセンタースピーカの位置である。
N個の再生スピーカについて空間原点Cとの距離Dist(n,C)が求められると、次式(11)の計算によりN個の各再生スピーカの補正係数spkr_pos_correction_coeffcient(n)が求められる。
Figure 0006376127
なお、式(11)において、Max_spkr_pos_correction_coeffcientは、距離Dist(n,C)が最大(180°)となるときの補正係数を示している。
さらに、求められた補正係数spkr_pos_correction_coeffcient(n)が、m番目の理想スピーカについてのn番目の再生スピーカの再生ゲインMixGain(m,n)に乗算されて、補正後の再生ゲインMixGain_pos_corr(m,n)とされる。すなわち、次式(12)の計算が行なわれる。
Figure 0006376127
なお、式(12)において、MaxMixGain(n)は、n番目の再生スピーカについてのM個の再生ゲイン、つまりnの値が同じである再生ゲインMixGain(m,n)の最大値である。式(12)において、MaxMixGain(n)が含まれる項は、spkr_pos_correction_coeffcient(n)による補正が行なわれ過ぎないようにするための逆補正の項である。
以上の処理により、再生スピーカの配置位置に応じて適宜補正された、M×N個の再生ゲインMixGain_pos_corr(m,n)が得られる。
なお、再生スピーカの配置位置に応じた再生ゲインの補正が行なわれない場合には、再生ゲインMixGain(m,n)がそのまま再生ゲインMixGain_pos_corr(m,n)とされる。
〈処理STE4について〉
また、処理STE3の後に行なわれる処理STE4では、全ての再生スピーカの再生ゲインが小さい値となっている理想スピーカのオーディオ信号に対して、少なくとも1つの再生スピーカにおいて、予め定められた再生ゲインの下限値でオーディオ信号が再生されるように再生ゲインが補正される。
すなわち、処理STE3で得られた理想スピーカごとの再生ゲイン、つまりmの値が同じであるN個の再生ゲインMixGain_pos_corr(m,n)の最大値MaxMixGaini(m)が求められ、その最大値MaxMixGaini(m)と下限値MixGainMinThreとが比較される。
そして、所定のm番目の理想スピーカについて、最大値MaxMixGaini(m)が下限値MixGainMinThreより小さい場合、そのm番目の理想スピーカについてのN個の再生ゲインMixGain_pos_corr(m,n)に対して、補正値MinGaincorrectioni(m)が加算される。ここで、補正値MinGaincorrectioni(m)は、次式(13)に示すように最大値MaxMixGaini(m)と下限値MixGainMinThreとの差分である。
Figure 0006376127
このような補正によって、少なくとも1つの再生スピーカによりチャンネルmのオーディオ信号が所定の最低再生ゲインで再生されることになり、特定チャンネルの音声が聞こえなくなってしまうことを防止することができる。
〈処理STE5について〉
また、処理STE5では、出力音声全体のエネルギが、入力音声全体のエネルギと近くなるように再生ゲインMixGain_pos_corr(m,n)が補正される。
まず、再生装置は、メタデータから理想スピーカの各チャンネル間の相対音圧の期待値SPR_i(m)を読み出し、そのうちの一番音圧の大きい理想スピーカの絶対音圧を0dBFSと仮定し、理想スピーカごとの各期待値SPR_i(m)から各チャンネルのオーディオ信号の音声の音圧を計算し、入力オーディオ信号の音声全体のパワー値pow_iを求める。
ここで、パワー値pow_iは、M個の各チャンネルのオーディオ信号を再生することで理想スピーカから出力される音声(以下、入力音声とも称する)の全体のパワーである。また、以下、N個の各チャンネルのオーディオ信号を再生することで再生スピーカから出力される音声を出力音声とも称することとする。
次に、再生装置は処理STE4で得られた再生ゲインMixGain_pos_corr(m,n)に対して、期待値SPR_i(m)を乗算することで、各再生スピーカの出力音声の音圧の期待値SPR_o(n)を求め、期待値SPR_o(n)から出力音声全体のパワー値pow_oを求める。
そして、再生装置は処理STE4で得られた全ての再生ゲインMixGain_pos_corr(m,n)に、入力音声と出力音声のパワー値の比(pow_o/pow_i)を乗算して、出力音声全体の音圧補正を行なう。このようにして得られた再生ゲインが、理想スピーカごとの各再生スピーカの最終的な再生ゲインとなる。
ここで、一番音圧の大きい理想スピーカの絶対音圧を0dBと仮定して、入力音声と出力音声のパワー値の比(pow_o/pow_i)を求めたが、その値は実際の絶対音圧を用いて求めた入力音声と出力音声のパワー値の比(pow_o/pow_i)と同じ値となる。このように入力音声の絶対音圧を仮定すれば、実際の入力音声の絶対音圧が分からない場合でも、入力音声と出力音声のパワー値の比(pow_o/pow_i)を求めることが可能となる。なお、仮定した音圧値を0dBではなく、他の任意の値としても、結果として得られるパワー値の比は同じ値となる。
〈LFE用のスピーカについて〉
さらに、LFE用のチャンネルのオーディオ信号の再生について説明する。
例えば、LFE用の理想スピーカの数は、0個、1個、または2個のうちの何れかとなり、同様にLFE用の再生スピーカの数も0個、1個、または2個のうちの何れかとなる。
LFE用の理想スピーカの数、またはLFE用の再生スピーカの数の何れかが0個である場合には、LFE用のチャンネルのオーディオ信号は再生不可能であり、そのオーディオ信号のゲインは−∞とされる。
これに対して、LFE用の理想スピーカや再生スピーカの数が1個または2個である場合には、再生装置では例えば図4に示す再生ゲインにより、LFE用の各チャンネルのオーディオ信号が生成される。
すなわち、LFE用の理想スピーカとLFE用の再生スピーカがともに1つまたは2つである場合には、LFE用の理想スピーカのオーディオ信号が、そのままLFE用の再生スピーカのオーディオ信号とされて再生される。
また、LFE用の理想スピーカが1つであり、LFE用の再生スピーカが2つである場合、またはLFE用の理想スピーカが2つであり、LFE用の再生スピーカが1つである場合には、各チャンネルのオーディオ信号が均等に分配される。
すなわち、LFE用の理想スピーカ1つに対して、LFE用の再生スピーカが2つである場合、理想スピーカのオーディオ信号が同じ再生ゲインでゲイン調整され、それぞれ2つの再生スピーカで再生される。また、LFE用の理想スピーカ2つに対して、LFE用の再生スピーカが1つである場合、理想スピーカのオーディオ信号が同じ再生ゲインで足し合わされて1つのオーディオ信号とされ、再生スピーカで再生される。
〈再生装置の構成例〉
続いて、以上において説明した再生装置の具体的な実施の形態について説明する。
再生装置は、例えば図5に示すように構成される。
図5に示す再生装置11は、図示せぬデコーダ等からメタデータとオーディオ信号の供給を受けて、メタデータに基づいてオーディオ信号のゲイン調整を行い、その結果得られたオーディオ信号をスピーカ12−1乃至スピーカ12−Nに供給する。
なお、図5では再生装置11のうちのLFE用でないチャンネルのオーディオ信号を再生するための機能ブロックのみが図示されており、LFE用のチャンネルのオーディオ信号を再生するための機能ブロックの図示は省略されている。
また、図5では、LFE用でないM個の各理想スピーカに対応するMチャンネルのオーディオ信号が供給され、それらのMチャンネルのオーディオ信号がNチャンネルのオーディオ信号に変換されて出力されるものとする。さらに、スピーカ12−1乃至スピーカ12−Nは、以上において説明したLFE用でない再生スピーカに対応する。
以下、スピーカ12−1乃至スピーカ12−Nを特に区別する必要のない場合、単にスピーカ12とも称することとする。また、各スピーカ12は、以上において説明した再生スピーカRSP11に対応するスピーカであるので、スピーカ12を再生スピーカ12とも称することとする。
図5に示す再生装置11には、距離計算部21、再生ゲイン計算部22、補正部23、下限値補正部24、全体ゲイン補正部25、およびゲイン調整部26が設けられている。また、ゲイン調整部26は、増幅部31、増幅部32、および増幅部33を備えている。
距離計算部21には、メタデータに含まれているLFE用ではない各理想スピーカの位置情報と、各再生スピーカ12の位置情報とが供給される。距離計算部21は、理想スピーカの位置情報と再生スピーカ12の位置情報に基づいて距離Dist(m,n)を算出し、再生ゲイン計算部22に供給する。
ここで、各スピーカの位置情報とは水平方向角度θ、垂直方向角度γ、および距離rからなる情報である。
また、距離計算部21は、必要に応じて理想スピーカ側の補正値SoundPressureCorrectionimおよび遅延時間Delayimを算出して増幅部31に供給するとともに、再生スピーカ12側の補正値SoundPressureCorrectiononおよび遅延時間Delayonを算出して増幅部33に供給する。つまり、距離計算部21では処理STE1が行なわれる。
再生ゲイン計算部22には、メタデータに含まれているカーブ情報とカーブインデックスが供給され、再生ゲイン計算部22は、カーブ情報やカーブインデックスと、距離計算部21から供給された距離とを用いて再生ゲインMixGain(m,n)を算出し、補正部23に供給する。すなわち、再生ゲイン計算部22では処理STE2が行なわれる。
補正部23には、再生スピーカ12の位置情報と、メタデータに含まれている、再生スピーカ12の配置位置に応じた再生ゲインの補正が必要か否かを示す情報、および補正係数Max_spkr_pos_correction_coeffcientとが供給される。
補正部23は、これらの供給された情報に基づいて、再生ゲイン計算部22から供給された再生ゲインに対して再生スピーカ12の配置位置に応じた補正を行い、その結果得られた再生ゲインMixGain_pos_corr(m,n)を下限値補正部24に供給する。すなわち、補正部23では処理STE3が行なわれる。
下限値補正部24には、メタデータに含まれている、再生ゲインの下限値MixGainMinThreが供給される。下限値補正部24は、下限値MixGainMinThreに基づいて補正部23から供給された再生ゲインの補正を行い、全体ゲイン補正部25に供給する。すなわち、下限値補正部24では、処理STE4が行なわれる。
全体ゲイン補正部25には、メタデータに含まれている理想スピーカの各チャンネル間の相対音圧の期待値SPR_i(m)が供給される。全体ゲイン補正部25は、期待値SPR_i(m)に基づいて、下限値補正部24から供給された再生ゲインの補正を行い、その結果得られた最終的な再生ゲインを増幅部32に供給する。全体ゲイン補正部25では、処理STE5が行なわれる。
ゲイン調整部26は、図示せぬデコーダから供給されたM個の理想スピーカのオーディオ信号に対してゲイン調整を行なってNチャンネルのオーディオ信号を生成し、各チャンネルのオーディオ信号を再生スピーカ12に供給して音声を再生させる。ゲイン調整部26では、処理STE6が行なわれる。
すなわち、増幅部31は、距離計算部21から供給された補正値および遅延時間に基づいて、供給されたMチャンネルのオーディオ信号に対して、適宜、ゲイン補正および遅延処理を施して増幅部32に供給する。
増幅部32は、増幅部31から供給されたMチャンネルのオーディオ信号に、全体ゲイン補正部25から供給された再生ゲインを乗算する。また、増幅部32は、再生ゲインが乗算された各理想スピーカのオーディオ信号を加算することでNチャンネルのオーディオ信号を生成し、増幅部33に供給する。
増幅部33は、距離計算部21から供給された補正値および遅延時間に基づいて、増幅部32から供給されたNチャンネルのオーディオ信号に対して、適宜、ゲイン補正および遅延処理を施して再生スピーカ12に供給する。
〈ダウンミックス処理の説明〉
続いて、再生装置11の動作について説明する。
再生装置11に各理想スピーカのオーディオ信号とメタデータが供給されると、再生装置11は、LFE用のオーディオ信号と、LFE用ではないオーディオ信号とに対してそれぞれ再生スピーカに供給するオーディオ信号を生成し、出力する。
以下、図6のフローチャートを参照して、再生装置11がLFE用ではないオーディオ信号に対して行なうダウンミックス処理について説明する。
ステップS11において、距離計算部21は、メタデータに含まれているLFE用でない理想スピーカの位置情報と、LFE用でない再生スピーカ12の位置情報に基づいて、理想スピーカと再生スピーカ12の距離Dist(m,n)を求め、再生ゲイン計算部22に供給する。具体的には、理想スピーカと再生スピーカ12の組み合わせごとに式(1)の計算が行なわれ、M×N個の距離Dist(m,n)が求められる。
ステップS12において、距離計算部21は必要に応じて、理想スピーカ側と再生スピーカ12側の補正値および遅延時間を求める。
具体的には距離計算部21は、距離rim≠rである理想スピーカについて、理想スピーカの位置情報としての距離rimに基づいて式(2)および式(3)の計算を行い、補正値SoundPressureCorrectionimおよび遅延時間Delayimを算出して増幅部31に供給する。
また、距離計算部21は、距離ron≠rである再生スピーカについて、再生スピーカ12の位置情報としての距離ronに基づいて式(4)および式(5)の計算を行い、補正値SoundPressureCorrectiononおよび遅延時間Delayonを算出して増幅部33に供給する。
ステップS13において、再生ゲイン計算部22は、距離計算部21から供給された距離Dist(m,n)に基づいて、理想スピーカごとに各再生スピーカ12の再生ゲインを求める。
例えば、再生ゲイン計算部22は、理想スピーカと再生スピーカ12との距離Dist(m,n)が「0」となる再生スピーカ12が存在する理想スピーカについては、式(6)の計算を行なって、その理想スピーカについての各再生スピーカ12の再生ゲインMixGain(m,n)を算出する。
また、再生ゲイン計算部22は、距離Dist(m,n)=0となる再生スピーカ12が存在しない理想スピーカについては、メタデータに含まれているカーブ情報に示されるカーブ、すなわち折れ線カーブまたは関数カーブを得る。このとき、再生ゲイン計算部22は、カーブインデックスを参照し、必要に応じてメタデータから折れ線カーブまたは関数カーブを読み出す。
再生ゲイン計算部22は、折れ線カーブまたは関数カーブが得られると、得られたカーブに基づいて距離Dist(m,n)に対応するゲイン値を求め、求めたゲイン値を理想スピーカの再生スピーカ12についての再生ゲインMixGain(m,n)とする。このとき、必要に応じて式(7)や式(9)の計算が行なわれる。
再生ゲイン計算部22は、各理想スピーカについて、再生スピーカ12ごとの再生ゲインMixGain(m,n)が得られると、再生ゲインMixGain(m,n)を補正部23に供給する。
ステップS14において、補正部23は、メタデータに含まれている再生ゲインの補正が必要か否かを示す情報に基づいて、必要に応じて再生ゲイン計算部22から供給された再生ゲインを再生スピーカ12の配置位置に応じて補正し、下限値補正部24に供給する。
具体的には、補正部23は、各再生スピーカ12の位置情報と、メタデータに含まれている補正係数Max_spkr_pos_correction_coeffcientとを用いて、式(11)および式(12)を計算することで、再生ゲインMixGain_pos_corr(m,n)を算出する。
ステップS15において、下限値補正部24は必要に応じて、メタデータに含まれている下限値MixGainMinThreに基づいて、補正部23から供給された再生ゲインを補正し、全体ゲイン補正部25に供給する。具体的には、必要に応じて式(13)が計算され、再生ゲインMixGain_pos_corr(m,n)に補正値MinGaincorrectioni(m)が加算される。
ステップS16において、全体ゲイン補正部25は出力音声全体の音圧補正を行なう。
すなわち、全体ゲイン補正部25は、メタデータに含まれている期待値SPR_i(m)と、下限値補正部24から供給された再生ゲインMixGain_pos_corr(m,n)とに基づいて、入力音声と出力音声の全体のパワー値の比(pow_o/pow_i)を算出する。そして、全体ゲイン補正部25は、パワー値の比(pow_o/pow_i)を、再生ゲインMixGain_pos_corr(m,n)に乗算して最終的な再生ゲインとし、増幅部32に供給する。
ステップS17において、増幅部31は、距離計算部21から供給された理想スピーカ側の補正値および遅延値に基づいて、オーディオ信号のゲイン調整を行なう。
具体的には増幅部31は、補正値と遅延値が供給されたチャンネルmのオーディオ信号について、オーディオ信号に補正値SoundPressureCorrectionimを乗算し、その結果得られたオーディオ信号を遅延時間Delayimだけ時間方向に遅延させて増幅部32に供給する。
ステップS18において、増幅部32は、全体ゲイン補正部25から供給された再生ゲインと、増幅部31から供給されたオーディオ信号とに基づいて、各再生スピーカ12のオーディオ信号を生成し、増幅部33に供給する。
具体的には、増幅部32は、再生スピーカ12に対応するN個のチャンネルのうちの1つを注目チャンネルncとすると、注目チャンネルncについての各理想スピーカの再生ゲインを、それらの理想スピーカのオーディオ信号に乗算する。そして、増幅部32は、再生ゲインが乗算された各理想スピーカのオーディオ信号、つまりM個のオーディオ信号を足し合わせて得られる1つのオーディオ信号を、注目チャンネルncのオーディオ信号とする。N個の各チャンネルを注目チャンネルとして同様の処理を行なうことで、M個の各理想スピーカのオーディオ信号が、N個の各再生スピーカ12のオーディオ信号へと変換される。
ステップS19において、増幅部33は、距離計算部21から供給された再生スピーカ12側の補正値および遅延値に基づいて、増幅部32から供給されたオーディオ信号のゲイン調整を行なう。
具体的には増幅部33は、補正値と遅延値が供給されたチャンネルnのオーディオ信号について、オーディオ信号に補正値SoundPressureCorrectiononを乗算し、その結果得られたオーディオ信号を遅延時間Delayonだけ時間方向に遅延させて再生スピーカ12に供給する。
各チャンネルのオーディオ信号が再生スピーカ12に出力されると、ダウンミックス処理は終了する。また、再生スピーカ12では、再生装置11から供給されたオーディオ信号に基づいて音声が再生される。
以上のようにして、再生装置11は、理想スピーカの位置と実際の再生スピーカ12の配置位置との距離に応じてオーディオ信号のゲイン調整(ゲイン補正)を行なう。これにより、理想スピーカと再生スピーカ12との位置にずれがある場合であっても、出力音声の音質と音像定義の劣化を抑制することができ、より臨場感のあるオーディオ再生を行なうことができる。
以上において説明した処理によって、入力された任意の1以上のチャンネルのオーディオ信号を、1以上の任意の個数の任意の位置に配置された再生スピーカで再生することができるようになる。また、入力される各チャンネルのオーディオ信号が各オブジェクトを音源とするオーディオ信号である場合であっても、同様のダウンミックス処理により、正しい音像位置でのオーディオ再生を行なうことができる。
〈エンコーダとデコーダについて〉
次に、再生装置11に供給されるメタデータを符号化するエンコーダと、符号化されたメタデータを復号するデコーダについて説明する。
例えば図7に示すように、本技術を適用したオーディオシステムでは、エンコーダ61からデコーダ62にメタデータが供給され、さらにデコーダ62から再生装置11へとメタデータが供給される。
エンコーダ61は、外部からメタデータを得るために必要な情報と、M個の各理想スピーカのオーディオ信号とを取得して、符号化されたメタデータとオーディオ信号とからなるビットストリームを生成する。
エンコーダ61は、メタデータ生成部71、オーディオ信号符号化部72、および出力部73を備えている。
メタデータ生成部71は、外部から必要な情報を取得するとともに、取得した情報を必要に応じて符号化し、符号化されたメタデータを生成する。
例えば、メタデータには、各理想スピーカの位置情報、理想スピーカのうちのLFE用の理想スピーカの数(チャンネル数)、およびカーブ情報、カーブインデックスが含まれている。また、メタデータには、再生スピーカ12の配置位置に応じた再生ゲインの補正が必要か否かを示す情報、再生スピーカ12の配置による補正係数Max_spkr_pos_correction_coeffcient、ゲインの下限値MixGainMinThre、およびチャンネル間の相対音圧の期待値SPR_i(m)も含まれている。
オーディオ信号符号化部72は、外部から供給されたオーディオ信号を符号化する。出力部73は、符号化されたメタデータと、符号化されたオーディオ信号とが含まれるビットストリームを生成し、デコーダ62に出力する。
また、デコーダ62は、抽出部81、オーディオ信号復号部82、および出力部83を備えている。デコーダ62は、エンコーダ61から送信されてきたビットストリームを受信し、抽出部81は、受信されたビットストリームからメタデータとオーディオ信号を抽出する。このとき、抽出部81は必要に応じてメタデータの復号を行なう。
オーディオ信号復号部82は、抽出部81により抽出されたオーディオ信号を復号する。出力部83は、抽出部81により抽出されたメタデータと、オーディオ信号復号部82により復号されたオーディオ信号とを再生装置11に供給する。
さらに、エンコーダ61からデコーダ62に出力されるビットストリームに記述されるメタデータの一部は、例えば図8に示すようになる。すなわち、図8はメタデータの一部のシンタックスを示している。
図8の例では、ヘッダの先頭には、ダウンミックスに必要な情報がメタデータに含まれているか否かを示す情報として「down mix coef exist flag」が配置されている。
また、メタデータにはカーブ情報として「down mix coef mode」が配置されており、その下には、カーブインデックスとしての「polyline curve idx」または「function curve idx」が配置される。
「polyline curve idx」は、折れ線カーブを示しており、この値が2進数「111」である場合には、新たな折れ線カーブであることを示している。この場合、新たな折れ線カーブを得るための情報として「polyline curve coeffcient[j]」が記述されている。
新たな折れ線カーブを得るための情報は、例えば図2に示した折れ線CV11上の四角形の各点(以下、記述点と称する)、つまり数列を構成する各値を特定する情報とされる。
具体的には、例えば再生ゲイン軸(縦軸)が16分割されるとし、16本の分割線が定義される。各記述点は、縦軸の各分割線上に順次配置されるとする。
メタデータ内では、記述点が「0」で表され、各記述点がどの分割線上に配置されるかを示す情報は「1」で表されることとする。
図2中、左から順番に記述点を記述することとし、まず、左から1番目の記述点が上から何本下の分割線上に位置するかを示す情報が「1」の数で記述され、その後、記述点を表す「0」が記述される。ここでは、左から1番目の記述点は最上位の分割線上に位置するため、記述点を表す「0」だけが記述される。
また、それ以降においては、その記述点が、直前の記述点が位置する分割線からQ本下の分割線上に位置することを示す情報がQ個の「1」で記述され、その後に記述点を表す「0」が記述される。
例えば、左から3番目の記述点は2番目の記述点より2本下の分割線上に位置するため、2個の「1」が記述され、その後、1個の「0」が記述される。また、左から10番目の記述点は9番目の記述点と同じ分割線上に位置する、すなわち0本下の分割線上に位置するので、「1」が記述されず、1個の「0」だけが記述される。
上記の方法により記述が行なわれ、全ての記述点の記述が完了した場合、1個の「1」が記述され、折れ線カーブの情報の記述が終了したことが表される。但し、記述点の数が多く、合わせて64個の「1」と「0」を用いても記述しきれない場合には、「1」と「0」の数が64に達するまで記述が行なわれ、その後は記述終了とされる。
したがって、折れ線カーブを得るための情報をメタデータから読み出す場合には、16個の「1」、または合計で64個の「1」と「0」(すなわち、「1」と「0」が合計で64個)が読み出されるまで、順番に各記述点を得るための情報が読み出され、折れ線カーブが生成される。
また、「function curve idx」は、関数カーブを示しており、この値が2進数の「111」である場合には、新たな関数カーブであることを示している。この場合、新たな関数カーブの係数として「function_curve_coeffcient[i]」が記述されている。
また、メタデータに記述されている「minimun_gain_threshold_idx」は、ゲインの下限値MixGainMinThreを示すインデックスである。さらに、メタデータに記述されている「gain_correction_coeffcient」は再生スピーカ12の配置位置に応じた再生ゲインの補正に必要な補正係数Max_spkr_pos_correction_coeffcientである。ここで、Max_spkr_pos_correction_coeffcientの値が「1」である場合には、再生スピーカ12の配置位置に応じた再生ゲインの補正は必要ないことを示していることになる。
さらに、メタデータには、チャンネル間の相対音圧の期待値SPR_i(m)がメタデータ内に記述されているか否かを示す情報である「sound_level_exist_flag」が記述されており、この「sound_level_exist_flag」の値に応じて「channel sound level[i]」が記述される。「channel sound level[i]」は、期待値SPR_i(m)である。
〈符号化処理の説明〉
さらに、エンコーダ61とデコーダ62の動作について説明する。
まず、図9のフローチャートを参照して、エンコーダ61による符号化処理について説明する。
ステップS41において、メタデータ生成部71は、外部から必要な情報を取得するとともに、取得した情報の符号化を行なうことで、符号化されたメタデータを生成する。例えば、メタデータ生成部71は、図8に示したシンタックスに対応するメタデータを生成する。
ステップS42において、オーディオ信号符号化部72は、外部から供給されたオーディオ信号を符号化する。
ステップS43において、出力部73は、符号化されたメタデータと、符号化されたオーディオ信号とが含まれるビットストリームを生成し、デコーダ62に出力する。そして、ビットストリームが出力されると、符号化処理は終了する。
以上のようにしてエンコーダ61は、理想スピーカの位置情報や、カーブ情報などが含まれるメタデータを生成し、出力する。このように理想スピーカの位置情報やカーブ情報などからなる情報をメタデータとして生成することで、再生装置11において、理想スピーカの位置と実際の再生スピーカ12の配置位置との距離に応じたゲイン補正など、適切なゲイン補正を行なうことができるようになる。その結果、より臨場感のあるオーディオ再生を行なうことができる。
〈復号処理の説明〉
続いて、図10のフローチャートを参照して、デコーダ62により行なわれる復号処理について説明する。
ステップS71において、デコーダ62はエンコーダ61から送信されてきたビットストリームを受信し、抽出部81は、受信されたビットストリームからメタデータとオーディオ信号を抽出する。また、抽出部81は、メタデータの復号も行なう。
ステップS72において、オーディオ信号復号部82は、抽出部81により抽出されたオーディオ信号を復号する。
ステップS73において、出力部83は、復号されたメタデータと、復号されたオーディオ信号とを再生装置11に出力し、復号処理は終了する。
以上のようにしてデコーダ62は、メタデータとオーディオ信号を復号し、理想スピーカの位置情報や、カーブ情報などが含まれるメタデータとオーディオ信号を再生装置11に出力する。このように理想スピーカの位置情報やカーブ情報などからなる情報をメタデータとして出力することで、再生装置11において、理想スピーカの位置と実際の再生スピーカ12の配置位置との距離に応じたゲイン補正など、適切なゲイン補正を行なうことができるようになる。その結果、より臨場感のあるオーディオ再生を行なうことができる。
ところで、上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウェアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のコンピュータなどが含まれる。
図11は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示すブロック図である。
コンピュータにおいて、CPU501,ROM502,RAM503は、バス504により相互に接続されている。
バス504には、さらに、入出力インターフェース505が接続されている。入出力インターフェース505には、入力部506、出力部507、記録部508、通信部509、及びドライブ510が接続されている。
入力部506は、キーボード、マウス、マイクロホン、撮像素子などよりなる。出力部507は、ディスプレイ、スピーカなどよりなる。記録部508は、ハードディスクや不揮発性のメモリなどよりなる。通信部509は、ネットワークインターフェースなどよりなる。ドライブ510は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどのリムーバブルメディア511を駆動する。
以上のように構成されるコンピュータでは、CPU501が、例えば、記録部508に記録されているプログラムを、入出力インターフェース505及びバス504を介して、RAM503にロードして実行することにより、上述した一連の処理が行われる。
コンピュータ(CPU501)が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディア511に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。
コンピュータでは、プログラムは、リムーバブルメディア511をドライブ510に装着することにより、入出力インターフェース505を介して、記録部508にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部509で受信し、記録部508にインストールすることができる。その他、プログラムは、ROM502や記録部508に、あらかじめインストールしておくことができる。
なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。
また、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。
例えば、本技術は、1つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。
また、上述のフローチャートで説明した各ステップは、1つの装置で実行する他、複数の装置で分担して実行することができる。
さらに、1つのステップに複数の処理が含まれる場合には、その1つのステップに含まれる複数の処理は、1つの装置で実行する他、複数の装置で分担して実行することができる。
さらに、本技術は、以下の構成とすることも可能である。
[1]
オーディオ信号を再生する理想的なスピーカの位置と、前記オーディオ信号を再生する実際のスピーカの位置との距離を計算する距離計算部と、
前記距離に基づいて前記オーディオ信号の再生ゲインを計算するゲイン計算部と、
前記再生ゲインに基づいて前記オーディオ信号のゲイン調整を行なうゲイン調整部と
を備えるオーディオ信号出力装置。
[2]
前記ゲイン計算部は、各前記距離に対する前記再生ゲインを得るためのカーブ情報に基づいて、前記再生ゲインを計算する
[1]に記載のオーディオ信号出力装置。
[3]
前記カーブ情報は、折れ線カーブまたは関数カーブを示す情報である
[2]に記載のオーディオ信号出力装置。
[4]
前記ゲイン調整部は、前記理想的なスピーカが所定の基準点を中心とする単位円上にない場合、前記基準点から前記理想的なスピーカまでの距離と前記単位円の半径とに基づいて定められたゲインにより前記オーディオ信号のゲイン調整をさらに行う
[1]または[2]に記載のオーディオ信号出力装置。
[5]
前記ゲイン調整部は、前記基準点から前記理想的なスピーカまでの距離と前記単位円の半径とに基づいて定められた遅延時間に基づいて前記オーディオ信号を遅延させる
[4]に記載のオーディオ信号出力装置。
[6]
前記ゲイン調整部は、前記実際のスピーカが所定の基準点を中心とする単位円上にない場合、前記基準点から前記実際のスピーカまでの距離と前記単位円の半径とに基づいて定められたゲインにより前記オーディオ信号のゲイン調整をさらに行う
[1]または[2]に記載のオーディオ信号出力装置。
[7]
前記ゲイン調整部は、前記基準点から前記実際のスピーカまでの距離と前記単位円の半径とに基づいて定められた遅延時間に基づいて前記オーディオ信号を遅延させる
[6]に記載のオーディオ信号出力装置。
[8]
理想的なセンタースピーカの位置と、前記実際のスピーカの位置との距離に基づいて、前記再生ゲインを補正するゲイン補正部をさらに備える
[1]乃至[7]の何れかに記載のオーディオ信号出力装置。
[9]
前記再生ゲインが予め定められた下限値よりも小さい場合、前記再生ゲインを補正する下限値補正部をさらに備える
[1]乃至[8]の何れかに記載のオーディオ信号出力装置。
[10]
入力された前記オーディオ信号に基づく入力音声の音圧の期待値、および前記再生ゲインに基づいて、前記再生ゲインによりゲイン調整された前記オーディオ信号に基づく出力音声の全体のパワーと、前記入力音声の全体のパワーとの比を算出し、前記比に基づいて前記再生ゲインを補正する全体ゲイン補正部をさらに備える
[1]乃至[9]の何れかに記載のオーディオ信号出力装置。
[11]
オーディオ信号を再生する理想的なスピーカの位置と、前記オーディオ信号を再生する実際のスピーカの位置との距離を計算し、
前記距離に基づいて前記オーディオ信号の再生ゲインを計算し、
前記再生ゲインに基づいて前記オーディオ信号のゲイン調整を行なう
ステップを含むオーディオ信号出力方法。
[12]
オーディオ信号を再生する理想的なスピーカの位置と、前記オーディオ信号を再生する実際のスピーカの位置との距離を計算し、
前記距離に基づいて前記オーディオ信号の再生ゲインを計算し、
前記再生ゲインに基づいて前記オーディオ信号のゲイン調整を行なう
ステップを含む処理をコンピュータに実行させるプログラム。
[13]
オーディオ信号を再生する理想的なスピーカの位置と、前記オーディオ信号を再生する実際のスピーカの位置との距離に応じて前記オーディオ信号のゲインを補正するための補正情報を生成する補正情報生成部と、
前記オーディオ信号を符号化する符号化部と、
前記補正情報および符号化された前記オーディオ信号を含むビットストリームを出力する出力部と
を備える符号化装置。
[14]
オーディオ信号を再生する理想的なスピーカの位置と、前記オーディオ信号を再生する実際のスピーカの位置との距離に応じて前記オーディオ信号のゲインを補正するための補正情報を生成し、
前記オーディオ信号を符号化し、
前記補正情報および符号化された前記オーディオ信号を含むビットストリームを出力する
ステップを含む符号化方法。
[15]
オーディオ信号を再生する理想的なスピーカの位置と、前記オーディオ信号を再生する実際のスピーカの位置との距離に応じて前記オーディオ信号のゲインを補正するための補正情報、および符号化された前記オーディオ信号をビットストリームから抽出する抽出部と、
前記符号化された前記オーディオ信号を復号する復号部と、
復号された前記オーディオ信号および前記補正情報を出力する出力部と
を備える復号装置。
[16]
前記補正情報は、前記理想的なスピーカの位置情報である
[15]に記載の復号装置。
[17]
前記補正情報は、各前記距離に対するゲインを得るためのカーブ情報である
[15]または[16]に記載の復号装置。
[18]
前記カーブ情報は、折れ線カーブまたは関数カーブを示す情報である
[17]に記載の復号装置。
[19]
オーディオ信号を再生する理想的なスピーカの位置と、前記オーディオ信号を再生する実際のスピーカの位置との距離に応じて前記オーディオ信号のゲインを補正するための補正情報、および符号化された前記オーディオ信号をビットストリームから抽出し、
前記符号化された前記オーディオ信号を復号し、
復号された前記オーディオ信号および前記補正情報を出力する
ステップを含む復号方法。
11 再生装置, 21 距離計算部, 22 再生ゲイン計算部, 23 補正部, 24 下限値補正部, 25 全体ゲイン補正部, 26 ゲイン調整部, 61 エンコーダ, 62 デコーダ, 71 メタデータ生成部, 72 オーディオ信号符号化部, 73 出力部, 81 抽出部, 82 オーディオ信号復号部, 83 出力部

Claims (11)

  1. オーディオ信号を再生する理想的なスピーカの位置と、前記オーディオ信号を再生する実際のスピーカの位置との距離を計算する距離計算部と、
    前記距離に基づいて前記オーディオ信号の再生ゲインを計算するゲイン計算部と、
    入力された前記オーディオ信号に基づく入力音声の音圧の期待値、および前記再生ゲインに基づいて、前記再生ゲインによりゲイン調整された前記オーディオ信号に基づく出力音声の全体のパワーと、前記入力音声の全体のパワーとの比を算出し、前記比に基づいて前記再生ゲインを補正する全体ゲイン補正部と、
    補正された前記再生ゲインに基づいて前記オーディオ信号のゲイン調整を行なうゲイン調整部と
    を備えるオーディオ信号出力装置。
  2. 前記ゲイン計算部は、各前記距離に対する前記再生ゲインを得るためのカーブ情報に基づいて、前記再生ゲインを計算する
    請求項1に記載のオーディオ信号出力装置。
  3. 前記カーブ情報は、折れ線カーブまたは関数カーブを示す情報である
    請求項2に記載のオーディオ信号出力装置。
  4. 前記ゲイン調整部は、前記理想的なスピーカが所定の基準点を中心とする単位円上にない場合、前記基準点から前記理想的なスピーカまでの距離と前記単位円の半径とに基づいて定められたゲインにより前記オーディオ信号のゲイン調整をさらに行う
    請求項1または請求項2に記載のオーディオ信号出力装置。
  5. 前記ゲイン調整部は、前記基準点から前記理想的なスピーカまでの距離と前記単位円の半径とに基づいて定められた遅延時間に基づいて前記オーディオ信号を遅延させる
    請求項4に記載のオーディオ信号出力装置。
  6. 前記ゲイン調整部は、前記実際のスピーカが所定の基準点を中心とする単位円上にない場合、前記基準点から前記実際のスピーカまでの距離と前記単位円の半径とに基づいて定められたゲインにより前記オーディオ信号のゲイン調整をさらに行う
    請求項1または請求項2に記載のオーディオ信号出力装置。
  7. 前記ゲイン調整部は、前記基準点から前記実際のスピーカまでの距離と前記単位円の半径とに基づいて定められた遅延時間に基づいて前記オーディオ信号を遅延させる
    請求項6に記載のオーディオ信号出力装置。
  8. 理想的なセンタースピーカの位置と、前記実際のスピーカの位置との距離に基づいて、前記再生ゲインを補正するゲイン補正部をさらに備える
    請求項1乃至請求項7の何れか一項に記載のオーディオ信号出力装置。
  9. 前記再生ゲインが予め定められた下限値よりも小さい場合、前記再生ゲインを補正する下限値補正部をさらに備える
    請求項1乃至請求項8の何れか一項に記載のオーディオ信号出力装置。
  10. オーディオ信号を再生する理想的なスピーカの位置と、前記オーディオ信号を再生する実際のスピーカの位置との距離を計算し、
    前記距離に基づいて前記オーディオ信号の再生ゲインを計算し、
    入力された前記オーディオ信号に基づく入力音声の音圧の期待値、および前記再生ゲインに基づいて、前記再生ゲインによりゲイン調整された前記オーディオ信号に基づく出力音声の全体のパワーと、前記入力音声の全体のパワーとの比を算出し、前記比に基づいて前記再生ゲインを補正し、
    補正された前記再生ゲインに基づいて前記オーディオ信号のゲイン調整を行なう
    ステップを含むオーディオ信号出力方法。
  11. オーディオ信号を再生する理想的なスピーカの位置と、前記オーディオ信号を再生する実際のスピーカの位置との距離を計算し、
    前記距離に基づいて前記オーディオ信号の再生ゲインを計算し、
    入力された前記オーディオ信号に基づく入力音声の音圧の期待値、および前記再生ゲインに基づいて、前記再生ゲインによりゲイン調整された前記オーディオ信号に基づく出力音声の全体のパワーと、前記入力音声の全体のパワーとの比を算出し、前記比に基づいて前記再生ゲインを補正し、
    補正された前記再生ゲインに基づいて前記オーディオ信号のゲイン調整を行なう
    ステップを含む処理をコンピュータに実行させるプログラム。
JP2015519804A 2013-05-31 2014-05-21 オーディオ信号出力装置および方法、並びにプログラム Active JP6376127B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2013115725 2013-05-31
JP2013115725 2013-05-31
PCT/JP2014/063410 WO2014192603A1 (ja) 2013-05-31 2014-05-21 オーディオ信号出力装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム

Publications (2)

Publication Number Publication Date
JPWO2014192603A1 JPWO2014192603A1 (ja) 2017-02-23
JP6376127B2 true JP6376127B2 (ja) 2018-08-22

Family

ID=51988636

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015519804A Active JP6376127B2 (ja) 2013-05-31 2014-05-21 オーディオ信号出力装置および方法、並びにプログラム

Country Status (9)

Country Link
US (1) US9866985B2 (ja)
EP (1) EP3007469A4 (ja)
JP (1) JP6376127B2 (ja)
KR (1) KR20160013861A (ja)
CN (1) CN105247893A (ja)
BR (1) BR112015029344A2 (ja)
RU (1) RU2668113C2 (ja)
TW (1) TWI634798B (ja)
WO (1) WO2014192603A1 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3657823A1 (en) * 2013-11-28 2020-05-27 Dolby Laboratories Licensing Corporation Position-based gain adjustment of object-based audio and ring-based channel audio
US11290819B2 (en) * 2016-01-29 2022-03-29 Dolby Laboratories Licensing Corporation Distributed amplification and control system for immersive audio multi-channel amplifier
US9949052B2 (en) 2016-03-22 2018-04-17 Dolby Laboratories Licensing Corporation Adaptive panner of audio objects
JP6684651B2 (ja) * 2016-05-24 2020-04-22 日本放送協会 チャンネル数変換装置およびそのプログラム
EP3565279A4 (en) * 2016-12-28 2020-01-08 Sony Corporation AUDIO SIGNAL REPRODUCING DEVICE AND REPRODUCING METHOD, SOUND COLLECTING DEVICE AND SOUND COLLECTING METHOD, AND PROGRAM
US9820073B1 (en) 2017-05-10 2017-11-14 Tls Corp. Extracting a common signal from multiple audio signals
EP3713255A4 (en) * 2017-11-14 2021-01-20 Sony Corporation SIGNAL PROCESSING DEVICE AND METHOD AND PROGRAM
JP7226436B2 (ja) 2018-04-12 2023-02-21 ソニーグループ株式会社 情報処理装置および方法、並びにプログラム
RU191094U1 (ru) * 2019-03-22 2019-07-23 Федеральное государственное бюджетное образовательное учреждение высшего образования "Санкт-Петербургский государственный институт кино и телевидения" Универсальный усилитель мощности сигналов звуковой частоты
CN113795425B (zh) * 2019-06-05 2024-08-16 索尼集团公司 信息处理装置、信息处理方法和程序
WO2021113350A1 (en) 2019-12-02 2021-06-10 Dolby Laboratories Licensing Corporation Systems, methods and apparatus for conversion from channel-based audio to object-based audio
CN115299079A (zh) * 2020-03-19 2022-11-04 松下电器(美国)知识产权公司 音响再现方法、计算机程序及音响再现装置

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3397001B2 (ja) * 1994-06-13 2003-04-14 ソニー株式会社 符号化方法及び装置、復号化装置、並びに記録媒体
DE19646055A1 (de) * 1996-11-07 1998-05-14 Thomson Brandt Gmbh Verfahren und Vorrichtung zur Abbildung von Schallquellen auf Lautsprecher
JP2005286903A (ja) * 2004-03-30 2005-10-13 Pioneer Electronic Corp 音響再生装置、音響再生システム、音響再生方法及び制御プログラム並びにこのプログラムを記録した情報記録媒体
JP2006101248A (ja) * 2004-09-30 2006-04-13 Victor Co Of Japan Ltd 音場補正装置
JP2008187213A (ja) * 2005-05-19 2008-08-14 D & M Holdings Inc オーディオ信号処理装置、スピーカボックス、スピーカシステム及び映像音声出力装置
KR100644715B1 (ko) * 2005-12-19 2006-11-10 삼성전자주식회사 능동적 오디오 매트릭스 디코딩 방법 및 장치
JP4867367B2 (ja) * 2006-01-30 2012-02-01 ヤマハ株式会社 立体音響再生装置
US20070253561A1 (en) * 2006-04-27 2007-11-01 Tsp Systems, Inc. Systems and methods for audio enhancement
JP4835298B2 (ja) * 2006-07-21 2011-12-14 ソニー株式会社 オーディオ信号処理装置、オーディオ信号処理方法およびプログラム
US20080232601A1 (en) * 2007-03-21 2008-09-25 Ville Pulkki Method and apparatus for enhancement of audio reconstruction
JP2009206819A (ja) * 2008-02-27 2009-09-10 Sharp Corp 音声信号処理装置、音声信号処理方法、音声信号処理プログラム、記録媒体、表示装置、並びに、表示装置用ラック
JP5401864B2 (ja) * 2008-08-01 2014-01-29 ヤマハ株式会社 音響装置及びプログラム
FR2955996B1 (fr) * 2010-02-04 2012-04-06 Goldmund Monaco Sam Methode pour creer un environnement audio avec n haut-parleurs
US9008338B2 (en) * 2010-09-30 2015-04-14 Panasonic Intellectual Property Management Co., Ltd. Audio reproduction apparatus and audio reproduction method

Also Published As

Publication number Publication date
BR112015029344A2 (pt) 2017-07-25
TW201505455A (zh) 2015-02-01
CN105247893A (zh) 2016-01-13
EP3007469A4 (en) 2017-03-15
EP3007469A1 (en) 2016-04-13
US9866985B2 (en) 2018-01-09
RU2015149206A (ru) 2017-05-19
US20160127847A1 (en) 2016-05-05
JPWO2014192603A1 (ja) 2017-02-23
KR20160013861A (ko) 2016-02-05
RU2668113C2 (ru) 2018-09-26
WO2014192603A1 (ja) 2014-12-04
TWI634798B (zh) 2018-09-01

Similar Documents

Publication Publication Date Title
JP6376127B2 (ja) オーディオ信号出力装置および方法、並びにプログラム
US10674262B2 (en) Merging audio signals with spatial metadata
RU2759160C2 (ru) УСТРОЙСТВО, СПОСОБ И КОМПЬЮТЕРНАЯ ПРОГРАММА ДЛЯ КОДИРОВАНИЯ, ДЕКОДИРОВАНИЯ, ОБРАБОТКИ СЦЕНЫ И ДРУГИХ ПРОЦЕДУР, ОТНОСЯЩИХСЯ К ОСНОВАННОМУ НА DirAC ПРОСТРАНСТВЕННОМУ АУДИОКОДИРОВАНИЮ
US20240305945A1 (en) Spatial audio signal manipulation
JP2023083502A (ja) 信号処理装置および方法、並びにプログラム
TWI692254B (zh) 聲音處理裝置及方法、以及程式
US11743646B2 (en) Signal processing apparatus and method, and program to reduce calculation amount based on mute information
WO2015186535A1 (ja) オーディオ信号処理装置および方法、符号化装置および方法、並びにプログラム
KR20160003659A (ko) 음성 처리 장치 및 음성 처리 시스템
CN114450977A (zh) 用于在空间变换域中处理声场表示的装置、方法或计算机程序
US11483669B2 (en) Spatial audio parameters
WO2014208387A1 (ja) 音声信号処理装置
JP6694755B2 (ja) チャンネル数変換装置およびそのプログラム
JPWO2016039168A1 (ja) 音声処理装置および方法
JP2006270649A (ja) 音声・音響信号処理装置およびその方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170511

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170511

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180508

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180611

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180626

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180709

R151 Written notification of patent or utility model registration

Ref document number: 6376127

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151