JP2018201224A - オーディオ信号レンダリング方法及び装置 - Google Patents

オーディオ信号レンダリング方法及び装置 Download PDF

Info

Publication number
JP2018201224A
JP2018201224A JP2018146254A JP2018146254A JP2018201224A JP 2018201224 A JP2018201224 A JP 2018201224A JP 2018146254 A JP2018146254 A JP 2018146254A JP 2018146254 A JP2018146254 A JP 2018146254A JP 2018201224 A JP2018201224 A JP 2018201224A
Authority
JP
Japan
Prior art keywords
signal
channel
rendering
audio signal
rendered
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018146254A
Other languages
English (en)
Other versions
JP6660982B2 (ja
Inventor
ジョン,サン−ベ
Sang-Bae Chon
キム,ソン−ミン
Sung Min Kim
チョウ,ヒョン
Hyun Jo
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2018201224A publication Critical patent/JP2018201224A/ja
Application granted granted Critical
Publication of JP6660982B2 publication Critical patent/JP6660982B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/307Frequency adjustment, e.g. tone control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/07Synergistic effects of band splitting and sub-band processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
  • Details Of Audible-Bandwidth Transducers (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】立体音響再生方法及びその装置に係り、高度音響信号を含む多チャネルオーディオ信号を、水平面レイアウト環境で再生するための方法及び装置を提供する
【解決手段】立体音響再生装置は、多チャネルオーディオ信号を獲得し、多チャネルオーディオ信号のチャネル情報及び周波数によって再生されるチャネルにレンダリングし、レンダリングされた信号をミキシングする。
【選択図】図3

Description

本発明は、立体音響再生方法及びその装置に係り、特に、多チャネルオーディオ信号を再生する方法及びその装置に関する。
映像処理技術及び音響処理技術の発達により、高画質・高音質のコンテンツが量産されている。高画質・高音質のコンテンツを要求したユーザは、臨場感あふれる映像及び音響を望み、それにより、立体映像及び立体音響に係わる研究が活発に進められている。
立体音響は、複数個のスピーカを水平面上の異なる位置に配置し、それぞれのスピーカから、同一であったり異なったりする音響信号を出力することにより、ユーザに空間感を感じさせる技術である。しかし、実際の音響は、水平面上の多様な位置で発生するだけではなく、異なる高度でも発生する。従って、異なる高度で発生する音響信号を、水平面上に配置されたスピーカを介して再生する技術が必要である。
本発明は、立体音響再生方法及びその装置に係り、高度音響信号を含む多チャネルオーディオ信号を、水平面レイアウト環境で再生するための方法に関する。
本発明の一実施形態による、立体音響再生方法は、多チャネルオーディオ信号を獲得する段階と、前記多チャネルオーディオ信号のチャネル情報、及び周波数によって再生されるチャネルにレンダリングする段階と、前記レンダリングされた信号をミキシングする段階と、を含むことを特徴とする。
前記立体音響再生方法は、前記多チャネルオーディオ信号からアプローズ信号を分離する段階をさらに含み、前記レンダリングする段階は、前記アプローズ信号は、2D(two-dimensional)レンダリング方法によってレンダリングされるか、あるいは前記アプローズ信号の各チャネル別に、水平面上に配置された出力チャネルのうち最も近いチャネルにレンダリングされる段階を含むことを特徴とする。
前記ミキシングする段階は、前記レンダリングされたアプローズ信号を、エネルギーブースト方式によってミキシングする段階を含むことを特徴とする。
前記アプローズ信号を分離する段階は、前記多チャネル入力信号にトーナルしない広帯域信号が存在し、前記広帯域信号のレベルがチャネル別に類似しているか否かということ、短い区間のインパルス形態が反復されているか否かということ、及びチャネル間関連性が低いか否かということのうち少なくとも一つに基づいて、前記多チャネル入力信号が、前記アプローズ信号を含むか否かということを判断する段階と、前記判断結果によって、前記アプローズ信号を分離する段階と、を含むことを特徴とする。
前記レンダリングする段階は、前記多チャネルオーディオ信号を、前記チャネル情報に基づいて、水平面チャネル信号及びオーバーヘッドチャネル信号に分離する段階と、前記オーバーヘッドチャネル信号を、低周波信号と高周波信号とに分離する段階と、前記低周波信号は、前記低周波信号の各チャネル別に、水平面上に配置された出力チャネルのうち最も近いチャネルにレンダリングする段階と、前記高周波信号は、3Dレンダリング方法によってレンダリングする段階と、前記水平面チャネル信号は、2Dレンダリング方法によってレンダリングする段階と、を含むことを特徴とする。
前記ミキシングする段階は、前記チャネル情報及び周波数によって、前記レンダリングされた信号に適用するゲインを決定する段階と、前記決定されたゲインを前記レンダリングされた信号に適用してミキシングする段階と、を含むことを特徴とする。
前記ミキシングする段階は、前記レンダリングされた信号のパワー値に基づいて、前記パワー値が保存されるように、前記レンダリングされた信号をミキシングする段階を含むことを特徴とする。
前記ミキシングする段階は、前記レンダリングされた信号のパワー値に基づいて、所定区間単位にミキシングする段階と、前記レンダリングされた信号のうち低周波信号を分離する段階と、前記低周波信号は、以前区間での前記レンダリングされた信号のパワー値に基づいて、前記レンダリングされた信号をミキシングする段階と、を含むことを特徴とする。
前記レンダリングする段階は、前記多チャネルオーディオ信号のチャネル情報、及び周波数によって再生されるチャネルにレンダリングする段階を含むことを特徴とする。
本発明の一実施形態による立体音響再生装置は、多チャネルオーディオ信号を獲得し、前記多チャネルオーディオ信号のチャネル情報、及び周波数によって再生されるチャネルにレンダリングするレンダラ;及び前記レンダリングされた信号をミキシングするミキサ;を含むことを特徴とする。
本発明の一実施形態による立体音響再生装置は、音声信号のうち高度成分を水平面上に配置されたスピーカで高度感あるように再生することができる。
本発明の一実施形態による立体音響再生装置は、多チャネルオーディオ信号をチャネル数が少ない環境で再生するとき、音色(tone)が変わったり、音が消えたりする現象を最小化することができる。
本発明の一実施形態による立体音響再生装置の内部構造を示したブロック図である。 本発明の一実施形態による立体音響再生装置の内部構造を示したブロック図である。 本発明の一実施形態による立体音響再生方法を図示したフローチャートである。 本発明の一実施形態において、アプローズ信号を含むオーディオ信号に対する立体音響再生方法を図示したフローチャートである。 本発明の一実施形態において、3Dレンダラの内部構造を示したブロック図である。 本発明の一実施形態による、レンダリングされたオーディオ信号をミキシングする方法を図示したフローチャートである。 本発明の一実施形態による、レンダリングされたオーディオ信号を周波数によってミキシングする方法を図示したフローチャートである。 本発明の一実施形態による、レンダリングされたオーディオ信号を周波数によってミキシングする一例を図示した例示図である。 本発明の一実施形態による立体音響再生装置の内部構造を示したブロック図である。 本発明の一実施形態による立体音響再生装置の内部構造を示したブロック図である。
以下、本発明の望ましい実施例について、添付した図面を参照して詳細に説明する。ただし、下記の説明、及び添付された図面において、本発明の要旨を不明確にする公知機能または構成に係わる詳細な説明は省略する。また、図面全体にわたって、同一構成要素は、可能な限り、同一図面符号でもって示されているということに留意しなければならない。
以下で説明される本明細書及び特許請求の範囲に使用された用語や単語は、一般的であったり、辞書的であったりする意味に限定して解釈されるものではなく、発明者は、その自身の発明を最善の方法で説明するための用語でもって適切に定義することができるという原則に立脚し、本発明の技術的思想に符合する意味及び概念に解釈されなければならない。従って、本明細書に記載された実施形態と、図面に図示された構成は、本発明の最も望ましい一実施形態に過ぎず、本発明の技術的思想をいずれも代弁するものではないので、本出願時点において、それらを代替する多様な均等物と変形例とがあるということを理解しなければならない。
明細書全体において、ある部分がある構成要素を「含む」とするとき、それは、特別に反対になる記載がない限り、他の構成要素を除くものではなく、他の構成要素をさらに含んでもよいということを意味する。また、明細書に記載された「…部」、「モジュール」というような用語は、少なくとも1つの機能や動作を処理する単位を意味し、それは、ハードウェアまたはソフトウェアによって具現されるか、ハードウェアとソフトウェアとの結合によって具現されるのである。
以下、添付した図面を参照し、本発明の実施形態について、本発明が属する技術分野で当業者が容易に実施することができるように詳細に説明する。しかし、本発明は、さまざまに異なる形態に具現され、ここで説明する実施形態に限定されるものではない。そして、図面において、本発明について明確に説明するために、説明と関係ない部分は省略し、明細書全体を通じて類似した部分については、類似した図面符号を付した。
以下、添付された図面を参照し、本発明の望ましい実施形態について説明する。
図1及び図2は、本発明の一実施形態による立体音響再生装置の内部構造を示したブロック図である。
本発明の一実施形態による立体音響再生装置100は、再生されるチャネルで、ダウンミキシングされた多チャネルオーディオ信号を出力することができる。
立体音響とは、音の高低、音色(tone)だけではなく、方向や距離感まで再生して臨場感を有するものにし、音源が発生させた空間に位置していない聴取者に、方向感、距離感及び空間感を知覚させる空間情報を付加した音響を意味する。
以下の説明において、オーディオ信号のチャネルは、音響が出力されるスピーカの個数を意味する。チャネル数が多いほど、音響が出力されるスピーカの個数が多くなる。本発明の一実施形態による立体音響再生装置100は、チャネル数が多い多チャネルオーディオ信号が、チャネル数が少ない環境で出力されて再生されるように、多チャネルオーディオ信号を、再生されるチャネルにレンダリングしてミキシングすることができる。このとき、多チャネルオーディオ信号は、高度音響を出力することができるチャネルを含んでもよい。
高度音響を出力することができるチャネルは、高度感を感じるように、聴取者の頭上に位置したスピーカを介して、音響信号を出力することができるチャネルを意味する。水平面チャネルは(horizontal channel)、聴取者と水平した面に位置したスピーカを介して、音響信号を出力することができるチャネルを意味する。
前述のチャネル数が少ない環境は、高度音響を出力することができるチャネルを含まず、水平面チャネルによって、水平面上に配置されたスピーカを介して音響を出力する環境を意味する。
また、以下の説明において、水平面チャネルは、水平面上に配置されたスピーカを介して出力されるオーディオ信号を含むチャネルを意味する。オーバーヘッドチャネル(overhead channel)は、水平面ではない高度上に配置されて高度音を出力することができるスピーカを介して出力されるオーディオ信号を含むチャネルを意味する。
図1を参照すれば、本発明の一実施形態による立体音響再生装置100は、レンダラ110及びミキサ120を含んでもよい。
本発明の一実施形態による立体音響再生装置100は、多チャネルオーディオ信号をレンダリングしてミキシングし、再生されるチャネルに出力することができる。例えば、多チャネルオーディオ信号は、22.2チャネル信号であり、再生されるチャネルは、5.1チャネルまたは7.1チャネルでもある。立体音響再生装置100は、多チャネルオーディオ信号の各チャネルを対応させるチャネルを決定することにより、レンダリングを行い、再生されるチャネルと対応した各チャネルの信号を合わせ、最終信号として出力することにより、レンダリングされたオーディオ信号をミキシングすることができる。
レンダラ110は、多チャネルオーディオ信号を、チャネル及び周波数によってレンダリングすることができる。レンダラ110は、多チャネルオーディオ信号に対して、オーバーヘッドチャネルと水平面チャネルとによる信号を、それぞれ3D(three-dimensional)レンダリング及び2D(two-dimensional)レンダリングすることができる。
レンダラ110は、オーバーヘッドチャネルを3Dレンダリングするために、HRTF(head related transfer filter)フィルタを通過したオーバーヘッドチャネルを、周波数によって、それぞれ異なる方法でレンダリングすることができる。HRTFフィルタは、両耳間のレベル差、及び両耳間での、音響時間の到逹時間差のような単純な経路差だけではなく、頭表面での回折、耳たぶによる反射のような複雑な経路上の特性が、音の到来方向によって変化する現象によって、立体音響を認識させる。HRTFフィルタは、オーディオ信号の音質を変化させることにより、立体音響が認識されるように、オーバーヘッドチャネルに含まれたオーディオ信号を処理することができる。
レンダラ110は、オーバーヘッドチャネル信号のうち低周波信号については、アド・ツー・クローゼストチャネル(add to the closest channel)方法によってレンダリングし、高周波信号については、マルチチャネルパンニング(multichannel panning)方法によってレンダリングすることができる。マルチチャネルパンニング方法によれば、多チャネルオーディオ信号の各チャネルの信号が、各チャネル信号にレンダリングされるチャネルごとに互いに異なるように設定されたゲイン値が適用され、少なくとも1つの水平面チャネルにそれぞれレンダリングされる。ゲイン値が適用された各チャネルの信号は、ミキシングを介して合わされることにより、最終信号として出力される。
低周波信号は、回折性が強いので、マルチチャネルパンニング方法によって、多チャネルオーディオ信号の各チャネルを、さまざまなチャネルにそれぞれ分けてレンダリングせず、1つのチャネルにのみレンダリングしても、聴取者の聴取に、同じような音質を有することができる。従って、本発明の一実施形態による立体音響再生装置100は、低周波信号をアド・ツー・クローゼストチャネル方法によってレンダリングすることにより、1つの出力チャネルにさまざまなチャネルがミキシングされるとこによって発生する音質劣化を防止することができる。すなわち、1つの出力チャネルにさまざまなチャネルがミキシングされれば、各チャネル信号間の干渉によって、音質が増幅されたり低減されたりして劣化されるので、1つの出力チャネルに1つのチャネルをミキシングすることにより、音質劣化を防止することができる。
アド・ツー・クローゼストチャネル方法によれば、多チャネルオーディオ信号の各チャネルは、さまざまなチャネルに分けてレンダリングする代わりに、再生されるチャネルのうち最も近いチャネルにレンダリングされる。
また、立体音響再生装置100は、周波数によって異なる方法でレンダリングを行うことにより、スイートスポット(sweet spot)を音質劣化なしに広げることができる。すなわち、回折特性が強い低周波信号に対しては、アド・ツー・クローゼストチャネル方法によってレンダリングすることにより、1つの出力チャネルにさまざまなチャネルがミキシングされることによって発生する音質劣化を防止することができる。スイートスポットとは、聴取者が、歪曲されていない立体音響を最適に聴取することができる所定範囲を意味する。スイートスポットが広いほど、聴取者は、広い範囲で、歪曲されていない立体音響を最適に聴取することができ、聴取者がスイートスポットに位置しない場合、音質または音相などが歪曲された音響を聴取することになる。
周波数によってことなるパンニング(panning)方法でレンダリングする方法については、以下の図4または図5でさらに詳細に説明する。
ミキサ120は、レンダラ110によって水平チャネルと対応した各チャネルの信号を合わせ、最終信号として出力することができる。ミキサ120は、所定区間別に、各チャネルの信号をミキシングすることができる。例えば、ミキサ120は、1フレーム別に、各チャネルの信号をミキシングすることができる。
本発明の一実施形態によるミキサ120は、再生される各チャネルにレンダリングされた信号のパワー値に基づいてミキシングすることができる。言い換えれば、ミキサ120は、再生される各チャネルにレンダリングされた信号のパワー値に基づいて、最終信号の振幅、または最終信号に適用されるゲイン(gain)を決定することができる。
図2を参照すれば、本発明の一実施形態による立体音響再生装置200は、音響分析部210、レンダラ220、ミキサ230及び出力部240を含んでもよい。図2の立体音響再生装置200、レンダラ220及びミキサ230は、図1の立体音響再生装置100、レンダラ110及びミキサ120と対応し、重複説明は省略する。
音響分析部210は、多チャネルオーディオ信号を分析してレンダリングモードを選択し、多チャネルオーディオ信号に含まれた一部信号を分離して出力することができる。音響分析部210は、レンダリングモード選択部211とレンダリング信号分離部212とを含んでもよい。
レンダリングモード選択部211は、多チャネルオーディオ信号に、拍手音や雨の音のように、トランジェント(transient)な信号が多い否かということを所定区間別に判断することができる。以下の説明において、拍手(applause)音や雨の音のように、トランジェント、すなわち、瞬間的であって一時的な信号が多いオーディオ信号をアプローズ(applause)信号と称する。
本発明の一実施形態による立体音響再生装置200は、アプローズ信号を分離し、アプローズ信号の特徴によって、チャネルレンダリング及びミキシングを処理することができる。
レンダリングモード選択部211は、アプローズ信号が、多チャネルオーディオ信号に含まれているか否かということによって、レンダリングモードを、一般(general)モードまたはアプローズモードのうち一つに選択することができる。レンダラ220は、レンダリングモード選択部211によって選択されたモードによってレンダリングすることができる。すなわち、レンダラ220は、選択されたモードによって、アプローズ信号に対するレンダリングを行うことができる。
レンダリングモード選択部211は、アプローズ信号が、多チャネルオーディオ信号に含まれていない場合、一般モードを選択することができる。一般モードによれば、オーバーヘッドチャネル信号は、3Dレンダラ221によってレンダリングされ、水平チャネル信号は、2Dレンダラ222によってレンダリングされる。すなわち、アプローズ信号に対する考慮なしにレンダリングが行われる。
レンダリングモード選択部211は、アプローズ信号が、多チャネルオーディオ信号に含まれている場合、アプローズモードを選択することができる。アプローズモードによれば、アプローズ信号が分離され、分離されたアプローズ信号に対してレンダリングが行われる。
レンダリングモード選択部211は、多チャネルオーディオ信号に含まれているか、あるいは他の装置から別途に受信されたアプローズビット情報を利用して、アプローズ信号が、多チャネルオーディオ信号に含まれているか否かということを、所定区間別に判断することができる。アプローズビット情報は、MPEG(Moving Picture Experts Group)系のコーデックスによれば、bsTsEnableフラグ情報またはbsTempShapeEnableChannelフラグ情報を含み、前述のフラグ情報によって、レンダリングモードが、レンダリングモード選択部211によって選択される。
また、レンダリングモード選択部211は、判断する所定区間の多チャネルオーディオ信号の特性に基づいて、レンダリングモードを選択することができる。すなわち、レンダリングモード選択部211は、所定区間の多チャネルオーディオ信号の特性がアプローズ信号を含むオーディオ信号の特性を有するか否かということによって、レンダリングモードを選択することができる。
レンダリングモード選択部211は、所定区間の多チャネルオーディオ信号において、多数の入力チャネルに、トーナル(tonal)ではない広帯域(wideband)信号が存在し、該信号のレベルがチャネル別に類似しているか否かということ、短い区間のインパルス(impulse)形態が反復されているか否かということ、及びチャネル間の関連性(correlation)が低いか否かということのうち少なくとも1つの条件に基づいて、アプローズ信号が、多チャネルオーディオ信号に含まれているか否かということを判断することができる。
レンダリングモード選択部211は、アプローズ信号が、現在区間において、多チャネルオーディオ信号に含まれていると判断した場合、レンダリングモードをアプローズモードに選択することができる。
レンダリング信号分離部212は、レンダリング信号選択部211によってアプローズモードが選択された場合、多チャネルオーディオ信号に含まれたアプローズ信号を一般音響信号と分離することができる。
MPEG USAC系でのbsTsdEnableフラグが使用される場合、当該チャネルの高度(elevation)に係わりなく、フラグ情報によって、水平チャネル信号のように2Dレンダリングされる。また、オーバーヘッド信号も、フラグ情報によって、水平チャネル信号と仮定されてミキシングされる。すなわち、レンダリング信号分離部212は、フラグ情報によって、所定区間の多チャネルオーディオ信号に含まれたアプローズ信号を分離することができ、分離されたアプローズ信号は、水平チャネル信号のように2Dレンダリングされる。
フラグが使用されない場合、レンダリング信号分離部212は、チャネル間の信号を分析し、アプローズ信号成分を分離することができる。オーバーヘッド信号中にで分離されたアプローズ信号は、2Dレンダリングされ、アプローズ信号ではない残りの信号は、3Dレンダリングされる。
レンダラ220は、オーバーヘッド信号を、3Dレンダリング方法によってレンダリングする3Dレンダラ221と、水平面チャネル信号またはアプローズ信号を2Dレンダリング方法によってレンダリングする2Dレンダラ222と、を含んでもよい。
3Dレンダラ221は、オーバーヘッド信号を、周波数によってそれぞれ異なる方法でレンダリングすることができる。3Dレンダラ221は、低周波信号は、アド・ツー・クローゼストチャネル方法でレンダリングし、高周波信号は、3Dレンダリング方法によってレンダリングすることができる。以下において、3Dレンダリング方法は、オーバーヘッド信号をレンダリングする方法を意味し、3Dレンダリング方法は、マルチチャネルパンニング方法を含んでもよい。
2Dレンダラ222は、水平面チャネル信号またはアプローズ信号を、2Dレンダリング方法、アド・ツー・クローゼストチャネル方法及びエネルギーブースト(energy boost)方法のうち少なくとも1つの方法によってレンダリングすることができる。以下において、2Dレンダリング方法は、水平面チャネル信号をレンダリングする方法を意味し、2Dレンダリング方法は、ダウンミックス数式(downmix equation)またはVBAP(vector base amplitude panning)方法を含んでもよい。
3Dレンダラ221と2Dレンダラ222は、それぞれマトリックス化されて簡略化される。3Dレンダラ221は、入力チャネル、出力チャネル、周波数の関数で決定される3Dダウンミックスマトリックスを介して、ダウンミキシングすることができる。2Dレンダラ222は、入力チャネル、出力チャネルの関数で決定される2Dダウンミックスマトリックスを介して、ダウンミキシングされる。すなわち、3Dダウンミックスマトリックスまたは2Dダウンミックスマトリックスは、入力チャネル、出力チャネルまたは周波数によって決定される係数を含み、入力された多チャネルオーディオ信号をダウンミキシングすることができる。
それは、レンダリング時に、音響信号の位相(phase)部分よりは、周波数別に振幅部分が重要であるので、3Dレンダラ221と2Dレンダラ222は、それぞれ周波数値によって決定される係数を含むダウンミックスマトリックスを利用してレンダリングすることにより、レンダリングの演算量を簡略化することができる。ダウンミックスマトリックスを介してレンダリングされた信号は、ミキサ230のパワー保存モジュールによってミキシングされ、最終信号として出力される。
ミキサ230は、レンダリングされた信号を各チャネル別に演算し、最終信号を出力することができる。本発明の一実施形態によるミキサ230は、各チャネルに含まれた信号のパワー値に基づいて、レンダリングされた信号をミキシングすることができる。従って、本発明の一実施形態による立体音響再生装置200は、レンダリングされた信号のパワー値に基づいてミキシングすることにより、周波数の補強または相殺によって発生する音色歪曲を低減させることができる。
出力部240は、ミキサ230によってミキシングされた信号を、スピーカを介して最終出力させることができる。そのとき、出力部240は、ミキシングされた信号のチャネルによってそれぞれ異なるスピーカを介して、音響信号を出力させることができる。
図3は、本発明の一実施形態による立体音響再生方法を図示したフローチャートである。
図3を参照すれば、段階S301において、立体音響再生装置100は、チャネル情報及び周波数によって、多チャネルオーディオ信号をレンダリングすることができる。立体音響再生装置100は、チャネル情報によって、3Dレンダリングまたは2Dレンダリングを行うが、低周波信号については、低周波信号の特性を考慮してレンダリングすることができる。
段階S303において、立体音響再生装置100は、段階S301でレンダリングされた信号をミキシングし、最終信号を生成することができる。立体音響再生装置100は、多チャネルオーディオ信号の各チャネルの信号を出力するチャネルを決定することによってレンダリングし、レンダリングされた信号を合わせたり演算したりすることによってミキシングし、最終信号を生成することができる。
図4は、本発明の一実施形態において、アプローズ信号を含むオーディオ信号に対する立体音響再生方法を図示したフローチャートである。
図4を参照すれば、段階S401において、立体音響再生装置200は、多チャネルオーディオ信号にアプローズ信号が含まれているか否かということを判断するために、多チャネルオーディオ信号を所定区間別に分析することができる。
段階S403において、立体音響再生装置200は、入力された多チャネルオーディオ信号に、アプローズ信号が含まれているか否かということを、所定区間別に判断することができる。例えば、1フレーム別に判断される。立体音響再生装置200は、フラグ情報、または判断する所定区間の多チャネルオーディオ信号を分析することにより、アプローズ信号を含むか否かということを所定区間別に判断することができる。立体音響再生装置200は、アプローズ信号を、オーバーヘッド信号または水平面チャネル信号とは分離して処理することにより、アプローズ信号をミキシングするときに発生する音質歪曲を最小化することができる。
段階S405において、アプローズ信号が含まれていると判断された場合、立体音響再生装置200は、アプローズ信号を分離し、段階S407において、アプローズ信号と水平面チャネルの信号とを2Dレンダリングすることができる。
水平面チャネルの信号は、ダウンミックス数式(downmix equation)またはVBAP方法によって2Dレンダリングされる。
アプローズ信号は、アド・ツー・クローゼストチャネル方法によって、高度音響を含むチャネルを水平面に投影した場合、最も近いチャネルにレンダリングされるか、あるいは2Dレンダリング方法によってレンダリングされた後、エネルギーブースト方式によってミキシングされる。
アプローズ信号は、2Dレンダリング方法または3Dレンダリング方法によってレンダリングしてミキシングする場合、ミキシングされた信号にトランジェント成分の個数が多くなってホワイトニング(whitening)現象が発生したり、チャネル間のクロス関連性が高くなって音相が狭くなったりする。従って、ホワイトニング現象や、音相が狭くなる現象を防止するために、立体音響再生装置200は、低周波信号を3Dレンダリングするときに使用されるアド・ツー・クローゼストチャネル方法またはエネルギーブースト方式によって、アプローズ信号をレンダリングしてミキシングすることができる。
エネルギーブースト方式は、さまざまなチャネルのオーディオ信号が、1つのチャネルにミキシングされる場合、トランジェント周期が変わって音色がホワイトニングされる現象を防ぐために、水平面チャネル信号のエネルギーを大きくする方法でミキシングする方法を意味する。エネルギーブースト方式は、レンダリングされたアプローズ信号をミキシングする方法に関するものである。
エネルギーブースト方式による、アプローズ信号をミキシングする方法は、下記数式(1)によって遂行される。
ωin,outは、ダウンミキシングゲイン(downmixing gain)を意味するものであり、アプローズ信号は、多チャネルオーディオ信号の各チャネルが再生されるチャネルにレンダリングされ、ミキシングされるとき、各チャネル別にダウンミキシングゲインが適用される。ダウンミキシングゲインは、各チャネルがレンダリングされるチャネルによって、所定値にあらかじめ決定される。xin=out[l,k]は、出力レイアウトに対応するようにレンダリングされたアプローズ信号を示すものであり、いずれか1つのアプローズ信号を意味する。lは、音響信号の所定区間を識別するための値であり、kは、周波数を示す。xin=out[l,k]/|xin=out[l,k]|は、入力されたアプローズ信号の位相値を示し、数式(1)のルート内の値は、同一出力チャネルに対応したアプローズ信号のパワー、すなわち、エネルギー値の和を意味する。
数式(1)を参照すれば、出力レイアウトの1チャネルにレンダリングされた多数のアプローズ信号にダウンミキシングゲインが適用された値のパワー値ほど、再生される各チャネルのゲインが修正される。従って、アプローズ信号は、エネルギー値の和ほど振幅が大きくなり、位相差によって発生するホワイトニング現象が防止される。
段階S409において、立体音響再生装置200は、アプローズ信号が含まれていないと判断された場合、水平チャネルの信号を2Dレンダリングすることができる。
段階S411において、立体音響再生装置200は、オーバーヘッドチャネル信号を、立体音響信号が提供されるように、HRTFフィルタでフィルタリングすることができる。オーバーヘッドチャネル信号が周波数ドメインの信号であるか、あるいはフィルタバンクサンプルである場合、スペクトルの相対的なウェイティング(weighting)だけ提供するためのフィルタであるので、単純な乗算によってHRTFフィルタリングが行われる。
段階S413において、立体音響再生装置200は、オーバーヘッドチャネル信号を高周波と低周波とに分離することができる。例えば、立体音響再生装置200は、1kHzを基準に、それ以下の周波数を有する音響信号を低周波に分離することができる。低周波成分は、回折が強い音響的な特徴によって、アド・ツー・クローゼストチャネル方法によってレンダリングされる。
段階S415において、立体音響再生装置200は、高周波信号に分離された信号は、3Dレンダリング方法によってレンダリングすることができる。3Dレンダリング方法は、マルチチャネルパンニング方法を含んでもよい。マルチチャネルパンニングとは、多チャネルオーディオ信号の各チャネル信号が再生されるチャネルに配分されることを意味する。そのとき、パンニング係数が適用された各チャネル信号が、再生されるチャネルに配分される。高周波信号の場合、高度感が上昇するほど、両耳間のレベル差(ILD:interaural level difference)が低減する特性を提供するために、サラウンドチャネルに信号が配分される。また、フロントチャネルとパンニングされる多数のチャネルの個数によって、音響信号の方向が定位される。
段階S417において、立体音響再生装置100は、低周波信号は、前述のアド・ツー・クローゼストチャネル方法によってレンダリングすることができる。1つのチャネルに、多くの信号、すなわち、多チャネルオーディオ信号のいくつかのチャネル信号が混ざれば、それぞれ異なる位相によって音質が相殺されるか、あるいは増幅されるかということによって音質劣化が発生する。アド・ツー・クローゼストチャネル方法によれば、立体音響再生装置100は、前述の音質劣化の発生を防止するために、各チャネル水平面に投影した場合、最も近いチャネルに、下記表1のようにマッピングすることができる。
表1を参照すれば、オーバーヘッドチャネルにおいて、近いチャネルが複数個存在するTBC及びVOGようなチャネルは、音相定位のために、パンニング係数(panning coeffiecient)によって、5.1チャネルに配分される。
表1に図示されたマッピング関係は、例示に過ぎず、それに限られるものではなく、各チャネルは、異なってもマッピングされる。
多チャネルオーディオ信号が、周波数信号またはフィルタバンク信号である場合、低周波に該当するビン(bin)またはバンド(band)は、アド・ツー・クローゼストチャネル方法、高周波に該当するビンまたはバンドは、マルチチャネルパンニング方法によってレンダリングされる。ビンまたはバンドは、周波数ドメインでの所定単位位の信号区間を意味する。
段階S419において、立体音響再生装置100は、各チャネルにレンダリングされた信号を、パワー値に基づいてミキシングすることができる。そのとき、立体音響再生装置100は、周波数ドメインでミキシングすることができる。各チャネルにレンダリングされた信号を、パワー値に基づいてミキシングする方法については、以下の図6及び図7でさらに詳細に説明する。
段階S421において、立体音響再生装置100は、ミキシングされた最終信号を出力することができる。
図5は、本発明の一実施形態において、3Dレンダラの内部構造を示したブロック図である。図5の3Dレンダラ500は、図2の3Dレンダラ221と対応し、重複説明は省略する。
図5を参照すれば、3Dレンダラ500は、HRTFフィルタ510、LPF(low-pass filter)520、HPF(high-pass filter)530、アド・ツー・クローゼストチャネル540及びマルチチャネルパンニング550を含んでもよい。
HRTFフィルタ510は、多チャネルオーディオ信号のうちオーバーヘッドチャネル信号をHRTFフィルタリングすることができる。
LPF 520は、HRTFフィルタリングされたオーバーヘッドチャネル信号のうち低周波成分を分離して出力することができる。
HPF 530は、HRTFフィルタリングされたオーバーヘッドチャネル信号のうち高周波成分を分離して出力することができる。
アド・ツー・クローゼストチャネル540は、オーバーヘッドチャネル信号のうち低周波成分を各チャネル水平面に投影した場合、最も近いチャネルにレンダリングすることができる。
マルチチャネルパンニング550は、オーバーヘッドチャネル信号のうち高周波成分を、マルチチャネルパンニング方法によってレンダリングすることができる。
図6は、本発明の一実施形態による、レンダリングされたオーディオ信号をミキシングする方法を図示したフローチャートである。図6の段階S601ないし段階S605は、図4の段階S419と対応し、重複説明は省略する。
図6を参照すれば、段階S601において、立体音響再生装置100は、レンダリングされたオーディオ信号を獲得することができる。
段階S603において、立体音響再生装置100は、各チャネル別にレンダリングされた信号のパワー値を獲得し、段階S605において、各チャネル別に獲得されたパワー値に基づいてミキシングすることにより、最終信号を生成することができる。
図7は、本発明の一実施形態による、レンダリングされたオーディオ信号を周波数によってミキシングする方法を図示したフローチャートである。図7の段階S701及び段階S703は、図6の段階S601及び段階S603と対応し、重複説明は省略する。
図7を参照すれば、段階S701において、立体音響再生装置100は、レンダリングされたオーディオ信号を獲得することができる。
段階S703において、立体音響再生装置100は、パワー保存モジュール(power preserving module)によって、各チャネル別にレンダリングされた信号のパワー値を獲得し、段階S705において、獲得されたパワー値に基づいてミキシングすることができる。各チャネル別にレンダリングされた信号のパワー値は、各チャネル別にレンダリングされた信号の二乗の和を求めることによって獲得される。
in,outは、いずれか1つのチャネルにレンダリングされたオーディオ信号であり、xoutは、いずれか1つのチャネルにレンダリングされた信号の総和を示し、lは、多チャネルオーディオ信号の現在区間を示す。kは、周波数を示し、youtは、パワー保存モジュールによってミキシングされた信号を示す。
パワー保存モジュールによれば、前述の各チャネル別にレンダリングされた信号のパワー値に基づいて、最終ミキシングされた信号のパワーが、ミキシング前のパワーに維持されるようにミキシングされる。従って、パワー保存モジュールによれば、ミキシングされた信号が、レンダリングされた信号が加わるとき、補強干渉または相殺干渉によって音響信号が歪曲されることを防止することができる。
数式(2)を参照すれば、立体音響再生装置100は、パワー保存モジュールによって、各チャネル別にレンダリングされた信号の総和に対する位相に、各チャネル別にレンダリングされた信号のパワー値を適用することにより、レンダリングされた信号をミキシングすることができる。
段階S701で獲得された信号が時間ドメインである場合、周波数ドメインに変換された後、数式(2)によってミキシングされる。そのとき、時間ドメインの音響信号は、周波数シェーマまたはフィルタバンクシェーマによって周波数ドメインに変換される。
しかし、立体音響再生装置100が、所定区間別にパワー保存モジュールを適用する場合、所定区間別に、各信号のパワー値を推定するが、低周波の場合、パワー値を推定することができる区間が、波長に比べて十分ではない。従って、各区間ごとに推定されたパワー値が異なり、パワー保存モジュールが適用された区間の境界において、不連続的な部分が生じてしまう。一方、高周波の場合、パワー値を推定することができる区間が波長に比べて十分であるので、区間の境界において、不連続的な部分が発生する可能性が低い。すなわち、以下で説明するワンポールスムージング(one-pole smoothing)方法は、パワー値を推定することができる区間が、波長に比べて十分であるか否かということによって適用される。
本発明の一実施形態による立体音響再生装置100は、段階S707において、段階S705でミキシングされた信号に、低周波信号に該当する部分が存在するか否かということを判断することができる。ミキシングされた信号に、低周波信号に該当する部分が存在する場合、立体音響再生装置100は、段階S709ないし段階S711において、下記数式(3)のワンポールスムージング方法を利用して、パワー保存モジュールが適用された区間の境界で発生した不連続的な部分を除去することができる。
outは、以前区間のPoutと、現在区間のミキシングされた信号総和のパワー値とに基づいて獲得される。
inは、以前区間のPinと、現在区間のレンダリングされた各信号のパワー値の総和とに基づいて獲得される。
以前区間のPoutまたはPinに適用されるγによって、以前区間のパワー値が数式に適用されるが、γは、低周波の波長が長いほど、または周波数値が小さいほど、小さい値を有するように決定される。
本発明の一実施形態による立体音響再生装置100は、不連続的な部分を除去するために、以前区間でレンダリングされた信号、またはレンダリングされた信号を加えた信号のパワー値に基づいて、ミキシングされた信号のゲインを調節することができる。
さらに、数式(3)と同様に、出力信号のゲインを、以前区間の出力信号のゲイン値に基づいて獲得することにより、不連続的な部分を除去するために、数式(4)のように処理される。
本発明の一実施形態による立体音響再生装置100は、不連続的な部分を除去するために、以前区間でレンダリングされた信号、またはレンダリングされた信号を加えた信号に適用されたゲイン値に基づいて、ミキシングされた信号のゲインを調節することができる。
図8は、本発明の一実施形態による、レンダリングされたオーディオ信号を周波数によってミキシングする一例を図示した例示図である。
図8を参照すれば、レンダリングされたオーディオ信号801,802を加えたミキシング過程中の信号803を参照すれば、レンダリングされたオーディオ信号801,802は、位相差によって、加えた値の振幅が増幅されることによって音が大きく聞こえるようになる。
従って、本発明の一実施形態による立体音響再生装置100は、パワー保存モジュールを適用することにより、ミキシング過程中の信号803のゲインを、レンダリングされたオーディオ信号801,802のパワー値に基づいて決定することができる。
パワー保存モジュールによってミキシングされた信号804は、レンダリングされたオーディオ信号801,802と類似した大きさの振幅を有するように調節されたが、所定区間別にパワー保存モジュールが適用されることにより、区間ごとに不連続的な部分を含む。
従って、本発明の一実施形態による立体音響再生装置100は、ワンポールスムージング技法によって、以前区間のパワー値を参照し、ミキシングされた信号に対してスムージング処理を行うことにより、最終信号805を求めることができる。
図9及び図10は、本発明の一実施形態による立体音響再生装置の内部構造を示したブロック図である。
図9を参照すれば、立体音響再生装置900は、3Dレンダラ910、2Dレンダラ920、ウェイティング適用部930、ミキサ940を含んでもよい。図9の3Dレンダラ910、2Dレンダラ920及びミキサ940は、図2の3Dレンダラ221、2Dレンダラ222及びミキサ230と対応し、重複説明は省略する。
3Dレンダラ910は、多チャネルオーディオ信号のうちオーバーヘッドチャネル信号に対してレンダリングすることができる。
2Dレンダラ920は、多チャネルオーディオ信号のうち水平面チャネル信号に対してレンダリングすることができる。
ウェイティング適用部930は、3Dレンダラ910によってレンダリングされるレイアウトにおいて、再生される信号のチャネルレイアウトと一致しない場合、多チャネルオーディオ信号を、再生されるチャネルレイアウトによって出力するための構成要素である。再生されるチャネルのレイアウトとは、再生されるチャネル信号が出力されるスピーカの配置情報を意味する。
2Dレンダラ920がVBAP方法でレンダリングする場合、任意のレイアウトチャネル環境でも、水平面チャネル信号に対するレンダリングが可能である。VBAP方法によれば、立体音響再生装置900は、ベクトル基盤の簡単な計算のみで、任意のスピーカ環境でのパンニングゲインを求め、多チャネルオーディオ信号をレンダリングすることができる。従って、任意の再生チャネルレイアウトが、3Dレンダラ910によってレンダリングされるレイアウトと類似する程度によって、ウェイティングが決定される。例えば、3Dレンダラ910が、多チャネルオーディオ信号を、5.1チャネルの再生環境にレンダリングする場合、レンダリングする任意のレイアウトチャネル環境が、5.1チャネルの再生環境とレイアウトがどれほど異なるかということにより、ウェイティングが決定される。
そして、3Dウェイティング適用部930は、3Dレンダラ910及び2Dレンダラ920によってレンダリングされた信号にそれぞれ決定されたウェイティングを適用し、出力することができる。
図10を参照すれば、立体音響再生装置1000は、3Dレンダラ1010、2Dレンダラ1020及びミキサ1030を含んでもよい。図9の3Dレンダラ1010、2Dレンダラ1020及びミキサ1030は、図2の3Dレンダラ221、2Dレンダラ222及びミキサ230と対応し、重複説明は省略する。
3Dレンダラ1010は、レンダリングすることができるレイアウトのうち、出力されるチャネルのレイアウトと最も類似したレイアウトでレンダリングすることができる。そして、2Dレンダラ1020は、3Dレンダラ1010によってレンダリングされた信号を、各チャネル別に出力される信号のチャネルレイアウトにさらにパンニングさせ(repanning)、レンダリングすることができる。
例えば、3Dレンダラ1010が、多チャネルオーディオ信号を、5.1チャネルの再生環境にレンダリングする場合、2Dレンダラ1020は、VBAP方法によってレンダリングする任意のレイアウトチャネル環境により、3Dレンダリングされた信号をさらにパンニングさせてレンダリングすることができる。
本発明の一実施形態による立体音響再生装置は、音声信号のうち高度成分を水平面上に配置されたスピーカで高度感あるように再生することができる。
本発明の一実施形態による立体音響再生装置は、多チャネルオーディオ信号を、チャネル数が少ない環境で再生するとき、音色が変わったり、音が消えたりする現象を最小化することができる。
本発明の一実施形態による方法は、コンピュータで読み取り可能な記録媒体に、コンピュータ(情報処理機能を有する装置をいずれも含む)で読み取り可能なコードでもって具現することが可能である。コンピュータで読み取り可能な記録媒体は、コンピュータシステムによって読み取り可能なデータが保存される全ての種類の記録装置を含む。コンピュータで読み取り可能な記録装置の例としては、ROM(read only memory)、RAM(random access memory)、CD(compact disc)−ROM、磁気テープ、フロッピー(登録商標)ディスク、光データ保存装置などがある。
たとえ前記説明が多様な実施形態に適用される本発明の新規特徴に焦点を合わせて説明したにしても、本技術分野における当業者であるならば、本発明の範囲を外れずに、前記説明された装置、方法の形態及び詳細事項において、多様な削除、代替及び変更が可能であるということを理解するであろう。従って、本発明の範囲は、前述の説明よりは、特許請求の範囲によって定義される。特許請求の範囲の均等範囲中の全ての変形は、本発明の範囲に包摂されるものである。
以下、本願により教示される実施形態を例示的に列挙する。
(付記1)
複数個の入力チャネルから複数個の出力チャネルに変換される多チャネル信号を受信する段階と、
前記多チャネル信号の特性から、高度感レンダリングのためのレンダリングタイプを決定する段階と、
前記複数個の出力チャネルによって高度感ある音相を提供するために、前記複数個の入力チャネルに含まれた少なくとも1つのオーバーヘッド入力チャネルを、前記決定されたレンダリングタイプによってレンダリングする段階と、を含むオーディオ信号レンダリング方法。
(付記2)
前記多チャネル信号の特性は、ビットストリームに含まれたパラメータから得られることを特徴とする付記1に記載のオーディオ信号レンダリング方法。
(付記3)
前記多チャネル信号の特性は、前記多チャネル信号がアプローズ信号に該当するか否かということを含むことを特徴とする付記1に記載のオーディオ信号レンダリング方法。
(付記4)
前記多チャネル信号の特性は、前記多チャネル信号の帯域幅及び相関度を含むことを特徴とする付記1に記載のオーディオ信号レンダリング方法。
(付記5)
前記レンダリングする段階は、
前記多チャネル信号がアプローズ信号に該当する場合、前記少なくとも1つのオーバーヘッド入力チャネルを2Dレンダリングによってレンダリングする段階と、
前記多チャネル信号がアプローズ信号に該当しない場合、前記少なくとも1つのオーバーヘッド入力チャネルを3Dレンダリングによってレンダリングする段階と、を含むことを特徴とする付記1に記載のオーディオ信号レンダリング方法。
(付記6)
前記方法は、
前記複数個の入力チャネルに含まれた少なくとも1つの水平入力チャネルをレンダリングする段階と、
前記少なくとも1つのオーバーヘッド入力チャネルのレンダリング結果と、前記少なくとも1つの水平入力チャネルのレンダリング結果と、をミキシングする段階と、をさらに含むことを特徴とする付記1に記載のオーディオ信号レンダリング方法。
(付記7)
前記ミキシングする段階は、
各レンダリングされた信号のパワー値に基づいて、前記パワー値が保存されるように、前記レンダリングされた信号をミキシングする段階を含むことを特徴とする付記6に記載のオーディオ信号レンダリング方法。
(付記8)
付記1ないし7のうちいずれか1項に記載の方法を実行することができるプログラムを記録したコンピュータで読み取り可能な記録媒体。
(付記9)
複数個の入力チャネルから複数個の出力チャネルに変換される多チャネル信号を受信する受信部と、
前記多チャネル信号の特性から、高度感レンダリングのためのレンダリングタイプを決定し、前記複数個の出力チャネルによって高度感ある音相を提供するために、前記複数個の入力チャネルに含まれた少なくとも1つのオーバーヘッド入力チャネルを前記決定されたレンダリングタイプによってレンダリングする第1レンダラと、を含むオーディオ信号レンダリング装置。
(付記10)
前記多チャネル信号の特性は、ビットストリームに含まれたパラメータから得られることを特徴とする付記9に記載のオーディオ信号レンダリング装置。
(付記11)
前記多チャネル信号の特性、は前記多チャネル信号がアプローズ信号に該当するか否かということを含むことを特徴とする付記9に記載のオーディオ信号レンダリング装置。
(付記12)
前記多チャネル信号の特性は、前記多チャネル信号の帯域幅及び相関度を含むことを特徴とする付記9に記載のオーディオ信号レンダリング装置。
(付記13)
前記第1レンダラは、前記多チャネル信号がアプローズ信号に該当する場合、前記少なくとも1つのオーバーヘッド入力チャネルを2Dレンダリングによってレンダリングし、前記多チャネル信号がアプローズ信号に該当しない場合、前記少なくとも1つのオーバーヘッド入力チャネルを3Dレンダリングによってレンダリングすることを特徴とする付記9に記載のオーディオ信号レンダリング装置。
(付記14)
前記装置は、
前記複数個の入力チャネルに含まれた少なくとも1つの水平入力チャネルをレンダリングする第2レンダラと、
前記少なくとも1つのオーバーヘッド入力チャネルのレンダリング結果と、前記少なくとも1つの水平入力チャネルのレンダリング結果とをミキシングするミキサと、をさらに含むことを特徴とする付記9に記載のオーディオ信号レンダリング装置。
(付記15)
前記ミキサは、各レンダリングされた信号のパワー値に基づいて、前記パワー値が保存されるように、前記レンダリングされた信号をミキシングすることを特徴とする付記14に記載のオーディオ信号レンダリング装置。

Claims (13)

  1. 少なくとも1つの高さ入力チャネル信号を含むマルチチャネル信号、及びレンダリングタイプ情報を受信する段階と、
    出力レイアウトに対して、三次元(3D)レンダリングのための第1ダウンミックスマトリックスを獲得する段階と、
    出力レイアウトに対して、二次元(2D)レンダリングのための第2ダウンミックスマトリックスを獲得する段階と、
    前記レンダリングタイプ情報に基づいて、前記第1ダウンミックスマトリックス及び前記第2ダウンミックスマトリックスのうち一つを選択する段階と、
    前記第1ダウンミックスマトリックス及び前記第2ダウンミックスマトリックスのうちから選択された一つに基づいて、前記マルチチャネル信号をレンダリングする段階と、を含み、
    前記出力レイアウトは、5.1チャネルフォーマットであるオーディオ信号レンダリング方法。
  2. 前記レンダリングする段階は、
    前記マルチチャネル信号がアプローズ信号を含む場合、前記第2ダウンミックスマトリックスを使用し、前記マルチチャネル信号をレンダリングする段階を含むことを特徴とする請求項1に記載のオーディオ信号レンダリング方法。
  3. 前記レンダリングする段階は、
    前記マルチチャネル信号のパワー値に基づいて、前記パワー値が保存されるように、前記マルチチャネル信号をレンダリングする段階を含むことを特徴とする請求項1に記載のオーディオ信号レンダリング方法。
  4. 前記レンダリングする段階は、
    周波数範囲によって異なるパンニング方法により、前記マルチチャネル信号をパンニングする段階を含むことを特徴とする請求項1に記載のオーディオ信号レンダリング方法。
  5. 前記パンニング方法は、アド・ツー・クローゼストチャネル方法を含むことを特徴とする請求項4に記載のオーディオ信号レンダリング方法。
  6. 前記レンダリングタイプ情報は、フレームごとに受信されることを特徴とする請求項1に記載のオーディオ信号レンダリング方法。
  7. 請求項1に記載の方法を実行することができるプログラムを記録したコンピュータで読み取り可能な記録媒体。
  8. 少なくとも1つの高さ入力チャネル信号を含むマルチチャネル信号、及びレンダリングタイプ情報を受信する受信部と、
    出力レイアウトに対して、三次元(3D)レンダリングのための第1ダウンミックスマトリックスを獲得し、出力レイアウトに対して、二次元(2D)レンダリングのための第2ダウンミックスマトリックスを獲得し、前記レンダリングタイプ情報に基づいて、前記第1ダウンミックスマトリックス及び前記第2ダウンミックスマトリックスのうち一つを選択し、前記第1ダウンミックスマトリックス及び前記第2ダウンミックスマトリックスのうちから選択された一つに基づいて、前記マルチチャネル信号をレンダリングするレンダリング部と、を含み、
    前記出力レイアウトは、5.1チャネルフォーマットであるオーディオ信号レンダリング装置。
  9. 前記レンダリング部は、前記マルチチャネル信号がアプローズ信号を含む場合、前記第2ダウンミックスマトリックスを使用し、前記マルチチャネル信号をレンダリングすることを特徴とする請求項8に記載のオーディオ信号レンダリング装置。
  10. 前記レンダリング部は、前記マルチチャネル信号のパワー値に基づいて、前記パワー値が保存されるように、前記マルチチャネル信号をレンダリングすることを特徴とする請求項8に記載のオーディオ信号レンダリング装置。
  11. 前記レンダリング部は、周波数範囲によって異なるパンニング方法により、前記マルチチャネル信号をパンニングすることを特徴とする請求項8に記載のオーディオ信号レンダリング装置。
  12. 前記パンニング方法は、アド・ツー・クローゼストチャネル方法を含むことを特徴とする請求項11に記載のオーディオ信号レンダリング装置。
  13. 前記レンダリングタイプ情報は、フレームごとに受信されることを特徴とする請求項8に記載のオーディオ信号レンダリング装置。
JP2018146254A 2013-10-25 2018-08-02 オーディオ信号レンダリング方法及び装置 Active JP6660982B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020130128038A KR102231755B1 (ko) 2013-10-25 2013-10-25 입체 음향 재생 방법 및 장치
KR10-2013-0128038 2013-10-25

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2016523302A Division JP6382965B2 (ja) 2013-10-25 2014-10-27 オーディオ信号レンダリング方法及び装置

Publications (2)

Publication Number Publication Date
JP2018201224A true JP2018201224A (ja) 2018-12-20
JP6660982B2 JP6660982B2 (ja) 2020-03-11

Family

ID=52993205

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2016523302A Active JP6382965B2 (ja) 2013-10-25 2014-10-27 オーディオ信号レンダリング方法及び装置
JP2018146254A Active JP6660982B2 (ja) 2013-10-25 2018-08-02 オーディオ信号レンダリング方法及び装置

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2016523302A Active JP6382965B2 (ja) 2013-10-25 2014-10-27 オーディオ信号レンダリング方法及び装置

Country Status (10)

Country Link
US (3) US10091600B2 (ja)
EP (4) EP3833054B1 (ja)
JP (2) JP6382965B2 (ja)
KR (1) KR102231755B1 (ja)
CN (2) CN107734445B (ja)
ES (1) ES2952212T3 (ja)
MX (1) MX355499B (ja)
PL (2) PL3833054T3 (ja)
SI (1) SI3833054T1 (ja)
WO (1) WO2015060696A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6866679B2 (ja) * 2017-02-20 2021-04-28 株式会社Jvcケンウッド 頭外定位処理装置、頭外定位処理方法、及び頭外定位処理プログラム
US10999678B2 (en) 2017-03-24 2021-05-04 Sharp Kabushiki Kaisha Audio signal processing device and audio signal processing system
US11232804B2 (en) 2017-07-03 2022-01-25 Dolby International Ab Low complexity dense transient events detection and coding
CN111434126B (zh) * 2017-12-12 2022-04-26 索尼公司 信号处理装置和方法以及程序

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001016698A (ja) * 1999-06-28 2001-01-19 Sony Corp 音場再生システム
JP2007329746A (ja) * 2006-06-08 2007-12-20 Nippon Hoso Kyokai <Nhk> 3次元音響パンニング装置
JP2009511966A (ja) * 2005-10-12 2009-03-19 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ マルチチャンネル音声信号の時間的および空間的整形
JP2009526467A (ja) * 2006-02-09 2009-07-16 エルジー エレクトロニクス インコーポレイティド オブジェクトベースオーディオ信号の符号化及び復号化方法とその装置
JP2011066868A (ja) * 2009-08-18 2011-03-31 Victor Co Of Japan Ltd オーディオ信号符号化方法、符号化装置、復号化方法及び復号化装置
JP2011209588A (ja) * 2010-03-30 2011-10-20 Fujitsu Ltd ダウンミクス装置およびダウンミクス方法
WO2012145176A1 (en) * 2011-04-18 2012-10-26 Dolby Laboratories Licensing Corporation Method and system for upmixing audio to generate 3d audio
US20120314875A1 (en) * 2011-06-09 2012-12-13 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding 3-dimensional audio signal
JP2013533703A (ja) * 2010-07-07 2013-08-22 サムスン エレクトロニクス カンパニー リミテッド 立体音響再生方法及びその装置

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7558393B2 (en) * 2003-03-18 2009-07-07 Miller Iii Robert E System and method for compatible 2D/3D (full sphere with height) surround sound reproduction
KR20050060789A (ko) 2003-12-17 2005-06-22 삼성전자주식회사 가상 음향 재생 방법 및 그 장치
DE102004057500B3 (de) 2004-11-29 2006-06-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Ansteuerung einer Beschallungsanlage und Beschallungsanlage
EP1761110A1 (en) * 2005-09-02 2007-03-07 Ecole Polytechnique Fédérale de Lausanne Method to generate multi-channel audio signals from stereo signals
WO2007083739A1 (ja) 2006-01-19 2007-07-26 Nippon Hoso Kyokai 3次元音響パンニング装置
WO2007136166A1 (en) 2006-05-23 2007-11-29 Lg Electronics Inc. Digital broadcasting system and method of processing data
KR101297300B1 (ko) 2007-01-31 2013-08-16 삼성전자주식회사 스피커 어레이를 이용한 프론트 서라운드 재생 시스템 및그 신호 재생 방법
KR100943215B1 (ko) 2007-11-27 2010-02-18 한국전자통신연구원 음장 합성을 이용한 입체 음장 재생 장치 및 그 방법
EP2154911A1 (en) * 2008-08-13 2010-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An apparatus for determining a spatial output multi-channel audio signal
CN102246543B (zh) 2008-12-11 2014-06-18 弗兰霍菲尔运输应用研究公司 产生多信道音频信号的装置
KR101387808B1 (ko) 2009-04-15 2014-04-21 한국전자통신연구원 가변 비트율을 갖는 잔차 신호 부호화를 이용한 고품질 다객체 오디오 부호화 및 복호화 장치
WO2011095913A1 (en) 2010-02-02 2011-08-11 Koninklijke Philips Electronics N.V. Spatial sound reproduction
EP2375410B1 (en) * 2010-03-29 2017-11-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. A spatial audio processor and a method for providing spatial parameters based on an acoustic input signal
US9107018B2 (en) 2010-07-22 2015-08-11 Koninklijke Philips N.V. System and method for sound reproduction
SG188254A1 (en) * 2010-08-25 2013-04-30 Fraunhofer Ges Forschung Apparatus for decoding a signal comprising transients using a combining unit and a mixer
KR101783962B1 (ko) 2011-06-09 2017-10-10 삼성전자주식회사 3차원 오디오 신호를 부호화 및 복호화하는 방법 및 장치
EP3893521B1 (en) * 2011-07-01 2024-06-19 Dolby Laboratories Licensing Corporation System and method for adaptive audio signal generation, coding and rendering
EP2645749B1 (en) 2012-03-30 2020-02-19 Samsung Electronics Co., Ltd. Audio apparatus and method of converting audio signal thereof
CN102664017B (zh) * 2012-04-25 2013-05-08 武汉大学 一种3d音频质量客观评价方法
EP2862370B1 (en) * 2012-06-19 2017-08-30 Dolby Laboratories Licensing Corporation Rendering and playback of spatial audio using channel-based audio systems
US9736609B2 (en) * 2013-02-07 2017-08-15 Qualcomm Incorporated Determining renderers for spherical harmonic coefficients
BR112015024692B1 (pt) 2013-03-29 2021-12-21 Samsung Electronics Co., Ltd Método de provisão de áudio realizado por um aparelho de áudio, e aparelho de áudio
CN105376691B (zh) * 2014-08-29 2019-10-08 杜比实验室特许公司 感知方向的环绕声播放

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001016698A (ja) * 1999-06-28 2001-01-19 Sony Corp 音場再生システム
JP2009511966A (ja) * 2005-10-12 2009-03-19 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ マルチチャンネル音声信号の時間的および空間的整形
JP2009526467A (ja) * 2006-02-09 2009-07-16 エルジー エレクトロニクス インコーポレイティド オブジェクトベースオーディオ信号の符号化及び復号化方法とその装置
JP2007329746A (ja) * 2006-06-08 2007-12-20 Nippon Hoso Kyokai <Nhk> 3次元音響パンニング装置
JP2011066868A (ja) * 2009-08-18 2011-03-31 Victor Co Of Japan Ltd オーディオ信号符号化方法、符号化装置、復号化方法及び復号化装置
JP2011209588A (ja) * 2010-03-30 2011-10-20 Fujitsu Ltd ダウンミクス装置およびダウンミクス方法
JP2013533703A (ja) * 2010-07-07 2013-08-22 サムスン エレクトロニクス カンパニー リミテッド 立体音響再生方法及びその装置
WO2012145176A1 (en) * 2011-04-18 2012-10-26 Dolby Laboratories Licensing Corporation Method and system for upmixing audio to generate 3d audio
US20120314875A1 (en) * 2011-06-09 2012-12-13 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding 3-dimensional audio signal

Also Published As

Publication number Publication date
US11051119B2 (en) 2021-06-29
US10091600B2 (en) 2018-10-02
EP4221261A1 (en) 2023-08-02
US20200260204A1 (en) 2020-08-13
SI3833054T1 (sl) 2023-08-31
EP3035711B1 (en) 2020-06-03
US20160269845A1 (en) 2016-09-15
EP3664475B1 (en) 2021-03-31
US10645513B2 (en) 2020-05-05
EP4221261B1 (en) 2024-07-03
EP3035711A1 (en) 2016-06-22
JP2016537864A (ja) 2016-12-01
KR20150047943A (ko) 2015-05-06
WO2015060696A1 (ko) 2015-04-30
EP3035711A4 (en) 2017-04-12
CN107734445B (zh) 2019-10-15
JP6382965B2 (ja) 2018-08-29
EP3833054B1 (en) 2023-06-28
US20180367933A1 (en) 2018-12-20
CN105684466A (zh) 2016-06-15
MX355499B (es) 2018-04-20
JP6660982B2 (ja) 2020-03-11
CN105684466B (zh) 2017-11-28
PL3833054T3 (pl) 2023-08-21
EP3664475A1 (en) 2020-06-10
PL3664475T3 (pl) 2021-07-05
KR102231755B1 (ko) 2021-03-24
ES2952212T3 (es) 2023-10-30
EP3833054A1 (en) 2021-06-09
CN107734445A (zh) 2018-02-23
MX2016004750A (es) 2016-07-22

Similar Documents

Publication Publication Date Title
RU2695508C1 (ru) Устройство предоставления аудио и способ предоставления аудио
KR102160254B1 (ko) 액티브다운 믹스 방식을 이용한 입체 음향 재생 방법 및 장치
KR101341523B1 (ko) 스테레오 신호들로부터 멀티 채널 오디오 신호들을생성하는 방법
JP6660982B2 (ja) オーディオ信号レンダリング方法及び装置
JP2019033506A (ja) 音響信号のレンダリング方法、該装置、及びコンピュータ可読記録媒体
KR102302672B1 (ko) 음향 신호의 렌더링 방법, 장치 및 컴퓨터 판독 가능한 기록 매체
JP2014506416A (ja) オーディオ空間化および環境シミュレーション
EP3745744A2 (en) Audio processing
KR102380232B1 (ko) 입체 음향 재생 방법 및 장치
KR102443055B1 (ko) 입체 음향 재생 방법 및 장치
KR102217832B1 (ko) 액티브다운 믹스 방식을 이용한 입체 음향 재생 방법 및 장치
KR102290417B1 (ko) 액티브다운 믹스 방식을 이용한 입체 음향 재생 방법 및 장치
JP2015065551A (ja) 音声再生システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180802

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190730

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20191030

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191227

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200114

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200210

R150 Certificate of patent or registration of utility model

Ref document number: 6660982

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250