JP6382965B2 - オーディオ信号レンダリング方法及び装置 - Google Patents

オーディオ信号レンダリング方法及び装置 Download PDF

Info

Publication number
JP6382965B2
JP6382965B2 JP2016523302A JP2016523302A JP6382965B2 JP 6382965 B2 JP6382965 B2 JP 6382965B2 JP 2016523302 A JP2016523302 A JP 2016523302A JP 2016523302 A JP2016523302 A JP 2016523302A JP 6382965 B2 JP6382965 B2 JP 6382965B2
Authority
JP
Japan
Prior art keywords
channel
signal
rendering
audio signal
input multi
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016523302A
Other languages
English (en)
Other versions
JP2016537864A (ja
Inventor
ジョン,サン−ベ
キム,ソン−ミン
チョウ,ヒョン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2016537864A publication Critical patent/JP2016537864A/ja
Application granted granted Critical
Publication of JP6382965B2 publication Critical patent/JP6382965B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/307Frequency adjustment, e.g. tone control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/07Synergistic effects of band splitting and sub-band processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Fittings On The Vehicle Exterior For Carrying Loads, And Devices For Holding Or Mounting Articles (AREA)
  • Details Of Audible-Bandwidth Transducers (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

本発明は、立体音響再生方法及びその装置に係り、特に、多チャネルオーディオ信号を再生する方法及びその装置に関する。
映像処理技術及び音響処理技術の発達により、高画質・高音質のコンテンツが量産されている。高画質・高音質のコンテンツを要求したユーザは、臨場感あふれる映像及び音響を望み、それにより、立体映像及び立体音響に係わる研究が活発に進められている。
立体音響は、複数個のスピーカを水平面上の異なる位置に配置し、それぞれのスピーカから、同一であったり異なったりする音響信号を出力することにより、ユーザに空間感を感じさせる技術である。しかし、実際の音響は、水平面上の多様な位置で発生するだけではなく、異なる高度でも発生する。従って、異なる高度で発生する音響信号を、水平面上に配置されたスピーカを介して再生する技術が必要である。
本発明は、立体音響再生方法及びその装置に係り、高度音響信号を含む多チャネルオーディオ信号を、水平面レイアウト環境で再生するための方法に関する。
本発明の一実施形態による、立体音響再生方法は、多チャネルオーディオ信号を獲得する段階と、前記多チャネルオーディオ信号のチャネル情報、及び周波数によって再生されるチャネルにレンダリングする段階と、前記レンダリングされた信号をミキシングする段階と、を含むことを特徴とする。
前記立体音響再生方法は、前記多チャネルオーディオ信号からアプローズ信号を分離する段階をさらに含み、前記レンダリングする段階は、前記アプローズ信号は、2D(two-dimensional)レンダリング方法によってレンダリングされるか、あるいは前記アプローズ信号の各チャネル別に、水平面上に配置された出力チャネルのうち最も近いチャネルにレンダリングされる段階を含むことを特徴とする。
前記ミキシングする段階は、前記レンダリングされたアプローズ信号を、エネルギーブースト方式によってミキシングする段階を含むことを特徴とする。
前記アプローズ信号を分離する段階は、前記多チャネル入力信号にトーナルしない広帯域信号が存在し、前記広帯域信号のレベルがチャネル別に類似しているか否かということ、短い区間のインパルス形態が反復されているか否かということ、及びチャネル間関連性が低いか否かということのうち少なくとも一つに基づいて、前記多チャネル入力信号が、前記アプローズ信号を含むか否かということを判断する段階と、前記判断結果によって、前記アプローズ信号を分離する段階と、を含むことを特徴とする。
前記レンダリングする段階は、前記多チャネルオーディオ信号を、前記チャネル情報に基づいて、水平面チャネル信号及びオーバーヘッドチャネル信号に分離する段階と、前記オーバーヘッドチャネル信号を、低周波信号と高周波信号とに分離する段階と、前記低周波信号は、前記低周波信号の各チャネル別に、水平面上に配置された出力チャネルのうち最も近いチャネルにレンダリングする段階と、前記高周波信号は、3Dレンダリング方法によってレンダリングする段階と、前記水平面チャネル信号は、2Dレンダリング方法によってレンダリングする段階と、を含むことを特徴とする。
前記ミキシングする段階は、前記チャネル情報及び周波数によって、前記レンダリングされた信号に適用するゲインを決定する段階と、前記決定されたゲインを前記レンダリングされた信号に適用してミキシングする段階と、を含むことを特徴とする。
前記ミキシングする段階は、前記レンダリングされた信号のパワー値に基づいて、前記パワー値が保存されるように、前記レンダリングされた信号をミキシングする段階を含むことを特徴とする。
前記ミキシングする段階は、前記レンダリングされた信号のパワー値に基づいて、所定区間単位にミキシングする段階と、前記レンダリングされた信号のうち低周波信号を分離する段階と、前記低周波信号は、以前区間での前記レンダリングされた信号のパワー値に基づいて、前記レンダリングされた信号をミキシングする段階と、を含むことを特徴とする。
前記レンダリングする段階は、前記多チャネルオーディオ信号のチャネル情報、及び周波数によって再生されるチャネルにレンダリングする段階を含むことを特徴とする。
本発明の一実施形態による立体音響再生装置は、多チャネルオーディオ信号を獲得し、前記多チャネルオーディオ信号のチャネル情報、及び周波数によって再生されるチャネルにレンダリングするレンダラ;及び前記レンダリングされた信号をミキシングするミキサ;を含むことを特徴とする。
本発明の一実施形態による立体音響再生装置は、音声信号のうち高度成分を水平面上に配置されたスピーカで高度感あるように再生することができる。
本発明の一実施形態による立体音響再生装置は、多チャネルオーディオ信号をチャネル数が少ない環境で再生するとき、音色(tone)が変わったり、音が消えたりする現象を最小化することができる。
本発明の一実施形態による立体音響再生装置の内部構造を示したブロック図である。 本発明の一実施形態による立体音響再生装置の内部構造を示したブロック図である。 本発明の一実施形態による立体音響再生方法を図示したフローチャートである。 本発明の一実施形態において、アプローズ信号を含むオーディオ信号に対する立体音響再生方法を図示したフローチャートである。 本発明の一実施形態において、3Dレンダラの内部構造を示したブロック図である。 本発明の一実施形態による、レンダリングされたオーディオ信号をミキシングする方法を図示したフローチャートである。 本発明の一実施形態による、レンダリングされたオーディオ信号を周波数によってミキシングする方法を図示したフローチャートである。 本発明の一実施形態による、レンダリングされたオーディオ信号を周波数によってミキシングする一例を図示した例示図である。 本発明の一実施形態による立体音響再生装置の内部構造を示したブロック図である。 本発明の一実施形態による立体音響再生装置の内部構造を示したブロック図である。
以下、本発明の望ましい実施例について、添付した図面を参照して詳細に説明する。ただし、下記の説明、及び添付された図面において、本発明の要旨を不明確にする公知機能または構成に係わる詳細な説明は省略する。また、図面全体にわたって、同一構成要素は、可能な限り、同一図面符号でもって示されているということに留意しなければならない。
以下で説明される本明細書及び特許請求の範囲に使用された用語や単語は、一般的であったり、辞書的であったりする意味に限定して解釈されるものではなく、発明者は、その自身の発明を最善の方法で説明するための用語でもって適切に定義することができるという原則に立脚し、本発明の技術的思想に符合する意味及び概念に解釈されなければならない。従って、本明細書に記載された実施形態と、図面に図示された構成は、本発明の最も望ましい一実施形態に過ぎず、本発明の技術的思想をいずれも代弁するものではないので、本出願時点において、それらを代替する多様な均等物と変形例とがあるということを理解しなければならない。
明細書全体において、ある部分がある構成要素を「含む」とするとき、それは、特別に反対になる記載がない限り、他の構成要素を除くものではなく、他の構成要素をさらに含んでもよいということを意味する。また、明細書に記載された「…部」、「モジュール」というような用語は、少なくとも1つの機能や動作を処理する単位を意味し、それは、ハードウェアまたはソフトウェアによって具現されるか、ハードウェアとソフトウェアとの結合によって具現されるのである。
以下、添付した図面を参照し、本発明の実施形態について、本発明が属する技術分野で当業者が容易に実施することができるように詳細に説明する。しかし、本発明は、さまざまに異なる形態に具現され、ここで説明する実施形態に限定されるものではない。そして、図面において、本発明について明確に説明するために、説明と関係ない部分は省略し、明細書全体を通じて類似した部分については、類似した図面符号を付した。
以下、添付された図面を参照し、本発明の望ましい実施形態について説明する。
図1及び図2は、本発明の一実施形態による立体音響再生装置の内部構造を示したブロック図である。
本発明の一実施形態による立体音響再生装置100は、再生されるチャネルで、ダウンミキシングされた多チャネルオーディオ信号を出力することができる。
立体音響とは、音の高低、音色(tone)だけではなく、方向や距離感まで再生して臨場感を有するものにし、音源が発生させた空間に位置していない聴取者に、方向感、距離感及び空間感を知覚させる空間情報を付加した音響を意味する。
以下の説明において、オーディオ信号のチャネルは、音響が出力されるスピーカの個数を意味する。チャネル数が多いほど、音響が出力されるスピーカの個数が多くなる。本発明の一実施形態による立体音響再生装置100は、チャネル数が多い多チャネルオーディオ信号が、チャネル数が少ない環境で出力されて再生されるように、多チャネルオーディオ信号を、再生されるチャネルにレンダリングしてミキシングすることができる。このとき、多チャネルオーディオ信号は、高度音響を出力することができるチャネルを含んでもよい。
高度音響を出力することができるチャネルは、高度感を感じるように、聴取者の頭上に位置したスピーカを介して、音響信号を出力することができるチャネルを意味する。水平面チャネルは(horizontal channel)、聴取者と水平した面に位置したスピーカを介して、音響信号を出力することができるチャネルを意味する。
前述のチャネル数が少ない環境は、高度音響を出力することができるチャネルを含まず、水平面チャネルによって、水平面上に配置されたスピーカを介して音響を出力する環境を意味する。
また、以下の説明において、水平面チャネルは、水平面上に配置されたスピーカを介して出力されるオーディオ信号を含むチャネルを意味する。オーバーヘッドチャネル(overhead channel)は、水平面ではない高度上に配置されて高度音を出力することができるスピーカを介して出力されるオーディオ信号を含むチャネルを意味する。
図1を参照すれば、本発明の一実施形態による立体音響再生装置100は、レンダラ110及びミキサ120を含んでもよい。
本発明の一実施形態による立体音響再生装置100は、多チャネルオーディオ信号をレンダリングしてミキシングし、再生されるチャネルに出力することができる。例えば、多チャネルオーディオ信号は、22.2チャネル信号であり、再生されるチャネルは、5.1チャネルまたは7.1チャネルでもある。立体音響再生装置100は、多チャネルオーディオ信号の各チャネルを対応させるチャネルを決定することにより、レンダリングを行い、再生されるチャネルと対応した各チャネルの信号を合わせ、最終信号として出力することにより、レンダリングされたオーディオ信号をミキシングすることができる。
レンダラ110は、多チャネルオーディオ信号を、チャネル及び周波数によってレンダリングすることができる。レンダラ110は、多チャネルオーディオ信号に対して、オーバーヘッドチャネルと水平面チャネルとによる信号を、それぞれ3D(three-dimensional)レンダリング及び2D(two-dimensional)レンダリングすることができる。
レンダラ110は、オーバーヘッドチャネルを3Dレンダリングするために、HRTF(head related transfer filter)フィルタを通過したオーバーヘッドチャネルを、周波数によって、それぞれ異なる方法でレンダリングすることができる。HRTFフィルタは、両耳間のレベル差、及び両耳間での、音響時間の到逹時間差のような単純な経路差だけではなく、頭表面での回折、耳たぶによる反射のような複雑な経路上の特性が、音の到来方向によって変化する現象によって、立体音響を認識させる。HRTFフィルタは、オーディオ信号の音質を変化させることにより、立体音響が認識されるように、オーバーヘッドチャネルに含まれたオーディオ信号を処理することができる。
レンダラ110は、オーバーヘッドチャネル信号のうち低周波信号については、アド・ツー・クローゼストチャネル(add to the closest channel)方法によってレンダリングし、高周波信号については、マルチチャネルパンニング(multichannel panning)方法によってレンダリングすることができる。マルチチャネルパンニング方法によれば、多チャネルオーディオ信号の各チャネルの信号が、各チャネル信号にレンダリングされるチャネルごとに互いに異なるように設定されたゲイン値が適用され、少なくとも1つの水平面チャネルにそれぞれレンダリングされる。ゲイン値が適用された各チャネルの信号は、ミキシングを介して合わされることにより、最終信号として出力される。
低周波信号は、回折性が強いので、マルチチャネルパンニング方法によって、多チャネルオーディオ信号の各チャネルを、さまざまなチャネルにそれぞれ分けてレンダリングせず、1つのチャネルにのみレンダリングしても、聴取者の聴取に、同じような音質を有することができる。従って、本発明の一実施形態による立体音響再生装置100は、低周波信号をアド・ツー・クローゼストチャネル方法によってレンダリングすることにより、1つの出力チャネルにさまざまなチャネルがミキシングされるとこによって発生する音質劣化を防止することができる。すなわち、1つの出力チャネルにさまざまなチャネルがミキシングされれば、各チャネル信号間の干渉によって、音質が増幅されたり低減されたりして劣化されるので、1つの出力チャネルに1つのチャネルをミキシングすることにより、音質劣化を防止することができる。
アド・ツー・クローゼストチャネル方法によれば、多チャネルオーディオ信号の各チャネルは、さまざまなチャネルに分けてレンダリングする代わりに、再生されるチャネルのうち最も近いチャネルにレンダリングされる。
また、立体音響再生装置100は、周波数によって異なる方法でレンダリングを行うことにより、スイートスポット(sweet spot)を音質劣化なしに広げることができる。すなわち、回折特性が強い低周波信号に対しては、アド・ツー・クローゼストチャネル方法によってレンダリングすることにより、1つの出力チャネルにさまざまなチャネルがミキシングされることによって発生する音質劣化を防止することができる。スイートスポットとは、聴取者が、歪曲されていない立体音響を最適に聴取することができる所定範囲を意味する。スイートスポットが広いほど、聴取者は、広い範囲で、歪曲されていない立体音響を最適に聴取することができ、聴取者がスイートスポットに位置しない場合、音質または音などが歪曲された音響を聴取することになる。
周波数によってことなるパンニング(panning)方法でレンダリングする方法については、以下の図4または図5でさらに詳細に説明する。
ミキサ120は、レンダラ110によって水平チャネルと対応した各チャネルの信号を合わせ、最終信号として出力することができる。ミキサ120は、所定区間別に、各チャネルの信号をミキシングすることができる。例えば、ミキサ120は、1フレーム別に、各チャネルの信号をミキシングすることができる。
本発明の一実施形態によるミキサ120は、再生される各チャネルにレンダリングされた信号のパワー値に基づいてミキシングすることができる。言い換えれば、ミキサ120は、再生される各チャネルにレンダリングされた信号のパワー値に基づいて、最終信号の振幅、または最終信号に適用されるゲイン(gain)を決定することができる。
図2を参照すれば、本発明の一実施形態による立体音響再生装置200は、音響分析部210、レンダラ220、ミキサ230及び出力部240を含んでもよい。図2の立体音響再生装置200、レンダラ220及びミキサ230は、図1の立体音響再生装置100、レンダラ110及びミキサ120と対応し、重複説明は省略する。
音響分析部210は、多チャネルオーディオ信号を分析してレンダリングモードを選択し、多チャネルオーディオ信号に含まれた一部信号を分離して出力することができる。音響分析部210は、レンダリングモード選択部211とレンダリング信号分離部212とを含んでもよい。
レンダリングモード選択部211は、多チャネルオーディオ信号に、拍手音や雨の音のように、トランジェント(transient)な信号が多い否かということを所定区間別に判断することができる。以下の説明において、拍手(applause)音や雨の音のように、トランジェント、すなわち、瞬間的であって一時的な信号が多いオーディオ信号をアプローズ(applause)信号と称する。
本発明の一実施形態による立体音響再生装置200は、アプローズ信号を分離し、アプローズ信号の特徴によって、チャネルレンダリング及びミキシングを処理することができる。
レンダリングモード選択部211は、アプローズ信号が、多チャネルオーディオ信号に含まれているか否かということによって、レンダリングモードを、一般(general)モードまたはアプローズモードのうち一つに選択することができる。レンダラ220は、レンダリングモード選択部211によって選択されたモードによってレンダリングすることができる。すなわち、レンダラ220は、選択されたモードによって、アプローズ信号に対するレンダリングを行うことができる。
レンダリングモード選択部211は、アプローズ信号が、多チャネルオーディオ信号に含まれていない場合、一般モードを選択することができる。一般モードによれば、オーバーヘッドチャネル信号は、3Dレンダラ221によってレンダリングされ、水平チャネル信号は、2Dレンダラ222によってレンダリングされる。すなわち、アプローズ信号に対する考慮なしにレンダリングが行われる。
レンダリングモード選択部211は、アプローズ信号が、多チャネルオーディオ信号に含まれている場合、アプローズモードを選択することができる。アプローズモードによれば、アプローズ信号が分離され、分離されたアプローズ信号に対してレンダリングが行われる。
レンダリングモード選択部211は、多チャネルオーディオ信号に含まれているか、あるいは他の装置から別途に受信されたアプローズビット情報を利用して、アプローズ信号が、多チャネルオーディオ信号に含まれているか否かということを、所定区間別に判断することができる。アプローズビット情報は、MPEG(Moving Picture Experts Group)系のコーデックスによれば、bsTsEnableフラグ情報またはbsTempShapeEnableChannelフラグ情報を含み、前述のフラグ情報によって、レンダリングモードが、レンダリングモード選択部211によって選択される。
また、レンダリングモード選択部211は、判断する所定区間の多チャネルオーディオ信号の特性に基づいて、レンダリングモードを選択することができる。すなわち、レンダリングモード選択部211は、所定区間の多チャネルオーディオ信号の特性がアプローズ信号を含むオーディオ信号の特性を有するか否かということによって、レンダリングモードを選択することができる。
レンダリングモード選択部211は、所定区間の多チャネルオーディオ信号において、多数の入力チャネルに、トーナル(tonal)ではない広帯域(wideband)信号が存在し、該信号のレベルがチャネル別に類似しているか否かということ、短い区間のインパルス(impulse)形態が反復されているか否かということ、及びチャネル間の関連性(correlation)が低いか否かということのうち少なくとも1つの条件に基づいて、アプローズ信号が、多チャネルオーディオ信号に含まれているか否かということを判断することができる。
レンダリングモード選択部211は、アプローズ信号が、現在区間において、多チャネルオーディオ信号に含まれていると判断した場合、レンダリングモードをアプローズモードに選択することができる。
レンダリング信号分離部212は、レンダリング信号選択部211によってアプローズモードが選択された場合、多チャネルオーディオ信号に含まれたアプローズ信号を一般音響信号と分離することができる。
MPEG USAC系でのbsTsdEnableフラグが使用される場合、当該チャネルの高度(elevation)に係わりなく、フラグ情報によって、水平チャネル信号のように2Dレンダリングされる。また、オーバーヘッド信号も、フラグ情報によって、水平チャネル信号と仮定されてミキシングされる。すなわち、レンダリング信号分離部212は、フラグ情報によって、所定区間の多チャネルオーディオ信号に含まれたアプローズ信号を分離することができ、分離されたアプローズ信号は、水平チャネル信号のように2Dレンダリングされる。
フラグが使用されない場合、レンダリング信号分離部212は、チャネル間の信号を分析し、アプローズ信号成分を分離することができる。オーバーヘッド信号中にで分離されたアプローズ信号は、2Dレンダリングされ、アプローズ信号ではない残りの信号は、3Dレンダリングされる。
レンダラ220は、オーバーヘッド信号を、3Dレンダリング方法によってレンダリングする3Dレンダラ221と、水平面チャネル信号またはアプローズ信号を2Dレンダリング方法によってレンダリングする2Dレンダラ222と、を含んでもよい。
3Dレンダラ221は、オーバーヘッド信号を、周波数によってそれぞれ異なる方法でレンダリングすることができる。3Dレンダラ221は、低周波信号は、アド・ツー・クローゼストチャネル方法でレンダリングし、高周波信号は、3Dレンダリング方法によってレンダリングすることができる。以下において、3Dレンダリング方法は、オーバーヘッド信号をレンダリングする方法を意味し、3Dレンダリング方法は、マルチチャネルパンニング方法を含んでもよい。
2Dレンダラ222は、水平面チャネル信号またはアプローズ信号を、2Dレンダリング方法、アド・ツー・クローゼストチャネル方法及びエネルギーブースト(energy boost)方法のうち少なくとも1つの方法によってレンダリングすることができる。以下において、2Dレンダリング方法は、水平面チャネル信号をレンダリングする方法を意味し、2Dレンダリング方法は、ダウンミックス数式(downmix equation)またはVBAP(vector base amplitude panning)方法を含んでもよい。
3Dレンダラ221と2Dレンダラ222は、それぞれマトリックス化されて簡略化される。3Dレンダラ221は、入力チャネル、出力チャネル、周波数の関数で決定される3Dダウンミックスマトリックスを介して、ダウンミキシングすることができる。2Dレンダラ222は、入力チャネル、出力チャネルの関数で決定される2Dダウンミックスマトリックスを介して、ダウンミキシングされる。すなわち、3Dダウンミックスマトリックスまたは2Dダウンミックスマトリックスは、入力チャネル、出力チャネルまたは周波数によって決定される係数を含み、入力された多チャネルオーディオ信号をダウンミキシングすることができる。
それは、レンダリング時に、音響信号の位相(phase)部分よりは、周波数別に振幅部分が重要であるので、3Dレンダラ221と2Dレンダラ222は、それぞれ周波数値によって決定される係数を含むダウンミックスマトリックスを利用してレンダリングすることにより、レンダリングの演算量を簡略化することができる。ダウンミックスマトリックスを介してレンダリングされた信号は、ミキサ230のパワー保存モジュールによってミキシングされ、最終信号として出力される。
ミキサ230は、レンダリングされた信号を各チャネル別に演算し、最終信号を出力することができる。本発明の一実施形態によるミキサ230は、各チャネルに含まれた信号のパワー値に基づいて、レンダリングされた信号をミキシングすることができる。従って、本発明の一実施形態による立体音響再生装置200は、レンダリングされた信号のパワー値に基づいてミキシングすることにより、周波数の補強または相殺によって発生する音色歪曲を低減させることができる。
出力部240は、ミキサ230によってミキシングされた信号を、スピーカを介して最終出力させることができる。そのとき、出力部240は、ミキシングされた信号のチャネルによってそれぞれ異なるスピーカを介して、音響信号を出力させることができる。
図3は、本発明の一実施形態による立体音響再生方法を図示したフローチャートである。
図3を参照すれば、段階S301において、立体音響再生装置100は、チャネル情報及び周波数によって、多チャネルオーディオ信号をレンダリングすることができる。立体音響再生装置100は、チャネル情報によって、3Dレンダリングまたは2Dレンダリングを行うが、低周波信号については、低周波信号の特性を考慮してレンダリングすることができる。
段階S303において、立体音響再生装置100は、段階S301でレンダリングされた信号をミキシングし、最終信号を生成することができる。立体音響再生装置100は、多チャネルオーディオ信号の各チャネルの信号を出力するチャネルを決定することによってレンダリングし、レンダリングされた信号を合わせたり演算したりすることによってミキシングし、最終信号を生成することができる。
図4は、本発明の一実施形態において、アプローズ信号を含むオーディオ信号に対する立体音響再生方法を図示したフローチャートである。
図4を参照すれば、段階S401において、立体音響再生装置200は、多チャネルオーディオ信号にアプローズ信号が含まれているか否かということを判断するために、多チャネルオーディオ信号を所定区間別に分析することができる。
段階S403において、立体音響再生装置200は、入力された多チャネルオーディオ信号に、アプローズ信号が含まれているか否かということを、所定区間別に判断することができる。例えば、1フレーム別に判断される。立体音響再生装置200は、フラグ情報、または判断する所定区間の多チャネルオーディオ信号を分析することにより、アプローズ信号を含むか否かということを所定区間別に判断することができる。立体音響再生装置200は、アプローズ信号を、オーバーヘッド信号または水平面チャネル信号とは分離して処理することにより、アプローズ信号をミキシングするときに発生する音質歪曲を最小化することができる。
段階S405において、アプローズ信号が含まれていると判断された場合、立体音響再生装置200は、アプローズ信号を分離し、段階S407において、アプローズ信号と水平面チャネルの信号とを2Dレンダリングすることができる。
水平面チャネルの信号は、ダウンミックス数式(downmix equation)またはVBAP方法によって2Dレンダリングされる。
アプローズ信号は、アド・ツー・クローゼストチャネル方法によって、高度音響を含むチャネルを水平面に投影した場合、最も近いチャネルにレンダリングされるか、あるいは2Dレンダリング方法によってレンダリングされた後、エネルギーブースト方式によってミキシングされる。
アプローズ信号は、2Dレンダリング方法または3Dレンダリング方法によってレンダリングしてミキシングする場合、ミキシングされた信号にトランジェント成分の個数が多くなってホワイトニング(whitening)現象が発生したり、チャネル間のクロス関連性が高くなって音が狭くなったりする。従って、ホワイトニング現象や、音が狭くなる現象を防止するために、立体音響再生装置200は、低周波信号を3Dレンダリングするときに使用されるアド・ツー・クローゼストチャネル方法またはエネルギーブースト方式によって、アプローズ信号をレンダリングしてミキシングすることができる。
エネルギーブースト方式は、さまざまなチャネルのオーディオ信号が、1つのチャネルにミキシングされる場合、トランジェント周期が変わって音色がホワイトニングされる現象を防ぐために、水平面チャネル信号のエネルギーを大きくする方法でミキシングする方法を意味する。エネルギーブースト方式は、レンダリングされたアプローズ信号をミキシングする方法に関するものである。
エネルギーブースト方式による、アプローズ信号をミキシングする方法は、下記数式(1)によって遂行される。
ωin,outは、ダウンミキシングゲイン(downmixing gain)を意味するものであり、アプローズ信号は、多チャネルオーディオ信号の各チャネルが再生されるチャネルにレンダリングされ、ミキシングされるとき、各チャネル別にダウンミキシングゲインが適用される。ダウンミキシングゲインは、各チャネルがレンダリングされるチャネルによって、所定値にあらかじめ決定される。xin=out[l,k]は、出力レイアウトに対応するようにレンダリングされたアプローズ信号を示すものであり、いずれか1つのアプローズ信号を意味する。lは、音響信号の所定区間を識別するための値であり、kは、周波数を示す。xin=out[l,k]/|xin=out[l,k]|は、入力されたアプローズ信号の位相値を示し、数式(1)のルート内の値は、同一出力チャネルに対応したアプローズ信号のパワー、すなわち、エネルギー値の和を意味する。
数式(1)を参照すれば、出力レイアウトの1チャネルにレンダリングされた多数のアプローズ信号にダウンミキシングゲインが適用された値のパワー値ほど、再生される各チャネルのゲインが修正される。従って、アプローズ信号は、エネルギー値の和ほど振幅が大きくなり、位相差によって発生するホワイトニング現象が防止される。
段階S409において、立体音響再生装置200は、アプローズ信号が含まれていないと判断された場合、水平チャネルの信号を2Dレンダリングすることができる。
段階S411において、立体音響再生装置200は、オーバーヘッドチャネル信号を、立体音響信号が提供されるように、HRTFフィルタでフィルタリングすることができる。オーバーヘッドチャネル信号が周波数ドメインの信号であるか、あるいはフィルタバンクサンプルである場合、スペクトルの相対的なウェイティング(weighting)だけ提供するためのフィルタであるので、単純な乗算によってHRTFフィルタリングが行われる。
段階S413において、立体音響再生装置200は、オーバーヘッドチャネル信号を高周波と低周波とに分離することができる。例えば、立体音響再生装置200は、1kHzを基準に、それ以下の周波数を有する音響信号を低周波に分離することができる。低周波成分は、回折が強い音響的な特徴によって、アド・ツー・クローゼストチャネル方法によってレンダリングされる。
段階S415において、立体音響再生装置200は、高周波信号に分離された信号は、3Dレンダリング方法によってレンダリングすることができる。3Dレンダリング方法は、マルチチャネルパンニング方法を含んでもよい。マルチチャネルパンニングとは、多チャネルオーディオ信号の各チャネル信号が再生されるチャネルに配分されることを意味する。そのとき、パンニング係数が適用された各チャネル信号が、再生されるチャネルに配分される。高周波信号の場合、高度感が上昇するほど、両耳間のレベル差(ILD:interaural level difference)が低減する特性を提供するために、サラウンドチャネルに信号が配分される。また、フロントチャネルとパンニングされる多数のチャネルの個数によって、音響信号の方向が定位される。
段階S417において、立体音響再生装置100は、低周波信号は、前述のアド・ツー・クローゼストチャネル方法によってレンダリングすることができる。1つのチャネルに、多くの信号、すなわち、多チャネルオーディオ信号のいくつかのチャネル信号が混ざれば、それぞれ異なる位相によって音質が相殺されるか、あるいは増幅されるかということによって音質劣化が発生する。アド・ツー・クローゼストチャネル方法によれば、立体音響再生装置100は、前述の音質劣化の発生を防止するために、各チャネル水平面に投影した場合、最も近いチャネルに、下記表1のようにマッピングすることができる。
表1を参照すれば、オーバーヘッドチャネルにおいて、近いチャネルが複数個存在するTBC及びVOGようなチャネルは、音定位のために、パンニング係数(panning coeffiecient)によって、5.1チャネルに配分される。
表1に図示されたマッピング関係は、例示に過ぎず、それに限られるものではなく、各チャネルは、異なってもマッピングされる。
多チャネルオーディオ信号が、周波数信号またはフィルタバンク信号である場合、低周波に該当するビン(bin)またはバンド(band)は、アド・ツー・クローゼストチャネル方法、高周波に該当するビンまたはバンドは、マルチチャネルパンニング方法によってレンダリングされる。ビンまたはバンドは、周波数ドメインでの所定単位位の信号区間を意味する。
段階S419において、立体音響再生装置100は、各チャネルにレンダリングされた信号を、パワー値に基づいてミキシングすることができる。そのとき、立体音響再生装置100は、周波数ドメインでミキシングすることができる。各チャネルにレンダリングされた信号を、パワー値に基づいてミキシングする方法については、以下の図6及び図7でさらに詳細に説明する。
段階S421において、立体音響再生装置100は、ミキシングされた最終信号を出力することができる。
図5は、本発明の一実施形態において、3Dレンダラの内部構造を示したブロック図である。図5の3Dレンダラ500は、図2の3Dレンダラ221と対応し、重複説明は省略する。
図5を参照すれば、3Dレンダラ500は、HRTFフィルタ510、LPF(low-pass filter)520、HPF(high-pass filter)530、アド・ツー・クローゼストチャネル540及びマルチチャネルパンニング550を含んでもよい。
HRTFフィルタ510は、多チャネルオーディオ信号のうちオーバーヘッドチャネル信号をHRTFフィルタリングすることができる。
LPF 520は、HRTFフィルタリングされたオーバーヘッドチャネル信号のうち低周波成分を分離して出力することができる。
HPF 530は、HRTFフィルタリングされたオーバーヘッドチャネル信号のうち高周波成分を分離して出力することができる。
アド・ツー・クローゼストチャネル540は、オーバーヘッドチャネル信号のうち低周波成分を各チャネル水平面に投影した場合、最も近いチャネルにレンダリングすることができる。
マルチチャネルパンニング550は、オーバーヘッドチャネル信号のうち高周波成分を、マルチチャネルパンニング方法によってレンダリングすることができる。
図6は、本発明の一実施形態による、レンダリングされたオーディオ信号をミキシングする方法を図示したフローチャートである。図6の段階S601ないし段階S605は、図4の段階S419と対応し、重複説明は省略する。
図6を参照すれば、段階S601において、立体音響再生装置100は、レンダリングされたオーディオ信号を獲得することができる。
段階S603において、立体音響再生装置100は、各チャネル別にレンダリングされた信号のパワー値を獲得し、段階S605において、各チャネル別に獲得されたパワー値に基づいてミキシングすることにより、最終信号を生成することができる。
図7は、本発明の一実施形態による、レンダリングされたオーディオ信号を周波数によってミキシングする方法を図示したフローチャートである。図7の段階S701及び段階S703は、図6の段階S601及び段階S603と対応し、重複説明は省略する。
図7を参照すれば、段階S701において、立体音響再生装置100は、レンダリングされたオーディオ信号を獲得することができる。
段階S703において、立体音響再生装置100は、パワー保存モジュール(power preserving module)によって、各チャネル別にレンダリングされた信号のパワー値を獲得し、段階S705において、獲得されたパワー値に基づいてミキシングすることができる。各チャネル別にレンダリングされた信号のパワー値は、各チャネル別にレンダリングされた信号の二乗の和を求めることによって獲得される。
in,outは、いずれか1つのチャネルにレンダリングされたオーディオ信号であり、xoutは、いずれか1つのチャネルにレンダリングされた信号の総和を示し、lは、多チャネルオーディオ信号の現在区間を示す。kは、周波数を示し、youtは、パワー保存モジュールによってミキシングされた信号を示す。
パワー保存モジュールによれば、前述の各チャネル別にレンダリングされた信号のパワー値に基づいて、最終ミキシングされた信号のパワーが、ミキシング前のパワーに維持されるようにミキシングされる。従って、パワー保存モジュールによれば、ミキシングされた信号が、レンダリングされた信号が加わるとき、補強干渉または相殺干渉によって音響信号が歪曲されることを防止することができる。
数式(2)を参照すれば、立体音響再生装置100は、パワー保存モジュールによって、各チャネル別にレンダリングされた信号の総和に対する位相に、各チャネル別にレンダリングされた信号のパワー値を適用することにより、レンダリングされた信号をミキシングすることができる。
段階S701で獲得された信号が時間ドメインである場合、周波数ドメインに変換された後、数式(2)によってミキシングされる。そのとき、時間ドメインの音響信号は、周波数シェーマまたはフィルタバンクシェーマによって周波数ドメインに変換される。
しかし、立体音響再生装置100が、所定区間別にパワー保存モジュールを適用する場合、所定区間別に、各信号のパワー値を推定するが、低周波の場合、パワー値を推定することができる区間が、波長に比べて十分ではない。従って、各区間ごとに推定されたパワー値が異なり、パワー保存モジュールが適用された区間の境界において、不連続的な部分が生じてしまう。一方、高周波の場合、パワー値を推定することができる区間が波長に比べて十分であるので、区間の境界において、不連続的な部分が発生する可能性が低い。すなわち、以下で説明するワンポールスムージング(one-pole smoothing)方法は、パワー値を推定することができる区間が、波長に比べて十分であるか否かということによって適用される。
本発明の一実施形態による立体音響再生装置100は、段階S707において、段階S705でミキシングされた信号に、低周波信号に該当する部分が存在するか否かということを判断することができる。ミキシングされた信号に、低周波信号に該当する部分が存在する場合、立体音響再生装置100は、段階S709ないし段階S711において、下記数式(3)のワンポールスムージング方法を利用して、パワー保存モジュールが適用された区間の境界で発生した不連続的な部分を除去することができる。
outは、以前区間のPoutと、現在区間のミキシングされた信号総和のパワー値とに基づいて獲得される。
inは、以前区間のPinと、現在区間のレンダリングされた各信号のパワー値の総和とに基づいて獲得される。
以前区間のPoutまたはPinに適用されるγによって、以前区間のパワー値が数式に適用されるが、γは、低周波の波長が長いほど、または周波数値が小さいほど、小さい値を有するように決定される。
本発明の一実施形態による立体音響再生装置100は、不連続的な部分を除去するために、以前区間でレンダリングされた信号、またはレンダリングされた信号を加えた信号のパワー値に基づいて、ミキシングされた信号のゲインを調節することができる。
さらに、数式(3)と同様に、出力信号のゲインを、以前区間の出力信号のゲイン値に基づいて獲得することにより、不連続的な部分を除去するために、数式(4)のように処理される。
本発明の一実施形態による立体音響再生装置100は、不連続的な部分を除去するために、以前区間でレンダリングされた信号、またはレンダリングされた信号を加えた信号に適用されたゲイン値に基づいて、ミキシングされた信号のゲインを調節することができる。
図8は、本発明の一実施形態による、レンダリングされたオーディオ信号を周波数によってミキシングする一例を図示した例示図である。
図8を参照すれば、レンダリングされたオーディオ信号801,802を加えたミキシング過程中の信号803を参照すれば、レンダリングされたオーディオ信号801,802は、位相差によって、加えた値の振幅が増幅されることによって音が大きく聞こえるようになる。
従って、本発明の一実施形態による立体音響再生装置100は、パワー保存モジュールを適用することにより、ミキシング過程中の信号803のゲインを、レンダリングされたオーディオ信号801,802のパワー値に基づいて決定することができる。
パワー保存モジュールによってミキシングされた信号804は、レンダリングされたオーディオ信号801,802と類似した大きさの振幅を有するように調節されたが、所定区間別にパワー保存モジュールが適用されることにより、区間ごとに不連続的な部分を含む。
従って、本発明の一実施形態による立体音響再生装置100は、ワンポールスムージング技法によって、以前区間のパワー値を参照し、ミキシングされた信号に対してスムージング処理を行うことにより、最終信号805を求めることができる。
図9及び図10は、本発明の一実施形態による立体音響再生装置の内部構造を示したブロック図である。
図9を参照すれば、立体音響再生装置900は、3Dレンダラ910、2Dレンダラ920、ウェイティング適用部930、ミキサ940を含んでもよい。図9の3Dレンダラ910、2Dレンダラ920及びミキサ940は、図2の3Dレンダラ221、2Dレンダラ222及びミキサ230と対応し、重複説明は省略する。
3Dレンダラ910は、多チャネルオーディオ信号のうちオーバーヘッドチャネル信号に対してレンダリングすることができる。
2Dレンダラ920は、多チャネルオーディオ信号のうち水平面チャネル信号に対してレンダリングすることができる。
ウェイティング適用部930は、3Dレンダラ910によってレンダリングされるレイアウトにおいて、再生される信号のチャネルレイアウトと一致しない場合、多チャネルオーディオ信号を、再生されるチャネルレイアウトによって出力するための構成要素である。再生されるチャネルのレイアウトとは、再生されるチャネル信号が出力されるスピーカの配置情報を意味する。
2Dレンダラ920がVBAP方法でレンダリングする場合、任意のレイアウトチャネル環境でも、水平面チャネル信号に対するレンダリングが可能である。VBAP方法によれば、立体音響再生装置900は、ベクトル基盤の簡単な計算のみで、任意のスピーカ環境でのパンニングゲインを求め、多チャネルオーディオ信号をレンダリングすることができる。従って、任意の再生チャネルレイアウトが、3Dレンダラ910によってレンダリングされるレイアウトと類似する程度によって、ウェイティングが決定される。例えば、3Dレンダラ910が、多チャネルオーディオ信号を、5.1チャネルの再生環境にレンダリングする場合、レンダリングする任意のレイアウトチャネル環境が、5.1チャネルの再生環境とレイアウトがどれほど異なるかということにより、ウェイティングが決定される。
そして、3Dウェイティング適用部930は、3Dレンダラ910及び2Dレンダラ920によってレンダリングされた信号にそれぞれ決定されたウェイティングを適用し、出力することができる。
図10を参照すれば、立体音響再生装置1000は、3Dレンダラ1010、2Dレンダラ1020及びミキサ1030を含んでもよい。図9の3Dレンダラ1010、2Dレンダラ1020及びミキサ1030は、図2の3Dレンダラ221、2Dレンダラ222及びミキサ230と対応し、重複説明は省略する。
3Dレンダラ1010は、レンダリングすることができるレイアウトのうち、出力されるチャネルのレイアウトと最も類似したレイアウトでレンダリングすることができる。そして、2Dレンダラ1020は、3Dレンダラ1010によってレンダリングされた信号を、各チャネル別に出力される信号のチャネルレイアウトにさらにパンニングさせ(repanning)、レンダリングすることができる。
例えば、3Dレンダラ1010が、多チャネルオーディオ信号を、5.1チャネルの再生環境にレンダリングする場合、2Dレンダラ1020は、VBAP方法によってレンダリングする任意のレイアウトチャネル環境により、3Dレンダリングされた信号をさらにパンニングさせてレンダリングすることができる。
本発明の一実施形態による立体音響再生装置は、音声信号のうち高度成分を水平面上に配置されたスピーカで高度感あるように再生することができる。
本発明の一実施形態による立体音響再生装置は、多チャネルオーディオ信号を、チャネル数が少ない環境で再生するとき、音色が変わったり、音が消えたりする現象を最小化することができる。
本発明の一実施形態による方法は、コンピュータで読み取り可能な記録媒体に、コンピュータ(情報処理機能を有する装置をいずれも含む)で読み取り可能なコードでもって具現することが可能である。コンピュータで読み取り可能な記録媒体は、コンピュータシステムによって読み取り可能なデータが保存される全ての種類の記録装置を含む。コンピュータで読み取り可能な記録装置の例としては、ROM(read only memory)、RAM(random access memory)、CD(compact disc)−ROM、磁気テープ、フロッピー(登録商標)ディスク、光データ保存装置などがある。
たとえ前記説明が多様な実施形態に適用される本発明の新規特徴に焦点を合わせて説明したにしても、本技術分野における当業者であるならば、本発明の範囲を外れずに、前記説明された装置、方法の形態及び詳細事項において、多様な削除、代替及び変更が可能であるということを理解するであろう。従って、本発明の範囲は、前述の説明よりは、特許請求の範囲によって定義される。特許請求の範囲の均等範囲中の全ての変形は、本発明の範囲に包摂されるものである。

Claims (23)

  1. 少なくとも1つの高さ入力チャネル信号を含む入力マルチチャネル信号を受信する段階と、
    出力チャネルレイアウトを確認する段階と、
    高度レンダリングのためのレンダリングタイプを確認する段階と、
    複数個の出力チャネル信号によって高度感ある音像を提供するために、前記少なくとも1つの高さ入力チャネル信号を含む入力マルチチャネル信号を、前記確認されたレンダリングタイプと前記確認された出力チャネルレイアウトによってレンダリングする段階と、を含み、
    前記レンダリングタイプは、2Dレンダリングタイプまたは3Dレンダリングタイプを表すオーディオ信号レンダリング方法。
  2. 前記レンダリングタイプは、ビットストリームに含まれたパラメータから確認されることを特徴とする請求項1に記載のオーディオ信号レンダリング方法。
  3. 前記パラメータは、前記入力マルチチャネル信号の特性から決定されたことを特徴とする請求項2に記載のオーディオ信号レンダリング方法。
  4. 前記入力マルチチャネル信号の特性は、前記入力マルチチャネル信号の帯域幅及び相関度のうち、少なくとも1つを含むことを特徴とする請求項3に記載のオーディオ信号レンダリング方法。
  5. 前記レンダリングする段階は、
    前記入力マルチチャネル信号のパワー値に基づいて、前記パワー値が保存されるように、前記入力マルチチャネル信号をレンダリングすることを特徴とする請求項1に記載のオーディオ信号レンダリング方法。
  6. 請求項1に記載の方法を実行することができるプログラムを記録したコンピュータで読み取り可能な記録媒体。
  7. 少なくとも1つの高さ入力チャネル信号を含む入力マルチチャネル信号を受信する受信部と、
    出力チャネルレイアウト及び高度レンダリングのためのレンダリングタイプを確認し、複数個の出力チャネル信号によって高度感ある音像を提供するために、前記少なくとも1つの高さ入力チャネル信号を含む入力マルチチャネル信号を前記確認されたレンダリングタイプと前記確認された出力チャネルレイアウトによってレンダリングするレンダラと、を含み、
    前記レンダリングタイプは、2Dレンダリングタイプまたは3Dレンダリングタイプを表すオーディオ信号レンダリング装置。
  8. 前記レンダリングタイプは、ビットストリームに含まれたパラメータから確認されることを特徴とする請求項7に記載のオーディオ信号レンダリング装置。
  9. 記パラメータは、前記入力マルチチャネル信号の特性から決定されたことを特徴とする請求項8に記載のオーディオ信号レンダリング装置。
  10. 前記入力マルチチャネル信号の特性は、前記入力マルチチャネル信号の帯域幅及びチャネル間の相関度のうち、少なくとも1つを含むことを特徴とする請求項9に記載のオーディオ信号レンダリング装置。
  11. 前記レンダラは、入力マルチチャネル信号のパワー値に基づいて、前記パワー値が保存されるように、前記入力マルチチャネル信号をレンダリングすることを特徴とする請求項7に記載のオーディオ信号レンダリング装置。
  12. 前記レンダリングタイプは、フレームごとに確認されることを特徴とする請求項1に記載のオーディオ信号レンダリング方法。
  13. 前記出力チャネルレイアウトは、5.0チャネルフォーマットまたは5.1チャネルフォーマットであることを特徴とする請求項1に記載のオーディオ信号レンダリング方法。
  14. 前記レンダリングする段階は、前記確認されたレンダリングタイプによって選択されたダウンミックスマトリックスに基づいて、前記入力マルチチャネル信号をレンダリングすることを特徴とする請求項1に記載のオーディオ信号レンダリング方法。
  15. 前記レンダリングする段階は、前記入力マルチチャネル信号を頭部伝達関数(head related transfer function、HRTF)に基づいて、音色をイコライジングする段階を含むことを特徴とする請求項1に記載のオーディオ信号レンダリング方法。
  16. 前記レンダリングする段階は、前記入力マルチチャネル信号を周波数範囲によって互いに異なるパンニング方法によってパンニングする段階を含むことを特徴とする請求項1に記載のオーディオ信号レンダリング方法。
  17. 前記パンニング方法は、アド・ツー・クローゼストチャネル(addtotheclosestchannel)方法を含むことを特徴とする請求項16に記載のオーディオ信号レンダリング方法。
  18. 前記レンダリングタイプは、フレームごとに確認されることを特徴とする請求項7に記載のオーディオ信号レンダリング装置。
  19. 前記出力チャネルレイアウトは、5.0チャネルフォーマットまたは5.1チャネルフォーマットであることを特徴とする請求項7に記載のオーディオ信号レンダリング装置。
  20. 前記レンダラは、前記確認されたレンダリングタイプによって選択されたダウンミックスマトリックスに基づいて、前記入力マルチチャネル信号をレンダリングすることを特徴とする請求項7に記載のオーディオ信号レンダリング装置。
  21. 前記レンダラは、前記入力マルチチャネル信号を頭部伝達関数(head related transfer function、HRTF)に基づいて、音色をイコライジングすることを特徴とする請求項7に記載のオーディオ信号レンダリング装置。
  22. 前記レンダラは、前記入力マルチチャネル信号を周波数範囲によって互いに異なるパンニング方法によってパンニングすることを特徴とする請求項7に記載のオーディオ信号レンダリング装置。
  23. 前記パンニング方法は、アド・ツー・クローゼストチャネル(add to the closest channel)方法を含むことを特徴とする請求項22に記載のオーディオ信号レンダリング装置。
JP2016523302A 2013-10-25 2014-10-27 オーディオ信号レンダリング方法及び装置 Active JP6382965B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR1020130128038A KR102231755B1 (ko) 2013-10-25 2013-10-25 입체 음향 재생 방법 및 장치
KR10-2013-0128038 2013-10-25
PCT/KR2014/010134 WO2015060696A1 (ko) 2013-10-25 2014-10-27 입체 음향 재생 방법 및 장치

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2018146254A Division JP6660982B2 (ja) 2013-10-25 2018-08-02 オーディオ信号レンダリング方法及び装置

Publications (2)

Publication Number Publication Date
JP2016537864A JP2016537864A (ja) 2016-12-01
JP6382965B2 true JP6382965B2 (ja) 2018-08-29

Family

ID=52993205

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2016523302A Active JP6382965B2 (ja) 2013-10-25 2014-10-27 オーディオ信号レンダリング方法及び装置
JP2018146254A Active JP6660982B2 (ja) 2013-10-25 2018-08-02 オーディオ信号レンダリング方法及び装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2018146254A Active JP6660982B2 (ja) 2013-10-25 2018-08-02 オーディオ信号レンダリング方法及び装置

Country Status (10)

Country Link
US (3) US10091600B2 (ja)
EP (4) EP4221261A1 (ja)
JP (2) JP6382965B2 (ja)
KR (1) KR102231755B1 (ja)
CN (2) CN105684466B (ja)
ES (1) ES2952212T3 (ja)
MX (1) MX355499B (ja)
PL (2) PL3664475T3 (ja)
SI (1) SI3833054T1 (ja)
WO (1) WO2015060696A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6866679B2 (ja) * 2017-02-20 2021-04-28 株式会社Jvcケンウッド 頭外定位処理装置、頭外定位処理方法、及び頭外定位処理プログラム
US10999678B2 (en) 2017-03-24 2021-05-04 Sharp Kabushiki Kaisha Audio signal processing device and audio signal processing system
US11232804B2 (en) 2017-07-03 2022-01-25 Dolby International Ab Low complexity dense transient events detection and coding
KR102561608B1 (ko) 2017-12-12 2023-08-01 소니그룹주식회사 신호 처리 장치 및 방법, 그리고 프로그램

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4306029B2 (ja) 1999-06-28 2009-07-29 ソニー株式会社 音場再生システム
US7558393B2 (en) * 2003-03-18 2009-07-07 Miller Iii Robert E System and method for compatible 2D/3D (full sphere with height) surround sound reproduction
KR20050060789A (ko) 2003-12-17 2005-06-22 삼성전자주식회사 가상 음향 재생 방법 및 그 장치
DE102004057500B3 (de) * 2004-11-29 2006-06-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur Ansteuerung einer Beschallungsanlage und Beschallungsanlage
EP1761110A1 (en) * 2005-09-02 2007-03-07 Ecole Polytechnique Fédérale de Lausanne Method to generate multi-channel audio signals from stereo signals
US7974713B2 (en) 2005-10-12 2011-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Temporal and spatial shaping of multi-channel audio signals
JP5010185B2 (ja) * 2006-06-08 2012-08-29 日本放送協会 3次元音響パンニング装置
US8249283B2 (en) 2006-01-19 2012-08-21 Nippon Hoso Kyokai Three-dimensional acoustic panning device
WO2007091870A1 (en) * 2006-02-09 2007-08-16 Lg Electronics Inc. Method for encoding and decoding object-based audio signal and apparatus thereof
WO2007136166A1 (en) 2006-05-23 2007-11-29 Lg Electronics Inc. Digital broadcasting system and method of processing data
KR101297300B1 (ko) 2007-01-31 2013-08-16 삼성전자주식회사 스피커 어레이를 이용한 프론트 서라운드 재생 시스템 및그 신호 재생 방법
KR100943215B1 (ko) 2007-11-27 2010-02-18 한국전자통신연구원 음장 합성을 이용한 입체 음장 재생 장치 및 그 방법
EP2154911A1 (en) * 2008-08-13 2010-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An apparatus for determining a spatial output multi-channel audio signal
CN102246543B (zh) 2008-12-11 2014-06-18 弗兰霍菲尔运输应用研究公司 产生多信道音频信号的装置
KR101387808B1 (ko) 2009-04-15 2014-04-21 한국전자통신연구원 가변 비트율을 갖는 잔차 신호 부호화를 이용한 고품질 다객체 오디오 부호화 및 복호화 장치
JP2011066868A (ja) * 2009-08-18 2011-03-31 Victor Co Of Japan Ltd オーディオ信号符号化方法、符号化装置、復号化方法及び復号化装置
WO2011095913A1 (en) 2010-02-02 2011-08-11 Koninklijke Philips Electronics N.V. Spatial sound reproduction
EP2375410B1 (en) * 2010-03-29 2017-11-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. A spatial audio processor and a method for providing spatial parameters based on an acoustic input signal
JP5604933B2 (ja) 2010-03-30 2014-10-15 富士通株式会社 ダウンミクス装置およびダウンミクス方法
KR20120004909A (ko) 2010-07-07 2012-01-13 삼성전자주식회사 입체 음향 재생 방법 및 장치
RU2589377C2 (ru) 2010-07-22 2016-07-10 Конинклейке Филипс Электроникс Н.В. Система и способ для воспроизведения звука
AU2011295367B2 (en) * 2010-08-25 2014-07-31 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus for decoding a signal comprising transients using a combining unit and a mixer
EP2700250B1 (en) 2011-04-18 2015-03-04 Dolby Laboratories Licensing Corporation Method and system for upmixing audio to generate 3d audio
KR101783962B1 (ko) 2011-06-09 2017-10-10 삼성전자주식회사 3차원 오디오 신호를 부호화 및 복호화하는 방법 및 장치
US9754595B2 (en) * 2011-06-09 2017-09-05 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding 3-dimensional audio signal
TWI603632B (zh) * 2011-07-01 2017-10-21 杜比實驗室特許公司 用於適應性音頻信號的產生、譯碼與呈現之系統與方法
EP2645749B1 (en) 2012-03-30 2020-02-19 Samsung Electronics Co., Ltd. Audio apparatus and method of converting audio signal thereof
CN102664017B (zh) * 2012-04-25 2013-05-08 武汉大学 一种3d音频质量客观评价方法
WO2013192111A1 (en) * 2012-06-19 2013-12-27 Dolby Laboratories Licensing Corporation Rendering and playback of spatial audio using channel-based audio systems
US9736609B2 (en) * 2013-02-07 2017-08-15 Qualcomm Incorporated Determining renderers for spherical harmonic coefficients
US9549276B2 (en) 2013-03-29 2017-01-17 Samsung Electronics Co., Ltd. Audio apparatus and audio providing method thereof
CN110636415B (zh) * 2014-08-29 2021-07-23 杜比实验室特许公司 用于处理音频的方法、系统和存储介质

Also Published As

Publication number Publication date
US20160269845A1 (en) 2016-09-15
EP3664475A1 (en) 2020-06-10
EP3035711A4 (en) 2017-04-12
JP6660982B2 (ja) 2020-03-11
EP3664475B1 (en) 2021-03-31
US10645513B2 (en) 2020-05-05
EP3833054A1 (en) 2021-06-09
US20200260204A1 (en) 2020-08-13
CN105684466B (zh) 2017-11-28
PL3833054T3 (pl) 2023-08-21
PL3664475T3 (pl) 2021-07-05
CN107734445B (zh) 2019-10-15
JP2018201224A (ja) 2018-12-20
KR102231755B1 (ko) 2021-03-24
MX2016004750A (es) 2016-07-22
US11051119B2 (en) 2021-06-29
CN105684466A (zh) 2016-06-15
WO2015060696A1 (ko) 2015-04-30
EP3833054B1 (en) 2023-06-28
MX355499B (es) 2018-04-20
EP3035711A1 (en) 2016-06-22
SI3833054T1 (sl) 2023-08-31
US10091600B2 (en) 2018-10-02
JP2016537864A (ja) 2016-12-01
EP4221261A1 (en) 2023-08-02
EP3035711B1 (en) 2020-06-03
CN107734445A (zh) 2018-02-23
US20180367933A1 (en) 2018-12-20
ES2952212T3 (es) 2023-10-30
KR20150047943A (ko) 2015-05-06

Similar Documents

Publication Publication Date Title
RU2695508C1 (ru) Устройство предоставления аудио и способ предоставления аудио
KR102160254B1 (ko) 액티브다운 믹스 방식을 이용한 입체 음향 재생 방법 및 장치
US9749767B2 (en) Method and apparatus for reproducing stereophonic sound
KR102302672B1 (ko) 음향 신호의 렌더링 방법, 장치 및 컴퓨터 판독 가능한 기록 매체
JP6660982B2 (ja) オーディオ信号レンダリング方法及び装置
JP2019033506A (ja) 音響信号のレンダリング方法、該装置、及びコンピュータ可読記録媒体
JP2014506416A (ja) オーディオ空間化および環境シミュレーション
KR102380232B1 (ko) 입체 음향 재생 방법 및 장치
KR102443055B1 (ko) 입체 음향 재생 방법 및 장치
KR102217832B1 (ko) 액티브다운 믹스 방식을 이용한 입체 음향 재생 방법 및 장치
KR102290417B1 (ko) 액티브다운 믹스 방식을 이용한 입체 음향 재생 방법 및 장치
JP2015065551A (ja) 音声再生システム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170228

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20170529

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170714

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180116

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180416

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180703

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180802

R150 Certificate of patent or registration of utility model

Ref document number: 6382965

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250