JPWO2014199536A1 - オーディオ再生装置及びその方法 - Google Patents

オーディオ再生装置及びその方法 Download PDF

Info

Publication number
JPWO2014199536A1
JPWO2014199536A1 JP2015522476A JP2015522476A JPWO2014199536A1 JP WO2014199536 A1 JPWO2014199536 A1 JP WO2014199536A1 JP 2015522476 A JP2015522476 A JP 2015522476A JP 2015522476 A JP2015522476 A JP 2015522476A JP WO2014199536 A1 JPWO2014199536 A1 JP WO2014199536A1
Authority
JP
Japan
Prior art keywords
position information
audio
reproduction
axis
coordinate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015522476A
Other languages
English (en)
Other versions
JP6022685B2 (ja
Inventor
宮阪 修二
修二 宮阪
一任 阿部
一任 阿部
トラン アータン
トラン アータン
シム ヨンウィ
シム ヨンウィ
リュー ゾンシャン
リュー ゾンシャン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Socionext Inc
Original Assignee
Socionext Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Socionext Inc filed Critical Socionext Inc
Application granted granted Critical
Publication of JP6022685B2 publication Critical patent/JP6022685B2/ja
Publication of JPWO2014199536A1 publication Critical patent/JPWO2014199536A1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/04Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/403Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers loud-speakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/308Electronic adaptation dependent on speaker or headphone connection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2203/00Details of circuits for transducers, loudspeakers or microphones covered by H04R3/00 but not provided for in any of its subgroups
    • H04R2203/12Beamforming aspects for stereophonic sound reproduction with loudspeaker arrays
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/12Circuits for transducers, loudspeakers or microphones for distributing signals to two or more loudspeakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/11Positioning of individual sound objects, e.g. moving airplane, within a sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/13Application of wave-field synthesis in stereophonic audio systems

Abstract

オーディオ信号とその音像を定位させる3次元空間における位置を示す再生位置情報とを含むオーディオオブジェクトを再生するオーディオ再生装置(110)であって、少なくとも1体のスピーカアレー(106)と、再生位置情報を、スピーカアレー(106)の位置を基準とした2次元座標軸上の位置情報である修正再生位置情報に変換する変換部(102)と、修正再生位置情報に応じてオーディオオブジェクトに含まれるオーディオ信号の音像を定位させる処理をする信号処理部(105)とを備える。

Description

本開示は、オーディオオブジェクトを、スピーカアレーを用いて再生する装置及びその方法に関する。特に、定位させる音像の3次元空間における位置を示す再生位置情報を含むオーディオオブジェクトを再生する装置及びその方法に関する。
近年、デジタルテレビ放送受信機やDVDプレーヤで5.1chのオーディオコンテンツを再生するものが多く開発、商品化されている。5.1chとは、前方左右チャネルと前方センターチャネル、およびサラウンドチャネルを左右に配置したチャネル設定である。さらに近年のブルーレイ(Blu−ray(登録商標))プレーヤでは、バックサラウンドに左右のチャネルを追加した7.1ch構成のものもある。
一方、画像の更なる大画面化、高精細化に伴い、オーディオの立体音響化の研究も盛んに行われている。たとえば、22.2chのスピーカ配置を前提とした立体音響の研究が行われている。図14は、現在、NHK(日本放送協会)で研究開発が行われている22.2chのオーディオ再生におけるスピーカ配置を示している。従来の2次元平面上(図14では中段にあたる)にだけスピーカを配置したものと異なり、足元(下段)や天井(上段)にもスピーカを配置した3次元の構成となっている(非特許文献1)。
また、映画館を3次元音響で特徴付ける取り組みも盛んに行われている(非特許文献2)。この場合も、スピーカを天井にも配置する3D(3次元)の構成となっている。また、コンテンツはオーディオオブジェクトとして符号化されている。オーディオオブジェクトとは、定位させる音像の3次元空間における位置を示す再生位置情報を伴ったオーディオ信号である。たとえば、音源(音像)がどの位置に定位しているかを(x、y、z)の3軸で表した再生位置情報と、当該音源のオーディオ信号とを組みとして符号化した信号である。
たとえば、弾丸や飛行機や飛んでいる鳥の鳴き声などをオーディオオブジェクト化する場合、時間とともに、再生位置情報が示す位置を時々刻々と遷移させる。この場合、再生位置情報は、遷移する方向を表すベクトル情報であってもよい。もちろん、ある特定の位置で発生した爆発音などの場合、再生位置情報は一定となる。
このように、3次元にスピーカを配置することを前提として、再生位置情報を伴ったオーディオ信号を再生する研究開発がおこなわれているが、実際のホームユースやパーソナルユースでは、3次元にスピーカを配置することができない場合が多い。
一方、スピーカを自由に配置できない環境化で、できるだけ臨場感の高いオーディオ再生を可能とする技術として、HRTF(頭部伝達関数;Head Related Transfer Function)、波面合成、ビームフォームなどの研究開発が行われている。
HRTFは、人の頭部周辺の音の伝播特性を模擬する伝達関数である。音がどちらの方向から聴こえているかという知覚は、HRTFに影響されるといわれており、図15に示したように、主に、両耳間の音圧差、両耳間に到達する音波の時間差によって影響される。逆にいえば、それを信号処理で人工的に制御することで、音が聞こえてくる方向を制御できる。詳しくは、非特許文献3で説明されている。また、前後及び上下方向の定位に関わる手がかりは、HRTFの振幅スペクトルに含まれているといわれている。詳しくは特許文献1で説明されている。
波面合成の基本的な動作原理は図16の(a)に示される通りである。本来、音波は音源を中心とした同心円上に拡散するので(音源の位置にスピーカを配置しない限り)自然な音波を空間に生成することはできないが、複数のスピーカを列状に配置(つまり、スピーカアレーを形成)し、適切に音圧及び位相を制御することで、さも音源から音波が拡散しているかのような同心円状の波形の一部を空間上に生成できる。詳しくは、非特許文献4に説明されている。
ビームフォームの基本的な動作原理は図16の(b)に示される通りである。波面合成と同様に、ビームフォームでも、スピーカアレーを用い、適切に音圧及び位相を制御することで、特定の位置の音圧レベルをその周囲より高くすることができる。それによって、さもその位置に音源が存在するかのような状態を再現できる。詳しくは、非特許文献5に説明されている。
国際公開第2006/030692号
First published in SMPTE Technical Conference Publication in October 2007 Dolby Atmos Cinema Technical Guidelines Audio Eng Soc,Vol 49,No 4,2001 April Introduction to Head−Related Transfer Functions (HRTFs): Representations of HRTFs in Time,Frequency,and Space Audio Signal Processing for Next−Generation Multimedia Communication Systems,pp.323−342,Y.A.Huang,J.Benesty,Kluwer,Jan. 2004 AES 127th Convention,New York NY,USA,2009 October 9-12 Physical and Perceptual Properties of Focused Sources in Wave Field Synthesis
しかしながら、上記に示した22.2chのような、天井にもスピーカを配置するような構成を、実際のホームユースやパーソナルユースで実現することは難しいという課題がある。
スピーカを自由に配置できない場合でも音の臨場感を高める方法として、HRTF、波面合成、ビームフォームがあるが、HRTFは、音の聴こえてくる方向を制御する方法として優れているが、知覚上そのように聴こえるように制御しているに過ぎず、実際の物理的な波面を再現しているわけではないので、受聴者と音源との距離感を再現することができない。逆に波面合成及びビームフォームは、実際の物理的な波面を再現できるので受聴者と音源との距離感を再現することができるが、受聴者の後方に音源を生成することはできない。これは、スピーカアレーから出力された音波が音像を結ぶ前に音波が受聴者に聴覚に達してしまうからである。
また、上記従来のいずれの技術も、スピーカが配置されている2次元平面上で音を制御する技術であるので、オーディオオブジェクトに含まれる再生位置情報が3次元の空間情報として表現されている場合、再生位置情報を反映した信号処理ができない。
本開示は、このような従来の課題に鑑みてなされたものであって、スピーカを自由に配置できない空間であっても、3次元の再生位置情報を含むオーディオオブジェクトを高い臨場感で再生できるオーディオ再生装置及びその方法を提供することを目的とする。
上記の課題を解決するために、一実施形態に係るオーディオ再生装置は、オーディオ信号と前記オーディオ信号の音像を定位させる3次元空間における位置を示す再生位置情報とを含むオーディオオブジェクトを再生するオーディオ再生装置であって、音響信号を音響振動に変換する少なくとも1体のスピーカアレーと、前記再生位置情報を、前記スピーカアレーの位置を基準とした2次元座標軸上の位置情報である修正再生位置情報に変換する変換部と、前記修正再生位置情報に応じて前記オーディオオブジェクトに含まれる前記オーディオ信号の音像を定位させる処理をする信号処理部とを備える。
これによれば、オーディオオブジェクトに含まれる3次元の再生位置情報がスピーカアレーの位置を基準とした2次元座標軸上の修正再生位置情報に変換され、修正後の修正再生位置情報に応じて音像が定位されるので、スピーカ配置に制約がある場合でも、オーディオオブジェクトを高い臨場感で再生できる。
ここで、前記スピーカアレーを構成するスピーカ素子の並び方向をX軸、前記X軸と直交し、かつ、前記スピーカアレーが設置されている面である設置面と水平な方向をY軸、及び、前記X軸と直交し、かつ、前記設置面と垂直な方向をZ軸としたとき、前記修正再生位置情報は、前記X軸と前記Y軸とで構成された座標軸上の位置を指し、前記再生位置情報で特定される位置が(x、y、z)であるとき、前記修正再生位置情報は前記x、yに応じた値であってもよい。
これによれば、再生位置情報で特定される位置が(x、y、z)であるときに修正再生位置情報が前記x、yに応じた値となるので、3次元にスピーカを配置できない空間であっても3次元の再生位置情報を含むオーディオオブジェクトを高い臨場感で再生できる。
また、前記2次元座標におけるY座標では、前記スピーカアレーの背面方向がマイナス座標、前記スピーカアレーの前面方向がプラス座標であり、前記2次元座標におけるX座標では、前記スピーカアレーの中央から左右にそれぞれマイナス座標、プラス座標であるとき、前記修正再生位置情報の値は、前記x、yの少なくとも一方に所定の値を乗じた値であってもよい。
これによれば、修正再生位置情報の値は前記x、yに所定の値を乗じた値となるので、感じられる空間の広さを仮想的に変えることができる。
また、前記修正再生位置情報のx座標値は、前記スピーカアレーの幅に制限されてもよい。
これによれば、修正再生位置情報のx座標値は前記スピーカアレーの幅に制限される値となるので、スピーカアレーの性能に適した信号処理ができる。
また、前記信号処理部は、前記2次元座標軸上の位置に音像を構成するビームフォーム部であってもよい。
これによれば、ビームフォーム部によって、目的の位置に強い音響振動が生成されるので、さもそこに音源が存在するかのような音場を生成することができる。
また、前記2次元座標におけるY座標では、前記スピーカアレーの背面方向がマイナス座標、前記スピーカアレーの前面方向がプラス座標であり、前記信号処理部は、前記修正再生位置情報のy座標値が負の値である場合、Huygensの定理を利用した信号処理で波面合成してもよい。
これによれば、修正再生位置情報のy座標値が負の値である場合、Huygensの定理を利用した信号処理で波面合成されるので、定位させる音像の目的位置がスピーカの背面であった場合でも、さもそこに音源が存在するかのような音場を生成することができる。
また、前記修正再生位置情報は、前記スピーカアレーから出力される音響を受聴する受聴者の位置から見た前記再生位置情報が示す位置への方向角と、前記受聴者の位置から前記再生位置情報が示す位置までの距離とによって前記2次元座標軸上の位置を示してもよい。
これによれば、修正再生位置情報は、受聴者の位置から見た再生位置情報が示す位置への方向角と、受聴者の位置から再生位置情報が示す位置までの距離とによって2次元座標軸上の位置を示すので、受聴者から聴いてどの方向どの距離に音源が存在するかを制御することができる。
また、前記信号処理部は、HRTF(Head Related Transfer Function)を用いて前記音像を定位させる処理をし、前記HRTFは、前記修正再生位置情報が示す位置の方向から音が聞こえるように設定されてもよい。
これによれば、修正再生位置情報が示す位置の方向から音が聞こえるように設定されHRTFを用いて音像を定位させる処理を行われるので、受聴者から聴いたときの音源への方向を反映した再生ができる。
また、前記信号処理部は、前記受聴者の位置と前記修正再生位置情報が示す位置との距離に応じて音量を調整してもよい。
これによれば、受聴者の位置と修正再生位置情報が示す位置との距離に応じて音量が調整されるので、受聴者から聴いたときの音源への距離を反映した再生ができる。
また、前記信号処理部は、前記修正再生位置情報が示す位置に応じて信号処理方式を変更してもよい。
これによれば、修正再生位置情報が示す位置に応じて信号処理方式が変更されるので、目標の再生位置に応じた最適な信号処理方式を選択することができる。
また、前記スピーカアレーを構成するスピーカ素子の並び方向をX軸、前記X軸と直交し、かつ、前記スピーカアレーが設置されている面である設置面と水平な方向をY軸、及び、前記X軸と直交し、かつ、前記設置面と垂直な方向をZ軸とし、前記Y軸における位置を示すY座標では、前記スピーカアレーの背面方向がマイナス座標、前記スピーカアレーの前面方向がプラス座標であり、前記信号処理部は、前記修正再生位置情報のy座標値が負の値である場合、Huygensの定理を利用した信号処理で波面合成し、前記修正再生位置情報のy座標値が受聴者の位置より前の正の値である場合、ビームフォームを利用した信号処理で音像を生成し、前記修正再生位置情報のy座標値が受聴者の位置より後ろの正の値である場合、HRTFを利用した信号処理で音像を定位させてもよい。
これによれば、修正再生位置情報のy座標値が負の値である場合、Huygensの定理を利用した信号処理で波面合成が行われ、修正再生位置情報のy座標値が受聴者の位置より前の正の値である場合、ビームフォームを利用した信号処理で音像が生成され、修正再生位置情報のy座標値が受聴者の位置より後ろの正の値である場合、HRTFを利用した信号処理で音像が定位されるので、受聴者の位置より前方については目標の位置にあたかも音源があるかのような音響振動が生成され、受聴者の位置より後方についても知覚的にあたかもその方向から音が聞こえてくるような再生ができる。
また、前記オーディオ再生装置は、少なくとも2体のスピーカアレーを備え、前記少なくとも2体のスピーカアレーが少なくとも2つの2次元座標を構成し、前記少なくとも2体のスピーカアレーのうちの一つのスピーカアレーを構成するスピーカ素子の並び方向をX軸、前記X軸と直交し、かつ、前記一つのスピーカアレーが設置されている面である設置面と水平な方向をY軸、及び、前記X軸と直交し、かつ、前記設置面と垂直な方向をZ軸とし、前記再生位置情報で特定される位置が(x、y、z)であるとき、前記信号処理部は、前記zの値に応じて前記少なくとも2体のスピーカアレーを制御してもよいし、前記2つの2次元座標が平行しているとき、前記信号処理部は、前記zの値が予め定められた値よりも大きい場合は、前記設置面に対して上側の2次元座標を構成しているスピーカアレーの音量を大きくし、前記zの値が予め定められた値よりも小さい場合は、前記設置面に対して下側の2次元座標を構成しているスピーカアレーの音量を大きくしてもよいし、前記2つの2次元座標が直交しているとき、前記信号処理部は、前記zの値が予め定められた値よりも大きい場合は、前記設置面に対して垂直の2次元座標を構成しているスピーカアレーを構成するスピーカ素子のうち、予め定められた位置よりも上方のスピーカ素子の音量を大きくし、前記zの値が予め定められた値よりも小さい場合は、前記設置面に対して垂直の2次元座標を構成しているスピーカアレーを構成するスピーカ素子のうち、予め定められた位置よりも下方のスピーカ素子の音量を大きくしてもよい。
これによれば、オーディオ再生装置には、少なくとも2体のスピーカアレーを備えられ、再生位置情報で特定される位置(x、y、z)のzの値に応じて少なくとも2体のスピーカアレーが制御されるので、再生位置情報の高さ情報も制御でき、3次元の再生位置情報を含むオーディオオブジェクトが高い臨場感で再生される。
また、オーディオ信号と前記オーディオ信号の音像を定位させる3次元空間における位置を示す再生位置情報とを含むオーディオオブジェクトを再生するオーディオ再生装置であって、前記オーディオオブジェクトは、所定の時間間隔ごとの前記オーディオ信号と前記再生位置情報とを含むオーディオフレームから構成され、前記オーディオ再生装置は、前記再生位置情報が欠落している場合には、過去に再生したオーディオフレームに含まれていた再生位置情報を、前記再生位置情報が欠落したオーディオフレームの再生位置情報として用いることで、前記オーディオオブジェクトに含まれるオーディオフレームを再生してもよい。
これによれば、再生位置情報が欠落している場合には、過去に再生したオーディオフレームに含まれていた再生位置情報がオーディオフレームの再生位置情報として用いられるので、再生位置情報が欠落している場合でも、自然な音場再生ができる、或いは、オーディオオブジェクトが動いていないときに当該オーディオオブジェクトを記録あるいは伝送する際の情報量を減らすことができる。
なお、上記課題を達成する他の形態として、上記のようなオーディオ再生装置だけでなく、オーディオ再生方法、オーディオ再生方法を実行するプログラム、そのプログラムが記録されたDVD等のコンピュータ読み取り可能な記録媒体であってもよい。
本実施の形態に係るオーディオ再生装置及びその方法によれば、スピーカを自由に配置できない空間であっても、3次元の再生位置情報を含むオーディオオブジェクトを高い臨場感で再生できる。
図1は、実施の形態におけるオーディオ再生装置の構成を示す図である。 図2は、オーディオオブジェクトの構成を示す図である。 図3は、スピーカアレーの形状の一例を示す図である。 図4Aは、スピーカアレーと2次元座標軸との関係を示す図である。 図4Bは、別の形態のスピーカアレーと2次元座標軸との関係を示す図である。 図5は、3次元の再生位置情報と修正再生位置情報(x,y)との関係を示す図である。 図6は、3次元の再生位置情報と修正再生位置情報(方向,距離)との関係を示す図である。 図7は、修正再生位置情報と信号処理方式との関係を示す図である。 図8は、本実施の形態のオーディオ再生装置の主要な動作を示すフローチャートである。 図9は、本実施の形態のオーディオ再生装置の動作のうち、オーディオフレームに含まれる再生位置情報の取り扱いに関する動作を示すフローチャートである。 図10は、オーディオオブジェクトの位置と信号処理方式との関係を示す図である。 図11は、オーディオオブジェクトが頭上を通過する場合の信号処理方式を示す図である。 図12は、2つのスピーカアレーを用いた、実施の形態のバリエーションを示す図である。 図13は、3つのスピーカアレーを用いた、実施の形態のバリエーションを示す図である。 図14は、従来技術における22.2chのスピーカ配置の一例を示す図である。 図15は、従来技術におけるHRTFの原理を示す図である。 図16は、従来技術における波面合成及びビームフォームの原理を示す図である。
以下、オーディオ再生装置及びその方法の実施の形態について図面を参照しながら説明する。
なお、以下で説明する実施の形態は、いずれも好ましい一具体例を示すものである。以下の実施の形態で示される数値、形状、構成要素、構成要素の配置位置及び接続形態、動作順序などは、一例であり、本開示を限定する主旨ではない。また、以下の実施の形態における構成要素のうち、本開示の最上位概念を示す独立請求項に記載されていない構成要素については、より好ましい形態を構成する任意の構成要素として説明される。
図1は本実施の形態におけるオーディオ再生装置110の構成を示す図である。このオーディオ再生装置110は、オーディオ信号(ここでは、オーディオ符号化信号)とそのオーディオ信号の音像を定位させる3次元空間における位置を示す再生位置情報とを含むオーディオオブジェクトを再生するオーディオ再生装置であって、オーディオオブジェクト分離部100、設定部101、変換部102、選択部103、復号化部104、信号処理部105、及び、スピーカアレー106を備える。
図1において、オーディオオブジェクト分離部100は、再生位置情報とオーディオ符号化信号とからなるオーディオオブジェクトから、再生位置情報とオーディオ符号化信号とを分離する処理部である。
設定部101は、スピーカアレー106が設置されている位置に応じて仮想的に2次元座標軸(つまり、スピーカアレー106の位置を基準とした2次元座標軸)を設定する処理部である。
変換部102は、オーディオオブジェクト分離部100で分離された再生位置情報を、設定部101で設定された2次元座標軸上の位置情報(2次元情報)である修正再生位置情報に変換する処理部である。
選択部103は、変換部102で生成された修正再生位置情報と、設定部101で設定された2次元座標軸と、スピーカアレー106から出力される音響を受聴する受聴者の位置(あるいは、このオーディオ再生装置110が予定している受聴位置)とから、信号処理部105で採用すべき信号処理方式を選択する処理部である。
復号化部104は、オーディオオブジェクト分離部100で分離されたオーディオ符号化信号を復号化し、オーディオ信号(音響信号)を生成する処理部である。
信号処理部105は、変換部102での変換で得られた修正再生位置に応じて、復号化部104での復号化で得られたオーディオ信号の音像を定位させる処理をする処理部であり、ここでは、選択部103で選択された信号処理方式で処理を行う。
スピーカアレー106は、前記信号処理部からの出力信号(音響信号)を音響振動に変換する少なくとも1体のスピーカアレー(列状に並べられた複数のスピーカ素子の集まり)である。
なお、オーディオオブジェクト分離部100、設定部101、変換部102、選択部103、復号化部104、信号処理部105は、典型的には、半導体集積回路等の電子回路によってハードウェア的に実現されるが、CPU、ROM及びRAM等を備えるコンピュータで実行されるプログラムによってソフトウェア的に実現されてもよい。
以上のように構成された本実施の形態におけるオーディオ再生装置110の動作について以下説明する。
まず、オーディオオブジェクト分離部100は、再生位置情報とオーディオ符号化信号とからなるオーディオオブジェクトを再生位置情報とオーディオ符号化信号とに分離する。オーディオオブジェクトは、たとえば、図2に示すような構成をもっている。すなわち、オーディオオブジェクトは、オーディオ符号化信号と当該オーディオ符号化信号の音像を定位させる3次元空間における位置を示す再生位置情報との組である。それらの情報(オーディオ符号化信号及び再生位置情報)が所定の時間間隔のオーディオフレーム単位で符号化されてオーディオオブジェクトを構成している。ここで再生位置情報は、天井にもスピーカを配置することを前提にしている3次元情報(3次元空間における位置を示す情報)である。なお、再生位置情報は、必ずしも全てのオーディオフレーム単位で挿入されている必要はなく、それが欠落しているオーディオフレームでは、オーディオオブジェクト分離部100によって、過去に再生したオーディオフレームに含まれていた再生位置情報が用いられる。このような再生位置情報の再利用は、オーディオ再生装置110が備える記憶部を利用することで実現できる。
さて、オーディオオブジェクト分離部100では、図2に示したようなオーディオオブジェクトから再生位置情報とオーディオ符号化信号とを取り出す。
一方、設定部101は、スピーカアレー106が設置されている位置に応じて仮想的に2次元座標軸を設定する。スピーカアレー106の概観は、例えば図3に示される通りである。すなわち、複数のスピーカ素子を並べたものである。設定部101は、図4Aに示すように、スピーカアレー106が設置されている位置に応じて仮想的に2次元座標軸(スピーカアレーの位置を基準とした2次元座標軸)を設定する。ここでは、設定部101は、スピーカアレー106を構成するスピーカ素子の並び方向をX軸、X軸と直交し、かつ、スピーカアレー106が設置されている面である設置面と水平な方向をY軸とするXY面を2次元座標軸として設定する。なお、Y軸における位置を示すY座標では、スピーカアレー106の背面方向がマイナス座標、スピーカアレー106の前面方向がプラス座標であり、X軸におけるX座標では、スピーカアレー106の中央から左右にそれぞれマイナス座標、プラス座標に設定される。なお、スピーカアレーは直線状に配置されている必要はなく、例えば図4Bに示すように、アーチ状配置されていてもよい。図4Bでは個々のスピーカユニット(スピーカ素子)はいずれも正面を向いているように描かれているが、必ずしもその必要はなく、個々のスピーカユニット(スピーカ素子)が放射状に向くように角度が調整されて配置されていてもよい。
次に、変換部102は、上記3次元の再生位置情報を2次元情報である修正再生位置情報に変換する。本実施の形態では、図4A及び図4Bに示したようなX軸及びY軸からなる2次元座標が設定されているので、もともと、再生位置情報は、当該X軸及びY軸からなる2次元座標(つまり、設置面)に直交するZ軸を有する3次元座標での位置にマッピングされている。いま、マッピング後の当該再生位置情報が示す位置を(x1,y1,z1)とする。変換部102は、この位置情報を2次元の位置情報に変換し修正再生位置情報を生成する。
3次元の再生位置情報から2次元の修正再生位置情報への変換は、例えば図5に示したような方法でおこなわれる。ここでは、オーディオオブジェクト1のように、オーディオオブジェクト1の再生位置情報が示す位置を(x1,y1,z1)とすると、それに対応する修正再生位置情報が示す位置は、(x1,y1)となる。なお、修正再生位置情報が示す位置は、オーディオオブジェクト2のように、再生位置情報が示す位置(x2,y2,z2)に対応するものの、必ずしもX座標値及びY座標値と同じ位置(x2,y2)でなくてもよい。例えば、図5に示している修正再生位置情報2が示す位置(x2,y2*α)のように、1以上の値α(所定値)をX座標値及びY座標値の少なくとも一方に乗じることで、実際に再生位置情報で指示されている値より大きな値にしてより広い音響空間を演出してもよい。この例では、Y軸方向の値が誇張されるので、奥行き方向の空間が拡大したかのような音響効果が期待できる。逆にX軸座標は、スピーカアレー106の幅の制約に応じて1より小さい値β(所定値)を乗じてもよい(図5には図示していない。)。つまり、X座標値は、スピーカアレー106の幅に制限されてもよい(スピーカアレー106の幅の範囲内の値であってもよい)。
3次元の再生位置情報を2次元の修正再生位置情報に変換する他の方法として、図6に示した方法でもよい。すなわち、修正再生位置情報として、受聴者からみたオーディオオブジェクト(再生位置情報が示す位置)の方向と距離の情報に変換するようにしてもよい。つまり、修正再生位置情報は、スピーカアレー106から出力される音響を受聴する受聴者の位置から見た再生位置情報が示す位置への方向角と、受聴者の位置から再生位置情報が示す位置までの距離と示す極座標であってもよい。オーディオオブジェクト1の例では、オーディオオブジェクト1の再生位置情報が(x1、y1、z1)であるとき、受聴者の位置から見た位置(x1、y1、z1)への方向角θ1と、受聴者の位置から位置(x1、y1、z1)までの距離r1とすると、それに対応する修正再生位置情報1が(θ1、r1’)で表わされている。ここで、r1’はr1に依存して定まる値である。また、オーディオオブジェクト2の例では、オーディオオブジェクト2の再生位置情報が(x2、y2、z2)であるとき、受聴者の位置から見た位置(x2、y2、z2)への方向角θ2と、受聴者の位置から位置(x2、y2、z2)までの距離r2とすると、それに対応する修正再生位置情報2が(θ2、r2’)で表わされている。ここで、r2’はr2に依存して定まる値である。これ(修正再生位置情報の極座標による表現)は、音像定位の方法としてHRTFを用いる場合、HRTFのフィルタ係数は、受聴者からの方位の情報を手がかりにして設定されるので、信号処理を容易にさせる。
なお、図6において、r1’はr1に応じて決定されるが、θ1が0°に近いほどr1に近い値になり、θ1が90°に近いほどr1より小さな値になるように制御してもよい。
また、信号処理部105は、修正再生位置情報が示す位置の方向から音が聞こえるように設定されHRTFを用いて音像を定位させる処理をしてもよい。これにより、受聴者から聴いてどの方向どの距離に音源が存在するかを制御することができる。さらに、信号処理部105は、受聴者の位置と修正再生位置情報が示す位置との距離(r1’、r2’等)に応じて音量を調整してもよい。これにより、受聴者から聴いたときの音源への距離を反映した再生ができる。
次に、選択部103は、変換部102で生成された修正再生位置情報と設定部101で設定された2次元座標軸と受聴者の位置(あるいは、このオーディオ再生装置110が予め定めている受聴位置)とから信号処理部105で採用すべき信号処理方式を選択する。図7にその一例を示した。例えば、オーディオオブジェクト1に対しては(修正再生位置情報のy座標値が受聴者の位置より前の正の値である場合)、修正再生位置情報1の位置にビームフォームで音像を合成する。これは、音源の再生位置が、スピーカアレー106の前方で、かつ、受聴者の前方の場合、ビームフォームによって音像を結ぶことが可能だからである。また、例えば、オーディオオブジェクト2に対しては(修正再生位置情報のy座標値が負の値である場合)、修正再生位置情報2の位置を音源としたHuygensの原理に基づいた波面合成を行う。これは、音源の再生位置が、スピーカアレー106の後方の場合、波面合成によってさもそこに音源が存在するかのような音響効果を作り出すことができるからである。また、例えば、オーディオオブジェクト3に対しては(修正再生位置情報のy座標値が受聴者の位置より後ろの正の値である場合)、修正再生位置情報3で示した方向(θ1)から音が聞こえているかのような音像定位を、HRFTを用いて実現する。これは、音源の再生位置が、受聴者の後方の場合、ビームフォームや波面合成が効果を発揮しないので、HRFTを用いる方法を選択する。HRTFを用いた場合、方向は精度よく再現できるが、距離感は再現できないので、音源までの距離r1に応じて音量を制御するなどしてもよい。
さて、一方、オーディオオブジェクト分離部100で分離されたオーディオ符号化信号は復号化部104でオーディオPCM信号に復号化される。これはオーディオ符号化信号のコーデック方式におけるデコーダを用いればよい。
このようにして復号化されたオーディオPCM信号は、信号処理部105において、選択部103によって選択された信号処理方式で処理される。つまり、信号処理部105は、修正再生位置情報のy座標値が負の値である場合、Huygensの定理を利用した信号処理で波面合成し、修正再生位置情報のy座標値が受聴者の位置より前の正の値である場合、ビームフォームを利用した信号処理で音像を生成し、修正再生位置情報のy座標値が受聴者の位置より後ろの正の値である場合、HRTFを利用した信号処理で音像を定位させる。
なお、本実施の形態では、信号処理方式は、ビームフォーム、波面合成、及び、HRTFのいずれかであるが、いずれの信号処理方式であっても、より具体的な実現方法としては、従来から用いられている信号処理方式をもちいればよい。
最後に、スピーカアレー106は、信号処理部105からの出力信号(音響信号)を音響振動に変換する。
図8は、本実施の形態のオーディオ再生装置110の主要な動作を示すフローチャートである。
まず、オーディオオブジェクト分離部100は、オーディオオブジェクトから3次元の再生位置情報とオーディオ符号化信号とを分離する(S10)。
続いて、変換部102は、オーディオオブジェクト分離部100で分離された3次元の再生位置情報を、スピーカアレー106の位置を基準とした2次元座標軸上の位置情報(2次元情報)である修正再生位置情報に変換する(S11)。
次に、選択部103は、変換部102で生成された修正再生位置情報と、設定部101で設定された2次元座標軸と、スピーカアレー106から出力される音響を受聴する受聴者の位置(あるいは、このオーディオ再生装置110が予定している受聴位置)とから、信号処理部105で採用すべき信号処理方式を選択する(S12)。
最後に、信号処理部105は、変換部102での変換で得られた修正再生位置に応じて、オーディオオブジェクト分離部100で分離され復号化部104で復号化されたオーディオ信号の音像を定位させる処理をする(S13)。このとき、信号処理部105は、選択部103で選択された信号処理方式で処理を行う。
これにより、オーディオオブジェクトに含まれる3次元の再生位置情報はスピーカアレーの位置を基準とした2次元座標軸上の修正再生位置情報に変換され、修正後の修正再生位置情報に応じて音像が定位されるので、スピーカ配置に制約がある場合でも、オーディオオブジェクトが高い臨場感で再生される。
なお、図8では、主要な動作ステップとして、4つのステップS10〜S13が示されたが、最低限のステップとしては、変換ステップS11と信号処理ステップS13とが実行されればよい。これら2つのステップによって、3次元の再生位置情報が2次元座標軸上の修正再生位置情報に変換されるので、スピーカを自由に配置できない空間であっても3次元の再生位置情報を含むオーディオオブジェクトが高い臨場感で再生され得る。
また、逆に、本実施の形態のオーディオ再生装置110の動作として、図8に示されたステップS10〜S13に加えて、設定部101の動作、及び、復号化部104の動作が追加されてもよい。
図9は、本実施の形態のオーディオ再生装置110の動作のうち、オーディオフレームに含まれる再生位置情報の取り扱いに関する動作を示すフローチャートである。ここでは、オーディオオブジェクトに含まれるオーディオフレーム毎に行われる再生位置情報に関する動作が示されている。
オーディオオブジェクト分離部100は、処理対象のオーディオフレーム中に再生位置情報が欠落しているか否かを判断する(S20)。
その結果、再生位置情報が欠落していると判断された場合には(S20でYes)、オーディオオブジェクト分離部100によって、過去に再生したオーディオフレームに含まれていた再生位置情報が、処理対象のオーディオフレームの再生位置情報として用いられ、その再生位置情報に従って(2次元の修正再生位置情報に変換等された後に)、信号処理部105で信号処理が行われる(S21)。
一方、再生位置情報が欠落していないと判断された場合には(S20でNo)、オーディオオブジェクト分離部100によって、処理対象のオーディオフレームに含まれていた再生位置情報が分離され、その再生位置情報に従って(2次元の修正再生位置情報に変換等された後に)、信号処理部105で信号処理が行われる(S22)。
これにより、再生位置情報が欠落している場合であっても、過去に再生したオーディオフレームに含まれていた再生位置情報が用いられるので、自然な音場再生ができる、或いは、オーディオオブジェクトが動いていないときに当該オーディオオブジェクトを記録あるいは伝送する際の情報量を減らすことができる。
なお、図8及び図9のフローチャート及びその変形例に係る手順は、その手順が記述されたプログラムとして実現され、プロセッサによって実行され得る。
さて、本実施の形態では、修正再生位置情報に応じて3つの信号処理方式の中から1つの方法が選択された。図10の(a)は、それを整理した図である。修正再生位置情報がスピーカアレーに後方である場合はHuygensの原理による波面合成、スピーカアレーの前方で受聴者の前方の場合はビームフォームによる方法、受聴者の後方の場合はHRTFによる方法が用いられる。図10の(b)は、オーディオオブジェクト(オーディオオブジェクトに含まれる再生位置情報が示す位置)が時間とともに移動した場合のそれぞれの境界線付近での信号処理方式を示している。例えば、修正再生位置情報がスピーカアレーのライン近傍の場合は、信号処理部105は、波面合成の方法による出力信号とビームフォームの方法による出力信号とを所定の割合で混合した信号を生成する。同様に受聴者近傍では、信号処理部105は、ビームフォームの方法による出力信号とHRTFの方法による出力信号とを所定の割合で混合した信号を生成する。
また、本実施の形態では、修正再生位置情報に応じて3つの信号処理方式の中から1つの方法を選択されたが、HRTFの方法は、修正再生位置情報がいずれの位置であっても選択されてもよい。それは、Huygensの原理による波面合成では、スピーカの前方に音像を定位させることができず、ビームフォームでは、スピーカの後方やリスナーの後方に音像を定位させることができないのに対し、HRTFは、両耳間の位相差情報やレベル差情報、さらに頭部周辺の音響伝達特性を模擬することで、どのような制御も可能であるからである。図11は、オーディオオブジェクト(オーディオオブジェクトに含まれる再生位置情報が示す位置)がリスナーの頭上を通過するような場合のHRTFが狙う位置情報の軌跡を示している。まさにオーディオオブジェクト(オーディオオブジェクトに含まれる再生位置情報が示す位置)がリスナーの頭上に差し掛かったときは、頭部の周囲を回りこむように制御する。そうすることによって、頭上周辺での臨場感を高めることができる。
また、実施の形態では、Z軸方向の制御について言及していないが、上下方向の定位に関わる手がかりは、頭部周辺の音響伝達関数の振幅スペクトルに含まれているという研究成果(特許文献1)を活用し、HRTFにその要素を加えてもよい。
また、Z軸方向の制御については、スピーカアレーを複数用いることで、複数の平面を構成し、Z軸方向を制御してもよい。図12は2つのスピーカアレー106a及び106bを用いたバリエーション、図13は3つのスピーカアレー106a〜106cを用いたバリエーション、をそれぞれ示している。
図12及び図13に示される例では、オーディオ再生装置は、少なくとも2体のスピーカアレーを備え、それら少なくとも2体のスピーカアレーが少なくとも2つの2次元座標を構成し、再生位置情報で特定される位置が(x、y、z)であるとき、信号処理部105は、上記zの値に応じて少なくとも2体のスピーカアレーを制御する。具体的には、上記2つの2次元座標が平行しているとき、信号処理部105は、上記zの値が予め定められた値よりも大きい(あるいは、以上である)場合は、XY面(設置面)に対して上側の2次元座標を構成しているスピーカアレーの音量を大きくし、上記zの値が予め定められた値よりも小さい(あるいは、以下である)場合は、XY面(設置面)に対して下側の2次元座標を構成しているスピーカアレーの音量を大きくする。
一方、上記2つの2次元座標が直交しているとき、信号処理部105は、上記zの値が予め定められた値よりも大きい(あるいは、以上である)場合は、XY面(設置面)に対して垂直の2次元座標を構成しているスピーカアレーを構成するスピーカ素子のうち、予め定められた位置よりも上方のスピーカ素子の音量を大きくし、上記zの値が予め定められた値よりも小さい(あるいは、以下である)場合は、XY面(設置面)に対して垂直の2次元座標を構成しているスピーカアレーを構成するスピーカ素子のうち、予め定められた位置よりも下方のスピーカ素子の音量を大きくする。
このように、オーディオ再生装置110が少なくとも2体のスピーカアレーを備える場合には、再生位置情報で特定される位置(x、y、z)のzの値に応じてそれら少なくとも2体のスピーカアレーが制御されるので、再生位置情報の高さ情報も制御でき、3次元の再生位置情報を含むオーディオオブジェクトが高い臨場感で再生される。
上記のように、本実施の形態におけるオーディオ再生装置110は、音響信号を音響振動に変換する少なくとも1体のスピーカアレー106と、3次元の再生位置情報をスピーカアレー106の位置を基準とした2次元座標軸上の位置情報(修正再生位置情報)に変換する変換部102と、修正再生位置に応じてオーディオオブジェクトの音像を定位させるように処理する信号処理部105とを備えることで、3次元の再生位置情報を伴ったオーディオオブジェクトを、天井スピーカを設置できない等のスピーカを自由に配置できない環境であっても、可能な限り良好な臨場感で再生することができることとなる。
以上、本開示に係るオーディオ再生装置について、実施の形態に基づいて説明したが、本開示に係るオーディオ再生装置は、この実施の形態に限定されない。本開示の趣旨を逸脱しない限り、当業者が思いつく各種変形を本実施の形態に施したものや、異なる実施の形態における構成要素を組み合わせて構築される形態であってもよい。
尚、本実施の形態では、設定部101を備えたが、スピーカアレーの設置位置があらかじめ確定している場合は設定部101が不要であることは言うまでもない。
また、本実施の形態では、選択部103に受聴者位置情報を入力するようにしているが、受聴者の位置があらかじめ確定している、あるいは、受聴者の位置として本装置があらかじめ想定している位置が固定である場合は、それ(受聴者位置情報の入力)が不要であることは言うまでもない。
あるいは、信号処理方式が固定の場合(たとえば常にHRTFで処理すると決まっている場合は)選択部103が不要であることは言うまでもない。
また、本実施の形態では、復号化部104を備えたが、オーディオ符号化信号が単純なPCM信号である場合、つまり、オーディオオブジェクトに含まれるオーディオ信号が符号化されていない場合には、復号化部104が不要であることは言うまでもない。
また、本実施の形態では、オーディオオブジェクト分離部100が備えられたが、オーディオ信号と再生位置情報とが分離された構造のオーディオオブジェクトがオーディオ再生装置110に入力される場合には、オーディオオブジェクト分離部100が不要であるのは言うまでもない。
また、スピーカアレーはスピーカ素子が直線状に配置されたものでなくてもよく、例えばアーチ状(弧)であってもよい。またスピーカ素子の間隔は一定でなくてもよい。本開示では、スピーカアレーの形状について限定するものでない。
本開示にかかるオーディオ再生装置は、スピーカアレーを備えるオーディオ再生装置として、特に、3次元にスピーカを配置できない空間であっても3次元の位置情報を含むオーディオオブジェクトを高い臨場感で再生できるので、幅広くオーディオ信号を再生する機器に利用できる。
100 オーディオオブジェクト分離部
101 設定部
102 変換部
103 選択部
104 復号化部
105 信号処理部
106、106a〜106c スピーカアレー
110 オーディオ再生装置

Claims (17)

  1. オーディオ信号と前記オーディオ信号の音像を定位させる3次元空間における位置を示す再生位置情報とを含むオーディオオブジェクトを再生するオーディオ再生装置であって、
    音響信号を音響振動に変換する少なくとも1体のスピーカアレーと、
    前記再生位置情報を、前記スピーカアレーの位置を基準とした2次元座標軸上の位置情報である修正再生位置情報に変換する変換部と、
    前記修正再生位置情報に応じて前記オーディオオブジェクトに含まれる前記オーディオ信号の音像を定位させる処理をする信号処理部と、
    を備えるオーディオ再生装置。
  2. 前記スピーカアレーを構成するスピーカ素子の並び方向をX軸、前記X軸と直交し、かつ、前記スピーカアレーが設置されている面である設置面と水平な方向をY軸、及び、前記X軸と直交し、かつ、前記設置面と垂直な方向をZ軸としたとき、
    前記修正再生位置情報は、前記X軸と前記Y軸とで構成された座標軸上の位置を指し、
    前記再生位置情報で特定される位置が(x、y、z)であるとき、前記修正再生位置情報は前記x、yに応じた値である
    請求項1記載のオーディオ再生装置。
  3. 前記2次元座標におけるY座標では、前記スピーカアレーの背面方向がマイナス座標、前記スピーカアレーの前面方向がプラス座標であり、前記2次元座標におけるX座標では、前記スピーカアレーの中央から左右にそれぞれマイナス座標、プラス座標であるとき、前記修正再生位置情報の値は、前記x、yの少なくとも一方に所定の値を乗じた値である
    請求項2記載のオーディオ再生装置。
  4. 前記修正再生位置情報のx座標値は、前記スピーカアレーの幅に制限される
    請求項2又は3記載のオーディオ再生装置。
  5. 前記信号処理部は、前記2次元座標軸上の位置に音像を構成するビームフォーム部である
    請求項1から4のいずれか1項に記載のオーディオ再生装置。
  6. 前記2次元座標におけるY座標では、前記スピーカアレーの背面方向がマイナス座標、前記スピーカアレーの前面方向がプラス座標であり、
    前記信号処理部は、前記修正再生位置情報のy座標値が負の値である場合、Huygensの定理を利用した信号処理で波面合成する
    請求項2記載のオーディオ再生装置。
  7. 前記修正再生位置情報は、前記スピーカアレーから出力される音響を受聴する受聴者の位置から見た前記再生位置情報が示す位置への方向角と、前記受聴者の位置から前記再生位置情報が示す位置までの距離とによって前記2次元座標軸上の位置を示す
    請求項1記載のオーディオ再生装置。
  8. 前記信号処理部は、HRTF(Head Related Transfer Function)を用いて前記音像を定位させる処理をし、
    前記HRTFは、前記修正再生位置情報が示す位置の方向から音が聞こえるように設定されている
    請求項7記載のオーディオ再生装置。
  9. 前記信号処理部は、前記受聴者の位置と前記修正再生位置情報が示す位置との距離に応じて音量を調整する
    請求項8記載のオーディオ再生装置。
  10. 前記信号処理部は、前記修正再生位置情報が示す位置に応じて信号処理方式を変更する
    請求項1記載のオーディオ再生装置。
  11. 前記スピーカアレーを構成するスピーカ素子の並び方向をX軸、前記X軸と直交し、かつ、前記スピーカアレーが設置されている面である設置面と水平な方向をY軸、及び、前記X軸と直交し、かつ、前記設置面と垂直な方向をZ軸とし、
    前記Y軸における位置を示すY座標では、前記スピーカアレーの背面方向がマイナス座標、前記スピーカアレーの前面方向がプラス座標であり、
    前記信号処理部は、
    前記修正再生位置情報のy座標値が負の値である場合、Huygensの定理を利用した信号処理で波面合成し、
    前記修正再生位置情報のy座標値が受聴者の位置より前の正の値である場合、ビームフォームを利用した信号処理で音像を生成し、
    前記修正再生位置情報のy座標値が受聴者の位置より後ろの正の値である場合、HRTFを利用した信号処理で音像を定位させる
    請求項10記載のオーディオ再生装置。
  12. 前記オーディオ再生装置は、少なくとも2体のスピーカアレーを備え、
    前記少なくとも2体のスピーカアレーが少なくとも2つの2次元座標を構成し、
    前記少なくとも2体のスピーカアレーのうちの一つのスピーカアレーを構成するスピーカ素子の並び方向をX軸、前記X軸と直交し、かつ、前記一つのスピーカアレーが設置されている面である設置面と水平な方向をY軸、及び、前記X軸と直交し、かつ、前記設置面と垂直な方向をZ軸とし、前記再生位置情報で特定される位置が(x、y、z)であるとき、
    前記信号処理部は、前記zの値に応じて前記少なくとも2体のスピーカアレーを制御する
    請求項1記載のオーディオ再生装置。
  13. 前記2つの2次元座標が平行しているとき、前記信号処理部は、
    前記zの値が予め定められた値よりも大きい場合は、前記設置面に対して上側の2次元座標を構成しているスピーカアレーの音量を大きくし、
    前記zの値が予め定められた値よりも小さい場合は、前記設置面に対して下側の2次元座標を構成しているスピーカアレーの音量を大きくする
    請求項12記載のオーディオ再生装置。
  14. 前記2つの2次元座標が直交しているとき、前記信号処理部は、
    前記zの値が予め定められた値よりも大きい場合は、前記設置面に対して垂直の2次元座標を構成しているスピーカアレーを構成するスピーカ素子のうち、予め定められた位置よりも上方のスピーカ素子の音量を大きくし、
    前記zの値が予め定められた値よりも小さい場合は、前記設置面に対して垂直の2次元座標を構成しているスピーカアレーを構成するスピーカ素子のうち、予め定められた位置よりも下方のスピーカ素子の音量を大きくする
    請求項12記載のオーディオ再生装置。
  15. オーディオ信号と前記オーディオ信号の音像を定位させる3次元空間における位置を示す再生位置情報とを含むオーディオオブジェクトを再生するオーディオ再生装置であって、
    前記オーディオオブジェクトは、所定の時間間隔ごとの前記オーディオ信号と前記再生位置情報とを含むオーディオフレームから構成され、
    前記オーディオ再生装置は、
    前記再生位置情報が欠落している場合には、過去に再生したオーディオフレームに含まれていた再生位置情報を、前記再生位置情報が欠落したオーディオフレームの再生位置情報として用いることで、前記オーディオオブジェクトに含まれるオーディオフレームを再生する
    オーディオ再生装置。
  16. オーディオ信号と前記オーディオ信号の音像を定位させる3次元空間における位置を示す再生位置情報とを含むオーディオオブジェクトを、スピーカアレーを用いて、再生するオーディオ再生方法であって、
    前記再生位置情報を、前記スピーカアレーの位置を基準とした2次元座標軸上の位置情報である修正再生位置情報に変換する変換ステップと、
    前記修正再生位置情報に応じて前記オーディオオブジェクトに含まれる前記オーディオ信号の音像を定位させる処理をする信号処理ステップとを含む
    オーディオ再生方法。
  17. オーディオ信号と前記オーディオ信号の音像を定位させる3次元空間における位置を示す再生位置情報とを含むオーディオオブジェクトを、スピーカアレーを用いて、再生するオーディオ再生方法であって、
    前記オーディオオブジェクトは、所定の時間間隔ごとの前記オーディオ信号と前記再生位置情報とを含むオーディオフレームから構成され、
    前記オーディオ再生方法は、
    前記再生位置情報が欠落している場合には、過去に再生したオーディオフレームに含まれていた再生位置情報を、前記再生位置情報が欠落したオーディオフレームの再生位置情報として用いることで、前記オーディオオブジェクトに含まれるオーディオフレームを再生するステップを含む
    オーディオ再生方法。
JP2015522476A 2013-06-10 2014-02-19 オーディオ再生装置及びその方法 Active JP6022685B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2013122254 2013-06-10
JP2013122254 2013-06-10
PCT/JP2014/000868 WO2014199536A1 (ja) 2013-06-10 2014-02-19 オーディオ再生装置及びその方法

Publications (2)

Publication Number Publication Date
JP6022685B2 JP6022685B2 (ja) 2016-11-09
JPWO2014199536A1 true JPWO2014199536A1 (ja) 2017-02-23

Family

ID=52021863

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015522476A Active JP6022685B2 (ja) 2013-06-10 2014-02-19 オーディオ再生装置及びその方法

Country Status (4)

Country Link
US (1) US9788120B2 (ja)
JP (1) JP6022685B2 (ja)
CN (3) CN105264914B (ja)
WO (1) WO2014199536A1 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107979807A (zh) * 2016-10-25 2018-05-01 北京酷我科技有限公司 一种模拟环绕立体声的方法及系统
US10531196B2 (en) * 2017-06-02 2020-01-07 Apple Inc. Spatially ducking audio produced through a beamforming loudspeaker array
CN108414072A (zh) * 2017-11-07 2018-08-17 四川大学 一种真三维声音录制与播放系统
JP7115535B2 (ja) 2018-02-21 2022-08-09 株式会社ソシオネクスト 音声信号処理装置、音声調整方法及びプログラム
CN109286888B (zh) * 2018-10-29 2021-01-29 中国传媒大学 一种音视频在线检测与虚拟声像生成方法及装置
JP7456106B2 (ja) * 2019-09-19 2024-03-27 ソニーグループ株式会社 信号処理装置、信号処理方法および信号処理システム
JP2021153292A (ja) * 2020-03-24 2021-09-30 ヤマハ株式会社 情報処理方法および情報処理装置
CN111787460B (zh) * 2020-06-23 2021-11-09 北京小米移动软件有限公司 设备控制方法及装置
CN113329319B (zh) * 2021-05-27 2022-10-21 音王电声股份有限公司 一种扬声器阵列的沉浸声还音制式方法及其应用
GB2611547A (en) * 2021-10-07 2023-04-12 Nokia Technologies Oy Apparatus, methods and computer programs for processing spatial audio
WO2024014390A1 (ja) * 2022-07-13 2024-01-18 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 音響信号処理方法、情報生成方法、コンピュータプログラム、及び、音響信号処理装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001197598A (ja) * 2000-01-05 2001-07-19 Mitsubishi Electric Corp 映像音声再生装置
JP2006128818A (ja) * 2004-10-26 2006-05-18 Victor Co Of Japan Ltd 立体映像・立体音響対応記録プログラム、再生プログラム、記録装置、再生装置及び記録メディア
JP2011035784A (ja) * 2009-08-04 2011-02-17 Sharp Corp 立体映像・立体音響記録再生装置・システム及び方法
JP2011066868A (ja) * 2009-08-18 2011-03-31 Victor Co Of Japan Ltd オーディオ信号符号化方法、符号化装置、復号化方法及び復号化装置
WO2013006338A2 (en) * 2011-07-01 2013-01-10 Dolby Laboratories Licensing Corporation System and method for adaptive audio signal generation, coding and rendering

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6990205B1 (en) 1998-05-20 2006-01-24 Agere Systems, Inc. Apparatus and method for producing virtual acoustic sound
DE10328335B4 (de) * 2003-06-24 2005-07-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Wellenfeldsyntesevorrichtung und Verfahren zum Treiben eines Arrays von Lautsprechern
DE10344638A1 (de) 2003-08-04 2005-03-10 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Erzeugen, Speichern oder Bearbeiten einer Audiodarstellung einer Audioszene
JP4551652B2 (ja) * 2003-12-02 2010-09-29 ソニー株式会社 音場再生装置及び音場空間再生システム
EP1791394B1 (en) 2004-09-16 2011-11-09 Panasonic Corporation Sound image localization apparatus
DE102005008369A1 (de) 2005-02-23 2006-09-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Simulieren eines Wellenfeldsynthese-Systems
DE102005008366A1 (de) 2005-02-23 2006-08-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Ansteuern einer Wellenfeldsynthese-Renderer-Einrichtung mit Audioobjekten
DE102005008333A1 (de) 2005-02-23 2006-08-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Steuern einer Wellenfeldsynthese-Rendering-Einrichtung
JP4449998B2 (ja) * 2007-03-12 2010-04-14 ヤマハ株式会社 アレイスピーカ装置
KR101268779B1 (ko) * 2009-12-09 2013-05-29 한국전자통신연구원 라우드 스피커 어레이를 사용한 음장 재생 장치 및 방법
JP2011124723A (ja) * 2009-12-09 2011-06-23 Sharp Corp オーディオデータ処理装置、オーディオ装置、オーディオデータ処理方法、プログラム及び当該プログラムを記録した記録媒体
TW201412092A (zh) * 2012-09-05 2014-03-16 Acer Inc 多媒體處理系統及音訊信號處理方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001197598A (ja) * 2000-01-05 2001-07-19 Mitsubishi Electric Corp 映像音声再生装置
JP2006128818A (ja) * 2004-10-26 2006-05-18 Victor Co Of Japan Ltd 立体映像・立体音響対応記録プログラム、再生プログラム、記録装置、再生装置及び記録メディア
JP2011035784A (ja) * 2009-08-04 2011-02-17 Sharp Corp 立体映像・立体音響記録再生装置・システム及び方法
JP2011066868A (ja) * 2009-08-18 2011-03-31 Victor Co Of Japan Ltd オーディオ信号符号化方法、符号化装置、復号化方法及び復号化装置
WO2013006338A2 (en) * 2011-07-01 2013-01-10 Dolby Laboratories Licensing Corporation System and method for adaptive audio signal generation, coding and rendering

Also Published As

Publication number Publication date
CN105264914A (zh) 2016-01-20
US9788120B2 (en) 2017-10-10
US20160088393A1 (en) 2016-03-24
CN106961647B (zh) 2018-12-14
CN106961645A (zh) 2017-07-18
CN106961647A (zh) 2017-07-18
WO2014199536A1 (ja) 2014-12-18
CN106961645B (zh) 2019-04-02
JP6022685B2 (ja) 2016-11-09
CN105264914B (zh) 2017-03-22

Similar Documents

Publication Publication Date Title
JP6022685B2 (ja) オーディオ再生装置及びその方法
US10659899B2 (en) Methods and systems for rendering audio based on priority
US10021507B2 (en) Arrangement and method for reproducing audio data of an acoustic scene
CN105191354B (zh) 音频处理装置及其方法
EP2954702B1 (en) Mapping virtual speakers to physical speakers
JP5919201B2 (ja) 音声を定位知覚する技術
EP3282716B1 (en) Rendering of audio objects with apparent size to arbitrary loudspeaker layouts
KR101268779B1 (ko) 라우드 스피커 어레이를 사용한 음장 재생 장치 및 방법
EP3028476B1 (en) Panning of audio objects to arbitrary speaker layouts
US9467792B2 (en) Method for processing of sound signals
JP2015529415A (ja) 多次元的パラメトリック音声のシステムおよび方法
KR20190091445A (ko) 오디오 이미지를 생성하는 시스템 및 방법
EP3192282A1 (en) Rendering audio objects in a reproduction environment that includes surround and/or height speakers
JP6663490B2 (ja) スピーカシステム、音声信号レンダリング装置およびプログラム
KR102527336B1 (ko) 가상 공간에서 사용자의 이동에 따른 오디오 신호 재생 방법 및 장치
JP2018110366A (ja) 3dサウンド映像音響機器
US10440495B2 (en) Virtual localization of sound

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160906

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161005

R150 Certificate of patent or registration of utility model

Ref document number: 6022685

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150