JP2009055621A - 仮想音響環境において指向性音響を処理する方法 - Google Patents

仮想音響環境において指向性音響を処理する方法 Download PDF

Info

Publication number
JP2009055621A
JP2009055621A JP2008250770A JP2008250770A JP2009055621A JP 2009055621 A JP2009055621 A JP 2009055621A JP 2008250770 A JP2008250770 A JP 2008250770A JP 2008250770 A JP2008250770 A JP 2008250770A JP 2009055621 A JP2009055621 A JP 2009055621A
Authority
JP
Japan
Prior art keywords
sound
sound source
acoustic environment
filter
virtual acoustic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008250770A
Other languages
English (en)
Inventor
Jyri Huopaniemi
フオパニエミ、イリ
Riitta Vaeaenaenen
ベーネネン、リータ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Mobile Phones Ltd
Nokia Oyj
Original Assignee
Nokia Mobile Phones Ltd
Nokia Mobile Phones Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Mobile Phones Ltd, Nokia Mobile Phones Ltd filed Critical Nokia Mobile Phones Ltd
Publication of JP2009055621A publication Critical patent/JP2009055621A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K11/00Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
    • G10K11/18Methods or devices for transmitting, conducting or directing sound
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K15/00Acoustics not otherwise provided for
    • G10K15/02Synthesis of acoustic waves

Landscapes

  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Steroid Compounds (AREA)
  • Complex Calculations (AREA)
  • Executing Machine-Instructions (AREA)

Abstract

【課題】仮想音響環境が妥当な計算負荷でユーザに伝送され得る方法およびシステムを示すことである。本発明のさらなる目的は、音の高低と到達方向が音の指向性に及ぼす影響を考慮できる方法およびシステムを示すことである。
【解決手段】仮想音響環境が電子装置内で処理される。仮想音響環境は少なくとも1つの音源300を含む。音が方向づけられる方法をモデル化するために、方向に依存するフィルタの組306、307、308、309が音源に対応して設けられることによって、フィルタの組が音に及ぼす影響が所定のパラメータに依存する。指向性は音の周波数に依存可能である。
【選択図】図3

Description

本発明は、ある空間に対応する人工的な聴感覚(audible impression)が聴取者に対して生成され得る方法およびシステムに関する。さらに詳しくは、本発明は、そのような聴感覚における指向性音響の処理およびユーザに提示される情報がディジタル形式で伝送、処理、および/または圧縮されるシステムにおいて結果として生ずる聴感覚の伝送に関する。
仮想音響環境は、電気的再生音に対する聴取者がある空間内にいることを想像できる上で手助けとなる聴感覚を意味する。複雑な仮想音響環境は、多くの場合に実際の空間を模倣することを意図している。それは前記空間の聴覚化と称される。この概念は論文、エム.クライネル、ベー.アイ.ダレンベック、ペー.スベンソン著「聴覚化−概要」、1993、ヤー.アウヂオ工学会、第41巻、No.11、861〜875頁(M. Kleiner, B. I. Dalenbaeck, P. Svensson;“Auralization - An Overview”, 1993, J. Audio Eng. Soc., vol. 41, No. 11, pp. 861 - 875)に記載されている。聴覚化は視覚仮想環境の生成と自然な方法で結合され得るので、適当なディスプレイとスピーカまたはヘッドセットを備えたユーザは所望の実際または想像上の空間を観測することができて、前記空間内を「動き回る」ことさえもできる。したがって、ユーザは観測ポイントとして選択した前記環境内の位置に依存して様々な視覚および聴感覚を得る。
仮想音響環境の生成は3つの要素、すなわち音源のモデル化、空間のモデル化、および聴取者のモデル化に分割され得る。本発明はとくに音源のモデル化と早期の音の反射に関する。
VRML97言語(バーチャルリアリティモデル化言語(Virtual Reality Modeling Language)97)は視覚および仮想音響の環境をモデル化して処理するのによく使用され、この言語は出版物ISO/IEC JTC/SC24 IS 14772-1, 1997, 「情報技術−コンピューターグラフィックスおよび画像処理−バーチャルリアリティモデル化言語(Information Technology - Computer Graphics and Image Processing - The Virtual Reality Modeling Language)(VRML97)、1997年4月およびインターネットアドレス http://www.vrml.org/Specifications/VRML97/の対応ページで扱われている。本特許出願が作成されているあいだに開発されている規則の他のセットはJava3Dに関連しており、それはVRMLの制御および処理環境となり、たとえば出版物SUN出版1997;「JAVA 3D API詳説 1.0」およびインターネットアドレス http://www.javasoft.com/-products/java-media/3D/forDevelopers/3Dguide/- に記載されている。さらに、開発中のMPEG−4規格(Motion Picture Experts Group 4)は、ディジタル通信リンクを経由して伝送されるマルチメディア提示が実際と仮想の対象を含むことができて、それらはある視聴覚環境をともに形成することを目標としている。MPEG-4規格は出版物ISO/IEC JTC/SC29 WG11 CD 14496, 1997;「情報技術−視聴覚対象のコード化」(Information Technology - Coding of audiovisual objects.)1997年11月およびインターネットアドレス http://www.cselt.it/-mpeg/public/mpeg-4_cd.htm の対応ページに記載されている。
図1はVRML97およびMPEG-4で使用されている既知の指向性音響モデルを示す。音源はポイント101に位置し、その回りに2つの楕円体102と103が一方が他方の内側に仮定され、それによって1つの楕円体の焦点が音源の位置と共通であり、2つの楕円体の主軸が平行である。楕円体102と104の大きさは、主軸の方向に測定される距離maxBack、maxFront、minBackとminFrontによって表わされる。距離の関数としての音の減衰は曲線104によって表わされる。内側の楕円体102の内側では音の強さは一定であり、外側の楕円体103の外側では音の強さはゼロである。ポイント101を通るすべての直線に沿ってポイント101から離れるにつれて、音の強さは内側と外側の楕円体とのあいだで直線的に20dB減少する。いいかえれば、2つの楕円体のあいだに位置するポイント105で観察される減衰Aは次式によって計算され得る。
A=−20dB・(d’/d”)
ここで、d'はポイント101と105を結ぶ直線に沿って測定される内側の楕円体の表面から観察ポイントまでの距離であり、d”は同じ直線に沿って測定される内側と外側の楕円体のあいだの距離である。
Java3Dにおいて、指向性音響モデルは図2に示された円錐状音響概念によってモデル化される。この図は円錐の共通の長手方向軸を含む面に沿った2つの円錐構造の断面を表わす。音源は円錐201と202の共通の頂点203に位置する。前方の円錐201と後方の円錐202の両方の領域において、音は均一に減衰する。2つの円錐間の領域においては、直線的な補間(interpolation)が適用される。観測ポイント204で検出される減衰を計算するために、減衰なしの音の強さ、前方と後方の円錐の幅、および前方の円錐の長手方向軸とポイント203と204とを結ぶ直線のあいだの角度を知る必要がある。
音響反射面を有する空間の音響特性をモデル化する既知の方法が虚音源法(image source method)であり、そこでは最初の音源に加えて観測対象の反射面に対応する音源の鏡像である1組の仮想虚音源が与えられる。1つの虚音源は各調査対象の反射面の後に配置されるので、この虚音源から観測ポイントまでまっすぐに測定される距離は、最初の音源から反射して観測ポイントに至る距離と同じである。さらに、虚音源からの音は実際の反射音と同じ方向から調査ポイントに到達する。聴感覚は虚音源によって発生される音を加えることによって得られる。
従来技術による方法は計算の負荷が非常に大きい。仮想環境が、たとえば放送またはデータネットワークを通してユーザに伝送されると仮定した場合には、ユーザの受信機は数千の虚音源によって発生される音を絶えず加える必要がある。そのうえ、ユーザが観測ポイントの位置を変更しようと決めた場合には、計算のベースはいつも変化する。さらに、既知の解は、方向角のほかに音の指向性はその波長に強く依存していること、いいかえれば、周波数の高低が様々な音は様々な方向に向かうという事実を完全に無視している。
フィンランド特許出願第974006号明細書(ノキア社(Nokia Corp.))に、仮想音響環境を処理する方法およびシステムが述べられている。そこでは、モデル化対象の環境の音響反射面は一定の周波数応答を有するフィルタによって表わされる。モデル化された環境をディジタル伝送形式で伝送するためには、その環境に属するすべての不可欠な音響反射面の伝達関数をある方法で表わすことで充分である。しかし、これさえも音の到達方向または高低が音の方向に及ぼす影響を考慮していない。
本発明の目的は、仮想音響環境が妥当な計算負荷でユーザに伝送され得る方法およびシステムを示すことである。本発明のさらなる目的は、音の高低と到達方向が音の指向性に及ぼす影響を考慮できる方法およびシステムを示すことである。
本発明の目的は、音の所望の指向性を様々なパラメータの助けで設定し、その指向性が周波数と到着方向角にどのように依存するかを考慮するパラメータで特徴づけられたシステム関数によって音源またはその早期反射をモデル化することによって達成される。
本発明による方法は、音がどのような方向に向けられるかをモデル化するために、フィルタの組が音源に及ぼす影響がフィルタの所定のパラメータに依存するように方向に依存するフィルタの組が仮想音響環境の音源に対応して設けられることを特徴とする。
また本発明は、仮想音響環境に属する音源からの音の指向性をモデル化するパラメータで特徴づけられたフィルタを含むフィルタバンクを生成する手段を含むことを特徴とするシステムに関する。
本発明によれば、音源のモデルまたはそれから計算された反射は、方向に依存するディジタルフィルタを含む。ゼロ方位と称されるある基準方向が音に対して選択される。この方向は仮想音響環境においてどの方向にも向けられ得る。それに加えて、多数の他の方向が選択され、そこでは音がどの方向に向けられているかをモデル化することが必要とされる。また、これらの方向は任意に選択され得る。選択された各々の他の方向は、周波数に依存するか、または依存しないかを選択することができる伝達関数を有する独自のディジタルフィルタによってモデル化される。観測ポイントがフィルタによって丁度表わされた方向以外のどこかに位置する場合には、フィルタ伝達関数のあいだに様々な補間を形成することが可能である。
情報をディジタル形式で伝送する必要があるシステムにおいて音およびそれがどのように向けられているかをモデル化しようとする場合に、各伝達関数に関するデータだけを伝送すればよい。受信装置は、所要の観測ポイントを知って、音が音源の位置から観測ポイントの方に向いていることを、それが再構成した伝達関数の助けで決定する。観測ポイントの位置がゼロ方位に対して変化する場合に、受信装置は音が新しい観測ポイントに対してどのように向けられているかを調べる。いくつかの音源が有り得るので、受信装置は音が各音源から観測ポイントへどのように向くかを計算し、それに対応して再生音を修正する。そのとき、たとえば楽器が様々な場所に位置し様々な方向に向いている仮想オーケストラに対して、聴取者は正しく位置づけられた聴取位置における聴感覚を得る。
方向に依存するディジタルフィルタリングを実現する最も簡単な代案は、ある増幅率を選択された各方向に割り当てる(attatch)ことである。しかし、そのとき音の高低は考慮されない。より改良された代案では、観測される周波数帯域は小帯域に分割され、各小帯域について選択された各方向においてそれら独自の増幅率が与えられる。さらに改良されたバージョンでは、観測される各方向は一般化された伝達関数によってモデル化され、その伝達関数に対応して同じ伝達関数の再構成を可能にするある係数の組が指示される。
以下において、例として示される好適な実施態様および図面を参照することにより、本発明はより詳細に説明される。
従来技術に関連づけて、図1〜2の例示が前段でなされ、以下の本発明の記述では、好ましい例示が図3〜7bになされている。
図3は、ポイント300に在る音源の場所とゼロ方位の方向301を示す。図において、ポイント300に位置する音源を4つのフィルタで表わすものと仮定する。第1のフィルタは音源から方向302に伝播する音を表わし、第2のフィルタは音源から方向303に伝播する音を表わし、第3のフィルタは音源から方向304に伝播する音を表わし、そして第4のフィルタは音源から方向305に伝播する音を表わす。さらに図において、音はゼロ方位の方向301に対して対称に伝播すると仮定される。その結果実際に、方向302〜305の各々は、観測される方向を表わす半径をゼロ方位の方向301を中心として回転することによって得られる円錐形の面上のいずれかの対応する方向を表わす。本発明はこれらの仮定に限定されるものではなく、本発明のいくつかの特徴は簡易化された実施の形態を先ず検討することによってより容易に理解される。図において、方向302〜305は同じ平面内で等距離だけ離れた直線として示されているが、方向は任意に選択され得る。
図3に示されたゼロ方位方向と異なる方向に伝播する音を表わす各フィルタは、ブロック306、307、308および309によって記号的に示される。各フィルタはある伝達関数Hi(ここで、i∈{1,2,3,4})によって特徴づけられる。フィルタの伝達関数は、ゼロ方位に対して伝播する音が音源によって前述のように発生する音と同じであるように正規化される。通常、音は時間の関数なので、音源によって発生する音はX(t)と表わされる。各フィルタ306〜309は次式による応答Yi(t)(ここで、i∈{1,2,3,4})を生成する。
Yi(t)=Hi*X(t) (1)
ここで、*は時間に対する重畳積分(コンボルーション)を表わす。応答Yi(t)は当該方向を向いている音である。
最も簡単な形では、伝達関数は、インパルスX(t)は実数によって逓倍されることを意味する。最も強い音が向く方向としてゼロ方位を選定することが自然なので、各フィルタ306〜309の最も簡単な伝達関数は、ゼロと1とのあいだの実数(両限界値を含む)である。
簡単な実数による逓倍は指向性に対する音の高低の重要性を考慮していない。より汎用性のある伝達関数ではインパルスは所定の周波数帯域に分割され、各周波数帯域は実数であるそれぞれの増幅率によって逓倍される。周波数帯域はその周波数帯域の最高周波数を表わす1つの数字によって規定され得る。代替として、ある複数の実数係数がいくつかの周波数例に対してここに示され得る。これによって、適当な補間がこれらの周波数間に適用される(たとえば、周波数400Hzと増幅率0.6、および周波数1000Hzと増幅率0.2が与えられた場合に、直接補間によって周波数700Hzに対して増幅率0.4を得る)。
一般に、各フィルタ306〜309は、Z変換H(z)によって表わされる伝達関数Hを有するあるIIRまたはFIRフィルタ(Infinite Impulse Response; Finite Impulse Response)であるということができる。インパルスX(t)のZ変換X(t)とインパルスY(t)のZ変換Y(t)によって、つぎの定義を得る。
Figure 2009055621
これによって、任意の伝達関数を表わすためにZ変換のモデル化に使用される係数[b01122・・・]を表わすだけで充分である。加算で使われている上限NとMは、伝達関数を規定するのに必要とされる精度を表わす。実際には、それらは各単一伝達関数をモデル化するために使用される係数を格納および/または伝送システムで伝送するためにどれくらいの大きさの容量が利用できるかによって決定される。
図4は、トランペットによって発生される音がどのように向いているかを示す。それはゼロ方位によって表現され、8つの周波数に依存する伝達関数とそれらのあいだの補間を有する。音が指向性を与えられる様子は、垂直軸が音量をデシベルで表わし、第1の水平軸が方向角をゼロ方位に対する角度で表わし、第2の水平軸が音の周波数をキロヘルツで表わす三次元座標系においてモデル化される。補間のため、音は面400によって表わされる。図の上左端で、面400は水平線401によって制限され、それは音量がゼロ方位方向において周波数に依存しないことを表現している。上右端で、面400はほぼ水平な線402によって制限され、それは音量が非常に低い周波数(0Hzに近い周波数)において方向角に依存しないことを示している。様々な方向角を表わすフィルタの周波数応答は、線402から出発し図の左下方へ斜めに延びる曲線である。方向角は等距離であり、それらの大きさは22.5°、45°、67.5°、90°、112.5°、135°、157.5°、および180°である。たとえば、曲線403は音量をゼロ方位から測定された角度157.5°で伝播する音に関する周波数の関数として表わし、この曲線はこの方向において最高周波数は低周波数よりもより大きく減衰することを示している。
本発明は、仮想音響環境がコンピュータメモリーで生成されて同じ結合で処理されるか、またはそれがDVDディスク(Digital Versatile Disc)のような記憶媒体から読み出されて、視聴覚表現手段(ディスプレイ、スピーカ)を介してユーザに再生する局所的な装置における再生に適している。さらに本発明は、仮想音響環境がいわゆるサービスプロバイダの装置で生成されて伝送装置を経由してユーザへ伝送されるシステムに適用できる。本発明にもとづいた方法で処理される指向性音響をユーザに対して再生し、ユーザが再生音を聴きたいと欲する仮想音響環境内のポイントを選択できる装置は、一般に受信装置と称される。この用語は本発明に限定されるものではない。
ユーザが再生音を聴きたいと欲する仮想音響環境内のポイントについての情報を受信装置に与えた場合に、受信装置は音がどの方向に音源から前記ポイントへ向けられるかを決定する。図4では、グラフで示すように、受信装置が音源のゼロ方位と観測ポイントの方向のあいだの角度を決定した場合に、面400を周波数軸に平行な垂直な面で切断し、方向角軸をゼロ方位と観測ポイントとのあいだの角度であるその値で切断することを意味する。面400と前記垂直な面とのあいだのセクションは、観測ポイントの方向で検出される音の相対的音量を周波数の関数として表わす曲線である。受信装置は前記曲線にもとづいた周波数応答を実現するフィルタを形成し、音源によって発生された音をユーザに向けて再生される前にそれが形成したフィルタを通してユーザに向ける。ユーザが観測ポイントの位置を変更することを決定した場合に、受信装置は新しい曲線を決定して上述のように新しいフィルタを生成する。
図5は、様々に向けられている3つの仮想音源501、502、および503を有する仮想音響環境500を示す。ポイント504はユーザによって選ばれた観測ポイントを示す。図5に示された状況を説明するために、本発明にもとづいて、各音源501、502、および503について音がどのように向けられるかを表わす独自のモデルが生成され、それによって各ケースにおけるモデルはほぼ図3および4の通りであり得るが、ゼロ方位はモデルにおける各仮想音源について異なる方向を有することを考慮する。この場合には、音がどのように向けられるかを考慮するために、受信装置は3つの別々のフィルタを生成する必要がある。第1のフィルタを生成するために、第1の音源によって伝送される音がどのように向けられるかをモデル化する伝達関数が決定されて、これらの伝達関数と補間の助けによって図4のような面が生成される。さらに、観測ポイントの方向と音源501のゼロ方位とのあいだの角度が決定されて、この角度の助けによって上記面上の前記方向における周波数応答を読み取ることができる。同じオペレーションが各音源について別々に繰り返される。ユーザに再生される音は3つの音源すべてからの音の和であり、この和において各音は前記音がどのように向けられるかをモデル化するそれぞれのフィルタでろ波されている。
本発明にもとづいて、実際の音源に加えて音の反射、特に早期反射もモデル化することができる。図5で、虚音源法によって形成される虚音源506は、音源503によって伝送される音がどのように近傍の壁から反射されるかを表わす。
この虚音源は本発明にもとづいて実際の音源と全く同じ様に処理され得る、いいかえれば、それについてゼロ方位の方向およびゼロ方位方向と異なる方向における音の指向性(必要な場合は周波数に依存)を決定することができる。受信装置は実際の音源によって発生された音に対して使用したものと同じ原理で虚音源によって発生された音を再生する。
図6は送信装置601および受信装置602を有するシステムを示す。送信装置601は、少なくとも1つの音源および少なくとも1つの空間の音響特性を含むある仮想音響環境を生成し、その環境を受信装置602にある形式で伝える。伝送は、たとえばディジタルラジオ、テレビ放送、またはデータネットワークで行なわれ得る。また伝送は、送信装置601はすでに生成されている仮想音響環境にもとづいてDVDディスク(Digital Versatile Disc)のような記録を生成し、受信装置のユーザはこの記録を使用時に入手するということをも意味し得る。記録として引き渡される典型的な応用は、音源が仮想楽器を含むオーケストラによるコンサートであり、空間が電気的にモデル化された仮想または実際のコンサートホールであり、それによって装置を持った受信装置のユーザがホール内の様々な場所で演奏がどのように聞こえるかを聴くことができる。この仮想環境が視聴覚的である場合には、コンピュータグラフィックスによって実現される視覚表示部も含む。本発明では、送信装置と受信装置が異なる装置である必要はなく、ユーザは特定の仮想音響環境を1つの装置で生成し、彼自身が生成したものを試聴するために同じ装置を使用することができる。
図6に示された実施の形態において、送信装置のユーザは、コンピュータグラフィックス・ツール603および対応するツール604を備える仮想オーケストラのプレーヤと楽器のようなビデオアニメーションの助けによって、コンサートホールのようなある視覚環境を生成する。さらに、彼はキーボード605を介して彼が生成した環境の音源のある指向性、できれば音が周波数に依存してどのように向けられるかを表わす伝達関数を入力する。音がどのように向けられるかのモデル化も実際の音源について行なわれた測定にもとづいて行なわれ得る。そのとき、指向性情報は通常データベース606から読み出される。仮想楽器の音はデータベース606からロードされる。送信装置はユーザによって入力された情報を処理し、ブロック607、608、609、および610内でビットストリームに変換して、そのビットストリームをマルチプレクサ611内で1つのデータストリームに結合する。そのデータストリームは、受信装置602にある形式で供給される。デマルチプレクサ612では、データストリームから静止環境を表わす画像セクションをブロック613に、時間に依存する画像セクションまたはアニメーションをブロック614に、時間に依存する音をブロック615に、そして面を表わす係数をブロック616に分離する。画像セクションは表示ドライバブロック617において結合されてディスプレイ618に供給される。音源から伝えられた音を表わす信号は、ブロック615からフィルタバンク619に供給される。フィルタバンク619は、ブロック616から得られるパラメータaおよびbの助けによって再構成される伝達関数を有するフィルタを備えている。フィルタバンクによって発生される音はヘッドセット620に供給される。
図7aおよび7bは、本発明にもとづく方法で仮想音響環境を実現できる受信装置のフィルタの構成をより詳細に示す。また、本発明にもとづく音の指向性のモデル化だけでなく、音処理に関する他のファクタも図において考慮されている。遅延手段721は様々な音成分の相互時間差(たとえば、様々な経路に沿って反射された音、または様々な距離に位置する仮想音源の相互時間差)を生成する。同時に遅延手段721は、正しい音を正しいフィルタ722、723、および724に向けるデマルチプレクサとして動作する。フィルタ722、723、および724は、より詳細に図7bに記述されているパラメータで特徴づけられたフィルタである。それらによって供給される信号は、一方ではフィルタ701、702、および703に分岐され、他方では加算器と増幅器704を経由して加算器705に分岐され、それはエコー分岐706、707、708、および709と、加算器710と、増幅器711、712、713、および714とともに結合を形成し、それによってポストエコーがある信号に対して生成され得る。フィルタ701、702、および703は、たとえばHRTFモデル(Head-Related Transfer Function)にもとづいた様々な方向における聴取者の聴感覚の差異を考慮する指向性フィルタである。また、フィルタ701、702、および703は、様々な方向から聴取者の耳に届く音成分の相互時間差をモデル化するいわゆるITD遅延(Interaural Time Difference)を含んでいることが最も好ましい。
フィルタ701、702、および703において、各信号成分は左右のチャンネルに分割され、また、マルチチャンネルシステムでは一般にNチャンネルに分割される。あるチャンネルに関連するすべての信号は加算器715または716で結合され、加算器717または718へ向けられて、そこで各信号に属するポストエコーが信号に加えられる。ライン719および720はスピーカまたはヘッドセットに通ずる。図7aにおいて、フィルタ723とフィルタ724とのあいだおよびフィルタ702とフィルタ703とのあいだの点は、本発明は受信装置のフィルタバンク内のフィルタの数を制限しないことを意味する。モデル化された仮想音響環境の複雑さに応じて数百または数千のフィルタがあってもよい。
図7bは、図7aに示されたパラメータで特徴づけられるフィルタ722を実現する可能性をより詳細に示す。図7bにおいて、フィルタ722は3つの連続するフィルタ段730、731、および732を含み、そのうちの第1のフィルタ段730は媒体(通常は空気)中の伝播減衰を表わし、第2段731は反射材料(それは反射をモデル化する場合にとくに適用される)で起きる吸収を表わし、そして第3段732は音が音源から(ことによると反射面を経由して)観測ポイントまで媒体中を伝播する距離と空気の湿度、圧力、および温度のような媒体の特性の両方を考慮する。距離を計算するために、第1段730は送信装置からモデル化対象の空間の座標系における音源の位置に関する情報を、そして受信装置からユーザが観測ポイントとして選定したポイントの座標に関する情報を得る。第1段730は送信装置または受信装置のどちらかから媒体の特性を表わすデータを得る(受信装置のユーザは所要の媒体特性を設定することができる)。デフォルトとして、第2段731は送信装置から反射面の吸収を表わす係数を得るが、またこの場合に受信装置のユーザはモデル化された空間の特性を変更する可能性を与えられ得る。第3段732は音源によって伝送された音がどのように音源からモデル化された空間内の様々な方向に向けられるかを考慮する。したがって、第3段732は本特許出願で提示される本発明を実現する。
仮想音響環境の特性がパラメータを使用することによって1つの装置から別の装置へどのように処理されて伝送されるかを一般的に上述した。つぎに、本発明がどのようにあるデータ伝送形式に適用されるかを論ずる。マルチメディアはユーザに対する視聴覚対象の相互同期した提示を意味する。会話形式のマルチメディア提示が、たとえば娯楽や電子会議の形式として将来広く普及すると考えられる。従来技術には、電気的形式でマルチメディアプログラムを伝送する様々な方法を規定する多数の規格がある。本特許出願において、いわゆるMPEG(Motion Picture Experts Group)規格を詳しく論ずる。その規格のうちの本特許出願が提出された時に作成中のMPEG−4規格は、伝送されるマルチメディア提示がある視聴覚環境をともに形成する実際または仮想の対象を含むことができるという目標を有する。本発明はMPEG−4規格と接続して使用されることに決して限定されないばかりでなく、たとえばVRML97規格の拡張に、または現在は未知である将来の視聴覚規格にさえも適用され得る。
MPEG−4規格にもとづくデータストリームは、時間(合成音のような)およびパラメータ(モデル化対象の空間における音源の位置のような)が連続しているセクションを含むことができる多重化視聴覚対象を含む。対象は階層的であるように規定され得るので、いわゆるプリミティブ(primitive)は階層の最低レベルにある。対象のほかに、MPEG−4規格にもとづくマルチメディアプログラムは、対象の相互関係に関する情報およびプログラムの一般的設定の配列に関する情報を含むいわゆる場面記述(scene description)を含み、非常に便利なことにそれらの情報は実際の対象から別々に符号化されたり復号化されたりする。また場面記述はBIFSセクション(場面記述に対する2進フォーマット)と称される。本発明にもとづく仮想音響環境の伝送は、MPEG−4規格(SAOL/SASL: Structured Audio Orchestra Language / Structured Audio Score Language)またはVRML97言語で規定される構造化音声言語を使用することによって有利に実現される。
上述の言語において、音源をモデル化する音ノード(sound node)が目下規定されている。本発明によれば既知の音ノードの拡張を規定することが可能であり、本特許出願においてそれは指示音ノード(DirectiveSound node)と称される。既知の音ノードのほかに、指向性フィールドと称されて音の指向性を表わすフィルタを再構成するのに必要な情報を供給するフィールドをさらに含む。フィルタをモデル化する3つの異なる代案が上述された。以下に、これらの代案が本発明にもとづく指示音ノードの指向性フィールドにおいてどのように実現されるかを説明する。
第1の代案によれば、あるゼロ方位とは異なる方向をモデル化する各フィルタは、0と1とのあいだの正規化実数である増幅率による簡単な逓倍に対応する。そのとき、指向性フィールドの内容は、たとえばつぎのようである。
((0.79 0.8)(1.57 0.6)(2.36 0.4)(3.14 0.2))
この代案において、指向性フィールドは音源モデルにおけるゼロ方位と異なる複数の方向と同数の数値の対を含む。数値の対の第1の数値は注目している方向とゼロ方位とのあいだの角度をラジアンで示し、第2の数値は前記方向における増幅率を示す。
第2の代案によれば、ゼロ方位の方向と異なる各方向における音は周波数帯域に分割されて、その各々は独自の増幅率を有する。指向性フィールドの内容は、たとえばつぎのようである。
((0.79 125.0 0.8 1000.0 0.6 4000.0 0.4)
(1.57 125.0 0.7 1000.0 0.5 4000.0 0.3)
(2.36 125.0 0.6 1000.0 0.4 4000.0 0.2)
(3.14 125.0 0.5 1000.0 0.3 4000.0 0.1))
この代案において、指向性フィールドは音源モデルにおけるゼロ方位と異なる複数の方向と同数の内括弧によって互いに分けられている数値のセットを含む。各数値のセットにおいて、第1の数値は注目している方向とゼロ方位とのあいだの角度をラジアンで示す。第1の数値の後に数値の対があり、それらの第1のものはある周波数をヘルツで示し、第2のものは増幅率である。たとえば、数値のセット(0.79 125.0 0.8 1000.0 0.6 4000.0 0.4)は、0.79ラジアン方向において0.8の増幅率が周波数0〜125Hzに対して使用され、0.6の増幅率が周波数125〜1000Hzに対して使用されて、0.4の増幅率が周波数1000〜4000Hzに対して使用されると解釈され得る。代案として、上述の数のセットは0.79ラジアン方向において増幅率は周波数125Hzで0.8であり、増幅率は周波数1000Hzで0.6であり、増幅率は周波数4000Hzで0.4であり、そして他の周波数における増幅率はこれらから内挿法および外挿法によって計算されることを意味する表記法を使用することが可能である。本発明に関して、使用される表記法が送信装置と受信装置の両方にとって既知である限り、どの表記法が使用されるかは本質的ではない。
第3の代案によれば、伝達関数はゼロ方位と異なる各方向に適用されて、伝達関数を規定するためにそのZ変換の係数aおよびbが与えられる。指向性フィールドの内容は、たとえばつぎのようである。
((45 b45.045.145.145.245.2 …)
(90 b90.090.190.190.290.2 …)
(135 b135.0135.1135.1135.2135.2 …)
(180 b180.0180.1180.1180.2180.2 …))
この代案においても、指向性フィールドは音源モデルにおけるゼロ方位の方向とは異なる複数の方向と同数の内括弧によって互いに分けられている数値のセットを含む。各数値のセットにおいて、第1の数は注目している方向とゼロ方位とのあいだの角度を今回は度で示す。この場合に、上述の場合のように他の既知の角度単位も同様に使用することが可能である。第1の数値の後に、注目している方向に使用される伝達関数のZ変換を決定する係数aおよびbがある。各数値のセットの後のポイントは、本発明は伝達関数のZ変換を規定する係数aおよびbの数についていかなる制限も課さないことを意味する。様々な各数値のセットにおいて、様々な数の係数aおよびbが有り得る。第3の代案において、係数aおよびbもそれらの独自のベクトルとして与えられ得る。そのために、FIRまたは全極IIRフィルタの効率的なモデル化が、出版物エリス、エス.(Ellis, S.)1998:「VMRLにおけるより現実的な音に向けて(Towards more realistic sound in VMRL)」、Proc. VRML'98, アメリカ合衆国、マネー、1998年2月16〜19日、95〜100頁と同じ方法で可能となるだろう。
上に提示された本発明の実施の形態は、勿論例として意図されたにすぎないし、それらは本発明を制限するのになんの影響も有しない。とくにフィルタを表わすパラメータが指示音ノード(DirectiveSound node)の指向性フィールドにおいて配列される方法は、非常に多くの方法で選定され得る。
既知の指向性音響モデルを示す図である。 他の既知の指向性音響モデルを示す図である。 本発明にもとづく指向性音響モデルを概略的に示す図である。 本発明にもとづくモデルによって生成された音がどのような方向に向けられるかを表わすグラフである。 本発明がどのように仮想音響環境に適用されるかを示す図である。 本発明にもとづくシステムを示す図である。 本発明にもとづくシステムの一部をより詳細に示す図である。 図7aの細部を示す図である。

Claims (1)

  1. 電子装置において、仮想音響環境を処理する方法であり、それによって該仮想音響環境が少なくとも1つの音源(300)を含む方法であって、音がどのような方向に向けられるかをモデル化するために、フィルタの組(306、307、308、309)が音に及ぼす影響が各フィルタの所定のパラメータに依存するように、方向に依存するフィルタの組を音源に対応して設けることを特徴とする仮想音響環境を処理する方法。
JP2008250770A 1998-03-23 2008-09-29 仮想音響環境において指向性音響を処理する方法 Pending JP2009055621A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FI980649A FI116505B (fi) 1998-03-23 1998-03-23 Menetelmä ja järjestelmä suunnatun äänen käsittelemiseksi akustisessa virtuaaliympäristössä

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2000538346A Division JP4573433B2 (ja) 1998-03-23 1999-03-23 仮想音響環境において指向性音響を処理する方法およびシステム

Publications (1)

Publication Number Publication Date
JP2009055621A true JP2009055621A (ja) 2009-03-12

Family

ID=8551352

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2000538346A Expired - Lifetime JP4573433B2 (ja) 1998-03-23 1999-03-23 仮想音響環境において指向性音響を処理する方法およびシステム
JP2008250770A Pending JP2009055621A (ja) 1998-03-23 2008-09-29 仮想音響環境において指向性音響を処理する方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2000538346A Expired - Lifetime JP4573433B2 (ja) 1998-03-23 1999-03-23 仮想音響環境において指向性音響を処理する方法およびシステム

Country Status (11)

Country Link
US (1) US7369668B1 (ja)
EP (1) EP1064647B1 (ja)
JP (2) JP4573433B2 (ja)
KR (1) KR100662673B1 (ja)
CN (1) CN1132145C (ja)
AT (1) ATE361522T1 (ja)
AU (1) AU2936999A (ja)
DE (1) DE69935974T2 (ja)
ES (1) ES2285834T3 (ja)
FI (1) FI116505B (ja)
WO (1) WO1999049453A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012065264A (ja) * 2010-09-17 2012-03-29 Denso Corp 立体音場生成装置

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FI116505B (fi) * 1998-03-23 2005-11-30 Nokia Corp Menetelmä ja järjestelmä suunnatun äänen käsittelemiseksi akustisessa virtuaaliympäristössä
US6668177B2 (en) 2001-04-26 2003-12-23 Nokia Corporation Method and apparatus for displaying prioritized icons in a mobile terminal
US7032188B2 (en) 2001-09-28 2006-04-18 Nokia Corporation Multilevel sorting and displaying of contextual objects
US6996777B2 (en) 2001-11-29 2006-02-07 Nokia Corporation Method and apparatus for presenting auditory icons in a mobile terminal
US6934911B2 (en) 2002-01-25 2005-08-23 Nokia Corporation Grouping and displaying of contextual objects
JP2005094271A (ja) * 2003-09-16 2005-04-07 Nippon Hoso Kyokai <Nhk> 仮想空間音響再生プログラムおよび仮想空間音響再生装置
JP4516527B2 (ja) * 2003-11-12 2010-08-04 本田技研工業株式会社 音声認識装置
US9319820B2 (en) * 2004-04-16 2016-04-19 Dolby Laboratories Licensing Corporation Apparatuses and methods for use in creating an audio scene for an avatar by utilizing weighted and unweighted audio streams attributed to plural objects
JP4789145B2 (ja) * 2006-01-06 2011-10-12 サミー株式会社 コンテンツ再生装置及びコンテンツ再生プログラム
JP4894386B2 (ja) * 2006-07-21 2012-03-14 ソニー株式会社 音声信号処理装置、音声信号処理方法および音声信号処理プログラム
JP5082327B2 (ja) * 2006-08-09 2012-11-28 ソニー株式会社 音声信号処理装置、音声信号処理方法および音声信号処理プログラム
GB0724366D0 (en) * 2007-12-14 2008-01-23 Univ York Environment modelling
JP5397131B2 (ja) * 2009-09-29 2014-01-22 沖電気工業株式会社 音源方向推定装置及びプログラム
US8810598B2 (en) 2011-04-08 2014-08-19 Nant Holdings Ip, Llc Interference based augmented reality hosting platforms
WO2012168765A1 (en) * 2011-06-09 2012-12-13 Sony Ericsson Mobile Communications Ab Reducing head-related transfer function data volume
JP2015501984A (ja) 2011-11-21 2015-01-19 ナント ホールディングス アイピー,エルエルシー 加入請求書サービス、システムおよび方法
CN103152500B (zh) * 2013-02-21 2015-06-24 黄文明 多方通话中回音消除方法
US9582516B2 (en) 2013-10-17 2017-02-28 Nant Holdings Ip, Llc Wide area augmented reality location-based services
WO2018077379A1 (en) * 2016-10-25 2018-05-03 Huawei Technologies Co., Ltd. Method and apparatus for acoustic scene playback
KR102113542B1 (ko) 2017-11-30 2020-05-21 서울과학기술대학교 산학협력단 심층신경망을 이용하여 음향 신호를 정규화하는 방법
US10705790B2 (en) * 2018-11-07 2020-07-07 Nvidia Corporation Application of geometric acoustics for immersive virtual reality (VR)
CN114630240B (zh) * 2022-03-16 2024-01-16 北京小米移动软件有限公司 方向滤波器的生成方法、音频处理方法、装置及存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06292298A (ja) * 1993-03-31 1994-10-18 Sega Enterp Ltd 聴覚特性及びモニター環境を考慮した三次元仮想音像形成装置
JPH06335096A (ja) * 1993-05-21 1994-12-02 Sony Corp 音場再生装置
JPH0793367A (ja) * 1993-09-28 1995-04-07 Atsushi Matsushita 音声情報検索システム及び装置
JPH08265900A (ja) * 1995-03-27 1996-10-11 Sharp Corp 音像定位制御装置
JPH08272380A (ja) * 1995-03-30 1996-10-18 Taimuuea:Kk 仮想3次元空間音響の再生方法および装置
WO1997000514A1 (fr) * 1995-06-16 1997-01-03 Sony Corporation Procede et appareil de generation de son
JPH09102051A (ja) * 1995-10-09 1997-04-15 Nippon Telegr & Teleph Corp <Ntt> 音場制御方法および装置
JPH1070796A (ja) * 1996-08-29 1998-03-10 Fujitsu Ltd 立体音響処理装置
JP2002508609A (ja) * 1998-03-23 2002-03-19 ノキア モービル フォーンズ リミテッド 仮想音響環境において指向性音響を処理する方法およびシステム

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4731848A (en) 1984-10-22 1988-03-15 Northwestern University Spatial reverberator
US5285165A (en) 1988-05-26 1994-02-08 Renfors Markku K Noise elimination method
FI90166C (fi) 1991-10-16 1993-12-27 Nokia Mobile Phones Ltd Cmos-kompander
FI89846C (fi) 1991-11-29 1993-11-25 Nokia Mobile Phones Ltd En deviationsbegraensare foer en fraon en radiotelefon utsaend signal
FI92535C (fi) 1992-02-14 1994-11-25 Nokia Mobile Phones Ltd Kohinan vaimennusjärjestelmä puhesignaaleille
DE69322805T2 (de) 1992-04-03 1999-08-26 Yamaha Corp. Verfahren zur Steuerung von Tonquellenposition
JP3636361B2 (ja) 1992-07-07 2005-04-06 レイク・テクノロジイ・リミテッド 高精度及び高効率を有するディジタルフィルタ
JP3578783B2 (ja) 1993-09-24 2004-10-20 ヤマハ株式会社 電子楽器の音像定位装置
US5485514A (en) 1994-03-31 1996-01-16 Northern Telecom Limited Telephone instrument and method for altering audible characteristics
US5659619A (en) 1994-05-11 1997-08-19 Aureal Semiconductor, Inc. Three-dimensional virtual audio display employing reduced complexity imaging filters
US5684881A (en) 1994-05-23 1997-11-04 Matsushita Electric Industrial Co., Ltd. Sound field and sound image control apparatus and method
FR2736499B1 (fr) 1995-07-03 1997-09-12 France Telecom Procede de diffusion d'un son avec une directivite donnee
FR2738099B1 (fr) 1995-08-25 1997-10-24 France Telecom Procede de simulation de la qualite acoustique d'une salle et processeur audio-numerique associe
US5790957A (en) 1995-09-12 1998-08-04 Nokia Mobile Phones Ltd. Speech recall in cellular telephone
FI102337B (fi) 1995-09-13 1998-11-13 Nokia Mobile Phones Ltd Menetelmä ja piirijärjestely audiosignaalin käsittelemiseksi
FI100840B (fi) 1995-12-12 1998-02-27 Nokia Mobile Phones Ltd Kohinanvaimennin ja menetelmä taustakohinan vaimentamiseksi kohinaises ta puheesta sekä matkaviestin
DE19646055A1 (de) 1996-11-07 1998-05-14 Thomson Brandt Gmbh Verfahren und Vorrichtung zur Abbildung von Schallquellen auf Lautsprecher
JP3266020B2 (ja) * 1996-12-12 2002-03-18 ヤマハ株式会社 音像定位方法及び装置
FI116990B (fi) 1997-10-20 2006-04-28 Nokia Oyj Menetelmä ja järjestelmä akustisen virtuaaliympäristön käsittelemiseksi

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06292298A (ja) * 1993-03-31 1994-10-18 Sega Enterp Ltd 聴覚特性及びモニター環境を考慮した三次元仮想音像形成装置
JPH06335096A (ja) * 1993-05-21 1994-12-02 Sony Corp 音場再生装置
JPH0793367A (ja) * 1993-09-28 1995-04-07 Atsushi Matsushita 音声情報検索システム及び装置
JPH08265900A (ja) * 1995-03-27 1996-10-11 Sharp Corp 音像定位制御装置
JPH08272380A (ja) * 1995-03-30 1996-10-18 Taimuuea:Kk 仮想3次元空間音響の再生方法および装置
WO1997000514A1 (fr) * 1995-06-16 1997-01-03 Sony Corporation Procede et appareil de generation de son
JPH09102051A (ja) * 1995-10-09 1997-04-15 Nippon Telegr & Teleph Corp <Ntt> 音場制御方法および装置
JPH1070796A (ja) * 1996-08-29 1998-03-10 Fujitsu Ltd 立体音響処理装置
JP2002508609A (ja) * 1998-03-23 2002-03-19 ノキア モービル フォーンズ リミテッド 仮想音響環境において指向性音響を処理する方法およびシステム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012065264A (ja) * 2010-09-17 2012-03-29 Denso Corp 立体音場生成装置

Also Published As

Publication number Publication date
JP4573433B2 (ja) 2010-11-04
US7369668B1 (en) 2008-05-06
AU2936999A (en) 1999-10-18
FI980649A0 (fi) 1998-03-23
CN1132145C (zh) 2003-12-24
KR100662673B1 (ko) 2006-12-28
KR20010034650A (ko) 2001-04-25
ATE361522T1 (de) 2007-05-15
DE69935974D1 (de) 2007-06-14
ES2285834T3 (es) 2007-11-16
JP2002508609A (ja) 2002-03-19
WO1999049453A1 (en) 1999-09-30
DE69935974T2 (de) 2007-09-06
FI116505B (fi) 2005-11-30
CN1302426A (zh) 2001-07-04
EP1064647B1 (en) 2007-05-02
FI980649A (fi) 1999-09-24
EP1064647A1 (en) 2001-01-03

Similar Documents

Publication Publication Date Title
JP4573433B2 (ja) 仮想音響環境において指向性音響を処理する方法およびシステム
KR100440454B1 (ko) 가상 음향 환경을 처리하는 방법 및 시스템
Serafin et al. Sonic interactions in virtual reality: State of the art, current challenges, and future directions
Jot et al. Rendering spatial sound for interoperable experiences in the audio metaverse
US7706544B2 (en) Audio reproduction system and method for reproducing an audio signal
KR100551605B1 (ko) 음원을 스피커로 프로젝팅하는 방법과 장치
EP1025743A4 (en) USE OF FILTERING EFFECTS IN STEREO HEADPHONE EQUIPMENT TO IMPROVE THE SPACE OF A SOUNDPROOF AT A HÖZER
US20070160216A1 (en) Acoustic synthesis and spatialization method
JPH07212898A (ja) 音声再生装置
JP6246922B2 (ja) 音響信号処理方法
JP7453248B2 (ja) オーディオ装置およびその処理の方法
JP2003061200A (ja) 音声処理装置及び音声処理方法、並びに制御プログラム
Huopaniemi et al. DIVA virtual audio reality system
JP2001186599A (ja) 音場創出装置
RU2804014C2 (ru) Аудиоустройство и способ для него
WO2022113394A1 (ja) ライブデータ配信方法、ライブデータ配信システム、ライブデータ配信装置、ライブデータ再生装置、およびライブデータ再生方法
WO2022113393A1 (ja) ライブデータ配信方法、ライブデータ配信システム、ライブデータ配信装置、ライブデータ再生装置、およびライブデータ再生方法
Geronazzo Sound Spatialization.
Gutiérrez A et al. Audition
Stewart Spatial auditory display for acoustics and music collections
Funkhouser et al. SIGGRAPH 2002 Course Notes “Sounds Good to Me!” Computational Sound for Graphics, Virtual Reality, and Interactive Systems
KR20060131806A (ko) 음향 합성 및 공간화 방법

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090519

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20090819

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20090824

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090916

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100323

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100622

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20100622

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100713