JP2012509632A5 - オーディオ信号を変換するためのコンバータ及び方法 - Google Patents
オーディオ信号を変換するためのコンバータ及び方法 Download PDFInfo
- Publication number
- JP2012509632A5 JP2012509632A5 JP2011536881A JP2011536881A JP2012509632A5 JP 2012509632 A5 JP2012509632 A5 JP 2012509632A5 JP 2011536881 A JP2011536881 A JP 2011536881A JP 2011536881 A JP2011536881 A JP 2011536881A JP 2012509632 A5 JP2012509632 A5 JP 2012509632A5
- Authority
- JP
- Japan
- Prior art keywords
- transfer function
- signal
- simplified
- input
- channels
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 title claims description 6
- 230000005284 excitation Effects 0.000 claims 5
- 230000000875 corresponding Effects 0.000 claims 1
- 238000004088 simulation Methods 0.000 description 7
- 230000003287 optical Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 210000000883 Ear, External Anatomy 0.000 description 1
- 210000003128 Head Anatomy 0.000 description 1
- 108010009740 Vp16-Jazz protein Proteins 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000004059 degradation Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000000034 method Methods 0.000 description 1
Description
そのようなモデルは、「録音された音楽に空間的印象を付加する一例:バイノーラル・インパルス応答との信号畳み込み」と題する非特許文献1によって知られ、この場合、音響環境がコンバータ内でオーディオ信号を伝達関数と畳み込むことによってシミュレートされ、音響環境のこのモデルが形成される。Nチャネルの各々に対して、一組の畳み込みが確立されてMチャネルの各々に対する残響が計算され、その結果Mチャネルを通して再生される音声が、モデル化された音響環境内で録音されたかのように知覚される。
米国ニューヨークのAudio Engineering Societyのジャーナル、1993年11月1日付けのNo.11、第41巻、894から904頁のAhnert W氏らによる「EARS Auralization Software」は、技術者用の電子的-音響的シミュレータ(EASE)に関連して用いるための電子的に聴覚化されたルームシミュレーション(EARS)について開示している。EASE2.0のルームシミュレーションから、シミュレートされたモノラルのルームインパルス応答は、指向性情報すなわち放射の方向を備えて作成されている。応答は、EASEポスト処理ファイルに記憶することができ、部屋の選ばれた視聴位置及びシミュレートされる視聴者の頭の方向の関数として両耳用の聴覚化を導出するように外耳伝達関数で畳み込みをすることができる。
ACM TUS LNKD−DOI:10.1145.1015706.1015710、ACM Transactions on Graphices、2004年8月1付けのNo.3、第23巻、249から258頁のTsingosN氏らによる「Perceptual Audio Rendering of Complex Virtual Wnvironments」は、何百もの動きのある音源を含む複雑な仮想シーンに対するリアルタイム3Dオーディオレンダリングパイプラインを開示している。10倍以上の音源数がコンシューマ3Dオーディオハードウェアで利用可能であり、オーディオ品質の最小限の減少での聴覚の選択除去及び空間的な詳細度により処理することができる。述べられている方法は、室内及び室外環境の両方に対して良好に実現され、相互のアーキテクチャの音響シミュレーション及びビデオゲームの自動3D音声管理を含む多くのアプリケーションに対してオーディオハードウェアの制限された能力に影響を与える。聞こえない音源は、動的に排除され、残存する可聴の音源は、多くのクラスタにグループ化される。各クラスタは、1つの知覚的な基準を用いて位置決めされる1つの偽音源によって表される。空間的な音声処理は、その後、その偽音源のみに関して実行され、それによって、計算上のコストを低減する。音声品質の制限された劣化及び局所的欠陥が取得されるが、それはクラスタで大きく異なるものである。
米国ニューヨークのAudio Engineering Societyのジャーナル、1993年11月1日付けのNo.11、第41巻、894から904頁のAhnert W氏らによる「EARS Auralization Software」は、技術者用の電子的-音響的シミュレータ(EASE)に関連して用いるための電子的に聴覚化されたルームシミュレーション(EARS)について開示している。EASE2.0のルームシミュレーションから、シミュレートされたモノラルのルームインパルス応答は、指向性情報すなわち放射の方向を備えて作成されている。応答は、EASEポスト処理ファイルに記憶することができ、部屋の選ばれた視聴位置及びシミュレートされる視聴者の頭の方向の関数として両耳用の聴覚化を導出するように外耳伝達関数で畳み込みをすることができる。
ACM TUS LNKD−DOI:10.1145.1015706.1015710、ACM Transactions on Graphices、2004年8月1付けのNo.3、第23巻、249から258頁のTsingosN氏らによる「Perceptual Audio Rendering of Complex Virtual Wnvironments」は、何百もの動きのある音源を含む複雑な仮想シーンに対するリアルタイム3Dオーディオレンダリングパイプラインを開示している。10倍以上の音源数がコンシューマ3Dオーディオハードウェアで利用可能であり、オーディオ品質の最小限の減少での聴覚の選択除去及び空間的な詳細度により処理することができる。述べられている方法は、室内及び室外環境の両方に対して良好に実現され、相互のアーキテクチャの音響シミュレーション及びビデオゲームの自動3D音声管理を含む多くのアプリケーションに対してオーディオハードウェアの制限された能力に影響を与える。聞こえない音源は、動的に排除され、残存する可聴の音源は、多くのクラスタにグループ化される。各クラスタは、1つの知覚的な基準を用いて位置決めされる1つの偽音源によって表される。空間的な音声処理は、その後、その偽音源のみに関して実行され、それによって、計算上のコストを低減する。音声品質の制限された劣化及び局所的欠陥が取得されるが、それはクラスタで大きく異なるものである。
コンバータ60は、残響の前期部分及び後期部分を別個に処理するものであり、入力信号を分割するための分割器に接続された入力チャネルを有する。プロセッサは、入力チャネル及び出力チャネルの種々の組合せに関する複数の残響を計算して出力信号の前期部分を生成することができる。後期部分は全く生成されないか、又は分割器に同様に接続された別個のプロセッサによって生成され、この場合、後期部分は、例えばアルゴリズムによる残響のような従来の方法で生成される。
出力チャネルはプロセッサによって結合器に与えられ、ここで各チャネルに関して結果として得られる前期及び後期部分が結合されて単一の出力信号になり出力に供給される。
プロセッサによって用いられる伝達関数又は伝達関数のパラメータは、パラメータ入力からのモデル即ち伝達関数に関する情報を受け取るように配置されたモデル入力ブロックを介して供給される。
プロセッサによって用いられる伝達関数又は伝達関数のパラメータは、パラメータ入力からのモデル即ち伝達関数に関する情報を受け取るように配置されたモデル入力ブロックを介して供給される。
図7は、コンバータを備えたオーディオ装置を示す。
オーディオ装置80は、コンバータ60、即ち図6のコンバータ60を備える。オーディオ装置は、N個の入力チャネルを、例えば、光ディスク81又は伝送チャネル(図示せず)から受け取る。N個の入力チャネルはコンバータ60に供給されてM個のチャネルに変換される。このためにコンバータは用いる伝達関数に関する情報を必要とする。この情報はコンバータ60の内部若しくはオーディオ装置80の内部に埋込むことができ、又は外部ソースから受け取ることができる。図8には、情報が光ディスクから読み出される状況を示す。その場合には、光ディスクは入力チャネル及び室モデル情報の両方を含む。
オーディオ装置80は、コンバータ60、即ち図6のコンバータ60を備える。オーディオ装置は、N個の入力チャネルを、例えば、光ディスク81又は伝送チャネル(図示せず)から受け取る。N個の入力チャネルはコンバータ60に供給されてM個のチャネルに変換される。このためにコンバータは用いる伝達関数に関する情報を必要とする。この情報はコンバータ60の内部若しくはオーディオ装置80の内部に埋込むことができ、又は外部ソースから受け取ることができる。図8には、情報が光ディスクから読み出される状況を示す。その場合には、光ディスクは入力チャネル及び室モデル情報の両方を含む。
図8は、前期部分と後期部分を含む計測されたインパルス応答を示す。図示した実施形態においては前期部分と後期部分が連続しているが、代替的実施形態においては、それらは重なっても良く又は分離してもよい。
残響の前期部分と後期部分の処理を分割して別々に取り扱うことができる。
残響の前期部分と後期部分の処理を分割して別々に取り扱うことができる。
図2の残響の強度包絡線20を再び図8に示すが、ここでは前期部分21、22、23、24、25と後期部分91の間の分割点を示す垂直点線がある。分割点は時間に固定されたものではなく、音のタイプ(例えば、声、古典、ジャズ、ポップなど)又はモデル化された音響環境のタイプに基づいて決定される。図8の場合には、分割点は、比較的大きな振幅を有する明らかな主要反響から生じるピークを有する前期部分と、主要なピークがなく比較的一様な減衰包絡線形状を有する後期部分91との間に存在するように選ばれている。本説明から明らかなように、本発明は、それらのピークを有する前期部分21、22、23、24、25について有利に用いることができる。後期部分91は、従来技術による既知の方法及び手段を用いて処理することができ、又はその全てを無視することができる。
図9は模擬前期部分を示す。
インパルス応答の模擬前期部分100は、図5と等しく、本発明のモデリング方法を用いて選択された主要なピーク31、32、33、34、35のみを含むが、後期部分は本発明の方法を適用する前に除去されている。
これは、模擬残響の後期部分101をゼロに設定することになる。
インパルス応答の模擬前期部分100は、図5と等しく、本発明のモデリング方法を用いて選択された主要なピーク31、32、33、34、35のみを含むが、後期部分は本発明の方法を適用する前に除去されている。
これは、模擬残響の後期部分101をゼロに設定することになる。
図10は模擬後期部分を示す。インパルス応答のモデル化された後期部分110には、処理の前に前期部分が除去されるので前期部分の主要なピーク31、32、33、34、35はないが、後期部分111を含む。
図11は、モデルの簡略伝達関数に用いるピークの選択が、室内で再生したときの櫛型フィルタ効果を避けるために違うように選ばれた2つのチャネル120、121を示す。説明を簡単にするために、2つの同一のインパルス応答120、121を示すが、実際にはインパルス応答は各チャネルに対して僅かに異なることになる。
第1のモデル化されたインパルス応答120において第2のピーク32が削除されており、一方第2のモデル化されたインパルス応答121においては第4のピーク34が削除されている。
第1のモデル化されたインパルス応答120において第2のピーク32が削除されており、一方第2のモデル化されたインパルス応答121においては第4のピーク34が削除されている。
Claims (16)
- 音響環境(1)のモデルを簡略化する方法であって、該モデルは一組の伝達関数を含み、各々の伝達関数は該音響環境(1)内の音発生位置(2)から音受信位置(3)までの音伝搬(4、5)に対応し、各々の伝達関数に関して、
前記音発生位置で発生する第1の励振の前記音受信位置で受信される模擬残響を、前記伝達関数を前記第1の励振に作用させることによって計算し、
前記模擬残響の強度包絡線(30)内の一組の極大(31、32、33、34、35)のサブセット(31、32、35)を選択し、
前記第1の励振に作用して前記選択された極大(31、32、33、34、35)のサブセット(31、32、35)に適合する強度包絡線を有する模擬残響をもたらす簡略伝達関数を計算する、
ステップを含むことを特徴とする方法。 - 前記選択される極大(31、32、33、34、35)のサブセット(31、32、35)の数は所定の最大値を越えないことを特徴とする、請求項1に記載の方法。
- 前記選択される極大(31、32、33、34、35)のサブセット(31、32、35)は、時間強度減衰関数を越える極大の中から選択されることを特徴とする、請求項1又は請求項2のいずれか1項に記載の方法。
- 前記減衰関数は指数型減衰関数であることを特徴とする、請求項3に記載の方法。
- 前記簡略伝達関数は、前記第1の励振との畳み込みによって作用させることを特徴とする、前記請求項のいずれか1項に記載の方法。
- 前記簡略伝達関数は、各々の選択された極大(31、32、35)に関する信号遅延及び信号減衰の組合せとして表され、時間領域操作で前記第1の励振に作用させることを特徴とする、請求項1から請求項4までのいずれか1項に記載の方法。
- N個の入力チャネルを含む第1のオーディオ・ストリームを、M個の出力チャネルを含む第2のオーディオ・ストリームに変換する方法であって、各々の入力及び出力チャネルに関して、
請求項1から請求項6までのいずれか1項に記載の方法を用いて簡略化されたMチャネル音響環境(1)のモデルにおいて、前記入力チャネル及び出力チャネルに関連する簡略伝達関数を選択し、
前記入力チャネルからの入力信号を、前記選択された簡略伝達関数を作用させることにより処理して前記出力チャネルの出力信号の少なくとも一部分を生成する、
ステップを含むことを特徴とする方法。 - M>Nであることを特徴とする、請求項7に記載の方法。
- 前記簡略伝達関数が適合する選択された極大(31、32、33、34、35)のサブセット(31、32、35)は、前記M個の出力チャネルのうちの少なくとも2個に関して異なり、好ましくはM個の全ての出力チャネルに関して異なることを特徴とする、請求項7又は請求項8のいずれか1項に記載の方法。
- 前記出力信号は前期部分(31、32、33、34、35)と後期部分(91)を含むことを特徴とする、請求項4から請求項8までのいずれか1項に記載の方法。
- 前記前期部分(91)のみが前記簡略伝達関数を用いて生成されることを特徴とする、請求項10に記載の方法。
- 前記後期部分(91)は前記入力信号のアルゴリズムによる残響によって生成されることを特徴とする、請求項11に記載の方法。
- N個の入力チャネル(54)を含む第1のオーディオ信号を、請求項7から請求項12までのいずれか1項に記載の方法を用いて計算されたM個のチャネル(55)を含む第2のオーディオ信号に変換するためのコンバータ(50)であって、
N個の入力(54)及びM個の出力(55)と、
簡略伝達関数の前記セットを、入力チャネル(54)で受け取られたオーディオ信号に作用させて、計算された出力チャネル(55)の残響成分を得るためのプロセッサ(51)と、
を備え、
前記プロセッサ(51)によって用いるための、簡略伝達関数の前記セットに関連する少なくとも係数を有するデータ記憶媒体(52)をさらに備える、
ことを特徴とするコンバータ。 - 前記データ記憶媒体(52)は、前記プロセッサ(51)に接続された非常駐コンピュタ・メモリであることを特徴とする、請求項13に記載のコンバータ。
- 請求項1から請求項6までのいずれか1項に記載の方法によって得られた、音響基準室(1)の簡略化モデルを含むことを特徴とする信号。
- 請求項15に記載の信号を含むことを特徴とするデータ記憶媒体(81)。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP08169729 | 2008-11-21 | ||
EP08169729.4 | 2008-11-21 | ||
PCT/EP2009/065587 WO2010057997A1 (en) | 2008-11-21 | 2009-11-20 | Converter and method for converting an audio signal |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2012509632A JP2012509632A (ja) | 2012-04-19 |
JP2012509632A5 true JP2012509632A5 (ja) | 2013-01-17 |
JP5611970B2 JP5611970B2 (ja) | 2014-10-22 |
Family
ID=42060701
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011536881A Active JP5611970B2 (ja) | 2008-11-21 | 2009-11-20 | オーディオ信号を変換するためのコンバータ及び方法 |
Country Status (10)
Country | Link |
---|---|
US (1) | US9100767B2 (ja) |
EP (1) | EP2368375B1 (ja) |
JP (1) | JP5611970B2 (ja) |
KR (1) | KR101646540B1 (ja) |
CN (1) | CN102334348B (ja) |
CA (1) | CA2744429C (ja) |
DK (1) | DK2368375T3 (ja) |
HK (1) | HK1166908A1 (ja) |
TW (1) | TWI524785B (ja) |
WO (1) | WO2010057997A1 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014085439A (ja) * | 2012-10-22 | 2014-05-12 | Nippon Hoso Kyokai <Nhk> | インパルス応答測定システム及びインパルス応答測定方法 |
DE102012224454A1 (de) * | 2012-12-27 | 2014-07-03 | Sennheiser Electronic Gmbh & Co. Kg | Erzeugung von 3D-Audiosignalen |
KR101627661B1 (ko) * | 2013-12-23 | 2016-06-07 | 주식회사 윌러스표준기술연구소 | 오디오 신호 처리 방법, 이를 위한 파라메터화 장치 및 오디오 신호 처리 장치 |
JP6371167B2 (ja) * | 2014-09-03 | 2018-08-08 | リオン株式会社 | 残響抑制装置 |
JP2019518373A (ja) | 2016-05-06 | 2019-06-27 | ディーティーエス・インコーポレイテッドDTS,Inc. | 没入型オーディオ再生システム |
US10324683B2 (en) * | 2016-12-27 | 2019-06-18 | Harman International Industries, Incorporated | Control for vehicle sound output |
US10979844B2 (en) | 2017-03-08 | 2021-04-13 | Dts, Inc. | Distributed audio virtualization systems |
US9820073B1 (en) | 2017-05-10 | 2017-11-14 | Tls Corp. | Extracting a common signal from multiple audio signals |
CN117643075A (zh) * | 2021-07-15 | 2024-03-01 | 杜比实验室特许公司 | 用于言语增强的数据扩充 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6253100A (ja) * | 1985-09-02 | 1987-03-07 | Nippon Gakki Seizo Kk | 音響特性制御装置 |
JPH0748920B2 (ja) * | 1986-05-31 | 1995-05-24 | 株式会社富士通ゼネラル | 音響再生装置 |
JPS63173500A (ja) * | 1987-01-13 | 1988-07-18 | Sony Corp | カ−オ−デイオ装置 |
DE19545623C1 (de) * | 1995-12-07 | 1997-07-17 | Akg Akustische Kino Geraete | Verfahren und Vorrichtung zur Filterung eines Audiosignals |
JPH1127800A (ja) * | 1997-07-03 | 1999-01-29 | Fujitsu Ltd | 立体音響処理システム |
JP2000059894A (ja) * | 1998-08-12 | 2000-02-25 | Victor Co Of Japan Ltd | 音像定位装置とfirフィルタ係数の処理方法及びfirフィルタの演算方法 |
JP3435141B2 (ja) * | 2001-01-09 | 2003-08-11 | 松下電器産業株式会社 | 音像定位装置、並びに音像定位装置を用いた会議装置、携帯電話機、音声再生装置、音声記録装置、情報端末装置、ゲーム機、通信および放送システム |
FR2852779B1 (fr) * | 2003-03-20 | 2008-08-01 | Procede pour traiter un signal electrique de son | |
FR2862799B1 (fr) * | 2003-11-26 | 2006-02-24 | Inst Nat Rech Inf Automat | Dispositif et methode perfectionnes de spatialisation du son |
FR2899424A1 (fr) * | 2006-03-28 | 2007-10-05 | France Telecom | Procede de synthese binaurale prenant en compte un effet de salle |
US8116458B2 (en) * | 2006-10-19 | 2012-02-14 | Panasonic Corporation | Acoustic image localization apparatus, acoustic image localization system, and acoustic image localization method, program and integrated circuit |
JP4941106B2 (ja) * | 2007-05-30 | 2012-05-30 | カシオ計算機株式会社 | 共鳴音付加装置および共鳴音付加プログラム |
CN101178897B (zh) * | 2007-12-05 | 2011-04-20 | 浙江大学 | 利用基频包络剔除情感语音的说话人识别方法 |
-
2009
- 2009-11-20 JP JP2011536881A patent/JP5611970B2/ja active Active
- 2009-11-20 WO PCT/EP2009/065587 patent/WO2010057997A1/en active Application Filing
- 2009-11-20 DK DK09801675.1T patent/DK2368375T3/da active
- 2009-11-20 EP EP09801675.1A patent/EP2368375B1/en active Active
- 2009-11-20 CA CA2744429A patent/CA2744429C/en active Active
- 2009-11-20 US US13/130,737 patent/US9100767B2/en active Active
- 2009-11-20 CN CN200980153440.8A patent/CN102334348B/zh active Active
- 2009-11-20 TW TW098139475A patent/TWI524785B/zh not_active IP Right Cessation
- 2009-11-20 KR KR1020117014254A patent/KR101646540B1/ko active IP Right Grant
-
2012
- 2012-07-25 HK HK12107294.4A patent/HK1166908A1/xx not_active IP Right Cessation
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7183467B2 (ja) | 少なくとも一つのフィードバック遅延ネットワークを使ったマルチチャネル・オーディオに応答したバイノーラル・オーディオの生成 | |
JP7139409B2 (ja) | 少なくとも一つのフィードバック遅延ネットワークを使ったマルチチャネル・オーディオに応答したバイノーラル・オーディオの生成 | |
JP2012509632A5 (ja) | オーディオ信号を変換するためのコンバータ及び方法 | |
JP5956994B2 (ja) | 拡散音の空間的オーディオの符号化及び再生 | |
JP5611970B2 (ja) | オーディオ信号を変換するためのコンバータ及び方法 | |
KR100964353B1 (ko) | 오디오 데이터를 처리하기 위한 방법 및 이에 따른 사운드수집 장치 | |
JP7208365B2 (ja) | 仮想3dオーディオを現実の室内に適応させる装置及び方法 | |
JP2023517720A (ja) | 残響のレンダリング | |
Otani et al. | Binaural Ambisonics: Its optimization and applications for auralization | |
Thery et al. | Auditory perception stability evaluation comparing binaural and loudspeaker Ambisonic presentations of dynamic virtual concert auralizations | |
San Martín et al. | Influence of recording technology on the determination of binaural psychoacoustic indicators in soundscape investigations | |
US20230104111A1 (en) | Determining a virtual listening environment | |
WO2024024468A1 (ja) | 情報処理装置および方法、符号化装置、音声再生装置、並びにプログラム | |
Palenda et al. | Setup for choir recordings in virtual churches | |
San Martín Murugarren et al. | Influence of recording technology on the determination of binaural psychoacoustic indicators in soundscape investigations | |
Koutsivitis et al. | Reproduction of audiovisual interactive events in virtual ancient Greek spaces | |
Frey | The Derivation of the Acoustical Impulse Response Function of | |
JP2009139615A (ja) | 音響再生装置、音響再生方法、音響再生プログラム、及び音響再生システム | |
Janssen | A Reverberation Instrument Based on Perceptual Mapping. | |
KR20060131806A (ko) | 음향 합성 및 공간화 방법 |