JP6774912B2 - 音像生成装置 - Google Patents

音像生成装置 Download PDF

Info

Publication number
JP6774912B2
JP6774912B2 JP2017131706A JP2017131706A JP6774912B2 JP 6774912 B2 JP6774912 B2 JP 6774912B2 JP 2017131706 A JP2017131706 A JP 2017131706A JP 2017131706 A JP2017131706 A JP 2017131706A JP 6774912 B2 JP6774912 B2 JP 6774912B2
Authority
JP
Japan
Prior art keywords
wave field
field synthesis
prefilter
window function
sound image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017131706A
Other languages
English (en)
Other versions
JP2019016871A (ja
Inventor
公孝 堤
公孝 堤
高田 英明
英明 高田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2017131706A priority Critical patent/JP6774912B2/ja
Publication of JP2019016871A publication Critical patent/JP2019016871A/ja
Application granted granted Critical
Publication of JP6774912B2 publication Critical patent/JP6774912B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)

Description

本発明は、実空間内に仮想的な音源・音像を作り出す音響再生技術に関する。
パブリックビューイングやコンサート会場では、上映会場に設置された複数のスピーカから音声や音楽などが再生される。近年、その音源を仮想的に実空間内に作り出すことにより、これまで以上に臨場感のある音響再生を実現する取り組みが行われている。
上映空間内に仮想的な音源を作り出す音響再生技術について、特許文献1には、収録会場内の複数のマイクロフォンで実音源からの音響信号を収音した後、当該音響信号の上下左右方向の到来方向を分析して、遠隔地の上映空間内において、波面合成法(Wave Field Synthesis)を用いることにより、スピーカアレイから収録会場の音響信号を物理的に再現すること、つまり、実音源に対応する仮想音源を再現する方法が記載されている。
また、非特許文献1には、想定する仮想音場に吸い込み型音源(acoustic sink)があると仮定し、第1種レイリー積分から導出される駆動信号をスピーカアレイに与えることにより、図6に示すように、当該スピーカアレイの前面に仮想音像(X)を作り出す方法が記載されている。
特開2011−244306号公報
Sascha Spors、外3名、"Physical and Perceptual Properties of Focused Sources in Wave Field Synthesis"、127th Audio Engineering Society Convention paper 7914、2009年10月 Hagen Wierstorf、外3名、"Perception of focused sources in wave field synthesis"、Journal of the Audio Engineering Society、vol. 61、No. 1/2、2013年1月,2月、p.5-p.16
特許文献1の方法は、収録地点の音響信号を忠実に再現するため、仮想音源の再現において高い再現性がある。しかし、スピーカアレイだけでなくマイクアレイも必要になるため、システム全体の規模が増大してしまう。また、収録した音を忠実に再生しようとするため、例えば映画に代表されるように日常存在しないような効果音を特殊効果として加えるなど、後に行われる音声コンテンツの編集が困難となる。
一方、非特許文献1の方法は、仮想音像を生成するためにマイクアレイを必要としない。一般に、非特許文献1に示されるように、解析的に定義されたディジタルフィルタは、逐次最適化などを用いる手法に比べて低演算量でフィルタ係数を算出できる。しかし、音響信号のチャネル毎に逆フーリエ変換処理などが必要となるため、リアルタイムに位置が変化する仮想音源を再現する場合、その演算量が膨大になるという課題があった。
そこで、非特許文献2の方法を用いることが考えられる。非特許文献1の方法は、非特許文献2の近似手法を用いて時間領域に変換することができる。
スピーカアレイの各スピーカに与える駆動信号(音響信号)は、仮想音像の位置X(x,y)と、対象とするi番目のスピーカの位置X(x,y)を用いて次式で定義できる。
j=√(−1)、kは波数(k=ω/c)、ωは角周波数(ω=2πf)、fは周波数、cは音速、g=√(2π|yref−y|)、|yref−y|は仮想音像からスピーカアレイまでの距離、H (1)は1次の第1種ハンケル関数である。
式(1)をx軸方向に逆フーリエ変換により時間領域に変換して、時間領域の波面合成として知られる次式を得る。
式(2)に含まれる次式は、波面合成プレフィルタh(n)として知られている。nは時間である。
そのため、時間領域での波面合成技術では、式(2)に示す通り、出力予定の音響信号に対して式(3)の波面合成プレフィルタh(n)を適用すれば、その後はチャネル毎にパワー乗算処理と遅延処理を行うだけでよいため、演算量を劇的に削減することができる。
しかし、非特許文献2の方法では、算出された波面合成プレフィルタh(n)はフィルタの中央以外の裾の部分にもパワーを有するため(後述)、出力される音響信号にリバーブ(反響音、残響音などのノイズ)がかかったような音質となり、主観的な品質を劣化させてしまうという課題があった。
本発明は、上記事情を鑑みてなされたものであり、音響信号のノイズを抑圧することを目的とする。
以上の課題を解決するため、請求項1に係る音像生成装置は、波面合成用の波面合成プレフィルタに窓関数を掛け合わせる窓関数掛合部と、前記窓関数が掛け合わせられた前記波面合成プレフィルタを音響信号に畳み込むフィルタ演算部と、を備えることを特徴とする。
請求項2に係る音像生成装置は、請求項1に記載の音像生成装置において、前記窓関数掛合部は、前記波面合成プレフィルタの最大振幅値を含む時間範囲に、前記波面合成プレフィルタの時間範囲よりも小さい時間範囲の窓関数を掛け合わせ、前記フィルタ演算部は、当該窓関数が掛け合わせられた時間範囲のみの波面合成プレフィルタを前記音響信号に畳み込むことを特徴とする。
本発明によれば、音響信号のノイズを抑圧することができる。
音像生成装置の構成を示す図である。 波面合成プレフィルタの原形状を示す図である。 ハニング窓の形状を示す図である。 波面合成プレフィルタの形状を示す図である。 従来と本発明の音圧分布を示す図である。 スピーカアレイと仮想音源の位置関係を示す図である。
上記課題を解決するため、本発明は、波面合成プレフィルタに窓関数を掛け合わせることを特徴とする。これにより、波面合成プレフィルタの裾部分のパワーが抑圧されるので、出力される音響信号の持つリバーブ状のノイズを抑圧することができる。
また、本発明は、波面合成プレフィルタの最大振幅値を含む中心部分付近に限定して、当該波面合成プレフィルタの時間範囲よりも小さい時間範囲の窓関数を掛け合わせ、当該窓関数が掛け合わせられた時間範囲に限定した波面合成プレフィルタのみを取り出して、新たな波面合成プレフィルタとすることを特徴とする。これにより、波面合成プレフィルタの時間長が短くなるので、波面合成プレフィルタの畳み込み演算処理に伴う遅延時間を低遅延化することができる。
以下、本発明を実施する一実施の形態について図面を用いて説明する。
〔第1の実施形態〕
図1は、第1の実施形態に係る音像生成装置1の構成を示す図である。図1に示す構成は、時間領域の波面合成を行う場合の基本的な構成例である。音像生成装置1は、波面合成用の波面合成プレフィルタを生成する波面合成プレフィルタ生成部11と、当該波面合成プレフィルタに窓関数を掛け合わせる窓関数掛合部12と、当該窓関数が掛け合わせられた波面合成プレフィルタを音響信号に畳み込むフィルタ演算部13と、当該音響信号の遅延量を調整する遅延調整部14と、遅延量調整後の音響信号にゲインを乗算するゲイン乗算部15と、を備えて構成される。遅延調整部14とゲイン乗算部15は、それぞれ、スピーカアレイのスピーカの数と同数であり、スピーカ毎に独立に演算処理を行う。
次に、音像生成装置1の動作について説明する。
ステップS1;
まず、波面合成プレフィルタ生成部11は、波面合成プレフィルタh(n)を生成する。以下、波面合成プレフィルタh(n)の生成方法を改めて説明する。
例えば、スピーカアレイの各スピーカに与える音響信号は、仮想音像の位置X(x,y)と、i番目の対象スピーカの位置X(x,y)を用いて、式(4)で定義することができる。
ここで、j=√(−1)、kは波数(k=ω/c)、ωは角周波数(ω=2πf)、fは周波数、cは音速、g=√(2π|yref−y|)、|yref−y|は仮想音像からスピーカアレイまでの距離、H (1)は1次の第1種ハンケル関数である。
そして、式(4)をx軸方向に逆フーリエ変換により時間領域に変換することにより、時間領域の波面合成として知られる式(5)を得ることができる。
式(5)の右辺の一部を成す式(6)が波面合成プレフィルタh(n)である。波面合成プレフィルタ生成部11は、当該式(6)を用いて波面合成プレフィルタh(n)を生成する。nは時間である。
波面合成プレフィルタh(n)を図2に例示する。式(6)を用いることにより、例えば、0〜約250の時間範囲内でパワー(振幅値)を持つ波面合成プレフィルタh(n)を生成することができる。ただし、「発明が解決しようとする課題」で説明した通り、当該波面合成プレフィルタh(n)には、フィルタ中央以外の裾の部分にもパワーが含まれている。図2に例示した波面合成プレフィルタh(n)の場合、0〜約100の時間範囲と約170〜約250の時間範囲にもパワーがある。
ステップS2;
次に、窓関数掛合部12は、ステップS1で生成した波面合成プレフィルタh(n)の時間長と同じ時間長の窓関数w(n)を生成し、当該窓関数w(n)を当該波面合成プレフィルタh(n)に掛け合わせ、式(7)に示す改良後の波面合成プレフィルタh(n){hの上には“∧”}を生成する。
例えば、窓関数w(n)としてハニング窓関数w(n)を生成する。当該ハニング窓関数w(n)を図3に例示する。図2に例示した波面合成プレフィルタh(n)の時間長(0〜約250)と同じ時間長(0〜約250)で「1」を最大パワーとする。図3に示したハニング窓関数w(n)を図2に示した波面合成プレフィルタh(n)に掛け合わせることにより、図4に示すような裾部分のパワーが抑圧された改良後の波面合成プレフィルタh(n){hの上には“∧”}を生成することができる。
なお、窓関数としては、ハニング窓関数以外に、ハミング窓関数などを用いてもよい。その他、元の波面合成プレフィルタh(n)の裾部分のパワーを抑圧できればよいため、0〜約100の時間範囲と約170〜約250の時間範囲の各パワーを「0」とし、約100〜約170の時間範囲のパワーを「1」とする標準的な窓関数を用いてもよい。
ステップS3;
次に、フィルタ演算部13は、式(8)に示すように、音像生成装置1に入力された音響信号s(n)に対して、ステップS2で生成した改良後の波面合成プレフィルタh(n){hの上には“∧”}を畳み込む。なお、当該畳み込みを行う畳み込み演算処理自体は、公知技術である。
ステップS4;
次に、遅延調整部14は、式(9)に示すように、ステップS3で畳み込み処理を行った音響信号s(n){sの上には“∧”}に対して、仮想音源の位置Xとスピーカの位置Xで決定される遅延量を加える。
ステップS5;
次に、ゲイン乗算部15は、式(10)に示すように、ステップS4で遅延量を加えた音響信号s(n){sの上には“・”}のゲインを調整(加算、減算などの演算を含む)する。ゲイン調整された音響信号y(n)が、スピーカを駆動させる駆動信号となる。
ステップS4とステップS5をスピーカの数だけ繰り返すことにより、時間領域の波面合成に必要な音響信号を全て得ることができる。なお、遅延調整部14とゲイン乗算部15のパラメータを時間的に変更することにより、仮想音像の位置を動的に変化させることもできる。また、音像生成装置1は、音響信号とともに、仮想音像の位置が指定された音像位置情報を受信した場合、生成する仮想音像の位置が当該指定された位置に合うように上記パラメータを調整することもできる。
第1の実施形態によれば、波面合成プレフィルタに窓関数を掛け合わせるので、波面合成プレフィルタの裾部分のパワー(振幅値)が抑圧され、音響信号の持つリバーブ状のノイズを抑圧することができる。
効果を確認するため、単一周波数(1kHz)の正弦波を用いた音場の計算機シミュレーションを行った。従来の音圧分布と本実施形態の音圧分布を図5に示す。図中の「x…x」はx軸上に10cm間隔で並べた40個のスピーカを示し、座標(0,2)が仮想音像の位置(焦点音源)を示している。波面合成プレフィルタに窓関数を掛け合わせた場合であっても、焦点音源が作る音場分布は、従来と比べて劣化していないことを把握できる。
〔第2の実施形態〕
第2の実施形態では、波面合成プレフィルタの畳み込み演算処理に伴う遅延時間を低遅延化することを目的とする。当該目的を達成するため、窓関数掛合部12で波面合成プレフィルタに掛け合わる窓関数を、当該波面合成プレフィルタの時間長よりも短い時間長の窓関数とし、当該窓関数が掛け合わせられた時間長のみの波面合成プレフィルタを生成する。
本実施形態に係る音像生成装置1の構成は、第1の実施形態の構成と同じである。ただし、窓関数掛合部12は、第1の実施形態で説明した機能以外に、元の波面合成プレフィルタの時間長よりも短い時間長の窓関数を生成し、当該元の波面合成プレフィルタの最大振幅値を含む時間範囲に当該窓関数を掛け合わせ、当該窓関数が掛け合わせられた時間範囲のみの波面合成プレフィルタのみを取り出して、改良後の波面合成プレフィルタとする機能を持つ。なお、窓関数掛合部12以外の機能については、第1の実施形態と概ね同じである。
次に、本実施の形態に係る音像生成装置1の動作について説明する。
第1の実施形態で説明したステップS1の後、窓関数掛合部12は、まず、ステップS1で生成した波面合成プレフィルタh(n)の時間長よりも短い時間長Lの窓関数w(p){p=1,…,L}を生成する。
次に、窓関数掛合部12は、波面合成プレフィルタh(n)の振幅の絶対値が最大となる時点を特定し、当該時点が中央にくる時間範囲を特定する。例えば、所定の開始時点tにp値をそれぞれ加算し、(t+1),(t+2),…,(t+L)の各時間範囲のうちから、波面合成プレフィルタの最大振幅値が中央に位置する時間範囲を特定する。
次に、窓関数掛合部12は、式(11)に示すように、特定した時間範囲内の波面合成プレフィルタに上記時間長Lの窓関数w(p)を掛け合わせ、当該窓関数w(p)が掛け合わせられた時間範囲のみからなる、第1の実施形態で用いた改良後の波面合成プレフィルタよりも時間長の短い波面合成プレフィルタを生成する。
これ以降は、第1の実施形態で説明したステップS3以降の処理と同じである。フィルタ演算部13では、第1の実施形態よりも時間長の短い波面合成プレフィルタを音響信号に畳み込む処理が行われる。
第2の実施形態によれば、波面合成プレフィルタの最大振幅値を含む時間範囲に、当該波面合成プレフィルタの時間長よりも短い時間長の窓関数を掛け合わせ、当該窓関数が掛け合わせられた時間範囲のみの波面合成プレフィルタを音響信号に畳み込むので、波面合成プレフィルタの時間長が短くなり、波面合成プレフィルタの畳み込み演算処理に伴う遅延時間を低遅延化することができる。
最後に、各実施の形態で説明した音像生成装置1は、上記機能を備える回路やコンピュータなどで実現可能である。
1…音像生成装置
11…波面合成プレフィルタ生成部
12…窓関数掛合部
13…フィルタ演算部
14…遅延調整部
15…ゲイン乗算部

Claims (2)

  1. 波面合成用の波面合成プレフィルタに窓関数を掛け合わせる窓関数掛合部と、
    前記窓関数が掛け合わせられた前記波面合成プレフィルタを音響信号に畳み込むフィルタ演算部と、
    を備えることを特徴とする音像生成装置。
  2. 前記窓関数掛合部は、前記波面合成プレフィルタの最大振幅値を含む時間範囲に、前記波面合成プレフィルタの時間範囲よりも小さい時間範囲の窓関数を掛け合わせ、
    前記フィルタ演算部は、
    当該窓関数が掛け合わせられた時間範囲のみの波面合成プレフィルタを前記音響信号に畳み込むことを特徴とする請求項1に記載の音像生成装置。
JP2017131706A 2017-07-05 2017-07-05 音像生成装置 Active JP6774912B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017131706A JP6774912B2 (ja) 2017-07-05 2017-07-05 音像生成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017131706A JP6774912B2 (ja) 2017-07-05 2017-07-05 音像生成装置

Publications (2)

Publication Number Publication Date
JP2019016871A JP2019016871A (ja) 2019-01-31
JP6774912B2 true JP6774912B2 (ja) 2020-10-28

Family

ID=65358575

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017131706A Active JP6774912B2 (ja) 2017-07-05 2017-07-05 音像生成装置

Country Status (1)

Country Link
JP (1) JP6774912B2 (ja)

Also Published As

Publication number Publication date
JP2019016871A (ja) 2019-01-31

Similar Documents

Publication Publication Date Title
JP7367785B2 (ja) 音声処理装置および方法、並びにプログラム
US11503421B2 (en) Systems and methods for processing audio signals based on user device parameters
KR101764175B1 (ko) 입체 음향 재생 방법 및 장치
KR102430769B1 (ko) 몰입형 오디오 재생을 위한 신호의 합성
JP7352291B2 (ja) 音響装置
JP6485711B2 (ja) 音場再現装置および方法、並びにプログラム
JPWO2018008395A1 (ja) 音場形成装置および方法、並びにプログラム
JP6865440B2 (ja) 音響信号処理装置、音響信号処理方法および音響信号処理プログラム
JP2023517720A (ja) 残響のレンダリング
US9100767B2 (en) Converter and method for converting an audio signal
JP2012509632A5 (ja) オーディオ信号を変換するためのコンバータ及び方法
WO2022014326A1 (ja) 信号処理装置および方法、並びにプログラム
JP6970366B2 (ja) 音像再現装置、音像再現方法及び音像再現プログラム
US10587983B1 (en) Methods and systems for adjusting clarity of digitized audio signals
JP6774912B2 (ja) 音像生成装置
JP6670259B2 (ja) 音響再生装置
WO2024024468A1 (ja) 情報処理装置および方法、符号化装置、音声再生装置、並びにプログラム
JP2009139615A (ja) 音響再生装置、音響再生方法、音響再生プログラム、及び音響再生システム
US20230143062A1 (en) Automatic level-dependent pitch correction of digital audio
Palenda et al. Setup for choir recordings in virtual churches
JP2011146949A (ja) 音響処理装置
JP2011146947A (ja) 音響処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190724

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200603

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200929

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201005

R150 Certificate of patent or registration of utility model

Ref document number: 6774912

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150