JP5651813B1 - 音声信号処理装置、および音声信号処理方法 - Google Patents

音声信号処理装置、および音声信号処理方法 Download PDF

Info

Publication number
JP5651813B1
JP5651813B1 JP2014542039A JP2014542039A JP5651813B1 JP 5651813 B1 JP5651813 B1 JP 5651813B1 JP 2014542039 A JP2014542039 A JP 2014542039A JP 2014542039 A JP2014542039 A JP 2014542039A JP 5651813 B1 JP5651813 B1 JP 5651813B1
Authority
JP
Japan
Prior art keywords
signal
head
related transfer
transfer functions
transfer function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014542039A
Other languages
English (en)
Other versions
JPWO2014203496A1 (ja
Inventor
潤二 荒木
潤二 荒木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Management Co Ltd
Original Assignee
Panasonic Intellectual Property Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Intellectual Property Management Co Ltd filed Critical Panasonic Intellectual Property Management Co Ltd
Priority to JP2014542039A priority Critical patent/JP5651813B1/ja
Application granted granted Critical
Publication of JP5651813B1 publication Critical patent/JP5651813B1/ja
Publication of JPWO2014203496A1 publication Critical patent/JPWO2014203496A1/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • H04S5/005Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation  of the pseudo five- or more-channel type, e.g. virtual surround
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/305Electronic adaptation of stereophonic audio signals to reverberation of the listening space

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)

Abstract

音声信号処理装置(10)は、R信号およびL信号から構成されるステレオ信号を取得する取得部(101)と、受聴者(115)の右側の互いに異なる2以上の位置にR信号の音像を定位させるために頭部伝達関数の右耳用および左耳用の組を少なくとも2組以上R信号に畳み込む第一処理と、受聴者(115)の左側の互いに異なる2以上の位置にL信号の音像を定位させるために頭部伝達関数の右耳用および左耳用の組を少なくとも2組以上L信号に畳み込む第二処理と、を行うことにより処理後のR信号および処理後のL信号を生成する制御部(100)と、処理後のR信号および処理後のL信号を出力する出力部(107)とを備える。

Description

本開示は、R信号およびL信号から構成されるステレオ信号を信号処理する音声信号処理装置、並びに音声信号処理方法に関する。
仮想音像を再生するための音源を耳近傍に設置されたスピーカで再生するシステムがある。特許文献1には、フィルタ特性に残響成分を付加することにより仮想音像によるサラウンド感をより高める手法が開示されている。
特開平7−222297号公報
2つのスピーカを用いて仮想音像を定位させ、サラウンド感を高める方法については、検討の余地がある。
本開示は、仮想音像により高いサラウンド感を得ることができる音声信号処理装置および音声信号処理方法を提供する。
本開示における音声信号処理装置は、R信号およびL信号から構成されるステレオ信号を取得する取得部と、(1)受聴者の右側の互いに異なる2以上の位置に前記R信号の音像を定位させるために頭部伝達関数の右耳用および左耳用の組を少なくとも2組以上前記R信号に畳み込む第一処理と、(2)前記受聴者の左側の互いに異なる2以上の位置に前記L信号の音像を定位させるために頭部伝達関数の右耳用および左耳用の組を少なくとも2組以上前記L信号に畳み込む第二処理と、を行うことにより処理後のR信号および処理後のL信号を生成する制御部と、前記処理後のR信号および前記処理後のL信号を出力する出力部とを備える。
本開示における音声信号処理装置によれば、仮想音像により高いサラウンド感を得ることができる。
図1は、実施の形態1に係る音声信号処理装置の全体構成を示すブロック図である。 図2Aは、2組以上の頭部伝達関数の畳み込みを説明するための第1の図である。 図2Bは、2組以上の頭部伝達関数の畳み込みを説明するための第2の図である。 図3は、実施の形態1に係る音声信号処理装置の動作のフローチャートである。 図4は、制御部の頭部伝達関数の調整動作のフローチャートである。 図5は、位相差の設定方法を説明するための頭部伝達関数の時間波形を示す図である。 図6は、ゲインの設定方法を説明するための頭部伝達関数の時間波形を示す図である。 図7Aは、小空間における残響成分を説明するための図である。 図7Bは、大空間における残響成分を説明するための図である。 図8Aは、図7Aの空間における残響成分のインパルス応答を示す図である。 図8Bは、図7Bの空間における残響成分のインパルス応答を示す図である。 図9Aは、小空間における残響成分のインパルス応答の実測データを示す図である。 図9Bは、大空間における残響成分のインパルス応答の実測データを示す図である。 図10は、図9Aおよび図9Bの2つのインパルス応答の残響曲線を示す図である。
以下、適宜図面を参照しながら、実施の形態を詳細に説明する。ただし必要以上に詳細な説明は省略する場合がある。例えば、既によく知られた事項の詳細説明や実質的に同一の構成に対する重複説明を省略する場合がある。これは、以下の説明が不必要に冗長になるのを避け、当業者の理解を容易にするためである。
なお、発明者は、当業者が本開示を十分に理解するために添付図面および以下の説明を提供するのであって、これらによって請求の範囲に記載の主題を限定することを意図するものではない。
(実施の形態1)
[全体構成]
以下、実施の形態1について図面を参照しながら説明する。
まず、実施の形態1に係る音声信号処理装置の全体構成について説明する。図1は、実施の形態1に係る音声信号処理装置の全体構成を示すブロック図である。
図1に示される音声信号処理装置10は、取得部101と、制御部100と、出力部107とを備える。制御部100は、頭部伝達関数設定部102と、時間差制御部103と、ゲイン調整部104と、残響成分付加部105と、生成部106とを有する。
図1に示される構成においては、出力部107から出力される信号は、耳近傍Lスピーカ118および耳近傍Rスピーカ119から再生される。受聴者115は、耳近傍Lスピーカ118および耳近傍Rスピーカ119から再生される音を受聴する。
ここで、受聴者115は、耳近傍Lスピーカ118からの再生音については、仮想フロントLスピーカ109、仮想サイドLスピーカ111、および仮想バックLスピーカ113から再生されているように知覚する。一方、受聴者115は、耳近傍Rスピーカ119からの再生音については、仮想フロントRスピーカ110、仮想サイドRスピーカ112、および仮想バックRスピーカ114から再生されているように知覚する。
このような効果は、音声信号処理装置10において、取得されたL信号およびR信号に対してそれぞれ2組以上(実施の形態1では3組)の頭部伝達関数が畳み込まれることで得られ、この点が音声信号処理装置10の特徴となる。以下、音声信号処理装置10の各構成要素について説明する。なお、頭部伝達関数の組とは、右耳用の頭部伝達関数および左耳用の頭部伝達関数の組を意味する。
取得部101は、R信号およびL信号から構成されるステレオ信号を取得する。取得部101は、例えば、ネットワーク上にあるサーバに蓄積されているステレオ信号を取得する。また、取得部101は、例えば、音声信号処理装置10内の記憶部(図示せず。例えばHDD、およびSSD等)または音声信号処理装置10に挿入される記録媒体(例えば、DVDなどの光ディスクおよびUSBメモリ)などからステレオ信号を取得する。つまり、取得部101は、音声信号処理装置10の内部または外部のいずれからステレオ信号を取得してもよく、取得部101のステレオ信号の取得経路は、どのような経路であっても構わない。
制御部100の頭部伝達関数設定部102は、取得部101が取得したR信号およびL信号に対して畳み込む頭部伝達関数を設定する。
具体的には、頭部伝達関数設定部102は、受聴者115の右側の互いに異なる2以上の位置にR信号を定位させるために、R信号に対して少なくとも2組以上の頭部伝達関数の組を設定する。ここで、実施の形態1では、「受聴者115の右側の互いに異なる2以上の位置」とは、仮想フロントRスピーカ110の位置、仮想サイドRスピーカ112の位置、および仮想バックRスピーカ114の位置、の3つの位置である。
そして、頭部伝達関数設定部102は、R信号に対して設定された少なくとも2組以上の頭部伝達関数の組を1つにまとめることにより1組の頭部伝達関数を生成する。
また、頭部伝達関数設定部102は、受聴者115の左側の互いに異なる2以上の位置にL信号を定位させるために、L信号に対して少なくとも2組以上の頭部伝達関数の組を設定する。ここで、実施の形態1では、「受聴者115の左側の互いに異なる2以上の位置」とは、仮想フロントLスピーカ109の位置、仮想サイドLスピーカ111の位置、および仮想バックLスピーカ113の位置、の3つの位置である。
そして、頭部伝達関数設定部102は、L信号に対して設定された少なくとも2組以上の頭部伝達関数の組を1つにまとめることにより1組の頭部伝達関数を生成する。
次に、生成部106は、取得部101が取得したR信号およびL信号に対して、頭部伝達関数設定部102が1つにまとめた1組の頭部伝達関数を畳み込む。なお、生成部106は、1つにまとめる前の2組以上の頭部伝達関数の各組を個別にR信号およびL信号に対して畳み込んでもよい。
そして、出力部107は、頭部伝達関数を畳み込んで新たに生成された処理後のL信号を耳近傍Lスピーカ118に出力し、処理後のR信号を耳近傍Rスピーカ119に出力する。
ここで、2組以上の頭部伝達関数の畳み込みについて説明する。図2Aおよび図2Bは、2組以上の頭部伝達関数の畳み込みを説明するための図である。なお、図2Aおよび図2Bは、一例として、L信号に対して2組の頭部伝達関数を畳み込み、受聴者115の左側の互いに異なる2つの位置にL信号の音像を定位させる例について説明する。
図2Aに示されるように、フロントLスピーカ109aからL信号の再生音を再生させた場合の頭部伝達関数の組は、左耳用の頭部伝達関数と右耳用の頭部伝達関数とを含む。具体的には、頭部伝達関数の組は、フロントLスピーカ109aから受聴者115の左耳までの頭部伝達関数FL_L(左耳用の頭部伝達関数)と、フロントLスピーカ109aから受聴者115の右耳までの頭部伝達関数FL_R(右耳用の頭部伝達関数)とを含む。
また、サイドLスピーカ111aからL信号の再生音を再生させた場合の頭部伝達関数の組は、左耳用の頭部伝達関数と右耳用の頭部伝達関数とを含む。具体的には、頭部伝達関数の組は、サイドLスピーカ111aから受聴者115の左耳までの頭部伝達関数FL_L’と、サイドLスピーカ111aから受聴者115の右耳までの頭部伝達関数FL_R’とを含む。
図2Aに示されるような音場を、耳近傍Lスピーカ118および耳近傍Rスピーカ119の2つのスピーカを用いて再現する場合、L信号には、これら4つの頭部伝達関数が畳み込まれる。
そして、図2Bに示されるように、L信号に対して、左耳用の頭部伝達関数FL_Lと、左耳用の頭部伝達関数FL_L’とが畳み込まれた信号が処理後のL信号として生成され、耳近傍Lスピーカ118に出力される、また、L信号に対して、右耳用の頭部伝達関数FL_Rと、左耳用の頭部伝達関数FL_R’とが畳み込まれた信号が処理後のR信号として生成され、耳近傍Rスピーカ119に出力される。
このような処理後のL信号および処理後のR信号の再生音を耳近傍Lスピーカ118および耳近傍Rスピーカ119を通じて聞いた受聴者115は、L信号の音像が仮想フロントLスピーカ109の位置および仮想サイドLスピーカ111の位置に定位しているように知覚する。
なお、上述のように、処理後のL信号は、左耳用の頭部伝達関数FL_Lと、左耳用の頭部伝達関数FL_L’とが合成された(1つにまとめられた)頭部伝達関数がL信号に畳み込まれることによって生成されてもよい。同様に、処理後のR信号は、右耳用の頭部伝達関数FL_Rと、右耳用の頭部伝達関数FL_R’とが合成された頭部伝達関数(合成頭部伝達関数)がL信号に畳み込まれることによって生成されてもよい。つまり、「2組の頭部伝達関数が畳み込まれる」には、2組分の頭部伝達関数が合成された1組の合成頭部伝達関数が畳み込まれることが含まれる。
また、図2Bは、L信号に頭部伝達関数が畳み込まれる例を示すものであるが、R信号に対して2組の頭部伝達関数を畳み込み、受聴者115の右側の互いに異なる2つの位置にR信号の音像を定位させる場合も同様である。
また、図1に示されるように受聴者115の左右両側に音像を定位させる場合、3つの左耳用の頭部伝達関数(仮想フロントLスピーカ109、仮想サイドLスピーカ111、および仮想バックLスピーカ113のそれぞれの位置から受聴者115の左耳までの3つの頭部伝達関数)をL信号に畳み込んだ信号と、3つの左耳用の頭部伝達関数(仮想フロントRスピーカ110、仮想サイドRスピーカ112、および仮想バックRスピーカ114のそれぞれの位置から受聴者115の左耳までの3つの頭部伝達関数)をR信号に畳み込んだ信号とを合成した信号が処理後のL信号となる。処理後のR信号についても同様である。
[動作]
次に、音声信号処理装置10の上述のような動作についてフローチャートを用いて説明する。図3は、音声信号処理装置10の動作のフローチャートである。
まず、取得部101は、L信号およびR信号を取得する(S11)。そして、制御部100は、取得されたR信号に2組以上の頭部伝達関数を畳み込む(S12)。具体的には、制御部100は、受聴者115の右側の互いに異なる2以上の位置にR信号の音像を定位させるために頭部伝達関数の組を少なくとも2組以上R信号に畳み込む処理を行う。
同様に、制御部100は、取得されたL信号に2組以上の頭部伝達関数を畳み込む(S13)。具体的には、制御部100は、受聴者115の左側の互いに異なる2以上の位置にL信号の音像を定位させるために頭部伝達関数の組を少なくとも2組以上L信号に畳み込む処理を行う。制御部100は、このような処理によって、処理後のL信号および処理後のR信号を生成する(S14)。
最後に、出力部107は、生成された処理後のL信号を耳近傍Lスピーカ118に出力し、生成された処理後のR信号を耳近傍Rスピーカ119に出力する(S15)。
このように、音声信号処理装置10(制御部100)は、1つのチャネル信号(L信号またはR信号)に対して複数組の頭部伝達関数を畳み込む。これにより、受聴者115は、例えば、ヘッドフォンで音を受聴したとしても、音が頭の外で鳴っているように感じ、高いサラウンド感を得ることができる。
[頭部伝達関数の調整動作]
実施の形態1では、制御部100は、より詳細には、R信号に畳み込まれる頭部伝達関数の各組に、互いに異なる残響成分を付加する処理、位相差を設定する処理、および、互いに異なるゲインを乗算する処理、の3つの処理を行う。そして、3つの処理を行った頭部伝達関数の各組をR信号に畳み込む。同様に、制御部100は、L信号に畳み込まれる頭部伝達関数の各組に、互いに異なる残響成分を付加する処理、位相差を設定する処理、および、L信号に畳み込まれる頭部伝達関数の各組に、互いに異なるゲインを乗算する処理、の3つの処理を行ってL信号に畳み込む。以下、このような制御部100の頭部伝達関数の調整動作について説明する。図4は、制御部100の頭部伝達関数の調整動作のフローチャートである。
図1で説明したように、制御部100は、頭部伝達関数設定部102、時間差制御部103、ゲイン調整部104、および残響成分付加部105を有する。
頭部伝達関数設定部102は、取得部101が取得したステレオ信号(2ch信号)を構成するR信号およびL信号に対して畳み込み処理する頭部伝達関数を設定する(S21)。頭部伝達関数設定部102は、R信号およびL信号のそれぞれに対して少なくとも2組(2種類)以上の頭部伝達関数を設定する。頭部伝達関数設定部102は、設定した頭部伝達関数を時間差制御部103に出力する。
ここで、R信号およびL信号に対して設定される頭部伝達関数は、設計者によって任意に決定される。また、R信号に設定される頭部伝達関数の組と、これに対応するL信号に設定される頭部伝達関数の組とは、左右対称の特性である必要はない。R信号およびL信号のそれぞれに対して種類の異なる2組以上の頭部伝達関数が設定されればよい。
なお、頭部伝達関数は、事前に測定、もしくは設計されてデータとしてメモリ等の記憶部(図示せず)に記録されている。
次に、時間差制御部103は、R信号用の頭部伝達関数に対してそれぞれ異なる位相を設定し、かつ、L信号用の頭部伝達関数に対してそれぞれ異なる位相を設定する。言い換えれば、時間差制御部103は、R信号に畳み込まれる頭部伝達関数の各組に、位相差を設定し、かつ、L信号に畳み込まれる頭部伝達関数の各組に、位相差を設定する(S22)。そして、時間差制御部103は、位相を調整した頭部伝達関数をゲイン調整部104に出力する。
これにより、R信号に畳み込まれる2組以上の頭部伝達関数は、互いに位相が異なり、かつ、L信号に畳み込まれる2組以上の頭部伝達関数は、互いに位相が異なるものとなる。
このように、時間差制御部103は、受聴者115に仮想音(仮想音像)が到達するまでの時間を制御する。例えば、処理後のL信号は、仮想サイドLスピーカ111からの仮想音が仮想フロントLスピーカ109からの仮想音よりも先に到達するように受聴者115に知覚させることができる。
なお、時間差制御部103が位相差をどのように設定するかは、設計者が処理後のR信号および処理後のL信号によって実現したい音場により異なる。例えば、時間差制御部103は、頭部伝達関数設定部102から出力されるR信号およびL信号それぞれに畳み込まれる頭部伝達関数(頭部伝達関数の組)に設定される位相を、両耳間時間差に基づいて設定する。
具体的には、時間差制御部103は、両耳間時間差が第1の時間差(例えば1ms)である頭部伝達関数を畳み込んで生成された新たなR信号が、両耳間時間差が第1の時間差よりも小さな第2の時間差(例えば0ms)である頭部伝達関数を畳み込んで生成された新たなR信号よりも先に受聴者115に聞こえるように位相差を設定する。言い換えれば、時間差制御部103は、R信号に畳み込まれる頭部伝達関数の各組に、両耳間時間差が小さいほど位相が遅れるように位相差を設定する。
一方、時間差制御部103は、両耳間時間差が第3の時間差(例えば1ms)である頭部伝達関数を畳み込んで生成された新たなL信号が、両耳間時間差が第3の時間差よりも小さな第4の時間差(0ms)である頭部伝達関数を畳み込んで生成された新たなL信号よりも先に受聴者115に聞こえるように位相を設定する。言い換えれば、時間差制御部103は、L信号に畳み込まれる頭部伝達関数の各組に、両耳間時間差が小さいほど位相が遅れるように位相差を設定する。
次に、ゲイン調整部104は、時間差制御部103から出力されるR信号に畳み込まれる2組以上の頭部伝達関数それぞれに対して乗算するゲインを設定する。また、ゲイン調整部104は、時間差制御部103から出力されるL信号に畳み込まれる2組以上の頭部伝達関数それぞれに対して乗算するゲインを設定する。そして、ゲイン調整部104は、設定したゲインを対応する頭部伝達関数の組に対して乗算し残響成分付加部105に出力する。つまり、ゲイン調整部104は、R信号に畳み込まれる頭部伝達関数の各組に互いに異なるゲインを乗算し、L信号に畳み込まれる頭部伝達関数の各組に互いに異なるゲインを乗算する(S23)。
なお、ゲイン調整部104がゲインをどのように設定するかは、設計者が処理後のR信号および処理後のL信号によって実現したい音場により異なる。例えば、ゲイン調整部104は、R信号に畳み込まれる頭部伝達関数(頭部伝達関数の組)に乗算するゲインおよびL信号に畳み込まれる頭部伝達関数に乗算するゲインを、両耳間時間差に基づいて設定する。
具体的には、ゲイン調整部104は、両耳間時間差が第1の時間差(例えば1ms)である頭部伝達関数を畳み込んで生成された新たなR信号が、両耳間時間差が第1の時間差よりも小さな第2の時間差(例えば0ms)である頭部伝達関数を畳み込んで生成された新たなR信号よりも受聴者115に大きく聞こえるようにゲインを設定する。言い換えれば、ゲイン調整部104は、R信号に畳み込まれる頭部伝達関数の各組に、両耳間時間差が大きいほど大きなゲインを乗算する。
また、ゲイン調整部104は、両耳間時間差が第3の時間差(例えば1ms)である頭部伝達関数を畳み込んで生成された新たなL信号が、両耳間時間差が第3の時間差よりも小さな第4の時間差(例えば0ms)である頭部伝達関数を畳み込んで生成された新たなL信号よりも受聴者115に大きく聞こえるようにゲインを設定する。言い換えれば、ゲイン調整部104は、L信号に畳み込まれる頭部伝達関数の各組に、両耳間時間差が大きいほど大きなゲインを乗算する。
次に、残響成分付加部105は、ゲイン調整部104から出力されるR信号用の頭部伝達関数のそれぞれに対して残響成分を設定する。残響成分とは、小空間や大空間といった異なる空間の残響を表す音の成分を意味する。また、残響成分付加部105は、ゲイン調整部104から出力されるL信号用の頭部伝達関数のそれぞれに対して残響成分を設定する。そして、残響成分付加部105は、残響成分を設定(付加)した頭部伝達関数を生成部106に出力する。つまり、残響成分付加部105は、R信号に畳み込まれる頭部伝達関数の各組に、互いに異なる残響成分を付加し、L信号に畳み込まれる頭部伝達関数の各組に、互いに異なる残響成分を付加する(S24)。
なお、残響成分付加部105が残響成分をどのように設定するかは、設計者が処理後のR信号および処理後のL信号によって実現したい音場により異なる。
例えば、残響成分付加部105は、R信号に畳み込まれる頭部伝達関数に付加する残響成分およびL信号に畳み込まれる頭部伝達関数に付加する残響成分を、両耳間時間差に基づいて設定する。
具体的には、残響成分付加部105は、R信号に畳み込まれる2組以上の頭部伝達関数のうち、両耳間時間差が第1の時間差(例えば1ms)である頭部伝達関数に対し、第1の空間をシミュレートした残響成分を付加する。そして、残響成分付加部105は、両耳間時間差が第1の時間差よりも小さな第2の時間差(例えば0ms)である頭部伝達関数に対して第1の空間よりも大きな第2の空間をシミュレートした残響成分を付加する。つまり、残響成分付加部105は、R信号に畳み込まれる頭部伝達関数の各組に、互いに異なる残響成分を付加する。
一方、残響成分付加部105は、L信号に畳み込まれる2組以上の頭部伝達関数のうち、両耳間時間差が第3の時間差(例えば1ms)である頭部伝達関数には第3の空間をシミュレートした残響成分を付加する。そして、残響成分付加部105は両耳間時間差が第3の時間差よりも小さな第4の時間差(例えば0ms)である頭部伝達関数には第3の空間よりも大きな第4の空間をシミュレートした残響成分を付加する。つまり、残響成分付加部105は、L信号に畳み込まれる頭部伝達関数の各組に、互いに異なる残響成分を付加する。
例えば、残響成分付加部105は、R信号に3組の頭部伝達関数が畳み込まれる場合は、3つの残響成分を設定する。同様に、残響成分付加部105は、例えば、L信号用に頭部伝達関数が3つ畳み込まれる場合は、3つの残響成分を設定する。なお、頭部伝達関数が3つ設定される場合に、3つの残響成分のうち2つは同じ残響成分であってもよい。
最後に、制御部100は、R信号に畳み込まれる頭部伝達関数を時間軸上で加算することにより、合成頭部伝達関数を生成し、L信号に畳み込まれる頭部伝達関数を時間軸上で加算することにより、合成頭部伝達関数を生成する(S25)。生成された合成頭部伝達関数は、生成部106に出力される。なお、上述のように、頭部伝達関数は、合成されずに畳み込まれてもよい。
[頭部伝達関数の調整の具体例]
以下、頭部伝達関数の調整の具体例について説明する。なお、以下の説明では、受聴者115の正面の位置を0°、受聴者115の耳軸上の位置を90°と定義し、R信号およびL信号のそれぞれに対して、60°、90°、および120°の3つの頭部伝達関数の組が畳み込まれるものとして説明する。なお、上述の両耳間時間差は、0°の頭部伝達関数において最も小さくなり、90度の頭部伝達関数において最も大きくなる。
ここで、R信号用の60°の頭部伝達関数の組は、図1の仮想フロントRスピーカ110の位置にR信号の音像を定位させるためのものであり、R信号用の90°の頭部伝達関数の組は、図1の仮想サイドRスピーカ112の位置にR信号の音像を定位させるためのものである。また、R信号用の120°の頭部伝達関数の組は、図1の仮想バックRスピーカ114の位置にR信号の音像を定位させるためのものである。
また、L信号用の60°の頭部伝達関数の組は、図1の仮想フロントLスピーカ109の位置にL信号の音像を定位させるためのものであり、L信号用の90°の頭部伝達関数の組は、図1の仮想サイドLスピーカ111の位置にL信号の音像を定位させるためのものである。また、L信号用の120°の頭部伝達関数の組は、図1の仮想バックLスピーカ113の位置にL信号の音像を定位させるためのものである。
なお、以下の説明では、R信号用の3組の頭部伝達関数は、互いに位相が揃っているものとし、L信号用の3組の頭部伝達関数は、互い位相が揃っているものとする。
まず、時間差制御部103の位相差(位相)の設定方法について説明する。図5は、位相差の設定方法を説明するための頭部伝達関数の時間波形を示す図である。なお、図5では、頭部伝達関数の組の一方(例えば、右耳用)を例示するものである。図5の(a)は、60°の頭部伝達関数の時間波形を示し、図5の(b)は、90°の頭部伝達関数の時間波形を示し、図5の(c)は、120°の頭部伝達関数の時間波形を示す。
図5の(a)に示されるように、時間差制御部103は、例えば、90°の頭部伝達関数を基準にして、60°の頭部伝達関数がN(N;N>0)msecの遅延を有するように位相(位相差)を設定する。
また、図5の(c)に示されるように、時間差制御部103は、例えば、90°の頭部伝達関数を基準にして、120°の頭部伝達関数がN+M(M;M>0)msecの遅延を有するように位相(位相差)を設定する。
なお、図5において、60°の頭部伝達関数と120°の頭部伝達関数との間に遅延がなく、90°の頭部伝達関数と位相が揃っている場合(N=0)は、受聴者115がそれぞれの頭部伝達関数による出力音を同時に聴くことを意味する。
遅延量Nは、90°の頭部伝達関数および60°の頭部伝達関数による仮想音像がそれぞれ互いに独立に定位する(定位すると受聴者115に知覚される)ように好適な値が設定される。同様に、遅延量N+Mは、60°の頭部伝達関数および120°の頭部伝達関数による仮想音像がそれぞれ互いに独立に定位する(定位すると受聴者115に知覚される)ように好適な値が設定される。
上記のような好適な遅延量は、例えば、あらかじめ主観評価実験を行うことにより決定される。まず、90°の頭部伝達関数と60°の頭部伝達関数との間の遅延量、および60°の頭部伝達関数と120°の頭部伝達関数との間の遅延量のそれぞれを可変させる。そして、先行音効果により90°の方位の仮想音像が先に知覚され、続いて60°、120°の方位の仮想音像が順に知覚されるような遅延量を決定する。
ただし、遅延量が大きすぎると、60°、90°、および120°のそれぞれの方位で独立して仮想音像が定位するだけでなく、エコー感が増大してしまい、聴感上不自然な音場となってしまう。このため、遅延量は大きすぎないことが望ましい。
なお、図5の例では、先行音効果により90°の頭部伝達関数が最も早く知覚されるように遅延量が設定されるが、他の方位の頭部伝達関数が先行音効果により最も早く知覚されるように遅延量が設定されてもよい。
次に、ゲイン調整部104のゲインの設定方法について説明する。図6は、ゲインの設定方法を説明するための頭部伝達関数の時間波形を示す図である。なお、図6では、時間差制御部103により位相が調整された60°、90°、および120°の頭部伝達関数の時間波形が図示されている。
ゲイン調整部104は、先行音効果により最も早く再生される90°の頭部伝達関数にはゲイン1を乗算し、振幅を変化させない。
一方、ゲイン調整部104は、60°の頭部伝達関数の振幅を1/a倍、120°の頭部伝達関数の振幅を1/b倍にゲイン設定する。
ここで、振幅の倍率を表す1/aは、90°の頭部伝達関数による仮想音像と、60°の頭部伝達関数による仮想音像とが互いに独立に定位し、かつ、受聴者115が効果的に仮想スピーカの音像を知覚できるように設定される。同様に、振幅の倍率を表す1/bは、60°の頭部伝達関数による仮想音像と、120°の頭部伝達関数による仮想音像とが互いに独立に定位し、かつ受聴者115が効果的に仮想スピーカの音像を知覚できるように設定される。
好適なゲインを決定するには、例えば、あらかじめ主観評価実験を行う。まず、90°の頭部伝達関数と60°の頭部伝達関数との間、および、60°の頭部伝達関数と120°の頭部伝達関数との間に上述の先行音効果を得られるように時間差(位相差)を設定する。つまり、受聴者115が90°の方位の仮想音像を先に知覚し、続いて60°、120°の方位の仮想音像を順に知覚するような先行音効果をまず確立させる。その上で、それぞれの頭部伝達関数のゲインを変更して、聴感上、受聴者115が効果的に仮想スピーカの音像を知覚できるようなゲインを決定する。
なお、受聴者115の周囲に先行音効果が明確に知覚できるような音場を生成するためには、最も早く知覚される90°の頭部伝達関数に対して、それ以外の方位の頭部伝達関数の振幅を少なくとも−2dB以下とする(a≧1.25、b≧1.25)ことが望ましい。しかしながら、生成する音場によってはこのように振幅を小さくせずにa=1.0、b=1.0、もしくはa<1.0、b<1.0としてもよい。
次に、残響成分付加部105の残響成分の付加方法について説明する。図7Aおよび図7Bは、異なる空間における残響成分を説明するための図である。
図7Aおよび図7Bは、それぞれ、空間(図7Aは小空間、図7は大空間)において、当該空間に設置したスピーカ120から測定用信号を再生し、中央に設置したマイク121で残響成分のインパルス応答を測定する様子を示している。図8Aは、図7Aの空間における残響成分のインパルス応答を示す図であり、図8Bは、図7Bの空間における残響成分のインパルス応答を示す図である。
図7Aに示される空間において、当該空間に設置したスピーカ120から測定用信号を再生すると、最初に直接波成分(図中の「direct」)がマイク121に到達し、続いて壁による反射波成分(1)から(4)がマイク121に到達する。なお、反射波成分はこれ以外にも無数に存在するが、簡単のため4つのみが図示されている。
同様に、図7Bに示される空間おいて、当該空間に設置したスピーカ120から測定用信号を再生すると、最初に直接波成分(図中の「direct」)がマイク121に到達し、続いて壁による反射波成分(1)’から(4)’がマイク121に到達する。小空間と大空間とでは空間の大きさが異なり、スピーカから壁までの距離、および、壁からマイクまでの距離が異なるため、図7Aの(1)から(4)の反射波成分が、それぞれ対応する図7Bの(1)’から(4)’の反射音成分よりも先に到達する。このため、図8Aおよび図8Bにそれぞれ示される残響成分のインパルス応答のように、小空間と大空間とでは残響成分に差がある。
続いて、このような残響成分の実測データについて説明する。図9Aは、小空間における残響成分のインパルス応答の実測データを示す図である。図9Bは、大空間における残響成分のインパルス応答の実測データを示す図である。なお、図9Aおよび図9Bのグラフの横軸は、サンプリング周波数48kHzでサンプリングを行った場合のサンプル数である。
図9Aに示される小空間における直接波成分と初期反射成分までの時間差は、Δt、図9Bに示される大空間における直接波成分と初期反射成分までの時間差は、Δt’と定義される。図10は、図9Aおよび図9Bの2つのインパルス応答の残響曲線を示す図である。なお、図10のグラフの横軸は、サンプリング周波数48kHzでサンプリングを行った場合のサンプル数である。
図10のグラフより、小空間および大空間のそれぞれにおける残響時間を算出することができる。ここで、残響時間とは、エネルギーが60dB減衰するのに要する時間を意味する。
小空間においては、5100−8000サンプル間で20dBの減衰が生じており、小空間における残響時間は約180msecと算出される。同様に、大空間においては、6000−8000サンプル間で3dBの減衰が生じており、大空間における残響時間は約850msecと算出される。ここで、実施の形態1において「異なる空間における残響成分」とは、少なくとも次式を満たす場合と定義される。すなわち、小空間における残響時間をRT_small、大空間における残響時間をRT_largeとした場合、異なる空間における残響成分は、次の(式1)を満たす。
Δt’≧Δt、かつRT_large≧RT_small・・(式1)
以上のように定義された異なる空間における残響成分を頭部伝達関数に付加する具体的な方法について説明する。まず、残響成分付加部105は、残響成分が少ない小空間における残響成分を、先行音効果により最も早く知覚される90°の頭部伝達関数に付加する(畳み込む)。これにより、残響成分による音像のぼやけが比較的少なく、明確に定位する仮想音像を生成することができる。
なお、大空間における残響成分は、言い換えれば、小空間における残響成分よりも反射音成分のエネルギーが大きい残響成分である。また、大空間における残響成分は、小空間における残響成分よりも反射音成分の継続時間長が長い残響成分である。
次に、残響成分付加部105は、残響成分が多い大空間における残響成分を60°の頭部伝達関数と120°の頭部伝達関数とにそれぞれ付加する(畳み込む)。これにより、残響成分による音像のぼやけが比較的大きく、受聴者115の周囲の広範囲に定位する仮想音像を生成することができる。
以上のように調整された頭部伝達関数(頭部伝達関数の組)が、取得部101が取得したR信号およびL信号に畳み込まれることで処理後のR信号および処理後のL信号が生成される。生成された処理後のR信号が耳近傍Rスピーカ119から再生され、生成された処理後のL信号が耳近傍Lスピーカ118再生されることによって、受聴者115は、90°方向には音像のぼやけが少ない明確な仮想音像を他の音像よりも先行して知覚し、時間的に少し遅れて60°方向および120°方向に音像のぼやけが大きく、拡がりのある仮想音像を知覚する。この結果、受聴者115の周囲に従来にはないワイドなサラウンド音場を生成される。つまり、音声信号処理装置10によれば、仮想音像により高いサラウンド感を得ることができる。
なお、上記のような頭部伝達関数の調整は、発明者の「両耳間位相差の大きい90°方向の仮想音像が、受聴者115の感じるサラウンド感に強い影響を与える」という知見に基づく一例であり、頭部伝達関数の調整方法は、特に限定されるものではない。
例えば、上記時間差制御部103、ゲイン調整部104、および残響成分付加部105の処理は、必須ではない。これらの処理なしで所望の音場が得られる場合は、これらの処理は行われる必要がない。
また、時間差制御部103、ゲイン調整部104、および残響成分付加部105の各処理が全て行われる必要はない。制御部100は、R信号(またはL信号)に畳み込まれる頭部伝達関数の各組に、互いに異なる残響成分を付加する処理、位相差を設定する処理、および、互いに異なるゲインを乗算する処理、のうち少なくとも1つの処理を行えば、仮想音場の調整が実現される。
また、時間差制御部103、ゲイン調整部104、および残響成分付加部105の各処理の順序についても、特に限定されるものではない。例えば、時間差制御部103は、必ずしも頭部伝達関数設定部102の後段に存在する必要はなく、ゲイン調整部104の後段に設けられてもよい。なぜなら、複数の方位に仮想音像を定位する複数の頭部伝達関数は互いに独立であるため、それぞれ個別にゲインを調整した後に頭部伝達関数間の時間差を調整しても同様の効果を得ることができるからである。
[効果等]
以上のように、実施の形態1において、音声信号処理装置10は、R信号およびL信号から構成されるステレオ信号を取得する取得部101と、第一処理および第二処理を行うことにより処理後のR信号および処理後のL信号を生成する制御部100と、処理後のR信号および処理後のL信号を出力する出力部107とを備える。
ここで、第一処理は、受聴者115の右側の互いに異なる2以上の位置にR信号の音像を定位させるために頭部伝達関数の右耳用および左耳用の組を少なくとも2組以上R信号に畳み込む処理である。「受聴者115の右側の互いに異なる2以上の位置」は、例えば、仮想フロントRスピーカ110の位置、仮想サイドRスピーカ112の位置、および仮想バックRスピーカ114位置の3つの位置である。
また、第二処理は、受聴者115の左側の互いに異なる2以上の位置にL信号の音像を定位させるために頭部伝達関数の右耳用および左耳用の組を少なくとも2組以上L信号に畳み込む処理である。「受聴者115の左側の互いに異なる2以上の位置」は、例えば、仮想フロントLスピーカ109の位置、仮想サイドLスピーカ111の位置、および仮想バックLスピーカ113位置の3つの位置である。
このように、1つのチャネル信号に対して頭部伝達関数の組を複数組畳み込むことで、例えば、処理後のR信号および処理後のL信号をヘッドフォンで受聴した際にも音が頭の外で鳴っているように感じることができる。つまり、受聴者115は、仮想音像による高いサラウンド感が得られる。
また、制御部100は、R信号に畳み込まれる頭部伝達関数の各組に、互いに異なる残響成分を付加してR信号に畳み込む第一処理を行い、L信号に畳み込まれる頭部伝達関数の各組に、互いに異なる残響成分を付加してL信号に畳み込む第二処理を行ってもよい。
具体的には、制御部100は、R信号に畳み込まれる頭部伝達関数の各組に、両耳間時間差が小さいほど大きな空間をシミュレートした残響成分を付加し、L信号に畳み込まれる頭部伝達関数の各組に、両耳間時間差が小さいほど大きな空間をシミュレートした残響成分を付加してもよい。
これにより、受聴者115は、両耳間時間差が大きな音については明瞭に知覚でき、かつ、両耳間時間差が小さい音によりサラウンド感を知覚することができる。
また、制御部100は、R信号に畳み込まれる頭部伝達関数の各組に、位相差を設定してR信号に畳み込む第一処理を行い、L信号に畳み込まれる頭部伝達関数の各組に、位相差を設定してL信号に畳み込む第二処理を行ってもよい。
これにより、受聴者115は、仮想音像の各定位位置からの音を時間差で受聴することができ、より頭外感を感じることができる。
また、制御部100は、R信号に畳み込まれる頭部伝達関数の各組に、両耳間時間差が小さいほど位相が遅れるように位相差を設定し、L信号に畳み込まれる頭部伝達関数の各組に、両耳間時間差が小さいほど位相が遅れるように位相差を設定してもよい。
これにより、受聴者115は、両耳間時間差が大きい位置に定位する音ほど先に音を聞くことができる。受聴者115は、先に聞こえる音であって両耳間時間差が大きい定位位置からの音を強く意識するため、より頭外感を感じることができる。
また、制御部100は、R信号に畳み込まれる頭部伝達関数の各組に、互いに異なるゲインを乗算してR信号に畳み込む第一処理を行い、L信号に畳み込まれる頭部伝達関数の各組に、互いに異なるゲインを乗算してL信号に畳み込む第二処理を行ってもよい。
これにより、受聴者115は、仮想音像の各定位位置から異なる大きさの音を受聴することができ、より頭外感を感じることができる。
また、制御部100は、R信号に畳み込まれる頭部伝達関数の各組に、両耳間時間差が大きいほど大きなゲインを乗算し、L信号に畳み込まれる頭部伝達関数の各組に、両耳間時間差が大きいほど大きなゲインを乗算してもよい。
これにより、両耳間時間差が大きくなればなるほど受聴者115に対して大きな音を聞かせることができる。そのため、受聴者115は、両耳間時間差が大きい定位位置からの音を強く意識するため、より頭外感を感じることができる。
また、制御部100は、R信号に畳み込まれる頭部伝達関数の各組に、(1)互いに異なる残響成分を付加する処理、(2)位相差を設定する処理、および、(3)互いに異なるゲインを乗算する処理、のうち少なくとも1つの処理を行ってR信号に畳み込む第一処理を行い、L信号に畳み込まれる頭部伝達関数の各組に、(1)互いに異なる残響成分を付加する処理、(2)位相差を設定する処理、および、(3)互いに異なるゲインを乗算する処理、のうち少なくとも1つの処理を行ってL信号に畳み込む第二処理を行ってもよい。
なお、制御部100は、詳細には、第一処理によって第一R信号および第一L信号を生成し、第二処理によって第二R信号および第二L信号を生成し、第一R信号と第二R信号とを合成することによって処理後のR信号を生成し、第一L信号と第二L信号とを合成することによって処理後のL信号を生成する。
より詳細には、R信号に畳み込まれる頭部伝達関数の2以上の組には、(1)受聴者115の右側の第一位置にR信号の音像を定位させるための、右耳用の第一頭部伝達関数および左耳用の第一頭部伝達関数の組と、(2)受聴者115の右側の第二位置にR信号の音像を定位させるための、右耳用の第二頭部伝達関数および左耳用の第二頭部伝達関数の組とが含まれる。同様に、L信号に畳み込まれる頭部伝達関数の2以上の組には、(1)受聴者115の左側の第三位置にL信号の音像を定位させるための、右耳用の第三頭部伝達関数(例えば図2BのFL_R)および左耳用の第三頭部伝達関数(例えば図2BのFL_L)の組と、(2)受聴者115の左側の第四位置にL信号の音像を定位させるための、右耳用の第四頭部伝達関数(例えば図2BのFL_R’)および左耳用の第四頭部伝達関数(例えば図2BのFL_L’)の組とが含まれる。
そして、制御部100は、第一処理によって、右耳用の第一頭部伝達関数および右耳用の第二頭部伝達関数をR信号に畳み込んだ第一R信号と、左耳用の第一頭部伝達関数および左耳用の第二頭部伝達関数をR信号に畳み込んだ第一L信号とを生成する。同様に、制御部100は、第二処理によって、右耳用の第三頭部伝達関数および右耳用の第四頭部伝達関数をL信号に畳み込んだ第二R信号と、左耳用の第三頭部伝達関数および左耳用の第四頭部伝達関数をL信号に畳み込んだ第二L信号とを生成する。第二R信号は、例えば、図2Bで耳近傍Rスピーカ119に出力される、L信号にFL_RおよびFL_R’が畳み込まれた信号であり、第二L信号は、例えば、図2Bで耳近傍Lスピーカ118に出力される、L信号にFL_LおよびFL_L’が畳み込まれた信号である。
また、制御部100は、第一処理においては、R信号に畳み込まれる頭部伝達関数である第一頭部伝達関数を2組以上合成した第一合成頭部伝達関数をR信号に畳み込むことによって、第一頭部伝達関数を2組以上R信号に畳み込み、第二処理においては、L信号に畳み込まれる頭部伝達関数である第二頭部伝達関数を2組以上合成した第二合成頭部伝達関数をL信号に畳み込むことによって、第二頭部伝達関数を2組以上L信号に畳み込んでもよい。
(他の実施の形態)
以上のように、本出願において開示する技術の例示として、実施の形態1を説明した。しかしながら、本開示における技術は、これに限定されず、適宜、変更、置き換え、付加、省略などを行った実施の形態にも適用可能である。また、上記実施の形態1で説明した各構成要素を組み合わせて、新たな実施の形態とすることも可能である。
そこで、以下、他の実施の形態をまとめて説明する。
上記実施の形態1では取得部101が取得する信号は、ステレオ信号であったが、ステレオ信号以外の2チャンネルの信号であってもよい。また、取得部101が取得する信号は、2チャンネルよりチャンネル数が多いマルチチャンネル信号でもよい。この場合、チャンネル信号ごとに対応する合成頭部伝達関数が生成されればよい。また、2チャンネル以上のマルチチャンネル信号のうちの一部のチャンネル信号だけが処理対象とされてもよい。
上記実施の形態1では、一例としてヘッドフォンなどの耳近傍Lスピーカ118および耳近傍Rスピーカ119が用いられたが、通常のLスピーカおよびRスピーカが用いられてもよい。
なお、上記実施の形態1において、各構成要素(例えば、制御部100に含まれる構成要素)は、専用のハードウェアで構成されるか、各構成要素に適したソフトウェアプログラムを実行することによって実現されてもよい。各構成要素は、CPUまたはプロセッサなどのプログラム実行部が、ハードディスクまたは半導体メモリなどの記録媒体に記録されたソフトウェアプログラムを読み出して実行することによって実現されてもよい。
なお、図1のブロック図に示される各機能ブロックは典型的には集積回路であるLSI(例えば、DSP:Digital Signal Processor)として実現される。これらは個別に1チップ化されてもよいし、一部または全てを含むように1チップ化されてもよい。
例えばメモリ以外の機能ブロックが1チップ化されていても良い。
ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。
また、集積回路化の手法はLSIに限るものではなく、専用回路又は汎用プロセッサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。
さらには、半導体技術の進歩または派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適応等が可能性としてありえる。
また、各機能ブロックのうち、符号化または復号化の対象となるデータを格納する手段だけ1チップ化せずに別構成としてもよい。
また、上記実施の形態1において、特定の処理部が実行する処理を別の処理部が実行してもよい。また、複数の処理の順序が変更されてもよいし、複数の処理が並行して実行されてもよい。
なお、本開示の包括的または具体的な態様は、システム、方法、集積回路、コンピュータプログラムまたはコンピュータ読み取り可能なCD−ROMなどの記録媒体で実現されてもよい。また、本開示の包括的または具体的な態様は、システム、方法、集積回路、コンピュータプログラムまたは記録媒体の任意な組み合わせで実現されてもよい。例えば、本開示は、音声信号処理方法として実現されてもよい。
以上のように、本開示における技術の例示として、実施の形態を説明した。そのために、添付図面および詳細な説明を提供した。
したがって、添付図面および詳細な説明に記載された構成要素の中には、課題解決のために必須な構成要素だけでなく、上記技術を例示するために、課題解決のためには必須でない構成要素も含まれ得る。そのため、それらの必須ではない構成要素が添付図面や詳細な説明に記載されていることをもって、直ちに、それらの必須ではない構成要素が必須であるとの認定をするべきではない。
また、上述の実施の形態は、本開示における技術を例示するためのものであるから、請求の範囲またはその均等の範囲において種々の変更、置き換え、付加、省略などを行うことができる。
本開示は、1組以上の対となるスピーカから音声信号を再生する装置を備えた機器に適用することができ、特に、サラウンドシステム、TV、AVアンプ、コンポ、携帯電話機、ポータブルオーディオ機器等に適用できる。
10 音声信号処理装置
100 制御部
101 取得部
102 頭部伝達関数設定部
103 時間差制御部
104 ゲイン調整部
105 残響成分付加部
106 生成部
107 出力部
109 仮想フロントLスピーカ
109a フロントLスピーカ
110 仮想フロントRスピーカ
111 仮想サイドLスピーカ
111a サイドLスピーカ
112 仮想サイドRスピーカ
113 仮想バックLスピーカ
114 仮想バックRスピーカ
115 受聴者
118 耳近傍Lスピーカ
119 耳近傍Rスピーカ
120 スピーカ
121 マイク

Claims (11)

  1. R信号およびL信号から構成されるステレオ信号を取得する取得部と、
    (1)受聴者の右側の互いに異なる2以上の位置に前記R信号の音像を定位させるために頭部伝達関数の右耳用および左耳用の組を少なくとも2組以上前記R信号に畳み込む第一処理であって、前記R信号に畳み込まれる前記頭部伝達関数の各組に、互いに異なる残響成分を付加して前記R信号に畳み込む前記第一処理と、(2)前記受聴者の左側の互いに異なる2以上の位置に前記L信号の音像を定位させるために頭部伝達関数の右耳用および左耳用の組を少なくとも2組以上前記L信号に畳み込む第二処理であって、前記L信号に畳み込まれる前記頭部伝達関数の各組に、互いに異なる残響成分を付加して前記L信号に畳み込む前記第二処理と、を行うことにより処理後のR信号および処理後のL信号を生成する制御部と、
    前記処理後のR信号および前記処理後のL信号を出力する出力部とを備える
    音声信号処理装置。
  2. 前記制御部は、
    前記R信号に畳み込まれる前記頭部伝達関数の各組に、両耳間時間差が小さいほど大きな空間をシミュレートした残響成分を付加し、
    前記L信号に畳み込まれる前記頭部伝達関数の各組に、両耳間時間差が小さいほど大きな空間をシミュレートした残響成分を付加する
    請求項に記載の音声信号処理装置。
  3. 前記制御部は、
    前記第一処理において、さらに、前記R信号に畳み込まれる前記頭部伝達関数の各組に、位相差を設定して前記R信号に畳み込み、
    前記第二処理において、さらに、前記L信号に畳み込まれる前記頭部伝達関数の各組に、位相差を設定して前記L信号に畳み込
    求項1または2に記載の音声信号処理装置。
  4. 前記制御部は、
    前記R信号に畳み込まれる前記頭部伝達関数の各組に、両耳間時間差が小さいほど位相が遅れるように位相差を設定し、
    前記L信号に畳み込まれる前記頭部伝達関数の各組に、両耳間時間差が小さいほど位相が遅れるように位相差を設定する
    請求項に記載の音声信号処理装置。
  5. 前記制御部は、
    前記第一処理において、さらに、前記R信号に畳み込まれる前記頭部伝達関数の各組に、互いに異なるゲインを乗算して前記R信号に畳み込み、
    前記第二処理において、さらに、前記L信号に畳み込まれる前記頭部伝達関数の各組に、互いに異なるゲインを乗算して前記L信号に畳み込
    求項1〜4のいずれか1項に記載の音声信号処理装置。
  6. 前記制御部は、
    前記R信号に畳み込まれる前記頭部伝達関数の各組に、両耳間時間差が大きいほど大きなゲインを乗算し、
    前記L信号に畳み込まれる前記頭部伝達関数の各組に、両耳間時間差が大きいほど大きなゲインを乗算する
    請求項に記載の音声信号処理装置。
  7. 前記制御部は、
    前記第一処理において、さらに、前記R信号に畳み込まれる前記頭部伝達関数の各組に、(1)位相差を設定する処理、および、()互いに異なるゲインを乗算する処理、のうち少なくとも1つの処理を行い、
    前記第二処理において、さらに、前記L信号に畳み込まれる前記頭部伝達関数の各組に、()位相差を設定する処理、および、(2)互いに異なるゲインを乗算する処理、のうち少なくとも1つの処理を行
    請求項1に記載の音声信号処理装置。
  8. 前記制御部は、
    前記第一処理によって第一R信号および第一L信号を生成し、
    前記第二処理によって第二R信号および第二L信号を生成し、
    前記第一R信号と前記第二R信号とを合成することによって前記処理後のR信号を生成し、
    前記第一L信号と前記第二L信号とを合成することによって前記処理後のL信号を生成する
    請求項1〜のいずれか1項に記載の音声信号処理装置。
  9. 前記R信号に畳み込まれる前記頭部伝達関数の2以上の組には、(1)前記受聴者の右側の第一位置に前記R信号の音像を定位させるための、右耳用の第一頭部伝達関数および左耳用の第一頭部伝達関数の組と、(2)前記受聴者の右側の第二位置に前記R信号の音像を定位させるための、右耳用の第二頭部伝達関数および左耳用の第二頭部伝達関数の組とが含まれ、
    前記L信号に畳み込まれる前記頭部伝達関数の2以上の組には、(1)前記受聴者の左側の第三位置に前記L信号の音像を定位させるための、右耳用の第三頭部伝達関数および左耳用の第三頭部伝達関数の組と、(2)前記受聴者の左側の第四位置に前記L信号の音像を定位させるための、右耳用の第四頭部伝達関数および左耳用の第四頭部伝達関数の組とが含まれ、
    前記制御部は、
    前記第一処理によって、前記右耳用の第一頭部伝達関数および前記右耳用の第二頭部伝達関数を前記R信号に畳み込んだ前記第一R信号と、前記左耳用の第一頭部伝達関数および前記左耳用の第二頭部伝達関数を前記R信号に畳み込んだ前記第一L信号とを生成し、
    前記第二処理によって、前記右耳用の第三頭部伝達関数および前記右耳用の第四頭部伝達関数を前記L信号に畳み込んだ前記第二R信号と、前記左耳用の第三頭部伝達関数および前記左耳用の第四頭部伝達関数を前記L信号に畳み込んだ前記第二L信号とを生成する
    請求項に記載の音声信号処理装置。
  10. 前記制御部は、
    前記第一処理においては、前記R信号に畳み込まれる前記頭部伝達関数である第一頭部伝達関数を2組以上合成した第一合成頭部伝達関数を前記R信号に畳み込むことによって、前記第一頭部伝達関数を2組以上前記R信号に畳み込み、
    前記第二処理においては、前記L信号に畳み込まれる前記頭部伝達関数である第二頭部伝達関数を2組以上合成した第二合成頭部伝達関数を前記L信号に畳み込むことによって、前記第二頭部伝達関数を2組以上前記L信号に畳み込む
    請求項1〜のいずれか1項に記載の音声信号処理装置。
  11. R信号およびL信号から構成されるステレオ信号を取得する取得ステップと、
    (1)受聴者の右側の互いに異なる2以上の位置に前記R信号の音像を定位させるために頭部伝達関数の右耳用および左耳用の組を少なくとも2組以上前記R信号に畳み込む第一処理であって、前記R信号に畳み込まれる前記頭部伝達関数の各組に、互いに異なる残響成分を付加して前記R信号に畳み込む前記第一処理と、(2)前記受聴者の左側の互いに異なる2以上の位置に前記L信号の音像を定位させるために頭部伝達関数の右耳用および左耳用の組を少なくとも2組以上前記L信号に畳み込む第二処理であって、前記L信号に畳み込まれる前記頭部伝達関数の各組に、互いに異なる残響成分を付加して前記L信号に畳み込む前記第二処理と、を行うことにより処理後のR信号および処理後のL信号を生成する制御ステップと、
    前記処理後のR信号および前記処理後のL信号を出力する出力ステップとを含む
    音声信号処理方法。
JP2014542039A 2013-06-20 2014-06-11 音声信号処理装置、および音声信号処理方法 Active JP5651813B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014542039A JP5651813B1 (ja) 2013-06-20 2014-06-11 音声信号処理装置、および音声信号処理方法

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2013129159 2013-06-20
JP2013129159 2013-06-20
JP2014542039A JP5651813B1 (ja) 2013-06-20 2014-06-11 音声信号処理装置、および音声信号処理方法
PCT/JP2014/003105 WO2014203496A1 (ja) 2013-06-20 2014-06-11 音声信号処理装置、および音声信号処理方法

Publications (2)

Publication Number Publication Date
JP5651813B1 true JP5651813B1 (ja) 2015-01-14
JPWO2014203496A1 JPWO2014203496A1 (ja) 2017-02-23

Family

ID=52104248

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014542039A Active JP5651813B1 (ja) 2013-06-20 2014-06-11 音声信号処理装置、および音声信号処理方法

Country Status (3)

Country Link
US (1) US9794717B2 (ja)
JP (1) JP5651813B1 (ja)
WO (1) WO2014203496A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9820073B1 (en) 2017-05-10 2017-11-14 Tls Corp. Extracting a common signal from multiple audio signals
CN115866505A (zh) * 2018-08-20 2023-03-28 华为技术有限公司 音频处理方法和装置
US11540049B1 (en) * 2019-07-12 2022-12-27 Scaeva Technologies, Inc. System and method for an audio reproduction device

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004102099A (ja) * 2002-09-12 2004-04-02 Minolta Co Ltd 画像形成装置及び画像形成方法
JP2005051801A (ja) * 2004-09-06 2005-02-24 Yamaha Corp 音像定位装置
JP2008211834A (ja) * 2004-12-24 2008-09-11 Matsushita Electric Ind Co Ltd 音像定位装置
JP2009105565A (ja) * 2007-10-22 2009-05-14 Onkyo Corp 仮想音像定位処理装置および仮想音像定位処理方法
WO2012144227A1 (ja) * 2011-04-22 2012-10-26 パナソニック株式会社 音声信号再生装置、音声信号再生方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07203595A (ja) 1993-12-29 1995-08-04 Matsushita Electric Ind Co Ltd 音場信号再生装置
EP0666556B1 (en) 1994-02-04 2005-02-02 Matsushita Electric Industrial Co., Ltd. Sound field controller and control method
JPH07222297A (ja) 1994-02-04 1995-08-18 Matsushita Electric Ind Co Ltd 音場再生装置
JP2731751B2 (ja) 1995-07-17 1998-03-25 有限会社井藤電機鉄工所 ヘッドホン装置
JPH10200999A (ja) 1997-01-08 1998-07-31 Matsushita Electric Ind Co Ltd カラオケ装置
AUPQ938000A0 (en) * 2000-08-14 2000-09-07 Moorthy, Surya Method and system for recording and reproduction of binaural sound
JP3435156B2 (ja) * 2001-07-19 2003-08-11 松下電器産業株式会社 音像定位装置
JP2006203850A (ja) 2004-12-24 2006-08-03 Matsushita Electric Ind Co Ltd 音像定位装置
CN103716748A (zh) * 2007-03-01 2014-04-09 杰里·马哈布比 音频空间化及环境模拟
JP5540581B2 (ja) * 2009-06-23 2014-07-02 ソニー株式会社 音声信号処理装置および音声信号処理方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004102099A (ja) * 2002-09-12 2004-04-02 Minolta Co Ltd 画像形成装置及び画像形成方法
JP2005051801A (ja) * 2004-09-06 2005-02-24 Yamaha Corp 音像定位装置
JP2008211834A (ja) * 2004-12-24 2008-09-11 Matsushita Electric Ind Co Ltd 音像定位装置
JP2009105565A (ja) * 2007-10-22 2009-05-14 Onkyo Corp 仮想音像定位処理装置および仮想音像定位処理方法
WO2012144227A1 (ja) * 2011-04-22 2012-10-26 パナソニック株式会社 音声信号再生装置、音声信号再生方法

Also Published As

Publication number Publication date
US20160100270A1 (en) 2016-04-07
JPWO2014203496A1 (ja) 2017-02-23
US9794717B2 (en) 2017-10-17
WO2014203496A1 (ja) 2014-12-24

Similar Documents

Publication Publication Date Title
JP5298199B2 (ja) モノフォニック対応およびラウドスピーカ対応のバイノーラルフィルタ
JP6607895B2 (ja) 少なくとも一つのフィードバック遅延ネットワークを使ったマルチチャネル・オーディオに応答したバイノーラル・オーディオの生成
KR101567461B1 (ko) 다채널 사운드 신호 생성 장치
JP5533248B2 (ja) 音声信号処理装置および音声信号処理方法
US8873761B2 (en) Audio signal processing device and audio signal processing method
JP6620235B2 (ja) サウンドステージ拡張のための機器及び方法
JP6215478B2 (ja) 少なくとも一つのフィードバック遅延ネットワークを使ったマルチチャネル・オーディオに応答したバイノーラル・オーディオの生成
JP2012004668A (ja) 頭部伝達関数生成装置、頭部伝達関数生成方法及び音声信号処理装置
JP2008522483A (ja) 多重チャンネルオーディオ入力信号を2チャンネル出力で再生するための装置及び方法と、これを行うためのプログラムが記録された記録媒体
JP6479287B1 (ja) オーディオ再生のためのサブバンド空間クロストークキャンセル
JP2009194682A (ja) 頭部伝達関数測定方法、頭部伝達関数畳み込み方法および頭部伝達関数畳み込み装置
JP5816072B2 (ja) バーチャルサラウンドレンダリングのためのスピーカアレイ
JP2006121152A (ja) 音声信号処理装置および音声信号処理方法
JP5118267B2 (ja) 音声信号再生装置、音声信号再生方法
CN113170271A (zh) 用于处理立体声信号的方法和装置
JP6947936B2 (ja) カンファレンスのためのサブバンド空間処理およびクロストークキャンセルシステム
JP5651813B1 (ja) 音声信号処理装置、および音声信号処理方法
JP2024502732A (ja) バイノーラル信号の後処理
JP2021013063A (ja) オーディオ信号処理装置、オーディオ信号処理方法及びオーディオ信号処理プログラム
CN112602338A (zh) 信号处理装置、信号处理方法和程序
JP6438004B2 (ja) デジタルオーディオ信号のサウンドを再生するための方法
JP2010178373A (ja) 頭部伝達関数測定方法、頭部伝達関数畳み込み方法および頭部伝達関数畳み込み装置
JP2007202020A (ja) 音声信号処理装置、音声信号処理方法、プログラム
JP2008104240A (ja) 音声信号処理装置および音声信号処理方法
Bejoy Virtual surround sound implementation using deccorrelation filters and HRTF

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20141009

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20141009

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141104

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141117

R150 Certificate of patent or registration of utility model

Ref document number: 5651813

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250