JP2010193323A - 録音装置、再生装置、録音方法、再生方法、及びコンピュータプログラム - Google Patents
録音装置、再生装置、録音方法、再生方法、及びコンピュータプログラム Download PDFInfo
- Publication number
- JP2010193323A JP2010193323A JP2009037248A JP2009037248A JP2010193323A JP 2010193323 A JP2010193323 A JP 2010193323A JP 2009037248 A JP2009037248 A JP 2009037248A JP 2009037248 A JP2009037248 A JP 2009037248A JP 2010193323 A JP2010193323 A JP 2010193323A
- Authority
- JP
- Japan
- Prior art keywords
- sound
- frequency band
- frequency
- signal
- phase
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Stereophonic System (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
【解決手段】音を電気信号に変換するマイクロホンアレイ部110と、アナログの電気信号をデジタル信号に変換するA−D変換器130と、マイクロホンアレイの各デジタル信号を周波数帯域毎にその強度を示す信号に分解する時間周波数変換部141と、周波数帯域毎に各デジタル信号間の位相差を求めて、音到来方向を特定する雑音・主音判別部143と、音到来方向が特定された周波数帯域毎にデジタル信号間の位相を各音出力手段の位置に対応させて補正する補正情報を取得する記憶装置160と、補正情報に基づいて、音到来方向が特定された周波数帯域毎に各デジタル信号間の位相を補正する主音振幅・位相補正処理部148とを備える、ことを特徴とする。
【選択図】図2A
Description
音をアナログの電気信号に変換する複数のマイクロホンを有するマイクロホンアレイと、
前記マイクロホンアレイに含まれる各マイクロホンによって変換されたアナログの電気信号をデジタル信号に変換するA−D変換手段と、
所定の時間毎に、前記A−D変換手段によって変換された各前記マイクロホンのデジタル信号を周波数帯域毎にその強度を示す信号に分解する時間周波数分解手段と、
前記時間周波数分解手段によって分解された周波数帯域毎に各前記マイクロホンのデジタル信号間の位相差を求めて、音の到来方向を特定する音到来方向特定手段と、
音出力装置の各音出力手段の位置関係に基づき、前記音到来方向特定手段によって音の到来方向が特定された周波数帯域毎に各前記マイクロホンのデジタル信号間の位相を各前記音出力手段の位置に対応させて補正する補正情報を取得する取得手段と、
前記取得手段によって取得された補正情報に基づいて、前記音到来方向特定手段によって音の到来方向が特定された周波数帯域毎に各前記マイクロホンのデジタル信号間の位相を補正する補正手段とを備える、ことを特徴とする。
前記補正手段は、前記成分判別手段によって、主音成分と判別された周波数帯域の信号に対してのみ位相と振幅とを補正する、ことを特徴とする。
前記音出力チャンネル信号生成手段によって生成された複数のデジタル信号を記憶する記憶手段とを備える、ことを特徴とする。
前記記憶手段は、前記取得手段が取得した補正情報をさらに記憶し、
前記補正手段は、前記音到来方向特定手段によって周波数帯域毎に特定された音の到来する方向と、前記記憶手段に記憶された補正情報とに基づいて、各前記主音成分の位相と振幅とを補正する、ことを特徴とする。
周波数帯域毎に同一の前記マイクロホンによって過去に取得された信号の強度と現在の信号の強度とを基にして、雑音のレベルを示す雑音レベルを算出する雑音レベル算出手段と、
前記時間周波数分解手段によって分解された周波数帯域毎にその強度を示す信号が前記雑音レベル算出手段によって算出された雑音レベル以上か未満かを判別するレベル判別手段と、
前記レベル判別手段により所定のレベル未満と判別されたことに応答して、該周波数帯域を雑音成分とし、所定のレベル以上と判別されたことに応答して、周波数帯域毎に各前記マイクロホンのデジタル信号間に相互に関連があるかを判別する相関関係判別手段と、
前記相関関係判別手段により相互に関連がないと判別されたことに応答して、該周波数帯域を雑音成分とし、相互に関連があると判別されたことに応答して、該周波数帯域を空間上の音源から到来した主音成分と判別する雑音主音判別手段とを備える、ことを特徴とする。
音出力装置の各音出力手段の位置関係に基づき、周波数帯域毎に録音装置の各マイクロホンのデジタル信号間の位相を各前記音出力手段の位置に対応させて補正する補正情報を取得する取得手段と、
前記録音装置の各マイクロホンにより集音され、所定の時間毎に各前記マイクロホンのデジタル信号を周波数帯域毎にその強度を示す信号に分解されたデジタル信号を取得する音取得手段と、
前記取得手段によって取得された補正情報に基づいて、前記音取得手段によって取得された周波数帯域毎に分解された各前記デジタル信号を読み出し、周波数帯域毎に各前記マイクロホンのデジタル信号間の位相差を求めて、音の到来方向を特定する音到来方向特定手段と、
前記取得手段によって取得された補正情報に基づいて、前記音到来方向特定手段によって音の到来方向が特定された周波数帯域毎に各前記マイクロホンのデジタル信号間の位相を補正する補正手段と、
前記補正手段によって位相が補正された各前記マイクロホンのデジタル信号に基づいて、複数の各前記音出力手段の数に対応する複数の周波数帯域毎に分解されたデジタル信号を生成する出力チャンネル信号生成手段と、
前記出力チャンネル信号生成手段によって生成された周波数帯域毎に分解された各デジタル信号を合成して、時間帯域毎に分割された各デジタル信号に変換する周波数時間変換手段と、
前記周波数時間変換手段によって変換された時間帯域毎に分割された各デジタル信号をアナログの電気信号に変換するD−A変換手段とを備え、
前記音出力手段は、前記D−A変換手段によって変換された電気信号を音に変換する、ことを特徴とする。
複数の音取得手段によって取得された音をアナログの電気信号に変換する音変換ステップと、
前記音変換ステップによって変換されたアナログの電気信号をデジタル信号に変換するA−D変換ステップと、
所定の時間毎に、前記A−D変換ステップによって変換された各マイクロホンのデジタル信号を周波数帯域毎にその強度を示す信号に分解する時間周波数分解ステップと、
前記時間周波数分解ステップによって分解された周波数帯域毎に各前記マイクロホンのデジタル信号間の位相差を求めて、音の到来方向を特定する音到来方向特定ステップと、
音出力装置の各音出力手段の位置関係に基づき、前記音到来方向特定ステップによって音の到来方向が特定された周波数帯域毎に各前記マイクロホンのデジタル信号間の位相を各前記音出力手段の位置に対応させて補正する補正情報を取得する取得ステップと、
前記取得ステップによって取得された補正情報に基づいて、前記音到来方向特定ステップによって音の到来方向が特定された周波数帯域毎に各前記マイクロホンのデジタル信号間の位相を補正する補正ステップとを含む、ことを特徴とする。
音出力装置の各音出力手段の位置関係に基づき、周波数帯域毎に録音装置の各マイクロホンのデジタル信号間の位相を各前記音出力手段の位置に対応させて補正する補正情報を取得する取得ステップと、
前記録音装置の各マイクロホンにより集音され、所定の時間毎に各マイクロホンのデジタル信号を周波数帯域毎にその強度を示す信号に分解されたデジタル信号を取得する音取得ステップと、
前記取得ステップによって取得された補正情報に基づいて、前記音取得ステップによって取得された周波数帯域毎に分解された各前記デジタル信号を読み出し、周波数帯域毎に各前記マイクロホンのデジタル信号間の位相差を求めて、音の到来方向を特定する音到来方向特定ステップと、
前記取得ステップによって取得された補正情報に基づいて、前記音到来方向特定ステップによって音の到来方向が特定された周波数帯域毎に各前記マイクロホンのデジタル信号間の位相を補正する補正ステップと、
前記補正ステップによって位相が補正された各前記マイクロホンのデジタル信号に基づいて、複数の各前記音出力手段の数に対応する複数の周波数帯域毎に分解されたデジタル信号を生成する出力チャンネル信号生成ステップと、
前記出力チャンネル信号生成ステップによって生成された周波数帯域毎に分解された各前記デジタル信号を合成して、時間帯域毎に分割された各デジタル信号に変換する周波数時間変換ステップと、
前記周波数時間変換ステップによって変換された時間帯域毎に分割された各前記デジタル信号をアナログの電気信号に変換するD−A変換ステップと、
前記D−A変換ステップによって変換された電気信号を音に変換する複数の各前記音出力手段に音を出力させる音出力ステップとを含む、ことを特徴とする。
複数のマイクロホンを備えたコンピュータを、
音をアナログの電気信号に変換する複数のマイクロホンを有するマイクロホンアレイと、
前記マイクロホンアレイに含まれる各マイクロホンによって変換されたアナログの電気信号をデジタル信号に変換するA−D変換手段と、
所定の時間毎に、前記A−D変換手段によって変換された各前記マイクロホンのデジタル信号を周波数帯域毎にその強度を示す信号に分解する時間周波数分解手段と、
前記時間周波数分解手段によって分解された周波数帯域毎に各前記マイクロホンのデジタル信号間の位相差を求めて、音の到来方向を特定する音到来方向特定手段と、
音出力装置の各音出力手段の位置関係に基づき、前記音到来方向特定手段によって音の到来方向が特定された周波数帯域毎に各前記マイクロホンのデジタル信号間の位相を各前記音出力手段の位置に対応させて補正する補正情報を取得する取得手段と、
前記取得手段によって取得された補正情報に基づいて、前記音到来方向特定手段によって音の到来方向が特定された周波数帯域毎に各前記マイクロホンのデジタル信号間の位相を補正する補正手段として機能させる、ことを特徴とする。
複数のスピーカを備えたコンピュータを、
音出力装置の各音出力手段の位置関係に基づき、周波数帯域毎に録音装置の各マイクロホンのデジタル信号間の位相を各前記音出力手段の位置に対応させて補正する補正情報を取得する取得手段と、
前記録音装置の各マイクロホンにより集音され、所定の時間毎に各前記マイクロホンのデジタル信号を周波数帯域毎にその強度を示す信号に分解されたデジタル信号を取得する音取得手段と、
前記取得手段によって取得された補正情報に基づいて、前記音取得手段によって取得された周波数帯域毎に分解された各前記デジタル信号を読み出し、周波数帯域毎に各前記マイクロホンのデジタル信号間の位相差を求めて、音の到来方向を特定する音到来方向特定手段と、
前記取得手段によって取得された補正情報に基づいて、前記音到来方向特定手段によって音の到来方向が特定された周波数帯域毎に各前記マイクロホンのデジタル信号間の位相を補正する補正手段と、
前記補正手段によって位相が補正された各前記マイクロホンのデジタル信号に基づいて、複数の各前記音出力手段の数に対応する複数の周波数帯域毎に分解されたデジタル信号を生成する出力チャンネル信号生成手段と、
前記出力チャンネル信号生成手段によって生成された周波数帯域毎に分解された各前記デジタル信号を合成して、時間帯域毎に分割された各デジタル信号に変換する周波数時間変換手段と、
前記周波数時間変換手段によって変換された時間帯域毎に分割された各前記デジタル信号をアナログの電気信号に変換するD−A変換手段と、
前記音出力手段は、前記D−A変換手段によって変換された電気信号を音に変換するように機能させる、ことを特徴とする。
実施形態1に係る録音再生装置100は、マイクロホンアレイによって収録した音を再現する際に、再生装置に対応させて音の位相を補正して、臨場感を保持したまま再現する。
実施形態1の録音再生装置100は、物理的には、図1に示すように、マイクロホンアレイ部110と、LPF120、180と、A−D変換器130と、制御装置140と、一時記憶装置150と、記憶装置160と、D−A変換器170と、再生装置190とを備える。
LPF(Low Pass Filter)120は、マイクロホン毎に配置され、対応するマイクロホンからのアナログの電気信号の中から、A−D変換器130のサンプリングレートの0.5倍以上の周波数成分を除去して、帯域制限されたアナログの電気信号をA−D変換器130に出力する。
A−D変換器(Analog to Digital Converter)130は、帯域制限された各アナログの電気信号を対応するデジタル信号に変換して、制御装置140に出力する。
一時記憶装置150は、制御装置140によってプログラムが実行される際に、処理中のデータ等を一時的に記憶する。
記憶装置160は、制御装置140によって実行されるプログラムやデータ等を記憶する。
なお、制御装置140と、一時記憶装置150と、記憶装置160とによって、音が発生する位置を再現する音響効果である音像定位機能を実現する処理内容の中心部分については、後述する。
LPF180は、アナログに変換された電気信号を帯域制限して、サンプリングレートの0.5倍以上の周波数成分を取り除き、再生装置190に出力する。
再生装置190は、電気信号を音圧に変換する。本実施形態では、再生装置190としてヘッドホンの場合と、複数のスピーカとの場合について説明する。
本実施形態の録音再生装置100の録音部は、図2Aに示すように、機能的に、マイクロホンアレイ部110と、LPF120と、A−D変換器130と、時間周波数変換部141と、雑音レベル推定部142と、雑音・主音判別部143と、主音振幅・位相補正処理部148と、補正主音・雑音録音処理部144と、周波数時間変換部149と、聴取者頭部伝達関数保存部163と、マイク配置情報保存部164と、データベース161とを備える。
A−D変換器130は、LPF120によって帯域制限された電気信号をデジタル信号に変換する。その際に、A−D変換器130は、デジタル信号を所定のサンプル数毎に纏めて(フレームシフト、以下shiftと表す)時間周波数変換部141に出力する。A−D変換器130から出力されるデジタル信号は、マイクロホンの識別番号をi、サンプリングタイミングをtとすると、xi(t)と表される。
ここで、フーリエ変換するサンプリング時間(t)のグループをフレームと言い、フーリエ変換するフレームサイズをL、時間領域の信号から周波数領域の信号へ変換した回数をフレームインデックスτと言い、ハミング窓関数をw(n)とすると、周波数領域に変換した後の信号xi(f,τ)は、下記の数1で表せる。
また、取得された音の信号が時間領域の信号から周波数領域の信号に変換される度に雑音レベルを推定することにより、実際の雑音レベルの変化に追従することができる。なお、雑音レベル推定部142の処理の詳細については、後述する。
なお、頭部伝達関数とは、頭の中心に相当する自由空間上の1点と、耳道内の1点との間の伝達関数のことであり、音が聴取者の頭部、胸部、耳介などでの反射・回折の影響を含むため、身体形状の方向依存性、個人性が強く反映される。そのため、再生時に音源を定位させるために、頭部伝達関数に基づいて音の再生処理をする。
まず、主音振幅・位相補正処理部148は、雑音・主音判別部143によって出力された主音成分と判別された周波数帯域毎の周波数領域のデータの音源方向を推定する。次に、主音振幅・位相補正処理部148は、聴取者頭部伝達関数保存部163から読み出した聴取者頭部伝達関数と、マイク配置情報保存部164から読み出した録音時のマイクの配置情報とに基づいて、音源方向に対する各マイクロホンの振幅比と位相差とを表すステアリングベクトルを求める。そして、主音振幅・位相補正処理部148は、該ステアリングベクトルに基づいて主音成分の位相と振幅とを補正する。なお、主音振幅・位相補正処理部148が、主音成分と判別された周波数帯域毎の周波数領域のデータの位相と振幅とを補正する処理の詳細については、後述する。
なぜなら、非特許文献1に記載されているように、一般的に主音が音声の場合に、非常に短い時間であれば各フレームの周波数帯域毎に複数の音源が混ざることがなく、各フレームの周波数帯域毎に1つの音源しか存在しないと仮定しても問題が生じないからである。また、一般に雑音レベルは主音レベルよりも小さいため、主音が存在する各フレームの周波数帯域を雑音が存在する各フレームの周波数帯域として誤判定する確率は低いからである。さらに、図3の左から6番目のフレームにおいて、音声1と音声2とが同じフレームに存在し、音声2の周波数領域も音声1の周波数領域に割り当てられているが、音声再生処理では問題は生じない。
図2Bは再生時の構成を示す図であり、再生部の再生機能は、データベース161と、再生機器情報保存部162と、再生方法認識部147と、再生処理部146と、D−A変換器170と、LPF180と、再生装置190とを備える。
例えば、録音再生装置100が携帯電話の場合、ヘッドホン端子にヘッドホンのプラグが刺さっているか否かを検出するセンサを備え、刺さっている場合には、再生装置190をヘッドホンと判別して、刺さっていない場合、再生装置190を携帯電話に搭載されたスピーカと判別する。また、携帯電話の利用者が音声を再生する際に、再生方法認識部147へ再生方法を選択する指示を受け付ける構成にしてもよい。
次に、この録音再生装置100の動作を説明する。
まず、この録音再生装置100を録音装置として機能させる場合について説明する。
マイクロホンアレイ部110によって集音されて、アナログの電気信号に変換された音信号は、LPF120によって帯域制限され、A−D変換器130によってデジタル信号xi(t)に変換され、時間周波数変換部141(制御装置140)に供給される。
前述の通り、周波数領域に変換された信号xi(f,τ)は、数1で表される。
なお前述したように、フーリエ変換するサンプリング時間(t)のグループをフレームと言い、フーリエ変換するフレームサイズをL、時間領域の信号から周波数領域の信号へ変換した回数をフレームインデックスτとする。ハミング窓関数をw(n)とする。
数1で示すように、時間周波数変換部141によって周波数領域に変換された信号xi(f,τ)は、雑音レベル推定部142に出力され、雑音レベルが推定される。
まず、1つのフレームの全周波数に渡って、存在する純音(一つの正弦波の音)の周波数とその強度とを示すパワースペクトル(信号が周波数毎に含んでいるエネルギーをグラフにしたもの)を算出する(ステップS101)。
このパワースペクトルの算出は、周波数帯域毎に複数チャンネルの音声信号
X(f,τ)=[x1(f,τ),...,xi(f,τ),...,xM(f,τ)] (Mはマイクロホン数、iは添え字)に、
y(f,τ)=||X(f,τ)||2
で表される演算をすることにより求める。
この平滑化処理は、ステップS101で求められたパワースペクトラムに、数2で表される演算をすることにより求める。なお、w(i)はハミング窓関数を示し、ハミング窓により平滑化する範囲を2Lw+1とする。
この時間方向スペクトル平滑化処理は、ステップS102で求められた周波数帯域毎のパワースペクトラムに、
S(f,τ)=αsS(f,τ−1)+(1−αs)Sf(f,τ)
で表される演算をすることにより求める。なお、αsは予め定める更新係数とする。Sfは、時間的に古いフレームにおいて算出されたパワースペクトルを示す。
最小統計値Smin(f,τ)=min[S(f,τ),S(f,τ-1),…,S(f,τ−N)]
この音存在確率更新処理は、数4で表すことができる。なお、αpは予め定める係数とする。
この雑音係数は、数5で表すことができる。なお、αは予め定める係数とする。
この雑音レベルσdを更新する処理は、数6で表すことができる。
該フレームの周波数帯域毎にその周波数成分に含まれる音の到来方向を推定し、推定された周波数帯域毎に音の到来方向を示す音源方向θ(f,τ)を求める(ステップS210)。
M個あるマイクロホンの中から対となるマイクペアを複数定め、マイクロホン同士の間隔をdiとし、その間隔が狭いマイクペアの方から順に処理をして、音源方向θ(f,τ)を推定する。この処理の詳細については、後述する。
音源方向の尤度L(f,τ)が閾値を超えていないと判別された場合(ステップS230;NO)、該周波数領域の信号を雑音と判定し、出力する(ステップS250)。
この雑音推定処理は、数8によってSNRを求める。
主音振幅・位相補正処理部148による主音の補正処理と、補正主音・雑音録音処理部144の処理とは、後述する。
まず、処理中のマイクペアのインデックス(添え字)をi=1とし、マイクペアの位相差をδ^(0)=0とする(ステップS2101)。
上記処理により、各周波数帯域の主音の到来方向を推定することができる。
図7のフローチャートに示すように、主音振幅・位相補正処理部148において、主音と判別された周波数帯域の位相と振幅とを補正する。
なお、前述したように以下の説明では、周波数領域に変換された1つの周波数帯域には1つの主音しか存在しない場合を前提に説明するが、1つの周波数帯域に複数の主音が存在し、且つ音源分離により複数の主音を分離することができる場合には、主音毎に音源方向θ(f,τ)を算出する以外は同様の処理をして、補正された主音同士を重畳すればよい。
時間・周波数毎の方向推定処理(ステップS210)によって、主音と推定された周波数帯域毎の音源方向θ(f,τ)の情報を読み出す(ステップS401)。
例えば、ステアリングベクトルを取得する場合、主音振幅・位相補正処理部148は、再生方法認識部147を介して、再生機器情報保存部162から再生装置190の音出力手段毎に対応したステアリングベクトルを取得する。さらに、聴取者の嗜好に合わせて周波数帯域毎の強度、周波数特性を補正した補正ステアリングベクトルを取得してもよい。
例えば、ステアリングベクトルを算出する場合、主音振幅・位相補正処理部148は、再生方法認識部147を介して、再生機器情報保存部162から再生装置190のスピーカ間隔等の算出条件を取得し、所定の式に基づいて、ステアリングベクトルを算出する。
人間の頭部302の両耳間隔をdとすると、数13によって、ステアリングベクトルが算出される(ステップS402)。
事前に、リスニングポイント401上の利用者の両耳位置にマイクを仕込み音源方向θから到来する単一音源に対するインパルス応答を収録して、この収録値に近似した値に調整されたFIR (Finite Impulse Response)フィルタを求める。この各スピーカ毎のFIRフィルタの値をフーリエ変換して周波数帯域毎のベクトルにしたものを音源方向θのステアリングベクトルとする。
主音と判別された周波数帯域の周波数領域のデータは、推定された音源方向θと、各スピーカ毎のFIRフィルタとが掛け合わされて、位相と振幅とが補正される。補正された信号は、時間領域のデジタル信号に変換され、D−A変換器170によってアナログ信号変換され、LPF180によって帯域制限され、各スピーカ402、403、404、405から音として出力される。
なお、このステアリングベクトルは固定的なものではなく、聴取者の嗜好に合わせて特定の周波数成分を強調したり、周波数帯域毎に係数を変化させても構わない。この嗜好の情報は、再生機器情報保存部162に保存しておいてもよい。
なお、図7のフローチャートは、1つのフレームの周波数帯域に1つの音源しか無いことを前提として説明した。
1つの周波数帯域に複数の音源が存在する場合には、雑音・主音判別処理によって、主音毎に音源方向が推定され音源分離信号を受け取り、主音毎にステップS401からS403の処理を行い、ステップS403によって、多チャンネルの信号に変換された後に、主音毎に同じチャンネルの同じ周波数の信号を加算すればよい。
上述したように、図7のフローチャートに示した処理により、主音の位相と振幅とを補正することができる。また、この処理により主音の周波数成分のデータを出力するチャンネル分に生成することができる。
なお、補正後の主音のチャンネル数が増減した場合、雑音・主音判別部143によって出力される雑音チャンネル数を増減してから主音のチャンネルと重畳するか、主音振幅・位相補正処理部148から位相をランダムにずらした雑音成分が加算された主音の供給を受けて、雑音を重畳しなくてもよい。
再生の指示を受けると、再生処理部146は、再生方法認識部147を介して再生機器情報保存部162に保存されている再生装置190の情報を取得する。再生機器処理部146は、再生するチャンネル分の音のデジタル信号を読み出し、再生する機器に対応させて振幅等を補正して、所定のタイミングでD−A変換器170に出力する。
各チャンネルの信号は、D−A変換器170によってアナログの電気信号に変換され、再生装置190の各出力器によって音に変換され、出力される。
また、主音と判別された信号に限って、位相と振幅とを補正することによって、目的となる音を明瞭に再現することができる。
さらに、録音する際に、再生装置190の音出力手段に合わせて主音の位相と振幅とを修正した音データを生成するため、再生時に複雑な処理をしなくても、臨場感ある音を再現することができる。
上述した、図7のフローチャートに示した主音の位相と振幅とを補正する処理では、既存のステアリングベクトルのデータ又は、詳細な式を使用した。ここでは、図10のフローチャートに示すような簡略化した式による演算によって位相と振幅とを補正する方法について説明する。なお、この簡略した式による演算によって位相と振幅とを補正する方法は、同一平面上に2つのマイクロホンが配設された録音装置によって録音され、図8によって示されるようにヘッドホンによって音を再生することを想定している。
例えば、図6のフローチャートに示した位相差計算処理(ステップS2102)等によって、各フレームの周波数帯域毎に主音の位相差σを算出する(ステップS411)。
数14によって、各フレームの周波数帯域毎の主音の位相を変換する(ステップS412)。なお、ここでは、マイク間隔をd1とし、ヘッドホンの両耳間隔をd2とする。
生成された各チャンネルの信号は、補正主音・雑音録音処理部144に出力される。
なお、この各チャンネルの信号に位相をランダムにずらした雑音成分を加算してもよい。
1つの周波数帯域に複数の音源が存在する場合には、雑音・主音判別処理によって、主音毎に音源方向が推定され音源分離信号を受け取り、主音毎にステップS411からS413の処理を行い、ステップS413によって、多チャンネルの信号に変換された後に、主音毎に同じチャンネルの同じ周波数の信号を加算すればよい。
雑音・主音判別処理2については、図5のフローチャートに1つの方法を示したが、ここでは別の方法について説明する。
図11のフローチャートに示すように、雑音・主音判別部143によって、各フレームの周波数帯域毎に、周波数領域の信号が主音か雑音かを判別する。なお、所定のフレーム数L分の周波数領域のデータが得られる度に、この雑音・主音判別処理をする。
時間・周波数帯域毎の方向推定処理(ステップS210)から雑音判定処理(ステップS240)までは、図5のフローチャートと同様の処理をする。
例えば、階級の幅が20度のヒストグラムにおいて、ある周波数帯域が主音と推定され、その音源方向が30度であったとする。この主音は、20度から40度までの階級に含まれるので、この階級の既存値である度数に、尤度L(f,τ)の値又は、該当する周波数成分のレベル又は、該周波数成分の対数レベルを加算する。
例えば、尤度L(f,τ)の値の場合、ピーク検出する値は、度数が所定の値以下になるまで、又は最大の値との差が所定の値以下になるまでピーク検出をする。周波数成分のパワー値又はその対数パワー値の場合、最大値と比較したレベルが所定の差になるまで又は、最大値と比較したレベルが所定の比率以下になるまでピーク検出をする。
なお、ピーク検出を所定の範囲にすることにより、背景雑音に相当するような小さい音源を誤って取り出すことを防ぐことができる。
上述した処理により、各フレームの周波数帯域毎に、周波数領域の信号が主音か雑音かを判別することができる。
図5及び図11のステップS210の処理に対応し、図6のフローチャートによって主音方向を推定する方法を示したが、ここでは別の方法について説明する。
図12のフローチャートに示す時間・周波数毎の方向推定処理2によって、周波数帯域毎に主音方向の推定処理をする。
まず、最大値のレベルを示す変数max_powerと、最大値の方位角を示す変数max_power_thetaとを0に設定し、方位角を示す変数θを最小値(例えば、−90度)に設定する(ステップS2111)。
なお、ここで、方位角θは、所定の分解能(例えば、1度刻み等)で、−90度から+90度もしくは−180度から+180度まで表せるとする。また、入力される複数チャンネルの信号をxとする。
なおここでは、ステアリングベクトルa(θ)をa(θ)の1番目の要素で割ったものを新たにa(θ)としても良い。a(θ)の1番目の要素を1にして、これを基準に他の要素を表現する。また、riは、マイクロホンアレイ部110の中心位置から予め定める距離(例えば1m等)と方角(方位角θ度)とによって表される位置に存在する仮想音源とi番目のマイクロホンとの間の距離とを示す。
内積の絶対値が大きい場合には(ステップS2113;YES)、max_powerを|O(θ)|に設定し、max_power_thetaをθに設定して最大値を更新する(ステップS2114)。
最大値よりも大きい場合には(ステップS2115;YES)、変数max_power_thetaを該周波数成分の音源方向と推定し、処理を終了する。
最大値よりも小さい場合には(ステップS2115;NO)、内積計算(ステップS2112)の処理に戻る。
上述した処理により、主音の方向を推定することができる。
図5及び図11のステップS210の処理に対応し、図6及び図12のフローチャートによって主音方向を推定する処理の例を示したが、ここではさらに別の方法について図13に示すフローチャートを用いて説明する。
マイクロホンアレイ部110を構成する複数のマイクロホンの中から対となる複数のマイクペアiを選択し、初期値1を設定する。ヒストグラムC(θ)の度数を示す全てのθを0に初期化する(ステップ2121)。
なおここで、方位角θの幅(ヒストグラムの階級)は所定の角度幅とし、処理をする複数のフレームの中で最も時間が古いフレームをτとする。
さらに、t=dc-1sinθによって、変数をtからθに変換した、クロススペクトルci(θ,τ)を算出する(ステップS2123)。
添え字iの値が全てのマイクペアの数(M(M-1)/2)よりも大きい場合には(ステップS2125;YES)、フレームτが処理をする全てのフレーム数より大きいかを判別する(ステップS2126)。
処理をする全てのフレーム数以下の場合には(ステップS2126;NO)、添え字iを1に初期化し、処理をするフレームを示すτに1を加算して(τ+1)、次フレームについて、変数初期化(ステップS2121)以降の処理をする。
処理をする全てのフレーム数よりも大きい場合には(ステップS2126;YES)、ヒストグラムCi(θ,τ)の度数が所定の閾値よりも大きい方位角θを音源方向推定値θとして出力し、処理を終了する。
なお、本処理で求めたヒストグラムC(θ)を図11のヒストグラムの作成・更新(ステップS270)によって更新されるヒストグラムの代わりに使用してもよい。
上述した処理により、主音の方向を推定することができる。
実施形態1では、録音時に位相と振幅とを補正したが、実施形態2では、再生時に位相と振幅とを補正する機能を備えた録音再生装置100について説明する。
また、実施形態1では、1つの周波数帯域には、1つの音源しか含まれないことを前提として雑音と主音とを判別して主音を補正する処理について説明したが、実施形態2では、1つの周波数帯域に複数の主音が含まれる場合でも、雑音と主音とを判別して主音を補正する処理について説明する。
さらに、実施形態2の雑音・主音判別部143は、実施形態1と異なり、図15に示すように1つの周波数帯域に複数の音源が含まれている場合も判別し、音源毎に周波数帯域の周波数領域のデータを主音録音処理部1441に出力する。
カメラ201は、画像を撮影してデジタルの映像信号を録画データとしてデータベース161に出力する。
図14Bは再生時の構成を示す図であり、再生部は、データベース161と、再生機器情報保存部162と、聴取者頭部伝達関数保存部163と、再生方法認識部147と、位相・振幅補正部1481と、周波数時間変換部149と、D−A変換器170と、LPF180と、再生装置190と、表示装置202とを備える。
例えば、録音再生装置100が携帯電話の場合に、ヘッドホン端子にヘッドホン301のプラグが刺さっているか否かを検出するセンサを備え、刺さっている場合には、再生装置190をヘッドホン301と判別して、スピーカ間の距離は聴取者の両耳間距離に設定したり、聴取者頭部伝達関数を取得する。刺さっていない場合、位相・振幅補正部1481は、再生装置190を携帯電話に搭載されたスピーカと判別して、携帯電話に搭載されたスピーカ間の距離を設定して処理をしてもよい。また、携帯電話の利用者が音を再生する際に、再生方法を選択する指示を与える構成にしてもよい。
まず、位相・振幅補正部1481は、データベース161からフレーム毎に主音のインデックスが付された周波数帯域の周波数領域のデータを読み出し、主音毎(主音のインデックスをiとする)に該主音の音源方向を推定する。次に、位相・振幅補正部1481は、再生方法認識部147から供給される再生装置190のスピーカ配置位置と周波数特性との情報を基に、音源方向に対する各マイクロホンの振幅比と位相差とを表すステアリングベクトルを求める。そして、位相・振幅補正部1481は、該ステアリングベクトルに基づいて主音iの位相と振幅とを補正する。なお、位相・振幅補正部1481が、主音と判別された周波数帯域の周波数領域のデータの位相と振幅とを補正する処理の詳細については、後述する。
次に、この録音再生装置100の動作を説明する。
まず、この録音再生装置100を録音部として機能させる場合について説明する。
マイクロホンアレイ部110によって集音されてから雑音レベル推定部142によって各フレームの周波数帯域毎に、周波数領域のデータに含まれる雑音のレベルが推定されるまでの処理(図4のフローチャート)は、実施形態1と同様である。
次に、図16の雑音・主音判別処理3のフローチャートに示すように、雑音・主音判別部143によって、各フレームの周波数帯域毎に、周波数領域の信号成分が主音成分か雑音成分かを判別する。
処理対象のフレームを所定の分割数Lで分割する。
分割したフレーム群毎(フレーム郡のインデックスをk)に、フレームkに含まれる多チャンネル信号をxk(f,τ)とする場合の共分散行列Rk(f)を数19によって算出する。
さらに、全てのフレーム郡の共分散行列を足し合わせた行列R(f)=ΣRk(f)を算出して、共分散行列R(f)を更新する(ステップS241)。
なお、Ωは対角行列とし、L(f)=U(f)1/√Ωとする。(ここで、1/√Ωは1をΩの各要素の平方根で割ったものを各要素とする行列のことを言う。)
任意の各フレーム群の共分散行列Rk(f)に対して、L(f)^*Rk(f)L(f)=T(f)ΔT(f)^{*}を満たす関数T(f)を算出して、同時多角化する(ステップS242)。なおここでは、Δは対角行列とする。
なお、W(f)の各行要素をwi(f)とすると、wi(f)はi番目の音源を多チャンネル信号から抽出するための雑音抑圧フィルタを示す。
そこで、雑音抑圧フィルタW(f)をフレーム毎の多チャンネル信号と掛け合わせて、分離信号を要素とするベクトルS(f,τ)を算出する。
また、W(f)を逆行列にした各列要素が各音源のステアリングベクトルに相当するベクトルとなることから、分離ベクトルの各要素毎にW(f)を逆行列にした各列要素を掛け合わせて、多チャンネルの分離信号を算出する。
このようなフィルタリング処理により、マイク数と同じ数の多チャンネルの分離信号を得ることができる(ステップS244)。
雑音と判別された周波数帯域の周波数領域のデータは、雑音録音処理部1442に出力され、主音と判別された周波数帯域の周波数領域のデータは、主音録音処理部1441に出力される。但し、同じ周波数帯域に複数の主音があると判別された場合には、主音の周波数帯域の周波数領域のデータが、主音録音処理部1441に出力される。
データベース161によって、主音の時間領域データと雑音の時間領域データとが録音データとして保存され、録音処理は終了する。
なお、カメラ201から供給された録画データに、録音データと同期する情報を付加して、データベース161に保存してもよい。
制御装置140が再生の指示を受けると、再生方法認識部147は、再生機器情報保存部162から再生装置190のスピーカ間の距離やスピーカの周波数特性等の再生装置190に関する情報又は、聴取者頭部伝達関数保存部163から聴取者頭部伝達関数を取得して、位相・振幅補正部1481に出力する。
図17のフローチャートは、図7のフローチャートの方向推定情報取得処理(ステップS401)の代わりに方向推定処理(ステップS404)とする点が異なるが、その他は主音毎に同様の処理をする。これは、実施形態1では、前段階の処理で主音の方向が推定されているので情報を取得するのみでよいが、図17ではこの段階で主音の方向を推定する必要があるからである。
まず、主音と判別された周波数帯域に1つの主音しかない場合には、該周波数帯域の音源方向θ(f,τ)を前述した図6、図12及び図13の何れかのフローチャートに示した処理により求める。主音と判別された周波数帯域に複数の主音がある場合には、主音毎に該周波数帯域の音源方向θ(f,τ)を前述した図6、図12及び図13の何れかのフローチャートに示した処理により求める。
次の、補正ステアリングベクトルを取得・算出する処理(ステップS402)以降は、図7のフローチャートに示した処理と同様の処理をする。
但し、本実施形態の位相・振幅補正部1481は、実施形態1の主音振幅・位相補正処理部148と異なり、再生装置190のスピーカ間の距離やスピーカの周波数特性や聴取者頭部伝達関数等の情報に基づいて、再生装置190に対応した主音の位相と振幅とを補正する。
位相・振幅補正部1481は、主音のみ位相と振幅とが補正され、再生装置190のスピーカの数に対応したチャンネル数の周波数領域のデータを周波数時間変換部149に出力する。
なお、1つの周波数帯域に複数の主音がある場合には、補正された主音毎の周波数領域データを加算して、1つの周波数帯域の周波数領域データにする。
また、表示装置202は、再生された音と同期したタイミングでデータベース161から画像情報を読み出し、画像を再生する。
また、1つの周波数帯域に複数の主音が含まれる場合であっても、主音毎に位相と振幅とを補正することによって、目的となる音を明瞭に再現することができる。
さらに、音を再生する際に、位相と振幅とを補正するため、多様な再生装置に対応して臨場感がある音を再現することができる。
なお、雑音・主音判別部143によって、主音毎に音源分離がなされているので、主音毎に処理をする。
(雑音・主音判別処理の別例4)
図16のフローチャートに示した雑音主音判別処理以外の判別方法について説明する。
図18のフローチャートに示すように、図16のフローチャートに示したステップS241からS243までの処理をして、雑音抑圧フィルタ(分離フィルタ)W(f)を作成して、これを初期フィルタとする(ステップS245)。
また、分離ベクトルの各要素毎にW(f)を逆行列にした各列要素を掛け合わせて、多チャンネルの分離信号を算出して、マイク数と同じ数の多チャンネルの分離信号を得るフィルタリング処理をする(ステップS247)。
この様に、図18のフローチャートに示した手段によっても、雑音と主音とを判別することができる。
さらに、別の雑音・主音判別処理について説明する。
図19のフローチャートに示す処理は、図11の雑音・主音判別処理2のフローチャートに示した再振り分け処理(ステップS300)と置き換えて使用する。この再振り分け処理1に置き換えることにより、音の到来方向が異なる主音毎に周波数領域のデータを分離した出力信号を得ることができる。
なお、異なるフレーム間における(時間的に異なる)、同じ周波数の音源方向が、θを基準として所定の範囲内のある音源方向を選択し、平均値を算出して、ステアリングベクトルa(θ,f)を求めてもよい。この方法により、周波数が同じでも異なる方向から到来する音を音源方向から取り除くと共に、音源の移動に対応することができる。
なお、分離信号S(f,τ)の要素は、ヒストグラムの各ピークとして検出され、主音毎に推定された音源方向を示す信号である。
上記処理により、主音毎に方向が推定された多チャンネル信号が出力される。
さらに、別の雑音・主音判別処理について説明する。
図20のフローチャートに示す処理は、図11の雑音・主音判別処理2のフローチャートに示した再振り分け処理(ステップS300)と置き換えて使用する。このこの再振り分け処理2に置き換えることにより、音の到来方向が異なる主音毎に周波数領域のデータを分離した信号を得ることができる。
ヒストグラムのピーク値を検出し、推定した音源方向θ毎に数23によって、雑音共分散行列Rθ(f)を算出する(ステップS311)。
上記フィルタリング処理により、主音毎に方向が推定された多チャンネル信号が出力される。
さらに、別の雑音・主音判別処理について説明する。
図21のフローチャートに示す処理は、図11の雑音・主音判別処理2のフローチャートに示した再振り分け処理(ステップS300)と置き換えて使用する。このこの再振り分け処理2に置き換えることにより、音の到来方向が異なる主音毎に周波数領域のデータを分離した信号を得ることができる。
ヒストグラムのピーク値を検出し、推定した音源方向θ毎に数25によって、目的音共分散行列Rs,θ(f)を算出する(ステップS322)。
音源方向θ毎に雑音抑圧フィルタw(f)を使って、Sθ(f,τ)=w(f)x(f,τ)の演算により、各フレームの周波数帯域毎の分離信号Sθ(f,τ)を求め、多チャンネル信号を算出する(ステップS324)。
上記フィルタリング処理により、主音毎に方向が推定された多チャンネル信号が出力される。
実施形態1及び2では、録音再生装置100の録音・再生機能を切り替えることにより音の位相と振幅とを補正する処理を示した。実施形態3では、録音再生装置100によって録音した音の位相と振幅とを他の装置で補正する処理について説明する。
また、携帯電話によるテレビ電話等でも、臨場感ある音を伝えることができる。
録音再生装置100がカメラ201を備える録音装置でテレビ電話機能を実現する際に、画角の中心方向のみを主音の方向として処理してもよい。これにより、システムの負担を軽減することができる。
また、録音再生装置100は、音源の位相と振幅とを補正する際に、聴取者の好みにあわせて音を再生するための設定手段を備えてもよい。
また、録音再生装置100が、録音した音の情報を記憶するのではなく、記憶媒体に記憶させたり、記憶媒体から録音した音の情報を読み出して再生してもよい。
Claims (10)
- 音をアナログの電気信号に変換する複数のマイクロホンを有するマイクロホンアレイと、
前記マイクロホンアレイに含まれる各マイクロホンによって変換されたアナログの電気信号をデジタル信号に変換するA−D変換手段と、
所定の時間毎に、前記A−D変換手段によって変換された各前記マイクロホンのデジタル信号を周波数帯域毎にその強度を示す信号に分解する時間周波数分解手段と、
前記時間周波数分解手段によって分解された周波数帯域毎に各前記マイクロホンのデジタル信号間の位相差を求めて、音の到来方向を特定する音到来方向特定手段と、
音出力装置の各音出力手段の位置関係に基づき、前記音到来方向特定手段によって音の到来方向が特定された周波数帯域毎に各前記マイクロホンのデジタル信号間の位相を各前記音出力手段の位置に対応させて補正する補正情報を取得する取得手段と、
前記取得手段によって取得された補正情報に基づいて、前記音到来方向特定手段によって音の到来方向が特定された周波数帯域毎に各前記マイクロホンのデジタル信号間の位相を補正する補正手段とを備える、
ことを特徴とする録音装置。 - 前記時間周波数分解手段によって分解された周波数帯域毎にその強度を示す信号が所定のレベル未満であることに応答して、雑音成分と判別し、所定のレベル以上であることに応答して、音源から到来した主音成分と判別する成分判別手段を備え、
前記補正手段は、前記成分判別手段によって、主音成分と判別された周波数帯域の信号に対してのみ位相と振幅とを補正する、
ことを特徴とする請求項1に記載の録音装置。 - 前記補正手段によって主音成分の位相が補正された各前記マイクロホンのデジタル信号に基づいて、複数の前記音出力手段の数に対応したデジタル信号を生成する音出力チャンネル信号生成手段と、
前記音出力チャンネル信号生成手段によって生成された複数のデジタル信号を記憶する記憶手段とを備える、
ことを特徴とする請求項2に記載の録音装置。 - 前記取得手段が取得する補正情報は、前記音出力装置の各音出力手段の距離に基づいて計算され、前記音到来方向特定手段によって音の到来する方向が特定された周波数帯域毎に各前記マイクロホンのデジタル信号の位相を補正するステアリングベクトル又は、音を聴取する聴取位置を中心とした円周上に位置する各方向の音源から到来する音を測定し、測定された音の特性と各前記音出力手段の特性とに基づいて求められたたステアリングベクトルであり、
前記記憶手段は、前記取得手段が取得した補正情報をさらに記憶し、
前記補正手段は、前記音到来方向特定手段によって周波数帯域毎に特定された音の到来する方向と、前記記憶手段に記憶された補正情報とに基づいて、各前記主音成分の位相と振幅とを補正する、
ことを特徴とする請求項3に記載の録音装置。 - 前記成分判別手段は、
周波数帯域毎に同一の前記マイクロホンによって過去に取得された信号の強度と現在の信号の強度とを基にして、雑音のレベルを示す雑音レベルを算出する雑音レベル算出手段と、
前記時間周波数分解手段によって分解された周波数帯域毎にその強度を示す信号が前記雑音レベル算出手段によって算出された雑音レベル以上か未満かを判別するレベル判別手段と、
前記レベル判別手段により所定のレベル未満と判別されたことに応答して、該周波数帯域を雑音成分とし、所定のレベル以上と判別されたことに応答して、周波数帯域毎に各前記マイクロホンのデジタル信号間に相互に関連があるかを判別する相関関係判別手段と、
前記相関関係判別手段により相互に関連がないと判別されたことに応答して、該周波数帯域を雑音成分とし、相互に関連があると判別されたことに応答して、該周波数帯域を空間上の音源から到来した主音成分と判別する雑音主音判別手段とを備える、
ことを特徴とする請求項2乃至4の何れか1項に記載の録音装置。 - 音出力装置の各音出力手段の位置関係に基づき、周波数帯域毎に録音装置の各マイクロホンのデジタル信号間の位相を各前記音出力手段の位置に対応させて補正する補正情報を取得する取得手段と、
前記録音装置の各マイクロホンにより集音され、所定の時間毎に各前記マイクロホンのデジタル信号を周波数帯域毎にその強度を示す信号に分解されたデジタル信号を取得する音取得手段と、
前記取得手段によって取得された補正情報に基づいて、前記音取得手段によって取得された周波数帯域毎に分解された各前記デジタル信号を読み出し、周波数帯域毎に各前記マイクロホンのデジタル信号間の位相差を求めて、音の到来方向を特定する音到来方向特定手段と、
前記取得手段によって取得された補正情報に基づいて、前記音到来方向特定手段によって音の到来方向が特定された周波数帯域毎に各前記マイクロホンのデジタル信号間の位相を補正する補正手段と、
前記補正手段によって位相が補正された各前記マイクロホンのデジタル信号に基づいて、複数の各前記音出力手段の数に対応する複数の周波数帯域毎に分解されたデジタル信号を生成する出力チャンネル信号生成手段と、
前記出力チャンネル信号生成手段によって生成された周波数帯域毎に分解された各デジタル信号を合成して、時間帯域毎に分割された各デジタル信号に変換する周波数時間変換手段と、
前記周波数時間変換手段によって変換された時間帯域毎に分割された各デジタル信号をアナログの電気信号に変換するD−A変換手段とを備え、
前記音出力手段は、前記D−A変換手段によって変換された電気信号を音に変換する、ことを特徴とする再生装置。 - 複数の音取得手段によって取得された音をアナログの電気信号に変換する音変換ステップと、
前記音変換ステップによって変換されたアナログの電気信号をデジタル信号に変換するA−D変換ステップと、
所定の時間毎に、前記A−D変換ステップによって変換された各マイクロホンのデジタル信号を周波数帯域毎にその強度を示す信号に分解する時間周波数分解ステップと、
前記時間周波数分解ステップによって分解された周波数帯域毎に各前記マイクロホンのデジタル信号間の位相差を求めて、音の到来方向を特定する音到来方向特定ステップと、
音出力装置の各音出力手段の位置関係に基づき、前記音到来方向特定ステップによって音の到来方向が特定された周波数帯域毎に各前記マイクロホンのデジタル信号間の位相を各前記音出力手段の位置に対応させて補正する補正情報を取得する取得ステップと、
前記取得ステップによって取得された補正情報に基づいて、前記音到来方向特定ステップによって音の到来方向が特定された周波数帯域毎に各前記マイクロホンのデジタル信号間の位相を補正する補正ステップとを含む、
ことを特徴とする録音方法。 - 音出力装置の各音出力手段の位置関係に基づき、周波数帯域毎に録音装置の各マイクロホンのデジタル信号間の位相を各前記音出力手段の位置に対応させて補正する補正情報を取得する取得ステップと、
前記録音装置の各マイクロホンにより集音され、所定の時間毎に各マイクロホンのデジタル信号を周波数帯域毎にその強度を示す信号に分解されたデジタル信号を取得する音取得ステップと、
前記取得ステップによって取得された補正情報に基づいて、前記音取得ステップによって取得された周波数帯域毎に分解された各前記デジタル信号を読み出し、周波数帯域毎に各前記マイクロホンのデジタル信号間の位相差を求めて、音の到来方向を特定する音到来方向特定ステップと、
前記取得ステップによって取得された補正情報に基づいて、前記音到来方向特定ステップによって音の到来方向が特定された周波数帯域毎に各前記マイクロホンのデジタル信号間の位相を補正する補正ステップと、
前記補正ステップによって位相が補正された各前記マイクロホンのデジタル信号に基づいて、複数の各前記音出力手段の数に対応する複数の周波数帯域毎に分解されたデジタル信号を生成する出力チャンネル信号生成ステップと、
前記出力チャンネル信号生成ステップによって生成された周波数帯域毎に分解された各前記デジタル信号を合成して、時間帯域毎に分割された各デジタル信号に変換する周波数時間変換ステップと、
前記周波数時間変換ステップによって変換された時間帯域毎に分割された各前記デジタル信号をアナログの電気信号に変換するD−A変換ステップと、
前記D−A変換ステップによって変換された電気信号を音に変換する複数の各前記音出力手段に音を出力させる音出力ステップとを含む、
ことを特徴とする再生方法。 - 複数のマイクロホンを備えたコンピュータを、
音をアナログの電気信号に変換する複数のマイクロホンを有するマイクロホンアレイと、
前記マイクロホンアレイに含まれる各マイクロホンによって変換されたアナログの電気信号をデジタル信号に変換するA−D変換手段と、
所定の時間毎に、前記A−D変換手段によって変換された各前記マイクロホンのデジタル信号を周波数帯域毎にその強度を示す信号に分解する時間周波数分解手段と、
前記時間周波数分解手段によって分解された周波数帯域毎に各前記マイクロホンのデジタル信号間の位相差を求めて、音の到来方向を特定する音到来方向特定手段と、
音出力装置の各音出力手段の位置関係に基づき、前記音到来方向特定手段によって音の到来方向が特定された周波数帯域毎に各前記マイクロホンのデジタル信号間の位相を各前記音出力手段の位置に対応させて補正する補正情報を取得する取得手段と、
前記取得手段によって取得された補正情報に基づいて、前記音到来方向特定手段によって音の到来方向が特定された周波数帯域毎に各前記マイクロホンのデジタル信号間の位相を補正する補正手段として機能させる、
ことを特徴とするコンピュータプログラム。 - 複数のスピーカを備えたコンピュータを、
音出力装置の各音出力手段の位置関係に基づき、周波数帯域毎に録音装置の各マイクロホンのデジタル信号間の位相を各前記音出力手段の位置に対応させて補正する補正情報を取得する取得手段と、
前記録音装置の各マイクロホンにより集音され、所定の時間毎に各前記マイクロホンのデジタル信号を周波数帯域毎にその強度を示す信号に分解されたデジタル信号を取得する音取得手段と、
前記取得手段によって取得された補正情報に基づいて、前記音取得手段によって取得された周波数帯域毎に分解された各前記デジタル信号を読み出し、周波数帯域毎に各前記マイクロホンのデジタル信号間の位相差を求めて、音の到来方向を特定する音到来方向特定手段と、
前記取得手段によって取得された補正情報に基づいて、前記音到来方向特定手段によって音の到来方向が特定された周波数帯域毎に各前記マイクロホンのデジタル信号間の位相を補正する補正手段と、
前記補正手段によって位相が補正された各前記マイクロホンのデジタル信号に基づいて、複数の各前記音出力手段の数に対応する複数の周波数帯域毎に分解されたデジタル信号を生成する出力チャンネル信号生成手段と、
前記出力チャンネル信号生成手段によって生成された周波数帯域毎に分解された各前記デジタル信号を合成して、時間帯域毎に分割された各デジタル信号に変換する周波数時間変換手段と、
前記周波数時間変換手段によって変換された時間帯域毎に分割された各前記デジタル信号をアナログの電気信号に変換するD−A変換手段と、
前記音出力手段は、前記D−A変換手段によって変換された電気信号を音に変換するように機能させる、
ことを特徴とするコンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009037248A JP2010193323A (ja) | 2009-02-19 | 2009-02-19 | 録音装置、再生装置、録音方法、再生方法、及びコンピュータプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009037248A JP2010193323A (ja) | 2009-02-19 | 2009-02-19 | 録音装置、再生装置、録音方法、再生方法、及びコンピュータプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010193323A true JP2010193323A (ja) | 2010-09-02 |
Family
ID=42818856
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009037248A Pending JP2010193323A (ja) | 2009-02-19 | 2009-02-19 | 録音装置、再生装置、録音方法、再生方法、及びコンピュータプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2010193323A (ja) |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012037603A (ja) * | 2010-08-04 | 2012-02-23 | Fujitsu Ltd | 雑音推定装置、雑音推定方法および雑音推定プログラム |
JP2012175580A (ja) * | 2011-02-23 | 2012-09-10 | Kyocera Corp | 携帯電子機器及び音出力システム |
JP2013135320A (ja) * | 2011-12-26 | 2013-07-08 | Toshiba Corp | 周波数特性調整システムおよび周波数特性調整方法 |
JP2013157747A (ja) * | 2012-01-27 | 2013-08-15 | Denso Corp | 音場制御装置及びプログラム |
JP2013179585A (ja) * | 2012-02-01 | 2013-09-09 | Nikon Corp | 音処理装置および音処理プログラム |
JP2013545137A (ja) * | 2010-10-25 | 2013-12-19 | クゥアルコム・インコーポレイテッド | マルチチャネルオーディオ信号を分解するための方法、装置および機械可読記憶媒体 |
WO2016167138A1 (ja) * | 2015-04-13 | 2016-10-20 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
KR20160133282A (ko) * | 2015-05-12 | 2016-11-22 | (주)에어사운드 | 강의 콘텐츠 운용 시스템 및 방법 |
JP2017105461A (ja) * | 2013-11-19 | 2017-06-15 | クラリオン株式会社 | 集音装置 |
WO2017110882A1 (ja) * | 2015-12-21 | 2017-06-29 | シャープ株式会社 | スピーカの配置位置提示装置 |
JP2017125893A (ja) * | 2016-01-12 | 2017-07-20 | 富士通株式会社 | 音源検出装置、音源検出方法、及びプログラム |
US10524075B2 (en) | 2015-12-10 | 2019-12-31 | Sony Corporation | Sound processing apparatus, method, and program |
WO2020003342A1 (ja) * | 2018-06-25 | 2020-01-02 | 日本電気株式会社 | 波源方向推定装置、波源方向推定方法、およびプログラム記録媒体 |
WO2020003343A1 (ja) * | 2018-06-25 | 2020-01-02 | 日本電気株式会社 | 波源方向推定装置、波源方向推定方法、およびプログラム記録媒体 |
US10674255B2 (en) | 2015-09-03 | 2020-06-02 | Sony Corporation | Sound processing device, method and program |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08111899A (ja) * | 1994-10-13 | 1996-04-30 | Matsushita Electric Ind Co Ltd | 両耳聴装置 |
JP2003271191A (ja) * | 2002-03-15 | 2003-09-25 | Toshiba Corp | 音声認識用雑音抑圧装置及び方法、音声認識装置及び方法並びにプログラム |
JP2006178333A (ja) * | 2004-12-24 | 2006-07-06 | Nippon Telegr & Teleph Corp <Ntt> | 近接音分離収音方法、近接音分離収音装置、近接音分離収音プログラム、記録媒体 |
JP2006295592A (ja) * | 2005-04-12 | 2006-10-26 | Nippon Hoso Kyokai <Nhk> | スピーカ装置 |
WO2007018293A1 (ja) * | 2005-08-11 | 2007-02-15 | Asahi Kasei Kabushiki Kaisha | 音源分離装置、音声認識装置、携帯電話機、音源分離方法、及び、プログラム |
JP2008067854A (ja) * | 2006-09-13 | 2008-03-27 | National Institute Of Advanced Industrial & Technology | 電動車椅子搭載用音声入力装置 |
JP2008193382A (ja) * | 2007-02-05 | 2008-08-21 | Mitsubishi Electric Corp | 携帯電話機、及び音声調整方法 |
-
2009
- 2009-02-19 JP JP2009037248A patent/JP2010193323A/ja active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08111899A (ja) * | 1994-10-13 | 1996-04-30 | Matsushita Electric Ind Co Ltd | 両耳聴装置 |
JP2003271191A (ja) * | 2002-03-15 | 2003-09-25 | Toshiba Corp | 音声認識用雑音抑圧装置及び方法、音声認識装置及び方法並びにプログラム |
JP2006178333A (ja) * | 2004-12-24 | 2006-07-06 | Nippon Telegr & Teleph Corp <Ntt> | 近接音分離収音方法、近接音分離収音装置、近接音分離収音プログラム、記録媒体 |
JP2006295592A (ja) * | 2005-04-12 | 2006-10-26 | Nippon Hoso Kyokai <Nhk> | スピーカ装置 |
WO2007018293A1 (ja) * | 2005-08-11 | 2007-02-15 | Asahi Kasei Kabushiki Kaisha | 音源分離装置、音声認識装置、携帯電話機、音源分離方法、及び、プログラム |
JP2008067854A (ja) * | 2006-09-13 | 2008-03-27 | National Institute Of Advanced Industrial & Technology | 電動車椅子搭載用音声入力装置 |
JP2008193382A (ja) * | 2007-02-05 | 2008-08-21 | Mitsubishi Electric Corp | 携帯電話機、及び音声調整方法 |
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012037603A (ja) * | 2010-08-04 | 2012-02-23 | Fujitsu Ltd | 雑音推定装置、雑音推定方法および雑音推定プログラム |
KR101521368B1 (ko) * | 2010-10-25 | 2015-05-18 | 퀄컴 인코포레이티드 | 다중 채널 오디오 신호를 분해하는 방법, 장치 및 머신 판독가능 저장 매체 |
US9111526B2 (en) | 2010-10-25 | 2015-08-18 | Qualcomm Incorporated | Systems, method, apparatus, and computer-readable media for decomposition of a multichannel music signal |
JP2013545137A (ja) * | 2010-10-25 | 2013-12-19 | クゥアルコム・インコーポレイテッド | マルチチャネルオーディオ信号を分解するための方法、装置および機械可読記憶媒体 |
JP2012175580A (ja) * | 2011-02-23 | 2012-09-10 | Kyocera Corp | 携帯電子機器及び音出力システム |
JP2013135320A (ja) * | 2011-12-26 | 2013-07-08 | Toshiba Corp | 周波数特性調整システムおよび周波数特性調整方法 |
JP2013157747A (ja) * | 2012-01-27 | 2013-08-15 | Denso Corp | 音場制御装置及びプログラム |
JP2013179585A (ja) * | 2012-02-01 | 2013-09-09 | Nikon Corp | 音処理装置および音処理プログラム |
JP2017105461A (ja) * | 2013-11-19 | 2017-06-15 | クラリオン株式会社 | 集音装置 |
WO2016167138A1 (ja) * | 2015-04-13 | 2016-10-20 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
US10380991B2 (en) | 2015-04-13 | 2019-08-13 | Sony Corporation | Signal processing device, signal processing method, and program for selectable spatial correction of multichannel audio signal |
KR20160133282A (ko) * | 2015-05-12 | 2016-11-22 | (주)에어사운드 | 강의 콘텐츠 운용 시스템 및 방법 |
KR101687676B1 (ko) * | 2015-05-12 | 2017-01-02 | (주)에어사운드 | 강의 콘텐츠 운용 시스템 및 방법 |
US10674255B2 (en) | 2015-09-03 | 2020-06-02 | Sony Corporation | Sound processing device, method and program |
US11265647B2 (en) | 2015-09-03 | 2022-03-01 | Sony Corporation | Sound processing device, method and program |
US10524075B2 (en) | 2015-12-10 | 2019-12-31 | Sony Corporation | Sound processing apparatus, method, and program |
WO2017110882A1 (ja) * | 2015-12-21 | 2017-06-29 | シャープ株式会社 | スピーカの配置位置提示装置 |
JP2017125893A (ja) * | 2016-01-12 | 2017-07-20 | 富士通株式会社 | 音源検出装置、音源検出方法、及びプログラム |
WO2020003342A1 (ja) * | 2018-06-25 | 2020-01-02 | 日本電気株式会社 | 波源方向推定装置、波源方向推定方法、およびプログラム記録媒体 |
WO2020003343A1 (ja) * | 2018-06-25 | 2020-01-02 | 日本電気株式会社 | 波源方向推定装置、波源方向推定方法、およびプログラム記録媒体 |
JPWO2020003343A1 (ja) * | 2018-06-25 | 2021-06-24 | 日本電気株式会社 | 波源方向推定装置、波源方向推定方法、およびプログラム |
JPWO2020003342A1 (ja) * | 2018-06-25 | 2021-06-24 | 日本電気株式会社 | 波源方向推定装置、波源方向推定方法、およびプログラム |
JP7056739B2 (ja) | 2018-06-25 | 2022-04-19 | 日本電気株式会社 | 波源方向推定装置、波源方向推定方法、およびプログラム |
US11408963B2 (en) | 2018-06-25 | 2022-08-09 | Nec Corporation | Wave-source-direction estimation device, wave-source-direction estimation method, and program storage medium |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2010193323A (ja) | 録音装置、再生装置、録音方法、再生方法、及びコンピュータプログラム | |
CN107925815B (zh) | 空间音频处理装置 | |
US10645518B2 (en) | Distributed audio capture and mixing | |
CN108370487B (zh) | 声音处理设备、方法和程序 | |
JP5957446B2 (ja) | 音響処理システム及び方法 | |
JP5229053B2 (ja) | 信号処理装置、および信号処理方法、並びにプログラム | |
JP5060631B1 (ja) | 信号処理装置及び信号処理方法 | |
EP2984852B1 (en) | Method and apparatus for recording spatial audio | |
CN110537221A (zh) | 用于空间音频处理的两阶段音频聚焦 | |
EP3363212A1 (en) | Distributed audio capture and mixing | |
Rafaely et al. | Spatial audio signal processing for binaural reproduction of recorded acoustic scenes–review and challenges | |
JP2016025469A (ja) | 収音再生システム、収音再生装置、収音再生方法、収音再生プログラム、収音システム及び再生システム | |
KR20080017259A (ko) | 음향 수음장치 및 음향 수음방법 | |
GB2591066A (en) | Spatial audio processing | |
JP2017046322A (ja) | 信号処理装置及びその制御方法 | |
JP7232546B2 (ja) | 音響信号符号化方法、音響信号復号化方法、プログラム、符号化装置、音響システム、及び復号化装置 | |
EP3700233A1 (en) | Transfer function generation system and method | |
Fernandez et al. | Enhancing binaural rendering of head-worn microphone arrays through the use of adaptive spatial covariance matching | |
EP2268064A1 (en) | Device and method for converting spatial audio signal | |
CN110890100B (zh) | 语音增强、多媒体数据采集、播放方法、装置及监控系统 | |
JP2018191127A (ja) | 信号生成装置、信号生成方法およびプログラム | |
CN114501297B (zh) | 一种音频处理方法以及电子设备 | |
GB2561595A (en) | Ambience generation for spatial audio mixing featuring use of original and extended signal | |
JP2011239036A (ja) | 音声信号変換装置、方法、プログラム、及び記録媒体 | |
AU2023258816A1 (en) | Sound generation device, sound reproduction device, sound generation method, and sound signal processing program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20100806 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120111 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130619 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130702 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130902 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20140225 |