JP2008172615A - 音声信号処理装置 - Google Patents

音声信号処理装置 Download PDF

Info

Publication number
JP2008172615A
JP2008172615A JP2007004845A JP2007004845A JP2008172615A JP 2008172615 A JP2008172615 A JP 2008172615A JP 2007004845 A JP2007004845 A JP 2007004845A JP 2007004845 A JP2007004845 A JP 2007004845A JP 2008172615 A JP2008172615 A JP 2008172615A
Authority
JP
Japan
Prior art keywords
impulse response
audio signal
unit
sample point
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007004845A
Other languages
English (en)
Inventor
Shota Morikawa
将太 森川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Victor Company of Japan Ltd
Original Assignee
Victor Company of Japan Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Victor Company of Japan Ltd filed Critical Victor Company of Japan Ltd
Priority to JP2007004845A priority Critical patent/JP2008172615A/ja
Publication of JP2008172615A publication Critical patent/JP2008172615A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Stereophonic System (AREA)

Abstract

【課題】インパルス応答の畳み込み演算における演算量を削減するために、インパルス応答のうち畳み込み演算に用いる部分を選択する際に、妥当性をもってインパルス応答の特徴的部分を選択し、効果的な音像定位を行うことができる音声信号処理装置を提供する。
【解決手段】インパルス応答特徴量抽出部2は、インパルス応答の中から選択される直接音フレームと相関の高い部分の位置を示す特徴的サンプル点位置と、特徴的サンプル点位置からの1フレームと直接音フレームとのパワー比率とを求め、再生処理部3は、入力音声信号と直接音フレームとの畳み込み演算を行い、得られた畳み込み演算結果に対して、特徴的サンプル点位置とパワー比率とに応じた遅延処理および積和演算を行う。
【選択図】図1

Description

本発明は、音声信号処理装置に係り、特に多チャンネルで供給される音声信号を2チャンネルステレオ再生する場合に仮想的な音像定位を実現する音声信号処理装置に関する。
従来、DVDビデオのマルチチャンネル音声に代表される2チャンネル以上の音声ソースを2チャンネルステレオ再生する場合、マルチチャンネルの各々のスピーカ位置に音源があるとして、モデルとなる室の反射音をシミュレーションによって導出し、インパルス応答をモデル化して畳み込み演算を行い、再生系のクロストークをキャンセル処理することで仮想的な音像定位を実現していた。この畳み込み演算に必要な係数であるインパルス応答のモデル化の際には、室の寸法を考慮して計算およびシミュレーションを行い、直接音に対応する、その室の壁、天井、床からの反射音を付加する手法が用いられている。
このようにインパルス応答の畳み込み演算を行う音像定位技術においては、畳み込み演算に用いる係数長を長くすればするほど再生時に遅延が生じ、かつ全体で1つの畳み込み演算と捉えられるため、その分だけ演算量が増大していた。
そこで、測定したインパルス応答を間引くことにより、そのままのインパルス応答を畳み込み演算のために用いる場合より演算量を削減する技術が特許文献1に提案されている。
特開平1−135222号公報
しかしながら、特許文献1に開示された技術では、インパルス応答をどの程度間引くかをプロセッサ側の演算量の制約からのみ決める他なく、その程度は作為的にならざるを得なかった。
本発明は上記に鑑みてなされたもので、インパルス応答の畳み込み演算における演算量を削減するために、インパルス応答のうち畳み込み演算に用いる部分を選択する際に、妥当性をもってインパルス応答の特徴的部分を選択し、効果的な音像定位を行うことができる音声信号処理装置を提供することを目的とする。
上記目的を達成するため、本発明の音声信号処理装置は、複数チャンネルの音声信号からなる音声ソースの各チャンネルについて測定された、当該チャンネルの音声信号が出力されるべきスピーカ位置から聴取者の各耳の位置へのインパルス応答のそれぞれについて特徴量を抽出するインパルス応答特徴量抽出部と、前記各インパルス応答について抽出された前記特徴量を用いて前記各チャンネルの入力音声信号を処理して、前記各インパルス応答に対応した空間特性付加信号を出力する空間特性付加処理部と、この空間特性付加処理部から出力される各前記空間特性付加信号のうち、聴取者の左耳の位置へのインパルス応答に対応した空間特性付加信号同士を足し合わせて左チャンネルの出力音声信号を生成する第1の加算器と、前記空間特性付加処理部から出力される各前記空間特性付加信号のうち、聴取者の右耳の位置へのインパルス応答に対応した空間特性付加信号同士を足し合わせて右チャンネルの出力音声信号を生成する第2の加算器と、前記左チャンネルの出力音声信号と前記右チャンネルの出力音声信号との相互作用をキャンセルするクロストークキャンセル処理を行うクロストークキャンセル処理部とを備え、前記インパルス応答特徴量抽出部は、前記各インパルス応答について、当該インパルス応答の中から選択される直接音フレームと当該インパルス応答との相関値を1サンプルごとに計算する相関計算部と、この相関計算部の計算結果に基づいて、当該インパルス応答において前記直接音フレームとの相関値が高い時刻的ポイントに相当する時間軸位置情報を所定の数だけ特徴的サンプル点位置として記憶する特徴的サンプル点位置記憶部と、この特徴的サンプル点位置記憶部に記憶された前記各特徴的サンプル点位置について、当該特徴的サンプル点位置からの1フレームと前記直接音フレームとのパワー比率を計算するパワー比率計算部と、このパワー比率計算部で計算した前記パワー比率を記憶するパワー比率記憶部とを備え、前記空間特性付加処理部は、前記各インパルス応答について、当該インパルス応答における前記直接音フレームと、当該インパルス応答に対応するチャンネルの入力音声信号との畳み込み演算を、前記入力音声信号のブロック単位で行う畳み込み演算部と、この畳み込み演算部による畳み込み演算結果を格納する畳み込み演算結果格納部と、この畳み込み演算結果格納部に格納された前記入力音声信号のブロック単位の畳み込み演算結果に対して、前記特徴的サンプル点位置記憶部に記憶された前記各特徴的サンプル点位置に対応した遅延処理を施す遅延処理部と、前記パワー比率記憶部に記憶された前記パワー比率に基づいて、前記遅延処理部から出力される、前記入力音声信号の1ブロックに対して前記特徴的サンプル点位置の数分のブロックの信号をそれぞれ増幅して出力する増幅部と、前記畳み込み演算部により得られた前記畳み込み演算結果と、前記増幅部からの増幅信号を格納し、格納した信号を時分割的に先頭の1ブロックごとに空間特性付加信号として出力する出力待機バッファ部とを備えることを特徴とする。
また、本発明の音声信号処理装置に係る前記相関計算部は、所定のフレーム幅ごとに前記インパルス応答のパワーを計算し、パワーの最大値をとるフレームを前記直接音フレームとして決定することを特徴とする。
また、本発明の音声信号処理装置に係る前記相関計算部は、前記インパルス応答の波形の瞬時パワーを時間振幅値の2乗として計算し、前記瞬時パワーの最大値をとる時刻的ポイントを含むフレームを前記直接音フレームとして決定することを特徴とする。
本発明によれば、インパルス応答の中から選択される直接音フレームと相関の高い部分の位置を示す特徴的サンプル点位置と、特徴的サンプル点位置からの1フレームと直接音フレームとのパワー比率とを求め、入力音声信号と直接音フレームとの畳み込み演算を行い、得られた畳み込み演算結果に対して、特徴的サンプル点位置とパワー比率とに応じた遅延処理および積和演算を行うので、妥当性をもってインパルス応答の畳み込み演算に用いる特徴的部分を選択し、かつ少ない演算量で効果的な音像定位を行うことができる。
以下、本発明を実施するための最良の形態について、図面を参照して説明する。本実施の形態では、入力する音声ソースがDVDの5チャンネルソースである場合を例にとって説明する。
図1は本発明の実施の形態に係る音声信号処理装置の構成を示すブロック図である。図1に示すように本実施の形態に係る音声信号処理装置1は、音声ソースの各チャンネルについて測定された、当該チャンネルの音声信号が出力されるべきスピーカ位置から聴取者の各耳の位置へのインパルス応答のそれぞれについて特徴量を抽出するインパルス応答特徴量抽出部2と、インパルス応答特徴量抽出部2で抽出された各インパルス応答の特徴量を用いて5チャンネルの入力音声信号を処理し、左右チャンネルの出力音声信号を出力する再生処理部3とを備える。
図2は図1に示す音声信号処理装置1のインパルス応答特徴量抽出部2の構成を示すブロック図である。図2に示すようにインパルス応答特徴量抽出部2は、入力される各インパルス応答について、当該インパルス応答の中から選択される直接音フレームと当該インパルス応答との相関値を1サンプルごとに計算する相関計算部21と、相関計算部21の計算結果に基づいて、当該インパルス応答において直接音フレームとの相関値が高い時刻的ポイントに相当する時間軸位置情報を所定の数だけ特徴的サンプル点位置として記憶する特徴的サンプル点位置記憶部22と、特徴的サンプル点位置記憶部22に記憶された各特徴的サンプル点位置について、当該特徴的サンプル点位置からの1フレームと直接音フレームとのパワー比率を計算するパワー比率計算部23と、パワー比率計算部23で計算したパワー比率を記憶するパワー比率記憶部24とを備える。
図3は図1に示す音声信号処理装置1の再生処理部3の構成を示すブロック図である。図3に示すように再生処理部3は、各インパルス応答について抽出された特徴量を用いて、対応する各チャンネルの入力音声信号を処理して、各インパルス応答に対応した空間特性付加信号を出力する空間特性付加処理部31A〜35A,31B〜35Bと、聴取者の左耳の位置へのインパルス応答に対応した空間特性付加信号を生成する空間特性付加処理部31A〜35Aの出力信号を足し合わせて左チャンネルの出力音声信号を生成する加算器41Aと、聴取者の右耳の位置へのインパルス応答に対応した空間特性付加信号を生成する空間特性付加処理部31B〜35Bの出力信号を足し合わせて右チャンネルの出力音声信号を生成する加算器41Bと、左チャンネルの出力音声信号と右チャンネルの出力音声信号との相互作用をキャンセルするクロストークキャンセル処理を行うクロストークキャンセル処理部42と、クロストークキャンセル処理後の左チャンネルの出力音声信号を音声として出力するスピーカ43Aと、クロストークキャンセル処理後の右チャンネルの出力音声信号を音声として出力するスピーカ43Bとを備える。
空間特性付加処理部31Aは、音声ソースのセンタチャンネルが出力されるべきスピーカ位置から聴取者の左耳の位置へのインパルス応答についてインパルス応答特徴量抽出部2で抽出された特徴量を用いて、センタチャンネルの入力音声信号を処理し、生成した空間特性付加信号を加算器41Aに供給する。
空間特性付加処理部31Bは、音声ソースのセンタチャンネルが出力されるべきスピーカ位置から聴取者の右耳の位置へのインパルス応答についてインパルス応答特徴量抽出部2で抽出された特徴量を用いて、センタチャンネルの入力音声信号を処理し、生成した空間特性付加信号を加算器41Bに供給する。
空間特性付加処理部32Aは、音声ソースの左チャンネルが出力されるべきスピーカ位置から聴取者の左耳の位置へのインパルス応答についてインパルス応答特徴量抽出部2で抽出された特徴量を用いて、左チャンネルの入力音声信号を処理し、生成した空間特性付加信号を加算器41Aに供給する。
空間特性付加処理部32Bは、音声ソースの左チャンネルが出力されるべきスピーカ位置から聴取者の右耳の位置へのインパルス応答についてインパルス応答特徴量抽出部2で抽出された特徴量を用いて、左チャンネルの入力音声信号を処理し、生成した空間特性付加信号を加算器41Bに供給する。
空間特性付加処理部33Aは、音声ソースの右チャンネルが出力されるべきスピーカ位置から聴取者の左耳の位置へのインパルス応答についてインパルス応答特徴量抽出部2で抽出された特徴量を用いて、右チャンネルの入力音声信号を処理し、生成した空間特性付加信号を加算器41Aに供給する。
空間特性付加処理部33Bは、音声ソースの右チャンネルが出力されるべきスピーカ位置から聴取者の右耳の位置へのインパルス応答についてインパルス応答特徴量抽出部2で抽出された特徴量を用いて、右チャンネルの入力音声信号を処理し、生成した空間特性付加信号を加算器41Bに供給する。
空間特性付加処理部34Aは、音声ソースのサラウンド左チャンネルが出力されるべきスピーカ位置から聴取者の左耳の位置へのインパルス応答についてインパルス応答特徴量抽出部2で抽出された特徴量を用いて、サラウンド左チャンネルの入力音声信号を処理し、生成した空間特性付加信号を加算器41Aに供給する。
空間特性付加処理部34Bは、音声ソースのサラウンド左チャンネルが出力されるべきスピーカ位置から聴取者の右耳の位置へのインパルス応答についてインパルス応答特徴量抽出部2で抽出された特徴量を用いて、サラウンド左チャンネルの入力音声信号を処理し、生成した空間特性付加信号を加算器41Bに供給する。
空間特性付加処理部35Aは、音声ソースのサラウンド右チャンネルが出力されるべきスピーカ位置から聴取者の左耳の位置へのインパルス応答についてインパルス応答特徴量抽出部2で抽出された特徴量を用いて、サラウンド右チャンネルの入力音声信号を処理し、生成した空間特性付加信号を加算器41Aに供給する。
空間特性付加処理部35Bは、音声ソースのサラウンド右チャンネルが出力されるべきスピーカ位置から聴取者の右耳の位置へのインパルス応答についてインパルス応答特徴量抽出部2で抽出された特徴量を用いて、サラウンド右チャンネルの入力音声信号を処理し、生成した空間特性付加信号を加算器41Bに供給する。
図4は図3に示す再生処理部3における空間特性付加処理部31Aの構成を示すブロック図である。空間特性付加処理部31A〜35A,31B〜35Bはそれぞれ同様の構成であるため、空間特性付加処理部31Aを例にその構成を説明する。
図4に示すように空間特性付加処理部31Aは、インパルス応答の直接音フレームと入力音声信号との畳み込み演算を、入力音声信号のブロック単位で行う畳み込み演算部51と、畳み込み演算部51による畳み込み演算結果を格納する畳み込み演算結果格納バッファ52と、畳み込み演算結果格納バッファ52に記憶された入力音声信号のブロック単位の畳み込み演算結果に対して、特徴的サンプル点位置記憶部22に記憶された各特徴的サンプル点位置に対応した遅延処理を施す遅延回路53A〜53Eと、パワー比率記憶部24に記憶されたパワー比率に基づいて、遅延回路53A〜53Eから出力される信号をそれぞれ増幅して出力するアンプ54A〜54Eと、畳み込み演算結果格納バッファ52に格納された畳み込み演算結果と、アンプ54A〜54Eから出力された特徴的サンプル点位置の数分のブロックの増幅信号を格納し、格納した信号を時分割的に先頭の1ブロックごとに空間特性付加信号として出力する出力待機バッファ55とを備える。
遅延回路およびアンプはそれぞれ、特徴的サンプル点位置記憶部22に記憶された、空間特性付加処理部31Aに対応するインパルス応答についての特徴的サンプル点位置の数と同じ数だけ設けられる。特徴的サンプル点位置の数は、処理プロセッサとの関係性から決定され、図4では、特徴的サンプル点位置の数が5つであり、遅延回路およびアンプが5つずつ設けられる場合を示している。
遅延回路53A〜53Eには、特徴的サンプル点位置記憶部22に記憶された各特徴的サンプル点位置に対応した遅延時間D1〜D5が設定される。また、アンプ54A〜54Eには、パワー比率記憶部24に記憶されたパワー比率に対応した係数値P1〜P5が設定される。
次に、本実施の形態に係る音声信号処理装置においてインパルス応答の特徴量を抽出する手順を説明する。図5は図2に示すインパルス応答特徴量抽出部2においてインパルス応答の特徴量を抽出する手順を示すフローチャートである。
相関計算部21には、再生空間となる室にて音声ソースの各チャンネルについて測定された、当該チャンネルの音声信号が出力されるべきスピーカ位置から聴取者の各耳の位置へのインパルス応答が入力される。本実施の形態では音声ソースは5チャンネルであるので、相関計算部21には合計10個のインパルス応答が入力され、それぞれのインパルス応答について、以下の処理によりその特徴量として特徴的サンプル点位置およびパワー比率が抽出される。
まず、ステップS10において、相関計算部21は、図6に示すようなインパルス応答の波形情報が入力されると、所定のフレーム幅ごとにインパルス応答のパワーを計算する。次いで、ステップS20では、相関計算部21は、図7に示すように、すべてのフレームの中でパワーが最大値をとるフレームを直接音フレームとして決定する。
なお、上記のようにフレームごとのインパルス応答のパワーを計算して直接音フレームを決定するかわりに、インパルス応答の瞬時パワーを計算して直接音フレームを決定してもよい。この場合、相関計算部21は、ステップS10では、所定のフレーム幅ごとにインパルス応答の波形の瞬時パワーを時間振幅値の2乗として計算し、ステップS20では、瞬時パワーの最大値の時刻的ポイントから前後を調整して1フレーム長が所定のサンプル数となるようにしたフレームを直接音フレームとして決定する。
次いで、ステップS30において、相関計算部21は、ステップS20で決定した直接音フレームと元のインパルス応答との相関値を1サンプルごとに計算していき、時刻的ポイントに対する相関値を計算する。算出した相関値の一例を図8に示す。
ここで、相関値の計算には様々な方法が可能性としてあり得るが、ここでは一例として基本的な式を以下の(数式1)に示す。
Figure 2008172615
次いで、ステップS40において、相関計算部21は、ステップS30で算出した相関値が高い順に所定の数だけ、その時刻的ポイントに相当する時間軸位置情報を特徴的サンプル点位置として特徴的サンプル点位置記憶部22に格納する。
次いで、ステップS50において、パワー比率計算部23は、特徴的サンプル点位置記憶部22に格納された特徴的サンプル点位置を参照して、それぞれの特徴的サンプル点位置からの1フレームについて、直接音フレームとのパワー比率を計算する。
そして、ステップS60において、パワー比率計算部23は、計算したパワー比率を、対応する特徴的サンプル点位置の相関値の高い順でパワー比率記憶部24に格納する。
このようにインパルス応答特徴量抽出部2で特徴量として抽出する各インパルス応答についての特徴的サンプル点位置およびパワー比率は、再生空間と聴取者位置が変わらない限り、1回だけ抽出しておけばよい。
次に、本実施の形態に係る音声信号処理装置における入力音声信号に対する空間特性付加処理の手順を説明する。以下、空間特性付加処理部31Aにおいてセンタチャンネルの入力音声信号を処理する手順について説明するが、空間特性付加処理部32A〜35A,31B〜35Bにおいても、それぞれに対応するチャンネルの入力音声信号に対して同様の処理を行う。
図9は図4に示す空間特性付加処理部31Aにおける空間特性付加処理の手順を示すフローチャートである。まず、ステップS110において、畳み込み演算部51は、インパルス応答の直接音フレームと入力音声信号との畳み込み演算を、入力音声信号のブロック単位で行い、得られた畳み込み演算結果を畳み込み演算結果格納バッファ52に格納する。
次に、ステップS120において、遅延回路53A〜53Eは、畳み込み演算結果格納バッファ52に格納された入力音声信号の各ブロックの畳み込み演算結果に対して、遅延時間D1〜D5により遅延処理を施す。
次に、ステップS130において、アンプ54A〜54Eは、遅延回路53A〜53Eから出力される信号にそれぞれ係数値P1〜P5を乗算して増幅し、増幅された信号を出力する。
そして、ステップS140において、畳み込み演算部51で得られた畳み込み演算結果と、アンプ54A〜54Eで増幅された信号とが、出力待機バッファ55内に加算される。
その後、出力待機バッファ55は、格納した信号を時分割的に先頭の1ブロックごとに空間特性付加信号として加算器41Aに出力する。ここで、図4に示すように、出力待機バッファ55から出力される1ブロックの長さL1は、遅延時間D1〜D5に依存しない。1ブロックの出力後、出力待機バッファ55内の信号は1ブロック分前詰めされる。
そして、空間特性付加処理部31Aから加算器41Aに供給された空間特性付加信号は、加算器41Aにおいて空間特性付加処理部32A〜35Aからの空間特性付加信号と加算される。また、空間特性付加処理部31B〜35Bからの空間特性付加信号は加算器41Bにおいて足し合わされる。
クロストークキャンセル処理部42は、加算器41Aで生成された左チャンネルの出力音声信号と、加算器41Bで生成された右チャンネルの出力音声信号との相互作用をキャンセルするクロストークキャンセル処理を行う。そして、クロストークキャンセル処理後の左右チャンネルの出力音声信号は、それぞれスピーカ43A,43Bにおいて音声として出力される。
上記説明のように、畳み込み演算部51で必要なタップ数は直接音フレーム長のみであり、直接音フレームの定義上、例えばサンプリング周波数48kHzにおいて長くともおよそ256サンプルというサンプルオーダーである。その他の特徴的サンプル点位置に対応した畳み込み演算は必要なく、出力待機バッファ55に対して特定の位置に積和して格納するのみである。
また、ある長さのブロック単位で一括の積和が可能であるようなアーキテクチャのプロセッサにおいては、出力待機バッファ55の格納までの処理が1サンプルごとではなく1ブロックごとに可能となり、さらなる演算量の削減を見込むことができる。
また、DSP(Digital Signal Processor)を用いた実装時には、図4における出力待機バッファ55の要するメモリ容量と再生の1サイクル(入力音声信号の1ブロック単位分の時間長)に演算可能な量にて、特徴的サンプル点位置の数を決めることができる。特徴量抽出時に、用いるべきポイントの順序を基となるインパルス応答の直接音フレームとの相関値の高い順としたため、決定した数に対しても自動的にすべての段の遅延回路における遅延時間、およびアンプの係数値の値は定まる。
なお、上記のパラメータの値は一例であり、サンプリング周波数は48kHz以外にも44.1kHz、96kHzなどでもよい。直接音フレーム長も同様に、例えば128サンプルでもよいし、上記の例より長い512サンプルなどに設定してもよい。
このように本実施の形態によれば、インパルス応答の中から選択される直接音フレームと相関の高い部分の位置を示す特徴的サンプル点位置と、特徴的サンプル点位置からの1フレームと直接音フレームとのパワー比率とを求め、入力音声信号と直接音フレームとの畳み込み演算を行い、得られた畳み込み演算結果に対して、特徴的サンプル点位置とパワー比率とに応じた遅延処理および積和演算を行うので、妥当性をもってインパルス応答の畳み込み演算に用いる特徴的部分を選択し、かつ少ない演算量で効果的な音像定位を行うことができる。
なお、上記音声信号処理装置の機能をプログラムによりコンピュータに実現させるようにしてもよい。このプログラムは、記録媒体から読みとられてコンピュータに取り込まれてもよいし、通信ネットワークを介して伝送されてコンピュータに取り込まれてもよい。
本発明の実施の形態に係る音声信号処理装置の構成を示すブロック図である。 図1に示す音声信号処理装置のインパルス応答特徴量抽出部の構成を示すブロック図である。 図1に示す音声信号処理装置の再生処理部の構成を示すブロック図である。 図3に示す再生処理部における空間特性付加処理部の構成を示すブロック図である。 インパルス応答の特徴量を抽出する手順を示すフローチャートである。 インパルス応答の波形の一例を示す図である。 インパルス応答の直接音フレームを説明するための図である。 相関値の一例を図8に示す図である。 空間特性付加処理の手順を示すフローチャートである。
符号の説明
1 音声信号処理装置
2 インパルス応答特徴量抽出部
3 再生処理部
21 相関計算部
22 特徴的サンプル点位置記憶部
23 パワー比率計算部
24 パワー比率記憶部
31A〜35A31B〜35B 空間特性付加処理部
41A,41B 加算器
42 クロストークキャンセル処理部
43A,43B スピーカ
51 畳み込み演算部
52 畳み込み演算結果格納バッファ
53A〜53E 遅延回路
54A〜54E アンプ
55 出力待機バッファ

Claims (3)

  1. 複数チャンネルの音声信号からなる音声ソースの各チャンネルについて測定された、当該チャンネルの音声信号が出力されるべきスピーカ位置から聴取者の各耳の位置へのインパルス応答のそれぞれについて特徴量を抽出するインパルス応答特徴量抽出部と、
    前記各インパルス応答について抽出された前記特徴量を用いて前記各チャンネルの入力音声信号を処理して、前記各インパルス応答に対応した空間特性付加信号を出力する空間特性付加処理部と、
    この空間特性付加処理部から出力される各前記空間特性付加信号のうち、聴取者の左耳の位置へのインパルス応答に対応した空間特性付加信号同士を足し合わせて左チャンネルの出力音声信号を生成する第1の加算器と、
    前記空間特性付加処理部から出力される各前記空間特性付加信号のうち、聴取者の右耳の位置へのインパルス応答に対応した空間特性付加信号同士を足し合わせて右チャンネルの出力音声信号を生成する第2の加算器と、
    前記左チャンネルの出力音声信号と前記右チャンネルの出力音声信号との相互作用をキャンセルするクロストークキャンセル処理を行うクロストークキャンセル処理部とを備え、
    前記インパルス応答特徴量抽出部は、
    前記各インパルス応答について、当該インパルス応答の中から選択される直接音フレームと当該インパルス応答との相関値を1サンプルごとに計算する相関計算部と、
    この相関計算部の計算結果に基づいて、当該インパルス応答において前記直接音フレームとの相関値が高い時刻的ポイントに相当する時間軸位置情報を所定の数だけ特徴的サンプル点位置として記憶する特徴的サンプル点位置記憶部と、
    この特徴的サンプル点位置記憶部に記憶された前記各特徴的サンプル点位置について、当該特徴的サンプル点位置からの1フレームと前記直接音フレームとのパワー比率を計算するパワー比率計算部と、
    このパワー比率計算部で計算した前記パワー比率を記憶するパワー比率記憶部とを備え、
    前記空間特性付加処理部は、
    前記各インパルス応答について、当該インパルス応答における前記直接音フレームと、当該インパルス応答に対応するチャンネルの入力音声信号との畳み込み演算を、前記入力音声信号のブロック単位で行う畳み込み演算部と、
    この畳み込み演算部による畳み込み演算結果を格納する畳み込み演算結果格納部と、
    この畳み込み演算結果格納部に格納された前記入力音声信号のブロック単位の畳み込み演算結果に対して、前記特徴的サンプル点位置記憶部に記憶された前記各特徴的サンプル点位置に対応した遅延処理を施す遅延処理部と、
    前記パワー比率記憶部に記憶された前記パワー比率に基づいて、前記遅延処理部から出力される、前記入力音声信号の1ブロックに対して前記特徴的サンプル点位置の数分のブロックの信号をそれぞれ増幅して出力する増幅部と、
    前記畳み込み演算部により得られた前記畳み込み演算結果と、前記増幅部からの増幅信号を格納し、格納した信号を時分割的に先頭の1ブロックごとに空間特性付加信号として出力する出力待機バッファ部と
    を備えることを特徴とする音声信号処理装置。
  2. 前記相関計算部は、所定のフレーム幅ごとに前記インパルス応答のパワーを計算し、パワーの最大値をとるフレームを前記直接音フレームとして決定することを特徴とする請求項1に記載の音声信号処理装置。
  3. 前記相関計算部は、前記インパルス応答の波形の瞬時パワーを時間振幅値の2乗として計算し、前記瞬時パワーの最大値をとる時刻的ポイントを含むフレームを前記直接音フレームとして決定することを特徴とする請求項1に記載の音声信号処理装置。
JP2007004845A 2007-01-12 2007-01-12 音声信号処理装置 Pending JP2008172615A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007004845A JP2008172615A (ja) 2007-01-12 2007-01-12 音声信号処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007004845A JP2008172615A (ja) 2007-01-12 2007-01-12 音声信号処理装置

Publications (1)

Publication Number Publication Date
JP2008172615A true JP2008172615A (ja) 2008-07-24

Family

ID=39700274

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007004845A Pending JP2008172615A (ja) 2007-01-12 2007-01-12 音声信号処理装置

Country Status (1)

Country Link
JP (1) JP2008172615A (ja)

Similar Documents

Publication Publication Date Title
JP6620235B2 (ja) サウンドステージ拡張のための機器及び方法
KR100739798B1 (ko) 청취 위치를 고려한 2채널 입체음향 재생 방법 및 장치
KR101368859B1 (ko) 개인 청각 특성을 고려한 2채널 입체 음향 재생 방법 및장치
KR102571510B1 (ko) 밝은 영역과 어두운 영역에 관하여 최적화된 오디오 사전 보상 필터
US20130089215A1 (en) Audio processing device, audio processing method, recording medium, and program
JP2008517317A (ja) オーディオデータ処理システム、方法、プログラム要素、及びコンピュータ読み取り可能媒体
WO2016183379A2 (en) Generation and playback of near-field audio content
EP2484127B1 (en) Method, computer program and apparatus for processing audio signals
JP2008311718A (ja) 音像定位制御装置及び音像定位制御プログラム
JP2020508590A (ja) マルチチャネル・オーディオ信号をダウンミックスするための装置及び方法
KR20100084319A (ko) 후방향 오디오 채널의 적응적 리마스터링 장치 및 방법
KR20230038426A (ko) 신호 처리 장치 및 방법, 그리고 프로그램
JP2008228225A (ja) 音声信号処理装置
JP5324663B2 (ja) 音響信号処理装置および音響信号処理方法
US20230360662A1 (en) Method and device for processing a binaural recording
US20110261971A1 (en) Sound Signal Compensation Apparatus and Method Thereof
JP2008172615A (ja) 音声信号処理装置
KR100641454B1 (ko) 오디오 시스템의 크로스토크 제거 장치
JP2010217268A (ja) 音源方向知覚が可能な両耳信号を生成する低遅延信号処理装置
JP5552764B2 (ja) 信号処理装置、およびプログラム
CN113611271B (zh) 适用于移动终端的数字音量扩增方法、装置及存储介质
JP2014158103A (ja) 音声信号処理装置、音声信号処理装置の制御方法およびプログラム
EP3537728B1 (en) Connection state determination system for speakers, acoustic device, and connection state determination method for speakers
Völk et al. Physical correlates of loudness transfer functions in binaural synthesis
KR100494288B1 (ko) 다채널 입체 음향 재생 장치 및 그 방법