JP6292040B2 - 音声処理装置、音源位置制御方法及び音源位置制御プログラム - Google Patents
音声処理装置、音源位置制御方法及び音源位置制御プログラム Download PDFInfo
- Publication number
- JP6292040B2 JP6292040B2 JP2014120015A JP2014120015A JP6292040B2 JP 6292040 B2 JP6292040 B2 JP 6292040B2 JP 2014120015 A JP2014120015 A JP 2014120015A JP 2014120015 A JP2014120015 A JP 2014120015A JP 6292040 B2 JP6292040 B2 JP 6292040B2
- Authority
- JP
- Japan
- Prior art keywords
- head
- related transfer
- sound source
- transfer function
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Stereophonic System (AREA)
Description
[音源位置制御システムの構成]
図1は、第1実施形態における音源位置制御システムの構成の一例を示す説明図である。図1に示す音源位置制御システム1は、一例として、ヘッドフォン2と携帯端末3とを備える。携帯端末3は、音声処理装置の一例である。
ヘッドフォン2は、左右の耳に装着して音を聴くための装置である。ヘッドフォン2は、頭部角速度センサ21と、出力装置22と、地磁気センサ23とを備える。この頭部角速度センサ21は、例えば、XYZ軸(3軸)方向の角速度を検出するセンサである。頭部角速度センサ21は、頭部の姿勢変位を検出するため、例えば、頭部の回転運動による角速度を検出し、その角速度のデータを携帯端末3に送信する。なお、角速度のデータは、姿勢データの一例である。出力装置22は、例えば、アナログの音声信号を増幅するスピーカである。地磁気センサ23は、例えば、電子コンパスであって、地磁気の向きを検出し、方位を算出した方位データを、携帯端末3に送信する。なお、方位データは、姿勢データの一例である。
図4は、図1に示す音声ファイルテーブル36のデータ構造の一例を示す説明図である。この音声ファイルテーブル36は、再生用の音声データを格納したテーブルであって、「ファイル名」の項目を含む。音声ファイルテーブル36には、ファイル名(File_001, File_002, File_003,・・・等)の音声データが格納されている。なお、HRTFテーブル35及び音声ファイルテーブル36の取り扱いについては、図8、図9等を用いて後述する。
次に、音声処理装置の主なハードウェア構成について説明する。本件開示の音声処理装置は、例えば、携帯端末3であって、コンピュータを用いて実現できる。
次に、第1実施形態における携帯端末3及びヘッドフォン2の外観構成について、説明する。
図6は、図1に示す携帯端末3及びヘッドフォン2の外観構成の一例を示す図である。ヘッドフォン2は、左耳用のスピーカ22L、右耳用のスピーカ22R、人物がヘッドフォン2を装着するためのヘッドバンド24及びセンサ格納部25を備える。左耳用のスピーカ22L及び右耳用のスピーカ22Rは、通信ケーブル26内の音声用の通信回線を介して、携帯端末3のオーディオ・インターフェース11と電気的に接続される。なお、左耳用のスピーカ22L及び右耳用のスピーカ22Rは、オーディオ・インターフェース11と、無線通信を介して電気的に接続してもよい。
次に、第1実施形態における音源位置制御システム1の処理における概要について説明する。ここで、携帯端末3が音源位置制御プログラムの処理を実行することで、第1実施形態における音源位置制御方法が実現される。
ここで、説明をわかりやすくするため、図2に例示した頭部伝達関数を用いる。図7Aは、初期状態を示している。図7Aに示す通り、人物(聴取者)Pは、静止して、ヘッドフォン2を介して、例えば、図2に示す頭部伝達関数H1(定位角θ1=0度)が畳み込まれた音声ファイルのデータを聴いていることとする。この際、人物Pは、定位角θ1=0度の方位に仮想的に配置される仮想音源VS1から音が聴こえてくるように感じる。
図1に示す携帯端末3の音源位置制御部31は、人物Pの現在の姿勢での頭部伝達関数H1に加えて、頭部の動きが生じたときに、角速度に応じて、その動きに伴う仮想音源の変位を抑制するフィードバック用の頭部伝達関数H2を選択する。
次に、音源位置制御システム1における音源位置制御プログラムの動作の一例について説明する。音源位置制御プログラムは、例えば、音源位置制御処理、HRTF合成処理、音声信号処理及び音声出力処理をプロセッサ4に実行させる。
図8は、第1実施形態における音源位置制御プログラムの動作の一例を示すフローチャートである。図9は、第1実施形態における音源位置制御プログラムの処理ブロック図である。
(現在位置のゲイン):(n度のゲイン)=(1−s):s (式1)
ここで、nは、HRTFテーブル35における頭部伝達関数の定位角(θ)の間隔角度(所定角度)を示す。ゲインは、比例配分の倍率を示し、全体で1を超えないように調整される。例えば、現在位置のゲインを、定位角(θ1 =0度)における第1の頭部伝達関数のゲインとすると、間隔角度が5度である場合、n度のゲインは、例えば、図7に示す人物Pの頭部が反時計回りに回転している場合、次の定位角(θ2 =5度)における第2の頭部伝達関数のゲインとなり、両者間でゲイン調整がなされる。例えば、図10において、s=0.7の場合、現在位置のゲインが、0.3となり、5度のゲインが、0.7となる。
ω≧0の場合(時計回り)、 θ2=θ1−Δθ (式2)
ω<0の場合(反時計回り)、θ2=θ1+Δθ (式3)
ここで、θ1は、第1の頭部伝達関数に対応する仮想音源の定位角であり、図9に示すブロックB1、B2の処理の入力パラメータとなる。θ2 は、第2の頭部伝達関数に対応する仮想音源の定位角であり、Δθは、HRTFテーブル35における各々の頭部伝達関数の間隔角度(例えば5度)である。
音源位置制御部31は、一例として、例えば、図7Cに示す人物Pの頭部が反時計回りに回転している場合、定位角(θ1 =0度)であるので、Δθ=5度として、式3に代入することにより、抑制する側の仮想音源の定位角(θ2 =5度)の値を算出する。
hL=(1−s)h1L + s・h2L (式4)
hR=(1−s)h1R + s・h2R (式5)
ここで、hL は、ミキシング後の左耳用の頭部伝達関数であり、hR は、ミキシング後の右耳用の頭部伝達関数である。
また、sは、音源位置制御部31が算出した配分比であり、h1L は、左耳用の第1の頭部伝達関数であり、h2L は、左耳用の第2の頭部伝達関数である。h1R は、右耳用の第2の頭部伝達関数であり、h2R は、右耳用の第2の頭部伝達関数である。
図11は、第1実施形態における音声信号処理部33の処理の一例を示す説明図である。図11では、音声信号処理部33によるメモリ6の入力バッファ61及び出力バッファ62を用いた処理を模式的に示している。ここで、音声信号処理部33は、音声ファイルテーブル36を参照し、聴取り対象の仮想音源の音像の元になる音声データ(例えば、File_001)を入力バッファ61に時系列に一時記録する。
また、音声出力処理部34は、並列処理により、出力バッファに一時記録された音声信号に基づいて、所定のフレームレートで音像定位が施された仮想音源の音(L、R)をヘッドフォン2に出力する(図9に示すブロックB8、B9の処理)。
一方、ステップS102の処理で、頭部の角速度が検出されない場合の処理について説明を続ける。この場合には、ステップS111の処理に移行する。
そして、プロセッサ4は、その後、ステップS107〜ステップS110の処理を実行し、ステップS111の処理において、音声データの読み出しが最後まで終了していない場合(ステップS110:No)、ステップS101の処理に戻る。一方、音声データの読み出しが最後まで終了した場合(ステップS110:Yes)、音源位置制御プログラムの処理を終了する。
図12に示す通り、人物Pの顔の向きが定位角0度の方位(北向き)を向いているとする。ここで、図12では、説明の便宜上、定位角の間隔角度が45度であるので、HRTFテーブル35における頭部伝達関数は、45度間隔のデータを抽出したHRTFテーブルとして用いることとする。
なお、図12では、説明の便宜上、定位角が45度間隔の頭部伝達関数を用いたが、これに限定されない。例えば、HRTFテーブル35に記憶されている各々の頭部伝達関数の定位角が5度間隔であれば、音源位置制御部31は、仮想音源VS2により近い方位の頭部伝達関数を第1の頭部伝達関数として選択できるので、より適切な音声信号を生成できる。また、図12では、ある大きさの仮想音源VS2を例示しているが、仮想音源は、必要に応じて、仮想的な点音源として捉えてもよい。
次に、第2実施形態について説明する。第2実施形態では、聴取り対象の仮想音源がHRTFテーブル35に記憶されている頭部伝達関数の定位角の示す方位に存在しない場合、音源位置制御部31が2つの頭部伝達関数を加重平均することにより、音像定位の精度をさらに向上させる。第2実施形態でも、聴取り対象の仮想音源が、HRTFテーブル35に記憶されている各々の頭部伝達関数の定位角が示す方位に存在しない場合について、説明する。
なお、第2実施形態では、第1実施形態と、同じ構成要素については同じ符号を付して説明を省略し、相違点について詳述する。第2実施形態でも、図1に示す音源位置制御システム1を適用できる。ここで、第2実施形態では、図8に示すフローチャートにおいて、ステップS104、ステップS105の処理が、第1実施形態と異なる。
次に、従来例も含めて、第1、第2実施形態の数値実験による比較について説明する。数値実験は、頭部の姿勢変位に対する応答性(追従性)を比較する。なお、姿勢変位としては、図2に示す水平面(XY平面)の頭部の回転運動(頭部の角速度)を例示する。
次に、第3実施形態について説明する。
図17は、第3実施形態における頭部の回転の方向を例示する説明図である。図17において、第3実施形態では、XYZ軸の直交座標系において、X軸(ロール軸)、Y軸(ピッチ軸)、Z軸(ヨー軸)として3軸を規定する。これにより、第3実施形態では、頭部の回転を、ロール角、ピッチ角、ヨー角(方位角)として、規定できる。ここで、第1実施形態では、Z軸(ヨー軸)を基準として方位角を適用した頭部伝達関数を取り扱ったが、本件開示の技術は、これに限定されない。第3実施形態では、ロール角、ピッチ角を適用した頭部伝達関数を取り扱ってもよい。ここで、頭部角速度センサ21は、例えば、角速度、姿勢角(ロール、ピッチ)及び方位角をリアルタイムに出力する機能を備えていることとする。
なお、第3実施形態では、ロール角、ピッチ角、ヨー角(方位角)を組み合わせて、第1実施形態、第2実施形態と同様の処理を実行してもよい。
さらに、明細書及び図面中のフローチャートに関して、「先ず」、「次に」、「続いて」等の用語を用いて説明したとしても、各種の改良又は変更に関し、この順で実施しなければならないことを必ずしも意味しないという点に留意すべきである。
(付記1)
人物の頭部の動きを示す角速度と顔の向きとを含む姿勢データを取得し、前記人物の周囲に仮想的に配置される仮想音源による音像を定位するための頭部伝達関数を複数記憶した記憶部を参照し、聴取り対象の前記仮想音源の位置と前記顔の向きとに応じて、第1の頭部伝達関数を選択し、前記動きが生じたときに、前記動きに伴う前記仮想音源の変位を抑制する第2の頭部伝達関数を選択する制御部と、
前記第1の頭部伝達関数のデータと前記第2の頭部伝達関数のデータとを、前記角速度に応じて重み付けして合成する合成部と、
合成された頭部伝達関数のデータと、予め記憶された再生用の音声データとに基づいて、前記仮想音源の音声信号を生成する信号処理部と、
を備える音声処理装置。
(付記2)
前記制御部は、前記頭部を基点として所定角度で前記聴取り対象の前記仮想音源を挟む関係を有する2つの連続する頭部伝達関数を、前記記憶部から選択して前記仮想音源の位置に応じて加重平均を行うことにより、前記第1の頭部伝達関数を生成すると共に、前記角速度に基づいて、前記顔の向きの回転方向を予測し、生成した前記第1の頭部伝達関数に対応する方位を基準として、前記回転方向と逆方向に連続する2つの頭部伝達関数を選択し、前記加重平均を行うことにより、前記第2の頭部伝達関数を生成する、付記1に記載の音声処理装置。
(付記3)
前記制御部は、前記頭部を基点として前記聴取り対象の前記仮想音源に最も近い方位の頭部伝達関数を、前記第1の頭部伝達関数として選択し、前記動きが生じたときに、前記角速度に基づいて、前記顔の向きの回転方向を予測し、前記第1の頭部伝達関数に対応する方位を基準として、前記回転方向と逆方向の方位の頭部伝達関数を、前記第2の頭部伝達関数として選択し、
前記合成部は、前記角速度が大きくなるほど、前記第2の頭部伝達関数のデータの寄与が多くなるように合成する、付記1に記載の音声処理装置。
(付記4)
前記記憶部は、前記頭部を起点として直交座標系の3軸方向のそれぞれについて離散的に計測された頭部伝達関数を記憶し、
前記制御部は、前記3軸方向のそれぞれの角速度を取得し、聴取り対象の前記仮想音源の位置と前記顔の向きとに応じて、前記第1の頭部伝達関数と前記第2の頭部伝達関数を選択する、付記1から付記3の何れかに記載の音声処理装置。
(付記5)
コンピュータが、
人物の頭部の動きを示す角速度と顔の向きとを含む姿勢データを取得し、前記人物の周囲に仮想的に配置される仮想音源による音像を定位するための頭部伝達関数を複数記憶した記憶部を参照し、聴取り対象の前記仮想音源の位置と前記姿勢データが示す現在の前記顔の向きとに応じて、第1の頭部伝達関数を選択し、前記動きが生じたときに、前記動きに伴う前記仮想音源の変位を抑制する第2の頭部伝達関数を選択し、
前記第1の頭部伝達関数のデータと前記第2の頭部伝達関数のデータとを、前記角速度に応じて重み付けして合成し、
合成された頭部伝達関数のデータと、予め記憶された再生用の音声データとに基づいて、前記仮想音源の音声信号を生成する
処理を実行する音源位置制御方法。
(付記6)
コンピュータに、
人物の頭部の動きを示す角速度と顔の向きとを含む姿勢データを取得し、前記人物の周囲に仮想的に配置される仮想音源による音像を定位するための頭部伝達関数を複数記憶した記憶部を参照し、聴取り対象の前記仮想音源の位置と前記姿勢データが示す現在の前記顔の向きとに応じて、第1の頭部伝達関数を選択し、前記動きが生じたときに、前記動きに伴う前記仮想音源の変位を抑制する第2の頭部伝達関数を選択し、
前記第1の頭部伝達関数のデータと前記第2の頭部伝達関数のデータとを、前記角速度に応じて重み付けして合成し、
合成された頭部伝達関数のデータと、予め記憶された再生用の音声データとに基づいて、前記仮想音源の音声信号を生成する
処理を実行させる音源位置制御プログラム。
Claims (5)
- 人物の頭部の動きを示す角速度と顔の向きとを含む姿勢データを取得し、前記人物の周囲に仮想的に配置される仮想音源による音像を定位するための頭部伝達関数を複数記憶した記憶部を参照し、聴取り対象の前記仮想音源の位置と前記顔の向きとに応じて、第1の頭部伝達関数を選択し、前記動きが生じたときに、前記動きに伴う前記仮想音源の変位を抑制する第2の頭部伝達関数を選択する制御部と、
前記第1の頭部伝達関数のデータと前記第2の頭部伝達関数のデータとを、前記角速度に応じて重み付けして合成する合成部と、
合成された頭部伝達関数のデータと、予め記憶された再生用の音声データとに基づいて、前記仮想音源の音声信号を生成する信号処理部と、
を備える音声処理装置。 - 前記制御部は、前記頭部を基点として所定角度で前記聴取り対象の前記仮想音源を挟む関係を有する2つの連続する頭部伝達関数を選択し、前記仮想音源の位置に応じて加重平均を行うことにより、前記第1の頭部伝達関数を生成し、前記角速度に基づいて、前記顔の向きの回転方向を予測し、生成した前記第1の頭部伝達関数に対応する方位を基準として、前記回転方向と逆方向に連続する2つの頭部伝達関数を選択し、前記加重平均を行うことにより、前記第2の頭部伝達関数を生成する、請求項1に記載の音声処理装置。
- 前記制御部は、前記頭部を基点として前記聴取り対象の前記仮想音源に最も近い方位の頭部伝達関数を、前記第1の頭部伝達関数として選択し、前記動きが生じたときに、前記角速度に基づいて、前記顔の向きの回転方向を予測し、前記第1の頭部伝達関数に対応する方位を基準として、前記回転方向と逆方向の方位の頭部伝達関数を、前記第2の頭部伝達関数として選択し、
前記合成部は、前記角速度が大きくなるほど、前記第2の頭部伝達関数のデータの寄与が多くなるように合成する、請求項1に記載の音声処理装置。 - コンピュータが、
人物の頭部の動きを示す角速度と顔の向きとを含む姿勢データを取得し、前記人物の周囲に仮想的に配置される仮想音源による音像を定位するための頭部伝達関数を複数記憶した記憶部を参照し、聴取り対象の前記仮想音源の位置と前記姿勢データが示す現在の前記顔の向きとに応じて、第1の頭部伝達関数を選択し、前記動きが生じたときに、前記動きに伴う前記仮想音源の変位を抑制する第2の頭部伝達関数を選択し、
前記第1の頭部伝達関数のデータと前記第2の頭部伝達関数のデータとを、前記角速度に応じて重み付けして合成し、
合成された頭部伝達関数のデータと、予め記憶された再生用の音声データとに基づいて、前記仮想音源の音声信号を生成する
処理を実行する音源位置制御方法。 - コンピュータに、
人物の頭部の動きを示す角速度と顔の向きとを含む姿勢データを取得し、前記人物の周囲に仮想的に配置される仮想音源による音像を定位するための頭部伝達関数を複数記憶した記憶部を参照し、聴取り対象の前記仮想音源の位置と前記姿勢データが示す現在の前記顔の向きとに応じて、第1の頭部伝達関数を選択し、前記動きが生じたときに、前記動きに伴う前記仮想音源の変位を抑制する第2の頭部伝達関数を選択し、
前記第1の頭部伝達関数のデータと前記第2の頭部伝達関数のデータとを、前記角速度に応じて重み付けして合成し、
合成された頭部伝達関数のデータと、予め記憶された再生用の音声データとに基づいて、前記仮想音源の音声信号を生成する
処理を実行させる音源位置制御プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014120015A JP6292040B2 (ja) | 2014-06-10 | 2014-06-10 | 音声処理装置、音源位置制御方法及び音源位置制御プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014120015A JP6292040B2 (ja) | 2014-06-10 | 2014-06-10 | 音声処理装置、音源位置制御方法及び音源位置制御プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015233252A JP2015233252A (ja) | 2015-12-24 |
JP6292040B2 true JP6292040B2 (ja) | 2018-03-14 |
Family
ID=54934468
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014120015A Active JP6292040B2 (ja) | 2014-06-10 | 2014-06-10 | 音声処理装置、音源位置制御方法及び音源位置制御プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6292040B2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6732464B2 (ja) * | 2016-02-12 | 2020-07-29 | キヤノン株式会社 | 情報処理装置および情報処理方法 |
CN106572425A (zh) * | 2016-05-05 | 2017-04-19 | 王杰 | 音频处理装置及方法 |
GB2554447A (en) * | 2016-09-28 | 2018-04-04 | Nokia Technologies Oy | Gain control in spatial audio systems |
CN110036655B (zh) * | 2016-12-12 | 2022-05-24 | 索尼公司 | Hrtf测量方法、hrtf测量装置和存储介质 |
JP7212622B2 (ja) * | 2017-06-15 | 2023-01-25 | ドルビー・インターナショナル・アーベー | コンピュータ媒介式の現実アプリケーションにおける送信器と受信器との間の通信を最適化する方法、装置およびシステム |
JP7252965B2 (ja) * | 2018-02-15 | 2023-04-05 | マジック リープ, インコーポレイテッド | 複合現実のための二重聴取者位置 |
JP7342451B2 (ja) * | 2019-06-27 | 2023-09-12 | ヤマハ株式会社 | 音声処理装置および音声処理方法 |
WO2024150544A1 (ja) * | 2023-01-12 | 2024-07-18 | ソニーグループ株式会社 | 音響装置、音響処理方法及び音響処理プログラム |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2751512B2 (ja) * | 1990-01-19 | 1998-05-18 | ソニー株式会社 | 音響信号再生装置 |
JPH0444500A (ja) * | 1990-06-11 | 1992-02-14 | Yamaha Corp | ヘッドホンシステム |
JPH0946797A (ja) * | 1995-07-28 | 1997-02-14 | Sanyo Electric Co Ltd | 音響信号再生装置 |
-
2014
- 2014-06-10 JP JP2014120015A patent/JP6292040B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2015233252A (ja) | 2015-12-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6292040B2 (ja) | 音声処理装置、音源位置制御方法及び音源位置制御プログラム | |
US10932075B2 (en) | Spatial audio processing apparatus | |
US9820037B2 (en) | Audio capture apparatus | |
US10397728B2 (en) | Differential headtracking apparatus | |
US10080094B2 (en) | Audio processing apparatus | |
EP3141002B1 (en) | Virtual sound systems and methods | |
US8644531B2 (en) | Information processing system and information processing method | |
US9357306B2 (en) | Multichannel audio calibration method and apparatus | |
US10448192B2 (en) | Apparatus and method of audio stabilizing | |
EP2719200B1 (en) | Reducing head-related transfer function data volume | |
US10003905B1 (en) | Personalized end user head-related transfer function (HRTV) finite impulse response (FIR) filter | |
US20160299738A1 (en) | Visual Audio Processing Apparatus | |
EP3435690B1 (en) | Sound processing method and sound processing device | |
US9769585B1 (en) | Positioning surround sound for virtual acoustic presence | |
US9462406B2 (en) | Method and apparatus for facilitating spatial audio capture with multiple devices | |
JP6596896B2 (ja) | 頭部伝達関数選択装置、頭部伝達関数選択方法、頭部伝達関数選択プログラム、音声再生装置 | |
CN105263075A (zh) | 一种带方位传感器耳机及其3d声场还原方法 | |
CN107105384B (zh) | 一种中垂面上近场虚拟声像的合成方法 | |
EP3618459B1 (en) | Method and apparatus for playing audio data | |
CN107707742B (zh) | 一种音频文件播放方法及移动终端 | |
WO2023173285A1 (zh) | 音频处理方法、装置、电子设备及计算机可读存储介质 | |
JP5380945B2 (ja) | 音響再生装置およびプログラム | |
US11076257B1 (en) | Converting ambisonic audio to binaural audio | |
WO2024037190A1 (zh) | 音频处理方法和装置 | |
JP6651231B2 (ja) | 携帯情報端末、情報処理装置、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170309 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20171215 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180116 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180129 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6292040 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |