WO2017154378A1

WO2017154378A1 - 測定装置、フィルタ生成装置、測定方法、及びフィルタ生成方法

Info

Publication number: WO2017154378A1
Application number: PCT/JP2017/001950
Authority: WO
Inventors: 村田　寿子; 正也小西; 優美藤井
Original assignee: 株式会社Ｊｖｃケンウッド
Priority date: 2016-03-10
Filing date: 2017-01-20
Publication date: 2017-09-14
Also published as: EP3428915B1; JP2017161775A; US10405127B2; US20190007784A1; CN108885864B; JP6701824B2; EP3428915A4; CN108885864A; EP3428915A1

Abstract

適切に測定を行うことができる測定装置、フィルタ生成装置、測定方法、及びフィルタ生成方法を提供する。本実施の形態にかかる測定装置は、収音信号に含まれる正負のピークを検出するピーク検出部（３１１）と、ピーク検出部（３１１）で検出された正負のピークでの振幅に基づいて、正又は負の符号を決定する符号決定部（３１２）と、決定された符号のピークのピーク配列を複数のピーク群に分割するピーク群分割部（３１３）と、複数のピーク群毎の最大振幅を検出する最大振幅検出部（３１４）と、最大振幅に基づいた切り出しタイミングで、前記収音信号を切り出して、複数の切り出し信号を生成する信号切り出し部（３１５）と、複数の切り出し信号を加算する信号加算部（３１６）を備えたものである。

Description

測定装置、フィルタ生成装置、測定方法、及びフィルタ生成方法

　本発明は、測定装置、フィルタ生成装置、測定方法、及びフィルタ生成方法に関する。

　音像定位技術として、ヘッドホンを用いて受聴者の頭部の外側に音像を定位させる頭外定位技術がある。頭外定位技術では、ヘッドホンから耳までの特性をキャンセルし、ステレオスピーカから耳までの４本の特性を与えることにより、音像を頭外に定位させている。

　頭外定位再生においては、２チャンネル（以下、ｃｈと記載）のスピーカから発した測定信号（インパルス音等）を聴取者本人の耳に設置したマイクロフォン（以下、マイクとする）で録音する。そして、インパルス応答から頭部伝達関数を算出して、フィルタを作成する。作成したフィルタを２ｃｈのオーディオ信号に畳み込むことにより、頭外定位再生を実現することができる。

　特許文献１には、個人化された室内インパルス応答のセットを取得する方法が開示されている。特許文献１では、聴取者の各耳の近くにマイクを設置している。そして、スピーカを駆動した時のインパルス音を、左右のマイクが録音する。

特表２００８－５１２０１５号公報特許４１８４４２０号公報

　従来、スピーカなどの音源が設置された専用の測定室、及び専用の機材を用いて測定が行われていた。しかしながら、昨今のメモリ容量の増大や演算速度の高速化に伴い、受聴者がパーソナルコンピュータ（ＰＣ）等を用いて、インパルス応答測定を行うことが可能となっている。受聴者がＰＣ等を用いてインパルス応答測定を行う場合、以下に示す問題点がある。

　インパルス応答測定では、Ｓ／Ｎ比を向上させるために、同じ条件でのインパルス応答測定を複数回行い、測定された信号を同期加算している（特許文献２）。同期加算を行う場合、各測定において、スピーカから測定信号を出力するタイミングと、マイクが測定信号を収音するタイミングと、を同期させる必要がある。

　一般的なＰＣ用音響デバイスは、入力と出力のクロックが同期している。このため、一旦測定を開始すると、停止するまでデバイスの持つ遅延量は変化しない。つまり、ある信号音（インパルス音）を含む測定信号を出力すると、ある遅延量をもって信号音がマイクで収音される。周期的に信号音を出すようにリピート再生させると、決められた周期で信号音が出力されるのが通常である。

　ところが、安価な音響デバイスを使用すると、周期的に信号音を出力しても、各信号音の遅延量が異なる場合がある。このため、一定の周期で信号音が再生されない、ということが起こる。例えば、マルチタスクの制御が音響デバイス優先となっておらず、他のタスクを実行してから音が出力される理由が考えられる。よって、測定に不可欠な同期加算ができず、正確な伝達特性が測定できないという問題点がある。

　本実施形態は上記の点に鑑みなされたもので、適切に伝達特性を測定することができる測定装置、フィルタ生成装置、測定方法、及びフィルタ生成方法を提供することを目的とする。

　本実施形態の一態様にかかる測定装置は、時間間隔を空けて連続する複数の信号音を含む測定信号を出力するスピーカと、前記スピーカから出力された前記測定信号を収音して、収音信号を取得するマイクと、前記収音信号に基づいて、伝達特性を測定する測定部と、を備え、前記測定部は、収音信号に含まれる正負のピークを検出するピーク検出部と、ピーク検出部で検出された前記正負のピークでの振幅に基づいて、正又は負の符号を決定する符号決定部と、決定された符号の前記ピークから構成されるピーク配列を複数のピーク群に分割する分割部と、前記複数のピーク群毎の最大振幅を検出する最大振幅検出部と、前記最大振幅に基づいた切り出しタイミングで、前記収音信号を切り出して、複数の切り出し信号を生成する切り出し部と、前記複数の切り出し信号を加算する信号加算部を備えたものである。

　本実施形態の一態様にかかる測定方法は、スピーカから出力された測定信号をマイクで収音することで伝達特性を測定する測定方法であって、前記スピーカから時間間隔を空けて連続する複数の信号音を含む測定信号を出力するステップと、前記スピーカから出力された前記測定信号をマイクで収音して、収音信号を取得するステップと、前記収音信号に含まれる正負のピークを検出するピーク検出ステップと、ピーク検出部で検出された前記正負のピークでの振幅に基づいて、正又は負の符号を決定する符号決定ステップと、決定された符号の前記ピークから構成されるピーク配列を複数のピーク群に分割する分割ステップと、前記複数のピーク群毎の最大振幅を検出する最大振幅検出ステップと、前記最大振幅に基づいた切り出しタイミングで、前記収音信号を切り出して、複数の切り出し信号を生成する切り出しステップと、前記複数の切り出し信号を加算する信号加算ステップと、を含むものである。

　本実施形態によれば、適切に伝達特性を測定することができる測定装置、フィルタ生成装置、測定方法、及びフィルタ生成方法を提供することができる。

本実施の形態に係る頭外定位処理装置を示すブロック図である。フィルタを生成するフィルタ生成装置の構成を示す図である。測定例１の伝達特性Ｈｌｓ、Ｈｌｏを示す図である。測定例１の伝達特性Ｈｒｓ、Ｈｒｏを示す図である。測定例２の伝達特性Ｈｌｓ、Ｈｌｏを示す図である。測定例２の伝達特性Ｈｒｓ、Ｈｒｏを示す図である。測定例３の伝達特性Ｈｌｓ、Ｈｌｏを示す図である。測定例３の伝達特性Ｈｒｓ、Ｈｒｏを示す図である。測定例４の伝達特性Ｈｌｓ、Ｈｌｏを示す図である。測定例４の伝達特性Ｈｒｓ、Ｈｒｏを示す図である。測定例５の伝達特性Ｈｌｓ、Ｈｌｏを示す図である。測定例５の伝達特性Ｈｒｓ、Ｈｒｏを示す図である。測定例４において、切り出された伝達特性Ｈｌｓ、Ｈｒｓを示す図である。測定例５において、切り出された伝達特性Ｈｌｓ、Ｈｒｓを示す図である。フィルタ生成装置の構成を示す制御ブロック図である。加算処理部の構成を示すブロック図である。加算処理部での加算処理を示すフローチャートである。加算処理部での加算処理を示すフローチャートである。加算処理部での加算処理を説明するための信号波形図である。加算処理部での加算処理を説明するための信号波形図である。加算処理部での加算処理を説明するための信号波形図である。加算処理部での加算処理を説明するための信号波形図である。加算処理部での加算処理を説明するための信号波形図である。加算処理部での加算処理を説明するための信号波形図である。フィルタの生成方法を示すフローチャートである。直接音探索処理を示すフローチャートである。図２６で示した処理の詳細な一例を示すフローチャートである。相互相関係数を算出するための処理を説明するための図である。音響デバイスによる遅延を説明するための図である。音響デバイスによる遅延を説明するための図である。音響デバイスによる遅延を説明するための図である。

　本実施の形態では、測定装置によって、スピーカからマイクまでの伝達特性を測定している。そして、測定装置で測定された伝達特性に基づいて、フィルタ生成装置がフィルタを生成している。

　本実施の形態にかかるフィルタ生成装置で生成したフィルタを用いた音像定位処理の概要について説明する。ここでは、音像定位処理装置の一例である頭外定位処理について説明する。本実施形態にかかる頭外定位処理は、個人の空間音響伝達特性（空間音響伝達関数ともいう）と外耳道伝達特性（外耳道伝達関数ともいう）を用いて頭外定位処理を行うものである。本実施形態では、スピーカから聴取者の耳までの空間音響伝達特性、及びヘッドホンを装着した状態での外耳道伝達特性を用いて頭外定位処理を実現している。

　本実施の形態では、ヘッドホン装着状態でのヘッドホンスピーカユニットから外耳道入口までの特性である外耳道伝達特性が利用されている。そして、外耳道伝達特性の逆特性（外耳道補正関数ともいう）を用いて畳み込み処理を行うことで、外耳道伝達特性をキャンセルすることができる。

　本実施の形態にかかる頭外定位処理装置は、パーソナルコンピュータ、スマートホン、タブレットＰＣなどの情報処理装置であり、プロセッサ等の処理手段、メモリやハードディスクなどの記憶手段、液晶モニタ等の表示手段、タッチパネル、ボタン、キーボード、マウスなどの入力手段、ヘッドホン又はイヤホンを有する出力手段を備えている。

実施の形態１．
　本実施の形態にかかる音場再生装置の一例である頭外定位処理装置１００を図１に示す。図１は、頭外定位処理装置のブロック図である。頭外定位処理装置１００は、ヘッドホン４３を装着するユーザＵに対して音場を再生する。そのため、頭外定位処理装置１００は、ＬｃｈとＲｃｈのステレオ入力信号ＸＬ、ＸＲについて、音像定位処理を行う。ＬｃｈとＲｃｈのステレオ入力信号ＸＬ、ＸＲは、ＣＤ（Compact Disc）プレーヤなどから出力されるオーディオ再生信号である。なお、頭外定位処理装置１００は、物理的に単一な装置に限られるものではなく、一部の処理が異なる装置で行われてもよい。例えば、一部の処理がパソコンなどにより行われ、残りの処理がヘッドホン４３に内蔵されたＤＳＰ(Digital Signal Processor)などにより行われてもよい。

　頭外定位処理装置１００は、頭外定位処理部１０と、フィルタ部４１、フィルタ部４２、及びヘッドホン４３を備えている。

　頭外定位処理部１０は、畳み込み演算部１１～１２、２１～２２、及び加算器２４、２５を備えている。畳み込み演算部１１～１２、２１～２２は、空間音響伝達特性を用いた畳み込み処理を行う。頭外定位処理部１０には、ＣＤプレーヤなどからのステレオ入力信号ＸＬ、ＸＲが入力される。頭外定位処理部１０には、空間音響伝達特性が設定されている。頭外定位処理部１０は、各ｃｈのステレオ入力信号ＸＬ、ＸＲに対し、空間音響伝達特性を畳み込む。空間音響伝達特性はユーザＵ本人の頭部や耳介で測定した頭部伝達関数ＨＲＴＦでもよいし、ダミーヘッドまたは第三者の頭部伝達関数であってもよい。これらの伝達特性は、その場で測定してもよいし、予め用意してもよい。

　空間音響伝達特性は、４つの伝達特性Ｈｌｓ、Ｈｌｏ、Ｈｒｏ、Ｈｒｓを有している。４つの伝達特性は、後述するフィルタ生成装置を用いて求めることができる。

　そして、畳み込み演算部１１は、Ｌｃｈのステレオ入力信号ＸＬに対して伝達特性Ｈｌｓを畳み込む。畳み込み演算部１１は、畳み込み演算データを加算器２４に出力する。畳み込み演算部２１は、Ｒｃｈのステレオ入力信号ＸＲに対して伝達特性Ｈｒｏを畳み込む。畳み込み演算部２１は、畳み込み演算データを加算器２４に出力する。加算器２４は２つの畳み込み演算データを加算して、フィルタ部４１に出力する。

　畳み込み演算部１２は、Ｌｃｈのステレオ入力信号ＸＬに対して伝達特性Ｈｌｏを畳み込む。畳み込み演算部１２は、畳み込み演算データを、加算器２５に出力する。畳み込み演算部２２は、Ｒｃｈのステレオ入力信号ＸＲに対して伝達特性Ｈｒｓを畳み込む。畳み込み演算部２２は、畳み込み演算データを、加算器２５に出力する。加算器２５は２つの畳み込み演算データを加算して、フィルタ部４２に出力する。

　フィルタ部４１、４２には外耳道伝達特性をキャンセルする逆フィルタが設定されている。そして、頭外定位処理部１０での処理が施された再生信号に逆フィルタを畳み込む。フィルタ部４１で加算器２４からのＬｃｈ信号に対して、逆フィルタを畳み込む。同様に、フィルタ部４２は加算器２５からのＲｃｈ信号に対して逆フィルタを畳み込む。逆フィルタは、ヘッドホン４３を装着した場合に、ヘッドホンユニットからマイクまでの特性をキャンセルする。すなわち、外耳道入口にマイクを配置したとき、ユーザ各人の外耳道入口とヘッドホンの再生ユニット間、あるいは鼓膜とヘッドホンの再生ユニット間の伝達特性をキャンセルする。逆フィルタは、ユーザＵ本人の耳介で外耳道伝達関数をその場で測定した結果から算出してもよいし、ダミーヘッド等の任意の外耳道伝達関数から算出したヘッドホン特性の逆フィルタを予め用意してもよい。

　フィルタ部４１は、補正されたＬｃｈ信号をヘッドホン４３の左ユニット４３Ｌに出力する。フィルタ部４２は、補正されたＲｃｈ信号をヘッドホン４３の右ユニット４３Ｒに出力する。ユーザＵは、ヘッドホン４３を装着している。ヘッドホン４３は、Ｌｃｈ信号とＲｃｈ信号をユーザＵに向けて出力する。これにより、ユーザＵの頭外に定位された音像を再生することができる。

（フィルタ生成装置）
　図２を用いて、空間音響伝達特性（以下、伝達特性とする）を測定して、フィルタを生成するフィルタ生成装置について説明する。図２は、フィルタ生成装置２００の測定構成を模式的に示す図である。なお、フィルタ生成装置２００は、図１に示す頭外定位処理装置１００と共通の装置であってもよい。あるいは、フィルタ生成装置２００の一部又は全部が頭外定位処理装置１００と異なる装置となっていてもよい。なお、フィルタ生成装置２００は、後述するように、伝達特性の測定装置、あるいは測定部としても機能する。

　図２に示すように、フィルタ生成装置２００は、ステレオスピーカ５とステレオマイク２を有している。ステレオスピーカ５が測定環境に設置されている。測定環境は、音響特性が考慮されていない環境（例えば部屋の形状が左右非対称等）や、ノイズとなる環境音が発生している環境となっている。より具体的には、測定環境は、ユーザＵの自宅の部屋やオーディオシステムの販売店舗やショールーム等でもよい。また、測定環境が音響特性を考慮していないレイアウトとなっていることがある。自宅の部屋では、家具などが左右非対称に配置されていることもある。スピーカが部屋に対して左右対称に配置されていないこともある。さらに、窓、壁面、床面、天井面からの反射による不要な残響が発生することもある。本実施の形態では、理想的ではない測定環境であっても、適切な伝達特性を測定するための処理を行っている。

　本実施の形態では、フィルタ生成装置２００の処理装置（図２では不図示）が、適切な伝達特性を測定するための演算処理を行っている。処理装置は、例えば、パーソナルコンピュータ（ＰＣ）、タブレット端末、スマートホン等である。

　ステレオスピーカ５は、左スピーカ５Ｌと右スピーカ５Ｒを備えている。例えば、受聴者１の前方に左スピーカ５Ｌと右スピーカ５Ｒが設置されている。左スピーカ５Ｌと右スピーカ５Ｒは、インパルス応答測定を行うためのインパルス音等を出力する。

　ステレオマイク２は、左のマイク２Ｌと右のマイク２Ｒを有している。左のマイク２Ｌは、受聴者１の左耳９Ｌに設置され、右のマイク２Ｒは、受聴者１の右耳９Ｒに設置されている。具体的には、左耳９Ｌ、右耳９Ｒの外耳道入口又は鼓膜位置にマイク２Ｌ、２Ｒを設置することが好ましい。マイク２Ｌ、２Ｒは、ステレオスピーカ５から出力された測定信号を収音して、収音信号を取得する。マイク２Ｌ、２Ｒは収音信号を後述するフィルタ生成装置２００に出力する。受聴者１は、人でもよく、ダミーヘッドでもよい。すなわち、本実施形態において、受聴者１は人だけでなく、ダミーヘッドを含む概念である。

　上記のように、左右のスピーカ５Ｌ、５Ｒで出力されたインパルス音をマイク２Ｌ、２Ｒで測定することでインパルス応答が測定される。フィルタ生成装置２００は、インパルス応答測定に基づいて取得した収音信号をメモリなどに記憶する。これにより、左スピーカ５Ｌと左マイク２Ｌとの間の伝達特性Ｈｌｓ、左スピーカ５Ｌと右マイク２Ｒとの間の伝達特性Ｈｌｏ、右スピーカ５Ｌと左マイク２Ｌとの間の伝達特性Ｈｒｏ、右スピーカ５Ｒと右マイク２Ｒとの間の伝達特性Ｈｒｓが測定される。すなわち、左スピーカ５Ｌから出力された測定信号を左マイク２Ｌが収音することで、伝達特性Ｈｌｓが取得される。左スピーカ５Ｌから出力された測定信号を右マイク２Ｒが収音することで、伝達特性Ｈｌｏが取得される。右スピーカ５Ｒから出力された測定信号を左マイク２Ｌが収音することで、伝達特性Ｈｒｏが取得される。右スピーカ５Ｒから出力された測定信号を右マイク２Ｒが収音することで、伝達特性Ｈｒｓが取得される。

　そして、フィルタ生成装置２００は、収音信号に基づいて、左右のスピーカ５Ｌ、５Ｒから左右のマイク２Ｌ、２Ｒまでの伝達特性Ｈｌｓ～Ｈｒｓに応じたフィルタを生成する。具体的には、フィルタ生成装置２００は、伝達特性Ｈｌｓ～Ｈｒｓを所定のフィルタ長で切り出して、頭外定位処理部１０の畳み込み演算に用いられるフィルタとして生成する。図１で示したように、頭外定位処理装置１００が、左右のスピーカ５Ｌ、５Ｒと左右のマイク２Ｌ、２Ｒとの間の伝達特性Ｈｌｓ～Ｈｒｓを用いて頭外定位処理を行う。すなわち、伝達特性をオーディオ再生信号に畳み込むことにより、頭外定位処理を行う。

　ここで、様々な測定環境で伝達特性を測定した場合に生じる問題について説明する。まず、理想的な測定環境において、インパルス応答測定した場合の収音信号の信号波形を測定例１として、図３、図４に示す。なお、図３、図４、及び後述の図に示す信号波形において、横軸がサンプル数であり、縦軸が振幅となっている。なお、サンプル数は測定開始からの時間に対応するものであり、測定開始タイミングを０としている。振幅は、マイク２Ｌ、２Ｒで取得した収音信号の信号強度、あるいは音圧に対応するものであり、正または負の符号を有する。

　測定例１では、反響がない無響室に耳介のない人頭とみなした剛球を配置して、測定を行っている。測定環境となる無響室において、剛球の前方には、左右対称に左右のスピーカ５Ｌ、５Ｒが配置されている。また、剛球に対して人頭の耳に相当する部分に左右対称にマイクを設置している。

　このような理想的な測定環境でインパルス測定を行った場合、図３、図４に示すような伝達特性Ｈｌｓ、Ｈｌｏ、Ｈｒｏ、Ｈｒｓが測定される。図３は、測定例１の伝達特性Ｈｌｓ、Ｈｌｏ、すなわち、左スピーカ５Ｌを駆動した時の測定結果を示している。図４は、測定例１の伝達特性Ｈｒｏ、Ｈｒｓ、すなわち右スピーカ５Ｒを駆動した時の測定結果を示している。図３の伝達特性Ｈｌｓと、図４の伝達特性Ｈｒｓとは、略同じ波形となっている。すなわち、伝達特性Ｈｌｓと、伝達特性Ｈｒｓとでは、ほぼ同じタイミングにほぼ同じ大きさのピークが現われる。すなわち、左スピーカ５Ｌから左マイク２Ｌまでのインパルス音の到達時刻と、右スピーカ５Ｒから右マイク２Ｒまでのインパルス音の到達時刻が一致している。

　実際の測定が行われる測定環境で測定した伝達特性を測定例２、３として、図５～図８に示す。図５は、測定例２の伝達特性Ｈｌｓ、Ｈｌｏを示し、図６は、測定例２の伝達特性のＨｒｏ、Ｈｒｓを示している。図７は、測定例３の伝達特性Ｈｌｓ、Ｈｌｏを示し、図８は、測定例３の伝達特性Ｈｒｏ、Ｈｒｓを示している。測定例２、３はそれぞれ異なる測定環境で行われた測定であり、受聴者周辺の物や、壁面、天井、床からの反響がある測定環境で行われている。

　実際の測定環境が、受聴者１の自宅などの場合、パーソナルコンピュータやスマートホン等によって、ステレオスピーカ５からインパルス音を発生させる。すなわち、パーソナルコンピュータやスマートホン等の汎用の情報処理装置が音響デバイスとして用いられる。このような場合、音響デバイスの遅延量が測定毎に異なるおそれがある。例えば、音響デバイスのプロセッサでの処理や、インターフェースでの処理により信号遅延が生じる場合がある。

　よって、ステレオスピーカ５の中央に剛球を設置したとしても、音響デバイスでの遅延により、左スピーカ５Ｌの駆動時と、右スピーカ５Ｒの駆動時で、応答位置（ピーク位置）が異なる。このような場合、測定例２、３に示すように、最大振幅（絶対値が最大となる振幅）が同じ時刻となるように、伝達特性を切り出している。例えば、測定例２では、伝達特性Ｈｌｓ、Ｈｒｓの最大振幅Ａが３０サンプル目となるように、伝達特性Ｈｌｓ、Ｈｌｏ、Ｈｒｏ、Ｈｒｓを切り出している。なお、測定例２で、最大振幅は、負のピークとなっている（図５、図６のＡ）。

　しかしながら、受聴者１の左右の耳介形状が異なる場合がある。この場合、受聴者１が左右のスピーカ５Ｌ、５Ｒに対して左右対称な位置にいたとしても、左右の伝達特性が大きく異なってしまう。また、測定環境が左右非対称である場合も、左右の伝達特性が大きく異なってしまう。

　さらに、実際の測定環境において測定を行う場合、図９、図１０に示す測定例４のように、最大振幅を取るピークが２つに割れてしまうことがある。測定例４では、図１０に示すように伝達特性Ｈｒｓの最大振幅Ａが２つに割れている。

　また、図１１、図１２の測定例５のように、左右の伝達特性Ｈｌｓ、Ｈｒｓで、最大振幅を取るピークの符号が異なる場合がある。測定例５では、伝達特性Ｈｌｓの最大振幅Ａは正のピークとなり（図１１）、伝達特性Ｈｒｓの最大振幅Ａは負のピークとなっている（図１２）。

　このように、左右の伝達特性Ｈｌｓ、Ｈｒｓの信号波形が大きく異なると、左右のスピーカ５からの音の到達時間がずれてしまう。よって、頭外定位処理部１０において畳み込み演算を行った場合、左右のバランスの良い音場を得ることができない場合がある。例えば、測定例４、測定例５の伝達特性Ｈｌｓ、Ｈｒｓが最大振幅を示すサンプル位置（または時刻）で揃えて切り出した伝達特性を図１３、図１４に示す。図１３は、測定例４の伝達特性Ｈｌｓ、Ｈｒｓを示し、図１４は、測定例５の伝達特性Ｈｌｓ、Ｈｒｓを示している。

　図１３、図１４に示すように、左右の伝達特性Ｈｌｓ、Ｈｒｓの波形の形状が大きく異なる場合、左右のバランスの良い音場を得ることができなってしまうおそれがある。例えば、センターに定位すべきボーカル音像が左右に偏ってしまう。このように、異なるインパルス応答測定で得られた伝達特性から適切に切り出すことができない場合がある。すなわち、適切にフィルタを生成することができない場合がある。そこで、本実施の形態では、フィルタ生成装置２００が以下の処理を行うことで適切な切り出しを行っている。

　フィルタ生成装置２００の処理装置２１０の構成について、図１５を用いて、説明する。図１５は、処理装置２１０の構成を示すブロック図である。処理装置２１０は、測定信号生成部２１１、収音信号取得部２１２、加算処理部２１３、直接音到達時刻探索部２１４、左右直接音判定部２１５、エラー訂正部２１６、及び波形切り出し部２１７を備えている。例えば、処理装置２１０は、パーソナルコンピュータ、スマートホン、タブレット端末などの情報処理装置であり、音声入力インターフェース（ＩＦ）と音声出力インターフェースを備えている。すなわち、処理装置２１０は、ステレオマイク２、及びステレオスピーカ５に接続される入出力端子を有する音響デバイスである。

　測定信号生成部２１１は、Ｄ／Ａ変換器やアンプなどを備えており、測定信号を生成する。測定信号生成部２１１は、生成した測定信号をステレオスピーカ５にそれぞれ出力する。左スピーカ５Ｌと右スピーカ５Ｒがそれぞれ伝達特性を測定するための測定信号を出力する。左スピーカ５Ｌによるインパルス応答測定と、右スピーカ５Ｒによるインパルス応答測定がそれぞれ行われる。

　ステレオマイク２の左マイク２Ｌ、右マイク２Ｒがそれぞれ測定信号を収音し、収音信号を処理装置２１０に出力する。収音信号取得部２１２は、左マイク２Ｌ、右マイク２Ｒからの収音信号を取得する。なお、収音信号取得部２１２は、Ａ／Ｄ変換器、及びアンプなどを有しており、左マイク２Ｌ、右マイク２Ｒからの収音信号をＡ／Ｄ変換、増幅などしてもよい。収音信号取得部２１２は、取得した収音信号を加算処理部２１３に出力する。

　左スピーカ５Ｌの駆動により、左スピーカ５Ｌと左マイク２Ｌとの間の伝達特性Ｈｌｓに応じた第１の収音信号と、左スピーカ５Ｌと右マイク２Ｒとの間の伝達特性Ｈｌｏに応じた第２の収音信号が同時に取得される。また、右スピーカ５Ｒの駆動により、右スピーカ５Ｒと左マイク２Ｌとの間の伝達特性Ｈｒｏに応じた第３の収音信号と、右スピーカ５Ｒと右マイク２Ｒとの間の伝達特性Ｈｒｓに応じた第４の収音信号が同時に取得される。

　加算処理部２１３は第１～第４の収音信号のそれぞれに対して加算処理する。加算処理は、複数回のインパルス応答測定により取得された収音信号を切り出して、加算する処理である。加算処理を行うことで、突発的な騒音の影響を軽減することができる。例えば、加算回数は３０回とすることができる。加算処理部２１３は収音信号を分割して、加算することで、伝達特性Ｈｌｓ、Ｈｌｏ、Ｈｒｏ、Ｈｒｓを取得する。

　具体的には、左スピーカ５Ｌからインパルス音の複数回連続して出力した時の測定信号を左右のマイク２Ｌ、２Ｒが収音する。加算処理部２１３は、マイク２Ｌで収音した収音信号を切り出して加算し、加算回数で除算する。これにより、伝達特性Ｈｌｓが求められる。さらに、加算処理部２１３は、マイク２Ｒで収音した収音信号を切り出して加算し、加算回数で除算する。これにより、伝達特性Ｈｌｏが求められる。

　同様に、右スピーカ５Ｒからインパルス音の複数回連続して出力した時の収音信号を左右のマイク２Ｌ、２Ｒが収音する。そして、加算処理部２１３は、マイク２Ｌで収音した収音信号を切り出して加算し、加算回数で除算する。これにより、伝達特性Ｈｒｏが求められる。さらに、加算処理部２１３は、マイク２Ｒで収音した収音信号を切り出して加算し、加算回数で除算する。これにより、伝達特性Ｈｒｓが求められる。

　ここで、スピーカ５Ｌ、５Ｒから出力される測定信号は、時間間隔を空けて連続する複数の信号音を含んでいる。信号音は、例えば、インパルス音である。具体的には、受聴者１からの測定開始入力を受け付けると、左スピーカ５Ｌが３０回のインパルス音を含む測定信号を出力する。マイク２Ｌ，２Ｒは、中断することなく、測定信号を収音する。すなわち、マイク２Ｌ、２Ｒは３０回のインパルス音を含む測定信号を連続して収音する。測定信号は、インパルス音に限らず、例えばＴＳＰ（Time Stretched Pulse)音等の他の信号でもよい。

　同様に受聴者１からの測定開始入力を受け付けると、右スピーカ５Ｒが３０回のインパルス音を含む測定信号を出力する。マイク２Ｌ、２Ｒは、中断することなく、測定信号を収音する。すなわち、マイク２Ｌ、２Ｒは３０回のインパルス音を含む測定信号を連続して収音する。

　マイク２Ｌ、２Ｒは、３０回のインパルス応答を含む収音信号を取得して、収音信号取得部２１２に出力する。収音信号取得部２１２は、収音信号に対してＡ／Ｄ変換等を施して、加算処理部２１３に出力する。よって、加算処理部２１３に入力される収音信号には、３０回分のインパルス音を含んでいる。すなわち、収音信号では、３０回のインパルス応答が時間間隔を空けて、連続して出現している。

　なお、測定信号に含まれるインパルス音の回数は３０回に限られるものでなく、２回以上であればよい。測定信号に含まれるインパルス音の回数に応じて、加算、及び除算を行えばよい。また、測定信号に含まれる信号音は、インパルス音に限られるものではない。測定信号におけるインパルス音の時間間隔は、測定環境に応じて設定しておけばよい。すなわち、次のインパルス音が出力される前に、残響等が一定レベル以下になるような時間間隔が予め設定されていればよい。

　本実施の形態では、測定信号生成部２１１が、複数のインパルス音を含む測定信号を生成している。そして、スピーカ５は、３０回のインパルス音を含む測定信号を、中断することなく出力する。すなわち、測定を開始すると、３０回のインパルス音が時間間隔を空けて連続して出力される。そして、収音信号取得部２１２は、３０回のインパルス応答を含む収音信号を加算処理部２１３に出力する。

　そして、加算処理部２１３は、収音信号を切り出して、３０個の切り出し信号を生成する。加算処理部２１３は、収音信号の一部のサンプルを切り出して、切り出し信号とする。各切り出し信号には、１回のインパルス応答が含まれている。加算処理部２１３は、切り出し信号のピーク位置を合わせて加算して、加算回数（３０回）で除算する。このようにすることで、同期加算に相当する加算処理が行われるため、収音信号のＳ／Ｎ比を高くすることができる。よって、突発的なノイズの影響を軽減することができる。

　以下、本実施の形態の特徴の一つである加算処理について説明する。まず、加算処理部２１３の構成について、図１６を用いて説明する。図１６は、加算処理部２１３の構成を示すブロック図である。加算処理部２１３は、ピーク検出部３１１と、符号決定部３１２と、ピーク群分割部３１３と、最大振幅検出部３１４と、信号切り出し部３１５と、信号加算部３１６とを備えている。

　ピーク検出部３１１は収音信号に含まれる正負のピークを検出する。すなわち、ピーク検出部３１１は正のピークと、負のピークとを検出する。具体的には、ピーク検出部３１１は、収音信号から、全てのピークの振幅値と時刻を抽出する。ここで、ピークの時刻は、サンプル数ｉによって示されている。すなわち、マイク２の収音開始時刻をｉ＝０として、サンプル数ｉ（ｉは０以上の整数）で時刻を示すことができる。

　符号決定部３１２は、収音信号に含まれるピークの振幅に基づいて、正または負の符号を決定する。具体的には、符号決定部３１２は、抽出された正のピークの最大振幅と、負のピークの最大振幅を求める。換言すると、符号決定部３１２は、収音信号の振幅の絶対値の最大値が、正のピークであるか、負のピークであるかを判別している。符号決定部３１２は、正のピークの最大振幅と負のピークの最大振幅の絶対値とを比較して、大きい方の符号を選択する。

　正のピークの最大振幅が負のピークの最大振幅の絶対値よりも大きい場合、符号決定部３１２は、着目する符号を正とする。反対に、正のピークの最大振幅が負のピークの最大振幅の絶対値よりも小さい場合、符号決定部３１２は、着目する符号を負とする。もちろん、符号決定部３１２は、最大振幅の比較以外の方法によって、符号を決定してもよい。例えば、所定の振幅値以上のピークの数や、複数のピークの平均値等を用いて、着目する符号を決定してもよい。

　そして、ピーク群分割部３１３は、決定された符号のピークから構成されるピーク配列を複数のピーク群に分割する。具体的には、ピーク群分割部３１３は、着目した符号のピークを抽出して、ピーク配列を求める。ピーク配列では、ピーク時間とピークの振幅の絶対値とが対応付けられている。さらに、ピーク群分割部３１３は、ピーク振幅の絶対値が、閾値未満のピークをピーク配列から除去して、ピーク配列Ｔｈｄａｔａを生成する。

　そして、ピーク群分割部３１３は、ピークの振幅の絶対値が閾値以上のピークから、ピーク群の先頭ピークを求める。ピーク群分割部３１３は、ピーク配列Ｔｈｄａｔａにおいて、最も早い時刻のピーク、すなわち、最も小さいインデックスｉのピークを先頭ピークとする。そして、先頭ピークから所定の時間に含まれるピークを１つのピーク群と設定する。これにより、１つ目のピーク群を求めることができる。

　同様に、ピーク群分割部３１３は、１番目のピーク群の後において、最も早い時刻のピーク、すなわち、最も小さいインデックスｉのピークを先頭ピークとする。そして、ピーク群分割部３１３は、先頭ピークから所定の時間に含まれるピークを１つのピーク群とする。これにより、１つ目のピーク群と２つ目のピーク群を求めることができる。ピーク群分割部３１３は、この処理を繰り返すことで３０個のピーク群を求める。

　最大振幅検出部３１４は、複数のピーク群毎の最大振幅を検出する。すなわち、最大振幅検出部３１４は、各ピーク群における最大振幅を検出する。なお、着目する符号が負の場合、最大振幅は、振幅の絶対値が最大となるピークに対応する。

　信号切り出し部３１５は、最大振幅に基づいた切り出しタイミングで、収音信号を切り出して、複数の切り出し信号を生成する。ここでは、３０個の切り出し信号が生成される。なお、複数の切り出し信号は、同じ数のサンプルから構成されている。例えば、切り出し信号は、最大振幅のサンプル数から１００サンプル前を先頭として、所定数のサンプルを含む信号となる。

　信号加算部３１６は、信号切り出し部３１５が切り出した切り出し信号を加算し、加算回数で割る。信号加算部３１６は、上記のように各切り出し信号の最大振幅が一致した状態で、切り出し信号を加算している。すなわち、切り出し信号のタイミングを揃えて、切り出し信号を加算している。これにより、３０回分のインパルス応答測定を正確に平均化することができる。例えば、加算時に、正のピークと負のピークが打ち消し合うことを防ぐことができる。よって、適切に伝達特性を測定することができる。

　なお、上記の加算処理は、伝達特性Ｈｌｏ、Ｈｌｓ、Ｈｒｏ、Ｈｒｓのそれぞれに対して実行されてもよい。あるいは、伝達特性Ｈｌｏの信号加算で求められた切り出したタイミングで、伝達特性Ｈｌｓの信号加算での切り出しタイミングを設定してもよい。同様に、伝達特性Ｈｒｓの信号加算で求められた切り出したタイミングで、伝達特性Ｈｒｏの信号加算での切り出しタイミングを設定してもよい。

　以下、加算処理部２１３における加算処理について、図１７～図２４を用いて詳細に説明する。図１７、図１８は、加算処理部２１３での加算処理を示すフローチャートである。図１９～図２４は、加算処理を説明するための信号波形図である。図１９～図２４において、横軸がサンプル数（ｉｎｄｅｘ）、縦軸が振幅（ａｍｐ）となっている。図１９～図２４では、１回目～３回目のインパルス音による応答信号波形、又はそのピーク配列が示されている。

　まず、左スピーカ５Ｌから測定信号が出力されたか否かをピーク検出部３１１が判定する（Ｓ４０１）。左スピーカ５Ｌから測定信号が出力されている場合（Ｓ４０１のＹＥＳ）、ピーク検出部３１１は収音信号ｄａｔａＬに基づいて、正ピーク配列ｐｄａｔａと負ピーク配列ｍｄａｔａを生成する（Ｓ４０２）。なお、正ピーク配列ｐｄａｔａは、正の振幅のピークのみからなる配列である。負ピーク配列ｍｄａｔａは負の振幅のピークのみからなる配列である。

　具体的には、ピーク検出部３１１が、全収音時間分の収音信号ｄａｔａＬにおいて、正振幅を有する正のピークと負振幅を有する負のピークとを全て求める。そして、ピーク検出部３１１は、収音信号ｄａｔａＬの全体に対して、正振幅では、振幅の値を残し、負振幅では、振幅の値を０に置き換える。このようにすることで、正ピーク配列ｐｄａｔａが求められる。図２４に示すような収音信号ｄａｔａＬが取得された場合、図１９に示すような正ピーク配列が得られる。

　また、ピーク検出部３１１は、収音信号ｄａｔａＬの全ピークに対して、正振幅では、振幅の値を０に置き換え、負振幅は振幅の値を絶対値に置き換える。このようにすることで、負ピーク配列ｍｄａｔａが求められる。

　左スピーカ５Ｌから測定信号が出力されていない場合（Ｓ４０１のＮＯ）、ステップＳ４０２の処理と同様に、ピーク検出部３１１が、収音信号ｄａｔａＲに基づいて、収音信号ｄａｔａＲの正ピーク配列ｐｄａｔａと、負ピーク配列ｍｄａｔａとを求める。（Ｓ４０３）。なお、収音信号ｄａｔａＲは、右スピーカ５Ｌから測定信号を出力した場合に取得された収音信号である。すなわち、収音信号ｄａｔａＲについてもステップＳ４０２の処理と同様の処理を行うことで、正ピーク配列ｐｄａｔａと、負ピーク配列ｍｄａｔａが求められる。

　そして、符号決定部３１２が、正ピーク配列ｐｄａｔａの最大値ｐｍａｘが、負ピーク配列ｍｄａｔａの最大値ｍｍａｘよりも大きいか否かを判定する（Ｓ４０４）。すなわち、符号決定部３１２は最大値ｐｍａｘと最大値ｍｍａｘとを比較する。符号決定部３１２は、最大値ｐｍａｘと最大値ｍｍａｘとの比較結果に応じて、着目する符号を決定する。

　例えば、正ピーク配列ｐｄａｔａの最大値ｐｍａｘが、負ピーク配列ｍｄａｔａの最大値ｍｍａｘよりも大きい場合（Ｓ４０４のＹＥＳ）、ピーク群分割部３１３が正ピーク配列ｐｄａｔａから、ピーク配列Ｔｈｄａｔａを生成する（Ｓ４０６）。すなわち、符号決定部３１２は、最大値ｐｍａｘが最大値ｍｍａｘよりも大きいため、正の符号を着目する符号として決定する。そして、正ピーク配列ｐｄａｔａに含まれる振幅を閾値と比較して、ピーク配列Ｔｈｄａｔａを生成する。具体的には、ピーク群分割部３１３は、正ピーク配列ｐｄａｔａに含まれるピークの振幅が閾値以上であれば、振幅の値を残し、振幅が閾値未満であれば振幅の値を０に置き換える。このようにして、ピーク配列Ｔｈｄａｔａが生成される。

　なお、閾値は、ｐｍａｘに応じて設定することが好ましく、ここでは、閾値をｐｍａｘ＊０．８としている。図２０は、正ピーク配列ｐｄａｔａに対する閾値をｐｍａｘ＊０．８とした場合を示している。そして、ピーク群分割部３１３が閾値（ｐｍａｘ＊０．８）よりも小さいピークでの振幅の値を０に置き換えると図２１のようになる。

　正ピーク配列ｐｄａｔａの最大値ｐｍａｘが、負ピーク配列ｍｄａｔａの最大値ｍｍａｘ以下の場合、（Ｓ４０４のＮＯ）、ピーク群分割部３１３は、ステップＳ４０５と同様に、負ピーク配列ｍｄａｔａから、ピーク配列Ｔｈｄａｔａを生成する（Ｓ４０６）。すなわち、符号決定部３１２は、最大値ｍｍａｘが最大値ｐｍａｘよりも大きいため、負の符号を着目する符号として決定する。そして、ピーク群分割部３１３が負ピーク配列ｍｄａｔａに含まれる振幅を閾値と比較し、ピーク配列Ｔｈｄａｔａを生成する。ピーク群分割部３１３は、負ピーク配列ｍｄａｔａに含まれるピークの振幅が閾値以上であれば、振幅の値を残し、振幅が閾値未満であれば振幅の値を０に置き換える。

　このようにして、ピーク配列Ｔｈｄａｔａが生成される。なお、閾値は、ｍｍａｘに応じて設定することが好ましく、ここでは、閾値をｍｍａｘ＊０．８としている。このように、符号決定部３１２において決定された符号のピーク配列に基づいて、ピーク群分割部３１３がピーク配列Ｔｈｄａｔａを生成する。

　ステップＳ４０５又はステップＳ４０６においてピーク配列Ｔｈｄａｔａを生成したら、ピーク群分割部３１３は、サンプル位置ｉ＝０，ピーク群の順序ｊ＝０とする（Ｓ４０７）。そして、ピーク群分割部３１３がピーク配列Ｔｈｄａｔａを複数のピーク群に分割して、最大振幅検出部３１４が各ピーク群の最大振幅を検出する（Ｓ４０８）。

　具体的には、ｉをインクリメントしていき、Ｔｈｄａｔａ［ｉ］＞０となったｉをｓｔａｒｔｉｄｘとし、ｅｎｄｉｄｘ＝ｓｔａｒｔｉｄｘ＋ＨＲＴＦ＿Ｌｅｎｇｔｈとし、ｓｔａｒｔｉｄｘ～ｅｎｄｉｄｘの区間において、最大振幅のインデックスｉｄｘを、ｍａｘｄａｔａ＿ｉｄｘ［ｊ］とする（図２２参照）。なお、図２２ではｊ＝０となっている。そして、ｓｔａｒｔｉｄｘからｆｒａｍｅｓｉｚｅ＊０．５までのＴｈｄａｔａを０と置き換える。これにより、ピーク配列Ｔｈｄａｔａが図２３のようになる。

　ｆｒａｍｅｓｉｚｅは、伝達特性のフレームサイズに対応している。具体的には、ｆｒａｍｅｓｉｚｅは、後述する切り出し信号に含まれるサンプル数となる。ｆｒａｍｅｓｉｚｅは、２つのインパルス音の時間間隔に相当するサンプル数よりも少なくなっていてもよい。ｆｒａｍｅｓｉｚｅ＊０．５は、ＨＲＴＦ＿Ｌｅｎｇｔｈ以上となっている。ＨＲＴＦ＿Ｌｅｎｇｔｈは、例えば２５６サンプルである。

　このように、ピーク群分割部３１３は、ｉ＝０からｉを徐々に増加させていくことで、１番目のピーク群（以下、第１のピーク群）の先頭ピークを求める。ピーク群分割部３１３は、先頭ピークから所定の期間ＨＲＴＦ＿Ｌｅｎｇｔｈに含まれる複数のピークを第１のピーク群とする。そして、最大振幅検出部３１４は、第１のピーク群の中で最も大きい振幅をｍａｘｄａｔａ＿ｉｄｘ［０］とする。すなわち、最大振幅検出部３１４は、１回目のインパルス音の応答に基づく、最大振幅ｍａｘｄａｔａを検出する。最大振幅検出部３１４が最大振幅を検出したら、ピーク群分割部３１３は、ｓｔａｒｔｉｄｘからｆｒａｍｅｓｉｚｅ＊０．５までのＴｈｄａｔａを０と置き換える。これにより、第１のピーク群に含まれていたピークがピーク配列Ｔｈｄａｔａから取り除かれる。なお、第１のピーク群は、ｊ＝０である。

　次に、ピーク群分割部３１３はｉがｉｄｘ＿ｌａｓｔよりも小さいか否かを判定する（Ｓ４０９）。ｉｄｘ＿ｌａｓｔは、ピーク配列Ｔｈｄａｔａの最後のインデックス、すなわち、収音信号の収音終了時刻におけるインデックスである。よって、ピーク群分割部３１３はピーク配列Ｔｈｄａｔａの全体を加算回数分のピーク群に分割したか否かを判定する。ｉがｉｄｘ＿ｌａｓｔよりも小さい場合（Ｓ４０９のＹＥＳ）。ｉ＝ｉ＋１、ｊ＝ｊ＋１として（Ｓ４１０）、ステップＳ４０８に戻る。

　ステップＳ４０８に戻ると、ピーク群分割部３１３は、ｉ＝ｓｔａｒｔｉｄｘ＋１からｉを徐々に増加させていくことで、２番目のピーク群（以下、第２のピーク群）の先頭ピークを求める。そして、ピーク群分割部３１３は、先頭ピークから期間ＨＲＴＦ＿Ｌｅｎｇｔｈに含まれる複数のピークを第２のピーク群とする。最大振幅検出部３１４は、第２のピーク群の中で最も大きい振幅をｍａｘｄａｔａ＿ｉｄｘ［１］とする（図２３参照）。最大振幅検出部３１４は、２回目のインパルス音の応答に基づく、最大の振幅を検出する。なお、図２３ではｊ＝１となっている。

　最大振幅検出部３１４が最大振幅を検出したら、ピーク群分割部３１３は、ｓｔａｒｔｉｄｘからｆｒａｍｅｓｉｚｅ＊０．５までのＴｈｄａｔａを０と置き換える。これにより、第２のピーク群に含まれていたピークがピーク配列Ｔｈｄａｔａから取り除かれる。ｆｒａｍｅｓｉｚｅ＊０．５は、ＨＲＴＦ＿Ｌｅｎｇｔｈ以上となっているため、第１のピーク群に含まれるピークは第２のピーク群に含まれない。

　そして、ｉがｉｄｘ＿ｌａｓｔに到達するまで、ピーク群分割部３１３、及び最大振幅検出部３１４が上記の処理を繰り返す。すなわち、ピーク群分割部３１３は、各ピーク群の先頭ピークを検出したら、先頭ピークから所定の期間ＨＲＴＦ＿Ｌｅｎｇｔｈに含まれる複数のピークを１つのピーク群とする。

　最大振幅検出部３１４がピーク群の最大振幅を求めたら、ピーク群分割部３１３は、先頭ピークからｆｒａｍｅｓｉｚｅ＊０．５にあるＴｈｄａｔａを０に置き換える。このようにすることで、ピーク群分割部３１３がピーク配列Ｔｈｄａｔａを加算回数分のピーク群に分割するとともに、最大振幅検出部３１４が各ピーク群の最大振幅を求める。ここで、加算回数は、測定信号に含まれるインパルス音の数であり、例えば３０である。ピーク群分割部３１３は、ピーク配列Ｔｈｄａｔａを３０個のピーク群に分割する。それぞれのピーク群は、先頭ピークから期間ＨＲＴＦ＿Ｌｅｎｇｔｈに含まれる複数のピークから構成されている。

　各インパルス応答の後半では、振幅減衰によって、ピーク配列Ｔｈｄａｔａが０になりやすい。すなわち、各インパルス応答の後半では、振幅が減衰するため、正ピーク配列ｐｄａｔａ、又は負ピーク配列ｍｄａｔａが閾値未満となりやすい。よって、閾値未満のピークを０としたピーク配列Ｔｈｄａｔａにおいて、一定程度０が連続する区間をピーク群の境界として設定する。すなわち、ピーク群分割部３１３は、ピークの振幅の絶対値が閾値以上のピークが一定期間以上存在しない箇所を、複数のピーク群の境界として設定する。このようにすることで、適切に各インパルス応答の境界を適切に設定することができる。

　そして、ｉがｉｄｘ＿ｌａｓｔ以上となったら、（Ｓ４０９のＮＯ）、信号切り出し部３１５がｍａｘｄａｔａ＿ｉｄｘ［ｊ］にオフセットを与えて収音信号を切り出し、信号加算部３１６が加算回数分の切り出し信号を加算する。（Ｓ４１１）。オフセットが、例えば－１００サンプルであるとすると、ｍａｘｄａｔａ＿ｉｄｘ［ｊ］－１００が切り出し開始時刻となる。そして、信号切り出し部３１５が、切り出し開始時刻からｆｒａｍｅｓｉｚｅ分の振幅を切り出すことで、１つの切り出し信号が生成される。信号切り出し部３１５は、ｍａｘｄａｔａ＿ｉｄｘ［ｊ］のそれぞれに対して、切り出し信号を生成する。

　信号加算部３１６は、加算回数分の切り出し信号を加算する。具体的には、サンプル位置ｉ＝０、ピーク群の順序ｊ＝０を初期値として、ｉがｆｒａｍｅｓｉｚｅ未満の範囲でｉをインクリメントし、各ｉ、ｊの値において、ｄａｔａＬ［ｉ］＝ｄａｔａＬ［ｉ］＋ｄａｔａＬ［ｍａｘ＿ｄａｔａ＿ｉｄｘ［ｊ］＋ＯＦＦＳＥＴ＋ｉ］の処理を行う。そして、ｊが加算回数未満の範囲でｊをインクリメントして同様の処理を行う。右の収音信号の場合も同様に、ｄａｔａＲ［ｉ］＝ｄａｔａＲ［ｉ］＋ｄａｔａＲ［ｍａｘ＿ｄａｔａ＿ｉｄｘ［ｊ］＋ＯＦＦＳＥＴ＋ｉ］の処理を行う。

　このように、最大振幅のインデックスｍａｘｄａｔａ＿ｉｄｘ［ｊ］にオフセットを与えたインデックスが切り出し開始時刻となっている。このようにすることで、ピーク群の先頭ピークが最大振幅でない場合でも、適切な切り出しタイミングを設定することができる。

　そして、信号切り出し部３１５は、切り出し開始時刻からｆｒａｍｅｓｉｚｅ分のサンプルを切り出して、切り出し信号とする。これにより、図２４に示すように、一定のｆｒａｍｅｓｉｚｅで切り出された切り出し信号が生成される。図２４では、１回目のインパルス音を収音した切り出し信号（第１の切り出し信号）と、２回目のインパルス音を収音した切り出し信号（第２の切り出し信号）が示されている。

　上記したように信号加算部３１６は、加算回数分の切り出し信号を加算する。そして、信号加算部３１６は、加算回数分の切り出し信号が加算された加算信号を加算回数で割る（Ｓ４１２）。具体的には、サンプル位置ｉ＝０を初期として、ｉがｆｒａｍｅｓｉｚｅ未満の範囲でｉをインクリメントし、各ｉの値において、ｄａｔａＬ［ｉ］＝ｄａｔａＬ［ｉ］／ｔｏｔａｌ＿ｔｉｍｅｓ、ｄａｔａＲ［ｉ］＝ｄａｔａＲ［ｉ］／ｔｏｔａｌ＿ｔｉｍｅｓの処理を行う。ここで、ｔｏｔａｌ＿ｔｉｍｅｓは加算回数である。

　そして、信号加算部３１６が、右スピーカ５Ｒでの収音信号に対して、加算処理が終了したか否かを判定する（Ｓ４１３）。右スピーカ５Ｒの収音信号に対して、加算処理が終了していない場合（Ｓ４１３のＮＯ）、ステップＳ４０１に戻る。これにより、右スピーカ５Ｒの収音信号についても同様に加算処理が行われる。右スピーカ５Ｒの収音信号に対して、加算処理が終了した場合（Ｓ４１３のＹＥＳ）、信号加算処理を終了する。

　このように、加算処理部２１３は、収音信号に対して、同期加算に相当する加算処理を行う。本実施の形態では、正又は負の符号を決定して、決定された符号のピークに着目している。すなわち、正の符号に着目した場合、正のピークの最大振幅が一致するように、切り出し開始位置を揃えている。また、負の符号に着目した場合、負のピークの最大振幅が一致するように切り出し開始位置を揃えている。このようにすることで、適切なタイミングで揃えられた切り出し信号を加算することができる。よって、Ｓ／Ｎ比を向上させることができる。

　本実施の形態にかかる測定装置、及び測定方法によれば、適切に伝達特性を測定することができる。また、マイク２とスピーカ５を同期させる必要がない。よって、安価なＰＣや入出力の付いている音響機器全般で伝達関数の測定ができる。このため、多くのユーザが本人特性を使った頭外定位ヘッドホンを利用できるようになる。

　符号決定部３１２は、収音信号における正のピークの振幅の最大値と、負のピークの振幅の絶対値の最大値とを比較することで、前記符号を決定している。このようにすることで、適切に着目する符号を決定することができる。よって、適切に伝達特性を測定することができる。

　ピーク群分割部３１３は、ピーク配列において、ピークの振幅の絶対値が閾値以上のピークから、前記ピーク群の先頭ピークを求め、先頭ピークから所定の期間に含まれるピークを１つのピーク群と設定している。こうすることで、ピーク群分割部３１３は、適切に収音信号を複数のピーク群に分割することができる。ピーク群分割部３１３は、ピーク配列において、ピークの振幅の絶対値が閾値以上のピークが一定期間以上存在しない箇所を、複数のピーク群の境界として設定している。こうすることで、ピーク群分割部３１３は、より適切に、収音信号を複数のピーク群に分割することができる。よって、適切に伝達特性を測定することができる。

　次に、直接音到達時刻探索部２１４が、加算処理が施された伝達特性Ｈｌｓ、Ｈｒｓの直接音到達時刻を探索する。直接音とは、左のスピーカ５Ｌから左のマイク２Ｌに直接到達する音、及び、右のスピーカ５Ｒから右のマイク２Ｒに直接到達する音である。すなわち、直接音とは、壁、床、天井、外耳等の周囲の構造物で反射せずに、スピーカ５Ｌ、５Ｒからマイク２Ｌ、２Ｒに到達した音である。通常、直接音はマイク２Ｌ、２Ｒに最も早く到達する音である。直接音到達時刻は測定開始から直接音が到達するまでに経過した時間に相当する。なお、測定開始位置は、上記した切り出し開始位置に相当するインデックスであり、ここではｉ＝０としている。

　より具体的には、直接音到達時刻探索部２１４は、伝達特性Ｈｌｓ、Ｈｒｓの振幅が最大となる時刻に基づいて、直接音到達時刻を探索する。なお、直接音到達時刻探索部２１４における処理については後述する。直接音到達時刻探索部２１４は、探索した直接音到達時刻を左右直接音判定部２１５に出力する。

　直接音到達時刻探索部２１４が探索した直接音到達時刻を用いて、左右直接音判定部２１５は、左右の直接音の振幅の符号が一致するか否かの判定を行う。例えば、左右直接音判定部２１５は、直接音到達時刻における伝達特性Ｈｌｓ、Ｈｒｓの振幅の符号が一致するか否かを判定する。さらに、左右直接音判定部２１５は、直接音到達時刻が一致するか否かを判定する。左右直接音判定部２１５は、判定結果をエラー訂正部２１６に出力する。

　直接音到達時刻における伝達特性Ｈｌｓ、Ｈｒｓの振幅の符号が一致しない場合、エラー訂正部２１６は、切り出しタイミングを訂正する。そして、波形切り出し部２１７は、訂正された切り出しタイミングで伝達特性Ｈｌｓ、Ｈｌｏ、Ｈｒｏ、Ｈｒｓの波形を切り出す。所定のフィルタ長で切り出された伝達特性Ｈｌｓ、Ｈｌｏ、Ｈｒｏ、Ｈｒｓがフィルタとなる。すなわち、波形切り出し部２１７は、先頭位置をずらして伝達特性Ｈｌｓ、Ｈｌｏ、Ｈｒｏ、Ｈｒｓの波形を切り出す。直接音到達時刻における伝達特性Ｈｌｓ、Ｈｒｓの振幅の符号が一致する場合、波形切り出し部２１は、切り出しタイミングを訂正せずに、そのままのタイミングで切り出す。

　具体的には、伝達特性Ｈｌｓ、Ｈｒｓの振幅の符号が異なる場合、エラー訂正部２１６は、伝達特性Ｈｌｓ、Ｈｒｓの直接音到達時刻を揃えるように、切り出しタイミングを訂正する。伝達特性Ｈｌｓ、Ｈｒｓの直接音が同じサンプル数に位置するように、伝達特性Ｈｌｓ、Ｈｌｏ、又は伝達特性Ｈｒｏ、Ｈｒｓのデータを移動する。すなわち、伝達特性Ｈｌｓ、Ｈｌｏと、伝達特性Ｈｒｏ、Ｈｒｓとで、切り出しの先頭サンプル数を異ならせている。

　そして、波形切り出し部２１７は、切り出した伝達特性Ｈｌｓ、Ｈｌｏ、Ｈｒｏ、Ｈｒｓからフィルタを生成する。すなわち、波形切り出し部２１７は、伝達特性Ｈｌｓ、Ｈｌｏ、Ｈｒｏ、Ｈｒｓの振幅をフィルタ係数とすることで、フィルタを生成する。波形切り出し部２１７で生成された伝達特性Ｈｌｓ、Ｈｌｏ、Ｈｒｏ、Ｈｒｓがフィルタとして、図１に示す畳み込み演算部１１、１２、２１、２２に設定される。これにより、左右のバランスの良い音質で頭外定位されたオーディオをユーザＵが受聴することができる。

　次に、処理装置２１０によるフィルタ生成方法について、図２５を用いて詳細に説明する。図２５は、処理装置２１０におけるフィルタ生成方法を示すフローチャートである。

　まず、加算処理部２１３が収音信号を加算処理する（Ｓ１０１）。すなわち、加算処理部２１３は、伝達特性Ｈｌｓ、Ｈｌｏ、Ｈｒｏ、Ｈｒｓ毎に収音信号を加算処理する。これにより、突発的なノイズの影響を低減することができる。ここでは、図１６～図２４で示した処理により、加算処理が行われる。

　次に、直接音到達時刻探索部２１４が伝達特性Ｈｌｓにおける直接音到達時刻Ｈｌｓ＿Ｆｉｒｓｔ＿ｉｄｘと、伝達特性Ｈｒｓにおける直接音到達時刻Ｈｒｓ＿Ｆｉｒｓｔ＿ｉｄｘとを取得する（Ｓ１０２）。

　ここで、直接音到達時刻探索部２１４における直接音到達時刻の探索処理について、図２６を用いて詳細に説明する。図２６は、直接音到達時刻の探索処理を示すフローチャートである。なお、図２６は、伝達特性Ｈｌｓ、伝達特性Ｈｒｓのそれぞれに対して行われる処理を示している。すなわち、直接音到達時刻探索部２１４が、図２６に示す処理を伝達特性Ｈｌｓ、Ｈｒｓのそれぞれに対して実行することで、直接音到達時刻Ｈｌｓ＿ｆｉｒｓｔ＿ｉｄｘと、直接音到達時刻Ｈｌｓ＿ｆｉｒｓｔ＿ｉｄｘとをそれぞれ取得することができる。

　まず、直接音到達時刻探索部２１４が、伝達特性の振幅の絶対値が最大となる時刻ｍａｘ＿ｉｄｘを取得する（Ｓ２０１）。すなわち、直接音到達時刻探索部２１４は、図９～図１２に示したように最大振幅Ａを取る時刻を時刻ｍａｘ＿ｉｄｘと設定する。時刻ｍａｘ＿ｉｄｘは、測定開始からの時間に対応するものである。また、時刻ｍａｘ＿ｉｄｘ、及び後述する各種の時刻は測定開始からの絶対時間として表してもよいし、測定開始からのサンプル数として表してもよい。

　次に、直接音到達時刻探索部２１４が時刻ｍａｘ＿ｉｄｘにおけるｄａｔａ［ｍａｘ＿ｉｄｘ］が０より大きいか否かを判定する（Ｓ２０２）。ｄａｔａ［ｍａｘ＿ｉｄｘ］は、ｍａｘ＿ｉｄｘにおける伝達特性の振幅の値である。すなわち、直接音到達時刻探索部２１４は、最大振幅が正のピークか負のピークであるかを判定する。ｄａｔａ［ｍａｘ＿ｉｄｘ］が負の場合（Ｓ２０２のＮＯ）、直接音到達時刻探索部２１４は、ｚｅｒｏ＿ｉｄｘ＝ｍａｘ＿ｉｄｘと設定する（Ｓ２０３）。図１２に示す振幅Ｈｒｓでは、最大振幅Ａが負であるため、ｍａｘ＿ｉｄｘ＝ｚｅｒｏ＿ｉｄｘとなる。

　ここで、ｚｅｒｏ＿ｉｄｘは直接音到達時刻の探索範囲の基準となる時刻である。具体的には、時刻ｚｅｒｏ＿ｉｄｘは、探索範囲の終端に対応する。直接音到達時刻探索部２１４は、０～ｚｅｒｏ＿ｉｄｘの範囲内で、直接音到達時刻を探索する。

　ｄａｔａ［ｍａｘ＿ｉｄｘ］が正の場合（Ｓ２０２のＹＥＳ）、直接音到達時刻探索部２１４は、ｚｅｒｏ＿ｉｄｘ＜ｍａｘ＿ｉｄｘ、かつ、振幅が最後に負となる時刻ｚｅｒｏ＿ｉｄｘを取得する（Ｓ２０４）。すなわち、直接音到達時刻探索部２１４は、時刻ｍａｘ＿ｉｄｘの直前で振幅が負となる時刻をｚｅｒｏ＿ｉｄｘとして設定する。例えば、図９～図１１に示す伝達特性では、最大振幅Ａが正であるため、時刻ｍａｘ＿ｉｄｘよりも前にｚｅｒｏ＿ｉｄｘが存在する。時刻ｍａｘ＿ｉｄｘの直前で、振幅が負となる時刻を探索範囲の終端としているが、探索範囲の終端はこれに限られるものではない。

　ステップＳ２０３、又はＳ２０４において、ｚｅｒｏ＿ｉｄｘが設定されると、直接音到達時刻探索部２１４は、０～ｚｅｒｏ＿ｉｄｘまでの極大点を取得する（Ｓ２０５）。すなわち、直接音到達時刻探索部２１４は、探索範囲０～ｚｅｒｏ＿ｉｄｘにおいて、振幅の正のピークを抽出する。

　直接音到達時刻探索部２１４は、極大点の個数が０より大きいか否かを判定する（Ｓ２０６）。すなわち、直接音到達時刻探索部２１４は、探索範囲０～ｚｅｒｏ＿ｉｄｘにおいて、極大点（正のピーク）が存在するか否かを判定する。

　極大点の個数が０以下の場合（Ｓ２０６のＮＯ）、すなわち、探索範囲０～ｚｅｒｏ＿ｉｄｘに極大点が無い場合、直接音到達時刻探索部２１４は、ｆｉｒｓｔ＿ｉｄｘ＝ｍａｘ＿ｉｄｘとする。ｆｉｒｓｔ＿ｉｄｘは、直接音到達時刻である。例えば、図１１、図１２に示す伝達特性Ｈｌｓ、Ｈｒｓでは、０～ｚｅｒｏ＿ｉｄｘの範囲に、極大点が存在しない。よって、直接音到達時刻探索部２１４は、直接音到達時刻ｆｉｒｓｔ＿ｉｄｘ＝ｍａｘ＿ｉｄｘとする。

　極大点の個数が０より大きい場合（Ｓ２０６のＹＥＳ）、すなわち、探索範囲０～ｚｅｒｏ＿ｉｄｘに極大点がある場合、直接音到達時刻探索部２１４は、極大点の振幅が（｜ｄａｔａ［ｍａｘ＿ｉｄｘ］｜／１５）よりも大きくなる最初の時刻を直接音到達時刻ｆｉｒｓｔ＿ｉｄｘとする（Ｓ２０８）。すなわち、探索範囲０～ｚｅｒｏ＿ｉｄｘにおいて、最も早い時刻にある正のピークであって、閾値（ここでは、最大振幅の絶対値の１５分の１）よりも高いピークを直接音とする。例えば、図９、図１０に示す伝達特性では、０～ｚｅｒｏ＿ｉｄｘの範囲に、極大点Ｃ、Ｄが存在する。そして、最初の極大点Ｃの振幅が、閾値よりも大きい。したがって、直接音到達時刻探索部２１４は、極大点Ｃの時刻を直接音到達時刻ｆｉｒｓｔ＿ｉｄｘに設定する。

　ここで、極大点の振幅が小さいと、ノイズ等によるものであるおそれがある。すなわち、極大点が、ノイズによるものか、スピーカからの直接音によるものであるかを判別する必要がある。したがって、本実施の形態では、（ｄａｔａ［ｍａｘ＿ｉｄｘ］の絶対値）／１５を閾値として、閾値よりも大きい極大点を直接音としている。このように、直接音到達時刻探索部２１４は、最大振幅に応じて閾値を設定している。

　そして、直接音到達時刻探索部２１４が、極大点の振幅と、閾値とを比較することで、極大点がノイズによるものか、直接音によるものかを判別している。すなわち、極大点の振幅が最大振幅の絶対値に対する所定の割合未満である場合、直接音到達時刻探索部２１４は、極大点をノイズと判別する。極大点の振幅が最大振幅の絶対値に対する所定の割合以上である場合、直接音到達時刻探索部２１４は、極大点を直接音と判別する。このようにすることで、ノイズの影響を除去できるため、直接音到達時刻を正確に探索することができる。

　もちろん、ノイズを判別するための閾値は、上記の値に限られるものではなく、測定環境や測定信号に応じて適切な割合を設定することができる。また、最大振幅に関わらず、閾値を設定することも可能である。

　このように、直接音到達時刻探索部２１４は、直接音到達時刻ｆｉｒｓｔ＿ｉｄｘを求めている。具体的には、直接音到達時刻探索部２１４は、振幅の絶対値が最大となる時刻ｍａｘ＿ｉｄｘよりも前において、振幅が極大点を取る時刻を直接音到達時刻ｆｉｒｓｔ＿ｉｄｘとする。すなわち、直接音到達時刻探索部２１４は、最大振幅よりも前において、最初にある正のピークを直接音と判定する。最大振幅よりも前に極大点が無い場合、最大振幅を直接音と判定する。直接音到達時刻探索部２１４は探索した直接音到達時刻ｆｉｒｓｔ＿ｉｄｘを左右直接音判定部２１５に出力する。

　図２５の説明に戻る。上記のように、左右直接音判定部２１５が伝達特性Ｈｌｓ、Ｈｒｓの直接音到達時刻Ｈｌｓ＿ｆｉｒｓｔ＿ｉｄｘ、Ｈｒｓ＿ｆｉｒｓｔ＿ｉｄｘをそれぞれ取得する。そして、左右直接音判定部２１５は、伝達特性Ｈｌｓ、Ｈｒｓの直接音の振幅の積を求める（Ｓ１０３）。すなわち、左右直接音判定部２１５は、直接音到達時刻Ｈｌｓ＿ｆｉｒｓｔ＿ｉｄｘにおける伝達特性Ｈｌｓの振幅と、直接音到達時刻Ｈｒｓ＿ｆｉｒｓｔ＿ｉｄｘにおける伝達特性Ｈｒｏの振幅とを乗算し、ＨｌｓとＨｒｓの最大振幅の正負の符号がそろっているか否かを判定する。

　次に、左右直接音判定部２１５は、（伝達特性Ｈｌｓ、Ｈｒｓの直接音の振幅の積）＞０であり、かつ、Ｈｌｓ＿ｆｉｒｓｔ＿ｉｄｘ＝Ｈｒｓ＿ｆｉｒｓｔ＿ｉｄｘとなるか否かを判定する（Ｓ１０４）。すなわち、左右直接音判定部２１５は、伝達特性Ｈｌｓ、Ｈｒｓの直接音到達時刻における振幅の符号が一致するか否かを判定する。さらに、左右直接音判定部２１５は、直接音到達時刻Ｈｌｓ＿ｆｉｒｓｔ＿ｉｄｘが直接音到達時刻Ｈｒｓ＿ｆｉｒｓｔ＿ｉｄｘと一致するか否かを判定する。

　直接音到達時刻における振幅が同じ符号であり、かつＨｌｓ＿ｆｉｒｓｔ＿ｉｄｘが直接音到達時刻Ｈｒｓ＿ｆｉｒｓｔ＿ｉｄｘと一致する場合（Ｓ１０４のＹＥＳ）、エラー訂正部２１６は、直接音が同じ時刻となるように一方のデータを移動する（Ｓ１０６）。なお、伝達特性の移動が不要の場合は、データの移動量は０となる。例えば、ステップＳ１０４でＹＥＳと判定された場合、データの移動量が０となる。この場合、ステップＳ１０６を省略して、ステップＳ１０７に移行してもよい。そして、波形切り出し部２１７が、同じ時刻から伝達特性Ｈｌｓ、Ｈｌｏ、Ｈｒｏ、Ｈｒｓをフィルタ長で切り出す（Ｓ１０７）。

　伝達特性Ｈｌｓ、Ｈｒｓの直接音の振幅の積が負である場合、又は、Ｈｌｓ＿ｆｉｒｓｔ＿ｉｄｘ＝Ｈｒｓ＿ｆｉｒｓｔ＿ｉｄｘとならない場合（Ｓ１０４のＮＯ）、エラー訂正部２１６が伝達特性Ｈｌｓ、Ｈｒｓの相互相関係数ｃｏｒｒを算出する（Ｓ１０５）。すなわち、左右の直接音到達時刻が揃っていないため、エラー訂正部２１６が切り出しタイミングを訂正する。そのため、エラー訂正部２１６が伝達特性Ｈｌｓ、Ｈｒｓの相互相関係数ｃｏｒｒを算出する。

　そして、エラー訂正部２１６は、相互相関係数ｃｏｒｒに基づいて、直接音が同じ時刻となるよう、一方のデータを移動する（Ｓ１０６）。具体的には、直接音到達時刻Ｈｌｓ＿ｆｉｒｓｔ＿ｉｄｘが直接音到達時刻Ｈｒｓ＿ｆｉｒｓｔ＿ｉｄｘと一致するように、伝達特性Ｈｒｓ、Ｈｒｏのデータを移動する。ここで、伝達特性Ｈｒｓ、Ｈｒｏのデータの移動量は、相関が最も高くなるオフセット量に応じて決定される。このように、エラー訂正部２１６は、伝達特性Ｈｌｓ、Ｈｒｓの相関に基づいて、切り出しタイミングを訂正する。波形切り出し部２１７は、伝達特性Ｈｌｓ、Ｈｌｏ、Ｈｒｏ、Ｈｒｓをフィルタ長で切り出す（Ｓ１０７）

　ここで、ステップＳ１０４～ステップＳ１０７の処理の一例について、図２７を用いて説明する。図２７は、ステップＳ１０４～ステップＳ１０７の処理の一例を示すフローチャートである。

　まず、左右直接音判定部２１５が、ステップＳ１０４と同様に、左右音の判定を行う。すなわち、左右直接音判定部２１５が、伝達特性Ｈｌｓ、Ｈｒｓの直接音の振幅の積＞０であり、かつ、Ｈｌｓ＿ｆｉｒｓｔ＿ｉｄｘ＝Ｈｒｓ＿ｆｉｒｓｔ＿ｉｄｘとなるか否かを判定する（Ｓ３０１）。

　伝達特性Ｈｌｓ、Ｈｒｓの直接音の振幅の積＞０であり、かつ、Ｈｌｓ＿ｆｉｒｓｔ＿ｉｄｘ＝Ｈｒｓ＿ｆｉｒｓｔ＿ｉｄｘとなっている場合（Ｓ３０１のＹＥＳ）、Ｈｌｓ＿ｆｉｒｓｔ＿ｉｄｘ＝Ｈｒｓ＿ｆｉｒｓｔ＿ｉｄｘが同じ時刻となるよう、エラー訂正部２１６が伝達特性Ｈｒｓ、Ｈｒｏのデータを移動する（Ｓ３０５）。なお、伝達特性の移動が不要の場合は、データの移動量は０となる。例えば、ステップＳ３０１でＹＥＳと判定された場合、データの移動量が０となる。この場合、ステップＳ３０５を省略して、ステップＳ３０６に移行してもよい。そして、波形切り出し部２１７が、同じ時刻からフィルタ長で伝達特性Ｈｌｓ、Ｈｌｏ、Ｈｒｏ、Ｈｒｓをフィルタ長で切り出す（Ｓ３０６）。すなわち、エラー訂正部２１６が、直接音到達時刻を揃えるように、伝達特性Ｈｒｏ、Ｈｒｓの切り出しタイミングを訂正する。そして、エラー訂正部２１６で訂正された切り出しタイミングで波形切り出し部２１７が伝達特性Ｈｌｓ、Ｈｌｏ、Ｈｒｏ、Ｈｒｓを切り出す。

　伝達特性Ｈｌｓ、Ｈｒｓの直接音の振幅の積＜０の場合、又は、Ｈｌｓ＿ｆｉｒｓｔ＿ｉｄｘ＝Ｈｒｓ＿ｆｉｒｓｔ＿ｉｄｘとならない場合（Ｓ３０１のＮＯ）、エラー訂正部２１６は、伝達特性Ｈｌｓのｓｔａｒｔ＝（ｆｉｒｓｔ＿ｉｄｘ－２０）をオフセットとし、＋３０サンプルのデータを取得し、平均値、分散を算出する（Ｓ３０２）。すなわち、エラー訂正部２１６は、直接音到達時刻ｆｉｒｓｔ＿ｉｄｘの２０サンプル前を開始点ｓｔａｒｔとして連続する３０サンプル分のデータを抽出する。そして、エラー訂正部２１６は、抽出した３０サンプルの平均値、及び分散を算出する。平均値及び分散は、相互相関係数を標準化するために用いられるため、標準化が不要の場合は算出しなくてもよい。なお、抽出するサンプル数は３０サンプルに限られるものではなく、エラー訂正部２１６は、任意のサンプル数を抽出することができる。

　そして、エラー訂正部２１６は、伝達特性Ｈｒｓの（ｓｔａｒｔ－１０）から（ｓｔａｒｔ＋１０）までオフセットを１ずつずらし、伝達特性Ｈｌｓとの相互相関係数ｃｏｒｒ［０］～ｃｏｒｒ［１９］を取得する（Ｓ３０３）。なお、エラー訂正部２１６は、伝達特性Ｈｒｓの平均値、及び分散を求め、伝達特性Ｈｌｓ、Ｈｒｓの平均値及び分散を用いて、相互相関係数ｃｏｒｒの標準化を行うことが好ましい。

　図２８を用いて、相互相関係数の求め方について説明する。図２８（ｂ）には、伝達特性Ｈｌｓ、並びに、伝達特性Ｈｌｓから抽出された３０サンプルが太枠Ｇで示されている。また、図２８（ａ）には、伝達特性Ｈｒｓ、並びに、（ｓｔａｒｔ－１０）をオフセットとした場合の３０サンプルが太枠Ｆで示されている。ｆｉｒｓｔ＿ｉｄｘ－２０＝ｓｔａｒｔであるため、図２８（ａ）では、ｆｉｒｓｔ＿ｉｄｘ－３０を先頭とする３０サンプルが太枠Ｆに含まれている。

　また、図２８（ｃ）には、伝達特性Ｈｒｓ、並びに、（ｓｔａｒｔ＋１０）をオフセットとした場合の３０サンプルが太枠Ｈで示されている。ｆｉｒｓｔ＿ｉｄｘ－２０＝ｓｔａｒｔであるため、図２８（ａ）では、ｆｉｒｓｔ＿ｉｄｘ－１０を先頭とする３０サンプルが太枠Ｆに含まれている。太枠Ｆに含まれる３０サンプルと太枠Ｇに含まれる３０サンプルとの相互相関を算出することで、相互相関係数ｃｏｒｒ［０］が求められる。同様に、太枠Ｇと太枠Ｈとの相互相関を算出することで、相互相関係数ｃｏｒｒ［１９］が求められる。相互相関係数ｃｏｒｒが高いほど、伝達特性Ｈｌｓ、Ｈｒｓの相関が高くなる。

　エラー訂正部２１６は、相互相関係数が最大値を取るｃｏｒｒ［ｃｍａｘ＿ｉｄｘ］を取得する（Ｓ３０４）。ここで、ｃｍａｘ＿ｉｄｘは、相互相関係数が最大値を取るオフセット量を相当する。すなわち、ｃｍａｘ＿ｉｄｘは、伝達特性Ｈｌｓと伝達特性Ｈｒｓの相関が最も大きい時のオフセット量を示す。

　そして、エラー訂正部２１６は、ｃｍａｘ＿ｉｄｘに応じて、Ｈｌｓ＿ｆｉｒｓｔ＿ｉｄｘとＨｒｓ＿ｆｉｒｓｔ＿ｉｄｘが同じ時刻となるよう伝達特性Ｈｒｓ、Ｈｒｏのデータを移動する（Ｓ３０５）。エラー訂正部２１６は、オフセット量だけ、伝達特性Ｈｒｓ、Ｈｒｏのデータを移動する。これにより、伝達特性Ｈｌｓ、Ｈｒｓの直接音到達時刻が揃う。なお、ステップＳ３０５は、図２５のステップＳ１０６に相当する。また、エラー訂正部２１６は、伝達特性Ｈｒｓ、Ｈｒｏを移動するのではなく、伝達特性Ｈｌｓ、Ｈｌｏを移動してもよい。

　そして、波形切り出し部２１７は、同じ時刻からフィルタ長で伝達特性Ｈｌｓ、Ｈｌｏ、Ｈｒｏ、Ｈｒｓを切り出す。このようにすることで、直接音到達時刻が揃ったフィルタを生成することができる。よって、左右のバランスの良好な音場を生成することができる。これにより、ボーカル音像をセンターに定位させることができる。

　次に、図２９Ａ～図２９Ｃを用いて直接音到達時刻を揃える意義について説明する。図２９Ａは、直接音到達時刻を揃える前の伝達特性Ｈｌｓ、Ｈｌｏを示す図である。図２９Ｂは、伝達特性Ｈｒｓ、Ｈｒｏを示す図である。図２９Ｃは、直接音到達時刻を揃えた後の伝達特性Ｈｌｓ、Ｈｌｏを示す図である。図２９Ａ～図２９Ｃにおいて、横軸がサンプル数であり、縦軸が振幅となっている。サンプル数は測定開始からの時間に対応し、測定開始時刻をサンプル数０としている。

　例えば、左スピーカ５Ｌからのインパルス応答測定と右スピーカ５Ｒからのインパルス応答測定で、音響デバイスでの遅延量が異なる場合がある。この場合、図２９Ｂに示す伝達特性Ｈｒｓ、Ｈｒｏに比べて、図２９Ａに示す伝達特性Ｈｌｓ、Ｈｌｏの直接音到達時刻が遅れてしまう。このような場合、直接音到達時刻のタイミングを揃えずに、伝達特性Ｈｌｓ、Ｈｌｏ、Ｈｒｏ、Ｈｒｓを切り出すと、左右のバランスが悪い音場が生成されてしまう。そこで、図２９Ｃのように、処理装置２１０が、相関に基づいて、伝達特性Ｈｌｓ、Ｈｌｏを移動している。これにより、伝達特性Ｈｌｓ、Ｈｒｓの直接音到達時刻を揃えることができる。

　そして、処理装置２１０は、直接音到達時刻を揃えて伝達特性を切り出すことで、フィルタを生成している。すなわち、波形切り出し部２１７が、直接音到達時刻が一致するように揃えられた伝達特性を切り出することで、フィルタを生成している。よって、左右のバランスが良好な音場を再生することができる。

　本実施の形態では、左右直接音判定部２１５が直接音の符号が一致しているか否かを判定する。左右直接音判定部２１５の判定結果に応じて、エラー訂正部２１６がエラー訂正を行っている。具体的には、直接音の符号が一致していない場合、又は、直接音到達時刻が一致していない場合に、エラー訂正部２１６が相互相関係数に基づいて、エラー訂正を行っている。直接音の符号が一致しており、かつ、直接音到達時刻が一致している場合は、エラー訂正部２１６が相互相関係数に基づくエラー訂正を実行しない。エラー訂正部２１６がエラー訂正を行う頻度は少ないため、不要な計算処理を省略することができる。すなわち、直接音の符号が一致しており、かつ、直接音到達時刻が一致している場合は、エラー訂正部２１６が相互相関係数を算出する必要がなくなる。よって、計算処理時間を短縮することができる。

　通常、エラー訂正部２１６によるエラー訂正を行わなくてよい。しかしながら、左右のスピーカ５Ｌ、５Ｒの特性が異なっていたり、周囲の反射の状況が左右で大きく異なっていたりする場合がある。あるいは、左耳９Ｌ、右耳９Ｒでマイク２Ｌ、２Ｒの位置がずれていることもある。また、音響デバイスの遅延量が異なることもある。このような場合、測定信号を適切に収音することができず、左右でタイミングがずれることがある。本実施の形態では、エラー訂正部２１６がエラー訂正を行うことで、適切にフィルタを生成することができる。よって、左右のバランスのよい音場を再生することができうる。

　また、直接音到達時刻探索部２１４が直接音到達時刻を探索している。具体的には、直接音到達時刻探索部２１４は、最大振幅となる時刻よりも前において、振幅が極大点を取る時刻を直接音到達時刻としている。さらに、直接音到達時刻探索部２１４は、最大振幅となる時刻よりも前において、極大点が無い場合に、最大振幅となる時刻を直接音到達時刻としている。このようにすることで、適切に直接音到達時刻を探索することができる。そして、直接音到達時刻に基づいて伝達特性を切り出すことで、より適切にフィルタを生成することができる。

　左右直接音判定部２１５が、直接音到達時刻における伝達特性Ｈｌｓ、Ｈｒｓの振幅の符号が一致しているか否かを判定している。そして、符号が異なっている場合、エラー訂正部２１６が切り出しタイミングを訂正している。このようにすることで、適切に切り出しタイミングを調整することができる。さらに、左右直接音判定部２１５が、伝達特性Ｈｌｓ、Ｈｒｓの直接音到達時刻が一致しているか否かを判定している。そして、伝達特性Ｈｌｓ、Ｈｒｓの直接音到達時刻が一致していない場合に、エラー訂正部２１６が切り出しタイミングを訂正している。このようにすることで、適切に切り出しタイミングを調整することができる。

　直接音到達時刻における伝達特性Ｈｌｓ、Ｈｒｓの振幅の符号が一致し、かつ、伝達特性Ｈｌｓ、Ｈｒｓの直接音到達時刻が一致している場合は、伝達特性の移動量は０となる。この場合、エラー訂正部２１６は切り出しタイミングを訂正する処理を省略してもよい。具体的には、ステップＳ１０４がＹＥＳの場合、ステップＳ１０６を省略することができる。あるいは、ステップＳ３０１がＹＥＳの場合、ステップＳ３０５を省略することができる。このようにすることで、不要な処理を省き、計算時間を短縮することができる。

　エラー訂正部２１６は、伝達特性Ｈｌｓ、Ｈｒｓの相関に基づいて、切り出しタイミングを訂正することが好ましい。このようにすることで、直接音到達時刻を適切に揃えることが可能となる。よって、左右のバランスの良好な音場を再生することができる。

　なお、上記の実施形態では、音像定位処理装置として、ヘッドホンを用いて頭外に音像を定位する頭外定位処理装置について説明したが、本実施の形態は頭外定位処理装置に限られるものではない。例えば、スピーカ５Ｌ、５Ｒからステレオ信号を再生することで、音像を定位させる音像定位処理装置に用いてもよい。すなわち、本実施の形態は、伝達特性を再生信号に畳み込む音像定位処理装置にて適用することが可能になる。例えば、バーチャルスピーカ、ニアスピーカサラウンド等における音像定位用フィルタを生成することも可能である。

　また、同期加算に相当する処理を行う加算処理部２１３は、スピーカやマイクの伝達特性を測定する測定装置として機能することができる。スピーカやマイクの設置位置は、特に限定されるものではなく、例えば、イヤホンなどに搭載されたスピーカやマイクを用いて、測定を行うことができる。

　上記信号処理のうちの一部又は全部は、コンピュータプログラムによって実行されてもよい。上述したプログラムは、様々なタイプの非一時的なコンピュータ可読媒体（ｎｏｎ－ｔｒａｎｓｉｔｏｒｙ　ｃｏｍｐｕｔｅｒ　ｒｅａｄａｂｌｅ　ｍｅｄｉｕｍ）を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体（ｔａｎｇｉｂｌｅ　ｓｔｏｒａｇｅ　ｍｅｄｉｕｍ）を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体（例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ）、光磁気記録媒体（例えば光磁気ディスク）、ＣＤ－ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）、ＣＤ－Ｒ、ＣＤ－Ｒ／Ｗ、半導体メモリ（例えば、マスクＲＯＭ、ＰＲＯＭ（Ｐｒｏｇｒａｍｍａｂｌｅ　ＲＯＭ)、ＥＰＲＯＭ（Ｅｒａｓａｂｌｅ　ＰＲＯＭ)、フラッシュＲＯＭ、ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ））を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体（ｔｒａｎｓｉｔｏｒｙ　ｃｏｍｐｕｔｅｒ　ｒｅａｄａｂｌｅ　ｍｅｄｉｕｍ)によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。

　以上、本発明者によってなされた発明を実施の形態に基づき具体的に説明したが、本発明は上記実施の形態に限られたものではなく、その要旨を逸脱しない範囲で種々変更可能であることは言うまでもない。

　この出願は、２０１６年３月１０日に出願された日本出願特願２０１６－０４７２６５を基礎とする優先権を主張し、その開示の全てをここに取り込む。

　本願は、伝達特性を用いて音像を定位する音像定位処理装置に適用可能である。

　Ｕ　ユーザ
　１　受聴者
　２Ｌ　左マイク
　２Ｒ　右マイク
　５Ｌ　左スピーカ
　５Ｒ　右スピーカ
　９Ｌ　左耳
　９Ｒ　右耳
　１０　頭外定位処理部
　１１　畳み込み演算部
　１２　畳み込み演算部
　２１　畳み込み演算部
　２２　畳み込み演算部
　２４　加算器
　２５　加算器
　３０　測定部
　４１　フィルタ部
　４２　フィルタ部
　４３　ヘッドホン
　１００　頭外定位処理装置
　２００　フィルタ生成装置
　２１０　処理装置
　２１１　測定信号生成部
　２１２　収音信号取得部
　２１３　加算処理部
　２１４　直接音到達時刻探索部
　２１５　左右直接音判定部
　２１６　エラー訂正部
　２１７　波形切り出し部
　３１１　ピーク検出部
　３１２　符号決定部
　３１３　ピーク群分割部
　３１４　最大振幅検出部
　３１５　信号切り出し部
　３１６　信号加算部

Claims

　時間間隔を空けて連続する複数の信号音を含む測定信号を出力するスピーカと、
　前記スピーカから出力された前記測定信号を収音して、収音信号を取得するマイクと、
　前記収音信号に基づいて、伝達特性を測定する測定部と、を備え、
　前記測定部は、
　収音信号に含まれる正負のピークを検出するピーク検出部と、
　ピーク検出部で検出された前記正負のピークでの振幅に基づいて、正又は負の符号を決定する符号決定部と、
　決定された符号の前記ピークから構成されるピーク配列を複数のピーク群に分割する分割部と、
　前記複数のピーク群毎の最大振幅を検出する最大振幅検出部と、
　前記最大振幅に基づいた切り出しタイミングで、前記収音信号を切り出して、複数の切り出し信号を生成する切り出し部と、
　前記複数の切り出し信号を加算する信号加算部を備えた測定装置。
　前記符号決定部は、前記収音信号における正のピークの振幅の最大値と、前記負のピークの振幅の絶対値の最大値とを比較することで、前記符号を決定する請求項１に記載の測定装置。
　前記分割部は、
　前記ピーク配列において、前記ピークの振幅の絶対値が閾値以上のピークから、前記ピーク群の先頭ピークを求め、
　前記先頭ピークから所定の期間に含まれるピークを１つのピーク群と設定する請求項１、又は２に記載の測定装置。
　前記分割部は、前記ピーク配列において、前記ピークの振幅の絶対値が閾値以上のピークが一定期間以上存在しない箇所を、前記複数のピーク群の境界として設定する請求項３に記載の測定装置。
　請求項１～４のいずれか１項に記載の測定装置を備え
　前記測定装置によって測定された伝達特性に基づいて、フィルタを生成するフィルタ生成装置。
　スピーカから出力された測定信号をマイクで収音することで伝達特性を測定する測定方法であって、
　前記スピーカから時間間隔を空けて連続する複数の信号音を含む測定信号を出力するステップと、
　前記スピーカから出力された前記測定信号をマイクで収音して、収音信号を取得するステップと、
　前記収音信号に含まれる正負のピークを検出するピーク検出ステップと、
　ピーク検出部で検出された前記正負のピークでの振幅に基づいて、正又は負の符号を決定する符号決定ステップと、
　決定された符号の前記ピークから構成されるピーク配列を複数のピーク群に分割する分割ステップと、
　前記複数のピーク群毎の最大振幅を検出する最大振幅検出ステップと、
　前記最大振幅に基づいた切り出しタイミングで、前記収音信号を切り出して、複数の切り出し信号を生成する切り出しステップと、
　前記複数の切り出し信号を加算する信号加算ステップと、
　を含む測定方法。
　請求項６に記載の測定方法で測定した伝達特性を用いてフィルタを生成するステップを含むフィルタ生成方法。