WO2021251136A1

WO2021251136A1 - 信号処理装置、信号処理方法、信号処理プログラム、信号処理用モデル製造方法及び音響出力機器

Info

Publication number: WO2021251136A1
Application number: PCT/JP2021/019901
Authority: WO
Inventors: 康信村田; 宏平浅田
Original assignee: ソニーグループ株式会社
Priority date: 2020-06-11
Filing date: 2021-05-26
Publication date: 2021-12-16
Also published as: JPWO2021251136A1; US20230223001A1

Abstract

更なるユーザビリティの向上を促進する。信号処理装置（１０）は、外界から分離されたユーザの耳内の音響特性を取得する取得部（１１１）と、前記ユーザの耳内へ漏れ込んだ環境音とは逆位相の音データを生成するＮＣフィルタ部（１１２２）と、前記音データを補正フィルタを用いて補正する補正部（１１２３）と、前記補正フィルタのフィルタ係数を前記音響特性に基づいて決定する決定部（１１２１）と、を備える。

Description

信号処理装置、信号処理方法、信号処理プログラム、信号処理用モデル製造方法及び音響出力機器

　本開示は、信号処理装置、信号処理方法、信号処理プログラム、信号処理用モデル製造方法及び音響出力機器に関する。

　近年、携帯型のオーディオプレイヤの普及に伴い、携帯型のオーディオプレイヤ用の音響出力機器（例えば、ヘッドホンやイヤホン等）を対象として、リスナ（ユーザ）に対して、外部環境のノイズ（騒音）を低減した良好な再生音場空間を提供するノイズ低減システムが普及してきている。

　上記技術に関連して、ノイズキャンセリング（Ｎｏｉｓｅ　Ｃａｎｃｅｌｉｎｇ：ＮＣ）フィルタを用いて、ユーザの鼓膜位置において騒音を抑制する技術が普及してきている。

特開２０１６－０１５５８５号公報

　しかしながら、従来の技術では、更なるユーザビリティの向上を促進する余地があった。例えば、従来の技術では、鼓膜位置のＮＣ効果量を最大にするために鼓膜位置の信号を必要とする場合があるが、製品の仕様上、鼓膜位置にマイクを配置することは実現が困難な場合があった。

　そこで、本開示では、更なるユーザビリティの向上を促進することが可能な、新規かつ改良された信号処理装置、信号処理方法、信号処理プログラム、信号処理用モデル製造方法及び音響出力機器を提案する。

　本開示によれば、外界から分離されたユーザの耳内の音響特性を取得する取得部と、前記ユーザの耳内へ漏れ込んだ環境音とは逆位相の音データを生成するＮＣフィルタ部と、前記音データを補正フィルタを用いて補正する補正部と、前記補正フィルタのフィルタ係数を前記音響特性に基づいて決定する決定部と、を備える、信号処理装置が提供される。

実施形態に係るＮＣ最適化のための構成例を示す図である。実施形態に係るＮＣフィルタ決定に係る機能の概要を示す図である。実施形態に係るＮＣフィルタ設計時及び使用時の構成例を示す図である。実施形態に係る使用時のＮＣ最適化のための機能の概要を示す図である。実施形態に係る使用時のＮＣ最適化のための機能の概要を示す図である。実施形態に係るＨＭ特性の一例を示す図である。実施形態に係るＮＣ効果のシミュレーション結果の一例を示す図である。実施形態に係るＮＣ効果のシミュレーション結果の一例を示す図である。実施形態に係るＮＣ効果のシミュレーション結果の一例を示す図である。実施形態に係るＮＣ効果のシミュレーション結果の一例を示す図である。実施形態に係る信号処理システムの構成例を示す図である。実施形態に係るＮＣ最適化のための機能の概要を示す図である。実施形態に係る第２のＤＮＮの推定結果の一例を示す図である。実施形態に係る信号処理システムの機能の概要を示す図である。実施形態に係る信号処理システムの機能の概要を示す図である。実施形態に係る信号処理システムの処理の流れを示すフローチャートである。実施形態に係る信号処理システムの処理の流れを示すフローチャートである。実施形態に係る信号処理システムの処理の流れを示すフローチャートである。実施形態に係る補正フィルタの記憶及び参照の機能の概要を示す図である。実施形態に係る補正フィルタの記憶及び参照の処理の流れを示す図である。実施形態に係る補正フィルタの記憶及び参照の処理の流れを示す図である。実施形態に係る補正フィルタの記憶及び参照の処理の流れを示す図である。実施形態に係る補正フィルタの記憶及び参照の処理の流れを示す図である。実施形態に係る補正フィルタの記憶及び参照の処理の流れを示すフローチャートである。実施形態に係る補正フィルタの記憶及び参照の処理の流れを示す図である。実施形態に係る補正フィルタの記憶及び参照の処理の流れを示す図である。実施形態に係る補正フィルタの記憶及び参照の処理の流れを示す図である。実施形態に係る補正フィルタの記憶及び参照の処理の流れを示す図である。実施形態に係る補正フィルタの記憶及び参照の処理の流れを示す図である。実施形態に係る補正フィルタの記憶及び参照の処理の流れを示す図である。実施形態に係る補正フィルタの記憶及び参照の処理の流れを示す図である。実施形態に係る補正フィルタの記憶及び参照の処理の流れを示す図である。実施形態に係る補正フィルタの記憶及び参照の処理の流れを示す図である。実施形態に係る補正フィルタの記憶及び参照の処理の流れを示す図である。実施形態に係る補正フィルタの記憶及び参照の処理の流れを示すフローチャートである。実施形態に係る信号処理システムのブロック図を示す図である。実施形態に係る記憶部の一例を示す図である。実施形態に係る信号処理装置における処理の流れを示すフローチャートである。実施形態に係る補正フィルタのリストを表示する表示画面の一例を示す図である。実施形態に係る補正フィルタのリストを表示する表示画面の一例を示す図である。実施形態に係る補正フィルタを更新するための機能の概要を示す図である。実施形態に係る補正フィルタのゲインを調整する場合の機能の概要を示す図である。実施形態に係る補正フィルタのゲインを調整する場合の機能の概要を示す図である。実施形態に係る補正フィルタのゲインを調整する場合の処理の流れを示すフローチャートである。実施形態に係る信号処理装置のハードウェア構成例を示す図である。

　以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。

　なお、説明は以下の順序で行うものとする。
　１．本開示の一実施形態
　　１．１．はじめに
　　１．２．ＮＣ個人最適化
　　１．３．信号処理システムの構成
　２．信号処理システムの機能
　　２．１．第１のＤＮＮ
　　２．２．第２のＤＮＮ
　　２．３．第３のＤＮＮ
　　２．４．補正フィルタの推定処理
　　２．５．第４のＤＮＮ
　　２．６．処理の流れ
　　２．７．補正フィルタの記憶と参照
　　２．８．第５のＤＮＮ
　　２．９．第６のＤＮＮ
　　２．１０．機能構成例
　　２．１１．信号処理システムの処理
　　２．１２．処理のバリエーション
　３．ハードウェア構成例
　４．まとめ

＜＜１．本開示の一実施形態＞＞
　＜１．１．はじめに＞
　ユーザの頭部の形や耳の大きさ等の身体的な特徴や、眼鏡や帽子の有無等の外部的な要因により、ヘッドホン内等の容積や空気密度は異なり得る。従って、ノイズ低減信号を適用した後の信号による音がユーザの耳に達した時点での信号の特性は、ヘッドホン内等の容積や空気密度に応じて変化し得るので、ユーザに応じて変化し得る。ヘッドホン等の装着状態の違いによっても、ノイズ低減信号を適用した後の信号による音がユーザの耳に達した時点での信号の特性は変化し得る。

　製品に搭載されている標準仕様（デフォルト）のＮＣフィルタ（以下、適宜、「αデフォルト」とする）は、設計時の標準の頭部や装着状態で定めたものである場合がある。このため、ユーザの使用時のものは、デフォルトと比較して、頭部形状や装着状態に誤差が生じる場合があるため、最適なＮＣ効果が得られない場合がある。このため、更なるユーザビリティの向上を促進する余地があった。

　そこで、本開示では、更なるユーザビリティの向上を促進することが可能な、新規かつ改良された信号処理装置、信号処理方法及び信号処理用モデル製造方法を提案する。

　＜１．２．ＮＣ個人最適化＞
　まず、ＮＣ個人最適化について説明する。図１は、ＮＣ個人最適化のための構成例を示す図である。マイクＭＩ１１は、ヘッドホンＨＰ１１の内部に配置されたＦＦ（Ｆｅｅｄ　Ｆｏｒｗａｒｄ）ＮＣ用のマイク（以下、適宜、「第１マイク」とする）を示す。マイクＭＩ１２は、ヘッドホンＨＰ１１の内部に配置されたＦＢ（Ｆｅｅｄ　Ｂａｃｋ）ＮＣ用のマイク（以下、適宜、「第２マイク」とする）を示す。マイクＭＩ１３は、鼓膜位置に配置されたマイク（以下、適宜、「第３マイク」とする）を示す。音響特性Ｆ０は、ノイズ源Ｎから第１マイクまでの音響特性（空間音響特性）を示す。音響特性Ｆ１は、第１マイクから第３マイクまでの音響特性を示す。なお、音響特性Ｆ１は、ヘッドホンＨＰ１１の内部の空間を介さない漏れ込み特性である。デバイス特性Ｈ１は、ヘッドホンＨＰ１１のドライバ（スピーカ）から第３マイクまでの音響特性を示す。デバイス特性Ｈ２は、ヘッドホンＨＰ１１のドライバから第２マイクまでの音響特性を示す。マイク特性Ｍ１は、第１マイクのマイク特性を示す。マイク特性Ｍ２は、第２マイクのマイク特性を示す。マイク特性Ｍ３は、第３マイクのマイク特性を示す。

　続いて、ＮＣ個人最適化のための機能の概要について説明する。図２では、設計時の標準の頭部や装着状態において、ＮＣ効果量が最大になるＮＣフィルタを決定する。このＮＣフィルタが、製品に搭載されるαデフォルトである。図２では、設計時のデバイス特性Ｈ１と、音響特性Ｆ１とに基づいて、αデフォルトを決定する。下記式（１）は、αデフォルトを決定するための算出式を示す。

　（式中、Ｆ１デフォルトは、設計時の音響特性Ｆ１を示す。Ｈ１デフォルトは、設計時のデバイス特性Ｈ１を示す。）

　デバイス特性Ｈ１及び音響特性Ｆ１はユーザ間で異なり得る。このため、デバイス特性Ｈ１に着目し、上記式（１）に含まれるＨ１デフォルトＭ１（以下、適宜、「Ｈ１Ｍ１特性」とする）をユーザ間で補正することで、個人最適化を行うこともできる。しかしながら、この場合には、鼓膜付近にマイクを配置する必要があるため、ユーザの使用環境下でデバイス特性Ｈ１を測定することは難しい。そこで本実施形態では、例えば、デバイス特性Ｈ２に着目して、デバイス特性Ｈ１とデバイス特性Ｈ２との類似度に基づいて、デバイス特性Ｈ１を推定する。

　図３（Ａ）及び図３（Ｂ）は、設計時及び使用時の構成例を示す図である。デバイス特性Ｈ２デフォルトは、設計時のデバイス特性Ｈ２を示す。デバイス特性Ｈ２ユーザは、個人最適化を実行した際のデバイス特性Ｈ２を示す。

　続いて、図４及び図５を用いて、使用時のＮＣ個人最適化のための機能の概要について説明する。なお、図２と同様の説明は適宜省略する。また、図２では、デバイス特性Ｈ１としてデバイス特性Ｈ１デフォルトを用いる場合を示したが、図４及び図５では、デバイス特性Ｈ１ユーザを用いる。図４において、製品のＮＣフィルタには、標準のαデフォルトが用いられている。しかしながら、ユーザの装着状態等に基づくデバイス特性Ｈ１ユーザによって、音響特性が変化し得る。そこで、図５では、図４で変化し得る音響特性を補正する。図５では、例えば、デバイス特性Ｈ２ユーザに着目し、デバイス特性Ｈ２ユーザとデバイス特性Ｈ２デフォルトとの差分を打ち消す補正フィルタを用いて補正を行う。なお、図５では、説明の便宜上、デバイス特性Ｈ１ユーザの適用直後に補正を行う場合を示したが、αデフォルトの適用前後で補正を行ってもよいし、αデフォルト自身を補正してもよい。また、実際の製品では、悪影響が生じないように、約１００Ｈｚ以下に帯域を絞って補正を行う場合が多くなり得る。

　続いて、図６を用いて、上記式（１）に含まれるＨＭ特性について説明する。図６（Ａ）は、鼓膜位置に配置されたマイクで測定したＨ１Ｍ特性を示す。図６（Ｂ）は、ＦＢＮＣ用のマイクで測定したＨ２Ｍ特性を示す。図６（Ａ）及び図６（Ｂ）のそれぞれは、装着状態を変えながら約４４０回測定したＨＭ特性のデータを含む。なお、図６（Ａ）及び図６（Ｂ）に示すデータは、全てダミーヘッドを用いて測定されたデータであるため、頭部の形状による差分はないものとする。また、横軸は周波数（Ｈｚ）であり、縦軸は音圧（ｄＢ）である。

　ここで、図６（Ａ）に示すＨ１Ｍ特性のデータは、上述したように、ユーザの使用環境下で測定することが困難である。仮に、Ｈ１Ｍ特性が測定可能であれば、推定ではなく計算によって最適な補正フィルタ係数αが決定可能となる。また、補正フィルタ係数αは、Ｈ１Ｍ特性に基づいて決定されるものであり、Ｈ２Ｍ特性に基づいて決定することができない値である。そこで、上述したように、デバイス特性Ｈ２ユーザに着目し、デバイス特性Ｈ２ユーザに基づく差分を打ち消すようにαデフォルトを補正する。ただし、図６（Ａ）及び図６（Ｂ）に示すように、約２００Ｈｚ以上において、Ｈ１Ｍ特性とＨ２Ｍ特性とではＨＭ特性が大きく異なり得る。このＨＭ特性が大きく異なる要因の一例には、ユーザの外耳道の形、耳毛、室内の温度や湿度等が挙げられるが、これら以外にも様々な要因があり得る。このため、Ｈ１Ｍ特性とＨ２Ｍ特性とが近い傾向を示す帯域（例えば、約１００Ｈｚ）に絞って補正を行うことが望まれた。具体的には、近い傾向の帯域においては、Ｈ２Ｍ特性を代用することで、適切な補正が可能となり得た。しかしながら、ユーザ間の頭部の個人差や装着状態によっては類似性を担保できないため、適切に補正できない場合があった。

　続いて、図７を用いて、ＮＣ効果のシミュレーションを説明する。図７Ａは、鼓膜位置に配置されたマイクで測定されるシミュレーション結果の一例を示す。図７Ａには、５つのグラフが含まれる。このうち、グラフＬＡ１は、ユーザがヘッドホン等を装着していない曝露な状態のシミュレーション結果を示す。グラフＬＡ２は、ユーザがヘッドホン等を装着してＮＣを行わない場合のシミュレーション結果を示す。グラフＬＡ３は、αデフォルトでＮＣを行った場合のシミュレーション結果を示す。グラフＬＡ４は、ＮＣ効果量が最大になる最適なＮＣフィルタでＮＣを行った場合のシミュレーション結果を示す。グラフＬＡ５は、機械学習により推定された補正フィルタで補正したＮＣフィルタ（補正済フィルタ）でＮＣを行った場合のシミュレーション結果を示す。なお、縦軸及び横軸の指標は、図６と同様である。

　ここで、図７Ａでは、縦軸の音圧が低いほど、ＮＣ効果が高い。なお、ここでのＮＣ効果には、遮音による効果も含まれるものとする。また、グラフＬＡ３とグラフＬＡ４とを比較すると、差分の大きい帯域では、約１５ｄＢほど異なる場合があることが分かる。グラフＬＡ３乃至グラフＬＡ５は、製品に搭載されているαデフォルトに補正フィルタを適用することによって、最適なＮＣフィルタに近づけることができることを示す。グラフＬＡ５がグラフＬＡ４に近づくほど、機械学習により推定された補正フィルタで補正したＮＣフィルタが、最適なＮＣフィルタに近い特性を有するようになるため、ＮＣ効果が改善されることを示す。また、図７Ｂは、図７ＡのグラフＬＡ３乃至グラフＬＡ５に対応するＮＣフィルタの周波数特性（ゲイン）を示す。

　図８は、図７で対象となったユーザが、ヘッドホン等を脱着することにより、装着状態が変化した際のシミュレーション結果の一例を示す。なお、図８に含まれるグラフは、図７と同様であるため、説明を省略する。図７及び図８を比較することによって、装着状態の誤差がＮＣ効果及びＮＣフィルタの特性に大きく影響を与えることが分かる。例えば、２００Ｈｚ以下では、グラフＬＡ４とグラフＬＡ５との差分が図７よりも図８のほうが大きく異なる。例えば、グラフＬＡ３は、図７では３５０Ｈｚ付近から急激に減少するのに対して図８では２００Ｈｚ付近から緩やかに減少する。

　以下、実施形態では、ＤＮＮ（Ｄｅｅｐ　Ｎｅｕｒａｌ　Ｎｅｔｗｏｒｋ）等の機械学習を用いて補正フィルタを推定する場合を説明する。ＤＮＮ等の機械学習を用いることで、帯域の制限なく、ユーザの頭部の形状や装着状態や外部環境音等に応じた補正フィルタを適切に推定することができる。これにより、信号処理装置１０は、より広い帯域で、より自由度高くＮＣの最適化を実現することができる。なお、実施形態に登場するＤＮＮは、人工知能の一例である。

　以下、実施形態では、ＦＢＮＣ用のマイクで測定したＨ２Ｍ特性を入力とし、ＦＦＮＣ用のマイクで測定した測定データを基に生成されたノイズキャンセリング信号を最適に補正するための補正フィルタの係数（補正フィルタ係数）を出力するＤＮＮ（以下、適宜、「補正フィルタ係数推定ＤＮＮ」又は「第１のＤＮＮ」とする）を説明する。なお、第１のＤＮＮは、ノイズキャンセリング信号の補正に限らず、ＦＦＮＣ用のマイクで測定した測定データを基にノイズキャンセリング信号を生成するフィルタを最適に補正するための補正フィルタ係数を出力してもよい。また、以下、最適化を実行した際のＮＣ効果量が十分である場合、若しくは、漏れ込みが大きいため補正をしてもＮＣ効果量が十分でない場合において、補正の要／不要を判定するＤＮＮ（以下、適宜、「補正判定ＤＮＮ」又は「第２のＤＮＮ」とする）を説明する。

　以下、実施形態に係る補正フィルタは、例えば、インパルス応答が有限であるＦＩＲ（Ｆｉｎｉｔｅ　Ｉｍｐｕｌｓｅ　Ｒｅｓｐｏｎｓｅ）であってもよい。

　以下、実施形態に係る補正済フィルタは、例えば、αデフォルトに対して、使用時等の対象となる時点での補正フィルタを適用したものであってもよい。

　以下、実施形態では、ＪＥＩＴＡ規格で設定された環境におけるＮＣ効果量を推定する場合を示すが、ＪＥＩＴＡに限らず、他の規格で設定された環境におけるＮＣ効果量を推定してもよい。信号処理装置１０は、ＮＣ効果量を推定することで最適化の効果を推定することができるため、最適化を実行するか否かを判定することができる。

　以下、実施形態では、音響出力機器の一例として、ヘッドホン２０を用いて説明する。

　＜１．３．信号処理システムの構成＞
　実施形態に係る信号処理システム１の構成について説明する。図９は、信号処理システム１の構成例を示す図である。図９に示したように、信号処理システム１は、信号処理装置１０及びヘッドホン２０を備える。信号処理装置１０には、多様な装置が接続され得る。例えば、信号処理装置１０には、ヘッドホン２０が接続され、各装置間で情報の連携が行われる。信号処理装置１０及びヘッドホン２０は、相互に情報・データ通信を行い連携して動作することが可能なように、無線または有線通信により、情報通信ネットワークに接続される。情報通信ネットワークは、インターネット、ホームネットワーク、ＩｏＴ（Ｉｎｔｅｒｎｅｔ　ｏｆ　Ｔｈｉｎｇｓ）ネットワーク、Ｐ２Ｐ（Ｐｅｅｒ-ｔｏ-Ｐｅｅｒ）ネットワーク、近接通信メッシュネットワークなどによって構成されうる。無線は、例えば、Ｗｉ-ＦｉやＢｌｕｅｔｏｏｔｈ（登録商標）、または４Ｇや５Ｇといった移動通信規格に基づく技術を利用することができる。有線は、Ｅｔｈｅｒｎｅｔ（登録商標）またはＰＬＣ（Ｐｏｗｅｒ　Ｌｉｎｅ　Ｃｏｍｍｕｎｉｃａｔｉｏｎｓ）などの電力線通信技術を利用することができる。

　信号処理装置１０及びヘッドホン２０は、いわゆるオンプレミス（Ｏｎ-Ｐｒｅｍｉｓｅ）上、エッジサーバ、またはクラウド上に複数のコンピュータハードウェア装置として、各々別々に提供されても良いし、信号処理装置１０及びヘッドホン２０のうちの任意の複数の装置の機能を同一の装置として提供してもよい。例えば、信号処理装置１０及びヘッドホン２０は、信号処理装置１０とヘッドホン２０とが一体となって機能するとともに、外部の情報処理装置と通信する装置であってもよい。さらに、ユーザは図示されない端末装置（情報表示装置としてのディスプレイや音声及びキーボード入力を含むＰＣ（Ｐｅｒｓｏｎａｌ　ｃｏｍｐｕｔｅｒ）またはスマートホン等のパーソナルデバイス）上で動作するユーザインタフェース（Ｇｒａｐｈｉｃａｌ　Ｕｓｅｒ　Ｉｎｔｅｒｆａｃｅ：ＧＵＩ含む）やソフトウェア（コンピュータ・プログラム（以下、プログラムとも称する）により構成される）を介して、信号処理装置１０及びヘッドホン２０と相互に情報・データ通信が可能なようにされている。

　（１）信号処理装置１０
　信号処理装置１０は、ユーザ個人に最適なＮＣを行うための補正フィルタの係数（フィルタ係数）を決定する処理を行う情報処理装置である。具体的には、信号処理装置１０は、外界から分離されたユーザの耳内の音響特性を取得する。そして、信号処理装置１０は、ユーザの耳内へ漏れ込んだ環境音とは逆位相の音データを生成し、補正フィルタを用いて補正する。また、信号処理装置１０は、補正フィルタ係数を音響特性に基づいて決定する。これにより、信号処理装置１０は、鼓膜位置の信号を必要とすることなく最適化用の補正フィルタ係数を推定することができる。また、信号処理装置１０は、設計者の経験や匙加減に頼ることなく最適化のための処理を実現することができる。これにより、信号処理装置１０は、更なるユーザビリティの向上を促進する余地があった。

　また、信号処理装置１０は、信号処理システム１の動作全般を制御する機能も有する。例えば、信号処理装置１０は、各装置間で連携される情報に基づき、信号処理システム１の動作全般を制御する。具体的には、信号処理装置１０は、ヘッドホン２０から受信する情報に基づき、最適化のための補正フィルタ係数を決定する。

　信号処理装置１０は、ＰＣ（Ｐｅｒｓｏｎａｌ　Ｃｏｍｐｕｔｅｒ）、サーバ（Ｓｅｒｖｅｒ）等により実現される。なお、信号処理装置１０は、ＰＣ、サーバ等に限定されない。例えば、信号処理装置１０は、信号処理装置１０としての機能をアプリケーションとして実装したＰＣ、サーバ等のコンピュータハードウェア装置であってもよい。

　（２）ヘッドホン２０
　ヘッドホン２０は、音を聞くためにユーザが利用するヘッドホンである。ヘッドホン２０は、ドライバ及びマイクを有し、ユーザの鼓膜を含む空間と外界とを分離可能な音響出力機器であれば、ヘッドホンに限らず、どのようなものであってもよい。例えば、ヘッドホン２０は、イヤホンであってもよい。

　ヘッドホン２０は、例えば、ドライバから出力された測定音をマイクで収音する。

＜＜２．信号処理システムの機能＞＞
　以上、信号処理システム１の構成について説明した。続いて、信号処理システム１の機能について説明する。なお、信号処理システム１の機能には、ユーザ個人に最適なＮＣを行うための、αデフォルトを補正する補正フィルタ係数を推定する機能と、ユーザ個人に最適なＮＣの補正を行うか否かを判定する機能とが含まれる。

　図１０は、ユーザ個人に最適なＮＣを行うための機能の概要を示す図である。信号処理システム１は、第２マイクで収音された信号に基づいて音響特性（Ｈ２ユーザＭ２特性）を測定する。そして、信号処理システム１は、測定された音響特性に基づいて、補正フィルタ係数を推定する第１のＤＮＮを用いて、補正フィルタ係数を推定する。また、信号処理システム１は、測定されたＨ２ユーザＭ２特性に基づいて、αデフォルトのＮＣ効果を推定し、補正効果が十分見込めるか否かを判定する第２のＤＮＮを用いて、補正効果が十分見込める場合に補正フィルタを適用する。以下、第１のＤＮＮ及び第２のＤＮＮについて説明する。

　＜２．１．第１のＤＮＮ＞
　第１のＤＮＮでは、第２マイクで収音された信号に基づくＨ２ユーザＭ２特性を入力とし、補正フィルタ係数を出力とする。第１のＤＮＮでは、最適化手法の一例として、Ａｄａｍによる最適化を行う。第１のＤＮＮでは、Ｈ１ユーザＭ３に基づく補正フィルタ係数を教師データとする。ここで、第１のＤＮＮでは、例えば、勾配法を用いて、ＮＣのシミュレーション結果が最小を満たす補正フィルタ係数を教師データとしてもよい。第１のＤＮＮでは、この補正フィルタ係数を出力、Ｈ２ユーザＭ２特性を入力として教師データとする。第１のＤＮＮでは、ロス関数（損失関数）を用いて、教師データ及び推定データの双方にＦＦＴ（Ｆａｓｔ　Ｆｏｕｒｉｅｒ　Ｔｒａｎｓｆｏｒｍ）を用いて周波数特性に変換した後、共通のローパスフィルタを用いて各帯域の差分の絶対値の総和から平均（平均値）を算出してもよい。

　＜２．２．第２のＤＮＮ＞
　第２のＤＮＮでは、第２マイクで収音された信号に基づく音響特性（例えば、インパルス応答の時間信号及びＦＦＴした周波数信号）及び補正済フィルタ係数を入力とし、補正するか否かを出力とする。第２のＤＮＮでは、最適化手法の一例として、Ａｄａｍによる最適化を行う。第２のＤＮＮでは、クロスエントロピに基づくロス関数を用いる。第２のＤＮＮでは、Ｈ２ユーザＭ２特性と、マイク特性Ｍ１と、マイク特性Ｍ３と、補正済フィルタ係数とでＮＣのシミュレーションを行う。そして、第２のＤＮＮでは、シミュレーション結果として得られる補正効果であるＮＣ効果量が、所定の閾値以上か否かに基づいて、補正を行うか否かをラベル付したものを教師データとする。ここで、ＮＣ効果量とは、ヘッドホン２０を装着していない曝露な状態と、ＮＣを有効にした状態とにおいて、所定のノイズ音源及びノイズ環境で鼓膜位置の音圧を比較したときの抑制量である。例えば、信号処理システム１は、ヘッドホン２０を装着していない曝露な状態と、ＮＣを有効にした状態とのそれぞれに対して１／３オクターブバンド解析を行い、各帯域の抑制量や騒音抑制率をＮＣ効果量として処理を行ってもよい。

　図１１は、ＮＣ効果量に騒音抑制率を用いた場合の第２のＤＮＮの推定結果を示す。具体的には、Ｈ２Ｍ２特性を入力として、補正フィルタ係数αの騒音抑制率を推定した推定結果を示す。ここで、騒音抑制率が所定の閾値以上の場合に補正しないとする場合には、図１１に示すように、４つの象限に分割され得る。なお、図１１では、所定の閾値は０．７である。ここで、横軸は正解データであり、縦軸は推定データである。なお、信号処理システム１は、補正済フィルタ係数の入力に応じて、第２のＤＮＮを学習する。

　続いて、騒音抑制率に基づく最適化について説明する。ここで、信号処理システム１の機能には、ＮＣフィルタを補正することにより騒音が抑制されるか否かの推定を行う機能が含まれる。信号処理システム１は、騒音抑制率を出力するＤＮＮ（以下、適宜、「騒音抑制率推定ＤＮＮ」又は「第３のＤＮＮ」とする）を用いて、騒音が抑制されるか否かの推定を行う。以下、第３のＤＮＮについて説明する。

　＜２．３．第３のＤＮＮ＞
　第３のＤＮＮでは、Ｈ２ユーザＭ２特性、Ｈ２Ｍ２特性、及びαデフォルトを入力とし、騒音抑制率を出力とする。第３のＤＮＮでは、最適化手法の一例として、Ａｄａｍによる最適化を行う。第３のＤＮＮでは、二乗平均誤差に基づくロス関数を用いる。

　＜２．４．補正フィルタの推定処理＞
　図１２は、実施形態に係る信号処理システムの機能の概要を示す図である。図１２では、第１のＤＮＮと第２のＤＮＮとが一体に機能する場合を示す。図１２では、一体となった第１のＤＮＮと第２のＤＮＮとをまとめて「ＤＮＮ」と表記している。図１２に示すＤＮＮでは、Ｈ２ユーザＭ２特性及び補正済フィルタを入力とし、補正フィルタ係数及び補正するか否かを出力とする。また、図１２に示すＤＮＮでは、補正済フィルタを最終的な出力としてもよい。なお、図１２では、第１のＤＮＮと第２のＤＮＮとが一体となるように２つのＤＮＮが全結合層で結合されるように構成される場合を示したが、第１のＤＮＮと第２のＤＮＮとが別々に配置されるように構成されてもよいものとする。

　続いて、周囲の環境音を測定し、環境音の音響特性に基づく差分を補正する補正フィルタを推定する場合について説明する。ここで、上述してきたような、ユーザの装着状態の誤差を補正する補正フィルタを、適宜、「装着誤差補正フィルタ」又は「第１の補正フィルタ」とする。また、環境音の音響特性に基づく差分を補正する補正フィルタを、適宜、「環境音差分補正フィルタ」又は「第２の補正フィルタ」とする。ここで、第１の補正フィルタを推定する場合には、ある程度静かな環境でなければ測定音が騒音に埋もれてしまう可能性がある。第２の補正フィルタを推定する場合には、ある程度大きな騒音があるほうが環境音の特徴を測定し易く望ましい場合がある。そのため、信号処理システム１は、環境音の騒音レベルに応じて、第１の補正フィルタと第２の補正フィルタとのどちらの補正フィルタを推定するかを判定する。

　図１３は、図１２の処理に加えて、第１の補正フィルタ及び第２の補正フィルタを用いた処理の概要を示す図である。なお、第１の補正フィルタを推定する際には、図１２と同様の入出力情報等に基づいて処理を行う。ここで、信号処理システム１の機能には、周囲の環境音に基づいて補正フィルタ係数を推定する機能が含まれる。信号処理システム１は、第２の補正フィルタ係数を出力するＤＮＮ（以下、適宜、「環境音差分補正フィルタ係数推定ＤＮＮ」又は「第４のＤＮＮ」とする）を用いて、補正済フィルタを推定する。以下、第４のＤＮＮが第２の補正フィルタを推定する処理について説明する。

　＜２．５．第４のＤＮＮ＞
　第４のＤＮＮでは、第１マイクで収音された信号及び対象となる時点での補正済フィルタを入力とし、第２の補正フィルタ係数を出力とする。第４のＤＮＮでは、最適化手法の一例として、Ａｄａｍによる最適化を行う。第４のＤＮＮでは、Ｈ１Ｍ３及び音響特性Ｆ１ユーザを用いて、様々な環境音で周囲の音場を測定する。この場合、信号処理システム１は、第１マイクで収音された信号と、第３マイクで収音された信号とに基づいて、最適なフィルタ係数を推定する。そして、信号処理システム１は、例えば、勾配法を用いて、αデフォルトと、最適なフィルタ係数との差分を補正する補正フィルタ係数を推定する。そして、信号処理システム１は、第１マイクで収音された信号を入力とし、推定された補正フィルタ係数とを出力とした教師データを生成する。第４のＤＮＮでは、ロス関数を用いて、教師データ及び推定データの双方に周波数帯域ごとの重み付をした後、各帯域の振幅及び位相距離の総和から平均を算出してもよい。ここで、周波数帯域ごとの重み付けとは、例えば、ローパスフィルタでＮＣ効果が期待できない高域の除外や、ハイパスフィルタで周波数分解能の低い低域の除外に基づく重み付けである。

　＜２．６．処理の流れ＞
　図１４は、図１３に係る処理の流れを示すフローチャートである。信号処理システム１は、最適化の機能実行時の周囲の環境音の大きさによって、第１の補正フィルタに基づく補正を行うか、第２の補正フィルタに基づく補正を行うかを決定する。なお、信号処理装置１０に係る処理の流れについての詳細は後述する。

　図１５は、図１４の処理に加えて、環境音に基づく判定後、第２の補正フィルタに基づく補正を行うか否かの判定を行う処理の流れを示すフローチャートである。信号処理システム１は、推定された第２の補正フィルタ係数の大きさによって、第２の補正フィルタに基づく補正を行うかを決定する。

　図１６は、図１５の変形例である。図１６は、現補正済ＮＣ効果推定結果と、新補正済ＮＣ効果推定結果とを比較して補正をするか否かの判定を行う処理の流れを示すフローチャートである。図１６では、図１４及び図１５に示すような閾値の比較に基づいて補正を行うか否かを判定しなくてもよい。

　＜２．７．補正フィルタの記憶と参照＞
　図１７は、信号処理システム１が、補正フィルタ係数を記憶（保存）し、最適化の機能実行時に補正フィルタ係数の履歴に基づいて処理を行う場合の機能の概要を示す。近年、プリセットのＮＣフィルタであるαデフォルトが複数搭載された製品も普及してきている。図１７では、一つのαデフォルトに基づいて最適化の処理を行う場合を示したが、複数のαデフォルトに基づいて処理を行ってもよい。ここで、図１７のＤＮＮ１は、第１のＤＮＮである。図１７のＤＮＮ２は、所定のフィルタ係数を有するＮＣフィルタを用いた場合のＮＣ効果を推定するＤＮＮ（以下、適宜、「ＮＣ効果推定ＤＮＮ」又は「第５のＤＮＮ」とする）である。図１７のＤＮＮ３は、所定の規格で設定された環境におけるＮＣ効果を推定するＤＮＮ（以下、適宜、「ＮＣ効果ユーザ環境推定ＤＮＮ」又は「第６のＤＮＮ」とする）である。なお、第５のＤＮＮ及び第６のＤＮＮについての詳細は後述する。また、図１７のＮＣ効果ＪＥＩＴＡは、ＪＥＩＴＡ規格のノイズ環境におけるＮＣ効果量である。なお、ＪＥＩＴＡ規格のノイズ環境におけるＮＣ効果量に騒音抑制率を用いる場合もあり得るが、騒音抑制率の場合は出力が一つの数値となり、ＤＮＮ３の入力に足り得ないため、ここではＮＣ効果量に騒音抑制率は用いないものとする。

　続いて、図１８乃至図２４を用いて、補正フィルタの記憶や参照の処理の流れについて説明する。図１８乃至図２４では、信号処理装置１０により記憶されるメモリ（例えば、記憶部１２０）の一例を用いて説明する。図１８乃至図２４では、各帯域のＮＣ効果量に基づいて重み付けをして平均化する等の所定の処理を行うことによって指標として一つの数値が算出される。なお、所定の処理は、ＮＣ効果量の指標として数値を算出する処理であれば、各帯域のＮＣ効果量に基づいて重み付けをして平均化する処理に限らず、どのようなものであってもよい。この数値は、０から１までの間で算出される。また、数値が大きいほど、ＮＣの性能が高いものとして説明する。まず、メモリに記憶された第１の補正フィルタを更新する場合の処理について説明する。図１８は、最適化の処理を実行していない場合を示す。

　図１８Ａは、補正フィルタのメモリに何も記憶されていない状態を示す。例えば、購入時等の初期時である。ここで、第１の補正フィルタを用いた状態を、以下、適宜、「Ｎ．標準」とする。また、ヘッドホン２０を装着して最適化を実行していない状態を、以下、適宜、「Ｏ．不明」とする。

　図１８Ｂは、ユーザが眼鏡等何も装着せずに、ヘッドホン２０の装着状態に影響しない状態で、電車で移動中にヘッドホン２０を使用した際のＮＣ効果量を記憶した状態を示す。ここで、電車で移動中の状態を、以下、適宜、「Ｂ．電車」とする。なお、最適化の処理が実行されていないため、装着状態は、「Ｏ．不明」である。ここでは、「Ｏ．不明」の状態での「Ｂ．電車」に「０．５５」のＮＣ効果量が記憶される。信号処理装置１０は、「Ｏ．不明」の状態での、「Ｂ．電車」でのＮＣ効果量の実測値を記憶する。信号処理装置１０は、「Ｂ．電車」の環境音を記憶する。なお、説明の便宜上、「Ｂ．電車」のラベルを用いて説明したが、ヘッドホン２０は、その際の使用環境が「Ｂ．電車」であることを認識する必要はないものとする。

　図１８Ｃは、ユーザが「Ｂ．電車」の後、バスで移動中にヘッドホン２０を使用した際のＮＣ効果量を記憶した状態を示す。ここで、バスで移動中の状態を、以下、適宜、「Ｃ．バス」とする。ここで、「Ｃ．バス」でのＮＣ効果量が、「Ｂ．電車」でのＮＣ効果量よりも大きいものとする。ここでは、「Ｏ．不明」の状態での「Ｃ．バス」に「０．６０」のＮＣ効果量が記憶される。図１８Ｃでは、信号処理装置１０は、「Ｏ．不明」の状態での、「Ｃ．バス」でのＮＣ効果量の実測値を記憶する。信号処理装置１０は、「Ｃ．バス」の環境音を記憶する。

　続いて、図１９は、ユーザが最適化の機能に気づき、ヘッドホン２０を外さずに、静かな環境で実行する場合を示す。ここで、ユーザが眼鏡等何も装着せずに最適化の機能を実行する状態を、以下、適宜、「Ｐ．（装着）なし」とする。信号処理装置１０は、「Ｐ．なし」の状態での実行時の装着における空間特性が「Ｎ．標準」の状態と異なると判断し、補正フィルタ（ｐ）を第１の補正フィルタとして推定する。また、信号処理装置１０は、補正フィルタ（ｐ）を適用した場合と適用しない場合とのそれぞれのＮＣ効果量を推定する。ここでは、補正フィルタ（ｐ）を適用する場合のＮＣ効果量として、「Ｐ．なし」の状態での「Ｃ．バス」に「０．７０」のＮＣ効果量が記憶される。信号処理装置１０は、「Ｐ．なし」の状態での、「Ｃ．バス」でのＮＣ効果量の推定値を記憶する。なお、補正フィルタ（ｐ）を適用しない場合には、「Ｏ．不明」に実測値が記憶されているため、ＮＣ効果量にはこの実測値が用いられる。また、「Ｐ．なし」の状態での「Ａ．ＪＥＩＴＡ」に「０．７４」のＮＣ効果量が記憶される。信号処理装置１０は、「Ｐ．なし」の状態での、「Ａ．ＪＥＩＴＡ」でのＮＣ効果量の推定値を記憶する。

　信号処理装置１０は、「Ｃ．バス」での「Ｏ．不明」と「Ｐ．なし」との２つのＮＣ効果量を比較して、第１の補正フィルタを更新する（Ｓ２１）。ここでは、信号処理装置１０は、「Ｏ．不明」の「０．６０」のＮＣ効果量と、「Ｐ．なし」の「０．７０」のＮＣ効果量とを比較して、「Ｐ．なし」のＮＣ効果量のほうが大きいため、第１の補正フィルタを補正フィルタ（ｐ）に更新する。続いて、信号処理装置１０は、更新済みの第１の補正フィルタを用いて、ヘッドホン２０を装着したまま「Ｃ．バス」で使用した際のＮＣ効果量を記憶する（Ｓ２２）。ここでは、「Ｐ．なし」の状態での「Ｃ．バス」に「０．６８」のＮＣ効果量が記憶される。続いて、信号処理装置１０は、ヘッドホン２０を装着したまま「Ｂ．電車」で使用した際のＮＣ効果量を測定し、「Ｃ．バス」で使用した際のＮＣ効果量と比較する（Ｓ２３）。信号処理装置１０は、「Ｂ．電車」でのＮＣ効果量のほうが大きいため、ＮＣ効果量を上書きする。信号処理装置１０は、最大となるＮＣ効果量の記憶時の環境音の条件が「Ｃ．バス」から「Ｂ．電車」へ変化したため、「Ｃ．バス」の記憶を削除（消去）する。

　その後（例えば、後日）、信号処理装置１０は、ユーザが最適化の機能を実行することなく眼鏡を装着したまま「Ｂ．電車」及び「Ｃ．バス」で使用した際のＮＣ効果量を記憶する（Ｓ２４）。ここでは、「Ｏ．不明」の状態での「Ｂ．電車」に「０．６４」のＮＣ効果量が記憶される。続いて、ユーザはヘッドホン２０を外さずに最適化の機能を静かな環境で実行したものとする。ここで、眼鏡を装着したまま最適化を行う状態を、以下、適宜、「Ｑ．眼鏡」とする。信号処理装置１０は、「Ｑ．眼鏡」の状態での実行時の装着における特性が「Ｎ．標準」及び「Ｐ．なし」と異なると判断し、補正フィルタ（ｑ）を第１の補正フィルタとして推定する（Ｓ２５）。また、信号処理装置１０は、「Ｑ．眼鏡」の状態での「Ａ．ＪＥＩＴＡ」と「Ｂ．電車」とのそれぞれの効果量を推定する。ここでは、「Ｑ．眼鏡」の状態での「Ａ．ＪＥＩＴＡ」に「０．７０」のＮＣ効果量が記憶され、「Ｂ．電車」に「０．７１」のＮＣ効果量が記憶される。ここで、「Ｏ．不明」に実測値が記憶されているため、「Ｑ．眼鏡」の状態での「Ｂ．電車」のＮＣ効果量には、この実測値が用いられる。なお、「Ｏ．不明」に実測値が記憶されていない場合には、「Ｑ．眼鏡」の状態での「Ａ．ＪＥＩＴＡ」のＮＣ効果量を「Ｂ．電車」の環境音と合せて入力として推定する。そして、信号処理装置１０は、「Ｂ．電車」での「Ｏ．不明」と「Ｑ．眼鏡」との２つのＮＣ効果量を比較して、第１の補正フィルタを更新する（Ｓ２６）。ここでは、信号処理装置１０は、「Ｏ．不明」の「０．６４」のＮＣ効果量と、「Ｑ．眼鏡」の「０．７１」のＮＣ効果量とを比較して、比較の結果、「Ｑ．眼鏡」のＮＣ効果量のほうが大きいため、第１の補正フィルタを補正フィルタ（ｑ）に更新する。

　図２０は、図１８及び図１９に係る処理の流れを示すフローチャートである。

　信号処理装置１０は、Ｈ２ユーザＭ２特性の近傍を判定するために、メモリ内のリストを検索する順番を記憶順やアドレス順ではなく、ＮＣ効果量の順や、Ｈ２ユーザＭ２特性の近傍と判定された回数の順に補正フィルタを並び替えてもよい。これにより、信号処理装置１０は、より確実性の高い補正フィルタを選択することができる。ここで、ユーザによっては最適化の機能を実行する頻度が低い場合がある。最適化の機能を実行しない間に、ヘッドホン２０が複数回使用される可能性がある。このことから、信号処理装置１０は、「Ｏ．不明」の状態でのＮＣ効果量を記憶しておき、近傍の特性の検索に用いてもよい。信号処理装置１０は、例えば、各補正フィルタの（１）「対象となる装着状態におけるＮＣ効果量の平均値」、（２）「装着状態が不明の場合におけるＮＣ効果量の平均値」、（３）「対象となる装着状態において、補正フィルタが選択された際にヘッドホン２０を使用した回数」、及び（４）「装着状態が不明の場合において、補正フィルタが選択された際にヘッドホン２０を使用した回数」等を記憶することで、近傍の特性の検索に用いてもよい。

　信号処理装置１０は、上記（３）の回数がユーザの装着状態のばらつきに依存する可能性が高いため、近傍の特性を検索する場合にはこの回数の多い順に処理を行ってもよい。ここで、上記（３）の回数が多い補正フィルタは、ユーザが複数回の脱着を繰り返しても同じ装着状態になる傾向があるため信頼性が高くなり得る。信号処理装置１０は、仮に同じ回数の補正フィルタが含まれる場合には、上記（１）のＮＣ効果量の順に検索してもよい。また、信号処理装置１０は、上記（１）において、仮に同じＮＣ効果量の補正フィルタが含まれる場合には、上記（４）の回数の順に検索してもよい。そして、信号処理装置１０は、上記（２）のＮＣ効果量の順に検索してもよい。なお、この検索順は一例であり、この検索順に限られないものとする。

　続いて、図２１乃至図２４を用いて、第２の補正フィルタを記憶したメモリの更新の処理について説明する。なお、図１８乃至図２０と同様の説明は適宜省略する。

　図２１Ａは、初期時の第２の補正フィルタのメモリを示す。ここで、初期時の第２の補正フィルタのメモリの状態を、以下、適宜、「Ａ．ＪＥＩＴＡ（スルー）」とし、その際の環境音を、以下、適宜、「Ａ．ＪＥＩＴＡ」とする。また、初期時以降の第２の補正フィルタのメモリの状態を、以下、適宜、「ｎ．標準」とし、その際の装着情報を、以下、適宜、「Ｎ．標準」とする。また、補正フィルタは、「ａ」と「ｎ」の組み合わせで表記される。図２１Ａでは、信号処理装置１０は、初期時の第２の補正フィルタのメモリにアクセスする。

　図２１Ｂは、ユーザが何も装着しない状態で、最適化の機能を実行せずに、「Ｂ．電車」で使用した際のＮＣ効果量を記憶した状態を示す。ここでは、「Ｏ．不明」の状態での「ＮＣフィルタ（ａ－ｎ）Ｂ．電車」に「０．６２」のＮＣ効果量が記憶される。図２１Ｂでは、信号処理装置１０は、「Ｏ．不明」の状態での、「ＮＣフィルタ（ａ－ｎ）Ｂ．電車」でのＮＣ効果量の実測値を記憶する。信号処理装置１０は、「Ｂ．電車」の環境音を記憶する。

　図２１Ｃは、ユーザが「Ｂ．電車」で最適化の機能を実行した際のＮＣ効果量を記憶した状態を示す。図２１Ｃでは、信号処理装置１０は、第２の補正フィルタとＮＣ効果量とを推定する。ここでは、「Ｏ．不明」の状態での「ＮＣフィルタ（ｂ－ｎ）Ｂ．電車」に「０．７２」のＮＣ効果量が記憶される。信号処理装置１０は、「Ｏ．不明」の状態での、「ＮＣフィルタ（ｂ－ｎ）Ｂ．電車」でのＮＣ効果量の推定値を記憶する。そして、図２２に続く。

　図２２Ａでは、信号処理装置１０は、「Ｏ．不明」の状態での「ＮＣフィルタ（ａ－ｎ）Ｂ．電車」の実測値と、「ＮＣフィルタ（ｂ－ｎ）Ｂ．電車」の推定値とを比較する。具体的には、信号処理装置１０は、「Ｏ．不明」の状態での「ＮＣフィルタ（ａ－ｎ）Ｂ．電車」の実測値である「０．６２」のＮＣ効果量と、「ＮＣフィルタ（ｂ－ｎ）Ｂ．電車」の推定値である「０．７１」のＮＣ効果量とを比較する。信号処理装置１０は、新たに推定した「ＮＣフィルタ（ｂ－ｎ）Ｂ．電車」の推定値のほうが大きいため、この補正フィルタのほうがＮＣの性能が高いとして、第２の補正フィルタを更新する。図２２Ａは、ユーザがヘッドホン２０を外さずに「ＮＣフィルタ（ｂ－ｎ）Ｂ．電車」の実測値を記憶した状態を示す。

　図２２Ｂは、ユーザがヘッドホン２０を外すことなく、「Ｃ．バス」で使用した際に、環境音が変化した際のＮＣ効果量を記憶した状態を示す。ここでは、「Ｏ．不明」の状態での「ＮＣフィルタ（ｂ－ｎ）Ｃ．バス」に「０．６６」のＮＣ効果量が記憶される。図２２Ｂでは、信号処理装置１０は、「Ｏ．不明」の状態での、「Ｃ．バス」でのＮＣ効果量の推定値を記憶する。

　図２２Ｃは、その後（例えば、後日）、ユーザが眼鏡等何も装着していない状態で、静かな環境で最適化を実行した際（「Ｐ．なし」の状態）のＮＣ効果量を記憶した状態を示す。この場合、信号処理装置１０は、ヘッドホン２０の脱着が生じているものと仮定して、「Ｏ．不明」の状態に対応する値を全てクリアする。信号処理装置１０は、「Ｐ．なし」の状態が、メモリ内に含まれる「Ｎ．標準」の状態とは異なる特性であると判断し、「Ｐ．なし」に対応する補正フィルタ（ｐ）を推定する。また、信号処理装置１０は、「Ｐ．なし」の状態での「ＮＣフィルタ（ａ－ｐ）Ａ．ＪＥＩＴＡ」と、「ＮＣフィルタ（ａ－ｎ）Ａ．ＪＥＩＴＡ」とのＮＣ効果量を推定する。ここでは、「Ｐ．なし」の状態での「ＮＣフィルタ（ａ－ｐ）Ａ．ＪＥＩＴＡ」に「０．７７」のＮＣ効果量が記憶され、「ＮＣフィルタ（ａ－ｎ）Ａ．ＪＥＩＴＡ」に「０．６８」のＮＣ効果量が記憶される。そして、信号処理装置１０は、推定結果に基づいて、推定した「ＮＣフィルタ（ａ－ｐ）Ａ．ＪＥＩＴＡ」の推定値のほうが大きいため、第２の補正フィルタを補正フィルタ（ｐ）に更新する。そして、図２３に続く。

　図２３Ａは、ユーザがヘッドホン２０を外すことなく、「Ｂ．電車」及び「Ｃ．バス」で使用した際のＮＣ効果量を記憶した状態を示す。図２３Ａでは、信号処理装置１０は、「Ｐ．なし」の状態での、「Ｂ．電車」及び「Ｃ．バス」でのＮＣ効果量の推定値を記憶する。ここでは、「Ｐ．なし」の状態での「Ｂ．電車」に「０．７８」のＮＣ効果量が記憶され、「Ｃ．バス」に「０．７０」のＮＣ効果量が記憶される。

　図２３Ｂは、その後（例えば、後日）、ユーザが眼鏡を装着した状態で、装着後に最適化の機能を実行せずに、「Ｃ．バス」及び「Ｄ．飛行機」で使用した際のＮＣ効果量を記憶した状態を示す。ここでは、ユーザが眼鏡を装着後に最適化の機能を実行していないので、「Ｏ．不明」に記憶される。図２３（Ｂ）では、信号処理装置１０は、「Ｏ．不明」の状態での、「Ｃ．バス」及び「Ｄ．飛行機」でのＮＣ効果量の実測値を記憶する。ここでは、「Ｏ．不明」の状態での「Ｃ．バス」に「０．５８」のＮＣ効果量が記憶され、「Ｄ．飛行機」に「０．６２」のＮＣ効果量が記憶される。

　図２３Ｃは、ユーザがヘッドホン２０を装着したまま、周囲が静かになったときに最適化の機能を実行した際のＮＣ効果量を記憶した状態を示す。信号処理装置１０は、「Ｑ．眼鏡」の状態が、「Ｎ．標準」及び「Ｐ．なし」の状態とは異なる特性であると判断し、「Ｑ．眼鏡」に対応する補正フィルタ（ｑ）を推定する。また、信号処理装置１０は、「Ｑ．眼鏡」の状態での「ＮＣフィルタ（ａ－ｐ）Ａ．ＪＥＩＴＡ」と、「ＮＣフィルタ（ｂ－ｐ）Ｂ．電車」と、「ＮＣフィルタ（ｂ－ｑ）Ｂ．電車」とのＮＣ効果量を推定する。ここでは、「Ｑ．眼鏡」の状態での「ＮＣフィルタ（ａ－ｐ）Ａ．ＪＥＩＴＡ」に「０．７４」のＮＣ効果量が記憶され、「ＮＣフィルタ（ｂ－ｐ）Ｂ．電車」に「０．６６」のＮＣ効果量が記憶され、「ＮＣフィルタ（ｂ－ｑ）Ｂ．電車」に「０．７７」のＮＣ効果量が記憶される。

　図２３Ｄでは、信号処理装置１０は、新たに推定した「ＮＣフィルタ（ｂ－ｑ）Ｂ．電車」の推定値のほうが大きいため、このＮＣの性能が高いとして、補正フィルタ（ｑ）を第２の補正フィルタとして選択する。図２３Ｄは、ユーザがヘッドホン２０を装着したまま、「Ｃ．バス」及び「Ｄ．飛行機」で使用した際のＮＣ効果量を記憶した状態を示す。図２３Ｄでは、信号処理装置１０は、ユーザがヘッドホン２０を装着した状態での、「Ｃ．バス」及び「Ｄ．飛行機」でのＮＣ効果量の推定値を記憶する。ここでは、「Ｑ．眼鏡」の状態での「Ｃ．バス」に「０．７０」のＮＣ効果量が記憶され、「Ｄ．飛行機」に「０．７８」のＮＣ効果量が記憶される。

　図２４は、図２１乃至図２３に係る処理の流れを示すフローチャートである。

　＜２．８．第５のＤＮＮ＞
　続いて、補正フィルタの推定結果に基づく最適化について説明する。ここで、信号処理システム１の機能には、所定のフィルタ係数を有するＮＣフィルタを用いた場合のＮＣ効果の推定を行う機能が含まれる。信号処理システム１は、第５のＤＮＮを用いて、ＮＣ効果の推定を行う。以下、第５のＤＮＮについて説明する。

　第５のＤＮＮでは、Ｈ２ユーザＭ２特性及び補正済フィルタ係数を入力とし、ＮＣ効果量を出力とする。なお、第５のＤＮＮでは、上記に加えて、Ｈ２Ｍ２特性を入力としてもよいものとする。第５のＤＮＮでは、最適化手法の一例として、Ａｄａｍによる最適化を行う。第５のＤＮＮでは、二乗平均誤差に基づくロス関数を用いる。第５のＤＮＮでは、第１のＤＮＮで生成した教師データを用いてＮＣのシミュレーションを行い、シミュレーション結果として得られるＮＣ効果量を教師データとする。

　＜２．９．第６のＤＮＮ＞
　続いて、所定の規格で設定された環境に基づく最適化について説明する。ここで、信号処理システム１の機能には、所定の規格で設定された環境におけるＮＣ効果の推定を行う機能が含まれる。信号処理システム１は、第６のＤＮＮを用いて、ＮＣ効果の推定を行う。以下、第６のＤＮＮについて説明する。

　第６のＤＮＮでは、所定の規格のノイズ環境におけるＮＣ効果量、補正済フィルタ係数、及びユーザの使用環境下での環境音の特性を入力とし、ユーザの使用環境下でのＮＣ効果量を出力とする。第６のＤＮＮでは、二乗平均誤差に基づくロス関数を用いる。第６のＤＮＮでは、ＮＣのシミュレーション結果として得られるＮＣ効果量を教師データとする。例えば、第６のＤＮＮでは、ＮＣフィルタ、補正フィルタ、及び、環境音の音データ（例えば、第１マイク乃至第３マイクで測定された環境音の音データ）及び特性等のデータを用いてＮＣのシミュレーションを行い、シミュレーション結果として得られるＮＣ効果量を教師データとする。

　＜２．１０．機能構成例＞
　図２５は、実施形態に係る信号処理システム１の機能構成例を示すブロック図である。

　（１）信号処理装置１０
　図２５に示したように、信号処理装置１０は、通信部１００、制御部１１０、及び記憶部１２０を備える。なお、信号処理装置１０は、少なくとも制御部１１０を有する。

　（１－１）通信部１００
　通信部１００は、外部装置と通信を行う機能を有する。例えば、通信部１００は、外部装置との通信において、外部装置から受信する情報を制御部１１０へ出力する。具体的には、通信部１００は、ヘッドホン２０から受信する情報を制御部１１０へ出力する。例えば、通信部１００は、ヘッドホン２０に備えられたマイクで収音された信号を制御部１１０へ出力する。

　通信部１００は、外部装置との通信において、制御部１１０から入力される情報を外部装置へ送信する。具体的には、通信部１００は、制御部１１０から入力される収音信号の取得に関する情報をヘッドホン２０へ送信する。通信部１００は、ハードウェア回路（通信プロセッサなど）で構成され、ハードウェア回路上またはハードウェア回路を制御する別の処理装置（ＣＰＵなど）上で動作するコンピュータ・プログラムにより処理を行うように構成することができる。

　（１－２）制御部１１０
　制御部１１０は、信号処理装置１０の動作を制御する機能を有する。例えば、制御部１１０は、ユーザ個人に最適なＮＣを行うための補正フィルタ係数を決定する処理を行う。

　上述の機能を実現するために、制御部１１０は、図２５に示すように、取得部１１１、処理部１１２、出力部１１３を有する。制御部１１０はＣＰＵなどのプロセッサにより構成され、取得部１１１、処理部１１２、出力部１１３の各機能を実現するソフトウエア（コンピュータ・プログラム）を記憶部１２０から読み込んで処理をするようにされていてもよい。また、取得部１１１、処理部１１２、出力部１１３の一つ以上は、制御部１１０とは別のハードウェア回路（プロセッサなど）で構成され、別のハードウェア回路上または制御部１１０上で動作するコンピュータ・プログラムにより制御されるように構成することができる。

　・取得部１１１
　取得部１１１は、外界から分離されたユーザの耳内の音響特性を取得する機能を有する。取得部１１１は、例えば、耳内に出力された測定音を収音した収音信号に基づく音響特性を取得する。例えば、取得部１１１は、音響出力機器のマイクで収音された収音信号に基づく音響特性を取得する。

　取得部１１１は、記憶部１２０に記憶されたデータを取得する。例えば、取得部１１１は、補正フィルタ係数に関する情報を取得する。

　・処理部１１２
　処理部１１２は、信号処理装置１０の処理を制御するための機能を有する。処理部１１２は、図２５に示すように、決定部１１２１、ＮＣフィルタ部１１２２、補正部１１２３、生成部１１２４、及び判定部１１２５を有する。処理部１１２の有する決定部１１２１、ＮＣフィルタ部１１２２、補正部１１２３、生成部１１２４、及び判定部１１２５は、各々が独立したコンピュータ・プログラムのモジュールとして構成されていてもよいし、複数の機能を一つのまとまりのあるコンピュータ・プログラムのモジュールとして構成していてもよい。

　・決定部１１２１
　決定部１１２１は、取得部１１１により取得された音響特性に基づいて、補正フィルタ係数を決定する機能を有する。

　決定部１１２１は、音響特性を入力とし、フィルタ係数を出力とする学習済モデル（例えば、第１のＤＮＮ）を用いて、補正フィルタ係数を決定する。例えば、決定部１１２１は、ユーザの鼓膜位置において推定される音響特性を教師データとして学習した学習済モデルを用いて、補正フィルタ係数を決定する。

　決定部１１２１は、音響特性と音データとを入力とし、音データを補正するか否かを出力とする学習済モデル（例えば、第２のＤＮＮ）を用いて、補正フィルタ係数を決定する。例えば、決定部１１２１は、音響特性と音データとに基づいて推定される騒音抑制率に基づいて補正するか否かをラベル付した付与情報を教師データとして学習した学習済モデルを用いて、補正フィルタ係数を決定する。

　決定部１１２１は、音響特性と予め測定された音響特性及び音データとを入力とし、騒音抑制率を出力とする学習済モデル（例えば、第３のＤＮＮ）を用いて、補正フィルタ係数を決定する。例えば、決定部１１２１は、ユーザの鼓膜位置において推定される音響特性と音データとに基づく騒音抑制率を教師データとして学習した学習済モデルを用いて、補正フィルタ係数を決定する。

　決定部１１２１は、音響特性を測定したマイクとは異なるマイクで収音された収音信号と音データとを入力とし、ユーザ環境における環境音に基づくフィルタ係数の差分を補正する補正フィルタ係数を出力とする学習済モデル（第４のＤＮＮ）を用いて、補正フィルタ係数を決定する。例えば、決定部１１２１は、ユーザの鼓膜位置において推定される音響特性に基づくフィルタ係数の差分を補正するフィルタ係数を教師データとして学習した学習済モデルを用いて、補正フィルタ係数を決定する。

　決定部１１２１は、音響特性と音データとを入力とし、ＮＣ効果量を出力とする学習済モデル（例えば、第５のＤＮＮ）を用いて、補正フィルタ係数を決定する。例えば、決定部１１２１は、ユーザの鼓膜位置において推定される音響特性に基づく効果量を教師データとして学習した学習済モデルを用いて、補正フィルタ係数を決定する。

　決定部１１２１は、所定の規格で定められた環境におけるＮＣ効果量と音データとユーザ環境における環境音の音響特性とを入力とし、ユーザ環境におけるＮＣ効果量を出力とする学習済モデル（第６のＤＮＮ）を用いて、補正フィルタ係数を決定する。例えば、決定部１１２１は、音データとフィルタ係数とユーザ環境における環境音の音響特性とに基づくＮＣ効果量を教師データとして学習した学習済モデルを用いて、補正フィルタ係数を決定する。

　・ＮＣフィルタ部１１２２
　ＮＣフィルタ部１１２２は、ユーザの耳内へ漏れ込んだ環境音とは逆位相の音データを生成する機能を有する。ＮＣフィルタ部１１２２は、例えば、取得部１１１により取得された環境音の音響特性と逆位相の音データを生成する。

　・補正部１１２３
　補正部１１２３は、ＮＣフィルタ部１１２２により生成された音データを補正フィルタを用いて補正する機能を有する。具体的には、補正部１１２３は、決定部１１２１により決定された補正フィルタ係数を用いて補正する。

　・生成部１１２４
　生成部１１２４は、学習済モデルを生成する機能を有する。生成部１１２４は、例えば、入力データと出力データとを損失関数に入力することにより学習した学習済モデルを生成する。決定部１１２１は、生成部１１２４により生成された学習済モデルを用いて推定された補正フィルタ係数を決定する。

　・判定部１１２５
　判定部１１２５は、ＮＣフィルタ部１１２２により生成された音データを補正フィルタを用いて補正するか否かを判定する機能を有する。例えば、判定部１１２５は、補正フィルタを用いることにより、補正効果が十分見込めるか否かを判定し、補正効果が十分見込める場合には、補正フィルタを用いて補正すると判定する。

　判定部１１２５は、環境音の騒音レベルを判定する。判定部１１２５は、環境音の騒音レベルに応じて、第１の補正フィルタと第２の補正フィルタとのどちらの補正フィルタを用いるかを判定する。

　・出力部１１３
　出力部１１３は、補正部１１２３により補正された音データを出力する機能を有する。出力部１１３は、補正された音データを、通信部１００を介して、例えば、ヘッドホン２０へ提供する。ヘッドホン２０は、補正された音データを受信すると、補正された音データに基づく音を再生する。これにより、ユーザは、補正フィルタにより補正された音を試聴することができる。

　（１－３）記憶部１２０
　記憶部１２０は、例えば、ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）、フラッシュメモリ等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。記憶部１２０は、信号処理装置１０における処理に関するコンピュータ・プログラムやデータ（プログラムの一形式を含む）を記憶する機能を有する。

　図２６は、記憶部１２０の一例を示す。図２６に示すように、記憶部１２０は、「補正フィルタ係数ＩＤ」、「補正フィルタ係数」、「実行状態」、「使用環境１」、「使用環境２」といった項目を有してもよい。

　「補正フィルタ係数ＩＤ」は、補正フィルタ係数を識別するための識別情報を示す。「補正フィルタ係数」は、補正フィルタ係数を示す。「実行状態」は、最適化機能の実行状態を示す。図２６に示す例では、「実行状態」に「実行状態＃１」や「実行状態＃２」といった概念的な情報が格納される例を示したが、実際には、「Ｎ．標準」や「Ｏ．不明」等のデータが格納される。「使用環境１」等は、ユーザの使用環境を示す。図２６に示す例では、「使用環境１」に「使用環境＃１」や「使用環境＃２」といった概念的な情報が格納される例を示したが、実際には、「Ｂ．電車」や「Ｃ．バス」等のデータが格納される。

　（２）ヘッドホン２０
　図２５に示したように、ヘッドホン２０は、通信部２００、制御部２１０、及び出力部２２０を備える。

　（２－１）通信部２００
　通信部２００は、外部装置と通信を行う機能を有する。例えば、通信部２００は、外部装置との通信において、外部装置から受信する情報を制御部２１０へ出力する。具体的には、通信部２００は、信号処理装置１０から受信する情報を制御部２１０へ出力する。例えば、通信部２００は、補正フィルタにより補正された音データの取得に関する情報を制御部２１０へ出力する。

　（２－２）制御部２１０
　制御部２１０は、ヘッドホン２０の動作を制御する機能を有する。例えば、制御部２１０は、通信部２００を介して、マイクで収音された収音信号に基づく音響特性を信号処理装置１０へ送信する。

　（２－３）出力部２２０
　出力部２２０は、スピーカ等の音を出力可能な部材によって実現される。出力部２２０は、音データに基づく音を出力する。

　＜２．１１．信号処理システムの処理＞
　以上、実施形態に係る信号処理システム１の機能について説明した。続いて、信号処理システム１の処理について説明する。

　図２７は、実施形態に係る信号処理装置１０における処理の流れを示すフローチャートである。信号処理装置１０は、外界から分離されたユーザの耳内の音響特性を取得する（Ｓ１０１）。次いで、信号処理装置１０は、取得した音響特性を入力すると補正フィルタ係数を出力する学習済モデルを用いて補正フィルタ係数を決定する（Ｓ１０２）。そして、信号処理装置１０は、ユーザの耳内へ漏れ込んだ環境音と逆位相の音データを生成する（Ｓ１０３）。次いで、信号処理装置１０は、補正フィルタを用いて補正するか否かを判定する（Ｓ１０４）。信号処理装置１０は、補正フィルタを用いて補正すると判定した場合（Ｓ１０４；ＹＥＳ）、生成した音データを、決定した補正フィルタ係数を用いて補正する（Ｓ１０５）。また、信号処理装置１０は、補正フィルタを用いて補正しないと判定した場合（Ｓ１０４；ＮＯ）、情報処理を終了する。

　＜２．１２．処理のバリエーション＞
（ＵＩを用いた補正フィルタの選択）
　上記実施形態では、信号処理装置１０は、補正する／しないをＤＮＮ等の機械学習を用いて決定する場合を説明したが、この例に限られない。信号処理装置１０は、例えば、ユーザからの選択を受け付けることで、補正する／しないを決定してもよい。

　ＮＣ効果量が高いほどユーザにとって快適かどうかはユーザの主観に依存し得る。ＮＣ効果量が高くなることでユーザにとって快適ではなくなる一例として、例えば、中低域のノイズが大きく抑制されることで、ノイズによってマスクされていた高域のノイズが相対的に強調されて耳障りになる場合がある。信号処理装置１０は、現状のフィルタ係数を用いたＮＣ効果量、推定された補正フィルタ係数を用いたＮＣ効果量、メモリに記憶された補正フィルタ係数のＮＣ効果量等を提示してユーザからの選択を受け付けることで、補正する／しないを決定してもよい。例えば、信号処理装置１０は、スマートホン等の携帯端末（以下、適宜、「端末装置３０」とする）に補正フィルタのリストを表示させてユーザからの選択を受け付けてもよい。例えば、信号処理装置１０は、ユーザの装着状態に応じた補正フィルタのリストを表示させてもよい。これにより、信号処理装置１０は、ユーザが明示的に補正フィルタを選択できるようにすることができる。また、信号処理装置１０は、ユーザが任意の環境音でＮＣ効果量を確認できるようにすることができる。

　図２８は、補正フィルタのリストを表示する表示画面の一例を示す。図２８では、補正フィルタのリストに、「標準」と「フィルタ１」と「フィルタ２」とが含まれる。ここで、「標準」は、例えばユーザが何も装着しない際に信号処理装置１０が推定した補正フィルタである。「フィルタ１」は、例えばユーザが眼鏡を装着した際に信号処理装置１０が推定した補正フィルタである。「フィルタ２」は、例えばユーザが帽子を装着した際に信号処理装置１０が推定した補正フィルタである。図２８では、補正フィルタのリストを表示する表示画面ＨＧ１１には、ユーザが測定Ｂ１１を操作（例えば、クリックやタップ）すると新たな測定に基づく補正フィルタが選択肢として追加される所定の領域ＳＫ１１が含まれる。また、表示画面ＨＧ１１には、ユーザが選択した補正フィルタの特性がハイライトされる所定の領域ＳＫ１２が含まれる。また、表示画面ＨＧ１１に含まれる試聴Ｃ１１をユーザが操作すると、端末装置３０は、例えば、ユーザに選択された補正フィルタに基づく音を出力する。

　信号処理装置１０は、試聴Ｃ１１に対する操作を受け付けると、ユーザに選択された補正フィルタに基づく音を出力するための処理を行ってもよい。これにより、ユーザは選択した補正フィルタに基づく音を試聴することができる。ここで、信号処理装置１０は、試聴の際に、リストに含まれる補正フィルタの差分をユーザが認識し易いように、端末装置３０に記憶された音（例えば、楽曲（曲））を選択して再生してもよい。若しくは、信号処理装置１０は、ユーザにより予め選択された任意の音を再生してもよい。これにより、信号処理装置１０は、ユーザの使用環境下において、補正フィルタの比較を容易に行えるようにすることができる。また、信号処理装置１０は、Ｈ２ユーザＭ２特性を表示させるための処理を行ってもよい。これにより、信号処理装置１０は、Ｈ２ユーザＭ２特性をユーザに視覚的に把握させることができる。また、信号処理装置１０は、端末装置３０のＵＩ上でユーザが各補正フィルタに名前をつけられるようにするための処理を行ってもよい。これにより、信号処理装置１０は、ユーザが名前をつけられるようにすることで、ユーザに補正フィルタを使い分けし易くさせることができる。この際、ＵＩ上に表示された情報の認識のし易さや操作のし易さが劣化してしまう場合がある。このため、信号処理装置１０は、ガイド音声等を用いてヘッドホン２０のＵＩ単体で同様にユーザが試聴を比較できるようにするための処理を行ってもよい。また、信号処理装置１０は、ユーザの端末装置３０、若しくは、端末装置３０が接続しているサーバで、補正フィルタ係数の推定処理が行えるようにするための処理を行ってもよい。

　続いて、周囲の環境音の誤差に対する補正フィルタを端末装置３０で管理及び操作する場合を説明する。ここでは、端末装置３０の表示画面には装着誤差を補正するためのタブと環境音の差分を補正するためのタブとが設けられて、ユーザがタブを選択することで、補正フィルタのリストを切り替える。図２９は、第１の補正フィルタのリストと第２の補正フィルタのリストとをタブで管理及び選択する場合の表示画面の一例を示す。なお、図２８と同様の説明は適宜省略する。表示画面ＨＧ２１には、ユーザが選択することで補正フィルタのリストを切り替えるタブＴＢ１１及びタブＴＢ１２が含まれる。表示画面ＨＧ２１に含まれるタブＴＢ１１又はタブＴＢ１２をユーザが選択すると、端末装置３０は、タブＴＢ１１又はタブＴＢ１２に対応する補正フィルタのリストを表示する。信号処理装置１０は、ユーザの選択を受け付けると、ユーザに選択されたタブに対応する補正フィルタのリストを切り替えるための処理を行ってもよい。これにより、ユーザは、補正フィルタの種類に応じて、別々に補正フィルタを管理及び選択することができる。また、信号処理装置１０は、第２の補正フィルタのタブの選択時には、製品のデフォルトのＮＣフィルタが対象としている環境音の音響特性と、ユーザ環境における環境音の音響特性とを表示させてもよい。これにより、ユーザは選択の参考にすることができる。

　なお、実施形態に係る端末装置３０は、スマートホン等の携帯端末に限らず、ユーザからの補正フィルタに関する操作を受け付け可能な情報処理装置であれば、どのようなものであってもよい。

（環境音が随時変化する場合の処理）
　上記実施形態では、信号処理装置１０が、ユーザの操作をトリガとして推定された補正フィルタ係数を更新する場合を示したが、この例に限られない。信号処理装置１０は、随時変化する環境音に対して推定された補正フィルタ係数を随時更新してもよい。図３０に示すように、信号処理装置１０は、補正フィルタをクロスフェードすることにより、環境音の変化に追随して補正フィルタ係数を更新してもよい。これにより、信号処理装置１０は、音途切れや違和感なく補正フィルタ係数を更新することができる。なお、信号処理装置１０は、クロスフェードに限らず、どのような処理に基づいて補正フィルタ係数を更新してもよい。

（ＮＣフィルタの推定）
　上記実施形態では、信号処理装置１０が、環境音の差分に対する補正フィルタ係数を推定する場合を示したが、ＮＣフィルタのフィルタ係数を推定してもよい。例えば、信号処理装置１０は、第１マイクで収音された収音信号と、第３マイクで収音された収音信号とに基づいて、第３マイクで収音された収音信号が最小になるようなフィルタ係数を推定してもよい。上記実施形態では、信号処理装置１０が、様々な環境音で推定された補正フィルタ係数を教師データとする場合を示したが、標準となるフィルタ係数を定めることで補正フィルタ係数を推定してもよい。

（ゲインを調整する場合の処理）
　上記実施形態では、信号処理装置１０が、補正フィルタ係数を決定し、決定した補正フィルタ係数で補正する場合を示した。ここで、信号処理装置１０は、補正フィルタ係数を決定せずに、フィルタのゲインを調整することで補正を行ってもよい。この場合には、信号処理装置１０は、Ｈ２Ｍ２特性とＨ２ユーザＭ２特性との誤差に基づいて、オフセットを加えてもよい。また、信号処理装置１０は、このオフセットを調整し、誤差の二乗和が最小になるオフセット値を算出してもよい。信号処理装置１０は、このオフセット値の最小二乗和誤差が所定の閾値よりも小さい場合には、オフセット値をゲインの調整値として補正を行ってもよい。また、信号処理装置１０は、オフセット値を基準としてユーザからの調整を受け付けてもよい。これにより、信号処理装置１０は、ユーザの主観的な好みや聞こえ具合に応じて調整することができる。また、信号処理装置１０は、オフセット値の最小二乗和誤差が所定の閾値よりも大きい場合には、補正フィルタ係数の推定を行ってもよい。

　図３１は、オフセット値の最小二乗和誤差が所定の閾値よりも小さい場合を示す。図３１（Ａ）はゲイン調整前であり、図３１（Ｂ）はゲイン調整後である。

　図３２は、オフセット値の最小二乗和誤差が所定の閾値よりも大きい場合を示す。図３２（Ａ）はゲイン調整前であり、図３２（Ｂ）はゲイン調整後である。

　図３３は、ゲインを調整する場合の処理の流れを示すフローチャートである。

（誤差の補正）
　なお、上記実施形態では、ユーザ間の個人差や装着状態に基づく誤差を補正する場合を説明したが、補正はこれらの場合に限られない。実施形態に係る補正には、例えば、ヘッドホン２０等の個体差に基づく誤差を補正する場合も含まれるものとする。

＜＜３．ハードウェア構成例＞＞
　最後に、図３４を参照しながら、実施形態に係る信号処理装置のハードウェア構成例について説明する。図３４は、実施形態に係る信号処理装置のハードウェア構成例を示すブロック図である。なお、図３４に示す信号処理装置９００は、例えば、図２５に示した信号処理装置１０及びヘッドホン２０を実現し得る。実施形態に係る信号処理装置１０及びヘッドホン２０による情報処理は、ソフトウェア（コンピュータ・プログラムにより構成される）と、以下に説明するハードウェアとの協働により実現される。

　図３４に示すように、信号処理装置９００は、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）９０１、ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）９０２、及びＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）９０３を備える。また、信号処理装置９００は、ホストバス９０４ａ、ブリッジ９０４、外部バス９０４ｂ、インタフェース９０５、入力装置９０６、出力装置９０７、ストレージ装置９０８、ドライブ９０９、接続ポート９１０、及び通信装置９１１を備える。なお、ここで示すハードウェア構成は一例であり、構成要素の一部が省略されてもよい。また、ハードウェア構成は、ここで示される構成要素以外の構成要素をさらに含んでもよい。

　ＣＰＵ９０１は、例えば、演算処理装置又は制御装置として機能し、ＲＯＭ９０２、ＲＡＭ９０３、又はストレージ装置９０８に記録された各種コンピュータ・プログラムに基づいて各構成要素の動作全般又はその一部を制御する。ＲＯＭ９０２は、ＣＰＵ９０１に読み込まれるプログラムや演算に用いるデータ等を格納する手段である。ＲＡＭ９０３には、例えば、ＣＰＵ９０１に読み込まれるプログラムや、そのプログラムを実行する際に適宜変化する各種パラメータ等のデータ（プログラムの一部）が一時的又は永続的に格納される。これらはＣＰＵバスなどから構成されるホストバス９０４ａにより相互に接続されている。ＣＰＵ９０１、ＲＯＭ９０２およびＲＡＭ９０３は、例えば、ソフトウェアとの協働により、図２５を参照して説明した制御部１１０及び制御部２１０の機能を実現し得る。

　ＣＰＵ９０１、ＲＯＭ９０２、及びＲＡＭ９０３は、例えば、高速なデータ伝送が可能なホストバス９０４ａを介して相互に接続される。一方、ホストバス９０４ａは、例えば、ブリッジ９０４を介して比較的データ伝送速度が低速な外部バス９０４ｂに接続される。また、外部バス９０４ｂは、インタフェース９０５を介して種々の構成要素と接続される。

　入力装置９０６は、例えば、マウス、キーボード、タッチパネル、ボタン、マイクロホン、スイッチ及びレバー等、リスナによって情報が入力される装置によって実現される。また、入力装置９０６は、例えば、赤外線やその他の電波を利用したリモートコントロール装置であってもよいし、信号処理装置９００の操作に対応した携帯電話やＰＤＡ等の外部接続機器であってもよい。さらに、入力装置９０６は、例えば、上記の入力手段を用いて入力された情報に基づいて入力信号を生成し、ＣＰＵ９０１に出力する入力制御回路などを含んでいてもよい。信号処理装置９００の管理者は、この入力装置９０６を操作することにより、信号処理装置９００に対して各種のデータを入力したり処理動作を指示したりすることができる。

　他にも、入力装置９０６は、ユーザの位置を検知する装置により形成され得る。例えば、入力装置９０６は、画像センサ（例えば、カメラ）、深度センサ（例えば、ステレオカメラ）、加速度センサ、ジャイロセンサ、地磁気センサ、光センサ、音センサ、測距センサ（例えば、ＴｏＦ（Ｔｉｍｅ　ｏｆ　Ｆｌｉｇｈｔ）センサ）、力センサ等の各種のセンサを含み得る。また、入力装置９０６は、信号処理装置９００の姿勢、移動速度等、信号処理装置９００自身の状態に関する情報や、信号処理装置９００の周辺の明るさや騒音等、信号処理装置９００の周辺空間に関する情報を取得してもよい。また、入力装置９０６は、ＧＮＳＳ（Ｇｌｏｂａｌ　Ｎａｖｉｇａｔｉｏｎ　Ｓａｔｅｌｌｉｔｅ　Ｓｙｓｔｅｍ）衛星からのＧＮＳＳ信号（例えば、ＧＰＳ（Ｇｌｏｂａｌ　Ｐｏｓｉｔｉｏｎｉｎｇ　Ｓｙｓｔｅｍ）衛星からのＧＰＳ信号）を受信して装置の緯度、経度及び高度を含む位置情報を測定するＧＮＳＳモジュールを含んでもよい。また、位置情報に関しては、入力装置９０６は、Ｗｉ－Ｆｉ（登録商標）、携帯電話・ＰＨＳ・スマートホン等との送受信、または近距離通信等により位置を検知するものであってもよい。入力装置９０６は、例えば、図２５を参照して説明した取得部１１１の機能を実現し得る。

　出力装置９０７は、取得した情報をユーザに対して視覚的又は聴覚的に通知することが可能な装置で形成される。このような装置として、ＣＲＴディスプレイ装置、液晶ディスプレイ装置、プラズマディスプレイ装置、ＥＬディスプレイ装置、レーザープロジェクタ、ＬＥＤプロジェクタ及びランプ等の表示装置や、スピーカ及びヘッドホン等の音響出力装置や、プリンタ装置等がある。出力装置９０７は、例えば、信号処理装置９００が行った各種処理により得られた結果を出力する。具体的には、表示装置は、信号処理装置９００が行った各種処理により得られた結果を、テキスト、イメージ、表、グラフ等、様々な形式で視覚的に表示する。他方、音声出力装置は、再生された音声データや音響データ等からなるオーディオ信号をアナログ信号に変換して聴覚的に出力する。出力装置９０７は、例えば、図２５を参照して説明した出力部１１３及び出力部２２０の機能を実現し得る。

　ストレージ装置９０８は、信号処理装置９００の記憶部の一例として形成されたデータ格納用の装置である。ストレージ装置９０８は、例えば、ＨＤＤ等の磁気記憶部デバイス、半導体記憶デバイス、光記憶デバイス又は光磁気記憶デバイス等により実現される。ストレージ装置９０８は、記憶媒体、記憶媒体にデータを記録する記録装置、記憶媒体からデータを読み出す読出し装置および記憶媒体に記録されたデータを削除する削除装置などを含んでもよい。このストレージ装置９０８は、ＣＰＵ９０１が実行するコンピュータ・プログラムや各種データ及び外部から取得した各種のデータ等を格納する。ストレージ装置９０８は、例えば、図２５を参照して説明した記憶部１２０の機能を実現し得る。

　ドライブ９０９は、記憶媒体用リーダライタであり、信号処理装置９００に内蔵、あるいは外付けされる。ドライブ９０９は、装着されている磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリ等のリムーバブル記憶媒体に記録されている情報を読み出して、ＲＡＭ９０３に出力する。また、ドライブ９０９は、リムーバブル記憶媒体に情報を書き込むこともできる。

　接続ポート９１０は、例えば、ＵＳＢ（Ｕｎｉｖｅｒｓａｌ　Ｓｅｒｉａｌ　Ｂｕｓ）ポート、ＩＥＥＥ１３９４ポート、ＳＣＳＩ（Ｓｍａｌｌ　Ｃｏｍｐｕｔｅｒ　Ｓｙｓｔｅｍ　Ｉｎｔｅｒｆａｃｅ）、ＲＳ－２３２Ｃポート、又は光オーディオ端子等のような外部接続機器を接続するためのポートである。

　通信装置９１１は、例えば、ネットワーク９２０に接続するための通信デバイス等で形成された通信インタフェースである。通信装置９１１は、例えば、有線若しくは無線ＬＡＮ（Ｌｏｃａｌ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）、ＬＴＥ（Ｌｏｎｇ　Ｔｅｒｍ　Ｅｖｏｌｕｔｉｏｎ）、Ｂｌｕｅｔｏｏｔｈ（登録商標）又はＷＵＳＢ（Ｗｉｒｅｌｅｓｓ　ＵＳＢ）用の通信カード等である。また、通信装置９１１は、光通信用のルータ、ＡＤＳＬ（Ａｓｙｍｍｅｔｒｉｃ　Ｄｉｇｉｔａｌ　Ｓｕｂｓｃｒｉｂｅｒ　Ｌｉｎｅ）用のルータ又は各種通信用のモデム等であってもよい。この通信装置９１１は、例えば、インターネットや他の通信機器との間で、例えばＴＣＰ／ＩＰ等の所定のプロトコルに則して信号等を送受信することができる。通信装置９１１は、例えば、図２５を参照して説明した通信部１００及び通信部２００の機能を実現し得る。

　なお、ネットワーク９２０は、ネットワーク９２０に接続されている装置から送信される情報の有線、または無線の伝送路である。例えば、ネットワーク９２０は、インターネット、電話回線網、衛星通信網などの公衆回線網や、Ｅｔｈｅｒｎｅｔ（登録商標）を含む各種のＬＡＮ（Ｌｏｃａｌ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）、ＷＡＮ（Ｗｉｄｅ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）などを含んでもよい。また、ネットワーク９２０は、ＩＰ－ＶＰＮ（Ｉｎｔｅｒｎｅｔ　Ｐｒｏｔｏｃｏｌ－Ｖｉｒｔｕａｌ　Ｐｒｉｖａｔｅ　Ｎｅｔｗｏｒｋ）などの専用回線網を含んでもよい。

　以上、実施形態に係る信号処理装置９００の機能を実現可能なハードウェア構成の一例を示した。上記の各構成要素は、汎用的な部材を用いて実現されていてもよいし、各構成要素の機能に特化したハードウェアにより実現されていてもよい。従って、実施形態を実施する時々の技術レベルに応じて、適宜、利用するハードウェア構成を変更することが可能である。

＜＜４．まとめ＞＞
　以上説明したように、実施形態に係る信号処理装置１０は、外界から分離されたユーザの耳内の音響特性に基づいて補正フィルタ係数を決定する処理を行う。また、信号処理装置１０は、ユーザの耳内へ漏れ込んだ環境音とは逆位相の音データを補正フィルタを用いて補正する処理を行う。これにより、信号処理装置１０は、例えば、製品上搭載することが困難な鼓膜位置の音響信号を必要とすることなく、最適化用の補正フィルタ係数を決定することができる。また、信号処理装置１０は、補正フィルタを用いて補正することで、ＮＣ効果の向上を促進することができる。

　よって、更なるユーザビリティの向上を促進することが可能な、新規かつ改良された信号処理装置、信号処理方法及び信号処理用モデル製造方法及び音響出力機器を提供することが可能である。

　以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。

　例えば、本明細書において説明した各装置は、単独の装置として実現されてもよく、一部または全部が別々の装置として実現されても良い。例えば、図２５に示した信号処理装置１０及びヘッドホン２０は、それぞれ単独の装置として実現されてもよい。また、例えば、信号処理装置１０及びヘッドホン２０とネットワーク等で接続されたサーバ装置として実現されてもよい。また、信号処理装置１０が有する制御部１１０の機能をネットワーク等で接続されたサーバ装置が有する構成であってもよい。

　また、本明細書において説明した各装置による一連の処理は、ソフトウェア、ハードウェア、及びソフトウェアとハードウェアとの組合せのいずれを用いて実現されてもよい。ソフトウェアを構成するコンピュータ・プログラムは、例えば、各装置の内部又は外部に設けられる記録媒体（非一時的な媒体：ｎｏｎ－ｔｒａｎｓｉｔｏｒｙ　ｍｅｄｉａ）に予め格納される。そして、各プログラムは、例えば、コンピュータによる実行時にＲＡＭに読み込まれ、ＣＰＵなどのプロセッサにより実行される。

　また、本明細書においてフローチャートを用いて説明した処理は、必ずしも図示された順序で実行されなくてもよい。いくつかの処理ステップは、並列的に実行されてもよい。また、追加的な処理ステップが採用されてもよく、一部の処理ステップが省略されてもよい。

　また、本明細書に記載された効果は、あくまで説明的または例示的なものであって限定的ではない。つまり、本開示に係る技術は、上記の効果とともに、または上記の効果に代えて、本明細書の記載から当業者には明らかな他の効果を奏しうる。

　なお、以下のような構成も本開示の技術的範囲に属する。
（１）
　外界から分離されたユーザの耳内の音響特性を取得する取得部と、
　前記ユーザの耳内へ漏れ込んだ環境音とは逆位相の音データを生成するＮＣフィルタ部と、
　前記音データを補正フィルタを用いて補正する補正部と、
　前記補正フィルタのフィルタ係数を前記音響特性に基づいて決定する決定部と、
　を備える、信号処理装置。
（２）
　前記取得部は、
　前記耳内に出力された測定音を収音した収音信号に基づく前記音響特性を取得する
　前記（１）に記載の信号処理装置。
（３）
　前記決定部は、
　音響特性を入力とし、フィルタ係数を出力とする学習済モデルを用いて、前記フィルタ係数を決定する
　前記（１）又は（２）に記載の信号処理装置。
（４）
　前記決定部は、
　ユーザの鼓膜位置において推定される音響特性を教師データとして学習した前記学習済モデルを用いて、前記フィルタ係数を決定する
　前記（３）に記載の信号処理装置。
（５）
　前記決定部は、
　音響特性と音データとを入力とし、当該音データを補正するか否かを出力とする学習済モデルを用いて、前記フィルタ係数を決定する
　前記（１）～（４）のいずれか一つに記載の信号処理装置。
（６）
　前記決定部は、
　音響特性と音データとに基づいて推定される騒音抑制率に基づいて補正するか否かをラベル付した付与情報を教師データとして学習した前記学習済モデルを用いて、前記フィルタ係数を決定する
　前記（５）に記載の信号処理装置。
（７）
　前記決定部は、
　音響特性と予め測定された音響特性及び音データとを入力とし、騒音抑制率を出力とする学習済モデルを用いて、前記フィルタ係数を決定する
　前記（１）～（６）のいずれか一つに記載の信号処理装置。
（８）
　前記決定部は、
　ユーザの鼓膜位置において推定される音響特性と音データとに基づく騒音抑制率を教師データとして学習した前記学習済モデルを用いて、前記フィルタ係数を決定する
　前記（７）に記載の信号処理装置。
（９）
　前記決定部は、
　前記音響特性を測定したマイクとは異なるマイクで収音された収音信号と音データとを入力とし、ユーザ環境における環境音に基づくフィルタ係数の差分を補正する補正フィルタ係数を出力とする学習済モデルを用いて、前記フィルタ係数を決定する
　前記（１）～（８）のいずれか一つに記載の信号処理装置。
（１０）
　前記決定部は、
　ユーザの鼓膜位置において推定される音響特性に基づくフィルタ係数の差分を補正するフィルタ係数を教師データとして学習した前記学習済モデルを用いて、前記フィルタ係数を決定する
　前記（９）に記載の信号処理装置。
（１１）
　前記決定部は、
　音響特性と音データとを入力とし、ＮＣ効果量を出力とする学習済モデルを用いて、前記フィルタ係数を決定する
　前記（１）～（１０）のいずれか一つに記載の信号処理装置。
（１２）
　前記決定部は、
　ユーザの鼓膜位置において推定される音響特性に基づく効果量を教師データとして学習した前記学習済モデルを用いて、前記フィルタ係数を決定する
　前記（１１）に記載の信号処理装置。
（１３）
　前記決定部は、
　所定の規格で定められた環境におけるＮＣ効果量と音データとユーザ環境における環境音の音響特性とを入力とし、当該ユーザ環境におけるＮＣ効果量を出力とする学習済モデルを用いて、前記フィルタ係数を決定する
　前記（１）～（１２）のいずれか一つに記載の信号処理装置。
（１４）
　前記決定部は、
　音データとフィルタ係数とユーザ環境における環境音の音響特性とに基づくＮＣ効果量を教師データとして学習した前記学習済モデルを用いて、前記フィルタ係数を決定する
　前記（１３）に記載の信号処理装置。
（１５）
　コンピュータが実行する信号処理方法であって、
　外界から分離されたユーザの耳内の音響特性を取得する取得工程と、
　前記ユーザの耳内へ漏れ込んだ環境音とは逆位相の音データを生成するＮＣフィルタ工程と、
　前記音データを補正フィルタを用いて補正する補正工程と、
　前記補正フィルタのフィルタ係数を前記音響特性に基づいて決定する決定工程と、
　を含む信号処理方法。
（１６）
　外界から分離されたユーザの耳内の音響特性を取得する取得手順と、
　前記ユーザの耳内へ漏れ込んだ環境音とは逆位相の音データを生成するＮＣフィルタ手順と、
　前記音データを補正フィルタを用いて補正する補正手順と、
　前記補正フィルタのフィルタ係数を前記音響特性に基づいて決定する決定手順と、
　をコンピュータに実行させる信号処理プログラム。
（１７）
　マイクで収音された収音信号に基づく音響特性に基づいてフィルタ係数を補正するか否かを決定するとともに、最適なノイズキャンセリングを行うためのフィルタ係数を決定し、決定したフィルタ係数に基づいてノイズキャンセリングの信号を生成するために、予めマイクで収音された収音信号に基づく音響特性と、最適なノイズキャンセリングを行うための補正フィルタ係数とを入力として学習することにより、最適なノイズキャンセリングを行うためのモデルを製造する信号処理用モデル製造方法。
（１８）
　信号処理装置から提供された信号に基づいてノイズキャンセリングされた音を出力する出力部、を備える音響出力機器であって、当該信号処理装置が、当該音響出力機器のマイクで収音された収音信号に基づく音響特性に基づいて、最適なノイズキャンセリングを行うためのフィルタ係数を決定し、決定したフィルタ係数に基づいて生成した信号を提供することを特徴とする、音響出力機器。

　１　信号処理システム
　１０　信号処理装置
　２０　ヘッドホン
　３０　端末装置
　１００　通信部
　１１０　制御部
　１１１　取得部
　１１２　処理部
　１１２１　決定部
　１１２２　ＮＣフィルタ部
　１１２３　補正部
　１１２４　生成部
　１１２５　判定部
　１１３　出力部
　２００　通信部
　２１０　制御部
　２２０　出力部

Claims

　外界から分離されたユーザの耳内の音響特性を取得する取得部と、
　前記ユーザの耳内へ漏れ込んだ環境音とは逆位相の音データを生成するＮＣフィルタ部と、
　前記音データを補正フィルタを用いて補正する補正部と、
　前記補正フィルタのフィルタ係数を前記音響特性に基づいて決定する決定部と、
　を備える、信号処理装置。
　前記取得部は、
　前記耳内に出力された測定音を収音した収音信号に基づく前記音響特性を取得する
　請求項１に記載の信号処理装置。
　前記決定部は、
　音響特性を入力とし、フィルタ係数を出力とする学習済モデルを用いて、前記フィルタ係数を決定する
　請求項１に記載の信号処理装置。
　前記決定部は、
　ユーザの鼓膜位置において推定される音響特性を教師データとして学習した前記学習済モデルを用いて、前記フィルタ係数を決定する
　請求項３に記載の信号処理装置。
　前記決定部は、
　音響特性と音データとを入力とし、当該音データを補正するか否かを出力とする学習済モデルを用いて、前記フィルタ係数を決定する
　請求項１に記載の信号処理装置。
　前記決定部は、
　音響特性と音データとに基づいて推定される騒音抑制率に基づいて補正するか否かをラベル付した付与情報を教師データとして学習した前記学習済モデルを用いて、前記フィルタ係数を決定する
　請求項５に記載の信号処理装置。
　前記決定部は、
　音響特性と予め測定された音響特性及び音データとを入力とし、騒音抑制率を出力とする学習済モデルを用いて、前記フィルタ係数を決定する
　請求項１に記載の信号処理装置。
　前記決定部は、
　ユーザの鼓膜位置において推定される音響特性と音データとに基づく騒音抑制率を教師データとして学習した前記学習済モデルを用いて、前記フィルタ係数を決定する
　請求項７に記載の信号処理装置。
　前記決定部は、
　前記音響特性を測定したマイクとは異なるマイクで収音された収音信号と音データとを入力とし、ユーザ環境における環境音に基づくフィルタ係数の差分を補正する補正フィルタ係数を出力とする学習済モデルを用いて、前記フィルタ係数を決定する
　請求項１に記載の信号処理装置。
　前記決定部は、
　ユーザの鼓膜位置において推定される音響特性に基づくフィルタ係数の差分を補正するフィルタ係数を教師データとして学習した前記学習済モデルを用いて、前記フィルタ係数を決定する
　請求項９に記載の信号処理装置。
　前記決定部は、
　音響特性と音データとを入力とし、ＮＣ効果量を出力とする学習済モデルを用いて、前記フィルタ係数を決定する
　請求項１に記載の信号処理装置。
　前記決定部は、
　ユーザの鼓膜位置において推定される音響特性に基づく効果量を教師データとして学習した前記学習済モデルを用いて、前記フィルタ係数を決定する
　請求項１１に記載の信号処理装置。
　前記決定部は、
　所定の規格で定められた環境におけるＮＣ効果量と音データとユーザ環境における環境音の音響特性とを入力とし、当該ユーザ環境におけるＮＣ効果量を出力とする学習済モデルを用いて、前記フィルタ係数を決定する
　請求項１に記載の信号処理装置。
　前記決定部は、
　音データとフィルタ係数とユーザ環境における環境音の音響特性とに基づくＮＣ効果量を教師データとして学習した前記学習済モデルを用いて、前記フィルタ係数を決定する
　請求項１３に記載の信号処理装置。
　コンピュータが実行する信号処理方法であって、
　外界から分離されたユーザの耳内の音響特性を取得する取得工程と、
　前記ユーザの耳内へ漏れ込んだ環境音とは逆位相の音データを生成するＮＣフィルタ工程と、
　前記音データを補正フィルタを用いて補正する補正工程と、
　前記補正フィルタのフィルタ係数を前記音響特性に基づいて決定する決定工程と、
　を含む信号処理方法。
　外界から分離されたユーザの耳内の音響特性を取得する取得手順と、
　前記ユーザの耳内へ漏れ込んだ環境音とは逆位相の音データを生成するＮＣフィルタ手順と、
　前記音データを補正フィルタを用いて補正する補正手順と、
　前記補正フィルタのフィルタ係数を前記音響特性に基づいて決定する決定手順と、
　をコンピュータに実行させる信号処理プログラム。
　マイクで収音された収音信号に基づく音響特性に基づいてフィルタ係数を補正するか否かを決定するとともに、最適なノイズキャンセリングを行うためのフィルタ係数を決定し、決定したフィルタ係数に基づいてノイズキャンセリングの信号を生成するために、予めマイクで収音された収音信号に基づく音響特性と、最適なノイズキャンセリングを行うための補正フィルタ係数とを入力として学習することにより、最適なノイズキャンセリングを行うためのモデルを製造する信号処理用モデル製造方法。
　信号処理装置から提供された信号に基づいてノイズキャンセリングされた音を出力する出力部、を備える音響出力機器であって、当該信号処理装置が、当該音響出力機器のマイクで収音された収音信号に基づく音響特性に基づいて、最適なノイズキャンセリングを行うためのフィルタ係数を決定し、決定したフィルタ係数に基づいて生成した信号を提供することを特徴とする、音響出力機器。