JP6890867B1

JP6890867B1 - 評価プログラム、及び評価システム

Info

Publication number: JP6890867B1
Application number: JP2021004238A
Authority: JP
Inventors: 継河合
Original assignee: クリスタルメソッド株式会社
Priority date: 2021-01-14
Filing date: 2021-01-14
Publication date: 2021-06-18
Anticipated expiration: 2041-01-14
Also published as: JP2022108980A

Abstract

【課題】環境が変化した場合においても、ノイズデータから抽出した評価用音データを高精度に評価できる評価プログラム及び評価システムを提供する。【解決手段】目的信号音及び周辺環境音に基づくノイズデータの評価を支援する評価プログラムであって、ノイズデータを取得する取得ステップと、取得ステップにより取得したノイズデータから評価用音データを抽出する抽出ステップと、予め取得された参照用音データと、参照用音データに対する評価を示す参照用評価結果とを一対のデータセットとする評価用学習データを複数用いて、機械学習により生成された判定モデルを参照して、評価用音データに対する評価結果を生成する判定ステップとを、コンピュータに実行させる。【選択図】図１１

Description

本発明は、評価プログラム、及び評価システムに関する。

近年の音響処理技術の進展に伴い、コネクタ嵌合時等に発生するコネクタ音等の目的信号音を捉えて検知する自動監視システム技術が注目を集めている。これらの機能を実現する装置は屋外や工場などの周辺環境音を含む環境下で用いられることが多い。このため、目的信号音の入力のときに、目的信号音及び周辺環境音に基づくノイズデータが入力されてしまい異常音検出率の低下などを招く。このため、高精度の異常音検出を実現するには、ノイズデータに混入した周辺環境音を排除し、目的信号音のみを抽出する装置が必要であり、例えば特許文献１の音響信号強調装置が知られている。

特許文献１では、目的信号と雑音が混入した入力信号から、目的信号または雑音の特徴を重み付けした信号を出力し、結合係数を用いて目的信号の強調を行った強調信号を出力し、強調信号から目的信号または雑音の特徴の重み付けを解除する。また、特許文献１では、強調信号から目的信号または雑音の特徴の重み付けを解除し、ニューラルネットワークの学習を行うための教師信号に対して目的信号または雑音の特徴を重み付けした信号を出力し、重み付けされた信号と、出力信号との学習誤差が設定値以下の値となる結合係数を出力する。これにより、特許文献１では、学習データが少ない状況においても高品質な音響信号の強調信号を得ることができる音響信号強調装置に関する技術が開示されている。

国際公開番号ＷＯ２０１７／１４１３１７号公報

一方、工場等の周辺環境音は、現場や作業内容等によって変化する。例えば、周辺の機械の種類や性能、又は周辺の環境が異なると、周辺環境音は変化する。ここで、特許文献１では、ノイズデータから目的信号音を抽出するために、上記の環境下に合わせた学習データを取得する必要がある。このため、特許文献１では、環境が変化した場合、ノイズデータから抽出した評価用音データを評価する際、目的信号音と合致する精度が低くなり得る。このため、環境が変化した場合においても、評価用音データを高精度に評価することが求められている。

そこで本発明は、上述した問題に鑑みて案出されたものであり、その目的とするところは、環境が変化した場合においても、ノイズデータから抽出した評価用音データを高精度に評価できる評価プログラム、及び評価システムを提供することにある。

第１発明に係る評価プログラムは、目的信号音と周辺環境音とが混入した音に基づくノイズデータの評価を支援する評価プログラムであって、前記ノイズデータを取得する取得ステップと、前記取得ステップにより取得したノイズデータから、前記ノイズデータに含まれる前記目的信号音を抽出するために前記ノイズデータから抽出される評価用音データを抽出する抽出ステップと、予め取得された参照用音データと前記参照用音データに対する評価を示す参照用評価結果とを一対のデータセットとする評価用学習データを複数用いて、機械学習により生成された判定モデルを参照して、前記評価用音データに対する評価結果を生成する判定ステップとをコンピュータに実行させ、前記参照用音データは、学習用目的信号音のみに基づく第１参照用音データと、前記学習用目的信号音及び前記周辺環境音に基づく第２参照用音データとを含み、前記参照用評価結果は、前記第１参照用音データに対する評価を示す参照用第１評価結果と、前記第２参照用音データに対する評価を示し、前記参照用第１評価結果と異なる参照用第２評価結果とを含み、前記データセットは、前記第１参照用音データと前記参照用第１評価結果とを一対とする第１データセット、及び前記第２参照用音データと前記参照用第２評価結果とを一対とする第２データセットを含むことを特徴とする。

第２発明に係る評価プログラムは、目的信号音と周辺環境音とが混入した音に基づくノイズデータの評価を支援する評価プログラムであって、前記ノイズデータを取得する取得ステップと、前記取得ステップにより取得したノイズデータから、前記ノイズデータに含まれる前記目的信号音を抽出するために前記ノイズデータから抽出される評価用音データを抽出する抽出ステップと、予め取得された参照用音データと前記参照用音データに対する評価を示す参照用評価結果とを一対のデータセットとする評価用学習データを複数用いて、機械学習により生成された判定モデルを参照して、前記評価用音データに対する評価結果を生成する判定ステップとをコンピュータに実行させ、前記抽出ステップは、予め取得された参照用ノイズデータと前記参照用ノイズデータに紐づく参照用評価用音データとを一対のデータセットとする抽出用学習データを複数用いて、機械学習により生成された抽出モデルを参照して、前記ノイズデータから前記評価用音データを抽出することを特徴とする。

第３発明に係る評価プログラムは、第２発明において、前記抽出モデルは、前記参照用ノイズデータと、実際に録音された目的信号音に基づく前記参照用評価用音データ、又は擬似的に生成された前記参照用評価用音データとを一対のデータセットとする抽出用学習データを用いて、機械学習により生成されることを特徴とする。

第４発明に係る評価プログラムは、第２発明又は第３発明において、前記参照用音データは、学習用目的信号音に基づく第１参照用音データと、前記学習用目的信号音とは異なる音に基づく第２参照用音データとを含み、前記参照用評価結果は、前記第１参照用音データに対する評価を示す参照用第１評価結果と、前記第２参照用音データに対する評価を示し、前記参照用第１評価結果とは異なる参照用第２評価結果とを含み、前記データセットは、前記第１参照用音データと前記参照用第１評価結果とを一対とする第１データセット、及び前記第２参照用音データと前記参照用第２評価結果とを一対とする第２データセットを含むことを特徴とする。

第５発明に係る評価プログラムは、第１発明又は第４発明において、前記判定ステップは、前記評価用音データが前記第１参照用音データと類似又は一致する場合、前記評価用音データが正常であることを示す第１評価結果を生成し、前記評価用音データが前記第２参照用音データと類似又は一致する場合、前記評価用音データが異常であることを示す第２評価結果を生成することを特徴とする。

第６発明に係る評価プログラムは、第１発明〜第５発明のいずれかにおいて、前記取得ステップは、前記目的信号音及び前記周辺環境音から生成されたスペクトログラムを示す画像データを含む前記ノイズデータを取得することを特徴とする。

第７発明に係る評価プログラムは、第１発明〜第６発明の何れかにおいて、前記目的信号音は、コネクタ音であることを特徴とする。

第８発明に係る評価システムは、目的信号音と周辺環境音とが混入した音に基づくノイズデータの評価を支援する評価システムであって、前記ノイズデータを取得する取得手段と、前記取得手段により取得したノイズデータから、前記ノイズデータに含まれる前記目的信号音を抽出するために前記ノイズデータから抽出される評価用音データを抽出する抽出手段と、予め取得された参照用音データと前記参照用音データに対する評価を示す参照用評価結果とを一対のデータセットとする評価用学習データを複数用いて、機械学習により生成された判定モデルが記憶されたデータベースと、前記判定モデルを参照して、前記評価用音データに対する評価結果を生成する判定手段を備え、前記参照用音データは、学習用目的信号音のみに基づく第１参照用音データと、前記学習用目的信号音及び前記周辺環境音に基づく第２参照用音データとを含み、前記参照用評価結果は、前記第１参照用音データに対する評価を示す参照用第１評価結果と、前記第２参照用音データに対する評価を示し、前記参照用第１評価結果と異なる参照用第２評価結果とを含み、前記データセットは、前記第１参照用音データと前記参照用第１評価結果とを一対とする第１データセット、及び前記第２参照用音データと前記参照用第２評価結果とを一対とする第２データセットを含むことを特徴とする。

第９発明に係る評価システムは、目的信号音と周辺環境音とが混入した音に基づくノイズデータの評価を支援する評価システムであって、前記ノイズデータを取得する取得手段と、前記取得手段により取得したノイズデータから、前記ノイズデータに含まれる前記目的信号音を抽出するために前記ノイズデータから抽出される評価用音データを抽出する抽出手段と、予め取得された参照用音データと前記参照用音データに対する評価を示す参照用評価結果とを一対のデータセットとする評価用学習データを複数用いて、機械学習により生成された判定モデルが記憶されたデータベースと、前記判定モデルを参照して、前記評価用音データに対する評価結果を生成する判定手段を備え、前記抽出手段は、予め取得された参照用ノイズデータと前記参照用ノイズデータに紐づく参照用評価用音データとを一対のデータセットとする抽出用学習データを複数用いて、機械学習により生成された抽出モデルを参照して、前記ノイズデータから前記評価用音データを抽出することを特徴とする。

第１発明〜第９発明によれば、予め取得された参照用音データと参照用評価結果とを一対のデータセットとする評価用学習データを用いて、機械学習により生成された判定モデルを参照して、評価用音データに対する評価結果を生成する。即ち、評価プログラムを利用する環境を踏まえた参照用音データを用意することで、評価用音データに対する適切な評価結果を生成することができる。例えば、参照用音データとして、環境の変化に依存しない参照用音データを用いることで、抽出された評価用音データが環境の変化によってバラツキが生じたときも、評価用音データの評価に生じる影響を抑制できる。このため、環境が変化した場合においても、ノイズデータから抽出した評価用音データを高精度に評価することが可能となる。

特に、第４発明によれば、参照用音データは、学習用目的信号音に基づく第１参照用音データと、学習用目的信号音とは異なる音に基づく第２参照用音データとを含み、データセットは、第１参照用音データと参照用第１評価結果とを一対とする第１データセット、及び第２参照用音データと参照用第２評価結果とを一対とする第２データセットを含む。例えば、第１参照用音データとして、抽出の対象となる学習用目的信号音に基づく第１参照用音データを用いて、第２参照用音データとして、上述した学習用目的信号音とは異なる環境の変化に伴い発生した音に基づく第２参照用音データを用いることで、抽出された評価用音データが環境の変化によってバラツキが生じたときも、評価用音データが抽出の対象となる学習用目的信号音を示すか否かを評価できる。このため、環境が変化した場合においても、ノイズデータから抽出した評価用音データをより高精度に評価できる。

特に、第１発明によれば、参照用音データは、学習用目的信号音のみに基づく第１参照用音データと、学習用目的信号音及び周辺環境音に基づく第２参照用音データとを含み、データセットは、第１参照用音データと参照用第１評価結果とを一対とする第１データセット、及び第２参照用音データと第２評価結果とを一対とする第２データセットを含む。これにより、環境の変化に伴い周辺環境音が変化した場合においても、評価用音データに周辺環境音が含まれているか否かを判定することができ、より適切な評価結果を生成することが可能となる。このため、環境が変化した場合においても、ノイズデータから抽出した評価用音データをより高精度に評価できる。

特に、第５発明によれば、判定ステップは、評価用音データが第１参照用音データと類似又は一致する場合、評価用音データが正常であることを示す第１評価結果を生成し、評価用音データが第２参照用音データと類似又は一致する場合、評価用音データが異常であることを示す第２評価結果を生成する。これにより、評価用音データが目的信号音を示す音データであるかを評価する際、評価者の主観に伴う評価のバラつきを抑制できる。このため、ノイズデータから抽出した評価用音データに対し、評価者の経験や知見等に依らず定量的な評価を実現することができる。

特に、第６発明によれば、取得ステップは、目的信号音及び周辺環境音から生成されたスペクトログラムを示す画像データを含むノイズデータを取得する。これにより、目的信号音及び周辺環境音から生成されたスペクトログラムの画像データから評価用音データを抽出することが可能となる。このため、スペクトログラムの画像データを含むノイズデータから抽出した評価用音データを高精度に評価できる。

特に、第２発明によれば、抽出ステップは、予め取得された参照用ノイズデータと参照用ノイズデータに紐づく参照用評価用音データとを一対のデータセットとする抽出用学習データを複数用いて、機械学習により生成された抽出モデルを参照して、ノイズデータから評価用音データを抽出する。これにより、ノイズデータから評価用音データを高精度に抽出し、評価することができる。このため、ノイズデータから抽出した評価用音データをより高精度に評価できる。

特に、第３発明によれば、抽出モデルは、参照用ノイズデータと、実際に録音された目的信号音に基づく参照用評価用音データ、又は擬似的に生成された参照用評価用音データとを一対のデータセットとする抽出用学習データを用いて、機械学習により生成される。これにより、実際に録音された目的信号音に基づく評価用音データや擬似的に生成された評価用音データを学習データとすることが可能となり、想定される環境に適した学習データを容易に取得することができる。このため、環境が変化した場合においても、ノイズデータから抽出した評価用音データをより高精度に評価できる。

図１は、実施形態における評価システムの一例を示す模式図である。図２は、実施形態における評価システムの動作の一例を示す模式図である。図３（ａ）は、音データの一例を示す模式図であり、図３（ｂ）は、スペクトログラムの一例を示す模式図である。図４（ａ）は、抽出モデルの学習方法の一例を示す模式図であり、図４（ｂ）は、判定モデルの学習方法の一例を示す模式図である。図５は、第１データセット及び第２データセットを用いた判定モデルの学習方法の一例を示す模式図である。図６は、抽出モデルの一例を示す模式図である。図７は、判定モデルの一例を示す模式図である。図８は、第１データセット及び第２データセットを用いた判定モデルの一例を示す模式図である。図９（ａ）は、実施形態における評価装置の構成の一例を示す模式図であり、図９（ｂ）は、実施形態における評価装置の機能の一例を示す模式図であり、図９（ｃ）は、ＤＢ生成部の一例を示す模式図である。図１０は、処理部の一例を示す模式図である。図１１は、実施形態における評価システムの動作の一例を示すフローチャートである。

以下、本発明を適用した実施形態における評価プログラム、及び評価システムの一例について、図面を参照しながら説明する。

図を用いて、本実施形態における評価システム１００、及び評価装置１の一例について説明する。図１は、本実施形態における評価システム１００の一例を示す模式図である。図２は、本実施形態における評価システム１００の動作の一例を示す模式図である。図４、図５は、本実施形態における学習方法の一例を示す模式図である。

＜評価システム１００＞
評価システム１００は、目的信号音及び周辺環境音に基づくノイズデータを取得し、取得したノイズデータの評価を支援するために用いられる。

目的信号音は、ノイズデータから抽出する対象となる音である。目的信号音は、例えばコネクタ音等のような工場において評価すべき特定の音、会議や通話等で発生する音声、テレビ等の電子機器から発生する音、音楽の中の特定の楽器から発生する音等がある。以下、目的信号音としての一例として、コネクタ音を用いた場合について説明する。

評価システム１００は、ノイズデータから評価用音データを抽出し、例えば学習データを用いた機械学習により生成されたデータベースを参照し、評価用音データに対する評価結果を生成することで、評価用音データを評価する。

評価システム１００は、例えば図１に示すように、評価装置１を備える。評価システム１００は、例えば端末２及びサーバ３の少なくとも何れかを備えてもよい。評価装置１は、例えば通信網４を介して端末２やサーバ３と接続される。

評価システム１００では、例えば図２に示すように、評価装置１は、ノイズデータを取得する。その後、評価装置１は、例えば抽出モデルを参照して、ノイズデータから評価用音データを抽出する。その後、評価装置１は、判定モデルを参照して、評価用音データに対する評価結果を生成する。これにより、評価システム１００では、ノイズデータから抽出した評価用音データを評価できる。

抽出モデルは、入力されたノイズデータから、評価用音データを出力するモデルである。抽出モデルは、例えば機械学習により、生成されてもよい。抽出モデルは、例えば一組の予め取得された参照用ノイズデータと、参照用評価用音データとを学習データ（抽出用学習データ）として用いて、生成される。抽出モデルは、複数の抽出用学習データを用いた機械学習により構築された学習済みモデルが用いられてもよい。なお、抽出モデルは、ノイズデータから評価用音データを抽出し得る手段であれば、例えばＰＬＳ分析等の公知の技術を用いてもよい。

判定モデルは、機械学習により生成される。判定モデルとして、例えば参照用音データを入力データとし、参照用音データに対する評価を示す参照用評価結果を出力データとして、入力データと出力データとを一組の学習データ（評価用学習データ）として用いて、生成される。判定モデルは、複数の評価用学習データを用いた機械学習により構築された、評価用音データから評価結果を生成するための学習済みモデルが用いられる。

ノイズデータは、例えば評価システム１００によって出力される評価用音データを抽出するために用いられる。ノイズデータは、例えば図示しないマイク等の収音装置により収集された音に基づき生成される。ノイズデータは、コネクタ音及び周辺環境音に基づくデータである。ノイズデータとして、例えば後述する音データと同じデータ形式が用いられる。また、ノイズデータは、コネクタ音及び周辺環境音から生成されたスペクトログラムの画像データを含んでもよい。

音データは、音を符号化したものである。音の符号化には例えば、量子化ビット数とサンプリング周波数と時間とで定まる長さのビット列として表されるパルス符号変調（ＰＣＭ）方式に基づくものと、音の波の疎密を１ｂｉｔで表現して一定の間隔で標本化するパルス密度変調（ＰＤＭ）方式に基づくものなどがある。また、音データは、例えば図３（ａ）に示すように、時間軸に対する振幅で示される。また、音データは、音から生成されたスペクトログラムの画像データを含んでいてもよい。

スペクトログラムは、例えば図３（ｂ）に示すように、時間軸及び周波数軸に対する強度（振幅）で示され、例えばフーリエ変換（例えば短時間フーリエ変換）を用いて音データから変換される。スペクトログラムは、画像データとして用いられ、例えば１ピクセル×１ピクセルは、０．０６４ｓｅｃ×１５．６２４Ｈｚの範囲に対応する。

評価用音データ、参照用評価用音データ及び参照用音データとして、例えば上述した音データのデータ形式が用いられる。評価用音データは、評価装置１によりノイズデータから抽出される。評価用音データは、ノイズデータに含まれるコネクタ音の特徴を示す。評価用音データは、評価装置１により、例えば判定モデルを参照し、評価結果を生成するために用いられる。

参照用評価用音データは、抽出モデルを機械学習により生成する際、抽出用学習データとして用いられる。参照用評価用音データは、コネクタ音の特徴を示す。参照用評価用音データとして、例えば予め取得された評価用音データが用いられる。参照用評価用音データは、例えば実際に録音されたコネクタ音に基づく音データと、擬似的に生成された音データとの少なくとも何れかであってもよい。

参照用音データは、判定モデルを機械学習により生成する際、評価用学習データとして用いられる。参照用音データは、評価対象となるコネクタ音の特徴、及び環境音の特徴の少なくとも何れかを示す。参照用音データは、例えば予め取得された学習用コネクタ音に基づく音データが用いられる。参照用音データは、例えば学習用コネクタ音とは異なる音に基づく音データであってもよい。また、参照用音データは、学習用コネクタ音及び周辺環境音に基づく音データであってもよい。

参照用音データ及び参照用評価用音データは、例えばＧＡＮ（Generative Adversarial Network）やオートエンコーダをモデルとした機械学習を用いて、生成された生成用データベース、特に、ＣｏｎｄｉｔｉｏｎａｌＧＡＮの一種であるｐｉｘ２ｐｉｘをモデルとした機械学習を用いて、生成された生成用データベースを用いて擬似的に生成されてもよい。

参照用音データは、例えば第１参照用音データと、第１参照用音データとは異なる第２参照用音データとを含む。また、参照用音データは、例えば第３、第４参照用音データのように、それぞれ異なる３種類以上の音データを含んでもよい。

コネクタ音は、コネクタ嵌合時に発生する音である。また、学習用コネクタ音は、学習データの取得の際に用いられるコネクタ音である。学習用コネクタ音は、例えば目的のコネクタ音と同じ特徴を含むコネクタ音である。

周辺環境音は、例えば工場内における装置の稼働音、空調音、人の発話等の音声等の雑音である。

評価結果は、例えば評価用音データに対する評価を示すデータである。評価結果は、例えば評価用音データが、目的のコネクタ音の特徴を示す音データであるかどうか、又は目的のコネクタ音の特徴を示す音データとの類似度を示すデータである。評価結果として、例えば評価用音データが目的のコネクタ音の特徴を示す音データであり、正常であることを示す「ＯＫ」、及び、評価用音データが目的のコネクタ音の特徴を示す音データとは異なり、異常であることを示す「ＮＧ」の２種類が用いられてもよい。評価結果は、例えば百分率等の３段階以上の連関度で示してもよい。また、評価結果は、例えば評価用音データに周辺環境音が含まれているかどうかを示すデータであってもよい。

参照用評価結果は、判定モデルを機械学習により生成する際、評価用学習データとして用いられる。参照用評価結果は、例えば第１評価結果と、第２評価結果とを含む。第１評価結果は、第１参照用音データに対する評価を示す。第２評価結果は、第２参照用音データに対する評価を示し、第１評価結果とは異なるデータを示す。また、参照用評価結果は、例えば第３、第４参照用音データのように、３種類以上の評価結果を含んでもよい。

＜学習方法＞
本実施形態における学習方法は、入力されたノイズデータから評価用音データを抽出するために用いられる抽出モデル、及び評価用音データに対する評価結果を生成するために用いられる判定モデルを生成する際に用いられる。

学習方法は、例えば図４（ａ）に示すように、抽出モデルを生成する。学習方法は、参照用ノイズデータを第１入力データとし、参照用評価用音データを第１出力データとして、第１入力データと第１出力データとを一対のデータセットとする抽出用学習データを取得する。学習方法は、複数の抽出用学習データを用いた機械学習により、ノイズデータから評価用音データを抽出するための抽出モデルを生成する。

また、学習方法は、例えば図４（ｂ）に示すように、判定モデルを生成する。学習方法は、参照用音データを第２入力データとし、参照用評価結果を第２出力データとして、第２入力データと第２出力データとを一対のデータセットとする評価用学習データを取得する。学習方法は、複数の評価用学習データを用いた機械学習により、評価用音データから評価結果を生成するための判定モデルを生成する。

また、判定モデルの学習方法は、例えば図５に示すように、第１参照用音データと参照用第１評価結果とを一対の第１データセットとする。判定モデルの学習方法は、第２参照用音データと参照用第２評価結果とを一対の第２データセットとする。判定モデルの学習方法は、上述した第１データセット及び第２データセットを含むデータセットを用いた機械学習により、評価用音データから評価結果を生成するための判定モデルを生成してもよい。

学習方法では、例えばニューラルネットワークをモデルとした機械学習を用いて、上述したデータベースを生成する。上述したデータベースは、例えばＣＮＮ（Convolution Neural Network）等のニューラルネットワークをモデルとした機械学習を用いて生成されるほか、任意のモデルが用いられてもよい。

抽出モデルには、例えば参照用ノイズデータ（第１入力データ）と参照用評価用音データ（第１出力データ）との間における連関度を有する第１連関性が記憶される。連関度は、第１入力データと第１出力データとの繋がりの度合いを示しており、例えば連関度が高いほど各データの繋がりが強いと判断することができる。連関度は、例えば百分率等の３値以上（３段階以上）で示されるほか、２値（２段階）で示されてもよい。

例えば第１連関性は、多対多の情報（複数の第１入力データ、対、複数の第１出力データ）の間における繋がりの度合いにより構築される。第１連関性は、機械学習の過程で適宜更新され、例えば複数の第１入力データ、及び複数の第１出力データに基づいて最適化された関数（分類器）を示す。なお、第１連関性は、例えば各データの間における繋がりの度合いを示す複数の連関度を有してもよい。連関度は、例えばデータベースがニューラルネットワークで構築される場合、重み変数に対応させることができる。

このため、評価システム１００では、例えば分類器の判定した結果を全て踏まえた第１連関性を用いて、ノイズデータに適した評価用音データを選択する。これにより、ノイズデータが、参照用ノイズデータと同一又は類似である場合のほか、非類似である場合においても、ノイズデータに適した評価用音データを定量的に選択することができる。

第１連関性は、例えば図６に示すように、複数の第１出力データと、複数の第１入力データとの間における繋がりの度合いを示してもよい。この場合、第１連関性を用いることで、複数の第１出力データ（図６では「参照用評価用音データＡ」〜「参照用評価用音データＣ」）のそれぞれに対し、複数の第１入力データ（図６では「参照用ノイズデータＡ」〜「参照用ノイズデータＣ」）の関係の度合いを紐づけて記憶させることができる。このため、例えば第１連関性を介して、１つの第１出力データに対して、複数の第１入力データを紐づけることができる。これにより、ノイズデータに対して多角的な評価用音データの選択を実現することができる。

第１連関性は、例えば各第１出力データと、各第１入力データとをそれぞれ紐づける複数の連関度を有する。連関度は、例えば百分率、１０段階、又は５段階等の３段階以上で示され、例えば線の特徴（例えば太さ等）で示される。例えば、第１入力データに含まれる「参照用ノイズデータＡ」は、第１出力データに含まれる「参照用評価用音データＡ」との間の連関度ＡＡ「７３％」を示し、第１出力データに含まれる「参照用評価用音データＢ」との間の連関度ＡＢ「１２％」を示す。すなわち、「連関度」は、各データ間における繋がりの度合いを示しており、例えば連関度が高いほど、各データの繋がりが強いことを示す。

また、抽出モデルは、第１入力データと第１出力データとの間に少なくとも１以上の隠れ層が設けられ、機械学習させるようにしてもよい。第１入力データ又は隠れ層データの何れか一方又は両方において上述した連関度が設定され、これが各データの重み付けとなり、これに基づいて出力の選択が行われる。そして、この連関度がある閾値を超えた場合に、その出力を選択するようにしてもよい。

判定モデルには、例えば参照用音データ（第２入力データ）と参照用評価結果（第２出力データ）との間における連関度を有する第２連関性が記憶される。連関度は、第２入力データと第２出力データとの繋がりの度合いを示しており、例えば連関度が高いほど各データの繋がりが強いと判断することができる。連関度は、例えば百分率等の３値以上（３段階以上）で示されるほか、２値（２段階）で示されてもよい。

例えば第２連関性は、多対多の情報（複数の第２入力データ、対、複数の第２出力データ）の間における繋がりの度合いにより構築される。第２連関性は、機械学習の過程で適宜更新され、例えば複数の第２入力データ、及び複数の第２出力データに基づいて最適化された関数（分類器）を示す。なお、第２連関性は、例えば各データの間における繋がりの度合いを示す複数の連関度を有してもよい。連関度は、例えばデータベースがニューラルネットワークで構築される場合、重み変数に対応させることができる。

このため、評価システム１００では、例えば分類器の判定した結果を全て踏まえた第２連関性を用いて、評価用音データに適した評価結果を選択する。これにより、評価用音データが、参照用評価用音データと同一又は類似である場合のほか、非類似である場合においても、評価用音データに適した評価結果を定量的に選択することができる。

第２連関性は、例えば図７に示すように、複数の第２出力データと、複数の第２入力データとの間における繋がりの度合いを示してもよい。この場合、第２連関性を用いることで、複数の第２出力データ（図７では「参照用評価結果Ａ」〜「参照用評価結果Ｃ」）のそれぞれに対し、複数の第２入力データ（図７では「参照用音データＡ」〜「参照用音データＣ」）の関係の度合いを紐づけて記憶させることができる。このため、例えば第２連関性を介して、１つの第２出力データに対して、複数の第２入力データを紐づけることができる。これにより、評価用音データに対して多角的な評価結果の選択を実現することができる。

第２連関性は、例えば各第２出力データと、各第２入力データとをそれぞれ紐づける複数の連関度を有する。連関度は、例えば百分率、１０段階、又は５段階等の３段階以上で示され、例えば線の特徴（例えば太さ等）で示される。例えば、第２入力データに含まれる「参照用音データＡ」は、第２出力データに含まれる「参照用評価結果Ａ」との間の連関度ＡＡ「７３％」を示し、第２出力データに含まれる「参照用評価結果Ｂ」との間の連関度ＡＢ「１２％」を示す。すなわち、「連関度」は、各データ間における繋がりの度合いを示しており、例えば連関度が高いほど、各データの繋がりが強いことを示す。

また、判定モデルは、第２入力データと第２出力データとの間に少なくとも１以上の隠れ層が設けられ、機械学習させるようにしてもよい。第２入力データ又は隠れ層データの何れか一方又は両方において上述した連関度が設定され、これが各データの重み付けとなり、これに基づいて出力の選択が行われる。そして、この連関度がある閾値を超えた場合に、その出力を選択するようにしてもよい。

また、判定モデルには、例えば第１参照用音データと参照用第１評価結果との間における連関度を有する第３連関性、及び第２参照用音データと参照用第２評価結果との間における連関度を有する第４連関性が記憶されてもよい。第３連関度は第１参照用音データと参照用第１評価結果との間における連関度を有することに対して、第４連関度は、第２参照用音データと参照用第２評価結果との間における連関度を有する点で異なる。

例えば第３連関性は、複数の第１参照用音データ、対、複数の参照用第１評価結果の間における繋がりの度合いにより構築される。第３連関性は、機械学習の過程で適宜更新される。第３連関性は、例えば図８に示すように、第１データセットを参照し、複数の参照用第１評価結果と、複数の第１参照用音データとの間における繋がりの度合いを示してもよい。これにより、例えば第３連関性を介して、１つの参照用第１評価結果に対して、複数の第１参照用音データを紐づけることができる。これにより、第１参照用音データに対して多角的な参照用第１評価結果の選択を実現することができる。また、第３連関性は、例えば参照用第１評価結果と、第１参照用音データとの間に少なくとも１以上の隠れ層が設けられ、機械学習させるようにしてもよい。

例えば第４連関性は、複数の第２参照用音データ、対、複数の参照用第２評価結果の間における繋がりの度合いにより構築される。第４連関性は、機械学習の過程で適宜更新される。第４連関性は、例えば図８に示すように、第２データセットを参照し、複数の参照用第２評価結果と、複数の第２参照用音データとの間における繋がりの度合いを示してもよい。これにより、例えば第４連関性を介して、１つの参照用第２評価結果に対して、複数の第２参照用音データを紐づけることができる。これにより、第２参照用音データに対して多角的な参照用第２評価結果の選択を実現することができる。また、第４連関性は、例えば参照用第２評価結果と、第２参照用音データとの間に少なくとも１以上の隠れ層が設けられ、機械学習させるようにしてもよい。

また、判定モデルは、第１データセット及び第２データセットのみからなる評価用学習データを用いて、第３連関性及び第４連関性を学習した場合、異なるデータセットの入力に対する出力の連関度がなくてもよい。判定モデルは、例えば第１参照用音データに対する参照用第２評価結果の連関度がなくてもよい。

＜評価装置１＞
次に、図９、図１０を参照して、本実施形態における評価装置１の一例を説明する。図９（ａ）は、本実施形態における評価装置１の構成の一例を示す模式図であり、図９（ｂ）は、本実施形態における評価装置１の機能の一例を示す模式図である。図９（ｃ）は、ＤＢ生成部１６の一例を示す模式図である。図１０は、処理部１２の一例を示す模式図である。

評価装置１として、例えばラップトップ（ノート）ＰＣ又はデスクトップＰＣ等の電子機器が用いられる。評価装置１は、例えば図９（ａ）に示すように、筐体１０と、ＣＰＵ（Central Processing Unit）１０１と、ＲＯＭ（Read Only Memory）１０２と、ＲＡＭ（Random Access Memory）１０３と、保存部１０４と、Ｉ／Ｆ１０５〜１０７とを備える。各構成１０１〜１０７は、内部バス１１０により接続される。

ＣＰＵ１０１は、評価装置１全体を制御する。ＲＯＭ１０２は、ＣＰＵ１０１の動作コードを格納する。ＲＡＭ１０３は、ＣＰＵ１０１の動作時に使用される作業領域である。保存部１０４は、データベースや学習対象データ等の各種情報が記憶される。保存部１０４として、例えばＨＤＤ（Hard Disk Drive）のほか、ＳＳＤ（Solid State Drive）等のデータ保存装置が用いられる。なお、例えば評価装置１は、図示しないＧＰＵ（Graphics Processing Unit）を有してもよい。

Ｉ／Ｆ１０５は、通信網４を介して、必要に応じて端末２、サーバ３、ウェブサイト等との各種情報の送受信を行うためのインターフェースである。Ｉ／Ｆ１０６は、入力部１０８との情報の送受信を行うためのインターフェースである。入力部１０８として、例えばキーボードが用いられ、評価装置１の使用者等は、入力部１０８を介して、各種情報、又は評価装置１の制御コマンド等を入力する。また、入力部１０８は、収音が可能な図示しないマイクを備えていてもよい。Ｉ／Ｆ１０７は、表示部１０９との各種情報の送受信を行うためのインターフェースである。表示部１０９は、保存部１０４に保存された各種情報、又は評価結果等を表示する。表示部１０９として、ディスプレイが用いられ、例えばタッチパネル式の場合、入力部１０８と一体に設けられる。また、表示部１０９は、スピーカが用いられてもよい。

図９（ｂ）は、評価装置１の機能の一例を示す模式図である。評価装置１は、取得部１１と、処理部１２と、出力部１４と、記憶部１５とを備え、例えばＤＢ生成部１６を有してもよい。ＤＢ生成部１６は、例えば図９（ｃ）に示すように、抽出モデル生成部１６１と、判定モデル生成部１６２とを有する。なお、図９（ｂ）、図９（ｃ）、図１０に示した各機能は、ＣＰＵ１０１が、ＲＡＭ１０３を作業領域として、保存部１０４等に記憶されたプログラムを実行することにより実現され、例えば人工知能等により制御されてもよい。

＜＜取得部１１＞＞
取得部１１は、ノイズデータを取得する。取得したデータは、上述した評価用音データを抽出する際に用いられる。取得部１１は、例えば入力部１０８から入力されたノイズデータを取得するほか、例えば通信網４を介して、端末２等からノイズデータを取得してもよい。

取得部１１は、例えば上述した各種モデルの生成に用いられる学習データを取得してもよい。取得部１１は、例えば入力部１０８から入力された学習データを取得するほか、例えば通信網４を介して、端末２等から学習データを取得してもよい。

例えば、抽出モデルの生成に用いられる抽出用学習データとして、参照用ノイズデータ及び参照用評価用音データが挙げられる。また、例えば判定モデルの生成に用いられる評価用学習データとして、参照用音データ及び参照用評価結果が挙げられる。

＜＜処理部１２＞＞
処理部１２は、例えば抽出モデルを参照し、ノイズデータから評価用音データを抽出し、判定モデルを参照し、評価用音データに対する評価結果を生成する。

処理部１２は、図１０に示すように、取得部１１に接続される抽出処理部１２１を有する。また、処理部１２は、抽出処理部１２１に接続される評価処理部１２２を有する。

抽出処理部１２１は、例えば抽出モデルを参照し、ノイズデータから評価用音データを抽出する。抽出処理部１２１は、例えば抽出モデルを参照し、ノイズデータに対して、連関性の最も高い評価用音データを抽出する。ほか、例えば予め設定された閾値以上の連関度を有する複数の参照用評価用音データを、評価用音データとして選択してもよい。また、選択される参照用評価用音データの数については、任意に設定できる。

評価処理部１２２は、例えば判定モデルを参照し、評価用音データを入力として、入力に対する評価結果を生成する。評価処理部１２２は、例えば判定モデルを参照し、評価用音データに対して、連関性の最も高い評価結果を抽出する。ほか、例えば予め設定された閾値以上の連関度を有する複数の参照用評価結果を、評価結果として選択してもよい。また、選択される参照用評価結果の数については、任意に設定できる。

＜＜出力部１４＞＞
出力部１４は、評価結果を出力する。出力部１４は、Ｉ／Ｆ１０７を介して表示部１０９に評価結果を出力するほか、例えばＩ／Ｆ１０５を介して、端末２等に評価結果を出力する。

＜＜記憶部１５＞＞
記憶部１５は、保存部１０４に保存されたデータベース等の各種データを必要に応じて取り出す。記憶部１５は、取得部１１、処理部１２、ＤＢ生成部１６により取得又は生成された各種データを、必要に応じて保存部１０４に保存する。

＜＜ＤＢ生成部１６＞＞
ＤＢ生成部１６は、複数の学習データを用いた機械学習によりデータベースを生成する。機械学習には、例えば上述したニューラルネットワーク等が用いられる。

ＤＢ生成部１６は、例えば、抽出モデル生成部１６１と、判定モデル生成部１６２とを有する。

抽出モデル生成部１６１は、例えば一対の参照用ノイズデータと、参照用評価用音データと、を抽出用学習データとして、複数の抽出用学習データを用いた機械学習により抽出モデルを生成する。

判定モデル生成部１６２は、例えば一対の参照用音データと、参照用評価結果と、を評価用学習データとして、複数の評価用学習データを用いた機械学習により判定モデルを生成する。

判定モデル生成部１６２は、例えば第１参照用音データと参照用第１評価結果とを一対の第１データセットとし、第２参照用音データと参照用第２評価結果とを一対の第２データセットとし、第１データセット及び第２データセットを含む複数の評価用学習データを用いた機械学習により、判定モデルを生成してもよい。

＜端末２＞
端末２は、例えば評価システム１００を用いたサービスのユーザ等が保有し、通信網４を介して評価装置１と接続される。端末２は、例えばデータベースを生成する電子機器を示してもよい。端末２は、例えばパーソナルコンピュータや、タブレット端末等の電子機器が用いられる。端末２は、例えば評価装置１の備える機能のうち、少なくとも一部の機能を備えてもよい。また、端末２は、ノイズデータ、及び各学習データを取得するための図示しないマイクを備えていてもよい。端末２は、ユーザに評価用音データの評価結果を提示できる図示しないディスプレイ、又はスピーカを備えていてもよい。

＜サーバ３＞
サーバ３は、通信網４を介して評価装置１と接続される。サーバ３は、過去の各種データ等が記憶され、必要に応じて評価装置１から各種データが送信される。サーバ３は、例えば評価装置１の備える機能のうち、少なくとも一部の機能を備えてもよく、例えば評価装置１の代わりに少なくとも一部の処理を行ってもよい。サーバ３は、例えば評価装置１の保存部１０４に記憶された各種データのうち少なくとも一部が記憶され、例えば保存部１０４の代わりに用いられてもよい。

＜通信網４＞
通信網４は、例えば評価装置１が通信回路を介して接続されるインターネット網等である。通信網４は、いわゆる光ファイバ通信網で構成されてもよい。また、通信網４は、有線通信網のほか、無線通信網等の公知の通信技術で実現してもよい。

（評価システムの動作）
次に、本実施形態における評価システム１００の動作の一例について説明する。図１１は、本実施形態における評価システム１００の動作の一例を示すフローチャートである。

＜取得手段Ｓ１１０＞
取得手段Ｓ１１０は、例えば収音装置により収音された音に基づき生成されたノイズデータを取得する。取得手段Ｓ１１０では、例えば取得部１１が、ノイズデータを取得する。また、取得部１１は、例えば上述した抽出モデルの抽出用学習データに含まれる参照用ノイズデータと同じ形式のノイズデータを取得してもよい。取得部１１は、例えば端末２等からノイズデータを取得するほか、例えば記憶部１５を介して、保存部１０４に取得したノイズデータを保存してもよい。

＜抽出手段Ｓ１２０＞
抽出手段Ｓ１２０は、取得手段Ｓ１１０で取得したノイズデータから評価用音データを抽出する。抽出手段Ｓ１２０は、例えば抽出処理部１２１が、上述した学習方法により予め生成された抽出モデルを参照し、ノイズデータから評価用音データを抽出する。また、抽出手段Ｓ１２０は、例えば判定モデルの評価用学習データに含まれる参照用音データと同じ形式の評価用音データを抽出してもよい。また、抽出手段Ｓ１２０は、抽出モデルを用いることなく、他の公知の技術によって、ノイズデータから評価用音データを抽出してもよい。

また、抽出手段Ｓ１２０は、例えば記憶部１５を介して、ノイズデータから抽出した評価用音データを保存部１０４に保存してもよい。なお、取得した各データは、例えばサーバ３や他の評価装置１に送信されてもよい。

＜判定手段Ｓ１３０＞
判定手段Ｓ１３０は、例えば判定モデルを参照し、抽出手段Ｓ１２０で抽出した評価用音データに対する評価結果を生成する。判定手段Ｓ１３０では、例えば評価処理部１２２は、予め生成された判定モデルを参照し、抽出手段Ｓ１２０で抽出した評価用音データに対する評価結果を生成する。例えば、参照用音データとして、環境の変化に依存しない目的のコネクタ音に基づく音データを用いることで、抽出された評価用音データが環境の変化によってバラツキが生じたときも、評価用音データの評価に生じる影響を抑制できる。このため、環境が変化した場合においても、ノイズデータから抽出した評価用音データを高精度に評価することが可能となる。

また、判定手段Ｓ１３０において、第１データセット及び第２データセットを含む複数の評価用学習データを用いた機械学習により、生成された判定モデルを参照してもよい。この場合、判定手段Ｓ１３０において、ノイズデータから抽出した評価用音データが、第１データセットに含まれる第１参照用音データ、又は第２データセットに含まれる第２参照用音データのどちらと一致又は類似するかを判定する。さらに判定手段Ｓ１３０において、評価用音データと一致又は類似する方の参照用音データと参照用評価結果の連関性を参照し、評価用音データに対する評価結果を決定する。

また、判定手段Ｓ１３０において、例えば、第１参照用音データとして、目的のコネクタ音の特徴を示す音データを用いて、第２参照用音データとして、上述した目的のコネクタ音とは異なる音の特徴を示す音データを用いて生成された判定モデルを参照してもよい。この場合、ノイズデータから抽出した評価用音データが、第１参照用音データ、又は第２参照用音データのどちらと一致又は類似するかを判定する。このとき、例えば評価用音データが第１参照用音データと一致又は類似する場合、第１参照用音データと参照用第１評価結果の第３連関性を参照し、評価用音データに対する評価結果として、参照用第１評価結果に含まれる評価結果を決定する。この場合、参照用第１評価結果は、評価用音データと、目的のコネクタ音の特徴を示す音データとの類似度を百分率で示したものでもよい。また、参照用第１評価結果に含まれる評価結果は、ノイズデータから目的のコネクタ音に基づく音データを正常に抽出できたことを示す「ＯＫ」等であってもよい。また、例えば評価用音データが第２参照用音データと一致又は類似する場合、第２参照用音データと参照用第２評価結果の第４連関性を参照し、評価用音データに対する評価結果として、参照用第２評価結果に含まれる評価結果を決定する。この場合、参照用第２評価結果に含まれる評価は、ノイズデータから抽出した評価用音データに異常があることを示す「ＮＧ」等であってもよい。これにより、抽出された評価用音データが環境の変化によってバラツキが生じたときも、評価用音データが目的のコネクタ音を示すか否かを評価できる。このため、環境が変化した場合においても、ノイズデータから抽出した評価用音データをより高精度に評価できる。また、目的のコネクタ音とは異なる音は、例えばコネクタの嵌合に異常があったときのコネクタの嵌合時に発生する音であってもよい。

また、判定手段Ｓ１３０において、例えば、第１参照用音データとして、目的のコネクタ音のみの特徴を示す音データを用いて、第２参照用音データとして、上述した学習用コネクタ音及び周辺環境音に基づく音データを用いてもよい。この場合、ノイズデータから抽出した評価用音データが、第１参照用音データ、又は第２参照用音データのどちらと一致又は類似するかを判定する。さらに判定手段Ｓ１３０において、評価用音データと一致又は類似する方の参照用音データと参照用評価結果の連関性を参照し、評価用音データに対する評価結果を決定する。これにより、環境の変化に伴い周辺環境音が変化した場合においても、評価用音データに周辺環境音が含まれるか否かを判定することができ、より適切な評価結果を生成することが可能となる。このため、環境が変化した場合においても、ノイズデータから抽出した評価用音データをより高精度に評価できる。

判定手段Ｓ１３０は、例えば記憶部１５を介して、生成した評価結果を保存部１０４に保存してもよい。なお、取得した評価結果は、例えば端末２やサーバ３や他の評価装置１に送信されてもよい。生成する評価結果はひとつの評価用音データに対して複数の評価結果を取得してもよい。

＜出力手段Ｓ１４０＞
出力手段Ｓ１４０では、例えば出力部１４は、判定手段Ｓ１３０により生成された評価結果を、表示部１０９や端末２等に出力する。

上述した各手段を行うことで、本実施形態における評価システム１００の動作が完了する。なお、上記では目的信号音の一例として、コネクタ音を用いた場合について説明したが、他の音を用いた場合についても同様の効果が得られるため、説明を省略する。

本発明の実施形態を説明したが、この実施形態は例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。

１：評価装置
２：端末
３：サーバ
４：通信網
１０：筐体
１１：取得部
１２：処理部
１４：出力部
１５：記憶部
１６：ＤＢ生成部
１００：評価システム
１０１：ＣＰＵ
１０２：ＲＯＭ
１０３：ＲＡＭ
１０４：保存部
１０５：Ｉ／Ｆ
１０６：Ｉ／Ｆ
１０７：Ｉ／Ｆ
１０８：入力部
１０９：表示部
１１０：内部バス
１２１：抽出処理部
１２２：評価処理部
１６１：抽出モデル生成部
１６２：判定モデル生成部
Ｓ１１０：取得手段
Ｓ１２０：抽出手段
Ｓ１３０：判定手段
Ｓ１４０：出力手段

Claims

目的信号音と周辺環境音とが混入した音に基づくノイズデータの評価を支援する評価プログラムであって、
前記ノイズデータを取得する取得ステップと、
前記取得ステップにより取得したノイズデータから、前記ノイズデータに含まれる前記目的信号音を抽出するために前記ノイズデータから抽出される評価用音データを抽出する抽出ステップと、
予め取得された参照用音データと前記参照用音データに対する評価を示す参照用評価結果とを一対のデータセットとする評価用学習データを複数用いて、機械学習により生成された判定モデルを参照して、前記評価用音データに対する評価結果を生成する判定ステップとをコンピュータに実行させ、
前記参照用音データは、
学習用目的信号音のみに基づく第１参照用音データと、
前記学習用目的信号音及び前記周辺環境音に基づく第２参照用音データと
を含み、
前記参照用評価結果は、
前記第１参照用音データに対する評価を示す参照用第１評価結果と、
前記第２参照用音データに対する評価を示し、前記参照用第１評価結果と異なる参照用第２評価結果と
を含み、
前記データセットは、
前記第１参照用音データと前記参照用第１評価結果とを一対とする第１データセット、及び
前記第２参照用音データと前記参照用第２評価結果とを一対とする第２データセット
を含むこと
を特徴とする評価プログラム。
目的信号音と周辺環境音とが混入した音に基づくノイズデータの評価を支援する評価プログラムであって、
前記ノイズデータを取得する取得ステップと、
前記取得ステップにより取得したノイズデータから、前記ノイズデータに含まれる前記目的信号音を抽出するために前記ノイズデータから抽出される評価用音データを抽出する抽出ステップと、
予め取得された参照用音データと前記参照用音データに対する評価を示す参照用評価結果とを一対のデータセットとする評価用学習データを複数用いて、機械学習により生成された判定モデルを参照して、前記評価用音データに対する評価結果を生成する判定ステップとをコンピュータに実行させ、
前記抽出ステップは、予め取得された参照用ノイズデータと前記参照用ノイズデータに紐づく参照用評価用音データとを一対のデータセットとする抽出用学習データを複数用いて、機械学習により生成された抽出モデルを参照して、前記ノイズデータから前記評価用音データを抽出すること
を特徴とする評価プログラム。
前記抽出モデルは、
前記参照用ノイズデータと、
実際に録音された目的信号音に基づく前記参照用評価用音データ、又は擬似的に生成された前記参照用評価用音データと
を一対のデータセットとする抽出用学習データを用いて、機械学習により生成されること
を特徴とする請求項２に記載の評価プログラム。
前記参照用音データは、
学習用目的信号音に基づく第１参照用音データと、
前記学習用目的信号音とは異なる音に基づく第２参照用音データと
を含み、
前記参照用評価結果は、
前記第１参照用音データに対する評価を示す参照用第１評価結果と、
前記第２参照用音データに対する評価を示し、前記参照用第１評価結果とは異なる参照用第２評価結果と
を含み、
前記データセットは、
前記第１参照用音データと前記参照用第１評価結果とを一対とする第１データセット、及び
前記第２参照用音データと前記参照用第２評価結果とを一対とする第２データセット
を含むこと
を特徴とする請求項２又は請求項３に記載の評価プログラム。
前記判定ステップは、
前記評価用音データが前記第１参照用音データと類似又は一致する場合、前記評価用音データが正常であることを示す第１評価結果を生成し、
前記評価用音データが前記第２参照用音データと類似又は一致する場合、前記評価用音データが異常であることを示す第２評価結果を生成すること
を特徴とする請求項１又は請求項４に記載の評価プログラム。
前記取得ステップは、前記目的信号音及び前記周辺環境音から生成されたスペクトログラムを示す画像データを含む前記ノイズデータを取得すること
を特徴とする請求項１〜５の何れか１項記載の評価プログラム。
前記目的信号音は、コネクタ音であること
を特徴とする請求項１〜６の何れか１項記載の評価プログラム。
目的信号音と周辺環境音とが混入した音に基づくノイズデータの評価を支援する評価システムであって、
前記ノイズデータを取得する取得手段と、
前記取得手段により取得したノイズデータから、前記ノイズデータに含まれる前記目的信号音を抽出するために前記ノイズデータから抽出される評価用音データを抽出する抽出手段と、
予め取得された参照用音データと前記参照用音データに対する評価を示す参照用評価結果とを一対のデータセットとする評価用学習データを複数用いて、機械学習により生成された判定モデルが記憶されたデータベースと、
前記判定モデルを参照して、前記評価用音データに対する評価結果を生成する判定手段を備え、
前記参照用音データは、
学習用目的信号音のみに基づく第１参照用音データと、
前記学習用目的信号音及び前記周辺環境音に基づく第２参照用音データと
を含み、
前記参照用評価結果は、
前記第１参照用音データに対する評価を示す参照用第１評価結果と、
前記第２参照用音データに対する評価を示し、前記参照用第１評価結果と異なる参照用第２評価結果と
を含み、
前記データセットは、
前記第１参照用音データと前記参照用第１評価結果とを一対とする第１データセット、及び
前記第２参照用音データと前記参照用第２評価結果とを一対とする第２データセット
を含むこと
を特徴とする評価システム。
目的信号音と周辺環境音とが混入した音に基づくノイズデータの評価を支援する評価システムであって、
前記ノイズデータを取得する取得手段と、
前記取得手段により取得したノイズデータから、前記ノイズデータに含まれる前記目的信号音を抽出するために前記ノイズデータから抽出される評価用音データを抽出する抽出手段と、
予め取得された参照用音データと前記参照用音データに対する評価を示す参照用評価結果とを一対のデータセットとする評価用学習データを複数用いて、機械学習により生成された判定モデルが記憶されたデータベースと、
前記判定モデルを参照して、前記評価用音データに対する評価結果を生成する判定手段を備え、
前記抽出手段は、予め取得された参照用ノイズデータと前記参照用ノイズデータに紐づく参照用評価用音データとを一対のデータセットとする抽出用学習データを複数用いて、機械学習により生成された抽出モデルを参照して、前記ノイズデータから前記評価用音データを抽出すること
を特徴とする評価システム。