WO2020065806A1

WO2020065806A1 - 処理装置、処理方法、およびプログラム

Info

Publication number: WO2020065806A1
Application number: PCT/JP2018/035849
Authority: WO
Inventors: 江藤　力
Original assignee: 日本電気株式会社
Priority date: 2018-09-27
Filing date: 2018-09-27
Publication date: 2020-04-02
Also published as: JPWO2020065806A1; US20220036223A1; JP7063389B2

Abstract

処理装置（２０）は、予測式生成手段（２１０）および出力手段（２５０）を備える。予測式生成手段（２１０）は、複数種類のセンサの集合からの出力に基づいた複数の特徴量と正解データとを入力とした機械学習を行うことにより、前記複数の特徴量を変数とする式であって、におい成分に関する予測を行うための予測式を生成する。出力手段（２５０）は、予測式を示す情報として、複数の重みを、それぞれ特徴量に関連づけて出力する。

Description

処理装置、処理方法、およびプログラム

　本発明は処理装置、処理方法、およびプログラムに関する。

　ガスをセンサで測定することにより、ガスに関する情報を得る技術が開発されている。

　特許文献１は、複数のセンサ素子を設けた匂いセンサを開示している。具体的には、複数のセンサ素子にはそれぞれ異なる特性を有する物質吸着膜が設けられており、各センサ素子は作用させようとする分子に特異的な反応を示す構成をとれることが開示されている。

国際公開第２０１７／０８５９３９号

　しかし、特許文献１には、検出の目的に応じてセンサ素子の組み合わせをどのように選定すればよいかについて開示されていない。

　本発明は、上記の課題に鑑みてなされたものである。本発明の目的は、所望の目的のために、適したセンサの組み合わせを導出する技術を提供することにある。

　本発明の第１の処理装置は、
　複数種類のセンサの集合からの出力に基づいた複数の特徴量と正解データとを入力とした機械学習を行うことにより、前記複数の特徴量を変数とする式であって、におい成分に関する予測を行うための予測式を生成する予測式生成手段と、
　前記予測式における前記複数の特徴量に対する複数の重みに基づいて、前記集合から一以上の前記センサを抽出する抽出手段と、
　前記抽出手段で抽出された前記センサおよび抽出されなかった前記センサの少なくとも一方を、識別可能な状態で出力する出力手段とを備え、
　前記抽出手段は、前記予測式において、前記複数の重みのうち予め定められた条件を満たす、または満たさない前記重みで重みづけられた前記特徴量の、出力元である前記センサを抽出する。

　本発明の第２の処理装置は、
　複数種類のセンサの集合からの出力に基づいた複数の特徴量と正解データとを入力とした機械学習を行うことにより、前記複数の特徴量を変数とする式であって、におい成分に関する予測を行うための予測式を生成する予測式生成手段と、
　前記予測式を示す情報として、前記予測式における前記複数の特徴量に対する複数の重みを、それぞれ前記特徴量に関連づけて出力する出力手段とを備える。

　本発明の第１の処理方法は、
　複数種類のセンサの集合からの出力に基づいた複数の特徴量と正解データとを入力とした機械学習を行うことにより、前記複数の特徴量を変数とする式であって、におい成分に関する予測を行うための予測式を生成する予測式生成ステップと、
　前記予測式における前記複数の特徴量に対する複数の重みに基づいて、前記集合から一以上の前記センサを抽出する抽出ステップと、
　前記抽出ステップで抽出された前記センサおよび抽出されなかった前記センサの少なくとも一方を、識別可能な状態で出力する出力ステップとを含み、
　前記抽出ステップでは、前記予測式において、前記複数の重みのうち予め定められた条件を満たす、または満たさない前記重みで重みづけられた前記特徴量の、出力元である前記センサを抽出する。

　本発明の第２の処理方法は、
　複数種類のセンサの集合からの出力に基づいた複数の特徴量と正解データとを入力とした機械学習を行うことにより、前記複数の特徴量を変数とする式であって、におい成分に関する予測を行うための予測式を生成する予測式生成ステップと、
　前記予測式を示す情報として、前記予測式における前記複数の特徴量に対する複数の重みを、それぞれ前記特徴量に関連づけて出力する出力ステップとを含む。

　本発明のプログラムは、
　本発明の処理方法の各ステップをコンピュータに実行させる。

　本発明によれば、所望の目的のために、適したセンサの組み合わせを導出する技術を提供できる。

　上述した目的、およびその他の目的、特徴および利点は、以下に述べる好適な実施の形態、およびそれに付随する以下の図面によってさらに明らかになる。

第１の実施形態に係る処理装置の構成を例示する図である。センサを例示する図である。時系列データを例示する図である。複数種類のセンサの集合からのセンサ出力データを例示する図である。第１の実施形態に係る処理方法を例示するフローチャートである。処理装置を実現するための計算機を例示する図である。第２の実施形態に係る処理装置の構成を例示する図である。第２の実施形態に係る処理方法を例示するフローチャートである。第３の実施形態に係る予測式生成手段で行われる機械学習に用いられる予測モデルを例示する図である。第４の実施形態に係る処理装置の構成を例示する図である。第４の実施形態に係る処理方法を例示するフローチャートである。

　以下、本発明の実施の形態について、図面を用いて説明する。尚、すべての図面において、同様な構成要素には同様の符号を付し、適宜説明を省略する。

　なお、以下に示す説明において、特に説明する場合を除き、各装置の各構成要素は、ハードウエア単位の構成ではなく、機能単位のブロックを示している。各装置の各構成要素は、任意のコンピュータのＣＰＵ、メモリ、メモリにロードされた本図の構成要素を実現するプログラム、そのプログラムを格納するハードディスクなどの記憶メディア、ネットワーク接続用インタフェースを中心にハードウエアとソフトウエアの任意の組合せによって実現される。そして、その実現方法、装置には様々な変形例がある。

（第１の実施形態）
　図１は、第１の実施形態に係る処理装置２０の構成を例示する図である。本実施形態に係る処理装置２０は、予測式生成手段２１０および出力手段２５０を備える。予測式生成手段２１０は、複数種類のセンサの集合からの出力に基づいた複数の特徴量と正解データとを入力とした機械学習を行うことにより、複数の特徴量を変数とする式であって、におい成分に関する予測を行うための予測式を生成する。出力手段２５０は、予測式を示す情報として、予測式における複数の特徴量に対する複数の重みを、それぞれ特徴量に関連づけて出力する。以下に詳しく説明する。

　図２は、センサ１０を例示する図である。センサ１０は、分子が付着する受容体を有し、その受容体における分子の付着と離脱に応じて検出値が変化するセンサである。なお、センサ１０によってセンシングされているガスを、対象ガスと呼ぶ。また、センサ１０から出力される検出値の時系列データを、時系列データ１４と呼ぶ。ここで、必要に応じ、時系列データ１４をＹとも表記し、時刻ｔの検出値をｙ（ｔ）とも表記する。Ｙは、ｙ（ｔ）が列挙されたベクトルとなる。

　例えばセンサ１０は、膜型表面応力センサ（Membrane-type Surface stress Sensor; MSS)である。MSSは、受容体として、分子が付着する官能膜を有しており、その官能膜に対する分子の付着と離脱によってその官能膜の支持部材に生じる応力が変化する。MSSは、この応力の変化に基づく検出値を出力する。

　MSSの官能膜には有機系、無機系、およびバイオ系のように様々な材料を用いることができる。センサ１０の応答する対象分子および、応答特性は官能膜に依存する。したがって、互いに異なる官能膜を有する複数種類のセンサ１０を組み合わせることにより、様々な成分を含む混合ガスからなる複雑なにおいを分析可能となる。

　なお、センサ１０は、MSSには限定されず、受容体に対する分子の付着と離脱に応じて生じる、センサ１０の部材の粘弾性や動力学特性（質量や慣性モーメントなど）に関連する物理量の変化に基づいて検出値を出力するものであればよく、カンチレバー式、膜型、光学式、ピエゾ、振動応答などの様々なタイプのセンサを採用することができる。これらのセンサ１０においても、センサ１０が応答する対象分子および、応答特性の少なくとも一方が互いに異なる複数種類のセンサ１０を組み合わせることができる。

　ここで、センサ１０の種類は多数にのぼる。一方で、実際に検出装置において用いることができるセンサ１０の数には限りがある。そこで、目的の検出を行うためにどの種類のセンサ１０を組み合わせて用いるのがよいかを選定する必要がある。

　本実施形態において予測式生成手段２１０は、複数種類のセンサ１０の集合からの出力に基づいた複数の特徴量と正解データとを入力とした機械学習を行うことにより、におい成分に関する予測を行うための予測式を生成する。予測式は複数の特徴量を変数とする式であり、予測式において各特徴量に対する重みは、その特徴量が予測結果に及ぼす寄与の大きさに対応する。したがって、予測式を示す情報に基づき、目的に対して寄与が大きなセンサ１０と寄与が小さなセンサ１０とを判別することができる。

　特徴量および予測式について以下に詳しく説明する。特徴量はセンサ１０の出力に基づいて得られる値である。ただし、一つのセンサ１０に対しては一つ以上の特徴量が得られ、各特徴量は、一つのセンサ１０の出力にのみ依存する。

　時系列データ１４は、センサ１０が出力した検出値を、センサ１０から出力された時刻が早い順に並べた時系列のデータである。ただし、時系列データ１４は、センサ１０から得られた検出値の時系列データに対して、所定の前処理が加えられたものであってもよい。前処理としては、例えば、時系列のデータからノイズ成分を除去するフィルタリングなどを採用することができる。

　図３は、時系列データ１４を例示する図である。時系列データ１４は、センサ１０を対象ガスに曝すことで得られる。ただし、時系列データ１４は、センサ１０を測定対象のガスに曝す操作と、センサ１０から測定対象のガスを取り除く操作とで得ても良い。本図の例において、センサ１０を対象ガスに曝すことで期間Ｐ１のデータが得られ、センサ１０から測定対象のガスを取り除く操作により期間Ｐ２のデータが得られる。なお、センサ１０から測定対象のガスを取り除く操作はたとえばセンサ１０をパージガスに曝す操作が挙げられる。また、センサ１０による対象ガスの測定においては、センサ１０を測定対象のガスに曝す操作と、センサ１０から測定対象のガスを取り除く操作を繰り返し行い、複数の時系列データ１４を得ても良い。

　図４は、複数種類のセンサ１０の集合１００からのセンサ出力データ１６を例示する図である。本図の例において、センサ１０の集合１００は、第１センサ１０ａ、第２センサ１０ｂ、第３センサ１０ｃ、および第４センサ１０ｄからなる。たとえば集合１００はモジュール化されており、同じ対象ガスに対して同じ検出環境で測定が行われる。センサ１０の集合１００は、使用可能な多数のセンサ１０から任意に選択された複数のセンサ１０からなる。センサ出力データ１６は、複数種類のセンサ１０のそれぞれから得られた時系列データ１４を結合したデータである。本図の例において、センサ出力データ１６は、第１センサ１０ａ、第２センサ１０ｂ、第３センサ１０ｃ、および第４センサ１０ｄの時系列データ１４を順に並べたものである。

　センサ出力データ１６からは、複数の特徴量が算出できる。ここで、特徴量ベクトルＸを、複数の特徴量を要素とするベクトルであるとする。特徴量ベクトルＸには、１００に含まれる複数種類の１０の出力に基づく複数の特徴量ｘ_ｊ（ｊ＝１，２，．．．，Ｊ）が含まれる。なお、ｘ_ｊは数値であっても良いしベクトルであってもよい。ｘ_ｊがベクトルである場合、ｘ_ｊは同一のセンサ１０の出力に基づく複数の特徴量を要素とするベクトルである。特徴量ｘ_ｊは、たとえば、センサ１０の時系列データ１４、時系列データ１４を微分したデータ、または、後述する寄与値の集合Ξである。予測式生成手段２１０は時系列データ１４またはセンサ出力データ１６を取得し、取得したデータに基づいて特徴量を算出することができる。ただし、予測式生成手段２１０は時系列データ１４またはセンサ出力データ１６を取得する代わりに、処理装置２０の外部で導出された特徴量を取得しても良い。

　予測式は特徴量の線形和であり、ｚ＝ＷＸ＋ｂで表される。ここで、Ｗはベクトルであり、ｂは定数である。そして、重みＷの各要素は、特徴量ベクトルＸの各要素に対する係数である。そして、得られるｚが予測結果を示す。予測式は判別に用いられても良いし、回帰予測に用いられても良い。たとえばあるにおい成分の有無の判別に用いられる予測式では、ｚが予め定められた基準以上である場合、測定対象のガスに検出対象のにおい成分が含まれていると判断し、基準未満である場合、測定対象のガスに検出対象のにおい成分が含まれていないと判断することができる。回帰予測の例としては、飲料等の製品のにおいに基づく製造品質の予測や呼気の測定による体内状態の予測等が挙げられる。

　なお、上記した時系列データ１４、センサ出力データ１６、特徴量、および予測式の形態は例であり、本実施形態に係る時系列データ１４、センサ出力データ１６、特徴量、および予測式の形態は上記に限定されない。

　特徴量の一例である寄与値の集合Ξについて以下に説明する。ここで、説明のため、センサ１０によるセンシングを以下のようにモデル化する。
（１）センサ１０は、Ｋ種類の分子を含む対象ガスに曝されている。
（２）対象ガスにおける各分子ｋの濃度は一定のρ_ｋである。
（３）センサ１０には、合計Ｎ個の分子が吸着可能である。
（４）時刻ｔにおいてセンサ１０に付着している分子ｋの数はｎ_ｋ（ｔ）個である。

　センサ１０に付着している分子ｋの数ｎ_ｋ（ｔ）の時間変化は、以下のように定式化できる。

　式（１）の右辺の第１項と第２項はそれぞれ、単位時間当たりの分子ｋの増加量（新たにセンサ１０に付着する分子ｋの数）と減少量（センサ１０から離脱する分子ｋの数）を表している。また、α_ｋとβ_ｋはそれぞれ、分子ｋがセンサ１０に付着する速度を表す速度定数と、分子ｋがセンサ１０から離脱する速度を表す速度定数である。

　ここで、濃度ρ_ｋが一定であるため、上記式（１）から、時刻ｔにおける分子ｋの数ｎ_ｋ（ｔ）は、以下のように定式化できる。

　また、時刻ｔ_０（初期状態）でセンサ１０に分子が付着していないと仮定すれば、ｎ_ｋ（ｔ）は以下のように表される。

　センサ１０の検出値は、対象ガスに含まれる分子によってセンサ１０に働く応力によって定まる。そして、複数の分子によってセンサ１０に働く応力は、個々の分子に働く応力の線形和で表すことができると考えられる。ただし、分子によって生じる応力は、分子の種類によって異なると考えられる。すなわち、センサ１０の検出値に対する分子の寄与は、その分子の種類によって異なると言える。

　そこで、センサ１０の検出値ｙ（ｔ）は、以下のように定式化できる。

　ここで、γ_ｋとξ_ｋはいずれも、センサ１０の検出値に対する分子ｋの寄与を表す。なお、「立ち上がり」は上記した期間Ｐ１に相当し、「立ち下がり」は上記した期間Ｐ２に相当する。

　ここで、対象ガスをセンシングしたセンサ１０から得た時系列データ１４を上述の式（４）のように分解できれば、対象ガスに含まれる分子の種類や、各種類の分子が対象ガスに含まれる割合を把握することができる。すなわち、式（４）に示す分解によって、対象ガスの特徴を表すデータ（すなわち、対象ガスの特徴量）が得られる。

　そこでセンサ１０によって出力された時系列データ１４は、特徴定数の集合Θ＝｛θ_１，θ_２，．．．，θ_ｍ｝を用いて、以下の式（５）に示すように分解される。なお、特徴定数の集合Θは、予め定められていてもよいし、処理装置２０によって生成されてもよい。

　ここで、ξ_ｉは、センサ１０の検出値に対する特徴定数θ_ｉの寄与を表す寄与値である。

　このような分解により、時系列データ１４に対する各特徴定数θ_ｉの寄与を表す寄与値ξ_ｉが算出される。寄与値ξ_ｉの集合Ξを、対象ガスの特徴を表す特徴量とすることができる。寄与値ξ_ｉの集合は、例えば、ξ_ｉを列挙した特徴ベクトルΞ＝（ξ_１，ξ_２，．．．，ξ_ｍ）で表される。ただし、対象ガスの特徴量は、必ずベクトルとして表現しなければならないわけではない。

　ここで、特徴定数θとしては、前述した速度定数βや、速度定数の逆数である時定数τを採用することができる。θとしてβとτを使う場合それぞれについて、式（５）は、以下のように表すことができる。

　前述したように、センサ１０の検出値に対する分子の寄与は、その分子の種類によって異なると考えられるため、上述した寄与値の集合Ξは、対象ガスに含まれる分子の種類やその混合比率に応じて異なるものになると考えられる。よって、寄与値の集合Ξは、複数種類の分子が混合されているガスを互いに区別することができる情報、すなわちガスの特徴量として利用することができる。

　寄与値の集合Ξを対象ガスの特徴量として利用することには、複数種類の分子を含むガスを扱えるという利点以外の利点もある。まず、ガス同士の類似度合いを容易に把握することができるという利点がある。例えば、対象ガスの特徴量をベクトルで表現すれば、ガス同士の類似度合いを特徴ベクトル間の距離に基づいて容易に把握することができる。

　また、寄与値の集合Ξを特徴量とすることには、混合比変化に対して時定数変化や混合比変化についてロバストにすることができるという利点がある。ここでいう「ロバスト性」とは、「測定環境や測定対象が少しだけ変化したとき、得られる特徴量も少しだけ変化する」という性質である。

　混合比変化についてロバストであれば、例えば、２種類のガスを混合させた混合ガスについて、ガスの混合比を徐々に変化させていくと、特徴量も徐々に変化していくことになる。この性質は、式（４）において、寄与値ξ_ｋがガスの濃度を表すρ_ｋに比例しているため、濃度の小さな変化が寄与値の小さな変化として現れるということからわかる。

　図５は、第１の実施形態に係る処理方法を例示するフローチャートである。本実施形態に係る処理方法は、予測式生成ステップＳ２１０および出力ステップＳ２５０を含む。予測式生成ステップＳ２１０では、複数種類のセンサ１０の集合１００からの出力に基づいた複数の特徴量と正解データとを入力とした機械学習を行うことにより、複数の特徴量を変数とする式であって、におい成分に関する予測を行うための予測式が生成される。出力ステップＳ２５０では、予測式を示す情報として、予測式における複数の特徴量に対する複数の重みが、それぞれ特徴量に関連づけて出力される。本実施形態に係る処理方法は、処理装置２０により実現される。以下に詳しく説明する。

　予測式生成手段２１０は、時系列データ１４、センサ出力データ１６、または特徴量ベクトルＸを取得する。予測式生成手段２１０は時系列データ１４、センサ出力データ１６、または特徴量ベクトルＸを、予測式生成手段２１０からアクセス可能な記憶装置から取得しても良いし、処理装置２０の外部の装置から取得しても良いし、センサ１０から取得しても良い。特徴量ベクトルＸは、その場の測定により得られても良いし、予め準備されて記憶装置に保持されていても良い。また、予測式生成手段２１０はその特徴量ベクトルＸに対する正解データを取得する。正解データはユーザにより処理装置２０に入力されても良いし、予測式生成手段２１０からアクセス可能な記憶装置に予め特徴量ベクトル（すなわち複数の特徴量）と関連づけられて記憶されていても良い。

　そして予測式生成手段２１０は、予測式生成ステップＳ２１０において、複数の特徴量と正解データとを入力とした機械学習を行うことで予測式を生成する。具体的には、予測式生成手段２１０は重みＷおよび定数ｂを導出する。複数の特徴量はたとえば上記した特徴量ベクトルＸである。複数の特徴量は既知の対象ガスをセンサ１０の集合１００で測定した結果により得られる。そして正解データは、その特徴量ベクトルに対し予測式で得られるべき予測結果を示す情報である。すなわち、正解データは測定した既知の対象ガスに対応する情報である。

　ここで、予測式生成手段２１０は、複数の特徴量と正解データとを含む学習用データセットを複数用いて機械学習を行うことで、予測式の精度を高めることができる。このような複数の学習用データセットは、上記した様に、センサ１０による対象ガスの測定において、センサ１０を測定対象のガスに曝す操作と、センサ１０から測定対象のガスを取り除く操作を繰り返し行うことで得られる。予測式生成手段２１０はたとえば、予め定められた学習の反復回数（学習用データセット数）を満たした場合に学習を終了する。なお、複数の学習用データセットにおいて、センサ１０の集合１００による検出環境は同じであることが好ましい。また、この検出環境は実際にセンサ１０および生成された予測式を用いる際の検出環境に近いことが好ましい。

　なお、機械学習に用いる特徴量は対象ガスに対するセンサ１０の応答をシミュレーションして得られたものであってもよい。なお、複数の学習用データセットは互いに検出環境が異なるシミュレーション条件で得られた結果を用いて生成されうる。ただし、同一の検出環境に対し互いに異なる複数のシミュレーション結果が得られる場合には、複数の学習用データセットは互いに同一のシミュレーション条件で得られた結果を用いて生成されてもよい。

　次いで、本実施形態に係る出力手段２５０は出力ステップＳ２５０において、予測式生成手段２１０に生成された予測式を示す情報を出力する。具体的には出力手段２５０は、予測式を示す情報として、複数の重みおよび定数ｂを、それぞれ特徴量に関連づけて出力する。たとえば重みの各値がセンサ１０の集合１００のうち、どのセンサ１０の特徴量に対応する値かが分かる状態で表示装置に表示される。そして、各特徴量に対する重みを確認することで、ユーザは予測結果に対する各センサ１０の寄与度を把握することができる。そして、ユーザはたとえばセンサ１０のうち予測結果への寄与が低いセンサ１０を他の種類のセンサ１０に取り替えることができる。なお、各センサ１０に対し複数の特徴量および重みが存在する場合、ユーザはたとえば複数の重みのほとんどがゼロであるセンサ１０を予測結果への寄与が低いセンサ１０であるとみなすことができる。

　処理装置２０のユーザは、たとえば、特定の目的で、複数のセンサ１０を含むセンサモジュールを作製しようとする場合、センサモジュールに含めるセンサ１０の選定に処理装置２０を用いる。センサ１０の集合１００に含まれるセンサ１０の数の上限は、センサモジュールに搭載可能なセンサ１０の数により定められる。たとえばユーザは処理装置２０の出力に基づき予測結果への寄与が低いセンサ１０を他の使用可能な種類のセンサ１０に取り替え、再度処理装置２０を同様に動作させる。そして、センサモジュールに搭載された全てのセンサ１０が予測結果へ充分寄与する状態になるまで、センサ１０の取り替えと処理装置２０の動作を繰り返し行う。そうすることで、限られた数のセンサ１０で所望の目的を果たすことができるセンサ１０の組み合わせを求めることができる。

　さらに、ユーザは、最終的に採用したセンサ１０の組み合わせと、その組み合わせに対して生成された予測式を用いて、におい成分に関する予測を行うことができる。具体的には、におい成分に関する予測において、複数のセンサ１０からの出力に基づき特徴量が算出され、その特徴量が予測式に適用される。そして、予測式による算出値に基づき予測結果が得られる。

　なお、出力手段２５０は外部の装置に対して予測式を示す情報を出力しても良いし、出力手段２５０からアクセス可能な記憶装置にこの情報を記憶させても良い。

　処理装置２０の各機能構成部は、各機能構成部を実現するハードウエア（例：ハードワイヤードされた電子回路など）で実現されてもよいし、ハードウエアとソフトウエアとの組み合わせ（例：電子回路とそれを制御するプログラムの組み合わせなど）で実現されてもよい。以下、処理装置２０の各機能構成部がハードウエアとソフトウエアとの組み合わせで実現される場合について、さらに説明する。

　図６は、処理装置２０を実現するための計算機１０００を例示する図である。計算機１０００は任意の計算機である。例えば計算機１０００は、Personal Computer（PC）やサーバマシンなどの据え置き型の計算機である。その他にも例えば、計算機１０００は、スマートフォンやタブレット端末などの可搬型の計算機である。計算機１０００は、処理装置２０を実現するために設計された専用の計算機であってもよいし、汎用の計算機であってもよい。

　計算機１０００は、バス１０２０、プロセッサ１０４０、メモリ１０６０、ストレージデバイス１０８０、入出力インタフェース１１００、及びネットワークインタフェース１１２０を有する。バス１０２０は、プロセッサ１０４０、メモリ１０６０、ストレージデバイス１０８０、入出力インタフェース１１００、及びネットワークインタフェース１１２０が、相互にデータを送受信するためのデータ伝送路である。ただし、プロセッサ１０４０などを互いに接続する方法は、バス接続に限定されない。

　プロセッサ１０４０は、CPU（Central Processing Unit）、GPU（Graphics Processing Unit）、FPGA（Field－Programmable Gate Array）などの種々のプロセッサである。メモリ１０６０は、RAM（Random Access Memory）などを用いて実現される主記憶装置である。ストレージデバイス１０８０は、ハードディスク、SSD（Solid State Drive）、メモリカード、又は ROM（Read Only Memory）などを用いて実現される補助記憶装置である。

　入出力インタフェース１１００は、計算機１０００と入出力デバイスとを接続するためのインタフェースである。例えば入出力インタフェース１１００には、キーボードなどの入力装置や、ディスプレイ装置などの出力装置が接続される。その他にも例えば、入出力インタフェース１１００には、センサ１０が接続される。ただし、センサ１０は必ずしも計算機１０００と直接接続されている必要はない。例えばセンサ１０は、計算機１０００と共有している記憶装置に時系列データ１４を記憶させてもよい。

　ネットワークインタフェース１１２０は、計算機１０００を通信網に接続するためのインタフェースである。この通信網は、例えば LAN（Local Area Network）や WAN（Wide Area Network）である。ネットワークインタフェース１１２０が通信網に接続する方法は、無線接続であってもよいし、有線接続であってもよい。

　ストレージデバイス１０８０は、処理装置２０の各機能構成部を実現するプログラムモジュールを記憶している。プロセッサ１０４０は、これら各プログラムモジュールをメモリ１０６０に読み出して実行することで、各プログラムモジュールに対応する機能を実現する。

　次に、本実施形態の作用および効果について説明する。本実施形態に係る処理装置２０によれば、予測式を示す情報に基づいて、各センサ１０の予測結果への寄与度を把握することができる。ひいては、所望の目的のために、適したセンサの組み合わせを導出することができる。

（第２の実施形態）
　図７は、第２の実施形態に係る処理装置２０の構成を例示する図である。本実施形態に係る処理装置２０は、以下に説明する点を除いて第１の実施形態に係る処理装置２０と同じである。

　本実施形態に係る処理装置２０は、抽出手段２２０をさらに備える。抽出手段２２０は、予測式における複数の特徴量に対する複数の重みに基づいて、集合１００から一以上のセンサ１０を抽出する。具体的には抽出手段２２０は、予測式において、複数の重みのうち予め定められた条件を満たす、または満たさない重みで重みづけられた特徴量の、出力元であるセンサ１０を抽出する。

　また、本実施形態において出力手段２５０は、抽出手段２２０で抽出されたセンサ１０および抽出されなかったセンサ１０の少なくとも一方を、識別可能な状態で出力する。なお、本実施形態において出力手段２５０は必ずしも予測式を示す情報を出力する必要は無い。以下に詳しく説明する。

　図８は、第２の実施形態に係る処理方法を例示するフローチャートである。本実施形態に係る処理方法は、抽出ステップＳ２２０をさらに含み、出力ステップＳ２５０では抽出ステップＳ２２０で抽出されたセンサ１０および抽出されなかったセンサ１０の少なくとも一方を、識別可能な状態で出力する点を除いて第１の実施形態に係る処理方法と同じである。抽出ステップＳ２２０では、予測式における複数の特徴量に対する複数の重みに基づいて、集合１００から一以上のセンサ１０が抽出される。具体的には、抽出ステップＳ２２０では、予測式において、複数の重みのうち予め定められた条件を満たす、または満たさない重みで重みづけられた特徴量の、出力元であるセンサ１０が抽出される。

　本処理方法は、本実施形態に係る処理装置２０により実現される。処理装置２０の動作について以下に詳しく説明する。

　本実施形態において、予測式生成ステップＳ２１０は第１の実施形態に係る予測式生成ステップＳ２１０と同様である。本実施形態では、予測式生成ステップＳ２１０に次いで抽出ステップＳ２２０の処理が行われる。

　抽出ステップＳ２２０において抽出手段２２０は、予測式における重みと、重みに関する予め定められた条件とに基づいて、その予測式において予測結果への寄与度が高いセンサ１０を抽出する。具体的には、抽出手段２２０は、予測式生成手段２１０から予測式を示す情報を取得する。そして、予測式を示す情報に示された各センサ１０の特徴量に対する重みの大きさを算出する。

　ここで、予測式ｚ＝ＷＸ＋ｂにおけるＷＸを、集合１００に含まれる各センサ１０の時系列データ１４に基づく特徴量ｘ_ｊ、および特徴量ｘ_ｊに対する重みｗ_ｊを用いて、ｗ_１ｘ_１＋ｗ_２ｘ_２＋・・・ｗ_Ｊｘ_Ｊと書き換えることができる。なお、ｗ_ｊはそれぞれ数値であっても良いしベクトルであってもよい。ｗ_ｊがベクトルである場合、ｗ_ｊの各要素は、ｘ_ｊの要素である各特徴量に対する重みである。そして、重みの大きさは、たとえばｗ_ｊのノルムである。一方、ｗ_ｊが数値である場合、重みの大きさはｗ_ｊの絶対値である。

　抽出手段２２０はさらに、算出した重みの大きさが予め定められた条件を満たすか否かを判定する。条件を示す情報は抽出手段２２０からアクセス可能な記憶装置に予め記憶されている。たとえば、条件が「重みの大きさが基準値以上である」等、予測結果への寄与度が高いセンサ１０についての条件を示す場合、抽出手段２２０はこの条件を満たす重みに対応するセンサ１０を抽出する。一方、条件が「重みの大きさが基準値以下である」等、予測結果への寄与が低いセンサ１０の条件を示す場合、抽出手段２２０はこの条件を満たさない重みに対応するセンサ１０を抽出する。そして抽出手段２２０は、抽出されたセンサ１０からなる組み合わせを示す組み合わせ情報を生成する。生成された組み合わせ情報には、予測式を示す情報が関連づけられる。

　なお、図３に示したような時系列データ１４において、センサ１０に対し吸着および離脱する分子に関する情報は、期間Ｐ１および期間Ｐ２のそれぞれの冒頭で大きく出力が変動する部分に強く反映されると考えられる。したがって、このような冒頭部分のデータに基づく特徴量の重みが大きくなると予測される。そして仮に、期間Ｐ１および期間Ｐ２のうち定常部分のデータに基づく特徴量の重みが大きい場合、その結果はノイズ等の影響を受けているとも考えられる。これらのことから、抽出手段２２０は、期間Ｐ１および期間Ｐ２の一部のデータのみに基づく特徴量に対する重みに基づいて、センサ１０を抽出しても良い。具体的には、期間Ｐ１および期間Ｐ２のそれぞれにおいて、期間のはじめから予め定められた時間後までの間のデータに基づく特徴量に対する重みに基づいて、センサ１０を抽出しても良い。

　次いで、出力ステップＳ２５０において出力手段２５０は、センサ１０の抽出結果に基づき、予測結果への寄与度が高いセンサ１０、または予測結果への寄与度が低いセンサ１０の少なくともいずれかを出力する。なお、出力手段２５０によるセンサ１０の出力とは、センサ１０を示す記号等の出力である。なお、出力手段２５０が、予測結果への寄与度が高いセンサ１０、および予測結果への寄与度が低いセンサ１０の両方を出力する場合、それらは互いに識別可能な状態で出力される。また、出力手段２５０はさらに予測式を示す情報を出力しても良い。

　具体的には予測結果への寄与度が高いセンサ１０、または予測結果への寄与度が低いセンサ１０の少なくともいずれかを示す表示が、処理装置２０に設けられた表示装置に表示される。また、出力手段２５０は外部の装置に対して予測結果への寄与度が高いセンサ１０、または予測結果への寄与度が低いセンサ１０の少なくともいずれかを示す情報を出力しても良いし、出力手段２５０からアクセス可能な記憶装置にこの情報を記憶させても良い。

　本実施形態においても、ユーザは出力手段２５０の出力に基づいて、第１の実施形態と同様に採用するセンサ１０の組み合わせを探索することができる。

　本実施形態に係る処理装置２０も、図６に示したような計算機１０００により実現可能である。本実施形態において、ストレージデバイス１０８０は、処理装置２０の抽出手段２２０を実現するプログラムモジュールをさらに記憶している。

　次に、本実施形態の作用および効果について説明する。本実施形態においては第１の実施形態と同様の作用および効果が得られる。くわえて、本実施形態に係る処理装置２０によれば、抽出手段２２０の抽出結果に基づいて、予測結果への寄与度が低い、または高いセンサ１０を把握することができる。ひいては、所望の目的のセンサを得るために、適したセンサの組み合わせをより明瞭に把握することができる。

（第３の実施形態）
　図９は、第３の実施形態に係る予測式生成手段２１０で行われる機械学習に用いられる予測モデルを例示する図である。本実施形態に係る処理装置２０は、以下に説明する点を除いて第２の実施形態に係る処理装置２０と同じである。

　本実施形態に係る処理装置２０では、予測式生成手段２１０は、センサ１０の検出環境に基づいた分岐を含むモデルを用いて予測式を生成する。また、出力手段２５０は、予測式に適した検出環境の条件であって、分岐の条件に基づく検出環境の条件を、予測式を示す情報に関連づけて出力する。

　センサ１０の出力は、対象ガスの成分のみならず、その検出環境、すなわち測定条件により変化しうる。したがって、好ましいセンサ１０の組み合わせは検出環境毎に異なる可能性がある。本実施形態では、予測式生成手段２１０が検出環境に基づいた分岐を含むモデルを用いて予測式を生成することにより、好ましいセンサ１０の組み合わせを検出環境に対応付けて導き出すことができる。

　検出環境は特に限定されないが、たとえば温度、湿度、気圧、夾雑ガスの種類、パージガスの種類、におい成分のサンプリング周期、対象物とセンサ１０との距離、センサ１０の周囲に存在する物体のうち少なくともいずれかを含む。温度、湿度、および気圧はそれぞれセンサ１０の周囲の温度、湿度、および気圧、具体的にはセンサ１０の官能部を取り巻く雰囲気の温度、湿度、および気圧である。夾雑ガスの種類は、センサ１０を対象ガスに曝す操作において、対象のにおい成分と共にセンサ１０に供給されるガスの種類である。具体的には夾雑ガスの種類としては、窒素等の不活性ガス、および空気等が挙げられる。パージガスの種類はセンサ１０から測定対象のガスを取り除く操作においてセンサ１０に供給されるガスである。具体的にはパージガスとしては、窒素等の不活性ガス、および空気等が挙げられる。におい成分のサンプリング周期は、センサ１０を測定対象のガスに曝す操作と、センサ１０から測定対象のガスを取り除く操作を繰り返し行う場合の繰り返し周期である。対象物とセンサ１０との距離は、特定の対象物の周囲にセンサ１０を配置して検出を行う場合の、対象物とセンサ１０との距離である。センサ１０の周囲に存在する物体は、特定の対象物の周囲に１０を配置して検出を行う場合の、対象物の種類である。

　機械学習に用いられるモデルは、具体的には複数のノードを含んだ階層構造を有する。そして一以上の中間ノードには分岐の条件として分岐式が位置し、最下層のアノードには予測式が位置する。本図において条件Ａ、条件Ｂ１および条件Ｂ２は分岐の条件であり、式１から式４はそれぞれ予測式である。なお、中間ノードの数やアノードの数等、モデルの具体的な構成は特に限定されない。

　本実施形態において予測式生成手段２１０が行う機械学習はたとえば、センサ１０の検出環境をさらに入力とした異種混合学習である。ここで、検出環境は、機械学習の入力である特徴量に関連づけられており、その特徴量の元となった時系列データ１４が得られた際の検出環境である。異種混合学習によれば、分岐の条件を含む具体的なモデルが予測式と共に生成される。

　本実施形態において予測式生成手段２１０は予測式生成ステップＳ２１０において複数の検出環境で得られた複数の学習用データセットを入力とした機械学習を行う。上記した通り、各学習用データセットはセンサ１０の集合１００で得られた複数の特徴量と正解データとからなる。そして、機械学習の結果として、一以上の予測式が生成される。

　ここで、各予測式には前提となる検出環境の条件が紐づけられる。各予測式は、その予測式に関連づけられた検出環境の条件を満たす環境下で特に有効である。検出環境の条件は予測式と同時に生成されるモデルにおける分岐条件に基づく。詳しくは、検出環境の条件は生成されたモデルにおいて、スタートからアノードの予測式に至るまでに通る分岐条件とその判定結果で定められる。たとえば本図の例において、条件Ａが「温度＞Ｔ_１」であり、条件Ｂ２が「湿度＞Ｈ_１」である場合、式３に関連づけられる検出環境の条件は、「温度がＴ_１以下であり、かつ湿度がＨ_１より高い」である。

　次いで、抽出手段２２０により抽出ステップＳ２２０が行われる。本実施形態に係る抽出ステップＳ２２０では、ユーザにより設定された特定の使用環境で好適に使用可能なセンサ１０の組み合わせが抽出される。処理装置２０はたとえばユーザからの入力を受け付け可能であり、抽出手段２２０はユーザにより入力された使用環境を示す情報を取得する。ただし、使用環境を示す情報は予め定められ、抽出手段２２０からアクセス可能な記憶装置に保持されていても良い。使用環境を示す情報はたとえば、温度、湿度、気圧、夾雑ガスの種類、パージガスの種類、におい成分のサンプリング周期、対象物とセンサ１０との距離、センサ１０の周囲に存在する物体のうち一以上である。

　そして、抽出手段２２０は、予測式生成手段２１０が生成した複数の予測式の中から、使用環境が満たす検出環境の条件に対応づけられた予測式を選択する。その上で抽出手段２２０は、選択した予測式に対し、第２の実施形態で説明したのと同様にセンサ１０を抽出し、組み合わせ情報を生成する。組み合わせ情報には検出環境の条件を示す情報がさらに関連づけられる。

　また、出力手段２５０は出力ステップＳ２５０において、第２の実施形態で説明した出力ステップＳ２５０の処理と同様の処理を行う。ただし、出力手段２５０は、予測式に関連づけられた検出環境の条件をさらに出力しても良い。

　なお、使用環境が、複数の予測式についての検出環境の条件を満たす場合、抽出手段２２０は複数の予測式を選択し、各予測式に対して組み合わせ情報を生成しても良い。また、出力手段２５０は、複数の組み合わせの出力を行っても良い。ただし、出力手段２５０は、組み合わせ毎に識別可能な状態で予測式を示す情報等を出力する。

　なお、機械学習で用いる分岐の条件を含む具体的なモデルは、機械学習により生成される代わりに、ユーザにより設定されても良い。この場合、機械学習は異種混合学習でなくても良い。

　また、異種混合学習では、学習の繰り返しの中で、予測式と共に分岐条件が繰り返し更新されうるが、学習の途中の段階で得られたモデルを、以降の学習で固定して用いても良い。

　また、本実施形態に係る処理装置２０は第１の実施形態に係る処理装置２０と同様に、抽出手段２２０を備えていなくても良い。その場合、出力手段２５０は予測式生成手段２１０で生成された一以上の予測式を示す情報を出力する。

　また、抽出手段２２０は予測式生成手段２１０で生成された全ての予測式に対し組み合わせ情報を生成し、出力手段２５０が生成された全ての組み合わせ情報について、センサ１０、予測式を示す情報、および検出環境の条件を出力しても良い。その場合、ユーザは出力された情報を総合的に見て、複数の検出環境の条件の全体において好ましいセンサ１０の組み合わせを判断することができる。たとえば、ユーザはいずれの組み合わせにも含まれないセンサ１０を、使用するセンサ１０の候補から除外することができる。または、全ての組み合わせに含まれるセンサ１０のみを候補として残すことができる。また、関連づけられた検出環境の条件が、実用上想定しにくい極端な条件であるような組み合わせにのみ含まれるセンサ１０を、候補から除外することができる。

　次に、本実施形態の作用および効果について説明する。本実施形態においては第１の実施形態と同様の作用および効果が得られる。くわえて、予測式生成手段２１０が検出環境に基づいた分岐を含むモデルを用いて予測式を生成することにより、好ましいセンサ１０の組み合わせを検出環境に対応付けて導き出すことができる。

（第４の実施形態）
　図１０は、第４の実施形態に係る処理装置２０の構成を例示する図である。また、図１１は、第４の実施形態に係る処理方法を例示するフローチャートである。本実施形態に係る処理装置２０は、以下に説明する点を除いて第２および第３の実施形態の少なくともいずれかに係る処理装置２０と同じである。

　図１０の例において処理装置２０は、予測式の予測精度を算出する予測精度算出手段２３０、およびセンサ１０の組み合わせを評価する評価手段２４０をさらに備える。また、図１１の例において処理方法は、予測精度算出ステップＳ２３０および評価ステップＳ２４０をさらに含む。ただし、本実施形態に係る処理装置２０は、予測精度算出手段２３０および評価手段２４０の少なくとも一方を備えていなくても良い。また、本実施形態に係る処理方法は、予測精度算出ステップＳ２３０および評価ステップＳ２４０の少なくとも一方を含まなくても良い。

　本実施形態の予測式生成ステップＳ２１０では、第１から第３の実施形態の少なくともいずれかに係る予測式生成ステップＳ２１０と同様の処理が行われる。次いで、本実施形態の抽出ステップＳ２２０では、第２および第３の実施形態の少なくともいずれかに係る抽出ステップＳ２２０と同様の処理が行われる。

　本実施形態に係る処理装置２０では、抽出ステップＳ２２０に次いで、予測精度算出手段２３０により予測精度算出ステップＳ２３０の処理が行われる。なお、予測精度算出ステップＳ２３０の処理が行われるタイミングは予測式生成ステップＳ２１０の後かつ、後述する評価ステップＳ２４０の前である限り、特に限定されない。なお、処理装置２０が評価手段２４０を備えない場合には、予測精度算出ステップＳ２３０の処理が行われるタイミングは予測式生成ステップＳ２１０の後かつ、出力ステップＳ２５０の前であればよい。

　予測精度算出ステップＳ２３０では、予測精度算出手段２３０が各予測式の予測精度を算出する。予測精度の算出には、学習用データセットと同様のデータセットが評価用データセットとして用いられる。すなわち、評価用データセットは複数の特徴量と正解データとを含む。

　ただし、複数の学習用データセットと複数の評価用データセットには、互いに全く同じデータセットは含まれない。たとえば処理装置２０の外部または内部で生成された、互いに異なる複数のデータセットのうちの一部を複数の学習用データセットとして用い、残りを複数の評価用データセットとして用いることができる。

　予測精度は回帰に基づく予測については回帰精度であり、たとえば最小二乗誤差または平均平方二乗誤差（ＲＭＳＥ）である。また、予測精度は判別に基づく予測については判別精度であり、たとえば適合率、再現率、Ｆ値、正答率、またはＲＯＣ＿ＡＵＣである。

　予測精度算出手段２３０が予測精度を算出する方法の一例について詳しく説明する。予測式生成手段２１０が学習用データセットを取得または生成するのと同様の方法で、予測精度算出手段２３０は複数の評価用データセットを取得または生成することができる。予測精度算出手段２３０は評価用データセットに含まれる特徴量を、精度を評価しようとする予測式に入力することで、予測結果を得る。そして、得られた予測結果と、評価用データセットに含まれる正解データとが一致するか否かを判定する。そして、予測精度算出手段２３０は複数の評価用データセットについて同様の処理を行い、予測結果と正解データとが一致する確率を、その予測式の予測精度として算出する。算出された予測精度は、その予測式に関連づけられる。

　複数の評価用データセットは、互いに異なる検出環境での測定結果に基づくものであっても良い。ただし、第１または第２の実施形態のように、一つの集合１００に対して一つの予測式が生成される場合、評価用データセットは、学習用データセットが得られた検出環境に近い検出環境で得られたデータであることが好ましい。第３の実施形態のように一つの集合１００に対して複数の予測式が生成される場合、各予測式について、その予測式に関連づけられた検出環境の条件を満たす環境で得られた評価用データセットのみが予測精度の算出に用いられる。

　次いで、評価ステップＳ２４０の処理が評価手段２４０により行われる。評価手段２４０は、センサ１０の組み合わせを、たとえばその組み合わせを採用する場合に用いる予測式の予測精度と、その組み合わせを採用する場合のコストとの少なくとも一方に基づいて評価する。なかでも評価手段２４０は、組み合わせ情報に示されたセンサ１０の組み合わせを採用する場合のコストに少なくとも基づいて、センサ１０の組み合わせを評価することが好ましい。

　コストにはたとえば初期コストおよびランニングコストが含まれる。初期コストとしては、センサ１０の製造コストや調達コスト等が挙げられる。また、ランニングコストとしては、管理コスト、センサ１０の劣化等に起因する交換コスト、扱いにおける人的手間等が挙げられる。

　評価手段２４０によりアクセス可能な記憶装置には、予め各センサ１０のコストを示すパラメータが保持されており、評価手段２４０は、組み合わせに含まれるセンサ１０のコストを示すパラメータを記憶装置から取得する。そして、組み合わせに含まれる全てのセンサ１０についてのコストを示すパラメータを合算し、合算値を得る。

　また、評価手段２４０は予測精度算出手段２３０から、その組み合わせ情報に関連づけられた予測式の予測精度を取得する。

　評価手段２４０はさらに評価関数を用いて組み合わせを評価する。評価関数は一以上の要因に基づき評価値を算出する関数である。具体的には評価関数は、各要因における評価結果を示す評価パラメータの線形和で表される。たとえば要因をコストとした評価パラメータは、上記の様に算出された合算値であり、要因を精度とした評価パラメータは予測精度算出手段２３０から取得した予測精度である。また、評価関数では、各評価パラメータに対して係数が掛けられ、評価結果に対する要因ごとの重みのバランスがとられたり、評価の方向性が定められたりしている。係数は、評価パラメータの種類毎に定められている。

　評価手段２４０は評価関数にコストを示すパラメータの合算値および予測精度を適用することにより、評価結果として評価値を算出する。なお、評価手段２４０により得られる評価結果は、コストに関する合算値は小さいほど高くなり、予測精度が良いほど高くなる。評価関数を示す情報は評価手段２４０によりアクセス可能な記憶装置に予め保持されている。算出された評価値は、組み合わせ情報に関連づけられる。

　評価手段２４０は、さらに組み合わせに含まれるセンサ１０の数に基づき、センサ１０の組み合わせを評価しても良い。たとえば、組み合わせに含まれるセンサ１０の数を要因とする場合、たとえば、センサ１０の数が、評価関数における評価パラメータとなり得る。なお、評価手段２４０により得られる評価結果は、組み合わせに含まれるセンサ１０の数が少ないほど高くなる。

　第３の実施形態のように一つの集合１００に対して複数の予測式が生成される場合、評価手段２４０は、さらに組み合わせ情報に関連づけられた検出環境の条件に基づき、センサ１０の組み合わせを評価しても良い。たとえば、検出環境の条件の広さを要因とする場合、たとえば、検出環境の条件として示された温度、湿度、気圧、周期、距離等の範囲の幅や、ガスや物体の選択肢の数が、評価関数における評価パラメータとなり得る。また、検出環境の条件の実用性を要因とする場合、検出環境の条件として示された温度、湿度、気圧、周期、距離等の範囲の中心値と、予め定められた標準値との距離が評価関数における評価パラメータとなり得る。すなわち、この距離が小さいほど実用性が高いといえる。なお、評価手段２４０により得られる評価結果は、検出環境の条件が広いほど高くなり、検出環境の条件の実用性が高いほど高くなる。

　出力ステップＳ２５０において出力手段２５０は、さらに評価手段２４０で算出された評価結果をセンサ１０の組み合わせに関連づけて出力する。ユーザはセンサ１０の複数の組み合わせを、評価結果を用いて互いに比較することができる。たとえば、集合１００の構成を変えながら処理装置２０による処理を繰り返す場合、各集合１００による結果を評価結果により比較し、最も優れるセンサ１０の組み合わせを導出することができる。また、第３の実施形態のように、一つの集合１００に基づき複数の組み合わせ情報が生成される場合に、評価結果によりそれらを互いに比較することができる。なお、出力手段２５０は評価結果に加えて、または、評価結果に代えて、予測式の予測精度を出力しても良い。

　さらに、第３の実施形態で説明した様に、たとえば出力された情報を総合的に見て、複数の検出環境の条件の全体において好ましいセンサ１０の組み合わせを判断しようとする場合について説明する。この場合たとえば、集合１００に対して生成される複数の組み合わせ情報に対する評価値が、全て予め定められた閾値を超え、かつ、評価値の平均値が大きくなるように、集合１００のセンサ１０を組み替える。そうすることで、目的に適したセンサ１０の組み合わせが集合１００として得られる。このような集合１００の組み替えは、ユーザが手作業で行うことができる。ただし、学習データセットおよび評価データセットがシミュレーションにより得られる場合には、集合１００の組み替えはシミュレーション装置により仮想的に行われても良い。

　また、本実施形態に係る処理装置２０では、複数の集合１００に基づく組み合わせに対し、さらに評価結果の比較が行われても良い。たとえば予測式生成手段２１０は、複数の集合１００のそれぞれについて機械学習を行う。また抽出手段２２０は、複数の集合１００のそれぞれに対し組み合わせ情報を生成する。そして評価手段２４０は、生成された複数の組み合わせ情報が示す複数の組み合わせをそれぞれ評価する。出力手段２５０は、複数の組み合わせのうち評価手段２４０による評価結果が最も優れる（高い）組み合わせを出力する。なお、出力手段２５０は複数の組み合わせを、評価結果が最も優れる組み合わせが識別可能な状態で出力しても良い。

　本実施形態に係る処理装置２０も、図６に示したような計算機１０００により実現可能である。本実施形態において、ストレージデバイス１０８０は、処理装置２０の予測精度算出手段２３０および評価手段２４０をそれぞれ実現するプログラムモジュールをさらに記憶している。

　次に、本実施形態の作用および効果について説明する。本実施形態においては第１の実施形態と同様の作用および効果が得られる。くわえて、予測精度算出手段２３０で予測式の予測精度が算出されたり、評価手段２４０による評価が行われたりすることで、センサ１０の複数の組み合わせの有効性を互いに比較することができる。

　以上、図面を参照して本発明の実施形態について述べたが、これらは本発明の例示であり、上記以外の様々な構成を採用することもできる。たとえば、上述の説明で用いたシーケンス図やフローチャートでは、複数の工程（処理）が順番に記載されているが、各実施形態で実行される工程の実行順序は、その記載の順番に制限されない。各実施形態では、図示される工程の順番を内容的に支障のない範囲で変更することができる。また、上述の各実施形態は、内容が相反しない範囲で組み合わせることができる。

　以上、図面を参照して本発明の実施形態について述べたが、これらは本発明の例示であり、上記以外の様々な構成を採用することもできる。

　上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
１－１．　複数種類のセンサの集合からの出力に基づいた複数の特徴量と正解データとを入力とした機械学習を行うことにより、前記複数の特徴量を変数とする式であって、におい成分に関する予測を行うための予測式を生成する予測式生成手段と、
　前記予測式における前記複数の特徴量に対する複数の重みに基づいて、前記集合から一以上の前記センサを抽出する抽出手段と、
　前記抽出手段で抽出された前記センサおよび抽出されなかった前記センサの少なくとも一方を、識別可能な状態で出力する出力手段とを備え、
　前記抽出手段は、前記予測式において、前記複数の重みのうち予め定められた条件を満たす、または満たさない前記重みで重みづけられた前記特徴量の、出力元である前記センサを抽出する処理装置。
１－２．　複数種類のセンサの集合からの出力に基づいた複数の特徴量と正解データとを入力とした機械学習を行うことにより、前記複数の特徴量を変数とする式であって、におい成分に関する予測を行うための予測式を生成する予測式生成手段と、
　前記予測式を示す情報として、前記予測式における前記複数の特徴量に対する複数の重みを、それぞれ前記特徴量に関連づけて出力する出力手段とを備える処理装置。
１－３．　１－２．に記載の処理装置において、
　前記予測式における前記複数の特徴量に対する複数の重みに基づいて、前記集合から一以上の前記センサを抽出する抽出手段をさらに備え、
　前記抽出手段は、前記予測式において、前記複数の重みのうち予め定められた条件を満たす、または満たさない前記重みで重みづけられた前記特徴量の、出力元である前記センサを抽出する処理装置。
１－４．　１－１．または１－３．に記載の処理装置において、
　前記抽出手段は、抽出された前記センサからなる組み合わせを示す組み合わせ情報を生成し、
　前記組み合わせを採用する場合のコストに少なくとも基づいて、前記組み合わせを評価する評価手段をさらに備える処理装置。
１－５．　１－４．に記載の処理装置において、
　前記予測式生成手段は、複数の前記集合のそれぞれについて前記機械学習を行い、
　前記抽出手段は、前記複数の集合のそれぞれに対し前記組み合わせ情報を生成し、
　前記評価手段は、生成された前記複数の組み合わせ情報が示す前記複数の組み合わせをそれぞれ評価し、
　前記出力手段は、前記複数の組み合わせのうち前記評価手段による評価結果が最も優れる前記組み合わせを出力する処理装置。
１－６．　１－１．から１－５．のいずれか一つに記載の処理装置において、
　前記予測式生成手段は、前記センサの検出環境に基づいた分岐を含むモデルを用いて前記予測式を生成し、
　前記出力手段は、前記予測式に適した前記検出環境の条件であって、前記分岐の条件に基づく前記検出環境の条件を、前記予測式を示す情報に関連づけてさらに出力する処理装置。
１－７．　１－６．に記載の処理装置において、
　前記機械学習は、前記特徴量に関連づけられた前記センサの検出環境をさらに入力とした異種混合学習であり、
　前記分岐の条件は、前記異種混合学習により生成される処理装置。
１－８．　１－６．または１－７．に記載の処理装置において、
　前記検出環境は、温度、湿度、気圧、夾雑ガスの種類、パージガスの種類、前記におい成分のサンプリング周期、対象物と前記センサとの距離、前記センサの周囲に存在する物体のうち少なくともいずれかを含む処理装置。
１－９．　１－１．から１－８．のいずれか一つに記載の処理装置において、
　前記予測式の予測精度を算出する予測精度算出手段をさらに備える処理装置。
２－１．　複数種類のセンサの集合からの出力に基づいた複数の特徴量と正解データとを入力とした機械学習を行うことにより、前記複数の特徴量を変数とする式であって、におい成分に関する予測を行うための予測式を生成する予測式生成ステップと、
　前記予測式における前記複数の特徴量に対する複数の重みに基づいて、前記集合から一以上の前記センサを抽出する抽出ステップと、
　前記抽出ステップで抽出された前記センサおよび抽出されなかった前記センサの少なくとも一方を、識別可能な状態で出力する出力ステップとを含み、
　前記抽出ステップでは、前記予測式において、前記複数の重みのうち予め定められた条件を満たす、または満たさない前記重みで重みづけられた前記特徴量の、出力元である前記センサを抽出する処理方法。
２－２．　複数種類のセンサの集合からの出力に基づいた複数の特徴量と正解データとを入力とした機械学習を行うことにより、前記複数の特徴量を変数とする式であって、におい成分に関する予測を行うための予測式を生成する予測式生成ステップと、
　前記予測式を示す情報として、前記予測式における前記複数の特徴量に対する複数の重みを、それぞれ前記特徴量に関連づけて出力する出力ステップとを含む処理方法。
２－３．　２－２．に記載の処理方法において、
　前記予測式における前記複数の特徴量に対する複数の重みに基づいて、前記集合から一以上の前記センサを抽出する抽出ステップをさらに含み、
　前記抽出ステップでは、前記予測式において、前記複数の重みのうち予め定められた条件を満たす、または満たさない前記重みで重みづけられた前記特徴量の、出力元である前記センサを抽出する処理方法。
２－４．　２－１．または２－３．に記載の処理方法において、
　前記抽出ステップでは、抽出された前記センサからなる組み合わせを示す組み合わせ情報を生成し、
　前記組み合わせを採用する場合のコストに少なくとも基づいて、前記組み合わせを評価する評価ステップをさらに含む処理方法。
２－５．　２－４．に記載の処理方法において、
　前記予測式生成ステップでは、複数の前記集合のそれぞれについて前記機械学習を行い、
　前記抽出ステップでは、前記複数の集合のそれぞれに対し前記組み合わせ情報を生成し、
　前記評価ステップでは、生成された前記複数の組み合わせ情報が示す前記複数の組み合わせをそれぞれ評価し、
　前記出力ステップでは、前記複数の組み合わせのうち前記評価ステップにおける評価結果が最も優れる前記組み合わせをさらに出力する処理方法。
２－６．　２－１．から２－５．のいずれか一つに記載の処理方法において、
　前記予測式生成ステップでは、前記センサの検出環境に基づいた分岐を含むモデルを用いて前記予測式を生成し、
　前記出力ステップでは、前記予測式に適した前記検出環境の条件であって、前記分岐の条件に基づく前記検出環境の条件を、前記予測式を示す情報に関連づけてさらに出力する処理方法。
２－７．　２－６．に記載の処理方法において、
　前記機械学習は、前記特徴量に関連づけられた前記センサの検出環境をさらに入力とした異種混合学習であり、
　前記分岐の条件は、前記異種混合学習により生成される処理方法。
２－８．　２－６．または２－７．に記載の処理方法において、
　前記検出環境は、温度、湿度、気圧、夾雑ガスの種類、パージガスの種類、前記におい成分のサンプリング周期、対象物と前記センサとの距離、前記センサの周囲に存在する物体のうち少なくともいずれかを含む処理方法。
２－９．　２－１．から２－８．のいずれか一つに記載の処理方法において、
　前記予測式の予測精度を算出する予測精度算出ステップをさらに備える処理方法。
３－１．　２－１．から２－９．のいずれか一つに記載の処理方法の各ステップをコンピュータに実行させるプログラム。

Claims

　複数種類のセンサの集合からの出力に基づいた複数の特徴量と正解データとを入力とした機械学習を行うことにより、前記複数の特徴量を変数とする式であって、におい成分に関する予測を行うための予測式を生成する予測式生成手段と、
　前記予測式における前記複数の特徴量に対する複数の重みに基づいて、前記集合から一以上の前記センサを抽出する抽出手段と、
　前記抽出手段で抽出された前記センサおよび抽出されなかった前記センサの少なくとも一方を、識別可能な状態で出力する出力手段とを備え、
　前記抽出手段は、前記予測式において、前記複数の重みのうち予め定められた条件を満たす、または満たさない前記重みで重みづけられた前記特徴量の、出力元である前記センサを抽出する処理装置。
　複数種類のセンサの集合からの出力に基づいた複数の特徴量と正解データとを入力とした機械学習を行うことにより、前記複数の特徴量を変数とする式であって、におい成分に関する予測を行うための予測式を生成する予測式生成手段と、
　前記予測式を示す情報として、前記予測式における前記複数の特徴量に対する複数の重みを、それぞれ前記特徴量に関連づけて出力する出力手段とを備える処理装置。
　請求項２に記載の処理装置において、
　前記予測式における前記複数の特徴量に対する複数の重みに基づいて、前記集合から一以上の前記センサを抽出する抽出手段をさらに備え、
　前記抽出手段は、前記予測式において、前記複数の重みのうち予め定められた条件を満たす、または満たさない前記重みで重みづけられた前記特徴量の、出力元である前記センサを抽出する処理装置。
　請求項１または３に記載の処理装置において、
　前記抽出手段は、抽出された前記センサからなる組み合わせを示す組み合わせ情報を生成し、
　前記組み合わせを採用する場合のコストに少なくとも基づいて、前記組み合わせを評価する評価手段をさらに備える処理装置。
　請求項４に記載の処理装置において、
　前記予測式生成手段は、複数の前記集合のそれぞれについて前記機械学習を行い、
　前記抽出手段は、前記複数の集合のそれぞれに対し前記組み合わせ情報を生成し、
　前記評価手段は、生成された前記複数の組み合わせ情報が示す前記複数の組み合わせをそれぞれ評価し、
　前記出力手段は、前記複数の組み合わせのうち前記評価手段による評価結果が最も優れる前記組み合わせを出力する処理装置。
　請求項１から５のいずれか一項に記載の処理装置において、
　前記予測式生成手段は、前記センサの検出環境に基づいた分岐を含むモデルを用いて前記予測式を生成し、
　前記出力手段は、前記予測式に適した前記検出環境の条件であって、前記分岐の条件に基づく前記検出環境の条件を、前記予測式を示す情報に関連づけてさらに出力する処理装置。
　請求項６に記載の処理装置において、
　前記機械学習は、前記特徴量に関連づけられた前記センサの検出環境をさらに入力とした異種混合学習であり、
　前記分岐の条件は、前記異種混合学習により生成される処理装置。
　請求項６または７に記載の処理装置において、
　前記検出環境は、温度、湿度、気圧、夾雑ガスの種類、パージガスの種類、前記におい成分のサンプリング周期、対象物と前記センサとの距離、前記センサの周囲に存在する物体のうち少なくともいずれかを含む処理装置。
　請求項１から８のいずれか一項に記載の処理装置において、
　前記予測式の予測精度を算出する予測精度算出手段をさらに備える処理装置。
　複数種類のセンサの集合からの出力に基づいた複数の特徴量と正解データとを入力とした機械学習を行うことにより、前記複数の特徴量を変数とする式であって、におい成分に関する予測を行うための予測式を生成する予測式生成ステップと、
　前記予測式における前記複数の特徴量に対する複数の重みに基づいて、前記集合から一以上の前記センサを抽出する抽出ステップと、
　前記抽出ステップで抽出された前記センサおよび抽出されなかった前記センサの少なくとも一方を、識別可能な状態で出力する出力ステップとを含み、
　前記抽出ステップでは、前記予測式において、前記複数の重みのうち予め定められた条件を満たす、または満たさない前記重みで重みづけられた前記特徴量の、出力元である前記センサを抽出する処理方法。
　複数種類のセンサの集合からの出力に基づいた複数の特徴量と正解データとを入力とした機械学習を行うことにより、前記複数の特徴量を変数とする式であって、におい成分に関する予測を行うための予測式を生成する予測式生成ステップと、
　前記予測式を示す情報として、前記予測式における前記複数の特徴量に対する複数の重みを、それぞれ前記特徴量に関連づけて出力する出力ステップとを含む処理方法。
　請求項１１に記載の処理方法において、
　前記予測式における前記複数の特徴量に対する複数の重みに基づいて、前記集合から一以上の前記センサを抽出する抽出ステップをさらに含み、
　前記抽出ステップでは、前記予測式において、前記複数の重みのうち予め定められた条件を満たす、または満たさない前記重みで重みづけられた前記特徴量の、出力元である前記センサを抽出する処理方法。
　請求項１０または１２に記載の処理方法において、
　前記抽出ステップでは、抽出された前記センサからなる組み合わせを示す組み合わせ情報を生成し、
　前記組み合わせを採用する場合のコストに少なくとも基づいて、前記組み合わせを評価する評価ステップをさらに含む処理方法。
　請求項１３に記載の処理方法において、
　前記予測式生成ステップでは、複数の前記集合のそれぞれについて前記機械学習を行い、
　前記抽出ステップでは、前記複数の集合のそれぞれに対し前記組み合わせ情報を生成し、
　前記評価ステップでは、生成された前記複数の組み合わせ情報が示す前記複数の組み合わせをそれぞれ評価し、
　前記出力ステップでは、前記複数の組み合わせのうち前記評価ステップにおける評価結果が最も優れる前記組み合わせをさらに出力する処理方法。
　請求項１０から１４のいずれか一項に記載の処理方法において、
　前記予測式生成ステップでは、前記センサの検出環境に基づいた分岐を含むモデルを用いて前記予測式を生成し、
　前記出力ステップでは、前記予測式に適した前記検出環境の条件であって、前記分岐の条件に基づく前記検出環境の条件を、前記予測式を示す情報に関連づけてさらに出力する処理方法。
　請求項１５に記載の処理方法において、
　前記機械学習は、前記特徴量に関連づけられた前記センサの検出環境をさらに入力とした異種混合学習であり、
　前記分岐の条件は、前記異種混合学習により生成される処理方法。
　請求項１５または１６に記載の処理方法において、
　前記検出環境は、温度、湿度、気圧、夾雑ガスの種類、パージガスの種類、前記におい成分のサンプリング周期、対象物と前記センサとの距離、前記センサの周囲に存在する物体のうち少なくともいずれかを含む処理方法。
　請求項１０から１７のいずれか一項に記載の処理方法において、
　前記予測式の予測精度を算出する予測精度算出ステップをさらに備える処理方法。
　請求項１０から１８のいずれか一項に記載の処理方法の各ステップをコンピュータに実行させるプログラム。