JPWO2020065806A1 - 処理装置、処理方法、およびプログラム - Google Patents

処理装置、処理方法、およびプログラム Download PDF

Info

Publication number
JPWO2020065806A1
JPWO2020065806A1 JP2020547701A JP2020547701A JPWO2020065806A1 JP WO2020065806 A1 JPWO2020065806 A1 JP WO2020065806A1 JP 2020547701 A JP2020547701 A JP 2020547701A JP 2020547701 A JP2020547701 A JP 2020547701A JP WO2020065806 A1 JPWO2020065806 A1 JP WO2020065806A1
Authority
JP
Japan
Prior art keywords
sensor
prediction formula
prediction
output
sensors
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020547701A
Other languages
English (en)
Other versions
JP7063389B2 (ja
Inventor
江藤 力
力 江藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2020065806A1 publication Critical patent/JPWO2020065806A1/ja
Application granted granted Critical
Publication of JP7063389B2 publication Critical patent/JP7063389B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/0004Gaseous mixtures, e.g. polluted air
    • G01N33/0009General constructional details of gas analysers, e.g. portable test equipment
    • G01N33/0027General constructional details of gas analysers, e.g. portable test equipment concerning the detector
    • G01N33/0036Specially adapted to detect a particular component
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01DMEASURING NOT SPECIALLY ADAPTED FOR A SPECIFIC VARIABLE; ARRANGEMENTS FOR MEASURING TWO OR MORE VARIABLES NOT COVERED IN A SINGLE OTHER SUBCLASS; TARIFF METERING APPARATUS; MEASURING OR TESTING NOT OTHERWISE PROVIDED FOR
    • G01D21/00Measuring or testing not otherwise provided for
    • G01D21/02Measuring two or more variables by means not covered by a single other subclass
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N5/00Analysing materials by weighing, e.g. weighing small particles separated from a gas or liquid
    • G01N5/02Analysing materials by weighing, e.g. weighing small particles separated from a gas or liquid by absorbing or adsorbing components of a material and determining change of weight of the adsorbent, e.g. determining moisture content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Combustion & Propulsion (AREA)
  • Medicinal Chemistry (AREA)
  • Food Science & Technology (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Algebra (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Investigating Or Analyzing Materials By The Use Of Fluid Adsorption Or Reactions (AREA)
  • Testing Or Calibration Of Command Recording Devices (AREA)
  • Investigating Or Analyzing Materials By The Use Of Electric Means (AREA)

Abstract

処理装置(20)は、予測式生成手段(210)および出力手段(250)を備える。予測式生成手段(210)は、複数種類のセンサの集合からの出力に基づいた複数の特徴量と正解データとを入力とした機械学習を行うことにより、前記複数の特徴量を変数とする式であって、におい成分に関する予測を行うための予測式を生成する。出力手段(250)は、予測式を示す情報として、複数の重みを、それぞれ特徴量に関連づけて出力する。

Description

本発明は処理装置、処理方法、およびプログラムに関する。
ガスをセンサで測定することにより、ガスに関する情報を得る技術が開発されている。
特許文献1は、複数のセンサ素子を設けた匂いセンサを開示している。具体的には、複数のセンサ素子にはそれぞれ異なる特性を有する物質吸着膜が設けられており、各センサ素子は作用させようとする分子に特異的な反応を示す構成をとれることが開示されている。
国際公開第2017/085939号
しかし、特許文献1には、検出の目的に応じてセンサ素子の組み合わせをどのように選定すればよいかについて開示されていない。
本発明は、上記の課題に鑑みてなされたものである。本発明の目的は、所望の目的のために、適したセンサの組み合わせを導出する技術を提供することにある。
本発明の第1の処理装置は、
複数種類のセンサの集合からの出力に基づいた複数の特徴量と正解データとを入力とした機械学習を行うことにより、前記複数の特徴量を変数とする式であって、におい成分に関する予測を行うための予測式を生成する予測式生成手段と、
前記予測式における前記複数の特徴量に対する複数の重みに基づいて、前記集合から一以上の前記センサを抽出する抽出手段と、
前記抽出手段で抽出された前記センサおよび抽出されなかった前記センサの少なくとも一方を、識別可能な状態で出力する出力手段とを備え、
前記抽出手段は、前記予測式において、前記複数の重みのうち予め定められた条件を満たす、または満たさない前記重みで重みづけられた前記特徴量の、出力元である前記センサを抽出する。
本発明の第2の処理装置は、
複数種類のセンサの集合からの出力に基づいた複数の特徴量と正解データとを入力とした機械学習を行うことにより、前記複数の特徴量を変数とする式であって、におい成分に関する予測を行うための予測式を生成する予測式生成手段と、
前記予測式を示す情報として、前記予測式における前記複数の特徴量に対する複数の重みを、それぞれ前記特徴量に関連づけて出力する出力手段とを備える。
本発明の第1の処理方法は、
複数種類のセンサの集合からの出力に基づいた複数の特徴量と正解データとを入力とした機械学習を行うことにより、前記複数の特徴量を変数とする式であって、におい成分に関する予測を行うための予測式を生成する予測式生成ステップと、
前記予測式における前記複数の特徴量に対する複数の重みに基づいて、前記集合から一以上の前記センサを抽出する抽出ステップと、
前記抽出ステップで抽出された前記センサおよび抽出されなかった前記センサの少なくとも一方を、識別可能な状態で出力する出力ステップとを含み、
前記抽出ステップでは、前記予測式において、前記複数の重みのうち予め定められた条件を満たす、または満たさない前記重みで重みづけられた前記特徴量の、出力元である前記センサを抽出する。
本発明の第2の処理方法は、
複数種類のセンサの集合からの出力に基づいた複数の特徴量と正解データとを入力とした機械学習を行うことにより、前記複数の特徴量を変数とする式であって、におい成分に関する予測を行うための予測式を生成する予測式生成ステップと、
前記予測式を示す情報として、前記予測式における前記複数の特徴量に対する複数の重みを、それぞれ前記特徴量に関連づけて出力する出力ステップとを含む。
本発明のプログラムは、
本発明の処理方法の各ステップをコンピュータに実行させる。
本発明によれば、所望の目的のために、適したセンサの組み合わせを導出する技術を提供できる。
上述した目的、およびその他の目的、特徴および利点は、以下に述べる好適な実施の形態、およびそれに付随する以下の図面によってさらに明らかになる。
第1の実施形態に係る処理装置の構成を例示する図である。 センサを例示する図である。 時系列データを例示する図である。 複数種類のセンサの集合からのセンサ出力データを例示する図である。 第1の実施形態に係る処理方法を例示するフローチャートである。 処理装置を実現するための計算機を例示する図である。 第2の実施形態に係る処理装置の構成を例示する図である。 第2の実施形態に係る処理方法を例示するフローチャートである。 第3の実施形態に係る予測式生成手段で行われる機械学習に用いられる予測モデルを例示する図である。 第4の実施形態に係る処理装置の構成を例示する図である。 第4の実施形態に係る処理方法を例示するフローチャートである。
以下、本発明の実施の形態について、図面を用いて説明する。尚、すべての図面において、同様な構成要素には同様の符号を付し、適宜説明を省略する。
なお、以下に示す説明において、特に説明する場合を除き、各装置の各構成要素は、ハードウエア単位の構成ではなく、機能単位のブロックを示している。各装置の各構成要素は、任意のコンピュータのCPU、メモリ、メモリにロードされた本図の構成要素を実現するプログラム、そのプログラムを格納するハードディスクなどの記憶メディア、ネットワーク接続用インタフェースを中心にハードウエアとソフトウエアの任意の組合せによって実現される。そして、その実現方法、装置には様々な変形例がある。
(第1の実施形態)
図1は、第1の実施形態に係る処理装置20の構成を例示する図である。本実施形態に係る処理装置20は、予測式生成手段210および出力手段250を備える。予測式生成手段210は、複数種類のセンサの集合からの出力に基づいた複数の特徴量と正解データとを入力とした機械学習を行うことにより、複数の特徴量を変数とする式であって、におい成分に関する予測を行うための予測式を生成する。出力手段250は、予測式を示す情報として、予測式における複数の特徴量に対する複数の重みを、それぞれ特徴量に関連づけて出力する。以下に詳しく説明する。
図2は、センサ10を例示する図である。センサ10は、分子が付着する受容体を有し、その受容体における分子の付着と離脱に応じて検出値が変化するセンサである。なお、センサ10によってセンシングされているガスを、対象ガスと呼ぶ。また、センサ10から出力される検出値の時系列データを、時系列データ14と呼ぶ。ここで、必要に応じ、時系列データ14をYとも表記し、時刻tの検出値をy(t)とも表記する。Yは、y(t)が列挙されたベクトルとなる。
例えばセンサ10は、膜型表面応力センサ(Membrane-type Surface stress Sensor; MSS)である。MSSは、受容体として、分子が付着する官能膜を有しており、その官能膜に対する分子の付着と離脱によってその官能膜の支持部材に生じる応力が変化する。MSSは、この応力の変化に基づく検出値を出力する。
MSSの官能膜には有機系、無機系、およびバイオ系のように様々な材料を用いることができる。センサ10の応答する対象分子および、応答特性は官能膜に依存する。したがって、互いに異なる官能膜を有する複数種類のセンサ10を組み合わせることにより、様々な成分を含む混合ガスからなる複雑なにおいを分析可能となる。
なお、センサ10は、MSSには限定されず、受容体に対する分子の付着と離脱に応じて生じる、センサ10の部材の粘弾性や動力学特性(質量や慣性モーメントなど)に関連する物理量の変化に基づいて検出値を出力するものであればよく、カンチレバー式、膜型、光学式、ピエゾ、振動応答などの様々なタイプのセンサを採用することができる。これらのセンサ10においても、センサ10が応答する対象分子および、応答特性の少なくとも一方が互いに異なる複数種類のセンサ10を組み合わせることができる。
ここで、センサ10の種類は多数にのぼる。一方で、実際に検出装置において用いることができるセンサ10の数には限りがある。そこで、目的の検出を行うためにどの種類のセンサ10を組み合わせて用いるのがよいかを選定する必要がある。
本実施形態において予測式生成手段210は、複数種類のセンサ10の集合からの出力に基づいた複数の特徴量と正解データとを入力とした機械学習を行うことにより、におい成分に関する予測を行うための予測式を生成する。予測式は複数の特徴量を変数とする式であり、予測式において各特徴量に対する重みは、その特徴量が予測結果に及ぼす寄与の大きさに対応する。したがって、予測式を示す情報に基づき、目的に対して寄与が大きなセンサ10と寄与が小さなセンサ10とを判別することができる。
特徴量および予測式について以下に詳しく説明する。特徴量はセンサ10の出力に基づいて得られる値である。ただし、一つのセンサ10に対しては一つ以上の特徴量が得られ、各特徴量は、一つのセンサ10の出力にのみ依存する。
時系列データ14は、センサ10が出力した検出値を、センサ10から出力された時刻が早い順に並べた時系列のデータである。ただし、時系列データ14は、センサ10から得られた検出値の時系列データに対して、所定の前処理が加えられたものであってもよい。前処理としては、例えば、時系列のデータからノイズ成分を除去するフィルタリングなどを採用することができる。
図3は、時系列データ14を例示する図である。時系列データ14は、センサ10を対象ガスに曝すことで得られる。ただし、時系列データ14は、センサ10を測定対象のガスに曝す操作と、センサ10から測定対象のガスを取り除く操作とで得ても良い。本図の例において、センサ10を対象ガスに曝すことで期間P1のデータが得られ、センサ10から測定対象のガスを取り除く操作により期間P2のデータが得られる。なお、センサ10から測定対象のガスを取り除く操作はたとえばセンサ10をパージガスに曝す操作が挙げられる。また、センサ10による対象ガスの測定においては、センサ10を測定対象のガスに曝す操作と、センサ10から測定対象のガスを取り除く操作を繰り返し行い、複数の時系列データ14を得ても良い。
図4は、複数種類のセンサ10の集合100からのセンサ出力データ16を例示する図である。本図の例において、センサ10の集合100は、第1センサ10a、第2センサ10b、第3センサ10c、および第4センサ10dからなる。たとえば集合100はモジュール化されており、同じ対象ガスに対して同じ検出環境で測定が行われる。センサ10の集合100は、使用可能な多数のセンサ10から任意に選択された複数のセンサ10からなる。センサ出力データ16は、複数種類のセンサ10のそれぞれから得られた時系列データ14を結合したデータである。本図の例において、センサ出力データ16は、第1センサ10a、第2センサ10b、第3センサ10c、および第4センサ10dの時系列データ14を順に並べたものである。
センサ出力データ16からは、複数の特徴量が算出できる。ここで、特徴量ベクトルXを、複数の特徴量を要素とするベクトルであるとする。特徴量ベクトルXには、100に含まれる複数種類の10の出力に基づく複数の特徴量x(j=1,2,...,J)が含まれる。なお、xは数値であっても良いしベクトルであってもよい。xがベクトルである場合、xは同一のセンサ10の出力に基づく複数の特徴量を要素とするベクトルである。特徴量xは、たとえば、センサ10の時系列データ14、時系列データ14を微分したデータ、または、後述する寄与値の集合Ξである。予測式生成手段210は時系列データ14またはセンサ出力データ16を取得し、取得したデータに基づいて特徴量を算出することができる。ただし、予測式生成手段210は時系列データ14またはセンサ出力データ16を取得する代わりに、処理装置20の外部で導出された特徴量を取得しても良い。
予測式は特徴量の線形和であり、z=WX+bで表される。ここで、Wはベクトルであり、bは定数である。そして、重みWの各要素は、特徴量ベクトルXの各要素に対する係数である。そして、得られるzが予測結果を示す。予測式は判別に用いられても良いし、回帰予測に用いられても良い。たとえばあるにおい成分の有無の判別に用いられる予測式では、zが予め定められた基準以上である場合、測定対象のガスに検出対象のにおい成分が含まれていると判断し、基準未満である場合、測定対象のガスに検出対象のにおい成分が含まれていないと判断することができる。回帰予測の例としては、飲料等の製品のにおいに基づく製造品質の予測や呼気の測定による体内状態の予測等が挙げられる。
なお、上記した時系列データ14、センサ出力データ16、特徴量、および予測式の形態は例であり、本実施形態に係る時系列データ14、センサ出力データ16、特徴量、および予測式の形態は上記に限定されない。
特徴量の一例である寄与値の集合Ξについて以下に説明する。ここで、説明のため、センサ10によるセンシングを以下のようにモデル化する。
(1)センサ10は、K種類の分子を含む対象ガスに曝されている。
(2)対象ガスにおける各分子kの濃度は一定のρである。
(3)センサ10には、合計N個の分子が吸着可能である。
(4)時刻tにおいてセンサ10に付着している分子kの数はn(t)個である。
センサ10に付着している分子kの数n(t)の時間変化は、以下のように定式化できる。
Figure 2020065806
式(1)の右辺の第1項と第2項はそれぞれ、単位時間当たりの分子kの増加量(新たにセンサ10に付着する分子kの数)と減少量(センサ10から離脱する分子kの数)を表している。また、αとβはそれぞれ、分子kがセンサ10に付着する速度を表す速度定数と、分子kがセンサ10から離脱する速度を表す速度定数である。
ここで、濃度ρが一定であるため、上記式(1)から、時刻tにおける分子kの数n(t)は、以下のように定式化できる。
Figure 2020065806
また、時刻t(初期状態)でセンサ10に分子が付着していないと仮定すれば、n(t)は以下のように表される。
Figure 2020065806
センサ10の検出値は、対象ガスに含まれる分子によってセンサ10に働く応力によって定まる。そして、複数の分子によってセンサ10に働く応力は、個々の分子に働く応力の線形和で表すことができると考えられる。ただし、分子によって生じる応力は、分子の種類によって異なると考えられる。すなわち、センサ10の検出値に対する分子の寄与は、その分子の種類によって異なると言える。
そこで、センサ10の検出値y(t)は、以下のように定式化できる。
Figure 2020065806
ここで、γとξはいずれも、センサ10の検出値に対する分子kの寄与を表す。なお、「立ち上がり」は上記した期間P1に相当し、「立ち下がり」は上記した期間P2に相当する。
ここで、対象ガスをセンシングしたセンサ10から得た時系列データ14を上述の式(4)のように分解できれば、対象ガスに含まれる分子の種類や、各種類の分子が対象ガスに含まれる割合を把握することができる。すなわち、式(4)に示す分解によって、対象ガスの特徴を表すデータ(すなわち、対象ガスの特徴量)が得られる。
そこでセンサ10によって出力された時系列データ14は、特徴定数の集合Θ={θ,θ,...,θ}を用いて、以下の式(5)に示すように分解される。なお、特徴定数の集合Θは、予め定められていてもよいし、処理装置20によって生成されてもよい。
Figure 2020065806
ここで、ξは、センサ10の検出値に対する特徴定数θの寄与を表す寄与値である。
このような分解により、時系列データ14に対する各特徴定数θの寄与を表す寄与値ξが算出される。寄与値ξの集合Ξを、対象ガスの特徴を表す特徴量とすることができる。寄与値ξの集合は、例えば、ξを列挙した特徴ベクトルΞ=(ξ,ξ,...,ξ)で表される。ただし、対象ガスの特徴量は、必ずベクトルとして表現しなければならないわけではない。
ここで、特徴定数θとしては、前述した速度定数βや、速度定数の逆数である時定数τを採用することができる。θとしてβとτを使う場合それぞれについて、式(5)は、以下のように表すことができる。
Figure 2020065806
前述したように、センサ10の検出値に対する分子の寄与は、その分子の種類によって異なると考えられるため、上述した寄与値の集合Ξは、対象ガスに含まれる分子の種類やその混合比率に応じて異なるものになると考えられる。よって、寄与値の集合Ξは、複数種類の分子が混合されているガスを互いに区別することができる情報、すなわちガスの特徴量として利用することができる。
寄与値の集合Ξを対象ガスの特徴量として利用することには、複数種類の分子を含むガスを扱えるという利点以外の利点もある。まず、ガス同士の類似度合いを容易に把握することができるという利点がある。例えば、対象ガスの特徴量をベクトルで表現すれば、ガス同士の類似度合いを特徴ベクトル間の距離に基づいて容易に把握することができる。
また、寄与値の集合Ξを特徴量とすることには、混合比変化に対して時定数変化や混合比変化についてロバストにすることができるという利点がある。ここでいう「ロバスト性」とは、「測定環境や測定対象が少しだけ変化したとき、得られる特徴量も少しだけ変化する」という性質である。
混合比変化についてロバストであれば、例えば、2種類のガスを混合させた混合ガスについて、ガスの混合比を徐々に変化させていくと、特徴量も徐々に変化していくことになる。この性質は、式(4)において、寄与値ξがガスの濃度を表すρに比例しているため、濃度の小さな変化が寄与値の小さな変化として現れるということからわかる。
図5は、第1の実施形態に係る処理方法を例示するフローチャートである。本実施形態に係る処理方法は、予測式生成ステップS210および出力ステップS250を含む。予測式生成ステップS210では、複数種類のセンサ10の集合100からの出力に基づいた複数の特徴量と正解データとを入力とした機械学習を行うことにより、複数の特徴量を変数とする式であって、におい成分に関する予測を行うための予測式が生成される。出力ステップS250では、予測式を示す情報として、予測式における複数の特徴量に対する複数の重みが、それぞれ特徴量に関連づけて出力される。本実施形態に係る処理方法は、処理装置20により実現される。以下に詳しく説明する。
予測式生成手段210は、時系列データ14、センサ出力データ16、または特徴量ベクトルXを取得する。予測式生成手段210は時系列データ14、センサ出力データ16、または特徴量ベクトルXを、予測式生成手段210からアクセス可能な記憶装置から取得しても良いし、処理装置20の外部の装置から取得しても良いし、センサ10から取得しても良い。特徴量ベクトルXは、その場の測定により得られても良いし、予め準備されて記憶装置に保持されていても良い。また、予測式生成手段210はその特徴量ベクトルXに対する正解データを取得する。正解データはユーザにより処理装置20に入力されても良いし、予測式生成手段210からアクセス可能な記憶装置に予め特徴量ベクトル(すなわち複数の特徴量)と関連づけられて記憶されていても良い。
そして予測式生成手段210は、予測式生成ステップS210において、複数の特徴量と正解データとを入力とした機械学習を行うことで予測式を生成する。具体的には、予測式生成手段210は重みWおよび定数bを導出する。複数の特徴量はたとえば上記した特徴量ベクトルXである。複数の特徴量は既知の対象ガスをセンサ10の集合100で測定した結果により得られる。そして正解データは、その特徴量ベクトルに対し予測式で得られるべき予測結果を示す情報である。すなわち、正解データは測定した既知の対象ガスに対応する情報である。
ここで、予測式生成手段210は、複数の特徴量と正解データとを含む学習用データセットを複数用いて機械学習を行うことで、予測式の精度を高めることができる。このような複数の学習用データセットは、上記した様に、センサ10による対象ガスの測定において、センサ10を測定対象のガスに曝す操作と、センサ10から測定対象のガスを取り除く操作を繰り返し行うことで得られる。予測式生成手段210はたとえば、予め定められた学習の反復回数(学習用データセット数)を満たした場合に学習を終了する。なお、複数の学習用データセットにおいて、センサ10の集合100による検出環境は同じであることが好ましい。また、この検出環境は実際にセンサ10および生成された予測式を用いる際の検出環境に近いことが好ましい。
なお、機械学習に用いる特徴量は対象ガスに対するセンサ10の応答をシミュレーションして得られたものであってもよい。なお、複数の学習用データセットは互いに検出環境が異なるシミュレーション条件で得られた結果を用いて生成されうる。ただし、同一の検出環境に対し互いに異なる複数のシミュレーション結果が得られる場合には、複数の学習用データセットは互いに同一のシミュレーション条件で得られた結果を用いて生成されてもよい。
次いで、本実施形態に係る出力手段250は出力ステップS250において、予測式生成手段210に生成された予測式を示す情報を出力する。具体的には出力手段250は、予測式を示す情報として、複数の重みおよび定数bを、それぞれ特徴量に関連づけて出力する。たとえば重みの各値がセンサ10の集合100のうち、どのセンサ10の特徴量に対応する値かが分かる状態で表示装置に表示される。そして、各特徴量に対する重みを確認することで、ユーザは予測結果に対する各センサ10の寄与度を把握することができる。そして、ユーザはたとえばセンサ10のうち予測結果への寄与が低いセンサ10を他の種類のセンサ10に取り替えることができる。なお、各センサ10に対し複数の特徴量および重みが存在する場合、ユーザはたとえば複数の重みのほとんどがゼロであるセンサ10を予測結果への寄与が低いセンサ10であるとみなすことができる。
処理装置20のユーザは、たとえば、特定の目的で、複数のセンサ10を含むセンサモジュールを作製しようとする場合、センサモジュールに含めるセンサ10の選定に処理装置20を用いる。センサ10の集合100に含まれるセンサ10の数の上限は、センサモジュールに搭載可能なセンサ10の数により定められる。たとえばユーザは処理装置20の出力に基づき予測結果への寄与が低いセンサ10を他の使用可能な種類のセンサ10に取り替え、再度処理装置20を同様に動作させる。そして、センサモジュールに搭載された全てのセンサ10が予測結果へ充分寄与する状態になるまで、センサ10の取り替えと処理装置20の動作を繰り返し行う。そうすることで、限られた数のセンサ10で所望の目的を果たすことができるセンサ10の組み合わせを求めることができる。
さらに、ユーザは、最終的に採用したセンサ10の組み合わせと、その組み合わせに対して生成された予測式を用いて、におい成分に関する予測を行うことができる。具体的には、におい成分に関する予測において、複数のセンサ10からの出力に基づき特徴量が算出され、その特徴量が予測式に適用される。そして、予測式による算出値に基づき予測結果が得られる。
なお、出力手段250は外部の装置に対して予測式を示す情報を出力しても良いし、出力手段250からアクセス可能な記憶装置にこの情報を記憶させても良い。
処理装置20の各機能構成部は、各機能構成部を実現するハードウエア(例:ハードワイヤードされた電子回路など)で実現されてもよいし、ハードウエアとソフトウエアとの組み合わせ(例:電子回路とそれを制御するプログラムの組み合わせなど)で実現されてもよい。以下、処理装置20の各機能構成部がハードウエアとソフトウエアとの組み合わせで実現される場合について、さらに説明する。
図6は、処理装置20を実現するための計算機1000を例示する図である。計算機1000は任意の計算機である。例えば計算機1000は、Personal Computer(PC)やサーバマシンなどの据え置き型の計算機である。その他にも例えば、計算機1000は、スマートフォンやタブレット端末などの可搬型の計算機である。計算機1000は、処理装置20を実現するために設計された専用の計算機であってもよいし、汎用の計算機であってもよい。
計算機1000は、バス1020、プロセッサ1040、メモリ1060、ストレージデバイス1080、入出力インタフェース1100、及びネットワークインタフェース1120を有する。バス1020は、プロセッサ1040、メモリ1060、ストレージデバイス1080、入出力インタフェース1100、及びネットワークインタフェース1120が、相互にデータを送受信するためのデータ伝送路である。ただし、プロセッサ1040などを互いに接続する方法は、バス接続に限定されない。
プロセッサ1040は、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)、FPGA(Field−Programmable Gate Array)などの種々のプロセッサである。メモリ1060は、RAM(Random Access Memory)などを用いて実現される主記憶装置である。ストレージデバイス1080は、ハードディスク、SSD(Solid State Drive)、メモリカード、又は ROM(Read Only Memory)などを用いて実現される補助記憶装置である。
入出力インタフェース1100は、計算機1000と入出力デバイスとを接続するためのインタフェースである。例えば入出力インタフェース1100には、キーボードなどの入力装置や、ディスプレイ装置などの出力装置が接続される。その他にも例えば、入出力インタフェース1100には、センサ10が接続される。ただし、センサ10は必ずしも計算機1000と直接接続されている必要はない。例えばセンサ10は、計算機1000と共有している記憶装置に時系列データ14を記憶させてもよい。
ネットワークインタフェース1120は、計算機1000を通信網に接続するためのインタフェースである。この通信網は、例えば LAN(Local Area Network)や WAN(Wide Area Network)である。ネットワークインタフェース1120が通信網に接続する方法は、無線接続であってもよいし、有線接続であってもよい。
ストレージデバイス1080は、処理装置20の各機能構成部を実現するプログラムモジュールを記憶している。プロセッサ1040は、これら各プログラムモジュールをメモリ1060に読み出して実行することで、各プログラムモジュールに対応する機能を実現する。
次に、本実施形態の作用および効果について説明する。本実施形態に係る処理装置20によれば、予測式を示す情報に基づいて、各センサ10の予測結果への寄与度を把握することができる。ひいては、所望の目的のために、適したセンサの組み合わせを導出することができる。
(第2の実施形態)
図7は、第2の実施形態に係る処理装置20の構成を例示する図である。本実施形態に係る処理装置20は、以下に説明する点を除いて第1の実施形態に係る処理装置20と同じである。
本実施形態に係る処理装置20は、抽出手段220をさらに備える。抽出手段220は、予測式における複数の特徴量に対する複数の重みに基づいて、集合100から一以上のセンサ10を抽出する。具体的には抽出手段220は、予測式において、複数の重みのうち予め定められた条件を満たす、または満たさない重みで重みづけられた特徴量の、出力元であるセンサ10を抽出する。
また、本実施形態において出力手段250は、抽出手段220で抽出されたセンサ10および抽出されなかったセンサ10の少なくとも一方を、識別可能な状態で出力する。なお、本実施形態において出力手段250は必ずしも予測式を示す情報を出力する必要は無い。以下に詳しく説明する。
図8は、第2の実施形態に係る処理方法を例示するフローチャートである。本実施形態に係る処理方法は、抽出ステップS220をさらに含み、出力ステップS250では抽出ステップS220で抽出されたセンサ10および抽出されなかったセンサ10の少なくとも一方を、識別可能な状態で出力する点を除いて第1の実施形態に係る処理方法と同じである。抽出ステップS220では、予測式における複数の特徴量に対する複数の重みに基づいて、集合100から一以上のセンサ10が抽出される。具体的には、抽出ステップS220では、予測式において、複数の重みのうち予め定められた条件を満たす、または満たさない重みで重みづけられた特徴量の、出力元であるセンサ10が抽出される。
本処理方法は、本実施形態に係る処理装置20により実現される。処理装置20の動作について以下に詳しく説明する。
本実施形態において、予測式生成ステップS210は第1の実施形態に係る予測式生成ステップS210と同様である。本実施形態では、予測式生成ステップS210に次いで抽出ステップS220の処理が行われる。
抽出ステップS220において抽出手段220は、予測式における重みと、重みに関する予め定められた条件とに基づいて、その予測式において予測結果への寄与度が高いセンサ10を抽出する。具体的には、抽出手段220は、予測式生成手段210から予測式を示す情報を取得する。そして、予測式を示す情報に示された各センサ10の特徴量に対する重みの大きさを算出する。
ここで、予測式z=WX+bにおけるWXを、集合100に含まれる各センサ10の時系列データ14に基づく特徴量x、および特徴量xに対する重みwを用いて、w+w+・・・wと書き換えることができる。なお、wはそれぞれ数値であっても良いしベクトルであってもよい。wがベクトルである場合、wの各要素は、xの要素である各特徴量に対する重みである。そして、重みの大きさは、たとえばwのノルムである。一方、wが数値である場合、重みの大きさはwの絶対値である。
抽出手段220はさらに、算出した重みの大きさが予め定められた条件を満たすか否かを判定する。条件を示す情報は抽出手段220からアクセス可能な記憶装置に予め記憶されている。たとえば、条件が「重みの大きさが基準値以上である」等、予測結果への寄与度が高いセンサ10についての条件を示す場合、抽出手段220はこの条件を満たす重みに対応するセンサ10を抽出する。一方、条件が「重みの大きさが基準値以下である」等、予測結果への寄与が低いセンサ10の条件を示す場合、抽出手段220はこの条件を満たさない重みに対応するセンサ10を抽出する。そして抽出手段220は、抽出されたセンサ10からなる組み合わせを示す組み合わせ情報を生成する。生成された組み合わせ情報には、予測式を示す情報が関連づけられる。
なお、図3に示したような時系列データ14において、センサ10に対し吸着および離脱する分子に関する情報は、期間P1および期間P2のそれぞれの冒頭で大きく出力が変動する部分に強く反映されると考えられる。したがって、このような冒頭部分のデータに基づく特徴量の重みが大きくなると予測される。そして仮に、期間P1および期間P2のうち定常部分のデータに基づく特徴量の重みが大きい場合、その結果はノイズ等の影響を受けているとも考えられる。これらのことから、抽出手段220は、期間P1および期間P2の一部のデータのみに基づく特徴量に対する重みに基づいて、センサ10を抽出しても良い。具体的には、期間P1および期間P2のそれぞれにおいて、期間のはじめから予め定められた時間後までの間のデータに基づく特徴量に対する重みに基づいて、センサ10を抽出しても良い。
次いで、出力ステップS250において出力手段250は、センサ10の抽出結果に基づき、予測結果への寄与度が高いセンサ10、または予測結果への寄与度が低いセンサ10の少なくともいずれかを出力する。なお、出力手段250によるセンサ10の出力とは、センサ10を示す記号等の出力である。なお、出力手段250が、予測結果への寄与度が高いセンサ10、および予測結果への寄与度が低いセンサ10の両方を出力する場合、それらは互いに識別可能な状態で出力される。また、出力手段250はさらに予測式を示す情報を出力しても良い。
具体的には予測結果への寄与度が高いセンサ10、または予測結果への寄与度が低いセンサ10の少なくともいずれかを示す表示が、処理装置20に設けられた表示装置に表示される。また、出力手段250は外部の装置に対して予測結果への寄与度が高いセンサ10、または予測結果への寄与度が低いセンサ10の少なくともいずれかを示す情報を出力しても良いし、出力手段250からアクセス可能な記憶装置にこの情報を記憶させても良い。
本実施形態においても、ユーザは出力手段250の出力に基づいて、第1の実施形態と同様に採用するセンサ10の組み合わせを探索することができる。
本実施形態に係る処理装置20も、図6に示したような計算機1000により実現可能である。本実施形態において、ストレージデバイス1080は、処理装置20の抽出手段220を実現するプログラムモジュールをさらに記憶している。
次に、本実施形態の作用および効果について説明する。本実施形態においては第1の実施形態と同様の作用および効果が得られる。くわえて、本実施形態に係る処理装置20によれば、抽出手段220の抽出結果に基づいて、予測結果への寄与度が低い、または高いセンサ10を把握することができる。ひいては、所望の目的のセンサを得るために、適したセンサの組み合わせをより明瞭に把握することができる。
(第3の実施形態)
図9は、第3の実施形態に係る予測式生成手段210で行われる機械学習に用いられる予測モデルを例示する図である。本実施形態に係る処理装置20は、以下に説明する点を除いて第2の実施形態に係る処理装置20と同じである。
本実施形態に係る処理装置20では、予測式生成手段210は、センサ10の検出環境に基づいた分岐を含むモデルを用いて予測式を生成する。また、出力手段250は、予測式に適した検出環境の条件であって、分岐の条件に基づく検出環境の条件を、予測式を示す情報に関連づけて出力する。
センサ10の出力は、対象ガスの成分のみならず、その検出環境、すなわち測定条件により変化しうる。したがって、好ましいセンサ10の組み合わせは検出環境毎に異なる可能性がある。本実施形態では、予測式生成手段210が検出環境に基づいた分岐を含むモデルを用いて予測式を生成することにより、好ましいセンサ10の組み合わせを検出環境に対応付けて導き出すことができる。
検出環境は特に限定されないが、たとえば温度、湿度、気圧、夾雑ガスの種類、パージガスの種類、におい成分のサンプリング周期、対象物とセンサ10との距離、センサ10の周囲に存在する物体のうち少なくともいずれかを含む。温度、湿度、および気圧はそれぞれセンサ10の周囲の温度、湿度、および気圧、具体的にはセンサ10の官能部を取り巻く雰囲気の温度、湿度、および気圧である。夾雑ガスの種類は、センサ10を対象ガスに曝す操作において、対象のにおい成分と共にセンサ10に供給されるガスの種類である。具体的には夾雑ガスの種類としては、窒素等の不活性ガス、および空気等が挙げられる。パージガスの種類はセンサ10から測定対象のガスを取り除く操作においてセンサ10に供給されるガスである。具体的にはパージガスとしては、窒素等の不活性ガス、および空気等が挙げられる。におい成分のサンプリング周期は、センサ10を測定対象のガスに曝す操作と、センサ10から測定対象のガスを取り除く操作を繰り返し行う場合の繰り返し周期である。対象物とセンサ10との距離は、特定の対象物の周囲にセンサ10を配置して検出を行う場合の、対象物とセンサ10との距離である。センサ10の周囲に存在する物体は、特定の対象物の周囲に10を配置して検出を行う場合の、対象物の種類である。
機械学習に用いられるモデルは、具体的には複数のノードを含んだ階層構造を有する。そして一以上の中間ノードには分岐の条件として分岐式が位置し、最下層のアノードには予測式が位置する。本図において条件A、条件B1および条件B2は分岐の条件であり、式1から式4はそれぞれ予測式である。なお、中間ノードの数やアノードの数等、モデルの具体的な構成は特に限定されない。
本実施形態において予測式生成手段210が行う機械学習はたとえば、センサ10の検出環境をさらに入力とした異種混合学習である。ここで、検出環境は、機械学習の入力である特徴量に関連づけられており、その特徴量の元となった時系列データ14が得られた際の検出環境である。異種混合学習によれば、分岐の条件を含む具体的なモデルが予測式と共に生成される。
本実施形態において予測式生成手段210は予測式生成ステップS210において複数の検出環境で得られた複数の学習用データセットを入力とした機械学習を行う。上記した通り、各学習用データセットはセンサ10の集合100で得られた複数の特徴量と正解データとからなる。そして、機械学習の結果として、一以上の予測式が生成される。
ここで、各予測式には前提となる検出環境の条件が紐づけられる。各予測式は、その予測式に関連づけられた検出環境の条件を満たす環境下で特に有効である。検出環境の条件は予測式と同時に生成されるモデルにおける分岐条件に基づく。詳しくは、検出環境の条件は生成されたモデルにおいて、スタートからアノードの予測式に至るまでに通る分岐条件とその判定結果で定められる。たとえば本図の例において、条件Aが「温度>T」であり、条件B2が「湿度>H」である場合、式3に関連づけられる検出環境の条件は、「温度がT以下であり、かつ湿度がHより高い」である。
次いで、抽出手段220により抽出ステップS220が行われる。本実施形態に係る抽出ステップS220では、ユーザにより設定された特定の使用環境で好適に使用可能なセンサ10の組み合わせが抽出される。処理装置20はたとえばユーザからの入力を受け付け可能であり、抽出手段220はユーザにより入力された使用環境を示す情報を取得する。ただし、使用環境を示す情報は予め定められ、抽出手段220からアクセス可能な記憶装置に保持されていても良い。使用環境を示す情報はたとえば、温度、湿度、気圧、夾雑ガスの種類、パージガスの種類、におい成分のサンプリング周期、対象物とセンサ10との距離、センサ10の周囲に存在する物体のうち一以上である。
そして、抽出手段220は、予測式生成手段210が生成した複数の予測式の中から、使用環境が満たす検出環境の条件に対応づけられた予測式を選択する。その上で抽出手段220は、選択した予測式に対し、第2の実施形態で説明したのと同様にセンサ10を抽出し、組み合わせ情報を生成する。組み合わせ情報には検出環境の条件を示す情報がさらに関連づけられる。
また、出力手段250は出力ステップS250において、第2の実施形態で説明した出力ステップS250の処理と同様の処理を行う。ただし、出力手段250は、予測式に関連づけられた検出環境の条件をさらに出力しても良い。
なお、使用環境が、複数の予測式についての検出環境の条件を満たす場合、抽出手段220は複数の予測式を選択し、各予測式に対して組み合わせ情報を生成しても良い。また、出力手段250は、複数の組み合わせの出力を行っても良い。ただし、出力手段250は、組み合わせ毎に識別可能な状態で予測式を示す情報等を出力する。
なお、機械学習で用いる分岐の条件を含む具体的なモデルは、機械学習により生成される代わりに、ユーザにより設定されても良い。この場合、機械学習は異種混合学習でなくても良い。
また、異種混合学習では、学習の繰り返しの中で、予測式と共に分岐条件が繰り返し更新されうるが、学習の途中の段階で得られたモデルを、以降の学習で固定して用いても良い。
また、本実施形態に係る処理装置20は第1の実施形態に係る処理装置20と同様に、抽出手段220を備えていなくても良い。その場合、出力手段250は予測式生成手段210で生成された一以上の予測式を示す情報を出力する。
また、抽出手段220は予測式生成手段210で生成された全ての予測式に対し組み合わせ情報を生成し、出力手段250が生成された全ての組み合わせ情報について、センサ10、予測式を示す情報、および検出環境の条件を出力しても良い。その場合、ユーザは出力された情報を総合的に見て、複数の検出環境の条件の全体において好ましいセンサ10の組み合わせを判断することができる。たとえば、ユーザはいずれの組み合わせにも含まれないセンサ10を、使用するセンサ10の候補から除外することができる。または、全ての組み合わせに含まれるセンサ10のみを候補として残すことができる。また、関連づけられた検出環境の条件が、実用上想定しにくい極端な条件であるような組み合わせにのみ含まれるセンサ10を、候補から除外することができる。
次に、本実施形態の作用および効果について説明する。本実施形態においては第1の実施形態と同様の作用および効果が得られる。くわえて、予測式生成手段210が検出環境に基づいた分岐を含むモデルを用いて予測式を生成することにより、好ましいセンサ10の組み合わせを検出環境に対応付けて導き出すことができる。
(第4の実施形態)
図10は、第4の実施形態に係る処理装置20の構成を例示する図である。また、図11は、第4の実施形態に係る処理方法を例示するフローチャートである。本実施形態に係る処理装置20は、以下に説明する点を除いて第2および第3の実施形態の少なくともいずれかに係る処理装置20と同じである。
図10の例において処理装置20は、予測式の予測精度を算出する予測精度算出手段230、およびセンサ10の組み合わせを評価する評価手段240をさらに備える。また、図11の例において処理方法は、予測精度算出ステップS230および評価ステップS240をさらに含む。ただし、本実施形態に係る処理装置20は、予測精度算出手段230および評価手段240の少なくとも一方を備えていなくても良い。また、本実施形態に係る処理方法は、予測精度算出ステップS230および評価ステップS240の少なくとも一方を含まなくても良い。
本実施形態の予測式生成ステップS210では、第1から第3の実施形態の少なくともいずれかに係る予測式生成ステップS210と同様の処理が行われる。次いで、本実施形態の抽出ステップS220では、第2および第3の実施形態の少なくともいずれかに係る抽出ステップS220と同様の処理が行われる。
本実施形態に係る処理装置20では、抽出ステップS220に次いで、予測精度算出手段230により予測精度算出ステップS230の処理が行われる。なお、予測精度算出ステップS230の処理が行われるタイミングは予測式生成ステップS210の後かつ、後述する評価ステップS240の前である限り、特に限定されない。なお、処理装置20が評価手段240を備えない場合には、予測精度算出ステップS230の処理が行われるタイミングは予測式生成ステップS210の後かつ、出力ステップS250の前であればよい。
予測精度算出ステップS230では、予測精度算出手段230が各予測式の予測精度を算出する。予測精度の算出には、学習用データセットと同様のデータセットが評価用データセットとして用いられる。すなわち、評価用データセットは複数の特徴量と正解データとを含む。
ただし、複数の学習用データセットと複数の評価用データセットには、互いに全く同じデータセットは含まれない。たとえば処理装置20の外部または内部で生成された、互いに異なる複数のデータセットのうちの一部を複数の学習用データセットとして用い、残りを複数の評価用データセットとして用いることができる。
予測精度は回帰に基づく予測については回帰精度であり、たとえば最小二乗誤差または平均平方二乗誤差(RMSE)である。また、予測精度は判別に基づく予測については判別精度であり、たとえば適合率、再現率、F値、正答率、またはROC_AUCである。
予測精度算出手段230が予測精度を算出する方法の一例について詳しく説明する。予測式生成手段210が学習用データセットを取得または生成するのと同様の方法で、予測精度算出手段230は複数の評価用データセットを取得または生成することができる。予測精度算出手段230は評価用データセットに含まれる特徴量を、精度を評価しようとする予測式に入力することで、予測結果を得る。そして、得られた予測結果と、評価用データセットに含まれる正解データとが一致するか否かを判定する。そして、予測精度算出手段230は複数の評価用データセットについて同様の処理を行い、予測結果と正解データとが一致する確率を、その予測式の予測精度として算出する。算出された予測精度は、その予測式に関連づけられる。
複数の評価用データセットは、互いに異なる検出環境での測定結果に基づくものであっても良い。ただし、第1または第2の実施形態のように、一つの集合100に対して一つの予測式が生成される場合、評価用データセットは、学習用データセットが得られた検出環境に近い検出環境で得られたデータであることが好ましい。第3の実施形態のように一つの集合100に対して複数の予測式が生成される場合、各予測式について、その予測式に関連づけられた検出環境の条件を満たす環境で得られた評価用データセットのみが予測精度の算出に用いられる。
次いで、評価ステップS240の処理が評価手段240により行われる。評価手段240は、センサ10の組み合わせを、たとえばその組み合わせを採用する場合に用いる予測式の予測精度と、その組み合わせを採用する場合のコストとの少なくとも一方に基づいて評価する。なかでも評価手段240は、組み合わせ情報に示されたセンサ10の組み合わせを採用する場合のコストに少なくとも基づいて、センサ10の組み合わせを評価することが好ましい。
コストにはたとえば初期コストおよびランニングコストが含まれる。初期コストとしては、センサ10の製造コストや調達コスト等が挙げられる。また、ランニングコストとしては、管理コスト、センサ10の劣化等に起因する交換コスト、扱いにおける人的手間等が挙げられる。
評価手段240によりアクセス可能な記憶装置には、予め各センサ10のコストを示すパラメータが保持されており、評価手段240は、組み合わせに含まれるセンサ10のコストを示すパラメータを記憶装置から取得する。そして、組み合わせに含まれる全てのセンサ10についてのコストを示すパラメータを合算し、合算値を得る。
また、評価手段240は予測精度算出手段230から、その組み合わせ情報に関連づけられた予測式の予測精度を取得する。
評価手段240はさらに評価関数を用いて組み合わせを評価する。評価関数は一以上の要因に基づき評価値を算出する関数である。具体的には評価関数は、各要因における評価結果を示す評価パラメータの線形和で表される。たとえば要因をコストとした評価パラメータは、上記の様に算出された合算値であり、要因を精度とした評価パラメータは予測精度算出手段230から取得した予測精度である。また、評価関数では、各評価パラメータに対して係数が掛けられ、評価結果に対する要因ごとの重みのバランスがとられたり、評価の方向性が定められたりしている。係数は、評価パラメータの種類毎に定められている。
評価手段240は評価関数にコストを示すパラメータの合算値および予測精度を適用することにより、評価結果として評価値を算出する。なお、評価手段240により得られる評価結果は、コストに関する合算値は小さいほど高くなり、予測精度が良いほど高くなる。評価関数を示す情報は評価手段240によりアクセス可能な記憶装置に予め保持されている。算出された評価値は、組み合わせ情報に関連づけられる。
評価手段240は、さらに組み合わせに含まれるセンサ10の数に基づき、センサ10の組み合わせを評価しても良い。たとえば、組み合わせに含まれるセンサ10の数を要因とする場合、たとえば、センサ10の数が、評価関数における評価パラメータとなり得る。なお、評価手段240により得られる評価結果は、組み合わせに含まれるセンサ10の数が少ないほど高くなる。
第3の実施形態のように一つの集合100に対して複数の予測式が生成される場合、評価手段240は、さらに組み合わせ情報に関連づけられた検出環境の条件に基づき、センサ10の組み合わせを評価しても良い。たとえば、検出環境の条件の広さを要因とする場合、たとえば、検出環境の条件として示された温度、湿度、気圧、周期、距離等の範囲の幅や、ガスや物体の選択肢の数が、評価関数における評価パラメータとなり得る。また、検出環境の条件の実用性を要因とする場合、検出環境の条件として示された温度、湿度、気圧、周期、距離等の範囲の中心値と、予め定められた標準値との距離が評価関数における評価パラメータとなり得る。すなわち、この距離が小さいほど実用性が高いといえる。なお、評価手段240により得られる評価結果は、検出環境の条件が広いほど高くなり、検出環境の条件の実用性が高いほど高くなる。
出力ステップS250において出力手段250は、さらに評価手段240で算出された評価結果をセンサ10の組み合わせに関連づけて出力する。ユーザはセンサ10の複数の組み合わせを、評価結果を用いて互いに比較することができる。たとえば、集合100の構成を変えながら処理装置20による処理を繰り返す場合、各集合100による結果を評価結果により比較し、最も優れるセンサ10の組み合わせを導出することができる。また、第3の実施形態のように、一つの集合100に基づき複数の組み合わせ情報が生成される場合に、評価結果によりそれらを互いに比較することができる。なお、出力手段250は評価結果に加えて、または、評価結果に代えて、予測式の予測精度を出力しても良い。
さらに、第3の実施形態で説明した様に、たとえば出力された情報を総合的に見て、複数の検出環境の条件の全体において好ましいセンサ10の組み合わせを判断しようとする場合について説明する。この場合たとえば、集合100に対して生成される複数の組み合わせ情報に対する評価値が、全て予め定められた閾値を超え、かつ、評価値の平均値が大きくなるように、集合100のセンサ10を組み替える。そうすることで、目的に適したセンサ10の組み合わせが集合100として得られる。このような集合100の組み替えは、ユーザが手作業で行うことができる。ただし、学習データセットおよび評価データセットがシミュレーションにより得られる場合には、集合100の組み替えはシミュレーション装置により仮想的に行われても良い。
また、本実施形態に係る処理装置20では、複数の集合100に基づく組み合わせに対し、さらに評価結果の比較が行われても良い。たとえば予測式生成手段210は、複数の集合100のそれぞれについて機械学習を行う。また抽出手段220は、複数の集合100のそれぞれに対し組み合わせ情報を生成する。そして評価手段240は、生成された複数の組み合わせ情報が示す複数の組み合わせをそれぞれ評価する。出力手段250は、複数の組み合わせのうち評価手段240による評価結果が最も優れる(高い)組み合わせを出力する。なお、出力手段250は複数の組み合わせを、評価結果が最も優れる組み合わせが識別可能な状態で出力しても良い。
本実施形態に係る処理装置20も、図6に示したような計算機1000により実現可能である。本実施形態において、ストレージデバイス1080は、処理装置20の予測精度算出手段230および評価手段240をそれぞれ実現するプログラムモジュールをさらに記憶している。
次に、本実施形態の作用および効果について説明する。本実施形態においては第1の実施形態と同様の作用および効果が得られる。くわえて、予測精度算出手段230で予測式の予測精度が算出されたり、評価手段240による評価が行われたりすることで、センサ10の複数の組み合わせの有効性を互いに比較することができる。
以上、図面を参照して本発明の実施形態について述べたが、これらは本発明の例示であり、上記以外の様々な構成を採用することもできる。たとえば、上述の説明で用いたシーケンス図やフローチャートでは、複数の工程(処理)が順番に記載されているが、各実施形態で実行される工程の実行順序は、その記載の順番に制限されない。各実施形態では、図示される工程の順番を内容的に支障のない範囲で変更することができる。また、上述の各実施形態は、内容が相反しない範囲で組み合わせることができる。
以上、図面を参照して本発明の実施形態について述べたが、これらは本発明の例示であり、上記以外の様々な構成を採用することもできる。
上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
1−1. 複数種類のセンサの集合からの出力に基づいた複数の特徴量と正解データとを入力とした機械学習を行うことにより、前記複数の特徴量を変数とする式であって、におい成分に関する予測を行うための予測式を生成する予測式生成手段と、
前記予測式における前記複数の特徴量に対する複数の重みに基づいて、前記集合から一以上の前記センサを抽出する抽出手段と、
前記抽出手段で抽出された前記センサおよび抽出されなかった前記センサの少なくとも一方を、識別可能な状態で出力する出力手段とを備え、
前記抽出手段は、前記予測式において、前記複数の重みのうち予め定められた条件を満たす、または満たさない前記重みで重みづけられた前記特徴量の、出力元である前記センサを抽出する処理装置。
1−2. 複数種類のセンサの集合からの出力に基づいた複数の特徴量と正解データとを入力とした機械学習を行うことにより、前記複数の特徴量を変数とする式であって、におい成分に関する予測を行うための予測式を生成する予測式生成手段と、
前記予測式を示す情報として、前記予測式における前記複数の特徴量に対する複数の重みを、それぞれ前記特徴量に関連づけて出力する出力手段とを備える処理装置。
1−3. 1−2.に記載の処理装置において、
前記予測式における前記複数の特徴量に対する複数の重みに基づいて、前記集合から一以上の前記センサを抽出する抽出手段をさらに備え、
前記抽出手段は、前記予測式において、前記複数の重みのうち予め定められた条件を満たす、または満たさない前記重みで重みづけられた前記特徴量の、出力元である前記センサを抽出する処理装置。
1−4. 1−1.または1−3.に記載の処理装置において、
前記抽出手段は、抽出された前記センサからなる組み合わせを示す組み合わせ情報を生成し、
前記組み合わせを採用する場合のコストに少なくとも基づいて、前記組み合わせを評価する評価手段をさらに備える処理装置。
1−5. 1−4.に記載の処理装置において、
前記予測式生成手段は、複数の前記集合のそれぞれについて前記機械学習を行い、
前記抽出手段は、前記複数の集合のそれぞれに対し前記組み合わせ情報を生成し、
前記評価手段は、生成された前記複数の組み合わせ情報が示す前記複数の組み合わせをそれぞれ評価し、
前記出力手段は、前記複数の組み合わせのうち前記評価手段による評価結果が最も優れる前記組み合わせを出力する処理装置。
1−6. 1−1.から1−5.のいずれか一つに記載の処理装置において、
前記予測式生成手段は、前記センサの検出環境に基づいた分岐を含むモデルを用いて前記予測式を生成し、
前記出力手段は、前記予測式に適した前記検出環境の条件であって、前記分岐の条件に基づく前記検出環境の条件を、前記予測式を示す情報に関連づけてさらに出力する処理装置。
1−7. 1−6.に記載の処理装置において、
前記機械学習は、前記特徴量に関連づけられた前記センサの検出環境をさらに入力とした異種混合学習であり、
前記分岐の条件は、前記異種混合学習により生成される処理装置。
1−8. 1−6.または1−7.に記載の処理装置において、
前記検出環境は、温度、湿度、気圧、夾雑ガスの種類、パージガスの種類、前記におい成分のサンプリング周期、対象物と前記センサとの距離、前記センサの周囲に存在する物体のうち少なくともいずれかを含む処理装置。
1−9. 1−1.から1−8.のいずれか一つに記載の処理装置において、
前記予測式の予測精度を算出する予測精度算出手段をさらに備える処理装置。
2−1. 複数種類のセンサの集合からの出力に基づいた複数の特徴量と正解データとを入力とした機械学習を行うことにより、前記複数の特徴量を変数とする式であって、におい成分に関する予測を行うための予測式を生成する予測式生成ステップと、
前記予測式における前記複数の特徴量に対する複数の重みに基づいて、前記集合から一以上の前記センサを抽出する抽出ステップと、
前記抽出ステップで抽出された前記センサおよび抽出されなかった前記センサの少なくとも一方を、識別可能な状態で出力する出力ステップとを含み、
前記抽出ステップでは、前記予測式において、前記複数の重みのうち予め定められた条件を満たす、または満たさない前記重みで重みづけられた前記特徴量の、出力元である前記センサを抽出する処理方法。
2−2. 複数種類のセンサの集合からの出力に基づいた複数の特徴量と正解データとを入力とした機械学習を行うことにより、前記複数の特徴量を変数とする式であって、におい成分に関する予測を行うための予測式を生成する予測式生成ステップと、
前記予測式を示す情報として、前記予測式における前記複数の特徴量に対する複数の重みを、それぞれ前記特徴量に関連づけて出力する出力ステップとを含む処理方法。
2−3. 2−2.に記載の処理方法において、
前記予測式における前記複数の特徴量に対する複数の重みに基づいて、前記集合から一以上の前記センサを抽出する抽出ステップをさらに含み、
前記抽出ステップでは、前記予測式において、前記複数の重みのうち予め定められた条件を満たす、または満たさない前記重みで重みづけられた前記特徴量の、出力元である前記センサを抽出する処理方法。
2−4. 2−1.または2−3.に記載の処理方法において、
前記抽出ステップでは、抽出された前記センサからなる組み合わせを示す組み合わせ情報を生成し、
前記組み合わせを採用する場合のコストに少なくとも基づいて、前記組み合わせを評価する評価ステップをさらに含む処理方法。
2−5. 2−4.に記載の処理方法において、
前記予測式生成ステップでは、複数の前記集合のそれぞれについて前記機械学習を行い、
前記抽出ステップでは、前記複数の集合のそれぞれに対し前記組み合わせ情報を生成し、
前記評価ステップでは、生成された前記複数の組み合わせ情報が示す前記複数の組み合わせをそれぞれ評価し、
前記出力ステップでは、前記複数の組み合わせのうち前記評価ステップにおける評価結果が最も優れる前記組み合わせをさらに出力する処理方法。
2−6. 2−1.から2−5.のいずれか一つに記載の処理方法において、
前記予測式生成ステップでは、前記センサの検出環境に基づいた分岐を含むモデルを用いて前記予測式を生成し、
前記出力ステップでは、前記予測式に適した前記検出環境の条件であって、前記分岐の条件に基づく前記検出環境の条件を、前記予測式を示す情報に関連づけてさらに出力する処理方法。
2−7. 2−6.に記載の処理方法において、
前記機械学習は、前記特徴量に関連づけられた前記センサの検出環境をさらに入力とした異種混合学習であり、
前記分岐の条件は、前記異種混合学習により生成される処理方法。
2−8. 2−6.または2−7.に記載の処理方法において、
前記検出環境は、温度、湿度、気圧、夾雑ガスの種類、パージガスの種類、前記におい成分のサンプリング周期、対象物と前記センサとの距離、前記センサの周囲に存在する物体のうち少なくともいずれかを含む処理方法。
2−9. 2−1.から2−8.のいずれか一つに記載の処理方法において、
前記予測式の予測精度を算出する予測精度算出ステップをさらに備える処理方法。
3−1. 2−1.から2−9.のいずれか一つに記載の処理方法の各ステップをコンピュータに実行させるプログラム。

Claims (19)

  1. 複数種類のセンサの集合からの出力に基づいた複数の特徴量と正解データとを入力とした機械学習を行うことにより、前記複数の特徴量を変数とする式であって、におい成分に関する予測を行うための予測式を生成する予測式生成手段と、
    前記予測式における前記複数の特徴量に対する複数の重みに基づいて、前記集合から一以上の前記センサを抽出する抽出手段と、
    前記抽出手段で抽出された前記センサおよび抽出されなかった前記センサの少なくとも一方を、識別可能な状態で出力する出力手段とを備え、
    前記抽出手段は、前記予測式において、前記複数の重みのうち予め定められた条件を満たす、または満たさない前記重みで重みづけられた前記特徴量の、出力元である前記センサを抽出する処理装置。
  2. 複数種類のセンサの集合からの出力に基づいた複数の特徴量と正解データとを入力とした機械学習を行うことにより、前記複数の特徴量を変数とする式であって、におい成分に関する予測を行うための予測式を生成する予測式生成手段と、
    前記予測式を示す情報として、前記予測式における前記複数の特徴量に対する複数の重みを、それぞれ前記特徴量に関連づけて出力する出力手段とを備える処理装置。
  3. 請求項2に記載の処理装置において、
    前記予測式における前記複数の特徴量に対する複数の重みに基づいて、前記集合から一以上の前記センサを抽出する抽出手段をさらに備え、
    前記抽出手段は、前記予測式において、前記複数の重みのうち予め定められた条件を満たす、または満たさない前記重みで重みづけられた前記特徴量の、出力元である前記センサを抽出する処理装置。
  4. 請求項1または3に記載の処理装置において、
    前記抽出手段は、抽出された前記センサからなる組み合わせを示す組み合わせ情報を生成し、
    前記組み合わせを採用する場合のコストに少なくとも基づいて、前記組み合わせを評価する評価手段をさらに備える処理装置。
  5. 請求項4に記載の処理装置において、
    前記予測式生成手段は、複数の前記集合のそれぞれについて前記機械学習を行い、
    前記抽出手段は、前記複数の集合のそれぞれに対し前記組み合わせ情報を生成し、
    前記評価手段は、生成された前記複数の組み合わせ情報が示す前記複数の組み合わせをそれぞれ評価し、
    前記出力手段は、前記複数の組み合わせのうち前記評価手段による評価結果が最も優れる前記組み合わせを出力する処理装置。
  6. 請求項1から5のいずれか一項に記載の処理装置において、
    前記予測式生成手段は、前記センサの検出環境に基づいた分岐を含むモデルを用いて前記予測式を生成し、
    前記出力手段は、前記予測式に適した前記検出環境の条件であって、前記分岐の条件に基づく前記検出環境の条件を、前記予測式を示す情報に関連づけてさらに出力する処理装置。
  7. 請求項6に記載の処理装置において、
    前記機械学習は、前記特徴量に関連づけられた前記センサの検出環境をさらに入力とした異種混合学習であり、
    前記分岐の条件は、前記異種混合学習により生成される処理装置。
  8. 請求項6または7に記載の処理装置において、
    前記検出環境は、温度、湿度、気圧、夾雑ガスの種類、パージガスの種類、前記におい成分のサンプリング周期、対象物と前記センサとの距離、前記センサの周囲に存在する物体のうち少なくともいずれかを含む処理装置。
  9. 請求項1から8のいずれか一項に記載の処理装置において、
    前記予測式の予測精度を算出する予測精度算出手段をさらに備える処理装置。
  10. 複数種類のセンサの集合からの出力に基づいた複数の特徴量と正解データとを入力とした機械学習を行うことにより、前記複数の特徴量を変数とする式であって、におい成分に関する予測を行うための予測式を生成する予測式生成ステップと、
    前記予測式における前記複数の特徴量に対する複数の重みに基づいて、前記集合から一以上の前記センサを抽出する抽出ステップと、
    前記抽出ステップで抽出された前記センサおよび抽出されなかった前記センサの少なくとも一方を、識別可能な状態で出力する出力ステップとを含み、
    前記抽出ステップでは、前記予測式において、前記複数の重みのうち予め定められた条件を満たす、または満たさない前記重みで重みづけられた前記特徴量の、出力元である前記センサを抽出する処理方法。
  11. 複数種類のセンサの集合からの出力に基づいた複数の特徴量と正解データとを入力とした機械学習を行うことにより、前記複数の特徴量を変数とする式であって、におい成分に関する予測を行うための予測式を生成する予測式生成ステップと、
    前記予測式を示す情報として、前記予測式における前記複数の特徴量に対する複数の重みを、それぞれ前記特徴量に関連づけて出力する出力ステップとを含む処理方法。
  12. 請求項11に記載の処理方法において、
    前記予測式における前記複数の特徴量に対する複数の重みに基づいて、前記集合から一以上の前記センサを抽出する抽出ステップをさらに含み、
    前記抽出ステップでは、前記予測式において、前記複数の重みのうち予め定められた条件を満たす、または満たさない前記重みで重みづけられた前記特徴量の、出力元である前記センサを抽出する処理方法。
  13. 請求項10または12に記載の処理方法において、
    前記抽出ステップでは、抽出された前記センサからなる組み合わせを示す組み合わせ情報を生成し、
    前記組み合わせを採用する場合のコストに少なくとも基づいて、前記組み合わせを評価する評価ステップをさらに含む処理方法。
  14. 請求項13に記載の処理方法において、
    前記予測式生成ステップでは、複数の前記集合のそれぞれについて前記機械学習を行い、
    前記抽出ステップでは、前記複数の集合のそれぞれに対し前記組み合わせ情報を生成し、
    前記評価ステップでは、生成された前記複数の組み合わせ情報が示す前記複数の組み合わせをそれぞれ評価し、
    前記出力ステップでは、前記複数の組み合わせのうち前記評価ステップにおける評価結果が最も優れる前記組み合わせをさらに出力する処理方法。
  15. 請求項10から14のいずれか一項に記載の処理方法において、
    前記予測式生成ステップでは、前記センサの検出環境に基づいた分岐を含むモデルを用いて前記予測式を生成し、
    前記出力ステップでは、前記予測式に適した前記検出環境の条件であって、前記分岐の条件に基づく前記検出環境の条件を、前記予測式を示す情報に関連づけてさらに出力する処理方法。
  16. 請求項15に記載の処理方法において、
    前記機械学習は、前記特徴量に関連づけられた前記センサの検出環境をさらに入力とした異種混合学習であり、
    前記分岐の条件は、前記異種混合学習により生成される処理方法。
  17. 請求項15または16に記載の処理方法において、
    前記検出環境は、温度、湿度、気圧、夾雑ガスの種類、パージガスの種類、前記におい成分のサンプリング周期、対象物と前記センサとの距離、前記センサの周囲に存在する物体のうち少なくともいずれかを含む処理方法。
  18. 請求項10から17のいずれか一項に記載の処理方法において、
    前記予測式の予測精度を算出する予測精度算出ステップをさらに備える処理方法。
  19. 請求項10から18のいずれか一項に記載の処理方法の各ステップをコンピュータに実行させるプログラム。
JP2020547701A 2018-09-27 2018-09-27 処理装置、処理方法、およびプログラム Active JP7063389B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2018/035849 WO2020065806A1 (ja) 2018-09-27 2018-09-27 処理装置、処理方法、およびプログラム

Publications (2)

Publication Number Publication Date
JPWO2020065806A1 true JPWO2020065806A1 (ja) 2021-09-09
JP7063389B2 JP7063389B2 (ja) 2022-05-09

Family

ID=69949756

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020547701A Active JP7063389B2 (ja) 2018-09-27 2018-09-27 処理装置、処理方法、およびプログラム

Country Status (3)

Country Link
US (1) US20220036223A1 (ja)
JP (1) JP7063389B2 (ja)
WO (1) WO2020065806A1 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7140191B2 (ja) * 2018-07-31 2022-09-21 日本電気株式会社 情報処理装置、制御方法、及びプログラム
JP7224460B2 (ja) 2019-05-27 2023-02-17 三菱電機株式会社 照明装置
US20210102925A1 (en) * 2019-10-02 2021-04-08 X Development Llc Machine olfaction system and method
TWI762853B (zh) * 2020-01-06 2022-05-01 宏碁股份有限公司 利用自動化機制挑選影響力指標的方法及電子裝置
US11657300B2 (en) * 2020-02-26 2023-05-23 Samsung Electronics Co., Ltd. Systems and methods for predicting storage device failure using machine learning

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018132325A (ja) * 2017-02-13 2018-08-23 国立研究開発法人物質・材料研究機構 ニオイ測定による西洋梨の熟成度の非破壊検査方法および装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11443219B2 (en) * 2017-02-17 2022-09-13 Nec Corporation Model estimation system, method, and program

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018132325A (ja) * 2017-02-13 2018-08-23 国立研究開発法人物質・材料研究機構 ニオイ測定による西洋梨の熟成度の非破壊検査方法および装置

Also Published As

Publication number Publication date
US20220036223A1 (en) 2022-02-03
JP7063389B2 (ja) 2022-05-09
WO2020065806A1 (ja) 2020-04-02

Similar Documents

Publication Publication Date Title
JP7063389B2 (ja) 処理装置、処理方法、およびプログラム
Wahl et al. Assessment of predictive performance in incomplete data by combining internal validation and multiple imputation
Egeghy et al. Computational exposure science: an emerging discipline to support 21st-century risk assessment
JP6679086B2 (ja) 学習装置、予測装置、学習方法、予測方法、およびプログラム
KR20170009991A (ko) 글로벌 모델로부터의 로컬화된 학습
JPWO2017168865A1 (ja) 情報処理装置及び情報処理方法
Aloisio et al. Assessment of structural interventions using Bayesian updating and subspace-based fault detection methods: The case study of S. Maria di Collemaggio basilica, L’Aquila, Italy
JP6216294B2 (ja) 重回帰分析装置および重回帰分析方法
Sansó et al. Statistical calibration of climate system properties
García-Macías et al. Real-time Bayesian damage identification enabled by sparse PCE-Kriging meta-modelling for continuous SHM of large-scale civil engineering structures
JP7017711B2 (ja) 関係性分析装置、関係性分析方法およびプログラム
Wheeler Bayesian additive adaptive basis tensor product models for modeling high dimensional surfaces: an application to high-throughput toxicity testing
Kaneko Beware of r2 even for test datasets: Using the latest measured y‐values (r2LM) in time series data analysis
JP7056747B2 (ja) 情報処理装置、処理装置、情報処理方法、処理方法、決定方法、およびプログラム
JP7140191B2 (ja) 情報処理装置、制御方法、及びプログラム
JP7127697B2 (ja) 情報処理装置、制御方法、及びプログラム
US11789001B2 (en) Information processing apparatus, sensor operation optimization method, and program
WO2020026328A1 (ja) 情報処理装置、制御方法、及びプログラム
Wang et al. Nonparametric interval estimators for the coefficient of variation
CN116050475A (zh) 关键污染物浓度预测模型的训练方法、装置和计算机设备
JP7074194B2 (ja) 情報処理装置、制御方法、及びプログラム
JP7099623B2 (ja) 情報処理装置、情報処理方法、およびプログラム
Altamirano-Astorga et al. Indoor air pollution forecasting using deep neural networks
JP2022092419A (ja) データ解析装置、方法およびシステム
JP2022167027A (ja) モデル生成装置、モデル生成方法、モデル生成プログラム、品質予測モデル及び製品品質予測装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210310

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210310

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220322

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220404

R151 Written notification of patent or utility model registration

Ref document number: 7063389

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151