JP7276450B2 - 予測モデル再学習装置、予測モデル再学習方法及びプログラム - Google Patents

予測モデル再学習装置、予測モデル再学習方法及びプログラム Download PDF

Info

Publication number
JP7276450B2
JP7276450B2 JP2021528543A JP2021528543A JP7276450B2 JP 7276450 B2 JP7276450 B2 JP 7276450B2 JP 2021528543 A JP2021528543 A JP 2021528543A JP 2021528543 A JP2021528543 A JP 2021528543A JP 7276450 B2 JP7276450 B2 JP 7276450B2
Authority
JP
Japan
Prior art keywords
prediction model
data
learning
sensor
odor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021528543A
Other languages
English (en)
Other versions
JPWO2020255305A1 (ja
Inventor
聡 山田
力 江藤
純子 渡辺
ひろみ 清水
秀宜 羽根
重夫 木村
渉 藤井
知行 河部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2020255305A1 publication Critical patent/JPWO2020255305A1/ja
Application granted granted Critical
Publication of JP7276450B2 publication Critical patent/JP7276450B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/02Food
    • G01N33/025Fruits or vegetables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/09Supervised learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/096Transfer learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Food Science & Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Medicinal Chemistry (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Investigating Or Analyzing Materials By The Use Of Electric Means (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、予測モデルを再学習する予測モデル再学習装置、予測モデル再学習方法およびプログラム記録媒体に関する。
予測モデルは、環境の変化などが原因で、時間の経過とともに予測精度が劣化することが知られている。
そのため、特許文献1は、予測モデルの精度を評価する評価指標に基づいて、予測モデルを再学習する技術を開示する。
特許文献2は、5つのサンプルの測定終了毎に、匂いを識別する予測モデルを再学習する技術を開示する。
国際公開第2016/151618号 特開1992-186139号公報
ところで、ニオイを検知するセンサには、温度、湿度といった測定環境が変わると、センサの検出値の挙動が変化する特性がある。
しかしながら、特許文献1に記載の評価指標は、上記の特性を考慮していない。そのため、特許文献1に記載の技術では、センサの検出値を用いた予測モデルの精度劣化が改善しない場合がある。
特許文献2に記載の技術は、5つのサンプルの測定終了毎に、再学習を行うため、上記の特性を考慮していない。そのため、特許文献2に記載の技術では予測モデルの精度劣化が改善しない場合がある。
そこで、本発明は、予測モデルの精度劣化を改善することを目的とする。
本発明の予測モデル再学習装置は、センサによるニオイ検知に関係するデータに基づいて、ニオイの予測モデルを再学習するか否かを決定する指標を算出する算出手段と、算出された前記指標が所定の条件を満たす場合に、前記予測モデルを再学習する再学習手段と、を備える。
本発明の予測モデル再学習方法は、センサによるニオイ検知に関係するデータに基づいて、ニオイの予測モデルを再学習するか否かを決定する指標を算出し、算出された前記指標が所定の条件を満たす場合に、前記予測モデルを再学習する。
本発明のプログラム記録媒体は、センサによるニオイ検知に関係するデータに基づいて、ニオイの予測モデルを再学習するか否かを決定する指標を算出する処理と、算出された前記指標が所定の条件を満たす場合に、前記予測モデルを再学習する処理とをコンピュータに実行させる。
本発明は、予測モデルの精度劣化を改善するという効果がある。
予測モデル再学習装置2000が取得するデータを得るためのセンサ10を例示する図である。 予測モデルの概念図である。 実施形態1の予測モデル再学習装置2000の機能構成を例示する図である。 予測モデル再学習装置を実現するための計算機を例示する図である。 実施形態1の予測モデル再学習装置2000によって実行される処理の流れを例示する図である。 記憶部2010が記憶するニオイデータを例示する図である。 記憶部2010が記憶する予測モデルと学習データの対応関係を例示する図である。 記憶部2010が記憶する再学習のための条件を例示する図である。 算出部2020の処理の流れを例示する図である。 再学習部2030の処理の流れを例示する図である。 実施形態2の予測モデル再学習装置2000の機能構成を例示する図である。 実施形態2の予測モデル再学習装置2000によって実行される処理の流れを例示する図である。 実施形態2において、記憶部2010が記憶するニオイデータを例示する図である。 記憶部2010が記憶する、再学習部2030が再学習を行うか否かの判定に用いる条件を例示する図である。 時系列データに対する特徴定数毎の寄与値を例示する図である。 算出部2050の処理の流れを例示する図である。 実施形態2の変形例における機能構成を例示する図である。 実施形態3の予測モデル再学習装置2000の機能構成を例示する図である。 実施形態3の予測モデル再学習装置2000によって実行される処理の流れを例示する図である。 更新判定部2070の処理の流れを例示する図である。
[実施形態1]
以下、本発明に係る実施形態1を説明する。
<センサについて>
本実施形態で用いるセンサについて説明する。図1は、ニオイを検知するセンサ10及びセンサ10がニオイを検知することにより得られる時系列データを例示する図である。センサ10は、分子が付着する受容体を有し、その受容体における分子の付着と離脱に応じて検出値が変化するセンサである。なお、センサ10によってセンシングされているガスを、対象ガスと呼ぶ。また、センサ10から出力される検出値の時系列データを、時系列データ20と呼ぶ。ここで、必要に応じ、時系列データ20をYとも表記し、時刻tの検出値をy(t)とも表記する。Yは、y(t)が列挙されたベクトルとなる。
例えば、センサ10は、膜型表面応力センサ(Membrane-type Surface stress Sensor; MSS)である。MSSは、受容体として、分子が付着する官能膜を有しており、その官能膜に対する分子の付着と離脱によってその官能膜の支持部材に生じる応力が変化する。MSSは、この応力の変化に基づく検出値を出力する。なお、センサ10は、MSSには限定されず、受容体に対する分子の付着と離脱に応じて生じる、センサ10の部材の粘弾性や動力学特性(質量や慣性モーメントなど)に関連する物理量の変化に基づいて検出値を出力するものであればよく、カンチレバー式、膜型、光学式、ピエゾ、振動応答などの様々なタイプのセンサを採用することができる。
<予測モデルについて>
本実施形態で用いる予測モデルについて説明する。図2は、予測モデルの概念図である。ここでは、センサ10から出力される検出値の時系列データから、果物の種類を予測する予測モデルを例として示す。図2(A)は、予測モデルを学習するフェーズを示す。図2(A)では、ある果物の種類(例えば、リンゴ)と、センサ10から出力される検出値の時系列データ20との組み合わせを学習データとして、予測モデルが学習される。図2(B)は、予測モデルを利用するフェーズを示す。図2(B)では、予測モデルは、種類が未知である果物から取得された時系列データを入力として受け付け、果物の種類を予測結果として出力する。
なお、以下で説明する実施形態においては、予測モデルは、果物の種類を予測するものに限定されない。予測モデルは、センサ10から出力される検出値の時系列データに基づいて、予測結果を出力するものであればよい。例えば、予測モデルは、人の呼気から特定の病気の有無を予測するものであってもよいし、住居内のニオイから有害物質の有無を予測するものであってもよいし、工場内のニオイから工場設備の異常を予測するものであってもよい。
<予測モデル再学習装置2000の機能構成の例>
図3は、実施形態1の予測モデル再学習装置2000の機能構成を例示する図である。予測モデル再学習装置2000は、算出部2020及び再学習部2030を有する。算出部2020は、記憶部2010から、センサによるニオイ検知に関係するデータ(以下、ニオイデータ)を取得し、予測モデルを再学習するか否かを決定する指標を算出する。再学習部2030は、算出部2020により算出された指標に基づき、予測モデルの再学習を行うか否かを決定する。再学習部2030は、予測モデルの再学習を行うと決定した場合、予測モデルの再学習を行う。
<予測モデル再学習装置2000のハードウェア構成>
図4は、図3に示した予測モデル再学習装置2000を実現するための計算機を例示する図である。計算機1000は任意の計算機である。例えば、計算機1000は、Personal Computer(PC)やサーバマシンなどの据え置き型の計算機である。その他にも例えば、計算機1000は、スマートフォンやタブレット端末などの可搬型の計算機である。計算機1000は、予測モデル再学習装置2000を実現するために設計された専用の計算機であってもよいし、汎用の計算機であってもよい。
計算機1000は、バス1020、プロセッサ1040、メモリ1060、ストレージデバイス1080、入出力インタフェース1100、及びネットワークインタフェース1120を有する。バス1020は、プロセッサ1040、メモリ1060、ストレージデバイス1080、入出力インタフェース1100、及びネットワークインタフェース1120が、相互にデータを送受信するためのデータ伝送路である。ただし、プロセッサ1040などを互いに接続する方法は、バス接続に限定されない。
プロセッサ1040は、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)、FPGA(Field-Programmable Gate Array)などの種々のプロセッサである。メモリ1060は、RAM(Random Access Memory)などを用いて実現される主記憶装置である。ストレージデバイス1080は、ハードディスク、SSD(Solid State Drive)、メモリカード、又はROM(Read Only Memory)などを用いて実現される補助記憶装置である。
入出力インタフェース1100は、計算機1000と入出力デバイスを接続するためのインタフェースである。例えば、入出力インタフェース1100には、キーボードなどの入力装置や、ディスプレイ装置などの出力装置が接続される。その他にも例えば、入出力インタフェース1100には、センサ10が接続される。ただし、センサ10は必ずしも計算機1000と直接接続されている必要はない。例えば、センサ10は、計算機1000と共有している記憶装置に取得したデータを記憶させてもよい。
ネットワークインタフェース1120は、計算機1000を通信網に接続するためのインタフェースである。この通信網は、例えば、LAN(Local Area Network)やWAN(Wide Area Network)である。ネットワークインタフェース1120が通信網に接続する方法は、無線接続であってもよいし、有線接続であってもよい。
ストレージデバイス1080は、予測モデル再学習装置2000の各機能構成部を実現するプログラムモジュールを記憶している。プロセッサ1040は、これら各プログラムモジュールをメモリ1060に読み出して実行することで、各プログラムモジュールに対応する機能を実現する。
<処理の流れ>
図5は、実施形態1の予測モデル再学習装置2000によって実行される処理の流れを例示する図である。算出部2020はニオイデータから予測モデルを再学習するか否かの指標を算出する(S100)。再学習部2030は、算出した指標に基づいて、予測モデルを再学習する(S110)。再学習部2030は、再学習した予測モデルを記憶部2010に記憶させて予測モデルを更新する(S120)。
<記憶部2010が記憶する情報>
記憶部2010が記憶する情報を説明する。図6は、記憶部2010が記憶するニオイデータを例示する図である。
図6における各レコードがニオイデータに対応する。各ニオイデータは、例えば、ニオイデータを識別するためのID、センサ10がニオイを検知したことにより得られる時系列データ、ニオイを検知したセンサ10を識別するためのセンサID、測定日、測定対象及び測定環境を含む。
測定日は、例えば、センサ10に対象ガスが噴射された日でもよいし、取得したニオイデータが記憶部2010に記憶された日でもよい。なお、測定日は、測定時間を含む測定日時であってもよい。
測定環境は、ニオイを測定する際の環境に関する情報である。図6に示すように、例えば、測定環境として、センサ10が設置された環境の温度、湿度及びサンプリング周期がある。
サンプリング周期は、ニオイを測定する間隔を示し、Δt[s]、あるいはその逆数を用いたサンプリング周波数[Hz]として表される。例えば、サンプリング周期は、0.1[s]、0.01[s]などである。
また、ニオイがサンプルガスとパージガスを交互にセンサ10に噴射することで測定される場合、サンプルガス及びパージガス噴射時間を、サンプリング周期としてもよい。ここで、サンプルガスとは、図1における対象ガスである。パージガスは、センサ10に付着した対象ガスを除去するためのガス(例えば、窒素)である。例えば、センサ10は、サンプルガスは5秒間、パージガスは5秒間、噴射されることでデータを測定できる。
上述した温度、湿度、サンプリング周期等の測定環境は、例えば、センサ10の内部又は外部に備えられた計器によって取得されてもよいし、ユーザから入力されてもよい。
なお、本実施形態においては、温度、湿度、サンプリング周期を測定環境の例として説明したが、他の測定環境の例としては、測定対象とセンサ10の距離、パージガスの種類、キャリアガス、センサの種類(例えば、センサID)、測定時の季節、測定時の気圧、測定時の大気(例えば、CO濃度)及び測定者についての情報がある。キャリアガスは、測定対象のニオイと同時に噴射されるガスであり、例えば窒素や大気を用いる。サンプルガスは、キャリアガスと測定対象のニオイの混合である。
また、上述した温度・湿度は、測定対象、キャリアガス、パージガス、センサ10自体、センサ10周辺の大気、センサ10、あるいはセンサ10を制御する機器の設定値から取得されたものであってもよい。
図7は、記憶部2010が記憶する、予測モデルと学習データIDの対応関係を例示する図である。図7に示すように、記憶部2010は、予測モデルと、予測モデルを学習する際に利用した学習データIDとを対応付けて記憶する。学習データIDは、図6に示したニオイデータのIDに対応する。例えば、学習データID「1」は、図6におけるID「1」に対応する。すなわち、図7に示した予測モデルは、学習データの一部として、図6におけるID「1」、ID「2」、ID「3」のニオイデータを用いて学習されたことを示す。
なお、図7においては、1つの予測モデルが記憶部2010に記憶されている場合を例として説明したが、複数の予測モデルが記憶部2010に記憶されていてもよい。
図8は、記憶部2010が記憶する、再学習部2030が再学習を行うか否かの判定に用いる条件を例示する図である。図8に示すように、指標と条件が対応付けられている。指標は、予測モデルを再学習するか否かを判定するために用いられる指標の種類である。指標の種類は、図6に示した測定環境(温度差、湿度差等)である。条件は、各指標において、予測モデルの再学習を行う条件を示す。例えば、図8に示すように、指標が「温度差」の場合、対応する条件は「5℃以上」である。つまり、算出部2020が指標として算出した、ニオイデータの測定環境に含まれる温度差が「5℃以上」である場合、再学習部2030は、予測モデルを再学習する。算出部2020による指標の算出処理及び再学習部2030による再学習処理の詳細は後述する。
<算出部2020の処理について>
図9は、算出部2020の処理の流れを例示する図である。図9を参照して、算出部2020による処理を具体的に説明する。ここでは、算出部2020が温度差を指標として算出する場合を例として説明する。また、算出部2020が図7に示した予測モデルを再学習するか否かを判定するための指標を算出する場合を例として説明する。
図9に示すように、まず、算出部2020は、学習データとして用いられたニオイデータの測定環境に含まれる温度を取得する(S200)。例えば、算出部2020は、学習データとして用いられたID「1」のニオイデータの温度「20℃」(図6)を取得する。
次に、算出部2020は、学習データとして用いられたニオイデータ以外のニオイデータであり、学習データとして用いられたニオイデータの測定日以降であるニオイデータの測定環境に含まれる温度を取得する(S210)。例えば、算出部2020は、図6に示したID「125」のニオイデータの温度「10℃」を取得する。
次に、算出部2020は、S200において取得した温度と、S210において取得した温度との差を指標として算出する(S220)。例えば、S200において取得した温度が「20℃」であり、S210において取得した温度が「10℃」である場合、指標は「10℃」である。
なお、本実施形態においては、S200及びS210において、ニオイデータを1つずつ取得する場合を例として説明した。この場合、例えば、算出部2020は、学習データに用いられたニオイデータのうちの1つをランダムに取得してもよいし、ユーザからのニオイデータの指定を受け付けて取得してもよい。S210において取得するニオイデータについても同様である。
また、算出部2020がS200及びS210において取得するニオイデータは、それぞれ複数であってもよい。この場合、算出部2020は、例えば、複数のニオイデータの温度の統計値(例えば、平均値、中央値、最頻値)を取得する。複数のニオイデータは、S200においては学習データに用いたすべてのニオイデータであってもよいし、ユーザから指定されたニオイデータであってもよい。S210において取得するニオイデータについても同様である。
また、本実施形態においては、算出部2020が温度差を指標として取得する場合を例として説明した。しかしながら、指標は温度差に限らず、例えば湿度差やサンプリング周期の差であってもよい。
<再学習部2030の処理について>
図10は、再学習部2030の処理の流れを例示する図である。図10を参照して、再学習部2030の処理を具体的に説明する。
図10に示すように、まず、再学習部2030は、算出部2020により算出された指標を取得する(S300)。例えば、再学習部2030は、温度差「10℃」を指標として取得する。
次に、再学習部2030は、S300で取得した指標が、記憶部2010が記憶する条件(図8)を満たすか否かを判定する(S310)。再学習部2030は、指標が条件を満たすと判定した場合(S310;YES)、S320に進む。それ以外の場合、再学習部2030は、処理を終了する。
再学習部2030は、指標が条件を満たすと判定した場合(S310;YES)、機械学習の技術(例えば、確率的勾配降下法等の確率的最適化の技術)を用いて、予測モデルを再学習する(S320)。例えば、再学習部2030が取得した指標が温度差「10℃」である場合、図8に示した温度差の条件は「5℃以上」であるため、再学習部2030は、予測モデルを再学習する。
なお、本実施形態においては、再学習部2030が予測モデルを再学習する場合を例として説明したが、再学習部2030は、新たに予測モデルを生成してもよい。この場合、再学習部2030は、新たな学習データセットを用いて予測モデルを生成する。新たな学習データセットは、例えば、ユーザにより指定される。ユーザによる指定方法としては、例えば、学習データセットが直接入力されてもよいし、測定日(または測定期間)が指定されてもよいし、測定環境が指定されてもよいし、バギング等のサンプリング方法が指定されてもよい。
<作用・効果>
以上のように、本実施形態に係る予測モデル再学習装置2000は、温度、湿度といった測定環境の影響によりセンサの検出値の挙動が変化する特性を考慮して、予測モデルを再学習する。これにより、予測モデルの精度劣化を改善することができる。
[実施形態2]
以下、本発明に係る実施形態2を説明する。実施形態2は、実施形態1と比べて、特徴量取得部2040及び取得した特徴量に基づいて指標を算出する算出部2050を有する点で異なる。以下、詳細を説明する。
<予測モデル再学習装置2000の機能構成の例>
図11は、実施形態2の予測モデル再学習装置2000の機能構成を例示する図である。実施形態2の予測モデル再学習装置2000は、特徴量取得部2040、算出部2050及び再学習部2030を有する。特徴量取得部2040は、記憶部2010から予測モデルに用いられる学習データ以外のデータに含まれる時系列データの特徴量を取得する。算出部2050は、取得した特徴量に基づいて、予測モデルの指標を算出する。再学習部2030の動作は、他の実施形態と同様であり、本実施形態では説明を省略する。
<処理の流れ>
図12は、実施形態2の予測モデル再学習装置2000によって実行される処理の流れを例示する図である。特徴量取得部2040は、記憶部2010から予測モデルに用いられる学習データ以外のデータに含まれる時系列データの特徴量を取得する(S400)。算出部2020は、取得した特徴量に基づいて、予測モデルの指標を算出する(S410)。再学習部2030は、算出した指標に基づいて、予測モデルの再学習を行う(S420)。再学習部2030は、再学習した予測モデルを記憶部2010に記憶させて予測モデルを更新する(S430)。
<記憶部2010が記憶する情報>
実施形態2において、記憶部2010が記憶する情報を説明する。図13は、実施形態2において、記憶部2010が記憶するニオイデータを例示する図である。
図13における各レコードがニオイデータに対応する。各ニオイデータは、例えば、センサ10がニオイを検知したことにより得られる時系列データ及び時系列データの特徴量を表すベクトル量であるFkを含む。添字kは、ニオイデータのIDと対応している。特徴量の詳細については後述する。
図14は、記憶部2010が記憶する、再学習部2030が再学習を行うか否かの判定に用いる条件を例示する図である。図14に示すように、指標と条件とが対応付けられている。指標は、予測モデルを再学習するか否かを判定するために用いられる指標の種類を意味する。指標の種類としては、例えば、分離度や確信度がある。条件は、各指標の種類毎に、予測モデルの再学習を行うための条件を示す。例えば、図14に示すように、指標の種類が「分離度」の場合、対応する条件は「0.5以下」である。つまり、算出部2020が指標として算出した分離度が「0.5以下」になった場合、再学習部2030は、予測モデルを再学習する。算出部2020による分離度及び確信度の算出処理の詳細は後述する。
<特徴量の算出方法>
図13に示した特徴量Fkの算出方法の一例を説明する。各時系列データに対応する特徴量Fkは、時系列データに対する、特徴定数毎の寄与値で示されるベクトル量である。以下、図15を用いて、特徴定数と寄与値について説明する。
図15は、時系列データに対する特徴定数毎の寄与値を例示する図である。特徴定数θは、センサ10に付着している分子の量の時間変化の大きさに関する時定数又は速度定数である。特徴量Fkは、各特徴定数θi(iは1からnの整数;n≧1)について、時系列データy(t)に対する寄与の大きさを表す寄与値ξiで示されるベクトル量である。
特徴定数θと寄与値ξの算出方法を説明する。特徴量取得部2040は、時系列データを以下の式(1)に示すように分解する。
[数1]

Figure 0007276450000001
式(1)において、fは、特徴定数によって異なる関数である。
特徴定数θとして、速度定数βを採用した場合、式(1)は、以下の式(2)のように表すことができる。
[数2]

Figure 0007276450000002
特徴定数θとして、速度定数の逆数である時定数τを採用した場合は、式(1)は、以下の式(3)のように表すことができる。
[数3]

Figure 0007276450000003
<特徴定数θの集合Θの算出方法>
特徴定数θ、θ、・・・θ(以下、集合Θとする)の算出方法を説明する。集合Θは、例えば、(1)特徴定数θの最小値θmin(すなわち、θ)、(2)特徴定数θの最大値θmax(すなわち、θ)、及び(3)隣接する特徴定数の間隔ds、の3つのパラメータによって定めることができる。この場合、集合Θは、Θ={θmin,θmin+ds,θmin+2ds,...,θmax}となる。以下、上述した3つのパラメータを決定する方法の一例をそれぞれ示す。
(1)θmin
θminは、センサ10のサンプリング間隔Δtの定数倍である。すなわち、予め定められた定数をC1とすると、θmin=Δt*C1である。
(2)θmax
θmaxは、センサ10により取得される時系列データy(t)の長さ(検出値の数)Tの定数倍である。すなわち、予め1以上の値をC2とすると、θmax=T*C2である。
(3)ds
dsは、例えば、特徴定数θの個数をnsとすると、ds=(θmax-θmin)/(ns-1)である。
なお、特徴定数として速度定数βを用いる場合、特徴定数の最小値θmin、特徴定数の最大値θmax、及び隣接する特徴定数の間隔dsはそれぞれ、速度定数の最小値βmin、速度定数の最大値βmax、及び隣接する速度定数の間隔Δβとなる。同様に、特徴定数として時定数τを用いる場合、特徴定数の最小値θmin、特徴定数の最大値θmax、及び隣接する特徴定数の間隔dsはそれぞれ、時定数の最小値τmin、時定数の最大値τmax、及び隣接する時定数の間隔Δτとなる。
<寄与ベクトルの算出>
特徴量取得部2040は、前述のようにして特定した特徴定数θの集合Θに含まれる各特徴定数θiの寄与値ξiである寄与ベクトルΞを特徴量Fkとして算出する。具体的には、特徴量取得部2040は、全ての寄与値ξi(すなわち、特徴量Fk。以下では、説明のため「寄与ベクトルΞ」と表記する。)をパラメータとして、式(1)を用いて、センサ10の検出値を予測する検出値予測モデルを生成する。この検出値予測モデルを生成する際、時系列データを利用して寄与ベクトルΞについてパラメータ推定を行うことにより、寄与ベクトルΞを算出することができる。
検出値予測モデルのパラメータ推定には、種々の方法を利用することができる。以下、その方法の一例を示す。なお、以下の説明では、速度定数βを特徴定数として利用するケースを説明している。時定数τを特徴定数とする場合におけるパラメータ推定の方法は、以下の説明における速度定数βを1/τと読み替えることで実現できる。例えば、特徴量取得部2040は、検出値予測モデルから得られる予測値と、センサ10から出力される検出値の時系列データとを用いた最尤推定や最大事後確率推定により、パラメータΞを推定する。以下、最尤推定の場合を記載する。最尤推定には、例えば、最小二乗法を用いることができる。この場合、具体的には、以下の目的関数に従ってパラメータΞを決定する。
[数4]

Figure 0007276450000004
式(4)において、y^(ti)は、時刻tiの予測値を表し、検出値予測モデルにより決定される。
上述の目的関数を最小化するベクトルΞは、以下の式(5)を用いて算出することができる。
[数5]

Figure 0007276450000005
式(5)において、Yは、(y(t0), y(t1),...)を転置した列ベクトルである。
そこで、特徴量取得部2040は、時系列データYと特徴定数の集合Θ={β1, β2,...}を上記式(5)に適用することで、パラメータΞを算出する。
ここで、上記式(5)における「立ち上がり」と「立ち下り」の意味を説明する。「立ち上がり」は、サンプリング周期の説明において上述したサンプルガスをセンサ10に噴射することにより、時系列データが示す検出値が増加している状態を示す。「立ち下り」は、サンプリング周期の説明において上述したパージガスをセンサ10に噴射することにより、センサ10から対象ガスが取り除かれて、時系列データが示す測定値が減少している状態を示す。
なお、本実施形態においては、特徴量Fkは、「立ち上がり」の時系列データ及び「立ち下り」の時系列データから取得される。しかしながら、これに限らず、特徴量取得部2040は、「立ち上がり」の時系列データ又は「立ち下り」の時系列データのどちらか一方からのみ特徴量を取得してもよい。
また、時系列データの特徴量を取得する方法は、上述の方法に限定されない。例えば、特徴量取得部2040は、時系列データからだけではなく、時系列データと測定環境を用いて特徴量を算出してもよい。具体的には、特徴量取得部2040は、時系列データと測定環境からニューラルネットワーク等の機械学習手法を用いて、特徴量を取得してもよい。
<算出部2050の指標算出方法>
図16は、算出部2050の処理の流れを例示する図である。図16を参照して、算出部2050による処理を具体的に説明する。ここでは、算出部2050が分離度を指標として算出する場合を例として説明する。分離度の詳細は後述する。また、算出部2050が図7に示した予測モデルを再学習するか否かを判定するための指標を算出する場合を例として説明する。
図16に示すように、まず、算出部2050は、予測モデルの学習データとして用いられたニオイデータ以外のニオイデータであり、学習データとして用いられたニオイデータの測定日以降であるニオイデータを取得する(S500)。例えば、算出部2050は、図13に示したID「1」、ID「2」のニオイデータを取得する。
次に、算出部2050は、S500で取得したニオイデータの特徴量を用いて、ニオイデータのクラスを予測する(S510)。例えば、特定の果物の種類(例えば、梨)に該当すると予測されるニオイデータには、正クラスが割り当てられる。特定の果物の種類に該当しないと予測されるニオイデータには、負クラスが割り当てられる。
次に、算出部2050は、各ニオイデータの予測結果から、予測モデルの分離度を指標として算出する(S520)。
分離度について説明する。分離度は、例えば、クラス内分散とクラス間分散の比として表される。クラス内分散は、クラス内でのデータの散らばりを示し、正クラスの分散と負クラスの分散の和で表される。クラス間分散は、データ全体における各クラスの散らばりを示し、データ全体に対する、正クラスの分散及び負クラスの分散それぞれに各クラスのサンプル数をかけたものの和として算出される。この分離度は、データの特徴量から直接算出しても良いし、次元削減された特徴量(例えば、1次元の空間に次元削減された特徴量)から算出されても良い。
なお、算出部2050が算出する指標は、クラス内分散とクラス間分散の比である分離度に限定されない。算出部2050は、クラス内分散及びクラス間分散のどちらか一方を指標としてもよい。
また、算出部2050は、S520で分離度の代わりに、確信度を指標として用いてもよい。
確信度について説明する。簡単のため、予測モデルが二値分類を行う場合を説明する。確信度は、予測モデルによる分類の確からしさの度合いを表す指標であり、決定関数によって得られた値を、例えばシグモイド関数などで0から1の値として表したものである。学習時において、予測モデルは、正クラスのサンプルはできるだけ1に近づくように、負クラスのサンプルはできるだけ0に近づくように学習される。予測時は、学習した予測モデルを用いて、閾値(一般には0.5とすることが多い)より大きい確信度が得られれば、正クラスとして予測結果を出力する。このとき、確信度が閾値付近のデータが多くなれば予測に不安定な状態になっている場合があると推測できるため、再学習をする指標として活用しうる。
<作用・効果>
以上のように、本実施形態に係る予測モデル再学習装置2000は、センサの検出値の特徴量を考慮して、予測モデルを再学習する。これにより、予測モデルの精度劣化を改善することができる。
[変形例]
実施形態2の変形例について説明する。変形例では、特徴量取得部2040は、時系列データに対して、測定環境の影響を補正した上で、特徴量を取得することができる。
図17は、実施形態2の変形例における機能構成を例示する図である。予測モデル再学習装置2000は、他の実施形態と比べて、補正部2060を有する点を特徴とする。補正部2060は、補正係数を用いて、予測モデルに用いられる学習データ以外のデータに含まれる時系列データを補正する。特徴量取得部2040は、補正した時系列データから特徴量を取得する。その他の機能構成は、他の実施形態および実施形態2で説明した動作と同様である。
補正部2060が、補正係数を用いて時系列データを補正する例を説明する。補正部2060は、補正係数を、時系列データy(t)に乗ずることで補正を行う。補正係数は、例えば、センサ10の官能膜の個体差に関するものである。補正係数は、例えば、センサ10の出荷時に予め算出され、センサ10が備え付けられた筐体に記憶されている。補正部2060は、センサ10が備え付けられた筐体から補正係数を取得することで、時系列データy(t)を補正する。
[実施形態3]
以下、本発明に係る実施形態3を説明する。実施形態1、2においては、再学習された予測モデルが、そのまま記憶部2010に記憶されて更新される。しかしながら、例えば、測定環境に一時的な誤差が生じた(急な大雨により一時的に湿度が上昇した等)場合、その測定環境を用いて算出された指標に基づく予測モデルの更新は不要である場合もある。
そこで、本実施形態3においては、予測モデルの更新前に、再学習された予測モデルにより予測モデルを更新するか否かを判定する。
<予測モデル再学習装置2000の機能構成の例>
図18は、実施形態3の予測モデル再学習装置2000の機能構成を例示する図である。予測モデル再学習装置2000は、算出部2050、再学習部2030及び更新判定部2070を有する。算出部2050及び再学習部2030は、他の実施形態と同様の動作を行うため、ここでは説明を省略する。更新判定部2070は、再学習を行った予測モデル及び更新判定用のニオイデータから再学習を行った予測モデルの更新判定を行う。
<処理の流れ>
図19は、実施形態3の予測モデル再学習装置2000によって実行される処理の流れを例示する図である。算出部2050は、予測モデルを再学習するか否かを決定する指標を算出する(S600)。再学習部2030は、算出された指標が所定の条件を満たす場合に、前記予測モデルを再学習する(S610)。更新判定部2070は、再学習した予測モデルが所定の条件を満たす場合に、予測モデルを更新する(S620)。
<更新判定部2070の更新判定処理について>
更新判定部2070の更新判定処理を説明する。図20は、更新判定部2070の処理の流れを例示する図である。図20を参照して、更新判定部2070による処理を具体的に説明する。ここでは、更新判定部2070が図7に示した予測モデルを再学習するか否かを判定するための指標を算出する場合を例として説明する。
まず、更新判定部2070は、更新判定用のニオイデータを取得する(S700)。更新判定用のニオイデータは、予測モデルを再学習するか否かを判定するための指標を算出する際に用いられたニオイデータとは異なるニオイデータである。図6を用いて、更新判定用のニオイデータの具体例を示す。予測モデルの学習データの測定日が「2016/10/15」で、指標算出のためにID「125」のニオイデータを用いた場合、更新判定部2070は、(1)IDが「125」とは異なるニオイデータを更新判定用のニオイデータとして取得する。
なお、更新判定部2070は、上述した条件(1)に加え、図6に示したセンサID、測定日時、測定環境及び測定対象のうち一つ以上について条件の指定を受け付け、指定された条件を含むニオイデータを、更新判定用のニオイデータとして取得してもよい。
図20を用いた説明に戻る。更新判定部2070は、取得した更新判定用データを用いて、再学習済みの予測モデルの精度指標を算出する(S710)。精度指標は、例えば、Precision、Recall、Specificity、F値、Accuracy及びAUCである。
なお、ここでは、予測モデルが判別モデルである場合の精度指標の例を説明した。予測モデルが回帰モデルである場合は、精度指標は、例えば、決定係数、平均二乗誤差及び平均絶対誤差である。
次に、S710で算出した精度指標が、所定の条件を満たす場合に、更新判定部2070は、再学習済み予測モデルを記憶部2010に記憶させて予測モデルを更新する(S720)。所定の条件は、例えば、S710で算出した精度指標が閾値以上か否かである。精度指標の閾値は、予め記憶部2010に記憶されていてもよいし、ユーザから入力を受け付けてもよい。
<作用・効果>
以上のように、本実施形態に係る予測モデル再学習装置2000は、再学習された予測モデルの精度に応じて予測モデルを更新するか否かを判定するため、不要な予測モデルの更新を回避することができる。
なお、本願発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
10 センサ
20 時系列データ
1000 計算機
1020 バス
1040 プロセッサ
1060 メモリ
1080 ストレージデバイス
1100 入出力インタフェース
1120 ネットワークインタフェース
2000 予測モデル再学習装置
2010 記憶部
2020 算出部
2030 再学習部
2040 特徴量取得部
2050 算出部
2060 補正部
2070 更新判定部

Claims (10)

  1. センサによるニオイ検知に関係するデータに基づいて、前記センサが測定する時系列データからニオイを予測する予測モデルを再学習するか否かを決定する指標を算出する算出手段と、
    算出された前記指標が所定の条件を満たす場合に、前記予測モデルを再学習する再学習手段と、
    を備える予測モデル再学習装置。
  2. 前記センサによるニオイ検知に関係するデータは、前記センサによるニオイの測定環境を示し、
    前記算出手段は、前記予測モデルの学習データの測定環境と、前記学習データ以外のデータの測定環境との差を、前記指標として算出する、
    請求項1に記載の予測モデル再学習装置。
  3. 前記ニオイの測定環境は少なくとも温度および湿度のいずれか一つを含む、
    ことを特徴とする請求項2に記載の予測モデル再学習装置。
  4. 前記センサによるニオイ検知に関係するデータは、前記予測モデルの学習データ以外のデータの特徴量を示し、
    前記算出手段は、前記特徴量と前記予測モデルとに基づいて、前記指標を算出する、
    請求項1に記載の予測モデル再学習装置。
  5. 前記センサによるニオイ検知に関係するデータは、前記予測モデルの学習データの特徴量及び、前記学習データ以外のデータの特徴量を示し、
    前記算出手段は、前記予測モデルの学習データの特徴量と、前記学習データ以外のデータの前記特徴量とに基づいて、前記指標を算出する、
    請求項1に記載の予測モデル再学習装置。
  6. 前記センサの個体差から算出された補正係数に基づいて、前記センサによるニオイの検出値を補正する補正手段をさらに備え、
    前記算出手段は、前記補正された検出値の特徴量を取得する、
    請求項4または5に記載の予測モデル再学習装置。
  7. 前記再学習した予測モデルと、更新判定のための前記ニオイ検知に関係するデータとから再学習を行った予測モデルの更新判定を行う更新判定手段を、
    更に備える請求項1から6のいずれか1項に記載の予測モデル再学習装置。
  8. 前記学習データ以外のデータは、前記学習データとして用いられたデータの測定日以降のデータである
    請求項2からのいずれか1項に記載の予測モデル再学習装置。
  9. コンピュータが、
    センサによるニオイ検知に関係するデータに基づいて、前記センサが測定する時系列データからニオイを予測するニオイの予測モデルを再学習するか否かを決定する指標を算出し、
    算出された前記指標が所定の条件を満たす場合に、前記予測モデルを再学習する、
    予測モデル再学習方法。
  10. センサによるニオイ検知に関係するデータに基づいて、前記センサが測定する時系列データからニオイを予測するニオイの予測モデルを再学習するか否かを決定する指標を算出する処理と、
    算出された前記指標が所定の条件を満たす場合に、前記予測モデルを再学習する処理と、
    をコンピュータに実行させるためのプログラム。
JP2021528543A 2019-06-19 2019-06-19 予測モデル再学習装置、予測モデル再学習方法及びプログラム Active JP7276450B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2019/024338 WO2020255305A1 (ja) 2019-06-19 2019-06-19 予測モデル再学習装置、予測モデル再学習方法及びプログラム記録媒体

Publications (2)

Publication Number Publication Date
JPWO2020255305A1 JPWO2020255305A1 (ja) 2020-12-24
JP7276450B2 true JP7276450B2 (ja) 2023-05-18

Family

ID=74037024

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021528543A Active JP7276450B2 (ja) 2019-06-19 2019-06-19 予測モデル再学習装置、予測モデル再学習方法及びプログラム

Country Status (3)

Country Link
US (1) US20220309397A1 (ja)
JP (1) JP7276450B2 (ja)
WO (1) WO2020255305A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020026327A1 (ja) * 2018-07-31 2020-02-06 日本電気株式会社 情報処理装置、制御方法、及びプログラム
WO2022181819A1 (ja) * 2021-02-26 2022-09-01 株式会社香味醗酵 変換装置、予測モデル作製装置、変換情報作製方法、予測モデル作製方法、及びプログラム
WO2023163214A1 (ja) * 2022-02-28 2023-08-31 株式会社香味醗酵 情報処理装置、カートリッジ、放出装置、n次元コード、制御方法、コンピュータプログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016151618A1 (ja) 2015-03-23 2016-09-29 日本電気株式会社 予測モデル更新システム、予測モデル更新方法および予測モデル更新プログラム
JP2018004422A (ja) 2016-06-30 2018-01-11 京セラドキュメントソリューションズ株式会社 非接触温度センサー異常判定装置
WO2018230645A1 (ja) 2017-06-14 2018-12-20 株式会社東芝 異常検知装置、異常検知方法、およびプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016151618A1 (ja) 2015-03-23 2016-09-29 日本電気株式会社 予測モデル更新システム、予測モデル更新方法および予測モデル更新プログラム
JP2018004422A (ja) 2016-06-30 2018-01-11 京セラドキュメントソリューションズ株式会社 非接触温度センサー異常判定装置
WO2018230645A1 (ja) 2017-06-14 2018-12-20 株式会社東芝 異常検知装置、異常検知方法、およびプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
中本高道 ほか,ニューラルネットワークを用いたにおいセンサー,応用物理,第58巻, 第7号,1989年,p.1045-1054,特に「3.2 適応学習実験」

Also Published As

Publication number Publication date
WO2020255305A1 (ja) 2020-12-24
JPWO2020255305A1 (ja) 2020-12-24
US20220309397A1 (en) 2022-09-29

Similar Documents

Publication Publication Date Title
JP7276450B2 (ja) 予測モデル再学習装置、予測モデル再学習方法及びプログラム
JP6574527B2 (ja) 時系列データ特徴量抽出装置、時系列データ特徴量抽出方法及び時系列データ特徴量抽出プログラム
US11163853B2 (en) Sensor design support apparatus, sensor design support method and non-transitory computer readable medium
CN102265227B (zh) 用于在机器状况监视中创建状态估计模型的方法和设备
JP7063389B2 (ja) 処理装置、処理方法、およびプログラム
CN114896712A (zh) 基于基准贝叶斯原理与稀疏正则化的结构损伤识别方法
US10437944B2 (en) System and method of modeling irregularly sampled temporal data using Kalman filters
JP7140191B2 (ja) 情報処理装置、制御方法、及びプログラム
CN115618190A (zh) 基于传感器数据的环境颗粒物浓度估计方法、系统及终端
JP7056747B2 (ja) 情報処理装置、処理装置、情報処理方法、処理方法、決定方法、およびプログラム
JP7099623B2 (ja) 情報処理装置、情報処理方法、およびプログラム
JP7099296B2 (ja) 評価方法、システム構築方法、及び評価システム
JP7480683B2 (ja) 状態推定装置、方法およびプログラム
WO2020065890A1 (ja) 情報処理装置、情報処理方法、およびプログラム
US20210321923A1 (en) Stress twin for individuals
JP7327648B2 (ja) データ生成装置、データ生成方法、及び、プログラム
WO2020071430A1 (ja) 情報処理装置、情報処理システム、情報処理方法及びプログラムが格納された非一時的なコンピュータ可読媒体
Barriault et al. Quantitative Natural Gas Discrimination For Pipeline Leak Detection Through Time-Series Analysis of an MOS Sensor Response
CN115931727A (zh) 一种叶绿素a遥感反演方法、装置、系统以及存储介质
JP2022012351A (ja) 要因分析装置、要因分析方法、及び要因分析プログラム
JP2021012633A (ja) 異常度算出方法、及び、異常度算出用コンピュータプログラム
JPWO2020065889A1 (ja) 情報処理装置、伝達関数生成方法、およびプログラム
JP2021193359A (ja) 健全性評価システム及び健全性評価方法
CN117743057A (zh) 硬盘健康状态检测方法、装置、存储介质和电子设备
JP2021043728A (ja) モデル生成方法、モデル生成装置及びプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210917

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210917

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221018

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221208

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230404

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230417

R151 Written notification of patent or utility model registration

Ref document number: 7276450

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151