JP2019105870A - 判別プログラム、判別方法および判別装置 - Google Patents

判別プログラム、判別方法および判別装置 Download PDF

Info

Publication number
JP2019105870A
JP2019105870A JP2017236216A JP2017236216A JP2019105870A JP 2019105870 A JP2019105870 A JP 2019105870A JP 2017236216 A JP2017236216 A JP 2017236216A JP 2017236216 A JP2017236216 A JP 2017236216A JP 2019105870 A JP2019105870 A JP 2019105870A
Authority
JP
Japan
Prior art keywords
events
event
value
feature
generated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017236216A
Other languages
English (en)
Other versions
JP6954070B2 (ja
Inventor
裕平 梅田
Yuhei Umeda
裕平 梅田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2017236216A priority Critical patent/JP6954070B2/ja
Priority to US16/197,833 priority patent/US11423298B2/en
Publication of JP2019105870A publication Critical patent/JP2019105870A/ja
Application granted granted Critical
Publication of JP6954070B2 publication Critical patent/JP6954070B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/41Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Biophysics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Computer Vision & Pattern Recognition (AREA)

Abstract

【課題】点過程時系列データから事象を判別することを課題とする。【解決手段】判別装置は、時系列で発生した複数の事象のうち、事象判別閾値より大きい値を有する複数の特定事象を抽出する。判別装置は、複数の特定事象から、複数の特定事象の隣接発生間隔に関する特徴量を生成する。判別装置は、事象判別閾値を変化させることにより、事象判別閾値と特徴量を成分とする点から、複数の事象に対応した配列データを生成する。判別装置は、配列データを利用して、複数の事象の種別を判別する。【選択図】図2

Description

本発明は、判別プログラム、判別方法および判別装置に関する。
時系列データを自動で分類する深層学習(ディープラーニング(DL)・Deep Learning)技術が知られている。また、時系列データには、間欠的にイベントが発生する、いつイベントが発生するかわからない特徴がある点過程時系列データと呼ばれるものが存在する。例えば、点過程時系列データとしては、心拍データ、インターネットなどでの顧客等のアクセス、商品の需要データ、経済取引、地震などのデータがある。点過程時系列データも時系列データであることから、例えば心拍データで病気の有無や眠気度の分類、経済指標で経済状態の分類などのように、分類を行う要望がある。
近年では、点過程時系列データの解析に関する技術として、イベント間の間隔を発生時の値とし、その間隔値を補間して時系列データに変換した後で、周波数解析を行うことにより、発生間隔の特徴を抽出する技術が知られている。また、別の技術として、イベントの発生をポアソン過程等でモデル化し、イベント発生を確率的なものとして扱う技術が知られており、イベントの発生がカオス的であると仮定してカオス時系列の特徴量を求める技術なども知られている。
特開2016−95434号公報 特開2016−42123号公報
ところで、上記技術は、分析対象の点過程時系列データにおいて、イベントの発生間隔が特定のモデルであることを前提に特徴量を算出して、点過程時系列データから該当する事象を判別する。しかしながら、点過程時系列データ内の各イベントの値に関する情報が欠落しており、点過程時系列データの特徴量としては正確性に欠けることとなり、結果として事象の判別結果の精度も劣化する。
一つの側面では、点過程時系列データから事象を判別することができる判別プログラム、判別方法および判別装置を提供することを目的とする。
第1の案では、判別プログラムは、時系列で発生した複数の事象のうち、事象判別閾値より大きい値を有する複数の特定事象を抽出する処理をコンピュータに実行させる。判別プログラムは、前記複数の特定事象から、前記複数の特定事象の隣接発生間隔に関する特徴量を生成する処理をコンピュータに実行させる。判別プログラムは、前記事象判別閾値を変化させることにより、前記事象判別閾値と前記特徴量を成分とする点から、前記複数の事象に対応した配列データを生成する処理をコンピュータに実行させる。判別プログラムは、前記配列データを利用して、前記複数の事象の種別を判別する処理をコンピュータに実行させる。
一実施形態によれば、点過程時系列データから事象を判別することができる。
図1は、実施例1にかかる判別装置の全体例を説明する図である。 図2は、実施例1にかかる判別装置の機能構成を示す機能ブロック図である。 図3は、点過程時系列データの例を示す図である。 図4は、イベントの抽出例を説明する図である。 図5は、間隔アトラクタの生成例を説明する図である。 図6は、パーシステントホモロジについて説明するための図である。 図7は、バーコードデータと生成される連続データとの関係について説明するための図である。 図8は、配列表示の例を説明する図である。 図9は、画像化による特徴量の例を説明する図である。 図10は、学習処理の流れを示すフローチャートである。 図11は、実験データのラベル付けを説明する図である。 図12は、一般的な技術である時系列補間を説明する図である。 図13は、実験結果を説明する図である。 図14は、実験結果の詳細を説明する図である。 図15は、ハードウェア構成例を説明する図である。
以下に、本願の開示する判別プログラム、判別方法および判別装置の実施例を図面に基づいて詳細に説明する。なお、この実施例によりこの発明が限定されるものではない。また、各実施例は、矛盾のない範囲内で適宜組み合わせることができる。
[全体構成]
図1は、実施例1にかかる判別装置の全体例を説明する図である。図1に示すように、実施例1にかかる判別装置10は、学習データにデータ分析を行った後に、機械学習や深層学習(ディープラーニング(DL)・Deep Learning)などを用いた判別処理(学習処理)を実行して、学習データを事象ごとに正しく判別(分類)できるように、ニューラルネットワーク(NN:Neural Network)などを学習する。その後、学習結果を適用した学習モデルを用いることで、判別対象データの正確な事象(ラベル)の推定を実現する。
ここで、実施例1で想定する学習データは、例えば心拍データや経済取引のような間欠的にイベントが発生する点過程時系列データである。この学習データは、発生間隔がどのようなモデルに該当するのか、また、発生間隔がカオス(非線形なルール)に沿っているのかが事前に判明していてもよく、事前に判明していなくてもよい。
このような状態で、判別装置10は、時系列で発生した複数のイベントのうち、判別閾値より大きい値を有する複数の特定イベントを抽出する。判別装置10は、複数の特定イベントから、複数の特定イベントの隣接発生間隔に関する特徴量を生成する。その後、判別装置10は、判別閾値を変化させることにより、判別閾値と特徴量を成分とする点から、複数のイベントに対応した配列データを生成する。そして、判別装置10は、配列データを利用して、複数のイベントの種別を判別する。
つまり、判別装置10は、イベント値の閾値を変化させ、各閾値以上の隣接発生間隔に関する特徴量を生成し、各閾値に関する特徴量を並べることで、イベント発生間隔とイベント値の大きさ(値)の両方を反映した特徴量を生成する。判別装置10は、このようにして生成された特徴量を用いて、点過程時系列データの事象を判別することができる。なお、判別装置10は、サーバ、パーソナルコンピュータ、タブレットなどのコンピュータ装置の一例である。また、判別装置10と学習モデルによる推定処理を実行する装置とは、別々の装置で実現することもでき、一つの装置で実現することもできる。
[機能構成]
図2は、実施例1にかかる判別装置10の機能構成を示す機能ブロック図である。図2に示すように、判別装置10は、通信部11と記憶部12と制御部20を有する。
通信部11は、他の装置との通信を制御部する処理部であり、例えば通信インタフェースである。例えば、通信部11は、管理者の端末から、処理開始指示を受信する。また、通信部11は、管理者の端末等から、学習データ(入力データ)を受信して学習データDB13に格納する。
記憶部12は、プログラムやデータを記憶する記憶装置の一例であり、例えばメモリやハードディスクなどである。この記憶部12は、学習データDB13や学習結果DB14を記憶する。
学習データDB13は、学習対象のデータを記憶するデータベースである。具体的には、学習データDB13は、点過程時系列のデータ(以下では、点過程時系列データと記載する場合がある)を記憶する。図3は、点過程時系列データの例を示す図である。図3に示すように、点過程時系列データは、間欠的にイベントが発生するデータであり、例えば心拍データや地震のデータなどである。なお、図3の横軸は、時間であり、縦軸は、イベントの大きさ(値)である。
学習結果DB14は、学習結果を記憶するデータベースである。例えば、学習結果DB14は、制御部20による学習データの判別結果(分類結果)、機械学習やディープラーニングによって学習された各種パラメータを記憶する。
制御部20は、判別装置10全体の処理を司る処理部であり、例えばプロセッサなどである。この制御部20は、特徴量算出部21、特徴量生成部22、学習部23を有する。なお、特徴量算出部21、特徴量生成部22、学習部23は、プロセッサなどが有する電子回路やプロセッサなどが実行するプロセスの一例である。また、特徴量算出部21は、抽出部と第1生成部の一例であり、特徴量生成部22は、第2生成部の一例であり、学習部23は、判別部の一例である。
特徴量算出部21は、イベント発生を抽出するための事象判別閾値である閾値aを変化させ、各閾値aについて閾値以上のイベントのみをイベント発生と判断して、イベントの発生間隔に関する特徴量を算出する処理部である。具体的には、特徴量算出部21は、閾値aを変化させた各閾値aにおいて、特定の時間において、時系列で発生した複数のイベントのうち、閾値aより大きい値を有する複数の特定イベントを抽出する。そして、特徴量算出部21は、複数の特定イベントから、複数の特定イベントの発生間隔に関する特徴量を生成する。
例えば、特徴量算出部21は、点過程時系列データを学習データDB13から読み出し、点過程時系列データ内で発生しているイベントのうち、最大のイベントの値(最大値)と最小のイベントの値(最小値)を特定する。そして、特徴量生成部21は、最小値から最大値までを指定の数に等分する。その後、特徴量生成部21は、閾値を最小値から最大値まで等間隔で変化させる過程で、各閾値について、閾値以上のイベントのみをイベント発生と判断して、イベントの発生間隔を抽出する。そして、特徴量算出部21は、各閾値に対して抽出したイベントの発生間隔の特徴量を、確率分布、カオス時系列解析、パーシステントホモロジなどを用いて算出する。なお、イベントの大きさは、0から1に正規化することもできる。
ここで、イベントの抽出について説明する。図4は、イベントの抽出例を説明する図である。図4では、イベントe1からイベントenまでのn個のイベントが発生している点過程時系列データを例にして説明する。まず、図4の左図に示すように、特徴量算出部21は、閾値a以上であるイベントとして、「e1、e2、e3、e4・・・en−1、en」を特定する。続いて、特徴量算出部21は、各イベントの発生間隔として「Δt1、Δt2、Δt3、・・・Δtn」を特定する。例えば、特徴量算出部21は、イベントe1とイベントe2の発生間隔を「Δt1」、イベントe2とイベントe3の発生間隔を「Δt2」などと特定する。そして、特徴量算出部21は、イベント発生間隔「Δt1、Δt2、Δt3、・・・Δtn」の特徴量を、閾値aのときの特徴量として算出する。
次に、図4の右図に示すように、特徴量算出部21は、前回の閾値aから所定値増やした新たな閾値aを算出し、新たな閾値a以上であるイベントとして、「e1、e3、e4・・・en−1、en」を特定する。続いて、特徴量算出部21は、各イベントの発生間隔として「Δt1+Δt2、Δt3、・・・Δtn」を特定する。そして、特徴量算出部21は、イベント発生間隔「Δt1+Δt2、Δt3、・・・Δtn」の特徴量を、新たな閾値aのときの特徴量として算出する。
ここで、特徴量の算出の一例として、図5から図7を用いて、パーシステントホモロジを用いた算出例について説明する。図5は、間隔アトラクタの生成例を説明する図である。図6は、パーシステントホモロジについて説明するための図である。図7は、バーコードデータと生成される連続データとの関係について説明するための図である。
具体的には、特徴量算出部21は、イベントの発生間隔それぞれを複数の成分として有する間隔ベクトルを生成し、時系列において所定数の連続した間隔ベクトルから、特定の成分を1組の座標とする局所変動点を生成する。そして、特徴量算出部21は、始点となる間隔ベクトルが異なる複数の局所変動点に対しパーシステントホモロジ変換を用いることにより、ベッチ系列を生成する。なお、特徴量算出部21は、時間間隔など、特定の条件により区分された区間における「複数のイベント」を対象として処理することができる。
より詳細には、特徴量算出部21は、閾値aのときのイベントの発生間隔「Δt1、Δt2、Δt3、・・・Δtn」を成分(要素)とする間隔ベクトルを生成する。続いて、特徴量算出部21は、間隔ベクトルの各要素(成分)をスライドさせていき、複数の座標を生成する。例えば、図5に示すように、特徴量算出部21は、間隔ベクトルの要素であるイベントの発生間隔(Δt1、Δt2、Δt3・・・Δtn)に対して、「Δt1、Δt2、Δt3」を「x,y,z」座標として抽出し、次に「Δt2、Δt3、Δt4」を「x,y,z」座標として抽出する。なお、この例の場合、3次元の要素が取得できなくなるまでスライドさせることもでき、最後の発生間隔がx座標(このときy座標とz座標は0)となるまでスライドを繰り返すこともできる。
次に、特徴量算出部21は、抽出した各座標(各間隔アトラクタ)から疑似アトラクタを生成し、パーシステントホモロジ変換を用いてベッチ系列へ変換する。なお、ここで生成されるアトラクタは、有限個の点集合であることから「疑似アトラクタ」と呼ぶこととする。なお、ベッチ系列の変換には、特開2017−97643号公報の手法を用いることができる。
ここで、ベッチ系列の変換について簡単に説明する。まず、「ホモロジ」とは、対象の特徴をm(m≧0)次元の穴の数によって表現する手法である。ここで言う「穴」とはホモロジ群の元のことであり、0次元の穴は連結成分であり、1次元の穴は穴(トンネル)であり、2次元の穴は空洞である。各次元の穴の数はベッチ数と呼ばれる。そして、「パーシステントホモロジ」とは、対象(ここでは、点の集合(Point Cloud))におけるm次元の穴の遷移を特徴付けるための手法であり、パーシステントホモロジによって点の配置に関する特徴を調べることができる。この手法においては、対象における各点が球状に徐々に膨らまされ、その過程において各穴が発生した時刻(発生時の球の半径で表される)と消滅した時刻(消滅時の球の半径で表される)とが特定される。
図6を用いて、パーシステントホモロジをより具体的に説明する。ルールとして、1つの球が接した場合には2つの球の中心が線分で結ばれ、3つの球が接した場合には3つの球の中心が線分で結ばれる。ここでは、連結成分及び穴だけを考える。図6(a)のケース(半径r=0)においては、連結成分のみが発生し、穴は発生していない。図6(b)のケース(半径r=r1)においては、穴が発生しており、連結成分の一部が消滅している。図6(c)のケース(半径r=r2)においては、さらに多くの穴が発生しており、連結成分は1つだけ持続している。図6(d)のケース(半径r=r3)においては、連結成分の数は1のままであり、穴が1つ消滅している。なお、図6に示す各黒い点が各間隔アトラクタに該当する。
パーシステントホモロジの計算過程において、ホモロジ群の元(すなわち穴)の発生半径と消滅半径とが計算される。穴の発生半径と消滅半径とを使用することで、バーコードデータを生成することができる。バーコードデータは穴次元毎に生成されるので、複数の穴次元のバーコードデータを統合することで1塊のバーコードデータが生成できる。連続データは、パーシステントホモロジにおける球の半径(すなわち時間)とベッチ数との関係を示すデータである。
図7を用いて、バーコードデータと生成される連続データとの関係について説明する。上段のグラフはバーコードデータから生成されるグラフであり、横軸が半径を表す。下段のグラフは連続データ(ベッチ系列と記載する場合がある)から生成されるグラフであり、縦軸はベッチ数を表し、横軸は時間を表す。上で述べたように、ベッチ数は穴の数を表しており、例えば上段のグラフにおいて破線に対応する半径の時には存在している穴の数が10であるので、下段のグラフにおいては破線に対応するベッチ数も10である。ベッチ数は、ブロック毎に計数される。なお、下段のグラフは疑似的な時系列データのグラフであるので、横軸の値自体が意味を持つわけではない。
基本的には、同じバーコードデータからは同じ連続データが得られる。すなわち、元の疑似アトラクタが同じであれば同じ連続データが得られる。但し、異なるバーコードデータから同じ連続データが得られるケースが極めて稀に発生する。しかし、或るバーコードデータから生成される連続データと、別のバーコードデータから生成される連続データとの類似関係は、上で述べた稀なケースが発生しなければ、バーコードデータ間の類似関係と等価である。以上から、データ間の距離の定義は変わるものの、バーコードデータから生成される連続データ間の類似関係は、元の連続データ間の類似関係とほぼ等価である。
このようにして、特徴量算出部21は、閾値を変化させたときに取得された各イベントの発生間隔から、間隔ベクトルの生成およびパーシステントホモロジ変換を行って、各閾値に対応する各ベッチ系列を生成する。この各ベッチ系列が各閾値に対応する各特徴量となる。そして、特徴量算出部21は、閾値とベッチ系列とを対応付けて特徴量生成部22に出力する。
図2に戻り、特徴量生成部22は、特徴量算出部21によって算出された各閾値に対応する各特徴量を用いて、点過程時系列データの特徴量を生成する処理部である。具体的には、特徴量生成部22は、閾値を変化させることにより、閾値と特徴量を成分とする点から、複数のイベントに対応した配列データを生成する。例えば、特徴量生成部22は、各閾値に対応する各特徴量(ベッチ系列)を並べた配列データを点過程時系列データの特徴量として生成する。
また、特徴量生成部22は、各閾値aに対して順にベッチ系列(特徴量ベクトル)を並べて、ひとつの特徴量とすることもできる。例えば、特徴量生成部22は、特徴量ベクトルの次元が大きい場合などは、ひとつの特徴量ベクトルを閾値aの変化に伴い縦軸に並べることで画像として扱うことも有用である。
図8は、配列表示の例を説明する図である。ここではイベントの大きさは、0から1に正規化して閾値aを0から1まで等間隔に変化させた例を示す。特徴量生成部22は、各閾値に対応する各ベッチ系列をベクトル表現とする。そして、図8に示すように、特徴量生成部22は、縦軸を閾値aとし、各閾値に対応したベクトル表現(ベッチ系列)を並べた配列データを生成する。すなわち、各セルにはベッチ数が格納される。その後、特徴量生成部22は、生成した配列データを、点過程時系列データの特徴量として学習部23に出力する。
さらに、特徴量生成部22は、生成した配列データを画像として取り扱うこともできる。図9は、画像化による特徴量の例を説明する図である。特徴量生成部22は、図8に示した配列データにおいて、各セルのベッチ数等により色や濃さを変えたり、値に変更したりすることで、図9に示した各特徴画像を生成することもできる。図9の各画像は、別々の点過程時系列データから生成された画像である。図9の(a)の特徴画像と図9の(b)の特徴画像とを比較すると、白い領域の濃さに相違がある。また、図9の(a)の特徴画像と図9の(c)の特徴画像とを比較すると、白い領域の形状に相違がある。従って、本実施の形態の方法により生成された特徴画像に基づき分類を実行すれば、図9の(a)、(b)、(c)の各画像を分類できる。
図2に戻り、学習部23は、特徴量生成部22によって生成された特徴量を用いて点過程時系列データを判別して、学習処理を実行する処理部である。学習部23は、点過程時系列データを特徴量によって事象ごとに分類する。つまり、学習部23は、各点過程時系列データを事象A、各点過程時系列データを事象Bなどのように分類する。そして、学習部23は、点過程時系列データの特徴量から事象が分類できるようにDL等によって学習し、学習結果を学習結果DB14に格納する。学習の結果は、点過程時系列データの分類結果(すなわちDL学習の出力)を含み、入力から出力を計算する際のニューラルネットワークの各種パラメータが含まれていてもよい。また、本実施の形態の学習は教師有りの学習であってもよいし、教師無しの学習であってもよい。なお、DLに限らず、一般的な機械学習であってもよい。
[処理の流れ]
次に、上述した学習処理について説明する。図10は、学習処理の流れを示すフローチャートである。図10に示す処理が各点過程時系列データについて実行される。図10に示すように、特徴量算出部21は、点過程時系列データを学習データDB13から読み出す(S101)。
続いて、特徴量算出部21は、点過程時系列データ内のイベントの最大値を抽出し(S102)、0から最大値を指定数分に等分する(S103)。なお、特徴量算出部21は、点過程時系列データ内のイベントの最小値から最大値を指定数分に等分することもできる。
そして、特徴量算出部21は、閾値aに初期値(例えば0)を設定し(S104)、閾値a以上のイベントのみを抽出する(S105)。続いて、特徴量算出部21は、抽出したイベントのイベント間隔を用いて特徴量を算出する(S106)。
その後、閾値aが最大値ではない場合(S107:No)、特徴量算出部21は、閾値aを所定数増加させて(S108)、S105以降を実行する。
また、閾値aが最大値である場合(S107:Yes)、特徴量生成部22は、特徴量算出部21によって算出された各特徴量を用いて、点過程時系列データ全体の特徴量を生成する(S109)。
その後、学習部23は、特徴量生成部22によって生成された点過程時系列データ全体の特徴量を用いて、点過程時系列データを判別し、特徴量と事象との関係性を学習する(S110)。
そして、未処理の点過程時系列データが存在する場合(S111:No)、S101以降が繰り返され、全点過程時系列データについて処理が終了した場合(S111:Yes)、学習処理が終了する。
[効果]
上述したように、判別装置10は、各閾値aの値に対して特徴量を生成することができる。あくまでイベント間隔を用いた特徴量のため、イベント間隔の情報は失わず、閾値aの変化に伴い、イベントの小さな情報を削るため、閾値aの変化に伴う特徴量の変化はイベントの値とイベント間隔の関係を表現する。つまり、判別装置10は、イベント間隔をもとにしてイベント間隔情報を保存しつつ、イベントの値とイベント間隔の関係を表現することができる。この結果、判別装置10は、点過程時系列データの解析を、イベントの値もイベント間隔も両方を含めた形で実行できるので、点過程時系列データから事象を正確に判別することができる。
ここで、実施例1による手法と従来手法との比較を行った実験結果を説明する。まず、実験の条件を説明する。イベント発生間隔は、正規分布で発生と一様分布で発生することとし、ラベルは、時間軸で正規分布で乱数発生となっているものをラベル1とサイン関数に沿って発生しているものをラベル2とし、ラベル付けはそれらの組み合わせとする。図11は、実験データのラベル付けを説明する図である。図11に示すように、実験データでは、イベント値が正規分布に沿っており、イベントの発生間隔が正規分布に沿っているデータにラベル1を付し、イベント値が正規分布に沿っており、イベントの発生間隔が一様分布に沿っているデータにラベル2を付し、イベント値がサイン関数に沿っており、イベントの発生間隔が正規分布に沿っているデータにラベル3を付し、イベント値がサイン関数に沿っており、イベントの発生間隔が一様分布に沿っているデータにラベル4を付すこととする。
次に、比較実験の手法を説明する。ここでは、実施例1による手法に加えて、イベント間隔の統計量を用いる一般手法と、時系列補間の手法を採用する。図12は、一般的な技術である時系列補間を説明する図である。図12に示すように、時系列補間は、点過程を一定間隔の時系列として補間する手法であり、イベントの発生間隔の情報が失われ、実際の値との誤差も大きい。
図13は、実験結果を説明する図である。ここでは、各ラベルの点過程時系列データを入力して学習し、学習後に、例えば推定対象のラベル1の点過程時系列データを入力したときにラベル1と推定できたときを正答と判定し、他のラベルが推定されたときを誤答と判定する。図13に示すように、実施例1による手法では、100%の高精度の正答率であったが、他の手法は低精度の正答率に留まった。また、各ラベルの正答率をみると、一般手法では、イベントの発生間隔の違いは判別できたが、イベントの値は判別できない。また、時系列補間では、イベントの値の違いは判別できたが、イベントの発生間隔の違いは判別できない。
図14は、実験結果の詳細を説明する図である。図14では、正解ラベルと推定ラベルとのマトリックス図を示す。例えば、ラベル1の点過程時系列データを、ラベル1と推定した割合、ラベル2と推定した割合、ラベル3と推定した割合、ラベル4と推定した割合を示す。
図14に示すように、一般手法では、イベントの発生間隔は推定できているが、イベントの値についてはランダムに推定されたことがわかる。また、時系列補間では、イベントの値は推定できているが、イベントの発生間隔についてはランダムに推定されたことがわかる。これに対して、実施例1による手法では、イベントの発生間隔とイベントの値の両方について正確に推定できた。
さて、これまで本発明の実施例について説明したが、本発明は上述した実施例以外にも、種々の異なる形態にて実施されてよいものである。
[対象]
例えば、間隔ベクトルの生成処理や判別処理などは、時間間隔など、特定の条件により区分された区間における「複数のイベント」を対象として処理することができる。
[学習手法]
実施例1の学習は、DLに限らずに他の機械学習を採用することができる。また、間隔アトラクタの次元数も任意に設定することができる。なお、学習後に推定対象のデータのラベル推定を行う場合、学習時と同様の処理を行って学習モデルに入力する。
[特徴量の算出]
実施例1では、パーシステントホモロジ変換によって特徴量を算出する例を説明したが、これに限定されるものではない。例えば、確率分布、カオス時系列解析などを用いて、特徴量を算出することができる。特に、イベント発生間隔などが確率分布やカオス理論に沿っている場合には有効である。また、点過程時系列データ全体の特徴量についても、必ずしも画像にする必要はなく、配列で特徴量を判別することもできる。
なお、閾値aの変化方法は、一定間隔に限らず、任意に設定変更することができる。また、パーシステントホモロジ変換に限らず、時間が異なる複数の点やベクトルなどから特徴量を生成する手法を採用することができる。
[ハードウェア]
図15は、ハードウェア構成例を説明する図である。図15に示すように、判別装置10は、通信インタフェース10a、HDD(Hard Disk Drive)10b、メモリ10c、プロセッサ10dを有する。また、図15に示した各部は、バス等で相互に接続される。
通信インタフェース10aは、ネットワークインタフェースカードなどであり、他のサーバとの通信を行う。HDD10bは、図2に示した機能を動作させるプログラムやDBを記憶する。
プロセッサ10dは、図2に示した各処理部と同様の処理を実行するプログラムをHDD10b等から読み出してメモリ10cに展開することで、図2等で説明した各機能を実行するプロセスを動作させる。すなわち、このプロセスは、判別装置10が有する各処理部と同様の機能を実行する。具体的には、プロセッサ10dは、特徴量算出部21、特徴量生成部22、学習部23等と同様の機能を有するプログラムをHDD10b等から読み出す。そして、プロセッサ10dは、特徴量算出部21、特徴量生成部22、学習部23等と同様の処理を実行するプロセスを実行する。
このように判別装置10は、プログラムを読み出して実行することで判別方法を実行する情報処理装置として動作する。また、判別装置10は、媒体読取装置によって記録媒体から上記プログラムを読み出し、読み出された上記プログラムを実行することで上記した実施例と同様の機能を実現することもできる。なお、この他の実施例でいうプログラムは、判別装置10によって実行されることに限定されるものではない。例えば、他のコンピュータまたはサーバがプログラムを実行する場合や、これらが協働してプログラムを実行するような場合にも、本発明を同様に適用することができる。
[システム]
上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散や統合の具体的形態は図示のものに限られない。つまり、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。例えば、アイテムを表示する処理部と、選好を推定する処理部とを別々の筐体で実現することもできる。さらに、各装置にて行なわれる各処理機能は、その全部または任意の一部が、CPUおよび当該CPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。
10 判別装置
11 通信部
12 記憶部
13 学習データDB
14 学習結果DB
20 制御部
21 特徴量算出部
22 特徴量生成部
23 学習部

Claims (7)

  1. 時系列で発生した複数の事象のうち、事象判別閾値より大きい値を有する複数の特定事象を抽出し、
    前記複数の特定事象から、前記複数の特定事象の隣接発生間隔に関する特徴量を生成し、
    前記事象判別閾値を変化させることにより、前記事象判別閾値と前記特徴量を成分とする点から、前記複数の事象に対応した配列データを生成し、
    前記配列データを利用して、前記複数の事象の種別を判別する、
    処理をコンピュータに実行させる判別プログラム。
  2. 前記複数の特定事象間の隣接発生間隔それぞれを複数の成分として有する間隔ベクトルを生成し、
    前記時系列において所定数の連続した前記間隔ベクトルから、特定の成分を1組の座標とする局所変動点を生成し、
    始点となる前記間隔ベクトルが異なる複数の局所変動点に対しパーシステントホモロジ変換を用いることにより、ベッチ系列を生成し、
    前記事象判別閾値と前記ベッチ系列を成分とする点から、前記複数の事象に対応した画像データを生成する、処理をコンピュータに実行させる請求項1に記載の判別プログラム。
  3. 前記配列データから画像データを生成し、画像データを利用して、前記複数の事象の種別を判別する、処理をコンピュータに実行させる請求項1に記載の判別プログラム。
  4. 前記画像データの画素値は、前記特徴量に関連する値とは異なる値である、請求項3に記載の判別プログラム。
  5. 前記複数の特定事象の隣接発生間隔それぞれから、時間が異なる複数のベクトルを生成し、生成された前記複数のベクトルを用いて、前記複数の特定事象の隣接発生間隔に関する前記特徴量を生成する、処理をコンピュータに実行させる請求項1に記載の判別プログラム。
  6. 時系列で発生した複数の事象のうち、事象判別閾値より大きい値を有する複数の特定事象を抽出し、
    前記複数の特定事象から、前記複数の特定事象の隣接発生間隔に関する特徴量を生成し、
    前記事象判別閾値を変化させることにより、前記事象判別閾値と前記特徴量を成分とする点から、前記複数の事象に対応した配列データを生成し、
    前記配列データを利用して、前記複数の事象の種別を判別する、
    処理をコンピュータが実行する判別方法。
  7. 時系列で発生した複数の事象のうち、事象判別閾値より大きい値を有する複数の特定事象を抽出する抽出部と、
    前記複数の特定事象から、前記複数の特定事象の隣接発生間隔に関する特徴量を生成する第1生成部と、
    前記事象判別閾値を変化させることにより、前記事象判別閾値と前記特徴量を成分とする点から、前記複数の事象に対応した配列データを生成する第2生成部と、
    前記配列データを利用して、前記複数の事象の種別を判別する判別部と
    を有する判別装置。
JP2017236216A 2017-12-08 2017-12-08 判別プログラム、判別方法および判別装置 Active JP6954070B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2017236216A JP6954070B2 (ja) 2017-12-08 2017-12-08 判別プログラム、判別方法および判別装置
US16/197,833 US11423298B2 (en) 2017-12-08 2018-11-21 Computer-readable recording medium, determination method, and determination apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017236216A JP6954070B2 (ja) 2017-12-08 2017-12-08 判別プログラム、判別方法および判別装置

Publications (2)

Publication Number Publication Date
JP2019105870A true JP2019105870A (ja) 2019-06-27
JP6954070B2 JP6954070B2 (ja) 2021-10-27

Family

ID=66697014

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017236216A Active JP6954070B2 (ja) 2017-12-08 2017-12-08 判別プログラム、判別方法および判別装置

Country Status (2)

Country Link
US (1) US11423298B2 (ja)
JP (1) JP6954070B2 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008186079A (ja) * 2007-01-26 2008-08-14 Ntt Docomo Inc 情報端末及びその入力方法
US9430688B1 (en) * 2015-03-25 2016-08-30 The Boeing Company Overlapping multi-signal classification
JP2017097643A (ja) * 2015-11-25 2017-06-01 富士通株式会社 機械学習プログラム、機械学習方法及び情報処理装置

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3712882B2 (ja) * 1999-03-03 2005-11-02 日本電信電話株式会社 時間間隔を含む時系列パターン抽出装置
JP3650572B2 (ja) * 2000-07-07 2005-05-18 日本電信電話株式会社 時系列データの分類装置
US20030065409A1 (en) * 2001-09-28 2003-04-03 Raeth Peter G. Adaptively detecting an event of interest
US20070036434A1 (en) * 2005-08-15 2007-02-15 Peter Saveliev Topology-Based Method of Partition, Analysis, and Simplification of Dynamical Images and its Applications
JP2007179131A (ja) * 2005-12-27 2007-07-12 Nec Corp イベント検出システム、管理端末及びプログラムと、イベント検出方法
JP5030882B2 (ja) * 2008-07-25 2012-09-19 三菱電機株式会社 監視用画像処理装置
JP2010249991A (ja) * 2009-04-14 2010-11-04 Seiko Epson Corp 転写装置および画像形成装置
JP5388827B2 (ja) * 2009-12-11 2014-01-15 三菱電機株式会社 監視用画像処理装置
JP5861463B2 (ja) 2012-01-17 2016-02-16 株式会社デンソー 情報取得プログラム
JP5769039B2 (ja) * 2012-03-30 2015-08-26 日本電気株式会社 管路管理支援装置及び管路管理支援システム
CN105027550B (zh) * 2012-11-06 2018-04-06 阿尔卡特朗讯公司 用于处理视觉信息以检测事件的系统和方法
US9589190B2 (en) * 2012-12-21 2017-03-07 Robert Bosch Gmbh System and method for detection of high-interest events in video data
JP6241790B2 (ja) 2014-08-15 2017-12-06 日本電信電話株式会社 生成モデル作成装置、推定装置、それらの方法およびプログラム
JP6372696B2 (ja) * 2014-10-14 2018-08-15 ソニー株式会社 情報処理装置、情報処理方法、並びにプログラム
JP6367691B2 (ja) 2014-11-17 2018-08-01 日本電信電話株式会社 報知音感知・識別装置、報知音感知・識別方法、報知音感知・識別プログラム
JP6467989B2 (ja) * 2015-02-26 2019-02-13 富士通株式会社 検知プログラム、検知方法及び検知装置
JP6716888B2 (ja) * 2015-10-29 2020-07-01 Tdk株式会社 呼吸解析装置、呼吸解析方法及びプログラム
JP6434396B2 (ja) * 2015-12-10 2018-12-05 日本電信電話株式会社 センサデータ収集システムおよび方法
US10546197B2 (en) * 2017-09-26 2020-01-28 Ambient AI, Inc. Systems and methods for intelligent and interpretive analysis of video image data using machine learning
JP6912998B2 (ja) * 2017-10-25 2021-08-04 株式会社日立製作所 データ分析装置、データ分析方法、およびデータ分析プログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008186079A (ja) * 2007-01-26 2008-08-14 Ntt Docomo Inc 情報端末及びその入力方法
US9430688B1 (en) * 2015-03-25 2016-08-30 The Boeing Company Overlapping multi-signal classification
JP2017097643A (ja) * 2015-11-25 2017-06-01 富士通株式会社 機械学習プログラム、機械学習方法及び情報処理装置

Also Published As

Publication number Publication date
JP6954070B2 (ja) 2021-10-27
US11423298B2 (en) 2022-08-23
US20190180178A1 (en) 2019-06-13

Similar Documents

Publication Publication Date Title
KR101531618B1 (ko) 이미지들의 비교 방법 및 시스템
WO2019105163A1 (zh) 目标人物的搜索方法和装置、设备、程序产品和介质
CN113254549B (zh) 人物关系挖掘模型的训练方法、人物关系挖掘方法及装置
CA3066029A1 (en) Image feature acquisition
Kumar et al. Adaptive cluster tendency visualization and anomaly detection for streaming data
CN111814910B (zh) 异常检测方法、装置、电子设备及存储介质
JP6950504B2 (ja) 異常候補抽出プログラム、異常候補抽出方法および異常候補抽出装置
EP4053757A1 (en) Degradation suppression program, degradation suppression method, and information processing device
CN115545103A (zh) 异常数据识别、标签识别方法和异常数据识别装置
JP2019086979A (ja) 情報処理装置、情報処理方法及びプログラム
CN112116028B (zh) 模型决策解释实现方法、装置及计算机设备
JP6950505B2 (ja) 判別プログラム、判別方法および判別装置
CN116188917A (zh) 缺陷数据生成模型训练方法、缺陷数据生成方法及装置
JP6954070B2 (ja) 判別プログラム、判別方法および判別装置
JP2020086796A (ja) 機械学習方法、機械学習プログラムおよび機械学習装置
CN112861874B (zh) 一种基于多滤波器去噪结果的专家场去噪方法及系统
CN115619245A (zh) 一种基于数据降维方法的画像构建和分类方法及系统
JP2017188063A (ja) 画像検索システム、画像検索方法、及び画像検索用プログラム
CN114120180A (zh) 一种时序提名的生成方法、装置、设备及介质
Cheng et al. A coupled ETAS-I2GMM point process with applications to seismic fault detection
Dornaika et al. Kernel sparse modeling for prototype selection
JP2019133462A (ja) 検出プログラム、検出方法および検出装置
JP6365064B2 (ja) 母集団生成プログラム、母集団生成方法および母集団生成装置
JP7379300B2 (ja) 推定装置、推定方法及びプログラム
CN117192373B (zh) 动力电池故障分析方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200911

TRDD Decision of grant or rejection written
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210825

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210831

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210913

R150 Certificate of patent or registration of utility model

Ref document number: 6954070

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150