JP2019105870A

JP2019105870A - 判別プログラム、判別方法および判別装置

Info

Publication number: JP2019105870A
Application number: JP2017236216A
Authority: JP
Inventors: 裕平梅田; Yuhei Umeda
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2017-12-08
Filing date: 2017-12-08
Publication date: 2019-06-27
Anticipated expiration: 2037-12-08
Also published as: JP6954070B2; US11423298B2; US20190180178A1

Abstract

【課題】点過程時系列データから事象を判別することを課題とする。【解決手段】判別装置は、時系列で発生した複数の事象のうち、事象判別閾値より大きい値を有する複数の特定事象を抽出する。判別装置は、複数の特定事象から、複数の特定事象の隣接発生間隔に関する特徴量を生成する。判別装置は、事象判別閾値を変化させることにより、事象判別閾値と特徴量を成分とする点から、複数の事象に対応した配列データを生成する。判別装置は、配列データを利用して、複数の事象の種別を判別する。【選択図】図２

Description

本発明は、判別プログラム、判別方法および判別装置に関する。

時系列データを自動で分類する深層学習（ディープラーニング（ＤＬ）・Deep Learning）技術が知られている。また、時系列データには、間欠的にイベントが発生する、いつイベントが発生するかわからない特徴がある点過程時系列データと呼ばれるものが存在する。例えば、点過程時系列データとしては、心拍データ、インターネットなどでの顧客等のアクセス、商品の需要データ、経済取引、地震などのデータがある。点過程時系列データも時系列データであることから、例えば心拍データで病気の有無や眠気度の分類、経済指標で経済状態の分類などのように、分類を行う要望がある。

近年では、点過程時系列データの解析に関する技術として、イベント間の間隔を発生時の値とし、その間隔値を補間して時系列データに変換した後で、周波数解析を行うことにより、発生間隔の特徴を抽出する技術が知られている。また、別の技術として、イベントの発生をポアソン過程等でモデル化し、イベント発生を確率的なものとして扱う技術が知られており、イベントの発生がカオス的であると仮定してカオス時系列の特徴量を求める技術なども知られている。

特開２０１６−９５４３４号公報特開２０１６−４２１２３号公報

ところで、上記技術は、分析対象の点過程時系列データにおいて、イベントの発生間隔が特定のモデルであることを前提に特徴量を算出して、点過程時系列データから該当する事象を判別する。しかしながら、点過程時系列データ内の各イベントの値に関する情報が欠落しており、点過程時系列データの特徴量としては正確性に欠けることとなり、結果として事象の判別結果の精度も劣化する。

一つの側面では、点過程時系列データから事象を判別することができる判別プログラム、判別方法および判別装置を提供することを目的とする。

第１の案では、判別プログラムは、時系列で発生した複数の事象のうち、事象判別閾値より大きい値を有する複数の特定事象を抽出する処理をコンピュータに実行させる。判別プログラムは、前記複数の特定事象から、前記複数の特定事象の隣接発生間隔に関する特徴量を生成する処理をコンピュータに実行させる。判別プログラムは、前記事象判別閾値を変化させることにより、前記事象判別閾値と前記特徴量を成分とする点から、前記複数の事象に対応した配列データを生成する処理をコンピュータに実行させる。判別プログラムは、前記配列データを利用して、前記複数の事象の種別を判別する処理をコンピュータに実行させる。

一実施形態によれば、点過程時系列データから事象を判別することができる。

図１は、実施例１にかかる判別装置の全体例を説明する図である。図２は、実施例１にかかる判別装置の機能構成を示す機能ブロック図である。図３は、点過程時系列データの例を示す図である。図４は、イベントの抽出例を説明する図である。図５は、間隔アトラクタの生成例を説明する図である。図６は、パーシステントホモロジについて説明するための図である。図７は、バーコードデータと生成される連続データとの関係について説明するための図である。図８は、配列表示の例を説明する図である。図９は、画像化による特徴量の例を説明する図である。図１０は、学習処理の流れを示すフローチャートである。図１１は、実験データのラベル付けを説明する図である。図１２は、一般的な技術である時系列補間を説明する図である。図１３は、実験結果を説明する図である。図１４は、実験結果の詳細を説明する図である。図１５は、ハードウェア構成例を説明する図である。

以下に、本願の開示する判別プログラム、判別方法および判別装置の実施例を図面に基づいて詳細に説明する。なお、この実施例によりこの発明が限定されるものではない。また、各実施例は、矛盾のない範囲内で適宜組み合わせることができる。

［全体構成］
図１は、実施例１にかかる判別装置の全体例を説明する図である。図１に示すように、実施例１にかかる判別装置１０は、学習データにデータ分析を行った後に、機械学習や深層学習（ディープラーニング（ＤＬ）・Deep Learning）などを用いた判別処理（学習処理）を実行して、学習データを事象ごとに正しく判別（分類）できるように、ニューラルネットワーク（ＮＮ：Neural Network）などを学習する。その後、学習結果を適用した学習モデルを用いることで、判別対象データの正確な事象（ラベル）の推定を実現する。

ここで、実施例１で想定する学習データは、例えば心拍データや経済取引のような間欠的にイベントが発生する点過程時系列データである。この学習データは、発生間隔がどのようなモデルに該当するのか、また、発生間隔がカオス（非線形なルール）に沿っているのかが事前に判明していてもよく、事前に判明していなくてもよい。

このような状態で、判別装置１０は、時系列で発生した複数のイベントのうち、判別閾値より大きい値を有する複数の特定イベントを抽出する。判別装置１０は、複数の特定イベントから、複数の特定イベントの隣接発生間隔に関する特徴量を生成する。その後、判別装置１０は、判別閾値を変化させることにより、判別閾値と特徴量を成分とする点から、複数のイベントに対応した配列データを生成する。そして、判別装置１０は、配列データを利用して、複数のイベントの種別を判別する。

つまり、判別装置１０は、イベント値の閾値を変化させ、各閾値以上の隣接発生間隔に関する特徴量を生成し、各閾値に関する特徴量を並べることで、イベント発生間隔とイベント値の大きさ（値）の両方を反映した特徴量を生成する。判別装置１０は、このようにして生成された特徴量を用いて、点過程時系列データの事象を判別することができる。なお、判別装置１０は、サーバ、パーソナルコンピュータ、タブレットなどのコンピュータ装置の一例である。また、判別装置１０と学習モデルによる推定処理を実行する装置とは、別々の装置で実現することもでき、一つの装置で実現することもできる。

［機能構成］
図２は、実施例１にかかる判別装置１０の機能構成を示す機能ブロック図である。図２に示すように、判別装置１０は、通信部１１と記憶部１２と制御部２０を有する。

通信部１１は、他の装置との通信を制御部する処理部であり、例えば通信インタフェースである。例えば、通信部１１は、管理者の端末から、処理開始指示を受信する。また、通信部１１は、管理者の端末等から、学習データ（入力データ）を受信して学習データＤＢ１３に格納する。

記憶部１２は、プログラムやデータを記憶する記憶装置の一例であり、例えばメモリやハードディスクなどである。この記憶部１２は、学習データＤＢ１３や学習結果ＤＢ１４を記憶する。

学習データＤＢ１３は、学習対象のデータを記憶するデータベースである。具体的には、学習データＤＢ１３は、点過程時系列のデータ（以下では、点過程時系列データと記載する場合がある）を記憶する。図３は、点過程時系列データの例を示す図である。図３に示すように、点過程時系列データは、間欠的にイベントが発生するデータであり、例えば心拍データや地震のデータなどである。なお、図３の横軸は、時間であり、縦軸は、イベントの大きさ（値）である。

学習結果ＤＢ１４は、学習結果を記憶するデータベースである。例えば、学習結果ＤＢ１４は、制御部２０による学習データの判別結果（分類結果）、機械学習やディープラーニングによって学習された各種パラメータを記憶する。

制御部２０は、判別装置１０全体の処理を司る処理部であり、例えばプロセッサなどである。この制御部２０は、特徴量算出部２１、特徴量生成部２２、学習部２３を有する。なお、特徴量算出部２１、特徴量生成部２２、学習部２３は、プロセッサなどが有する電子回路やプロセッサなどが実行するプロセスの一例である。また、特徴量算出部２１は、抽出部と第１生成部の一例であり、特徴量生成部２２は、第２生成部の一例であり、学習部２３は、判別部の一例である。

特徴量算出部２１は、イベント発生を抽出するための事象判別閾値である閾値ａを変化させ、各閾値ａについて閾値以上のイベントのみをイベント発生と判断して、イベントの発生間隔に関する特徴量を算出する処理部である。具体的には、特徴量算出部２１は、閾値ａを変化させた各閾値ａにおいて、特定の時間において、時系列で発生した複数のイベントのうち、閾値ａより大きい値を有する複数の特定イベントを抽出する。そして、特徴量算出部２１は、複数の特定イベントから、複数の特定イベントの発生間隔に関する特徴量を生成する。

例えば、特徴量算出部２１は、点過程時系列データを学習データＤＢ１３から読み出し、点過程時系列データ内で発生しているイベントのうち、最大のイベントの値（最大値）と最小のイベントの値（最小値）を特定する。そして、特徴量生成部２１は、最小値から最大値までを指定の数に等分する。その後、特徴量生成部２１は、閾値を最小値から最大値まで等間隔で変化させる過程で、各閾値について、閾値以上のイベントのみをイベント発生と判断して、イベントの発生間隔を抽出する。そして、特徴量算出部２１は、各閾値に対して抽出したイベントの発生間隔の特徴量を、確率分布、カオス時系列解析、パーシステントホモロジなどを用いて算出する。なお、イベントの大きさは、０から１に正規化することもできる。

ここで、イベントの抽出について説明する。図４は、イベントの抽出例を説明する図である。図４では、イベントｅ１からイベントｅｎまでのｎ個のイベントが発生している点過程時系列データを例にして説明する。まず、図４の左図に示すように、特徴量算出部２１は、閾値ａ以上であるイベントとして、「ｅ１、ｅ２、ｅ３、ｅ４・・・ｅｎ−１、ｅｎ」を特定する。続いて、特徴量算出部２１は、各イベントの発生間隔として「Δｔ１、Δｔ２、Δｔ３、・・・Δｔｎ」を特定する。例えば、特徴量算出部２１は、イベントｅ１とイベントｅ２の発生間隔を「Δｔ１」、イベントｅ２とイベントｅ３の発生間隔を「Δｔ２」などと特定する。そして、特徴量算出部２１は、イベント発生間隔「Δｔ１、Δｔ２、Δｔ３、・・・Δｔｎ」の特徴量を、閾値ａのときの特徴量として算出する。

次に、図４の右図に示すように、特徴量算出部２１は、前回の閾値ａから所定値増やした新たな閾値ａを算出し、新たな閾値ａ以上であるイベントとして、「ｅ１、ｅ３、ｅ４・・・ｅｎ−１、ｅｎ」を特定する。続いて、特徴量算出部２１は、各イベントの発生間隔として「Δｔ１＋Δｔ２、Δｔ３、・・・Δｔｎ」を特定する。そして、特徴量算出部２１は、イベント発生間隔「Δｔ１＋Δｔ２、Δｔ３、・・・Δｔｎ」の特徴量を、新たな閾値ａのときの特徴量として算出する。

ここで、特徴量の算出の一例として、図５から図７を用いて、パーシステントホモロジを用いた算出例について説明する。図５は、間隔アトラクタの生成例を説明する図である。図６は、パーシステントホモロジについて説明するための図である。図７は、バーコードデータと生成される連続データとの関係について説明するための図である。

具体的には、特徴量算出部２１は、イベントの発生間隔それぞれを複数の成分として有する間隔ベクトルを生成し、時系列において所定数の連続した間隔ベクトルから、特定の成分を１組の座標とする局所変動点を生成する。そして、特徴量算出部２１は、始点となる間隔ベクトルが異なる複数の局所変動点に対しパーシステントホモロジ変換を用いることにより、ベッチ系列を生成する。なお、特徴量算出部２１は、時間間隔など、特定の条件により区分された区間における「複数のイベント」を対象として処理することができる。

より詳細には、特徴量算出部２１は、閾値ａのときのイベントの発生間隔「Δｔ１、Δｔ２、Δｔ３、・・・Δｔｎ」を成分（要素）とする間隔ベクトルを生成する。続いて、特徴量算出部２１は、間隔ベクトルの各要素（成分）をスライドさせていき、複数の座標を生成する。例えば、図５に示すように、特徴量算出部２１は、間隔ベクトルの要素であるイベントの発生間隔（Δｔ１、Δｔ２、Δｔ３・・・Δｔｎ）に対して、「Δｔ１、Δｔ２、Δｔ３」を「ｘ，ｙ，ｚ」座標として抽出し、次に「Δｔ２、Δｔ３、Δｔ４」を「ｘ，ｙ，ｚ」座標として抽出する。なお、この例の場合、３次元の要素が取得できなくなるまでスライドさせることもでき、最後の発生間隔がｘ座標（このときｙ座標とｚ座標は０）となるまでスライドを繰り返すこともできる。

次に、特徴量算出部２１は、抽出した各座標（各間隔アトラクタ）から疑似アトラクタを生成し、パーシステントホモロジ変換を用いてベッチ系列へ変換する。なお、ここで生成されるアトラクタは、有限個の点集合であることから「疑似アトラクタ」と呼ぶこととする。なお、ベッチ系列の変換には、特開２０１７−９７６４３号公報の手法を用いることができる。

ここで、ベッチ系列の変換について簡単に説明する。まず、「ホモロジ」とは、対象の特徴をｍ（ｍ≧０）次元の穴の数によって表現する手法である。ここで言う「穴」とはホモロジ群の元のことであり、０次元の穴は連結成分であり、１次元の穴は穴（トンネル）であり、２次元の穴は空洞である。各次元の穴の数はベッチ数と呼ばれる。そして、「パーシステントホモロジ」とは、対象（ここでは、点の集合（Point Cloud））におけるｍ次元の穴の遷移を特徴付けるための手法であり、パーシステントホモロジによって点の配置に関する特徴を調べることができる。この手法においては、対象における各点が球状に徐々に膨らまされ、その過程において各穴が発生した時刻（発生時の球の半径で表される）と消滅した時刻（消滅時の球の半径で表される）とが特定される。

図６を用いて、パーシステントホモロジをより具体的に説明する。ルールとして、１つの球が接した場合には２つの球の中心が線分で結ばれ、３つの球が接した場合には３つの球の中心が線分で結ばれる。ここでは、連結成分及び穴だけを考える。図６（ａ）のケース（半径ｒ＝０）においては、連結成分のみが発生し、穴は発生していない。図６（ｂ）のケース（半径ｒ＝ｒ₁）においては、穴が発生しており、連結成分の一部が消滅している。図６（ｃ）のケース（半径ｒ＝ｒ₂）においては、さらに多くの穴が発生しており、連結成分は１つだけ持続している。図６（ｄ）のケース（半径ｒ＝ｒ₃）においては、連結成分の数は１のままであり、穴が１つ消滅している。なお、図６に示す各黒い点が各間隔アトラクタに該当する。

パーシステントホモロジの計算過程において、ホモロジ群の元（すなわち穴）の発生半径と消滅半径とが計算される。穴の発生半径と消滅半径とを使用することで、バーコードデータを生成することができる。バーコードデータは穴次元毎に生成されるので、複数の穴次元のバーコードデータを統合することで１塊のバーコードデータが生成できる。連続データは、パーシステントホモロジにおける球の半径（すなわち時間）とベッチ数との関係を示すデータである。

図７を用いて、バーコードデータと生成される連続データとの関係について説明する。上段のグラフはバーコードデータから生成されるグラフであり、横軸が半径を表す。下段のグラフは連続データ（ベッチ系列と記載する場合がある）から生成されるグラフであり、縦軸はベッチ数を表し、横軸は時間を表す。上で述べたように、ベッチ数は穴の数を表しており、例えば上段のグラフにおいて破線に対応する半径の時には存在している穴の数が１０であるので、下段のグラフにおいては破線に対応するベッチ数も１０である。ベッチ数は、ブロック毎に計数される。なお、下段のグラフは疑似的な時系列データのグラフであるので、横軸の値自体が意味を持つわけではない。

基本的には、同じバーコードデータからは同じ連続データが得られる。すなわち、元の疑似アトラクタが同じであれば同じ連続データが得られる。但し、異なるバーコードデータから同じ連続データが得られるケースが極めて稀に発生する。しかし、或るバーコードデータから生成される連続データと、別のバーコードデータから生成される連続データとの類似関係は、上で述べた稀なケースが発生しなければ、バーコードデータ間の類似関係と等価である。以上から、データ間の距離の定義は変わるものの、バーコードデータから生成される連続データ間の類似関係は、元の連続データ間の類似関係とほぼ等価である。

このようにして、特徴量算出部２１は、閾値を変化させたときに取得された各イベントの発生間隔から、間隔ベクトルの生成およびパーシステントホモロジ変換を行って、各閾値に対応する各ベッチ系列を生成する。この各ベッチ系列が各閾値に対応する各特徴量となる。そして、特徴量算出部２１は、閾値とベッチ系列とを対応付けて特徴量生成部２２に出力する。

図２に戻り、特徴量生成部２２は、特徴量算出部２１によって算出された各閾値に対応する各特徴量を用いて、点過程時系列データの特徴量を生成する処理部である。具体的には、特徴量生成部２２は、閾値を変化させることにより、閾値と特徴量を成分とする点から、複数のイベントに対応した配列データを生成する。例えば、特徴量生成部２２は、各閾値に対応する各特徴量（ベッチ系列）を並べた配列データを点過程時系列データの特徴量として生成する。

また、特徴量生成部２２は、各閾値ａに対して順にベッチ系列（特徴量ベクトル）を並べて、ひとつの特徴量とすることもできる。例えば、特徴量生成部２２は、特徴量ベクトルの次元が大きい場合などは、ひとつの特徴量ベクトルを閾値ａの変化に伴い縦軸に並べることで画像として扱うことも有用である。

図８は、配列表示の例を説明する図である。ここではイベントの大きさは、０から１に正規化して閾値ａを０から１まで等間隔に変化させた例を示す。特徴量生成部２２は、各閾値に対応する各ベッチ系列をベクトル表現とする。そして、図８に示すように、特徴量生成部２２は、縦軸を閾値ａとし、各閾値に対応したベクトル表現（ベッチ系列）を並べた配列データを生成する。すなわち、各セルにはベッチ数が格納される。その後、特徴量生成部２２は、生成した配列データを、点過程時系列データの特徴量として学習部２３に出力する。

さらに、特徴量生成部２２は、生成した配列データを画像として取り扱うこともできる。図９は、画像化による特徴量の例を説明する図である。特徴量生成部２２は、図８に示した配列データにおいて、各セルのベッチ数等により色や濃さを変えたり、値に変更したりすることで、図９に示した各特徴画像を生成することもできる。図９の各画像は、別々の点過程時系列データから生成された画像である。図９の（ａ）の特徴画像と図９の（ｂ）の特徴画像とを比較すると、白い領域の濃さに相違がある。また、図９の（ａ）の特徴画像と図９の（ｃ）の特徴画像とを比較すると、白い領域の形状に相違がある。従って、本実施の形態の方法により生成された特徴画像に基づき分類を実行すれば、図９の（ａ）、（ｂ）、（ｃ）の各画像を分類できる。

図２に戻り、学習部２３は、特徴量生成部２２によって生成された特徴量を用いて点過程時系列データを判別して、学習処理を実行する処理部である。学習部２３は、点過程時系列データを特徴量によって事象ごとに分類する。つまり、学習部２３は、各点過程時系列データを事象Ａ、各点過程時系列データを事象Ｂなどのように分類する。そして、学習部２３は、点過程時系列データの特徴量から事象が分類できるようにＤＬ等によって学習し、学習結果を学習結果ＤＢ１４に格納する。学習の結果は、点過程時系列データの分類結果（すなわちＤＬ学習の出力）を含み、入力から出力を計算する際のニューラルネットワークの各種パラメータが含まれていてもよい。また、本実施の形態の学習は教師有りの学習であってもよいし、教師無しの学習であってもよい。なお、ＤＬに限らず、一般的な機械学習であってもよい。

［処理の流れ］
次に、上述した学習処理について説明する。図１０は、学習処理の流れを示すフローチャートである。図１０に示す処理が各点過程時系列データについて実行される。図１０に示すように、特徴量算出部２１は、点過程時系列データを学習データＤＢ１３から読み出す（Ｓ１０１）。

続いて、特徴量算出部２１は、点過程時系列データ内のイベントの最大値を抽出し（Ｓ１０２）、０から最大値を指定数分に等分する（Ｓ１０３）。なお、特徴量算出部２１は、点過程時系列データ内のイベントの最小値から最大値を指定数分に等分することもできる。

そして、特徴量算出部２１は、閾値ａに初期値（例えば０）を設定し（Ｓ１０４）、閾値ａ以上のイベントのみを抽出する（Ｓ１０５）。続いて、特徴量算出部２１は、抽出したイベントのイベント間隔を用いて特徴量を算出する（Ｓ１０６）。

その後、閾値ａが最大値ではない場合（Ｓ１０７：Ｎｏ）、特徴量算出部２１は、閾値ａを所定数増加させて（Ｓ１０８）、Ｓ１０５以降を実行する。

また、閾値ａが最大値である場合（Ｓ１０７：Ｙｅｓ）、特徴量生成部２２は、特徴量算出部２１によって算出された各特徴量を用いて、点過程時系列データ全体の特徴量を生成する（Ｓ１０９）。

その後、学習部２３は、特徴量生成部２２によって生成された点過程時系列データ全体の特徴量を用いて、点過程時系列データを判別し、特徴量と事象との関係性を学習する（Ｓ１１０）。

そして、未処理の点過程時系列データが存在する場合（Ｓ１１１：Ｎｏ）、Ｓ１０１以降が繰り返され、全点過程時系列データについて処理が終了した場合（Ｓ１１１：Ｙｅｓ）、学習処理が終了する。

［効果］
上述したように、判別装置１０は、各閾値ａの値に対して特徴量を生成することができる。あくまでイベント間隔を用いた特徴量のため、イベント間隔の情報は失わず、閾値ａの変化に伴い、イベントの小さな情報を削るため、閾値ａの変化に伴う特徴量の変化はイベントの値とイベント間隔の関係を表現する。つまり、判別装置１０は、イベント間隔をもとにしてイベント間隔情報を保存しつつ、イベントの値とイベント間隔の関係を表現することができる。この結果、判別装置１０は、点過程時系列データの解析を、イベントの値もイベント間隔も両方を含めた形で実行できるので、点過程時系列データから事象を正確に判別することができる。

ここで、実施例１による手法と従来手法との比較を行った実験結果を説明する。まず、実験の条件を説明する。イベント発生間隔は、正規分布で発生と一様分布で発生することとし、ラベルは、時間軸で正規分布で乱数発生となっているものをラベル１とサイン関数に沿って発生しているものをラベル２とし、ラベル付けはそれらの組み合わせとする。図１１は、実験データのラベル付けを説明する図である。図１１に示すように、実験データでは、イベント値が正規分布に沿っており、イベントの発生間隔が正規分布に沿っているデータにラベル１を付し、イベント値が正規分布に沿っており、イベントの発生間隔が一様分布に沿っているデータにラベル２を付し、イベント値がサイン関数に沿っており、イベントの発生間隔が正規分布に沿っているデータにラベル３を付し、イベント値がサイン関数に沿っており、イベントの発生間隔が一様分布に沿っているデータにラベル４を付すこととする。

次に、比較実験の手法を説明する。ここでは、実施例１による手法に加えて、イベント間隔の統計量を用いる一般手法と、時系列補間の手法を採用する。図１２は、一般的な技術である時系列補間を説明する図である。図１２に示すように、時系列補間は、点過程を一定間隔の時系列として補間する手法であり、イベントの発生間隔の情報が失われ、実際の値との誤差も大きい。

図１３は、実験結果を説明する図である。ここでは、各ラベルの点過程時系列データを入力して学習し、学習後に、例えば推定対象のラベル１の点過程時系列データを入力したときにラベル１と推定できたときを正答と判定し、他のラベルが推定されたときを誤答と判定する。図１３に示すように、実施例１による手法では、１００％の高精度の正答率であったが、他の手法は低精度の正答率に留まった。また、各ラベルの正答率をみると、一般手法では、イベントの発生間隔の違いは判別できたが、イベントの値は判別できない。また、時系列補間では、イベントの値の違いは判別できたが、イベントの発生間隔の違いは判別できない。

図１４は、実験結果の詳細を説明する図である。図１４では、正解ラベルと推定ラベルとのマトリックス図を示す。例えば、ラベル１の点過程時系列データを、ラベル１と推定した割合、ラベル２と推定した割合、ラベル３と推定した割合、ラベル４と推定した割合を示す。

図１４に示すように、一般手法では、イベントの発生間隔は推定できているが、イベントの値についてはランダムに推定されたことがわかる。また、時系列補間では、イベントの値は推定できているが、イベントの発生間隔についてはランダムに推定されたことがわかる。これに対して、実施例１による手法では、イベントの発生間隔とイベントの値の両方について正確に推定できた。

さて、これまで本発明の実施例について説明したが、本発明は上述した実施例以外にも、種々の異なる形態にて実施されてよいものである。

［対象］
例えば、間隔ベクトルの生成処理や判別処理などは、時間間隔など、特定の条件により区分された区間における「複数のイベント」を対象として処理することができる。

［学習手法］
実施例１の学習は、ＤＬに限らずに他の機械学習を採用することができる。また、間隔アトラクタの次元数も任意に設定することができる。なお、学習後に推定対象のデータのラベル推定を行う場合、学習時と同様の処理を行って学習モデルに入力する。

［特徴量の算出］
実施例１では、パーシステントホモロジ変換によって特徴量を算出する例を説明したが、これに限定されるものではない。例えば、確率分布、カオス時系列解析などを用いて、特徴量を算出することができる。特に、イベント発生間隔などが確率分布やカオス理論に沿っている場合には有効である。また、点過程時系列データ全体の特徴量についても、必ずしも画像にする必要はなく、配列で特徴量を判別することもできる。

なお、閾値ａの変化方法は、一定間隔に限らず、任意に設定変更することができる。また、パーシステントホモロジ変換に限らず、時間が異なる複数の点やベクトルなどから特徴量を生成する手法を採用することができる。

［ハードウェア］
図１５は、ハードウェア構成例を説明する図である。図１５に示すように、判別装置１０は、通信インタフェース１０ａ、ＨＤＤ（Hard Disk Drive）１０ｂ、メモリ１０ｃ、プロセッサ１０ｄを有する。また、図１５に示した各部は、バス等で相互に接続される。

通信インタフェース１０ａは、ネットワークインタフェースカードなどであり、他のサーバとの通信を行う。ＨＤＤ１０ｂは、図２に示した機能を動作させるプログラムやＤＢを記憶する。

プロセッサ１０ｄは、図２に示した各処理部と同様の処理を実行するプログラムをＨＤＤ１０ｂ等から読み出してメモリ１０ｃに展開することで、図２等で説明した各機能を実行するプロセスを動作させる。すなわち、このプロセスは、判別装置１０が有する各処理部と同様の機能を実行する。具体的には、プロセッサ１０ｄは、特徴量算出部２１、特徴量生成部２２、学習部２３等と同様の機能を有するプログラムをＨＤＤ１０ｂ等から読み出す。そして、プロセッサ１０ｄは、特徴量算出部２１、特徴量生成部２２、学習部２３等と同様の処理を実行するプロセスを実行する。

このように判別装置１０は、プログラムを読み出して実行することで判別方法を実行する情報処理装置として動作する。また、判別装置１０は、媒体読取装置によって記録媒体から上記プログラムを読み出し、読み出された上記プログラムを実行することで上記した実施例と同様の機能を実現することもできる。なお、この他の実施例でいうプログラムは、判別装置１０によって実行されることに限定されるものではない。例えば、他のコンピュータまたはサーバがプログラムを実行する場合や、これらが協働してプログラムを実行するような場合にも、本発明を同様に適用することができる。

［システム］
上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。

また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散や統合の具体的形態は図示のものに限られない。つまり、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。例えば、アイテムを表示する処理部と、選好を推定する処理部とを別々の筐体で実現することもできる。さらに、各装置にて行なわれる各処理機能は、その全部または任意の一部が、ＣＰＵおよび当該ＣＰＵにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。

１０判別装置
１１通信部
１２記憶部
１３学習データＤＢ
１４学習結果ＤＢ
２０制御部
２１特徴量算出部
２２特徴量生成部
２３学習部

Claims

時系列で発生した複数の事象のうち、事象判別閾値より大きい値を有する複数の特定事象を抽出し、
前記複数の特定事象から、前記複数の特定事象の隣接発生間隔に関する特徴量を生成し、
前記事象判別閾値を変化させることにより、前記事象判別閾値と前記特徴量を成分とする点から、前記複数の事象に対応した配列データを生成し、
前記配列データを利用して、前記複数の事象の種別を判別する、
処理をコンピュータに実行させる判別プログラム。
前記複数の特定事象間の隣接発生間隔それぞれを複数の成分として有する間隔ベクトルを生成し、
前記時系列において所定数の連続した前記間隔ベクトルから、特定の成分を１組の座標とする局所変動点を生成し、
始点となる前記間隔ベクトルが異なる複数の局所変動点に対しパーシステントホモロジ変換を用いることにより、ベッチ系列を生成し、
前記事象判別閾値と前記ベッチ系列を成分とする点から、前記複数の事象に対応した画像データを生成する、処理をコンピュータに実行させる請求項１に記載の判別プログラム。
前記配列データから画像データを生成し、画像データを利用して、前記複数の事象の種別を判別する、処理をコンピュータに実行させる請求項１に記載の判別プログラム。
前記画像データの画素値は、前記特徴量に関連する値とは異なる値である、請求項３に記載の判別プログラム。
前記複数の特定事象の隣接発生間隔それぞれから、時間が異なる複数のベクトルを生成し、生成された前記複数のベクトルを用いて、前記複数の特定事象の隣接発生間隔に関する前記特徴量を生成する、処理をコンピュータに実行させる請求項１に記載の判別プログラム。
時系列で発生した複数の事象のうち、事象判別閾値より大きい値を有する複数の特定事象を抽出し、
前記複数の特定事象から、前記複数の特定事象の隣接発生間隔に関する特徴量を生成し、
前記事象判別閾値を変化させることにより、前記事象判別閾値と前記特徴量を成分とする点から、前記複数の事象に対応した配列データを生成し、
前記配列データを利用して、前記複数の事象の種別を判別する、
処理をコンピュータが実行する判別方法。
時系列で発生した複数の事象のうち、事象判別閾値より大きい値を有する複数の特定事象を抽出する抽出部と、
前記複数の特定事象から、前記複数の特定事象の隣接発生間隔に関する特徴量を生成する第１生成部と、
前記事象判別閾値を変化させることにより、前記事象判別閾値と前記特徴量を成分とする点から、前記複数の事象に対応した配列データを生成する第２生成部と、
前記配列データを利用して、前記複数の事象の種別を判別する判別部と
を有する判別装置。