JP2021110987A

JP2021110987A - 情報処理装置、情報処理方法及びコンピュータプログラム

Info

Publication number: JP2021110987A
Application number: JP2020000550A
Authority: JP
Inventors: 亜梨花福島; Arika Fukushima; 明淑高; Myungsook Ko
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 2020-01-06
Filing date: 2020-01-06
Publication date: 2021-08-02
Anticipated expiration: 2040-01-06
Also published as: US11874854B2; US20210209132A1; JP7244443B2

Abstract

【課題】観測対象の状態を推定する情報処理装置、情報処理方法及びコンピュータプログラムを提供する。【解決手段】本実施形態に係る情報処理装置は、観測対象から得られた時系列データに含まれる第１時刻のデータに基づいて、前記第１時刻の前記観測対象の状態を推定する推定部を備える。【選択図】図１

Description

本実施形態は、情報処理装置、情報処理方法及びコンピュータプログラムに関する。

従来、観測対象の状態を推定する解析システムがいくつか開発されている。例えば、観測対象にセンサを設置して、センサから時系列データを取得する。時系列データに正解又は不正解の教師ラベルを割り当てた教師データを作成し、教師データに基づいて、観測対象の状態を推定する。しかしながら、この方法では時系列データ全体の状態に対する推定しか行うことができず、一部の状態に対する推定を行うことができなかった。

特許第６１２９０８２号公報

本発明の実施形態は、観測対象の状態を推定する情報処理装置、情報処理方法及びコンピュータプログラムを提供する。

本実施形態に係る情報処理装置は、観測対象から得られた時系列データに含まれる第１時刻のデータに基づいて、前記第１時刻の前記観測対象の状態を推定する推定部を備える。

第１実施形態に係る情報処理装置のブロック図。正しい動作の時系列データと、正しくない動作の時系列データとの例を示す図。時系列データ取得部により取得された時系列データの一例を示す図。時系列データＤＢに記憶された時系列データ例を示す図。モデル木の構造を模式的に示す図。分岐条件テーブルとモデルパラメータテーブルとを示す図。モデル木の具体例を示す図。通知部が送信する出力データの例を示す図。第１実施形態に係る学習モード時における動作の全体フローを示す図。ラベル設定部の詳細フローを示す図。モデル生成部の詳細な動作フローを示す図。分岐基準量の算出方法の詳細フローを示す図。識別率の算出に用いる混合行列を示す図。第１実施形態の評価モードにおける動作の全体のフローを示す図。時系列データ取得部の詳細フローを示す図。動作判定部の詳細フローを示す図。複数の時刻を含む時系列データについて判定した結果の例を示す図。第１実施形態に係る情報処理装置のハードウェア構成を示す図。ＡＧＶが移動することにより辿ったルート（動線）のイメージの図。第２実施形態に係る情報処理システムである警告システムのブロック図。第３実施形態に係る情報処理システムである分類システムのブロック図。電力需要予測における決定木の一例を示す図。第５実施形態に係る動作の一例のフローを示す図。図２３に続く図。モデル木を更新する例を示す図。

以下、図面を参照しながら、本発明の実施形態について説明する。

＜第１実施形態＞
図１は、本実施形態に係る情報処理装置のブロック図である。図１の情報処理装置１０１は、観測対象から得られた時系列データを解析し、任意の時刻における観測対象の状態を推定する装置である。観測対象の状態の例として、人間又は移動体等の動き（動作）、電力需要量等の需要量の動き（変化）等がある。本実施形態では、観測対象（人間又は移動体等）の動作における任意の時刻の状態を推定する場合を想定する。状態を推定する例として、任意の時刻における状態のクラスを判定する。クラスの例として、任意の時刻における動作の軌跡が正しい第１クラス（正解のクラス）、任意の時刻における動作の軌跡が誤っている第２クラス（不正解のクラス）がある。本実施形態では２つのクラスを扱うが、クラスの数は３以上でもよい。状態のクラスを判定することは、状態を推定する一例にすぎない。状態を推定することは、状態のクラスを判定することに限られない。例えば、状態を推定することは、状態の複数の候補の中から、該当する候補を選択することでもかまわない。ニューラルネットワーク等のモデルを用いて状態を予測することでもかまわない。

本実施形態では、観測対象から得られた時系列データ全体に対するクラスを判定するのではなく、時系列データの任意の時刻に対してクラスを判定する。ある動作を行っている観測対象から取得される時系列データ全体に対して誤っていると判断される場合であっても、正しい動作の部分と誤った動作の部分とが混在している場合がある。すなわち、全体として誤っていると判断される動作の時系列データであっても、時系列データの一部に対応する動作は正しい場合もある。例えば、リハビリテーション（リハビリ）や技能育成のための動作を行う場合を考える。リハビリの動作には、正しいとされる軌跡（手本となる軌跡）があることが多い。リハビリでは正しい動作を繰り返し実施することで機能回復を図る。指導者がいない状況では、リハビリ実施者は誤った動作を行うことがあるが、全体としては誤った動作であっても部分的に見た場合には、正しい動作が行われている場合もある。本実施形態では評価対象となる動作の時系列データに対して時刻毎に正しい動作か（正しい状態か）、又は誤っている動作か（誤った状態か）を高精度に判定することを可能にする。

図２は、正しい動作の時系列データと、正しくない動作の時系列データとの例を示す。より詳細には、図２（Ａ）は情報処理装置１０１のユーザ（観測対象の観察者等）によって正しいと判断された動作の時系列データである。図２（Ｂ）は情報処理装置１０１のユーザによって正しくないと判断された動作の時系列データである。図２（Ｂ）の時系列データは全体として正しくない波形を有しているが、正しい動作の時系列データと同じ又は近似した形をしている波形も含まれている。例えば、動作開始からＰ秒目〜Ｑ秒目、Ｒ秒目〜Ｓ秒目では、図２（Ｂ）の波形は、図２（Ａ）の波形と異なっている。一方、動作開始からＰ秒目までと、Ｑ秒目〜Ｒ秒目までと、Ｓ秒目以降では、図２（Ｂ）の波形は、図２（Ａ）の波形は同じである。Ｐ秒目、Ｑ秒目、Ｒ秒目、Ｓ秒目は、正しい動作の波形と誤の動作の波形との境界である。

本実施形態では、学習モードとして、正解又は不正解のラベルを教師ラベルとして割り当てられた複数の時系列データを用いて、境界となる時刻の決定と、時刻で区切られた時間区間ごとの分類モデルの生成とを行う。分類モデルは、動作の正誤を判定するためのモデルである。

評価モードとして、時間区間毎の分類モデルを用いて、評価対象となる時系列データについて時刻ごとに正誤判定を行う。より詳細には、閾値以上の識別性能の分類モデルが得られた時間区間については分類モデルを用いた正誤判定を行い、識別性能が閾値未満の分類モデルが得られた時間区間については分類モデルを用いた正誤判定を行わない。例えば、Ｑ秒目〜Ｒ秒目では正しくない（誤った）動作のデータが存在しない又は少ないため、閾値以上の識別性能の分類モデルが得られないとする。このように識別性能の低い時間区間に属する時刻については、正誤判定を実施しない。これにより、高精度な判定を行うとともに、時系列データの全点を正誤判定することを回避し、計算回数を削減する。以下、本実施形態について詳細に説明する。

情報処理装置１０１は、時系列データ取得部（データ取得部）１１、時系列データＤＢ＿１２、ラベル設定部１３、モデル生成部１４、動作判定部（推定部）１５、モデルＤＢ＿１６及び通知部１７を備えている。

時系列データ取得部１１は、データ取得部として、Ｍ（Ｍは１以上の整数）個のセンサ部１、２、・・・、Ｍにより検出された特徴量の時系列である時系列データを取得する。センサ部１〜Ｍは、一例として観測対象に設置されたセンサを含む。観測対象は人間でもよいし、無人搬送車(Automatic Guided Vehicle: AGV)等の移動体でもよいし、スマートメータ等の装置でもよい。

センサの例は、速度センサ、加速度センサ、位置センサ、温度センサ、磁気センサ、電力センサ、電圧センサ、電流センサを含む。センサは他の種類のセンサでもよい。特徴量は、センサにより検出された値でもよい。また、特徴量は、センサにより検出された値の統計値（平均値又は分散など）でもよい。また、特徴量は、複数のセンサにより検出された値の演算値でもよい。例えば、電流センサにより検出された電流値と、電圧センサにより検出された電圧値との積でもよい。この場合、センサ部は、ＣＰＵ等の演算装置でもよい。

時系列データＤＢ＿１２は、時系列データ取得部１１により取得された時系列データを格納する。時系列データＤＢ＿１２は、時系列データ取得部１１により取得された時系列データを、時刻に関連付けて格納する。

図３は時系列データ取得部１１により取得された時系列データの一例を示す。時間tにおける時系列データが示されている。他の時刻についても同様の形式で時系列データが取得される。この例では、Ｘ軸、Ｙ軸、Ｚ軸毎の加速度、Ｘ軸、Ｙ軸、Ｚ軸毎の角速度、Ｘ軸、Ｙ軸、Ｚ軸毎の地磁気の強度などが、特徴量として取得されている。

入力部１８は、センサ部１〜Ｍにより取得された時系列データ、あるいは、時系列データＤＢ＿１２に格納された時系列データに対して、観測対象の動作に関するクラスの情報を教師ラベルとして入力する。

例えば、情報処理装置１０１のユーザは、観測対象の動作を観察し、観測対象の動作が完了した後、観測対象が正しい動作を行ったかを判断する。観測対象が正しい動作を行ったと判断すれば、動作が正しいクラスを示す教師ラベル（正解の教師ラベル）を入力する。観測対象が正しくない動作を行っていると判断すれば、“動作が誤っているクラスを示す教師ラベル（不正解の教師ラベル）を入力する。正しい動作は、正常な動作又は想定通りの動作とも言える。正しくない動作は、異常な動作又は想定外の動作とも言える。

例えば、観測対象がリハビリテーションを行い、リハビリテーションの動作が正しければ（指導者の指示したとおりの動作を観測対象が行った場合は）、正解の教師ラベルを入力し、それ以外の場合は、負の教師ラベルを入力する。別の例として、ＡＧＶが所定の経路を走行した場合は、正解の教師ラベルを入力し、それ以外の場合は、負の教師ラベルを入力する。

ラベル設定部１３は、入力部１８から入力された教師ラベルを、時系列データＤＢ＿１２に、ユーザの指定した時系列データに対応付けて格納する。時系列データ取得部１１が、観測対象の動作を識別する識別情報（動作ＩＤ）を生成し、時系列データに対応付けて、時系列データＤＢ＿１２に格納してもよい。なお、動作ＩＤは、ユーザが入力部１８から指定してもよい。

図４は、時系列データＤＢ＿１２に記憶された時系列データ例を示す。各時刻に取得されたデータに動作ＩＤ、時刻、教師ラベル（正／誤）が対応づいている。“正”は正解の教師ラベル、“誤”は不正解の教師ラベルに対応する。

複数の時刻のデータを含む時系列データの各データには、同じ動作ＩＤと、同じ教師ラベルとが割り当てられている。

時系列データに含まれる個々のデータは時刻順に並んでいる。例えば、動作ＩＤが１の複数のデータがＮ個存在し、これらＮ個データの集合が、同じ動作を表す時系列データに対応する。１つの行（１つの時刻のデータ）は１つのレコードに対応する。動作ＩＤ２についても同様にＮ個のデータが存在し、動作ＩＤ３以降についても同様である。

動作ＩＤ＝１，２，３，・・の各時系列データの時刻は相対時刻であり、この例では、いずれも時刻１から開始している。但し、各時系列データの時刻は、絶対時刻で表してもよい。

また、図４の例では、各時系列データに含まれるレコード数（データ数）は同じであるが、動作ごとに時系列データに含まれるレコード数（データ数）が異なってもよい。

また、図４の例では、動作ごとにレコード（データ）のサンプリング間隔は同じであるが、サンプリング間隔が異なってもよい。

本実施形態では、教師ラベルをラベル設定部１３が入力部１８から取得し、取得した教師ラベルを割り当てているが、他の装置で時系列データの取得と教師ラベルの設定等を行ってもよい。この場合、情報処理装置１０１は、他の装置から教師ラベル等が割り当てられた時系列データを取得して、取得した時系列データを時系列データＤＢ＿１２に格納してもよい。

モデル生成部１４は、時系列データＤＢ＿１２に格納されている教師ラベル付きの時系列データを学習データとして用いて、モデル木を生成する。モデル木は、評価対象となる時系列データにおいて評価対象となるデータのクラス（正解／不正解）を評価するために用いる分類モデルを、評価対象となるデータの時刻に基づいて決定するためのものである。モデル木は、モデル木は決定木の一種であり、葉ノードに分類モデルが対応付けられた決定木である。分類モデルは、評価対象となるデータのクラス（正解／不正解）を判定するためのものである。分類データは、評価対象となるデータと、動作の正誤を判定するための値（クラスを判定するための値）とが対応づいたモデルである。モデル生成部１４は、生成したモデル木を、モデルＤＢ＿１６に格納する。

図５は、モデル木の構造を模式的に示す。モデル木は、複数のノードと、ノード間の関係を示すアークとを備える。ノードには、内部ノードと、末端ノード（葉ノード）とがある。内部ノードは、枝分かれした先に他のノードを持つノード（根ノードと途中ノード）である。葉ノードは、それ以上枝分かれしないノードである。内部ノードには、分岐条件が割り当てられる。葉ノードには、分類モデル（識別器）が対応づけられる。あるノードから枝分かれした先のノードを、当該ノードの子ノードと呼ぶ。また当該ノードを子ノードの親ノードと呼ぶ。

分岐条件は、時刻に関する条件である。具体的には、分岐条件は、時系列データの波形を複数の時間区間に区切る時刻を基にした不等式で定義される。一例として、動作の開始時刻からの経過時間を用いて、分岐条件は定義される。例えば、「経過時間<12秒」（経過時間は１２秒未満）、「経過時間<43秒」などが分岐条件に該当する。

各葉ノードに分類モデルｆ_ｉ（ｉ＝１，…，Ｓ）（Ｓは葉ノードの数)が対応づけられている。分類モデルは、時系列データ中のある1つの時刻のデータ（特徴量のセットｘ^（ｔ）（ｔ＝１，…，Ｔ））の正誤判定を行うモデルである。このようなモデルは、一般的な機械学習の手法であるロジスティック回帰、ナイーブベイズ分類器、ニューラルネットワーク、深層学習、ランダムフォレスト、又はブースティングなどを利用して生成できる。

各葉ノードにおける分類モデルｆ_ｉは、一例として、同一の機械学習の手法を用いて生成される。分類モデルの学習方法として、LASSO(Least absolute shrinkage and selection operator)に代表されるようなスパースモデリング手法やステップワイズ法などを用いる場合、変数選択が行われる。これにより、分類モデルに利用される変数（特徴量）が、モデル毎に異なる可能性もある。分類モデルは、一般的に以下の式で表現できる。

ｆｉは、分類モデルを表す関数である。

ｘ^（ｔ）（ｔ＝１，…，Ｔ）は、時刻ｔにおける各センサ部の値（特徴量）を含むベクトルである。つまり、ｘ^（ｔ）＝（ｘ_１ ^（ｔ），ｘ_２ ^（ｔ），…，ｘ_ｌ ^（ｔ），…，ｘ_Ｌ ^（ｔ））である。ｘ_ｌ ^（ｔ）は、時刻ｔにおけるあるセンサ部（ｌ番目のセンサ部）の特徴量を示す。Ｌは特徴量の数である。

図６（Ａ）及び図６（Ｂ）は、モデル生成部１４により生成されたモデル木をテーブル形式で表す。図６（Ａ）は分岐条件テーブルを示す。図６（Ｂ）はモデルパラメータテーブルを示す。分岐条件テーブルは、モデル木の構造を表す。モデルパラメータテーブルは、モデル木の葉ノードに対応づけられた分類モデルのパラメータ及び分類モデルの識別性能を格納する。分類モデルの関数の形は別途、モデルＤＢ＿１６に格納されているとする。

図６（Ａ）の分岐条件テーブルは、以下の項目を含む。

ノードＩＤ：モデル木のノードを識別するためのＩＤ

ノードタイプ：ノードＩＤが示すノードが、葉ノードか内部ノードかを示す値。但し、内部ノードのうち根ノードについては、根ノードを示す値を持つ。

閾値：ノードタイプが内部ノードを示す場合に、分岐条件に閾値として用いられる時刻。ノードタイプが葉ノードを示す場合は“ＮＡ”である。

モデルＩＤ：ノードタイプが葉ノードを示す場合、該当する葉ノードに対応付けられたモデルのＩＤ。ノードタイプが内部ノードを示す場合は“ＮＡ”である。

左側のノードＩＤ：ノードタイプが内部ノードを示す場合に、該当の内部ノードの分岐条件がｔｒｕｅであった場合に進む次のノードのノードＩＤ。ノードタイプが葉ノードである場合は“ＮＡ”である。

右側のノードＩＤ：ノードタイプが内部ノードを示す場合、該当の内部ノードの分岐条件がｆａｌｓｅであった場合に進む次のノードのノードＩＤ。ノードタイプが葉ノードを示す場合は、“ＮＡ”である。

図６（Ｂ）のモデルパラメータテーブルは、以下の項目を含む。

モデルＩＤ：葉ノードに対応づけられた分類モデルを識別するＩＤ。

モデルパラメータ１〜Ｆ：分類モデルのＦ個のモデルパラメータの値。モデル生成部１４で変数選択が実施された場合、選択されなかった変数（削除された変数）は０の値を持つ。

識別性能：分類モデルの識別性能が高いか低いか（分類モデルを用いた正誤判定を行うか否か）を示す。識別性能が高いとは、分類モデルの識別性能を評価する指標が閾値以上であることを意味する。本実施形態では、識別性能が高い場合、分類モデルを用いた正誤判定を行う。識別性能が低いとは、分類モデルの識別性能を評価する指標が閾値未満であることを意味する。本実施形態では、識別性能が低い場合、分類モデルを用いた正誤判定を行わない。この場合、例えば、“正しい”（正解）又は“未判定”の判定結果を出力する（詳細は後述する）。

モデル生成部１４がモデル木を生成する動作の詳細は後述する。

動作判定部（決定部）１５は、時系列データ取得部１１により得られた評価対象となる時系列データに対して、モデルＤＢ＿１６に格納されたモデル木と、時刻ｐ（ｐ＝１，…，Ｔ）が属する時間区間を特定する情報とに基づき、時刻ｐ（ｐ＝１，…，Ｔ）における観測対象の状態を推定する。すなわち、時刻ｐにおける観測対象の状態（動作等）の正誤判定を行う。図６を用いて、動作判定部１５の動作の概要を説明する。

図７は、図２に示した時刻Ｐ、Ｑ、Ｒ、Ｓが境界時刻として用いられた場合に作成されたモデル木の例を示す。
Ｐ秒目未満に対応する葉ノードに、識別率の低い分類モデルｆ_１が対応付けられている。
Ｐ秒目以上Ｑ秒目未満に対応する葉ノードには、識別率の高い分類モデルｆ_２が対応付けられている。
Ｑ秒目以上Ｒ秒目未満に対応する葉ノードに、識別率の低い分類モデルｆ_３が対応付けられている。
Ｒ秒目以上Ｓ秒目未満に対応する葉ノードに、識別率の高い分類モデルｆ_４が対応付けられている。
Ｓ秒目以上に対応する葉ノードに、識別率の低い分類モデルｆ_５が対応付けられている。

このモデル木の場合、動作判定部１５は、評価対象となる時系列データのＰ秒目より前の時間区間では正誤判定を行わない。つまり、分類モデルｆ_１を用いた判定を行わない。この場合、例えば、“正しい”（正解）又は“未判定”の判定結果を出力する。
評価対象となる時系列データのＰ秒目以上Ｑ秒目未満の時間区間では、分類モデルｆ_２を用いた判定を行う。この場合、分類モデルｆ_２に基づく正誤判定の結果を出力する。
評価対象となる時系列データのＱ秒目以上Ｒ秒目未満の時間区間では正誤判定を行わない。つまり、分類モデルｆ_３を用いた判定を行わない。この場合、例えば、“正しい”（正解）又は“未判定”の判定結果を出力する。
評価対象となる時系列データのＲ秒目以上Ｓ秒目未満の時間区間では、分類モデルｆ_４を用いた判定を行う。この場合、分類モデルｆ_４に基づく正誤判定の結果を出力する。
評価対象となる時系列データのＳ秒目以上の時間区間では正誤判定を行わない。つまり、分類モデルｆ_５を用いた判定を行わない。この場合、例えば、“正しい”（正解）又は“未判定”の判定結果を出力する。

通知部１７は、動作判定部１５において判定された時刻ｐにおける動作の正誤判定の結果を含む出力データを、予め指定された装置に送信する。予め指定された装置は、一例として、観測対象自体（例えばＡＧＶ、ドローン等の移動体など）、観測対象を管理する管理装置、観測対象が保持する装置（例えば人間が保持する装置）がある。あるいは、予め指定された装置は、ユーザの保持する端末、又はサーバなどでもよい。

図８は、通知部１７が送信する出力データの例を示す。図８の出力データは、動作ＩＤ、時刻、及び正誤判定結果を含む。

図９は、本実施形態に係る学習モード時における動作の全体フローを示す。時系列データＤＢ＿１２には予め動作ＩＤが割り当てられた時系列データが格納されているとする。

ステップＳ１０１において、ラベル設定部１３がユーザより入力された教師ラベル（正解又は不正解の２値のラベル）を、入力部１８を介して取得する。ラベル設定部１３は、取得した教師ラベルを、対応する時系列データに対応づける。教師ラベル及び動作ＩＤを割り当てられた時系列データは、学習データに対応する。学習データの集合は学習テーブル（前述した図４参照）に対応する。

ステップＳ１０２において、モデル生成部１４が、時系列データＤＢ＿１２より、学習データ（Ｍ個のセンサ部が存在する場合Ｍ個の学習データ）を取得する。モデル生成部１４は、取得した学習データを用いて、モデル木を生成する。モデル生成部１４は、生成したモデル木を、モデルＤＢ＿１６に格納する。

図１０は、図９のステップＳ１０１で行うラベル設定部１３の詳細フローを示す。

ステップＳ９１において、ラベル設定部１３では、教師ラベルを付けたい動作の動作ＩＤを特定する。動作ＩＤはユーザが指定してもよいし、まだ教師ラベルが付けられていない時系列データを任意に特定してもよい。

ステップＳ９２において、特定した動作ＩＤに対応する時系列データを、時系列データＤＢ＿１２から取得する。

ステップＳ９３において、取得した時系列データを表示部に表示する。

ステップＳ９４において、ユーザが、正解（正しい）または不正解（誤り）の教師ラベルを決定し、入力部１８を用いて入力する。ユーザは、動作ＩＤの時系列データがセンサ部により検出されたときの観測対象の動作を観察しており、観察に基づき、教師ラベルを決定する。あるいは、時系列データの波形を見て、教師ラベルを決定してもよい。

ステップＳ９５において、ラベル設定部１３は、入力部１８から入力された教師ラベルを、動作ＩＤに関する時系列データに対応づける。

ラベル設定部１３では、時系列データに対する前処理を実施してもよい。例えば、Ｘ軸、Ｙ軸、Ｚ軸の３つの値をユークリッド距離などに変換してもよい。あるいは、Ｘ軸、Ｙ軸、Ｚ軸の３つの値に対して主成分変換を行ってもよい。または各軸の値の移動平均を計算してもよい。その他、一般的な時系列データの前処理手法を適用可能である。

図１１は、図９のステップＳ１０２で行うモデル生成部１４の詳細な動作フローを示す。図１１のフローでは、時系列データＤＢ＿１２内に学習データが予め全部揃っているとする。なお、生成したモデル木を更新する際は、フルスクラッチで再学習してもよい。以下の説明において、分岐条件を生成する対象のノードを“生成ノード”と呼ぶ。

ステップＳ１１１において、時系列データＤＢ＿１２から、複数の動作分の時系列データ（すなわち複数の動作のそれぞれについて複数の時刻の学習データ（レコード））を学習テーブルとして取得する。学習テーブルの時刻の列に含まれるすべての時刻を特定する。重複する時刻があれば、重複を排除する。各動作の複数の学習データで同じ時刻が含まれる場合は、１つの動作の学習データからすべての時刻を特定すれば、重複のない時刻列が得られる。

ステップＳ１１３において、初めて分割を実施するかを判定する。すなわち、これから生成しようとしているノードが根ノードか否かを判断する。根ノードの場合（初めて分割する場合）は、ステップＳ１１４に進み、根ノードでない場合は、ステップＳ１１５へ進む。

ステップＳ１１４において、学習テーブルの特徴量の列を説明変数として抽出し、教師ラベル（正誤）の列（図４参照）を目的変数として抽出して、モデル生成用データとする。モデル生成用データに基づき、説明変数から目的変数を予測する分類モデルを生成する。また分類モデルの識別率を算出する。識別率の算出方法の詳細は後述する。また、ノードＩＤを発行し、根ノードを生成ノードとして作成する。

ステップＳ１１５において、学習テーブルと、生成ノードに対する分類モデルとを用いて、閾値候補の全てに対して、分岐基準量を算出する。なお、分岐基準量の詳細は後述する。

ステップＳ１１６において、分岐基準量が最大の閾値候補を、生成ノードにおける分岐条件の閾値とする。

ステップＳ１１７において、ステップＳ１１６で生成した分岐条件を学習テーブルの時刻の列に適用し、左グループ（時刻＜閾値）の学習テーブルと、右グループ（時刻＞＝閾値）の学習テーブルとに分割する。左グループに対してノードＩＤを発行し、右グループに対してノードＩＤを発行する。それぞれ左グループのノード、右グループのノードを生成する。

ステップＳ１１８において、以下のステップＳ１１９、Ｓ１２０の処理を、左グループ、右グループそれぞれに対して実施する。

ステップＳ１１９において、該当グループの学習テーブルの特徴量の列を説明変数として抽出し、教師ラベル（正誤）の列を目的変数として抽出して、モデル生成用データを作成する。モデル生成用データに基づき、説明変数から目的変数を予測する分類モデルを生成する。

ステップＳ１２０において、該当グループに対して生成した分類モデルの識別率を算出する。識別率の算出方法の詳細は後述する。

ステップＳ１２１において、停止条件が満たされるかを判断する。より詳細には、現在の対象ノード（ステップＳ１０７で生成した左ノード及び右ノード）が停止条件を満たすかを判断する。停止条件は、左ノード及び右ノードの分割を実施するかどうかを判定するための条件である。停止条件が満たされる場合はステップＳ１２４に進み、満たさない場合はステップＳ１２２に進む。

停止条件の例を、以下に（Ａ）〜（Ｃ）として、３つ示す。βは予め設定されたパラメータである。

（Ａ）識別率を用いる。例えば、分割前の識別率と、分割後の２つのグループの識別率の平均値との差が予め設定された値を下回っていた場合は、停止条件が満たされるとする。

（Ｂ）分割回数を用いる。例えば、分割回数が予め設定された値を上回った場合は、停止条件が満たされるとする。

（Ｃ）グループ内の学習データ数を利用する。例えば、左グループ（左ノード）、または右グループ（左ノード）に属する学習データ数が予め設定された値を下回った場合は、停止条件が満たされるとする。

ステップＳ１２２において、分岐条件テーブル（図６参照）に、生成ノードのノードＩＤ、ノードタイプ、閾値、左側のノードＩＤ、右側のノードＩＤを格納する。最初にステップＳ１２２を実行するときは、ノードタイプは“根”である。

ステップＳ１２３において、左グループのノードを生成ノードとする。左グループの学習テーブルと左グループの分類モデルとを用いて、左グループの生成ノードに対して、ステップＳ１１５を実行する。同様に、右グループのノードを生成ノードとする。右グループの学習テーブルと右グループの分類モデルとを用いて、右グループの生成ノードに対して、ステップＳ１１５を実行する。以下、左グループの生成ノードと、右グループの生成ノードとのそれぞれに対して、上述した生成ノードが根ノードの場合と同様の処理を繰り返す。

ステップＳ１２４において、左グループに対して生成した分類モデル及び右グループに対して生成した分類モデルを破棄する。生成ノード（破棄された左グループのノードおよび右グループのノードを分割により生成する元となった親のノード）に対して生成された分類モデルに対して、モデルＩＤを発行する。発行したモデルＩＤと、当該分類モデルのパラメータとを、モデルパラメータテーブル（図６参照）に格納する。すなわち、ステップＳ１２４において、モデル木の葉ノードが確定し、葉ノードに対応付けられる分類モデルが確定する。

ステップＳ１２５において、各モデルＩＤの分類モデルの識別率が予め設定された設定値より小さいかを判定する。設定値より小さい場合は、ステップＳ１２６に進み、設定値以上の場合は、ステップＳ１２７に進む。

ステップＳ１２６において、該当するモデルＩＤの識別性能に“低い”（当該モデルＩＤの分類モデルを用いた正誤判定を行わない）を記録する。

ステップＳ１２７において、該当するモデルＩＤの識別性能に“高い” （当該モデルＩＤの分類モデルを用いた正誤判定を行う）を記録する。

図１２は、図１１のステップＳ１１５で行う分岐基準量の算出方法の詳細フローを示す。
本説明におけるレコードとは学習テーブルにおけるある動作のある時刻におけるデータを示す（すなわち、学習テーブルの１行に該当する）。

ステップＳ１３１において、生成ノードに属する学習テーブル（根ノードの場合、Ｓ１１１で取得した全学習データ（全レコード））を分類モデルに適用し、正誤判定を行う。正誤判定の結果と、実際の正誤（レコードの教師ラベル）とを比較し、正誤判定結果と実際の正誤とが異なっているレコード数（不正解のレコード数）を算出する。

ステップＳ１３２において、生成ノードに対するスコアを算出する。スコアの例を（Ａ）、（Ｂ）及び（Ｃ）として以下に示す。

ステップＳ１３３において、閾値候補の数だけ、以下のステップＳ１３４〜Ｓ１３７を繰り返す。

ステップＳ１３４において、閾値候補で分岐条件を生成する。生成した分岐条件を、生成ノードに属する学習テーブルの時刻列に当てはめ、左グループ(時刻＜閾値)の学習テーブルと、右グループ(時刻＞＝閾値)の学習テーブルとに分割する。

ステップＳ１３５において、左グループと、右グループとのそれぞれについてステップＳ１３６を実行する。

ステップＳ１３６において、左グループの学習テーブルを用いて、ステップＳ１３２と同じ手法でスコアを算出する。右グループの学習テーブルを用いて、ステップＳ１３２と同じ手法でスコアを算出する。

図１３は、図１１のステップＳ１２０で識別率の算出に用いる混合行列を示す。ＴＰは真陽性（True Positive）、ＦＰは偽陽性（False Positive）、ＦＮは、偽陰性（False Negative）は、ＴＮは真陰性（True Negative）である。混合行列は、学習テーブルのある動作のある時刻における実際の正誤と正誤判定結果との組み合わせ別に、レコード数をカウントしたものである。識別率は混合行列を元に、以下（Ａ）〜（４）のいずれかを用いることができる。（Ａ）〜（Ｄ）のいずれも値が大きいほど、識別率が高い（識別性能が高い）ことに相当する。

図１４は、本実施形態の評価モードにおける動作の全体のフローを示す。以下では時刻ｔにおける動作を説明する。

ステップＳ２０１において、時系列データ取得部１１がセンサ部１〜Ｍから時刻ｔの特徴量を受信する。受信したＭ個の特徴量を動作判定部１５へ提供する。なお、動作判定部１５に送信する前に前処理を実施することも可能である。収集した時系列データを学習データとして今後利用する場合は、時系列データＤＢ＿１２に、受信したＭ個の特徴量を時刻ｔに関連付けて格納する。

ステップＳ２０２において、動作判定部１５は、時系列データ取得部１１より時刻ｔにおけるＭ個の特徴量ｘ^（ｔ）を取得する。動作判定部１５はモデルＤＢ＿１６に格納されているモデル木を取得する。

モデル木に対して特徴量ｘ^（ｔ）を適用することで、適用する分類モデルを特定する。特定した分類モデルの分類性能が“高い”の場合は、特定した分類モデルを用いて正誤判定を行う。すなわち、時刻ｔにおける目的変数ｙ^（ｔ）を算出する。算出されたｙ^（ｔ）に基づき正誤判定の結果を含む出力データを、通知部１７に提供する。正誤判定の結果はｙ^（ｔ）の値そのものでもよいし、“正しい”（正解）又は“正しくない”（不正解）のテキストでもよい。

一方、特定した分類モデルの分類性能が“低い”の場合は、分類モデルに基づく正誤判定を行わない。この場合、正誤判定の結果として“正しい”の判定結果を正誤判定の結果として含む出力データを通知部１７に提供してもよいし、“ＮＡ”など、正誤判定を行わなかったことを示す値を正誤判定の結果として含む出力データを通知部１７に提供してもよい。あるいは、何ら値を出力しなくてもよい。

ステップＳ２０３において、通知部１７は、動作判定部１５から取得した時刻ｔの正誤判定の結果を含む出力データを、予め指定された装置に送信する。

ステップＳ２０１〜Ｓ２０３の動作を時刻1,…,Tの各時刻に対して繰り返すことで、予め指定された装置に、各時刻における正誤判定の結果を通知する。

図１５は、図１４のステップＳ２０１で行う時系列データ取得部１１の詳細フローを示す。図１５におけるフローは１つの時刻（ここでは時間ｔ）における動作を示す。

ステップＳ２１１において、時系列データ取得部１１は、観測対象に設置したＭ個のセンサ部のそれぞれからＫ種類の値（例えば１つのセンサ部が、Ｘ軸、Ｙ軸、Ｚ軸の値を検出する場合、Ｋ＝３である）のデータを取得する。Ｍ及びＫはそれぞれ１以上の整数である。

ステップＳ２１２において、取得したデータに時刻ｔを対応づける。

ステップＳ２１３において、時刻ｔに対応付けたデータを、動作判定部１５に提供する。

時系列データ取得部１１において、取得したデータに対して前処理を実施してもよい。この前処理は、一例として、前述したラベル設定部１３の学習データ生成時における前処理と同じである。

図１６は、図１４のステップＳ２０２で行う動作判定部１５の詳細フローを示す。以下の説明において、現在ノードとは分岐条件が満たされるかの判断の対象となっているノードのことである。

ステップＳ２２１において、時系列データ取得部１１から特徴量と時刻ｔとを含むデータを受信する。

ステップＳ２２２において、モデルＤＢ＿１６から、モデル木を取得する。具体的には、分岐条件テーブルとモデルパラメータテーブルとを取得する（図６参照）。

ステップＳ２２３において、分岐条件テーブルのノードタイプ列に“根”を持つノードＩＤを特定し、特定したノードＩＤを持つノードを、現在ノードとして設定する。

ステップＳ２２４において、現在ノードが葉ノードであるかを判定する。具体的には、分岐条件テーブルのノードタイプ列において、現在のノードＩＤの値が“葉”であるかを判定する。

現在ノードが葉ノードである場合は、ステップＳ２２８へ進み、葉ノードでない場合は、ステップＳ２２５に進む。

ステップＳ２２５において、現在ノードの分岐条件と、上記データに含まれる時刻とに基づき、分岐条件が満たされるかを判断する。

ステップＳ２２６において、ステップＳ２２５で分岐条件が満たされる場合、ｔｒｕｅが付されたアーク（図５の例では左側のアーク）を辿って、子ノードを特定する。特定した子ノードを現在ノードとし、ステップＳ２２４に戻る。

ステップＳ２２７において、ステップＳ２２５で分岐条件が満たされない場合、ｆａｌｓｅが付されたアーク（図５の例では右側のアーク）を辿って、子ノードを特定する。特定した子ノードを現在ノードとし、ステップＳ２２４に戻る。

ステップＳ２２８において、現在ノード（葉ノード）に対応づけられた分類モデルの分類性能が高いかを特定する。具体的には、現在ノードのノードＩＤに対応するモデルＩＤを分岐条件テーブルから特定する。モデルパラメータテーブルにおいて、特定したモデルＩＤに対応する分類性能の値を特定する。特定した値が“高い”か“低い”かを特定する。

ステップＳ２２９において、ステップＳ２２８で分類モデルの分類性能が高いと判断された場合に、分類モデル（モデルパラメータテーブルにおいてモデルＩＤに対応するモデルパラメータ）と、上記データに含まれる特徴量とに基づき、正誤判定を行う。正誤判定の結果を得る。

ステップＳ２３０において、ステップＳ２２８で分類モデルの分類性能が低いと判断された場合に、分類モデルによる正誤判定を行うことなく、正誤判定の結果を“正しい”と決定する。あるいは、正誤判定の結果は “未判定”などと、分類モデルによる判定を行わなかったことを示す値を、正誤判定の結果としてもよい。

ステップＳ２３１において、ステップＳ２２９又はＳ２３０で得られた正誤判定の結果を含む出力データを、通知部１７へ提供する。

図１７は、複数の時刻１〜Ｔを含む時系列データについて、図１４〜図１６の動作で判定した結果の例を示す。各時刻について判定結果として“正”又は“誤”が示されている。図１７の結果データを表示装置に表示して、本装置のユーザが判定結果を確認できるようにしてもよい。図１７の結果データは、区間と、時刻と、判定結果とを含む。区間の列には、時刻が属する時間区間で用いる分類モデルの分類性能の値が格納されている。“高分類性能”の場合は、分類モデルを用いて“正”又は“誤”が判定され、判定の結果が、判定結果の列に格納されている。“高分類性能”の場合は、判定結果の列に一律に“正”が格納されている。

以上、本実施形態によれば、正解又は不正解の教師ラベルが割り当てられた学習用の複数の時系列データに基づき、時間区間ごとに分類モデルを生成する。評価対象となる時系列データにおいて時刻ごとに正誤判定を行う場合に、分類性能の高い分類モデルが生成された時間区間内では当該分類モデルを用いて正誤判定を行う。

分類性能の低い分類モデルが生成された時間区間については分類モデルによる判定を行わない。この場合、常に正誤判定の結果とし“正しい”（正解）を出力するか、あるいは、正誤判定を行わなかったことを示す“未判定”などの情報を正誤判定の結果として出力する。

すなわち、分類性能の低い分類モデルが生成された時間区間では、正解の教師ラベルが割り当てられた時系列データでも、不正解の教師ラベルが割り当てられた時系列データでも同じ又は近似した波形を有しており、正誤を有効に判別できる波形は得られていないといえる。つまり、常に正しい動作が行われた時間区間であると判断できる。このような時間区間については、常に正誤判定の結果として“正しい”を出力して、正誤判定を行わないことで、計算負荷を低減できる。または、正誤判定を行わなかったことを示す“未判定”などの情報を正誤判定の結果として出力することで、正誤判定の精度が低下することを防止できる。

（ハードウェア構成）
図１８に、本実施形態に係る情報処理装置１０１のハードウェア構成を示す。本実施形態に係る情報処理装置１０１は、コンピュータ装置１７０により構成される。コンピュータ装置１７０は、ＣＰＵ１５１と、入力インタフェース１５２と、表示装置１５３と、通信装置１５４と、主記憶装置１５５と、外部記憶装置１５６とを備え、これらはバス１５７により相互に接続されている。

ＣＰＵ（中央演算装置）１５１は、主記憶装置１５５上で、情報処理装置１０１の上述の各機能構成を実現するコンピュータプログラムを実行する。ＣＰＵ１５１が、コンピュータプログラムを実行することにより、各機能構成は実現される。

入力インタフェース１５２は、キーボード、マウス、及びタッチパネルなどの入力装置からの操作信号を、情報処理装置１０１に入力するための回路である。情報処理装置の入力部の入力機能を担う部分は、入力インタフェース１５２上に構築されることができる。

表示装置１５３は、情報処理装置１０１から出力されるデータ又は情報を表示する。表示装置１５３は、例えば、ＬＣＤ（液晶ディスプレイ）、ＣＲＴ（ブラウン管）、及びＰＤＰ（プラズマディスプレイ）であるが、これに限られない。コンピュータ装置１７０から出力されたデータ又は情報は、この表示装置１５３により表示することができる。情報処理装置１０１が備える出力部は、表示装置１５３上に構築されることができる。

通信装置１５４は、情報処理装置１０１が外部装置と無線又は有線で通信するための回路である。通信装置１５４を介して外部装置から情報を入力することができる。外部装置から入力した情報を、ＤＢに格納することができる。通知部１７は、通信装置１５４上に構築されることができる。

主記憶装置１５５は、本実施形態の処理を実現するプログラム、及びプログラムの実行に必要なデータ、及びプログラムの実行により生成されたデータなどを記憶する。プログラムは、主記憶装置１５５上で展開され、実行される。主記憶装置１５５は、例えば、ＲＡＭ、ＤＲＡＭ、ＳＲＡＭであるが、これに限られない。各実施形態における各種ＤＢ及び記憶部は、主記憶装置１５５上に構築されてもよい。

外部記憶装置１５６は、上記プログラム及びプログラムの実行に必要なデータ、及びプログラムの実行により生成されたデータなどを記憶する。これらのプログラムやデータは、本実施形態の処理の際に主記憶装置１５５に読み出される。外部記憶装置１５６は、例えば、ハードディスク、光ディスク、フラッシュメモリ、及び磁気テープであるが、これに限られない。各実施形態における各種ＤＢ及び記憶部は、外部記憶装置１５６上に構築されてもよい。

なお、上述のプログラムは、コンピュータ装置１７０に予めインストールされていてもよいし、ＣＤ−ＲＯＭなどの記憶媒体に記憶されていてもよい。また、当該プログラムは、インターネット上にアップロードされていてもよい。

なお、コンピュータ装置１７０は、プロセッサ１５１、入力インタフェース１５２、表示装置１５３、通信装置１５４、及び主記憶装置１５５を、それぞれ１つ又は複数備えてもよいし、プリンタやスキャナなどの周辺機器を接続されていてもよい。

また、情報処理装置１０１は、単一のコンピュータ装置１７０により構成されてもよいし、相互に接続された複数のコンピュータ装置１７０からなるシステムとして構成されてもよい。

＜第２実施形態＞
第２実施形態では、観測対象が無人搬送車（ＡＧＶ）である。但し、本実施形態の観測対象は、定期的に同一又はほぼ同一のルートを走行するよう計画される移動体であれば、ドローンやバスのような移動体でもよい。本実施形態の観測対象の動作は、移動体の移動である。

図１９は、ＡＧＶが移動することにより辿った軌跡（動線）のイメージである。３つのルートＲ１〜Ｒ３が示されている。

ＡＧＶは無人搬送車であるため、一般的に、ほぼ決められたルートを、ほぼ決められた速度に従って移動している。工場などの床を移動するＡＧＶは、一例として、時刻情報と、位置情報とで走行すべきルートを管理される。位置情報は、２軸（Ｘ軸、Ｙ軸）又は３軸（Ｘ軸、Ｙ軸、Ｚ軸）で示される。３軸の例として、工場の天井に設置したレールを利用してＺ軸方向にＡＧＶが移動する場合がある。

ＡＧＶが計画通りのルートを走行できず、ルートを変更しなければならない場合がある。例えば、ルートに障害物がある、または、他のＡＧＶのルートとコンフリクトする場合等である。ルートの変更が行われた場合、ルートの変更が運用計画に影響がなかった場合は、ＡＧＶの動作は正しい動作をしたと判断される。運用計画に影響があった場合は、正しくない動作をしたと判断される。運用計画に影響があったか否かは、例えば到着予定時刻に対して一定時間以上遅れたか否かがある。また、障害物に衝突したか否かがある。その他の例でもよい。

例えば、ルートＲ３はルート変更のなかった想定通りのルートであるとする。ルートＲ１では、範囲Ｈ１においてルートＲ３と異なった箇所を走行している。しかしながら、到着予定時刻に対して一定時間以上遅れなかったため、ルートＲ１の動作は正しい動作であると判断される。ルートＲ２でも、範囲Ｈ２においてルートＲ３と異なった箇所を走行している。しかしながら、到着予定時刻に対して一定時間以上遅れたため、ルートＲ２の動作は、正しくない動作（誤った動作）であると判断される。

本装置のユーザは、ＡＧＶの走行を観察し、予定通りのルートをＡＧＶが走行すれば、正解の教師ラベルを割り当てる。予定外のルートを通過したが、運用計画に影響がない場合も、正解の教師ラベルを割り当てる。予定外のルートを通過し、かつ運用計画に影響があった場合は、不正解の教師ラベルを割り当てる。教師ラベルを割り当てる方法は第１実施形態と同様である。

図２０は、第２実施形態に係る情報処理システムである警告システムのブロック図である。図２０の警告システムは、モデル木をエッジコンピューティングのようにＡＧＶ側に搭載することで、ＡＧＶの運行を円滑に進めるためのシステムである。１台以上のＡＧＶ５０と、コンピュータ５７とを備える。ＡＧＶ５０は、センサ部１〜Ｍ、通知部１７、モデル木（分岐条件テーブル５１、モデルパラメータテーブル５２）及び演算部５３を備える。演算部５３はＣＰＵ又はマイコン等であり、図１の時系列データ取得部１１及び動作判定部１５の機能を備える。コンピュータ５７が、ＡＧＶ５０のセンサ部１〜Ｍから時系列データを収集する。ユーザにより時系列データに教師ラベルを割り当てる。コンピュータ５７は、教師ラベル付きの時系列データに基づき、分岐条件テーブル５１及びモデルパラメータテーブル５２を生成して、ＡＧＶ５０に提供する。

ＡＧＶ５０は、コンピュータ５７又は図示しない管理装置により指示されたルートを走行する。演算部５３は、時刻毎にセンサ部１〜Ｍで取得されるデータと、モデル木に基づき、正誤判定を行うか決定する。正誤判定を行う場合には、モデルパラメータテーブル５２に基づき、該当する分類モデルを用いて正誤判定を行う。正誤判定を行わない場合は、正誤判定の結果として“正解”又は“未判定”などのデータを出力する。

通知部１７は、正誤判定の結果として不正解の結果が得られた場合、警告データを出力する。例えばランプを発行させる、音を出すなどがある。ＡＧＶのルートを人間が横切るなどしてＡＧＶが人間を避け、運用計画に影響が出るルートへＡＧＶが入った直後の場合などは、警告により人間を即座にルートから離れさせ、ＡＧＶが本来のルートに戻れるようにする。これによりＡＧＶが運用計画に影響が出るルート変更を行わなくて済むようになる。一方、正誤判定の結果として正解の結果が得られた場合は、ルートに変更が生じる場合であっても、運用計画に影響はないため、人間の歩行を優先させることが可能である。

＜第３実施形態＞
図２１は、第３実施形態に係る情報処理システムである分類システム６０のブロック図である。分類システム６０は、人間であるリハビリ実施者の動作の正誤判定を行う。分類システム６０は、時系列データ取得部１１、学習部６６、動作判定部６７、データ記憶部６５を備えている。学習部６６は、図１のラベル設定部１３及びモデル生成部１４の機能を含む。動作判定部６７は、図１の動作判定部１５及び通知部１７の機能を備える。データ記憶部６５は、図１の時系列データＤＢ＿１２及びモデルＤＢ＿１６の機能を備えている。

リハビリ実施者６３はセンサ部１〜Ｍを身体の各所に装着している。センサ部１〜Ｍは、例えば加速度センサ、速度センサ、磁気センサなどを含む。リハビリの動作の実施毎に、動作の軌跡の波形データ（時系列データ）を時系列データ取得部１１が取得する。

専門員又は監督者等の観察者６４は、リハビリ実施者の動作を観察し、動作の正誤を判断し、判断した結果として正解又は不正解を示す教師ラベルを入力端末６１から入力する。学習部６６は、教師ラベルを時系列データに対応づけて、データ記憶部６５に格納する。

学習部６６は、教師ラベルが割り当てられた時系列データに基づき、モデル木を生成する。

リハビリ実施者６３は、観察者６４が不在の状態でセンサ部１〜Ｍを装着し、リハビリ動作を行う。時系列データ取得部１１は、センサ部１〜Ｍから動作の波形データを受信する。時刻毎に、モデル木を用いて、正誤判定を行うかを決定する。正誤判定を行う場合には、該当する分類モデルを用いて正誤判定を行う。正誤判定を行わない場合は、正誤判定の結果として“正解”又は“未判定”などのデータを出力する。正誤判定の結果が不正解であれば、出力端末６２に誤りを示す情報を出力する。正誤判定の結果が正解であれば、リハビリ実施者６３の動作は正しいことを示す情報を出力端末６２に出力する。出力端末６２は、リハビリ実施者６３又は観察者６４の端末でもよいし、データを蓄積するサーバでもよい。

＜第４実施形態＞
家庭や工場等における電力の需要量は、条件が共通の場合、類似した時系列データが得られやすい。条件としては、曜日や時間帯などの時刻条件、都市部や過疎部などの位置条件、気温などの気象条件がある。そこで、このような条件に基づいて、決定木又はクラスタリング手法により、類似している時系列データにグループ化し、グループごとに、電力需要予測を行う方法がある。電力需要予測は、過去の需要量から将来の需要量を予測する。グループごとに予測を行うことで、予測の精度を高めることができる。

しかしながら、イベントが起きた日などの特異日又はイベントが起きた時間帯（特異時間帯）では、条件が共通していても、類似した時系列データが得られるとは限らない。この場合、電力需要予測の精度が低下する可能性がある。そこで、本実施形態は、そのような決定木又はクラスタリング手法を用いた電力需要予測手法を第１実施形態と組み合わせることで、特異日・特異時間帯の分析を容易にする手法を提案する。これにより、電力需要予測の精度を向上させることができる。本実施形態での観測対象は電力需要量であり、観測対象の動きは、電力需要量の変化である。

図２２は、電力需要予測における決定木の一例を示す。斜線付きの矩形で示す内部ノードには、時刻条件、位置条件及び気象条件の少なくとも１つの条件を含む分岐条件が含まれる。電力需要量（例えば１日分の電力需要量）の時系列データが、決定木の各内部ノードで時刻条件、位置条件及び気象条件の少なくとも１つを満たすかを判定されることで、いずれかの葉ノードに分類される。複数の時系列データについて同様に分類することで、各葉ノードには、類似した時系列データ群が同じグループとして割り当てられる。葉ノードは、白抜きの矩形で示される。

同一のグループに割り当てられた時系列データを用いて、過去の電力需要量から将来の電力需要量を予測する電力需要予測モデルを生成する。グループの数だけ、電力需要モデルが生成される。モデルは、線形回帰モデル、重回帰モデル、ロジスティック回帰モデル、ニューラルネットワークなど、任意の回帰モデルでもよいし、それ以外のモデルでもよい。

同一のグループごとに、予測対象となる複数の時系列データについて、電力需要モデルの予測値と、電力需要の実績値とを比較し、予測値と実績値の差分である誤差を算出する。誤差が閾値未満の時系列データは、正解の教師ラベル（予測を外さなかったことを示すラベル）を割り当てる。誤差が閾値以上の時系列データには、不正解の教師ラベル（予測を外したことを示すラベル）を割り当てる。

上述した決定木又はクラスタリング手法によるグループ化、需要予測モデルの生成は、一般的なコンピュータによって実行することができる。

同一のグループごとに、教師ラベルが割り当てられた時系列データを、第１実施形態の学習用の時系列データとして用いて、モデル木を生成する。モデル木の各葉ノードに対応づけられた分類モデルの分類性能に基づき、分類性能が高い時間区間と、分類性能が低い時間区間とを特定する。分類性能が高い時間区間において、時系列データをコンピュータで解析することにより、予測を外した日又は時間帯の波形の傾向を調べることができる。

＜第５実施形態＞
図２３及び図２４は、第５実施形態に係るモデル木の更新のフローを示す。第５実施形態では、第１実施形態で生成されたモデル木を、新たな取得される時系列データによって更新する。更新により、モデル木の階層が深くなる方向に内部ノードが追加される。モデル木の既に存在する内部ノードの分岐条件は維持される。時系列データはストリーム型式で受け取る場合を想定する。時刻ごとに本フローの処理を行う。本フローの説明で使用する用語を以下の数式又は記号で定義する。

本フローの概要は以下の通りである。学習データ（時系列データ）の先頭から１時刻分のデータであるインスタンスが追加される都度、本フローが実行される。

新たに追加するノードの分岐条件を決定する際に基準となる分岐基準量を算出する。算出方法は、第１実施形態と同じである。分岐条件の判定対象となる受信済みのインスタンス全体について、最大の分岐基準量の分岐条件と、２番目に大きい分岐基準量の分岐条件との差を計算する。計算した差が、Hoeffding Boundの条件で算出される値より大きい場合に、最大の分岐基準量の分岐条件でモデル木を分岐する（当該分岐条件を含む新たな内部ノードを追加する）。

以下、図２３及び図２４に基づき、本実施形態のフローを説明する。

ステップＳ３０１において、動作判定部１５は、モデルＤＢ＿１６からモデル木を読み込む。

ステップＳ３０２において、モデル生成部１４は、時刻ｉ＝１にセットする。フローの開始時は、時刻ｉ＝１は、時系列データの最初の時刻に対応する。

ステップＳ３０３において、時系列データの入力があるかを判断する。入力がなければ、本処理を終了する。

ステップＳ３０４において、ステップＳ３０３で時系列データの入力がある場合は、時刻ｉのデータの特徴量を算出する。

ステップＳ３０５において、モデル生成部１４は、算出した特徴量を用いて、モデル木により時刻ｉのデータを分類する。

ステップＳ３０６において、時刻ｉを用いて分岐条件の閾値の候補を生成する。閾値の候補の生成方法は、第１実施形態と同様でよい。生成する閾値の候補は、時刻ｉのデータが分類された葉ノードと、当該葉ノードの親ノードとの間に、新たな分岐条件ノードを追加する場合に、当該追加するノードの分岐条件で用いるものである。

ステップＳ３０７において、ｉ＝１かを判断する。

ステップＳ３０８において、ｉ＝１の場合、ｉ＝ｉ＋１として、次の時刻のデータを読み込む。

ステップＳ３０９において、ｉ＝１でない場合、閾値の候補と、モデル木で分類された葉ノードに対応づけられた分類モデルを用いて、分岐基準量を算出する。分岐基準量の算出方法は第１実施形態と同じである。

ステップＳ３１０において、ｉ番目の時刻の分岐基準量をメモリに保存する。

ステップＳ３１１において、ｉ＝２かを判断する。ｉ＝２の場合、ステップＳ３０８でｉ＝ｉ＋１として、次の時刻のデータを読み込む。

ステップＳ３１２において、ｉ＝２でない場合（つまりｉが３以上の場合）、これまで算出した分岐基準量のうち、分岐基準量の最大値と、２番目に大きい分岐基準量との差を算出する。算出した差が、上述のHoeffding Boundの条件の値であるε未満かを判断する。差がε未満の場合、ステップＳ３０８でi=i+1として、次の時刻のデータを読み込む。

図２４のステップＳ３１３において、差がε以上の場合、ｉ番目の時刻の特徴量をメモリに記憶する。

最大の分岐基準量が得られた閾値の候補の時刻を含む分岐条件を生成し、分岐条件を含む内部ノードを追加する。当該分岐条件に含まれる時刻より前と、当該時刻以降とで、データ（インスタンス）を分割し、２つのグループを生成する。各グループについて、ステップＳ３０５で特定された分類モデルを用いて、モデル誤差（分類モデルによる予測値と真値との差）を計算する。モデル誤差の統計値（平均値、中央値、最大値、又は最小値）を計算する。

ステップＳ３１７において、２つのグループのうち、モデル誤差の統計値が大きい方のグループは、グループに属する特徴量で新たに該当グループの分類モデルを生成する。

ステップＳ３１８において、２つのグループのうち、モデル誤差の統計値が小さい方のグループは、元の分類モデル（ステップＳ３０５で特定した分類モデル）を用いる。

ステップＳ３１９において、メモリ上でのデータ（インスタンス）、閾値、分岐基準量を消去する。

ステップＳ３２０において、ｉ＝１にリセットする。ステップＳ３０３に戻り、次の時刻のデータがなければ、終了する。次のデータがあれば、以上のステップを繰り返す。

図２５は、本実施形態により第１実施形態で用いた図５のモデル木を更新した例を模式的に示す。「経過時間＜Ａ」の分岐条件を含む内部ノードと、分類モデルｆ_１が対応づいた葉ノードとの間に、「経過時間＜Ｅ」の内部ノードが追加されている。追加された内部ノードの２つの子ノード（葉ノード）のうちの一方には元の分類モデルｆ_１が対応付けられ、他方の葉ノードには新たに生成された分類モデルｆ_６が対応づけられている。

本実施形態では、オンラインでリアルタイムに更新を行ったが、バッチ処理も可能である。

なお、本発明は上記各実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記各実施形態に開示されている複数の構成要素を適宜組み合わせることによって種々の発明を形成できる。また例えば、各実施形態に示される全構成要素からいくつかの構成要素を削除した構成も考えられる。さらに、異なる実施形態に記載した構成要素を適宜組み合わせてもよい。

１０１：情報処理装置
１〜Ｍ：センサ部
１１：時系列データ取得部
１２：時系列データＤＢ
１３：ラベル設定部
１４：モデル生成部
１５：動作判定部（決定部）
１６：モデルＤＢ
１７：通知部
５１：分岐条件テーブル
５２：モデルパラメータテーブル
５３：演算部
５０：ＡＧＶ
５７：コンピュータ
６０：分類システム
６１：入力端末
６２：出力端末
６３：リハビリ実施者
６４：観察者
６６：学習部
６７：動作判定部
６５：データ記憶部
１５１：プロセッサ（ＣＰＵ）
１５２：入力インタフェース
１５３：表示装置
１５４：通信装置
１５５：主記憶装置
１５６：外部記憶装置
１５７：バス
１７０：コンピュータ装置

Claims

観測対象から得られた時系列データに含まれる第１時刻のデータに基づいて、前記第１時刻の前記観測対象の状態を推定する推定部
を備えた情報処理装置。
前記時系列データは、前記観測対象の動きの時系列データである
請求項１に記載の情報処理装置。
前記推定部は、前記時系列データにおける前記第１時刻を含む時間区間に基づいて、前記観測対象の状態を推定する
請求項１又は２に記載の情報処理装置。
前記推定部は、前記第１時刻を含む前記時間区間に対応づけられた分類モデルを用いて前記観測対象の状態を推定する
請求項３に記載の情報処理装置。
前記分類モデルは、前記観測対象から得られたデータが割り当てられる変数と、前記観測対象の状態を表す値とを対応づけており、
前記推定部は、前記分類モデルと、前記第１時刻の前記データとに基づいて前記観測対象の状態を推定する
請求項４に記載の情報処理装置。
前記推定部は、前記第１時刻の状態のクラスを判定する
請求項４又は５に記載の情報処理装置。
前記クラスは、前記第１時刻の状態が正しい第１クラス又は前記第１時刻の状態が誤っている第２クラスである
請求項６に記載の情報処理装置。
前記時系列データは、少なくとも１つの第１時間区間と、少なくとも１つの第２時間区間とを含み、
前記推定部は、前記第１時刻が前記第１時間区間に含まれる場合に前記観測対象の状態の推定を行う
請求項６又は７に記載の情報処理装置。
前記推定部は、前記第１時刻が前記第２時間区間に含まれる場合に前記観測対象の状態の推定を行わない
請求項８に記載の情報処理装置。
前記時系列データは、複数の前記第１時間区間を含み、
複数の前記第１時間区間に、複数の前記分類モデルが対応づいており、
前記推定部は、前記第１時刻を含む前記第１時間区間に対応する前記分類モデルを用いて、前記観測対象の状態の推定を行う
請求項８又は９に記載の情報処理装置。
前記第２時間区間に、前記分類モデルが対応づいており、
前記第１時間区間は、前記分類モデルの識別性能が高い時間区間であり、
前記第２時間区間は、前記分類モデルの識別性能が低い時間区間である
請求項１０に記載の情報処理装置。
複数の時系列データと、前記複数の時系列データに割り当てられた複数のクラスとに基づいて、前記第１時間区間の推定と、前記分類モデルの生成とを行う
請求項８〜１１のいずれか一項に記載の情報処理装置。
複数のノードと、時刻に関する分岐条件と、前記複数のノードのうち複数の末端ノードに対応づいた複数の前記分類モデルと、を含むモデル木を備え、
前記推定部は、前記第１時刻と前記モデル木を用いて、前記観測対象の状態の推定に用いる前記分類モデルを推定する
請求項１０又は１１のいずれか一項に記載の情報処理装置。
複数の時系列データと、前記複数の時系列データに割り当てられた複数のクラスとに基づいて、前記モデル木を生成又は更新する
請求項１３に記載の情報処理装置。
前記時系列データを取得するデータ取得部
を備えた請求項１〜１４のいずれか一項に記載の情報処理装置。
前記観測対象の状態は、前記観測対象の動きである
請求項２〜１４のいずれか一項に記載の情報処理装置。
前記観測対象の動きは、人間のリハビリテーション動作である
請求項１６に記載の情報処理装置。
前記観測対象の動きは、移動体の移動である
請求項１６に記載の情報処理装置。
前記時系列データは、前記観測対象の動きの軌跡データである
請求項１〜１８のいずれか一項に記載の情報処理装置。
前記観測対象は、需要量である
請求項１〜１６のいずれか一項に記載の情報処理装置。
前記観測対象に設置されたセンサ部から前記時系列データを取得するデータ取得部
を備えた請求項１〜２０のいずれか一項に記載の情報処理装置。
前記観測対象の状態を推定することは、前記観測対象の状態を正誤判定することである
請求項１〜２１のいずれか一項に記載の情報処理装置。
コンピュータが
観測対象から得られた時系列データに含まれる第１時刻のデータに基づいて、前記第１時刻の前記観測対象の状態を推定する、
情報処理方法。
観測対象から得られた時系列データに含まれる第１時刻のデータに基づいて、前記第１時刻の前記観測対象の状態を推定するステップ
をコンピュータに実行させるためのコンピュータプログラム。
観測対象から得られた時系列データに含まれる第１時刻のデータに基づいて推定した、前記第１時刻の前記観測対象の状態を表示する情報処理装置。