JP2021110987A - 情報処理装置、情報処理方法及びコンピュータプログラム - Google Patents

情報処理装置、情報処理方法及びコンピュータプログラム Download PDF

Info

Publication number
JP2021110987A
JP2021110987A JP2020000550A JP2020000550A JP2021110987A JP 2021110987 A JP2021110987 A JP 2021110987A JP 2020000550 A JP2020000550 A JP 2020000550A JP 2020000550 A JP2020000550 A JP 2020000550A JP 2021110987 A JP2021110987 A JP 2021110987A
Authority
JP
Japan
Prior art keywords
time
information processing
observation target
series data
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020000550A
Other languages
English (en)
Other versions
JP7244443B2 (ja
Inventor
亜梨花 福島
Arika Fukushima
亜梨花 福島
明淑 高
Myungsook Ko
明淑 高
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2020000550A priority Critical patent/JP7244443B2/ja
Priority to US17/015,279 priority patent/US11874854B2/en
Publication of JP2021110987A publication Critical patent/JP2021110987A/ja
Application granted granted Critical
Publication of JP7244443B2 publication Critical patent/JP7244443B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Rehabilitation Tools (AREA)
  • Biomedical Technology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)

Abstract

【課題】観測対象の状態を推定する情報処理装置、情報処理方法及びコンピュータプログラムを提供する。【解決手段】本実施形態に係る情報処理装置は、観測対象から得られた時系列データに含まれる第1時刻のデータに基づいて、前記第1時刻の前記観測対象の状態を推定する推定部を備える。【選択図】図1

Description

本実施形態は、情報処理装置、情報処理方法及びコンピュータプログラムに関する。
従来、観測対象の状態を推定する解析システムがいくつか開発されている。例えば、観測対象にセンサを設置して、センサから時系列データを取得する。時系列データに正解又は不正解の教師ラベルを割り当てた教師データを作成し、教師データに基づいて、観測対象の状態を推定する。しかしながら、この方法では時系列データ全体の状態に対する推定しか行うことができず、一部の状態に対する推定を行うことができなかった。
特許第6129082号公報
本発明の実施形態は、観測対象の状態を推定する情報処理装置、情報処理方法及びコンピュータプログラムを提供する。
本実施形態に係る情報処理装置は、観測対象から得られた時系列データに含まれる第1時刻のデータに基づいて、前記第1時刻の前記観測対象の状態を推定する推定部を備える。
第1実施形態に係る情報処理装置のブロック図。 正しい動作の時系列データと、正しくない動作の時系列データとの例を示す図。 時系列データ取得部により取得された時系列データの一例を示す図。 時系列データDBに記憶された時系列データ例を示す図。 モデル木の構造を模式的に示す図。 分岐条件テーブルとモデルパラメータテーブルとを示す図。 モデル木の具体例を示す図。 通知部が送信する出力データの例を示す図。 第1実施形態に係る学習モード時における動作の全体フローを示す図。 ラベル設定部の詳細フローを示す図。 モデル生成部の詳細な動作フローを示す図。 分岐基準量の算出方法の詳細フローを示す図。 識別率の算出に用いる混合行列を示す図。 第1実施形態の評価モードにおける動作の全体のフローを示す図。 時系列データ取得部の詳細フローを示す図。 動作判定部の詳細フローを示す図。 複数の時刻を含む時系列データについて判定した結果の例を示す図。 第1実施形態に係る情報処理装置のハードウェア構成を示す図。 AGVが移動することにより辿ったルート(動線)のイメージの図。 第2実施形態に係る情報処理システムである警告システムのブロック図。 第3実施形態に係る情報処理システムである分類システムのブロック図。 電力需要予測における決定木の一例を示す図。 第5実施形態に係る動作の一例のフローを示す図。 図23に続く図。 モデル木を更新する例を示す図。
以下、図面を参照しながら、本発明の実施形態について説明する。
<第1実施形態>
図1は、本実施形態に係る情報処理装置のブロック図である。図1の情報処理装置101は、観測対象から得られた時系列データを解析し、任意の時刻における観測対象の状態を推定する装置である。観測対象の状態の例として、人間又は移動体等の動き(動作)、電力需要量等の需要量の動き(変化)等がある。本実施形態では、観測対象(人間又は移動体等)の動作における任意の時刻の状態を推定する場合を想定する。状態を推定する例として、任意の時刻における状態のクラスを判定する。クラスの例として、任意の時刻における動作の軌跡が正しい第1クラス(正解のクラス)、任意の時刻における動作の軌跡が誤っている第2クラス(不正解のクラス)がある。本実施形態では2つのクラスを扱うが、クラスの数は3以上でもよい。状態のクラスを判定することは、状態を推定する一例にすぎない。状態を推定することは、状態のクラスを判定することに限られない。例えば、状態を推定することは、状態の複数の候補の中から、該当する候補を選択することでもかまわない。ニューラルネットワーク等のモデルを用いて状態を予測することでもかまわない。
本実施形態では、観測対象から得られた時系列データ全体に対するクラスを判定するのではなく、時系列データの任意の時刻に対してクラスを判定する。ある動作を行っている観測対象から取得される時系列データ全体に対して誤っていると判断される場合であっても、正しい動作の部分と誤った動作の部分とが混在している場合がある。すなわち、全体として誤っていると判断される動作の時系列データであっても、時系列データの一部に対応する動作は正しい場合もある。例えば、リハビリテーション(リハビリ)や技能育成のための動作を行う場合を考える。リハビリの動作には、正しいとされる軌跡(手本となる軌跡)があることが多い。リハビリでは正しい動作を繰り返し実施することで機能回復を図る。指導者がいない状況では、リハビリ実施者は誤った動作を行うことがあるが、全体としては誤った動作であっても部分的に見た場合には、正しい動作が行われている場合もある。本実施形態では評価対象となる動作の時系列データに対して時刻毎に正しい動作か(正しい状態か)、又は誤っている動作か(誤った状態か)を高精度に判定することを可能にする。
図2は、正しい動作の時系列データと、正しくない動作の時系列データとの例を示す。より詳細には、図2(A)は情報処理装置101のユーザ(観測対象の観察者等)によって正しいと判断された動作の時系列データである。図2(B)は情報処理装置101のユーザによって正しくないと判断された動作の時系列データである。図2(B)の時系列データは全体として正しくない波形を有しているが、正しい動作の時系列データと同じ又は近似した形をしている波形も含まれている。例えば、動作開始からP秒目〜Q秒目、R秒目〜S秒目では、図2(B)の波形は、図2(A)の波形と異なっている。一方、動作開始からP秒目までと、Q秒目〜R秒目までと、S秒目以降では、図2(B)の波形は、図2(A)の波形は同じである。P秒目、Q秒目、R秒目、S秒目は、正しい動作の波形と誤の動作の波形との境界である。
本実施形態では、学習モードとして、正解又は不正解のラベルを教師ラベルとして割り当てられた複数の時系列データを用いて、境界となる時刻の決定と、時刻で区切られた時間区間ごとの分類モデルの生成とを行う。分類モデルは、動作の正誤を判定するためのモデルである。
評価モードとして、時間区間毎の分類モデルを用いて、評価対象となる時系列データについて時刻ごとに正誤判定を行う。より詳細には、閾値以上の識別性能の分類モデルが得られた時間区間については分類モデルを用いた正誤判定を行い、識別性能が閾値未満の分類モデルが得られた時間区間については分類モデルを用いた正誤判定を行わない。例えば、Q秒目〜R秒目では正しくない(誤った)動作のデータが存在しない又は少ないため、閾値以上の識別性能の分類モデルが得られないとする。このように識別性能の低い時間区間に属する時刻については、正誤判定を実施しない。これにより、高精度な判定を行うとともに、時系列データの全点を正誤判定することを回避し、計算回数を削減する。以下、本実施形態について詳細に説明する。
情報処理装置101は、時系列データ取得部(データ取得部)11、時系列データDB_12、ラベル設定部13、モデル生成部14、動作判定部(推定部)15、モデルDB_16及び通知部17を備えている。
時系列データ取得部11は、データ取得部として、M(Mは1以上の整数)個のセンサ部1、2、・・・、Mにより検出された特徴量の時系列である時系列データを取得する。センサ部1〜Mは、一例として観測対象に設置されたセンサを含む。観測対象は人間でもよいし、無人搬送車(Automatic Guided Vehicle: AGV)等の移動体でもよいし、スマートメータ等の装置でもよい。
センサの例は、速度センサ、加速度センサ、位置センサ、温度センサ、磁気センサ、電力センサ、電圧センサ、電流センサを含む。センサは他の種類のセンサでもよい。特徴量は、センサにより検出された値でもよい。また、特徴量は、センサにより検出された値の統計値(平均値又は分散など)でもよい。また、特徴量は、複数のセンサにより検出された値の演算値でもよい。例えば、電流センサにより検出された電流値と、電圧センサにより検出された電圧値との積でもよい。この場合、センサ部は、CPU等の演算装置でもよい。
時系列データDB_12は、時系列データ取得部11により取得された時系列データを格納する。時系列データDB_12は、時系列データ取得部11により取得された時系列データを、時刻に関連付けて格納する。
図3は時系列データ取得部11により取得された時系列データの一例を示す。時間tにおける時系列データが示されている。他の時刻についても同様の形式で時系列データが取得される。この例では、X軸、Y軸、Z軸毎の加速度、X軸、Y軸、Z軸毎の角速度、X軸、Y軸、Z軸毎の地磁気の強度などが、特徴量として取得されている。
入力部18は、センサ部1〜Mにより取得された時系列データ、あるいは、時系列データDB_12に格納された時系列データに対して、観測対象の動作に関するクラスの情報を教師ラベルとして入力する。
例えば、情報処理装置101のユーザは、観測対象の動作を観察し、観測対象の動作が完了した後、観測対象が正しい動作を行ったかを判断する。観測対象が正しい動作を行ったと判断すれば、動作が正しいクラスを示す教師ラベル(正解の教師ラベル)を入力する。観測対象が正しくない動作を行っていると判断すれば、“動作が誤っているクラスを示す教師ラベル(不正解の教師ラベル)を入力する。正しい動作は、正常な動作又は想定通りの動作とも言える。正しくない動作は、異常な動作又は想定外の動作とも言える。
例えば、観測対象がリハビリテーションを行い、リハビリテーションの動作が正しければ(指導者の指示したとおりの動作を観測対象が行った場合は)、正解の教師ラベルを入力し、それ以外の場合は、負の教師ラベルを入力する。別の例として、AGVが所定の経路を走行した場合は、正解の教師ラベルを入力し、それ以外の場合は、負の教師ラベルを入力する。
ラベル設定部13は、入力部18から入力された教師ラベルを、時系列データDB_12に、ユーザの指定した時系列データに対応付けて格納する。時系列データ取得部11が、観測対象の動作を識別する識別情報(動作ID)を生成し、時系列データに対応付けて、時系列データDB_12に格納してもよい。なお、動作IDは、ユーザが入力部18から指定してもよい。
図4は、時系列データDB_12に記憶された時系列データ例を示す。各時刻に取得されたデータに動作ID、時刻、教師ラベル(正/誤)が対応づいている。“正”は正解の教師ラベル、“誤”は不正解の教師ラベルに対応する。
複数の時刻のデータを含む時系列データの各データには、同じ動作IDと、同じ教師ラベルとが割り当てられている。
時系列データに含まれる個々のデータは時刻順に並んでいる。例えば、動作IDが1の複数のデータがN個存在し、これらN個データの集合が、同じ動作を表す時系列データに対応する。1つの行(1つの時刻のデータ)は1つのレコードに対応する。動作ID2についても同様にN個のデータが存在し、動作ID3以降についても同様である。
動作ID=1,2,3,・・の各時系列データの時刻は相対時刻であり、この例では、いずれも時刻1から開始している。但し、各時系列データの時刻は、絶対時刻で表してもよい。
また、図4の例では、各時系列データに含まれるレコード数(データ数)は同じであるが、動作ごとに時系列データに含まれるレコード数(データ数)が異なってもよい。
また、図4の例では、動作ごとにレコード(データ)のサンプリング間隔は同じであるが、サンプリング間隔が異なってもよい。
本実施形態では、教師ラベルをラベル設定部13が入力部18から取得し、取得した教師ラベルを割り当てているが、他の装置で時系列データの取得と教師ラベルの設定等を行ってもよい。この場合、情報処理装置101は、他の装置から教師ラベル等が割り当てられた時系列データを取得して、取得した時系列データを時系列データDB_12に格納してもよい。
モデル生成部14は、時系列データDB_12に格納されている教師ラベル付きの時系列データを学習データとして用いて、モデル木を生成する。モデル木は、評価対象となる時系列データにおいて評価対象となるデータのクラス(正解/不正解)を評価するために用いる分類モデルを、評価対象となるデータの時刻に基づいて決定するためのものである。モデル木は、モデル木は決定木の一種であり、葉ノードに分類モデルが対応付けられた決定木である。分類モデルは、評価対象となるデータのクラス(正解/不正解)を判定するためのものである。分類データは、評価対象となるデータと、動作の正誤を判定するための値(クラスを判定するための値)とが対応づいたモデルである。モデル生成部14は、生成したモデル木を、モデルDB_16に格納する。
図5は、モデル木の構造を模式的に示す。モデル木は、複数のノードと、ノード間の関係を示すアークとを備える。ノードには、内部ノードと、末端ノード(葉ノード)とがある。内部ノードは、枝分かれした先に他のノードを持つノード(根ノードと途中ノード)である。葉ノードは、それ以上枝分かれしないノードである。内部ノードには、分岐条件が割り当てられる。葉ノードには、分類モデル(識別器)が対応づけられる。あるノードから枝分かれした先のノードを、当該ノードの子ノードと呼ぶ。また当該ノードを子ノードの親ノードと呼ぶ。
分岐条件は、時刻に関する条件である。具体的には、分岐条件は、時系列データの波形を複数の時間区間に区切る時刻を基にした不等式で定義される。一例として、動作の開始時刻からの経過時間を用いて、分岐条件は定義される。例えば、「経過時間<12秒」(経過時間は12秒未満)、「経過時間<43秒」などが分岐条件に該当する。
各葉ノードに分類モデルf(i=1,…,S)(Sは葉ノードの数)が対応づけられている。分類モデルは、時系列データ中のある1つの時刻のデータ(特徴量のセットx(t)(t=1,…,T))の正誤判定を行うモデルである。このようなモデルは、一般的な機械学習の手法であるロジスティック回帰、ナイーブベイズ分類器、ニューラルネットワーク、深層学習、ランダムフォレスト、又はブースティングなどを利用して生成できる。
各葉ノードにおける分類モデルfは、一例として、同一の機械学習の手法を用いて生成される。分類モデルの学習方法として、LASSO(Least absolute shrinkage and selection operator)に代表されるようなスパースモデリング手法やステップワイズ法などを用いる場合、変数選択が行われる。これにより、分類モデルに利用される変数(特徴量)が、モデル毎に異なる可能性もある。分類モデルは、一般的に以下の式で表現できる。
Figure 2021110987
fiは、分類モデルを表す関数である。
(t)(t=1,…,T)は、時刻tにおける各センサ部の値(特徴量)を含むベクトルである。つまり、x(t)=(x (t),x (t),…,x (t),…,x (t))である。x (t)は、時刻tにおけるあるセンサ部(l番目のセンサ部)の特徴量を示す。Lは特徴量の数である。
Figure 2021110987
図6(A)及び図6(B)は、モデル生成部14により生成されたモデル木をテーブル形式で表す。図6(A)は分岐条件テーブルを示す。図6(B)はモデルパラメータテーブルを示す。分岐条件テーブルは、モデル木の構造を表す。モデルパラメータテーブルは、モデル木の葉ノードに対応づけられた分類モデルのパラメータ及び分類モデルの識別性能を格納する。分類モデルの関数の形は別途、モデルDB_16に格納されているとする。
図6(A)の分岐条件テーブルは、以下の項目を含む。
ノードID:モデル木のノードを識別するためのID
ノードタイプ:ノードIDが示すノードが、葉ノードか内部ノードかを示す値。但し、内部ノードのうち根ノードについては、根ノードを示す値を持つ。
閾値 :ノードタイプが内部ノードを示す場合に、分岐条件に閾値として用いられる時刻。ノードタイプが葉ノードを示す場合は“NA”である。
モデルID:ノードタイプが葉ノードを示す場合、該当する葉ノードに対応付けられたモデルのID。ノードタイプが内部ノードを示す場合は“NA”である。
左側のノードID:ノードタイプが内部ノードを示す場合に、該当の内部ノードの分岐条件がtrueであった場合に進む次のノードのノードID。ノードタイプが葉ノードである場合は“NA”である。
右側のノードID:ノードタイプが内部ノードを示す場合、該当の内部ノードの分岐条件がfalseであった場合に進む次のノードのノードID。ノードタイプが葉ノードを示す場合は、“NA”である。
図6(B)のモデルパラメータテーブルは、以下の項目を含む。
モデルID:葉ノードに対応づけられた分類モデルを識別するID。
モデルパラメータ1〜F:分類モデルのF個のモデルパラメータの値。モデル生成部14で変数選択が実施された場合、選択されなかった変数(削除された変数)は0の値を持つ。
識別性能:分類モデルの識別性能が高いか低いか(分類モデルを用いた正誤判定を行うか否か)を示す。識別性能が高いとは、分類モデルの識別性能を評価する指標が閾値以上であることを意味する。本実施形態では、識別性能が高い場合、分類モデルを用いた正誤判定を行う。識別性能が低いとは、分類モデルの識別性能を評価する指標が閾値未満であることを意味する。本実施形態では、識別性能が低い場合、分類モデルを用いた正誤判定を行わない。この場合、例えば、“正しい”(正解)又は“未判定”の判定結果を出力する(詳細は後述する)。
モデル生成部14がモデル木を生成する動作の詳細は後述する。
動作判定部(決定部)15は、時系列データ取得部11により得られた評価対象となる時系列データに対して、モデルDB_16に格納されたモデル木と、時刻p(p=1,…,T)が属する時間区間を特定する情報とに基づき、時刻p(p=1,…,T)における観測対象の状態を推定する。すなわち、時刻pにおける観測対象の状態(動作等)の正誤判定を行う。図6を用いて、動作判定部15の動作の概要を説明する。
図7は、図2に示した時刻P、Q、R、Sが境界時刻として用いられた場合に作成されたモデル木の例を示す。
P秒目未満に対応する葉ノードに、識別率の低い分類モデルfが対応付けられている。
P秒目以上Q秒目未満に対応する葉ノードには、識別率の高い分類モデルfが対応付けられている。
Q秒目以上R秒目未満に対応する葉ノードに、識別率の低い分類モデルfが対応付けられている。
R秒目以上S秒目未満に対応する葉ノードに、識別率の高い分類モデルfが対応付けられている。
S秒目以上に対応する葉ノードに、識別率の低い分類モデルfが対応付けられている。
このモデル木の場合、動作判定部15は、評価対象となる時系列データのP秒目より前の時間区間では正誤判定を行わない。つまり、分類モデルfを用いた判定を行わない。この場合、例えば、“正しい”(正解)又は“未判定”の判定結果を出力する。
評価対象となる時系列データのP秒目以上Q秒目未満の時間区間では、分類モデルfを用いた判定を行う。この場合、分類モデルfに基づく正誤判定の結果を出力する。
評価対象となる時系列データのQ秒目以上R秒目未満の時間区間では正誤判定を行わない。つまり、分類モデルfを用いた判定を行わない。この場合、例えば、“正しい”(正解)又は“未判定”の判定結果を出力する。
評価対象となる時系列データのR秒目以上S秒目未満の時間区間では、分類モデルfを用いた判定を行う。この場合、分類モデルfに基づく正誤判定の結果を出力する。
評価対象となる時系列データのS秒目以上の時間区間では正誤判定を行わない。つまり、分類モデルfを用いた判定を行わない。この場合、例えば、“正しい”(正解)又は“未判定”の判定結果を出力する。
通知部17は、動作判定部15において判定された時刻pにおける動作の正誤判定の結果を含む出力データを、予め指定された装置に送信する。予め指定された装置は、一例として、観測対象自体(例えばAGV、ドローン等の移動体など)、観測対象を管理する管理装置、観測対象が保持する装置(例えば人間が保持する装置)がある。あるいは、予め指定された装置は、ユーザの保持する端末、又はサーバなどでもよい。
図8は、通知部17が送信する出力データの例を示す。図8の出力データは、動作ID、時刻、及び正誤判定結果を含む。
図9は、本実施形態に係る学習モード時における動作の全体フローを示す。時系列データDB_12には予め動作IDが割り当てられた時系列データが格納されているとする。
ステップS101において、ラベル設定部13がユーザより入力された教師ラベル(正解又は不正解の2値のラベル)を、入力部18を介して取得する。ラベル設定部13は、取得した教師ラベルを、対応する時系列データに対応づける。教師ラベル及び動作IDを割り当てられた時系列データは、学習データに対応する。学習データの集合は学習テーブル(前述した図4参照)に対応する。
ステップS102において、モデル生成部14が、時系列データDB_12より、学習データ(M個のセンサ部が存在する場合M個の学習データ)を取得する。モデル生成部14は、取得した学習データを用いて、モデル木を生成する。モデル生成部14は、生成したモデル木を、モデルDB_16に格納する。
図10は、図9のステップS101で行うラベル設定部13の詳細フローを示す。
ステップS91において、ラベル設定部13では、教師ラベルを付けたい動作の動作IDを特定する。動作IDはユーザが指定してもよいし、まだ教師ラベルが付けられていない時系列データを任意に特定してもよい。
ステップS92において、特定した動作IDに対応する時系列データを、時系列データDB_12から取得する。
ステップS93において、取得した時系列データを表示部に表示する。
ステップS94において、ユーザが、正解(正しい)または不正解(誤り)の教師ラベルを決定し、入力部18を用いて入力する。ユーザは、動作IDの時系列データがセンサ部により検出されたときの観測対象の動作を観察しており、観察に基づき、教師ラベルを決定する。あるいは、時系列データの波形を見て、教師ラベルを決定してもよい。
ステップS95において、ラベル設定部13は、入力部18から入力された教師ラベルを、動作IDに関する時系列データに対応づける。
ラベル設定部13では、時系列データに対する前処理を実施してもよい。例えば、X軸、Y軸、Z軸の3つの値をユークリッド距離などに変換してもよい。あるいは、X軸、Y軸、Z軸の3つの値に対して主成分変換を行ってもよい。または各軸の値の移動平均を計算してもよい。その他、一般的な時系列データの前処理手法を適用可能である。
図11は、図9のステップS102で行うモデル生成部14の詳細な動作フローを示す。図11のフローでは、時系列データDB_12内に学習データが予め全部揃っているとする。なお、生成したモデル木を更新する際は、フルスクラッチで再学習してもよい。以下の説明において、分岐条件を生成する対象のノードを“生成ノード”と呼ぶ。
ステップS111において、時系列データDB_12から、複数の動作分の時系列データ(すなわち複数の動作のそれぞれについて複数の時刻の学習データ(レコード))を学習テーブルとして取得する。学習テーブルの時刻の列に含まれるすべての時刻を特定する。重複する時刻があれば、重複を排除する。各動作の複数の学習データで同じ時刻が含まれる場合は、1つの動作の学習データからすべての時刻を特定すれば、重複のない時刻列が得られる。
Figure 2021110987
Figure 2021110987
ステップS113において、初めて分割を実施するかを判定する。すなわち、これから生成しようとしているノードが根ノードか否かを判断する。根ノードの場合(初めて分割する場合)は、ステップS114に進み、根ノードでない場合は、ステップS115へ進む。
ステップS114において、学習テーブルの特徴量の列を説明変数として抽出し、教師ラベル(正誤)の列(図4参照)を目的変数として抽出して、モデル生成用データとする。モデル生成用データに基づき、説明変数から目的変数を予測する分類モデルを生成する。また分類モデルの識別率を算出する。識別率の算出方法の詳細は後述する。また、ノードIDを発行し、根ノードを生成ノードとして作成する。
ステップS115において、学習テーブルと、生成ノードに対する分類モデルとを用いて、閾値候補の全てに対して、分岐基準量を算出する。なお、分岐基準量の詳細は後述する。
ステップS116において、分岐基準量が最大の閾値候補を、生成ノードにおける分岐条件の閾値とする。
ステップS117において、ステップS116で生成した分岐条件を学習テーブルの時刻の列に適用し、左グループ(時刻<閾値)の学習テーブルと、右グループ(時刻>=閾値)の学習テーブルとに分割する。左グループに対してノードIDを発行し、右グループに対してノードIDを発行する。それぞれ左グループのノード、右グループのノードを生成する。
ステップS118において、以下のステップS119、S120の処理を、左グループ、右グループそれぞれに対して実施する。
ステップS119において、該当グループの学習テーブルの特徴量の列を説明変数として抽出し、教師ラベル(正誤)の列を目的変数として抽出して、モデル生成用データを作成する。モデル生成用データに基づき、説明変数から目的変数を予測する分類モデルを生成する。
ステップS120において、該当グループに対して生成した分類モデルの識別率を算出する。識別率の算出方法の詳細は後述する。
ステップS121において、停止条件が満たされるかを判断する。より詳細には、現在の対象ノード(ステップS107で生成した左ノード及び右ノード)が停止条件を満たすかを判断する。停止条件は、左ノード及び右ノードの分割を実施するかどうかを判定するための条件である。停止条件が満たされる場合はステップS124に進み、満たさない場合はステップS122に進む。
停止条件の例を、以下に(A)〜(C)として、3つ示す。βは予め設定されたパラメータである。
(A)識別率を用いる。例えば、分割前の識別率と、分割後の2つのグループの識別率の平均値との差が予め設定された値を下回っていた場合は、停止条件が満たされるとする。
(B)分割回数を用いる。例えば、分割回数が予め設定された値を上回った場合は、停止条件が満たされるとする。
(C)グループ内の学習データ数を利用する。例えば、左グループ(左ノード)、または右グループ(左ノード)に属する学習データ数が予め設定された値を下回った場合は、停止条件が満たされるとする。
ステップS122において、分岐条件テーブル(図6参照)に、生成ノードのノードID、ノードタイプ、閾値、左側のノードID、右側のノードIDを格納する。最初にステップS122を実行するときは、ノードタイプは“根”である。
ステップS123において、左グループのノードを生成ノードとする。左グループの学習テーブルと左グループの分類モデルとを用いて、左グループの生成ノードに対して、ステップS115を実行する。同様に、右グループのノードを生成ノードとする。右グループの学習テーブルと右グループの分類モデルとを用いて、右グループの生成ノードに対して、ステップS115を実行する。以下、左グループの生成ノードと、右グループの生成ノードとのそれぞれに対して、上述した生成ノードが根ノードの場合と同様の処理を繰り返す。
ステップS124において、左グループに対して生成した分類モデル及び右グループに対して生成した分類モデルを破棄する。生成ノード(破棄された左グループのノードおよび右グループのノードを分割により生成する元となった親のノード)に対して生成された分類モデルに対して、モデルIDを発行する。発行したモデルIDと、当該分類モデルのパラメータとを、モデルパラメータテーブル(図6参照)に格納する。すなわち、ステップS124において、モデル木の葉ノードが確定し、葉ノードに対応付けられる分類モデルが確定する。
ステップS125において、各モデルIDの分類モデルの識別率が予め設定された設定値より小さいかを判定する。設定値より小さい場合は、ステップS126に進み、設定値以上の場合は、ステップS127に進む。
ステップS126において、該当するモデルIDの識別性能に“低い”(当該モデルIDの分類モデルを用いた正誤判定を行わない)を記録する。
ステップS127において、該当するモデルIDの識別性能に“高い” (当該モデルIDの分類モデルを用いた正誤判定を行う)を記録する。
図12は、図11のステップS115で行う分岐基準量の算出方法の詳細フローを示す。
本説明におけるレコードとは学習テーブルにおけるある動作のある時刻におけるデータを示す(すなわち、学習テーブルの1行に該当する)。
ステップS131において、生成ノードに属する学習テーブル(根ノードの場合、S111で取得した全学習データ(全レコード))を分類モデルに適用し、正誤判定を行う。正誤判定の結果と、実際の正誤(レコードの教師ラベル)とを比較し、正誤判定結果と実際の正誤とが異なっているレコード数(不正解のレコード数)を算出する。
ステップS132において、生成ノードに対するスコアを算出する。スコアの例を(A)、(B)及び(C)として以下に示す。
Figure 2021110987
ステップS133において、閾値候補の数だけ、以下のステップS134〜S137を繰り返す。
ステップS134において、閾値候補で分岐条件を生成する。生成した分岐条件を、生成ノードに属する学習テーブルの時刻列に当てはめ、左グループ(時刻<閾値)の学習テーブルと、右グループ(時刻>=閾値)の学習テーブルとに分割する。
ステップS135において、左グループと、右グループとのそれぞれについてステップS136を実行する。
ステップS136において、左グループの学習テーブルを用いて、ステップS132と同じ手法でスコアを算出する。右グループの学習テーブルを用いて、ステップS132と同じ手法でスコアを算出する。
Figure 2021110987
図13は、図11のステップS120で識別率の算出に用いる混合行列を示す。TPは真陽性(True Positive)、FPは偽陽性(False Positive)、FNは、偽陰性(False Negative)は、TNは真陰性(True Negative)である。混合行列は、学習テーブルのある動作のある時刻における実際の正誤と正誤判定結果との組み合わせ別に、レコード数をカウントしたものである。識別率は混合行列を元に、以下(A)〜(4)のいずれかを用いることができる。(A)〜(D)のいずれも値が大きいほど、識別率が高い(識別性能が高い)ことに相当する。
Figure 2021110987
図14は、本実施形態の評価モードにおける動作の全体のフローを示す。以下では時刻tにおける動作を説明する。
ステップS201において、時系列データ取得部11がセンサ部1〜Mから時刻tの特徴量を受信する。受信したM個の特徴量を動作判定部15へ提供する。なお、動作判定部15に送信する前に前処理を実施することも可能である。収集した時系列データを学習データとして今後利用する場合は、時系列データDB_12に、受信したM個の特徴量を時刻tに関連付けて格納する。
ステップS202において、動作判定部15は、時系列データ取得部11より時刻tにおけるM個の特徴量x(t)を取得する。動作判定部15はモデルDB_16に格納されているモデル木を取得する。
モデル木に対して特徴量x(t)を適用することで、適用する分類モデルを特定する。特定した分類モデルの分類性能が“高い”の場合は、特定した分類モデルを用いて正誤判定を行う。すなわち、時刻tにおける目的変数y(t)を算出する。算出されたy(t)に基づき正誤判定の結果を含む出力データを、通知部17に提供する。正誤判定の結果はy(t)の値そのものでもよいし、“正しい”(正解)又は“正しくない”(不正解)のテキストでもよい。
一方、特定した分類モデルの分類性能が“低い”の場合は、分類モデルに基づく正誤判定を行わない。この場合、正誤判定の結果として“正しい”の判定結果を正誤判定の結果として含む出力データを通知部17に提供してもよいし、“NA”など、正誤判定を行わなかったことを示す値を正誤判定の結果として含む出力データを通知部17に提供してもよい。あるいは、何ら値を出力しなくてもよい。
ステップS203において、通知部17は、動作判定部15から取得した時刻tの正誤判定の結果を含む出力データを、予め指定された装置に送信する。
ステップS201〜S203の動作を時刻1,…,Tの各時刻に対して繰り返すことで、予め指定された装置に、各時刻における正誤判定の結果を通知する。
図15は、図14のステップS201で行う時系列データ取得部11の詳細フローを示す。図15におけるフローは1つの時刻(ここでは時間t)における動作を示す。
ステップS211において、時系列データ取得部11は、観測対象に設置したM個のセンサ部のそれぞれからK種類の値(例えば1つのセンサ部が、X軸、Y軸、Z軸の値を検出する場合、K=3である)のデータを取得する。M及びKはそれぞれ1以上の整数である。
ステップS212において、取得したデータに時刻tを対応づける。
ステップS213において、時刻tに対応付けたデータを、動作判定部15に提供する。
時系列データ取得部11において、取得したデータに対して前処理を実施してもよい。この前処理は、一例として、前述したラベル設定部13の学習データ生成時における前処理と同じである。
図16は、図14のステップS202で行う動作判定部15の詳細フローを示す。以下の説明において、現在ノードとは分岐条件が満たされるかの判断の対象となっているノードのことである。
ステップS221において、時系列データ取得部11から特徴量と時刻tとを含むデータを受信する。
ステップS222において、モデルDB_16から、モデル木を取得する。具体的には、分岐条件テーブルとモデルパラメータテーブルとを取得する(図6参照)。
ステップS223において、分岐条件テーブルのノードタイプ列に“根”を持つノードIDを特定し、特定したノードIDを持つノードを、現在ノードとして設定する。
ステップS224において、現在ノードが葉ノードであるかを判定する。具体的には、分岐条件テーブルのノードタイプ列において、現在のノードIDの値が“葉”であるかを判定する。
現在ノードが葉ノードである場合は、ステップS228へ進み、葉ノードでない場合は、ステップS225に進む。
ステップS225において、現在ノードの分岐条件と、上記データに含まれる時刻とに基づき、分岐条件が満たされるかを判断する。
ステップS226において、ステップS225で分岐条件が満たされる場合、trueが付されたアーク(図5の例では左側のアーク)を辿って、子ノードを特定する。特定した子ノードを現在ノードとし、ステップS224に戻る。
ステップS227において、ステップS225で分岐条件が満たされない場合、falseが付されたアーク(図5の例では右側のアーク)を辿って、子ノードを特定する。特定した子ノードを現在ノードとし、ステップS224に戻る。
ステップS228において、現在ノード(葉ノード)に対応づけられた分類モデルの分類性能が高いかを特定する。具体的には、現在ノードのノードIDに対応するモデルIDを分岐条件テーブルから特定する。モデルパラメータテーブルにおいて、特定したモデルIDに対応する分類性能の値を特定する。特定した値が“高い”か“低い”かを特定する。
ステップS229において、ステップS228で分類モデルの分類性能が高いと判断された場合に、分類モデル(モデルパラメータテーブルにおいてモデルIDに対応するモデルパラメータ)と、上記データに含まれる特徴量とに基づき、正誤判定を行う。正誤判定の結果を得る。
ステップS230において、ステップS228で分類モデルの分類性能が低いと判断された場合に、分類モデルによる正誤判定を行うことなく、正誤判定の結果を“正しい”と決定する。あるいは、正誤判定の結果は “未判定”などと、分類モデルによる判定を行わなかったことを示す値を、正誤判定の結果としてもよい。
ステップS231において、ステップS229又はS230で得られた正誤判定の結果を含む出力データを、通知部17へ提供する。
図17は、複数の時刻1〜Tを含む時系列データについて、図14〜図16の動作で判定した結果の例を示す。各時刻について判定結果として“正”又は“誤”が示されている。図17の結果データを表示装置に表示して、本装置のユーザが判定結果を確認できるようにしてもよい。図17の結果データは、区間と、時刻と、判定結果とを含む。区間の列には、時刻が属する時間区間で用いる分類モデルの分類性能の値が格納されている。“高分類性能”の場合は、分類モデルを用いて“正”又は“誤”が判定され、判定の結果が、判定結果の列に格納されている。“高分類性能”の場合は、判定結果の列に一律に“正”が格納されている。
以上、本実施形態によれば、正解又は不正解の教師ラベルが割り当てられた学習用の複数の時系列データに基づき、時間区間ごとに分類モデルを生成する。評価対象となる時系列データにおいて時刻ごとに正誤判定を行う場合に、分類性能の高い分類モデルが生成された時間区間内では当該分類モデルを用いて正誤判定を行う。
分類性能の低い分類モデルが生成された時間区間については分類モデルによる判定を行わない。この場合、常に正誤判定の結果とし“正しい”(正解)を出力するか、あるいは、正誤判定を行わなかったことを示す“未判定”などの情報を正誤判定の結果として出力する。
すなわち、分類性能の低い分類モデルが生成された時間区間では、正解の教師ラベルが割り当てられた時系列データでも、不正解の教師ラベルが割り当てられた時系列データでも同じ又は近似した波形を有しており、正誤を有効に判別できる波形は得られていないといえる。つまり、常に正しい動作が行われた時間区間であると判断できる。このような時間区間については、常に正誤判定の結果として“正しい”を出力して、正誤判定を行わないことで、計算負荷を低減できる。または、正誤判定を行わなかったことを示す“未判定”などの情報を正誤判定の結果として出力することで、正誤判定の精度が低下することを防止できる。
(ハードウェア構成)
図18に、本実施形態に係る情報処理装置101のハードウェア構成を示す。本実施形態に係る情報処理装置101は、コンピュータ装置170により構成される。コンピュータ装置170は、CPU151と、入力インタフェース152と、表示装置153と、通信装置154と、主記憶装置155と、外部記憶装置156とを備え、これらはバス157により相互に接続されている。
CPU(中央演算装置)151は、主記憶装置155上で、情報処理装置101の上述の各機能構成を実現するコンピュータプログラムを実行する。CPU151が、コンピュータプログラムを実行することにより、各機能構成は実現される。
入力インタフェース152は、キーボード、マウス、及びタッチパネルなどの入力装置からの操作信号を、情報処理装置101に入力するための回路である。情報処理装置の入力部の入力機能を担う部分は、入力インタフェース152上に構築されることができる。
表示装置153は、情報処理装置101から出力されるデータ又は情報を表示する。表示装置153は、例えば、LCD(液晶ディスプレイ)、CRT(ブラウン管)、及びPDP(プラズマディスプレイ)であるが、これに限られない。コンピュータ装置170から出力されたデータ又は情報は、この表示装置153により表示することができる。情報処理装置101が備える出力部は、表示装置153上に構築されることができる。
通信装置154は、情報処理装置101が外部装置と無線又は有線で通信するための回路である。通信装置154を介して外部装置から情報を入力することができる。外部装置から入力した情報を、DBに格納することができる。通知部17は、通信装置154上に構築されることができる。
主記憶装置155は、本実施形態の処理を実現するプログラム、及びプログラムの実行に必要なデータ、及びプログラムの実行により生成されたデータなどを記憶する。プログラムは、主記憶装置155上で展開され、実行される。主記憶装置155は、例えば、RAM、DRAM、SRAMであるが、これに限られない。各実施形態における各種DB及び記憶部は、主記憶装置155上に構築されてもよい。
外部記憶装置156は、上記プログラム及びプログラムの実行に必要なデータ、及びプログラムの実行により生成されたデータなどを記憶する。これらのプログラムやデータは、本実施形態の処理の際に主記憶装置155に読み出される。外部記憶装置156は、例えば、ハードディスク、光ディスク、フラッシュメモリ、及び磁気テープであるが、これに限られない。各実施形態における各種DB及び記憶部は、外部記憶装置156上に構築されてもよい。
なお、上述のプログラムは、コンピュータ装置170に予めインストールされていてもよいし、CD−ROMなどの記憶媒体に記憶されていてもよい。また、当該プログラムは、インターネット上にアップロードされていてもよい。
なお、コンピュータ装置170は、プロセッサ151、入力インタフェース152、表示装置153、通信装置154、及び主記憶装置155を、それぞれ1つ又は複数備えてもよいし、プリンタやスキャナなどの周辺機器を接続されていてもよい。
また、情報処理装置101は、単一のコンピュータ装置170により構成されてもよいし、相互に接続された複数のコンピュータ装置170からなるシステムとして構成されてもよい。
<第2実施形態>
第2実施形態では、観測対象が無人搬送車(AGV)である。但し、本実施形態の観測対象は、定期的に同一又はほぼ同一のルートを走行するよう計画される移動体であれば、ドローンやバスのような移動体でもよい。本実施形態の観測対象の動作は、移動体の移動である。
図19は、AGVが移動することにより辿った軌跡(動線)のイメージである。3つのルートR1〜R3が示されている。
AGVは無人搬送車であるため、一般的に、ほぼ決められたルートを、ほぼ決められた速度に従って移動している。工場などの床を移動するAGVは、一例として、時刻情報と、位置情報とで走行すべきルートを管理される。位置情報は、2軸(X軸、Y軸)又は3軸(X軸、Y軸、Z軸)で示される。3軸の例として、工場の天井に設置したレールを利用してZ軸方向にAGVが移動する場合がある。
AGVが計画通りのルートを走行できず、ルートを変更しなければならない場合がある。例えば、ルートに障害物がある、または、他のAGVのルートとコンフリクトする場合等である。ルートの変更が行われた場合、ルートの変更が運用計画に影響がなかった場合は、AGVの動作は正しい動作をしたと判断される。運用計画に影響があった場合は、正しくない動作をしたと判断される。運用計画に影響があったか否かは、例えば到着予定時刻に対して一定時間以上遅れたか否かがある。また、障害物に衝突したか否かがある。その他の例でもよい。
例えば、ルートR3はルート変更のなかった想定通りのルートであるとする。ルートR1では、範囲H1においてルートR3と異なった箇所を走行している。しかしながら、到着予定時刻に対して一定時間以上遅れなかったため、ルートR1の動作は正しい動作であると判断される。ルートR2でも、範囲H2においてルートR3と異なった箇所を走行している。しかしながら、到着予定時刻に対して一定時間以上遅れたため、ルートR2の動作は、正しくない動作(誤った動作)であると判断される。
本装置のユーザは、AGVの走行を観察し、予定通りのルートをAGVが走行すれば、正解の教師ラベルを割り当てる。予定外のルートを通過したが、運用計画に影響がない場合も、正解の教師ラベルを割り当てる。予定外のルートを通過し、かつ運用計画に影響があった場合は、不正解の教師ラベルを割り当てる。教師ラベルを割り当てる方法は第1実施形態と同様である。
図20は、第2実施形態に係る情報処理システムである警告システムのブロック図である。図20の警告システムは、モデル木をエッジコンピューティングのようにAGV側に搭載することで、AGVの運行を円滑に進めるためのシステムである。1台以上のAGV50と、コンピュータ57とを備える。AGV50は、センサ部1〜M、通知部17、モデル木(分岐条件テーブル51、モデルパラメータテーブル52)及び演算部53を備える。演算部53はCPU又はマイコン等であり、図1の時系列データ取得部11及び動作判定部15の機能を備える。コンピュータ57が、AGV50のセンサ部1〜Mから時系列データを収集する。ユーザにより時系列データに教師ラベルを割り当てる。コンピュータ57は、教師ラベル付きの時系列データに基づき、分岐条件テーブル51及びモデルパラメータテーブル52を生成して、AGV50に提供する。
AGV50は、コンピュータ57又は図示しない管理装置により指示されたルートを走行する。演算部53は、時刻毎にセンサ部1〜Mで取得されるデータと、モデル木に基づき、正誤判定を行うか決定する。正誤判定を行う場合には、モデルパラメータテーブル52に基づき、該当する分類モデルを用いて正誤判定を行う。正誤判定を行わない場合は、正誤判定の結果として“正解”又は“未判定”などのデータを出力する。
通知部17は、正誤判定の結果として不正解の結果が得られた場合、警告データを出力する。例えばランプを発行させる、音を出すなどがある。AGVのルートを人間が横切るなどしてAGVが人間を避け、運用計画に影響が出るルートへAGVが入った直後の場合などは、警告により人間を即座にルートから離れさせ、AGVが本来のルートに戻れるようにする。これによりAGVが運用計画に影響が出るルート変更を行わなくて済むようになる。一方、正誤判定の結果として正解の結果が得られた場合は、ルートに変更が生じる場合であっても、運用計画に影響はないため、人間の歩行を優先させることが可能である。
<第3実施形態>
図21は、第3実施形態に係る情報処理システムである分類システム60のブロック図である。分類システム60は、人間であるリハビリ実施者の動作の正誤判定を行う。分類システム60は、時系列データ取得部11、学習部66、動作判定部67、データ記憶部65を備えている。学習部66は、図1のラベル設定部13及びモデル生成部14の機能を含む。動作判定部67は、図1の動作判定部15及び通知部17の機能を備える。データ記憶部65は、図1の時系列データDB_12及びモデルDB_16の機能を備えている。
リハビリ実施者63はセンサ部1〜Mを身体の各所に装着している。センサ部1〜Mは、例えば加速度センサ、速度センサ、磁気センサなどを含む。リハビリの動作の実施毎に、動作の軌跡の波形データ(時系列データ)を時系列データ取得部11が取得する。
専門員又は監督者等の観察者64は、リハビリ実施者の動作を観察し、動作の正誤を判断し、判断した結果として正解又は不正解を示す教師ラベルを入力端末61から入力する。学習部66は、教師ラベルを時系列データに対応づけて、データ記憶部65に格納する。
学習部66は、教師ラベルが割り当てられた時系列データに基づき、モデル木を生成する。
リハビリ実施者63は、観察者64が不在の状態でセンサ部1〜Mを装着し、リハビリ動作を行う。時系列データ取得部11は、センサ部1〜Mから動作の波形データを受信する。時刻毎に、モデル木を用いて、正誤判定を行うかを決定する。正誤判定を行う場合には、該当する分類モデルを用いて正誤判定を行う。正誤判定を行わない場合は、正誤判定の結果として“正解”又は“未判定”などのデータを出力する。正誤判定の結果が不正解であれば、出力端末62に誤りを示す情報を出力する。正誤判定の結果が正解であれば、リハビリ実施者63の動作は正しいことを示す情報を出力端末62に出力する。出力端末62は、リハビリ実施者63又は観察者64の端末でもよいし、データを蓄積するサーバでもよい。
<第4実施形態>
家庭や工場等における電力の需要量は、条件が共通の場合、類似した時系列データが得られやすい。条件としては、曜日や時間帯などの時刻条件、都市部や過疎部などの位置条件、気温などの気象条件がある。そこで、このような条件に基づいて、決定木又はクラスタリング手法により、類似している時系列データにグループ化し、グループごとに、電力需要予測を行う方法がある。電力需要予測は、過去の需要量から将来の需要量を予測する。グループごとに予測を行うことで、予測の精度を高めることができる。
しかしながら、イベントが起きた日などの特異日又はイベントが起きた時間帯(特異時間帯)では、条件が共通していても、類似した時系列データが得られるとは限らない。この場合、電力需要予測の精度が低下する可能性がある。そこで、本実施形態は、そのような決定木又はクラスタリング手法を用いた電力需要予測手法を第1実施形態と組み合わせることで、特異日・特異時間帯の分析を容易にする手法を提案する。これにより、電力需要予測の精度を向上させることができる。本実施形態での観測対象は電力需要量であり、観測対象の動きは、電力需要量の変化である。
図22は、電力需要予測における決定木の一例を示す。斜線付きの矩形で示す内部ノードには、時刻条件、位置条件及び気象条件の少なくとも1つの条件を含む分岐条件が含まれる。電力需要量(例えば1日分の電力需要量)の時系列データが、決定木の各内部ノードで時刻条件、位置条件及び気象条件の少なくとも1つを満たすかを判定されることで、いずれかの葉ノードに分類される。複数の時系列データについて同様に分類することで、各葉ノードには、類似した時系列データ群が同じグループとして割り当てられる。葉ノードは、白抜きの矩形で示される。
同一のグループに割り当てられた時系列データを用いて、過去の電力需要量から将来の電力需要量を予測する電力需要予測モデルを生成する。グループの数だけ、電力需要モデルが生成される。モデルは、線形回帰モデル、重回帰モデル、ロジスティック回帰モデル、ニューラルネットワークなど、任意の回帰モデルでもよいし、それ以外のモデルでもよい。
同一のグループごとに、予測対象となる複数の時系列データについて、電力需要モデルの予測値と、電力需要の実績値とを比較し、予測値と実績値の差分である誤差を算出する。誤差が閾値未満の時系列データは、正解の教師ラベル(予測を外さなかったことを示すラベル)を割り当てる。誤差が閾値以上の時系列データには、不正解の教師ラベル(予測を外したことを示すラベル)を割り当てる。
上述した決定木又はクラスタリング手法によるグループ化、需要予測モデルの生成は、一般的なコンピュータによって実行することができる。
同一のグループごとに、教師ラベルが割り当てられた時系列データを、第1実施形態の学習用の時系列データとして用いて、モデル木を生成する。モデル木の各葉ノードに対応づけられた分類モデルの分類性能に基づき、分類性能が高い時間区間と、分類性能が低い時間区間とを特定する。分類性能が高い時間区間において、時系列データをコンピュータで解析することにより、予測を外した日又は時間帯の波形の傾向を調べることができる。
<第5実施形態>
図23及び図24は、第5実施形態に係るモデル木の更新のフローを示す。第5実施形態では、第1実施形態で生成されたモデル木を、新たな取得される時系列データによって更新する。更新により、モデル木の階層が深くなる方向に内部ノードが追加される。モデル木の既に存在する内部ノードの分岐条件は維持される。時系列データはストリーム型式で受け取る場合を想定する。時刻ごとに本フローの処理を行う。本フローの説明で使用する用語を以下の数式又は記号で定義する。
Figure 2021110987
本フローの概要は以下の通りである。学習データ(時系列データ)の先頭から1時刻分のデータであるインスタンスが追加される都度、本フローが実行される。
新たに追加するノードの分岐条件を決定する際に基準となる分岐基準量を算出する。算出方法は、第1実施形態と同じである。分岐条件の判定対象となる受信済みのインスタンス全体について、最大の分岐基準量の分岐条件と、2番目に大きい分岐基準量の分岐条件との差を計算する。計算した差が、Hoeffding Boundの条件で算出される値より大きい場合に、最大の分岐基準量の分岐条件でモデル木を分岐する(当該分岐条件を含む新たな内部ノードを追加する)。
Figure 2021110987
以下、図23及び図24に基づき、本実施形態のフローを説明する。
ステップS301において、動作判定部15は、モデルDB_16からモデル木を読み込む。
ステップS302において、モデル生成部14は、時刻i=1にセットする。フローの開始時は、時刻i=1は、時系列データの最初の時刻に対応する。
ステップS303において、時系列データの入力があるかを判断する。入力がなければ、本処理を終了する。
ステップS304において、ステップS303で時系列データの入力がある場合は、時刻iのデータの特徴量を算出する。
ステップS305において、モデル生成部14は、算出した特徴量を用いて、モデル木により時刻iのデータを分類する。
ステップS306において、時刻iを用いて分岐条件の閾値の候補を生成する。閾値の候補の生成方法は、第1実施形態と同様でよい。生成する閾値の候補は、時刻iのデータが分類された葉ノードと、当該葉ノードの親ノードとの間に、新たな分岐条件ノードを追加する場合に、当該追加するノードの分岐条件で用いるものである。
ステップS307において、i=1かを判断する。
ステップS308において、i=1の場合、i=i+1として、次の時刻のデータを読み込む。
ステップS309において、i=1でない場合、閾値の候補と、モデル木で分類された葉ノードに対応づけられた分類モデルを用いて、分岐基準量を算出する。分岐基準量の算出方法は第1実施形態と同じである。
ステップS310において、i番目の時刻の分岐基準量をメモリに保存する。
ステップS311において、i=2かを判断する。i=2の場合、ステップS308でi=i+1として、次の時刻のデータを読み込む。
ステップS312において、i=2でない場合(つまりiが3以上の場合)、これまで算出した分岐基準量のうち、分岐基準量の最大値と、2番目に大きい分岐基準量との差を算出する。算出した差が、上述のHoeffding Boundの条件の値であるε未満かを判断する。差がε未満の場合、ステップS308でi=i+1として、次の時刻のデータを読み込む。
図24のステップS313において、差がε以上の場合、i番目の時刻の特徴量をメモリに記憶する。
最大の分岐基準量が得られた閾値の候補の時刻を含む分岐条件を生成し、分岐条件を含む内部ノードを追加する。当該分岐条件に含まれる時刻より前と、当該時刻以降とで、データ(インスタンス)を分割し、2つのグループを生成する。各グループについて、ステップS305で特定された分類モデルを用いて、モデル誤差(分類モデルによる予測値と真値との差)を計算する。モデル誤差の統計値(平均値、中央値、最大値、又は最小値)を計算する。
ステップS317において、2つのグループのうち、モデル誤差の統計値が大きい方のグループは、グループに属する特徴量で新たに該当グループの分類モデルを生成する。
ステップS318において、2つのグループのうち、モデル誤差の統計値が小さい方のグループは、元の分類モデル(ステップS305で特定した分類モデル)を用いる。
ステップS319において、メモリ上でのデータ(インスタンス)、閾値、分岐基準量を消去する。
ステップS320において、i=1にリセットする。ステップS303に戻り、次の時刻のデータがなければ、終了する。次のデータがあれば、以上のステップを繰り返す。
図25は、本実施形態により第1実施形態で用いた図5のモデル木を更新した例を模式的に示す。「経過時間<A」の分岐条件を含む内部ノードと、分類モデルfが対応づいた葉ノードとの間に、「経過時間<E」の内部ノードが追加されている。追加された内部ノードの2つの子ノード(葉ノード)のうちの一方には元の分類モデルfが対応付けられ、他方の葉ノードには新たに生成された分類モデルfが対応づけられている。
本実施形態では、オンラインでリアルタイムに更新を行ったが、バッチ処理も可能である。
なお、本発明は上記各実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記各実施形態に開示されている複数の構成要素を適宜組み合わせることによって種々の発明を形成できる。また例えば、各実施形態に示される全構成要素からいくつかの構成要素を削除した構成も考えられる。さらに、異なる実施形態に記載した構成要素を適宜組み合わせてもよい。
101:情報処理装置
1〜M:センサ部
11:時系列データ取得部
12:時系列データDB
13:ラベル設定部
14:モデル生成部
15:動作判定部(決定部)
16:モデルDB
17:通知部
51:分岐条件テーブル
52:モデルパラメータテーブル
53:演算部
50:AGV
57:コンピュータ
60:分類システム
61:入力端末
62:出力端末
63:リハビリ実施者
64:観察者
66:学習部
67:動作判定部
65:データ記憶部
151:プロセッサ(CPU)
152:入力インタフェース
153:表示装置
154:通信装置
155:主記憶装置
156:外部記憶装置
157:バス
170:コンピュータ装置

Claims (25)

  1. 観測対象から得られた時系列データに含まれる第1時刻のデータに基づいて、前記第1時刻の前記観測対象の状態を推定する推定部
    を備えた情報処理装置。
  2. 前記時系列データは、前記観測対象の動きの時系列データである
    請求項1に記載の情報処理装置。
  3. 前記推定部は、前記時系列データにおける前記第1時刻を含む時間区間に基づいて、前記観測対象の状態を推定する
    請求項1又は2に記載の情報処理装置。
  4. 前記推定部は、前記第1時刻を含む前記時間区間に対応づけられた分類モデルを用いて前記観測対象の状態を推定する
    請求項3に記載の情報処理装置。
  5. 前記分類モデルは、前記観測対象から得られたデータが割り当てられる変数と、前記観測対象の状態を表す値とを対応づけており、
    前記推定部は、前記分類モデルと、前記第1時刻の前記データとに基づいて前記観測対象の状態を推定する
    請求項4に記載の情報処理装置。
  6. 前記推定部は、前記第1時刻の状態のクラスを判定する
    請求項4又は5に記載の情報処理装置。
  7. 前記クラスは、前記第1時刻の状態が正しい第1クラス又は前記第1時刻の状態が誤っている第2クラスである
    請求項6に記載の情報処理装置。
  8. 前記時系列データは、少なくとも1つの第1時間区間と、少なくとも1つの第2時間区間とを含み、
    前記推定部は、前記第1時刻が前記第1時間区間に含まれる場合に前記観測対象の状態の推定を行う
    請求項6又は7に記載の情報処理装置。
  9. 前記推定部は、前記第1時刻が前記第2時間区間に含まれる場合に前記観測対象の状態の推定を行わない
    請求項8に記載の情報処理装置。
  10. 前記時系列データは、複数の前記第1時間区間を含み、
    複数の前記第1時間区間に、複数の前記分類モデルが対応づいており、
    前記推定部は、前記第1時刻を含む前記第1時間区間に対応する前記分類モデルを用いて、前記観測対象の状態の推定を行う
    請求項8又は9に記載の情報処理装置。
  11. 前記第2時間区間に、前記分類モデルが対応づいており、
    前記第1時間区間は、前記分類モデルの識別性能が高い時間区間であり、
    前記第2時間区間は、前記分類モデルの識別性能が低い時間区間である
    請求項10に記載の情報処理装置。
  12. 複数の時系列データと、前記複数の時系列データに割り当てられた複数のクラスとに基づいて、前記第1時間区間の推定と、前記分類モデルの生成とを行う
    請求項8〜11のいずれか一項に記載の情報処理装置。
  13. 複数のノードと、時刻に関する分岐条件と、前記複数のノードのうち複数の末端ノードに対応づいた複数の前記分類モデルと、を含むモデル木を備え、
    前記推定部は、前記第1時刻と前記モデル木を用いて、前記観測対象の状態の推定に用いる前記分類モデルを推定する
    請求項10又は11のいずれか一項に記載の情報処理装置。
  14. 複数の時系列データと、前記複数の時系列データに割り当てられた複数のクラスとに基づいて、前記モデル木を生成又は更新する
    請求項13に記載の情報処理装置。
  15. 前記時系列データを取得するデータ取得部
    を備えた請求項1〜14のいずれか一項に記載の情報処理装置。
  16. 前記観測対象の状態は、前記観測対象の動きである
    請求項2〜14のいずれか一項に記載の情報処理装置。
  17. 前記観測対象の動きは、人間のリハビリテーション動作である
    請求項16に記載の情報処理装置。
  18. 前記観測対象の動きは、移動体の移動である
    請求項16に記載の情報処理装置。
  19. 前記時系列データは、前記観測対象の動きの軌跡データである
    請求項1〜18のいずれか一項に記載の情報処理装置。
  20. 前記観測対象は、需要量である
    請求項1〜16のいずれか一項に記載の情報処理装置。
  21. 前記観測対象に設置されたセンサ部から前記時系列データを取得するデータ取得部
    を備えた請求項1〜20のいずれか一項に記載の情報処理装置。
  22. 前記観測対象の状態を推定することは、前記観測対象の状態を正誤判定することである
    請求項1〜21のいずれか一項に記載の情報処理装置。
  23. コンピュータが
    観測対象から得られた時系列データに含まれる第1時刻のデータに基づいて、前記第1時刻の前記観測対象の状態を推定する、
    情報処理方法。
  24. 観測対象から得られた時系列データに含まれる第1時刻のデータに基づいて、前記第1時刻の前記観測対象の状態を推定するステップ
    をコンピュータに実行させるためのコンピュータプログラム。
  25. 観測対象から得られた時系列データに含まれる第1時刻のデータに基づいて推定した、前記第1時刻の前記観測対象の状態を表示する情報処理装置。
JP2020000550A 2020-01-06 2020-01-06 情報処理装置、情報処理方法及びコンピュータプログラム Active JP7244443B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2020000550A JP7244443B2 (ja) 2020-01-06 2020-01-06 情報処理装置、情報処理方法及びコンピュータプログラム
US17/015,279 US11874854B2 (en) 2020-01-06 2020-09-09 Information processing apparatus, information processing method, and computer program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020000550A JP7244443B2 (ja) 2020-01-06 2020-01-06 情報処理装置、情報処理方法及びコンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2021110987A true JP2021110987A (ja) 2021-08-02
JP7244443B2 JP7244443B2 (ja) 2023-03-22

Family

ID=76654353

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020000550A Active JP7244443B2 (ja) 2020-01-06 2020-01-06 情報処理装置、情報処理方法及びコンピュータプログラム

Country Status (2)

Country Link
US (1) US11874854B2 (ja)
JP (1) JP7244443B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021116899A1 (en) * 2019-12-13 2021-06-17 Marvell Asia Pte Ltd. Automotive data processing system with efficient generation and exporting of metadata

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019066989A (ja) * 2017-09-29 2019-04-25 三菱重工業株式会社 評価システム、評価方法及びプログラム

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011036809A1 (ja) 2009-09-28 2011-03-31 株式会社 東芝 異常判定システムおよびその方法
CN103429150B (zh) 2011-03-11 2016-03-16 皇家飞利浦有限公司 用于监测生理信号的监测装置
JP6181360B2 (ja) 2012-08-30 2017-08-16 アクセンチュア グローバル サービシズ リミテッド マーケティング装置、マーケティング方法、プログラム、及び記録媒体
US10136249B2 (en) 2015-07-24 2018-11-20 Hitachi, Ltd. Information distribution apparatus and method
JP2017055913A (ja) 2015-09-15 2017-03-23 株式会社東芝 動作フォーム判定装置、判定方法、判定プログラム、判定システム
US11093819B1 (en) * 2016-12-16 2021-08-17 Waymo Llc Classifying objects using recurrent neural network and classifier neural network subsystems
JP6875179B2 (ja) * 2017-04-07 2021-05-19 株式会社日立製作所 システム分析装置、及びシステム分析方法
US11386274B2 (en) * 2017-05-10 2022-07-12 Oracle International Corporation Using communicative discourse trees to detect distributed incompetence
CN111247565B (zh) * 2017-09-06 2022-06-03 瑞士再保险有限公司 用于移动远程信息处理装置的电子日志记录和跟踪检测系统及其对应方法
US20190042956A1 (en) * 2018-02-09 2019-02-07 Intel Corporation Automatic configurable sequence similarity inference system
US10965562B2 (en) * 2018-05-07 2021-03-30 Cisco Technology, Inc. Dynamically adjusting prediction ranges in a network assurance system
US20200166909A1 (en) * 2018-11-20 2020-05-28 Relativity Space, Inc. Real-time adaptive control of manufacturing processes using machine learning
US11635764B2 (en) * 2019-02-22 2023-04-25 Uatc, Llc. Motion prediction for autonomous devices
US11548533B2 (en) * 2019-03-23 2023-01-10 Uatc, Llc Perception and motion prediction for autonomous devices
US20200342968A1 (en) * 2019-04-24 2020-10-29 GE Precision Healthcare LLC Visualization of medical device event processing
US11714658B2 (en) * 2019-08-30 2023-08-01 Microstrategy Incorporated Automated idle environment shutdown
US10998101B1 (en) * 2019-12-15 2021-05-04 Bao Tran Health management

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019066989A (ja) * 2017-09-29 2019-04-25 三菱重工業株式会社 評価システム、評価方法及びプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
高 明淑 ほか: "「決定木に基づく在宅リハビリ実施支援システムの提案 −サンディング動作を対象とした検討−」", 電気学会論文誌C 電子・情報・システム部門誌, vol. 第139巻, 第7号, JPN6022035148, 1 July 2019 (2019-07-01), pages 766 - 773, ISSN: 0004854087 *

Also Published As

Publication number Publication date
US11874854B2 (en) 2024-01-16
US20210209132A1 (en) 2021-07-08
JP7244443B2 (ja) 2023-03-22

Similar Documents

Publication Publication Date Title
US11403526B2 (en) Decision making for autonomous vehicle motion control
EP3035314B1 (en) A traffic data fusion system and the related method for providing a traffic state for a network of roads
Gillani et al. Unpacking the “Black Box” of AI in education
WO2021130926A1 (ja) 人流予測装置、人流予測方法、及び人流予測プログラム
Liu et al. Understanding sequential decisions via inverse reinforcement learning
ChikkaKrishna et al. Short-term traffic prediction using fb-prophet and neural-prophet
CN113253709B (zh) 一种适用于轨道交通车辆健康诊断方法及装置
JP7244443B2 (ja) 情報処理装置、情報処理方法及びコンピュータプログラム
Al-Tameemi et al. Predictive learning analytics in higher education: Factors, methods and challenges
CN114495486B (zh) 一种基于层次强化学习的微观交通流预测系统及方法
Mathibela et al. Can priors be trusted? learning to anticipate roadworks
Papathanasopoulou et al. Flexible car-following models incorporating information from adjacent lanes
JP7214672B2 (ja) 情報処理装置、情報処理方法及びコンピュータプログラム
Mazurenko et al. Development of intelligent traffic control system project
JP2022026378A (ja) 車両事故予測システム、車両事故予測方法、車両事故予測プログラム、及び、学習済みモデル生成システム
WO2023032251A1 (ja) 情報処理装置、情報処理方法、プログラムおよび移動体
CN117476250B (zh) 基于多目标跟踪的流行病调查预测方法、装置及可读介质
CN118071040B (zh) 一种公路施工的安全检查评价方法及系统
Lyubchenko et al. Any Logic-Based Analysis of Maintenance Efficiency of Aging Railway Telecommunication Equipment
Williams A Framework for Real-Time Bus Travel Time Prediction with Reliability Sensitivity
Anderson Interpretable and Realtime Predictions of Social Interactions for Autonomous Vehicles
Shapouri UNDERSTANDING AND MODELING DRIVERS’EN-ROUTE DIVERSION BEHAVIOR DURING CONGESTION
Ye Vision-Guided Policy Learning for Complex Tasks
Motamedidehkordi Data-driven Modeling of Lane Changing on Freeways: Application for Automated Vehicles in Mixed-traffic
Li Uncertainty Quantification and Predictability Analysis for Traffic Forecasting at Multiple Scales

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210910

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220729

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220823

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221019

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230210

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230309

R151 Written notification of patent or utility model registration

Ref document number: 7244443

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151