JP7491653B2 - 深層コンター相関予測 - Google Patents

深層コンター相関予測 Download PDF

Info

Publication number
JP7491653B2
JP7491653B2 JP2022532753A JP2022532753A JP7491653B2 JP 7491653 B2 JP7491653 B2 JP 7491653B2 JP 2022532753 A JP2022532753 A JP 2022532753A JP 2022532753 A JP2022532753 A JP 2022532753A JP 7491653 B2 JP7491653 B2 JP 7491653B2
Authority
JP
Japan
Prior art keywords
diagnostic
data
plots
generating
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022532753A
Other languages
English (en)
Other versions
JP2023505144A (ja
Inventor
ボーマン、アーロン
キーン、マーティン
ベンダー、マイケル
ガンシ、ジュニア、ジョン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2023505144A publication Critical patent/JP2023505144A/ja
Application granted granted Critical
Publication of JP7491653B2 publication Critical patent/JP7491653B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Business, Economics & Management (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Operations Research (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Databases & Information Systems (AREA)
  • Algebra (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)

Description

本発明は、一般に予測に関する。より具体的には、本発明は、深層コンター相関予測(deep contour-correlated forecasting)に関する。
将来の事象を予測する能力が、今日のビジネス環境において望まれる。将来の傾向に関する信頼できる情報は大いに役立つので、多くの組織は、将来の傾向を予測し、それらの傾向が最終的に生じ得る効果を分析しようとして、相当な量の人的資源及び金銭的資源を費やしている。従って、予測は、多くの計画プロセスにおいて重要で望ましいツールである。ビジネス事象を予測することは、典型的には、履歴データを収集すること及びそのデータに対して予測モデルを適用することを含む。
予測モデルを作成するために頻繁に用いられる2種類のモデルは、指数平滑化モデル及び自己回帰統合移動平均(ARIMA)モデルを含む。指数平滑化モデルは、時間にわたる一連の値の挙動を、何故それらの値がそのように振る舞うのかを理解しようとせずに、記述するものである。当技術分野には、既知の幾つかの異なる指数平滑化モデルが存在する。反対に、ARIMA統計モデルは、モデル製作者が、時系列における過去の値が時系列の将来の値を予測する際の役割を指定することを可能にする。ARIMAモデルはまた、モデル製作者が、予測される時系列の挙動を説明するのに役立ち得る予測因子を含めることを可能にする。
傾向又は時系列における将来の値を効率的に予測するためには、時系列を記述する適切なモデルを作成する必要がある。時系列における過去の値を最も正確に反映するモデルを作成することは、予測プロセスの最も難しい部分である。過去のデータからより良好なモデルを導き出すことは、より良好な予測に対する鍵となる。これまでは、時系列における値を反映するために選ばれたモデルは比較的単純で容易なものであるか、又は、モデルを作成する人が実質的にすべて行った長時間の退屈な数学的解析の結果であった。従って、モデルは、比較的単純で、時系列における将来の値の十分なインジケータにはならないことが多いか、又は、非常に労力とコストがかかり、より簡単なモデルを超える成功の機会があまり多くないものであった。最近では、改善された電子コンピュータ・ハードウェアの利用可能性が、予測のモデル化の多くをコンピュータで迅速に行うことを可能にした。しかし、潜在的には、時系列を比較することができる無数のモデルが存在するが、予測のための従来のコンピュータ・ソフトウェアの解決策は、履歴データを評価するモデルの数が制限され、典型的には少数であるため、限定的であった。
実施形態は、コンピュータ・システムを使用して相関による予測を生成する。一実施形態は、プロセッサにより、第1の入力変数の履歴値についての入力データを受け取ることを含む。この実施形態はさらに、プロセッサにより、第1の入力変数の履歴値を用いて、第1の入力変数の将来値についての予測データを作成することを含む。この実施形態はさらに、プロセッサにより、予測データの診断分析に基づいて診断データを生成することを含む。この実施形態はさらに、プロセッサにより、診断データに基づいて第1の診断値を決定する第1の認識プロセスからの第1の診断値を含む第1の診断変数を作成することを含む。この実施形態はさらに、プロセッサにより、第1の診断変数と第2の診断変数との間の相関を識別することによって特徴ベクトルを決定する第2の認識プロセスに基づいて、特徴ベクトル生成することを含む。この実施形態はさらに、プロセッサにより、認識予測プロセスへの入力として特徴ベクトルを用いて、最終予測を生成することを含む。この態様の他の実施形態は、対応するコンピュータ・システム、装置、及び、各々が実施形態の行為を実行するように構成された1つ又は複数のコンピュータ・ストレージ・デバイスに記録されたコンピュータ・プログラムを含む。
一態様により、コンピュータ実施の方法が提供され、この方法は、プロセッサにより、第1の入力変数の履歴値についての入力データを受け取ることと、プロセッサにより、第1の入力変数の履歴値を用いて第1の入力変数の将来値についての予測データを作成することと、プロセッサにより、予測データの診断分析に基づいて診断データを生成することと、プロセッサにより、診断データに基づいて第1の診断値を決定する第1の認識プロセスからの第1の診断値を含む第1の診断変数を作成することと、プロセッサにより、第1の診断変数と第2の診断変数との間の相関を識別することによって特徴ベクトルを決定する第2の認識プロセスに基づいて、特徴ベクトルを生成することと、プロセッサにより、特徴ベクトルを認識予測プロセスへの入力として用いて、最終予測を生成することとを含む。
別の態様により、分類器予測用の対比情報を生成するためのコンピュータ使用可能プログラム製品であって、コンピュータ可読ストレージ・デバイスと、ストレージ・デバイスに格納されたプログラム命令とを備えるコンピュータ使用可能プログラム製品が提供され、格納されたプログラム命令は、プロセッサにより、第1の入力変数の履歴値についての入力データを受け取るためのプログラム命令と、プロセッサにより、第1の入力変数の履歴値を用いて第1の入力変数の将来値についての予測データを作成するためのプログラム命令と、プロセッサにより、予測データの診断分析に基づいて診断データを生成するためのプログラム命令と、プロセッサにより、診断データに基づいて第1の診断値を決定する第1の認識プロセスからの第1の診断値を含む第1の診断変数を作成するためのプログラム命令と、プロセッサにより、第1の診断変数と第2の診断変数との間の相関を識別することによって特徴ベクトルを決定する第2の認識プロセスに基づいて、特徴ベクトルを生成するためのプログラム命令と、プロセッサにより、特徴ベクトルを認識予測プロセスへの入力として用いて、最終予測を生成するためのプログラム命令と、を含む。
別の態様により、プロセッサと、コンピュータ可読メモリと、コンピュータ可読ストレージ・デバイスと、メモリを介してプロセッサによって実行のための、ストレージ・デバイスに格納されたプログラム命令とを備えるコンピュータ・システムが提供され、格納されたプログラム命令は、プロセッサにより、第1の入力変数の履歴値についての入力データを受け取るためのプログラム命令と、プロセッサにより、第1の入力変数の履歴値を用いて第1の入力変数の将来値についての予測データを作成するためのプログラム命令と、プロセッサにより、予測データの診断分析に基づいて診断データを生成するためのプログラム命令と、プロセッサにより、診断データに基づいて第1の診断値を決定する第1の認識プロセスからの第1の診断値を含む第1の診断変数を作成するためのプログラム命令と、プロセッサにより、第1の診断変数と第2の診断変数との間の相関を識別することによって特徴ベクトルを決定する第2の認識プロセスに基づいて、特徴ベクトルを生成するためのプログラム命令と、プロセッサにより、特徴ベクトルを認識予測プロセスへの入力として用いて最終予測を生成するためのプログラム命令とを含む。
次に、本発明の好ましい実施形態が、単なる例として、添付の図面を参照しながら説明されることになる。
例示的な実施形態を実装することができるデータ処理システムのネットワークのブロック図を示す。 例示的な実施形態を実装することができるデータ処理システムのブロック図を示す。 一実施形態による予測環境を提供するための例示的な構成のブロック図を示す。 一実施形態による予測環境を提供するための診断系列生成器の例示的な一構成の図を示す。 一実施形態による例示的な診断プロットの図を示す。 一実施形態による特徴ベクトル生成器のブロック図を示す。 一実施形態による認識予測器のブロック図を示す。 一実施形態による深層コンター相関予測の例示的なプロセスのフローチャートを示す。
例示的な実施形態は、予測を生成するとき、より正確な予測を生ずるために、影響力のある時間変化因子との相関を考慮する必要性があることを認識する。また、従来の予測アルゴリズムは自己回帰型であるので、予測における不正確性が伝搬し、予測の残り部分に影響を及ぼす可能性がある。例えば、非限定的なシナリオにおいて、予測アルゴリズムは、必要以上に大きなスケーリングの不必要な経費を負うことなく需要が満たされることを保証するために、スケーラビリティ・プランニングを可能にする、ウェブ・アプリケーションのためのネットワーク・トラフィックの予測を提供する。しかし、この予測アルゴリズムは、従来の経験に従って、将来の値を、それ自体の過去の値に基づいて生成するように構成されたものである。その結果、それは、ウェブ・アプリケーションの性質に応じて、需要に影響し得る他の変化する因子、例えば、IOパターン、供給されるデータのサイズ、トラフィックの位置、又は、場合により、さらに天候及び休日の近さなどとの相関を探求しない。その結果、サーバ割り当てが最適より小さく、例えば、時々サーバ・リソース割り当てが不足し、不十分なユーザ体験につながる。
不正確な予測はさらに、不必要な費用をもたらす可能性があり、例えば、小売環境では、多すぎる在庫を購入することが、付加的な費用又は過度の商品の廃棄による損失をもたらす可能性があり、反対に、少なすぎる在庫を購入することが、売り切れ商品に関する販売機会の損失をもたらす可能性がある。同様に、飲食業において、食品需要の予測は、ユーザ体験の低下をもたらす過小配分又は不必要な費用を招く過剰配分において、過小購入のために食品廃棄又は機会損失による金銭的な損失をもたらす可能性がある。
例示的な実施形態は、現在利用可能な予測ツール又は解決策が、これらのニーズに向けられたものではなく、これらのニーズに対する適切な解決策を提供するものでもないことを認識する。本発明を説明するのに用いられる例示的な実施形態は、一般に、上記の問題及び、他の種々の因子による将来の値への影響を考慮するプロセスに従って正確に将来の値を予測することに関係する他の問題を、処理し解決する。
例示的な実施形態は、より正確でより長期の予測を作成する能力を向上させる必要があることを認識する。幾つかの実施形態において、認識予測システムは、多次元属性空間を表す入力データを含む予測変数を受け取る。入力データは、それぞれの次元に対応する予測変数の時系列ベクトル又はバンドに編成される。認識予測システムは、入力データの各々のバンドについての時系列予測を生成し、結果として得られる予測に対して診断テストを実行してエラーをチェックする。認識予測システムは、次に、診断テストの結果を用いて、それぞれの予測診断変数を時系列アレイの形式で生成する。次に、認識予測システムは、予測診断変数を入力として受け取り、もしあればバンドの各々の対の間の原因-結果関係に関連する相関値を計算する。認識相関プロセスは、予測診断変数の値を調節し、調節された値を、それぞれのバンドの各々についての新しい時系列アレイとして出力する。相関調節された新しいアレイは、ニューラル・ネットワークに入力され、初期の時系列予測とは異なり、ここでは種々の入力バンドの間の相関を考慮する更新された時系列予測を生成する。
一実施形態において、入力データは、各々がそれぞれの予測変数に対応する複数の一変量バンドに編成される。幾つかの実施形態において、入力データは、物理的属性を電気信号に変換するセンサなどのセンサに由来する。幾つかの実施形態において、入力データは、コンピュータ・メモリ内に格納されるコンピュータ生成ログ、例えば、サーバ・ログ、オペレーティング・システム・ログ、及びアプリケーション・ログに由来する。幾つかの実施形態において、入力データは、センサ、ログ、及び任意の他の所望のデータ・ソースの組み合わせに由来する。
幾つかの実施形態において、入力データは、1つの予測変数の将来の値が他の予測変数の将来の値に影響を及ぼすことになると予想される根拠がある、二つ又はそれ以上の予測変数を表すデータを含む。例えば、一実施形態において、天候予測システムは、例えば、温度、露点、相対湿度、降水量、風速及び風向、視界、及び大気圧などの複数の気象関連予測変数に編成された履歴データを、天候センサー及び他のデータ・ソースから受け取り、格納する。これらの予測変数の各々は、変数自体の履歴データに基づいて、単独で予測することができる。しかし、これらの予測変数の幾つかの値は、他の変数の値によって影響されること、例えば、所与の場所における降水量及び風速が、同じ場所における大気圧に基づいて増加又は減少する可能性があることが知られている。従って、幾つかの実施形態において、認識予測システムは、予測を生成するとき、それらの変数の間の相関を考慮する。
幾つかの実施形態において、認識予測システムは、診断系列生成器、特徴ベクトル生成器、及び認識予測器を含む。一実施形態において、診断系列生成器は、予測変数についての履歴時系列データを受け取り、予測変数についての時系列予測を生成する。一実施形態において、特徴ベクトル生成器は、予測変数についての時系列予測、及び、1つ又は複数の付加的な予測変数の各々についての時系列予測を受け取り、もしあれば、変数の各対の間の相関値を計算する。特徴ベクトル生成器は、予測診断変数の値を調節し、調節された値を、それぞれのバンドの各々についての新しい時系列アレイとして出力する。一実施形態において、認識予測器は、相関調節されたアレイをニューラル・ネットワークへの入力として受け取り、初期の入力時系列予測とは異なって、ここでは種々の入力バンドの間の相関を考慮した、更新された時系列予測を出力する。
幾つかの実施形態において、認識予測システムは、予測が望まれる入力データを含む予測変数を受け取る診断系列生成器を含む。幾つかの実施形態において、診断系列生成器は、受け取った予測変数の各々のバンドについて時系列予測を生成し、結果として得られた予測に対して診断テストを実行して、エラーをチェックする。次に、診断系列生成器は、診断テストの結果を用いて、それぞれの予測診断変数を時系列アレイの形式で生成する。
一実施形態において、診断系列生成器は、例えば電子メモリ又はユーザ入力から最長の予測期間及びステップ・サイズを受け取る拡大窓予測プロセス(growing window forecasting)を用いる。ステップ・サイズは、予測の間の時間を設定し、予測期間は、最長の予測期間を設定する。非限定的な例として、予測期間が24時間に設定され、ステップ・サイズが1時間に設定される場合、診断系列生成器は、1時間先から24時間先まで、1時間毎の全部で24の予測を生成することになる。一実施形態において、診断系列生成器は、複数の予測変数を受け取り、予測期間を用いて全体の時間を設定し、ステップ・サイズを用いて予測変数の各々について予測の間の時間を設定する。例えば、診断系列生成器が10個の予測変数を受け取り、ユーザがステップ・サイズを1日に、予測期間を15日に設定する場合、診断系列生成器は、全部で150の予測を生成することになる。
幾つかの実施形態において、診断系列生成器は、予測を生成するために入力データの遅延バージョン又は分割バージョンを用いることを含む、教師あり又は半教師ありの学習プロセスを行う。例えば、幾つかの実施形態において、診断系列生成器は、入力データを訓練セットとテスト・セットとに分割する。幾つかの実施形態において、入力データの半分が入力データとして用いられ、入力データの他の半分がテスト・データとして用いられる。
幾つかの実施形態において、診断系列生成器は、予測変数を受け取り、各々の予測変数についての予測を出力する予測生成器と、予測を受け取り、予測に関する診断レポートを生成する診断レポート生成器と、診断レポートを受け取り、調節された予測値を診断値として生成する認識診断評価器とを含む。幾つかの実施形態において、診断系列生成器は、予測生成器、診断レポート生成器、及び認識診断評価器の各々の二つ又はそれ以上を含み、複数の変数の並列処理を可能にする。幾つかの実施形態において、診断系列生成器は、予測生成器、診断レポート生成器、及び認識診断評価器の各々の1つを含み、複数の予測変数の並列処理を可能にするために、複数の診断系列生成器が互いに並列に加えられる。
幾つかの実施形態において、予測生成器は、予測変数についての履歴入力データを受け取り、進化する対象変数がそれ自身の遅延した(即ち、以前の)値に回帰する自己回帰モデルを用いて、予測変数についての将来値を予測する。従って、自己回帰時間系列分析は、変数の将来の値を、その変数のみの履歴に基づいて予測する。一実施形態において、予測生成器は、自己回帰モデルの時間遅延の数(又は「オーダー」)、及び、データの、過去の値が差し引かれた回数(又は「差異の程度」)のようなパラメータを用いる自己回帰統合移動平均(ARIMA)モデルを用いて、予測変数についての将来の値を予測する。別の例として、一実施形態において、予測生成器は、予測変数の時間系列データにおける強い季節傾向を検出し、季節性ARIMA(SARIMAX)モデルを適用し、このモデルは、入力データ傾向の季節性の因子に対するARIMAモデルの自己回帰項及び移動平均項を用いて、予測変数についての予測を得るものである。
一実施形態において、予測生成器は、自己回帰モデルと、例えば電子メモリから又はユーザ入力から予測生成器が最長予測期間及びステップ・サイズを受け取る拡大窓予測プロセスとを用いる。ステップ・サイズは、予測の間の時間を設定し、予測期間は、最長の予測期間を設定する。非限定的な例として、ν個の変数を受け取る予測生成器について、予測期間がt時間に設定され、ステップ・サイズがs時間に設定される場合、予測生成器は、s時間先からt時間先まで、s時間毎の全部で(νt)/sの予測について、変数毎にt/sの予測を生成することになる。例えば、予測生成器が5個の予測変数を受け取り、ユーザーがステップ・サイズを1日に、予測期間を14日に設定する場合、診断系列生成器は、全部で70の予測を生成することになる。
幾つかの実施形態において、診断レポート生成器は、予測生成器によって準備された予測に対して診断テストを行い、残差又は残差エラーとも呼ばれるエラーをチェックする。一実施形態において、診断系列生成器は、診断テストの結果を、予測を向上させるために予測変数について学習する認識評価システムへの入力として用いる。幾つかの実施形態において、残差エラーは、期待される結果から予測を差し引いたものとして計算される。幾つかの実施形態において、診断レポート生成器は、全ての予測にわたって個々の残差エラーを収集し、それらを、予測モデルをよりよく理解するために用いる。
幾つかの実施形態において、診断レポート生成器は、各々の予測について、診断テストの結果のグラフ表示を与える1つ又は複数のプロットを出力する。例えば、幾つかの実施形態において、診断レポート生成器は、正規化残差線プロット、残差ヒストグラム及び推定密度プロット、残差分位数(Q-Q)プロット、及び残差自己相関プロットのうちの1つ又は複数をもたらす、予測の診断テストを行う。
残差線プロットは、中央のゼロ軸に対する残差予測エラー値の可視表示を与える線プロットである。エラー値及び線プロットはランダムに見えるべきであり、さもなければ、あるパターンの存在は、予測モデルを調節するか又は別のアルゴリズムで置き換える必要があることを示す。例えば、一実施形態において、診断系列生成器は、ARIMAモデルを用いて予測を計算し、残差線プロットを生成する。次に、認識診断評価器は、残差線プロットを分析し、認識診断評価器が入力データ又はプロットの中に季節性又は周期的なパターンを検出した場合には、診断系列生成器は、異なるモデルを使用する機会をユーザに与えることをユーザに通知するか、自動化された実施形態においては、診断系列生成器は、季節性パターンを含むデータにより適したSARIMAXモデルのような異なるモデルを用いて予測を再計算するように、予測生成器に指示する。
残差ヒストグラム及び推定密度プロット(又は「ヒストグラム及び密度プロット」)は、予測中の残差エラーの分布における異常性の可視表示を与える。通常、ヒストグラム及び密度プロットは、ある程度ガウス型の外見を有する。非ガウス分布又は大きな歪みの存在は、予測モデルを調節するか又は置き換える必要があることを示す。
残差Q-Qプロットは、2つの分布間の比較の可視表示を与え、分布の間の類似性又は差異の程度を示す。例えば、一実施形態において、予測値はガウス分布と比較され、差異は散布図としてプロットされる。この例における散布図は、水平軸及び垂直軸上の増加する値と一致する方向に原点から延びる対角線に、密接に沿っているべきである。さもなければ、著しい逸脱の存在は、時には、自己回帰パラメータが理想的ではなく、改善の余地があることを示すことになる。このプロットは、典型的には、予想から外れた値を識別するために有用となる。
残差自己相関プロットは、ある観測と以前の時間ステップにおける観測との間の比較の可視表示を与える。このプロットについて期待されるのは、2つの分布の間に自己相関がないことを見出すことである。プロットは、重要度の閾値に対する自己相関スコアを示す。著しい逸脱の存在は、時には、自己回帰パラメータが理想的ではなく、改善の余地があることを示すことになる。
一実施形態において、認識診断評価器は、診断テストの結果を受け取り、分析プロセスを行って、予測診断変数を時系列アレイの形式で生成する。幾つかの実施形態において、認識診断評価器は、その結果を調べて、エラーがランダムではないこと、及び、モデルがキャプチャしてより良好な予測を作成するために使用することができるより多くの情報が存在することを示す、パターン又は構造を探す。
認識診断評価器の一実施形態は、診断レポート生成器によって生成された1つ又は複数のプロットを分類するために、画像分類モデルを構成する。プロットは、リアルタイムで見ることもできるし、キャプチャして後の時間で見ることもできる。一実施形態において、画像分類モデルは、ニューラル・ネットワークをベースとするモデル、例えば、畳み込みニューラル・ネットワーク(CNN)である。構成プロセスの際に、一実施形態は、種々のプロットのラベル付けされた画像を用いて、ニューラル・ネットワークをベースとするモデルを訓練し、訓練に従ってプロットを分類する。例えば、画像分類モデルは、プロット内のエラー・レベルに従ってプロットを分類するように意図される。CNNによって行われるエラー・レベル検出の粒度は、CNNが識別するように訓練されるクラスの数に依存することになる。例えば、画像分類モデルは、プロットを含む画像を、予測の精度に従って、例えば0%の精度から100%の精度まで分類するように、意図される。
診断系列生成器の一実施形態は、予測を生成する予測生成器、及び、予測について複数の診断プロットを作成する診断レポート生成器を含む。そのような一つの実施形態において、認識診断評価器は、1つ又は複数のCNNを用いて、予測についての診断プロットの各々を分類する。認識診断評価器は、診断プロットの分類の結果を平均することによって、予測について単一の値を出力する。例えば、一実施形態は、全てが単一の予測に関連する、正規化残差線プロット、残差ヒストグラム及び推定密度プロット、残差分位数(Q-Q)プロット、並びに残差自己相関プロットを生成する。認識診断評価器の一実施形態は、全部で4つのプロットを個々に分類し、各々に、各々のプロットの精度に応じて0から100までの値を割り当てる。次に、4つの診断プロットについての精度値を平均して、予測の精度を示す単一の数値が得られる。
診断系列生成器の一実施形態は、複数の予測変数に関する入力データを受け取る。診断系列生成器は、それぞれの予測変数を受け取るために並列に配置された複数の予測生成器を含む。診断系列生成器はさらに、それぞれの予測生成器から予測を受け取るために並列に配置された複数の診断レポート生成器を含む。診断系列生成器は、各々がそれぞれの診断レポート生成器から診断情報を受け取るように接続され、並列に配置された複数の認識診断評価器をさらに含む。
一実施形態において、各々の予測生成器は、変数毎にt/sの予測を生成し、ここでtは予測期間、sはステップ・サイズであり、いずれも共通の時間次元(例えば、分、時間、日など)に設定される。各々の診断レポート生成器は、変数毎の全部で(pt)/s個のプロットについて、予測毎にp個の診断プロットを計算する。各々の認識診断評価器は、変数毎の全部でt/sの診断値について、予測毎に1つの(即ち、p個のプロット毎に1つの)診断値を生成する。各々変数についての診断値は、それぞれの予測診断アレイに格納される。
一実施形態において、認識予測システムは、予測診断変数を診断系列生成器から受け取る特徴ベクトル生成器を含む。一実施形態において、認識予測システムは、診断変数の各々が他のすべてのノードに完全に接続されたノードとなるホップフィールド・ネットワークを含む。各々のノードは、診断値に対応する単一の予測変数を表す。一実施形態において、診断値は、接続ノードの活性化関数に対して診断値が有する寄与度を求めるために、ホップフィールド・ネットワークに供給される。寄与度は、ノードを接続するエッジに重みを与える。特定のノードから、各々の診断変数にリンクするエッジが順序付けられる。予測変数の間の関係の順序は、最終的な予測に含めるときに予測器の予測をどれほど下方までたどるべきであるかを決定するために、用いることができる。
一実施形態において、ノード値が既知であるので、ホップフィールド・ネットワークは、ノード間の接続の各々の重みを学習するまで、ノードを調査することになる。従って、幾つかの実施形態において、ホップフィールド・ネットワークの重みが学習される。幾つかの実施形態において、ホップフィールド・ネットワークは、予測変数412(図4Aに示される)の数に等しい、完全に接続された数を含む。幾つかの実施形態において、ひとたびホップフィールド・ネットワークが全ての重みを学習すると、特徴ベクトル生成器が、各々のノードの接続エッジに従ってノードをランク付けすることになる。特徴ベクトル生成器は、各々のノードに対するエッジをランク付けし、次いで、エッジの重みに従ってノードをランク付けすることになる。次に、特徴ベクトル生成器は、各々が重みに従って修正される3つの特徴ベクトル、即ち、最高の重みが付けられたエッジを用いる長期特徴ベクトル、最低の重みが付けられたエッジを用いる短期特徴ベクトル、及び、中間エッジ値の平均を用いる中期特徴ベクトルを形成することになる。3つの特徴ベクトルの各々のベクトルは、一緒に結合され、3つの結合された特徴ベクトルが認識予測器へ出力される。
一実施形態において、認識予測器は、3つの特徴ベクトルを受け取り、それらをニューラル・ネットワークへの入力として用いる。一実施形態において、ニューラル・ネットワークは、長短期メモリ(LSTM)ニューラル・ネットワークである。一実施形態において、LSTMは、ホップフィールド・ネットワークによって計算された相関に基づいて修正された予測を生成するために、半分がテスト・データであり半分がLSTMを訓練するための訓練データであるように分割された履歴データを用いて訓練される。一実施形態において、認識予測器は、中期特徴ベクトルをLSTMへの入力として用い、長期特徴ベクトル及び短期特徴ベクトルを、LSTMへの短期及び長期メモリ入力への入力として用いる。
説明を分かりやすくするために、及び、それに対する何らの限定なしに、実施形態は、幾つかの例示的構成を用いて説明されている。この開示から、当業者であれば、説明された目的を達成するために、説明された構成の多くの改変、改造、及び修正を考えることができることになり、それらは実施形態の範囲に入るものと考えられる。
さらに、データ処理環境の簡略化されたダイアグラムが図面及び実施形態に使用される。実際のコンピューティング環境においては、図示されない又は本明細書では説明されない付加的な構造体又はコンポーネント、或いは、図示されたのとは異なるが本明細書で説明されるのと同じ機能のための構造体又はコンポーネントが、実施形態の範囲から逸脱せずに存在し得る。
さらに、実施形態は、単なる例として、特定の実際的又は仮想的コンポーネントに関して説明される。種々の実施形態によって説明されるステップは、例えば、機械学習分類器モデルによって行われる決定に関する説明をもたらすように適合させることができる。
これら及び他の同様のアーチファクトの任意の特定の明示は、本発明に限定することを意図するものではない。これら及び他の同様のアーチファクトの任意の特定の明示は、本発明に限定することを意図するものではない。
本開示内の例は、単に説明を明瞭にするために使用され、例示的実施形態に限定するものではない。本明細書に列挙される任意の利点は、単なる例に過ぎず、例示的実施形態に限定することを意図しない。付加的な利点又は異なる利点は、特定の例示的実施形態によって実現することができる。さらに、特定の例示的実施形態は、上に列挙される利点の一部、全てを有するか、又はいずれも有さない場合がある。
さらに、例示的実施形態は、任意の種類のデータ、データ・ソース、又はデータ・ネットワーク上のデータ・ソースへのアクセスに関して実施することができる。任意の種類のデータ・ストレージ・デバイスは、本発明の範囲内で、データ処理システムにおいてローカルで、又はデータ・ネットワーク上のいずれかで、本発明の実施形態にデータを提供することができる。実施形態がモバイル・デバイスを使用して説明される場合、モバイル・デバイスと共に使用するのに好適な任意の種類のデータ・ストレージ・デバイスは、例示的実施形態の範囲内で、モバイル・デバイスにおいてローカルで、又はデータ・ネットワーク上でのいずれかで、そうした実施形態にデータを提供することができる。
例示的実施形態は、特定のコード、設計、アーキテクチャ、プロトコル、レイアウト、概略図、及びツールを単に例として使用して説明され、例示的実施形態に限定するものではない。さらに、例示的実施形態は、幾つかの場合において、説明を明瞭にするために、特定のソフトウェア、ツール、及びデータ処理環境を単なる例として使用して説明される。例示的実施形態は、他の同等な又は同様の目的の構造、システム、アプリケーション、又はアーキテクチャと併せて使用され得る。例えば、他の同等なモバイル・デバイス、構造、システム、アプリケーション、又はアーキテクチャは、本発明の範囲内で、本発明のそうした実施形態と併せて使用することができる。例示的実施形態は、ハードウェア、ソフトウェア、又はそれらの組み合わせで実施することができる。
本開示内の例は、単に説明を明瞭にするために使用され、例示的実施形態に限定するものではない。付加的なデータ、動作、アクション、タスク、活動、及び操作は、本開示から想起されるものとし、これらは、例示的実施形態の範囲内で企図される。
本明細書に列挙される任意の利点は、単なる例に過ぎず、例示的実施形態に限定することを意図しない。付加的な利点又は異なる利点は、特定の例示的実施形態によって実現することができる。さらに、特定の例示的実施形態は、上に列挙される利点の一部、全てを有するか、又はいずれも有さない場合がある。
図を、特に図1及び図2を参照すると、これらの図は、例示的実施形態を実施することができるデータ処理環境の例示的な図である。図1及び図2は単なる例示に過ぎず、異なる実施形態を実施することができる環境に関していかなる制限も主張又は示唆することを意図しない。特定の実装は、以下の説明に基づいて、示される環境に対して多くの変更を行うことができる。
図1は、例示的実施形態を実施することができるデータ処理システムのネットワークのブロック図を示す。データ処理環境100は、例示的実施形態を実施することができるコンピュータのネットワークである。データ処理環境100は、ネットワーク102を含む。ネットワーク102は、データ処理環境100内で一緒に接続された種々のデバイスとコンピュータの間の通信リンクを提供するために使用される媒体である。ネットワーク102は、有線、無線通信リンク、又は光ファイバ・ケーブルなどの接続を含むことができる。
クライアント又はサーバは、ネットワーク102に接続された特定のデータ処理システムの役割の単なる例示に過ぎず、これらのデータ処理システムの他の構成又は役割を排除することを意図したものではない。データ処理システム104は、ネットワーク102に結合される。ソフトウェア・アプリケーションは、データ処理環境100内の任意のコンピュータ上で実行することができる。図1の処理システム104内で実行されるものとして説明されるあらゆるソフトウェア・アプリケーションは、別のデータ処理システム内で実行するように同様に構成することができる。図1のデータ処理システム104内に格納又は生成されたあらゆるデータ又は情報は、別のデータ処理システム内で実行するように同様に構成することができる。データ処理システム104などのデータ処理システム104は、そこでコンピューティング・プロセスを実行するソフトウェア・アプリケーション又はソフトウェア・ツールを有することができる。実施形態において、データ処理システム104は、1つ又は複数の実施形態による、本明細書で説明されるデータ・プロセッサ機能の1つ又は複数を実装するように構成することができる
サーバ106は、ストレージ・ユニット108と共にネットワーク102に結合される。ストレージ・ユニット108は、例えば画像データ及び属性データなど、種々の実施形態に対して本明細書で説明されるようなデータを格納するように厚生されたデータベース109を含む。実施形態において、サーバ106は、1つ又は複数の実施形態による、本明細書で設営されるプロセッサ機能の1つ又は複数を実装するように構成することができるニューラル・ネットワーク・アプリケーション105Bを含む。
クライアント110、112及び114もネットワーク102に結合される。サーバ106、又はクライアント110、112もしくは114などの従来のデータ処理システムは、データを含むことができ、そこで従来のコンピューティング・プロセスを実行するソフトウェア・アプリケーション又はソフトウェア・ツールを有することができる。
単なる例として、そうしたアーキテクチャへのいかなる限定も意味することなく、図1は、実施形態の例示的実装で使用可能な特定のコンポーネントを示す。例えば、サーバ104、106、及びクライアント110、112、114は、単に例としてサーバ及びクライアントとして示され、クライアント・サーバ・アーキテクチャへの限定を意味しない。別の例として、実施形態は、図示のように、幾つかのデータ処理システム及びデータ・ネットワークにわたって分散され得るが、別の実施形態は、例示的実施形態の範囲内で単一のデータ処理システム上で実施され得る。従来のデータ処理システム106、110、112及び114はまた、クラスタ、区画、及び実施形態を実施するのに適した他の構成内にある例示的ノードも表す。
デバイス132は、本明細書で説明される従来のコンピューティング・デバイスの一例である。例えば、デバイス132は、スマートフォン、タブレット・コンピュータ、ラップトップ・コンピュータ、据え置き型又は携帯型のクライアント110、ウェアラブル・コンピューティング・デバイス、又は他の任意の適切なデバイスの形態をとることができる。実施形態において、デバイス132は、ニューラル・ネットワークの、本明細書で説明されるプロセスを開始するといった、ニューラル・ネットワーク・アプリケーション10Bによる1つ又は複数のデータ処理タスクを実行する要求をサーバ106に送る。図1の別の従来のデータ処理システムにおいて実行されるものとして説明されるあらゆるソフトウェア・アプリケーションを、デバイス132において同様に実行されるように構成することができる。図1の別の従来のデータ処理システムにおいて格納又は生成されるあらゆるデータ又は情報を、デバイス132において同様に格納又は生成されるように構成することができる。
サーバ106、ストレージ・ユニット108、データ処理システム104、及びクライアント110、112及び114、並びにデバイス132は、有線接続、無線通信プロトコル、又は他の適切なデータ接続を使用してネットワーク102に結合することができる。クライアント110、112及び114は、例えば、パーソナル・コンピュータ又はネットワーク・コンピュータとすることができる。
示される例において、サーバ106は、ブートファイル、オペレーティング・システム画像、及びアプリケーションなどのデータを、クライアント110、112及び114に提供することができる。クライアント110、112及び114は、この例では、サーバ104に対するクライアントであり得る。クライアント110、112、114又はそれらの幾つかの組み合わせは、それ自体のデータ、ブートファイル、オペレーティング・システム画像、及びアプリケーションを含むことができる。データ処理環境100は、付加的なサーバ、クライアント、及び図示されていない他のデバイスを含むことができる。
示される例において、メモリ124は、ブートファイル、オペレーティング・システム画像、及びアプリケーションなどのデータをプロセッサ122に提供することができる。プロセッサ122は、それ自体のデータ、ブートファイル、オペレーティング・システム画像、及びアプリケーションを含むことができる。データ処理環境100は、付加的なサーバ、クライアント、及び図示されていない他のデバイスを含むことができる。
実施形態において、データ処理システム104のニューラル・ネットワーク・アプリケーション105A及びサーバ106のニューラル・ネットワーク・アプリケーション105Bの1つ又は複数は、本明細書で説明されるようなDNNなどのニューラル・ネットワークの実施形態を実施する。特定の実施形態では、ニューラル・ネットワークは、単一のサーバ又は処理システム内のネットワーク・アプリケーション105A及びネットワーク・アプリケーション105Bの1つを用いて実施される。別の特定の実施形態では、ニューラル・ネットワークは、単一のサーバ又は処理システム内のネットワーク・アプリケーション105A及びネットワーク・アプリケーション105Bの両方を用いて実施される。サーバ106は、複数のノードを含む複数のGPU107を含み、そこで、各ノードは本明細書で説明されるような1つ又は複数のGPUを含むことができる。
示される例において、データ処理環境100は、インターネットとすることができる。ネットワーク102は、伝送制御プロトコル/インターネット・プロトコル(TCP/IP)及び他のプロトコルを用いて互いに通信するネットワーク及びゲートウェイの集まりを表すことができる。インターネットの中心は、データ及びメッセージを送付する何千もの商用、政府、教育、及び他のコンピュータ・システムを含む、主要なノード又はホスト・コンピュータ間のデータ通信リンクのバックボーンである。当然ながら、データ処理環境100は、例えば、イントラネット、ローカル・エリア・ネットワーク(LAN)、又は広域ネットワーク(WAN)等といった多数の異なるタイプのネットワークとして実装することもできる。図1は、一例であることが意図され、異なる例示的実施形態に対するアーキテクチャ上の限定であることは意図されない。
他の使用の中でも、データ処理環境100は、例示的実施形態を実施することができるクライアント-サーバ環境を実施するために用いることができる。クライアント-サーバ環境は、ソフトウェア・アプリケーション及びデータがネットワークにわたって分散されるのを可能にするので、アプリケーションは、クライアント・データ処理システムとサーバ・データ処理システムとの間の対話性を用いて機能する。データ処理環境100は、サービス指向型アーキテクチャを用いることもでき、そこで、ネットワークにわたって分散された相互運用可能なソフトウェア・コンポーネントは、一貫したビジネス・アプリケーションとして互いにパッケージ化することができる。データ処理環境100は、クラウドの形をとることもでき、最小の管理労力又はサービス・プロバイダとの最小限の対話しか伴わずに迅速にプロビジョニング及びリリースされ得る、構成可能なコンピューティング・リソース(例えば、ネットワーク、ネットワーク帯域幅、サーバ、処理、メモリ、ストレージ、アプリケーション、仮想マシン及びサービス)の共有プールに対する便利な、オンデマンドのネットワーク・アクセスを可能にするためのサービス・デリバリのクラウド・コンピューティング・モデルを利用する。
図2を参照すると、この図は、例示的実施形態を実施することができるデータ処理システムのブロック図を示す。データ処理システム200は、図1のサーバ104及び106、又はクライアント110、112及び114などのコンピュータ、又は別のタイプのデバイスの例であり、その中に、例示的実施形態のためのプロセスを実施するコンピュータ使用可能プログラム・コード又は命令が配置され得る。
データ処理システム200は、図1のデバイス132のような、データ処理システム又は内部の構成も表し、その中に、例示的実施形態のプロセスを実施するコンピュータ使用可能プログラム・コード又は命令が配置され得る。データ処理システム200は、単なる例としてコンピュータとして説明されるが、それに限定されるものではない。図1のデバイス132などの他のデバイスの形の実装は、タッチ・インターフェースを付加することなどにより、データ処理システム200を修正することができ、本明細書で説明されるデータ処理システム200の動作及び機能の一般的な説明から逸脱することなく、データ処理システム200から特定の示されるコンポーネントを排除することさえ可能である。
示される例において、データ処理システム200は、ノース・ブリッジ及びメモリ・コントローラ・ハブ(NB/MCH)202と、サウス・ブリッジ及び入力/出力(I/O)コントローラ・ハブ(SB/ICH)204とを含む、ハブ・アーキテクチャを利用する。処理ユニット206、メイン・メモリ208、及びグラフィックス・プロセッサ210は、ノース・ブリッジ及びメモリ・コントローラ・ハブ(NB/MCH)202に結合される。処理ユニット206は、1つ又は複数のプロセッサを含むことができ、1つ又は複数の異種のプロセッサ・システムを用いて実装され得る。処理ユニット206は、マルチコア・プロセッサとすることができる。特定の実装において、グラフィックス・プロセッサ210は、アクセラレーテッド・グラフィックス・ポート(AGP)を通して、NB/MCH202に結合され得る。
示される例において、ローカル・エリア・ネットワーク(LAN)アダプタ212は、サウス・ブリッジ及びI/Oコントローラ・ハブ(SB/ICH)204に結合される。音声アダプタ216、キーボード及びマウス・アダプタ220、モデム222、読み出し専用メモリ(ROM)224、ユニバーサル・シリアル・バス(USB)及び他のポート232、並びにPCI/PCIeデバイス234は、バス238を通して、サウス・ブリッジ及びI/Oコントローラ・ハブ204に結合される。ハードディスク・ドライブ(HDD)又はソリッド・ステート・ドライブ(SSD)226及びCD-ROM230は、バス240を通して、サウス・ブリッジ及びI/Oコントローラ・ハブ204に結合される。PCI/PCIeデバイス234は、例えば、Ethernetアダプタ、アドイン・カード、及びノートブック・コンピュータ用のPCカードを含むことができる。PCIは、カード・バス・コントローラを使用するが、PCIeは使用しない。ROM224は、例えば、フラッシュ・バイナリ入力/出力システム(BIOS)とすることができる。ハードディスク・ドライブ226及びCD-ROM230は、例えば、統合ドライブ・エレクトロニクス(IDE)、シリアル・アドバンスト・テクノロジ・アタッチメント(SATA)インターフェース、又はエクスターナルSATA(eSATA)及びマイクロSATA(mSATA)などの変形を使用することができる。スーパーI/O(SIO)デバイス236は、バス238を通して、サウス・ブリッジ及びI/Oコントローラ・ハブ(SB/ICH)204に結合され得る。
メイン・メモリ208、ROM224、又はフラッシュ・メモリ(図示せず)などのメモリは、コンピュータ使用可能ストレージ・デバイスの幾つかの例である。ハードディスク・ドライブ又はソリッド・ステート・ドライブ226、CD-ROM230及び他の同様の使用可能なデバイスは、コンピュータ使用可能ストレージ媒体を含むコンピュータ使用可能ストレージ・デバイスの幾つかの例である。
オペレーティング・システムは、処理ユニット206上で動作する。オペレーティング・システムは、図2のデータ処理システム200内の種々のコンポーネントを連携させ、それらの制御を提供する。オペレーティング・システムは、これらに限定されるものではないが、サーバ・システム、パーソナル・コンピュータ及びモバイル・デバイスを含む、任意のタイプのコンピューティング・プラットフォーム用の市販のオペレーティング・システムとすることができる。オブジェクト指向又は他のタイプのプログラミング・システムは、オペレーティング・システムと共に動作し、データ処理システム200上で実行されるプログラム又はアプリケーションから、オペレーティング・システムへの呼び出しを提供することができる。
オペレーティング・システム、オブジェクト指向プログラミング・システム、及び図1のサーバ・アプリケーション105などのアプリケーション又はプログラムのための命令は、例えばハードディスク・ドライブ226上のコード226Aの形でストレージ・デバイス上に配置され、例えば処理ユニット206によって実行するために、メイン・メモリ208などの1つ又は複数のメモリの少なくとも1つにロードされ得る。例示的実施形態のプロセスは、例えば、メイン・メモリ208、読み出し専用メモリ224などのメモリ内に、又は1つ又は複数の周辺機器内に配置され得る、コンピュータ実施命令を用いて、処理ユニット206により実行され得る。
さらに、1つの事例では、コード226Aは、ネットワーク201A上でリモート・システム201Bからダウンロードすることができ、そこで、同様のコード201Cがストレージ・デバイス201D上に格納される。別の事例では、コード226Aは、ネットワーク201A上でリモート・システム201Bにダウンロードすることができ、そこで、ダウンロードされたコード201Cがストレージ・デバイス201D上に格納される。
図1~図2のハードウェアは、実装に応じて変化し得る。フラッシュ・メモリ、同等の不揮発性メモリ、又は光学ディスク・ドライブ等といった、他の内部ハードウェア又は周辺機器が、図1~図2に示されるハードウェアに加えて又はそれらの代わりに使用され得る。さらに、例示的実施形態のプロセスを、マルチプロセッサ・データ処理システムに適用することができる。
幾つかの例示的な例において、データ処理システム200は、通常、オペレーティング・システム・ファイルもしくはユーザ生成データ又はその両方を格納するための不揮発性メモリを提供するフラッシュ・メモリを有するように構成される、携帯情報端末(PDA)とすることができる。バス・システムは、システム・バス、I/Oバス、及びPCIバスなどの1つ又は複数のバスを含むことができる。もちろん、バス・システムは、ファブリック又はアーキテクチャに取り付けられた異なるコンポーネント又はデバイス間のデータの転送を提供する任意のタイプの通信ファブリック又はアーキテクチャを用いて実施することができる。
通信ユニットは、モデム又はネットワーク・アダプタなどのデータを送受信するために使用される1つ又は複数のデバイスを含むことができる。メモリは、例えば、メイン・メモリ208、又はノース・ブリッジ及びメモリ・コントローラ・ハブ202内に見出されるキャッシュなどのキャッシュとすることができる。処理ユニットは、1つ又は複数のプロセッサ又はCPUを含むことができる。
図1~図2の示される例及び上述の例は、アーキテクチャ上の制限を意味することを意図するものではない。例えば、データ処理システム200は、モバイル又はウェアラブル・デバイスの形をとることに加えて、タブレット・コンピュータ、ラップトップ・コンピュータ、又は電話デバイスとすることもできる。
コンピュータ又はデータ処理システムが、仮想マシン、仮想デバイス、又は仮想コンポーネントとして説明される場合、仮想マシン、仮想デバイス、又は仮想コンポーネントは、データ処理システム200内に示される一部又は全てのコンポーネントの仮想化された発現(manifestation)を用いてデータ処理システム200の方法で動作する。例えば、仮想マシン、仮想デバイス、又は仮想コンポーネントにおいて、処理ユニット206は、ホスト・データ処理システムにおいて利用可能なハードウェア処理ユニット206の全て又は一部の数の仮想化インスタンスとして発現され、メイン・メモリ208は、ホスト・データ処理システムにおいて利用可能であり得るメイン・メモリ208の全ての部分又は一部分の仮想化インスタンスとして発現され、ディスク226は、ホスト・データ処理システムにおいて利用可能であり得るディスク226の全ての部分又は一部分の仮想化インスタンスとして発現される。ホスト・データ処理システムは、そのような場合、データ処理システム200により表される。
図3を参照すると、この図は、一実施形態による、予測のための例示的な構成300のブロック図を示す。この例示的な実施形態は、認識予測システム302を含む。特定の一実施形態において、認識予測システム302は、図1のアプリケーション105A/105Bの一例である。
幾つかの実施形態において、認識予測システム302は、診断系列生成器304、特徴ベクトル生成器306、及び認識予測器308を含む。代替的実施形態においては、認識予測システム302は、本明細書で説明されているが1つ又は複数のモジュールにグループ分けされる機能の幾つか又は全てを含むことができる。幾つかの実施形態において、本明細書で説明される機能は、ソフトウェア若しくはハードウェア又はそれら両方の組み合わせをベースとするシステム、例えば、特定用途向け集積回路(ASIC)、コンピュータ・プログラム、或いはスマートフォン・アプリケーションを含むことができる複数のシステムの間に分散される。
幾つかの実施形態において、認識予測システム302は、多次元属性空間を表す入力データを含む予測変数310を受け取る。入力データは、それぞれの次元に対応する予測変数のn個のベクトル又はバンドに編成される。一実施形態において、入力データは、各々がそれぞれの予測変数に対応する複数の一変量バンドに編成される。幾つかの実施形態において、入力データは、物理的属性を電気信号に変換するセンサなどのセンサに由来する。幾つかの実施形態において、入力データは、コンピュータ・メモリ内に格納されたコンピュータ生成ログ、例えば、サーバ・ログ、オペレーティング・システム・ログ、及びアプリケーション・ログに由来する。幾つかの実施形態において、入力データは、センサ、ログ、及び任意の他の所望のデータ・ソースの組み合わせに由来する。
幾つかの実施形態において、診断系列生成器304は予測変数310を受け取り、予測変数についての時系列予測を生成する。一実施形態において、特徴ベクトル生成器306は、予測変数308についての時系列予測、及び、1つ又は複数の付加的な予測変数の各々についての時系列予測を受け取り、もしあれば、変数の各対の間の相関値を計算する。特徴ベクトル生成器306は、予測診断変数の値を調節し、調節された値を、それぞれのバンドの各々についての新しい時系列アレイとして出力する。一実施形態において、認識予測器308は、相関調節されたアレイをニューラル・ネットワークへの入力として受け取り、初期の入力時系列予測とは異なって、ここでは種々の入力バンドの間の相関を考慮した、更新された時系列最終予測312を出力する。
図4Aを参照すると、この図は、一実施形態による例示的な構成400のブロック図を示す。例示的な実施形態は、診断系列生成器402を含む。特定の一実施形態において、診断系列生成器402は、図4の予測変数310に対応する予測変数412を受け取る。認識予測システム302は、図1のアプリケーション105A/105Bの一例である。
診断系列生成器402の一実施形態は、複数の予測変数412に関する入力データを受け取る。診断系列生成器402は、それぞれの予測変数を受け取るように並列に配置された複数の予測生成器404A~404Eを含む。診断系列生成器402はまた、それぞれの予測生成器404A~404Eから予測を受け取るように並列に配置された複数の診断レポート生成器406A~406Eを含む。診断系列生成器402はさらに、各々がそれぞれの診断レポート生成器406A~406Eから診断情報を受け取るように接続された、並列に配列された複数の認識診断評価器408A~408Eを含む。
一実施形態において、各々の予測生成器404は、変数毎にt/s個の予測を生成し、ここでtは予測期間、sはステップ・サイズであり、いずれも共通時間次元(例えば、分、時間、日など)に設定される。各々の診断レポート生成器406は、変数毎の全部で(pt)/s個のプロットについて、予測毎にp個の診断プロットを生成する。各々の認識診断評価器408は、変数毎の全部でt/s個の診断値について、予測毎に1つ(即ち、p個のプロット毎に1つ)の予測値414を生成する。各々の変数についての診断値414は、それぞれの予測診断アレイに格納される。
一実施形態において、予測生成器404A~404Eは、自己回帰モデルの時間遅延の数(又は「オーダー」)、及び、データの、過去の値が差し引かれた回数(又は「差異の程度」)などのパラメータを用いる自己回帰統合移動平均(ARIMA)モデルを用いて、予測変数についての将来値を予測する。別の例として、一実施形態において、予測生成器404A~404Eは、予測変数の時系列データにおける強い季節性傾向を検出し、季節性ARIMA(SARIMAX)モデルを適用し、このモデルは、入力データ傾向の季節性の因子に対するARIMAモデルの季節性部分の自己回帰項及び移動平均項を用いて、予測変数についての予測を得るものである。
認識診断評価器408A~408Eの一実施形態は、診断レポート生成器406A~406Eによって生成された1つ又は複数のプロットを分類するために、画像分類モデル415A~415Eを構成する。プロットはリアルタイムで見ることもできるし、キャプチャして後の時間で見ることもできる。一実施形態において、画像分類モデル415A~415Eは、ニューラル・ネットワークをベースとするモデル、例えば、畳み込みニューラル・ネットワーク(CNN)である。構成プロセスの際に、一実施形態は、種々のプロットのラベル付けされた画像を用いて、ニューラル・ネットワークをベースとするモデル415A~415Eを訓練し、訓練に従ってプロットを分類する。例えば、画像分類モデル415は、プロット内のエラー・レベルに従ってプロットを分類するように意図されている。CNN415によって行われるエラー・レベル検出の粒度は、CNN415が識別するように訓練されるクラスの数に依存することになる。例えば、画像分類モデルは、プロットを含む画像を、予測の精度に従って、例えば0%の精度から100%の精度まで分類するように、意図されている。
一実施形態において、予測生成器404A~404Eは予測を生成し、診断レポート生成器406A~406Eは、各々、予測毎に複数の診断プロットを作成する。1つのそのような実施形態において、認識診断評価器408A~408Eは、1つ又は複数のCNNを用いて、予測毎の診断プロットの各々を分類する。認識診断評価器408A~408Eは、各々、予測毎の複数の診断プロットの分類の結果を平均することによって、予測毎に単一の値を出力する。例えば、一実施形態は、全てが単一の予測に関連する、正規化残差線プロット、残差ヒストグラム及び推定密度プロット、残差分位数(Q-Q)プロット、並びに残差自己相関プロットを生成する。認識診断評価器の一実施形態は、全部で4つのプロットを個々に分類し、各々に、各々のプロットの精度に応じて0から100までの値を割り当てる。次に、4つの診断プロットについての精度値を平均して、予測の精度を示す単一の数値が得られる。
図4Bを参照すると、この図は、一実施形態による例示的な診断プロット416、418、420、及び422の図を示す。幾つかの実施形態において、診断レポート生成器406A~406Eの各々は、正規化残差線プロット416、残差ヒストグラム及び推定密度プロット418、残差分位数(Q-Q)プロット422、及び残差自己相関プロット422を含む図4Bに示される1つ又は複数の例示的なプロットを含むことができる1つ又は複数のプロットを出力する。
残差線プロット416は、中央のゼロ軸に対する残差予測エラーの可視表示を与える線プロットである。エラー値及び線プロット416はランダムに見えるべきであり、さもなければ、あるパターンの存在は、予測モデルを調節するか又は別のアリゴリズムで置き換える必要があることを示す。例えば、一実施形態において、診断系列生成器402は、ARIMAモデルを用いて予測を計算し、残差線プロット416を生成する。次いで、認識診断評価器は、残差線プロット416を分析し、認識診断評価器が入力データ又はプロット416の中に季節性又は周期的なパターンを検出した場合には、診断系列生成器402は、異なるモデルを使用する機会をユーザに与えることをユーザに通知するか、自動化された実施形態においては、診断系列生成器402は、季節性パターンを含むデータにより適したSARIMAXモデルのような異なるモデルを用いて予測を再計算するように、予測生成器に指示する。
残差ヒストグラム及び推定密度プロット418(又は「ヒストグラ及び密度プロット」)は、予測中の残差エラーの分布における異常性の可視表示を与える。通常、ヒストグラ及び密度プロット418は、ある程度ガウス型の外見を有する。非ガウス分布又は大きな歪みの存在は、予測モデルを調節するか又は置き換える必要があることを示す。
残差Q-Qプロット420は、2つの分布間の比較の可視表示を与え、分布の間の類似性又は差異の程度を示す。例えば、一実施形態において、予測値はガウス分布と比較され、差異は散布図420としてプロットされる。この例における散布図420は、水平及び垂直軸上の増加する値と一致する方向に原点から伸びる対角線に、密接に沿っているべきである。さもなければ、著しい逸脱の存在は、時には、自己回帰パラメータが理想的ではなく、改善の余地があることを示すことになる。プロット420は、典型的には、予想から外れた値を識別するために有用となる。
残差自己相関プロット422は、ある観測と以前の時間ステップにおける観測との間の比較の可視表示を与える。このプロット422について期待されるのは、2つの分布の間に自己相関がないことを見出すことである。プロット422は、重要度の閾値に対する自己相関スコアを示す。著しい逸脱の存在は、時には、自己回帰パラメータが理想的ではなく、改善の余地があることを示すことになる。
図5を参照すると、この図は、一実施形態による、予測特徴を生成するための例示的な構成500のブロック図を示す。この例示的な実施形態は、診断値512を受け取る特徴ベクトル生成器502を含む。特定の実施形態において、特徴ベクトル生成器502は、図3の特徴ベクトル生成器306の一例であり、診断値512は、図4の診断値414の一例である。
一実施形態において、特徴ベクトル生成器502は、診断変数506A~506Eの各々が他のすべてのノードに完全に接続されたノードになるホップフィールド・ネットワーク504を含む。各々のノードは、診断値506A~506Eに対応する単一の予測変数を表す。一実施形態において、診断値506A~506Eは、接続ノードの活性化関数に対して診断値が有する寄与度を求めるために、ホップフィールド・ネットワークに供給される。寄与度は、ノードを接続するエッジに重みを与える。特定のノードから、各々の診断変数にリンクするエッジが順序付けられる。予測変数の間の関係の順序は、最終的な予測に含めるときに予測器の予測をどれほど下方までたどるべきであるかを決定するために、用いることができる。
一実施形態において、ノード値が既知であるので、ホップフィールド・ネットワーク504は、ノード間の接続の各々の重みを学習するまで、ノートを調査することになる。従って、幾つかの実施形態において、ホップフィールド・ネットワーク504の重みが学習される。幾つかの実施形態において、ホップフィールド・ネットワーク504は、予測変数412(図4Aに示される)の数に等しい、完全に接続された数を含む。幾つかの実施形態において、ひとたびホップフィールド・ネットワーク504がすべての重みを学習すると、特徴ベクトル生成器502が、各々のノードの接続エッジに従ってノードをランク付けすることになる。特徴ベクトル生成器502は、各々のノードに対するエッジをランク付けし、次に、エッジの重みに従ってノードをランク付けすることになる。次に、特徴ベクトル生成器502は、各々が重みに従って修正される3つの特徴ベクトル、即ち、最高の重みが付けられたエッジを用いる長期特徴ベクトル、最低の重みが付けられたエッジを用いる短期特徴ベクトル、及び、中間エッジ値の平均を用いる中期特徴ベクトルを形成することになる。3つの特徴ベクトルの各々のベクトルは、一緒に結合され、3つの結合された特徴ベクトルが認識予測器602へ出力される。
図6を参照すると、この図は、一実施形態による予測環境600のブロック図を示す。例示的な実施形態は、特徴ベクトル612を受け取る認識予測器602を含む。特定の一実施形態において、認識予測器602は、図3の認識予測器308の一例であり、特徴ベクトル612は図5の特徴ベクトル514の一例である。
一実施形態において、認識予測器602は、特徴ベクトル612の例である3つの特徴ベクトル606、608、及び610を受け取る。認識予測器602は、3つの特徴ベクトル606、608、及び610を、ニューラル・ネットワーク604への入力として用いる。一実施形態において、ニューラル・ネットワーク604は、長短期メモリ(LSTM)ニューラル・ネットワーク604である。一実施形態において、LSTM604は、ホップフィールド・ネットワーク504によって計算された相関に基づいて修正された予測を生成するために、半分がテスト・データであり半分がLSTM604を訓練するための訓練データであるように分割された履歴データを用いて訓練される。一実施形態において、認識予測器602は、中期特徴ベクトル606をLSTMへの入力として用い、長期特徴ベクトル608及び短期特徴ベクトル620を、LSTM604への短期及び長期メモリ入力に対する入力として用いる。このようにして、LSTMネットワーク604は、入力予測を束縛する異なる対象期間のメモリを保持することになる。
図7を参照すると、この図は、一実施形態による、予測器の予測を作成するための例示的なプロセス700のフローチャートを示す。特定の実施形態において、認識予測システム302がプロセス700を実行する。
一実施形態において、ブロック702において、プロセスは、予測変数のセットを受け取る。次に、ブロック704において、プロセスは、予測変数のセットにおける各々の予測変数についての診断レポートを生成する。幾つかの実施形態において、診断レポートを生成することは、変数毎にt/s個の予測を生成することを含み、ここで、tは予測期間、sはステップ・サイズであり、いずれも共通の時間次元(例えば、分、時間、日など)に設定され、次に、変数毎の全部で(pt)/s個のプロットについて、予測毎にp個の診断プロットを含む診断レポートを生成することを含む。各々の認識診断評価器は、変数毎の全部でt/s個の診断値について、予測毎に1つの(即ち、p個のプロット毎に1つの)診断値を生成する。次に、ブロック706において、プロセスは、各々の診断レポートの認識評価を行い、各々の予測変数についての診断変数を生成する。
次に、ブロック708において、プロセスは、予測変数の間の相関の認識評価に基づいて、特徴ベクトルを生成する。幾つかの実施形態において、特徴ベクトルの処理は、ホップフィールド・ネットワークを用いて特徴ベクトルを処理することを含む。次に、ブロック710において、プロセスは、特徴ベクトルの認識評価に基づいて、最終予測を生成する。幾つかの実施形態において、最終予測の生成は、LSTMを用いて最終予測を生成することを含む。
以下の定義及び略語は、特許請求の範囲及び明細書を解釈するために用いるものである。本明細書で用いる場合、「備える」、「備えている」、「含む)」、「含んでいる」、「有する」、「有している」、「含有する」又は「含有している」又はその任意の他の変形は、非排他的な包含をカバーすることが意図される。例えば、要素のリストを含む、組成物、混合物、プロセス、方法、物品、又は装置は、必ずしもそれらの要素に限定されるものではなく、明示的に列挙されていない他の要素、又はそうした組成物、混合物、プロセス、方法、物品、又は装置に固有の他の要素を含むことができる。
さらに、「例示的(illustrative)」という用語は、本明細書において「例、事例、例証として機能する」ことを意味するように用いられる。「例示的」であるとして本明細書に記載されるいずれの実施形態又は設計も、他の実施形態又は設計と比較して、必ずしも、好適である又は有利であると解釈されるべきではない。「少なくとも1つ」及び「1つ又は複数」という用語は、1より大きい又1に等しい任意の整数、すなわち、1、2、3、4等を含むと理解される。「複数の」という用語は、2より大きい又は2に等しい任意の整数、すなわち、2、3、4、5等を含むと理解される。「接続」という用語は、間接的「接続」及び直接的「接続」の両方を含むことができる。
「一実施形態」、「1つの実施形態」、「例示的な実施形態」などへの本明細書における言及は、説明されている実施形態が特定の機能、構造、又は特徴を含むことができるが、全ての実施形態が特定の機能、構造、又は特徴を含むことも又は含まないこともあることを示す。さらに、そのような句は、必ずしも同じ実施形態を指しているわけではない。さらに、特定の機能、構造、又は特徴が1つの実施形態に関連して説明される場合、明示的に説明されていてもいなくても、他の実施形態に関連してそのような機能、構造、又は特徴に影響を与えることは当業者の知識の範囲内であると考えられる。
「約」、「実質的に」、「およそ」という用語及びそれらの変形は、出願時に利用可能な機器に基づいて、特定の量の測定と関連した誤差の程度を含むように意図される。例えば、「約」は、所与の値の±8%又は5%、又は2%の範囲を含むことができる。
本発明の種々の実施形態の説明は、例示の目的のために提示し、開示した実施形態に排他的であること又は限定することを意図するものではない。当業者には、説明した実施形態の範囲及び趣旨から逸脱することなく、多くの修正及び変更が明らかであろう。本明細書において使用した用語は、本実施形態の原理、実際上の用途、又は市場において見出される技術を越えた技術的改善を最良に説明するため、又は当業者が本明細書に開示された実施形態を理解することを可能にするために選択されたものである。
本発明の種々の実施形態の説明は、例示の目的のために提示し、開示した実施形態に排他的であること又は限定することを意図するものではない。当業者には、説明した実施形態の範囲及び趣旨から逸脱することなく、多くの修正及び変更が明らかであろう。本明細書において使用した用語は、本実施形態の原理、実際上の用途、又は市場において見出される技術を越えた技術的改善を最良に説明するため、又は当業者が本明細書に開示された実施形態を理解することを可能にするために選択されたものである。
このように、オンライン・コミュニティ及び他の関連した特徴、機能又は動作における参加を管理するための例示的な実施形態では、コンピュータ実施方法、システム又装置、及びコンピュータ・プログラム製品が提供される。1つの実施形態又はその一部がデバイスのタイプに関して説明される場合、コンピュータ実施方法、システム又は装置、コンピュータ・プログラム製品、又はその一部は、そのデバイスのタイプの適切な匹敵する表現と共に使用されるように適合又は構成される。
1つの実施形態がアプリケーションにおいて実施されると説明され場合には、例示的な実施形態の範囲内で、ソフトウェア・アズ・ア・サービス(Software as a Service(SaaS)モデルにおけるアプリケーションの配信が企図される。SaaSモデルでは、クラウド・インフラストラクチャ内でアプリケーションを実行することによって、1つの実施形態を実施するアプリケーションの能力がユーザに提供される。ユーザは、様々なクライアント・デバイスを使用して、ウェブ・ブラウザなどのシン・クライアント・インタフェース(例えばウェブ・ベースの電子メール)又は他の軽量クライアント・アプリケーションを介して、そのアプリケーションにアクセスすることができる。ユーザは、クラウド・インフラストラクチャのネットワーク、サーバ、オペレーティング・システム又はストレージを含む、基礎を成すクラウド・インフラストラクチャを管理又は制御しない。幾つかの場合では、ユーザが、SaaSアプリケーションの能力の管理又は制御さえもしないことがある。他の幾つかの場合では、アプリケーションのSaaS実施態様は、限定されたユーザ固有のアプリケーション構成設定の可能な例外を可能にすることができる。
本発明は、システム、方法もしくはコンピュータ・プログラム製品又はそれらの組み合わせを、いずれかの可能な技術的詳細レベルで統合したものとすることができる。コンピュータ・プログラム製品は、プロセッサに本発明の態様を実行させるためのコンピュータ可読プログラム命令をその上に有する1つ又は複数のコンピュータ可読ストレージ媒体を含むことができる。
コンピュータ可読ストレージ媒体は、命令実行デバイスにより使用される命令を保持及び格納できる有形デバイスとすることができる。コンピュータ可読ストレージ媒体は、例えば、これらに限定されるものではないが、電子ストレージ・デバイス、磁気ストレージ・デバイス、光学ストレージ・デバイス、電磁気ストレージ・デバイス、半導体ストレージ・デバイス、又は上記のいずれかの適切な組み合わせとすることができる。コンピュータ可読ストレージ媒体のより具体的な例の非網羅的なリストとして、以下のもの、すなわち、ポータブル・コンピュータ・ディスケット、ハードディスク、ランダム・アクセス・メモリ(RAM)、読み出し専用メモリ(ROM)、消去可能プログラム可能読み出し専用メモリ(EPROM又はフラッシュ・メモリ)、スタティック・ランダム・アクセス・メモリ(SRAM)、ポータブル・コンパクト・ディスク読み出し専用メモリ(CD-ROM)、デジタル多用途ディスク(DVD)、メモリ・スティック、フロッピー・ディスク、パンチカードもしくは命令がそこに記録された溝内の隆起構造のような機械的にエンコードされたデバイス、及び上記のいずれかの適切な組み合わせが挙げられる。本明細書で使用される場合、コンピュータ可読ストレージ媒体は、電波、又は他の自由に伝搬する電磁波、導波管もしくは他の伝送媒体を通じて伝搬する電磁波(例えば、光ファイバケーブルを通る光パルス)、又はワイヤを通って送られる電気信号などの、一時的信号自体として解釈されない。
本明細書に説明されるコンピュータ可読プログラム命令は、コンピュータ可読ストレージ媒体からそれぞれのコンピューティング/処理デバイスに、又は、例えばインターネット、ローカル・エリア・ネットワーク、広域ネットワーク、もしくは無線ネットワーク又はその組み合わせなどのネットワークを介して外部コンピュータ又は外部ストレージ・デバイスにダウンロードすることができる。ネットワークは、銅伝送ケーブル、光伝送ファイバ、無線伝送、ルータ、ファイアウォール、スイッチ、ゲートウェイ・コンピュータ、もしくはエッジサーバ又はその組み合わせを含むことができる。各コンピューティング/処理デバイスにおけるネットワーク・アダプタ・カード又はネットワーク・インターフェースは、ネットワークからコンピュータ可読プログラム命令を受け取り、それぞれのコンピューティング/処理デバイス内のコンピュータ可読ストレージ媒体内に格納するためにコンピュータ可読プログラム命令を転送する。
本発明の動作を行うためのコンピュータ可読プログラム命令は、アセンブラ命令、命令セットアーキテクチャ(ISA)命令、マシン命令、マシン依存命令、マイクロコード、ファームウェア命令、状態設定データ、集積回路のための構成データ、又は、Smalltalk、C++などのオブジェクト指向プログラミング言語、及び、「C」プログラミング言語、又は類似のプログラミング言語などの通常の手続き型プログラミング言語を含む1つ又は複数のプログラミング言語の任意の組み合わせで記述されるソース・コード又はオブジェクト・コードとすることができる。コンピュータ可読プログラム命令は、完全にユーザのコンピュータ上で実行される場合もあり、一部がユーザのコンピュータ上で、独立型ソフトウェア・パッケージとして実行される場合もあり、一部がユーザのコンピュータ上で実行され、一部が遠隔コンピュータ上で実行される場合もあり、又は完全に遠隔コンピュータもしくはサーバ上で実行される場合もある。最後のシナリオにおいて、遠隔コンピュータは、ローカル・エリア・ネットワーク(LAN)もしくは広域ネットワーク(WAN)を含むいずれかのタイプのネットワークを通じてユーザのコンピュータに接続される場合もあり、又は外部コンピュータへの接続がなされる場合もある(例えば、インターネットサービスプロバイダを用いたインターネットを通じて)。幾つかの実施形態において、例えば、プログラム可能論理回路、フィールド・プログラマブル・ゲート・アレイ(FPGA)、又はプログラム可能論理アレイ(PLA)を含む電子回路は、コンピュータ可読プログラム命令の状態情報を用いて、電子回路を個別化することによりコンピュータ可読プログラム命令を実行し、本発明の態様を実施することができる。
本発明の態様は、本発明の実施形態による方法、装置(システム)及びコンピュータ・プログラム製品のフローチャート図もしくはブロック図又はその両方を参照して説明される。フローチャート図もしくはブロック図又はその両方の各ブロック、並びにフローチャート図もしくはブロック図又はその両方内のブロックの組み合わせは、コンピュータ可読プログラム命令によって実施できることが理解されるであろう。
これらのコンピュータ可読プログラム命令を、汎用コンピュータ、専用コンピュータ、又は他のプログラム可能データ処理装置のプロセッサに与えてマシンを製造し、それにより、コンピュータ又は他のプログラム可能データ処理装置のプロセッサによって実行される命令が、フローチャートもしくはブロック図又はその両方の1つ又は複数のブロック内で指定された機能/動作を実装するための手段を作り出すようにすることができる。これらのコンピュータ可読プログラム命令を、コンピュータ、プログラム可能データ処理装置、もしくは他のデバイス又はそれらの組合せを特定の方式で機能させるように指示することができるコンピュータ可読ストレージ媒体内に格納し、それにより、その中に格納された命令を有するコンピュータ可読ストレージ媒体が、フローチャートもしくはブロック図又はその両方の1つ又は複数のブロックにおいて指定された機能/動作の態様を実装する命令を含む製品を含むようにすることもできる。
コンピュータ・プログラム命令を、コンピュータ、他のプログラム可能データ処理装置、又は他のデバイス上にロードして、一連のオペレーション動作をコンピュータ、他のプログラム可能データ処理装置、又は他のデバイス上で行わせてコンピュータ実施のプロセスを生成し、それにより、コンピュータ、他のプログラム可能装置、又は他のデバイス上で実行される命令が、フローチャートもしくはブロック図又はその両方の1つ又は複数のブロックにおいて指定された機能/動作を実施するようにすることもできる。
図面内のフローチャート及びブロック図は、本発明の種々の実施形態による、システム、方法、及びコンピュータ・プログラム製品の可能な実装の、アーキテクチャ、機能及び動作を示す。この点に関して、フローチャート又はブロック図内の各ブロックは、指定された論理機能を実施するための1つ又は複数の実行可能命令を含む、モジュール、セグメント、又は命令の一部を表すことができる。幾つかの代替的な実装において、ブロック内に示される機能は、図に示される順序とは異なる順序で生じることがある。例えば、連続して示される2つのブロックは、関与する機能に応じて、実際には実質的に同時に実行されることもあり、又はこれらのブロックはときとして逆順で実行されることもある。ブロック図もしくはフローチャート図又はその両方の各ブロック、及びブロック図もしくはフローチャート図又はその両方内のブロックの組み合わせは、指定された機能又は動作を実行する、又は専用のハードウェアとコンピュータ命令との組み合わせを実行する、専用ハードウェア・ベースのシステムによって実施できることにも留意されたい。

Claims (28)

  1. コンピュータの情報処理により予測を生成する方法であって、
    プロセッサにより、第1の入力変数の履歴値についての入力データを受け取ることと、
    前記プロセッサにより、前記第1の入力変数の前記履歴値を用いて前記第1の入力変数の将来値についての予測データを作成することと、
    前記プロセッサにより、前記予測データの診断分析に基づいて診断データを生成することと、
    前記プロセッサにより、第1の認識プロセスからの第1の診断値を含む第1の診断変数を作成することであって、前記第1の認識プロセスは前記診断データに基づいて前記第1の診断値を決定する、作成することと、
    前記プロセッサにより、前記第1の診断変数と第2の診断変数との間の相関を識別することによって特徴ベクトルを決定する第2の認識プロセスに基づいて、前記特徴ベクトルを生成することと、
    前記プロセッサにより、前記特徴ベクトルを認識予測プロセスへの入力として用いて、最終予測を生成することと、
    を含む方法。
  2. 前記予測データを作成することは、前記第1の入力変数の前記履歴値に対して自己回帰モデルを用いることを含む、請求項1に記載の方法。
  3. 前記予測データを作成することは、前記予測データが複数の予測についてのデータを含むように、それぞれの予測期間について複数の予測を行うことを含む、請求項1に記載の方法。
  4. 前記診断データを生成することは、前記診断データがそれぞれの予測に関連付けられる診断結果についてのデータを含むように、前記複数の予測の各々に対して前記診断分析を行うことを含む、請求項3に記載の方法。
  5. 前記診断データを生成することは、複数の診断プロットについての画像データを生成することを含み、前記複数の診断プロットは、前記診断結果の各々についての診断プロットを含む、請求項4に記載の方法。
  6. 前記第1の認識プロセスは、前記診断プロットの少なくとも1つについての前記画像データを評価するために、畳み込みニューラル・ネットワーク(CNN)を用いることを含む、請求項5に記載の方法。
  7. 前記複数の診断プロットは、診断プロットの複数のグループを含み、診断プロットの各々のグループは、複数の異なる診断テストについてのプロットを含み、診断プロットの各々のグループは、それぞれの予測に関連付けられる、請求項5に記載の方法。
  8. 前記複数の異なる診断テストについての前記プロットは、正規化残差線プロット、残差ヒストグラム及び推定密度プロット、残差分位数(Q-Q)プロット、並びに残差自己相関プロットを含む、請求項7に記載の方法。
  9. 前記第1の認識プロセスは、前記複数の異なる診断テストのうちの第1のもののみについての画像データを評価するために第1のCNNを用いること、及び、前記複数の異なる診断テストのうちの第2のもののみについての画像データを評価するために第2のCNNを用いることを含む、請求項7に記載の方法。
  10. 前記第2の認識プロセスに基づいて前記特徴ベクトルを生成することは、ホップフィールド・ネットワークを、前記ホップフィールド・ネットワークのそれぞれ第1及び第2のノードにおける前記第1及び第2の診断変数とともに用いることを含む、請求項1に記載の方法。
  11. 前記ホップフィールド・ネットワークを用いて前記特徴ベクトルを生成することは、前記第1及び第2のノードの間のエッジについて前記ホップフィールド・ネットワークによって決定されたエッジ重みに基づいて、特徴値を前記特徴ベクトルに割り当てることを含む、請求項10に記載の方法。
  12. 前記最終予測を生成することは、前記特徴値を長短期メモリ(LSTM)ニューラル・ネットワークのための中期入力として用いることを含む、請求項11に記載の方法。
  13. 前記最終予測を生成することは、前記特徴値をLSTMニューラル・ネットワークのためのメモリ入力として用いることを含む、請求項11に記載の方法。
  14. プロセッサと、コンピュータ可読メモリと、コンピュータ可読ストレージ・デバイスと、前記メモリを介して前記プロセッサによって実行するための、前記ストレージ・デバイスに格納されたプログラム命令とを備え、前記格納されたプログラム命令は、
    前記プロセッサにより、第1の入力変数の履歴値についての入力データを受け取るためのプログラム命令と、
    前記プロセッサにより、前記第1の入力変数の前記履歴値を用いて前記第1の入力変数の将来値についての予測データを作成するためのプログラム命令と、
    前記プロセッサにより、前記予測データの診断分析に基づいて診断データを生成するためのプログラム命令と、
    前記プロセッサにより、第1の認識プロセスからの第1の診断値を含む第1の診断変数を作成するためのプログラム命令であって、前記第1の認識プロセスは前記診断データに基づいて前記第1の診断値を決定する、プログラム命令と、
    前記プロセッサにより、前記第1の診断変数と第2の診断変数との間の相関を識別することによって特徴ベクトルを決定する第2の認識プロセスに基づいて、前記特徴ベクトルを生成するためのプログラム命令と、
    前記プロセッサにより、前記特徴ベクトルを認識予測プロセスへの入力として用いて、最終予測を生成するためのプログラム命令と、
    を含む、
    コンピュータ・システム。
  15. 前記予測データを作成することは、前記第1の入力変数の前記履歴値に対して自己回帰モデルを用いることを含む、請求項14に記載のコンピュータ・システム。
  16. 前記予測データを作成することは、前記予測データが複数の予測についてのデータを含むように、それぞれの予測期間について複数の予測を行うことを含む、請求項14に記載のコンピュータ・システム。
  17. 前記診断データを生成することは、前記診断データがそれぞれの予測に関連付けられる診断結果についてのデータを含むように、前記複数の予測の各々に対して前記診断分析を行うことを含む、請求項16に記載のコンピュータ・システム。
  18. 前記診断データを生成することは、複数の診断プロットについての画像データを生成することを含み、前記複数の診断プロットは、前記診断結果の各々についての診断プロットを含む、請求項17に記載のコンピュータ・システム。
  19. 前記第1の認識プロセスは、前記診断プロットの少なくとも1つについての前記画像データを評価するために、畳み込みニューラル・ネットワーク(CNN)を用いることを含む、請求項18に記載のコンピュータ・システム。
  20. 前記複数の診断プロットは、診断プロットの複数のグループを含み、診断プロットの各々のグループは、複数の異なる診断テストについてのプロットを含み、診断プロットの各々のグループは、それぞれの予測に関連付けられる、請求項18に記載のコンピュータ・システム。
  21. 前記複数の異なる診断テストについての前記プロットは、正規化残差線プロット、残差ヒストグラム及び推定密度プロット、残差分位数(Q-Q)プロット、並びに残差自己相関プロットを含む、請求項20に記載のコンピュータ・システム。
  22. 前記第1の認識プロセスは、前記複数の異なる診断テストのうちの第1のもののみについての画像データを評価するために第1のCNNを用いること、及び、前記複数の異なる診断テストのうちの第2のもののみについての画像データを評価するために第2のCNNを用いることを含む、請求項20に記載のコンピュータ・システム。
  23. 前記第2の認識プロセスに基づいて前記特徴ベクトルを生成することは、ホップフィールド・ネットワークを、前記ホップフィールド・ネットワークのそれぞれ第1及び第2のノードにおける前記第1及び第2の診断変数とともに用いることを含む、請求項14に記載のコンピュータ・システム。
  24. 前記ホップフィールド・ネットワークを用いて前記特徴ベクトルを生成することは、前記第1及び第2のノードの間のエッジについて前記ホップフィールド・ネットワークによって決定されたエッジ重みに基づいて、特徴値を前記特徴ベクトルに割り当てることを含む、請求項23に記載のコンピュータ・システム。
  25. 前記最終予測を生成することは、前記特徴値を長短期メモリ(LSTM)ニューラル・ネットワークのための中期入力として用いることを含む、請求項24に記載のコンピュータ・システム。
  26. 前記最終予測を生成することは、前記特徴値をLSTMニューラル・ネットワークのためのメモリ入力として用いることを含む、請求項24に記載のコンピュータ・システム。
  27. コンピュータ上で実行されるときに請求項1~請求項13のいずれか1項に記載の方法を行うように適合されたプログラム・コード手段を含むコンピュータ・プログラム。
  28. 請求項27に記載のコンピュータ・プログラムを格納したコンピュータ可読ストレージ媒体。
JP2022532753A 2019-12-02 2020-11-25 深層コンター相関予測 Active JP7491653B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US16/700,340 US11586705B2 (en) 2019-12-02 2019-12-02 Deep contour-correlated forecasting
US16/700,340 2019-12-02
PCT/IB2020/061129 WO2021111252A1 (en) 2019-12-02 2020-11-25 Deep contour-correlated forecasting

Publications (2)

Publication Number Publication Date
JP2023505144A JP2023505144A (ja) 2023-02-08
JP7491653B2 true JP7491653B2 (ja) 2024-05-28

Family

ID=76091582

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022532753A Active JP7491653B2 (ja) 2019-12-02 2020-11-25 深層コンター相関予測

Country Status (6)

Country Link
US (1) US11586705B2 (ja)
JP (1) JP7491653B2 (ja)
CN (1) CN114762059A (ja)
DE (1) DE112020005914T5 (ja)
GB (1) GB2605719B (ja)
WO (1) WO2021111252A1 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016194248A1 (ja) 2015-06-03 2016-12-08 三菱電機株式会社 推論装置及び推論方法
WO2018029904A1 (ja) 2016-08-10 2018-02-15 パナソニックIpマネジメント株式会社 運転性向判定装置および運転性向判定システム

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6904335B2 (en) 2002-08-21 2005-06-07 Neal Solomon System, method and apparatus for organizing groups of self-configurable mobile robotic agents in a multi-robotic system
US8918162B2 (en) 2007-04-17 2014-12-23 Francine J. Prokoski System and method for using three dimensional infrared imaging to provide psychological profiles of individuals
US9020857B2 (en) 2009-02-11 2015-04-28 Johnathan C. Mun Integrated risk management process
WO2010124137A1 (en) * 2009-04-22 2010-10-28 Millennium Pharmacy Systems, Inc. Pharmacy management and administration with bedside real-time medical event data collection
US8873813B2 (en) 2012-09-17 2014-10-28 Z Advanced Computing, Inc. Application of Z-webs and Z-factors to analytics, search engine, learning, recognition, natural language, and other utilities
AU2013214801B2 (en) 2012-02-02 2018-06-21 Visa International Service Association Multi-source, multi-dimensional, cross-entity, multimedia database platform apparatuses, methods and systems
US20140324747A1 (en) * 2013-04-30 2014-10-30 Raytheon Company Artificial continuously recombinant neural fiber network
US20210169417A1 (en) * 2016-01-06 2021-06-10 David Burton Mobile wearable monitoring systems
CN105976049A (zh) 2016-04-28 2016-09-28 武汉宝钢华中贸易有限公司 基于混沌神经网络的库存预测模型及其构造方法
CA2998249A1 (en) * 2017-03-17 2018-09-17 Edatanetworks Inc. Artificial intelligence engine incenting merchant transaction with consumer affinity
US11147459B2 (en) * 2018-01-05 2021-10-19 CareBand Inc. Wearable electronic device and system for tracking location and identifying changes in salient indicators of patient health
US11379284B2 (en) 2018-03-13 2022-07-05 Nec Corporation Topology-inspired neural network autoencoding for electronic system fault detection
US10755229B2 (en) * 2018-04-11 2020-08-25 International Business Machines Corporation Cognitive fashion-ability score driven fashion merchandising acquisition
US20210248514A1 (en) * 2018-05-06 2021-08-12 Strong Force TX Portfolio 2018, LLC Artificial intelligence selection and configuration
CN109389244B (zh) 2018-09-06 2020-08-18 浙江鸿程计算机系统有限公司 一种基于gru的多因素感知短期景区内游客人数预测方法
CN109360097A (zh) 2018-09-28 2019-02-19 中山大学 基于深度学习的股票预测方法、装置、设备及存储介质
US10977030B2 (en) * 2018-10-08 2021-04-13 International Business Machines Corporation Predictive code clearance by a cognitive computing system
WO2020118273A2 (en) * 2018-12-07 2020-06-11 Warner Bros. Entertainment Inc. Trip-configurable content
CN109817338A (zh) 2019-02-13 2019-05-28 北京大学第三医院(北京大学第三临床医学院) 一种慢性病加重风险评估与告警系统
US11481620B2 (en) * 2019-07-29 2022-10-25 International Business Machines Corporation Intelligent retraining of deep learning models utilizing hyperparameter sets

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016194248A1 (ja) 2015-06-03 2016-12-08 三菱電機株式会社 推論装置及び推論方法
WO2018029904A1 (ja) 2016-08-10 2018-02-15 パナソニックIpマネジメント株式会社 運転性向判定装置および運転性向判定システム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
荒木孝治,"RとRコマンダーではじめる多変量解析",初版,株式会社日科技連出版社,2007年,特に、p. 68-72

Also Published As

Publication number Publication date
GB202208679D0 (en) 2022-07-27
DE112020005914T5 (de) 2022-09-22
JP2023505144A (ja) 2023-02-08
WO2021111252A1 (en) 2021-06-10
CN114762059A (zh) 2022-07-15
US20210166162A1 (en) 2021-06-03
GB2605719B (en) 2024-01-24
GB2605719A (en) 2022-10-12
US11586705B2 (en) 2023-02-21

Similar Documents

Publication Publication Date Title
US11860971B2 (en) Anomaly detection
US20180300621A1 (en) Learning dependencies of performance metrics using recurrent neural networks
US11681914B2 (en) Determining multivariate time series data dependencies
US20210397895A1 (en) Intelligent learning system with noisy label data
US11853877B2 (en) Training transfer-focused models for deep learning
US11263003B1 (en) Intelligent versioning of machine learning models
US11595269B1 (en) Identifying upgrades to an edge network by artificial intelligence
US11132623B2 (en) User adapted data presentation for data labeling
US10832173B1 (en) Cognitive software development
US11392821B2 (en) Detecting behavior patterns utilizing machine learning model trained with multi-modal time series analysis of diagnostic data
US20210110248A1 (en) Identifying and optimizing skill scarcity machine learning algorithms
Dube et al. AI gauge: Runtime estimation for deep learning in the cloud
US20230259117A1 (en) Asset health identification from multi-modality data analysis
US20210174191A1 (en) Automated fine-tuning of a pre-trained neural network for transfer learning
US20200410387A1 (en) Minimizing Risk Using Machine Learning Techniques
JP2023034537A (ja) 概念ドリフト検出のための装置、方法、及びシステム
JP7491653B2 (ja) 深層コンター相関予測
US20230045303A1 (en) Predicting a root cause of an alert using a recurrent neural network
US11741946B2 (en) Multiplicative integration in neural network transducer models for end-to-end speech recognition
US11314212B2 (en) HTM-based predictions for system behavior management
US11475296B2 (en) Linear modeling of quality assurance variables
US11734576B2 (en) Cooperative neural networks with spatial containment constraints
US20210158175A1 (en) Asset addition scheduling for a knowledge base
US11410054B2 (en) Cognitive prediction of problematic servers in unknown server group
US20220374701A1 (en) Differentiable temporal point processes for spiking neural networks

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20220601

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220609

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230424

TRDD Decision of grant or rejection written
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20240424

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240430

RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20240430

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240514

R150 Certificate of patent or registration of utility model

Ref document number: 7491653

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150