JP2017157213A - 予測分析のための時系列のデータ・セットを生成する方法及びデータ処理装置 - Google Patents

予測分析のための時系列のデータ・セットを生成する方法及びデータ処理装置 Download PDF

Info

Publication number
JP2017157213A
JP2017157213A JP2017030987A JP2017030987A JP2017157213A JP 2017157213 A JP2017157213 A JP 2017157213A JP 2017030987 A JP2017030987 A JP 2017030987A JP 2017030987 A JP2017030987 A JP 2017030987A JP 2017157213 A JP2017157213 A JP 2017157213A
Authority
JP
Japan
Prior art keywords
data
image
trend
time series
segment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017030987A
Other languages
English (en)
Other versions
JP6844301B2 (ja
Inventor
タウンセンド・ジョゼフ
Townsend Joseph
ロドリゲス・エドゥアルダ メンデス
Eduarda Mendes Rodrigues
ロドリゲス・エドゥアルダ メンデス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JP2017157213A publication Critical patent/JP2017157213A/ja
Application granted granted Critical
Publication of JP6844301B2 publication Critical patent/JP6844301B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/2163Partitioning the feature space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/067Enterprise or organisation modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching
    • G06F2218/16Classification; Matching by matching signal segments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • G06V10/443Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
    • G06V10/449Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
    • G06V10/451Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
    • G06V10/454Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Business, Economics & Management (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Economics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Analysis (AREA)
  • Quality & Reliability (AREA)
  • Multimedia (AREA)
  • Pure & Applied Mathematics (AREA)
  • Medical Informatics (AREA)
  • Game Theory and Decision Science (AREA)
  • Accounting & Taxation (AREA)
  • Mathematical Optimization (AREA)

Abstract

【課題】予測分析のための時系列のデータ・セットを、時系列データから生成する方法を提供すること。【解決手段】本方法は、時系列データを、均等なサイズでオーバーラップするデータのセグメントに分割し、各々のセグメントに関し、セグメントのデータを表現する画像を生成し、時系列データを利用して、各々の画像に関連するトレンドを決定し、生成された各画像及び関連するトレンドを前記データ・セットとして保存する工程を含む。方法の一実施形態では、各々保存されるデータ・セットからの画像は、予めトレーニングされた畳み込みニューラル・ネットワークを利用する特徴抽出プロセスにより、数値ベクトルに変換される。数値ベクトルはデータ・セットに関連付けて保存され、データ・セット及び関連する数値ベクトルは、何らかの時系列データから生成される新たな時系列画像に対するトレンドを予測するために使用される。【選択図】図2

Description

本発明は予測分析のための時系列データ・セットを生成する方法及び装置に関連する。
時系列データの将来的な傾向(又はトレンド)を予測するための現在の試みは、処理前数値データ又は処理前データの数学的な変換に基づいている。株式市場トレンド予測のような時系列データに明確なパターンが存在しないようなアプリケーション分野では、予測精度はしばしば相対的に低い。
時系列予測に対する多くの機械学習アプローチが過去に提案されており、例えば、回帰法又はニューラル・ネットワークに基づくものもある。しかしながら、これらのアプローチは、明らかなパターン又はトレンドが不足している時系列データについては苦戦を強いられ、そのようなデータの一例は、株式市場の時系列データである。ベンチマーク・モデルを凌ぐために、株式市場の変動方向を予測する多くのアプローチが提案されているが、テスト・データについて50%ないし65%というヒット率(すなわち、特定のモデルにより為された全ての予測のうち、正しい予測の割合)は、依然として平凡なものであり、このレンジのうち低い方はランダムな推測と大差のない同等なものでしかない。
データにおけるパターン又はトレンドが容易には認識できない状況において、時系列予測の精度を改善することが望ましい。
本発明の一側面による実施形態によれば、予測分析のための時系列のデータ・セットを、時系列データから生成するために、コンピュータで実行される方法が提供され、本方法は:前記時系列データを、均等なサイズでオーバーラップするデータのセグメントに分割する工程;各々のセグメントに関し、前記セグメントのデータを表現する画像を生成する工程;前記時系列データを利用して、各々の画像に関連するトレンドを決定する工程;及び、生成された各画像及び関連するトレンドを前記データ・セットとして保存する工程;を有する方法である。
本発明の実施形態による予測分析のためのデータ準備は、従来必要とされていたものと比較して複雑さを低減し、その理由は、差分化、統合、平滑化、外挿、ノイズ除去などのような処理前データを取り扱う際に必要とされていた従来の予備処理ステップを回避できるからである。
本発明を利用する方法は、予めトレーニングされた畳み込みニューラル・ネットワークを利用する特徴抽出プロセスにより、保存された各データ・セットからの画像を数値ベクトルに変換し、前記データ・セットに関連付けて前記数値ベクトルを保存する工程を更に有してもよい。畳み込みニューラル・ネットワーク(CNN)は、画像認識を実行することに非常に適しており、任意の画像データベースの分類に関して予めトレーニングすることが可能であり、これにより、画像間の類似性の識別を促進する。
データ・セット及び関連する数値ベクトルは、何らかの時系列データから生成された新たな時系列画像に対するトレンドを予測するために使用されてもよい。例えば、履歴データのうちの隣接する時間ウィンドウのトレンドは、問い合わせられた時間ウィンドウのトレンド・ラベルを予測することが可能な教師有り又は教師無し学習法をトレーニングするために使用されることが可能である。特に、本方法は:深層学習法を利用して、保存されたデータ・セットの各々について又は生成された画像のサブセットについて、数値ベクトル及びトレンドからトレンド予測モデルを導出し;導出された予測モデルを利用して、前記新たな時系列画像に対するトレンドを予測し;及び、新たな時系列画像に対して予測されたトレンドを出力する工程を更に有してもよい。
代替的に、最も類似する上位k個の過去の画像に対応する重み付けされた平均トレンドは、問い合わせられた期間の将来のトレンドについての予測として採用されることが可能である。特に、本方法は、生成された画像の各々について又は生成された画像のサブセットについて、生成された画像の数値ベクトルを利用して、画像と他の生成された画像各々との間の類似度を決定する工程を更に含んでもよい。生成された画像のうち新たな時系列画像に最も類似する所定数k個(kは整数)の画像が識別され、k個の識別された画像に関連するトレンドを利用は、平均トレンドを決定するために使用され、平均トレンドは、新たな時系列画像に対する予測トレンドとして出力される。
本発明の第2側面の実施形態によれば、予測分析のための時系列のデータ・セットを、時系列データから生成するように構成されるデータ処理装置が提供され、本装置は、データ準備手段を有し、データ準備手段は:時系列データを、均等なサイズでオーバーラップするデータのセグメントに分割し;各々のセグメントに関し、セグメントのデータを表現する画像を生成し;時系列データを利用して、各々の画像に関連するトレンドを決定し;及び、生成された各画像及び関連するトレンドをデータ・セットとして保存する;ように動作する。
本発明を組み込む装置において、データ準備手段は、予めトレーニングされた畳み込みニューラル・ネットワークを利用する特徴抽出プロセスにより、保存された各データ・セットからの画像を数値ベクトルに変換し、データ・セットに関連付けて数値ベクトルを保存するように動作してもよい。
本発明を組み込む装置は、データ・セット及び関連する数値ベクトルを利用して、何らかの時系列データから生成された新たな時系列画像に対するトレンドを予測するように構成されるトレンド予測手段を更に有してもよい。
この場合において、本装置は、深層学習法を利用して、保存されたデータ・セットの各々について又は生成された画像のサブセットについて、数値ベクトル及びトレンドからトレンド予測モデルを導出するように動作する分類器トレーニング手段を更に有し、トレンド予測手段は、導出されたトレンド予測モデルを利用して、新たな時系列画像に対するトレンドを予測し、新たな時系列画像に対して予測されたトレンドを出力するように動作する。
代替的に、本装置は、生成された画像の各々について又は生成された画像のサブセットについて、生成された画像の数値ベクトルを利用して、画像と他の生成された画像各々との間の類似度を決定することにより、画像類似度の結果を取得するように動作することが可能な分類器トレーニング手段を更に有してもよい。
この場合において、トレンド予測手段は、分類器トレーニング手段により取得された画像類似度の結果を利用して、生成された画像のうち新たな時系列画像に最も類似する所定数k個の画像を識別し(kは整数);k個の識別された画像に関連するトレンドを利用して、平均トレンドを決定し;及び、新たな時系列画像に対する予測トレンドとして、前記平均トレンドを出力する;ように動作することが可能である。
本発明を組み込む方法又は装置において、各セグメントは隣接する第1及び第2のサブ・セグメントのデータを有してもよく、第1のサブ・セグメントのデータはセグメントの画像を生成するために利用され、第2のサブ・セグメントのデータは画像に関連するトレンドを決定するように利用される。
本発明の第3側面の実施形態によれば、コンピュータで実行される場合に、本発明の第1側面を組み込む方法をコンピュータに実行させるコンピュータ・プログラムが提供される。
一例として、添付図面が参照される。
畳み込みニューラル・ネットワーク・アーキテクチャの一例を示す図。 本発明を組み込む装置を示す図。 本発明を組み込む装置における処理前時系列データの初期処理ステージを説明するための図。 本発明を組み込む装置における処理前時系列データの初期処理ステージを説明するための別の図。 本発明の実施形態で使用するルックアップ・テーブルの一例を示す図。 本発明を組み込む装置における初期処理ステージに続く画像変換ステージを示す図。 本発明の第1実施形態による画像類似度算出プロセスを示す図。 本発明の第2実施形態による教師あり学習プロセスを示す図。 本発明の第1実施形態によるトレンド予測を示す図。 本発明の第2実施形態によるトレンド予測を示す図。 本発明の第1及び第2実施形態の詳細な説明に使用する処理データのテーブルを示す図。 本発明の実施形態による図11のデータ処理の結果を示すテーブル。 図12のテーブルに記録される結果のルックアップ・テーブル。 図12のテーブルに示される結果に対応する特徴ベクトルを示すテーブル。 図12に記録される結果に対して実行される本発明を組み込むトレンド予測プロセスの結果を示すテーブル。 図3ないし6に関して説明されるプロセスを示すフローチャート。 図7及び8に関して説明されるプロセスを示すフローチャート。 図9及び10に関して説明されるプロセスを示すフローチャート。 本発明を組み込む方法を実行するのに適したコンピューティング・デバイスのブロック図。
この特許出願は、時系列データ・セットを生成する方法及び装置を提示し、その時系列データ・セットは時系列データの(ポジティブ又はネガティブな)将来的なトレンドの予測を支援するために使用されることが可能である。一実施形態において、方法/装置は、畳み込みニューラル・ネットワーク(convolutional neural networks:CNN)の機能を活用して画像認識を実行し、これにより、画像同士の間の類似度を識別する。
畳み込みニューラル・ネットワークは1つ以上の畳み込みレイヤを有する多層ニューラル・ネットワーク・アーキテクチャであり、その後にサブ・サンプリング・レイヤ(プーリング)及び1つ以上の完全に接続されたレイヤが続く。CNNは、深層学習(又はディープ・ラーニング)の形式によるものであり、画像分類タスクにおいて非常に良好に動作することが判明している。ディープ・ラーニング(Deep Learning:DL)は、所与のトレーニング・データ・セットに対する表現の複数のレベルを学習する機械学習法である。この方法は、その表現についての高いレベルで、データについてのより抽象的で本質的な特徴を抽出する。最も一般的なタイプのディープ・ラーニングは、ディープ・マルチレイヤ・ニューラル・ネットワークにより実行されるが、他のアーキテクチャを構成することも可能である。
数値データを利用する時系列予測は、例えば金融などのような或る種の分野では困難になることが判明しているが、本願において、発明者等は、時系列データで将来的なトレンドを予測する問題が、このデータを画像として表現することにより解決できることを提案している。本願では、処理前の数値的な時系列データを、特定の時間ウィンドウ(複数)のプロットを表現する一連の画像に変換するプロセスを、処理前データの「時系列画像化(time series imagification)」と呼び、その時間ウィンドウ(複数)は、プロセスのパラメータに依存して、時間的にオーバーラップしてもしなくてもよい。予めトレーニングされた畳み込みニューラル・ネットワーク(CNN)を利用して、複合的な特徴が、特徴ベクトルとして画像から抽出されることが可能であり、これらの特徴ベクトルは、予測アルゴリズムの入力として使用されることが可能である。CNNは、何らかの画像データベースの分類に関して予めトレーニングされることが可能である。所与の時間ウィンドウ内の時系列データの画像を仮定して、画像類似法を利用し、過去のものから類似する時系列データを読み出し、畳み込みニューラル・ネットワークにより取り出される特徴ベクトルを入力として使用する。各画像に関連するトレンドは、曲線フィッティング関数を利用して、未処理時系列データに基づいて決定されることが可能である。そして、k個の最も類似する過去の画像に対応する重み付け平均トレンドが、対象期間の将来的なトレンドの予測として採用されることが可能である。代替的に、履歴データからの隣接する時間ウィンドウのトレンドは、教師あり学習法(supervised learning method)をトレーニングするために使用されることが可能であり、教師あり学習法は対象の時間ウィンドウのトレンド・ラベルを予測することが可能である。
本発明の一実施形態では、入力データ(すなわち、ニューラル・ネットワーク又は他の機械学習に基づく予測システムへの入力用のデータ。このデータから対応する予測が為される。目下の例では、画像。)、及び、ターゲット・データ(すなわち、入力データである所与のベクトルに対応する予想される出力。目下の例では、画像に続くトレンド。)が、時系列の周期的なセグメントについて生成される。言い換えれば、数値的な時系列データの(複数の)画像による時系列である「メタ−時−系列(meta-time-series)」が生成される。
本願において、「特徴(feature)」という用語は、観測されるデータ又は現象の性質 (property)として定義されてよい。特徴は、数値的な値又は分類の値を有し、通常、アルゴリズム処理のためのN次元ベクトル空間として表現される(ここで、Nは特徴の総数に対応する)。「特徴抽出(feature extraction)」という用語は、元の未処理データの特徴についての何らかの変換により新たな特徴が導出されるデータ処理ステップとして、本願では定義される。ゴールは、有益な一群の特徴(又は特徴セット)を構築することであり、その特徴セットは、データの本質的な特性を表現することが可能であると同時に、特定のデータ・セットに対する過剰適合(overfitting)を避ける程度に十分に一包括的である。
提案される方法の実施形態が始まると、反復的に、利用可能な全ての時系列データを通じて循環し、規則的なオーバーラップ・インターバルでデータのプロットを保存する、又は、所定量の時間だけシフトされるウィンドウをスライドする。各々の画像に関し、後続の時間ウィンドウに関するトレンドも記録される。トレンドは、(例えば、0.21,-0.93等のように)数値形式で表現されてもよいし、或いは、(例えば、ポジティブ,ニュートラル,ネガティブ等のように)分類別の仕方で表現されてもよい。
生成される全ての画像は、その後、予めトレーニングされている畳み込みニューラル・ネットワーク(CNN)に与えられ、CNNは、特徴抽出のプロセスにより、全ての画像を数値ベクトルに変換する。
一実施形態では、所与の時系列セグメントに従うトレンドを予測するために、対応する画像のベクトル表現に類似尺度が適用され、類似する上位k個の画像を過去のデータから取り出す。これらの画像の各々に従う平均トレンドは、対象の時系列セグメントに従う予想されるトレンドとして使用される。平均トレンドは、各々の関連する画像の類似度により、或いは、適切な任意の他の数学的な関数により、重み付けされることが可能である。例えば、特定のアプリケーションが、より最近のデータを優遇するように意図される場合、より大きな重みを最近のトレンドに与えるために、時間減衰指数関数が使用されてもよい。
代替的な実施形態では、教師あり学習法を利用して、トレンド予測が実現されることも可能である。この場合、過去の画像及び各自のトレンドのサンプルが、教師あり分類器をトレーニングするために使用され、その分類器は、将来のトレンド・カテゴリ・ラベルをどのように予測するかを学習する(例えば、ポジティブなトレンドについては「1」;ニュートラルなトレンドについては「0」;或いは、ネガティブなトレンドについては「-1」)。
以下、本発明を組み込む方法及び装置を詳細に説明する。
図2は、画像類似及び機械学習法に基づいて、時系列予測システムを実現するデータ処理装置1を示す。図2に示されるように、本発明を組み込む装置は、データ準備、分類器トレーニング、及び、トレンド予測という3つの異なるステージに分けられ、これらの観点から以下詳細に説明される。
データ準備
本発明の実施形態によれば、データ準備ユニット10(データ準備手段)は、時系列データを、均等なサイズのオーバーラップするデータ・セグメントに分割すること;各々のセグメントのデータを表現する画像を生成すること;時系列データを利用して、各画像に関連するトレンドを決定すること;及び、生成された画像及び関連するトレンドのそれぞれをデータ・セットとして保存すること;を実行するように動作することが可能である。
「データ準備」及び「特徴抽出」については、図3ないし6を参照しながら説明される。図16は図3ないし6に関連して説明されるプロセスを示すフローチャートである。
図3に示されるように、利用可能な全ての時系列データにわたって反復的にサイクリング(又は循環)し、それを規則的に重複するインターバルWに分割することにより、或いは、所与の期間sだけシフトしたLwのウィンドウ長さを有するウィンドウをスライドさせることにより、一実施形態のプロセスが始まる。各々のインターバルWは、それ自身、次の2つの更に短いウィンドウに分割される:長さがLpである「現在ウィンドウ」Wp及び長さがLfである「将来ウィンドウ」Wf(ステップ1Aないし6)。
Wp内のデータは、そのデータのプロットを描写する画像に変換され、Wf内のデータは、最良に適合する直線の勾配として、そのデータのトレンドTfを算出するために使用される。トレンドは、(例えば、0.21,0.93等のように)数値の形式で表現されることも、或いは、(例えば、ポジティブ,ニュートラル,ネガティブ等のように)分類形式で表現されることも可能である。すなわち、Wpは或る画像を生成し、その画像に関する時系列データの類似度が比較され、Wfは、対応する画像が生成される期間に続く将来のトレンドを生成する。
図4に示されるように、長さLwで時間差sを有するオーバーラップする時間ウィンドウWiのスナップショットをn個取得するスライディング・ウィンドウ法を利用することで、時系列の画像化は、全てのデータが表現されるまで、固定期間sだけWの位置をシフトしながら、時系列全体に渡って反復される(注:図面に示される数値は単に説明を意図しているに過ぎない)(ステップ7ないし11)。
好ましくは、全ての画像が保存され(ステップ9)、それによって、画像はエンティティによって識別されることが可能になり、画像は、データを表現し且つプロットされたデータの開始及び終了の時点を表現する。例えば、株式市場予測の分野において、「AAPL_20150801_20150831.png」は、01/08/2015ないし31/08/2015の日付に対する株価AAPL(アップル・インコーポレーテッド)の終値のプロットを示す。
各々のウィンドウWに関するデータは、例えば、図5に示されるようにそれぞれ行形式で構造化されるルックアップ・テーブルに書き込まれ、各々の画像をデータにマッピングし、データはそれが表現する時間期間に関連して記録されるものである。
本実施形態のデータ準備ユニット10は、予めトレーニングされた畳み込みニューラル・ネットワークを利用して、特徴抽出プロセスにより、それぞれ保存されたデータ・セットから数値ベクトルへ画像を変換し、データ・セットに関連付けて数値ベクトルを保存するように動作することも可能である。
図6に示されるように、生成された全ての画像は、次に、事前にトレーニングされた畳み込みニューラル・ネットワーク(CNN)に与えられ、CNNは「深層」特徴抽出のプロセスにより、全ての画像を数値ベクトルに変換する(すなわち、機械学習技術により、モデルは、処理前入力ベクトルを新しいベクトル空間へ変換するようにトレーニングされる)。抽出される特徴ベクトルは、ニューラル・ネットワークの最後の完全結合層(fully- connected layer)の出力に対応するが、代替実施形態では、何れの完全結合層から抽出されてもよい(注:図に示されている数値は単なる例示に過ぎない)(ステップ12ないし14)。
分類器トレーニング
本実施形態のデータ処理装置1は分類器トレーニング・ユニット20(分類器トレーニング手段)を更に有し、分類器トレーニング・ユニット20は、図7に関連して後述されるような画像類似度算出プロセス、或いは、図8に関して後述されるようなトレンド予測学習プロセスに関する入力として数値ベクトルを使用するように動作する。図17は図7及び図8を参照しながら説明されるプロセスのフローチャートを示す。
特に、分類器トレーニング・ユニット20は次の(a)及び(b)のように動作する:(a)生成される画像の各々又は生成される画像のサブセットに関し、生成された画像に対する数値ベクトルを利用して、画像と他の生成された画像との間の類似度を決定する;及び/又は(b)深層学習法を利用して、数値ベクトルからのトレンド予測モデル、及び、保存されたデータ・セットの各々について又は生成された画像のサブセットについてのトレンドを導出する。すなわち、抽出された「深層」学習ベクトルは、類似度サーチ及び/又はトレンド予測学習プロセスに対する入力として使用される。
類似度サーチは、コサイン距離などのような簡易なベクトル類似尺度を利用して、或いは、k近傍法(k-Nearest Neighbours)等のような基本的な機械学習アルゴリズムにより、実行されることが可能であり(その機械学習アルゴリズムは、自動分類及び回帰タスクのために使用されることが可能であり、データ項目は、例えばコサイン尺度のようなベクトル類似度関数に基づいて、k個の近傍のクラスに応じて分類される)、それらは何れも、過去の時系列データのプールの中で、所与の時系列画像ベクトルに関し、上位k個の最も類似するベクトル(及びそれ故にk個の最も類似する画像)を識別する。図7は、CNNから抽出される「深層」特徴ベクトルに基づく画像類似度プロセスを示す。N×N型の類似度マトリクスのうち暗く影を伴う要素は、より高い類似スコアを示す(ここで、Nは時間ウィンドウ画像の総数である)(ステップ15,16,17A,18A)。
トレンド予測は、数値又は分類であるとすることが可能であり、教師無し又は教師有り学習アプローチを利用して実行されることが可能である。図8に示される教師あり学習アプローチでは、分類器トレーニング・ユニットは、データ予測ユニットにより提供される算出されたトレンド値/ラベル及びCNNを利用して抽出される「深層」特徴ベクトルを、トレーニング・データ・セットとして使用してトレーニングされ、そして、将来のトレンドの分類ラベル(例えば、ポジティブなトレンドについては「1」;ニュートラルなトレンドについては「0」;或いは、ネガティブなトレンドについては「-1」)に関して「深層」学習(deep learning:DL)モデルを導出する(ステップ15,16,17B,18B)。
トレンド予測
本実施形態のデータ処理装置1はトレンド予測モジュール30(トレンド予測手段)を更に有し、トレンド予測モジュール30は、データ・セット及び関連する数値ベクトルを利用して、新たな時系列データに対するトレンドを予測するように構成され、新たな時系列データは、処理された時系列データから生成されていてもいなくてもよい。
トレンド予測ユニットにより実行されるプロセスは、図9及び図10を参照しながら説明される。図18は図9及び図10を参照しながら説明されるプロセスのフローチャートを示す。
先ず、新たな時系列画像が新たな時間ウィンドウから導出され、「深層」特徴が画像から抽出される(ステップ19,20)。
一実施形態において、トレンド予測ユニットは、分類器トレーニング・ユニットにより決定される画像類似度の結果を利用して、生成された画像のうち、新たな時系列画像に最も類似する所定数個(k個)を識別し(ここでkは整数である);k個の識別された画像に関連するトレンドを使用して平均トレンドを決定し、新たな時系列画像に対する予測トレンドとして、平均トレンドを出力するように動作することが可能である。
特に、図9に示されるように、特定の時系列セグメントに従う将来のトレンドを予測するために、類似尺度が使用され、そのセグメントのプロットに対して最も類似する上位k個の画像(「上位k近傍の画像」)を抽出してもよい。対象とされるセグメントについての将来的なトレンド予測は、k個の類似画像の各々に関する平均トレンド(ポジティブ、ニュートラル又はネガティブ)として使用される。(ステップ21A,22A,23A)。
代替的な実施形態において、トレンド予測ユニットは、導出されたトレンド予測モデルを利用して新たな時系列画像に対するトレンドを予測し、新たな時系列画像に対する予測されたトレンドを出力するように動作することが可能である。
特に、図10に示されるように、トレーニングDLモデル(「教師あり学習アプローチ」)が、将来的なトレンドの予測に使用される。この場合において、「ディープ(又は深層)」特徴ベクトルが、CNNから対象とされる時間セグメントについて抽出される。そして、このベクトルは、トレンドの予測を出力するDLモデルを通じて伝達される。(ステップ21B,22B)
次に、本発明の実施形態がどのように実施されるかについての特定の具体例を説明する。この場合において、使用される具体例は、株式市場のトレンド(又は傾向)を予測することであるが、本発明の実施形態は他の分野でのデータ準備及びトレンド予測に適用されてよいことに留意を要する。
図11における時系列は、02/01/2014ないし31/12/2014のそれぞれの取引日に関するABBV(アッヴィ社(AbbVie Inc.))の株についての一群の終値である。
先ず、パラメータLp=10,Lf=5,s=3を利用して、上記のデータ準備法に従って、入力日及びターゲット日が図11の時系列から準備され(具体的なアプリケーションに応じて、他のパラメータが選択されることが可能である)、このデータに対して記録されている最初の3つの画像及びトレンドが図12に与えられており、図12からの値は、図13に示されるルックアップ・テーブルに保存される。
次に、生成された全ての株式市場時系列データが、予めトレーニングされた畳み込みニューラル・ネットワーク(CNN)に与えられ、CNNは、図14に示されるような特徴抽出のプロセスにより、全ての画像を数値ベクトルに変換する(注:図に示される数値は単なる一例に過ぎない)。この例は「ディープ」特徴ベクトルの抽出を示す。
提供されたクエリ画像(対象の画像)に関し、例えば、類似尺度は、図15の例に示されるような各画像に続く期間の関連するトレンドに沿って、上位k個の類似画像を抽出するために使用されてもよい。図15は、クエリ画像「ACE_2014-08-12_2014-08-25.png」について発見された上位k個の類似画像及び関連するトレンドを示し、その画像は12/08/2014ないし25/08/2014に渡る取引日の株価をプロットしている。クエリ画像に対する後続トレンドは、上位k個の類似画像の平均トレンドとして計算される。
図15の例を利用すると、25/08/2014以降のLf=5日間にわたる予測トレンドは、(0.92 + 0.87 + 0.79 + 0.91) / 4 = 0.8725という値をとる。
本発明の実施形態は、任意の時系列予測問題に適用されることが可能であり、以下、その具体例に言及する(ただし、具体例はそれらに限定されない)。
例えば、株式市場予測に加えて、他の金融アプリケーションは、為替レート予測、ビットコイン価格予測、あるいは、時系列に基づく任意のキー・パフォーマンス・インジケータ(key performance indicators:KPI)の予測を含む。これは、売上高、利益、損失などの予測のような他の商業分野に適用されてもよい。
可能性のある他のアプリケーションは、所定の話題に関する投稿数、同じ話題に投稿したユーザー数などのようなソーシャル・メディア・トレンドの予測を含む。
本発明は、ウェアラブル及びスマート・デバイス等のような様々な領域のデバイスから収集されるデータ、又は、オーディオ波形に関する予測及び分析を実行する手段も提供する。
本願で説明される実施形態は、本発明に従う時系列データから準備される画像からのトレンドの予測を含むが、過去のデータのうち類似するトレンドの画像を単に取り出すことでさえ、それは、各自の専門的な分析を行うためにそれらの画像を利用しようとする者にとって有用であろう。
例えば、画像類似サーチ法は、たとえ機械学習を当てにすることを希望しない場合でさえ、それ自体、データ分析のために有用なツールである。類似する過去の振る舞いの時系列セグメントを取り出す能力は、各自自身の分析及び予測を為すデータを発見する専門家にとって有益であろう。類似する画像に対応する日付についての情報は、ルックアップ・テーブルにおいて見出されることが可能である。
図19は本発明を組み込むデータ・ストレージ・サーバーのようなコンピューティング・デバイスのブロック図を示し、コンピューティング・デバイスは、実施形態による方法を実現するように使用され且つ実施形態による方法のタスクを実行するように使用されてよい。コンピューティング・デバイスは、コンピュータ処理ユニット(CPU)993、ランダム・アクセス・メモリ(RAM)995等のようなメモリ、及び、ハード・ディスク996等のようなストレージを有する。選択的に、コンピューティング・デバイスは、実施形態のそのような他のコンピューティング・デバイスと通信するためのネットワーク・インターフェース999も含む。例えば、実施形態はそのようなコンピューティング・デバイスのネットワークにより構成されてよい。選択的に、コンピューティング・デバイスは、リード・オンリ・メモリ994、キーボード及びマウス998等のような1つ以上の入力機構、1つ以上のモニタ997等のようなディスプレイ・ユニットも含んでいる。コンポーネントはバス992を介して互いに接続可能である。
CPU993は、コンピューティング・デバイスを制御し、処理動作を実行するように構成される。RAM995は、CPU993により読み込まれ及び書き込まれるデータを保存する。ストレージ・ユニット996は、例えば、不揮発性ストレージ・ユニットであってもよく、データを保存するように構成される。
ディスプレイ・ユニット997は、コンピューティング・デバイスにより保存されるデータの表現を表示し、且つ、ユーザーとコンピューティング・デバイスに保存されるプログラム及びデータとの間でやり取りを可能にするカーソル、ダイアログ・ボックス及びスクリーンを表示する。入力機構998は、コンピューティング・デバイスにデータ及び命令を入力することをユーザーに可能にする。
ネットワーク・インターフェース(ネットワークI/F)999は、インターネットのようなネットワークに接続され、ネットワークを介してそのような他のコンピューティング・デバイスと接続されることが可能である。ネットワークI/F999は、ネットワークを介する他の装置から/へのデータ入力/出力を制御する。マイクロフォン、スピーカ、プリンタ、電源ユニット、ファン、ケース、スキャナ、トラックボール等のような他のペリフェラル・デバイスが、コンピューティング・デバイスに含まれてもよい。
本発明を組み込む方法は、図19に示されるもののようなコンピューティング・デバイスで実行されてよい。そのようなコンピューティング・デバイスは、図19に示される全てのコンポーネントを有することは必須ではなく、これらのコンポーネントのうちの一部分により構成されてもよい。本発明を組み込む方法は、ネットワークを介して1つ以上のデータ・ストレージ・サーバーと通信する単独のコンピューティング・デバイスにより実行されてもよい。コンピューティング・デバイスは、少なくとも一部のデータを保存するデータ・ストレージ自体であってもよい。本発明を組み込む方法は、互いに協働して動作する複数のコンピューティング・デバイスにより実行されてもよい。複数のコンピューティング・デバイスのうちの1つ以上が、少なくとも一部のデータを保存するデータ・ストレージ・サーバーであってもよい。
本発明の実施形態は、ハードウェアで実現されてもよいし、1つ以上のプロセッサ上で動作するソフトウェア・モジュールとして実現されてもよいし、或いは、それらの組み合わせとして実現されてもよい。すなわち、マイクロプロセッサ又はディジタル信号プロセッサ(DSP)は、実際には、上記の機能のうちの全部又は一部を実現するために使用されてよいことを、当業者は認めるであろう。
本発明は本願で説明される方法のうちの全部又は一部を実行する1つ以上のデバイス又は装置のプログラム(例えば、コンピュータ・プログラム及びコンピュータ・プログラム・プロダクト)として組み込まれてもよい。本発明を組み込むそのようなプログラムは、コンピュータ読み取り可能な媒体に保存されてもよいし、或いは、例えば1つ以上の信号の形式で存在することも可能である。そのような信号は、インターネット・ウェブサイトからダウンロードされるデータ信号であってもよいし、或いは、キャリア信号又はその他の任意の形態で提供されてもよい。
本発明についての上記の実施形態は、有利なことに、他の任意の実施形態と独立して使用されてもよいし、或いは、1つ以上の他の実施形態と実現可能な任意の組み合わせで使用されてもよい。
以上の実施の形態に関し、更に以下の付記を開示する。
(付記1)
予測分析のための時系列のデータ・セットを、時系列データから生成するために、コンピュータで実行される方法であって:
前記時系列データを、均等なサイズでオーバーラップするデータのセグメントに分割する工程;
各々のセグメントに関し、前記セグメント内のデータを表現する画像を生成する工程;
前記時系列データを利用して、各々の画像に関連するトレンドを決定する工程;及び
生成された各画像及び関連するトレンドを前記データ・セットとして保存する工程;
を有する方法。
(付記2)
予めトレーニングされた畳み込みニューラル・ネットワークを利用して特徴抽出プロセスにより、保存された各データ・セットからの画像を数値ベクトルに変換し、前記データ・セットに関連付けて前記数値ベクトルを保存する工程を更に有する付記1に記載の方法。
(付記3)
前記データ・セット及び関連する数値ベクトルを利用して、何らかの時系列データから生成された新たな時系列画像に対するトレンドを予測する工程を更に有する付記2に記載の方法。
(付記4)
深層学習法を利用して、保存されたデータ・セットの各々について又は生成された画像のサブセットについて、前記数値ベクトル及びトレンドからトレンド予測モデルを導出する工程;
導出されたトレンド予測モデルを利用して、前記新たな時系列画像に対するトレンドを予測する工程;及び
前記新たな時系列画像に対して予測されたトレンドを出力する工程;
を更に有する付記3に記載の方法。
(付記5)
生成された画像の各々について又は生成された画像のサブセットについて、前記生成された画像の数値ベクトルを利用して、画像と他の生成された画像各々との間の類似度を決定する工程を更に有する付記3に記載の方法。
(付記6)
生成された画像のうち前記新たな時系列画像に最も類似する所定数k個の画像を識別する工程(kは整数);
k個の識別された画像に関連するトレンドを利用して、平均トレンドを決定する工程;
前記新たな時系列画像に対する予測トレンドとして、前記平均トレンドを出力する工程;
を更に有する付記5に記載の方法。
(付記7)
各々のセグメントは、隣接する第1及び第2のサブ・セグメントのデータを有し、前記第1のサブ・セグメントのデータは前記セグメントの画像を生成するために使用され、前記第2のサブ・セグメントのデータは前記画像に関連するトレンドを決定するために使用される、付記1ないし6のうち何れか一項に記載の方法。
(付記8)
予測分析のための時系列のデータ・セットを、時系列データから生成するように構成されるデータ処理装置であって、データ準備手段を有し、前記データ準備手段は:
前記時系列データを、均等なサイズでオーバーラップするデータのセグメントに分割し;
各々のセグメントに関し、前記セグメント内のデータを表現する画像を生成し;
前記時系列データを利用して、各々の画像に関連するトレンドを決定し;及び
生成された各画像及び関連するトレンドを前記データ・セットとして保存する;
ように動作することが可能である、データ処理装置。
(付記9)
前記データ準備手段は、更に、予めトレーニングされた畳み込みニューラル・ネットワークを利用して特徴抽出プロセスにより、保存された各データ・セットからの画像を数値ベクトルに変換し、前記データ・セットに関連付けて前記数値ベクトルを保存するように動作することが可能である、付記8に記載のデータ処理装置。
(付記10)
前記データ・セット及び関連する数値ベクトルを利用して、何らかの時系列データから生成された新たな時系列画像に対するトレンドを予測するように構成されるトレンド予測手段を更に有する付記9に記載のデータ処理装置。
(付記11)
深層学習法を利用して、保存されたデータ・セットの各々について又は生成された画像のサブセットについて、前記数値ベクトル及びトレンドからトレンド予測モデルを導出するように動作する分類器トレーニング手段;
を更に有し、前記トレンド予測手段は、
導出されたトレンド予測モデルを利用して、前記新たな時系列画像に対するトレンドを予測し、前記新たな時系列画像に対して予測されたトレンドを出力するように動作することが可能である;
付記10に記載のデータ処理装置。
(付記12)
生成された画像の各々について又は生成された画像のサブセットについて、前記生成された画像の数値ベクトルを利用して、画像と他の生成された画像各々との間の類似度を決定することにより、画像類似度の結果を取得するように動作することが可能な分類器トレーニング手段を更に有する付記10に記載のデータ処理装置。
(付記13)
前記トレンド予測手段は:
前記分類器トレーニング手段により取得された画像類似度の結果を利用して、生成された画像のうち前記新たな時系列画像に最も類似する所定数k個の画像を識別し(kは整数);
k個の識別された画像に関連するトレンドを利用して、平均トレンドを決定し;及び
前記新たな時系列画像に対する予測トレンドとして、前記平均トレンドを出力する;
ように動作することが可能である付記12に記載のデータ処理装置。
(付記14)
各々のセグメントは、隣接する第1及び第2のサブ・セグメントのデータを有し、前記データ準備手段は、前記第1のサブ・セグメントのデータを利用して前記セグメントの画像を生成し、前記第2のサブ・セグメントのデータを利用して前記画像に関連するトレンドを決定するように動作することが可能である、付記8ないし13のうち何れか一項に記載のデータ処理装置。
(付記15)
コンピュータで実行される場合に、付記1ないし7のうち何れか一項に記載の方法を前記コンピュータに実行させるコンピュータ・プログラム。
10:データ準備ユニット
20:分類器トレーニング・ユニット
30:トレンド予測ユニット

Claims (15)

  1. 予測分析のための時系列のデータ・セットを、時系列データから生成するために、コンピュータで実行される方法であって:
    前記時系列データを、均等なサイズでオーバーラップするデータのセグメントに分割する工程;
    各々のセグメントに関し、前記セグメント内のデータを表現する画像を生成する工程;
    前記時系列データを利用して、各々の画像に関連するトレンドを決定する工程;及び
    生成された各画像及び関連するトレンドを前記データ・セットとして保存する工程;
    を有する方法。
  2. 予めトレーニングされた畳み込みニューラル・ネットワークを利用して特徴抽出プロセスにより、保存された各データ・セットからの画像を数値ベクトルに変換し、前記データ・セットに関連付けて前記数値ベクトルを保存する工程を更に有する請求項1に記載の方法。
  3. 前記データ・セット及び関連する数値ベクトルを利用して、何らかの時系列データから生成された新たな時系列画像に対するトレンドを予測する工程を更に有する請求項2に記載の方法。
  4. 深層学習法を利用して、保存されたデータ・セットの各々について又は生成された画像のサブセットについて、前記数値ベクトル及びトレンドからトレンド予測モデルを導出する工程;
    導出されたトレンド予測モデルを利用して、前記新たな時系列画像に対するトレンドを予測する工程;及び
    前記新たな時系列画像に対して予測されたトレンドを出力する工程;
    を更に有する請求項3に記載の方法。
  5. 生成された画像の各々について又は生成された画像のサブセットについて、前記生成された画像の数値ベクトルを利用して、画像と他の生成された画像各々との間の類似度を決定する工程を更に有する請求項3に記載の方法。
  6. 生成された画像のうち前記新たな時系列画像に最も類似する所定数k個の画像を識別する工程(kは整数);
    k個の識別された画像に関連するトレンドを利用して、平均トレンドを決定する工程;
    前記新たな時系列画像に対する予測トレンドとして、前記平均トレンドを出力する工程;
    を更に有する請求項5に記載の方法。
  7. 各々のセグメントは、隣接する第1及び第2のサブ・セグメントのデータを有し、前記第1のサブ・セグメントのデータは前記セグメントの画像を生成するために使用され、前記第2のサブ・セグメントのデータは前記画像に関連するトレンドを決定するために使用される、請求項1ないし6のうち何れか一項に記載の方法。
  8. 予測分析のための時系列のデータ・セットを、時系列データから生成するように構成されるデータ処理装置であって、データ準備手段を有し、前記データ準備手段は:
    前記時系列データを、均等なサイズでオーバーラップするデータのセグメントに分割し;
    各々のセグメントに関し、前記セグメント内のデータを表現する画像を生成し;
    前記時系列データを利用して、各々の画像に関連するトレンドを決定し;及び
    生成された各画像及び関連するトレンドを前記データ・セットとして保存する;
    ように動作することが可能である、データ処理装置。
  9. 前記データ準備手段は、更に、予めトレーニングされた畳み込みニューラル・ネットワークを利用して特徴抽出プロセスにより、保存された各データ・セットからの画像を数値ベクトルに変換し、前記データ・セットに関連付けて前記数値ベクトルを保存するように動作することが可能である、請求項8に記載のデータ処理装置。
  10. 前記データ・セット及び関連する数値ベクトルを利用して、何らかの時系列データから生成された新たな時系列画像に対するトレンドを予測するように構成されるトレンド予測手段を更に有する請求項9に記載のデータ処理装置。
  11. 深層学習法を利用して、保存されたデータ・セットの各々について又は生成された画像のサブセットについて、前記数値ベクトル及びトレンドからトレンド予測モデルを導出するように動作する分類器トレーニング手段;
    を更に有し、前記トレンド予測手段は、
    導出されたトレンド予測モデルを利用して、前記新たな時系列画像に対するトレンドを予測し、前記新たな時系列画像に対して予測されたトレンドを出力するように動作することが可能である;
    請求項10に記載のデータ処理装置。
  12. 生成された画像の各々について又は生成された画像のサブセットについて、前記生成された画像の数値ベクトルを利用して、画像と他の生成された画像各々との間の類似度を決定することにより、画像類似度の結果を取得するように動作することが可能な分類器トレーニング手段を更に有する請求項10に記載のデータ処理装置。
  13. 前記トレンド予測手段は:
    前記分類器トレーニング手段により取得された画像類似度の結果を利用して、生成された画像のうち前記新たな時系列画像に最も類似する所定数k個の画像を識別し(kは整数);
    k個の識別された画像に関連するトレンドを利用して、平均トレンドを決定し;及び
    前記新たな時系列画像に対する予測トレンドとして、前記平均トレンドを出力する;
    ように動作することが可能である請求項12に記載のデータ処理装置。
  14. 各々のセグメントは、隣接する第1及び第2のサブ・セグメントのデータを有し、前記データ準備手段は、前記第1のサブ・セグメントのデータを利用して前記セグメントの画像を生成し、前記第2のサブ・セグメントのデータを利用して前記画像に関連するトレンドを決定するように動作することが可能である、請求項8ないし13のうち何れか一項に記載のデータ処理装置。
  15. コンピュータで実行される場合に、請求項1ないし7のうち何れか一項に記載の方法を前記コンピュータに実行させるコンピュータ・プログラム。
JP2017030987A 2016-02-29 2017-02-22 予測分析のための時系列のデータ・セットを生成する方法及びデータ処理装置 Active JP6844301B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB1603472.0 2016-02-29
GB1603472.0A GB2547712A (en) 2016-02-29 2016-02-29 Method and apparatus for generating time series data sets for predictive analysis

Publications (2)

Publication Number Publication Date
JP2017157213A true JP2017157213A (ja) 2017-09-07
JP6844301B2 JP6844301B2 (ja) 2021-03-17

Family

ID=55807059

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017030987A Active JP6844301B2 (ja) 2016-02-29 2017-02-22 予測分析のための時系列のデータ・セットを生成する方法及びデータ処理装置

Country Status (3)

Country Link
US (1) US10185893B2 (ja)
JP (1) JP6844301B2 (ja)
GB (1) GB2547712A (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019163141A1 (ja) 2018-02-26 2019-08-29 株式会社日立情報通信エンジニアリング 状態予測装置および状態予測制御方法
WO2019190053A1 (ko) * 2018-03-30 2019-10-03 유치헌 순환신경망을 사용한 딥 러닝 기반의 주식 가격 예측 시스템 및 방법
JP2020022101A (ja) * 2018-08-01 2020-02-06 キヤノン株式会社 監視装置、生産ライン、および監視装置の制御方法
JP2020020604A (ja) * 2018-07-30 2020-02-06 トヨタ自動車株式会社 電池情報処理システム、二次電池の容量推定方法、ならびに、組電池、および、その組電池の製造方法
KR20200034545A (ko) * 2018-09-21 2020-03-31 키스트-유로페 포르슝스게젤샤프트 엠비에치 중첩 산점도를 이용한 데이터 변환 방법 및 장치
WO2020083381A1 (zh) * 2018-10-25 2020-04-30 杭州海康威视数字技术股份有限公司 数据库表的区域切分方法、装置、设备及存储介质
JP2020166315A (ja) * 2019-03-28 2020-10-08 ブラザー工業株式会社 学習データの生成方法、トレーニング方法、予測モデル、コンピュータプログラム
KR20210014452A (ko) * 2019-07-30 2021-02-09 스퀘어네트 주식회사 제조 공정 비정상 데이터 탐지 시스템
JP2021033792A (ja) * 2019-08-27 2021-03-01 富士通株式会社 判定処理プログラム、判定処理方法および判定処理装置
US11263258B2 (en) 2019-03-15 2022-03-01 Fujitsu Limited Information processing method, information processing apparatus, and non-transitory computer-readable storage medium for storing information processing program of scoring with respect to combination of imaging method and trained model
US11307257B2 (en) 2018-07-31 2022-04-19 Toyota Jidosha Kabushiki Kaisha Battery information processing system, method of estimating capacity of secondary battery, and battery assembly and method of manufacturing battery assembly

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180232807A1 (en) * 2015-10-28 2018-08-16 Fractal Industries, Inc. Advanced decentralized financial decision platform
US10885464B1 (en) * 2016-10-31 2021-01-05 EMC IP Holding Company LLC Relevance decay for time-based evaluation of machine learning applications
US10891545B2 (en) * 2017-03-10 2021-01-12 International Business Machines Corporation Multi-dimensional time series event prediction via convolutional neural network(s)
JP6885896B2 (ja) * 2017-04-10 2021-06-16 富士フイルム株式会社 自動レイアウト装置および自動レイアウト方法並びに自動レイアウトプログラム
US10817757B2 (en) * 2017-07-31 2020-10-27 Splunk Inc. Automated data preprocessing for machine learning
EP3451231A1 (en) * 2017-08-31 2019-03-06 Fujitsu Limited Imagification of multivariate data
CN108197706B (zh) * 2017-11-27 2021-07-30 华南师范大学 残缺数据深度学习神经网络方法、装置、计算机设备及存储介质
EP3495220B1 (en) 2017-12-11 2024-04-03 Volvo Car Corporation Path prediction for a vehicle
CN110019401B (zh) * 2017-12-25 2024-04-05 顺丰科技有限公司 件量预测方法、装置、设备及其存储介质
CN110032745A (zh) * 2018-01-11 2019-07-19 富士通株式会社 生成传感器数据的方法和设备及计算机可读存储介质
CN108399409B (zh) * 2018-01-19 2019-06-18 北京达佳互联信息技术有限公司 图像分类方法、装置及终端
US11244224B2 (en) * 2018-03-20 2022-02-08 International Business Machines Corporation Comparing time series data using context-based similarity
KR102565278B1 (ko) 2018-03-26 2023-08-09 삼성전자주식회사 영상 분할 방법, 영상 분할 장치, 및 영상 분할을 위한 학습 방법
US12014267B2 (en) * 2018-07-13 2024-06-18 Arizona Board Of Regents On Behalf Of Arizona State University Systems and methods for sequential event prediction with noise-contrastive estimation for marked temporal point process
CN109272344A (zh) * 2018-08-07 2019-01-25 阿里巴巴集团控股有限公司 模型训练方法和装置、数据预测方法和装置、服务器
US11024288B2 (en) 2018-09-04 2021-06-01 Gracenote, Inc. Methods and apparatus to segment audio and determine audio segment similarities
US20200155078A1 (en) * 2018-11-16 2020-05-21 International Business Machines Corporation Health monitoring using artificial intelligence based on sensor data
US20200160447A1 (en) * 2018-11-18 2020-05-21 Trendalyze Inc. Motif search and prediction in temporal trading systems
US11714397B2 (en) * 2019-02-05 2023-08-01 Samsung Display Co., Ltd. System and method for generating machine learning model with trace data
JP7010861B2 (ja) * 2019-02-07 2022-01-26 ファナック株式会社 状態判定装置及び状態判定方法
CN111768214A (zh) * 2019-03-14 2020-10-13 北京京东尚科信息技术有限公司 产品属性的预测方法、系统、设备和存储介质
US11373298B2 (en) * 2019-03-28 2022-06-28 Canon Medical Systems Corporation Apparatus and method for training neural networks using small, heterogeneous cohorts of training data
CN111798018A (zh) * 2019-04-09 2020-10-20 Oppo广东移动通信有限公司 行为预测方法、装置、存储介质及电子设备
EP3968247A4 (en) * 2019-06-21 2022-12-21 Siemens Aktiengesellschaft METHOD AND DEVICE FOR ELECTRIC LOAD DATA PREDICTION AND INFORMATION HOLDER
US11768912B2 (en) * 2019-07-12 2023-09-26 International Business Machines Corporation Performing multivariate time series prediction with three-dimensional transformations
CN110414442B (zh) * 2019-07-31 2022-04-01 广东省智能机器人研究院 一种压力时序数据分段特征值预测方法
US11314984B2 (en) 2019-08-20 2022-04-26 International Business Machines Corporation Intelligent generation of image-like representations of ordered and heterogenous data to enable explainability of artificial intelligence results
KR102145374B1 (ko) 2020-01-17 2020-08-18 성균관대학교산학협력단 시각화된 특징벡터와 결합된 인공 지능 신경망 장치 및 이의 데이터 분류 방법
US11995749B2 (en) * 2020-01-23 2024-05-28 Disney Enterprises, Inc. Rig-space neural rendering of digital assets
CN110991775B (zh) * 2020-03-02 2020-06-26 北京全路通信信号研究设计院集团有限公司 一种基于深度学习的轨道交通客流需求预测方法和装置
CN111709784B (zh) * 2020-06-18 2023-05-30 抖音视界有限公司 用于生成用户留存时间的方法、装置、设备和介质
US20220138778A1 (en) * 2020-10-30 2022-05-05 Jpmorgan Chase Bank, N.A. Method and system for using deep video prediction for economic forecasting
US11263172B1 (en) * 2021-01-04 2022-03-01 International Business Machines Corporation Modifying a particular physical system according to future operational states
CN112929215B (zh) * 2021-02-04 2022-10-21 博瑞得科技有限公司 一种网络流量预测方法、系统、计算机设备及存储介质
US11790049B1 (en) * 2021-03-31 2023-10-17 Amazon Technologies, Inc. Techniques for improving machine-learning accuracy and convergence
CN114860535A (zh) * 2022-04-18 2022-08-05 地平线征程(杭州)人工智能科技有限公司 数据评估模型生成方法及装置、异常数据监控方法及装置
CN116452984B (zh) * 2023-06-14 2023-09-08 四川三思德科技有限公司 基于氧含量数据的火势识别预测方法和系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005216202A (ja) * 2004-02-02 2005-08-11 Fuji Heavy Ind Ltd 未来値予測装置および未来値予測方法
JP2008116588A (ja) * 2006-11-01 2008-05-22 National Institute Of Advanced Industrial & Technology 特徴抽出装置及び方法並びにプログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1251433A3 (en) 2001-04-20 2003-08-27 Fraunhofer-Gesellschaft Zur Förderung Der Angewandten Forschung E.V. A method for segmentation and identification of nonstationary time series
JP2004110438A (ja) * 2002-09-18 2004-04-08 Nec Corp 画像処理装置、画像処理方法及びプログラム
US20090175539A1 (en) * 2008-01-09 2009-07-09 Authorizer Technologies, Inc. Method and system for swipe sensor image alignment using fourier phase analysis
US8379961B2 (en) * 2008-07-03 2013-02-19 Nec Laboratories America, Inc. Mitotic figure detector and counter system and method for detecting and counting mitotic figures

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005216202A (ja) * 2004-02-02 2005-08-11 Fuji Heavy Ind Ltd 未来値予測装置および未来値予測方法
JP2008116588A (ja) * 2006-11-01 2008-05-22 National Institute Of Advanced Industrial & Technology 特徴抽出装置及び方法並びにプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
中山敦貴 ほか: "高頻度板情報の時空間パターン分析による株価動向推定", 人工知能学会 金融情報学研究会(SIG−FIN) 第15回研究会 [ONLINE], JPN6020033433, 26 September 2015 (2015-09-26), pages 1 - 4, ISSN: 0004341194 *

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019163141A1 (ja) 2018-02-26 2019-08-29 株式会社日立情報通信エンジニアリング 状態予測装置および状態予測制御方法
WO2019190053A1 (ko) * 2018-03-30 2019-10-03 유치헌 순환신경망을 사용한 딥 러닝 기반의 주식 가격 예측 시스템 및 방법
JP2020020604A (ja) * 2018-07-30 2020-02-06 トヨタ自動車株式会社 電池情報処理システム、二次電池の容量推定方法、ならびに、組電池、および、その組電池の製造方法
US11307257B2 (en) 2018-07-31 2022-04-19 Toyota Jidosha Kabushiki Kaisha Battery information processing system, method of estimating capacity of secondary battery, and battery assembly and method of manufacturing battery assembly
JP2020022101A (ja) * 2018-08-01 2020-02-06 キヤノン株式会社 監視装置、生産ライン、および監視装置の制御方法
KR20200034545A (ko) * 2018-09-21 2020-03-31 키스트-유로페 포르슝스게젤샤프트 엠비에치 중첩 산점도를 이용한 데이터 변환 방법 및 장치
KR102163155B1 (ko) 2018-09-21 2020-10-08 한국과학기술연구원 유럽연구소 중첩 산점도를 이용한 데이터 변환 방법 및 장치
WO2020083381A1 (zh) * 2018-10-25 2020-04-30 杭州海康威视数字技术股份有限公司 数据库表的区域切分方法、装置、设备及存储介质
CN111104569A (zh) * 2018-10-25 2020-05-05 杭州海康威视数字技术股份有限公司 数据库表的区域切分方法、装置及存储介质
CN111104569B (zh) * 2018-10-25 2023-10-20 杭州海康威视数字技术股份有限公司 数据库表的区域切分方法、装置及存储介质
US11263258B2 (en) 2019-03-15 2022-03-01 Fujitsu Limited Information processing method, information processing apparatus, and non-transitory computer-readable storage medium for storing information processing program of scoring with respect to combination of imaging method and trained model
JP7299560B2 (ja) 2019-03-28 2023-06-28 ブラザー工業株式会社 学習データの生成方法、トレーニング方法、予測モデル、コンピュータプログラム
JP2020166315A (ja) * 2019-03-28 2020-10-08 ブラザー工業株式会社 学習データの生成方法、トレーニング方法、予測モデル、コンピュータプログラム
KR102265461B1 (ko) * 2019-07-30 2021-06-15 스퀘어네트 주식회사 제조 공정 비정상 데이터 탐지 시스템
KR20210014452A (ko) * 2019-07-30 2021-02-09 스퀘어네트 주식회사 제조 공정 비정상 데이터 탐지 시스템
JP2021033792A (ja) * 2019-08-27 2021-03-01 富士通株式会社 判定処理プログラム、判定処理方法および判定処理装置
JP7293988B2 (ja) 2019-08-27 2023-06-20 富士通株式会社 学習プログラム、判定処理プログラム、学習装置、判定処理装置、学習方法および判定処理方法

Also Published As

Publication number Publication date
US10185893B2 (en) 2019-01-22
US20170249534A1 (en) 2017-08-31
GB2547712A (en) 2017-08-30
GB201603472D0 (en) 2016-04-13
JP6844301B2 (ja) 2021-03-17

Similar Documents

Publication Publication Date Title
JP6844301B2 (ja) 予測分析のための時系列のデータ・セットを生成する方法及びデータ処理装置
US11586880B2 (en) System and method for multi-horizon time series forecasting with dynamic temporal context learning
Adetunji et al. House price prediction using random forest machine learning technique
Kotu et al. Predictive analytics and data mining: concepts and practice with rapidminer
Shrivastava et al. Failure prediction of Indian Banks using SMOTE, Lasso regression, bagging and boosting
US20120173465A1 (en) Automatic Variable Creation For Adaptive Analytical Models
WO2020108396A1 (zh) 视频分类的方法以及服务器
Lee et al. Hidden markov models for forex trends prediction
Stavinova et al. Predictability classes for forecasting clients behavior by transactional data
CN114491267A (zh) 一种物品的推荐方法、装置以及存储介质
Kumari et al. Importance of data standardization methods on stock indices prediction accuracy
Mern et al. Using bitcoin ledger network data to predict the price of bitcoin
JP2015228182A (ja) 変化点検出装置、変化点検出方法、及びコンピュータプログラム
Cortez et al. Third special issue on knowledge discovery and business intelligence
Quan Stock prediction by searching similar candlestick charts
Strozzi et al. Trend and seasonality features extraction with pre-trained CNN and recurrence plot
JP5826893B1 (ja) 変化点予測装置、変化点予測方法、及びコンピュータプログラム
Abiodun et al. A comparative analysis of stock series prediction of apple and google datasets using deep learning
Singh et al. Predicting Closing Price of Five Stocks Using CNN and RNN Combined with Technical Indicators
Srivastava et al. Stock Market Prediction using Optimised LSTM Model
CN117350819A (zh) 基于流式数据的商品智能排序方法及系统
Altun et al. Machine Learning and Knowledge Discovery in Databases: European Conference, ECML PKDD 2017, Skopje, Macedonia, September 18–22, 2017, Proceedings, Part III
Nussipova et al. Optimizing loss functions for improved energy demand prediction in smart power grids.
Filsafan et al. Ensemble Imputation Method for Forecasting Indonesia Sugar Dataset Using Machine Learning
Aggarwal Machine Learning: A Gateway for Stock Market Predictions

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191112

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200820

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200908

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201109

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210126

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210208

R150 Certificate of patent or registration of utility model

Ref document number: 6844301

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150