JP6997133B2 - ピボットテーブル構造のolap結果を用いたディープラーニング予測データ反映システム - Google Patents

ピボットテーブル構造のolap結果を用いたディープラーニング予測データ反映システム Download PDF

Info

Publication number
JP6997133B2
JP6997133B2 JP2019093340A JP2019093340A JP6997133B2 JP 6997133 B2 JP6997133 B2 JP 6997133B2 JP 2019093340 A JP2019093340 A JP 2019093340A JP 2019093340 A JP2019093340 A JP 2019093340A JP 6997133 B2 JP6997133 B2 JP 6997133B2
Authority
JP
Japan
Prior art keywords
dimension
data
tree
node
pivot table
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019093340A
Other languages
English (en)
Other versions
JP2020119487A (ja
Inventor
ソンミン ホワン
ソンフン チョン
サンウ パク
ヒョンギュ コン
ミンク パク
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BI MATRIX CO Ltd
Original Assignee
BI MATRIX CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BI MATRIX CO Ltd filed Critical BI MATRIX CO Ltd
Publication of JP2020119487A publication Critical patent/JP2020119487A/ja
Application granted granted Critical
Publication of JP6997133B2 publication Critical patent/JP6997133B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

本発明は、オンライン分析処理(OLAP:Online Analytical Processing)に基づいて生成されたピボットテーブル構造のデータセットに対して、時系列的特性を有するデータセットを検出してディープラーニング(Deep Learning、深層学習)方式で予測し、予測データセットをピボットテーブル構造に反映させる、ピボットテーブル構造のOLAP結果を用いたディープラーニング予測データ反映システムに関する。
一般に、オンライン分析処理(Online Analytical Processing)システム、すなわち、OLAPシステムは、意思決定支援システムの代表的な例であって、データを複数の基準(次元)を用いて分析することができる多次元分析を可能にする。
従来技術のOLAPシステムは、すでに構築されたデータをさまざまな側面から提供して、定型化された形で提供する。しかし、OLAPシステムは、過去のデータを複数の基準で分析し、現象を理解できるように助けるが、将来の予測を示すことはできない。万が一、OLAPシステムがデータを細分化しながらデータに対する将来の予測をも示すことができれば、意思決定するのに役立つであろう。
ところが、OLAPシステムは、さまざまな側面(または多次元)でデータを示すために、通常ピボットテーブル構造でデータセットを表示する。ピボットテーブルは、横軸(行)と縦軸(カラム)がそれぞれの次元名(項目名など)で構成され、横軸(行)と縦軸(カラム)が触れ合うセルがデータ領域として構成されるテーブル形式である。すなわち、ピボットテーブルは、複数の次元(多次元)の組み合わせによりデータ値を示す。
すなわち、OLAP結果であるピボットテーブル(Tabular)の構造は、多次元構成に応じて深さと形式が変化する。ピボットテーブル構造形式においては、データを予測しにくく、データを予測するとしてもその予測結果をピボットテーブル構造形式に反映するのが難しい。
韓国登録特許第1034428号(2011.05.12.公告) 日本公開特許第2002-007435号(2002.01.11.公告) 韓国登録特許第0969656号(2010.07.14.公告) 韓国登録特許第0424144号(2004.03.24.公告)
本発明は、上述した問題を解決するためのもので、その目的は、OLAP(Online Analytical Processing)に基づいて生成されたピボットテーブル構造のデータセットに対して、時系列的特性を有するデータセットを検出してディープラーニング方式で予測し、予測データセットをピボットテーブル構造に反映させる、ピボットテーブル構造のOLAP結果を用いたディープラーニング予測データ反映システムを提供することである。
特に、本発明の目的は、ピボットテーブル構造から階層構造の次元を抽出し、これを用いて、ピボットテーブル構造のデータセットをレコード構造(またはデータフレーム構造)のデータセットとして再構成し、再構成されたデータセットを用いてディープラーニング予測を行う、ピボットテーブル構造のOLAP結果を用いたディープラーニング予測データ反映システムを提供することである。
上記目的を達成するために、本発明は、ピボットテーブル構造のOLAP結果を用いたディープラーニング予測データ反映システムに関するものであり、
ピボットテーブル構造のデータセットを受信するデータセット受信部と;ピボットテーブル構造のデータセットから、データ次元を階層構造で有する行次元ツリー及び列次元ツリーを生成する次元抽出部と;前記行次元ツリーと列次元ツリーとを結合して統合ツリーを生成し、統合ツリーからレコード構造のデータセットを形成するフレーム変換部と;レコード構造のデータセットを対象としてディープラーニングを用いて予測するデータ予測部と;予測データが追加されたレコードデータセットを用いて前記統合ツリーを再構成し、再構成された統合ツリーを用いてピボットテーブルを再構成するデータ再構成部と;を含むことを特徴とする。
また、本発明は、ピボットテーブル構造のOLAP結果を用いたディープラーニング予測データ反映システムにおいて、前記次元抽出部は、前記ピボットテーブルの行次元と列次元の階層構造に基づいてそれぞれの行次元ツリー及び列次元ツリーを構成し、各次元ツリーのルートノードを仮想ノードとして設定し、前記ピボットテーブルの各次元名を1つのノードに対応させてそれぞれのノードを生成し、上位次元と下位次元の関係に基づいて、ノード間の上位及び下位の関係を設定し、次元ツリーの各ノードが次元名を持つように設定し、次元の上位または下位の関係に基づいて、各ノードを上位ノードまたは下位ノードとして階層的に構成することを特徴とする。
また、本発明は、ピボットテーブル構造のOLAP結果を用いたディープラーニング予測データ反映システムにおいて、前記次元抽出部は、前記次元ツリーにおいて、上位カテゴリの各ノードが、同様に、下位カテゴリの全てのノードを持つように構成することを特徴とする。
また、本発明は、ピボットテーブル構造のOLAP結果を用いたディープラーニング予測データ反映システムにおいて、前記次元抽出部は、メジャーを持つ次元ツリーに対して、メジャーノードにデータ値を持つデータノードを接続させ、前記ピボットテーブルのデータ領域のメジャーのデータセットの数に見合う分だけ次元ツリーを生成することを特徴とする。
また、本発明は、ピボットテーブル構造のOLAP結果を用いたディープラーニング予測データ反映システムにおいて、前記フレーム変換部は、メジャーを持つ次元ツリーを下位ツリーとし、残りのツリーを上位ツリーとすることで、上位ツリーのリーフノードが下位ツリーのルートノードとなるように、2つの次元ツリーを統合することを特徴とする。
また、本発明は、ピボットテーブル構造のOLAP結果を用いたディープラーニング予測データ反映システムにおいて、前記フレーム変換部は、各メジャーに対して、メジャーの次元名をフィールドと設定し、当該メジャーのデータ値を当該フィールドのフィールド値とし、メジャーノードの上位ノードのカテゴリをフィールドと設定し、当該カテゴリの次元名を当該フィールドのフィールド値とすることで、メジャーノードの上位ノードの次元名とメジャーのデータ値とを用いて1つのレコードを構成することを特徴とする。
また、本発明は、ピボットテーブル構造のOLAP結果を用いたディープラーニング予測データ反映システムにおいて、前記データ予測部は、レコード構造のデータセットにおいて、時系列データを持つフィールドを対象として次のサイクルのメジャーフィールドのデータ値を予測するが、時系列の次元を除いた残りの次元の組み合わせごとに予測データを得、時系列次元のデータは、次のサイクルの、組み合わせごとに予測したデータを、レコードとして形成することを特徴とする。
また、本発明は、ピボットテーブル構造のOLAP結果を用いたディープラーニング予測データ反映システムにおいて、前記データ再構成部は、予測データのレコード構造のデータセットを統合ツリーに反映し、統合ツリーをピボットテーブル構造のデータセットとして再構成することを特徴とする。
上述したように、本発明に係る、ピボットテーブル構造のOLAP結果を用いたディープラーニング予測データ反映システムによれば、多次元分析が可能なOLAP結果に将来の予測データを追加して表示することにより、過去のデータに対する多次元分析だけでなく細分化された将来予測をも提供して、正確な意思決定を支援することができるという効果が得られる。
また、本発明に係る、ピボットテーブル構造のOLAP結果を用いたディープラーニング予測データ反映システムによれば、ピボットテーブル構造をレコード構造として再構成してディープラーニング予測を行うことにより、多次元構成に応じて深さと形式が変化して予測しにくい問題を克服することができるという効果が得られる。
本発明を実施するための全体システムの構成のブロック図である。 本発明の一実施形態に係る、ピボットテーブル構造のOLAP結果を用いたディープラーニング予測データ反映システムの構成のブロック図である。 本発明の一実施形態に係るピボットテーブルの例示図である。 本発明の一実施形態に係る行次元ツリーの例示図である。 本発明の一実施形態に係る列次元ツリーの例示図である。 本発明の一実施形態に係る下位次元ツリーのインスタンスの例示図である。 本発明の一実施形態に係る合計ノードが含まれている行次元ツリーの例示図である。 本発明の一実施形態に係る合計ツリーを別途に構成したツリーの例示図である。 本発明の一実施形態に係る統合ツリーの例示図である。 本発明の一実施形態に係る合計ノードが含まれている統合ツリーの例示図である。 本発明の一実施形態に係るレコード構造のデータセットの例示図である。 本発明の一実施形態に係る予測データが反映されたレコード構造のデータセットの例示図である。 本発明の一実施形態に係る予測データが反映された統合ツリーの例示図である。 本発明の一実施形態に係る予測データが反映された統合ツリーであって、合計ノードが含まれている統合ツリーの例示図である。
以下、添付の図面を参照して、本発明の実施のための具体的な内容を説明する。
また、本発明を説明するにあたり、同一の部分には同一符号を付し、その繰り返しの説明は省略する。
まず、図1を参照して、本発明を実施するための全体システムの一例について説明する。
図1に示すように、本発明を実施するための全体システムは、ユーザ端末10に設けられるクライアント20と、データを保存するデータベース80と、データを分析し、分析結果をピボットテーブル形式で提供する分析サーバ50と、ピボットテーブル構造のデータにディープラーニング予測データを反映して再構成する予測反映サーバ30と、で構成される。また、ユーザ端末10は、ネットワーク(図示せず)を介して分析サーバ50または予測反映サーバ30と接続する。
まず、クライアント20は、ユーザ端末10に設けられるクライアント用のプログラムシステムであって、Webブラウザを介してユーザインタフェースを有する。すなわち、ユーザは、WebブラウザまたはWebブラウザのような画面のインタフェースを介して、オンライン上でのデータ閲覧及び分析作業を行う。このとき、ユーザ端末10は、ユーザのコマンドなどを入力され、当該コマンドを実行し、処理結果を画面上またはWebブラウザ上に表示する。
一方、ユーザ端末10は、パーソナルコンピュータ(PC:personal computer)、ノートブック、タブレットPC、ファブレット、PDA、スマートフォンなどのコンピューティング機能を有するコンピュータ端末である。ユーザ端末10は、ネットワークを介して分析サーバ50または予測反映サーバ30と接続し、ユーザ端末10上のクライアント20は、オンライン上でのデータ処理作業を行うことができる。
また、クライアント20は、データ要請及び分析などのオンライン上での処理作業を分析サーバ50に要請し、その分析結果を分析サーバ50から取得してWebブラウザ上に表示する。特に、クライアント20は、データベース80から取得したデータセットをピボットテーブル形式で表示する。
また、クライアント20は、ピボットテーブル構造のデータに対して予測を反映するように予測反映サーバ30に要請し、その反映結果を予測反映サーバ30から取得してWebブラウザ上に表示する。このとき、予測結果が反映されたピボットテーブル構造で表示する。
一方、クライアント20の機能は、例えば、データセットに対する分析要請、分析結果のピボットテーブル形式の表示、ピボットテーブルのデータに対する予測反映及び再構成要請とその結果の表示などの機能は、WebブラウザのWebスクリプト機能によって実現される。すなわち、HTML5.0などのWeb標準によるスクリプトによって、クライアント20の機能がプログラムシステムで実現できる。
次に、データベース80は、データを保存するための通常のデータベース(DB)であって、データを管理するためのデータベース管理システム(DBMS:DataBase Management System)を備え、データの保存、削除、検索などの作業をクエリ(またはクエリ文)を用いて行う。特に、データベース80は、商用化されたデータベースであり、データセットを処理するための一般的なクエリ機能を用いてデータクエリサービスを行う。
特に、データベース80は、ビッグデータを保存するデータベースである。また、好ましくは、データベース80は、リレーショナルデータベース(RDB)で構成される。
次に、分析サーバ50は、データベース80からデータセットを取得して、ピボットテーブル構造の分析データ(データセット)を生成し、これらの分析結果データをクライアント20に送信して表示させる。好ましくは、クライアント20の要請に応じて分析を行い、その結果を送信する。
すなわち、分析サーバ50は、オンライン分析処理(OLAP:Online Analytical Processing)を行う通常のOLAPサーバである。好ましくは、分析の結果は、ピボットテーブル構造で構成される。ピボットテーブルは、行と列で形成されてデータセットを表示するデータ領域と、行の一側(好ましくは左側)または列の一端(好ましくは上端)に形成されて次元名を表示する次元領域と、で構成されるテーブル形式である。データ領域のセルには、行次元と列次元との組み合わせによるデータ値や統計値(例えば、個数、合計、平均など)が入力されて表示される。
次に、予測反映サーバ30は、分析サーバ50で分析された分析結果に予測データを反映し、反映結果データをクライアント20に送信して表示させる。好ましくは、クライアント20の要請に応じて分析作業を行い、その結果を送信する。
すなわち、分析サーバ50は、ピボットテーブル構造から行と列の階層構造を抽出し、ピボットテーブル構造のデータをレコード構造のデータとして再構成し、再構成されたデータを用いてディープラーニング予測を行う。そして、予測結果を反映したレコード構造のデータを再びピボットテーブル構造として再構成する。
一方、前述したクライアント20と予測反映サーバ30の機能は一例であり、サーバとクライアントの実現技術に応じて多様に実現されてもよい。すなわち、クライアント20と予測反映サーバ30は、1つの予測反映システムであって、その機能が性能に応じて分配されてもよい。例えば、クライアント20は、単純にWebブラウザ機能及びインタフェース機能だけを有しており、全ての機能は、予測反映サーバ30で構築されてもよい。すなわち、予測反映サーバ30は、ピボットテーブルのインタフェース機能及びレコード構造の再構成機能だけでなく、ディープラーニング予測機能をも全て有することができる。他の例によれば、予測反映サーバ30は、ディープラーニング予測機能のみを有しており、クライアント20が、ピボットテーブルのインタフェース機能及びレコード構造の再構成機能などを備えることができる。すなわち、サーバ-クライアントの実現方式により様々な形で機能を分配することができる。
次に、図2を参照して、本発明の一実施形態に係る、ピボットテーブル構造のOLAP結果を用いたディープラーニング予測データ反映システム30の構成について説明する。
本発明に係るディープラーニング予測データ反映システム30は、サーバ-クライアントシステムで実現できる。
従来技術のディープラーニング方式は、データの収集/精製/前処理などを行った後、ディープラーニングライブラリなどを用いて直接コーディングする方式である。本発明に係る予測データ反映システム30は、分析サーバ50(例えば、i-META、i-STREAMなど)で生成された分析結果を直接使用して、その構造化データ(またはピボットテーブル構造のデータセット)をフレーム形式(レコード形式)のデータセットに変換し、次元中に時系列要素と順次要素を自動的に認識し、次元の配置情報を用いて、ディープラーニング予測結果を構造化データに自動的に反映する。
図2に示すように、本発明の一実施形態に係るディープラーニング予測データ反映システム30は、ピボットテーブル構造のデータセットを受信するデータセット受信部31と、ピボットテーブル構造のデータセットからデータ次元(data dimension)を階層構造(またはツリー構造)で抽出する次元抽出部32と、ピボットテーブル構造のデータセットをレコード構造のデータセットに変換するフレーム変換部33と、レコード構造のデータセットを対象としてディープラーニングを用いて予測するデータ予測部34と、予測データが追加されたレコードデータセットをピボットテーブルデータセットとして再構成するデータ再構成部35と、で構成される。
まず、データセット受信部31は、ピボットテーブル構造のデータセット(またはピボットテーブルデータセット)を受信する。
図3に示すように、ピボットテーブル構造は、行と列で形成されてデータセットを表示するデータ領域と、行の一側(好ましくは左側)または列の一端(好ましくは上端)に形成されて次元名を表示する次元領域と、で構成される。
すなわち、次元領域は、データ領域の列の上端に表示される列次元領域と、データ領域の行の左側に表示される行次元領域と、に区分される。図3の例において、<電子素材事業部>、<ホームエンターテイメント事業部>、<売上数量>、<ウォン単価>などは、列次元領域の列の次元名であり、日付<20150101>、<20150102>、...<内需>、<輸出>などは、行次元領域の行の次元名である。
一方、列次元と行次元などの各次元は、それぞれの階層構造で構成される。最下位次元(または最下位次元名)は、それぞれのデータ領域の行または列のそれぞれに全て1対1対応する。最下位次元は、自分の親または先祖の次元によって区別される。したがって、各最下位次元に対応する各データ領域の行または列は、前記最下位次元及びその親または先祖の次元によって区分(定義)される。図3の例において、データ領域の1列目のデータセットは、<電子素材事業部>の<売上数量>の次元によって区分される。2列目のデータセットは、<電子素材事業部>の<ウォン単価>の次元によって区分される。また、1行目のデータセットは、<20180101>の<内需>の次元によって区分される。
また、データ領域のセルには、行次元と列次元との組み合わせによるデータ値や統計値(例えば、個数、合計、平均など)が入力されて表示される。
また、ピボットテーブルの行次元と列次元のうちのいずれか一方の次元の最下位次元は、<メジャー(measure)>と設定される。メジャー(measure)次元は、データ領域のデータ値の種類を示す。図3の例において、列次元の最下位次元をメジャー(またはメジャー次元)と設定している。データ領域の1列目のデータセットは<売上数量>を示し、2列目のデータセットは<ウォン単価>を示す。
次に、次元抽出部32は、ピボットテーブル構造のデータセットから、次元の階層構造を示す行及び列の次元ツリーを生成する。
すなわち、次元抽出部32は、ピボットテーブル構造のデータセットから、行及び列の次元の階層構造を示す次元ツリーを生成する。
図3の例において、行次元は、<売上日付>、<売上区分名>の階層構造を有する。このとき、<売上日付>は上位次元と呼び、<売上区分名>は下位次元と呼ぶことにする。階層構造の上位と下位は相対的概念である。
このとき、<売上日付>、<売上区分名>は、それぞれ次元のカテゴリと呼び、各次元が持つ値を次元名(または次元値)と呼ぶことにする。<売上日付>の行カテゴリは、<20180101>、<20180102>、<20180104>などの次元名を持ち、<売上区分名>の行カテゴリは、<内需>、<輸出>など2つの次元名を持つ。
図3の例において、列次元は<事業区分名>、<メジャー(measure)>の階層構造を有する。このとき、<事業区分名>、<メジャー>は、それぞれ次元のカテゴリである。<事業部区分名>の列カテゴリは、<電子素材事業部>、<ホームエンターテイメント事業部>などの次元名を持ち、<メジャー>のカテゴリは、「売上数量>、<ウォン単価>など2つの次元名を持つ。特に、メジャーの次元名は、メジャー名と呼ぶことにする。
次元抽出部32は、ピボットテーブルの行次元と列次元の階層構造に基づいて、それぞれ行の次元ツリー及び、列の次元ツリーを構成する。すなわち、各次元ツリーのルートノードとしては、仮想のノードを任意に設定する。ピボットテーブルの各次元名を1つのノードに対応させてそれぞれのノードを生成し、上位次元と下位次元の関係に基づいて、ノード間の上位及び下位の関係を設定する。すなわち、次元ツリーの各ノードは次元名を持ち、次元の上位または下位の関係に基づいて、各ノードが上位ノードまたは下位ノードとして階層的に構成される。
一方、ピボットテーブル構造において、上位カテゴリの次元名のそれぞれは、下位カテゴリの全ての次元名を持つように構成される。したがって、次元ツリーにおいて、上位カテゴリの各ノードは、同様に、下位カテゴリの全てのノードを持つ。
図4は、図3のピボットテーブルの行次元構造から生成された行次元ツリーを示すグラフである。図4の例において、上位カテゴリ<売上日付>のノード<20180101>、<20180102>、<20180104>などのそれぞれは、同様に、下位カテゴリ<売上区分名>の全ての下位ノード<内需>、<輸出>を持つ。
また、図5は、図3のピボットテーブルの列次元構造から生成された列次元ツリーを示すグラフである。図5の例において、上位カテゴリ<事業部区分名>のノード<電子素材事業部>、<ホームエンターテイメント事業部>などのそれぞれは、同様に、下位カテゴリ<メジャー>の全ての下位ノード<売上数量>、<ウォン単価>を持つ。
また、図5に示すように、メジャー(measure)を有する次元ツリーは、リーフノードがメジャーノードであるが、メジャーノードにデータ値ノード(またはデータノード)が接続されてもよい。このとき、データノードのデータセットは、ピボットテーブルのデータ領域のメジャーのデータセットに該当する。また、メジャーのデータセットの数は、行次元(行の最下位次元)の数に見合う分だけ存在する。
図6に示すように、データ領域のメジャーのデータセットの数に見合う分だけ次元ツリーが作成できる。図3のデータ領域の1行目のデータセット(メジャーのデータセット)は{25,1000,20,900}であり、メジャーのデータセットをデータノードの値とすることで、図6の第1番目の次元ツリーのように生成できる。
また、好ましくは、次元抽出部32は、行次元のツリー構造に含まれていない行次元、すなわち、ピボットテーブルの次元構造において並行される次元を、合計ノードとして追加生成する。また、データ領域のメジャーのデータセットのうち合計に該当する次元ツリーも生成される。特に、合計ノードは、ピボットテーブルの次元構造において合計次元と対応する最下位次元のツリーレベルと同じレベルを有するようにツリー構造に追加する(または別のツリー構造を生成する)。すなわち、合計次元と、これに対応する最下位次元とは、兄弟関係(sibling)を有するように構成される。
図7aの例に示すように、<20180101 Total>、<20180102 Total>、...などの行次元は、ツリー構造で並んでいる構造であって、先に得られた次元のツリー構造に該当するものではない。これらのノードを合計ノードとしてツリー構造に追加するか、別の合計ツリーを生成する。図7aは、先に得られた次元ツリーに合計ノードを追加したものを示し、図7bは、合計ツリーを別途に構成したものを示している。
このとき、合計に該当するデータ領域のメジャーのデータセットに対しても次元ツリーが生成される。すなわち、合計に対応するメジャーのデータセット(例えば、{40、1500、50、1300}に対する合計ツリーも生成される。
次に、フレーム変換部33は、先に生成した行及び列の次元ツリーを合わせて統合次元ツリーを生成し、統合次元ツリーからレコード構造のデータセット(以下、レコードデータセット)を生成する。
まず、フレーム変換部33は、メジャーを持つ次元ツリーを下位ツリーとし、残りのツリーを上位ツリーとすることで、上位ツリーのリーフノードが下位ツリーのルートノードとなるように、2つの次元ツリーを統合する。
図8は、先の図4の行次元ツリーと図5の列次元ツリーとを統合して統合次元ツリーを生成した例を示している。メジャー(measure)次元が列次元ツリーに存在するので、列次元ツリーが下位ツリーとなり、行次元ツリーが上位ツリーとなる。
一方、下位ツリーは、メジャーのデータセットの数に見合う分だけ生成される。このとき、各データノードのメジャーデータセットは、行次元のそれぞれに対応する。したがって、各下位ツリーは、自分のデータノードのデータセットが対応する行次元のリーフノードを、ルートノードとして統合する。
例えば、図8に示すように、上位ツリーのリーフノード<内需>または<輸出>を、下位ツリー(列次元ツリー)のルートノードとして結合する。第1番目の下位ツリーのデータセットは{25,1000,20,900}であり、当該データセットに対応する行次元は{<20180101>、<内需>}である。したがって、第1番目の下位ツリーは、{<20180101>、<内需>}と区分される上位ツリーのリーフノード<内需>を、ルートノードとして結合する。
一方、好ましくは、フレーム変換部33は、合計ノードをも含めた統合次元ツリーを生成する。すなわち、合計に対応するメジャーのデータセット(例えば、{40、1500、50、1300}など)をも統合ツリーに生成する。図9は、合計ノードが含まれた統合ツリーを示している。
また、フレーム変換部33は、統合次元ツリー(または統合ツリー)が生成されると、統合ツリーのデータセットからレコード構造(データフレーム形式)のデータセットを生成する。このとき、レコード構造は、多数のフィールドで構成されるレコードの集合で構成される。したがって、フィールドまたはフィールド名を構成し、各フィールドに該当するフィールド値を設定して、データフレームを生成する。
すなわち、各メジャーに対して、メジャーの次元名をフィールドと設定し、当該メジャーのデータ値を当該フィールドのフィールド値とする。また、メジャーノードの上位ノードのカテゴリ(カテゴリ名)をフィールドと設定し、当該カテゴリの次元名を当該フィールドのフィールド値とする。このとき、ルートノードは除外される。したがって、メジャーノードの上位ノードの次元名とメジャーのデータ値とを用いて1つのレコードを構成する。
このとき、合計ノードを含むツリー構造は除外される。すなわち、合計ノードを含まないツリー構造の場合にのみ、統合次元ツリーからレコード構造のデータセットを生成する。
図6の例において、最上部のメジャーカテゴリの次元名<売上数量>と<ウォン単価>をフィールド(フィールド名)と設定し、データ値<25>、<1000>を当該フィールドのフィールド値とする。また、メジャーカテゴリの上位ノードのカテゴリ<売上日付>、<売上区分名>、<事業部区分名>を、それぞれのフィールド(フィールド名)とする。さらに、メジャーノードの上位ノードの次元名<20180101>、<内需>、<電子素材事業部>を、当該フィールドのフィールド値とする。
したがって、レコードは{<20180101>、<内需>、<電子素材事業部>、<25>、<1000>}で構成される。このとき、フィールド名は、{<売上日付>、<売上区分名>、<事業部区分名>、<売上数量>、<ウォン単価>}で構成される。
統合ツリーの全てのメジャーカテゴリのメジャーノードに対してレコードを生成すると、レコード構造のデータセットを生成することができる。図10は、図8の統合ツリーから生成されたレコード構造のデータセットを示している。
他の実施形態によれば、フレーム変換部33は、全てのメジャーデータセットに対応する下位ツリーを全て生成せずに、上位ツリーと下位ツリーとを巡回してレコード構造のデータセットが得られる。このとき、下位ツリーにデータノードを連結させずに、1つの下位ツリーのみを生成する。すなわち、下位ツリーのノードは、次元に対するノードのみで構成される。
フィールドを構成する方式は、前述した実施形態と同様である。
そして、各レコードを作るために以下のように巡回する。
rowlevel2→…→rowleveln→columnlevel1→…→columnleveln
すなわち、上位ツリーにおけるルートノードからスタートしてリーフノードに順次巡回しながら、各ノードの値(次元名)をレコードに入力する。そして、上位ツリーのリーフノードに到達すると、下位ツリーのルートノードからスタートして下位ノードに巡回する。このとき、メジャーノードに触れるとメジャーフィールドにデータ値を入力する。このとき、データ領域の行と列が巡回されたノードのほか、同一の次元のデータをメジャーフィールドのデータ値として入力する。
次に、データ予測部34は、レコードデータセットを対象としてディープラーニング(LSTM:Long Short Term Memory、長短期記憶)を用いて予測する。好ましくは、レコード構造のデータセットにおいて、時系列データを持つフィールドを対象として次のサイクルのメジャーフィールドのデータ値を予測する。
好ましくは、時系列のフィールドは、次元名によって作られるフィールドである。
図10の例において、<売上日付>フィールドは行次元により作られたフィールドであり、日付が時系列の順序を有するので、<売上日付>の次のサイクル<20180105>に対して次の分析サイクルのメジャーデータを予測することができる。
このとき、時系列次元を除いた残りの次元の組み合わせごとに予測データを得、時系列次元のデータは、次のサイクルの、組み合わせごとに予測したデータを、レコードとして形成する。このとき、次元のフィールド値は、時系列次元の次のサイクル、残りの次元の組み合わせ、及び予測したデータで構成される。
次に、データ再構成部35は、予測データが追加されたレコードデータセットをピボットテーブル構造のデータセットとして再構成する。すなわち、予測データのレコード構造のデータセットを統合ツリーに反映し、統合ツリーをピボットテーブル構造のデータセットとして再構成する。この際、前述したレコード構造のデータセットを形成する過程の逆過程を行う。
図11の予測データが反映されたレコード構造のデータセットから、予測データを統合ツリーに反映する。図12は、予測データが反映された統合ツリーを示している。
図12に示すように、時系列次元の次のサイクルを次元名とする新たな階層のノードを生成して、統合ツリーに挿入する。このとき、時系列次元のカテゴリに属するノードに全て含ませる。
すなわち、図11で生成された新たなレコードに対応するノードを生成し、生成されたノードを元の統合ツリーに追加して再構成する。
一方、好ましくは、図13に示すように、新たなノード(新たな部分ツリー)に、合計ノードに対する部分(合計ノードの部分ツリー、または合計ノード及びその下位ツリー)をも追加する。このとき、合計ノードの下位構造(下位ツリー)は、他の兄弟ノード(sibling node)(特に、新たなレコードによって生成された兄弟ノード)の下位ツリー構造を全て合算して生成する。
下位ツリーの合算は、次のような方法により行われる。下位ツリーの構造を同様に生成する。そして、リーフノードであるデータ値のみが異なるが、同じ位置のリーフノード(他の兄弟ノードのリーフノード)のデータ値を全て合算することで、当該位置のリーフノード(合計ノードの下位ツリー構造のリーフノード)のデータ値を生成する。
また、データ再構成部35は、再構成された統合ツリーからピボットテーブルの構造を生成する。ピボットテーブルの構造から統合ツリーを形成した過程の逆過程を行い、ピボットテーブルを再構成して生成する。
以上、本発明者によってなされた発明を実施形態に基づいて具体的に説明したが、本発明は上記実施形態に限定されるものではなく、その要旨を逸脱しない範囲において種々変更可能であることは言うまでもない。
この特許出願は、2017年度の韓国政府の財源として韓国研究財団の支援を受けて行われた基礎研究事業である(No.2017M3C4A7083282)。
10 ユーザ端末
20 クライアント
30 予測反映サーバ
31 データセット受信部
32 次元抽出部
33 フレーム変換部
34 データ予測部
35 データ再構成部
50 分析サーバ
80 データベース

Claims (2)

  1. ピボットテーブル構造のオンライン分析処理(OLAP)結果を用いたディープラーニング予測データ反映システムにおいて、
    ピボットテーブル構造のデータセットを受信するデータセット受信部と;
    ピボットテーブル構造のデータセットから、データ次元を階層構造で有する行次元ツリー及び列次元ツリーを生成する次元抽出部と;
    前記行次元ツリーと列次元ツリーとを結合して統合ツリーを生成し、統合ツリーからレコード構造のデータセットを形成するフレーム変換部と;
    レコード構造のデータセットを対象としてディープラーニングを用いて予測するが、前記データセットの時系列データを持つフィールドを対象として次のサイクルのデータである予測データを予測するデータ予測部と;
    前記予測データが追加されたレコードデータセットを用いて前記統合ツリーを再構成し、再構成された統合ツリーを用いてピボットテーブルを再構成するデータ再構成部と;
    を含み、
    前記次元抽出部は、前記ピボットテーブルの行次元と列次元の階層構造に基づいてそれぞれの行次元ツリー及び列次元ツリーを構成し、各次元ツリーのルートノードを仮想ノードとして設定し、前記ピボットテーブルの各次元名を1つのノードに対応させてそれぞれのノードを生成し、上位次元と下位次元の関係に基づいて、ノード間の上位及び下位の関係を設定し、次元ツリーの各ノードが次元名を持つように設定し、次元の上位または下位の関係に基づいて、各ノードを上位ノードまたは下位ノードとして階層的に構成し、
    前記次元抽出部は、前記次元ツリーにおいて、上位カテゴリの各ノードが、同様に、下位カテゴリの全てのノードを持つように構成し、
    前記次元抽出部は、メジャーを持つ次元ツリーに対して、メジャーノードにデータ値を持つデータノードを接続させ、前記ピボットテーブルのデータ領域のメジャーのデータセットの数に見合う分だけ次元ツリーを生成し、
    前記フレーム変換部は、メジャーを持つ次元ツリーを下位ツリーとし、残りのツリーを上位ツリーとすることで、上位ツリーのリーフノードが下位ツリーのルートノードとなるように、2つの次元ツリーを統合するが、各下位ツリーに対して、自分のデータノードのデータセットが対応する上位ツリーのリーフノードを、ルートノードとして統合することを特徴とする、ピボットテーブル構造のOLAP結果を用いたディープラーニング予測データ反映システム。
  2. 前記フレーム変換部は、各メジャーに対して、メジャーの次元名をフィールドと設定し、当該メジャーのデータ値を当該フィールドのフィールド値とし、メジャーノードの上位ノードのカテゴリをフィールドと設定し、当該カテゴリの次元名を当該フィールドのフィールド値とすることで、メジャーノードの上位ノードの次元名とメジャーのデータ値とを用いて1つのレコードを構成することを特徴とする、請求項1に記載のピボットテーブル構造のOLAP結果を用いたディープラーニング予測データ反映システム。
JP2019093340A 2019-01-25 2019-05-17 ピボットテーブル構造のolap結果を用いたディープラーニング予測データ反映システム Active JP6997133B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR20190009845 2019-01-25
KR10-2019-0009845 2019-01-25
KR10-2019-0031220 2019-03-19
KR1020190031220A KR102058124B1 (ko) 2019-01-25 2019-03-19 피벗 테이블 구조의 olap 결과를 이용한 딥러닝 예측 데이터 반영 시스템

Publications (2)

Publication Number Publication Date
JP2020119487A JP2020119487A (ja) 2020-08-06
JP6997133B2 true JP6997133B2 (ja) 2022-01-17

Family

ID=69051901

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019093340A Active JP6997133B2 (ja) 2019-01-25 2019-05-17 ピボットテーブル構造のolap結果を用いたディープラーニング予測データ反映システム

Country Status (2)

Country Link
JP (1) JP6997133B2 (ja)
KR (1) KR102058124B1 (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111177220B (zh) * 2019-12-26 2022-07-15 中国平安财产保险股份有限公司 基于大数据的数据分析方法、装置、设备及可读存储介质
KR102491755B1 (ko) 2020-08-03 2023-01-26 (주)한국플랫폼서비스기술 쿼리 기반 딥러닝 추론 시스템 및 그 방법
KR102491753B1 (ko) 2020-08-03 2023-01-26 (주)한국플랫폼서비스기술 쿼리를 이용한 프레임워크 딥러닝 학습 시스템 및 방법
KR102251139B1 (ko) 2020-10-13 2021-05-12 (주)비아이매트릭스 데이터 증강 기반 기계학습 방식의 결측치 보정 시스템
KR102568010B1 (ko) 2020-11-20 2023-08-22 (주)한국플랫폼서비스기술 쿼리 기반 딥러닝 추론 시스템을 이용한 공작 기계 예지 보전 시스템 및 그 방법
KR102568011B1 (ko) 2020-12-30 2023-08-22 (주)한국플랫폼서비스기술 쿼리 기반 딥러닝 추론을 이용한 안면 검출 및 사생활 보호 시스템 및 그 방법
KR20220165391A (ko) 2021-06-08 2022-12-15 (주)한국플랫폼서비스기술 쿼리 기반 딥러닝 분산 시스템 및 분산 훈련 방법
KR20220168814A (ko) 2021-06-17 2022-12-26 (주)한국플랫폼서비스기술 쿼리 기반 딥러닝 추론을 이용한 사생활 보호 및 재검출 평가 시스템 및 그 방법
KR20230060354A (ko) 2021-10-27 2023-05-04 (주)한국플랫폼서비스기술 개인정보를 보호하기 위한 비식별화용 영상 기록 장치
KR20230060353A (ko) 2021-10-27 2023-05-04 (주)한국플랫폼서비스기술 딥러닝 프레임워크 데이터베이스 응용 공작 기계 예지 보전 장치, 이를 구비한 분산 시스템 및 그 방법
KR20230065038A (ko) 2021-11-04 2023-05-11 (주)한국플랫폼서비스기술 쿼리 기반 데이터베이스 연동 딥러닝 분산 시스템 및 그 방법
WO2023080275A1 (ko) 2021-11-04 2023-05-11 (주)한국플랫폼서비스기술 성별 및 나이를 분류하는 딥러닝 프레임워크 응용 데이터베이스 서버 및 그 방법
KR20230074965A (ko) 2021-11-22 2023-05-31 (주)한국플랫폼서비스기술 전통 가옥 도면의 구조 명칭을 분류하는 딥러닝 프레임워크 응용 데이터베이스 서버 및 그 방법
KR102641532B1 (ko) 2022-10-20 2024-02-28 (주)한국플랫폼서비스기술 사생활 보호 딥러닝 프레임워크 응용 컴퓨팅 장치 및 그 방법
KR102602781B1 (ko) 2022-11-30 2023-11-16 (주)한국플랫폼서비스기술 딥러닝 프레임워크 응용 서비스 모델의 지속적인 통합 및 배포 시스템 및 그 방법

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001325582A (ja) 2000-05-17 2001-11-22 Chugoku Electric Power Co Inc:The 時系列データ学習・予測装置
US20110107254A1 (en) 2009-10-30 2011-05-05 Oracle International Corporation Transforming data tables into multi-dimensional projections with aggregations
JP2017219882A (ja) 2016-06-02 2017-12-14 日本電信電話株式会社 論理関係認識装置、論理関係認識方法および論理関係認識プログラム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2776226B2 (ja) * 1993-12-27 1998-07-16 日本電気株式会社 多段表データ取り扱い装置
JPH08221384A (ja) * 1995-02-17 1996-08-30 Kao Corp 販売量予測方法および装置
JP2795317B2 (ja) * 1996-06-24 1998-09-10 日本電気株式会社 多段表処理方式
US7099880B2 (en) 2002-01-31 2006-08-29 International Business Machines Corporation System and method of using data mining prediction methodology
US6931391B2 (en) 2002-06-21 2005-08-16 Microsoft Corporation Systems and methods for generating prediction queries
US7627555B2 (en) * 2004-06-22 2009-12-01 Microsoft Corporation Combining multidimensional expressions and data mining extensions to mine OLAP cubes
JP6109037B2 (ja) * 2013-10-23 2017-04-05 本田技研工業株式会社 時系列データ予測装置、時系列データ予測方法、及びプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001325582A (ja) 2000-05-17 2001-11-22 Chugoku Electric Power Co Inc:The 時系列データ学習・予測装置
US20110107254A1 (en) 2009-10-30 2011-05-05 Oracle International Corporation Transforming data tables into multi-dimensional projections with aggregations
JP2017219882A (ja) 2016-06-02 2017-12-14 日本電信電話株式会社 論理関係認識装置、論理関係認識方法および論理関係認識プログラム

Also Published As

Publication number Publication date
KR102058124B1 (ko) 2019-12-23
JP2020119487A (ja) 2020-08-06

Similar Documents

Publication Publication Date Title
JP6997133B2 (ja) ピボットテーブル構造のolap結果を用いたディープラーニング予測データ反映システム
CN106095862B (zh) 集中式可扩展融合型多维复杂结构关系数据的存储方法
CN106294888B (zh) 一种基于时空数据库的对象数据的订阅方法
Moniruzzaman et al. Nosql database: New era of databases for big data analytics-classification, characteristics and comparison
US6581068B1 (en) System and method for instant consolidation, enrichment, delegation and reporting in a multidimensional database
US7805433B2 (en) Multidimensional cube functions
US7089266B2 (en) Computer systems and methods for the query and visualization of multidimensional databases
US7698349B2 (en) Dimension member sliding in online analytical processing
US10579678B2 (en) Dynamic hierarchy generation based on graph data
JP2006503357A (ja) オンライン分析処理(olap)のための方法およびシステム
CN112131203A (zh) 一种数据仓库搭建的方法和系统
Adiba et al. Big data management challenges, approaches, tools and their limitations
Pokorný New database architectures: Steps towards big data processing
US7117218B2 (en) System and method for expressing and calculating a relationship between measures
Alguliyev et al. Development of a Decision Support System with the use of OLAP-Technologies in the National Terminological Information Environment.
JP2005018751A5 (ja)
Singh NoSQL: A new horizon in big data
Mahboubi et al. Analyzing demographic and economic simulation model results: a semi-automatic spatial OLAP approach
Farooq et al. Do NoSQL databases cope with current data challenges
Agrawal et al. Analysis of multidimensional modeling related to conceptual level
KR101801091B1 (ko) 다차원 계층 데이터 큐브 시스템 및 처리 방법
Zhang et al. Research on Multidimensional Data Storage Model Based on Relational Database
Maram et al. Interactive Visualization of Datasets Using Data Processing and Data Presentation Challenges
Sendín‐Raña et al. Web‐oriented business intelligence solution based on Associative Query Logic
Yamaganti et al. Data Warehousing Concepts Using ETL Process for Social Media Data Extraction

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7426

Effective date: 20190805

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20190805

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200812

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200901

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201118

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210427

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210706

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211214

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211216

R150 Certificate of patent or registration of utility model

Ref document number: 6997133

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150