JP2005321849A - データ分析支援プログラム、データ分析支援方法、およびデータ分析支援装置 - Google Patents

データ分析支援プログラム、データ分析支援方法、およびデータ分析支援装置 Download PDF

Info

Publication number
JP2005321849A
JP2005321849A JP2004137115A JP2004137115A JP2005321849A JP 2005321849 A JP2005321849 A JP 2005321849A JP 2004137115 A JP2004137115 A JP 2004137115A JP 2004137115 A JP2004137115 A JP 2004137115A JP 2005321849 A JP2005321849 A JP 2005321849A
Authority
JP
Japan
Prior art keywords
data
analysis support
item
data analysis
generated
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004137115A
Other languages
English (en)
Inventor
Hiroyuki Suzuki
啓之 鈴木
Masaharu Koyabu
正晴 小籔
Yoichi Yoshizawa
庸一 吉澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2004137115A priority Critical patent/JP2005321849A/ja
Priority to US10/953,644 priority patent/US20050262433A1/en
Publication of JP2005321849A publication Critical patent/JP2005321849A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • G06F16/84Mapping; Conversion

Abstract

【課題】データウエアハウスにまだ取り込まれていないデータ(発生直後のデータなど)を対象として、OLAPによるリアルタイムなデータ分析ができるようにする。
【解決手段】データウエアハウスに格納される前の未確定データは、各部門の基幹系データベース202からサーバ200に収集されて、一旦XMLファイルに変換される。そしてこれらのファイルから、データウエアハウス内のテーブルと同形式の「仮想テーブル」が作成され、この仮想テーブルを対象として集計などの各種加工が行われる。これにより、正規化やクレンジングの済んでいない未確定データであっても、データウエアハウス内の確定データと同様に参照・分析できるようになる。なお、データウエアハウス内のテーブルと仮想テーブルとを結合することで、確定データと未確定データとをあわせたシームレスなデータ分析も可能となる。
【選択図】 図2

Description

この発明は、OLAP(OnLine Analytical Processing)によるユーザのデータ分析を支援するためのデータ分析支援プログラム、データ分析支援方法、およびデータ分析支援装置に関する。
企業などにおいて、各部門の業務に使用される基幹系データベースから必要なデータを抽出し、抽出されたデータにより全社規模の情報系データベース(データウエアハウス)を構築して、OLAPにより多面的・多角的に分析することが従来から行われている(たとえば下記特許文献1参照。)。
特許第3302522号公報
しかしながら従来のOLAPでは、データウエアハウスに格納されたデータ(以下では「確定データ」という)しか分析の対象とすることができない。すなわち、データウエアハウスへデータを格納するには事前にその正規化やクレンジング(名称や形式の統一、不完全なデータの排除など)、あるいは受け入れ側データベースのスキーマの再定義などが必要となるため、データが各部門で発生してからデータウエアハウスへ反映されるまでには通常はタイムラグが存在する。そして、この反映前のデータ(以下では「未確定データ」という)はOLAPの対象外となるため、たとえば数日前までの売上状況(確定データ)は分析できても、直近数時間内の売上状況(未確定データ)をリアルタイムに分析することはできないという問題点があった。
この発明は、上述した従来技術による問題点を解消するため、データウエアハウスにまだ取り込まれていないデータを対象とする(あるいは、少なくとも当該データを対象に含む)データ分析を支援することが可能なデータ分析支援プログラム、データ分析支援方法、およびデータ分析支援装置を提供することを目的とする。
上述した課題を解決し、目的を達成するため、この発明にかかるデータ分析支援プログラム、データ分析支援方法、およびデータ分析支援装置は、データウエアハウスにまだ格納されていないデータからマークアップ文書を生成し、これらの文書中から指定されたテーブルの項目に対応するタグ内のデータを抽出して、当該データを前記項目の値とするテーブルを生成するとともに、当該テーブル内のデータを指定された形式に加工することを特徴とする。
この発明によれば、データウエアハウスに格納される前の未確定データからでも、データウエアハウス内のテーブルと同形式の仮想テーブル(後述)を作成して、OLAPによる分析の対象とすることができる。
また、この発明にかかるデータ分析支援プログラム、データ分析支援方法、およびデータ分析支援装置は、前記テーブルの各項目に複数のタグが対応づけられていることを特徴とする。
この発明によれば、各文書のマークアップを媒介として未確定データの形式のばらつきを吸収し、データウエアハウス内のテーブルと同形式の仮想テーブルを組織横断的に作成して、OLAPによる分析の対象とすることができる。
また、この発明にかかるデータ分析支援プログラム、データ分析支援方法、およびデータ分析支援装置は、上記マークアップ文書がXML形式であることを特徴とする。
この発明によれば、各文書のXMLタグを媒介として未確定データの形式のばらつきを吸収し、データウエアハウス内のテーブルと同形式の仮想テーブルを組織横断的に作成して、OLAPによる分析の対象とすることができる。
また、この発明にかかるデータ分析支援プログラムは、さらに前記テーブルをデータウエアハウス内のテーブルと結合し、この結合されたテーブル内のデータを指定された形式に加工することを特徴とする。
この発明によれば、確定データであるか未確定データであるかを問わず、それらが混在するテーブルを作成して、OLAPによる分析の対象とすることができる。
本発明にかかるデータ分析支援プログラム、データ分析支援方法、およびデータ分析支援装置によれば、データウエアハウスにまだ取り込まれていないデータを対象とするデータ分析を支援することが可能なデータ分析支援プログラム、データ分析支援方法、およびデータ分析支援装置を提供することができるという効果を奏する。
以下に添付図面を参照して、この発明にかかるデータ分析支援プログラム、データ分析支援方法、およびデータ分析支援装置の好適な実施の形態を詳細に説明する。
図1は、この発明の実施の形態にかかるデータ分析支援装置のハードウエア構成を示す説明図である。図中、CPU101は装置全体の制御を司る。ROM102はブートプログラムなどを記憶している。RAM103はCPU101のワークエリアとして使用される。
HDD104は、CPU101の制御にしたがってHD105に対するデータのリード/ライトを制御する。HD105は、HDD104の制御にしたがって書き込まれたデータを記憶する。FDD106は、CPU101の制御にしたがってFD107に対するデータのリード/ライトを制御する。FD107は、FDD106の制御にしたがって書き込まれたデータを記憶する。なお、FD107は着脱可能な記録媒体の一例であり、FD107の代わりにCD−ROM(CD−R、CD−RW)、MO、DVD(Digital Versatile Disk)、メモリーカードなどであってもよい。
ディスプレイ108は、カーソル、ウィンドウ、アイコンなどをはじめ、文書や画像などの各種データを表示する。ネットワークI/F109はLAN/WANなどのネットワークに接続され、当該ネットワークと装置内部とのデータの送受信を司る。キーボード110は、文字、数値、各種指示などの入力のための複数のキーを備え、押下されたキーに対応するデータを装置内部へ入力する。マウス111は本体下部のボールの回転量と回転方向、および本体上部の各ボタンのON/OFFを随時装置内部へ入力する。また、バス100は上記各部を接続する。
次に、図2はこの発明の実施の形態にかかるデータ分析支援装置を含む、データ分析支援システムの機能構成を示す説明図である。図示するように上記システムは、大別してサーバ200とそのクライアント201、および各業務部門で使用される基幹系データベース202から構成される。なお、サーバ200とクライアント201、サーバ200と基幹系データベース202とは、それぞれLANまたはWANにより接続されている。
そして、図中サーバ200が本発明にかかるデータ分析支援装置に相当する。このサーバ200はクライアント201からの求めに応じて、その保持する情報系データベース200a内の確定データ、あるいはまだそこに反映されていない未確定データを、表形式やグラフ形式などユーザに分かりやすい形に加工する。確定データのほかに、正規化やクレンジングのなされていない未確定データであっても分析対象とできる点に特徴がある。
そしてサーバ200は、図示するように情報系データベース200a、ソースデータ抽出部200b、ソースデータ記憶部200c、XMLデータ生成部200d、XMLデータ記憶部200e、送信データ生成部200f、仮想テーブル定義記憶部200gおよび要求受付部202hを備えている。
図中、情報系データベース200aは基幹系データベース202から抽出され、かつ上述の正規化やクレンジングなどを施されたデータからなる各種テーブルを保持するデータベースである。なお、基幹系データベース202からのデータの抽出手順や、抽出されたデータの情報系データベース200aへの格納手順などは従来技術と同様とし、ここでは詳細な説明を省略する。
次に、ソースデータ抽出部200bは基幹系データベース202に接続して、情報系データベース200aにまだ反映されていないデータを抽出する機能部である。なお、この抽出は「いつ」「どこから」「どうやって」データを取り出してくるかを事前に設定しておき、当該設定のもとでソースデータ抽出部200bに自動実行させるのでもよいし、あるいはクライアント201からデータの参照要求があったときに、関連する基幹系データベース202から関連するデータを取り出してくるのでもよい。そして、ソースデータ抽出部200bで抽出されたデータは、まずソースデータ記憶部200c内に蓄積される。
基幹系データベース202の形式は、それを使用する部門の事情などに応じて異なる場合がある。たとえば営業部門Aでは、売り上げた商品の品名や個数などを所定のRDB(リレーショナルデータベース)で管理するのに対して、営業部門BではSGML形式の伝票ファイルを所定の文書サーバに蓄積しているものとする。この場合、ある特定の商品について全社的な売上状況をリアルタイムに把握するには、RDBから抽出されたデータであるか伝票ファイルから抽出されたデータであるかを問わず、上記商品の販売数量や販売総額などを横通しで集計できるのでなければならない。
そこで本発明では、各種の基幹系データベース202から抽出され、ソースデータ記憶部200cに蓄積されたソースデータを、XMLデータ生成部200dで一律にXML形式に変換する。たとえばRDBから抽出されたデータであれば、個々のレコードを図3のようなXMLファイルに変換する。また、ソースデータがすでにタグ付けされていても、たとえば図4に示すように一件ずつの分離が必要な場合もある。XMLデータ生成部200dはあらかじめ保持している変換規則に従って、ソースデータから図3や図4に示すようなXMLファイルを生成し、生成したXMLファイルをXMLデータ記憶部200eに蓄積する。
図2の説明に戻り、次に送信データ生成部200fは、未確定データの参照を要求してきたクライアント201に返信するための表やグラフなどを生成する機能部である。図示するように送信データ生成部200fは、仮想テーブル定義記憶部200gに保持された仮想テーブル定義に従って、上述のXMLファイルから仮想テーブルを生成する仮想テーブル生成部200f−1と、生成されたテーブル内のデータをユーザの指示に従って加工するデータ加工部200f−2とから構成される。
図5は、仮想テーブル定義および当該定義に従って生成される仮想テーブルの一例を模式的に示す説明図である。個々の仮想テーブルには、たとえば「SALES」などの一意な名称が付与され、その各項目にも「STORE」「SALESDATE」などの一意な名称が付与されている。さらに、項目ごとにその属性、たとえばタイトル(表示時の見出し文字列)やデータ型などのほか、上述のXMLファイル内のタグとの対応関係が定義されている。
そして、たとえばこの「SALES」テーブルの生成を指示された仮想テーブル生成部200f−1は、XMLデータ記憶部200e内のXMLファイルの中から上記タグを有するファイルを検索し、さらにこのファイルから上記タグ内のデータを抽出して、対応する項目の値とする。従って、たとえば図示する「SALES」テーブルの「STORE」項目は、図3の「売上」タグ下の「店舗コード」タグから抽出された「SBY」「SBY」「SNJ」や、図4の「注文」タグ下の「店舗コード」タグから抽出された「OSK」「NGY」「OSK」を値として持つことになる。
なお、XMLファイル側に対応するタグがない場合は、仮想テーブル中の対応する項目の値はNULL(図中「−」で表現される)とする。たとえば図3に示したXMLファイルには、「CUSTOMER」項目に対応するタグ(具体的には「注文」タグ下の「顧客コード」タグ)がないので、図5の仮想テーブルでは、当該ファイルから抽出されたデータの「顧客コード」項目が「−」になっている。
そして、たとえばクライアント101が「SALES」テーブルの「SALES」項目の値を「STORE」項目ごとかつ「SALESDATE」項目ごとに集計して、「STORE」項目を縦軸(行)、「SALESDATE」項目を横軸(列)とする二次元表に加工するよう要求してきた場合、データ加工部200f−2は図5の仮想テーブルから図6に示すような二次元表を生成する。
図2の説明に戻り、次に要求受付部200hはクライアント201からデータの参照要求を受信するとともに、当該要求の処理に必要な事項、すなわち「どのデータをどんな形で見たいのか」をクライアント201に問い合わせて、その回答を送信データ生成部200fへ出力する機能部である。
次に、図7はこの発明の実施の形態にかかるデータ分析支援装置における、未確定データの加工処理の手順を示すフローチャートである。クライアント201からのデータ参照要求を受信したサーバ100の要求受付部200hは(ステップS701:Yes)、まず仮想テーブル定義記憶部200gを参照して、対象となるデータの範囲や加工方法などをユーザに指定させるための条件入力画面を作成・返信する(ステップS702)。
図8は、クライアント201における上記画面の表示の一例を示す説明図である。図中、テーブル選択エリア800は対象となるデータの範囲をユーザに指定させるための領域であり、仮想テーブル定義記憶部200g内にその定義が保持されている、すべての仮想テーブルのタイトルが表示される。たとえば、上述の「SALES」テーブルのタイトルは「店頭販売」であるものとする。
また、縦軸選択エリア801・横軸選択エリア802はデータ加工部200f−2による集計の軸をユーザに指定させるための領域であり、テーブル選択エリア800で選択されている「SALES」テーブルの項目のうち、種別が「分類キー」であるもののタイトル、具体的には「STORE」「SALESDATE」「ITEM」「CUSTOMER」項目のタイトル「店舗」「販売日付」「商品型番」「顧客コード」が表示される。
また、集計項目選択エリア803はデータ加工部200f−2による集計の対象をユーザに指定させるための領域であり、テーブル選択エリア800で選択されている「SALES」テーブルの項目のうち、種別が「データ値」であるもののタイトル、具体的には「SALES」「NUMBER」項目のタイトル「販売金額」「数量」が表示される。そして集計方法選択エリア804で、選択された集計項目の合計値を算出するのか平均値を算出するのかを選択できるようになっている。
なお、テーブル選択エリア800で別のテーブルが選択されたときは、選択後のテーブルがクライアント201からサーバ200へ通知され、当該テーブルの定義から特定された分類キー項目とデータ値項目とが返信される。そして、縦軸選択エリア801・横軸選択エリア802・集計項目選択エリア803の表示内容が、選択中のテーブルに合わせて切り替えられる。
その後、クライアント201のユーザが必要事項を入力してOKボタン805を押下すると、上記画面の指定内容がクライアント201からサーバ200に返信され、送信データ生成部200fは要求受付部200hを介してこれを受信する(ステップS703:Yes)。なお、ここでは図示するように、対象テーブルとして「SALES」(図中「店頭販売」)、縦の集計軸として「STORE」(同「店舗」)、横の集計軸として「SALESDATE」(同「販売日付」)、集計項目として「SALES」(同「販売金額」)、集計方法として「合計」が、それぞれ指定されたものとする。
そして送信データ生成部200fでは、まずその仮想テーブル生成部200f−1により、仮想テーブル定義記憶部200g内の「SALES」テーブルの定義を参照して、XMLデータ記憶部200e内のデータから図5に示したような仮想テーブル「SALES」を生成する(ステップS704)。
次に、送信データ生成部200fはそのデータ加工部200f−2により、上記テーブル内の指定された集計項目「SALES」の値を、指定された軸項目「STORE」および「SALESDATE」ごとに集計する(ステップS705)。図9はこの集計の結果を模式的に示す説明図である。図示する表は、店舗ごとかつ販売日付ごとの販売金額の合計を示してはいるものの、ユーザが指定した「STORE」を縦軸、「SALESDATE」を横軸とする二次元表の形にはなっていない。そこで、データ加工部200f−2はさらに上記結果中のデータ位置を入れ替えて、最終的に図6に示したような二次元表を生成する(ステップS706)。
その後、上記表は送信データ生成部200fから要求受付部200hに引き渡され、要求受付部200hから要求元のクライアント201に返信される(ステップS707)。
以上説明した実施の形態によれば、情報系データベース200aにまだ取り込まれていない未確定データ(発生直後であってまだ正規化やクレンジングがなされていないデータ)であっても、クライアント201からは確定データと同様に参照することが可能である。そのため従来のOLAPでは不能であった、鮮度の高いデータを基礎とするリアルタイムなデータ分析が可能となる。
また、基幹系データベース202から吸い上げられたデータは一律にXML形式に変換されており、複数のXMLタグを仮想テーブルの同一の項目に対応づけることができるので、部門ごとにデータベースの構造やテーブルの構造が異なる場合でも、ユーザに見せる表やグラフではその差異を吸収することができる。
なお、上述した仮想テーブルはユーザからの参照要求時にアドホックに生成され、また必ずしも正確性や完全性は保障されない未確定データを基礎とする点で、情報系データベース200a内の恒常的なテーブルとは異なるが(「仮想」の語を用いているのもこのためである)、形式的には情報系データベース200a内のテーブルと異なる点はない。
そこで、たとえば仮想テーブル「SALES」を情報系データベース200a内の店舗マスタテーブルと結合して、図10のようなテーブル(図5の仮想テーブルに「店舗名」項目が追加されたもの)を作成すれば、ユーザに見せる二次元表では図11のように、縦軸を店舗名とすることもできる(図6では縦軸が店舗コードであったことと対比)。上記は列方向に確定データを追加する例であるが、たとえば図12に示すような行方向への追加、すなわち確定データのみからなるレコードと未確定データのみからなるレコードとの混在するテーブルを作成することも可能である。このように、情報系データベース200a内のテーブルと仮想テーブルとを適宜組み合わせることで、従来不可能であった、確定データと未確定データをあわせたシームレスなデータ分析が可能となる。
なお、本実施の形態で説明したデータ分析支援方法は、予め用意されたプログラムをパーソナル・コンピュータやワークステーション等のコンピュータで実行することにより実現することができる。このプログラムは、ハードディスク105、フレキシブルディスク107、CD−ROM、MO、DVD等のコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。またこのプログラムは、インターネット等のネットワークを介して配布することが可能な伝送媒体であってもよい。
(付記1)データウエアハウスにまだ格納されていないデータからマークアップ文書を生成する文書生成工程と、
前記文書生成工程で生成されたマークアップ文書の中から、指定されたテーブルの項目に対応づけられたタグを検索するタグ検索工程と、
前記タグ検索工程で検索されたタグ内のデータを抽出するデータ抽出工程と、
前記データ抽出工程で抽出されたデータを前記項目の値として前記テーブルを生成するテーブル生成工程と、
前記テーブル生成工程で生成されたテーブル内のデータを指定された形式に加工するデータ加工工程と、
をコンピュータに実行させることを特徴とするデータ分析支援プログラム。
(付記2)前記テーブルの各項目には複数のタグが対応づけられていることを特徴とする前記付記1に記載のデータ分析支援プログラム。
(付記3)前記文書生成工程で生成されるマークアップ文書はXML形式であることを特徴とする前記付記1または付記2に記載のデータ分析支援プログラム。
(付記4)さらに、前記テーブル生成工程で生成されたテーブルを前記データウエアハウス内のテーブルと結合するテーブル結合工程を含み、
前記データ加工工程では、前記テーブル結合工程で結合されたテーブル内のデータを指定された形式に加工することを特徴とする前記付記1〜付記3のいずれか一つに記載のデータ分析支援プログラム。
(付記5)データウエアハウスにまだ格納されていないデータからマークアップ文書を生成する文書生成工程と、
前記文書生成工程で生成されたマークアップ文書の中から、指定されたテーブルの項目に対応づけられたタグを検索するタグ検索工程と、
前記タグ検索工程で検索されたタグ内のデータを抽出するデータ抽出工程と、
前記データ抽出工程で抽出されたデータを前記項目の値として前記テーブルを生成するテーブル生成工程と、
前記テーブル生成工程で生成されたテーブル内のデータを指定された形式に加工するデータ加工工程と、
を含むことを特徴とするデータ分析支援方法。
(付記6)前記テーブルの各項目には複数のタグが対応づけられていることを特徴とする前記付記5に記載のデータ分析支援方法。
(付記7)前記文書生成工程で生成されるマークアップ文書はXML形式であることを特徴とする前記付記5または付記6に記載のデータ分析支援方法。
(付記8)さらに、前記テーブル生成工程で生成されたテーブルを前記データウエアハウス内のテーブルと結合するテーブル結合工程を含み、
前記データ加工工程では、前記テーブル結合工程で結合されたテーブル内のデータを指定された形式に加工することを特徴とする前記付記5〜付記7のいずれか一つに記載のデータ分析支援方法。
(付記9)データウエアハウスにまだ格納されていないデータからマークアップ文書を生成する文書生成手段と、
前記文書生成手段により生成されたマークアップ文書の中から、指定されたテーブルの項目に対応づけられたタグを検索するタグ検索手段と、
前記タグ検索手段により検索されたタグ内のデータを抽出するデータ抽出手段と、
前記データ抽出手段により抽出されたデータを前記項目の値として前記テーブルを生成するテーブル生成手段と、
前記テーブル生成手段により生成されたテーブル内のデータを指定された形式に加工するデータ加工手段と、
を備えることを特徴とするデータ分析支援装置。
(付記10)前記テーブルの各項目には複数のタグが対応づけられていることを特徴とする前記付記9に記載のデータ分析支援装置。
(付記11)前記文書生成手段により生成されるマークアップ文書はXML形式であることを特徴とする前記付記9または付記10に記載のデータ分析支援装置。
(付記12)さらに、前記テーブル生成手段により生成されたテーブルを前記データウエアハウス内のテーブルと結合するテーブル結合手段を含み、
前記データ加工手段は、前記テーブル結合手段により結合されたテーブル内のデータを指定された形式に加工することを特徴とする前記付記9〜付記11のいずれか一つに記載のデータ分析支援装置。
以上のように、本発明にかかるデータ分析支援プログラム、データ分析支援方法、およびデータ分析支援装置は、データウエアハウスにまだ取り込まれていないデータの閲覧に有用であり、特に発生直後のデータを含めたリアルタイムな状況分析が必要な場合に適している。
この発明の実施の形態にかかるデータ分析支援装置のハードウエア構成を示す説明図である。 この発明の実施の形態にかかるデータ分析支援装置を含む、データ分析支援システムの機能構成を示す説明図である。 変換前のソースデータと変換後のXMLデータの一例を示す説明図である。 変換前のソースデータと変換後のXMLデータの他の一例を示す説明図である。 仮想テーブル定義および当該定義に従って生成される仮想テーブルの一例を模式的に示す説明図である。 データ加工部200f−2により生成される二次元表の一例を示す説明図である。 この発明の実施の形態にかかるデータ分析支援装置における、未確定データの加工処理の手順を示すフローチャートである。 クライアント201における条件画面の表示の一例を示す説明図である。 データ加工部200f−2による集計結果を模式的に示す説明図である。 確定データと未確定データとが混在するテーブルの一例を模式的に示す説明図である。 図10のテーブルから作成される二次元表の一例を示す説明図である。 確定データと未確定データとが混在するテーブルの他の一例を模式的に示す説明図である。
符号の説明
200 サーバ
201 クライアント
202 基幹系データベース
200a 情報系データベース
200b ソースデータ抽出部
200c ソースデータ記憶部
200d XMLデータ生成部
200e XMLデータ記憶部
200f 送信データ生成部
200f−1 仮想テーブル生成部
200f−2 データ加工部
200g 仮想テーブル定義記憶部
200h 要求受付部

Claims (10)

  1. データウエアハウスにまだ格納されていないデータからマークアップ文書を生成する文書生成工程と、
    前記文書生成工程で生成されたマークアップ文書の中から、指定されたテーブルの項目に対応づけられたタグを検索するタグ検索工程と、
    前記タグ検索工程で検索されたタグ内のデータを抽出するデータ抽出工程と、
    前記データ抽出工程で抽出されたデータを前記項目の値として前記テーブルを生成するテーブル生成工程と、
    前記テーブル生成工程で生成されたテーブル内のデータを指定された形式に加工するデータ加工工程と、
    をコンピュータに実行させることを特徴とするデータ分析支援プログラム。
  2. 前記テーブルの各項目には複数のタグが対応づけられていることを特徴とする前記請求項1に記載のデータ分析支援プログラム。
  3. 前記文書生成工程で生成されるマークアップ文書はXML形式であることを特徴とする前記請求項1または請求項2に記載のデータ分析支援プログラム。
  4. さらに、前記テーブル生成工程で生成されたテーブルを前記データウエアハウス内のテーブルと結合するテーブル結合工程を含み、
    前記データ加工工程では、前記テーブル結合工程で結合されたテーブル内のデータを指定された形式に加工することを特徴とする前記請求項1〜請求項3のいずれか一つに記載のデータ分析支援プログラム。
  5. データウエアハウスにまだ格納されていないデータからマークアップ文書を生成する文書生成工程と、
    前記文書生成工程で生成されたマークアップ文書の中から、指定されたテーブルの項目に対応づけられたタグを検索するタグ検索工程と、
    前記タグ検索工程で検索されたタグ内のデータを抽出するデータ抽出工程と、
    前記データ抽出工程で抽出されたデータを前記項目の値として前記テーブルを生成するテーブル生成工程と、
    前記テーブル生成工程で生成されたテーブル内のデータを指定された形式に加工するデータ加工工程と、
    を含むことを特徴とするデータ分析支援方法。
  6. 前記テーブルの各項目には複数のタグが対応づけられていることを特徴とする前記請求項5に記載のデータ分析支援方法。
  7. 前記文書生成工程で生成されるマークアップ文書はXML形式であることを特徴とする前記請求項5または請求項6に記載のデータ分析支援方法。
  8. データウエアハウスにまだ格納されていないデータからマークアップ文書を生成する文書生成手段と、
    前記文書生成手段により生成されたマークアップ文書の中から、指定されたテーブルの項目に対応づけられたタグを検索するタグ検索手段と、
    前記タグ検索手段により検索されたタグ内のデータを抽出するデータ抽出手段と、
    前記データ抽出手段により抽出されたデータを前記項目の値として前記テーブルを生成するテーブル生成手段と、
    前記テーブル生成手段により生成されたテーブル内のデータを指定された形式に加工するデータ加工手段と、
    を備えることを特徴とするデータ分析支援装置。
  9. 前記テーブルの各項目には複数のタグが対応づけられていることを特徴とする前記請求項8に記載のデータ分析支援装置。
  10. 前記文書生成手段により生成されるマークアップ文書はXML形式であることを特徴とする前記請求項8または請求項9に記載のデータ分析支援装置。

JP2004137115A 2004-05-06 2004-05-06 データ分析支援プログラム、データ分析支援方法、およびデータ分析支援装置 Pending JP2005321849A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2004137115A JP2005321849A (ja) 2004-05-06 2004-05-06 データ分析支援プログラム、データ分析支援方法、およびデータ分析支援装置
US10/953,644 US20050262433A1 (en) 2004-05-06 2004-09-29 Computer product, data analysis support method, and data analysis support apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004137115A JP2005321849A (ja) 2004-05-06 2004-05-06 データ分析支援プログラム、データ分析支援方法、およびデータ分析支援装置

Publications (1)

Publication Number Publication Date
JP2005321849A true JP2005321849A (ja) 2005-11-17

Family

ID=35376646

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004137115A Pending JP2005321849A (ja) 2004-05-06 2004-05-06 データ分析支援プログラム、データ分析支援方法、およびデータ分析支援装置

Country Status (2)

Country Link
US (1) US20050262433A1 (ja)
JP (1) JP2005321849A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014130539A (ja) * 2012-12-28 2014-07-10 Fujitsu Ltd 情報処理装置、ノード抽出プログラムおよびノード抽出方法
WO2017009886A1 (ja) * 2015-07-10 2017-01-19 三菱電機株式会社 データ取得装置、データ取得方法及びデータ取得プログラム
KR20200099771A (ko) * 2019-02-15 2020-08-25 리걸테크 주식회사 데이터 관리 시스템 및 데이터 관리 방법
JP7383799B2 (ja) 2019-09-13 2023-11-20 タブロー ソフトウェア,エルエルシー マルチファクトデータセットのデータ視覚化を生成するための適切な測度集計の活用

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008250515A (ja) * 2007-03-29 2008-10-16 Ricoh Co Ltd 機器管理装置及び機器管理システム
US20080256480A1 (en) * 2007-04-06 2008-10-16 Sbs Information Systems Co., Ltd. Data gathering and processing system
US8856071B2 (en) * 2009-08-11 2014-10-07 At&T Intellectual Property I, L.P. Minimizing staleness in real-time data warehouses

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3213585B2 (ja) * 1998-07-09 2001-10-02 株式会社インフォメックス データ検索方法及び装置、データ検索システム、記録媒体
US6721727B2 (en) * 1999-12-02 2004-04-13 International Business Machines Corporation XML documents stored as column data
US20020029207A1 (en) * 2000-02-28 2002-03-07 Hyperroll, Inc. Data aggregation server for managing a multi-dimensional database and database management system having data aggregation server integrated therein
US6934712B2 (en) * 2000-03-21 2005-08-23 International Business Machines Corporation Tagging XML query results over relational DBMSs
US6768986B2 (en) * 2000-04-03 2004-07-27 Business Objects, S.A. Mapping of an RDBMS schema onto a multidimensional data model
US6594672B1 (en) * 2000-06-01 2003-07-15 Hyperion Solutions Corporation Generating multidimensional output using meta-models and meta-outlines
US7117215B1 (en) * 2001-06-07 2006-10-03 Informatica Corporation Method and apparatus for transporting data for data warehousing applications that incorporates analytic data interface
US6604110B1 (en) * 2000-08-31 2003-08-05 Ascential Software, Inc. Automated software code generation from a metadata-based repository
EP1217541A1 (en) * 2000-11-29 2002-06-26 Lafayette Software Inc. Method of processing queries in a database system, and database system and software product for implementing such method
US7178100B2 (en) * 2000-12-15 2007-02-13 Call Charles G Methods and apparatus for storing and manipulating variable length and fixed length data elements as a sequence of fixed length integers
JP2003150594A (ja) * 2001-11-12 2003-05-23 Hitachi Ltd データウェアハウスシステム
US6829606B2 (en) * 2002-02-14 2004-12-07 Infoglide Software Corporation Similarity search engine for use with relational databases
US7015911B2 (en) * 2002-03-29 2006-03-21 Sas Institute Inc. Computer-implemented system and method for report generation
US7181456B2 (en) * 2002-08-20 2007-02-20 Microsoft Corporation Process description language
US7716167B2 (en) * 2002-12-18 2010-05-11 International Business Machines Corporation System and method for automatically building an OLAP model in a relational database
US7152073B2 (en) * 2003-01-30 2006-12-19 Decode Genetics Ehf. Method and system for defining sets by querying relational data using a set definition language
US7313561B2 (en) * 2003-03-12 2007-12-25 Microsoft Corporation Model definition schema
US7778899B2 (en) * 2003-05-19 2010-08-17 Serena Software, Inc. Method and system for object-oriented workflow management of multi-dimensional data

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014130539A (ja) * 2012-12-28 2014-07-10 Fujitsu Ltd 情報処理装置、ノード抽出プログラムおよびノード抽出方法
WO2017009886A1 (ja) * 2015-07-10 2017-01-19 三菱電機株式会社 データ取得装置、データ取得方法及びデータ取得プログラム
JPWO2017009886A1 (ja) * 2015-07-10 2017-10-12 三菱電機株式会社 データ取得装置、データ取得方法及びデータ取得プログラム
CN107533550A (zh) * 2015-07-10 2018-01-02 三菱电机株式会社 数据取得装置、数据取得方法和数据取得程序
CN107533550B (zh) * 2015-07-10 2019-01-29 三菱电机株式会社 数据取得装置、数据取得方法和计算机能读取的记录介质
US10289719B2 (en) 2015-07-10 2019-05-14 Mitsubishi Electric Corporation Data acquisition device, data acquisition method and computer readable medium
KR20200099771A (ko) * 2019-02-15 2020-08-25 리걸테크 주식회사 데이터 관리 시스템 및 데이터 관리 방법
KR102183815B1 (ko) * 2019-02-15 2020-11-27 리걸테크 주식회사 데이터 관리 시스템 및 데이터 관리 방법
JP7383799B2 (ja) 2019-09-13 2023-11-20 タブロー ソフトウェア,エルエルシー マルチファクトデータセットのデータ視覚化を生成するための適切な測度集計の活用

Also Published As

Publication number Publication date
US20050262433A1 (en) 2005-11-24

Similar Documents

Publication Publication Date Title
CN102959578B (zh) 取证系统、取证方法及取证程序
JP4097263B2 (ja) ウェブアプリケーションモデル生成装置、ウェブアプリケーション生成支援方法及びプログラム
US7555480B2 (en) Comparatively crawling web page data records relative to a template
WO2011090538A1 (en) Collecting community feedback for collaborative document development
CN103262106A (zh) 管理来自结构化和非结构化数据源的内容
US20080250052A1 (en) Repopulating a database with document content
JPH08305616A (ja) データ管理システム
Weigl et al. On providing semantic alignment and unified access to music library metadata
JP4855080B2 (ja) スキーマ統合支援装置、スキーマ統合支援装置のスキーマ統合支援方法およびスキーマ統合支援プログラム
JP7290391B2 (ja) 情報処理装置及びプログラム
JP2005321849A (ja) データ分析支援プログラム、データ分析支援方法、およびデータ分析支援装置
TWI296380B (en) Method and apparatus for electronic document collection
JP2008181218A (ja) 入力支援方法及び装置
US20050171966A1 (en) Relational to hierarchical tree data conversion technique
Meyer Reference accuracy: best practices for making the links
Rasmussen et al. The data documentation initiative: a preservation standard for research
JP2020064482A (ja) 属性抽出装置および属性抽出方法
Delsey The Library Catalogue in a Networked Environment.
McGrath Musings on Faceted Search, Metadata, and Library Discovery Interfaces
JPH117452A (ja) ネットワークを介した情報収集方法および装置と該方法を実施するプログラムを記録した記録媒体
Onwuchekwa Organisation of information and the information retrieval system
Chiu Towards a hypermedia-enabled and web-based data analysis framework
Schuchardt et al. Applying content management to automated provenance capture
JP4352840B2 (ja) プログラム、データ処理方法およびデータ処理システム
JP2007011721A (ja) 文書検索装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060726

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090707

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090907

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20091006