JP2001522495A - 動的に増加しているデータベース・データ・セットの増加集計方法 - Google Patents

動的に増加しているデータベース・データ・セットの増加集計方法

Info

Publication number
JP2001522495A
JP2001522495A JP54735498A JP54735498A JP2001522495A JP 2001522495 A JP2001522495 A JP 2001522495A JP 54735498 A JP54735498 A JP 54735498A JP 54735498 A JP54735498 A JP 54735498A JP 2001522495 A JP2001522495 A JP 2001522495A
Authority
JP
Japan
Prior art keywords
data
stored
group identifier
intermediate file
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP54735498A
Other languages
English (en)
Inventor
モハーン、サンカラン
サンカラン、サレッシュ
モン、ウォン
ディアス、ネサマネー
Original Assignee
インフォーマティカ、コーポレーション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by インフォーマティカ、コーポレーション filed Critical インフォーマティカ、コーポレーション
Publication of JP2001522495A publication Critical patent/JP2001522495A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2433Query languages
    • G06F16/244Grouping and aggregation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/283Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99934Query formulation, input preparation, or translation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99937Sorting
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99942Manipulating data structure, e.g. compression, compaction, compilation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 動的に増加するデータベース・データ・セットの増加集計を行う方法。本発明の実施例は、データ市場またはデータ倉庫内で作動し新たに受けたデータに対応して演算データベースに記憶されているデータを集計し現在の情報を提供する。最初に、コンピュータ・サーバは、集合データ・セットでサーバによって初期化される中間ファイルを作成する。集合データ・セットはデータ値および特定グループ識別子に各々対応する計数値からなる。コンピュータは新しい入力データ・セット内のグループ識別子のいずれかが中間ファイルに記憶されているグループ識別子のいずれかと同一であるかを判定する。入力されたグループ識別子が記憶されているグループ識別子と同一である場合、入力されたデータ値は記憶されているデータ値と集計されかつ特定の記憶されているグループ識別子に対応する計数値を1増加させる。入力されたグループ識別子が記憶されてるグループ識別子のいずれとも一致しない場合、入力されたグループ識別子および対応するデータ値が中間ファイル内に記憶され、かつ計数値1が特定グループ識別子に加えられる。新しい入力データ・セット内の全てのグループ識別子が一旦決められると、コンピュータは中間ファイルに対してなされた変更の全てを集合データ・セットに記憶する。

Description

【発明の詳細な説明】 動的に増加しているデータベース・データ・セットの増加集計方法 発明の分野 本発明はデータベース・システムに関する。より詳しくは、本発明は動的に増 加しているコンピュータ・データベース・データ・セットの増加集計方法に関す る。 発明の背景 コンピュータは、金銭上の取引並びに商取引、製造、保健、電気通信等、多様 な分野において多様な応用がなされている。これらのアプリケーションのほとん どは通常、データを入力し、コンピュータ・プログラムに従ってデータを処理し 、その後、結果をデータベースに記憶するものである。コンピュータがより強力 、高速および多様になるにつれて、処理可能なデータの量がそれに応じて増加し ている。コンピュータ技術の進歩に遅れないように、データベースをピークの演 算効率に対して設計することが絶対的に必要となった。従って、演算データベー スは最大の処理量、アクセス時間、および記憶容量に合わせて構築、類別、およ びフォーマットされている。 残念ながら、これらの演算データベースに見られる原データは、人から見た場 合、当惑させ理解不可能と思われる数字および符号の行列としてしばしば存在す る。さらに、現代のデータベースに記憶されている原データの範囲および広大さ に、たまたま居合わせた観察者は圧倒される。従って、人が容易に理解できるよ うにデータを解釈、分析、および編集する助けとなるようにアプリケーションが 開発されている。これは表示する前に原データを選別、分類、および要約するこ とによってなされる。これにより人はデータを解釈し、データに基づいて重要な 決定をすることができる。 原データを1以上の演算データベースから取り出して有用な情報に変換するこ とが、データ「倉庫」およびデータ「市場」の機能である。データ倉庫およびデ ータ市場において、データは演算上の必要よりもむしろ決定支援の役割を満足さ せるように構成されている。データをデータ倉庫またはデータ市場に格納する前 に、演算データベースからの対応する源データを濾過し無関係かつ間違っている 記録を取り除き、暗号および相反する符号を解読し、原データを意味のあるもの に変換し、決定支援、傾向分析その他のエンドユーザーの要求に役立つ要約デー タを予め計算する。結局、データ倉庫は決定支援に役立つ非常に大量のデータを 含む分析データベースからなる。データ市場はデータ倉庫と似ているが、但し財 政、販売、在庫品、または人材のような事業の単一局面に対する集合データのサ ブセットを収容している。データ倉庫およびデータ市場で、決定者は有用な情報 を自由に保持している。 データ倉庫を使用するであろう会社としては例えば、何千件ものホテルを世界 中に有し各顧客の滞在の詳細をすべて記録しているホテル・チェーンが挙げられ る。このデータを貯蔵しておくことによって、ホテル・チェーンの取締役はデー タ倉庫から記憶されているデータにアクセスして、世界中の顧客に対するサービ スをいかに改善するかに関する重要な決定をするためにデータを使用することが できる。 データ倉庫およびデータ市場の両方に関する一つの課題は、演算データベース に記憶されている非常に大量のデータを、頻繁に入力される非常に大量のデータ と集計することである。データ倉庫またはデータ市場に記憶されているデータを 新たに入力されたデータと集計することによって、原データは決定者が頼りにで きる最新で有意義な情報に変換される。重要な決定が決定時の事業を最もよく表 している情報に基づくように決定者が最新の現在情報を有することが重要である 。データ市場またはデータ倉庫に記憶されているデータを、新たに入力されたデ ータと集計することに関する問題は実行に非常に時間がかかるということである 。集計処理時間が長い理由はデータ市場またはデータ倉庫に記憶されている全て の関連データを新たに入力されたデータと再集計するからである。集計処理時間 が長いという問題は非常に多くの量のデータが頻繁にデータ市場またはデータ倉 庫に入力されると悪化する。例えば、データ倉庫に何テラバイトものデータが記 憶されかつ100万レコードのデータが毎週入力されている場合、データ倉庫に アクセスする中央コンピュータは新データが入力される毎に記憶されている全デ ータを再集計しようとして圧倒される。 従って、中央コンピュータがデータ倉庫、データ市場、およびデータベースに アクセスし、これらに記憶されている何セットものデータを頻繁に入力される大 量のデータと容易に集計することができる方法を提供すると好都合であろう。本 発明はこのような利点を提供する。 発明の要約 本発明は、動的に増加しているデータベース・データ・セットの増加集計を行 う方法である。本発明の実施例は、データ市場またはデータ倉庫内で作動し新た に受けた即ち入力されたデータに応じて演算データベースに記憶されているデー タを集計し最新情報を提供する。最初に、コンピュータ・サーバが集合データ・ セットで初期化される中間ファイルを生成する。集合データ・セットは特定のグ ループ識別子に各々対応するデータ値および計数値からなる。集合データ・セッ トがデータ市場またはデータ倉庫の中間ファイルに一旦記憶されると、本発明は 新たな入力データ・セットを受ける準備ができるが、データは特定グループ識別 子に各々対応するデータ値からなる。その後、コンピュータは新しい入力セット 内に設けられているグループ識別子のいずれかが中間ファイルに記憶されている グループ識別子のいずれかと同一であるかを判定する。入力されたグループ識別 子が記憶されているグループ識別子と一致すると、入力されたグループ識別子に 対応する入力データ値を、記憶されている記憶グループ識別子に対応する記憶デ ータ値と集計する。記憶されているグループ識別子に対応する計数値は値1だけ 増加する。入力されたグループ識別子が中間ファイルに記憶されてるグループ識 別子のいずれとも一致しない場合、入力されたグループ識別子および対応する入 力データ値が中間ファイルに記憶されかつ計数値1が特定グループ識別子に加え られる。新しい入力データ・セット内の全てのグループ識別子が一旦決められる と、コンピュータは中間ファイルになされた変更の全てを集合データ・セットに 記憶する。中間ファイルに生じた変更のみを記憶することによって、集合データ ・セットは最新情報で更新され集合データ・セット全体を更新する必要がない。 図面の簡単な説明 本発明は添付図面において限定的ではなく例によって示され、同一の構成要素 には同一の参照番号が付される。 図1は動的に増加するデータベース・データ・セットに対して増加集計の演算 を行う本発明が適用されたコンピュータ・システム・データベースを示す図。 図2は動的に増加するデータベース・データ・セットに対して合計、平均また は計数からなる増加集計を行う本発明の実施例のフローチャートを示す図。 図3Aは本発明がどのように作動して動的に増加するデータベース・データ・ セットを増加集計するかを示しているブロック図および表。 図3Bはソース・テーブル300a'および図3Aのターゲット・テーブル3 02aを示し、本発明が動的に増加するデータベース・データ・セットをどのよ うに増加集計するかをより十分に示す図。 詳細な説明 動的に増加しているデータベース・データ・セットの増加集計方法を説明する 。以下の記載において、説明の目的で、本発明が完全に理解されるように数多く の詳細を述べる。しかしながら、これらの詳細がなくても本発明が実施可能であ ることは当業者には明らかである。一方、本発明が不明瞭になることを回避する ために周知の構造および装置はブロック図形式で示す。 図1はデータベース・システムに入力されたデータの集計演算を行う本発明が 適用されたコンピュータ・システム・データベースを示す図である。このデータ べース・システムは、サーバ110(例えばUnixまたはNTサーバ・コンピ ュータ)にアクセス可能な情報にアクセスするために使用される専用コンピュー タ端末101〜105(例えばパソコン、ラップトップコンピュータ、ワークス テーション、ターミナル等)からなる。各コンピュータ端末101〜105は、 データを記憶かつ処理するためのそれ自身の物理的メモリ・システム(例えば、 ハードドライブ、ランダムアクセスメモリ、読み出し専用メモリ等)を有する。 サーバ110が接続されている大容量記憶装置112によってコンピュータ端末 101〜105は大容量記憶装置112内に設けられている非常に多くの量のデ ータにアクセスできる。サーバ110はコンピュータ端末101〜105がアク セス可能なそれ自身の物理的メモリ・システムも有する。サーバ110のメモリ ・システム内に設けられている中間ディスク・ファイル114のメモリ表現は、 サーバ110内での本発明による集計演算時に使用されコンピュータ端末101 〜105に表示される。大容量記憶装置112に設けられている演算データベー ス116はデータ市場またはデータ倉庫用の原データを記憶する。データ市場/ 倉庫113は、大容量記憶装置112に設けられているが、演算データベース1 16に記憶されている原データを決定支援に対してより有意義な情報に変換する 。 大容量記憶装置112に設けられている中間ディスク・ファイル115およびメ モリ内表現中間ディスク・ファイル114のいずれかを使用して本発明はその集 計演算を行うことができる。サーバ110および大容量記憶装置112はデータ 倉庫、データ市場、または大容量データベースを表している。指摘すべき重要な ことは、データ市場/倉庫113、中間ディスク・ファイル115、演算データ ベース116が別の大容量記憶装置に設けてもよくかつ各大容量記憶装置は別体 のサーバに接続可能であるということである。 図2は動的に増加しているデータベース・データ・セットに対して合計、平均 または計数からなる増加集計を行う本発明の実施例のフローチャートを示す。図 2はステップ202で開始する工程200を含む。ステップ204で図1のサー バ110はデータ市場/倉庫113に設けられているターゲット・テーブルに現 在記憶されている集計されたデータ・セットで中間ディスク・ファイル114お よび115のいずれかを生成かつ初期化する。ステップ204の目的は、中間デ ィスク・ファイル114および115のいずれかを作成して演算データベース1 16から新たに入力されたデータと、データ市場/倉庫113内のターゲット・ テーブルにすでに記憶されているデータとの集計を記憶することである。本発明 は、集計演算に中間ディスク・ファイル114および115のいずれかを使用す ることができる。本発明の作動を明瞭に説明するために、工程200の更なる説 明には中間ディスク・ファイル115を使用する。 ステップ204の完了後、図2のステップ206でサーバ110は新たな入力 列を受けるが、入力列にはグループ識別子および対応するデータ値が含まれてい る。グループ識別子が特定グループの項目(例えばハンバーガ)を規定する一方 でデータ値はグループがどれだけ多く売れたかを示すであろう。ステップ207 でサーバ110は入力列を調べるが、入力列にはグループ識別子と対応するデー タ値が含まれ、グループ識別子および対応するデータ値に対してステップ210 または214で行われる機能の型が決定される。例えば、グループ識別子および 対応するデータ値に対してサーバ110が行うであろう機能は挿入、更新、また は削除機能である。挿入機能によってサーバ110は入力列のデータを中間ディ スク・ファイル115に追加する一方で削除機能によってサーバ110は中間フ ァイル115から入力列のデータを削除する。更新機能によってサーバ110は 入力列のデータにおける単数または複数の変更を中間ファイル115に送る。本 発明の作動の説明を明瞭にするために、挿入機能は中間ファイル115における 各入力列のグループ識別子および対応するデータ値に対して行われるものとする 。 ステップ207の完了後、ステップ208でサーバ110は入力列の受信した グループ識別子が中間ディスク・ファイル115の記憶情報にすでに記憶されて いるかを判定する。受信したグループ識別子が中間ディスク・ファイル115に 設けられていない場合、サーバ110はステップ214に進む。ステップ214 でサーバ110は新しい独自のグループ識別子と対応するデータ値を中間ディス ク・ファイル115に記憶されているデータのリストに追加する。ステップ21 6でサーバ110は中間ディスク・ファイル115内の記憶データに追加された ばかりの新グループ識別子に対応する値1に等しい計数値を記憶する。 入力列のグループ識別子が中間ディスク・ファイル115に設けられている場 合、図2のステップ208でサーバ110はステップ210に進む。ステップ2 10でサーバ110は新たに受信したデータ値を中間ディスク・ファイル115 内の記憶データ値と集計するが、両データ値は同じグループ識別子に対応してい る。ステップ212でサーバ110はステップ210の同じグループ識別子に対 応する記憶計数値を1増加させる。記憶された計数値は、特定グループ識別子に 対応しているが、特定グループ識別子がサーバ110に受信された回数を表して いる。 ステップ212および216の両方でサーバ110は図2のステップ218に 進む。ステップ218でサーバ110は最後のグループ識別子および対応するデ ータ値が工程200で受信かつ処理されたかを判定する。最後のグループ識別子 および対応するデータ値が受信かつ処理されていない場合、ステップ218でサ ーバ110はステップ206へ進む。サーバ110は最後のグループ識別子およ びデータ値がサーバ110によって受信かつ処理されるまでステップ206〜2 18を繰り返す。 最後のグループ識別子およびデータ値がサーバ110によって一旦受信かつ処 理されると、サーバ110はステップ218からステップ220へ進む。ステッ プ220でサーバ110は中間ディスク・ファイル115内で行われた変更を、 データ市場/倉庫113に記憶されているターゲット・テーブルへ送信しテーブ ルを新情報で更新する。速度を最適にするために、中間ディスク・ファイル11 5内で生じた変更のみをデータ市場/倉庫113に設けられているターゲット・ テーブルに記憶する。このように最適化することによって記憶が高速化され不必 要な記憶手順が取り除かれる。ステップ220が一旦完了すると、サーバ110 はステップ222へ進み工程200が終了する。 図2の工程200が完了すると、図1のデータ市場/倉庫113に設けられて いるターゲット・テーブルには各々の特定のグループ識別子がデータ値の対応す る合計および各特定グループ識別子が受信された回数を示す各特定グループ識別 子に対応する計数とともに記憶される。これら三変数で、本発明によってサーバ 110は集計演算の一部として各グループ識別子の平均データ値を決めることも できる。ある特定グループ識別子の平均データ値「平均」を以下に示す関係に基 づいてサーバ110が計算する。 平均=合計/計数 上式において、「合計」はグループ識別子のデータ値の合計に等しく、「計数 」はこの特定グループ識別子に対応する計数に等しい。各グループ識別子に対し て 平均データ値を計算することができるので記憶されている原データに関する重要 な情報が得られる。 図2の工程200において説明した工程と同様、本発明によってサーバ110 (図1)はグループ識別子のデータ値を使用して最大および最小データ値を計算 することもできる。最大および最小データ値を計算することは各々本発明の集計 演算の別々の機能である。全てのグループの最大データ値を決めることは例えば 最大金額を使った顧客を判定する際、有用となるであろう。同様に全てのグルー プ識別子の最小データ値を計算することによって決定者に有用な情報を与えるこ とができる。 本発明における増加集計演算の機能に含まれるものとしてサーバ110(図1 )は使用者が規定した値の分散即ち変数xを計算することができる。サーバ11 0は以下の式に示す関係に基づいて数値の分散を計算する。 上式において、xiは使用者規定値xの要素の一つであり、nはxのセットに おける要素の数である。nの値が1に等しい場合、分散は0に等しい。使用者規 定値の分散を計算することによって原データを決定者に有用である有意義な情報 に変換することができる。 本発明の増加集計演算に含まれる更なる機能として、サーバ110は使用者規 定値即ち変数xの標準偏差を計算することができる。標準偏差は上述したように 最初に分散を計算し次に分散を表す値の平方根を求めることによって計算される 。使用者規定値の標準偏差を計算することによって難解なデータを重要な決定を 行う際、使用する有用な情報に変換することができる。 さらに、本発明による増加集計演算においてサーバ110は使用者規定値即ち 変数xの中央値を計算することができる。さらに本発明による増加集計演算にお いて、サーバ110は使用者規定値即ち変数xの階数を計算することができる。 階数機能において、例えばサーバ110は中間ファイル115に設けられている 10個の大きなデータ値を階数の高いものから低いものへと順次にリストに並べ る必要がある。使用者規定値の中央値または階数を計算することによって、難解 なデータを重要な決定をする際、使用する有用な情報に変換することができる。 図3Aは本発明がどのように作動してサーバ110(図1)が動的に増加する データベース・データ・セットの増加集計を行うかを示すブロック図および表を 示す図である。ソース・テーブル300は、サーバ110が受信し、結果として データ市場/倉庫113内のターゲット・テーブル302に記憶される演算デー タベース116の新入力データを示している。ソース・テーブル300に設けら れているソース・フィールド304および308は共に特定の新たに入力された データを示す。ソース・フィールド308が新たに入力されたグループ識別子を 示す一方でソース・フィールド304は対応するデータ値を示している。ターゲ ット・テーブル302に設けられているターゲット・フィールド306および3 10は共に、各対応グループ識別子に対して記憶されている集計されたデータ値 を示している。詳しくは、ターゲット・フィールド310が記憶されている独自 のグループ識別子を示す一方で、ターゲット・フィールド306は各グループ識 別子の対応する集計された合計データ値を示している。 図3Aのソース・テーブル300aおよびターゲット・テーブル302aには 本発明によってサーバ110(図1)がどのように集計演算を行うかの具体例が 示されている。ソース・テーブル300aおよびターゲット・テーブル302a は各々、ソース・テーブル300およびターゲット・テーブル302の詳細な説 明を表している。ソース・テーブル300aのソース・フィールド304aがデ ータ値を示す一方で、ソース・フィールド308aは対応するグループ識別子を 示している。ソース・フィールド304aの各データ値はソース・テーブル30 0aの同じ列に設けられているソース・フィールド308aのグループ識別子に 対応している。同様に、ターゲット・フィールド306aの集計された合計デー タ値は、各々ターゲット・テーブル302aの同じ列に設けられているターゲッ ト・フィールド310aのグループ識別子に対応している。 本発明の集計演算をより十分に理解するために、図3Aのソース・テーブル3 00aおよびターゲット・テーブル302aを具体例において使用する。ハンバ ーガ・グループに対応するデータ値は一時間以内に売れたハンバーガの量を表し ている。アップルパイ・グループに対応するデータ値は一時間以内に売れたアッ プルパイの量を表している。ミルクシェイキ・グループに対応するデータ値は一 時間以内に売れたミルクシェイキの量を表している。 図3Aのソース・フィールド308aが異なるグループ識別子を示す一方でソ ース・フィールド304aはこれらに対応するデータ値を示している。見ればわ かるように、ソース・テーブル300aにおける第一列は5個のハンバーガが一 時間以内に売れた事実を示し、第二列は6個のアップルパイが一時間以内に売れ た事実を示している。ソース・テーブル300aにおける第三列は3個のハンバ ーガが一時間以内に売れた事実を示し、第四列は4個のミルクシェイキが一時間 以内に売れた事実を示している。ソース・テーブル300aの第五列は7個のア ップルパイが一時間以内に売れた事実を示している。本発明によるとこの新入力 データが集計された後、この情報はターゲット・テーブル302aに記憶される 。 図3Aのターゲット・テーブル302aに示されているように、本発明による サーバ110はハンバーガ・グループの全てのデータ値を受信かつ集計し、ター ゲット・テーブル302aの第一列に示されているように一時間以内に売れた合 計8個のハンバーガとして記憶する。本発明によるサーバ110はアップルパイ ・グループの全てのデータ値を受信かつ集計し、ターゲット・テーブル302 aの第二列に示されているように一時間以内に売れた合計13個のアップルパイ として記憶する。また、本発明によるサーバ110はミルクシェイキ・グループ のデータ値を受信し、ターゲット・テーブル302aの第三列に示されているよ うに一時間以内に売れた合計4個のミルクシェイキとして記憶する。本例は本発 明によってサーバ110(図1)が行う集計演算を示している。本発明がその集 計演算をどのように行うかをより十分に理解するために、図3Bは本発明による サーバ110が情報の新ソース・テーブルに対してどのように受信かつ集計を行 うか、およびターゲット・テーブル302aにすでに存在している値にどのよう に変更が行われるかを示している。 図3Bが示すソース・テーブル300a'および図3Aのターゲット・テーブ ル302aは本発明が動的に増加するデータベース・データ・セットをどのよう に増加集計するかをより詳しく示している。ターゲット・テーブル302aは図 3Aに示されているものと全く同じ表であるが、但し本発明によるサーバ110 がデータ値をどのように変更し、新グループ識別子およびそれらに対応するデー タ値が受信された場合どのように追加するかを示している。ソース・テーブル3 00a'は図3Aのソース・テーブル300aと同じ型の表であるが、但しソー ス・テーブル300a'は新しい入力データ・セット値を対応するグループ識別 子とともに示している。ソース・テーブル300a'およびターゲット・テーブ ル302aの両方に設けられているグループ識別子は図3Aに対して上述した内 容と同じことを示している。唯一の違いは、まだ規定されていない新グループ識 別子があるということである。サラダ・グループに対応するデータ値は一時間以 内に売れたサラダの量を示している。 図3Bのソース・フィールド308a'が異なるグループ識別子を示す一方で 、ソース・フィールド304a'はそれらに対応するデータ値を示している。見 ればわかるように、ソース・テーブル300a'における第一列は5個のミルク シェイ キが一時間以内に売れた事実を示し、第二列は6個のサラダが一時間以内に売れ た事実を示している。ソース・テーブル300a'における第三列は4個のハン パーガが一時間以内に売れた事実を示している。本発明によるサーバ110は、 この二セットの新入力データを受信した後、増加集計しかつターゲット・テーブ ル302aに記憶する。 図3Bのターゲット・テーブル302aに示されているように、本発明による サーバ110(図1)は、ハンバーガ・グループの全てのデータ値を受信しかつ それらを図3Aにおいてすでに存在していたデータ値と増加集計し、ターゲット ・テーブル302aの第一列に示されているように一時間以内に売れた合計12 個のハンバーガを新たに記憶する。本発明はアップルパイ・グループに関するデ ータ値を何等受け取っていないので、アップルパイ・グループに対してターゲッ ト・テーブル302aにすでに存在するデータ値は変更されず一時間以内に売れ た13個のアップルパイのままである。このアップルパイ・グループの一定デー タ値はターゲット・テーブル302aの第二列に示されている。本発明によるサ ーバ110は、ミルクシェイキ・グループの全てのデータ値を受信しかつそれら を図3Aにおいてすでに存在していたデータ値と集計し、ターゲット・テーブル 302aの第三列に示されているように一時間以内に売れた合計9個のミルクシ ェイキを新たに記憶する。また、本発明によるサーバ110(図1)は新サラダ ・グループおよびそれに対応するデータ値を受信し、テーブルの第四列に示され ているように一時間以内に売れた合計6個のサラダとしてターゲット・テーブル 302aに記憶する。この例は、動的に増加するデータベース・データ・セット に対して本発明によって行われる増加集計演算を示している。 本発明の一実施例において、高速検索機構を使用して図1のサーバ110に設 けられている中間ディスク・ファイル114、または中間ディスク・ファイル1 15を検索する。この高速検索機構を本発明において実施する一手法は、b−ツ リーを使用することであるが、これは当業者には周知である。例えば、図1の中 間ディスク・ファイル114に100万個のグループが記憶されているとする。 新グループが演算データベース116からサーバ110に入力されると、新たに 受信されたグループが100万の記憶されているグループに設けられているか否 かを判定する必要がある。b−ツリー方法論によると、新たに受信されたグルー プが100万個の記憶されているグループに設けられているかを各記憶グループ を全て評価することなく素早く判定することができる。 集計演算を高速化するための本発明の更なる実施例は、中間ディスク・ファイ ル114および115のいずれかに記憶されているデータを図1のサーバ110 のランダム・アクセス・メモリ(RAM)へ移動させることである。これにより 本発明の集計演算はサーバ110のハード・ドライブから実行される場合よりも 高速に行うことができる。言い換えれば、本発明は利用するRAMにb−ツリー ・ディスク・ファイルを記憶する。 本発明の更に別の実施例は、図1の中間ディスク・ファイル114および11 5のいずれかを完全に維持する方法である。この方法を達成するため、演算デー タベース116からの新入力データを本発明によって集計する前後において中間 ファイル114および115のいずれかを複写する。これらの写しを新入力デー タ集計の前後に取ることによって、中間ディスク・ファイル114および115 のいずれかに記憶されている情報は前回保存された写しを消去するまで正確なま まであることが確実になる。この複写は集計が行われる前または後に生じるシス テムの故障から守るためにも行われる。システムの故障時にデータの損失を防ぐ ために行われる工程は中間ディスク・ファイル114および115のいずれかが 密閉された有効なデータ・ビットを有することによってデータの正確さを確実に することである。 さらに、本発明において、各ターゲット・テーブル302(図3A)の集計に 対して個々に中間ディスク・ファイル114または115(図1)を作成しても よい。言い換えれば、いくつかのターゲット・テーブルがあり、かつ異なる項目 が集計される場合、異なる中間ディスク・ファイルが存在しうる。この中間ディ スク・ファイルは、データがその特定ターゲット・テーブルに対して適切である ことを確実にするために、各特定のターゲットに対して保存される。 本発明の更なる実施例は、障害復旧支援を行うことができることである。b− ツリーを構築する時、構築の前または後にシステムの故障が生じる可能性がある 。b−ツリーを構築する前に故障が生じた場合、本発明は前回保存した点に戻り かつデータを完全に維持することができる。b−ツリーが首尾よく構築された後 であるがターゲット・データベースが更新される前にシステムの故障が生じた場 合、中間ディスク・ファイル114または115は集計されたデータの正確な写 しを保持しているがターゲット・データは一致していない。この問題を解決する ために、b−ツリーから直接ターゲット・テーブルに高速で誤差なしで装填可能 である特定の機構が使用される。 以上、本発明の具体的な実施例を例示および説明の目的で記載した。この記載 は、徹底的に記載されたものでも開示した正確な形態に発明を限定するように意 図したものでもなく、上記教示に照らしてみると多くの改良および変形が明らか に可能である。発明の原則およびその実際上の適用を最もよく説明するために実 施例を選択かつ記載したので、それにより当業者は発明および様々な実施例を様 々な改良とともに意図されている特定の用途に適するように最大限に利用するこ とができる。発明の範囲は添付する請求の範囲および均等範囲によって定義され ると考えられている。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 モン、ウォン アメリカ合衆国カリフォルニア州、サンノ ゼ、ヘデオック、コート、1685 (72)発明者 ディアス、ネサマネー アメリカ合衆国カリフォルニア州、サンフ ランシスコ、ダローリス、ストリート、 870 【要約の続き】 ータ・セット内の全てのグループ識別子が一旦決められ ると、コンピュータは中間ファイルに対してなされた変 更の全てを集合データ・セットに記憶する。

Claims (1)

  1. 【特許請求の範囲】 1. コンピュータ・システム・データベースにおいて、動的に変化する演算 データベース・データ・セットを増加集計するための方法であって、 a)中間ファイルを作成し、 b)一組の記憶されたグループ識別子およびこの記憶グループ識別子に対応する 一組の記憶データ値を含む前記演算データベースに記憶されている集合データ・ セットで中間ファイルを初期化し、 c)一組の新入力データに含まれている入力グループ識別子と、この入力グルー プ識別子に対応する入力データ値とを受取り、 d)前記入力グループ識別子が前記中間ファイルに記憶されている前記記憶グル ープ識別子のいずれかと同一であるかを判定し、 e)前記入力グループ識別子が前記中間ファイルに見られるいずれかの前記記憶 グループ識別子と同一である場合、前記入力データ値を対応する前記記憶データ 値と集計し、 f)前記入力グループ識別子が前記中間ファイルに記憶されている前記記憶グル ープ識別子のいずれとも同一でない場合、前記入力グループ識別子を前記中間フ ァイルに記憶し、 g)前記中間ファイルになされた変更を、前記演算データベースに記憶されてい る前記集合データ・セットに記憶するステップからなる方法。 2. ステップc)〜f)が前記一組の新入力データの次の入力グループ識別 子に対して繰り返される、請求の範囲第1項記載の方法。 3. 前記集合データ・セットが前記記憶グループ識別子に対応する計数値を さらに含み、前記計数値は前記コンピュータ・システム・データベースが前記グ ループ識別子を受けた回数を示している、請求の範囲第1項または第2項に記載 の方法。 4. 前記集計ステップは、前記中間ファイルに設けられている前記記憶グル ープ識別子に対応する計数値を増加させるステップをさらに備える、請求の範囲 第2項または第3項に記載の方法。 5. 前記入力グループ識別子を記憶する前記ステップは、前記中間ファイル に新たに記憶された入力グループ識別子に対応する1の計数を記憶するステップ を備える、請求の範囲第3項に記載の方法。 6. 前記中間ファイルに記憶されている前記データ値を特定グループ識別子 の前記計数値で割ることによって平均データ値を決定するステップを更に備える 、請求の範囲第1項〜第5項のいずれか1つに記載の方法。 7. 前記中間ファイルに記憶されている最大データ値を決定するステップを さらに備える、請求の範囲第1項〜第5項のいずれか1つに記載の方法。 8. 前記中間ファイルに記憶されている最小データ値を決定するステップを さらに備える、請求の範囲第1項〜第7項のいずれか1つに記載の方法。 9. 使用者が規定した値、または前記中間ファイルに記憶されている変数の 中央値を決定するステップをさらに備える、請求の範囲第1項〜第8項のいずれ か1つに記載の方法。 10. 使用者規定値、または前記中間ファイルに記憶されている変数の階数 を決定するステップをさらに備える、請求の範囲第1項〜第9項のいずれか1つ に記載の方法。 11. 使用者規定値、または前記中間ファイルに設けられている変数xの分 散を下記式: (上式において、xiは使用者規定値Xの要素の一つであり、nは一組のxにお ける要素の数であり、nの値が1に等しい場合、前記分散は0に等しい) に従って決定するステップをさらに備える、請求の範囲第1項〜第10項のいず れか1つに記載の方法。 12. xの分散の平方根を求める関係に基づいて標準偏差を決定するステッ プをさらに備える、請求の範囲第8項に記載の方法。 13. 前記決定ステップが検索機構としてb−ツリーを使用して前記中間フ ァイルを検索するステップを備える、請求の範囲第1項〜第12項のいずれか1 つに記載の方法。 14. 前記初期化ステップが前記中間ファイルを前記コンピュータ・システ ムのランダム・アクセス・メモリに記憶するステップを備える、請求の範囲第1 項〜第13項のいずれか1つに記載の方法。 15. 前記初期化ステップが、前記集合データ・セットを前記中間ファイル に記憶した後に前記中間ファイルに記憶されている要素の写しを作成するステッ プを備える、請求の範囲第1項〜第14項のいずれか1つに記載の方法。 16. 前記記憶ステップが、前記中間ファイルになされた変更を前記演算デ ータベースに記憶されている前記集合データ・セットに記憶する前に、前記中間 ファイルに記憶されている要素の写しを作成するステップを備える、請求の範囲 第1項〜第15項のいずれか1つに記載の方法。
JP54735498A 1997-04-30 1998-04-29 動的に増加しているデータベース・データ・セットの増加集計方法 Pending JP2001522495A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US08/846,934 US5794246A (en) 1997-04-30 1997-04-30 Method for incremental aggregation of dynamically increasing database data sets
US08/846,934 1997-04-30
PCT/US1998/008667 WO1998049636A1 (en) 1997-04-30 1998-04-29 A method for incremental aggregation of dynamically increasing database data sets

Publications (1)

Publication Number Publication Date
JP2001522495A true JP2001522495A (ja) 2001-11-13

Family

ID=25299348

Family Applications (1)

Application Number Title Priority Date Filing Date
JP54735498A Pending JP2001522495A (ja) 1997-04-30 1998-04-29 動的に増加しているデータベース・データ・セットの増加集計方法

Country Status (4)

Country Link
US (1) US5794246A (ja)
EP (1) EP0979469A1 (ja)
JP (1) JP2001522495A (ja)
WO (1) WO1998049636A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100850255B1 (ko) * 2001-12-28 2008-08-19 인터내셔널 비지네스 머신즈 코포레이션 실시간 데이터 웨어하우징

Families Citing this family (105)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6023694A (en) * 1996-01-02 2000-02-08 Timeline, Inc. Data retrieval method and apparatus with multiple source capability
US6631382B1 (en) 1996-01-02 2003-10-07 Timeline, Inc. Data retrieval method and apparatus with multiple source capability
US6625617B2 (en) 1996-01-02 2003-09-23 Timeline, Inc. Modularized data retrieval method and apparatus with multiple source capability
US6339775B1 (en) * 1997-11-07 2002-01-15 Informatica Corporation Apparatus and method for performing data transformations in data warehousing
US6014670A (en) * 1997-11-07 2000-01-11 Informatica Corporation Apparatus and method for performing data transformations in data warehousing
US6393472B1 (en) 1997-12-10 2002-05-21 At&T Corp. Automatic aggregation of network management information in spatial, temporal and functional forms
US7233952B1 (en) 1999-01-15 2007-06-19 Hon Hai Precision Industry, Ltd. Apparatus for visualizing information in a data warehousing environment
US7007029B1 (en) 1999-01-15 2006-02-28 Metaedge Corporation System for visualizing information in a data warehousing environment
EP1198761A4 (en) * 1999-01-15 2002-11-27 Metaedge Corp METHOD FOR VIEWING INFORMATION IN A DATA SENDING ENVIRONMENT
WO2000042553A2 (en) * 1999-01-15 2000-07-20 Harmony Software, Inc. Method and apparatus for processing business information from multiple enterprises
US6411961B1 (en) 1999-01-15 2002-06-25 Metaedge Corporation Apparatus for providing a reverse star schema data model
US7320001B1 (en) 1999-01-15 2008-01-15 Hon Hai Precision Industry, Ltd. Method for visualizing information in a data warehousing environment
US6377934B1 (en) 1999-01-15 2002-04-23 Metaedge Corporation Method for providing a reverse star schema data model
US6356214B1 (en) 1999-02-02 2002-03-12 Cisco Technology, Inc. Fast look-up table based scheme for NRZI encoding/decoding and zero insertion/removal in serial bit streams
US8321411B2 (en) 1999-03-23 2012-11-27 Microstrategy, Incorporated System and method for management of an automatic OLAP report broadcast system
US6567796B1 (en) 1999-03-23 2003-05-20 Microstrategy, Incorporated System and method for management of an automatic OLAP report broadcast system
US6282544B1 (en) * 1999-05-24 2001-08-28 Computer Associates Think, Inc. Method and apparatus for populating multiple data marts in a single aggregation process
US9208213B2 (en) 1999-05-28 2015-12-08 Microstrategy, Incorporated System and method for network user interface OLAP report formatting
US8607138B2 (en) 1999-05-28 2013-12-10 Microstrategy, Incorporated System and method for OLAP report generation with spreadsheet report within the network user interface
US6385604B1 (en) 1999-08-04 2002-05-07 Hyperroll, Israel Limited Relational database management system having integrated non-relational multi-dimensional data store of aggregated data elements
US6408292B1 (en) 1999-08-04 2002-06-18 Hyperroll, Israel, Ltd. Method of and system for managing multi-dimensional databases using modular-arithmetic based address data mapping processes on integer-encoded business dimensions
US7266181B1 (en) 1999-09-13 2007-09-04 Microstrategy, Incorporated System and method for the creation and automatic deployment of personalized dynamic and interactive voice services with integrated inbound and outbound voice services
US6829334B1 (en) 1999-09-13 2004-12-07 Microstrategy, Incorporated System and method for the creation and automatic deployment of personalized, dynamic and interactive voice services, with telephone-based service utilization and control
US7197461B1 (en) 1999-09-13 2007-03-27 Microstrategy, Incorporated System and method for voice-enabled input for use in the creation and automatic deployment of personalized, dynamic, and interactive voice services
US6850603B1 (en) 1999-09-13 2005-02-01 Microstrategy, Incorporated System and method for the creation and automatic deployment of personalized dynamic and interactive voice services
US7340040B1 (en) * 1999-09-13 2008-03-04 Microstrategy, Incorporated System and method for real-time, personalized, dynamic, interactive voice services for corporate-analysis related information
US6964012B1 (en) 1999-09-13 2005-11-08 Microstrategy, Incorporated System and method for the creation and automatic deployment of personalized, dynamic and interactive voice services, including deployment through personalized broadcasts
US6940953B1 (en) 1999-09-13 2005-09-06 Microstrategy, Inc. System and method for the creation and automatic deployment of personalized, dynamic and interactive voice services including module for generating and formatting voice services
US6885734B1 (en) 1999-09-13 2005-04-26 Microstrategy, Incorporated System and method for the creation and automatic deployment of personalized, dynamic and interactive inbound and outbound voice services, with real-time interactive voice database queries
US6836537B1 (en) 1999-09-13 2004-12-28 Microstrategy Incorporated System and method for real-time, personalized, dynamic, interactive voice services for information related to existing travel schedule
US8130918B1 (en) 1999-09-13 2012-03-06 Microstrategy, Incorporated System and method for the creation and automatic deployment of personalized, dynamic and interactive voice services, with closed loop transaction processing
US6606596B1 (en) 1999-09-13 2003-08-12 Microstrategy, Incorporated System and method for the creation and automatic deployment of personalized, dynamic and interactive voice services, including deployment through digital sound files
WO2001022323A1 (en) 1999-09-20 2001-03-29 Quintiles Transnational Corporation System and method for analyzing de-identified health care data
US6438538B1 (en) 1999-10-07 2002-08-20 International Business Machines Corporation Data replication in data warehousing scenarios
US6947934B1 (en) * 2000-02-16 2005-09-20 International Business Machines Corporation Aggregate predicates and search in a database management system
US20020029207A1 (en) 2000-02-28 2002-03-07 Hyperroll, Inc. Data aggregation server for managing a multi-dimensional database and database management system having data aggregation server integrated therein
WO2002001416A2 (en) * 2000-06-23 2002-01-03 The Johns Hopkins University Architecture for distributed database information access
US7117215B1 (en) 2001-06-07 2006-10-03 Informatica Corporation Method and apparatus for transporting data for data warehousing applications that incorporates analytic data interface
US6513043B1 (en) 2000-09-01 2003-01-28 Syntricity, Inc. System and method for storing, retrieving, and analyzing characterization data
US9934478B1 (en) * 2000-09-22 2018-04-03 Jda Software Group, Inc. Generating an ordering of workflow items given a partial ordering and extension data
US7111010B2 (en) 2000-09-25 2006-09-19 Hon Hai Precision Industry, Ltd. Method and system for managing event attributes
US7233940B2 (en) * 2000-11-06 2007-06-19 Answers Corporation System for processing at least partially structured data
US20040205045A1 (en) * 2001-04-04 2004-10-14 Li-Wen Chen Method and system for decision support analysis
US7162643B1 (en) 2001-06-15 2007-01-09 Informatica Corporation Method and system for providing transfer of analytic application data over a network
US20030009443A1 (en) * 2001-06-15 2003-01-09 Oleg Yatviskiy Generic data aggregation
US6789096B2 (en) * 2001-06-25 2004-09-07 Informatica Corporation Real time sessions in an analytic application
US7720842B2 (en) 2001-07-16 2010-05-18 Informatica Corporation Value-chained queries in analytic applications
US7174342B1 (en) 2001-08-09 2007-02-06 Ncr Corp. Systems and methods for defining executable sequences to process information from a data collection
US7080066B1 (en) 2001-08-09 2006-07-18 Ncr Corporation Systems and methods for refining a decision-making process via executable sequences
US6931408B2 (en) * 2001-08-17 2005-08-16 E.C. Outlook, Inc. Method of storing, maintaining and distributing computer intelligible electronic data
US20030065650A1 (en) * 2001-10-03 2003-04-03 Annand Ritchie I. Method and query application tool for searching hierarchical databases
JP2003150594A (ja) * 2001-11-12 2003-05-23 Hitachi Ltd データウェアハウスシステム
US6836777B2 (en) * 2001-11-15 2004-12-28 Ncr Corporation System and method for constructing generic analytical database applications
US6820077B2 (en) 2002-02-22 2004-11-16 Informatica Corporation Method and system for navigating a large amount of data
AU2003298616A1 (en) 2002-11-06 2004-06-03 International Business Machines Corporation Confidential data sharing and anonymous entity resolution
US8620937B2 (en) * 2002-12-27 2013-12-31 International Business Machines Corporation Real time data warehousing
EP1584035B1 (en) * 2002-12-31 2015-04-15 International Business Machines Corporation Authorized anonymous authentication
US7200602B2 (en) * 2003-02-07 2007-04-03 International Business Machines Corporation Data set comparison and net change processing
EP1631908A4 (en) * 2003-03-24 2012-01-25 Ibm SECURE COORDINATED IDENTIFICATION METHOD, SYSTEM AND PROGRAM
US7089266B2 (en) 2003-06-02 2006-08-08 The Board Of Trustees Of The Leland Stanford Jr. University Computer systems and methods for the query and visualization of multidimensional databases
US7756907B2 (en) * 2003-09-16 2010-07-13 The Board Of Trustees Of The Leland Stanford Jr. University Computer systems and methods for visualizing data
US7421458B1 (en) 2003-10-16 2008-09-02 Informatica Corporation Querying, versioning, and dynamic deployment of database objects
US7254590B2 (en) * 2003-12-03 2007-08-07 Informatica Corporation Set-oriented real-time data processing based on transaction boundaries
KR100546764B1 (ko) * 2003-12-05 2006-01-26 한국전자통신연구원 재구성 데이터 메모리 관리 방법 및 장치
US8819072B1 (en) * 2004-02-02 2014-08-26 Microsoft Corporation Promoting data from structured data files
US7308542B1 (en) * 2004-02-19 2007-12-11 Microsoft Corporation Data integrity protection for stored data
WO2005114508A1 (en) 2004-05-21 2005-12-01 Computer Associates Think, Inc. Maintaining a history of query results
US8572221B2 (en) 2004-05-26 2013-10-29 Facebook, Inc. System and method for managing an online social network
US8904273B2 (en) * 2004-07-02 2014-12-02 International Business Machines Corporation System and method of format specification
US7333995B2 (en) * 2004-07-02 2008-02-19 Cognos, Incorporated Very large dataset representation system and method
US20060005112A1 (en) * 2004-07-02 2006-01-05 David Lilly System and method of report layout
US7818282B2 (en) * 2004-07-02 2010-10-19 International Business Machines Corporation System and method for the support of multilingual applications
US7800613B2 (en) * 2004-12-02 2010-09-21 Tableau Software, Inc. Computer systems and methods for visualizing data with generation of marks
US8099674B2 (en) 2005-09-09 2012-01-17 Tableau Software Llc Computer systems and methods for automatically viewing multidimensional databases
US7999809B2 (en) 2006-04-19 2011-08-16 Tableau Software, Inc. Computer systems and methods for automatic generation of models for a dataset
US8700579B2 (en) * 2006-09-18 2014-04-15 Infobright Inc. Method and system for data compression in a relational database
US8266147B2 (en) * 2006-09-18 2012-09-11 Infobright, Inc. Methods and systems for database organization
JP2008112934A (ja) * 2006-10-31 2008-05-15 Oki Electric Ind Co Ltd 半導体記憶装置及びその製造方法
US8204831B2 (en) 2006-11-13 2012-06-19 International Business Machines Corporation Post-anonymous fuzzy comparisons without the use of pre-anonymization variants
US20080140696A1 (en) * 2006-12-07 2008-06-12 Pantheon Systems, Inc. System and method for analyzing data sources to generate metadata
US9355273B2 (en) 2006-12-18 2016-05-31 Bank Of America, N.A., As Collateral Agent System and method for the protection and de-identification of health care data
WO2008134627A2 (en) 2007-04-27 2008-11-06 Boomi, Inc. System and method for automated on-demand creation of a customized software application
US8521748B2 (en) 2010-06-14 2013-08-27 Infobright Inc. System and method for managing metadata in a relational database
US8417727B2 (en) 2010-06-14 2013-04-09 Infobright Inc. System and method for storing data in a relational database
US9519704B2 (en) * 2011-05-18 2016-12-13 Netspark Ltd Real time single-sweep detection of key words and content analysis
US9710282B2 (en) 2011-12-21 2017-07-18 Dell Products, Lp System to automate development of system integration application programs and method therefor
US8958097B2 (en) * 2012-01-17 2015-02-17 Kabushiki Kaisha Toshiba Information processing apparatus
US8943076B2 (en) 2012-02-06 2015-01-27 Dell Products, Lp System to automate mapping of variables between business process applications and method therefor
US8805716B2 (en) 2012-03-19 2014-08-12 Dell Products, Lp Dashboard system and method for identifying and monitoring process errors and throughput of integration software
US8782103B2 (en) 2012-04-13 2014-07-15 Dell Products, Lp Monitoring system for optimizing integrated business processes to work flow
US9606995B2 (en) 2012-04-30 2017-03-28 Dell Products, Lp Cloud based master data management system with remote data store and method therefor
US9158782B2 (en) * 2012-04-30 2015-10-13 Dell Products, Lp Cloud based master data management system with configuration advisor and method therefore
US9015106B2 (en) 2012-04-30 2015-04-21 Dell Products, Lp Cloud based master data management system and method therefor
US8589207B1 (en) 2012-05-15 2013-11-19 Dell Products, Lp System and method for determining and visually predicting at-risk integrated processes based on age and activity
US9069898B2 (en) 2012-05-31 2015-06-30 Dell Products, Lp System for providing regression testing of an integrated process development system and method therefor
US9092244B2 (en) 2012-06-07 2015-07-28 Dell Products, Lp System for developing custom data transformations for system integration application programs
US9183074B2 (en) 2013-06-21 2015-11-10 Dell Products, Lp Integration process management console with error resolution interface
US9613102B2 (en) 2014-04-01 2017-04-04 Tableau Software, Inc. Systems and methods for ranking data visualizations
US20150278214A1 (en) 2014-04-01 2015-10-01 Tableau Software, Inc. Systems and Methods for Ranking Data Visualizations Using Different Data Fields
US9424318B2 (en) 2014-04-01 2016-08-23 Tableau Software, Inc. Systems and methods for ranking data visualizations
US10498858B2 (en) 2016-12-14 2019-12-03 Dell Products, Lp System and method for automated on-demand creation of and execution of a customized data integration software application
US10896297B1 (en) 2017-12-13 2021-01-19 Tableau Software, Inc. Identifying intent in visual analytical conversations
US11055489B2 (en) 2018-10-08 2021-07-06 Tableau Software, Inc. Determining levels of detail for data visualizations using natural language constructs
US11030255B1 (en) 2019-04-01 2021-06-08 Tableau Software, LLC Methods and systems for inferring intent and utilizing context for natural language expressions to generate data visualizations in a data visualization interface
US11042558B1 (en) 2019-09-06 2021-06-22 Tableau Software, Inc. Determining ranges for vague modifiers in natural language commands

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5455945A (en) * 1993-05-19 1995-10-03 Vanderdrift; Richard System and method for dynamically displaying entering, and updating data from a database
US5713020A (en) * 1993-09-02 1998-01-27 Microsoft Corporation Method and system for generating database queries containing multiple levels of aggregation
US5519859A (en) * 1993-11-15 1996-05-21 Grace; John A. Method and apparatus for automatic table selection and generation of structured query language instructions
US5537589A (en) * 1994-06-30 1996-07-16 Microsoft Corporation Method and system for efficiently performing database table aggregation using an aggregation index
US5675785A (en) * 1994-10-04 1997-10-07 Hewlett-Packard Company Data warehouse which is accessed by a user using a schema of virtual tables
US5511190A (en) * 1995-01-20 1996-04-23 Tandem Computers, Inc. Hash-based database grouping system and method

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100850255B1 (ko) * 2001-12-28 2008-08-19 인터내셔널 비지네스 머신즈 코포레이션 실시간 데이터 웨어하우징
KR100877461B1 (ko) * 2001-12-28 2009-01-07 인터내셔널 비지네스 머신즈 코포레이션 실시간 데이터 웨어하우징

Also Published As

Publication number Publication date
US5794246A (en) 1998-08-11
EP0979469A1 (en) 2000-02-16
WO1998049636A1 (en) 1998-11-05

Similar Documents

Publication Publication Date Title
JP2001522495A (ja) 動的に増加しているデータベース・データ・セットの増加集計方法
US11119834B2 (en) Artificial creation of dominant sequences that are representative of logged events
US8065264B1 (en) Systems and methods for optimizing database queries
US5893090A (en) Method and apparatus for performing an aggregate query in a database system
US6643646B2 (en) Analysis of massive data accumulations using patient rule induction method and on-line analytical processing
EP2450809B1 (en) Method for extracting information from a database
US20040133581A1 (en) Database management system, data structure generating method for database management system, and storage medium therefor
US20030187835A1 (en) Search engine
US7962483B1 (en) Association rule module for data mining
US20040015486A1 (en) System and method for storing and retrieving data
US6654756B1 (en) Combination of mass storage sizer, comparator, OLTP user defined workload sizer, and design
US20020184222A1 (en) Chaining database records that represent a single customer or multiple customers living in a household
EP3217296A1 (en) Data query method and apparatus
Valkanas et al. Mining competitors from large unstructured datasets
CN110413888A (zh) 一种书籍推荐方法及装置
US6389416B1 (en) Depth first method for generating itemsets
CN110716950A (zh) 一种口径系统建立方法、装置、设备及计算机存储介质
US20210232573A1 (en) Issue rank management in an issue tracking system
US7962526B2 (en) Frequent itemset counting using clustered prefixes and index support
US8655911B2 (en) Expressing frequent itemset counting operations
Xylogiannopoulos et al. Clickstream analytics: an experimental analysis of the amazon users' simulated monthly traffic
Yang et al. Querying a collection of continuous functions
US6442562B1 (en) Apparatus and method for using incomplete cached balance sets to generate incomplete or complete cached balance sets and balance values
CN110837508A (zh) 一种口径系统建立方法、装置、设备及计算机存储介质
CA2485814A1 (en) Method and apparatus for range processing in an n-dimensional space