JPH1055367A - データ利用システム - Google Patents

データ利用システム

Info

Publication number
JPH1055367A
JPH1055367A JP8210828A JP21082896A JPH1055367A JP H1055367 A JPH1055367 A JP H1055367A JP 8210828 A JP8210828 A JP 8210828A JP 21082896 A JP21082896 A JP 21082896A JP H1055367 A JPH1055367 A JP H1055367A
Authority
JP
Japan
Prior art keywords
statistical table
item
list
data
statistical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8210828A
Other languages
English (en)
Inventor
Hitoshi Ashida
仁史 芦田
Hideyuki Maki
牧  秀行
Erika Ayukawa
江里香 鮎川
Akira Maeda
章 前田
Yukiyasu Ito
幸康 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP8210828A priority Critical patent/JPH1055367A/ja
Priority to US08/904,753 priority patent/US5933796A/en
Publication of JPH1055367A publication Critical patent/JPH1055367A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/283Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99937Sorting

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Finance (AREA)
  • Data Mining & Analysis (AREA)
  • Accounting & Taxation (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Educational Administration (AREA)
  • General Engineering & Computer Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】与えられたデータの統計表の中から、特徴的な
分布を示す統計表を自動的に抽出する。さらに、抽出し
た統計表によりデータの分布を確認した上で、必要なデ
ータを、統計表上から検索する。 【解決手段】1つ以上の数値項目値を含む2つ以上の項
目値からなるレコードの集合であるデータの中から、デ
ータの一部のレコードを抽出するシステムであって、デ
ータの中から、1つ以上の項目値を限定した部分データ
の統計表を作成し、該統計表の期待値の分布表との差異
により、各統計表の特徴量を算出し、特徴量に基づき、
統計表のリストを生成する統計表リスト生成装置102
と、指定された任意の統計表から、その全部または、指
定された1つ以上のセルに含まれるレコードのリストを
該データから作成するレコードリスト生成装置105か
ら構成される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、データの統計表の
特徴量を算出し、統計表を参考に、ユーザが指定したセ
ルに含まれるデータを抽出するデータ利用システムに関
する。
【0002】
【従来の技術】データの統計表を作成できる技術とし
て、以下の3つが考えられる。
【0003】(1)統計ソフトウエアの利用 現在、データのあらゆる項目に関する統計表を作成でき
る技術がある(従来技術1)。
【0004】(2)リレーショナルデータベースの利用 リレーショナルデータベースを利用すれば、大量のデー
タに対し統計表を作成できる。また、データの検索も容
易に実行できる(従来技術2)。
【0005】(3)多次元データベースの利用 近年、解析専門のデータベースとして多次元データベー
ス(多次元DB)注目されている。あらゆる項目に関し
て、あらかじめ集計した結果を集めている。このため、
集計結果を瞬時に出力できる。ただし、生成の元となっ
たデータとは、独立している(従来技術3)。
【0006】
【発明が解決しようとする課題】上述の通り、統計表を
生成する技術は存在する。しかし、いずれの技術を用い
ても、各統計表を評価することはできない。本発明で
は、特徴的な分布を示す統計表を自動的に抽出すること
を第1の目的とする。
【0007】従来技術1、2を利用すれば、レコードの
検索は可能である。しかし、いずれの技術を用いても、
データの統計表などから直接レコードを検索することは
不可能である。本発明では、抽出した統計表に含まれる
レコード、または、統計表の一部のセルに含まれるレコ
ードを統計表から直接抽出することを第2の目的とす
る。
【0008】
【課題を解決するための手段】上記の第1の目的を達成
するため、本発明のデータ利用システムでは、統計表リ
スト生成装置により、生データから複数の統計表を生成
し、さらに統計表を評価し、特徴的な分布を示す統計表
を自動的に抽出する。
【0009】上記第2の目的を達成するため、本発明の
データ利用システムでは、レコードリスト生成装置によ
り、統計表リストの中から、選択した統計表の指定され
たセルに含まれるレコードを生データから自動的に抽出
する。
【0010】
【発明の実施の形態】以下、図面を用いて本発明の実施
の形態について説明する。
【0011】図1は、本発明の対象であるデータ利用シ
ステムの構成図である。この装置を用いて対象とする生
データから統計表リストを作成し、特徴レコードリスト
を作成する。
【0012】図1において、102は、1つ以上の数値
項目値を含む2つ以上の項目値からなるレコードの集合
であるデータ101と、統計表リスト生成時のパラメー
タを指定するリスト生成方法指定パラメータ103を入
力とし、統計表のリスト104を出力する統計表リスト
生成装置、105は、統計表リスト104、レコードリ
ストの生成時の、統計表上のセル等のレコードリスト生
成方法指定パラメータ106を入力とし、パラメータに
より指定されたセルに含まれる特徴レコードリスト10
7を出力するレコードリスト生成装置である。
【0013】次に図1の各装置について詳しく説明す
る。まず、統計表リスト生成装置102について説明す
る。統計表リスト生成装置102の入力である生データ
の例を図3に示す。図3はスプレッドシート形式のデー
タであるが、フォーマットはこれに限らない。リレーシ
ョナルデータベースでもよい。出力である統計表リスト
は、例えば図4に示すような項目と項目値の組合せのリ
ストとする。各項目値が、新たに加えられる条件を示
し、図4に示すような、統計表に対応する。
【0014】図2に示す通り、統計表リスト生成装置1
02は、多次元DB生成装置201と、統計表リスト抽出
装置203から構成される。
【0015】多次元DB生成装置201は、生データ10
1と統計表リスト生成方法パラメータ103を入力と
し、多次元DB202を出力する。
【0016】統計表リスト生成方法指定パラメータ10
3では、多次元DBに利用する項目、統計表に表示する統
計値、統計表の表示用項目、および統計表リストの表示
個数を指定する。
【0017】多次元DB202は、一般的な多次元DBであ
る。図4に例を示す。図4では、図式化するため、OS、
年度、製品種別の3項目に関する立方体で表現している
が、理論上は項目数に制限はない。図に示す通り、多次
元DBは複数の統計表の集まりである。多次元DBでは、各
統計表のことをスライスと呼ぶ。
【0018】統計表リスト抽出装置203は、多次元DB
202の中から、統計表リスト生成方法指定パラメータ
103に従い、種々の統計表を作成し、各統計表を、そ
の期待値の分布表との差異により、特徴量を算出し、そ
の特徴量の昇順にリストをソートし、統計表リスト生成
方法指定パラメータ103のリスト総数の個数だけ、統
計表のリスト104を出力する。統計表リスト抽出装置
で実行する統計表リスト抽出処理のパド図を図6に示
す。
【0019】図6に示す通り、統計表リスト抽出処理
は、統計表リスト生成方法指定パラメータ103に基づ
き、図7に示すような、特徴量算出の基準となる基準統
計表を作成する、基準統計表生成処理601、レコード
を限定する新たな任意の1項目を選択し、処理603以
降を繰り返す項目選択処理602、処理選択処理602
にて選択された項目の中の任意の1項目値を選択し、処
理604以降を繰り返すカテゴリ値選択処理603、処
理603にて選択された項目値を新たな条件として加
え、統計表を作成する統計表生成処理604、同じく、
処理603にて選択された項目値を新たな条件として加
えた時の期待値の統計表を作成する期待値統計表生成処
理605、処理604に作成した統計表と、処理605
にて作成した期待値統計表の差異を評価する特徴量算出
処理606、処理606にて算出した特徴量に基づき、
統計表をソートする統計表ソート処理607からなる。
【0020】図7に統計表リスト生成方法指定パラメー
タの例を示す。図8に同パラメータに基づき、基準統計
表生成処理601にて生成した基準統計表の例を示す。
図8において、表の左上の記載された、C=Cq,..は、
条件、Ai(i=1、..、m)は、項目Aの項目値、Bj(j=
1、..、n)は、項目Bの項目値、Sij(i=1、...、
m、 j=1、...、n)は統計値を表す。
【0021】図6における項目選択処理602で、項目
Pを選択し、カテゴリ値選択処理603で、項目値Pk
を選択した場合、図9に示す、P=Pkの条件を満たす
レコードのみについての統計表が得られる。
【0022】次に、期待値統計表生成処理605につい
て説明する。図8に示す基準統計表に含まれるレコード
の統計値の総和は、(数1)に示す通りである。
【0023】
【数1】
【0024】この中で、P=Pkの条件を満たすレコー
ドの統計値の総和を Sum(Pk)とし、R(Pk)を(数2)
に示す形で定義すると、期待値の統計表は、図10のよ
うになる。
【0025】
【数2】
【0026】特徴量算出処理606では、(数3)に示
す通り、実際の統計表と期待値の統計表の対応するセル
の値の差分の二乗値を期待値の二乗値で規格化したもの
の総和を取っている。
【0027】
【数3】
【0028】統計表ソート処理607では、特徴量算出
処理606で算出された特徴量に基づき統計表をソート
する。統計表リストは先に図4に示したように、項目名
と項目値の組で表わされる。
【0029】レコードリスト生成装置105は、図11
に示す通り、着目セル選択装置1101と、レコード抽
出装置1103から構成される。着目セル選択装置11
01は、統計表リスト104、レコードリスト生成方法
指定パラメータ106を入力とし、セル情報702を出
力する。
【0030】レコード抽出装置1103は、選択セル情
報1102、生データ101を入力し、特徴レコードリ
スト107を出力する。
【0031】レコードリスト生成方法指定パラメータ1
06は、選択する統計表およびセルの情報、検索対象と
する生データの格納タイプ、レコードリストの項目およ
びレコード数が含まれる。例えば、図12に示すような
形式で格納される。図12は、図4に示す「製品種別=
CD-ROM」のスライス(統計表)の中から、年度=95
年、OS=Aのセルを選択した例である。
【0032】着目セル選択装置1101は、統計値リス
ト104の中から、レコードリスト生成方法指定パラメ
ータ106にて指定される統計表を選択し、その統計表
の中からさらに、同パラメータにて指定されるセルを選
択する。さらにそれを、レコードリスト生成方法指定パ
ラメータ106にて指定されるデータタイプに基づく検
索文に変換し、選択セル情報1102として出力する。
例えば、データタイプがリレーショナルデータベース(R
DB)の場合には、選択セル情報1102は、図13に示
すようなSQL文になる。
【0033】レコード抽出装置1103は、選択セル情
報1102を元に、生データを検索し、特徴レコードリ
スト107を出力する。特徴レコードリスト107は例
えば、図14に示すような形式で出力される。以上説明
したデータ利用システムの適用例を説明する。
【0034】図15に、リレーショナルデータベースに
格納された生データ101のスキーマを示す。統計表リ
スト生成方法指定パラメータ103は、図16に示す。
この時、多次元DBは計算機のディスプレイ上に図17に
示すように表示される。図17において、ユーザがマイ
ニングメニューを選択(例えば、マウス等の入力手段で
クリック)することにより、統計表リスト生成装置10
2が起動し、図18に示すような統計表のリストを同じ
くディスプレイ上に表示する。図18は、データに階層
構造があった場合の例である。図18に示す統計表リス
トにおいて、例えば、2行目を選択した場合、図19に
示すような統計表がディスプレイ上に表示される。この
統計表の2行目、2列目の、A、1994年のセルを選択
し、さらにメニューの検索を選択した場合、レコードリ
スト生成装置105が起動し、図20に示す特徴レコー
ドリストがディスプレイ上に表示される。
【0035】また、ユーザの指定によっては、統計表を
表示した時点で、統計表リスト生成装置102を自動的
に起動することも可能である。この場合、図22に示す
ように、統計表リスト作成が終了した時点で、リストア
イコンが点滅、変色、サイズ変更などして、ユーザに注
目を促し、ユーザが選択すれば、図18に示すような統
計表リストがディスプレイ上に表示される。アイコンの
色の点滅速度の変化、色の変化、サイズの変化により、
統計表リスト生成処理の進捗状況を表すこともできる。
【0036】統計表リスト生成装置は繰り返し何度でも
起動できる。例えば、図19に示す統計表上で、再び、
マイニングメニューを選択すれば、統計表リスト生成方
法指定パラメータ103が、図21に示すように、書き
換えられ、統計表リスト生成装置102が再び起動され
る。図16と図21の2つの統計表リスト生成方法指定
パラメータの相違点は、図16において、条件の項が
「なし」であるのに対し、図21では、「CITY=San Die
go」となっている。
【0037】
【発明の効果】本発明では、与えられたデータに対し、
1つ以上の項目値を限定した部分データの統計表を自動
的に作成し、それらの統計表の特徴を評価できるので、
特徴的な分布を持つ統計表を自動的に抽出できる。さら
に、それらの統計表により、データの特徴を確認した上
で、統計表の1つ以上のセルを指定し、そのセルに含ま
れるデータを抽出できる。
【図面の簡単な説明】
【図1】本発明のデータ利用システムの構成図である。
【図2】本発明の統計表リスト生成装置の構成図であ
る。
【図3】本発明の分析および検索の対象である生データ
の例である。
【図4】本発明で生成する統計表リストおよび統計表の
例である。
【図5】本発明で生成、利用する多次元DBのイメージ
図である。
【図6】本発明の統計値リスト抽出処理のパド図であ
る。
【図7】本発明の統計表リスト生成装置の起動時に利用
する統計表リスト方法指定パラメータである。
【図8】本発明の統計値リスト抽出処理で生成する基準
統計表である。
【図9】本発明の統計値リスト抽出処理で生成する実際
の統計表である。
【図10】本発明の統計値リスト抽出処理で生成する期
待値の分布表である。
【図11】本発明のレコードリスト生成装置の構成図で
ある。
【図12】本発明のレコードリスト生成方法指定パラメ
ータの例である。
【図13】本発明の選択セル情報の例である。
【図14】本発明のレコードリストの例である。
【図15】本発明の生データがリレーショナルデータベ
ースである場合の例である。
【図16】本発明の統計表リスト生成方法指定パラメー
タの例である。
【図17】本発明の多次元DBのイメージ図である。
【図18】本発明の統計表リストの例である。
【図19】本発明の統計表の例である。
【図20】本発明の特徴レコードリストの例である。
【図21】本発明の統計表リスト生成方法指定パラメー
タの例である。
【図22】本発明の統計表リスト生成進捗状況を表すア
イコンを表示している統計表の例である。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 前田 章 神奈川県川崎市麻生区王禅寺1099番地 株 式会社日立製作所システム開発研究所内 (72)発明者 伊藤 幸康 神奈川県横浜市戸塚区戸塚町5030番地 株 式会社日立製作所ソフトウェア開発本部内

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】1つ以上の数値項目値を含む2つ以上の項
    目値からなるレコードの集合であるデータの中から、該
    データの一部のレコードを抽出するシステムであって、 該データの中から、1つ以上の項目値を限定した部分デ
    ータの統計表を作成し、該統計表の期待値の分布表との
    差異により、各統計表の特徴量を算出し、該特徴量に基
    づき、統計表のリストを生成する統計表リスト生成手段
    と、 指定された任意の統計表から、その全部または、指定さ
    れた1つ以上のセルに含まれるレコードのリストを該デ
    ータから作成するレコードリスト生成手段を有すること
    を特徴とするデータ利用システム。
  2. 【請求項2】請求項1に記載のデータ利用システムにお
    いて、 該統計表リスト生成手段は、上記データを多次元データ
    ベースに格納しておき、上記多次元データベースに基づ
    いて上記特徴量を算出することを特徴とするデータ利用
    システム。
  3. 【請求項3】請求項1または2に記載のデータ利用シス
    テムにおいて、 上記レコードリスト生成手段は、上記統計表リストか
    ら、ユーザが指定する選択する統計表、セルの情報、検
    索対象とする生データの格納タイプ、レコードリストの
    項目名およびレコード数を指定するレコードリスト生成
    方法指定パラメータに基づき、ユーザが指定した統計表
    およびセルの情報を格納した選択セル情報を出力する着
    目セル選択手段を有し、該選択セル情報を用い、生デー
    タからレコードリストを生成するレコード抽出処理を有
    することを特徴とするデータ利用システム。
  4. 【請求項4】請求項2に記載のデータ利用システムにお
    いて、 上記統計表リスト抽出手段は、上記特徴量算出の基準と
    なる基準統計表を生成する基準統計表生成処理と、レコ
    ードを限定するための新たな任意の1項目を選択する項
    目選択処理、該項目選択処理により選択された項目の任
    意の項目値を1つ選択する項目値選択処理、該項目値選
    択処理により選択された項目値を新たな条件として加え
    た時の統計表を作成する統計表生成処理、同じく、該項
    目値選択処理により選択された項目値を新たな条件とし
    て加えた時の期待値の統計表を作成する期待値統計表生
    成処理、該統計表と該期待値の統計表の差異を評価する
    特徴量算出処理、該特徴量算出処理にて算出した特徴量
    に基づき、統計表をソートする統計表ソート処理を有す
    ることを特徴としたデータ利用システム。
  5. 【請求項5】請求項4に記載のデータ利用システムにお
    いて、上記特徴量算出処理は、上記統計表と上記期待値
    の統計表の各セルの差分値を該期待値の統計表の同じセ
    ルの値で除したものを2乗して総和したもを特徴量とす
    ることを特徴としたデータ利用システム。
  6. 【請求項6】請求項2に記載のデータ利用システムにお
    いて、上記統計表リスト抽出手段は、統計表に加える新
    たな制約を、項目名と項目値の組合せ、あるいは、項目
    名、項目の階層名、項目値の組合せを1レコードとした
    リストを出力することを特徴としたデータ利用システ
    ム。
  7. 【請求項7】請求項3に記載のデータ利用システムにお
    いて、 上記着目セル選択処理は、上記レコードリスト生成方法
    指定パラメータにて指定される統計表、セルの情報を、
    上記生データの格納タイプにて指定されるタイプのデー
    タを検索できる形に変換することを特徴としたデータ利
    用システム。
  8. 【請求項8】請求項1に記載のデータ利用システムにお
    いて、 上記統計表の指定は、コンピュータのディスプレイ上に
    表示される統計表リストの中の1つをクリックまたはダ
    ブルクリックすることにより選択し、選択された統計表
    をディスプレイ上に表示する手段を有することを特徴と
    したデータ利用システム。
JP8210828A 1996-08-09 1996-08-09 データ利用システム Pending JPH1055367A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP8210828A JPH1055367A (ja) 1996-08-09 1996-08-09 データ利用システム
US08/904,753 US5933796A (en) 1996-08-09 1997-08-01 Data extracting system based on characteristic quantities of data distribution

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8210828A JPH1055367A (ja) 1996-08-09 1996-08-09 データ利用システム

Publications (1)

Publication Number Publication Date
JPH1055367A true JPH1055367A (ja) 1998-02-24

Family

ID=16595795

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8210828A Pending JPH1055367A (ja) 1996-08-09 1996-08-09 データ利用システム

Country Status (2)

Country Link
US (1) US5933796A (ja)
JP (1) JPH1055367A (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11306186A (ja) * 1998-04-16 1999-11-05 Hitachi Ltd 組合せ分析情報作成装置及び組合せ分析情報作成プログラムを記録した記録媒体
JP2001075966A (ja) * 1999-07-07 2001-03-23 Internatl Business Mach Corp <Ibm> データ分析システム
US6738761B1 (en) 1999-09-17 2004-05-18 Nec Corporation Information processing system capable of indicating tendency to change
JP2010267288A (ja) * 2003-09-15 2010-11-25 Ab Initio Technology Llc データプロファイリング
US9323748B2 (en) 2012-10-22 2016-04-26 Ab Initio Technology Llc Profiling data with location information
US9449057B2 (en) 2011-01-28 2016-09-20 Ab Initio Technology Llc Generating data pattern information
US9892026B2 (en) 2013-02-01 2018-02-13 Ab Initio Technology Llc Data records selection
US9971798B2 (en) 2014-03-07 2018-05-15 Ab Initio Technology Llc Managing data profiling operations related to data type
US11068540B2 (en) 2018-01-25 2021-07-20 Ab Initio Technology Llc Techniques for integrating validation results in data profiling and related systems and methods
US11487732B2 (en) 2014-01-16 2022-11-01 Ab Initio Technology Llc Database key identification

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1115897A (ja) * 1997-06-20 1999-01-22 Fujitsu Ltd 対話型データ分析支援装置及び対話型データ分析支援プログラムを記録した媒体
US6097887A (en) * 1997-10-27 2000-08-01 Kla-Tencor Corporation Software system and method for graphically building customized recipe flowcharts
US7269786B1 (en) 2000-05-04 2007-09-11 International Business Machines Corporation Navigating an index to access a subject multi-dimensional database
US6915289B1 (en) 2000-05-04 2005-07-05 International Business Machines Corporation Using an index to access a subject multi-dimensional database
US7117215B1 (en) 2001-06-07 2006-10-03 Informatica Corporation Method and apparatus for transporting data for data warehousing applications that incorporates analytic data interface
US7509571B2 (en) * 2001-01-03 2009-03-24 Sun Microsystems, Inc. Method and apparatus for a file format for storing spreadsheet compactly
US7162643B1 (en) 2001-06-15 2007-01-09 Informatica Corporation Method and system for providing transfer of analytic application data over a network
US7720842B2 (en) 2001-07-16 2010-05-18 Informatica Corporation Value-chained queries in analytic applications
US8140568B2 (en) * 2001-12-13 2012-03-20 International Business Machines Corporation Estimation and use of access plan statistics
US6820077B2 (en) * 2002-02-22 2004-11-16 Informatica Corporation Method and system for navigating a large amount of data
WO2003107140A2 (en) * 2002-06-18 2003-12-24 Seven Blue Seas Vacations, Inc. Visual presentation of information in multiple dimensions
US7472127B2 (en) * 2002-12-18 2008-12-30 International Business Machines Corporation Methods to identify related data in a multidimensional database
US7421458B1 (en) 2003-10-16 2008-09-02 Informatica Corporation Querying, versioning, and dynamic deployment of database objects
US7254590B2 (en) * 2003-12-03 2007-08-07 Informatica Corporation Set-oriented real-time data processing based on transaction boundaries
US9880991B2 (en) * 2012-10-17 2018-01-30 International Business Machines Corporation Transposing table portions based on user selections

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2806259B2 (ja) * 1994-03-29 1998-09-30 日本電気株式会社 リレーショナルデータベースより検索した表の表示方式
US5710915A (en) * 1995-12-21 1998-01-20 Electronic Data Systems Corporation Method for accelerating access to a database clustered partitioning

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11306186A (ja) * 1998-04-16 1999-11-05 Hitachi Ltd 組合せ分析情報作成装置及び組合せ分析情報作成プログラムを記録した記録媒体
JP2001075966A (ja) * 1999-07-07 2001-03-23 Internatl Business Mach Corp <Ibm> データ分析システム
US6738761B1 (en) 1999-09-17 2004-05-18 Nec Corporation Information processing system capable of indicating tendency to change
US9323802B2 (en) 2003-09-15 2016-04-26 Ab Initio Technology, Llc Data profiling
JP2010267288A (ja) * 2003-09-15 2010-11-25 Ab Initio Technology Llc データプロファイリング
US8868580B2 (en) 2003-09-15 2014-10-21 Ab Initio Technology Llc Data profiling
US9449057B2 (en) 2011-01-28 2016-09-20 Ab Initio Technology Llc Generating data pattern information
US9652513B2 (en) 2011-01-28 2017-05-16 Ab Initio Technology, Llc Generating data pattern information
US9323749B2 (en) 2012-10-22 2016-04-26 Ab Initio Technology Llc Profiling data with location information
US9323748B2 (en) 2012-10-22 2016-04-26 Ab Initio Technology Llc Profiling data with location information
US9569434B2 (en) 2012-10-22 2017-02-14 Ab Initio Technology Llc Profiling data with source tracking
US9990362B2 (en) 2012-10-22 2018-06-05 Ab Initio Technology Llc Profiling data with location information
US10719511B2 (en) 2012-10-22 2020-07-21 Ab Initio Technology Llc Profiling data with source tracking
US9892026B2 (en) 2013-02-01 2018-02-13 Ab Initio Technology Llc Data records selection
US10241900B2 (en) 2013-02-01 2019-03-26 Ab Initio Technology Llc Data records selection
US11163670B2 (en) 2013-02-01 2021-11-02 Ab Initio Technology Llc Data records selection
US11487732B2 (en) 2014-01-16 2022-11-01 Ab Initio Technology Llc Database key identification
US9971798B2 (en) 2014-03-07 2018-05-15 Ab Initio Technology Llc Managing data profiling operations related to data type
US11068540B2 (en) 2018-01-25 2021-07-20 Ab Initio Technology Llc Techniques for integrating validation results in data profiling and related systems and methods

Also Published As

Publication number Publication date
US5933796A (en) 1999-08-03

Similar Documents

Publication Publication Date Title
JPH1055367A (ja) データ利用システム
US7464096B2 (en) Method and apparatus for information mining and filtering
US10565232B2 (en) Constructing queries for execution over multi-dimensional data structures
RU2402060C2 (ru) Доступ к данным и организация данных, осуществляемые посредством диаграмм
CN110292775B (zh) 获取差异数据的方法及装置
US6032146A (en) Dimension reduction for data mining application
CN1044415C (zh) 对储存在计算机系统中的数据库进行检索的一种方法和系统
US6134555A (en) Dimension reduction using association rules for data mining application
JP3177746B2 (ja) デ−タ処理システム及び方法
CN1551015B (zh) 简化试探分析的空间模型的系统、方法和装置
JP2013502653A5 (ja)
NZ507121A (en) Data visualization parameters specified in query for data from database
CN103390044B (zh) 一种连锁类兴趣点数据识别方法及装置
CN103942198B (zh) 用于挖掘意图的方法和设备
CN106682012A (zh) 商品对象信息搜索方法及装置
JP2003503798A (ja) 統合されたタイトルバー及びナビゲータを使用してレポートを作成しかつタイトルを付けるためのシステム及び方法
JP5535062B2 (ja) ウェブログの時系列分析のためのデータ格納および照会方法及びその方法を実行するシステム
CN110489441B (zh) 一种基于大数据的即席查询方法及设备
CA2360589A1 (en) Programs and methods for the display, analysis and manipulation of multi-dimension data implemented on a computer
JP2003016101A (ja) 電子カタログ検索システム及び方法
CN111949658A (zh) 一种面向数据立方体的可操作图形透视表构建方法
JPH11316766A (ja) 多次元分析構築システム及び分析処理用データベース
CN110362591B (zh) 一种报表展现方法和装置
US7313559B2 (en) System and method for analytically modeling data organized according to a referenced attribute
JPH08272806A (ja) データベース検索システム