JP6400588B2 - データに対する規則の指定及び適用 - Google Patents

データに対する規則の指定及び適用 Download PDF

Info

Publication number
JP6400588B2
JP6400588B2 JP2015537766A JP2015537766A JP6400588B2 JP 6400588 B2 JP6400588 B2 JP 6400588B2 JP 2015537766 A JP2015537766 A JP 2015537766A JP 2015537766 A JP2015537766 A JP 2015537766A JP 6400588 B2 JP6400588 B2 JP 6400588B2
Authority
JP
Japan
Prior art keywords
validation
cells
field
rule
subsets
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015537766A
Other languages
English (en)
Other versions
JP2016504642A (ja
Inventor
ロイ レオナード プロコップス
ロイ レオナード プロコップス
ジョエル グールド
ジョエル グールド
Original Assignee
アビニシオ テクノロジー エルエルシー
アビニシオ テクノロジー エルエルシー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アビニシオ テクノロジー エルエルシー, アビニシオ テクノロジー エルエルシー filed Critical アビニシオ テクノロジー エルエルシー
Publication of JP2016504642A publication Critical patent/JP2016504642A/ja
Application granted granted Critical
Publication of JP6400588B2 publication Critical patent/JP6400588B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/177Editing, e.g. inserting or deleting of tables; using ruled lines
    • G06F40/18Editing, e.g. inserting or deleting of tables; using ruled lines of spreadsheets

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • User Interface Of Digital Computer (AREA)
  • Debugging And Monitoring (AREA)
  • Stored Programmes (AREA)

Description

関連出願の相互参照
本出願は、参照により本明細書に組み込まれている、2012年10月17日に出願した米国特許出願第13/653,995号の優先権を主張するものである。
本明細書は、データに対する規則の指定及び適用に関する。
ビジネスアプリケーションを含む多くの最近のアプリケーションは、さまざまなソースから集められる可能性があるデータの大きな組(すなわち、「データセット」)を処理する。データセットにデータを提供するさまざまなソースは、異なるレベルのデータ品質を有する可能性がある。アプリケーションが適切に機能することを保証するために、データセットの適切なレベルのデータ品質が維持されるべきである。適切なレベルのデータ品質を維持するために、データセットを、データ妥当性検証システムによって処理することができる。そのようなシステムは、データセットがアプリケーションに提供される前にそのデータセットに妥当性検証規則を適用する。一部の例において、データ妥当性検証システムは、妥当性検証規則の結果を用いてデータ品質の測定値を計算し、データ品質の測定値が予め決められた閾値未満になる場合、アプリケーションの管理者に警告する。その他の例において、データ妥当性検証システムは、妥当性検証規則のうちの1又は2以上に反するデータを取り扱うためのモジュールを含む。例えば、データ妥当性検証システムは、妥当性検証規則のうちの1又は2以上に反するデータを破棄又は修復することができる。
概して、データ妥当性検証システムによって適用される妥当性検証規則は、データ妥当性検証システムの管理者によって定義される。
一態様においては、概して、コンピューティングシステムは、データセットの複数の要素の各要素の1又は2以上のフィールドに含まれるデータの妥当性を検証するための1又は2以上の妥当性検証規則を指定する。コンピューティングシステムは、第1の軸及び第2の軸を有する2次元グリッドに配置された複数のセルを描画するように構成されたユーザインターフェースモジュールを含む。2次元グリッドは、2次元グリッドの第1の軸に沿った方向に延伸したセルの1又は2以上のサブセットであって、1又は2以上のサブセットのそれぞれのサブセットがデータセットの複数の要素のうちの1つの要素のそれぞれのフィールドに関連付けられる、1又は2以上のサブセット、及び2次元グリッドの第2の軸に沿った方向に延伸したセルの複数のサブセットであって、複数のサブセットのうちの1又は2以上がそれぞれの妥当性検証規則に関連付けられる、複数のサブセットを含む。コンピューティングシステムは、セルの少なくともいくつかのセルから受け取られたユーザ入力に基づいてデータセットの少なくとも1つの要素に妥当性検証規則を適用するように構成された処理モジュールも含む。一部の実施形態においては、フィールド及び妥当性検証規則に関連する少なくともいくつかのセルが、それぞれ、関連する妥当性検証規則が関連するフィールドに適用されるか否かを判定する入力を受け取るための入力要素を含む。一部の実施形態においては、フィールド及び妥当性検証規則に関連する少なくともいくつかのセルが、それぞれ、要素の関連するフィールドに含まれるデータに関連する妥当性検証規則を適用することに基づく妥当性検証結果に関連するフィードバックを示すためのインジケータを含む。
態様は、以下の特徴のうちの1又は2以上を含み得る。
第1の要素の第1のフィールドに含まれるデータに妥当性検証規則を適用することは、セルの入力要素において受け取られた任意の入力に基づいて、第1の要素の第1のフィールドに関連する第1の軸に沿った方向に延伸したセルのサブセットからのセルに関連する任意の選択された妥当性検証規則を決定することと、選択された妥当性検証規則に基づいて第1の要素の第1のフィールドに含まれるデータに関する妥当性検証結果を決定することとを含む。
第1の軸に沿った方向に延伸したセルの1又は2以上のサブセットは、セルの行である。
第2の軸に沿った方向に延伸したセルの複数のサブセットは、セルの列である。
入力要素は、1又は2以上の妥当性検証規則パラメータを指定する入力を受け取るように構成される。
妥当性検証規則のうちの1又は2以上は、評価されるときに、少なくとも2つの妥当性検証結果の組のうちの妥当性検証結果を生じ、妥当性検証結果は、妥当な結果及び妥当でない結果を含む。
セルの少なくともいくつかのセルに含まれるフィードバックを示すためのインジケータは、妥当性検証結果が妥当でない結果である場合にセルに網かけ(shade)を適用するように構成される。
入力要素は、妥当性検証規則パラメータのそれぞれの正しさを判定するようにさらに構成される。
フィールド及び妥当性検証規則に関連する少なくともいくつかのセルは、それぞれ、セルに関連する妥当性検証規則パラメータの正しさを判定した結果を表示するための第2のインジケータを含む。
フィードバックを示すためのインジケータは、妥当でない結果の数を表示するように構成される数値インジケータを含み、妥当でない結果の数は、データセットの要素のすべてに関する関連するフィールドに含まれるデータに関連する妥当性検証規則を適用することによって決定される。
データセットは、データベースの1又は2以上のテーブルを含み、データセットの要素は、データベースのレコードを含む。
妥当性検証規則のうちの1又は2以上は、ユーザによって定義される。
妥当性検証規則のうちの1又は2以上は、予め定義される。
2次元グリッドの第2の軸に沿った方向に延伸したセルの複数のサブセットのうちの1又は2以上は、第1の妥当性検証規則に関連する第1のセル及び第2の妥当性検証規則に関連する第2のセルを含み、第2の妥当性検証規則は、第1の妥当性検証規則とは異なる。
2次元グリッドの第2の軸に沿った方向に延伸したセルの複数のサブセットのうちの1又は2以上は、既存の値に適用された妥当性検証規則のうちの1つに関する妥当でない結果に応じて対応するフィールドの既存の値を置き換えるための値を受け取るための入力要素を含むセルのサブセットを含む。
2次元グリッドの第2の軸に沿った方向に延伸したセルの複数のサブセットのうちの1又は2以上は、除外される値が対応するフィールドに表示されることが妥当性検証規則が既存の値に適用されることを防止する結果となるように、除外される値を受け取るための入力要素を含むセルのサブセットを含む。
別の態様においては、概して、コンピューティングシステムが、データセットの複数の要素の各要素の1又は2以上のフィールドに含まれるデータの妥当性を検証するための1又は2以上の妥当性検証規則を指定する。コンピューティングシステムは、第1の軸及び第2の軸を有する2次元グリッドに配置された複数のセルを描画するための手段を含む。2次元グリッドは、2次元グリッドの第1の軸に沿った方向に延伸したセルの1又は2以上のサブセットであって、1又は2以上のサブセットのそれぞれのサブセットがデータセットの複数の要素のうちの1つの要素のそれぞれのフィールドに関連付けられる、1又は2以上のサブセット、及び2次元グリッドの第2の軸に沿った方向に延伸したセルの複数のサブセットであって、複数のサブセットのうちの1又は2以上がそれぞれの妥当性検証規則に関連付けられる、複数のサブセットを含む。コンピューティングシステムは、セルの少なくともいくつかのセルから受け取られたユーザ入力に基づいてデータセットの少なくとも1つの要素に妥当性検証規則を適用するための手段も含む。一部の実施形態においては、フィールド及び妥当性検証規則に関連する少なくともいくつかのセルが、それぞれ、関連する妥当性検証規則が関連するフィールドに適用されるか否かを判定する入力を受け取るための入力要素を含む。一部の実施形態においては、フィールド及び妥当性検証規則に関連する少なくともいくつかのセルが、それぞれ、要素の関連するフィールドに含まれるデータに関連する妥当性検証規則を適用することに基づく妥当性検証結果に関連するフィードバックを示すためのインジケータを含む。
別の態様においては、方法は、データセットの複数の要素の各要素の1又は2以上のフィールドに含まれるデータの妥当性を検証するための1又は2以上の妥当性検証規則を指定する。方法は、ユーザインターフェースモジュールによって、第1の軸及び第2の軸を有する2次元グリッドに配置された複数のセルを描画するステップを含む。2次元グリッドは、2次元グリッドの第1の軸に沿った方向に延伸したセルの1又は2以上のサブセットであって、1又は2以上のサブセットのそれぞれのサブセットがデータセットの複数の要素のうちの1つの要素のそれぞれのフィールドに関連付けられる、1又は2以上のサブセット、及び2次元グリッドの第2の軸に沿った方向に延伸したセルの複数のサブセットであって、複数のサブセットのうちの1又は2以上がそれぞれの妥当性検証規則に関連付けられる、複数のサブセットを含む。方法は、少なくとも1つのプロセッサによって、セルの少なくともいくつかのセルから受け取られたユーザ入力に基づいてデータセットの少なくとも1つの要素に妥当性検証規則を適用するステップも含む。一部の実施形態においては、フィールド及び妥当性検証規則に関連する少なくともいくつかのセルが、それぞれ、関連する妥当性検証規則が関連するフィールドに適用されるか否かを判定する入力を受け取るための入力要素を含む。一部の実施形態においては、フィールド及び妥当性検証規則に関連する少なくともいくつかのセルが、それぞれ、要素の関連するフィールドに含まれるデータに関連する妥当性検証規則を適用することに基づく妥当性検証結果に関連するフィードバックを示すためのインジケータを含む。
別の態様においては、概して、コンピュータ可読ストレージ媒体に記憶されたコンピュータプログラムが、データセットの複数の要素の各要素の1又は2以上のフィールドに含まれるデータの妥当性を検証するための1又は2以上の妥当性検証規則を指定する。コンピュータプログラムは、コンピュータシステムに、第1の軸及び第2の軸を有する2次元グリッドに配置された複数のセルを描画させるための命令を含む。2次元グリッドは、2次元グリッドの第1の軸に沿った方向に延伸したセルの1又は2以上のサブセットであって、1又は2以上のサブセットのそれぞれのサブセットがデータセットの複数の要素のうちの1つの要素のそれぞれのフィールドに関連付けられる、1又は2以上のサブセット、及び2次元グリッドの第2の軸に沿った方向に延伸したセルの複数のサブセットであって、複数のサブセットのうちの1又は2以上がそれぞれの妥当性検証規則に関連付けられる、複数のサブセットを含む。コンピュータプログラムは、コンピュータシステムに、セルの少なくともいくつかのセルから受け取られたユーザ入力に基づいてデータセットの少なくとも1つの要素に妥当性検証規則を適用させるための命令も含む。一部の実施形態においては、フィールド及び妥当性検証規則に関連する少なくともいくつかのセルが、それぞれ、関連する妥当性検証規則が関連するフィールドに適用されるか否かを判定する入力を受け取るための入力要素を含む。一部の実施形態においては、フィールド及び妥当性検証規則に関連する少なくともいくつかのセルが、それぞれ、要素の関連するフィールドに含まれるデータに関連する妥当性検証規則を適用することに基づく妥当性検証結果に関連するフィードバックを示すためのインジケータを含む。
態様は、以下の利点のうちの1又は2以上を有する場合がある。
利点の中でもとりわけ、ユーザインターフェースは、規則が入力されるとき、データセットの単一のデータ要素に規則を適用した結果のライブフィードバックを提供することができる。このようにして、ユーザは、データセット全体に規則を適用する(潜在的に時間のかかるプロセス)必要なしにそれらの規則の有効性をテストすることができる。
ユーザインターフェースは、ユーザがデータセットに対して指定された規則を実行し、データセット全体に対する指定された規則のそれぞれの実行に関するフィードバックを受け取ることを可能にする。そして、ユーザは、ユーザの期待にそぐわない指定された規則のいずれかを修正する機会を得る。
ユーザインターフェースは、ユーザが規則を迅速且つ直感的に指定及び修正することを可能にし、時間及びリソースを節約する。
本発明のその他の特徴及び利点は、以下の説明及び請求項から明らかになるであろう。
データの妥当性を検証するための妥当性検証規則を指定するためのシステムのブロック図である。 データの妥当性を検証するための妥当性検証規則を指定するためのユーザインターフェースの図である。 妥当性検証規則を指定するためのユーザインターフェースのスクリーンキャプチャの図である。
図1は、妥当性検証方法が使用され得る例示的なデータ処理システム100を示す。データ処理システム100は、ストレージデバイス、又はオンラインデータストリームへの接続などのデータの1又は2以上のソースを含み得るデータソース102を含み、それらの1又は2以上のソースのそれぞれは、さまざまな記憶フォーマット(例えば、データベーステーブル、スプレッドシートファイル、フラットテキストファイル、又はメインフレームによって使用されるネイティブフォーマット)のいずれかでデータ(「データセット」と呼ばれる場合がある)を記憶し得る。実行環境104は、ユーザインターフェース(UI,user interface)モジュール106及び処理モジュール108を含む。UIモジュール106は、データソース102からのデータを処理するために処理モジュール108によって使用される妥当性検証規則を指定するための、ユーザインターフェース112(例えば、ディスプレイスクリーン上のグラフィカルな表示)を介してユーザ110から受け取られる入力を管理する。
実行環境104は、UNIXオペレーティングシステムなどの好適なオペレーティングシステムの制御の下で1又は2以上の多目的コンピュータでホストされてもよい。例えば、実行環境104は、ローカルの(例えば、SMPコンピュータなどのマルチプロセッサシステム)、又はローカルに分散された(例えば、クラスタ若しくはMPPとして接続された複数のプロセッサ)、又はリモートの、又はリモートに分散された(例えば、ローカルエリアネットワーク(LAN,local area network)及び/若しくは広域ネットワーク(WAN,wide-area network)を介して接続された複数のプロセッサ)、或いはそれらの任意の組み合わせのいずれかの複数の中央演算処理装置(CPU,central processing unit)を用いるコンピュータシステムの構成を含むマルチノード並列コンピューティング環境を含み得る。
処理モジュール108は、データソース102からデータを読み取り、UIモジュール106によって取得された妥当性検証情報に基づいて妥当性検証手順を実行する。データソース102を提供するストレージデバイスは、実行環境104のローカルにあってもよく、例えば、実行環境104を実行するコンピュータに接続されたストレージ媒体(例えば、ハードドライブ114)に記憶され、又は実行環境104のリモートにあってもよく、例えば、リモート接続を介して実行環境104を実行するコンピュータと通信するリモートシステム(例えば、メインフレーム116)でホストされる。
概して、データソース102からアクセスされるデータセットは、いくつかのデータ要素(例えば、予め決められたレコード構造にしたがってフォーマットされたレコード、又はデータベーステーブルの行)を含む。いくつかのデータ要素のそれぞれの要素は、場合によってはヌル(ゼロ)又は空値を含むいくつかのフィールド(例えば、レコード構造内で定義された属性、又はデータベーステーブルの列)(例えば、「名前」、「名字」、「電子メールアドレス」など)に関する値を含む場合がある。(例えば、内容若しくはデータ型に関連する)フィールドの値のさまざまな特徴、又は特定のフィールドの値の有無が、妥当である又は妥当でないと見做される場合がある。例えば、文字列「Smith」を含む「名字」フィールドは、妥当であると考えられ得る一方、空白の「名字」フィールドは、妥当でないと考えられ得る。
データソース102からのデータセットを利用するアプリケーションの性能は、データセットが1又は2以上の妥当でないフィールドを有する、かなり多くのデータ要素を含む場合、悪影響を受ける可能性がある。処理モジュール108は、データセットにデータ妥当性検証規則を適用することを含むデータ妥当性検証手順を実行して、データセットが妥当性検証規則によって定義された品質の制約を満たすことを保証する。データ処理システム100は、データセットの品質が品質の制約を満たさない場合、システム管理者に警告する。一部の例において、処理モジュール108は、可能であれば妥当でないデータを修復し、又はさまざまなデータクレンジング手順を実行してクレンジングされたデータ要素のデータセットを生成するように構成され得る。さらに、その他の例において、処理モジュール108は、妥当でないデータを含むフィールドのリストを生成するように構成されてもよく、このフィールドのリストから、レポートを生成することができる。一部の例において、レポートは、フィールドのリストの中のフィールドのうちの1又は2以上に関して、妥当でないデータを含んでいたレコードの数を含む。その他の例においては、妥当でないフィールドの集約が、フィールドのリストから計算される。
概して、異なるアプリケーションは、異なる種類のデータを処理する。したがって、アプリケーションに応じて、データセットの要素は、異なるフィールドを含んでもよい。UIモジュール106は、データセットの妥当性を検証するために、1組の妥当性検証規則が指定され、使用されることを可能にするユーザインターフェース112を提供する。ユーザインターフェース112は、特定のデータ要素の構造の複数のフィールド(一部の実施形態においては、すべての利用可能なフィールド)を含む単一の表示を提供することができる。したがって、所与のアプリケーションに関して、ユーザ110(例えば、システム管理者)は、データのための適切な妥当性検証規則を指定することができる。
1 妥当性検証ユーザインターフェース
図2を参照すると、ユーザインターフェース112の一例が、データセットの妥当性を検証するための1又は2以上の妥当性検証規則をユーザ110が指定(設定)し、確認することを容易にするように構成される。
1.1 妥当性検証規則の指定
UIモジュール106は、第1の軸226及び第2の軸228を有する2次元グリッド(格子)225で配置された、いくつかのセル224を含むユーザインターフェース112を(例えば、コンピュータモニタ上に)描画する。セル224の1又は2以上のサブセット230(以後、発明を実施するための形態において行230という)は、2次元グリッド225の第1の軸226に沿った方向に延びる。行230のそれぞれは、フィールド218に関連付けられる。一部の例において、行230のそれぞれの最初のセル(すなわち、最も左のセル)は、行230に関連するフィールド218の名前を含む(この例において、フィールド名は「フィールド1」、「フィールド2」、...「フィールドM」である)。
セル224の複数のサブセット232(以後、発明を実施するための形態において列232という)は、2次元グリッド225の第2の軸228に沿った方向に延びる。列232のうちの1又は2以上は、それぞれの妥当性検証規則234に関連付けられる。一部の例において、列232のそれぞれの最初の(すなわち、最も上の)セルは、列232に関連する妥当性検証規則234の名前を含む(この例において、妥当性検証規則名は、「妥当性検証規則1」、「妥当性検証規則2」、...「妥当性検証規則N」である)。一部の例においては、第1の軸226及び第2の軸228の方向を入れ替え、フィールド218に関連する行230を列にし、妥当性検証規則234に関連する列232を行とすることができることに留意されたい。
一部の例において、ユーザインターフェース112は、予め定義された妥当性検証規則のリスト(図示せず)を含む(有する)。妥当性検証規則234は、例えば、ユーザ110が予め定義された妥当性検証規則のうちの1若しくは2以上を2次元グリッド225内にドラッグするか、又は予め定義された妥当性検証規則のうちの1つをダブルクリックし、その結果、1又は2以上の新しい列232が2次元グリッド225に追加されることによって2次元グリッド225に追加される。予め定義された妥当性検証規則は、対応するセル内で与えられ得る入力として予め定義された1組のパラメータを受け付け得る組み込み関数を有する。多くの状況に関して、妥当性検証規則の予め定義されたリストは、ユーザ110の必要を十分に満たす。しかし、一部の例においては、以下で説明されるように、ユーザ110は、2次元グリッド225に列232としてやはり追加され得るカスタムの妥当性検証規則を定義することができる。
1又は2以上の妥当性検証規則の列232が2次元グリッド225に追加された後、ユーザ110は、どの妥当性検証規則234がどのフィールド218に適用されるべきかを指定することができる。所与の妥当性検証規則234が所与のフィールド218に適用されるべきであることを指定するために、ユーザ110は、まず、所与のフィールド218に関連する行230が所与の妥当性検証規則234に関連する列232と交差するセル224を選択する。それから、ユーザ110は、選択されたセル224の入力要素(例えば、テキストフィールド又はチェックボックス)に1又は2以上の妥当性検証規則パラメータ236を入力する。概して、セルに規則パラメータ236を含めることは、潜在的に、2つの目的に資する。第1の目的は、妥当性検証規則234を構成する「設定入力(configuration input)」を与えることであり、第2の目的は、所与の妥当性検証規則234が所与のフィールド218に適用されるべきであることを示すことである。したがって、セル224が妥当性検証規則パラメータ236を含まない(つまり、セルが空白のままである)場合、処理モジュール108は、セル224に関連する妥当性検証規則234をセル224に関連するフィールド218に適用しないということになる。
多くの異なる種類の規則パラメータ236が、セル224に入力され得る。場合によっては、設定入力が規則を構成するために必要とされず、したがって、規則パラメータ236は、単に、対応する妥当性検証規則が適用されるべきであることを確定する「確定入力(confirmation input)」規則パラメータである場合がある。例えば、確定入力規則パラメータを受け取るための入力要素の一例は、チェックされたときに、セル224に関連する妥当性検証規則234がセル224に関連するフィールド218に適用されるべきであることを示すチェックボックスである。さまざまな種類の妥当性検証規則の例が、妥当性検証規則が設定入力によって構成されるのか否かを示す以下のリストに示される。
・整数−フィールドが整数のみを含むことを検証する(設定入力は必要とされない)。
・妥当でない値−フィールドが(設定入力として与えられる)ユーザ指定の妥当でない値を含まないことを検証する。
・最大精度−フィールドが小数点以下の(設定入力として与えられる)ユーザ指定の数以下の桁数を有することを検証する。
・最大−フィールドの値が(設定入力として与えられる)ユーザ指定の値よりも大きい場合、妥当でない。
・最大長−フィールドが(設定入力として与えられる)ユーザ指定の数以下の文字数又はバイト数を有することを検証する。
・最小−フィールドが(設定入力として与えられる)ユーザ指定の値未満である場合、妥当でない。
・空白でない−フィールドが空であるか又は空白のみを含む場合、妥当でない(設定入力は必要とされない)。
・ヌルでない−フィールドが(必要とされる設定入力として与えられる)ヌルである場合、妥当でない。
・パターン−文字列フィールドが(設定入力として与えられる)指定されたパターン通りであることを検証する。
・妥当な値−フィールドが(設定入力として与えられる)ユーザ指定の妥当な値のみを含むことを検証する。
・型に対して妥当−フィールドのデータがそのデータの型に対して妥当であることを検証する(設定入力は必要とされない)。
妥当性検証規則の上記のリストは必ずしも包括的でないことが、留意される。
1.2 妥当性検証規則の確認
一部の例において、UIモジュール106は、処理モジュール108がデータセットの要素の少なくとも一部にユーザ指定の妥当性検証規則234を適用した結果を表示することによってユーザインターフェース112を通じてユーザ110にフィードバックを提供する。
図2に示されたユーザインターフェース112は、データセットの所与の要素244に関するフィールド218の値242を表示するように構成される。ユーザが妥当性検証規則234及びそれらの関連するパラメータ236を指定する(及び/又は修正する)とき、処理モジュール108は、自動的に、指定された妥当性検証規則234を所与のデータ要素244のフィールド218の値242に適用し、妥当性検証規則234を適用した結果をUIモジュール106に与え、そして、UIモジュール106が、ユーザ110へのフィードバックとしてユーザインターフェース112に結果を表示する。概して、妥当性検証規則を適用した結果は、パス/フェイル(合/否)結果である。そのようなパス/フェイル結果は、例えば、適切なセルを特定の色、パターン、又は網かけで満たすことによってユーザ110に示され得る。図2において、フィールド1及び妥当性検証規則1に関連するセルは、フィールド1の値が妥当性検証規則1に反したことを示す灰色の網かけ238を含む。その他の例において、パス/フェイル結果は、適切なセルにインジケータアイコンを含むこと/含まないことによってユーザ100に示すことができる。例えば、フェイル(不合格)の結果を、セルに赤い感嘆符アイコンを含めることによって示すことができ、パス(合格)の結果を、赤い感嘆符アイコンがないことによって示すことができる。一部の例において、緑色の円などのアイコンを、パスの結果を示すためにセルに含めることができる。
妥当性検証規則234を指定するとき、ユーザ110がデータセットの異なる要素に対する妥当性検証規則の影響を評価するためにデータセット内をナビゲーションすることが有用である場合がある。したがって、ユーザインターフェース112は、ユーザが(この例において、シーケンス番号を入力することによって)データセットの異なる要素を選択することを可能にするコントロール246を含む。ユーザが1つの要素から次の要素へとナビゲーションするとき、処理モジュール108は、現在選択されている要素に妥当性検証規則234を自動的に適用する。
一部の例において、ユーザインターフェース112は、処理モジュール108がデータセットの要素のすべてに指定された妥当性検証規則234を適用することを可能にする実行コントロール248を含む。データセットへの妥当性検証規則234の適用が完了すると、処理モジュール108は、データセットに妥当性検証規則234を適用した結果をUIモジュール106に与え、そして、UIモジュール106が、ユーザ110に対してユーザインターフェース112で結果を表示する。一部の例において、適用された妥当性検証規則234に関連する各セル234は、フェイル結果カウントインジケータ240を含む。フェイル結果カウントインジケータ240は、セル224によって指定された妥当性検証規則234に反したデータ要素の数を表示する。
1.3 混合された列及びカスタムの妥当性検証規則
上で述べられたように、ユーザ110は、予め定義された妥当性検証規則のいずれにも含まれていない機能を有する妥当性検証規則を望む場合がある。一部の例において、ユーザインターフェース112は、1又は2以上の混合された妥当性検証規則の列を2次元グリッド225に挿入するためのオプションを含む。混合された妥当性検証規則の列は、列に含まれる(所与のフィールド218に関連する)各セルに関する異なる妥当性検証規則をユーザ110が指定することを可能にする。例えば、混合された妥当性検証規則の列の1つのセルが「妥当な値」テストを含み得る一方、混合された妥当性検証規則の列の別のセルは「最大」テストを含み得る。概して、ユーザ100は、(テストが規則パラメータを受け付ける場合は)テストのための規則パラメータが後に続くテストの名前を入力することによって混合された妥当性検証規則の列の所与のセルに関する妥当性検証規則を指定する。概して、列として2次元グリッド225に追加され得る任意の妥当性検証規則が、混合された妥当性検証規則の列の単一のセルに入力され得る。混合された妥当性検証規則の列のセルの内容のいくつかの例は、「ヌルでない」、「最大(99)」、及び「妥当な値(VM,F)」である。
混合された妥当性検証規則の列によってもたらされる1つの利点は、まれにしか使用されないテストをスクリーン上により効率的に示すことによってユーザインターフェース112の使い勝手が高められることである。特に、ユーザ110は、単一のフィールド218にのみ当てはまる妥当性検証規則に2次元グリッド225の列232全体を割り当てる必要はない。例えば、混合された妥当性検証規則の列は、「妥当な電子メール」テストが単一のフィールド218(例えば、「email_addr」フィールド)にのみ当てはまるが、2次元グリッド225の列232全体を占有し、それによって、貴重なスクリーンの領域(real estate)を無駄にする状況を避けることができる。
その他の例において、ユーザ110は、予め定義された妥当性検証規則のリストを新しい、再利用可能な、カスタムの妥当性検証規則234によって拡張することができる。ユーザインターフェース112は、ユーザ110が新しい妥当性検証規則234の機能を定義するためのテンプレートを提供する。ユーザ110は、例えば、プログラミング言語、又は例えば構造化されたコメントが施されたDMLコードなどの式言語(expression language)を用いて、テンプレートの範囲内で、所望のカスタムの機能を定義する。新しい妥当性検証規則234は、保存されると、予め定義された妥当性検証規則のリストに追加される。ユーザ110は、例えば、妥当性検証規則のリストから2次元グリッド225内に妥当性検証規則をドラッグするか、又は妥当性検証規則をダブルクリックすることによって、新しいカスタムの妥当性検証規則234を後で使用することができる。予め定義された妥当性検証規則と同様に、新しい妥当性検証規則を2次元グリッド225内にドラッグするか、又は新しい妥当性検証規則をダブルクリックすることは、新しい列232を2次元グリッド225に追加させ、新しい列232は、新しい妥当性検証規則に関連付けられる。
予め定義された妥当性検証規則か、又はカスタムの妥当性検証規則かに関わらず、妥当性検証規則は、規則がヌル値又は空白値に適用されるべきかどうかを示す属性を有する場合がある。規則がヌル値に適用されるべきでないとその規則が指定する場合、最初に、値がヌル値であるかに関してテストされ、それから、ヌルである場合は規則が適用されず、又はヌルでない場合は規則が適用される。規則が空白値に適用されるべきでないとその規則が指定する場合、最初に、値が空白であるかどうかを調べるためにその値がテストされ、それから、値が空白でないと分かった場合にだけ規則が適用される。
予め定義されているか又はカスタムであるかに関わらず、妥当性検証規則は、セル224に入力された1組の規則パラメータ236が妥当性検証規則に関して妥当であるかどうかを判定するために使用され得る論理を示す属性を有する場合がある。例えば、ユーザインターフェース112は、この論理を用いて、セル224に入力されたそれぞれの1組の規則パラメータ236が正しいか否か(correctness)を判定し、規則パラメータが(例えば、構文(syntax)エラーが原因で)正しくないと判定される場合、インジケータ(例えば、赤い停止サイン)がセル内に表示され、論理によって決定されたエラーメッセージが(例えば、エラーのリストで、又はホバリングしているときにはホバーツールチップとして)表示される。規則パラメータが正しいか否か(正しさ)を調べることの別の例は、指定されたルックアップファイルの識別子が処理モジュール108に実際に知らされていることを確認することなど、意味(semantics)を調べることである。
1.4 前処理列又は後処理列
一部の例において、ユーザインターフェース112は、フィールドの値に任意の初期処理を適用するか、又はその他の列の妥当性検証規則によって異なるように取り扱われる任意の特定の値を指定するために使用され得る前処理列を含んでもよい。また、ユーザインターフェース112は、妥当性検証規則によって実行されたテストの結果に応じて任意の対処を適用するために使用され得る後処理列も含んでもよい。前処理列は、例えば、妥当性検証から除外される値と、フィールド218のうちの1又は2以上に関する妥当性検証のデータ型とをユーザ110が指定することを可能にするために使用され得る。後処理列は、例えば、(例えば、異なる種類の妥当でない値を適切な置換値で置き換えるために)要素の既存の値を置き換える置換値をユーザ110が指定することを可能にするために使用され得る。
概して、置換値は、後処理列の単一のセルに入力され、所与のフィールド218に関連付けられる。置換値は、所与のフィールド218に関連する1又は2以上の妥当性検証規則236に違反するときに所与のフィールド218の値242を置き換える。例えば、「start_date」フィールドが2つの妥当性検証規則、最小(1900−01−01)及び最大(2011−12−31)に関連付けられる場合、置換値の一例は、1970−01−01である。したがって、所与のレコードに関する「start_date」フィールドの値が最小未満であるか(すなわち、1900−01−01よりも前)又は最大を超える(すなわち、2011−12−31よりも後)場合、値は、置換値1970−01−01で置き換えられる。文字列、日付/時間などのその他の種類の置換値も、後処理列で指定され得る。
上述のように、ユーザ110は、除外される値の種類の前処理列で、妥当性検証から除外される1又は2以上の値を指定することもできる。例えば、「end_date」などのフィールドに関する妥当なデータは、概して、日付情報(例えば、1900−01−01)のみを含む。しかし、一部のアプリケーションにおいては、「ACTIVE」などの別の値も「end_date」フィールドに関する妥当なデータであると指定することが望ましい場合もある。これは、除外される値の種類の前処理列に文字列「ACTIVE」を入力し、値「ACTIVE」が「start_date」フィールドに関して常に許容されることと、妥当性検証規則が指定された除外される値に適用される必要がないこととを示すことによってなされ得る。
前処理列は、フィールド218のうちの1又は2以上に関する妥当性検証のデータ型を指定する妥当性検証の型列も含むことができる。一部の例において、ユーザ110は、フィールドの妥当性を検証するために使用されるDMLの型宣言を入力することができる。例えば、フィールド218が日付を表す文字列値を含む場合、ユーザ110は、文字列値が実際は日付データ型を表し、したがって、そのように妥当性を検証されるべきであると指定するようにDATE(‘YYYY-MM-DD’)を入力することができる。同様に、10進数として文字列の妥当性を検証するために、ユーザ110は、decimal(‘’)を入力することができる。
1.5 例示的なユーザインターフェース
図3を参照すると、スクリーンキャプチャが、図2のユーザインターフェース112の一実施形態を示す。ユーザインターフェース112は、ユーザ110が妥当性検証規則のフィードバックを受け取りながらデータセットに関する妥当性検証規則234を指定することを可能にするように構成される。
上述のように、ユーザインターフェース112は、セル224の2次元グリッド225を含む。2次元グリッド225は、データセットのデータ要素のフィールド218に関連するいくつかの行230を含む。行230のそれぞれの最初のセルは、行230に関連するフィールド218の名前を含み、データセットの現在選択されているデータ要素244に関するフィールド218の値242を括弧内に含む。フィールドについてのその他の情報も、ユーザが妥当性検証規則を指定するのを支援するために視覚的に表示され得る。この例において、第1のセルは、フィールド218の値のデータ型を視覚的に示すアイコン220も含む。
図3において、ユーザ110は、2次元グリッド225にいくつかの妥当性検証規則234を追加した。妥当性検証規則234は、いくつかの列232としてグリッドに表示される。それぞれの妥当性検証規則234の名前が、妥当性検証規則234に関連する列232の一番上に含まれる(例えば、「最大長」、「空白でない」、「パターン」など)。
ユーザ110は、選択された妥当性検証規則234がデータセットの要素の1又は2以上のフィールド218に適用されるべきであると指定している。そのようにするために、適用されるそれぞれの妥当性検証規則234に関して、ユーザ110は、妥当性検証規則234に関連する列232と妥当性検証規則234が適用されるべき(1又は2以上の)フィールド218に関連する(1又は2以上の)行230との交差部分に規則パラメータ236を入力している。例えば、ユーザ110は、「パターン」妥当性検証規則と「zipcode」フィールドとの交差部分に規則パラメータS“99999”を入力している。入力された規則パラメータは、データセットの各要素の「zipcode」フィールドを評価して要素のそれぞれの「zipcode」フィールドの値が5つの連続する数字文字のパターンを有する文字列であるかどうかを判定するように「パターン」妥当性検証規則を構成する。同様に、「パターン」妥当性検証規則は、データセットの各要素の「phonenum」フィールドを評価して、各要素の「phonenum」フィールドの値242がS“999−999−9999”(すなわち、3つの数字文字、ダッシュ、3つの数字文字、ダッシュ、及び4つの数字文字)のパターンを有する文字列であるかどうかを判定するように構成される。
その他の種類の妥当性検証規則234及び規則パラメータも、図3に示されている。例えば、「妥当な値」妥当性検証規則が、「statename」フィールドに関する妥当な値を米国の州名の組として特定する規則パラメータM“StateNames”を有する「statename」フィールドに適用される。上記の規則パラメータの「StateNames」の前の「M」は、実行環境104内でアクセス可能なメタデータ参照システムに記憶される(コードセットと呼ばれることもある)別個のデータセットとして(例えば、ユーザ110又はシステム管理者によって)州名の組が定義されることを示す。この例において、州名を含むデータセットは、変数名「StateNames」によって参照される。
一部の例において、コードセットは、ルックアップテーブルに記憶される。ルックアップテーブルのコードセットにアクセスするために、規則パラメータは、例えば、名前「StateNames」によってシステムに対して特定されたルックアップファイルが妥当な「statename」の値のソースであることを示すL“StateNames”として入力される。さらにその他の例において、ユーザ110は、1組の妥当な値を直接入力することができる。例えば、妥当な1組の性別コードは、V“M,F,U”として入力され得る。
別の「空白でない」妥当性検証規則が、いくつかのフィールドに適用される。例えば、「空白でない」妥当性検証規則は、「空白でない」規則パラメータの列と「street」フィールドの行との交差部分のセルにチェックマーク規則パラメータが存在するので「street」フィールドに適用される。
上述のように、ユーザインターフェース112は、所与の要素244に関するフィールド218の値242のすべてをユーザ110に対して表示することができる。また、UIモジュール106は、要素244のフィールド218に関連する妥当性検証規則234の一部又はすべてを処理モジュール108に実行させる入力をユーザインターフェース112から受け取る。処理モジュール108によって生成された(1又は2以上の)結果が、UIモジュール106に与えられ、そして、UIモジュール106が、(1又は2以上の)結果に基づくフィードバックをユーザインターフェース112でユーザ110に対して表示する。図3においては、「statename」フィールドの値が1組の州名の構成要素であるかどうかをテストするために、「妥当な値」妥当性検証規則が「statename」フィールドに適用される。検査から、「statename」フィールドの値が州名「Pennsylvania」の綴りの誤り「Pennsylvannia」であることを知り得る。したがって、「妥当な値」妥当性検証規則は、所与の要素244に関する「statename」フィールドに関して守られていない。妥当性検証規則が守られていないことをユーザ110に対して示すために、「妥当な値」妥当性検証規則及び「statename」フィールドに関連するセルが、網かけを付けられる。
ユーザ110は、ナビゲーションコントロール246を用いてデータセットの要素内をナビゲーションすることができる。一部の例において、ナビゲーションコントロール246は、ユーザ110が1度に1つずつデータセットの要素内に入り込むことを可能にする矢印と、ユーザ110がそれらのユーザ110が見たいデータセットの要素の番号を入力することを可能にする数値フィールドとを含む。ユーザ110がナビゲーションコントロール246を用いて異なる要素にナビゲーションするたびに、処理モジュール108は、新しい要素の値に対して指定された妥当性検証規則を実行し、値242及び妥当性検証テストの結果を示すその他の視覚的なフィードバック(例えば、セルの網かけ)が、リフレッシュ/更新される。
ユーザインターフェース112は、作動されるときに、処理モジュール108にデータセットの要素のすべてに関して指定された妥当性検証規則を実行させる「テスト」ボタン248も含む。上述のように、データセットの要素のすべてに関して指定された妥当性検証規則を実行した結果は、1又は2以上の要素が指定された妥当性検証規則に反した各セルにフェイル要素カウントインジケータ240を含めることによってユーザインターフェース112においてまとめられる。図3の実施形態において、フェイル要素カウントインジケータ240は、セルによって指定された妥当性検証規則に反したデータセットの要素の数を表す数である。例えば、「statename」フィールド及び「妥当な値」妥当性検証規則に関連するセルに関するフェイル要素カウントインジケータは、データセットの要素のうちの3886個が1組の妥当な州名の構成要素ではない州名を含むことを示す。ユーザは、そのセルをクリックして、フェイルであった要素についての情報を取得することができる。
1又は2以上の妥当性検証規則のテスト結果に反した各要素に関して、妥当性検証の問題点について問題点の情報の集合を集約し、後で取得されるように記憶することができる。例えば、1又は2以上の妥当性検証規則が指定されたフィールドのリストを、そのフィールドに関して妥当性検証の問題点が存在しなかった場合のゼロ個の要素のカウントを含む、そのフィールドに関して妥当性検証の問題点を有していた要素の数のカウントとともに別のビューに表示することができる。これは、ユーザが、そのフィールドに関する妥当性検証規則が実際に実行されたことを確認しながらその特定の妥当性検証規則に反した要素がないと明白に判定することを可能にする。記憶された妥当性検証の問題点の情報は、さまざまな測定基準(例えば、特定の品質の問題点を有するレコードの割合)を計算するため、又は妥当性検証の問題点の情報によってデータ要素のデータセットを補足するためにも使用され得る。
2 代替
一部の例において、フェイル結果カウントインジケータ240は、ユーザ110によってクリックされるときにUIモジュール106にフェイル要素のすべてをまとめるウィンドウをユーザ110に対して表示させるハイパーリンクである。
一部の例において、データ妥当性検証規則を適用した結果は、データセットの測定基準を判定するために使用され得る。例えば、測定基準は、データ品質の問題点を有するデータセットのレコードの割合を含み得る。本明細書において説明されていないその他のユーザインターフェースを使用し、これらの測定基準を指定し、ユーザ110に対して示すことができる。
上記の説明はセルに網かけを付けることによってユーザにフィードバックを与えることを示すが、その他の種類のフィードバックメカニズム(例えば、音声、ポップアップウィンドウ、特別なシンボルなど)を利用することができる。
上記の説明は、完全なデータセットを処理しながら規則を指定することを示す。しかし、一部の例においては、削減されたより管理しやすいサイズを有し、完全なデータセットを代表するテストデータセットを使用することができる。
上述の方法は、コンピュータで実行するためのソフトウェアを用いて実装され得る。例えば、ソフトウェアは、それぞれが少なくとも1つのプロセッサ、(揮発性及び不揮発性メモリ及び/又はストレージ要素を含む)少なくとも1つのデータストレージシステム、少なくとも1つの入力デバイス又はポート、並びに少なくとも1つの出力デバイス又はポートを含む(分散、クライアント/サーバ、又はグリッドなどのさまざまなアーキテクチャであってよい)1又は2以上のプログラムされた又はプログラム可能なコンピュータシステムで実行される1又は2以上のコンピュータプログラムで手順を形成する。ソフトウェアは、例えば、データフローグラフの設計及び構成に関連するその他のサービスを提供するより大きなプログラムの1又は2以上のモジュールを形成する場合がある。グラフのノード及び要素は、コンピュータ可読媒体に記憶されたデータ構造、又はデータリポジトリに記憶されたデータモデルに準拠するその他の編成されたデータとして実装され得る。
ソフトウェアは、多目的又は専用のプログラム可能なコンピュータによって読み取り可能なCD−ROMなどのストレージ媒体で提供されるか、又はそのソフトウェアが実行されるコンピュータのストレージ媒体にネットワークの通信媒体を介して配信される(伝播信号に符号化される)場合がある。機能のすべてが、専用のコンピュータで、又はコプロセッサなどの専用のハードウェアを用いて実行される場合がある。ソフトウェアは、ソフトウェアによって指定された計算の異なる部分が異なるコンピュータによって実行される分散された方法で実装される場合がある。それぞれのそのようなコンピュータプログラムは、本明細書において説明された手順を実行するためにストレージ媒体又はデバイスがコンピュータシステムによって読まれるときにコンピュータを構成し、動作させるために、多目的又は専用のプログラム可能なコンピュータによって読み取り可能なストレージ媒体又はデバイス(例えば、ソリッドステートメモリ若しくは媒体、又は磁気若しくは光媒体)に記憶されるか又はダウンロードされることが好ましい。本発明のシステムは、コンピュータプログラムで構成されたコンピュータ可読ストレージ媒体として実装される場合もあり、そのように構成されたストレージ媒体は、本明細書において説明された機能を実行するために特定の予め定義された方法でコンピュータシステムを動作させる。
本発明のいくつかの実施形態が、説明された。しかしながら、本発明の主旨及び範囲から逸脱することなしにさまざまな修正がなされ得ることが理解されるであろう。例えば、上述のステップの一部は、順番に依存しない場合があり、したがって、説明された順番とは異なる順番で実行され得る。
上述の説明は、添付の請求項の範囲によって定義される本発明の範囲を例示するように意図されており、限定するように意図されていないことを理解されたい。例えば、上述のいくつかの機能のステップは、処理全体に実質的に影響を与えることなく異なる順番で実行され得る。その他の実施形態は、以下の請求項の範囲内にある。

Claims (19)

  1. データセットの複数の要素の各要素の1又は2以上のフィールドに含まれるデータの妥当性を検証するための1又は2以上の妥当性検証規則を指定するためのユーザーインターフェイスを表示可能なコンピューティングシステムであって、
    前記コンピューティングシステムが、
    (1)前記妥当性検証規則が適用される前記データセットの複数の要素のうちの1つの要素のそれぞれのフィールドにおけるデータ値と、(2)第1の軸及び第2の軸を有する2次元グリッドに配列された複数のセルとを備える前記ユーザーインターフェイスを描画するように構成されたユーザインターフェースモジュールであって、前記2次元グリッドが、
    前記2次元グリッドの前記第1の軸に沿った方向に延伸した前記セルの1又は2以上のサブセットであって、それぞれのサブセットが前記データセットの前記複数の要素のうちの1つの要素のそれぞれのフィールドに関連付けられる、1又は2以上のサブセット、及び
    前記2次元グリッドの前記第2の軸に沿った方向に延伸した前記セルの複数のサブセットであって、その1又は2以上がそれぞれの妥当性検証規則に関連付けられる、複数のサブセットを含む、前記ユーザインターフェースモジュールと、
    前記セルの少なくともいくつかのセルから受け取られたユーザ入力に基づいて前記データセットの少なくとも1つの要素に妥当性検証規則を適用するように構成された処理モジュールとを含み、
    フィールド及び妥当性検証規則に関連する少なくともいくつかのセルが、それぞれ、
    関連する妥当性検証規則が関連するフィールドに適用されるか否かを判定する入力を受け取るための入力要素、及び
    前記要素の前記関連するフィールドに含まれるデータに前記関連する妥当性検証規則を適用することに基づく妥当性検証結果に関連するフィードバックを示すためのインジケータを含む、前記コンピューティングシステム。
  2. 第1の要素の第1のフィールドに含まれるデータに妥当性検証規則を適用することが、
    セルの入力要素において受け取られた任意の入力に基づいて、前記第1の要素の前記第1のフィールドに関連する第1の軸に沿った方向に延伸したセルのサブセットからの前記セルに関連する任意の選択された妥当性検証規則を決定することと、
    前記選択された妥当性検証規則に基づいて前記第1の要素の前記第1のフィールドに含まれる前記データに関する妥当性検証結果を決定することとを含む、請求項1に記載のシステム。
  3. 第1の軸に沿った方向に延伸したセルの1又は2以上のサブセットが、セルの行である、請求項1に記載のシステム。
  4. 第2の軸に沿った方向に延伸したセルの複数のサブセットが、セルの列である、請求項1に記載のシステム。
  5. 入力要素が、1又は2以上の妥当性検証規則パラメータを指定する入力を受け取るように構成される、請求項1に記載のシステム。
  6. 妥当性検証規則のうちの1又は2以上が、評価されるときに、少なくとも2つの妥当性検証結果のセットの妥当性検証結果を生じ、前記妥当性検証結果が、妥当な結果及び妥当でない結果を含む、請求項1に記載のシステム。
  7. セルの少なくともいくつかのセルに含まれるフィードバックを示すためのインジケータが、妥当性検証結果が妥当でない結果である場合にセルに網かけを適用するように構成される、請求項6に記載のシステム。
  8. 入力要素が、妥当性検証規則パラメータのそれぞれの正しさを判定するようにさらに構成される、請求項5に記載のシステム。
  9. フィールド及び妥当性検証規則に関連する少なくともいくつかのセルが、それぞれ、前記セルに関連する妥当性検証規則パラメータの正しさを判定した結果を表示するための第2のインジケータを含む、請求項8に記載のシステム。
  10. フィードバックを示すためのインジケータが、妥当でない結果の数を表示するように構成される数値インジケータを含み、妥当でない結果の前記数が、データセットの要素のすべてに関する関連するフィールドに含まれるデータに関連する妥当性検証規則を適用することによって決定される、請求項1に記載のシステム。
  11. データセットが、データベースの1又は2以上のテーブルを含み、前記データセットの要素が、データベースのレコードを含む、請求項1に記載のシステム。
  12. 妥当性検証規則のうちの1又は2以上が、ユーザによって定義される、請求項1に記載のシステム。
  13. 妥当性検証規則のうちの1又は2以上が、予め定義される、請求項1に記載のシステム。
  14. 2次元グリッドの第2の軸に沿った方向に延伸したセルの複数のサブセットのうちの1又は2以上が、第1の妥当性検証規則に関連する第1のセル及び第2の妥当性検証規則に関連する第2のセルを含み、前記第2の妥当性検証規則が、前記第1の妥当性検証規則とは異なる、請求項1に記載のシステム。
  15. 2次元グリッドの第2の軸に沿った方向に延伸したセルの複数のサブセットのうちの1又は2以上が、既存の値に適用された妥当性検証規則のうちの1つに関する妥当でない結果に応じて対応するフィールドの前記既存の値を置き換えるための値を受け取るための入力要素を含むセルのサブセットを含む、請求項1に記載のシステム。
  16. 2次元グリッドの第2の軸に沿った方向に延伸したセルの複数のサブセットのうちの1又は2以上が、除外される値が対応するフィールドに表示されることが妥当性検証規則が既存の値に適用されることを防止する結果となるように、前記除外される値を受け取るための入力要素を含むセルのサブセットを含む、請求項1に記載のシステム。
  17. データセットの複数の要素の各要素の1又は2以上のフィールドに含まれるデータの妥当性を検証するための1又は2以上の妥当性検証規則を指定するためのユーザーインターフェイスを表示可能なコンピューティングシステムであって、
    前記コンピューティングシステムが、
    (1)前記妥当性検証規則が適用される前記データセットの複数の要素のうちの1つの要素のそれぞれのフィールドにおけるデータ値と、(2)第1の軸及び第2の軸を有する2次元グリッドに配列された複数のセルとを備える前記ユーザーインターフェイスを描画するための手段であって、前記2次元グリッドが、
    前記2次元グリッドの前記第1の軸に沿った方向に延伸した前記セルの1又は2以上のサブセットであって、それぞれのサブセットが前記データセットの前記複数の要素のうちの1つの要素のそれぞれのフィールドに関連付けられる、1又は2以上のサブセット、及び
    前記2次元グリッドの前記第2の軸に沿った方向に延伸した前記セルの複数のサブセットであって、その1又は2以上がそれぞれの妥当性検証規則に関連付けられる、複数のサブセットを含む、前記描画するための手段と、
    前記セルの少なくともいくつかのセルから受け取られたユーザ入力に基づいて前記データセットの少なくとも1つの要素に妥当性検証規則を適用するための手段とを含み、
    フィールド及び妥当性検証規則に関連する少なくともいくつかのセルが、それぞれ、
    関連する妥当性検証規則が関連するフィールドに適用されるか否かを判定する入力を受け取るための入力要素、及び
    前記要素の前記関連するフィールドに含まれるデータに前記関連する妥当性検証規則を適用することに基づく妥当性検証結果に関連するフィードバックを示すためのインジケータを含む、前記コンピューティングシステム。
  18. データセットの複数の要素の各要素の1又は2以上のフィールドに含まれるデータの妥当性を検証するための1又は2以上の妥当性検証規則を指定するための方法であって、
    ユーザインターフェースモジュールによって、(1)前記妥当性検証規則が適用される前記データセットの複数の要素のうちの1つの要素のそれぞれのフィールドにおけるデータ値と、(2)第1の軸及び第2の軸を有する2次元グリッドに配列された複数のセルとを備えるユーザーインターフェイスを描画するステップであって、前記2次元グリッドが、
    前記2次元グリッドの前記第1の軸に沿った方向に延伸した前記セルの1又は2以上のサブセットであって、それぞれのサブセットが前記データセットの前記複数の要素のうちの1つの要素のそれぞれのフィールドに関連付けられる、1又は2以上のサブセット、及び
    前記2次元グリッドの前記第2の軸に沿った方向に延伸した前記セルの複数のサブセットであって、その1又は2以上がそれぞれの妥当性検証規則に関連付けられる、複数のサブセットを含む、前記描画するステップと、
    少なくとも1つのプロセッサによって、前記セルの少なくともいくつかのセルから受け取られたユーザ入力に基づいて前記データセットの少なくとも1つの要素に妥当性検証規則を適用するステップとを含み、
    フィールド及び妥当性検証規則に関連する少なくともいくつかのセルが、それぞれ、
    関連する妥当性検証規則が関連するフィールドに適用されるか否かを判定する入力を受け取るための入力要素、及び
    前記要素の前記関連するフィールドに含まれるデータに前記関連する妥当性検証規則を適用することに基づく妥当性検証結果に関連するフィードバックを示すためのインジケータを含む、前記方法。
  19. データセットの複数の要素の各要素の1又は2以上のフィールドに含まれるデータの妥当性を検証するための1又は2以上の妥当性検証規則を指定するための、コンピュータ可読ストレージ媒体に記憶されたコンピュータプログラムであって、ユーザーインターフェイスを表示可能なコンピュータシステムに、
    (1)前記妥当性検証規則が適用される前記データセットの複数の要素のうちの1つの要素のそれぞれのフィールドにおけるデータ値と、(2)第1の軸及び第2の軸を有する2次元グリッドに配置された複数のセルとを備える前記ユーザーインターフェイスを描画することであって、前記2次元グリッドが、
    前記2次元グリッドの前記第1の軸に沿った方向に延伸した前記セルの1又は2以上のサブセットであって、それぞれのサブセットが前記データセットの前記複数の要素のうちの1つの要素のそれぞれのフィールドに関連付けられる、1又は2以上のサブセット、及び
    前記2次元グリッドの前記第2の軸に沿った方向に延伸した前記セルの複数のサブセットであって、その1又は2以上がそれぞれの妥当性検証規則に関連付けられる、複数のサブセットを含む、前記描画することと、
    前記セルの少なくともいくつかのセルから受け取られたユーザ入力に基づいて前記データセットの少なくとも1つの要素に妥当性検証規則を適用することとを実行させるための命令を含み、
    フィールド及び妥当性検証規則に関連する少なくともいくつかのセルが、それぞれ、
    関連する妥当性検証規則が関連するフィールドに適用されるか否かを判定する入力を受け取るための入力要素、及び
    前記要素の前記関連するフィールドに含まれるデータに前記関連する妥当性検証規則を適用することに基づく妥当性検証結果に関連するフィードバックを示すためのインジケータを含む、前記コンピュータプログラム。
JP2015537766A 2012-10-17 2013-10-15 データに対する規則の指定及び適用 Active JP6400588B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13/653,995 US10489360B2 (en) 2012-10-17 2012-10-17 Specifying and applying rules to data
US13/653,995 2012-10-17
PCT/US2013/064979 WO2014062638A1 (en) 2012-10-17 2013-10-15 Specifying and applying rules to data

Publications (2)

Publication Number Publication Date
JP2016504642A JP2016504642A (ja) 2016-02-12
JP6400588B2 true JP6400588B2 (ja) 2018-10-03

Family

ID=49517666

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015537766A Active JP6400588B2 (ja) 2012-10-17 2013-10-15 データに対する規則の指定及び適用

Country Status (9)

Country Link
US (3) US10489360B2 (ja)
EP (1) EP2909750B1 (ja)
JP (1) JP6400588B2 (ja)
KR (1) KR102126099B1 (ja)
CN (1) CN104737163A (ja)
AU (1) AU2013331476B2 (ja)
CA (1) CA2887141C (ja)
HK (1) HK1211115A1 (ja)
WO (1) WO2014062638A1 (ja)

Families Citing this family (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
AU2009322602B2 (en) 2008-12-02 2015-06-25 Ab Initio Technology Llc Mapping instances of a dataset within a data management system
WO2012061109A1 (en) 2010-10-25 2012-05-10 Ab Initio Technology Llc Managing data set objects in a dataflow graph that represents a computer program
CA2824282C (en) 2011-01-14 2019-05-21 Ab Initio Technology Llc Managing changes to collections of data
US20140101117A1 (en) * 2012-10-10 2014-04-10 Salesforce.Com, Inc. Methods and systems for managing records in an on-demand system
US10489360B2 (en) 2012-10-17 2019-11-26 Ab Initio Technology Llc Specifying and applying rules to data
KR20240132105A (ko) 2013-02-07 2024-09-02 애플 인크. 디지털 어시스턴트를 위한 음성 트리거
US10769122B2 (en) 2014-03-13 2020-09-08 Ab Initio Technology Llc Specifying and applying logical validation rules to data
GB201409214D0 (en) * 2014-05-23 2014-07-09 Ibm A method and system for processing a data set
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
JP6457622B2 (ja) 2014-07-18 2019-01-23 アビニシオ テクノロジー エルエルシー パラメータの集合の管理
US9626393B2 (en) * 2014-09-10 2017-04-18 Ab Initio Technology Llc Conditional validation rules
US10191924B2 (en) * 2014-10-20 2019-01-29 Ab Initio Technology Llc Specifying and applying rules to data
US10460227B2 (en) 2015-05-15 2019-10-29 Apple Inc. Virtual assistant in a communication session
US10409802B2 (en) 2015-06-12 2019-09-10 Ab Initio Technology Llc Data quality analysis
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
CN106802898B (zh) * 2015-11-26 2020-09-04 北大方正集团有限公司 数据录入方法及装置
KR102432104B1 (ko) 2016-11-09 2022-08-11 아브 이니티오 테크놀로지 엘엘시 데이터 요소 간의 관계를 결정하기 위한 시스템 및 방법
US11126599B2 (en) * 2017-01-24 2021-09-21 Accenture Global Solutions Limited Information validation method and system
DK180048B1 (en) 2017-05-11 2020-02-04 Apple Inc. MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK201770428A1 (en) 2017-05-12 2019-02-18 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
US20180336275A1 (en) 2017-05-16 2018-11-22 Apple Inc. Intelligent automated assistant for media exploration
CN107491430B (zh) * 2017-08-28 2021-01-08 南京农纷期电子商务有限公司 利用pdf工具包和SPEL表达式填充pdf的方法
KR102034679B1 (ko) * 2018-01-17 2019-10-23 (주)비아이매트릭스 그리드 인터페이스 기반 데이터 입출력 시스템
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
DK201870355A1 (en) 2018-06-01 2019-12-16 Apple Inc. VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS
CN108897728B (zh) * 2018-06-27 2023-04-07 平安科技(深圳)有限公司 短信拼接处理方法、装置、计算机设备和存储介质
CA3106682A1 (en) * 2018-07-19 2020-01-23 Ab Initio Technology Llc Publishing to a data warehouse
CN110889106B (zh) * 2018-09-11 2024-08-16 京东科技控股股份有限公司 配置方法、装置、系统、计算机可读存储介质
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US11243972B1 (en) * 2018-12-28 2022-02-08 Lumeris Solutions Company, LLC Data validation system
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11704494B2 (en) * 2019-05-31 2023-07-18 Ab Initio Technology Llc Discovering a semantic meaning of data fields from profile data of the data fields
US20200380389A1 (en) * 2019-05-31 2020-12-03 Apple Inc. Sentiment and intent analysis for customizing suggestions using user-specific information
US11227599B2 (en) 2019-06-01 2022-01-18 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
US11886399B2 (en) 2020-02-26 2024-01-30 Ab Initio Technology Llc Generating rules for data processing values of data fields from semantic labels of the data fields
KR102240496B1 (ko) * 2020-04-17 2021-04-15 주식회사 한국정보기술단 데이터 품질 관리 시스템 및 그 방법
US11061543B1 (en) 2020-05-11 2021-07-13 Apple Inc. Providing relevant data items based on context
US11490204B2 (en) 2020-07-20 2022-11-01 Apple Inc. Multi-device audio adjustment coordination
US11438683B2 (en) 2020-07-21 2022-09-06 Apple Inc. User identification using headphones
WO2022165321A1 (en) 2021-01-31 2022-08-04 Ab Initio Technology Llc Data processing system with manipulation of logical dataset groups
CN113190829B (zh) * 2021-05-18 2024-04-09 京东科技信息技术有限公司 一种权限数据的识别方法、装置、设备和介质
CN113468037A (zh) * 2021-07-26 2021-10-01 浙江大华技术股份有限公司 一种数据质量评估方法、装置、介质和电子设备
CN113642311B (zh) * 2021-08-12 2023-09-05 北京奇艺世纪科技有限公司 一种数据对比方法、装置、电子设备及存储介质

Family Cites Families (120)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5168441A (en) 1990-05-30 1992-12-01 Allen-Bradley Company, Inc. Methods for set up and programming of machine and process controllers
US5446885A (en) 1992-05-15 1995-08-29 International Business Machines Corporation Event driven management information system with rule-based applications structure stored in a relational database
JPH06162075A (ja) * 1992-11-20 1994-06-10 Sharp Corp 自動リライト装置
JPH0744368A (ja) 1993-07-29 1995-02-14 Hitachi Ltd 組合せモデルの編集システム
US5758351A (en) 1995-03-01 1998-05-26 Sterling Software, Inc. System and method for the creation and use of surrogate information system objects
US5966072A (en) 1996-07-02 1999-10-12 Ab Initio Software Corporation Executing computations expressed as graphs
JPH1131042A (ja) * 1997-07-11 1999-02-02 Hitachi Ltd コード表データ作成時の属性即時チェック方法及び装置
US6216140B1 (en) 1997-09-17 2001-04-10 Hewlett-Packard Company Methodology for the efficient management of hierarchically organized information
US6216131B1 (en) 1998-02-06 2001-04-10 Starfish Software, Inc. Methods for mapping data fields from one data set to another in a data processing environment
US6088702A (en) 1998-02-25 2000-07-11 Plantz; Scott H. Group publishing system
US6948154B1 (en) * 1999-03-22 2005-09-20 Oregon State University Methodology for testing spreadsheets
US7120638B1 (en) * 1999-09-21 2006-10-10 International Business Machines Corporation Method, system, program, and data structure for cleaning a database table
US6633875B2 (en) 1999-12-30 2003-10-14 Shaun Michael Brady Computer database system and method for collecting and reporting real estate property and loan performance information over a computer driven network
GB2358072B (en) * 2000-01-07 2004-01-28 Mitel Corp Tabular range editing mechanism
US7164422B1 (en) 2000-07-28 2007-01-16 Ab Initio Software Corporation Parameterized graphs with conditional components
US6704024B2 (en) 2000-08-07 2004-03-09 Zframe, Inc. Visual content browsing using rasterized representations
US6708186B1 (en) 2000-08-14 2004-03-16 Oracle International Corporation Aggregating and manipulating dictionary metadata in a database system
US7143076B2 (en) 2000-12-12 2006-11-28 Sap Aktiengesellschaft Method and apparatus for transforming data
US6629098B2 (en) 2001-01-16 2003-09-30 Hewlett-Packard Development Company, L.P. Method and system for validating data submitted to a database application
US7117430B2 (en) * 2001-02-27 2006-10-03 Microsoft Corporation Spreadsheet error checker
US7614036B2 (en) 2001-03-22 2009-11-03 Robert D Bjornson Method and system for dataflow creation and execution
JP2002279147A (ja) 2001-03-22 2002-09-27 Sharp Corp 内製化判断支援装置、内製化判断支援方法および内製化判断支援プログラムを記録した機械読取可能な記録媒体および内製化判断支援プログラム
US7853553B2 (en) 2001-03-26 2010-12-14 Siebel Systems, Inc. Engine for converting data from a source format to a destination format using user defined mappings
US6732095B1 (en) 2001-04-13 2004-05-04 Siebel Systems, Inc. Method and apparatus for mapping between XML and relational representations
US6494159B2 (en) 2001-05-11 2002-12-17 The United States Of America As Represented By The Secretary Of The Navy Submarine launched unmanned combat vehicle replenishment
US6832366B2 (en) 2001-05-17 2004-12-14 Simdesk Technologies, Inc. Application generator
US7099885B2 (en) 2001-05-25 2006-08-29 Unicorn Solutions Method and system for collaborative ontology modeling
US6868526B2 (en) 2001-07-18 2005-03-15 The Mathworks, Inc. Graphical subclassing
AUPR966001A0 (en) 2001-12-20 2002-01-24 Canon Information Systems Research Australia Pty Ltd A microprocessor card defining a custom user interface
US7080088B1 (en) 2002-01-30 2006-07-18 Oracle International Corporation Automatic reconciliation of bindable objects
US7185317B2 (en) 2002-02-14 2007-02-27 Hubbard & Wells Logical data modeling and integrated application framework
US6820077B2 (en) * 2002-02-22 2004-11-16 Informatica Corporation Method and system for navigating a large amount of data
US7110924B2 (en) 2002-05-15 2006-09-19 Caterpillar Inc. Method for controlling the performance of a target system
US7574652B2 (en) 2002-06-20 2009-08-11 Canon Kabushiki Kaisha Methods for interactively defining transforms and for generating queries by manipulating existing query data
US20050144189A1 (en) 2002-07-19 2005-06-30 Keay Edwards Electronic item management and archival system and method of operating the same
US7167850B2 (en) 2002-10-10 2007-01-23 Ab Initio Software Corporation Startup and control of graph-based computation
US7225301B2 (en) 2002-11-22 2007-05-29 Quicksilver Technologies External memory controller node
US20040225632A1 (en) 2003-05-08 2004-11-11 Microsoft Corporation Automated information management and related methods
US7257603B2 (en) 2003-05-08 2007-08-14 Microsoft Corporation Preview mode
US20050010896A1 (en) 2003-07-07 2005-01-13 International Business Machines Corporation Universal format transformation between relational database management systems and extensible markup language using XML relational transformation
US20050060317A1 (en) * 2003-09-12 2005-03-17 Lott Christopher Martin Method and system for the specification of interface definitions and business rules and automatic generation of message validation and transformation software
US7865507B2 (en) * 2003-09-15 2011-01-04 Oracle International Corporation Data quality analyzer
ATE515746T1 (de) 2003-09-15 2011-07-15 Ab Initio Technology Llc Datenprofilierung
US7328428B2 (en) 2003-09-23 2008-02-05 Trivergent Technologies, Inc. System and method for generating data validation rules
US7765529B1 (en) 2003-10-31 2010-07-27 The Mathworks, Inc. Transforming graphical objects in a graphical modeling environment
US7840949B2 (en) 2003-11-03 2010-11-23 Ramal Acquisition Corp. System and method for data transformation using dataflow graphs
US20050187984A1 (en) 2004-02-20 2005-08-25 Tianlong Chen Data driven database management system and method
US8165853B2 (en) 2004-04-16 2012-04-24 Knowledgebase Marketing, Inc. Dimension reduction in predictive model development
JP4275013B2 (ja) 2004-06-21 2009-06-10 三洋電機株式会社 データフローグラフ処理装置、処理装置、リコンフィギュラブル回路。
US7536406B2 (en) 2004-06-23 2009-05-19 Microsoft Corporation Impact analysis in an object model
US20060007464A1 (en) 2004-06-30 2006-01-12 Percey Michael F Structured data update and transformation system
US7353227B2 (en) 2004-07-23 2008-04-01 Sap Aktiengesellschaft Conflict resolution engine
JP2006113810A (ja) 2004-10-14 2006-04-27 Fujitsu Ltd 書誌情報入力支援プログラム
US7899833B2 (en) 2004-11-02 2011-03-01 Ab Initio Technology Llc Managing related data objects
WO2006096681A1 (en) 2005-03-07 2006-09-14 Computer Associates Think, Inc. System and method for data manipulation
JP4550641B2 (ja) 2005-03-30 2010-09-22 大陽日酸エンジニアリング株式会社 データ照合装置及び方法
US8255363B2 (en) 2005-06-08 2012-08-28 rPath Methods, systems, and computer program products for provisioning software using dynamic tags to identify and process files
US8630917B2 (en) 2005-06-09 2014-01-14 At&T Intellectual Property Ii, L.P. Arrangement for guiding user design of comprehensive product solution using on-the-fly data validation
US7877350B2 (en) 2005-06-27 2011-01-25 Ab Initio Technology Llc Managing metadata for graph-based computations
US7716630B2 (en) 2005-06-27 2010-05-11 Ab Initio Technology Llc Managing parameters for graph-based computations
US7464105B2 (en) 2005-07-06 2008-12-09 International Business Machines Corporation Method for performing semi-automatic dataset maintenance
US7870162B2 (en) 2005-07-29 2011-01-11 Sap Ag Method for generating properly formed expressions
US20070050750A1 (en) 2005-08-31 2007-03-01 Microsoft Corporation Extensible data-driven setup application for operating system
US20070080088A1 (en) 2005-10-06 2007-04-12 Trotter Jason K Preassembly of cooperating parts
WO2007048229A1 (en) 2005-10-25 2007-05-03 Angoss Software Corporation Strategy trees for data mining
US8060821B2 (en) 2005-12-09 2011-11-15 Apple Inc. Enhanced visual feedback of interactions with user interface
US20070179956A1 (en) 2006-01-18 2007-08-02 Whitmyer Wesley W Jr Record protection system for networked databases
US7761586B2 (en) 2006-02-06 2010-07-20 Microsoft Corporation Accessing and manipulating data in a data flow graph
US7661067B2 (en) 2006-02-21 2010-02-09 International Business Machines Corporation Method for providing quick responses in instant messaging conversations
US7647298B2 (en) 2006-03-23 2010-01-12 Microsoft Corporation Generation of query and update views for object relational mapping
US7577724B1 (en) 2006-03-28 2009-08-18 Emc Corporation Methods and apparatus associated with advisory generation
US20070294119A1 (en) 2006-03-30 2007-12-20 Adaptive Alpha, Llc System, method and computer program product for evaluating and rating an asset management business and associate investment funds using experiential business process and performance data, and applications thereof
US8868577B2 (en) 2006-03-31 2014-10-21 Sap Se Generic database manipulator
US7797319B2 (en) 2006-05-15 2010-09-14 Algebraix Data Corporation Systems and methods for data model mapping
US7870556B2 (en) 2006-05-16 2011-01-11 Ab Initio Technology Llc Managing computing resources in graph-based computations
US7970746B2 (en) 2006-06-13 2011-06-28 Microsoft Corporation Declarative management framework
US7689565B1 (en) 2006-06-28 2010-03-30 Emc Corporation Methods and apparatus for synchronizing network management data
AU2007286155B2 (en) 2006-08-10 2013-12-12 Ab Initio Technology Llc. Distributing services in graph-based computations
US8423564B1 (en) 2006-10-31 2013-04-16 Ncr Corporation Methods and apparatus for managing and updating stored information
US20080126988A1 (en) 2006-11-24 2008-05-29 Jayprakash Mudaliar Application management tool
US8538918B1 (en) 2006-12-05 2013-09-17 Corelogic Solutions, Llc Systems and methods for tracking parcel data acquisition
US20080162384A1 (en) 2006-12-28 2008-07-03 Privacy Networks, Inc. Statistical Heuristic Classification
GB0700450D0 (en) 2007-01-10 2007-02-21 Radiation Watch Ltd The RWL threat engine
US9430552B2 (en) 2007-03-16 2016-08-30 Microsoft Technology Licensing, Llc View maintenance rules for an update pipeline of an object-relational mapping (ORM) platform
US20080243765A1 (en) 2007-03-29 2008-10-02 Ariel Fuxman Method for generating nested mapping specifications in a schema mapping formalism
US7603368B2 (en) 2007-03-30 2009-10-13 Fmr Llc Mapping data on a network
US8069129B2 (en) 2007-04-10 2011-11-29 Ab Initio Technology Llc Editing and compiling business rules
US8032404B2 (en) 2007-06-13 2011-10-04 International Business Machines Corporation Method and system for estimating financial benefits of packaged application service projects
US8694518B2 (en) 2007-06-14 2014-04-08 Colorquick, L.L.C. Method and apparatus for database mapping
US8103704B2 (en) 2007-07-31 2012-01-24 ePrentise, LLC Method for database consolidation and database separation
US7912264B2 (en) 2007-08-03 2011-03-22 Siemens Medical Solutions Usa, Inc. Multi-volume rendering of single mode data in medical diagnostic imaging
US7860863B2 (en) 2007-09-05 2010-12-28 International Business Machines Corporation Optimization model for processing hierarchical data in stream systems
US8566296B2 (en) 2007-09-14 2013-10-22 Oracle International Corporation Support for compensation aware data types in relational database systems
US8954482B2 (en) 2007-09-20 2015-02-10 Ab Initio Technology Llc Managing data flows in graph-based computations
US20090234623A1 (en) 2008-03-12 2009-09-17 Schlumberger Technology Corporation Validating field data
JP4224126B1 (ja) 2008-06-09 2009-02-12 パナソニック株式会社 データベース管理サーバ装置、データベース管理システム、データベース管理方法およびデータベース管理プログラム
US20090319494A1 (en) 2008-06-20 2009-12-24 Microsoft Corporation Field mapping for data stream output
JP5331203B2 (ja) 2008-06-30 2013-10-30 アビニシオ テクノロジー エルエルシー グラフベース計算におけるデータ記録
US8082228B2 (en) 2008-10-31 2011-12-20 Netapp, Inc. Remote office duplication
CA3042068C (en) 2008-11-12 2022-09-20 Ab Initio Technology Llc Managing and automatically linking data objects
AU2009322602B2 (en) 2008-12-02 2015-06-25 Ab Initio Technology Llc Mapping instances of a dataset within a data management system
KR101738647B1 (ko) 2008-12-02 2017-06-08 아브 이니티오 테크놀로지 엘엘시 데이터 유지 시스템
WO2010088523A1 (en) 2009-01-30 2010-08-05 Ab Initio Technology Llc Processing data using vector fields
EP2221733A1 (en) 2009-02-17 2010-08-25 AMADEUS sas Method allowing validation in a production database of new entered data prior to their release
CN101576823A (zh) * 2009-06-11 2009-11-11 阿里巴巴集团控股有限公司 一种表单控件的验证方法及装置
US8935702B2 (en) 2009-09-04 2015-01-13 International Business Machines Corporation Resource optimization for parallel data integration
KR101631978B1 (ko) 2009-09-16 2016-06-20 아브 이니티오 테크놀로지 엘엘시 데이터세트 요소의 매핑
JP2011090598A (ja) 2009-10-26 2011-05-06 Hitachi Solutions Ltd 文書検証装置および文書検証方法
KR20120115233A (ko) 2009-11-13 2012-10-17 아브 이니티오 테크놀로지 엘엘시 레코드 포맷 정보의 관리
US9805015B2 (en) 2009-12-16 2017-10-31 Teradata Us, Inc. System and method for enhanced user interactions with a grid
US8555265B2 (en) 2010-05-04 2013-10-08 Google Inc. Parallel processing of data
US8583664B2 (en) 2010-05-26 2013-11-12 Microsoft Corporation Exposing metadata relationships through filter interplay
US8732143B2 (en) 2010-08-27 2014-05-20 Microsoft Corporation Reducing locking during database transactions
WO2012061109A1 (en) 2010-10-25 2012-05-10 Ab Initio Technology Llc Managing data set objects in a dataflow graph that represents a computer program
US8949166B2 (en) 2010-12-16 2015-02-03 International Business Machines Corporation Creating and processing a data rule for data quality
CA2824282C (en) 2011-01-14 2019-05-21 Ab Initio Technology Llc Managing changes to collections of data
US20120310904A1 (en) 2011-06-01 2012-12-06 International Business Machine Corporation Data validation and service
US20130166515A1 (en) * 2011-12-22 2013-06-27 David Kung Generating validation rules for a data report based on profiling the data report in a data processing tool
US8516008B1 (en) * 2012-05-18 2013-08-20 Splunk Inc. Flexible schema column store
US10489360B2 (en) 2012-10-17 2019-11-26 Ab Initio Technology Llc Specifying and applying rules to data

Also Published As

Publication number Publication date
AU2013331476A1 (en) 2015-04-30
EP2909750B1 (en) 2019-12-04
AU2013331476B2 (en) 2018-06-14
EP2909750A1 (en) 2015-08-26
KR102126099B1 (ko) 2020-06-23
JP2016504642A (ja) 2016-02-12
CN104737163A (zh) 2015-06-24
KR20150074020A (ko) 2015-07-01
CA2887141C (en) 2021-05-04
CA2887141A1 (en) 2014-04-24
US10489360B2 (en) 2019-11-26
US20200301897A1 (en) 2020-09-24
US20140108357A1 (en) 2014-04-17
US20170004151A1 (en) 2017-01-05
HK1211115A1 (en) 2016-05-13
WO2014062638A1 (en) 2014-04-24

Similar Documents

Publication Publication Date Title
JP6400588B2 (ja) データに対する規則の指定及び適用
JP6916403B2 (ja) データへの論理的妥当性検査規則の指定および適用
US11755630B2 (en) Regular expression generation using longest common subsequence algorithm on combinations of regular expression codes
US10540436B2 (en) Evaluating rules applied to data
JP6720144B2 (ja) 条件付き検証規則
JP2020504862A (ja) 実行可能データフローグラフの差分
US9075544B2 (en) Integration and user story generation and requirements management
CN107251021B (zh) 过滤数据沿袭图
AU2016219432A1 (en) Filtering data lineage diagrams
CN117032785A (zh) 数据处理方法、电子设备、存储介质及程序产品
JPWO2012144257A1 (ja) ポリシー記述支援システム及びポリシー記述支援方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20161011

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170927

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20171023

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20171218

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180320

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180809

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180905

R150 Certificate of patent or registration of utility model

Ref document number: 6400588

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250