JP2017509971A - データへの論理的妥当性検査規則の指定および適用 - Google Patents

データへの論理的妥当性検査規則の指定および適用 Download PDF

Info

Publication number
JP2017509971A
JP2017509971A JP2016551811A JP2016551811A JP2017509971A JP 2017509971 A JP2017509971 A JP 2017509971A JP 2016551811 A JP2016551811 A JP 2016551811A JP 2016551811 A JP2016551811 A JP 2016551811A JP 2017509971 A JP2017509971 A JP 2017509971A
Authority
JP
Japan
Prior art keywords
item
field
mapping
validation
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016551811A
Other languages
English (en)
Inventor
ゴウルド,ジョエル
プロコプス,ロイ
Original Assignee
アビニシオ テクノロジー エルエルシー
アビニシオ テクノロジー エルエルシー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アビニシオ テクノロジー エルエルシー, アビニシオ テクノロジー エルエルシー filed Critical アビニシオ テクノロジー エルエルシー
Publication of JP2017509971A publication Critical patent/JP2017509971A/ja
Priority to JP2021018377A priority Critical patent/JP6916403B2/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/067Enterprise or organisation modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/10Requirements analysis; Specification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Quality & Reliability (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Stored Programmes (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Debugging And Monitoring (AREA)

Abstract

論理的規則を指定するための、コンピュータ記憶媒体上に符号化されたコンピュータプログラムを含む方法、システム、および装置であり、各方法のうちの1つの方法は、項目に基づいて動作を適用する論理的規則を定義することを含む。この方法は、複数のフィールドと複数の項目の間のマッピングを定義することを含み、このマッピングは、1つのフィールドと1つの項目との間のマッピングを含む。この方法は、項目に関連づけられた論理的規則を記憶することを含む。この方法はまた、それぞれのフィールドがそれぞれの項目に割り当てられた第1のフィールドによって識別されたデータに、論理的規則を適用することを含む。

Description

本明細書は、データへの規則の指定および適用に関する。
業務アプリケーションを含め、現代の数多くのアプリケーションでは、データの大規模なセット(すなわち「データセット」)を処理し、これらを様々なソースからコンパイルすることができる。データセットにデータを供給する様々なソースは、様々なレベルのデータ品質を有することがある。アプリケーションが確実に適切に機能するように、データセットでの適切なレベルのデータ品質を監視および/または維持しなければならない。適切なレベルのデータ品質を監視または維持するために、データ妥当性検査システムによってデータセットを処理することができる。このようなシステムが、妥当性検査規則をデータセットに適用した後に、このデータセットがアプリケーションに提供される。例によっては、データ妥当性検査システムは、妥当性検査規則の結果を使用して、データ品質の測定値を計算し、データ品質の測定値が所定の閾値を下回っている場合にはプリケーションの管理者に警告する。他の例では、データ妥当性検査システムは、妥当性検査規則のうちの1つまたは複数の規則から外れるデータを取り扱うためのモジュールを備える。たとえば、データ妥当性検査システムは、妥当性検査規則のうちの1つまたは複数の規則から外れるデータを破棄または修復することができる。
一般に、データ妥当性検査システムによって適用される妥当性検査規則は、データ妥当性検査システムのユーザまたは管理者によって定義される。
一般に、本明細書に記載された主題の革新的な一態様は、論理的規則を受信する動作を含む方法で実施することができ、この論理的規則は、1つまたは複数の動作を指定し、これら動作のうちの少なくとも1つの動作が、ある項目に割り当てられた値に適用される。これらの方法は、その項目に関連した論理的規則を記憶する動作を含む。これらの方法は、複数のフィールドと複数の項目の間のマッピングを定義する動作を含み、このマッピングは、1つのフィールドと1つの項目との間のマッピングを含む。これらの方法はまた、それぞれのフィールドがそれぞれの項目に割り当てられた第1のフィールドによって識別されたデータに、論理的規則を適用する動作を含む。
この態様の他の実施形態は、対応するコンピュータシステム、装置、および1つまたは複数のコンピュータ記憶装置上に記録されたコンピュータプログラムを含み、それぞれが、これらの方法の動作を実行するように構成されている。1つまたは複数のコンピュータのシステムは、このシステムに組み込まれたソフトウェア、ファームウェア、ハードウェア、またはそれらの組合せを有することによって特定の動作を実行するように構成することができ、動作に際して、これらによってシステムが動作を実行するようになる。1つまたは複数のコンピュータプログラムは、データ処理装置によって実行されると、その装置が動作を実行できるようにする命令を含むことによって、特定の動作を実行するよう構成することができる。
上記その他の実施形態はそれぞれ、任意選択により、以下の特徴のうちの1つまたは複数を単独または組み合わせて含むことができる。論理的規則はさらに、第2の項目に基づいて動作をさらに実行してもよく、マッピングはさらに、第2のフィールドと第2の項目の間のマッピングを含む。論理的規則は、1つまたは複数の妥当性検査試験を含み、この1つまたは複数の妥当性検査試験のうちの第1の妥当性検査試験の項目への適用が、第2の項目に基づく。方法はさらに、データセット内の各フィールドと、それに対応する項目との間のマッピングを記憶する動作を含んでもよい。方法はさらに、項目とフィールドの間のマッピングに基づいて論理的規則を選択する動作を含んでもよい。方法はさらに、項目とフィールドの間のマッピングに基づいて、潜在的に可能な論理的規則のリストを示す動作を含んでもよい。
開示されたシステムの態様は、以下の例示的な利点のうちの1つまたは複数を有することができる。ユーザインターフェースによって、ビジネスユーザが妥当性検査規則を識別できるようにすることが可能である。論理的規則は、柔軟なやり方でビジネス項目と関連づけることができる。データセット内の各フィールドも、柔軟なやり方でビジネス項目と関連づけることができる。デフォルトの妥当性検査規則は、これらの関連づけに基づいて決定することができる。論理的規則は、特定用途向けの妥当性検査規則を生成するのに費やされる時間を短縮し、データセットを妥当性検査するのに費やされる時間を短縮することができ、妥当性検査規則の複数使用にわたって一貫性を実現することができ、通常はモジュラプログラミングに関連する他の利点とともに、妥当性検査規則自体の品質をさらに改善する。無効データによってアプリケーションの性能が落ちることがあるので、データセットを事前に妥当性検査することで、そのデータセットを使用するアプリケーションの性能を向上させることができる。妥当性検査規則をモジュール化することで、そうした規則を開発し、試験し、生産に移すためのワークフローを企業が開発できるようにすることが可能である。さらに、そうした妥当性検査規則は、改善され、変更されるとき、一箇所で変更することができ、したがって、こうした規則の保守性が改善される。一貫した規則が、データ品質を改善することができる。
本発明の他の特徴および利点は、以下の説明および特許請求の範囲から明白になろう。
データを妥当性検査するための妥当性検査規則を指定するための、システムのブロック図である。 データを妥当性検査するための論理的規則を指定するための、ユーザインターフェースの一例を示す図である。 論理的規則を作成する例を示す図である。 論理的規則を作成する例を示す図である。 論理的規則をフィールドに割り当てるための例示的なユーザインターフェースを示す図である。 データセット内のフィールドをビジネス項目にマッピングする様子を示す概念図である。
データ処理システムは、様々なソースからのデータを受け付け、このデータに基づいて出力を生成する。このシステムによって処理されるデータは、異常、誤り、または問題点を含んでいることがある。これらのデータ品質問題は、たとえば、キー入力誤りなど不正確な入力に起因する誤り、データ破壊などのマシン故障、およびデータの符号化の不正確な識別など変換誤りに起因する誤りが原因となることがある。誤りはまた、紛失したデータまたは報告されなかったデータ、不適切にフォーマットされたデータ、データ使用側でのデータ誤解釈につながるデータ供給側での仕様変更、データとの不整合につながる参照コードセットでの誤り、同期問題(たとえば、新規の基準データが時間通りに出現せず、ソースデータが相対的に古い基準データと一致しない)、新規のコード値の導入などが原因となることがある。一般に、データ品質システムの目標は、時にはデータ改善プログラム(データ品質問題点の数が、時間とともに円滑に減少するよう設計されたプログラム)の一部分として、測定する必要のあるデータ内の問題点を検出することである。
データ妥当性検査が、データ品質を測定するプロセスである。一般に、データソースに対して1つまたは複数のデータ妥当性検査試験が実行される。データの品質が定量化され、必要ならば、データの品質を改善するための処置をとることができる。
ユーザインターフェースは、妥当性検査規則を作成するプロセスを簡略化することができる。一般に、妥当性検査規則は、1つまたは複数の妥当性検査試験のセットであり、これをデータに適用して、データ品質を決定することができる。たとえば、妥当性検査規則は、データのフィールドが特定のデータタイプなのかどうか判定する妥当性検査試験、およびデータのフィールドが特定のサイズなのかどうか判定する妥当性検査試験を含んでもよい。1つの有用な比較基準は、論理的規則を編集し、コンパイルするためのシステムであり、これが2007年4月10日出願の「EDITING AND COMPILING LOGICAL RULES」と題する米国特許第8,069,129号に記載されており、その内容は、特にコラム6〜21を参考として組み込まれる。本明細書に記載のシステム、方法、および媒体は、従来技術に勝る以下の利点のうち少なくともいくつかを有する。ユーザインターフェースによって、ビジネスユーザが妥当性検査規則を識別できるようにすることが可能である。論理的規則は、ビジネス項目と関連づけることができる。データセット内の各フィールドも、ビジネス項目と関連づけることができる。デフォルトの妥当性検査規則は、これらの関連づけに基づいて決定することができる。論理的規則により、データセットを妥当性検査するのに費やす時間を短縮することができる。データセットを妥当性検査することで、そのデータセットを使用するアプリケーションの性能を向上させることができる。別の有用な比較基準は、規則を指定し、その規則をデータに適用するためのシステムであり、これが2012年10月17日出願の「SPECIFYING AND APPLYING RULES TO DATA」と題する米国特許出願第13/653,995号に記載されている。ビジネス項目は、データに組み込まれている概念を表す。たとえば、「cust_tb1」と名前のついたリレーショナルデータベースの表は、「phone_no」と名前のついたフィールドを含んでもよい。ある値を「phone_no」フィールド内に有する「cust_tb1」内の行は、その特定の電話番号をもつ顧客が存在することを表す。この例では、「顧客」は、少なくとも「cust_tb1」に組み込まれたビジネス項目であり、「電話番号」は、「phone_no」フィールドに組み込まれたビジネス項目である。妥当性検査規則は、ビジネス項目および概念を使用して構成することができ、続いてデータに適用することができる。このようにして、ビジネスユーザは、コンピュータ専門家の支援をほとんどまたは全く借りることなく、論理的規則を構成することができる。
一般に、システム、たとえば図1に示すシステムを使用して、論理的妥当性検査規則を指定することができる。図2には、ユーザインターフェースの一例が示してあり、これを使用して論理的妥当性検査規則を指定することができる。図3Aおよび3Bには、論理的規則の具体例が示してある。図3Aには、もっぱらビジネス項目に関連して生成される論理的妥当性検査規則が示してある。図3Bには、データセット内のデータを使用して生成され、次いで論理的規則へと一般化される、論理的妥当性検査規則が示してある。図3Bにはさらに、論理的妥当性検査規則を作成している間の、データセットからの試験データが表示してある。論理的妥当性検査規則が定義されると、この規則を様々なデータセットに適用することができる。図4には、論理的妥当性検査規則をデータセットに適用するための例示的なユーザインターフェースが示してある。実装形態によっては、データセット内のフィールドをビジネス項目にマッピングしてもよく、その結果、論理的妥当性検査規則をコンピュータシステムによって自動的に選択してもよい。図5は、データセット内のフィールドがビジネス項目にどのようにマッピングできるのかの概念図である。
図1には、妥当性検査技法を使用することのできる例示的なデータ処理システム100が示してある。システム100は、データソース102を含む。データソース102は、記憶装置またはオンラインデータストリームへの接続など、1つまたは複数のデータのソースを含むことができ、そのそれぞれが、様々な記憶フォーマット(たとえば、データベーステーブル、スプレッドシートファイル、フラットテキストファイル、またはメインフレームが使用するネイティブフォーマット)のうち任意のフォーマットで、データ(「データセット」と呼ばれることもある)を記憶することができる。
実行環境104は、UNIX(登録商標)など適切なオペレーティングシステムの制御下で、1つまたは複数の汎用コンピュータ上にホスティングすることができる。たとえば、実行環境104は、複数ノードの並列コンピューティング環境を含むことができ、これは、複数の中央処理装置(CPU)、ローカルプロセッサ(たとえば、SMPコンピュータなどのマルチプロセッサシステム)もしくはローカル分散プロセッサ(たとえば、クラスタもしくはMPPとして結合されたマルチプロセッサ)、遠隔プロセッサもしくは遠隔分散プロセッサ(たとえば、ローカルエリアネットワーク(LAN)および/もしくは広域ネットワーク(WAN)を介して結合されたマルチプロセッサ)、またはその任意の組合せを使用するコンピュータシステムの構成を含むことができる。
この実行環境は、ユーザインターフェース(UI)モジュール106および処理モジュール108を備える。UIモジュール106は、ユーザインターフェース112a(たとえば、表示画面上のグラフィカルな図)を介してユーザ110aから受信した入力を管理し、この入力は、論理的規則を指定するのに利用される。論理的規則は、たとえば、ビジネス項目について定義される妥当性検査規則でもよい。論理的規則を処理モジュール108が使用して、データソース102からのデータを処理することができる。UIモジュール106はまた、ユーザインターフェース112bを介してユーザ110bから受信される入力を管理することができ、この入力は、データセット内のフィールドを、識別されたビジネス項目にマッピングするのに利用される。
処理モジュール108は、データソース102からのデータを読み取り、UIモジュール106が取得した妥当性検査情報に基づいて妥当性検査手順を実行する。データソース102を設ける記憶装置は、実行環境104に対してローカルとすることができ、これは、たとえば実行環境104を実行するコンピュータに接続された記憶媒体(たとえばハードドライブ114)に記憶することができる。別法として、またはさらに、記憶装置は、実行環境104に対して遠隔とすることができ、これは、たとえば実行環境104を実行するコンピュータと遠隔接続を介して通信する遠隔システム(たとえばメインフレーム116)にホスティングすることができる。
一般に、データソース102からアクセスされるデータセットは、いくつかのデータ要素を含み、この要素は、所定のレコード構造に従ってフォーマット化されたレコード、すなわちデータベーステーブル内の各行とすることができる。各データ要素は、いくつかのフィールドについての値、たとえば、レコード構造内すなわちデータベーステーブルでの各列内で定義される属性を含むことができ、これらは、場合によってはヌル値または空の値である。フィールド内の値の様々な特性、またはあるフィールドでの値の有無を、有効または無効とみなすことができる。たとえば、文字列「Smith」を含む「last_name」フィールドは有効とみなしてもよく、空白の「last_name」フィールドは無効とみなしてもよい。フィールドが有効か無効か判定する条件は、フィールドが異なれば違っていてもよい。たとえば、文字列「Randolf」を含む「middle_name」フィールドは有効とみなしてもよく、空白の「middle_name」フィールドも有効とみなしてよい。
一般に、データセット内のフィールドは、論理的規則の物理表現を示すことができる。たとえば、「顧客」データセットでの「first_name」フィールド(たとえば、リレーショナルデータベースに記憶された可変長の文字列でもよい)は、顧客の名であり、したがってビジネス項目「名」に関連づけられているデータを含んでもよい。すなわち、顧客データセットのデータ要素の「first_name」フィールドでの文字列「John」は、「John」という名前のビジネス顧客の存在を表す。他のデータセットは、様々な方式で同じビジネス概念を表してもよい。たとえば、第2のデータセットは、フィールド「fname」を含むことができ、これもビジネス項目「名」に対応してよい。
ビジネス項目について、論理的規則を定義することができる。たとえば、妥当性検査規則は、ビジネス項目「名」に関連づけられたフィールドが英字列であることを妥当性検査するように構成することができる。次いで、論理的規則を使用して、「first_name」フィールドおよび「fname」フィールドを妥当性検査してもよい。
データセットがかなりの数の無効フィールドを含む場合、データソース102からのデータセットを利用するアプリケーションの性能に悪影響が及ぶことがある。処理モジュール108は、データ妥当性検査規則をデータセットに適用する工程を含むデータ妥当性検査手順を実行して、このデータセットが品質制約条件を確実に満たすようにする。データセットの品質が品質制約条件を満たしていない場合、データ処理システム100がシステム管理者に警告する。構成によっては、処理モジュール108は、可能なら無効データを修復するよう、または様々なデータクレンジング手順を実行して、クレンジングされたデータ要素のデータセットを生成するよう構成することができる。処理モジュール108は、レポートを生成できる元になる無効データを含むフィールドのリストを生成するよう構成することができる。これらのレポートは、フィールドのリスト内の各フィールドのうち1つまたは複数のフィールドについての無効データを含むレコードのカウントを含むことができる。これらのレポートは、フィールドのリストから計算された無効フィールドの集合を含むこともできる。
一般に、様々なアプリケーションが、様々なタイプのデータを処理する。したがって、アプリケーションに応じて、データセットの各要素が、様々なフィールドを含むことができる。UIモジュール106がユーザインターフェース112を設け、このユーザインターフェースによって、妥当性検査規則のセットを指定し、これを使用してデータセットを妥当性検査できるようになる。ユーザインターフェース112は、特定のデータ要素構造の複数のフィールド(実装形態によっては、利用可能な全てのフィールド)を含む単一ビューを提示することができる。したがって、所与のアプリケーションに対して、ユーザ110(たとえばシステム管理者)は、データについての適切な妥当性検査規則を指定することができる。
図2は、論理的規則を指定してデータを妥当性検査するための、ユーザインターフェース112の一例である。ユーザインターフェース112は、ユーザ110が、1つまたは複数の論理的規則を容易に指定して妥当性を確認するように構成される。この例では、論理的規則は、1つまたは複数の妥当性検査試験を含んでもよく、この妥当性検査試験のそれぞれは、別の妥当性検査規則の適用が必要となる場合がある。妥当性検査試験および対応する規則のそれぞれを、ビジネス項目に適用することができる。
UIモジュール106は、ユーザインターフェース112を提供する。ユーザインターフェース112は、たとえばコンピュータモニタ上に表示してもよい。ユーザインターフェース112は、第1の軸226および第2の軸228を有する2次元グリッド225に配置された、いくつかのセル224を含む。セル224の1つまたは複数のサブセット230(詳細説明のこれ以降では、行230と呼ぶ)は、2次元グリッド225の第1の軸226に沿った方向に拡張する。行230のそれぞれは、フィールド218に関連している。構成によっては、行230のそれぞれの第1の(すなわち左端の)セルは、行230に関連づけられたビジネス項目218の名前を含む。この例では、各行の第1のセルは、ビジネス項目名「項目1」、「項目2」、...「項目M」を含む。
セル224の複数のサブセット232(詳細説明のこれ以降では、列232と呼ぶ)は、第2の軸228に沿って拡張する。列232のうち1つまたは複数の列は、妥当性検査規則234に関連している。列232は、(行によって識別される)ビジネス項目に関連づけられた妥当性検査規則が適用される下となる環境を識別する、「条件」の列250を含むことができる。例によっては、残りの列232のそれぞれの第1の(すなわち最上部の)セルは、この列に関連する妥当性検査規則234の名前を含む。この例では、妥当性検査規則名は、「妥当性検査規則1」、「妥当性検査規則2」、...「妥当性検査規則N」である。例によっては、第1の軸226の方向と第2の軸228の方向とを入れ替えることができ、それにより、フィールド218に関連する行230が列になり、妥当性検査規則234に関連する列232が行になることに留意されたい。
1つまたは複数の妥当性検査規則の列232が2次元グリッド225に追加された後、ユーザ110は、どの妥当性検査規則234をどのビジネス項目218に適用すべきか指定することができる。所与の妥当性検査規則234を所与のビジネス項目218に適用すべきであると指定するには、ユーザ110はまず、所与のビジネス項目218に関連する行230が、所与の妥当性検査規則234に関連する列232と交わるセル224を選択する。次いで、ユーザ110は、選択されたセル224の入力要素(たとえば、テキストフィールドまたはチェックボックス)に、1つまたは複数の妥当性検査規則パラメータ236を入力する。一般に、規則パラメータ236をセルに含めることは、2つの目的にかなう。第1の目的は、妥当性検査規則234を構成する「構成入力」を提供することである。第2の目的は、所与の妥当性検査規則234を所与のビジネス項目218に適用しなければならないと示すことである。その結果、セル224が妥当性検査規則パラメータ236を含まない(すなわち、セルが空白のままである)場合、処理モジュール108は、セル224に関連する妥当性検査規則234を、セル224に関連するそのそれぞれのビジネス項目218に適用することはなくなる。
数多くの様々なタイプの規則パラメータ236を、セル224に入力することができる。場合によっては、規則を構成するのに構成入力は必要でなく、したがって、規則パラメータ236は単に、対応する妥当性検査規則を適用すべきであることを確認する「確認入力」規則パラメータとすることができる。確認入力規則パラメータを受信するための入力要素の一例はチェックボックスであり、このチェックボックスは、チェックされると、セル224に関連する妥当性検査規則234を、セル224に関連するビジネス項目218に適用しなければならないことを示す。様々なタイプの妥当性検査規則の例を以下のリストに示す。各妥当性検査規則は、その妥当性検査規則が以下の構成入力によって構成されるかどうかを示す。
・整数−整数妥当性検査規則は、ビジネス項目が整数のみを含んでいることを妥当性検査する(構成入力は不要)。
・無効値−無効値規則は、ビジネス項目がユーザ指定された無効値(構成入力として提供される)を含んでいないことを妥当性検査する。
・最高精度−最高精度規則は、ビジネス項目の桁数が、小数点以下でユーザ指定数(構成入力として提供される)以下であることを妥当性検査する。
・最大値−最大値規則は、ビジネス項目の値がユーザ指定値(構成入力として提供される)よりも大きい場合に、値が有効であると判定する。
・最大長−最大長規則は、ビジネス項目の文字数またはバイト数が、ユーザ指定数(構成入力として提供される)以下であることを妥当性検査する。
・最小値−最小値規則は、ビジネス項目がユーザ指定値(構成入力として提供される)よりも小さい場合に、値が無効であると判定する。
・非空白−非空白規則は、ビジネス項目が空である場合、すなわち空白のみを含む場合(構成入力は必要ない)、値が無効であると判定する。
・非ヌル−非ヌル規則は、ビジネス項目がヌルである場合(必要な構成入力として提供される)、値が無効であると判定する。
・パターン−パターン規則は、指定されたパターン(構成入力として提供される)としてストリングビジネス項目を妥当性検査する。
・有効値−有効値規則は、ビジネス項目がユーザ指定された有効値(構成入力として提供される)のみを含んでいることを妥当性検査する。
・タイプ有効性−タイプ有効性規則は、ビジネス項目データが、そのタイプについて有効であることを妥当性検査する(構成入力は必要ない)。
妥当性検査規則の上記リストは必ずしも包括的ではない。
例によっては、ユーザインターフェース112は、1つまたは複数の混成された妥当性検査規則の列を、2次元グリッド225に挿入する選択肢を含む。混成された妥当性検査規則の列により、ユーザ110は、その列に含まれる(所与のフィールド218に関連する)各セルについて、互いに異なる妥当性検査規則を指定できるようになる。たとえば、混成された妥当性検査規則の列の1つのセルは、「有効値」試験を含むこともでき、混成された妥当性検査規則の列の別のセルは、「最大値」試験を含むこともできる。一般に、ユーザ100は、試験の名前と、それに続いて(試験が規則パラメータを受け付ける場合は)試験についての規則パラメータとを入力することによって、混成された妥当性検査規則の列の所与のセルについて妥当性検査規則を指定する。一般に、列としての2次元グリッド225に追加できる任意の妥当性検査規則は、混成された妥当性検査規則の列の単一セルに入力することができる。「非ヌル」、「最大値(99)」、および「有効値(M、F)」は、混成された妥当性検査規則の列で目にすることができるセルの例示的な内容である。
混成された妥当性検査規則の列によって実現される1つの利点は、たまにしか使用しない試験をより効率的に画面上に表示することによって、ユーザインターフェース112の使い勝手が改善されることである。具体的には、ユーザ110は、2次元のグリッド225の列232全体を、単一フィールド218のみに適用される妥当性検査規則に当てはめなくてもよい。たとえば、混成された妥当性検査規則の列は、「有効eメール」の試験が単一フィールド218(たとえば、「email_addr」フィールド)のみに適用されるが、2次元グリッド225の列232全体を占有し、それによって貴重な画面スペースを無駄にする状況を回避することができる。
先に述べたように、ユーザ110は、既定の妥当性検査規則のいずれにも含まれない機能を有する妥当性検査規則を要求することがある。構成によっては、ユーザ110は、新規の再使用可能で特定用途向けの妥当性検査規則234で、既定の妥当性検査規則のリストを増やすことができる。ユーザインターフェース112は、ユーザ110が、新規の妥当性検査規則234の機能を定義するためのテンプレートを提供する。ユーザ110は、たとえば、構造化コメントで装飾されたDMLコードなどのプログラミング言語または式言語を使用して、テンプレートの範囲内で所望の特定用途向け機能を定義する。一般に、特定用途向けの妥当性検査規則の作成には、文字列のような入力、数字のような入力、データのような入力、および日時のような入力に、妥当性検査試験を実行するためのソフトウェア命令を必要とする。特定用途向けの妥当性検査規則はまた、パラメータの名前、記述、およびリストを必要とし、このパラメータは、特定用途向けの妥当性検査規則に必要であり、パラメータの名前、パラメータのデータタイプ、およびパラメータの位置を含む。特定用途向けの妥当性検査規則はまた、この特定用途向けの妥当性検査規則が生成してもよい誤りコードのリストを必要とすることがある。
新規の妥当性検査規則234を保存すると、この妥当性検査規則234は、既定の妥当性検査規則のリストまたは階層データ構造など他のデータ構造に追加される。実装形態によっては、ユーザは、階層データ構造を定義し、後にアクセスするため新規の妥当性検査規則をこの構造内に配置することができる。
ユーザ110は、たとえば、妥当性検査規則のリストから2次元グリッド225まで妥当性検査規則をドラッグすることによって、または他の利用方法とともに妥当性検査規則をダブルクリックすることによって、新規で特定用途向けの妥当性検査規則234を後で使用することができる。既定の妥当性検査規則の場合と同様に、新規の妥当性検査規則をグリッド225までドラッグするか、またはこの新規の妥当性検査規則をダブルクリックすることによって、新規の列232がグリッド225に追加され、この新規の列232は、新規の妥当性検査規則に関連づけられる。
妥当性検査規則は、既定の妥当性検査規則であろうと、特定用途向けの妥当性検査規則であろうと、この規則をヌル値に適用すべきか、ブランク値に適用すべきかを示す属性を有することができる。この規則をヌル値に適用すべきではないと規則が指定する場合、まずその値がヌルについて試験され、次いでヌルの場合はこの規則が適用されず、ヌルでない場合にはこの規則が適用される。この規則をブランク値に適用すべきではないとこの規則が指定する場合、まずこの値がブランクかどうか確認するために試験され、この値がブランクではないと分かった場合にのみこの規則が適用される。
妥当性検査規則は、既定であろうと特定用途向けであろうと、セル224に入力される1組の規則パラメータ236が妥当性検査規則において有効かどうか判定するのに使用できる論理を示す属性を有することができる。たとえば、ユーザインターフェース112は、セル224に入力される規則パラメータ236のそれぞれのセットが正しいかどうか判定することができる。(たとえば、構文誤りによって)規則パラメータが間違っていると判定される場合、表示(たとえば赤色停止標識)がセル内に表示され、論理によって決定される誤りメッセージが(たとえば、誤りのリスト内に、またはセル上に停止しているときのツールチップとして)表示される。規則パラメータの正しさを検査する別の例は、指定された参照ファイル識別子が、実際に処理モジュール108に知られていることを検査することなど、セマンティクスを検査することである。
場合によっては、特定のビジネス項目に割り当てられた値が有効かどうかは、別のビジネス項目に依存することがある。たとえば、郵便番号およびジップコード、または電話番号の有効フォーマットは、国によって異なることがある。ビジネス項目が特定の値を有するときに適用されるか、または他の何らかの判定基準に基づいている行は、再使用可能な論理的規則の柔軟性を向上させる。
構成によっては、ユーザインターフェース112は条件の列250を含み、この列により、ユーザは、所与の行での妥当性検査規則を試験するための前提条件を確立できるようになる。たとえば、ユーザは、規則パラメータ1,1236を有する「妥当性検査規則1」をビジネス項目「項目1」230に適用する前に、「条件1」252を満たすべきであると指定してもよい。
前述の通り、条件は、妥当性検査の主題であってもなくてもよいビジネス項目を参照することができる。たとえば、所定の値と一致し、実現可能な値の範囲もしくはセット内に含まれ、または提供される正規表現値と一致する値をビジネス項目が有していることを、条件が必要としてもよい。条件は、ビジネス項目がある値を有する(たとえば、ビジネス項目がヌル値の表示を含まない)ことを必要とする場合がある。
実装形態によっては、条件は、データ駆動型とすることができる。たとえば、あるタイプのレコード、ある範囲内のアカウント、1組の値での国である。条件は、別の入力ファイルまたはデータベーステーブル内に、参照ファイルまたは参照データを含んでもよい。
ユーザは、論理的規則を定義すると、後でアクセスするために、この規則を記憶しておこうと考えることがある。一般に、論理的規則が記憶された後に、この規則を見つけるのが容易になるほど、この規則を再使用する可能性が高くなる。妥当性検査規則の再使用を容易にするために、この規則は、ラベルまたは名前によって識別することができ、また特定のビジネス項目に関連づけることもできる。
構成によっては、ユーザインターフェース112はフィールド254を含むことができ、ここでユーザは、論理的規則に名前を指定することができる。ユーザインターフェース112はフィールド256をも含むことができ、ここでユーザは、論理的規則に関連づけるため1次ビジネス項目を指定することができる。構成によっては、フィールド256は、ユーザインターフェースの第1の行230内で識別されたビジネス項目218で自動入力することができる。
論理的規則は、リポジトリまたは他のデータストアに記憶することができる。
図3Aおよび図3Bには、論理的規則を定義するための2つの手法の例が示してある。第1の例(図3A)では、特定のデータセットに関係なく、論理的規則が定義される。第2の例(図3B)では、モデルとしての既存のデータセットからのデータを使用して、論理的規則が定義される。
図3Aには、論理的規則を生成する一例が示してある。たとえば、図2のユーザインターフェース212とすることができるユーザインターフェース300は、名前フィールド304を含む。ここで、名前フィールド304には、名前「ジップ妥当性検査」が取り込まれている。フィールド314に示すように、論理的規則は、ビジネス項目「郵便番号」に関連づけられている。
表306は、「郵便番号」のビジネス項目についての妥当性検査規則を定義する。再使用可能な国をまたぐ郵便番号の妥当性検査規則は、3つの条件付き妥当性検査を含む。第1の妥当性検査308は、国が「US」である場合、郵便番号が「(99999)|(99999−9999)」のフォーマットでなければならないことを示す。第2の妥当性検査310は、国が「CA」である場合、郵便番号が「A9A 9A9」のフォーマットでなければならないことを示す。第3の妥当性検査312は、国が「UK」である場合、郵便番号が「A((A9)|9)(A|9)?9AA」のフォーマットでなければならないことを示す。
論理的規則は、入力としてデータ値を受け付けることができる。構成によっては、システムは、妥当性検査規則からの必要なデータを決定することができる。ここで、システムは、ビジネス項目「郵便番号」およびビジネス項目「国」に割り当てられた値を、論理的規則が必要とすることを決定できる。他の構成では、このシステムは、ユーザインターフェース(図示せず)からの要求されたデータ値のリストを受け付けることができる。
一般に、ユーザは、表306に所望の条件および妥当性検査を入力することができる。ユーザは、妥当性検査規則に満足すると、この規則をデータリポジトリに保存することができる。「保存」ボタン316をクリックすることによって、またはメニュー選択など別の同様な機構、もしくは他の同様な動作を介して、これを実行することができる。
前述の通り、論理的規則は、リポジトリまたは他のデータストアに記憶することができる。ユーザインターフェースは、リポジトリにアクセスし、自動的に、またはユーザ入力と連動して、関連する再使用可能なビジネス妥当性検査規則を識別することができる。
図3Bを参照すると、実装形態によっては、既存のデータセットを参照して論理的規則を定義することができる。たとえば、「顧客データセット(CustomerDataSet)」は、「custid」、「名前」、「主要道路(primary_street)」、「主要都市(primary_city)」、「主要州(primary_state)」、「主要ジップコード(primary_zipcode)」、「主要国(primary_country)」、および「主要電話(primary_phone)」を含んでもよい。ユーザインターフェース350により、ユーザは、主要ジップコードのフィールド(図示せず)を参照することによって論理的規則を作成できるようになる。
表356は、「主要ジップコード」についての妥当性検査規則を定義する。再使用可能な国をまたぐ郵便番号の妥当性検査規則は、3つの条件付き妥当性検査を含む。第1の妥当性検査358は、主要国のフィールド内の値が「US」である場合、郵便番号が「(99999)|(99999−9999)」のフォーマットでなければならないことを示す。第2の妥当性検査360は、主要国のフィールド内の値が「CA」である場合、郵便番号が「A9A 9A9」のフォーマットでなければならないことを示す。第3の妥当性検査362は、主要国のフィールド内の値が「UK」である場合、郵便番号が「A((A9)|9)(A|9)?9AA」のフォーマットでなければならないことを示す。
一般に、ユーザは、表356に所望の条件および妥当性検査を入力することができる。ユーザは、妥当性検査規則に満足すると、この規則をデータリポジトリに保存することができる。「保存」ボタン364をクリックすることによって、またはメニュー選択など別の同様な機構、もしくは他の同様な動作を介して、これを実行することができる。ユーザが妥当性検査規則を保存する時点で、ユーザには、表356内で識別される各フィールドにビジネス項目を割り当てる選択肢が与えられる。たとえば、ユーザは、ビジネス項目「郵便番号」を「主要ジップコード」フィールドに割り当て、ビジネス項目「国」を「主要国」フィールドに割り当ててもよい。
前述の通り、論理的規則は、リポジトリまたは他のデータストアに記憶することができる。ユーザインターフェースは、リポジトリにアクセスし、自動的に、またはユーザ入力と連動して、関連する再使用可能なビジネス妥当性検査規則を識別することができる。
このようにして論理的規則を構築することには、ユーザが試験データを利用して論理的規則を妥当性検査できるようになる利点がある。たとえば、試験表366には、「顧客データセット」内のレコードのデータ値、ならびにその結果得られる妥当性検査結果が示してある。たとえば、第1の行368は、主要ジップコード「02421」および主要国「US」を含む。表356内の第1の妥当性検査358に基づいて、ユーザインターフェース350は、第1の行368が有効であることを表示する。第2の行370は、主要ジップコード「M3A 102」および主要国「US」を含む。主要ジップコードと主要国の組合せが、表356内のいかなる妥当性検査にも一致しないので、ユーザインターフェース350は、第2の行370が無効であると表示する。第3の行372は、主要ジップコード「M3A 102」および主要国「CA」を含む。表356内の第3の妥当性検査362に基づいて、ユーザインターフェース350は、第3の行370が有効であることを表示する。
図4には、ユーザインターフェース400の一例が示してあり、これを使用して、論理的規則をフィールドに割り当てることができる。ユーザインターフェース400は、データセットのフィールドを表示することができる。データセットは、1つまたは複数のデータストアに記憶された、様々なデータセットの中から選択することができる。データセットは、たとえば、リレーショナルデータベース、単層ファイル、または他のデータ構造内の表とすることができる。この例では、「顧客データセット」416が選択されている。
ユーザインターフェース400は、選択されたデータセット内のフィールド420を表示する表418を含む。「顧客データセット」は、フィールド「custid」402、「名前」、「主要道路」、「主要都市」、「主要州」(まとめて406と表示する)、「主要ジップコード」408、「主要国」414、および「主要電話」422を含む。
ユーザインターフェース400により、ユーザは、特定用途向けの妥当性検査規則をフィールドに提供できるようになる。ここで、「custid」フィールド402が妥当性検査規則に関連づけられ、「custid」フィールド402の値がパターンS「9999999」404に一致することが必要となる。ユーザインターフェース400により、ユーザはまた、論理的規則418を選択できるようになる。この例では、「主要ジップコード」408は、ジップ妥当性検査規則410に関連づけられている。図3を参照して先に定義したジップ妥当性検査規則410には、パラメータとして「主要国」が与えられる。割り当てられた値は、それぞれ「国」のビジネス項目に対応する。
前述の通り、使用可能な妥当性検査規則のデータセットへの適用を簡略化するために、ユーザは、データセット内のフィールドをビジネス項目にマッピングしようと考えてもよい。図5は、データセット内のフィールドをビジネス項目にマッピングする一例を示す概念図である。マッピングによって、データセット内のフィールドとビジネス項目との間の関係が確立する。一般に、1つまたは複数のフィールドを、ビジネス項目にマッピングすることができる。マッピングは、各フィールドを連結して、または他の方法で結合して、ビジネス項目を作成することを指定できる。構成によっては、データセット内に記憶された値を標準のビジネスフォーマットに変更するのに、変換を指定することができる。
データストア502はデータセットを含む。この例では、データストアは「顧客データセット」504を含む。「顧客データセット」504は、主要ジップコードのフィールド508、主要国のフィールド510、および主要電話のフィールド516を有するフィールドを含む。データセット内の各フィールドは、既存のビジネス項目にマッピングすることができる。たとえば、主要ジップコードのフィールド508は、郵便番号のビジネス項目512にマッピングすることができる。主要国のフィールド510は、国のビジネス項目514にマッピングすることができる。主要電話のフィールド516は、電話番号のビジネス項目518にマッピングすることができる。
構成によっては、変換は、フィールドをビジネス項目にマッピングすることの一部分として指定することができる。変換を使用して、あるフォーマットから別のフォーマットにデータを変換することができる。電話番号は、「(999)999−9999」、「999−999−9999」のフォーマットで記憶することもでき、または市外局番、プレフィックス、およびサフィックスを3つ別々のフィールドに記憶することもできる。ここで、主要電話のフィールド516は、「(999)999−9999」のフォーマットで電話番号を記憶してもよい。電話番号のビジネス項目を使用する機能は、「999−999−9999」など特定の方式(すなわち、標準のビジネスフォーマット)でデータがフォーマットされることを想定することができる。変換520は、データを標準ビジネスフォーマットに変換する機能を定義する。
ビジネス項目とフィールドの間の関連づけが確立されると、この関連づけをビジネス項目のデータストア508に記憶することができる。たとえば、関連づけ522は、「顧客データセット」の主要ジップコードのフィールドを郵便番号のビジネス項目にマッピングすることを示している。システムは、フィールドからビジネス項目へのマッピングを使用して、特定のフィールド向けの論理的規則を自動的に識別し、識別された論理的規則への入力を識別することができる。データセット内のフィールドがビジネス項目に関連づけられる場合、システムは、同じビジネス項目に関連づけられた論理的規則を識別することができる。次いで、システムは、識別された妥当性検査規則をフィールドに割り当てることができる。たとえば、図4を参照すると、システムは、主要ジップコードのフィールドが郵便番号のビジネス項目に関連づけられていることを識別してもよい。システムはまた、ジップ妥当性検査規則が、郵便番号のビジネス項目に関連づけられていることを識別することもできる。したがって、システムは、ユーザインターフェース400において、ジップ妥当性検査規則と主要ジップコードのフィールドを関連づけることができる。
システムはまた、マッピングを使用して、選択された妥当性検査規則への入力を識別することができる。システムは、たとえば、ジップ妥当性検査規則が郵便番号のビジネス項目および国のビジネス項目を入力として必要とすることを識別することもできる。ここで、システムは、「顧客データセット」の主要ジップコードのフィールドが郵便番号のビジネス項目に関連づけられており、「顧客データセット」の主要国のフィールドが国のビジネス項目に関連づけられていることを識別するはずである。それに応じて、システムは、主要ジップコードおよび主要国をジップ妥当性検査規則のパラメータに自動で割り当てる。
構成によっては、複数の論理的規則がビジネス項目に関連づけられているとシステムが判定する場合、ユーザインターフェースは、適切な妥当性検査規則を選択する元になるリストをユーザに示すことができる。
構成によっては、ユーザには、妥当性検査規則およびシステムが選択した入力を見直し、それを修正する機会を与えることができる。たとえば、代替規則を選択することによって、選択された妥当性検査規則をユーザが修正しようとする状況では、前述の通り、システムは、各フィールドが入力として提供されるものと識別することができる。
ユーザは、選択された論理的規則および入力に満足する場合、妥当性検査の選択結果を保存することができる。
前述の各技法は、コンピュータ上で実行するためのソフトウェアを使用して実装することができる。たとえば、ソフトウェアは、(分散アーキテクチャ、クライアント/サーバ、またはグリッドなど様々なアーキテクチャとすることができる)1つまたは複数のプログラムされた、またはプログラム可能なコンピュータシステム上で実行される、1つまたは複数のコンピュータプログラムにおいて手順を形成し、このコンピュータシステムのそれぞれが、少なくとも1つのプロセッサ、(揮発性メモリおよび不揮発性メモリ、ならびに/または記憶素子を含む)少なくとも1つのデータ記憶システム、少なくとも1つの入力装置もしくは入力ポート、ならびに少なくとも1つの出力装置もしくは出力ポートを備える。ソフトウェアは、たとえば、データ流れ図の設計および構成に関連する他のサービスを提供する、さらに大きいプログラムの1つまたは複数のモジュールを形成することができる。グラフのノードおよび要素は、コンピュータ読取り可能な媒体に記憶されたデータ構造、またはデータリポジトリに記憶されたデータモデルに合致する他の編成されたデータとして実装することができる。
ソフトウェアは、汎用もしくは専用のプログラマブルコンピュータから読取り可能な、CD−ROMなどの記憶媒体上に準備することができ、またはネットワークの通信媒体を介して、このソフトウェアが実行されるコンピュータの記憶媒体まで配布する(伝搬信号内に符号化する)ことができる。専用コンピュータ上で、またはコプロセッサなどの専用ハードウェアを使用して、機能の全てを実行することができる。ソフトウェアによって指定された計算の様々な部分を様々なコンピュータによって実行する分散方式で、ソフトウェアを実装することができる。本明細書に記載の手順を実行するよう、記憶媒体または記憶装置がコンピュータシステムに読み取られるときにコンピュータを構成し動作させるために、このようなコンピュータプログラムはそれぞれ、汎用または専用のプログラム可能なコンピュータで読取り可能な記憶媒体または記憶装置(たとえば、固体記憶装置もしくは固体記憶媒体、または磁気媒体もしくは光媒体)に、記憶またはダウンロードされることが好ましい。この発明性のあるシステムはまた、コンピュータプログラムで構成された、コンピュータ読取り可能な記憶媒体として実施されるものとみなすことができ、ここで、そのように構成された記憶媒体により、コンピュータシステムは、特定の事前定義された方式で動作して、本明細書に記載の機能を実行できるようになる。
本発明の実施形態をいくつか説明してきた。それにもかかわらず、本発明の精神および範囲から逸脱することなく様々な修正を加え得ることが理解されよう。たとえば、前述の工程のいくつかは、順序に依存しなくてもよく、したがって記載された順序とは異なる順序で実行することができる。
前述の説明は、本発明の範囲を例示するものであり、それを限定するものではなく、本発明の範囲は、添付の特許請求の範囲に記載の範囲によって定義されることを理解されたい。たとえば、前述のいくつかの機能工程は、処理全体に実質的に影響を及ぼすことなく、互いに異なる順序で実行することができる。他の実施形態は、添付の特許請求の範囲に記載の範囲内にある。

Claims (19)

  1. 論理的規則を指定するためのコンピュータ実施方法であって、
    論理的規則を受信することであって、前記論理的規則が1つまたは複数の動作を指定し、前記動作のうちの少なくとも1つが項目に割り当てられた値に適用されることと、
    前記項目に関連づけられた前記論理的規則を記憶することと、
    複数のフィールドと複数の項目の間のマッピングを定義することであって、前記マッピングが、1つのフィールドと1つの項目との間のマッピングを含むことと、
    それぞれのフィールドがそれぞれの項目に割り当てられる第1のフィールドによって識別されたデータに前記論理的規則を適用することと
    を含む方法。
  2. 前記論理的規則がさらに、第2の項目に基づいて動作を適用し、前記マッピングがさらに、第2のフィールドと前記第2の項目の間のマッピングを含む、請求項1に記載の方法。
  3. 前記論理的規則が、1つまたは複数の妥当性検査試験を含み、前記1つまたは複数の妥当性検査試験のうちの第1の妥当性検査試験の前記項目への適用が前記第2の項目に基づく、請求項2に記載の方法。
  4. データセット内のフィールドと、対応する項目との間のマッピングを記憶することをさらに含む、請求項1に記載の方法。
  5. 前記項目と前記フィールドの間のマッピングに基づいて前記論理的規則を選択することをさらに含む、請求項1に記載の方法。
  6. 前記項目と前記フィールドの間の前記マッピングに基づいて潜在的に可能な論理的規則のリストを示すことをさらに含む、請求項1に記載の方法。
  7. コンピュータプログラム命令で符号化されたコンピュータ記憶媒体であって、前記コンピュータプログラム命令は1つまたは複数のコンピュータによって実行されたときに、
    論理的規則を受信することであって、前記論理的規則が1つまたは複数の動作を指定し、前記動作のうちの少なくとも1つが項目に割り当てられた値に適用されることと、
    前記項目に関連づけられた前記論理的規則を記憶することと、
    複数のフィールドと複数の項目の間のマッピングを定義することであって、前記マッピングが、1つのフィールドと1つの項目との間のマッピングを含むことと、
    それぞれのフィールドがそれぞれの項目に割り当てられる第1のフィールドによって識別されたデータに前記論理的規則を適用することと
    を含む動作を、前記1つまたは複数のコンピュータに実行させる、コンピュータ記憶媒体。
  8. 前記論理的規則がさらに、第2の項目に基づいて動作を適用し、前記マッピングがさらに、第2のフィールドと前記第2の項目の間のマッピングを含む、請求項7に記載の媒体。
  9. 前記論理的規則が、1つまたは複数の妥当性検査試験を含み、前記1つまたは複数の妥当性検査試験のうちの第1の妥当性検査試験の前記項目への適用が前記第2の項目に基づく、請求項8に記載の媒体。
  10. データセット内の各フィールドと、それに対応する項目との間のマッピングを記憶することをさらに含む、請求項7に記載の媒体。
  11. 前記項目と前記フィールドの間のマッピングに基づいて前記論理的規則を選択することをさらに含む、請求項7に記載の媒体。
  12. 前記項目と前記フィールドの間の前記マッピングに基づいて潜在的に可能な論理的規則のリストを示すことをさらに含む、請求項7に記載の媒体。
  13. 1つまたは複数のコンピュータと、
    前記1つまたは複数のコンピュータによって実行されると、
    論理的規則を受信することであって、前記論理的規則が1つまたは複数の動作を指定し、前記動作のうちの少なくとも1つが項目に割り当てられた値に適用されること、
    前記項目に関連づけられた前記論理的規則を記憶すること、
    複数のフィールドと複数の項目の間のマッピングを定義することであって、前記マッピングが、1つのフィールドと1つの項目との間のマッピングを含むこと、および
    それぞれのフィールドがそれぞれの項目に割り当てられる第1のフィールドによって識別されたデータに前記論理的規則を適用することを含む動作を、前記1つまたは複数のコンピュータが実行できるようにするよう動作可能である命令を記憶する、1つまたは複数の記憶装置と
    を備えるシステム。
  14. 前記論理的規則がさらに、第2の項目に基づいて動作を適用し、前記マッピングがさらに、第2のフィールドと前記第2の項目の間のマッピングを含む、請求項13に記載のシステム。
  15. 前記論理的規則が、1つまたは複数の妥当性検査試験を含み、前記1つまたは複数の妥当性検査試験のうちの第1の妥当性検査試験の前記項目への適用が前記第2の項目に基づく、請求項14に記載のシステム。
  16. データセット内の各フィールドと、それに対応する項目との間のマッピングを記憶することをさらに含む、請求項13に記載のシステム。
  17. 前記項目と前記フィールドの間のマッピングに基づいて前記論理的規則を選択することをさらに含む、請求項13に記載のシステム。
  18. 前記項目と前記フィールドの間の前記マッピングに基づいて潜在的に可能な論理的規則のリストを示すことをさらに含む、請求項13に記載の媒体。
  19. 論理的規則を受信するための手段であって、前記論理的規則が1つまたは複数の動作を指定し、前記動作のうちの少なくとも1つが項目に割り当てられた値に適用される手段と、
    前記項目に関連づけられた前記論理的規則を記憶するための手段と、
    複数のフィールドと複数の項目の間のマッピングを定義するための手段であって、前記マッピングが、1つのフィールドと1つの項目との間のマッピングを含む手段と、
    それぞれのフィールドがそれぞれの項目に割り当てられる第1のフィールドによって識別されたデータに前記論理的規則を適用するための手段と
    を備えるシステム。
JP2016551811A 2014-03-13 2015-03-12 データへの論理的妥当性検査規則の指定および適用 Pending JP2017509971A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2021018377A JP6916403B2 (ja) 2014-03-13 2021-02-08 データへの論理的妥当性検査規則の指定および適用

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/208,147 US10769122B2 (en) 2014-03-13 2014-03-13 Specifying and applying logical validation rules to data
US14/208,147 2014-03-13
PCT/US2015/020066 WO2015138666A1 (en) 2014-03-13 2015-03-12 Specifying and applying logical validation rules to data

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2021018377A Division JP6916403B2 (ja) 2014-03-13 2021-02-08 データへの論理的妥当性検査規則の指定および適用

Publications (1)

Publication Number Publication Date
JP2017509971A true JP2017509971A (ja) 2017-04-06

Family

ID=52774579

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2016551811A Pending JP2017509971A (ja) 2014-03-13 2015-03-12 データへの論理的妥当性検査規則の指定および適用
JP2021018377A Active JP6916403B2 (ja) 2014-03-13 2021-02-08 データへの論理的妥当性検査規則の指定および適用

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2021018377A Active JP6916403B2 (ja) 2014-03-13 2021-02-08 データへの論理的妥当性検査規則の指定および適用

Country Status (9)

Country Link
US (1) US10769122B2 (ja)
EP (1) EP3117378A1 (ja)
JP (2) JP2017509971A (ja)
KR (1) KR102411550B1 (ja)
CN (1) CN106104472B (ja)
AU (1) AU2015229419A1 (ja)
CA (1) CA2940444C (ja)
SG (2) SG11201606457YA (ja)
WO (1) WO2015138666A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10769122B2 (en) 2014-03-13 2020-09-08 Ab Initio Technology Llc Specifying and applying logical validation rules to data
JP2023501098A (ja) * 2019-11-10 2023-01-18 タブロー ソフトウェア,インコーポレイテッド セマンティックロールを用いたデータプレパレーション

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021144656A1 (en) 2020-01-15 2021-07-22 Monday.Com Digital processing systems and methods for graphical dynamic table gauges in collaborative work systems
WO2021161104A1 (en) 2020-02-12 2021-08-19 Monday.Com Enhanced display features in collaborative network systems, methods, and devices
WO2021024040A1 (en) * 2019-08-08 2021-02-11 Mann, Roy Digital processing systems and methods for automatic relationship recognition in tables of collaborative work systems
WO2021099839A1 (en) 2019-11-18 2021-05-27 Roy Mann Collaborative networking systems, methods, and devices
US11410129B2 (en) 2010-05-01 2022-08-09 Monday.com Ltd. Digital processing systems and methods for two-way syncing with third party applications in collaborative work systems
US11650972B1 (en) * 2015-12-02 2023-05-16 Wells Fargo Bank, N.A. Semantic compliance validation for blockchain
US11373248B1 (en) * 2017-05-09 2022-06-28 Pulse8, Inc. Method and apparatus for risk adjustment
US11106643B1 (en) * 2017-08-02 2021-08-31 Synchrony Bank System and method for integrating systems to implement data quality processing
US11436359B2 (en) 2018-07-04 2022-09-06 Monday.com Ltd. System and method for managing permissions of users for a single data type column-oriented data structure
US11698890B2 (en) 2018-07-04 2023-07-11 Monday.com Ltd. System and method for generating a column-oriented data structure repository for columns of single data types
US11194783B2 (en) 2018-09-05 2021-12-07 International Business Machines Corporation Multiple parameter based composite rule wise data validation in cloud hybrid model
US11249978B2 (en) 2018-11-29 2022-02-15 Kyndryl, Inc. Multiple parameter based composite rule data validation
CN112148391A (zh) * 2019-06-26 2020-12-29 北京百度网讯科技有限公司 生成基于芯片的计算功能的方法、装置、设备和存储介质
US11165810B2 (en) 2019-08-27 2021-11-02 International Business Machines Corporation Password/sensitive data management in a container based eco system
US11361156B2 (en) 2019-11-18 2022-06-14 Monday.Com Digital processing systems and methods for real-time status aggregation in collaborative work systems
WO2021107760A1 (en) * 2019-11-29 2021-06-03 Mimos Berhad System and method for dynamically processing data into a knowledge base repository
US11494291B2 (en) 2019-12-20 2022-11-08 UiPath, Inc. System and computer-implemented method for analyzing test automation workflow of robotic process automation (RPA)
US20210191367A1 (en) * 2019-12-20 2021-06-24 UiPath, Inc. System and computer-implemented method for analyzing a robotic process automation (rpa) workflow
CN113468401B (zh) * 2020-03-31 2023-04-28 中移系统集成有限公司 局数据核查制作方法、装置、计算机设备和存储介质
EP4143732A1 (en) 2020-05-01 2023-03-08 Monday.com Ltd. Digital processing systems and methods for enhanced collaborative workflow and networking systems, methods, and devices
US20240184989A1 (en) 2020-05-01 2024-06-06 Monday.com Ltd. Digital processing systems and methods for virtualfile-based electronic white board in collaborative work systems systems
US11277361B2 (en) 2020-05-03 2022-03-15 Monday.com Ltd. Digital processing systems and methods for variable hang-time for social layer messages in collaborative work systems
CN111639077B (zh) * 2020-05-15 2024-03-22 杭州数梦工场科技有限公司 数据治理方法、装置、电子设备、存储介质
CN111813399B (zh) * 2020-07-23 2022-05-31 平安医疗健康管理股份有限公司 基于机器学习的审核规则处理方法、装置及计算机设备
US11455588B2 (en) * 2020-09-04 2022-09-27 TADA Cognitive Solutions, LLC Data validation and master network techniques
US11531452B2 (en) 2021-01-14 2022-12-20 Monday.com Ltd. Digital processing systems and methods for group-based document edit tracking in collaborative work systems
US12056664B2 (en) 2021-08-17 2024-08-06 Monday.com Ltd. Digital processing systems and methods for external events trigger automatic text-based document alterations in collaborative work systems
US12105948B2 (en) 2021-10-29 2024-10-01 Monday.com Ltd. Digital processing systems and methods for display navigation mini maps
KR102437098B1 (ko) 2022-04-15 2022-08-25 이찬영 인공 지능 기반의 오류 데이터 판정 방법 및 그 장치
US11741071B1 (en) 2022-12-28 2023-08-29 Monday.com Ltd. Digital processing systems and methods for navigating and viewing displayed content
US11886683B1 (en) 2022-12-30 2024-01-30 Monday.com Ltd Digital processing systems and methods for presenting board graphics
US11893381B1 (en) 2023-02-21 2024-02-06 Monday.com Ltd Digital processing systems and methods for reducing file bundle sizes
US12111790B1 (en) * 2023-06-30 2024-10-08 Citibank, N.A. Automatic validation of input files
US12056255B1 (en) 2023-11-28 2024-08-06 Monday.com Ltd. Digital processing systems and methods for facilitating the development and implementation of applications in conjunction with a serverless environment

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1131042A (ja) * 1997-07-11 1999-02-02 Hitachi Ltd コード表データ作成時の属性即時チェック方法及び装置
US6535883B1 (en) * 1999-08-04 2003-03-18 Mdsi Software Srl System and method for creating validation rules used to confirm input data
US20050066263A1 (en) * 2003-09-23 2005-03-24 Baugher Ernest S. System and method for generating data validation rules
US20100100220A1 (en) * 2005-06-09 2010-04-22 Belanger David G Arrangement for guiding user design of comprehensive product solution using on-the-fly data validation
US20110145005A1 (en) * 2009-12-10 2011-06-16 Wu Cao Method and system for automatic business content discovery
US20120158625A1 (en) * 2010-12-16 2012-06-21 International Business Machines Corporation Creating and Processing a Data Rule

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5446885A (en) * 1992-05-15 1995-08-29 International Business Machines Corporation Event driven management information system with rule-based applications structure stored in a relational database
US20020078435A1 (en) * 1999-10-15 2002-06-20 Pamela P. Liu Table driven configurator on internet
US20050144166A1 (en) * 2003-11-26 2005-06-30 Frederic Chapus Method for assisting in automated conversion of data and associated metadata
US20040083199A1 (en) * 2002-08-07 2004-04-29 Govindugari Diwakar R. Method and architecture for data transformation, normalization, profiling, cleansing and validation
US7698441B2 (en) * 2002-10-03 2010-04-13 International Business Machines Corporation Intelligent use of user data to pre-emptively prevent execution of a query violating access controls
WO2006039516A2 (en) * 2004-09-30 2006-04-13 Millennium It (Usa) Inc. System and method for configurable trading system
US8069129B2 (en) 2007-04-10 2011-11-29 Ab Initio Technology Llc Editing and compiling business rules
US8166000B2 (en) * 2007-06-27 2012-04-24 International Business Machines Corporation Using a data mining algorithm to generate format rules used to validate data sets
US8386999B2 (en) * 2007-08-09 2013-02-26 Infonovus Technologies, Llc Method and system for analyzing a software design
CN101482864B (zh) * 2008-01-08 2012-07-25 国际商业机器公司 用于检验gis数据的正确性的方法和装置
US8090737B2 (en) * 2009-03-26 2012-01-03 International Business Machines Corporation User dictionary term criteria conditions
US8468167B2 (en) * 2010-10-25 2013-06-18 Corelogic, Inc. Automatic data validation and correction
CN103348598B (zh) 2011-01-28 2017-07-14 起元科技有限公司 生成数据模式信息
US8818893B2 (en) * 2011-06-14 2014-08-26 Bank Of America Corporation Dynamic payment generator
US8943059B2 (en) * 2011-12-21 2015-01-27 Sap Se Systems and methods for merging source records in accordance with survivorship rules
US10489360B2 (en) 2012-10-17 2019-11-26 Ab Initio Technology Llc Specifying and applying rules to data
US9323748B2 (en) * 2012-10-22 2016-04-26 Ab Initio Technology Llc Profiling data with location information
US9317484B1 (en) * 2012-12-19 2016-04-19 Emc Corporation Page-independent multi-field validation in document capture
US9558230B2 (en) * 2013-02-12 2017-01-31 International Business Machines Corporation Data quality assessment
US10346388B2 (en) * 2013-05-03 2019-07-09 Sap Se Performance and quality optimized architecture for cloud applications
US9355136B2 (en) * 2013-05-06 2016-05-31 International Business Machines Corporation Automating generation of messages in accordance with a standard
US10769122B2 (en) 2014-03-13 2020-09-08 Ab Initio Technology Llc Specifying and applying logical validation rules to data

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1131042A (ja) * 1997-07-11 1999-02-02 Hitachi Ltd コード表データ作成時の属性即時チェック方法及び装置
US6535883B1 (en) * 1999-08-04 2003-03-18 Mdsi Software Srl System and method for creating validation rules used to confirm input data
US20050066263A1 (en) * 2003-09-23 2005-03-24 Baugher Ernest S. System and method for generating data validation rules
US20100100220A1 (en) * 2005-06-09 2010-04-22 Belanger David G Arrangement for guiding user design of comprehensive product solution using on-the-fly data validation
US20110145005A1 (en) * 2009-12-10 2011-06-16 Wu Cao Method and system for automatic business content discovery
US20120158625A1 (en) * 2010-12-16 2012-06-21 International Business Machines Corporation Creating and Processing a Data Rule

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10769122B2 (en) 2014-03-13 2020-09-08 Ab Initio Technology Llc Specifying and applying logical validation rules to data
JP2023501098A (ja) * 2019-11-10 2023-01-18 タブロー ソフトウェア,インコーポレイテッド セマンティックロールを用いたデータプレパレーション

Also Published As

Publication number Publication date
EP3117378A1 (en) 2017-01-18
US20150261796A1 (en) 2015-09-17
JP6916403B2 (ja) 2021-08-11
WO2015138666A1 (en) 2015-09-17
AU2015229419A1 (en) 2016-09-22
CA2940444A1 (en) 2015-09-17
CN106104472B (zh) 2021-11-05
US10769122B2 (en) 2020-09-08
KR102411550B1 (ko) 2022-06-20
SG10201911946SA (en) 2020-02-27
KR20160133477A (ko) 2016-11-22
CN106104472A (zh) 2016-11-09
SG11201606457YA (en) 2016-09-29
CA2940444C (en) 2023-08-15
JP2021099819A (ja) 2021-07-01

Similar Documents

Publication Publication Date Title
JP6916403B2 (ja) データへの論理的妥当性検査規則の指定および適用
US20200301897A1 (en) Specifying and applying rules to data
JP6720144B2 (ja) 条件付き検証規則
US10013439B2 (en) Automatic generation of instantiation rules to determine quality of data migration
US8615526B2 (en) Markup language based query and file generation
US10127264B1 (en) Techniques for automated data analysis
US9940182B1 (en) Business rule engine validation systems and related methods
US20100070893A1 (en) Data quality administration framework
US20130006683A1 (en) System and method of managing testing for a healthcare systems transition
JP6567043B2 (ja) 階層的なエンティティのための計算の管理
KR20150099456A (ko) 계층적으로 참조된 데이터 내의 컴포넌트를 필터링하는 방법 및 시스템

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180215

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181214

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181220

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20190320

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190620

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191120

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20200131

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200511

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20201029