JP2023517310A

JP2023517310A - スキーマからの最適化された論理の生成

Info

Publication number: JP2023517310A
Application number: JP2022553152A
Authority: JP
Inventors: ヨナ・エゲノルフ; マーシャル・エー・イスマン; イアン・シェクター
Original assignee: アビニシオテクノロジーエルエルシー
Priority date: 2020-03-06
Filing date: 2021-03-04
Publication date: 2023-04-25
Anticipated expiration: 2041-03-04
Also published as: US20220147529A1; US11734264B2; US11210285B2; US20210279043A1; MX2022011037A; CA3170453A1; CN117891869A; WO2021178665A1; CN115516443B; BR112022017705A2; US20240126748A1; CN115516443A; AU2021230348A1; EP4115301A1

Abstract

方法は、データセット間の関係、データセットに対する計算、又はデータセットの変換を指定するスキーマにアクセスすることと、データセットの中からデータセットを選択することと、スキーマから、選択されたデータセットに関連する他のデータセットを識別することと、を含む。データセットの属性が識別され、識別された属性及び属性間の関係を表す論理データが生成される。論理データは、開発環境に提供され、開発環境が、識別された属性を表す論理データの一部分へのアクセスを提供する。動作を実行するときに、識別された属性のうちの少なくとも１つを指定する仕様が、開発環境から受信される。仕様と、論理データによって表される識別された属性間の関係に基づいて、仕様において指定された属性のうちの少なくとも１つを有する少なくとも１つのデータセットに記憶装置からアクセスすることによって動作を実行するためのコンピュータプログラムが生成される。

Description

（優先権）
本出願は、２０２０年９月１８日に出願された米国特許出願第１７／０２５，７５１号及び２０２０年３月６日に出願された米国特許仮出願第６２／９８６，３７４号の優先権及び利益を主張するものであり、それらの各々の全容は参照により本明細書に組み込まれる。

（発明の分野）
本開示は、データベーススキーマなどのスキーマから論理を生成することに関する。

複雑な計算は、多くの場合、有向グラフを通るデータフローとして表すことができ、計算のコンポーネントは、グラフの頂点と関連付けられ、コンポーネント間のデータフローはグラフのリンク（弧、辺）に対応する。そのようなグラフベースの計算を実施するシステムは、「ＥｘｅｃｕｔｉｎｇＣｏｍｐｕｔａｔｉｏｎｓＥｘｐｒｅｓｓｅｄａｓＧｒａｐｈｓ」と題された米国特許第５，９６６，０７２号に記載されており、その全容は参照により本明細書に組み込まれる。場合によっては、頂点と関連付けられた計算は、「ビジネスルール」と称される人間が読み取れる形式で記述される。

データフローグラフを生成するための１つの技術は、ビジネスルールエディタを使用する。ビジネスルールエディタの例は、「ＥｄｉｔｉｎｇａｎｄＣｏｍｐｉｌｉｎｇＢｕｓｉｎｅｓｓＲｕｌｅｓ」と題された米国特許第８，０６９，１２９号に開示されており、その全容は参照により本明細書に組み込まれる。

概して、第１の態様では、開発環境を提供するためのデータ処理システムと、１つ以上の属性を有するデータセットを記憶する記憶装置とによって実装される方法であって、開発環境は、データセットの１つ以上の属性へのアクセスを提供し、方法は、スキーマにアクセスすることであって、スキーマは、スキーマにおいて表されるデータセット間の関係、データセットのうちの１つ以上に対する１つ以上の計算、又はデータセットのうちの１つ以上の１つ以上の変換を指定する、アクセスすることと、データセットの中から、記憶装置の中の複数のデータセットを識別することであって、識別することが、データセットの中からデータセットを選択することと、スキーマから、選択されたデータセットに関連する１つ以上の他のデータセットを識別することと、によって行われる、識別することと、複数のデータセットの属性を識別することと、複数のデータセットの識別された属性を表し、属性間の１つ以上の関係を更に表す論理データを生成することと、開発環境に、論理データを提供することと、開発環境によって、複数のデータセットの識別された属性を表す論理データのうちの１つ以上の部分へのアクセスを提供することと、開発環境から、動作を実行するときに、識別された属性のうちの少なくとも１つを指定する仕様を受信することと、指定と、論理データによって表される識別された属性間の１つ以上の関係とに基づいて、複数からの少なくとも１つのデータセットに記憶装置からアクセスすることによって動作を実行するように構成されているコンピュータプログラムを生成することとであって、アクセスされた少なくとも１つのデータセットが、仕様において指定された属性のうちの少なくとも１つを有する、生成することと、を含む。

概して、第２の態様では、第１の態様と組み合わせ可能であり、開発環境は、複数のデータセットに記憶装置からアクセスすることなく、論理データのうちの１つ以上の部分へのアクセスを提供する。

概して、第３の態様では、第１の態様又は第２の態様と組み合わせ可能であり、本方法は、仕様において指定された属性のうちの少なくとも１つを含む複数のデータセットから１つのデータセットを識別することと、識別されたデータセットに記憶装置からアクセスすることと、を含む。

概して、第４の態様では、第１～第３の態様のうちのいずれかと組み合わせ可能であり、本方法は、記憶装置からアクセスされた少なくとも１つのデータセットを使用してコンピュータプログラムを実行することを含む。

概して、第５の態様では、第１～第４の態様のうちのいずれかと組み合わせ可能であり、本方法は、仕様において指定された属性のうちの少なくとも１つを有する複数のデータセット内のデータセットのみに記憶装置からアクセスすることによって動作を実行するように構成されている最適化されたコンピュータプログラムを作り出すように、コンピュータプログラムを最適化することを含む。

概して、第６の態様では、第１～第５の態様のうちのいずれかと組み合わせ可能であり、１つ以上の属性は、複数のデータセットのフィールド名を含む。

概して、第７の態様では、第１～第６の態様のうちのいずれかと組み合わせ可能であり、１つ以上の属性は、記憶装置内の複数のデータセットにアクセスするための情報を含む。

概して、第８の態様では、第１～第７の態様のうちのいずれかと組み合わせ可能であり、本方法は、スキーマから、選択されたデータセットと１つ以上の他のデータセットとを結合するための１つ以上のパラメータを識別することを含む。

概して、第９の態様では、第１～８つの態様のうちのいずれかと組み合わせ可能であり、１つ以上のパラメータは、選択されたデータセットと１つ以上の他のデータセットのうちの少なくとも１つとを結合するためのキーを含む。

概して、第１０の態様では、第１～第９の態様のうちのいずれかと組み合わせ可能であり、本方法は、クライアントデバイスから、選択されたデータセットを指定する選択データを受信することを含む。

概して、第１１の態様では、第１～第１０の態様のうちのいずれかと組み合わせ可能であり、選択されたデータセットは、論理データのルートノードを含み、１つ以上の他のデータセットのうちの少なくとも１つは、選択されたデータセットに結合される。

概して、第１２の態様では、第１～第１１の態様のうちのいずれかと組み合わせ可能であり、データセットのうちの１つ以上に対する１つ以上の計算、又はデータセットのうちの１つ以上の１つ以上の変換は、複数のデータセットのうちの少なくとも１つの仮想フィールドを定義する。

概して、第１３の態様では、第１～第１２の態様のうちのいずれかと組み合わせ可能であり、本方法は、仕様と、論理データによって表される識別された属性間の１つ以上の関係とに基づいて動作を実行するように構成されている実行可能なデータフローグラフを生成することを含み、実行可能なデータフローグラフは、１つ以上の属性のうちの少なくとも１つを入力として含む。

概して、第１４の態様では、第１～第１３の態様のうちのいずれかと組み合わせ可能であり、本方法は、仕様において指定された属性のうちの少なくとも１つを含まない複数のデータセット内の少なくとも１つのデータセットに記憶装置からアクセスする動作をコンピュータプログラムから排除することを含む。

概して、第１５の態様では、第１～第１４の態様のうちのいずれかと組み合わせ可能であり、コンピュータプログラムは、複数の選択ステートメントによって少なくともいくつかのデータに記憶装置からアクセスするように構成され、選択ステートメントは、仕様において指定された属性のうちの少なくとも１つのみを選択するように最小化される。

概して、第１６の態様では、第１～第１５の態様のうちのいずれかと組み合わせ可能であり、開発環境は、論理データをデータソースとして読み取る。

概して、第１７の態様では、第１～第１６の態様のうちのいずれかと組み合わせ可能であり、コンピュータプログラムは、仕様において指定された属性のうちの少なくとも１つを有するデータセットのみに記憶装置からアクセスするように構成される。

概して、第１８の態様では、第１～第１７の態様のうちのいずれかと組み合わせ可能であり、開発環境と、１つ以上の属性を有するデータセットを記憶する記憶装置とを提供するためのシステムであって、開発環境は、データセットの１つ以上の属性へのアクセスを提供し、システムは、１つ以上のプロセッサと、１つ以上のプロセッサによって実行されると、１つ以上のプロセッサに動作を実行させるように動作可能な命令を記憶する１つ以上の記憶デバイスであって、動作は、スキーマにアクセスすることであって、スキーマは、スキーマにおいて表されるデータセット間の関係、データセットのうちの１つ以上に対する１つ以上の計算、又はデータセットのうちの１つ以上の１つ以上の変換を指定する、アクセスすることと、データセットの中から、複数のデータセットを識別することであって、識別することが、データセットの中からデータセットを選択することと、スキーマから、選択されたデータセットに関連する１つ以上の他のデータセットを識別することと、によって行われる、識別することと、複数のデータセットの属性を識別することと、複数のデータセットの識別された属性を表し、属性間の１つ以上の関係を更に表す論理データを生成することと、開発環境に、論理データを提供することと、開発環境によって、複数のデータセットの識別された属性を表す論理データのうちの１つ以上の部分へのアクセスを提供することと、開発環境から、動作を実行するときに、識別された属性のうちの少なくとも１つを指定する仕様を受信することと、仕様と、論理データによって表される識別された属性間の１つ以上の関係とに基づいて、複数からの少なくとも１つのデータセットに記憶装置からアクセスすることによって動作を実行するように構成されているコンピュータプログラムを生成することであって、アクセスされた少なくとも１つのデータセットが、仕様において指定された属性のうちの少なくとも１つを有する、生成することと、を含む１つ以上の記憶デバイスと、を備える。

概して、第１９の態様では、第１～第１８の態様のうちのいずれかと組み合わせ可能であり、非一時的コンピュータ可読記憶媒体は、命令を記憶しており、命令は、コンピューティングシステムに、スキーマにアクセスすることであって、スキーマは、スキーマにおいて表されるデータセット間の関係、データセットのうちの１つ以上に対する１つ以上の計算、又はデータセットのうちの１つ以上の１つ以上の変換を指定する、アクセスすることと、データセットの中から、記憶装置内の複数のデータセットを識別することであって、識別することが、データセットの中からデータセットを選択することと、スキーマから、選択されたデータセットに関連する１つ以上の他のデータセットを識別することと、によって行われる、識別することと、複数のデータセットの属性を識別することと、複数のデータセットの識別された属性を表し、属性間の１つ以上の関係を更に表す論理データを生成することと、開発環境に、論理データを提供することと、開発環境によって、複数のデータセットの識別された属性を表す論理データのうちの１つ以上の部分へのアクセスを提供することと、開発環境から、動作を実行するときに、識別された属性のうちの少なくとも１つを指定する仕様を受信することと、仕様と、論理データによって表される識別された属性間の１つ以上の関係とに基づいて、複数からの少なくとも１つのデータセットに記憶装置からアクセスすることによって動作を実行するように構成されているコンピュータプログラムを生成することであって、アクセスされた少なくとも１つのデータセットが、仕様において指定された属性のうちの少なくとも１つを有する、生成することと、を行わせる。

上記の実装形態のうちの１つ以上は、以下の利点のうちの１つ以上を提供し得る。本明細書に記載の技術は、データセットの属性に関する情報を含む論理データを生成するために、データセット及びデータセット間の関係に関する情報を使用する。開発環境において論理データをデータソースとして提供することによって、論理データは、物理データセット自体にアクセスする負担を伴わずに、データセットへの論理アクセスを提供することができる。このようにして、物理データセットにデータベース記憶装置からアクセスすることと関連する計算リソースの消費を低減することができる。それとは別に、計算論理は、実際のデータセットにアクセスする必要なくデータセットの属性を使用して開発環境を通して指定することができ、これにより、データセットを不要なアクセスから保護することが可能になる。すなわち、データセットは、計算論理を指定し、それからアプリケーションをコンパイルすることを依然として可能にしながら、データセットを含め、セキュアに保たれる。加えて、本明細書に記載の技術は、ユーザが、物理データセットにアクセスし処理するときに必要とされるオーバーヘッド及び処理時間を伴わず、論理データ内の属性を使用して計算論理を柔軟に開発する権限を与えられるため、開発環境のユーザの生産性を改善することができる。

計算論理が開発されると、本明細書に記載の技術により、論理を高度に最適化された様式で処理することが可能になる。例えば、ユーザは、計算論理を開発するときに、原則として、不要であることが判明した多数のデータセットを考慮するか又はアクセスし得る。論理データによって提供される情報を使用して、データフローグラフなどのアプリケーションを生成することができ、アプリケーションは、所望の出力を作成するために処理において必要とされるデータのサブセットのみを最小限にロードして結合することができる。そうすることで、本明細書に記載の技術は、論理を処理するために必要な計算リソースを低減しながら、計算論理の生成及び実行の速度を増加させる。

１つ以上の実装形態の詳細が、添付の図面及び以下の記載において明らかにされる。本明細書に記載のその他の特徴、目的、及び利点は、記載及び図面から、並びに特許請求の範囲から明らかになるであろう。

スキーマのブロック図である。論理データを作り出し、論理データを使用してコンピュータプログラムを生成するためのシステムのブロック図である。論理データを作り出すためのシステムのブロック図である。開発環境のブロック図である。開発環境のブロック図である。コンピュータプログラムを実行するためのシステムのブロック図である。論理データを作り出し、論理データを使用してコンピュータプログラムを生成するためのプロセスの図である。論理データを作り出すためのシステムのブロック図である。論理データを作り出すためのシステムのブロック図である。論理データを作り出すためのシステムのブロック図である。論理データを作り出し、論理データを使用してコンピュータプログラムを生成するためのシステムのブロック図である。論理データを作り出し、論理データを使用してコンピュータプログラムを生成するためのシステムのブロック図である。論理データを作り出し、論理データを使用してコンピュータプログラムを生成するためのシステムのブロック図である。論理データを作り出すためのシステムのブロック図である。論理データを作り出すためのシステムのブロック図である。コンピュータプログラムを生成するためのシステムのブロック図である。コンピュータプログラムを生成するためのシステムのブロック図である。コンピュータプログラムを生成するためのシステムのブロック図である。コンピュータプログラムを生成するためのシステムのブロック図である。コンピュータプログラムを生成するためのシステムのブロック図である。コンピュータプログラムを生成するためのシステムのブロック図である。コンピュータプログラムをテストするためのシステムのブロック図である。コンピュータプログラムをテストするためのシステムのブロック図である。コンピュータプログラムをテストするためのシステムのブロック図である。コンピュータプログラムをテストするためのシステムのブロック図である。コンピュータプログラムをテストするためのシステムのブロック図である。コンピュータプログラムをテストするためのシステムのブロック図である。コンピュータプログラムをテストするためのシステムのブロック図である。コンピュータプログラムをテストするためのシステムのブロック図である。開発環境のブロック図である。コンピュータプログラムを生成するためのシステムのブロック図である。コンピュータプログラムを実行するためのシステムのブロック図である。開発環境のブロック図である。コンピュータプログラムを生成するためのシステムのブロック図である。コンピュータプログラムを生成するためのシステムのブロック図である。コンピュータプログラムを生成するためのシステムのブロック図である。コンピュータプログラムを生成するためのシステムのブロック図である。論理データを作り出し、論理データを使用してコンピュータプログラムを生成するためのプロセスのフローチャートである。

本明細書には、記憶システム又はメモリに記憶された物理データセットを表す論理データを生成するためのシステムが記載される。論理データは、これらの物理データセットを、とりわけ、物理データセットの属性を含めることによって、これらの物理データセットの記憶場所のアドレスを指定するポインタを含めることによって、又は物理データセットにどのようにアクセスするかを表す他の情報を指定することによって、又はそれらの組み合わせによって表す。この例では、論理データ又は論理データの一部分は、どのデータセット（又はデータセットの属性）が使用され、アクセスされるかを指定する仕様の開発を可能にするために、開発環境においてアクセス可能である。概して、仕様は、データセット又はデータセットの属性に対して実行される動作（例えば、計算論理）を指定する。仕様は、コンピューティングシステム上で実行することができるコンピュータプログラム（例えば、実行可能なデータフローグラフ）にコンパイルされるか、さもなければそれを作成するために使用される。いくつかの例では、コンピュータプログラムは、実行可能なマシンコードを含む。論理データが、データセット又はそれらの属性に物理的にアクセスする必要なく開発環境においてアクセス可能であるため、論理データは、物理的負担を伴わずに論理アクセスを提供する。

便宜上、限定するものではないが、本明細書に記載の特徴のうちのいくつかの視覚表現は、特徴自体と称され得る。例えば、データフローグラフの視覚表現は、データフローグラフと称され得る。論理データの視覚表現は、論理データと称され得る。データベーススキーマの視覚表現は、データベーススキーマと称され得る。コンポーネントの視覚表現は、コンポーネントと称され得、以下同様である。

図１を参照すると、スキーマ２が示されており、スキーマ２は、記憶システムに記憶されたデータセット６ａ、６ｂ、６ｃ、６ｄの間の階層的関係などの関係４ａ、４ｂ、４ｃを指定する。いくつかの例では、スキーマ２は、データベース管理システム（Database Management System、ＤＢＭＳ）によってサポートされる形式言語でデータベースの構造を記述するデータベーススキーマである。スキーマ２は、記憶システムに記憶されたデータセット６ａ、６ｂ、６ｃ、６ｄ、及びそれらのデータセットの関係４ａ、４ｂ、４ｃに関する情報に基づいて生成することができる。いくつかの例では、記憶されたデータセットの各々に関する情報は、他の情報の中でもとりわけ、データセットの名前、データセットのアクセスパラメータ（例えば、ファイル名、場所）、データセットのレコードフォーマット、データセットに含まれるデータタイプ、又はそれらの組み合わせを含む。いくつかの例では、データセット間の関係に関する情報は、データセット間の関係のタイプ（例えば、関係４ｂ及び４ｃなどの１対１、１対多、関係４ａなどの多対多）若しくはデータセット内のデータを結合するためのキー（例えば、主キー、外部キー）、又はその両方についての情報など、データセットをどのように結合することができるかに関する情報を含む。

スキーマ２を生成するために使用される情報は、ユーザ（例えば、技術ユーザ）によって指定されるか、（例えば、記憶システムに結合された１つ以上のコンピューティングシステムによって）記憶システムから自動的に取得されるか、又はその両方が可能である。例えば、いくつかの例では、記憶システムに通信可能に結合された１つ以上のコンピューティングシステムは、データ検出技術、セマンティック検出技術、又は他の機械学習技術を使用してスキーマ２を生成するために、データセット６ａ、６ｂ、６ｃ、６ｄに関するメタデータ又は他の情報をインポートすることができる。いくつかの例では、情報を処理すること、データセット６ａ、６ｂ、６ｃ、６ｄのうちの１つ以上に対する計算又はデータセット６ａ、６ｂ、６ｃ、６ｄのうちの１つ以上の変換などが、（例えば、技術ユーザによって）指定され、スキーマ２に含まれる。例えば、スキーマ２は、計算又は動作を実行するための命令（又は動作を実行するために、実行可能なデータフローグラフなどのコンピュータプログラムを呼び出すための命令）を含む。これらの計算又は変換は、データセット６ａ、６ｂ、６ｃ、６ｄ内の既存のフィールドを修正し、データセット内に新しいフィールド（仮想フィールド又は計算フィールドと称されることもある）を作成し、又は完全に新しいデータセットを作成することができる。いくつかの例では、修正された又は新たに作成されたフィールド又はデータセットの値は、以下に記載されるように、ランタイム（例えば、フィールド又はデータセットを使用するコンピュータプログラムによって実行されるとき）までデータ入力されない。

図２Ａは、記憶システム１２及びクライアントデバイス１４を有する環境１０を示している。この例では、環境１０はまた、論理データジェネレータ１６を含んでいる。論理データジェネレータ１６は、例えば、実際の物理データセット（又は物理データセットに基づく論理データセット）の属性に関する情報を含む論理データを生成するように構成されている。この例では、論理データは、記憶システム１２からのデータセットへの物理アクセスを必要とせずに、例えば、記憶システム１２に記憶され得る物理データセットへの論理アクセスを提供する。この例では、論理アクセスとは、それ自体が記憶システム１２に記憶される物理データセットの属性のリスト又は他の仕様を指す。別の例では、論理データは、論理データで表される物理データセットが、記憶システム１２からアクセスされ得るアドレス又は場所を識別するポインタ若しくは他の情報、又は物理データセットにアクセスするための命令若しくはパラメータ、又はその両方を含み得る。

この例では、記憶システム１２は、論理データジェネレータ１６と通信するように構成され、論理データジェネレータに、他の情報の中でもとりわけ、物理データセットの位置を指定する情報、物理データセットの属性を指定する情報、物理データセットの間の関係を指定する情報、又は物理データセット自体、又はそれらの組み合わせなどの、論理データの生成に使用する情報を提供する。クライアントデバイス１４はまた、論理データジェネレータ１６と通信するように構成され、それにより、クライアントデバイス１４は、論理データジェネレータ１６に、他の情報の中でもとりわけ、論理データからどの物理的データセット又は物理データセットのどの属性を含む（又は省略する）のかを指定する情報、論理データのルートノードを指定する情報、又はそれらの組み合わせなど、論理データを生成するための情報を送信し得る。

環境１０はまた、開発環境１８を含み、開発環境１８は、ユーザ（例えば、開発環境１８に通信可能に結合され得るクライアントデバイス１４のユーザ）が、データフローグラフなどのコンピュータプログラムを生成する際に、論理データにおいて表されるどのデータセット（又はデータセットの属性）にユーザがアクセス又は使用したいかを指定するためのグラフィカルユーザインターフェース又は他のユーザインターフェースをユーザに提供する。開発環境１８は、グラフジェネレータ２２と結合され、グラフジェネレータ２２は、開発環境１８から受信した情報からデータフローグラフを生成するように構成されている。開発環境１８から受信した情報は、この情報がコンピュータプログラム（例えば、実行可能なデータフローグラフ）の機能を指定し、実行又はアプリケーション自体への仕様のコンパイル中にどのデータセット（又は属性）がアクセスされるべきかを指定するため、仕様と称されることが多い。

環境１０はまた、コンパイラ２４を含み、コンパイラ２４は、仕様及び／又はデータフローグラフを、データ処理システム２６によって（例えば、マシンコードで）実行可能なコンピュータプログラムにコンパイルするように構成されている。この例では、開発環境１８は、仕様をデータフローグラフを生成するグラフジェネレータ２２に送信し、グラフジェネレータ２２がデータフローグラフを生成する。次に、グラフジェネレータ２２は、データフローグラフをコンパイラ２４に送信し、コンパイラ２４は、データフローグラフをコンピュータプログラム（例えば、実行可能なデータフローグラフ）にコンパイルする。コンパイラ２４は、コンピュータプログラムを実行及び／又は記憶するために、コンピュータプログラムをデータ処理システム２６に送信する。この例では、コンピュータプログラムは、記憶システム１２から、属性が論理データに含まれた、又は仕様において指定された、又はその両方であった複数のデータセットのうちの少なくとも１つにアクセスするように構成されている。

図２Ｂを参照すると、環境２０は、環境１０の更なる詳細を示している。この例では、記憶システム１２は、スキーマ２１を論理データジェネレータ１６に送信する。データベーススキーマ２１は、階層関係など、記憶システム１２に記憶されたデータセット２１ａ、２１ｂ、２１ｃ、２１ｄの間の関係を指定する。例では、スキーマ２１は、データベーススキーマである。スキーマ２１は、図１を参照して記載されたスキーマ２と同じ又は類似であってもよい。

クライアントデバイス１４はまた、選択データ２３を論理データジェネレータ１６に送信する。選択データ２３は、ルートノード、例えば、論理データを定義する際に親ノードとなるデータセットを指定する。この例では、ルートノードは、論理データ内のルートノードである初期データセットを定義するパースペクティブである。この例では、パースペクティブは情報の抽出であり、スキーマ内に選択された開始点を指定する。パースペクティブは、スキーマ内に選択された開始点を含み、対象のルート論理エンティティを表す。選択データ２３を生成するために、クライアントデバイス１４は、グラフィカルユーザインターフェース２７を表示する。グラフィカルユーザインターフェース２７は、データセット部分２８と、データセット２１ｄが論理データのルートノードとして選択されることを表すアイコン２９ａで更新される選択されたパースペクティブ部分２９とを含む。データセット部分２８は、それぞれ、データセット２１ａ、２１ｂ、２１ｃ、２１ｄの視覚表現２８ａ、２８ｂ、２８ｃ、２８ｄを表示する。選択されたパースペクティブ部分２９は、ボタンであり得る選択可能な部分２９ｂを含む。選択可能な部分２９ｂが選択されると、ユーザは、視覚表現２８ａ、２８ｂ、２８ｃ、２８ｄのうちの１つを論理データのルートノードとして選択することができる。この例では、ユーザは視覚表現２８ｄを選択して、データセット２１ｄが論理データのルートノードであることを指定する。視覚表現２８ｄが選択され、選択可能な部分２９２ｂと対話されると、選択されたパースペクティブ部分２９は、データセット２１ｄが論理データのルートノードであることを指定するアイコン２８ａを表示するように更新される。選択データ２３は、ルートノードがデータセット２１ｄであることを指定する。

対象のルート論理エンティティが論理データに対して指定されると、論理データは、対象のそのルート論理エンティティに関連する他のデータセットの情報を含むように拡張される。本明細書に記載されるように、その、他の情報は、属性、フィールド、ソース、命令、パラメータ又は対象のルート論理エンティティ及び関連データセットへのポインタなどを含み得る。この例では、論理データは、対象のルート論理エンティティのフィールド及び対象のルート論理エンティティに関連する他のデータセットのフィールドのエントリを有するワイドレコードに具体化することができる。概して、ワイドレコードは、同じ構造内に保持される関連データのグループを含む。論理データはまた、対象の論理エンティティ及び他の関連データセットのメモリ内の物理的場所へのポインタなど、他の属性のワイドレコードに具体化することができる。

論理データジェネレータ１６は、スキーマ２１及び選択データ２３を使用して、論理データ２５を生成する。例えば、論理データジェネレータ１６は、データセット２１ｄがルートノードであることを特定する選択データ２３を受信し、データセット２１ｄの属性又は利用可能なフィールドに関する情報を論理データ２５に含める。いくつかの例では、情報は、データセット２１ｄの利用可能な属性又はフィールドのベクトルを含む。論理データジェネレータ１６は、スキーマ２１を使用して、データセット２１ｄに関連する他のデータセットを識別する。例えば、この例では、論理データジェネレータ１６は、データセット２１ａ、２１ｂ、２１ｃがデータセット２１ｄに関連していると判定し、したがって、データセット２１ａ、２１ｂ、及び２１ｃの属性又は利用可能なフィールドに関する情報を論理データ２５に含める。この例では、論理データ２５は、データセット２１ａ、２１ｂ、及び２１ｃの各々の属性又は利用可能なフィールドを指定するベクトルを含む。属性又は利用可能なフィールドのこれらのベクトルは、フィールド自体内のフィールド又はデータに実際にアクセスすることなく、属性又はフィールド名を指定し、属性又はフィールド名にどのようにアクセスするかを命令し、さもなければ属性又はフィールド名を表す。このため、論理データ２５は、記憶システム１２からこれらのデータセットに実際にアクセスする物理的負担を伴わずに、データセット２１ａ、２１ｂ、２１ｃ、及び２１ｄへの論理アクセスを提供する。

図２Ｃを参照すると、環境３０は、論理データ２５を受信する開発環境１８を示している。例えば、開発環境１８は、論理データジェネレータ１６から、又は記憶装置（例えば、記憶システム１２）から論理データ２５を受信する。この例では、ビジネスルールエディタインターフェース３２が、ビジネスルール及び他の論理ルールを定義するために開発環境１８によって生成される。概して、エディタインターフェース３２は、式を含むセルをグラフィカルに識別し得る。これは、ユーザが、それ自体で真又は偽に評価されることになる式と、列変数に対して比較される値を返す式との間の差を理解するのに役立つことになる。ユーザがタイプ入力しているとき、ユーザは、例えば、式の始めにアスタリスクをタイプ入力することによって、特定のセルが式セルであることを示すことができる。この例では、エディタインターフェース３２は、入力部分３３及びルール定義部分３４を含む。入力部分３３は、それらの属性（例えば、フィールド）及び論理データ２５において表されるデータセット、並びに他のデータソース（論理データに対応してもしていなくてもよい）の視覚表現を提供する。例えば、入力部分３３は、データセット２１ａ（図２Ｂに示される）を表す視覚表現３５を含む。入力部分３３はまた、データセット２１ａの「フィールドＡ」を表す視覚表現３５ａを含む。この例では、視覚表現３５ａは、視覚表現３５からインデントされることによって、データセット２１ａ内のフィールドであるように視覚的に描かれている。入力部分３３はまた、それぞれ、データセット２１ｂ及びデータセット２１ｂ内の「フィールドＢ」を表す視覚表現３６及び３６ａを含む。入力部分３３はまた、それぞれ、データセット２１ｃ及びデータセット２１ｃ内の「フィールドＣ」を表す視覚表現３７及び３７ａを含む。入力部分３３はまた、それぞれ、データセット２１ｄ及びデータセット２１ｄ内の「フィールドＤ」を表す視覚表現３８及び３８ａを含む。この例では、入力部分３３内の視覚表現は、ビジネスルールを定義する際にユーザに利用可能なデータセット及びフィールドを表す。入力部分３３に表される利用可能なデータセット及びフィールドは、論理データ２５から識別され、それによって、物理的メモリからデータセット（又はフィールド）にアクセスする必要なくデータセット及びフィールドへのアクセスをユーザに提供する。

ルール定義部分３４は、一連のルールケースを含む。この例では、ルール定義部分３４は、スプレッドシートフォーマットを含む。スプレッドシート内のトリガ列は、利用可能なデータ値に対応し、行は、ルールケース、例えば、利用可能なデータ値を関連付ける基準のセットに対応する。ルールケースは、所与のレコードのデータ値が、ルールケースが基準を有する各トリガ列のトリガ基準を満たす場合、そのレコードに適用される。ルールケースが適用される場合、出力列に基づいて出力が生成される。その入力関係の全てが満たされているルールケースは、「トリガされた」と称され得る。出力列は、潜在的な出力変数に対応し、該当する行の対応するセル内の値は、もしあれば、その変数の出力を決定する。セルは、変数に割り当てられた値を含むことができ、又は以下で考察されるように、出力値を生成するために評価されなければならない式を含むことができる。図２Ｃには１つのみが示されているが、２つ以上の出力列があってもよい。

ルール定義部分３４内のセルの入力を指定することによってルールの定義が完了すると、開発環境１８は、ルールケースを指定し、ルールを実装するためにどのフィールドがアクセスする必要があるかを指定するルール仕様３９ａを生成する。しかしながら、ルールを定義するこの段階では、論理データ２５は、ユーザに、物理アクセスなしにそれらのフィールドへの論理アクセスを提供する。例えば、ユーザは、入力部分３３内の記憶システム１２に記憶された様々なデータセットから利用可能なフィールドを閲覧することができることによって、論理アクセスが提供された。開発環境１８は、ルール仕様３９ａをグラフジェネレータ２２に送信する。開発環境１８はまた、論理データ２５をグラフジェネレータ２２に送信する。

図２Ｄを参照すると、環境４０は、開発環境１８の別の例を示している。この例では、開発環境１８は、コンポーネント部分４２、入力部分４３、及びキャンバス区画４４を有するグラフィカルユーザインターフェース４１を描画している。コンポーネント部分４２は、計算論理を定義するために利用可能な様々な動作を表す視覚表現４２ａ～４２ｆを含む。入力部分４３は、論理データ２５において表されるデータセット及び属性（例えば、フィールド）の視覚表現４５、４５ａ、４６、４６ａ、４７、４７ａ、４８ｂ、４８ａを表示している。入力部分４３はまた、他のデータソース（例えば、論理データ２５以外のデータソース）において表されるデータセット及びフィールドの視覚表現４９及び４９ａを表示している。すなわち、入力部分４３内の視覚表現は、計算論理を定義するために利用可能なデータセット及びフィールドを表す。

キャンバス部分４４は、データフローグラフの形態で計算論理を定義するために使用され、視覚化４４ａとして視覚的に描かれる（以下、便宜上、限定することなく、「データフローグラフ４４ａ」と称される）。視覚化４４ａによって表されるデータフローグラフは、ノードを有するデータ構造を含む。ノードの各々は、少なくとも１つの動作プレースホルダフィールド及び少なくとも１つのデータプレースホルダフィールドを含み、これらは、キャンバス部分４４においてユーザによって指定された動作及びデータ（例えば、論理データ、「データセットＶ」などの他のデータソース）が入力される。この例では、データフローグラフ４４ａは、視覚表現４２ａ～４２ｆのうちの１つ以上を、コンポーネント部分４２からキャンバス部分４４上にドラッグ及びドロップすることによって生成される。視覚表現４２ａ～４２ｆの各々は、データ構造によって又はデータ構造に対して実行される動作を表す。視覚表現がキャンバス部分４４上に配置されると、それらは、キャンバス部分４４上のアイコンになる。開発環境１８は、データフローグラフ４４ａによって視覚的に表される計算論理を使用して、仕様３９ｂを生成する。仕様３９ｂは、キャンバス部分４４において視覚的に描かれた計算論理を指定する。開発環境１８は、仕様３９ｂ及び論理データ２５をグラフジェネレータ２２に送信する。グラフジェネレータ２２は、仕様３９ｂ及び論理データ２５を使用して、以下に記載のように、データフローグラフ４４ａの各ノードの動作フィールド及びデータプレースホルダフィールドにデータ入力することができる。

図２Ｅを参照すると、環境５０は、環境１０の更なる詳細を示している。この例では、グラフジェネレータ２２は、開発環境１８（例えば、仕様及び論理データ）から受信した情報からデータフローグラフ５２を生成する。コンパイラ２４は、データフローグラフ５２を受信し、それを実行可能プログラム５４（例えば、実行可能なデータフローグラフなどのコンピュータプログラム）にコンパイルする。コンパイラ２４は、実行可能プログラム５４を、コンピュータプログラムの実行及び／又は記憶のためにデータ処理システム２６に送信する。この例では、コンピュータプログラムは、記憶システム１２から、属性が論理データに含まれた、又は仕様において指定された、又はその両方であった複数のデータセットのうちの少なくとも１つにアクセスするように構成されている。

図３を参照すると、スイムレーン図３００は、論理データを生成し、その論理データを使用して、最適化されたデータフローグラフを生成するためのプロセスを例示している。動作中、記憶システム１２は、スキーマを論理データジェネレータ１６に送信する（３０２）。論理データジェネレータ１６は、スキーマを受信する（３０４）。論理データジェネレータ１６は、スキーマを表すデータを提示するためのグラフィカルユーザインターフェース（Graphical User Interface、ＧＵＩ）データを生成する（３０６）。論理データジェネレータ１６は、ＧＵＩデータをクライアントデバイス１４に送信する（３０８）。クライアントデバイス１４は、ユーザに表示されるようにＧＵＩデータを描画する（３１０）。クライアントデバイス１４は、（例えば、クライアントデバイス上に描画されたＧＵＩと対話するユーザから）ルートノード選択データを受信する（３１２）。ルートノード選択データは、論理データのルートノードに選択されるデータセットを指定するデータを含む。クライアントデバイス１４は、ルートノード選択データを論理データジェネレート１６に送信する（３１４）。論理データジェネレータ１６は、ルートノード選択データを受信する（３１６）。次いで、論理データジェネレータ１６は、受信したルートノード選択データ及びスキーマを使用して論理データを生成する（３１８）。論理データジェネレータ１６は、論理データを開発環境１８及びグラフジェネレータ２２に送信する（３２０）。いくつかの例では、論理データジェネレータ１６は、論理データを開発環境１８に送信し、次いで、開発環境１８が、論理データをグラフジェネレート２２に渡す。

開発環境１８及びグラフジェネレータ２２の各々は、論理データを受信する（３２２、３２４）。開発環境１８は、論理データのフィールド又は他の属性を表示するためのＧＵＩデータを生成する（３２６）。開発環境１８は、ＧＵＩデータをクライアントデバイス１４に送信する（３２８）。ＧＵＩデータは、フィールド属性などの属性、又は論理データに含まれる他の属性を表し、それにより、物理的負担を伴わずに論理アクセスを提供する。クライアントデバイス１４は、受信されたＧＵＩデータを描画し（３３０）、選択されたフィールド、データセット、又は他の属性を指定する選択データを受信する（３３２）。明確にするために、本明細書に記載の選択されたフィールド又はデータセットは、論理データ自体から選択された情報を指す。いくつかの例では、選択データはまた、選択されたフィールドに対して実行される動作又は論理を指定する。クライアントデバイス１４は、選択されたファイルを指定する選択データを開発環境１８に送信する（３３４）。開発環境１８は、選択されたフィールドを指定する選択データを受信し（３３６）、選択されたフィールド（及び選択されたフィールドに対して実行される動作）で仕様を生成する（３３８）。開発環境１８は、仕様をグラフジェネレータ２２に送信する（３４０）。

グラフジェネレータ２２は、仕様（１０２）を受信する（３４２）。グラフジェネレータ２２は、仕様及び論理データを使用してデータフローグラフを生成する（３４４）。概して、データフローグラフ（又は永続的コンピュータプログラム）は、以下のような仕様から生成される。仕様は、構造化データ項目（例えば、データレコード）内の１つ以上のフィールドの１つ以上の値を処理するためにコンピュータプログラムによって実装される複数のモジュールを指定する。これらの複数のモジュールは、ルール、命令、データフローグラフのコンポーネントなどを含み得る。本明細書に記載のシステムは、仕様を、複数のモジュールを実装するコンピュータプログラムに変換し、変換することは、複数のモジュールのうちの１つ以上の第１のモジュールの各々について、第１のモジュールの出力に少なくとも部分的に基づく入力を各々が受信する複数のモジュールのうちの１つ以上の第２のモジュールを識別することと、各々が（ｉ）第１のモジュールにアクセス可能であり、（ｉｉ）第１のモジュールの出力に少なくとも部分的に基づいて１つ以上の第２のモジュールのうちの少なくとも１つへの入力として指定される構造化データ項目の１つ以上のフィールドの１つ以上の値のみを第１のモジュールが出力するように、第１のモジュールの出力データフォーマットをフォーマットすることと、「ＴｒａｎｓｆｏｒｍｉｎｇａＳｐｅｃｉｆｉｃａｔｉｏｎｉｎｔｏａＰｅｒｓｉｓｔｅｎｔＣｏｍｐｕｔｅｒＰｒｏｇｒａｍ」と題された米国特許出願公開第２０１９／０１３００４８（Ａ１）号に記載されているように、１つ以上の第１のモジュールの各々についてフォーマットされた出力データフォーマットを指定する保存されたコンピュータプログラムを用いて、コンピュータプログラムを永続メモリに保存することとを含み、その全容は参照により本明細書に組み込まれる。システムはまた、各モジュールのコンテンツがコンピュータプログラムに含まれ、かつ／又はコンピュータプログラムの適切なフォーマットにある命令に変換されることを指定する様々なルールを含む。この例では、グラフジェネレータ２２は、最初に、論理データにおいて表されるデータソースでデータフローグラフを生成する。グラフジェネレータ２２はまた、データフローグラフがデータシンクを必要とするため、データフローグラフにデータシンクを追加する。次いで、グラフジェネレータ２２は、データフローグラフに、ソートコンポーネントなどのデータフローグラフの計算効率を増加させるためにグラフジェネレータ２２が自動的に追加するように構成された様々なコンポーネントを追加する。グラフジェネレータ２２はまた、様々なデータソースからのデータを適切に結合するために、結合コンポーネントを追加するように構成されている。データソースにアクセス又は結合するための命令、パラメータ、又は他の情報を論理データに含めることができる。最後に、グラフジェネレータ２２は、仕様において指定された計算論理を含む変換コンポーネントを追加する。変換コンポーネント自体は、仕様が上記のようにデータフローグラフに変換されるとき、別のデータフローグラフを表す様々なコンポーネント又はサブコンポーネントを含み得る。

例では、グラフジェネレータ２２は、最適化されたデータフローグラフを生成するためにデータフローグラフを最適化する（３４６）。概して、グラフジェネレータ２２は、仕様を分析して、どのフィールド及び関連付けられたデータソース、仕様がアクセスされているかを識別しているかを識別することによって、データフローグラフを最適化するオプティマイザを実行する。次に、オプティマイザは、フィールドが仕様において参照されていないデータソースを識別し、オプティマイザは、データフローグラフから、フィールドが仕様において参照されていないデータソースを除去する。いくつかの例では、オプティマイザは、仕様において参照されるデータセット及びフィールドのみが取り出されるように、選択ステートメント（例えば、データベースの言語で発行されたデータベース選択ステートメント）を最小化する。いくつかの例では、オプティマイザは、「ＳｙｓｔｅｍｓａｎｄＭｅｔｈｏｄｓｆｏｒＤａｔａｆｌｏｗＧｒａｐｈＯｐｔｉｍｉｚａｔｉｏｎ」と題された米国特許出願第２０１９／０３７０４０７（Ａ１）号に記載されるように、一連の最適化ルールを適用することによってこれを行い、その全容は参照により本明細書に組み込まれる。そうすることで、オプティマイザは、所望の出力を作成するために論理データが論理アクセスを提供するデータのサブセットのみを最小限にロードし結合するデータフローグラフを作成することができる。オプティマイザはまた、計算効率を改善するために、データフローグラフ内のコンポーネントの順序を再配置するなど、他の最適化を実行し得る。例えば、フィルタコンポーネントが結合コンポーネントの前にくることが計算上より効率的であり得、その結果、結合コンポーネントは最終的にフィルタ除去されるデータを結合しない。こうして、オプティマイザは、フィルタコンポーネントを結合コンポーネントの前にくるように移動させ得る。

図４Ａを参照すると、環境６０は、論理データ２３を使用してデータセット２１ｄを論理データのルートノードとして識別する論理データジェネレータ１６を例示している。これは、図４Ａにおいて星印及び輪郭付けされているデータセット２１ｄによって示されている。論理データジェネレータ１６はまた、データセット２１ｄに関連する他のデータセットを識別するためにスキーマ２１を使用する。他の関連データセットは、データセット２１ａ、２１ｂ、及び２１ｃを含む。データセット２１ｄをルートノードとして使用して、論理データジェネレータ１６は、論理データ２５を生成する。前述のように、論理データ２５は、データセット２１ｄが論理データ２５のパースペクティブ又はルートノードであることを指定するエントリ２５ａを含む。エントリ２５ａは、データセット２１ｄのフィールド及び／又は属性を含む。データセット（例えば、データセット２１ｄ）の属性は、データセット内のフィールドの名前、又はデータセット内のフィールドを表す他の情報を含むことができる。他の情報の中でもデータセット２１ｄ内のフィールドの名前を含めることによって、論理データ２５は、記憶装置内のデータセット２１ｄに物理的にアクセスする必要なく、データセット２１ｄ内のフィールドへのアクセスを提供する。論理データ２５はまた、それぞれ、データセット２１ｃ、２１ｂ、及び２１ａに対応するエントリ２５ｂ、２５ｃ、及び２５ｄを含む。この例では、エントリ２５ｂ、２５ｃ、２５ｄは、データセット２１ｄとの関係に従って順序付けられる。この例では、データセット２１ｄはルートノードであり、データセット２１ｃは子ノードである。こうして、データセット２１ｃを表すエントリ２５ｂは、論理データ２５においてエントリ２５ａの直下に順序付けられる。加えて、データセット２１ａ、２１ｂは、データセット２１ｃの子である。こうして、エントリ２５ｃ、２５ｄは、データセット２１ａ、２１ｂ、及び２１ｃの間の関係を表すために、エントリ２５ｂの下に順序付けられている。エントリ２５ｂ、２５ｃ、及び２５ｄの各々は、それぞれのデータセットの属性及び／又はフィールドを含む。前述のように、これらの属性及び／又はフィールドは、フィールドの名前又は他の識別情報であり得、これにより、論理データ２５が、データセットデータセット２１ａ、２１ｂ、２１ｃ、及び２１ｄに記憶装置から実際にアクセスする負担を伴わずに、それらのデータセットへの論理アクセスを提供することが可能になる。論理データ２５は、データセット２１ａ、２１ｂ、２１ｃ、及び２１ｄの属性又はフィールドを識別するために使用することができ、かつ／又は必要に応じてそれらのデータセットにアクセスするために使用することができる情報を含むため、論理アクセスを提供することができる。

図４Ｂを参照すると、環境７０は、環境６０（図４Ａ）の変動を示し、環境７０において、データセット２１ｂが、破線及び星印の輪郭によって示されるように、ルートノードとして選択されている。データセット２１ｂは、例えば、ユーザが図２Ｂの視覚表現２８ｂを選択するときに、ルートノードとして選択される。データセット２１ｂがルートノードとして選択されると、論理データジェネレータ１６は、論理データ７２を生成し、論理データ７２において、図４Ａに示されるように、データセット２１ｂがルートノードとして指定され、論理データにおける他のデータセットの順序が、論理データ２５におけるデータセットの順序に対して変更されている。この例では、論理データ７２は、データセット２１ｂを表すエントリ７２ａを含む。この例では、データセット２１ｂは、データセット２１ｃの子であり、エントリ７２ｂは、データセット２１ｃを表す論理データ７２に含まれる。データセット２１ａは、データセット２１ｃの子であり、エントリ７２ｃは、データセット２１ａを表す論理データ７２に含まれる。データセット２１ｃは、データセット２１ｄの子であり、エントリ７２ｄは、データセット２１ｄを表す論理データ７２に含まれる。図４Ａを参照して上述したように、エントリ７２ａ、７２ｂ、７２ｃ、及び７２ｄの各々は、それぞれのデータセットの各々についての属性又はフィールドに関する情報、及び／又はデータセットの特性若しくはデータセットにどのようにアクセスするかを指定する他の情報を含む。

図４Ｃを参照すると、環境８０は、データベーススキーマ８４に対する論理データ８２の生成を例示している。この例では、論理データジェネレータ１６は、データベーススキーマ８４を受信し、また、（破線及び星印の輪郭によって示されるように）スキーマ８４においてデータセット８４ｄがルートノードであることを指定する選択データ２３を受信する。この例では、スキーマ８４は、データセット８４ａ、８４ｂ、８４ｃ、８４ｄ、及び８４ｅを含む。例では、スキーマ８４は、データセット８４ｄ（例えば、データセット８４ｄのフィールドのフィールド又は値）に対して計算を実行すること、さもなければデータセット８４ｄを変換してデータセット８４ｅを作り出すことを行うための命令を含む。例えば、スキーマ８４は、１つ以上の動作を実行するための命令、又は入力としてデータセット８４ｄ（又はその一部）を含み、出力としてデータセット８４ｅ（又はその一部）を作り出す実行可能プログラム（例えば、データフローグラフ）を呼び出す命令を含むことができ。いくつかの例では、これらの計算、変換、又は他の動作は、スキーマ８４において動作を指定する命令を含むことなどによって、スキーマ８４において直接定義される。いくつかの例では、スキーマ８４は、動作を実行する命令にアクセスするためのリンク、ポインタ、又は他の情報を含むことができる。いくつかの例では、これらの動作は以前に実行され、動作によって作り出されたデータセット８４ｅは、記憶システムに記憶された物理データセットである。いくつかの例では、データセット８４ｅは、１つ以上の計算された属性若しくは仮想属性、仮想フィールド、又は実行中にデータ入力される他の仮想要素（例えば、データセット８４ｅがデータフローグラフなどのコンピュータプログラムで使用されるとき）など、仮想データを含む。

データセット８４ｄがルートノードであるため、論理データジェネレータ１６は、エントリ８２ａ～８２ｅを有する論理データ８２を生成する。エントリ８２ａは、ルートノードであるデータセット８４ｄを表す。エントリ８２ａは、データセット８４ｄの属性を含むことができる。本明細書で前述したように、属性は、フィールドの名前、フィールドへのポインタなどを含む。データセット８４ｃ及び８４ｅがデータセット８４ｄの子であるため、論理データ８２における次のエントリは、データセット８４ｅを表すエントリ８２ｂ及びデータセット８４ｃを表すエントリ８２ｃである。エントリ８２ｂ及び８２ｅの各々は、フィールド属性を含む。データセット８４ａ及び８４ｂがデータセット８４ｃの子であるため、論理データ８２における次のエントリは、データセット８４ｂを表すエントリ８２ｄ及びデータセット８４ａを表すエントリ８２ｅである。エントリ８２ｄ及び８２ｅの各々は、フィールド属性を含む。

図５Ａを参照すると、環境９０は、論理データを生成し、論理データを使用して最適化されたデータフローグラフを生成する実際の実施例の概要を示している。この例では、論理ジェネレータ１６は、スキーマ９１を記憶システムから受信する。論理データジェネレータ１６はまた、クライアントデバイス１４から選択されたルートノードを示す選択データ９２を受信する。このスキーマ９１及び選択データ９２を使用して、論理データジェネレータ１６は、本明細書に記載の技術に従って論理データ９４を生成する。論理データジェネレータ１６は、論理データ９４を開発環境１８に送信する。この論理データ９４を使用して、開発環境１８は、記憶の基礎となる物理データセットにアクセスすることなく、属性又はフィールドなど、論理データ９４に含まれる情報を、（例えば、クライアントデバイス１４を使用して）開発環境１８と対話することができるユーザによって閲覧可能又はアクセス可能にするグラフィカルユーザインターフェース又は他のユーザインターフェースを生成する。ユーザは、選択された属性の実行又は使用のために、開発環境１８を使用して、論理データ９４内の属性のうちの少なくとも１つ並びに１つ以上の動作を選択する。この情報に基づいて、開発環境１８は、論理データ９４の属性及び／又はフィールドのうちのどれがデータフローグラフを生成する際に含まれるべきかを指定する仕様９６ａを作り出す。グラフジェネレータ２２は、論理データ９４及び仕様９６ａを受信し、仕様９６ａにおいて指定された属性と関連付けられた（さもなければ、仕様９６ａで動作を実行するために必要とされる）物理データセットのみにアクセスするように最適化されたデータフローグラフ９８ａを作り出す。

同じ又は異なるユーザが、開発環境１８を使用して、論理データ９４の１つ以上の異なる属性、選択された属性に対して実行する１つ以上の異なる動作、又はその両方を選択し得る。例えば、ユーザは、データフローグラフ９８ａの処理において識別されたエラーに応答して、仕様９６ａにおいて指定された選択された属性又は動作を変更してもよく、又は異なる属性及び動作を選択して、完全に新しいデータフローグラフを作り出してもよい。この情報を使用して、開発環境は、仕様９６ａとは異なる仕様９６ｂを作り出す。グラフジェネレータ２２は、論理データ９４及び仕様９６ｂを受信し、仕様９６ｂにおいて指定された属性と関連付けられた物理データセットのみにアクセスするために、データフローグラフ９８ａとは異なるように最適化されたデータフローグラフ９８ｂを作り出す。このようにして、論理データ９４は、そこに含まれるデータセット及び属性の全てへの論理アクセスを可能にするが、それを行う物理的負担を伴わない。これは、エンドユーザ（例えば、開発環境１８のユーザ）に多大な柔軟性を提供し、エンドユーザは、論理データ９４に含まれる全ての物理データを（そのようなデータに物理的にアクセスする負担を伴わずに）閲覧及び選択することができ、それらの仕様を遂行するために必要な物理データのみにアクセスするように個別対応された高度に最適化されたデータフローグラフを取得することができる。

図５Ｂを参照すると、環境１００は、環境９０の更なる詳細を示している。この例では、記憶システム１２は、スキーマ９１をデータセット１０１、１０２、１０３、１０４と共に記憶する。「オファー状況」データセット１０１は、「キー」フィールド１０１ａ及び「オファー受入」フィールド１０１ｂを含む。フィールド１０１ａは、例えば、主キー、外部キー、又はその両方（別個のフィールドで定義され得る）を含むことができる。「分数」データセット１０２は、フィールド１０２ａ、１０２ｂ、１０２ｃ、及び１０２ｄを含む。「顧客」データセット１０３は、フィールド１０３ａ及び１０３ｂを含む。「リロード日」データセット１０４は、フィールド１０４ａ及び１０４ｂを含む。この例では、「残りの分数」フィールド１０２ｄは、例えば、上記のようにスキーマ９１において定義された仮想フィールド又は計算フィールドである。例えば、スキーマ９１は、１つ以上の動作又は、データセット１０２若しくは別のデータセット内の１つ以上の他のフィールドからフィールド１０２ｄを生成する、他の命令を指定し得る。特に、スキーマ９１は、フィールド１０２ｂと１０２ｃとの間の差としてフィールド１０２ｄを定義し得る。この例では、正方形の括弧を使用して、フィールド１０２ｄが仮想フィールド又は計算フィールドであることを示している。この例では、データセット１０１、１０２、１０３、１０４は、それらのキーの値を介して互いに関連している。すなわち、データセット１０１、１０２、１０３、１０４の各々は、互いに一致するキーの値を有し、１つのデータセットからのデータを別のデータセットと結合するために使用することができる。

論理データジェネレータ１６は、スキーマ９１を記憶システム１２から受信する。クライアントデバイス１４は、（例えば、論理データジェネレータ１６（図示せず）から受信されたスキーマ９１にどのデータセットが含まれるかを指定するＧＵＩデータに基づいて）グラフィカルユーザインターフェース１０５を表示する。ＧＵＩ１０５は、データセット部分１０６及び選択されたパースペクティブ部分１０７を含む。データセット部分１０６は、それぞれ、データセット１０１、１０２、１０３、１０４の視覚表現１０６ａ、１０６ｂ、１０６ｃ、１０６ｄを含む。選択されたパースペクティブ部分１０７は、ボタン１０７ａを含み、その選択により、閲覧者が視覚表現１０６ａ～１０６ｄのうちの１つを選択することが可能になる。この例では、ユーザは、データセット１０３を表す視覚表現１０６ｃを選択している。これが選択されると、選択されたパースペクティブ部分１０７は、論理データジェネレータ１６によって生成される論理データのルートノードとしてデータセット１０７が選択されていることを指定しているアイコン１０７ｂで更新される。クライアントデバイス１４は、データセット１０３がルートノードとして選択されることを指定する選択データ９２を生成する。クライアントデバイス１４は、選択データ９２を論理データジェネレータ１６に送信する。論理データジェネレータ１６は、スキーマ９１及び選択データ９２を使用して、論理データ９４を作り出す。

図５Ｃを参照すると、環境１１０は、スキーマ９１及び選択データ９２から論理データ９４を生成する例示を示している。この例では、論理データ９４は、図５Ｂに示されるように、データセット１０１、１０２、１０３、１０４及びそれぞれのフィールドにどのようにアクセスするかを指定する一連の命令、パラメータ、又は他の情報を含む。いくつかの例では、論理データ９４は、命令、パラメータ、又はフィールド１０２ｄなどの仮想フィールド若しくは計算フィールドをどのように生成するか、さもなければどのようにアクセスするかを指定する他の情報を含む。いくつかの例では、論理データは、基礎となるデータセットの属性、フィールド、又は他の特徴を含むワイドレコードに具体化される。論理データジェネレータ１６は、論理データ９４を開発環境１８に送信する。

図５Ｄを参照すると、環境１２０は、ビジネスルール及び他の論理ルールを定義するために開発環境１８によって生成されたビジネスルールエディタインターフェース１２１の例を示している。概して、エディタインターフェース１２１は、式を含むセルをグラフィカルに識別し得る。これは、ユーザが、それ自体で真又は偽に評価されることになる式と、列変数に対して比較される値を返す式との間の差を理解するのに役立つことになる。ユーザがタイプ入力しているとき、ユーザは、例えば、式の始めにアスタリスクをタイプ入力することによって、特定のセルが式セルであることを示すことができる。この例では、エディタインターフェース１２１は、入力部分１２２及びルール定義部分１２３を含む。入力部分１２２は、論理データ９４で表されるフィールド及びデータセット（下向きの矢印によって示されるような拡張ビューに示されている）、並びに他のデータソースの視覚表現（右向きの矢印によって示されるような折り畳みビューに示されている）を提供する。例えば、入力部分１２２は、（図５Ｂに示される）データセット１０１を表す視覚表現１２４を含む。入力部分１２２はまた、データセット１０１において「オファー受入」フィールド１０１ｂを表す視覚表現１２４ａを含む。この例では、視覚表現１２４ａは、視覚表現１２４からインデントされることによって、データセット１０１においてフィールドであるとして視覚的に描かれている。入力部分１２２はまた、それぞれ、データセット１０２及びフィールド１０２ｂ、１０２ｃ、及び１０２ｄを表す視覚表現１２５及び１２５ａ、１２５ｂ、及び１２５ｃを含む。入力部分１２２はまた、それぞれ、データセット１０３及びフィールド８６ｂを表す視覚表現１２６及び１２６ａを含む。入力部分１２２はまた、それぞれ、データセット１０４及びフィールド１０４ｂを表す視覚表現１２７及び１２７ａを含む。この例では、入力部分１２２内の視覚表現は、ビジネスルールを定義する際にユーザに利用可能なデータセット及びフィールドを表す。入力部分１２２において表される利用可能なデータセット及びフィールドは、論理データ９４から識別され、それによって、データセット及びフィールドへのアクセスをユーザに提供するが、それらのデータセット（又はフィールド）に物理的メモリから実際にアクセスする必要はない。

ルール定義部分１２３は、一連のルールケースを含む。この例では、ルール定義部分１０６は、スプレッドシートフォーマットを含む。スプレッドシート内のトリガ列１２８ａ、１２８ｂ、及び１２８ｃは、利用可能なデータ値に対応し、行１２９ｃ～１２９ｇは、ルールケース、例えば、利用可能なデータ値を関連付ける基準のセットに対応している。ルールケースは、所与のレコードのデータ値が、ルールケースが基準を有する各トリガ列のトリガ基準を満たす場合、そのレコードに適用される。ルールケースが適用される場合、出力列１２９ａに基づいて出力が生成される。その入力関係の全てが満たされているルールケースは、「トリガされた」と称され得る。出力列１２９ａは、潜在的な出力変数に対応し、該当する行の対応するセル内の値は、その変数について、存在する場合、出力を決定する。セルは、変数に割り当てられた値を含むことができ、又は以下で考察されるように、出力値を生成するために評価されなければならない式を含むことができる。図５Ｄには１つのみが示されているが、２つ以上の出力列があってもよい。

特に、行１２９ａは、ルールの相対的な入力及び出力を指定する。行１２９ｂは、ルールを定義する際に使用されるフィールド及び出力が何であるかを指定する。この例では、行１２９ｂは、セル１２８ａ、１２８ｂ、及び１２８ｃを含む。セル１２８ａは、入力部分１２２において視覚表現１２６ａの周りの点線によって視覚的に描かれるように、視覚表現１２６ａのユーザ選択時にルール定義部分１２３に追加される。この選択の結果として、セル１２８ａは、「名前」フィールド１０３ｂｅが（図５Ｂに示される）、ルール定義部分１２３において指定されたルールを定義する際の入力として使用されることを指定する。セル１２８ｂは、「残りの分数」フィールド１０２ｄ（図５Ｂに示される）はまた、ルール定義１２３において示されるルールを定義する際の入力として使用されることを指定する。この例では、視覚表現１２５ｃが選択されると、セル１２８ｂは、「残りの分数」フィールド１０２ｄがルールへの入力として使用されることを表すように更新される。同様に、セル１２８ｃは、「使用された分数」フィールド１０２ｃ（図５Ｂに示される）を表す視覚表現１２５ｂが選択された後に、「使用された分数」１０２ｃもまた、ルール定義１２３において示されるルールを定義する際の入力として使用されることを指定する。セル１２８ａ、１２８ｂ、及び１２８ｃは、ユーザが、記憶システム１２に記憶されたデータセットからフィールドの属性（フィールドの名前など）にアクセスすることができることを例示するが、それらのデータセット（又はフィールド）自体に物理的にアクセスする必要はない。ルール定義部分１２３はまた、ルールケースの様々な基準が満たされたときに様々なルールケース及び出力を指定する行１２９ｃ、１２９ｄ、１２９ｅ、１２９ｆ、及び１２９ｇを含む。

ルール定義部分１２３においてセルの入力を指定することによってルールの定義を完了すると、開発環境１８は、ルールケース、及びルールを実装するためにどのフィールドにアクセスすることが必要になるかを指定するルール仕様９６ａを生成する。この例では、ルール仕様９６ａは、「名前」フィールド１０３ｂ、「残りの分数」フィールド１０２ｄ、及び「使用された分数」フィールド１０２ｃ（各々、図５Ｂに示される）をルールの入力として使用されることを指定する。すなわち、これらのフィールドの値は、ルールの入力として使用される。こうして、ルール自体を実行すると、それらのフィールドは、ルールを実行するときに物理的にアクセスすることが必要となる。しかしながら、ルールを定義するこの段階では、論理データ９４は、ユーザに、物理アクセスなしにそれらのフィールドへの論理アクセスを提供する。例えば、ユーザは、入力部分１２２において記憶システム１２に記憶された様々なデータセットから利用可能なフィールドを閲覧することができることによって、論理アクセスが提供された。開発環境１８は、ルール仕様９６ａをグラフジェネレータ２２に送信する。開発環境１８はまた、論理データ９４をグラフジェネレータ２２に送信する。

図５Ｅを参照すると、環境１３０は、ルール仕様９６ａ及び論理データ９４からデータフローグラフを生成及び最適化する例を示している。グラフジェネレータ２２は、ルール仕様９６ａ及び論理データ９４を受信する。グラフジェネレータ２２は、最適化されたデータフローグラフ９８ａを生成する際に、オプティマイザ１３２をルール仕様９６ａ及び論理データ９４の両方に適用する。この例では、グラフジェネレータ２２は、データフローグラフ１３４を生成するためにルール仕様９６ａ及び論理データ９４を使用する。この例では、データフローグラフ１３４は、コンポーネント１３４ａ～１３４ｍを含む。次いで、グラフジェネレータ２２は、オプティマイザ１３２をデータフローグラフ１３４に適用する。概して、オプティマイザ１３２は、データフローグラフ（例えば、データフローグラフ１３４）における冗長性を低減し、データフローグラフによって使用されていないデータソースを排除する。すなわち、ルールが特定のデータソースからフィールド（例えば、データセット）にアクセスすることをルール仕様９６ａが指定しない場合、オプティマイザ１３２は、そのデータソースをデータフローグラフから除去することになる。いくつかの例では、オプティマイザ１３２は、（例えば、ソースデータがリレーショナルデータベースに記憶されているときに）選択ステートメントを最小化することによってこれを行い、それにより、ルール仕様９６ａにおいて指定され、論理データ９４に含まれているデータセット及びフィールドのみがアクセスされる。

初期に、グラフジェネレータ２２は、例えば、論理データ９４において指定されたデータセットにアクセスするための命令、パラメータ、又は他の情報に基づいて、データソースとして論理データ９４に含まれるデータセット及びフィールドでデータフローグラフ１３４を生成する。この例では、データフローグラフ１３４内のコンポーネント１３４ａ～１３４ｍは、論理データ９４において表されるデータソース（例えば、データセット）に基づいている。いくつかの例では、グラフジェネレータ２２はまた、仕様９６ａ又は論理データ９４、又はその両方に含まれる情報をデータフローグラフ１３４にどのように変換するかを指定する組み込み機能に依存し得る。例えば、組み込み機能は、例えば、仕様９６ａ若しくは論理データ９４、又はその両方からの情報に基づいて、とりわけ、ソート、パーティション、又は結合動作などの様々な動作をデータフローグラフに挿入する機能を含むことができる。

データフローグラフ１３４はまた、１つ以上の変換コンポーネントを含むことができる。概して、変換コンポーネントは、１つ以上のデータソース、例えば、入力データセットから入力レコードを受信し、計算論理に基づいて出力レコードを作り出す。変換コンポーネントを作り出すために、グラフジェネレータ２２は、入力に適用されるように、論理の仕様（例えば、仕様９６ａからのルールセット、又は論理データ９４からの命令、パラメータ、又は他の情報）を受信することができる。次いで、グラフジェネレータ２２は、データフローを表すリンク要素によって接続されたデータ処理コンポーネントを有するグラフベースの計算として変換を生成し実装することができる。この例では、データフローグラフ１３４は、ルール仕様９６ａにおいて指定されたルールを実行する論理を含む変換コンポーネント１３４ｌを含む。この例では、データフローグラフ１３４はまた、計算フィールド１０２ｄを生成するための論理を含む変換コンポーネント１３４ｉを含む。この例では、生成された変換は、データフローグラフ１３４におけるコンポーネント（例えば、コンポーネント１３４ｌ）である。グラフジェネレータ２２はまた、例えば、ルールセットが編集されたときに変換を更新し得る。例えば、ルールセットが編集されたとき、エディタ（例えば、開発環境１８）は、ルールセット全体をグラフジェネレータ２２に提供するか、又は新しい若しくは修正されたルール若しくはルールケースのみを提供してもよい。グラフジェネレータ２２は、変換を使用するシステムの能力及びニーズに応じて、元の変換を置き換えるために完全に新しい変換を生成してもよく、又はグラフジェネレータ２２は、変換を含む新しいコンポーネントを提供してもよい。

グラフジェネレータ２２は、オプティマイザ１３２をデータフローグラフ１３４に適用して、データフローグラフ１３６を生成する。オプティマイザ１３２は、データフローグラフ１３６のクロスアウト部分によって示されるように、データフローグラフ１３４からコンポーネント１３４ａ、１３４ｃ、１３４ｆ、１３４ｇ、１３４ｊを除去する。オプティマイザ１３２は、これらのコンポーネントがルール仕様９６ａによって参照又は使用されないデータセットに関連するため、これらのコンポーネントを除去することを決定する。すなわち、ルール仕様９６ａは、除去されるデータセットに含まれるいずれのフィールドへの参照も含まない。いくつかの例では、ルートノード（例えば、この例におけるデータセット１０３又はコンポーネント１３４ｂ）としての役割を果たすデータセットは、ルール仕様９６ａによって使用されるかどうかにかかわらず、最適化されない場合があることに留意されたい。最適化の最終結果は、ルール仕様９６ａによって指定されたルールを実行するために必要とされないデータセットの全て、並びにそれらのデータセットにアクセスするためにインスタンス化された他のコンポーネント（例えば、ソート、結合など）を除去するように最適化されたデータフローグラフ９８ａである。

図５Ｆを参照すると、環境１４０は、ビジネスルール及び他の論理ルールを定義するために開発環境１８によって生成されたビジネスルールエディタインターフェース１２１の別の例を示している。環境１４０では、ルール定義１２３は、図５Ｄに示される環境１２０におけるルール定義に対して変更されている。具体的には、トリガセル１２８ｂ及び１２８ｃが削除されており、セル１２８ａは、「使用された分数」フィールド１０２ｃ（図５Ｂに示される）が、「使用された分数」フィールド１０２ｃを表す視覚表現１２５ｂを選択した後にルール定義１２３に示されるルールを定義する際の唯一の入力であることを指定するように修正されている。列１２９ｄ、１２９ｅ、１２９ｆ、及び１２９ｇのルールケースも更新されている。そのため、開発環境１８は、図５Ｄに示されるルール仕様９６ａの修正バージョンであるルール仕様１４２を生成する。この例では、ルール仕様１４２は、「使用された分数」フィールド１０２ｃがルールの唯一の入力として使用されることを指定する。開発環境１８は、ルール仕様１４２をグラフジェネレータ２２に送信する。開発環境１８はまた、論理データ９４をグラフジェネレータ２２に送信する。

図５Ｇを参照すると、環境１５０は、修正された仕様１４２及び論理データ９４からデータフローグラフを生成及び最適化する例を示している。初期に、グラフジェネレータ２２は、修正された仕様１４２において指定されたルールを実行する論理を含む変換コンポーネント１５２ｌを除いて、図５Ｅに示されるデータフローグラフ１３４に類似したデータフローグラフ１５２を生成する。この例では、修正された仕様１４２において指定され、コンポーネント１５２ｌによって実装されるルールが、仕様９６ａで指定され、コンポーネント１３４ｌによって実装されるルールとは異なるため、変換コンポーネント１５２ｌは、変換コンポーネント１３４ｌ（図５Ｅに示される）とは異なる。グラフジェネレータ２２は、オプティマイザ１３２をデータフローグラフ１５２に適用して、データフローグラフ１５４を生成する。そうすることで、オプティマイザ１３２は、データフローグラフ１５４のクロスアウト部分によって示されるように、データフローグラフ１５４からコンポーネント１３４ａ、１３４ｃ、１３４ｆ、１３４ｇ、１３４ｊ、及び１３４ｉを除去する。オプティマイザ１３２は、これらのコンポーネントがルール仕様１４２によって参照又は使用されないデータセットに関連するため、これらのコンポーネントを除去することを決定する。ルートノード（例えば、この例におけるデータセット１０３又はコンポーネント１３４ｂ）として役割を果たすデータセットが仕様１４０において参照されていないが、最適化されていないことに留意されたい。最適化の最終結果は、ルール仕様１４２によって指定されたルールを実行するために必要とされないデータセットの全て、並びにそれらのデータセットにアクセスするためにインスタンス化された他のコンポーネント（例えば、ソート、結合など）を除去するように最適化されたデータフローグラフ１５６である。データフローグラフ１５６は、それぞれのグラフの仕様９６ａ、１４２において依存される異なる属性に起因して、同じ論理データ９４ソースを使用するにもかかわらず、データフローグラフ９８ａとは異なる。

図５Ｈを参照すると、環境１６０は、ビジネスルール及び他の論理ルールを定義するために開発環境１８によって生成されたビジネスルールエディタインターフェース１２１の更に別の例を示している。環境１４０において、ルール定義１２３は、それぞれ、図５Ｄ及び図５Ｆに示される環境１２０及び１４０におけるルール定義に対して変更されている。ここで、セル１２８ａは、「最終リロード」フィールド１０３ｂ（図５Ｂに示す）を表す視覚表現１２７ａを選択した後に、「最終リロード」フィールド１０３ｂが、ルール定義１２３に示されるルールを定義する際の唯一の入力であることを指定する。列１２９ｃ、１２９ｄ、１２９ｅ、１２９ｆ、及び１２９ｇのルールケースも変更されている。そのため、開発環境１８は、ルール仕様９６ａ（図５Ａに最初に示されている）、１４２の各々とは異なるルール仕様９６ｂを生成する。この例では、ルール仕様９６ｂは、「最終リロード」フィールド１０３ｂがルールの唯一の入力として使用されることを指定する。開発環境１８は、ルール仕様９６ｂをグラフジェネレータ２２に送信する。開発環境１８はまた、論理データ９４をグラフジェネレータ２２に送信する。

図５Ｉを参照すると、環境１７０は、仕様９６ｂ及び論理データ９４からデータフローグラフを生成及び最適化する例を示している。初期に、グラフジェネレータ２２は、修正された仕様９６ｂ（この例では、変換コンポーネント１３４ｌ及び１５２ｌの各々とは異なる）において指定されたルールを実行する論理を含む変換コンポーネント１７２ｌを除いて、それぞれ、図５Ｅ及び図５Ｇに示されるデータフローグラフ１３４及び１５２に類似するデータフローグラフ１７２を生成する。グラフジェネレータ２２は、オプティマイザ１３２をデータフローグラフ１７２に適用して、データフローグラフ１７４を生成する。そうすることで、オプティマイザ１３２は、データフローグラフ１７４のクロスアウト部分によって示されるように、データフローグラフ１５４からコンポーネント１３４ａ、１３４ｃ、１３４ｆ、１３４ｅ、１３４ｈ、及び１３４ｉを除去する。オプティマイザ１３２は、これらのコンポーネントがルール仕様９６ｂによって参照又は使用されないデータセットに関連するため、これらのコンポーネントを除去することを決定する。ルートノード（例えば、この例におけるデータセット１０３又はコンポーネント１３４ｂ）として役割を果たすデータセットが仕様１４０において参照されていないが、最適化されていないことに留意されたい。最適化の最終結果は、ルール仕様９６ｂによって指定されたルールを実行するために必要とされないデータセットの全て、並びにそれらのデータセットにアクセスするためにインスタンス化された他のコンポーネント（例えば、ソート、結合など）を除去するために最適化されたデータフローグラフ９８ｂ（図５Ａに最初に示されている）である。データフローグラフ９８ｂは、それぞれのグラフの仕様において依存される異なる属性に起因して、同じ論理データ９４ソースを使用するにもかかわらず、データフローグラフ９８ａ及び１５６とは異なる。

図５Ｊを参照すると、環境１８０は、データフローグラフ９６ａの実行の結果を示している。グラフ生成システム１８は、データフローグラフ９６ａをコンパイラ２４に送信する。コンパイラ２４は、以下のように、データフローグラフ９６ａを実行可能プログラム１８２にコンパイルする。

データフローグラフは、計算プロセスを表す複数の頂点であって、各頂点が、関連付けられたアクセス方法を有する頂点として、及び、複数のリンクであって、リンクの各々が、互いに少なくとも２つの頂点を接続し、接続された頂点間のデータの流れを表す、複数のリンクとして、計算を表す。データフローグラフは、（１）データフローグラフをユーザ入力としてコンピューティングシステムに受け取ることと、（２）各頂点が実行可能状態になり、各リンクが、リンクによって接続された頂点のアクセス方法と互換性のある少なくとも１つの通信方法と関連付けられるまでに、グラフ変換ステップをコンピューティングシステム上で実行することによって、実行のためのデータフローグラフを準備することと、（３）コンピューティングシステムによって、リンクの通信方法に応じて、通信チャネル及び／又はデータストアの組み合わせを作成することによって、各リンクを起動することと、（４）プロセスの実行を呼び出すことによってコンピューティングシステム上で各プロセスを起動することと、によって実行される。

概して、実行のためのデータフローグラフは、以下のように準備される。

ドライバプログラム（又は、単に、略して「ドライバ」）は、ユーザインターフェースを通して受信されたユーザからの入力に基づいて、データフローグラフを描くための手段を提供する。データフローグラフの視覚表現を表す１つ以上のデータフローグラフデータ構造が、ドライバによって生成される。ドライバは、初期にユーザによって描かれたデータフローグラフにアクセスし、グラフ変換を適用することによって実行のためのデータフローグラフを準備する。これらの変換を実行するときに、初期データフローグラフを定義するデータフローグラフデータ構造は、各頂点及び任意の関連付けられたリンクをフェッチするために、既知の様式でトラバースされる。いくつかの例では、以下に記載されるように、実行のためのデータフローグラフを準備するために、フェッチされたデータ構造に対して５つのデータフローグラフ変換が使用される。

データフローグラフは依然として実行可能な形態ではないが、以下に記載される５つのデータフローグラフ変換が、実行可能なデータフローグラフが取得されるまで、任意の順序で、しばしば必要に応じて（全くないことを含む）、選択及び適用され得る。５つのデータフローグラフ変換は、（１）ファイルアダプタを挿入することと、（２）通信アダプタを挿入することと、（３）ファイル頂点の状態をＣｏｍｐｌｅｔｅに設定することと、（４）プロセス頂点の状態をＲｕｎｎａｂｌｅ又はＵｎｒｕｎｎａｂｌｅに設定することと、（５）データリンクの通信方法を設定することと、を含む。これらの変換の各々及び各々が実行され得る条件をここに記載する。

ファイルアダプタを挿入すること
この変換では、ドライバは、リンクをファイルアダプタに（すなわち、リンク、ファイル頂点、及び別のリンクに）置き換える。すなわち、データフローグラフデータ構造のトラバース中にリンクを表す各データフローグラフデータ構造がフェッチ又はアクセスされるとき、元のデータ構造を修正、拡張、又は置換する新しいデータ構造が作成され得る。

ソース（宛先）ファイルアダプタの場合、ファイル頂点のホストは、ソース（宛先）頂点のホストと同じであり、ファイル頂点のファイルは、ソース（宛先）頂点の作業ディレクトリ内に位置する新しいファイルである。この変換は、
（１）ソースが、ファイル頂点又はＤｏｎｅ状態にないプロセス頂点のいずれかである場合、及び
（２）宛先が、Ｉｎｃｏｍｐｌｅｔｅ状態のファイル頂点又はＤｏｎｅ状態にないプロセス頂点のいずれかである場合、に実施され得る。

通信アダプタを挿入すること
この変換では、ドライバは、リンクを通信アダプタに（すなわち、リンク、プロセス頂点、及び別のリンクに）置換する。プロセス頂点は、コピープログラムを実行し、コピープログラムはデータをその入力からその出力へコピーするものであり、基礎となるサブストレイトによって支持される通信チャネル又はデータストアのうちのいずれかから読み取り／そこに書き込みすることができる。ソース（宛先）通信アダプタの場合、プロセス頂点のホストは、ソース（宛先）頂点のホストと同じであり、作業ディレクトリは、ソース（宛先）頂点の作業ディレクトリと同じである。プロセス頂点は、Ｅｎａｂｌｅｄ状態で作成される。この変換は、
（１）ソースが、Ｄｏｎｅ以外の状態のプロセス頂点、又はファイル頂点のいずれかである場合、及び
（２）宛先が、Ｄｏｎｅ以外の状態のプロセス頂点、又はＩｎｃｏｍｐｌｅｔｅ状態のファイル頂点のいずれかである場合、に作成され得る。

ファイル頂点の状態をＣｏｍｐｌｅｔｅに設定すること
この変換では、ファイル頂点の状態がＣｏｍｐｌｅｔｅに設定される。この変換は、ファイル頂点の状態が不完全であり、ファイル頂点への全ての入力がＤｏｎｅ状態のプロセス頂点である場合に実行され得る。

プロセス頂点の状態をＲｕｎｎａｂｌｅ又はＵｎｒｕｎｎａｂｌｅに設定すること
この変換において、プロセス頂点の状態は、Ｒｕｎｎａｂｌｅ又はＵｎｒｕｎｎａｂｌｅのいずれかに設定される。この変換は、プロセス頂点の状態がＥｎａｂｌｅｄである場合に実行され得る。

データリンクの通信方法を設定すること
この変換では、通信方法がデータリンクに設定される。この変換は、データリンクの通信方法がＵｎｂｏｕｎｄである場合に実行され得る。

以下の３つのプロパティを有するデータフローグラフが実行される。
（１）全てのプロセス頂点が、次の状態、すなわち、Ｄｏｎｅ、Ｒｕｎｎａｂｌｅ、Ｕｎｒｕｎｎａｂｌｅ、又はＤｉｓａｂｌｅｄのうちの１つにある。
（２）全てのデータリンクが、以下の基準の全てを満たす。
１）データリンクのソース又は宛先がＲｕｎｎａｂｌｅプロセス頂点である場合、データリンクの通信方法は、特定の通信方法にバインドされなければならない。
２）データリンクの通信方法がＦｉｌｅ以外のものである場合、そのソース及び宛先の両方がプロセス頂点でなければならず、１つのプロセス頂点がＲｕｎｎａｂｌｅである場合、両方のプロセス頂点がＲｕｎｎａｂｌｅでなければならない。
３）データリンクの通信方法がＦｉｌｅである場合、そのソース又は宛先がファイル頂点でなければならない。宛先がＲｕｎｎａｂｌｅプロセス頂点である場合、ソースはＣｏｍｐｌｅｔｅファイル頂点でなければならない。ソースがＲｕｎｎａｂｌｅファイル頂点である場合、宛先がＩｎｃｏｍｐｌｅｔｅファイル頂点でなければならない。
（３）通信方法にバインドされた全てのリンクは、通信方法に固有の制約を満たす。
１）通信方法が、そのソース及び宛先ポートのアクセス方法と互換性がなければならない（これは、プログラムテンプレートを参照することによって決定され得る）。前述の拡張サブストレイトの場合、全ての通信方法が、ＳＯＣアクセスと互換性があり、ＳｈａｒｅｄＭｅｍｏｒｙ以外の全てが、ＦｉｌｅＤｅｓｃｒｉｐｔｏｒアクセスと互換性があり、ＮａｍｅｄＰｉｐｅ及びＦｉｌｅが、ＮａｍｅｄＰｉｐｅアクセスと互換性があり、ファイルのみがＦｉｌｅアクセスと互換性がある。
２）いくつかの通信方法は、ソース及び宛先の頂点のノードが同一であることを必要とする。前述の拡張サブストレイトの場合、これは、ＴＣＰ／ＩＰ以外の全ての通信方法について当てはまる。

データフローグラフ変換は、実行可能グラフが取得されるまで、任意の順序で適用され得る（例えば、データフローグラフデータ構造は、全ての変換が完了するまで繰り返しトラバースされ得る）。いくつかの例では、データフローグラフ変換は、以下の順序、すなわち、（１）ファイルアダプタを挿入すること、（２）ファイル間リンクを置換すること、（３）Ｃｏｍｐｌｅｔｅファイル頂点を識別すること、（４）Ｕｎｒｕｎｎａｂｌｅプロセス頂点を識別すること、（５）Ｒｕｎｎａｂｌｅプロセス頂点を識別すること、（６）残りのＥｎａｂｌｅｄ頂点をＵｎｒｕｎｎａｂｌｅに設定すること、（７）条件が満たされる場合、更にファイルアダプタを挿入すること、（８）通信方法を選択すること、及び（９）通信アダプタを挿入すること、で適用される。ここで、この例のステップをより詳細に記載する。

（１）ファイルアダプタを挿入すること
ファイルアダプタを挿入するために、データフローグラフ内の全てのリンクについて、以下のステップが実行される。リンクのソースポートがファイルの使用を必要とするデータアクセス方法を有し、宛先が同じノード上のファイルではない場合、ソースファイルアダプタを挿入する。リンクの宛先ポートがファイルの使用を必要とするデータアクセス方法を有し、ソースが同じノード上のファイルではない場合、宛先ファイルアダプタを挿入する。リンクの宛先がＤｉｓａｂｌｅｄ状態のプロセス頂点であり、ソースがＥｎａｂｌｅｄ状態のプロセス頂点である場合、宛先ファイルアダプタを挿入する。

（２）ファイル間リンクを置換すること
ファイル間リンクを置換するために、データフローグラフの全てのリンクについて、以下のステップが実行される。ソース及び宛先が両方ともファイル頂点である場合、ソース通信アダプタを挿入する。（加えて、ソース及び宛先が異なるノード上にある場合、宛先通信アダプタも挿入する、図示せず）。

（３）Ｃｏｍｐｌｅｔｅファイル頂点を識別すること
Ｃｏｍｐｌｅｔｅファイル頂点を識別するために、データフローグラフの全てのファイル頂点について、以下のステップが実行される。全てのアップストリーム頂点がＤｏｎｅ状態にあるプロセス頂点である場合、その状態をＣｏｍｐｌｅｔｅに設定する。

（４）Ｕｎｒｕｎｎａｂｌｅプロセス頂点を識別すること
Ｕｎｒｕｎｎａｂｌｅプロセス頂点を識別するために、データフローグラフの全てのリンクについて、以下のステップが実行される。「Ｕｎｒｕｎｎａｂｉｌｉｔｙ」テストは、次のように実行される、すなわち、リンクのソースがＩｎｃｏｍｐｌｅｔｅファイル頂点であり、その宛先がＥｎａｂｌｅｄ状態のプロセス頂点である場合、プロセス頂点の状態をＵｎｒｕｎｎａｂｌｅに設定し、ソースがＥｎａｂｌｅｄ以外の任意の状態のプロセス頂点であり、宛先がＥｎａｂｌｅｄ状態のプロセス頂点である場合、宛先プロセス頂点をＵｎｒｕｎｎａｂｌｅとしてマーク付けする。Ｕｎｒｕｎｎａｂｌｅとしてマーク付けされ得る頂点がなくなるまで、このテストを繰り返す。

（５）Ｒｕｎｎａｂｌｅプロセス頂点を識別すること
Ｒｕｎｎａｂｌｅプロセス頂点を識別するために、データフローグラフ内の全てのプロセス頂点について、以下のステップが実行される。「Ｒｕｎｎａｂｉｌｉｔｙ」テストは、以下のように実行される、すなわち、頂点がＥｎａｂｌｅｄ状態にあり、全てのアップストリーム頂点がＣｏｍｐｌｅｔｅファイル頂点又はＲｕｎｎａｂｌｅプロセス頂点のいずれかである場合、頂点の状態をＲｕｎｎａｂｌｅに設定する。Ｒｕｎｎａｂｌｅとしてマーク付けされ得る頂点がなくなるまで、このテストを繰り返す。

（６）残りのＥｎａｂｌｅｄ頂点をＵｎｒｕｎｎａｂｌｅに設定すること
残りのＥｎａｂｌｅｄ頂点をＵｎｒｕｎｎａｂｌｅに設定するために、グラフ内の全てのプロセス頂点について、以下のステップが実行される。頂点がＥｎａｂｌｅｄ状態にある場合、その状態をＵｎｒｕｎｎａｂｌｅに設定する。

（７）更にファイルアダプタを挿入すること
更にファイルアダプタを挿入するために、データフローグラフ内の全てのリンクについて、以下のステップが実行される。リンクのソースがＲｕｎｎａｂｌｅプロセス頂点であり、宛先がＵｎｒｕｎｎａｂｌｅプロセス頂点である場合、ソースファイルアダプタを挿入する。

（８）通信方法を選択すること
通信方法を選択するために、データフローグラフ内の全てのリンクについて、以下のステップが実行される。このステップは、いずれかの終了時に、実行可能なプロセスに取り付けられ、かつ通信方法にバインドされていないリンクにのみ適用される。リンクのソース（宛先）がファイル頂点であり、その宛先（ソース）が同じノード上のプロセス頂点である場合、リンクの通信方法をＦｉｌｅに設定する。そうでない場合、利用可能な通信方法のうちの１つを選択し、それにより、その方法の制約の全てが満たされる。速度について、通信方法は、ＳｈａｒｅｄＭｅｍｏｒｙ、ＮａｍｅｄＰｉｐｅ、及びＴＣＰ／ＩＰの順序で考慮され得る。いくつかの例では、上術の制約を満たす第１の方法が選択される。基準サブストレイトでは、以下のルールが使用され得る。まず、リンクがＳＯＣ接続を受け入れるポートに取り付けられている場合、リンクは、ソース及び宛先が同じノード上にある場合はＳｈａｒｅｄＭｅｍｏｒｙを使用し、それらが異なるノードにある場合はＴＣＰ／ＩＰを使用することになる。そうでない場合、ソース及び宛先が同じノード上にある場合、ＮａｍｅｄＰｉｐｅ方法が使用されることになる。全ての他の場合において、単一の通信方法では十分ではなく、システムは通信アダプタ（以下）に戻すことになる。

（９）通信アダプタを挿入すること
通信方法を選択する前のステップにおいて単一の通信方法が選択されておらず、全てが試みられた場合、ソース通信アダプタを挿入し、アダプタの２つのリンクの通信方法を選択しようと試みることによって継続する。これが失敗した場合、新たに挿入されたソース通信アダプタを宛先通信アダプタに置換することを試みる。これが失敗した場合、ソース通信アダプタ及び宛先通信アダプタの両方を挿入し、結果として生じる二重アダプタ内の３つのリンクの通信方法を選択する。基準サブストレイトにおいて、通信アダプタが、ソース及び宛先が異なるノード上にあり、リンクが、ＳＯＣ接続方法を受け入れないファイル頂点又はプロセス頂点のいずれかに接続される場合にのみ必要とされる。この場合、アダプタは以下のように選択され得る。

ソースがファイル頂点である場合、ソース通信アダプタを挿入する。ソース通信アダプタ内の２つのリンクは、次に、Ｆｉｌｅ及びＴＣＰ／ＩＰ通信方法を使用することになる。

ソースがＳＯＣ通信方法を受け入れないポートである場合、ソース通信アダプタを挿入する。ソース通信アダプタ内の２つのリンクは、次に、ＴＣＰ／ＩＰ及びＦｉｌｅ通信方法を使用する。

宛先がファイル頂点である場合、宛先通信アダプタを挿入する。

アダプタ内の２つのリンクは、次に、ＴＣＰ／ＩＰ及びＦｉｌｅ通信方法を使用する。

宛先がＳＯＣ通信方法を受け入れないポートである場合、宛先通信アダプタを挿入する。アダプタ内の２つのリンクは、次に、ＴＣＰ／ＩＰ及びＮａｍｅｄＰｉｐｅ通信方法を使用する。

フェーズＣ：データリンクを起動すること
データリンクは、Ｕｎｌａｕｎｃｈｅｄ状態で作成され、起動されなければならない。リンクを起動するために、リンクをスキャンして、Ｕｎｌａｕｎｃｈｅｄであり、通信方法にバインドされ、Ｒｕｎｎａｂｌｅソース又は宛先を有するリンクを見つける。全てのそのようなリンクについて、様々な通信方法によって使用され得る識別子が生成される。上記の拡張サブストレイトの場合、識別子は以下のように作成される。全てのリンクは、２つの識別子、すなわち、ストリームオブジェクト識別子及び通信チャネル／ファイル識別子を有する。ストリームオブジェクト識別子は、ＳＯＣメカニズムによって使用され、リンクの名前と同一である。チャネル／ファイル識別子は、リンクによって用いられるＦｉｌｅ、ＮａｍｅｄＰｉｐｅ、ＳｈａｒｅｄＭｅｍｏｒｙ区域、又はＴＣＰ／ＩＰ接続を識別するために使用される。加えて、プロセス頂点がＮａｍｅｄＰｉｐｅ又はＦｉｌｅ通信方法を必要とする場合、チャネル／ファイル識別子は、プロセス頂点が、起動されると、ＵＮＩＸファイルシステムを使用してチャネル／ファイルに取り付けることができるように、利用可能にされることになる。

識別子が生成された後、チャネル又はストリームオブジェクトを作成するために、サブストレイトが呼び出される。通信方法がＮａｍｅｄＰｉｐｅである場合、ＮａｍｅｄＰｉｐｅを作成するために、サブストレイトがまたも呼び出される。

実行可能プログラム１８２が生成されると、コンパイラ２４は実行可能プログラム１８２をデータ処理システム２６に送信する。データ処理システム２６は、記憶システム１２からレコードを受信し、実行可能プログラム１３６をバッチモードで実行して、例えば、バッチ結果１８４を作り出す。バッチ結果１８４は、特定のルールケース「始動」（例えば、処理されたデータレコードによってルールが何回トリガされたか）の回数を示す。この例では、「ゴールド」オファーは、他のルールと比較して、途方もない時間量をトリガした。そのため、ユーザは、例えば、ゴールドオファーがトリガされる時間数を減少させるために変更を行うことができるかどうかを決定するために、自分が作成したルールをテストすることを望む場合がある。

図５Ｋを参照すると、環境１９０は、ビジネスルール及び他の論理ルールを定義及びテストするために開発環境１８によって生成されたビジネスルールエディタ及びテストインターフェース１９１の例を示している。この例では、インターフェース１９１は、レコード１９２ａによるテスト、式１９２ｂによってテスト、エラー１９２ｃによってテスト、ベースラインデルタ１９２ｄによってテストし、ルールケース１９２ｅによるテストを含む、様々なテストカテゴリ１９２を可能にする。この例では、開発環境１８のユーザは、ルールケース１９２ｅによってテストするように選択され、ケース２（ゴルフオファーに対応する）を指定している。ここから、ユーザは、図５Ｌに示されるように、ボタン１９３ａと対話することによって、指定されたルールケース（すなわち、ルールケース２）をトリガしたレコード１９３をステップスルーすることができる。この例では、インターフェース１９１のルール定義部分１２３において影付き塗りつぶしの太い輪郭によって示されるように、レコード４が、ルールケース２をトリガしている。データフローグラフが実行された（これにより、物理データがアクセスされた）ため、入力部分１２２において示されるフィールドは、現在のレコード（図５Ｌのレコード４）のデータ値１９４が入力される。これらの値から分かるように、レコード４は、トリガケース２の定義されたルール内に十分に含まれる。図５Ｍに示されるように、ボタン１９３ａと対話することにより、ケース２をトリガした次のレコードに進む。データ値１９４から、レコード２４がルールケース２の「使用された分数」閾値に有意に近いことが分かる。

そのため、ゴールドオファーの数を減少させるために、ユーザは、図５Ｎに示されるように「使用された分数」閾値を増加させ得る。この例では、ユーザは、太枠の網掛けセル１９５に示されるように、ルールケース２における「使用された分数」のトリガ値を「＞４００」に変更している。変更の全体的な結果を見るために別のバッチテストを実行する前に、ユーザは、ルールが予想通りに機能していることを確実にするために、個々のレコード又は少数のレコードに対するルール変更を望む場合がある。そうするために、ユーザは、テストされるレコードをウィンドウ１９３に入力し、「テストレコード」ボタン１９６と対話することができる。この例では、ユーザは、レコード２４をテストするように選択している。「テストレコード」ボタン１９６を選択したことに応答して、開発環境１８は、修正された仕様１９７を生成し、仕様１９７をグラフジェネレータ２２に送信する。開発環境１８は、仕様１９７全体又は修正された部分のみを伝送することができる。その修正された仕様１９７及び論理データ（図示せず）を使用して、グラフジェネレータ２２は、修正されたデータフローグラフ１９８を作り出した。データフローグラフ１９８は、コンパイル及びその後の実行のためにコンパイラに送信される。開発環境１８はまた、テストされるレコードを指定するデータ１９９を、実行のためにデータ処理システム２６に送信する。

図５Ｏを参照すると、環境２００は、指定されたテストレコード２０４に対するデータフローグラフ１９８の実行を示している。この例では、コンパイラ２４は、データフローグラフ１９８を受信し、それをコンパイルして実行可能プログラム２０２を作り出し、実行可能プログラム２０２は、データ処理システム２６に送信される。データ処理システム２６は、テストされるレコードを指定するデータ１９９を受信し、記憶システム１２から指定されたテストレコード２０４（例えば、この例ではレコード２４）を取り出す。次いで、データ処理システム２６は、テストレコード２０４を使用して実行可能プログラム２０２を実行して、更新された結果２０６、すなわち、指定されたレコードを更新された実行可能データフローグラフで処理した結果を作り出す。これらの結果は、図５Ｐに示されるように、インターフェース１９１においてテストを実行したユーザに提示される。図５Ｐに見られるように、レコード２４は、修正されたルールの下でケース２（ゴールドオファーを表す）ではなく、ケース３（シルバーオファーを表す）をトリガする。

修正されたルールケース及びデータフローグラフが意図されるように機能していることを確認すると、図５Ｑに示されるように、バッチテストを実行することができる。そうするために、データ処理システム２６は、記憶システム１２からレコードを受信し、バッチモードで実行可能プログラム２０２を実行してバッチ結果２０８を作り出す。バッチ結果２０８は、ゴールドオファーの数が、図５Ｊに示される修正前のバッチ結果１８４と比較して著しく減少していることを示している。

図６Ａを参照すると、環境２１０は、ビジネスルール及び他の論理ルールを定義するために開発環境１８によって生成されたビジネスルールエディタインターフェース１２１の別の例を示している。この例では、論理データ２１１は、「取引先データ」データセットをルートノードとして含み、「取引先データ」データセットは、「取引」データセット、「支払データ」データセット、及び「出金データ」データセットを含む様々な他のデータセットに関連している。これらのデータセットの各々及びそれらのそれぞれのフィールドは、インターフェース１２１の入力部分１２２において視覚化される。具体的には、入力部分１２２は、「取引先データ」及びそのフィールドの視覚表現２１２、２１２ａ、２１２ｂ、及び２１２ｃ、「取引」及びそのフィールドの視覚表現２１３、２１３ａ、及び２１３ｂ、「支払データ」及びそのフィールドの視覚表現２１４及び２１４ａ、並びに「出金データ」及びそのフィールドの視覚表現２１５及び２１５ａを含む。

ルール定義部分１２３は、一連の入力及びルールケースを含む。この例では、それぞれ、「価格」フィールド及び「場所」フィールドは、セル１２８ａ及び１２８ｂに示されるように、ルールを定義する際の入力として使用される。「取引先場所」及び「取引先口座残高」フィールドは、ルール定義部分１２０において指定されたルールケースを定義する際の式の一部として使用される。ルールケースが適用される場合、出力列１２９ａに基づいて出力が生成される。この列に示されるように、ルールケース１２９ｃ、１２９ｄ、１２９ｅの各々の出力は、指定されたトリガ基準に基づいて、レビューのためのある特定の取引の承認、否認、又はフラグ付けに関連する。ルール定義部分１２３においてセルの入力を指定することによってルールの定義を完了すると、開発環境１８は、ルールケースと、ルールを実装するためにどのフィールドにアクセスする必要があるかを指定するルール仕様２１６を生成する。開発環境１８は、ルール仕様２１６をグラフジェネレータ２２に送信する。開発環境１８はまた、論理データ２１１をグラフジェネレータ２２に送信する。

図６Ｂを参照すると、環境２２０は、ルール仕様２１６及び論理データ２１１から連続動作のために構成されたデータフローグラフを生成及び最適化する例を示している。グラフジェネレータ２２は、ルール仕様２１６及び論理データ２１１を受信する。バッチ又は非連続設定と同様に、グラフジェネレータ２２は、初期に、例えば、論理データ２１１において指定されたデータセットにアクセスするための命令、パラメータ、及び他の情報に基づいて、データソースとして論理データ２１１に含まれるデータセット及びフィールドにアクセスするように構成されたデータフローグラフ２２２を生成する。しかしながら、データフローグラフ２２２のコンポーネント及びデータがアクセスされ、処理される様式は、連続設定では異なる。この例では、サブスクライブコンポーネント２２２ａを使用して、ルートノードである「取引先データ」からのデータのフローをサブスクライブしている。次いで、ルートノードからの各着信フローユニット（又はその一部分）は、例えば、ルックアップコンポーネント２２２ｃを使用して、論理データ２１１において定義された関連レコードの後続のルックアップに使用するために、複製コンポーネント２２２ｂを通して複製される。

初期データフローグラフ２２２を生成した後、グラフジェネレータ２２は、データフローグラフ２２４を生成するために、オプティマイザ１３２をデータフローグラフ２２２に適用する。オプティマイザ１３２は、データフローグラフ２２４のクロスアウト部分によって示されるように、データフローグラフ２２２からコンポーネント２２２ｄ、２２２ｆ、２２２ｇ、２２２ｈ、及び２２２ｉを除去する。オプティマイザ１３２は、これらのコンポーネントがルール仕様２１６によって参照又は使用されないデータセットに関連するため、これらのコンポーネントを除去することを決定する。すなわち、ルール仕様２１６は、除去されたデータセットに含まれるいずれのフィールドへの参照も含まない。最適化の最終結果は、ルール仕様９６ａによって指定されたルールを実行するために必要とされないデータセットの全て、並びにそれらのデータセットにアクセスするためにインスタンス化された他のコンポーネント（例えば、ソート、結合など）を除去するように最適化されたデータフローグラフ２２６である。これにより、本明細書に記載の論理データは、入力データが連続的、半連続的、又は非連続的であるかどうかにかかわらず、物理的負担を伴わずに論理アクセスを提供し、最適化を容易にするのに有効である。

図６Ｃを参照すると、環境２３０は、連続データフローグラフ２２６の実行の結果を示している。グラフ生成システム１８は、データフローグラフ２２６をコンパイラ２４に送信し、コンパイラ２４は、データフローグラフ９６ａを実行可能プログラム２３２（例えば、実行可能なデータフローグラフ）にコンパイルする。コンパイラ２３は、実行可能プログラム２３２をデータ処理システム２６に送信する。データ処理システム２６は、データストリーム１２（例えば、連続データ）を受信し、実行可能プログラム２３２を実行して、データストリームを処理し、リアルタイム又はほぼリアルタイムの結果２３４を作り出す。

図７Ａを参照すると、環境２４０は、仕様２５２を生成する開発環境１８の別の実世界の例を示している。この例では、開発環境１８は、コンポーネント部分２４２、入力部分２４３、及びキャンバス部分２４４を有するグラフィカルユーザインターフェース２４１を描画している。コンポーネント部分２４２は、計算論理を定義するために利用可能な様々な動作を表す視覚表現２４２ａ～２４２ｆを含む。入力部分２４３は、論理データ９４において表されるデータセット及びフィールドの視覚表現２４５、２４５ａ、２４６、２４６ａ、２４６ｂ、２４６ｃ、２４７、２４７ａ、２４８、２４８ａを表示している。入力部分２４３はまた、他のデータソースにおいて表されるデータセット及びフィールドの視覚表現２４９及び２４９ａを表示している。すなわち、入力部分２４３における視覚表現は、計算論理を定義するために利用可能なデータセット及びフィールドを表す。

キャンバス部分２４４は、データフローグラフの形態で計算論理を定義するために使用され、視覚化２５０として視覚的に描かれる（以下、便宜上、及び限定することなく、「データフローグラフ２５０」と称される）。視覚化２５０によって表されるデータフローグラフは、ノードを有するデータ構造を含む。ノードの各々は、少なくとも１つの動作プレースホルダフィールド及び少なくとも１つのデータプレースホルダフィールドを含み、これらは、キャンバス部分２４４においてユーザによって指定された動作及びデータが入力される。この例では、データフローグラフ２５０は、視覚表現２４２ａ～２４２ｆのうちの１つ以上を、コンポーネント部分２４２からキャンバス部分２４４上にドラッグ及びドロップすることによって生成される。視覚表現２４２ａ～２４２ｆの各々は、データ構造によって又はデータ構造に対して実行される動作を表す。視覚表現がキャンバス部分２４４上に配置されると、それらは、キャンバス部分２４４上のアイコンになる。アイコン２５１ａなどのこれらのアイコンのうちのいくつかは、特定のデータセット又はフィールドに関して実行する動作（例えば、フィルタ動作）を指定する。この例では、アイコン２５１ａは、入力部分２４３において視覚表現２４６ａによって表される「追加された分数」に対してフィルタ動作が実行されることを指定する。アイコン２５１ｂは、論理データ部分２４３において視覚表現２４６ｃによって表される「残りの分数」フィールドに対してフィルタ動作が実行されることを指定する。開発環境１８は、データフローグラフ２５０によって視覚的に表される計算論理を使用して、仕様２５２を生成する。仕様２５２は、キャンバス部分２４４において視覚的に描かれた計算論理を指定する。開発環境１８は、仕様２５２及び論理データ９４をグラフジェネレータ２２に送信する。グラフジェネレータ２２は、仕様２５２及び論理データ９４を使用して、データフローグラフ２５０の各ノードの動作フィールド及びデータプレースホルダフィールドにデータ入力することができる。

図７Ｂを参照すると、環境２６０は、最適化されたデータフローグラフを生成するグラフジェネレータ２２の例を例示しており、その視覚化は、視覚化２６８（本明細書では、便宜上、及び限定することなく、「データフローグラフ２６８」と称される）によって示される。グラフジェネレータ２２は、仕様２５２及び論理データ９４を受信する。その仕様２５２及び論理データ９４を使用して、グラフジェネレータ２２は、図７Ｃに示されるように、コンポーネント２６２ａ～２６２ｒを含むデータフローグラフ２６２を生成する。特に、グラフジェネレータ２２は、データフローグラフ２５２の各ノードについて動作フィールド及びデータプレースホルダフィールドにデータ入力し、かつ前述の技術を使用することによって、仕様２５２及び論理データ９４からデータフローグラフ２６２を生成する。例えば、指定された計算論理が変換コンポーネント１３４ｌによって実装されるデータフローグラフ９８ａとは異なり、データフローグラフ２６２は、仕様２５２において指定された計算論理に基づいて別個のコンポーネント２６２ｏ、２６２ｐ、２６２ｑを含む。データフローグラフ２６２は、論理データ９４において表され、別個の「オファー」データセット２４９及びその「月次」フィールド２４９ａと結合されるデータセットを表し、データフローグラフ２６２はまた、データフローグラフ（例えば、ソート、パーティションなど）を生成するために必要な追加の組み込み機能を表す。

この例では、グラフジェネレータ２２は、最適化されたデータフローグラフ２６８を作り出すために、オプティマイザ１３２を図７Ｃに示されるデータフローグラフ２６２に適用する。最適化の様々な中間段階が図７Ｄ及び図７Ｅに示されている。オプティマイザ１３２は、仕様２５２若しくは論理データ９４、又はその両方を分析して、仕様２５２において使用されるフィールドを識別し、次に、それらのフィールドを含むデータセットを識別する。オプティマイザ１３２は、データフローグラフ２６２から、仕様２５２によって使用又は参照されないデータセットを除去する。オプティマイザ１３２はまた、必要に応じてグラフにパーティションコンポーネントを追加することを担うことができる。いくつかの例では、オプティマイザ１３２は、ルール仕様２５２において指定され、論理データ９４に含まれるデータセット及びフィールドのみがアクセスされるように、選択ステートメントを最小限に抑えることによってこれを行う。図７Ｄに示されるように、オプティマイザ１３２は、データフローグラフ２６２からコンポーネント２６２ａ、２６２ｓ、２６２ｃ、２６２ｆ、２６２ｉ、２６２ｖ、及び２６２ｈを除去する（それにより、時間Ｔ２においてデータフローグラフ２６４を作り出す）。これは、コンポーネント２６２ａがデータセット「オファー状況」を表し、そのフィールド「オファー受入」が、仕様２５２によって参照又は使用されないためである。同様に、コンポーネント２６２ｃは、データセット「リロード日」を表し、そのフィールド「最終リロード」は、仕様によって参照又は使用されない。これらの入力ソース（すなわち、コンポーネント２６２ａ及び２６２ｉによって表されるもの）を除去することにより、残りのコンポーネントを不要なもの（「デッドコンポーネント」と称されることもある）として描写し、したがって、これらのコンポーネント（すなわち、２６２ｓ、２６２ｃ、２６２ｖ、２６２ｈ）も除去することができる。

オプティマイザ１３２はまた、コンポーネント２６２ｋによって指定された結合動作の前にフィルタコンポーネント２６２ｏ及び２６２ｐを移動させる更なる最適化を実行し、それによって、図７Ｅに示されるように、時間Ｔ３においてデータフローグラフ２６６を作り出す。そうすることによって、フィルタ動作が結合動作の前に実行されて、結合される必要のあるデータの量を低減するため、オプティマイザ１２２は、より高速で、より効率的で、より少ない計算リソースを使用するデータフローグラフを作り出す。フィルタ動作が結合動作の後に実行される場合、システムが最終的にフィルタ除去されるデータを結合しなければならないため、より多くの組成リソースが使用される。最適化の結果は、データフローグラフ２６８である。

概して、オプティマイザ１３２は、データフローグラフにおいて指定された動作のうちの１つ以上に従ってデータを処理するために必要とされ得る最適化若しくは他の変換を実行するか、又は最適化若しくは変換、又はその両方を伴わずにデータを処理することと比較して、データフローグラフにおいて指定された動作のうちの１つ以上に従ってデータを処理することを改善する。例えば、オプティマイザは、データフローグラフ２６２の所望の機能を有する変換されたデータフローグラフ２６８を作り出すために、とりわけ、１つ以上のソート動作、データタイプ動作、データフローグラフにおいて指定されたキーに基づく結合動作を含む結合動作、パーティション動作、自動並列処理動作、又はメタデータを指定する動作を追加する。いくつかの実装形態では、変換されたデータフローグラフ２６８ｓは、最適化を適用する前の変換されたデータフローグラフの計算効率と比較して、変換されたデータフローグラフの計算効率を改善するために、１つ以上のデータフローグラフ最適化ルールを変換されたデータフローグラフに適用することによって最適化されたデータフローグラフである（又は最適化されたデータフローグラフに変換される）。データフローグラフ最適化ルールは、例えば、「ＥｄｉｔｏｒｆｏｒＧｅｎｅｒａｔｉｎｇＣｏｍｐｕｔａｔｉｏｎａｌＧｒａｐｈｓ」と題された米国特許出願第６２／９６６，７６８号に記載されるように、とりわけ、デッドコンポーネント又は冗長コンポーネントの削除、早期フィルタリング、又はレコードの絞り込みを含むことができ、その全容は参照により本明細書に組み込まれる。

本明細書に記載の技術は、開発環境を使用してユーザ（例えば、ビジネスユーザ）の生産性を改善し、最適化されたデータ処理を可能にするために、データセット間の関係についての情報を使用する。ユーザ（例えば、技術ユーザ）は、初期に、開発環境に公開する論理データを（例えば、ルートノードとして使用するためにデータセットを選択するか、又は仮想フィールドを定義することによって）定義する必要があり得るが、ビジネスユーザは、公開された論理データから自身の計算論理を柔軟に開発する権限を与えられ、その論理に基づいて、最適化された様式で論理を実行するために、多種多様なデータフローグラフを生成することができる。

本明細書に記載される技術は、ユーザが、記憶システムに記憶されたデータセットの複雑なセットから、迅速かつ強力に、論理データを開発環境に公開する権能を与えるものである。いくつかの例では、技術ユーザは、作業に関心がある一組のデータセットを選択し、これらのデータセットの全ての中からスキーマ定義が発見されるか、さもなければ取得される。例えば、スキーマは、データベース内にあるこれらのデータセットからエクスポートされ、データ発見、セマンティック発見、若しくは他の機械学習を使用して、又は技術ユーザからの追加の入力を受信することによって、又はそれらの組み合わせによって発見することができる。いくつかの例では、技術ユーザは、他のデータ要素の中からのアグリゲーションなど、追加の計算フィールド又は仮想フィールドをスキーマ内に生成することができる。いくつかの例では、技術ユーザは、論理データのルートノード又はパースペクティブを選択することができる。

次いで、開発環境において動作するビジネスユーザは、論理データ（実際の物理データ要素又は技術ユーザが定義した論理データ要素に対応し得る）に含まれる属性のいずれかを使用して、自分のビジネスニーズに適用可能な計算論理を開発することができる。いくつかの例では、ビジネスユーザは、出力を視認し、開発環境で書いた論理（例えば、ルール）をテストすることができる。

ビジネスユーザが、自分が開発した（及び任意選択的にテストされた）計算論理に満足すると、最適化されたデータフローグラフは、そのデータフローグラフに必要とされるデータセットのみを処理するグラフジェネレータによって生成することができる。例えば、ビジネスユーザは、計算論理を開発するときに、不要であることが判明した多数のデータセットにアクセスし得る。グラフジェネレータ及びオプティマイザが論理データからのデータセットについて詳細な情報を有するため、データセットが生成するデータフローグラフは、劇的に最適化することができる。

最適化されたデータフローグラフが生成されると、最適化されたデータフローグラフは、例えば、データ処理システムによって実行することができる。いくつかの例では、データフローグラフは、２つの異なるモード、すなわち、バッチ又はリアルタイムで実行することができる。いくつかの例では、ビジネスユーザが異なるセットのデータに依存する異なるセットのルールに関心があった場合、ビジネスユーザは、所望のデータフローグラフを生成することができ、そのデータフローグラフも、技術ユーザが関与する必要なく最適化することができる。

図８は、論理データを作り出し、論理データを使用してコンピュータプログラムを生成するための例示的なプロセス８００のフローチャートを例示している。プロセス８００は、図１～図７を参照して記載された技術を実装するように構成されたコンピューティングシステムのうちの１つ以上を含む、本明細書に記載のシステム及びコンポーネントのうちの１つ以上によって実装することができる。

プロセス８００の動作は、スキーマにおいて表されるデータセット間の関係を指定するスキーマ、１つ以上のデータセットに対する１つ以上の計算、又は１つ以上のデータセットに対する１つ以上の変換にアクセスすること（８０２）を含む。例では、スキーマは、データベーススキーマである。例では、データセットのうちの１つ以上に対する１つ以上の計算又はデータセットの１つ以上の１つ以上の変換は、複数のデータセットのうちの少なくとも１つの論理フィールド、仮想フィールド、又は計算フィールドを定義する。

記憶装置内のデータセットの中からの複数のデータセットは、データセットの中からデータセットを選択することと、スキーマから、選択されたデータセットに関連する１つ以上の他のデータセットを識別することと、によって識別される（８０２）。例では、選択されたデータセットは、論理データのルートノードであり、１つ以上の他のデータセットのうちの少なくとも１つは、選択されたデータセットに結合される。例では、選択されたデータセットを指定する選択データは、クライアントデバイスから受信される。例では、選択されたデータセットと１つ以上の他のデータセットとを結合するための、１つ以上のキーなどの１つ以上のパラメータが、スキーマから識別される。

複数のデータセットの属性が識別される（８０６）。例では、１つ以上の属性は、複数のデータセットのフィールド名を含む。例では、１つ以上の属性は、複数のデータセットにアクセスするための情報を含む。複数のデータセットの識別された属性を表し、属性間の１つ以上の関係を更に表す論理データが生成される（８０８）。

論理データは、開発環境に提供される（８１０）。開発環境は、複数のデータセットの識別された属性を表す論理データのうちの１つ以上の部分へのアクセスを提供する（８１２）。例では、開発環境は、複数のデータセットに記憶装置からアクセスすることなく、論理データのうちの１つ以上の部分へのアクセスを提供する。例では、開発環境は、論理データをデータソースとして読み取る。

動作を実行するときに、識別された属性のうちの少なくとも１つを指定する仕様が、開発環境から受信される（８１４）。仕様と、論理データによって表される識別された属性間の１つ以上の関係に基づいて、複数からの少なくとも１つのデータセットに記憶装置からアクセスすることによって動作を実行するように構成されているコンピュータプログラムが生成され（８１６）、アクセスされた少なくとも１つのデータセットが、仕様において指定された属性のうちの少なくとも１つを有する。例では、コンピュータプログラムは、記憶装置からアクセスされた少なくとも１つのデータセットを使用して実行される。例では、動作は、仕様において指定された属性のうちの少なくとも１つを含む複数のデータセットから１つのデータセットを識別することと、識別されたデータセットに記憶装置からアクセスすることと、を含む。

例では、コンピュータプログラムは、仕様において指定された属性のうちの少なくとも１つを有する複数のデータセット内のデータセットのみに記憶装置からアクセスすることによって動作を実行するように構成されている最適化されたコンピュータプログラムを作り出すように最適化される。例では、仕様において指定された属性のうちの少なくとも１つを含まない複数のデータセット内の少なくとも１つのデータセットに記憶装置からアクセスする動作は、コンピュータプログラムから除去される。例では、コンピュータプログラムは、選択ステートメントによって複数からの少なくともいくつかのデータに記憶装置からアクセスするように構成され、選択ステートメントは、仕様において指定された属性のうちの少なくとも１つのみを選択するように最小化される。例では、動作は、仕様と、論理データによって表される識別された属性間の１つ以上の関係に基づいて、動作を実行するように構成されている実行可能なデータフローグラフを生成することを含み、実行可能なデータフローグラフは、１つ以上の属性のうちの少なくとも１つを入力として含む。

本明細書に記載の主題及び動作の実装形態は、本明細書に開示された構造及びそれらの構造的等価物を含むデジタル電子回路、又はコンピュータソフトウェア、ファームウェア、若しくはハードウェア、又はそれらのうちの１つ以上の組み合わせで実装することができる。本明細書に記載の主題の実装形態は、１つ以上のコンピュータプログラム（データ処理プログラムとも称される）（すなわち、データ処理装置によって実行するために、又はデータ処理装置の動作を制御するためにコンピュータ記憶媒体上に符号化されたコンピュータプログラム命令の１つ以上のモジュール）として実装することができる。コンピュータ記憶媒体は、コンピュータ可読記憶デバイス、コンピュータ可読記憶基板、ランダムアクセス若しくはシリアルアクセスメモリアレイ若しくはデバイス、又はそれらのうちの１つ以上の組み合わせであってもよく、又はそれらに含まれてもよい。コンピュータ記憶媒体はまた、１つ以上の別個の物理的コンポーネント又は媒体（例えば、複数のＣＤ、ディスク、又は他の記憶デバイス）であってもよく、又はそれらに含まれてもよい。本主題は、非一時的コンピュータ記憶媒体に記憶されたコンピュータプログラム命令に実装され得る。

本明細書に記載の動作は、１つ以上のコンピュータ可読記憶デバイス上に記憶された、又は他のソースから受信されたデータに対してデータ処理装置によって実行される動作として実装することができる。

「データ処理装置」という用語は、データを処理するためのあらゆる種類の装置、デバイス、及びマシンを包含し、例として、プログラマブルプロセッサ、コンピュータ、システムオンチップ、又は前述のものの複数のもの、又は組み合わせを含む。装置は、専用論理回路（例えばＦＰＧＡ（ＦｉｅｌｄＰｒｏｇｒａｍｍａｂｌｅＧａｔｅａｒｒａｙ、フィールドプログラマブルゲートアレイ）又はＡＳＩＣ（ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ、特定用途向け集積回路）を含むことができる。装置はまた、ハードウェアに加えて、問題のコンピュータプログラムの実行環境を提供するコード（例えば、プロセッサファームウェア、プロトコルスタック、データベース管理システム、オペレーティングシステム、クロスプラットフォームランタイム環境、仮想マシン、又はそれらのうちの１つ以上の組み合わせを構成するコード）を含むことができる。装置及び実行環境は、ウェブサービス、分散コンピューティング、及びグリッドコンピューティングインフラストラクチャなどの様々な異なるコンピューティングモデルインフラストラクチャを実現することができる。

コンピュータプログラム（プログラム、ソフトウェア、ソフトウェアアプリケーション、スクリプト、又はコードとしても知られている）は、コンパイル言語若しくはインタープリタ言語、宣言型言語若しくは手続き型言語を含む任意の形式のプログラミング言語で書くことができ、スタンドアロンプログラムとして、又はモジュール、コンポーネント、サブルーチン、オブジェクト、若しくはコンピューティング環境での使用に好適な他のユニットとして含む、任意の形態で展開することができる。コンピュータプログラムは、ファイルシステム内のファイルに対応してもよいが、対応する必要がない場合がある。プログラムは、他のプログラム又はデータ（例えば、マークアップ言語文書に記憶された１つ以上のスクリプト）を保持するファイルの一部分、問題のプログラム専用の単一のファイル、又は複数の協調ファイル（例えば、１つ以上のモジュール、サブプログラム、又はコードの一部分を記憶するファイル）に記憶することができる。コンピュータプログラムは、１つのコンピュータ上で、又は１つのサイトに位置するか、又は複数のサイトに分散され、通信ネットワークによって相互接続された複数のコンピュータ上で実行されるように展開することができる。

本明細書に記載のプロセス及び論理フローは、入力データに対して動作し、出力を生成することによってアクションを実行するために、１つ以上のコンピュータプログラムを実行する１つ以上のプログラマブルプロセッサによって実行することができる。プロセス及び論理フローはまた、専用論理回路（例えば、ＦＰＧＡ（フィールドプログラマブルゲートアレイ）又はＡＳＩＣ（特定用途向け集積回路）によって実行することができ、装置は専用論理回路として実装することができる。

コンピュータプログラムの実行に好適なプロセッサは、例として、汎用マイクロプロセッサ及び専用マイクロプロセッサの両方、並びに任意の種類のデジタルコンピュータの任意の１つ以上のプロセッサを含む。概して、プロセッサは、リードオンリーメモリ若しくはランダムアクセスメモリ又はその両方から命令及びデータを受信するであろう。コンピュータの必須要素は、命令に従ってアクションを実行するためのプロセッサと、命令及びデータを記憶するための１つ以上のメモリデバイスとを含む。一般に、コンピュータはまた、データを記憶するための１つ以上の大容量記憶デバイス（例えば、磁気ディスク、光磁気ディスク、又は光ディスク）を含むか、それらからデータを受信するか、それらにデータを転送するか、又はその両方を行うように動作可能に結合することになるが、コンピュータは、そのようなデバイスを有する必要はない。更に、コンピュータは、別のデバイス（例えば、携帯電話、携帯情報端末（Personal Digital Assistant、ＰＤＡ）、モバイルオーディオ若しくはビデオプレーヤ、ゲームコンソール、全地球測位システム（Global Positioning System、ＧＰＳ）受信機、又は携帯型記憶デバイス（例えば、ユニバーサルシリアルバス（Universal Serial Bus、ＵＳＢ）フラッシュドライブ））に組み込むことができる。コンピュータプログラム命令及びデータを記憶するのに好適なデバイスは、例として、半導体メモリデバイス（例えば、ＥＰＲＯＭ、ＥＥＰＲＯＭ、及びフラッシュメモリデバイス）、磁気ディスク（例えば、内蔵ハードディスク又はリムーバブルディスク）、光磁気ディスク、並びにＣＤ－ＲＯＭ及びＤＶＤ－ＲＯＭディスクを含む、あらゆる形態の不揮発性メモリ、媒体及びメモリデバイスを含む。プロセッサ及びメモリは、専用論理回路によって補完され得るか、又は専用論理回路に組み込まれ得る。

本明細書に記載の主題の実装形態は、バックエンドコンポーネント（例えば、データサーバとして）を含むか、又はミドルウェアコンポーネント（例えば、アプリケーションサーバ）を含むか、又はフロントエンドコンポーネント（例えば、ユーザが本明細書に記載の主題の実装形態と対話することができるグラフィカルユーザインターフェース又はＷｅｂブラウザを有するユーザコンピュータ）、又は１つ以上のそのようなバックエンドコンポーネント、ミドルウェアコンポーネント、若しくはフロントエンドコンポーネントの任意の組み合わせを含む、コンピューティングシステムに実装することができる。システムのコンポーネントは、デジタルデータ通信（例えば、通信ネットワーク）の任意の形態又は媒体によって相互接続することができる。通信ネットワークの例には、ローカルエリアネットワーク（Local Area Network、ＬＡＮ）及びワイドエリアネットワーク（Wide Area Network、ＷＡＮ）、インターネットワーク（例えば、インターネット）、及びピアツーピアネットワーク（例えば、アドホックピアツーピアネットワーク）が含まれる。

コンピューティングシステムは、ユーザ及びサーバを含むことができる。ユーザ及びサーバは、一般に、互いに遠隔であり、典型的には、通信ネットワークを通して対話する。クライアントとサーバとの関係は、それぞれのコンピュータ上で実行され、互いにクライアント－サーバ関係を有するコンピュータプログラムによって生じ得る。いくつかの実装形態では、サーバは、データ（例えば、ＨＴＭＬページ）をユーザデバイスに送信する（例えば、ユーザデバイスと対話するユーザにデータを表示し、ユーザデバイスと対話するユーザからユーザ入力を受信する目的で）。ユーザデバイスにおいて生成されたデータ（例えば、ユーザ対話の結果）は、サーバにおいてユーザデバイスから受信することができる。

本明細書は多くの特定の実装形態の詳細を含むが、これらは、任意の実装形態又は特許請求され得るものの範囲に対する限定として解釈されるべきではなく、特定の実装形態に特有の特徴の記載として解釈されるべきである。別個の実施態様の文脈において本明細書に記載されるある特定の特徴はまた、単一の実装形態において組み合わせて実装することができる。逆に、単一の実施態様の文脈において記載される様々な特徴はまた、複数の実装形態において別々に、又は任意の好適な二次組み合わせにおいて実装することができる。更に、特徴は、ある特定の組み合わせにおいて作用するものして上述され、初めにそのように特許請求され得るが、特許請求される組み合わせからの１つ以上の特徴は、場合によっては、組み合わせから切除することができ、特許請求される組み合わせは、二次組み合わせ又は二次組み合わせの変形を対象とし得る。

同様に、動作は、特定の順序で図面に描かれているが、望ましい結果を達成するために、そのような動作が示された特定の順序で又は連続した順序で実行されるか、又は全ての例示された動作が実行されることを必要とするものとして理解されるべきではない。ある特定の状況では、マルチタスク処理及び並列処理が有利であり得る。更に、上記の実装態様における様々なシステムコンポーネントの分離は、全ての実装形態においてそのような分離を必要とするものとして理解されるべきではなく、記載されたプログラムコンポーネント及びシステムは、一般に単一のソフトウェア製品に共に統合されるか、又は複数のソフトウェア製品にパッケージ化され得ることを理解されたい。

他の実装形態は、以下の特許請求の範囲の範囲内である。

２スキーマ
１０環境
１２記憶システム
１４クライアントデバイス
１６論理データジェネレータ
１８開発環境
２０環境
２２グラフジェネレータ
２４コンパイラ
２６データ処理システム
２７グラフィカルユーザインターフェース
３０環境
３２エディタインターフェース
３３入力部分
３４ルール定義部分
４０環境
４２コンポーネント部分
４３入力部分
４４キャンバス部分
５０環境
５２データフローグラフ
５４実行可能プログラム
６０環境
７０環境
７２論理データ
８０環境
８２論理データ
８４スキーマ
９０環境
９１スキーマ
９２選択データ
９４論理データ
９６ａ仕様
９６ｂ仕様
９８ａデータフローグラフ
９８ｂデータフローグラフ
１００環境
１０１データセット
１０２データセット
１０３データセット
１０４データセット
１０５グラフィカルユーザインターフェース
１０６データセット部分
１０７パースペクティブ部分
１１０環境
１２０環境
１２１インターフェース
１２２入力部分
１２３ルール定義
１２４視覚表現
１２５視覚表現
１２６視覚表現
１２７視覚表現
１３０環境
１３２オプティマイザ
１３４データフローグラフ
１３６データフローグラフ
１４０環境
１４２仕様
１５０環境
１５２データフローグラフ
１５４データフローグラフ
１５６データフローグラフ
１６０環境
１７０環境
１７２データフローグラフ
１７４データフローグラフ
１８０環境
１８２実行可能プログラム
１８４バッチ結果
１９０環境
１９１インターフェース
１９２テストカテゴリ
１９３ウィンドウ
１９４データ値
１９５太枠の網掛けセル
１９６ボタン
１９７仕様
１９８データフローグラフ
１９９データ
２００環境
２０２実行可能プログラム
２０４テストレコード
２０６結果
２０８バッチ結果
２１０環境
２１１論理データ
２１３視覚表現
２１４及びそのフィールドの視覚表現
２１５及びそのフィールドの視覚表現
２１６ルール仕様
２２０環境
２２２データフローグラフ
２２４データフローグラフ
２２６データフローグラフ
２３０環境
２３２実行可能プログラム
２３４ほぼリアルタイムの結果
２４０環境
２４１グラフィカルユーザインターフェース
２４２コンポーネント部分
２４３論理データ部分
２４３入力部分
２４４キャンバス部分
２４５視覚表現
２４６視覚表現
２４７視覚表現
２４８視覚表現
２４９視覚表現
２５２仕様
２６０環境
２６２データフローグラフ
２６４データフローグラフ
２６６データフローグラフ
２６８データフローグラフ
３００スイムレーン図
８００プロセス

Claims

開発環境を提供するためのデータ処理システムと、１つ以上の属性を有するデータセットを記憶する記憶装置とによって実装される方法であって、前記開発環境が前記データセットの前記１つ以上の属性へのアクセスを提供し、前記方法が、
スキーマにアクセスすることであって、前記スキーマが、前記スキーマにおいて表されるデータセット間の関係、前記データセットのうちの１つ以上に対する１つ以上の計算、又は前記データセットのうちの１つ以上の１つ以上の変換を指定する、アクセスすることと、
前記データセットの中から、記憶装置内の複数の前記データセットを識別することであって、前記識別することが、
前記データセットの中からデータセットを選択することと、
前記スキーマから、選択された前記データセットに関連する１つ以上の他のデータセットを識別することと、によって行われる、識別することと、
前記複数の前記データセットの属性を識別することと、
前記複数の前記データセットの識別された属性を表し、前記属性間の１つ以上の関係を更に表す論理データを生成することと、
開発環境に、前記論理データを提供することと、
前記開発環境によって、前記複数の前記データセットの識別された前記属性を表す前記論理データのうちの１つ以上の部分へのアクセスを提供することと、
前記開発環境から、動作を実行するときに、識別された前記属性のうちの少なくとも１つを指定する仕様を受信することと、
前記仕様と、前記論理データによって表される識別された前記属性間の前記１つ以上の関係とに基づいて、複数からの少なくとも１つのデータセットに記憶装置からアクセスすることによって前記動作を実行するように構成されているコンピュータプログラムを生成することであって、アクセスされた前記少なくとも１つのデータセットが、前記仕様において指定された前記属性のうちの少なくとも１つを有する、生成することと、を含む、方法。
前記開発環境が、前記複数のデータセットに記憶装置からアクセスすることなく、前記論理データのうちの前記１つ以上の部分へのアクセスを提供する、請求項１に記載の方法。
前記仕様において指定された前記属性のうちの前記少なくとも１つを含む前記複数のデータセットから１つのデータセットを識別することと、
識別された前記データセットに記憶装置からアクセスすることと、を含む、請求項１に記載の方法。
記憶装置からアクセスされた前記少なくとも１つのデータセットを使用して前記コンピュータプログラムを実行することを含む、請求項１に記載の方法。
前記仕様において指定された前記属性のうちの前記少なくとも１つを有する前記複数のデータセット内のデータセットのみに記憶装置からアクセスすることによって前記動作を実行するように構成されている最適化されたコンピュータプログラムを作り出すように、前記コンピュータプログラムを最適化することを含む、請求項１に記載の方法。
前記１つ以上の属性が、前記複数の前記データセットのフィールド名を含む、請求項１に記載の方法。
前記１つ以上の属性が、記憶装置内の前記複数の前記データセットにアクセスするための情報を含む、請求項１に記載の方法。
前記スキーマから、選択された前記データセットと前記１つ以上の他のデータセットとを結合するための１つ以上のパラメータを識別することを含む、請求項１に記載の方法。
前記１つ以上のパラメータが、選択された前記データセットと前記１つ以上の他のデータセットのうちの少なくとも１つとを結合するためのキーを含む、請求項８に記載の方法。
クライアントデバイスから、選択された前記データセットを指定する選択データを受信することを含む、請求項１に記載の方法。
選択された前記データセットが、前記論理データのルートノードを含み、前記１つ以上の他のデータセットのうちの少なくとも１つが、選択された前記データセットに結合される、請求項１に記載の方法。
前記データセットのうちの１つ以上に対する前記１つ以上の計算、又は前記データセットのうちの１つ以上の１つ以上の変換が、前記複数の前記データセットのうちの少なくとも１つの仮想フィールドを定義する、請求項１に記載の方法。
前記仕様と、前記論理データによって表される識別された前記属性間の前記１つ以上の関係とに基づいて前記動作を実行するように構成されている実行可能なデータフローグラフを生成することを含み、前記実行可能なデータフローグラフが、前記１つ以上の属性のうちの少なくとも１つを入力として含む、請求項１に記載の方法。
前記仕様において指定された前記属性のうちの前記少なくとも１つを含まない前記複数のデータセット内の少なくとも１つのデータセットに記憶装置からアクセスする動作を前記コンピュータプログラムから排除することを含む、請求項１に記載の方法。
前記コンピュータプログラムが、選択ステートメントによって複数からの少なくともいくつかのデータに記憶装置からアクセスするように構成され、前記選択ステートメントが、前記仕様において指定された前記属性のうちの前記少なくとも１つのみを選択するように最小化される、請求項１に記載の方法。
前記開発環境が、前記論理データをデータソースとして読み取る、請求項１に記載の方法。
開発環境と、１つ以上の属性を有するデータセットを記憶する記憶装置とを提供するためのシステムであって、前記開発環境が前記データセットの前記１つ以上の属性へのアクセスを提供し、前記システムが、
１つ以上のプロセッサと、前記１つ以上のプロセッサによって実行されると、前記１つ以上のプロセッサに動作を実行させるように動作可能な命令を記憶する１つ以上の記憶デバイスであって、前記動作が、
スキーマにアクセスすることであって、前記スキーマが、前記スキーマにおいて表されるデータセット間の関係、前記データセットのうちの１つ以上に対する１つ以上の計算、又は前記データセットのうちの１つ以上の１つ以上の変換を指定する、アクセスすることと、
前記データセットの中から、記憶装置内の複数の前記データセットを識別することであって、前記識別することが、
前記データセットの中からデータセットを選択することと、
前記スキーマから、選択された前記データセットに関連する１つ以上の他のデータセットを識別することと、によって行われる、識別することと、
前記複数の前記データセットの属性を識別することと、
前記複数の前記データセットの識別された属性を表し、前記属性間の１つ以上の関係を更に表す論理データを生成することと、
開発環境に、前記論理データを提供することと、
前記開発環境によって、識別された前記属性前記複数の前記データセットを表す前記論理データのうちの１つ以上の部分へのアクセスを提供することと、
前記開発環境から、動作を実行するときに、識別された前記属性のうちの少なくとも１つを指定する仕様を受信することと、
前記仕様と、前記論理データによって表される識別された前記属性間の前記１つ以上の関係とに基づいて、複数からの少なくとも１つのデータセットに記憶装置からアクセスすることによって前記動作を実行するように構成されているコンピュータプログラムを生成することであって、アクセスされた前記少なくとも１つのデータセットが、前記仕様において指定された前記属性のうちの前記少なくとも１つを有する、生成することと、を含む、１つ以上の記憶デバイスと、を備える、システム。
前記コンピュータプログラムが、前記仕様において指定された前記属性のうちの前記少なくとも１つを有するデータセットのみに記憶装置からアクセスするように構成されている、請求項１７に記載のシステム。
命令を記憶する非一時的コンピュータ可読記憶媒体であって、前記命令が、コンピューティングシステムに、
スキーマにアクセスすることであって、前記スキーマが、前記スキーマにおいて表されるデータセット間の関係、前記データセットのうちの１つ以上に対する１つ以上の計算、又はデータセットのうちの１つ以上の１つ以上の変換を指定する、アクセスすることと、
前記データセットの中から、記憶装置内の複数の前記データセットを識別することであって、前記識別することが、
前記データセットの中からデータセットを選択することと、
前記スキーマから、選択された前記データセットに関連する１つ以上の他のデータセットを識別することと、によって行われる、識別することと、
前記複数の前記データセットの属性を識別することと、
前記複数の前記データセットの識別された属性を表し、前記属性間の１つ以上の関係を更に表す論理データを生成することと、
開発環境に、前記論理データを提供することと、
前記開発環境によって、識別された前記属性前記複数の前記データセットを表す前記論理データのうちの１つ以上の部分へのアクセスを提供することと、
前記開発環境から、動作を実行するときに、識別された前記属性のうちの少なくとも１つを指定する仕様を受信することと、
前記仕様と、前記論理データによって表される識別された前記属性間の前記１つ以上の関係とに基づいて、複数からの少なくとも１つのデータセットに、記憶装置からアクセスすることによって前記動作を実行するように構成されているコンピュータプログラムを生成することであって、アクセスされた前記少なくとも１つのデータセットが、前記仕様において指定された前記属性のうちの前記少なくとも１つを有する、生成することと、を行わせる、非一時的コンピュータ可読記憶媒体。
前記コンピュータプログラムが、前記仕様において指定された前記属性のうちの前記少なくとも１つを有するデータセットのみに記憶装置からアクセスするように構成されている、請求項１９に記載の非一時的コンピュータ可読記憶媒体。