JP5863762B2 - コンピュータ支援による計算グラフの並列化 - Google Patents

コンピュータ支援による計算グラフの並列化 Download PDF

Info

Publication number
JP5863762B2
JP5863762B2 JP2013269093A JP2013269093A JP5863762B2 JP 5863762 B2 JP5863762 B2 JP 5863762B2 JP 2013269093 A JP2013269093 A JP 2013269093A JP 2013269093 A JP2013269093 A JP 2013269093A JP 5863762 B2 JP5863762 B2 JP 5863762B2
Authority
JP
Japan
Prior art keywords
component
instances
elements
sort
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2013269093A
Other languages
English (en)
Other versions
JP2014059914A5 (ja
JP2014059914A (ja
Inventor
クレイグ ダブリュ スタンフィル
クレイグ ダブリュ スタンフィル
Original Assignee
アビニシオ テクノロジー エルエルシー
アビニシオ テクノロジー エルエルシー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アビニシオ テクノロジー エルエルシー, アビニシオ テクノロジー エルエルシー filed Critical アビニシオ テクノロジー エルエルシー
Publication of JP2014059914A publication Critical patent/JP2014059914A/ja
Publication of JP2014059914A5 publication Critical patent/JP2014059914A5/ja
Application granted granted Critical
Publication of JP5863762B2 publication Critical patent/JP5863762B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/40Transformation of program code
    • G06F8/41Compilation
    • G06F8/45Exploiting coarse grain parallelism in compilation, i.e. parallelism between groups of instructions

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Stored Programmes (AREA)
  • Devices For Executing Special Programs (AREA)
  • Image Generation (AREA)

Description

関連出願の相互参照
本出願は、2003年6月25日出願の米国特許仮出願第60/482,391号の優先権を主張し、当該仮出願は引用により本明細書に組み込む。
本発明は、データの並列処理に関し、より詳細には、コンピュータ支援による並列計算グラフの仕様に関する。
発明の背景
複雑な計算は、多くの場合、計算のコンポーネントをグラフの頂点と関連付け、コンポーネント間のデータフローをグラフのリンク(枝、辺)に対応させ、有向グラフによってデータフローとして表すことが可能である。このようなグラフベースの計算を実施するシステムは、米国特許第5,966,072号「グラフとして表される計算の実行」に記載されている。
図1Aを参照すると、計算グラフ100の例には、入力ファイル110および出力ファイル140が含まれる。入力ファイル110は、トランザクション処理システムにおける別々のトランザクションとそれぞれ関連付けられたデータ記録等の、一連のワーク要素のソースである。各ワーク要素は、最初にコンポーネントA120により処理され、直列リンク125を通過し、次いでコンポーネントB130により処理される。コンポーネントBの出力は、出力ファイル140に格納される。
計算グラフは、個々のコンポーネントの多数のインスタンスを用いて実施するのが望ましい。例えば、コンポーネントの各インスタンスを異なるプロセッサでホストすることにより、粗い並列処理を達成して全体の計算能力を増大できる。図1Bを参照すると、並列化した計算グラフ101の仕様には、直列計算グラフ100と同様の入力ファイル110および出力ファイル140が含まれる。並列コンポーネントA121は、並列に編成されたコンポーネントA120のm個のインスタンスを表し、並列コンポーネントB131は、並列に表されたコンポーネントB130のm個のインスタンスを表す。並列リンク126は、並列コンポーネントA121と並列コンポーネントB131とを接続する。図1Bのような並列計算グラフの表現では、並列コンポーネントは太線で示され、コンポーネントに隣接する並列処理次数(例えば、図1Bの「m」)のインジケータを任意で用いて示される。
図1Cを参照すると、並列化した計算グラフ101は、コンポーネントA120のm個のインスタンス(A1からAmまでラベルを付す)を並列に編成して、明示的に直列形で表される。入力ファイル110からワーク要素を分配するために、1:m分岐要素115を、入力ファイル110と、コンポーネントA120のm個のインスタンスを含む並列コンポーネントA121を構成するコンポーネントAのm個のインスタンスとの間に挿入する。分岐要素115は、ワーク要素を1つの入力で受け、各入力をm出力の内の1つに、例えばラウンドロビン方式で送る。m:1の合流要素135は、m個のコンポーネントB120の出力をm本の入力ライン上で受け、その入力を、例えば到着時間に従ってマージして、出力ファイル140に出力する。並列リンク126は、本例では、コンポーネントAおよびコンポーネントBの対応するインスタンスを接続する直列リンクの並列組合せとして表される。
概要
一態様では、本発明は、一般に、並列計算グラフを自動的に規定するための方法を特徴とする。第1計算グラフの仕様を受け入れる。グラフは、リンク要素により接続されるデータ処理要素を有し、各リンク要素は、上流データ処理要素および下流データ処理要素に関連付けられる。1つ以上のリンク要素のそれぞれに対して、リンク要素のデータ処理特性が、リンク要素と関連する上流および/または下流データ処理要素の特性に従って決定される。
各データ処理要素は、頂点として表され、各リンク要素は、計算グラフの枝として表すことができる。
別の態様では、本発明は、一般に、1つ以上の並列コンポーネントを持つ計算グラフを規定する自動化した手法を特徴とする。その手法には、下流並列コンポーネントのデータフローに対する入力要件を特徴付けるメタデータを用いるステップと、データフローを処理するための少なくとも1つの機能要素を規定して、下流並列コンポーネントの入力要件を満たすステップとが含まれる。
機能要素には、分岐要素を含めることができる。分岐要素には、例えば、ハッシュ分岐要素、ラウンドロビン分岐要素、または一斉伝達要素を含めることができる。
機能要素には、ソート要素も含み得る合流要素を含めることができる。
相互接続ネットワークは、機能要素をリンクできる。
本手法には、コンポーネントの出力データフローの特性を、コンポーネントについてのメタデータに基づいて決定するステップを含めることもできる。同様に、または追加して、これらの特性は、コンポーネントに対する1つ以上の入力フローの特性に基づくことができる。出力フローの特性を決定するステップには、1つ以上の規則を適用するステップを含めることができ、および/または1つ以上の手順命令を実行するステップを含めることができる。
別の態様では、本発明は、一般に、計算グラフを並列化するための方法を特徴とする。計算グラフの仕様を受け入れる。計算グラフには、リンクにより結合された第1コンポーネントおよび第2コンポーネントが含まれる。第1コンポーネントおよび/または第2コンポーネントの並列処理次数の仕様も受け入れる。直列リンクと対応するコンポーネント間リンクは、少なくとも規定した並列処理次数に基づく並列特性を有するように形成される。
別の態様では、本発明は、一般に、直列計算グラフを並列化するためのコンピュータ実装方法を特徴とする。本方法には、(a)前記並列化グラフのコンポーネントへの入力フローの特性を、そのコンポーネントの1つ以上の出力フローの特性にマッピングするステップと、(b)2つのコンポーネント間のリンクを実装する機能要素についての特性を、そのリンクからデータを受け入れるコンポーネントの要求入力特性に基づいて決定するステップと、(c)コンポーネントの入力フローの前記特性を、別のコンポーネントからの出力フローの特性、および、かかる別のコンポーネントと前記コンポーネントとを接続するリンクに対する機能要素の決定された特性に基づいて決定するステップとを含む各ステップの繰り返し適用を含む。
別の態様では、本発明は、一般に、ソート順序に従ってソートするデータフローを実施する手法を特徴とし、ソート順序に関する1つ以上のインジケータをソートデータに加えてフロー上を通過させる。インジケータの内の少なくとも幾つかが、データについてのソート順序における順位をそれぞれ識別し、それにより、フロー上の後続データが、ソート順序における識別した順位より早く発生しないようにする。
本発明の態様は、次の利点の内の1つ以上を有することができる:
直列計算グラフは、ユーザからの入力なしで、または限られたユーザからの入力で並列化でき、それにより、並列化した計算グラフを設計する処理を簡略化できる。
自動化した手順は、ユーザに頼って入力要件を満たすのではなく、自動化したシステムが、グラフ内のコンポーネントの入力要件が満たされていることを検証できるので、エラーが少なくなる傾向がある。
本発明の態様は、最初の直列(または並列)計算グラフと、並列計算グラフとの機能的等価性を保証することに関する技術的考察に関わる。技術的効果は、直列計算グラフにより規定される計算が、幾つかの別々のプロセッサ上で並列実行されるよう分配でき、それにより、直列実行と比較して並列実行のスループットが増大するということである。
本発明の他の特徴および利点は、以下の説明および請求項から明らかである。
図1Aは、直列計算グラフである。 図1Bは、並列化した計算グラフである。 図1Cは、図1Bに示す並列化した計算グラフの直列表示である。 図2Aは、並列化した計算グラフの一部である。 図2Bは、コンポーネント間リンク上に表される要素を持つ並列化した計算グラフの一部である。 図2Cは、図2Bに示す並列化した計算グラフの一部の直列表示である。 図3は、自動並列化手順のフロー図である。
説明
図1A〜図1Cを参照すると、図1Aに示す直列計算グラフ100は、簡単な計算グラフの一例であり、状況によっては、図1B〜図1Cに示す並列計算グラフ101として実施できる。例えば、入力ファイル110からの各ワーク要素を他の全てのワーク要素と独立して処理できる場合、並列計算グラフ101は、直列計算グラフ100と同一の計算を実行することになる。注意すべきは、同一の計算を実行するとはいえ、直列グラフ100の場合に出力ファイル140が受け取るワーク要素の順序は、並列グラフ101の場合と同一であるとは限らない、ということである。この例では、出力ワーク要素の順序は、計算ネットワークの機能に対して重要ではない。
コンポーネントA120の特性に依存して、入力要素を分割してコンポーネントAの各種インスタンスで処理するために、特定種類の分岐要素115が必要なこともある。例えば、計算グラフ100が、特定アカウントにそれぞれ関連付けられたトランザクション記録を処理するためのものである場合、並列計算グラフが直列グラフと機能的に等価であるために、いずれの特定アカウントについての全ての記録も、コンポーネントA120の共通のインスタンスにより処理するよう要求してもよい。直列グラフ100では、コンポーネントA120のインスタンスが1つしかないので、このような要件が満たされる。並列グラフ101では、特定アカウントについての全ての記録がコンポーネントAの共通のインスタンスに送られるという要件は、例えばラウンドロビン分岐要素等、幾つかの1:m分岐要素115の形式ついては保証されない。この例では、適切な分岐要素115がハッシュ関数に従って、各記録におけるアカウントフィールドの値を、分岐要素115の出力の1つとそれぞれ関連付けられたm個の異なる値にマッピングする。いかなる特定ハッシュ値を生み出す記録も、全て同一出力に送られるので、並列グラフ101においてコンポーネントA120の共通のインスタンスにより処理される。このような1:m分岐要素115は、ハッシュ分岐要素と呼ばれる。ハッシュ関数は、分岐要素115の出力のそれぞれに送られる各記録が、平均して数の偏りがないように設計される。
直列計算グラフ100に基づいて並列計算グラフ101の仕様を決定するユーザは、直列グラフの仕様を変換して直列グラフの所望の機能を保存する。例えば、図1Aに示す直列グラフについて、ユーザは、並列処理次数(m)をコンポーネントA120およびB120について規定し(本例ではともに同一の並列処理次数を有する)、分岐要素115および合流要素135をグラフに追加し、そして追加した要素の特性を規定することができる。例えば、コンポーネントA120がアカウント番号に従って分岐された記録を要求する場合、ユーザは、コンポーネントA120の要件を認識し、手動で分岐要素115を構成して、アカウント番号のハッシュ値に従って記録を分割する。
一般に、コンポーネントA120の特性に依存して、分岐要素115を規定するユーザは、各種の分岐要素から選択できる。これらの分岐要素の種類には以下が含まれるが、必ずしもこれらに限定されない:
・ワーク要素を分岐する基準となる各ワーク要素内の1つ、または複数のキーにより規定されるハッシュ分岐要素;
・ワーク要素のキー値とは無関係にワーク要素を分割するラウンドロビン分岐要素、普通は異なる出力間を巡回する;および、
・各入力ワーク要素の複製が出力のそれぞれに送られる一斉伝達分岐要素。
また、並列処理グラフ101を規定するユーザは、合流要素135の特性を規定しなければならないこともある。例えば、入力ワーク要素は、トランザクション記録にあるアカウント番号等の、ワーク要素のキー値に従ってソートされている場合がある。直列グラフ100では、その順序は保存されよう。しかしながら、並列グラフ101では、異なる分岐が僅かに異なるレートでその出力を処理するだけでも、その順序が乱れることがある。従って、結果的に得られる出力ファイル140の順序が直列グラフ100を用いて拘束されるものと一致すべき場合、合流要素135は様々な分岐から受け取るワーク要素内の特定キー、例えばアカウント番号に従って、その入力をソートすべきであるとユーザは規定できる。
出力合流要素135の所望の特性、および合流要素への入力についてなし得る仮定に依存して、並列グラフを規定するユーザは、合流要素の種類を選択する。合流要素の利用可能な種類には、以下が含まれるが、限定はされない:
・ワーク要素を入力から出力へ任意の順序で、例えば合流要素に到着した時間に従って通過させる任意の合流要素;および、
・キーに従って入力をソートしてから出力へ通過させるソート合流要素。
図1Aに戻って参照すると、入力ファイル110からのワーク要素を、コンポーネントA120およびコンポーネントB130の両方に適するように分岐できない状況もあり得る。例えば、トランザクション記録の場合、コンポーネントAについてはアカウント番号により、コンポーネントBについては受取人により、ワーク要素を分岐する必要があるかもしれない。このような場合、図1Cに示すようなコンポーネントAおよびコンポーネントBの対応するインスタンス間の直接リンクは、一般に許容されない。このような直接リンクが不可能なもう1つの状況は、コンポーネントBとは異なる並列処理次数がコンポーネントAに望ましい場合である。例えば、コンポーネントAがコンポーネントBの2倍のリソースを要求する場合、コンポーネントAには2倍の数のインスタンスが規定可能で、それにより、コンポーネントAおよびBの異なる対応インスタンス間の直接リンクが不可能になる。
図2A〜図2Cを参照すると、より一般的な例で、直列グラフと機能的に等価な並列計算グラフの規定が、幾つかのステップで実行される。図2Aは、コンポーネント間リンク(ICL)205によりリンクされた並列コンポーネントA210およびB240を含む、並列グラフ200の一部を示す。図2Aのグラフ表現では、ICL205の並列特性は明示的でない。これらの特性は、この手法では、並列グラフ200で実行される計算が、コンポーネントAおよびBが次数1を有する直列グラフと等価となるように決定される。図2Aでは、コンポーネントAは並列次数mを有し、コンポーネントBは並列次数nを有すると示され、ここで、mは必ずしもnと等しくない。ICL205の特性は、並列コンポーネントB240の直列インスタンスの入力の要件(例えば、分岐または順序要件)、および/または並列コンポーネントA210の直列インスタンスの出力の特性(例えば、分岐またはソート特性)を含む因子に依存する。
図2Bを参照すると、第2並列グラフ201は、相互に接続された要素のネットワークとしてICL205を表す。このネットワークは、並列コンポーネントA121と並列コンポーネントB131との間のリンクを提供し、グラフの全体機能が正しくなるように並列コンポーネントを構成する直列コンポーネント間でワーク要素を適切に「シャッフル」する。ICL205のネットワーク表現は、並列コンポーネントA121の出力を取り込む並列分岐要素221、相互接続ネットワーク225、および出力が並列コンポーネントB131への入力を提供する並列合流要素231を用いて、このシャッフルを実行する。
この例では、並列コンポーネントA210は並列処理次数mを有し、一方、並列コンポーネントB240は並列処理次数nを有し、これは必ずしもmと同一ではない。並列コンポーネントA210と、並列分岐要素221との間の並列リンクは、m本の直列リンクを表す。並列分岐要素221の出力は、mn(m×n)本の直列リンクを表す。相互接続ネットワーク225は、mn本の入力およびmn本の出力を有する。並列合流要素231は、mn本の入力およびn本の出力を有する。
図2Cを参照すると、図2Bに示す並列計算グラフ201の一部の直列表現で、並列分岐要素221は、分岐要素220のm個のインスタンスにより実施される。これらの分岐要素のそれぞれは、図1B〜図1Cに示す分岐要素115と類似した1:nの分岐要素である。並列合流要素231は、合流要素230のn個のインスタンスにより実施される。これらの合流要素のそれぞれは、図1B〜図1Cの合流要素135と類似のm:1合流要素である。相互接続ネットワーク225は、分岐要素220の全てのインスタンスが、合流要素230の全てのインスタンスに接続された直列リンクのクロス接続として実施される。並列グラフの代替表現の幾つかでは、単一のシンボルまたはアイコンを用いて分岐要素221と相互接続ネットワーク225との組合せを表し、この組合せもまた「分岐要素」と呼ぶ。
このように、図2Bに示すように並列コンポーネントA210と、並列コンポーネントB240とをリンクするICL205のネットワーク表現を規定するユーザは、(コンポーネント間リンク(ICL)205を形成する相互接続ネットワーク225と併せて)並列分岐要素221および並列合流要素231の特性を規定する。ユーザは、下流コンポーネントB130の認識要件と、上流の並列コンポーネントA121を構成するコンポーネントA120のインスタンスの出力特性についてユーザが為し得る何らかの仮定とに基づいて、これらの特性を選択する。
コンポーネント間リンク205の特性を規定する例として、コンポーネントA210は、ワーク要素がアカウント番号に従って分岐されるよう要求し、一方、コンポーネントB240は、出力が郵便番号に従って分岐されるよう要求すると想定する。コンポーネントAへの入力が適切に分岐されたと仮定すると、コンポーネントAの出力もまた同様に分岐されることになる。すなわち、この例では、図2BのコンポーネントA210の出力は、アカウント番号に従って分岐されることになる。コンポーネント間リンクの1:n分岐要素220のそれぞれは、各ワード要素内の郵便番号キーを用いて、どの出力にワーク要素を渡すかを決定するハッシュ分岐要素である。同一の郵便番号をもつワーク要素は、コンポーネントA210の別々のインスタンスにより処理されているのが一般的であり、従って、1:nハッシュ要素220の別々のインスタンスを通過することになる。同一のハッシュ値と対応する各1:nハッシュ分岐要素220からの出力は、コンポーネント間リンクの共通の合流要素230に渡される。この例では、コンポーネントBに提示されるワーク要素の順序は重要ではないので、合流要素230のそれぞれは、ワーク要素を到着順で対応するコンポーネントに渡す。
自動化した、またはコンピュータ支援による、直列グラフを並列化するための手法は、ICL205のネットワーク表現、およびネットワーク表現の全体のリンクおよび要素(例えば、分岐要素)の特性を決定する。ユーザは、図2Bに示すようなICL205のネットワーク構造を必ずしも考慮せずに、図2Aに示すようなグラフ表現を用いる。その手法は、コンポーネント間リンクのネットワーク表現の分岐、相互接続、および合流要素を明示的に挿入するようユーザに要求することなく、コンポーネント間リンクの要素を追加して、上記手法と基本的に同一の結果を達成する。
この自動化した、またはコンピュータ支援による手法の一態様は、計算グラフ内のコンポーネントの幾つか、または全ての入力要件を特性化する情報の使用、およびコンポーネントの幾つか、または全ての出力特性を決定する方法に関する。このために必要な情報は、コンポーネントと関連付けたメタデータとして格納される。このメタデータは自動化した並列化手順により用いられる。
直列グラフ(例えば、グラフ200)内の1つ以上のコンポーネントはそれぞれ、コンポーネントが要求する各入力特性に関するメタデータを含む。例えば、コンポーネントの特定の入力を特定の方法で分岐するよう要求する場合、その入力に対する入力メタデータには、どのキーまたはフィールドに従ってワーク要素を分岐しなければならないかのインジケータを含むことができる。コンポーネントが多数の入力を有する場合、各入力は、それと関連付けられた別々のメタデータを有する。例えば、ある入力は、全てのワーク要素の複製が入力に配分されなければならないことを示す一方、別の入力は、ワーク要素が各ワーク要素のアカウント番号により分岐されなければならないことを示す場合がある。
コンポーネントへの入力についてのメタデータ特性には、以下の1つ以上を含めることができる:
・分岐する場合、1つまたは複数の特定キーに基づいて入力を分岐しなければならないことを示すインジケータ;
・コンポーネントの各インスタンスが、全てのワーク要素の複製を入力で受け取らなければならないことを示すインジケータ;および、
・入力をソートしなければならないことを示すインジケータ、およびソート順序を定義する1つまたは複数のキー。
1つ以上のコンポーネントの別の特性化は、コンポーネントの入力フロー特性、およびコンポーネント自体の特性に基づく各出力フロー特性に関する。このような特性化の一例は、入力フローで順に受け取る各ワーク要素を処理するコンポーネントについてのものである。このようなコンポーネントについて、入力ワーク要素が特定キーに基づいてソートされる場合、コンポーネント内で順序変更がないので、出力ワーク要素もまた、その同一キーに従ってソートされる。同様に、特定キーに従って分岐されたワーク要素をコンポーネントが受け取る場合、そのキーの値をコンポーネントが修正しない場合、出力ワーク要素は、そのキーに基づいて分岐したままとなる。(注意すべきは、コンポーネントがキーの値を修正する場合、出力がもはやキーの修正値に従って分岐されるとは限らない、ということである)。
この特性化は、一般に、コンポーネントの各入力フロー特性を受け入れ、各出力フローについての特性を作り出す、コンポーネントに特有のマッピング機能を定義する。
フローの特性化は、コンポーネントに対する入力要件の特性化と類似している。特に、フローの特性化には、以下を含めることができる:
・フローがワーク要素の分岐サブセットだけを含むことを示すインジケータ、分岐する場合は、フローを分岐する基準となった1つまたは複数の特定キー;および、
・フローがソートされていることを示すインジケータ、およびソート順序を定義する1つまたは複数のキー。
コンポーネントについての入力特性から出力特性へのマッピングをコード化する幾つかの代替法を用いることができる。例えば、マッピングは、コンポーネントと関連付けられた手順命令内で明示的にコード化できる。マッピングをコード化する別の方法は、コンポーネントがワーク要素内のどのキー値を修正すると、ソート順序または分岐が乱れる可能性があるかのインジケータ、およびそのコンポーネントが明示的に実施するソート、順序変更、または分岐に関する明示的なインジケータに基づく。マッピングは、入力特性およびこれらの表示に基づき、例えば、一般的な、またはコンポーネントに特有の一組の規則を用いる。このようなマッピング規則の例には以下が含まれる:
・1入力および1出力を持ち、キーkey1の値の修正を示さないコンポーネントについては、key1に従って分岐された入力は、key1に従って分岐されたままの出力を生じる;
・1入力および1出力を持ち、キーkey2の値の修正を示さないコンポーネントについては、key1、続いてKey2に従ってソートされた入力は、key1だけに従ってソートされた出力を生じる;
・入力ワーク要素の順序変更を示すコンポーネント。ソートされた入力は、それ以上ソートされないことを示す出力を生じる。なぜなら、そのコンポーネントはソート順序を乱しているかもしれないからである;および、
・キーkey1の値に従ってソートを明示的に実施するコンポーネントは、入力のソート順序とは無関連にkey1に従って出力がソートされることを示す。
コンポーネントには、ワーク要素内のフィールド名を変更するものもある。このようなコンポーネントについてのメタデータは、このような名称変更を識別し、出力特性は新規に命名した変数により表される。例えば、入力が「アカウント」キーにより分岐され、かつ「アカウント」フィールドが「顧客」フィールドとして名称変更される場合、出力は、「顧客」フィールドに従って分岐されるとして特性化される。
図3を参照すると、直列計算グラフから並列計算グラフを規定するための自動化した手順300は、並列化すべき直列グラフの仕様を受け入れるステップで開始する(ステップ310)。この仕様には、各コンポーネントのどの出力がフローにより別のコンポーネントの各入力に接続されるかを規定するグラフのトポロジとも呼ばれるグラフの構造の仕様が含まれる。仕様には、上記各コンポーネントについてのメタデータ、すなわち、もしあれば、1つ以上のコンポーネントの各入力についての入力要件、およびコンポーネントについての入力特性と出力特性との間のマッピング、またはコンポーネント出力の他の特性化も含まれる。注意すべきは、このメタデータは、あるコンポーネントはいかなる入力要件も規定せず、また、あるコンポーネントは出力フローの特性を生み出すマッピングを提供しないという点で、任意であるということである。コンポーネントがいかなる入力特性も規定しない場合、手順は、入力フローについての何らかの特定の特性を必ずしも強化するとは限らない。コンポーネントが、その出力フローの特性を生み出すマッピングを提供しない場合、手順は、これらの特性に関する何らかの仮定を行うとは限らない。
本手順でユーザは、計算グラフの各コンポーネントに対して所望の並列処理次数を規定する。本手順の応用の一例として、図1Aに示す単純な直列計算グラフ100を検討する。コンポーネントA120がm=3個の並列インスタンスを有し、およびコンポーネントB130がn=5個の並列インスタンスを有することをユーザが規定すると仮定する。この例では、入力ファイル110および出力ファイル140は、物理ファイルを表す並列次数1を有し、直列アクセスをサポートする。
最初の直列グラフの各リンクに対して、手順は、コンポーネント間リンク(すなわち、分岐要素、相互接続ネットワーク、および合流要素)の特性を決定して、並列計算グラフの直列リンクを実施する。手順は、次の4段階を繰り返す:
(a)1つ以上のコンポーネントの入力から出力へのリンク特性をマッピングするステップ(ステップ320);
(b)上流コンポーネントの出力特性が既知である各コンポーネント間リンクに対して、下流の入力の既知の要件のいずれかに基づいて、コンポーネント間リンクの分岐要素、相互接続ネットワーク、および合流要素を含む、コンポーネント間リンクの特性を決定するステップ(ステップ330);
(c)ステップ(b)で処理されたコンポーネント間リンクのそれぞれについて、コンポーネント間リンクの出力と関連付けられた下流コンポーネントの結果的に得られる入力フロー特性を決定するステップ(ステップ340);および、
(d)コンポーネント間リンクのネットワーク表現のコンポーネントを、並列グラフの対応するコンポーネント間に挿入するステップ(ステップ350)。
全ての並列リンクが処理されると(ステップ360)、並列コンポーネントのそれぞれを展開することにより、等価な直列計算グラフが形成される。
手順のマッピング段階(ステップ320)では、通常全てではないコンポーネントからの1つ以上の出力フロー特性が計算される。例えば、最初の繰り返しで、入力がないコンポーネントからのフロー特性が計算できる。続く繰り返しでは、全ての入力フローについて入力特性を計算した任意のコンポーネントについてのマッピングを用いて、そのコンポーネントの出力フロー特性を決定する。
次の段階(ステップ330)で、1つ以上のコンポーネント間リンクの分岐および合流要素の特性が、そのリンクの上流コンポーネントの並列処理次数(m)、および下流コンポーネントの並列処理次数(n)、上流コンポーネントからの出力フローの特性、および下流コンポーネントの入力フローの要件に基づいて決定される。以下は直接取り扱うことができる幾つかの事例である:
(P1)m=nで、かつ下流コンポーネントへの入力フローを、いずれかの特定キーに基づいて分岐、またはソートする必要がなく、入力フローが各ワーク要素の複製を必要としない場合、上流および下流コンポーネントの対応するインスタンスは、図1Bの例に示すように、直接接続される。注意すべきは、これは、基本的に分岐および合流要素の退化した形式に相当する、ということである。
(P2)m≠nで、かつ下流コンポーネントへの入力フローを、いずれかの特定キーに基づいて分岐する必要がなく、入力フローが各ワーク要素の複製を必要としない場合、コンポーネント間リンクの分岐要素は、ラウンドロビン分配を実行するよう定義する。
(P3)下流コンポーネントへの入力フローが、上流コンポーネントの出力フローの分岐と異なる一組のキーに従ってワーク要素を分岐することを要求する場合、分岐要素は、要求されたキー値に従ってハッシュ分岐を実行する。
(P4)入力フローが各ワーク要素の複製を要求する場合、コンポーネント間リンクの分岐要素は、一斉伝達機能を実行するよう定義する。
事例(P2)〜(P4)のそれぞれについて、下流コンポーネントの入力フロー特性に適合させるためのコンポーネント間リンクの合流要素に関する幾つかの特別な場合がある:
(G1)下流コンポーネントの入力フローが、入力が特定組のキーに従ってソートされることを要求し、かつ上流コンポーネントの出力がこれらと同じキーに従ってソートされる場合、合流要素はソート合流を実行する。ソート合流では、合流要素は、入力のそれぞれのワーク要素がソートされると仮定し、ソートキーに従って次にどの入力を出力として選択するかを選択し、出力の正しいソート順序を達成する。
(G2)下流コンポーネントの入力フローが、入力が特定組のキー(key1、...、keyJ)に従ってソートされることを要求し、かつ上流コンポーネントの出力が一組のキー(key1、...、keyJ、...、keyK)に従ってソートされる場合、分岐要素は、ソート化合流を実行する。J=Kの場合、特別な場合(G1)に帰着する。
(G3)入力フローが、入力が特定組のキーに基づいてソートされることを要求し、かつ上流コンポーネントの出力が互換性のある組のキーに従ってソートされない場合、合流要素はソートを実行する。
他の形式の分岐および合流要素を用いることもできる。例えば、m=nで、かつ下流コンポーネントが、いずれの特定の分岐も要求しないが、特定キーに従うソートを要求する場合、対応する上流および下流コンポーネントは、要求されるソートを実行する1入力/1出力の「合流」要素だけを有するコンポーネント間リンクにより接続できる。注意すべきは、コンポーネント間リンクへの入力は分岐を維持し、コンポーネント間リンクはソートされた特性を追加するということである。
サイクルの次の段階(ステップ340)では、下流コンポーネントの入力フロー特性は、上流コンポーネントの出力フロー特性、および中間のコンポーネント間リンクの特性から決定される。注意すべきは、一般に、少なくとも入力に対する要求特性は、これらのフロー上に存在するということである。コンポーネントの出力フローの特性に反映させられる追加の特性も存在し得る。例えば、フローがあるキーに従って分岐され、かつ下流コンポーネントが、入力が別のキーでソートされることを要求する場合、ソートだけが要求されているにもかかわらず、結果的に得られるフローは、分岐およびソートの両方が行われる。
サイクルの最後の段階(ステップ350)では、コンポーネント間リンクのネットワーク表現の要素がグラフに追加される。
サイクルの各繰り返し(ステップ320〜350)の最後に、コンポーネントへの追加入力フローの特性が計算される。最初の計算グラフが非循環の場合、最初のグラフの全てのリンクが処理された時に本手順は終了する。
全てのリンクが処理されなかった場合、例えば、上流コンポーネントの出力フローの特性が計算されなかった場合、手順を再開する手法は、コンポーネント間リンクの特性を決定する際に、フロー特性に関する仮定を行わないことである。このような再スタートは、非循環でない計算グラフで、または幾つかのコンポーネントについてメタデータが利用可能でないグラフで要求されることがある。例えば、フローが実際には既に分岐されていたとしても、冗長な分岐要素をコンポーネント間リンクに挿入できる。効率的ではない可能性もあるが、並列グラフの正しい機能は依然として保たれよう。
上記の自動化した手順では、ユーザにコンポーネント間リンクのコンポーネントの挿入を明示的に指示できる。代替として、ユーザは、元の直列計算グラフのリンクのそれぞれに導入されるコンポーネント間リンクの性質を意識しなくてもよい。ユーザインターフェースは、これらの分岐および合流要素を隠すか、またはデフォルトでコンポーネント間リンクのネットワーク表現を表示するのではなく、ユーザが操作するこれら要素のオプション表示を提供できる。
コンピュータ支援(例えば、部分的に自動化した)モードでは、分岐および合流要素の幾つかを明示的に導入することにより、ユーザがその手順を導く。例えば、ユーザは、自動化した手順が適用される前に、特定の分岐および合流要素、または他の形式の要素を並列リンク上で用いるよう規定でき、それにより、そのリンクに対する自動化した手順をオーバーライドできる。コンピュータ支援モードの別の態様では、ユーザは自動化した処理の結果を調査し、コンポーネント間リンクの分岐および合流要素を修正できる。注意すべきは、ユーザがリンクを修正した後、自動化した処理はオプションとして、そのリンクから下流にフロー特性を伝搬する。下流の変化は、下流のコンポーネント間リンクの新仕様をもたらすことになる。
別のコンピュータ支援モードでは、自動化した手順は、各コンポーネントの入力要件が満たされていることを検証し、満たされていない場合、ユーザに通知する。次いで、ユーザは、入力要件を満たす要素を導入でき、次に、システムは改良した設計を自動的に再チェックできる。このモードの変形として、システムは、入力要件を満たすためにグラフの修正(例えば、コンポーネント間リンク上への分岐または合流要素の可能な挿入)を提案してもよく、ユーザは提案された修正を用いることを確認するか、または代替の修正(例えば、異なる要素の挿入、または挿入した要素の異なる特性の規定)を提供する。
上記の並列処理手法では、ユーザは、コンポーネントのそれぞれについて特定の並列処理次数を選択してから、自動手順を適用する。代替の手法では、ユーザは、どのコンポーネントが並列処理されるか、またはそれらの並列処理次数と関連付けられた変数の識別だけを行うが、所望する並列処理の次数を必ずしも規定するとは限らない。その結果は、各コンポーネント間リンクの特性が決定される「一般的な」並列計算グラフとなるが、並列コンポーネントと同様に、コンポーネント間リンクのネットワーク表現における並列要素の特定の実現は、まだ決定されていない。コンポーネントについての所望の並列処理次数の特定の値を用いることを規定する場合(例えば、グラフの実行時間に)、一般的なグラフは、特定の並列化した形式で実現される。
上記の並列化手法では、フロー特性は、基本的に「あふれる」手法で伝搬される。すなわち、データフロー特性は、データフロー自体と同一の方向で「下流に」伝搬する。代替の手法を用いてもよい。例えば、上流への伝搬を用いることができる。このような上流伝搬の単純な実施例を、一連の2つのコンポーネントAおよびBがある場合に用いることができる。AおよびBがともに同一の並列処理次数を有し、Bがキーに従う分岐を要求し、Aがいずれの特定の分岐も要求しない場合、分岐要件を上流に伝搬して、それによりAがBと同一の分岐を要求することもできる。こうして、AとBとの間の明示的な分岐および合流要素を導入することなく、AおよびBの対応するインスタンス間の直接リンクを用いることが可能になる。
直列グラフのコンポーネントは、直列サブネットワークの全体を表すこともできる。自動並列化手法の一手法は、直列サブネットワークがそのホストグラフ内で完全に展開されるかのように、サブネットワークを並列化することである。
代替の手法では、直列サブネットワークは、それをホストするネットワークと独立して並列化される。サブネットワークを通じたフロー特性の全体マッピングを含む、全体としてのサブネットワークの特性化を行うメタデータは、ホストネットワークの並列化手順中に用いるために、サブグラフ内のコンポーネントについてのメタデータに基づいて計算される。
上記並列化した計算グラフで用いることができる要素の一種は、ソートマージ要素である。上で注記したように、ソートマージ要素が仮定するのは、その入力のそれぞれのワーク要素が特定のソート順序に従ってソートされ、ソートマージ要素は、同一のソート順序に従って全体のマージ出力を生成しなければならないということである。このようなソートマージ要素が後続する場合の基本手順は、その入力のそれぞれで保留されている各ワーク要素を考慮し、ソート順序に従って、次のワーク要素を出力として通過させることである。
しかしながら、どの入力にも保留中のワーク要素がない場合、ソートマージは、その入力に後から到着するワーク要素が既に保留となっている入力より早いソート順序で発生するかどうか判らないので、どのワーク要素も通過させない。次いで、ワーク要素は、フロー終了のインジケータがリンクに到着するまで保持され、到着した時点で、ソートマージ要素は、それ以上のワーク要素がそのフローに到着しないと見なすことができる。
このような阻止挙動が並列化したグラフに発生する状況もある。例えば、m個のインスタンスのそれぞれ、またはコンポーネントAの出力が、キーkey1に従ってソートされ、下流コンポーネントBが、入力がキーkey2に従ってソートされ、キーkey1に従って分岐されるよう要求すると想定する。key1に従うAの出力の分岐がメタデータにより規定されない場合、並列化手法は、key1に従って分岐するコンポーネント間リンク内のハッシュ分岐要素、続いてkey2に従ってソートするソート合流を用いる。しかしながら、コンポーネントAの出力が既にハッシュ分岐されている場合、各ハッシュ分岐要素に対して、1出力だけが何らかのワーク要素を受け入れる。同様に、結果として、ソートマージ要素で、各ソートマージ要素に対して1入力だけが入力を受け入れる。これは、フロー終了インジケータがハッシュ分岐要素からソートマージ要素に渡されるまで、全体のフローを不必要に妨げる。
この状況を避ける方法は、ソートされた入力を受け取るハッシュ分岐要素が、その出力リンクのそれぞれについてソート値インジケータを繰り返し送って、その出力の内の少なくとも1つが到達したソート順序の値を示すことである。このソート値インジケータは、ソート順序で早い値をもつワーク要素が、このリンクを介して提供されないことを下流コンポーネントに合図する。このようなソート値インジケータを受け取るソートマージ要素は、インジケータを用いて、例えば、受け取ったソート値インジケータの値に先行するソート値を有するという理由で、別の入力から保留になっているワーク要素を渡すことができるかどうかを決定する。
ソート値インジケータは、コンポーネントを通じてワーク要素のフローに基づいてできるだけ頻繁に、または少ない頻度で、例えば、処理されるワーク要素の数に従って、もしくは時間に従って、周期的に送ることができる。ソート値インジケータは、分岐され得る任意のソートされたフロー上で送ることができ、このようなインジケータは、インジケータを受け取る分岐要素の出力上で一斉伝達される。
下流のソートマージ要素を妨げる問題に対する別の解決法は、上流のハッシュ分岐要素の入力をスクランブルすることであり、それにより、一般に、少なくとも幾つかのワーク要素がハッシュ分岐要素の各出力に渡される。
上記自動手法はコンピュータ上で実行するためのソフトウエアを用いて実装できる。例えば、ソフトウエアは、少なくとも1個のプロセッサ、少なくとも1台のデータ格納システム(揮発性または不揮発性メモリ、および/または格納素子を含む)、少なくとも1台の入力装置またはポート、および少なくとも1台の出力装置またはポートを含む、1台以上のプログラムされた、またはプログラム可能なコンピュータシステム(分散、クライアント/サーバ、またはグリッド等の各種アーキテクチャのものでよい)上で実行される1つ以上のコンピュータプログラムで手順を形成する。ソフトウエアは、例えば計算グラフの設計および構成に関する他のサービスを提供する、より大きなプログラムの1つ以上のモジュールを形成してもよい。
ソフトウエアは、汎用もしくは専用のプログラム可能なコンピュータにより可読のCD−ROM等の媒体で提供するか、または実行されるコンピュータにネットワークを介して配信(伝搬される信号でコード化して)できる。全ての機能は、専用のコンピュータ上で、またはコプロセッサ等の専用のハードウエアを用いて、実行できる。ソフトウエアは、ソフトウエアが規定する計算の異なる部分を異なるコンピュータで実行する分散式で実装してもよい。このようなコンピュータプログラムはそれぞれ、汎用もしくは専用のプログラム可能なコンピュータにより可読の格納媒体もしくは装置(例えば、固体メモリもしくは媒体、または磁気式もしくは光学式媒体)に格納またはダウンロードして、格納媒体もしくは装置をコンピュータシステムが読み取って、本明細書で説明する手順で実行する際、コンピュータを構成し、動作させるのが好ましい。本発明のシステムは、コンピュータプログラムを伴って構成したコンピュータ可読の格納媒体として実装することも考えられ、そのように構成された格納媒体は、コンピュータシステムを特定の、および所定の方法で動作させて、本明細書で説明した機能を実行する。
言うまでもなく、先に述べた説明は、説明を意図としたものであり、付帯の請求の範囲が定義する本発明の範囲を制限するものではない。他の実施の形態は、以下の請求の範囲内にある。

Claims (27)

  1. コンピュータシステム内のプロセッサ及びメモリを用いてデータを処理する方法であって、
    前記方法は、前記プロセッサによって実行される、
    第1のコンポーネントの複数のインスタンスと、コンポーネント間リンクと、第2のコンポーネントの複数のインスタンスとを用いてデータを処理するステップであって、前記コンポーネント間リンクは、前記第1のコンポーネントの前記複数のインスタンスから複数の出力を受信し、前記第2のコンポーネントの前記複数のインスタンスの複数の入力に提供される複数の出力を生成する、ステップを含み、
    前記コンポーネント間リンクは、前記第1のコンポーネントの前記複数のインスタンスから前記複数の出力を受信する複数の分岐要素と、前記第2のコンポーネントの前記複数のインスタンスの前記複数の入力に提供される前記複数の出力を生成する複数の合流要素とを含み、
    前記ステップは、
    各分岐要素で、前記第1のコンポーネントの前記複数のインスタンスの1つから、ソート順序に従ってソートされたデータを受信するステップと、
    前記ソートされたデータを前記複数の分岐要素から前記複数の合流要素に通過させるステップと、
    各分岐要素の複数の出力上でソート値インジケータを送信し、前記分岐要素の前記複数の出力の少なくとも1つによって到達された前記ソート順序の値を示すステップと、
    前記複数の合流要素で、データを合流及びソートするステップと、
    ソートされたデータを前記複数の合流要素から前記第2のコンポーネントの前記複数のインスタンスに通過させるステップであって、前記ソートされたデータを前記第2のコンポーネントの前記複数のインスタンスに通過させることは、前記ソート値インジケータに基づく、ステップと、
    前記第2のコンポーネントの前記複数のインスタンスを用いて前記複数の合流要素から受信された前記データを処理するステップと、
    を含む、方法。
  2. 前記第1のコンポーネントの前記複数のインスタンスから前記ソートされたデータを受信するステップは、第1のキーに従ってソートされた複数のワーク要素を受信するステップを含む、請求項1に記載の方法。
  3. 前記第2のコンポーネントは、その複数の入力で受信されたデータが第2のキーに従ってソートされ、前記第1のキーに従って分岐されることを要求する、請求項2に記載の方法。
  4. 前記分岐要素は、前記第1のキーに従って前記データを分岐させる、請求項3に記載の方法。
  5. 前記複数の合流要素は、前記第2のキーに従って前記データをソートする、請求項4に記載の方法。
  6. 前記ソート値インジケータを送信するステップは、前記分岐要素の前記複数の出力の各々の上で前記ソート値インジケータを送信し、前記複数の出力の少なくとも1つの上でワーク要素によって到達された前記ソート順序の値を示すステップを含む、請求項2に記載の方法。
  7. 前記ソート値インジケータは、前記ソート値インジケータが送信された前記出力から、前記ソート順序においてより早い値を有するワーク要素が提供されないことを、前記第2のコンポーネントに合図する、請求項6に記載の方法。
  8. 前記ソート値インジケータは、処理されるワーク要素の数に従って繰り返し送信される、請求項6に記載の方法。
  9. 前記ソート値インジケータは、時間に従って繰り返し送信される、請求項6に記載の方法。
  10. コンピュータ可読媒体に格納されたコンピュータプログラムであって、前記コンピュータプログラムは、プロセッサ及びデータ格納システムを含むコンピュータシステムに、
    第1のコンポーネントの複数のインスタンスと、コンポーネント間リンクと、第2のコンポーネントの複数のインスタンスとを用いてデータを処理するステップであって、前記コンポーネント間リンクは、前記第1のコンポーネントの前記複数のインスタンスから複数の出力を受信し、前記第2のコンポーネントの前記複数のインスタンスの複数の入力に提供される複数の出力を生成する、ステップを実行させるための命令を含み、
    前記コンポーネント間リンクは、前記第1のコンポーネントの前記複数のインスタンスから前記複数の出力を受信する複数の分岐要素と、前記第2のコンポーネントの前記複数のインスタンスの前記複数の入力に提供される前記複数の出力を生成する複数の合流要素とを含み、
    前記ステップは、
    各分岐要素で、前記第1のコンポーネントの前記複数のインスタンスの1つから、ソート順序に従ってソートされたデータを受信するステップと、
    前記ソートされたデータを前記複数の分岐要素から前記複数の合流要素に通過させるステップと、
    各分岐要素の複数の出力上でソート値インジケータを送信し、前記分岐要素の前記複数の出力の少なくとも1つによって到達された前記ソート順序の値を示すステップと、
    前記複数の合流要素で、データを合流及びソートするステップと、
    ソートされたデータを前記複数の合流要素から前記第2のコンポーネントの前記複数のインスタンスに通過させるステップであって、前記ソートされたデータを前記第2のコンポーネントの前記複数のインスタンスに通過させることは、前記ソート値インジケータに基づく、ステップと、
    前記第2のコンポーネントの前記複数のインスタンスを用いて前記複数の合流要素から受信された前記データを処理するステップと、
    を含む、コンピュータプログラム。
  11. 前記第1のコンポーネントの前記複数のインスタンスから前記ソートされたデータを受信するステップは、第1のキーに従ってソートされた複数のワーク要素を受信するステップを含む、請求項10に記載のコンピュータプログラム。
  12. 前記第2のコンポーネントは、その複数の入力で受信されたデータが第2のキーに従ってソートされ、前記第1のキーに従って分岐されることを要求する、請求項11に記載のコンピュータプログラム。
  13. 前記分岐要素は、前記第1のキーに従って前記データを分岐させる、請求項12に記載のコンピュータプログラム。
  14. 前記複数の合流要素は、前記第2のキーに従って前記データをソートする、請求項13に記載のコンピュータプログラム。
  15. 前記ソート値インジケータを送信するステップは、前記分岐要素の前記複数の出力の各々の上で前記ソート値インジケータを送信し、前記複数の出力の少なくとも1つの上でワーク要素によって到達された前記ソート順序の値を示すステップを含む、請求項11に記載のコンピュータプログラム。
  16. 前記ソート値インジケータは、前記ソート値インジケータが送信された前記出力から、前記ソート順序においてより早い値を有するワーク要素が提供されないことを、前記第2のコンポーネントに合図する、請求項15に記載のコンピュータプログラム。
  17. 前記ソート値インジケータは、処理されるワーク要素の数に従って繰り返し送信される、請求項15に記載のコンピュータプログラム。
  18. 前記ソート値インジケータは、時間に従って繰り返し送信される、請求項15に記載のコンピュータプログラム。
  19. プロセッサ及びデータ格納システムを含むコンピュータシステムであって、
    前記コンピュータシステムは、
    第1のコンポーネントの複数のインスタンスと、コンポーネント間リンクと、第2のコンポーネントの複数のインスタンスとを用いてデータを処理する手段であって、前記コンポーネント間リンクは、前記第1のコンポーネントの前記複数のインスタンスから複数の出力を受信し、前記第2のコンポーネントの前記複数のインスタンスの複数の入力に提供される複数の出力を生成する、手段を含み、
    前記コンポーネント間リンクは、前記第1のコンポーネントの前記複数のインスタンスから前記複数の出力を受信する複数の分岐要素と、前記第2のコンポーネントの前記複数のインスタンスの前記複数の入力に提供される前記複数の出力を生成する複数の合流要素とを含み、
    前記手段は、
    各分岐要素で、前記第1のコンポーネントの前記複数のインスタンスの1つから、ソート順序に従ってソートされたデータを受信する手段と、
    前記ソートされたデータを前記複数の分岐要素から前記複数の合流要素に通過させる手段と、
    各分岐要素の複数の出力上でソート値インジケータを送信し、前記分岐要素の前記複数の出力の少なくとも1つによって到達された前記ソート順序の値を示す手段と、
    前記複数の合流要素で、データを合流及びソートする手段と、
    ソートされたデータを前記複数の合流要素から前記第2のコンポーネントの前記複数のインスタンスに通過させる手段であって、前記ソートされたデータを前記第2のコンポーネントの前記複数のインスタンスに通過させることは、前記ソート値インジケータに基づく、手段と、
    前記第2のコンポーネントの前記複数のインスタンスを用いて前記複数の合流要素から受信された前記データを処理する手段と、
    を含む、コンピュータシステム。
  20. 前記第1のコンポーネントの前記複数のインスタンスから前記ソートされたデータを受信することは、第1のキーに従ってソートされた複数のワーク要素を受信することを含む、請求項19に記載のコンピュータシステム。
  21. 前記第2のコンポーネントは、その複数の入力で受信されたデータが第2のキーに従ってソートされ、前記第1のキーに従って分岐されることを要求する、請求項20に記載のコンピュータシステム。
  22. 前記分岐要素は、前記第1のキーに従って前記データを分岐させる、請求項21に記載のコンピュータシステム。
  23. 前記複数の合流要素は、前記第2のキーに従って前記データをソートする、請求項22に記載のコンピュータシステム。
  24. 前記ソート値インジケータを送信することは、前記分岐要素の前記複数の出力の各々の上で前記ソート値インジケータを送信し、前記複数の出力の少なくとも1つの上でワーク要素によって到達された前記ソート順序の値を示すことを含む、請求項20に記載のコンピュータシステム。
  25. 前記ソート値インジケータは、前記ソート値インジケータが送信された前記出力から、前記ソート順序においてより早い値を有するワーク要素が提供されないことを、前記第2のコンポーネントに合図する、請求項24に記載のコンピュータシステム。
  26. 前記ソート値インジケータは、処理されるワーク要素の数に従って繰り返し送信される、請求項24に記載のコンピュータシステム。
  27. 前記ソート値インジケータは、時間に従って繰り返し送信される、請求項24に記載のコンピュータシステム。

JP2013269093A 2003-06-25 2013-12-26 コンピュータ支援による計算グラフの並列化 Expired - Lifetime JP5863762B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US48239103P 2003-06-25 2003-06-25
US60/482,391 2003-06-25

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2012083817A Division JP5735448B2 (ja) 2003-06-25 2012-04-02 コンピュータ支援による計算グラフの並列化

Publications (3)

Publication Number Publication Date
JP2014059914A JP2014059914A (ja) 2014-04-03
JP2014059914A5 JP2014059914A5 (ja) 2015-05-07
JP5863762B2 true JP5863762B2 (ja) 2016-02-17

Family

ID=33551983

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2006517764A Expired - Lifetime JP5271494B2 (ja) 2003-06-25 2004-06-22 コンピュータ支援による計算グラフの並列化
JP2012083817A Expired - Lifetime JP5735448B2 (ja) 2003-06-25 2012-04-02 コンピュータ支援による計算グラフの並列化
JP2013269093A Expired - Lifetime JP5863762B2 (ja) 2003-06-25 2013-12-26 コンピュータ支援による計算グラフの並列化

Family Applications Before (2)

Application Number Title Priority Date Filing Date
JP2006517764A Expired - Lifetime JP5271494B2 (ja) 2003-06-25 2004-06-22 コンピュータ支援による計算グラフの並列化
JP2012083817A Expired - Lifetime JP5735448B2 (ja) 2003-06-25 2012-04-02 コンピュータ支援による計算グラフの並列化

Country Status (7)

Country Link
US (3) US8059125B2 (ja)
EP (1) EP1636699A2 (ja)
JP (3) JP5271494B2 (ja)
CN (2) CN101165650B (ja)
AU (2) AU2004252918B2 (ja)
CA (4) CA2891196C (ja)
WO (1) WO2005001687A2 (ja)

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2004252918B2 (en) 2003-06-25 2009-12-10 Ab Initio Technology Llc. Computer-aided parallelizing of computation graphs
CN1316359C (zh) * 2005-06-09 2007-05-16 上海交通大学 用户指导的程序半自动并行化方法
US7877350B2 (en) * 2005-06-27 2011-01-25 Ab Initio Technology Llc Managing metadata for graph-based computations
US7716630B2 (en) * 2005-06-27 2010-05-11 Ab Initio Technology Llc Managing parameters for graph-based computations
EP2527983A3 (en) * 2006-08-10 2013-06-12 Ab Initio Technology LLC Distributing services in graph-based computations
US20080082644A1 (en) * 2006-09-29 2008-04-03 Microsoft Corporation Distributed parallel computing
US8201142B2 (en) * 2006-09-29 2012-06-12 Microsoft Corporation Description language for structured graphs
US7844959B2 (en) * 2006-09-29 2010-11-30 Microsoft Corporation Runtime optimization of distributed execution graph
US8074219B2 (en) 2007-06-27 2011-12-06 Microsoft Corporation Order preservation in data parallel operations
KR101635945B1 (ko) * 2007-07-26 2016-07-04 아브 이니티오 테크놀로지 엘엘시 에러 핸들링이 가능한 그래프 기반의 트랜잭션 연산 처리 방법 및 시스템
US20100077384A1 (en) * 2008-09-23 2010-03-25 Microsoft Corporation Parallel processing of an expression
EP2391938A4 (en) * 2009-01-30 2016-06-08 Ab Initio Technology Llc DATA PROCESSING WITH VECTOR FIELDS
CA2750279C (en) 2009-02-13 2019-03-26 Ab Initio Technology Llc Managing task execution
US8667329B2 (en) * 2009-09-25 2014-03-04 Ab Initio Technology Llc Processing transactions in graph-based applications
EP3287896B1 (en) 2010-06-15 2023-04-26 Ab Initio Technology LLC Dynamically loading graph-based computations
US9430204B2 (en) 2010-11-19 2016-08-30 Microsoft Technology Licensing, Llc Read-only communication operator
US9507568B2 (en) * 2010-12-09 2016-11-29 Microsoft Technology Licensing, Llc Nested communication operator
US9395957B2 (en) 2010-12-22 2016-07-19 Microsoft Technology Licensing, Llc Agile communication operator
US10108521B2 (en) 2012-11-16 2018-10-23 Ab Initio Technology Llc Dynamic component performance monitoring
US9507682B2 (en) 2012-11-16 2016-11-29 Ab Initio Technology Llc Dynamic graph performance monitoring
US9274926B2 (en) 2013-01-03 2016-03-01 Ab Initio Technology Llc Configurable testing of computer programs
CA3128713C (en) 2013-12-05 2022-06-21 Ab Initio Technology Llc Managing interfaces for dataflow graphs composed of sub-graphs
EP3189422A1 (en) * 2014-09-02 2017-07-12 AB Initio Technology LLC Executing graph-based program specifications
JP6479966B2 (ja) * 2014-09-02 2019-03-06 アビニシオ テクノロジー エルエルシー ユーザインタラクションを通じたグラフに基づくプログラム内の構成要素のサブセットの視覚的な規定
JP6626497B2 (ja) * 2014-09-02 2019-12-25 アビニシオ テクノロジー エルエルシー タスクの呼び出しの管理
JP6467497B2 (ja) * 2014-09-02 2019-02-13 アビニシオ テクノロジー エルエルシー 特定のデータポートの接続の特定に基づいてグラフの構成要素の自動化されたクラスタリングによるグラフに基づくプログラムの仕様のコンパイル
EP3089037B1 (en) * 2015-04-29 2019-07-17 Framatome Method for checking equivalence of code
US10657134B2 (en) 2015-08-05 2020-05-19 Ab Initio Technology Llc Selecting queries for execution on a stream of real-time data
EP3335116A1 (en) 2015-08-11 2018-06-20 AB Initio Technology LLC Data processing graph compilation
CN105068862B (zh) * 2015-09-12 2018-10-23 中国电子科技集团公司第十研究所 统一划分数据链信息处理流程的方法
US10503562B2 (en) 2015-12-17 2019-12-10 Ab Initio Technology Llc Processing data using dynamic partitioning
CA3005263C (en) 2015-12-21 2021-06-15 Ab Initio Technology Llc Sub-graph interface generation
JP6698177B2 (ja) 2016-05-17 2020-05-27 アビニシオ テクノロジー エルエルシー 再構成可能な分散処理
JP7216654B2 (ja) * 2017-03-29 2023-02-01 アビニシオ テクノロジー エルエルシー 可変レベル並列性を用いたデータ処理動作を行うためのシステム及び方法
US10817310B2 (en) 2017-09-01 2020-10-27 Ab Initio Technology Llc Executing graph-based program specifications
US11636485B2 (en) * 2018-04-06 2023-04-25 Fair Isaac Corporation Efficient parallelized computation of global behavior profiles in real-time transaction scoring systems
JP7013326B2 (ja) * 2018-05-29 2022-01-31 株式会社日立製作所 情報処理システム、情報処理装置、および情報処理システムの制御方法
CN111177433B (zh) * 2019-12-31 2021-07-20 北京百度网讯科技有限公司 用于并行处理信息的方法和装置

Family Cites Families (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5117489A (en) * 1987-04-22 1992-05-26 Mitsubishi Denki Kabushiki Kaisha Data-driven processor having an internal tag-generating system for generating a distinct tagged information and assembling with un-tagged information of an input/output data packet
JPH01108638A (ja) * 1987-10-21 1989-04-25 Hitachi Ltd 並列化コンパイル方式
JP2738692B2 (ja) * 1988-01-29 1998-04-08 株式会社日立製作所 並列化コンパイル方法
US5072371A (en) * 1989-03-01 1991-12-10 The United States Of America As Represented By The United States Department Of Energy Method for simultaneous overlapped communications between neighboring processors in a multiple
US4953106A (en) * 1989-05-23 1990-08-28 At&T Bell Laboratories Technique for drawing directed graphs
US5301284A (en) * 1991-01-16 1994-04-05 Walker-Estes Corporation Mixed-resolution, N-dimensional object space method and apparatus
US5347639A (en) * 1991-07-15 1994-09-13 International Business Machines Corporation Self-parallelizing computer system and method
US5313584A (en) * 1991-11-25 1994-05-17 Unisys Corporation Multiple I/O processor system
JPH05257709A (ja) * 1992-03-16 1993-10-08 Hitachi Ltd 並列化判別方法およびそれを用いた並列化支援方法
US5394524A (en) 1992-08-07 1995-02-28 International Business Machines Corporation Method and apparatus for processing two graphics data streams in parallel
US5446915A (en) * 1993-05-25 1995-08-29 Intel Corporation Parallel processing system virtual connection method and apparatus with protection and flow control
US5475842A (en) * 1993-08-11 1995-12-12 Xerox Corporation Method of compilation optimization using an N-dimensional template for relocated and replicated alignment of arrays in data-parallel programs for reduced data communication during execution
US5440736A (en) * 1993-11-24 1995-08-08 Digital Equipment Corporation Sorter for records having different amounts of data
JP3442192B2 (ja) * 1995-05-31 2003-09-02 シャープ株式会社 データ駆動型情報処理装置
JP3560690B2 (ja) * 1995-06-14 2004-09-02 富士通株式会社 並列プロセッサ装置
US6064393A (en) 1995-08-04 2000-05-16 Microsoft Corporation Method for measuring the fidelity of warped image layer approximations in a real-time graphics rendering pipeline
US6016150A (en) 1995-08-04 2000-01-18 Microsoft Corporation Sprite compositor and method for performing lighting and shading operations using a compositor to combine factored image layers
US5682537A (en) * 1995-08-31 1997-10-28 Unisys Corporation Object lock management system with improved local lock management and global deadlock detection in a parallel data processing system
US5813004A (en) * 1995-09-25 1998-09-22 International Business Machines Corporation Partitioning and sorting logical units of data prior to reaching an end of the data file
US5819021A (en) * 1995-12-11 1998-10-06 Ab Initio Software Corporation Overpartitioning system and method for increasing checkpoints in component-based parallel applications
US6311265B1 (en) * 1996-03-25 2001-10-30 Torrent Systems, Inc. Apparatuses and methods for programming parallel computers
US5909681A (en) * 1996-03-25 1999-06-01 Torrent Systems, Inc. Computer system and computerized method for partitioning data for parallel processing
US5799149A (en) * 1996-06-17 1998-08-25 International Business Machines Corporation System partitioning for massively parallel processors
US5870743A (en) * 1996-06-24 1999-02-09 Oracle Corporation Method and apparatus for parallelizing operations that create a table
US5966072A (en) * 1996-07-02 1999-10-12 Ab Initio Software Corporation Executing computations expressed as graphs
US6330008B1 (en) * 1997-02-24 2001-12-11 Torrent Systems, Inc. Apparatuses and methods for monitoring performance of parallel computing
US5999729A (en) * 1997-03-06 1999-12-07 Continuum Software, Inc. System and method for developing computer programs for execution on parallel processing systems
US6088716A (en) * 1997-04-28 2000-07-11 Ab Initio Software Corporation Method for preventing buffer deadlock in dataflow computations
US5956704A (en) * 1997-06-05 1999-09-21 Oracle Corporation Method and apparatus for parallelizing operations that insert data into an existing data container
US6266804B1 (en) * 1997-12-23 2001-07-24 Ab Initio Software Corporation Method for analyzing capacity of parallel processing systems
US6480876B2 (en) * 1998-05-28 2002-11-12 Compaq Information Technologies Group, L.P. System for integrating task and data parallelism in dynamic applications
US6205465B1 (en) * 1998-07-22 2001-03-20 Cisco Technology, Inc. Component extensible parallel execution of multiple threads assembled from program components specified with partial inter-component sequence information
US7047232B1 (en) * 1999-01-13 2006-05-16 Ab Initio Software Corporation Parallelizing applications of script-driven tools
JP2000242478A (ja) * 1999-02-15 2000-09-08 Internatl Business Mach Corp <Ibm> 実行可能性判定装置およびその方法
US6311285B1 (en) * 1999-04-27 2001-10-30 Intel Corporation Method and apparatus for source synchronous transfers at frequencies including an odd fraction of a core frequency
US6978458B1 (en) * 2000-11-17 2005-12-20 Oracle International Corporation Distributing data items to corresponding buckets for use in parallel operations
AU2004252918B2 (en) * 2003-06-25 2009-12-10 Ab Initio Technology Llc. Computer-aided parallelizing of computation graphs

Also Published As

Publication number Publication date
CA2891145A1 (en) 2005-01-06
US20050034112A1 (en) 2005-02-10
AU2009238350A1 (en) 2009-12-17
WO2005001687A2 (en) 2005-01-06
CA2891143A1 (en) 2005-01-06
CA2529925A1 (en) 2005-01-06
CA2891196A1 (en) 2005-01-06
JP5271494B2 (ja) 2013-08-21
CN1842764B (zh) 2010-06-23
CN1842764A (zh) 2006-10-04
CA2891143C (en) 2019-02-12
CN101165650A (zh) 2008-04-23
JP2007529041A (ja) 2007-10-18
US8866817B2 (en) 2014-10-21
AU2004252918B2 (en) 2009-12-10
EP1636699A2 (en) 2006-03-22
WO2005001687A3 (en) 2005-07-21
JP2012128887A (ja) 2012-07-05
US8059125B2 (en) 2011-11-15
JP2014059914A (ja) 2014-04-03
CA2891145C (en) 2019-02-19
JP5735448B2 (ja) 2015-06-17
US9569189B2 (en) 2017-02-14
AU2009238350B2 (en) 2011-08-25
AU2004252918A1 (en) 2005-01-06
US20120056888A1 (en) 2012-03-08
US20120056892A1 (en) 2012-03-08
CA2529925C (en) 2016-08-23
CN101165650B (zh) 2012-10-10
CA2891196C (en) 2018-03-20

Similar Documents

Publication Publication Date Title
JP5863762B2 (ja) コンピュータ支援による計算グラフの並列化
JP2014059914A5 (ja)
WO2005001687A9 (en) Computer-aided parallelizing of computation graphs
CN106170762B (zh) 管理包括子图的数据流图所用的接口
JP6454706B2 (ja) ソースコード変換
CN113287114A (zh) 针对以同步数字电路为目标的编程语言的查找表优化
WO2022068124A1 (zh) 一种可重构阵列处理器的指令调度系统及方法
JP2010532528A (ja) データ並列演算における順番保存
JP2022518209A (ja) スレッドの実行順序を維持する同期デジタル回路を生成する言語およびコンパイラ
Minh Do et al. Parallel Maude-NPA for cryptographic protocol analysis
Manohar et al. Asynchronous parallel prefix computation
EP1852777A2 (en) Computer-aided parallelizing of computation graphs
Falk et al. Integrated modeling using finite state machines and dataflow graphs
KR20230092635A (ko) 양방향 인터페이스 조합기를 지원하는 하드웨어 기술 언어
CN116710898A (zh) 数据分析下推操作的自动选择
Reddy Is it Possible to Sequence Continuously Changing Workload Patterns for Periodic Elastic Scaling?

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140127

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140127

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140918

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20141218

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20141224

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150318

A524 Written submission of copy of amendment under article 19 pct

Free format text: JAPANESE INTERMEDIATE CODE: A524

Effective date: 20150318

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20150402

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150731

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20150807

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151023

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151026

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151124

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151222

R150 Certificate of patent or registration of utility model

Ref document number: 5863762

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250