JP2012521591A5

JP2012521591A5 -

Info

Publication number: JP2012521591A5
Application number: JP2012501429A
Authority: JP
Filing date: 2010-03-03
Publication date: 2014-04-17
Anticipated expiration: 2030-03-03

Description

装置１は、Ａｘ＝ｂによって定義される連立１次方程式の解を表すｎｘ１のベクトルｘに対応する、ｎの高精度データ要素を生成するためのプロセスを実施するように適合される。ここでＡは、次元ｎｘｎの正定値対称密行列であり、ｂはｎｘ１ベクトルである。行列Ａの要素に対応するｎｘｎの高精度データ要素、およびベクトルｂの要素に対応するｎの高精度データ要素は、メモリ５に格納された入力データによって定義される。より具体的に言えば、行列Ａの高精度データ要素は、ここではスカラ関数Ｆ（）＝ａ（ｉ，ｊ）を介して間接的に定義され、この式でａ（ｉ，ｊ）は、行インデックスｉ（１＜＝ｉ＜＝ｎ）および列インデックスｊ（１＜＝ｊ＜＝ｎ）を伴う要素を表す。この例では、ベクトルｂのデータ要素はメモリ５内で直接定義されるものと想定している。メモリ５は、処理動作で使用するための３つの収束条件を定義するパラメータを指定する、データＣ_１（ｋ_１，ｄ_１）、Ｃ_２（ｋ_２，ｄ_２）、およびＣ_３（ｐ，ｃ）も保持する。これらのパラメータについて、以下で説明する。

Claims

Ａｘ＝ｂを満たす次元ｎｘ１ベクトルｘに対応するｎ個の高精度データ要素を生成するための装置であって、この式で、Ａは、ｎｘｎ個の事前に定義された高精度データ要素に対応する次元ｎｘｎ正定値対称行列であり、ｂは、事前に定義されたｎ個の高精度データ要素に対応する次元ｎｘ１ベクトルであり、行列Ａの高精度データ要素が、スカラ関数Ｆ＝ａ（ｉ，ｊ）で定義され、ここで、ｉは行列Ａの行インデックス（１＜＝ｉ＜＝ｎ）であり、およびｊは行列Ａの列インデックス（１＜＝ｊ＜＝ｎ）であり、
前記装置は、
行列Ａおよびベクトルｂの前記データ要素を定義する入力データを格納するためのメモリと、
（ａ）Ａ_ｌｘ_ｌ＝ｂ_ｌを満たす次元ｎｘ１ベクトルｘ_ｌに対応するｎ個の低精度データ要素を前記入力データから生成するための第１の反復プロセスを実施するステップであって、この式で、Ａ_ｌは、前記スカラ関数Ｆに基づいて作成された低精度関数Ｆｌによって定義される低精度の行列Ａ_ｌのｎｘｎ個のデータ要素に対応する次元ｎｘｎ行列であり、ｂ_ｌは、低精度のベクトルｂのｎｘ１個のデータ要素に対応する次元ｎｘ１ベクトルであり、前記高精度は前記低精度よりも高いレベルの精度を有し、前記制御論理は第１の収束条件を満たすことに応じて前記第１の反復プロセスを終了する、前記第１の反復プロセスを実施するステップと、
（ｂ）ベクトルｘ_ｌの前記低精度データ要素それぞれを高精度データ要素に変換し、現行の高精度解ベクトルｘを取得するステップと、
（ｃ）前記ベクトルｂとベクトル積Ａｘとの間の差に依存して、次元ｎｘ１修正ベクトルに対応するｎ個の低精度データ要素を生成するための第２の反復プロセスを実施するステップであって、前記制御論理は第２の収束条件を満たすことに応じて前記第２の反復プロセスを終了する、前記第２の反復プロセスを実施するステップと、
（ｄ）前記修正ベクトルのｎ個の低精度データ要素から、次元ｎｘ１更新ベクトルｕそれぞれの高精度データ要素を生成するステップと、
（ｅ）ｘ＝ｘ＋ｕとなるように、前記現行の高精度解ベクトルｘの前記データ要素を更新するステップと、
（ｆ）第３の収束条件が満たされるまで、前記ステップ（ｃ）〜（ｅ）を実行するステップと
を実行するように適合された、前記制御論理と
を備えている、前記装置。
前記制御論理が、
前記ステップ（ｂ）で前記現行の高精度解ベクトルｘを生成した後、前記ベクトルｂと前記ベクトル積Ａｘとの差異を示す現行の次元ｎｘ１誤りベクトルｒ（以下、現行の誤りベクトルｒという）に対応するｎ個のデータ要素を生成するステップと、
前記次元ｎｘ１修正ベクトルと前記行列Ａ_ｌのベクトル積が前記現行の誤りベクトルｒに依存するように、前記ステップ（ｃ）を実行するステップと、
前記ステップ（ｄ）で、前記次元ｎｘ１修正ベクトルのデータ要素を高精度データ要素に変換することによって、更新ベクトルｕのデータ要素を生成するステップと
を実行するように適合された、請求項１に記載の装置。
前記制御論理が、
ｒ＝ｂ−Ａｘとなるように高精度で前記現行の誤りベクトルｒの前記データ要素を生成するステップと、
低精度誤りベクトルｒ_ｌを取得するために、前記現行の誤りベクトルｒの前記データ要素をそれぞれの低精度データ要素に変換するステップと、
前記修正ベクトルと前記行列のＡ_ｌの前記ベクトル積が前記低精度の誤りベクトルｒ_ｌに等しいように、前記ステップ（ｃ）を実行するステップと、
前記ステップ（ｅ）で、前記現行の高精度解ベクトルｘの前記データ要素を更新した後、ｒ＝ｂ−Ａｘとなるように、前記現行の誤りベクトルｒの前記データ要素を更新するステップと
を実行するように適合され、
前記第３の収束条件が前記現行の誤りベクトルｒに依存する、
請求項２に記載の装置。
前記第１の収束条件が、
前記第１の反復プロセスの所定のパス数が完了すること、
前記ベクトルｘ_ｌの解が所定の許容範囲に到達すること、および
前記第１の反復プロセスの連続するパスにおいて、前記ベクトルｘ_ｌの解に変化が検出されないこと
のうちの少なくとも１つ、またはそのうちの第１の発生に依存する、請求項１〜３のいずれか一項に記載の装置。
前記第２の収束条件が、
前記第２の反復プロセスの所定のパス数が完了すること、
前記修正ベクトルの解が所定の許容範囲に到達すること、および
前記第２の反復プロセスの連続するパスにおいて、前記修正ベクトルの解に変化が検出されないこと
のうちの少なくとも１つ、またはそのうちの第１の発生に依存する、請求項１〜４のいずれか一項に記載の装置。
前記第３の収束条件が、
前記ステップ（ｃ）〜（ｅ）の所定のパス数が完了すること、
前記現行の高精度解ベクトルｘに依存するベクトルの解が所定の許容範囲に到達すること、および
前記ステップ（ｃ）〜（ｅ）の連続するパスにおいて、前記現行の高精度解ベクトルｘに依存する前記ベクトルの解に変化が検出されないこと
のうちの少なくとも１つ、またはそのうちの第１の発生に依存する、請求項１〜５のいずれか一項に記載の装置。
前記現行の高精度解ベクトルｘに依存する前記ベクトルが前記誤りベクトルｒを含む、請求項１〜６のいずれか一項に記載の装置。
前記第１の反復プロセス又は前記第２の反復プロセスが、共役勾配方法を含む、請求項１〜７のいずれか一項に記載の装置。
前記制御論理が、
ステップ（ａ）〜（ｅ）を並列に実施するように構成された複数のプロセッサを備えている、
請求項１〜８のいずれか一項に記載の装置。
Ａｘ＝ｂを満たす次元ｎｘ１ベクトルｘに対応するｎ個の高精度データ要素を生成するためのコンピュータ・プログラムであって、この式で、Ａは、ｎｘｎ個の事前に定義された高精度データ要素に対応する次元ｎｘｎ正定値対称行列であり、ｂは、事前に定義されたｎ個の高精度データ要素に対応する次元ｎｘ１ベクトルであり、行列Ａの高精度データ要素が、スカラ関数Ｆ＝ａ（ｉ，ｊ）で定義され、ここで、ｉは行列Ａの行インデックス（１＜＝ｉ＜＝ｎ）であり、およびｊは行列Ａの列インデックス（１＜＝ｊ＜＝ｎ）であり、前記コンピュータのメモリ内に格納され行列Ａおよびベクトルｂの前記データ要素を定義する入力データに、前記コンピュータをアクセスさせ、
（ａ）Ａ_ｌｘ_ｌ＝ｂ_ｌを満たす次元ｎｘ１ベクトルｘ_ｌに対応するｎ個の低精度データ要素を前記入力データから生成するための第１の反復プロセスを実施するステップであって、この式で、Ａ_ｌは、低精度の行列Ａのｎｘｎ個のデータ要素に対応する次元ｎｘｎ行列であり、ｂ_ｌは、低精度のベクトルｂのｎｘ１個のデータ要素に対応する次元ｎｘ１ベクトルであり、前記高精度は前記低精度よりも高いレベルの精度を有し、前記制御論理は第１の収束条件を満たすことに応じて前記第１の反復プロセスを終了する、前記第１の反復プロセスを実施するステップと、
（ｂ）ベクトルｘ_ｌの前記低精度データ要素それぞれを高精度データ要素に変換し、現行の高精度解ベクトルｘを取得するステップと、
（ｃ）前記ベクトルｂとベクトル積Ａｘとの間の差に依存して、次元ｎｘ１修正ベクトルに対応するｎ個の低精度データ要素を生成するための第２の反復プロセスを実施するステップであって、前記制御論理は第２の収束条件を満たすことに応じて前記第２の反復プロセスを終了する、前記第２の反復プロセスを実施するステップと、
（ｄ）前記修正ベクトルのｎ個の低精度データ要素から、次元ｎｘ１更新ベクトルｕそれぞれの高精度データ要素を生成するステップと、
（ｅ）ｘ＝ｘ＋ｕとなるように、前記現行の高精度解ベクトルｘの前記データ要素を更新するステップと、
（ｆ）第３の収束条件が満たされるまで、前記ステップ（ｃ）〜（ｅ）を実行するステップと
をコンピュータに実行させるための、プログラム・コード手段を備えている、前記コンピュータ・プログラム。
前記ステップ（ｂ）で前記現行の高精度解ベクトルｘを生成した後、前記ベクトルｂと前記ベクトル積Ａｘとの差異を示す現行の次元ｎｘ１誤りベクトルｒ（以下、現行の誤りベクトルｒという）に対応するｎ個のデータ要素を生成するステップと、
前記次元ｎｘ１修正ベクトルと前記行列Ａ_ｌのベクトル積が前記現行の誤りベクトルｒに依存するように、前記ステップ（ｃ）を実行するステップと、
前記ステップ（ｄ）で、前記次元ｎｘ１修正ベクトルのデータ要素を高精度データ要素に変換することによって、更新ベクトルｕのデータ要素を生成するステップと
を、前記コンピュータに実行させるための、前記プログラム・コード手段をさらに含む、請求項１０に記載のコンピュータ・プログラム。
ｒ＝ｂ−Ａｘとなるように高精度で前記現行の誤りベクトルｒの前記データ要素を生成するステップと、
低精度誤りベクトルｒ_ｌを取得するために、前記現行の誤りベクトルｒの前記データ要素をそれぞれの低精度データ要素に変換するステップと、
前記修正ベクトルと前記行列のＡ_ｌの前記ベクトル積が前記低精度の誤りベクトルｒ_ｌに等しいように、前記ステップ（ｃ）を実行するステップと、
前記ステップ（ｅ）で、前記現行の高精度解ベクトルｘの前記データ要素を更新した後、ｒ＝ｂ−Ａｘとなるように、前記現行の誤りベクトルｒの前記データ要素を更新するステップと
を、前記コンピュータに実行させるための、プログラム・コード手段をさらに含み、
前記第３の収束条件が前記現行の誤りベクトルｒに依存する、
請求項１１に記載のコンピュータ・プログラム。
前記第１の収束条件が、
前記第１の反復プロセスの所定のパス数が完了すること、
前記ベクトルｘ_ｌの解が所定の許容範囲に到達すること、および
前記第１の反復プロセスの連続するパスにおいて、前記ベクトルｘ_ｌの解に変化が検出されないこと
のうちの少なくとも１つ、またはそのうちの第１の発生に依存し；
前記第２の収束条件が、
前記第２の反復プロセスの所定のパス数が完了すること、
前記修正ベクトルの解が所定の許容範囲に到達すること、および
前記第２の反復プロセスの連続するパスにおいて、前記修正ベクトルの解に変化が検出されないこと
のうちの少なくとも１つ、またはそのうちの第１の発生に依存し；又は、
前記第３の収束条件が、
前記ステップ（ｃ）〜（ｅ）の所定のパス数が完了すること、
前記現行の高精度解ベクトルｘに依存するベクトルの解が所定の許容範囲に到達すること、および
前記ステップ（ｃ）〜（ｅ）の連続するパスにおいて、前記現行の高精度解ベクトルｘに依存する前記ベクトルの解に変化が検出されないこと
のうちの少なくとも１つ、またはそのうちの第１の発生に依存する、
請求項１０〜１２のいずれか一項に記載のコンピュータ・プログラム。
前記現行の高精度解ベクトルｘに依存する前記ベクトルが前記誤りベクトルｒを含む、請求項１０〜１３のいずれか一項に記載のコンピュータ・プログラム。
前記第１の反復プロセス又は前記第２の反復プロセスが、共役勾配方法を含む、請求項１０〜１４のいずれか一項に記載のコンピュータ・プログラム。