JP2012521591A5 - - Google Patents

Download PDF

Info

Publication number
JP2012521591A5
JP2012521591A5 JP2012501429A JP2012501429A JP2012521591A5 JP 2012521591 A5 JP2012521591 A5 JP 2012521591A5 JP 2012501429 A JP2012501429 A JP 2012501429A JP 2012501429 A JP2012501429 A JP 2012501429A JP 2012521591 A5 JP2012521591 A5 JP 2012521591A5
Authority
JP
Japan
Prior art keywords
vector
data elements
precision
solution
current
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012501429A
Other languages
English (en)
Other versions
JP2012521591A (ja
JP5570038B2 (ja
Filing date
Publication date
Application filed filed Critical
Priority claimed from PCT/IB2010/050912 external-priority patent/WO2010109359A2/en
Publication of JP2012521591A publication Critical patent/JP2012521591A/ja
Publication of JP2012521591A5 publication Critical patent/JP2012521591A5/ja
Application granted granted Critical
Publication of JP5570038B2 publication Critical patent/JP5570038B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Description

装置1は、Ax=bによって定義される連立1次方程式の解を表すnx1のベクトルxに対応する、nの高精度データ要素を生成するためのプロセスを実施するように適合される。ここでAは、次元nxnの正定値対称密行列であり、bはnx1ベクトルである。行列Aの要素に対応するnxnの高精度データ要素、およびベクトルbの要素に対応するnの高精度データ要素は、メモリ5に格納された入力データによって定義される。より具体的に言えば、行列Aの高精度データ要素は、ここではスカラ関数F( )=a(i,j)を介して間接的に定義され、この式でa(i,j)は、行インデックスi(1<=i<=n)および列インデックスj(1<=j<=n)を伴う要素を表す。この例では、ベクトルbのデータ要素はメモリ5内で直接定義されるものと想定している。メモリ5は、処理動作で使用するための3つの収束条件を定義するパラメータを指定する、データC(k,d)、C(k,d)、およびC(p,c)も保持する。これらのパラメータについて、以下で説明する。

Claims (15)

  1. Ax=bを満たす次元nx1ベクトルxに対応するnの高精度データ要素を生成するための装置であって、この式で、Aは、nxnの事前に定義された高精度データ要素に対応する次元nxn正定値対称行列であり、bは、事前に定義されたn個の高精度データ要素に対応する次元nx1ベクトルであり、行列Aの高精度データ要素が、スカラ関数F=a(i,j)で定義され、ここで、iは行列Aの行インデックス(1<=i<=n)であり、およびjは行列Aの列インデックス(1<=j<=n)であり、
    前記装置は、
    行列Aおよびベクトルbの前記データ要素を定義する入力データを格納するためメモリと、
    (a)A=bを満たす次元nx1ベクトルxに対応するnの低精度データ要素を前記入力データから生成するための第1の反復プロセスを実施するステップであって、この式で、Aは、前記スカラ関数Fに基づいて作成された低精度関数Flによって定義される低精度の行列Aのnxn個のデータ要素に対応する次元nxn行列であり、bは、低精度のベクトルbのnx1個のデータ要素に対応する次元nx1ベクトルであり、前記高精度は前記低精度よりも高いレベルの精度を有し、前記制御論理は第1の収束条件を満たすことに応じて前記第1の反復プロセスを終了する、前記第1の反復プロセスを実施するステップと、
    (b)ベクトルxの前記低精度データ要素それぞれを高精度データ要素に変換し、現行の高精度解ベクトルxを取得するステップと、
    (c)前記ベクトルbとベクトル積Axとの間の差に依存して、次元nx1修正ベクトルに対応するnの低精度データ要素を生成するための第2の反復プロセスを実施するステップであって、前記制御論理は第2の収束条件を満たすことに応じて前記第2の反復プロセスを終了する、前記第2の反復プロセスを実施するステップと、
    (d)前記修正ベクトルのnの低精度データ要素から、次元nx1更新ベクトルuれぞれの高精度データ要素を生成するステップと、
    (e)x=x+uとなるように、前記現行の高精度解ベクトルxの前記データ要素を更新するステップと、
    (f)第3の収束条件が満たされるまで、前記ステップ(c)〜(e)を実行するステップ
    を実行するように適合された、前記制御論理と
    を備えている、前記装置。
  2. 前記制御論理が
    前記ステップ(b)で前記現行の高精度解ベクトルxを生成した後、前記ベクトルbと前記ベクトル積Axとの差異を示す現行の次元nx1誤りベクトルr(以下、現行の誤りベクトルrという)に対応するnのデータ要素を生成するステップと、
    前記次元nx1修正ベクトルと前記行列Aのベクトル積が前記現行の誤りベクトルrに依存するように、前記ステップ(c)を実行するステップと、
    前記ステップ(d)で、前記次元nx1修正ベクトルのデータ要素を高精度データ要素に変換することによって、更新ベクトルuのデータ要素を生成するステップ
    を実行するように適合された、請求項1に記載の装置。
  3. 前記制御論理が
    r=b−Axとなるように高精度で前記現行の誤りベクトルrの前記データ要素を生成するステップと、
    低精度誤りベクトルrを取得するために、前記現行の誤りベクトルrの前記データ要素をそれぞれの低精度データ要素に変換するステップと、
    前記修正ベクトルと前記行列のAの前記ベクトル積が前記低精度の誤りベクトルrに等しいように、前記ステップ(c)を実行するステップと、
    前記ステップ(e)で、前記現行の高精度解ベクトルxの前記データ要素を更新した後、r=b−Axとなるように、前記現行の誤りベクトルrの前記データ要素を更新するステップ
    を実行するように適合され、
    前記第3の収束条件が前記現行の誤りベクトルrに依存する、
    請求項2に記載の装置。
  4. 前記第1の収束条件が、
    前記第1の反復プロセスの所定のパス数が完了すること、
    前記ベクトルxの解が所定の許容範囲に到達すること、および
    前記第1の反復プロセスの連続するパスにおいて、前記ベクトルxの解に変化が検出されないこと
    のうちの少なくとも1つ、またはそのうちの第1の発生に依存する、請求項1〜3のいずれか一項に記載の装置。
  5. 前記第2の収束条件が、
    前記第2の反復プロセスの所定のパス数が完了すること、
    前記修正ベクトルの解が所定の許容範囲に到達すること、および
    前記第の反復プロセスの連続するパスにおいて、前記修正ベクトルの解に変化が検出されないこと
    のうちの少なくとも1つ、またはそのうちの第1の発生に依存する請求項1〜4のいずれか一項に記載の装置。
  6. 前記第3の収束条件が、
    前記ステップ(c)(e)の所定のパス数が完了すること、
    前記現行の高精度解ベクトルxに依存するベクトルの解が所定の許容範囲に到達すること、および
    前記ステップ(c)(e)の連続するパスにおいて、前記現行の高精度解ベクトルxに依存する前記ベクトルの解に変化が検出されないこと
    のうちの少なくとも1つ、またはそのうちの第1の発生に依存する請求項1〜5のいずれか一項に記載の装置。
  7. 前記現行の高精度解ベクトルxに依存する前記ベクトルが前記誤りベクトルrを含む、請求項1〜6のいずれか一項に記載の装置。
  8. 前記第1の反復プロセス又は前記第2の反復プロセス共役勾配方法を含む請求項1〜7のいずれか一項に記載の装置。
  9. 前記制御論理が
    ステップ(a)(e)を並列に実施するように構成された複数のプロセッサを備えている、
    請求項1〜8のいずれか一項に記載の装置。
  10. Ax=bを満たす次元nx1ベクトルxに対応するnの高精度データ要素を生成するためのコンピュータ・プログラムであって、この式で、Aは、nxnの事前に定義された高精度データ要素に対応する次元nxn正定値対称行列であり、bは、事前に定義されたn個の高精度データ要素に対応する次元nx1ベクトルであり、行列Aの高精度データ要素が、スカラ関数F=a(i,j)で定義され、ここで、iは行列Aの行インデックス(1<=i<=n)であり、およびjは行列Aの列インデックス(1<=j<=n)であり、前記コンピュータのメモリ内に格納され行列Aおよびベクトルbの前記データ要素を定義する入力データに、前記コンピュータをアクセスさせ、
    (a)A=bを満たす次元nx1ベクトルxに対応するnの低精度データ要素を前記入力データから生成するための第1の反復プロセスを実施するステップであって、この式で、Aは、低精度の行列Aのnxn個のデータ要素に対応する次元nxn行列であり、bは、低精度のベクトルbのnx1個のデータ要素に対応する次元nx1ベクトルであり、前記高精度は前記低精度よりも高いレベルの精度を有し、前記制御論理は第1の収束条件を満たすことに応じて前記第1の反復プロセスを終了する、前記第1の反復プロセスを実施するステップと、
    (b)ベクトルxの前記低精度データ要素それぞれを高精度データ要素に変換し、現行の高精度解ベクトルxを取得するステップと、
    (c)前記ベクトルbとベクトル積Axとの間の差に依存して、次元nx1修正ベクトルに対応するnの低精度データ要素を生成するための第2の反復プロセスを実施するステップであって、前記制御論理は第2の収束条件を満たすことに応じて前記第2の反復プロセスを終了する、前記第2の反復プロセスを実施するステップと、
    (d)前記修正ベクトルのnの低精度データ要素から、次元nx1更新ベクトルuれぞれの高精度データ要素を生成するステップと、
    (e)x=x+uとなるように、前記現行の高精度解ベクトルxの前記データ要素を更新するステップと、
    (f)第3の収束条件が満たされるまで、前記ステップ(c)〜(e)を実行するステップ
    をコンピュータに実行させるための、プログラム・コード手段を備えている、前記コンピュータ・プログラム。
  11. 前記ステップ(b)で前記現行の高精度解ベクトルxを生成した後、前記ベクトルbと前記ベクトル積Axとの差異を示す現行の次元nx1誤りベクトルr(以下、現行の誤りベクトルrという)に対応するnのデータ要素を生成するステップと、
    前記次元nx1修正ベクトルと前記行列Aのベクトル積が前記現行の誤りベクトルrに依存するように、前記ステップ(c)を実行するステップと、
    前記ステップ(d)で、前記次元nx1修正ベクトルのデータ要素を高精度データ要素に変換することによって、更新ベクトルuのデータ要素を生成するステップ
    を、前記コンピュータに実行させるための、前記プログラム・コード手段をさらに含む、請求項10に記載のコンピュータ・プログラム。
  12. r=b−Axとなるように高精度で前記現行の誤りベクトルrの前記データ要素を生成するステップと、
    低精度誤りベクトルrを取得するために、前記現行の誤りベクトルrの前記データ要素をそれぞれの低精度データ要素に変換するステップと、
    前記修正ベクトルと前記行列のAの前記ベクトル積が前記低精度の誤りベクトルrに等しいように、前記ステップ(c)を実行するステップと、
    前記ステップ(e)で、前記現行の高精度解ベクトルxの前記データ要素を更新した後、r=b−Axとなるように、前記現行の誤りベクトルrの前記データ要素を更新するステップ
    を、前記コンピュータに実行させるためのプログラム・コード手段をさらに含み、
    前記第3の収束条件が前記現行の誤りベクトルrに依存する、
    請求項11に記載のコンピュータ・プログラム。
  13. 前記第1の収束条件が、
    前記第1の反復プロセスの所定のパス数が完了すること、
    前記ベクトルxの解が所定の許容範囲に到達すること、および
    前記第1の反復プロセスの連続するパスにおいて、前記ベクトルxの解に変化が検出されないこと
    のうちの少なくとも1つ、またはそのうちの第1の発生に依存し;
    前記第2の収束条件が、
    前記第2の反復プロセスの所定のパス数が完了すること、
    前記修正ベクトルの解が所定の許容範囲に到達すること、および
    前記第の反復プロセスの連続するパスにおいて、前記修正ベクトルの解に変化が検出されないこと
    のうちの少なくとも1つ、またはそのうちの第1の発生に依存し;又は、
    前記第3の収束条件が、
    前記ステップ(c)(e)の所定のパス数が完了すること、
    前記現行の高精度解ベクトルxに依存するベクトルの解が所定の許容範囲に到達すること、および
    前記ステップ(c)(e)の連続するパスにおいて、前記現行の高精度解ベクトルxに依存する前記ベクトルの解に変化が検出されないこと
    のうちの少なくとも1つ、またはそのうちの第1の発生に依存する、
    請求項10〜12のいずれか一項に記載のコンピュータ・プログラム。
  14. 前記現行の高精度解ベクトルxに依存する前記ベクトルが前記誤りベクトルrを含む、請求項10〜13のいずれか一項に記載のコンピュータ・プログラム。
  15. 前記第1の反復プロセス又は前記第2の反復プロセスが、共役勾配方法を含む、請求項10〜14のいずれか一項に記載のコンピュータ・プログラム。
JP2012501429A 2009-03-24 2010-03-03 連立1次方程式を処理するための装置およびコンピュータ・プログラム Expired - Fee Related JP5570038B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP09156017.7 2009-03-24
EP09156017 2009-03-24
PCT/IB2010/050912 WO2010109359A2 (en) 2009-03-24 2010-03-03 Processing of linear systems of equations

Publications (3)

Publication Number Publication Date
JP2012521591A JP2012521591A (ja) 2012-09-13
JP2012521591A5 true JP2012521591A5 (ja) 2014-04-17
JP5570038B2 JP5570038B2 (ja) 2014-08-13

Family

ID=42781607

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012501429A Expired - Fee Related JP5570038B2 (ja) 2009-03-24 2010-03-03 連立1次方程式を処理するための装置およびコンピュータ・プログラム

Country Status (4)

Country Link
US (2) US9032006B2 (ja)
JP (1) JP5570038B2 (ja)
CN (1) CN102362274A (ja)
WO (1) WO2010109359A2 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10083250B2 (en) 2013-05-22 2018-09-25 International Business Machines Corporation Simplification of large networks and graphs
US9262380B2 (en) 2013-05-22 2016-02-16 International Business Machines Corporation Calculating node centralities in large networks and graphs
GB2523341A (en) 2014-02-20 2015-08-26 Ibm Iterative refinement apparatus
US10025754B2 (en) 2015-07-22 2018-07-17 International Business Machines Corporation Linear FE system solver with dynamic multi-grip precision
JP6550465B2 (ja) * 2015-08-20 2019-07-24 株式会社日立製作所 情報処理回路
US10209685B2 (en) * 2015-10-29 2019-02-19 Mitsubishi Electric Research Laboratories, Inc. Method and apparatus for preconditioned model predictive control
CN107526709A (zh) * 2016-06-15 2017-12-29 辉达公司 使用低精度格式的张量处理
US10997492B2 (en) * 2017-01-20 2021-05-04 Nvidia Corporation Automated methods for conversions to a lower precision data format
US11494588B2 (en) 2020-03-06 2022-11-08 International Business Machines Corporation Ground truth generation for image segmentation
US11556852B2 (en) * 2020-03-06 2023-01-17 International Business Machines Corporation Efficient ground truth annotation
US11495038B2 (en) 2020-03-06 2022-11-08 International Business Machines Corporation Digital image processing
CN111475475A (zh) * 2020-04-01 2020-07-31 中国人民解放军火箭军工程大学 一种数据矩阵的差异化压缩存储模型
CN113375568B (zh) * 2021-05-12 2023-03-31 苏州阿普奇物联网科技有限公司 一种基于激光扫描的金属拉丝抛光不良检测方法
US11907715B2 (en) 2021-12-20 2024-02-20 International Business Machines Corporation Hardware acceleration with preconditioners

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4311741B2 (ja) * 2004-12-15 2009-08-12 キヤノン株式会社 情報処理装置、情報処理方法
US8175853B2 (en) * 2008-03-28 2012-05-08 International Business Machines Corporation Systems and methods for a combined matrix-vector and matrix transpose vector multiply for a block-sparse matrix
US8577949B2 (en) * 2009-07-07 2013-11-05 L-3 Communications Integrated Systems, L.P. System for conjugate gradient linear iterative solvers

Similar Documents

Publication Publication Date Title
JP2012521591A5 (ja)
US10534607B2 (en) Accessing data in multi-dimensional tensors using adders
US10394979B2 (en) Method and device for elastic object deformation modeling
JP5937284B2 (ja) 階層型ニューラルネットワーク装置、判別器学習方法および判別方法
Pan et al. An effective hybrid discrete differential evolution algorithm for the flow shop scheduling with intermediate buffers
JP2017138964A5 (ja)
JP2018158570A (ja) 付加製造製品の設計のためのシステムおよび方法
CN108897716B (zh) 通过存储器读写操作来缩减计算量的数据处理装置及方法
CN111914378B (zh) 一种单振幅量子计算模拟方法及装置
CN111077768B (zh) 优化装置及优化装置的控制方法
JP2014206913A (ja) 高分子材料のシミュレーション方法
JPWO2020234984A5 (ja)
CN106020775B (zh) 模板代码的simd实现
Bajdich et al. Systematic reduction of sign errors in many-body calculations of atoms and molecules
JP2015135662A (ja) 情報処理装置、プログラム及び方法
US9607106B2 (en) Method and apparatus for searching pattern in sequence data
JP6651254B2 (ja) シミュレーション方法、シミュレーションプログラム、及びシミュレーション装置
CN111079082A (zh) 一种提高涉及稀疏矩阵计算速率的方法和系统
Barkouki et al. A matrix rational Lanczos method for model reduction in large‐scale first‐and second‐order dynamical systems
JP7339923B2 (ja) 材料の特性値を推定するシステム
Lu et al. Data Filtering Based Recursive Least Squares Algorithm for Two‐Input Single‐Output Systems with Moving Average Noises
JP6504155B2 (ja) データ管理装置、データ分析装置、データ分析システム、及び、分析方法
JPWO2005029352A1 (ja) 並列計算方法及び装置
CN106650126B (zh) 一种计算阵列版图电阻网络的加速方法
Lotfi et al. Two new three and four parametric with memory methods for solving nonlinear‎ equations