JP2012521591A5 - - Google Patents
Download PDFInfo
- Publication number
- JP2012521591A5 JP2012521591A5 JP2012501429A JP2012501429A JP2012521591A5 JP 2012521591 A5 JP2012521591 A5 JP 2012521591A5 JP 2012501429 A JP2012501429 A JP 2012501429A JP 2012501429 A JP2012501429 A JP 2012501429A JP 2012521591 A5 JP2012521591 A5 JP 2012521591A5
- Authority
- JP
- Japan
- Prior art keywords
- vector
- data elements
- precision
- solution
- current
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims description 25
- 239000011159 matrix material Substances 0.000 claims description 21
- 230000000875 corresponding Effects 0.000 claims description 19
- 238000004590 computer program Methods 0.000 claims 7
- 230000001419 dependent Effects 0.000 claims 3
- 238000002939 conjugate gradient method Methods 0.000 claims 2
- 230000000717 retained Effects 0.000 description 1
Description
装置1は、Ax=bによって定義される連立1次方程式の解を表すnx1のベクトルxに対応する、nの高精度データ要素を生成するためのプロセスを実施するように適合される。ここでAは、次元nxnの正定値対称密行列であり、bはnx1ベクトルである。行列Aの要素に対応するnxnの高精度データ要素、およびベクトルbの要素に対応するnの高精度データ要素は、メモリ5に格納された入力データによって定義される。より具体的に言えば、行列Aの高精度データ要素は、ここではスカラ関数F( )=a(i,j)を介して間接的に定義され、この式でa(i,j)は、行インデックスi(1<=i<=n)および列インデックスj(1<=j<=n)を伴う要素を表す。この例では、ベクトルbのデータ要素はメモリ5内で直接定義されるものと想定している。メモリ5は、処理動作で使用するための3つの収束条件を定義するパラメータを指定する、データC1(k1,d1)、C2(k2,d2)、およびC3(p,c)も保持する。これらのパラメータについて、以下で説明する。
Claims (15)
- Ax=bを満たす次元nx1ベクトルxに対応するn個の高精度データ要素を生成するための装置であって、この式で、Aは、nxn個の事前に定義された高精度データ要素に対応する次元nxn正定値対称行列であり、bは、事前に定義されたn個の高精度データ要素に対応する次元nx1ベクトルであり、行列Aの高精度データ要素が、スカラ関数F=a(i,j)で定義され、ここで、iは行列Aの行インデックス(1<=i<=n)であり、およびjは行列Aの列インデックス(1<=j<=n)であり、
前記装置は、
行列Aおよびベクトルbの前記データ要素を定義する入力データを格納するためのメモリと、
(a)Alxl=blを満たす次元nx1ベクトルxlに対応するn個の低精度データ要素を前記入力データから生成するための第1の反復プロセスを実施するステップであって、この式で、Alは、前記スカラ関数Fに基づいて作成された低精度関数Flによって定義される低精度の行列Alのnxn個のデータ要素に対応する次元nxn行列であり、blは、低精度のベクトルbのnx1個のデータ要素に対応する次元nx1ベクトルであり、前記高精度は前記低精度よりも高いレベルの精度を有し、前記制御論理は第1の収束条件を満たすことに応じて前記第1の反復プロセスを終了する、前記第1の反復プロセスを実施するステップと、
(b)ベクトルxlの前記低精度データ要素それぞれを高精度データ要素に変換し、現行の高精度解ベクトルxを取得するステップと、
(c)前記ベクトルbとベクトル積Axとの間の差に依存して、次元nx1修正ベクトルに対応するn個の低精度データ要素を生成するための第2の反復プロセスを実施するステップであって、前記制御論理は第2の収束条件を満たすことに応じて前記第2の反復プロセスを終了する、前記第2の反復プロセスを実施するステップと、
(d)前記修正ベクトルのn個の低精度データ要素から、次元nx1更新ベクトルuそれぞれの高精度データ要素を生成するステップと、
(e)x=x+uとなるように、前記現行の高精度解ベクトルxの前記データ要素を更新するステップと、
(f)第3の収束条件が満たされるまで、前記ステップ(c)〜(e)を実行するステップと
を実行するように適合された、前記制御論理と
を備えている、前記装置。 - 前記制御論理が、
前記ステップ(b)で前記現行の高精度解ベクトルxを生成した後、前記ベクトルbと前記ベクトル積Axとの差異を示す現行の次元nx1誤りベクトルr(以下、現行の誤りベクトルrという)に対応するn個のデータ要素を生成するステップと、
前記次元nx1修正ベクトルと前記行列Alのベクトル積が前記現行の誤りベクトルrに依存するように、前記ステップ(c)を実行するステップと、
前記ステップ(d)で、前記次元nx1修正ベクトルのデータ要素を高精度データ要素に変換することによって、更新ベクトルuのデータ要素を生成するステップと
を実行するように適合された、請求項1に記載の装置。 - 前記制御論理が、
r=b−Axとなるように高精度で前記現行の誤りベクトルrの前記データ要素を生成するステップと、
低精度誤りベクトルrlを取得するために、前記現行の誤りベクトルrの前記データ要素をそれぞれの低精度データ要素に変換するステップと、
前記修正ベクトルと前記行列のAlの前記ベクトル積が前記低精度の誤りベクトルrlに等しいように、前記ステップ(c)を実行するステップと、
前記ステップ(e)で、前記現行の高精度解ベクトルxの前記データ要素を更新した後、r=b−Axとなるように、前記現行の誤りベクトルrの前記データ要素を更新するステップと
を実行するように適合され、
前記第3の収束条件が前記現行の誤りベクトルrに依存する、
請求項2に記載の装置。 - 前記第1の収束条件が、
前記第1の反復プロセスの所定のパス数が完了すること、
前記ベクトルxlの解が所定の許容範囲に到達すること、および
前記第1の反復プロセスの連続するパスにおいて、前記ベクトルxlの解に変化が検出されないこと
のうちの少なくとも1つ、またはそのうちの第1の発生に依存する、請求項1〜3のいずれか一項に記載の装置。 - 前記第2の収束条件が、
前記第2の反復プロセスの所定のパス数が完了すること、
前記修正ベクトルの解が所定の許容範囲に到達すること、および
前記第2の反復プロセスの連続するパスにおいて、前記修正ベクトルの解に変化が検出されないこと
のうちの少なくとも1つ、またはそのうちの第1の発生に依存する、請求項1〜4のいずれか一項に記載の装置。 - 前記第3の収束条件が、
前記ステップ(c)〜(e)の所定のパス数が完了すること、
前記現行の高精度解ベクトルxに依存するベクトルの解が所定の許容範囲に到達すること、および
前記ステップ(c)〜(e)の連続するパスにおいて、前記現行の高精度解ベクトルxに依存する前記ベクトルの解に変化が検出されないこと
のうちの少なくとも1つ、またはそのうちの第1の発生に依存する、請求項1〜5のいずれか一項に記載の装置。 - 前記現行の高精度解ベクトルxに依存する前記ベクトルが前記誤りベクトルrを含む、請求項1〜6のいずれか一項に記載の装置。
- 前記第1の反復プロセス又は前記第2の反復プロセスが、共役勾配方法を含む、請求項1〜7のいずれか一項に記載の装置。
- 前記制御論理が、
ステップ(a)〜(e)を並列に実施するように構成された複数のプロセッサを備えている、
請求項1〜8のいずれか一項に記載の装置。 - Ax=bを満たす次元nx1ベクトルxに対応するn個の高精度データ要素を生成するためのコンピュータ・プログラムであって、この式で、Aは、nxn個の事前に定義された高精度データ要素に対応する次元nxn正定値対称行列であり、bは、事前に定義されたn個の高精度データ要素に対応する次元nx1ベクトルであり、行列Aの高精度データ要素が、スカラ関数F=a(i,j)で定義され、ここで、iは行列Aの行インデックス(1<=i<=n)であり、およびjは行列Aの列インデックス(1<=j<=n)であり、前記コンピュータのメモリ内に格納され行列Aおよびベクトルbの前記データ要素を定義する入力データに、前記コンピュータをアクセスさせ、
(a)Alxl=blを満たす次元nx1ベクトルxlに対応するn個の低精度データ要素を前記入力データから生成するための第1の反復プロセスを実施するステップであって、この式で、Alは、低精度の行列Aのnxn個のデータ要素に対応する次元nxn行列であり、blは、低精度のベクトルbのnx1個のデータ要素に対応する次元nx1ベクトルであり、前記高精度は前記低精度よりも高いレベルの精度を有し、前記制御論理は第1の収束条件を満たすことに応じて前記第1の反復プロセスを終了する、前記第1の反復プロセスを実施するステップと、
(b)ベクトルxlの前記低精度データ要素それぞれを高精度データ要素に変換し、現行の高精度解ベクトルxを取得するステップと、
(c)前記ベクトルbとベクトル積Axとの間の差に依存して、次元nx1修正ベクトルに対応するn個の低精度データ要素を生成するための第2の反復プロセスを実施するステップであって、前記制御論理は第2の収束条件を満たすことに応じて前記第2の反復プロセスを終了する、前記第2の反復プロセスを実施するステップと、
(d)前記修正ベクトルのn個の低精度データ要素から、次元nx1更新ベクトルuそれぞれの高精度データ要素を生成するステップと、
(e)x=x+uとなるように、前記現行の高精度解ベクトルxの前記データ要素を更新するステップと、
(f)第3の収束条件が満たされるまで、前記ステップ(c)〜(e)を実行するステップと
をコンピュータに実行させるための、プログラム・コード手段を備えている、前記コンピュータ・プログラム。 - 前記ステップ(b)で前記現行の高精度解ベクトルxを生成した後、前記ベクトルbと前記ベクトル積Axとの差異を示す現行の次元nx1誤りベクトルr(以下、現行の誤りベクトルrという)に対応するn個のデータ要素を生成するステップと、
前記次元nx1修正ベクトルと前記行列Alのベクトル積が前記現行の誤りベクトルrに依存するように、前記ステップ(c)を実行するステップと、
前記ステップ(d)で、前記次元nx1修正ベクトルのデータ要素を高精度データ要素に変換することによって、更新ベクトルuのデータ要素を生成するステップと
を、前記コンピュータに実行させるための、前記プログラム・コード手段をさらに含む、請求項10に記載のコンピュータ・プログラム。 - r=b−Axとなるように高精度で前記現行の誤りベクトルrの前記データ要素を生成するステップと、
低精度誤りベクトルrlを取得するために、前記現行の誤りベクトルrの前記データ要素をそれぞれの低精度データ要素に変換するステップと、
前記修正ベクトルと前記行列のAlの前記ベクトル積が前記低精度の誤りベクトルrlに等しいように、前記ステップ(c)を実行するステップと、
前記ステップ(e)で、前記現行の高精度解ベクトルxの前記データ要素を更新した後、r=b−Axとなるように、前記現行の誤りベクトルrの前記データ要素を更新するステップと
を、前記コンピュータに実行させるための、プログラム・コード手段をさらに含み、
前記第3の収束条件が前記現行の誤りベクトルrに依存する、
請求項11に記載のコンピュータ・プログラム。 - 前記第1の収束条件が、
前記第1の反復プロセスの所定のパス数が完了すること、
前記ベクトルxlの解が所定の許容範囲に到達すること、および
前記第1の反復プロセスの連続するパスにおいて、前記ベクトルxlの解に変化が検出されないこと
のうちの少なくとも1つ、またはそのうちの第1の発生に依存し;
前記第2の収束条件が、
前記第2の反復プロセスの所定のパス数が完了すること、
前記修正ベクトルの解が所定の許容範囲に到達すること、および
前記第2の反復プロセスの連続するパスにおいて、前記修正ベクトルの解に変化が検出されないこと
のうちの少なくとも1つ、またはそのうちの第1の発生に依存し;又は、
前記第3の収束条件が、
前記ステップ(c)〜(e)の所定のパス数が完了すること、
前記現行の高精度解ベクトルxに依存するベクトルの解が所定の許容範囲に到達すること、および
前記ステップ(c)〜(e)の連続するパスにおいて、前記現行の高精度解ベクトルxに依存する前記ベクトルの解に変化が検出されないこと
のうちの少なくとも1つ、またはそのうちの第1の発生に依存する、
請求項10〜12のいずれか一項に記載のコンピュータ・プログラム。 - 前記現行の高精度解ベクトルxに依存する前記ベクトルが前記誤りベクトルrを含む、請求項10〜13のいずれか一項に記載のコンピュータ・プログラム。
- 前記第1の反復プロセス又は前記第2の反復プロセスが、共役勾配方法を含む、請求項10〜14のいずれか一項に記載のコンピュータ・プログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP09156017.7 | 2009-03-24 | ||
EP09156017 | 2009-03-24 | ||
PCT/IB2010/050912 WO2010109359A2 (en) | 2009-03-24 | 2010-03-03 | Processing of linear systems of equations |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2012521591A JP2012521591A (ja) | 2012-09-13 |
JP2012521591A5 true JP2012521591A5 (ja) | 2014-04-17 |
JP5570038B2 JP5570038B2 (ja) | 2014-08-13 |
Family
ID=42781607
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012501429A Expired - Fee Related JP5570038B2 (ja) | 2009-03-24 | 2010-03-03 | 連立1次方程式を処理するための装置およびコンピュータ・プログラム |
Country Status (4)
Country | Link |
---|---|
US (2) | US9032006B2 (ja) |
JP (1) | JP5570038B2 (ja) |
CN (1) | CN102362274A (ja) |
WO (1) | WO2010109359A2 (ja) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10083250B2 (en) | 2013-05-22 | 2018-09-25 | International Business Machines Corporation | Simplification of large networks and graphs |
US9262380B2 (en) | 2013-05-22 | 2016-02-16 | International Business Machines Corporation | Calculating node centralities in large networks and graphs |
GB2523341A (en) | 2014-02-20 | 2015-08-26 | Ibm | Iterative refinement apparatus |
US10025754B2 (en) | 2015-07-22 | 2018-07-17 | International Business Machines Corporation | Linear FE system solver with dynamic multi-grip precision |
JP6550465B2 (ja) * | 2015-08-20 | 2019-07-24 | 株式会社日立製作所 | 情報処理回路 |
US10209685B2 (en) * | 2015-10-29 | 2019-02-19 | Mitsubishi Electric Research Laboratories, Inc. | Method and apparatus for preconditioned model predictive control |
CN107526709A (zh) * | 2016-06-15 | 2017-12-29 | 辉达公司 | 使用低精度格式的张量处理 |
US10997492B2 (en) * | 2017-01-20 | 2021-05-04 | Nvidia Corporation | Automated methods for conversions to a lower precision data format |
US11494588B2 (en) | 2020-03-06 | 2022-11-08 | International Business Machines Corporation | Ground truth generation for image segmentation |
US11556852B2 (en) * | 2020-03-06 | 2023-01-17 | International Business Machines Corporation | Efficient ground truth annotation |
US11495038B2 (en) | 2020-03-06 | 2022-11-08 | International Business Machines Corporation | Digital image processing |
CN111475475A (zh) * | 2020-04-01 | 2020-07-31 | 中国人民解放军火箭军工程大学 | 一种数据矩阵的差异化压缩存储模型 |
CN113375568B (zh) * | 2021-05-12 | 2023-03-31 | 苏州阿普奇物联网科技有限公司 | 一种基于激光扫描的金属拉丝抛光不良检测方法 |
US11907715B2 (en) | 2021-12-20 | 2024-02-20 | International Business Machines Corporation | Hardware acceleration with preconditioners |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4311741B2 (ja) * | 2004-12-15 | 2009-08-12 | キヤノン株式会社 | 情報処理装置、情報処理方法 |
US8175853B2 (en) * | 2008-03-28 | 2012-05-08 | International Business Machines Corporation | Systems and methods for a combined matrix-vector and matrix transpose vector multiply for a block-sparse matrix |
US8577949B2 (en) * | 2009-07-07 | 2013-11-05 | L-3 Communications Integrated Systems, L.P. | System for conjugate gradient linear iterative solvers |
-
2010
- 2010-03-03 US US13/202,230 patent/US9032006B2/en not_active Expired - Fee Related
- 2010-03-03 JP JP2012501429A patent/JP5570038B2/ja not_active Expired - Fee Related
- 2010-03-03 CN CN2010800134171A patent/CN102362274A/zh active Pending
- 2010-03-03 WO PCT/IB2010/050912 patent/WO2010109359A2/en active Application Filing
-
2015
- 2015-05-11 US US14/708,668 patent/US9424232B2/en not_active Expired - Fee Related
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2012521591A5 (ja) | ||
US10534607B2 (en) | Accessing data in multi-dimensional tensors using adders | |
US10394979B2 (en) | Method and device for elastic object deformation modeling | |
JP5937284B2 (ja) | 階層型ニューラルネットワーク装置、判別器学習方法および判別方法 | |
Pan et al. | An effective hybrid discrete differential evolution algorithm for the flow shop scheduling with intermediate buffers | |
JP2017138964A5 (ja) | ||
JP2018158570A (ja) | 付加製造製品の設計のためのシステムおよび方法 | |
CN108897716B (zh) | 通过存储器读写操作来缩减计算量的数据处理装置及方法 | |
CN111914378B (zh) | 一种单振幅量子计算模拟方法及装置 | |
CN111077768B (zh) | 优化装置及优化装置的控制方法 | |
JP2014206913A (ja) | 高分子材料のシミュレーション方法 | |
JPWO2020234984A5 (ja) | ||
CN106020775B (zh) | 模板代码的simd实现 | |
Bajdich et al. | Systematic reduction of sign errors in many-body calculations of atoms and molecules | |
JP2015135662A (ja) | 情報処理装置、プログラム及び方法 | |
US9607106B2 (en) | Method and apparatus for searching pattern in sequence data | |
JP6651254B2 (ja) | シミュレーション方法、シミュレーションプログラム、及びシミュレーション装置 | |
CN111079082A (zh) | 一种提高涉及稀疏矩阵计算速率的方法和系统 | |
Barkouki et al. | A matrix rational Lanczos method for model reduction in large‐scale first‐and second‐order dynamical systems | |
JP7339923B2 (ja) | 材料の特性値を推定するシステム | |
Lu et al. | Data Filtering Based Recursive Least Squares Algorithm for Two‐Input Single‐Output Systems with Moving Average Noises | |
JP6504155B2 (ja) | データ管理装置、データ分析装置、データ分析システム、及び、分析方法 | |
JPWO2005029352A1 (ja) | 並列計算方法及び装置 | |
CN106650126B (zh) | 一种计算阵列版图电阻网络的加速方法 | |
Lotfi et al. | Two new three and four parametric with memory methods for solving nonlinear equations |