JPH07152726A - 修正コレスキー分解計算装置 - Google Patents
修正コレスキー分解計算装置Info
- Publication number
- JPH07152726A JPH07152726A JP29791393A JP29791393A JPH07152726A JP H07152726 A JPH07152726 A JP H07152726A JP 29791393 A JP29791393 A JP 29791393A JP 29791393 A JP29791393 A JP 29791393A JP H07152726 A JPH07152726 A JP H07152726A
- Authority
- JP
- Japan
- Prior art keywords
- matrix
- modified cholesky
- calculation
- block size
- cholesky decomposition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Complex Calculations (AREA)
Abstract
により、修正コレスキー分解計算装置の計算速度を向上
させる。 【構成】 この実施例は、キーボードなどの入力装置1
と、プログラム制御により動作するデータ処理装置2
と、データを記憶する記憶装置3と、ディスプレイなど
の出力装置4とから構成される。データ処理装置2はブ
ロックサイズ決定手段21と、修正コレスキー分解計算
手段22とを備える。記憶装置3はブロックサイズ決定
用データ記憶部31と行列記憶部32とを備える。ブロ
ックサイズ決定用データ記憶部31は、どんなブロック
サイズを取れば最も速く修正コレスキー分解ができるか
というデータをいくつかの行列の数次Nに対してあらか
じめ記憶している。行列記憶部32は動作開始直後に
は、分解すべき行列Aが記憶されているが、データ処理
装置2の動作に伴って、その内容は更新される。
Description
値計算を行なう数値計算装置に関し、特に、修正コレス
キー分解を計算する修正コレスキー分解計算装置に関す
る。
解の計算をその行列を構成する小行列、すなわちブロッ
ク行列の計算に帰着させる方法をブロック化処理と呼
び、これにより修正コレスキー分解の計算の大部分がブ
ロック化行列の積と差に帰着される。
方法として修正コレスキー法というのが知られている
が、これを電子計算機で高速に計算するために次のよう
な方法が行われている。なお、詳細はジェイ・ドンゲエ
ラ「ア・セット・オブ・レベル3・ベーシック・リニア
・アルジブラ・サブプログラムズ」( 文献1:J.DO
NGARRA「A Set of Level 3 Basic Linear Algebra
Subprograms」 ACMTransaction on Mathematical Softw
are,Vol.16,No.1,March,1990)に記述されている。
L11およびU11は同じ次数Mの正方行列で、このMを以
降ブロックサイズと呼ぶ。すると、 A=LDU は、
L21,U11およびU12は修正コレスキー法で計算でき
る。の結果を用いれば式(3)の左辺が計算できるの
で、それを新たに行列Aと見なして再びブロックに分割
して上記の計算を行なう。この過程繰り返して修正コレ
スキー分解の計算を行なうのがブロック化処理による修
正コレスキー分解である。この方法では、上記の式
(3)の左辺の計算が、計算量の大部分を占める。した
がって修正コレスキー分解を高速に計算するという問題
は、 A22−L21D11U12 (4) というブロック化行列の計算を高速に行なうという問題
に帰着する。ここでAをK×K行列、L21をK×M行列
そしてU21をM×K行列とすると、Kは計算の過程で変
化するが、ブロックサイズMは計算の過程で変化しな
い。修正コレスキー分解の計算速度は、中央処理装置の
レジスタの構成や、キャッシュメモリの容量といった電
子計算機のバードウェアの構成ならびに、与えられた行
列Aの次数とブロックサイズMに依存する。このうち人
為的に設定可能なのは、ブロックサイズだけであるが、
文献1によると、従来は様々な行列の次数に対して、平
均して最も大きな計算速度を示したブロックサイズに固
定して計算を行なっているため、使用している電子計算
機で実現しうる最大の計算速度が、行列の任意の次数に
対して得られるとは限らない。
られた行列に対して、最適なブロックサイズを自動的に
選択して、修正コレスキー分解を計算できるようにした
修正コレスキー分解計算装置を提供することにある。
分解計算装置は、対称行列を下三角行列Lの対角行列
D、および転置行列Uを用いて、LDUという形に表わ
す修正コレスキー分解を計算するための装置であって、
行列の修正コレスキー分解の計算をブロック化処理、す
なわち行列を構成する小行列の間の演算に帰着させる処
理を用いることにより、修正コレスキー分解の計算の多
くの部分が行列の積と差の計算になり、この行列の積と
差の計算を高速化することで、修正コレスキー分解の計
算自体を高速化することを特徴とする。
対称行列を下三角行列Lの対角行列D、および転置行列
Uを用いて、LDUという形に表わす修正コレスキー分
解を計算するための装置であって、入力行列の次数によ
って、入力行列をどのような大きさのブロックに分割し
て処理すればよいかを調べておき(このブロックの大き
さを以降ブロックサイズと呼ぶ)、これをもとに最適な
ブロックサイズを選択する機能を備えていることを特徴
とする。
る。
である。この実施例は、キーボードなどの入力装置1
と、プログラム制御により動作するデータ処理装置2
と、データを記憶する記憶装置3と、ディスプレイなど
の出力装置4とから構成される。
段21と、修正コレスキー分解計算手段22とを備え
る。記憶装置3はブロックサイズ決定用データ記憶部3
1と行列記憶部32とを備える。
は、どんなブロックサイズを取れば最も速く修正コレス
キー分解ができるかというデータをいくつかの行列の数
次Nに対してあらかじめ記憶している。行列記憶部32
は動作開始直後には、分解すべき行列Aが記憶されてい
るが、データ処理装置2の動作に伴って、その内容は更
新される。
動作について説明する。
憶部32に格納され、行列Aの次数Nがブロックサイズ
決定手段21に与えられる(ステップA1)。ブロック
サイズ決定手段21はあらかじめ定められたブロック化
処理を行う行列の次数の下限LとNを比較する(ステッ
プA2)。もしN<Lならば、修正コレスキー分解計算
手段22はブロック化処理を用いずに修正コレスキー分
解を計算する(ステップA6)。もし、N<Lでないな
らばブロックサイズ決定手段21はNを行列記憶部32
にある最適ブロックサイズのデータと比較する(ステッ
プA3)。そして、該当する最適なブロックサイズが見
つかればその値を修正コレスキー分解計算手段22に与
える。もし見つからなければ、既定値のブロックサイズ
を修正コレスキー分解計算手段22に与える(ステップ
A5)。そして修正コレスキー分解計算手段22は行列
Aを,従来の技術の欄で述べたように、文献1で示され
たブロック化処理により与えられたブロックサイズで修
正コレスキー分解し、結果を行列記憶部32に格納する
(ステップA4)。記憶領域を節約するため、修正コレ
スキー分解の計算結果は入力された行列Aのデータの上
に上書される。その格納のされ方であるが、行列Aの下
三角部分に行列Lの下三角部分が、行列Aの対角要素を
除く上三角部分に行列Uの上三角部分が格納される。最
後に出力装置4から行列記憶部32に格納された修正コ
レスキー分解の計算結果が出力される(ステップA
7)。
処理による修正コレスキー分解の計算で固定されたブロ
ックサイズを用いているのに対し、本発明ではブロック
サイズ決定手段とブロックサイズ決定用データ記憶部を
設けることにより、最適なブロックサイズが自動的に選
択されて、修正コレスキー分解の計算速度が向上する。
また、本発明はブロック化処理を用いている修正コレス
キー分解以外の計算のための装置にも適用可能である。
Claims (2)
- 【請求項1】 対称行列を下三角行列Lの対角行列D、
および転置行列Uを用いて、LDUという形に表わす修
正コレスキー分解を計算するための装置であって、行列
の修正コレスキー分解の計算をブロック化処理、すなわ
ち行列を構成する小行列の間の演算に帰着させる処理を
用いることにより、修正コレスキー分解の計算の多くの
部分が行列の積と差の計算になり、この行列の積と差の
計算を高速化することで、修正コレスキー分解の計算自
体を高速化することを特徴とする修正コレスキー分解計
算装置。 - 【請求項2】 対称行列を下三角行列Lの対角行列D、
および転置行列Uを用いて、LDUという形に表わす修
正コレスキー分解を計算するための装置であって、入力
行列の次数によって、入力行列をどのような大きさのブ
ロックに分割して処理すればよいかを調べておき(この
ブロックの大きさを以降ブロックサイズと呼ぶ)、これ
をもとに最適なブロックサイズを選択する機能を備えて
いることを特徴とする修正コレスキー分解計算装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP29791393A JP2953929B2 (ja) | 1993-11-29 | 1993-11-29 | 修正コレスキー分解計算装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP29791393A JP2953929B2 (ja) | 1993-11-29 | 1993-11-29 | 修正コレスキー分解計算装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH07152726A true JPH07152726A (ja) | 1995-06-16 |
JP2953929B2 JP2953929B2 (ja) | 1999-09-27 |
Family
ID=17852718
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP29791393A Expired - Lifetime JP2953929B2 (ja) | 1993-11-29 | 1993-11-29 | 修正コレスキー分解計算装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2953929B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8250130B2 (en) | 2008-05-30 | 2012-08-21 | International Business Machines Corporation | Reducing bandwidth requirements for matrix multiplication |
US8533251B2 (en) | 2008-05-23 | 2013-09-10 | International Business Machines Corporation | Optimized corner turns for local storage and bandwidth reduction |
US10417302B2 (en) | 2016-02-23 | 2019-09-17 | Fujitsu Limited | Parallel computer, parallel LU-factorization method, and parallel LU-factorization program |
-
1993
- 1993-11-29 JP JP29791393A patent/JP2953929B2/ja not_active Expired - Lifetime
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8533251B2 (en) | 2008-05-23 | 2013-09-10 | International Business Machines Corporation | Optimized corner turns for local storage and bandwidth reduction |
US8554820B2 (en) | 2008-05-23 | 2013-10-08 | International Business Machines Corporation | Optimized corner turns for local storage and bandwidth reduction |
US8250130B2 (en) | 2008-05-30 | 2012-08-21 | International Business Machines Corporation | Reducing bandwidth requirements for matrix multiplication |
US10417302B2 (en) | 2016-02-23 | 2019-09-17 | Fujitsu Limited | Parallel computer, parallel LU-factorization method, and parallel LU-factorization program |
Also Published As
Publication number | Publication date |
---|---|
JP2953929B2 (ja) | 1999-09-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2956800B2 (ja) | 連立一次方程式に関する計算装置 | |
JP2883784B2 (ja) | マイクロコンピュータ | |
CN112074806A (zh) | 使用减小的位宽向量的块浮点计算 | |
US9170776B2 (en) | Digital signal processor having instruction set with a logarithm function using reduced look-up table | |
US6223197B1 (en) | Constant multiplier, method and device for automatically providing constant multiplier and storage medium storing constant multiplier automatic providing program | |
US6470440B1 (en) | Vector compare and maximum/minimum generation apparatus and method therefor | |
JPH07152726A (ja) | 修正コレスキー分解計算装置 | |
US20020190996A1 (en) | Generating partials for perspective corrected texture coordinates in a four pixel texture pipeline | |
EP4024206A1 (en) | Computing device and method for reusing data | |
US6389443B1 (en) | Method and apparatus for an efficient square-root computation | |
US20030182339A1 (en) | Emod a fast modulus calculation for computer systems | |
US20210182685A1 (en) | Neural network batch normalization optimization method and apparatus | |
US20240211211A1 (en) | Mac apparatus using floating point unit and control method thereof | |
CN118586462A (zh) | 一种大语言模型量化方法、装置及电子设备 | |
JP3074935B2 (ja) | マイクロコンピュータ | |
JPH07182310A (ja) | 構造解析方法及び装置 | |
JP2821406B2 (ja) | 積和演算器およびこれを用いたディジタルフィルタ回路 | |
JP3260394B2 (ja) | メンバーシップ関数回路 | |
JP3101377B2 (ja) | 再帰フィルタ設計方式 | |
JP6059287B2 (ja) | 行列三角化装置およびプログラム | |
CN116225532A (zh) | 一种支持加速向量运算的通用处理器 | |
JPH0210476A (ja) | 曲線の折線近似装置 | |
JP3522387B2 (ja) | パイプライン演算装置 | |
JP2924518B2 (ja) | レイアウトのコンパクション処理方法 | |
JP3115428B2 (ja) | パイプライン制御方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 19990622 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20070716 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080716 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090716 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100716 Year of fee payment: 11 |