JPH07152726A - 修正コレスキー分解計算装置 - Google Patents

修正コレスキー分解計算装置

Info

Publication number
JPH07152726A
JPH07152726A JP29791393A JP29791393A JPH07152726A JP H07152726 A JPH07152726 A JP H07152726A JP 29791393 A JP29791393 A JP 29791393A JP 29791393 A JP29791393 A JP 29791393A JP H07152726 A JPH07152726 A JP H07152726A
Authority
JP
Japan
Prior art keywords
matrix
modified cholesky
calculation
block size
cholesky decomposition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP29791393A
Other languages
English (en)
Other versions
JP2953929B2 (ja
Inventor
Junichi Yorozu
淳一 萬
Kenichi Takada
健一 高田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NIPPON DENKI GIJUTSU JOHO SYST
NIPPON DENKI GIJUTSU JOHO SYST KAIHATSU KK
NEC Corp
Original Assignee
NIPPON DENKI GIJUTSU JOHO SYST
NIPPON DENKI GIJUTSU JOHO SYST KAIHATSU KK
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NIPPON DENKI GIJUTSU JOHO SYST, NIPPON DENKI GIJUTSU JOHO SYST KAIHATSU KK, NEC Corp filed Critical NIPPON DENKI GIJUTSU JOHO SYST
Priority to JP29791393A priority Critical patent/JP2953929B2/ja
Publication of JPH07152726A publication Critical patent/JPH07152726A/ja
Application granted granted Critical
Publication of JP2953929B2 publication Critical patent/JP2953929B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Complex Calculations (AREA)

Abstract

(57)【要約】 【目的】 最適なブロックサイズによるブロック化処理
により、修正コレスキー分解計算装置の計算速度を向上
させる。 【構成】 この実施例は、キーボードなどの入力装置1
と、プログラム制御により動作するデータ処理装置2
と、データを記憶する記憶装置3と、ディスプレイなど
の出力装置4とから構成される。データ処理装置2はブ
ロックサイズ決定手段21と、修正コレスキー分解計算
手段22とを備える。記憶装置3はブロックサイズ決定
用データ記憶部31と行列記憶部32とを備える。ブロ
ックサイズ決定用データ記憶部31は、どんなブロック
サイズを取れば最も速く修正コレスキー分解ができるか
というデータをいくつかの行列の数次Nに対してあらか
じめ記憶している。行列記憶部32は動作開始直後に
は、分解すべき行列Aが記憶されているが、データ処理
装置2の動作に伴って、その内容は更新される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、電子計算機を用いて数
値計算を行なう数値計算装置に関し、特に、修正コレス
キー分解を計算する修正コレスキー分解計算装置に関す
る。
【0002】
【従来の技術】与えられた対称行列の修正コレスキー分
解の計算をその行列を構成する小行列、すなわちブロッ
ク行列の計算に帰着させる方法をブロック化処理と呼
び、これにより修正コレスキー分解の計算の大部分がブ
ロック化行列の積と差に帰着される。
【0003】与えられた行列を修正コレスキー分解する
方法として修正コレスキー法というのが知られている
が、これを電子計算機で高速に計算するために次のよう
な方法が行われている。なお、詳細はジェイ・ドンゲエ
ラ「ア・セット・オブ・レベル3・ベーシック・リニア
・アルジブラ・サブプログラムズ」( 文献1:J.DO
NGARRA「A Set of Level 3 Basic Linear Algebra
Subprograms」 ACMTransaction on Mathematical Softw
are,Vol.16,No.1,March,1990)に記述されている。
【0004】まず行列A,L,DおよびUを
【0005】
【0006】のようにブロック行列に分割する。A11
11およびU11は同じ次数Mの正方行列で、このMを以
降ブロックサイズと呼ぶ。すると、 A=LDU は、
【0007】
【0008】という3つの式に書き換えられる。L11
21,U11およびU12は修正コレスキー法で計算でき
る。の結果を用いれば式(3)の左辺が計算できるの
で、それを新たに行列Aと見なして再びブロックに分割
して上記の計算を行なう。この過程繰り返して修正コレ
スキー分解の計算を行なうのがブロック化処理による修
正コレスキー分解である。この方法では、上記の式
(3)の左辺の計算が、計算量の大部分を占める。した
がって修正コレスキー分解を高速に計算するという問題
は、 A22−L211112 (4) というブロック化行列の計算を高速に行なうという問題
に帰着する。ここでAをK×K行列、L21をK×M行列
そしてU21をM×K行列とすると、Kは計算の過程で変
化するが、ブロックサイズMは計算の過程で変化しな
い。修正コレスキー分解の計算速度は、中央処理装置の
レジスタの構成や、キャッシュメモリの容量といった電
子計算機のバードウェアの構成ならびに、与えられた行
列Aの次数とブロックサイズMに依存する。このうち人
為的に設定可能なのは、ブロックサイズだけであるが、
文献1によると、従来は様々な行列の次数に対して、平
均して最も大きな計算速度を示したブロックサイズに固
定して計算を行なっているため、使用している電子計算
機で実現しうる最大の計算速度が、行列の任意の次数に
対して得られるとは限らない。
【0009】
【発明が解決しようとする課題】本発明の目的は、与え
られた行列に対して、最適なブロックサイズを自動的に
選択して、修正コレスキー分解を計算できるようにした
修正コレスキー分解計算装置を提供することにある。
【0010】
【課題を解決するための手段】本発明の修正コレスキー
分解計算装置は、対称行列を下三角行列Lの対角行列
D、および転置行列Uを用いて、LDUという形に表わ
す修正コレスキー分解を計算するための装置であって、
行列の修正コレスキー分解の計算をブロック化処理、す
なわち行列を構成する小行列の間の演算に帰着させる処
理を用いることにより、修正コレスキー分解の計算の多
くの部分が行列の積と差の計算になり、この行列の積と
差の計算を高速化することで、修正コレスキー分解の計
算自体を高速化することを特徴とする。
【0011】本発明の修正コレスキー分解計算装置は、
対称行列を下三角行列Lの対角行列D、および転置行列
Uを用いて、LDUという形に表わす修正コレスキー分
解を計算するための装置であって、入力行列の次数によ
って、入力行列をどのような大きさのブロックに分割し
て処理すればよいかを調べておき(このブロックの大き
さを以降ブロックサイズと呼ぶ)、これをもとに最適な
ブロックサイズを選択する機能を備えていることを特徴
とする。
【0012】
【実施例】次に、本発明について図面を参照して説明す
る。
【0013】図1は本発明の一実施例を示すブロック図
である。この実施例は、キーボードなどの入力装置1
と、プログラム制御により動作するデータ処理装置2
と、データを記憶する記憶装置3と、ディスプレイなど
の出力装置4とから構成される。
【0014】データ処理装置2はブロックサイズ決定手
段21と、修正コレスキー分解計算手段22とを備え
る。記憶装置3はブロックサイズ決定用データ記憶部3
1と行列記憶部32とを備える。
【0015】ブロックサイズ決定用データ記憶部31
は、どんなブロックサイズを取れば最も速く修正コレス
キー分解ができるかというデータをいくつかの行列の数
次Nに対してあらかじめ記憶している。行列記憶部32
は動作開始直後には、分解すべき行列Aが記憶されてい
るが、データ処理装置2の動作に伴って、その内容は更
新される。
【0016】次に図1と図2を参照して、この実施例の
動作について説明する。
【0017】入力装置1から与えられた行列Aが行列記
憶部32に格納され、行列Aの次数Nがブロックサイズ
決定手段21に与えられる(ステップA1)。ブロック
サイズ決定手段21はあらかじめ定められたブロック化
処理を行う行列の次数の下限LとNを比較する(ステッ
プA2)。もしN<Lならば、修正コレスキー分解計算
手段22はブロック化処理を用いずに修正コレスキー分
解を計算する(ステップA6)。もし、N<Lでないな
らばブロックサイズ決定手段21はNを行列記憶部32
にある最適ブロックサイズのデータと比較する(ステッ
プA3)。そして、該当する最適なブロックサイズが見
つかればその値を修正コレスキー分解計算手段22に与
える。もし見つからなければ、既定値のブロックサイズ
を修正コレスキー分解計算手段22に与える(ステップ
A5)。そして修正コレスキー分解計算手段22は行列
Aを,従来の技術の欄で述べたように、文献1で示され
たブロック化処理により与えられたブロックサイズで修
正コレスキー分解し、結果を行列記憶部32に格納する
(ステップA4)。記憶領域を節約するため、修正コレ
スキー分解の計算結果は入力された行列Aのデータの上
に上書される。その格納のされ方であるが、行列Aの下
三角部分に行列Lの下三角部分が、行列Aの対角要素を
除く上三角部分に行列Uの上三角部分が格納される。最
後に出力装置4から行列記憶部32に格納された修正コ
レスキー分解の計算結果が出力される(ステップA
7)。
【0018】
【発明の効果】以上説明したように、従来のブロック化
処理による修正コレスキー分解の計算で固定されたブロ
ックサイズを用いているのに対し、本発明ではブロック
サイズ決定手段とブロックサイズ決定用データ記憶部を
設けることにより、最適なブロックサイズが自動的に選
択されて、修正コレスキー分解の計算速度が向上する。
また、本発明はブロック化処理を用いている修正コレス
キー分解以外の計算のための装置にも適用可能である。
【図面の簡単な説明】
【図1】本発明の一実施例のブロック図である。
【図2】図1の実施例の動作を示す流れ図である。
【符号の説明】
1 入力装置 2 データ処理装置 3 記憶装置 4 出力装置 21 ブロックサイズ決定手段 22 修正コレスキー分解計算手段 31 ブロックサイズ決定用データ記憶部 32 行列記憶部

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 対称行列を下三角行列Lの対角行列D、
    および転置行列Uを用いて、LDUという形に表わす修
    正コレスキー分解を計算するための装置であって、行列
    の修正コレスキー分解の計算をブロック化処理、すなわ
    ち行列を構成する小行列の間の演算に帰着させる処理を
    用いることにより、修正コレスキー分解の計算の多くの
    部分が行列の積と差の計算になり、この行列の積と差の
    計算を高速化することで、修正コレスキー分解の計算自
    体を高速化することを特徴とする修正コレスキー分解計
    算装置。
  2. 【請求項2】 対称行列を下三角行列Lの対角行列D、
    および転置行列Uを用いて、LDUという形に表わす修
    正コレスキー分解を計算するための装置であって、入力
    行列の次数によって、入力行列をどのような大きさのブ
    ロックに分割して処理すればよいかを調べておき(この
    ブロックの大きさを以降ブロックサイズと呼ぶ)、これ
    をもとに最適なブロックサイズを選択する機能を備えて
    いることを特徴とする修正コレスキー分解計算装置。
JP29791393A 1993-11-29 1993-11-29 修正コレスキー分解計算装置 Expired - Lifetime JP2953929B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP29791393A JP2953929B2 (ja) 1993-11-29 1993-11-29 修正コレスキー分解計算装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP29791393A JP2953929B2 (ja) 1993-11-29 1993-11-29 修正コレスキー分解計算装置

Publications (2)

Publication Number Publication Date
JPH07152726A true JPH07152726A (ja) 1995-06-16
JP2953929B2 JP2953929B2 (ja) 1999-09-27

Family

ID=17852718

Family Applications (1)

Application Number Title Priority Date Filing Date
JP29791393A Expired - Lifetime JP2953929B2 (ja) 1993-11-29 1993-11-29 修正コレスキー分解計算装置

Country Status (1)

Country Link
JP (1) JP2953929B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8250130B2 (en) 2008-05-30 2012-08-21 International Business Machines Corporation Reducing bandwidth requirements for matrix multiplication
US8533251B2 (en) 2008-05-23 2013-09-10 International Business Machines Corporation Optimized corner turns for local storage and bandwidth reduction
US10417302B2 (en) 2016-02-23 2019-09-17 Fujitsu Limited Parallel computer, parallel LU-factorization method, and parallel LU-factorization program

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8533251B2 (en) 2008-05-23 2013-09-10 International Business Machines Corporation Optimized corner turns for local storage and bandwidth reduction
US8554820B2 (en) 2008-05-23 2013-10-08 International Business Machines Corporation Optimized corner turns for local storage and bandwidth reduction
US8250130B2 (en) 2008-05-30 2012-08-21 International Business Machines Corporation Reducing bandwidth requirements for matrix multiplication
US10417302B2 (en) 2016-02-23 2019-09-17 Fujitsu Limited Parallel computer, parallel LU-factorization method, and parallel LU-factorization program

Also Published As

Publication number Publication date
JP2953929B2 (ja) 1999-09-27

Similar Documents

Publication Publication Date Title
JP2956800B2 (ja) 連立一次方程式に関する計算装置
JP2883784B2 (ja) マイクロコンピュータ
CN112074806A (zh) 使用减小的位宽向量的块浮点计算
US9170776B2 (en) Digital signal processor having instruction set with a logarithm function using reduced look-up table
US6223197B1 (en) Constant multiplier, method and device for automatically providing constant multiplier and storage medium storing constant multiplier automatic providing program
US6470440B1 (en) Vector compare and maximum/minimum generation apparatus and method therefor
JPH07152726A (ja) 修正コレスキー分解計算装置
US20020190996A1 (en) Generating partials for perspective corrected texture coordinates in a four pixel texture pipeline
EP4024206A1 (en) Computing device and method for reusing data
US6389443B1 (en) Method and apparatus for an efficient square-root computation
US20030182339A1 (en) Emod a fast modulus calculation for computer systems
US20210182685A1 (en) Neural network batch normalization optimization method and apparatus
US20240211211A1 (en) Mac apparatus using floating point unit and control method thereof
CN118586462A (zh) 一种大语言模型量化方法、装置及电子设备
JP3074935B2 (ja) マイクロコンピュータ
JPH07182310A (ja) 構造解析方法及び装置
JP2821406B2 (ja) 積和演算器およびこれを用いたディジタルフィルタ回路
JP3260394B2 (ja) メンバーシップ関数回路
JP3101377B2 (ja) 再帰フィルタ設計方式
JP6059287B2 (ja) 行列三角化装置およびプログラム
CN116225532A (zh) 一种支持加速向量运算的通用处理器
JPH0210476A (ja) 曲線の折線近似装置
JP3522387B2 (ja) パイプライン演算装置
JP2924518B2 (ja) レイアウトのコンパクション処理方法
JP3115428B2 (ja) パイプライン制御方法

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19990622

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070716

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080716

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090716

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100716

Year of fee payment: 11