JP2001067338A - 高速たたみ込み演算方式とその演算器および高速補間方式と高速補間器 - Google Patents

高速たたみ込み演算方式とその演算器および高速補間方式と高速補間器

Info

Publication number
JP2001067338A
JP2001067338A JP24244199A JP24244199A JP2001067338A JP 2001067338 A JP2001067338 A JP 2001067338A JP 24244199 A JP24244199 A JP 24244199A JP 24244199 A JP24244199 A JP 24244199A JP 2001067338 A JP2001067338 A JP 2001067338A
Authority
JP
Japan
Prior art keywords
sum
input
product
calculation unit
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP24244199A
Other languages
English (en)
Inventor
Masato Ogata
正人 緒方
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Precision Co Ltd
Original Assignee
Mitsubishi Precision Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Precision Co Ltd filed Critical Mitsubishi Precision Co Ltd
Priority to JP24244199A priority Critical patent/JP2001067338A/ja
Publication of JP2001067338A publication Critical patent/JP2001067338A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Complex Calculations (AREA)

Abstract

(57)【要約】 【課題】 高速、小型、安価で容易に並列度及び次元を
変更可能なたたみ込み積分演算器兼補間器を提供する。 【解決手段】 メモリデータ列を所定数m毎に順次読み
込みシフトして出力するバレルシフタと、2個の入力a
と入力bとを接続し、重みWと入力bとの積及び入力a
の和を出力する出力fと、入力bを出力とする出力gと
を有する積和計算部の複数個を縦に接続した積和計算部
列を所定数m列分だけ有し、メモリデータからの第1行
目の各積和計算部の入力bを、出力fから順次下の行の
積和計算部の入力aへ、出力gから左隣で下の行の積和
計算部の入力bへと順次出力し処理する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、情報処理関係で広く用
いられるとともにリサンプリング技術によるたたみ込み
積分(コンボリューション)を高速に行う演算方式とそ
の演算器に関するものである。
【0002】また、本発明は積和で用いる重みを適切に
用いることにより高速な補間方式又は補間器ともなる。
【0003】
【従来の技術】式(1)は二次元コンボリューションを
示す式である。
【0004】
【数1】
【0005】但し、Smnは位置(m,n)における計
算結果 Wlkはコンボリューション領域(l,k)における重
み Vcdはコンボリューション操作を受ける位置(c,
d)における入力データ aはコンボリューション領域の広さ、である。
【0006】式(1)を実現したものが、従来から用い
られている高速演算器である。従来の方法を図2により
説明する。図2は、二次元コンボリューション計算を高
速に行う従来の演算器である。図中、Vij(i=1,
2,3,4,5,j=1,2,3,4,5)はコンボリ
ューション演算を受けるデータ、Wij(i=−1,
0,1,j=−1,0,1)はコンボリューションの核
(カーネル)を示す重み係数である。また、図では3×
3コンボリューション領域を用いてV34を中心とする
コンボリューションの例を示している。図2において、
メモリ201を表わす枠内の最外周に“0”によって埋
められた領域は、コンボリューションにおいて端の処理
のためにデータ側に等価的に処理を行なわせるため持た
せたデータ“0”である。
【0007】メモリ201から行内のデータ(入力V
ij)が3個の1Dコンボルバー202、203、20
4に逐次読み込まれ、1次元コンボリューションが行な
われる。各1Dコンボルバー202には、データを入力
して1個ずつシフトする3個のシフター205、20
6、207、3個の重み係数部208、209、21
0、3個の乗算器211、212、213と、2個の加
算器214、215とを備え、1Dコンボルバー20
2、203の出力を加算する加算器216と、さらに加
算器216の出力と1Dコンボルバー204の出力を加
算する加算器217で構成される。各1Dコンボルバー
202、203、204内の乗算、加算の処理はパイプ
ライン的に行なわれる。3個の1Dコンボルバー20
2、203、204の計算結果を加算して、2Dコンボ
ルバーを構成している。
【0008】
【発明が解決しようとする課題】図2の例で説明した従
来法によると、コンボルバーの構成で必要となる乗算器
と、コンボリューション領域との関係は表1となる。
【0009】
【表1】
【0010】表1に示すように、従来法ではコンボリュ
ーション領域をaとしたとき、2Dコンボルバーではa
、3Dコンボルバーでa個必要となる。加算器につ
いても同程度の大きさで必要となる。このことから、コ
ンボリューション領域又はコンボリューション次元の増
加に伴い乗算器の数が急激に増加して、実際上、広領域
のコンボルバーの構成が困難あるいは高価であった。
【0011】本発明は、従来法が必要とする乗算器及び
加算器を、応用上充分な計算式の簡略化により削減し、
高速なコンボルバーを構成することを目的とする。
【0012】また、このとき、容易にパイプラインを実
行する処理機構の追加により処理速度を向上させること
ができる構成、計算機構を変更することなく処理性能
を、処理機構が追加されただけ向上するすなわちスケー
ラビリティを保つ機構、を持つことも目的とする。
【0013】さらに、演算器の構成を変えることなく、
重み係数の変更のみにより、高速補間器としての機能も
兼ね備える演算器の構成を目的とした。
【0014】
【課題を解決するための手段】
【0015】上記課題を解決するため本発明に係る高速
たたみ込み方式および演算器を以下のように構成した。
【0016】2個の入力aと入力bとを接続し、重みW
と前記入力bとの積及び前記入力aの和を出力する出力
fと、前記入力bを出力とする出力gとを有する積和計
算部とを備える。
【0017】このとき、2個の入力aと入力bとを接続
し、重みWと前記入力bとの積及び前記入力aの和を出
力する出力fと、前記入力bを出力とする出力gとを有
する積和計算部の複数個を縦に接続し、第1行目の積和
計算部の入力aに0、入力bにメモリデータを接続し、
第2行目以降の積和計算部の各入力aに前行の積和計算
部の出力fを接続し、各入力bに前行の積和計算部の出
力gを接続する。
【0018】そして、メモリデータ列を所定数m毎に順
次読み込みシフトして出力するバレルシフタと、2個の
入力aと入力bとを接続し、重みWと前記入力bとの積
及び前記入力aの和を出力する出力fと、前記入力bを
出力とする出力gとを有する積和計算部の複数個を縦に
接続した積和計算部列を前記所定数m列分だけ有し、前
記各積和計算部列の第1行目の積和計算部の各入力aに
0、入力bに前記バレルシフタの各出力を接続し、前記
各積和計算部列の第2行目以降の積和計算部の各入力a
に各列の前行の積和計算部の出力fを接続し、第m列目
の入力bに前行目であって第1列目の出力gを接続する
とともに第1列目から第(m−1)列目の各入力bに前
行であって次列の積和計算部の出力gを接続したものと
する。
【0019】さらに、メモリデータ列を所定数m毎に順
次読み込みシフトして出力するバレルシフタと、2個の
入力aと入力bとを接続し、重みWと前記入力bとの積
及び前記入力aの和を出力する出力fと、前記入力bを
出力とする出力gとを有する積和計算部の複数個を縦に
接続した積和計算部列を前記所定数m列分だけ有し、前
記各積和計算部列の第2行目以降の積和計算部の各入力
aに各列の前行の積和計算部の出力fを接続し、第m列
目の入力bに前行目であって第1列目の出力gを接続す
るとともに第1列目から第(m−1)列目の各入力bに
前行であって次列の積和計算部の出力gを接続した積和
計算群を複数備え、第1番目の積和計算群の前記各積和
計算部列の第1行目の積和計算部の各入力aに0、入力
bに前記バレルシフタの各出力を接続し、第2番目以降
の積和計算群の前記各積和計算部列の第1行目の積和計
算部の各入力aに0、入力bに前番目の積和計算群の最
終行の積和計算部の出力fを接続したものとしてもよ
い。
【0020】上記構成において、積和計算部列又は積和
計算群の積和計算部に与える重みを書き込み可能なメモ
リに格納して高速補間方式および高速補間器を構成する
ことができる。
【0021】そして、上記積和計算部の重みを、たたみ
込み積分を受ける位置と所定範囲の距離との関数により
計算し、書き込み可能なメモリに格納した構成にするこ
とができる。
【0022】従来の技術の説明における上記式(1)
は、二次元のコンボリューション計算を示すものである
が、多くの実用上の諸利用では、Wijは任意性(独立
性)を持つ必要がない。実用上(あるいは応用上)有用
なカーネルの重みWijは、W ij=W・Wと分離
可能である。
【0023】例えば、二次コンボリューションの主要応
用である空間フィルタで用いられる二次元SINC関数
はこの例である。次にその例を示す。
【0024】
【数2】
【0025】Wijが分離可能であるカーネルの類(あ
るいはクラス)に応用を限定すれば(応用上のほとんど
はこの類)式(1)は
【0026】
【数3】
【0027】となる。
【0028】式(1)の計算と式(2)による計算で必
要とされる計算量を比較すれば、式(1)では、コンボ
リューション領域をaとすれば、aの積・和計算が必
要である。一方、式(2)では2aの積和・計算で実現
が可能である。
【0029】次ぎに三次元コンボルバーに関して同様の
説明を行なう。三次元コンボリューション計算は次の式
(3)に示される。
【0030】
【数4】
【0031】Wlkp=Wと分離可能な応用
上有用なカーネルを対象とすれば式(3)は計算式
(4)となる。
【0032】
【数5】
【0033】前と同様に、通常の場合の式(3)のコン
ボリューションは領域を一辺aとすれば、a個の積和
計算が必要である。一方、式(4)の計算は、3aの積
和計算で処理が可能である。aが大きくなるに従い、こ
の差は顕著になる。
【0034】たたみ込み積分は、注目するサンプル点の
位置のたたみ込み値を求めるのに、注目点の周辺の既知
の値を用いて計算する。従って、通常この用途は、原信
号の空間周波数を低下させること(フィルタリング)に
用いられる。
【0035】これと対極にあるのが、補間である。これ
は、サンプル点の位置を周辺の既値信号を用いて空間周
波数は適切として推測するものである。即ち、サンプル
位置での推定が、ナイキスト周波数による影響を受けな
い。
【0036】補間法には、各種あるが、サンプル点と既
値信号点位置が、一致するとき、既値を出力する「ラグ
ランジェ」補間が広く用いられている。
【0037】本発明は、補間の次数を拡大可能かつ高速
な「ラグランジェ補間」を行なう演算器として用いるこ
とが可能である。通常の方法では、パイプライン間での
情報授受のため、パイプライン化による高速補間器の構
成は困難であった。
【0038】次数aのラグランジェ補間式は式(5)で
ある。
【0039】
【数6】
【0040】ここにxはサンプル位置、xは値を持つ
格子点位置、f(x)はxでの信号値とする。次数
aを固定しても一般性を失わないので、aを3、即ち、
次数3のラグランジェ補間に関して説明する。
【0041】式(5)は、a=3とすれば式(6)とな
る。
【0042】
【数7】
【0043】このとき、格子点位置(信号を持つ位置)
に次の関係式(7)があるとすれば、計算分離可能であ
る。
【0044】
【数8】
【0045】式(8)に分離した計算式を示す。
【0046】
【数9】
【0047】即ち、重みWが距離(x−x)の関数
として表わされる。このことが、パイプライン化した補
間器を構成する上でよい性質を持つ。即ち、W[x−
]f(x)とW[x−x]f(x)が分離
されているので、他の演算と独立に並列処理可能とな
る。
【0048】ラグランジェ補間式(8)を、X方向及び
Y方向に適用すれば、2次元3次のラグランジェ補間と
なる。また、X,Y,Z方向に適用すれば、3次元3次
のラグランジェ補間となる。
【0049】図3にx(あるいはi)、y(あるいは
j)方向へ、独立に式(8)のラグランジェ補間を適用
する模式図を示す。図3において、×はデータを持つ格
子点位置、・はリサンプリングにより、データを推定す
る位置、Vijは格子点ij(上の×印で示した位置)
におけるボクセル値(Voxel)であり、式(8)中のf
(x),f(x),f(x)に相当する。diは
リサンプリングを行なう位置と格子点位置(データを持
つ)間の距離であり、式(8)中にある[x−x
[x−x][x−x]に相当する。図3は、リサン
プリングにより位置p(図3で・で表わされる。)のデ
ータを推定する場合を示していて、円で囲まれた格子の
交点(×)の位置は、式(8)においてx,x,x
,y,y ,y,z,z,zで表わされ
る。また、xi(x,x,x,y ,y
,z,z,z)を用いて位置p(x)の位置
のデータを推定するための重みWを、[x−x]の関
数としてルックアップテーブルより求める。
【0050】
【実施例】以下本発明の一実施例について図により説明
する。図4は、この演算器に用いられる基本要素である
積和計算部Mを示す。この積和計算部Mは、2個の入力
aと入力bとを接続し、重みWと前記入力bとの積及び
前記入力aの和を出力する出力fと、前記入力bを出力
とする出力gとを有する。入力aと入力bのそれぞれに
入力されると、出力fにf=a+bWが、また、出力g
にg=bがそれぞれ出力される。
【0051】図1は本発明に係る高速たたみ込み演算器
の一実施例である。実施例として、並列度4、コンボリ
ューション領域3×3の二次元コンボルバーの構成例を
示した。図1において、101はメモリ部、102はバ
レルシフタ、103aは積和計算部Mijを縦に3個、
横に4個備えた第1の積和計算群、103bは同様の第
2の積和計算群である。各積和計算群103a,bは積
和計算部Mとラッチ(レジスタ)Lと遅延器Dとセレク
ターSとを備え、縦方向に3個接続した積和計算列を、
横方向に4個配列した積和計算部Mij(i=1,2,
3,j=1,2,3,4)を配置する。第1群の積和計
算群103aにおいて、第1行目の積和計算部M1j
入力aに0、入力bにメモリデータを接続する。第2行
目以降の積和計算部Mij(i=2,3,j=1,2,
3,4)の各入力aに遅延器Dを介して前行の積和計算
部M(i−1)j(i=2,3,j=1,2,3,4)
の出力fを接続する。最終行を除く行即ち第1行目から
第2行目までであって第1列目の積和計算部Mi1(i
=1,2,)の出力gを直接あるいはラッチLのいずれ
かを選択するセレクターSを介して第2行目以降であり
最終列即ち第4列目の積和計算部Mi4(i=2,3)
の各入力bに接続する。第1行目から第2行目までであ
って第2列目から最終列即ち第4列の積和計算部Mij
(i=1,2,j=2,3,4)の出力gを遅延器Dを
介して次行であって前列の積和計算部M
(i+1)(j−1)(i=1,2,j=2,3,4)
の入力bに接続する。
【0052】第2の積和計算群103bは、第1行目の
積和計算部M1jの入力bに前群である第1の積和計算
群103aの最終行(第4行)の積和計算部M3jの出
力fを接続し、第2行目以降の積和計算部Mij(i=
2,3,j=1,2,3,4)の各入力aに遅延器D
(を介して前行の積和計算部M(i−1)j(i=2,
3,j=1,2,3,4)の出力fを接続する。そのほ
かは、第1の積和計算群103aの構成と同様である。
【0053】ラッチL及びセレクターSは、第1列の積
和計算部Mi1(i=1,2)の出力gのデータが最終
列の積和計算部Mi4(i=2,3)の入力bへ、必要
な時刻に入力可能となるように合わせるためのデータ保
持及び選択に用いられる。
【0054】また、遅延器Dは積和計算部Mij(i=
1,2,j=2,3,4)のデータが1つ下行で左側の
積和計算部Mij(i=2,3,j=1,2,3)に伝
播するデータとのタイミングを合わせるためのものであ
る。また、(n/Np)で表わされる遅延器のnはボリ
ューム(コンボリューション領域)の一辺を規定するデ
ータ数、Npは並列処理するパイプライン(積和計算部
Mの列)数を示す。
【0055】並列度の向上は列(パイプライン)を横に
追加することにより実施できる。又、コンボリューショ
ン領域の拡大は、パイプラインの縦方向の重みWを下方
向に追加することにより、容易に実施できる。図5に第
2の積和計算群103bの下に第3の積和計算群103
cを第2の積和計算群103bと同様に接続した例を示
す。但し、メモリ部101及びバレル・シフター102
は図示していない。第3の積和計算群103cでは、各
列の各積和計算部Mの出力fと入力aとの間に(n
Np)の遅延器が接続される。これにより、コンボリュ
ーション領域の拡大を図っている。
【0056】実施例の高速補間器への適用は、図1及び
図5の構成はそのままにして、重みの変更により実現す
る。重みは以下の式(9)のように距離の関数として表
わされる。このとき、各格子点(図3参照)における重
みは、予めルック・アップ・テーブルに書き込んでおく
ことにより実現する。各格子点の位置をアドレスとして
前記ルック・アップ・テーブルよりその点の重みを読み
出す。このテーブルを書き換えることにより、積和計算
部が例えばラグランジェ補間器になったり、通常のたた
み込み演算器になる。
【0057】
【数10】
【0058】図1をもとに動作を説明する。処理は行単
位に行なわれる。また、メモリ部101のデータの列数
が並列処理数(パイプライン数)より多い場合は、並列
処理数単位に入力データをずらして読み出し右端まで読
み出したならば折り返して左端から読み出し処理する。
以下の説明では、入力データ数と並列度が等しいとして
説明する。
【0059】(1)シフト 第1行のデータV11,V12,V13,V14が入力
される。次の時刻では、V21,V22,V23,V
24と入力される。このとき、バレルシフタ102の出
力は、第1行のデータに対しては、そのまま、第2行の
データに対しては、右に1個シフトされて出力される。
表2入出力の関係を示す。
【0060】
【表2】
【0061】(2)コンボリューション シフトされたデータが逐次コンボルバーへの入力とな
る。今、1番目の1Dコンボルバー(図1の第1の積和
計算群103b)の出力を考える。結果が出るのは3番
目のパイプライン(積和計算部M13,M23,M33
からなる)の積和計算部M13へ入力したデータが1番
目のパイプラインの積和計算部M31に到達した時刻の
後である。このとき、出力として積和計算部M31から
11+W12+W13が出力される。こ
の出力は、次のように得られる。V 11を入力した積和
計算部M11の出力f=W11と、V12を入力し
た積和計算部M12の出力g=V12とを積和計算部M
21に入力する。この積和計算部M21の出力f=W
11+W12は、積和計算部M31のa入力とな
る。一方、積和計算部M31のb入力には、メモリ部1
01からデータV13がバレル・シフタ102、積和計
算部M13の出力g及び積和計算部M22の入力bから
その出力g=V13を経て入力され、その結果、積和計
算部M31の出力f=W11+W12+W
13を得る。この様子及び他の積和計算部Mijの入出
力の経過を表3に示す。表中矩形はデータを、矢印はデ
ータの接続経路を示す。
【0062】
【表3】
【0063】このデータを次のコンボルバーへの入力と
して、同様の処理により、二次元コンボルバーの出力が
得られる。表4、表5に第2の積和計算群103bにお
ける積和計算部Mijの入出力の経過を示す。表中矩形
はデータを、矢印はデータの接続経路を示す。
【0064】
【表4】
【0065】
【発明の効果】以上のように本発明によれば、広く情報
処理で用いられるたたみ込み積分が高速、小型および安
価に構成可能である。また、1次元、2次元、3次元と
コンボリューションの構成が、1次元コンボルバー(積
和計算群)を直列に追加することにより、構成を変更す
ることなく作ることが可能であり、VLSI化に適して
いる。また、積和計算部の列を横に追加することによ
り、並列度を向上することができ、スケーラビリティを
保つことができる。
【0066】さらに、補間器として用いる場合は補間の
次数を容易に広げることが可能となり、精度の高い補間
計算を高速に行なえる。
【図面の簡単な説明】
【図1】本発明の一実施例のブロック図であり、二次元
コンボルバーへの適用例を示す。
【図2】二次元(2D)コンボリューション計算を行う
従来の演算器のブロック図である。
【図3】ラグランジェ補間を適用する模式図である。
【図4】本発明の演算器の基本要素である積和計算部で
ある。
【図5】本発明の他の実施例のブロック図であり、三次
元コンボルバーへの適用例を示す。
【符号の説明】
ij…積和計算部、L…ラッチ、D…遅延器、S…セ
レクタ、101…メモリ部、102…バレルシフタ、1
03a…第1の積和計算群、103b…第2の積和計算
群。

Claims (14)

    【特許請求の範囲】
  1. 【請求項1】 2個の入力aと入力bとを接続し、重み
    Wと前記入力bとの積及び前記入力aの和を出力する出
    力fと、前記入力bを出力とする出力gとを有する積和
    計算部とを備えることを特徴とする高速たたみ込み演算
    方式。
  2. 【請求項2】 2個の入力aと入力bとを接続し、重み
    Wと前記入力bとの積及び前記入力aの和を出力する出
    力fと、前記入力bを出力とする出力gとを有する積和
    計算部とを備えることを特徴とする高速たたみ込み演算
    器。
  3. 【請求項3】 2個の入力aと入力bとを接続し、重み
    Wと前記入力bとの積及び前記入力aの和を出力する出
    力fと、前記入力bを出力とする出力gとを有する積和
    計算部の複数個を縦に接続し、第1行目の積和計算部の
    入力aに0、入力bにメモリデータを接続し、第2行目
    以降の積和計算部の各入力aに前行の積和計算部の出力
    fを接続し、各入力bに前行の積和計算部の出力gを接
    続したことを特徴とする高速たたみ込み演算方式。
  4. 【請求項4】 2個の入力aと入力bとを接続し、重み
    Wと前記入力bとの積及び前記入力aの和を出力する出
    力fと、前記入力bを出力とする出力gとを有する積和
    計算部の複数個を縦に接続し、第1行目の積和計算部の
    入力aに0、入力bにメモリデータを接続し、第2行目
    以降の積和計算部の各入力aに前行の積和計算部の出力
    fを接続し、各入力bに前行の積和計算部の出力gを接
    続したことを特徴とする高速たたみ込み演算器。
  5. 【請求項5】 メモリデータ列を所定数m毎に順次読み
    込みシフトして出力するバレルシフタと、2個の入力a
    と入力bとを接続し、重みWと前記入力bとの積及び前
    記入力aの和を出力する出力fと、前記入力bを出力と
    する出力gとを有する積和計算部の複数個を縦に接続し
    た積和計算部列を前記所定数m列分だけ有し、前記各積
    和計算部列の第1行目の積和計算部の各入力aに0、入
    力bに前記バレルシフタの各出力を接続し、前記各積和
    計算部列の第2行目以降の積和計算部の各入力aに各列
    の前行の積和計算部の出力fを接続し、第m列目の入力
    bに前行目であって第1列目の出力gを接続するととも
    に第1列目から第(m−1)列目の各入力bに前行であ
    って次列の積和計算部の出力gを接続したことを特徴と
    する高速たたみ込み演算方式。
  6. 【請求項6】 メモリデータ列を所定数m毎に順次読み
    込みシフトして出力するバレルシフタと、2個の入力a
    と入力bとを接続し、重みWと前記入力bとの積及び前
    記入力aの和を出力する出力fと、前記入力bを出力と
    する出力gとを有する積和計算部の複数個を縦に接続し
    た積和計算部列を前記所定数m列分だけ有し、前記各積
    和計算部列の第1行目の積和計算部の各入力aに0、入
    力bに前記バレルシフタの各出力を接続し、前記各積和
    計算部列の第2行目以降の積和計算部の各入力aに各列
    の前行の積和計算部の出力fを接続し、第m列目の入力
    bに前行目であって第1列目の出力gを接続するととも
    に第1列目から第(m−1)列目の各入力bに前行であ
    って次列の積和計算部の出力gを接続したことを特徴と
    する高速たたみ込み演算器。
  7. 【請求項7】 メモリデータ列を所定数m毎に順次読み
    込みシフトして出力するバレルシフタと、2個の入力a
    と入力bとを接続し、重みWと前記入力bとの積及び前
    記入力aの和を出力する出力fと、前記入力bを出力と
    する出力gとを有する積和計算部の複数個を縦に接続し
    た積和計算部列を前記所定数m列分だけ有し、前記各積
    和計算部列の第2行目以降の積和計算部の各入力aに各
    列の前行の積和計算部の出力fを接続し、第m列目の入
    力bに前行目であって第1列目の出力gを接続するとと
    もに第1列目から第(m−1)列目の各入力bに前行で
    あって次列の積和計算部の出力gを接続した積和計算群
    を複数備え、第1番目の積和計算群の前記各積和計算部
    列の第1行目の積和計算部の各入力aに0、入力bに前
    記バレルシフタの各出力を接続し、第2番目以降の積和
    計算群の前記各積和計算部列の第1行目の積和計算部の
    各入力aに0、入力bに前番目の積和計算群の最終行の
    積和計算部の出力fを接続したことを特徴とする高速た
    たみ込み演算方式。
  8. 【請求項8】 メモリデータ列を所定数m毎に順次読み
    込みシフトして出力するバレルシフタと、2個の入力a
    と入力bとを接続し、重みWと前記入力bとの積及び前
    記入力aの和を出力する出力fと、前記入力bを出力と
    する出力gとを有する積和計算部の複数個を縦に接続し
    た積和計算部列を前記所定数m列分だけ有し、前記各積
    和計算部列の第2行目以降の積和計算部の各入力aに各
    列の前行の積和計算部の出力fを接続し、第m列目の入
    力bに前行目であって第1列目の出力gを接続するとと
    もに第1列目から第(m−1)列目の各入力bに前行で
    あって次列の積和計算部の出力gを接続した積和計算群
    を複数備え、第1番目の積和計算群の前記各積和計算部
    列の第1行目の積和計算部の各入力aに0、入力bに前
    記バレルシフタの各出力を接続し、第2番目以降の積和
    計算群の前記各積和計算部列の第1行目の積和計算部の
    各入力aに0、入力bに前番目の積和計算群の最終行の
    積和計算部の出力fを接続したことを特徴とする高速た
    たみ込み演算器。
  9. 【請求項9】 メモリデータ列を所定数m毎に順次読み
    込みシフトして出力するバレルシフタと、2個の入力a
    と入力bとを接続し、重みWと前記入力bとの積及び前
    記入力aの和を出力する出力fと、前記入力bを出力と
    する出力gとを有する積和計算部の複数個を縦に接続し
    た積和計算部列を前記所定数m列分だけ有し、前記各積
    和計算部列の第1行目の積和計算部の各入力aに0、入
    力bに前記バレルシフタの各出力を接続し、前記各積和
    計算部列の第2行目以降の積和計算部の各入力aに各列
    の前行の積和計算部の出力fを接続し、第m列目の入力
    bに前行目であって第1列目の出力gを接続するととも
    に第1列目から第(m−1)列目の各入力bに前行であ
    って次列の積和計算部の出力gを接続した構成におい
    て、前記積和計算部に与える重みを書き込み可能なメモ
    リに格納したことを特徴とする高速補間方式。
  10. 【請求項10】 メモリデータ列を所定数m毎に順次読
    み込みシフトして出力するバレルシフタと、2個の入力
    aと入力bとを接続し、重みWと前記入力bとの積及び
    前記入力aの和を出力する出力fと、前記入力bを出力
    とする出力gとを有する積和計算部の複数個を縦に接続
    した積和計算部列を前記所定数m列分だけ有し、前記各
    積和計算部列の第1行目の積和計算部の各入力aに0、
    入力bに前記バレルシフタの各出力を接続し、前記各積
    和計算部列の第2行目以降の積和計算部の各入力aに各
    列の前行の積和計算部の出力fを接続し、第m列目の入
    力bに前行目であって第1列目の出力gを接続するとと
    もに第1列目から第(m−1)列目の各入力bに前行で
    あって次列の積和計算部の出力gを接続した構成におい
    て、前記積和計算部に与える重みを書き込み可能なメモ
    リに格納したことを特徴とする高速補間器。
  11. 【請求項11】 メモリデータ列を所定数m毎に順次読
    み込みシフトして出力するバレルシフタと、2個の入力
    aと入力bとを接続し、重みWと前記入力bとの積及び
    前記入力aの和を出力する出力fと、前記入力bを出力
    とする出力gとを有する積和計算部の複数個を縦に接続
    した積和計算部列を前記所定数m列分だけ有し、前記各
    積和計算部列の第2行目以降の積和計算部の各入力aに
    各列の前行の積和計算部の出力fを接続し、第m列目の
    入力bに前行目であって第1列目の出力gを接続すると
    ともに第1列目から第(m−1)列目の各入力bに前行
    であって次列の積和計算部の出力gを接続した積和計算
    群を複数備え、第1番目の積和計算群の前記各積和計算
    部列の第1行目の積和計算部の各入力aに0、入力bに
    前記バレルシフタの各出力を接続し、第2番目以降の積
    和計算群の前記各積和計算部列の第1行目の積和計算部
    の各入力aに0、入力bに前番目の積和計算群の最終行
    の積和計算部の出力fを接続した構成において、前記積
    和計算部に与える重みを書き込み可能なメモリに格納し
    たことを特徴とする高速補間方式。
  12. 【請求項12】 メモリデータ列を所定数m毎に順次読
    み込みシフトして出力するバレルシフタと、2個の入力
    aと入力bとを接続し、重みWと前記入力bとの積及び
    前記入力aの和を出力する出力fと、前記入力bを出力
    とする出力gとを有する積和計算部の複数個を縦に接続
    した積和計算部列を前記所定数m列分だけ有し、前記各
    積和計算部列の第2行目以降の積和計算部の各入力aに
    各列の前行の積和計算部の出力fを接続し、第m列目の
    入力bに前行目であって第1列目の出力gを接続すると
    ともに第1列目から第(m−1)列目の各入力bに前行
    であって次列の積和計算部の出力gを接続した積和計算
    群を複数備え、第1番目の積和計算群の前記各積和計算
    部列の第1行目の積和計算部の各入力aに0、入力bに
    前記バレルシフタの各出力を接続し、第2番目以降の積
    和計算群の前記各積和計算部列の第1行目の積和計算部
    の各入力aに0、入力bに前番目の積和計算群の最終行
    の積和計算部の出力fを接続した構成において、前記積
    和計算部に与える重みを書き込み可能なメモリに格納し
    たことを特徴とする高速補間器。
  13. 【請求項13】 積和計算部の重みを、所定位置と所定
    範囲の距離との関数により計算し、書き込み可能なメモ
    リに格納したことを特徴とする請求項9又は請求項11
    のいずれかに記載の高速補間方式。
  14. 【請求項14】 積和計算部の重みを、所定位置と所定
    範囲の距離との関数により計算し、書き込み可能なメモ
    リに格納したことを特徴とする請求項10又は請求項1
    2のいずれかに記載の高速補間器。
JP24244199A 1999-08-30 1999-08-30 高速たたみ込み演算方式とその演算器および高速補間方式と高速補間器 Pending JP2001067338A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP24244199A JP2001067338A (ja) 1999-08-30 1999-08-30 高速たたみ込み演算方式とその演算器および高速補間方式と高速補間器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP24244199A JP2001067338A (ja) 1999-08-30 1999-08-30 高速たたみ込み演算方式とその演算器および高速補間方式と高速補間器

Publications (1)

Publication Number Publication Date
JP2001067338A true JP2001067338A (ja) 2001-03-16

Family

ID=17089145

Family Applications (1)

Application Number Title Priority Date Filing Date
JP24244199A Pending JP2001067338A (ja) 1999-08-30 1999-08-30 高速たたみ込み演算方式とその演算器および高速補間方式と高速補間器

Country Status (1)

Country Link
JP (1) JP2001067338A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018074012A1 (ja) * 2016-10-19 2018-04-26 ソニーセミコンダクタソリューションズ株式会社 演算処理回路および認識システム
US10642622B2 (en) 2016-12-27 2020-05-05 Fujitsu Limited Arithmetic processing device and control method of the arithmetic processing device
WO2020194594A1 (ja) * 2019-03-27 2020-10-01 Tdk株式会社 ニューラルネットワーク演算処理装置及びニューラルネットワーク演算処理方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018074012A1 (ja) * 2016-10-19 2018-04-26 ソニーセミコンダクタソリューションズ株式会社 演算処理回路および認識システム
CN109844738A (zh) * 2016-10-19 2019-06-04 索尼半导体解决方案公司 运算处理电路和识别系统
US11461684B2 (en) 2016-10-19 2022-10-04 Sony Semiconductor Solutions Corporation Operation processing circuit and recognition system
US10642622B2 (en) 2016-12-27 2020-05-05 Fujitsu Limited Arithmetic processing device and control method of the arithmetic processing device
WO2020194594A1 (ja) * 2019-03-27 2020-10-01 Tdk株式会社 ニューラルネットワーク演算処理装置及びニューラルネットワーク演算処理方法
US11681498B2 (en) 2019-03-27 2023-06-20 Tdk Corporation Neural network arithmetic processing device and neural network arithmetic processing method

Similar Documents

Publication Publication Date Title
EP2017743B1 (en) High speed and efficient matrix multiplication hardware module
Ebeling et al. Mapping applications to the RaPiD configurable architecture
US7337205B2 (en) Matrix multiplication in a vector processing system
US20040098440A1 (en) Multiplication of multi-precision numbers having a size of a power of two
EP3093757B1 (en) Multi-dimensional sliding window operation for a vector processor
Fan et al. Reconfigurable acceleration of 3D-CNNs for human action recognition with block floating-point representation
US11341400B1 (en) Systems and methods for high-throughput computations in a deep neural network
EP3841461B1 (en) Digital circuit with compressed carry
JPS63167967A (ja) ディジタル信号処理集積回路
US7653676B2 (en) Efficient mapping of FFT to a reconfigurable parallel and pipeline data flow machine
JP2024028901A (ja) ハードウェアにおけるスパース行列乗算
JP2001067338A (ja) 高速たたみ込み演算方式とその演算器および高速補間方式と高速補間器
JPH09212485A (ja) 2次元idct回路
CN113672612A (zh) 索引源数组中的元素
Liu et al. Hardware architectures for eigenvalue computation of real symmetric matrices
JP2957845B2 (ja) 高速フーリエ変換装置
JPH07200539A (ja) 二次元dct演算装置
JPH06223166A (ja) 画像処理用汎用プロセッサ
US6944640B2 (en) Progressive two-dimensional (2D) pyramid filter
JP2001084242A (ja) 可変演算プロセッサ
KR100189195B1 (ko) 단일화된 시스톨릭어레이 구조에 의한 2차원 dct/dst/dht의 수행장치
Brown et al. The design of a block‐regularized parameter estimator by algorithmic engineering
Hernandez et al. A combined VLSI architecture for nonlinear image processing filters
JP2953918B2 (ja) 演算装置
Massicotte A parallel VLSI architecture of Kalman-filter-based algorithms for signal reconstruction

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060727

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071204

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080131

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080722

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080918