JPH09293065A - Two-dimensional pe array device, associative memory, data transfer method and morphology arithmetic processing method - Google Patents

Two-dimensional pe array device, associative memory, data transfer method and morphology arithmetic processing method

Info

Publication number
JPH09293065A
JPH09293065A JP29914596A JP29914596A JPH09293065A JP H09293065 A JPH09293065 A JP H09293065A JP 29914596 A JP29914596 A JP 29914596A JP 29914596 A JP29914596 A JP 29914596A JP H09293065 A JPH09293065 A JP H09293065A
Authority
JP
Japan
Prior art keywords
word
associative memory
shift
data
hit flag
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP29914596A
Other languages
Japanese (ja)
Other versions
JP3726977B2 (en
Inventor
Takeshi Ikenaga
剛 池永
Takeshi Ogura
武 小倉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP29914596A priority Critical patent/JP3726977B2/en
Publication of JPH09293065A publication Critical patent/JPH09293065A/en
Application granted granted Critical
Publication of JP3726977B2 publication Critical patent/JP3726977B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Storing Facsimile Image Data (AREA)
  • Image Processing (AREA)

Abstract

PROBLEM TO BE SOLVED: To obtain a PE array device with high performance by suppressing a whole data transfer time and reducing hardware quantity. SOLUTION: In a two-dimensional PE array device PEA1, PE arrayed in X×Y is divided into the blocks of q-columns in a longitudinal direction and r-rows in a horizontal direction and one associative memory 11 is assigned to the respective divided blocks. X is the number of PEs in the longitudinal direction, Y is the number of PEs in the horizontal direction, X=Mq and Y=nr are more than two optional integers and (q) and (r) are more than two optional numbers. In the assigned respective associative memories 11(1 ,1) , w pieces of words 12 are divided by (X÷q), arrayed in a zigzag state to be (X÷q)×(Y÷r) and successively assigned to the blocks of PE. The high-order shift input/output of the one associative memory 11 is connected to the low-order shift input/output of another associative memory 11 being adjacent to the horizontal direction by an inter-associative memory hit flag shift line 16.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、画像処理、音響処
理、知識処理等に有効な2次元プロセッシングエレメン
ト(Processing Element:PE)ア
レイ装置および連想メモリ並びにデータ転送方法および
モルフォロジー(morphology)演算処理方法
に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a two-dimensional processing element (PE) array device, an associative memory, a data transfer method, and a morphology operation processing method which are effective for image processing, sound processing, knowledge processing and the like. Regarding

【0002】[0002]

【従来の技術】ネットワークサービスのビジュアル化、
高付加価値化によって、高度な画像処理、音響処理、知
識処理の必要性が高まっている。しかし、このような処
理は、一般に莫大な処理性能が要求されるので、ノイマ
ンアーキテクチャに基づいた既のマイクロプロセッサ、
信号処理プロセッサでは実行困難な場合が多い。
2. Description of the Related Art Visualization of network services,
The need for advanced image processing, sound processing, and knowledge processing is increasing due to higher added value. However, such processing generally requires enormous processing performance, so an existing microprocessor based on Neumann architecture,
It is often difficult to execute with a signal processor.

【0003】このような処理を有効に行う装置として、
2次元PEアレイ装置が知られている。この2次元PE
アレイ装置は、種々の論理、算術演算処理を行なう多数
のPEと、単一命令ストリーム・複数データストリーム
方式(SIMD)によって、各PEに対して単一の命令
列を与える1つの制御回路とを備える。この2次元PE
アレイ装置は、これらの回路と方式とによって各PEが
同時に上記演算処理を行なう機構と、2次元方向の隣接
PEへのデータ転送機構とを保持する装置である。
As a device for effectively performing such processing,
A two-dimensional PE array device is known. This two-dimensional PE
The array device includes a large number of PEs that perform various logic and arithmetic operation processes, and a single control circuit that gives a single instruction sequence to each PE by a single instruction stream / multiple data stream method (SIMD). Prepare This two-dimensional PE
The array device is a device that holds a mechanism in which each PE simultaneously performs the above-mentioned arithmetic processing by these circuits and methods and a data transfer mechanism to a neighboring PE in the two-dimensional direction.

【0004】また、2次元PEアレイ装置について、種
々の処理を効率良く割り付けるセルラーオートマトン、
セルラーニューラルネット等の計算理論が知られてい
る。上記セルラーオートマトン、セルラーニューラルネ
ットについては、「Chua,L.O.etal,“C
ellular Neural Networks:T
heory”,IEEE Trans.on Circ
uits and Systems,Vol.35,
No.10 Oct.1988」に開示されている。
A cellular automaton for efficiently allocating various processes in a two-dimensional PE array device,
A calculation theory such as a cellular neural network is known. Regarding the above-mentioned cellular automata and cellular neural net, "Chua, LO et al," C
ellular Neural Networks: T
"", IEEE Trans. on Circ
uits and Systems, Vol. 35,
No. 10 Oct. 1988 ”.

【0005】図28は、従来の2次元PEアレイ装置P
EA11を示す図である。
FIG. 28 shows a conventional two-dimensional PE array device P.
It is a figure which shows EA11.

【0006】従来の2次元PEアレイ装置として知られ
ている装置は、マイクロプロセッサか論理、算術演算回
路を備えた集積回路で構成されているPE202を、図
28に示すように、2次元状にX×Y個(Xは縦方向、
Yは横方向のPEの数。X,Yは2以上の整数)配置
し、それぞれを縦横2次元方向のデータ転送パス203
で結合した装置である。
In a device known as a conventional two-dimensional PE array device, a PE 202, which is composed of a microprocessor or an integrated circuit having a logic and arithmetic operation circuit, is formed into a two-dimensional form as shown in FIG. X × Y (X is the vertical direction,
Y is the number of PEs in the horizontal direction. X and Y are integers of 2 or more), and each of them is arranged in a data transfer path 203 in the two-dimensional vertical and horizontal directions.
It is a device combined with.

【0007】しかし、この従来例においては、PE数が
多いと、データ転送パス203が多数必要になり、2次
元PEアレイ装置全体のハードウェア量が多くなるとい
う問題がある。
However, in this conventional example, when the number of PEs is large, a large number of data transfer paths 203 are required, and the hardware amount of the entire two-dimensional PE array device is large.

【0008】また、PE202を2次元に配置した場
合、PEの集積度を上げることが一般に困難であり、こ
の点からも、ハードウェア量が多くなるという問題があ
る。また、PE202の数が多くなるにつれて、データ
入出力201におけるデータ幅が大きくなり、外部との
データのやりとりが困難であるという問題がある。
Further, when the PEs 202 are arranged two-dimensionally, it is generally difficult to increase the degree of integration of the PEs, and from this point also there is a problem that the amount of hardware increases. Further, as the number of PEs 202 increases, the data width in the data input / output 201 increases, which makes it difficult to exchange data with the outside.

【0009】この場合、データ入出力201におけるデ
ータ幅を圧縮する機構を追加すれば、外部とのデータの
やりとりが容易になる。しかし、上記データ幅圧縮機構
を追加すると、PE202の数を変更できるというよう
な拡張性を持たせることが困難であるという問題があ
る。
In this case, if a mechanism for compressing the data width in the data input / output 201 is added, it becomes easy to exchange data with the outside. However, when the data width compression mechanism is added, it is difficult to provide expandability such that the number of PEs 202 can be changed.

【0010】図29は、従来の2次元PEアレイ装置P
EA12を示す図である。
FIG. 29 shows a conventional two-dimensional PE array device P.
It is a figure which shows EA12.

【0011】従来の2次元PEアレイ装置の別の例とし
て知られている装置は、マイクロプロセッサか論理、算
術演算回路を備えた集積回路で構成されているPE21
2を、図29に示すように、X×Y個、1次元方向のみ
に、データ転送パス213で接続し、これらPE212
をX個ずつジグザグ状に割り付け、疑似的にX×Yの2
次元PEアレイ装置を実現する装置である。
A device known as another example of the conventional two-dimensional PE array device is a PE 21 which is composed of a microprocessor or an integrated circuit having a logic and arithmetic operation circuit.
29, as shown in FIG. 29, X × Y pieces are connected by a data transfer path 213 only in one-dimensional direction.
Z is laid out in a zigzag pattern, and a pseudo X × Y 2
This is a device for realizing a three-dimensional PE array device.

【0012】この装置の場合、2次元方向に隣接するP
E212へのデータ転送方法として、1次元のデータ転
送パス213を用い、PE212を橋渡しとして用いな
がら転送する方法が考えられる。
In the case of this device, the P adjacent to each other in the two-dimensional direction
As a data transfer method to the E212, a method of using the one-dimensional data transfer path 213 and using the PE 212 as a bridge can be considered.

【0013】しかし、この方法においては、図29にお
ける横方向のPE間のデータ転送は、X個のPEを介し
て行なう必要があるため転送時間が長くなり、その結
果、全体の転送時間が莫大になるという問題が生じる。
However, in this method, the data transfer between the PEs in the horizontal direction in FIG. 29 needs to be performed through X PEs, resulting in a long transfer time, resulting in a huge transfer time. The problem arises that

【0014】なお、上記横方向のPE間の転送時間を短
くするために、専用のパスを設ける方法が考えられる
が、この方法の場合、縦横2次元方向のデータ転送パス
203を用いた方法と同様に、データ転送パスの本数が
増えるので、ハードウェア量が多くなという問題があ
る。
Although a method of providing a dedicated path can be considered in order to shorten the transfer time between the PEs in the horizontal direction, this method is different from the method using the data transfer path 203 in the vertical and horizontal two-dimensional directions. Similarly, since the number of data transfer paths increases, there is a problem that the amount of hardware is large.

【0015】図30は、従来の連想メモリM11を示す
図である。
FIG. 30 is a diagram showing a conventional associative memory M11.

【0016】図30において、従来の連想メモリM11
は、ワード224(1) 〜ワード224(w) と、マスクレ
ジスタ222と、アドレスデコーダ225と、ワード2
24(1) 〜ワード224(w) 間の1次元方向のデータ転
送路として利用できるヒットフラグレジスタ227とで
構成されている。この連想メモリM11は、「Ogur
a,T.et al.“A 20−kbit Asso
ciative Memory LSI for Ar
tificial IntelligenceMach
ines”,IEEE J.Solid−State
Circuits Vol.24,No.4,pp.1
014−1020 Aug.1989」に開示されてい
る。
In FIG. 30, the conventional associative memory M11 is used.
Is a word 224 (1) to a word 224 (w) , a mask register 222, an address decoder 225, and a word 2
24 (1) to word 224 (w) and a hit flag register 227 that can be used as a one-dimensional data transfer path. This associative memory M11 is called "Ogur
a, T .; et al. "A 20-kbit Asso
passive Memory LSI for Ar
tactical IntelligenceMach
ines ”, IEEE J. Solid-State
Circuits Vol. 24, No. 4, pp. 1
014-1020 Aug. 1989 ".

【0017】この連想メモリM11は、通常のメモリの
ように、アドレス入力223にアドレス値を与えること
によって、任意のワード224(1) 〜ワード224(w)
に対してデータを読み書きできる機能を有し、また、マ
スク検索機能、並列部分書き込み機能をも有し、これら
の機能を用いることによって、全ワードに対して、種々
の論理、算術演算を同時に実行できる。したがって、こ
の連想メモリを、2次元PEアレイ装置に使用すること
によって、極めて多数のPEを持つ超並列型計算装置と
して利用できる。
The associative memory M11, like an ordinary memory, gives an address value to the address input 223, so that an arbitrary word 224 (1) to word 224 (w) can be obtained.
It also has a function to read and write data to, and also has a mask search function and a parallel partial write function. By using these functions, various logic and arithmetic operations can be executed simultaneously on all words. it can. Therefore, by using this associative memory in a two-dimensional PE array device, it can be used as a massively parallel computing device having an extremely large number of PEs.

【0018】しかし、ワード224(1) 〜ワード224
(w) 間の1次元方向のデータ転送路として利用できるヒ
ットフラグレジスタ227は、シフトアップまたはシフ
トダウンの単一方向のシフトモードしか有さないので、
上記従来例において、ワード224(1) 〜ワード224
(w) 間のデータ転送を効率的に行う方向は、特定方向に
限定されるという問題がある。また、データの読み書き
とシフトとを同時に行なうモードを備えていないので、
上記従来例では、データ転送処理等を効率的に行うこと
ができないという問題がある。
However, word 224 (1) to word 224
Since the hit flag register 227 that can be used as a one-dimensional data transfer path between (w) has only a unidirectional shift mode of shift up or shift down,
In the above conventional example, word 224 (1) to word 224
There is a problem that the direction of efficiently performing data transfer between (w) is limited to a specific direction. Also, because it does not have a mode to read and write data and shift simultaneously,
In the above-mentioned conventional example, there is a problem that the data transfer processing and the like cannot be efficiently performed.

【0019】したがって、上記連想メモリを用いて2次
元PEアレイ装置を構成した場合、データ転送時間が長
くなるという問題がある。
Therefore, when a two-dimensional PE array device is constructed using the associative memory, there is a problem that the data transfer time becomes long.

【0020】[0020]

【発明が解決しようとする課題】画像処理アルゴリズム
においては、画像中の画素をそのまま2次元PEに割り
付けて処理を行なうと有効である場合が多い。たとえば
256画素×256画素=65.536という場合は、
多数のPEが必要になるので、多くのPEを搭載可能な
2次元PEアレイ装置が必要になる。この場合、その2
次元PEアレイ装置を多数のボードで構成すると、それ
らの装置コストが莫大になるので、これを避けるため
に、上記多数のPEを持つ2次元PEアレイ装置を、1
ボード程度のハードウェア量で実現できることが望まれ
ている。
In many image processing algorithms, it is often effective to directly allocate pixels in an image to a two-dimensional PE for processing. For example, if 256 pixels × 256 pixels = 65.536,
Since many PEs are required, a two-dimensional PE array device capable of mounting many PEs is required. In this case, part 2
If a two-dimensional PE array device is composed of a large number of boards, the cost of those devices becomes enormous.
It is hoped that this can be realized with the amount of hardware equivalent to the board.

【0021】画像処理等は、実時間処理を求められるも
のが多い。このため、種々の画像処理において各PEで
の演算処理時間と、2次元方向の隣接PEへのデータ転
送時間とをできるだけ抑えることによる実時間処理が可
能な2次元PEアレイ装置が望まれている。
Many of the image processing and the like require real-time processing. Therefore, in various image processing, a two-dimensional PE array device capable of real-time processing by suppressing the processing time in each PE and the data transfer time to the adjacent PE in the two-dimensional direction is desired. .

【0022】画像処理、音響処理、知識処理等における
並列性は、各処理によって様々であり、したがって、要
求される2次元PEアレイ装置のPE構成も種々とな
る。この点から、PEの構成を任意に変えられる拡張性
の高い2次元PEアレイ装置が望まれている。
The parallelism in image processing, acoustic processing, knowledge processing, etc. varies depending on each processing, and therefore the PE configuration of the required two-dimensional PE array device also varies. From this point, a highly expandable two-dimensional PE array device capable of arbitrarily changing the PE configuration is desired.

【0023】本発明は、ハードウェア量が少なく、転送
時間が短く、拡張性の高い2次元PEアレイ装置、連想
メモリおよびデータ転送方法を提供することを第1の目
的とする。
A first object of the present invention is to provide a two-dimensional PE array device, an associative memory, and a data transfer method which have a small amount of hardware, a short transfer time, and high expandability.

【0024】モルフォロジー演算処理は、構成される対
象画像を集合論的操作により変形する手法を一貫させた
理論体系であり、2値画像または濃淡画像に対する特徴
抽出、形状記述、形状認識処理において幅広く用いられ
ている。モルフォロジー演算処理方法の詳細は、「P.
maragos,“Tutorial on adva
nces in morphological ima
ge prosessing and analysi
s”,Optical Engineering,Vo
l.26 No.7,1987」等に開示されている。
従来のモルフォロジー演算処理装置としては、「M.H
assoun,et al “A VLSI gray
−scale morphology process
or for real−time NDE imag
e processing application
s”,SPIE,Vol.1350 Image Al
gebra and Morphological I
mage Processing,1990」が知られ
ている。
The morphological operation processing is a theoretical system in which a method of transforming a target image to be constructed by a set theory operation is consistent, and is widely used in feature extraction, shape description, shape recognition processing for a binary image or a grayscale image. Has been. For details of the morphological operation processing method, refer to “P.
maragos, "Tutorial on adva"
nces in morphological image
ge processing and analysis
s ", Optical Engineering, Vo
l. 26 No. 26. 7, 1987 "and the like.
As a conventional morphology operation processing device, "MH
assoon, et al "A VLSI gray
-Scale morphology process
or for real-time NDE image
e processing application
s ", SPIE, Vol. 1350 Image Al
gebra and Morphological I
"Mage Processing, 1990".

【0025】図31は、従来のモルフォロジー演算処理
装置MS0を示す図である。
FIG. 31 is a diagram showing a conventional morphology arithmetic processing unit MS0.

【0026】この従来のモルフォロジー演算処理装置M
S0は、5×5のPEアレイ83と、排他的論理和81
と、比較器82等で構成され、原画像に対するPEアレ
イ83によるスキャニング、算術演算処理、比較演算処
理を行うことによって、モルフォロジー演算処理を行う
ものである。
This conventional morphology arithmetic processing unit M
S0 is a 5 × 5 PE array 83 and an exclusive OR 81
And a comparator 82 and the like, and performs the morphological operation processing by performing scanning, arithmetic operation processing, and comparison operation processing on the original image by the PE array 83.

【0027】しかし、従来のモルフォロジー演算処理装
置MS0は、PEアレイ83の大きさである5×5以上
の大きな構造要素を処理できないという問題がある。ま
た、原画像の大きさに比例した処理時間を必要とするの
で、大きな原画像を処理する場合には、モルフォロジー
演算処理時間が長くなるという問題がある。さらに、大
きな構造要素を処理できるようにするためには、PEア
レイ83の数を増加せざるを得ず、この増加により、隣
接PE間の配線等が多くなり、ハード量が多くなるとい
う問題がある。
However, the conventional morphological operation processing device MS0 has a problem that it cannot process a large structural element of 5 × 5 or more, which is the size of the PE array 83. Further, since a processing time proportional to the size of the original image is required, there is a problem that when processing a large original image, the morphology calculation processing time becomes long. Further, in order to be able to process a large structural element, the number of PE arrays 83 must be increased, and due to this increase, the number of wires between adjacent PEs increases and the amount of hardware increases. is there.

【0028】モルフォロジー演算処理を様々な画像処理
に応用できるようにするためには、大きな原画像、大き
な構造要素に対して、実時間処理(ビデオレート)でき
ることが必要であり、このように実時間処理できるモル
フォロジー演算処理装置が望まれている。
In order to apply the morphological operation processing to various image processings, it is necessary to be able to perform real-time processing (video rate) on a large original image and a large structuring element. A morphological operation processing device capable of processing is desired.

【0029】モルフォロジー演算処理の特徴は、原画像
の局所演算のみで処理できるという極めて並列性の高い
点である。従って、高性能なモルフォロジー演算処理装
置を実現するためには、この並列性の高さという特徴を
最大限に引き出し、画素数と同数のPEを有するモルフ
ォロジー演算処理装置を実現すればよい。
A feature of the morphological operation processing is that it can be processed only by the local operation of the original image, which is extremely parallel. Therefore, in order to realize a high-performance morphology operation processing device, it is sufficient to maximize the feature of high parallelism and realize a morphology operation processing device having the same number of PEs as the number of pixels.

【0030】ところが、このように実現した場合、現実
的な原画像、たとえば512画素×512画素の原画像
を処理するためには、約26万画素という多数のPEを
必要とする。このため、多くのPEを搭載可能なモルフ
ォロジー演算処理装置が必要になる。
However, when realized in this way, a large number of PEs of about 260,000 pixels are required to process a realistic original image, for example, an original image of 512 pixels × 512 pixels. Therefore, a morphological operation processing device capable of mounting many PEs is required.

【0031】このような装置を実現するためには多数の
ボードが必要であり、その装置コストは莫大なものにな
る。したがって、上記のように多数のPEを有するモル
フォロジー演算処理装置においては、そのコストを廉価
に抑えるために、1ボード程度のハード量で実現できる
ことが望まれている。
A large number of boards are required to realize such a device, and the cost of the device becomes enormous. Therefore, in the morphology operation processing device having a large number of PEs as described above, it is desired that the morphology operation processing device can be realized with a hardware amount of about one board in order to keep the cost low.

【0032】本発明は、高性能でしかもハード量が少な
い、2次元PEアレイ装置を用いたモルフォロジー演算
処理方法を提供することを第2の目的とする。
A second object of the present invention is to provide a morphological operation processing method using a two-dimensional PE array device having a high performance and a small amount of hardware.

【0033】[0033]

【課題を解決するための手段】請求項1記載の発明は、
1次元に並べられたw個(wは任意の自然数)のワード
と、シフトアップ、シフトダウン可能なヒットフラグレ
ジスタと、このヒットフラグレジスタの内容を外に出し
入れする上位シフト入出力と下位シフト入出力とを有す
るq×r個(q,rは2以上の任意の整数)の連想メモ
リと、前記連想メモリのうちで、横方向に隣接している
前記連想メモリのうちの一方の連想メモリの下位シフト
入出力と、前記横方向に隣接している前記連想メモリの
うちの他方の連想メモリの前記シフト入出力とを接続す
るヒットフラグシフト線と、前記連想メモリのw個のワ
ードのそれぞれがm列、n行(w、m、nはw=mXn
を満たす任意の自然数)にジグザグ状に並べられたPE
に順次割り付けられ、全体で縦方向m×q個、横方向n
×r個のPEとを備えたことを特徴とする。
According to the first aspect of the present invention,
W words (where w is an arbitrary natural number) arranged in one dimension, a hit flag register that can be shifted up and down, an upper shift input / output and a lower shift input that put the contents of this hit flag register in and out. Of associative memories having q and r (q and r are arbitrary integers of 2 or more) having an output and one of the associative memories of the associative memories that are laterally adjacent to each other. Each of the hit flag shift line connecting the lower shift input / output and the shift input / output of the other associative memory of the horizontally adjacent associative memories and w words of the associative memory are m columns, n rows (w, m, n is w = mXn
PEs arranged in a zigzag pattern that satisfy any natural number that satisfies
Are sequentially allocated to m × q in the vertical direction and n in the horizontal direction.
Xr PEs are provided.

【0034】ここで、請求項1において、前記連想メモ
リおよび前記ヒットフラグシフト線を含む連想メモリア
レイ部に対して単一の制御命令ストリームを生成する制
御部をさらに備えたこととすることができる。
Here, in claim 1, the control section for generating a single control instruction stream for the associative memory array section including the associative memory and the hit flag shift line can be further provided. .

【0035】ここで、請求項1において、前記連想メモ
リの1つのワードに複数のPEが割り付けられ、この内
の1つのPEに、自分のPEの現状態フィールドと、前
記自分のPEの次状態フィールドと、隣接PEの各状態
フィールドとをさらに備えたこととすることができる。
Here, in claim 1, a plurality of PEs are allocated to one word of the associative memory, and one PE among the PEs is assigned to the current state field of its own PE and the next state of its own PE. A field and each status field of adjacent PEs may be further provided.

【0036】請求項4記載の発明は、アドレスを用いた
ワードへのデータ書き込みおよび読み出し手段と、ヒッ
トフラグレジスタのシフトモード手段と、前記アドレス
を用いたワードへのデータ書き込みおよび読み出し手段
と前記ヒットフラグレジスタのシフトモード手段とを同
時に実行するモード手段とを有することを特徴とする。
According to a fourth aspect of the present invention, data writing / reading means for a word using an address, shift mode means of a hit flag register, data writing / reading means for a word using the address, and the hit are described. And a mode means for simultaneously executing the shift mode means of the flag register.

【0037】ここで、請求項1から3いずれかにおい
て、前記連想メモリは、アドレスを用いたワードへのデ
ータ書き込みおよび読み出し手段と、ヒットフラグレジ
スタのシフトモード手段と、前記アドレスを用いたワー
ドへのデータ書き込みおよび読み出し手段と前記ヒット
フラグレジスタのシフトモード手段とを同時に実行する
モード手段とを有することとすることができる。
Here, in the associative memory according to any one of claims 1 to 3, the associative memory includes means for writing and reading data to and from a word using an address, shift mode means for a hit flag register, and a word using the address. It is possible to have a mode means for simultaneously executing the data writing and reading means and the shift mode means of the hit flag register.

【0038】請求項6記載の発明は、w個(wは任意の
自然数)のワードを1次元に並べるステップと、q×r
個(q,rは2以上の任意の整数)の連想メモリ間で、
シフトアップ、シフトダウン可能なヒットフラグレジス
タの内容を上位シフト入出力と下位シフト入出力とを用
いて外に出し入れすることによりデータを転送するステ
ップと、前記連想メモリの内、横方向に隣接している前
記連想メモリの一方の連想メモリの下位シフト入出力
と、前記横方向に隣接している前記連想メモリの他方の
連想メモリの前記シフト入出力とをヒットフラグシフト
線により接続するステップと、前記連想メモリのw個の
ワードをm列、n行(m、nはw=mxnを満たす任意
の自然数)にジグザグ状に並べるステップと、前記連想
メモリのw個のワードのそれぞれがPEに割り付けられ
るステップとを備えたことを特徴とする。
According to a sixth aspect of the present invention, a step of arranging w words (where w is an arbitrary natural number) in one dimension, and q × r
Between associative memories (q and r are arbitrary integers of 2 or more),
A step of transferring data by moving the contents of the hit flag register capable of shifting up and down by using the upper shift input / output and the lower shift input / output to transfer the data; Connecting a lower shift input / output of one associative memory of the associative memory and the shift input / output of the other associative memory of the laterally adjacent associative memories by a hit flag shift line, Arranging w words in the associative memory in m columns and n rows (m and n are arbitrary natural numbers satisfying w = mxn) in a zigzag pattern, and assigning each of the w words in the associative memory to PEs And a step that is performed.

【0039】ここで、請求項6において、前記連想メモ
リの1つのワードに複数のPEを割り付けるステップ
と、該複数のPEの内の1つのPEが、自分のPEの現
状態フィールドと、前記自分のPEの次状態フィールド
と、隣接PEの各現状態フィールドとを前記1つのワー
ド内に設けるステップとをさらに備えたこととすること
ができる。
Here, in claim 6, the step of allocating a plurality of PEs to one word of the associative memory, and one PE of the plurality of PEs has a current state field of its own PE and the own PE. The next state field of each PE and the current state field of each adjacent PE may be further provided in the one word.

【0040】請求項8記載の発明は、w個(wは任意の
自然数)のワードを1次元に並べるステップと、q×r
個(q,rは2以上の任意の整数)の連想メモリ間で、
シフトアップ、シフトダウン可能なヒットフラグレジス
タの内容を上位シフト入出力と下位シフト入出力とを用
いて外に出し入れすることによりデータを転送するステ
ップと、縦方向q列に並べられた前記連想メモリのうち
で、奇数列の連想メモリ群から偶数列の連想メモリ群、
または偶数列の連想メモリ群から奇数列の連想メモリ群
へのデータ転送を同時に行うステップと、横方向r行に
並べられた全ての連想メモリに対して、前記データ転送
を、同時に行なうステップとを備えたことを特徴とす
る。
According to an eighth aspect of the invention, a step of arranging w words (where w is an arbitrary natural number) in one dimension, and q × r
Between associative memories (q and r are arbitrary integers of 2 or more),
A step of transferring data by moving the contents of a hit flag register capable of shifting up and down by using the upper shift input / output and the lower shift input / output to transfer the data; and the associative memory arranged in q columns in the vertical direction. Of the associative memory group of odd columns to the associative memory group of even columns,
Alternatively, a step of simultaneously performing data transfer from the associative memory group of even columns to an associative memory group of odd columns, and a step of simultaneously performing the data transfer to all the associative memories arranged in r rows in the horizontal direction. It is characterized by having.

【0041】請求項9記載の発明は、w個(wは任意の
自然数)のワードを1次元に並べるステップと、前記ワ
ードに格納されているデータと検索データとを照合し検
索データの一部の照合を無視するマスク検索を行うステ
ップと、前記マスク検索により指定された第1ワード内
の特定ビットの内容をシフトアップ、シフトダウン可能
な第1ヒットフラグレジスタへ転送するステップと、転
送された第1ヒットフラグレジスタの内容を転送先の第
2ワードの第2ヒットフラグレジスタへシフトアップ又
はシフトダウンするステップと、第2ヒットフラグレジ
スタが特定の値をとる第2ワードに対して検索データの
マスクされていないビットに対応する第2ワードのビッ
トに検索データを書き込む並列部分書き込みを用いて、
第2ワード内の特定ビットへ第2ヒットフラグレジスタ
の内容を転送するステップとを備えたことを特徴とす
る。
According to a ninth aspect of the present invention, a step of arranging w words (where w is an arbitrary natural number) in one dimension and a part of the search data by collating the data stored in the words with the search data. The step of performing a mask search that ignores the collation, and the step of transferring the content of a specific bit in the first word designated by the mask search to a first hit flag register capable of shifting up and down. Shifting up or down the contents of the first hit flag register to the second hit flag register of the second word of the transfer destination; and searching data for the second word whose second hit flag register has a specific value. Using parallel partial write, which writes the search data to the bits of the second word corresponding to the unmasked bits,
Transferring the contents of the second hit flag register to a particular bit in the second word.

【0042】請求項10記載の発明は、アドレスを用い
てワードへデータを書き込みおよび読み出しを行うステ
ップと、ヒットフラグレジスタがシフトモードを実行す
るステップと、前記アドレスを用いたワードへデータを
書き込みおよび読み出しを行うステップと前記ヒットフ
ラグレジスタがシフトモードを実行するステップとを同
時に実行するモードのステップとを有することを特徴と
する。
According to the tenth aspect of the present invention, the steps of writing and reading data to and from the word using the address, the step of executing the shift mode by the hit flag register, and writing and writing the data to the word using the address are performed. It is characterized by including a step of reading and a step of simultaneously executing the step of executing the shift mode of the hit flag register.

【0043】請求項11記載の発明は、原画像フィール
ドと処理画像フィールドとシフト画像フィードとが設け
られ1次元に並べられたw個(wは任意の自然数)のワ
ードと、シフトアップ、シフトダウン可能なヒットフラ
グレジスタと、このヒットフラグレジスタの内容を外に
出し入れする上位シフト入出力と下位シフト入出力とを
備えたq×r個(q,rは2以上の任意の整数)の連想
メモリと、前記q×r個の連想メモリのうちで、横方向
に隣接している前記連想メモリのうちの一方の連想メモ
リの下位シフト入出力と、前記横方向に隣接している前
記連想メモリのうちの他方の連想メモリの前記シフト入
出力とを接続するヒットフラグシフト線と、前記連想メ
モリのw個のワードのそれぞれが、m列、n行(w,
m,nはw=m×nを満たす任意の自然数)にジグザグ
状に並べられたPEに順次割り付けられ、全体で縦方向
m×q個、横方向n×r個のPEを有する連想メモリア
レイ部と、前記連想メモリアレイ部に単一の制御命令ス
トリームを与える制御部とを備えたことを特徴とする。
According to the eleventh aspect of the present invention, there are w (w is an arbitrary natural number) words arranged in a one-dimensional manner and provided with an original image field, a processed image field and a shifted image feed, and shift up and shift down. Q × r associative memories (q and r are arbitrary integers of 2 or more) having possible hit flag registers and upper shift input / output and lower shift input / output for putting the contents of the hit flag registers in and out. Of the q × r associative memories, the lower shift input / output of one of the associative memories adjacent in the horizontal direction and the associative memory adjacent in the horizontal direction. Each of the hit flag shift line that connects the shift input / output of the other associative memory and the w words of the associative memory have m columns and n rows (w,
An associative memory array having m × q PEs in the vertical direction and n × r PEs in the horizontal direction, which are sequentially allocated to PEs arranged in a zigzag pattern (m is an arbitrary natural number satisfying w = m × n). And a control unit for supplying a single control instruction stream to the associative memory array unit.

【0044】請求項12記載の発明は、w個(wは任意
の自然数)のワードを1次元に並べるステップと、該ワ
ード内に各々1つずつの原画像フィールド、処理画像フ
ィールド、左右シフト画像フィールドと2つの上下シフ
ト画像フィールドを設けるステップと、q×r個(q,
rは2以上の任意の整数)の連想メモリ間で、シフトア
ップ、シフトダウン可能なヒットフラグレジスタの内容
を上位シフト入出力と下位シフト入出力とを用いて外に
出し入れするステップと、前記q×r個の連想メモリの
うちで、横方向に隣接している前記連想メモリのうちの
一方の連想メモリの下位シフト入出力と、前記横方向に
隣接している前記連想メモリのうちの他方の連想メモリ
の上位シフト入出力とをヒットフラグシフト線により接
続するステップと、前記連想メモリのw個のワードのそ
れぞれが、m列、n行(w,m,nはw=m×nを満た
す任意の自然数)にジグザグ状に並べられたPEに順次
割り付けられ、全体で縦方向m×q個、横方向n×r個
のPEを有する連想メモリアレイ部を設けるステップ
と、制御部が、前記連想メモリアレイ部に単一の制御命
令ストリームを与えるステップと、左右方向のPEの原
画像フィールド又は上下シフト画像フィールドのデータ
を、左右シフト画像フィールドに順次転送し、演算処理
を行い処理画像フィールドに格納する転送演算処理ステ
ップと、上下方向のPEの原画像フィールド又は片方の
上下シフト画像フィールドのデータを、他方の上下シフ
ト画像フィールドに転送する画像シフトアップ、ダウン
処理ステップと、前記転送演算処理ステップと画像シフ
トアップ、ダウン処理ステップとを、上下左右方向のP
Eからの転送演算処理がすべて終了するまで繰り返すス
テップとを備えたことを特徴とする。
According to a twelfth aspect of the present invention, a step of arranging w (w is an arbitrary natural number) words in one dimension, and one original image field, one processed image field, and one horizontal shift image in each word are provided. Field and two vertically shifted image fields, q × r (q,
r is an arbitrary integer greater than or equal to 2), the content of the hit flag register which can be shifted up and down is put in and out of the associative memory using upper shift input / output and lower shift input / output. Out of the xr associative memories, the lower shift input / output of one of the associative memories that are laterally adjacent to each other and the other of the associative memories that are laterally adjacent to each other The step of connecting the upper shift input / output of the associative memory with a hit flag shift line, and each of the w words of the associative memory have m columns and n rows (w, m, n satisfy w = m × n). Providing an associative memory array unit having m × q PEs in the vertical direction and n × r PEs in the horizontal direction, which are sequentially allocated to the PEs arranged in a zigzag pattern (arbitrary natural number), Communicating The step of giving a single control instruction stream to the memory array section, and the data of the original image field of the PE in the horizontal direction or the data of the vertical shift image field are sequentially transferred to the horizontal shift image field, arithmetic processing is performed and stored in the processed image field. A transfer operation processing step for transferring, and an image shift up / down processing step for transferring the data of the original image field of PE in the vertical direction or the data for one of the vertical shift image fields to the other vertical shift image field, and the transfer operation processing step. Image shift up and down processing steps, P
And a step of repeating until all the transfer arithmetic processing from E is completed.

【0045】ここで、請求項12において、原画像の各
要素のデータを前記2次元PEアレイ装置の対応するP
Eの原画像フィールドに転送するステップと、構造要素
によって定義される上下左右方向の任意のPEからのデ
ータ転送および演算処理を行うステップとをさらに備え
たこととすることができる。
Here, in claim 12, the data of each element of the original image is converted into the corresponding P of the two-dimensional PE array device.
It may further be provided with a step of transferring to the original image field of E and a step of performing data transfer and arithmetic processing from any PE defined in the vertical and horizontal directions by the structuring element.

【0046】ここで、請求項12において、原画像フィ
ールド又は上下シフト画像フィールドの特定のビットに
対するマスク検索と、m回(mは前記m列のm)のシフ
トアップあるいはシフトダウン処理と、左右シフト画像
フィールドの対応するビットに対する並列部分書き込み
とを、データのビット数繰り返すデータ転送処理ステッ
プと、左右シフト画像フィールドにあるデータが演算処
理をするべきPEからのデータであるときにのみ、処理
画像フィールドおよび左右シフト画像フィールドに対し
て演算処理を行い、該演算処理の結果を処理画像フィー
ルドに格納する演算処理ステップと、前記データ転送処
理ステップおよび演算処理ステップを、左右方向からの
転送演算処理がすべて終了するまで繰り返すステップと
を備えたこととすることができる。
Here, in the twelfth aspect, a mask search for a specific bit of the original image field or the vertically shifted image field, m upshifts (m is m in the m column) or downshifts, and left and right shifts. Only when the data transfer processing step in which the parallel partial writing to the corresponding bits of the image field is repeated by the number of bits of the data and the data in the left / right shift image field is the data from the PE to be processed, the processed image field And an arithmetic processing step of performing arithmetic processing on the left and right shift image fields and storing the result of the arithmetic processing in the processed image field, and the data transfer processing step and the arithmetic processing step, all of the left and right transfer arithmetic processing. And steps to repeat until finished. It is possible.

【0047】ここで、請求項12において、原画像フィ
ールド又は片方の上下シフト画像フィールドの特定のビ
ットに対するマスク検索と、1回のシフトアップあるい
はシフトダウン処理と、他方の上下シフト画像フィール
ドの対応するビットに対する並列部分書き込みとを、デ
ータのビット数繰り返す内部ワード転送ステップと、連
想メモリのアドレスを用いたワードへのデータの読み書
き機能を用いて、奇数又は偶数連想メモリ群の上位又は
下位ワード群の特定のワードの原画像フィールド又は片
方の上限シフト画像フィールドの全ビットを、対応する
偶数又は奇数連想メモリ群の他方の上下シフト画像フィ
ールドに上位又は下位境界ワードを転送するステップと
を備えたこととすることができる。
Here, in claim 12, a mask search for a specific bit of the original image field or one of the vertical shift image fields, one shift up or shift down process, and the other vertical shift image field correspond. By using the internal word transfer step in which parallel partial writing to bits is repeated for the number of bits of data and the function of reading and writing data to and from the word using the address of the associative memory, the upper or lower word group of the odd or even associative memory group is Transferring all the bits of the original image field or one upper shift image field of a particular word to the upper or lower boundary word of the other upper or lower shift image field of the corresponding even or odd associative memory group. can do.

【0048】[0048]

【発明の実施の形態】BEST MODE FOR CARRYING OUT THE INVENTION

(実施の形態1)図1は、本発明の一実施の形態である
2次元PEアレイ装置PEA1の基本構成を示す図であ
る。
(Embodiment 1) FIG. 1 is a diagram showing a basic configuration of a two-dimensional PE array device PEA1 which is an embodiment of the present invention.

【0049】2次元PEアレイ装置PEA1は、2次元
に配列されている複数の連想メモリ11と、2つの連想
メモリ11を互いに接続する連想メモリ間ヒットフラグ
シフト線16とで構成されている。
The two-dimensional PE array device PEA1 is composed of a plurality of associative memories 11 arranged two-dimensionally and an associative memory hit flag shift line 16 connecting the two associative memories 11 to each other.

【0050】以下、個々の連想メモリを区別して参照す
る場合は、連想メモリ11とせずに連想メモリ11
(1,1) 等とする。同様に、個々のワードを区別して参照
する場合は、ワード24又はワード12とせずに、ワー
ド24(1) 、ワード12(1,1) 等とする。
In the following, when the individual associative memories are referred to separately, the associative memory 11 is used instead of the associative memory 11.
(1,1) etc. Similarly, when individually referring to individual words, the word 24 (1) , the word 12 (1,1) or the like is used instead of the word 24 or the word 12.

【0051】また、2次元PEアレイ装置PEA1は、
1次元に並べられたw個(wは任意の自然数)のワード
と、シフトアップ、シフトダウン可能なヒットフラグレ
ジスタと、このヒットフラグレジスタの内容を外に出し
入れする上位シフト入出力と下位シフト入出力とを具備
するq×r個(q,rは2以上の任意の整数)の連想メ
モリ11と、上記q×r個の連想メモリ11のうちで、
横方向に隣接している上記連想メモリ11のうちの一方
の連想メモリ11の下位シフト入出力と、上記横方向に
隣接している上記連想メモリ11のうちの他方の連想メ
モリ11の上記シフト入出力とを接続するヒットフラグ
シフト線16とを有し、上記連想メモリ11のw個のワ
ードがm列、n行にジグザグ状に並べられ、連想メモリ
11のw個のワードのそれぞれが、種々の論理、算術処
理を行なうPEに割り付けられている2次元PEアレイ
装置である。
The two-dimensional PE array device PEA1 is
W words (where w is an arbitrary natural number) arranged in one dimension, a hit flag register that can be shifted up and down, an upper shift input / output and a lower shift input that put the contents of this hit flag register in and out. Of the q × r associative memories 11 (q and r are arbitrary integers of 2 or more) having outputs and the above q × r associative memories 11,
Lower shift input / output of one of the associative memories 11 adjacent to each other in the horizontal direction and the shift input / output of the other associative memory 11 of the associative memories 11 adjacent to each other in the horizontal direction. A hit flag shift line 16 connected to the output, w words of the associative memory 11 are arranged in a z-zag pattern in m columns and n rows, and each of the w words of the associative memory 11 has various values. Is a two-dimensional PE array device assigned to PEs that perform the logic and arithmetic processing of.

【0052】図2は、上記2次元PEアレイ装置PEA
1を構成する連想メモリ11(1,1)を示す図である。
FIG. 2 shows the two-dimensional PE array device PEA.
FIG. 3 is a diagram showing an associative memory 11 (1,1) which constitutes No. 1.

【0053】連想メモリ11(1,1) は、検索/書き込み
データ入力21と、マスクレジスタ22と、アドレス入
力23と、ワード24と、アドレスデコーダ25と、上
位シフト入出力26と、シフトアップ、シフトダウンす
ることによってワード24の内容を転送するヒットフラ
グレジスタ27と、読み出しデータ出力28と、下位シ
フト入出力29とで構成されている。また、1つの連想
メモリ11(1,1) におけるワード24の全ての数wは、
w=m×nであり、w,m,nは、上記式を満たす任意
の自然数である。なお、図2におけるワード24は、図
1に示すワード12と同じものである。すなわち、ワー
ド24(1) 〜24(w) のそれぞれは、ワード12(1,1)
〜12(m,n) に対応する。また、他の連想メモリ11
(2,1) 〜11(q,r) の構成も、連想メモリ11(1,1)
上記構成と同様であるので、以下の説明では、連想メモ
リ11(1,1) を代表として説明する。
The associative memory 11 (1,1) has a search / write data input 21, a mask register 22, an address input 23, a word 24, an address decoder 25, an upper shift input / output 26, a shift up, It is composed of a hit flag register 27 for transferring the contents of the word 24 by shifting down, a read data output 28, and a lower shift input / output 29. Also, all the numbers w of the words 24 in one associative memory 11 (1,1) are
w = m × n, and w, m, and n are arbitrary natural numbers that satisfy the above formula. The word 24 in FIG. 2 is the same as the word 12 shown in FIG. That is, each of the words 24 (1) to 24 (w) is the word 12 (1,1).
Corresponds to ~ 12 (m, n) . In addition, another associative memory 11
Since the configurations of (2,1) to 11 (q, r) are similar to the above-described configurations of the associative memory 11 (1,1) , the following description will be made by taking the associative memory 11 (1,1) as a representative. To do.

【0054】連想メモリ11(1,1) は、データ書き込み
機能と、データ読み出し機能と、マスク検索機能と、並
列部分書き込み機能とを有する。
The associative memory 11 (1,1) has a data write function, a data read function, a mask search function, and a parallel partial write function.

【0055】上記データ書き込み機能は、連想メモリ1
(1,1) において、アドレス入力23にアドレス値を与
え、検索/書き込みデータ入力21に、書き込みデータ
を与えることによって、任意のワード24にデータを書
き込む機能である。
The data writing function is the same as that of the associative memory 1.
1 (1,1) is a function of writing data to an arbitrary word 24 by giving an address value to the address input 23 and giving write data to the search / write data input 21.

【0056】上記データ読み出し機能は、連想メモリ1
(1,1) において、アドレス入力23にアドレス値を与
えることによって、任意のワード24のデータを読み出
し、データ出力28から読み出す機能である。
The data read function is the same as the associative memory 1
1 (1,1) is a function of reading the data of an arbitrary word 24 and reading it from the data output 28 by giving an address value to the address input 23.

【0057】また、上記マスク検索機能は、検索/書き
込みデータ入力21に与えた検索データと、ワード24
に格納されているデータとを並列に照合し、この照合結
果をヒットフラグレジスタ27へ書き込み、この場合、
マスクレジスタ22にマスクしたいビット位置を与える
ことによって、検索データの一部の照合を無視させる機
能である。そして、マスクレジスタ22に特定のビット
以外をマスクするデータを設定し、検索/書き込みデー
タ入力21に検索データ「1」を与えることによって、
ワード24中の特定のビットを、ヒットフラグレジスタ
27へ転送する機能が実現できる。
Further, the mask search function uses the search data given to the search / write data input 21 and the word 24.
Collate in parallel with the data stored in, and write the collation result to the hit flag register 27. In this case,
This is a function of giving a bit position to be masked to the mask register 22 to ignore collation of a part of the search data. Then, by setting data for masking other than a specific bit in the mask register 22 and supplying search data “1” to the search / write data input 21,
A function of transferring a specific bit in the word 24 to the hit flag register 27 can be realized.

【0058】また、並列部分書き込み機能は、ヒットフ
ラグレジスタ27が「1」であるワードに対して、検索
/書き込みデータ入力21のデータが、マスクされてい
ない特定のビットに書き込まれる機能である。
The parallel partial write function is a function in which the data of the search / write data input 21 is written to a specific bit which is not masked for the word whose hit flag register 27 is "1".

【0059】ヒットフラグレジスタ27は、シフトアッ
プ、シフトダウンの双方向のシフトモードを有し、つま
り、図示しないセレクタによって、シフトアップ、シフ
トダウンを切り替え、上位シフト入出力26、下位シフ
ト入出力29を介して、連想メモリ11(1,1) の外部か
らシリアルに読み書きを行なう機能を有する。
The hit flag register 27 has a bidirectional shift mode of upshifting and downshifting, that is, switching between upshifting and downshifting by a selector (not shown), upper shift input / output 26, lower shift input / output 29. It has a function of serially reading and writing from outside the associative memory 11 (1,1) via the.

【0060】また、図1に示すように、上記2次元PE
アレイ装置PEA1は、X×Yに並べられたPEが、縦
方向q列、横方向r行のブロックに分割され、この分割
された各ブロックに1つの連想メモリ11(1,1) を割り
付けたものである。なお、Xは縦方向のPEの数であ
り、Yは横方向のPEの数であり、X=mq,Y=nr
は2以上の任意の整数であり、また、q,rは2以上の
任意の数である。
Further, as shown in FIG.
In the array device PEA1, PEs arranged in X × Y are divided into blocks of q columns in the vertical direction and r rows in the horizontal direction, and one associative memory 11 (1,1) is allocated to each of the divided blocks. It is a thing. Note that X is the number of PEs in the vertical direction, Y is the number of PEs in the horizontal direction, and X = mq, Y = nr.
Is an arbitrary integer of 2 or more, and q and r are arbitrary numbers of 2 or more.

【0061】割り付けられた各連想メモリ11
(1,1) は、w個のワード12を(X÷q)個づつに区切
られ、(X÷q)×(Y÷r)にジグザグ状に並べら
れ、上記PEのブロックに順次割り付けられることによ
って構成されている。
Each assigned associative memory 11
(1,1) is divided into w words 12 (X ÷ q) each, arranged in a zigzag pattern (X ÷ q) × (Y ÷ r), and sequentially allocated to the PE blocks. It consists of:

【0062】このようにすれば、1つの連想メモリ11
(1,1) でm×nのPEを搭載できる。なお、mは、m=
X÷qを満たす自然数であり、nは、n=Y÷rを満た
す自然数である。よって、全体では、縦方向X=m×q
個、横方向Y=n×r個のPEを搭載した2次元PEア
レイ装置PEA1を実現することができる。
In this way, one associative memory 11
(1,1) can mount m × n PE. Note that m is m =
It is a natural number that satisfies X ÷ q, and n is a natural number that satisfies n = Y ÷ r. Therefore, as a whole, the vertical direction X = m × q
It is possible to realize a two-dimensional PE array device PEA1 equipped with a number of PEs of Y = n × r in the horizontal direction.

【0063】また、横方向に隣接する連想メモリ間は、
連想メモリ間ヒットフラグシフト線16によって結合さ
れている。具体的には、1つの連想メモリ11の上位シ
フト入出力26と、その連想メモリ11と横方向に隣接
する他の連想メモリ11の下位シフト入出力29とが、
連想メモリ間ヒットフラグシフト線16によって結合さ
れている。具体的には、1つの連想メモリ11(1,1)
上位シフト入出力26と、その連想メモリ11(1,1)
横方向に隣接する連想メモリ11(1,2) の下位シフト入
出力29とが、連想メモリ間ヒットフラグシフト線16
によって結合されている。したがって、横方向に互いに
隣接する連想メモリ11同士の間では、同一の連想メモ
リ11として、シフトアップ、シフトダウン等の動作を
統一的に取り扱うことができる。
Further, between the associative memories adjacent in the horizontal direction,
The associative memories are connected by the hit flag shift line 16. Specifically, the upper shift input / output 26 of one associative memory 11 and the lower shift input / output 29 of another associative memory 11 laterally adjacent to the associative memory 11 are
The associative memories are connected by the hit flag shift line 16. Specifically, the upper shift output 26 of one content addressable memory 11 (1,1), the lower shifting-associative memory 11 laterally adjacent and its associative memory 11 (1,1) (1,2) The output 29 is the associative memory hit flag shift line 16
Are joined by. Therefore, among the associative memories 11 that are adjacent to each other in the horizontal direction, the same associative memory 11 can handle the operations such as shift up and shift down in a unified manner.

【0064】図3は、上記実施の形態において、右、
下、左、上の4隣接のPEにデータ転送する場合におけ
る連想メモリ11(1,1) のワード24の割り付け法を示
す図である。
FIG. 3 shows the above embodiment, on the right,
It is a figure which shows the allocation method of the word 24 of the associative memory 11 (1,1) in the case of transferring data to 4 adjacent PEs of the lower left, and the upper.

【0065】図3に示すように、PE31は、現状態フ
ィールドC32と、次状態フィールドC+33と、右P
E状態フィールドR34と、下PE状態フィールドD3
5と、左PE状態フィールドL36と、上PE状態フィ
ールドU37とによって構成されている。
As shown in FIG. 3, the PE 31 has a current state field C32, a next state field C + 33, and a right P
E state field R34 and lower PE state field D3
5, a left PE status field L36, and an upper PE status field U37.

【0066】ワークフィールドW38は、現状態フィー
ルドC32、隣接PE(右PE状態フィールドR34
と、下PE状態フィールドD35と、左PE状態フィー
ルドL36と、上PE状態フィールドU37と)のデー
タを用いて、種々の演算を行なう場合のテンポラリ領域
として使用される領域である。
The work field W38 includes a current state field C32, an adjacent PE (right PE state field R34
The lower PE status field D35, the left PE status field L36, and the upper PE status field U37) are used as temporary areas when various operations are performed.

【0067】図4は、上記実施の形態において、右、右
下、下、左下、左、左上、上、右上の8隣接のPEにデ
ータ転送する場合における連想メモリ11(1,1)
のワードの割り付け法を示す図である。
FIG. 4 shows the associative memory 11 (1, 1) in the above embodiment when data is transferred to the eight adjacent PEs of right, lower right, lower, lower left, left, upper left, upper and upper right.
It is a figure which shows the allocation method of the word of.

【0068】図4に示すように、PE41は、現状態フ
ィールドC42、次状態フィールドC+43、右PE状
態フィールドR44、右下PE状態フィールドRD4
5、下PE状態フィールドD46、左下PE状態フィー
ルドLD47、左PE状態フィールドL48、左上PE
状態フィールドLU49、上PE状態フィールドU41
0、右上PE状態フィールドRU411によって構成さ
れている。
As shown in FIG. 4, the PE 41 has a current state field C42, a next state field C + 43, a right PE state field R44, and a lower right PE state field RD4.
5, lower PE status field D46, lower left PE status field LD47, left PE status field L48, upper left PE
Status field LU49, upper PE status field U41
0, upper right PE status field RU411.

【0069】ワークフィールドW412は、現状態フィ
ールドC42、隣接PE(右PE状態フィールドR4
4、右下PE状態フィールドRD45、下PE状態フィ
ールドD46、左下PE状態フィールドLD47、左P
E状態フィールドL48、左上PE状態フィールドLU
49、上PE状態フィールドU410、右上PE状態フ
ィールドRU411)のデータを用いて種々の演算を行
なう場合にテンポラリ領域として使用する領域である。
The work field W412 includes a current state field C42, an adjacent PE (right PE state field R4).
4, lower right PE status field RD45, lower PE status field D46, lower left PE status field LD47, left P
E status field L48, upper left PE status field LU
49, upper PE status field U410, upper right PE status field RU411) is used as a temporary area when various calculations are performed.

【0070】図3,図4に示した方法と同様の方法によ
って、距離が2まで離れたPEへデータ転送を含む24
隣接のPE、またはそれ以上に対するデータ転送を行う
場合の連想メモリ11(1,1) のワードの割り付けを行う
ことができる。
By the same method as shown in FIG. 3 and FIG.
Words of the associative memory 11 (1,1) can be allocated when data is transferred to adjacent PEs or more.

【0071】図5は、2次元PEアレイ装置PEA1に
おける全体の処理手順を示すフローチャートである。
FIG. 5 is a flowchart showing the overall processing procedure in the two-dimensional PE array device PEA1.

【0072】電源投入後、まず、現状態フィールドC3
2またはC42へ、外部から初期データを設定する。
After the power is turned on, first, the current state field C3
Initial data is externally set to 2 or C42.

【0073】次に、連想メモリ11(1,1) の並列部分書
き込み機能を用いて、2次元PEアレイ装置PEA1内
の全ての隣接状態フィールドを「0」に初期化する(5
1)。なお、2次元PEアレイ装置PEA1内の全ての
隣接状態フィールドは、4隣接の場合には、右PE状態
フィールドR34、下PE状態フィールドD35、左P
E状態フィールドL36、上PE状態フィールドU37
のフィールドであり、8隣接の場合には、右PE状態フ
ィールドR44、右下PE状態フィールドRD45、下
PE状態フィールドD46、左下PE状態フィールドL
D47、左PE状態フィールドL48、左上PE状態フ
ィールドLU49、上PE状態フィールドU410、右
上PE状態フィールドRU411のフィールドである。
Next, all the adjacent state fields in the two-dimensional PE array device PEA1 are initialized to "0" by using the parallel partial write function of the associative memory 11 (1,1) (5
1). In the case where all the adjacent state fields in the two-dimensional PE array device PEA1 are four adjacent, the right PE state field R34, the lower PE state field D35, and the left P state field R34.
E status field L36, upper PE status field U37
In the case of 8 adjacencies, the right PE status field R44, the lower right PE status field RD45, the lower PE status field D46, and the lower left PE status field L.
D47, left PE status field L48, upper left PE status field LU49, upper PE status field U410, and upper right PE status field RU411.

【0074】次に、隣接PEへのデータ転送を行なう
(54)。このデータ転送は、内部ワード転送(連想メ
モリ内転送:52)と上位、下位境界ワード転送(連想
メモリ間転送:53)とに分けて行なう。内部ワード転
送(52)は、上位境界ワード群13の上PEへのデー
タ転送と下位境界ワード群15の下PEへのデータ転送
以外の全ての転送であり、上位、下位境界ワード転送
(53)は、上位境界ワード群13の上PEへのデータ
転送と下位境界ワード群15の下PEへのワード転送で
ある。なお、上位境界ワード群13の上PEは、8隣接
の場合、右上、左上PEを含み、下位境界ワード群15
の下PEは、8隣接の場合右下、左下PEを含む。
Next, data transfer to the adjacent PE is performed (54). This data transfer is divided into internal word transfer (transfer in associative memory: 52) and upper and lower boundary word transfer (transfer between associative memories: 53). The internal word transfer (52) is all transfers except the data transfer to the upper PE of the upper boundary word group 13 and the lower PE of the lower boundary word group 15, and the upper and lower boundary word transfers (53). Is data transfer to the upper PE of the upper boundary word group 13 and word transfer to the lower PE of the lower boundary word group 15. When the upper PE of the upper boundary word group 13 is 8 adjacent, it includes the upper right PE and the upper left PE, and the lower boundary word group 15
The lower PE includes a lower right PE and a lower left PE in the case of 8 adjacencies.

【0075】次に、上記実施の形態における内部ワード
転送(52)について説明する。
Next, the internal word transfer (52) in the above embodiment will be described.

【0076】図6は、上記実施の形態において、4隣接
内部ワード転送手順を示すフローチャートである。
FIG. 6 is a flowchart showing a 4-adjacent internal word transfer procedure in the above embodiment.

【0077】4隣接内部ワード転送(52)は、下、右
PEへのビット転送(61)と、上、左PEへのビット
転送(62)との2段階で構成される。
The 4-adjacent internal word transfer (52) is composed of two stages: a bit transfer to the lower and right PEs (61) and a bit transfer to the upper and left PEs (62).

【0078】下、右PEへのビット転送(61)では、
まず、マスクレジスタ22に、C32の特定ビット以外
をマスクするデータを設定し、「1」で検索を行なうこ
とによって、ヒットフラグレジスタ27へ、C32の特
定ビットの内容を転送する。次に、ヒットフラレジスタ
27を1下位シフトダウンし、U37の対応ビットによ
って、ヒットフラグレジスタ27が「1」のワードに、
「1」を並列部分書き込みする。上記の手順によって、
下PEへのビット転送を行なうことができる。次に、ヒ
ットフラグレジスタ27をm−1回シフトダウンし、L
36の対応ビットによって、ヒットフラグレジスタ27
が「1」のワードに、「1」を並列部分書き込みする。
上記の手順によって右PEへのビット転送が行われる。
Below, in the bit transfer (61) to the right PE,
First, the mask register 22 is set with data for masking a bit other than the specific bit of C32, and a search with "1" is performed to transfer the content of the specific bit of C32 to the hit flag register 27. Next, the hit flag register 27 is shifted down by one lower, and the hit flag register 27 becomes a word of "1" by the corresponding bit of U37.
"1" is written in parallel. By the above procedure,
Bit transfer to the lower PE can be performed. Next, the hit flag register 27 is shifted down by m-1 times, and L
Depending on the corresponding bit of 36, the hit flag register 27
The partial writing of "1" is performed in the word of "1".
Bit transfer to the right PE is performed by the above procedure.

【0079】上、左PEへのビット転送(62)では、
まず、C32の特定ビット以外をマスクレジスタ22に
マスクするデータを、設定「1」で検索することによっ
て、C32の特定ビットの内容を、ヒットフラグレジス
タ27に転送する。次に、ヒットフラグレジスタ27を
1回シフトアップし、D35の対応ビットによって、ヒ
ットフラグレジスタ27が「1」であるワードに「1」
を並列部分書き込みする。この手順によって、上PEへ
のビット転送が行われる。そして、ヒットフラグレジス
タ27をm−1回シフトアップし、R34の対応ビット
で、ヒットフラグレジスタ27が「1」のワードに
「1」を並列部分書き込みする。これによって、左PE
へのビット転送が行われる。
Above, in the bit transfer (62) to the left PE,
First, the contents of the specific bit of C32 are transferred to the hit flag register 27 by searching the mask register 22 for the data other than the specific bit of C32 by setting "1". Next, the hit flag register 27 is shifted up once, and "1" is added to the word in which the hit flag register 27 is "1" by the corresponding bit of D35.
Write in parallel part. By this procedure, bit transfer to the upper PE is performed. Then, the hit flag register 27 is shifted up by m-1 times, and "1" is written in parallel to the word "1" by the hit flag register 27 by the corresponding bit of R34. This allows the left PE
Bit transfer to.

【0080】そして、上記手順をC32のビット数分、
繰り返し、4隣接内部ワード転送がすべて終了する。
Then, the above procedure is repeated by the number of bits of C32.
Repeatedly, the 4-adjacent internal word transfer is completed.

【0081】図7は、上記実施の形態における8隣接内
部ワード転送手順を示すフローチャートである。
FIG. 7 is a flowchart showing the 8-adjacent internal word transfer procedure in the above embodiment.

【0082】図7に示すように、8隣接内部ワード転送
は、下、右上、右、右下PEへのビット転送(71)
と、上、左下、左、右上PEへのビット転送(72)と
の2段階で行なわれる。
As shown in FIG. 7, the 8-adjacent internal word transfer is a bit transfer to the lower, upper right, right and lower right PEs (71).
And bit transfer to the upper, lower left, left, and upper right PE (72).

【0083】下、右上、右、右下PEへのビット転送
(71)では、まず、C42の特定ビット以外をマスク
レジスタ22にマスクするデータを設定し、「1」で検
索を行なうことによって、ヒットフラグレジスタ27へ
C42の特定ビットの内容を転送する。そして、ヒット
フラグレジスタ27を1回シフトダウンし、U410の
対応ビットによって、ヒットフラグレジスタ27が
「1」のワードに、「1」を並列部分書き込みする。こ
の手順によって、下PEへのビット転送が行われる。次
に、ヒットフラグレジスタ27をm−2回シフトダウン
し、LD47の対応ビットによって、ヒットフラグレジ
スタ27が「1」のワードに、「1」を並列部分書き込
みする。この手順によって右上PEへのビット転送が行
なわれる。
In the bit transfer (71) to the lower, upper right, right, and lower right PEs, first, data for masking other than the specific bits of C42 is set in the mask register 22, and a search is performed with "1". The contents of the specific bit of C42 are transferred to the hit flag register 27. Then, the hit flag register 27 is shifted down once, and "1" is written in parallel to the word of which the hit flag register 27 is "1" by the corresponding bit of U410. By this procedure, bit transfer to the lower PE is performed. Next, the hit flag register 27 is shifted down by m−2 times, and “1” is written in parallel to the word of which the hit flag register 27 is “1” by the corresponding bit of the LD 47. By this procedure, bit transfer to the upper right PE is performed.

【0084】次に、ヒットフラグレジスタ27を1回シ
フトダウンし、L48の対応ビットで、ヒットフラグレ
ジスタ27が「1」のワードに、「1」を並列部分書き
込みする。この手順によって右PEへのビット転送が行
なわれる。次に、ヒットフラグレジスタ27を1回シフ
トダウンし、LU49の対応ビットで、ヒットフラグレ
ジスタ27が「1」のワードに、「1」を並列部分書き
込みする。このようにして、右下PEへのビット転送が
行なわれる。
Next, the hit flag register 27 is shifted down once, and "1" is written in parallel to the word of which the hit flag register 27 is "1" by the corresponding bit of L48. Bit transfer to the right PE is performed by this procedure. Next, the hit flag register 27 is shifted down once, and "1" is written in parallel to the word of which the hit flag register 27 is "1" by the corresponding bit of the LU 49. In this way, the bit transfer to the lower right PE is performed.

【0085】上、左下、左、左上PEへのビット転送
(72)では、まず、マスクレジスタ22にC42の特
定ビット以外をマスクするデータを設定し、「1」で検
索を行なうことによって、ヒットフラグレジスタ27へ
C42の特定ビットの内容を転送し、ヒットフラグレジ
スタ27を1回シフトアップする。次に、D46の対応
ビットで、ヒットフラグレジスタ27が「1」のワード
に、「1」を並列部分書き込みする。この手順によっ
て、上PEへのビット転送が行なわれる。次に、ヒット
フラグレジスタ27をm−2回シフトアップし、RU4
11の対応ビットによって、ヒットフラグレジスタ27
が「1」のワードに、「1」を並列部分書き込みする。
この手順によって、左下PEへのビット転送が行なわれ
る。次に、ヒットフラグレジスタ27を1回シフトアッ
プし、R44の対応によって、ヒットフラグレジスタ2
7が「1」のワードに「1」を並列部分書き込みする。
上記手順によって、左PEへのビット転送が行なわれ
る。
In the bit transfer to the upper, lower left, left, upper left PE (72), first, data for masking other than the specific bits of C42 is set in the mask register 22, and a search is performed with "1" to hit. The contents of the specific bit of C42 are transferred to the flag register 27, and the hit flag register 27 is shifted up once. Next, with the corresponding bit of D46, the hit flag register 27 writes "1" in parallel to the word of "1". By this procedure, bit transfer to the upper PE is performed. Next, the hit flag register 27 is shifted up by m-2 times, and RU4
According to 11 corresponding bits, the hit flag register 27
The partial writing of "1" is performed in the word of "1".
By this procedure, bit transfer to the lower left PE is performed. Next, the hit flag register 27 is shifted up once and the hit flag register 2 is changed depending on the correspondence of R44.
7 parallel-writes "1" to the word "1".
By the above procedure, bit transfer to the left PE is performed.

【0086】次に、ヒットフラグレジスタ27を1回シ
フトアップし、RD45の対応ビットによって、ヒット
フラグレジスタ27が「1」のワードに、「1」を並列
部分書き込みする。上記手順によって、左上PEへのビ
ット転送が行なわれる。そして、上記手順をC42のビ
ット数分、繰り返す。これらの手順によって、8隣接内
部ワード転送が全て行なわれる。24隣接内部ワード転
送、またはそれ以上の数の隣接内部ワード転送について
も、上記4隣接、8隣接内部ワード転送の手順と同様の
手順で行なわれる。
Next, the hit flag register 27 is shifted up once, and "1" is written in parallel to the word of which the hit flag register 27 is "1" by the corresponding bit of the RD 45. By the above procedure, bit transfer to the upper left PE is performed. Then, the above procedure is repeated for the number of bits of C42. By these procedures, all 8-adjacent internal word transfers are performed. The 24-adjacent internal word transfer or the number of adjacent internal word transfers of more than 24 is performed in the same procedure as the procedure of the 4-adjacent or 8-adjacent internal word transfer.

【0087】上位、下位境界ワード転送(53)は、連
想メモリ11(1,1) のアドレスを用いたワードへのデー
タ書き込み、読み出し機能を用いて逐次的に行なう。ま
た、内部ワード転送(52)が全て終了してから、上記
の上位、下位境界ワード転送(53)を実行する。内部
ワード転送時(52)に、たとえば上位境界ワード群1
3のU37等に、対応しないデータが書き込まれるが、
図5に示すフローチャートにおける上位、下位境界ワー
ド転送時(53)に、上記対応しないデータが上書きさ
れるので問題ない。
The upper / lower boundary word transfer (53) is sequentially performed by using the data writing / reading function for the word using the address of the associative memory 11 (1,1) . Further, after all the internal word transfers (52) are completed, the above-mentioned upper and lower boundary word transfers (53) are executed. During the internal word transfer (52), for example, upper boundary word group 1
Incompatible data is written to U37 of 3
At the time of transfer of the upper and lower boundary words (53) in the flowchart shown in FIG. 5, there is no problem because the uncorresponding data is overwritten.

【0088】次に、現状態フィールドC32または42
と隣接状態を用いて次状態を算出し(55)、この算出
された次状態を、次状態フィールドC+33または43
に入れる。連想メモリ11(1,1) においては、全てのワ
ードに対して、この処理を同時に実行することができ
る。次に、次状態フィールドC+32または42の役割
と、現状態のフィールドC33または43の役割とを入
れ換えて、初期化段階(51)へ戻る。以上の手順を任
意回数繰り返し、最後に、次状態フィールドC+33ま
たは43のデータを外部へ出力する。
Next, the current state field C32 or 42
The next state is calculated using the adjacent state and the adjacent state (55), and the calculated next state is set to the next state field C + 33 or 43.
Put in. In the associative memory 11 (1,1) , this process can be executed simultaneously for all words. Next, the role of the next state field C + 32 or 42 and the role of the current state field C33 or 43 are exchanged, and the process returns to the initialization stage (51). The above procedure is repeated any number of times, and finally the data of the next state field C + 33 or 43 is output to the outside.

【0089】上記実施の形態において、連想メモリ11
(1,1) は、集積度が極めて高いメモリ技術をベースとし
て構成されているので、小量のハードウェア量によっ
て、1つのPEとデータ転送パスとを実現できる。した
がって、ハードウェア量が少ない2次元PEアレイ装置
PEA1を実現することができる。また、X×YのPE
で構成された2次元PEアレイ装置PEA1を実現する
場合、Yのq分の1づつ多段に分けて割り付けるので、
横方向のPE間のデータ転送時間が短くなり、図29に
示すようにPEをY個づつジグザグ状に割り付ける従来
の2次元PEアレイ装置PEA12よりも、横方法のP
E間のデータ転送時間が短くなる。
In the above embodiment, the associative memory 11
Since (1,1) is configured based on a memory technology having a very high degree of integration, one PE and a data transfer path can be realized with a small amount of hardware. Therefore, it is possible to realize the two-dimensional PE array device PEA1 with a small amount of hardware. Also, X × Y PE
When implementing the two-dimensional PE array device PEA1 configured by
The data transfer time between PEs in the horizontal direction is shortened, and as compared with the conventional two-dimensional PE array device PEA12 that allocates PEs in Ys in a zigzag pattern as shown in FIG.
The data transfer time between E becomes short.

【0090】上記実施の形態においては、縦方向の連想
メモリ11間でワードの転送が必要となるが、ワードに
直接データを読み書きできる連想メモリ11を使用して
いるので、上記転送の効率が向上される。この点から
も、2次元PEアレイ装置PEA1は、全体のデータ転
送時間を抑えることが可能である。また、2次元PEア
レイ装置PEA1の場合、ジグザグに割り付けるワード
の数、連想メモリ11の縦横の数q,rを任意に選択で
きるので、任意の数でPEを構成でき、2次元PEアレ
イ装置としての拡張性が高いといえる。
In the above embodiment, it is necessary to transfer words between the associative memories 11 in the vertical direction, but since the associative memory 11 capable of directly reading and writing data in the words is used, the transfer efficiency is improved. To be done. Also from this point, the two-dimensional PE array apparatus PEA1 can suppress the entire data transfer time. Further, in the case of the two-dimensional PE array device PEA1, since the number of words to be assigned in zigzag and the vertical and horizontal numbers q and r of the associative memory 11 can be arbitrarily selected, PEs can be configured by an arbitrary number and a two-dimensional PE array device Can be said to be highly expandable.

【0091】(実施の形態2)図8は、本発明の実施の
形態2における上位、下位境界ワード転送手順53を示
すフローチャートである。
(Second Embodiment) FIG. 8 is a flow chart showing an upper / lower boundary word transfer procedure 53 in the second embodiment of the present invention.

【0092】図9は、上記実施の形態2において、4隣
接における奇数連想メモリ群91の下位ワード群15の
1ワードを、偶数連想メモリ群92へ転送する例を示す
図である。なお、上記奇数連想メモリ群91、偶数連想
メモリ群92を構成する連想メモリは、連想メモリ11
(1,1) と同様のものである。
FIG. 9 is a diagram showing an example of transferring one word of the lower word group 15 of the odd-numbered associative memory group 91 at four adjacent locations to the even-numbered associative memory group 92 in the second embodiment. The associative memories forming the odd-numbered associative memory group 91 and the even-numbered associative memory group 92 are the associative memory 11
It is the same as (1,1) .

【0093】図10は、上記実施の形態2において、4
隣接における偶数連想メモリ群92の下位ワード群15
の1ワードを、奇数連想メモリ群91へ転送する例を示
す図である。
FIG. 10 shows that in the second embodiment, 4
Lower word group 15 of even associative memory group 92 adjacent to each other
FIG. 3 is a diagram showing an example in which one word of is transferred to an odd-numbered associative memory group 91.

【0094】図11は、上記実施の形態2において、4
隣接における奇数連想メモリ群91の上位ワード群13
の1ワードを、偶数連想メモリ群92へ転送する例を示
す図である。
FIG. 11 shows that in the second embodiment, 4
Upper word group 13 of odd-numbered associative memory group 91 adjacent to each other
FIG. 9 is a diagram showing an example in which one word of is transferred to an even associative memory group 92.

【0095】図12は、上記実施の形態2において、4
隣接における偶数連想メモリ群92の上位ワード群13
の1ワードを、奇数連想メモリ群91へ転送する例を示
す図である。
FIG. 12 shows that in the second embodiment, 4
Upper word group 13 of even associative memory group 92 adjacent to each other
FIG. 3 is a diagram showing an example in which one word of is transferred to an odd-numbered associative memory group 91.

【0096】図8に示すように、上位、下位境界ワード
転送手順(53)において、まず、奇数メモリ群91の
下位ワード群15に属する特定のワードの現状態フィー
ルドC32または42の全ビットを、対応する偶数メモ
リ群92の上位ワード群13のワードのU37(8隣接
の場合LU49、U410、RU411)へ転送する。
この場合、図9に示すように、データ転送の方向93に
示すデータ転送を、全て同時に行なう。これを下位ワー
ド群15の数だけ、順に繰り返す。
As shown in FIG. 8, in the upper / lower boundary word transfer procedure (53), first, all bits of the current state field C32 or 42 of a specific word belonging to the lower word group 15 of the odd memory group 91 are The data is transferred to U37 (LU49, U410, RU411 in the case of 8 adjacencies) of the word of the upper word group 13 of the corresponding even memory group 92.
In this case, as shown in FIG. 9, all the data transfers shown in the data transfer direction 93 are simultaneously performed. This is repeated in order for the number of lower word groups 15.

【0097】次に、偶数メモリ群92の下位ワード群1
5に属する特定のワードの現状態フィールドC32また
は42の全ビットを、対応する奇数メモリ群91の上位
ワード群13のワードのU37(8隣接の場合LU4
9、U410、RU411)へ転送する。この場合、図
10に示すように、データ転送の方向101に示したデ
ータ転送を、全て同時に行なう。この動作を、下位ワー
ド群15の数だけ順に繰り返す。
Next, the lower word group 1 of the even memory group 92
All the bits of the current state field C32 or 42 of the specific word belonging to 5 are assigned to U37 of the word of the upper word group 13 of the corresponding odd-numbered memory group 91 (LU4 in case of 8 adjacencies LU4
9, U410, RU411). In this case, as shown in FIG. 10, all the data transfers shown in the data transfer direction 101 are simultaneously performed. This operation is sequentially repeated for the number of lower word groups 15.

【0098】次に、奇数メモリ群91の上位ワード群1
3に属する特定のワードの現状態フィールドC32また
は42の全ビットを、対応する偶数メモリ群92の下位
ワード群15のワードのD35(8隣接の場合LD4
7、D46、RD45)へ転送する。この場合、図11
に示すように、データ転送の方向111に示したデータ
転送を、全て同時に行なう。これを上位ワード群13の
数だけ順に繰り返す。
Next, the upper word group 1 of the odd memory group 91
All bits of the current state field C32 or 42 of the specific word belonging to 3 are stored in D35 of the word of the lower word group 15 of the corresponding even memory group 92 (LD4 in the case of 8 adjacencies).
7, D46, RD45). In this case, FIG.
As shown in, all the data transfers shown in the data transfer direction 111 are simultaneously performed. This is repeated in order for the number of upper word groups 13.

【0099】次に、偶数メモリ群92の上位ワード群1
3に属する特定のワードの現状態フィールドC32また
は42の全ビットを、対応する奇数メモリ群91の下位
ワード群15のワードのD35(8隣接の場合LD4
7、D46、RD45)へ転送する。この場合、図12
に示すように、データ転送の方向121に示したデータ
転送を、全て同時に行なう。これを上位ワード群13の
数だけ順に繰り返す。
Next, the upper word group 1 of the even memory group 92
All the bits of the current state field C32 or 42 of the specific word belonging to 3 are set to D35 of the word of the lower word group 15 of the corresponding odd-numbered memory group 91 (LD4 in the case of 8 adjacencies).
7, D46, RD45). In this case, FIG.
As shown in, all the data transfers shown in the data transfer direction 121 are simultaneously performed. This is repeated in order for the number of upper word groups 13.

【0100】これらの手順によって、全ての上位、下位
境界ワード転送(53)が行なわれる。上記実施の形態
2においては、図9,図10,図11,図12に示した
矢印の数だけ、データ転送が並列に行なわれるので、図
1に示す2次元PEアレイ装置PEA1における逐次的
なデータ転送よりも、転送時間がさらに短くなる。
By these procedures, all upper and lower boundary word transfers (53) are performed. In the second embodiment, data transfer is performed in parallel by the number of arrows shown in FIGS. 9, 10, 11 and 12, so that the two-dimensional PE array device PEA1 shown in FIG. The transfer time is even shorter than the data transfer.

【0101】つまり、上記実施の形態2は、1次元に並
べられたw個(wは任意の自然数)のワードと、シフト
アップ、シフトダウン可能なヒットフラグレジスタと、
このヒットフラグレジスタの内容を外に出し入れする上
位シフト入出力と下位シフト入出力とを具備するq×r
個(q,rは2以上の任意の整数)の連想メモリにおい
て、縦方向q列に並べられた上記連想メモリのうちで、
奇数列の連想メモリ群から偶数列の連想メモリ群、また
は偶数列の連想メモリ群から奇数列の連想メモリ群への
データ転送を同時に行う段階と、横方向r行に並べられ
た全ての連想メモリに対して、上記データ転送を、同時
に行なう段階とを有するデータ転送方法である。
That is, in the second embodiment, w words (w is an arbitrary natural number) arranged in one dimension, a hit flag register capable of shifting up and shifting down,
Q × r having upper shift input / output and lower shift input / output for putting the contents of the hit flag register in and out.
In the associative memory of (where q and r are arbitrary integers of 2 or more), among the associative memories arranged in q columns in the vertical direction,
Simultaneous data transfer from the associative memory group of odd columns to the associative memory group of even columns, or from the associative memory group of even columns to the associative memory group of odd columns, and all the associative memories arranged in the horizontal direction r rows On the other hand, the data transfer method includes the step of simultaneously performing the data transfer.

【0102】このようなデータ転送方法を採用すること
によって、異なる連想メモリ11を、互いに独立して動
作させることができる。この性質を利用し、異なる連想
メモリ11間のデータ転送を行なう場合に、奇数列の連
想メモリ群91から偶数列の連想メモリ群92へのデー
タ転送、偶数列の連想メモリ群92から奇数列の連想メ
モリ群91へのデータ転送、または、横方向に並べられ
た全ての連想メモリのデータ転送を同時に行なうことが
でき、これによって、データ転送時間を短くすることが
できる。
By adopting such a data transfer method, different associative memories 11 can be operated independently of each other. Utilizing this property, when data is transferred between different associative memories 11, data transfer from the associative memory group 91 of odd columns to the associative memory group 92 of even columns, and associative memory group 92 of even columns may be performed. Data transfer to the associative memory group 91 or data transfer of all the associative memories arranged in the horizontal direction can be performed at the same time, whereby the data transfer time can be shortened.

【0103】(実施の形態3)図13は、本発明の実施
の形態3である2次元PEアレイ装置PEA3におい
て、連想メモリ11のワード24のPEへの割り付け方
法(4隣接の場合)を示す図である。
(Embodiment 3) FIG. 13 shows a method of allocating words 24 in the associative memory 11 to PEs in the two-dimensional PE array apparatus PEA3 according to Embodiment 3 of the present invention (in the case of 4 adjacencies). It is a figure.

【0104】図20は、連想メモリ11の1つのワード
24に2個のPEを割り付けた場合における2次元PE
アレイ装置の構成例を示す図である。
FIG. 20 shows a two-dimensional PE when two PEs are allocated to one word 24 of the associative memory 11.
It is a figure which shows the structural example of an array device.

【0105】図13に示すように、現状態フィールドC
132、次状態フィールドC+133、右PE状態フィ
ールドR134、下PE状態フィールドD135、左P
E状態フィールドL136、上PE状態フィールドU1
37によって構成されるPE131を、ビット数の許す
限りJ個(Jは任意の2以上の自然数)、1つの連想メ
モリの1ワード24に割り付ける。
As shown in FIG. 13, the current state field C
132, next state field C + 133, right PE state field R134, lower PE state field D135, left P
E state field L136, upper PE state field U1
The PE 131 constituted by 37 is allocated to J (J is an arbitrary natural number of 2 or more) one word 24 of one associative memory as long as the number of bits allows.

【0106】この場合、Jを2とすると、図20に示す
ように、1つのワードa1に、上位のPE a2と下位
のPE a3との2つのPEを割り付け、縦方向X=m
×2×q個、横方向Y=n×r個のPEを搭載した2次
元PEアレイ装置を実現することができる。ただし、こ
の場合、上位のPE a2の下PE状態フィールドD1
35のデータと、下位のPE a3の上PE状態フィー
ルドU137のデータとは、同一ワード上に存在するの
で、それぞれの状態フィールドは設けない。
In this case, assuming that J is 2, as shown in FIG. 20, two PEs of the upper PE a2 and the lower PE a3 are allocated to one word a1, and the vertical direction X = m.
It is possible to realize a two-dimensional PE array device having × 2 × q PEs and Y = n × r PEs in the horizontal direction. However, in this case, the lower PE status field D1 of the upper PE a2
Since the data of No. 35 and the data of the upper PE status field U137 of the lower PE a3 exist on the same word, each status field is not provided.

【0107】8隣接、24隣接の場合も、上記と同様
に、連想メモリのワードの割り付けが行なわれる。これ
によって、同じ連想メモリの数で、より多くのPEを実
現できるので、ハード量の少ない2次元PEアレイ装置
を実現できる。
In the case of 8-adjacent and 24-adjacent as well, words are allocated in the associative memory in the same manner as described above. As a result, a larger number of PEs can be realized with the same number of associative memories, so that a two-dimensional PE array device with a small amount of hardware can be realized.

【0108】次に、図21により2次元PEアレイ装置
PEA3を用いて種々の処理を行なう全体の処理手順に
ついて説明する。
Next, the overall processing procedure for performing various processes using the two-dimensional PE array device PEA3 will be described with reference to FIG.

【0109】上記処理手順は、図6に示す内部ワード転
送(52)と、上位、下位境界ワード転送(53)とを
除いて、図6に示す手順と同じ手順で行なわれる。
The above processing procedure is the same as the procedure shown in FIG. 6, except for the internal word transfer (52) shown in FIG. 6 and the upper and lower boundary word transfers (53).

【0110】内部ワード転送(52)は、上位PE a
2の内部ワード転送b1と、下位PE a3の内部ワー
ド転送B2とに分けて行なわれる。
The internal word transfer (52) is performed by the upper PE a.
The internal word transfer b1 of 2 and the internal word transfer B2 of the lower PE a3 are performed separately.

【0111】上位PE a2の内部ワード転送b1で
は、マスクレジスタ22にC32の特定ビット以外をマ
スクするデータを設定し「1」で検索を行なうことによ
って、ヒットフラグレジスタ27へC32の特定ビット
の内容を転送する。次に、ヒットフラグレジスタ27を
m回シフトダウンし、L36の対応ビットで、ヒットフ
ラグレジスタ27が「1」のワードに「1」を並列部分
書き込みする。上記手順によって、右PEへのビット転
送が行なえる。
In the internal word transfer b1 of the upper PE a2, the mask register 22 is set with data for masking a bit other than the specific bit of C32, and a search is performed with "1" to set the contents of the specific bit of C32 in the hit flag register 27. To transfer. Next, the hit flag register 27 is shifted down m times, and "1" is written in parallel to the word of which the hit flag register 27 is "1" by the corresponding bit of L36. Bit transfer to the right PE can be performed by the above procedure.

【0112】次に、マスクレジスタ22にC32の特定
ビット以外をマスクするデータを再度設定し、「1」で
検索を行なうことによって、ヒットフラグレジスタ27
へC32の特定ビットの内容を転送し、ヒットフラグレ
ジスタ27を1回シフトアップする。そして、D35の
対応ビットで、ヒットフラグレジスタ27が「1」のワ
ードに「1」を並列部分書き込みする。上記手順によっ
て、上記PE a2へのビット転送が行なえる。
Next, the mask flag 22 is set again with data for masking other than the specific bit of C32, and a search is performed with "1", whereby the hit flag register 27
The contents of the specific bit of C32 are transferred to and the hit flag register 27 is shifted up once. Then, at the corresponding bit of D35, the hit flag register 27 partially writes "1" in the word "1" in parallel. By the above procedure, bit transfer to the PE a2 can be performed.

【0113】次に、ヒットフラグレジスタ27をm−1
回シフトアップし、R34の対応ビットで、ヒットフラ
グレジスタ27が「1」のワードに、「1」を並列部分
書き込みする。この手順によって、左PEへのビット転
送が行なえる。上記手順をC32のビット数分繰り返
す。これらの手順によって、上記PE a1の4隣接内
部ワード転送b1が全て行なえる。
Next, the hit flag register 27 is set to m-1.
The number of shifts is increased, and the hit flag register 27 writes "1" in parallel to the word of "1" by the corresponding bit of R34. By this procedure, bit transfer to the left PE can be performed. The above procedure is repeated for the number of bits of C32. By these procedures, the 4-adjacent internal word transfer b1 of the PE a1 can be all performed.

【0114】下位PE a3の内部ワード転送b2で
は、マスクレジスタ22にC32の特定ビット以外をマ
スクするデータを設定し、「1」で検索を行なうことに
よって、ヒットフラグレジスタ27へC32の特定ビッ
トの内容を転送し、ヒットフラグレジスタ27を1回シ
フトダウンする。そして、U37の対応ビットで、ヒッ
トフラグレジスタ27が「1」のワードに、「1」を並
列部分書き込みする。上記手順によって、下位PEへの
ビット転送が行なえる。
In the internal word transfer b2 of the lower PE a3, the mask register 22 is set with data for masking a bit other than the specific bit of C32, and a search is performed with "1". The contents are transferred and the hit flag register 27 is downshifted once. Then, with the corresponding bit of U37, the hit flag register 27 writes "1" in parallel to the word of "1". Bits can be transferred to the lower PE by the above procedure.

【0115】次に、ヒットフラグレジスタ27をm−1
回シフトダウンし、L36の対応ビットで、ヒットフラ
グレジスタ27が「1」のワードに、「1」を並列部分
書き込みする。上記手順によって、右PEへのビット転
送が行なえる。
Next, the hit flag register 27 is set to m-1.
Downshifting is performed twice, and the hit flag register 27 partially writes "1" in parallel to the word of "1" at the corresponding bit of L36. Bit transfer to the right PE can be performed by the above procedure.

【0116】次に、マスクレジスタ22にC32の特定
ビット以外をマスクするデータを再度設定し、「1」で
検索を行なうことによって、ヒットフラグレジスタ27
へC32の特定ビットの内容を転送し、ヒットフラグレ
ジスタ27をm回シフトアップする。そして、R34の
対応ビットで、ヒットフラグレジスタ27が「1」のワ
ードに、「1」を並列部分書き込みする。上記手順によ
って左PEへのビット転送が行なえる。これらの得順を
C32のビット数分繰り返す。以上の手順によって、下
位PE a3の4隣接内部ワード転送b2が全て行なえ
る。
Next, the mask flag 22 is set again with data for masking other than the specific bit of C32, and a search is performed with "1".
The contents of the specific bit of C32 are transferred to and the hit flag register 27 is shifted up m times. Then, with the corresponding bit of R34, the hit flag register 27 writes "1" in parallel to the word of "1". Bit transfer to the left PE can be performed by the above procedure. These acquisition orders are repeated for the number of bits of C32. By the above procedure, the 4-adjacent internal word transfer b2 of the lower PE a3 can be all performed.

【0117】次に、上位、下位境界ワード転送手順(5
3)について説明する。
Next, the upper / lower boundary word transfer procedure (5
3) will be described.

【0118】上位、下位境界ワード転送53は、図8に
示す手順と同様に、奇数連想メモリ群91の下位ワード
群15の特定の1ワードを、偶数連想メモリ群92へ転
送し、偶数連想メモリ群92の下位ワード群15の特定
の1ワードを、奇数連想メモリ群91へ転送し、奇数連
想メモリ群91の上位ワード群13の特定の1ワード
を、偶数連想メモリ群92へ転送し、偶数連想メモリ群
92の上位ワード群13の特定の1ワードを、奇数連想
メモリ群91へ転送し、それぞれを上位、下位ワード群
のワードの数だけ繰り返すことによって転送が行われ
る。
The upper / lower boundary word transfer 53 transfers a specific one word of the lower word group 15 of the odd associative memory group 91 to the even associative memory group 92 in the same manner as the procedure shown in FIG. A specific 1 word of the lower word group 15 of the group 92 is transferred to the odd associative memory group 91, a specific 1 word of the upper word group 13 of the odd associative memory group 91 is transferred to the even associative memory group 92, and an even number A specific one word of the upper word group 13 of the associative memory group 92 is transferred to the odd associative memory group 91, and each of them is repeated by the number of words in the upper and lower word groups to perform the transfer.

【0119】ただし、たとえば、図20に示した連想メ
モリ11の1つのワード24に2個のPEを割り付けた
場合、上位ワード群13から下位ワード群15へのワー
ド転送を行なう際は、下位PE a3のワードのみ転送
を行ない、一方、下位ワード群15から上位ワード群1
3へのワード転送を行なう際は、上位PE a2のワー
ドのみ転送を行なう。以上の手順によって、全ての上
位、下位境界ワード転送53が行なえる。
However, for example, when two PEs are assigned to one word 24 of the associative memory 11 shown in FIG. 20, when the word transfer from the upper word group 13 to the lower word group 15 is performed, the lower PE Only the word a3 is transferred, while the lower word group 15 to the upper word group 1 are transferred.
When word transfer to 3 is performed, only the word of the upper PE a2 is transferred. By the above procedure, all upper and lower boundary word transfers 53 can be performed.

【0120】図13は、2次元PEアレイ装置PEA3
における連想メモリ11のワード24のPEへの割り付
け方法(4隣接の場合)を示す図である。
FIG. 13 shows a two-dimensional PE array device PEA3.
FIG. 9 is a diagram showing a method of allocating words 24 of the associative memory 11 to PEs in the case of (4 adjacent).

【0121】図13に示すように、現状態フィールドC
132、次状態フィールドC+133、右PE状態フィ
ールドR134、下PE状態フィールドD135、左P
E状態フィールドL136、上PE状態フィールドU1
37によって構成されるPE131を、ビット数の許す
限り、J個(Jは2以上の任意の自然数)、連想メモリ
の1ワード24に割り付ける。8隣接、24隣接の場合
も、同様に、連想メモリのワードの割り付けを行なうこ
とができる。これによって、同じ連想メモリの数で、よ
り多くのPEを実現できるので、ハード量の少ない2次
元PEアレイ装置を実現することが可能である。
As shown in FIG. 13, the current state field C
132, next state field C + 133, right PE state field R134, lower PE state field D135, left P
E state field L136, upper PE state field U1
The PE 131 constituted by 37 is allocated to J words (J is an arbitrary natural number of 2 or more) to one word 24 of the associative memory as long as the number of bits allows. Words in the associative memory can be similarly allocated also in the case of 8-adjacent and 24-adjacent. As a result, more PEs can be realized with the same number of associative memories, so that it is possible to realize a two-dimensional PE array device with a small amount of hardware.

【0122】ここで、連想メモリの1つのワードに複数
PEを割りつける場合の(内部ワード)転送方法は、上
記のとおりである。
Here, the (internal word) transfer method when a plurality of PEs are assigned to one word in the associative memory is as described above.

【0123】2次元PEアレイ装置PEA3は、連想メ
モリの1つのワード24に複数のPEが割り付けられ、
この内の1つのPE131に、自分のPEの現状態フィ
ールドと、上記自分のPEの次状態フィールドと、隣接
PEの各状態フィールドとを保有している2次元PEア
レイ装置である。このように連想メモリの1つのワード
24に複数のPEを割り付けていることによって、同じ
連想メモリの数でより多くのPEを実現できるので、ハ
ード量の少ない2次元PEアレイ装置を実現することが
可能である。
In the two-dimensional PE array device PEA3, a plurality of PEs are allocated to one word 24 of the associative memory,
One of these PEs 131 is a two-dimensional PE array device in which the current state field of its own PE, the next state field of its own PE, and the state fields of adjacent PEs are held. By allocating a plurality of PEs to one word 24 of the associative memory as described above, more PEs can be realized with the same number of associative memories, so that it is possible to realize a two-dimensional PE array device with a small amount of hardware. It is possible.

【0124】(実施の形態4)次に、連想メモリ11と
して、2次元PEアレイ装置PEA1の機能に加えて、
アドレスを用いたワード24へのデータ書き込み、読み
出しと、シフトアップ、シフトダウン動作とを同時に実
行できるモードを有する連想メモリを用いて、2次元P
Eアレイ装置を構成した実施の形態4である連想メモリ
について説明する。
(Embodiment 4) Next, as an associative memory 11, in addition to the function of the two-dimensional PE array device PEA1,
A two-dimensional P is used by using an associative memory having a mode in which data writing / reading to / from a word 24 using an address and a shift-up / shift-down operation can be simultaneously performed.
The associative memory according to the fourth embodiment which constitutes the E array device will be described.

【0125】実施の形態4である連想メモリは、アドレ
スを用いたワード24へのデータ書き込み読み出しと、
ヒットフラグレジスタのシフトモードとを実行する連想
メモリにおいて、上記アドレスを用いたワードへのデー
タ書き込み読み出しと、上記ヒットフラグレジスタのシ
フトモードとを同時に行なうモードを有する連想メモリ
である。
The associative memory according to the fourth embodiment has a function of writing / reading data to / from a word 24 using an address,
In the associative memory that executes the shift mode of the hit flag register, the associative memory has a mode in which data writing / reading to / from a word using the address and a shift mode of the hit flag register are simultaneously performed.

【0126】図14は、右、下、左、上の4隣接のPE
に対するデータ転送機能を有する2次元PEアレイ装置
を実現するための連想メモリのワードの割り付け法を示
す図である。
FIG. 14 shows four adjacent PEs on the right, bottom, left, and top.
FIG. 3 is a diagram showing a word allocation method of an associative memory for realizing a two-dimensional PE array device having a data transfer function for.

【0127】図14に示すように、1つのPE141
は、現状態フィールドC142、次状態フィールドC+
143、右PE状態フィールドR144、下PE状態フ
ィールドD145、左PE状態フィールドL146、上
PE状態フィールドU147、ワード種類識別フィール
ドI148によって構成される。
As shown in FIG. 14, one PE 141
Indicates the current state field C142 and the next state field C +
143, a right PE status field R144, a lower PE status field D145, a left PE status field L146, an upper PE status field U147, and a word type identification field I148.

【0128】PE141を連想メモリ11の1つのワー
ド24に、ビット数の許す限り、J個(Jは2以上の任
意の自然数)割り付ける。ワークフィールドW149
は、現状態フィールドC142、隣接PEのデータを用
い、種々の演算を行なう際のテンポラリ領域として用い
る。
PE 141 is allocated to one word 24 of the associative memory 11 by J (J is an arbitrary natural number of 2 or more) as long as the number of bits allows. Work field W149
Is used as a temporary area when various operations are performed using the data of the current state field C142 and the adjacent PE.

【0129】図15は、右、右下、下、左下、左、左
上、上、右上の8隣接のPEに対するデータ転送機能を
有する2次元PEアレイ装置を実現するための連想メモ
リのワード24の割り付け法を示した図である。
FIG. 15 shows a word 24 of the associative memory for realizing a two-dimensional PE array device having a data transfer function for eight adjacent PEs of right, lower right, lower, lower left, left, upper left, upper and upper right. It is the figure which showed the allocation method.

【0130】図15に示すように、1つのPE151
は、現状態フィールドC152、次状態フィールドC+
153、右PE状態フィールドR154、右下PE状態
フィールドRD155、下PE状態フィールドD15
6、左下PE状態フィールドLD157、左PE状態フ
ィールドL158、左上PE状態フィールドLU15
9、上PE状態フィールドU1510、右上PE状態フ
ィールドRU1511、ワード種類識別フィールドI1
512によって構成される。PE151を、連想メモリ
11の1つのワード24に、ビット数の許す限り、J個
(Jは任意の自然数)割り付ける。ワークフィールドW
1513は、現状態フィールドC152、隣接PEのデ
ータを用いて種々の演算を行なう際のテンポラリ領域と
して用いる。
As shown in FIG. 15, one PE 151 is used.
Indicates a current state field C152 and a next state field C +
153, right PE status field R154, lower right PE status field RD155, lower PE status field D15
6, lower left PE status field LD157, left PE status field L158, upper left PE status field LU15
9, upper PE status field U1510, upper right PE status field RU1511, word type identification field I1
512. PE 151 is allocated to one word 24 of the associative memory 11 by J (J is an arbitrary natural number) as long as the number of bits allows. Work field W
Reference numeral 1513 is used as a temporary area when various operations are performed using the data of the current state field C152 and the adjacent PE.

【0131】図16は、ワード種類識別フィールドI1
48または1512を示す図である。
FIG. 16 shows the word type identification field I1.
It is a figure which shows 48 or 1512.

【0132】ワード種類識別フィールドI148または
1512は、上位境界ワード識別子161、内部状態ワ
ード識別子162、下位境界ワード識別子163の3ビ
ットで構成されている。電源投入時に、ワードが上位境
界ワード群13に属する場合、上位境界ワード識別子1
61のみが「1」で残りは「0」に設定され、ワードが
内部ワード群14に属する場合、内部状態ワード識別子
162のみが「1」で残りは「0」に設定され、ワード
が下位境界ワード群15に属する場合、下位境界ワード
識別子163のみが「1」で残りは「0」に設定され
る。
The word type identification field I 148 or 1512 is composed of 3 bits of an upper boundary word identifier 161, an internal state word identifier 162, and a lower boundary word identifier 163. At power-on, if a word belongs to upper boundary word group 13, upper boundary word identifier 1
When only 61 is “1” and the rest is set to “0”, and the word belongs to the internal word group 14, only the internal state word identifier 162 is set to “1” and the rest is set to “0”, and the word is lower boundary. When belonging to the word group 15, only the lower boundary word identifier 163 is set to "1" and the rest are set to "0".

【0133】図17は、上記に示した構成をとる2次元
PEアレイ装置を用いて種々の処理を行なう全体の処理
手順を示した図である。
FIG. 17 is a diagram showing an overall processing procedure for performing various kinds of processing using the two-dimensional PE array device having the above-mentioned configuration.

【0134】隣接PEへのデータ転送173以外は、図
6に示した方法と同様に行なう。
Except for the data transfer 173 to the adjacent PE, the method is the same as that shown in FIG.

【0135】図18は、隣接PEへのデータ転送173
のうち内部ワード転送171に関する4隣接内部ワード
転送手順を示す図である。
FIG. 18 shows the data transfer 173 to the adjacent PE.
It is a figure which shows the 4 adjacent internal word transfer procedure regarding the internal word transfer 171 among these.

【0136】図19は、隣接PEへのデータ転送173
のうち内部ワード転送171に関する8隣接内部ワード
転送手順を示す図である。
FIG. 19 shows the data transfer 173 to the adjacent PE.
8 is a diagram showing an 8-adjacent internal word transfer procedure regarding an internal word transfer 171 in FIG.

【0137】図18に示すように、4隣接内部ワード転
送171は、下、右PEへのビット転送181と、上、
左PEへのビット転送182との2段階で行なう。下、
右PEへのビット転送181では、まず、マスクレジス
タ22にC142の特定ビット以外をマスクするデータ
を設定し、「1」で検索を行なうことによって、ヒット
フラグレジスタ27へ、C142の特定ビットの内容を
転送する。
As shown in FIG. 18, the 4-adjacent internal word transfer 171 includes the bit transfer 181 to the lower PE and the upper bit to the right PE.
It is carried out in two steps including the bit transfer 182 to the left PE. under,
In the bit transfer 181 to the right PE, first, data for masking other than the specific bit of C142 is set in the mask register 22 and a search is performed with "1", so that the content of the specific bit of C142 is stored in the hit flag register 27. To transfer.

【0138】次に、ヒットフラグレジスタ27を1回シ
フトダウンし、U147の対応ビットでかつ上位境界ワ
ード群13に属さず、ヒットフラグレジスタ27が
「1」のワードに「1」を並列部分書き込みする。
Next, the hit flag register 27 is downshifted once, and the corresponding bit of U147 and which does not belong to the upper boundary word group 13 and the hit flag register 27 writes "1" in the partial parallel writing to the word of "1". To do.

【0139】上位境界ワード群13に属すか否かは、ワ
ード種類識別フィールドI148を検索して調べる。上
記の手順によって下PEへのビット転送が行なわれる。
次に、ヒットフラグレジスタ27をm−1回シフトダウ
ンし、L146の対応ビットで、ヒットフラグレジスタ
27が「1」のワードに「1」を並列部分書き込みす
る。上記手順によって、右PEへのビット転送が行なわ
れる。
Whether or not it belongs to the upper boundary word group 13 is searched by searching the word type identification field I148. Bit transfer to the lower PE is performed by the above procedure.
Next, the hit flag register 27 is shifted down by m-1 times, and "1" is written in parallel to the word of "1" by the hit flag register 27 by the corresponding bit of L146. By the above procedure, bit transfer to the right PE is performed.

【0140】上、左PEへのビット転送182では、ま
ず、マスクレジスタ22にC142の特定ビット以外を
マスクするデータを設定し、「1」で検索を行なうこと
によって、ヒットフラグレジスタ27へC142の特定
ビットの内容を転送する。次に、ヒットフラグレジスタ
27を1回シフトアップし、D145の対応ビットでか
つ下位境界ワード群15に属さず、ヒットフラグレジス
タ27が「1」のワードに「1」を並列部分書き込みす
る。下位境界ワード群15に属すか否かは、ワード種類
識別フィールドI148を検索して調べる。上記手順に
よって、上PEへのビット転送が行なわれる。
In the bit transfer 182 to the left PE, first, data for masking other than the specific bits of C142 is set in the mask register 22 and a search is performed with "1" to set the C142 in the hit flag register 27. Transfer the contents of a specific bit. Next, the hit flag register 27 is shifted up once, and "1" is written in parallel to the word corresponding to D145 and not belonging to the lower boundary word group 15 and the hit flag register 27 is "1". Whether the word belongs to the lower boundary word group 15 is searched by searching the word type identification field I148. By the above procedure, the bit transfer to the upper PE is performed.

【0141】次に、ヒットフラグレジスタ27をm−1
回シフトアップし、R144の対応ビットで、ヒットフ
ラグレジスタ27が、「1」のワードに「1」を並列部
分書き込みする。上記手順によって、左PEへのビット
転送が行なわれる。
Next, the hit flag register 27 is set to m-1.
After shifting up, the hit flag register 27 partially writes "1" in parallel to the word "1" with the corresponding bit of R144. By the above procedure, bit transfer to the left PE is performed.

【0142】上記手順をC142のビット数分繰り返
し、さらに、1ワードに複数のPEを割り付けた場合、
上記手順をその数だけ繰り返す。以上の手順によって、
4隣接内部ワード転送が全て行なわれる。
When the above procedure is repeated for the number of bits of C142 and a plurality of PEs are assigned to one word,
Repeat the above procedure for that number of times. By the above procedure,
All four adjacent internal word transfers are performed.

【0143】図19に示すように、8隣接内部ワード転
送は、下、右上、右、右下PEへのビット転送191
と、上、左下、左、左上PEへのビット転送192との
2段階で行なう。
As shown in FIG. 19, the 8-adjacent internal word transfer is a bit transfer 191 to the lower, upper right, right and lower right PEs.
And bit transfer 192 to upper, lower left, left, upper left PE.

【0144】下、右上、右、右下PEへのビット転送1
91では、まず、マスクレジスタ22にC152の特定
ビット以外をマスクするデータを設定し、「1」で検索
を行なうことによって、ヒットフラグレジスタ27へC
152の特定ビットの内容を転送し、ヒットフラグレジ
スタ27を1回シフトダウンする。次に、U1510の
対応ビットでかつ上位境界ワード群13以外で、ヒット
フラグレジスタ27が「1」のワードに、「1」を並列
部分書き込みする。上位境界ワード群13に属すか否か
は、ワード種類識別フィールドI1512を検索して調
べる。上記手順によって、下PEへのビット転送が行な
われる。
Bit transfer to bottom, top right, right, bottom right PE 1
In 91, first, the mask register 22 is set with data for masking other than a specific bit of C152, and a search is performed with "1", so that the hit flag register 27 is C-filled.
The contents of the specific bit of 152 are transferred, and the hit flag register 27 is downshifted once. Next, except for the upper boundary word group 13 corresponding to U1510, the hit flag register 27 partially writes "1" in parallel to the word of "1". Whether or not it belongs to the upper boundary word group 13 is searched by searching the word type identification field I1512. By the above procedure, the bit transfer to the lower PE is performed.

【0145】次に、ヒットフラグレジスタ27をm−2
回シフトダウンし、LD157の対応ビットで、ヒット
フラグレジスタ27が、「1」のワードに「1」を並列
部分書き込みする。上記手順によって、右上PEへのビ
ット転送が行なわれる。
Next, the hit flag register 27 is set to m-2.
Downshifting is performed twice, and the hit flag register 27 writes "1" in parallel to the word of "1" by the corresponding bit of the LD 157. Bit transfer to the upper right PE is performed by the above procedure.

【0146】次に、ヒットフラグレジスタ27を1回シ
フトダウンし、L158の対応ビットで、ヒットフラグ
レジスタ27が、「1」のワードに「1」を並列部分書
き込みする。上記手順によって、右PEへのビット転送
が行なわれる。
Next, the hit flag register 27 is shifted down once, and the hit flag register 27 writes "1" in parallel to the word "1" at the corresponding bit of L158. By the above procedure, bit transfer to the right PE is performed.

【0147】次に、ヒットフラグレジスタ27を1回シ
フトダウンし、LU159の対応ビットでかつ上位境界
ワード群13に属さず、ヒットフラグレジスタ27が
「1」のワードに、「1」を並列部分書き込みする。上
位境界ワード群13に属するか否かは、ワード種類識別
フィールドI1512を検索して調べる。上記手順によ
って、右下PEへのビット転送が行なわれる。
Next, the hit flag register 27 is shifted down once, and the corresponding bit of the LU 159 does not belong to the upper boundary word group 13, and the hit flag register 27 is "1" in the word "1" in parallel part. To write. Whether or not it belongs to the upper boundary word group 13 is searched by searching the word type identification field I1512. By the above procedure, the bit transfer to the lower right PE is performed.

【0148】上、左下、左、左上PEへのビット転送1
92では、まず、マスクレジスタ22にC152の特定
ビット以外をマスクするデータを設定し、「1」で検索
を行なうことによって、ヒットフラグレジスタ27へC
42の特定ビットの内容を転送する。
Bit transfer to upper, lower left, left, upper left PE 1
In 92, first, data for masking other than the specific bit of C152 is set in the mask register 22, and a search is performed with "1", so that C is set in the hit flag register 27.
Transfer the contents of 42 specific bits.

【0149】次に、ヒットフラグレジスタ27を1回シ
フトアップし、D156の対応ビットでかつ下位境界ワ
ード群15に属さず、ヒットフラグレジスタ27が
「1」のワードに、「1」を並列部分書き込みする。上
位境界ワード群13に属するか否かは、ワード種類識別
フィールドI1512を検索して調べる。上記手順によ
って、上PEへのビット転送が行なわれる。
Next, the hit flag register 27 is shifted up once, the corresponding bit of D156 and not belonging to the lower boundary word group 15, and the hit flag register 27 is "1" in the word "1" in parallel part. To write. Whether or not it belongs to the upper boundary word group 13 is searched by searching the word type identification field I1512. By the above procedure, the bit transfer to the upper PE is performed.

【0150】次に、ヒットフラグレジスタ27をm−2
回シフトアップし、RU1511の対応ビットで、ヒッ
トフラグレジスタ27が「1」のワードに、「1」を並
列部分書き込みする。上記手順によって、左下PEへの
ビット転送が行なわれる。
Next, the hit flag register 27 is set to m-2.
The number of shifts is increased, and the hit flag register 27 writes "1" in parallel to the word of "1" by the corresponding bit of the RU 1511. By the above procedure, bit transfer to the lower left PE is performed.

【0151】次に、ヒットフラグレジスタ27を1回シ
フトアップし、R154の対応ビットで、ヒットフラグ
レジスタ27が「1」のワードに「1」を並列部分書き
込みする。上記手順によって左PEへのビット転送が行
なわれる。
Next, the hit flag register 27 is shifted up once, and "1" is written in parallel to the word of which the hit flag register 27 is "1" by the corresponding bit of R154. Bit transfer to the left PE is performed by the above procedure.

【0152】次に、ヒットフラグレジスタ27を1回シ
フトアップし、RD155の対応ビットでかつ下位境界
ワード群15に属さず、ヒットフラグレジスタ27が
「1」のワードに、「1」を並列部分書き込みする。上
記境界ワード群13に属するか否かは、ワード種類識別
フィールドI1512を検索して調べる。上記手順によ
って、左上PEへのビット転送が行なわれる。
Next, the hit flag register 27 is shifted up once, and the corresponding bit of the RD 155 does not belong to the lower boundary word group 15 and the hit flag register 27 is "1". To write. Whether it belongs to the boundary word group 13 is searched by searching the word type identification field I1512. By the above procedure, bit transfer to the upper left PE is performed.

【0153】上記手順をC152のビット数分繰り返
し、さらに、1ワードに複数のPEを割り付けた場合
は、上記手順をその数だけ繰り返す。以上の手順によっ
て、8隣接内部ワード転送が全て行なわれる。
The above procedure is repeated for the number of bits of C152, and when a plurality of PEs are assigned to one word, the above procedure is repeated for that number of times. Through the above procedure, all 8-adjacent internal word transfers are performed.

【0154】24隣接内部ワード転送、またはそれ以上
の場合も、上記した4隣接、8隣接内部ワード転送と同
様の手順で行なわれる。
In the case of 24-adjacent internal word transfer or more, the same procedure as the above-mentioned 4-adjacent or 8-adjacent internal word transfer is performed.

【0155】上位、下位境界ワード転送172手順は、
上記各実施の形態に示した方法と同様に行なう。
The upper and lower boundary word transfer 172 procedure is as follows:
The method is the same as the method described in each of the above embodiments.

【0156】次に、内部ワード転送171と上位、下位
境界ワード転送172をどの様な手順で行なうかについ
て説明する。
Next, the procedure of the internal word transfer 171 and the upper / lower boundary word transfer 172 will be described.

【0157】上記した内部ワード転送手順171の中
で、シフトダウン、シフトアップ動作を行なっている期
間、上位、下位境界ワード転送172も同様に行なう。
ヒットフラグレジスタのシフトモード(内部ワード転送
171で利用)と、アドレスを用いたワードへのデータ
書き込み、読み出し(上位、下位境界ワード転送172
で利用)とを同時に実行できるモードを有する連想メモ
リを用いることによって、上記のように、内部ワード転
送171と、上位、下位境界ワード転送172を同時に
行なうことができる。
In the internal word transfer procedure 171, the upper and lower boundary word transfers 172 are similarly performed during the shift down and shift up operations.
Hit flag register shift mode (used for internal word transfer 171) and data writing / reading to / from a word using an address (upper / lower boundary word transfer 172)
As described above, the internal word transfer 171 and the upper and lower boundary word transfers 172 can be performed at the same time by using the associative memory having a mode capable of simultaneously executing (1.

【0158】また、上記の内部ワード転送171で示し
たように、内部ワード転送171時に、たとえば上位境
界ワード群13のU147等に、対応しないデータが書
き込まれることがないようにしているので、内部ワード
転送171と、上位、下位境界ワード転送172とを同
時に行なうことによって、正しいデータが上書きされる
等の問題は生じない。
Further, as shown in the internal word transfer 171, the internal word transfer 171 is prevented from being written with uncorresponding data, for example, in U147 or the like of the upper boundary word group 13. By performing the word transfer 171 and the upper / lower boundary word transfer 172 at the same time, a problem such as overwriting with correct data does not occur.

【0159】また、内部ワード転送171と上位、下位
境界ワード転送172とを同時に行なえるので、(請求
項1の実施の形態に示した)内部ワード転送171と上
位、下位境界ワード転送172とを順番に行なう方法と
比較すると、短い転送時間が短くなる。
Further, since the internal word transfer 171 and the upper / lower boundary word transfer 172 can be performed at the same time, the internal word transfer 171 (shown in the embodiment of claim 1) and the upper / lower boundary word transfer 172 are performed. Compared with the sequential method, the short transfer time becomes short.

【0160】つまり、アドレスを用いたワードへのデー
タ書き込み、読みだしとヒットフラグレジスタのシフト
モードとが同時に行えるモードを有する連想メモリを用
いるから、図17で示すデータ転送可能である171と
172とを、同時に実行できる。
That is, since the associative memory having a mode in which the data writing / reading to / from the word using the address and the shift mode of the hit flag register can be performed at the same time is used, the data transfer shown in FIG. 17 can be performed 171 and 172. Can be performed simultaneously.

【0161】上記のように、アドレスを用いたワードへ
のデータ書き込み、読み出しとヒットフラグレジスタの
シフトモードが同時に動作させることによって、上記の
横方法のPE間のデータ転送時間と、上記の縦方向の連
想メモリ間のワードの転送とを同時に行なうことが可能
になり、データ転送時間を抑えることが可能である。こ
の場合、上記シフトモードは、双方向の場合、一方向の
場合の両者に適用できる。
As described above, the data transfer time between PEs in the horizontal method described above and the vertical direction described above are obtained by simultaneously operating the data writing / reading in the word using the address and the shift mode of the hit flag register. It is possible to simultaneously transfer the words between the associative memories of (1) and (2), and it is possible to suppress the data transfer time. In this case, the shift mode can be applied to both bidirectional and unidirectional cases.

【0162】(実施の形態5)図22は、本発明の他の
実施の形態であるモルフォロジー演算処理を実行する2
次元PEアレイ装置MS1の基本構成を示す図である。
(Fifth Embodiment) FIG. 22 shows a second embodiment for executing a morphology operation process according to another embodiment of the present invention.
It is a figure which shows the basic composition of three-dimensional PE array apparatus MS1.

【0163】2次元PEアレイ装置MS1は、連想メモ
リアレイ部17と制御部18とで構成されている。連想
メモリアレイ部17は、q×r個(q,rは2以上の任
意の整数)の2次元配列された連想メモリ11で構成さ
れている。
The two-dimensional PE array device MS1 is composed of an associative memory array section 17 and a control section 18. The associative memory array unit 17 is composed of q × r associative memories 11 that are two-dimensionally arranged (q and r are arbitrary integers of 2 or more).

【0164】2次元PEアレイ装置MS1を構成する連
想メモリ11は、基本的には、図2に示す連想メモリ1
(1,1) と同じであり、w個(wは任意の自然数)のワ
ード24と、アドレスデコーダ25と、シフトアップ、
シフトダウン可能なヒットフラグレジスタ27と、この
ヒットフラグレジスタ27の内容を外に出し入れする上
位シフト入出力26と、下位シフト入出力29等とを具
備するものである。なお、2次元PEアレイ装置MS1
で使用されている連想メモリ11におけるワード24
は、原画像フィールドと処理画像フィールドとシフト画
像フィールドとを有する1次元に並べられたワードであ
る。
The associative memory 11 constituting the two-dimensional PE array device MS1 is basically the associative memory 1 shown in FIG.
1 (1,1) , which is w (where w is any natural number) word 24, address decoder 25, shift up,
It is provided with a hit flag register 27 capable of shifting down, an upper shift input / output 26 for putting the contents of the hit flag register 27 in and out, a lower shift input / output 29 and the like. Two-dimensional PE array device MS1
24 in the associative memory 11 used in
Is a one-dimensionally arranged word having an original image field, a processed image field and a shifted image field.

【0165】また、図2において説明したマスク検索機
能と並列部分書き込み機能とを用いることによって、全
ワード24に対して、並列に、モルフォロジー演算処理
に必要な、加減算、比較演算、論理和演算を含む、任意
の論理、算術演算を実行することが可能である。この具
体的な手順に関しては、「小倉,長沼,“連想プロセッ
サ上での局所表現型ニューラルネットワークのハードウ
ェアアルゴリズムとその評価”,信学技報CPSY81
−44,1991」等に開示されている。
Further, by using the mask search function and the parallel partial write function described with reference to FIG. 2, all words 24 can be subjected to addition / subtraction, comparison operation, and logical sum operation necessary for morphological operation processing in parallel. It is possible to execute arbitrary logical and arithmetic operations including. Regarding this concrete procedure, "Ogura, Naganuma," Hardware algorithm of local expression neural network on associative processor and its evaluation ", IEICE Technical Report CPSY81
-44, 1991 "and the like.

【0166】1つの連想メモリ11に着目すると、その
横方向の一方に隣接する連想メモリの下位シフト入出力
とヒットフラグシフト線16で接続され、上記横方向の
他方に隣接する連想メモリのシフト入出力とヒットフラ
グシフト線16で接続されている。このようにすること
によって、横方向に互いに隣接する連想メモリは、同一
の連想メモリとして、シフトアップ、シフトダウン等の
動作を統一的に行うことができる。
Focusing on one associative memory 11, it is connected to the lower shift input / output of the associative memory adjacent in one of its lateral directions by the hit flag shift line 16, and the shift input of the associative memory adjacent to the other in the lateral direction. The output and the hit flag shift line 16 are connected. By doing so, the associative memories that are adjacent to each other in the lateral direction can perform operations such as shift up and shift down in a unified manner as the same associative memory.

【0167】1つの連想メモリ11におけるw個のワー
ド24は、それぞれが、m列、n行(w,m,nはw=
m×nを満たす任意の自然数)にジグザグ状に並べられ
た種々の論理、算術演算を行うPEに順次割り付けられ
ている。1つの連想メモリ11では、m×nの2次元の
PEアレイを実現でき、連想メモリアレイ部17全体で
は、縦方向m×q個、横方向n×r個のPEを持つ2次
元のPEを実現できる。連想メモリアレイ部17におい
て、m×qが原画像の縦の画素数であり、n×rが画像
の横の画素数であり、したがって、m,q,n,rを所
望の値に指定することによって、原画像の画素数と同数
のPEを実現することができる。
The w words 24 in one associative memory 11 are respectively m columns and n rows (w, m, n is w =
It is sequentially assigned to PEs that perform various logical and arithmetic operations arranged in a zigzag pattern (arbitrary natural number satisfying m × n). A single associative memory 11 can realize an m × n two-dimensional PE array, and the entire associative memory array unit 17 is a two-dimensional PE having m × q PEs in the vertical direction and n × r PEs in the horizontal direction. realizable. In the associative memory array unit 17, m × q is the vertical pixel number of the original image, and n × r is the horizontal pixel number of the image. Therefore, m, q, n, and r are designated to desired values. As a result, the same number of PEs as the number of pixels of the original image can be realized.

【0168】制御部18は、モルフォロジー演算処理を
連想メモリアレイ部17に実行させるために、単一の制
御命令ストリームを生成するものであり、マイクロプロ
セッサまたはFPGA(field programm
able gate array)等の再構成可能な回
路で構成されている。
The control unit 18 generates a single control instruction stream in order to cause the associative memory array unit 17 to execute the morphological operation processing, and is a microprocessor or FPGA (field program program).
It is composed of a reconfigurable circuit such as an Able Gate Array).

【0169】図23は、2次元PEアレイ装置MS1で
使用する連想メモリ11における各ワード24のフィー
ルド構成を詳細に示す図である。
FIG. 23 is a diagram showing in detail the field configuration of each word 24 in the associative memory 11 used in the two-dimensional PE array device MS1.

【0170】各ワード24は、原画像の各画素データを
格納する原画像フィールドC331と、モルフォロジー
演算処理後の各画素データを格納する処理画像フィール
ドC+332と、原画像のシフトアップまたはシフトダ
ウンデータを格納するシフト画像フィールドUD1 33
3と、シフト画像フィールドUD2 334と、左右のP
Eの原画像データを格納するシフト画像フィールドRL
335とによって構成されている。ワークフィールドW
336は、原画像フィールドC331またはシフト画像
フィールドUD1 333,UD2 334,RL335の
データを用いて種々の演算を行う場合のテンポラリ領域
として用いるものである。
Each word 24 includes an original image field C331 for storing each pixel data of the original image, a processed image field C + 332 for storing each pixel data after the morphological operation processing, and shift up or shift down data of the original image. Stored shift image field UD 1 33
3 and the shift image field UD 2 334 and the left and right P
Shift image field RL for storing original image data of E
And 335. Work field W
Reference numeral 336 is used as a temporary area when various calculations are performed using the data of the original image field C331 or the shift image field UD 1 333, UD 2 334, RL 335.

【0171】次に、モルフォロジー演算処理を行うため
に、制御部18において生成する単一の制御命令動作に
ついて、詳細に説明する。まず、モルフォロジー演算に
ついて概説する。
Next, a single control command operation generated in the control unit 18 for performing the morphological operation processing will be described in detail. First, the morphological operation will be outlined.

【0172】モルフォロジー演算は、ダイレーション
(dilation)、エロージョン(erosio
n)、クロージング(closing)、オープニング
(opening)の4つの基本演算で構成されてい
る。
Morphological operations include dilation and erosion.
n), closing, and opening.

【0173】図24は、モルフォロジーの構造要素を定
義した図である。
FIG. 24 is a diagram defining the structural elements of the morphology.

【0174】「ダイレーション」は、原画像の各画素に
対して、自分と近傍の画素データのみを用いた演算によ
って行われる処理である。その処理結果は、図24に示
すように、自PEの位置を原点343とした場合、(−
X2,−Y2)〜(X1,Y1)に分布する構造要素3
41の定義(具体的には、構造要素が2値である場合に
は「1」であること、多値である場合には「データが存
在する」ことをいう)に従って、自分と近傍PEの原画
像とに対して演算処理を行った結果である。たとえば、
構造要素341が(0,0)、(1,1)、(1,−
1)、(−1,1)、(−1,−1)において定義され
ている場合、ダイレーションは、自分と上下左右の4隣
接の原画像とのデータに対して演算処理を行った結果と
なる。ここで、X1,X2,Y1,Y2は0以上の任意
の整数である。
The "dilation" is a process performed on each pixel of the original image by a calculation using only the pixel data of itself and its neighbors. As shown in FIG. 24, the processing result is (-
Structural elements 3 distributed in (X2, -Y2) to (X1, Y1)
According to the definition of 41 (specifically, when the structuring element is binary, it is “1”, and when it is multivalued, it means “there is data”). It is a result of performing arithmetic processing on the original image. For example,
Structural element 341 is (0,0), (1,1), (1,-
1), (-1, 1), and (-1, -1) are defined, the dilation is the result of arithmetic processing on the data of itself and the four adjacent original images in the upper, lower, left, and right directions. Becomes Here, X1, X2, Y1, and Y2 are arbitrary integers of 0 or more.

【0175】演算処理は、原画像が2値であり、構造要
素341が2値である場合(setprocessin
g)、論理和演算を実行し(上記例の場合、自分と上下
左右の4隣接の原画像とのデータのうちで、1つでも
「1」があったら「1」を出力し)、原画像が多値であ
り、構造要素341が2値である場合(functio
n and set processing)、最大値
を求める演算を実行し(上記例の場合、自分と上下左右
の4隣接の原画像とのデータの最大値を求める演算を実
行し)、原画像が多値であり、構造要素341が多値で
ある場合(function processin
g)、構造要素341の値を加算した上で最大値演算を
実行する。
The arithmetic processing is performed when the original image is binary and the structuring element 341 is binary (setprocessin).
g), the logical sum operation is executed (in the case of the above example, if there is at least one “1” in the data of itself and the four adjacent original images in the upper, lower, left, and right directions, “1” is output), and the original If the image is multi-valued and the structuring element 341 is binary (functio)
n and set processing), the calculation for the maximum value is executed (in the above example, the calculation for the maximum value of the data between itself and the four adjacent original images on the top, bottom, left, and right is executed), and the original image is multivalued. Yes, if the structuring element 341 is multi-valued (function processin)
g), the value of the structuring element 341 is added, and then the maximum value operation is executed.

【0176】「エロージョン」は、上記のダイレーショ
ンと同様に処理できる。ただし、エージョンにおける演
算処理は、原画像が2値であり、構造要素341が2値
である場合、論理積演算(上記例の場合、自分と上下左
右の4隣接の原画像とのデータの全てが「1」であれ
ば、「1」を出力し)、原画像が多値であり、構造要素
341が2値である場合、最小値を求める演算を実行し
(上記例の場合、自分と上下左右の4隣接の原画像との
データの最小値を求める演算を実行し)、原画像が多値
であり、構造要素341が多値である場合には、構造要
素341の値を減算した上で最小値演算を行う。
"Erosion" can be processed in the same manner as the above dilation. However, when the original image is binary and the structuring element 341 is binary, the logical product operation (in the above example, all of the data of oneself and the four adjacent original images in the upper, lower, left and right directions) Is "1", "1" is output), and when the original image is multivalued and the structuring element 341 is binary, the calculation for the minimum value is executed (in the above example, If the original image is multi-valued and the structuring element 341 is multi-valued, the value of the structuring element 341 is subtracted. Perform the minimum value calculation above.

【0177】「クロージング」は、上記ダイレーション
を行った後にエロージョンを実行した結果であり、「オ
ープニング」は、エロージョンを行った後にダイレーシ
ョンを実行した結果である。
“Closing” is the result of performing erosion after performing the above dilation, and “opening” is the result of performing dilation after performing erosion.

【0178】図25は、モルフォロジー演算処理におけ
る全体の出力手順を示すフローチャートである。
FIG. 25 is a flow chart showing the overall output procedure in the morphology calculation processing.

【0179】まず、原画像の2次元の各画像データを、
連想メモリアレイ部17の対応するPE(=ワード2
4)の原画像フィールドC331に転送する。また、画
像処理フィールドC+332を初期化する。
First, the two-dimensional image data of the original image are
PE (= word 2) corresponding to the associative memory array unit 17
It is transferred to the original image field C331 in 4). Also, the image processing field C + 332 is initialized.

【0180】次に、モルフォロジー演算のステップ35
3(1)として、転送演算処理351と画像シフト処理
352とを並列に実行する。転送演算処理351では、
構造要素の(−X2,0)−(X1,0)の定義に従っ
て、自分とその左右のPE12の原画像フィールドC3
31とのデータを、自分のPE12へ転送、演算を行
い、この演算結果を処理画像フィールドC+332に格
納する。演算種別は、上記したように、たとえばダイレ
ーションでは、原画像が2値であり、構造要素341が
2値である場合、論理和演算を行う。画像シフト処理3
52は、上PE12の原画像フィールドC331をシフ
ト画像フィールドUD1 333に転送する。これによっ
て、画像フィールドUD1 333に、原画像フィールド
C331のデータを1画素分シフトダウンしたデータが
格納される。
Next, step 35 of the morphological operation.
3 (1), the transfer calculation process 351 and the image shift process 352 are executed in parallel. In the transfer calculation processing 351,
According to the definition of (-X2,0)-(X1,0) of the structuring element, the original image field C3 of itself and the PEs 12 on the left and right thereof
The data of 31 is transferred to the PE 12 of its own, and calculation is performed, and the calculation result is stored in the processed image field C + 332. As described above, for example, in dilation, when the original image has a binary value and the structuring element 341 has a binary value, the logical sum operation is performed. Image shift processing 3
52 transfers the original image field C331 of the upper PE12 to shift image field UD 1 333. As a result, data obtained by shifting down the data of the original image field C331 by one pixel is stored in the image field UD 1 333.

【0181】次に、モルフォロジー演算のステップ35
3(2)として、転送演算処理351と画像シフト処理
352とを並列に実行する。転送演算処理351では、
構造要素の(−X2,1)−(X1,1)の定義に従っ
て、自分とその左右のPE12のシフト画像フィールド
UD1 333とのデータを、自分のPE12へ転送し、
演算を行い、この演算結果を処理画像フィールドC+3
32に格納する。画像シフト処理352は、上PE12
のシフト画像フィールドUD1 333を、シフト画像フ
ィールドUD2 334に転送する。
Next, step 35 of the morphological operation.
3 (2), the transfer calculation process 351 and the image shift process 352 are executed in parallel. In the transfer calculation processing 351,
Of the structural element (-X2,1) - as defined by (x1,1), the data of the own and the shift image field UD 1 333 of PE12 of the left and right, then transferred to their PE12,
Calculation is performed, and the calculation result is processed image field C + 3.
It is stored in 32. The image shift processing 352 is performed on the upper PE 12.
The shift image fields UD 1 333, is transferred to the shift image field UD 2 334.

【0182】上記と同様の処理を、ステップ353
(3)から、ステップ353(Y1)まで繰り返す。こ
の場合、画像シフト処理352は、シフト画像フィール
ドUD1333とシフト画像フィールドUD2 334と
を交互に入れ換えて処理する。
The same processing as above is performed in step 353.
Repeat from (3) to step 353 (Y1). In this case, the image shift processing 352 alternately shifts and processes the shift image field UD 1 333 and the shift image field UD 2 334.

【0183】次に、モルフォロジー演算のステップ35
3(Y1+1)として、転送演算処理351と画像シフ
ト処理352とを並列に実行する。転送演算処理351
では、構造要素の(−X2,Y1)−(X1,Y1)の
定義に従って、自分とその左右のPE12のシフト画像
フィールドUD1 333(またはシフト画像フィールド
UD2 334)とのデータを、自分のPE12へ転送
し、演算し、その演算結果を処理画像フィールドC+3
32に格納する。画像シフト処理352では、下PE1
2の原画像フィールドC331をシフト画像フィールド
UD1 333(またはシフト画像フィールドUD2 33
4)に転送する。これによって、画像フィールドUD1
(またはシフト画像フィールドUD2 334)に、原画
像フィールドC331のデータを1画素分シフトアップ
したデータが格納される。
Next, step 35 of the morphological operation.
3 (Y1 + 1), the transfer calculation process 351 and the image shift process 352 are executed in parallel. Transfer calculation processing 351
Then, according to the definition of (-X2, Y1)-(X1, Y1) of the structuring element, the data of the self and the shift image field UD 1 333 (or the shift image field UD 2 334) of the PEs 12 on the left and right of the self are changed to the data of the own. Transferred to PE12, calculated, and the calculation result is processed image field C + 3
It is stored in 32. In the image shift processing 352, the lower PE1
2 of the original image field C331 to the shift image field UD 1 333 (or the shift image field UD 2 33
Transfer to 4). This causes the image field UD 1
(Or, the shift image field UD 2 334) stores data obtained by shifting up the data of the original image field C331 by one pixel.

【0184】次に、モルフォロジー演算のステップ35
3(Y1+2)として、転送演算処理351と画像シフ
ト処理352とを並列に実行する。転送演算処理351
において、構造要素の(−X2,−1)−(X1,−
1)の定義に従って、自分とその左右のPE12のシフ
ト画像フィールドUD1 333(またはシフト画像フィ
ールドUD2 334)とのデータを、自分のPE12へ
転送し、演算し、この演算結果を処理画像フィールドC
+332に格納する。画像シフト処理352は、下PE
12のシフトフィールドUD1 333(またはシフト画
像フィールドUD2 334)を、シフト画像フィールド
UD2 334(またはシフト画像フィールドUD1 33
3)に転送する。
Next, step 35 of the morphological operation.
3 (Y1 + 2), the transfer calculation process 351 and the image shift process 352 are executed in parallel. Transfer calculation processing 351
, The structural element (-X2, -1)-(X1,-
According to the definition of 1), the data of itself and the shift image field UD 1 333 (or the shift image field UD 2 334) of the PEs 12 on the left and right of the PE 12 are transferred to the PE 12 of its own, and the operation result is processed. C
Store in +332. The image shift processing 352 is performed by the lower PE.
12 shift fields UD 1 333 (or shift image field UD 2 334) are replaced by shift image field UD 2 334 (or shift image field UD 1 33).
Transfer to 3).

【0185】上記と同様の処理を、ステップ(Y1+
3)からステップ(Y1+Y2)まで繰り返す。この場
合、画像シフト処理352では、シフト画像フィールド
UD1333とシフト画像フィールドUD2 334とを
交互に入れ換えて処理する。
A process similar to the above is performed in step (Y1 +
Repeat from 3) to step (Y1 + Y2). In this case, in the image shift processing 352, the shift image field UD 1 333 and the shift image field UD 2 334 are alternately replaced and processed.

【0186】最後に、モルフォロジー演算のステップ3
53(Y1+Y2+1)として、転送演算処理351を
実行する。転送演算処理351では、構造要素の(−X
2,−Y2)−(X1,−Y2)の定義に従って、自分
とその左右のPE12のシフト画像フィールドUD1
33(またはシフト画像フィールドUD2 334)との
データを、自分のPE12へ転送し、演算し、その演算
結果を処理画像フィールドC+332に格納する。
Finally, step 3 of the morphological operation
The transfer calculation process 351 is executed as 53 (Y1 + Y2 + 1). In the transfer operation processing 351, the structure element (-X
2, -Y2)-(X1, -Y2) according to the definition of the shift image field UD 13
The data of 33 (or the shift image field UD 2 334) is transferred to the PE 12 of its own, is operated, and the operation result is stored in the processed image field C + 332.

【0187】図26は、図25に示す処理ステップ35
3(1)を例にとって、転送演算処理351を詳細に示
すフローチャートである。
FIG. 26 shows the processing step 35 shown in FIG.
3 is a flowchart showing the transfer calculation process 351 in detail by taking 3 (1) as an example.

【0188】転送演算処理351は、自PE12に対す
る転送演算処理61と、左PE12に対する転送演算処
理362と、右PE12に対する転送演算処理363と
に分けて実行する。
The transfer calculation process 351 is divided into a transfer calculation process 61 for the self PE 12, a transfer calculation process 362 for the left PE 12, and a transfer calculation process 363 for the right PE 12.

【0189】自PE12に対する転送演算処理361で
は、まず、連想メモリ11のマスクレジスタ22に、原
画像フィールドC331の特定ビット以外をマスクする
データを設定し、「1」で検索を行うことによって、ビ
ットフラグレジスタ27へ、原画像フィールドC331
の特定ビットの内容を転送する。
In the transfer operation processing 361 for the self PE 12, first, data for masking other than a specific bit of the original image field C331 is set in the mask register 22 of the associative memory 11, and a search is performed with "1", so that the bit The original image field C331 is added to the flag register 27.
Transfers the contents of a specific bit of.

【0190】次に、シフト画像フィールドRL335の
対応ビットで、ヒットフラグレジスタ27が「1」のワ
ードに、「1」を並列部分書き込みする。上記手順を原
画像フィールドC331のビット数分だけ繰り返す。
Next, in the corresponding bit of the shift image field RL335, "1" is partially written in parallel to the word of which the hit flag register 27 is "1". The above procedure is repeated for the number of bits of the original image field C331.

【0191】次に、対応する構造要素(この場合、原点
(0,0)が定義されていたら、演算処理を行い、その
結果を処理画像フィールドC+332に格納する。演算
の種別は、上記したように、たとえばダイレーションで
原画像が多値であり、構造要素341が2値である場
合、最大値演算を行う。
Next, if the corresponding structuring element (in this case, the origin (0, 0) is defined, the arithmetic processing is performed and the result is stored in the processed image field C + 332. The type of the arithmetic is as described above. In addition, for example, when the original image is multi-valued by dilation and the structuring element 341 is binary, the maximum value calculation is performed.

【0192】左PE12に対する転送演算処理362で
は、まず、マスクレジスタ22にシフト画像フィールド
RL335(最初だけ原画像フィールドC331)の特
定ビット以外をマスクするデータを設定し、「1」で検
索を行うことによって、ヒットフラグレジスタ27へ、
シフト画像フィールドRL335(最初だけ原画像フィ
ールドC331)の特定ビットの内容を転送する。
In the transfer arithmetic processing 362 for the left PE 12, first, data for masking other than specific bits of the shift image field RL335 (only the original image field C331 for the first time) is set in the mask register 22, and the search is performed with "1". To the hit flag register 27,
The contents of the specific bit of the shift image field RL335 (the original image field C331 only at the beginning) are transferred.

【0193】次に、ヒットフラグレジスタ27をm回シ
フトダウンし、シフト画像フィールドRL335の対応
ビットで、ヒットフラグレジスタ27が「1」のワード
に「1」を並列部分書き込みする。上記手順を、シフト
画像フィールドRL335のビット数分だけ繰り返す。
次に、対応する構造要素(この場合(−1,0)が定義
されていたら、演算処理を行い、この結果を処理画像フ
ィールドC+332に格納する。上記手順を(−2,
0)−(−X2,0)で定義されている構造要素がなく
なるまで繰り返す。
Next, the hit flag register 27 is downshifted m times, and "1" is written in parallel to the word of which the hit flag register 27 is "1" by the corresponding bit of the shift image field RL335. The above procedure is repeated for the number of bits of the shift image field RL335.
Next, if the corresponding structuring element ((-1, 0) in this case is defined, arithmetic processing is performed, and the result is stored in the processed image field C + 332.
0)-(-X2,0) Repeat until there are no structural elements defined.

【0194】右PE12に対する転送演算処理363で
は、まず、マスクレジスタ22にシフト画像フィールド
RL335(最初だけ原画像フィールドC331)の特
定ビット以外をマスクするデータを設定し、「1」で検
索を行うことによって、ヒットフラグレジスタ27へシ
フト画像フィールドRL335(最初だけ原画像フィー
ルドC331)の特定ビットの内容を転送する。
In the transfer operation processing 363 for the right PE 12, first, data for masking other than a specific bit of the shift image field RL335 (the original image field C331 only at the beginning) is set in the mask register 22, and the search is performed with "1". Thus, the contents of the specific bit of the shift image field RL335 (only the original image field C331 at the beginning) is transferred to the hit flag register 27.

【0195】次に、ヒットフラグレジスタ27をm回シ
フトアップし、シフト画像フィールドRL335の対応
ビットで、ヒットフラグレジスタ27が「1」のワード
に、「1」の並列部分書き込みする。上記手順を、シフ
ト画像フィールドRL335のビット数分だけ繰り返
す。次に、対応する構造要素(この場合(1,0)が定
義されていたら、演算処理を行い、この結果を処理画像
フィールドC+332に格納する。上記手順を、(2,
0)−(X1,0)で定義されている構造要素がなくな
るまで繰り返す。
Next, the hit flag register 27 is shifted up by m times, and the hit flag register 27 writes "1" in parallel in the corresponding bit of the shift image field RL335 to the word of "1". The above procedure is repeated for the number of bits of the shift image field RL335. Next, if the corresponding structuring element ((1,0) in this case is defined, arithmetic processing is performed, and this result is stored in the processed image field C + 332.
0)-(X1,0) is repeated until there are no more structural elements.

【0196】上記処理によって、(−X2,0)−(X
1,0)に分布する構造要素に対するモルフォロジー演
算処理が終わる。上記処理は、処理ステップ2からY1
+Y2+1の転送演算処理も同様に実行し、全ステップ
終了後には、全ての構造要素に対するモルフォロジー演
算処理が終わる。
By the above processing, (-X2,0)-(X
The morphological operation processing for the structuring elements distributed in (1, 0) ends. The above process is performed from process step 2 to Y1.
The transfer calculation process of + Y2 + 1 is similarly executed, and after the completion of all the steps, the morphology calculation process for all the structural elements ends.

【0197】図27は、処理ステップ353(1)を例
にとって、画像シフト処理手順352を詳細に示すフロ
ーチャートである。
FIG. 27 is a flow chart showing the image shift processing procedure 352 in detail by taking the processing step 353 (1) as an example.

【0198】画像シフト処理手順352は、内部ワード
転送371……下位境界ワード群15の下PEへのデー
タ転送以外の全ての転送と、上位、下位境界ワード転送
372……下位境界ワード群15の下PEへのデータ転
送とに分けて実行する。
The image shift processing procedure 352 includes internal word transfer 371 ... All transfers other than data transfer to the lower PE of the lower boundary word group 15 and upper and lower boundary word transfer 372. The data transfer to the lower PE is executed separately.

【0199】内部ワード転送371では、まず、マスク
レジスタ22に、原画像フィールドC331の特定ビッ
ト以外をマスクするデータを設定し、「1」で検索する
ことによって、ヒットフラグレジスタ27へ、原画像フ
ィールドC331の特定ビットの内容を転送する。次
に、ヒットフラグレジスタ27を1回シフトダウンし、
シフト画像フィールドUD1 333の対応ビットで、ヒ
ットフラグレジスタ27が「1」のワードに「1」を並
列部分書き込みする。上記手順を原画像フィールドC3
31のビット数分だけ繰り返す。
In the internal word transfer 371, first, the mask register 22 is set with data for masking other than a specific bit of the original image field C331, and a search is performed with "1", whereby the hit flag register 27 is sent to the original image field. The contents of the specific bit of C331 are transferred. Next, shift down the hit flag register 27 once,
At the corresponding bit of the shift image field UD 1 333, the hit flag register 27 writes “1” in parallel to the word of “1”. The above procedure is applied to the original image field C3.
Repeat for 31 bits.

【0200】上位、下位境界ワード転送372では、ま
ず、奇数メモリ群91の下位ワード群15に属する特定
のワードの原画像フィールドC331の全ビットを、対
応する偶数メモリ群92の上位ワード群13のワードの
シフト画像フィールドUD1333へ転送する。次に、
偶数メモリ群92の下位ワード群15に属する特定のワ
ードの原画像フィールドC331の全ビットを、対応す
る奇数メモリ群91の上位ワード群13のワードのシフ
ト画像フィールドUD1 333へ転送する。これらの転
送は、連想メモリ11のアドレスを用いたワードへのデ
ータ書き込み、読み出し機能を用いて行う。
In the upper / lower boundary word transfer 372, first, all bits of the original image field C331 of a specific word belonging to the lower word group 15 of the odd memory group 91 are stored in the upper word group 13 of the corresponding even memory group 92. Transfer to word shift image field UD 1 333. next,
All bits of the original image field C331 of the specific word belonging to the lower word group 15 of the even memory group 92 are transferred to the shift image field UD 1 333 of the word of the upper word group 13 of the corresponding odd memory group 91. These transfers are performed using a data write / read function for words using the address of the associative memory 11.

【0201】上記処理は、ステップ353(Y1+1)
等のシフトアップ処理に対しても、同様に実行できる。
The above-mentioned processing is step 353 (Y1 + 1).
The same can be applied to shift-up processing such as.

【0202】ヒットフラグレジスタ27のシフト動作
は、上記アドレスを用いたワードへのデータ書き込み、
読み出しと同時に行うモードを有するので、画像シフト
処理手順352の上位、下位境界ワード転送372は、
転送演算処理351のヒットフラグをシフトダウン、シ
フトアップ動作を同時に行うことができ、モルフォロジ
ー演算処理を効率よく行うことができる。
The shift operation of the hit flag register 27 is performed by writing data in the word using the above address,
Since it has a mode to be performed simultaneously with reading, the upper and lower boundary word transfer 372 of the image shift processing procedure 352 is
The hit flag of the transfer operation process 351 can be shifted down and up at the same time, and the morphology operation process can be performed efficiently.

【0203】上記処理フローチャートを、プログラムま
たは状態遷移の形で制御部18に搭載し、連想メモリア
レイ部17に対して、順次命令を与えることによって、
上記実施の形態である2次元PEアレイ装置MS1は、
任意の形状、大きさの構造要素に対するモルフォロジー
演算処理を実行することができる。
By mounting the above processing flowchart in the control unit 18 in the form of a program or state transition and sequentially giving instructions to the associative memory array unit 17,
The two-dimensional PE array device MS1 according to the above embodiment is
The morphological operation processing can be executed on the structural element having an arbitrary shape and size.

【0204】上記実施の形態である2次元PEアレイ装
置MS1は、原画像の画素と同数のPEを持った2次元
PEを有する構成をとることによって、処理速度は、原
画像の大きさに依存しない。また、連想メモリのワード
にシフト画像フィールドを設け、上記シフト画像フィー
ルドに隣接画素のデータを順次、転送しながらモルフォ
ロジー演算処理を行うことによって、処理可能な構造要
素の大きさに制限がない。したがって、大きな構造要
素、大きな原画像に対して、少ない処理時間でモルフォ
ロジー演算処理を実行することができ、高性能なモルフ
ォロジー演算処理装置を実現することができる。
The two-dimensional PE array device MS1 of the above embodiment has a two-dimensional PE having the same number of PEs as the pixels of the original image, so that the processing speed depends on the size of the original image. do not do. Further, by providing a shift image field in a word of the associative memory and performing the morphological operation processing while sequentially transferring the data of the adjacent pixels to the shift image field, there is no limitation on the size of the structural element that can be processed. Therefore, it is possible to execute the morphology operation processing on a large structuring element and a large original image in a short processing time, and it is possible to realize a high-performance morphology operation processing device.

【0205】また、上記実施の形態で用いる連想メモリ
は、集積度の極めて高いメモリ技術をベースとして構成
できるので、小量のハード量で、1つのPEとデータ転
送パスとを実現できる。したがって、少ないハード量で
2次元PEアレイ装置MS1を実現することができ、ま
た、2次元PEアレイ装置MS1の装置コストが低くな
る。
Since the associative memory used in the above embodiments can be constructed based on a memory technology having a very high degree of integration, one PE and a data transfer path can be realized with a small amount of hardware. Therefore, the two-dimensional PE array device MS1 can be realized with a small amount of hardware, and the device cost of the two-dimensional PE array device MS1 is reduced.

【0206】[0206]

【発明の効果】請求項1記載の発明によれば、全体のデ
ータ転送時間を抑え、しかもハードウェア量を少なくし
たので、高性能なPEアレイ装置を実現できる。
According to the first aspect of the present invention, since the total data transfer time is suppressed and the amount of hardware is reduced, a high performance PE array device can be realized.

【0207】請求項2記載の発明によれば、制御部を設
けたので、転送時間のさらに短い2次元PEアレイ装置
を実現できる。
According to the second aspect of the invention, since the control unit is provided, it is possible to realize a two-dimensional PE array device having a shorter transfer time.

【0208】請求項3記載の発明によれば、1つのワー
ドに複数のPEを割り付けたので、少ないハードウェア
量でより多くのPEを有する2次元PEアレイ装置を実
現できる。
According to the third aspect of the invention, since a plurality of PEs are assigned to one word, a two-dimensional PE array device having a larger number of PEs can be realized with a small amount of hardware.

【0209】請求項4記載の発明によれば、アドレスを
用いたワードへのデータ書き込み及び読み出し手段とヒ
ットフラグレジスタのシフトモード手段とを同時に実行
するモード手段を有するので、全体のデータ転送時間を
さらに抑えた連想メモリを実現できる。
According to the invention described in claim 4, since there is a mode means for simultaneously executing the data writing / reading means for the word using the address and the shift mode means of the hit flag register, the total data transfer time is reduced. A more suppressed associative memory can be realized.

【0210】請求項5記載の発明によれば、全体のデー
タ転送時間をさらに抑えた連想メモリを用いるので、転
送時間のさらに短い2次元PEアレイ装置を実現でき
る。
According to the fifth aspect of the invention, since the associative memory in which the entire data transfer time is further suppressed is used, a two-dimensional PE array device with a shorter transfer time can be realized.

【0211】請求項6記載の発明によれば、全体のデー
タ転送時間を抑えることができるので、転送時間の短い
データ転送方法を実現できる。
According to the invention described in claim 6, since the entire data transfer time can be suppressed, a data transfer method having a short transfer time can be realized.

【0212】請求項7記載の発明によれば、1つのワー
ドに複数のPEを割り付けたので、転送時間のさらに短
いデータ転送方法を実現できる。
According to the invention described in claim 7, since a plurality of PEs are assigned to one word, a data transfer method having a shorter transfer time can be realized.

【0213】請求項8記載の発明によれば、全体のデー
タ転送時間をさらに抑えることができるので、転送時間
のさらに短いデータ転送方法を実現できる。
According to the invention as set forth in claim 8, since the entire data transfer time can be further suppressed, a data transfer method having a shorter transfer time can be realized.

【0214】請求項9記載の発明によれば、全体のデー
タ転送時間をさらに抑えることができるので、転送時間
のさらに短いデータ転送方法を実現できる。
According to the invention as set forth in claim 9, since the entire data transfer time can be further suppressed, a data transfer method with a shorter transfer time can be realized.

【0215】請求項10記載の発明によれば、全体のデ
ータ転送時間をさらに抑えることができるので、転送時
間のさらに短い連想メモリデータ転送方法を実現でき
る。
According to the tenth aspect of the present invention, since the entire data transfer time can be further suppressed, the associative memory data transfer method with a shorter transfer time can be realized.

【0216】請求項11記載の発明によれば、全体のデ
ータ転送時間を抑え、しかもハードウェア量を少なくし
たので、高性能な2次元PEアレイ装置を実現すること
ができる。
According to the eleventh aspect of the present invention, since the entire data transfer time is suppressed and the amount of hardware is reduced, a high performance two-dimensional PE array device can be realized.

【0217】請求項12記載の発明によれば、全体のデ
ータ転送時間を抑え、しかもハードウェア量を少なくし
たので、高性能なモルフォロジー演算処理方法を実現す
ることができる。
According to the twelfth aspect of the present invention, since the entire data transfer time is suppressed and the amount of hardware is reduced, a high-performance morphological operation processing method can be realized.

【0218】請求項13記載の発明によれば、全体のデ
ータ転送時間をさらに抑えたので、さらに高性能なモル
フォロジー演算処理方法を実現することができる。
According to the thirteenth aspect of the present invention, since the entire data transfer time is further suppressed, it is possible to realize a higher performance morphological operation processing method.

【0219】請求項14記載の発明によれば、全体のデ
ータ転送時間を抑え、しかもハードウェア量を少なくし
たので、高性能なモルフォロジー演算処理方法を実現す
ることができる。
According to the fourteenth aspect of the present invention, since the entire data transfer time is suppressed and the amount of hardware is reduced, a high-performance morphological operation processing method can be realized.

【0220】請求項15記載の発明によれば、全体のデ
ータ転送時間を抑え、しかもハードウェア量を少なくし
たので、高性能なモルフォロジー演算処理方法を実現す
ることができる。
According to the fifteenth aspect of the present invention, since the entire data transfer time is suppressed and the amount of hardware is reduced, a high-performance morphological operation processing method can be realized.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施の形態である2次元PEアレイ
装置PEA1の基本構成を示す図である。
FIG. 1 is a diagram showing a basic configuration of a two-dimensional PE array device PEA1 which is an embodiment of the present invention.

【図2】上記2次元PEアレイ装置PEA1を構成する
連想メモリ11(1,1) を示す図である。
FIG. 2 is a diagram showing an associative memory 11 (1,1) that constitutes the two-dimensional PE array device PEA1.

【図3】上記実施の形態において、右、下、左、上の4
隣接のPEにデータ転送する場合における連想メモリ1
(1,1) のワードの割り付け法を示す図である。
FIG. 3 is a diagram showing a case where the right, the lower, the left, and the upper 4 in the above-described embodiment.
Associative memory 1 for data transfer to adjacent PE
It is a figure which shows the allocation method of the word of 1 (1,1) .

【図4】上記実施の形態において、右、右下、下、左
下、左、左上、上、右上の8隣接のPEにデータ転送す
る場合における連想メモリ11(1,1) のワードの割り付
け法を示す図である。
FIG. 4 is a word allocation method of the associative memory 11 (1,1) in the case of transferring data to eight adjacent PEs on the right, lower right, lower, lower left, left, upper left, upper and upper right in the above embodiment. FIG.

【図5】2次元PEアレイ装置PEA1における全体の
処理手順を示すフローチャートである。
FIG. 5 is a flowchart showing an overall processing procedure in the two-dimensional PE array device PEA1.

【図6】上記実施の形態において、4隣接内部ワード転
送手順を示すフローチャートである。
FIG. 6 is a flowchart showing a 4-adjacent internal word transfer procedure in the above embodiment.

【図7】上記実施の形態における8隣接内部ワード転送
手順を示すフローチャートである。
FIG. 7 is a flowchart showing an 8-adjacent internal word transfer procedure in the above embodiment.

【図8】本発明の実施の形態2における上位、下位境界
ワード転送手順53を示すフローチャートである。
FIG. 8 is a flowchart showing an upper / lower boundary word transfer procedure 53 according to the second embodiment of the present invention.

【図9】上記実施の形態2において、4隣接における奇
数連想メモリ群91の下位ワード群15の1ワードを、
偶数連想メモリ群92へ転送する例を示す図である。
FIG. 9 is a block diagram showing one word of the lower word group 15 of the odd-numbered associative memory group 91 in four adjacencies in the second embodiment.
FIG. 7 is a diagram showing an example of transfer to an even-numbered associative memory group 92.

【図10】上記実施の形態2において、4隣接における
偶数連想メモリ群92の下位ワード群15の1ワード
を、奇数連想メモリ群91へ転送する例を示す図であ
る。
FIG. 10 is a diagram showing an example of transferring one word of the lower word group 15 of the even-numbered associative memory group 92 in four adjacent areas to the odd-numbered associative memory group 91 in the second embodiment.

【図11】上記実施の形態2において、4隣接における
奇数連想メモリ群91の上位ワード群13の1ワード
を、偶数連想メモリ群92へ転送する例を示す図であ
る。
FIG. 11 is a diagram showing an example of transferring one word of the upper word group 13 of the odd-numbered associative memory group 91 in four adjacent to the even-numbered associative memory group 92 in the second embodiment.

【図12】上記実施の形態2において、4隣接における
偶数連想メモリ群92の上位ワード群13の1ワード
を、奇数連想メモリ群91へ転送する例を示す図であ
る。
FIG. 12 is a diagram showing an example of transferring one word of the upper word group 13 of the even-numbered associative memory group 92 in four adjacent areas to the odd-numbered associative memory group 91 in the second embodiment.

【図13】本発明の実施の形態3である2次元PEアレ
イ装置PEA3において、連想メモリ11のワード24
のPEへの割り付け方法(4隣接の場合)を示す図であ
る。
FIG. 13 illustrates a word 24 of the associative memory 11 in the two-dimensional PE array device PEA3 according to the third embodiment of the present invention.
It is a figure which shows the allocation method (in the case of 4 adjacency) to PE.

【図14】右、下、左、上の4隣接のPEに対するデー
タ転送機能を有する2次元PEアレイ装置を実現するた
めの連想メモリのワードの割り付け法を示す図である。
FIG. 14 is a diagram showing a word allocation method of an associative memory for realizing a two-dimensional PE array device having a data transfer function for four adjacent PEs on the right, bottom, left, and top.

【図15】右、右下、下、左下、左、左上、上、右上の
8隣接のPEに対するデータ転送機能を有する2次元P
Eアレイ装置を実現するための連想メモリのワードの割
り付け法を示した図である。
FIG. 15 is a two-dimensional P having a data transfer function for eight adjacent PEs of right, lower right, lower, lower left, left, upper left, upper, upper right.
It is the figure which showed the word allocation method of the associative memory for implement | achieving an E array apparatus.

【図16】ワード種類識別フィールドI 148または1
512を示す図である。
FIG. 16: Word type identification field I 148 or 1
It is a figure which shows 512.

【図17】上記に示した構成をとる2次元PEアレイ装
置を用いて種々の処理を行なう全体の処理手順を示した
図である。
FIG. 17 is a diagram showing an overall processing procedure for performing various kinds of processing using the two-dimensional PE array device having the above-described configuration.

【図18】隣接PEへのデータ転送173のうち内部ワ
ード転送171に関する4隣接内部ワード転送手順を示
す図である。
FIG. 18 is a diagram showing a 4-adjacent internal word transfer procedure regarding internal word transfer 171 of data transfer 173 to an adjacent PE.

【図19】隣接PEへのデータ転送173のうち内部ワ
ード転送171に関する8隣接内部ワード転送手順を示
す図である。
FIG. 19 is a diagram showing an 8-adjacent internal word transfer procedure regarding the internal word transfer 171 of the data transfer 173 to the adjacent PE.

【図20】連想メモリ11の1つのワード24に2個の
PEを割り付けた場合における2次元PEアレイ装置の
構成例を示す図である。
20 is a diagram showing a configuration example of a two-dimensional PE array device in the case where two PEs are assigned to one word 24 of the associative memory 11. FIG.

【図21】連想メモリ11の1つのワード24に2個の
PEを割り付けた場合における4隣接PEへの内部ワー
ド転送手順(52)を示すフローチャートである。
FIG. 21 is a flowchart showing an internal word transfer procedure (52) to four adjacent PEs when two PEs are allocated to one word 24 of the associative memory 11.

【図22】本発明の他の実施の形態である2次元PEア
レイ装置MS1の基本構成を示す図である。
FIG. 22 is a diagram showing a basic configuration of a two-dimensional PE array device MS1 which is another embodiment of the present invention.

【図23】2次元PEアレイ装置MS1で使用する連想
メモリ11における各ワード24のフィールド構成を詳
細に示す図である。
FIG. 23 is a diagram showing in detail the field configuration of each word 24 in the associative memory 11 used in the two-dimensional PE array device MS1.

【図24】モルフォロジーの構造要素を定義した図であ
る。
FIG. 24 is a diagram defining structural elements of morphology.

【図25】上記実施の形態におけるモルフォロジー演算
処理の全体の出力手順を示すフローチャートである。
FIG. 25 is a flowchart showing the overall output procedure of the morphology calculation processing in the above embodiment.

【図26】図25に示す処理ステップ353(1)を例
にとって、転送演算処理351を詳細に示すフローチャ
ートである。
FIG. 26 is a flowchart showing in detail the transfer calculation processing 351 by taking the processing step 353 (1) shown in FIG. 25 as an example.

【図27】処理ステップ353(1)を例にとって、画
像シフト処理手順252を詳細に示すフローチャートで
ある。
FIG. 27 is a flowchart showing in detail an image shift processing procedure 252 by taking a processing step 353 (1) as an example.

【図28】従来の2次元PEアレイ装置PEA11を示
す図である。
FIG. 28 is a diagram showing a conventional two-dimensional PE array device PEA11.

【図29】従来の2次元PEアレイ装置PEA12を示
す図である。
FIG. 29 is a diagram showing a conventional two-dimensional PE array device PEA12.

【図30】従来の連想メモリM11を示す図である。FIG. 30 is a diagram showing a conventional associative memory M11.

【図31】従来のモルフォロジー演算処理装置を示す図
である。
FIG. 31 is a diagram showing a conventional morphological operation processing device.

【符号の説明】[Explanation of symbols]

PEA1,PEA3 2次元PEアレイ装置 MS1 モルフォロジー演算処理装置 11 連想メモリ 12 連想メモリの1ワード 13 上位境界ワード群 14 内部ワード群 15 下位境界ワード群 16 連想メモリ間ヒットフラグシフト線 PEA1, PEA3 Two-dimensional PE array device MS1 Morphology operation processing device 11 Associative memory 12 One word of associative memory 13 Upper boundary word group 14 Internal word group 15 Lower boundary word group 16 Associative memory hit flag shift line

Claims (15)

【特許請求の範囲】[Claims] 【請求項1】 1次元に並べられたw個(wは任意の自
然数)のワードと、シフトアップ、シフトダウン可能な
ヒットフラグレジスタと、このヒットフラグレジスタの
内容を外に出し入れする上位シフト入出力と下位シフト
入出力とを有するq×r個(q,rは2以上の任意の整
数)の連想メモリと、 前記連想メモリのうちで、横方向に隣接している前記連
想メモリのうちの一方の連想メモリの下位シフト入出力
と、前記横方向に隣接している前記連想メモリのうちの
他方の連想メモリの前記シフト入出力とを接続するヒッ
トフラグシフト線と、 前記連想メモリのw個のワードのそれぞれがm列、n行
(w、m、nはw=m×nを満たす任意の自然数)にジ
グザグ状に並べられたPEに順次割り付けられ、全体で
縦方向m×q個、横方向n×r個のPEとを備えたこと
を特徴とする2次元PEアレイ装置。
1. W words (where w is an arbitrary natural number) arranged in one dimension, a hit flag register that can be shifted up and down, and an upper shift input that puts the contents of this hit flag register in and out. Out of the associative memories, q × r associative memories having an output and a lower shift input / output (q and r are arbitrary integers of 2 or more), among the associative memories that are laterally adjacent to each other. A hit flag shift line that connects the lower shift input / output of one associative memory and the shift input / output of the other associative memory among the associative memories that are adjacent in the lateral direction, and w hit lines of the associative memory. Are sequentially allocated to PEs arranged in a zigzag pattern in m columns and n rows (w, m, n are arbitrary natural numbers satisfying w = m × n), and m × q in the vertical direction as a whole, Lateral direction n × r 2-dimensional PE array apparatus being characterized in that a PE of.
【請求項2】 請求項1記載の2次元PEアレイ装置に
おいて、 前記連想メモリおよび前記ヒットフラグシフト線を含む
連想メモリアレイ部に対して単一の制御命令ストリーム
を生成する制御部をさらに備えたことを特徴とする2次
元PEアレイ装置。
2. The two-dimensional PE array device according to claim 1, further comprising a control unit that generates a single control instruction stream for the associative memory array unit including the associative memory and the hit flag shift line. A two-dimensional PE array device characterized in that
【請求項3】 請求項1記載の2次元PEアレイ装置に
おいて、 前記連想メモリの1つのワードに複数のPEが割り付け
られ、この内の1つのPEに、自分のPEの現状態フィ
ールドと、前記自分のPEの次状態フィールドと、隣接
PEの各状態フィールドとをさらに備えたことを特徴と
する2次元PEアレイ装置。
3. The two-dimensional PE array device according to claim 1, wherein a plurality of PEs are assigned to one word of the associative memory, and one PE among the PEs has a current state field of its own PE and the PE. A two-dimensional PE array device further comprising a next state field of its own PE and each state field of adjacent PEs.
【請求項4】 アドレスを用いたワードへのデータ書き
込みおよび読み出し手段と、 ヒットフラグレジスタのシフトモード手段と、 前記アドレスを用いたワードへのデータ書き込みおよび
読み出し手段と前記ヒットフラグレジスタのシフトモー
ド手段とを同時に実行するモード手段とを有することを
特徴とする連想メモリ。
4. A word data writing / reading means using an address, a hit flag register shift mode means, a word data writing / reading means using the address, and the hit flag register shift mode means. An associative memory having mode means for simultaneously executing and.
【請求項5】 請求項1から3いずれかに記載の2次元
PEアレイ装置において、前記連想メモリは、 アドレスを用いたワードへのデータ書き込みおよび読み
出し手段と、 ヒットフラグレジスタのシフトモード手段と、 前記アドレスを用いたワードへのデータ書き込みおよび
読み出し手段と前記ヒットフラグレジスタのシフトモー
ド手段とを同時に実行するモード手段とを有する連想メ
モリであることを特徴とする2次元PEアレイ装置。
5. The two-dimensional PE array device according to claim 1, wherein the associative memory includes means for writing and reading data to and from a word using an address, shift mode means for a hit flag register, A two-dimensional PE array device, which is an associative memory having a means for writing / reading data to / from a word using the address and a mode means for simultaneously executing the shift mode means of the hit flag register.
【請求項6】 w個(wは任意の自然数)のワードを1
次元に並べるステップと、 q×r個(q,rは2以上の任意の整数)の連想メモリ
間で、シフトアップ、シフトダウン可能なヒットフラグ
レジスタの内容を上位シフト入出力と下位シフト入出力
とを用いて外に出し入れすることによりデータを転送す
るステップと、 前記連想メモリの内、横方向に隣接している前記連想メ
モリの一方の連想メモリの下位シフト入出力と、前記横
方向に隣接している前記連想メモリの他方の連想メモリ
の前記シフト入出力とをヒットフラグシフト線により接
続するステップと、 前記連想メモリのw個のワードをm列、n行(m、nは
w=m×nを満たす任意の自然数)にジグザグ状に並べ
るステップと、 前記連想メモリのw個のワードのそれぞれがPEに割り
付けられるステップとを備えたことを特徴とする2次元
PEアレイ装置のデータ転送方法。
6. The word w (where w is an arbitrary natural number) is 1
The steps of arranging in a dimension and the contents of the hit flag register that can be shifted up and down between q × r (q and r are arbitrary integers of 2 or more) associative memories are upper shift input / output and lower shift input / output. Transferring data by putting it in and out of the associative memory, a lower shift input / output of one associative memory of the associative memory that is laterally adjacent to the associative memory, and the horizontally adjacent Connecting the shift input / output of the other associative memory with a hit flag shift line, and w words of the associative memory in m columns and n rows (m and n are w = m). A zigzag arrangement in an arbitrary natural number satisfying × n, and a step of allocating each of the w words of the associative memory to a PE. Data transfer method dimension PE array unit.
【請求項7】 請求項6記載のデータ転送方法におい
て、 前記連想メモリの1つのワードに複数のPEを割り付け
るステップと、 該複数のPEの内の1つのPEが、自分のPEの現状態
フィールドと、前記自分のPEの次状態フィールドと、
隣接PEの各現状態フィールドとを前記1つのワード内
に設けるステップとをさらに備えたことを特徴とするデ
ータ転送方法。
7. The data transfer method according to claim 6, wherein a plurality of PEs are allocated to one word of the associative memory, and one PE among the plurality of PEs has a current state field of its own PE. And the next state field of my PE,
Providing each current state field of adjacent PEs in said one word.
【請求項8】 w個(wは任意の自然数)のワードを1
次元に並べるステップと、 q×r個(q,rは2以上の任意の整数)の連想メモリ
間で、シフトアップ、シフトダウン可能なヒットフラグ
レジスタの内容を上位シフト入出力と下位シフト入出力
とを用いて外に出し入れすることによりデータを転送す
るステップと、 縦方向q列に並べられた前記連想メモリのうちで、奇数
列の連想メモリ群から偶数列の連想メモリ群、または偶
数列の連想メモリ群から奇数列の連想メモリ群へのデー
タ転送を同時に行うステップと、 横方向r行に並べられた全ての連想メモリに対して、前
記データ転送を、同時に行なうステップとを備えたこと
を特徴とする連想メモリ間データ転送方法。
8. The word w (where w is an arbitrary natural number) is 1
The steps of arranging in a dimension and the contents of the hit flag register that can be shifted up and down between q × r (q and r are arbitrary integers of 2 or more) associative memories are upper shift input / output and lower shift input / output. Of the associative memory arranged in q columns in the vertical direction, from the associative memory group of odd columns to the associative memory group of even columns, or the associative memory group of even columns. A step of simultaneously performing data transfer from the associative memory group to the associative memory group of an odd number of columns, and a step of simultaneously performing the data transfer to all the associative memories arranged in the horizontal direction r rows. Characteristic data transfer method between associative memories.
【請求項9】 w個(wは任意の自然数)のワードを1
次元に並べるステップと、 前記ワードに格納されているデータと検索データとを照
合し検索データの一部の照合を無視するマスク検索を行
うステップと、 前記マスク検索により指定された第1ワード内の特定ビ
ットの内容をシフトアップ、シフトダウン可能な第1ヒ
ットフラグレジスタへ転送するステップと、 転送された第1ヒットフラグレジスタの内容を転送先の
第2ワードの第2ヒットフラグレジスタへシフトアップ
又はシフトダウンするステップと、 第2ヒットフラグレジスタが特定の値をとる第2ワード
に対して検索データのマスクされていないビットに対応
する第2ワードのビットに検索データを書き込む並列部
分書き込みを用いて、第2ワード内の特定ビットへ第2
ヒットフラグレジスタの内容を転送するステップとを備
えたことを特徴とする連想メモリ内データ転送方法。
9. One w (where w is an arbitrary natural number) word.
Arranging in a dimension, performing a mask search for matching the data stored in the word with the search data and ignoring a part of the search data, and searching in the first word specified by the mask search. Transferring the content of the specific bit to a first hit flag register that can be shifted up and down, and shifting up the transferred content of the first hit flag register to the second hit flag register of the second word of the transfer destination or Using the step of downshifting and parallel partial write to write the search data to the bits of the second word corresponding to the unmasked bits of the search data for the second word for which the second hit flag register has a specific value , To a particular bit in the second word
And a step of transferring the contents of the hit flag register.
【請求項10】 アドレスを用いてワードへデータを書
き込みおよび読み出しを行うステップと、 ヒットフラグレジスタがシフトモードを実行するステッ
プと、 前記アドレスを用いたワードへデータを書き込みおよび
読み出しを行うステップと前記ヒットフラグレジスタが
シフトモードを実行するステップとを同時に実行するモ
ードのステップとを有することを特徴とする連想メモリ
データ転送方法。
10. A step of writing and reading data to and from a word using an address, a step in which a hit flag register executes a shift mode, a step of writing and reading data to and from a word using the address, and An associative memory data transfer method, wherein the hit flag register has a step of executing a shift mode and a step of simultaneously executing a shift mode.
【請求項11】 原画像フィールドと処理画像フィール
ドとシフト画像フィードとが設けられ1次元に並べられ
たw個(wは任意の自然数)のワードと、シフトアッ
プ、シフトダウン可能なヒットフラグレジスタと、この
ヒットフラグレジスタの内容を外に出し入れする上位シ
フト入出力と下位シフト入出力とを備えたq×r個
(q,rは2以上の任意の整数)の連想メモリと、 前記q×r個の連想メモリのうちで、横方向に隣接して
いる前記連想メモリのうちの一方の連想メモリの下位シ
フト入出力と、前記横方向に隣接している前記連想メモ
リのうちの他方の連想メモリの前記シフト入出力とを接
続するヒットフラグシフト線と、 前記連想メモリのw個のワードのそれぞれが、m列、n
行(w,m,nはw=m×nを満たす任意の自然数)に
ジグザグ状に並べられたPEに順次割り付けられ、全体
で縦方向m×q個、横方向n×r個のPEを有する連想
メモリアレイ部と、 前記連想メモリアレイ部に単一の制御命令ストリームを
与える制御部とを備えたことを特徴とする2次元PEア
レイ装置。
11. A w-word (where w is an arbitrary natural number) word arranged in a one-dimensional manner and provided with an original image field, a processed image field and a shift image feed, and a hit flag register capable of shifting up and shifting down. , Q × r associative memories having upper shift input / output and lower shift input / output for putting the contents of the hit flag register in and out, and q × r Out of the associative memories, the lower shift input / output of one of the associative memories that are adjacent in the horizontal direction and the other associative memory of the associative memories that are adjacent in the horizontal direction And a hit flag shift line for connecting the shift input / output of each of the w and w words of the associative memory with m columns, n
PEs arranged in a zigzag pattern in rows (w, m, and n are arbitrary natural numbers that satisfy w = m × n) are sequentially allocated, and m × q PEs in the vertical direction and n × r PEs in the horizontal direction are totally allocated. A two-dimensional PE array device, comprising: an associative memory array section having the same; and a control section for giving a single control instruction stream to the associative memory array section.
【請求項12】 w個(wは任意の自然数)のワードを
1次元に並べるステップと、 該ワード内に各々1つずつの原画像フィールド、処理画
像フィールド、左右シフト画像フィールドと2つの上下
シフト画像フィールドを設けるステップと、 q×r個(q,rは2以上の任意の整数)の連想メモリ
間で、シフトアップ、シフトダウン可能なヒットフラグ
レジスタの内容を上位シフト入出力と下位シフト入出力
とを用いて外に出し入れするステップと、 前記q×r個の連想メモリのうちで、横方向に隣接して
いる前記連想メモリのうちの一方の連想メモリの下位シ
フト入出力と、前記横方向に隣接している前記連想メモ
リのうちの他方の連想メモリの上位シフト入出力とをヒ
ットフラグシフト線により接続するステップと、 前記連想メモリのw個のワードのそれぞれが、m列、n
行(w,m,nはw=m×nを満たす任意の自然数)に
ジグザグ状に並べられたPEに順次割り付けられ、全体
で縦方向m×q個、横方向n×r個のPEを有する連想
メモリアレイ部を設けるステップと、 制御部が、前記連想メモリアレイ部に単一の制御命令ス
トリームを与えるステップと、 左右方向のPEの原画像フィールド又は上下シフト画像
フィールドのデータを、左右シフト画像フィールドに順
次転送し、演算処理を行い処理画像フィールドに格納す
る転送演算処理ステップと、 上下方向のPEの原画像フィールド又は片方の上下シフ
ト画像フィールドのデータを、他方の上下シフト画像フ
ィールドに転送する画像シフトアップ、ダウン処理ステ
ップと、 前記転送演算処理ステップと画像シフトアップ、ダウン
処理ステップとを、上下左右方向のPEからの転送演算
処理がすべて終了するまで繰り返すステップとを備えた
ことを特徴とする2次元PEアレイ装置を用いたモルフ
ォロジー演算処理方法。
12. A step of arranging w words (where w is an arbitrary natural number) in one dimension, and one original image field, one processed image field, one horizontal shift image field and two vertical shifts in each word. The contents of the hit flag register that can be shifted up or down between the step of providing the image field and the qxr number of associative memories (q and r are arbitrary integers of 2 or more) are input to the upper shift input / output and the lower shift input. Using the output to move in and out, the lower shift input / output of one of the associative memories of the q × r associative memories that are laterally adjacent to each other, and the horizontal shift input / output. Connecting the upper shift input / output of the other associative memory of the associative memories adjacent to each other in the direction by a hit flag shift line, and w of the associative memory. Each, m columns of words, n
PEs arranged in a zigzag pattern in rows (w, m, and n are arbitrary natural numbers that satisfy w = m × n) are sequentially allocated, and m × q PEs in the vertical direction and n × r PEs in the horizontal direction are totally allocated. A step of providing an associative memory array section having the step of: the control section giving a single control instruction stream to the associative memory array section; Transfer arithmetic processing step of sequentially transferring to the image field, performing arithmetic processing and storing in the processed image field, and transferring the data of the original image field of the PE in the vertical direction or the data of one vertical shift image field to the other vertical shift image field The image shift up / down processing step, the transfer calculation processing step and the image shift up / down processing step And a step of repeating until all transfer arithmetic processing from the PE in the lower left and right direction is completed, a morphological arithmetic processing method using a two-dimensional PE array device.
【請求項13】 請求項12記載のモルフォロジー演算
処理方法において、 原画像の各要素のデータを前記2次元PEアレイ装置の
対応するPEの原画像フィールドに転送するステップ
と、 構造要素によって定義される上下左右方向の任意のPE
からのデータ転送および演算処理を行うステップとをさ
らに備えたことを特徴とするモルフォロジー演算処理方
法。
13. The morphological operation processing method according to claim 12, wherein the data of each element of the original image is transferred to the original image field of the corresponding PE of the two-dimensional PE array device, and is defined by a structural element. Arbitrary PE in up, down, left and right directions
And a step of performing data processing and arithmetic processing from the morphology arithmetic processing method.
【請求項14】 請求項12記載のモルフォロジー演算
処理方法において、 原画像フィールド又は上下シフト画像フィールドの特定
のビットに対するマスク検索と、m回(mは前記m列の
m)のシフトアップあるいはシフトダウン処理と、左右
シフト画像フィールドの対応するビットに対する並列部
分書き込みとを、データのビット数繰り返すデータ転送
処理ステップと、 左右シフト画像フィールドにあるデータが演算処理をす
るべきPEからのデータであるときにのみ、処理画像フ
ィールドおよび左右シフト画像フィールドに対して演算
処理を行い、該演算処理の結果を処理画像フィールドに
格納する演算処理ステップと、 前記データ転送処理ステップおよび演算処理ステップ
を、左右方向からの転送演算処理がすべて終了するまで
繰り返すステップとを備えたことを特徴とするモルフォ
ロジー演算処理方法。
14. The morphological operation processing method according to claim 12, wherein a mask search for a specific bit of the original image field or the vertically shifted image field and m upshifts or downshifts of m times (m is m in the m column). A data transfer processing step in which the processing and parallel partial writing to the corresponding bits of the left and right shift image fields are repeated by the number of bits of data, and when the data in the left and right shift image fields is data from the PE to be processed. Only, the arithmetic processing step of performing arithmetic processing on the processed image field and the left and right shifted image field and storing the result of the arithmetic processing in the processed image field, and the data transfer processing step and the arithmetic processing step from the left and right direction. Repeat until all transfer calculation processing is completed And a morphological operation processing method.
【請求項15】 請求項12記載のモルフォロジー演算
処理方法において、原画像フィールド又は片方の上下シ
フト画像フィールドの特定のビットに対するマスク検索
と、1回のシフトアップあるいはシフトダウン処理と、
他方の上下シフト画像フィールドの対応するビットに対
する並列部分書き込みとを、データのビット数繰り返す
内部ワード転送ステップと、 連想メモリのアドレスを用いたワードへのデータの読み
書き機能を用いて、奇数又は偶数連想メモリ群の上位又
は下位ワード群の特定のワードの原画像フィールド又は
片方の上限シフト画像フィールドの全ビットを、対応す
る偶数又は奇数連想メモリ群の他方の上下シフト画像フ
ィールドに上位又は下位境界ワードを転送するステップ
とを備えたことを特徴とするモルフォロジー演算処理方
法。
15. The morphological operation processing method according to claim 12, wherein a mask search for a specific bit in the original image field or one of the upper and lower shift image fields and one shift up or shift down process are performed.
By using the internal word transfer step that repeats the parallel partial writing for the corresponding bit of the other vertical shift image field by the number of bits of data, and the function of reading and writing data to the word using the address of the associative memory, All bits of the original image field or one upper shift image field of a particular word of the upper or lower word group of the memory group, and the upper or lower boundary word of the other upper or lower shift image field of the corresponding even or odd associative memory group. And a step of transferring the morphological operation processing method.
JP29914596A 1995-11-10 1996-11-11 Two-dimensional PE array device, data transfer method, and morphological operation processing method Expired - Lifetime JP3726977B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP29914596A JP3726977B2 (en) 1995-11-10 1996-11-11 Two-dimensional PE array device, data transfer method, and morphological operation processing method

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP31757495 1995-11-10
JP7-317574 1995-11-10
JP8-65356 1996-02-27
JP6535696 1996-02-27
JP29914596A JP3726977B2 (en) 1995-11-10 1996-11-11 Two-dimensional PE array device, data transfer method, and morphological operation processing method

Publications (2)

Publication Number Publication Date
JPH09293065A true JPH09293065A (en) 1997-11-11
JP3726977B2 JP3726977B2 (en) 2005-12-14

Family

ID=27298751

Family Applications (1)

Application Number Title Priority Date Filing Date
JP29914596A Expired - Lifetime JP3726977B2 (en) 1995-11-10 1996-11-11 Two-dimensional PE array device, data transfer method, and morphological operation processing method

Country Status (1)

Country Link
JP (1) JP3726977B2 (en)

Also Published As

Publication number Publication date
JP3726977B2 (en) 2005-12-14

Similar Documents

Publication Publication Date Title
US11170294B2 (en) Hardware accelerated machine learning
Ma et al. End-to-end scalable FPGA accelerator for deep residual networks
JP2756257B2 (en) Parallel processing system and method
US6205533B1 (en) Mechanism for efficient data access and communication in parallel computations on an emulated spatial lattice
US5144563A (en) Method and apparatus for optimizing element placement and method and apparatus for deciding the optimal element placement
JP3251421B2 (en) Semiconductor integrated circuit
EP0773502B1 (en) Two-dimensional associative processor and data transfer method
US6185667B1 (en) Input/output support for processing in a mesh connected computer
EP1070295A1 (en) Pattern generation and shift plane operations for a mesh connected computer
KR19990077230A (en) Image-Processing Processor
JPH04267466A (en) Parallel processing system and data comparing method
US20200167405A1 (en) Convolutional operation device with dimensional conversion
Jenq et al. Reconfigurable Mesh Algorithms for Image Shrinking, Expanding, Clustering, and Template Matching.
EP1792258B1 (en) Interconnections in simd processor architectures
Jonker Why linear arrays are better image processors
JPH06162227A (en) Vector parallel computer
JPH09293065A (en) Two-dimensional pe array device, associative memory, data transfer method and morphology arithmetic processing method
JP3627953B2 (en) PE array device and associative memory block
JP2021005242A (en) Information processing device, information processing program, and information processing method
Cantoni et al. Hierarchical architectures for computer vision
Kasagi et al. Offline Permutation on the CUDA-enabled GPU
Maziarz et al. Rapid prototyping of parallel processing systems on TESH network
JPH0727515B2 (en) Two-dimensional mesh array processing element
Chuang et al. SIMD hypercube algorithm for complete Euclidean distance transform
Hoffmann Global Cellular Automata GCA--A Massively Parallel Computing Model

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050107

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050308

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Effective date: 20050916

Free format text: JAPANESE INTERMEDIATE CODE: A01

RD01 Notification of change of attorney

Effective date: 20050922

Free format text: JAPANESE INTERMEDIATE CODE: A7426

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050922

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091007

Year of fee payment: 4

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101007

Year of fee payment: 5

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111007

Year of fee payment: 6

FPAY Renewal fee payment (prs date is renewal date of database)

Year of fee payment: 6

Free format text: PAYMENT UNTIL: 20111007

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121007

Year of fee payment: 7