JPS6326912B2 - - Google Patents

Info

Publication number
JPS6326912B2
JPS6326912B2 JP6232682A JP6232682A JPS6326912B2 JP S6326912 B2 JPS6326912 B2 JP S6326912B2 JP 6232682 A JP6232682 A JP 6232682A JP 6232682 A JP6232682 A JP 6232682A JP S6326912 B2 JPS6326912 B2 JP S6326912B2
Authority
JP
Japan
Prior art keywords
arithmetic
image data
processor
arithmetic circuit
circuit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP6232682A
Other languages
Japanese (ja)
Other versions
JPS58181171A (en
Inventor
Yoshiki Kobayashi
Tadashi Fukushima
Yoshuki Okuyama
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP6232682A priority Critical patent/JPS58181171A/en
Publication of JPS58181171A publication Critical patent/JPS58181171A/en
Publication of JPS6326912B2 publication Critical patent/JPS6326912B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/20Processor architectures; Processor configuration, e.g. pipelining

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Image Processing (AREA)

Description

【発明の詳細な説明】 本発明は、空間積和演算等の局所近傍画像処理
を実行する並列画像処理プロセツサに係り、特に
LSI化に適したアーキテクチヤを有する並列画像
処理プロセツサに関する。
DETAILED DESCRIPTION OF THE INVENTION The present invention relates to a parallel image processing processor that performs local neighborhood image processing such as spatial product-sum operations, and particularly relates to
This invention relates to a parallel image processing processor with an architecture suitable for LSI.

画像処理プロセツサは、通産省大型プロジエク
ト「パターン情報処理システム」(昭和55年10月
に研究開発成果発表論文集が発行されている。)
にて開発されているように、画像データを並列処
理し高速化を図ろうとしているものが多い。画像
データは2次元の広がりをもつため、全ての画像
データを並列処理することは困難である。しか
し、ノイズ除去や輪郭抽出機能を実現する空間積
和演算等のように、近傍の画像データ間の演算が
多いため、例えば画像のm行×n列の局所的なデ
ータを並列処理する例が多い。このような局所並
列形画像処理は、前記文献あるいは 木戸出正継:画像処理ハードウエアの動向:情
報処理コンピユータビジヨン研究会資料8−6
(1980年9月)にて総括的に説明されているが、
CCDアナログ処理形を除いてLSI化されたものは
ない。従来のアーキテクチヤのプロセツサをその
まゝLSI化するには、 集積度 ピン数 本発明の目的は、LSI化に適したアーキテクチ
ヤであつて、かつ、高速処理に適した並列画像処
理プロセツサを提供するにある。
The image processing processor is part of the Ministry of International Trade and Industry's large-scale project ``Pattern Information Processing System'' (a collection of research and development results was published in October 1980).
Many of them are trying to speed up the processing of image data in parallel, as has been developed in . Since image data has a two-dimensional spread, it is difficult to process all image data in parallel. However, since there are many calculations between neighboring image data, such as spatial product-sum calculations that realize noise removal and contour extraction functions, for example, it is difficult to process local data in m rows by n columns of an image in parallel. many. This type of locally parallel image processing is described in the above-mentioned document or Masatsugu Kido: Trends in Image Processing Hardware: Information Processing Computer Vision Study Group Material 8-6.
(September 1980), which is comprehensively explained.
There are no LSI versions other than the CCD analog processing type. In order to convert a processor with a conventional architecture into an LSI, the following steps must be taken: Integration degree Number of pins The purpose of the present invention is to provide a parallel image processing processor with an architecture suitable for LSI conversion and also suitable for high-speed processing. There is something to do.

本発明の特徴は、画像データ入力ポートと、前
記画像データ入力ポートからの画像データを順次
取込む複数個のシフトレジスタと、前記各シフト
レジスタの内容を入力して画像処理演算を行なう
複数個のプロセツサエレメントと、前記各プロセ
ツサエレメントの演算結果を加算する第1の演算
回路と、前段の基本モジユールにおける演算結果
データを入力する演算結果データ入力ポートと、
前記演算結果データと前記第1の演算回路の演算
結果の加算を行なう第2の演算回路と、前記第2
の演算回路の演算結果データを出力する演算結果
データ出力ポートと、前記シフトレジスタと前記
プロセツサエレメントとの間、前記プロセツサエ
レメントと前記第1の演算回路との間、および前
記第1の演算回路と前記第2の演算回路との間に
配置されたパイプラインレジスタとを基本モジユ
ール化したこと、更には、前記演算結果データ入
力ポートと前記第2の演算回路との間に第2のパ
イプラインレジスタを挿入して基本モジユール化
したところにある。
The present invention is characterized by an image data input port, a plurality of shift registers that sequentially take in image data from the image data input port, and a plurality of shift registers that input the contents of each of the shift registers and perform image processing operations. a processor element, a first arithmetic circuit that adds the arithmetic results of each of the processor elements, and an arithmetic result data input port that inputs arithmetic result data of the basic module at the previous stage;
a second arithmetic circuit that adds the arithmetic result data and the arithmetic result of the first arithmetic circuit;
between an operation result data output port that outputs operation result data of an operation circuit, between the shift register and the processor element, between the processor element and the first operation circuit, and between the first operation A pipeline register disposed between the circuit and the second arithmetic circuit is basically modularized, and further, a second pipe is provided between the arithmetic result data input port and the second arithmetic circuit. This is where line registers are inserted to create a basic module.

第1図〜第3図は、最近考えられている本発明
の前提を成す一実施例図である。
FIGS. 1 to 3 are diagrams of an embodiment that forms the premise of the present invention, which has been recently considered.

第1図は典型的な画像処理システムの構成を示
すもので、画像入力装置として工業用テレビジヨ
ンカメラ5、画像記憶装置として画像メモリ3、
及びこの内容を表示するCRTモニタ4が設けら
れている。画像メモリ3の画像情報が画像処理プ
ロセツサ2により処理され、この結果がまた画像
メモリ3に格納されたり、あるいはシステム全体
を制御する管理プロセツサ1に与えられる。
FIG. 1 shows the configuration of a typical image processing system, in which an industrial television camera 5 is used as an image input device, an image memory 3 is used as an image storage device, and an image memory 3 is used as an image storage device.
A CRT monitor 4 for displaying this content is also provided. The image information in the image memory 3 is processed by the image processing processor 2, and the results are also stored in the image memory 3 or provided to the management processor 1 which controls the entire system.

代表的な画像処理機能として空間積和演算があ
る。これは第2図に示すように、例えば4×4画
素の局所画像データf11〜f44に対し、定められた
荷重w11〜w44を乗算し総和をとるものである。
A typical image processing function is spatial product-sum operation. As shown in FIG. 2, for example, local image data of 4×4 pixels f 11 to f 44 are multiplied by predetermined loads w 11 to w 44 and the sum is calculated.

これにより ノイズ除去 輪郭強調 等の画像処理が行える。This results in noise removal Contour enhancement Image processing such as

このような、例えば4×4画素の局所画像デー
タを処理する画像処理プロセツサとして、第3図
に示すような4個のプロセツサエレメント(PE
#1〜#4)12をもつ画像処理プロセツサ基本
モジユール10を4モジユール組合せた並列画像
処理プロセツサ(タイプと呼ぶ)2−として
いる。画像メモリ3からは、局所画像データが1
列分(第3図ではf14〜f44)並列に与えられ、そ
の演算結果(第3図ではg)が画像メモリ3に格
納される。
As an image processing processor that processes local image data of, for example, 4×4 pixels, there are four processor elements (PE) as shown in Figure 3.
A parallel image processing processor (referred to as a type) 2- is a combination of four image processing processor basic modules 10 having image processing processors #1 to #4) 12. From the image memory 3, the local image data is 1
Columns (f 14 to f 44 in FIG. 3) are applied in parallel, and the calculation result (g in FIG. 3) is stored in the image memory 3.

基本モジユール10は、処理対象の行の画像デ
ータを取込む画像データ入力ポート24、内部処
理結果を出力する演算結果データ出力ポート35
をもつ。画像データf14が入力されたとき、シフ
トレジスタ11を介して1画素毎隣接した画素
f13,f12,f11も対応するPE#4〜1に入力され
る。画素f11は、空間積和演算のサイズを4×4
以上に拡張する場合のために、画像データ出力ポ
ート25から出力される。PE12には、シフト
レジスタ11からの処理対象の画像データfと、
荷重記憶メモリ15からの荷重データwが与えら
れ、乗算が実行される。この結果が4個のPE1
2の結果を加算する演算回路13により部分和が
とられる。演算結果入力ポート30から入力され
る部分和が演算回路14により次々と累算され、
演算結果出力ポート35より次段の基本モジユー
ル10に出力される。
The basic module 10 includes an image data input port 24 that takes in image data of a row to be processed, and a calculation result data output port 35 that outputs internal processing results.
have. When image data f 14 is input, each adjacent pixel is transferred through the shift register 11.
f 13 , f 12 , and f 11 are also input to corresponding PE#4-1. For pixel f 11 , the size of the spatial product-sum operation is 4×4
In case of expansion above, the image data is outputted from the image data output port 25. The PE 12 contains image data f to be processed from the shift register 11,
Load data w from the load storage memory 15 is given, and multiplication is performed. This result is 4 PE1
A partial sum is calculated by the arithmetic circuit 13 which adds the results of the two results. The partial sums input from the calculation result input port 30 are accumulated one after another by the calculation circuit 14,
The calculation result output port 35 outputs the result to the basic module 10 at the next stage.

このようにして、基本モジユール10を4段重
ねることにより、最終基本モジユール10Dから
g=4,4i,j=1,1 fi,j*wij が出力される。
In this way, by stacking the basic modules 10 in four stages, g= 4,4i,j=1,1 f i,j *w ij is output from the final basic module 10D.

このタイムチヤートを第4図に示す。前述した
演算が基本クロツク時間Δt1内に実行され結果g
が出力され、次のΔt1では1画素分だけ移動した
4×4絵素の入力画像に対する結果gが出力され
ることになる。したがつて、次々と入力される画
像データに対する全ての4×4絵素の空間積和演
算結果が次々と出力される。
This time chart is shown in FIG. The above calculation is executed within the basic clock time Δt1 and the result g
is output, and in the next Δt1, the result g for the input image of 4×4 picture elements shifted by one pixel is output. Therefore, the spatial product-sum calculation results of all 4×4 picture elements for image data that are input one after another are output one after another.

第5図は本発明による並列画像処理プロセツサ
の一実施例であつて、前述の実施例のタイプI画
像処理プロセツサ2−の基本クロツク時間Δt1
を、パイプライン処理により短縮化した構成を示
すものである。これをタイプのパイプラインバ
ージヨンの並列画像処理プロセツサ2−Pと呼
ぶ。即ち、タイプでは基本クロツク時間Δt1は 画像データfi,jのシフトレジスタ11への入力
処理 プロセツサエレメント12による積和荷重
wi,jと画像fi,jとの乗算処理 演算回路13による部分和処理 演算回路14による部分和累算処理 の全ての処理時間の和以上である必要があつた。
これに対して、例えば第5図の例のように、と
、と、及びとの間にパイプラインレジ
スタ16を介在させることにより、その基本クロ
ツク時間Δt2を〜の処理時間のうちの最大の
もの(全ての和でない)まで小さくすることが可
能になる。このタイムチヤートを第6図に示す。
時刻1で処理、2で、3で、4でが実行
される。時刻2では次の入力画像に対する処理
、3で、4で、5でが実行され、次々と
各構成要素をパイプライン的に動作させその処理
速度を向上することができる。
FIG. 5 shows an embodiment of the parallel image processing processor according to the present invention, in which the basic clock time Δt1 of the type I image processing processor 2- of the above-mentioned embodiment is shown.
This figure shows a configuration that is shortened by pipeline processing. This is called a pipeline version parallel image processing processor 2-P. That is, in the type, the basic clock time Δt1 is the input processing of image data f i,j to the shift register 11, and the sum-of-products load by the processor element 12.
The multiplication process of w i,j and the image f i,j, the partial sum processing by the arithmetic circuit 13, and the partial sum accumulation process by the arithmetic circuit 14 had to be longer than the sum of all processing times.
On the other hand, by interposing the pipeline register 16 between and, as in the example of FIG. (not the sum of all). This time chart is shown in FIG.
The process is executed at time 1, and at time 2, 3, and 4. At time 2, the processing for the next input image, at time 3, at time 4, and at time 5 are executed, and by operating each component one after another in a pipeline manner, it is possible to improve the processing speed.

第7図は本発明の第2の実施例であり、前述の
並列画像処理プロセツサ2−Pの基本クロツク
Δt2を更に短縮化しうる構成を示したもので、タ
イプのパイプラインースキユーバージヨンの並
列画像処理プロセツサ2−PSと呼ぶ。第5図
のPタイプでの基本クロツク時間Δt2は、処理
の部分和累積時間により制約される可能性が強
い。というのは基本モジユール10をn段にした
場合、Δt2は演算回路14での処理時間と演算結
果30,35の入出力時間との和のn倍の時間が
必要になるからである。特に基本モジユール10
をLSI化した場合は入出力遅延時間は無視できな
い。このため、第5図のタイプIPに更に部分和
の累積のパスにパイプラインレジスタ16を入
れ、基本モジユール10A〜D間での演算もパイ
プライン処理するようにしたもので、前述のΔt2
の時間規制を1/nにしている。この第7図のPS
タイプでは、第8図のタイムチヤートで示すよう
に、同時刻3で各基本モジユール10A〜Dの部
分和が算出され累積の部分でのタイミングが合わ
なくなる。第7図のPSでは、このタイミング
合せのための可変段数スキユー補正用シフトレジ
スタ17を画像データ入力ポート24に直後に設
置している。各基本モジユール10A〜Dの累積
パスでのパイプライン段数は1段であるため、可
変段数スキユー補正用シフトレジスタ17の段数
は、 基本モジユール10A………0段 〃 B………1段 〃 C………2段 〃 D………3段 に設定される。このようにして第8図のタイムチ
ヤートにおける不整合(………部)が補正され、
連続したΔt3時間でのパイプライン動作が可能と
なる。
FIG. 7 shows a second embodiment of the present invention, which shows a configuration in which the basic clock Δt2 of the parallel image processing processor 2-P described above can be further shortened. It is called the processing processor 2-PS. The basic clock time Δt2 in the P type shown in FIG. 5 is highly likely to be constrained by the partial sum accumulation time of processing. This is because when the basic module 10 has n stages, Δt2 requires n times the sum of the processing time in the arithmetic circuit 14 and the input/output time of the arithmetic results 30 and 35. Especially basic module 10
When converting into LSI, input/output delay time cannot be ignored. For this reason, a pipeline register 16 is further added to the type IP shown in FIG.
The time regulation is set to 1/n. PS of this figure 7
In the type, as shown in the time chart of FIG. 8, the partial sums of the basic modules 10A to 10D are calculated at the same time 3, and the timing in the cumulative part does not match. In the PS shown in FIG. 7, a variable stage skew correction shift register 17 for timing adjustment is installed immediately after the image data input port 24. Since the number of pipeline stages in the cumulative path of each basic module 10A to D is one stage, the number of stages of the variable stage skew correction shift register 17 is as follows: Basic module 10A...0 stage B...1 stage C ......2 stages D......Set to 3 stages. In this way, the inconsistency (... section) in the time chart of Fig. 8 is corrected,
Pipeline operation is possible for continuous Δt3 time.

なお、容易にわかるように、スキユレジスタ1
7は、部分和を求める演算回路13の直後に設置
しても、あるいは各PE12の直前、直後に設置
しても同様にタイミングの不整合は解決される。
In addition, as can be easily understood, the skew register 1
7 can be installed immediately after the arithmetic circuit 13 for calculating the partial sum, or even if it is installed immediately before or after each PE 12, the timing mismatch will be solved in the same way.

第9図に、処理形態が異なるタイプの構成を
示し、このようなタイプであつても前記実施例
と同様、パイプライン処理を適用することができ
る。前述までのの構成では、画像データ入力を
シフトレジスタ11を介ちて各PE12#1〜4
に隣接する絵素を分配していた。これに対し本実
施例では、入力画像データは各PE12#1〜4
に共通に与え、この乗算結果を演算回路18、レ
ジスタ19を介して累算して部分和Σ1を出力す
るようにしている。この動作を第10図のタイム
チヤートを参照して説明する。
FIG. 9 shows configurations of different types of processing, and even in such types, pipeline processing can be applied as in the above embodiment. In the configuration described above, image data is input to each PE 12#1 to 4 via the shift register 11.
It distributed pixels adjacent to . On the other hand, in this embodiment, the input image data is
are given in common, and the multiplication results are accumulated via an arithmetic circuit 18 and a register 19 to output a partial sum Σ1 . This operation will be explained with reference to the time chart in FIG.

時刻1で画像データ入力ポート20より画像
f11が入力され、PE12#1にて荷重記憶メモリ1
5から読み出された荷重w11との積f11*w11がレ
ジスタ19#2にセツトされる。
Image from image data input port 20 at time 1
f 11 is input, load storage memory 1 is input at PE12#1
The product f 11 *w 11 with the load w 11 read from 5 is set in register 19 #2.

時刻2で画像データf12が入力され、PE12
#2にて荷重w12との積f12*w12がとられ、これ
とレジスタ19#2の値f11*w11との和がf11
w11+f12*w12が演算回路18でとられ、レジス
タ19#3にセツトされる。
Image data f12 is input at time 2, and PE12
In #2, the product f 12 * w 12 with the load w 12 is taken, and the sum of this and the value f 11 *w 11 of register 19 #2 is f 11 *
w 11 +f 12 *w 12 is taken by the arithmetic circuit 18 and set in register 19#3.

時刻3で画像データf13が入力され、PE12
#3にて荷重w13との積f13*w13がとられ、これ
とレジスタ19#3の値f11*w11+f12*w12との
和f11*w11+f12*w12+f13*w13が演算回路18
でとられ、レジスタ19#4にセツトされる。
Image data f13 is input at time 3, and PE12
At #3, the product f 13 *w 13 with the load w 13 is taken, and the sum of this and the value f 11 *w 11 +f 12 *w 12 of register 19 #3 is f 11 *w 11 +f 12 *w 12 +f 13 *w 13 is the calculation circuit 18
and set in register 19#4.

時刻4で画像データf14が入力され、PE12
#4にて荷重w14との積f14*w14がとられ、これ
とレジスタ19#4の値f11*w11+f12*w12+f13
*w13との和Σ1 11=f11*w11+〜+f14*w14が演算
回路18でとられる。この部分和Σ1が各基本モ
ジユール10A〜Dの演算回路14で累積され、
最終段から g=4,4i,j=1,1 fi,j*wi,j が出力される。
Image data f14 is input at time 4, and PE12
At #4, the product f 14 * w 14 with the load w 14 is taken, and this and the value of register 19 #4 f 11 *w 11 +f 12 *w 12 +f 13
The sum Σ 1 11 = f 11 *w 11 +~+f 14 *w 14 with *w 13 is taken by the arithmetic circuit 18 . This partial sum Σ 1 is accumulated in the arithmetic circuit 14 of each basic module 10A to D,
g= 4,4i,j=1,1 f i,j *w i,j is output from the final stage.

以下、各基本クロツク時間Δt4間隔で空間積和
演算結果gが出力される。
Thereafter, the spatial product-sum calculation result g is output at intervals of each basic clock time Δt4.

このタイプの並列画像処理プロセツサ2−
にも、タイプと同様に、タイプP及びPS
が考えられ、基本クロツク時間Δt4を小さくする
ことが可能である。これらは容易に類推できるの
でここでは省略する。
This type of parallel image processing processor 2-
Also, types P and PS as well as types
can be considered, and it is possible to reduce the basic clock time Δt4. Since these can be easily inferred, they are omitted here.

第11図に、更に処理形態が異なる他の実施例
を示す。前述までの各PE12に独立に積和荷重
(メモリ)15を与えていた方式に対し、第11
図の構成では全PE12共通に積和荷重(メモリ)
25を与える方式でありタイプの並列画像処理
プロセツサ2−と呼ぶ。この動作を第12図の
タイムチヤートを参照して説明する。
FIG. 11 shows another embodiment with a further different processing form. In contrast to the method described above in which a product-sum load (memory) 15 was applied independently to each PE
In the configuration shown in the figure, the product-sum load (memory) is common to all PE12.
25, and is called a type of parallel image processing processor 2-. This operation will be explained with reference to the time chart in FIG.

まず時刻1で既に画像データ入力ポート20よ
り画像f14が入力されているとする。このときシ
フトレジスタ11を介してPE12#1〜#4に
はそれぞれf11,f12,f13,f14が与えられている。
そして荷重記憶メモリ15から荷重w11が読み出
され、それぞれの入力画像との積がとられる。演
算回路20では、時刻1のはじめに保持している
値が“0”クリアされ、前述のf11〜f14とw11との
積がそれぞれ保持される。
First, it is assumed that the image f14 has already been input from the image data input port 20 at time 1. At this time, f 11 , f 12 , f 13 , and f 14 are given to PEs 12 #1 to #4 via the shift register 11, respectively.
The load w 11 is then read out from the load storage memory 15 and multiplied by each input image. In the arithmetic circuit 20, the value held at the beginning of time 1 is cleared to "0", and the products of the aforementioned f11 to f14 and w11 are held respectively.

時刻2では画像f15が入力され、PE12#1〜
#4にはそれぞれf1215が与えられ、次の荷重
w12との積がとられる。この後演算回路20で以
前の値との累積処理が行われる。例えば#1では
f11*w11+f12*w12、#2ではf12*w11+f13*w12
が結果として保持される。
At time 2, image f15 is input, and PE12#1~
#4 is given f 12 ~ 15 respectively and the following loads
The product is taken with w 12 . Thereafter, the arithmetic circuit 20 performs an accumulation process with the previous value. For example, in #1
f 11 *w 11 +f 12 *w 12 , f 12 *w 11 +f 13 *w 12 in #2
is retained as a result.

時刻3,4でも同上の処理が実行され、演算回
路20#1〜#4には #1:Σ1 11=f11*w11+f12*w12+f13*w13+f14
w14 #2:Σ1 12=f12*w11+f13*w12+f14*w13+f15
w14 #3:Σ1 13=f13*w11+f14*w12+f15*w13+f16
w14 #4:Σ1 14=f14*w11+f15*w12+f16*w13+f17
w14 とそれぞれの第1部分和が得られ、これが時刻Δ
の終りでシフトレジスタ21にセツトされる。
The same processing as above is executed at times 3 and 4, and the arithmetic circuits 20 #1 to #4 have #1: Σ 1 11 = f 11 * w 11 + f 12 * w 12 + f 13 * w 13 + f 14 *
w 14 #2:Σ 1 12 =f 12 *w 11 +f 13 *w 12 +f 14 *w 13 +f 15 *
w 14 #3:Σ 1 13 =f 13 *w 11 +f 14 *w 12 +f 15 *w 13 +f 16 *
w 14 #4:Σ 1 14 =f 14 *w 11 +f 15 *w 12 +f 16 *w 13 +f 17 *
w 14 and the respective first partial sums are obtained, and this is obtained at time Δ
It is set in the shift register 21 at the end of the process.

時刻5〜8では、各基本モジユール10A〜D
のシフトレジスタ21から、Σ1 11〜Σ4 11,Σ1 12
Σ4 12,Σ1 13〜Σ4 13,Σ1 14〜Σ4 14が演算回路14に
より
順次累積され、結果g11〜g14を出力する。と同時
に、PE#1では画像データf15〜f18、PE#2では
f16〜f19、PE#3ではf17〜f20、PE#4ではf18
f21に対して時刻1〜4と同様の処理が実行され、
部分和Σ1 15,Σ1 16,Σ1 17,Σ1 18を求め、時刻9〜1

にてこれらが累積され結果g15〜g18が得られる。
このようにして連続して空間積和演算結果が出力
される。
At times 5-8, each basic module 10A-D
From the shift register 21, Σ 1 11 ~ Σ 4 11 , Σ 1 12 ~
Σ 4 12 , Σ 1 13 to Σ 4 13 , Σ 1 14 to Σ 4 14 are sequentially accumulated by the arithmetic circuit 14, and the results g 11 to g 14 are output. At the same time, image data f 15 to f 18 in PE #1 and image data f 15 to f 18 in PE #2
f 16 ~ f 19 , f 17 ~ f 20 for PE#3, f 18 ~ for PE #4
The same processing as times 1 to 4 is executed for f 21 ,
Find the partial sums Σ 1 15 , Σ 1 16 , Σ 1 17 , Σ 1 18 , and calculate from time 9 to 1.
2
These are accumulated and results g 15 to g 18 are obtained.
In this way, spatial product-sum calculation results are continuously output.

このタイプの並列画像処理プロセツサ2−
にも、タイプと同様に、タイプP及びPS
が考えられ、基本クロツク時間Δt5を小さくする
ことが可能である。
This type of parallel image processing processor 2-
Also, types P and PS as well as types
can be considered, and it is possible to reduce the basic clock time Δt5.

本発明によれば、拡張性に優れていることから
LSI化に適し、かつ処理速度の高速化を図ること
ができるアーキテクチヤとすることができる。
According to the present invention, since it is excellent in expandability,
It is possible to use an architecture that is suitable for LSI implementation and can increase processing speed.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は画像処理システムの構成を示す図、第
2図は局所並列処理の例を説明する図、第3図、
第9図及び第11図は本発明の適用対象となる並
列画像処理プロセツサのブロツク図、第5図及び
第7図は本発明による並列画像処理プロセツサの
一実施例図、第4図、第6図、第8図、第10
図、第12図は各並列画像処理プロセツサのタイ
ムチヤートを示す図である。 2……並列画像処理プロセツサ、3……画像メ
モリ、10……画像処理プロセツサ基本モジユー
ル、11……入力画像シフトレジスタ、12……
プロセツサエレメント、13……部分和演算回
路、14……部分和累演算回路、15……荷重記
憶メモリ、16……パイプラインレジスタ、17
……(可変段数)スキユー補正シフトレジスタ、
18……伝播・累積演算回路、19……伝播レジ
スタ、20……累積演算回路、21……部分和出
力シフトレジスタ、24……画像データ入力ポー
ト、25……画像データ出力ポート、30……演
算結果データ入力ポート、35……演算結果デー
タ出力ポート。
Figure 1 is a diagram showing the configuration of an image processing system, Figure 2 is a diagram explaining an example of local parallel processing, Figure 3 is a diagram showing an example of local parallel processing,
9 and 11 are block diagrams of a parallel image processing processor to which the present invention is applied, FIGS. 5 and 7 are diagrams of an embodiment of the parallel image processing processor according to the present invention, and FIGS. Figure, Figure 8, Figure 10
12 are diagrams showing time charts of each parallel image processing processor. 2... Parallel image processing processor, 3... Image memory, 10... Image processing processor basic module, 11... Input image shift register, 12...
Processor element, 13...Partial sum calculation circuit, 14...Partial sum accumulation calculation circuit, 15...Load storage memory, 16...Pipeline register, 17
...(variable number of stages) skew correction shift register,
18... Propagation/accumulation calculation circuit, 19... Propagation register, 20... Accumulation calculation circuit, 21... Partial sum output shift register, 24... Image data input port, 25... Image data output port, 30... Calculation result data input port, 35... Calculation result data output port.

Claims (1)

【特許請求の範囲】 1 画像データ供給源からの画像データを取込み
局所並列画像データ処理を行なう並列画像処理プ
ロセツサにおいて、画像データ入力ポートと、前
記画像データ入力ポートからの画像データを順次
取込む複数個のシフトレジスタと、前記各シフト
レジスタの内容を入力して画像処理演算を行なう
複数個のプロセツサエレメントと、前記各プロセ
ツサエレメントの演算結果を加算する第1の演算
回路と、前段の基本モジユールにおける演算結果
データを入力する演算結果データ入力ポートと、
前記演算結果データと前記第1の演算回路の演算
結果の加算を行なう第2の演算回路と、前記第2
の演算回路の演算結果データを出力する演算結果
データ出力ポートと、前記シフトレジスタと前記
プロセツサエレメントとの間、前記プロセツサエ
レメントと前記第1の演算回路との間、および前
記第1の演算回路と前記第2の演算回路との間に
配置されたパイプラインレジスタとからなる画像
処理プロセツサ基本モジユールを、複数組並列配
置したことを特徴とする並列画像処理プロセツ
サ。 2 画像データ供給源からの画像データを取込み
局所並列画像データ処理を行なう並列画像処理プ
ロセツサにおいて、画像データ入力ポートと、前
記画像データ入力ポートからの画像データを順次
取込みシフトレジスタと、前記各シフトレジスタ
の内容を入力して画像処理演算を行なう複数個の
プロセツサエレメントと、前記各プロセツサエレ
メントの演算結果を加算する第1の演算回路と、
前段の基本モジユールにおける演算結果データを
入力する演算結果データ入力ポートと、前記演算
結果データと前記第1の演算回路の演算結果の加
算を行なう第2の演算回路と、前記第2の演算回
路の演算結果データを出力する演算結果データ出
力ポートと、前記シフトレジスタと前記プロセツ
サエレメントとの間、前記プロセツサエレメント
と前記第1の演算回路との間、および前記第1の
演算回路と前記第2の演算回路との間に配置され
た第1のパイプラインレジスタと、前記演算結果
データ入力ポートと前記第2の演算回路との間に
配置された第2のパイプラインレジスタとからな
る画像処理プロセツサ基本モジユールを、複数組
並列設置したことを特徴とする並列画像処理プロ
セツサ。
[Scope of Claims] 1. A parallel image processing processor that takes in image data from an image data supply source and performs local parallel image data processing, including an image data input port and a plurality of processors that sequentially take in image data from the image data input ports. a plurality of processor elements that input the contents of each of the shift registers and perform image processing operations; a first arithmetic circuit that adds the operation results of each of the processor elements; a calculation result data input port for inputting calculation result data in the module;
a second arithmetic circuit that adds the arithmetic result data and the arithmetic result of the first arithmetic circuit;
between an operation result data output port that outputs operation result data of an operation circuit, between the shift register and the processor element, between the processor element and the first operation circuit, and between the first operation 1. A parallel image processing processor characterized in that a plurality of sets of image processing processor basic modules each consisting of a circuit and a pipeline register arranged between the circuit and the second arithmetic circuit are arranged in parallel. 2. A parallel image processing processor that takes in image data from an image data supply source and performs local parallel image data processing, including an image data input port, a shift register that sequentially takes in image data from the image data input port, and each of the shift registers. a plurality of processor elements that input the contents of and perform image processing operations; a first arithmetic circuit that adds the operation results of each of the processor elements;
an arithmetic result data input port for inputting arithmetic result data in the preceding basic module; a second arithmetic circuit for adding the arithmetic result data and the arithmetic result of the first arithmetic circuit; between an arithmetic result data output port that outputs arithmetic result data, the shift register and the processor element, between the processor element and the first arithmetic circuit, and between the first arithmetic circuit and the first arithmetic circuit. image processing comprising a first pipeline register disposed between the second arithmetic circuit and the second arithmetic circuit; and a second pipeline register disposed between the arithmetic result data input port and the second arithmetic circuit. A parallel image processing processor characterized in that a plurality of processor basic modules are installed in parallel.
JP6232682A 1982-04-16 1982-04-16 Parallel picture processing processor Granted JPS58181171A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6232682A JPS58181171A (en) 1982-04-16 1982-04-16 Parallel picture processing processor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6232682A JPS58181171A (en) 1982-04-16 1982-04-16 Parallel picture processing processor

Related Child Applications (2)

Application Number Title Priority Date Filing Date
JP26640987A Division JPS63140379A (en) 1987-10-23 1987-10-23 Parallel-picture processor
JP26640887A Division JPS63219082A (en) 1987-10-23 1987-10-23 Parallel image processor

Publications (2)

Publication Number Publication Date
JPS58181171A JPS58181171A (en) 1983-10-22
JPS6326912B2 true JPS6326912B2 (en) 1988-06-01

Family

ID=13196895

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6232682A Granted JPS58181171A (en) 1982-04-16 1982-04-16 Parallel picture processing processor

Country Status (1)

Country Link
JP (1) JPS58181171A (en)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6055477A (en) * 1983-09-07 1985-03-30 Agency Of Ind Science & Technol Uniform weight linear filter circuit
JPS60134991A (en) * 1983-12-23 1985-07-18 Toshiba Corp Picture processor
JPS60151789A (en) * 1984-01-19 1985-08-09 Hitachi Ltd Multifunctional processor of picture
JPH0792824B2 (en) * 1984-10-30 1995-10-09 日本電気株式会社 Real-time video processor
JPH0624008B2 (en) * 1984-11-29 1994-03-30 株式会社日立製作所 Parallel image processing processor
JPS621074A (en) * 1985-02-01 1987-01-07 Hitachi Ltd Parallel picture processor
JPS61251973A (en) * 1985-04-30 1986-11-08 Fanuc Ltd Image processing device
JPS61251972A (en) * 1985-04-30 1986-11-08 Fanuc Ltd Image processing device
JPS61251974A (en) * 1985-04-30 1986-11-08 Fanuc Ltd Image processing device
JPS61288282A (en) * 1985-06-17 1986-12-18 Fujitsu Ltd Picture filtering device
JPS6373380A (en) * 1986-09-16 1988-04-02 Matsushita Electric Ind Co Ltd Image processor
JPS62140184A (en) * 1985-12-16 1987-06-23 Matsushita Electric Ind Co Ltd Local image processor
JPH0831966B2 (en) * 1985-12-23 1996-03-27 日本電気株式会社 Real-time video processor
DE3804938C2 (en) 1987-02-18 1994-07-28 Canon Kk Image processing device
US4987557A (en) * 1987-06-25 1991-01-22 Fanuc Ltd. System for calculation of sum of products by repetitive input of data
JPH03192477A (en) * 1989-12-22 1991-08-22 Nec Corp Two-dimensional fir digital filtering system and circuit
US5673066A (en) * 1992-04-21 1997-09-30 Alps Electric Co., Ltd. Coordinate input device

Also Published As

Publication number Publication date
JPS58181171A (en) 1983-10-22

Similar Documents

Publication Publication Date Title
JPS6326912B2 (en)
JPS6053349B2 (en) image processing processor
US4635292A (en) Image processor
EP0518462B1 (en) Filtering system and operation method for very high-speed image processing
US4644488A (en) Pipeline active filter utilizing a booth type multiplier
US4791677A (en) Image signal processor
JPH0260028B2 (en)
Zhou et al. Novel design of multiplier-less FFT processors
JPS6379180A (en) Lsi for processing parallel image
JPS63140379A (en) Parallel-picture processor
JPS58163061A (en) Parallel picture processor
CN115775196A (en) Hardware implementation method of bilinear interpolation
JP2862388B2 (en) Filtering method for ultra-high-speed image processing system
JPH0566043B2 (en)
JPH05268593A (en) Difference absolute sum/difference square sum parallel arithmetic operation device
JPS6352269A (en) Image processor
JPS61131122A (en) Parallel pipeline processor
Dutta et al. Low Latency and Area Efficient Very Large Scale Integration Architecture of 2-Dimensional Bicubic Interpolation using Carry Save Adder Based Fast Multiplier
Kim et al. Novel approach for high-speed convolution
JPH0652215A (en) Matrix arithmetic processor
JPH0444306B2 (en)
JPH05233682A (en) Digital signal processor
JPS61246837A (en) Parallel multiplier
Itoh et al. A compact 54/spl times/54-bit multiplier with improved Wallace-tree structure
Current et al. Unified forward and inverse discrete cosine transform architecture and proposed VLSI implementation