JPH0527903B2 - - Google Patents

Info

Publication number
JPH0527903B2
JPH0527903B2 JP61015713A JP1571386A JPH0527903B2 JP H0527903 B2 JPH0527903 B2 JP H0527903B2 JP 61015713 A JP61015713 A JP 61015713A JP 1571386 A JP1571386 A JP 1571386A JP H0527903 B2 JPH0527903 B2 JP H0527903B2
Authority
JP
Japan
Prior art keywords
image data
parallel
data
output
calculation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP61015713A
Other languages
English (en)
Other versions
JPS621074A (ja
Inventor
Shuichi Miura
Yoshiki Kobayashi
Tadashi Fukushima
Kazuyoshi Asada
Kotaro Hirasawa
Yoshuki Okuyama
Takeshi Kato
Norio Murayama
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Publication of JPS621074A publication Critical patent/JPS621074A/ja
Publication of JPH0527903B2 publication Critical patent/JPH0527903B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、空間積和演算等の局所近傍(カーネ
ルという)画像処理を実行する並列画像処理プロ
セツサに関する。
〔従来の技術〕
画像データを処理する画像処理は、前処理、特
徴抽出処理、判定処理等に大別できるが、この発
明にかかる並列画像処理プロセツサは、主に前処
理を行なうに適したものである。
この前処理を行なうにあたり、汎用性があり、
かつ高速処理のできる画像処理プロセツサが所望
されるわけであるが、取り扱う画像データは、2
次元の広がりを持つため、全ての画像データを並
列処理することは困難である。従つて、ノイズ除
去や輪郭抽出機能を実現する空間積和演算等のよ
うな局所近傍の画像データ間の演算に対して並列
処理を行なう場合が多い。このような局所近傍の
画像データを扱うものとして特開昭57−209564号
公報、特開昭58−163061号公報、特開昭58−
181171号公報、特開昭59−146366号公報等に記載
された局所並列型画像処理プロセツサをLSI化し
たものである。これは局所画像データの一部を並
列に演算する並列演算回路を基本モジユールとし
てLSI化を図つたものであり、この基本モジユー
ルを複数個並置するか、基本モジユールを時分割
処理することにより、局所画像領域のサイズを拡
張し、局所近傍演算の並列処理を高速に、かつ汎
用的に行なうことができるものである。
すなわち、m行×n列(m、n:整数)の局所
並列画像処理を行なうにあたり、(1)演算回路(プ
ロセツサエレメント)n個を単位とする基本モジ
ユールをm個並置するか、(2)基本モジユールを単
独で用いてm語の列の画像データを画像データメ
モリ(レジスタ)に順次記憶して時分割に基本モ
ジユールに取込み、対応する行の画像データを演
算回路間でシフトすると同時にその行のn個の画
像データに対して並列処理を行なうようにし、m
回のサイクルでm行×n列の局所並列処理を行な
うようにしたものである。
〔発明が解決しようとする問題点〕
上述の発明では、基本モジユールを複数個用い
て画像処理を実行する場合、各基本モジユールに
並列に画像データを供給するためのラインバツフ
ア回路が外付け回路として必要である。このた
め、一度結線してしまうと、並列処理可能な局所
画像領域が固定されてしまうという問題があつ
た。また、局所近傍領域の拡張においてはライン
バツフア回路も増設しなければならないという問
題があつた。例えば1画素のデータが8ビツトで
表わされる256×256画素の画像に対し、3×3の
局所並列演算を6MHzの動作周波数で実行する場
合、6MHzで動作する4Kビツトの高速メモリ、あ
るいはシフトレジスタが必要となり、ハード物量
が大きくなつてしまう。一方、時分割処理するこ
とにより画像処理を実行する場合には、外付けの
ラインバツフア回路は不要であるが、ステイツク
走査という特殊な走査法により画像データを基本
モジユールに供給しなければならないという問題
があつた。通常のラスタ走査された画像データを
ステイツク走査に変換するためには、前述のライ
ンバツフア回路以上のハード物量が必要となる。
本発明の目的は、上記の問題を解決し、局所近
傍演算の対象となる局所画像領域を、少ないハー
ド物量で容易に拡張できる並列画像処理プロセツ
サを提供することにある。
本発明の他の目的は、同じハードウエア構成で
様々な局所画像領域に柔軟に対応できる並列画像
処理プロセツサを提供することにある。
〔問題点を解決するための手段〕
本発明は上記目的を達成するために以下のよう
な解決手段を用いる。
第1に、基本モジユール(LSI)構成の並列画
像処理プロセツサにおいて、従来ハード物量の大
きかつたラインバツフアを内蔵させ、基本モジユ
ール間の接続を行なうために、ラインバツフアに
より遅延させた画像データを出力し、他の基本モ
ジユールの入力画像データとするための出力ポー
トを設けたことにより達成される。
第2に、基本モジユール構成の並列画像処理プ
ロセツサにおいて、少なくとも1つのラインバツ
フアと、外部からの入力画像データとラインバツ
フアにより遅延させた画像データのいずれかとを
選択的に切換える切換回路とを内蔵させ、基本モ
ジユール間の接続を行なうために、セレクタによ
り選択した画像データを出力し、他の基本モジユ
ールの入力画像データとするための出力ポートを
設けたことにより達成される。
第3に、外部からの画像データを入力する入力
ポートと、該入力画像データから順次局所画像デ
ータを切出して記憶する複数個の順次記憶手段
と、該局所画像データを並列演算する複数個の演
算回路を含む並列演算部と、該並列演算された結
果を結合して外部に出力する結合手段を備えた基
本モジユール構成の並列画像処理プロセツサにお
いて、それぞれの順次記憶手段の段数を可変と
し、前記入力画像データを順次1行分ずつ遅延さ
せる少なくとも1個のラインバツフアと、該ライ
ンバツフアからの出力の順次記憶手段からの出力
とを選択的に切換え、次の順次記憶手段に入力さ
せる少なくとも1個の第1の切換回路と、外部か
らの入力画像データとラインバツフアにより遅延
させた画像データのいずれかとを選択的に切換え
る第2の切換回路と、基本モジユール間の接続を
行なうために該第2のセレクタにより選択した画
像データを出力し、他の基本モジユールの入力画
像データとするための出力ポートと、第1及び第
2の切換回路に制御信号を与える制御回路とを設
けたことにより達成される。
〔作用〕
第1に、ラインバツフア内蔵及び遅延させた画
像データを出力する出力ポートを設けたことによ
り、他の基本モジユールに入力する場合でも、あ
らかじめ遅延させたデータを供給できるため外付
け回路が不要となるため、拡張性が向上する。
第2に、更に外部からの入力画像データとライ
ンバツフアにより遅延させた画像データのいずれ
かとを選択的に切換える切換回路を内蔵したこと
により、何行分遅延させた画像データを他の基本
モジユールに入力させるかの選択が可能となり、
種々なサイズの局所近傍演算に対処できる。
第3に、更に順次記憶手段を可変段数とし、ラ
インバツフア出力と順次記憶手段の出力とを選択
的に切換える第1の切換回路と、前述した外部か
らの入力画像データとラインバツフア出力のいず
れかとを選択的に切換える第2の切換回路、第1
及び第2の切換回路を制御する制御回路を内蔵さ
せたことにより、基本モジユール単独で時分割処
理したり、基本モジユールを並置して同一結線で
種々なサイズを局所近傍演算を行なうことが可能
になるなど時間、局所近傍のサイズを考慮した使
用ができる。
〔発明の実施例〕
以下、本発明の実施例を図面を用いて説明す
る。
第2図に、画像前処理演算の基本演算であるm
行×n列(3×3)の局所近傍画像処理を高速に
実行するための、局所並列型演算方式を示す。
処理対象となる入力画像1を10×10の濃淡画像
とし、該画像は図に示す番号、、、…の順
にラスタ走査されるものとする。第2図では、画
像データまでを走査し終つたところを示す。
入力画像1から走査された画像データは、レジ
スタ31−00、およびラインバツフア20−0
に入力される。レジスタ31−00に入力された
画像データは、順次レジスタ31−01、レジス
タ31−02へとシフトされていく。また、ライ
ンバツフア20−0に入力された画像データは、
画像を1ライン分走査する時間だけ遅延させられ
て、ラインバツフア20−0から出力される。
ラインバツフア20−0から出力されさ画像デ
ータは、レジスタ31−10、およびラインバツ
フア20−1に入される。レジスタ31−10に
入力された画像データは、順次レジスタ31−1
1、レジスタ31−12へとシフトされていく。
また、ラインバツフア20−1に入力された画像
データは、画像を1ライン分走査する時間だけ遅
延させられて、ラインバツフア20−1から出力
される。
ラインバツフア20−1から出力された画像デ
ータは、レジスタ31−20に入力される。レジ
スタ31−20に入力された画像データは、順次
レジスタ31−21、レジスタ31−22へとシ
フトされていく。
以上の構成により、画像データがレジスタ3
1−00およびラインバツフア20−0に取込ま
れたとき、9個のレジスタ31には、画像データ
を中心とした3×3の局所近傍画像、、
、、、が同時に格納されている。よつて
レジスタ31と同数の演算器を用いれば、各レジ
スタ31内の画像データに対し並列に演算を行う
ことができ、高速処理を実現できる。
第1図に、上記局所並列型演算方式を実現する
並列画像処理プロセツサの基本モジユール10の
構成を示す。
基本モジユール10は、画像データを取り込む
画像データ入力ポート54、基本モジユール10
の内部で遅延させた画像データを出力する画像デ
ータ出力ポート55、別の基本モジユール10か
らの演算結果を入力する演算データ入力ポート6
4、および内部処理結果を出力する演算データ出
力ポート65を有する。
入力画像1からラスタ走査された画像データ
は、画像データ入力ポート54を介して可変段数
シフトレジスタ(VSR)31−0ラインバツフ
ア20−0、セレクタ70に入力される。ライン
バツフア20−0は、入力された画像データを、
ラスタ走査の1ライン分の時間遅らせて、セレク
タ33−0、ラインバツフア20−1、セレクタ
70に出力する。ラインバツフア20−1は、ラ
インバツフア20−0から供給された画像データ
を、さらに1ライン分の時間遅らせて、セレクタ
33−1、セレクタ70に出力する。
セレクタ70では、制御回路21からの制御信
号により、画像データ入力ポート54からの画像
データ、ラインバツフア20−0の出力、および
ラインバツフア20−1の出力の中からひとつを
選択して、画像データ出力ポート55から出力す
る。画像データ出力ポート55からの出力は、複
数の基本モジユール10を使用する場合、次段の
基本モジユール10の入力画像データとなるが、
セレクタ70により、画像データ出力ポート55
の出力として、入力画像データに対して0、1、
2ライン遅れた画像データの中のひとつを選択す
ることができる。
また、VSR31−0は、制御回路21からの
制御信号によりシフト操作を行い、並列演算部3
0およびセレクタ33−0に画像データを供給す
る。
セレクタ33−0は、ラインバツフア20−0
の出力とVSR31−0の出力とを、制御回路2
1からの制御信号により選択し、VSR31−1
に出力する。VSR31−1は、上記可変段数シ
フトレジスタ31−0と同様にシフト操作を行
い、並列演算部30およびセレクタ33−1に画
像データを供給する。
セレクタ33−1は、ラインバツフア20−1
の出力とVSR31−1の出力とを、セレクタ3
3−0と同様の制御により選択し、VSR31−
2に供給する。VSR31−2は、上記VSR31
−0と同様のシフト操作を行い、並列演算部30
に画像データを供給する。以上のセレクタ33の
切換えにより、VSR31の配列を、1×3と3
×1の2通りの中から選択することができる。こ
のVSR31の配列は、1マシンサイクルの間に
同時に演算可能な局所画像データの配列に対応す
る。
並列演算部30は、VSR31−0,31−1,
31−2から供給される画像データを並列に演算
し、演算結果を統合回路40に出力する。統合回
路40では、演算データ入力ポート64から供給
される演算データと、並列演算部30の出力が統
合され、演算データ出力ポート65から出力さ
れ、出力画像2に格納される。
本実施例の基本モジユール10は、3個の
VSR31から同時に供給される3つの画像デー
タを並列演算部30において並列に処理できる。
一方、最も汎用的な局所近傍画像演算は、第2図
に示すように3×3の局所画像データを処理する
ものであり、1つの出力画像データを算出するた
めに9つの画像データが必要となる。このような
3×3の局所近傍画像演算を、本基本モジユール
10を用いて実現するには次の2通りの方法があ
る。
(1) 時分割処理方式 (2) 基本モジユール増設方式 (1)の方式は、9つの局所画像データを3つずつ
3マシンサイクルに分けて並列演算部30で演算
し、その結果を統合回路40にて3マシンサイク
ルで結合する方法である。本方式では、、画像デ
ータの取込みおよび演算データの出力は3マシン
サイクルに1度実行される。本実施例で説明する
基本モジユール10では、最大8回の時分割処理
が可能で、1個の基本モジユール10で、最大24
個の画像データを時分割により処理できる。
n回の時分割処理の場合、ラインバツフア20
はnマシンサイクルに1度動作し、VSR31は、
nマシンサイクルに1度シフトを行い、1×nの
局所画像データをnマシンサイクルの間保持す
る。そしてそのn個の画像データをnマシンサイ
クルの間に1つずつ並列演算部30に供給する。
並列演算部30では、n回に分けて供給される画
像データに対し、対応するn個の係数データを1
マシンサイクル毎に発生させ、両者の演算を実行
し、1マシンサイクル毎にその結果を統合回路4
0に供給する。結合回路40では、n回に分けて
並列演算部30から供給される演算データを、n
マシンサイクルで統合し、演算データ出力ポート
65から出力する。本方式では、処理速度は遅く
なるが基本モジユール10が1個ですみ、ハード
量が少なくてすむ。
(2)の方式は、基本モジユール10を3個用いて
3×3の局部画像データを1マシンサイクルの間
に1度に演算する方法である。本方式では、各基
本モジユール10で3つずつ画像データを演算
し、LSI間で演算データを統合する。本方式は、
(1)の方式に比べハード量は多くなるが、高速に演
算を実行できる。
また、本基本モジユール10は、マルチマスク
処理にも対応できる構成となつている。マスク数
mのマルチマスク処理とは、ひとつの入力画像1
に対し、m通りの局所近傍画像演算を実行し、得
られるm枚の出力画像2を統合して最終結果とす
る処理で、エツジ抽出処理等に用いられる。本基
本モジユール10では、このマルチマスク処理の
統合の前までの処理を、1回の画素走査で実現で
きる。マスク数mのマルチマスク処理の場合、画
像データは、mマシンサイクルに1度取込まれ、
ラインバツフア20、VSR31もmマシンサイ
クルに一度動作する。VSR31は、mマシンサ
イクルの間同じ画像データを並列演算部30に供
給し続ける。並列演算部30では、1つの画像デ
ータについてmマシンサイクルの間にm通りの係
数パターンを発生し、1マシンサイクル毎に上記
画像データとの演算を行う。得られたm通りの演
算結果は、mマシンサイクルの間に順次演算デー
タ出力ポート65から出力される。なお、前述の
時分割処理と、マルチマスク処理を組合わせるこ
とも可能である。時分割数t、マスク数mの時分
割マルチマスク処理の場合、画像データの取込み
はt×mマシンサイクルに一度となり、m通りの
演算結果がtマシンサイクル毎に順次出力される
ことになる。
以上の時分割処理、マルチマスク処理は、制御
回路21を外部から操作し、(マスク数×時分割
数−1)を与える制御信号MSKTMS1014と、
(時分割数−1)を与える制御信号TMS1013を設
定することにより実現できる。
第3図に、並列演算部の詳細構成例を示す。
VSR31からの出力信号線300,301,3
02は、3個の演算回路(PE)37−0,37
−1,37−2に入る。一方、演算回路37−
0,37−1,37−2の他方の入力は、係数メ
モリ36−0,36−1,36−2に結線されて
おり、3個の係数メモリ36は、カウンタ35の
出力をアドレスとして、あらかじめ記憶された係
数データをそれぞれ対応する演算回路37に供給
する。演算回路37の出力は、演算器38により
統合され、信号線400を介して統合回路40に
入力される。
MSKTMS≠0の場合には、時分割処理あるい
はマルチマスク処理となり、係数メモリは、1マ
シンサイクル毎にアドレスを変え、異なるアドレ
スから係数データを読出して演算回路37に供給
する。このアドレスはカウンタ35により作られ
る。
第4図に、統合回路40の詳細構成例を示す。
並列演算部30の出力は、信号線400を介して
レジスタ41とセレクタ42に入る。レジスタ4
1の出力はセレクタ43に入力される。セレクタ
42は、信号線640を介して供給される演算デ
ータ入力ポート64からの演算データと並列演算
部30の出力とを選択し、演算器44に供給す
る。セレクタ43は、レジスタ41の出力線41
0と統合結合回路40の出力線650とを選択し
て演算器44に供給する。演算器44の出力は、
レジスタ45、信号線650を介して演算データ
出力ポート65から外部へ出力される。
セレクタ42、セレクタ43は、それぞれカウ
ンタ46からの制御信号420,430により制
御される。カウンタ46は、制御回路21からの
リセツト信号450と(時分割数−1)を与える
制御信号TMS1013により制御され、リセツト信
号450が“HIGH”になるとリセツトされ、0
からTMSまでのカウントアツプが繰返される。
TMS=0のとき、セレクタ42、セレクタ43
は常に信号線640、信号線410を選択する。
TMS≠0のときは、セレクタ42はカウンタ4
6の値がTMSに等しくなつたときのみ信号線6
40を選択し、セレクタ43は、カウンタ46の
値が0になつたときのみ信号線410を選択す
る。
第5図に、TMS=2の場合の統合回路40の
動作を示す。TMS≠0のとき、統合回路40は、
(TMS+1)マシンサイクルで、データ線400
から(TMS+1)マシンサイクルの間に供給さ
れる(TMS+1)個の演算データと、データ線
640から供給される1つの演算データを結合す
る。第5図の場合、3マシンサイクルで、データ
線400上の演算データa,b,cと、データ線
640上の演算データlを加算により統合してい
る。
第1のマシンサイクルでは、演算器44におい
て演算データaおよびbが加算される。第2のマ
シンサイクルでa+bとcが加算され、a+b+
cを得る。第3のマシンサイクルではa+b+c
とlが加算され、次のマシンサイクルでレジスタ
45から統合結果a+b+c+lが出力される。
第6図に、第1図における2本ラインバツフア
20をRAMを用いて構成する詳細例を示す。
第6図は、8ビツトのデータを最大1024段遅延
できるラインバツフアを2本、もしくは8ビツト
のデータを最大2048段遅延できるラインバツフア
を1本形成できる。遅延段数の可変なラインバツ
フアの構成となつている。
第6図において、RMA241、およびRAM
242は、それぞれ8×1024ビツトの記憶容量を
持つ。クロツク信号2102が“High”レベル
の時、行番地制御回路245の出力である10ビツ
トの行番地信号2103に対応するRAM241
およびRAM242の各8ビツトのデータは、そ
れぞれ信号線252、信号線253上に読み出さ
れる。また、クロツク信号2102が“Low”
レベルでかつ入出力情報制御回路246の出力デ
ータ2104が“Low”の時は、入力信号線5
40上の8ビツトのデータは、RAM241の行
番地信号2103に対応する番地に、クロツク信
号2102が“Low”レベルでかつ入出力情報
制御回路246の出力データ2104が“High”
の際は入力信号線540上の8ビツトのデータ
は、RAM242の行番地信号2103に対応す
る番地に、それぞれ書き込まれる。RAM241
およびRAM242から読み出された信号線25
2および信号線253上のそれぞれ8ビツトのデ
ータは、セレクタ243およびセレクタ244に
入力される。セレクタ243は、信号線2104
が“Low”の時、信号線252上のデータを選
択して出力信号線200上に、信号線2104が
“High”の時は、信号線253上のデータを選択
して出力信号線200上に出力する。一方、セレ
クタ244は、信号線2104が“Low”の時
は信号線253上のデータを、信号線2104が
“High”の時は信号線252上のデータを、それ
ぞれ選択して出力線201上に出力する。
行番地制御回路245は10ビツトのバイナリイ
カウンターで、制御信号2101が“Low”で
かつクロツク信号2102が“High”になる度
カウントアツプし、制御信号2101が“High”
となると0に初期化される。行番地制御回路24
5は、カウントデータを10ビツトの行番地信号2
103として、RAM241、RAM242のほ
か、論理回路247に出力する。論理回路247
は、10ビツトの行番地信号2103すべてが
“High”の時、もしくは信号線2101が
“High”の時、信号線2106に“High”レベ
ルを出力する。これ以外の時は、信号線2106
に“Low”レベルを出力する。
入出力情報制御回路246は、1ビツトのカウ
ンタ(つまりTフリツプフロツプ)であり、初期
化信号2105が“Low”でかつ信号線210
6が“High”レベルになる度、信号線2104
の状態を“High”から“Low”へ、もしくは
“Low”から“High”へと変化させる。また、初
期化信号2150に“High”が入力されると、
信号線2104を“Low”に初期化する。
第6図に示す回路は次のように動作する。
今、初期状態として、制御信号2101、クロ
ツク信号2102および初期化信号2105がす
べて“Low”とする。そして初期化信号210
5を“High”、“Low”と変化させた後、制御信
号2101を“High”にする。この時、行番地
制御回路246の出力信号2103は0、入出力
情報制御回路246の出力信号2104は
“Low”となる。この後、制御信号2101が
“Low”に変化し、その後クロツク信号2102
が“Low”から“High”、さらに“Low”へと変
化する。この時、クロツク信号2102が
“High”の間に、RAM241の0行番地の内容
8ビツトが、信号線252、セレクタ244を介
して、出力信号線201上に出力され、また
RAM242の0行番地の内容8ビツトが信号線
253、セレクタ243を介して、信号線200
上に出力される。その後、クロツク信号2102
が“Low”になると、入力信号線540上の8
ビツトのデータが、RMA241の0行番地に書
き込まれる。この時、RAM242の内容は、ど
の行番地も変化しない。
この後、クロツク信号2102が“Low”か
ら“High”、さらに“Low”と変化する度、読み
出し、書き込みの行番地は一つずつ増えてゆく
が、RAM241から読み出されたデータは出力
信号線201上に、RMA242から読み出され
たデータが出力信号線200上に出力されるこ
と、および、入力信号線540上のデータが
RAM241に書き込まれることは変わらない。
ここで、行番地信号線2103が1023に達
する前に制御信号線2101が“High”となつ
たとする。すると信号線2106は“Low”か
ら、“High”へと変化する。この信号線2106
のレベル変化によつて、入出力情報制御回路24
6の状態は変化し、信号線2104を“High”
にする。この結果、セレクタ243,244の選
択が切り換わり、信号線252は出力信号線20
0に、信号線253は出力信号線201に接続さ
れる。また、書き込み可能なRAMは、RAM2
41からRAM242に移り、RAM241は書
き込めなくなる。さらに、行番地制御回路245
の出力信号2103は0に初期化される。そこ
で、この後、制御信号2101を“Low”にし
てから、クロツク信号2102にパルス信号を印
加すると、読み出し・書き込みの行番地信号21
03は0から一つずつ上昇する。クロツク信号2
102が“High”の時、行番地信号2103に
よりRAM241から読み出されたデータは、信
号線252、セレクタ243を介して出力信号線
200へ、また、RAM242から読み出された
データは、信号線253、セレクタ244を介し
て出力信号線201に読み出される。またクロツ
ク信号2102が“Low”の時、入力信号線5
40上のデータは、RAM242の行番地信号2
103に対応する行番地に書き込まれる。
ここで、第6図の回路構成と第1図との対応に
ついて説明する。
第6図の回路において、初期状態として、
RAM241,242の内定は不定であるとす
る。また、入力画像1の水平方向の画素数を100
とする。
第6図の回路において、入力画像1の画素デー
タは、入力信号線540から入力されて、最初は
RAM241に書き込まれる。第1番目のラスタ
の画素データ100個はRAM241の行番地0か
ら99まで順次書き込まれる。この時、RAM24
1,242からは不定データが読み出される。次
に第2番目のラスタの画素データ100個が、
RAM242の行番地0から99まで書き込まれ
る。この時、RAM241からは、第1番目のラ
スタデータが読み出されるが、RAM242から
読み出されるデータは不定データである。
そして第3番目のラスタデータは、RAM24
1の行番地0から99に書き込まれる。この時、
RAM241からは第1番目のラスタデータが、
信号線252、セレクタ244を介して出力信号
線200に、RAM242からは第2番目のラス
タデータが、信号線253、セレクタ243を介
して出力信号線200に出力される。さらに第4
番目のラスタデータは、RAM242の行番地0
から99に書き込まれる。この時、RAM242か
らは第2番目のラスタデータが、信号線253、
セレクタ244を介して出力信号線201へ、
RAM241からは第3番目のラスタデータが、
信号線252、セレクタ243を介して出力信号
線200へ出力される。
つまり、第3番目のラスタデータを入力する
時、RAM241はラインバツフア20−1とし
て、RAM242はラインバツフア20−0とし
てデータを出力することになる。一方、第4番目
のラスタデータを入力する時は、RAM241が
ラインバツフア20−0として、RAM242が
ラインバツフア20−1としてデータを出力する
ことになる。
一般的に言つて、奇数番目のラスタデータは
RAM241に、偶数番目のラスタデータは
RAM242に書き込まれる。また、RAM24
1,242から読み出されたデータは、小さい番
数のラスタデータが出力信号線201に、大きい
番数のラスタデータが出力信号線200に出力さ
れることになる。
一方、遅延段数が1024段を越えた場合、換言す
ると、行番地信号2103が1023に達した場
合、信号線2106が“High”となり、読み出
し制御回路246の出力信号2104の状態を変
化させ、これまで書き込んでいたRAMへの書き
込みをやめさせ、もう一方のRAMへの書き込み
を指示することになる。この時の書き込み開始行
番地は0となる。また、信号線2104が変化す
るとRAM241,242と出力信号線200,
201の接続が切り換わる。このため、第6図の
回路を、入力信号540と出力信号200をもつ
8ビツト2048段のラインバツフアとして使用する
ことが可能となる。以上、ラインバツフアをLSI
化に適したRAMで構成する例で説明したが、勿
論シフトレジスタでも構成できる。
第7図に、VSR31−0の構成例を示す。
VSR31−0は、シフト操作を行なう読出し信
号制御部18、出力選択制御部19、可変段数シ
フトレジスタセル(vsr)100からなる。入力
画像1からラスタ走査された画素データは、8ビ
ツトのデータとして入力データ線540からvsr
100に入力される。また、vsr100の出力は、
出力データ線300を介して並列演算部30およ
びセレクタ33−0に入力される。
vsr100は、1マシンサイクルの間に、デー
タの読出し、書込みを行うことにより、データの
入力、シフトを実行する。本実施例では、vsr1
00は、クロツクに同期した書込み可能信号φ1
1001と、読出し信号制御部18から出力され
る読出し可能信号φ2′1006により、データの
書込み、読出しを実行する。また、出力選択制御
部19から出力される出力選択信号1015は、
vsr100内に埋込まれた、セレクタを構成する
クロツクゲート1500(第8図)に入力され
る。出力選択信号1015がHighとなつたvsr1
00内のデータが、セレクタの出力として出力デ
ータ線300に出力される。
読出し信号制御部18は、クロツクに同期した
読出し可能信号1002を入力とし、間欠的に
Highとなる読出し可能信号1006を出力する。
第7図では、シフト操作を行なう読出し信号制御
部18は、4bitダウンカウンタ104、ハーフレ
ジスタ(HR)102、遅延回路101からな
る。
4bitダウンカウンタ104は、クロツク毎にカ
ウントダウンするカウンタである。リセツト信号
1000がHighになると、カウンタ出力100
4がゼロになつたとき、ロード信号1024が
Highになり、その次のマシンサイクルで制御回
路21からの4bitデータMSKTMS1014が、
4bitダウンカウンタ104にロードされる。HR
102および遅延回路101は、ロード信号10
24がHighとなつた次のマシンサイクルで読出
し可能信号1006がHighとなるよう、ロード
信号1024を半マシンサイクル遅らせた読出し
制御信号1005を生成する。
出力選択制御部19は、3bitアツプカウンタ1
03およびデコーダ1015からなり、出力選択
信号1015を、1マシンサイクル毎に切り換え
る。3bitアツプカウンタは、クロツク毎にカウン
トアツプするカウンタである。リセツト信号10
00がHighになるか、カウンタ出力1003が
制御回路21からの3bitデータTMS1013と
一致したときリセツト信号1023がHighとな
り、その次のマシンサイクルで3bitアツプカウン
タ103がリセツトされる。3bitアツプカウンタ
103の出力1003は、デコーダ105により
デコードされ、出力選択信号1015となる。
尚、シフトレジスタの段数はTMS信号により可
変とすることができ、TMSを所定値に設定する
と1段数は(TMS+1)となる。
第8図は、1bit段のvsr100の詳細を示す。
vsr100は、1マシンサイクルの前半にvsr10
0内のデータを出力線1011に読出し、後半に
入力線1010からのデータをvsr100内に書
込むことにより、データのシフトを実行する。入
力線1010は、初段のvsr100では入力デー
タ線540と接続され、初段以外のvsr100で
は前段のvsr100の出力線1011と接続され
る。vsr100内のデータは、出力選択信号10
15がHighとなつたとき、出力データ線300
に出力される。
第9図は、MSKTMS=5、TMS=2とした
ときのVSR31−0の動作を、第10図はその
タイミングチヤートを示す。VSR31−0は、
(MSKTMS+1)マシンサイクルに一度データ
を入力、シフトし、(TMS+1)マシンサイクル
でVSR31−0内のデータを順次出力する。第
9図の場合、6マシンサイクルに一度データが入
力、シフトされ、3マシンサイクルの間にVSR
10内のデータが順次出力される。
第9図、第10図の,……,は、それぞれ
第1、……、第9のマシンサイクルを示してい
る。第1のマシンサイクルは、VSR31−0に
データA,Bが格納されており、データCが入力
データ線540に到達している状態を示す。この
とき、リセツト信号1000をHighにすると、
第2のマシンサイクル4bitダウンカウンタ、3bit
アツプカウンタがそれぞれ初期状態になる。さら
に、第1のマシンサイクルから第2のマシンサイ
クルにかけて、読出し制御信号(RDEN)10
15がHighとなるため、第2のマシンサイクル
において読出し可能信号φ2′1006がHighとな
る。その結果、第1のマシンサイクルから第2の
マシンサイクルにかけて、データCがVSR31
−0に入力されるとともに、データA,Bがそれ
ぞれ右へ1段シフトされることになる。
一方、第2のマシンサイクルから、第7のマシ
ンサイクルの間、3bitアツプカウンタ103が
0、1、2、0、1、2とカウントを続ける。こ
の結果、出力データ線300に、VSR31−0
内のデータA,B,Cが、C,B,A,C,B,
Aの順に出力される。
第7のマシンサイクルでは、次の画素データD
が、入力データ線540に到達する。このとき、
4bitダウンカウンタ104が0を出力し、第7の
マシンサイクルから第8のマシンサイクルにかけ
てRDEN1005がHighとなり、第1、第2の
マシンサイクルと同様に、第7のマシンサイクル
から第8のマシンサイクルにかけて、データDが
VSR31−0に入力されるとともに、データB,
Cが右へ1段シフトされ、データAが捨てられ
る。以後、第8のマシンサイクルから6マシンサ
イクルの間データB,C,Dが保持され、第2か
ら第7のマシンサイクルと同様に、VSR10内
のデータB,C,Dが、D,C,B,D,C,B
の順に順次読出される。
第7図に示した構成例によれば、間欠的に入力
される。ラスタ走査された入力画像1から、局所
近傍画像を切り出して可変段数シフトレジスタに
保持することができる。また、保持された局所近
傍画像データを、時分割に順次演算回路に供給す
ることができる。
第11図はVSR31−0の別の構成を示す。
ここでは、VSR31−0は、シフト操作を行な
う書込み信号制御部28、出力選択制御部19、
可変段数シフトレジスタセル(vsr)100から
なる。本実施例では、vsr100は、書込み信号
制御部28から出力される書込み可能信号φ1′1
106と、クロツクに同期した読出し可能信号
φ21002により、データの書込み、読出しを
実行する。
書込み信号制御部28は、第7図に示した読出
し信号制御部18に対応しており、シフト操作を
行なうものでクロツクに同期した書込み可能信号
1001を入力とし、間欠的にHighとなる書込
み可能信号1106を出力する。第11図では、
書込み信号制御部28は、4bitダウンカウンタ1
04からなる。ここでは、4bitダウンカウンタ1
04のロード信号1024を、そのまま書込み制
御信号として用いる。
第12図に、本構成例において、MSKTMS=
5、TMS=2としたときの、VSR31−0のタ
イミングチヤートを示す。VSR31−0の動作
は、第9図に示した前記実施例と同じである。第
12図では、第1図および第7のマシンサイクル
において、4bitダウンカウンタ104のロード信
号1024がHighとなり、書込み可能信号φ1′1
106がHighになる。この結果、第1のマシン
サイクルから第2のマシンサイクルにかけて、デ
ータCがVSR31−0に入力されるとともに、
データA,Bがそれぞれ右へ1段シフトされる。
また、第7のマシンサイクルから第8のマシンサ
イクルにかけて、データDがVSR31−0に入
力され、データB,Cがそれぞれ右へ1段シフト
される。
本構成例によれば、前記第7図に示した構成例
と同じ効果を、前記実施例に比べ少ないハードウ
エア量で実現できる。
第13図に、VSR31−0の、さらに他の構
成例を示す。ここでは、VSR31−0は、シフ
ト操作を行なう書込み制御部28、出力選択制御
部29、可変段数シフトレジスタセル(vsr)1
00からなる。
本構成例における出力選択制御部29は、3bit
アツプカウンタ103、RAM203、デコーダ
105からなる。3bitアツプカウンタ103のカ
ウンタ出力線1003は、RAM203のアドレ
ス線となり、カウンタ出力線1003により指定
されたアドレスの内容がRAM出力線2003か
ら出力され、デコーダ105に入り、出力選択信
号1015に変換され、vsr100に供給される。
RAM203のアドレス0、1、2に、それぞ
れ0、2、4をあらかじめ記憶させた場合の、
VSR31−0の動作を第14図に、タイムチヤ
ートを第15図に示す。第14図、第15図で
は、MSKTMS、TMSは、それぞれ5,2であ
る。
第1のマシンサイクルから第2のマシンサイク
ルにかけてデータの入力およびシフトが実行され
た後、第2のマシンサイクルから第7のマシンサ
イクルまで、クロツク毎にRAM出力2003に
より指定されるvsr100の内容A,C,Eが、
E,C,A,E,C,Aの順に読出される。第7
のマシンサイクルから第8のマシンサイクルにか
けてデータのシフト、入力が実行された後は、第
8のマシンサイクル以降、RAM出力2003に
より、vsr100の内容B,D,Fが、F,D,
B,F,D,Bの順に読出されることになる。
本実施例によれば、RAMにあらかじめデータ
を設定しておくことにより、可変段数シフトレジ
スタ内の任意のデータを、任意の順序で読出すこ
とが可能となり、飛び飛びの局所近傍画像の時分
割処理を効率よく実現できる。
第16図に、第1図に示した基本モジユール1
0を1個用いて、3×3の局所近傍画像演算を3
マシンサイクル毎に時分割処理する構成を示す。
ここでは、各VSR31は、3回の時分割処理に
より1×3の局所画像データを保持し、これら3
個のVSR31は、第1図におけるセレクタ33
の切換えにより、3×1に配列される。この結果
全体として3×3の局所画像データが保持される
ことになる。この構成は、MSKTMS、TMSを
2に設定し、第1図におけるセレクタ33−0,
33−1がそれぞれデータ線200,201を選
択するように制御回路21を外部から操作するこ
とにより実現される。この際に基本モジユール1
0は1個しか使用しないのでセレクタ70を介し
て画像データ出力ポート55へデータを送出する
必要はない。
入力画像1は、3マシンサイクルに1度ラスタ
走査され、3マシンサイクルに1画素ずつ画像デ
ータ入力ポート54を介してVSR31−0およ
びラインバツフア20−0に入力される。ライン
バツフア20−0は、画像データを入力画像1の
1ラインを走査する時間だけ遅延させる。ライン
バツフア20−0の出力は、VSR31−1とラ
インバツフア20−1に入力される。ラインバツ
フア20−1は、ラインバツフア20−0と同様
に、画像データを入力画像1の1ラインを走査す
る時間だけ遅延させ、VSR31−2に出力する。
VSR31−0,31−1,31−2は、3マシ
ンサイクルに一度画素データを入力するとともに
シフトを行う。このとき、出力画素2の1つの画
素データを算出するのに必要な9個の局所近傍画
像データA,B,C,D,E,F,G,H,I
が、VSR31−0,31−1,31−2の内部
に3マシンサイクルの間保持されることになる。
VSR31−0,31−1,31−2に保持さ
れた局所近傍画像データは、3マシンサイクルの
間に時分割に読出され、それぞれ並列演算部30
内の演算回路(PE)37−0,37−1,37
−2(第3図)に入力される。PE37−0,3
7−1,37−2では、それぞれ、VSR31−
0,31−1,31−2から供給される画素デー
タと、対応する係数メモリ36−0,36−1,
36−2から供給される荷重係数とが演算され、
その演算結果が演算器38で統合される。このよ
うにして、1つの局所近傍画像を形成する画素デ
ータの演算結果は、演算器38から3回に分けて
出力され、統合回路40により3マシンサイクル
間に統合され、出力画像2として基本モジユール
10から出力される。
第17図は、第1図に示した基本モジユール1
0を3個用いて、3×3の局所近傍画像演算を1
マシンサイクル毎に実行する構成を示す。ここで
は、第1図におけるセレクタ33の切換えによ
り、3個のVSR31を1×3に配列している。
また、セレクタ70の切換えにより、画像データ
出力ポート55からは、ラインバツフア20−0
によつて、入力画像データに対し、1ライン分遅
れた画像データが出力される。この結果、3個の
基本モジユール10は3×1に配列され、全体と
して3×3の局所画像データを同時に取出せる。
この内部構成は、MSKTMS、TMSを0に設定
し、第1図におけるセレクタ33−0,33−1
および70が、それぞれデータ線300,30
1,200を選択するように制御回路21を外部
から操作することにより実現される。
入力画像1は、1マシンサイクル毎にラスタ走
査される。ラスタ走査により読出された入力画像
データは、基本モジユール10Aの画像データ入
力ポート54に与えられる。基本モジユール10
Aの画像データ出力ポート55からは、基本モジ
ユール10A内のラインバツフア20−0により
1ライン分遅れた画像データが出力され、基本モ
ジユール10Bの画像データ入力ポート54に与
えられる。同様に基本モジユール10Bから10
Cへさらに1ライン分遅れた画像データが受け渡
される。また、基本モジユール10Aの演算デー
タ出力ポート65から出力される演算結果は、基
本モジユール10Bの演算データ入力ポート64
に与えられ、基本モジユール10Bの内部におい
て統合回路40によつて並列演算部30の演算結
果と統合される。同様に基本モジユール10Bか
ら10Cへ演算結果が渡され、基本モジユール1
0Cの内部において並列演算部30の演算結果と
統合され、演算データ出力ポート65から、1マ
シンサイクル毎に出力画像データとして出力され
る。
基本モジユール10A,10B,10Cの内部
では、それぞれ画像データがVSR31−0に入
力され、さらにVSR31−1,31−2へと順
次シフトされてゆく。この結果、3個の基本モジ
ユール10内にある合計9個のVSR31には、
3×3の局所画像データA,B,C,D,C,
E,F,G,H,Iが同時に保持される。これら
の局所画像データは、合計3個の並列演算部30
により、1マシンサイクルで演算される。
第18図は、3個の基本モジユール10を第1
7図と同じ接続としたまま、7×7の局所近傍演
算を7マシンサイクル毎に実行する構成を示す。
ここでは、各VSR31は、7回の時分割処理に
より1×7の局所画像を保持し、これら3個の
VSR31は第1図におけるセレクタ33の切換
えにより、3×1に配列されている。この結果、
1個の基本モジユール10につき、3×7の局所
画像データを保持することになる。また、セレク
タ70の切換えにより、画像データ出力ポート5
5からは入力画像データに対し、2ランイ分遅れ
た画像データが出力される。この結果、3個の基
本モジユールは3×1に配列されるが、全体とし
て局所画像のサイズは9×7とはならず、7×7
になる。これは隣接する基本モジユール10間で
1行ずつVSR31内の画像データが重複してい
るためである。この重複を無くすためには、ライ
ンバツフア20が1個の基本モジユール10につ
き3本あればよい。この内部構成は、
MSKTMS、TMSを6に設定し、第1図におけ
るセレクタ33−0,33−1、および70が、
それぞれデータ線200,201,201を選択
するように制御回路21を外部から操作すること
により実現される。すなわち、基本モジユール1
0はセレクタ70によりラインバツフア20−1
の出力を選択し、データ線201のデータを画像
データ出力ポート55より出力するのである。
入力画像1は、7マシンサイクルに1度ラスタ
走査され、7マシンサイクルに1画素ずつ、基本
モジユール10Aの画像データ入力ポート54に
入力される。基本モジユール10Aの画像データ
出力ポート55からは、基本モジユール10A内
のラインバツフア20−0,20−1により2ラ
イン分遅れた画像データが出力され、基本モジユ
ール10Bの画像データ入力ポート54に与えら
れる。同様に基本モジユール10Bから10C
へ、さらに2ライン分遅れた画像データが受け渡
される。また、基本モジユール10Aの演算デー
タ出力ポート65から出力される演算結果は、基
本モジユール10Bの演算データ入力ポート64
に与えられ、基本モジユール10Bの内部におい
て統合回路40によつて並列演算部30の演算結
果と統合される。同様に基本モジユール10Bか
ら10Cへ演算結果が渡され、基本モジユール1
0Cの内部において並列演算部30の演算結果と
統合され、演算データ出力ポート65から、7マ
シンサイクル毎に出力画像データとして出力され
る。
基本モジユール10Aの内部では、VSR31
−0,31−1,31−2に、3×7の局所画像
が7マシンサイクルの間保持される。基本モジユ
ール10B,10Cの内部では、VSR31−0
に保持される画像データは前段の基本モジユール
10内のVSR31−2に保持される画像データ
と重複するため、有効な画像データとしてそれぞ
れVSR31−1,31−2に、2×7の局所画
像データが7マシンサイクルの間保持される。こ
の結果、3個の基本モジユール10内にある合計
7個のVSR31には、7×7の局所画像データ
が7マシンサイクルの間保持されることになる。
この7×7の局所画像データは7マシンサイクル
の間に時分割に読出され、合計3個の並列演算部
30により、7マシンサイクルで演算される。
なお、上記構成において、MSKTMS、TMS
を4に設定することにより、5×5の局所近傍画
像演算を5マシンサイクル毎に実行することも可
能である。この際に基本モジユール10のセレク
タ70がどのラインバツフア20の出力を選択す
るかは制御回路21により制御される。
本実施例によれば、基本モジユール10を1個
用いることにより、3×3の局所近傍画像演算を
3マシンサイクル毎に実行できる。また基本モジ
ユール10を3個接続し、制御回路21を操作す
ることにより、基本モジユールの接続方法を変え
ることなく、3×3、5×5、7×7の3種類の
局所近傍画像演算に対応できる。
第19図に別の実施例を示す。第19図の基本
モジユール10は、第1図に比べ、VSR31、
並列演算部30の内部の演算回路(PE)37が
それぞれ4個、セレクタ33、ラインバツフア2
0がそれぞれ3個に増えている。また、セレクタ
33−1は、データ線200,301中から1つ
を選択する3−to−16セレクタとなつている。こ
れにより、セレクタ33の切換えによつてVSR
31の配列を1×4、2×2、4×1の3通りに
切換えることができる。さらに、セレクタ70
は、データ線540,200,201,202の
中から1つを選択する4−to−1のセレクタとな
つている。これにより、セレクタ70の切換えに
よつて、入力画像データに対し、0、1、2、3
ライン遅れた画像データの中のひとつを選択し、
画像データ出力ポート55から出力することがで
きる。
第20図に、基本モジユール10を1個用い
て、4×4の局所近傍画像演算を4マシンサイク
ル毎に実行して時分割処理を行なう構成を示す。
第20図では、基本モジユール10の内部は、
ラインバツフア20、VSR31以外の回路を省
略している。また、同図は、4回の時分割処理に
より1個のVSR31で1×4の局所画像データ
を保持し、第19図におけるセレクタ33の切換
により、4個のVSR31を4×1に配列し、全
体として4×4の局所画像データを保持すること
を示す。この構成は、MSKTMS、TMSを3に
設定し、セレクタ33−0,33−1,33−2
がそれぞれデータ線200,201,202を選
択するように制御回路21を外部から操作するこ
とにより実現される。
第21図は、基本モジユール10を4個用い
て、4×4の局所近傍画像演算を1マシンサイク
ル毎に実行する構成を示す。ここでは、第19図
におけるセレクタ33の切換えにより、4個の
VSR31を1×4に配列している。また、セレ
クタ70の切換えにより、画像データ出力ポート
55からは、入力画像データに対して1ライン分
遅れた画像データが出力される。これにより、基
本モジユール10が4×1の配列となり、全体と
して4×4の局所画像ゲータを同時に取出せる。
この構成は、MSKTMS、TMSを0に設定し、
第19図におけるセレクタ33−0,33−1,
33−2,70がそれぞれデータ線300,30
1,302,200を選択するように制御回路2
1を外部から操作することにより実現される。す
なわち、第19図におけるセレクタ70はライン
バツフア20−0を選択し、データ線200のデ
ータを画像出力ポート55より出力するのであ
る。
入力画像データは、基本モジユール10Aの画
像データ入力ポート54に与えられる。基本モジ
ユール10Aの画像データ出力ポート55から出
力される1行分遅れた画像データは、基本モジユ
ール10Bの画像データ入力ポート54に与えら
れる。同様に基本モジユール10Bから10C
へ、10Cから10Dへと画像データが受け渡さ
れてゆく。また、基本モジユール10Aの演算デ
ータ出力ポート65から出力される演算結果は、
基本モジユール10Bの演算データ入力ポート6
4に与えられる。同様に基本モジユール10Bか
ら10Cへ、10Cから10Dへと演算結果が渡
されてゆき、基本モジユール10Dの演算データ
出力ポート65から、1マシンサイクル毎に出力
画像データが出力される。
第22図は、4個の基本モジユール10を第2
1図と同じ接続としたまま、8×8の局所近傍演
算を4マシンサイクル毎に実行する構成を示す。
ここでは、各VSR31は、4回の時分割処理に
より1×4の局所画像データを保持し、これら4
個のVSR31は、第19図におけるセレクタ3
3の切換えにより、2×2に配列され、1個の基
本モジユール10につき、2×8の局所画像デー
タを保持する構成となる。また、セレクタ70の
切換えにより、画像データ出力ポート55から
は、入力画像データに対し、2ライン分遅れた画
像データが出力される。この結果、4個の基本モ
ジユール10が4×1に配列され、全体として8
×8の局所画像データを保持することができる。
この構成は、MSKTMS、TMSを3とし、第1
9図におけるセレクタ33−0,33−1,33
−2,70がそれぞれデータ線300,200,
302,201を選択するように制御回路21を
外部から操作することにより実現できる。すなわ
ち、第19図における基本モジユール10はセレ
クタ70によりラインバツフア20−1の出力を
選択し、データ線201のデータを画像データ出
力ポート55より出力するのである。
第22図では、画像データ入力ポート54から
入力された画像データは1個の基本モジユール1
0で2ライン分の遅延を受け、画像データ出力ポ
ート55から出力される。また、VSR31は、
1個当たり1×4の局所画像データを保持し、基
本モジユール1個当たりでは、2×8の局所画像
データを保持する。この結果、4個の基本モジユ
ール10で、8×8の局所画像データを保持する
ことができる。
本実施例によれば、基本モジユール10を1個
用いることにより、4×4の局所画像演算を4マ
シンサイクル毎に実行できる。また基本モジユー
ル10を複数個接続し、制御回路21を外部から
操作することにより、同じ接続で4×4、8×8
等の様々な局所画像領域に対する局所近傍画像演
算を実行できる。
第23図に、さらに別の実施例を示す。本実施
例の基本モジユール10は、3本のラインバツフ
ア20、9個のVSR31、そして並列演算部3
0の内部の演算回路37もそれぞれ9個有してい
る。
第24図は、基本モジユール10を1個用いて
1マシンサイクル毎に3×3の局所画像演算を実
行する構成を示す。第25図は、第24図と同じ
ハードウエア構成で、時分割処理により3マシン
サイクル毎に3×9の局所近傍演算を実行する構
成を示す。
第26図は、基本モジユール10を9個用い
て、1マシンサイクル毎に9×9の局所画像演算
を実行する構成を示す。
画像データfは、基本モジユール10Aの画像
データ入力ポート54に与えられるとともに、シ
フトレジスタ3により3画素遅延されて基本モジ
ユール10Bの画像データ入力ポート54にさら
にシフトレジスタ4により3画素遅延されて基本
モジユール10Cの画像データ入力ポート54に
与えられる。基本モジユール10A,10B,1
0Cの画像データ出力ポート55から出力される
3行分遅れた画像データは、各々基本モジユール
10D,10E,10Fの画像データ入力ポート
54に与えられる。基本モジユール10D,10
E,10Fの画像データ出力ポート55から出力
される6行分遅れた画像データは、各々基本モジ
ユール10G,10H,10Iの画像データ入力
ポートに与えられる。また、基本モジユール10
Aの演算データ出力ポート65から出力される演
算結果は、基本モジユール10Dの演算データ入
力ポート64に与えられる。同様に基本モジユー
ル10Dから10Gへ、10から10Bへ、さら
に10E,10H,10C,10F,10Iと演
算結果が受け渡されてゆき、基本モジユール10
Iの演算データ出力ポート65から1マシンサイ
クルごとに出力画像データgが出力される。
第27図は、基本モジユール10を3個用い
て、9×9の局所画像演算を3マシンサイクル毎
に時分割実行する構成を示す。第26図の構成に
比べ、1/3のハードウエア量で同じ9×9の局所
画像演算を実現している。
本実施例によれば、3×3の局所画像演算を基
本モジユール10を1個用いることにより1マシ
ンサイクル毎に実行できる。また基本モジユール
10を複数個用いることにより、大きな局所画像
領域を用いる演算、例えばゼロクロツシングオペ
レーシヨン、パターンマツチング等を1マシンサ
イクル毎に実行することができる。さらに、時分
割処理を行うことにより、小さなハードウエア量
で大きな局所画像領域を用いる演算を実現でき
る。
以上、種々な実施例で説明してきたが、基本モ
ジユール(LSI)10内におけるラインバツフア
20、VSR31、並列演算部30内の演算回路
(PE)37の数は、LSIの集積度との関係で任意
に設定することができる。例えばm若しくはm−
1個のラインバツフア、m個の演算回路を設け、
この基本モジユールを単独で用いてn回のサイク
ルで時分割処理すればm×nの局所近傍の画像処
理が可能となり、n個の基本モジユールを並置し
てセレクタ70により1つのラインバツフア出力
を選択して並列処理すれば、n行×m列の局所近
傍の画像処理が1回のマシンサイクルで可能とな
る。
更にこの基本モジユールをn個並置(同一接
続)のまま、セレクタ70、セレクタ31を切換
えるだけで最大(n×m)行×t列の時分割処理
が可能である。(但し、この場合はt回のマシン
サイクルが必要となる。この際にVSR31はt
段構成とする。) また、演算回路37の数をm×n個設置すれば
更に多様な並列処理が高速になし得るのは言うま
でもない。
すなわち、本並列画像処理プロセツサは、大量
な画像データを高速処理したいとか、逆に多少時
間はかかつてもよいが、ハードウエアをコンパク
トにしたいなど相反するユーザニーズに柔軟に対
応できるものである。
〔発明の効果〕
(1) 本発明によれば、ラインバツフア等の外付け
回路や、複雑な制御を必要とせずに、局所画像
演算の対象となる局所画像領域を容易に拡張で
きる効果がある。
(2) 本発明によれば、同じ基本モジユールの接続
で、制御回路の操作により基本モジユール内の
構成を変え、様々な局所画像領域に対する局所
近傍画像演算を実現できる効果がある。
(3) 本発明によれば、この基本モジユールをLSI
化することにより、ハード物量を大幅に小さく
することができる。
【図面の簡単な説明】
第1図は本発明にかか 並列画像処理プロセツ
サの基本モジユール構成図、第2図は演算方式の
説明図、第3図は基本モジユール内の並列演算部
の構成図、第4図は基本モジユール内の統合回路
の構成図、第5図は統合回路の動作例を示す図、
第6図は基本モジユール内のラインバツフアの構
成図、第7図及び第8図は基本モジユール内の可
変段数シフトレジスタの構成図、第9図は動作例
を示す図、第10図はタイミングチヤート、第1
1図は他の可変段数シフトレジスタの構成図、第
12図はタイミングチヤート、第13図は他の可
変段数シフトレジスタの構成図、第14図は動作
例を示す図、第15図はタイミングチヤート、第
16図〜第18図は基本モジユールの使用例を示
す図、第19図は本発明にかかる他の基本モジユ
ール構成図、第20図〜第22図は他の基本モジ
ユールの使用例を示す図、第23図は本発明にか
かる他の基本モジユール構成図、第24〜第27
図は他の基本モジユールの使用例を示す図であ
る。 10……並列画像処理プロセツサの基本モジユ
ール、20……ラインバツフア、30……並列演
算部、31……可変段数シフトレジスタ、37…
…演算回路、40……統合回路、54……画像デ
ータ入力ポート、55……画像データ出力ポー
ト、64……演算データ入力ポート、65……演
算データ出力ポート、70……セレクタ。

Claims (1)

  1. 【特許請求の範囲】 1 外部からの画像データを入力する入力ポート
    と、前記入力画像データから順次局所画像データ
    を切出して記憶するm個(mは2以上の整数)の
    順次記憶手段と、前記順次記憶手段からの前記局
    所画像データを並列演算する並列演算部と、前記
    入力画像データを順次1行分ずつ遅延させる少な
    くともm−1個のラインバツフア、とからなる並
    列画像処理プロセツサにおいて、 前記ラインバツフアからの出力と前記順次記憶
    手段からの出力とを選択的に切換えて次の前記順
    次記憶手段に入力させる、少なくともm−1個の
    切換回路と、前記並列演算部からの演算結果を外
    部に出力する演算データ出力ポート、とを設けた
    ことを特徴とする並列画像処理プロセツサ。 2 特許請求の範囲第1項において、 外部からの演算結果を入力する演算データ入力
    ポートと、前記並列演算部からの演算結果と前記
    演算データ入力ポートからの演算結果とを統合す
    る統合手段とを設け、前記演算データ出力ポート
    を介して前記統合手段から外部に出力することを
    特徴とする並列画像処理プロセツサ。 3 外部からの画像データを入力する入力ポート
    と、前記入力画像データから順次局所画像データ
    を切出して記憶するm個(mは2以上の整数)の
    順次記憶手段と、前記順次記憶手段からの前記局
    所画像データを並列演算する並列演算部と、前記
    入力画像データを順次1行分ずつ遅延させる少な
    くともm−1個のラインバツフア、とからなる並
    列画像処理プロセツサにおいて、 前記入力ポートからの画像データまたは前記ラ
    インバツフア出力からの画像データを取込み、そ
    のいずれかを選択的に切り換える切換回路と、前
    記切換回路により選択した画像データを出力する
    出力ポートと、前記並列演算部からの演算結果を
    外部に出力する演算データ出力ポート、を設けた
    ことを特徴とする並列画像処理プロセツサ。 4 特許請求の範囲第3項において、 外部からの演算結果を入力する演算データ入力
    ポートと、前記並列演算部からの演算結果と前記
    演算データ入力ポートからの演算結果とを統合す
    る統合手段とを設け、前記演算データ出力ポート
    を介して前記統合手段から外部に出力することを
    特徴とする並列画像処理プロセツサ。 5 外部からの画像データを入力する入力ポート
    と、前記入力画像データから順次局所画像データ
    を切出して記憶するm個(mは2以上の整数)の
    順次記憶手段と、前記順次記憶手段からの前記局
    所画像データを並列演算する並列演算部と、前記
    入力画像データを順次1行分ずつ遅延させる少な
    くともm−1個のラインバツフア、とからなる並
    列画像処理プロセツサにおいて、 前記ラインバツフアからの出力と前記順次記憶
    手段からの出力とを選択的に切換え、次の順次記
    憶手段に入力させる少なくともm−1個の第1の
    切換回路と、前記入力ポートからの画像データと
    前記ラインバツフア出力からの画像データのいず
    れかを選択的に切り換える第2の切換回路と、前
    記切換回路により選択した画像データを出力する
    出力ポートと、外部からの演算結果を入力する演
    算データ入力ポートと、前記並列演算部からの演
    算結果と前記演算データ入力ポートからの演算結
    果とを統合する統合手段と、前記統合手段から外
    部に出力する演算データ出力ポート、とを設けた
    ことを特徴とする並列画像処理プロセツサ。 6 特許請求の範囲第5項において、 前記画像データ入力ポート、前記順次記憶手
    段、前記ラインバツフア、前記第1の切換回路、
    前記並列演算部、前記演算データ入力ポート、前
    記統合手段、前記演算データ出力ポート、前記第
    2の切換回路、前記画像データ出力ポート、とを
    ワンチツプLSIとしたことを特徴とする並列画像
    処理プロセツサ。 7 特許請求の範囲第5項または第6項のうちの
    いずれかにおいて、 前記順次記憶手段の画像データのシフトはクロ
    ツク信号に対し間欠的に操作し、前記画像データ
    の読出しはクロツク毎に行う並列画像処理プロセ
    ツサ。 8 特許請求の範囲第5項乃至第7項のうちのい
    ずれかにおいて、 前記ラインバツフアは少なくとも1ビツトの同
    時読み出し、同時書き込みが可能な情報記憶部
    と、前記情報記憶部の行番地を制御する行番地制
    御部を備え、前記行番地制御部に与えられる制御
    信号により前記情報記憶部の読み出しおよび書き
    込み開始行番地と最終行番地が決定され、遅延段
    数を可変とすることができることを特徴とする並
    列画像処理プロセツサ。 9 特許請求の範囲第5項乃至第8項のいずれか
    において、 前記順次記憶手段をそれぞれn段(nは1以上
    の整数)構成として、前記第1の切換回路をライ
    ンバツフア出力に切換え、m行×n列の局所画像
    データをn回のマシンサイクルで時分割処理する
    ことを特徴とする並列画像処理プロセツサ。 10 特許請求の範囲第5項乃至第8項のいずれ
    かにおいて、 前記並列画像処理プロセツサをn個(nは2以
    上の整数)並置し、前記並列画像処理プロセツサ
    の出力ポートと次の前記並列画像処理プロセツサ
    の前記入力ポート、および前記並列画像処理プロ
    セツサの演算データ出力ポートと次の並列画像処
    理プロセツサの前記演算データ入力ポートとを接
    続し、各並列画像処理プロセツサの前記順次記憶
    手段をそれぞれ1段構成とし、第1の切換回路を
    順次記憶手段からの出力に切換え、第2の切換回
    路を1行分だけ遅延させたラインバツフア出力に
    切換え、m行×n列の局所画像データを1回のマ
    シンサイクルで処理することを特徴とする並列画
    像処理プロセツサ。 11 特許請求の範囲第5項乃至第8項のいずれ
    かにおいて、前記並列画像処理プロセツサをn個
    (nは2以上の整数)並置し、前記出力ポートと
    次の前記並列画像処理プロセツサの前記入力ポー
    ト、および前記前記並列画像処理プロセツサの演
    算データ出力ポートと次の前記並列画像処理プロ
    セツサの前記演算データ入力ポートとを接続し
    て、各前記並列画像処理プロセツサの前記順次記
    憶手段をそれぞれt段構成とし、前記第1の切換
    回路を前記ラインバツフア出力のいずれかに切換
    え、前記第2の切換回路を前記ラインバツフア出
    力のいずれかに切換え、最大(m×n)行×t列
    の局所画像データをt回のマシンサイクルで時分
    割処理することを特徴とする並列画像処理プロセ
    ツサ。
JP1571386A 1985-02-01 1986-01-29 並列画像処理プロセツサ Granted JPS621074A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP60-16553 1985-02-01
JP1655385 1985-02-01

Publications (2)

Publication Number Publication Date
JPS621074A JPS621074A (ja) 1987-01-07
JPH0527903B2 true JPH0527903B2 (ja) 1993-04-22

Family

ID=11919466

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1571386A Granted JPS621074A (ja) 1985-02-01 1986-01-29 並列画像処理プロセツサ

Country Status (1)

Country Link
JP (1) JPS621074A (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63291178A (ja) * 1987-05-22 1988-11-29 Matsushita Electric Ind Co Ltd ディジタル信号処理装置
JPH02229984A (ja) * 1989-03-01 1990-09-12 Tatsuo Ueda 水道管の埋設工法
JP5522890B2 (ja) * 2007-07-31 2014-06-18 キヤノン株式会社 画像処理装置及び方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS4857562A (ja) * 1971-11-19 1973-08-13
JPS58181171A (ja) * 1982-04-16 1983-10-22 Hitachi Ltd 並列画像処理プロセツサ

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS4857562A (ja) * 1971-11-19 1973-08-13
JPS58181171A (ja) * 1982-04-16 1983-10-22 Hitachi Ltd 並列画像処理プロセツサ

Also Published As

Publication number Publication date
JPS621074A (ja) 1987-01-07

Similar Documents

Publication Publication Date Title
US4739474A (en) Geometric-arithmetic parallel processor
US5854636A (en) Semiconductor IC with a plurality of processing circuits which receive parallel data via a parallel data transfer circuit
US5151953A (en) Single chip 2-D convolver
US20140337262A1 (en) Convolution operation circuit and object recognition apparatus
JPH0778825B2 (ja) 画像処理プロセツサ
JPS6053349B2 (ja) 画像処理プロセツサ
US5136662A (en) Image processor for sequential processing of successive regions of an image
US4606066A (en) Programmable image processor
JPH0230535B2 (ja)
JPH0636311B2 (ja) 2重ポートvramメモリ
JP3955741B2 (ja) ソート機能を有するsimd型マイクロプロセッサ
US4845767A (en) Image signal processor
JP2949589B2 (ja) 2×2ウインドウ・アーキテクチヤを有する並列パイプライン映像プロセツサ
US5274717A (en) Parallel image processor for performing local neighboring image processing
EP0189943B1 (en) Parallel image processor
US5029018A (en) Structure of image processing system
JPH0527903B2 (ja)
JP2002269067A (ja) 行列演算装置
Waltz SKIPSM implementations: morphology and much, much more
JPH0664606B2 (ja) 画像処理装置
US5535151A (en) Electronic processor for performing multiplication
JPH07107706B2 (ja) 遅延段数の可変なラインバツフア
JPH04100179A (ja) 画像処理装置
JPH06309349A (ja) プログラム制御のプロセッサ
JPH0769955B2 (ja) 画像処理プロセッサ

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees