JPH07334671A - 超高速画像処理システムのフィルタリング処理方式 - Google Patents

超高速画像処理システムのフィルタリング処理方式

Info

Publication number
JPH07334671A
JPH07334671A JP6132152A JP13215294A JPH07334671A JP H07334671 A JPH07334671 A JP H07334671A JP 6132152 A JP6132152 A JP 6132152A JP 13215294 A JP13215294 A JP 13215294A JP H07334671 A JPH07334671 A JP H07334671A
Authority
JP
Japan
Prior art keywords
processing
data
filtering
time
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6132152A
Other languages
English (en)
Inventor
Masaharu Imai
今井正治
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
TOYOHASHI TECHNO SCI KK
Japan Science and Technology Agency
Original Assignee
TOYOHASHI TECHNO SCI KK
Research Development Corp of Japan
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by TOYOHASHI TECHNO SCI KK, Research Development Corp of Japan filed Critical TOYOHASHI TECHNO SCI KK
Priority to JP6132152A priority Critical patent/JPH07334671A/ja
Publication of JPH07334671A publication Critical patent/JPH07334671A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Facsimile Image Signal Circuits (AREA)
  • Controls And Circuits For Display Device (AREA)
  • Image Processing (AREA)

Abstract

(57)【要約】 【目的】 複数のフィルタリング処理を逐次的に実行す
る場合の処理時間を短縮する。 【構成】 1行分の画像データの全部または一部をラス
タースキャン順に取り込む複数の入力要素からなる入力
ユニットと、各入力要素からの画像データが同時に転送
され、画素単位で並列的に画像処理演算を行う複数の処
理要素からなる処理ユニットと、各処理要素からの処理
データが同時に転送される複数の出力要素からなる出力
ユニットと、入力ユニット、処理ユニット、出力ユニッ
トを制御するコントローラとを備え、順次各行毎に画素
単位で複数のフィルタリング処理を行う超高速画像処理
システムであって、1回の入出力において複数のフィル
タリング処理を逐次的に実行するようにしたことを特徴
とする。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は大規模画像の前処理を実
時間で行うことができる超高速画像処理システムRIP
E(Real−time Image Process
ing Engine)のフィルタリング処理方式に関
するものである。
【0002】
【従来の技術】医療、工業生産などの分野で計算機を用
いた画像処理の必要性が高まって来ている。これらの応
用分野における近い将来の目標は2次元またはそれ以上
の多次元大規模画像(高画質画像)の実時間処理であ
る。システムの認識能力を向上させるためには画像自体
の分解能をあげることが必須であるが、そのためには、
画素数を増大させること、および前処理でのフィルタの
マスクサイズを増大させることが必要である。
【0003】ここ数年間での画像処理に対する具体的要
求の例として以下の3項目が考えられる。
【0004】1画像当たり2048×2048以上の
画素を持つ多値およびカラーの画像の処理が可能となる
こと。
【0005】上記の画像に対してフィルタリングなど
の局所並列処理が高速に行えること、および 50×50程度の大きさのマスクを用いたフィルタリ
ング処理が可能であること。
【0006】画像処理ではフィルタリングを中心とする
前処理が行われる場合が多く、画像の規模およびフィル
タの規模が増大するのに従い、前処理に必要な計算時間
は急激に増加する。
【0007】これまで医療、工業生産などで実用化され
ている画像処理システムでは、512×512程度の画
素を持つ画像を対象としているが、2048×2048
画素程度の解像度を持つ医療用X線フィルムなどの複雑
な濃淡画像の前処理を行うためには、スーパーコンピュ
ータなどの汎用大型計算機を用いても実時間処理は困難
である。このような大規模画像の前処理を効率よく行う
専用システムを実現するためには、処理の並列化および
パイプライン化が有効であると考えられる。特にフィル
タリング処理のアルゴリズムの多くは並列型の積和演算
を頻繁に用いているので、画素単位での空間並列処理が
効果的であると考えられる。
【0008】
【発明が解決しようとする課題】ところで、本出願人は
既に超高速画像処理システムRIPEを提案している。
図1は超高速画像処理システムRIPEのハードウェア
構成を示す図、図2は各画像処理要素を示す図である。
図中、1はベースポインタ、2はリファレンスポイン
タ、3は加減算器、4はスリットメモリ、10は入力ユ
ニット(LIU)、10−1〜10−nはラッチ回路
(IE)、20は処理ユニット(LPU)、20−1〜
20−nは処理要素(PE)、30は出力ユニット(L
OU)、30−1〜30−nはラッチ回路(OE)、4
0はホストコンピュータ、50は外部コントローラ、2
1−iはセレクタ、22−iは算術論理ユニット(AL
U)、23−iはレジスタファイル、24−iはフラグ
レジスタ、25−iは通信コントローラ、26−iはバ
スである。
【0009】RIPEでは、65536階調(16ビッ
ト)の濃淡画像データに対する各行の処理を、入力−演
算−出力の3つのステージに分割し、パイプライン的に
処理することにより画像データの入出力と演算処理を平
行して行うものであり、演算ステージでは画像1行中の
画素数と同じ個数のPE(Processig Ele
ment)を用い、外部コントローラより各PEに対し
て同一の命令を1つづつ与え、それぞれの画像データに
対して同一の処理を行うSIMD(Single In
struction stream Multiple
Data stream)型の並列処理が行われるた
め、画像データの処理が1行分同時に行われる。
【0010】図1のシステムはホストシステムのバック
エンドプロセッサとして動作し、外部コントローラ5
0、入力ユニット10、演算ユニット20、出力ユニッ
ト30からなっている。外部コントローラ50はホスト
コンピュータ40との同期をとりながら、入力ユニット
10、演算ユニット20、出力ユニット30の制御を行
い、ユーザーが作成した処理プログラムを格納するRA
Mと、予め基本的な処理のプログラムが格納されている
ROMを持ち、ホストコンピュータ40からの指示にし
たがってRAMまたはROMに記憶された命令を1ステ
ップづつ順次各演算ユニット20に送っており、各演算
ユニットは命令されたことだけを実行する処理機械とし
て機能する。なお、ユーザーが作成した処理プログラム
は処理に先立ち、あらかじめホストコンピュータ40か
らコントローラ50のRAMにダウンロードされる。
【0011】入力ステージを受け持つLIU10は16
ビット幅のn個のラッチ回路(IE)から構成されてシ
フトレジスタとして動作し、他のメモリに記憶されてい
るイメージデータ、或いはカメラで読み込んだイメージ
データがラスタースキャン順に入力され、その画素デー
タを順次シフトし、画像1行分の画素データが揃った時
点で1行分の画素データを同時にLPU20の各PE2
0−1〜20−nに同時並列的に転送する。
【0012】LPU20はn個のPEから構成されて演
算ステージを受け持っており、図2に示すような各モジ
ュールからなっている。図2はi番目のPE20−iを
示したものであり、ラッチ回路10−iからのデータを
順次スリットメモリ4に読み込み、このデータをバス2
6−iを通してALU22−iで演算して中間結果をレ
ジスタ23−iに格納し、また結果をセレクタ21−i
を通してラッチ回路30−iへ出力するものである。各
PEはコントローラ50からの命令を1ステップづつ受
け取って一斉に同一処理を行っており、自身のメモリに
はプログラムが格納されておらず、外部からの指令によ
って単に処理機械として動作する。
【0013】スリットメモリ4は、フィルタリング処理
に必要なデータを格納するためのものである。すなわ
ち、画像データに対する局所並列処理では1つの画素の
出力値を決定するために、その画素の近傍の画素データ
も必要となり、この場合全てのPEが各自必要なデータ
を内部に持つこととすると、システム全体ではデータが
重複し不経済である。そこで、各PE内でのスリットメ
モリにそのPEが処理を受け持っている列のデータを必
要な個数分、すなわちマスクの縦の画素の個数分だけ記
憶させることにし、残りの近傍データは他のPE内のス
リットメモリに保持されているので、隣接するPE間で
通信コントローラ25−iを通してデータ転送を行うこ
とによって得るようにする。本実施例では各スリットメ
モリは16ビット幅の64個のセルからなり、列方向の
長さが64以下のマスクを用いた局所並列処理が実現で
きる。
【0014】ALU22−iは各画素に対して16ビッ
ト幅の算術論理演算処理を行うものである。処理内容は
どのようなフィルタ処理を行うかにより異なるが、AL
U22−iは外部コントローラから1つづつ与えられる
命令を実行する。
【0015】レジスタファイル23−iは中間結果等の
データを格納するレジスタが割付けられたファイルで、
16個の16ビット幅のGR(General Reg
ister),通信コントローラ25−iを通して隣接
するPE間で転送されるデータを格納する通信用レジス
タCR(Communication Registe
r)等からなり、またフラグレジスタ24−iは符合、
零、オーバーフロー、キャリー等のフラグの内容を格納
するためのものである。
【0016】セレクタ21−iは局所処理を行う場合、
画像の外周部では近傍のデータが完全には得られないた
め計算結果は無効となり、従来の画像処理アルゴリズム
では、通常強制的に出力値を0にしたり、処理内容に応
じて適切な定数または近傍の値等を設定するようにして
いるが、この画像外周部の出力値を定数にするか、無効
ではあるが計算値にするかいずれかを設定できるように
し、この機能を行っている。
【0017】こうして各PEはスリットメモリ4に読み
込まれた必要なデータを順次読み出すと共に、隣接する
処理ユニットからのデータを通信コントローラを通して
受け取り、フィルタリング処理を行いラッチ回路に出力
している。
【0018】図1のLOU30は16ビット幅のn個の
ラッチ回路からなり、出力ステージを受持ち、LPU2
0で演算されたデータは1行分同時にLOU30に転送
され、その後順次シフトされることによって1画素づつ
ラスタースキャン順に出力される。
【0019】ところで、RIPEにより4つのフィルタ
リング処理A,B,C,Dを連続して行う場合、図3に
示すように、画像データf0 に対してフィルタリング処
理Aを施し、得られたデータf1 を一旦メモリに格納す
る。次いで、データf1 を読み出し、フィルタリング処
理Bを施して同様にデータf2 を得てこれをメモリに格
納する。以後同様にフィルタリング処理Cを行ってデー
タf3 を得、さらにフィルタリング処理Dを施してデー
タf4 が得られる。
【0020】この場合の処理(Execution)時
間と演算(Processing)時間とメモリアクセ
ス時間との関係は、図4に示すような関係になってい
る。処理時間とはPEにおける処理時間の合計であり、
メモリアクセス時間とはIE,OEに対する入出力に対
する時間であり、演算時間はPEにおいて演算に要して
いる時間である。図4から分かるように、各フィルタリ
ング処理演算毎にデータを読みだして記憶するためのメ
モリアクセス時間があるため、演算時間は短いものの、
全体の処理時間は長くなり、RIPEのもつ演算性能を
十分に発揮できていないという問題がある。
【0021】本発明は上記課題を解決するためのもの
で、1回の入出力で複数のフィルタリング処理を逐次的
に実行することにより処理時間の短縮を図ることができ
る超高速画像処理システムのフィルタリング処理方式を
提供することを目的とする。
【0022】
【課題を解決するための手段】本発明は、1行分の画像
データの全部または一部をラスタースキャン順に取り込
む複数の入力要素からなる入力ユニットと、各入力要素
からの画像データが同時に転送され、画素単位で並列的
に画像処理演算を行う複数の処理要素からなる処理ユニ
ットと、各処理要素からの処理データが同時に転送され
る複数の出力要素からなる出力ユニットと、入力ユニッ
ト、処理ユニット、出力ユニットを制御するコントロー
ラとを備え、順次各行毎に画素単位で複数のフィルタリ
ング処理を行う超高速画像処理システムであって、1回
の入出力において複数のフィルタリング処理を逐次的に
実行するようにしたことを特徴とする。
【0023】
【作用】本発明は複数のフィルタリング処理を1つのフ
ィルタリング処理として機能させ、1回の入出力におい
て複数のフィルタリング処理を逐次的に適用することに
より、メモリアクセス時間を1回の入出力に限定するこ
とができ、全体の処理時間を大幅に短縮することが可能
となる。
【0024】
【実施例】図5は本発明のフィルタリング処理方式を説
明する図、図6は複数のフィルタリングプログラムを1
つのフィルタリングプログラムにマージし、1回の入出
力において各フィルタリングを逐次的に適用する場合の
説明図である。本発明は、図1における処理要素(P
E)において実行されるフィルタリング処理を対象とし
ている。図5において、画像データf0 は入力ユニット
より読み込まれ、まずフィルタリング処理Aが施され、
フィルタリング処理Aにより次のフィルタリング処理B
を実行できるデータがそろうと、フィルタリング処理B
が実行され、順次データがそろう毎にフィルタリング処
理C、Dが実行されて、最終的に生成されるデータf4
がメモリに格納される。その結果、図6に示すように、
メモリアクセス時間は図4における1回のフィルタリン
グ処理に要する時間であり、全体の処理時間は各フィル
タリング処理に要する演算処理時間の合計時間となる。
この結果、各フィルタリング処理毎に要したメモリアク
セス時間は不要となり、全体の処理時間を大幅に短縮す
ることが可能となる。
【0025】次に、図5で示したフィルタリング処理に
ついてさらに詳細に説明する。図7は画像データに対す
る本発明のフィルタリング処理を説明する図で、3×3
のマスクサイズによるフィルタリング処理を考えるとす
る。画像データf0 に対して、3×3のマスクサイズの
フィルタ処理Aにより、順次f1 のデータが生成され
る。この処理は図7において、順次下方に向かって行わ
れる。こうして、データf1 が生成されて3×3のマス
クサイズの処理を満たすデータがそろうと、同様にフィ
ルタ処理Bを実行してf2 が生成される。さらにf2
データが揃うと、フィルタ処理Cが、f3 のデータが揃
うとフィルタ処理Dが順次、逐次的に適用され、1回の
入出力において、4つのフィルタ処理が実行されること
になる。
【0026】これをさらに図8により詳細に説明する
と、図7における第i行についてf0データの
0 i,-1,f0 i,0 ,f0 i,1 3つのデータによりf1
i,0 が、f0 i,0 ,f0 i,1 ,f0 i,2 の3つのデータ
よりf1 i,1 が、順次f0 i,(j-1) ,f0 i,j ,f0
i,(j+1) よりf1 i,j が得られ、また、同様にしてf1
よりf2 データが生成される。
【0027】この場合、例えば処理A、処理B、処理C
のマスクサイズが3×3、処理Dが例えば2値化処理で
マスクサイズが1×1であったとすると、各処理におけ
るデータサイズは図9に示すように、処理Dにおいては
データ数1、処理Cにおいてはデータ数3×3、処理B
においてはデータ数5×5、処理Aにおいてはデータ数
7×7の関係になる。つまり、画像データとしては、7
×7のデータ数より最終フィルタリング処理のデータが
得られることになる。
【0028】図10は本発明のフィルタリング処理にお
けるスリットメモリへのデータ格納を説明する図であ
る。図10(a)に示すように、7つのf0 データより
5つのf1 データが生成され、5つのf1 より3つのf
2 データが、3つのf2 データから1つのf3 が生成さ
れる。この場合、7つのf0 データのうち、f1 データ
を生成したf0 i,j 、f0 (i,j-1) ,f0 (i,j-2) ,f
0 (i,j-3) のデータは不要となり、またf1 (i,j-1)
1 (i,j-2) も不要となるため、これを消去すると、図
10(b)に示すようになる。この図10(b)の値に
対して順次新たなf0 のデータが付加され(図10
(c))、順次処理が実行されることになり、データ消
去により記憶すべきデータ数を少なくすることができ
る。
【0029】
【発明の効果】以上のように本発明によれば、従来複数
のフィルタリング処理を実行する場合、メモリアクセス
時間がネックとなっていたが、本発明においては、1回
の入出力において、複数のフィルタリング処理を逐次的
に適用するようにしたので、大幅に処理時間の短縮を図
る事が可能となる。
【図面の簡単な説明】
【図1】 超高速画像処理システムRIPEのハードウ
ェア構成を示す図である。
【図2】 各画像処理要素を示す図である。
【図3】 従来の複数のフィルタリング処理を行う場合
のフローを説明する図である。
【図4】 従来のフィルタリング処理における処理時間
と演算時間とメモリアクセス時間との関係を示す図であ
る。
【図5】 本発明のフィルタリング処理を説明する図で
ある。
【図6】 本発明のフィルタリング処理における処理時
間と演算時間とメモリアクセス時間との関係を示す図で
ある。
【図7】 画像データに対する本発明のフィルタリング
処理を説明する図である。
【図8】 本発明のフィルタリング処理を説明する図で
ある。
【図9】 複数のフィルタリング処理を行う場合のマス
クサイズとデータ数との関係を示す図である。
【図10】 フィルタリング処理におけるメモリ内デー
タを説明する図である。
【符号の説明】
A,B,C,D…フィルタリング処理

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 1行分の画像データの全部または一部を
    ラスタースキャン順に取り込む複数の入力要素からなる
    入力ユニットと、各入力要素からの画像データが同時に
    転送され、画素単位で並列的に画像処理演算を行う複数
    の処理要素からなる処理ユニットと、各処理要素からの
    処理データが同時に転送される複数の出力要素からなる
    出力ユニットと、入力ユニット、処理ユニット、出力ユ
    ニットを制御するコントローラとを備え、順次各行毎に
    画素単位で複数のフィルタリング処理を行う超高速画像
    処理システムであって、1回の入出力において複数のフ
    ィルタリング処理を逐次的に実行するようにしたことを
    特徴とする超高速画像処理システムのフィルタリング処
    理方式。
JP6132152A 1994-06-14 1994-06-14 超高速画像処理システムのフィルタリング処理方式 Pending JPH07334671A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6132152A JPH07334671A (ja) 1994-06-14 1994-06-14 超高速画像処理システムのフィルタリング処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6132152A JPH07334671A (ja) 1994-06-14 1994-06-14 超高速画像処理システムのフィルタリング処理方式

Publications (1)

Publication Number Publication Date
JPH07334671A true JPH07334671A (ja) 1995-12-22

Family

ID=15074578

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6132152A Pending JPH07334671A (ja) 1994-06-14 1994-06-14 超高速画像処理システムのフィルタリング処理方式

Country Status (1)

Country Link
JP (1) JPH07334671A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113220730A (zh) * 2021-05-28 2021-08-06 中国农业银行股份有限公司 业务数据的处理系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113220730A (zh) * 2021-05-28 2021-08-06 中国农业银行股份有限公司 业务数据的处理系统
CN113220730B (zh) * 2021-05-28 2024-03-26 中国农业银行股份有限公司 业务数据的处理系统

Similar Documents

Publication Publication Date Title
US5315699A (en) Filtering operation method for very high-speed image processing system
JPS6053349B2 (ja) 画像処理プロセツサ
US4606066A (en) Programmable image processor
AU747283B2 (en) Data processing system for logically adjacent data samples such as image data in a machine vision system
JPH0740252B2 (ja) マルチプロセツサシステム
JPH03131965A (ja) ニューラルネットワーク用二次元収縮アレイ及びその方法
Duclos et al. Image processing on a SIMD/SPMD architecture: OPSILA
US20090046953A1 (en) Image Processing Apparatus And Method
EP0069542A2 (en) Data processing arrangement
JP6532334B2 (ja) 並列演算装置、画像処理装置及び並列演算方法
JPH07334671A (ja) 超高速画像処理システムのフィルタリング処理方式
JP2862387B2 (ja) 超高速画像処理システムのフィルタリング処理方式
JP2862388B2 (ja) 超高速画像処理システムのフィルタリング処理方式
Reddy et al. Computer architectures for vision
JP2001216275A (ja) 画像処理装置および画像処理方法
JPH06282432A (ja) 演算処理装置
CN112418417B (zh) 基于simd技术的卷积神经网络加速装置及方法
JP3834869B2 (ja) 並列処理プロセッサ
JPS6247785A (ja) 近傍画像処理装置
Lin et al. A High-Throughout Real-Time Prewitt Operator on Embedded NEON+ ARM System
CN114511072A (zh) 图像处理方法、装置、电子设备及存储介质
JP2658346B2 (ja) 並列画像処理装置
JP2001357395A (ja) 画像処理装置およびその方法
JPS6379180A (ja) 並列画像処理用lsi
JPS63118987A (ja) 循環並列画像処理装置