JPH0757075A - Processor element of one-chip parallel processor for pattern processing - Google Patents

Processor element of one-chip parallel processor for pattern processing

Info

Publication number
JPH0757075A
JPH0757075A JP22228693A JP22228693A JPH0757075A JP H0757075 A JPH0757075 A JP H0757075A JP 22228693 A JP22228693 A JP 22228693A JP 22228693 A JP22228693 A JP 22228693A JP H0757075 A JPH0757075 A JP H0757075A
Authority
JP
Japan
Prior art keywords
register
processor
bit
processor element
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP22228693A
Other languages
Japanese (ja)
Inventor
Nobuo Takayanagi
信夫 高柳
Shuichi Nakagami
修一 中上
Masatoshi Ishikawa
正俊 石川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Steel Corp
Original Assignee
Nippon Steel Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Steel Corp filed Critical Nippon Steel Corp
Priority to JP22228693A priority Critical patent/JPH0757075A/en
Publication of JPH0757075A publication Critical patent/JPH0757075A/en
Withdrawn legal-status Critical Current

Links

Landscapes

  • Closed-Circuit Television Systems (AREA)
  • Image Processing (AREA)

Abstract

PURPOSE:To enable a high functional and high speed pattern processing by making a register into a 1-bit register in the processor element of a one-chip parallel processor for pattern processing which is used for fetching the pattern information on a high speed visual sensor, etc., and processing the information at a high speed. CONSTITUTION:In a processor element 11 composed of plural sensors 12 sensing pattern information, the register of a one-chip parallel processor for pattern processing where plural processor elements 11 coupled with each picture element processing outputs of these sensors 12 or a picture element group composed of a few picture elements by 1 to 1 are integrated on an integrated circuit and a computing element, the computing element is composed of the computing element 22 of a bit serial arithmetic system and the register is composed by connecting plural 1-bit registers 21 with the computing element 22 in parallel.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、高速視覚センサ等のパ
ターン情報を取り込み、これを高速に処理するために用
いられるパターン処理用1チップ並列処理装置に使用さ
れるプロセッサ要素に関するものである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a processor element used in a one-chip parallel processing device for pattern processing, which is used for fetching pattern information from a high-speed visual sensor or the like and processing it at high speed.

【0002】[0002]

【従来の技術】画像処理などのパターン情報の処理に
は、高い並列性があるものが多く、データの並列処理が
有効なことが多い。このことを利用して、生産現場にお
ける製品の外観検査のように高速なパターン処理が必要
とされる分野では、特定用途向けの並列処理装置がこれ
までに数多く開発されてきた。
2. Description of the Related Art In many cases, pattern information processing such as image processing has high parallelism, and parallel processing of data is often effective. Utilizing this fact, many parallel processing devices for specific applications have been developed so far in fields where high-speed pattern processing is required, such as visual inspection of products on the production site.

【0003】しかし、これらのパターン処理用並列処理
装置は大がかりで複雑であり、したがって、高価なもの
ばかりであった。また、画像処理用途のものでは、その
ほとんどが画像を取り込むセンサに従来からあるCCD(Ch
arge Coupled Device)カメラを用いていたため、処理装
置の処理速度の上限が、このCCD カメラから画像を取り
込む速度(1秒間に30フレーム又は60フレーム)に
制限されていた。
However, these parallel processing devices for pattern processing are large-scale and complicated, and are therefore expensive. For image processing applications, most of the CCD (Ch
Since the arge coupled device) camera is used, the upper limit of the processing speed of the processing device is limited to the speed of capturing an image from this CCD camera (30 frames or 60 frames per second).

【0004】一般に、パターン情報はデータ量が膨大で
あるため、センサと処理装置の間の通信経路が処理装置
を高速化する上での障害となっていた。これを解決する
ために通信経路の速度を上げたり、容量を増やしたりす
ることは、配線にかかるコストと信頼性の面から望まし
くない。
Generally, since the pattern information has a huge amount of data, the communication path between the sensor and the processing device has been an obstacle to speeding up the processing device. Increasing the speed of the communication path or increasing the capacity in order to solve this is not desirable in terms of wiring cost and reliability.

【0005】このような配線の複雑化を避けつつ、通信
経路の問題を解決するには、パターン情報をセンシング
するためのセンサアレイと、パターン情報を並列に処理
するプロセッサアレイとをLSI上に一体化したパター
ン処理用1チップ並列処理装置が有効である。すなわ
ち、パターン処理用1チップ並列処理装置においては、
センサアレイとプロセッサアレイとを1つのLSIによ
って実現することにより、出力として少量の質の高い情
報を取り出すことで、配線の問題を解決することが可能
となる。また、同時に、高速、小型、軽量、低価格、低
消費電力などの優れた効果が得られる。その際、1つの
LSI上のゲート数には限りがあるので、より高い解像
度のパターンを処理するためには、プロセッサアレイを
構成する各プロセッサ要素の回路規模をできるだけ小型
化してセンサとプロセッサの搭載数を増やすようにしな
ければならない。
In order to solve the problem of the communication path while avoiding such complicated wiring, a sensor array for sensing pattern information and a processor array for processing pattern information in parallel are integrated on an LSI. A one-chip parallel processing device for pattern processing that has been realized is effective. That is, in the one-chip parallel processing device for pattern processing,
By implementing the sensor array and the processor array by one LSI, it is possible to solve the wiring problem by taking out a small amount of high-quality information as an output. At the same time, excellent effects such as high speed, small size, light weight, low price, and low power consumption can be obtained. At that time, since the number of gates on one LSI is limited, in order to process a pattern of higher resolution, the circuit scale of each processor element constituting the processor array should be minimized to mount a sensor and a processor. We must try to increase the number.

【0006】ところが、一般にプロセッサ要素の回路規
模を小さくすると、それだけ演算機能が失われることに
なる。したがって、ある程度の汎用性を持ったパターン
処理用並列処理装置を実現するには、如何に機能を落さ
ずに、プロセッサ要素の回路規模を小さくするかが重要
である。
However, generally, when the circuit scale of the processor element is reduced, the arithmetic function is lost accordingly. Therefore, in order to realize a parallel processing apparatus for pattern processing having a certain degree of versatility, it is important to reduce the circuit scale of the processor element without degrading the function.

【0007】一方、本発明の対象とするパターン処理用
1チップ並列処理装置のプロセッサ要素では、上述の配
線の問題と同様の理由により、外部に記憶装置を持つこ
とができないため、演算に必要なデータの全てをプロセ
ッサ要素内のレジスタに保持する必要がある。したがっ
て、演算機能を維持するためには、プロセッサ要素のレ
ジスタ構造が重要となってくる。すなわち、一般のマイ
クロプロセッサにおいては、レジスタは、プロセッサの
外部にあるメモリに比べて高速に読み書き可能な記憶領
域であり、メモリアクセスの頻度を減らすことが主たる
目的であるのに対して、本発明の対象とするプロセッサ
要素のレジスタは、プロセッサ要素が持つことのできる
唯一の記憶領域であるので、この少ない記憶領域を有効
に効率良く使用できるようなレジスタ構成が要求され
る。
On the other hand, the processor element of the one-chip parallel processing device for pattern processing, which is the object of the present invention, cannot have an external storage device for the same reason as the above-mentioned wiring problem, so that it is necessary for the calculation. All of the data needs to be held in registers within the processor element. Therefore, in order to maintain the arithmetic function, the register structure of the processor element becomes important. That is, in a general microprocessor, the register is a storage area that can be read and written at a higher speed than a memory outside the processor, and the main purpose is to reduce the frequency of memory access. Since the register of the target processor element is the only storage area that the processor element can have, a register configuration that can effectively use this small storage area is required.

【0008】このような集積化を目指したパターン処理
用1チップ並列処理装置のプロセッサ要素の従来例とし
ては「石川正俊:並列処理を用いた局所的パターン処理
用LSIとその触覚センサへの応用」(計測自動制御学
会論文集,Vol.24,No. 3, pp. 228-235(1988))があ
る。図4に、この従来例にあるパターン処理用LSIの
プロセッサ要素の構成を表した概略図を示す。この従来
例のプロセッサ要素では、レジスタとして3つの8bit
シフトレジスタ41を用い、各シフトレジスタ41はマ
ルチプレクサ43を通じて演算器42と接続する構成に
している。さらに、この8bit シフトレジスタ41は上
位4bit と下位4bit とを1ステップで交換する機能を
備えている。
As a conventional example of a processor element of a one-chip parallel processing device for pattern processing aiming at such integration, “Masatoshi Ishikawa: Local pattern processing LSI using parallel processing and its application to a tactile sensor” (Proceedings of the Society of Instrument and Control Engineers, Vol. 24, No. 3, pp. 228-235 (1988)). FIG. 4 is a schematic diagram showing the configuration of the processor element of the pattern processing LSI according to this conventional example. In this conventional processor element, three 8-bit registers are used.
The shift register 41 is used, and each shift register 41 is connected to the arithmetic unit 42 through a multiplexer 43. Further, the 8-bit shift register 41 has a function of exchanging upper 4 bits and lower 4 bits in one step.

【0009】[0009]

【発明が解決しようとする課題】前記従来例では、8bi
tよりも桁数の少ないデータの演算を行なう場合、デー
タを演算器42の入力端子まで移動しなければなかっ
た。そこで、このデータの移動を行なう機構として、レ
ジスタ41のシフト機構と、上位4bit と下位4bit と
を交換する機構が用意されていたが、これらの動作は、
データを単に移動するだけであり、演算とは関係のない
ステップである。
In the above-mentioned conventional example, 8bi is used.
When performing calculation of data having a number of digits smaller than t, the data had to be moved to the input terminal of the calculator 42. Therefore, as a mechanism for moving this data, a shift mechanism for the register 41 and a mechanism for exchanging the upper 4 bits and the lower 4 bits were prepared.
It is a step that simply moves data and has nothing to do with arithmetic.

【0010】また、少ないレジスタを有効に使用するた
めに、例えば8bit シフトレジスタ41に2個の4bit
データを格納するような場合には、上位4bit 側にある
データの演算を行なうのに下位4bit 側のデータを一時
的に退避する必要があり、やはり、演算とは無関係の動
作を伴う。すなわち、レジスタの bit幅(前記従来例で
は8bit )よりも小さなbit 幅のデータを扱う場合に
は、必ずこれらの無駄な動作が必要となり、その結果と
して、プログラムのステップ数が増大し、プロセッサの
処理速度が低下することになる。
In order to effectively use a small number of registers, for example, two 4-bit shift registers 41 are provided in the 4-bit shift register 41.
In the case of storing data, it is necessary to temporarily save the data in the lower 4 bits in order to perform the operation on the data in the upper 4 bits, which also involves an operation unrelated to the operation. That is, when dealing with data having a bit width smaller than the bit width of a register (8 bits in the above-mentioned conventional example), these unnecessary operations must be performed, resulting in an increase in the number of program steps and The processing speed will decrease.

【0011】前記従来例に述べたレジスタの上位4bit
と下位4bit とを1ステップで交換する機能により、シ
フトレジスタだけを使った場合に比べて、この処理速度
の低下はある程度改善されてはいるが、交換単位が4bi
t に固定であるため、桁数が4bit でないデータに対し
てはほとんど効果がない。
Upper 4 bits of the register described in the conventional example
By the function of exchanging the lower 4bits with the lower 4bits in one step, the reduction of the processing speed is improved to some extent as compared with the case of using only the shift register, but the exchange unit is 4bi.
Since it is fixed at t, it has almost no effect on data whose number of digits is not 4 bits.

【0012】本発明の対象とするパターン処理用1チッ
プ並列処理装置では、パターンデータとして2値化され
たデータを扱うことが多く、したがって、演算結果も4
bit以下になることが多い。
In the 1-chip parallel processing device for pattern processing which is the object of the present invention, binarized data is often handled as the pattern data, and therefore the operation result is 4
It is often less than a bit.

【0013】よって、本発明は、レジスタ構成として、
4bit 以下のデータを効率良く扱うことのできる構成を
とることによって、上述のような問題点を取り除くこと
を目的とする。
Therefore, according to the present invention, as a register configuration,
The purpose is to eliminate the above-mentioned problems by adopting a structure that can efficiently handle data of 4 bits or less.

【0014】[0014]

【課題を解決するための手段】上記目的を達成するため
に、本発明のプロセッサ要素は1bit のレジスタを複数
並べるレジスタ構成を取ったものである。すなわち、本
発明のプロセッサ要素は、パターン情報をセンシングす
る複数のセンサとこれらのセンサの出力信号を処理する
複数のプロセッサ要素とを1つの集積回路上に集積化し
たパターン処理用1チップ並列処理装置のプロセッサ要
素であって、ビットシリアル演算方式の演算器と、上記
演算器に並列に接続された複数の1bitレジスタとから構
成されている。
To achieve the above object, the processor element of the present invention has a register configuration in which a plurality of 1-bit registers are arranged. That is, the processor element of the present invention is a one-chip parallel processing device for pattern processing in which a plurality of sensors for sensing pattern information and a plurality of processor elements for processing output signals of these sensors are integrated on one integrated circuit. The processor element is composed of a bit-serial arithmetic operation unit and a plurality of 1-bit registers connected in parallel to the operation unit.

【0015】[0015]

【作用】本発明のパターン処理用1チップ並列処理装置
のプロセッサ要素では、演算器による演算にはビットシ
リアル演算を採用するので、演算器は1bit 分の演算回
路しか持たなくて良い。レジスタは1bit レジスタで、
これを必要な個数だけ並列に配置する。1bit レジスタ
の個数は、当パターン処理用1チップ並列処理装置上で
実現しようとするアルゴリズムからの要請とLSIのゲ
ート数の制約から決定される。各レジスタは、演算器の
入力端子へつながれたレジスタの読み出し用信号線と、
演算器の出力端子からの書き込み用信号線に接続され
る。そして各レジスタに各々固有のアドレスを割り振る
ことにより、データを読み出すレジスタと、演算結果を
書き込むレジスタを各々独立に選択することができる。
本プロセッサ要素はセンサ信号を処理することを目的と
しているので、各プロセッサ要素はセンサの出力信号を
直接取り込むことが可能になっている。また、並列処理
装置を構成するために、各プロセッサ要素は、近傍のプ
ロセッサ要素と通信するための機構を備えている。
In the processor element of the one-chip parallel processing device for pattern processing of the present invention, since the arithmetic unit uses bit serial arithmetic, the arithmetic unit only needs to have an arithmetic circuit for 1 bit. The register is a 1-bit register,
Arrange the required number in parallel. The number of 1-bit registers is determined based on a request from an algorithm to be realized on the one-chip parallel processing device for pattern processing and a constraint on the number of gates of the LSI. Each register is a signal line for reading the register connected to the input terminal of the arithmetic unit,
It is connected to the write signal line from the output terminal of the arithmetic unit. By assigning a unique address to each register, a register for reading data and a register for writing a calculation result can be independently selected.
Since this processor element is intended to process the sensor signal, each processor element can directly capture the output signal of the sensor. Further, in order to configure the parallel processing device, each processor element has a mechanism for communicating with a neighboring processor element.

【0016】本発明のプロセッサ要素では、1bit レジ
スタを用いた結果、1bit 分の演算は1命令で実行可能
である。例えば、データAとデータBに何らかの演算を
施して結果Cを得ようとする場合には、演算の種類、デ
ータA及びBが格納されているレジスタのアドレス、結
果を書き込むレジスタのアドレスを指定することで、レ
ジスタからデータが読み出され、演算結果がレジスタに
格納される。
In the processor element of the present invention, as a result of using the 1-bit register, 1-bit operation can be executed by one instruction. For example, when an operation is performed on the data A and the data B to obtain the result C, the type of operation, the address of the register in which the data A and B are stored, and the address of the register in which the result is written are specified. As a result, the data is read from the register and the calculation result is stored in the register.

【0017】[0017]

【実施例】以下、本発明の実施例を図面に基づき説明す
る。図1は、本発明のプロセッサ要素を対象物の特徴量
を検出するLSI型視覚センサに応用した実施例を表し
たもので、1チップの集積回路上に集積化された格子状
に結合された光センサアレイとプロセッサアレイを示し
ている。アレイの大きさは、LSIに集積可能なトラン
ジスタの数とプロセッサ要素11のトランジスタの数、
光センサ12に必要な面積によって決まるが、ここでは
64×64程度のものを想定している。本実施例では、
画像パターン情報をセンシングする光センサ12とし
て、光が当たると1を出力するものを想定しているの
で、取り込まれる画像は2値画像である。
Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 shows an embodiment in which the processor element of the present invention is applied to an LSI type visual sensor for detecting a feature amount of an object, and the processor elements are combined in a lattice form integrated on a one-chip integrated circuit. The photosensor array and the processor array are shown. The size of the array depends on the number of transistors that can be integrated in the LSI and the number of transistors of the processor element 11,
It depends on the area required for the optical sensor 12, but here, it is assumed that it is about 64 × 64. In this embodiment,
Since it is assumed that the optical sensor 12 that senses image pattern information outputs 1 when the light hits, the captured image is a binary image.

【0018】各プロセッサ要素11は各光センサ12と
一対一に結合しており、センサの出力信号を直接取り込
むことが可能となっている。なお、少数のグループ化さ
れた複数の光センサに1つのプロセッサ要素を結合する
ように構成しても良い。
Each processor element 11 is connected to each optical sensor 12 in a one-to-one correspondence, and can directly capture the output signal of the sensor. It should be noted that one processor element may be coupled to a plurality of photosensors grouped into a small number.

【0019】また、各プロセッサ要素11は4近傍のプ
ロセッサ要素11と直接にデータ通信することが可能
で、光センサアレイよって得られる2値画像データに対
して、各画素毎の近傍演算を並列に実行する。したがっ
て、輪郭線抽出、細線化、パターンマッチングといった
パターン処理を超高速に実行することが可能である。
Further, each processor element 11 can directly perform data communication with the processor elements 11 in four neighborhoods, and the neighborhood calculation for each pixel is performed in parallel with the binary image data obtained by the photosensor array. Run. Therefore, it is possible to perform pattern processing such as contour line extraction, thinning, and pattern matching at an extremely high speed.

【0020】本実施例では、簡単のためにプロセッサ要
素11の結合網を4近傍接続の格子状としたが、他に
も、8近傍接続や六角形型や三角形型の結合網も考えら
れる。また、用途によっては、プロセッサ要素を1直線
に結合することも考えられる。
In the present embodiment, the connection network of the processor elements 11 is in the form of a 4-neighbor connection grid for simplification, but other than this, an 8-neighbor connection or a hexagonal or triangular connection network is also conceivable. It is also conceivable to combine the processor elements in a straight line, depending on the application.

【0021】図2は、10個の1bit レジスタ21とビ
ットシリアル演算を行なう演算器22とからなるパター
ン処理用並列処理装置のプロセッサ要素11の構成を示
している。
FIG. 2 shows the configuration of the processor element 11 of the parallel processing device for pattern processing, which is composed of ten 1-bit registers 21 and an arithmetic unit 22 for performing a bit serial operation.

【0022】このプロセッサ要素11では、回路規模を
小さくする工夫として、演算器にビットシリアル演算を
採用し、SIMD(Single Instruction Stream Multiple Da
ta Stream)型の並列処理方式を採用した。ビットシリア
ル演算は演算器の回路が1bit 分で済むので、プロセッ
サ要素の回路規模を小さくするのに有効である。また、
SIMD型の並列処理方式は、全てのプロセッサ要素が同一
の命令で動作する方式であるので、プロセッサ要素の制
御が単純であり、回路規模の縮小に有効である。
In this processor element 11, as a device for reducing the circuit scale, bit serial operation is adopted for the operation unit, and SIMD (Single Instruction Stream Multiple Da) is adopted.
ta Stream) type parallel processing method was adopted. The bit serial operation is effective for reducing the circuit scale of the processor element because the circuit of the arithmetic unit needs only 1 bit. Also,
The SIMD type parallel processing method is a method in which all the processor elements operate with the same instruction, so that the control of the processor elements is simple and effective in reducing the circuit scale.

【0023】演算器22の入力端子A、Bにはレジスタ
読み出し用信号線23aおよびレジスタ読み出し用信号
線23bが接続されていて、出力端子Cにはレジスタ書
き込み用信号線25が接続されている。各1bit レジス
タ21はレジスタ読み出し用信号線23aまたはレジス
タ読み出し用信号線23bとレジスタ書き込み用信号線
25との間に並列に接続されている。
The register read signal line 23a and the register read signal line 23b are connected to the input terminals A and B of the arithmetic unit 22, and the register write signal line 25 is connected to the output terminal C. Each 1-bit register 21 is connected in parallel between the register read signal line 23a or the register read signal line 23b and the register write signal line 25.

【0024】演算器22は3種類の論理演算(論理積、
論理和、排他的論理和)と加減算を行なう論理回路で構
成されている。他の論理演算や乗算等は、これらの演算
の組合せで実現できるが、必要ならこれらの演算回路を
備えた演算器を使用することもできる。理想的には、実
行するプログラムにおいて、最も使用頻度の高い演算回
路を演算器22に用意するのが最適である。
The arithmetic unit 22 has three types of logical operations (logical product,
It is composed of a logical circuit that performs addition and subtraction. Other logical operations, multiplications, etc. can be realized by a combination of these operations, but an arithmetic unit equipped with these arithmetic circuits can be used if necessary. Ideally, in the program to be executed, it is optimal to prepare the arithmetic circuit that is used most frequently in the arithmetic unit 22.

【0025】レジスタ21は、撮像した画像、演算結
果、演算の係数、演算の途中結果といったデータの保持
に使用され、1つのレジスタはデータの1bit 分のみを
保持することができる。光センサ12から得られる画像
データは1bit であるが、演算処理が進むにつれて必然
的にデータのbit 幅は増えてくるので、そのような多bi
t データを保持する場合には、例えば、4bit のデータ
の保持には4つのレジスタを使用することになる。これ
らのレジスタ21には固有のアドレスが割り振られると
共に、各レジスタ21には後述する読み出し用ゲート2
1bと書き込み用のゲート21cが設けられ、これらの
ゲートの開閉を選択することで、データを読み書きする
レジスタ21aを選択することができる。したがって、
前記図4に示した従来例が備えていたマルチプレクサは
存在しない。
The register 21 is used to hold data such as a picked-up image, a calculation result, a calculation coefficient, and an intermediate calculation result, and one register can hold only 1-bit data. The image data obtained from the optical sensor 12 is 1 bit, but the bit width of the data inevitably increases as the calculation process progresses.
When holding t data, for example, four registers are used to hold 4-bit data. A unique address is assigned to each of these registers 21, and each register 21 has a read gate 2 to be described later.
1b and a writing gate 21c are provided. By selecting opening / closing of these gates, the register 21a for reading / writing data can be selected. Therefore,
There is no multiplexer provided in the conventional example shown in FIG.

【0026】図2では1bit レジスタ21の数を10個
としたが、実際には、この数はプロセッサ要素11で実
行させようとする応用プログラムからの要請と回路規模
からの制約により決まるものである。例えば、4近傍の
画像データとの積和演算を行なう場合には、各画素に対
する重みの係数を4bit とすると、画素データが1bit
、近傍の画素データとの乗算結果が4bit 、これを4
回加算した結果が7bitとなり、最低でも12bit 分の
レジスタが必要になる。ただし、ここでは同時に使用す
るレジスタ数を最小にするために、各近傍との乗算の直
後に加算を行なうものとしている。そのようにすれば、
全部で4つある乗算結果を保存しなくて済むからであ
る。本実施例では、積和演算の重みの係数を3bit と想
定しており、この場合には、レジスタ数は10個で十分
である。
Although the number of 1-bit registers 21 is 10 in FIG. 2, this number is actually determined by a request from the application program to be executed by the processor element 11 and a constraint from the circuit scale. . For example, when performing a product-sum operation with image data of 4 neighborhoods, if the weighting coefficient for each pixel is 4 bits, the pixel data will be 1 bit.
, The result of multiplication with neighboring pixel data is 4bit.
The result of round addition is 7 bits, and at least 12 bits of registers are required. However, here, in order to minimize the number of registers used at the same time, the addition is performed immediately after the multiplication with each neighborhood. That way,
This is because it is not necessary to store the four multiplication results in total. In this embodiment, it is assumed that the weight coefficient of the product-sum calculation is 3 bits, and in this case, 10 registers are sufficient.

【0027】一方、一般の画像処理装置で用いられる3
×3フィルタでは、8近傍の画素データとの積和演算が
必要であるが、この場合には、重みの係数を4bit とす
ると、乗算結果が4bit 、これを8回加算した結果は9
bit となり、14bit が演算に必要となる。さらに、結
果の精度を上げるためには、重みの係数のbit 幅を増や
すことが必要であり、例えば、係数を8bit にすると、
22bit 分のレジスタが必要となる。
On the other hand, 3 used in a general image processing apparatus
The × 3 filter needs a product-sum operation with pixel data in 8 neighborhoods. In this case, if the weight coefficient is 4 bits, the multiplication result is 4 bits, and the result of adding 8 times is 9
14 bits are required for calculation. Furthermore, in order to improve the accuracy of the result, it is necessary to increase the bit width of the weight coefficient. For example, if the coefficient is set to 8 bits,
A 22-bit register is required.

【0028】また、近傍の数をさらに増やせば、それだ
け、実現できるフィルタの種類が増えるが、必要になる
レジスタ数も増えることになる。このように、1プロセ
ッサ要素当たりのレジスタ数を増やせば、本実施例の視
覚センサの応用範囲も広がると考えられるが、それだ
け、プロセッサ要素の回路規模が大きくなるため、集積
化が困難になる。他の画像パターン処理の例としては、
2枚の画像間の差分による移動物体の検出、対象物の輪
郭線の抽出、論理演算を用いた細線化などが挙げられ
る。これらの処理は論理演算が中心なので、積和演算ほ
ど多くのレジスタを必要とせず、本実施例のプロセッサ
要素でも実行可能である。
Further, if the number of neighbors is further increased, the number of types of filters that can be realized increases, but the number of registers required also increases. As described above, if the number of registers per processor element is increased, the application range of the visual sensor of the present embodiment is expected to be expanded, but the circuit scale of the processor element is correspondingly increased, which makes integration difficult. As another example of image pattern processing,
Examples include detection of a moving object based on the difference between two images, extraction of a contour line of an object, and thinning using a logical operation. Since these processes mainly involve logical operations, they do not require as many registers as the product-sum operation and can be executed by the processor element of this embodiment.

【0029】また、図2では、1bit レジスタ21と演
算器22とを上述のように接続したが、このままでは、
同じレジスタ読み出し信号線につながったレジスタ同士
では演算ができないので、前記従来例のようにレジスタ
を3つのグループに分けて、マルチプレクサを通じて演
算器22とつなぐことも考えられる。この他にも、全1
bit レジスタまたは一部の1bit レジスタを適当なセレ
クタを通して、演算器22の両方の入力端子に接続する
など、様々な接続方法が考えられる。ただし、マルチプ
レクサを使用すれば、それだけプロセッサ要素の回路規
模が大きくなる。
Further, in FIG. 2, the 1-bit register 21 and the arithmetic unit 22 are connected as described above.
Since calculation cannot be performed between the registers connected to the same register read signal line, it is conceivable to divide the registers into three groups and connect them to the arithmetic unit 22 through a multiplexer as in the conventional example. Besides this, all 1
Various connection methods are conceivable, such as connecting a bit register or a part of 1-bit registers to both input terminals of the arithmetic unit 22 through an appropriate selector. However, if the multiplexer is used, the circuit scale of the processor element is increased accordingly.

【0030】プロセッサ要素11に対する命令は、プロ
セッサ要素11外の図示しない制御回路からマイクロ命
令で与えられる。プロセッサ要素11内の各ゲート21
b、21cには、マイクロ命令の送られてくる制御線が
接続されている。また、演算に使用される定数も、マイ
クロ命令の一部として、直接、レジスタ読み出し用信号
線23aおよびレジスタ読み出し用信号線23bに送ら
れる。
The instruction to the processor element 11 is given as a micro instruction from a control circuit (not shown) outside the processor element 11. Each gate 21 in the processor element 11
A control line to which a micro command is sent is connected to b and 21c. Further, the constant used for the calculation is also directly sent to the register read signal line 23a and the register read signal line 23b as a part of the micro instruction.

【0031】図3は図2にある1bit レジスタ21の詳
細を示すもので、レジスタ読み出し用信号線23とレジ
スタ書き込み用信号線25に読み出し用ゲート21b及
び書き込み用ゲート21cを介して接続された1bit レ
ジスタ21aを示している。読み出し用ゲート21bと
書き込み用ゲート21cには、各々の開閉を制御するた
めに、読み出し用ゲート制御線36、書き込み用ゲート
制御線37が接続されている。
FIG. 3 shows the details of the 1-bit register 21 shown in FIG. 2. The 1-bit connected to the register read signal line 23 and the register write signal line 25 via the read gate 21b and the write gate 21c. The register 21a is shown. A read gate control line 36 and a write gate control line 37 are connected to the read gate 21b and the write gate 21c in order to control the opening and closing of each.

【0032】通常は、全レジスタの読み出し用ゲート2
1bと書き込み用ゲート21cは閉じられている。1bi
t レジスタ21aのデータの読み出しは、読み出し用ゲ
ート制御線36によって読み出し用ゲート21bを開く
ことによって行なわれる。
Normally, the read gate 2 of all registers
1b and the writing gate 21c are closed. 1bi
The data read from the t register 21a is performed by opening the read gate 21b by the read gate control line 36.

【0033】同様に、1bit レジスタ21aへのデータ
の書き込みは、書き込み用ゲート制御線37によって書
き込み用ゲート21cを開き、1bit レジスタ21aと
レジスタ書き込み用信号線25を接続することによって
行なわれる。
Similarly, writing of data to the 1-bit register 21a is performed by opening the writing gate 21c by the writing gate control line 37 and connecting the 1-bit register 21a and the register writing signal line 25.

【0034】[0034]

【発明の効果】本発明では、演算器としてビットシリア
ル演算方式の演算器を用いているので、演算器の回路が
1bit 分で済み、従ってプロセッサ要素の回路規模を小
さくするのに有効である。
According to the present invention, since the arithmetic unit of the bit serial arithmetic system is used as the arithmetic unit, the circuit of the arithmetic unit only needs to be 1 bit, which is effective for reducing the circuit scale of the processor element.

【0035】また、本発明では、小さいbit 幅のデータ
を中心に扱うことが多いパターン処理用1チップ並列処
理装置のプロセッサ要素において、1bit レジスタを演
算器に並列に接続することで任意のレジスタに対する読
み書きを1ステップで済むようにしているので、データ
の無駄な移動をなくすことができる。前記従来例のプロ
セッサ要素では、レジスタが8bit シフトレジスタであ
ったため、2値画像のような主に小さいbit 幅のデータ
を処理する場合には、演算の途中結果がレジスタに入っ
てから演算器に到達するまでに、5ステップ(シフト動
作が4ステップとレジスタの上位4bit 下位4bit の交
換動作が1ステップ)が必要であったのに対して、本発
明のプロセッサ要素ではレジスタが1bit なので、同じ
演算を1ステップで実行可能である。したがって、シフ
トレジスタを用いたプロセッサ要素に比べて、プログラ
ムのステップ数が減る分、大幅に実行速度が向上する。
Further, according to the present invention, in the processor element of the one-chip parallel processing device for pattern processing, which often handles mainly data of a small bit width, by connecting the 1-bit register in parallel to the arithmetic unit, any register can be processed. Since the reading and writing are done in one step, it is possible to eliminate unnecessary movement of data. In the processor element of the conventional example, the register is an 8-bit shift register. Therefore, when mainly processing data with a small bit width such as a binary image, the intermediate result of the operation is stored in the register and then stored in the operator. Before reaching, 5 steps (4 steps for shift operation and 1 step for exchanging upper 4 bits and lower 4 bits of the register) are required, while the processor element of the present invention has 1 bit of register, the same operation is performed. Can be performed in one step. Therefore, as compared with the processor element using the shift register, the number of steps of the program is reduced, so that the execution speed is significantly improved.

【0036】また、シフトレジスタを用いた場合には、
bit幅の小さなデータを各レジスタに配置する際に、デ
ータの有効期間や演算順序を考慮に入れて最適にデータ
配置することが必要であったが、本発明のプロセッサ要
素では、データをどのレジスタに置いても実行速度に影
響を与えることがないので、シフトレジスタを用いるよ
りもデータ配置の自由度が大きいと言える。このこと
は、少ないレジスタを有効に利用することにつながり、
プロセッサ要素の機能の向上を意味する。
When a shift register is used,
When allocating data with a small bit width to each register, it was necessary to optimally allocate the data in consideration of the valid period of data and the operation sequence. Since it does not affect the execution speed even if it is placed at, it can be said that the degree of freedom of data placement is greater than when using a shift register. This leads to the effective use of a small number of registers,
It means the improvement of the function of the processor element.

【図面の簡単な説明】[Brief description of drawings]

【図1】パターン処理用1チップ並列処理装置のプロセ
ッサ要素の構成を示す図である。
FIG. 1 is a diagram showing a configuration of a processor element of a 1-chip parallel processing device for pattern processing.

【図2】プロセッサ要素の構成を示す図である。FIG. 2 is a diagram showing a configuration of a processor element.

【図3】1bit レジスタの構成例を示した図である。FIG. 3 is a diagram showing a configuration example of a 1-bit register.

【図4】従来例の概略図である。FIG. 4 is a schematic view of a conventional example.

【符号の説明】[Explanation of symbols]

11 プロセッサ要素 12 光センサ 21 1bit レジスタ 21a 1bit レジスタ 21b 読み出し用ゲート 21c 書き込み用ゲート 22 演算器 23a、23b レジスタ読み出し用信号線 25 レジスタ書き込み用信号線 36 読み出し用ゲート制御線 37 書き込み用ゲート制御線 41 8bit シフトレジスタ 42 演算器 43 マルチプレクサ 11 processor element 12 optical sensor 21 1bit register 21a 1bit register 21b read gate 21c write gate 22 arithmetic unit 23a, 23b register read signal line 25 register write signal line 36 read gate control line 37 write gate control line 41 8bit shift register 42 arithmetic unit 43 multiplexer

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】 パターン情報をセンシングする複数のセ
ンサとこれらのセンサの出力信号を処理する複数のプロ
セッサ要素とを1つの集積回路上に集積化したパターン
処理用1チップ並列処理装置のプロセッサ要素であっ
て、ビットシリアル演算方式の演算器と、上記演算器に
並列に接続された複数の1bitレジスタとから構成されて
いることを特徴とするパターン処理用1チップ並列処理
装置のプロセッサ要素。
1. A processor element of a one-chip parallel processing device for pattern processing, wherein a plurality of sensors for sensing pattern information and a plurality of processor elements for processing output signals of these sensors are integrated on one integrated circuit. A processor element of a one-chip parallel processing device for pattern processing, comprising a bit-serial operation type arithmetic unit and a plurality of 1-bit registers connected in parallel to the arithmetic unit.
【請求項2】 パターン情報をセンシングする複数のセ
ンサと、これらセンサの出力を処理する、各一画素に又
は少数の画素からなる画素群と一対一に結合した複数の
プロセッサ要素とを、1つの集積回路上に集積化したパ
ターン処理用1チップ並列処理装置の、レジスタと演算
器よりなるプロセッサ要素であって、演算器が、ビット
シリアル演算方式の演算器であり、レジスタが、1bitレ
ジスタを複数個並列に演算器に接続したものであること
を特徴とするパターン処理用1チップ並列処理装置のプ
ロセッサ要素。
2. A plurality of sensors for sensing pattern information, and a plurality of processor elements for processing the outputs of these sensors, which are connected to each pixel or to a pixel group consisting of a small number of pixels in a one-to-one correspondence. A processor element of a 1-chip parallel processing device for pattern processing integrated on an integrated circuit, comprising a register and a computing unit, wherein the computing unit is a computing unit of a bit serial computing system, and the register includes a plurality of 1-bit registers. A processor element of a one-chip parallel processing device for pattern processing, which is connected in parallel to arithmetic units.
JP22228693A 1993-08-13 1993-08-13 Processor element of one-chip parallel processor for pattern processing Withdrawn JPH0757075A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP22228693A JPH0757075A (en) 1993-08-13 1993-08-13 Processor element of one-chip parallel processor for pattern processing

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP22228693A JPH0757075A (en) 1993-08-13 1993-08-13 Processor element of one-chip parallel processor for pattern processing

Publications (1)

Publication Number Publication Date
JPH0757075A true JPH0757075A (en) 1995-03-03

Family

ID=16779995

Family Applications (1)

Application Number Title Priority Date Filing Date
JP22228693A Withdrawn JPH0757075A (en) 1993-08-13 1993-08-13 Processor element of one-chip parallel processor for pattern processing

Country Status (1)

Country Link
JP (1) JPH0757075A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001195564A (en) * 2000-01-14 2001-07-19 Masatoshi Ishikawa Image detection and processing apparatus
JP2010136413A (en) * 1998-10-07 2010-06-17 Hamamatsu Photonics Kk High-speed vision sensor

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010136413A (en) * 1998-10-07 2010-06-17 Hamamatsu Photonics Kk High-speed vision sensor
JP2001195564A (en) * 2000-01-14 2001-07-19 Masatoshi Ishikawa Image detection and processing apparatus
JP4523104B2 (en) * 2000-01-14 2010-08-11 正俊 石川 Image detection processing device

Similar Documents

Publication Publication Date Title
US6573936B2 (en) Method and apparatus for providing a single-instruction multiple data digital camera system that integrates on-chip sensing and parallel processing
US4622632A (en) Data processing system having a pyramidal array of processors
US8244788B2 (en) Semiconductor integrated circuit device having a plurality of photo detectors and processing elements
US4697247A (en) Method of performing matrix by matrix multiplication
US20050160406A1 (en) Programmable digital image processor
AU747283B2 (en) Data processing system for logically adjacent data samples such as image data in a machine vision system
EP0539595A1 (en) Data processor and data processing method
US6421772B1 (en) Parallel computer with improved access to adjacent processor and memory elements
JPS6247786A (en) Exclusive memory for adjacent image processing
US7596679B2 (en) Interconnections in SIMD processor architectures
JPS6116369A (en) Picture processor
JP3932379B2 (en) Image processing apparatus and image sensor
WO1999063751A1 (en) Low-power parallel processor and imager integrated circuit
US6542429B2 (en) Method of controlling line memory
US6809422B2 (en) One-chip image processing apparatus
JPH0757075A (en) Processor element of one-chip parallel processor for pattern processing
EP0610688A2 (en) Image processor
JPH0785260A (en) Two-dimensional sensor device
JP2862387B2 (en) Filtering method for ultra-high-speed image processing system
JPH06195480A (en) Parallel processor
JP3917489B2 (en) Image rotation apparatus and image rotation method
JPH0728988A (en) Two-dimensional sensor system
JPH07177435A (en) High-speed visual sensor
WO2020046647A2 (en) Vectorized peak detection for signal processing
JPH0312752A (en) Picture data access system

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20001031