JP2003218338A - 半導体集積回路装置 - Google Patents

半導体集積回路装置

Info

Publication number
JP2003218338A
JP2003218338A JP2002017665A JP2002017665A JP2003218338A JP 2003218338 A JP2003218338 A JP 2003218338A JP 2002017665 A JP2002017665 A JP 2002017665A JP 2002017665 A JP2002017665 A JP 2002017665A JP 2003218338 A JP2003218338 A JP 2003218338A
Authority
JP
Japan
Prior art keywords
integrated circuit
semiconductor integrated
circuit device
processing
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002017665A
Other languages
English (en)
Other versions
JP3902741B2 (ja
Inventor
Masatoshi Ishikawa
正俊 石川
Idaku Ishii
抱 石井
Takashi Komuro
孝 小室
Shingo Kagami
慎吾 鏡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Semiconductor Technology Academic Research Center
Original Assignee
Semiconductor Technology Academic Research Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Semiconductor Technology Academic Research Center filed Critical Semiconductor Technology Academic Research Center
Priority to JP2002017665A priority Critical patent/JP3902741B2/ja
Priority to US10/200,332 priority patent/US7098437B2/en
Publication of JP2003218338A publication Critical patent/JP2003218338A/ja
Priority to US11/289,695 priority patent/US8244788B2/en
Priority to US11/289,696 priority patent/US7244919B2/en
Application granted granted Critical
Publication of JP3902741B2 publication Critical patent/JP3902741B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01JMEASUREMENT OF INTENSITY, VELOCITY, SPECTRAL CONTENT, POLARISATION, PHASE OR PULSE CHARACTERISTICS OF INFRARED, VISIBLE OR ULTRAVIOLET LIGHT; COLORIMETRY; RADIATION PYROMETRY
    • G01J1/00Photometry, e.g. photographic exposure meter
    • G01J1/42Photometry, e.g. photographic exposure meter using electric radiation detectors
    • G01J1/4228Photometry, e.g. photographic exposure meter using electric radiation detectors arrangements with two or more detectors, e.g. for sensitivity compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N25/00Circuitry of solid-state image sensors [SSIS]; Control thereof
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01JMEASUREMENT OF INTENSITY, VELOCITY, SPECTRAL CONTENT, POLARISATION, PHASE OR PULSE CHARACTERISTICS OF INFRARED, VISIBLE OR ULTRAVIOLET LIGHT; COLORIMETRY; RADIATION PYROMETRY
    • G01J1/00Photometry, e.g. photographic exposure meter
    • G01J1/02Details
    • G01J1/0204Compact construction

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)
  • Solid State Image Pick-Up Elements (AREA)

Abstract

(57)【要約】 【課題】 従来のビジョンチップや画像処理用SIMD
プロセッサ等においては、PEの性能と画素数の間にト
レードオフの関係が存在し、より汎用性の高い半導体集
積回路装置の提供を困難にさせている。 【解決手段】 1つの半導体チップに設けられた複数の
プロセッシングエレメント2を有する半導体集積回路装
置であって、前記各プロセッシングエレメントの出力に
設けられたラッチ手段23と、入力元を上下左右のいず
れかのプロセッシングエレメントまたは零信号から選択
して出力する選択手段27とを備えるように構成する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は半導体集積回路装置
に関し、特に、複数の光検出器(PD:Photo Detecto
r)およびプロセッシングエレメント(PE: Processi
ng Element(演算処理回路))を備えたビジョンチップ
に関する。
【0002】画像処理を専門に行う画像処理プロセッサ
は、従来より研究、開発および提案がなされており、そ
の多くはなんらかの並列演算を行う機構を備えている。
例えば、並列度が数万にのぼる超並列プロセッサでは、
少数または1つの画素毎にPE(プロセッシングエレメ
ント)を割り当て、それら複数のPEに対して同時に同
一の命令を実行させるというSIMD(Single Instruc
tion Stream Multi Data Stream)型の制御を行うこと
で、ある種の画像処理を効率よく実行できる。
【0003】このような画像処理プロセッサは、かつて
はスーパーコンピュータクラスの大規模なものがほとん
どであったが、近年、半導体集積化技術の進歩に伴っ
て、さらに、画像処理を手軽に扱いたいというニーズの
高まりから、これを1チップ化する動きが進んでいる。
さらに、プロセッサだけでなく、PD(光検出器;光検
出回路,光検出素子)までも1チップに収めたビジョン
チップと呼ばれるデバイスの研究も注目を集めている。
【0004】このような従来のビジョンチップや画像処
理用SIMDプロセッサ(半導体集積回路装置)におい
ては、PEの性能と画素数の間にトレードオフの関係が
存在し、より汎用性の高い半導体集積回路装置の提供を
困難にさせている。また、グローバル演算に不向きな構
造であったため、2次元パターンからスカラー量を抽出
する処理を効率よく行うことができなかった。
【0005】すなわち、従来、ビジョンチップのPEに
採用されていたALUは、単に各PE内のデータのみに
基づいて演算を行うものか、或いは、隣接PEからの出
力が直接ALUの入力とするものであるため、実現でき
る演算機能が自身とその周囲のPEから演算を行うロー
カルな演算に限られている。ビジョンチップの均質な配
列構造を崩さずにグローバル演算を行うには、例えば、
新たに加算器等の付加回路が必要となって回路規模が大
きくなってしまう。これは、限られたチップ面積上にな
るべく多くの画素を配置するビジョンチップに対する回
路規模をできるだけ小さくするという要求に相反する。
【0006】また、従来のビジョンチップでは、各PE
の演算能力や搭載されているメモリの量が有限であるこ
とが、実現できる処理の範囲を制限することになってい
る。そして、ビジョンチップの汎用性を増すために、演
算能力や搭載するメモリの容量を増やすと、今度は回路
面積が肥大化してしまうというジレンマがある。
【0007】そこで、画素数(搭載可能なPEの数)の
低下を来すことなく、高い汎用性を有する半導体集積回
路装置の提供が要望されている。
【0008】
【従来の技術】従来、画素毎にコンパクトなPEを備え
た半導体集積回路装置(ビジョンチップ)の設計におい
ては、PEの性能と画素数のトレードオフポイントが固
定であったため、想定されるあらゆる用途に対応できる
ように設計を行うと、通常の用途に対しては冗長になっ
てしまった。また、従来の半導体集積回路装置はグロー
バル演算に不向きな構造であるため、画像処理のリアル
タイム応用に必須の2次元パターンからスカラー量を抽
出する処理を効率よく行うことができなかった。
【0009】図1はビジョンチップを概念的に示す図で
あり、図2は従来のビジョンチップのアーキテクチャを
説明するための図である。
【0010】図1に示されるように、ビジョンチップ1
は、光学系(例えば、レンズ)を介して与えられた画像
(入力画像)をマトリクス状に配置された複数のユニッ
ト(画素)100で検出および処理して出力する。
【0011】図2に示されるように、ビジョンチップ1
は、マトリクス状に配置された複数のユニット100、
デコーダ11、出力回路12、および、通信手段13を
備えた1つの半導体チップとして構成される。デコーダ
11には、命令INSTおよびクロックCLK等が入力
され、通信手段13を介してデコードされた信号を各ユ
ニット100に供給し、また、出力回路12は、通信手
段13を介して供給される各ユニット100で検出およ
び処理された信号を外部に出力する。
【0012】各ユニット100は、光検出器(PD:光
検出回路,光検出素子)101およびプロセッシングエ
レメント(PE)102を備える。図2に示すビジョン
チップ1(PE102)は、アーキテクチャS3PE(S
imple and Smart Sensory Processing Element)に従っ
たもので、センサ(PD101)とプロセッサ(PE1
02)の一体化により、それらの間の通信ボトルネック
を解消し、1秒間に1000枚を超える高フレームレー
トを実現するものである。このような高いフレームレー
トを有するビジョンチップは、視覚情報を用いたフィー
ドバック制御を容易に実現し、また、ロボットビジョン
等の分野で画像処理のリアルタイム応用を促進するもの
として期待されている。ここで、ビジョンチップのアー
キテクチャS3PEを概説する。
【0013】図2において、参照符号121はローカル
メモリ、122はI/Oポート、123〜125はデー
タラッチ(Dラッチ)、そして、126はALU(Arit
hmetic and Logic Unit)を示している。
【0014】図2に示されるように、ビジョンチップ1
は、PE(プロセッシングエレメント)102が画素数
分マトリクス状に配列され、各PE102にはPD(光
検出器)101が取り付けられている。PE102は、
主としてALU126およびローカルメモリ121を備
える。ALU126は、全加算器、キャリー格納用レジ
スタ、および、いくつかのマルチプレクサを備える簡単
な構成とされ、論理演算と算術演算を共通の回路で実行
する。なお、演算はビット単位で行われ、多ビットデー
タの演算は繰り返し処理によりビットシリアルに実行す
る。
【0015】ローカルメモリ121は、24ビットのラ
ンダムアクセスメモリ(RAM)に加え、8ビットのI
/Oポート(8ビットの Memory-mapped Input/Output
ポート)122が同一のアドレス空間に割り当てられて
いる。これらは、ビット単位でランダムにアクセスする
ことが可能となっている。I/Oポート122は、上下
左右の4近傍との通信、PD101からの入力、およ
び,零信号(”0”)と接続されている。このメモリマ
ップI/O方式(122)の採用により、演算だけでな
く入出力を含めた全ての処理をローカルメモリ121ヘ
のアクセスで行うようになっている。
【0016】PD101からの光強度信号のA/D(An
alog to Digital)変換は、光電流による蓄積電荷の放
電をしきい値回路(インバータ)で検出し、そのしきい
値を切るまでの時間を計測して行っている。その際、P
E102をカウンタとして用いることにより、回路を増
やすことなくA/D変換を実現している。
【0017】上記のS3PEでは、SIMD型の制御方
式を用いており、全ての画素(PE102)に対し、同
時に同一の命令が実行されるため、画像の局所性を利用
したアルゴリズム、すなわち、画素自身とその周辺の画
素から値が決定されるようなアルゴリズムが極めて効率
的に実行できる。例えば、初期視覚処理と呼ばれるもの
のほとんどはこのようなアルゴリズムで実現できる。初
期視覚処理は、画像処理のリアルタイム応用において、
特徴抽出・認識を行う前の画像の前処理として用いられ
る。なお、この初期視覚処理アルゴリズムを実装したと
ころ、どれもμsオーダーの演算時間に収めることがで
きた。このことから、ビジョンチップが実現する高いフ
レームレートに見合う演算能力を持っていることがわか
る。
【0018】また、上記のS3PEアーキテクチャに基
づき、0.35μmCMOSプロセスを用いたフルカス
タム設計を行った結果、各PEあたりトランジスタ数で
約400個、面積で105μm×105μmというコン
パクトな回路に収まり、この設計を基に、64×64画
素を1チップ上に集積したビジョンチップを試作したと
ころ、チップ面積は8.7mm×8.7mmとなった。
【0019】なお、従来、上述したS3PEのほかに
も、汎用のPEを利用したビジョンチップがいくつか作
られている。例えば、スウェーデンの Linkoping 大学
では光センサとA/DコンバータおよびPEアレイを1
チップ化したビジョンチップの研究が行なわれ、IVP
社より製品化された。また、その MAPP2200 と呼ばれる
ビジョンチップは、256×256画素のCMOSイメ
ージセンサの列毎にA/Dコンバータと汎用のPEが取
り付けられている。さらに、同研究グループは、画素単
位で並列演算を行うビジョンチップ Near-Sensor Image
Processing(NSIP)の研究も行っており、32×
32画素のチップが開発されている。また、フランスの
Bernard らは Programmable Artificial Retina と呼
ばれる汎用のPEを採用したビジョンチップを設計して
おり、65×76画素(後に、128×128画素)の
チップが開発されている。
【0020】なお、センサとの一体化はなされていない
が、1画素を1つのPEが処理する画素単位のSIMD
プロセッサとして、Gealow らによる Pixel-Parallel I
mageProcessor があり、64×64=4096個のPE
が1チップに収められている。同種のアプローチとし
て、Gayles らによるMGAP−2もあり、49152
個のPEが32チップ構成で実現されている。
【0021】
【発明が解決しようとする課題】上述したように、従
来、様々なビジョンチップが研究、開発および提案され
ているが、従来のビジョンチップの設計においては、な
るべくPE(102)の回路を小さくする必要から、P
Eの性能は用途に対して最低限のものでなくてはならな
かった。ここで、PEの性能とは、主に演算機能とメモ
リ容量を指す。演算機能の充実はアルゴリズムの実行速
度の向上につながり、また、メモリ容量の増加は実行で
きるアルゴリズムの範囲を広げることにつながる。特
に、メモリ容量はビジョンチップを設計する上で重要な
項目であり、ビジョンチップの適用範囲を決めることに
もなる。
【0022】ところで、ビジョンチップ(半導体集積回
路装置)は、実行させたいアルゴリズムの範囲を広げよ
うとすればするほど、すなわち、汎用性を高めようとす
ればするほど、例えば、大容量のメモリが必要となって
各PEの回路面積が増加することになる。この各PEの
回路面積の増加は、そのまま1チップに集積できる画素
数(PEの数)の減少につながる。このように、ビジョ
ンチップにおいて、汎用性と画素数との間にトレードオ
フの関係が存在し、ビジョンチップを設計する上でジレ
ンマとなっている。
【0023】他の問題として、多くのビジョンチップが
採用している2Dメッシュネットワーク構造(通信手段
13:上下左右の四方向とのみ接続するもの)は、グロ
ーバル演算に不向きであるということである。この構造
は、例えば、エッジ検出のように、ある画素の値がその
画素自身とその周辺の画素からのみ決定されるような局
所的な演算に対しては非常に強力であるが、遠く離れた
画素の情報を利用するような演算には、その距離分の通
信時間がかかってしまう。
【0024】これらの問題に対して、上述したS3PE
をはじめとする従来のビジョンチップおよびSIMDプ
ロセッサでは、効果的な解決策を提示できていなかっ
た。また、MGAP−2やいくつかのSIMDプロセッ
サでは、コンディションレジスタを利用したPEの結合
機能を持ち、前者の問題に対処しているが、結合がレジ
スタを介した擬似的なものであるため、結合PE数分の
段数のパイプライン処理が必要となる。これは、段数が
多くなった場合に効率が悪く、好ましくない。さらに、
後者の問題に対する解決とはなっていない。また、NS
IPで採用されているGLUや、高速対象追跡ビジョン
チップで使われているモーメント抽出回路は、後者の問
題を部分的に解決しているが、これらは画像全体に対す
る固定した処理であり、より高度なアルゴリズムを実装
したい場合には柔軟性が不足している。
【0025】すなわち、従来の半導体集積回路装置は、
例えば、ロボットビジョンに必要不可欠な入力画像の特
徴抽出や画像認識といった処理を十分に実現することが
困難である。
【0026】本発明の第1の形態は、上述した従来の半
導体集積回路装置が有する課題に鑑み、画素数の低下を
来すことなく(PEの占有面積の増大を来すことな
く)、高い汎用性を有する半導体集積回路装置の提供を
目的とする。本発明の第2の形態は、光検出器の出力信
号のA/D変換を追加回路なしで行うと共に、柔軟なセ
ンシングを実現することのできる半導体集積回路装置の
提供を目的とする。
【0027】
【課題を解決するための手段】本発明の第1の形態によ
れば、1つの半導体チップに設けられた複数のプロセッ
シングエレメントを有する半導体集積回路装置であっ
て、前記各プロセッシングエレメントの出力に設けられ
たラッチ手段と、入力元を上下左右のいずれかのプロセ
ッシングエレメントまたは零信号から選択して出力する
選択手段とを備えることを特徴とする半導体集積回路装
置が提供される。
【0028】また、本発明の第1の形態によれば、複数
のプロセッシングエレメント、および、該プロセッシン
グエレメントをつなぐ通信手段を有する半導体集積回路
装置であって、第1のプロセッシングエレメントにおけ
る資源を、前記通信手段を介して任意の第2のプロセッ
シングエレメントの資源として使用することを特徴とす
る半導体集積回路装置も提供される。
【0029】本発明の第2の形態によれば、複数の光検
出回路および複数のプロセッシングエレメントを有する
半導体集積回路装置であって、前記各光検出回路は、光
検出素子の出力と基準電圧とを比較する比較手段を備
え、該比較手段の出力が該基準電圧を切るまでの時間を
カウントしてA/D変換処理を行うことを特徴とする半
導体集積回路装置が提供される。
【0030】本発明の第1の形態に係る半導体集積回路
装置は、これまでのアーキテクチャに若干の変更を加え
るだけで、複数のPE(プロセッシングエレメント)を
結合して1つの大きなPEとして扱うことが可能であ
り、これにより、PEの性能と画素数(搭載可能なPE
の数)のトレードオフポイントが可変になり、効率よく
資源を利用することができる。さらに、本発明の第1の
形態に係る半導体集積回路装置によれば、結合されたP
Eの中で総和やブロードキャスト等のグローバル演算を
実行することができ、特徴量フィードバックを実現する
ことが可能になる。
【0031】すなわち、ビジョンチップに用いられるビ
ットシリアルALUに、PE間通信の機能だけでなく、
PE間を回路的に連結する機能を付加することで、累積
演算や多ビット演算を実現する。これにより、画像全体
の総和を計算するようなグローバルな演算を、新たに加
算器等の回路を追加することなく実行することができる
ようになる。さらに、結合の組合せを変えることによ
り、複数のPEを用いて多ビット演算を実行することも
でき、個々のPEの能力を集めてひとつの強力なプロセ
ッサとして利用することも可能になる。
【0032】また、近傍通信の入力元を上下左右のいず
れかのPEまたは零信号からPE毎に選択できるように
することで、複数のPEを縦続接続してブロック化する
ことができる。ブロックの指定には、列バスおよび行バ
スを通じて行なわれるか、或いは、内部データから生成
される。このとき、n個のPEが接続されたブロックに
おいては、n個のALUが結合されnビットALUとし
て振る舞わせることが可能であり、n個のデータの総和
・AND・OR・XORおよびnビットデータ同士の加
減算等を一度に計算することができる。また、メモリ素
子も、例えば、1ビットメモリを24個持つPEをn個
結合することで、nビットが1ワードのメモリが24個
使用可能になる。従って、ブロックのサイズを大きくす
ることで、素子を無駄にすることなく、ブロックの演算
能力を高めることができる。
【0033】本発明の第2の形態に係る半導体集積回路
装置は、光検出素子(光検出器PDの画素値)の出力の
A/D変換を、ソフトウェアを用いて行うことにより、
柔軟で能動的な画像センシングを実現することができ
る。ここで、A/D変換を、ソフトウェアを用いて行う
とは、フォトダイオードに光が照射されて電荷が次第に
抜けるのを比較手段(コンパレータ)で観測し、電圧が
基準電圧(しきい値)を切るまでの時間をプロセッシン
グエレメント(PE)でカウントすることであり、カウ
ントの際の時間の刻み幅をプログラムで可変にすること
により、或いは、基準電圧を可変にすることにより、ア
ナログ量の量子化の区間割り当てを任意に実現する。ま
た、リセットのタイミングをローカルに可変にすること
で、広ダイナミックレンジと高フレームレートを両立し
た撮像が可能になる。
【0034】上記の本発明の特徴的な構成は、ビジョン
チップのみならず、一般のイメージセンサ、或いは、広
く複数のプロセッシングエレメント(演算処理回路)を
有する半導体集積回路装置に対しても適用することがで
き、その性能を大幅に向上することが可能である。
【0035】
【発明の実施の形態】以下、本発明に係る半導体集積回
路装置(ビジョンチップ)の実施例を、添付図面を参照
して詳述する。
【0036】図3は本発明の第1の形態に係るビジョン
チップの一例のアーキテクチャを説明するための図であ
る。図3において、参照符号2はPE(図2におけるプ
ロセッシングエレメント102に対応)、121はロー
カルメモリ、122はI/Oポート、123,124は
データラッチ(Dラッチ)、そして、126はALUを
示している。さらに、参照符号20は3ビットのレジス
タ(状態レジスタ)、21は列バス(COL)、22は
行バス(ROW)、そして、23はDラッチを示してい
る。
【0037】図3に示すPE2(102)は、前述した
図2に示されるように、画素数分マトリクス状に配列さ
れ、それぞれPD(光検出器101)が取り付けられて
ビジョンチップ1を構成する。PE2は、主としてAL
U126およびローカルメモリ121を備える。ALU
126は、マルチプレクサ1261〜1265、全加算
器(FA:Full Adder)1266、および、D型フリッ
プフロップ(キャリー格納用レジスタ)1267を備え
る。ここで、各マルチプレクサ1261〜1265は、
命令(制御信号)S0〜S5で制御することにより指定
され、論理演算と算術演算を同一の回路で実行するよう
になっている。
【0038】図3に示すPE2は、前述した図2に示す
3PE102に対して、座標依存値を送るための列バ
ス21および行バス22の共通バスが設けられている。
また、状態レジスタ20の出力は、マルチプレクサ27
に供給され、近傍通信の入力元が上下左右のいずれかの
PEまたは零信号(上下左右零のいずれか)から選択さ
れてALU126(マルチプレクサ1263)に供給さ
れるようになっている。すなわち、メモリ空間上に用意
された状態レジスタ20(3ビットのレジスタ)の内容
によって、マルチプレクサ27を制御して近傍通信の入
力先を上下左右零のいずれにするかを選択できるように
なっている。ここで、マルチプレクサ27が零を選択す
るのは、マルチプレクサ27の出力(ALU126の入
力)を遮断して、例えば、始点となるPEの指定等を行
う。さらに、マルチプレクサ1265の出力は、ローカ
ルメモリ121に供給されると共に、Dラッチ23に格
納されて他のPEに出力されるようになっている。すな
わち、近傍通信の出力先は、ラッチ(Dラッチ23)に
なっている。
【0039】ここで、ALU126の出力信号は、フリ
ップフロップではなくラッチ(Dラッチ)23を介して
出力されるように構成されているのは、フリップフロッ
プではクロックCLK(例えば、クロックCLKの立ち
上がりタイミング)を待つ必要があるのに対して、ラッ
チ23ではイネーブル信号Nenの入力(高レベル
『H』)によりそのまま出力信号を他のPE(ALU)
に伝えることができるからである。すなわち、例えば、
PE2aのALU126aの出力をDラッチ23a、お
よび、PE2bのマルチプレクサ27b(1263b)
を介してPE2bのALU126b(全加算器1266
b)に接続することにより、1つのモジュール(機能ブ
ロック)として使用し、リアルタイムの処理を行うこと
ができる。
【0040】単独のPE2における演算の手順は、前述
した図2のS3PE102と同様であり、A,Bの二つ
のデータをローカルメモリ121から読み出して演算を
実行した後、結果をローカルメモリ121に書き込む。
算術命令の場合は、結果書き込みの後にキャリー格納用
レジスタ1267を更新する。なお、A,Bのデータが
前回と同じ場合は読み出し処理を省略することができ、
通常演算において実行できる演算の種類は、図2のS3
PE102で実行できる演算と同じである。
【0041】具体的に、演算の手順としては、Dラッチ
124をイネーブル信号Aenにより一瞬イネーブルに
して、一方のオペランド(A)をローカルメモリ121
から読み込む。次に、Dラッチ123をイネーブル信号
Benにより一瞬イネーブルにして、他方のオペランド
(B)をメモリ121から読み込む。命令の種類を指定
すると、演算結果が計算されるので、その演算結果をメ
モリ121へ格納する。
【0042】キャリー格納用レジスタ1267は、その
出力が全加算器1266の入力につながっていること
で、多ビットの加減算を1ビット単位で行うビットシリ
アル演算を実現する。ここで、キャリー格納用レジスタ
1267は、クロックCLKによりキャリー値を更新す
るようになっている。また、マルチプレクサ1263に
与える制御信号S5を高レベル『H』(”1”)にする
ことにより、演算のオペランドの一方を近傍入力(マル
チプレクサ27の出力)に切り換えることができる。
【0043】近傍入力の元になる近傍出力の値は、AL
U126の演算結果であり、Dラッチ23をイネーブル
信号Nenで一瞬イネーブルにすることにより更新され
る。このとき、制御信号S5が高レベル『H』になって
いると、全加算器1266の出力が隣接PEの全加算器
の入力に直接(レジスタを介さずに)つながることにな
り、全加算器が縦続接続される。これを利用すること
で、累積演算や多ビット演算を実現する。
【0044】これにより、より無駄の少ない構成で高度
な処理にも対応できるビジョンチップを実現することが
できる。
【0045】図4は図3のアーキテクチャにおけるPE
(プロセッシングエレメント)のブロック化処理を実行
するための構成を説明するための図であり、図3におけ
る主たる構成(列バス21、行バス22、ローカルメモ
リ121、I/Oポート122、状態レジスタ20、お
よび、マルチプレクサ27)を概略的に示すブロック図
である。
【0046】ビジョンチップに設けられている(ローカ
ルメモリ121にマップされている)状態レジスタ20
の内容によって、ALU126に供給される近傍入力元
を上側のPE,下側のPE,左側のPE,右側のPE,
或いは,零信号のいずれかから各PE毎に(ローカル
に)選択できるようになっている。また、列バス21お
よび行バス22が設けられており、各PE(2)に座標
情報を送信する機構を備えている。
【0047】本発明の第1の形態に係るビジョンチップ
の一例のアーキテクチャによれば、PE同士を結合し、
1つの大きなPEとみなすことにより、演算機能やメモ
リ容量等を高めることができる。また、近傍通信の入力
先をローカルに変えることで、さまざまな結合の形を作
ることができる。すなわち、後述するように、可変粒度
プロセッサや列並列プロセッサのエミュレーション等が
実現される。結合されたPEの中で実行できる演算とし
ては、例えば、累積演算および多ビット演算がある。
【0048】図5は本発明の第1の形態に係るビジョン
チップの一例におけるPEの結合処理を説明するための
図であり、左右(行方向)に隣接するPEの結合を示す
ブロック図である。
【0049】図5に示されるように、例えば、行方向に
隣接する2つのプロセッシングエレメント(PE)2a
および2bは、PE2aのラッチ23aを介してALU
126aと126bが直接接続されて隣接するPE同士
の結合が実現される。このようにして結合されたPE群
は、累積演算(総和演算や全OR演算等)や多ビット演
算を実行するために使用される。
【0050】図6は本発明の第1の形態に係るビジョン
チップの一例における累積演算処理を説明するための図
であり、図6は上述した図5に対応している。
【0051】図5および図6に示されるように、まず、
データをメモリ(121)から読み出してラッチ(12
4)に格納し、全加算器(1266)にデータA(A
(i), A(i+1), …)として供給する。次に、マルチプレ
クサ(1263)の制御信号S5を高レベル『H』(”
1”)としてマルチプレクサ(27)の出力を選択し、
データBとして全加算器(1266)に供給する。この
とき、マルチプレクサ(27)はラッチ(20)の出力
により、例えば、左側のPEの出力を選択して出力す
る。さらに、全加算器(1266)の出力(演算結果:
W(i), W(i+1), …)をメモリ(121)に格納する。な
お、必要に応じて、キャリー格納用レジスタ(126
7)を更新する。
【0052】このように、累積演算処理は、例えば、マ
ルチプレクサ1263aの制御信号S5を”1”にした
状態で、ラッチ23aのイネーブル信号Nenを”1”
にする(イネーブルにする)ことで、全加算器1266
aの和出力が次段の全加算器1266bの入力に直接接
続され、累積演算を実行することができる。すなわち、
同様に、近傍出力(例えば、左側のPE(2a)のAL
U(126a)の出力)を隣接PE(2b)のALU
(126b)の入力に直接に入力することで、演算器を
多段となるように構成し、累積演算を実現する。
【0053】図6は、例えば、制御信号[S0,S1,
S2,S3,S4,S5]をそれぞれ[1,x,0,
0,1,x]とした場合の例であり、累積加算器が構成
される。これにより、ひとまとまりのPEからのデータ
の総和を計算することができる。演算の種類を変えるこ
とで、全OR・全AND等も計算することができる。
【0054】すなわち、演算の種類を論理和にすれば全
ORになり、また、加算にすれば総和になる。総和の場
合は、最下位ビットから順にビットシリアルに計算する
ことになる。全ORを用いることで、ブロック内のデー
タのブロードキャストを実現することができる。
【0055】図7は本発明の第1の形態に係るビジョン
チップの一例における総和演算処理を説明するための図
であり、N=4,m=2で、11+10+01+00の
総和(11+10+01+00=0110)が計算され
る。ここで、前述したように、各PEの出力は、ラッチ
(Dラッチ23)を介して隣接する(右側の)PEに供
給されるようになっているため、1つのモジュールとし
て1命令で総和演算を実行することができる。
【0056】なお、例えば、列バス21および行バス2
2からの座標値をマスクとして用いることにより、モー
メント量等のスカラー特徴量を計算することもできる。
【0057】図8は本発明の第1の形態に係るビジョン
チップの一例における多ビット演算処理を説明するため
の図である。
【0058】まず、図8(I)に示されるように、一
旦、キャリー格納用レジスタ(1267)に一方のオペ
ランドに相当する値を格納するような命令を実行してお
き、キャリー信号C(C(i), C(i+1), …)が次段に接続
されるような命令を与える(図8(I)の例では、制御
信号S[S0,S1,S2,S3,S4,S5]にそれ
ぞれ[1,x,0,1,1,x]を与える)ことによ
り、図8(II)に示されるような複数のPEを用いた多
ビット演算が実現される。なお、図8に示されるよう
に、加算命令の場合、桁上げ加算器を構成することにな
る。
【0059】具体的に、まず、一方のデータをローカル
メモリ(121)から読み出してキャリー格納用レジス
タ(1267)に格納する(”1”との加算を実行す
る)。また、他方のデータをメモリ(121)から読み
出してラッチ(124)に格納する。さらに、命令を選
択する(制御信号S5=”1”,S2=”1”)。
【0060】次に、近傍出力ラッチをイネーブルにする
(図8(I):マルチプレクサ(1263)の制御信号
S5を”1”としてマルチプレクサ(27)の出力を選
択する。このとき、マルチプレクサ(27)はラッチ
(20)の出力により、例えば、左側のPEの出力を選
択して出力する。)さらに、近傍出力ラッチをディセー
ブルにする。
【0061】そして、命令を選択し(制御信号S5=”
1”,S2=”0”:図8(II))、演算結果をメモリ
(121)に格納する。なお、上記のような累積演算や
多ビット演算を行うPE群を指すものとして、ブロック
(ブロック化)という概念を用いている。
【0062】なお、上記の多ビット演算処理において
も、ALU(全加算器1267)の出力信号は、フリッ
プフロップではなくラッチ(Dラッチ23)を介して接
続することで1つのモジュールとして機能し、リアルタ
イムの処理を行うことができる。
【0063】図9〜図11は本発明の第1の形態に係る
ビジョンチップの一例におけるPEのブロック化処理を
説明するための図である。図9および図10において、
参照符号200はブロック(PE群)を示し、PEsは
始点のプロセッシングエレメント、また、PEeは終点
のプロセッシングエレメントを示している。
【0064】図9は1次元の例であり、図10は2次元
の例であるが、PEのブロック化(PE群化)は、列バ
ス21および行バス22を介して各PEに座標に依存し
た値を送り、それに基づいて状態レジスタ(20)の値
をローカルに設定することによって、PEをブロック状
に連結してブロック200を構成する。
【0065】すなわち、図9および図10に示されるよ
うに、始点になるプロセッシングエレメントPEsの近
傍入力先を零に設定(例えば、図3に示すPEにおける
マルチプレクサ27が零を選択して出力するように設
定)し、そこから一筆書きで終点のプロセッシングエレ
メントPEeまで連結する。ここで、終点のプロセッシ
ングエレメントPEeは、総和等のスカラー特徴量の格
納先になる。このひとかたまりのブロック200が、先
に挙げた累積演算や多ビット演算を行う際の処理単位と
なる。
【0066】このようなブロック化により、例えば、図
10に示されるように、n×mブロック内において、n
m個の1ビットALU(1266)が縦続接続され、n
mビットALUとして振る舞う。また、図11に示され
るように、メモリ素子も1ビットメモリが24個で構成
されるメモリ(121)を持つPEをnm個結合するこ
とで、nmビットが1ワードのメモリが24個使用可能
になる。従って、ブロックのサイズを大きくすること
で、素子を無駄にすることなく、ブロックの演算能力を
高めることが可能になる。
【0067】なお、ブロック(200)の大きさを動的
に切り替えることで、可変粒度の画像処理が可能にな
る。さらに、ブロック内のブロードキャストが自由に行
えるため、ピラミッドアーキテクチャ等のメッシュ以外
のネットワーク構造のエミュレーションも可能である。
【0068】図12は本発明の第1の形態に係るビジョ
ンチップの一例におけるブロック内特徴量のフィードバ
ック処理を説明するための図である。
【0069】上述したブロック(200)内において、
まず、総和演算でモーメント等のスカラー特徴量を計算
し、その結果をブロードキャスト(全ORで実現)でブ
ロック内の全PEに送り、結合メモリに格納すること
で、ブロック内での特徴量フィードバックが実現され
る。これらの一連の処理は、ビットシリアルに実現可能
であるため、作業用のメモリを消費せずに済む。
【0070】図12に示されるように、複数のPEをあ
るときは空間(画像)を表すために使用し、また、ある
ときはビット列(最下位ビット(LSB:Least Signif
icant Bit)、第2ビット、…:演算結果)を表すため
に用いることができ、メモリ(資源)を自由に無駄なく
使用することが可能である。このように、ブロック(P
E群)内に保持するデータを桁毎に異なるPEに分散し
て持たせることで、単一の場合におけるメモリ使用量を
削減することができる。
【0071】次に、列並列プロセッサのエミュレーショ
ンに関して、従来のビジョンチップやSIMDプロセッ
サの中には、列に1つだけPEを設置した列並列のもの
(例えば、MAPP2200)が存在する。このタイプのプロセ
ッサは、列並列にすることにより、完全並列に比べて1
列分の繰り返し処理が必要となるのため速度の点で性能
が落ちるが、その分個々のPEの演算能力を高めること
を目指すことができる。これに関して、本発明の第1の
形態に係るビジョンチップのPE結合機能を用いてPE
を列方向に一列につなげることにより、演算器(ALU
126)やメモリ(121)を無駄にすることなく、こ
れらの列並列プロセッサのエミュレーションが可能であ
る。
【0072】また、列並列のプロセッサでは、列毎に任
意の画素にアクセスできるため、ある種の座標変換アル
ゴリズムにおいて威力を発揮する。従来の2Dメッシュ
ネットワークを用いたチップにおいては、PE間の通信
が近傍のみと限られているため、このようなアルゴリズ
ムを実装することは難しいが、本発明の第1の形態に係
るビジョンチップのブロードキャスト機能を用いること
で、列並列プロセッサと同等の機能を実現することがで
きる。具体例として、後に90度回転アルゴリズムの実
装例を示す。
【0073】図13は本発明の第1の形態に係るビジョ
ンチップの一例におけるその他の処理を説明するための
図であり、ブロックの自己生成を説明するためのもので
ある。
【0074】上述したブロック化において、ブロックを
指定するのは、外部から列バス21および行バス22を
介して行うため、ブロックの大きさや位置は格子等のあ
る程度規則的なものとなっている。しかしながら、図1
3に示されるように、ブロック200a,200bの大
きさや位置を、例えば、入力画像に基づいて内部生成
(ブロックの自己生成)することで、より一層柔軟なブ
ロックを生成することができる。なお、ブロックは、同
時に複数生成することが可能である。
【0075】また、PEを列方向に一列につなげて列並
列マシンのエミュレーションを行うことで、演算能力お
よびメモリ容量を向上し、列内の任意の画素同士の通信
を可能とすることもできる。これは、ある種の座標変換
系のアルゴリズムにおいて威力を発揮することになる。
【0076】次に、図14〜図16を参照して、本発明
の第1の形態に係るビジョンチップの一例に対して視覚
処理アルゴリズムを実装した結果を説明する。なお、ア
ルゴリズムの検証は、専用シミュレータを使用して行っ
た。
【0077】図14は本発明の第1の形態に係るビジョ
ンチップの一例を適用した並列ブロックマッチング処理
を説明するための図であり、図12を参照して説明した
ブロック内特徴量のフィードバック処理を用いたアルゴ
リズムの例としての並列ブロックマッチングを説明する
ためのものである。
【0078】本並列ブロックマッチング処理は、二枚の
画像(画像A,画像B)のうち、一方の画像(画像A)
における区分けされた各部分(A1,A2,A3,A
4)が、他方の画像(画像B)においてどちらにずれて
いるかを探索するアルゴリズムである。すなわち、二枚
の画像を別々のカメラから入力することでステレオ処理
を実現したり、また、1フレーム前の入力とのマッチン
グを取ることでオプティカルフローを実現する等の応用
が考えられる。
【0079】図14(I)に示されるように、一方の画
像(画像A)をうずまき状に移動させながら、ブロック
単位でSAD(Sum of Absolute Difference:差分の絶
対値の総和)を取る。SADがこれまでの最大値よりも
大きい場合には、最大値およびインデックスを更新す
る。なお、図14(II)は、並列ブロックマッチング処
理の一例のプログラムおよびブロックマッチングを行う
移動方向を示し、また、図14(III)は、並列ブロッ
クマッチング処理の結果(インデックスidx)を示し
ている。ここで、図14(III)は、部分A1では18
回目でパターンが一致し、部分A2では14回目でパタ
ーンが一致し、部分A3では22回目でパターンが一致
し、そして、部分A4では10回目でパターンが一致し
た場合を示している。
【0080】通常、SADのような演算は、総和計算に
時間がかかり、何度も繰り返して演算を行うのは難しい
が、本発明の第1の形態に係るビジョンチップによれ
ば、ブロック内総和を高速に計算することができるた
め、SAD演算を無理なく実行することが可能である。
また、例えば、入力画像を4ビット×2枚、ブロックサ
イズを8×8、そして、探索領域を4×4とした場合に
使用するメモリ量は、入力が8ビット、差分の絶対値の
格納が4ビット、SAD結果の格納が10ビット、最大
値の格納が10ビット、そして、インデックスの格納4
ビットを合計した36ビット+作業用数ビットとなり、
1個のPEが持つローカルメモリ(例えば、24ビッ
ト)には収まりきらない。
【0081】しかしながら、本発明の第1の形態に係る
ビジョンチップによれば、SADの結果、最大値、およ
び、インデックス等をブロック内の複数PEのメモリに
分散して持たせることができるため、メモリ領域を圧迫
せずに済むことになる。
【0082】具体的に、入力画像を4ビット、ブロック
サイズを8×8画素、そして、探索範囲をn画素とした
場合に必要な演算の回数は、通常演算が(224n−1
2)回、ブロック内累積演算が(22n−2)回、座標
指定が(66n−6)回、そして、各PEが使用するメ
モリ量は19ビットであった。
【0083】図15は本発明の第1の形態に係るビジョ
ンチップの一例を適用した90度回転処理を説明するた
めの図である。
【0084】例えば、正立の画像『A』を反時計回り方
向に90度だけ回転する場合を考える。ここで、回転、
拡大およびフーリエ変換等の座標変換系のアルゴリズム
は、処理の局所性がないため、従来の2Dメッシュ結合
のSIMDプロセッサで実行するには向かないアルゴリ
ズムである。しかしながら、並列度を2次元から1次元
に落とし、繰り返し演算を行うことで、これらの演算が
可能になる場合がある。ここでは、特に、本発明の第1
の形態に係るビジョンチップを列並列プロセッサと見立
て、90度回転のアルゴリズムを実装した。
【0085】図15に示されるように、アルゴリズムの
手順は、対角線を介して列毎に列を行に置き換えてい
く。同一列内および同一行内でのデータの移動は、累積
演算によるブロードキャストを用いて行う。
【0086】本アルゴリズムを実装すると、入力画像が
1ビット、そして、画素数がN×N(2n=N)の場合
に必要な演算の回数は、通常演算が(4N+2n+2)
回、列(行)累積演算が4N回、座標指定が(6N+2
n)回、そして、各PEが使用するメモリ量が4ビット
であった。
【0087】図16は本発明の第1の形態に係るビジョ
ンチップの一例を適用した複数物体の同時トラッキング
処理を説明するための図である。
【0088】複数物体の同時トラッキングを行おうとし
た場合、1つの方法として、個々の物体に対して順番に
トラッキング処理を行うという方法が考えられる。しか
しながら、対象の数が多くなると、要求されるフレーム
レート内に処理が収まらない可能性も出てくる。そこ
で、図16のトラッキング処理は、本発明の第1の形態
に係るビジョンチップのブロック化の機能を用いて、複
数の物体を同時にトラッキングすることを考える。この
場合、入力画像における対象の位置と形状に依存してブ
ロックを作らなければならず、前述したブロックの自己
生成が有効になる。
【0089】すなわち、図16に示されるように、ま
ず、初めに物体の初期位置(既知とする)に初期ブロッ
クを配置し、それを基に対象を囲むブロックを自己生成
する。次に、ブロック内でスカラー特徴量を計算して出
力する。特徴量から対象の位置情報を計算し、次のフレ
ームにおける初期ブロックの位置とする。
【0090】ここで、初期ブロックの配置、特徴量の出
力および位置情報の計算は対象毎に行う必要があるが、
ブロックの自己生成および特徴量の計算は複数物体に対
して同時に実行することができるため、トラッキング処
理全体の処理時間を短縮することができる。
【0091】本アルゴリズムを実装すると、入力画像を
1ビット(バイナリ)、対象の個数をm、対象の最大サ
イズをnmax×nmax、そして、画素数N×Nとした場
合、初期ブロックの配置およびブロックの自己生成に
は、通常演算が(51nmax+12m+4)回、ブロッ
ク内列(行)方向累積演算が4nmax回、そして、座標
指定が(5m+16nmax)回だけかかる。特徴量の計
算および出力は、モーメントを利用した場合で、通常演
算が(66log2max+40log2N)回、ブロック内累
積演算が(12log2max+8log2N)回、列(行)累
積演算が(6mlog2max+4mlog2N)回、そして、
座標指定が(2m+2log2N)回だけかかる。なお、使
用メモリは、合計7である。
【0092】上述したアルゴリズムの実行時間および使
用メモリの見積もりの例を次の表1に示す。ここで、画
素数を256×256、マッチングの探索範囲を9×9
画素、トラッキング対象の最大サイズを32×32、ト
ラッキング対象の個数を10個、通常演算の実行速度を
40ns、N段累積演算の実行速度を(20+1.0
N)ns、そして、座標指定の実行速度を20nsとす
る。
【0093】
【表1】
【0094】上述した本発明の第1の形態に係るアーキ
テクチャを基に試作チップの設計を行った。過去の設計
から回路の追加はほとんどないので、回路規模はそのま
まに機能だけ拡充することができた。さらに、回路およ
びレイアウトを改良することにより、さらに高集積化が
実現された。具体的には、制御信号のグローバル配線化
・SRAMの非双対線化による効果が大きい。また、こ
れまでPD回路には、インバータが反転するまでの時間
をカウントする方式がとられていたが、比較器で基準電
圧Vrefと比較する方式を採用することにより、消費電
流をかなり抑えることができ、A/D変換のしきい値電
圧を変えられるという利点がある。
【0095】具体的に、例えば、0.35μm CMO
S DLP/TLMプロセス、エリアサイズが5.4m
m×5.4mmの中に64×64個の画素(図1におけ
るユニット100に相当)を搭載することができる。こ
こで、各PEの面積は、例えば、67.4μm×67.
4μmであり、256×256画素を約1.8cm角の
チップに搭載することが可能であり、画像処理デバイス
として標準的な画素数にまで到達させることができる。
【0096】このように、本発明の第1の形態に係るP
E結合機能とグローバル演算機能を付加したビジョンチ
ップによれば、例えば、ステレオ視やオプティカルフロ
ーのためのブロックマッチングを1ms以内に実行でき
る等、画像処理のリアルタイム応用に対し有効であり、
従って、ビジョンチップで実行できるアプリケーション
の幅を拡大することが可能である。
【0097】上述したように、本発明によれば、ALU
に含まれるFAやDFF等の回路を通常演算のみなら
ず、累積演算・多ビット演算にも流用することにより、
小さい回路規模を維持しつつ多様な演算を実現すること
ができる。その結果、グローバルな演算を行うことがで
きるビジョンチップを、従来のものとほとんど同じ回路
規模で実現することができる。
【0098】また、近傍通信の入力元をPE毎に選択で
きるようにすることで、複数のPEをブロック化し、P
E単体では不足な性能を補うことが可能である。その結
果、予め想定させるアプリケーションの最大のスペック
に合わせてPEを設計せずに済み、結果としてハードウ
ェア量の大幅な削減、並びに、対応アプリケーションの
大幅な拡大につながる。
【0099】以下、本発明の第2の形態としての光検出
回路PD(光検出素子:フォトダイオード)の出力をソ
フトウェアA/D変換する半導体集積回路装置を詳述す
る。
【0100】従来技術の説明として、図2を参照して説
明したように、S3PEにおいて、光検出器(PD)1
01からの光強度信号のA/D変換は、光電流による蓄
積電荷の放電をしきい値回路(インバータ)で検出し、
そのしきい値を切るまでの時間を計測して行っており、
PE102をカウンタとして用いることで回路を増やす
ことなくA/D変換を実現している。
【0101】図17は従来のビジョンチップの一例にお
けるフォトダイオード出力(光検出回路PD)のA/D
変換処理を実行するための構成を説明するための図であ
る。図17において、参照符号301は光検出器(PD
101)を示し、302はプロセッシングエレメント
(PE102)を示している。
【0102】PD301は、光検出素子(フォトダイオ
ード)311およびしきい値回路(インバータ)312
を備え、しきい値回路312は、フォトダイオード31
1の光電流による蓄積電荷の放電を検出する。PE30
2は、PD301からの光強度信号のA/D変換をソフ
トウェアで行うもので、しきい値回路312で検出され
たしきい値を切るまでの時間を計測して行うようになっ
ている。すなわち、PE302をカウンタとして用いる
ことで、回路を増やすことなくA/D変換を実現してい
る。
【0103】図18は図17のA/D変換処理における
課題を説明するための図である。図18において、参照
符号L1は光検出素子(フォトダイオード)311に入
力(照射)される光強度が大きい(明るい)とき、L2
は光検出素子311に入力される光強度が中くらいのと
き、そして、L3は光検出素子311に入力された光強
度が小さい(暗い)ときの時間に対する出力電圧の関係
を示している。
【0104】すなわち、光検出素子311に入力する光
強度が大きい場合には、光電流による電圧降下は大きく
(L1)、また、光検出素子311に入力する光強度が
小さい場合には、光電流による電圧降下が小さい(L
3)。ここで、図17のA/D変換処理では、しきい値
回路312としてインバータを使用するため、しきい値
電圧(基準電圧Vref)は固定であり、また、PE30
2におけるしきい値回路312の出力の変化検出処理
(カウンタによる時間測定処理)も一定の時間間隔(P
0)となっている。
【0105】このように、図17に示す従来のビジョン
チップの一例における光検出回路PD(フォトダイオー
ド出力)のA/D変換処理は、しきい値が固定されたし
きい値回路(インバータ)312を使用し、しきい値回
路312の出力の変化も一定の時間間隔P0で実行され
ている。その結果、光の強度やノイズに対する適切な制
御を行うことが困難であり、また、必要な個所で検出精
度を向上させるといったこともできなかった。
【0106】図19は本発明の第2の形態に係るビジョ
ンチップの一例におけるフォトダイオード出力(光検出
回路PD)のA/D変換処理を実行するための構成を説
明するための図であり、図20は図19の一構成例を示
す図である。図19および図20において、参照符号3
1は光検出器(PD101)、33はリセット回路、3
4は光検出素子(フォトダイオード311)、そして、
35はコンパレータ(比較手段)を示している。また、
参照符号32はプロセッシングエレメント(PE10
2)、36はローカルメモリ(121)、37はI/O
ポート(122)、そして、38はALU(126)を
示している。ここで、フォトダイオード34の出力(ア
ノード)はコンパレータ35の負入力に接続され、ま
た、コンパレータ35の正入力には基準電圧Vrefが印
加れている。
【0107】図19および図20に示されるように、フ
ォトダイオード34の寄生容量に蓄えられた電荷は、照
射された光の光強度に応じた量の光電流が流れることで
蓄積または解放(図19および図20では解放)され、
それに伴って、コンパレータ35の入力電圧も変動し、
予め定められた基準電圧(しきい値)Vrefを切ったと
ころで出力が反転する。このコンパレータ35の出力を
I/Oポート37(図20ではローカルメモリ36にマ
ップされている)を通じて取り込み、PE32のALU
38とメモリ36を用いてカウントする。
【0108】また、図20に示されるように、フォトダ
イオード34の電荷をリセットするための信号は、I/
Oポート37からリセット回路33に送られ、各PE毎
に(ローカルに)リセットのタイミングを制御するよう
になっている。
【0109】上述した本発明に係るA/D変換(可変量
子化間隔A/D変換)は、光電流による電圧降下をコン
パレータ35で検知する方式であり、電圧が基準電圧V
refを切るまでの時間をカウンタで測定する。この際、
出力が光強度の逆数となってしまうが、これでは、画像
処理を行う上で都合が悪いので、出力が光強度に比例ま
たは対数比例するように、カウントのタイミングを時間
によって変えて量子化間隔を調整する。
【0110】この際、ビジョンチップを高い時間分解能
で制御する必要が生じるため、ビジョンチップに対して
命令を供給する装置(システム)として、パイプライン
化によって命令供給の時間分解能を高め、且つ、そのパ
イプラインの動的な停止を一切排除することにより、命
令サイクルの粒度での実時間性を保証できるコントロー
ラを用いる。さらに、カウントの最中に基準電圧Vref
を変化させることにより、さらに柔軟なセンシングが可
能となる。例えば、カウントしながら基準電圧Vrefを
徐々に上げていくことにより、暗いところでは感度を優
先し、明るいところでは精度を優先したセンシングを実
現することができる。また、この可変量子化間隔A/D
変換の機構を積極的に利用し、過去のA/D変換結果を
用いて現時刻の区間割り当て制御を更新することによ
り、環境変化に対し適応的なA/D変換が可能になる。
詳細は、後述する。
【0111】図20に示す回路では、PD31(光検出
素子34)のリセットを各画素毎に行うことができ、こ
れを利用して、電圧が基準電圧Vrefを切った画素(P
D)に対してのみリセット信号を与える。これにより、
明るいところは高いフレームレートで、また、暗いとこ
ろは低いフレームレートで撮像することになり、広ダイ
ナミックレンジと高フレームレートを両立した撮像が可
能になる。
【0112】さらに、PD31(光検出素子34)のA
/D変換を既にPEに設けられているALU38とメモ
リ36を用いて行うことにより、回路の追加なしにA/
D変換を実現することがでる。また、この方式の利点と
して、光検出素子(フォトダイオード)34の制御のタ
イミングをソフトウェアで変えることができ、従来のイ
メージセンサでは不可能であった柔軟なセンシングを実
現することができる。
【0113】図21は図19および図20のA/D変換
処理の動作を説明するための図である。図21におい
て、参照符号LL1〜LL6は光検出素子(フォトダイ
オード)34に入力された光強度が高い(明るい:LL
1)方から低い(暗い:LL6)に向かっての時間に対
する出力電圧の関係を示している。
【0114】図21に示されるように、図20のA/D
変換処理は、基準電圧Vrefを様々な電圧レベルに設定
すると共に、プロセッシングエレメント(PE)32に
おけるしきい値回路(コンパレータ)35の出力の変化
検出処理(カウンタによる時間測定処理)も異なる時間
間隔(例えば、P1,P2)に変化させて制御するように
なっている。図21に示されるように、ノイズの影響
は、ノイズの大きさが同じであっても、光強度が小さい
ときほど(例えば、LL1よりもLL4やLL5の方
が)その影響は大きくなり、また、検出精度は、基準電
圧Vrefが低いときほど高くなる。
【0115】ここで、フォトダイオード34に入力する
光強度が大きい場合には、コンパレータ35の基準電圧
Vrefを低く設定してノイズに強くし、また、検出精度
を向上させる方が好ましい。一方、フォトダイオード3
4に入力する光強度が小さい場合には、コンパレータ3
5の基準電圧Vrefを高く設定して感度を向上させる必
要がある。さらに、コンパレータ35の出力の変化検出
処理(カウンタによる時間測定処理)は、例えば、フォ
トダイオード34に入力する光強度が大きいことが予想
される場合(例えば、LL1)には、最初の時間間隔を
狭く設定(P1)すると共に後の時間間隔を広く設定
(P2)し、コンパレータ35の変化タイミングを狭い
時間間隔の領域で検出して検出精度を向上させるように
構成することもできる。
【0116】このように、本発明の第2の形態に係る半
導体集積回路装置は、ビジョンチップが適用されるシス
テム(装置)に応じて、光の強度やノイズに対する適切
な制御を行い、さらに、必要な個所で検出精度を向上さ
せるといった制御を行うこともできる。
【0117】図22は本発明の第2の形態に係るビジョ
ンチップが適用されるシステムの構成例を示す図であ
る。図22において、参照符号1はビジョンチップ(半
導体集積回路装置)、100はユニット(画素)、41
はPD読み出し時刻・供給電圧テーブル(光検出回路P
Dの出力を検出するタイミング(時間間隔)およびコン
パレータに与える基準電圧Vref用のテーブル)、42
は命令テーブル、43はビジョンチップ制御装置、そし
て、44はD/A変換器を示している。まず、可変量子
化間隔A/D変換の動作について説明する。
【0118】図22に示されるように、本発明の第2の
形態に係る半導体集積回路装置(ビジョンチップ)が適
用されるシステムは、ビジョンチップ制御装置43が、
命令テーブル42およびPD読み出し時刻・供給電圧テ
ーブル41に従い、ビジョンチップに対して制御命令お
よび基準電圧Vrefを供給する機能を有する。
【0119】n階調の可変量子化間隔AD変換は、以下
の手順で行うことができる。
【0120】1)各画素100の変換結果を格納するメ
モリ領域(各PEのローカルメモリ36)を零に初期化
するための制御命令を供給する。
【0121】2)全ての画素をリセット(リセット回路
33をオンした後にオフ)する制御命令を供給する(こ
れを時刻0とする)。
【0122】3)基準電圧Vrefに電位V1を供給す
る。
【0123】4)k=1,2,…,n−1に対して、以
下の処理を繰り返し実行する。
【0124】i)時刻tkまで待った後、各画素におい
て、光検出器31(フォトダイオード34)の出力を読
み出す制御命令を供給する。
【0125】ii)基準電圧Vrefとして電位Vk+1を供給
する。
【0126】iii)各画素100において、変換結果を
格納するメモリ領域に対して、上記i)で読み出した1
ビット値を加算する制御命令を供給する。
【0127】5)以上の手順終了後、各画素の変換結果
格納メモリ領域にはA/D変換結果が格納される。
【0128】次に、{tk}および{Vk}の決定法につ
いて説明する。ここで、{tk}は、プロセッシングエ
レメント(PE)が光検出回路PDの出力を検出する時
刻(カウントのタイミング)に相当し、また、{Vk
はコンパレータ(35)に供給する基準電圧(Vref)
に相当する。
【0129】本発明の第2の形態に係る半導体集積回路
装置によれば、テーブルに格納する{tk}および
{Vk}を変更することで、さまざまな量子化間隔を実
現することができる。具体的に、{tk},{Vk}を決
定する方法の例として、仕様として与えられた{ik
(光電流量の量子化間隔)から、それを実現するための
{tk}および{Vk}を算出するアルゴリズムを次に示
す。
【0130】図23〜図25は図22のシステムにおけ
るフォトダイオード出力のA/D変換処理を説明するた
めの図である。
【0131】まず、アルゴリズムヘの入力に関し、{i
k}(k=1,…,n−1)は、光電流量の量子化間隔
を示す。量子化間隔{ik}は、図23のように表現す
る。すなわち、光電流量ikからik-1までのアナログ量
に対して、符号(ディジタル値)n−kを割り当てるも
のとする。
【0132】図23において、光電流量iの添字は、大
きい方が暗い光量を表し、フォトダイオード(34)を
流れる光電流量は少なく、逆に、小さい方が明るい光量
を表し、フォトダイオードを流れる光電流量は多い。こ
こで、光電流量iの添字を上記のように設定するのは、
時間順に添字を取るtk,Vkとの対応を表すためであ
る。ただし、in,i0は、それぞれ0および∞に固定と
してある。
【0133】次に、アルゴリズムの出力に関し、
{tk}(k=1,…,n−1)は、光検出回路(P
D)の出力の読み出し時刻列を示し、そして、{Vk
(k=1,…,n−1)は、各tkにおいてVrefとして
与えるべき電位を示す。なお、t0は0に固定する。
【0134】また、その他のパラメータに関し、ΔVは
基準電圧Vrefとして入力できる値の粒度、ΔtはPD
読み出し時刻の粒度、tmaxはAD変換に費やす時間
[Δtの整数倍]、そして、{Pk}(k=1,…,n
−1)は前述したi)〜iii)を実行するのに要する時
間[Δtの整数倍]を示す。さらに、Vddはフォトダイ
オードのリセット電位(電源電圧)、Vmaxは基準電圧
Vrefに入力できる最大値(コンパレータの動作領域の
上限)[ΔVの整数倍]、Vminは基準電圧Vrefに入力
できる最小値(コンパレータの動作領域の下限)[ΔV
の整数倍]、そして、Cはフォトダイオードの容量を示
す。
【0135】アルゴリズムに関し、まず、k=n−1の
場合を決定する。その結果を用いて、k=n−2の場合
を決定し、以下同様に、k=1まで決定していく。途中
でエラー終了になるのは、入力として与えられた
{ik}がハードウェア的な制約から実現不可能な場合
である。それぞれの値の対応を図24に示す。なお、記
述の都合上、tn=tmax,Vn=Vmaxとして扱う。
【0136】図24において、参照符号参照符号LL1
1〜LL14はフォトダイオード(34)に入力された
光強度が高い(明るい:LL11)方から低い(暗い:
LL14)に向かっての時間に対する出力電圧の関係を
示し、LL11は傾きが−i 1/C、LL12は傾きが
−i2/C、LL13は傾きが−ik/C、そして、LL
14は傾きが−in-1/Cとなっている。
【0137】k=n−1,n−2…,1の順にそれぞれ
に対して、以下のいずれかの処理を行う。
【0138】Vk+1≠Vminのとき、処理(A)を行う。
【0139】Vk+1=Vminのとき、処理(B)を行う。
【0140】ここで、上記の処理(A)および処理
(B)は次の通りである。
【0141】処理(A)は、以下のように計算する。
【0142】
【数1】
【0143】ただし、Vk>Vk+1となった場合はエラー
終了する。Vk<Vminとなった場合は、処理(B)にて
再計算する。
【0144】処理(B)は、以下のように計算する。
【0145】
【数2】
【0146】ただし、tk+1−tk<Pkとなった場合
は、エラー終了する。
【0147】このようにして、図24の曲線RLに示さ
れるように、所望の光電流量の量子化間隔{ik}を実
現するPD読み出し時刻列{tk}および基準電圧Vref
として与えるべき電位{Vk}を用意し、A/D変換を
行うことができる。また、PD読み出し時刻・供給電圧
テーブル41の内容を動的に入れ替えることで、環境や
目的の変化に応じた適応的なセンシングを実現すること
ができる。
【0148】光電流量の量子化間隔{ik}の与え方の
例を図25に示す。ただし、説明を簡略化するために、
8階調のA/D変換とする。
【0149】まず、図25(a)は、暗い領域を狭い刻
み幅でA/D変換する例(フォトダイオード34に入力
する光強度が小さい領域で検出精度を向上させるのに適
した例)であり、逆に、図25(b)は、明るい領域を
狭い刻み幅でA/D変換する例(フォトダイオード34
に入力する光強度が大きい領域で検出精度を向上させる
のに適した例)である。
【0150】また、図25(c)は、刻み幅を大きく取
ることで暗い領域から明るい領域までをカバーする例で
ある。ただし、図25(c)の例は、図25(a)と比
べて検出可能な上限が2倍になったのと同時に下限も2
倍になっているため、ダイナミックレンジは変わらな
い。
【0151】さらに、図25(d)は、刻み幅を暗い領
域から明るい領域になるに従って大きくして、広いダイ
ナミックレンジを実現する例である。ただし、図25
(d)の例では、その代償として、入力光の強度とA/
D変換後の値の関係は線形ではなくなる。
【0152】本発明の第2の形態に係る半導体集積回路
装置によれば、上記の図25(a)〜図25(d)に示
されるように、ビジョンチップが適用されるシステム
(装置)に応じて、光の強度やノイズに対する適切な制
御を行うことができ、必要な個所で検出精度を向上させ
るといった制御が可能になる。
【0153】以上の説明においては、本発明の適用可能
な半導体集積回路装置としてビジョンチップを例として
説明したが、本発明はビジョンチップに限定されず、複
数のプロセッシングエレメント(PE)が1つの半導体
チップ上に形成された半導体集積回路装置に対して幅広
く適用することができる。
【0154】(付記1) 1つの半導体チップに設けら
れた複数のプロセッシングエレメントを有する半導体集
積回路装置であって、前記各プロセッシングエレメント
の出力に設けられたラッチ手段と、入力元を上下左右の
いずれかのプロセッシングエレメントまたは零信号から
選択して出力する選択手段とを備えることを特徴とする
半導体集積回路装置。
【0155】(付記2) 付記1に記載の半導体集積回
路装置において、さらに、前記各プロセッシングエレメ
ントの座標位置情報に応じて前記選択手段が選択するプ
ロセッシングエレメントを制御する制御手段を備えるこ
とを特徴とする半導体集積回路装置。
【0156】(付記3) 付記1または2に記載の半導
体集積回路装置において、該半導体集積回路装置は、リ
アルタイムの多ビット演算処理または累積演算処理を実
行することを特徴とする半導体集積回路装置。
【0157】(付記4) 付記1〜3のいずれか1項に
記載の半導体集積回路装置において、さらに、複数の光
検出器を備え、前記各プロセッシングエレメントは対応
する前記光検出器の出力を処理することを特徴とする半
導体集積回路装置。
【0158】(付記5) 複数のプロセッシングエレメ
ント、および、該プロセッシングエレメントをつなぐ通
信手段を有する半導体集積回路装置であって、第1のプ
ロセッシングエレメントにおける資源を、前記通信手段
を介して任意の第2のプロセッシングエレメントの資源
として使用することを特徴とする半導体集積回路装置。
【0159】(付記6) 付記5に記載の半導体集積回
路装置において、前記プロセッシングエレメントを複数
結合し、プロセッシングエレメント群としてブロック化
することを特徴とする半導体集積回路装置。
【0160】(付記7) 付記6に記載の半導体集積回
路装置において、前記各プロセッシングエレメントはそ
れぞれALUおよびメモリを備え、前記ブロック化され
たプロセッシングエレメント群に含まれる複数のALU
およびメモリにより所定の処理を行うことを特徴とする
半導体集積回路装置。
【0161】(付記8) 付記6に記載の半導体集積回
路装置において、前記複数のプロセッシングエレメント
を結合するブロック化の構成およびサイズを動的に可変
としたことを特徴とする半導体集積回路装置。
【0162】(付記9) 付記6に記載の半導体集積回
路装置において、前記各プロセッシングエレメントは、
それぞれ近傍のプロセッシングエレメントとの接続を制
御する接続制御手段を備えることを特徴とする半導体集
積回路装置。
【0163】(付記10) 付記9に記載の半導体集積
回路装置において、前記接続制御手段は、近傍通信の入
力元を上下左右のいずれかのプロセッシングエレメント
または零信号から選択することを特徴とする半導体集積
回路装置。
【0164】(付記11) 付記6に記載の半導体集積
回路装置において、前記ブロック化されたプロセッシン
グエレメント群は、リアルタイムの多ビット演算または
累積演算を実行することを特徴とする半導体集積回路装
置。
【0165】(付記12) 付記5〜11のいずれか1
項に記載の半導体集積回路装置において、前記複数のプ
ロセッシングエレメントはマトリクス状に配置され、前
記通信手段は行バスおよび列バスを備えて該各プロセッ
シングエレメントに対して所定の情報を送信することを
特徴とする半導体集積回路装置。
【0166】(付記13) 付記12に記載の半導体集
積回路装置において、前記所定の情報は、前記各プロセ
ッシングエレメントの座標情報であることを特徴とする
半導体集積回路装置。
【0167】(付記14) 付記5〜13のいずれか1
項に記載の半導体集積回路装置において、該半導体集積
回路装置は、SIMDプロセッサであることを特徴とす
る半導体集積回路装置。
【0168】(付記15) 付記14に記載の半導体集
積回路装置において、該半導体集積回路装置は、前記各
プロセッシングエレメントがそれぞれ対応する光検出器
の出力を処理するビジョンチップであることを特徴とす
る半導体集積回路装置。
【0169】(付記16) 付記5〜15のいずれか1
項に記載の半導体集積回路装置において、該半導体集積
回路装置は、1つの半導体チップとして構成されている
ことを特徴とする半導体集積回路装置。
【0170】(付記17) 複数の光検出回路および複
数のプロセッシングエレメントを有する半導体集積回路
装置であって、前記各光検出回路は、光検出素子の出力
と基準電圧とを比較する比較手段を備え、該比較手段の
出力が該基準電圧を切るまでの時間をカウントしてA/
D変換処理を行うことを特徴とする半導体集積回路装
置。
【0171】(付記18) 付記17に記載の半導体集
積回路装置において、前記比較手段に与える基準電圧レ
ベルを可変としたことを特徴とする半導体集積回路装
置。
【0172】(付記19) 付記18に記載の半導体集
積回路装置において、前記比較手段の基準電圧レベル
を、ソフトウェアにより可変制御するか、または、予め
与えられたテーブルに基づいて規定することを特徴とす
る半導体集積回路装置。
【0173】(付記20) 付記17に記載の半導体集
積回路装置において、前記比較手段の出力が前記基準電
圧を切るまでの時間をカウントするカウント間隔を可変
としたことを特徴とする半導体集積回路装置。
【0174】(付記21) 付記20に記載の半導体集
積回路装置において、前記カウント間隔を、ソフトウェ
アにより可変制御するか、または、予め与えられたテー
ブルに基づいて規定することを特徴とする半導体集積回
路装置。
【0175】(付記22) 付記17〜21のいずれか
1項に記載の半導体集積回路装置において、前記光検出
素子のリセットを該各光検出回路毎に行うことを特徴と
する半導体集積回路装置。
【0176】(付記23) 付記17〜22のいずれか
1項に記載の半導体集積回路装置において、前記A/D
変換処理を、前記各プロセッシングエレメントのALU
およびメモリを使用して実行することを特徴とする半導
体集積回路装置。
【0177】(付記24) 付記17〜23のいずれか
1項に記載の半導体集積回路装置において、該半導体集
積回路装置はビジョンチップであり、前記各プロセッシ
ングエレメントは前記複数の光検出回路の対応する1つ
と結合されていることを特徴とする半導体集積回路装
置。
【0178】(付記25) 付記17〜24のいずれか
1項に記載の半導体集積回路装置において、該半導体集
積回路装置は、1つの半導体チップとして構成されてい
ることを特徴とする半導体集積回路装置。
【0179】
【発明の効果】以上、詳述したように、本発明の第1の
形態によれば、画素数の低下を来すことなく(PEの占
有面積の増大を来すことなく)、高い汎用性を有する半
導体集積回路装置を提供することができる。また、本発
明の第2の形態によれば、光検出素子の出力のA/D変
換を追加回路なしで行うと共に、柔軟なセンシングを実
現することのできる半導体集積回路装置を提供すること
ができる。
【図面の簡単な説明】
【図1】ビジョンチップを概念的に示す図である。
【図2】従来のビジョンチップのアーキテクチャを説明
するための図である。
【図3】本発明の第1の形態に係るビジョンチップの一
例のアーキテクチャを説明するための図である。
【図4】図3のアーキテクチャにおけるPE(プロセッ
シングエレメント)のブロック化処理を実行するための
構成を説明するための図である。
【図5】本発明の第1の形態に係るビジョンチップの一
例におけるPEの結合処理を説明するための図である。
【図6】本発明の第1の形態に係るビジョンチップの一
例における累積演算処理を説明するための図である。
【図7】本発明の第1の形態に係るビジョンチップの一
例における総和演算処理を説明するための図である。
【図8】本発明の第1の形態に係るビジョンチップの一
例における多ビット演算処理を説明するための図であ
る。
【図9】本発明の第1の形態に係るビジョンチップの一
例におけるPEのブロック化処理を説明するための図
(その1)である。
【図10】本発明の第1の形態に係るビジョンチップの
一例におけるPEのブロック化処理を説明するための図
(その2)である。
【図11】本発明の第1の形態に係るビジョンチップの
一例におけるPEのブロック化処理を説明するための図
(その3)である。
【図12】本発明の第1の形態に係るビジョンチップの
一例におけるブロック内特徴量のフィードバック処理を
説明するための図である。
【図13】本発明の第1の形態に係るビジョンチップの
一例におけるその他の処理を説明するための図である。
【図14】本発明の第1の形態に係るビジョンチップの
一例を適用した並列ブロックマッチング処理を説明する
ための図である。
【図15】本発明の第1の形態に係るビジョンチップの
一例を適用した90度回転処理を説明するための図であ
る。
【図16】本発明の第1の形態に係るビジョンチップの
一例を適用した複数物体の同時トラッキング処理を説明
するための図である。
【図17】従来のビジョンチップの一例におけるフォト
ダイオード出力のA/D変換処理を実行するための構成
を説明するための図である。
【図18】図17のA/D変換処理における課題を説明
するための図である。
【図19】本発明の第2の形態に係るビジョンチップの
一例におけるフォトダイオード出力のA/D変換処理を
実行するための構成を説明するための図である。
【図20】図19の一構成例を示す図である。
【図21】図19および図20のA/D変換処理の動作
を説明するための図である。
【図22】本発明の第2の形態に係るビジョンチップが
適用されるシステムの構成例を示す図である。
【図23】図22のシステムにおけるフォトダイオード
出力のA/D変換処理を説明するための図(その1)で
ある。
【図24】図22のシステムにおけるフォトダイオード
出力のA/D変換処理を説明するための図(その2)で
ある。
【図25】図22のシステムにおけるフォトダイオード
出力のA/D変換処理を説明するための図(その3)で
ある。
【符号の説明】
1…半導体集積回路装置(ビジョンチップ) 2,32,102,302…プロセッシングエレメント
(PE) 11…デコーダ 12…出力回路 13…通信手段 20…状態レジスタ(3ビットのレジスタ) 21…列バス(COL) 22…行バス(ROW) 23,123〜125…データラッチ(Dラッチ) 27,1261〜1265…マルチプレクサ(MUX) 31,101,301…光検出器(PD) 33…リセット手段(リセット回路) 34…光検出素子(フォトダイオード) 35…コンパレータ 36,121…メモリ(ローカルメモリ) 37,122…I/Oポート 38,126…ALU 100…ユニット(画素) 1266…全加算器(FA) 1267…キャリー格納用レジスタ(D型フリップフロ
ップ:DFF) S0〜S5…命令(制御信号) Vref…基準電圧
───────────────────────────────────────────────────── フロントページの続き (72)発明者 鏡 慎吾 東京都荒川区町屋1−29−14 305 Fターム(参考) 4M118 AA10 AB01 CA03 5B045 AA01 GG12 GG14 5B057 AA20 BA02 BA29 CA02 CA08 CA12 CA16 CB02 CB08 CB12 CB16 CC01 CD03 CH03 DB02 DB05 DB09 DC32

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】 1つの半導体チップに設けられた複数の
    プロセッシングエレメントを有する半導体集積回路装置
    であって、 前記各プロセッシングエレメントの出力に設けられたラ
    ッチ手段と、 入力元を上下左右のいずれかのプロセッシングエレメン
    トまたは零信号から選択して出力する選択手段とを備え
    ることを特徴とする半導体集積回路装置。
  2. 【請求項2】 請求項1に記載の半導体集積回路装置に
    おいて、さらに、 前記各プロセッシングエレメントの座標位置情報に応じ
    て前記選択手段が選択するプロセッシングエレメントを
    制御する制御手段を備えることを特徴とする半導体集積
    回路装置。
  3. 【請求項3】 請求項1または2に記載の半導体集積回
    路装置において、該半導体集積回路装置は、リアルタイ
    ムの多ビット演算処理または累積演算処理を実行するこ
    とを特徴とする半導体集積回路装置。
  4. 【請求項4】 複数のプロセッシングエレメント、およ
    び、該プロセッシングエレメントをつなぐ通信手段を有
    する半導体集積回路装置であって、 第1のプロセッシングエレメントにおける資源を、前記
    通信手段を介して任意の第2のプロセッシングエレメン
    トの資源として使用することを特徴とする半導体集積回
    路装置。
  5. 【請求項5】 請求項4に記載の半導体集積回路装置に
    おいて、前記プロセッシングエレメントを複数結合し、
    プロセッシングエレメント群としてブロック化すること
    を特徴とする半導体集積回路装置。
  6. 【請求項6】 請求項5に記載の半導体集積回路装置に
    おいて、前記複数のプロセッシングエレメントを結合す
    るブロック化の構成およびサイズを動的に可変としたこ
    とを特徴とする半導体集積回路装置。
  7. 【請求項7】 請求項5に記載の半導体集積回路装置に
    おいて、前記各プロセッシングエレメントは、それぞれ
    近傍のプロセッシングエレメントとの接続を制御する接
    続制御手段を備えることを特徴とする半導体集積回路装
    置。
  8. 【請求項8】 複数の光検出回路および複数のプロセッ
    シングエレメントを有する半導体集積回路装置であっ
    て、前記各光検出回路は、光検出素子の出力と基準電圧
    とを比較する比較手段を備え、該比較手段の出力が該基
    準電圧を切るまでの時間をカウントしてA/D変換処理
    を行うことを特徴とする半導体集積回路装置。
  9. 【請求項9】 請求項8に記載の半導体集積回路装置に
    おいて、前記比較手段に与える基準電圧レベルを可変と
    したことを特徴とする半導体集積回路装置。
  10. 【請求項10】 請求項8に記載の半導体集積回路装置
    において、前記比較手段の出力が前記基準電圧を切るま
    での時間をカウントするカウント間隔を可変としたこと
    を特徴とする半導体集積回路装置。
  11. 【請求項11】 請求項8〜10のいずれか1項に記載
    の半導体集積回路装置において、該半導体集積回路装置
    は、1つの半導体チップとして構成されていることを特
    徴とする半導体集積回路装置。
JP2002017665A 2002-01-25 2002-01-25 半導体集積回路装置 Expired - Fee Related JP3902741B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2002017665A JP3902741B2 (ja) 2002-01-25 2002-01-25 半導体集積回路装置
US10/200,332 US7098437B2 (en) 2002-01-25 2002-07-23 Semiconductor integrated circuit device having a plurality of photo detectors and processing elements
US11/289,695 US8244788B2 (en) 2002-01-25 2005-11-30 Semiconductor integrated circuit device having a plurality of photo detectors and processing elements
US11/289,696 US7244919B2 (en) 2002-01-25 2005-11-30 Semiconductor integrated circuit device having photo detector circuits, processing elements, and comparing circuits which compare the output of a photo detector element with a reference voltage

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002017665A JP3902741B2 (ja) 2002-01-25 2002-01-25 半導体集積回路装置

Publications (2)

Publication Number Publication Date
JP2003218338A true JP2003218338A (ja) 2003-07-31
JP3902741B2 JP3902741B2 (ja) 2007-04-11

Family

ID=27606177

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002017665A Expired - Fee Related JP3902741B2 (ja) 2002-01-25 2002-01-25 半導体集積回路装置

Country Status (2)

Country Link
US (3) US7098437B2 (ja)
JP (1) JP3902741B2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006293419A (ja) * 2005-04-05 2006-10-26 Univ Of Tokyo 画像モーメントセンサ、画像モーメント計測装置、画像モーメントセンサの演算方法及び画像モーメント計測方法
JP2006313543A (ja) * 2005-05-02 2006-11-16 Pixart Imaging Inc 全画像を記録しなくても複数のオブジェクトを認識できる画像認識方法
JP2011508293A (ja) * 2007-11-30 2011-03-10 コグネックス・コーポレイション ビジョンセンサ、システムおよび方法
JP2013531838A (ja) * 2010-05-17 2013-08-08 コグネックス・コーポレイション 全体画像内で注意の焦点に関する画像データを処理するためのシステムと方法
WO2017122395A1 (ja) * 2016-01-12 2017-07-20 ソニー株式会社 画像データ処理回路および撮像回路
JP2018504040A (ja) * 2015-03-27 2018-02-08 レイセオン カンパニー 電流−周波数変換器
US10891706B2 (en) 2016-09-08 2021-01-12 Sony Corporation Arithmetic device and sensor to track movement of object between frames
JP2021511699A (ja) * 2018-01-18 2021-05-06 バルブ コーポレーション センサ集積回路を含むヘッドマウントディスプレイのためのポジショントラッキングシステム

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7383421B2 (en) 2002-12-05 2008-06-03 Brightscale, Inc. Cellular engine for a data processing system
US9330060B1 (en) * 2003-04-15 2016-05-03 Nvidia Corporation Method and device for encoding and decoding video image data
US8660182B2 (en) * 2003-06-09 2014-02-25 Nvidia Corporation MPEG motion estimation based on dual start points
US7218350B2 (en) * 2003-06-30 2007-05-15 Texas Instruments Incorporated Image sensor with digital output and inherent pixel non-uniformity suppression
US8553113B2 (en) * 2003-08-20 2013-10-08 At&T Intellectual Property I, L.P. Digital image capturing system and method
US8423597B1 (en) 2003-08-29 2013-04-16 Nvidia Corporation Method and system for adaptive matrix trimming in an inverse discrete cosine transform (IDCT) operation
US7126512B2 (en) * 2004-03-19 2006-10-24 Charles Douglas Murphy Comparing circuits for time-to-threshold A/D conversion in digital imaging arrays
US20080001736A1 (en) * 2004-06-09 2008-01-03 Koninklijke Philips Electronics N.V. Electronic Circuit
KR100646996B1 (ko) * 2004-06-16 2006-11-23 삼성에스디아이 주식회사 유기 발광 표시 장치 및 그 제어 방법
US20060129374A1 (en) * 2004-12-15 2006-06-15 Larson Lee A Apparatus and method for apparatus mediating voltage levels between an emulation unit and a target processor
US7451293B2 (en) * 2005-10-21 2008-11-11 Brightscale Inc. Array of Boolean logic controlled processing elements with concurrent I/O processing and instruction sequencing
US7659497B2 (en) * 2005-12-06 2010-02-09 International Business Machines Corporation On demand circuit function execution employing optical sensing
US8731071B1 (en) 2005-12-15 2014-05-20 Nvidia Corporation System for performing finite input response (FIR) filtering in motion estimation
US7488926B2 (en) * 2006-01-06 2009-02-10 Microsoft Corporation Pixel array with shared pixel output lines
US7671460B2 (en) * 2006-01-25 2010-03-02 Teledyne Licensing, Llc Buried via technology for three dimensional integrated circuits
KR100748319B1 (ko) * 2006-03-29 2007-08-09 삼성에스디아이 주식회사 유기발광표시장치 및 그의 구동방법
US8724702B1 (en) 2006-03-29 2014-05-13 Nvidia Corporation Methods and systems for motion estimation used in video coding
US8660380B2 (en) * 2006-08-25 2014-02-25 Nvidia Corporation Method and system for performing two-dimensional transform on data value array with reduced power consumption
US20080059764A1 (en) * 2006-09-01 2008-03-06 Gheorghe Stefan Integral parallel machine
US20080244238A1 (en) * 2006-09-01 2008-10-02 Bogdan Mitu Stream processing accelerator
US7436342B2 (en) * 2007-01-30 2008-10-14 Teledyne Licensing, Llc Numerical full well capacity extension for photo sensors with an integration capacitor in the readout circuit using two and four phase charge subtraction
US7498650B2 (en) * 2007-03-08 2009-03-03 Teledyne Licensing, Llc Backside illuminated CMOS image sensor with pinned photodiode
US7923763B2 (en) * 2007-03-08 2011-04-12 Teledyne Licensing, Llc Two-dimensional time delay integration visible CMOS image sensor
US8756482B2 (en) * 2007-05-25 2014-06-17 Nvidia Corporation Efficient encoding/decoding of a sequence of data frames
US20080291209A1 (en) * 2007-05-25 2008-11-27 Nvidia Corporation Encoding Multi-media Signals
US9118927B2 (en) * 2007-06-13 2015-08-25 Nvidia Corporation Sub-pixel interpolation and its application in motion compensated encoding of a video signal
US8873625B2 (en) 2007-07-18 2014-10-28 Nvidia Corporation Enhanced compression in representing non-frame-edge blocks of image frames
US7982775B2 (en) * 2007-08-02 2011-07-19 Texas Instruments Incorporated Method and apparatus for motion stabilization
US7795650B2 (en) * 2008-12-09 2010-09-14 Teledyne Scientific & Imaging Llc Method and apparatus for backside illuminated image sensors using capacitively coupled readout integrated circuits
US8666181B2 (en) * 2008-12-10 2014-03-04 Nvidia Corporation Adaptive multiple engine image motion detection system and method
ITCO20110022A1 (it) * 2011-06-30 2012-12-31 Fond Bruno Kessler Fotorilevatore
FR2991083A1 (fr) * 2012-05-24 2013-11-29 St Microelectronics Grenoble 2 Procede et dispositif de protection d'un circuit integre contre des attaques par sa face arriere
US9798698B2 (en) 2012-08-13 2017-10-24 Nvidia Corporation System and method for multi-color dilu preconditioner
JP6633330B2 (ja) * 2014-09-26 2020-01-22 株式会社半導体エネルギー研究所 半導体装置
CN105962922B (zh) 2016-04-19 2018-11-27 矽力杰半导体技术(杭州)有限公司 光电传感器、光电检测方法以及应用其的心率检测设备
CN105953823B (zh) 2016-04-21 2018-12-18 矽力杰半导体技术(杭州)有限公司 环境光滤除电路、光电传感器及应用其的光电检测设备
CN105910632B (zh) 2016-04-21 2018-10-26 矽力杰半导体技术(杭州)有限公司 光电检测设备和集成电路
KR101941892B1 (ko) * 2017-03-23 2019-01-28 고려대학교 산학협력단 대비 감도 향상을 위한 인공 망막 시스템
WO2021212045A1 (en) * 2020-04-17 2021-10-21 SiMa Technologies, Inc. Synchronization of processing elements and software managed memory hierarchy in a machine learning accelerator

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3855589A (en) * 1969-11-25 1974-12-17 Sylvania Electric Prod Analog to digital converter with variable quantization and dynamic range
US4215401A (en) * 1978-09-28 1980-07-29 Environmental Research Institute Of Michigan Cellular digital array processor
US4380046A (en) * 1979-05-21 1983-04-12 Nasa Massively parallel processor computer
US4593351A (en) * 1981-06-12 1986-06-03 International Business Machines Corporation High speed machine for the physical design of very large scale integrated circuits
US4524428A (en) * 1982-01-26 1985-06-18 Hughes Aircraft Company Modular input-programmable logic circuits for use in a modular array processor
JPS61208561A (ja) 1985-03-13 1986-09-16 Agency Of Ind Science & Technol 並列デ−タ処理装置
US6108763A (en) * 1986-09-18 2000-08-22 Grondalski; Robert S. Simultaneous parity generating/reading circuit for massively parallel processing systems
US4985832A (en) * 1986-09-18 1991-01-15 Digital Equipment Corporation SIMD array processing system with routing networks having plurality of switching stages to transfer messages among processors
US5027117A (en) * 1988-03-31 1991-06-25 Ricoh Company, Ltd. Conversion using a variable reference based on image density
JP2930341B2 (ja) * 1988-10-07 1999-08-03 マーチン・マリエッタ・コーポレーション データ並列処理装置
US5253308A (en) * 1989-06-21 1993-10-12 Amber Engineering, Inc. Massively parallel digital image data processor using pixel-mapped input/output and relative indexed addressing
EP0541534A1 (en) * 1990-08-03 1993-05-19 Du Pont Pixel Systems Limited Data-array processing systems
US5689719A (en) * 1991-06-28 1997-11-18 Sanyo Electric O., Ltd. Parallel computer system including processing elements
US5252308A (en) * 1991-12-31 1993-10-12 Union Oil Company Of California Transporting urea for quantitative conversion into ammonia
KR100186918B1 (ko) 1994-10-21 1999-05-01 모리시다 요이치 신호처리장치
JP3639014B2 (ja) 1994-10-21 2005-04-13 松下電器産業株式会社 信号処理装置
US6118901A (en) * 1997-10-31 2000-09-12 National Science Council Array architecture with data-rings for 3-step hierarchical search block matching algorithm
US6608296B1 (en) * 1998-10-07 2003-08-19 Hamamatsu Photonics K.K. High-speed vision sensor having a parallel processing system
EP1164544B1 (en) * 1999-03-16 2011-11-02 Hamamatsu Photonics K.K. High-speed vision sensor
FR2791155B1 (fr) * 1999-03-17 2001-05-11 St Microelectronics Sa Dispositif et procede de mise en oeuvre d'une operation modulaire elementaire selon la methode de montgomery
US7158183B1 (en) * 1999-09-03 2007-01-02 Nikon Corporation Digital camera
AU7555900A (en) * 1999-10-04 2001-05-10 Hamamatsu Photonics K.K. Camera system for high-speed image processing
US6525304B1 (en) * 2000-11-28 2003-02-25 Foveon, Inc. Circuitry for converting analog signals from pixel sensor to a digital and for storing the digital signal
US6642503B2 (en) * 2001-06-13 2003-11-04 Texas Instruments Incorporated Time domain sensing technique and system architecture for image sensor

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006293419A (ja) * 2005-04-05 2006-10-26 Univ Of Tokyo 画像モーメントセンサ、画像モーメント計測装置、画像モーメントセンサの演算方法及び画像モーメント計測方法
JP4565122B2 (ja) * 2005-04-05 2010-10-20 国立大学法人 東京大学 画像モーメントセンサ、画像モーメント計測装置、画像モーメントセンサの演算方法及び画像モーメント計測方法
JP2006313543A (ja) * 2005-05-02 2006-11-16 Pixart Imaging Inc 全画像を記録しなくても複数のオブジェクトを認識できる画像認識方法
JP2011508293A (ja) * 2007-11-30 2011-03-10 コグネックス・コーポレイション ビジョンセンサ、システムおよび方法
JP2016192224A (ja) * 2010-05-17 2016-11-10 コグネックス・コーポレイション 全体画像内で注意の焦点に関する画像データを処理するためのシステムと方法
JP2015143990A (ja) * 2010-05-17 2015-08-06 コグネックス・コーポレイション 全体画像内で注意の焦点に関する画像データを処理するためのシステムと方法
JP2013531838A (ja) * 2010-05-17 2013-08-08 コグネックス・コーポレイション 全体画像内で注意の焦点に関する画像データを処理するためのシステムと方法
JP2018504040A (ja) * 2015-03-27 2018-02-08 レイセオン カンパニー 電流−周波数変換器
WO2017122395A1 (ja) * 2016-01-12 2017-07-20 ソニー株式会社 画像データ処理回路および撮像回路
US10572967B2 (en) 2016-01-12 2020-02-25 Sony Corporation Image data processing circuit and imaging circuit
US10891706B2 (en) 2016-09-08 2021-01-12 Sony Corporation Arithmetic device and sensor to track movement of object between frames
JP2021511699A (ja) * 2018-01-18 2021-05-06 バルブ コーポレーション センサ集積回路を含むヘッドマウントディスプレイのためのポジショントラッキングシステム
JP7207809B2 (ja) 2018-01-18 2023-01-18 バルブ コーポレーション センサ集積回路を含むヘッドマウントディスプレイのためのポジショントラッキングシステム

Also Published As

Publication number Publication date
US20060081765A1 (en) 2006-04-20
JP3902741B2 (ja) 2007-04-11
US7098437B2 (en) 2006-08-29
US7244919B2 (en) 2007-07-17
US20030141434A1 (en) 2003-07-31
US20060081767A1 (en) 2006-04-20
US8244788B2 (en) 2012-08-14

Similar Documents

Publication Publication Date Title
JP2003218338A (ja) 半導体集積回路装置
US20180046900A1 (en) Sparse convolutional neural network accelerator
Komuro et al. A dynamically reconfigurable SIMD processor for a vision chip
Kyrkou et al. A parallel hardware architecture for real-time object detection with support vector machines
Moussalli et al. Fast and flexible conversion of geohash codes to and from latitude/longitude coordinates
CN115461712A (zh) 用于存储器内计算的可缩放阵列架构
US11461651B2 (en) System on a chip with deep learning accelerator and random access memory
US10404930B2 (en) Pixel processing apparatus of processing bad pixel and removing noise, and image signal processing apparatus and image processing system each including the same
US20200082246A1 (en) Scalable multi-die deep learning system
Zhang et al. PIMCA: A programmable in-memory computing accelerator for energy-efficient DNN inference
CN108364298B (zh) 用于将像素识别为局部极值点的方法和布置
WO1999063751A1 (en) Low-power parallel processor and imager integrated circuit
WO2022015967A1 (en) High endurance memory circuitry
Yousefzadeh et al. Energy-efficient in-memory address calculation
US20220350863A1 (en) Technology to minimize the negative impact of cache conflicts caused by incompatible leading dimensions in matrix multiplication and convolution kernels without dimension padding
US20230105329A1 (en) Image signal processor and image sensor including the image signal processor
Kondo et al. Pseudo MIMD array processor—AAP2
Dudek A flexible global readout architecture for an analogue SIMD vision chip
Vink et al. Caffe barista: Brewing caffe with fpgas in the training loop
US11907118B2 (en) Interleaved data conversion to change data formats
Landis et al. Evaluation of computing in memory architectures for digital image processing applications
Kim et al. An augmented reality processor with a congestion-aware network-on-chip scheduler
US20230385624A1 (en) Computing in memory with artificial neurons
US11385873B2 (en) Control speculation in dataflow graphs
EP4318326A2 (en) Unified programming interface for regrained tile execution

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051213

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060210

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060912

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20061101

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20061205

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070104

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110112

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120112

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130112

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130112

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees