JP2003218338A - 半導体集積回路装置 - Google Patents
半導体集積回路装置Info
- Publication number
- JP2003218338A JP2003218338A JP2002017665A JP2002017665A JP2003218338A JP 2003218338 A JP2003218338 A JP 2003218338A JP 2002017665 A JP2002017665 A JP 2002017665A JP 2002017665 A JP2002017665 A JP 2002017665A JP 2003218338 A JP2003218338 A JP 2003218338A
- Authority
- JP
- Japan
- Prior art keywords
- integrated circuit
- semiconductor integrated
- circuit device
- processing
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000004065 semiconductor Substances 0.000 title claims abstract description 105
- 238000012545 processing Methods 0.000 claims abstract description 153
- 238000000034 method Methods 0.000 claims description 53
- 238000006243 chemical reaction Methods 0.000 claims description 49
- 230000008569 process Effects 0.000 claims description 40
- 238000004891 communication Methods 0.000 claims description 24
- 230000001186 cumulative effect Effects 0.000 claims description 21
- 238000010168 coupling process Methods 0.000 claims description 6
- 238000005859 coupling reaction Methods 0.000 claims description 6
- 230000008878 coupling Effects 0.000 claims description 5
- 230000015654 memory Effects 0.000 description 61
- 238000010586 diagram Methods 0.000 description 46
- 238000004364 calculation method Methods 0.000 description 36
- 230000006870 function Effects 0.000 description 16
- 238000001514 detection method Methods 0.000 description 13
- 238000013139 quantization Methods 0.000 description 11
- 230000000903 blocking effect Effects 0.000 description 6
- 230000008859 change Effects 0.000 description 6
- 238000013461 design Methods 0.000 description 6
- 239000011159 matrix material Substances 0.000 description 5
- 230000000007 visual effect Effects 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 102100033040 Carbonic anhydrase 12 Human genes 0.000 description 1
- 101000867855 Homo sapiens Carbonic anhydrase 12 Proteins 0.000 description 1
- 101000680262 Homo sapiens Transmembrane protein 60 Proteins 0.000 description 1
- OFFWOVJBSQMVPI-RMLGOCCBSA-N Kaletra Chemical compound N1([C@@H](C(C)C)C(=O)N[C@H](C[C@H](O)[C@H](CC=2C=CC=CC=2)NC(=O)COC=2C(=CC=CC=2C)C)CC=2C=CC=CC=2)CCCNC1=O.N([C@@H](C(C)C)C(=O)N[C@H](C[C@H](O)[C@H](CC=1C=CC=CC=1)NC(=O)OCC=1SC=NC=1)CC=1C=CC=CC=1)C(=O)N(C)CC1=CSC(C(C)C)=N1 OFFWOVJBSQMVPI-RMLGOCCBSA-N 0.000 description 1
- 101100136062 Mycobacterium tuberculosis (strain ATCC 25618 / H37Rv) PE10 gene Proteins 0.000 description 1
- 102100022076 Transmembrane protein 60 Human genes 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003708 edge detection Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- ORQBXQOJMQIAOY-UHFFFAOYSA-N nobelium Chemical compound [No] ORQBXQOJMQIAOY-UHFFFAOYSA-N 0.000 description 1
- 230000003071 parasitic effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 210000001525 retina Anatomy 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 230000031893 sensory processing Effects 0.000 description 1
- 239000004149 tartrazine Substances 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
- 230000003936 working memory Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01J—MEASUREMENT OF INTENSITY, VELOCITY, SPECTRAL CONTENT, POLARISATION, PHASE OR PULSE CHARACTERISTICS OF INFRARED, VISIBLE OR ULTRAVIOLET LIGHT; COLORIMETRY; RADIATION PYROMETRY
- G01J1/00—Photometry, e.g. photographic exposure meter
- G01J1/42—Photometry, e.g. photographic exposure meter using electric radiation detectors
- G01J1/4228—Photometry, e.g. photographic exposure meter using electric radiation detectors arrangements with two or more detectors, e.g. for sensitivity compensation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N25/00—Circuitry of solid-state image sensors [SSIS]; Control thereof
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01J—MEASUREMENT OF INTENSITY, VELOCITY, SPECTRAL CONTENT, POLARISATION, PHASE OR PULSE CHARACTERISTICS OF INFRARED, VISIBLE OR ULTRAVIOLET LIGHT; COLORIMETRY; RADIATION PYROMETRY
- G01J1/00—Photometry, e.g. photographic exposure meter
- G01J1/02—Details
- G01J1/0204—Compact construction
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Image Processing (AREA)
- Image Analysis (AREA)
- Solid State Image Pick-Up Elements (AREA)
Abstract
プロセッサ等においては、PEの性能と画素数の間にト
レードオフの関係が存在し、より汎用性の高い半導体集
積回路装置の提供を困難にさせている。 【解決手段】 1つの半導体チップに設けられた複数の
プロセッシングエレメント2を有する半導体集積回路装
置であって、前記各プロセッシングエレメントの出力に
設けられたラッチ手段23と、入力元を上下左右のいず
れかのプロセッシングエレメントまたは零信号から選択
して出力する選択手段27とを備えるように構成する。
Description
に関し、特に、複数の光検出器(PD:Photo Detecto
r)およびプロセッシングエレメント(PE: Processi
ng Element(演算処理回路))を備えたビジョンチップ
に関する。
は、従来より研究、開発および提案がなされており、そ
の多くはなんらかの並列演算を行う機構を備えている。
例えば、並列度が数万にのぼる超並列プロセッサでは、
少数または1つの画素毎にPE(プロセッシングエレメ
ント)を割り当て、それら複数のPEに対して同時に同
一の命令を実行させるというSIMD(Single Instruc
tion Stream Multi Data Stream)型の制御を行うこと
で、ある種の画像処理を効率よく実行できる。
はスーパーコンピュータクラスの大規模なものがほとん
どであったが、近年、半導体集積化技術の進歩に伴っ
て、さらに、画像処理を手軽に扱いたいというニーズの
高まりから、これを1チップ化する動きが進んでいる。
さらに、プロセッサだけでなく、PD(光検出器;光検
出回路,光検出素子)までも1チップに収めたビジョン
チップと呼ばれるデバイスの研究も注目を集めている。
理用SIMDプロセッサ(半導体集積回路装置)におい
ては、PEの性能と画素数の間にトレードオフの関係が
存在し、より汎用性の高い半導体集積回路装置の提供を
困難にさせている。また、グローバル演算に不向きな構
造であったため、2次元パターンからスカラー量を抽出
する処理を効率よく行うことができなかった。
採用されていたALUは、単に各PE内のデータのみに
基づいて演算を行うものか、或いは、隣接PEからの出
力が直接ALUの入力とするものであるため、実現でき
る演算機能が自身とその周囲のPEから演算を行うロー
カルな演算に限られている。ビジョンチップの均質な配
列構造を崩さずにグローバル演算を行うには、例えば、
新たに加算器等の付加回路が必要となって回路規模が大
きくなってしまう。これは、限られたチップ面積上にな
るべく多くの画素を配置するビジョンチップに対する回
路規模をできるだけ小さくするという要求に相反する。
の演算能力や搭載されているメモリの量が有限であるこ
とが、実現できる処理の範囲を制限することになってい
る。そして、ビジョンチップの汎用性を増すために、演
算能力や搭載するメモリの容量を増やすと、今度は回路
面積が肥大化してしまうというジレンマがある。
低下を来すことなく、高い汎用性を有する半導体集積回
路装置の提供が要望されている。
た半導体集積回路装置(ビジョンチップ)の設計におい
ては、PEの性能と画素数のトレードオフポイントが固
定であったため、想定されるあらゆる用途に対応できる
ように設計を行うと、通常の用途に対しては冗長になっ
てしまった。また、従来の半導体集積回路装置はグロー
バル演算に不向きな構造であるため、画像処理のリアル
タイム応用に必須の2次元パターンからスカラー量を抽
出する処理を効率よく行うことができなかった。
あり、図2は従来のビジョンチップのアーキテクチャを
説明するための図である。
は、光学系(例えば、レンズ)を介して与えられた画像
(入力画像)をマトリクス状に配置された複数のユニッ
ト(画素)100で検出および処理して出力する。
は、マトリクス状に配置された複数のユニット100、
デコーダ11、出力回路12、および、通信手段13を
備えた1つの半導体チップとして構成される。デコーダ
11には、命令INSTおよびクロックCLK等が入力
され、通信手段13を介してデコードされた信号を各ユ
ニット100に供給し、また、出力回路12は、通信手
段13を介して供給される各ユニット100で検出およ
び処理された信号を外部に出力する。
検出回路,光検出素子)101およびプロセッシングエ
レメント(PE)102を備える。図2に示すビジョン
チップ1(PE102)は、アーキテクチャS3PE(S
imple and Smart Sensory Processing Element)に従っ
たもので、センサ(PD101)とプロセッサ(PE1
02)の一体化により、それらの間の通信ボトルネック
を解消し、1秒間に1000枚を超える高フレームレー
トを実現するものである。このような高いフレームレー
トを有するビジョンチップは、視覚情報を用いたフィー
ドバック制御を容易に実現し、また、ロボットビジョン
等の分野で画像処理のリアルタイム応用を促進するもの
として期待されている。ここで、ビジョンチップのアー
キテクチャS3PEを概説する。
メモリ、122はI/Oポート、123〜125はデー
タラッチ(Dラッチ)、そして、126はALU(Arit
hmetic and Logic Unit)を示している。
は、PE(プロセッシングエレメント)102が画素数
分マトリクス状に配列され、各PE102にはPD(光
検出器)101が取り付けられている。PE102は、
主としてALU126およびローカルメモリ121を備
える。ALU126は、全加算器、キャリー格納用レジ
スタ、および、いくつかのマルチプレクサを備える簡単
な構成とされ、論理演算と算術演算を共通の回路で実行
する。なお、演算はビット単位で行われ、多ビットデー
タの演算は繰り返し処理によりビットシリアルに実行す
る。
ンダムアクセスメモリ(RAM)に加え、8ビットのI
/Oポート(8ビットの Memory-mapped Input/Output
ポート)122が同一のアドレス空間に割り当てられて
いる。これらは、ビット単位でランダムにアクセスする
ことが可能となっている。I/Oポート122は、上下
左右の4近傍との通信、PD101からの入力、およ
び,零信号(”0”)と接続されている。このメモリマ
ップI/O方式(122)の採用により、演算だけでな
く入出力を含めた全ての処理をローカルメモリ121ヘ
のアクセスで行うようになっている。
alog to Digital)変換は、光電流による蓄積電荷の放
電をしきい値回路(インバータ)で検出し、そのしきい
値を切るまでの時間を計測して行っている。その際、P
E102をカウンタとして用いることにより、回路を増
やすことなくA/D変換を実現している。
式を用いており、全ての画素(PE102)に対し、同
時に同一の命令が実行されるため、画像の局所性を利用
したアルゴリズム、すなわち、画素自身とその周辺の画
素から値が決定されるようなアルゴリズムが極めて効率
的に実行できる。例えば、初期視覚処理と呼ばれるもの
のほとんどはこのようなアルゴリズムで実現できる。初
期視覚処理は、画像処理のリアルタイム応用において、
特徴抽出・認識を行う前の画像の前処理として用いられ
る。なお、この初期視覚処理アルゴリズムを実装したと
ころ、どれもμsオーダーの演算時間に収めることがで
きた。このことから、ビジョンチップが実現する高いフ
レームレートに見合う演算能力を持っていることがわか
る。
づき、0.35μmCMOSプロセスを用いたフルカス
タム設計を行った結果、各PEあたりトランジスタ数で
約400個、面積で105μm×105μmというコン
パクトな回路に収まり、この設計を基に、64×64画
素を1チップ上に集積したビジョンチップを試作したと
ころ、チップ面積は8.7mm×8.7mmとなった。
も、汎用のPEを利用したビジョンチップがいくつか作
られている。例えば、スウェーデンの Linkoping 大学
では光センサとA/DコンバータおよびPEアレイを1
チップ化したビジョンチップの研究が行なわれ、IVP
社より製品化された。また、その MAPP2200 と呼ばれる
ビジョンチップは、256×256画素のCMOSイメ
ージセンサの列毎にA/Dコンバータと汎用のPEが取
り付けられている。さらに、同研究グループは、画素単
位で並列演算を行うビジョンチップ Near-Sensor Image
Processing(NSIP)の研究も行っており、32×
32画素のチップが開発されている。また、フランスの
Bernard らは Programmable Artificial Retina と呼
ばれる汎用のPEを採用したビジョンチップを設計して
おり、65×76画素(後に、128×128画素)の
チップが開発されている。
が、1画素を1つのPEが処理する画素単位のSIMD
プロセッサとして、Gealow らによる Pixel-Parallel I
mageProcessor があり、64×64=4096個のPE
が1チップに収められている。同種のアプローチとし
て、Gayles らによるMGAP−2もあり、49152
個のPEが32チップ構成で実現されている。
来、様々なビジョンチップが研究、開発および提案され
ているが、従来のビジョンチップの設計においては、な
るべくPE(102)の回路を小さくする必要から、P
Eの性能は用途に対して最低限のものでなくてはならな
かった。ここで、PEの性能とは、主に演算機能とメモ
リ容量を指す。演算機能の充実はアルゴリズムの実行速
度の向上につながり、また、メモリ容量の増加は実行で
きるアルゴリズムの範囲を広げることにつながる。特
に、メモリ容量はビジョンチップを設計する上で重要な
項目であり、ビジョンチップの適用範囲を決めることに
もなる。
路装置)は、実行させたいアルゴリズムの範囲を広げよ
うとすればするほど、すなわち、汎用性を高めようとす
ればするほど、例えば、大容量のメモリが必要となって
各PEの回路面積が増加することになる。この各PEの
回路面積の増加は、そのまま1チップに集積できる画素
数(PEの数)の減少につながる。このように、ビジョ
ンチップにおいて、汎用性と画素数との間にトレードオ
フの関係が存在し、ビジョンチップを設計する上でジレ
ンマとなっている。
採用している2Dメッシュネットワーク構造(通信手段
13:上下左右の四方向とのみ接続するもの)は、グロ
ーバル演算に不向きであるということである。この構造
は、例えば、エッジ検出のように、ある画素の値がその
画素自身とその周辺の画素からのみ決定されるような局
所的な演算に対しては非常に強力であるが、遠く離れた
画素の情報を利用するような演算には、その距離分の通
信時間がかかってしまう。
をはじめとする従来のビジョンチップおよびSIMDプ
ロセッサでは、効果的な解決策を提示できていなかっ
た。また、MGAP−2やいくつかのSIMDプロセッ
サでは、コンディションレジスタを利用したPEの結合
機能を持ち、前者の問題に対処しているが、結合がレジ
スタを介した擬似的なものであるため、結合PE数分の
段数のパイプライン処理が必要となる。これは、段数が
多くなった場合に効率が悪く、好ましくない。さらに、
後者の問題に対する解決とはなっていない。また、NS
IPで採用されているGLUや、高速対象追跡ビジョン
チップで使われているモーメント抽出回路は、後者の問
題を部分的に解決しているが、これらは画像全体に対す
る固定した処理であり、より高度なアルゴリズムを実装
したい場合には柔軟性が不足している。
例えば、ロボットビジョンに必要不可欠な入力画像の特
徴抽出や画像認識といった処理を十分に実現することが
困難である。
導体集積回路装置が有する課題に鑑み、画素数の低下を
来すことなく(PEの占有面積の増大を来すことな
く)、高い汎用性を有する半導体集積回路装置の提供を
目的とする。本発明の第2の形態は、光検出器の出力信
号のA/D変換を追加回路なしで行うと共に、柔軟なセ
ンシングを実現することのできる半導体集積回路装置の
提供を目的とする。
れば、1つの半導体チップに設けられた複数のプロセッ
シングエレメントを有する半導体集積回路装置であっ
て、前記各プロセッシングエレメントの出力に設けられ
たラッチ手段と、入力元を上下左右のいずれかのプロセ
ッシングエレメントまたは零信号から選択して出力する
選択手段とを備えることを特徴とする半導体集積回路装
置が提供される。
のプロセッシングエレメント、および、該プロセッシン
グエレメントをつなぐ通信手段を有する半導体集積回路
装置であって、第1のプロセッシングエレメントにおけ
る資源を、前記通信手段を介して任意の第2のプロセッ
シングエレメントの資源として使用することを特徴とす
る半導体集積回路装置も提供される。
出回路および複数のプロセッシングエレメントを有する
半導体集積回路装置であって、前記各光検出回路は、光
検出素子の出力と基準電圧とを比較する比較手段を備
え、該比較手段の出力が該基準電圧を切るまでの時間を
カウントしてA/D変換処理を行うことを特徴とする半
導体集積回路装置が提供される。
装置は、これまでのアーキテクチャに若干の変更を加え
るだけで、複数のPE(プロセッシングエレメント)を
結合して1つの大きなPEとして扱うことが可能であ
り、これにより、PEの性能と画素数(搭載可能なPE
の数)のトレードオフポイントが可変になり、効率よく
資源を利用することができる。さらに、本発明の第1の
形態に係る半導体集積回路装置によれば、結合されたP
Eの中で総和やブロードキャスト等のグローバル演算を
実行することができ、特徴量フィードバックを実現する
ことが可能になる。
ットシリアルALUに、PE間通信の機能だけでなく、
PE間を回路的に連結する機能を付加することで、累積
演算や多ビット演算を実現する。これにより、画像全体
の総和を計算するようなグローバルな演算を、新たに加
算器等の回路を追加することなく実行することができる
ようになる。さらに、結合の組合せを変えることによ
り、複数のPEを用いて多ビット演算を実行することも
でき、個々のPEの能力を集めてひとつの強力なプロセ
ッサとして利用することも可能になる。
れかのPEまたは零信号からPE毎に選択できるように
することで、複数のPEを縦続接続してブロック化する
ことができる。ブロックの指定には、列バスおよび行バ
スを通じて行なわれるか、或いは、内部データから生成
される。このとき、n個のPEが接続されたブロックに
おいては、n個のALUが結合されnビットALUとし
て振る舞わせることが可能であり、n個のデータの総和
・AND・OR・XORおよびnビットデータ同士の加
減算等を一度に計算することができる。また、メモリ素
子も、例えば、1ビットメモリを24個持つPEをn個
結合することで、nビットが1ワードのメモリが24個
使用可能になる。従って、ブロックのサイズを大きくす
ることで、素子を無駄にすることなく、ブロックの演算
能力を高めることができる。
装置は、光検出素子(光検出器PDの画素値)の出力の
A/D変換を、ソフトウェアを用いて行うことにより、
柔軟で能動的な画像センシングを実現することができ
る。ここで、A/D変換を、ソフトウェアを用いて行う
とは、フォトダイオードに光が照射されて電荷が次第に
抜けるのを比較手段(コンパレータ)で観測し、電圧が
基準電圧(しきい値)を切るまでの時間をプロセッシン
グエレメント(PE)でカウントすることであり、カウ
ントの際の時間の刻み幅をプログラムで可変にすること
により、或いは、基準電圧を可変にすることにより、ア
ナログ量の量子化の区間割り当てを任意に実現する。ま
た、リセットのタイミングをローカルに可変にすること
で、広ダイナミックレンジと高フレームレートを両立し
た撮像が可能になる。
チップのみならず、一般のイメージセンサ、或いは、広
く複数のプロセッシングエレメント(演算処理回路)を
有する半導体集積回路装置に対しても適用することがで
き、その性能を大幅に向上することが可能である。
路装置(ビジョンチップ)の実施例を、添付図面を参照
して詳述する。
チップの一例のアーキテクチャを説明するための図であ
る。図3において、参照符号2はPE(図2におけるプ
ロセッシングエレメント102に対応)、121はロー
カルメモリ、122はI/Oポート、123,124は
データラッチ(Dラッチ)、そして、126はALUを
示している。さらに、参照符号20は3ビットのレジス
タ(状態レジスタ)、21は列バス(COL)、22は
行バス(ROW)、そして、23はDラッチを示してい
る。
図2に示されるように、画素数分マトリクス状に配列さ
れ、それぞれPD(光検出器101)が取り付けられて
ビジョンチップ1を構成する。PE2は、主としてAL
U126およびローカルメモリ121を備える。ALU
126は、マルチプレクサ1261〜1265、全加算
器(FA:Full Adder)1266、および、D型フリッ
プフロップ(キャリー格納用レジスタ)1267を備え
る。ここで、各マルチプレクサ1261〜1265は、
命令(制御信号)S0〜S5で制御することにより指定
され、論理演算と算術演算を同一の回路で実行するよう
になっている。
S3PE102に対して、座標依存値を送るための列バ
ス21および行バス22の共通バスが設けられている。
また、状態レジスタ20の出力は、マルチプレクサ27
に供給され、近傍通信の入力元が上下左右のいずれかの
PEまたは零信号(上下左右零のいずれか)から選択さ
れてALU126(マルチプレクサ1263)に供給さ
れるようになっている。すなわち、メモリ空間上に用意
された状態レジスタ20(3ビットのレジスタ)の内容
によって、マルチプレクサ27を制御して近傍通信の入
力先を上下左右零のいずれにするかを選択できるように
なっている。ここで、マルチプレクサ27が零を選択す
るのは、マルチプレクサ27の出力(ALU126の入
力)を遮断して、例えば、始点となるPEの指定等を行
う。さらに、マルチプレクサ1265の出力は、ローカ
ルメモリ121に供給されると共に、Dラッチ23に格
納されて他のPEに出力されるようになっている。すな
わち、近傍通信の出力先は、ラッチ(Dラッチ23)に
なっている。
ップフロップではなくラッチ(Dラッチ)23を介して
出力されるように構成されているのは、フリップフロッ
プではクロックCLK(例えば、クロックCLKの立ち
上がりタイミング)を待つ必要があるのに対して、ラッ
チ23ではイネーブル信号Nenの入力(高レベル
『H』)によりそのまま出力信号を他のPE(ALU)
に伝えることができるからである。すなわち、例えば、
PE2aのALU126aの出力をDラッチ23a、お
よび、PE2bのマルチプレクサ27b(1263b)
を介してPE2bのALU126b(全加算器1266
b)に接続することにより、1つのモジュール(機能ブ
ロック)として使用し、リアルタイムの処理を行うこと
ができる。
した図2のS3PE102と同様であり、A,Bの二つ
のデータをローカルメモリ121から読み出して演算を
実行した後、結果をローカルメモリ121に書き込む。
算術命令の場合は、結果書き込みの後にキャリー格納用
レジスタ1267を更新する。なお、A,Bのデータが
前回と同じ場合は読み出し処理を省略することができ、
通常演算において実行できる演算の種類は、図2のS3
PE102で実行できる演算と同じである。
124をイネーブル信号Aenにより一瞬イネーブルに
して、一方のオペランド(A)をローカルメモリ121
から読み込む。次に、Dラッチ123をイネーブル信号
Benにより一瞬イネーブルにして、他方のオペランド
(B)をメモリ121から読み込む。命令の種類を指定
すると、演算結果が計算されるので、その演算結果をメ
モリ121へ格納する。
出力が全加算器1266の入力につながっていること
で、多ビットの加減算を1ビット単位で行うビットシリ
アル演算を実現する。ここで、キャリー格納用レジスタ
1267は、クロックCLKによりキャリー値を更新す
るようになっている。また、マルチプレクサ1263に
与える制御信号S5を高レベル『H』(”1”)にする
ことにより、演算のオペランドの一方を近傍入力(マル
チプレクサ27の出力)に切り換えることができる。
U126の演算結果であり、Dラッチ23をイネーブル
信号Nenで一瞬イネーブルにすることにより更新され
る。このとき、制御信号S5が高レベル『H』になって
いると、全加算器1266の出力が隣接PEの全加算器
の入力に直接(レジスタを介さずに)つながることにな
り、全加算器が縦続接続される。これを利用すること
で、累積演算や多ビット演算を実現する。
な処理にも対応できるビジョンチップを実現することが
できる。
(プロセッシングエレメント)のブロック化処理を実行
するための構成を説明するための図であり、図3におけ
る主たる構成(列バス21、行バス22、ローカルメモ
リ121、I/Oポート122、状態レジスタ20、お
よび、マルチプレクサ27)を概略的に示すブロック図
である。
ルメモリ121にマップされている)状態レジスタ20
の内容によって、ALU126に供給される近傍入力元
を上側のPE,下側のPE,左側のPE,右側のPE,
或いは,零信号のいずれかから各PE毎に(ローカル
に)選択できるようになっている。また、列バス21お
よび行バス22が設けられており、各PE(2)に座標
情報を送信する機構を備えている。
の一例のアーキテクチャによれば、PE同士を結合し、
1つの大きなPEとみなすことにより、演算機能やメモ
リ容量等を高めることができる。また、近傍通信の入力
先をローカルに変えることで、さまざまな結合の形を作
ることができる。すなわち、後述するように、可変粒度
プロセッサや列並列プロセッサのエミュレーション等が
実現される。結合されたPEの中で実行できる演算とし
ては、例えば、累積演算および多ビット演算がある。
チップの一例におけるPEの結合処理を説明するための
図であり、左右(行方向)に隣接するPEの結合を示す
ブロック図である。
隣接する2つのプロセッシングエレメント(PE)2a
および2bは、PE2aのラッチ23aを介してALU
126aと126bが直接接続されて隣接するPE同士
の結合が実現される。このようにして結合されたPE群
は、累積演算(総和演算や全OR演算等)や多ビット演
算を実行するために使用される。
チップの一例における累積演算処理を説明するための図
であり、図6は上述した図5に対応している。
データをメモリ(121)から読み出してラッチ(12
4)に格納し、全加算器(1266)にデータA(A
(i), A(i+1), …)として供給する。次に、マルチプレ
クサ(1263)の制御信号S5を高レベル『H』(”
1”)としてマルチプレクサ(27)の出力を選択し、
データBとして全加算器(1266)に供給する。この
とき、マルチプレクサ(27)はラッチ(20)の出力
により、例えば、左側のPEの出力を選択して出力す
る。さらに、全加算器(1266)の出力(演算結果:
W(i), W(i+1), …)をメモリ(121)に格納する。な
お、必要に応じて、キャリー格納用レジスタ(126
7)を更新する。
ルチプレクサ1263aの制御信号S5を”1”にした
状態で、ラッチ23aのイネーブル信号Nenを”1”
にする(イネーブルにする)ことで、全加算器1266
aの和出力が次段の全加算器1266bの入力に直接接
続され、累積演算を実行することができる。すなわち、
同様に、近傍出力(例えば、左側のPE(2a)のAL
U(126a)の出力)を隣接PE(2b)のALU
(126b)の入力に直接に入力することで、演算器を
多段となるように構成し、累積演算を実現する。
S2,S3,S4,S5]をそれぞれ[1,x,0,
0,1,x]とした場合の例であり、累積加算器が構成
される。これにより、ひとまとまりのPEからのデータ
の総和を計算することができる。演算の種類を変えるこ
とで、全OR・全AND等も計算することができる。
ORになり、また、加算にすれば総和になる。総和の場
合は、最下位ビットから順にビットシリアルに計算する
ことになる。全ORを用いることで、ブロック内のデー
タのブロードキャストを実現することができる。
チップの一例における総和演算処理を説明するための図
であり、N=4,m=2で、11+10+01+00の
総和(11+10+01+00=0110)が計算され
る。ここで、前述したように、各PEの出力は、ラッチ
(Dラッチ23)を介して隣接する(右側の)PEに供
給されるようになっているため、1つのモジュールとし
て1命令で総和演算を実行することができる。
2からの座標値をマスクとして用いることにより、モー
メント量等のスカラー特徴量を計算することもできる。
チップの一例における多ビット演算処理を説明するため
の図である。
旦、キャリー格納用レジスタ(1267)に一方のオペ
ランドに相当する値を格納するような命令を実行してお
き、キャリー信号C(C(i), C(i+1), …)が次段に接続
されるような命令を与える(図8(I)の例では、制御
信号S[S0,S1,S2,S3,S4,S5]にそれ
ぞれ[1,x,0,1,1,x]を与える)ことによ
り、図8(II)に示されるような複数のPEを用いた多
ビット演算が実現される。なお、図8に示されるよう
に、加算命令の場合、桁上げ加算器を構成することにな
る。
メモリ(121)から読み出してキャリー格納用レジス
タ(1267)に格納する(”1”との加算を実行す
る)。また、他方のデータをメモリ(121)から読み
出してラッチ(124)に格納する。さらに、命令を選
択する(制御信号S5=”1”,S2=”1”)。
(図8(I):マルチプレクサ(1263)の制御信号
S5を”1”としてマルチプレクサ(27)の出力を選
択する。このとき、マルチプレクサ(27)はラッチ
(20)の出力により、例えば、左側のPEの出力を選
択して出力する。)さらに、近傍出力ラッチをディセー
ブルにする。
1”,S2=”0”:図8(II))、演算結果をメモリ
(121)に格納する。なお、上記のような累積演算や
多ビット演算を行うPE群を指すものとして、ブロック
(ブロック化)という概念を用いている。
も、ALU(全加算器1267)の出力信号は、フリッ
プフロップではなくラッチ(Dラッチ23)を介して接
続することで1つのモジュールとして機能し、リアルタ
イムの処理を行うことができる。
ビジョンチップの一例におけるPEのブロック化処理を
説明するための図である。図9および図10において、
参照符号200はブロック(PE群)を示し、PEsは
始点のプロセッシングエレメント、また、PEeは終点
のプロセッシングエレメントを示している。
の例であるが、PEのブロック化(PE群化)は、列バ
ス21および行バス22を介して各PEに座標に依存し
た値を送り、それに基づいて状態レジスタ(20)の値
をローカルに設定することによって、PEをブロック状
に連結してブロック200を構成する。
うに、始点になるプロセッシングエレメントPEsの近
傍入力先を零に設定(例えば、図3に示すPEにおける
マルチプレクサ27が零を選択して出力するように設
定)し、そこから一筆書きで終点のプロセッシングエレ
メントPEeまで連結する。ここで、終点のプロセッシ
ングエレメントPEeは、総和等のスカラー特徴量の格
納先になる。このひとかたまりのブロック200が、先
に挙げた累積演算や多ビット演算を行う際の処理単位と
なる。
10に示されるように、n×mブロック内において、n
m個の1ビットALU(1266)が縦続接続され、n
mビットALUとして振る舞う。また、図11に示され
るように、メモリ素子も1ビットメモリが24個で構成
されるメモリ(121)を持つPEをnm個結合するこ
とで、nmビットが1ワードのメモリが24個使用可能
になる。従って、ブロックのサイズを大きくすること
で、素子を無駄にすることなく、ブロックの演算能力を
高めることが可能になる。
に切り替えることで、可変粒度の画像処理が可能にな
る。さらに、ブロック内のブロードキャストが自由に行
えるため、ピラミッドアーキテクチャ等のメッシュ以外
のネットワーク構造のエミュレーションも可能である。
ンチップの一例におけるブロック内特徴量のフィードバ
ック処理を説明するための図である。
まず、総和演算でモーメント等のスカラー特徴量を計算
し、その結果をブロードキャスト(全ORで実現)でブ
ロック内の全PEに送り、結合メモリに格納すること
で、ブロック内での特徴量フィードバックが実現され
る。これらの一連の処理は、ビットシリアルに実現可能
であるため、作業用のメモリを消費せずに済む。
るときは空間(画像)を表すために使用し、また、ある
ときはビット列(最下位ビット(LSB:Least Signif
icant Bit)、第2ビット、…:演算結果)を表すため
に用いることができ、メモリ(資源)を自由に無駄なく
使用することが可能である。このように、ブロック(P
E群)内に保持するデータを桁毎に異なるPEに分散し
て持たせることで、単一の場合におけるメモリ使用量を
削減することができる。
ンに関して、従来のビジョンチップやSIMDプロセッ
サの中には、列に1つだけPEを設置した列並列のもの
(例えば、MAPP2200)が存在する。このタイプのプロセ
ッサは、列並列にすることにより、完全並列に比べて1
列分の繰り返し処理が必要となるのため速度の点で性能
が落ちるが、その分個々のPEの演算能力を高めること
を目指すことができる。これに関して、本発明の第1の
形態に係るビジョンチップのPE結合機能を用いてPE
を列方向に一列につなげることにより、演算器(ALU
126)やメモリ(121)を無駄にすることなく、こ
れらの列並列プロセッサのエミュレーションが可能であ
る。
意の画素にアクセスできるため、ある種の座標変換アル
ゴリズムにおいて威力を発揮する。従来の2Dメッシュ
ネットワークを用いたチップにおいては、PE間の通信
が近傍のみと限られているため、このようなアルゴリズ
ムを実装することは難しいが、本発明の第1の形態に係
るビジョンチップのブロードキャスト機能を用いること
で、列並列プロセッサと同等の機能を実現することがで
きる。具体例として、後に90度回転アルゴリズムの実
装例を示す。
ンチップの一例におけるその他の処理を説明するための
図であり、ブロックの自己生成を説明するためのもので
ある。
指定するのは、外部から列バス21および行バス22を
介して行うため、ブロックの大きさや位置は格子等のあ
る程度規則的なものとなっている。しかしながら、図1
3に示されるように、ブロック200a,200bの大
きさや位置を、例えば、入力画像に基づいて内部生成
(ブロックの自己生成)することで、より一層柔軟なブ
ロックを生成することができる。なお、ブロックは、同
時に複数生成することが可能である。
列マシンのエミュレーションを行うことで、演算能力お
よびメモリ容量を向上し、列内の任意の画素同士の通信
を可能とすることもできる。これは、ある種の座標変換
系のアルゴリズムにおいて威力を発揮することになる。
の第1の形態に係るビジョンチップの一例に対して視覚
処理アルゴリズムを実装した結果を説明する。なお、ア
ルゴリズムの検証は、専用シミュレータを使用して行っ
た。
ンチップの一例を適用した並列ブロックマッチング処理
を説明するための図であり、図12を参照して説明した
ブロック内特徴量のフィードバック処理を用いたアルゴ
リズムの例としての並列ブロックマッチングを説明する
ためのものである。
画像(画像A,画像B)のうち、一方の画像(画像A)
における区分けされた各部分(A1,A2,A3,A
4)が、他方の画像(画像B)においてどちらにずれて
いるかを探索するアルゴリズムである。すなわち、二枚
の画像を別々のカメラから入力することでステレオ処理
を実現したり、また、1フレーム前の入力とのマッチン
グを取ることでオプティカルフローを実現する等の応用
が考えられる。
像(画像A)をうずまき状に移動させながら、ブロック
単位でSAD(Sum of Absolute Difference:差分の絶
対値の総和)を取る。SADがこれまでの最大値よりも
大きい場合には、最大値およびインデックスを更新す
る。なお、図14(II)は、並列ブロックマッチング処
理の一例のプログラムおよびブロックマッチングを行う
移動方向を示し、また、図14(III)は、並列ブロッ
クマッチング処理の結果(インデックスidx)を示し
ている。ここで、図14(III)は、部分A1では18
回目でパターンが一致し、部分A2では14回目でパタ
ーンが一致し、部分A3では22回目でパターンが一致
し、そして、部分A4では10回目でパターンが一致し
た場合を示している。
時間がかかり、何度も繰り返して演算を行うのは難しい
が、本発明の第1の形態に係るビジョンチップによれ
ば、ブロック内総和を高速に計算することができるた
め、SAD演算を無理なく実行することが可能である。
また、例えば、入力画像を4ビット×2枚、ブロックサ
イズを8×8、そして、探索領域を4×4とした場合に
使用するメモリ量は、入力が8ビット、差分の絶対値の
格納が4ビット、SAD結果の格納が10ビット、最大
値の格納が10ビット、そして、インデックスの格納4
ビットを合計した36ビット+作業用数ビットとなり、
1個のPEが持つローカルメモリ(例えば、24ビッ
ト)には収まりきらない。
ビジョンチップによれば、SADの結果、最大値、およ
び、インデックス等をブロック内の複数PEのメモリに
分散して持たせることができるため、メモリ領域を圧迫
せずに済むことになる。
サイズを8×8画素、そして、探索範囲をn画素とした
場合に必要な演算の回数は、通常演算が(224n−1
2)回、ブロック内累積演算が(22n−2)回、座標
指定が(66n−6)回、そして、各PEが使用するメ
モリ量は19ビットであった。
ンチップの一例を適用した90度回転処理を説明するた
めの図である。
向に90度だけ回転する場合を考える。ここで、回転、
拡大およびフーリエ変換等の座標変換系のアルゴリズム
は、処理の局所性がないため、従来の2Dメッシュ結合
のSIMDプロセッサで実行するには向かないアルゴリ
ズムである。しかしながら、並列度を2次元から1次元
に落とし、繰り返し演算を行うことで、これらの演算が
可能になる場合がある。ここでは、特に、本発明の第1
の形態に係るビジョンチップを列並列プロセッサと見立
て、90度回転のアルゴリズムを実装した。
手順は、対角線を介して列毎に列を行に置き換えてい
く。同一列内および同一行内でのデータの移動は、累積
演算によるブロードキャストを用いて行う。
1ビット、そして、画素数がN×N(2n=N)の場合
に必要な演算の回数は、通常演算が(4N+2n+2)
回、列(行)累積演算が4N回、座標指定が(6N+2
n)回、そして、各PEが使用するメモリ量が4ビット
であった。
ンチップの一例を適用した複数物体の同時トラッキング
処理を説明するための図である。
た場合、1つの方法として、個々の物体に対して順番に
トラッキング処理を行うという方法が考えられる。しか
しながら、対象の数が多くなると、要求されるフレーム
レート内に処理が収まらない可能性も出てくる。そこ
で、図16のトラッキング処理は、本発明の第1の形態
に係るビジョンチップのブロック化の機能を用いて、複
数の物体を同時にトラッキングすることを考える。この
場合、入力画像における対象の位置と形状に依存してブ
ロックを作らなければならず、前述したブロックの自己
生成が有効になる。
ず、初めに物体の初期位置(既知とする)に初期ブロッ
クを配置し、それを基に対象を囲むブロックを自己生成
する。次に、ブロック内でスカラー特徴量を計算して出
力する。特徴量から対象の位置情報を計算し、次のフレ
ームにおける初期ブロックの位置とする。
力および位置情報の計算は対象毎に行う必要があるが、
ブロックの自己生成および特徴量の計算は複数物体に対
して同時に実行することができるため、トラッキング処
理全体の処理時間を短縮することができる。
1ビット(バイナリ)、対象の個数をm、対象の最大サ
イズをnmax×nmax、そして、画素数N×Nとした場
合、初期ブロックの配置およびブロックの自己生成に
は、通常演算が(51nmax+12m+4)回、ブロッ
ク内列(行)方向累積演算が4nmax回、そして、座標
指定が(5m+16nmax)回だけかかる。特徴量の計
算および出力は、モーメントを利用した場合で、通常演
算が(66log2nmax+40log2N)回、ブロック内累
積演算が(12log2nmax+8log2N)回、列(行)累
積演算が(6mlog2nmax+4mlog2N)回、そして、
座標指定が(2m+2log2N)回だけかかる。なお、使
用メモリは、合計7である。
用メモリの見積もりの例を次の表1に示す。ここで、画
素数を256×256、マッチングの探索範囲を9×9
画素、トラッキング対象の最大サイズを32×32、ト
ラッキング対象の個数を10個、通常演算の実行速度を
40ns、N段累積演算の実行速度を(20+1.0
N)ns、そして、座標指定の実行速度を20nsとす
る。
テクチャを基に試作チップの設計を行った。過去の設計
から回路の追加はほとんどないので、回路規模はそのま
まに機能だけ拡充することができた。さらに、回路およ
びレイアウトを改良することにより、さらに高集積化が
実現された。具体的には、制御信号のグローバル配線化
・SRAMの非双対線化による効果が大きい。また、こ
れまでPD回路には、インバータが反転するまでの時間
をカウントする方式がとられていたが、比較器で基準電
圧Vrefと比較する方式を採用することにより、消費電
流をかなり抑えることができ、A/D変換のしきい値電
圧を変えられるという利点がある。
S DLP/TLMプロセス、エリアサイズが5.4m
m×5.4mmの中に64×64個の画素(図1におけ
るユニット100に相当)を搭載することができる。こ
こで、各PEの面積は、例えば、67.4μm×67.
4μmであり、256×256画素を約1.8cm角の
チップに搭載することが可能であり、画像処理デバイス
として標準的な画素数にまで到達させることができる。
E結合機能とグローバル演算機能を付加したビジョンチ
ップによれば、例えば、ステレオ視やオプティカルフロ
ーのためのブロックマッチングを1ms以内に実行でき
る等、画像処理のリアルタイム応用に対し有効であり、
従って、ビジョンチップで実行できるアプリケーション
の幅を拡大することが可能である。
に含まれるFAやDFF等の回路を通常演算のみなら
ず、累積演算・多ビット演算にも流用することにより、
小さい回路規模を維持しつつ多様な演算を実現すること
ができる。その結果、グローバルな演算を行うことがで
きるビジョンチップを、従来のものとほとんど同じ回路
規模で実現することができる。
きるようにすることで、複数のPEをブロック化し、P
E単体では不足な性能を補うことが可能である。その結
果、予め想定させるアプリケーションの最大のスペック
に合わせてPEを設計せずに済み、結果としてハードウ
ェア量の大幅な削減、並びに、対応アプリケーションの
大幅な拡大につながる。
回路PD(光検出素子:フォトダイオード)の出力をソ
フトウェアA/D変換する半導体集積回路装置を詳述す
る。
明したように、S3PEにおいて、光検出器(PD)1
01からの光強度信号のA/D変換は、光電流による蓄
積電荷の放電をしきい値回路(インバータ)で検出し、
そのしきい値を切るまでの時間を計測して行っており、
PE102をカウンタとして用いることで回路を増やす
ことなくA/D変換を実現している。
けるフォトダイオード出力(光検出回路PD)のA/D
変換処理を実行するための構成を説明するための図であ
る。図17において、参照符号301は光検出器(PD
101)を示し、302はプロセッシングエレメント
(PE102)を示している。
ード)311およびしきい値回路(インバータ)312
を備え、しきい値回路312は、フォトダイオード31
1の光電流による蓄積電荷の放電を検出する。PE30
2は、PD301からの光強度信号のA/D変換をソフ
トウェアで行うもので、しきい値回路312で検出され
たしきい値を切るまでの時間を計測して行うようになっ
ている。すなわち、PE302をカウンタとして用いる
ことで、回路を増やすことなくA/D変換を実現してい
る。
課題を説明するための図である。図18において、参照
符号L1は光検出素子(フォトダイオード)311に入
力(照射)される光強度が大きい(明るい)とき、L2
は光検出素子311に入力される光強度が中くらいのと
き、そして、L3は光検出素子311に入力された光強
度が小さい(暗い)ときの時間に対する出力電圧の関係
を示している。
強度が大きい場合には、光電流による電圧降下は大きく
(L1)、また、光検出素子311に入力する光強度が
小さい場合には、光電流による電圧降下が小さい(L
3)。ここで、図17のA/D変換処理では、しきい値
回路312としてインバータを使用するため、しきい値
電圧(基準電圧Vref)は固定であり、また、PE30
2におけるしきい値回路312の出力の変化検出処理
(カウンタによる時間測定処理)も一定の時間間隔(P
0)となっている。
チップの一例における光検出回路PD(フォトダイオー
ド出力)のA/D変換処理は、しきい値が固定されたし
きい値回路(インバータ)312を使用し、しきい値回
路312の出力の変化も一定の時間間隔P0で実行され
ている。その結果、光の強度やノイズに対する適切な制
御を行うことが困難であり、また、必要な個所で検出精
度を向上させるといったこともできなかった。
ンチップの一例におけるフォトダイオード出力(光検出
回路PD)のA/D変換処理を実行するための構成を説
明するための図であり、図20は図19の一構成例を示
す図である。図19および図20において、参照符号3
1は光検出器(PD101)、33はリセット回路、3
4は光検出素子(フォトダイオード311)、そして、
35はコンパレータ(比較手段)を示している。また、
参照符号32はプロセッシングエレメント(PE10
2)、36はローカルメモリ(121)、37はI/O
ポート(122)、そして、38はALU(126)を
示している。ここで、フォトダイオード34の出力(ア
ノード)はコンパレータ35の負入力に接続され、ま
た、コンパレータ35の正入力には基準電圧Vrefが印
加れている。
ォトダイオード34の寄生容量に蓄えられた電荷は、照
射された光の光強度に応じた量の光電流が流れることで
蓄積または解放(図19および図20では解放)され、
それに伴って、コンパレータ35の入力電圧も変動し、
予め定められた基準電圧(しきい値)Vrefを切ったと
ころで出力が反転する。このコンパレータ35の出力を
I/Oポート37(図20ではローカルメモリ36にマ
ップされている)を通じて取り込み、PE32のALU
38とメモリ36を用いてカウントする。
イオード34の電荷をリセットするための信号は、I/
Oポート37からリセット回路33に送られ、各PE毎
に(ローカルに)リセットのタイミングを制御するよう
になっている。
子化間隔A/D変換)は、光電流による電圧降下をコン
パレータ35で検知する方式であり、電圧が基準電圧V
refを切るまでの時間をカウンタで測定する。この際、
出力が光強度の逆数となってしまうが、これでは、画像
処理を行う上で都合が悪いので、出力が光強度に比例ま
たは対数比例するように、カウントのタイミングを時間
によって変えて量子化間隔を調整する。
で制御する必要が生じるため、ビジョンチップに対して
命令を供給する装置(システム)として、パイプライン
化によって命令供給の時間分解能を高め、且つ、そのパ
イプラインの動的な停止を一切排除することにより、命
令サイクルの粒度での実時間性を保証できるコントロー
ラを用いる。さらに、カウントの最中に基準電圧Vref
を変化させることにより、さらに柔軟なセンシングが可
能となる。例えば、カウントしながら基準電圧Vrefを
徐々に上げていくことにより、暗いところでは感度を優
先し、明るいところでは精度を優先したセンシングを実
現することができる。また、この可変量子化間隔A/D
変換の機構を積極的に利用し、過去のA/D変換結果を
用いて現時刻の区間割り当て制御を更新することによ
り、環境変化に対し適応的なA/D変換が可能になる。
詳細は、後述する。
素子34)のリセットを各画素毎に行うことができ、こ
れを利用して、電圧が基準電圧Vrefを切った画素(P
D)に対してのみリセット信号を与える。これにより、
明るいところは高いフレームレートで、また、暗いとこ
ろは低いフレームレートで撮像することになり、広ダイ
ナミックレンジと高フレームレートを両立した撮像が可
能になる。
/D変換を既にPEに設けられているALU38とメモ
リ36を用いて行うことにより、回路の追加なしにA/
D変換を実現することがでる。また、この方式の利点と
して、光検出素子(フォトダイオード)34の制御のタ
イミングをソフトウェアで変えることができ、従来のイ
メージセンサでは不可能であった柔軟なセンシングを実
現することができる。
処理の動作を説明するための図である。図21におい
て、参照符号LL1〜LL6は光検出素子(フォトダイ
オード)34に入力された光強度が高い(明るい:LL
1)方から低い(暗い:LL6)に向かっての時間に対
する出力電圧の関係を示している。
変換処理は、基準電圧Vrefを様々な電圧レベルに設定
すると共に、プロセッシングエレメント(PE)32に
おけるしきい値回路(コンパレータ)35の出力の変化
検出処理(カウンタによる時間測定処理)も異なる時間
間隔(例えば、P1,P2)に変化させて制御するように
なっている。図21に示されるように、ノイズの影響
は、ノイズの大きさが同じであっても、光強度が小さい
ときほど(例えば、LL1よりもLL4やLL5の方
が)その影響は大きくなり、また、検出精度は、基準電
圧Vrefが低いときほど高くなる。
光強度が大きい場合には、コンパレータ35の基準電圧
Vrefを低く設定してノイズに強くし、また、検出精度
を向上させる方が好ましい。一方、フォトダイオード3
4に入力する光強度が小さい場合には、コンパレータ3
5の基準電圧Vrefを高く設定して感度を向上させる必
要がある。さらに、コンパレータ35の出力の変化検出
処理(カウンタによる時間測定処理)は、例えば、フォ
トダイオード34に入力する光強度が大きいことが予想
される場合(例えば、LL1)には、最初の時間間隔を
狭く設定(P1)すると共に後の時間間隔を広く設定
(P2)し、コンパレータ35の変化タイミングを狭い
時間間隔の領域で検出して検出精度を向上させるように
構成することもできる。
導体集積回路装置は、ビジョンチップが適用されるシス
テム(装置)に応じて、光の強度やノイズに対する適切
な制御を行い、さらに、必要な個所で検出精度を向上さ
せるといった制御を行うこともできる。
ンチップが適用されるシステムの構成例を示す図であ
る。図22において、参照符号1はビジョンチップ(半
導体集積回路装置)、100はユニット(画素)、41
はPD読み出し時刻・供給電圧テーブル(光検出回路P
Dの出力を検出するタイミング(時間間隔)およびコン
パレータに与える基準電圧Vref用のテーブル)、42
は命令テーブル、43はビジョンチップ制御装置、そし
て、44はD/A変換器を示している。まず、可変量子
化間隔A/D変換の動作について説明する。
形態に係る半導体集積回路装置(ビジョンチップ)が適
用されるシステムは、ビジョンチップ制御装置43が、
命令テーブル42およびPD読み出し時刻・供給電圧テ
ーブル41に従い、ビジョンチップに対して制御命令お
よび基準電圧Vrefを供給する機能を有する。
の手順で行うことができる。
モリ領域(各PEのローカルメモリ36)を零に初期化
するための制御命令を供給する。
33をオンした後にオフ)する制御命令を供給する(こ
れを時刻0とする)。
る。
下の処理を繰り返し実行する。
て、光検出器31(フォトダイオード34)の出力を読
み出す制御命令を供給する。
する。
格納するメモリ領域に対して、上記i)で読み出した1
ビット値を加算する制御命令を供給する。
格納メモリ領域にはA/D変換結果が格納される。
いて説明する。ここで、{tk}は、プロセッシングエ
レメント(PE)が光検出回路PDの出力を検出する時
刻(カウントのタイミング)に相当し、また、{Vk}
はコンパレータ(35)に供給する基準電圧(Vref)
に相当する。
装置によれば、テーブルに格納する{tk}および
{Vk}を変更することで、さまざまな量子化間隔を実
現することができる。具体的に、{tk},{Vk}を決
定する方法の例として、仕様として与えられた{ik}
(光電流量の量子化間隔)から、それを実現するための
{tk}および{Vk}を算出するアルゴリズムを次に示
す。
るフォトダイオード出力のA/D変換処理を説明するた
めの図である。
k}(k=1,…,n−1)は、光電流量の量子化間隔
を示す。量子化間隔{ik}は、図23のように表現す
る。すなわち、光電流量ikからik-1までのアナログ量
に対して、符号(ディジタル値)n−kを割り当てるも
のとする。
きい方が暗い光量を表し、フォトダイオード(34)を
流れる光電流量は少なく、逆に、小さい方が明るい光量
を表し、フォトダイオードを流れる光電流量は多い。こ
こで、光電流量iの添字を上記のように設定するのは、
時間順に添字を取るtk,Vkとの対応を表すためであ
る。ただし、in,i0は、それぞれ0および∞に固定と
してある。
{tk}(k=1,…,n−1)は、光検出回路(P
D)の出力の読み出し時刻列を示し、そして、{Vk}
(k=1,…,n−1)は、各tkにおいてVrefとして
与えるべき電位を示す。なお、t0は0に固定する。
基準電圧Vrefとして入力できる値の粒度、ΔtはPD
読み出し時刻の粒度、tmaxはAD変換に費やす時間
[Δtの整数倍]、そして、{Pk}(k=1,…,n
−1)は前述したi)〜iii)を実行するのに要する時
間[Δtの整数倍]を示す。さらに、Vddはフォトダイ
オードのリセット電位(電源電圧)、Vmaxは基準電圧
Vrefに入力できる最大値(コンパレータの動作領域の
上限)[ΔVの整数倍]、Vminは基準電圧Vrefに入力
できる最小値(コンパレータの動作領域の下限)[ΔV
の整数倍]、そして、Cはフォトダイオードの容量を示
す。
場合を決定する。その結果を用いて、k=n−2の場合
を決定し、以下同様に、k=1まで決定していく。途中
でエラー終了になるのは、入力として与えられた
{ik}がハードウェア的な制約から実現不可能な場合
である。それぞれの値の対応を図24に示す。なお、記
述の都合上、tn=tmax,Vn=Vmaxとして扱う。
1〜LL14はフォトダイオード(34)に入力された
光強度が高い(明るい:LL11)方から低い(暗い:
LL14)に向かっての時間に対する出力電圧の関係を
示し、LL11は傾きが−i 1/C、LL12は傾きが
−i2/C、LL13は傾きが−ik/C、そして、LL
14は傾きが−in-1/Cとなっている。
に対して、以下のいずれかの処理を行う。
(B)は次の通りである。
終了する。Vk<Vminとなった場合は、処理(B)にて
再計算する。
は、エラー終了する。
れるように、所望の光電流量の量子化間隔{ik}を実
現するPD読み出し時刻列{tk}および基準電圧Vref
として与えるべき電位{Vk}を用意し、A/D変換を
行うことができる。また、PD読み出し時刻・供給電圧
テーブル41の内容を動的に入れ替えることで、環境や
目的の変化に応じた適応的なセンシングを実現すること
ができる。
例を図25に示す。ただし、説明を簡略化するために、
8階調のA/D変換とする。
み幅でA/D変換する例(フォトダイオード34に入力
する光強度が小さい領域で検出精度を向上させるのに適
した例)であり、逆に、図25(b)は、明るい領域を
狭い刻み幅でA/D変換する例(フォトダイオード34
に入力する光強度が大きい領域で検出精度を向上させる
のに適した例)である。
ることで暗い領域から明るい領域までをカバーする例で
ある。ただし、図25(c)の例は、図25(a)と比
べて検出可能な上限が2倍になったのと同時に下限も2
倍になっているため、ダイナミックレンジは変わらな
い。
域から明るい領域になるに従って大きくして、広いダイ
ナミックレンジを実現する例である。ただし、図25
(d)の例では、その代償として、入力光の強度とA/
D変換後の値の関係は線形ではなくなる。
装置によれば、上記の図25(a)〜図25(d)に示
されるように、ビジョンチップが適用されるシステム
(装置)に応じて、光の強度やノイズに対する適切な制
御を行うことができ、必要な個所で検出精度を向上させ
るといった制御が可能になる。
な半導体集積回路装置としてビジョンチップを例として
説明したが、本発明はビジョンチップに限定されず、複
数のプロセッシングエレメント(PE)が1つの半導体
チップ上に形成された半導体集積回路装置に対して幅広
く適用することができる。
れた複数のプロセッシングエレメントを有する半導体集
積回路装置であって、前記各プロセッシングエレメント
の出力に設けられたラッチ手段と、入力元を上下左右の
いずれかのプロセッシングエレメントまたは零信号から
選択して出力する選択手段とを備えることを特徴とする
半導体集積回路装置。
路装置において、さらに、前記各プロセッシングエレメ
ントの座標位置情報に応じて前記選択手段が選択するプ
ロセッシングエレメントを制御する制御手段を備えるこ
とを特徴とする半導体集積回路装置。
体集積回路装置において、該半導体集積回路装置は、リ
アルタイムの多ビット演算処理または累積演算処理を実
行することを特徴とする半導体集積回路装置。
記載の半導体集積回路装置において、さらに、複数の光
検出器を備え、前記各プロセッシングエレメントは対応
する前記光検出器の出力を処理することを特徴とする半
導体集積回路装置。
ント、および、該プロセッシングエレメントをつなぐ通
信手段を有する半導体集積回路装置であって、第1のプ
ロセッシングエレメントにおける資源を、前記通信手段
を介して任意の第2のプロセッシングエレメントの資源
として使用することを特徴とする半導体集積回路装置。
路装置において、前記プロセッシングエレメントを複数
結合し、プロセッシングエレメント群としてブロック化
することを特徴とする半導体集積回路装置。
路装置において、前記各プロセッシングエレメントはそ
れぞれALUおよびメモリを備え、前記ブロック化され
たプロセッシングエレメント群に含まれる複数のALU
およびメモリにより所定の処理を行うことを特徴とする
半導体集積回路装置。
路装置において、前記複数のプロセッシングエレメント
を結合するブロック化の構成およびサイズを動的に可変
としたことを特徴とする半導体集積回路装置。
路装置において、前記各プロセッシングエレメントは、
それぞれ近傍のプロセッシングエレメントとの接続を制
御する接続制御手段を備えることを特徴とする半導体集
積回路装置。
回路装置において、前記接続制御手段は、近傍通信の入
力元を上下左右のいずれかのプロセッシングエレメント
または零信号から選択することを特徴とする半導体集積
回路装置。
回路装置において、前記ブロック化されたプロセッシン
グエレメント群は、リアルタイムの多ビット演算または
累積演算を実行することを特徴とする半導体集積回路装
置。
項に記載の半導体集積回路装置において、前記複数のプ
ロセッシングエレメントはマトリクス状に配置され、前
記通信手段は行バスおよび列バスを備えて該各プロセッ
シングエレメントに対して所定の情報を送信することを
特徴とする半導体集積回路装置。
積回路装置において、前記所定の情報は、前記各プロセ
ッシングエレメントの座標情報であることを特徴とする
半導体集積回路装置。
項に記載の半導体集積回路装置において、該半導体集積
回路装置は、SIMDプロセッサであることを特徴とす
る半導体集積回路装置。
積回路装置において、該半導体集積回路装置は、前記各
プロセッシングエレメントがそれぞれ対応する光検出器
の出力を処理するビジョンチップであることを特徴とす
る半導体集積回路装置。
項に記載の半導体集積回路装置において、該半導体集積
回路装置は、1つの半導体チップとして構成されている
ことを特徴とする半導体集積回路装置。
数のプロセッシングエレメントを有する半導体集積回路
装置であって、前記各光検出回路は、光検出素子の出力
と基準電圧とを比較する比較手段を備え、該比較手段の
出力が該基準電圧を切るまでの時間をカウントしてA/
D変換処理を行うことを特徴とする半導体集積回路装
置。
積回路装置において、前記比較手段に与える基準電圧レ
ベルを可変としたことを特徴とする半導体集積回路装
置。
積回路装置において、前記比較手段の基準電圧レベル
を、ソフトウェアにより可変制御するか、または、予め
与えられたテーブルに基づいて規定することを特徴とす
る半導体集積回路装置。
積回路装置において、前記比較手段の出力が前記基準電
圧を切るまでの時間をカウントするカウント間隔を可変
としたことを特徴とする半導体集積回路装置。
積回路装置において、前記カウント間隔を、ソフトウェ
アにより可変制御するか、または、予め与えられたテー
ブルに基づいて規定することを特徴とする半導体集積回
路装置。
1項に記載の半導体集積回路装置において、前記光検出
素子のリセットを該各光検出回路毎に行うことを特徴と
する半導体集積回路装置。
1項に記載の半導体集積回路装置において、前記A/D
変換処理を、前記各プロセッシングエレメントのALU
およびメモリを使用して実行することを特徴とする半導
体集積回路装置。
1項に記載の半導体集積回路装置において、該半導体集
積回路装置はビジョンチップであり、前記各プロセッシ
ングエレメントは前記複数の光検出回路の対応する1つ
と結合されていることを特徴とする半導体集積回路装
置。
1項に記載の半導体集積回路装置において、該半導体集
積回路装置は、1つの半導体チップとして構成されてい
ることを特徴とする半導体集積回路装置。
形態によれば、画素数の低下を来すことなく(PEの占
有面積の増大を来すことなく)、高い汎用性を有する半
導体集積回路装置を提供することができる。また、本発
明の第2の形態によれば、光検出素子の出力のA/D変
換を追加回路なしで行うと共に、柔軟なセンシングを実
現することのできる半導体集積回路装置を提供すること
ができる。
するための図である。
例のアーキテクチャを説明するための図である。
シングエレメント)のブロック化処理を実行するための
構成を説明するための図である。
例におけるPEの結合処理を説明するための図である。
例における累積演算処理を説明するための図である。
例における総和演算処理を説明するための図である。
例における多ビット演算処理を説明するための図であ
る。
例におけるPEのブロック化処理を説明するための図
(その1)である。
一例におけるPEのブロック化処理を説明するための図
(その2)である。
一例におけるPEのブロック化処理を説明するための図
(その3)である。
一例におけるブロック内特徴量のフィードバック処理を
説明するための図である。
一例におけるその他の処理を説明するための図である。
一例を適用した並列ブロックマッチング処理を説明する
ための図である。
一例を適用した90度回転処理を説明するための図であ
る。
一例を適用した複数物体の同時トラッキング処理を説明
するための図である。
ダイオード出力のA/D変換処理を実行するための構成
を説明するための図である。
するための図である。
一例におけるフォトダイオード出力のA/D変換処理を
実行するための構成を説明するための図である。
を説明するための図である。
適用されるシステムの構成例を示す図である。
出力のA/D変換処理を説明するための図(その1)で
ある。
出力のA/D変換処理を説明するための図(その2)で
ある。
出力のA/D変換処理を説明するための図(その3)で
ある。
(PE) 11…デコーダ 12…出力回路 13…通信手段 20…状態レジスタ(3ビットのレジスタ) 21…列バス(COL) 22…行バス(ROW) 23,123〜125…データラッチ(Dラッチ) 27,1261〜1265…マルチプレクサ(MUX) 31,101,301…光検出器(PD) 33…リセット手段(リセット回路) 34…光検出素子(フォトダイオード) 35…コンパレータ 36,121…メモリ(ローカルメモリ) 37,122…I/Oポート 38,126…ALU 100…ユニット(画素) 1266…全加算器(FA) 1267…キャリー格納用レジスタ(D型フリップフロ
ップ:DFF) S0〜S5…命令(制御信号) Vref…基準電圧
Claims (11)
- 【請求項1】 1つの半導体チップに設けられた複数の
プロセッシングエレメントを有する半導体集積回路装置
であって、 前記各プロセッシングエレメントの出力に設けられたラ
ッチ手段と、 入力元を上下左右のいずれかのプロセッシングエレメン
トまたは零信号から選択して出力する選択手段とを備え
ることを特徴とする半導体集積回路装置。 - 【請求項2】 請求項1に記載の半導体集積回路装置に
おいて、さらに、 前記各プロセッシングエレメントの座標位置情報に応じ
て前記選択手段が選択するプロセッシングエレメントを
制御する制御手段を備えることを特徴とする半導体集積
回路装置。 - 【請求項3】 請求項1または2に記載の半導体集積回
路装置において、該半導体集積回路装置は、リアルタイ
ムの多ビット演算処理または累積演算処理を実行するこ
とを特徴とする半導体集積回路装置。 - 【請求項4】 複数のプロセッシングエレメント、およ
び、該プロセッシングエレメントをつなぐ通信手段を有
する半導体集積回路装置であって、 第1のプロセッシングエレメントにおける資源を、前記
通信手段を介して任意の第2のプロセッシングエレメン
トの資源として使用することを特徴とする半導体集積回
路装置。 - 【請求項5】 請求項4に記載の半導体集積回路装置に
おいて、前記プロセッシングエレメントを複数結合し、
プロセッシングエレメント群としてブロック化すること
を特徴とする半導体集積回路装置。 - 【請求項6】 請求項5に記載の半導体集積回路装置に
おいて、前記複数のプロセッシングエレメントを結合す
るブロック化の構成およびサイズを動的に可変としたこ
とを特徴とする半導体集積回路装置。 - 【請求項7】 請求項5に記載の半導体集積回路装置に
おいて、前記各プロセッシングエレメントは、それぞれ
近傍のプロセッシングエレメントとの接続を制御する接
続制御手段を備えることを特徴とする半導体集積回路装
置。 - 【請求項8】 複数の光検出回路および複数のプロセッ
シングエレメントを有する半導体集積回路装置であっ
て、前記各光検出回路は、光検出素子の出力と基準電圧
とを比較する比較手段を備え、該比較手段の出力が該基
準電圧を切るまでの時間をカウントしてA/D変換処理
を行うことを特徴とする半導体集積回路装置。 - 【請求項9】 請求項8に記載の半導体集積回路装置に
おいて、前記比較手段に与える基準電圧レベルを可変と
したことを特徴とする半導体集積回路装置。 - 【請求項10】 請求項8に記載の半導体集積回路装置
において、前記比較手段の出力が前記基準電圧を切るま
での時間をカウントするカウント間隔を可変としたこと
を特徴とする半導体集積回路装置。 - 【請求項11】 請求項8〜10のいずれか1項に記載
の半導体集積回路装置において、該半導体集積回路装置
は、1つの半導体チップとして構成されていることを特
徴とする半導体集積回路装置。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002017665A JP3902741B2 (ja) | 2002-01-25 | 2002-01-25 | 半導体集積回路装置 |
US10/200,332 US7098437B2 (en) | 2002-01-25 | 2002-07-23 | Semiconductor integrated circuit device having a plurality of photo detectors and processing elements |
US11/289,695 US8244788B2 (en) | 2002-01-25 | 2005-11-30 | Semiconductor integrated circuit device having a plurality of photo detectors and processing elements |
US11/289,696 US7244919B2 (en) | 2002-01-25 | 2005-11-30 | Semiconductor integrated circuit device having photo detector circuits, processing elements, and comparing circuits which compare the output of a photo detector element with a reference voltage |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002017665A JP3902741B2 (ja) | 2002-01-25 | 2002-01-25 | 半導体集積回路装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003218338A true JP2003218338A (ja) | 2003-07-31 |
JP3902741B2 JP3902741B2 (ja) | 2007-04-11 |
Family
ID=27606177
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002017665A Expired - Fee Related JP3902741B2 (ja) | 2002-01-25 | 2002-01-25 | 半導体集積回路装置 |
Country Status (2)
Country | Link |
---|---|
US (3) | US7098437B2 (ja) |
JP (1) | JP3902741B2 (ja) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006293419A (ja) * | 2005-04-05 | 2006-10-26 | Univ Of Tokyo | 画像モーメントセンサ、画像モーメント計測装置、画像モーメントセンサの演算方法及び画像モーメント計測方法 |
JP2006313543A (ja) * | 2005-05-02 | 2006-11-16 | Pixart Imaging Inc | 全画像を記録しなくても複数のオブジェクトを認識できる画像認識方法 |
JP2011508293A (ja) * | 2007-11-30 | 2011-03-10 | コグネックス・コーポレイション | ビジョンセンサ、システムおよび方法 |
JP2013531838A (ja) * | 2010-05-17 | 2013-08-08 | コグネックス・コーポレイション | 全体画像内で注意の焦点に関する画像データを処理するためのシステムと方法 |
WO2017122395A1 (ja) * | 2016-01-12 | 2017-07-20 | ソニー株式会社 | 画像データ処理回路および撮像回路 |
JP2018504040A (ja) * | 2015-03-27 | 2018-02-08 | レイセオン カンパニー | 電流−周波数変換器 |
US10891706B2 (en) | 2016-09-08 | 2021-01-12 | Sony Corporation | Arithmetic device and sensor to track movement of object between frames |
JP2021511699A (ja) * | 2018-01-18 | 2021-05-06 | バルブ コーポレーション | センサ集積回路を含むヘッドマウントディスプレイのためのポジショントラッキングシステム |
Families Citing this family (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7383421B2 (en) | 2002-12-05 | 2008-06-03 | Brightscale, Inc. | Cellular engine for a data processing system |
US9330060B1 (en) * | 2003-04-15 | 2016-05-03 | Nvidia Corporation | Method and device for encoding and decoding video image data |
US8660182B2 (en) * | 2003-06-09 | 2014-02-25 | Nvidia Corporation | MPEG motion estimation based on dual start points |
US7218350B2 (en) * | 2003-06-30 | 2007-05-15 | Texas Instruments Incorporated | Image sensor with digital output and inherent pixel non-uniformity suppression |
US8553113B2 (en) * | 2003-08-20 | 2013-10-08 | At&T Intellectual Property I, L.P. | Digital image capturing system and method |
US8423597B1 (en) | 2003-08-29 | 2013-04-16 | Nvidia Corporation | Method and system for adaptive matrix trimming in an inverse discrete cosine transform (IDCT) operation |
US7126512B2 (en) * | 2004-03-19 | 2006-10-24 | Charles Douglas Murphy | Comparing circuits for time-to-threshold A/D conversion in digital imaging arrays |
US20080001736A1 (en) * | 2004-06-09 | 2008-01-03 | Koninklijke Philips Electronics N.V. | Electronic Circuit |
KR100646996B1 (ko) * | 2004-06-16 | 2006-11-23 | 삼성에스디아이 주식회사 | 유기 발광 표시 장치 및 그 제어 방법 |
US20060129374A1 (en) * | 2004-12-15 | 2006-06-15 | Larson Lee A | Apparatus and method for apparatus mediating voltage levels between an emulation unit and a target processor |
US7451293B2 (en) * | 2005-10-21 | 2008-11-11 | Brightscale Inc. | Array of Boolean logic controlled processing elements with concurrent I/O processing and instruction sequencing |
US7659497B2 (en) * | 2005-12-06 | 2010-02-09 | International Business Machines Corporation | On demand circuit function execution employing optical sensing |
US8731071B1 (en) | 2005-12-15 | 2014-05-20 | Nvidia Corporation | System for performing finite input response (FIR) filtering in motion estimation |
US7488926B2 (en) * | 2006-01-06 | 2009-02-10 | Microsoft Corporation | Pixel array with shared pixel output lines |
US7671460B2 (en) * | 2006-01-25 | 2010-03-02 | Teledyne Licensing, Llc | Buried via technology for three dimensional integrated circuits |
KR100748319B1 (ko) * | 2006-03-29 | 2007-08-09 | 삼성에스디아이 주식회사 | 유기발광표시장치 및 그의 구동방법 |
US8724702B1 (en) | 2006-03-29 | 2014-05-13 | Nvidia Corporation | Methods and systems for motion estimation used in video coding |
US8660380B2 (en) * | 2006-08-25 | 2014-02-25 | Nvidia Corporation | Method and system for performing two-dimensional transform on data value array with reduced power consumption |
US20080059764A1 (en) * | 2006-09-01 | 2008-03-06 | Gheorghe Stefan | Integral parallel machine |
US20080244238A1 (en) * | 2006-09-01 | 2008-10-02 | Bogdan Mitu | Stream processing accelerator |
US7436342B2 (en) * | 2007-01-30 | 2008-10-14 | Teledyne Licensing, Llc | Numerical full well capacity extension for photo sensors with an integration capacitor in the readout circuit using two and four phase charge subtraction |
US7498650B2 (en) * | 2007-03-08 | 2009-03-03 | Teledyne Licensing, Llc | Backside illuminated CMOS image sensor with pinned photodiode |
US7923763B2 (en) * | 2007-03-08 | 2011-04-12 | Teledyne Licensing, Llc | Two-dimensional time delay integration visible CMOS image sensor |
US8756482B2 (en) * | 2007-05-25 | 2014-06-17 | Nvidia Corporation | Efficient encoding/decoding of a sequence of data frames |
US20080291209A1 (en) * | 2007-05-25 | 2008-11-27 | Nvidia Corporation | Encoding Multi-media Signals |
US9118927B2 (en) * | 2007-06-13 | 2015-08-25 | Nvidia Corporation | Sub-pixel interpolation and its application in motion compensated encoding of a video signal |
US8873625B2 (en) | 2007-07-18 | 2014-10-28 | Nvidia Corporation | Enhanced compression in representing non-frame-edge blocks of image frames |
US7982775B2 (en) * | 2007-08-02 | 2011-07-19 | Texas Instruments Incorporated | Method and apparatus for motion stabilization |
US7795650B2 (en) * | 2008-12-09 | 2010-09-14 | Teledyne Scientific & Imaging Llc | Method and apparatus for backside illuminated image sensors using capacitively coupled readout integrated circuits |
US8666181B2 (en) * | 2008-12-10 | 2014-03-04 | Nvidia Corporation | Adaptive multiple engine image motion detection system and method |
ITCO20110022A1 (it) * | 2011-06-30 | 2012-12-31 | Fond Bruno Kessler | Fotorilevatore |
FR2991083A1 (fr) * | 2012-05-24 | 2013-11-29 | St Microelectronics Grenoble 2 | Procede et dispositif de protection d'un circuit integre contre des attaques par sa face arriere |
US9798698B2 (en) | 2012-08-13 | 2017-10-24 | Nvidia Corporation | System and method for multi-color dilu preconditioner |
JP6633330B2 (ja) * | 2014-09-26 | 2020-01-22 | 株式会社半導体エネルギー研究所 | 半導体装置 |
CN105962922B (zh) | 2016-04-19 | 2018-11-27 | 矽力杰半导体技术(杭州)有限公司 | 光电传感器、光电检测方法以及应用其的心率检测设备 |
CN105953823B (zh) | 2016-04-21 | 2018-12-18 | 矽力杰半导体技术(杭州)有限公司 | 环境光滤除电路、光电传感器及应用其的光电检测设备 |
CN105910632B (zh) | 2016-04-21 | 2018-10-26 | 矽力杰半导体技术(杭州)有限公司 | 光电检测设备和集成电路 |
KR101941892B1 (ko) * | 2017-03-23 | 2019-01-28 | 고려대학교 산학협력단 | 대비 감도 향상을 위한 인공 망막 시스템 |
WO2021212045A1 (en) * | 2020-04-17 | 2021-10-21 | SiMa Technologies, Inc. | Synchronization of processing elements and software managed memory hierarchy in a machine learning accelerator |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3855589A (en) * | 1969-11-25 | 1974-12-17 | Sylvania Electric Prod | Analog to digital converter with variable quantization and dynamic range |
US4215401A (en) * | 1978-09-28 | 1980-07-29 | Environmental Research Institute Of Michigan | Cellular digital array processor |
US4380046A (en) * | 1979-05-21 | 1983-04-12 | Nasa | Massively parallel processor computer |
US4593351A (en) * | 1981-06-12 | 1986-06-03 | International Business Machines Corporation | High speed machine for the physical design of very large scale integrated circuits |
US4524428A (en) * | 1982-01-26 | 1985-06-18 | Hughes Aircraft Company | Modular input-programmable logic circuits for use in a modular array processor |
JPS61208561A (ja) | 1985-03-13 | 1986-09-16 | Agency Of Ind Science & Technol | 並列デ−タ処理装置 |
US6108763A (en) * | 1986-09-18 | 2000-08-22 | Grondalski; Robert S. | Simultaneous parity generating/reading circuit for massively parallel processing systems |
US4985832A (en) * | 1986-09-18 | 1991-01-15 | Digital Equipment Corporation | SIMD array processing system with routing networks having plurality of switching stages to transfer messages among processors |
US5027117A (en) * | 1988-03-31 | 1991-06-25 | Ricoh Company, Ltd. | Conversion using a variable reference based on image density |
JP2930341B2 (ja) * | 1988-10-07 | 1999-08-03 | マーチン・マリエッタ・コーポレーション | データ並列処理装置 |
US5253308A (en) * | 1989-06-21 | 1993-10-12 | Amber Engineering, Inc. | Massively parallel digital image data processor using pixel-mapped input/output and relative indexed addressing |
EP0541534A1 (en) * | 1990-08-03 | 1993-05-19 | Du Pont Pixel Systems Limited | Data-array processing systems |
US5689719A (en) * | 1991-06-28 | 1997-11-18 | Sanyo Electric O., Ltd. | Parallel computer system including processing elements |
US5252308A (en) * | 1991-12-31 | 1993-10-12 | Union Oil Company Of California | Transporting urea for quantitative conversion into ammonia |
KR100186918B1 (ko) | 1994-10-21 | 1999-05-01 | 모리시다 요이치 | 신호처리장치 |
JP3639014B2 (ja) | 1994-10-21 | 2005-04-13 | 松下電器産業株式会社 | 信号処理装置 |
US6118901A (en) * | 1997-10-31 | 2000-09-12 | National Science Council | Array architecture with data-rings for 3-step hierarchical search block matching algorithm |
US6608296B1 (en) * | 1998-10-07 | 2003-08-19 | Hamamatsu Photonics K.K. | High-speed vision sensor having a parallel processing system |
EP1164544B1 (en) * | 1999-03-16 | 2011-11-02 | Hamamatsu Photonics K.K. | High-speed vision sensor |
FR2791155B1 (fr) * | 1999-03-17 | 2001-05-11 | St Microelectronics Sa | Dispositif et procede de mise en oeuvre d'une operation modulaire elementaire selon la methode de montgomery |
US7158183B1 (en) * | 1999-09-03 | 2007-01-02 | Nikon Corporation | Digital camera |
AU7555900A (en) * | 1999-10-04 | 2001-05-10 | Hamamatsu Photonics K.K. | Camera system for high-speed image processing |
US6525304B1 (en) * | 2000-11-28 | 2003-02-25 | Foveon, Inc. | Circuitry for converting analog signals from pixel sensor to a digital and for storing the digital signal |
US6642503B2 (en) * | 2001-06-13 | 2003-11-04 | Texas Instruments Incorporated | Time domain sensing technique and system architecture for image sensor |
-
2002
- 2002-01-25 JP JP2002017665A patent/JP3902741B2/ja not_active Expired - Fee Related
- 2002-07-23 US US10/200,332 patent/US7098437B2/en not_active Expired - Fee Related
-
2005
- 2005-11-30 US US11/289,695 patent/US8244788B2/en not_active Expired - Fee Related
- 2005-11-30 US US11/289,696 patent/US7244919B2/en not_active Expired - Fee Related
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006293419A (ja) * | 2005-04-05 | 2006-10-26 | Univ Of Tokyo | 画像モーメントセンサ、画像モーメント計測装置、画像モーメントセンサの演算方法及び画像モーメント計測方法 |
JP4565122B2 (ja) * | 2005-04-05 | 2010-10-20 | 国立大学法人 東京大学 | 画像モーメントセンサ、画像モーメント計測装置、画像モーメントセンサの演算方法及び画像モーメント計測方法 |
JP2006313543A (ja) * | 2005-05-02 | 2006-11-16 | Pixart Imaging Inc | 全画像を記録しなくても複数のオブジェクトを認識できる画像認識方法 |
JP2011508293A (ja) * | 2007-11-30 | 2011-03-10 | コグネックス・コーポレイション | ビジョンセンサ、システムおよび方法 |
JP2016192224A (ja) * | 2010-05-17 | 2016-11-10 | コグネックス・コーポレイション | 全体画像内で注意の焦点に関する画像データを処理するためのシステムと方法 |
JP2015143990A (ja) * | 2010-05-17 | 2015-08-06 | コグネックス・コーポレイション | 全体画像内で注意の焦点に関する画像データを処理するためのシステムと方法 |
JP2013531838A (ja) * | 2010-05-17 | 2013-08-08 | コグネックス・コーポレイション | 全体画像内で注意の焦点に関する画像データを処理するためのシステムと方法 |
JP2018504040A (ja) * | 2015-03-27 | 2018-02-08 | レイセオン カンパニー | 電流−周波数変換器 |
WO2017122395A1 (ja) * | 2016-01-12 | 2017-07-20 | ソニー株式会社 | 画像データ処理回路および撮像回路 |
US10572967B2 (en) | 2016-01-12 | 2020-02-25 | Sony Corporation | Image data processing circuit and imaging circuit |
US10891706B2 (en) | 2016-09-08 | 2021-01-12 | Sony Corporation | Arithmetic device and sensor to track movement of object between frames |
JP2021511699A (ja) * | 2018-01-18 | 2021-05-06 | バルブ コーポレーション | センサ集積回路を含むヘッドマウントディスプレイのためのポジショントラッキングシステム |
JP7207809B2 (ja) | 2018-01-18 | 2023-01-18 | バルブ コーポレーション | センサ集積回路を含むヘッドマウントディスプレイのためのポジショントラッキングシステム |
Also Published As
Publication number | Publication date |
---|---|
US20060081765A1 (en) | 2006-04-20 |
JP3902741B2 (ja) | 2007-04-11 |
US7098437B2 (en) | 2006-08-29 |
US7244919B2 (en) | 2007-07-17 |
US20030141434A1 (en) | 2003-07-31 |
US20060081767A1 (en) | 2006-04-20 |
US8244788B2 (en) | 2012-08-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2003218338A (ja) | 半導体集積回路装置 | |
US20180046900A1 (en) | Sparse convolutional neural network accelerator | |
Komuro et al. | A dynamically reconfigurable SIMD processor for a vision chip | |
Kyrkou et al. | A parallel hardware architecture for real-time object detection with support vector machines | |
Moussalli et al. | Fast and flexible conversion of geohash codes to and from latitude/longitude coordinates | |
CN115461712A (zh) | 用于存储器内计算的可缩放阵列架构 | |
US11461651B2 (en) | System on a chip with deep learning accelerator and random access memory | |
US10404930B2 (en) | Pixel processing apparatus of processing bad pixel and removing noise, and image signal processing apparatus and image processing system each including the same | |
US20200082246A1 (en) | Scalable multi-die deep learning system | |
Zhang et al. | PIMCA: A programmable in-memory computing accelerator for energy-efficient DNN inference | |
CN108364298B (zh) | 用于将像素识别为局部极值点的方法和布置 | |
WO1999063751A1 (en) | Low-power parallel processor and imager integrated circuit | |
WO2022015967A1 (en) | High endurance memory circuitry | |
Yousefzadeh et al. | Energy-efficient in-memory address calculation | |
US20220350863A1 (en) | Technology to minimize the negative impact of cache conflicts caused by incompatible leading dimensions in matrix multiplication and convolution kernels without dimension padding | |
US20230105329A1 (en) | Image signal processor and image sensor including the image signal processor | |
Kondo et al. | Pseudo MIMD array processor—AAP2 | |
Dudek | A flexible global readout architecture for an analogue SIMD vision chip | |
Vink et al. | Caffe barista: Brewing caffe with fpgas in the training loop | |
US11907118B2 (en) | Interleaved data conversion to change data formats | |
Landis et al. | Evaluation of computing in memory architectures for digital image processing applications | |
Kim et al. | An augmented reality processor with a congestion-aware network-on-chip scheduler | |
US20230385624A1 (en) | Computing in memory with artificial neurons | |
US11385873B2 (en) | Control speculation in dataflow graphs | |
EP4318326A2 (en) | Unified programming interface for regrained tile execution |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20051213 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060210 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060912 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061101 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20061205 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070104 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110112 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120112 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130112 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130112 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |