JPH09503324A - 画素ブロックの比較のためのプロセッサ(ブロックマッチングプロセッサ) - Google Patents

画素ブロックの比較のためのプロセッサ(ブロックマッチングプロセッサ)

Info

Publication number
JPH09503324A
JPH09503324A JP7510054A JP51005495A JPH09503324A JP H09503324 A JPH09503324 A JP H09503324A JP 7510054 A JP7510054 A JP 7510054A JP 51005495 A JP51005495 A JP 51005495A JP H09503324 A JPH09503324 A JP H09503324A
Authority
JP
Japan
Prior art keywords
processor
unit
search area
data
memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7510054A
Other languages
English (en)
Other versions
JP3453145B2 (ja
Inventor
デ フォース ルック
シェービンガー マッティアス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens AG filed Critical Siemens AG
Publication of JPH09503324A publication Critical patent/JPH09503324A/ja
Application granted granted Critical
Publication of JP3453145B2 publication Critical patent/JP3453145B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/533Motion estimation using multistep search, e.g. 2D-log search or one-at-a-time search [OTS]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/223Analysis of motion using block-matching
    • G06T7/231Analysis of motion using block-matching using full search
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/43Hardware specially adapted for motion estimation or compensation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 本願対象は、有利にはブロックメモリ(ADM)、探索領域メモリ(SDM)、2次元のプロセッサ/レジスタセルフィールド(PRA)および制御ユニット(CTRL)が半導体チップに集積されており、探索領域メモリ(SDM)の語幅が、プロセッサ/レジスタセルフィールド(PRA)がシステムクロック(CLK)毎にその都度、探索領域の新しい完全な列の画素のデータ(SD)が並列に供給されるように、編成されているプロセッサに関する。このプロセッサでは制御ユニット(CTRL)に制御シーケンスが記憶されており、該制御シーケンスはシステムクロック毎に並列にデータ流制御信号(DFC)およびアドレス(ADR1,ADR2)をブロックメモリおよび探索領域メモリに対して送出し、その際制御ユニットは実質的に、外部の制御信号(CD)によって任意の制御シーケンスが書き込み可能であるシフトレジスタから成っている。重要な利点は、不完全な探索に基づいているブロック・マッチング・アルゴリズムにおいても、匹敵し得る高度なハードウェア利用が実現されることである。

Description

【発明の詳細な説明】 画素ブロックの比較のためのプロセッサ(ブロックマッチングプロセッサ) 動き推定の領域におけるこの形式のプロセッサは、例えばビデオ補償のための ハイブリッドコード化または動き補償された補間の場合におけるように、多数の 用途において使用される。その際種々の方法、しかも種々のパラメータ組み合わ せを支援することができるようにするために、フレキシブルな解決法が望ましい 。このための例はとりわけ、変位領域におけるサブサンプリング、所謂候補生( Kanditat)ベクトルの探索、ピクセル間引きおよびサブピクセル精度を有する計 算である。 全目的デジタル信号プロセッサまたはフレキシブルなビデオプロセッサは通例 、要求される計算能力に対しても、必要なI/O帯域幅に対しても設計されてい ない。 このために必要な高い計算能力は、2次元のセルフィールドによって実現する ことができる。しかしこの場合外部のデータはセルフィールド縁を介してしか供 給することができないので、使用可能な高い計算能力は一般に不完全にしか利用 することができず、結果的に通例、利用効率の著しい低下が見られた。 これまで、上述の2次元のセルフィールドの、例えば100%までの高い利用 効率は、完全な探索に基づいているブロック・マッチング・アルゴリズムの専用 具体化実現においてしか可能でなかった。 刊行物 IEEE Transactions on Circuits and Systems,Vol.36,No.10,1 989年10月、第1309ないし1316頁には、完全な探索に基づいている ブロック・マッチング・アルゴリズムに対するパラメータ化可能なVLSIアー キテクチャが記載されている。 不完全な探索、即ちその都度の探索領域内で可能な変位ベクトルすべてが探索 されないとき、計算された結果の部分量しか必要とされない。確かに、重要なイ ベントまたはセルフィールドにおける考察すべきプロセッサエレメントのフレキ シブルな選択によって、不完全な探索に基づいているブロック・マッチング・ア ルゴリズムを実現することができるが、このために、プロセッサ回路の利用効率 が著しく低減されることになる。 そこで本発明の課題は、不完全な探索に基づいているブロック・マッチング・ アルゴリズムの場合でも、出来るだけ高度なハードウェアの利用を可能にする、 2次元のセルフィールドを有する、画素ブロックの比較のためのプロセッサ(ブ ロックマッチングプロセッサ)を提供することである。 この課題は本発明によれば、請求項1の特徴部分に記載の構成によって解決さ れる。 請求項2ないし7の対象は、本発明の有利な実施例に向いている。 本発明を図面を用いて詳細に説明する。その際 第1図は、不完全な探索を説明するための線図、 第2図は、2次元のセルフィールドを有する本発明のプロセッサのブロック回路 図、 第3図は、第2図に含まれているセルフィールドの詳細回路図、 第4図は、第3図に含まれているプロセッサエレメントの詳細回路図である。 第1図には、点として図示されている11*13=143個の生じ得る変位と 、中心点としての変位0,0とを有する変位フィールドの例が示されている。不 完全な探索に基づいているブロック・マッチング・アルゴリズムに対しては、完 全な探索の場合におけるように、すべての変位が必要とされず、第1図において 太く示されている点として図示されている変位1…9のみが必要とされる。従来 のプロセッサ、即ち引き続き必要とされる変位の選択が行われる完全な変位では この場合例えば僅か9つしか必要とされないにも拘わらず、11*13=143 個の計算が実施される。 これに対して本発明のプロセッサによって、第1図に太線で示されている矢印 が表すミアンダ状のデータ 流が可能であり、その際必要な計算数は143から34に低減することができる 。従って、セルフィールドの利用効率は、6%から26%に向上する。 刊行物 IEEE Transactions on Circuits and Systems,Vol.36,No.10,1 989年10月、第1309ないし1316頁に詳細に記載されているように、 タイプ1またはタイプ2のセルフィールドを有するプロセッサが可能であり、そ の際タイプ1のセルフィールドは大域的な累算を行いかつタイプ2のセルフィー ルドは局所的な累算作用をする。 本発明のプロセッサは基本的にタイプ1のセルフィールドを有することができ るが、タイプ2のセルフィールドを有していても構わず、その際タイプ1のセル フィールドの方が不完全な探索の場合通例、ハードウェア利用効率の点で有利で ある。 第2図には、画素ブロックの比較のための、本発明のプロセッサのブロック回 路が示されており、該プロセッサは、プロセッサ/レジスタセルフィールドPR Aと、探索領域メモリSDMと、ブロックメモリADMと、制御ユニットCTR Lと、場合によっては付加的に推定変位ベクトルDVを形成するためのユニット VUと、帰還結合レジスタR1を備えた最小値形成ユニットMINとを有してい る。第2図において、語幅と、16*16個の画素を有するその時点で扱われて いる画素ブロック(現画素ブロックと称す)および4 8*48個の画素から成る探索領域に対するメモリ仕様とが例示されている。現 画素ブロックのデータに対するブロックメモリADMにはカメラから直接または 外部の画豫メモリからシステムクロックCLK毎に例えば、グレー値または色値 に相応する、1画素に対する8ビットが供給される。ブロックメモリADMは、 それぞれ、16個の画素に対する列および行から構成された画像ブロックのよう な2つの同一のユニットから成っており、その際画素当たり8ビットが設けられ ている。これらのユニットは、ブロックメモリへのデータの読み込みおよびプロ セッサ/レジスタセルフィールドPRAへのデータの読み出しに対する交番作動 において使用される。ブロックメモリADMの出力側において、システムクロッ ク毎に並列に、ここでは16*8ビットを有する列を現データADとしてプロセ ッサ/レジスタセルフイールドPRAに読み出すことができる。その都度16個 のシステムクロックにおいて、外部画像メモリから、現画素ブロックの完全な列 をブロックメモリADMに読み込むことができる。 探索領域はここでは例えば48行および48列を有しかつ探索領域メモリSD Mの列はブロックメモリADMの列と同時にロードしなければならないので、探 索領域メモリSDMには外部画像メモリMからシステムクロック毎に3*8ビッ トが供給され、その際その都度16個のシステムクロックの後、ここでは48* 8個のビットを有する探索領域の1列を探索領域メモリSDMに読み込むことが できる。探索領域メモリSDMの出力側において、システムクロック毎に、並列 に、ここでは48*8個のビットを有する列を探索領域データとして、プロセッ サ/レジスタセルフィールドPRAに読み込むことができる。探索領域メモリS DMはこの場合、48*64*8ビットの編成を有している。その理由は、その 都度2つの連続する探索領域が48*32ビットの領域においてオーバラップさ れかつ48*48個の画素のブロックからその都度読み出されかつ16*48個 の画素のブロックにその都度書き込まれるからである。この場合本発明にとって 重要なのは、探索領域メモリSDMに完全にデータが書き込まれるや否や、その 都度の探索領域内で、探索領域メモリからプロセッサ/レジスタセルフィールド PRAへの、相応の列の再ロードによって、最大16個のシステムクロック内で 任意のシフトが可能であるということである。このシフトは水平方向にはセルフ ィールド出力側の方向においてのみ行われかつ垂直方向には下方向にも上方向に も行われる。 第3図には、大域的な累算用のプロセッサ/レジスタセルフィールドPRAが 詳細に示されている。有利には現画素ブロックの画素当たり1つのプロセッサユ ニットが設けられている。即ち、16*16個の画素の場合、プロセッサユニッ トPE1,1… PE16 ,16が設けられている。探索領域列はここでは48個の画素を含んでいるので 、プロセッサユニットのそれぞれの列は上側が16個のレジスタによっておよび 下側が16個のレジスタによって補充されている。従って第3図に図示のプロセ ッサ/レジスタセルフィールドの第1列は、上から下に向かって、16個のレジ スタRE1,1… RE16,16、16個のプロセッサユニットPE1,1… PE16,1および別の16個のレジスタユニットRE1,1′… RE16 ,1′から成っている。プロセッサ/レジスタセルフィールドの別の列は相応に 編成されており、その際最後の列は16個のレジスタユニットRE1,16… RE16,16、16個のプロセッサユニットPE1,16… PE16,16 および別の16個のレジスタユニットRE1,16′… RE16,16′から 成っている。レジスタユニットRE1,16… RE16,16にはそれぞれ、 8ビット幅の出力データSD1…SD16が供給され、プロセッサユニットPE 1,16… PE16,16にはそれぞれ8ビット幅の、探索領域メモリSDM の出力データSD17…SD32が供給されかつレジスタユニットRE1,16 ′… RE16,16′にはそれぞれ例えば8ビット幅の、探索領域メモリSD Mの出力データSD33…SD48が供給される。プロセッサ/レジスタセルフ ィールドにおける純然たるシフト動作を回避するため に、供給されるデータを循環的に交換するための装置も考えられる。これにより 利用効率は一層改善される。プロセッサユニットPE1,16… PE16,1 6には更にそれぞれ、例えば8ビット幅の、ブロックメモリADMの出力データ AD1…AD16が供給される。その際16列目のプロセッサユニットは探索領 域データおよび中間結果に対する現データを15列目のプロセッサユニットに転 送し、以下も同様なことが行われ、ひいては第1列の中間結果を中間結果出力側 、例えばZOを介して加算器装置ADDに送出することができる。 その際加算器装置ADDは例えば、2進加算器ツリーから、即ち第1レベルで は3つの加算器、第2レベルでは4つの加算器、第3レベルでは2つの加算器お よび第4レベルでは1つの加算器から成っている。その際加算器装置ADDの出 力側に、現画素ブロックに対するデータと、探索領域によって制限された、比較 画像の部分の画素のデータとの差から成る絶対値和基準Nが形成される。 プロセッサユニットに相応して、16列目のレジスタユニットRE1,16… RE16,16′はデータを15列目のレジスタユニットに転送し、最終的にレ ジスタユニットRE1,1… RE16,1′まで続けられる。レジスタユニッ トおよびプロセッサユニットないしレジスタユニットおよびレジスタユニット間 の双方向のデータ搬送が可能であり、その際1システムクロックの期間に、デー タはその都度1行づつ先に送ることができる。 第4図には、プロセッサユニットPEの詳細回路が示されており、その際プロ セッサユニットPE自体はは、レジスタユニットREも含んでいる。レジスタユ ニットREはマルチプレクサMUXと、後置接続されているレジスタR2から成 り、レジスタの出力側は同時に、レジスタユニットREないしプロセッサユニッ トPEの探索領域データ出力信号DFCを送出する。2ビット幅のデータ流制御 信号DFCに依存して、隣接行の探索領域データ入力信号SDIi+1およびSD Ii-1並びにデータ流方向において先行する隣接列の探索領域データ入力信号S DIiがレジスタR3の入力側に交互に通し接続される。レジスタR2の出力側 は、隣接行におけるレジスタユニットに対する探索領域データ出力信号SDOi+ 1 およびSDIi-1並びにデータ流方向において後続する、セルフィールドの列の レジスタユニットに対する探索領域データ出力信号SDOiを送出する。現画素 ブロックのデータに対する入力信号ADIはプロセッサユニットPEにおいてレ ジスタR3を介してそれぞれの出力側に転送され、その際プロセッサユニットP Eの出力側に、現画素ブロックのデータに対する出力信号ADOが現れる。 レジスタユニットREの他に、プロセッサユニット PEは、スイッチSW、レジスタR4、減算器絶対値形成ユニットBおよび加算 ユニットAを含んでいる。ブロックの処理の間、スイッチSWは開放されかつバ ッファレジスタR4に記憶された、現画素ブロックのデータが、減算器絶対値形 成ユニットBのプラス入力側に加えられる。新しいブロックがロードされたとき 初めて、スイッチSWが閉成されかつバッファレジスタR4には新しい現画素ブ ロックのデータがロードされる。減算器絶対値形成ユニットBのマイナス入力側 には信号SDOiが供給されかつ減算器絶対値形成ユニットの出力側は加算ユニ ットAの入力側に接続されており、該加算ユニットの第2入力側には、セルフィ ールドの、データ流方向において先行する列の中間結果に対する入力信号が供給 されかつその出力側からは、データ流方向において後続する列の出力信号ZOが 送出される。 局所的な累算に対するプロセッサ/レジスタセルフィールドは第3図に相応し て構成されており、その際実質的に次の相異点がある。即ち、中間結果はプロセ ッサユニット間で転送されるのではなくて、プロセッサユニット自体において引 き続き処理されかつ別のマルチプレクサを介して、それぞれのプロセッサエレメ ントの加算ユニットAの出力側に基準が達するかまたはデータ流方向において先 行するプロセッサエレメントの基準が基準NとしてセルフィールドPRAの出力 側に達する。 制御ユニットCTRLは有利には、システムクロックCLKによってタイミン グ制御されかつ外部制御データCDによって内容が任意にプログラミングされる シフトレジスタから成っている。シフトレジスタまたは相応に編成された別の書 き込み/読み出しメモリに対して択一的に、基本的に、固定値メモリに基づいた 制御ユニットも考えられる。その際制御ユニットは、その際制御ユニットは、そ の中に、システムクロックCLK毎に並列にデータ流制御信号DFC、ブロック メモリのアドレス指定のためのアドレスADR1および探索領域メモリのアドレ ス指定のための別のアドレスADR2を送出する制御シーケンスが記憶可能であ るように、変形されなければならない。 プロセッサにおいて、絶対値和基準Nのみならず、推定変位ベクトルDVも計 算されるべきときは、プロセッサにおいて付加的に、最小値を確定するためのユ ニットMIN並びに付加的に推定変位ベクトルDVを形成するためのユニットV Uが設けられている。その際ユニットMINの出力信号はレジスタR1を介して ユニットMINの入力側に帰還結合されかつユニットMINの別の入力側にはプ ロセッサ/レジスタセルフィールドの絶対値和基準Nが供給される。 ユニットVUの構成に応じて、制御ユニットCTRLのデータ流制御信号DF Cを用いて、または第2図 に破線で示されているように、制御ユニットCTRLに付加的に記憶されている 、制御ユニットの出力信号VDを用いて、それぞれのユニットVUにおいて推定 変位ベクトルDVを形成することができる。その際付加的な出力信号VDは、ベ クトルデータ自体においてまたはベクトルデータのアドレスにおいて構成するこ とができる。 変位ベクトルDVを形成するためにデータ流制御信号DFCのみが用いられる とき、推定ベクトルDVのそれぞれの要素に対するユニットVUは、データ流制 御信号DFCによって正または負の計数パルスを得ることができかつその都度1 つの保持素子が後置接続されている計数器を含んでいる。その際保持素子では、 その都度の絶対値和基準Nがその都度の最小基準NMINに相応する限り、計数 器の出力側に現れる、その都度の変位ベクトルが記憶される。 制御ユニットCRTLの付加的な出力信号VDがベクトルアドレスから成って いる場合には、ユニットVUにおいて計数器ではなくて、ベクトルアドレスによ ってアドレス指定されるベクトルメモリが設けられている。更に、ユニットVU において、変位ベクトルのそれぞれの要素に対して保持素子が設けられており、 該保持素子において、その都度の絶対値和基準Nがその都度の最小基準NMIN に相応する限り、変位ベクトルのその都度の要素が記憶される。 制御ユニットの付加的な出力信号VDがその都度の変位ベクトル自体から構成 されている場合、その都度の変位ベクトルは、その都度の絶対値和基準Nがその 都度の最小基準NMINに相応する限り、保持素子に推定変位ベクトルとして転 送される。 本発明のプロセッサの有利な実施例によれば、プロセッサはメモリADMおよ びSDMとともに半導体チップ上にモノリシックに集積されている。
【手続補正書】特許法第184条の8 【提出日】1995年10月11日 【補正内容】 これまで、上述の2次元のセルフィールドの、例えば100%までの高い利用 効率は、完全な探索に基づいているブロック・マッチング・アルゴリズムの専用 具体化実現においてしか可能でなかった。 刊行物 IEEE Transactions on Circuits and Systems,Vol.36,No.10,1 989年10月、第1309ないし1316頁には、完全な探索に基づいている ブロック・マッチング・アルゴリズムに対するパラメータ化可能なVLSIアー キテクチャが記載されている。 不完全な探索、即ちその都度の探索領域内で可能な変位ベクトルすべてが探索 されないとき、計算された結果の部分量しか必要とされない。確かに、重要なイ ベントまたはセルフィールドにおける考察すべきプロセッサエレメントのフレキ シブルな選択によって、不完全な探索に基づいているブロック・マッチング・ア ルゴリズムを実現することができるが、このために、プロセッサ回路の利用効率 が著しく低減されることになる。 ヨーロッパ特許出願公開第0395293号公報から、比較プロセッサを有す る動き推定装置が公知であり、ここではとりわけ最小の変位ベクトルが求められ る。 そこで本発明の課題は、不完全な探索に基づいているブロック・マッチング・ アルゴリズムの場合でも、 出来るだけ高度なハードウェアの利用を可能にする、2次元のセルフィールドを 有する、画素ブロックの比較のためのプロセッサ(ブロックマッチングプロセッ サ)を提供することである。 請求の範囲 1.2つの現画素ブロックのデータに対するブロックメモリ(ADM)と、比 較画像の画素のデータに対する探索領域メモリ(SDM)と、2次元のプロセッ サ/レジスタセルフィールド(PRA)と、制御ユニット(CTRL)とが設け られており、ここにおいてそれぞれの探索領域は行および列から成っており、 前記探索領域メモリはその語幅が、前記プロセッサ/レジスタセルフィールドに システムクロック(CKL)毎にその都度、その都度の探索領域の完全な列の画 素のデータが並列に供給されるように、編成されており、 距離計算のための前記プロセッサ/レジスタセルフィールドにおいて、前記現画 素ブロックに対するデータと、前記その都度の探索領域によって制限される、比 較画像の部分の画素のデータとの差から絶対値和基準(N)が形成されかつ該絶 対値は累算される 画素ブロックの比較のためのプロセッサ(ブロックマッチングプロセッサ)にお いて、 前記探索領域メモリは2つの探索領域のデータを含んでおり、ここにおいて該2 つの探索領域は、探索領域交代の際にプロセッサ/レジスタセルフィールドの再 ロードを短縮するために、相互に水平方向にオーバラップしており、 前記制御ユニットおいて、システムクロック(CLK)毎に並列に、データ流制 御信号(DFC)、前記ブロックメモリのアドレス指定のためのアドレス(AD R1)、前記その都度の探索領域メモリのアドレス指定のための別のアドレス( ADR2)を送出する制御シーケンスが記憶されており、 前記制御ユニット(CTRL)は外部制御データ(CD)によってプログラミン グされかつ 前記システムクロック(CLK)によってタイミング制御されるシフトレジスタ が設けられており、該シフトレジスタに、前記制御データ(CD)によって、そ の都度の比較法(ブロック・マッチング・アルゴリズム)に依存している、フレ キシブルな制御シーケンスが書き込まれ、該制御シーケンスは、前記制御ユニッ トの出力信号(DFC,ADR1,ADR2、場合によりVD)を、その都度の 比較法に依存している、現画素ブロックと比較画像の探索領域のブロックとの間 の原理的に生じ得るすべての変位の部分のみが比較される(不完全な探索)よう に発生する ことを特徴とする画素ブロックの比較のためのプロセッサ(ブロックマッチング プロセッサ)。 2.前記プロセッサ/レジスタセルフィールドに最小値を確定するためのユニ ット(MIN)が後置接続されており、該ユニットにおいて絶対値和基準(N) から最小基準(NMIN)が求められ、 付加的に推定変位ベクトル(DV)を形成するためのユニット(VU)が設けら れており、 前記絶対値和基準(N)が前記最小基準(NMIN)に相応するとき、前記制御 ユニット(CTRL)の出力信号(DFCないしVD)の部分から、前記推定変 位ベクトル(DV)が発生される 請求項1記載のプロセッサ。 3.前記推定変位ベクトル(DV)を形成するためのユニット(VU)は変位 ベクトルのそれぞれの要素に対して計数器を含んでおり、該計数器にはデータ流 制御信号(DFC)が供給され、かつ 前記計数器にそれぞれ保持素子が後置接続されており、該保持素子において、前 記計数器の出力側に現れるその都度の変位ベクトルが、その都度の絶対値和基準 (N)がその都度の最小基準(NMIN)に相応する限り、記憶される 請求項2記載のプロセッサ。 4.前記推定変位ベクトル(DV)を形成するためのユニット(VU)に、ベ クトルメモリが設けられており、該ベクトルメモリは前記制御ユニットの出力信 号(VD)の部分によってアドレス指定されかつ 前記推定変位ベクトル(DV)を形成するためのユニット(VU)は推定ベクト ルのそれぞれの要素に対して1つの保持素子を含んでおり、該保持素子に、その 都度の変位ベクトルが、その都度の絶対値和基準(N )がその都度の最小基準(NMIN)に相応する限り、記憶される 請求項2記載のプロセッサ。 5.前記推定変位ベクトル(DV)を形成するためのユニット(VU)に、前 記制御ユニットの出力信号(VD)の部分が直接供給され、その際前記出力信号 の部分はその都度の変位ベクトル自体に相応しかつ 前記推定変位ベクトル(DV)を形成するためのユニット(VU)は推定ベクト ルのそれぞれの要素に対して1つの保持素子を含んでおり、該保持素子に、その 都度の変位ベクトルが、その都度の絶対値和基準(N)がその都度の最小基準( NMIN)に相応する限り、記憶される 請求項2記載のプロセッサ。 6.当該プロセッサは半導体チップ上にモノリシックに集積されている 請求項1から5までのいずれか1項記載のプロセッサ。

Claims (1)

  1. 【特許請求の範囲】 1.2つの現画素ブロックのデータに対するブロックメモリ(ADM)と、2 つの水平方向に隣接する探索領域によって制限される、比較画像の部分の画素の データに対する探索領域メモリ(SDM)と、2次元のプロセッサ/レジスタセ ルフィールド(PRA)と、制御ユニット(CTRL)とが設けられており、こ こにおいてそれぞれの探索領域は行および列から成っており、 前記探索領域メモリはその語幅が、前記プロセッサ/レジスタセルフィールドに システムクロック(CKL)毎にその都度、その都度の探索領域の完全な列の画 素のデータが並列に供給されるように、編成されており、 前記プロセッサ/レジスタセルフィールドにおいて、前記現画素ブロックに対す るデータと、前記その都度の探索領域によって制限される、比較画像の部分の画 素のデータとの差から絶対値和基準(N)が形成されかつ 前記制御ユニットおいて、システムクロック(CLK)毎に並列に、データ流制 御信号(DFC)、前記ブロックメモリのアドレス指定のためのアドレス(AD R1)、前記その都度の探索領域メモリのアドレス指定のための別のアドレス( ADR2)を送出する制御 シーケンスが記憶されている ことを特徴とする画素ブロックの比較のためのプロセッサ(ブロック・マッチン グ・プロセッサ)。 2.前記制御ユニット(CTRL)は外部制御データ(CD)によってプログ ラミングされかつ 前記システムクロック(CLK)によってタイミング制御されるシフトレジスタ が設けられており、該シフトレジスタに、前記制御データ(CD)によって、そ の都度の比較法(ブロック・マッチング・アルゴリズム)に依存している、フレ キシブルな制御シーケンスが書き込まれ、該制御シーケンスは、前記制御ユニッ トの出力信号(DFC,ADR1,ADR2、場合によりVD)を、その都度の 比較法に依存している、現画素ブロックと比較画像の探索領域のブロックとの間 の原理的に生じ得るすべての変位の部分のみが比較される(不完全な探索)よう に発生する 請求項1記載のプロセッサ。 3.前記プロセッサ/レジスタセルフィールドに最小値を確定するためのユニ ット(MIN)が後置接続されており、該ユニットにおいて絶対値和基準(N) から最小基準(NMIN)が求められ、 付加的に推定変位ベクトル(DV)を形成するためのユニット(VU)が設けら れており、 前記絶対値和基準(N)が前記最小基準(NMIN)に相応するとき、前記制御 ユニット(CTRL)の出 力信号(DFCないしVD)の部分から、前記推定変位ベクトル(DV)が発生 される 請求項1または2記載のプロセッサ。 4.前記推定変位ベクトル(DV)を形成するためのユニット(VU)は変位 ベクトルのそれぞれの要素に対して計数器を含んでおり、該計数器にはデータ流 制御信号(DFC)が供給され、かつ 前記計数器にそれぞれ保持素子が後置接続されており、該保持素子において、前 記計数器の出力側に現れるその都度の変位ベクトルが、その都度の絶対値和基準 (N)がその都度の最小基準(NMIN)に相応する限り、記憶される 請求項3記載のプロセッサ。 5.前記推定変位ベクトル(DV)を形成するためのユニット(VU)に、ベ クトルメモリが設けられており、該ベクトルメモリは前記制御ユニットの出力信 号(VD)の部分によってアドレス指定されかつ 前記推定変位ベクトル(DV)を形成するためのユニット(VU)は推定ベクト ルのそれぞれの要素に対して1つの保持素子を含んでおり、該保持素子に、その 都度の変位ベクトルが、その都度の絶対値和基準(N)がその都度の最小基準( NMIN)に相応する限り、記憶される 請求項3記載のプロセッサ。 6.前記推定変位ベクトル(DV)を形成するため のユニット(VU)に、前記制御ユニットの出力信号(VD)の部分が直接供給 され、その際前記出力信号の部分はその都度の変位ベクトル自体に相応しかつ 前記推定変位ベクトル(DV)を形成するためのユニット(VU)は推定ベクト ルのそれぞれの要素に対して1つの保持素子を含んでおり、該保持素子に、その 都度の変位ベクトルが、その都度の絶対値和基準(N)がその都度の最小基準( NMIN)に相応する限り、記憶される 請求項3記載のプロセッサ。 7.当該プロセッサは半導体チップ上にモノリシックに集積されている 請求項1から6までのいずれか1項記載のプロセッサ。
JP51005495A 1993-09-30 1994-09-23 画素ブロックの比較のためのプロセッサ(ブロックマッチングプロセッサ) Expired - Fee Related JP3453145B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
DE4333476.8 1993-09-30
DE4333476 1993-09-30
PCT/DE1994/001113 WO1995009404A1 (de) 1993-09-30 1994-09-23 Prozessor zum vergleich von bildpunkt-blöcken (block-matching-prozessor)

Publications (2)

Publication Number Publication Date
JPH09503324A true JPH09503324A (ja) 1997-03-31
JP3453145B2 JP3453145B2 (ja) 2003-10-06

Family

ID=6499156

Family Applications (1)

Application Number Title Priority Date Filing Date
JP51005495A Expired - Fee Related JP3453145B2 (ja) 1993-09-30 1994-09-23 画素ブロックの比較のためのプロセッサ(ブロックマッチングプロセッサ)

Country Status (5)

Country Link
US (1) US5805239A (ja)
EP (1) EP0721633B1 (ja)
JP (1) JP3453145B2 (ja)
DE (1) DE59401987D1 (ja)
WO (1) WO1995009404A1 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3226020B2 (ja) * 1997-05-28 2001-11-05 日本電気株式会社 動きベクトル検出装置
ES2138545B1 (es) * 1997-11-04 2000-08-16 Univ Castilla La Mancha Sistema de computacion para la realizacion de acumulacion espacio-temporal de activacion en señales digitales.
US20060259737A1 (en) * 2005-05-10 2006-11-16 Telairity Semiconductor, Inc. Vector processor with special purpose registers and high speed memory access
US20070150697A1 (en) * 2005-05-10 2007-06-28 Telairity Semiconductor, Inc. Vector processor with multi-pipe vector block matching

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB8909498D0 (en) * 1989-04-26 1989-06-14 British Telecomm Motion estimator

Also Published As

Publication number Publication date
WO1995009404A1 (de) 1995-04-06
EP0721633A1 (de) 1996-07-17
US5805239A (en) 1998-09-08
EP0721633B1 (de) 1997-03-05
JP3453145B2 (ja) 2003-10-06
DE59401987D1 (de) 1997-04-10

Similar Documents

Publication Publication Date Title
TW302444B (en) Full-search block matching motion estimation processor
US5586202A (en) Motion detecting apparatus
US6862035B2 (en) System for matching stereo image in real time
JP2636674B2 (ja) 動画像の動きベクトル検出装置
US5696836A (en) Motion estimation processor architecture for full search block matching
US20080133881A1 (en) Array of processing elements with local registers
US10540734B2 (en) Processor, system, and method for efficient, high-throughput processing of two-dimensional, interrelated data sets
JPH11510994A (ja) デジタル化ビデオシーケンス符号器における運動推定回路
US5659364A (en) Motion vector detection circuit
Nicol A systolic approach for real time connected component labeling
Baglietto et al. Parallel implementation of the full search block matching algorithm for motion estimation
EP0380521B1 (en) PARALLEL PIPELINE IMAGE PROCESSOR WITH 2x2 WINDOW ARCHITECTURE
JP3453145B2 (ja) 画素ブロックの比較のためのプロセッサ(ブロックマッチングプロセッサ)
WO1999063751A1 (en) Low-power parallel processor and imager integrated circuit
US5946405A (en) Block-matching motion estimation apparatus under use of linear systolic array architecture
JP3832431B2 (ja) 画像処理装置
JP3041658B2 (ja) 高並列動き補償演算器
GB2214751A (en) Video signal coding
JPH05300497A (ja) 画像処理装置及びディジタル信号処理プロセッサ
KR100359091B1 (ko) 움직임추정장치
Jong et al. Parallel architectures of 3-step search block-matching algorithm for video coding
EP0974103A2 (en) Method and apparatus for half pixel sad generation
KR100246033B1 (ko) 고속 실시간 처리 움직임 추정을 위한 연산방법 및 이를 위한 연산장치
JP4345273B2 (ja) 動きベクトル検出装置および動きベクトル検出方法
JP2002057994A (ja) 画像信号処理装置およびその方法

Legal Events

Date Code Title Description
S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees