JP2005518048A - 平行なデータバス上のデータを結合するための方法及び装置 - Google Patents

平行なデータバス上のデータを結合するための方法及び装置 Download PDF

Info

Publication number
JP2005518048A
JP2005518048A JP2003570257A JP2003570257A JP2005518048A JP 2005518048 A JP2005518048 A JP 2005518048A JP 2003570257 A JP2003570257 A JP 2003570257A JP 2003570257 A JP2003570257 A JP 2003570257A JP 2005518048 A JP2005518048 A JP 2005518048A
Authority
JP
Japan
Prior art keywords
data
processing unit
processor device
group
register
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
JP2003570257A
Other languages
English (en)
Inventor
ドレッシャー・ヴォルフラム
Original Assignee
フィリップス・セミコンダクターズ・ドレスデン・アクチェンゲゼルシャフト
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フィリップス・セミコンダクターズ・ドレスデン・アクチェンゲゼルシャフト filed Critical フィリップス・セミコンダクターズ・ドレスデン・アクチェンゲゼルシャフト
Publication of JP2005518048A publication Critical patent/JP2005518048A/ja
Ceased legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/30003Arrangements for executing specific machine instructions
    • G06F9/30007Arrangements for executing specific machine instructions to perform operations on data operands
    • G06F9/3001Arithmetic instructions
    • G06F9/30014Arithmetic instructions with variable precision
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/30003Arrangements for executing specific machine instructions
    • G06F9/30007Arrangements for executing specific machine instructions to perform operations on data operands
    • G06F9/30036Instructions to perform operations on packed data, e.g. vector, tile or matrix operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/30Arrangements for executing machine instructions, e.g. instruction decode
    • G06F9/38Concurrent instruction execution, e.g. pipeline or look ahead
    • G06F9/3885Concurrent instruction execution, e.g. pipeline or look ahead using a plurality of independent parallel functional units

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Physics (AREA)
  • Multi Processors (AREA)
  • Advance Control (AREA)
  • Image Processing (AREA)
  • Bus Control (AREA)

Abstract

平行なデータ処理をするためのストリップ構造を有するプロセッサ装置において、高い時間消費と結びつくことのない、個々のストリップからのローカルのデータを結合することを可能にするため、方法側で、異なった処理ユニット(2)の入力、中間及び/又は出力データを、少なくとも部分的に組み合わせのクロック制御されない操作を介して結合することが提案される。この方法で、異なったストリップからのローカルのデータの必要な結合は、プロセッサ装置での平行なデータ処理を本質的に遅延させない。従って、特に、結合の総結果を個々のクロックサイクル内で提供することが可能である。更に、本発明は、この方法に対応する、少なくとも部分的に組み合わせのクロック制御されない結合装置を有するプロセッサ装置に関する。

Description

本発明は、請求項1の上位概念による平行なデータバス(Datenpfaden)からのデータを結合するための方法並びに請求項8の上位概念による対応するプロセッサ装置に関する。
平行なデータ処理をするためのプロセッサは、相当前から公知である。そのアーキテクチャにとって特徴的であるのは、複数の処理ユニットを設けることであり、これらの処理ユニットによって、データの平行な処理を提供することができる。このようなアーキテクチャもしくは対応する方法は、例えば特許文献1に記載されている。この場合、データは、データメモリ内で複数の要素を有するデータグループへと分割され、1つの同じアドレスの下に記憶される。データグループのそれぞれの要素に、1つの処理ユニットが割り当てられており、その際、全ての要素は、同時かつ並行にデータメモリから読み出され、入力データとして1つ又は複数の処理ユニットへと分割され、これらの処理ユニット内でクロック制御されて平行に処理される。平行な処理ユニットは、通信ユニットを介して互いに接続されている。1つの処理ユニットは、少なくとも1つのプロセスユニットとメモリユニットとを有し、通常は同じ構造の少なくとも1つの別のストリップと隣接している1つのストリップに配設されている。
このようなSIMD(Single Instruction Multiple Data)ベクトルプロセッサ内で、それぞれのデータ要素は、説明した平行なデータバス(ストリップ)内で処理される。処理すべきプログラムに依存して、部分結果は、データ要素又はデータグループとしてグループメモリに書き込むことができる。しかしながら、事情によっては、平行なデータバスからのデータをまとめることが必要となり得る。例えば、ベクトルプロセッサ上でアルゴリズムを実行する場合は、ローカルで計算された、複数のストリップ又は更には全てのストリップからのデータを互いにグローバルの中間結果に結合する必要があり得る。このため、これまで、ストリップの部分結果は、所望の中間結果に達するために、複数のクロックサイクルを介する1つのプログラムによって保証されていた。このグローバルの中間結果がアルゴリズムの後続の計算のために必要とされる場合、最終結果の計算が遅延させられる。
独国特許第198 35 216号明細書
従って、本発明の課題は、前記のプロセッサ装置において、高い時間消費が結びつくことのない、個々のストリップからのローカルのデータを結合することを可能にする機能性を提供することにある。
方法側では、この課題は、異なった処理ユニットの入力、中間及び/又は出力データが、少なくとも部分的に組み合わせのクロック制御されない少なくとも1つの操作を介して結合されることによって解決される。
驚くほど簡単な方法で、組み合わせのクロック制御されない操作を設けることによって、異なった処理ユニットに割り当てられているデータは、迅速に結合することができ、従って、必要な結合によって、プロセッサ装置内での平行なデータ処理は、本質的に遅延されない。特に、これにより、結合の総結果を個々のクロックサイクル内で提供することが可能である。特に、プロセッサ装置上で経過する特殊なアルゴリズムの加速された処理を提供するために、結合操作によって、全ての処理ユニットからのデータが結合される場合が有効である。
本発明の基本的な思想は、論理操作にも算術操作にも転用可能であり、従って、原理的に、異なった処理ユニットもしくは平行なデータバスからのデータの考えられる全ての結合が、本発明により実行することができる。
本発明の有利な形成にあっては、操作を実施する際に、少なくとも部分ステップ内で冗長な数字表現を使用することができる。特に加算又は減算のような算術操作の場合、桁上げがデータの全ての桁で同時に構成され、次の部分ステップのために使用することができ、従って、操作の部分ステップ内で、後続の桁のための処理を遅延させる桁上げの処理は、何ら生じない。従って、部分ステップ内で、桁上げベクトルは、ほぼ和ベクトルと同じように迅速に普及させることを得ることができる。和及び桁上げベクトルが組み合わされる最後の部分ステップにおいてのみ、結果の遅延が、「波及」効果によって生じる。
任意のアルゴリズムの全ての可能な要求を正しく評価するために、ローカルのデータの結合の結果として、個々のデータ要素又は更にはデータグループも発生させられ、従って、本発明によれば、異なったストリップからの任意のデータ源が互いに結合され、結果は、プロセッサ装置の任意のデータ受信装置に導くことができる。
有利な実施形にあっては、操作の結果を処理ユニットにフィードバックすることができ、これにより、特に帰納的なアルゴリズムを、本発明によってより迅速に実行することができる。
有効なことに、複数の備えられた、組み合わせのクロック制御されない操作からのデータの結合のために、個々の操作を選択することができる。これにより、複数のアルゴリズムもしくは複雑なアルゴリズムは、プロセッサ装置内のローカルのデータの異なった複数の結合によって置換することができる。
装置側で、この課題は、プロセッサ装置が少なくとも部分的に組み合わせのクロック制御されない結合装置を備え、この結合装置が、異なったストリップからのデータを、特に異なった処理ユニットの入力、中間及び/又は出力データを互いに結合することによって解決される。
この本発明による装置は、アルゴリズムが一定の場合に必要な、異なったストリップからのローカルのデータの結合が、従来技術に対してより迅速に実行することができ、従って、さもなければ生じる平行なデータ処理における遅延が回避される。
本発明の有利な実施形にあっては、結合装置が、加算回路、減算回路及び/又は最小値/最大値を構成するための回路を有することができ、この回路内で、データのある桁での論理装置における操作の部分ステップを実行するための所定の段階での桁上げが、先行する桁の結果に依存せずに確認可能である。結合装置は、ほとんど全ての部分ステップ内でそれぞれ生じる桁上げが、後続の桁の計算のためには考慮されないように構成することができる。和ベクトル及び桁上げベクトルが結合されている結合回路の部分においてのみ、公知の遅延が生じる。
複数のストリップにわたる最小値/最大値を構成するための結合回路の場合、それぞれの計算段階の間でそれぞれの極値以外に極値のストリップを示すインデックスも転送される場合が有利である。
他のストリップからのデータと、1つのデータバス、即ちストリップ内の異なったデータを結合するためのプロセッサ装置が、このような複数の結合装置を備え、これらの結合装置が、プログラム制御されて選択可能であることが有効である。この方法で、例えば、同じデータを種々に論理的又は算術的に結合することも可能である。
結合装置の出力は、更にまた実施形に応じて、プロセッサ装置の任意のレジスタと、例えば処理ユニットのレジスタと、又は更にはデータグループが登録可能であるグローバルのレジスタとも接続することができる。
切替え装置の不必要なエネルギー消費を回避するために、結合装置の少なくとも1つの入力レジスタに、1つの制御装置が割り当てられており、この制御装置によって、入力レジスタ及びこれによりそのデータが結合装置から分離可能であるように設けることができる。従って、結合装置が、少なくとも部分的に組み合わせでクロック制御されないで作業するので、所定の時点では必要でないか、もしくは未だ全ての入力データが存在しないにもかかわらず、結合装置の入力データの変化が自動的に装置をキックオフすることを回避することができる。
本発明を、以下で、添付図に関連した幾つかの実施形の説明によって解説する。
図1は、本発明により形成された模範的なプロセッサ装置を概略図に示す。このプロセッサ装置は、グループメモリ1を有し、このグループメモリ内に、データグループが1つのアドレスの下に記憶可能であり、その際、個々のデータグループは、複数のデータ要素を備える。ストリップ構造内には、それぞれ1つの入力レジスタR...R及び出力レジスタRR...RRを有する処理ユニット2が配設されている。レジスタは、特殊な実施形に応じて、レジスタセットとしても形成することができ、従って、複数の入力もしくは出力レジスタを有することができる。出力レジスタRR〜RRの後に配設されたグローバルの結合装置5は、入力段階で組み合わせのクロック制御されない加算回路として形成されている。処理ユニット2とグループメモリ1との間には、更にグローバルの通信ユニット3が配設されており、この通信ユニットを介して、グループメモリからのデータが、それぞれの処理ユニット2に供給することができる。更に、データグループ又はデータグループの少なくとも1つの要素は、通信ユニットを迂回して直接割り当てられた処理ユニットと接続可能である。データグループは、同時かつ平行にデータメモリから読み出され、複数の処理ユニットへと分割され、そしてこれらの処理ユニット2内で平行に処理される。これらの処理ユニットは、それぞれ少なくとも1つのプロセスユニットと算術ロジックユニットとを有し、しかしながら、これらのユニットは、図には図示されてない。何故なら、これらのユニットは、本発明を理解するために重要ではないからである。
レジスタが、レジスタセットとして形成されている場合、それぞれ処理ユニットと割り当てられた入力レジスタセットもしくは出力レジスタセットとの間に、更に少なくとも1つの入力結合ロジックもしくは少なくとも1つの出力結合ロジックを配設することができ、これらの結合ロジックと、1つのデータバス内の1つのレジスタセットのレジスタが接続可能である。グループメモリ1からの1つのデータグループのそれぞれの要素に、説明したように、直接割り当てられた処理ユニットに供給できるか、通信ユニットによって、他の処理ユニットへと分配できるかのいずれかである。入力レジスタR...Rを介して、データは、それぞれの処理ユニット2内に達し、その際、処理の結果は、それぞれの出力レジスタRR...RR内に書き込まれる。これらの結果データは、更にまた直接グループメモリ1内に書き込むことができるか、通信ユニット3によって分配することができる。
隣接する処理ユニット2の間に、ローカルの結合装置4が配設されており、この結合装置によって、隣接する両方の処理ユニット2からのデータは、組み合わせのクロック制御されない結合装置と結合され、その際、結果は、両方の処理ユニットの一方に逆に書き込まれる。両方のデータ要素は、ローカルの結合装置4内で組み合わせのクロック制御されないネットワークを介してXOR(排他的論理和)結合され、これにより、結果を確認するためのいかなる付加的なクロックサイクルも必要なく、結果が更に処理される処理ユニットは、いかなる内部遅延も受けない。
上で説明したように、全ての出力レジスタRR...RRは、グローバルの結合装置5と接続されており、この結合装置内で、全て(N+1)の処理ユニット2の個々の出力データが加算される。結合装置5の加算回路は、図3において4ストリップのプロセッサ装置のために図示されており、その際、図の簡単さのために、4ビットのデータワードが結合装置内で加算される。第1の段階S1で、4つの全加算器VAによって、レジスタRR,RR及びRRからの3つのデータワードD0〜D2の個々のビットが加算され、その際、結果は、それぞれ第2の段階S2の割り当てられた全加算器に与えられ、桁上げCは、第2の段階S2内の次の桁の全加算器で行なわれる。図面では、データワードの桁は、Dijで指示されており、その際、iは、データワード(即ちストリップ)を、またjは、データワードの桁を確定する。入力値として、第2の段階の4つの全加算器VAに、第4のストリップのレジスタRRからの第4のデータワードD3のそれぞれのビットも加えられる。結合装置の第1及び第2の段階で、桁上げCは、後続の桁の全加算器で桁上げされないので、全ての計算は、両方の段階S1及びS2内で同時かつ直ちに全加算器の入力部へのデータの登録と共に実行することができる。半加算器HA及び後に接続された連続する3つの全加算器VAを有する最後の段階で初めて、後続の桁の全加算器でのより低い桁の桁上げCが転送され、従って、図3に図示された結合装置は、最後の部分段階内の3つの桁上げ転送で間に合い、この部分段階は、容易に個々のクロックサイクル内で実行される。結果として、6ビットのデータワードGが生じ、このデータワードは、結合装置の最後の段階で、桁上げ及び和ベクトルの結合によって生じる。結果ワードのより高い桁は、データグループを構成するためにゼロでもって満たされ(図3では図示されてない)、制御装置7を介して、グローバルの通信ユニット3へと導かれ、この通信ユニットから、計算されたデータグループは、グループメモリ内に記憶されるか、処理装置へと分配されるかのいずれかである。
両方の第1の段階S1,S2は、組み合わせでクロック制御されないで実行されるので、グローバルの結合装置5のそれぞれの入力は、ラッチの形の制御可能なゲート6を備え、このゲートによって、出力レジスタRR...RR内の変化は、グローバルの結合装置5内に導入することができる。これにより、1つの処理ユニットの1つの出力レジスタ内の変化が、グローバルの結合装置5がデータを結合し、これが常にエネルギー消費に結びついているということに自動的に通じることが回避される。この方法で、データの結合は、結合装置内で結合されるデータが必要とされるか、もしくはその後で全ての入力データが存在するような時点でキックオフすることができる。
組み合わせの結合装置の他の実施形によれば、この結合装置は、付加的なXOR結合部を設けることによって減算回路として形成されているか、又はスライド装置又はインバータを有することができる。
本発明の図示されてない別の実施形にあっては、複数のストリップを介して最大値を構成するための結合装置が形成されている。この装置は、複数の計算段階を備え、これらの計算段階では、それぞれ2つのストリップのデータが互いに減算される。結果が負である場合は減数が、結果が正である場合は被減数が、次の計算段階に転送される。同時に、インデックスがこの計算段階に引き渡され、このインデックスは、ストリップを示し、このストリップに、これまで考慮されたストリップの極値が存在する。従って、8つのストリップを介して最大値を構成する場合、3ビットのインデックスと、7つの計算段階が必要である。これらの計算段階は、カスケード状に、しかしながらまた少なくとも部分的に平行に処理するように形成することができる。
図2は、概略図に本発明による別のプロセッサ装置を示し、このプロセッサ装置の場合、グローバルの結合装置8が、入力レジスタR...Rと接続されている。結合装置8は、分離され独立した2つのロジック装置を有し、これらのロジック装置の内の1つは、制御ライン11によって選択することができる。第1のロジック装置は、データグループを発生させ、このデータグループは、グローバルのデータフィードバック10を介してグローバルの通信ユニット3にフィードバックされる。これに対して、第2のロジック装置では、データ要素が発生させられ、このデータ要素は、ローカルのデータフィードバック9を介して第2のストリップの処理ユニット2の入力レジスタRへとフィードバックされる。
第1の本発明によるプロセッサアーキテクチャの概略図を示す。 第2の本発明によるプロセッサアーキテクチャの概略図を示す。 異なった平行なデータバスからのデータを結合するための結合装置の模範的な構成を示す。
符号の説明
0 ストリップ
1 グループメモリ
2 処理ユニット
3 グローバルの通信ユニット
4 ローカルの結合装置
5 グローバルの結合装置
6 制御装置/ラッチ
7 制御装置
8 グローバルの結合装置
9 ローカルのデータフィードバック
10 グローバルのデータフィードバック
11 グローバルの結合装置のための制御ライン
S1 加算回路の第1の段階
S2 加算回路の第2の段階
S3 加算回路の第3の段階
入力レジスタ(i=0...N)
RR 出力レジスタ(i=0...N)
データワード(i=0...3)
VA 全加算器
HA 半加算器
C 全加算器の桁上げ
Gj 和の第jの桁(j=0...5)

Claims (13)

  1. データが、データメモリ内に、複数の要素を有するデータグループへと分割されて1つの同じアドレスの下に記憶され、このアドレスから読み出され、そして処理ユニットに供給され、その際、1つのデータグループのそれぞれの要素に、1つの処理ユニットが割り当てられ、1つのデータグループの全ての要素が、同時かつ並行にデータメモリから読み出され、入力データとして1つ又は複数の処理ユニットへと分割され、この処理ユニット内でクロック制御されて平行に処理される、プロセッサ装置内の平行なデータバスからのデータを結合するための方法において、
    異なった処理ユニット(2)の入力、中間及び/又は出力データ(D)が、少なくとも部分的に組み合わせのクロック制御されない少なくとも1つの操作を介して結合されることを特徴とする方法。
  2. 操作によって、全ての処理ユニット(2)のデータ(D)が結合されることを特徴とする請求項1に記載の方法。
  3. データが、論理的及び/又は算術的な操作を介して結合されることを特徴とする請求項1又は2に記載の方法。
  4. 操作を実行する際に、操作の少なくとも1つの部分ステップ(S1;S2)内で冗長な数字表現が使用され、特に桁上げがデータの全ての桁で同時に構成され、それぞれ次の部分ステップ(S2;S3)のために使用されることを特徴とする請求項1〜3のいずれか1つに記載の方法。
  5. 操作の結果として、データ要素又はデータグループが発生させられることを特徴とする請求項1〜4のいずれか1つに記載の方法。
  6. 操作の結果が、少なくとも1つの処理ユニット(2)又はこの処理ユニットに割り当てられたレジスタ(R,RR)にフィードバックされることを特徴とする請求項1〜5のいずれか1つに記載の方法。
  7. データの結合のために、複数の組み合わせのクロック制御されない操作の1つが選択されることを特徴とする請求項1〜6のいずれか1つに記載の方法。
  8. グループメモリ内に、複数の要素を有する少なくとも1つのデータグループが1つのアドレスの下に記憶されており、それぞれのデータ要素に、同じ構造の別のストリップと隣接している1つのストリップ内に配設されている少なくとも1つのプロセスユニット(MAC)と少なくとも1つのメモリユニットから成る処理ユニットが割り当てられている、グループメモリとして形成されたデータメモリと、通信ユニットを介して互いに接続されている平行な処理ユニットとによる平行なクロック制御されたデータ処理をするためのプロセッサ装置において、
    少なくとも部分的に組み合わせのクロック制御されない結合装置(4,5,8)が設けられており、この結合装置が、異なったストリップ(0)からのデータを、特に異なった処理ユニット(2)の入力、中間及び/又は出力データ(D)を互いに結合することを特徴とするプロセッサ装置。
  9. 結合装置(5)が、加算回路、減算回路及び/又は最小値/最大値を構成するための回路を有し、この回路内で、桁上げが所定の段階(S1,S2)でデータのある桁で先行する桁に依存せずに確認可能であることを特徴とする請求項8に記載のプロセッサ装置。
  10. 最小値/最大値を構成するための回路が、複数の計算段階を備え、これらの計算段階で、2つのストリップのデータのそれぞれ1回の減算が実行可能であり、その際、後続の計算段階に、1つのストリップを示すインデックスとそれぞれの極値が導入可能であることを特徴とする請求項9に記載のプロセッサ装置。
  11. このような複数の結合装置が設けられており、これらの結合装置の内の1つが、プログラム制御されて選択可能であることを特徴とする請求項8〜10のいずれか1つに記載のプロセッサ装置。
  12. 結合装置(5)の出力が、処理ユニットのレジスタか、データグループに割り当てられているレジスタに割り当てられていることを特徴とする請求項8〜11のいずれか1つに記載のプロセッサ装置。
  13. 結合装置(4,5,8)の少なくとも1つの入力レジスタに、1つの制御装置(6)が割り当てられており、この制御装置によって、レジスタデータが結合装置(4,5,8)から分離可能であることを特徴とする請求項8〜12のいずれか1つに記載のプロセッサ装置。
JP2003570257A 2002-02-18 2003-02-12 平行なデータバス上のデータを結合するための方法及び装置 Ceased JP2005518048A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE10206830A DE10206830B4 (de) 2002-02-18 2002-02-18 Verfahren und Anordnung zur Zusammenführung von Daten aus parallelen Datenpfaden
PCT/DE2003/000417 WO2003071431A2 (de) 2002-02-18 2003-02-12 Verfahren und anordnung zur zusammenführung von daten auf parallelen datenpfaden

Publications (1)

Publication Number Publication Date
JP2005518048A true JP2005518048A (ja) 2005-06-16

Family

ID=27674728

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003570257A Ceased JP2005518048A (ja) 2002-02-18 2003-02-12 平行なデータバス上のデータを結合するための方法及び装置

Country Status (6)

Country Link
US (1) US7779229B2 (ja)
EP (1) EP1476806B1 (ja)
JP (1) JP2005518048A (ja)
AU (1) AU2003210141A1 (ja)
DE (2) DE10206830B4 (ja)
WO (1) WO2003071431A2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2798464B8 (en) * 2011-12-30 2019-12-11 Intel Corporation Packed rotate processors, methods, systems, and instructions
CN106164850B (zh) * 2014-03-07 2018-11-27 索尼公司 用于阵列处理器的数据推测
JP2017174291A (ja) 2016-03-25 2017-09-28 ルネサスエレクトロニクス株式会社 画像処理装置、画像処理方法、及び自動車制御装置

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4507748A (en) * 1982-08-02 1985-03-26 International Telephone And Telegraph Corporation Associative processor with variable length fast multiply capability
US5129092A (en) * 1987-06-01 1992-07-07 Applied Intelligent Systems,Inc. Linear chain of parallel processors and method of using same
US6038584A (en) * 1989-11-17 2000-03-14 Texas Instruments Incorporated Synchronized MIMD multi-processing system and method of operation
US6070003A (en) * 1989-11-17 2000-05-30 Texas Instruments Incorporated System and method of memory access in apparatus having plural processors and plural memories
US5212777A (en) * 1989-11-17 1993-05-18 Texas Instruments Incorporated Multi-processor reconfigurable in single instruction multiple data (SIMD) and multiple instruction multiple data (MIMD) modes and method of operation
US5197140A (en) * 1989-11-17 1993-03-23 Texas Instruments Incorporated Sliced addressing multi-processor and method of operation
US5471593A (en) * 1989-12-11 1995-11-28 Branigin; Michael H. Computer processor with an efficient means of executing many instructions simultaneously
DE59010674D1 (de) * 1990-04-20 1997-04-17 Siemens Ag CORDIC-Prozessor für Vektordrehungen in Carry-Save-Architektur
US5765012A (en) * 1990-11-13 1998-06-09 International Business Machines Corporation Controller for a SIMD/MIMD array having an instruction sequencer utilizing a canned routine library
US5765015A (en) * 1990-11-13 1998-06-09 International Business Machines Corporation Slide network for an array processor
US5423051A (en) * 1992-09-24 1995-06-06 International Business Machines Corporation Execution unit with an integrated vector operation capability
JP3401823B2 (ja) 1993-03-31 2003-04-28 ソニー株式会社 画像コーデック用プロセッサ
JPH07146781A (ja) * 1993-11-19 1995-06-06 Sony Corp プロセツサ
JPH0830577A (ja) 1994-07-15 1996-02-02 Mitsubishi Electric Corp Simdプロセッサ
US5822606A (en) * 1996-01-11 1998-10-13 Morton; Steven G. DSP having a plurality of like processors controlled in parallel by an instruction word, and a control processor also controlled by the instruction word
US6401194B1 (en) * 1997-01-28 2002-06-04 Samsung Electronics Co., Ltd. Execution unit for processing a data stream independently and in parallel
JPH10254839A (ja) * 1997-03-11 1998-09-25 Sony Corp Simd制御並列プロセッサおよび演算方法
US5973705A (en) * 1997-04-24 1999-10-26 International Business Machines Corporation Geometry pipeline implemented on a SIMD machine
GB2325535A (en) * 1997-05-23 1998-11-25 Aspex Microsystems Ltd Data processor controller with accelerated instruction generation
US6088782A (en) * 1997-07-10 2000-07-11 Motorola Inc. Method and apparatus for moving data in a parallel processor using source and destination vector registers
US7197625B1 (en) * 1997-10-09 2007-03-27 Mips Technologies, Inc. Alignment and ordering of vector elements for single instruction multiple data processing
US6044448A (en) * 1997-12-16 2000-03-28 S3 Incorporated Processor having multiple datapath instances
JP3391262B2 (ja) * 1998-05-11 2003-03-31 日本電気株式会社 記号計算システム及び方法、並びに並列回路シミュレーションシステム
DE19835216B4 (de) * 1998-08-05 2005-10-27 Systemonic Ag Prozessor und Verfahren zur parallelen Datenverarbeitung
US6163839A (en) * 1998-09-30 2000-12-19 Intel Corporation Non-stalling circular counterflow pipeline processor with reorder buffer
EP0992917B1 (en) * 1998-10-06 2007-07-04 Texas Instruments Inc. Linear vector computation
US6308252B1 (en) * 1999-02-04 2001-10-23 Kabushiki Kaisha Toshiba Processor method and apparatus for performing single operand operation and multiple parallel operand operation
JP4138180B2 (ja) * 1999-10-08 2008-08-20 日本テキサス・インスツルメンツ株式会社 プロセッサ
ATE529802T1 (de) * 2000-02-09 2011-11-15 Texas Instruments Inc Datenverarbeitungsvorrichtung
US6665790B1 (en) * 2000-02-29 2003-12-16 International Business Machines Corporation Vector register file with arbitrary vector addressing
US6732253B1 (en) * 2000-11-13 2004-05-04 Chipwrights Design, Inc. Loop handling for single instruction multiple datapath processor architectures
US6675268B1 (en) * 2000-12-11 2004-01-06 Lsi Logic Corporation Method and apparatus for handling transfers of data volumes between controllers in a storage environment having multiple paths to the data volumes
US7028286B2 (en) * 2001-04-13 2006-04-11 Pts Corporation Methods and apparatus for automated generation of abbreviated instruction set and configurable processor architecture
US7394052B2 (en) * 2001-07-30 2008-07-01 Nippon Telegraph And Telephone Corporation Parallel processing logic circuit for sensor signal processing
US6968445B2 (en) * 2001-12-20 2005-11-22 Sandbridge Technologies, Inc. Multithreaded processor with efficient processing for convergence device applications

Also Published As

Publication number Publication date
EP1476806A2 (de) 2004-11-17
EP1476806B1 (de) 2007-07-25
AU2003210141A8 (en) 2003-09-09
US7779229B2 (en) 2010-08-17
WO2003071431A3 (de) 2004-04-08
DE50307765D1 (de) 2007-09-06
WO2003071431A2 (de) 2003-08-28
AU2003210141A1 (en) 2003-09-09
DE10206830A1 (de) 2003-09-04
DE10206830B4 (de) 2004-10-14
US20060090060A1 (en) 2006-04-27

Similar Documents

Publication Publication Date Title
US11645224B2 (en) Neural processing accelerator
US10417004B2 (en) Pipelined cascaded digital signal processing structures and methods
JP2866606B2 (ja) 命令実行順の回転式優先順位選択回路
US7971172B1 (en) IC that efficiently replicates a function to save logic and routing resources
US6411980B2 (en) Data split parallel shifter and parallel adder/subtractor
CN113064852B (zh) 一种可重构处理器及配置方法
JP2983542B2 (ja) 処理高速化装置
JP6308095B2 (ja) 演算回路及び演算回路の制御方法
JP2006518144A (ja) プログラム可能な論理セルのアレイをもつ電子回路
JP2005518048A (ja) 平行なデータバス上のデータを結合するための方法及び装置
JPH0756712A (ja) 数値計算を実行するプロセスおよびそのプロセスを実現する演算装置
US7313586B2 (en) Adder-subtracter circuit
US9787290B2 (en) Resource-saving circuit structures for deeply pipelined systolic finite impulse response filters
KR102286101B1 (ko) 데이터 처리장치 및 내로우잉 앤 라운딩 산술연산을 행하는 방법
US8150949B2 (en) Computing apparatus
JPS622328B2 (ja)
WO2011000799A1 (en) Multi-bit carry chain
JPH05324694A (ja) 再構成可能並列プロセッサ
JPWO2012077185A1 (ja) 10進絶対値加算器
CN115390924A (zh) 指令执行方法、执行引擎、处理器、芯片及电子设备
JPH04257025A (ja) シリアル入力の乗算回路
JPH04227336A (ja) 復号器
CN117667011A (zh) 一种数字信号处理模块中的后加器
Donohoe Reconfigurable data path processor
JP5115307B2 (ja) 半導体集積回路

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20051031

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071214

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080115

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080414

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080421

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080514

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080521

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080715

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090818

A045 Written measure of dismissal of application [lapsed due to lack of payment]

Free format text: JAPANESE INTERMEDIATE CODE: A045

Effective date: 20100112