JPH07141175A - アクティブメモリおよび処理方式 - Google Patents
アクティブメモリおよび処理方式Info
- Publication number
- JPH07141175A JPH07141175A JP6115229A JP11522994A JPH07141175A JP H07141175 A JPH07141175 A JP H07141175A JP 6115229 A JP6115229 A JP 6115229A JP 11522994 A JP11522994 A JP 11522994A JP H07141175 A JPH07141175 A JP H07141175A
- Authority
- JP
- Japan
- Prior art keywords
- memory
- data
- circuit
- broadcast
- bus
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 title claims description 23
- 238000012546 transfer Methods 0.000 claims abstract description 17
- 230000004044 response Effects 0.000 claims abstract description 9
- 238000003672 processing method Methods 0.000 claims description 2
- 238000000034 method Methods 0.000 description 15
- 238000007792 addition Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 206010008531 Chills Diseases 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000013256 coordination polymer Substances 0.000 description 1
- 238000010130 dispersion processing Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/76—Architectures of general purpose stored program computers
- G06F15/78—Architectures of general purpose stored program computers comprising a single central processing unit
- G06F15/7807—System on chip, i.e. computer system on a single chip; System in package, i.e. computer system on one or more chips in a single package
- G06F15/7821—Tightly coupled to memory, e.g. computational memory, smart memory, processor in memory
Abstract
(57)【要約】
【目的】 データおよび計算結果を保持する記憶位置の
ローおよびカラムを含むデータメモリを含むアクティブ
メモリを提供する。 【構成】 ブロードキャストメモリ22は制御命令を保
持する記憶位置のローおよびカラムを含んでいる。デー
タメモリ20から検索された第1および第2のデータ語
を使用して第1の演算を実施しかつ第1の演算結果およ
び前の演算結果を使用して第2の演算を実施する計算回
路26が設けられる。制御回路24がブロードキャスト
メモリ22から受信した制御命令に応答してデータメモ
リ20から前記計算回路26への第1および第2のデー
タ語の転送と第1および第2の演算の実施を制御するよ
うに作動する。
ローおよびカラムを含むデータメモリを含むアクティブ
メモリを提供する。 【構成】 ブロードキャストメモリ22は制御命令を保
持する記憶位置のローおよびカラムを含んでいる。デー
タメモリ20から検索された第1および第2のデータ語
を使用して第1の演算を実施しかつ第1の演算結果およ
び前の演算結果を使用して第2の演算を実施する計算回
路26が設けられる。制御回路24がブロードキャスト
メモリ22から受信した制御命令に応答してデータメモ
リ20から前記計算回路26への第1および第2のデー
タ語の転送と第1および第2の演算の実施を制御するよ
うに作動する。
Description
【0001】
【産業上の利用分野】本発明は一般的にデータ処理に関
し、特に分散信号処理装置、方式および方法に関する。
し、特に分散信号処理装置、方式および方法に関する。
【0002】
【従来の技術】コンピュータシステムにより実施される
タスクの複雑さが増すにつれ、中央処理装置(CPU)
の負担、システムメモリサイズ、およびシステムアドレ
スおよびデータバスのトラフィックも全て増大しつつあ
る。特に、行列計算、音声合成、画像信号処理、および
デジタル信号処理に関連するタスクの多くは計算集約的
であり最終結果を得る前に沢山の基本的な算術演算を実
行する必要のある場合が多い。例えば、デジタル信号処
理応用ではドット積を計算する必要のある場合が多い。
ドット積の計算にはいくつかの乗算および加算を実施す
る必要があり、その各々が従来の処理方式ではシステム
中央処理装置により実施しなければならない。さらに、
中間和および積を記憶して演算の進行につれてメモリか
ら検索しなければならない。したがって、CPUには全
ての算術演算を実施するタスクだけでなくメモリに対す
るデータ転送を制御するタスクの負担もかかる。したが
ってメモリは初期生データおよび全ての中間結果を処理
するのに充分な大きさでなければならない。最後に、た
とえ多数のCPUを使用しても、アドレス、データおよ
び結果が交換されるため関連するアドレスおよびデータ
バスのトラフィックが重要となる。
タスクの複雑さが増すにつれ、中央処理装置(CPU)
の負担、システムメモリサイズ、およびシステムアドレ
スおよびデータバスのトラフィックも全て増大しつつあ
る。特に、行列計算、音声合成、画像信号処理、および
デジタル信号処理に関連するタスクの多くは計算集約的
であり最終結果を得る前に沢山の基本的な算術演算を実
行する必要のある場合が多い。例えば、デジタル信号処
理応用ではドット積を計算する必要のある場合が多い。
ドット積の計算にはいくつかの乗算および加算を実施す
る必要があり、その各々が従来の処理方式ではシステム
中央処理装置により実施しなければならない。さらに、
中間和および積を記憶して演算の進行につれてメモリか
ら検索しなければならない。したがって、CPUには全
ての算術演算を実施するタスクだけでなくメモリに対す
るデータ転送を制御するタスクの負担もかかる。したが
ってメモリは初期生データおよび全ての中間結果を処理
するのに充分な大きさでなければならない。最後に、た
とえ多数のCPUを使用しても、アドレス、データおよ
び結果が交換されるため関連するアドレスおよびデータ
バスのトラフィックが重要となる。
【0003】
【発明が解決しようとする課題】したがって、計算集約
的応用をより効率的に処理する装置、方式および方法に
対するニーズが生じている。このような装置、方式およ
び方法はCPUのタスク負担を軽減し、所要メモリ量を
最少限に抑え、バスの帯域幅を効率的に使用するもので
なければならない。さらに、このような装置、方式およ
び方法は現在利用できるデバイスおよびシステム構成と
互換性のあるものでなければならない。
的応用をより効率的に処理する装置、方式および方法に
対するニーズが生じている。このような装置、方式およ
び方法はCPUのタスク負担を軽減し、所要メモリ量を
最少限に抑え、バスの帯域幅を効率的に使用するもので
なければならない。さらに、このような装置、方式およ
び方法は現在利用できるデバイスおよびシステム構成と
互換性のあるものでなければならない。
【0004】
【課題を解決するための手段】データおよび計算結果を
保持する記憶位置のローおよびカラムを含むデータメモ
リを有するアクティブメモリが提供される。制御命令を
保持する記憶位置のローおよびカラムを含むブロードキ
ャスト(broadcast)メモリも提供される。デ
ータメモリから検索される第1および第2のデータ語を
使用して第1の演算を実施しかつ第1の演算結果および
前の演算結果を使用して第2の演算を実施する計算回路
が含まれる。ブロードキャストメモリから受信する制御
命令に応答して作動する制御回路がデータメモリから計
算回路への第1および第2のデータ語の転送および第1
および第2の演算の実施を制御する。
保持する記憶位置のローおよびカラムを含むデータメモ
リを有するアクティブメモリが提供される。制御命令を
保持する記憶位置のローおよびカラムを含むブロードキ
ャスト(broadcast)メモリも提供される。デ
ータメモリから検索される第1および第2のデータ語を
使用して第1の演算を実施しかつ第1の演算結果および
前の演算結果を使用して第2の演算を実施する計算回路
が含まれる。ブロードキャストメモリから受信する制御
命令に応答して作動する制御回路がデータメモリから計
算回路への第1および第2のデータ語の転送および第1
および第2の演算の実施を制御する。
【0005】本発明の概念に包含される装置、方式およ
び方法により計算集約的応用はより効率的に処理され
る。例えば、本発明の概念を包含するアクティブメモリ
デバイスを使用したシステムにより分散処理を実現する
ことができる。分散処理によりCPUのタスク負担が軽
減され、所要メモリ量が最少限に抑えられ、バスの帯域
幅がより効率的に使用される。
び方法により計算集約的応用はより効率的に処理され
る。例えば、本発明の概念を包含するアクティブメモリ
デバイスを使用したシステムにより分散処理を実現する
ことができる。分散処理によりCPUのタスク負担が軽
減され、所要メモリ量が最少限に抑えられ、バスの帯域
幅がより効率的に使用される。
【0006】
【実施例】本発明の概念を包含するアーキテクチュアを
使用した処理システム10を図1に示す。処理システム
10はデータバス16およびアドレスバス18を介して
いくつかのアクティブメモリデバイス14に接続されて
いる中央処理装置(CPU)12を含んでいる。図1の
アーキテクチュアにおいて、主システム制御および計算
機能は例えば汎用マイクロプロセッサ、マイクロコント
ローラ、デジタル信号プロセッサ、もしくはグラフィッ
クプロセッサとすることができるCPU12により提供
される。後記するように、一般的なシステム操作に必要
なデータおよび命令記憶を行う他に、アクティブメモリ
デバイス14は問題解決操作に必要な分散計算およびデ
ータ処理を行う。
使用した処理システム10を図1に示す。処理システム
10はデータバス16およびアドレスバス18を介して
いくつかのアクティブメモリデバイス14に接続されて
いる中央処理装置(CPU)12を含んでいる。図1の
アーキテクチュアにおいて、主システム制御および計算
機能は例えば汎用マイクロプロセッサ、マイクロコント
ローラ、デジタル信号プロセッサ、もしくはグラフィッ
クプロセッサとすることができるCPU12により提供
される。後記するように、一般的なシステム操作に必要
なデータおよび命令記憶を行う他に、アクティブメモリ
デバイス14は問題解決操作に必要な分散計算およびデ
ータ処理を行う。
【0007】実施例のシステム10では、代表的に行列
演算や音声合成時に必要な繰返し計算等のデータ集約的
計算がアクティブメモリデバイス14を使用して分散的
に実施される。例えば、CPU12は所与の問題に必要
な生データのサブセットを各アクティブメモリ14にロ
ードすることができる。各アクティブメモリ14は次
に、CPU12が同時に他のタスクを実施できる間に、
対応するデータサブセットに所与の演算セットを実施す
る。アクティブメモリ14へ分散されたタスクが完了す
ると、CPU12は結果を検索して問題の解決を完了す
る。好ましくは、システム10内の各アクティブメモリ
14は選択された従来の(“イナクティブ”)メモリユ
ニットのピン配置(例えば、28ピンpinout)と
互換性のあるピン配置を有している。このようにして、
アクティブメモリ14および従来のイナクティブメモリ
を所与のボードや他の支持構造上で交替させることがで
きる。
演算や音声合成時に必要な繰返し計算等のデータ集約的
計算がアクティブメモリデバイス14を使用して分散的
に実施される。例えば、CPU12は所与の問題に必要
な生データのサブセットを各アクティブメモリ14にロ
ードすることができる。各アクティブメモリ14は次
に、CPU12が同時に他のタスクを実施できる間に、
対応するデータサブセットに所与の演算セットを実施す
る。アクティブメモリ14へ分散されたタスクが完了す
ると、CPU12は結果を検索して問題の解決を完了す
る。好ましくは、システム10内の各アクティブメモリ
14は選択された従来の(“イナクティブ”)メモリユ
ニットのピン配置(例えば、28ピンpinout)と
互換性のあるピン配置を有している。このようにして、
アクティブメモリ14および従来のイナクティブメモリ
を所与のボードや他の支持構造上で交替させることがで
きる。
【0008】CPU12にかかる計算負担を最少限に抑
える他に、アクティブメモリデバイス14を使用した分
散処理によりデータバス16およびアドレスバス18を
より効率的に利用することができる。本質的に、アクテ
ィブデバイス14によりデータが圧縮すなわち低減され
てデータバス16を介した生データおよび中間結果の交
換およびアドレスバス18を介した対応するアドレス送
信が実質的に低減されるようになされる。
える他に、アクティブメモリデバイス14を使用した分
散処理によりデータバス16およびアドレスバス18を
より効率的に利用することができる。本質的に、アクテ
ィブデバイス14によりデータが圧縮すなわち低減され
てデータバス16を介した生データおよび中間結果の交
換およびアドレスバス18を介した対応するアドレス送
信が実質的に低減されるようになされる。
【0009】本発明の概念を包含するアクティブメモリ
14の機能ブロック図を図2に示す。アクティブメモリ
14はデータランダムアクセスメモリ20(RAM)、
ブロードキャストRAM22、コントローラ24および
データパス26を含むシングルチップもしくはモジュー
ル(“デバイス”)として構成することができる。シン
グルチップの実施例では、データRAM20およびブロ
ードキャストRAM22は所与のデバイスセットに対し
て標準化された構成として製造することができコントロ
ーラ24およびデータパス26は所与のデバイスもしく
はデバイスのサブセットの動作要求に適合するようにカ
ストマイズされる。
14の機能ブロック図を図2に示す。アクティブメモリ
14はデータランダムアクセスメモリ20(RAM)、
ブロードキャストRAM22、コントローラ24および
データパス26を含むシングルチップもしくはモジュー
ル(“デバイス”)として構成することができる。シン
グルチップの実施例では、データRAM20およびブロ
ードキャストRAM22は所与のデバイスセットに対し
て標準化された構成として製造することができコントロ
ーラ24およびデータパス26は所与のデバイスもしく
はデバイスのサブセットの動作要求に適合するようにカ
ストマイズされる。
【0010】データRAM20はスタティックランダム
アクセスメモリ(SRAM)もしくはダイナミックラン
ダムアクセスメモリアレイ(DRAM)とすることがで
きる。図2において、RAM20は128ロー128カ
ラム構成とされたRAMセルの2K×8メモリとして示
されている。図2に示す構成の他に、いくつかの交番R
AMアーキテクチュアのいずれかを使用することもでき
ることがお判りと思われる。データRAM20にはロー
アドレス回路28を含むアレイ内の選定セルに対してデ
ータを読み取りおよび書き込む回路と、ローアドレスマ
ルチプレクサ30と、第1段復号(カラムアドレス)回
路32と、カラムアドレスマルチプレクサ34と、入出
力回路36が関連している。マルチプレクサ30により
システムアドレスバス18もしくはコントローラ24か
らローアドレス回路28へアドレスビットが通される。
個別信号もしくはアドレス値自体に応答して選定を行う
ことができる。同様に、マルチプレクサ34によりアド
レスバス18もしくはコントローラ24からのアドレス
ビットが通される。マルチプレクサ30、34と入出力
回路36によりデータバス16およびアドレスバス18
を介してCPU12からもしくは内部バス38を介して
データパス26からデータRAMのセルへデータビット
を転送することができる。
アクセスメモリ(SRAM)もしくはダイナミックラン
ダムアクセスメモリアレイ(DRAM)とすることがで
きる。図2において、RAM20は128ロー128カ
ラム構成とされたRAMセルの2K×8メモリとして示
されている。図2に示す構成の他に、いくつかの交番R
AMアーキテクチュアのいずれかを使用することもでき
ることがお判りと思われる。データRAM20にはロー
アドレス回路28を含むアレイ内の選定セルに対してデ
ータを読み取りおよび書き込む回路と、ローアドレスマ
ルチプレクサ30と、第1段復号(カラムアドレス)回
路32と、カラムアドレスマルチプレクサ34と、入出
力回路36が関連している。マルチプレクサ30により
システムアドレスバス18もしくはコントローラ24か
らローアドレス回路28へアドレスビットが通される。
個別信号もしくはアドレス値自体に応答して選定を行う
ことができる。同様に、マルチプレクサ34によりアド
レスバス18もしくはコントローラ24からのアドレス
ビットが通される。マルチプレクサ30、34と入出力
回路36によりデータバス16およびアドレスバス18
を介してCPU12からもしくは内部バス38を介して
データパス26からデータRAMのセルへデータビット
を転送することができる。
【0011】図2の実施例では、4本の隣接ビット線の
各セットがマルチプレクサ33を介して第1段デコーダ
32により多重化されて32ビット幅の内部バス38が
形成される(例えば、256カラムメモリアーキテクチ
ュアを使用する場合には、内部バスは64ビット幅とな
る)。実施例では、I/O回路36はアドレスバス18
からのアドレスビットに応答して32ビット内部バス3
8上の4セットの隣接8ビットの一つを選定してシステ
ムデータバス16へ伝達する4:1マルチプレクサとし
て作動する。別の実施例では、内部バス38の幅やシス
テムバス16と連絡されるライン(ビット)数に応じて
入出力回路の構成を変えることができる。
各セットがマルチプレクサ33を介して第1段デコーダ
32により多重化されて32ビット幅の内部バス38が
形成される(例えば、256カラムメモリアーキテクチ
ュアを使用する場合には、内部バスは64ビット幅とな
る)。実施例では、I/O回路36はアドレスバス18
からのアドレスビットに応答して32ビット内部バス3
8上の4セットの隣接8ビットの一つを選定してシステ
ムデータバス16へ伝達する4:1マルチプレクサとし
て作動する。別の実施例では、内部バス38の幅やシス
テムバス16と連絡されるライン(ビット)数に応じて
入出力回路の構成を変えることができる。
【0012】ブロードキャストRAM22もスタティッ
クもしくはダイナミックとすることとができ、ローアド
レス回路40を含むそのメモリセルアレイに対してデー
タの書き込みおよび読み取りを行う回路と、ローアドレ
スマルチプレクサ42と、第1段(カラム)復号回路4
4と、マルチプレクサ46と、入出力回路48と関連し
ている。図2において、ブロードキャストRAMは2ロ
ー128カラム構成とされているが、他の実施例では交
番ロー/カラム構成を使用することができる。ブロード
キャストRAM22に関連するリード/ライト回路はR
AM20に関連するリード/ライト回路と同様に作動す
る。マルチプレクサ45を介した実施例の第1段デコー
ダ回路44により、ブロードキャストRAM22内の1
28カラムメモリの各隣接4カラムに対して第2の内部
バス50を介してデータパス26に接続されている選定
32ビットによる4:1多重化が行われる。マルチプレ
クサ42、46によりシステムアドレスバス18もしく
はコントローラ24からのアドレスビットが選択的に通
される。したがって、マルチプレクサ42、46と入出
力回路48によりCPU12もしくはデータパス26を
介したコントローラ24からブロードキャストRAM2
6のセルへデータを転送することができる。
クもしくはダイナミックとすることとができ、ローアド
レス回路40を含むそのメモリセルアレイに対してデー
タの書き込みおよび読み取りを行う回路と、ローアドレ
スマルチプレクサ42と、第1段(カラム)復号回路4
4と、マルチプレクサ46と、入出力回路48と関連し
ている。図2において、ブロードキャストRAMは2ロ
ー128カラム構成とされているが、他の実施例では交
番ロー/カラム構成を使用することができる。ブロード
キャストRAM22に関連するリード/ライト回路はR
AM20に関連するリード/ライト回路と同様に作動す
る。マルチプレクサ45を介した実施例の第1段デコー
ダ回路44により、ブロードキャストRAM22内の1
28カラムメモリの各隣接4カラムに対して第2の内部
バス50を介してデータパス26に接続されている選定
32ビットによる4:1多重化が行われる。マルチプレ
クサ42、46によりシステムアドレスバス18もしく
はコントローラ24からのアドレスビットが選択的に通
される。したがって、マルチプレクサ42、46と入出
力回路48によりCPU12もしくはデータパス26を
介したコントローラ24からブロードキャストRAM2
6のセルへデータを転送することができる。
【0013】データRAM20に関連する対応する回路
と同様に、ローアドレス回路40、マルチプレクサ4
2、46、第1段復号回路44、入出力回路48の特定
構成はブロードキャストRAM22のセルアレイ内のロ
ーおよびカラム数、内部バス50の幅、システムアドレ
スバス18から受信されるビット数、およびシステムデ
ータバス14と連絡されるビット(線)数等の要因に基
いて変動する。好ましくは、データバス16とデータR
AM20に関連する入出力回路36およびブロードキャ
ストRAM22に関連する入出力回路48との接続は従
来のメモリpinoutとの互換性を与えるために1組
のピン(Dφ−D7)を介して行われる。同様に、デー
タRAM20およびブロードキャストRAM22に関連
するリード/ライト回路の接続は(図示せぬ)1組のピ
ンを介して行うことができる。アクティブメモリ14は
システムメモリの一部であるため、メモリ14はメモリ
チップの特性を示すことが好ましい。すなわち、メモリ
14はメモリチップのように効率的で、サイズが小さく
かつ従来の(“イナクティブ”)メモリチップのピン配
置と互換性のある最少数のデータおよびアドレスピンし
か使用しないものでなければならない。
と同様に、ローアドレス回路40、マルチプレクサ4
2、46、第1段復号回路44、入出力回路48の特定
構成はブロードキャストRAM22のセルアレイ内のロ
ーおよびカラム数、内部バス50の幅、システムアドレ
スバス18から受信されるビット数、およびシステムデ
ータバス14と連絡されるビット(線)数等の要因に基
いて変動する。好ましくは、データバス16とデータR
AM20に関連する入出力回路36およびブロードキャ
ストRAM22に関連する入出力回路48との接続は従
来のメモリpinoutとの互換性を与えるために1組
のピン(Dφ−D7)を介して行われる。同様に、デー
タRAM20およびブロードキャストRAM22に関連
するリード/ライト回路の接続は(図示せぬ)1組のピ
ンを介して行うことができる。アクティブメモリ14は
システムメモリの一部であるため、メモリ14はメモリ
チップの特性を示すことが好ましい。すなわち、メモリ
14はメモリチップのように効率的で、サイズが小さく
かつ従来の(“イナクティブ”)メモリチップのピン配
置と互換性のある最少数のデータおよびアドレスピンし
か使用しないものでなければならない。
【0014】コントローラ24の制御の元でデータパス
26により内部バス38、50を介してデータが方路決
定され所望の分散計算機能が得られる。所望の計算機能
を実施するためにチップやユニットをカストマイズする
のに必要なランダム論理、プログラマブルゲートアレイ
回路、もしくはプログラマブル論理アレイ回路としてデ
ータパス26を実現することができる。例えば、データ
パス26は加算器や乗算器を含んで行列乗算器の例や音
声応用における比較器回路を実現することができる。さ
らに、コントローラ24およびデータパス26は共にデ
ジタル信号プロセッサのテキサスインスツルメンツTI
−320ファミリーに見られるようなデジタル信号プロ
セッサ回路として実現することができる。
26により内部バス38、50を介してデータが方路決
定され所望の分散計算機能が得られる。所望の計算機能
を実施するためにチップやユニットをカストマイズする
のに必要なランダム論理、プログラマブルゲートアレイ
回路、もしくはプログラマブル論理アレイ回路としてデ
ータパス26を実現することができる。例えば、データ
パス26は加算器や乗算器を含んで行列乗算器の例や音
声応用における比較器回路を実現することができる。さ
らに、コントローラ24およびデータパス26は共にデ
ジタル信号プロセッサのテキサスインスツルメンツTI
−320ファミリーに見られるようなデジタル信号プロ
セッサ回路として実現することができる。
【0015】システム10の実施例では、アクティブメ
モリ14がシステムアドレスバス18から受信する対応
する数のアドレスビットに対して利用可能な最高アドレ
ススペースに各ブロッドキャストRAM22が配置され
る。これにより、各ブロードキャストRAM22はチッ
プセレクト信号なしで書込みおよび読取りを行うことが
できる。さらに、システム10内のアクティブメモリ1
4の全てのブロードキャストRAM22を同時にアクセ
スすることができる。所与のメモリ14に対するブロー
ドキャストRAM22はコントローラ26が選定された
計算を実施するのに使用する命令およびデータをCPU
12からデータバス16を介して受信する。
モリ14がシステムアドレスバス18から受信する対応
する数のアドレスビットに対して利用可能な最高アドレ
ススペースに各ブロッドキャストRAM22が配置され
る。これにより、各ブロードキャストRAM22はチッ
プセレクト信号なしで書込みおよび読取りを行うことが
できる。さらに、システム10内のアクティブメモリ1
4の全てのブロードキャストRAM22を同時にアクセ
スすることができる。所与のメモリ14に対するブロー
ドキャストRAM22はコントローラ26が選定された
計算を実施するのに使用する命令およびデータをCPU
12からデータバス16を介して受信する。
【0016】代表的な計算では、CPU12は各アクテ
ィブメモリ14のデータRAM20へデータバス16か
らデータを書き込む。代表的に各データRAM20は演
算される全体データセットの異なるサブセットを保持す
る。例えば、行列乗算の場合には、各データRAM20
は関与する行列の対応するローに対するデータを保持す
ることができる。各コントローラ24が従う制御シーケ
ンスはアドレスバス18上にハイアドレスビットが存在
する時に各ブロードキャストRAM22へ書き込まれる
ようにデータバス16へ与えられる。同様に、システム
10により実施される所望する計算の少くとも一つの引
数(ベクトル)が各ブロードキャストRAM22へ書き
込まれる。代表的に、システム10内の全てのブロード
キャストRAM22へ同じベクトルが書き込まれる。
ィブメモリ14のデータRAM20へデータバス16か
らデータを書き込む。代表的に各データRAM20は演
算される全体データセットの異なるサブセットを保持す
る。例えば、行列乗算の場合には、各データRAM20
は関与する行列の対応するローに対するデータを保持す
ることができる。各コントローラ24が従う制御シーケ
ンスはアドレスバス18上にハイアドレスビットが存在
する時に各ブロードキャストRAM22へ書き込まれる
ようにデータバス16へ与えられる。同様に、システム
10により実施される所望する計算の少くとも一つの引
数(ベクトル)が各ブロードキャストRAM22へ書き
込まれる。代表的に、システム10内の全てのブロード
キャストRAM22へ同じベクトルが書き込まれる。
【0017】一実施例において、ブロードキャストメモ
リスペース内のダミー位置において各アクティブメモリ
デバイス14のコントローラ24およびデータパス26
により引数の実行が開始される。特に、制御シーケンス
に指示されるコントローラ24によりデータパス26は
ブロードキャストRAM22から検索される引数をデー
タRAM20からのデータの各ローへ与える。各データ
RAM20内のデータの所与のローへ引数を与えた結果
は同じローに沿った1つもしくは2つの選定バイト位置
へコントローラ24によりデータパス26を介して書き
戻される。コントローラ24によりデータRAM20内
の全データが演算されるように全てのローアドレスおよ
びデータRAM第1段デコーダ32の4対1マルチプレ
クサへの全アドレスが巡回される。
リスペース内のダミー位置において各アクティブメモリ
デバイス14のコントローラ24およびデータパス26
により引数の実行が開始される。特に、制御シーケンス
に指示されるコントローラ24によりデータパス26は
ブロードキャストRAM22から検索される引数をデー
タRAM20からのデータの各ローへ与える。各データ
RAM20内のデータの所与のローへ引数を与えた結果
は同じローに沿った1つもしくは2つの選定バイト位置
へコントローラ24によりデータパス26を介して書き
戻される。コントローラ24によりデータRAM20内
の全データが演算されるように全てのローアドレスおよ
びデータRAM第1段デコーダ32の4対1マルチプレ
クサへの全アドレスが巡回される。
【0018】コントローラ24およびデータパス26に
実現することができる一種の計算回路は図3に示す乗算
−累算回路52である。乗算−累算回路52は次式に従
ったドット積計算のような応用に有用である。
実現することができる一種の計算回路は図3に示す乗算
−累算回路52である。乗算−累算回路52は次式に従
ったドット積計算のような応用に有用である。
【0019】
【数1】
【0020】図3の実施例では、内部バス38上の各1
6ビットはそれぞれバスインターフェイス54を介して
マルチプレクサ56のXおよびY入力に接続されてい
る。乗算器の32ビット出力は1対16ビットシフター
58へ与えられる。多くのデジタル信号応用では級数計
算の第1項(すなわち、X1 およびY1 項)は1よりも
小さいため、シフター58を使用して乗算器の出力を正
規化し先縁ゼロの数を低減することができる。次に演算
器(ALU)60のA出力へポストシフター32ビット
が与えられる。演算器60には加減算等の基本的な算術
演算の他に増減分およびAND、OR等の論理演算を実
施する機能を持たせることができる。ALU60からの
32ビット出力は16ビットハイレジスタおよび16ビ
ットローレジスタへ分割することができる累算器62へ
送られる。累算器62およびALU60はALU60に
より実施される現在の演算結果が累算器62へ入力され
ALU60により実施された前の演算結果がALU60
のB入力へ戻されるようにパイプライン接続される。A
LU60の出力はシフター64へもパイプライン接続さ
れる。シフター64はバスインターフェイス54および
内部バス38を介してデータRAM20へ戻す出力の最
上位16ビットを選定する。
6ビットはそれぞれバスインターフェイス54を介して
マルチプレクサ56のXおよびY入力に接続されてい
る。乗算器の32ビット出力は1対16ビットシフター
58へ与えられる。多くのデジタル信号応用では級数計
算の第1項(すなわち、X1 およびY1 項)は1よりも
小さいため、シフター58を使用して乗算器の出力を正
規化し先縁ゼロの数を低減することができる。次に演算
器(ALU)60のA出力へポストシフター32ビット
が与えられる。演算器60には加減算等の基本的な算術
演算の他に増減分およびAND、OR等の論理演算を実
施する機能を持たせることができる。ALU60からの
32ビット出力は16ビットハイレジスタおよび16ビ
ットローレジスタへ分割することができる累算器62へ
送られる。累算器62およびALU60はALU60に
より実施される現在の演算結果が累算器62へ入力され
ALU60により実施された前の演算結果がALU60
のB入力へ戻されるようにパイプライン接続される。A
LU60の出力はシフター64へもパイプライン接続さ
れる。シフター64はバスインターフェイス54および
内部バス38を介してデータRAM20へ戻す出力の最
上位16ビットを選定する。
【0021】乗算−累算演算では、データRAM20の
所与のローから取り出した2つの16ビット語が第1段
復号回路32から内部バス32を介して与えられ次に乗
算器56により乗算されてALU60のB入力へ与えら
れる。乗算結果は累算器62からのB入力に与えられる
前の乗算/加算結果と加算される。効率を良くするため
に、シフターにより選定される最上位16結果ビットが
データRAM20内の同じローの位置へ返送される。級
数計算が進むと、データがローごとに検索されて結果は
ローごとにデータRAM20へ書き戻される。
所与のローから取り出した2つの16ビット語が第1段
復号回路32から内部バス32を介して与えられ次に乗
算器56により乗算されてALU60のB入力へ与えら
れる。乗算結果は累算器62からのB入力に与えられる
前の乗算/加算結果と加算される。効率を良くするため
に、シフターにより選定される最上位16結果ビットが
データRAM20内の同じローの位置へ返送される。級
数計算が進むと、データがローごとに検索されて結果は
ローごとにデータRAM20へ書き戻される。
【0022】コントローラ24が乗算−累算を指示する
ための制御シーケンスを保持する他に、ブロードキャス
トRAMはデータパス26の乗算/累算回路の特定演算
を規定するためのデータを受信し記憶する。例えば、ど
れだけ多くのXijおよびYik項を乗算しかつ加算すべき
かを規定する命令語、およびシフター64により選定さ
れる16ビットをブロードキャストRAMに記憶してコ
ントローラ24が使用するようにすることができる。
ための制御シーケンスを保持する他に、ブロードキャス
トRAMはデータパス26の乗算/累算回路の特定演算
を規定するためのデータを受信し記憶する。例えば、ど
れだけ多くのXijおよびYik項を乗算しかつ加算すべき
かを規定する命令語、およびシフター64により選定さ
れる16ビットをブロードキャストRAMに記憶してコ
ントローラ24が使用するようにすることができる。
【0023】アクティブメモリデバイスが各データRA
M20に予め書き込まれたデータで演算を行う間、CP
U12は解放されて他のタスクを受け持つことができ
る。次に、アクティブメモリにより分散計算タスクの完
了が表示された後で、CPU12は各アクティブメモリ
14のデータRAM20からの低減(圧縮)された結果
の検索へ戻る。
M20に予め書き込まれたデータで演算を行う間、CP
U12は解放されて他のタスクを受け持つことができ
る。次に、アクティブメモリにより分散計算タスクの完
了が表示された後で、CPU12は各アクティブメモリ
14のデータRAM20からの低減(圧縮)された結果
の検索へ戻る。
【0024】本発明およびその利点について詳細に説明
してきたが、特許請求の範囲に明記された発明の精神お
よび範囲内でさまざまな変更、置換および修正が可能で
ある。
してきたが、特許請求の範囲に明記された発明の精神お
よび範囲内でさまざまな変更、置換および修正が可能で
ある。
【0025】以上の説明に関して更に以下の項を開示す
る。 (1) データおよび計算結果を保持する記憶位置のロー
およびカラムを含むデータメモリと、制御命令を保持す
る記憶位置のローおよびカラムを含むブロードキャスト
メモリと、前記データメモリから検索した第1および第
2のデータ語を使用して第1の演算を実施しかつ前記第
1の演算結果および前の演算結果を使用して第2の演算
を実施する計算回路と、前記ブロードキャストメモリか
ら受信した制御命令に応答して作動して前記データメモ
リから前記計算回路への前記第1および第2のデータ語
の転送と前記第1および第2の演算の実施を制御する制
御回路と、を具備するアクティブメモリ。
る。 (1) データおよび計算結果を保持する記憶位置のロー
およびカラムを含むデータメモリと、制御命令を保持す
る記憶位置のローおよびカラムを含むブロードキャスト
メモリと、前記データメモリから検索した第1および第
2のデータ語を使用して第1の演算を実施しかつ前記第
1の演算結果および前の演算結果を使用して第2の演算
を実施する計算回路と、前記ブロードキャストメモリか
ら受信した制御命令に応答して作動して前記データメモ
リから前記計算回路への前記第1および第2のデータ語
の転送と前記第1および第2の演算の実施を制御する制
御回路と、を具備するアクティブメモリ。
【0026】(2) データビットおよび演算結果ビット
を保持する複数のローおよびカラム構成とされたメモリ
セルアレイを含むデータメモリと、前記データメモリに
接続されて前記データおよび結果ビットを前記データメ
モリ内の前記セルおよび第1の内部バス間で選択的に転
送するデータメモリ制御回路と、制御ビットを保持する
複数のローおよびカラム構成とされたメモリセルアレイ
を含むブロードキャストメモリと、前記ブロードキャス
トメモリに接続されて前記制御ビットを前記ブロードキ
ャストメモリ内の前記セルおよび第2の内部バス間で選
択的に転送するブロードキャストメモリと、前記デー
タ、制御、および結果ビット流を前記第1および第2の
内部バスを介して方路決定しかつ選定された演算を実施
するように作動するデータパスであって、前記データメ
モリから検索されて前記第1の内部バスへ与えられる前
記データビットの第1および第2の語を乗算してその積
を前の演算結果へ加算するように作動する乗算/累算回
路を含むデータパスと、前記ブロードキャストメモリ制
御回路、前記データメモリ制御回路、および前記データ
パスに接続され、前記ブロードキャストメモリから検索
された前記制御ビットのいくつかに応答して前記第1の
内部バスを介した前記データメモリから前記データパス
への前記第1および第2の語の転送および前記乗算器/
累算器による乗算および加算の実施を指示するコントロ
ーラと、を具備するメモリ。
を保持する複数のローおよびカラム構成とされたメモリ
セルアレイを含むデータメモリと、前記データメモリに
接続されて前記データおよび結果ビットを前記データメ
モリ内の前記セルおよび第1の内部バス間で選択的に転
送するデータメモリ制御回路と、制御ビットを保持する
複数のローおよびカラム構成とされたメモリセルアレイ
を含むブロードキャストメモリと、前記ブロードキャス
トメモリに接続されて前記制御ビットを前記ブロードキ
ャストメモリ内の前記セルおよび第2の内部バス間で選
択的に転送するブロードキャストメモリと、前記デー
タ、制御、および結果ビット流を前記第1および第2の
内部バスを介して方路決定しかつ選定された演算を実施
するように作動するデータパスであって、前記データメ
モリから検索されて前記第1の内部バスへ与えられる前
記データビットの第1および第2の語を乗算してその積
を前の演算結果へ加算するように作動する乗算/累算回
路を含むデータパスと、前記ブロードキャストメモリ制
御回路、前記データメモリ制御回路、および前記データ
パスに接続され、前記ブロードキャストメモリから検索
された前記制御ビットのいくつかに応答して前記第1の
内部バスを介した前記データメモリから前記データパス
への前記第1および第2の語の転送および前記乗算器/
累算器による乗算および加算の実施を指示するコントロ
ーラと、を具備するメモリ。
【0027】(3) 中央処理装置と、前記中央処理装置
に接続されたアドレスバスと、前記中央処理装置に接続
されたデータバスと、単体として構成されたアクティブ
メモリデバイスと、を具備する処理方式であって、前記
アクティブメモリデバイスは、データビットおよび計算
結果ビットを保持する複数のローおよびカラム構成とさ
れたメモリセルアレイを含むデータメモリと、前記アド
レスバスおよび前記データメモリに接続されて前記デー
タメモリ内の前記セルおよび第1の内部バス間でデータ
および結果ビットを選択的に転送するデータメモリ制御
回路と、前記第1の内部バスおよび前記データバスに接
続されて両者間でデータおよび結果ビットを選択的に転
送するデータメモリ入出力回路と、制御ビットを保持す
る複数のローおよびカラム構成とされたメモリセルアレ
イを含むブロードキャストメモリと、前記ブロードキャ
ストメモリおよび前記アドレスバスに接続されて前記ブ
ロードキャストメモリ内の前記セルおよび第2の内部バ
ス間で選択的に制御ビットを転送するブロードキャスト
メモリ制御回路と、前記第2の内部バスおよび前記デー
タバスに接続されて両者間で選択的に制御ビットを転送
するブロードキャストメモリ入出力回路と、前記データ
メモリから検索されて前記第2の内部バスへ与えられる
第1および第2のデータ語を使用して第1の演算を実施
しかつ前記第1の演算結果および記憶された前の演算結
果を使用して第2の演算を実施するように作動する計算
回路と、前記計算回路、前記ブロードキャストメモリ制
御回路、および前記データメモリ制御回路に接続され、
前記ブロードキャストメモリから検索した前記制御ビッ
トのいくつかに応答して前記データメモリからの前記第
1および第2の語の転送、前記計算回路による前記第1
および第2の演算の実施、および前記第2の演算結果の
前記データメモリへの転送を制御するように作動するコ
ントローラと、を具備する処理方式。
に接続されたアドレスバスと、前記中央処理装置に接続
されたデータバスと、単体として構成されたアクティブ
メモリデバイスと、を具備する処理方式であって、前記
アクティブメモリデバイスは、データビットおよび計算
結果ビットを保持する複数のローおよびカラム構成とさ
れたメモリセルアレイを含むデータメモリと、前記アド
レスバスおよび前記データメモリに接続されて前記デー
タメモリ内の前記セルおよび第1の内部バス間でデータ
および結果ビットを選択的に転送するデータメモリ制御
回路と、前記第1の内部バスおよび前記データバスに接
続されて両者間でデータおよび結果ビットを選択的に転
送するデータメモリ入出力回路と、制御ビットを保持す
る複数のローおよびカラム構成とされたメモリセルアレ
イを含むブロードキャストメモリと、前記ブロードキャ
ストメモリおよび前記アドレスバスに接続されて前記ブ
ロードキャストメモリ内の前記セルおよび第2の内部バ
ス間で選択的に制御ビットを転送するブロードキャスト
メモリ制御回路と、前記第2の内部バスおよび前記デー
タバスに接続されて両者間で選択的に制御ビットを転送
するブロードキャストメモリ入出力回路と、前記データ
メモリから検索されて前記第2の内部バスへ与えられる
第1および第2のデータ語を使用して第1の演算を実施
しかつ前記第1の演算結果および記憶された前の演算結
果を使用して第2の演算を実施するように作動する計算
回路と、前記計算回路、前記ブロードキャストメモリ制
御回路、および前記データメモリ制御回路に接続され、
前記ブロードキャストメモリから検索した前記制御ビッ
トのいくつかに応答して前記データメモリからの前記第
1および第2の語の転送、前記計算回路による前記第1
および第2の演算の実施、および前記第2の演算結果の
前記データメモリへの転送を制御するように作動するコ
ントローラと、を具備する処理方式。
【0028】(4) 第3項記載の方式であって、前記計
算回路は、前記第1および第2の語に対して前記第1の
算術演算を実施しそれに応答して第1の結果を与える第
1の回路と、前記第2の算術演算を実施それに応答して
第2の結果を与える第2の回路であって、前記第1の回
路から前記第1の結果を受信して前記第2の演算を実施
するのに使用する第2の回路と、前記前の演算の前記結
果を一時的に記憶する累算器であって、前記累算器に記
憶される前記結果は前記第2の回路へ与えられて前記第
2の演算を実施するのに使用される累算器と、を具備す
る処理方式。
算回路は、前記第1および第2の語に対して前記第1の
算術演算を実施しそれに応答して第1の結果を与える第
1の回路と、前記第2の算術演算を実施それに応答して
第2の結果を与える第2の回路であって、前記第1の回
路から前記第1の結果を受信して前記第2の演算を実施
するのに使用する第2の回路と、前記前の演算の前記結
果を一時的に記憶する累算器であって、前記累算器に記
憶される前記結果は前記第2の回路へ与えられて前記第
2の演算を実施するのに使用される累算器と、を具備す
る処理方式。
【0029】(5) 第3項記載の方式であって、前記計
算回路は、それぞれ第1および第2の入力ポートへ与え
られる前記第1および第2の語を乗算してその積を出力
ポートへ与えるように作動する乗算器と、各入力ポート
に与えられるデータ語を加算してその和を出力ポートに
与えるように作動する演算器であって、前記乗算器の前
記出力に与えられる積が前記演算器の第1の前記入力ポ
ートへ与えられる演算器と、前記演算器の前記出力ポー
トに与えられる前の結果を一時的に記憶する累算器であ
って、前記累算器に記憶されている前記前の結果は前記
演算器の第2の前記入力ポートへ与えられて前記演算器
の前記第1のポートへ与えられる前記積に加算される累
算器と、を具備する処理方式。
算回路は、それぞれ第1および第2の入力ポートへ与え
られる前記第1および第2の語を乗算してその積を出力
ポートへ与えるように作動する乗算器と、各入力ポート
に与えられるデータ語を加算してその和を出力ポートに
与えるように作動する演算器であって、前記乗算器の前
記出力に与えられる積が前記演算器の第1の前記入力ポ
ートへ与えられる演算器と、前記演算器の前記出力ポー
トに与えられる前の結果を一時的に記憶する累算器であ
って、前記累算器に記憶されている前記前の結果は前記
演算器の第2の前記入力ポートへ与えられて前記演算器
の前記第1のポートへ与えられる前記積に加算される累
算器と、を具備する処理方式。
【0030】(6) データおよび計算結果を保持する記
憶位置のローおよびカラムを含むデータメモリを含むア
クティブメモリが提供される。ブロードキャストメモリ
は制御命令を保持する記憶位置のローおよびカラムを含
んでいる。データメモリから検索された第1および第2
のデータ語を使用して第1の演算を実施しかつ第1の演
算結果および前の演算結果を使用して第2の演算を実施
する計算回路が設けられる。制御回路はブロードキャス
トメモリから受信した制御命令に応答してデータメモリ
から前記計算回路への第1および第2のデータ語の転送
と第1および第2の演算の実施を制御するように作動す
る。
憶位置のローおよびカラムを含むデータメモリを含むア
クティブメモリが提供される。ブロードキャストメモリ
は制御命令を保持する記憶位置のローおよびカラムを含
んでいる。データメモリから検索された第1および第2
のデータ語を使用して第1の演算を実施しかつ第1の演
算結果および前の演算結果を使用して第2の演算を実施
する計算回路が設けられる。制御回路はブロードキャス
トメモリから受信した制御命令に応答してデータメモリ
から前記計算回路への第1および第2のデータ語の転送
と第1および第2の演算の実施を制御するように作動す
る。
【0031】注記) (c) 著作権、 *M* テキサスインスツルメンツ社、19
93年。本特許文書の開示の一部に著作権保護の対象と
なる資料が含まれている。著作権およびマスクワーク所
有者は米国特許庁で閲覧できる特許文書や特許開示、特
許ファイルもしくは記録をいかなる人がファクシミリで
再生しても異議を唱えないが、それ以外については全て
の著作権およびマスクワークの権利を保有するものとす
る。
93年。本特許文書の開示の一部に著作権保護の対象と
なる資料が含まれている。著作権およびマスクワーク所
有者は米国特許庁で閲覧できる特許文書や特許開示、特
許ファイルもしくは記録をいかなる人がファクシミリで
再生しても異議を唱えないが、それ以外については全て
の著作権およびマスクワークの権利を保有するものとす
る。
【0032】関連特許の相互参照 同じ譲受人の下記の特許および出願が参照としてここに
組み込まれている。 米国特許出願 号、アトニードケッ
ト番号第32350−714号、TI−13438、
“分散処理装置、方式および方法”、出願日、 米国特許出願 号、アトニードケッ
ト番号第32350−715号、TI−13439、
“メモリ埋込サーチ演算器を実現する装置、方式および
方法”、出願日 、 米国特許出願 号、アトニードケッ
ト番号第32350−716号、TI−13440、
“カネルバメモリを実現する装置、方式および方法”、
出願日 、 。
組み込まれている。 米国特許出願 号、アトニードケッ
ト番号第32350−714号、TI−13438、
“分散処理装置、方式および方法”、出願日、 米国特許出願 号、アトニードケッ
ト番号第32350−715号、TI−13439、
“メモリ埋込サーチ演算器を実現する装置、方式および
方法”、出願日 、 米国特許出願 号、アトニードケッ
ト番号第32350−716号、TI−13440、
“カネルバメモリを実現する装置、方式および方法”、
出願日 、 。
【図1】本発明の概念を実施したデータ処理方式のブロ
ック図。
ック図。
【図2】図1に示すアクティブメモリデバイスの実施例
の機能ブロック図。
の機能ブロック図。
【図3】図2に示すアクティブメモリデバイスの計算回
路の実施例の機能ブロック図。
路の実施例の機能ブロック図。
14 アクティブメモリ 20 データメモリ 22 ブロードキャストメモリ 24 制御回路 26 計算回路
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 G06F 17/16 (72)発明者 シバリング マハント − シェッティ アメリカ合衆国テキサス州リチャードソ ン,スコッツボロ レーン 1405 (72)発明者 デレック スミス アメリカ合衆国ルイジアナ州ラファイエッ ト,ルーズベルト ストリート 512
Claims (2)
- 【請求項1】 データおよび計算結果を保持する記憶位
置のローおよびカラムを含むデータメモリと、 制御命令を保持する記憶位置のローおよびカラムを含む
ブロードキャストメモリと、 前記データメモリから検索した第1および第2のデータ
語を使用して第1の演算を実施し前記第1の演算結果お
よび前の演算結果を使用して第2の演算を実施する計算
回路と、 前記ブロードキャストメモリから受信する制御命令に応
答して作動して前記データメモリから前記計算回路への
前記第1および第2のデータ語の転送と前記第1および
第2の演算の実施を制御する制御回路と、 を具備するアクティブメモリ。 - 【請求項2】 中央処理装置と、 前記中央処理装置に接続されたアドレスバスと、 前記中央処理装置に接続されたデータバスと、 単体として構成されたアクティブメモリデバイスと、 を具備する処理方式であって、前記アクティブメモリデ
バイスは、 データビットおよび計算結果を保持する複数のローおよ
びコラム構成とされたメモリセルアレイを含むデータメ
モリと、 前記アドレスバスおよび前記データメモリに接続されて
前記データメモリ内の前記セルと第1の内部バスとの間
でデータおよび結果ビットを選択的に転送する データメモリ制御回路と、前記第1の内部バスおよび前
記データバスに接続されて両者間でデータおよび結果ビ
ットを選択的に転送するデータメモリ入出力回路と、 制御ビットを保持する複数のローおよびカラム構成とさ
れたメモリセルアレイを含むブロードキャストメモリ
と、 前記ブロードキャストメモリおよび前記アドレスバスに
接続されて前記ブロードキャストメモリ内の前記セルと
第2の内部セルとの間で選択的に制御ビットを転送する
ブロードキャストメモリ制御回路と、 前記第2の内部バスおよび前記データバスに接続されて
両者間で選択的に制御ビットを転送するブロードキャス
トメモリ入出力回路と、 前記データメモリから検索されて前記第1の内部バスへ
与えられる第1および第2のデータ語を使用して第1の
演算を実施かつ前記第1の演算結果及び記憶された前の
演算結果を使用して第2の演算を実施する計算回路と、 前記計算回路と、前記ブロードキャストメモリ制御回路
と、前記データメモリ制御回路に接続され、前記ブロー
ドキャストメモリから受信する前記制御ビットのいくつ
か応答して前記データメモリからの前記第1および第2
の語の転送と、前記計算回路による前記第1および第2
の演算の実施と、前記第2の演算結果の前記データメモ
リへの転送とを制御するコントローラと、 を具備する処理方式。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US068908 | 1993-05-28 | ||
US08/068,908 US5528549A (en) | 1993-05-28 | 1993-05-28 | Apparatus, systems and methods for distributed signal processing |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH07141175A true JPH07141175A (ja) | 1995-06-02 |
Family
ID=22085485
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP6115229A Pending JPH07141175A (ja) | 1993-05-28 | 1994-05-27 | アクティブメモリおよび処理方式 |
Country Status (4)
Country | Link |
---|---|
US (2) | US5528549A (ja) |
EP (1) | EP0626658A1 (ja) |
JP (1) | JPH07141175A (ja) |
TW (1) | TW273606B (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002108691A (ja) * | 2000-09-29 | 2002-04-12 | Mitsubishi Electric Corp | 半導体記憶装置および半導体記憶装置の制御方法 |
JP2010287249A (ja) * | 2010-08-09 | 2010-12-24 | Renesas Electronics Corp | 半導体記憶装置およびメモリ制御システム |
JP2019061677A (ja) * | 2017-09-27 | 2019-04-18 | 三星電子株式会社Samsung Electronics Co.,Ltd. | 積層型メモリ装置及びその動作方法並びにメモリシステム |
Families Citing this family (70)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10232788A (ja) * | 1996-12-17 | 1998-09-02 | Fujitsu Ltd | 信号処理装置及びソフトウェア |
US6185704B1 (en) * | 1997-04-11 | 2001-02-06 | Texas Instruments Incorporated | System signaling schemes for processor and memory module |
US5818788A (en) * | 1997-05-30 | 1998-10-06 | Nec Corporation | Circuit technique for logic integrated DRAM with SIMD architecture and a method for controlling low-power, high-speed and highly reliable operation |
US6760833B1 (en) * | 1997-08-01 | 2004-07-06 | Micron Technology, Inc. | Split embedded DRAM processor |
US8489861B2 (en) * | 1997-12-23 | 2013-07-16 | Round Rock Research, Llc | Split embedded DRAM processor |
US7346644B1 (en) | 2000-09-18 | 2008-03-18 | Altera Corporation | Devices and methods with programmable logic and digital signal processing regions |
US7119576B1 (en) | 2000-09-18 | 2006-10-10 | Altera Corporation | Devices and methods with programmable logic and digital signal processing regions |
US9015390B2 (en) * | 2003-04-25 | 2015-04-21 | Micron Technology, Inc. | Active memory data compression system and method |
US8620980B1 (en) | 2005-09-27 | 2013-12-31 | Altera Corporation | Programmable device with specialized multiplier blocks |
US8954426B2 (en) * | 2006-02-17 | 2015-02-10 | Google Inc. | Query language |
US20070185870A1 (en) | 2006-01-27 | 2007-08-09 | Hogue Andrew W | Data object visualization using graphs |
US8266198B2 (en) * | 2006-02-09 | 2012-09-11 | Altera Corporation | Specialized processing block for programmable logic device |
US8301681B1 (en) | 2006-02-09 | 2012-10-30 | Altera Corporation | Specialized processing block for programmable logic device |
US8041759B1 (en) | 2006-02-09 | 2011-10-18 | Altera Corporation | Specialized processing block for programmable logic device |
US8266199B2 (en) * | 2006-02-09 | 2012-09-11 | Altera Corporation | Specialized processing block for programmable logic device |
KR100735527B1 (ko) * | 2006-02-13 | 2007-07-04 | 삼성전자주식회사 | 2개의 패드 행을 포함하는 반도체 메모리 장치 |
US7836117B1 (en) | 2006-04-07 | 2010-11-16 | Altera Corporation | Specialized processing block for programmable logic device |
US7822799B1 (en) | 2006-06-26 | 2010-10-26 | Altera Corporation | Adder-rounder circuitry for specialized processing block in programmable logic device |
US8386550B1 (en) | 2006-09-20 | 2013-02-26 | Altera Corporation | Method for configuring a finite impulse response filter in a programmable logic device |
US8954412B1 (en) | 2006-09-28 | 2015-02-10 | Google Inc. | Corroborating facts in electronic documents |
US7930336B2 (en) * | 2006-12-05 | 2011-04-19 | Altera Corporation | Large multiplier for programmable logic device |
US8386553B1 (en) | 2006-12-05 | 2013-02-26 | Altera Corporation | Large multiplier for programmable logic device |
US7814137B1 (en) | 2007-01-09 | 2010-10-12 | Altera Corporation | Combined interpolation and decimation filter for programmable logic device |
US8650231B1 (en) | 2007-01-22 | 2014-02-11 | Altera Corporation | Configuring floating point operations in a programmable device |
US7865541B1 (en) | 2007-01-22 | 2011-01-04 | Altera Corporation | Configuring floating point operations in a programmable logic device |
US8645450B1 (en) | 2007-03-02 | 2014-02-04 | Altera Corporation | Multiplier-accumulator circuitry and methods |
US7949699B1 (en) | 2007-08-30 | 2011-05-24 | Altera Corporation | Implementation of decimation filter in integrated circuit device using ram-based data storage |
US8959137B1 (en) | 2008-02-20 | 2015-02-17 | Altera Corporation | Implementing large multipliers in a programmable integrated circuit device |
US8244789B1 (en) | 2008-03-14 | 2012-08-14 | Altera Corporation | Normalization of floating point operations in a programmable integrated circuit device |
US8626815B1 (en) | 2008-07-14 | 2014-01-07 | Altera Corporation | Configuring a programmable integrated circuit device to perform matrix multiplication |
US8255448B1 (en) | 2008-10-02 | 2012-08-28 | Altera Corporation | Implementing division in a programmable integrated circuit device |
US8307023B1 (en) | 2008-10-10 | 2012-11-06 | Altera Corporation | DSP block for implementing large multiplier on a programmable integrated circuit device |
TWI398876B (zh) | 2008-12-25 | 2013-06-11 | Winbond Electronics Corp | 記憶體控制器與解碼器 |
US8805916B2 (en) * | 2009-03-03 | 2014-08-12 | Altera Corporation | Digital signal processing circuitry with redundancy and bidirectional data paths |
US8549055B2 (en) * | 2009-03-03 | 2013-10-01 | Altera Corporation | Modular digital signal processing circuitry with optionally usable, dedicated connections between modules of the circuitry |
US8468192B1 (en) | 2009-03-03 | 2013-06-18 | Altera Corporation | Implementing multipliers in a programmable integrated circuit device |
US8645449B1 (en) | 2009-03-03 | 2014-02-04 | Altera Corporation | Combined floating point adder and subtractor |
US8706790B1 (en) | 2009-03-03 | 2014-04-22 | Altera Corporation | Implementing mixed-precision floating-point operations in a programmable integrated circuit device |
US8886696B1 (en) | 2009-03-03 | 2014-11-11 | Altera Corporation | Digital signal processing circuitry with redundancy and ability to support larger multipliers |
US8650236B1 (en) | 2009-08-04 | 2014-02-11 | Altera Corporation | High-rate interpolation or decimation filter in integrated circuit device |
US8412756B1 (en) | 2009-09-11 | 2013-04-02 | Altera Corporation | Multi-operand floating point operations in a programmable integrated circuit device |
US8396914B1 (en) | 2009-09-11 | 2013-03-12 | Altera Corporation | Matrix decomposition in an integrated circuit device |
US8539016B1 (en) | 2010-02-09 | 2013-09-17 | Altera Corporation | QR decomposition in an integrated circuit device |
US7948267B1 (en) | 2010-02-09 | 2011-05-24 | Altera Corporation | Efficient rounding circuits and methods in configurable integrated circuit devices |
US8601044B2 (en) * | 2010-03-02 | 2013-12-03 | Altera Corporation | Discrete Fourier Transform in an integrated circuit device |
US8458243B1 (en) | 2010-03-03 | 2013-06-04 | Altera Corporation | Digital signal processing circuit blocks with support for systolic finite-impulse-response digital filtering |
US8484265B1 (en) | 2010-03-04 | 2013-07-09 | Altera Corporation | Angular range reduction in an integrated circuit device |
US8510354B1 (en) | 2010-03-12 | 2013-08-13 | Altera Corporation | Calculation of trigonometric functions in an integrated circuit device |
US8539014B2 (en) * | 2010-03-25 | 2013-09-17 | Altera Corporation | Solving linear matrices in an integrated circuit device |
US8589463B2 (en) | 2010-06-25 | 2013-11-19 | Altera Corporation | Calculation of trigonometric functions in an integrated circuit device |
US8862650B2 (en) | 2010-06-25 | 2014-10-14 | Altera Corporation | Calculation of trigonometric functions in an integrated circuit device |
US8577951B1 (en) | 2010-08-19 | 2013-11-05 | Altera Corporation | Matrix operations in an integrated circuit device |
IT1403375B1 (it) * | 2010-10-29 | 2013-10-17 | Strollo | Microcontrollore multiprocessore espandibile/parametrizzato |
US8645451B2 (en) | 2011-03-10 | 2014-02-04 | Altera Corporation | Double-clocked specialized processing block in an integrated circuit device |
US9600278B1 (en) | 2011-05-09 | 2017-03-21 | Altera Corporation | Programmable device using fixed and configurable logic to implement recursive trees |
US8812576B1 (en) | 2011-09-12 | 2014-08-19 | Altera Corporation | QR decomposition in an integrated circuit device |
US8949298B1 (en) | 2011-09-16 | 2015-02-03 | Altera Corporation | Computing floating-point polynomials in an integrated circuit device |
US9053045B1 (en) | 2011-09-16 | 2015-06-09 | Altera Corporation | Computing floating-point polynomials in an integrated circuit device |
US8762443B1 (en) | 2011-11-15 | 2014-06-24 | Altera Corporation | Matrix operations in an integrated circuit device |
US8543634B1 (en) | 2012-03-30 | 2013-09-24 | Altera Corporation | Specialized processing block for programmable integrated circuit device |
US9098332B1 (en) | 2012-06-01 | 2015-08-04 | Altera Corporation | Specialized processing block with fixed- and floating-point structures |
US8996600B1 (en) | 2012-08-03 | 2015-03-31 | Altera Corporation | Specialized processing block for implementing floating-point multiplier with subnormal operation support |
US9207909B1 (en) | 2012-11-26 | 2015-12-08 | Altera Corporation | Polynomial calculations optimized for programmable integrated circuit device structures |
US9189200B1 (en) | 2013-03-14 | 2015-11-17 | Altera Corporation | Multiple-precision processing block in a programmable integrated circuit device |
US9348795B1 (en) | 2013-07-03 | 2016-05-24 | Altera Corporation | Programmable device using fixed and configurable logic to implement floating-point rounding |
US20150089127A1 (en) * | 2013-09-23 | 2015-03-26 | Kuljit S. Bains | Memory broadcast command |
US9379687B1 (en) | 2014-01-14 | 2016-06-28 | Altera Corporation | Pipelined systolic finite impulse response filter |
US9684488B2 (en) | 2015-03-26 | 2017-06-20 | Altera Corporation | Combined adder and pre-adder for high-radix multiplier circuit |
US10942706B2 (en) | 2017-05-05 | 2021-03-09 | Intel Corporation | Implementation of floating-point trigonometric functions in an integrated circuit device |
US10902113B2 (en) * | 2017-10-25 | 2021-01-26 | Arm Limited | Data processing |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0513851A3 (en) * | 1984-10-05 | 1993-02-03 | Hitachi, Ltd. | Memory device having arithmetic and logic functions, in particular for graphic processing |
US4903236A (en) * | 1987-07-15 | 1990-02-20 | Mitsubishi Denki Kabushiki Kaisha | Nonvolatile semiconductor memory device and a writing method therefor |
US5276643A (en) * | 1988-08-11 | 1994-01-04 | Siemens Aktiengesellschaft | Integrated semiconductor circuit |
ATE99448T1 (de) * | 1988-08-11 | 1994-01-15 | Siemens Ag | Integrierte halbleiterschaltung mit einem speicherbereich. |
DE69132495T2 (de) * | 1990-03-16 | 2001-06-13 | Texas Instruments Inc | Verteilter Verarbeitungsspeicher |
JP3108505B2 (ja) * | 1992-03-13 | 2000-11-13 | 沖電気工業株式会社 | デコーダ回路 |
EP0606653A1 (en) * | 1993-01-04 | 1994-07-20 | Texas Instruments Incorporated | Field programmable distributed processing memory |
-
1993
- 1993-05-28 US US08/068,908 patent/US5528549A/en not_active Expired - Lifetime
-
1994
- 1994-05-25 EP EP94303754A patent/EP0626658A1/en not_active Withdrawn
- 1994-05-27 JP JP6115229A patent/JPH07141175A/ja active Pending
- 1994-12-16 TW TW083112018A patent/TW273606B/zh active
-
1995
- 1995-06-07 US US08/474,602 patent/US5500828A/en not_active Expired - Lifetime
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002108691A (ja) * | 2000-09-29 | 2002-04-12 | Mitsubishi Electric Corp | 半導体記憶装置および半導体記憶装置の制御方法 |
JP2010287249A (ja) * | 2010-08-09 | 2010-12-24 | Renesas Electronics Corp | 半導体記憶装置およびメモリ制御システム |
JP2019061677A (ja) * | 2017-09-27 | 2019-04-18 | 三星電子株式会社Samsung Electronics Co.,Ltd. | 積層型メモリ装置及びその動作方法並びにメモリシステム |
Also Published As
Publication number | Publication date |
---|---|
EP0626658A1 (en) | 1994-11-30 |
US5528549A (en) | 1996-06-18 |
TW273606B (ja) | 1996-04-01 |
US5500828A (en) | 1996-03-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH07141175A (ja) | アクティブメモリおよび処理方式 | |
US5528550A (en) | Apparatus, systems and methods for implementing memory embedded search arithmetic logic unit | |
US10817587B2 (en) | Reconfigurable matrix multiplier system and method | |
US6061779A (en) | Digital signal processor having data alignment buffer for performing unaligned data accesses | |
US5832290A (en) | Apparatus, systems and method for improving memory bandwidth utilization in vector processing systems | |
US7340562B2 (en) | Cache for instruction set architecture | |
US6510510B1 (en) | Digital signal processor having distributed register file | |
US3787673A (en) | Pipelined high speed arithmetic unit | |
US5404562A (en) | Massively parallel processor including queue-based message delivery system | |
US5175863A (en) | Signal data processing system having independently, simultaneously operable alu and macu | |
JP3573755B2 (ja) | 画像処理プロセッサ | |
US5179714A (en) | Parallel bit serial data processor | |
US4872133A (en) | Floating-point systolic array including serial processors | |
JPH0562387B2 (ja) | ||
JP2012009055A (ja) | 2次元マトリクス処理のためのレジスタ | |
US6804771B1 (en) | Processor with register file accessible by row column to achieve data array transposition | |
CN111597501A (zh) | 自适应性矩阵乘法器的系统 | |
JPS62134763A (ja) | 3アドレス・コ−ドの指標づけ装置 | |
JP3333779B2 (ja) | 行列演算装置 | |
JPH0345420B2 (ja) | ||
EP0626659A1 (en) | Apparatus, system and method for distributed processing | |
US5928350A (en) | Wide memory architecture vector processor using nxP bits wide memory bus for transferring P n-bit vector operands in one cycle | |
JPH1063647A (ja) | 行列演算装置 | |
JPH08106451A (ja) | デジタルパターン認識ベクトルプロセッサ | |
JPS6058503B2 (ja) | デ−タ処理制御方式 |