JPH07141175A - アクティブメモリおよび処理方式 - Google Patents

アクティブメモリおよび処理方式

Info

Publication number
JPH07141175A
JPH07141175A JP6115229A JP11522994A JPH07141175A JP H07141175 A JPH07141175 A JP H07141175A JP 6115229 A JP6115229 A JP 6115229A JP 11522994 A JP11522994 A JP 11522994A JP H07141175 A JPH07141175 A JP H07141175A
Authority
JP
Japan
Prior art keywords
memory
data
circuit
broadcast
bus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6115229A
Other languages
English (en)
Inventor
George R Doddington
アール.ドディントン ジョージ
Basavaraj Pawate
パワテ バサバルジ
Shivaling Mahant-Shetti
マハント − シェッティ シバリング
Derek Smith
スミス デレック
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Texas Instruments Inc
Original Assignee
Texas Instruments Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Texas Instruments Inc filed Critical Texas Instruments Inc
Publication of JPH07141175A publication Critical patent/JPH07141175A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/76Architectures of general purpose stored program computers
    • G06F15/78Architectures of general purpose stored program computers comprising a single central processing unit
    • G06F15/7807System on chip, i.e. computer system on a single chip; System in package, i.e. computer system on one or more chips in a single package
    • G06F15/7821Tightly coupled to memory, e.g. computational memory, smart memory, processor in memory

Abstract

(57)【要約】 【目的】 データおよび計算結果を保持する記憶位置の
ローおよびカラムを含むデータメモリを含むアクティブ
メモリを提供する。 【構成】 ブロードキャストメモリ22は制御命令を保
持する記憶位置のローおよびカラムを含んでいる。デー
タメモリ20から検索された第1および第2のデータ語
を使用して第1の演算を実施しかつ第1の演算結果およ
び前の演算結果を使用して第2の演算を実施する計算回
路26が設けられる。制御回路24がブロードキャスト
メモリ22から受信した制御命令に応答してデータメモ
リ20から前記計算回路26への第1および第2のデー
タ語の転送と第1および第2の演算の実施を制御するよ
うに作動する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は一般的にデータ処理に関
し、特に分散信号処理装置、方式および方法に関する。
【0002】
【従来の技術】コンピュータシステムにより実施される
タスクの複雑さが増すにつれ、中央処理装置(CPU)
の負担、システムメモリサイズ、およびシステムアドレ
スおよびデータバスのトラフィックも全て増大しつつあ
る。特に、行列計算、音声合成、画像信号処理、および
デジタル信号処理に関連するタスクの多くは計算集約的
であり最終結果を得る前に沢山の基本的な算術演算を実
行する必要のある場合が多い。例えば、デジタル信号処
理応用ではドット積を計算する必要のある場合が多い。
ドット積の計算にはいくつかの乗算および加算を実施す
る必要があり、その各々が従来の処理方式ではシステム
中央処理装置により実施しなければならない。さらに、
中間和および積を記憶して演算の進行につれてメモリか
ら検索しなければならない。したがって、CPUには全
ての算術演算を実施するタスクだけでなくメモリに対す
るデータ転送を制御するタスクの負担もかかる。したが
ってメモリは初期生データおよび全ての中間結果を処理
するのに充分な大きさでなければならない。最後に、た
とえ多数のCPUを使用しても、アドレス、データおよ
び結果が交換されるため関連するアドレスおよびデータ
バスのトラフィックが重要となる。
【0003】
【発明が解決しようとする課題】したがって、計算集約
的応用をより効率的に処理する装置、方式および方法に
対するニーズが生じている。このような装置、方式およ
び方法はCPUのタスク負担を軽減し、所要メモリ量を
最少限に抑え、バスの帯域幅を効率的に使用するもので
なければならない。さらに、このような装置、方式およ
び方法は現在利用できるデバイスおよびシステム構成と
互換性のあるものでなければならない。
【0004】
【課題を解決するための手段】データおよび計算結果を
保持する記憶位置のローおよびカラムを含むデータメモ
リを有するアクティブメモリが提供される。制御命令を
保持する記憶位置のローおよびカラムを含むブロードキ
ャスト(broadcast)メモリも提供される。デ
ータメモリから検索される第1および第2のデータ語を
使用して第1の演算を実施しかつ第1の演算結果および
前の演算結果を使用して第2の演算を実施する計算回路
が含まれる。ブロードキャストメモリから受信する制御
命令に応答して作動する制御回路がデータメモリから計
算回路への第1および第2のデータ語の転送および第1
および第2の演算の実施を制御する。
【0005】本発明の概念に包含される装置、方式およ
び方法により計算集約的応用はより効率的に処理され
る。例えば、本発明の概念を包含するアクティブメモリ
デバイスを使用したシステムにより分散処理を実現する
ことができる。分散処理によりCPUのタスク負担が軽
減され、所要メモリ量が最少限に抑えられ、バスの帯域
幅がより効率的に使用される。
【0006】
【実施例】本発明の概念を包含するアーキテクチュアを
使用した処理システム10を図1に示す。処理システム
10はデータバス16およびアドレスバス18を介して
いくつかのアクティブメモリデバイス14に接続されて
いる中央処理装置(CPU)12を含んでいる。図1の
アーキテクチュアにおいて、主システム制御および計算
機能は例えば汎用マイクロプロセッサ、マイクロコント
ローラ、デジタル信号プロセッサ、もしくはグラフィッ
クプロセッサとすることができるCPU12により提供
される。後記するように、一般的なシステム操作に必要
なデータおよび命令記憶を行う他に、アクティブメモリ
デバイス14は問題解決操作に必要な分散計算およびデ
ータ処理を行う。
【0007】実施例のシステム10では、代表的に行列
演算や音声合成時に必要な繰返し計算等のデータ集約的
計算がアクティブメモリデバイス14を使用して分散的
に実施される。例えば、CPU12は所与の問題に必要
な生データのサブセットを各アクティブメモリ14にロ
ードすることができる。各アクティブメモリ14は次
に、CPU12が同時に他のタスクを実施できる間に、
対応するデータサブセットに所与の演算セットを実施す
る。アクティブメモリ14へ分散されたタスクが完了す
ると、CPU12は結果を検索して問題の解決を完了す
る。好ましくは、システム10内の各アクティブメモリ
14は選択された従来の(“イナクティブ”)メモリユ
ニットのピン配置(例えば、28ピンpinout)と
互換性のあるピン配置を有している。このようにして、
アクティブメモリ14および従来のイナクティブメモリ
を所与のボードや他の支持構造上で交替させることがで
きる。
【0008】CPU12にかかる計算負担を最少限に抑
える他に、アクティブメモリデバイス14を使用した分
散処理によりデータバス16およびアドレスバス18を
より効率的に利用することができる。本質的に、アクテ
ィブデバイス14によりデータが圧縮すなわち低減され
てデータバス16を介した生データおよび中間結果の交
換およびアドレスバス18を介した対応するアドレス送
信が実質的に低減されるようになされる。
【0009】本発明の概念を包含するアクティブメモリ
14の機能ブロック図を図2に示す。アクティブメモリ
14はデータランダムアクセスメモリ20(RAM)、
ブロードキャストRAM22、コントローラ24および
データパス26を含むシングルチップもしくはモジュー
ル(“デバイス”)として構成することができる。シン
グルチップの実施例では、データRAM20およびブロ
ードキャストRAM22は所与のデバイスセットに対し
て標準化された構成として製造することができコントロ
ーラ24およびデータパス26は所与のデバイスもしく
はデバイスのサブセットの動作要求に適合するようにカ
ストマイズされる。
【0010】データRAM20はスタティックランダム
アクセスメモリ(SRAM)もしくはダイナミックラン
ダムアクセスメモリアレイ(DRAM)とすることがで
きる。図2において、RAM20は128ロー128カ
ラム構成とされたRAMセルの2K×8メモリとして示
されている。図2に示す構成の他に、いくつかの交番R
AMアーキテクチュアのいずれかを使用することもでき
ることがお判りと思われる。データRAM20にはロー
アドレス回路28を含むアレイ内の選定セルに対してデ
ータを読み取りおよび書き込む回路と、ローアドレスマ
ルチプレクサ30と、第1段復号(カラムアドレス)回
路32と、カラムアドレスマルチプレクサ34と、入出
力回路36が関連している。マルチプレクサ30により
システムアドレスバス18もしくはコントローラ24か
らローアドレス回路28へアドレスビットが通される。
個別信号もしくはアドレス値自体に応答して選定を行う
ことができる。同様に、マルチプレクサ34によりアド
レスバス18もしくはコントローラ24からのアドレス
ビットが通される。マルチプレクサ30、34と入出力
回路36によりデータバス16およびアドレスバス18
を介してCPU12からもしくは内部バス38を介して
データパス26からデータRAMのセルへデータビット
を転送することができる。
【0011】図2の実施例では、4本の隣接ビット線の
各セットがマルチプレクサ33を介して第1段デコーダ
32により多重化されて32ビット幅の内部バス38が
形成される(例えば、256カラムメモリアーキテクチ
ュアを使用する場合には、内部バスは64ビット幅とな
る)。実施例では、I/O回路36はアドレスバス18
からのアドレスビットに応答して32ビット内部バス3
8上の4セットの隣接8ビットの一つを選定してシステ
ムデータバス16へ伝達する4:1マルチプレクサとし
て作動する。別の実施例では、内部バス38の幅やシス
テムバス16と連絡されるライン(ビット)数に応じて
入出力回路の構成を変えることができる。
【0012】ブロードキャストRAM22もスタティッ
クもしくはダイナミックとすることとができ、ローアド
レス回路40を含むそのメモリセルアレイに対してデー
タの書き込みおよび読み取りを行う回路と、ローアドレ
スマルチプレクサ42と、第1段(カラム)復号回路4
4と、マルチプレクサ46と、入出力回路48と関連し
ている。図2において、ブロードキャストRAMは2ロ
ー128カラム構成とされているが、他の実施例では交
番ロー/カラム構成を使用することができる。ブロード
キャストRAM22に関連するリード/ライト回路はR
AM20に関連するリード/ライト回路と同様に作動す
る。マルチプレクサ45を介した実施例の第1段デコー
ダ回路44により、ブロードキャストRAM22内の1
28カラムメモリの各隣接4カラムに対して第2の内部
バス50を介してデータパス26に接続されている選定
32ビットによる4:1多重化が行われる。マルチプレ
クサ42、46によりシステムアドレスバス18もしく
はコントローラ24からのアドレスビットが選択的に通
される。したがって、マルチプレクサ42、46と入出
力回路48によりCPU12もしくはデータパス26を
介したコントローラ24からブロードキャストRAM2
6のセルへデータを転送することができる。
【0013】データRAM20に関連する対応する回路
と同様に、ローアドレス回路40、マルチプレクサ4
2、46、第1段復号回路44、入出力回路48の特定
構成はブロードキャストRAM22のセルアレイ内のロ
ーおよびカラム数、内部バス50の幅、システムアドレ
スバス18から受信されるビット数、およびシステムデ
ータバス14と連絡されるビット(線)数等の要因に基
いて変動する。好ましくは、データバス16とデータR
AM20に関連する入出力回路36およびブロードキャ
ストRAM22に関連する入出力回路48との接続は従
来のメモリpinoutとの互換性を与えるために1組
のピン(Dφ−D7)を介して行われる。同様に、デー
タRAM20およびブロードキャストRAM22に関連
するリード/ライト回路の接続は(図示せぬ)1組のピ
ンを介して行うことができる。アクティブメモリ14は
システムメモリの一部であるため、メモリ14はメモリ
チップの特性を示すことが好ましい。すなわち、メモリ
14はメモリチップのように効率的で、サイズが小さく
かつ従来の(“イナクティブ”)メモリチップのピン配
置と互換性のある最少数のデータおよびアドレスピンし
か使用しないものでなければならない。
【0014】コントローラ24の制御の元でデータパス
26により内部バス38、50を介してデータが方路決
定され所望の分散計算機能が得られる。所望の計算機能
を実施するためにチップやユニットをカストマイズする
のに必要なランダム論理、プログラマブルゲートアレイ
回路、もしくはプログラマブル論理アレイ回路としてデ
ータパス26を実現することができる。例えば、データ
パス26は加算器や乗算器を含んで行列乗算器の例や音
声応用における比較器回路を実現することができる。さ
らに、コントローラ24およびデータパス26は共にデ
ジタル信号プロセッサのテキサスインスツルメンツTI
−320ファミリーに見られるようなデジタル信号プロ
セッサ回路として実現することができる。
【0015】システム10の実施例では、アクティブメ
モリ14がシステムアドレスバス18から受信する対応
する数のアドレスビットに対して利用可能な最高アドレ
ススペースに各ブロッドキャストRAM22が配置され
る。これにより、各ブロードキャストRAM22はチッ
プセレクト信号なしで書込みおよび読取りを行うことが
できる。さらに、システム10内のアクティブメモリ1
4の全てのブロードキャストRAM22を同時にアクセ
スすることができる。所与のメモリ14に対するブロー
ドキャストRAM22はコントローラ26が選定された
計算を実施するのに使用する命令およびデータをCPU
12からデータバス16を介して受信する。
【0016】代表的な計算では、CPU12は各アクテ
ィブメモリ14のデータRAM20へデータバス16か
らデータを書き込む。代表的に各データRAM20は演
算される全体データセットの異なるサブセットを保持す
る。例えば、行列乗算の場合には、各データRAM20
は関与する行列の対応するローに対するデータを保持す
ることができる。各コントローラ24が従う制御シーケ
ンスはアドレスバス18上にハイアドレスビットが存在
する時に各ブロードキャストRAM22へ書き込まれる
ようにデータバス16へ与えられる。同様に、システム
10により実施される所望する計算の少くとも一つの引
数(ベクトル)が各ブロードキャストRAM22へ書き
込まれる。代表的に、システム10内の全てのブロード
キャストRAM22へ同じベクトルが書き込まれる。
【0017】一実施例において、ブロードキャストメモ
リスペース内のダミー位置において各アクティブメモリ
デバイス14のコントローラ24およびデータパス26
により引数の実行が開始される。特に、制御シーケンス
に指示されるコントローラ24によりデータパス26は
ブロードキャストRAM22から検索される引数をデー
タRAM20からのデータの各ローへ与える。各データ
RAM20内のデータの所与のローへ引数を与えた結果
は同じローに沿った1つもしくは2つの選定バイト位置
へコントローラ24によりデータパス26を介して書き
戻される。コントローラ24によりデータRAM20内
の全データが演算されるように全てのローアドレスおよ
びデータRAM第1段デコーダ32の4対1マルチプレ
クサへの全アドレスが巡回される。
【0018】コントローラ24およびデータパス26に
実現することができる一種の計算回路は図3に示す乗算
−累算回路52である。乗算−累算回路52は次式に従
ったドット積計算のような応用に有用である。
【0019】
【数1】
【0020】図3の実施例では、内部バス38上の各1
6ビットはそれぞれバスインターフェイス54を介して
マルチプレクサ56のXおよびY入力に接続されてい
る。乗算器の32ビット出力は1対16ビットシフター
58へ与えられる。多くのデジタル信号応用では級数計
算の第1項(すなわち、X1 およびY1 項)は1よりも
小さいため、シフター58を使用して乗算器の出力を正
規化し先縁ゼロの数を低減することができる。次に演算
器(ALU)60のA出力へポストシフター32ビット
が与えられる。演算器60には加減算等の基本的な算術
演算の他に増減分およびAND、OR等の論理演算を実
施する機能を持たせることができる。ALU60からの
32ビット出力は16ビットハイレジスタおよび16ビ
ットローレジスタへ分割することができる累算器62へ
送られる。累算器62およびALU60はALU60に
より実施される現在の演算結果が累算器62へ入力され
ALU60により実施された前の演算結果がALU60
のB入力へ戻されるようにパイプライン接続される。A
LU60の出力はシフター64へもパイプライン接続さ
れる。シフター64はバスインターフェイス54および
内部バス38を介してデータRAM20へ戻す出力の最
上位16ビットを選定する。
【0021】乗算−累算演算では、データRAM20の
所与のローから取り出した2つの16ビット語が第1段
復号回路32から内部バス32を介して与えられ次に乗
算器56により乗算されてALU60のB入力へ与えら
れる。乗算結果は累算器62からのB入力に与えられる
前の乗算/加算結果と加算される。効率を良くするため
に、シフターにより選定される最上位16結果ビットが
データRAM20内の同じローの位置へ返送される。級
数計算が進むと、データがローごとに検索されて結果は
ローごとにデータRAM20へ書き戻される。
【0022】コントローラ24が乗算−累算を指示する
ための制御シーケンスを保持する他に、ブロードキャス
トRAMはデータパス26の乗算/累算回路の特定演算
を規定するためのデータを受信し記憶する。例えば、ど
れだけ多くのXijおよびYik項を乗算しかつ加算すべき
かを規定する命令語、およびシフター64により選定さ
れる16ビットをブロードキャストRAMに記憶してコ
ントローラ24が使用するようにすることができる。
【0023】アクティブメモリデバイスが各データRA
M20に予め書き込まれたデータで演算を行う間、CP
U12は解放されて他のタスクを受け持つことができ
る。次に、アクティブメモリにより分散計算タスクの完
了が表示された後で、CPU12は各アクティブメモリ
14のデータRAM20からの低減(圧縮)された結果
の検索へ戻る。
【0024】本発明およびその利点について詳細に説明
してきたが、特許請求の範囲に明記された発明の精神お
よび範囲内でさまざまな変更、置換および修正が可能で
ある。
【0025】以上の説明に関して更に以下の項を開示す
る。 (1) データおよび計算結果を保持する記憶位置のロー
およびカラムを含むデータメモリと、制御命令を保持す
る記憶位置のローおよびカラムを含むブロードキャスト
メモリと、前記データメモリから検索した第1および第
2のデータ語を使用して第1の演算を実施しかつ前記第
1の演算結果および前の演算結果を使用して第2の演算
を実施する計算回路と、前記ブロードキャストメモリか
ら受信した制御命令に応答して作動して前記データメモ
リから前記計算回路への前記第1および第2のデータ語
の転送と前記第1および第2の演算の実施を制御する制
御回路と、を具備するアクティブメモリ。
【0026】(2) データビットおよび演算結果ビット
を保持する複数のローおよびカラム構成とされたメモリ
セルアレイを含むデータメモリと、前記データメモリに
接続されて前記データおよび結果ビットを前記データメ
モリ内の前記セルおよび第1の内部バス間で選択的に転
送するデータメモリ制御回路と、制御ビットを保持する
複数のローおよびカラム構成とされたメモリセルアレイ
を含むブロードキャストメモリと、前記ブロードキャス
トメモリに接続されて前記制御ビットを前記ブロードキ
ャストメモリ内の前記セルおよび第2の内部バス間で選
択的に転送するブロードキャストメモリと、前記デー
タ、制御、および結果ビット流を前記第1および第2の
内部バスを介して方路決定しかつ選定された演算を実施
するように作動するデータパスであって、前記データメ
モリから検索されて前記第1の内部バスへ与えられる前
記データビットの第1および第2の語を乗算してその積
を前の演算結果へ加算するように作動する乗算/累算回
路を含むデータパスと、前記ブロードキャストメモリ制
御回路、前記データメモリ制御回路、および前記データ
パスに接続され、前記ブロードキャストメモリから検索
された前記制御ビットのいくつかに応答して前記第1の
内部バスを介した前記データメモリから前記データパス
への前記第1および第2の語の転送および前記乗算器/
累算器による乗算および加算の実施を指示するコントロ
ーラと、を具備するメモリ。
【0027】(3) 中央処理装置と、前記中央処理装置
に接続されたアドレスバスと、前記中央処理装置に接続
されたデータバスと、単体として構成されたアクティブ
メモリデバイスと、を具備する処理方式であって、前記
アクティブメモリデバイスは、データビットおよび計算
結果ビットを保持する複数のローおよびカラム構成とさ
れたメモリセルアレイを含むデータメモリと、前記アド
レスバスおよび前記データメモリに接続されて前記デー
タメモリ内の前記セルおよび第1の内部バス間でデータ
および結果ビットを選択的に転送するデータメモリ制御
回路と、前記第1の内部バスおよび前記データバスに接
続されて両者間でデータおよび結果ビットを選択的に転
送するデータメモリ入出力回路と、制御ビットを保持す
る複数のローおよびカラム構成とされたメモリセルアレ
イを含むブロードキャストメモリと、前記ブロードキャ
ストメモリおよび前記アドレスバスに接続されて前記ブ
ロードキャストメモリ内の前記セルおよび第2の内部バ
ス間で選択的に制御ビットを転送するブロードキャスト
メモリ制御回路と、前記第2の内部バスおよび前記デー
タバスに接続されて両者間で選択的に制御ビットを転送
するブロードキャストメモリ入出力回路と、前記データ
メモリから検索されて前記第2の内部バスへ与えられる
第1および第2のデータ語を使用して第1の演算を実施
しかつ前記第1の演算結果および記憶された前の演算結
果を使用して第2の演算を実施するように作動する計算
回路と、前記計算回路、前記ブロードキャストメモリ制
御回路、および前記データメモリ制御回路に接続され、
前記ブロードキャストメモリから検索した前記制御ビッ
トのいくつかに応答して前記データメモリからの前記第
1および第2の語の転送、前記計算回路による前記第1
および第2の演算の実施、および前記第2の演算結果の
前記データメモリへの転送を制御するように作動するコ
ントローラと、を具備する処理方式。
【0028】(4) 第3項記載の方式であって、前記計
算回路は、前記第1および第2の語に対して前記第1の
算術演算を実施しそれに応答して第1の結果を与える第
1の回路と、前記第2の算術演算を実施それに応答して
第2の結果を与える第2の回路であって、前記第1の回
路から前記第1の結果を受信して前記第2の演算を実施
するのに使用する第2の回路と、前記前の演算の前記結
果を一時的に記憶する累算器であって、前記累算器に記
憶される前記結果は前記第2の回路へ与えられて前記第
2の演算を実施するのに使用される累算器と、を具備す
る処理方式。
【0029】(5) 第3項記載の方式であって、前記計
算回路は、それぞれ第1および第2の入力ポートへ与え
られる前記第1および第2の語を乗算してその積を出力
ポートへ与えるように作動する乗算器と、各入力ポート
に与えられるデータ語を加算してその和を出力ポートに
与えるように作動する演算器であって、前記乗算器の前
記出力に与えられる積が前記演算器の第1の前記入力ポ
ートへ与えられる演算器と、前記演算器の前記出力ポー
トに与えられる前の結果を一時的に記憶する累算器であ
って、前記累算器に記憶されている前記前の結果は前記
演算器の第2の前記入力ポートへ与えられて前記演算器
の前記第1のポートへ与えられる前記積に加算される累
算器と、を具備する処理方式。
【0030】(6) データおよび計算結果を保持する記
憶位置のローおよびカラムを含むデータメモリを含むア
クティブメモリが提供される。ブロードキャストメモリ
は制御命令を保持する記憶位置のローおよびカラムを含
んでいる。データメモリから検索された第1および第2
のデータ語を使用して第1の演算を実施しかつ第1の演
算結果および前の演算結果を使用して第2の演算を実施
する計算回路が設けられる。制御回路はブロードキャス
トメモリから受信した制御命令に応答してデータメモリ
から前記計算回路への第1および第2のデータ語の転送
と第1および第2の演算の実施を制御するように作動す
る。
【0031】注記) (c) 著作権、 ** テキサスインスツルメンツ社、19
93年。本特許文書の開示の一部に著作権保護の対象と
なる資料が含まれている。著作権およびマスクワーク所
有者は米国特許庁で閲覧できる特許文書や特許開示、特
許ファイルもしくは記録をいかなる人がファクシミリで
再生しても異議を唱えないが、それ以外については全て
の著作権およびマスクワークの権利を保有するものとす
る。
【0032】関連特許の相互参照 同じ譲受人の下記の特許および出願が参照としてここに
組み込まれている。 米国特許出願 号、アトニードケッ
ト番号第32350−714号、TI−13438、
“分散処理装置、方式および方法”、出願日、 米国特許出願 号、アトニードケッ
ト番号第32350−715号、TI−13439、
“メモリ埋込サーチ演算器を実現する装置、方式および
方法”、出願日 、 米国特許出願 号、アトニードケッ
ト番号第32350−716号、TI−13440、
“カネルバメモリを実現する装置、方式および方法”、
出願日 、 。
【図面の簡単な説明】
【図1】本発明の概念を実施したデータ処理方式のブロ
ック図。
【図2】図1に示すアクティブメモリデバイスの実施例
の機能ブロック図。
【図3】図2に示すアクティブメモリデバイスの計算回
路の実施例の機能ブロック図。
【符号の説明】
14 アクティブメモリ 20 データメモリ 22 ブロードキャストメモリ 24 制御回路 26 計算回路
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 G06F 17/16 (72)発明者 シバリング マハント − シェッティ アメリカ合衆国テキサス州リチャードソ ン,スコッツボロ レーン 1405 (72)発明者 デレック スミス アメリカ合衆国ルイジアナ州ラファイエッ ト,ルーズベルト ストリート 512

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 データおよび計算結果を保持する記憶位
    置のローおよびカラムを含むデータメモリと、 制御命令を保持する記憶位置のローおよびカラムを含む
    ブロードキャストメモリと、 前記データメモリから検索した第1および第2のデータ
    語を使用して第1の演算を実施し前記第1の演算結果お
    よび前の演算結果を使用して第2の演算を実施する計算
    回路と、 前記ブロードキャストメモリから受信する制御命令に応
    答して作動して前記データメモリから前記計算回路への
    前記第1および第2のデータ語の転送と前記第1および
    第2の演算の実施を制御する制御回路と、 を具備するアクティブメモリ。
  2. 【請求項2】 中央処理装置と、 前記中央処理装置に接続されたアドレスバスと、 前記中央処理装置に接続されたデータバスと、 単体として構成されたアクティブメモリデバイスと、 を具備する処理方式であって、前記アクティブメモリデ
    バイスは、 データビットおよび計算結果を保持する複数のローおよ
    びコラム構成とされたメモリセルアレイを含むデータメ
    モリと、 前記アドレスバスおよび前記データメモリに接続されて
    前記データメモリ内の前記セルと第1の内部バスとの間
    でデータおよび結果ビットを選択的に転送する データメモリ制御回路と、前記第1の内部バスおよび前
    記データバスに接続されて両者間でデータおよび結果ビ
    ットを選択的に転送するデータメモリ入出力回路と、 制御ビットを保持する複数のローおよびカラム構成とさ
    れたメモリセルアレイを含むブロードキャストメモリ
    と、 前記ブロードキャストメモリおよび前記アドレスバスに
    接続されて前記ブロードキャストメモリ内の前記セルと
    第2の内部セルとの間で選択的に制御ビットを転送する
    ブロードキャストメモリ制御回路と、 前記第2の内部バスおよび前記データバスに接続されて
    両者間で選択的に制御ビットを転送するブロードキャス
    トメモリ入出力回路と、 前記データメモリから検索されて前記第1の内部バスへ
    与えられる第1および第2のデータ語を使用して第1の
    演算を実施かつ前記第1の演算結果及び記憶された前の
    演算結果を使用して第2の演算を実施する計算回路と、 前記計算回路と、前記ブロードキャストメモリ制御回路
    と、前記データメモリ制御回路に接続され、前記ブロー
    ドキャストメモリから受信する前記制御ビットのいくつ
    か応答して前記データメモリからの前記第1および第2
    の語の転送と、前記計算回路による前記第1および第2
    の演算の実施と、前記第2の演算結果の前記データメモ
    リへの転送とを制御するコントローラと、 を具備する処理方式。
JP6115229A 1993-05-28 1994-05-27 アクティブメモリおよび処理方式 Pending JPH07141175A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US068908 1993-05-28
US08/068,908 US5528549A (en) 1993-05-28 1993-05-28 Apparatus, systems and methods for distributed signal processing

Publications (1)

Publication Number Publication Date
JPH07141175A true JPH07141175A (ja) 1995-06-02

Family

ID=22085485

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6115229A Pending JPH07141175A (ja) 1993-05-28 1994-05-27 アクティブメモリおよび処理方式

Country Status (4)

Country Link
US (2) US5528549A (ja)
EP (1) EP0626658A1 (ja)
JP (1) JPH07141175A (ja)
TW (1) TW273606B (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002108691A (ja) * 2000-09-29 2002-04-12 Mitsubishi Electric Corp 半導体記憶装置および半導体記憶装置の制御方法
JP2010287249A (ja) * 2010-08-09 2010-12-24 Renesas Electronics Corp 半導体記憶装置およびメモリ制御システム
JP2019061677A (ja) * 2017-09-27 2019-04-18 三星電子株式会社Samsung Electronics Co.,Ltd. 積層型メモリ装置及びその動作方法並びにメモリシステム

Families Citing this family (70)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10232788A (ja) * 1996-12-17 1998-09-02 Fujitsu Ltd 信号処理装置及びソフトウェア
US6185704B1 (en) * 1997-04-11 2001-02-06 Texas Instruments Incorporated System signaling schemes for processor and memory module
US5818788A (en) * 1997-05-30 1998-10-06 Nec Corporation Circuit technique for logic integrated DRAM with SIMD architecture and a method for controlling low-power, high-speed and highly reliable operation
US6760833B1 (en) * 1997-08-01 2004-07-06 Micron Technology, Inc. Split embedded DRAM processor
US8489861B2 (en) * 1997-12-23 2013-07-16 Round Rock Research, Llc Split embedded DRAM processor
US7346644B1 (en) 2000-09-18 2008-03-18 Altera Corporation Devices and methods with programmable logic and digital signal processing regions
US7119576B1 (en) 2000-09-18 2006-10-10 Altera Corporation Devices and methods with programmable logic and digital signal processing regions
US9015390B2 (en) * 2003-04-25 2015-04-21 Micron Technology, Inc. Active memory data compression system and method
US8620980B1 (en) 2005-09-27 2013-12-31 Altera Corporation Programmable device with specialized multiplier blocks
US8954426B2 (en) * 2006-02-17 2015-02-10 Google Inc. Query language
US20070185870A1 (en) 2006-01-27 2007-08-09 Hogue Andrew W Data object visualization using graphs
US8266198B2 (en) * 2006-02-09 2012-09-11 Altera Corporation Specialized processing block for programmable logic device
US8301681B1 (en) 2006-02-09 2012-10-30 Altera Corporation Specialized processing block for programmable logic device
US8041759B1 (en) 2006-02-09 2011-10-18 Altera Corporation Specialized processing block for programmable logic device
US8266199B2 (en) * 2006-02-09 2012-09-11 Altera Corporation Specialized processing block for programmable logic device
KR100735527B1 (ko) * 2006-02-13 2007-07-04 삼성전자주식회사 2개의 패드 행을 포함하는 반도체 메모리 장치
US7836117B1 (en) 2006-04-07 2010-11-16 Altera Corporation Specialized processing block for programmable logic device
US7822799B1 (en) 2006-06-26 2010-10-26 Altera Corporation Adder-rounder circuitry for specialized processing block in programmable logic device
US8386550B1 (en) 2006-09-20 2013-02-26 Altera Corporation Method for configuring a finite impulse response filter in a programmable logic device
US8954412B1 (en) 2006-09-28 2015-02-10 Google Inc. Corroborating facts in electronic documents
US7930336B2 (en) * 2006-12-05 2011-04-19 Altera Corporation Large multiplier for programmable logic device
US8386553B1 (en) 2006-12-05 2013-02-26 Altera Corporation Large multiplier for programmable logic device
US7814137B1 (en) 2007-01-09 2010-10-12 Altera Corporation Combined interpolation and decimation filter for programmable logic device
US8650231B1 (en) 2007-01-22 2014-02-11 Altera Corporation Configuring floating point operations in a programmable device
US7865541B1 (en) 2007-01-22 2011-01-04 Altera Corporation Configuring floating point operations in a programmable logic device
US8645450B1 (en) 2007-03-02 2014-02-04 Altera Corporation Multiplier-accumulator circuitry and methods
US7949699B1 (en) 2007-08-30 2011-05-24 Altera Corporation Implementation of decimation filter in integrated circuit device using ram-based data storage
US8959137B1 (en) 2008-02-20 2015-02-17 Altera Corporation Implementing large multipliers in a programmable integrated circuit device
US8244789B1 (en) 2008-03-14 2012-08-14 Altera Corporation Normalization of floating point operations in a programmable integrated circuit device
US8626815B1 (en) 2008-07-14 2014-01-07 Altera Corporation Configuring a programmable integrated circuit device to perform matrix multiplication
US8255448B1 (en) 2008-10-02 2012-08-28 Altera Corporation Implementing division in a programmable integrated circuit device
US8307023B1 (en) 2008-10-10 2012-11-06 Altera Corporation DSP block for implementing large multiplier on a programmable integrated circuit device
TWI398876B (zh) 2008-12-25 2013-06-11 Winbond Electronics Corp 記憶體控制器與解碼器
US8805916B2 (en) * 2009-03-03 2014-08-12 Altera Corporation Digital signal processing circuitry with redundancy and bidirectional data paths
US8549055B2 (en) * 2009-03-03 2013-10-01 Altera Corporation Modular digital signal processing circuitry with optionally usable, dedicated connections between modules of the circuitry
US8468192B1 (en) 2009-03-03 2013-06-18 Altera Corporation Implementing multipliers in a programmable integrated circuit device
US8645449B1 (en) 2009-03-03 2014-02-04 Altera Corporation Combined floating point adder and subtractor
US8706790B1 (en) 2009-03-03 2014-04-22 Altera Corporation Implementing mixed-precision floating-point operations in a programmable integrated circuit device
US8886696B1 (en) 2009-03-03 2014-11-11 Altera Corporation Digital signal processing circuitry with redundancy and ability to support larger multipliers
US8650236B1 (en) 2009-08-04 2014-02-11 Altera Corporation High-rate interpolation or decimation filter in integrated circuit device
US8412756B1 (en) 2009-09-11 2013-04-02 Altera Corporation Multi-operand floating point operations in a programmable integrated circuit device
US8396914B1 (en) 2009-09-11 2013-03-12 Altera Corporation Matrix decomposition in an integrated circuit device
US8539016B1 (en) 2010-02-09 2013-09-17 Altera Corporation QR decomposition in an integrated circuit device
US7948267B1 (en) 2010-02-09 2011-05-24 Altera Corporation Efficient rounding circuits and methods in configurable integrated circuit devices
US8601044B2 (en) * 2010-03-02 2013-12-03 Altera Corporation Discrete Fourier Transform in an integrated circuit device
US8458243B1 (en) 2010-03-03 2013-06-04 Altera Corporation Digital signal processing circuit blocks with support for systolic finite-impulse-response digital filtering
US8484265B1 (en) 2010-03-04 2013-07-09 Altera Corporation Angular range reduction in an integrated circuit device
US8510354B1 (en) 2010-03-12 2013-08-13 Altera Corporation Calculation of trigonometric functions in an integrated circuit device
US8539014B2 (en) * 2010-03-25 2013-09-17 Altera Corporation Solving linear matrices in an integrated circuit device
US8589463B2 (en) 2010-06-25 2013-11-19 Altera Corporation Calculation of trigonometric functions in an integrated circuit device
US8862650B2 (en) 2010-06-25 2014-10-14 Altera Corporation Calculation of trigonometric functions in an integrated circuit device
US8577951B1 (en) 2010-08-19 2013-11-05 Altera Corporation Matrix operations in an integrated circuit device
IT1403375B1 (it) * 2010-10-29 2013-10-17 Strollo Microcontrollore multiprocessore espandibile/parametrizzato
US8645451B2 (en) 2011-03-10 2014-02-04 Altera Corporation Double-clocked specialized processing block in an integrated circuit device
US9600278B1 (en) 2011-05-09 2017-03-21 Altera Corporation Programmable device using fixed and configurable logic to implement recursive trees
US8812576B1 (en) 2011-09-12 2014-08-19 Altera Corporation QR decomposition in an integrated circuit device
US8949298B1 (en) 2011-09-16 2015-02-03 Altera Corporation Computing floating-point polynomials in an integrated circuit device
US9053045B1 (en) 2011-09-16 2015-06-09 Altera Corporation Computing floating-point polynomials in an integrated circuit device
US8762443B1 (en) 2011-11-15 2014-06-24 Altera Corporation Matrix operations in an integrated circuit device
US8543634B1 (en) 2012-03-30 2013-09-24 Altera Corporation Specialized processing block for programmable integrated circuit device
US9098332B1 (en) 2012-06-01 2015-08-04 Altera Corporation Specialized processing block with fixed- and floating-point structures
US8996600B1 (en) 2012-08-03 2015-03-31 Altera Corporation Specialized processing block for implementing floating-point multiplier with subnormal operation support
US9207909B1 (en) 2012-11-26 2015-12-08 Altera Corporation Polynomial calculations optimized for programmable integrated circuit device structures
US9189200B1 (en) 2013-03-14 2015-11-17 Altera Corporation Multiple-precision processing block in a programmable integrated circuit device
US9348795B1 (en) 2013-07-03 2016-05-24 Altera Corporation Programmable device using fixed and configurable logic to implement floating-point rounding
US20150089127A1 (en) * 2013-09-23 2015-03-26 Kuljit S. Bains Memory broadcast command
US9379687B1 (en) 2014-01-14 2016-06-28 Altera Corporation Pipelined systolic finite impulse response filter
US9684488B2 (en) 2015-03-26 2017-06-20 Altera Corporation Combined adder and pre-adder for high-radix multiplier circuit
US10942706B2 (en) 2017-05-05 2021-03-09 Intel Corporation Implementation of floating-point trigonometric functions in an integrated circuit device
US10902113B2 (en) * 2017-10-25 2021-01-26 Arm Limited Data processing

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0513851A3 (en) * 1984-10-05 1993-02-03 Hitachi, Ltd. Memory device having arithmetic and logic functions, in particular for graphic processing
US4903236A (en) * 1987-07-15 1990-02-20 Mitsubishi Denki Kabushiki Kaisha Nonvolatile semiconductor memory device and a writing method therefor
US5276643A (en) * 1988-08-11 1994-01-04 Siemens Aktiengesellschaft Integrated semiconductor circuit
ATE99448T1 (de) * 1988-08-11 1994-01-15 Siemens Ag Integrierte halbleiterschaltung mit einem speicherbereich.
DE69132495T2 (de) * 1990-03-16 2001-06-13 Texas Instruments Inc Verteilter Verarbeitungsspeicher
JP3108505B2 (ja) * 1992-03-13 2000-11-13 沖電気工業株式会社 デコーダ回路
EP0606653A1 (en) * 1993-01-04 1994-07-20 Texas Instruments Incorporated Field programmable distributed processing memory

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002108691A (ja) * 2000-09-29 2002-04-12 Mitsubishi Electric Corp 半導体記憶装置および半導体記憶装置の制御方法
JP2010287249A (ja) * 2010-08-09 2010-12-24 Renesas Electronics Corp 半導体記憶装置およびメモリ制御システム
JP2019061677A (ja) * 2017-09-27 2019-04-18 三星電子株式会社Samsung Electronics Co.,Ltd. 積層型メモリ装置及びその動作方法並びにメモリシステム

Also Published As

Publication number Publication date
EP0626658A1 (en) 1994-11-30
US5528549A (en) 1996-06-18
TW273606B (ja) 1996-04-01
US5500828A (en) 1996-03-19

Similar Documents

Publication Publication Date Title
JPH07141175A (ja) アクティブメモリおよび処理方式
US5528550A (en) Apparatus, systems and methods for implementing memory embedded search arithmetic logic unit
US10817587B2 (en) Reconfigurable matrix multiplier system and method
US6061779A (en) Digital signal processor having data alignment buffer for performing unaligned data accesses
US5832290A (en) Apparatus, systems and method for improving memory bandwidth utilization in vector processing systems
US7340562B2 (en) Cache for instruction set architecture
US6510510B1 (en) Digital signal processor having distributed register file
US3787673A (en) Pipelined high speed arithmetic unit
US5404562A (en) Massively parallel processor including queue-based message delivery system
US5175863A (en) Signal data processing system having independently, simultaneously operable alu and macu
JP3573755B2 (ja) 画像処理プロセッサ
US5179714A (en) Parallel bit serial data processor
US4872133A (en) Floating-point systolic array including serial processors
JPH0562387B2 (ja)
JP2012009055A (ja) 2次元マトリクス処理のためのレジスタ
US6804771B1 (en) Processor with register file accessible by row column to achieve data array transposition
CN111597501A (zh) 自适应性矩阵乘法器的系统
JPS62134763A (ja) 3アドレス・コ−ドの指標づけ装置
JP3333779B2 (ja) 行列演算装置
JPH0345420B2 (ja)
EP0626659A1 (en) Apparatus, system and method for distributed processing
US5928350A (en) Wide memory architecture vector processor using nxP bits wide memory bus for transferring P n-bit vector operands in one cycle
JPH1063647A (ja) 行列演算装置
JPH08106451A (ja) デジタルパターン認識ベクトルプロセッサ
JPS6058503B2 (ja) デ−タ処理制御方式