JP2002196974A

JP2002196974A - ディジタル信号処理システム

Info

Publication number: JP2002196974A
Application number: JP2001341822A
Authority: JP
Inventors: Kenneth C Kelly; シー、ケリィケネス; Irvinderpal S Ghai; エス、ガーイアーヴィンダーパル; Jay B Reimer; ビー、ライマージェイ; Tai Huu Nguyen; フーンガイェンタイ; Harland Glenn Hopkins; グレンホプキンスハーランド; Yi Luo; ルウイー; Jason A T Jones; エイ、ティー、ジョーンズジェイソン; Dan K Bui; ケイ、ブイダン; Patrick J Smith; ジェイ、スミスパトリック; Kevin A Mcgonagle; エイ、マッゴナグルケヴィン
Original assignee: Texas Instruments Inc
Current assignee: Texas Instruments Inc
Priority date: 2000-11-08
Filing date: 2001-11-07
Publication date: 2002-07-12
Also published as: ATE435461T1; EP1239374B1; US20020056030A1; US6691216B2; EP1239374A1; DE60139109D1

Abstract

(57)【要約】【課題】多数コアに共有されるプログラム・メモリを
設けることによりサイズ及び電力消費を減少させたディ
ジタル信号処理システムを得る。【解決手段】単一のコピーのソフトウェアを多数のプ
ロセッサ・コア（１１、１２）に共有させ、プログラム
・メモリ（１０）を対応する命令バス（Ｐ１、Ｐ２）に
よりそれぞれのプロセッサ・コア（１１、２１）に接続
する。プログラム・メモリ（１０）は、各クロック・サ
イクルにおいて２つ以上の命令要求をサービスする。デ
ータは、プロセッサ・コア・サブシステム（１０１、１
０２）に対してローカルな、かつ専用のデータ・バス
（Ｄ１、Ｄ２）を介してプロセッサ・コア（１１、２
１）によりアクセス可能な、個別的メモリ・アレー（１
２、１３、２２、２３）に記憶される。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、概して、複数のプ
ロセッサ・サブシステムにより共有されるプログラム・
メモリを有する、ディジタル信号処理システムに関す
る。更に詳細には、本発明は、多数の中央処理装置（Ｃ
ＰＵ）コア間で共有され、かつ同一のクロック・サイク
ルにおいて多数のＣＰＵコアに複数の命令をフェッチす
ることができるプログラム・メモリを有するディジタル
信号処理システムに関する。

【０００２】

【従来の技術】一般的に、マイクロプロセッサは、単一
の半導体チップ上に製作された種々の論理回路を含む。
このような論理回路は、典型的には、中央処理装置（Ｃ
ＰＵ）コア、メモリ及び他の多数のコンポーネントを含
む。テキサス・インスツルメンツ（株）により提供され
ているディジタル信号プロセッサ（ＤＰＳ）のように、
いくつかのマイクロプロセッサは、同一チップ上に１以
上のＣＰＵコアを含み得る。このような多数コアのＤＳ
Ｐ装置の場合に、各ＣＰＵコアは、典型的には、データ
及びプログラム命令を記憶している関連メモリを有す
る。換言すれば、多数コアのＤＳＰ装置内のあらゆるＣ
ＰＵコアにおいて、そのＣＰＵコアが使用するために予
約された対応のメモリが存在する。

【０００３】

【発明が解決しようとする課題】一般的に、ＤＳＰのよ
うなマイクロプロセッサは、コンパクトであること、消
費電力が極めて少ないこと、かつ可能な限り発熱が少な
いことが望ましい。これは、セルラ電話、ページャなど
のようにバッテリ駆動された小さな装置に存在するＤＳ
Ｐにおいて特に真となる。従って、少ない電力を必要と
する小さく、軽量な装置に帰結するＤＳＰ技術では、ど
のような改良も大いに望ましい。

【０００４】

【発明を解決するための手段】開示した本発明は、多数
コアのＤＳＰ装置においてオンボード・メモリの冗長性
をなくすことにより、コンパクトな低電力設計を効果的
に提供することができる。一実施例において、多数コア
のＤＳＰ装置は、共有プログラム・メモリを有する。そ
れぞれのプロセッサ・コアは、同一のソフトウェア・プ
ログラムを実行することができるので、多数のプロセッ
サ・コアが単一コピーのソフトウェアのみを共有するこ
とにより、メモリ要求を減少させることができる。従っ
て、プログラム・メモリは、対応する命令バスにより各
プロセッサ・コアに接続される。プログラム・メモリ
は、好ましくは、各クロック・サイクルにおいて２以上
の命令要求にサービスをする。しかしながら、データ
は、好ましくは、プロセッサ・コア・サブシステムに対
してローカルな独立メモリ・アレーに記憶される。プロ
セッサ・コアは、専用のデータ・バスを介してそれらの
データをそれぞれアクセスする。

【０００５】好ましい一実施例によれば、プログラム・
メモリは、各クロック・サイクルの最初の半サイクルで
第１のメモリ・アクセスを実行し、またクロック・サイ
クルの第２の半サイクルで第２のメモリ・アクセスを実
行することができる「ラッパー」(wrapper)を含む。指
定されたセットの命令バスは、第１のアクセスに対して
のみアービトレーションが許容され、残りの命令バス
は、第２のアクセスに対してのみアービトレーションが
許容される。このようにして、オン・ボード・メモリ要
求及び関連した電力消費の減少が効果的に達成される。

【０００６】

【発明の実施の形態】本発明の好ましい実施例の詳細な
説明のために、ここで添付図面を参照する。

【０００７】（表記及び用語）以下の説明及び特許請求
の範囲の全般にわたって、特定のシステムのコンポーネ
ントを指すために、一定の用語を使用する。当該技術分
野に習熟する者には理解されるように、半導体製造会社
は、異なる名称によりコンポーネントを指すことがあ
る。機能は別として、この文書は、名称において相違す
るコンポーネント間を区別する意図はない。以下の説明
において、及び特許請求の範囲において、用語「含む」
及び「備えている」は、非限定形式により使用され、従
って「含むけれども、・・・・に限定されない」という
ことを意味すると解釈されるべきである。更に、用語
「接続」又は「接続している」は、間接的な又は直接的
な電気接続を意味することを意図している。従って、第
１の装置が第２の装置に接続されているときは、その接
続は、直接的な電気接続による、又は他の装置及び接続
を介した間接的な電気接続であり得る。

【０００８】以下、多数コアの固定小数点のディジタル
信号プロセッサ（ＤＳＰ）チップに関連させて、本発明
の好ましい実施例を説明する。ただし、この実施例は、
この開示の範囲をこの関係に限定されるものではなく、
好ましい実施例は、任意の多数コアのＤＳＰ装置に適用
可能性があり、共有資源からの恩恵となる。

【０００９】ここで図を参照する。図１は、多数のＤＳ
Ｐサブシステム１０１、１０２と、共有プログラム・メ
モリ（ＰＲＡＭ）１０と、メモリ・マップド周辺装置と
して他の外部装置によりＤＳＰチップ１００をアクセス
可能にするホスト・ポート・インターフェース（ＨＰ
Ｉ）１７、２７とを含むＤＳＰチップ１００を示す。Ｄ
ＳＰサブシステム１０１、１０２は、好ましくは、コア
対コアの通信が可能である。

【００１０】各ＤＳＰサブシステム１０１、１０２（図
１に点線により概要的に区分けされている）は、好まし
くは、ＤＳＰコア１１、２１と、データ又はソフトウェ
ア用の二重アクセスのランダム・アクセス・メモリ（Ｄ
ＡＲＡＭ）１２、２２と、データ用のシングル・アクセ
スのランダム・アクセス・メモリ（ＳＡＲＡＭ）１３、
２３と、ブートアップ用の読み出し専用メモリ（ＲＯ
Ｍ）１４、２４と、１以上の外部インターフェース１
６、２６と、直接メモリ・アクセス（ＤＭＡ）ロジック
（更に、ＤＭＡコントローラとも呼ばれる）１５、２５
と、他の種々のサポート回路とを含む。ＤＡＲＡＭ１
２、２２は、好ましくは、４メモリ・ブロックを含み、
それぞれクロック・サイクル当り２つのメモリアクセス
をサポートする。ＤＡＲＡＭ１２、２２は、第１に、デ
ータ・ストレージ用を意図しているが、同時にプログラ
ム命令を記憶するために使用されてもよい。ＤＳＰコア
１１、２１におけるレジスタ（図示なし）は、ＤＡＲＡ
Ｍ１２、２２がプログラム・メモリ空間にマッピングさ
れているのか、又はデータ・メモリ空間にマッピングさ
れているのかを判断する。ＳＡＲＡＭ１３、２３は、好
ましくは、更に４メモリ・ブロックを含み、それぞれ
は、クロック・サイクル当り１つのメモリ・アクセスを
サポートする。各ＳＡＲＡＭは、好ましくは、データ・
ストレージのための予備とされる。

【００１１】共有プログラム・メモリ（ＰＲＡＭ）１０
は、好ましくは、プログラム命令のための予備とされ、
二重アクセスＲＡＭの１６ブロックを含む。ブロック・
サイズ及びブロック数は、所望により変更されてもよい
が、各ブロックは、１６キロバイトのストレージを備え
る。ＰＲＡＭ１０は、各サブシステムが一つの部分を有
することにより、部分１０Ａ、１０Ｂに物理的に実施さ
れてもよい。各ＤＳＰサブシステム１０１、１０２は、
好ましくは、各クロック・サイクルにおいてＰＲＡＭ１
０の任意位置からフェッチされた命令を実行することが
できる。好ましい実施例によれば、ＤＳＰコア１１、２
１は、ＰＲＡＭ１０に対する書き込みが許可されない。
代わって、ＤＭＡロジック１５、２５は、ＰＲＡＭ１０
にソフトウェアを記憶させる。このソフトウェアは、Ｈ
ＰＩ１７、２７を介してホスト・プロセッサにより提供
されてもよい。

【００１２】図１を参照する。命令バスＰ１、Ｐ２は、
ＤＳＰコア１１、２１、ＤＡＲＡＭ１２、２２、ＲＯＭ
１４、２４、及びＰＲＡＭ１０を相互に接続する。各Ｄ
ＳＰコア１１、２１は、好ましくは、関連するデータ・
バスＤ１、Ｄ２を有し、これらは、ＤＳＰコア１１、２
１と、これに関連するデータ・ストレージ装置のＤＡＲ
ＡＭ１２、２２と、ＳＡＲＡＭ１３、２３との間のデー
タ転送を容易にする。各ＤＳＰコア１１、２１は、好ま
しくは、ＰＲＡＭ１０からこれに関連した命令バスＰ
１、Ｐ２を介して命令を読み出す。ＤＳＰコア１１、２
１は、ＰＲＡＭ１０に記憶された単一のプログラムから
個別の複数の命令をフェッチし、かつ実行し、またプロ
セッサ・コアによりプログラム命令が実行される順序
は、プロセッサ・コアが動作しているデータに依存す
る。例えば、コアが動作するデータは、電話による通信
を表しているとしてもよい。各コアは、異なるチャネル
・セットに対して責任を伴うこともあり、これらのチャ
ネルは、通信を独立して開始し、かつ終結するので、こ
れらのプロセッサは、適当なソフトウェア命令を独立し
て実行する。データは、命令を実行する順序を決定す
る。

【００１３】各ＤＭＡロジック１５、２５は、ローカル
・データ・ストレージ装置から及びこれへ、及び関連す
るメモリ・バスＭ１、Ｍ２を介して共有ＰＲＡＭ１０
へ、データ及び命令の移動をする。各ＤＭＡロジック１
５、２５は、更に、種々の外部インターフェース１６、
２６、及びＨＰＩ１７、２７に接続される。ＨＰＩ１
７、２７は、外部ホスト・プロセッサがＤＭＡロジック
１５、２５を介して全ての内部メモリをアクセスできる
ようにする。

【００１４】総合的なシステム設計を簡単にするため
に、ＨＰＩ１７、２７は、メモリ・インターフェースを
模擬するように設計される。即ち、ホスト・プロセッサ
は、ＨＰＩ１７、２７に所望の位置を表すアドレスを送
出することにより、ＤＳＰチップ１００及び多くのＤＳ
Ｐコア・レジスタ内の任意のメモリ位置における内容を
「見る」ことができる。ＨＰＩ１７、２７のうちの１イ
ンターフェースは、メモリ装置のときと同一方法によ
り、関連するＤＭＡロジック１５、２５が所望の情報を
取り出し、次いでこの情報を供給する。ＨＰＩ１７、２
７は、好ましくは、ホスト・プロセッサに対してスレー
ブ装置として動作するが、しかしＤＭＡロジック１５、
２５が他のタスクによりビジーであれば、アクセス中は
ホスト・プロセッサをストール(stall)させるようにホ
スト・プロセッサへ信号を発生する。

【００１５】外部インターフェース１６、２６は、好ま
しくは、１以上の多チャネル直列インターフェースをそ
れぞれ含む。多チャネル直列ポートは、他のＤＳＰチッ
プと直接インターフェースするために二重バッファ付き
の高速全二重の直列通信を提供する。これらのポートの
構成は、好ましくは、既存の標準プロトコルにより直接
インターフェースできるようにホストＣＰＵによりプロ
グラム可能である。各外部インターフェース１６、２６
は、好ましくは、多チャネル送信及び１２８チャネルま
での多チャネル送受信をサポートする。多チャネル直列
ポートは、多チャネルがエネーブルにされたときに、時
分割マルチプレクス及びデマルチプレクス処理を実行す
る。送受信される各データ・フレームは、１チャネルの
内容が他のチャネルの内容とインターリーブされるよう
に、時分割多重化（ＴＤＭ）されたデータ・ストリーム
を表す。

【００１６】ＤＭＡロジック１５、２５は、ＤＳＰコア
１１、２１から独立してデータ転送を実行する。ＤＭＡ
コントローラは、内部メモリ（ＰＲＡＭ１０、ＤＡＲＡ
Ｍ１２、２２及びＳＡＲＡＭ１３、２３）をアクセスす
る。ＤＭＡロジック１５、２５は、外部メモリと、内部
メモリと、外部インターフェース１６、２６及びＨＰＩ
１７、２７のような内部周辺装置との間のデータのバッ
クグラウンド移動を実行することができる。各ＤＭＡコ
ントローラは、好ましくは、多ブロック転送を独立して
同時管理するための多「チャネル」を提供する。ＤＭＡ
転送は、データをＤＭＡコントローラに対して内部のメ
モリにまず読み出し、次にＤＭＡコントローラ・メモリ
からのデータを所望の行き先に書き込むことにより達成
される。内部メモリに対するＤＳＰコア・メモリ・アク
セスがＤＭＡコントローラ・アクセスと競合するとき
に、ＤＭＡコントローラ・アクセスは、好ましくは、高
い優先度が与えられる。メモリ・バスＭ１及びＭ２は、
ＤＳＰコアがローカル・データ・メモリ（ＤＡＲＡＭ１
２、２２又はＳＡＲＡＭ１３、２３）間のＤＭＡデータ
転送により通信できるように、バス・インターフェース
（図示なし）により接続される。

【００１７】ここで、図２Ａを参照する。共有されたＰ
ＲＡＭ１０は、好ましくは、アドレス・デコーダ及び読
み出し・書き込み回路（特に図示していない）のような
メモリ・アレー及び周知のサポート回路を有するランダ
ム・アクセス・メモリ（ＲＡＭ）４０を含む。加えて、
ＰＲＡＭ１０は、好ましくは、図２Ａに示すように、メ
モリ「ラッパー」３０を含む。メモリ・ラッパー３０
は、ＲＡＭ４０を設け、同一のクロック・サイクルにお
いて多重ＤＳＰコア・アクセスを許容する所望の機能を
有するサポート回路を備えている。メモリ・ラッパー３
０は、関連するマルチプレクサ３２を有する第２のアー
ビトレーション・ユニット３３、これに関連したマルチ
プレクサ３９を有する第３のアービトレーション・ユニ
ット３８、時分割マルチプレクサ３５、遅延ラッチ３６
及び出力レジスタ３７を含む。

【００１８】図１及び図２Ａの実施例において、ＤＳＰ
チップ１００は、２つのＤＳＰサブシステム１０１、１
０２のみを含む。当該技術分野に習熟する者は理解する
ように、それぞれ対応するプロセッサ・コアを有する２
以上のＤＳＰサブシステムが存在し得る。このＤＳＰサ
ブシステムは、２つのセットに分割される。この説明の
場合に、第１セットは、ＤＳＰサブシステム１０１から
なり、また第２セットは、ＤＳＰサブシステム１０２か
らなる。第１セット（Ｐ１）におけるプロセッサ・コア
から命令バスは、第１のアービトレーション・ユニット
３１に接続され、また第２セット（Ｐ２）におけるプロ
セッサ・コアから命令バスは、第２のアービトレーショ
ン・ユニット３３に接続される。全サブシステムからの
メモリ・バスＭ１、Ｍ２は、第３のアービトレーション
・ユニット３８及び関連するマルチプレクサ３９を介し
て両アービトレーション・ユニット３１、３３に接続さ
れる。

【００１９】各アービトレーション・ユニット３１、３
３、３８は、ＲＡＭ４０に対するアクセスの要求を受け
取る。アービトレーション・ユニットが１以上の要求を
受け取ると、このアービトレーション・ユニットは、要
求のうちの１つを選択し、残りをストールさせておく。
競合を解消する際に、アービトレーション・ユニット３
１、３３は、好ましくは、メモリ・バスＭ１、Ｍ２から
のアクセス要求に対して優先度を与える。ＤＭＡ読み出
し要求は、第１のアービトレーション・ユニット３１に
よってのみサービスされ、またＤＭＡ書き込み要求は、
第２のアービトレーション・ユニット３３によってのみ
サービスされる。与えられたサイクルでは、アービトレ
ーション・ユニット３８により、１つのメモリ・バスＭ
１又はＭ２のみがアクセスについて許可される。アービ
トレーション・ユニットが少なくとも１つの要求を受け
付けると、アービトレーション・ユニットが関連するマ
ルチプレクサ３２、３４、３９をセットして選択した要
求をその先へ転送する。

【００２０】時分割マルチプレクサ３５は、アービトレ
ーション・ユニット３１、３３により選択されたアクセ
ス要求を受け付ける。インバータ４１は、クロック信号
を受け取り、反転させる。クロック信号（ＣＬＫ）は、
図１に特に示していないＤＳＰチップ１００内の他の場
所にあるクロック発生回路により発生されてもよい。反
転されたクロック信号は、時分割マルチプレクサ３５用
の選択信号として機能する。反転されたクロック信号が
ローのときは、時分割マルチプレクサ３５は、第１のア
ービトレーション・ユニット３１により選択されたメモ
リ・アクセスをＲＡＭ４０へ転送させる。転送されたメ
モリ・アクセスは、図示のようなアドレスＡを含む。こ
のクロック・サイクルの最初の半サイクルにおいて、Ｒ
ＡＭ４０は、アクセス要求のサービスをし、どのような
出力Ｑも遅延ラッチ３６に供給する。反転されたクロッ
ク信号の正方向変化（即ち、ローからハイへの）遷移に
より、遅延ラッチ３６がラッチをしてその出力値を出力
レジスタ３７へ転送する。、一方、時分割マルチプレク
サ３５は、その反転クロック信号がハイになると、第２
のアービトレーション・ユニット３３により選択された
メモリ・アクセスをＲＡＭ４０へ転送して、アクセス要
求のサービスをして、全ての出力Ｑを出力レジスタ３７
に供給する。非反転クロック信号の正方向遷移により、
出力レジスタ３７がラッチをし、ＲＡＭ４０の出力及び
遅延ラッチ３６の出力を転送する。このようにして、２
つのプロセッサ・コアは、１クロック・サイクルにおい
て共有したＰＲＡＭ１０から複数プログラム命令を独立
的に読み出すことができる。

【００２１】２つ以上のプロセッサ・コアを有するシス
テムにおいて、１つ以上のプロセッサ・コアの命令バス
は、第１のアービトレーション・ユニット３１に接続可
能とされ、残りのプロセッサ・コアの命令バスは、第２
のアービトレーション・ユニット３３に接続可能とされ
る。現在のクロック・サイクルにおいて許可されていな
いメモリ・アクセス要求を有するプロセッサ・コアは、
少なくともアクセスがサービスされる次のクロック・サ
イクルまで、強制的に待機される。これらの要求は、要
求がサービスされるまで、共通既知のバス肯定応答信号
をローに保持することにより、ストール可能にされる。
プロセッサ・コア間のアクセス競合は、好ましくは、１
つのプロセッサ・コアに対する差別的な取り扱いをなく
すためにシステマティクな形式によりアービトレーショ
ン優先度をシフトさせる。ＤＭＡ転送のストールを避け
るためにメモリ・バス・アクセスには常時最高の優先度
を与えることが好ましい。共有されたＰＲＡＭ１０に対
するＤＭＡアクセスは、以上で説明したように、初期化
プログラムのロード中でのみ実行される。通常の動作に
おいて、これらのアクセスは、典型的には、発生しな
い。

【００２２】複数のプロセッサ・コアを複数のアービト
レーション・ユニットに接続するときは、ＰＲＡＭから
物理的に最も遠いコアを第２のアービトレーション・ユ
ニット３３へ接続することが望ましいことに注意すべき
である。アービトレーション・ユニット３３を介して実
行されるアクセスは、クロック・サイクルの次の半サイ
クルにおいて実行されるので、これは、更に遠いプロセ
ッサ・コアからの信号伝搬に更なる時間を許容し、従っ
ていくらかタイミング上の制約を軽減する。

【００２３】図３及び図４は、命令バスＰ１、Ｐ２及び
メモリ・ラッパー３０の信号タイミングを示す。ＤＳＰ
コア１１、２１は、命令バスＰ１、Ｐ２の選択信号Ｐ１
ＳＥＬ、Ｐ２ＳＥＬを主張し、かつこれらに対応するＰ
１、Ｐ２の所望命令アドレスを供給することにより、メ
モリ・アクセスを要求する。メモリ・ラッパー３０は、
クロック・サイクルの最初の半サイクルにおいて第１の
アドレスＡとしてＰ１命令バス・アドレスＰ１ＡＤＤを
ＲＡＭ４０に転送し、かつクロック・サイクルの次の半
サイクルにおいてアドレスＡとしてＰ２命令バス・アド
レスＰ２ＡＤＤをＲＡＭ４０に転送する（図３及び図４
を比較すること）。クロック・サイクルの次の半サイク
ルにおいて、命令バスＰ１を介して要求される出力デー
タＱは、ＲＡＭ４０によりメモリ・ラッパー３０に供給
され、またクロック・サイクルの次の半サイクル後に
（次のクロック・サイクルの先頭）、命令バスＰ２によ
り要求された出力データＱが供給される。出力データＱ
は、Ｐ１ＤＡＴ及びＰ２ＤＡＴとしてラッチされ、個別
的なＤＳＰコア１１、２１に転送される前に、メモリ・
ラッパー３０により完全なクロック・サイクルについて
保持される。

【００２４】図２Ｂは、メモリ・ラッパー３０Ａが共有
されたＰＲＡＭ１０の部分１０Ａに供給される。他の部
分１０Ｂは同一のメモリ・ラッパーを有する。図２Ｂに
おけるものと同一番号付けのコンポーネントは、それと
同一の機能を実行する。ローカル・メモリ・バスＭ１の
みが部分１０Ａに接続されているので、メモリ・ラッパ
ー３０Ａはメモリ・バスＭ１とＭ２との間でアービトレ
ーションをする第３のアービトレータは、不必要である
ことに注意すべきである。部分１０Ｂも同様にメモリ・
バスＭ２に接続される。更に多くのプロセッサ・サブシ
ステムを有するディジタル信号プロセッサでは、更に多
くの部分に共有プログラム・メモリを実施することもで
き、各部分がローカル・メモリ・バスに接続される。

【００２５】以上の説明は、本発明の原理及び種々の実
施例を説明することを意図している。多数の変形及び変
更は、以上の開示を十分に理解すれば、当該技術分野に
習熟する者において明らかとなる。以下の特許請求の範
囲は、このような変形及び変更の全てを含むと解釈され
ることを意図している。

【００２６】以上の説明に関して更に以下の項を開示す
る。

【００２７】（１）ディジタル信号処理システムにお
いて、共有プログラム・メモリと、複数のプロセッサ・
サブシステムとを備え、前記プロセッサ・サブシステム
は、プロセッサ・コアと、前記プロセッサ・コアを前記
共有プログラム・メモリに接続する命令バスとを備え、
前記プログラム・メモリは、各クロック・サイクルにお
いて命令バスを介して受け取る多数の命令要求をサービ
スするように構築されたディジタル信号処理システム。

【００２８】（２）前記共有プログラム・メモリ及び前
記複数のプロセッサ・サブシステムは、単一チップ上に
製作された（１）記載のディジタル信号処理システム。

【００２９】（３）前記共有プログラム・メモリは、メ
モリ・アレーと、前記メモリ・アレーに接続されたメモ
リ・ラッパーとを含み、前記メモリ・ラッパーは、前記
２つの命令要求を受け取るように構築された時分割マル
チプレクサを含み、前記時分割マルチプレクサは、前記
クロック・サイクルの最初の半サイクルにおいて前記２
つの命令要求のうちの第１の命令要求を前記メモリ・ア
レーに転送するように構築され、かつ前記クロック・サ
イクルの次の半サイクルにおいて前記２つの命令要求の
うちの第２の命令要求を前記メモリ・アレーに転送する
ように構築された（１）記載のディジタル信号処理シス
テム。

【００３０】（４）前記メモリ・ラッパーは、更に、前
記メモリ・ラッパーに接続され、かつ前記第１の命令要
求の結果をラッチするように構築された遅延ラッチと、
前記遅延ラッチ及び前記メモリ・アレーに接続された出
力ラッチとを含み、前記出力ラッチは、前記第２の命令
要求の複数結果、及び遅延されたメモリ・アレー出力を
同時にラッチするように構築された（３）記載のディジ
タル信号処理システム。

【００３１】（５）前記メモリ・ラッパーは、更に、前
記命令バスのうちの第１の命令バスにそれぞれ接続され
た第１のアービトレーション・ユニット及び第１のマル
チプレクサであって、前記第１のアービトレーション・
ユニットは、アクセス・ユニットを選択するように構築
され、かつ前記２つの命令要求のうちの第１の命令要求
として、選択したアクセス要求を前記時分割マルチプレ
クサに転送するように構築された第１のアービトレーシ
ョン・ユニット及び第１のマルチプレクサ前記第１のマ
ルチプレクサと、前記複数の命令バスのういちの第２の
異なる命令バスにそれぞれ接続された第２のアービトレ
ーション・ユニット及び第２のマルチプレクサであっ
て、前記第２のアービトレーション・ユニットは、アク
セス・ユニットを選択するように構築され、かつ前記２
つの命令要求のうちの第２の命令要求として、選択した
アクセス要求を前記時分割マルチプレクサに転送するよ
うに構築された前記第２のアービトレーション・ユニッ
ト及び前記第２のマルチプレクサとを含む（３）記載の
ディジタル信号処理システム。

【００３２】（６）前記プロセッサ・サブシステムは、
それぞれ更に、前記命令バスと別個にデータ・バスを介
して前記プロセッサ・コアに接続されたデータ・メモリ
を含み、前記プロセッサ・コアは、前記命令バスを介し
て受け取ったプログラム命令に従って前記データ・メモ
リからのデータにより動作するように構成された（５）
記載のディジタル信号処理システム。

【００３３】（７）前記プロセッサ・サブシステムは、
それぞれ更に、直接メモリ・アクセス（ＤＭＡ）コント
ローラと、前記ＤＭＡコントローラを前記データ・メモ
リ及び前記共有プログラム・メモリに接続するメモリ・
バスとを含み、前記メモリ・バスは、前記命令バスから
分離され、かつ前記データ・バスから分離されている
（６）記載のディジタル信号処理システム。

【００３４】（８）前記メモリ・ラッパーは、更に、全
ての前記メモリ・バスにそれぞれ接続された第３のアー
ビトレーション・ユニット及び第３のマルチプレクサを
含み、前記第３のアービトレーション・ユニットは、前
記メモリ・バスを介して受け取ったアクセス要求を選択
するように構築され、かつ前記第３のマルチプレクサを
制御して前記第３のマルチプレクサを選択したアクセス
要求を前記第１及び第２のアービトレーション・ユニッ
トに転送するように構築された（７）記載のディジタル
信号処理システム。

【００３５】（９）前記第１のアービトレーション・ユ
ニットは、前記アクセス要求が読み出し要求であるとき
にのみ、前記第３のマルチプレクサから受け取ったアク
セス要求を選択し、かつ前記第２のアービトレーション
・ユニットは、前記アクセス要求が書き込み要求である
ときにのみ、前記第３のマルチプレクサから受け取った
アクセス要求を選択する（８）記載のディジタル信号処
理システム。

【００３６】（１０）前記第１及び第２のアービトレー
ション・ユニットは、第３のマルチプレクサから受け取
った複数のアクセス要求に対して優先度を許可する
（９）記載のディジタル信号処理システム。

【００３７】（１１）前記プロセッサ・コアは、前記共
有プログラム・メモリに記憶された単一のプログラムか
ら独立した複数の命令を並列に実行するように構築され
た（１）記載のディジタル信号処理システム。

【００３８】（１２）更に、各プロセッサ・サブシステ
ム用に個別的な二重アクセス・データ・メモリを備え、
各二重アクセス・データ・メモリは、前記命令バスから
別個のデータ・バスを介して前記プロセッサ・コアへ接
続され、前記プロセッサ・サブシステムのプロセッサ・
コアは、前記命令バスを介して読み込まれたプログラム
命令に従ってデータ・メモリからのデータにより動作す
るように構築された（１）記載のディジタル信号処理シ
ステム。

【００３９】（１３）更に、各プロセッサ・サブシステ
ムに対して個別的なブートＲＯＭを備え、各ブートＲＯ
Ｍは、前記命令バスを介して前記プロセッサ・コアに接
続された（１）記載のディジタル信号処理システム。

【００４０】（１４）更に、各プロセッサ・サブシステ
ムに対して個別的な外部アクセス・ポートを備え、各外
部アクセス・ポートは、前記プロセッサ・サブシステム
のＤＭＡコントローラに接続された（７）記載のディジ
タル信号処理システム。

【００４１】（１５）更に、ホスト・ポート・マルチプ
レクサと、各プロセッサ・サブシステムように個別的な
ホスト・ポート・インターフェースとを備え、各ホスト
・ポート・インターフェースは、前記プロセッサ・サブ
システムのＤＭＡコントローラに接続され、かつ各ホス
ト・ポート・インターフェースは、前記ホスト・ポート
・マルチプレクサを介してホスト・プロセッサと通信す
るように構築された（７）記載のディジタル信号処理シ
ステム。

【００４２】（１６）多数コアのＤＳＰ装置（１００）
が冗長性をなくすように共有されたプログラム・メモリ
（１０）を含み、これによってＤＳＰ装置（１００）の
サイズ及び電力消費を減少させる。それぞれのプロセッ
サ・コア（１１、２１）が典型的に同一ソフトウェア・
プログラムを実行するために、単一コピーのソフトウェ
アのみを多数のプロセッサ・コア（１１、１２）が共有
することにより、メモリ要求を減少することが可能であ
る。従って、プログラム・メモリ（１０）は、対応する
命令バス（Ｐ１、Ｐ２）によりそれぞれのプロセッサ・
コア（１１、２１）に接続される。プログラム・メモリ
（１０）は、好ましくは、各クロック・サイクルにおい
て２以上の命令要求にサービスをする。データは、好ま
しくは、プロセッサ・コア・サブシステム（１０１、１
０２）に対してローカルな、かつ専用のデータ・バス
（Ｄ１、Ｄ２）を介してプロセッサ・コア（１１、２
１）によりアクセス可能な、個別的メモリ・アレー（１
２、１３、２２、２３）に記憶される。特定の一実施例
では、プログラム・メモリ（１０）は、各クロック・サ
イクルの最初の半サイクルにおいて第１のメモリ・アク
セス、及び各クロック・サイクルの次の半サイクルにお
いて第２のメモリ・アクセスを実行できるラッパーを含
む。指定されたセットの命令バス（Ｐ１）は、第１のア
クセスに対してのみアービトレーションが許容され、か
つ残りの命令バス（Ｐ２）は、第２のアクセスに対して
のみアービトレーションが許容される。このようにし
て、オン・ボードのメモリ・ラッパー及び関連する電力
消費の減少を効果的に達成することができる。

【図面の簡単な説明】

【図１】２つのプロセッサ・コアが１つのプログラム・
メモリを共有する本発明の好ましい実施例を示すブロッ
ク図である。

【図２Ａ】共有プログラム・メモリ・ラッパーの一実施
例を示すブロック図である。

【図２Ｂ】共有プログラム・メモリ・ラッパーの他の実
施例を示すブロック図である。

【図３】単一クロック・サイクルにおいてどのようにし
てメモリ・アクセスをサービスできるのかを説明するタ
イミングを示す図である。

【図４】単一クロック・サイクルにおいてどのようにし
てメモリ・アクセスをサービスできるのかを説明するタ
イミングを示す図である。

【符号の説明】

１プログラム・メモリ１１、２１プロセッサ・コア１２、１３、２２、２３ＤＡＲＡＭ１０１、１０２ＤＳＰサブシステムＤ１、Ｄ２データ・バスＰ１、Ｐ２命令バス

───────────────────────────────────────────────────── フロントページの続き (72)発明者ジェイビー、ライマーアメリカ合衆国テキサス、ヒューストン、ハンティングブライアー 12615 (72)発明者タイフーンガイェンアメリカ合衆国テキサス、ヒューストン、アシュフィールドドライヴ 3226 (72)発明者ハーランドグレンホプキンスアメリカ合衆国テキサス、ミズーリシティ、ゴールデンティーレイン 3606 (72)発明者イールウアメリカ合衆国テキサス、スタッフォード、カークウッドストリート 12840、アパートメント 324 (72)発明者ジェイソンエイ、ティー、ジョーンズアメリカ合衆国テキサス、ヒューストン、デルモンテ 6403、ナンバー 219 (72)発明者ダンケイ、ブイアメリカ合衆国テキサス、シュガーランド、ホワイトフォージレイン 15010 (72)発明者パトリックジェイ、スミスアメリカ合衆国テキサス、ヒューストン、ニューキャッスルドライヴ 3222 (72)発明者ケヴィンエイ、マッゴナグルアメリカ合衆国テキサス、シュガーランド、ウェストブルックフォレストドライヴ 8511 Ｆターム(参考） 5B045 BB12 BB28 DD01 EE03 EE11 5B060 CC01 KA02

Claims

【特許請求の範囲】

【請求項１】ディジタル信号処理システムにおいて、共有プログラム・メモリと、複数のプロセッサ・サブシステムとを有し、前記各プロ
セッサ・サブシステムは、プロセッサ・コアと、前記プロセッサ・コアを前記共有
プログラム・メモリに接続する命令バスとを有し、前記
プログラム・メモリは、各クロック・サイクルで命令バ
スを介して受け取る多数の命令要求をサービスするよう
に構築されたことを、備えたディジタル信号処理システ
ム。