JP5471437B2

JP5471437B2 - 半導体集積回路装置およびキャッシュメモリ制御方法

Info

Publication number: JP5471437B2
Application number: JP2009297462A
Authority: JP
Inventors: 彰徳橋本
Original assignee: Fujitsu Semiconductor Ltd
Current assignee: Fujitsu Semiconductor Ltd
Priority date: 2009-12-28
Filing date: 2009-12-28
Publication date: 2014-04-16
Anticipated expiration: 2029-12-28
Also published as: US20110161549A1; JP2011138294A; US8868832B2

Description

本発明は、半導体集積回路装置およびキャッシュメモリ制御方法に関する。

近年、デジタル機器の複雑化に伴って、搭載されるシステムＬＳＩ(Large Scale Integration)も高速化および高性能化が要求されている。特に、システムＬＳＩに内蔵されるＣＰＵ(Central Processing Unit)は、高速に動作させることが強く求められている。

従来、ＣＰＵ(処理ユニット)を高速動作させる一般的な手法としては、例えば、ＣＰＵの動作を規定するパイプラインの段数を増やすといった抜本的な対策を講じる場合が多い。

このような場合でも、例えば、ＣＰＵのランダムロジックとＣＰＵ自身が持つキャッシュメモリ(例えば、一次キャッシュメモリ)間のアクセスタイミングは、スループット向上のためにキャッシュメモリからのデータリードがゼロウェイトであることが望まれる。

さらに、ＣＰＵのランダムロジック(内部論理回路)が高速になればなるほど、キャッシュメモリ(例えば、ＳＲＡＭ：Static Random Access Memory)のリードアクセスタイムもより高速なものが必要になってくる。

ところで、従来、ＣＰＵからメモリに対するアクセス速度を向上させることができるメモリアクセス技術および情報処理技術、並びに、キャッシュメモリ(ＳＲＡＭ)からの高速データ読み出しが可能な回路等としては、様々なものが提案されている。

特開平１０−３３３９８０号公報特開平０１−２７６３３６号公報

上述したように、ＣＰＵ(処理ユニット)は、例えば、パイプライン段数を増やすことで大幅に動作速度を向上させることはできるが、キャッシュメモリ(ＳＲＡＭ)は、論理回路の改善等を行っても高速化することはできない。

すなわち、キャッシュメモリを高速化するには、例えば、そのキャッシュメモリに使用するＳＲＡＭ自身を高速化しなければならず、現実問題としては、困難な状況にある。

さらに、近年、例えば、ＳＲＡＭのキャッシュメモリを内蔵するＣＰＵの動作速度(動作クロック)は、そのＳＲＡＭのデータリードアクセスタイムとＣＰＵのランダムロジック間のパスのタイミングに支配されるようにもなってきている。

図１は半導体集積回路装置の一例を示すブロック図であり、また、図２は図１の半導体集積回路装置の動作を説明するためのタイミング図である。なお、図１および図２を参照して説明する半導体集積回路装置は、キャッシュメモリからのデータリードがゼロウェイトのものを示している。

図１において、参照符号１００は処理ユニット(ＣＰＵ)，１０１はランダムロジック，１０２は内部フリップフロップ，そして，２００はキャッシュメモリ(ＳＲＡＭ)を示している。

なお、キャッシュメモリ２００は、例えば、システムＬＳＩ等の半導体集積回路装置に設けられるキャッシュメモリに限定されるものではなく、ＣＰＵ１００自体に内蔵される一次或いは二次キャッシュメモリであってもよい。

図２に示されるように、キャッシュメモリ２００からのデータリードがゼロウェイトの場合でも、クロックＣＬＫの１周期におけるＳＲＡＭのアクセスタイムＡＴrが大きく、次段のフリップフロップ１０２までのセットアップマージンＳＭfが小さくなる。

そのため、図１に示す半導体集積回路装置は、クロックＣＬＫの周波数を上げることができず、例えば、そのＣＰＵを内蔵するシステムＬＳＩ、或いは、そのシステムＬＳＩを搭載するデジタル機器の高速化および高性能化の要求を満たすことが困難になっていた。

図３は半導体集積回路装置の他の例を示すブロック図であり、また、図４は図３の半導体集積回路装置の動作を説明するためのタイミング図である。なお、図３および図４を参照して説明する半導体集積回路装置は、キャッシュメモリ２００とＣＰＵ１００との間にフリップフロップ３００を設けたものである。

図３に示す半導体集積回路装置において、キャッシュメモリ２００とＣＰＵ１００のランダムロジック１０１間のパスは、挿入したフリップフロップ３００により一度区切られることになり、ＣＰＵ１００の動作速度の高速化が期待できる。

すなわち、図４に示されるように、フリップフロップ３００により、次段のフリップフロップ１０２までのセットアップマージンＳＭfを大きく取ることができるようになっている。

しかしながら、図３に示す半導体集積回路装置において、ＣＰＵ１００がキャッシュメモリ２００からゼロウェイトでリードデータの取得を期待しているのに対して、リードデータは、フリップフロップ３００により１サイクル遅れて到着する。

そのため、例えば、２サイクルのクロックＣＬＫから１サイクルのＣＰＵクロックｃｌｋを生成するＣＰＵクロック制御回路３０１を設け、ＣＰＵ１００をクロックＣＬＫの半分の周波数で動作させる必要があり、結果としてＣＰＵ１００の処理性能が低下する。

具体的に、例えば、ＣＰＵ１００により、キャッシュメモリ２００から連続した８個の読み出しが発生した場合、１個のデータを取得する度にクロックＣＬＫが２サイクル必要になるめ、８／(８×２)＝５０％になる。すなわち、ＣＰＵ１００の性能が５０％低下することになる。

一実施形態の半導体集積回路装置は、処理ユニットと、該処理ユニットがアクセスするキャッシュメモリと、アドレス予測回路と、アクセス開始検出回路と、クロック制御回路と、遅延回路と、を有する。

前記アドレス予測回路は、前記処理ユニットが前記キャッシュメモリにアクセスするアドレスを予測し、前記アクセス開始検出回路は、前記処理ユニットが前記キャッシュメモリへのアクセスを開始したことを検出してアクセス開始信号を生成する。

前記クロック制御回路は、クロックおよび前記アクセス開始信号を受け取って前記処理ユニットに対する処理クロックを制御し、前記遅延回路は、前記キャッシュメモリからのリードデータを遅延して前記処理ユニットに供給する。

開示の半導体集積回路装置およびキャッシュメモリ制御方法は、処理ユニットの性能劣化を抑えつつ動作周波数を高速化することができるという効果を奏する。

半導体集積回路装置の一例を示すブロック図である。図１の半導体集積回路装置の動作を説明するためのタイミング図である。半導体集積回路装置の他の例を示すブロック図である。図３の半導体集積回路装置の動作を説明するためのタイミング図である。半導体集積回路装置の第１実施例を示すブロック図である。図５の半導体集積回路装置の動作を説明するためのタイミング図である。図５の半導体集積回路装置におけるアドレス予測回路の一例を示す図である。図５の半導体集積回路装置におけるアクセス開始検出回路の一例を示す図である。図５の半導体集積回路装置におけるクロック制御回路の一例を示す図である。半導体集積回路装置の第２実施例を示すブロック図である。図１０の半導体集積回路装置の動作を説明するためのタイミング図である。図１０の半導体集積回路装置におけるアドレス予測回路の一例を示す図である。図１０の半導体集積回路装置におけるアドレス比較回路の一例を示す図である。図１０の半導体集積回路装置におけるクロック制御回路の一例を示す図である。

以下、添付図面を参照して、半導体集積回路装置およびキャッシュメモリ制御方法の実施例を詳述する。

図５は半導体集積回路装置の第１実施例を示すブロック図であり、また、図６は図５の半導体集積回路装置の動作を説明するためのタイミング図である。

図５において、参照符号１００は処理ユニット(ＣＰＵ)，１０１はランダムロジック，１０２は内部フリップフロップ，そして，２００はキャッシュメモリ(ＳＲＡＭ)を示している。

さらに、参照符号４００はＣＰＵ高速化システム，４０１はアドレス予測回路，４０２はアクセス開始検出回路，４０３はクロック制御回路，４０４はセレクタ，そして，４０５は遅延回路(遅延用フリップフロップ)を示している。

図５に示されるように、ＣＰＵ１００は、キャッシュメモリ２００にアクセスするためのポート(キャッシュアドレスおよびキャッシュデータ用端子)を有する。なお、実際には、その他に、キャッシュメモリ２００に対するチップセレクト，ライトイネーブルおよびライトデータ等のポートも有しているが、ここでは省略する。

ＣＰＵ高速化システム４００は、アドレス予測回路４０１，アクセス開始検出回路４０２，クロック制御回路４０３，セレクタ４０４，および，遅延用フリップフロップ４０５を有する。なお、ＣＰＵ高速化システム４００の名称は、例えば、図１の半導体集積回路装置との差異を明確化するために、便宜的に付したものである。

図５および図６に示されるように、ＣＰＵ１００からキャッシュメモリ２００に対して最初のリードアクセスが発生すると、そのリードアドレス(キャッシュアドレスＡ０)は、アドレス予測回路４０１およびセレクタ４０４に供給される。

なお、ＣＰＵ１００からアクセス開始検出回路４０２に対しては、最初のリードアクセスの発生を通知するために、例えば、キャッシュメモリ２００に対するチップセレクト信号ＣＳが供給されている。

そして、アクセス開始検出回路４０２は、ＣＰＵ１００からの最初のリードアクセスが発生したことを検出してアクセス開始信号ＡＳＳを出力(アサート)する。

アドレス予測回路４０１は、ＣＰＵ１００からのキャッシュアドレスＡ０に基づいて、次の(２回目の)ＣＰＵ１００からのリードアドレスＡ１を予測して生成する。

この予測リードアドレスＡ１は、セレクタ４００に供給され、同様に、３回目以降の予測リードアドレスＡ２，Ａ３，…も、アドレス予測回路４０１により生成され、セレクタ４００に供給される。

なお、後述するように、アドレス予測回路４０１には、アクセス開始信号ＡＳＳも供給され、また、予測アドレスは、例えば、ＣＰＵ１００の仕様に応じた所定の加算値が順次加算されて生成されるようになっている。

セレクタ４０４は、アクセス開始検出回路４０２からのアクセス開始信号ＡＳＳがアサートされると、ＣＰＵ１００からのリードアドレス(Ａ０)を選択する。

また、セレクタ４０４は、アクセス開始検出回路４０２からのアクセス開始信号がアサートされていない場合、すなわち、２回目以降のリードアドレスによる転送時には、アドレス予測回路４０１で生成された予測リードドレス(Ａ１，Ａ２，Ａ３，…)を選択する。

さらに、セレクタ４０４によって選択されたリードアドレスは、キャッシュメモリ２００のアドレス用端子に供給される。

そして、所定のリードアクセスタイムの後、キャッシュメモリ２００のリードデータ用端子からリードデータが出力され、遅延用フリップフロップ４０５の入力に供給される。

この遅延用フリップフロップ４０５のクロック端子には、後述するクロック制御回路４０３の出力信号(ＣＰＵクロック)ｃｌｋが供給され、リードデータを、例えば、ＣＰＵクロックｃｌｋの立ち上がりエッジで取り込んで、次の立ち上がりエッジで出力する。

この遅延用フリップフロップ４０５から出力された信号(遅延されたリードデータ)は、ＣＰＵ１００のキャッシュデータ用端子に供給され、例えば、内部のランダムロジック１０１を介して内部フリップフロップ１０２の入力端子に供給される。

これにより、例えば、ＣＰＵクロックｃｌｋの立ち上がりエッジで出力されたリードデータには、内部フリップフロップ１０２に供給されるまでに時間的な余裕が含まれることになる。

具体的に、ＣＰＵ１００からの最初のリードアクセスが発生すると、アクセス開始信号ＡＳＳにより、セレクタ４０４はキャッシュアドレスＡ０を選択し、また、クロック制御回路４０３はＣＰＵクロックｃｌｋの供給を１サイクルだけ停止する。

これにより、遅延用フリップフロップ４０５を介したリードデータがＣＰＵ１００にとって１サイクル遅れて到着することによる弊害を回避することが可能になる。

すなわち、図６に示されるように、ＣＰＵ１００からの最初のリードアクセスのアドレスＡ０に対応したデータＤ０を、内部フリップフロップ１０２までのセットアップマージンＳＭfを満たして提供することができる。

さらに、２回目以降のアクセスに対して、セレクタ４０４はアドレス予測回路４０１により生成されたアドレスＡ１，Ａ２，Ａ３，…を選択するため、キャッシュメモリ２００からのリードデータＤ１，Ｄ２，Ｄ３，…はクロックＣＬＫに同期して出力される。

これは、図６に示されるように、２回目以降のアクセスに対して、クロック制御回路４０３は、ＣＰＵクロックｃｌｋをクロックＣＬＫと同じタイミング(周波数)となるように制御するためである。

これにより、ＣＰＵ１００からの２回目以降のアクセスは，クロックＣＬＫと同じ周波数のＣＰＵクロックｃｌｋで動作させることができ、ＣＰＵ１００の性能劣化を抑えつつ動作周波数を高速化することが可能になる。

本第１実施例の半導体集積回路装置によれば、ＣＰＵ１００からの最初のアクセスのみ１サイクルのペナルティを持つだけで、ＣＰＵ１００の性能劣化を抑えることができる。

具体的に、例えば、ＣＰＵ１００によりキャッシュメモリ２００から連続した８個の読み出しが発生した場合を考えると、８＋１＝９サイクルかかるだけであり、８／９＝８９［％］となり、１１％の性能劣化に留めることができることになる。

さらに、ＣＰＵ１００とキャッシュメモリ２００間のリードデータのパスは、遅延用フリップフロップ４０５で区切られているため、ＣＰＵの動作周波数をさらに上げることが可能になる。

図７は図５の半導体集積回路装置におけるアドレス予測回路の一例を示す図であり、また、図８は図５の半導体集積回路装置におけるアクセス開始検出回路の一例を示す図である。さらに、図９は図５の半導体集積回路装置におけるクロック制御回路の一例を示す図である。

まず、図７に示されるように、アドレス予測回路４０１は、セレクタ４１１，加算回路４１２およびフリップフロップ４１３を有する。

セレクタ４１１は、ＣＰＵ１００からのキャッシュアドレスとフリップフロップ４１３の出力である予測アドレスを受け取り、アクセス開始検出回路４０２で生成されたアクセス開始信号ＡＳＳに従って選択する。

すなわち、セレクタ４１１は、ＣＰＵ１００からの最初のリードアクセスが発生してアクセス開始検出回路４０２からのアクセス開始信号ＡＳＳが出力されると(図６では、高レベル『Ｈ』になると)、キャッシュアドレスを選択して加算回路４１２に供給する。

さらに、セレクタ４１１は、ＣＰＵ１００からの２回目以降のリードアクセスに対しては、アクセス開始信号ＡＳＳが低レベル『Ｌ』になるため、予測アドレスを選択して加算回路４１２に供給する。

加算回路４１２は、セレクタ４１１で選択されたアドレスに対して、例えば、ＣＰＵ１００の仕様に応じた所定値(定数)を加算してフリップフロップ４１３の入力端子に供給する。

フリップフロップ４１３は、その入力端子に供給されたアドレスを、例えば、クロックＣＬＫの立ち上がりエッジで取り込み、その出力端子から予測アドレスとして出力する。

また、図８に示されるように、アクセス開始検出回路４０２は、フリップフロップ４２１，インバータ４２２およびＡＮＤゲート４２３を有する。

フリップフロップ４２１は、例えば、キャッシュメモリ２００へのチップセレクト信号ＣＳをその入力端子で受け取り、クロックＣＬＫの立ち上がりエッジで取り込む。

フリップフロップ４２１の出力信号は、チップセレクト信号ＣＳをインバータ４２２で反転した信号と共にＡＮＤゲート４２３に供給され、それらの論理積を取った信号がアクセス開始信号ＡＳＳとしてＡＮＤゲート４２３から出力される。

具体的に、例えば、チップセレクト信号ＣＳはローイネーブル信号であり、ＣＰＵ１００からキャッシュメモリ２００に対する最初のアクセスを検出して高レベル『Ｈ』となるアクセス開始信号ＡＳＳを生成する。

さらに、図９に示されるように、クロック制御回路４０３は、インバータ４３１，ＡＮＤゲート４３２およびフリップフロップ４３３を有する。

フリップフロップ４３３は、クロックＣＬＫの立ち上がりエッジでアクセス開始信号ＡＳＳをインバータ４３１で反転した信号を取り込み、フリップフロップ４３３の出力とクロックＣＬＫの論理積を取った信号がＣＰＵクロックｃｌｋとしてＡＮＤゲート４３２から出力される。

すなわち、図６に示されるように、ＣＰＵクロックｃｌｋは、キャッシュメモリ２００に対する最初のアクセスを検出して出力されるアクセス開始信号ＡＳＳが高レベル『Ｈ』になった次のサイクルは低レベル『Ｌ』のままで、クロックＣＬＫの２倍の周期の信号になる。

そして、ＣＰＵクロックｃｌｋは、キャッシュメモリ２００に対する２回目以降のアクセスに対しては、クロックＣＬＫと同じ周期の信号になる。

なお、図７に示すアドレス予測回路４０１、図８に示すアクセス開始検出回路４０２および図９に示すクロック制御回路４０３は、単なる例であり、様々に変形することができるのはもちろんである。

図１０は半導体集積回路装置の第２実施例を示すブロック図であり、また、図１１は図１０の半導体集積回路装置の動作を説明するためのタイミング図である。

図１０と前述した図５との比較から明らかなように、本第２実施例の半導体集積回路装置は、図５に示す第１実施例の半導体集積回路装置に対して、さらに、アドレス比較回路４０６を設けたものに相当する。

すなわち、第１実施例の半導体集積回路装置において、アドレス予測回路４０１は、常に、ＣＰＵ１００のキャッシュアドレスを正確に予測できるものではない。

そこで、アドレス予測回路が予測を失敗したとき、すなわち、アドレス予測回路が生成した予測アドレスが、ＣＰＵがキャッシュメモリにアクセスするアドレスとは相違するとき、それに対処するようにしたものが本第２実施例である。

図１０に示されるように、ＣＰＵ高速化システム４００’は、アドレス予測回路４０１’，アクセス開始検出回路４０２，クロック制御回路４０３’，セレクタ４０４，遅延用フリップフロップ４０５，および，アドレス比較回路４０６を有する。なお、ＣＰＵ高速化システム４００’の名称は、便宜的に付したものなのは前述した通りである。

まず、図１１に示されるように、ＣＰＵ１００がキャッシュメモリ２００にアクセスするキャッシュアドレスがＡ０→Ａ５→Ａ６→Ａ７に変化する場合を考える。

このとき、アドレス予測回路４０１’は、ＣＰＵ１００からのキャッシュアドレスの最初の値Ａ０から、２回目および３回目のアドレスをＡ１およびＡ２と予測する。すなわち、アドレス予測回路４０１’による予測アドレスは、Ａ０→Ａ１→Ａ２へと変化する。

図１０に示されるように、アドレス比較回路４０６は、ＣＰＵ１００からのキャッシュアドレスとアドレス予測回路４０１’で生成された予測アドレスとを比較し、両者のアドレス値が異なればアドレス予測失敗信号ＡＥＦＳを出力する。

上記のケースでは、アドレス予測回路４０１’が、キャッシュアドレスＡ５，Ａ６とは異なるアドレスＡ１，Ａ２を生成したために、アドレス比較回路４０６からアドレス予測失敗信号ＡＥＦＳがアサートされることになる。

このアドレス予測失敗信号ＡＥＦＳは、図１１に示されるように、例えば、クロックＣＬＫの２サイクルの期間だけアサートされる(高レベル『Ｈ』になる)。

クロック制御回路４０３’は、アドレス予測失敗信号ＡＥＦＳを受けて、ＣＰＵ１００へのＣＰＵクロックｃｌｋをクロックＣＬＫの２サイクルの期間だけ停止する。

このＣＰＵクロックｃｌｋの停止により、ＣＰＵ１００が受け取るキャッシュアドレスＡ０に対応するデータＤ０(遅延用フリップフロップ４０５の出力信号)もクロックＣＬＫの３サイクルの期間だけ保持される。

これは、アドレス予測回路４０１’によるアドレス予測の失敗がＣＰＵ１００に影響を及ぼさないようにするためである。

アドレス予測失敗信号ＡＥＦＳのアサートとＣＰＵクロックｃｌｋの停止の間、キャッシュメモリ２００へのリードアドレスは、Ａ０→Ａ１→Ａ２の後、図１２を参照して後述するように、アドレス予測回路４０１’によりＡ５になる。

ここで、キャッシュメモリ２００のクロックＣＬＫは、アドレス予測失敗信号ＡＥＦＳがアサートされていても供給され続けており、キャッシュメモリ２００から出力されたリードデータもＡ０，Ａ１，Ａ２に対応したデータＤ０，Ｄ１，Ｄ２が出力される。

これらのリードデータＤ０，Ｄ１，Ｄ２は、遅延用フリップフロップ４０５に供給されるが、この遅延用フリップフロップ４０５はＣＰＵクロックｃｌｋで動作するようになっている。

すなわち、遅延用フリップフロップ４０５は、アドレス予測失敗信号ＡＥＦＳがアサートされている間は最初に取りこんだデータＤ０のみをＣＰＵ１００に供給し、データＤ１およびＤ２はＣＰＵ１００に供給しないようになっている。

アドレス予測回路４０１’のアドレス予測の失敗により、次のメモリアドレスとしてＣＰＵ１００からのキャッシュアドレスＡ５がＣＰＵ高速化システム４００’に取り込まれる。

すなわち、後述するように、アドレス予測回路４０１’は、アドレス予測失敗信号ＡＥＦＳのアサートによりＣＰＵ１００からのキャッシュアドレスＡ５を予測アドレスとして出力する。

そして、アドレス比較回路４０６で比較されるアドレスが一致すると、アドレス予測失敗信号ＡＥＦＳはネゲート(解除)される。

このアドレス予測失敗信号ＡＥＦＳの解除により、ＣＰＵクロックｃｌｋの停止もＣＰＵクロック制御回路４０３’によって解除され、ＣＰＵ１００はリードアドレスＡ５の次のアドレスとしてＡ６をキャッシュアドレスとして駆動する。

なお、アドレス予測回路４０１’は、既に取り込んだアドレスＡ５から、予測アドレスＡ６，Ａ７を生成してメモリアクセスを行う。

図１２は図１０の半導体集積回路装置におけるアドレス予測回路の一例を示す図であり、また、図１３は図１０の半導体集積回路装置におけるアドレス比較回路の一例を示す図である。さらに、図１４は図１０の半導体集積回路装置におけるクロック制御回路の一例を示す図である。

まず、図１２に示されるように、アドレス予測回路４０１’は、セレクタ４１１’，加算回路４１２’およびフリップフロップ４１３を有する。

セレクタ４１１’は、ＣＰＵ１００からのキャッシュアドレスとフリップフロップ４１３の出力である予測アドレスを受け取り、アクセス開始検出回路４０２で生成されたアクセス開始信号ＡＳＳおよびアドレス予測失敗信号ＡＥＦＳに従って選択する。

すなわち、セレクタ４１１’は、前述した第１実施例のセレクタ４１１と同様に、アクセス開始信号ＡＳＳがアサート(高レベル『Ｈ』)されると、ＣＰＵ１００からのキャッシュアドレスを選択して加算回路４１２’に供給する。

また、セレクタ４１１’は、ＣＰＵ１００からの２回目以降のリードアクセスに対しては、アクセス開始信号ＡＳＳが低レベル『Ｌ』になるため、予測アドレスを選択して加算回路４１２に供給する。

さらに、セレクタ４１１’は、アドレス予測失敗信号ＡＥＦＳがアサート(高レベル『Ｈ』)されると、ＣＰＵ１００からのキャッシュアドレスを選択して加算回路４１２’に供給する。

ここで、アドレス予測失敗信号ＡＥＦＳは、加算回路４１２’にも供給され、アドレス予測失敗信号ＡＥＦＳがアサートされると、セレクタ４１１’からの入力アドレスをそのまま出力する。

なお、アドレス予測失敗信号ＡＥＦＳがアサートされていないと、加算回路４１２’は、入力アドレスに対してＣＰＵ１００の仕様に応じた定数を加算してフリップフロップ４１３の入力端子に供給するのは、第１実施例の加算回路４１２と同様である。なお、フリップフロップ４１３も第１実施例と同様であり、その説明は省略する。

これにより、図１１に示されるように、アドレス予測が失敗してアドレス比較回路４０６からアドレス予測失敗信号ＡＥＦＳがアサートされると、ＣＰＵ１００からのキャッシュアドレス(Ａ５)が予測アドレスとして出力されることになる。

次に、図１３に示されるように、アドレス比較回路４０６は、フリップフロップ４６１および比較器４６２を有する。

フリップフロップ４６１は、アドレス予測回路４０１’からの予測アドレスをクロックＣＬＫの立ち上がりエッジで取り込む。比較回路４６２は、フリップフロップ４６１の出力信号(予測アドレス)とＣＰＵ１００からのキャッシュアドレスを比較し、両者のアドレス値が異なればアドレス予測失敗信号ＡＥＦＳを出力する。

そして、図１４に示されるように、クロック制御回路４０３’は、インバータ４３１，４３５，３入力ＡＮＤゲート４３２’およびフリップフロップ４３３，４３４を有する。

フリップフロップ４３４は、クロックＣＬＫの立ち上がりエッジでアドレス予測失敗信号ＡＥＦＳを取り込む。

３入力ＡＮＤゲート４３２’は、フリップフロップ４３４の出力信号をインバータ４３５で反転した信号と、アクセス開始信号ＡＳＳをインバータ４３１で反転した後クロックの立ち上がりエッジで取り込むフリップフロップ４３３の出力と、クロックＣＬＫを受け取り、それらの論理積を取ってＣＰＵクロックｃｌｋを生成する。

これにより、図１１に示されるように、ＣＰＵクロックｃｌｋは、第１実施例と同様に、アクセス開始信号ＡＳＳが高レベル『Ｈ』になった次のサイクル期間は低レベル『Ｌ』のままで、クロックＣＬＫの２倍の周期の信号になる。

さらに、ＣＰＵクロックｃｌｋは、アドレス予測失敗信号ＡＥＦＳを受けて、ＣＬＫの２サイクルの期間だけ停止することになる。

以上において、アドレス予測回路が予測を失敗すると動作遅延が生じることになるが、例えば、キャシュメモリに保持されるデータは、連続した所定の容量を有するデータであるため、アドレス予測が失敗しても、それによる動作遅延の影響は、実用上殆どない。

なお、アクセス開始検出回路４０２，セレクタ４０４および遅延用フリップフロップ４０５は、第１実施例と同様でありその説明は省略する。また、図１２に示すアドレス予測回路４０１’、図１３に示すアドレス比較回路４０６および図１４に示すクロック制御回路４０３’は、単なる例であり、様々に変形することができるのはいうまでもない。

１００処理ユニット(ＣＰＵ)
１０１ランダムロジック
１０２内部フリップフロップ
２００キャッシュメモリ
３００フリップフロップ
３０１ＣＰＵクロック制御回路
４００，４００’ ＣＰＵ高速化システム
４０１，４０１’ アドレス予測回路
４０２アクセス開始検出回路
４０３，４０３’ クロック制御回路
４０４セレクタ
４０５遅延回路(遅延用フリップフロップ)
４０６アドレス比較回路
ＡＥＦＳアドレス予測失敗信号
ＡＳＳアクセス開始信号
ＣＬＫクロック
ｃｌｋ処理クロック(ＣＰＵクロック)

Claims

処理ユニットと、
該処理ユニットがアクセスするキャッシュメモリと、
前記処理ユニットが前記キャッシュメモリにアクセスするアドレスを予測するアドレス予測回路と、
前記処理ユニットが前記キャッシュメモリへのアクセスを開始したことを検出してアクセス開始信号を生成するアクセス開始検出回路と、
クロックおよび前記アクセス開始信号を受け取って前記処理ユニットに対する処理クロックを制御するクロック制御回路と、
前記キャッシュメモリからのリードデータを遅延して前記処理ユニットに供給する遅延回路と、を有することを特徴とする半導体集積回路装置。
請求項１に記載の半導体集積回路装置において、さらに、
前記処理ユニットから前記キャッシュメモリに対する最初のアクセスは、前記処理ユニットからのアドレスを前記キャッシュメモリに入力すると共に、前記処理ユニットから前記キャッシュメモリに対する２回目以降のアクセスは、前記アドレス予測回路で生成した予測アドレスを前記キャッシュメモリに入力するセレクタを有することを特徴とする半導体集積回路装置。
請求項１または２に記載の半導体集積回路装置において、さらに、
前記処理ユニットからのアドレスと、前記アドレス予測回路で生成された予測アドレスを前記遅延回路で遅延したアドレスとを比較して、前記アドレス予測回路の予測が失敗したことを示すアドレス予測失敗信号を生成するアドレス比較回路を有することを特徴とする半導体集積回路装置。
請求項３に記載の半導体集積回路装置において、
前記クロック制御回路は、前記アドレス予測失敗信号を受け取って前記処理クロックを停止し、前記処理ユニットからのアドレスを前記キャッシュメモリに入力することを特徴とする半導体集積回路装置。
請求項３または４に記載の半導体集積回路装置において、
前記クロック制御回路は、前記アドレス予測失敗信号を１クロックサイクル遅延させた信号、前記アクセス開始信号、および、前記クロックの論理積を取って前記処理クロックを制御することを特徴とする半導体集積回路装置。
請求項１〜５のいずれか１項に記載の半導体集積回路装置において、
前記アドレス予測回路は、前記処理ユニットの仕様に応じて加算値の設定が可能な加算器を有することを特徴とする半導体集積回路装置。
請求項１〜６のいずれか１項に記載の半導体集積回路装置において、
前記アクセス開始検出回路は、前記処理ユニットから出力される前記キャッシュメモリのチップセレクト信号と、該チップセレクト信号を遅延した信号との論理積を取って前記アクセス開始信号を生成することを特徴とする半導体集積回路装置。
請求項７に記載の半導体集積回路装置において、
前記クロック制御回路は、前記アクセス開始信号の反転論理の信号をフリップフロップを介したのち前記クロックとの論理積を取って前記処理ユニットに対するクロックを生成することを特徴とする半導体集積回路装置。
請求項１〜８のいずれか１項に記載の半導体集積回路装置において、
前記遅延回路は、遅延用フリップフロップを有し、
前記処理ユニットは、内部フリップフロップを有し、
前記遅延用フリップフロップにより前記キャッシュメモリからのリードデータを１クロックサイクルだけ遅延して前記処理ユニットに供給することで前記内部フリップフロップまでのセットアップマージンを稼ぎ、該内部フリップフロップのセットアップ時間を満たす範囲で前記処理ユニットの動作周波数を高めることを特徴とする半導体集積回路装置。
処理ユニット、および、該処理ユニットがアクセスするキャッシュメモリを有する半導体集積回路装置におけるキャッシュメモリ制御方法であって、
前記処理ユニットが前記キャッシュメモリにアクセスするアドレスを予測し、
前記処理ユニットが前記キャッシュメモリへのアクセスを開始したことを検出してアクセス開始信号を生成し、
クロックおよび前記アクセス開始信号を受け取って前記処理ユニットに対する処理クロックを制御し、
前記キャッシュメモリからのリードデータを遅延して前記処理ユニットに供給することを特徴とするキャッシュメモリ制御方法。