JP2007274049A - Semiconductor integrated circuit and semiconductor integrated circuit design method - Google Patents

Semiconductor integrated circuit and semiconductor integrated circuit design method Download PDF

Info

Publication number
JP2007274049A
JP2007274049A JP2006093824A JP2006093824A JP2007274049A JP 2007274049 A JP2007274049 A JP 2007274049A JP 2006093824 A JP2006093824 A JP 2006093824A JP 2006093824 A JP2006093824 A JP 2006093824A JP 2007274049 A JP2007274049 A JP 2007274049A
Authority
JP
Japan
Prior art keywords
clock
block
semiconductor integrated
integrated circuit
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006093824A
Other languages
Japanese (ja)
Other versions
JP4893064B2 (en
Inventor
Toshio Ogawa
敏男 小川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2006093824A priority Critical patent/JP4893064B2/en
Publication of JP2007274049A publication Critical patent/JP2007274049A/en
Application granted granted Critical
Publication of JP4893064B2 publication Critical patent/JP4893064B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To shorten a design period and decrease power noise in a semiconductor integrated circuit and an EMI problem of a product. <P>SOLUTION: A source synchronous type interface for transmitting a clock and data at the same time is adopted for an interface between hierarchical blocks. A receiver 24 of a receiver side block 22 is provided with a clock phase detector 27 and a VDL 28 for configuring a mesochronous type synchronization circuit, receives data of the inter-block interface without setup/hold violation and transfers the data to an internal circuit of the receiver side block 22. <P>COPYRIGHT: (C)2008,JPO&INPIT

Description

本発明は、大規模半導体集積回路の設計期間の短縮と、電源電圧が低下する将来の半導体集積回路において問題となる大規模半導体集積回路内の電源ノイズを低減でき、信頼性の向上とEMI低減が図れる半導体集積回路および半導体集積回路設計方法に関する。   The present invention can shorten the design period of a large-scale semiconductor integrated circuit and reduce power supply noise in a large-scale semiconductor integrated circuit, which will be a problem in future semiconductor integrated circuits in which the power supply voltage is lowered, thereby improving reliability and reducing EMI. The present invention relates to a semiconductor integrated circuit and a semiconductor integrated circuit design method.

従来、半導体集積回路の設計は以下の手法により行っていた。
1)大規模な半導体集積回路を設計する場合、既存のIPマクロ(例えば他社から購入したブラックボックスになっているマクロブロック)を組み込む場合など、半導体集積回路を階層化して下層ブロックと、その下層ブロックを結線する上層のTOPレベルに分けて設計することが普通である。この場合、各下層ブロック内のFFに到達するクロック遅延を可能な限り等しくし、半導体集積回路内の全FF間のクロックスキューをできるだけ小さくすることが行われている。半導体集積回路全体のクロックスキューをできるだけ小さく設計するために、まずブロック内の物理設計を行い、ブロック内部のクロック遅延を決定し、それをTOPレベルのクロック配線遅延にフィードバックするといった手法が取られている(例えば、下記特許文献1参照。)。
Conventionally, semiconductor integrated circuits have been designed by the following method.
1) When designing a large-scale semiconductor integrated circuit, when incorporating an existing IP macro (for example, a macro block in a black box purchased from another company), the semiconductor integrated circuit is hierarchized to form a lower layer block and its lower layer block. In general, the design is divided into the top level of the upper layer connecting the blocks. In this case, the clock delays reaching the FFs in each lower layer block are made as equal as possible, and the clock skew between all the FFs in the semiconductor integrated circuit is made as small as possible. In order to design the clock skew of the entire semiconductor integrated circuit as small as possible, the physical design within the block is first performed, the clock delay inside the block is determined, and this is fed back to the clock wiring delay at the TOP level. (For example, refer to Patent Document 1 below.)

2)一方、半導体集積回路内のクロックサイクル内の消費電力の解析により、クロック系に含まれる数多くの消費電力の大きいクロックドライバーと、クロックが到達した直後に動作するFFの消費電力によって、チップ全体の消費電力の1/3以上が消費されており、その後次第に消費電力が低下し、クロックサイクルの後半は殆ど消費電力がないという現象があることがわかっている。FFは、クロックが入る度に電力を消費しており、またFF間の論理パスの遅延の分布を取ると、遅延の短いもの程多く、クロックサイクルの半分を超えるような遅延時間の比較的長いものはかなり少数なので、このような消費電力パターンになる。   2) On the other hand, by analyzing the power consumption in the clock cycle in the semiconductor integrated circuit, a large number of clock drivers included in the clock system and the power consumption of the FF operating immediately after the clock arrives, the entire chip It has been found that there is a phenomenon that more than 1/3 of the power consumption is consumed, the power consumption gradually decreases thereafter, and there is almost no power consumption in the second half of the clock cycle. The FF consumes power every time the clock enters, and the distribution of the delay of the logical path between the FFs increases as the delay is shorter and the delay time is longer than half of the clock cycle. Since there are quite a few things, this is the power consumption pattern.

特開平5−61564号公報JP-A-5-61564

しかしながら、従来技術による上記1)の階層化設計の場合、TOPレベルを通過するブロック間配線のタイミング収束が最も困難である。例えばブロック間の距離が遠く、論理設計者の想定外の配線遅延がかかってしまう場合など、中継FFの追加などの論理設計変更か、ブロックの配置を変更するといったFloor−Plan変更の必要が発生し、論理設計/検証、あるいは物理設計の期間が長期化してしまうといった問題がある。   However, in the case of the hierarchical design of 1) according to the prior art, the timing convergence of the inter-block wiring passing through the TOP level is the most difficult. For example, when the distance between blocks is long and wiring delays unexpected by the logic designer take place, it is necessary to change the logical design, such as adding a relay FF, or change the floor-plan, such as changing the arrangement of blocks. However, there is a problem that the period of logical design / verification or physical design becomes longer.

また、上記2)による結果、大規模な半導体集積回路内の各FFのクロック入力スキューをできるだけ小さくした場合、クロックが多数のFFに同時に到達することになり、その近辺の時間で半導体集積回路内の消費電力が極大になり、次第に消費電力が低下し、次のクロックエッジ到着の少し前には消費電力は極小になる。それが大きな電源電圧の揺れ(電源ノイズ)となり、誤動作やEMI(ELECTROMAGNETIC INTERFERENCE)の最大の発生源になっている。   As a result of the above 2), when the clock input skew of each FF in a large-scale semiconductor integrated circuit is made as small as possible, the clock reaches a large number of FFs at the same time. , The power consumption gradually decreases, and the power consumption becomes minimal shortly before the arrival of the next clock edge. This causes a large power supply voltage fluctuation (power supply noise), which is the largest source of malfunction and EMI (ELECTROMAGNETIC INTERFERENCE).

これらの問題を防ぐために、電源ノイズに対しては設計時に電源ノイズに対応できるような十分な電源マージンを加味する必要があり、そのために物理設計期間の長期化、また半導体集積回路内にコンデンサを搭載することによる半導体集積回路サイズアップによる半導体集積回路のコストアップという問題が生じる。さらに、EMIに関しては、パッケージ/プリント基板に多量のコンデンサを搭載して問題を解決しようとすると、製品のコストアップを招くという問題が生じる。   In order to prevent these problems, it is necessary to consider a sufficient power supply margin that can cope with the power supply noise at the time of design.To that end, it is necessary to extend the physical design period and to install a capacitor in the semiconductor integrated circuit. There is a problem that the cost of the semiconductor integrated circuit is increased due to the increase in size of the semiconductor integrated circuit due to the mounting. Further, with respect to EMI, when a large amount of capacitors are mounted on a package / printed circuit board to solve the problem, there arises a problem that the cost of the product is increased.

この発明は、上述した従来技術による問題点を解消するため、設計期間を短縮化でき、半導体集積回路内の電源ノイズおよび製品のEMI問題を軽減できる半導体集積回路および半導体集積回路設計方法を提供することを目的とする。   The present invention provides a semiconductor integrated circuit and a semiconductor integrated circuit design method capable of shortening a design period and reducing power supply noise in a semiconductor integrated circuit and EMI problems of a product in order to eliminate the above-described problems caused by the prior art. For the purpose.

上述した課題を解決し、目的を達成するため、この発明にかかる半導体集積回路は、階層化されたブロック間のインターフェースを、クロックとデータを同時に送るソースシンクロナスタイプにしたことを特徴とする。   In order to solve the above-described problems and achieve the object, the semiconductor integrated circuit according to the present invention is characterized in that the interface between the hierarchized blocks is a source-synchronous type that simultaneously transmits a clock and data.

また、受信側の前記ブロックにメソクロナスタイプの同期化回路を備え、前記インターフェースのデータをセットアップ/ホールド違反なしに受信し、受信側の前記ブロックの内部回路に転送することを特徴とする。   Also, the block on the receiving side is provided with a mesochronous type synchronization circuit, and the interface data is received without a setup / hold violation and transferred to the internal circuit of the block on the receiving side.

また、前記ブロック間の前記インターフェースに、前記クロックに同期したDDR(Double−Data−Rate)、あるいはQDR(Quad−Data−Rate)を用い、当該ブロック間インターフェース信号数を少なくしたことを特徴とする。   Further, the interface between the blocks may be DDR (Double-Data-Rate) or QDR (Quad-Data-Rate) synchronized with the clock, and the number of interface signals between the blocks may be reduced. .

また、前記ブロックをそれぞれ独立のクロックで動作させ、当該ブロックにそれぞれ位相の異なるクロックを与える遅延手段を備え、回路全体の1クロック内の消費電力の差を平坦化させることを特徴とする。   Further, the present invention is characterized by comprising delay means for operating the blocks with independent clocks and supplying clocks with different phases to the blocks to flatten the difference in power consumption within one clock of the entire circuit.

また、この発明にかかる半導体集積回路設計方法は、階層化されたブロック間のインターフェースを、クロックとデータを同時に送るソースシンクロナスタイプとして設計することを特徴とする。   In addition, the semiconductor integrated circuit design method according to the present invention is characterized in that the interface between the hierarchized blocks is designed as a source synchronous type that simultaneously sends a clock and data.

上記構成によれば、階層化設計において下位ブロック間のインターフェースタイミング制約を取り去ることができ、設計期間の短期化が可能となる。また、クロックの位相をブロック毎に意図的に変更できる。   According to the above configuration, the interface timing constraint between lower blocks can be removed in the hierarchical design, and the design period can be shortened. Also, the clock phase can be changed intentionally for each block.

本発明にかかる半導体集積回路および半導体集積回路の設計方法によれば、ブロック間インターフェース信号を1サイクル以内で転送するという制約を外すことができるため、回路設計期間を短縮化できるという効果を奏する。また、意図的に各ブロック内FFが動作する時間をずらすことができるため、半導体集積回路全体としてクロックサイクル内の消費電力の極大/極小を平準化でき、半導体集積回路内電源ノイズ問題、製品化時におけるEMI問題を軽減できるという効果を奏する。   According to the semiconductor integrated circuit and the semiconductor integrated circuit design method of the present invention, it is possible to remove the restriction that the inter-block interface signal is transferred within one cycle, so that the circuit design period can be shortened. In addition, since the operation time of each block FF can be deliberately shifted, the maximum / minimum power consumption in the clock cycle can be leveled as a whole semiconductor integrated circuit. There is an effect that the EMI problem at the time can be reduced.

以下に添付図面を参照して、この発明にかかる半導体集積回路および半導体集積回路設計方法の好適な実施の形態を詳細に説明する。   Exemplary embodiments of a semiconductor integrated circuit and a semiconductor integrated circuit design method according to the present invention will be explained below in detail with reference to the accompanying drawings.

(発明の概要)
半導体集積回路は、複数の下位ブロックとそれら複数の下位ブロックを包含する上位レベルのブロックとにより構成し、下位ブロック間のインターフェース信号をソースシンクロナスタイプとして設計する。すなわち、送信側ブロックは送信側ブロックのクロックと共に制御信号/データを送り、受信側ブロックは受信したクロックで一旦受信データをラッチしてから受信側ブロック内部クロックの位相をあわせてブロック内部に送出するための受信回路を持つ。
(Summary of Invention)
The semiconductor integrated circuit includes a plurality of lower blocks and upper level blocks including the plurality of lower blocks, and an interface signal between the lower blocks is designed as a source synchronous type. That is, the transmission side block sends a control signal / data together with the clock of the transmission side block, and the reception side block once latches the reception data with the received clock, and then sends the received block internal clock in phase with the received clock. For receiving circuit.

加えて、初期化中にトレーニングパターンを使うことにより、クロックなしで受信側下位ブロックがブロック間インターフェース信号の変化点からクロックを抽出し(CDR:Clock−Data−Recovery)、前述のソースシンクロナス転送時と同様にデータ転送を行う。また、半導体集積回路全体からみて各下位ブロック内FFにクロックが到達する時間をずらし、下位ブロック単位でクロック遅延の調整を可能とし、半導体集積回路の電源ノイズ/EMIを削減させる。   In addition, by using a training pattern during initialization, the receiving lower block extracts the clock from the change point of the inter-block interface signal without a clock (CDR: Clock-Data-Recovery), and the above-mentioned source synchronous transfer Data is transferred in the same way as time. Further, the time for the clock to reach each lower block FF is shifted from the semiconductor integrated circuit as a whole, the clock delay can be adjusted in units of lower blocks, and the power supply noise / EMI of the semiconductor integrated circuit is reduced.

(実施の形態)
(半導体集積回路の構成)
図1は、本発明の実施の形態による半導体集積回路の構成例を示す図である。図1に示す半導体集積回路10は、内部に複数の下位ブロックBLK1〜BLK5(11−1〜11−5)とクロック生成回路14を含み、クロック生成回路14は、クロックを各下位ブロック(11−1〜11−5)に配っている。各下位ブロック(11−1〜11−5)は、内部にコア論理(12−1〜12−5)と、クロックツリー(13−1〜13−5)を含んでおり、各クロックツリー(13−1〜13−5)は、クロック生成回路14から伝達されたクロックを、各ブロック内のコア論理(12−1〜12−5)内に存在するFF群(図1中では省略)に対して低スキューで伝達する機能を有する。
(Embodiment)
(Configuration of semiconductor integrated circuit)
FIG. 1 is a diagram showing a configuration example of a semiconductor integrated circuit according to an embodiment of the present invention. A semiconductor integrated circuit 10 shown in FIG. 1 includes a plurality of lower blocks BLK1 to BLK5 (11-1 to 11-5) and a clock generation circuit 14, and the clock generation circuit 14 transmits a clock to each lower block (11- 1-11-5). Each lower block (11-1 to 11-5) includes a core logic (12-1 to 12-5) and a clock tree (13-1 to 13-5), and each clock tree (13 -1 to 13-5) uses the clock transmitted from the clock generation circuit 14 for FF groups (not shown in FIG. 1) present in the core logic (12-1 to 12-5) in each block. And has a function of transmitting with low skew.

また、各ブロックのコア論理(12−1〜12−5)は、ソースシンクロナス送信器(16−1−5,16−5−1,16−5−3,16−3−5)、ソースシンクロナス受信器(15−1−5,15−5−1,15−5−3,15−3−5)以外の全ての論理を含み、従来の階層化設計の下位ブロックの概念に相当する。   The core logic (12-1 to 12-5) of each block includes a source synchronous transmitter (16-1-5, 16-5-1, 16-5-3, 16-3-5) and a source. This includes all logic except the synchronous receivers (15-1-5, 15-5-1, 15-5-3, 15-3-5), and corresponds to the concept of the lower block of the conventional hierarchical design. .

BLK1(11−1),BLK3(11−3),BLK5(11−5)には、ソースシンクロナス送信器(16−1−5,16−5−1,16−5−3,16−3−5)と、ソースシンクロナス受信器(15−1−5,15−5−1,15−5−3,15−3−5)を含み、これらの3つの下位ブロック(BLK1(11−1),BLK3(11−3),BLK5(11−5))間は、ブロック間クロックとデータ/制御信号(18−15,18−35)が配線されている。BLK2(11−2)と、BLK3(11−3)の間にはデータ/制御信号のみが配線されている。   BLK1 (11-1), BLK3 (11-3), and BLK5 (11-5) include source synchronous transmitters (16-1-5, 16-5-1, 16-5-3, 16-3). -5) and source synchronous receivers (15-1-5, 15-5-1, 15-5-3, 15-3-5), and these three sub-blocks (BLK1 (11-1) ), BLK3 (11-3), BLK5 (11-5)), an inter-block clock and data / control signals (18-15, 18-35) are wired. Only data / control signals are wired between BLK2 (11-2) and BLK3 (11-3).

図1に示す例では、BLK1(11−1)と、BLK5(11−5)間、BLK3(11−3)とBLK5(11−5)間、およびBLK2(11−2)とBLK3(11−3)のみブロック間信号が限定されて描かれているが、実際には他のブロック間ともブロック間信号があり、それらは図1では省略されている。   In the example shown in FIG. 1, between BLK1 (11-1) and BLK5 (11-5), between BLK3 (11-3) and BLK5 (11-5), and between BLK2 (11-2) and BLK3 (11- 3) Only the inter-block signals are depicted as being limited, but actually there are inter-block signals between other blocks, which are omitted in FIG.

BLK2(11−2)とBLK3(11−3)は、同じクロックがクロック生成回路14から供給され、これらの2つの下位ブロックは同期して動作しており、そのため両下位ブロック間のインターフェースは、従来型の同期ブロック間インターフェース17となっている。一方、BLK1(11−1)と、BLK5(11−5)、およびBLK3(11−3)とBLK5(11−5)は、クロック生成回路14から個別のクロックが供給されており、これらのクロックは同じ周波数ではあるが異なる位相を持つメソクロナスタイプとなっている。   BLK2 (11-2) and BLK3 (11-3) are supplied with the same clock from the clock generation circuit 14, and these two lower blocks operate synchronously, so the interface between both lower blocks is: A conventional inter-synchronous block interface 17 is provided. On the other hand, BLK1 (11-1), BLK5 (11-5), and BLK3 (11-3) and BLK5 (11-5) are supplied with individual clocks from the clock generation circuit 14, and these clocks are supplied. Are mesochronous types with the same frequency but different phases.

これらソースシンクロナス送信器(16−1−5,16−5−1,16−5−3,16−3−5)と、ソースシンクロナス受信器(15−1−5,15−5−1,15−5−3,15−3−5)を持つ下位ブロック(11−1,11−3,11−5)へのクロックの位相は全くの任意でよく、各下位ブロック(11−1,11−3,11−5)内のFFへのクロック到着時間を大きくずらすことにより、半導体集積回路10のクロックサイクルレベルでの消費電力を分散させることができ、半導体集積回路10を構成する各CMOSトランジスタ素子のスイッチング動作を分散/均一化することにより電源安定用コンデンサに頼らなくとも半導体集積回路10の消費電力の均一化が可能になり電源ノイズを削減できる。   These source synchronous transmitters (16-1-5, 16-5-1, 16-5-3, 16-3-5) and source synchronous receivers (15-1-5, 15-5-1). , 15-5-3, 15-3-5), the phase of the clock to the lower blocks (11-1, 11-3, 11-5) may be arbitrary, and each lower block (11-1, 11-3 and 11-5), the power consumption at the clock cycle level of the semiconductor integrated circuit 10 can be dispersed by largely shifting the clock arrival time to the FF in each of the CMOSs constituting the semiconductor integrated circuit 10. By distributing / homogenizing the switching operation of the transistor elements, the power consumption of the semiconductor integrated circuit 10 can be made uniform without relying on a power supply stabilization capacitor, and power supply noise can be reduced.

(送信器/受信器の構成例1…送信クロックが反転の場合)
以下、図1に示した半導体集積回路に設けられる送信器および受信器の各構成例について説明する。図2は、本発明の送信器/受信器の一例を示す構成図である。図2においては、送信クロックを反転する場合(データが安定してからクロックの立ち上がりエッジが受信側ブロックに到着する)の例を示してある。
(Configuration example 1 of transmitter / receiver: When transmission clock is inverted)
Hereinafter, each configuration example of the transmitter and the receiver provided in the semiconductor integrated circuit illustrated in FIG. 1 will be described. FIG. 2 is a block diagram showing an example of the transmitter / receiver of the present invention. FIG. 2 shows an example in which the transmission clock is inverted (the rising edge of the clock arrives at the receiving block after the data is stabilized).

送信側ブロック21は、送信器23を含み、送信器23は、その中に送信側FF群(ポジティブエッジのFF群)25と、BLK内クロックを反転して出力するインバータ26を含む。この構造により、データの変化点におけるクロックはダウンエッジとなり、受信側ブロック22が送信側ブロック21からブロック間クロックとブロック間データを受信した時点では、クロックのポジティブエッジではデータは安定している。よって受信FF群1(29−1)では、送信側ブロック21から伝播してくるブロック間クロックを使って、送信側ブロック21から伝播してくるブロック間データをラッチできる。   The transmission side block 21 includes a transmitter 23, and the transmitter 23 includes a transmission side FF group (positive edge FF group) 25 and an inverter 26 that inverts and outputs the BLK clock. With this structure, the clock at the data change point becomes a down edge, and when the receiving block 22 receives the inter-block clock and the inter-block data from the transmitting block 21, the data is stable at the positive edge of the clock. Therefore, the reception FF group 1 (29-1) can latch the inter-block data propagated from the transmission side block 21 by using the inter-block clock propagated from the transmission side block 21.

受信側ブロック22は、受信器24を含み、受信器24は、その中に同期化回路を構成するクロック位相検出器27と、その制御下にあるVariable−Delay−Line(VDL)28からなる。クロック位相検出器27は、送信側ブロック21が送ってきたブロック間クロックと、受信側ブロック22内クロックの位相を検出し、受信FF群2(29−2)がセットアップ/ホールドタイミング違反を起こさないようなクロックをVDL28で作成させ、受信FF群2(29−2)で一度ラッチしたあと、受信側ブロック22内クロックを使用する受信FF群3(29−3)にデータを渡す。   The reception side block 22 includes a receiver 24, and the receiver 24 includes a clock phase detector 27 constituting a synchronization circuit therein and a variable-delay-line (VDL) 28 under the control of the clock phase detector 27. The clock phase detector 27 detects the phase of the inter-block clock sent from the transmission side block 21 and the phase of the clock in the reception side block 22, and the reception FF group 2 (29-2) does not cause a setup / hold timing violation. Such a clock is generated by the VDL 28, and once latched by the reception FF group 2 (29-2), data is transferred to the reception FF group 3 (29-3) using the clock in the reception side block 22.

(送信器/受信器の構成例2…送信クロックを反転させない場合)
図3は、本発明の送信器/受信器の一例を示す構成図である。図3の構成は、図2とほぼ同じであるが、送信側ブロック31が出力するクロックのポジティブエッジがデータの変化点と同じ(送信クロックを反転させない)例である。
(Configuration example 2 of transmitter / receiver: When the transmission clock is not inverted)
FIG. 3 is a block diagram showing an example of the transmitter / receiver of the present invention. The configuration in FIG. 3 is almost the same as that in FIG. 2, but is an example in which the positive edge of the clock output from the transmission side block 31 is the same as the data change point (the transmission clock is not inverted).

送信側ブロック31は、送信側FF群35と、バッファ36を含む。送信器33内のクロックは、バッファ36を介して受信側ブロック32に出力されている。受信側ブロック32内の受信器34においては、まず入力されたブロック間クロックを受信側ブロック32内クロックとクロック位相検出器37によってその位相関係を検出し、VDL38によって受信FF群1(39−1)用のクロックと、受信FF群2(39−2)用のクロックが作られる。受信FF群1(39−1)用のクロックとしては、通常ブロック間クロックとして受信したクロックを反転したものを与える。また、受信FF群2(39−2)用のクロックとしては、受信FF群1(39−1)と、BLK内クロックを使用する受信FF群3(39−3)の間でセットアップ/ホールド違反が出ないタイミングになるように調整されたクロックを与える。これにより、受信側ブロック32では、セットアップ/ホールド違反なしに受信でき、この受信側ブロック32の内部回路に転送することができる。   The transmission side block 31 includes a transmission side FF group 35 and a buffer 36. The clock in the transmitter 33 is output to the receiving side block 32 via the buffer 36. In the receiver 34 in the reception side block 32, first, the phase relationship of the input inter-block clock is detected by the clock in the reception side block 32 and the clock phase detector 37, and the reception FF group 1 (39-1 is detected by the VDL 38. ) And a clock for the reception FF group 2 (39-2). As the clock for the reception FF group 1 (39-1), a clock obtained by inverting the clock received as the normal inter-block clock is given. Also, as a clock for the reception FF group 2 (39-2), a setup / hold violation between the reception FF group 1 (39-1) and the reception FF group 3 (39-3) using the clock in the BLK. A clock adjusted so that the timing will not appear is given. As a result, the reception side block 32 can receive without setup / hold violation and can transfer to the internal circuit of the reception side block 32.

(受信器の構成例3…ブロック間のクロック位相差がわかっている場合1)
図4は、本発明の受信器の一例を示す構成図である。上記の図2、図3の構成例は、送信側ブロックと、受信側ブロック間でクロックの位相が全く保証されていない場合の回路であったことに対して、図4の構成は、送信側ブロック(省略)と、受信側ブロック41の2つのクロックの位相関係がある程度限定されてわかっている場合の例である。
(Configuration example 3 of the receiver 1 when the clock phase difference between the blocks is known 1)
FIG. 4 is a block diagram showing an example of the receiver of the present invention. The configuration examples of FIGS. 2 and 3 are circuits when the clock phase is not guaranteed at all between the transmission side block and the reception side block, whereas the configuration of FIG. In this example, the phase relationship between the two clocks of the block (omitted) and the receiving side block 41 is known to some extent limited.

図2、図3の構成では受信側ブロックが3段のFF群でデータを同期化していたのに対して、図4の構成では、クロック位相検出器43と、VDL44により、送信側ブロックからのクロックと、受信側ブロック41内クロックの相関関係を物理設計時にある範囲に絞り込むことによって、受信器42内の受信FF群1(45−1)と、受信FF群2(45−2)の2段のFFでデータを受領できるようになっている。上記の「送信側ブロックからのクロックと受信側ブロック41内クロックの相関関係を物理設計時にある範囲に絞り込む」ことによる、クロックの調整の範囲は、完全同期の場合に比べて格段に自由度が高く容易に行える。   2 and 3, the receiving side block synchronizes data with a three-stage FF group. In the configuration of FIG. 4, the clock phase detector 43 and the VDL 44 are used to synchronize data from the transmitting side block. By narrowing the correlation between the clock and the clock in the reception side block 41 to a certain range at the time of physical design, the reception FF group 1 (45-1) and the reception FF group 2 (45-2) in the receiver 42 Data can be received by the FF of the stage. The range of clock adjustment by the above-mentioned “restricting the correlation between the clock from the transmission side block and the clock in the reception side block 41 to a certain range at the time of physical design” is much more flexible than in the case of complete synchronization. High and easy to do.

(受信器の構成例4…ブロック間のクロック位相差がわかっている場合2)
図5は、本発明の受信器の一例を示す構成図である。図5の構成も、送信側ブロック(省略)と、受信側ブロック51の2つのクロックの位相関係がある程度限定されてわかっている場合の例である。受信側ブロック51内のクロックは、受信FF群2(55−2)と、クロック位相検出器53に供給される。図4が受信FF群1(45−1)に与えるクロックを受信側ブロック41のクロックから生成していたのに対して、図5の構成では、送信側ブロックからのCLKを受信器52内のVDL54で遅らせて受信FF群1(55−1)用のクロックを作っている点が異なる。
(Receiver configuration example 4 ... when the clock phase difference between blocks is known 2)
FIG. 5 is a block diagram showing an example of the receiver of the present invention. The configuration of FIG. 5 is also an example when the phase relationship between the two clocks of the transmission side block (omitted) and the reception side block 51 is known to some extent. The clock in the reception side block 51 is supplied to the reception FF group 2 (55-2) and the clock phase detector 53. 4 generates the clock to be given to the reception FF group 1 (45-1) from the clock of the reception side block 41, whereas in the configuration of FIG. The difference is that the clock for the reception FF group 1 (55-1) is made delayed by the VDL 54.

(送信器/受信器の構成例5…DDRを用いる場合1)
図6−1は、本発明の送信器/受信器の一例を示す構成図である。図6−1に示す構成では、上述した構成と同様にブロック間インターフェースとしてソースシンクロナスインターフェースを使うが、ブロック間クロックのポジティブエッジとネガティブエッジの両エッジを使って転送を行うDDR(Double−Data−Rate)を使う場合の例である。
(Configuration Example 5 of Transmitter / Receiver 1 when DDR is used 1)
FIG. 6A is a block diagram showing an example of a transmitter / receiver of the present invention. In the configuration shown in FIG. 6A, the source synchronous interface is used as the inter-block interface as in the above-described configuration, but DDR (Double-Data) that performs transfer using both the positive edge and the negative edge of the inter-block clock. -Rate) is an example.

また、図6−2は、図6−1の構成によるデータ転送のタイムチャートである。送信側ブロック61におけるパラレルデータのD0とD1は、ブロック間インターフェース60部分では倍速でシリアルかつクロックのUp/Downエッジと同期して転送され、受信側ブロック62で再度パラレル化されるという送信/受信側ブロック論理例となっている。   FIG. 6B is a time chart of data transfer according to the configuration of FIG. Transmission / reception that parallel data D0 and D1 in the transmission side block 61 is transferred at a double speed serially in synchronization with the Up / Down edge of the clock at the inter-block interface 60 portion, and parallelized again in the reception side block 62. This is a side block logic example.

図6−1における送信側ブロック61中の送信器63は、マルチプレクサ66−2を有し、ブロック内クロックを使用して送信側FF群even用(65−0)と、送信側FF群odd用(65−1)からのデータを選択し、クロックのUp/Downに同期したデータを作り、受信側ブロック62に対して送出する。その際、送信側ブロック61内のクロックもバッファ66−1を経て同時に送られる。これによって、ブロック間インターフェース60の部分は、図6−2のタイムチャートに示すように、クロックの両エッジに同期した倍速データになる。   The transmitter 63 in the transmission side block 61 in FIG. 6A has a multiplexer 66-2, and uses the intra-block clock for transmission side FF group even (65-0) and transmission side FF group odd. The data from (65-1) is selected, data synchronized with the clock up / down is created, and is sent to the receiving side block 62. At that time, the clock in the transmission side block 61 is also sent simultaneously through the buffer 66-1. As a result, the inter-block interface 60 becomes double speed data synchronized with both edges of the clock as shown in the time chart of FIG. 6B.

受信側ブロック62内の受信器64にはクロック位相検出器67と、VDL68の他に、受信FF群のeven用の3セット(69−0−1,69−0−2,69−0−3)と、受信FF群のodd用の4セット(69−1−1,69−1−2,69−1−3,69−1−4)がある。受信側ブロック62に到達したブロック間クロックは、VDL68と、クロック位相検出器67に伝達され、VDL68は受信FF群even3(69−0−3)と受信FF群odd4(69−1−4)以外のFF群(69−0−1,69−0−2,69−1−1,69−1−2,69−1−3)のクロックを作成する。   In addition to the clock phase detector 67 and the VDL 68, the receiver 64 in the reception side block 62 includes three sets of reception FF groups for even (69-0-1, 69-0-2, 69-0-3). ) And 4 sets (69-1-1, 69-1-2, 69-1-3, 69-1-4) for odd of the reception FF group. The inter-block clock that has reached the receiving block 62 is transmitted to the VDL 68 and the clock phase detector 67. The VDL 68 is other than the receiving FF group even3 (69-0-3) and the receiving FF group odd4 (69-1-4). The clocks of the FF groups (69-0-1, 69-0-2, 69-1-1, 69-1-2, 69-1-3) are created.

受信FF群even1(69−0−1)は受信したブロック間クロックを90°遅延させたクロックを、また、受信FF群odd1(69−1−1)はさらにそれを反転させたクロックを使う。受信FF群odd2(69−1−2)は、180°ずれているデータをeven側と同じクロックを使ってeven側クロックに同期させるために使われる。その後の受信FF群even2(69−0−2)、受信FF群even3(69−0−3),受信FF群odd3(69−1−3),受信FF群odd4(69−1−4)は、図3の受信FF群2(39−2)と受信FF群3(39−3)と機能的に同じであり、受信側ブロック62のクロックに位相を合わせるために使われている。   The reception FF group even1 (69-0-1) uses a clock obtained by delaying the received inter-block clock by 90 °, and the reception FF group odd1 (69-1-1) uses a clock obtained by inverting the clock. The reception FF group odd2 (69-1-2) is used to synchronize data shifted by 180 ° with the even-side clock using the same clock as the even-side. The subsequent reception FF group even2 (69-0-2), reception FF group even3 (69-0-3), reception FF group odd3 (69-1-3), reception FF group odd4 (69-1-4) The reception FF group 2 (39-2) and the reception FF group 3 (39-3) in FIG. 3 are functionally the same, and are used to adjust the phase to the clock of the reception side block 62.

(送信器/受信器の構成例6…DDRを用いる場合2)
図7は、本発明の送信器/受信器の一例を示す構成図である。図7に示す構成は、図6−1と同じDDRを使うブロック間インターフェースであり、図6−1と同じ構成部には同じ符号を付してある。図7において、図6−1と異なる点は、送信側ブロック71の送信器73には、送出クロック90°位相シフター76−1が設けられており、出力するクロックがすでに90°位相がずれているため、ブロック間インターフェース60上のデータウィンドウの中心にブロック間クロックのUp/Downのエッジがくることである。そのため、受信側ブロック72内の受信器74では、受信したブロック間クロックをそのまま受信FF群even1(69−0−1)に使用しており、さらに受信したブロック間クロックを反転したクロックを受信FF群odd1(69−1−1)のクロックとして使用している。図6−1と、図7の構成では、このクロック構造だけが異なる。
(Configuration Example 6 of Transmitter / Receiver 2 when DDR is used 2)
FIG. 7 is a block diagram showing an example of the transmitter / receiver of the present invention. The configuration shown in FIG. 7 is an inter-block interface that uses the same DDR as in FIG. 6A, and the same components as those in FIG. 7 differs from FIG. 6A in that the transmitter 73 of the transmission side block 71 is provided with a transmission clock 90 ° phase shifter 76-1, and the output clock is already 90 ° out of phase. Therefore, the up / down edge of the inter-block clock comes to the center of the data window on the inter-block interface 60. Therefore, the receiver 74 in the reception side block 72 uses the received inter-block clock as it is for the reception FF group even1 (69-0-1), and further receives the clock obtained by inverting the received inter-block clock as the reception FF. It is used as a clock for the group odd1 (69-1-1). 6-1 and FIG. 7 differ only in this clock structure.

(送信器/受信器の構成例7…QDRを用いる場合)
図8−1は、本発明の送信器/受信器の一例を示す構成図である。また、図8−2は、図8−1の構成によるデータ転送のタイムチャートである。図8−1に示す構成は、1クロックで4つ分のデータを送るQuad−Data−Rate(QDR)の場合の例である。送信側ブロック81は、送信器83を有し、その中には送信側FF群0〜3(85−0〜85−3)が設けられ、その出力先に4:1のマルチプレクサ86−2が設けられる。このマルチプレクサ86−2は、マルチプレクサ用選択信号生成回路86−3によって制御されている。
(Example 7 of transmitter / receiver configuration ... when QDR is used)
FIG. 8-1 is a block diagram showing an example of the transmitter / receiver of the present invention. FIG. 8B is a time chart of data transfer with the configuration of FIG. The configuration illustrated in FIG. 8A is an example in the case of Quad-Data-Rate (QDR) that transmits four data in one clock. The transmission side block 81 includes a transmitter 83, in which transmission side FF groups 0 to 3 (85-0 to 85-3) are provided, and a 4: 1 multiplexer 86-2 is provided at the output destination. Provided. The multiplexer 86-2 is controlled by a multiplexer selection signal generation circuit 86-3.

マルチプレクサ用選択信号生成回路86−3は、送信側ブロック81のクロックの4倍スピードで0→1→2→3→0といったサイクリックな選択信号をマルチプレクサ86−2に伝え、4ビットの入力を4倍スピードの1ビットにシリアライズする。この4倍スピードのサイクリックな選択信号は、マルチプレクサ用選択信号生成回路86−3内で4倍のクロックをベースに作ってもよいし、あるいは外部からマルチプレクサ用選択信号生成回路86−3に4倍クロックを入力してもよい。ただし、D0が送出クロックの立ち上がりと同期し、ブロック間インターフェース80上ではブロック間クロックの立ち上がりがD0であることを示さねばならない。   The multiplexer selection signal generation circuit 86-3 transmits a cyclic selection signal of 0 → 1 → 2 → 3 → 0 to the multiplexer 86-2 at a speed four times the clock of the transmission side block 81, and receives a 4-bit input. Serialize to 1 bit at 4x speed. The 4 × speed cyclic selection signal may be generated based on a 4 × clock in the multiplexer selection signal generation circuit 86-3, or may be externally supplied to the multiplexer selection signal generation circuit 86-3. A double clock may be input. However, it must be shown that D0 is synchronized with the rising edge of the transmission clock and that the rising edge of the interblock clock is D0 on the interblock interface 80.

受信側ブロック82の構造については、基本的には図6−1および図7に示したDDRの構成例と同じであるが、図8−1の構成例では、受信器84に設けられた受信用クロック/ラッチイネーブル生成回路87−2が初段の受信FF群(89−0−0,89−1−0,89−2−0,89−3−0)への4倍クロックとイネーブル信号を生成している。送信側ブロック81のマルチプレクサ用選択信号生成回路86−3と同様に、受信用クロック/ラッチイネーブル生成回路87−2が4倍のクロックとその周波数で動作するラッチイネーブル信号を内部で作ってもよいし、外部から基準となる4倍のクロックをもらってもよい。   The structure of the receiving side block 82 is basically the same as the configuration example of the DDR shown in FIGS. 6A and 6B, but in the configuration example of FIG. Clock / latch enable generation circuit 87-2 generates a quadruple clock and enable signal for the first-stage reception FF group (89-0-0, 89-1-0, 89-2-0, 89-3-0). Is generated. Similar to the multiplexer selection signal generation circuit 86-3 of the transmission side block 81, the reception clock / latch enable generation circuit 87-2 may internally generate a latch enable signal that operates at four times the clock frequency. However, it is also possible to obtain a reference four times the clock from the outside.

そして、受信用クロック/ラッチイネーブル生成回路87−2は、ブロック間クロックの位相情報を元に、4倍速のデータをうまく受けられる4倍のクロックと、ブロック間クロックの立ち上がり時に転送されてくるデータをD0として、さらに次の4倍クロックでD1、その次がD2と、4倍速で送られてくるデータを受領できるラッチイネーブルを作成する機能を有する。初段の受信FF群89−0−0,89−1−0,89−2−0,89−3−0)にD0からD3までが全て格納されたサイクルで、次段のFF群(89−0−1,89−1−1,89−2−1,89−3−1)にクロックを与え、4ビットのデータをパラレル化された1クロックのデータとして取り込む。   Then, the reception clock / latch enable generation circuit 87-2, based on the phase information of the inter-block clock, receives a quadruple clock that can successfully receive quadruple-speed data and data transferred at the rise of the inter-block clock. And D0 at the next quadruple clock, and D2 at the next, and a function to create a latch enable that can receive data sent at quadruple speed. In the cycle in which all of D0 to D3 are stored in the first-stage reception FF group 89-0-0, 89-1-0, 89-2-0, 89-3-0), the next-stage FF group (89- 0-1, 89-1-1, 89-2-1, 89-3-1) are given clocks, and 4-bit data is taken in as parallelized 1-clock data.

その後、受信側ブロック82のクロックに同期させて受信側ブロック82内にデータを送り出す。ここでも、通信を行う送信側ブロック81と、受信側ブロック82のクロックが全くの自由な位相関係を保てるようにするために、3段目のFF群(89−0−2,89−1−2,89−2−2,89−3−2)と、4段目のFF群(89−0−3,89−1−3,89−2−3,89−3−3)を設けてある。   Thereafter, the data is sent into the receiving side block 82 in synchronization with the clock of the receiving side block 82. In this case as well, the third-stage FF group (89-0-2, 89-1-) is used so that the clocks of the transmitting side block 81 and the receiving side block 82 for communication can maintain a completely free phase relationship. 2, 89-2-2, 89-3-2) and the fourth stage FF group (89-0-3, 89-1-3, 89-2-3, 89-3-3) is there.

以上のように、ブロック間インターフェースに、クロックに同期したDDR、あるいはQDRを用いることにより、ブロック間インターフェースの信号数を少なくすることができる。   As described above, by using DDR or QDR synchronized with the clock for the inter-block interface, the number of signals of the inter-block interface can be reduced.

(送信器/受信器の構成例8…CDRを用いる場合)
図9は、本発明の送信器/受信器の一例を示す構成図である。図9に示す構成は、上述したようなクロックとデータを同時に送信するソースシンクロナスとは異なるクロックデータリカバリ(CDR)の例である。QDRよりさらに高速にデータを送りたい場合などは、回路的にクロック信号とデータ信号の関係を正しく保つことが難しくなる。そこで、データの中にクロック信号を埋め込むクロックデータリカバリの手法が用いられる。
(Configuration Example 8 of Transmitter / Receiver: When CDR is Used)
FIG. 9 is a block diagram showing an example of the transmitter / receiver of the present invention. The configuration shown in FIG. 9 is an example of clock data recovery (CDR) different from the source synchronous that transmits the clock and data simultaneously as described above. When it is desired to send data at a higher speed than QDR, it is difficult to maintain the correct relationship between the clock signal and the data signal in terms of circuit. Therefore, a clock data recovery technique for embedding a clock signal in data is used.

以下の例では、QDR相当の4倍速のデータを受領する場合のCDR回路の例を説明するが、当然、より早いデータレートでも対応可能である。シリアル化されたデータが受信器90に入ってくると、複数の異なったラッチタイミングを持つFF群(91−0〜91−8)でデータを取り込む。この複数の異なったラッチタイミングは、最適CLK生成回路92によってタイミングの異なるクロックが供給されることによって達成される。この例では、1サイクルの1/8毎ずれているクロックを供給している。   In the following example, an example of a CDR circuit in the case of receiving quadruple speed data equivalent to QDR will be described, but it is naturally possible to cope with a higher data rate. When the serialized data enters the receiver 90, the data is taken in by a plurality of FF groups (91-0 to 91-8) having different latch timings. The plurality of different latch timings are achieved by supplying clocks having different timings by the optimum CLK generation circuit 92. In this example, a clock that is shifted by 1/8 of one cycle is supplied.

入力されたData_inがこの複数のFFでラッチされるので、Data_inが変化すると、いずれかのFF群(91−0〜91−8)のどこかで変化が観測される。その変化を観測するのが入力データ位相検出用エッジ検出回路93である。この入力データ位相検出用エッジ検出回路93内のEOR94−0〜94−7によって変化点を検出し、ヒステリシスを持ったエッジ検出回路95でその変化点の場所を記憶する。ヒステリシスを持つ理由は、検出された変化点が頻繁に変動することを防ぐためである。   Since the input Data_in is latched by the plurality of FFs, when Data_in changes, a change is observed somewhere in one of the FF groups (91-0 to 91-8). The change is observed by the input data phase detection edge detection circuit 93. A change point is detected by the EORs 94-0 to 94-7 in the edge detection circuit 93 for detecting the input data phase, and the location of the change point is stored by the edge detection circuit 95 having hysteresis. The reason for having hysteresis is to prevent the detected change point from fluctuating frequently.

図9の例において、FF群91−2と、91−3との間で変化が観測されたとすると、入力データ位相検出用エッジ検出回路93は、そこから遠いFF91−8が最も安定している場所であると最適CLK生成回路92に伝達し、最適CLK生成回路92は、FF91−8の出力が選択されるようにセレクタ96に指示を与える。   In the example of FIG. 9, if a change is observed between the FF groups 91-2 and 91-3, the input data phase detection edge detection circuit 93 is most stable at the FF 91-8 far from the input data phase detection edge detection circuit 93. The location is transmitted to the optimum CLK generation circuit 92, and the optimum CLK generation circuit 92 gives an instruction to the selector 96 so that the output of the FF 91-8 is selected.

このあとは、図8の説明とほぼ同じ動作により、最適CLK生成回路92が4倍のクロックを作り、それに対応するラッチイネーブルを生成することにより、初段のFF群(99−0−0,99−0−1,99−0−2,99−0−3)にデータが取り込まれる。これら4つの初段FF群(99−0−0,99−0−1,99−0−2,99−0−3)にデータが格納された時点で、次段のFF群(99−1−0,99−1−1,99−1−2,99−1−3)にデータが転送され、さらに受信側クロックに同期するためにさらに3段目のFF群(99−2−0,99−2−1,99−2−2,99−2−3)と、4段目のFF群(99−3−0,99−3−1,99−3−2,99−3−3)を経て、受信側ブロック内にデータが送られる。ただし、DDR/QDRの場合と異なり、シリアライズされたデータのどれがパラレルデータ時の先頭にあたるかが上記回路だけではわからないため、通常はトレーニングパターンなどを使ってその検出を行うようになっている(具体的な回路は省略する)。   Thereafter, the optimum CLK generation circuit 92 generates a clock four times as large as the description of FIG. 8 and generates a latch enable corresponding to the clock, thereby generating the first stage FF group (99-0-0, 99). -0-1, 99-0-2, 99-0-3). When data is stored in these four first stage FF groups (99-0-0, 99-0-1, 99-0-2, 99-0-3), the next stage FF group (99-1- 0, 99-1-1, 99-1-2, 99-1-3), and further in order to synchronize with the receiving side clock, the third stage FF group (99-2-0, 99) -2-1, 99-2-2, 99-2-3) and the fourth stage FF group (99-3-0, 99-3-1, 99-3-2, 99-3-3) After that, data is sent in the receiving block. However, unlike the case of DDR / QDR, since only the above circuit does not know which serialized data is at the head of parallel data, it is usually detected using a training pattern or the like ( A specific circuit is omitted).

以上のように、CDR方式によれば、DDRやQDRに比して、よりブロック間インターフェース信号を少なくすることができる。   As described above, according to the CDR method, the inter-block interface signal can be further reduced as compared with DDR and QDR.

(受信器の構成例9…受信データビット間のクロックサイクルずれを解消する例)
図10は、本発明の受信器の一例を示す構成図である。半導体集積回路内でソースシンクロナスのインターフェースを作る場合に、できるだけクロックとデータを並べて同じドライブ能力、同じ配線長/配線層とし、その伝播遅延誤差を小さくすることが行われている。しかし、それができず、ビットによってタイミングずれが発生してしまう場合に、そのずれを解消する回路の例である。受信側ブロック100には、上記の各構成例として説明したいずれかの受信器101が配置される。そして、図10に示すように、受信側ブロック100内には、受信器101のすぐ内側にビットアライメントブロック102を追加する。
(Example 9 of receiver configuration: example of eliminating clock cycle deviation between received data bits)
FIG. 10 is a block diagram showing an example of the receiver of the present invention. When creating a source-synchronous interface in a semiconductor integrated circuit, clocks and data are arranged as much as possible to have the same drive capability and the same wiring length / wiring layer, and the propagation delay error is reduced. However, this is an example of a circuit that eliminates the shift when it cannot be done and a timing shift occurs due to bits. In the reception side block 100, any one of the receivers 101 described as the respective configuration examples is arranged. Then, as shown in FIG. 10, a bit alignment block 102 is added in the receiving side block 100 just inside the receiver 101.

このビットアライメントブロック102は、トレーニングモード(training_mode)を用いる。このため、送信側ブロックには、training_mode中においては全出力データビットがHighになる1サイクルと、7サイクルの間全出力データビットがLowになる機能を付加する。受信側ブロック100では、受信器101から出力された受信データをビットアライメント制御ブロック103に取り込み、ビットずれがあるかないかを検出する。そして、ビットアライメント制御ブロック103は、1ビットずれが検出された場合には、早く到着したビットはFF(104−0〜104−3)に一度取り込んで1サイクル遅らせ、次サイクルに到着したデータは直接出力するようにマルチプレクサ(105−0〜105−3)をコントロールする。これによって、ビットずれのアライメントを取ることができる。ビットアライメント制御ブロック103のブロック内に記載したサンプルコードは、この回路の制御論理例(制御ソフトウェア)である。上記構成によれば、トレーニングパターンを使い、ビットずれを自動的に修正することができる。   The bit alignment block 102 uses a training mode (training_mode). For this reason, the transmitting block is added with a function in which all output data bits are High during training_mode and a function in which all output data bits are Low for 7 cycles. In the receiving side block 100, the reception data output from the receiver 101 is taken into the bit alignment control block 103, and it is detected whether there is any bit shift. When the bit alignment control block 103 detects a 1-bit shift, the bit that arrived early is once taken into the FF (104-0 to 104-3) and delayed by one cycle, and the data that arrived in the next cycle is The multiplexers (105-0 to 105-3) are controlled so as to output directly. As a result, bit shift alignment can be achieved. The sample code described in the block of the bit alignment control block 103 is an example of control logic (control software) of this circuit. According to the above configuration, the bit shift can be automatically corrected using the training pattern.

以上説明した各構成例によれば、半導体集積回路を階層化設計する場合に、各下位ブロック内にメソクロナスタイプ(周波数は同じで、位相のみが不明の場合)のソースシンクロナス受信回路を設置し、送信側下位ブロックは、自クロックと共にデータ/制御信号を送出し、受信側下位ブロックはメソクロナスタイプのソースシンクロナス受信回路でこれらクロック/データ/制御信号を受信する構成とした。これにより、各下位ブロック単位にタイミング設計を独立に終了でき、下位ブロックを包含する上位ブロックは各下位ブロックのタイミングを気にすることなくブロック間のインターフェース信号群の送信クロックとデータ/制御信号の相対遅延(すなわちソースクロックとデータ/制御信号間のSkew)のみをある一定の範囲に入るように設計しさえすれば上位ブロックの設計を終了でき、半導体集積回路全体は上位ブロックに下位ブロックをはめ込めば設計が終了でき、下位ブロックと上位ブロックを完全に別に設計することにより設計期間の短縮が可能になる。   According to each configuration example described above, when a semiconductor integrated circuit is hierarchically designed, a source synchronous receiving circuit of a mesochronous type (when the frequency is the same and only the phase is unknown) is included in each lower block. The transmission-side lower block transmits a data / control signal together with its own clock, and the reception-side lower block receives these clock / data / control signals by a mesochronous type source synchronous reception circuit. As a result, the timing design can be completed independently for each lower block, and the upper block including the lower block can transmit the transmission clock and the data / control signal of the interface signal group between the blocks without worrying about the timing of each lower block. The design of the upper block can be completed as long as the relative delay (ie, skew between the source clock and the data / control signal) is designed to fall within a certain range, and the entire semiconductor integrated circuit can be fitted with the lower block in the upper block. The design can be completed and the design period can be shortened by designing the lower block and the upper block completely separately.

(半導体集積回路内のブロック毎のクロックの制御例1)
図11は、本発明の半導体集積回路内のブロック毎にクロックを制御する構成図である。上述した各構成により、半導体集積回路111の下位ブロックであるBLK0〜BLK9(116−0〜116−9)のクロックを任意にずらせるようになった場合に、どのようにクロックをずらすかを図11に示す。クロックに任意に遅延を与える方法としては、クロック生成回路112の中のPLL114や、DLL/VDL115によって意図的な遅延を付加させる。あるいは、クロック生成回路112の内部に遅延素子113−1、あるいは下位ブロックBLK1(116−1)の上位ブロックとして遅延素子113−2を配置する。
(Example 1 of clock control for each block in a semiconductor integrated circuit)
FIG. 11 is a block diagram for controlling the clock for each block in the semiconductor integrated circuit of the present invention. FIG. 7 shows how the clocks are shifted when the clocks of BLK0 to BLK9 (116-0 to 116-9), which are lower blocks of the semiconductor integrated circuit 111, are arbitrarily shifted by the above-described configurations. 11 shows. As a method of arbitrarily delaying the clock, an intentional delay is added by the PLL 114 or the DLL / VDL 115 in the clock generation circuit 112. Alternatively, the delay element 113-2 is arranged inside the clock generation circuit 112 as the delay element 113-1 or the upper block of the lower block BLK 1 (116-1).

(半導体集積回路内のブロック毎のクロックの制御例2)
図12は、本発明の半導体集積回路内のブロック毎にクロックを制御する構成図である。この図12の構成では、下位ブロックのクロック制御方法例と電源ノイズ削減においてインテリジェンス機能を持たせて行う場合の例である。半導体集積回路121内には、複数の電源ノイズ測定回路1〜5(125−1〜125−5)を配置する。そして、クロック生成回路122内のVDL123−1〜123−4によって遅延をつけたクロックで複数の下位ブロックBLK1〜BLK4(126−1〜126−4)を動作させたときに、電源ノイズ測定回路1〜5(125−1〜125−5)によって検出される電源ノイズが小さくなるように、クロック遅延制御回路124でVDL123−1〜123−4を制御する。
(Example 2 of clock control for each block in a semiconductor integrated circuit)
FIG. 12 is a block diagram for controlling the clock for each block in the semiconductor integrated circuit of the present invention. The configuration of FIG. 12 is an example of a clock control method for a lower block and an example in which an intelligence function is provided in power supply noise reduction. In the semiconductor integrated circuit 121, a plurality of power supply noise measurement circuits 1 to 5 (125-1 to 125-5) are arranged. When the plurality of lower blocks BLK1 to BLK4 (126-1 to 126-4) are operated with the clocks delayed by the VDLs 123-1 to 123-4 in the clock generation circuit 122, the power supply noise measurement circuit 1 The clock delay control circuit 124 controls the VDLs 123-1 to 123-4 so that the power supply noise detected by .about.5 (125-1 to 125-5) is reduced.

上記制御例1、2の構成によれば、上位ブロックの下位ブロックへのクロック配線時において、各下位ブロックに与えるクロックに意図的に異なるクロック遅延を与え、各下位ブロック内のFFが別のタイミングで動作させることにより、半導体集積回路全体としてのFFの動作時期をずらすことができる。これにより、消費電力極大時と極小時の差を全ての半導体集積回路内のFFが全て同時に動作する場合に比較して平坦化/削減できるようになる。同時に、半導体集積回路の電源ノイズの低下とEMI低減が可能になるため、従来必要としていた電源ピン数とオンチップコンデンサ分の面積が削減でき、半導体集積回路のサイズを小さくすることができ、半導体集積回路のコストダウンが可能になる。さらに、従来半導体集積回路が搭載されていたパッケージ/プリント基板上に実装されていた電源ノイズ/EMI対策用の外付けのバイパスコンデンサの数も削減できるため、パッケージ/プリント板モジュールのコスト削減も可能となる。   According to the configuration of the above control examples 1 and 2, when clock wiring to the lower block of the upper block, a different clock delay is intentionally given to the clock given to each lower block, and the FF in each lower block has a different timing. As a result, the operation timing of the FF as the entire semiconductor integrated circuit can be shifted. As a result, the difference between the maximum and minimum power consumption can be flattened / reduced as compared to the case where all the FFs in all the semiconductor integrated circuits operate simultaneously. At the same time, the power supply noise of the semiconductor integrated circuit can be reduced and the EMI can be reduced, so that the number of power supply pins and the area required for the on-chip capacitor, which have been conventionally required, can be reduced, and the size of the semiconductor integrated circuit can be reduced. The cost of the integrated circuit can be reduced. Furthermore, the number of external bypass capacitors for power supply noise / EMI countermeasures mounted on the package / printed circuit board on which the conventional semiconductor integrated circuit is mounted can be reduced, thereby reducing the cost of the package / printed board module. It becomes.

以上説明した半導体集積回路の構成は、この半導体集積回路の設計時に決定することができる。この半導体集積回路の設計にかかる方法は、予め用意されたプログラムをパーソナル・コンピュータやワークステーション等のコンピュータで実行することにより実現することができる。このプログラムは、ハードディスク、フレキシブルディスク、CD−ROM、MO、DVD等のコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行される。またこのプログラムは、インターネット等のネットワークを介して配布することが可能な伝送媒体であってもよい。   The configuration of the semiconductor integrated circuit described above can be determined at the time of designing the semiconductor integrated circuit. This method for designing a semiconductor integrated circuit can be realized by executing a program prepared in advance on a computer such as a personal computer or a workstation. This program is recorded on a computer-readable recording medium such as a hard disk, a flexible disk, a CD-ROM, an MO, and a DVD, and is executed by being read from the recording medium by the computer. The program may be a transmission medium that can be distributed via a network such as the Internet.

(付記1)階層化されたブロック間のインターフェースを、クロックとデータを同時に送るソースシンクロナスタイプにしたことを特徴とする半導体集積回路。 (Supplementary note 1) A semiconductor integrated circuit characterized in that the interface between the hierarchized blocks is of a source synchronous type for simultaneously sending a clock and data.

(付記2)受信側の前記ブロックにメソクロナスタイプの同期化回路を備え、前記インターフェースのデータをセットアップ/ホールド違反なしに受信し、受信側の前記ブロックの内部回路に転送することを特徴とする付記1に記載の半導体集積回路。 (Supplementary note 2) A mesochronous type synchronization circuit is provided in the block on the receiving side, the interface data is received without a setup / hold violation, and is transferred to an internal circuit of the block on the receiving side. The semiconductor integrated circuit according to appendix 1.

(付記3)前記ブロック間の前記インターフェースに、前記クロックに同期したDDR(Double−Data−Rate)、あるいはQDR(Quad−Data−Rate)を用い、当該ブロック間インターフェース信号数を少なくしたことを特徴とする付記1に記載の半導体集積回路。 (Supplementary Note 3) The interface between the blocks uses DDR (Double-Data-Rate) or QDR (Quad-Data-Rate) synchronized with the clock to reduce the number of inter-block interface signals. The semiconductor integrated circuit according to appendix 1.

(付記4)送信側の前記ブロックと、受信側の前記ブロックをメソクロナスタイプとし、クロックラインを使わずに前記データにクロックを埋め込むCDR(Clock−Data−Recovery)方式を用い、ブロック間インターフェース信号を少なくしたことを特徴とする付記1に記載の半導体集積回路。 (Supplementary note 4) The block on the transmission side and the block on the reception side are of a mesochronous type and use a CDR (Clock-Data-Recovery) method in which a clock is embedded in the data without using a clock line, and an inter-block interface The semiconductor integrated circuit according to appendix 1, wherein the number of signals is reduced.

(付記5)前記ブロック間のインターフェースとして高速なソースシンクロナスインターフェースを用い、
受信側の前記ブロックには、所定のトレーニングパターンによりビットずれを修正するビットアライメント手段を備えたことを特徴とする付記1に記載の半導体集積回路。
(Appendix 5) Using a high-speed source synchronous interface as an interface between the blocks,
The semiconductor integrated circuit according to appendix 1, wherein the block on the receiving side includes bit alignment means for correcting a bit shift by a predetermined training pattern.

(付記6)前記ブロックをそれぞれ独立のクロックで動作させ、当該ブロックにそれぞれ位相の異なるクロックを与える遅延手段を備え、回路全体の1クロック内の消費電力の差を平坦化させることを特徴とする付記1〜5のいずれか一つに記載の半導体集積回路。 (Additional remark 6) The said block is operated with an independent clock, The delay means which gives a clock with a different phase to each said block is provided, The difference of the power consumption in 1 clock of the whole circuit is planarized, It is characterized by the above-mentioned. The semiconductor integrated circuit according to any one of appendices 1 to 5.

(付記7)階層化されたブロック間のインターフェースを、クロックとデータを同時に送るソースシンクロナスタイプとして設計することを特徴とする半導体集積回路設計方法。 (Supplementary note 7) A method for designing a semiconductor integrated circuit, wherein an interface between layered blocks is designed as a source synchronous type for simultaneously sending a clock and data.

以上のように、本発明にかかる半導体集積回路および半導体集積回路設計方法は、多数のFFを用いた大規模な集積回路におけるブロック間のタイミング収束に有用であり、特に、多数のFFを用いたLSI設計に適している。   As described above, the semiconductor integrated circuit and the semiconductor integrated circuit design method according to the present invention are useful for timing convergence between blocks in a large-scale integrated circuit using a large number of FFs, and in particular, a large number of FFs are used. Suitable for LSI design.

本発明の実施の形態による半導体集積回路の構成例を示す図である。It is a figure which shows the structural example of the semiconductor integrated circuit by embodiment of this invention. 本発明の送信器/受信器の一例を示す構成図である。It is a block diagram which shows an example of the transmitter / receiver of this invention. 本発明の送信器/受信器の一例を示す構成図である。It is a block diagram which shows an example of the transmitter / receiver of this invention. 本発明の受信器の一例を示す構成図である。It is a block diagram which shows an example of the receiver of this invention. 本発明の受信器の一例を示す構成図である。It is a block diagram which shows an example of the receiver of this invention. 本発明の送信器/受信器の一例を示す構成図である。It is a block diagram which shows an example of the transmitter / receiver of this invention. 図6−1の構成によるデータ転送のタイムチャートである。6 is a time chart of data transfer according to the configuration of FIG. 本発明の送信器/受信器の一例を示す構成図である。It is a block diagram which shows an example of the transmitter / receiver of this invention. 本発明の送信器/受信器の一例を示す構成図である。It is a block diagram which shows an example of the transmitter / receiver of this invention. 図8−1の構成によるデータ転送のタイムチャートである。It is a time chart of the data transfer by the structure of FIGS. 本発明の送信器/受信器の一例を示す構成図である。It is a block diagram which shows an example of the transmitter / receiver of this invention. 本発明の受信器の一例を示す構成図である。It is a block diagram which shows an example of the receiver of this invention. 本発明の半導体集積回路内のブロック毎にクロックを制御する構成図である。It is a block diagram which controls a clock for every block in the semiconductor integrated circuit of this invention. 本発明の半導体集積回路内のブロック毎にクロックを制御する構成図である。It is a block diagram which controls a clock for every block in the semiconductor integrated circuit of this invention.

符号の説明Explanation of symbols

10 半導体集積回路
11−1〜11−5 下位ブロック(BLK1〜BLK5)
12−1〜12−5 コア論理
13−1〜13−5 クロックツリー
14 クロック生成回路
15−1−5,15−5−1,15−5−3,15−3−5 ソースシンクロナス受信器
16−1−5,16−5−1,16−5−3,16−3−5 ソースシンクロナス送信器
17 同期ブロック間インターフェース
10 Semiconductor Integrated Circuit 11-1 to 11-5 Lower Block (BLK1 to BLK5)
12-1 to 12-5 Core logic 13-1 to 13-5 Clock tree 14 Clock generation circuit 15-1-5, 15-5-1, 15-5-3, 15-3-5 Source synchronous receiver 16-1-5, 16-5-1, 16-5-3, 16-3-5 Source synchronous transmitter 17 Interface between synchronous blocks

Claims (5)

階層化されたブロック間のインターフェースを、クロックとデータを同時に送るソースシンクロナスタイプにしたことを特徴とする半導体集積回路。   A semiconductor integrated circuit characterized in that the interface between the hierarchized blocks is a source synchronous type that simultaneously sends a clock and data. 受信側の前記ブロックにメソクロナスタイプの同期化回路を備え、前記インターフェースのデータをセットアップ/ホールド違反なしに受信し、受信側の前記ブロックの内部回路に転送することを特徴とする請求項1に記載の半導体集積回路。   2. The block on the receiving side is provided with a mesochronous type synchronization circuit, receives the data of the interface without any setup / hold violation, and transfers it to the internal circuit of the block on the receiving side. A semiconductor integrated circuit according to 1. 前記ブロック間の前記インターフェースに、前記クロックに同期したDDR、あるいはQDRを用い、当該ブロック間インターフェース信号数を少なくしたことを特徴とする請求項1に記載の半導体集積回路。   2. The semiconductor integrated circuit according to claim 1, wherein the number of interface signals between the blocks is reduced by using DDR or QDR synchronized with the clock for the interface between the blocks. 前記ブロックをそれぞれ独立のクロックで動作させ、当該ブロックにそれぞれ位相の異なるクロックを与える遅延手段を備え、回路全体の1クロック内の消費電力の差を平坦化させることを特徴とする請求項1〜3のいずれか一つに記載の半導体集積回路。   A delay means for operating the blocks with independent clocks and supplying clocks with different phases to the blocks, and flattening a difference in power consumption within one clock of the entire circuit. 4. The semiconductor integrated circuit according to any one of 3 above. 階層化されたブロック間のインターフェースを、クロックとデータを同時に送るソースシンクロナスタイプとして設計することを特徴とする半導体集積回路設計方法。

A method for designing a semiconductor integrated circuit, wherein an interface between layered blocks is designed as a source synchronous type that simultaneously sends a clock and data.

JP2006093824A 2006-03-30 2006-03-30 Semiconductor integrated circuit and semiconductor integrated circuit design method Expired - Fee Related JP4893064B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006093824A JP4893064B2 (en) 2006-03-30 2006-03-30 Semiconductor integrated circuit and semiconductor integrated circuit design method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006093824A JP4893064B2 (en) 2006-03-30 2006-03-30 Semiconductor integrated circuit and semiconductor integrated circuit design method

Publications (2)

Publication Number Publication Date
JP2007274049A true JP2007274049A (en) 2007-10-18
JP4893064B2 JP4893064B2 (en) 2012-03-07

Family

ID=38676444

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006093824A Expired - Fee Related JP4893064B2 (en) 2006-03-30 2006-03-30 Semiconductor integrated circuit and semiconductor integrated circuit design method

Country Status (1)

Country Link
JP (1) JP4893064B2 (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008259152A (en) * 2007-04-03 2008-10-23 National Institutes Of Natural Sciences Bit alignment correction mechanism in very high-speed a/d conversion
JP2009165120A (en) * 2007-12-31 2009-07-23 Intel Corp Noise reduction method by implementing port-to-port delay
JP2015023398A (en) * 2013-07-18 2015-02-02 富士通株式会社 Receiving circuit and semiconductor integrated circuit device
CN110188387A (en) * 2019-04-26 2019-08-30 深圳市致宸信息科技有限公司 A kind of ULSIC timing closure method and device

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001195354A (en) * 2000-01-12 2001-07-19 Nec Corp Inter-lsi data transfer system, and source synchronous data transfer system used therefor
JP2002108809A (en) * 2000-09-29 2002-04-12 Nec Corp Method and device for transferring source synchronous data
JP2002366250A (en) * 2001-06-08 2002-12-20 Matsushita Electric Ind Co Ltd Circuit for adjusting clock signal
WO2006132329A1 (en) * 2005-06-10 2006-12-14 International Business Machines Corporation Microcomputer and method for testing the same

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001195354A (en) * 2000-01-12 2001-07-19 Nec Corp Inter-lsi data transfer system, and source synchronous data transfer system used therefor
JP2002108809A (en) * 2000-09-29 2002-04-12 Nec Corp Method and device for transferring source synchronous data
JP2002366250A (en) * 2001-06-08 2002-12-20 Matsushita Electric Ind Co Ltd Circuit for adjusting clock signal
WO2006132329A1 (en) * 2005-06-10 2006-12-14 International Business Machines Corporation Microcomputer and method for testing the same

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008259152A (en) * 2007-04-03 2008-10-23 National Institutes Of Natural Sciences Bit alignment correction mechanism in very high-speed a/d conversion
JP2009165120A (en) * 2007-12-31 2009-07-23 Intel Corp Noise reduction method by implementing port-to-port delay
JP2015023398A (en) * 2013-07-18 2015-02-02 富士通株式会社 Receiving circuit and semiconductor integrated circuit device
CN110188387A (en) * 2019-04-26 2019-08-30 深圳市致宸信息科技有限公司 A kind of ULSIC timing closure method and device

Also Published As

Publication number Publication date
JP4893064B2 (en) 2012-03-07

Similar Documents

Publication Publication Date Title
US10541693B2 (en) Method and apparatus for source-synchronous signaling
KR102367967B1 (en) Methods and apparatuses including command delay adjustment circuit
US7464282B1 (en) Apparatus and method for producing dummy data and output clock generator using same
JP5231045B2 (en) Clock skew controller and integrated circuit having the same
KR100888597B1 (en) Apparatus and methods for controlling memory interface
US5717729A (en) Low skew remote absolute delay regulator chip
US6891774B1 (en) Delay line and output clock generator using same
KR100910852B1 (en) Semiconductor device
KR100930401B1 (en) Semiconductor memory device
US8009492B2 (en) Circuit for generating data strobe signal and method
KR101699787B1 (en) Delay-locked-loop circuit, semiconductor device and memory system having the delay-locked-loop circuit
US6947349B1 (en) Apparatus and method for producing an output clock pulse and output clock generator using same
CN114301427A (en) Duty correction device and method, and semiconductor apparatus using the same
JP4893064B2 (en) Semiconductor integrated circuit and semiconductor integrated circuit design method
US20130009686A1 (en) Methods and Apparatus for Transmission of Data
KR20110137714A (en) Duty-cycle correction in a delay-locked loop
US7089439B1 (en) Architecture and method for output clock generation on a high speed memory device
KR100520657B1 (en) Phase Comparator for DLL(Delay Locked Loop)
JP2003045184A (en) Sdram semiconductor device
US10241538B2 (en) Resynchronization of a clock associated with each data bit in a double data rate memory system
KR101046730B1 (en) Semiconductor memory device and driving method thereof
KR101132799B1 (en) Semiconductor memory device and system
US7319635B2 (en) Memory system with registered memory module and control method
JP4952177B2 (en) Storage device
KR20190110733A (en) Semiconductor apparatus for trasmitting and receiving signal in synchronization with clock signal

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20080730

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081222

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110425

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110524

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110722

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111122

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111205

R150 Certificate of patent or registration of utility model

Ref document number: 4893064

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150106

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees