JP2009070980A - Semiconductor integrated circuit - Google Patents

Semiconductor integrated circuit Download PDF

Info

Publication number
JP2009070980A
JP2009070980A JP2007236874A JP2007236874A JP2009070980A JP 2009070980 A JP2009070980 A JP 2009070980A JP 2007236874 A JP2007236874 A JP 2007236874A JP 2007236874 A JP2007236874 A JP 2007236874A JP 2009070980 A JP2009070980 A JP 2009070980A
Authority
JP
Japan
Prior art keywords
clock
data processing
unit
semiconductor integrated
integrated circuit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007236874A
Other languages
Japanese (ja)
Inventor
Kiyoshi Takeuchi
浄 竹内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2007236874A priority Critical patent/JP2009070980A/en
Publication of JP2009070980A publication Critical patent/JP2009070980A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide a structure reducing power consumption in a semiconductor integrated circuit. <P>SOLUTION: A clock generating part performing clock signal generation processing and a data processing part inputting a clock generated by the clock generating part and performing data processing are separated. Supply power to the clock generating part is made at a low voltage (0.8 V, for example) which is relatively lower than that of the data processing part. Power consumption of the whole circuit is reduced with such structure. Since high voltage (1.2 V, for example) is supplied to the data processing part, the data processing part can perform data processing at a high operation frequency. <P>COPYRIGHT: (C)2009,JPO&INPIT

Description

本発明は、半導体集積回路に関する。さらに、詳細には、消費電力の低減を実現する、半導体集積回路に関する。   The present invention relates to a semiconductor integrated circuit. More specifically, the present invention relates to a semiconductor integrated circuit that realizes reduction of power consumption.

近年のプロセスの微細化とともに動作周波数の高速化に伴うCMOS半導体集積回路における消費電力の増加が問題となっている。消費電力の増加は、例えばポータブル機器のバッテリ寿命をより長くという目標を阻害する大きな要因となっている。半導体集積回路における消費電力は主にリーク電力とダイナミック電力に分類される。ダイナミック電流はリーク電流と比較した相対値が数オーダーレベルで大きく電力へのインパクトが非常に大きい。   The increase in power consumption in a CMOS semiconductor integrated circuit accompanying the increase in operating frequency with the miniaturization of processes in recent years has become a problem. The increase in power consumption is a major factor that hinders the goal of longer portable battery life, for example. Power consumption in semiconductor integrated circuits is mainly classified into leakage power and dynamic power. The dynamic current has a relative value of several orders of magnitude compared to the leakage current and has a large impact on power.

ダイナミック電力を抑えるための手法としては、動作周波数を下げる手法がまず考えられる。特許文献1(特開平3−68007号公報)には、マイクロコンピュータの動作クロック信号の周波数を各機能ブロックに必要な動作周波数に応じて切換えることによって低消費電力化を実現する技術が記載されている。   As a technique for suppressing the dynamic power, a technique for lowering the operating frequency can be considered first. Patent Document 1 (Japanese Patent Laid-Open No. 3-68007) describes a technique for realizing low power consumption by switching the frequency of an operation clock signal of a microcomputer according to an operation frequency required for each functional block. Yes.

さらに電圧制御により電力を低減する方法も提案されている、例えば特許文献2(特開平5−108193号公報)は、外部から供給される電源電圧とクロック信号周波数とを内蔵レジスタの設定値によって変更し低消費電力化を図るマイクロコンピュータについて記載している。また特許文献3(登録特許第3857052号公報)は、複数の回路ブロックに値が異なる複数の電源電圧を切り換えて供給し、周波数が異なる複数のクロックを切り換えて供給することにより、半導体集積回路のパフォーマンスを最大化すると同時にダイナミック電流を最小化する構成を開示している。   Further, a method for reducing power by voltage control has been proposed. For example, Patent Document 2 (Japanese Patent Laid-Open No. 5-108193) changes the power supply voltage and clock signal frequency supplied from the outside according to the set value of the built-in register. However, a microcomputer for reducing power consumption is described. Further, Patent Document 3 (Registered Patent No. 3,870,052) discloses a semiconductor integrated circuit by switching and supplying a plurality of power supply voltages having different values to a plurality of circuit blocks and switching and supplying a plurality of clocks having different frequencies. A configuration is disclosed that maximizes performance while minimizing dynamic current.

ところが、このようにチップ全体或いは一部の機能ブロックの電圧を下げる構成とすると、データライン、クロックラインの双方とも電圧が低下することになる。一方、
近年の高機能化されたシステムLSIでは、高い動作周波数が必要であり、低電圧駆動ではデータラインの遅延時間増加に伴うセットアップタイムのタイミング制約条件などを満たすことが困難となり、処理エラーを発生させてしまう場合がある。
特開平3−68007号公報 特開平5−108193号公報 登録特許第3857052号公報
However, when the voltage of the entire chip or a part of the functional blocks is lowered as described above, the voltage of both the data line and the clock line is lowered. on the other hand,
High-performance system LSIs in recent years require a high operating frequency, and it is difficult to meet the setup time timing constraints associated with increased data line delay time with low-voltage drive, causing processing errors. May end up.
JP-A-3-68007 Japanese Patent Laid-Open No. 5-108193 Registered Patent No. 3857052

本発明は上述の問題点に鑑みてなされたものであり、データ処理回路における遅延を抑制し、かつ消費電力の低減を実現する半導体集積回路を提供する。   The present invention has been made in view of the above problems, and provides a semiconductor integrated circuit that suppresses delay in a data processing circuit and realizes reduction in power consumption.

本発明は、例えば、半導体集積回路においてクロック生成ブロックを、クロック供給を受けてデータ処理を実行するデータ処理回路ブロックよりも低電圧で駆動し、データ処理回路ブロックへのクロック入力時に昇圧してクロック供給を行うことにより、クロック生成ブロックでの電力削減を行い、かつ動作周波数が高いデータ処理回路での遅延を防止することを可能とした半導体集積回路を提供する。   The present invention, for example, drives a clock generation block in a semiconductor integrated circuit at a lower voltage than a data processing circuit block that receives data and executes data processing, and boosts the clock when the clock is input to the data processing circuit block. Provided is a semiconductor integrated circuit capable of reducing power in a clock generation block and preventing a delay in a data processing circuit having a high operating frequency by performing supply.

また、本発明は、半導体集積回路においてクロック系信号をデータ系信号よりも低電圧で駆動し、フリップフロップ(以下F/Fと略)に入力する直前にレベルシフタにより昇圧してクロック供給することによりクロックツリーに挿入されたバッファも含めたクロックネットワーク全体の消費電力削減を行いLSIの省電を効率的に行うことを可能とした半導体集積回路を提供する。   Further, according to the present invention, in a semiconductor integrated circuit, a clock signal is driven at a voltage lower than that of a data signal, and is supplied with a voltage boosted by a level shifter immediately before being input to a flip-flop (hereinafter abbreviated as F / F). Provided is a semiconductor integrated circuit capable of reducing power consumption of an entire clock network including a buffer inserted in a clock tree and efficiently saving power of an LSI.

本発明の第1の側面は、
クロック信号生成処理を実行するクロック生成部と、
前記クロック生成部の生成するクロックを入力してデータ処理を実行するデータ処理部と、
前記クロック生成部およびデータ処理部に対する電力供給を実行する電力供給部を有し、
前記クロック生成部は、前記データ処理部に比較して相対的に低い低電圧の電力を前記電力供給部から入力して動作する構成を有することを特徴とする半導体集積回路にある。
The first aspect of the present invention is:
A clock generation unit for executing a clock signal generation process;
A data processing unit that inputs a clock generated by the clock generation unit and executes data processing;
A power supply unit that performs power supply to the clock generation unit and the data processing unit;
The clock generation unit may be configured to operate by inputting power having a relatively low voltage compared to the data processing unit from the power supply unit.

さらに、本発明の半導体集積回路の一実施態様において、前記クロック生成部は、前記半導体集積回路に設定される複数の機能ブロックに対するクロック信号の生成を実行するグローバルクロック生成部と、前記半導体集積回路に設定されるデータ処理部を含む複数の機能ブロックの各々に対するクロック信号の生成を実行するローカルクロック生成部を含み、前記グローバルクロック生成部と、ローカルクロック生成部のいずれもが前記データ処理部に比較して相対的に低い低電圧の電力を前記電力供給部から入力して動作する構成を有することを特徴とする。   Furthermore, in one embodiment of the semiconductor integrated circuit according to the present invention, the clock generator includes a global clock generator that generates clock signals for a plurality of functional blocks set in the semiconductor integrated circuit, and the semiconductor integrated circuit Including a local clock generation unit that generates a clock signal for each of a plurality of functional blocks including a data processing unit set to the data processing unit, and both the global clock generation unit and the local clock generation unit are included in the data processing unit. In comparison, the power supply unit operates by inputting relatively low-voltage power from the power supply unit.

さらに、本発明の半導体集積回路の一実施態様において、前記データ処理部は、前記クロック生成部から前記データ処理部に対するクロック信号の入力部に設定された昇圧部を介して、昇圧されたクロック信号の供給を受ける構成であることを特徴とする。   Furthermore, in an embodiment of the semiconductor integrated circuit of the present invention, the data processing unit is configured to boost the clock signal via a boosting unit set as an input unit of a clock signal from the clock generation unit to the data processing unit. It is the structure which receives supply of this.

さらに、本発明の半導体集積回路の一実施態様において、前記半導体集積回路は、さらに、前記半導体集積回路に設定されるデータ処理部を含む複数の機能ブロックの各々に構成されたクロックツリー部を有し、該クロックツリー部も前記データ処理部に比較して相対的に低い低電圧の電力により動作する構成を有することを特徴とする。   Furthermore, in one embodiment of the semiconductor integrated circuit of the present invention, the semiconductor integrated circuit further includes a clock tree unit configured in each of a plurality of functional blocks including a data processing unit set in the semiconductor integrated circuit. In addition, the clock tree unit also has a configuration that operates with low voltage power that is relatively lower than that of the data processing unit.

さらに、本発明の半導体集積回路の一実施態様において、前記データ処理部は、前記クロックツリー部から前記データ処理部に対するクロック信号の入力部に設定された昇圧部を介して、昇圧されたクロック信号の供給を受ける構成であることを特徴とする。   Furthermore, in one embodiment of the semiconductor integrated circuit according to the present invention, the data processing unit is configured to boost the clock signal via a boosting unit set from the clock tree unit to a clock signal input unit to the data processing unit. It is the structure which receives supply of this.

さらに、本発明の半導体集積回路の一実施態様において、前記クロックツリー部は複数のCTSバッファによるクロックスキュー調整を行う回路であり、クロック信号供給源から前記昇圧部までの経路におけるクロックスキューを考慮したCTSバッファ設定構成を有することを特徴とする。   Furthermore, in one embodiment of the semiconductor integrated circuit of the present invention, the clock tree unit is a circuit that performs clock skew adjustment by a plurality of CTS buffers, and considers clock skew in a path from a clock signal supply source to the boosting unit. It has a CTS buffer setting configuration.

さらに、本発明の半導体集積回路の一実施態様において、前記データ処理部は、1つの昇圧部を介してクロック信号を入力する複数のフリップフロップを有し、前記複数のフリップフロップは前記1つの昇圧部に隣接して配置された構成を有することを特徴とする。   Furthermore, in one embodiment of the semiconductor integrated circuit of the present invention, the data processing unit includes a plurality of flip-flops that input a clock signal through one boosting unit, and the plurality of flip-flops is the one boosting unit. It has the structure arrange | positioned adjacent to a part.

本発明のさらに他の目的、特徴や利点は、後述する本発明の実施例や添付する図面に基づくより詳細な説明によって明らかになるであろう。なお、本明細書においてシステムとは、複数の装置の論理的集合構成であり、各構成の装置が同一筐体内にあるものには限らない。   Other objects, features, and advantages of the present invention will become apparent from a more detailed description based on embodiments of the present invention described later and the accompanying drawings. In this specification, the system is a logical set configuration of a plurality of devices, and is not limited to one in which the devices of each configuration are in the same casing.

本発明の一実施例の構成によれば、クロック信号生成処理を実行するクロック生成部と、クロック生成部の生成するクロックを入力してデータ処理を実行するデータ処理部とを区分し、クロック生成部に対する供給電力をデータ処理部に比較して相対的に低い低電圧(例えば0.8V)としたので、回路全体の消費電力が削減される。また、データ処理部に対しては高電圧(例えば1.2V)を供給する構成としたので、データ処理部では高い動作周波数のデータ処理を行うことが可能となる。   According to the configuration of one embodiment of the present invention, a clock generation unit that executes clock signal generation processing and a data processing unit that executes data processing by inputting a clock generated by the clock generation unit are divided into clock generation units. Since the power supplied to the unit is set to a relatively low voltage (for example, 0.8 V) compared to the data processing unit, the power consumption of the entire circuit is reduced. In addition, since the data processing unit is configured to supply a high voltage (for example, 1.2 V), the data processing unit can perform data processing at a high operating frequency.

以下、図面を参照しながら本発明の半導体集積回路の詳細について説明する。
前述したように、近年のプロセスの微細化とともに動作周波数の高速化に伴うCMOS半導体集積回路における消費電力の増加が問題となっている。CMOS半導体集積回路における消費電力は主にリーク電力とダイナミック電力に分類される。ダイナミック電力は、主に信号のトグルおよび容量性負荷の充放電によるデバイス動作において消費される電力であり、ダイナミック電流はリーク電流と比較した相対値が数オーダーレベルで大きく電力へのインパクトが非常に大きい。
Hereinafter, details of the semiconductor integrated circuit of the present invention will be described with reference to the drawings.
As described above, an increase in power consumption in a CMOS semiconductor integrated circuit due to a recent process miniaturization and an increase in operating frequency has been a problem. Power consumption in CMOS semiconductor integrated circuits is mainly classified into leakage power and dynamic power. Dynamic power is the power consumed in device operation mainly due to signal toggle and capacitive load charging / discharging. The dynamic current has a large relative value compared to the leakage current at several order levels, and the impact on power is very high. large.

CMOS半導体集積回路のダイナミック電力[P]は一般的に以下の式(式1)によって表現される。
=αfCV・・・・(式1)
上記式において、
αは活性化率、
fは動作周波数、
Cは容量、
Vは動作電圧
である。
The dynamic power [P D ] of a CMOS semiconductor integrated circuit is generally expressed by the following formula (Formula 1).
P D = αfCV 2 (Equation 1)
In the above formula,
α is the activation rate,
f is the operating frequency,
C is capacity
V is the operating voltage.

通常、半導体集積回路は、複数の機能ブロックによって構成されている。すなわち、クロック信号の生成を行うクロック生成ブロックや、クロック生成ブロックの生成するクロック信号を入力して各種のデータ処理を実行するデータ処理ブロックなどの複数の機能ブロックである。   Usually, a semiconductor integrated circuit is composed of a plurality of functional blocks. That is, there are a plurality of functional blocks such as a clock generation block that generates a clock signal and a data processing block that inputs a clock signal generated by the clock generation block and executes various data processing.

これらのブロックの各々は、一般的には活性化率[α],動作周波数[f]、容量[C]が異なっており、半導体集積回路全体の消費電力を算出するためには、各機能ブロックの活性化率[α],動作周波数[f]、容量[C]を考慮して算出することが必要である。例えば、各ブロックに対する供給電圧が異なる異電圧構成として、各ブロック内が一定の活性化率、周波数で動作していると単純化して、1つのクロック生成ブロックと、複数(n個)のデータ処理ブロックによって構成される半導体集積回路におけるダイナミック電力[P]は、以下の算出式(式2)によって求めることができる。
=αckckckck +α +α +・・・+α ・・・(式2)
Each of these blocks generally has an activation rate [α], an operating frequency [f], and a capacitance [C], and each functional block is used to calculate the power consumption of the entire semiconductor integrated circuit. It is necessary to calculate in consideration of the activation rate [α], the operating frequency [f], and the capacitance [C]. For example, as a different voltage configuration with different supply voltages for each block, it is simplified if each block operates at a constant activation rate and frequency, and one clock generation block and a plurality (n) of data processing Dynamic power [P D ] in a semiconductor integrated circuit constituted by blocks can be obtained by the following calculation formula (Formula 2).
P D = α ck f ck C ck V ck 2 + α 1 f 1 C 1 V 1 2 + α 2 f 2 C 2 V 2 2 +... + Α n f n C n V n 2 (Equation 2)

上記式(式2)において、1項目の[αckckckck ]が、クロック生成ブロックにおいて消費されるダイナミック電力であり、以下の[α ]〜[α ]が、データ処理ブロック1〜nの各々において消費されるダイナミック電力である。 In the above formula (formula 2), [α ck f ck C ck V ck 2 ] of one item is dynamic power consumed in the clock generation block, and the following [α 1 f 1 C 1 V 1 2 ] to [Α n f n C n V n 2 ] is the dynamic power consumed in each of the data processing blocks 1 to n.

上記式(式2)において、特に1項目のクロック系信号がダイナミック電力に大きなインパクトを及ぼす。これは、
=αfCV
上記式中の、
活性化率[α],
動作周波数[f]、
これらの値が、クロック生成ブロックにおいて利用されるクロック系信号では、他のデータ処理ブロック1〜nの各々において利用されるデータ系信号よりも大きいためである。
In the above formula (formula 2), one clock-related signal in particular has a great impact on dynamic power. this is,
P D = αfCV 2
In the above formula,
Activation rate [α],
Operating frequency [f],
This is because these values are larger in the clock signal used in the clock generation block than in the data signal used in each of the other data processing blocks 1 to n.

上記式(式2)における2項目以降のデータ処理ブロック項[α ]〜[α ]で示されるダイナミック電力については、データラインのセットアップタイミング制約などがあり、電圧は大きく下げ難い。すなわち、供給電圧を低下させると、例えばデータ処理回路内のフリップフロップ(FF)間のデータ転送タイミングの遅延などが発生し、処理エラーを発生させる可能性がある。 For dynamic power indicated by the data processing block terms [α 1 f 1 C 1 V 1 2 ] to [α n f n C n V n 2 ] after the second item in the above equation (Equation 2), the setup of the data line Due to timing constraints, it is difficult to reduce the voltage significantly. That is, when the supply voltage is lowered, for example, a data transfer timing delay between flip-flops (FF) in the data processing circuit may occur, which may cause a processing error.

一方、1項目のクロック項[αckckckck ]で示されるクロック生成ブロックにおいて消費されるダイナミック電力については他の機能ブロックとは独立に電圧を大きく下げることが可能である。 On the other hand, regarding the dynamic power consumed in the clock generation block indicated by one item of clock term [α ck f ck C ck V ck 2 ], the voltage can be greatly reduced independently of other functional blocks.

本発明は、かかる事情を鑑みて、データ系信号を扱うデータ処理ブロックのトランジスタの駆動電圧は低下させることなく、クロック系信号を扱うトランジスタの電圧のみを下げる構成とすることにより効率的に低消費電力を実現する。   In view of such circumstances, the present invention efficiently reduces power consumption by reducing only the voltage of the transistor handling the clock signal without reducing the drive voltage of the transistor of the data processing block handling the data signal. Realize power.

すなわち、本発明の一実施例構成は、CMOS半導体集積回路を構成する複数の機能ブロック中、
クロック信号生成を行うクロック生成ブロックを低電圧化する。
クロック生成ブロック以外のデータ処理ブロックを低電圧化しない。
このように、機能ブロックごとに供給電圧を異ならせた構成である。
That is, the configuration of an embodiment of the present invention includes a plurality of functional blocks constituting a CMOS semiconductor integrated circuit.
The voltage of the clock generation block for generating the clock signal is lowered.
Do not lower the voltage of data processing blocks other than the clock generation block.
In this way, the supply voltage is different for each functional block.

図1を参照して、本発明の一実施例であるクロック生成ブロックを選択的に低電圧化した半導体集積回路100の構成例について説明する。図1は、
1つのクロック生成ブロック110、
ローカルクロック生成ブロックとデータ処理ブロックを含む機能ブロック120,140,160、
これらの機能ブロックを持つ半導体集積回路100である。
With reference to FIG. 1, a configuration example of a semiconductor integrated circuit 100 in which a clock generation block according to an embodiment of the present invention is selectively reduced in voltage will be described. FIG.
One clock generation block 110;
Functional blocks 120, 140, 160 including a local clock generation block and a data processing block;
This is a semiconductor integrated circuit 100 having these functional blocks.

図1に示す回路構成の詳細について説明する。クロックは水晶振動子101により生成され、PLL(Phase Locked Loop)102により逓倍される。PLL102の出力クロック信号であるクロック源信号[HIF]は、グローバルクロック生成ブロック110に入力される。   Details of the circuit configuration shown in FIG. 1 will be described. The clock is generated by the crystal unit 101 and multiplied by a PLL (Phase Locked Loop) 102. A clock source signal [HIF] that is an output clock signal of the PLL 102 is input to the global clock generation block 110.

PLL102の出力するクロック源信号[HIF]は、グローバルクロック生成ブロック110内に構成された分周/CG部111〜113を介して各機能ブロック120,140,160に入力される。分周/CG部111〜113は、各機能ブロック120,140,160の処理機能に応じた分周処理(例えば機能ブロックAはa分周、機能ブロックBはb分周、機能ブロックCはc分周)と、クロックゲーティング(CG)処理を実行する。このようにして各機能ブロック120,140,160に適合するクロック信号が生成されて各機能ブロック120,140,160に入力される。   The clock source signal [HIF] output from the PLL 102 is input to the functional blocks 120, 140, and 160 via the frequency dividing / CG units 111 to 113 configured in the global clock generation block 110. The frequency division / CG units 111 to 113 perform frequency division processing according to the processing function of each functional block 120, 140, 160 (for example, functional block A is divided by a, functional block B is divided by b, and functional block C is c Frequency division) and clock gating (CG) processing. In this way, a clock signal suitable for each functional block 120, 140, 160 is generated and input to each functional block 120, 140, 160.

図1に示す3つの機能ブロック120,140,160は、いずれも、機能ブロック120,140,160内にローカルのクロック生成ブロック130,150,170を持つ回路例である。すなわち、図1に示すように、
機能ブロックA,120は、ローカルクロック生成ブロックA130を有し、
機能ブロックB,140は、ローカルクロック生成ブロックB150を有し、
機能ブロックA,160は、ローカルクロック生成ブロックC170を有している。
また機能ブロックとは別に電源電圧をコントロールする電力制御ブロック190が設定されている。
Each of the three functional blocks 120, 140, and 160 shown in FIG. 1 is a circuit example having local clock generation blocks 130, 150, and 170 in the functional blocks 120, 140, and 160. That is, as shown in FIG.
The functional blocks A and 120 have a local clock generation block A130.
The functional blocks B and 140 have a local clock generation block B150.
The functional blocks A and 160 have a local clock generation block C170.
In addition to the functional block, a power control block 190 for controlling the power supply voltage is set.

本例では、
グローバルクロック生成ブロック110、
ローカルクロック生成ブロックA130、
ローカルクロック生成ブロックB150、
ローカルクロック生成ブロックC170、
これらのクロック生成ブロックに対する供給電圧を低電圧化(例えば0.8V)に設定し、
これらのクロック生成ブロックからクロック供給を受けてデータ処理を実行するデータ処理プロック、すなわち、
データ処理ブロックA−1,121、
データ処理ブロックA−2,122、
データ処理ブロックB−1,141、
データ処理ブロックB−2,142、
データ処理ブロックC−1,161、
データ処理ブロックC−2,162、
これらのデータ処理ブロックに対する供給電圧を高電圧(例えば1.2V)に設定する。
In this example,
Global clock generation block 110,
Local clock generation block A130,
Local clock generation block B150,
Local clock generation block C170,
Set the supply voltage for these clock generation blocks to low voltage (for example, 0.8V),
Data processing block that receives data from these clock generation blocks and executes data processing, that is,
Data processing blocks A-1, 121,
Data processing blocks A-2, 122,
Data processing blocks B-1, 141,
Data processing blocks B-2, 142,
Data processing blocks C-1, 161,
Data processing blocks C-2, 162,
The supply voltage for these data processing blocks is set to a high voltage (eg, 1.2 V).

図1に示す構成では、電力制御ブロック190からは、コンスタントに1.2Vが出力され、電圧コントロール信号により、各機能ブロックに対する供給電圧を自在に変えることが出来る設定としている。すなわち、電力制御ブロック190の出力1.2V電圧は、電圧コントロール信号による制御によって例えば0.8Vの低電圧化がなされて、各機能ブロック、すなわち、グローバルクロック生成ブロック110と、各機能ブロック120,140,160に供給される。   In the configuration shown in FIG. 1, 1.2V is constantly output from the power control block 190, and the supply voltage to each functional block can be freely changed by a voltage control signal. That is, the output 1.2V voltage of the power control block 190 is reduced to, for example, 0.8V by the control by the voltage control signal, so that each functional block, that is, the global clock generation block 110, each functional block 120, 140, 160.

また、データ処理ブロック121,122,141,142,161,162に対する供給電圧は、各機能ブロック120,140,160のローカルクロック生成ブロック130,150,170に設定されたレベルシフタ等により昇圧(例えば0.8V→1.2V)する構成として、高電圧(1.2V)をデータ処理ブロック121,122,141,142,161,162に供給する構成としている。   The supply voltage to the data processing blocks 121, 122, 141, 142, 161, 162 is boosted by a level shifter or the like set in the local clock generation blocks 130, 150, 170 of the function blocks 120, 140, 160 (for example, 0). .8V → 1.2V), a high voltage (1.2V) is supplied to the data processing blocks 121, 122, 141, 142, 161, 162.

図に示すように、データ処理ブロック121,122,141,142,161,162は、ローカルクロック生成ブロック130,150,170からデータ処理ブロックに対するクロック信号の入力部に設定された昇圧部(レベルシフタ)を介して、昇圧されたクロック信号の供給を受ける構成となっている。   As shown in the figure, the data processing blocks 121, 122, 141, 142, 161, 162 are boosting units (level shifters) set as input portions of clock signals from the local clock generation blocks 130, 150, 170 to the data processing blocks. In this configuration, the boosted clock signal is supplied via the.

すなわち、本実施例の構成では、クロック系信号のみを有するブロックを低電圧化し、クロックが他ブロックに入力されるときにクロック信号をレベルシフタ等により昇圧する。このように、本実施例では「グローバルクロック生成ブロック110」、「ローカルクロック生成ブロックA130」、「ローカルクロック生成ブロックB150」、「ローカルクロック生成ブロックC170」を例えば0.8Vの低電圧とし、その他の部分を1.2Vの高電圧に設定する構成としている。   That is, in the configuration of this embodiment, the voltage of the block having only the clock signal is lowered, and the clock signal is boosted by a level shifter or the like when the clock is input to another block. Thus, in this embodiment, the “global clock generation block 110”, “local clock generation block A130”, “local clock generation block B150”, and “local clock generation block C170” are set to a low voltage of, for example, 0.8 V, and the others This portion is set to a high voltage of 1.2V.

1.2Vの高電圧に設定されるのは、各機能ブロック120,140,160内において、ローカルクロック生成ブロックからクロック供給を受けてデータ処理を実行する例えばフリップフロップなどによって構成されるデータ処理回路を持つデータ処理ブロック121,122,141,142,161,162である。   The high voltage of 1.2 V is set in a data processing circuit constituted by, for example, a flip-flop that receives data from the local clock generation block and executes data processing in each functional block 120, 140, 160 Are data processing blocks 121, 122, 141, 142, 161, 162.

図1に示す構成では、
機能ブロックA,120内のローカルクロック生成ブロックA130からクロック供給を受けてデータ処理を実行する機能ブロックA−1,121,A−2,122、
機能ブロックB,140内のローカルクロック生成ブロックB150からクロック供給を受けてデータ処理を実行する機能ブロックB−1,141,B−2,142、
機能ブロックC,160内のローカルクロック生成ブロックC170からクロック供給を受けてデータ処理を実行する機能ブロックC−1,161,C−2,162、
これらのデータ処理回路には、高電圧(例えば1.2V)が供給される。
In the configuration shown in FIG.
Functional blocks A-1, 121, A-2, 122, which receive data from the local clock generation block A130 in the functional blocks A, 120 and execute data processing;
Functional blocks B-1, 141, B-2, 142 that receive data from the local clock generation block B150 in the functional blocks B, 140 and execute data processing;
Functional blocks C-1, 161, C-2, 162 that receive data from the local clock generation block C170 in the functional blocks C, 160 and execute data processing;
These data processing circuits are supplied with a high voltage (eg, 1.2 V).

この設定により、グローバルクロック生成ブロックおよびローカルクロック生成ブロックのすべては、低電圧(0.8V)により駆動され、クロック生成ブロックからのクロック供給を受けてデータ処理を実行するデータ処理回路としてのデータ処理ブロックには高電圧(1.2V)が供給されることになる。   With this setting, all of the global clock generation block and the local clock generation block are driven by a low voltage (0.8 V), and data processing as a data processing circuit that executes data processing upon receiving a clock supply from the clock generation block A high voltage (1.2 V) is supplied to the block.

データ処理ブロック121,122,141,142,161,162では、高い動作周波数によるデータ処理が要求される場合があり、低電圧化を行うと処理遅延などによる処理エラーが発生する恐れがあるが、本実施例の構成では、データ処理ブロック121,122,141,142,161,162は高電圧で駆動されることになり、高い動作周波数による高い処理能力を発揮することが可能となる。なお、処理シーケンスの具体例については後述する。   In the data processing blocks 121, 122, 141, 142, 161, 162, data processing at a high operating frequency may be required, and if the voltage is lowered, a processing error due to processing delay may occur. In the configuration of this embodiment, the data processing blocks 121, 122, 141, 142, 161, 162 are driven at a high voltage, and a high processing capability with a high operating frequency can be exhibited. A specific example of the processing sequence will be described later.

本実施例では、このような各機能ブロックに対する供給電圧の選択的変更、すなわちクロック信号生成ブロックのみを低電圧化する設定により、半導体集積回路全体の消費電力の低減を実現し、かつ高い動作周波数によるデータ処理も実行可能とした構成が実現している。   In this embodiment, by selectively changing the supply voltage for each functional block, that is, by setting only the clock signal generation block to a low voltage, the power consumption of the entire semiconductor integrated circuit is reduced, and a high operating frequency is achieved. The configuration that can execute the data processing by is realized.

本実施例の半導体集積回路のダイナミック電力[P]は、前述の式(式2)における1項目のクロック生成ブロックにおいて消費されるダイナミック電力[αckckckck ]に含まれる
動作電圧:Vckを減少(例えば1.2V→0.8V)させたものとなり、上記式(式2)における機能ブロック1〜nの各々において消費されるダイナミック電力[α ]〜[α ]に比較して大きい値となるクロック生成ブロックにおける、
活性化率[αck],
動作周波数[fck]、
これらを含む第一項の値を減少させたものとなり、結果として、半導体集積回路全体の消費電力削減が実現される。
The dynamic power [P D ] of the semiconductor integrated circuit according to the present embodiment is included in the dynamic power [α ck f ck C ck V ck 2 ] consumed in the clock generation block of one item in the above-described formula (Formula 2). Operating voltage: V ck is decreased (for example, 1.2 V → 0.8 V), and dynamic power [α 1 f 1 C 1 V consumed in each of the functional blocks 1 to n in the above formula (Formula 2) 1 2 ] to [α n f n C n V n 2 ] in the clock generation block having a large value,
Activation rate [α ck ],
Operating frequency [f ck ],
As a result, the power consumption of the entire semiconductor integrated circuit can be reduced.

なお、前述したように、図1に示す構成では、電力制御ブロック190からは、コンスタントに1.2Vが出力され、電圧コントロール信号によりクロック生成ブロック110の電圧を自在に変えることが出来る設定としている。例えばクロックスキュー、クロックジッタ等の制約が厳しい場合には0.8Vが供給されているクロック生成ブロック110の電圧を電圧コントロール信号により1.2Vとしたり、クロック系電圧を更に下げることが可能な場合はクロック電圧を0.6Vとしたりすることができる。なお、電圧コントロール信号を省略し、常にクロック生成ブロックには0.8Vを供給する構成にしてもよい。   As described above, in the configuration shown in FIG. 1, the power control block 190 constantly outputs 1.2V, and the voltage of the clock generation block 110 can be freely changed by the voltage control signal. . For example, when restrictions such as clock skew and clock jitter are severe, the voltage of the clock generation block 110 to which 0.8V is supplied can be set to 1.2V by the voltage control signal, or the clock system voltage can be further reduced. The clock voltage can be set to 0.6V. Note that the voltage control signal may be omitted, and 0.8 V may be always supplied to the clock generation block.

本実施例は特に「データのトグル回数は少ないがクロックの活性化率、動作周波数が高い」デザインまたは「機能ブロックに対するクロック生成ブロックの規模が大きい」デザインに適用すると、より大きな消費電力削減を見込むことができる。   This embodiment is expected to reduce power consumption even more when applied to designs with a small number of data toggles but a high clock activation rate and a high operating frequency or designs with a large clock generation block size for functional blocks. be able to.

次に、図2を参照して本発明の第2実施例の半導体集積回路の構成について説明する。第2実施例は、図1を参照して説明した構成より、さらに低消費電力化を実現する構成である。   Next, the configuration of the semiconductor integrated circuit according to the second embodiment of the present invention will be described with reference to FIG. The second embodiment is a configuration that realizes lower power consumption than the configuration described with reference to FIG.

まず、この第2実施例の背景について説明する。近年の半導体集積回路においては、クロックツリーシンセシス(CTS)という手法が広く用いられている。これは、半導体集積回路内に設定される各データ処理回路に対してクロック信号を供給するための経路として設定されるクロックラインに適切にCTSバッファを挿入することにより、チップ内の様々な位置に配置されるデータ処理回路内のフリップフロップ(FF)に供給されるクロックの遅延時間を調整してセットアップやホールドタイムを確保することにより、フリップフロップ(FF)間のデータのやりとりが適切なタイミングで行えるようにするものである。昨今のゲート規模の増加により、CTSバッファ数も非常に多くなっており、このバッファ群の電力を抑えることが肝要である。   First, the background of the second embodiment will be described. In recent semiconductor integrated circuits, a technique called clock tree synthesis (CTS) is widely used. This is because the CTS buffer is appropriately inserted into a clock line set as a path for supplying a clock signal to each data processing circuit set in the semiconductor integrated circuit, so that it can be placed at various positions in the chip. By adjusting the delay time of the clock supplied to the flip-flop (FF) in the arranged data processing circuit to ensure the setup and hold time, the data exchange between the flip-flops (FF) can be performed at an appropriate timing. It is something that can be done. Due to the recent increase in the gate scale, the number of CTS buffers has become very large, and it is important to suppress the power of this buffer group.

第2実施例はこのような事情を鑑みた実施形態である。第2実施例について図2を参照して説明する。図2は、図1に示す1つの機能ブロックの構成、例えば機能ブロック120に相当する構成を示している。図2に示す機能ブロック200の全体が、図1に示す1つの機能ブロック120に対応する。   The second example is an embodiment in view of such circumstances. A second embodiment will be described with reference to FIG. FIG. 2 shows the configuration of one functional block shown in FIG. 1, for example, the configuration corresponding to the functional block 120. The entire functional block 200 shown in FIG. 2 corresponds to one functional block 120 shown in FIG.

図1に示す半導体集積回路内のグローバルクロック生成ブロック110の分周/CG部111において、分周及びクロックゲーティング(CG)が実行された後のクロック信号が、図2に示す機能ブロック200内のローカルクロック生成ブロック210に入力され、ローカルの分周及びクロックゲーティング(CG)が分周/CG部211,212で実行された後、機能ブロック200内に構成されたデータ処理ブロックA−1,220、機能ブロックA−2,230に入力される。   In the frequency division / CG unit 111 of the global clock generation block 110 in the semiconductor integrated circuit shown in FIG. 1, the clock signal after frequency division and clock gating (CG) is executed is the function block 200 shown in FIG. After the local frequency division and clock gating (CG) are executed by the frequency division / CG units 211 and 212, the data processing block A-1 configured in the functional block 200 is input to the local clock generation block 210. 220, and functional blocks A-2 and 230.

この実施例2でも、先に図1を参照して説明した実施例1と同様、クロック生成処理を実行するグローバルクロック生成ブロックと、ローカルクロック生成ブロックは低電圧化(例えば0.8V)した構成である。本実施例では、さらに、これらのクロック生成ブロックに加えて、データ処理ブロック内の一部の回路についても低電圧(例えば0.8V)で動作させる構成としている。   Also in the second embodiment, as in the first embodiment described above with reference to FIG. 1, the global clock generation block that executes the clock generation processing and the local clock generation block have a low voltage (for example, 0.8 V). It is. In this embodiment, in addition to these clock generation blocks, some circuits in the data processing block are also operated at a low voltage (for example, 0.8 V).

図2には、機能ブロック200内に構成された2つのデータ処理ブロックA−1,220、データ処理ブロックA−2,230を示している。これらは、図1に示すデータ処理ブロックA−1,121、データ処理ブロックA−2,122に対応する。   FIG. 2 shows two data processing blocks A- 1 and 220 and data processing blocks A- 2 and 230 configured in the functional block 200. These correspond to the data processing blocks A-1 and 121 and the data processing blocks A-2 and 122 shown in FIG.

図2には、データ処理ブロックA−1,220のみを拡大して詳細回路を示している。なおデータ処理ブロックA−2,230もこの拡大詳細図とほぼ同様の構成を有する。   FIG. 2 shows a detailed circuit in which only the data processing blocks A-1 and 220 are enlarged. Note that the data processing blocks A-2 and 230 also have substantially the same configuration as this enlarged detailed view.

本実施例では、データ処理ブロックを複数の領域に分割して、分割領域単位で異なる電圧供給を行う構成としている。図2に示すように、データ処理ブロックA−1,220は、CTSバッファを備えたクロックツリー部221と、クロックツリー部221からクロックの供給を受けてデータ処理を行うフリップフロップ(FF)を備えたデータ処理回路部222に分割される。   In this embodiment, the data processing block is divided into a plurality of areas, and a different voltage is supplied for each divided area. As shown in FIG. 2, each of the data processing blocks A-1 and 220 includes a clock tree unit 221 having a CTS buffer, and a flip-flop (FF) that receives a clock from the clock tree unit 221 and performs data processing. The data processing circuit unit 222 is divided.

本実施例では、CTSバッファを備えたクロックツリー部221を低電圧(例えば0.8V)化し、フリップフロップ(FF)を備えたデータ処理回路部222は通常の電圧(1.2V)供給を行う構成としている。   In this embodiment, the clock tree unit 221 including the CTS buffer is reduced in voltage (for example, 0.8 V), and the data processing circuit unit 222 including the flip-flop (FF) supplies a normal voltage (1.2 V). It is configured.

CTSバッファを備えたクロックツリー部221は、前述のように、チップ内の様々な位置に配置されるフリップフロップ(FF)に供給されるクロックの遅延時間を調整しセットアップや、ホールドタイムを確保することにより、フリップフロップ(FF)間のデータのやりとりが適切なタイミングで行えるようにするために構成されるものであり、それぞれのフリップフロップ構成部に入力する経路上に複数のCTSバッファ251を備え、CTSバッファ251の数によってデータ処理回路部222内のフリップフロップ(FF)に対するクロック入力タイミングを調整する構成としている。   As described above, the clock tree unit 221 provided with the CTS buffer adjusts the delay time of the clock supplied to the flip-flops (FF) arranged at various positions in the chip to ensure the setup and hold time. Thus, data is exchanged between flip-flops (FF) at an appropriate timing, and a plurality of CTS buffers 251 are provided on a path to be input to each flip-flop constituting unit. The clock input timing for the flip-flop (FF) in the data processing circuit unit 222 is adjusted according to the number of CTS buffers 251.

フリップフロップ(FF)を備えたデータ処理回路部222に入力する最終段のCTSバッファ261〜263の出力は、レベルシフタ241〜243に入力され、クロックラインはフリップフロップ(FF)に対する入力直前に昇圧される。すなわち、例えば0.8Vから1.2Vに昇圧されてフリップフロップ(FF)に入力される。   The outputs of the final stage CTS buffers 261 to 263 that are input to the data processing circuit unit 222 including the flip-flop (FF) are input to the level shifters 241 to 243, and the clock line is boosted immediately before the input to the flip-flop (FF). The That is, for example, the voltage is boosted from 0.8V to 1.2V and input to the flip-flop (FF).

本実施例では、図2に示すように、複数のフリップフロップ(FF)、例えば8個のFFに対応して一つのレベルシフタを設定して、複数のフリップフロップ(FF)に対する入力電圧を1つのレベルシタによって昇圧する構成としている。   In this embodiment, as shown in FIG. 2, one level shifter is set corresponding to a plurality of flip-flops (FF), for example, 8 FFs, and an input voltage to the plurality of flip-flops (FF) is set to one. The voltage is boosted by a level shifter.

一つのフリップフロップ(FF)各々に対して一つのレベルシフタを設定して昇圧処理を行う構成としてもよいが、このようにすると電力、面積の観点から効率的ではないため、複数のフリップフロップ(FF)(例えば8個のFF)につき一つのレベルシフタで昇圧する構成としている。従って「複数のクロックビットをまとめてクロックゲーティングする」時と同じ要領で、レベルシフタがフリップフロップ(FF)を駆動できる範囲で(ファンアウト数に無理のない範囲で)最小ビット幅を指定することでレベルシフタのセル数を最適化する。   A configuration may be adopted in which one level shifter is set for each flip-flop (FF) to perform boosting processing. However, since this is not efficient from the viewpoint of power and area, a plurality of flip-flops (FF) ) (For example, 8 FFs), one level shifter boosts the voltage. Therefore, specify the minimum bit width within the range in which the level shifter can drive the flip-flop (FF) in the same way as when “clock gating multiple clock bits together” To optimize the number of level shifter cells.

本実施例では、クロックツリー部221内のCTSバッファ群も全て低電圧(0.8V)で駆動させる構成であり。これによりクロックツリーの末端まで含んだ膨大な数のCTSバッファが全て低電圧でトグルすることになるため電圧削減効果は非常に大きい。   In this embodiment, all the CTS buffer groups in the clock tree unit 221 are also driven at a low voltage (0.8 V). As a result, the huge number of CTS buffers including the end of the clock tree are all toggled at a low voltage, so the voltage reduction effect is very large.

また、通常CTS処理によるクロックスキューの最適化では、クロック供給源からフリップフロップ(FF)へ直接クロックを供給する末端のバッファセル(最終段バッファセル)までのクロック配線遅延を均一化しようとするが、本発明においてはクロック供給源からレベルシフタセルまでのクロックスキューを最適化する構成としている。   Further, in the optimization of the clock skew by the normal CTS processing, the clock wiring delay from the clock supply source to the terminal buffer cell (final stage buffer cell) that supplies the clock directly to the flip-flop (FF) is attempted to be uniform. In the present invention, the clock skew from the clock supply source to the level shifter cell is optimized.

すなわち、クロックツリー部は複数のCTSバッファによるクロックスキュー調整を行う回路として設定されるが、本発明の構成では、クロック信号供給源から昇圧部(レベルシフタ)までの経路におけるクロックスキューを考慮したCTSバッファ設定構成を有する。このためクロックが供給されるフリップフロップ(FF)はレベルシフタセルの近くに配置されることが望ましい。   That is, the clock tree unit is set as a circuit that performs clock skew adjustment by a plurality of CTS buffers. In the configuration of the present invention, a CTS buffer that takes into account the clock skew in the path from the clock signal supply source to the booster unit (level shifter). It has a setting configuration. For this reason, it is desirable that the flip-flop (FF) to which the clock is supplied be arranged near the level shifter cell.

クロックが供給されるフリップフロップ(FF)をレベルシフタセルの近くに配置した物理レイアウトの例について図3を参照して説明する。図3は、図2に示すデータ処理回路222内の8つのフリップフロップ(FF)と、データ処理回路222に接続されるレベルシフタ243の物理レイアウトを示している。図3は半導体集積回路の一部の平面図である。   An example of a physical layout in which a flip-flop (FF) to which a clock is supplied is arranged near the level shifter cell will be described with reference to FIG. FIG. 3 shows a physical layout of the eight flip-flops (FF) in the data processing circuit 222 shown in FIG. 2 and the level shifter 243 connected to the data processing circuit 222. FIG. 3 is a plan view of a part of the semiconductor integrated circuit.

レベルシフタ243は、クロックツリー部221の最終段のCTSバッファ263からクロック供給がなされ、クロック情報をデータ処理回路222内の8つのフリップフロップ(FF)に供給し、フリップフロップ(FF)間のデータ転送タイミングを制御する構成となっている。この構成により、レベルシフタセルから8つのフリップフロップ(FF)に対する配線遅延は均一化されることになり、クロック供給源からレベルシフタセルまでのクロックスキューの最適化と併せて、クロックが供給されるフリップフロップ(FF)は、クロック供給タイミングが均一化されることになる。   The level shifter 243 is supplied with a clock from the CTS buffer 263 at the final stage of the clock tree unit 221, supplies clock information to the eight flip-flops (FF) in the data processing circuit 222, and transfers data between the flip-flops (FF). The timing is controlled. With this configuration, the wiring delay from the level shifter cell to the eight flip-flops (FF) is made uniform, and in addition to the optimization of the clock skew from the clock supply source to the level shifter cell, the flip-flop to which the clock is supplied In (FF), the clock supply timing is made uniform.

また、本実施例では低電圧の0.8Vで駆動されるCTSバッファや、0.8Vから1.2Vに昇圧されるレベルシフタが機能ブロック内に散らばって配置されるため、0.8V、1.2Vの2系統の電源を有するセルライブラリを用意し、ロジック領域全体に2系統の電源レールを走らせる設定としている。図3に示す0.8V電源レール311、1.25電源レール312である。   In this embodiment, CTS buffers driven at a low voltage of 0.8V and level shifters boosted from 0.8V to 1.2V are arranged scattered in the functional block. A cell library having two power supplies of 2V is prepared, and two power supply rails are set to run in the entire logic area. These are the 0.8V power rail 311 and the 1.25 power rail 312 shown in FIG.

図3左側に示す最終段CTSバッファ263から出力されるクロック信号はレベルシフタ243で昇圧され、隣接して配置された8個のフリップフロップ(FF_1〜FF_8)にクロック信号が送られる。レベルシフタからフリップフロップ(FF)までの配線遅延はCTS処理されていないためクロックスキューに影響を及ぼすが、図3に示すように8つのフリップフロップ(FF)をレベルシフタ243に隣接して配置する構成とすることによりレベルシフタ243から8つのフリップフロップ(FF)までの配線遅延を均等化、最小化することができる。   The clock signal output from the final stage CTS buffer 263 shown on the left side of FIG. 3 is boosted by the level shifter 243 and sent to eight flip-flops (FF_1 to FF_8) arranged adjacent to each other. The wiring delay from the level shifter to the flip-flop (FF) is not subjected to CTS processing and thus affects the clock skew. As shown in FIG. 3, eight flip-flops (FF) are arranged adjacent to the level shifter 243. By doing so, the wiring delay from the level shifter 243 to the eight flip-flops (FF) can be equalized and minimized.

以上、図1〜図3を参照して本発明の複数の実施例の構成について説明した。第1実施例、第2実施例とも、データ処理を実行するデータ処理回路には高電圧(例えば1.2V)を供給し、
実施例1は、
グローバルクロック生成ブロックと、ローカルクロック生成ブロックを低電圧化し、
実施例2は、
グローバルクロック生成ブロックと、ローカルクロック生成ブロックを低電圧化するとともに、さらに、データ処理ブロック内に構成されたクロックツリー部をも低電圧化したクロックネットワーク全体の低電圧化を行った構成である。
The configuration of the embodiments of the present invention has been described above with reference to FIGS. In both the first embodiment and the second embodiment, a high voltage (for example, 1.2 V) is supplied to the data processing circuit that executes data processing.
Example 1
Reduce the voltage of the global clock generation block and local clock generation block,
Example 2
In this configuration, the global clock generation block and the local clock generation block are reduced in voltage, and the voltage of the entire clock network is reduced by reducing the voltage of the clock tree portion configured in the data processing block.

いずれの実施例構成においてもクロック信号の供給を受けてデータ処理を実行するデータ処理回路については低電圧化を行っていない。このような構成により、消費電力の低減を実現するとともにデータ処理回路における高い動作周波数でのデータ処理を可能とした構成を実現している。   In any of the embodiments, the voltage of the data processing circuit that receives the clock signal and executes the data processing is not reduced. With such a configuration, a configuration is realized in which power consumption can be reduced and data processing can be performed at a high operating frequency in the data processing circuit.

本発明の構成において高い動作周波数でのデータ処理が可能であることについて、従来の技術、すなわち機能ブロック全体を低電圧化する構成と比較して説明する。
以下、図4〜図6を参照して、
本発明の構成、すなわち、クロック生成ブロック、またはクロック生成ブロックとクロックツリーを含むクロックネットワークを選択的に低電圧化し、データ処理ブロックまたはデータ処理部を高電圧に維持する構成とした本発明の構成と、
従来型の低消費電力構成、すなわち、データ処理回路を含む全体回路を低電圧化した従来構成、
これらの構成における処理について対比して説明する。
The fact that data processing at a high operating frequency is possible in the configuration of the present invention will be described in comparison with the conventional technology, that is, the configuration in which the entire functional block is reduced in voltage.
Hereinafter, referring to FIGS.
Configuration of the present invention, that is, configuration of the present invention configured to selectively lower the voltage of the clock generation block or the clock network including the clock generation block and the clock tree and maintain the data processing block or data processing unit at a high voltage When,
Conventional low power consumption configuration, that is, a conventional configuration in which the entire circuit including the data processing circuit is reduced in voltage,
The processing in these configurations will be described in comparison.

図4にデータ処理回路の回路例として、2つのフリップフロップ(FF1)401、フリップフロップ(FF2)402間で信号の受け渡しを行う回路構成を示す。   FIG. 4 shows a circuit configuration for transferring signals between two flip-flops (FF1) 401 and flip-flop (FF2) 402 as a circuit example of the data processing circuit.

2つのフリップフロップ(FF1)401、フリップフロップ(FF2)402は、入力するクロック信号[CLK]によってタイミングを制御してデータ入出力を行う。   The two flip-flops (FF1) 401 and the flip-flop (FF2) 402 perform data input / output by controlling the timing according to the input clock signal [CLK].

まず、フリップフロップ(FF1)401に取り込まれたデータ(DATA)は、クロック信号[CLK]の立ち上がりでフリップフロップ(FF1)401からDATA_D_1として出力する。   First, data (DATA) taken into the flip-flop (FF1) 401 is output from the flip-flop (FF1) 401 as DATA_D_1 at the rising edge of the clock signal [CLK].

通常フリップフロップ(FF)間のデータラインには組み合わせ回路が入っているため、フリップフロップ(FF1)401からの出力データ[DATA_D_1]は、パスの長さに応じた遅延時間を持ったデータ[DATA_D_2]の信号となって次のフリップフロップ(FF2)402に取り込まれる。フリップフロップ(FF2)402に取り込まれた信号は、クロック信号[CLK]の立ち上がりで[DATA_2D]として、フリップフロップ(FF2)402から出力される。   Since the data line between the flip-flops (FF) normally includes a combinational circuit, the output data [DATA_D_1] from the flip-flop (FF1) 401 is data [DATA_D_2] having a delay time corresponding to the path length. ] Is taken into the next flip-flop (FF2) 402. The signal taken into the flip-flop (FF2) 402 is output from the flip-flop (FF2) 402 as [DATA_2D] at the rising edge of the clock signal [CLK].

従来の技術、つまり機能ブロック全体を低電圧化する手法を適用した場合の上記回路のタイミングチャートを図5に示す。図5には、
(1)クロック生成ブロック、データ処理ブロックとも高電圧に設定した場合のタイミングチャート、
(2)クロック生成ブロック、データ処理ブロックとも低電圧に設定した場合のタイミングチャート、
これらの2つのタイミングチャートを示している。
FIG. 5 shows a timing chart of the above circuit in the case where a conventional technique, that is, a technique for reducing the voltage of the entire functional block is applied. In FIG.
(1) Timing chart when clock generation block and data processing block are set to high voltage,
(2) Timing chart when the clock generation block and the data processing block are set to low voltage,
These two timing charts are shown.

図5(1),(2)とも、上から、
(a)クロック信号:(a1)クロックパルス源信号と、(a2)データ処理プロックに対する入力クロック信号
(b)前段フリップフロップ(FF)401に対するデータ[DATA]入力タイミング
(c)前段フリップフロップ(FF)401からのデータ[DATA_D_1]出力タイミング
(d)後段フリップフロップ(FF)402に対するデータ[DATA_D_2]入力タイミング
(e)後段フリップフロップ(FF)402からのデータ[DATA_2D]出力タイミング
これらの各タイミングを示している。
5 (1) and (2) from above,
(A) Clock signal: (a1) Clock pulse source signal and (a2) Input clock signal for data processing block (b) Data [DATA] input timing to previous stage flip-flop (FF) 401 (c) Previous stage flip-flop (FF ) Data [DATA_D_1] output timing from 401 (d) Data [DATA_D_2] input timing to the subsequent flip-flop (FF) 402 (e) Data [DATA_2D] output timing from the subsequent flip-flop (FF) 402 Show.

図5(1),(2)において、それぞれデータ[D]の移動タイミングを点線矢印で示している。   5 (1) and 5 (2), the movement timing of the data [D] is indicated by dotted arrows.

まず、図5(1)に示す高電圧に設定した場合のタイミングチャートについて説明する。時間[T1]以前に、データ[D]が前段フリップフロップ(FF)401に保持されており、
(b)前段フリップフロップ(FF)401に対するデータ[DATA]入力タイミング
に示すように時間[T2]において、クロック信号の立ち上がりに応じて、前段フリップフロップ(FF)401から出力される。
この出力タイミングは、時間[T2]である。
時間[T1]〜[T2]は、クロック信号が所定の電圧レベルに到達するために必要となる遅延時間[td_clk_hiv_old]である。この遅延時間は、クロック生成ブロックの駆動電圧に応じて変化する。
First, a timing chart in the case where the high voltage shown in FIG. Before the time [T1], the data [D] is held in the previous flip-flop (FF) 401,
(B) The data [DATA] input timing to the preceding flip-flop (FF) 401 is output from the preceding flip-flop (FF) 401 in response to the rising edge of the clock signal at time [T2] as shown in FIG.
This output timing is time [T2].
Times [T1] to [T2] are delay times [td_clk_hiv_old] required for the clock signal to reach a predetermined voltage level. This delay time changes according to the drive voltage of the clock generation block.

(c)前段フリップフロップ(FF)401からのデータ[DATA_D_1]出力に示す時間[T2]で、出力されたデータ[D]は、
(d)後段フリップフロップ(FF)402に対するデータ[DATA_D_2]入力タイミング
に示すように、時間[T3]において、後段フリップフロップ(FF)402に入力される。
時間[T2]〜[T3]は、前段フリップフロップ(FF)401と、後段フリップフロップ(FF)402とのパスの長さに応じた遅延時間[td_data_hiv_old]である。この遅延時間は、データ処理ブロックにおける駆動電圧に応じて変化する。
(C) At the time [T2] shown in the data [DATA_D_1] output from the previous stage flip-flop (FF) 401, the output data [D]
(D) As shown in data [DATA_D_2] input timing to the subsequent flip-flop (FF) 402, the data is input to the subsequent flip-flop (FF) 402 at time [T3].
Times [T2] to [T3] are delay times [td_data_hiv_old] corresponding to the path length between the front-stage flip-flop (FF) 401 and the rear-stage flip-flop (FF) 402. This delay time changes according to the drive voltage in the data processing block.

後段フリップフロップ(FF)402に入力されたデータ[D]は、
(e)後段フリップフロップ(FF)402からのデータ[DATA_2D]出力タイミング
に示すように、時間[T5]において、後段フリップフロップ(FF)402から出力される。
The data [D] input to the subsequent flip-flop (FF) 402 is
(E) As shown in data [DATA_2D] output timing from the subsequent stage flip-flop (FF) 402, it is output from the subsequent stage flip-flop (FF) 402 at time [T5].

ここで、
(d)後段フリップフロップ(FF)402に対するデータ[DATA_D_2]入力タイミング[T3]と、
(e)後段フリップフロップ(FF)402からのデータ[DATA_2D]出力タイミング[T5]、
この[T3]〜[T5]の期間が、セットアップタイム[ts_hiv_old]である。
here,
(D) Data [DATA_D_2] input timing [T3] to the subsequent flip-flop (FF) 402;
(E) Data [DATA_2D] output timing [T5] from the subsequent flip-flop (FF) 402,
The period from [T3] to [T5] is the setup time [ts_hiv_old].

図5(1)に示すように、クロック生成ブロックおよびデータ処理ブロックの双方に高電圧供給を行う設定では、比較的長いセットアップタイム[ts_hiv_old]が確保可能となる。   As shown in FIG. 5A, in a setting in which a high voltage is supplied to both the clock generation block and the data processing block, a relatively long setup time [ts_hiv_old] can be secured.

次に、図5(2)に示すシーケンス、すなわち、クロック生成ブロック、データ処理ブロックとも低電圧に設定した場合のタイミングチャートについて説明する。   Next, the sequence shown in FIG. 5 (2), that is, a timing chart when the clock generation block and the data processing block are set to a low voltage will be described.

時間[t1]以前に、データ[D]が前段フリップフロップ(FF)401に保持されており、
(b)前段フリップフロップ(FF)401に対するデータ[DATA]入力タイミング
に示すように時間[t2]において、クロック信号の立ち上がりに応じて、前段フリップフロップ(FF)401から出力される。
この出力タイミングは、時間[t2]である。
時間[t1]〜[t2]は、クロック信号が所定の電圧レベルに到達するために必要となる遅延時間[td_clk_lov_old]である。前述したように、この遅延時間は、クロック生成ブロックの駆動電圧に応じて変化する。
Before the time [t1], the data [D] is held in the previous flip-flop (FF) 401,
(B) The data [DATA] input timing to the previous flip-flop (FF) 401 is output from the previous flip-flop (FF) 401 in response to the rising edge of the clock signal at time [t2].
This output timing is time [t2].
Times [t1] to [t2] are delay times [td_clk_lov_old] necessary for the clock signal to reach a predetermined voltage level. As described above, this delay time changes according to the driving voltage of the clock generation block.

高電圧設定とした図5(1)の時間[T1]〜[T2]に比較して、低電圧設定とした図5(2)の時間[t1]〜[t2]は長くなっている。これは、クロック生成ブロックに対する供給電圧の低下に伴う現象である。   Compared with the time [T1] to [T2] in FIG. 5 (1) in which the high voltage is set, the time [t1] to [t2] in FIG. 5 (2) in which the low voltage is set is longer. This is a phenomenon associated with a decrease in supply voltage to the clock generation block.

次に、
(c)前段フリップフロップ(FF)401からのデータ[DATA_D_1]出力に示す時間[t2]で、出力されたデータ[D]は、
(d)後段フリップフロップ(FF)402に対するデータ[DATA_D_2]入力タイミング
に示すように、時間[t3]において、後段フリップフロップ(FF)402に入力される。
時間[t2]〜[t3]は、前段フリップフロップ(FF)401と、後段フリップフロップ(FF)402とのパスの長さに応じた遅延時間[td_data_lov_old]である。この遅延時間は、前述したように、データ処理ブロックにおける駆動電圧に応じて変化する。
next,
(C) At the time [t2] shown in the data [DATA_D_1] output from the previous stage flip-flop (FF) 401, the output data [D]
(D) As shown in data [DATA_D_2] input timing to the subsequent flip-flop (FF) 402, the data is input to the subsequent flip-flop (FF) 402 at time [t3].
Times [t2] to [t3] are delay times [td_data_lov_old] corresponding to the path length between the front-stage flip-flop (FF) 401 and the rear-stage flip-flop (FF) 402. As described above, this delay time changes according to the drive voltage in the data processing block.

高電圧設定とした図5(1)の時間[T2]〜[T3]に比較して、低電圧設定とした図5(2)の時間[t2]〜[t3]は長くなっている。これは、データ処理ブロックに対する供給電圧の低下に伴う現象である。   Compared with the time [T2] to [T3] in FIG. 5 (1) in which the high voltage is set, the time [t2] to [t3] in FIG. 5 (2) in which the low voltage is set is longer. This is a phenomenon associated with a decrease in the supply voltage to the data processing block.

後段フリップフロップ(FF)402に入力されたデータ[D]は、
(e)後段フリップフロップ(FF)402からのデータ[DATA_2D]出力タイミング
に示すように、時間[t5]において、後段フリップフロップ(FF)402から出力される。
The data [D] input to the subsequent flip-flop (FF) 402 is
(E) As shown in data [DATA_2D] output timing from the subsequent stage flip-flop (FF) 402, it is output from the subsequent stage flip-flop (FF) 402 at time [t5].

ここで、
(d)後段フリップフロップ(FF)402に対するデータ[DATA_D_2]入力タイミング[t3]と、
(e)後段フリップフロップ(FF)402からのデータ[DATA_2D]出力タイミング[t5]、
この[t3]〜[t5]の期間が、セットアップタイム[ts_lov_old]である。
here,
(D) Data [DATA_D_2] input timing [t3] to the subsequent flip-flop (FF) 402;
(E) Data [DATA_2D] output timing [t5] from the subsequent flip-flop (FF) 402,
The period from [t3] to [t5] is the setup time [ts_lov_old].

高電圧設定とした図5(1)の時間[T3]〜[T5]に比較して、低電圧設定とした図5(2)の時間[t3]〜[t5]は短くなっている。すなわちセットアップ時間が短くなってしまっている。これは、データ処理ブロックに対する供給電圧の低下に伴う現象である。   Compared with the time [T3] to [T5] in FIG. 5 (1) in which the high voltage is set, the time [t3] to [t5] in FIG. 5 (2) in which the low voltage is set is shorter. In other words, the setup time has been shortened. This is a phenomenon associated with a decrease in the supply voltage to the data processing block.

このように、データ処理ブロックの供給電圧を低下させると、十分なセットアップタイムが確保できなくなる。これは、結果として、データ処理回路の動作周波数を高くできないということになる。   Thus, if the supply voltage of the data processing block is lowered, sufficient setup time cannot be secured. As a result, the operating frequency of the data processing circuit cannot be increased.

次に、図6を参照して本発明の構成、すなわち、クロック生成ブロック、またはクロック生成ブロックとクロックツリーを含むクロックネットワークを選択的に低電圧化し、データ処理ブロックまたはデータ処理部を高電圧化した場合のタイミングチャートについて説明する。   Next, referring to FIG. 6, the configuration of the present invention, that is, the clock generation block or the clock network including the clock generation block and the clock tree is selectively reduced in voltage, and the data processing block or data processor is increased in voltage. A timing chart in this case will be described.

図6も図5と同様、図4に示すフリップフロップ401,402の動作タイミングを示しており、
(1)クロック生成ブロック、データ処理ブロックとも高電圧に設定した場合のタイミングチャート、
(2)クロック生成ブロックを低電圧化して、データ処理ブロックは高電圧に設定した場合のタイミングチャート、
これらの2つのタイミングチャートを示している。
6 shows the operation timing of the flip-flops 401 and 402 shown in FIG.
(1) Timing chart when clock generation block and data processing block are set to high voltage,
(2) Timing chart when the voltage of the clock generation block is lowered and the data processing block is set to a high voltage,
These two timing charts are shown.

図6(1),(2)とも、上から、
(a)クロック信号:(a1)クロックパルス源信号と、(a2)データ処理プロックに対する入力クロック信号
(b)前段フリップフロップ(FF)401に対するデータ[DATA]入力タイミング
(c)前段フリップフロップ(FF)401からのデータ[DATA_D_1]出力タイミング
(d)後段フリップフロップ(FF)402に対するデータ[DATA_D_2]入力タイミング
(e)後段フリップフロップ(FF)402からのデータ[DATA_2D]出力タイミング
これらの各タイミングを示している。
6 (1) and 6 (2) from above,
(A) Clock signal: (a1) Clock pulse source signal and (a2) Input clock signal for data processing block (b) Data [DATA] input timing to previous stage flip-flop (FF) 401 (c) Previous stage flip-flop (FF ) Data [DATA_D_1] output timing from 401 (d) Data [DATA_D_2] input timing to the subsequent flip-flop (FF) 402 (e) Data [DATA_2D] output timing from the subsequent flip-flop (FF) 402 Show.

図6(1),(2)において、それぞれデータ[D]の移動タイミングを点線矢印で示している。   6 (1) and 6 (2), the movement timing of the data [D] is indicated by dotted arrows.

図6(1)に示す高電圧に設定した場合のタイミングチャートは、図5(1)の設定と全く同様であるので説明を省略する。図6(2)に示すシーケンス、すなわち、クロック生成ブロック、またはクロック生成ブロックとクロックツリーを含むクロックネットワークを選択的に低電圧化し、データ処理ブロックまたはデータ処理部を高電圧化した場合のタイミングチャートについて説明する。   The timing chart when the high voltage shown in FIG. 6A is set is exactly the same as the setting shown in FIG. The sequence shown in FIG. 6 (2), that is, a timing chart when the clock generation block or the clock network including the clock generation block and the clock tree is selectively lowered in voltage and the data processing block or data processor is increased in voltage. Will be described.

時間[t1]以前に、データ[D]が前段フリップフロップ(FF)401に保持されており、
(b)前段フリップフロップ(FF)401に対するデータ[DATA]入力タイミング
に示すように時間[t2]において、クロック信号の立ち上がりに応じて、前段フリップフロップ(FF)401から出力される。
この出力タイミングは、時間[t2]である。
時間[t1]〜[t2]は、クロック信号が所定の電圧レベルに到達するために必要となる遅延時間[td_clk_lov_new]である。前述したように、この遅延時間は、クロック生成ブロックの駆動電圧に応じて変化する。
Prior to time [t1], data [D] is held in the previous flip-flop (FF) 401,
(B) The data [DATA] input timing to the previous flip-flop (FF) 401 is output from the previous flip-flop (FF) 401 in response to the rising edge of the clock signal at time [t2].
This output timing is time [t2].
Times [t1] to [t2] are delay times [td_clk_lov_new] necessary for the clock signal to reach a predetermined voltage level. As described above, this delay time changes according to the driving voltage of the clock generation block.

機能ブロック全体を高電圧設定とした図6(1)の時間[T1]〜[T2]に比較して、クロック生成ブロックなどを低電圧設定とした図6(2)の時間[t1]〜[t2]は長くなっている。これは、クロック生成ブロックに対する供給電圧の低下に伴う現象であり、この部分は、図5(1)と(2)の関係と同様である。   Compared with the time [T1] to [T2] in FIG. 6 (1) in which the entire functional block is set to a high voltage, the time [t1] to [[2] in FIG. t2] is longer. This is a phenomenon that accompanies a decrease in the supply voltage to the clock generation block, and this part is the same as the relationship of FIGS. 5 (1) and (2).

次に、
(c)前段フリップフロップ(FF)401からのデータ[DATA_D_1]出力に示す時間[t2]で、出力されたデータ[D]は、
(d)後段フリップフロップ(FF)402に対するデータ[DATA_D_2]入力タイミング
に示すように、時間[t3]において、後段フリップフロップ(FF)402に入力される。
時間[t2]〜[t3]は、前段フリップフロップ(FF)401と、後段フリップフロップ(FF)402とのパスの長さに応じた遅延時間[td_data_lov_new]である。この遅延時間は、前述したように、データ処理ブロックにおける駆動電圧に応じて変化する。
next,
(C) At the time [t2] shown in the data [DATA_D_1] output from the previous stage flip-flop (FF) 401, the output data [D]
(D) As shown in data [DATA_D_2] input timing to the subsequent flip-flop (FF) 402, the data is input to the subsequent flip-flop (FF) 402 at time [t3].
Times [t2] to [t3] are delay times [td_data_lov_new] corresponding to the path length between the front-stage flip-flop (FF) 401 and the rear-stage flip-flop (FF) 402. As described above, this delay time changes according to the drive voltage in the data processing block.

全機能ブロックを高電圧設定とした図6(1)の時間[T2]〜[T3]([td_data_hiov_new])と、クロック生成ブロックなどを低電圧設定とし、データ処理部を高電圧設定とした図6(2)の時間[t2]〜[t3]とは同じ遅延時間となっている。すなわち、
[td_data_lov_new]=[td_data_hiv_new]
となっている。
これは、図6(1),(2)ともデータ処理部には同じ高電圧(例えば1.2V)が共杞憂されており、遅延は同じ時間となるためである。
FIG. 6A shows the time [T2] to [T3] ([td_data_hiov_new]) of FIG. 6 (1) in which all functional blocks are set to high voltage, the clock generation block and the like are set to low voltage, and the data processing unit is set to high voltage The delay time is the same as the time [t2] to [t3] of 6 (2). That is,
[Td_data_lov_new] = [td_data_hiv_new]
It has become.
This is because the same high voltage (for example, 1.2 V) is present in the data processing unit in FIGS. 6A and 6B, and the delay is the same time.

次に、後段フリップフロップ(FF)402に入力されたデータ[D]は、
(e)後段フリップフロップ(FF)402からのデータ[DATA_2D]出力タイミング
に示すように、時間[t5]において、後段フリップフロップ(FF)402から出力される。
Next, the data [D] input to the subsequent flip-flop (FF) 402 is
(E) As shown in data [DATA_2D] output timing from the subsequent stage flip-flop (FF) 402, it is output from the subsequent stage flip-flop (FF) 402 at time [t5].

ここで、
(d)後段フリップフロップ(FF)402に対するデータ[DATA_D_2]入力タイミング[t3]と、
(e)後段フリップフロップ(FF)402からのデータ[DATA_2D]出力タイミング[t5]、
この[t3]〜[t5]の期間が、セットアップタイム[ts_lov_new]である。
here,
(D) Data [DATA_D_2] input timing [t3] to the subsequent flip-flop (FF) 402;
(E) Data [DATA_2D] output timing [t5] from the subsequent flip-flop (FF) 402,
The period from [t3] to [t5] is the setup time [ts_lov_new].

全機能ブロックを高電圧設定とした図6(1)の時間[T3]〜[T5]に比較して、クロック生成ブロックなどを低電圧設定とし、データ処理部を高電圧設定とした図6(2)の時間[t3]〜[t5]はほぼ同様の時間であり、図5(2)と異なり、
セットアップ時間が短くなっていない。これは、データ処理ブロックに対する供給電圧を低下させていないためである。
Compared to the times [T3] to [T5] in FIG. 6A in which all the functional blocks are set to high voltage, the clock generation block and the like are set to low voltage, and the data processing unit is set to high voltage. The times [t3] to [t5] of 2) are substantially the same time, and unlike FIG.
Setup time is not shortened. This is because the supply voltage to the data processing block is not lowered.

このように、データ処理ブロックの供給電圧を低下させることなく高電圧に維持する構成とすることで、十分なセットアップタイムが確保できる。これは、結果として、データ処理回路の動作周波数を高くすることを可能とするものである。   In this way, a sufficient setup time can be ensured by adopting a configuration in which the supply voltage of the data processing block is maintained at a high voltage without decreasing. As a result, the operating frequency of the data processing circuit can be increased.

このように、本発明の構成では、クロック生成ブロック、またはクロック生成ブロックとクロックツリーを含むクロックネットワークを選択的に低電圧化し、データ処理ブロックまたはデータ処理部を高電圧化する構成としたことにより、低消費電力が実現され、さらに十分なセットアップ時間の確保によりデータ処理部での動作周波数を高めることが可能となる。   Thus, in the configuration of the present invention, the clock generation block or the clock network including the clock generation block and the clock tree is selectively lowered in voltage, and the data processing block or the data processing unit is increased in voltage. Thus, low power consumption is realized, and it is possible to increase the operating frequency in the data processing unit by securing a sufficient setup time.

最後に本手法を用いた場合の消費電力削減効果について具体的な数値を用いて考察してみる。例えば近年のある画像処理LSIにおいてはロジック全体の消費電力の内、クロックの消費電力が4割近くを占める。さらにコントローラー系の機能ブロックにのみ着目してみると実に全体の8割以上の電力がクロック系であるケースもある。   Finally, let us consider the power consumption reduction effect when using this method using specific numerical values. For example, in a recent image processing LSI, the clock power consumption accounts for nearly 40% of the power consumption of the entire logic. Furthermore, if we focus only on the functional blocks of the controller system, there are cases where over 80% of the total power is actually from the clock system.

そこで、クロック系電力がそれぞれ全体の40%、80%を占めるケースでクロックのロジック電圧を1.2V→0.8Vに削減できた場合の電力削減効果を見積もってみる。全機能ブロックに高電圧(1.2V)を供給した場合の消費電力を[1]として、クロック系電力がそれぞれ全体の40%、80%を占める場合の消費電力[X]として、削減率=[1]−[X]として計算する。   Therefore, the power reduction effect is estimated when the clock logic voltage can be reduced from 1.2 V to 0.8 V in the case where the clock system power accounts for 40% and 80% of the total, respectively. Reduced rate = power consumption when high voltage (1.2V) is supplied to all functional blocks as [1], power consumption [X] when clock system power occupies 40% and 80% respectively Calculate as [1]-[X].

クロック系電力40%の場合は、
削減率=[1]−[X]
=1−{(0.4×0.8+0.6×1.2)/1.2
=0.22→22%削減
クロック系電力80%の場合は。
削減率=[1]−[X]
=1−{(0.8×0.8+0.2×1.2)/1.2
=0.45→45%削減
If the clock power is 40%,
Reduction rate = [1]-[X]
= 1-{(0.4 × 0.8 2 + 0.6 × 1.2 2 ) /1.2 2 }
= 0.22 → 22% reduction When the clock system power is 80%.
Reduction rate = [1]-[X]
= 1-{(0.8 × 0.8 2 + 0.2 × 1.2 2 ) /1.2 2 }
= 0.45 → 45% reduction

このように、クロック生成ブロックを選択的に低電圧化する構成、あるいは、クロック生成ブロックとクロックツリーを含むクロックネットワークを選択的に低電圧化することにより大幅な消費電力の削減が可能となる。さらに、本発明を適用することによりセットアップタイム、つまりLSIの最大動作周波数に影響を及ぼさずに消費電力をほぼ半減化できる。   As described above, the power generation can be significantly reduced by selectively reducing the voltage of the clock generation block or by selectively reducing the voltage of the clock network including the clock generation block and the clock tree. Furthermore, by applying the present invention, the power consumption can be almost halved without affecting the setup time, that is, the maximum operating frequency of the LSI.

以上、特定の実施例を参照しながら、本発明について詳解してきた。しかしながら、本発明の要旨を逸脱しない範囲で当業者が実施例の修正や代用を成し得ることは自明である。すなわち、例示という形態で本発明を開示してきたのであり、限定的に解釈されるべきではない。本発明の要旨を判断するためには、特許請求の範囲の欄を参酌すべきである。   The present invention has been described in detail above with reference to specific embodiments. However, it is obvious that those skilled in the art can make modifications and substitutions of the embodiments without departing from the gist of the present invention. In other words, the present invention has been disclosed in the form of exemplification, and should not be interpreted in a limited manner. In order to determine the gist of the present invention, the claims should be taken into consideration.

以上、説明したように、本発明の一実施例の構成では、クロック信号生成処理を実行するクロック生成部と、クロック生成部の生成するクロックを入力してデータ処理を実行するデータ処理部とを区分し、クロック生成部に対する供給電力をデータ処理部に比較して相対的に低い低電圧(例えば0.8V)としたので、回路全体の消費電力が削減される。また、データ処理部に対しては高電圧(例えば1.2V)を供給する構成としたので、データ処理部では高い動作周波数のデータ処理を行うことが可能となる。   As described above, in the configuration of an embodiment of the present invention, the clock generation unit that executes the clock signal generation process, and the data processing unit that executes the data processing by inputting the clock generated by the clock generation unit are provided. Since the power supplied to the clock generation unit is set to a relatively low voltage (for example, 0.8 V) compared to the data processing unit, the power consumption of the entire circuit is reduced. In addition, since the data processing unit is configured to supply a high voltage (for example, 1.2 V), the data processing unit can perform data processing at a high operating frequency.

本発明の一実施例の半導体集積回路の構成例について説明する図である。It is a figure explaining the structural example of the semiconductor integrated circuit of one Example of this invention. 本発明の一実施例の半導体集積回路の構成例について説明する図である。It is a figure explaining the structural example of the semiconductor integrated circuit of one Example of this invention. 本発明の一実施例の半導体集積回路構成におけるレベルシフタとフリップフロップ(FF)の物理的配置例について説明する図である。It is a figure explaining the example of physical arrangement | positioning of the level shifter and flip-flop (FF) in the semiconductor integrated circuit structure of one Example of this invention. 本発明の一実施例の半導体集積回路中のデータ処理回路を構成するフリップフロップ(FF)について説明する図である。It is a figure explaining the flip-flop (FF) which comprises the data processing circuit in the semiconductor integrated circuit of one Example of this invention. 従来型の半導体集積回路におけるデータ処理のタイミングチャートについて説明する図である。It is a figure explaining the timing chart of the data processing in the conventional type semiconductor integrated circuit. 本発明の一実施例の半導体集積回路におけるデータ処理のタイミングチャートについて説明する図である。It is a figure explaining the timing chart of the data processing in the semiconductor integrated circuit of one Example of this invention.

符号の説明Explanation of symbols

100 半導体集積回路
101 水晶振動子
102 PLL(Phase Locked Loop)
110 クロック生成ブロック
111〜113 分周/CG部
120,140,160 機能ブロック
121,122,141,142,161,162 データ処理ブロック
130,150,170 ローカルクロック生成ブロック
190 電力制御ブロック
200 機能ブロック
210 ローカルクロック生成ブロック
211,212 分周/CG部
220 データ処理ブロック
221 クロックツリー部
222 データ処理部
230 データ処理ブロック
241〜243 レベルシフタ
251,261〜263 CTSバッファ
311 0.8V電源レール
312 1.2V電源レール
401 フリップフロップ(FF1)
402 フリップフロップ(FF2)
DESCRIPTION OF SYMBOLS 100 Semiconductor integrated circuit 101 Crystal oscillator 102 PLL (Phase Locked Loop)
110 Clock generation block 111 to 113 Frequency division / CG unit 120, 140, 160 Function block 121, 122, 141, 142, 161, 162 Data processing block 130, 150, 170 Local clock generation block 190 Power control block 200 Function block 210 Local clock generation block 211, 212 Frequency division / CG unit 220 Data processing block 221 Clock tree unit 222 Data processing unit 230 Data processing block 241-243 Level shifters 251, 261-263 CTS buffer 311 0.8V power supply rail 312 1.2V power supply Rail 401 flip-flop (FF1)
402 Flip-flop (FF2)

Claims (7)

クロック信号生成処理を実行するクロック生成部と、
前記クロック生成部の生成するクロックを入力してデータ処理を実行するデータ処理部と、
前記クロック生成部およびデータ処理部に対する電力供給を実行する電力供給部を有し、
前記クロック生成部は、前記データ処理部に比較して相対的に低い低電圧の電力を前記電力供給部から入力して動作する構成を有することを特徴とする半導体集積回路。
A clock generation unit for executing a clock signal generation process;
A data processing unit that inputs a clock generated by the clock generation unit and executes data processing;
A power supply unit that performs power supply to the clock generation unit and the data processing unit;
The semiconductor integrated circuit according to claim 1, wherein the clock generation unit is configured to operate by inputting low-voltage power that is relatively lower than that of the data processing unit from the power supply unit.
前記クロック生成部は、
前記半導体集積回路に設定される複数の機能ブロックに対するクロック信号の生成を実行するグローバルクロック生成部と、
前記半導体集積回路に設定されるデータ処理部を含む複数の機能ブロックの各々に対するクロック信号の生成を実行するローカルクロック生成部を含み、
前記グローバルクロック生成部と、ローカルクロック生成部のいずれもが前記データ処理部に比較して相対的に低い低電圧の電力を前記電力供給部から入力して動作する構成を有することを特徴とする請求項1に記載の半導体集積回路。
The clock generator is
A global clock generator for generating clock signals for a plurality of functional blocks set in the semiconductor integrated circuit;
A local clock generation unit that generates a clock signal for each of a plurality of functional blocks including a data processing unit set in the semiconductor integrated circuit;
Both the global clock generation unit and the local clock generation unit are configured to operate by inputting relatively low power from the power supply unit as compared with the data processing unit. The semiconductor integrated circuit according to claim 1.
前記データ処理部は、
前記クロック生成部から前記データ処理部に対するクロック信号の入力部に設定された昇圧部を介して、昇圧されたクロック信号の供給を受ける構成であることを特徴とする請求項1に記載の半導体集積回路。
The data processing unit
2. The semiconductor integrated circuit according to claim 1, wherein the boosted clock signal is supplied from the clock generation unit via a boosting unit set in a clock signal input unit to the data processing unit. circuit.
前記半導体集積回路は、さらに、
前記半導体集積回路に設定されるデータ処理部を含む複数の機能ブロックの各々に構成されたクロックツリー部を有し、該クロックツリー部も前記データ処理部に比較して相対的に低い低電圧の電力により動作する構成を有することを特徴とする請求項1に記載の半導体集積回路。
The semiconductor integrated circuit further includes:
A clock tree unit configured in each of a plurality of functional blocks including a data processing unit set in the semiconductor integrated circuit, the clock tree unit also having a relatively low voltage compared to the data processing unit The semiconductor integrated circuit according to claim 1, wherein the semiconductor integrated circuit has a configuration that operates by electric power.
前記データ処理部は、
前記クロックツリー部から前記データ処理部に対するクロック信号の入力部に設定された昇圧部を介して、昇圧されたクロック信号の供給を受ける構成であることを特徴とする請求項4に記載の半導体集積回路。
The data processing unit
5. The semiconductor integrated circuit according to claim 4, wherein the boosted clock signal is supplied from the clock tree unit through a boosting unit set as a clock signal input unit to the data processing unit. circuit.
前記クロックツリー部は複数のCTSバッファによるクロックスキュー調整を行う回路であり、クロック信号供給源から前記昇圧部までの経路におけるクロックスキューを考慮したCTSバッファ設定構成を有することを特徴とする請求項5に記載の半導体集積回路。   6. The clock tree unit is a circuit that performs clock skew adjustment by a plurality of CTS buffers, and has a CTS buffer setting configuration in consideration of clock skew in a path from a clock signal supply source to the boosting unit. A semiconductor integrated circuit according to 1. 前記データ処理部は、1つの昇圧部を介してクロック信号を入力する複数のフリップフロップを有し、
前記複数のフリップフロップは前記1つの昇圧部に隣接して配置された構成を有することを特徴とする請求項5に記載の半導体集積回路。
The data processing unit includes a plurality of flip-flops that input a clock signal through one boosting unit,
6. The semiconductor integrated circuit according to claim 5, wherein the plurality of flip-flops have a configuration arranged adjacent to the one boosting unit.
JP2007236874A 2007-09-12 2007-09-12 Semiconductor integrated circuit Pending JP2009070980A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007236874A JP2009070980A (en) 2007-09-12 2007-09-12 Semiconductor integrated circuit

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007236874A JP2009070980A (en) 2007-09-12 2007-09-12 Semiconductor integrated circuit

Publications (1)

Publication Number Publication Date
JP2009070980A true JP2009070980A (en) 2009-04-02

Family

ID=40606938

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007236874A Pending JP2009070980A (en) 2007-09-12 2007-09-12 Semiconductor integrated circuit

Country Status (1)

Country Link
JP (1) JP2009070980A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016521400A (en) * 2013-03-15 2016-07-21 クゥアルコム・インコーポレイテッドQualcomm Incorporated Low power architecture
KR20190115280A (en) * 2018-04-02 2019-10-11 한화테크윈 주식회사 Semiconductor device including functional blocks and method of controlling clock signals provided thereto

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1185310A (en) * 1997-09-10 1999-03-30 Nec Corp Clock signal distribution circuit
JP2004022877A (en) * 2002-06-18 2004-01-22 Matsushita Electric Ind Co Ltd Standard cell for multiple power sources, standard cell library for automatic arrangement and wiring, power supply wiring method, and semiconductor integrated device
JP2004186520A (en) * 2002-12-05 2004-07-02 Oki Electric Ind Co Ltd Semiconductor integrated circuit
JP2006339521A (en) * 2005-06-03 2006-12-14 Matsushita Electric Ind Co Ltd Semiconductor integrated circuit
JP2007193751A (en) * 2006-01-23 2007-08-02 Nec Electronics Corp Semiconductor device and data input/output system

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1185310A (en) * 1997-09-10 1999-03-30 Nec Corp Clock signal distribution circuit
JP2004022877A (en) * 2002-06-18 2004-01-22 Matsushita Electric Ind Co Ltd Standard cell for multiple power sources, standard cell library for automatic arrangement and wiring, power supply wiring method, and semiconductor integrated device
JP2004186520A (en) * 2002-12-05 2004-07-02 Oki Electric Ind Co Ltd Semiconductor integrated circuit
JP2006339521A (en) * 2005-06-03 2006-12-14 Matsushita Electric Ind Co Ltd Semiconductor integrated circuit
JP2007193751A (en) * 2006-01-23 2007-08-02 Nec Electronics Corp Semiconductor device and data input/output system

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016521400A (en) * 2013-03-15 2016-07-21 クゥアルコム・インコーポレイテッドQualcomm Incorporated Low power architecture
KR20190115280A (en) * 2018-04-02 2019-10-11 한화테크윈 주식회사 Semiconductor device including functional blocks and method of controlling clock signals provided thereto
KR102634171B1 (en) * 2018-04-02 2024-02-06 한화비전 주식회사 Semiconductor device including functional blocks and method of controlling clock signals provided thereto

Similar Documents

Publication Publication Date Title
JP4894014B2 (en) Adaptive control of power supplies for integrated circuits.
US8984463B2 (en) Data transfer across power domains
US7443218B2 (en) Semiconductor integrated circuit with pulsed clock data latch
US5586307A (en) Method and apparatus supplying synchronous clock signals to circuit components
JP5051582B2 (en) Closed loop control for performance tuning
KR20160008258A (en) Semiconductor device
Kaur et al. Strategies & methodologies for low power VLSI designs: A review
TWI643458B (en) Power saving with dual-rail supply voltage scheme
WO2007099841A1 (en) Semiconductor device
JP2013066179A (en) Power control circuit, semiconductor device including the power control circuit, and operating method of the power control circuit
JP2008507117A (en) Control method for binary control of performance parameters
KR20030060517A (en) Clock synchronizing circuit for use in an integrated circuit device
JP2009070980A (en) Semiconductor integrated circuit
US8836403B2 (en) Programmable clock driver
WO2015162057A1 (en) Clock phase alignment
US20220391008A1 (en) Asynchronous fifo for power-domain crossing
JP2011018137A (en) Low power consumption circuit design method and semiconductor integrated circuit device
US8283962B2 (en) Semiconductor device and operation method thereof for generating phase clock signals
JPWO2005013107A1 (en) Semiconductor device and driving method of semiconductor device
CN114077570A (en) Semiconductor device with a plurality of transistors
JP2011107749A (en) Microcomputer
JP4304124B2 (en) Semiconductor device
JP2000332121A (en) Vlsi circuit and variable multiple supply voltage system for low-power design performance
JP2006229745A (en) Semiconductor integrated circuit device
Kumar et al. VLSI designs for low power applications

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100526

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121106

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20130402