JP2009246246A - Three-dimensional multilayer structure having low capacity through electrode and computer system - Google Patents

Three-dimensional multilayer structure having low capacity through electrode and computer system Download PDF

Info

Publication number
JP2009246246A
JP2009246246A JP2008093062A JP2008093062A JP2009246246A JP 2009246246 A JP2009246246 A JP 2009246246A JP 2008093062 A JP2008093062 A JP 2008093062A JP 2008093062 A JP2008093062 A JP 2008093062A JP 2009246246 A JP2009246246 A JP 2009246246A
Authority
JP
Japan
Prior art keywords
chip
bus
computer system
stacked structure
dimensional stacked
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008093062A
Other languages
Japanese (ja)
Other versions
JP5412662B2 (en
Inventor
Hiroshi Nakagawa
博 仲川
Masahiro Aoyanagi
昌宏 青柳
Yoshikuni Okada
義邦 岡田
Sukenori Matsumoto
祐教 松本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Institute of Advanced Industrial Science and Technology AIST
Tops Systems Corp
Original Assignee
National Institute of Advanced Industrial Science and Technology AIST
Tops Systems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Institute of Advanced Industrial Science and Technology AIST, Tops Systems Corp filed Critical National Institute of Advanced Industrial Science and Technology AIST
Priority to JP2008093062A priority Critical patent/JP5412662B2/en
Publication of JP2009246246A publication Critical patent/JP2009246246A/en
Application granted granted Critical
Publication of JP5412662B2 publication Critical patent/JP5412662B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L2224/00Indexing scheme for arrangements for connecting or disconnecting semiconductor or solid-state bodies and methods related thereto as covered by H01L24/00
    • H01L2224/01Means for bonding being attached to, or being formed on, the surface to be connected, e.g. chip-to-package, die-attach, "first-level" interconnects; Manufacturing methods related thereto
    • H01L2224/10Bump connectors; Manufacturing methods related thereto
    • H01L2224/15Structure, shape, material or disposition of the bump connectors after the connecting process
    • H01L2224/16Structure, shape, material or disposition of the bump connectors after the connecting process of an individual bump connector
    • H01L2224/161Disposition
    • H01L2224/16135Disposition the bump connector connecting between different semiconductor or solid-state bodies, i.e. chip-to-chip
    • H01L2224/16145Disposition the bump connector connecting between different semiconductor or solid-state bodies, i.e. chip-to-chip the bodies being stacked
    • HELECTRICITY
    • H01ELECTRIC ELEMENTS
    • H01LSEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
    • H01L2924/00Indexing scheme for arrangements or methods for connecting or disconnecting semiconductor or solid-state bodies as covered by H01L24/00
    • H01L2924/15Details of package parts other than the semiconductor or other solid state devices to be connected
    • H01L2924/151Die mounting substrate
    • H01L2924/153Connection portion
    • H01L2924/1531Connection portion the connection portion being formed only on the surface of the substrate opposite to the die mounting surface
    • H01L2924/15311Connection portion the connection portion being formed only on the surface of the substrate opposite to the die mounting surface being a ball array, e.g. BGA

Landscapes

  • Internal Circuitry In Semiconductor Integrated Circuit Devices (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide a tree-dimensional multilayer structure having low capacity through electrodes that enables direct connection of an interconnect between chips through a buffer gate which is indispensable for conventional two-dimensional packaging by significantly reducing the capacitance of a through electrode of a semiconductor LSI chip and to provide a computer system that achieves much more low power dissipation by actively promoting low frequency by using the three-dimensional multilayer structure. <P>SOLUTION: In a semiconductor LSI chip having low capacity through electrodes, the periphery of the through electrode is insulated by electrodeposition type polyimide. An electric capacity is equal to or smaller than that originated from an interconnect of 1 mm or less in the LSI chip. <P>COPYRIGHT: (C)2010,JPO&INPIT

Description

本発明は、積層半導体LSIチップを低容量の貫通電極を介して接続した3次元積層構造体、ならびに該3次元積層構造体を有するマルチコアチップや特定用途用プロセッサなど、特にヘテロジニアスマルチコアアーキテクチャを持つコンピュータシステムに関するものである。   The present invention has a heterogeneous multi-core architecture, such as a three-dimensional stacked structure in which stacked semiconductor LSI chips are connected through low-capacitance through electrodes, and a multi-core chip and a special-purpose processor having the three-dimensional stacked structure. It relates to a computer system.

近年、SoC上に複数のプロセッサを集積するマルチコアチップや、プロセッサコアを応用分野に特化させることにより効率の良い処理を追及できる特定用途用プロセッサ(ASIP)が提案され、製品開発が進められている。これらの技術は、組込みシステムに求められる幅広い技術ニーズに応えることができるため、我が国が世界的なリーダシップを保持している情報家電分野を中核に、将来に渡って大きな発展が期待できる。   In recent years, multi-core chips that integrate multiple processors on an SoC and special-purpose processors (ASIP) that can pursue efficient processing by specializing processor cores in application fields have been proposed, and product development has progressed. Yes. Since these technologies can meet a wide range of technical needs for embedded systems, major developments can be expected in the future, centered on the information home appliances field, where Japan holds a global leadership.

しかしながら、マルチコアチップやASIPでは、CPUやDSPなどの従来は単一プロセッサとして動作することを前提に開発されたコアを同一チップ上に複数個集積するため、メモリとのプロセッサのバンド幅のギャップに対応したキャッシュメモリが必要になり、またキャッシュメモリやオンチップメモリの共有によるメモリアクセスのボトルネックを回避するために動作周波数の向上や複雑なオンチップバス回路が必要になるなど、動作周波数の向上や付加回路による電力消費増加が問題となる。   However, in multi-core chips and ASIPs, multiple cores developed on the premise of operating as a single processor, such as CPUs and DSPs, are integrated on the same chip. Increased operating frequency, such as the need for a compatible cache memory and the need to improve operating frequency and complicated on-chip bus circuits to avoid memory access bottlenecks caused by sharing of cache memory and on-chip memory In addition, an increase in power consumption due to additional circuits becomes a problem.

更に、プロセステクノロジの微細化により、リーク電流が増加しており、90nm以下のテクノロジではリークが動的な消費電力を超えるという問題がある。   Furthermore, the leakage current is increasing due to the miniaturization of the process technology, and there is a problem that the leakage exceeds the dynamic power consumption in the technology of 90 nm or less.

また、ソフトウエア資産とハードウエア資産の共有化および再利用化を図ることで、組込みシステムの開発効率と設計効率を向上させるプラットフォーム技術が提案され、システムオンチップ(SoC)の開発が進められている。これらのプラットフォーム技術は、情報家電分野の情報機器が持つ幅広い機能や性能の要求に柔軟に対応すると共に、システム展開の容易化を実現している。しかしながら、これらのプラットフォームの性能向上の基本的は、動作周波数の向上と複数プロセッサコアによる並列処理であり、電力消費増加が問題となる。このため、機能ブロック単位で動的な周波数や電源電圧制御により、不要なエネルギー消費を抑える方法が提案されている。   In addition, by sharing and reusing software assets and hardware assets, platform technology has been proposed to improve development efficiency and design efficiency of embedded systems, and system-on-chip (SoC) development has been promoted. Yes. These platform technologies flexibly respond to the wide range of functions and performance requirements of information appliances in the information home appliance field, and also facilitate system deployment. However, the basic improvement in the performance of these platforms is an improvement in operating frequency and parallel processing by a plurality of processor cores, and an increase in power consumption becomes a problem. For this reason, a method of suppressing unnecessary energy consumption by dynamic frequency and power supply voltage control in units of functional blocks has been proposed.

さらに、マルチコア化の主流は、既存のプロセッサを複数個集積するホモジニアスマルチコアであり、そのソフトウエアは、負荷分散型の並列プログラミングである。しかしながら、組込みシステムの分野では、ソフトウエアの開発が容易で、信頼性の高いオブジェクト指向に適した機能分散型のプログラミングが望ましく、特に低消費電力化には、処理効率の良いヘテロジニアスマルチコアが期待される。   Further, the mainstream of multi-core is homogeneous multi-core in which a plurality of existing processors are integrated, and the software is load-balancing parallel programming. However, in the field of embedded systems, software development is easy and function-distributed programming suitable for highly reliable object orientation is desirable. Especially for low power consumption, high-efficiency heterogeneous multi-core is expected. Is done.

ところで、個々の半導体チップの開発に目を向けると、やはり、携帯電話、ネットワーク家電、RFICなどに代表されるユビキタスエレクトロニクス時代を迎えて、電子機器の一層の小型化、低消費電力化、高機能化、低価格化が求められており、特に、情報機器の消費電力に関しては、その普及とともに社会全体における全消費電力に対する比率が急激に増大すると予測され、半導体チップの超低消費電力化技術への期待は大きい。   By the way, when looking at the development of individual semiconductor chips, the ubiquitous electronics era represented by mobile phones, network home appliances, RFICs, etc., has entered a further downsizing of electronic devices, lower power consumption, and higher functionality. In particular, with regard to the power consumption of information equipment, the ratio of total power consumption in society as a whole is expected to increase rapidly with the spread of information equipment, leading to ultra-low power consumption technology for semiconductor chips. Expectation is great.

これを達成するためには、LSIシステムの小型化が必須の技術であり、近年、従来の基板上に二次元的に電子デバイスを大規模、高密度に集積する手法に加え、複数のLSIチップを実装技術により3次元的に大規模、高密度集積を行い、実質的に1チップと同程度の寸法内に一つの電子システムを納めることができるシステムインパッケージ(SiP)技術が提案され、開発が進められている。この技術は、電子システムに求められる幅広い技術ニーズに応えることができるため、電子実装技術分野を中核にして、将来に渡って大きな発展が期待できる。   In order to achieve this, downsizing of the LSI system is an essential technology. In recent years, in addition to the conventional method of two-dimensionally integrating electronic devices on a large-scale, high density, multiple LSI chips System-in-package (SiP) technology has been proposed and developed that enables large-scale, high-density integration in a three-dimensional manner using packaging technology, and allows one electronic system to be accommodated within the same dimensions as a single chip. Is underway. Since this technology can meet a wide range of technical needs for electronic systems, it can be expected to develop greatly in the future with the electronic packaging technology field as the core.

しかしながら、SiP技術では、LSIチップがワイヤボンディング接続を用いて、従来から行われているパッケージ実装されるため、ボンディングパッド部の静電容量、ボンディングワイヤのインダクタンスに対応した外部接続用信号増幅(バッファ)回路が必要となる。これらの付加回路は、内部の信号処理回路に比べて、大きな電源電圧により駆動されるため、電力消費の増加が問題となる。   However, in the SiP technology, the LSI chip is mounted using a conventional package using wire bonding connection, so signal amplification (buffer) for external connection corresponding to the capacitance of the bonding pad and the inductance of the bonding wire ) A circuit is required. Since these additional circuits are driven by a larger power supply voltage than the internal signal processing circuit, an increase in power consumption becomes a problem.

これ対して、さらに超高速、超高密度、低消費電力を狙うための高度な技術として、LSIチップ同士を直接3次元的に積層実装する3次元LSIチップ積層実装技術の研究開発が進められている(特許文献1、2、3参照)。この技術は、従来の平面的集積技術を越えた、究極的な高密度集積を達成する技術と位置づけられることから、注目度が高まって来ている。   On the other hand, research and development of 3D LSI chip stacking technology, in which LSI chips are directly stacked in 3D, is advanced as an advanced technology aimed at ultra-high speed, ultra-high density, and low power consumption. (See Patent Documents 1, 2, and 3). Since this technology is positioned as a technology that achieves ultimate high-density integration beyond the conventional planar integration technology, it has been attracting attention.

一般に、CMOSLSIゲートの消費電力Pは、P=f・CL・Vで表される、ここでfは動作周波数、CLは負荷容量、Vは電源電圧である。このうち、本発明は、動作周波数fの低減による低消費電力化を、ファームハードウェア上のアーキテクチャにより実現する。電源電圧Vは、内部回路用と外部インターフェイス用の2種類があるが、デバイスや使用環境などによりほぼ固定される。内部回路では、電源電圧や負荷容量CLはデバイス構成や内部配線等により決まり、微細化の進展とともに減少している。   In general, the power consumption P of a CMOS LSI gate is expressed by P = f · CL · V, where f is an operating frequency, CL is a load capacitance, and V is a power supply voltage. Of these, the present invention achieves low power consumption by reducing the operating frequency f by an architecture on firmware. There are two types of power supply voltage V for internal circuits and external interfaces, but they are almost fixed depending on the device and the usage environment. In the internal circuit, the power supply voltage and the load capacitance CL are determined by the device configuration, internal wiring, etc., and decrease with the progress of miniaturization.

一方、LSIチップ間を接続する外部インターフェイスにおいては、電源電圧はそれほど下がらない上に、負荷容量CLは非常に大きな値となる。例えば、130nm-CMOSプロセス技術を使用し、搭載トランジスタ数5,500万個のLSIで、内部回路1ゲート分に対する外部接続インターフェイス1端子分の消費電力費比は外部負荷容量を50pFと仮定して、100倍以上となる。また、このようなLSIの総消費電力に対する外部接続インターフェイスの占める比率は約3分の1となり、低消費電力化には、チップ間接続の負荷容量低減が重要課題となることがわかる。   On the other hand, in the external interface connecting the LSI chips, the power supply voltage does not decrease so much and the load capacitance CL has a very large value. For example, using a 130nm-CMOS process technology and an LSI with 55 million transistors, the ratio of the power consumption cost of one external connection interface to one gate of the internal circuit is 100 assuming that the external load capacitance is 50pF. More than double. In addition, the ratio of the external connection interface to the total power consumption of such an LSI is about one third, and it can be seen that reducing the load capacity of the chip-to-chip connection is an important issue for reducing the power consumption.

従って、3次元LSIチップ積層実装を適用することにより、チップ間接続の負荷容量低減が可能となり、小型化のみならず、低消費電力システムの実現に大きく寄与する。   Therefore, by applying 3D LSI chip stacking, it is possible to reduce the load capacity of chip-to-chip connection, which greatly contributes to the realization of not only miniaturization but also a low power consumption system.

3次元LSIチップ積層実装においては、薄型加工したLSIチップに貫通電極を設けて積層実装することから、デバイス間の距離が極端に短くなり、チップ間インターフェイスの配線長を大幅に短縮することができる。そのため、負荷容量を大幅に減少できる。また、信号の劣化、減衰がほとんどなくなり、波形整形、増幅に用いられるバッファ回路が不要となり、回路量の大幅削減が達成できる。最終的に、顕著な省電力効果が期待される。   In 3D LSI chip stack mounting, through electrodes are stacked and mounted on thin processed LSI chips, the distance between devices becomes extremely short, and the wiring length of the interface between chips can be greatly shortened. . Therefore, the load capacity can be greatly reduced. In addition, signal degradation and attenuation are almost eliminated, and a buffer circuit used for waveform shaping and amplification is not necessary, so that the circuit amount can be greatly reduced. Ultimately, a significant power saving effect is expected.

3次元LSIチップ積層実装技術の研究開発については、まだ多くの解決すべき課題がある。しかしながら、DRAM、フラッシュなどメモリLSIの3次元積層化は、平面集積の限界を超えるための必須技術として、事業化を目指した開発が着実に進められている(非特許文献1参照)。イメージセンサ、MEMS素子などについては、種々の方法で貫通電極の作製例が報告されており、幅広い応用分野を目指して、開発が進められている。   There are still many issues to be solved regarding the research and development of 3D LSI chip stack packaging technology. However, three-dimensional stacking of memory LSIs such as DRAM and flash is steadily being developed for commercialization as an essential technology for exceeding the limit of planar integration (see Non-Patent Document 1). As for image sensors, MEMS elements, etc., examples of the production of through electrodes have been reported by various methods, and developments are being made with a view to a wide range of application fields.

一方、DSP、CUPなどの消費電力の大きなデジタルLSIの3次元集積化については、消費電力が層数に比例して倍増するため、放熱が大きな課題となる。また、電源供給配線についても、電流供給能力を層数に比例して、向上させる必要が生じるため、安定供給確保が困難になる。   On the other hand, for three-dimensional integration of digital LSIs with high power consumption, such as DSP and CUP, heat dissipation becomes a major issue because power consumption doubles in proportion to the number of layers. Further, since it is necessary to improve the current supply capability in proportion to the number of layers for the power supply wiring, it is difficult to ensure stable supply.

前述したヘテロジニアスマルチコアチップおいては、LSIチップ内における異なる演算IPコアの連携と実効的な演算機能の有効利用を図ることで、演算性能の低下を招くことなくクロック周波数の低減が可能となり、これにより大幅な消費電力の低減が達成できる。その結果として、放熱の問題が解消されるとともに、LSIシステム全体の消費電力に占める、上述のチップ間インターフェイスにおけるバッファ回路での消費電力の割合が見かけ上で大きくなることが予想される。これに対しては、インターフェイス部分の著しい低容量化により入出力バッファ回路を不用とする3次元LSIチップ積層実装の適用が最終的な低消費電力化を達成するのに、有効な手段になると考えられる。
特開2003-243396号公報 特開2003-309121号公報 特開2002-299836号公報 Satoshi Matsui, et al., "Thermal Management in 8-Strata 4Gb DRAM SIP", 2007 Proceedings of IMPS 40th International Symposium on Microelectronics, 2007.11.11., pp.310-316.
In the heterogeneous multi-core chip described above, it is possible to reduce the clock frequency without degrading the calculation performance by linking different calculation IP cores in the LSI chip and effectively using the effective calculation function. As a result, a significant reduction in power consumption can be achieved. As a result, it is expected that the problem of heat dissipation will be solved, and the ratio of the power consumption in the buffer circuit in the above-described inter-chip interface to the power consumption of the entire LSI system will be apparently increased. For this, it is considered that the application of 3D LSI chip stacking which does not require an input / output buffer circuit due to a significant reduction in the capacity of the interface part will be an effective means to achieve the final reduction in power consumption. It is done.
JP 2003-243396 A JP 2003-309121 A JP 2002-299836 A Satoshi Matsui, et al., "Thermal Management in 8-Strata 4Gb DRAM SIP", 2007 Proceedings of IMPS 40th International Symposium on Microelectronics, 2007.11.11, pp.310-316.

本発明は、以上の事情に鑑みてなされたものであり、半導体LSIチップに形成する微細な貫通ビア電極について、その静電容量を大幅に低減し、これにより、従来の2次元実装では必須であったバッファゲートを介したチップ間配線を、直接接続することを可能にした、低容量貫通電極を持つ3次元積層構造体を提供し、さらに、この3次元積層構造体を利用するとともに、ソフトウエアの開発が容易で、信頼性の高いオブジェクト指向に適した機能分散型のプログラミングを採用して、積極的にさらなる低周波数化を図り、より一層の低消費電力化を実現することのできる、処理効率の良いヘテロジニアスマルチコアチップを持つコンピュータシステムを提供することを課題としている。   The present invention has been made in view of the above circumstances, and the capacitance of a fine through-via electrode formed on a semiconductor LSI chip is greatly reduced, which is essential for conventional two-dimensional mounting. The present invention provides a three-dimensional laminated structure having a low-capacitance through electrode, which enables direct connection of inter-chip wiring via a buffer gate, and further uses the three-dimensional laminated structure, It is easy to develop software and adopts function-distributed programming suitable for reliable object orientation, and can actively lower the frequency to achieve even lower power consumption. It is an object to provide a computer system having a heterogeneous multi-core chip with high processing efficiency.

本発明は、上記の課題を解決するものとして、第1には、貫通電極の周囲が電着型ポリイミドによって絶縁されており、電気容量が、LSIチップ内部の1mm以下の配線に起因する電気容量以下の値をもつ、低容量貫通電極を有する半導体LSIチップを提供する。   In order to solve the above-mentioned problems, the present invention firstly has a through electrode that is insulated by electrodeposition type polyimide, and has an electric capacity caused by wiring of 1 mm or less inside the LSI chip. A semiconductor LSI chip having a low-capacitance through electrode having the following values is provided.

第2には、前記電気容量以下の値が0.1pFである、前記半導体LSIチップを提供する。   Second, the semiconductor LSI chip having a value equal to or less than the electric capacity of 0.1 pF is provided.

第3には、前記半導体LSIチップを基板上に複数個積層してなる、低容量貫通電極を有する3次元積層構造体を提供する。   Thirdly, the present invention provides a three-dimensional laminated structure having a low-capacitance through electrode formed by laminating a plurality of the semiconductor LSI chips on a substrate.

第4には、前記半導体LSIチップ上にて低容量貫通電極を共通バスとする、マルチコアチップコンピュータシステムを提供する。   Fourth, a multi-core chip computer system using a low-capacitance through electrode as a common bus on the semiconductor LSI chip is provided.

第5には、トライステート信号によるクロック、バス使用要求、アドレス、コマンド、データ、ステータスを含む共通バスで接続される、前記マルチコアチップコンピュータシステムを提供する。   Fifth, there is provided the multi-core chip computer system connected by a common bus including a clock by a tristate signal, a bus use request, an address, a command, data, and a status.

第6には、前記半導体LSIチップを基板上に複数個積層してなり、各半導体LSIチップが異なる用途に応じて設計された特定用途用プロセッサである、3次元積層構造体コンピュータシステムを提供する。   Sixth, the present invention provides a three-dimensional stacked structure computer system, which is a processor for a specific application in which a plurality of the semiconductor LSI chips are stacked on a substrate, and each semiconductor LSI chip is designed for a different application. .

第7には、各特定用途用プロセッサは、用途に応じた命令セットを持ち、相互にやり取りするデータの形式が共通となっている、前記3次元積層構造体コンピュータシステムを提供する。   Seventhly, the processor for each specific application has the instruction set according to the application, and provides the three-dimensional stacked structure computer system in which the format of data exchanged with each other is common.

第8には、データ形式の共通化手段として、エンディアンを変換する回路をバスインターフェイス内に有する、前記3次元積層構造体コンピュータシステムを提供する。   Eighth, the three-dimensional stacked structure computer system having a circuit for converting the endian in the bus interface is provided as means for sharing the data format.

第9には、別々に設計された半導体LSIチップ間のやり取りが自動的に保障される、前記3次元積層構造体コンピュータシステムを提供する。   Ninth, the present invention provides the three-dimensional stacked structure computer system in which the exchange between the separately designed semiconductor LSI chips is automatically ensured.

第10には、前記保障は、チップ積層時に設定される各チップのバスIDに基づいて、各チップのバスへのアクセスがバスインターフェイス回路によって調停されることにより行われる、前記3次元積層構造体コンピュータシステムを提供する。   Tenth, the guarantee is performed by arbitrating access to the bus of each chip by a bus interface circuit based on the bus ID of each chip set at the time of stacking the chips. A computer system is provided.

第11には、ビット幅の異なるデータの任意の半導体LSIチップ間の送受を制御する回路を備える、前記3次元積層構造体コンピュータシステムを提供する。   11thly, the said three-dimensional laminated structure computer system provided with the circuit which controls transmission / reception between the arbitrary semiconductor LSI chips of the data from which bit width differs is provided.

第12には、ビット幅の異なるデータの設定は初期設定で認識する、前記3次元積層構造体コンピュータシステムを提供する。   Twelfth, the three-dimensional stacked structure computer system according to the present invention, which recognizes the setting of data having different bit widths as an initial setting.

第13には、前記認識は、システムの起動時にホストとなるホストチップで動作するシステム初期化プログラムによって、初期化モードを使用してバスに接続された各チップの情報を読み出すことによって行われる、前記3次元積層構造体コンピュータシステムを提供する。   Thirteenth, the recognition is performed by reading information of each chip connected to the bus using the initialization mode by a system initialization program that operates on a host chip that is a host when the system is started. The three-dimensional laminated structure computer system is provided.

第14には、前記各チップの情報は、製品ID、ベンダID、クラス、サブクラス、データサイズ、電源、および電流の少なくとも一つである、前記3次元積層構造体コンピュータシステムを提供する。   Fourteenth, the information on each chip is at least one of product ID, vendor ID, class, subclass, data size, power supply, and current.

第15には、前記ホストチップは、マスターバスID=0を持ち、前記初期化モードにおいて、前期ホストチップは、バスIDを用いてアクセス先のチップを指定する、前記3次元積層構造体コンピュータシステムを提供する。   Fifteenth, the three-dimensional stacked structure computer system, wherein the host chip has a master bus ID = 0, and in the initialization mode, the host host chip designates an access destination chip using the bus ID I will provide a.

第16には、3次元積層構造体を構成する半導体LSIチップのそれぞれに分散アービトレーション回路が設けられている、前記3次元積層構造体コンピュータシステムを提供する。   Sixteenth, there is provided the three-dimensional stacked structure computer system, wherein a distributed arbitration circuit is provided in each of the semiconductor LSI chips constituting the three-dimensional stacked structure.

第17には、前記分散アービトレーション回路は、リクエストを発行するマスター用のアービトレ−ション回路、およびリクエストを受け付けるスレーブ用のアービトレ−ション回路を含む、前記3次元積層構造体コンピュータシステムを提供する。   Seventeenth, the distributed arbitration circuit provides the three-dimensional stacked structure computer system including a master arbitration circuit for issuing a request and a slave arbitration circuit for receiving the request.

第18には、前記マスター用のアービトレーション回路は、バスインターフェイスを用いて自発的に他のチップにアクセスするバスマスターチップに搭載される、前記3次元積層構造体コンピュータシステムを提供する。   Eighteenth, the three-dimensional stacked structure computer system is provided, wherein the master arbitration circuit is mounted on a bus master chip that spontaneously accesses another chip using a bus interface.

第19には、前記バスマスターチップがプロセッサチップである、前記3次元積層構造体コンピュータシステムを提供する。   Nineteenth, the three-dimensional stacked structure computer system is provided in which the bus master chip is a processor chip.

第20には、前記スレーブ用のアービトレーション回路は、バスインターフェイスを用いて他のチップからアクセスされるバススレーブチップ)に搭載される、前記3次元積層構造体コンピュータシステムを提供する。   20thly, the slave arbitration circuit is mounted on a bus slave chip accessed from another chip using a bus interface), and provides the three-dimensional stacked structure computer system.

第21には、前記バススレーブチップがメモリである、前記3次元積層構造体コンピュータシステムを提供する。   Twenty-first, the three-dimensional stacked structure computer system according to the present invention, wherein the bus slave chip is a memory.

第22には、各アービトレーション回路は固有のIDを持つ、前記3次元積層構造体コンピュータシステムを提供する。   Twenty-second, the arbitration circuit has the unique ID, and provides the three-dimensional stacked structure computer system.

第23には、3次元積層構造体を構成する半導体LSIチップは、コアプロセッサ、メモリ、無線通信、インターフェイス、センサ、マンマシンインターフェイス、暗号処理チップの少なくとも一つからなり、分散並列処理プログラムにより制御される、前記3次元積層構造体コンピュータシステムを提供する。   In the 23rd, a semiconductor LSI chip constituting a three-dimensional stacked structure is composed of at least one of a core processor, a memory, wireless communication, an interface, a sensor, a man-machine interface, and a cryptographic processing chip, and is controlled by a distributed parallel processing program. The three-dimensional laminated structure computer system is provided.

第24には、各半導体チップは、コンピュータシステム設定用の初期化プログラムを分散並列処理プログラムとしてもつ、前記3次元積層構造体コンピュータシステムを提供する。   24thly, each semiconductor chip provides the said three-dimensional laminated structure computer system which has an initialization program for computer system setting as a distributed parallel processing program.

第25には、前記初期化プログラムにおいて、ホストチップは、チップ固有の情報であるデスクリプタとバスIDに基づき、システムアドレスマップを作成し、該システムアドレスマップに従って、各バススレーブチップのベースアドレスと上限アドレスで規定されるアドレス範囲を設定する、前記3次元積層構造体コンピュータシステムを提供する。   25thly, in the initialization program, the host chip creates a system address map based on the descriptor and bus ID, which are chip-specific information, and the base address and upper limit of each bus slave chip according to the system address map. The three-dimensional stacked structure computer system is provided for setting an address range defined by an address.

第26には、各バススレーブチップは、自己の前記アドレス範囲をバスインターフェイス回路に書込み、自己へのアクセスを検出する、前記3次元積層構造体コンピュータシステムを提供する。   Twenty-sixth, each bus slave chip provides the three-dimensional stacked structure computer system in which the address range of the bus slave chip is written to the bus interface circuit and access to the bus slave chip is detected.

第27には、3次元積層構造体を構成する半導体チップの積層後に、相互のチップを認識しイニシャライズ動作を行って、システムが最適化されている、前記3次元積層構造体コンピュータシステムを提供する。   According to a twenty-seventh aspect of the present invention, there is provided the above three-dimensional stacked structure computer system in which the system is optimized by recognizing each other chip and performing an initialization operation after stacking the semiconductor chips constituting the three-dimensional stacked structure. .

以上のとおりの特徴を有する本発明によれば、以下のとおりの効果を実現することができる。   According to the present invention having the features as described above, the following effects can be realized.

1)クロック周波数の低減
複数の特定用途用命令セットを用いたコアプロセッサチップを低容量貫通電極バスで接続し、並列演算させることで、各チップの演算性能の利用効率を向上させることができる。低容量貫通電極バスは各チップ内部バスと直接接続でき、バス幅の拡張性が容易になる。これにより、クロック周波数をあげることなく、各チップ間のデータ送受容量を増やすことができ、従来と同一の性能を簡単に達成できる。
1) Reduction of clock frequency By connecting core processor chips using a plurality of special-purpose instruction sets with a low-capacitance through-electrode bus and performing parallel operations, it is possible to improve the utilization efficiency of operation performance of each chip. The low-capacity through electrode bus can be directly connected to the internal bus of each chip, and the bus width can be easily expanded. As a result, the data transmission / reception amount between the chips can be increased without increasing the clock frequency, and the same performance as the conventional one can be easily achieved.

従来は内部バスのクロックに比して他チップとの接続バスのクロックは1桁以上低かったが、本発明では、原理的に同一周波数を適用できることから、従来のシステム性能を律速していた外部バスクロック周波数を実効的に高くすることができ、クロック周波数の増加を伴わずにシステム性能を向上させることができる。   Conventionally, the clock of the bus connected to another chip is one digit or more lower than the clock of the internal bus. However, in the present invention, since the same frequency can be applied in principle, the external system has limited the system performance. The bus clock frequency can be effectively increased, and the system performance can be improved without increasing the clock frequency.

2)消費電力の低減
低容量貫通電極バス構成により、従来のシステムで多くの使用費電力を必要とした各チップ間のインターフェイスバッファ回路を排除することができ、消費電力の削減が可能となる。
2) Reduction of power consumption With the low-capacitance through electrode bus configuration, it is possible to eliminate the interface buffer circuit between each chip, which requires a large amount of power consumption in the conventional system, and the power consumption can be reduced.

また、特定用途用命令セットの応用で、目的にあった最適処理を実行させることができる。   In addition, it is possible to execute optimum processing suitable for the purpose by applying the instruction set for specific use.

また、クロック周波数の低減により消費電力を低減できる。   Further, power consumption can be reduced by reducing the clock frequency.

さらには、3次元積層構造では、放熱対策が重要であるが、本発明によれば、消費電力を劇的に低減できるため、積層構造に極めて有利である。   Furthermore, in the three-dimensional laminated structure, heat dissipation measures are important. However, according to the present invention, power consumption can be dramatically reduced, which is extremely advantageous for the laminated structure.

そして、バス信号電圧を、内部バスと同等に低下させることができるため、消費電力を低減できる。   Since the bus signal voltage can be reduced to the same level as the internal bus, power consumption can be reduced.

3)大容量データ処理に好適
プロセッサとメモリ間のバス幅を広げられるためデータ転送容量の増加が容易になる。
3) Suitable for large-capacity data processing Since the bus width between the processor and the memory can be increased, the data transfer capacity can be easily increased.

4)システムの構築方法のフレキシビリティが広い
任意に設計した各種のチップを積層順に関係なく低容量貫通電極バスで接続するのみで所望のシステムを構築できる。
4) Wide flexibility of system construction method A desired system can be constructed by simply connecting variously designed chips with a low-capacitance through electrode bus regardless of the stacking order.

システムプログラムは各チップに搭載する共通動作プラットホームを利用することで、容易に構成することができる。   The system program can be easily configured by using a common operation platform mounted on each chip.

5)小型化
積層化により1チップの面積でnチップの機能を実現できる。
5) Miniaturization By stacking, an n-chip function can be realized with an area of one chip.

6)メモリチップの簡素化、高速大容量
従来メモリチップに搭載されていた外部からのアクセスを高速化するためのインターフェイス制御回路が不要になるため、メモリエリアの増大とこの回路による遅延が低減できるため高速大容量化が達成される。
6) Simplification of memory chip, high speed and large capacity Since an interface control circuit for speeding up external access which has been mounted on a conventional memory chip is not required, the memory area can be increased and the delay caused by this circuit can be reduced. Therefore, high speed and large capacity can be achieved.

ここで、まず、上記特徴を有する本発明の3次元積層構造体について説明する。   Here, the three-dimensional laminated structure of the present invention having the above characteristics will be described first.

本発明では、3次元LSIチップ積層実装技術について、従来提案されている貫通電極の絶縁層に用いられているシリコン酸化膜に代えて、低誘電率の厚膜の電着型ポリイミドを適用することで、チップ間接続の負荷容量を従来のシリコン酸化膜絶縁に比べて、1/10以下に低減する。   In the present invention, for the three-dimensional LSI chip stacking mounting technology, instead of the conventionally proposed silicon oxide film used for the insulating layer of the through electrode, a low-permittivity thick film electrodeposited polyimide is applied. Thus, the load capacity for chip-to-chip connection is reduced to 1/10 or less compared to conventional silicon oxide film insulation.

多数の低容量貫通電極をチップ間接続に用いて、広帯域システムバスを構成することにより、複数積層に対応したチップ間のスケーラブルな接続を可能にする3次元実装バス接続インターフェイスを具現化することができる。   Realizing a three-dimensional mounting bus connection interface that enables scalable connection between multiple stacks by configuring a broadband system bus using a large number of low-capacity through electrodes for inter-chip connection it can.

このインターフェイスはヘテロジニアスマルチコアに基づき、積層数、接続ピン数をクラス分けして規格化することで、高機能を目指した複数の異なるLSIチップを用途に応じて3次元積層し、再設計、再開発することなく、柔軟性および拡張性を確保しながら設計できることを意味し、将来に渡ってヘテロジニアスマルチコアチップ技術の応用範囲を飛躍的に広げることが可能である。   This interface is based on heterogeneous multi-core and standardized by classifying the number of stacks and the number of connection pins, so that several different LSI chips aiming at high functions can be stacked three-dimensionally according to the application, and redesigned and redesigned. This means that the design can be performed while ensuring flexibility and expandability without development, and it is possible to dramatically expand the application range of the heterogeneous multi-core chip technology in the future.

本発明は、前述したヘテロジニアスマルチコアチップの特徴から想定されるものであり、ヘテロジニアスマルチコアチップと、低容量貫通電極を持つ3次元積層構造体との組み合わせにより、一層の低消費電力化を可能ならしめる。   The present invention is assumed from the characteristics of the heterogeneous multi-core chip described above, and further reduction in power consumption is possible by combining the heterogeneous multi-core chip and a three-dimensional laminated structure having a low-capacitance through electrode. Make it smooth.

低容量貫通電極を持つ3次元積層構造体についてさらに具体的に説明すると、一般に、多層配線に電着型ポリイミドを用いると、配線のみに給電することで特定の個所に選択的に均一な絶縁層形成が可能となる。これにより、絶縁層形成後にグランド層を均一に形成すれば、配線の特性インピーダンスについて、高精度な制御が達成できる。   More specifically, a three-dimensional laminated structure having a low-capacitance through electrode will be described in detail. Generally, when an electrodeposited polyimide is used for a multilayer wiring, a uniform insulating layer is selectively selectively applied to a specific portion by supplying power only to the wiring. Formation is possible. Accordingly, if the ground layer is formed uniformly after the insulating layer is formed, highly accurate control can be achieved with respect to the characteristic impedance of the wiring.

一方、LSIデバイス内に設けられる貫通ビア電極は、通常、以下のような手順で形成される。アスペクト比の大きい深いビア孔をシリコン基板に形成し、CVD法などでビア孔の側壁に酸化シリコン膜を形成し、更にスパッタ法、CVD法などでシード層を形成した後、Cuめっき法などでビア孔を金属で埋め込む。   On the other hand, the through via electrode provided in the LSI device is usually formed by the following procedure. A deep via hole with a large aspect ratio is formed on a silicon substrate, a silicon oxide film is formed on the sidewall of the via hole by CVD, etc., and a seed layer is further formed by sputtering, CVD, etc., and then Cu plating is used. Fill the via hole with metal.

このビア孔の側壁絶縁工程にて、電着型ポリイミドを用いることができる。ビア穴形成後に孔以外の部分をレジストでカバーした後に、シリコン基板に給電して、ポリイミド絶縁層を電着形成する。その後は、従来と同様にスパッタ法、CVD法などでシード層を形成した後、Cuめっき法などでビア孔を金属で埋め込む。電着型ポリイミドでは、数十ミクロンの厚さでも短時間で膜形成が可能であり、低誘電率についても酸化シリコン膜より低い値に設定できる。   Electrodeposition type polyimide can be used in this via hole side wall insulating step. After the via hole is formed, a portion other than the hole is covered with a resist, and then the silicon substrate is powered to form a polyimide insulating layer by electrodeposition. After that, after forming a seed layer by sputtering or CVD as in the prior art, the via hole is filled with metal by Cu plating or the like. Electrodeposited polyimide can be formed in a short time even with a thickness of several tens of microns, and the low dielectric constant can be set to a value lower than that of a silicon oxide film.

これまで、半導体LSIデバイスの性能向上については、微細加工技術の進展により集積度および処理速度の向上が図られてきた。しかし、トランジスタゲート長の微細化によりリーク電流が増加することで、動作に関与しない無駄な電力の消費が増大しつつある。先進諸国が抱えるCO2削減の大命題に対応するための電子機器の消費電力削減の目標達成にとって、大きな障害となっている。これに対して、3次元積層技術は、微細化によらず集積度および処理速度の向上が図れるため、リーク電流の増大を招かずに低消費電力化が達成できる可能性を秘めており、非常に有望な消費電力削減技術と考えられる。   Up to now, with regard to improving the performance of semiconductor LSI devices, the degree of integration and processing speed have been improved by the advancement of microfabrication technology. However, as the leakage current increases due to the miniaturization of the transistor gate length, the consumption of useless power not involved in the operation is increasing. It is a major obstacle to achieving the goal of reducing the power consumption of electronic devices to meet the major proposition of CO2 reduction in advanced countries. On the other hand, the three-dimensional stacking technology can improve the degree of integration and processing speed regardless of miniaturization, so it has the potential to achieve low power consumption without increasing leakage current. This is considered a promising technology for reducing power consumption.

これまでのDRAMメモリデバイスの3次元積層化に関する実用的な研究開発においては、シリコン基板に貫通穴を形成してポリシリコンを貫通電極として用いているため(非特許文献1参照)、貫通ビア電極が示す静電容量は2pF/ビア程度であった。貫通電極の絶縁性を向上させるため、貫通ビアの内面にSiO2などの絶縁層を形成する取り組みがなされている。しかしながら、これまでの2次元配置用チップと同様なI/Oゲートが設けることを前提としているため、積極的な静電容量の低減に関する議論はされておらず、回路などの工夫を行うレベルに達していない。表1にチップのSiO2を用いた貫通電極の良好な条件における静電容量の計算例と、本提案におけるポリイミド絶縁貫通電極による計算例を示した。電着法によるポリイミド膜の形成はSiO2にくらべて、1μm以上の膜厚の形成が容易であるため、さらなる低容量化が可能である。   In practical research and development related to the three-dimensional stacking of DRAM memory devices so far, a through hole is formed in a silicon substrate and polysilicon is used as a through electrode (see Non-Patent Document 1). Was about 2 pF / via. In order to improve the insulating property of the through electrode, an effort has been made to form an insulating layer such as SiO2 on the inner surface of the through via. However, since it is premised on providing an I / O gate similar to the chip for two-dimensional placement so far, there has been no discussion on aggressive reduction of capacitance, and it is at a level where devices such as circuits are devised. Not reached. Table 1 shows an example of calculation of the capacitance of the through electrode using SiO2 of the chip under good conditions and an example of calculation using the polyimide insulated through electrode in this proposal. The formation of a polyimide film by electrodeposition is easier to form with a film thickness of 1 μm or more than SiO 2, so that the capacity can be further reduced.


本発明によれば、一般的なLSI内部の配線(容量:およそ100fF)やゲート(容量:およそ1fF)と直接に接続してもゲートの動作、信号伝送に影響を与えないような超低容量の貫通ビア電極技術を確立できる。これにより、メモリチップ間接続のような単純接続だけではなく、拡張性、柔軟性を確保しながら効率的な論理設計が実現できる3次元LSI積層ハードウエハシステムの構築が可能になる。この結果、高密度、高機能、高効率な低消費電力LSIシステム設計が求められる、携帯電子機器分野やロボット制御分野など広範なエレクトロニクス企業に大きなインパクトを与えることができる。

According to the present invention, an ultra-low capacitance that does not affect gate operation and signal transmission even when directly connected to a general LSI internal wiring (capacitance: about 100 fF) or gate (capacitance: about 1 fF). Through-hole via electrode technology can be established. This makes it possible to construct a three-dimensional LSI stacked hard wafer system capable of realizing efficient logic design while ensuring expandability and flexibility, as well as simple connection such as connection between memory chips. As a result, it can make a big impact on a wide range of electronics companies, such as the field of portable electronic devices and robot control, where high-density, high-functionality, and high-efficiency low-power LSI system design is required.

現在主流のCMOS-LSIデバイスにおいては、各ゲートの容量および各ゲート間を接続する配線が持つ容量に対する充放電により、電力が消費されている。このときの消費電力はP=fCV(f:動作周波数、C:配線(LSI内および実装系内)およびゲート(LSI内)の静電容量、V:動作電圧)で表記される。このとき、ゲート容量と配線容量はおよそ1fFゲート と100fF/mmとなり、バスライン構成では数ピコF程度と見積ることが出来る。また、デバイスが実装されるパッケージ、プリント回路基板の高周波用ストリップ配線に対しては、長い配線に起因する大きな容量(2〜4pF/cm)のため、LSIデバイス内に駆動能力の高い、高電圧動作のI/Oバッファゲートを配置しなければならなかった。このバッファゲートは外部回路に対する十分なドライブ能力を有する必要があり、たとえば、100Mゲートレベルのプロセッサの場合、50pFの静電容量の外部バスラインを駆動すると仮定すると、全消費電力の40%程度になると試算される。本提案では、表2に示すように10個のLSIチップを接続する貫通ビア配線の静電容量を1pF以下にすることが可能となり、従来のチップ間配線に要したこの40%の消費電力をほぼ無視できる程度に削減することができる。本発明はこのような低消費電力化を達成できる3次元積層技術を実現している。そのイメージを図1に示す。 In the current mainstream CMOS-LSI devices, power is consumed by charging / discharging the capacity of each gate and the capacity of the wiring connecting the gates. The power consumption at this time is expressed by P = fCV 2 (f: operating frequency, C: capacitance of wiring (inside LSI and mounting system) and gate (inside LSI), V: operating voltage). At this time, the gate capacitance and the wiring capacitance are about 1 fF gate and 100 fF / mm, and can be estimated to be about several pico F in the bus line configuration. In addition, for packages on which devices are mounted and high-frequency strip wiring on printed circuit boards, high capacitance (2 to 4 pF / cm) due to long wiring leads to high driving voltage and high voltage in LSI devices. Had to put an operational I / O buffer gate. This buffer gate needs to have sufficient drive capability for external circuits. For example, in the case of a 100M gate level processor, assuming that an external bus line with a capacitance of 50 pF is driven, it is about 40% of the total power consumption. It will be estimated. In this proposal, as shown in Table 2, it is possible to reduce the capacitance of the through via wiring connecting 10 LSI chips to 1 pF or less, and this 40% power consumption required for the conventional interchip wiring can be reduced. It can be reduced to an almost negligible level. The present invention realizes a three-dimensional stacking technique that can achieve such low power consumption. The image is shown in FIG.

電着型ポリイミドについては、これまでに銅や金などさまざまな金属上で信頼性の高い絶縁膜の形成に成功しており、また、その形成過程についての詳細なデータの蓄積を有する。すでに、多層配線構造の作製を目的とし、15μm程度の膜厚をもつ平滑な電着型ポリイミド膜を製膜するため検討を行った結果、撹拌の最適化により平滑面を得ることが可能となった。また、製膜の再現性も向上し、製膜時間による膜厚制御が可能であることが確認されている。厚い膜においても平滑な絶縁層が製膜可能となったため、電気銅めっきと電着型ポリイミドによる微細多層配線の作製が可能となり、この技術を用いて線路長22.4mm、線路幅30μmで特性インピーダンスおよそ50Ωを有するマイクロストリップ線路を作製し、その性能を検証している。   Electrodeposited polyimide has so far been successful in forming highly reliable insulating films on various metals such as copper and gold, and has accumulated detailed data on the formation process. Already, for the purpose of producing a multilayer wiring structure, a study was conducted to form a smooth electrodeposited polyimide film with a film thickness of about 15 μm. As a result, it became possible to obtain a smooth surface by optimizing the stirring. It was. In addition, it has been confirmed that the reproducibility of film formation is improved and the film thickness can be controlled by the film formation time. Since a smooth insulating layer can be formed even with a thick film, it is possible to fabricate fine multilayer wiring using electrolytic copper plating and electrodeposited polyimide. Using this technology, the characteristic length is 22.4mm and the line width is 30μm. A microstrip line with approximately 50Ω is fabricated and its performance is verified.

次に、本発明によるコンピュータシステムについて説明する。   Next, a computer system according to the present invention will be described.

本発明では、チップの動作周波数を低減することにより、従来にない低消費電力化を図る。チップの消費電力は、P=1/2・α・C・V2・fである。動作周波数fを下げることにより、チップ上のトランジスタのスイッチング速度を抑えた低電力回路とし、電源電圧Vを下げることができ、チップ全体の消費電力は、動作周波数fのほぼ3乗で低減することができる。   In the present invention, by reducing the operating frequency of the chip, an unprecedented reduction in power consumption is achieved. The power consumption of the chip is P = 1/2 · α · C · V2 · f. By reducing the operating frequency f, the power consumption voltage V can be reduced by reducing the switching speed of the transistors on the chip, and the power consumption of the entire chip can be reduced by the cube of the operating frequency f. Can do.

チップの動作周波数を低減するために、本発明では、PHS端末、ネットワーク家電、RFIC等の特定の用途に特化したヘテロジニアスマルチコアのアーキテクチャ及びそのソフトウエアアルゴリズムの協調設計を実現する。即ち、たとえば、PHS端末の場合、その通信機能、通話やメール、Webブラウジング等のアプリケーション処理機能、そしてLCDへの表示機能のそれぞれについて、複数のASIP仕様を定義することと並行して、アプリケーションソフトの各機能の処理を機能分散型で効率の良い処理方式を定義することにより、各処理に必要な命令ステップ数を大幅に削減する。   In order to reduce the operating frequency of the chip, the present invention realizes a heterogeneous multi-core architecture specialized for specific applications such as PHS terminals, network home appliances, and RFICs, and a collaborative design of its software algorithm. That is, for example, in the case of a PHS terminal, application software in parallel with defining multiple ASIP specifications for each of its communication functions, application processing functions such as calls and mails, web browsing, and display functions on the LCD By defining a function-distributed and efficient processing method for each function, the number of instruction steps required for each process is significantly reduced.

そこで、低い動作周波数でありながら高い処理能力を実現する低消費電力指向のヘテロジニアスマルチコアのアーキテクチャとして、クロック当りの演算処理能力の向上とともに、電力消費増加につながる付加回路の削減を図る。そのため、アーキテクチャ上で以下のアプローチをとる。   Therefore, as a low power consumption-oriented heterogeneous multi-core architecture that realizes high processing capability even at a low operating frequency, the arithmetic processing capability per clock is improved and additional circuits that lead to increased power consumption are reduced. Therefore, the following approach is taken on the architecture.

(1)浅い命令実行パイプライン:4〜5段
命令実行パイプラインが浅いため、分岐のペナルティは比較的小さい。そのため、付加回路が多い分岐予測回路は搭載しない。
(1) Shallow instruction execution pipeline: 4 to 5 stages Since the instruction execution pipeline is shallow, the branch penalty is relatively small. Therefore, a branch prediction circuit with many additional circuits is not installed.

(2)スーパースカラやVLIW等の命令の並列処理は行わない
命令並列の実効的な並列度は3〜4命令であり、そのための付加回路による消費電力の増加はそれ以上と考えられるため。
(2) Instructions such as superscalar and VLIW are not processed in parallel. The effective parallelism of instructions is 3 to 4 instructions, and the increase in power consumption due to the additional circuit is considered to be more than that.

(3)データ並列性能有効活用
SIMD命令等によるデータ並列によるクロック当りの演算処理向上は、演算回路の増加以上の効果がある。そのため、ヘテロジニアスマルチコアとして搭載する各プロセッサコアのデータサイズ(データパス幅)は、アプリケーション機能に応じてNビット(32ビット、64ビット、128ビットなど)とする。
(3) Effective use of data parallel performance
The improvement of arithmetic processing per clock by data parallel by SIMD instructions and the like has an effect more than the increase of arithmetic circuits. Therefore, the data size (data path width) of each processor core mounted as a heterogeneous multi-core is N bits (32 bits, 64 bits, 128 bits, etc.) according to the application function.

(4)特化型命令の追加
アプリケーション特化型命令として、演算のカスケーディングや特殊回路の実装により、1クロック当りの演算処理量を向上させる。
(4) Addition of specialized instructions As application-specific instructions, arithmetic processing amount per clock is improved by implementation of arithmetic cascading and special circuits.

(5)キャッシュメモリの最小化
キャッシュメモリは付加回路が多く、消費電力増加につながる。そのため、キャッシュメモリの代わりに可能な限りレジスタやローカルメモリを使用する。
(5) Minimization of cache memory The cache memory has many additional circuits, leading to an increase in power consumption. Therefore, registers and local memory are used as much as possible instead of the cache memory.

(6)データと命令のローカリティの向上
低消費電力の観点からは、レジスタファイル<ローカルメモリ<キャッシュメモリ<共有オンチップメモリ<外部メモリの順で有利となる。そのため、各プロセッサに内蔵するレジスタファイルやローカルメモリのサイズの最適化、共有オンチップメモリのサイズの最適化、外部メモリとのインターフェイスの最適化など、メモリ階層全体をデータと命令のローカリティの向上のために最適化する。
(6) Improved locality of data and instructions From the viewpoint of low power consumption, it is advantageous in the order of register file <local memory <cache memory <shared on-chip memory <external memory. Therefore, optimization of register files and local memory in each processor, optimization of size of shared on-chip memory, optimization of interface with external memory, etc. To optimize for.

(7)コンパクトな命令コードサイズ
マルチコアでは、複数のプロセッサコアが実装されるため、命令フェッチに必要なバンド幅は、シングルプロセッサのN倍となる。そのため、チップ上にキャッシュメモリやプログラムメモリを持つが、その容量とこれらのメモリとプロセッサ間のバスによって消費される電力は、命令コードサイズにほぼ比例する。従って、各プロセッサコアの命令コードサイズを極力抑えるよう、基本命令長を16bitとする命令セットアーキテクチャを定義する。
(7) Compact instruction code size Since a plurality of processor cores are mounted in a multi-core, the bandwidth required for instruction fetch is N times that of a single processor. For this reason, a cache memory or a program memory is provided on the chip, but the capacity and the power consumed by the bus between these memories and the processor are almost proportional to the instruction code size. Therefore, an instruction set architecture with a basic instruction length of 16 bits is defined to minimize the instruction code size of each processor core.

上述の通りのアプローチを採用する本発明のコンピュータシステムでは、さらに以下の具体的構成を具備する。   The computer system of the present invention that employs the approach as described above further includes the following specific configuration.

まず、たとえば図2に例示したように、前述の図1に例示した貫通電極を介して3次元積層される半導体LSIチップ群は、バスインターフェイスを用いて接続される。積層される半導体LSIチップ群は、自発的に他のチップにアクセスするバスマスターチップ、およびバスインターフェイスを用いて他のチップからアクセスされるバススレーブチップからなり、それぞれ積層時(チップのテスト時に各チップ)にバスID(マスターチップ、スレーブチップのそれぞれに固有のID)が設定され、このバスIDに基づいて各チップのバスへのアクセスがバスインターフェイス回路によって調停されて、別々に設計された各チップ間におけるデータ送受やプログラム処理等の各種やり取りが自動的に保障される。バスインターフェイス回路については後述する。   First, as illustrated in FIG. 2, for example, semiconductor LSI chip groups that are three-dimensionally stacked via the through electrodes illustrated in FIG. 1 are connected using a bus interface. A group of semiconductor LSI chips to be stacked includes a bus master chip that spontaneously accesses another chip and a bus slave chip that is accessed from another chip using a bus interface. The bus ID (a unique ID for each of the master chip and slave chip) is set for each chip, and access to the bus of each chip is arbitrated by the bus interface circuit based on this bus ID, and each designed separately Various exchanges such as data transmission / reception and program processing between chips are automatically secured. The bus interface circuit will be described later.

たとえばビット幅の異なるデータの送受においては、各チップのデータ転送サイズの要件設定が、システムの起動時にホストとなるホストチップで動作するシステム初期化プログラムにより、初期化モードを使用してバスに接続された各チップの情報(たとえば製品ID、ベンダID、クラス、サブクラス、データサイズ、電源、電流といったデスクリプタ)を読み出すことによって認識される。ホストチップはバスID=0であり、初期化モードでは、ホストチップが、バスIDを用いてアクセス先のチップを指定する。   For example, when sending and receiving data with different bit widths, the data transfer size requirement setting for each chip is connected to the bus using the initialization mode by the system initialization program that runs on the host chip that is the host when the system starts up. It is recognized by reading out information of each chip (for example, descriptors such as product ID, vendor ID, class, subclass, data size, power supply, current). The host chip has a bus ID = 0, and in the initialization mode, the host chip specifies an access destination chip using the bus ID.

各チップは、たとえば図3に例示したように分散アービトレーション回路を内蔵する。分散アービトレーション回路には、リクエストを発行するマスターチップ用のアービトレーション回路、およびリクエストを受け付けるスレーブチップ用のアービトレーション回路がある。たとえば、マスター用のアービトレーション回路はプロセッサチップなどのバスマスターチップに、スレーブ用のアービトレーション回路はメモリなおのバススレーブチップに搭載される。勿論各アービトレーション回路は固有のIDを持つ。各アービトレーション回路のIDは、たとえば図4に例示した構成により付与することができる。   Each chip incorporates a distributed arbitration circuit as exemplified in FIG. The distributed arbitration circuit includes an arbitration circuit for a master chip that issues a request and an arbitration circuit for a slave chip that receives a request. For example, an arbitration circuit for a master is mounted on a bus master chip such as a processor chip, and an arbitration circuit for a slave is mounted on a bus slave chip as a memory. Of course, each arbitration circuit has a unique ID. The ID of each arbitration circuit can be given by the configuration illustrated in FIG. 4, for example.

以上の半導体LSIチップと電源用および共通バス用の前記貫通電極との配置の一例を、図5に示す。図5の例では、チップ上のアービトレーション回路に対して共通バス用の複数の貫通電極が配設され、チップ周辺領域に電源用の複数の貫通電極が配設されている。また、電源用貫通電極を介して電源に接続される各積層チップの電源割当て方法の一例を、図6に示す。積層した半導体LSIチップ群は、リセット中はいずれのチップも電源電極1のみを使用する。リセット中に、ホストチップは、イニシャライズ動作を行って各チップの電流要求情報を読み出し、各チップの使用する電源電極の番号をコンフィグレーションとして設定する。各チップ内でコンフィグレーション設定に基づいて行われる電源選択回路例については図7に示すとおりである。これら図6および図7に示す電源割当てによって、各チップの積層後、相互のチップを認識しイニシャライズ動作を行って、電源電極の割当てを最適化することができる。   FIG. 5 shows an example of the arrangement of the semiconductor LSI chip and the through electrodes for power supply and common bus. In the example of FIG. 5, a plurality of through electrodes for a common bus are provided for the arbitration circuit on the chip, and a plurality of through electrodes for power supply are provided in the peripheral area of the chip. FIG. 6 shows an example of a method for assigning power to each laminated chip connected to the power supply through the power supply through electrode. The stacked semiconductor LSI chip group uses only the power supply electrode 1 for each chip during reset. During the reset, the host chip performs an initialization operation to read out current request information of each chip, and sets the number of the power supply electrode used by each chip as a configuration. An example of a power supply selection circuit performed based on the configuration setting in each chip is as shown in FIG. With the power supply allocation shown in FIGS. 6 and 7, after stacking the chips, the mutual chips can be recognized and an initialization operation can be performed to optimize the power supply electrode allocation.

ところで、バス構成については、トライステート信号によるクロック、バス使用要求、アドレス、コマンド、データ、ステータスを含む共通バスで接続される。マスターバスID=0を持つホストチップがクロック信号をドライブする。各チップはバスIDに従って該当するバス使用権要求信号(具体例は図13)をドライブする。そして、アービトレーションの結果、バス使用権を獲得したマスターチップがアドレス信号とコマンド信号をドライブする。データ信号は、データ転送の方向によって、書込みの場合はバス使用権を獲得したマスターチップが、読み出しの場合はアドレスで指定されたスレーブチップがドライブする。また、アドレスで指定されたスレーブチップは、ステータス信号をドライブする、
図8はそのバス信号の動作タイミングの一例である。この例では、1つのデータ転送処理が、3段のパイプラインステージに分けて行われる。先ず、第1ステージ(S0:バス使用要求ステージ)では、各チップは必要に応じてバス使用権要求信号をドライブする。各チップに内蔵されるアービトレーション回路は、自分のバス使用権要求信号と他のチップからのバス使用権要求信号を基に図10、図11に示す方法でアービトレーションを行い、どのチップがバス使用権を持つかを決める。アービトレーションの結果、バス使用権を獲得したチップは、第2ステージ(S1:バス要求創出ステージ)で、コマンド信号とアドレス信号をドライブする。そして第3ステージ(S2:バス・データ転送ステージ)で、データ転送が行われる。この3段のパイプライン処理は、図8に示すように1つのバス転送は、通常各ステージ1クロックサイクルで行われる。
By the way, the bus configuration is connected by a common bus including a clock by a tristate signal, a bus use request, an address, a command, data, and a status. A host chip having a master bus ID = 0 drives a clock signal. Each chip drives a corresponding bus use right request signal (specific example is FIG. 13) according to the bus ID. As a result of arbitration, the master chip that has acquired the bus use right drives the address signal and the command signal. The data signal is driven by the master chip that has acquired the right to use the bus in the case of writing or the slave chip specified by the address in the case of reading, depending on the direction of data transfer. The slave chip specified by the address drives the status signal.
FIG. 8 shows an example of the operation timing of the bus signal. In this example, one data transfer process is performed in three pipeline stages. First, in the first stage (S0: bus use request stage), each chip drives a bus use right request signal as necessary. The arbitration circuit built in each chip performs arbitration by the method shown in FIGS. 10 and 11 based on its own bus use right request signal and the bus use right request signal from another chip, and which chip uses the bus use right. Decide what to have. As a result of the arbitration, the chip that has acquired the bus use right drives the command signal and the address signal in the second stage (S1: bus request creation stage). Data transfer is performed in the third stage (S2: bus data transfer stage). In this three-stage pipeline processing, as shown in FIG. 8, one bus transfer is normally performed in one clock cycle of each stage.

図9はバス使用モードの一例を示す。ノーマル(シングル転送)モードは、データのリードやライトを3段のパイプライン処理1回のみ行う転送で、バスサイクルとして1サイクル分を占有する。スプリット転送モードは、マスターチップがスレーブチップからデータを読み出す場合で、スレーブチップからのデータ転送が上記S2で行えないようなアクセスサイクルの長いチップの場合に転送を2つのバスサイクルに分けて転送する。この場合スレーブチップは、読み出しデータが準備できるタイミングにあわせてバス使用権要求信号をドライブしてバス使用権を獲得する(図8中において、S0では左二番目のMaster-1と右端のSlave-2、S1では左二番目のReadと右端のsplit、S2では左二番目のNot yetと右端のReady)。バースト転送モードでは、バス使用権を獲得したチップがバス使用権をロックする(図13のbus_lock信号をドライブする)ことによりバス使用権を連続して確保することにより、複数のバスサイクルを必要とするストリームデータ等の転送を連続して行うことができる。また、サイクリック転送モードは、ADC(A/Dコンバータ)による一定周期でのサンプリングデータの転送のような場合に、優先度の高いバス使用要求を用いることにより定期的にバス使用権を獲得することができる。   FIG. 9 shows an example of the bus use mode. In the normal (single transfer) mode, data is read and written only once in three stages of pipeline processing, and occupies one cycle as a bus cycle. In the split transfer mode, when the master chip reads data from the slave chip and the chip has a long access cycle in which data transfer from the slave chip cannot be performed in S2, the transfer is divided into two bus cycles. . In this case, the slave chip obtains the bus use right by driving the bus use right request signal at the timing when the read data can be prepared (in FIG. 8, in S0, the second Master-1 on the left and the Slave- 2. In S1, the second left read and the rightmost split, and in S2, the second left not yet and the rightmost ready). In the burst transfer mode, the chip that has acquired the bus use right locks the bus use right (drives the bus_lock signal in FIG. 13), thereby continuously securing the bus use right, thereby requiring a plurality of bus cycles. The stream data and the like can be transferred continuously. In the cyclic transfer mode, the right to use the bus is regularly acquired by using a high-priority bus use request in the case of transferring sampling data at a fixed cycle by an ADC (A / D converter). be able to.

バス使用権のアービトレーションの一例については図10に示す。マスターチップ(プロセッサ)間で1次のラウンドロビンを構成し、優先度の最も高いマスターチップ(プロセッサ)を示す内部状態を保持する。そして、この内部状態に応じて、スレーブチップからのバス使用要求がなければ、バス使用要求を発行したマスターチップの中で最も優先度の高い(図11参照)チップにバス使用権を与えるアービトレーションを行う。次のクロックサイクルの内部状態は、バス使用権を獲得した次のプロセッサを優先順位1とする状態に遷移させることにより、効率よくラウンドロビンを回す。同様にスレーブチップ間で2次のラウンドロビンを構成する。そして、2次のラウンドロビンによるアービトレーションの結果は、1次のラウンドロビンによるアービトレーションよりも高い優先度を与えることにより、スプリット転送モードやサイクリック転送モード時のスレーブチップからの要求を優先してバス使用権を与える。   An example of arbitration of the bus use right is shown in FIG. A primary round robin is formed between master chips (processors), and an internal state indicating the master chip (processor) having the highest priority is held. If there is no bus use request from the slave chip according to this internal state, arbitration for giving the bus use right to the chip having the highest priority among the master chips that issued the bus use request (see FIG. 11) is performed. Do. The internal state of the next clock cycle efficiently turns round robin by making a transition to a state in which the next processor that has acquired the right to use the bus has priority level 1. Similarly, a secondary round robin is configured between slave chips. The result of the arbitration by the second round robin gives priority to the request from the slave chip in the split transfer mode or the cyclic transfer mode by giving a higher priority than the arbitration by the first round robin. Give usage rights.

バス使用権の優先度制御の一例については図11に示す。ここで、バス使用権n優先度遷移については、バス使用リクエスト無しの場合、state(2:0)を保持し、バス使用リクエスト有りの場合、state(2:0)はバス使用権を獲得したチップID+1に遷移する。また、バス使用権の優先度調整については、図8のバス使用モードの一例に加え、サイクリック転送のために、スレーブは内蔵するタイマに同期して、一定周期でバス要求を出力することにより、定期的な転送を実現する。   An example of priority control of the bus use right is shown in FIG. Here, regarding the bus use right n priority transition, state (2: 0) is retained when there is no bus use request, and state (2: 0) has acquired the bus use right when there is a bus use request. Transition to chip ID + 1. In addition to the example of the bus use mode in FIG. 8, the priority of the bus use right is adjusted by the slave outputting a bus request at a constant cycle in synchronization with the built-in timer for cyclic transfer. Realize regular transfers.

図12は、共通バスインターフェイス回路のチップ実装例を示す。この一例では、共通バスインターフェイス回路は、入出力ポートI/O、データ変換回路、バス調停回路、チップ識別IDメモリを備えている。LSIチップが持つアービトレーション回路に対して配設された共通バス用貫通電極と共通バスインターフェイス回路の入出力ポートI/Oとの間で共通バス信号が送受され、データ変換回路により、チップ内部回路との相互やり取りに必要なデータ形式の共通化のためのエンディアンの変換やデータ語長の変換といったデータ変換処理が施され、また、バス調停回路により、図10、図11に示すバス使用権の優先度制御に基づいて各チップのバスへのアクセスが調停される。   FIG. 12 shows a chip mounting example of the common bus interface circuit. In this example, the common bus interface circuit includes an input / output port I / O, a data conversion circuit, a bus arbitration circuit, and a chip identification ID memory. A common bus signal is transmitted and received between the common bus through electrode arranged for the arbitration circuit of the LSI chip and the input / output port I / O of the common bus interface circuit. Data conversion processing such as endian conversion and data word length conversion for the common data format necessary for mutual communication is performed, and the bus arbitration circuit gives priority to the bus use right shown in FIGS. Access to the bus of each chip is arbitrated based on the degree control.

図13は、バス信号の実装例を示す(マスター:8チップ、スレーブ:8チップ、計16チップの場合)。図中のタイプについては以下のとおりである。
A:Master:0がドライブする。他のチップは入力信号として参照する。
B:各チップはIDに基づき対応する1つの信号線をドライブし、それ以外の信号を入力として参照する。
C:バス権を保有するチップ、またはアクセス先のチップがドライブする。
FIG. 13 shows a mounting example of bus signals (master: 8 chips, slave: 8 chips, 16 chips in total). The types in the figure are as follows.
A: Master: 0 drives. Other chips refer to them as input signals.
B: Each chip drives a corresponding signal line based on the ID, and refers to other signals as inputs.
C: A chip having the bus right or an access destination chip drives.

以上のとおりの特徴を有する本発明は、低容量貫通電極を持つ3次元積層構造体とヘテロジニアスマルチコアチップとの組み合わせにより、以下の効果を実現することができる。   The present invention having the above-described features can realize the following effects by combining a three-dimensional laminated structure having a low-capacitance through electrode and a heterogeneous multi-core chip.

1)クロック周波数の低減
2)消費電力の低減
3)大容量データ処理に好適
4)システムの構築方法のフレキシビリティが広い
5)小型化
6)メモリチップの簡素化、高速大容量
1) Reduction of clock frequency 2) Reduction of power consumption 3) Suitable for large capacity data processing 4) Wide flexibility of system construction method 5) Miniaturization 6) Simplification of memory chip, high speed and large capacity

本発明による低容量貫通電極を用いた3次元積層構造の一例を示す図。The figure which shows an example of the three-dimensional laminated structure using the low capacity | capacitance penetration electrode by this invention. 本発明による3次元積層構造コンピュータシステムの一例を示す図。The figure which shows an example of the three-dimensional laminated structure computer system by this invention. 半導体LSIチップの一例を示す図。The figure which shows an example of a semiconductor LSI chip. 半導体LSIチップのID付与について説明する図。The figure explaining ID provision of a semiconductor LSI chip. 貫通電極配置の一例を示す図。The figure which shows an example of penetration electrode arrangement | positioning. 電源割当ての一例を示す図。The figure which shows an example of power supply allocation. 各チップ内の電源選択回路の一例を示す図。The figure which shows an example of the power supply selection circuit in each chip | tip. バス信号の動作タイミングの一例を示す図。The figure which shows an example of the operation timing of a bus signal. バス使用モードの一例を示す図。The figure which shows an example of bus use mode. バス使用権のアービトレーションの一例について説明する図。The figure explaining an example of arbitration of a bus use right. バス使用権の優先度制御の一例を示す図。The figure which shows an example of priority control of a bus use right. 共通バスインターフェイス回路実装の一例を示す図。The figure which shows an example of common bus interface circuit mounting. バス信号実装の一例を示す図。The figure which shows an example of bus signal mounting.

Claims (27)

貫通電極の周囲が電着型ポリイミドによって絶縁されており、電気容量が、LSIチップ内部の1mm以下の配線に起因する電気容量以下の値をもつ、低容量貫通電極を有する半導体LSIチップ。   A semiconductor LSI chip having a low-capacitance through electrode, wherein the periphery of the through electrode is insulated by electrodeposited polyimide, and the electric capacity has a value less than or equal to the electric capacity caused by wiring of 1 mm or less inside the LSI chip. 前記電気容量以下の値が0.1pFである、請求項1記載の半導体LSIチップ。   The semiconductor LSI chip according to claim 1, wherein a value equal to or less than the electric capacity is 0.1 pF. 請求項1または2記載の半導体LSIチップを基板上に複数個積層してなる、低容量貫通電極を有する3次元積層構造体。   A three-dimensional laminated structure having a low-capacitance through electrode, wherein a plurality of semiconductor LSI chips according to claim 1 or 2 are laminated on a substrate. 請求項1または2記載の半導体LSIチップ上にて低容量貫通電極を共通バスとする、マルチコアチップコンピュータシステム。   A multi-core chip computer system using a low-capacitance through electrode as a common bus on the semiconductor LSI chip according to claim 1. トライステート信号によるクロック、バス使用要求、アドレス、コマンド、データ、ステータスを含む共通バスで接続される、請求項4記載のマルチコアチップコンピュータシステム。   5. The multi-core chip computer system according to claim 4, wherein the multi-core chip computer system is connected by a common bus including a clock based on a tristate signal, a bus use request, an address, a command, data, and a status. 請求項1または2記載の半導体LSIチップを基板上に複数個積層してなり、各半導体LSIチップが異なる用途に応じて設計された特定用途用プロセッサである、3次元積層構造体コンピュータシステム。   A three-dimensional stacked structure computer system, wherein a plurality of semiconductor LSI chips according to claim 1 or 2 are stacked on a substrate, and each semiconductor LSI chip is a special-purpose processor designed for different applications. 各特定用途用プロセッサは、用途に応じた命令セットを持ち、相互にやり取りするデータの形式が共通となっている、請求項6記載の3次元積層構造体コンピュータシステム。   7. The three-dimensional stacked structure computer system according to claim 6, wherein each of the special purpose processors has an instruction set corresponding to the purpose, and has a common data format. データ形式の共通化手段として、エンディアンを変換する回路をバスインターフェイス内に有する、請求項7記載の3次元積層構造体コンピュータシステム。   8. The three-dimensional stacked structure computer system according to claim 7, wherein a circuit for converting the endian is provided in the bus interface as means for sharing the data format. 別々に設計された半導体LSIチップ間のやり取りが自動的に保障される、請求項6記載の3次元積層構造体コンピュータシステム。   7. The three-dimensional stacked structure computer system according to claim 6, wherein exchanges between separately designed semiconductor LSI chips are automatically secured. 前記保障は、チップ積層時に設定される各チップのバスIDに基づいて、各チップのバスへのアクセスがバスインターフェイス回路によって調停されることにより行われる、請求項9記載の3次元積層構造体コンピュータシステム。   10. The three-dimensional stacked structure computer according to claim 9, wherein the guarantee is performed by arbitrating access to the bus of each chip by a bus interface circuit based on the bus ID of each chip set at the time of stacking the chips. system. ビット幅の異なるデータの任意の半導体LSIチップ間の送受を制御する回路を備える、請求項6記載の3次元積層構造体コンピュータシステム。   The three-dimensional stacked structure computer system according to claim 6, further comprising a circuit for controlling transmission / reception of data having different bit widths between arbitrary semiconductor LSI chips. ビット幅の異なるデータの設定は初期設定で認識する、請求項10記載の3次元積層構造体コンピュータシステム。   The three-dimensional stacked structure computer system according to claim 10, wherein setting of data having different bit widths is recognized by an initial setting. 前記認識は、システムの起動時にホストとなるホストチップで動作するシステム初期化プログラムによって、初期化モードを使用してバスに接続された各チップの情報を読み出すことによって行われる、請求項12記載の3次元積層構造体コンピュータシステム。   13. The recognition is performed by reading information of each chip connected to the bus using an initialization mode by a system initialization program that operates on a host chip that is a host at the time of system startup. Three-dimensional laminated structure computer system. 前記各チップの情報は、製品ID、ベンダID、クラス、サブクラス、データサイズ、電源、および電流の少なくとも一つである、請求項13記載の3次元積層構造体コンピュータシステム。   14. The three-dimensional stacked structure computer system according to claim 13, wherein the information of each chip is at least one of product ID, vendor ID, class, subclass, data size, power source, and current. 前記ホストチップは、マスターバスID=0を持ち、前記初期化モードにおいて、前期ホストチップは、バスIDを用いてアクセス先のチップを指定する、請求項13記載の3次元積層構造体コンピュータシステム。   The three-dimensional stacked structure computer system according to claim 13, wherein the host chip has a master bus ID = 0, and in the initialization mode, the host chip specifies an access destination chip using the bus ID. 3次元積層構造体を構成する半導体LSIチップのそれぞれに分散アービトレーション回路が設けられている、請求項6から15のいずれか記載の3次元積層構造体コンピュータシステム。   16. The three-dimensional stacked structure computer system according to claim 6, wherein a distributed arbitration circuit is provided in each of the semiconductor LSI chips constituting the three-dimensional stacked structure. 前記分散アービトレーション回路は、リクエストを発行するマスター用のアービトレ−ション回路、およびリクエストを受け付けるスレーブ用のアービトレ−ション回路を含む、請求項16記載の3次元積層構造体コンピュータシステム。   17. The three-dimensional stacked structure computer system according to claim 16, wherein the distributed arbitration circuit includes an arbitration circuit for a master that issues a request and an arbitration circuit for a slave that receives a request. 前記マスター用のアービトレーション回路は、バスインターフェイスを用いて自発的に他のチップにアクセスするバスマスターチップに搭載される、請求項13記載の3次元積層構造体コンピュータシステム。   14. The three-dimensional stacked structure computer system according to claim 13, wherein the master arbitration circuit is mounted on a bus master chip that spontaneously accesses another chip using a bus interface. 前記バスマスターチップがプロセッサチップである、請求項18記載の3次元積層構造体コンピュータシステム。   19. The three-dimensional stacked structure computer system according to claim 18, wherein the bus master chip is a processor chip. 前記スレーブ用のアービトレーション回路は、バスインターフェイスを用いて他のチップからアクセスされるバススレーブチップ)に搭載される、請求項16記載の3次元積層構造体コンピュータシステム。   The three-dimensional stacked structure computer system according to claim 16, wherein the slave arbitration circuit is mounted on a bus slave chip accessed from another chip using a bus interface. 前記バススレーブチップがメモリである、請求項20記載の3次元積層構造体コンピュータシステム。   21. The three-dimensional stacked structure computer system according to claim 20, wherein the bus slave chip is a memory. 各アービトレーション回路は固有のIDを持つ、請求項16ないし21のいずれかに記載の3次元積層構造体コンピュータシステム。   The three-dimensional stacked structure computer system according to any one of claims 16 to 21, wherein each arbitration circuit has a unique ID. 3次元積層構造体を構成する半導体LSIチップは、コアプロセッサ、メモリ、無線通信、インターフェイス、センサ、マンマシンインターフェイス、暗号処理チップの少なくとも一つからなり、分散並列処理プログラムにより制御される、請求項6ないし22のいずれか記載の3次元積層構造体コンピュータシステム。   The semiconductor LSI chip constituting the three-dimensional stacked structure is composed of at least one of a core processor, a memory, a wireless communication, an interface, a sensor, a man-machine interface, and a cryptographic processing chip, and is controlled by a distributed parallel processing program. 23. The three-dimensional laminated structure computer system according to any one of 6 to 22. 各半導体チップは、コンピュータシステム設定用の初期化プログラムを分散並列処理プログラムとしてもつ、請求項23記載の3次元積層構造体コンピュータシステム。   The three-dimensional stacked structure computer system according to claim 23, wherein each semiconductor chip has an initialization program for computer system setting as a distributed parallel processing program. 前記初期化プログラムにおいて、ホストチップは、チップ固有の情報であるデスクリプタとバスIDに基づき、システムアドレスマップを作成し、該システムアドレスマップに従って、各バススレーブチップのベースアドレスと上限アドレスで規定されるアドレス範囲を設定する、請求項24記載の3次元積層構造体コンピュータシステム。   In the initialization program, the host chip creates a system address map based on the descriptor and bus ID, which are chip-specific information, and is defined by the base address and the upper limit address of each bus slave chip according to the system address map. The three-dimensional stacked structure computer system according to claim 24, wherein an address range is set. 各バススレーブチップは、自己の前記アドレス範囲をバスインターフェイス回路に書込み、自己へのアクセスを検出する、請求項25記載の3次元積層構造体コンピュータシステム。   26. The three-dimensional stacked structure computer system according to claim 25, wherein each bus slave chip writes its own address range to a bus interface circuit and detects access to the bus slave chip. 3次元積層構造体を構成する半導体チップの積層後に、相互のチップを認識しイニシャライズ動作を行って、システムが最適化されている、請求項6ないし26のいずれか記載の3次元積層構造体コンピュータシステム。   27. The three-dimensional stacked structure computer according to claim 6, wherein the system is optimized by recognizing each other chip and performing an initialization operation after stacking the semiconductor chips constituting the three-dimensional stacked structure. system.
JP2008093062A 2008-03-31 2008-03-31 Three-dimensional laminated structure computer system with low-capacity through electrode Active JP5412662B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008093062A JP5412662B2 (en) 2008-03-31 2008-03-31 Three-dimensional laminated structure computer system with low-capacity through electrode

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008093062A JP5412662B2 (en) 2008-03-31 2008-03-31 Three-dimensional laminated structure computer system with low-capacity through electrode

Publications (2)

Publication Number Publication Date
JP2009246246A true JP2009246246A (en) 2009-10-22
JP5412662B2 JP5412662B2 (en) 2014-02-12

Family

ID=41307797

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008093062A Active JP5412662B2 (en) 2008-03-31 2008-03-31 Three-dimensional laminated structure computer system with low-capacity through electrode

Country Status (1)

Country Link
JP (1) JP5412662B2 (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011113516A (en) * 2009-11-30 2011-06-09 National Institute Of Advanced Industrial Science & Technology Lsi chip lamination system
JP2011217169A (en) * 2010-03-31 2011-10-27 National Institute Of Advanced Industrial Science & Technology Packet switching system
KR101144159B1 (en) * 2010-12-07 2012-05-14 전남대학교산학협력단 3d multi-core processors using thermal-aware floorplan schemes
JP2013516006A (en) * 2009-12-29 2013-05-09 エンパイア テクノロジー ディベロップメント エルエルシー Shared memory for energy efficient multi-core processors
JP2016058777A (en) * 2014-09-05 2016-04-21 ルネサスエレクトロニクス株式会社 Semiconductor device
WO2019130702A1 (en) * 2017-12-27 2019-07-04 ソニーセミコンダクタソリューションズ株式会社 Image pickup device

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04269861A (en) * 1991-02-25 1992-09-25 Hitachi Ltd Semiconductor integrated circuit device
JP2002170903A (en) * 2000-11-29 2002-06-14 Fujitsu Ltd Semiconductor device
JP2003046057A (en) * 2001-07-27 2003-02-14 Toshiba Corp Semiconductor device
JP2003139818A (en) * 2001-10-30 2003-05-14 Hitachi Ltd Semiconductor integrated circuit and test method of the same
JP2005191255A (en) * 2003-12-25 2005-07-14 Jsr Corp Circuit board and method of manufacturing the same
JP2006114616A (en) * 2004-10-13 2006-04-27 Sharp Corp Element formation substrate and its manufacturing method as well as semiconductor device employing the same
JP2006190761A (en) * 2005-01-05 2006-07-20 Nec Corp Semiconductor chip and semiconductor device
WO2007002870A1 (en) * 2005-06-28 2007-01-04 Intel Corporation Method of forming through-silicon vias with stress buffer collars and resulting devices
JP2008050634A (en) * 2006-08-23 2008-03-06 National Institute Of Advanced Industrial & Technology Electrodeposited polyimide thin film and method for depositing the same

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04269861A (en) * 1991-02-25 1992-09-25 Hitachi Ltd Semiconductor integrated circuit device
JP2002170903A (en) * 2000-11-29 2002-06-14 Fujitsu Ltd Semiconductor device
JP2003046057A (en) * 2001-07-27 2003-02-14 Toshiba Corp Semiconductor device
JP2003139818A (en) * 2001-10-30 2003-05-14 Hitachi Ltd Semiconductor integrated circuit and test method of the same
JP2005191255A (en) * 2003-12-25 2005-07-14 Jsr Corp Circuit board and method of manufacturing the same
JP2006114616A (en) * 2004-10-13 2006-04-27 Sharp Corp Element formation substrate and its manufacturing method as well as semiconductor device employing the same
JP2006190761A (en) * 2005-01-05 2006-07-20 Nec Corp Semiconductor chip and semiconductor device
WO2007002870A1 (en) * 2005-06-28 2007-01-04 Intel Corporation Method of forming through-silicon vias with stress buffer collars and resulting devices
JP2008545251A (en) * 2005-06-28 2008-12-11 インテル・コーポレーション Method and apparatus for forming a through-silicon via with a stress buffer collar
JP2008050634A (en) * 2006-08-23 2008-03-06 National Institute Of Advanced Industrial & Technology Electrodeposited polyimide thin film and method for depositing the same

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011113516A (en) * 2009-11-30 2011-06-09 National Institute Of Advanced Industrial Science & Technology Lsi chip lamination system
JP2013516006A (en) * 2009-12-29 2013-05-09 エンパイア テクノロジー ディベロップメント エルエルシー Shared memory for energy efficient multi-core processors
US9367462B2 (en) 2009-12-29 2016-06-14 Empire Technology Development Llc Shared memories for energy efficient multi-core processors
JP2011217169A (en) * 2010-03-31 2011-10-27 National Institute Of Advanced Industrial Science & Technology Packet switching system
KR101144159B1 (en) * 2010-12-07 2012-05-14 전남대학교산학협력단 3d multi-core processors using thermal-aware floorplan schemes
JP2016058777A (en) * 2014-09-05 2016-04-21 ルネサスエレクトロニクス株式会社 Semiconductor device
WO2019130702A1 (en) * 2017-12-27 2019-07-04 ソニーセミコンダクタソリューションズ株式会社 Image pickup device
WO2019131965A1 (en) * 2017-12-27 2019-07-04 ソニーセミコンダクタソリューションズ株式会社 Imaging element
JPWO2019131965A1 (en) * 2017-12-27 2021-01-14 ソニーセミコンダクタソリューションズ株式会社 Image sensor
US11600651B2 (en) 2017-12-27 2023-03-07 Sony Semiconductor Solutions Corporation Imaging element
US11798972B2 (en) 2017-12-27 2023-10-24 Sony Semiconductor Solutions Corporation Imaging element

Also Published As

Publication number Publication date
JP5412662B2 (en) 2014-02-12

Similar Documents

Publication Publication Date Title
CN101981691B (en) Package on package using a bump-less build up layer (bbul) package
US8116100B2 (en) Semiconductor device
US8710676B2 (en) Stacked structure and stacked method for three-dimensional chip
CN101770439B (en) Electronic system and its method of operating
JP5412662B2 (en) Three-dimensional laminated structure computer system with low-capacity through electrode
US9941253B1 (en) Semiconductor packages including interconnectors and methods of fabricating the same
US9886275B1 (en) Multi-core processor using three dimensional integration
KR101748329B1 (en) Inter-chip memory interface structure
US20150054148A1 (en) Semiconductor packages including heat exhaust part
US10916524B2 (en) Stacked dice systems
JP2021057570A (en) Packaged device with chiplet comprising memory resources
TW202123794A (en) Reconstituted wafer assembly
TW202101727A (en) Interconnect hub for dies
EP3479399A1 (en) High density interconnect structures configured for manufacturing and performance
Chacin et al. COOL interconnect low power interconnection technology for scalable 3D LSI design
WO2018063261A1 (en) Die interconnect structures and methods
JP2021100099A (en) Embedded die architecture and method of making the same
CN114330201A (en) Packaging structure, device, board card and method for arranging integrated circuit
Matsumoto et al. Cool System scalable 3-D stacked heterogeneous Multi-Core/Multi-Chip architecture for ultra low-power digital TV applications
US11822475B2 (en) Integrated circuit with 3D partitioning
US20240213169A1 (en) Low die height glass substrate device and method
US20240213170A1 (en) Glass substrate device with embedded components
US20240215269A1 (en) Glass substrate device with through glass cavity
US20230317562A1 (en) Dual-sided terminal device with split signal and power routing
US10497669B2 (en) Hybrid die stacking

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100309

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20100309

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121116

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130128

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130708

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130906

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130930

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131023

R150 Certificate of patent or registration of utility model

Ref document number: 5412662

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250