DE112008002822T5

DE112008002822T5 - Dreidimensionale Chipstapel mit einer optischen Verbindung, die zwischen Vorrichtungen und innerhalb einer Vorrichtung vorliegt

Info

Publication number: DE112008002822T5
Application number: DE112008002822T
Authority: DE
Inventors: Nathan Lorenzo Palo Alto Binkert; Norman Paul Palo Alto Jouppi; Alan Lynn Palo Alto Davis; Raymond G. Redmond Beausoleil
Original assignee: Hewlett Packard Development Co LP
Current assignee: Hewlett Packard Enterprise Development LP
Priority date: 2007-10-23
Filing date: 2008-10-23
Publication date: 2011-02-17
Anticipated expiration: 2028-10-24
Also published as: WO2009055029A3; DE112008002822B4; JP2011501465A; KR20100087698A; JP5154652B2; WO2009055029A2; US20090103855A1; CN101836290B; US8064739B2; KR101513324B1; CN101836290A

Abstract

Eine Vorrichtung (100), die einen dreidimensionalen Stapel von Chips umfasst, wobei die Vorrichtung Folgendes umfasst:
einen elektrischen Chip (102, 104, 106), der eine Schaltungsanordnung zum Verarbeiten und Kommunizieren von elektrischen Signalen umfasst;
einen optischen Chip (108), der mit dem elektrischen Chip gekoppelt und in dem Stapel angeordnet ist, wobei der optische Chip Strukturen zum Transportieren und Modulieren optischer Signale umfasst; und
eine freiliegende optische Halbebene (128) des optischen Chip, die mit optischen Eingangs-/Ausgangstoren (125, 708, 802) konfiguriert ist.

Description

HINTERGRUND
QUERVERWEIS AUF VERWANDTE ANMELDUNGEN
Die vorliegende Patentanmeldung kann einen Gegenstand enthalten, der mit den folgenden Patentanmeldungen, die allesamt hiermit durch Bezugnahme aufgenommen sind, verwandt ist: (1) US-Patentanmeldung mit dem Titel „PHOTONIC INTERCONNECTS FOR COMPUTER SYSTEM DEVICES” der Erfinder Raymond G. Beausoleil, Marco Fiorentino, Norman Paul Jouppi, Qianfan Xu, Robert Samuel Schreiber und Nathan Lorenzo Binkert, Anwaltsaktenzeichen Nr. 200704210-1; und (2) US-Patentanmeldung mit dem Titel „THREE-DIMENSIONAL MEMORY MODULE ARCHITECTURES” der Erfinder Moray McLaren, Jung Ho Ahn, Alan Lynn Davis, Nathan Lorenzo Binkert und Norman Paul Jouppi, Anwaltsaktenzeichen Nr. 200703074-1.
TECHNISCHES GEBIET
Die vorliegende Anmeldung bezieht sich allgemein auf Prozessoren und Speicher für Computersysteme.
BESCHREIBUNG DES STANDES DER TECHNIK
Das Wachstum von zukünftigen auf Silizium basierenden Computersystemen wird im Wesentlichen durch die miteinander zusammenhängenden Probleme der Signalintegrität, des drahtbasierten globalen Signalisierens und thermischer Eigenschaften beschränkt. Da die Integrierte-Schaltung-Prozesstechnologie die Transistorgrößen progressiv schrumpfen lässt, werden die Drähte, die die Transistoren miteinander verbinden, zunehmend zu einem einschränkenden Problem.
Chipinterne Drähte können auf der Basis ihrer Länge kategorisiert werden: (i) lokale Drähte, die kurz sind und die Transistoren innerhalb einer einzelnen Ausführungseinheit, z. B. eines Addierers, miteinander verbinden; (ii) Drähte mittlerer Länge, die angrenzende Teilsysteme wie z. B. Registerdateien und eine Ausführungseinheit miteinander verbinden; und (iii) globale Drähte, die entfernte Teilsysteme wie z. B. eine Cachesteuerung und eine Registerdatei miteinander verbinden.
Lokale Drähte skalieren mit Transistoren und stellen folglich kein so großes Problem dar. Mittlere Drähte profitieren von einer ordnungsgemäßen Repeater-Einfügung und Low-k-Dielektrika.
Jedoch stellen globale Drähte bei Hochleistungssystemen ein Problem dar, da sie neben anderen Faktoren von großen Transistoren getrieben werden müssen. Dies verschlingt große Mengen an Leistung, was wiederum beträchtliche Wärme erzeugt. Angesichts der Dichte von Transistoren und den exponentiell eskalierenden Leckströmen bei hochentwickelten Prozessoren, die mit der Temperatur zunehmen, wird dies problematisch.
Die Probleme bei globalen Drähten werden durch die Tatsache, dass die Qualität des injizierten Signals mit der Drahtlänge abnimmt, noch verstärkt. Diese Qualitätsverschlechterung ist auf Probleme bezüglich eines kapazitiv gekoppelten Rauschens zurückzuführen. Im Grunde wird ein Draht eine umso bessere Antenne, je länger er wird. Die Probleme bezüglich eines kapazitiv gekoppelten Rauschens können durch eine Abschirmung behoben werden, die Abschirmung wiederum beeinflusst jedoch stark die Leistungsfähigkeit auf Grund einer Verringerung der Querschnittsbandbreite, da die Abschirmdrähte Fläche auf der Vorrichtung einnehmen, die für Signale verwendet werden könnte, was die Bandbreite erhöhen würde.
Chipexterne Drähte sind in Bezug auf Leistung, Signalintegrität, Energie pro Bit an Ausgangsbandbreite und in Bezug auf die Chipfläche, die für Anschlussflächen reserviert werden muss, ebenfalls problematisch.
Lösungen zum Ermöglichen, dass Computersysteme diese Einschränkungen von Signalintegrität, drahtbasiertem globalem Signalisieren und thermischen Eigenschaften überwinden.
ZUSAMMENFASSUNG
Computersysteme, die in einen dreidimensionalen (3D-)Stapel von Chips eingehäust sind, werden gemäß verschiedenen Ausführungsbeispielen der vorliegenden Erfindung beschrieben. Bei einem Ausführungsbeispiel umfasst das Computersystemgehäuse einen elektrischen Chip und einen optischen Chip, der mit dem elektrischen Chip gekoppelt und in dem Stapel angeordnet ist. Der elektrische Chip umfasst eine Schaltungsanordnung, um elektrische Signale zu verarbeiten und zu kommunizieren, und der optische Chip umfasst Strukturen, um optische Signale zu transportieren. Der elektrische Chip weist eine geringere Fläche auf als der optische Chip, so dass der optische Chip eine freiliegende Halbebene umfasst, die mit optischen Eingangs-/Ausgangstoren konfiguriert ist. Außerdem kann das Gehäuse dahin gehend konfiguriert sein, einen strukturellen Halt gegen Einfügungskräfte für externe optische Verbindungen zu liefern.
KURZE BESCHREIBUNG DER ZEICHNUNGEN
1 ist eine Querschnittsansicht einer Computersystemvorrichtung, die in einem 3D-Chipstapel, der einen optischen Chip umfasst, eingehäust ist, gemäß einem Ausführungsbeispiel der Erfindung.
2 ist ein schematisches Diagramm eines Multicluster-Computersystems gemäß einem Ausführungsbeispiel der Erfindung.
3 zeigt eine auseinander gezogene isometrische Ansicht von vier Chipschichten der Computersystemvorrichtung, in 1 gezeigt, gemäß einem Ausführungsbeispiel der Erfindung.
4A liefert ein beispielhaftes Layout eines Prozessorchip, das eine Schaltungsanordnung zeigt, die einem einzelnen Cluster zugeordnet ist, gemäß einem Ausführungsbeispiel der Erfindung.
4B zeigt ein Feld eines Speichersteuerungschip gemäß einem Ausführungsbeispiel der Erfindung.
5 ist ein schematisches Diagramm einer Schaltungsanordnung für ein einzelnes Rechencluster gemäß einem Ausführungsbeispiel der Erfindung.
6 zeigt eine vergrößerte, auseinander gezogene isometrische Ansicht der vier Halbleiterschichten der Rechenvorrichtung, in 1 gezeigt, gemäß einem Ausführungsbeispiel der Erfindung.
7 ist eine Draufsicht auf einen optischen Chip, die eine doppelseitige optische Halbebene gemäß einem Ausführungsbeispiel der Erfindung zeigt.
8 ist eine Querschnittsansicht einer Computersystemvorrichtung, die in einem 3D-Chipstapel, der einen optischen Chip umfasst, eingehäust ist, gemäß einem weiteren Ausführungsbeispiel der vorliegenden Erfindung.
AUSFÜHRLICHE BESCHREIBUNG
Die vorliegende Anmeldung offenbart Ausführungsbeispiele einer dreidimensionalen Chipstapelarchitektur und von Einhäusungstechniken. Die hierin offenbarten Ausführungsbeispiele können dazu verwendet werden, eine drahtbasierte elektronische Signalisierung für die Globalverbindung auf vorteilhafte Weise durch eine optische Verbindung zu ersetzen.
Vorteilhafterweise weist das optische Signalisieren die oben erörterten Probleme des elektrischen Signalisierens nicht auf. Der Grund dafür besteht darin, dass die Energie, die zum Senden eines Informationsbits mit Optik benötigt wird, nicht von der Länge des photonischen Wellenleiters für die interessierenden Strecken abhängig ist. Ferner skaliert die Energie pro Bit einer Verwendung einer optischen Verbindung mit VLSI-Technologie und ist um Größenordnungen geringer als die einer Verwendung einer elektrischen Verbindung. Somit mildert dies das thermische Problem beträchtlich ab. Außerdem weist eine optische Signalisierung nicht das Problem eines längenabhängigen gekoppelten Rauschens auf, und somit ist das Problem der Signalintegrität bei optischen Signalen kein Thema.
Ein weiteres Problem, das von manchen Ausführungsbeispielen der vorliegenden Erfindung überwunden wird, besteht darin, dass siliziumbasierte Laser eine extrem schlechte Qualität aufweisen. Manche hierin offenbarten Ausführungsbeispiele ermöglichen eine Vielzahl von extern bereitgestellten Laser (oder befestigten Lasern), die in der Lage sind, ausreichende optische Leistung zu liefern, um eine Signalisierungsleistung zu liefern, die für Erfordernisse innerhalb und außerhalb von Chipstapeln ausreichend ist.
Ein weiteres Problem, das von manchen Ausführungsbeispielen der vorliegenden Erfindung überwunden wird, bezieht sich auf die mechanische Integrität von durch Chips hindurch verlaufenden Durchgangslöcher. Durch Chips hindurch verlaufende Durchgangslöcher erfordern üblicherweise, dass die Wafer dünner werden, so dass Faserbefestigungseinfügungskräfte die physische Integrität der Chipstruktur nicht zuverlässig aufrechterhalten. Ein oder mehrere hierin offenbarte Ausführungsbeispiele ermöglichen, dass optische Fasern mit mechanischer Integrität an dem Chipstapel befestigt werden, um eine chipexterne Kommunikation zu unterstützen.
Ein Ausführungsbeispiel der vorliegenden Erfindung bezieht sich auf ein Einhäusungsverfahren, das einen photonischen Chip in einen dreidimensionalen (3D-)Chipstapel mit einer freiliegenden Halbebene integriert. Die freiliegende Halbebene ermöglicht eine Leistungseinkopplung entweder eines befestigten oder eines externen Lasers und legt auch optische Eingangs-/Ausgangstore (I/O-Tore) zur externen Kommunikation mit anderen Vorrichtungen in dem System frei. Der Chipstapel verwendet durch Chips hindurch verlaufende Durchgangslöcher. Eine Weitverkehrskommunikation zwischen Chips und eine Kommunikation innerhalb eines Chips kann auf optischen Wellenleitern erfolgen, die in einem optischen Chip platziert werden, der in dem 3D-Chipstapel konfiguriert ist.
Jeder befestigte oder externe Laser kann dahin gehend konfiguriert sein, Licht mit einer unterschiedlichen Frequenz in den optischen Chip einzukoppeln. Ein Bereitstellen von Laserlicht mit mehreren Frequenzen ermöglicht eine Wellenlängenmultiplexkommunikation innerhalb eines einzelnen Wellenleiters. Dies erhöht die effektive Bandbreite pro Querschnittsfläche. Die optischen I/O-Verbindungen können dazu verwendet werden, benachbarte Gehäuse durch optische Fasern hindurch oder mit angrenzenden Gehäusen über Fasern oder Wellenleiter im freien Raum zu verbinden.
Ein Aspekt der hierin offenbarten vorliegenden Erfindung ist das Freilegen einer optischen Halbebene für den optischen Chip. Optische Fasern können dahin gehend konfiguriert sein, sich mit externen optischen Anschlussflecken zu verbinden, die auf der optischen Halbebene angeordnet sind. Die befestigten oder externen Laser können dahin gehend konfiguriert sein, Laserleistung über eine separate Schnittstelle, die auf der optischen Halbebene angeordnet ist, in den photonischen Chip einzukoppeln. Optische Fasern können dahin gehend konfiguriert sein, zur Seite des Gehäuses hin zu verlaufen oder direkt zu benachbarten Gehäusen zu verlaufen.
1 ist eine Querschnittsansicht einer Computersystemvorrichtung, die in einem 3D-Chipstapel eingehäust ist, der eine photonische Verbindung auf einem optischen Chip in dem Stapel verwendet, gemäß einem Ausführungsbeispiel der Erfindung. Die Computersystemvorrichtung 100 umfasst einen Prozessorchip 102, einen Speichersteuerung/Verzeichnis/L2-Chip („Speichersteuerungschip”) 104, einen optionalen Chips mit analoger Elektronik 106, einen optischen Chip 108 und vier exemplarische in einem Stapel angeordnete Speicherchips 110–113, die in einem Gehäuse 120 stapelmäßig angeordnet sind. Die stapelmäßig angeordneten Speicherchips 110–113 können flüchtiger Speicher sein, z. B. dynamischer Direktzugriffsspeicher („DRAM” – dynamic random access memory), nicht-flüchtiger Speicher oder eine beliebige Kombination aus flüchtigem und nichtflüchtigem Speicher. Insbesondere können die stapelmäßig angeordneten Speicherchips 110–113 ein 8-Gigabyte(„GB”)-DRAM sein. Die Computersystemvorrichtung 100 umfasst auch eine Wärmesenke 118, die auf dem Gehäuse 120 in der Nähe des Prozessorchip 102 positioniert ist, und eine Anzahl von Durchgangslöchern, die durch vier Durchkontaktierungen 115, die sich von dem Speichersteuerungschip 104 durch den Chips mit analoger Elektronik 106 und den optischen Chip 108 hindurch zu den vier Speicherchips 110–113 erstrecken.
Die Chips 102, 104, 106, 108 und 110–113 können Dicken von etwa 25 bis etwa 50 Mikrometern aufweisen. Die Wärmesenke 118 leitet Wärme, die durch den Rechenbetrieb des Prozessorchip 102 erzeugt wird, ab, und die Durchkontaktierungen 115 können metallisierte oder mit Silizium gefüllte Durchgangslöcher sein, die Speichersteuerungen in dem Speicherchip elektrisch mit jedem der vier Speicherchips 110–113 verbinden. Die in dem Speichersteuerungschip 104 angeordneten Speichersteuerungen verwalten den Fluss von Daten zu und von den Speicherchips 110–113 und dem Fluss von Daten zu und von externen Vorrichtungen (nicht gezeigt). Der optische Chip 108 ist größer als die anderen Chips, was zu einer freiliegenden Halbebene 128 führt, die externe photonische Eingangs-/Ausgangsverbindungen 124, 126 umfassen kann, die dazu verwendet werden können, durch einen Wellenleiter wie z. B. eine optische Faser 124 Licht von einer externen Lichtquelle wie z. B. einem Laser 106 in die Computersystemvorrichtung 100 einzukoppeln oder datencodierte optische Signale an die und von der Computersystemvorrichtung 100 zu übertragen. Eine Diamantschicht 130 kann ebenfalls zwischen der unteren Oberfläche des optischen Chip 108 und der oberen Oberfläche des Speicherchip 110–113 enthalten sein. Die Diamantschicht 130 kann etwa 1–10 μm dick sein und kann dazu verwendet werden, Wärme, die durch den Prozessorchip 102 und den Speichersteuerungschip 104 erzeugt wird, zu verbreiten und abzuleiten.
Die in 1 gezeigte dreidimensionale Chipstapelung ermöglicht ein enges Koppeln des optischen Chip 108 mit den elektronischen Chips, liefert eine Zugänglichkeit der Speicherchips 110–113 bei niedriger Latenz, und dadurch, dass Clusterlogik und Speicher über stapelmäßig angeordnete angrenzende Chips 102 und 104 ausgebreitet werden, ist die elektrische Verdrahtung innerhalb eines Clusters gegenüber herkömmlichen Vorrichtungen verkürzt. Insbesondere liefert ein Stapeln der Speicherchips in unmittelbarer Nähe zu den Speichersteuerungen und eine Verwendung von Durchgangslöchern, die durch die Speicherschichten verlaufen, Verbindungen einer kürzeren Länge und eines geringeren Widerstands als die beträchtlich längeren, einen höheren Widerstand aufweisenden Verbindungen, die zum Verbinden von herkömmlichem Speicher mit Speichersteuerungen verwendet werden. Folglich ist die Leistung, oder Last, die zum Übertragen elektrischer Signale zwischen Chips der Computersystemvorrichtung 100 benötigt wird, beträchtlich geringer als die Leistung, die für herkömmliche Speicher-Zu-Speicher-Steuerungen benötigt wird.
Auf Grund der Wärmebelange und um eine Kühlung zu erleichtern, kann der heißeste Chip (der Chip, der während des Betriebs die meiste Wärme erzeugt) so stapelmäßig angeordnet werden, dass er der Chip ist, der am nächsten bei einer Wärmesenke 118 oder einer anderen Kühlvorrichtung gelegen ist. Der heißeste Chip in einem Stapel ist üblicherweise der Prozessorchip (Prozessor/L1-Chip) 102. Obwohl Konfigurationen veranschaulicht sind, bei denen ein Prozessorchip 102 sehr nahe an einer oder angrenzend an eine Wärmesenke 118 angebracht ist, sind auch andere Konfigurationen möglich. Statt der oder zusätzlich zu der Wärmesenke 118 können andere Kühlvorrichtungen verwendet werden. Beispielsweise kann ein Gebläse vorgesehen sein, um aktiv Luft über die Wärmesenke zu blasen, oder es kann eine thermoelektrische Kühlvorrichtung eingesetzt werden. Bei anderen Anwendungen kann ein Nicht-Prozessorchip dahin gehend konfiguriert sein, sich neben der Kühlvorrichtung zu befinden, oder es können mehr als eine Kühlvorrichtung vorgesehen sein.
Bei dem Ausführungsbeispiel ist ein Speichersteuerungschip (Speichersteuerung/Verzeichnis/L2-Chip) 104 mittels einer Vorderseite-Zu-Vorderseite-Bondverbindung 105 unterhalb des Prozessorchip 102 konfiguriert. Außerdem veranschaulicht dieses Beispiel einen optionalen Chips mit analoger Elektronik 106, der mittels einer Rückseite-Zu-Rückseite-Bondverbindung unterhalb des Speichersteuerungschip 104 konfiguriert ist.
Bei diesem Ausführungsbeispiel ist der optische Chip 108 mittels einer Vorderseite-Zu-Vorderseite-Bondverbindung 105 unterhalb der Chips mit analoger Elektronik 106 konfiguriert. Beispielsweise kann auf dem optischen Chip 108 eine Silizium-Germanium-Wellenleiterstruktur hergestellt werden. Hier ist der optische Chip 108 absichtlich so hergestellt, dass er entweder in der horizontalen und/oder in der Tiefenabmessung in dieser Figur größer ist als der Chips mit analoger Elektronik 106. Dieser Größenunterschied legt (einen) Optische-Halbebene-Bereich(e) 128 frei (eine beispielhafte Draufsicht findet sich in 7).
Die Optische-Halbebene-Bereiche sind freiliegende planare Bereiche 128, die Verbindungspunkte für befestigte oder externe Lichtquellen wie z. B. Nicht-Siliziumlaser und für die optischen I/O-Anschlussflächen (Eingangs-/Ausgangsanschlussflächen) enthalten können. Bei dem veranschaulichten Ausführungsbeispiel sind Laser 126 direkt an dem Halbebene-Bereich 128 des optischen (photonischen) Chip 108 befestigt. Bei einem alternativen Ausführungsbeispiel kann bzw. können statt der gezeigten befestigten Laser ein oder mehr optische Wellenleiter 124, die mit einem oder mehreren außerhalb des Chipstapels liegenden Laser verbunden sind, an Eingangslasertoren 125 auf dem (den) Optische-Halbebene-Bereich(en) befestigt sein. Beispielsweise ist bzw. sind eine oder mehrere optische Fasern 124 zur Eingabe/Ausgabe an den optischen I/O-Anschlussflächen 125 auf dem (den) Halbebene-Bereich(en) befestigt.
Die Laser können beispielsweise aus einem Material mit direktem Bandabstand, beispielsweise Indiumphosphid (InP), hergestellt werden. Bei einer Implementierung kann das Laserlicht unter Verwendung eines Leistungsteilers in mehrere (beispielsweise zehn) Wellenlängen aufgeteilt werden. Die Wellenlängen können beispielsweise im Bereich von 1400 bis 1500 Nanometern (nm) liegen, und die Modulation kann bei etwa 10 Gigahertz liegen. Bei einer Implementierung kann eine Wellenlänge verwendet und bei 100 Gigahertz moduliert werden. Andere spezifische Implementierungen können andere Wellenlängen und Modulationsfrequenzen verwenden.
Die externen optischen Wellenleiter 124 und/oder befestigten Laser 126 sind vorzugsweise mechanisch befestigt, um eine ordnungsgemäße Ausrichtung aufrechtzuerhalten. Mechanische Zugentlastungsmerkmale können für die befestigten optischen Fasern vorgesehen sein. Die mechanischen Zugentlastungsmerkmale können beispielsweise als Bestandteil des Gehäuses 120 und/oder in der Nähe des Verbindungspunktes mit dem optischen Chip 108 konfiguriert sein. Gemäß einem Ausführungsbeispiel können holographische Linsen, die oben auf dem optischen Chip 108 hergestellt werden, eine Schnittstelle zwischen Faser und optischem Chip bereitstellen.
Gemäß einem Ausführungsbeispiel der Erfindung ist ein robustes strukturelles Fundament vorgesehen, um den Einfügungskräften einer mechanischen Befestigung standzuhalten, ohne die dünnen und somit zerbrechlichen Chips in dem Stapel (besonders der zerbrechliche optische Chip 108, aber auch die anderen stapelmäßig angeordneten Chips) zu zerbrechen. Dies kann beispielsweise dadurch bewerkstelligt werden, dass der optische Chip 108 mit einem gleichen (wie in 1 gezeigt ist) oder größeren Basischip oder mit gleichen oder größeren Basischips getragen wird. Beispielsweise zeigt das veranschaulichte Ausführungsbeispiel Speicherchips 110–113 als Basischips, die mittels einer Vorderseite-Zu-Vorderseite-Bondverbindung 111 unterhalb des optischen Chip 108 konfiguriert sind. Je nach der Implementierung können derartige Speicherchips 110–113 optional sein. Bei einem anderen Ausführungsbeispiel kann bzw. können ein oder mehrere zusätzliche optische Chips (nicht veranschaulicht) als Basischip(s) unterhalb des optischen Chip 108 stapelmäßig angeordnet sein. Der Basischip wird bzw. die Basischips werden wiederum durch ein viel stärkeres mechanisches Gehäuse 120 getragen. Auf diese Weise liegt ein solides Fundament vor, das durch ein starres und robustes Gehäuse 120 gestützt wird, das den mechanischen Einfügungskräften, die erforderlich sind, um optische Verbinder wie z. B. optische Fasern (124) zu befestigen, standhalten kann. Beispielsweise kann das Gehäuse 120 ein Kugelrasterarray 132-Gehäuse umfassen.
2 ist ein schematisches Diagramm eines Multicluster-Computersystems gemäß einem Ausführungsbeispiel der Erfindung. Es sind mehrere Rechencluster 202 gezeigt, die mit einer photonischen Verbindung 204 verbunden sind. Jedes Cluster 202 kann auch mit einem optisch verbundenen Speicher 206 verbunden sein.
Die Funktionalitäten für die Systemkomponenten, die innerhalb der gestrichelten Linie in 2 gezeigt sind (d. h. die Cluster 202 und die photonische Verbindung 204), können durch den in 1 gezeigten Chipstapel bereitgestellt werden. Beispielsweise können die Funktionalitäten für die Cluster 202 durch den Prozessor/L1-Chip 104 und den Speichersteuerung/Verzeichnis/L2-Chip 106 bereitgestellt werden. Unterdessen können die Funktionalitäten für die photonische Verbindung 204 durch den optischen Chip 110 bereitgestellt werden. Die optisch verbundenen Speicher (OCMs – optically-connected memories) 206 können externe Speichervorrichtungen sein, die anhand der in 1 gezeigten Faser-I/Os 124 optisch mit dem Stapel verbunden sind.
Jedes Cluster des Prozessorchip 102 weist eine auf dem Speichersteuerungschip 104 angeordnete entsprechende Speichersteuerung auf, wobei jede Speichersteuerung eine Schnittstelle mit den stapelmäßig angeordneten Speicherchips 110–113 bildet oder eine photonische Verbindung mit einem chipexternen Speicher treibt, um eine Bandbreite zu liefern, die mit der Leistungsfähigkeit des Prozessorchips 102 skaliert. Die Cluster sind auch mit dem optischen Chip 108 photonisch gekoppelt, was eine hohe Bandbreite, eine geringe Latenz und einen sehr niedrigen Leistungsverbrauch bietet. Somit kann ein Programmierer, der die stapelmäßig angeordnete Rechenvorrichtung 100 zur Verfügung hat, eine Parallelität auf hoher Ebene ausdrücken und ist nicht mit Lokalitätsproblemen belastet, was die Schwierigkeit einer paralleler Entwicklung von Programmen stark verringert. Ferner kann die Architektur der Rechenvorrichtung 100 einem DRAM eine Bandbreite von einem Byte pro Flop liefern.
Wenn für jeden der Speicherchips 110–113 ein 8 GB-DRAM ausgewählt wird, liefert der stapelinterne Speicher 32 Gbytes eines DRAM, der durch die mehreren Durchgangslöcher, die durch den DRAM verlaufen, z. B. die Durchgangslöcher 120–123, direkt mit den Speichersteuerungen verbunden ist. Der DRAM wird durch 4 Speicherstapelschichten bereitgestellt, die zu etwa 25 bis 50 Mikrometern dünner gemacht sind, um eine Belastung der Durchgangslöcher bzw. die Leistungsmenge, die zum Verwenden der Durchgangslöcher benötigt wird, zu minimieren. Jede Schicht des DRAM-Stapels umfasst 64 nahezu identische Regionen, die bei dem obigen Prozessorchip 102 auf die Cluster abbilden. Jede DRAM-Region kann ferner in mehrere Banken unterteilt werden, die die Zeilenzugriffszeit verringern, und sie ermöglicht mehrere gleichzeitige Zugriffe. Beispielsweise kann jede Region bei einer Verwendung einer 20 nm-DRAM-Technologie 1 Gbit einer mittels eines Fehlerkorrekturcodes geschützten Speicherung liefern, so dass jede Speichersteuerung in dem Speichersteuerungschip 104 elektronisch mit 0,5 Gbytes an Speicher verbunden ist. Mehrere logische Kanäle liefern eine erhöhte Bandbreite in den Speicher hinein. Durch Bereitstellen einer erhöhten Bandbreite werden Bankkonflikte in dem DRAM reduziert. Jeder Speicherkanal besteht aus 72 Datenbits und etwa 30 Adress- und Steuerbits. Bei einer Verwendung von Durchkontaktierungen eines Abstands von 25 Mikrometern kann der Bereich über den Durchkontaktierungen weniger als 3% der Speicherschicht ausmachen, wobei 4 Kanäle pro Speichersteuerung angenommen werden. Durchkontaktierungen mit geringem Abstand ermöglichen, dass der DRAM so strukturiert wird, eine ganze Cachezeile aus einem einzigen Zeilenzugriff zu liefern. Außerdem können die Durchkontaktierungen Durchkontaktierungen auf ein oder mehrere Elemente in einer Schicht des Stapels abgestimmt sein. Manche Beispiele derartiger Elemente können Bitzeilen, Erfassungsverstärker und Eingangs-/Ausgangspuffer in einer Speicherschicht sein. Wenn 512 GB-DRAM ausgewählt wird und zu 64 separaten, optisch verbundenen Speichermodulen („OCM”) angeordnet wird. Die OCMs nutzen dieselbe grundlegende Technologie wie der oben beschriebene 8 GB-DRAM.
Der optische Chip 108 erfüllt zwei Funktionen. Erstens liefert der optische Chip 108 eine Schnittstelle mit den optischen Faserverbindungen, beispielsweise den externen photonischen Verbindungen 124 und 126. Zweitens liefert der optische Chip 108 eine leistungsarme Globalverbindung für den DRAM-Stapel. Die OCMs und der Prozessor sind durch optische Fasern 124 verbunden, was ganze 48 logische Kanäle liefert, die für Befehle oder andere anwendungsspezifische Datenaustauschoperationen verwendet werden können.
3 zeigt eine auseinander gezogene isometrische Ansicht des Prozessorchips 102, des Speichersteuerungschips 104, des Chip mit analoger Elektronik 106 und des optischen Chip 108 gemäß Ausführungsbeispielen der vorliegenden Erfindung. Wie in 3 gezeigt ist, sind der Prozessorchip 102 und der Speichersteuerungschip 104 in 64 Felder unterteilt. Bei diesem Beispiel stellt jedes Feld in dem Prozessorchip 102 vier als „Cluster” bezeichnete Kerne dar, und jedes Feld in dem Speichersteuerungschip 104 stellt einen L2-Cache, einen Verteiler, eine Speichersteuerung und andere Vorrichtungen dar, die in elektronischer Kommunikation mit einem entsprechenden Cluster stehen, das bei dem Prozessorchip 102 ungefähr direkt oberhalb angeordnet ist. Beispielsweise stellt ein Feld 302 des Speichersteuerungschips 104 einen L2-Cache, einen Verteiler, eine Speichersteuerung und andere Vorrichtungen dar, die unterhalb eines zugeordneten Clusters 304 angeordnet sind und in elektronischer Kommunikation mit demselben stehen. Die Cluster und Felder können ungefähr 3 mm mal 3 mm betragen, können jedoch auch größer oder kleiner ausfallen, je nach Implementierung. Ausführungsbeispiele der vorliegenden Erfindung sind nicht auf Cluster beschränkt, die vier Kerne aufweisen. Bei anderen Ausführungsbeispielen kann ein Cluster aus zwei, drei und vier oder mehr Kernen gebildet sein. Ein Beispiel eines Clusters und eines Feldes wird nachfolgend mit Bezugnahme auf die 4A–4B beschrieben.
Der optische Chip 108 umfasst 16 ungefähr regelmäßig beabstandete optoelektronische Wandler, z. B. einen optoelektronischen Wandler 306, ungefähr parallele (sich nicht kreuzende) Wellenleiter, die eine durch einen Streifen 308 dargestellte schlangenförmige Konfiguration aufweisen und die sich durch jeden der 16 regelmäßig beabstandeten optoelektronischen Wandler schlängeln, und 16 Bündel von 8 ungefähr parallelen Wellenleitern, wobei jedes Bündel von einem entsprechenden optoelektronischen Wandler ausgeht, beispielsweise das Bündel 310, das von dem optoelektronischen Wandler 306 ausgeht. Die schlangenförmigen Wellenleiter werden als „chipinterne Wellenleiter” bezeichnet, die eine photonische Kommunikation zwischen optoelektronischen Wandlern liefern, und die Wellenleiter, die die 16 Bündel von Wellenleitern umfassen, werden als „chipexterne Wellenleiter” bezeichnet, die eine photonische Kommunikation über externe photonische Verbindungen wie z. B. die optische Faser 124 mit Vorrichtungen liefern, die außerhalb der Rechenvorrichtung 100 angeordnet sind. Die 16 optoelektronischen Wandler sind jeweils aus vier optoelektronischen Wandlerblöcken gebildet (siehe 6). Jeder der optoelektronischen Wandlerblöcke („Wandlerblöcke”) steht in elektronischer Kommunikation mit einem der vier zugeordneten Felder in dem Speichersteuerungschip 104. 3 offenbart ferner zwei im Wesentlichen identische Kanalquellen 702 und 704, die an gegenüberliegenden Enden der schlangenförmigen chipinternen Wellenleiter 308 positioniert sind. Die Quellen 702 und 704 sind jeweils dahin gehend konfiguriert, denselben Satz von verschiedenen Kanälen auf jeden der chipinternen Wellenleiter in entgegengesetzten Richtungen auszugeben. Ein Richtungspfeil stellt die Richtung dar, in der Kanäle, die aus der Quelle 702 ausgegeben werden, übertragen werden, und ein Richtungspfeil stellt die Richtung dar, in der Kanäle, die aus der Quelle 704 ausgegeben werden, übertragen werden. Die schlangenförmigen chipinternen Wellenleiter 308 weisen eine Breite von ungefähr 1900 Mikrometern auf. Diese Lichtquellen können chipintern sein oder können externe Lichtquellen 126 sein. Externe Lichtquellen können aus anderen Materialien als Silizium hergestellt sein, beispielsweise aus III–V-Materialien, die für Laser besser geeignet sind.
Man beachte, dass die Kommunikation von optischen Signalen in den Vorrichtungen bei dem Chipstapel als innerhalb einer Vorrichtung erfolgende Kommunikationen betrachtet werden kann und dass die Kommunikation optischer Signale mit Vorrichtungen, die außerhalb des Chipstapels liegen, als zwischen Vorrichtungen vorliegende Kommunikationen betrachtet werden kann. Somit liefert die Wellenleiterstruktur der 3 sowohl eine zwischen Vorrichtungen als auch eine innerhalb einer Vorrichtung vorliegende optische Verbindung.
Der Chips mit analoger Elektronik 106 umfasst 16 Kontaktflächen, wobei jede Kontaktfläche zwischen vier Feldern in dem Speichersteuerungschip 104 und einem optoelektronischen Wandler in dem optischen Chip 108 angeordnet ist. Jede Kontaktfläche umfasst eine Anzahl von metallisierten oder mit Silizium gefüllten Durchkontaktierungen, die eine analoge elektronische Kommunikation zwischen den vier Feldern in dem Speichersteuerungschip 104 und den entsprechenden optoelektronischen Wandlern vorsehen. Daten werden durch die Kontaktflächen in Form von elektronischen analogen Signalen („elektrische Signale”) übertragen, da ein Erzeugen analoger Signale üblicherweise beträchtlich weniger Leistung verbraucht als ein Erzeugen digitaler elektrischer Signale. Eine derartige analoge Schicht kann dazu verwendet werden, digitale Signale von der Speichersteuerung in analoge Signale umzuwandeln, die benötigt werden, um Modulatoren oder andere Vorrichtungen auf der optischen Schicht zu steuern, oder dazu, analoge Ausgaben von Photodetektoren in digitale Signale umzuwandeln, die in die Speichersteuerung eingegeben werden sollen, oder zu anderen Zwecken.
Die folgende Beschreibung ist eine Übersicht darüber, wie ein Beispiel einer photonischen Verbindung auf einem optischen Chip 108 externe photonische Verbindungen, die durch die Halbebene 128 getragen werden, dazu nutzen kann, Daten zwischen Cluster und externen Vorrichtungen zu übertragen. Daten, die anhand eines Clusters des Prozessorchips 102, z. B. des Clusters 304, erzeugt werden, oder die aus einem Feld des Speichersteuerungschips 104, z. B. aus dem Feld 302, extrahiert werden, werden als datencodierte elektrische Signale durch Durchgangslöcher in einer Kontaktfläche 312 an einen entsprechenden (nicht gezeigten) Wandlerblock des optoelektronischen Wandlers 306 übertragen. Der Wandlerblock codiert die elektrischen Signale zu einer oder mehreren Wellenlängen einer als „Kanäle” bezeichneten elektromagnetischen Strahlung, die sich in einem oder mehreren der chipinternen Wellenleiter 308 ausbreitet. Ein Codieren von Daten zu unmodulierten Kanälen kann durch ein Modulieren der Intensität der Kanäle bewerkstelligt werden. Kanäle, die Daten führen, werden als „codierte Kanäle” bezeichnet.
Die codierten Kanäle können für (1) ein benachbartes Cluster 314, das ebenfalls in elektronische Kommunikation mit demselben optoelektronischen Wandler 306 steht, (2) ein Cluster, das sich andernorts in dem Prozessorchip 102 befindet, z. B. das Cluster 315, oder (3) eine externe Vorrichtung (nicht gezeigt) bestimmt sein. Wenn die codierten Kanäle für das benachbarte Cluster 314 bestimmt sind, empfängt sein entsprechender Wandlerblock, der sich in dem optoelektronischen Wandler 306 befindet, die codierten Kanäle und wandelt sie wieder in codierte elektrische Signale um, die durch die Kontaktfläche 312 zurück an das Cluster 314 übertragen werden. Wenn die datencodierten Kanäle für das Cluster 315 bestimmt sind, werden die codierten Kanäle entlang geeigneter chipinterner Wellenleiter an einen Wandlerblock übertragen, der dem Cluster 315 entspricht, das mit einem optoelektronischen Wandler 316 angeordnet ist. Die codierten Kanäle werden zurück in codierte elektrische Signale umgewandelt, die durch eine Kontaktfläche 318 an das Cluster 315 übertragen werden.
Wenn die codierten Kanäle für eine externe Vorrichtung bestimmt sind, platziert der Wandlerblock des optoelektronischen Wandlers 306 die codierten Kanäle auf chipexterne Wellenleiter des Bündels 310, wo die codierten Kanäle den optischen Chip 108 durch einen externen photonischen Verbinder wie z. B. die optische Faser 124 verlassen. Wenn eine externe Vorrichtung codierte Kanäle erzeugt, die für eines der vier Cluster 314 bestimmt sind, können die codierten Kanäle über die optische Faser 124 empfangen werden und entlang der chipexternen Wellenleiter in dem Bündel 310 an den optoelektronischen Wandler 306 übertragen werden, wo die codierten Kanäle in codierte elektrische Signale umgewandelt werden, die zur Verarbeitung durch die Kontaktfläche 312 an die vier Cluster 314 übertragen werden.
Cluster und Speichersteuerungen
4A zeigt ein Cluster 402 des Prozessorchips 102 gemäß Ausführungsbeispielen der vorliegenden Erfindung. Das Cluster 402 umfasst vier Kerne. Jeder Kern steht in elektrischer Kommunikation mit einem L1-Befehlscache und einem L1-Datencache. Ein L1-Befehlscache und ein L1-Datencache sind Hochgeschwindigkeits-Direktzugriffsspeicher, die Befehle und Daten, auf die häufig zugegriffen wird oder auf die in der letzten Zeit zugegriffen wurde, vorübergehend speichern.
4B zeigt ein Feld 404 des Speichersteuerungschips 104 gemäß Ausführungsbeispielen der vorliegenden Erfindung. Das Feld 404 umfasst einen L2-Cache und eine Komponentenregion 406, die einen Verteiler, eine Speichersteuerung, ein Verzeichnis, eine Netzwerkschnittstelle, eine Meine-Kreuzschiene-Verbindung und eine Partner-Kreuzschiene-Verbindung umfasst. Diese Kreuzschienenverbindungen können dahin gehend konfiguriert sein, mit entsprechenden Abschnitten der optoelektronischen Wandler eine Schnittstelle zu bilden. Der L2-Cache wird durch die vier Kerne des Clusters 402 gemeinsam genutzt. Eine L1–L2-Schnittstelle 408 ist ungefähr in der Mitte des Clusters 402 und des Feldes 404 positioniert und liefert eine elektronische Kommunikation zwischen dem Cluster 402 und dem Feld 404.
5 ist ein schematisches Diagramm einer Schaltungsanordnung für ein einzelnes Rechencluster gemäß einem Ausführungsbeispiel der vorliegenden Erfindung. Bei diesem Ausführungsbeispiel sind mehrere Prozessorkerne 1–4 gezeigt, von denen jeder einen zugeordneten Ebene-1-Cache (L1-Cache) umfasst. Diese Prozessorkerne (und zugeordneten L1-Caches) können auf dem Prozessor-/L1-Chip 102 vorgesehen sein.
Ein gemeinsam genutzter Ebene-2-Cache (L2-Cache) 504 ist mit jedem der Kerne 1–4 verbunden. Der L2-Cache 504 bildet eine Schnittstelle mit einer Verteilerverbindung 506. Die Verteilerverbindung 506 bildet ferner eine Schnittstelle mit verschiedenen Komponenten, z. B. einem Verzeichnismodul 508, einer Speichersteuerung 510, einer Netzwerkschnittstelle 514 und der photonischen Verbindung 204. Das Verzeichnismodul 508 kann dahin gehend konfiguriert sein, eine Cachekohärenz zu liefern, indem es beispielsweise einen globalen Zustand eines Speichers auf einer Pro-Cachezeile-Basis nachverfolgt. Die Speichersteuerung 510 kann Daten an einen und von einem Hauptspeicher (z. B. DRAM) transferieren. Der DRAM kann ein in 1 gezeigter stapelinterner DRAM 110–113 sein oder kann ein stapelexterner DRAM sein, z. B. optisch verbundene Speicher (OCMs), die anhand des Fasereingangs/der Faserausgänge 124 miteinander verbunden sind. Die Netzwerkschnittstelle 514 kann eine Dateneingabe/-ausgabe an Komponenten außerhalb des Stapels liefern, beispielsweise anhand des Fasereingangs/-ausgangs an Komponenten außerhalb des Stapels, beispielsweise anhand der Fasereingangs/der Faserausgänge 124.
6 zeigt eine vergrößerte, auseinander gezogene isometrische Ansicht von vier Clustern 602 des Prozessorchips 102, vier entsprechende Felder 604 des Speichersteuerungschips 104, eine Kontaktfläche 606 des Chip mit analoger Elektronik 106 und einen optoelektronischen Wandler 608 des optischen Chip 108, die gemäß Ausführungsbeispielen der vorliegenden Erfindung angeordnet sind. Wie in 6 gezeigt ist, umfasst der optoelektronische Wandler 608 vier einzelne optoelektronische Wandlerblöcke 610–613. Jeder Wandlerblock befindet sich über die Kontaktfläche 606 in elektronischer Kommunikation mit einem der vier Felder 604. Insbesondere steht das Feld 615 in elektronischer Kommunikation mit dem Wandlerblock 610, das Feld 616 steht in elektronischer Kommunikation mit dem Wandlerblock 611, das Feld 617 steht in elektronischer Kommunikation mit dem Wandlerblock 612, und das Feld 618 steht in elektronischer Kommunikation mit dem Wandlerblock 613. Die Wandlerblöcke 610–613 wandeln codierte elektrische Signale, die jeweils aus den Feldern 615–618 ausgegeben wurden, in codierte Kanäle um, die zur Verarbeitung durch andere Cluster auf einem Abschnitt der chipinternen Wellenleiter 308 übertragen werden können, oder die auf einem Bündel von Wellenleitern 620 zur Verarbeitung an externe Vorrichtungen übertragen werden können. Die Wandlerblöcke 610–613 wandeln auch codierte Kanäle, die in dem Bündel 620 und den chipinternen Wellenleitern 308 übertragen werden, in codierte elektrische Signale um, die durch die vier Cluster 602 separat verarbeitet werden können.
7 ist eine Draufsicht auf einen optischen Chip, die eine doppelseitige optische Halbebene zeigt, gemäß einem Ausführungsbeispiel der Erfindung. Wie in der Figur gezeigt ist, ist ein Mittenabschnitt 710 einer Vorderseite des optischen Chip 108 mit dem Chips mit analoger Elektronik 106 von Vorderseite zu Vorderseite verbunden. Die freiliegenden Halbebene-Regionen oder -Bereiche 128 können auf beiden Seiten des Mittenabschnitts 710 liegen, wie in 1. Bei einem anderen Ausführungsbeispiel können die freiliegenden Halbebene-Regionen oder -Bereiche auf allen vier Seiten des Mittenabschnitts liegen.
Wie in 7 gezeigt ist, können außerhalb des optischen Chip 108 liegende Laser 126 an einem oder beiden Halbebene-Bereichen 128 befestigt sein. Bei anderen Ausführungsbeispielen können statt der befestigten Laser optische Fasern, die mit außerhalb des Chipstapels liegenden Lasern verbunden sind, an Eingangslasertoren auf der optischen Halbebene 128 befestigt sein. Optische Fasern 124 zur Eingabe/Ausgabe können mit den externen optischen I/O-Bondverbindungen 708 auf dem optischen Chip 108 gekoppelt sein.
8 ist eine Querschnittsansicht einer Computersystemvorrichtung, die in einem 3D-Chipstapel 800 eingehäust ist, das einen optischen Chip umfasst, gemäß einem anderen Ausführungsbeispiel der vorliegenden Erfindung. Dieses Ausführungsbeispiel des 3D-Chipstapels verbindet den optischen Chip 108 bei einer Anordnung, bei der die optische Halbebene 128 auf der unteren Seite des optischen Chip freiliegend ist, mit dem Prozessorchip. Der optische Chip 108 nutzt bei diesem Beispiel ungefähr dieselbe Fläche wie der Prozessorchip 102 und steht über einen Speicherchip-L3-Cache-Chip 804 und den Speichersteuerungschip 104 vor. Durchkontaktierungen 115 erstrecken sich von dem Speichersteuerungschip 104 durch den L3-Cache-Chip 804. Die externe Eingangsausgangsbondverbindung 802 und die optische Faser 124 werden durch eine Seitenwand 810 getragen, die eine Öffnung aufweist, durch die die Faser 124 gelangen kann. Eine zusätzliche mechanische Zugentlastung 806 kann ebenfalls enthalten sein, um die Seitenwand darin zu unterstützen, den optischen Chip 108 und darüber liegende Schichten von unten zu tragen. Der externe Laser 126 wird durch eine Seitenwand 808 getragen.
Durch die oben offenbarte Architektur werden verschiedene Probleme und Schwierigkeiten überwunden. Erstens unterscheidet sich das Chipmaterial, das für eine Speicher- und Prozessor/Logik-Herstellung optimal ist, sehr stark von den Materialeigenschaften, die zum Erzeugen eines optischen Lasers optimal sind. Heutzutage werden für Speicher- und Logikstrukturen siliziumbasierte Strukturen verwendet, während integrierte Laser allgemein am besten unter Verwendung von III–V-Materialien, z. B. Indiumphosphid oder Galliumarsenid, hergestellt werden. Diese III–V-Materialien können dazu verwendet werden, Speicher- und Logikstrukturen herzustellen, die sehr schnell sind. Jedoch schließen die thermischen Eigenschaften dieser III–V-Materialien üblicherweise ihre Verwendung bei komplexen Hochleistungscomputersystemen von vorneherein aus.
Zweitens: Obwohl ein Stapeln von Chips ermöglicht, dass jeder Chip aus dem Material hergestellt wird, das gut darauf abgestimmt ist, die beabsichtigte Funktion des Chip zu erfüllen, bleibt das thermische Problem bestehen. Dadurch, dass eine Halbebene freigelegt wird und dass eine extern bereitgestellte Laserleistung gemäß Ausführungsbeispielen der Erfindung verwendet wird, wird es möglich, die Vorteile einer optischen Kommunikation aufzuweisen, ohne die thermische Dichte in dem Chipstapel zu erhöhen. Falls die thermische Dichte kein Problem ist, so kann das Ausführungsbeispiel des befestigten Lasers bevorzugt sein. Die freiliegende Halbebene, die mechanisch robust ist, bietet auch angrenzenden und/oder benachbarten Gehäusen die Vorteile einer optischen Kommunikation.
Drittens besteht ein beträchtliches Problem bei der Entwicklung von Hochleistungscomputerchips, besonders für Strukturgrößen von weniger als 250 Nanometern, darin, dass die langen Drahtverbindungen im Vergleich mit den Transistoren nicht gut skalieren. Im Einzelnen stellen die langen Drähte ein Hindernis bezüglich der Signalintegrität dar. Dies ist darauf zurückzuführen, dass ihre Kapazität zu viel Strom erfordert, um sich rasch aufzuladen, und somit zu Wärme führt, die nicht wirtschaftlich beseitigt werden kann. Lange Drähte sind auch für einen Hochgeschwindigkeitsbetrieb ein Hindernis. Im Grunde ist die Kapazität eines Drahtes eine Funktion der Fläche, und der Widerstandswert ist eine Funktion des Breite-Zu-Länge-Seitenverhältnisses des Drahtes. Folglich nehmen die Pro-Bit-Transportenergie und die Ausbreitungsverzögerung des Drahtes mit der Drahtlänge zu. Optische Kommunikation ist für die interessierenden Größenordnungen relativ unabhängig von der Pfadlänge. Deshalb verringert eine Verwendung einer optischen Verbindung die benötigte Leistung und die erzeugte Wärme, und sie verbessert die Leistungsfähigkeit von Computersystemen im Vergleich zu Systemen, die eine Weitverkehrskommunikation elektrisch unterstützen. Die Signalintegrität nimmt bei elektrischen Verbindungen ebenfalls mit der Länge ab. Photonische Verbindungen weisen dieses auf die Länge bezogene Problem nicht auf.
Bei der obigen Beschreibung sind zahlreiche spezifische Einzelheiten angegeben, um ein gründliches Verständnis von Ausführungsbeispielen der Erfindung zu vermitteln. Jedoch soll die obige Beschreibung von veranschaulichten Ausführungsbeispielen der Erfindung nicht erschöpfend sein oder die Erfindung auf die genauen offenbarten Formen beschränken. Fachleuten wird einleuchten, dass die Erfindung ohne eine oder mehrere der spezifischen Einzelheiten oder auch mit anderen Verfahren, Komponente usw. praktiziert werden kann. In anderen Fällen sind hinreichend bekannte Strukturen oder Vorgänge nicht ausführlich gezeigt oder beschrieben, um ein Verschleiern von Aspekten der Erfindung zu vermeiden. Obwohl spezifische Ausführungsbeispiele und Beispiele der Erfindung hierin zu Veranschaulichungszwecken beschrieben sind, sind im Rahmen des Schutzumfangs der Erfindung verschiedene äquivalente Modifikationen möglich, wie Fachleuten einleuchten wird.
Diese Modifikationen können angesichts der obigen ausführlichen Beschreibung an der Erfindung vorgenommen werden. Die in den folgenden Patentansprüchen verwendeten Begriffe sollten nicht dahin gehend ausgelegt werden, die Erfindung auf die in der Spezifikation und den Patentansprüchen offenbarten spezifischen Ausführungsbeispiele zu beschränken. Vielmehr soll der Schutzumfang der Erfindung durch die folgenden Patentansprüche bestimmt werden, die gemäß etablierten Grundsätzen der Anspruchsinterpretation ausgelegt werden sollen.
ZUSAMMENFASSUNG
Es werden Beispiele eines Computersystems (100) beschrieben, das in einem dreidimensionalen Stapel von Chips eingehäust ist. Das Gehäuse umfasst einen elektrischen Chip (102, 104, 106) und einen optischen Chip (108), der mit dem elektrischen Chip gekoppelt und in dem Stapel angeordnet ist. Der elektrische Chip umfasst eine Schaltungsanordnung, um elektrische Signale zu verarbeiten und zu kommunizieren, und der optische Chip umfasst Strukturen, um optische Signale zu transportieren. Der elektrische Chip weist eine geringere Fläche auf als der optische Chip, so dass der optische Chip eine freiliegende Halbebene (128) umfasst, die mit optischen Eingangs-/Ausgangstoren (125, 708, 802) konfiguriert ist. Außerdem kann das Gehäuse (120) dahin gehend konfiguriert sein, einen strukturellen Halt gegen Einfügungskräfte für externe optische Verbindungen (124) zu liefern.

Claims

Eine Vorrichtung (100), die einen dreidimensionalen Stapel von Chips umfasst, wobei die Vorrichtung Folgendes umfasst: einen elektrischen Chip (102, 104, 106), der eine Schaltungsanordnung zum Verarbeiten und Kommunizieren von elektrischen Signalen umfasst; einen optischen Chip (108), der mit dem elektrischen Chip gekoppelt und in dem Stapel angeordnet ist, wobei der optische Chip Strukturen zum Transportieren und Modulieren optischer Signale umfasst; und eine freiliegende optische Halbebene (128) des optischen Chip, die mit optischen Eingangs-/Ausgangstoren (125, 708, 802) konfiguriert ist.
Die Vorrichtung gemäß Anspruch 1, bei der der elektrische Chip eine kleinere Fläche aufweist als der optische Chip, und bei der die freiliegende optische Halbebene auf einer Seite des optischen Chip liegt, die dem elektrischen Chip zugewandt ist.
Die Vorrichtung gemäß Anspruch 1, die ferner Folgendes umfasst: ein oder mehrere Basischips (110, 111, 112, 113, 804), das beziehungsweise die mit dem optischen Chip auf einer Seite, die dem elektrischen Chip gegenüberliegt, gekoppelt und in dem Stapel angeordnet ist beziehungsweise sind, wobei der Basischip beziehungsweise die Basischips elektrische und/oder optische Chips umfasst beziehungsweise umfassen.
Die Vorrichtung gemäß Anspruch 3, bei der der Basischip zumindest einen Speicherchip umfasst.
Die Vorrichtung gemäß Anspruch 3, bei der der Basischip (804) eine geringere Fläche aufweist als der optische Chip (108), so dass die freiliegende optische Halbebene (128) auf einer Seite des optischen Chip liegt, die dem Basischip zugewandt ist.
Die Vorrichtung gemäß Anspruch 1, bei der die freiliegende optische Halbebene ferner zumindest einen Eingang (125, 708, 802) für Laserleistung von einem externen Laser umfasst.
Die Vorrichtung gemäß Anspruch 6, bei der der externe Laser (126) an der freiliegenden optischen Halbebene (128) befestigt ist.
Die Vorrichtung gemäß Anspruch 6, bei der der externe Laser anhand einer optischen Faser (124) mit der freiliegenden optischen Halbebene gekoppelt ist.
Die Vorrichtung gemäß Anspruch 1, die ferner elektrische Durchgangslöcher (115) umfasst, die dahin gehend konfiguriert sind, durch zumindest den optischen Chip zu verlaufen.
Die Vorrichtung gemäß Anspruch 1, die ferner Folgendes umfasst: eine Diamantschicht (130) zur Wärmeableitung, die zwischen dem optischen Chip und dem elektrischen Chip in dem Stapel angeordnet ist.
Eine Vorrichtung (100), die einen dreidimensionalen Stapel von Halbleiterchips aufweist, der Folgendes umfasst: einen elektrischen Chip (106), der zumindest eine Schaltungsanordnung mit analoger Elektronik umfasst; und einen optischen Chip (108), der Strukturen umfasst, um optische Signale zu transportieren und zu modulieren, und das mit dem elektrischen Chip gekoppelt ist; und einen Halbebene-Bereich (128) auf dem optischen Chip, der mit Eingang/Ausgang freiliegt
Die Vorrichtung gemäß Anspruch 11, die ferner Folgendes umfasst: zumindest einen zusätzlichen elektrischen Chip, der auf der Seite des elektrischen Chip (106) in dem Stapel angeordnet ist, die dem optischen Chip (108) gegenüberliegt, wobei der zumindest eine zusätzliche elektrische Chip (102, 104) zumindest eines der Gruppe umfasst, die aus einem Prozessorkern (102) oder einer Speichersteuerung (104) besteht.
Die Vorrichtung gemäß Anspruch 11, bei der der zumindest eine zusätzliche elektrische Chip eine Speichersteuerung (104) ist, und die ferner zumindest einen Speicherchip (110, 111, 112, 113) in dem Stapel und elektrische Durchkontaktierungen (115), die den zumindest einen Speicherchip mit der Speichersteuerung verbinden, umfasst.
Die Vorrichtung gemäß Anspruch 11, die ferner Folgendes umfasst: eine Diamantschicht (130) zur Wärmeableitung, die zwischen dem optischen Chip und dem elektrischen Chip in dem Stapel angeordnet ist.