DE112008002823T5 - Volloptische schnelle verteilte Entscheidung in einer Computersystemvorrichtung - Google Patents
Volloptische schnelle verteilte Entscheidung in einer Computersystemvorrichtung Download PDFInfo
- Publication number
- DE112008002823T5 DE112008002823T5 DE112008002823T DE112008002823T DE112008002823T5 DE 112008002823 T5 DE112008002823 T5 DE 112008002823T5 DE 112008002823 T DE112008002823 T DE 112008002823T DE 112008002823 T DE112008002823 T DE 112008002823T DE 112008002823 T5 DE112008002823 T5 DE 112008002823T5
- Authority
- DE
- Germany
- Prior art keywords
- light
- waveguide
- decision
- data
- cluster
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000003287 optical effect Effects 0.000 claims abstract description 64
- 238000004891 communication Methods 0.000 claims abstract description 40
- 230000004044 response Effects 0.000 claims abstract description 3
- 230000015654 memory Effects 0.000 description 75
- 230000005693 optoelectronics Effects 0.000 description 35
- 239000004065 semiconductor Substances 0.000 description 14
- 239000010410 layer Substances 0.000 description 9
- 238000000034 method Methods 0.000 description 9
- 238000012545 processing Methods 0.000 description 9
- 150000001875 compounds Chemical class 0.000 description 8
- 239000004038 photonic crystal Substances 0.000 description 7
- 230000005670 electromagnetic radiation Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 229910052710 silicon Inorganic materials 0.000 description 5
- 239000010703 silicon Substances 0.000 description 5
- 238000012546 transfer Methods 0.000 description 5
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 4
- WYTGDNHDOZPMIW-RCBQFDQVSA-N alstonine Natural products C1=CC2=C3C=CC=CC3=NC2=C2N1C[C@H]1[C@H](C)OC=C(C(=O)OC)[C@H]1C2 WYTGDNHDOZPMIW-RCBQFDQVSA-N 0.000 description 4
- 230000008878 coupling Effects 0.000 description 4
- 238000010168 coupling process Methods 0.000 description 4
- 238000005859 coupling reaction Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 239000000243 solution Substances 0.000 description 4
- 239000000758 substrate Substances 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 239000002184 metal Substances 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 229910003460 diamond Inorganic materials 0.000 description 2
- 239000010432 diamond Substances 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- BUHVIAUBTBOHAG-FOYDDCNASA-N (2r,3r,4s,5r)-2-[6-[[2-(3,5-dimethoxyphenyl)-2-(2-methylphenyl)ethyl]amino]purin-9-yl]-5-(hydroxymethyl)oxolane-3,4-diol Chemical compound COC1=CC(OC)=CC(C(CNC=2C=3N=CN(C=3N=CN=2)[C@H]2[C@@H]([C@H](O)[C@@H](CO)O2)O)C=2C(=CC=CC=2)C)=C1 BUHVIAUBTBOHAG-FOYDDCNASA-N 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000013019 agitation Methods 0.000 description 1
- 230000003466 anti-cipated effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- -1 data transport Chemical class 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000003989 dielectric material Substances 0.000 description 1
- 238000009429 electrical wiring Methods 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000012913 prioritisation Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G02—OPTICS
- G02B—OPTICAL ELEMENTS, SYSTEMS OR APPARATUS
- G02B6/00—Light guides; Structural details of arrangements comprising light guides and other optical elements, e.g. couplings
- G02B6/24—Coupling light guides
- G02B6/42—Coupling light guides with opto-electronic elements
- G02B6/43—Arrangements comprising a plurality of opto-electronic elements and associated optical interconnections
-
- G—PHYSICS
- G02—OPTICS
- G02B—OPTICAL ELEMENTS, SYSTEMS OR APPARATUS
- G02B6/00—Light guides; Structural details of arrangements comprising light guides and other optical elements, e.g. couplings
- G02B6/10—Light guides; Structural details of arrangements comprising light guides and other optical elements, e.g. couplings of the optical waveguide type
- G02B6/12—Light guides; Structural details of arrangements comprising light guides and other optical elements, e.g. couplings of the optical waveguide type of the integrated circuit kind
- G02B6/12007—Light guides; Structural details of arrangements comprising light guides and other optical elements, e.g. couplings of the optical waveguide type of the integrated circuit kind forming wavelength selective elements, e.g. multiplexer, demultiplexer
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01L—SEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
- H01L25/00—Assemblies consisting of a plurality of individual semiconductor or other solid state devices ; Multistep manufacturing processes thereof
- H01L25/03—Assemblies consisting of a plurality of individual semiconductor or other solid state devices ; Multistep manufacturing processes thereof all the devices being of a type provided for in the same subgroup of groups H01L27/00 - H01L33/00, or in a single subclass of H10K, H10N, e.g. assemblies of rectifier diodes
- H01L25/04—Assemblies consisting of a plurality of individual semiconductor or other solid state devices ; Multistep manufacturing processes thereof all the devices being of a type provided for in the same subgroup of groups H01L27/00 - H01L33/00, or in a single subclass of H10K, H10N, e.g. assemblies of rectifier diodes the devices not having separate containers
- H01L25/065—Assemblies consisting of a plurality of individual semiconductor or other solid state devices ; Multistep manufacturing processes thereof all the devices being of a type provided for in the same subgroup of groups H01L27/00 - H01L33/00, or in a single subclass of H10K, H10N, e.g. assemblies of rectifier diodes the devices not having separate containers the devices being of a type provided for in group H01L27/00
- H01L25/0657—Stacked arrangements of devices
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01L—SEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
- H01L25/00—Assemblies consisting of a plurality of individual semiconductor or other solid state devices ; Multistep manufacturing processes thereof
- H01L25/18—Assemblies consisting of a plurality of individual semiconductor or other solid state devices ; Multistep manufacturing processes thereof the devices being of types provided for in two or more different subgroups of the same main group of groups H01L27/00 - H01L33/00, or in a single subclass of H10K, H10N
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01L—SEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
- H01L31/00—Semiconductor devices sensitive to infrared radiation, light, electromagnetic radiation of shorter wavelength or corpuscular radiation and specially adapted either for the conversion of the energy of such radiation into electrical energy or for the control of electrical energy by such radiation; Processes or apparatus specially adapted for the manufacture or treatment thereof or of parts thereof; Details thereof
- H01L31/08—Semiconductor devices sensitive to infrared radiation, light, electromagnetic radiation of shorter wavelength or corpuscular radiation and specially adapted either for the conversion of the energy of such radiation into electrical energy or for the control of electrical energy by such radiation; Processes or apparatus specially adapted for the manufacture or treatment thereof or of parts thereof; Details thereof in which radiation controls flow of current through the device, e.g. photoresistors
- H01L31/10—Semiconductor devices sensitive to infrared radiation, light, electromagnetic radiation of shorter wavelength or corpuscular radiation and specially adapted either for the conversion of the energy of such radiation into electrical energy or for the control of electrical energy by such radiation; Processes or apparatus specially adapted for the manufacture or treatment thereof or of parts thereof; Details thereof in which radiation controls flow of current through the device, e.g. photoresistors characterised by at least one potential-jump barrier or surface barrier, e.g. phototransistors
- H01L31/101—Devices sensitive to infrared, visible or ultraviolet radiation
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01L—SEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
- H01L2224/00—Indexing scheme for arrangements for connecting or disconnecting semiconductor or solid-state bodies and methods related thereto as covered by H01L24/00
- H01L2224/01—Means for bonding being attached to, or being formed on, the surface to be connected, e.g. chip-to-package, die-attach, "first-level" interconnects; Manufacturing methods related thereto
- H01L2224/10—Bump connectors; Manufacturing methods related thereto
- H01L2224/12—Structure, shape, material or disposition of the bump connectors prior to the connecting process
- H01L2224/13—Structure, shape, material or disposition of the bump connectors prior to the connecting process of an individual bump connector
- H01L2224/13001—Core members of the bump connector
- H01L2224/1302—Disposition
- H01L2224/13025—Disposition the bump connector being disposed on a via connection of the semiconductor or solid-state body
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01L—SEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
- H01L2224/00—Indexing scheme for arrangements for connecting or disconnecting semiconductor or solid-state bodies and methods related thereto as covered by H01L24/00
- H01L2224/01—Means for bonding being attached to, or being formed on, the surface to be connected, e.g. chip-to-package, die-attach, "first-level" interconnects; Manufacturing methods related thereto
- H01L2224/42—Wire connectors; Manufacturing methods related thereto
- H01L2224/44—Structure, shape, material or disposition of the wire connectors prior to the connecting process
- H01L2224/45—Structure, shape, material or disposition of the wire connectors prior to the connecting process of an individual wire connector
- H01L2224/45001—Core members of the connector
- H01L2224/45099—Material
- H01L2224/451—Material with a principal constituent of the material being a metal or a metalloid, e.g. boron (B), silicon (Si), germanium (Ge), arsenic (As), antimony (Sb), tellurium (Te) and polonium (Po), and alloys thereof
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01L—SEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
- H01L2224/00—Indexing scheme for arrangements for connecting or disconnecting semiconductor or solid-state bodies and methods related thereto as covered by H01L24/00
- H01L2224/01—Means for bonding being attached to, or being formed on, the surface to be connected, e.g. chip-to-package, die-attach, "first-level" interconnects; Manufacturing methods related thereto
- H01L2224/42—Wire connectors; Manufacturing methods related thereto
- H01L2224/47—Structure, shape, material or disposition of the wire connectors after the connecting process
- H01L2224/48—Structure, shape, material or disposition of the wire connectors after the connecting process of an individual wire connector
- H01L2224/4805—Shape
- H01L2224/4809—Loop shape
- H01L2224/48091—Arched
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01L—SEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
- H01L2224/00—Indexing scheme for arrangements for connecting or disconnecting semiconductor or solid-state bodies and methods related thereto as covered by H01L24/00
- H01L2224/73—Means for bonding being of different types provided for in two or more of groups H01L2224/10, H01L2224/18, H01L2224/26, H01L2224/34, H01L2224/42, H01L2224/50, H01L2224/63, H01L2224/71
- H01L2224/732—Location after the connecting process
- H01L2224/73251—Location after the connecting process on different surfaces
- H01L2224/73253—Bump and layer connectors
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01L—SEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
- H01L2224/00—Indexing scheme for arrangements for connecting or disconnecting semiconductor or solid-state bodies and methods related thereto as covered by H01L24/00
- H01L2224/73—Means for bonding being of different types provided for in two or more of groups H01L2224/10, H01L2224/18, H01L2224/26, H01L2224/34, H01L2224/42, H01L2224/50, H01L2224/63, H01L2224/71
- H01L2224/732—Location after the connecting process
- H01L2224/73251—Location after the connecting process on different surfaces
- H01L2224/73265—Layer and wire connectors
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01L—SEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
- H01L2225/00—Details relating to assemblies covered by the group H01L25/00 but not provided for in its subgroups
- H01L2225/03—All the devices being of a type provided for in the same subgroup of groups H01L27/00 - H01L33/648 and H10K99/00
- H01L2225/04—All the devices being of a type provided for in the same subgroup of groups H01L27/00 - H01L33/648 and H10K99/00 the devices not having separate containers
- H01L2225/065—All the devices being of a type provided for in the same subgroup of groups H01L27/00 - H01L33/648 and H10K99/00 the devices not having separate containers the devices being of a type provided for in group H01L27/00
- H01L2225/06503—Stacked arrangements of devices
- H01L2225/06541—Conductive via connections through the device, e.g. vertical interconnects, through silicon via [TSV]
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01L—SEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
- H01L24/00—Arrangements for connecting or disconnecting semiconductor or solid-state bodies; Methods or apparatus related thereto
- H01L24/01—Means for bonding being attached to, or being formed on, the surface to be connected, e.g. chip-to-package, die-attach, "first-level" interconnects; Manufacturing methods related thereto
- H01L24/10—Bump connectors ; Manufacturing methods related thereto
- H01L24/12—Structure, shape, material or disposition of the bump connectors prior to the connecting process
- H01L24/13—Structure, shape, material or disposition of the bump connectors prior to the connecting process of an individual bump connector
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01L—SEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
- H01L24/00—Arrangements for connecting or disconnecting semiconductor or solid-state bodies; Methods or apparatus related thereto
- H01L24/01—Means for bonding being attached to, or being formed on, the surface to be connected, e.g. chip-to-package, die-attach, "first-level" interconnects; Manufacturing methods related thereto
- H01L24/10—Bump connectors ; Manufacturing methods related thereto
- H01L24/15—Structure, shape, material or disposition of the bump connectors after the connecting process
- H01L24/16—Structure, shape, material or disposition of the bump connectors after the connecting process of an individual bump connector
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01L—SEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
- H01L24/00—Arrangements for connecting or disconnecting semiconductor or solid-state bodies; Methods or apparatus related thereto
- H01L24/01—Means for bonding being attached to, or being formed on, the surface to be connected, e.g. chip-to-package, die-attach, "first-level" interconnects; Manufacturing methods related thereto
- H01L24/42—Wire connectors; Manufacturing methods related thereto
- H01L24/44—Structure, shape, material or disposition of the wire connectors prior to the connecting process
- H01L24/45—Structure, shape, material or disposition of the wire connectors prior to the connecting process of an individual wire connector
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01L—SEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
- H01L24/00—Arrangements for connecting or disconnecting semiconductor or solid-state bodies; Methods or apparatus related thereto
- H01L24/01—Means for bonding being attached to, or being formed on, the surface to be connected, e.g. chip-to-package, die-attach, "first-level" interconnects; Manufacturing methods related thereto
- H01L24/42—Wire connectors; Manufacturing methods related thereto
- H01L24/47—Structure, shape, material or disposition of the wire connectors after the connecting process
- H01L24/48—Structure, shape, material or disposition of the wire connectors after the connecting process of an individual wire connector
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01L—SEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
- H01L2924/00—Indexing scheme for arrangements or methods for connecting or disconnecting semiconductor or solid-state bodies as covered by H01L24/00
- H01L2924/01—Chemical elements
- H01L2924/01019—Potassium [K]
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01L—SEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
- H01L2924/00—Indexing scheme for arrangements or methods for connecting or disconnecting semiconductor or solid-state bodies as covered by H01L24/00
- H01L2924/01—Chemical elements
- H01L2924/01068—Erbium [Er]
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01L—SEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
- H01L2924/00—Indexing scheme for arrangements or methods for connecting or disconnecting semiconductor or solid-state bodies as covered by H01L24/00
- H01L2924/10—Details of semiconductor or other solid state devices to be connected
- H01L2924/11—Device type
- H01L2924/12—Passive devices, e.g. 2 terminal devices
- H01L2924/1204—Optical Diode
- H01L2924/12043—Photo diode
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01L—SEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
- H01L2924/00—Indexing scheme for arrangements or methods for connecting or disconnecting semiconductor or solid-state bodies as covered by H01L24/00
- H01L2924/10—Details of semiconductor or other solid state devices to be connected
- H01L2924/11—Device type
- H01L2924/14—Integrated circuits
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Microelectronics & Electronic Packaging (AREA)
- General Physics & Mathematics (AREA)
- Power Engineering (AREA)
- Condensed Matter Physics & Semiconductors (AREA)
- Computer Hardware Design (AREA)
- Optics & Photonics (AREA)
- Electromagnetism (AREA)
- Optical Communication System (AREA)
- Optical Integrated Circuits (AREA)
- Optical Modulation, Optical Deflection, Nonlinear Optics, Optical Demodulation, Optical Logic Elements (AREA)
Abstract
einen ersten Wellenleiter (1832, 2008);
eine Lichtquelle (1834, 2006) zum Senden von Licht über den ersten Wellenleiter (1832, 2001);
einen ersten Lichtumleiter (1837, 1838, 1839, 1840, 2010, 2012, 2014), der mit dem ersten Wellenleiter gekoppelt ist zum Umleiten des Lichts;
einen ersten Detektor (1841, 1842, 1843, 1844, 2018, 2022, 2026), der mit dem ersten Lichtumleiter gekoppelt ist zum Erfassen des Lichts;
einen ersten Modulator (1841, 1842, 1843, 1844, 0b, 1b, 2b) zum Modulieren von Licht zum Tragen von Daten ansprechend darauf, dass der erste Detektor das Licht erfasst; und
einen Datenwellenleiter (1814, 1815, 1816, 1827, 2030), der mit dem ersten Modulator gekoppelt ist zum Tragen des modulierten Lichts.
Description
- Technisches Gebiet
- Ausführungsbeispiele der vorliegenden Erfindung beziehen sich auf eine Entscheidung für Ressourcen in einer Computersystemvorrichtung, insbesondere eine Entscheidung für optische Kanäle in einer photonischen Verbindung, die Kommunikation zwischen Computersystemkomponenten in der Computersystemvorrichtung bereitstellt.
- Hintergrund
- In der Mitte der 60er Jahre des letzten Jahrhunderts haben Halbleiterhersteller beobachtet, dass sich die Dichte von Schaltungen, wie z. B. Transistoren, die auf integrierten Schaltungen hergestellt werden, etwa alle 18 Monate verdoppelt. Dieser Trend hat sich fortgesetzt und wird nun als „Mooresches Gesetz” bezeichnet. Die Transistordichte wird als grobe Messung der Computerverarbeitungsleistung angesehen, die wiederum der Datenverarbeitungsgeschwindigkeit entspricht. Obwohl das Mooresche Gesetz ursprünglich eine Beobachtung war, wurde das Mooresche Gesetz im Laufe der Zeit in der Halbleiterindustrie weithin anerkannt als grundlegende Antriebskraft hinter der steigenden Computerverarbeitungsleistung. Als Folge haben Halbleiterhersteller Technologien entwickelt zum Reduzieren der Größe von Chipkomponenten auf Abmessungen im Mikromaßstab und sogar im Nanomaßstab. Computersystemarchitekturen für Computersysteme (einige Beispiele dafür sind ein Speichermodulsystem, eine Einkernprozessorvorrichtung oder eine Mehrkernprozessorvorrichtung) stoßen an Grenzen bei dem Versuch, mit dem Mooreschen Gesetz mithalten zu können.
- Das Mehrkernsystem stellt einige der auftretenden Probleme beispielhaft dar. In den letzten Jahren hat die Halbleiterindustrie Prozessoren entwickelt, die zwei oder mehr Teilprozessoren umfassen, die als „Kerne” bezeichnet werden. Ein Zweikernprozessor enthält beispielsweise zwei Kerne und ein Vierkernprozessor enthält vier Kerne. Typischerweise sind die Kerne integriert, verwenden die gleichen Verbindungen zum Rest des Systems gemeinschaftlich und können unabhängig arbeiten. Obwohl Halbleiterhersteller die Transistordichte eines einzelnen Kerns erhöhen können, haben sich Halbleiterhersteller aufgrund von ineffizienter Leistungsaufnahme noch nicht in diese Richtung bewegt. Die Alternative ist es, die Anzahl von Kernen zu erhöhen, die auf einen einzelnen Stück bzw. Die gehäust werden. Ein Stück ist eine einzelne Schicht aus Halbleitermaterial, auf der eine integrierte Schaltung („Chip”) hergestellt wird. Chipinterne und chipexterne Kommunikation hat sich jedoch als ein kritisches Thema erwiesen zum Beibehalten des Leistungswachstums für die anspruchsvollen datenintensiven Anwendungen, für die diese Mehrkernchips benötigt werden. Rechenbandbreite skaliert linear mit der wachsenden Anzahl von Kernen, aber die Rate, mit der Daten über einen Mehrkernchip kommuniziert werden können unter Verwendung von hochwertigen Metalldrähten, nimmt mit einer sehr viel langsameren Geschwindigkeit zu. Außerdem wächst die Rate, mit der Daten chipextern durch Anschlussstifte kommuniziert werden können, die entlang dem Chiprand angeordnet sind, ebenfalls sehr viel langsamer als Rechenbandbreite und Energiekosten von chipinterner und chipexterner Kommunikation begrenzt die erreichbare Bandbreite wesentlich. Folglich ist die Computerarchitektur nun an einem Scheideweg und Physiker und Ingenieure suchen Alternativen zu der Verwendung von Metalldrähten für chipinterne und chipexterne Kommunikation.
- Computersystemkomponenten, wie z. B. die Kerne auf einem Chip, kommunizieren miteinander über eine gemeinsame Verbindung und verwenden Ressourcen gemeinschaftlich. Ein Mechanismus zum Vermeiden von Konflikten oder Kollision ist das Verwenden eines Entscheidungsmechanismus, durch den die Komponenten bestimmen können, welche zu jedem bestimmten Zeitpunkt Zugriff zu der Ressource erhält.
- Entscheidung für gemeinschaftlich verwendete Ressourcen ist wesentlich für die Leistungsfähigkeit vieler Systeme, eine effiziente Entscheidung zwischen vielen Anforderern für eine Ressource ist häufig sehr langsam relativ zu Prozessortaktzyklen. Ferner kann die Entscheidung bei hohen Prozessortaktfrequenzen eine große Menge an Leistung aufnehmen, wenn eine moderat komplexe elektrische Implementierung vorausgesetzt wird.
- Das Steuern von N-Eingangs-, N-Ausgangs-Kreuzschienen, um jedem Ausgangstor einen eindeutigen Sender zuzuweisen, ist ein Standardproblem bei der Computervernetzung. Die normalen Hardwarelösungen sind entwickelt für Systeme mit virtuellen Ausgabewarteschlangen (VOQs; VOQ = virtual Output queue), bei denen jeder Sender eine VOQ pro Empfänger aufweist. Die best mögliche Lösung kann berechnet werden durch einen Offline-Sequentiell-Agorithmus in O(N2,5) Zeit durch den Hopcroft-Karg-Algorithmus für maximale Übereinstimmung in einem zweiteiligen Graph, aber dies wäre viel zu langsam für die Verwendung als ein Kreuzschienenentscheidungsschema. Stattdessen wird für elektronisch gesteuerte Netzwerkschaltstrukturen ein paralleles iteratives Online-Schema verwendet. In jeder Runde eines iterativen Mehrrundenprozesses fordern Sender das Recht an, an Empfänger zu senden, eine Entscheidungsvorrichtung sendet ansprechend auf einige dieser Anforderungen Gewährungen zurück und einige dieser Gewährungen werden dann angenommen. Eine maximale Übereinstimmung wird in O(log2(N)) Runden erreicht. Die erforderliche Zeit wird typischerweise in Zehntel Mikrosekunden gemessen.
- Ein Entscheidungsschema, das seine Aufgabe bei einer Geschwindigkeit durchführen kann, die in Einklang steht mit dem System, in dem dasselbe arbeitet, um einen Engpass zu verhindern, und das wenig Leistung verbraucht, wird gewünscht. Geringe Komplexität ist ebenfalls ein erwünschtes Merkmal für ein Entscheidungssystem.
- Verschiedene Ausführungsbeispiele der vorliegenden Erfindung beziehen sich auf Systeme und Verfahren für volloptische verteilte Entscheidung für Computersystemkomponenten, die über eine photonische Verbindung in einer Computersystemvorrichtung kommunikativ gekoppelt sind. Die Ausführungsbeispiele der optischen Entscheidung in dem Computersystem liefern Entscheidungsschemata mit festgelegter Priorität und nicht festgelegter Priorität. Die Ausführungsbeispiel mit Nicht-Festgelegte-Priorität-Schema können Fairness bei der Entscheidung liefern. Bei einigen Ausführungsbeispielen sind die Zufuhr von Lichtleistung und Entscheidung kombiniert.
- Kurze Beschreibung der Zeichnungen
-
1 zeigt eine Querschnittsansicht einer gestapelten Rechenvorrichtung gemäß Ausführungsbeispielen der vorliegenden Erfindung. -
2 zeigt eine schematische Darstellung von Komponenten der Rechenvorrichtung gemäß Ausführungsbeispielen der vorliegenden Erfindung. -
3 zeigt eine auseinandergezogene isometrische Ansicht von vier Stückschichten der Rechenvorrichtung, gezeigt in1 , gemäß Ausführungsbeispielen der vorliegenden Erfindung. -
4A zeigt einen Cluster eines Prozessorstücks gemäß Ausführungsbeispielen der vorliegenden Erfindung. -
4B zeigt eine Fliese bzw. ein Feld (tile) eines Speicherstücks gemäß Ausführungsbeispielen der vorliegenden Erfindung. -
5 zeigt eine schematische Darstellung von Interaktionen zwischen Komponenten des Clusters und des Felds, die in4A –4B gezeigt sind, gemäß Ausführungsbeispielen der vorliegenden Erfindung. -
6 zeigt eine vergrößerte auseinandergezogene isometrische Ansicht der vier Stückschichten der Rechenvorrichtung, die in1 gezeigt ist, gemäß Ausführungsbeispielen der vorliegenden Erfindung. -
7A zeigt eine schematische Darstellung eines optischen Stücks gemäß Ausführungsbeispielen der vorliegenden Erfindung. -
7B zeigt eine Vergrößerung einer Region des optischen Stücks, das in7A gezeigt ist, gemäß Ausführungsbeispielen der vorliegenden Erfindung. -
7C zeigt eine Querschnittsansicht eines Abschnitts von chipinternen Stegwellenleitern entlang einer Linie 7C-7C, die in7B gezeigt ist, gemäß Ausführungsbeispielen der vorliegenden Erfindung. -
7D zeigt eine Draufsicht eines Abschnitts von zwei etwa parallelen photonischen Kristallwellenleitern gemäß Ausführungsbeispielen der vorliegenden Erfindung. -
8 zeigt eine schematische Darstellung einer elektromagnetischen Strahlungsquelle gemäß Ausführungsbeispielen der vorliegenden Erfindung. -
9A und9B zeigen schematische Darstellungen von zwei optoelektronischen Wandlern gemäß Ausführungsbeispielen der vorliegenden Erfindung. -
10 zeigt eine schematische Darstellung von Komponenten eines Wandlerblocks für einen optoelektronischen Wandler gemäß Ausführungsbeispielen der vorliegenden Erfindung. -
11 zeigt eine schematische Darstellung eines Daten-/Steuerblocks eines optoelektronischen Wandlers gemäß Ausführungsbeispielen der vorliegenden Erfindung. -
12 zeigt eine schematische Darstellung von drei Daten-/Steuerblöcken gemäß Ausführungsbeispielen der vorliegenden Erfindung. -
13 zeigt eine schematische Darstellung eines vergrößerten Bündelwellenleitermodulators/Detektors gemäß Ausführungsbeispielen der vorliegenden Erfindung. -
14 zeigt einen chipexternen Kommunikationsnetzknoten bzw -hub gemäß Ausführungsbeispielen der vorliegenden Erfindung. -
15 zeigt eine Rundsendung gemäß Ausführungsbeispielen der vorliegenden Erfindung. -
16A zeigt ein Wellenleiter-Mikroringsystem, das verwendet wird, um Daten in nichtcodierten Kanälen zu codieren, gemäß Ausführungsbeispielen der vorliegenden Erfindung. -
16B zeigt ein Wellenleiter-Mikroringsystem, das verwendet wird, um codierte Kanäle von einem Wellenleiter zu extrahieren, gemäß Ausführungsbeispielen der vorliegenden Erfindung. -
17 zeigt eine schematische Darstellung eines Mikrorings gemäß Ausführungsbeispielen der vorliegenden Erfindung. -
18A zeigt eine schematische Darstellung einer beispielhaften gestapelten Vier-Cluster-Rechenvorrichtung gemäß Ausführungsbeispielen der vorliegenden Erfindung. -
18B zeigt eine schematische Darstellung eines Entscheidungssystems, das in18A gezeigt ist, gemäß Ausführungsbeispielen der vorliegenden Erfindung. -
19 zeigt ein Entscheidungssystem gemäß Ausführungsbeispielen der vorliegenden Erfindung. -
20A stellt eine schematische Ansicht eines volloptischen Entscheidungssystems gemäß einem weiteren Ausführungsbeispiel der vorliegenden Erfindung dar, bei dem das Prioritätsschema festgelegt ist (nicht fair). -
20B stellt eine weitere Version eines Entscheidungssystemausführungsbeispiels dar, bei dem Lichtleistungslieferung an einen weiteren funktionalen Abschnitt der photonischen Verbindung, wie z. B. Datentransport, mit Entscheidung gekoppelt oder kombiniert ist. -
21 ist eine schematische Ansicht des Entscheidungssystems, das ein Entscheidungsschema verwenden kann, bei dem mehrere Computersystemkomponenten Zugriff erhalten können zu mehreren Empfangskomponenten, ohne eine Anzahl von verwendeten Wellenleitern zu erhöhen. -
22 zeigt eine schematische Ansicht eines weiteren Entscheidungssystems gemäß einem Ausführungsbeispiel der vorliegenden Erfindung. - Detaillierte Beschreibung
- Verschiedene Ausführungsbeispiele der vorliegenden Erfindung beziehen sich auf volloptische Entscheidungssysteme und Verfahren im Zusammenhang einer photonischen Verbindung, die Kommunikation zwischen Computersystemkomponenten bereitstellt. Diese photonischen Verbindungen sind schneller als ihre elektrischen Gegenstücke, daher muss ein Entscheidungssystem keinen Engpass darstellen. Ein volloptisches Entscheidungssystem ist wünschenswert, damit die Entscheidung in Einklang mit der Kommunikationsgeschwindigkeit durchgeführt werden kann. Zu Darstellungszwecken ist ein Computersystemvorrichtungsausführungsbeispiel beschrieben, um einen Kontext zu liefern zum Darstellen verschiedener Aspekte des Entscheidungssystems der vorliegenden Erfindung. Ein volloptisches Entscheidungssystem gemäß der vorliegenden Erfindung ist jedoch nicht auf die spezifischen Einzelheiten des Ausführungsbeispiels einer photonischen Verbindung, wie beschrieben, begrenzt.
- Photonische Verbindung
- Diese photonischen Verbindungen liefern chipinterne photonische Verbindungen zwischen Computersystemkomponenten (z. B. Kernen, Cluster, Speichersteuerungen). Zusätzlich liefern einige Ausführungsbeispiele der photonischen Verbindung ebenfalls chipexterne photonische Verbindungen zu Computersystemkomponenten auf externen Vorrichtungen. Ausführungsbeispiele der vorliegenden Erfindung umfassen auch photonische Verbindungen, die nanophotonische Komponenten umfassen, die Komponenten mit Abmessungen umfassen, die typischerweise geringer als eine Wellenleiter oder geringer als ein Mikrometer sind.
- Diese photonischen Verbindungen liefern eine schnellere Rate, mit der Daten chipextern kommuniziert werden können, im Vergleich zu herkömmlichen Anschlussstiften, die entlang des Chiprands angeordnet sind, liefern eine größere Rechenbandbreite, liefern geringere Energiekosten für chipinterne und chipexterne Kommunikation als herkömmliche Metalldrähte und können aufwärts oder abwärts skaliert werden, um zusätzliche Komponenten unterzubringen, beispielsweise einen Prozessor mit jeder Anzahl von Kernen. Architekturen der photonischen Verbindung können mit nicht blockierenden, rekonfigurierbaren, nanophotonischen Mikroringen mit niedriger Latenzzeit implementiert werden, die eine hohe Bandbreite, moderate Latenzzeit und sehr geringe Leistungsaufnahme bieten, selbst bei Spitzenrechenbandbreiten. Außerdem können die Architekturen der Rechensystemvorrichtungen konfiguriert werden, so dass der gesamte Speicher in nächster Nähe zu einer Speichersteuerung oder sogar dem Prozessor ist. Eine mehrkernbasierte Rechenvorrichtung, die optische Stücke verwendet, die gemäß Ausführungsbeispielen der vorliegenden Erfindung konfiguriert sind, können bei etwa 20 TBytes/s arbeiten.
- In der folgenden Beschreibung bezieht sich „photonisch” auf Vorrichtungen, die mit klassischer und/oder quantisierter elektromagnetischer Strahlung arbeiten mit Wellenlängen, die nicht begrenzt sind auf nur den sichtbaren Abschnitt des elektromagnetischen Spektrums. In den verschiedenen nachfolgend beschriebenen Photonischer-Schalter- und Schalter-Struktur-Ausführungsbeispielen wurden eine Anzahl von strukturell ähnlichen Komponenten, die die gleichen Materialien umfassen, mit den gleichen Bezugszeichen versehen und der Kürze halber wird eine Erklärung der Struktur und Funktion derselben nicht wiederholt.
- Gestapelte Mehrkernrechenvorrichtungen
-
1 zeigt eine Querschnittsansicht einer beispielhaften Computersystemvorrichtung („Rechenvorrichtung”)100 , die eine gestapelte Mehrkernrechenvorrichtung ist, die eine photonische Verbindung gemäß Ausführungsbeispielen der vorliegenden Erfindung verwendet. Die Rechenvorrichtung100 umfasst ein Prozessorstück102 , ein Speichersteuer/Verzeichnis/L2-Stück („Speichersteuerstück”)104 , ein analoges elektronisches Stück106 , ein optisches Stück108 und vier gestapelte Speicherstücke110 –113 , die in einem Gehäuse116 gestapelt sind. Die gestapelten Speicherstücke110 –113 können flüchtiger Speicher sein, wie z. B. dynamischer Direktzugriffsspeicher („DRAN”), nichtflüchtiger Speicher oder jede Kombination von flüchtigem und nichtflüchtigem Speicher. Insbesondere können die gestapelten Speicherstücke110 –113 8-Gigabit-(„GB”)DRAM sein. Die Rechenvorrichtung100 umfasst auch eine Wärmesenke118 , die auf der oberen Oberfläche des Prozessorstücks102 positioniert ist, und eine große Anzahl von Durchkontaktierungen (z. B. Hunderte), dargestellt durch vier Durchkontaktierungen120 –123 , die sich von dem Speichersteuerstück104 durch das analoge elektronische Stück106 und das optische Stück108 zu den vier Speicherstücken110 –113 erstrecken. - Die Stücke
102 ,104 ,106 ,108 und110 –113 können in Dicke von etwa 25 bis etwa 50 Mikrometer rechen. Die Wärmesenke118 dissipiert Wärme, die durch Rechenbetrieb des Prozessorstücks102 erzeugt wird, und die Durchkontaktierungen120 –123 können metallisierte oder siliziumgefüllte Durchkontaktierungen sein, die Speichersteuerungen in dem Speicherstück elektrisch verbinden mit jedem der vier Speicherstücke110 –113 . Die Speichersteuerungen, die in dem Speichersteuerstück104 angeordnet sind, verwalten den Datenfluss, der zu und von den Speicherstücken110 –113 geht, und den Datenfluss, der zu und von externen Vorrichtungen (nicht gezeigt) geht. Das optische Stück108 ist größer als die anderen Stücke, um externe photonische Verbindungen zu umfassen, wie z. B. externe photonische Verbindungen124 und126 , die verwendet werden können, um datencodierte elektromagnetische Strahlung zu und von der Rechenvorrichtung100 zu senden. Das optische Stück kann etwa 24 mm mal 24 mm sein, aber die Abmessungen können abhängig von der Implementierung variiert werden. Eine Diamantschicht130 kann auch zwischen der unteren Oberfläche des optischen Stücks108 und der oberen Oberfläche des Speicherstücks110 enthalten sein. Die Diamantschicht130 kann etwa 1–10 μm dick sein und kann verwendet werden, um Wärme, die durch das Prozessorstück102 und das Speichersteuerstück104 erzeugt wird, auszubreiten und zu dissipieren. - Der dreidimensionale Stückstapel, der in
1 gezeigt ist, ermöglicht enge Kopplung des optischen Stücks108 mit den elektronischen Stücken102 und104 , liefert Zugreifbarkeit der Speicherstücke110 –113 bei niedriger Latenzzeit und durch Ausbreiten der Clusterlogik und des Speichers über gestapelte benachbarte Stücke102 ,104 und110 –113 ist die elektrische Zwischenclusterverdrahtung verkürzt im Vergleich zu herkömmlichen Vorrichtungen. Insbesondere liefert das Stapeln der Speicherstücke in nächster Nähe zu den Speichersteuerungen und das Verwenden von Durchkontaktierungen, die durch die Speicherschichten verlaufen, Verbindungen mit kürzerer Länge und geringerem Widerstand als die beträchtlich längeren Verbindungen mit höherem Widerstand, die verwendet werden, um herkömmlichen Speicher mit Speichersteuerungen zu verbinden. Als Folge ist die Leistung oder Last, die benötigt wird, um elektrische Signale zwischen Stücken der Rechenvorrichtung100 zu übertragen, beträchtlich niedriger als die Leistung, die für herkömmliche Speicher-zu-Speichersteuerungen benötigt wird. -
2 zeigt eine schematische Darstellung von Komponenten der Stücke102 ,104 und108 der Rechenvorrichtung100 , die gemäß Ausführungsbeispielen der vorliegenden Erfindung verbunden sind. Das Prozessorstück102 ist ein Mehrkernprozessor, wo die Kerne in Clustern von jeweils vier Kernen angeordnet werden können, wie es durch Cluster202 –204 dargestellt ist. Jeder Kern hat einen privaten Befehlscache erster Ordnung („L1”) (nicht gezeigt) und einen privaten L1-Datencache (nicht gezeigt), die nachfolgenden beschrieben werden mit Bezugnahme auf4 . Die Cluster202 –204 haben jeweils einen privaten gemeinschaftlich verwendeten Cache zweiter Ordnung („L2”), dargestellt durch L2-Cache206 –208 , und eine zugeordnete Speichersteuerung, dargestellt durch Speichersteuerungen210 –212 . Die Speichersteuerungen210 –212 steuern den Datenfluss zu und von den Clustern202 –204 . Die L2-Caches und die Speichersteuerungen sind in dem Speichersteuerstück104 benachbart zu dem Prozessorstück102 angeordnet. Wie es in2 gezeigt ist, liefert eine photonische Verbindung214 des optischen Stücks108 photonische Verbindungen, die es den L2-Caches206 –208 , die den Cluster202 –204 zugeordnet sind, ermöglichen, photonisch miteinander und mit den Speichersteuerungen210 –212 zu kommunizieren. Außerdem offenbart2 , dass die Speichersteuerungen210 –211 photonisch mit externen Speichermodulen kommunizieren können, wie z. B. chipexternen Dual-in-line-Speichermodulen („DIMMs”)216 –218 . Die Cluster202 –204 können elektronisch oder photonisch mit den jeweiligen DIMMs216 –218 kommunizieren. - Jeder Cluster des Prozessorstücks
102 hat eine entsprechende Speichersteuerung, die auf dem Speichersteuerstück104 angeordnet ist, wobei jede Speichersteuerung eine Schnittstelle bildet mit den gestapelten Speicherstücken110 –113 oder eine photonische Verbindung zu chipexternem Speicher treibt, um Bandbreite bereitzustellen, die mit der Leistungsfähigkeit des Prozessorstücks102 skaliert. Die Cluster sind außerdem photonisch miteinander gekoppelt durch das optische Stück108 und bieten hohe Bandbreite, mäßige Latenzzeit und sehr niedrige Leistungsaufnahme. Somit kann ein Programmierer, dem eine gestapelte Rechenvorrichtung100 zur Verfügung steht, Parallelität auf einer sehr hohen Ebene ausdrücken und wird nicht durch Lokalitätsprobleme belastet, was die Schwierigkeit paralleler Pogrammentwicklung stark reduziert. Ferner kann die Architektur der Rechenvorrichtung100 Bandbreiten von einem Byte pro Gleitkommaoperation (Flop; Flop = floating point Operation) zu dem DRAM liefern. - Wenn 8 GB DRAM für jedes der Speicherstücke
110 –113 ausgewählt wird, liefert der Speicher auf dem Stapel 32 Gbyte DRAM, der direkt verbunden ist mit den Speichersteuerungen durch die mehreren Durchkontaktierungen, die durch den DRAM verlaufen, wie z. B. Durchkontaktierungen120 –123 . Der DRAM wird bereitgestellt durch vier Speicherstapelschichten, gedünnt auf etwa 25 bis 50 Mikrometer, um die Belastung der Durchkontaktierungen oder die Leistungsmenge, die benötigt wird, um dieselben zu verwenden, zu minimieren. Jede Schicht des DRAM-Stapels umfasst 64 beinahe identische Regionen, die auf die Cluster in dem obigen Prozessorstück102 abbilden. Jede DRAM-Region kann ferner unterteilt werden in mehrere Bänke, die die Zeilenzugriffszeit reduzieren und mehrere gleichzeitige Zugriffe ermöglichen. Beispielsweise kann das Verwenden von 20-nm-DRAM-Technologie jeder Region 1 Gbit von fehlerkorrekturgeschützter Speicherung liefern, so dass jede Speichersteuerung in dem Speichersteuerstück104 elektronisch mit 0,5 Gbyte Speicher verbindet. Mehrere Kanäle liefern erhöhte Bandbreite in den Speicher. Durch Bereitstellen erhöhter Bandbreite werden Bankkonflikte in dem DRAM reduziert. Jeder Speicherkanal besteht aus 72 Datenbits und etwa 30 Adress- und Steuerbits. Durch Verwenden von 25-Mikrometer-Abstand-Durchkontaktierungen kann der Flächenmehraufwand der Durchkontaktierungen weniger als 3% der Speicherschicht sein, wenn vier Kanäle pro Speichersteuerung angenommen werden. Feinabstand-Durchkontaktierungen ermöglichen es, den DRAM zu strukturieren, um eine gesamte Cachezeile von einem einzelnen Zeilenzugriff zu liefern. - Wenn 512 GB DRAM gewünscht wird, kann derselbe in 64 getrennten optisch verbundenen Speichermodulen („OCM”, OCM = optically connected memory module) angeordnet sein. Die OCMs nutzen die gleiche Basistechnologie wie die oben beschriebenen 8 GB DRAM. Das optische Stück
108 führt zwei Funktionen aus. Zuerst liefert das optische Stück108 eine Schnittstelle zu den Optikfaserverbindungen, wie z. B. externe photonische Verbindungen124 und126 . Zweitens liefert das optische Stück108 eine leistungsarme globale Verbindung für den Stapel von DRAM. Die OCMs und der Prozessor sind durch optische Fasern verbunden, was bis zu 48 Kanäle bereitstellt, die für Befehle oder andere anwendungsspezifische Datenaustauschvorgänge verwendet werden können. - Gesamtbetrieb der gestapelten Mehrkernrechenvorrichtungen
- Der Einfachheit halber sind photonische Verbindungsausführungsbeispiele der vorliegenden Erfindung nachfolgend mit Bezugnahme auf die Rechenvorrichtung
100 beschrieben, wobei das Prozessorstück102 64 Vierkern-Cluster umfasst. Für Fachleute auf diesem Gebiet ist klar, dass die photonischen Verbindungsausführungsbeispiele der vorliegenden Erfindung nicht auf solche Vorrichtungen begrenzt sind und dass diese Ausführungsbeispiele modifiziert und implementiert werden können, um photonische Verbindungen bereitzustellen für Mehrkernrechenvorrichtungen mit jeder Anzahl von Cluster mit jeder Anzahl von Kernen in verschiedenen Anordnungen. -
3 zeigt eine auseinandergezogene isometrische Ansicht des photonischen Stücks102 , des Speichersteuerstücks104 , des analogen elektronischen Stücks106 und des optischen Stücks108 gemäß Ausführungsbeispielen der vorliegenden Erfindung. Wie es in3 gezeigt ist, sind das Prozessorstück102 und das Speichersteuerstück104 in 64 Fliesen bzw. Felder (tiles) unterteilt. Jedes Feld in dem Prozessorstück102 stellt vier Kerne dar, die als „Cluster” bezeichnet werden, und jedes Feld in dem Speicherstück104 stellt einen L2-Cache, einen Hub, eine Speichersteuerung und andere Vorrichtungen dar, die mit einem entsprechenden Cluster in elektronischer Kommunikation sind, das etwa direkt darüber in dem Prozessorstück102 angeordnet ist. Das Feld302 des Speichersteuerstücks104 stellt beispielsweise einen L2-Cache, einen Hub, eine Speichersteuerung und andere Vorrichtungen dar, die unterhalb eines zugeordneten Clusters304 und in elektronischer Kommunikation mit demselben angeordnet sind. Die Cluster und Felder können etwa 3 mm mal 3 mm sein, können aber abhängig von der Implementierung größer oder kleiner gemacht werden. Ausführungsbeispiele der vorliegenden Erfindung sind nicht auf Cluster mit vier Kernen begrenzt. Bei anderen Ausführungsbeispielen kann ein Cluster zwei, drei und vier oder mehr Kerne umfassen. Ein Beispiel eines Clusters und eines Felds sind nachfolgend mit Bezugnahme auf4A –4B beschrieben. Das optische Stück108 umfasst 16 etwa regelmäßig beabstandete optoelektronische Wandler, wie z. B. den optoelektronischen Wandler306 ,270 , getrennte und etwa parallele (nicht überkreuzende) Wellenleiter mit einer Serpentinenkonfiguration, dargestellt durch Streifen308 , die ihren Weg bahnen durch jeden der 16 regelmäßig beabstandeten optoelektronischen Wandler und 16 Bündel von 8 etwa parallelen Wellenleitern, wobei jedes Bündel von einem entsprechenden optoelektronischen Wandler ausgeht, wie z. B. das Bündel310 , das von dem optoelektronischen Wandler306 ausgeht. Die270 Serpentinenwellenleiter werden „chipinterne Wellenleiter” genannt, die photonische Kommunikation zwischen optoelektronischen Wandlern bereitstellen, und die Wellenleiter, die die 16 Bündel Wellenleiter umfassen, werden als „chipexterne Wellenleiter” bezeichnet, die photonische Kommunikation mit Vorrichtungen bereitstellen, die außerhalb der Rechenvorrichtung100 angeordnet sind. Die 16 optoelektronischen Wandler bestehen jeweils aus vier optoelektronischen Wandlerblöcken (nicht gezeigt). Jeder der optoelektronischen Wandlerblöcke („Wandlerblöcke”) ist in elektronischer Kommunikation mit einem der vier zugeordneten Felder in dem Speichersteuerstück104 . Die Wandlerblöcke werden nachfolgend mit Bezugnahme auf6 und7 näher beschrieben. Das analoge elektronische Stück106 umfasst 16 Teilflächen, jede Teilfläche ist zwischen vier Feldern in dem Speichersteuerstück104 und einem optoelektronischen Wandler in dem optischen108 angeordnet. Jede Teilfläche umfasst eine Anzahl von metallisierten oder siliziumgefüllten Durchkontaktierungen, die analoge elektronische Kommunikation zwischen den vier Feldern in dem Speichersteuerstück104 und den entsprechenden optoelektronischen Wandlern bereitstellen. Daten werden durch die Teilflächen in der Form von elektronischen analogen Signalen gesendet („elektrische Signale”), weil das Erzeugen einer analoger Signale typischerweise sehr viel weniger Leistung verbraucht als das Erzeugen digitaler elektrischer Signale. - Die folgende Beschreibung ist eine Übersicht darüber, wie das optische Stück
108 verwendet werden kann, um Daten zwischen Clustern auf dem Prozessorstück102 zu übertragen und Daten zwischen Clustern und externen Vorrichtungen zu übertragen. Daten, die durch einen Cluster des Prozessorstücks102 erzeugt werden, wie z. B. Cluster304 , oder von einem Feld des Speichersteuerstücks104 extrahiert werden, wie z. B. Feld302 , werden als datencodierte elektrische Signale durch Durchkontaktierungen in einer Teilfläche312 zu einem entsprechenden Wandlerblock (nicht gezeigt) des optoelektronischen Wandlers306 übertragen. Der Wandlerblock codiert die elektrischen Signale in eine oder mehrere Wellenlängen elektromagnetischer Strahlung, als „Kanäle” bezeichnet, die sich in einem oder mehreren der chipinternen Wellenleiter308 ausbreiten. Das Codieren von Daten in unmodulierte Kanäle kann erreicht werden durch Modulieren der Intensität der Kanäle, was nachfolgend mit Bezugnahme auf14 näher beschrieben wird. Kanäle, die Daten tragen, werden als „codierte Kanäle” bezeichnet. Die codierten Kanäle können beabsichtigt sein für (1) einen benachbarten Cluster314 , der auch in elektronischer Kommunikation mit dem gleichen optoelektronischen Wandler306 ist, (2) einen Cluster, der irgendwo sonst in dem Prozessorstück102 angeordnet ist, wie z. B. der Cluster315 , oder (3) eine externe Vorrichtung (nicht gezeigt). Wenn die codierten Kanäle für den benachbarten Cluster314 beabsichtigt sind, empfängt sein entsprechender Wandlerblock, der in dem optoelektronischen Wandler306 angeordnet ist, die codierten Kanäle und. wandelt dieselben zurück in codierte elektrische Signale, die durch die Teilfläche312 zu dem Cluster314 zurückgesendet werden. Wenn die datencodierten Kanäle für den Cluster315 beabsichtigt sind, werden die codierten Kanäle entlang geeigneten chipinternen Wellenleitern zu einem Wandlerblock übertragen, der dem Cluster315 entspricht, der mit einem optoelektronischen Wandler316 angeordnet ist. Die codierten Kanäle werden zurückgewandelt in codierte elektrische Signale, die durch eine Teilfläche318 zu dem Cluster315 gesendet werden. Wenn die codierten Kanäle für eine externe Vorrichtung beabsichtigt sind, platziert der Wandlerblock des optoelektronischen Wandlers306 die codierten Kanäle auf chipexterne Wellenleiter des Bündels310 , wo die codierten Kanäle das optische Stück108 verlassen. Wenn eine externe Vorrichtung codierte Kanäle erzeugt, die für einen der vier Cluster314 beabsichtigt sind, können die codierten Kanäle entlang den chipexternen Wellenleitern in dem Bündel310 zu dem optoelektronischen Wandler306 übertragen werden, wo die codierten Kanäle in codierte elektrische Signale umgewandelt werden, die durch die Teilfläche312 zu den vier Cluster314 übertragen werden zur Verarbeitung. Eine detailliertere Beschreibung des Betriebs und der Komponenten des optischen Stücks108 ist nachfolgend mit Bezugnahme auf7 bereitgestellt. - Cluster und Speichersteuerungen
-
4A zeigt einen Cluster402 des Prozessorstücks102 gemäß Ausführungsbeispielen der vorliegenden Erfindung. Der Cluster402 umfasst vier Kerne. Jeder Kern ist in elektrischer Kommunikation mit einem L1-Befehlscache und einem L1-Datencache. Ein L1-Befehlscache und ein L1-Datencache sind Hochgeschwindigkeitsdirektzugriffsspeicher, die häufig oder vor kurzem zugegriffene Befehle und Daten vorübergehend speichern.4B zeigt ein Feld404 des Speichersteuerstücks104 gemäß Ausführungsbeispielen der vorliegenden Erfindung. Das Feld404 umfasst einen L2-Cache und eine Komponentenregion406 , die einen Hub, eine Speichersteuerung, ein Verzeichnis, eine Netzwerkschnittstelle, eine Meine-Kreuzschiene-Verbindung und eine Peer-Kreuzschienen-Verbindung umfasst. Diese Kreuzschienenverbindungen können konfiguriert sein, um eine Schnittstelle zu bilden mit entsprechenden Abschnitten der optoelektronischen Wandler. Der L2-Cache wird durch die vier Kerne des Clusters402 gemeinschaftlich verwendet. Eine L1–L2-Schnittstelle408 ist etwa in der Mitte des Clusters402 und des Felds404 positioniert, und liefert elektronische Kommunikation zwischen dem Cluster402 und dem Feld404 . - Kleine leistungseffiziente Kerne und Caches erreichen eine beinahe optimal mögliche Leistungsfähigkeit pro Energieeinheit. Daher können die Kerne, die für die vorliegende Erfindung gewählt werden, einen 5-GHz-Takt verwenden, und die Kerne können Zweifachausgabe (dual-issue), in Reihe und mehrgängig sein, und können konfiguriert sein, um Einzelbefehl-Mehrfachdaten-(„SIMD-”; SIMD = single instruction multiple data)Befehle zu bieten, die 4 Multiplikationsakkumulations- und Vier-Wort-breite Lade-/Speicheroperationen ermöglichen. SIMD kann eine Sammlung von Niederpegelfunktionen sein, die entworfen sind, um Gleitpunktleistungsfähigkeit zu beschleunigen. Der SIMD-Prozess ermöglicht es einem Befehl, die gleiche Funktion an mehreren Datenstücken durchzuführen, was die Anzahl von Schleifen reduziert, die erforderlich sind, um Daten handzuhaben. Mit nur 64 Vierer-Clustern, wie es oben mit Bezugnahme auf
3 beschrieben ist, die gemäß einem 5-GHz-Takt arbeiten, kann die Rechenbandbreite der Rechenvorrichtung100 10 Tflops/s sein. Jeder Cluster kann zumindest eine Cachezeile senden, wie z. B. 64 bis 128 Byte, während 24-Stunden-Zyklen, die als „Epochen” bezeichnet werden. -
5 zeigt eine schematische Darstellung von Interaktionen zwischen Komponenten von Cluster und Feld, die in4A –4B gezeigt sind, gemäß Ausführungsbeispielen der vorliegenden Erfindung. Der Hub502 verteilt codierte elektrische Signale an den L2-Cache504 , das Verzeichnis506 , die Speichersteuerung508 und die Netzschnittstelle510 . Der Hub502 ist auch verantwortlich für das Übertragen codierter elektrischer Signale zu und von dem optoelektronischen Wandler des optischen Stücks108 , wie es oben mit Bezugnahme auf3 beschrieben ist. Die Netzschnittstelle510 liefert Verbindungen zu einem externen Netz und die Speichersteuerung508 verwaltet den Datenfluss zu und von dem L2-Cache504 , dem Speicher110 –113 , der in1 gezeigt ist, und externem Speicher, wie z. B. den DIMMs216 –218 , die in2 gezeigt sind. -
6 zeigt eine vergrößerte auseinandergezogene isometrische Ansicht von vier Clustern602 des Prozessorstücks102 , vier entsprechenden Feldern604 des Speichersteuerstücks104 , eine Teilfläche606 des analogen elektronischen Stücks106 und einen optoelektronischen Wandler608 des optischen Stücks108 , die gemäß Ausführungsbeispielen der vorliegenden Erfindung angeordnet sind. Wie es in6 gezeigt ist, umfasst der optoelektronische Wandler608 vier einzelne optoelektronische Wandlerblöcke610 –613 . Jeder Wandlerblock ist in elektronischer Kommunikation mit einem der vier Felder604 über die Teilfläche606 . Insbesondere ist das Feld615 in elektronischer Kommunikation mit dem Wandlerblock610 , das Feld616 ist in elektronischer Kommunikation mit dem Wandlerblock611 , das Feld617 ist in elektronischer Kommunikation mit dem Wandlerblock612 und das Feld618 ist in elektronischer Kommunikation mit dem Wandlerblock613 . Die Wandlerblöcke610 –613 wandeln codierte elektrische Signale, die jeweils von den Feldern615 –618 ausgegeben werden, in codierte Kanäle um, die auf einem Teil der chipinternen Wellenleiter308 übertragen werden können zum Verarbeiten durch andere Cluster oder auf einem Bündel von Wellenleitern620 an externe Vorrichtungen zum Verarbeiten gesendet werden können. Die Wandlerblöcke610 –613 wandeln auch codierte Kanäle, die in dem Bündel620 und den chipinternen Wellenleitern308 übertragen werden, in codierte elektrische Signale um, die durch die vier Cluster602 getrennt verarbeitet werden können. - Optisches Stück
-
7A zeigt eine schematische Darstellung des optischen Stücks108 gemäß Ausführungsbeispielen der vorliegenden Erfindung. Wie es in7A gezeigt ist und oben mit Bezugnahme auf3 beschrieben ist, umfasst das optische Stück108 270 getrennte etwa parallele nicht überschneidende chipinterne Wellenleiter308 , 16 etwa regelmäßig beabstandete optoelektronische Wandler und 16 Bündel von 8 chipexternen Wellenleitern. Die chipinternen Wellenleiter308 können in einer Serpentinenkonfiguration angeordnet sein, so dass alle 270 chipinternen Wellenleiter308 photonisch gekoppelt sein können mit jedem der 16 optoelektronischen Wandler.7A offenbart, dass jeder optoelektronische Wandler vier Wandlerblöcke umfasst. Anders ausgedrückt, das optische Stück108 umfasst 64 Wandlerblöcke, die jeweils in Kommunikation sind mit einem der 64 Felder des Speichersteuerstücks104 .7A offenbart auch zwei im Wesentlichen identische Kanalquellen702 und704 , die an gegenüberliegenden Enden der serpentinenförmigen chipinternen Wellenleiter308 positioniert sind. Die Quellen702 und704 sind jeweils konfiguriert, um den gleichen Satz von 64 unterschiedlichen Kanälen auf jeden der chipinternen Wellenleiter in entgegengesetzten Richtungen auszugeben. Der Richtungspfeil706 stellt die Richtung dar, in der Kanäle, die von der Quelle702 ausgegeben werden, übertragen werden, und der Richtungspfeil708 stellt die Richtung dar, in der Kanäle, die von der Quelle704 ausgegeben werden, gesendet werden. Die serpentinenförmigen chipinternen Wellenleiter308 haben eine Breite von etwa 1.900 μm. - Ausführungsbeispiele der vorliegenden Erfindung sind nicht auf die chipinternen Wellenleiter begrenzt, die die in
7A gezeigte Serpentinenform haben. Die Konfiguration der chipinternen Wellenleiter kann jede geeignete Form annehmen, die von der Anzahl der optoelektronischen Wandlern, dem Layout der optoelektronischen Wandler und der verfügbaren Menge an Platz auf dem optischen Stück abhängen kann. -
7B zeigt eine Vergrößerung einer Region710 , die in7A gezeigt ist, des optischen Stücks108 gemäß Ausführungsbeispielen der vorliegenden Erfindung. Wie es in7B gezeigt ist, sind der Einfachheit der Darstellung halber nur 8 der270 serpentinenförmigen chipinternen Wellenleiter308 angezeigt.7B offenbart, dass die Wellenleiter einander nicht schneiden und etwa parallel sind, wie z. B. Wellenleiter714 und716 . - Die chipinternen Wellenleiter
308 können Stegwellenleiter oder photonische Kristallwellenleiter sein mit Querschnittsabmessungen, die von etwa 0,25 bis etwa 0,5 Mikrometer reichen.7C zeigt eine Querschnittsansicht eines Abschnitts718 der chipinternen Stegwellenleiter308 entlang einer Linie 7C-7C, die in7B gezeigt ist, gemäß Ausführungsbeispielen der vorliegenden Erfindung. Für eine einfache Darstellung stellt der Abschnitt718 der chipinternen Stegwellenleiter20 der270 chipinternen Stegwellenleiter dar, die auf der Oberfläche des optischen Stücks108 angeordnet sind. Wie es in7C gezeigt ist, sind die Stegwellenleiter in Bündeln angeordnet, wobei jedes Bündel vier Wellenleiter aufweist, wie z. B. das Bündel720 . -
7D zeigt eine Draufsicht eines Abschnitts von zwei etwa parallelen photonischen Kristallwellenleitern gemäß Ausführungsbeispielen der vorliegenden Erfindung. In7D stellen Kreise, wie z. B. der Kreis722 , ein regelmäßiges Gitter von Öffnungen in einer dielektrischen oder Halbleiter-Substratschicht des optischen Stücks108 dar. Regionen ohne Öffnungen sind photonische Kristallwellenleiter724 und726 . Die Öffnungen können mit Luft oder einem geeigneten dielektrischen Material gefüllt sein, das einen Brechungsindex aufweist, der niedriger ist als derjenige der Substratschicht. Das regelmäßige Gitter von Öffnungen erzeugt ein zweidimensionales Bragg-Gitter, das die Wellenleiter724 und726 umgibt. Dieses zweidimensionale Bragg-Gitter begrenzt elektromagnetische Strahlung einer geeigneten Wellenlänge auf die Wellenleiter724 und726 . Photonische Kristallwellenleiter sind gut bekannt und die Lehrbücher Fundamentals of Optical Waveguides von Katsunari Okamoto, Elsevier Inc., 2005; Optical Waveguide Theory von Snyder und Love, Chapman and Hall, London, 1983; und Photonic Crystals von Jean-Michel Lourtioz, Springer-Verlag, Berlin, 2005, sind nur drei von vielen Referenzen auf diesem Gebiet. -
8 zeigt eine schematische Darstellung der Quelle702 gemäß Ausführungsbeispielen der vorliegenden Erfindung. Die Quelle702 umfasst einen Laser802 und zwei Sternkoppler804 und806 . Der Laser802 kann ein modengekoppelter Rennbahn-Laser sein, der 64 unterschiedliche Wellenlängen unmodulierter elektromagnetischer Strahlung emittiert. Jede Wellenlänge oder jeder „Kanal” ist dargestellt durch λ1, λ2, λ3, ..., λ64, und jeder Kanal hat eine relativ konstante Intensität. Die Starrkoppler804 und806 umfassen jeweils Strahlteiler, die in einer Baumstruktur konfiguriert sind, die die 64 Kanäle auf jeden der258 von den270 chipinternen Wellenleitern308 platziert, wie es in8 gezeigt ist. Bei bestimmten Ausführungsbeispielen der vorliegenden Erfindung kann der Laser802 ein Hybrid-III–V-Halbleiter/Si-modengekoppelter Laser sein, der M + 1 Laserwellenlängen erzeugt (siehe z. B. A. W. Fang u. a., „Integrated AlGaInAs-silicon evanescent race track laser and photodetectors", Optics Express 15, 2315 (2007). - Das optische Stück
108 arbeitet synchron in Epochen von 24 Taktzyklen. Die verfügbaren nichtcodierten Kanäle sind in logische Kanäle gruppiert, die entweder eine Cachezeile oder eine Rundsendemitteilung oder eine Steuermitteilung in einer einzigen Epoche senden können. Ein logischer Kanal kann eine Cachezeile oder Steuermitteilung in einer Epoche kommunizieren. Die Gruppierung von Kanälen in logische Kanäle wird auf eine Weise durchgeführt, die es einem Cluster erlaubt, alle vier (24 Taktzyklen/6 Kanäle) Taktzyklen bis zu einer Cachezeile zu empfangen und zu senden, was eine Gesamtbandbreite von 10 TBytes/s [64 Cluster × (128 Bytes/4 Takte) × 5 GHz] ergibt. - Optoelektronische Wandler
-
9A –9B zeigen schematische Darstellungen von zwei Typen von optoelektronischen Wandlern gemäß Ausführungsbeispielen der vorliegenden Erfindung. In9A umfasst ein erster optoelektronischer Wandler900 vier Wandlerblöcke901 –904 , die mit vier chipexternen Kommunikationshubs905 –908 photonisch gekoppelt sind. Die Kommunikationshubs905 –908 sind jeweils photonisch gekoppelt mit Bündeln911 –914 , wobei jedes Bündel acht chipexterne Wellenleiter umfasst. In9B umfasst ein zweiter optoelektronischer Wandler920 die gleichen vier Wandlerblöcke901 –904 , die photonisch gekoppelt sind mit chipexternen Kommunikationshubs, die in eine einzelne Vorrichtung922 gruppiert sind. Bündel911 –914 sind photonisch gekoppelt mit der Vorrichtung922 über eine Serialisierungs-/Deserialisierungsvorrichtung924 . -
10 zeigt eine schematische Darstellung von Komponenten eines Wandlerblocks1000 gemäß Ausführungsbeispielen der vorliegenden Erfindung. Der Wandlerblock1000 umfasst ein Rundsendesystem1002 , einen Daten-/Steuerblock1004 , ein Entscheidungssystem1006 und einen chipexternen Kommunikationshub1008 . Der Betrieb und die Architektur des Entscheidungssystems1006 sind nachfolgend mit Bezugnahme auf18 und19 näher beschrieben. Das Rundsendesystem1002 ermöglicht es dem zugeordneten Cluster, Daten an all die anderen Cluster zu etwa der gleichen Zeit zu übertragen. Der Daten-/Steuerblock1004 ist einem bestimmten Feld des Speichersteuerstücks104 zugewiesen und wandelt codierte Kanäle in codierte elektrische Signale um, die zu dem bestimmten Feld gesendet werden, und wandelt codierte elektrische Signale, die von dem Feld ausgegeben werden, in codierte Kanäle um, die an einen anderen Cluster in der Rechenvorrichtung übertragen werden. Architekturausführungsbeispiele des Daten-/Steuerblocks1004 sind nachfolgend mit Bezugnahme auf11 –13 näher beschrieben. Das Entscheidungssystem1006 gewährt einem Cluster das Recht, einen Cluster oder ein Bündel von Wellenleitern in einer bestimmten Epoche zu verwenden. Wie es in10 gezeigt ist, sind zwei der270 chipinternen Wellenleiter308 dem Rundsendesystem1002 zugewiesen, zwölf der chipinternen Wellenleiter308 sind dem Entscheidungssystem1006 zugewiesen und 256 der chipinternen Wellenleiter308 sind dem Daten-/Steuerblock1004 zugewiesen. Die 256 chipinternen Wellenleiter sind in 64 Bündeln angeordnet. Jedes der 64 Bündel umfasst vier chipinterne Wellenleiter, die einem bestimmten Feld in dem Speicherstück102 zugeordnet sind. -
10 umfasst auch Parameter w1, w2, w3, w4 und w5, die Abmessungen von Komponenten des Wandlerblocks1000 darstellen. Bei bestimmten Ausführungsbeispielen kann w1 von etwa 2.100–2.400 μm reichen, w2 kann von etwa 1.700–2.100 μm reichen, w3 kann von etwa 32–44 μm reichen, w4 kann von etwa 80–120 μm reichen und w5 kann von etwa 500–600 μm reichen. Vorzugsweise kann w1 etwa 2.290 μm sein, w2 kann etwa 1.900 μm sein, w3 kann etwa 38 μm sein, w4 kann etwa 100 μm sein und w5 kann etwa 530 μm sein, aber diese Abmessungen und Bereiche können abhängig von der Implementierung variiert werden. -
11 zeigt eine schematische Darstellung eines Daten-/Steuerblocks1100 gemäß Ausführungsbeispielen der vorliegenden Erfindung. Der Daten-/Steuerblock1100 stellt das N-fache der 64 Daten-/Steuerblöcke in dem optischen Stück102 dar. Horizontale Linien1101 –1109 stellen nur neun der 64 Bündel von vier chipinternen Wellenleitern dar, die jedem der 64 Daten-/Steuerblöcke zugeordnet sind (die verbleibenden 55 Bündel sind nicht gezeigt). Die Bündel sind auch von 1 bis 64 von oben nach unten markiert, wobei jede Markierung einem bestimmten Daten-/Steuerblock entspricht. Jeder Daten-/Steuerblock verwendet ein bestimmtes Bündel zum Empfangen codierter Kanäle, die von den anderen 63 Daten-/Steuerblöcken ausgegeben werden. Die verbleibenden 63 Bündel werden durch den Daten-/Steuerblock verwendet, um codierte Kanäle an die anderen 63 Daten-/Steuerblöcke zu senden. Wie es in11 gezeigt ist, hat beispielsweise der Daten-/Steuerblock1100 63 Bündelwellenleitermodulatoren, wie z. B. Bündelwellenleitermodulator1110 , die photonisch gekoppelt sind mit den Bündeln 1 bis N – 1 und den Bündeln N + 1 bis 64. Der Daten-/Steuerblock1100 hat auch zwei Bündelwellenleiterdetektoren1112 und1114 , die photonisch gekoppelt sind mit dem N-ten Bündel1105 . Der Daten-/Steuerblock1100 empfängt 64 uncodierte (d. h. unmodulierte) Kanäle in jedem der chipinternen Wellenleiter des ersten bis N – 1-ten Bündels und dem N + 1-sten bis 64sten Bündel von den Quellen702 und704 . - Wie es in
11 gezeigt ist, ist der Daten-/Steuerblock1100 konfiguriert, um die nichtcodierten Kanäle zu verwenden, die durch die Quelle702 bereitgestellt werden, um codierte Kanäle zu erzeugen, die für die Daten-/Steuerblöcke N + 1 bis zu dem 64sten beabsichtigt sind, und die uncodierten Kanäle verwenden, die durch die Quelle704 bereitgestellt werden, um codierte Kanäle zu erzeugen, die für die Daten-/Steuerblöcke 1 bis N – 1 bestimmt sind. Wie es in11 gezeigt ist, empfängt beispielsweise der Daten-/Steuerblock1100 uncodierte Kanäle auf den Bündeln1101 –1104 , die von der Quelle704 stammen, wie es durch Richtungspfeile1116 –1120 angezeigt ist, und verwendet die Bündelwellenleitermodulatoren, die mit den Bündeln1101 –1104 photonisch gekoppelt sind, um Daten in diesen uncodierten Kanälen1116 –1120 zu codieren, die für die Daten-/Steuerblöcke 1 bis N – 1 bestimmt sind. Andererseits empfängt der Daten-/Steuerblock1100 auch uncodierte Kanäle auf den Bündeln1106 –1109 , die von der Quelle702 stammen, wie es durch Richtungspfeile1121 –1125 angezeigt ist, und verwendet die Bündelwellenleitermodulatoren, die mit den Bündeln1106 –1109 photonisch gekoppelt sind, um Daten in diesen uncodierten Kanälen1112 –1125 zu codieren, die für die Daten-/Steuerblöcke N + 1 bis 64 bestimmt sind. Der Daten-/Steuerblock1100 verwendet die Bündelwellenleiterdetektoren1112 und1114 , um codierte Kanäle1120 und1121 zu empfangen, die durch die anderen 63 Daten-/Steuerblöcke gesendet werden. -
12 zeigt eine schematische Darstellung von drei Daten-/Steuerblöcken gemäß Ausführungsbeispielen der vorliegenden Erfindung. Wie es in12 gezeigt ist, ist der zweite Daten-/Steuerblock1202 konfiguriert, um codierte Kanäle auf dem zweiten Bündel1102 zu empfangen, und der 63ste Daten-/Steuerblock1204 ist konfiguriert, um codierte Kanäle auf dem 63sten Bündel1108 zu empfangen. Die Daten-/Steuerblöcke1100 und1204 und andere Daten- und Steuerblöcke, die nicht gezeigt sind, verwenden das Bündel1102 , um codierte Kanäle zu dem zweiten Daten-/Steuerblock1202 zu senden. Diese codierten Kanäle verlaufen ungestört durch die Daten-/Steuerblöcke, die dazwischen angeordnet sind. Die Daten-/Steuerblöcke1100 und1202 und andere Daten- und Steuerblöcke, die nicht gezeigt sind, verwenden das Bündel1108 , um codierte Kanäle zu dem 63sten Daten-/Steuerblock1204 zu senden. Diese codierten Kanäle verlaufen ungestört durch die Daten-/Steuerblöcke, die dazwischen angeordnet sind. Die Architektur und der Betrieb der Bündelwellenleitermodulatoren und -detektoren werden nachfolgend mit Bezugnahme auf13 und14 näher beschrieben. - Es ist anzumerken, dass bei anderen Ausführungsbeispielen der vorliegenden Erfindung der Daten-/Steuerblock
1100 auch konfiguriert sein kann, um die uncodierten Kanäle zu verwenden, die durch die Quelle702 bereitgestellt werden, um codierte Kanäle zu erzeugen, die für die Daten-/Steuerblöcke 1 bis N – 1 bestimmt sind, und die uncodierten Kanäle zu verwenden, die durch die Quelle704 bereitgestellt werden, um codierte Kanäle zu erzeugen, die für die Daten-/Steuerblöcke N + 1 bis 64 bestimmt sind. - Der Bündelwellenleitermodulator und der Bündelwellenleiterdetektor sind beinahe identisch konfigurierte Bauelemente.
13 zeigt eine schematische Darstellung eines vergrößerten Bündelmodulators/Detektors1300 gemäß Ausführungsbeispielen der vorliegenden Erfindung. Wie es oben mit Bezugnahme auf11 –12 beschrieben ist, empfängt der Bündelwellenleitermodulator/Detektor1300 Kanäle auf einem Bündel von vier chipinternen Wellenleitern1301 –1304 . Der Bündelwellenleitermodulator/Detektor1300 umfasst vier Wellenleiter-Mikroringsysteme, wie z. B. das Wellenleiter-Mikroringsystem1306 . Die vier Wellenleiter-Mikroringsysteme umfassen die etwa parallelen Wellenleiter1301 –1304 , aber der Trennungsabstand zwischen den Wellenleitern1301 –1304 kann von etwa 10–14 μm reichen, was größer ist als der Trennungsabstand zwischen den Bündelwellenleitern1301 –1304 außerhalb des Bündelwellenleitermodulators/Detektors1300 . Jedes Wellenleiter-Mikroringsystem umfasst 64 Mikroringe, wie z. B. den Mikroring1308 . Die 64 Mikroringe sind benachbart zu und verteilt auf gegenüberliegenden Seiten entlang der Länge jedes Wellenleiters. Jeder der Mikroringe ist konfiguriert, um in Resonanz zu sein mit einem der 64 Kanäle, die entlang einem photonisch gekoppelten Wellenleiter übertragen werden. Die Konfiguration der Mikroringe wird nachfolgend mit Bezugnahme auf17 beschrieben. -
13 umfasst auch Parameter t1, t2, t3 und t4, die Abmessungen von Komponenten des Wellenleiter-Mikroringsystems1300 darstellen. Bei bestimmten Ausführungsbeispielen kann t1 von etwa 45–64 μm reichen, t2 kann von etwa 200–300 μm reichen, t3 kann von etwa 0,5–5 μm reichen und t4 kann von etwa 1–10 μm reichen. Vorzugsweise kann t1 etwa 57,5 μm sein, t2 kann etwa 255 μm sein, t3 kann etwa 2 μm sein und t4 kann etwa 5 μm sein, aber die Erfindung ist nicht auf diese Abmessungen oder Abmessungsbereiche begrenzt. Diese Abmessungen und Abmessungsbereiche können abhängig von der Implementierung variiert werden. -
14 zeigt einen chipexternen Kommunikationshub1400 gemäß Ausführungsbeispielen der vorliegenden Erfindung. Der chipexterne Kommunikationshub1400 umfasst einen chipexternen Wellenleitermodulator1401 und einen chipexternen Wellenleiterdetektor1402 mit Gesamtabmessungen von etwa 200–300 μm mal etwa 100–200 μm, aber die Abmessungen können abhängig von der Implementierung variiert werden. Der chipexterne Wellenleitermodulator1401 umfasst vier Wellenleiter-Mikroringsysteme1403 –1406 . Jedes der Wellenleiter-Mikroringsysteme1403 –1406 umfasst einen Abschnitt eines chipexternen Wellenleiters und 64 Mikroringe. Die Wellenleiter der Wellenleiter-Mikroringsysteme1403 –1406 sind photonisch gekoppelt mit einem chipinternen Wellenleiter1407 über jeweils vier Strahlteiler1408 –1411 . Der Wellenleiter1407 trägt 64 uncodierte Kanäle, die durch die Strahlteiler1408 –1411 in die Wellenleiter-Mikroringsysteme1403 –1406 platziert werden, die dann verwendet werden, um Daten in die 64 uncodierten Kanäle zu codieren, die durch vier entsprechende Felder erzeugt werden, wie es nachfolgend mit Bezugnahme auf15A beschrieben ist. Der chipexterne Wellenleiterdetektor1402 umfasst vier Wellenleiter-Mikroringsysteme1412 –1415 , die auch vier chipexterne Wellenleiter umfassen zum Aufnehmen codierter Kanäle von externen Bauelementen, wie z. B. chipexternem Speicher. Die Wellenleiter-Mikroringsysteme1412 –1415 werden verwendet, um die codierten Kanäle in entsprechende codierte elektrische Signale umzuwandeln, die an vier elektronisch gekoppelte Felder übertragen werden. -
15 zeigt ein Rundsendesystem1500 gemäß Ausführungsbeispielen der vorliegenden Erfindung. Das Rundsendesystem1500 umfasst einen Rundsendemodulator1502 und einen Rundsendedetektor1504 mit Flächenabmessungen von etwa 400–600 μm mal 20–40 μm, aber die Abmessungen können abhängig von der Implementierung variiert werden. Der Rundsendemodulator1502 umfasst zwei Wellenleiter-Mikroringsysteme1506 und1508 , die photonisch gekoppelt sind mit zwei chipinternen Wellenleitern1510 bzw.1512 . Der Rundsendedetektor1504 umfasst zwei Wellenleiter-Mikroringsysteme1514 und1516 , die photonisch gekoppelt sind mit den Wellenleitern1510 und1512 über Strahlteiler1518 bzw.1520 . Das Rundsendesystem1500 wird verwendet, um Daten etwa gleichzeitig an all die anderen Cluster zu senden und von denselben zu empfangen,. - Obwohl optoelektronische Wandlerausführungsbeispiele der vorliegenden Erfindung oben mit Bezugnahme auf
9 –15 für eine 64-Clusterrechenvorrichtung beschrieben wurden, ist anzumerken, dass Ausführungsbeispiele der vorliegenden Erfindung nicht so begrenzt sind. Ein Fachmann auf diesem Gebiet wird sofort erkennen, dass diese Ausführungsbeispiele aufwärts oder abwärts skaliert werden können, um Rechenvorrichtungen mit jeder Anzahl von Cluster unterzubringen. - Betrieb von Wellenleiter-Mikroringsystemen
-
16A zeigt ein Wellenleiter-Mikroringsystem, das verwendet werden kann, um Daten in 64 uncodierte Kanäle zu codieren, gemäß Ausführungsbeispielen der vorliegenden Erfindung. In16A werden 64 uncodierte (d. h. unmodulierte) Kanäle λ1, λ2, λ3, ..., λ64 durch einen Wellenleiter1602 getragen. Jeder der 64 Mikroringe ist konfiguriert, um in Resonanz zu sein mit einem der Kanäle, so dass jeder Kanal über evaneszente Kopplung in einen zugeordneten benachbarten Mikroring extrahiert werden kann. Beispielsweise ist ein Mikroring1604 konfiguriert, um mit dem Kanal λ1 in Resonanz zu sein. Während der Kanal λ1 entlang dem Wellenleiter1602 übertragen wird, wird ein Großteil des Kanals λ1 evaneszent gekoppelt in den Mikroring1604 . Informationen können codiert werden in die Intensitäten von Kanälen durch Anlegen eines Musters von „Ein”- und „Aus”-Spannungen an die Mikroringe. Die Spannung verschiebt den Brechungsindex der Mikroringe, was wiederum die Intensität eines Kanals moduliert, der entlang dem Wellenleiter1602 übertragen wird. Das Muster von Spannungen kann einer Zeichenfolge von Daten entsprechen, die von einem entsprechenden Feld in dem Speichersteuerstück104 ausgegeben werden. Beispielsweise kann eine geeignete „Ein”-Spannung, die durch ein Feld des Speichersteuerstücks104 erzeugt wird, der binären Zahl „1” entsprechen, und die „Aus”-Spannung kann der binären Zahl „0” entsprechen. Wenn die „Ein”-Spannung an einen Mikroring angelegt wird, wird die Resonanz des Mikrorings verschoben und der entsprechende Kanal, der entlang dem benachbarten Wellenleiter übertragen wird, wird nicht evaneszent in den Mikroring gekoppelt. Anders ausgedrückt, während die „Ein”-Spannung angelegt wird, bleibt die Intensität des Kanals relativ unverändert, während der Kanal den Mikroring passiert. Sobald die Spannung „aus”-geschaltet ist, wird jedoch der Kanal evaneszent gekoppelt in den Mikroring und die Intensität des Kanals, der den Mikroring passiert, fällt. Als Folge können die gleichen Daten, die in einem Muster von „Ein”- und „Aus”-Spannungen codiert sind, in die Intensität des Kanals codiert werden, wo relativ hohe Intensitäten der binären Zahl „1” entsprechen, und relativ niedrige Intensitäten der Binärzahl „0” entsprechen. -
16B zeigt ein Wellenleiter-Mikroringsystem, das verwendet werden kann, um 64 codierte Kanäle von einem Wellenleiter zu extrahieren, gemäß Ausführungsbeispielen der vorliegenden Erfindung. In16B werden 64 codierte Kanäle λ1, λ2, λ3, ..., λ64 in einen Wellenleiter1606 eines Detektorblocks eingegeben. Jeder der 64 Mikroringe ist konfiguriert, um in Resonanz zu sein mit einem der 64 Kanäle, so dass jeder Kanal über evaneszente Kopplung in einen benachbarten Mikroring extrahiert werden kann. Während beispielsweise der codierte Kanal λ1 entlang dem Wellenleiter1606 übertragen wird, werden eine hohe und niedrige Intensität, die dem Kanal λ1 zugeordnet sind evaneszent in einen Mikroring1608 gekoppelt. Das Muster von relativ hohen und niedrigen Intensitäten, die dem Kanal λ1 zugeordnet sind, erzeugt ein entsprechendes Muster von hohen und niedrigen Spannungen über den Mikroring1608 . Dieses Muster von Spannungen wird dann als ein elektrisches Signal übertragen, das die gleichen Informationen codiert, zu einem zugeordneten Feld in dem Speichersteuerstück104 . - Mikroringe
-
17 zeigt eine schematische Darstellung eines Mikrorings1700 gemäß Ausführungsbeispielen der vorliegenden Erfindung. Der Mikroring1700 ist in nächster Nähe zu einem Wellenleiter1702 positioniert. Bei bestimmten Ausführungsbeispielen umfasst der Mikroring1700 einen intrinsischen Halbleiter, hat eine p-Typ-Halbleiterregion1704 , die in dem Halbleitersubstrat in dem Mikroring1700 gebildet ist, und eine n-Typ-Halbleiterregion1706 , die in dem Halbleitersubstrat gebildet ist, der die Außenseite des Mikrorings1700 umgibt und auf der gegenüberliegenden Seite des Wellenleiters1702 ist. Die Regionen1704 ,1706 und der Mikroring1700 bilden einen p-i-n-Übergang, der als eine Photodiode oder ein Modulator verwendet werden kann, wie es oben mit Bezugnahme auf16 beschrieben ist. Der Wellenleiter1702 kann ein chipinterner oder chipexterner Wellenleiter sein, wie es oben mit Bezugnahme auf13 –15 beschrieben ist. Die Übertragung des Wellenleiters1702 kann empfindlich sein für die Kanalwellenlänge und kann stark reduziert werden, wenn der Kanal in Resonanz ist mit dem Mikroring1700 , weil der Kanal evaneszent in den Mikroring1700 koppelt. Die Resonanz des Mikrorings1700 kann elektronisch moduliert werden durch Anlegen einer geeigneten Spannung oder eines geeigneten Stroms an die Regionen1704 und1706 . Der Mikroring1700 kann konfiguriert sein, so dass, wenn keine Spannung oder kein Strom an den Mikroring angelegt ist, ein bestimmter Kanal in Resonanz ist mit dem Mikroring1700 und evaneszent in den Mikroring1700 koppelt. Wenn eine geeignete Spannung oder ein geeigneter Strom an den Mikroring1700 angelegt ist, wird die Resonanz des Mikrorings1700 verschoben und der gleiche Kanal breitet sich ungestört durch den Wellenleiter1702 aus. Andererseits kann der Mikroring1700 auch konfiguriert sein, so dass, wenn eine Spannung oder ein Strom an den Mikroring1700 angelegt ist, ein bestimmter Kanal in Resonanz ist mit dem Mikroring1700 und evaneszent in den Mikroring1700 koppelt. Wenn die Spannung oder der Strom „aus”-geschaltet ist, wird die Resonanz des Mikrorings1700 verschoben und der gleiche Kanal breitet sich ungestört durch den Wellenleiter1702 aus. Für ein Beispiel von Mikroringmodulatoren siehe Q. Xu u. a., „12.5 Gbit/s carrier-injection-based silicon microring silicon modulators", Optics Express 15, 430 (2007). - Entscheidung
- Die Cluster können sowohl als Ressourcen als auch als Anforderer für andere Ressourcen arbeiten. Es kann jedoch der Fall sein, dass zwei oder mehr Cluster Zugriff zu der gleichen Ressource, wie z. B. einen bestimmten Cluster, während der gleichen Epoche anfordern. Jeder Cluster der vorliegenden Erfindung ist elektronisch gekoppelt mit einem entsprechenden Entscheidungssystem, um diese Arten von Konflikten zu vermeiden. Der Kürze und Einfachheit halber ist die folgende Beschreibung der Durchführung von Entscheidungen beschrieben unter Verwendung einer schematischen Darstellung einer beispielhaften Rechenvorrichtung, die nur vier Cluster umfasst, gemäß Ausführungsbeispielen der vorliegenden Erfindung. Nachfolgend ist eine Beschreibung eines Entscheidungssystemausführungsbeispiels mit Bezugnahme auf
19 beschrieben. -
18A zeigt schematische Darstellungen einer beispielhaften gestapelten Vier-Cluster-Rechenvorrichtung1800 gemäß Ausführungsbeispielen der vorliegenden Erfindung. Die Rechenvorrichtung1800 umfasst vier Cluster1801 –1804 , die in elektronischer Kommunikation mit vier entsprechenden Daten-/Steuerblöcken1805 –1808 sind. Die Rechenvorrichtung1800 umfasst auch eine erste Quelle1810 und eine zweite Quelle1812 . Die Quellen1810 und1812 können konfiguriert sein, um 64 uncodierte Kanäle λ1, λ2, λ3, ..., λ64 auf jeden Wellenleiter der vier Bündel von Wellenleitern1814 –1817 zu emittieren, wie es oben mit Bezugnahme auf8 beschrieben ist. Die Daten-/Steuerblöcke empfangen jeweils Daten- und Steuerkanäle auf einem bestimmten Bündel und verwenden die verbleibenden Kanäle, um Daten- und Steuerkanäle an die anderen Cluster zu senden. Beispielsweise umfasst der Daten-/Steuerblock1806 einen Bündelwellenleiterdemodulator1820 und drei Bündelwellenleitermodulatoren1821 –1823 , die konfiguriert sind und betrieben werden, wie es oben in11 –12 beschrieben ist. Die Cluster1801 –1804 sind jeweils in elektronischer Kommunikation mit einem Entscheidungssystem1830 . -
18B zeigt eine schematische Darstellung des Entscheidungssystems1830 gemäß Ausführungsbeispielen der vorliegenden Erfindung. Das Entscheidungssystem1830 umfasst einen Leistungswellenleiter1832 , der photonisch gekoppelt ist mit einer Quelle1834 , einen Schleifenwellenleiter1836 in photonischer Kommunikation mit dem Leistungswellenleiter1832 und über vier Lichtumleiter, die bei diesem Ausführungsbeispiel wellenlängenselektive Elemente1837 –1840 sind. Bei dieser beispielhaften Erörterung sind die wellenlängenselektiven Elemente als Mikroringe implementiert. Die Quelle1834 ist eine Lichtquelle. Beispiele von Lichtquellen umfassen eine Laserquelle, eine Lichtdiode oder Licht, das von einem anderen System empfangen wird. Das Entscheidungssystem1830 umfasst auch vier Gruppen von vier inneren Mikroringen1841 –1844 , die in dem Schleifenwellenleiter1836 angeordnet sind. Die Quelle1834 emittiert vier unmodulierte Kanäle λ1', λ2', λ3' und λ4' auf dem Leistungswellenleiter1832 . Jede der vier Mikroringgruppen1841 –1844 ist in elektronischer Kommunikation mit einem der vier Cluster1801 –1804 . Insbesondere sind die Mikroringe der Mikroringgruppe1841 in elektronischer Kommunikation mit dem Cluster 11801 , die Mikroringe der Mikroringgruppe1842 sind in elektronischer Kommunikation mit dem Cluster 21802 , die Mikroringe der Mikroringgruppe1843 sind in elektronischer Kommunikation mit dem Cluster 31803 und die Mikroringe der Mikroringgruppe1844 sind in elektronischer Kommunikation mit dem Cluster 41804 . Die inneren Mikroringe sind konfiguriert als p-i-n-Übergangphotodioden, wie es oben mit Bezugnahme auf17 beschrieben ist. Es ist anzumerken, dass für die 64-Cluster-Rechenvorrichtung100 kein Bedarf besteht für eine getrennte Quelle1834 , wie es nachfolgend mit Bezugnahme auf19 beschrieben ist. - Wie es in
18B gezeigt ist, sind die vier Mikroringe1837 –1840 und die inneren Mikroringe1841 –1844 jeweils mit den Kanalbezeichnungen λ1', λ2', λ3' und λ4' markiert. Diese Bezeichnungen identifizieren den Kanal, mit dem jeder Mikroring in Resonanz ist und evaneszent koppeln kann von einem benachbarten Wellenleiter. Beispielsweise sind die Mikroringe1837 –1844 jeweils getrennt konfiguriert, um in Resonanz zu sein mit nur einem der Kanäle λ1', λ2', λ3' bzw. λ4'. Insbesondere koppeln die Mikroringe1837 –1840 evaneszent die Kanäle λ1', λ2', λ3' bzw. λ4' von der Uhrzeigersinnrichtung1864 in dem Leistungswellenleiter1832 auf die Gegenuhrzeigersinnrichtung1848 in dem Schleifenwellenleiter1836 . - Auf die gleiche Weise koppeln die inneren Mikroringe
1841 –1844 auch evaneszent bestimmte Kanäle von dem Schleifenwellenleiter1836 , aber die inneren Mikroringe müssen aktiviert werden oder „ein”-geschaltet werden durch einen entsprechenden Cluster. Beispielsweise können die Mikroringe1841 alle konfiguriert sein, um eine halbe Mode versetzt zu sein von der Resonanzfrequenz der Kanäle λ1', λ2', λ3' und λ4'. Als Folge passieren die Kanäle λ1', λ2', λ3' und λ4' die Mikroringe1841 ungestört entlang dem Schleifenwellenleiter1836 . Der entsprechende Cluster 11801 kann jedoch einen entsprechenden Strom senden, um einen bestimmten Mikroring zu aktivieren, was den Mikroring in Resonanz mit einem zugeordneten Kanal verschiebt. Der Mikroring kann den Kanal von dem Schleifenwellenleiter1836 evaneszent koppeln, um in dem Mikroring in Resonanz zu sein. Beispielsweise kann der Cluster 11801 den Mikroring1850 „ein”-schalten, so dass der Kanal λ3' evaneszent gekoppelt ist von dem Schleifenwellenleiter1836 , um in dem Mikroring1850 in Resonanz zu sein. Außer wenn die anderen Mikroringe in der Gruppe1841 „ein”-geschaltet sind, passieren die Kanäle λ1', λ2' und λ4' ungestört. - Die Verwendung des Entscheidungssystems
1830 , um zu bestimmen, ob einer der vier Cluster1801 –1804 zum Empfangen von Daten verfügbar ist, wird nun mit Bezugnahme auf18A und18B beschrieben. Kurz vor jeder Epoche wird jeder Cluster einem der vier Kanäle zugewiesen, die von der Quelle1834 emittiert werden, und die Cluster1801 –1804 sind sich der Cluster-Kanal-Zuweisungen bewusst. Diese Zuweisungen können beliebig sein oder auf einem Verfahren basieren, das eine faire Verwendung der Cluster sicherstellt, und können während der Epoche (bei einer beispielhaften Implementierung 1/3 einer Epoche) durchgeführt werden, vor dem Beginn einer neuen Epoche. Diese Cluster-Kanal-Zuweisungen werden durch die Cluster verwendet, um zu bestimmen, welche Cluster verfügbar sind zum Empfangen von Daten für weitere Verarbeitung. Bei einem Ausführungsbeispiel können die Kanalzuweisungen pro Epoche anfangs vorbestimmt werden und in einer Nachschlagtabelle gespeichert werden, die an jedem Cluster zugreifbar ist, und Computerlogik, die verwendet wird, um die Cluster-Kanal-Zuweisungen pro Epoche gemäß einem Schema zu aktualisieren. Ein Beispiel eines solchen Schemas ist ein Round-Robin-Schema. - Bei einem Ausführungsbeispiel ist die Entscheidungsvorrichtung über mehrere Stücke verteilt. Die Kreuzschienenverbindungen auf dem Speichersteuerstück
104 bestimmen, was von der Entscheidungsvorrichtung anzufordern ist. Die Anforderung wird durch das analoge Stück106 zu dem optischen Stück108 übertragen, in dem die Ringmodulatoren und die Wellenleiter sitzen. Es wird versucht, an dem optischen Stück108 einen Kanal umzuleiten, und dieser Kanal wird entweder umgeleitet und erfasst oder nicht. Das resultierende elektrische Signal kehrt zurück zu den Kreuzschienenverbindungen, die das elektrische Signal als Start oder Stopp (go/no-go) interpretieren, um den logischen Kanal zu verwenden, durch Senden von Daten zu den Modulatoren während der nächsten Epoche. - Man betrachte beispielsweise eine in Tabelle I gezeigte Cluster-Kanal-Zuweisung vor dem Beginn einer Epoche: Tabelle I
Cluster Nr. Kanal 1 λ1' 2 λ2' 3 λ3' 4 λ4' - Wie es in Tabelle I angezeigt ist, wurde dem Cluster 1
1801 der Kanal λ1' zugewiesen, dem Cluster 21802 der Kanal λ2' usw. Man nehme an, dass der Cluster 11801 und der Cluster 41804 beide den Cluster 31803 verwenden möchten, um Daten zu verarbeiten. Mit erneuter Bezugnahme auf18B schaltet der Cluster 11801 den Mikroring1850 „ein”, und der Cluster 41804 schaltet ebenfalls den Mikroring1852 ein. Der Kanal λ3' ist evaneszent gekoppelt von dem Leistungswellenleiter1832 über den Mikroring1839 auf den Schleifenwellenleiter1836 , wo sich der Kanal λ3' dann entlang dem Schleifenwellenleiter1836 ausbreitet in einer Gegenuhrzeigersinnrichtung1848 genau nach dem Mikroring1839 . Der Mikroring1850 extrahiert den Kanal λ3' von dem Schleifenwellenleiter1836 , bevor der Kanal λ3' den Mikroring1852 erreichen kann. Der Kanal λ3', der in dem Mikroring1850 in Resonanz ist, erzeugt ein elektrisches Signal, das an den Cluster 11801 gesendet wird. Wenn dieses elektrische Signal mit erneuter Bezugnahme auf18A , einen Schwellenwert überschreitet, wird es in dem Cluster 11801 erfasst. Nachdem dieses Signal erfasst wurde, überträgt der Cluster 11801 während der nachfolgenden Epoche die Daten an die Modulatoren1856 , die die Daten in unmodulierte Kanäle codieren, die von der Quelle1810 ausgegeben werden. Diese codierten (d. h. modulierten) Kanäle werden dann entlang dem Bündel1816 strömungsmäßig zu den Detektoren1858 übertragen und durch den Cluster 31803 verarbeitet, wie es oben mit Bezugnahme auf12 beschrieben ist. In dieser bestimmten Epoche erhält der Cluster 11801 Zugriff auf den Cluster 31803 und der Cluster 41804 muss auf eine nachfolgende Epoche warten. - Man nehme nun an, dass der Cluster 1
1801 und der Cluster 41804 beide erneut den Cluster 31803 verwenden möchten, um Daten zu verarbeiten. Aber in diesem Fall nehme man an, dass die Cluster-Kanal-Zuweisungen vor dem Beginn einer Epoche so sind, wie sie in Tabelle II gezeigt sind,: Tabelle IICluster Nr. Kanal 1 λ3' 2 λ1' 3 λ4' 4 λ2' - Wie es in Tabelle II angezeigt ist, wurde dem Cluster 3
1803 nun der Kanal λ4' zugewiesen. Mit erneuter Bezugnahme auf18B schaltet der Cluster 11801 den Mikroring1860 „ein”, und der Cluster 41804 schaltet ebenfalls den Mikroring1862 „ein”. Der Kanal λ4' ist evaneszent gekoppelt von dem Leistungswellenleiter1832 über den Mikroring1840 auf den Schleifenwellenleiter1836 , wo sich der Kanal λ4 dann entlang dem Schleifenwellenleiter1836 in der Gegenuhrzeigersinnrichtung1848 ausbreitet, genau nach dem Mikroring1840 . Vor dieser Epoche extrahiert der Mikroring1862 jedoch den Kanal λ4' von dem Schleifenwellenleiter1836 , bevor der Kanal λ4' den Mikroring1860 erreichen kann. Der Kanal λ4' ist in dem Mikroring1862 in Resonanz und erzeugt ein elektrisches Signal, das an den Cluster 41804 gesendet wird. Wenn dieses elektrische Signal mit erneuter Bezugnahme auf18A einen Schwellenwert überschreitet, erfasst der Cluster 41804 dieses Signal. Nachdem dieses Signal erfasst wurde, sendet der Cluster 41804 während der nachfolgenden Epoche die Daten an den Cluster 31803 zum Verarbeiten, wie es oben beschrieben ist. In dieser bestimmten Epoche erhält der Cluster 41804 Zugriff auf den Cluster 31803 und der Cluster 11801 muss auf eine nachfolgende Epoche warten. -
19 zeigt ein Entscheidungssystem1900 , das einem zugeordneten Cluster N gemäß Ausführungsbeispielen der vorliegenden Erfindung entspricht. Das Entscheidungssystem umfasst acht Entscheidungsvorrichtungen1901 –1908 . Jede Entscheidungsvorrichtung umfasst ein Wellenleiter-Mikroringsystem und einen Mikroring, der photonisch gekoppelt ist mit einem der vier mittleren Wellenleiter1911 –1914 . Die Entscheidungsvorrichtung1901 umfasst beispielsweise ein Wellenleiter-Mikroringsystem1916 und einen Mikroring1918 , der photonisch mit dem mittleren Wellenleiter1911 gekoppelt ist. Die Entscheidungsvorrichtung1901 kann durch den Cluster N verwendet werden, um zu bestimmen, ob ein angeforderter Cluster M verfügbar ist zum Empfangen von Daten, und andere Entscheidungsvorrichtungen (nicht gezeigt), die mit dem gleichen Wellenleiter1920 verbunden sind, tun das gleiche für ihre zugeordneten Cluster. - Der Einfachheit halber wird angenommen, dass das Entscheidungssystem
1900 eines der 64 Entscheidungssysteme der Rechenvorrichtung100 darstellt, wie z. B. das in10 gezeigte Entscheidungssystem1006 . Man nehme an, dass alle 64 Cluster die Entscheidungsvorrichtungen verwenden, die mit dem Wellenleiter1920 verbunden sind, um zu bestimmen, welcher Cluster verfügbar ist zum Empfangen von Daten. Eine Quelle, wie z. B. die Quelle702 oder704 , platziert die 64 Kanäle λ1, λ2, λ3 ..., λ64 in den Wellenleiter1911 in der Richtung1922 . Jede Entscheidungsvorrichtung umfasst einen Mikroring, wie z. B. den Mikroring1918 , der einen der Kanäle λ1, λ2, λ3 ..., λ64 von dem Leistungswellenleiter1911 extrahiert und den entsprechenden Kanal auf den Wellenleiter1920 platziert, zum Ausbreiten in der Richtung1924 . Beispielsweise kann der Mikroring1918 konfiguriert sein, um den Kanal λN von dem Leistungswellenleiter1911 zu extrahieren. Die 64 Mikroringe des Wellenleiter-Mikroringsystems1916 sind jeweils konfiguriert, um einen der 64 unmodulierten Kanäle λ1, λ2, λ3 ..., λ64 zu extrahieren, die durch den Wellenleiter1920 getragen werden, wenn ein geeigneter Strom angelegt wird. Man nehme nun an, dass der Cluster N Daten an den Cluster M senden möchte, damit dieselben während der nächsten Epoche verarbeitet werden. Während diesem letzten Drittel der vorhergehenden Epoche bestimmt der Cluster N, dass der Cluster M dem Kanal λ63 zugewiesen wurde in der Cluster-Kanal-Zuweisung. Der Cluster N antwortet durch „ein”-schalten des Mikrorings1922 . Weil der Mikroring1918 konfiguriert ist, um nur den Kanal λN zu extrahieren, wird der Kanal λ63 von dem Leistungswellenleiter1911 durch eine andere Entscheidungsvorrichtung (nicht gezeigt) extrahiert, die mit dem Wellenleiter1920 verbunden ist, und der Kanal λ63 wird zurückgesendet entlang dem Wellenleiter1920 in der Richtung1924 . Vorausgesetzt, dass der Kanal λ63 nicht abgefangen wird durch eine Entscheidungsvorrichtung eines Clusters, der ebenfalls den Cluster M verwenden möchte, um Daten zu verarbeiten, wird der Kanal λ63 extrahiert über evaneszente Kopplung in den Mikroring1922 , was ein elektrisches Signal über dem Schwellenwert erzeugt. Der Cluster N antwortet durch Übertragen von Daten an den Cluster M, wie es oben mit Bezugnahme auf12 beschrieben ist. Falls der Kanal λ63 extrahiert wird durch einen weiteren Cluster K, bevor der Kanal λ63 den Mikroring1922 erreicht, dann kann der Cluster K Daten an den Cluster M übertragen zum Verarbeiten, und der Cluster N wartet auf die nächste Cluster-Kanal-Zuweisung und die nächste Epoche. - Obwohl der Betrieb von einer der acht Entscheidungsvorrichtungen
1901 –1908 beschrieben wurde, ist anzumerken, dass eine Anzahl der anderen Entscheidungsvorrichtungen verwendet werden kann, um zu bestimmen, ob andere Cluster verfügbar sind und verwendet werden können, um zu bestimmen, ob externe Vorrichtungen verfügbar sind. Diese Bestimmungen können zu unterschiedlichen Zeiten während einer Epoche durchgeführt werden. - Wie es oben erörtert wurde, kann zusätzlich zu dem darstellenden Beispiel einer Mehrkernrechenvorrichtung das photonische Verbindungs- und Entscheidungssystemausführungsbeispiel in anderen Computersystemvorrichtungen implementiert werden, beispielsweise einer Speichersystemvorrichtung, die auch die dreidimensionalen Stapel- und Mehrfachspeichersteuerungen aufweisen kann.
- Das volloptische Entscheidungssystemausführungsbeispiel, das oben im Zusammenhang von
18A bis19 erörtert ist, stellt ein System dar, das Entscheidung mit Leistungszufuhr verbindet, und stellt auch eine sich ändernde oder nicht festgelegte Zuweisung von logischen optischen Kanälen dar, die den unterschiedlichen Ressourcen zugeordnet sind, z. B. Clustern in der Computersystemvorrichtung. Dies schafft Fairness, wie es oben erörtert wurde. -
20A stellt eine schematische Ansicht eines volloptischen Entscheidungssystems dar gemäß einem weiteren Ausführungsbeispiel der vorliegenden Erfindung, in dem das Prioritätsschema festgelegt ist (nicht fair). Das Entscheidungssystem2000 kann ein Teil einer photonischen Verbindung sein oder kann anwendbar sein an den gesamten Abschnitt einer optischen Verbindung. Ein beispielhafter optischer Entscheidungsabschnitt2002 ist gezeigt, sowie der optische Datenwegabschnitt2004 , der auch dargestellt ist, um die relative Position eines optischen Empfängers2016 zu zeigen, der der Empfängercomputersystemkomponente zugeordnet ist, zu der Daten während eines Zeitperiodenfensters (z. B. Epoche) gesendet werden sollen. Bei diesem Beispiel hat der Datenabschnitt seine eigene Lichteingabe, die zu modulieren ist mit den Daten, die von der Computersystemkomponente, die dem Entscheidungsgewinn zugeordnet ist, zu der gewünschten Empfängerkomponente zu senden ist, die2016 zugeordnet ist. Die Lichteingabe2003 kann ein Lichtabschnitt sein, der umgeleitet ist oder abgeteilt von dem Signal, das von der Laserquelle2006 erzeugt wird, in diesem. Fall wäre die Lichteingabe unmoduliert. Die Lichtleistung2003 für den optischen Datenwegabschnitt2004 wird jedoch nicht empfangen oder geliefert von einem Lichtumleiter (z. B. „0a ”, „1a ” oder „2a ”), der dem Entscheidungssystem zugeordnet ist. - Eine Laserquelle
2006 liefert Leistung als Licht entlang einem Leistungswellenleiter2008 . Jeder der Lichtumleiter0a ,1a ,1b koppelt Licht von dem Leistungswellenleiter2008 , wenn es ihm gemäß einem Entscheidungsschema oder -protokoll erlaubt wird. Für dieses Beispiel ist ein nullter Lichtumleiter0a am nächsten zu dem optischen Weg von der Laserquelle2006 , ein erster Lichtumleiter1a ist der nächste zu dem optischen Weg für die Laserquelle2006 und ein zweiter Lichtumleiter2a ist optisch am weitesten entfernt von der Laserquelle2006 . Das Entscheidungssystem2000 wird durch einen Entscheidungsabschnitt2002 dargestellt, der die Lichtumleiter0a ,1a und2a umfasst, sowie jeweilige Detektoren, die einen nullten Detektor2018 umfassen, der zwischen den nullten Lichtumleiter0a und die Entscheidungsvorrichtung-0-Logik gekoppelt ist, einen ersten Detektor2022 , der zwischen den ersten Lichtumleiter1a und die Entscheidungsvorrichtung-1-Logik gekoppelt ist, und einen zweiten Detektor2026 , der zwischen den zweiten Lichtumleiter2a und die Entscheidungsvorrichtung-2-Logik gekoppelt ist. Jede der Entscheidungsvorrichtungslogikeinheiten ist einer Computersystemkomponente der Computersystemvorrichtung zugeordnet. Bei einem Ausführungsbeispiel kann der Lichtumleiter (0a ,1a ,2a ) ein passiver optischer Abgriff sein oder ein passiver optischer Teiler, mit dem der jeweilige optische Detektor (2018 ,2022 ,2026 ) gekoppelt ist, um alles umgeleitete Licht zu empfangen. - Jeder der Lichtumleiter kann auch implementiert sein als ein wellenlängenselektives Element, wie z. B. ein Ringmodulator, wie bei dem oben dargestellten Mehrkernbeispiel. Es kann sein, dass die zusätzlichen Detektoren
2018 ,2022 und2026 nicht benötigt werden, wenn der Lichtumleiterringmodulator auch sein eigenes elektrisches Benachrichtigungssignal erzeugen kann. Falls eine der Computersystemkomponenten, die den Lichtumleitern0a ,1a und2a zugeordnet ist, eine Anforderung hat, ein Signal an die Komponente zu senden, die dem Empfänger216 zugeordnet ist, sendet die Entscheidungsvorrichtungslogik (0, 1, 2) der zugeordneten Computersystemkomponente ein Aktivierungssignal an seinen jeweiligen Ringmodulator-Lichtumleiter0a ,1a und2a . Bei dem dargestellten Beispiel aktiviert die Entscheidungsvorrichtung 1 den Lichtumleiter1a , der Licht von der Laserquelle2006 zu dem ersten Detektor2022 umleitet, der ein elektrisches Signal sendet, das die Entscheidungsvorrichtung-1-Logik benachrichtigt, dass der Umleiter1a das Licht erfolgreich von dem Leistungswellenleiter2008 umgeleitet hat und dass die Komponente 1 ihre Daten auf der nächsten zugewiesenen Zeitperiode (z. B. Epoche) an die Komponente senden kann, die dem optischen Empfänger2016 zugeordnet ist. Ein weiterer Modulatortyp, der verwendet werden kann, ist ein Kanalagilmodulator. - Die Entscheidungsvorrichtung-1-Logik kann eine anfordernde Komponente (z. B. eine Speichersteuerung oder einen Kern oder eine Netzwerkschnittstelle) benachrichtigen, dass ihre Anforderung als Nächstes erfüllt werden kann. Die Entscheidungsvorrichtung-1-Logik kann den Modulator
1b aktivieren zum Codieren der Anforderung oder der angeforderten Daten auf ein optisches Signal der Lichteingabe2003 zum Senden auf einen Datenwellenleiter2030 in einem oder mehreren Wellenlängenkanälen, die einen logischen Kanal bilden können, der durch den optischen Empfänger2016 empfangen werden kann. Bei diesem Beispiel kann das Licht von der Laserquelle2006 moduliert sein (z. B. eine Benachrichtigung über den Gewinn der Entscheidung), da dasselbe nicht als eine Leistungsquelle verwendet wird außerhalb des Entscheidungssystemabschnitts2002 . Eine unabhängige Entscheidung, wo Leistungszufuhr nicht mit der Entscheidungslichtquelle gekoppelt ist, kann Fälle unterstützen, wo eine Entscheidung dazu führen kann, dass mehrere Wellenleiter oder logischen Kanäle verwendet werden. Die spezifische Wellenlänge oder die Wellenlängen, die für die Entscheidungssignale verwendet werden, stellen dar, dass ein logischer Kanal verfügbar ist, aber nicht, dass eine Empfängerkomponente auf diesen gleichen spezifischen Wellenlängen kommunizieren muss. - Bei diesem Beispiel hat die Computersystemkomponente 1 die Entscheidung gewonnen. Die Umleitung von Licht durch den Lichtumleiter
1a verhindert auch, dass das Licht von der Laserquelle2006 den Lichtumleiter2a erreicht. Die Entscheidungsvorrichtung-2-Logik bestimmt, dass derselben nach wie vor kein Zugriff gewährt wurde, und muss zumindest für die nächste zugewiesene Zeitperiode warten, um ihre Daten zu senden. Dieses Beispiel stellt beispielhaft dar, dass das Entscheidungssystem2000 ein Festgelegte-Priorität-Entscheidungsschema hat und dies nicht notwendigerweise fair ist, da die Komponente 0 immer Priorität erhält vor der Komponente 1, die wiederum Priorität erhält vor der Komponente 2 beim Erhalten von Zugriff auf die Komponente, die dem optischen Empfänger2016 zugeordnet ist. -
20A (und20B nachfolgend) stellen drei Beispiele von Entscheidungsmodulen dar, die optische Entscheidungsmodule umfassen. Jedes Entscheidungsmodul umfasst eine Entscheidungsvorrichtungslogikeinheit (Entscheidungsvorrichtungen 0, 1 und 2), durch die ein Satz von Computersystemkomponenten interagieren kann für Zugriff auf die photonische Verbindung, und das zugeordnete optische Entscheidungsmodul, das Licht von dem Leistungswellenleiter2008 umleiten kann, um anzuzeigen, dass Zugriff gewährt wurde gemäß einem Entscheidungsschema. -
20B stellt eine weitere Version2001 eines Entscheidungssystemausführungsbeispiels dar, bei dem Lichtleistungszufuhr zu einem anderen funktionalen Abschnitt der photonischen Verbindung, wie z. B. Datentransport, gekoppelt oder kombiniert ist mit Entscheidung. Dabei sind die Modulatoren „0b ”, „1b ” und „2b ” positioniert, um unmodulierte Lichtleistung von dem Laser2006 zu empfangen, die durch Lichtumleiter0a ,1a bzw.2a umgeleitet wurde. Die Daten oder die Anforderung von der Computersystemkomponente, der Zugriff gewährt wurde, wird auf das unmodulierte Licht codiert für einen Transport auf dem zugeordneten photonischen Verbindungsdatenkanal oder den Kanälen, die bei der Entscheidung auf dem Wellenleiter2030 gewonnen wurden. - Für eine einfachere Darstellung ist der Entscheidungskanal oder die -kanäle so dargestellt, dass dieselben einen getrennten Wellenleiter überqueren von dem Datenkanalabschnitt der photonischen Verbindung. Die Wellenlängen, die die Entscheidungs- und Datenkanäle bilden, können jedoch wellenlängengemultiplext sein und können durch den gleichen optischen Wellenleiter getragen werden.
-
21 ist eine schematische Ansicht des Entscheidungssystems2001 , das ein Entscheidungsschema verwenden kann, bei dem mehreren Computersystemkomponenten Zugriff gewährt werden kann zu mehreren Empfangskomponenten, ohne eine Anzahl von verwendeten Wellenleitern zu erhöhen. - Bei diesem Beispiel liefert die Laserquelle
2006 nicht nur unmodulierte Lichtleistung, wie es in20B beschrieben ist, sondern gibt unmoduliertes Licht einzelner Wellenlängen aus, die wellenlängengemultiplext sind (WDM; WDM = wavelength division multiplexed) oder dichtwellenlängenmultiplext (DWDM; DWDM = dense wavelength division multiplexed). Der nullte Lichtumleiter0a , der erste Lichtumleiter1a und der zweite Lichtumleiter2a können jeweils mit einem abstimmbaren Modulator (z. B. kanalagilem Modulator) oder einer Bank von festen Modulatoren (z. B. Ringmodulatoren) implementiert sein. Gleichartig dazu können der nullte Modulator0b , der erste Modulator1b und der zweite Modulator2b jeweils mit einem abstimmbaren Modulator oder einer Bank von festen Modulatoren implementiert sein. Die Empfänger2016 sind vorzugsweise Festfrequenzempfänger. - Falls in diesem Fall eine Komponente mit einem bestimmten Empfänger kommunizieren möchte, stimmt die jeweilige Entscheidungsvorrichtungslogik ihren jeweiligen Umleiter und ihren jeweiligen Modulator ab, entweder parallel, falls Geschwindigkeit wichtig ist, oder sequentiell, falls es Beschränkungen bei der Leistung oder Zuverlässigkeit gibt, auf die Wellenlänge, die dem Empfänger entspricht. Dieses Schema ermöglicht es Komponenten, sich für mehrere Empfänger zu entscheiden, ohne die Anzahl von Wellenleitern zu erhöhen.
- Als detailliertere Beschreibung dieses Beispiels leitet der nullte Lichtumleiter
0a ein nulltes wellenlängenunmoduliertes Licht2102 von dem Leistungswellenleiter2008 um, und der erste Lichtumleiter1a leitet ein erstes wellenlängenunmoduliertes Licht2104 um. Der nullte Detektor2018 und der erste Detektor2022 erfassen erfolgreich eine Entscheidung für ihre jeweiligen zugeordneten Komponenten. Der nullte Modulator0b und der erste Modulator1b können das nullte wellenlängenunmodulierte Licht2102 empfangen bzw. ein erstes wellenlängenunmoduliertes Licht2104 , und ein nulltes wellenlängenmoduliertes Licht2106 bzw. ein erstes wellenlängenmoduliertes Licht2108 auf den Datenwellenleiter2030 ausgeben. - Mit Bezugnahme auf
22 ist eine schematische Ansicht eines weiteren Entscheidungssystems2200 gemäß einem Ausführungsbeispiel der vorliegenden Erfindung gezeigt. Entscheidungsprotokolle haben mehrere Eigenschaften, die gegeneinander abgewogen werden können und optimiert werden können, einschließlich Einfachheit, Geschwindigkeit, zentralisiert gegenüber verteilt, Fairness und Priorisierung. Wie es in20A gezeigt ist, hat das Entscheidungssystem2000 von20A eine festgelegte Priorität und ist somit nicht fair. - Das Entscheidungssystem stellt ein optisch implementiertes Token-Protokoll bereit. Bei diesem Beispiel gibt es zehn Module 0 bis 9, die versuchen, sich für eine einzelne Ressource zu entscheiden. Das Konzept eines Tokens wird dargestellt durch die Tatsache, dass die Module die Fähigkeit haben, Licht von einem Leistungswellenleiter
2204 auf einen Entscheidungswellenleiter2206 umzuleiten, und welches der Module das Licht umleitet, kann sich zwischen den Entscheidungen ändern. Indem die Priorität jedes Mal geändert wird, tritt die Entscheidung auf eine Weise auf, so dass jedes der Module die gleiche durchschnittliche Priorität hat, was zu einem Entscheidungsmechanismus führt, der fair ist. - In dem Entscheidungssystem
2200 leitet ein erstes Modul2208 das Licht von dem Leistungswellenleiter2204 zu dem Entscheidungswellenleiter2206 um, unter Verwendung eines ersten Lichtumleiters2210 , der als „1a ” bezeichnet wird. Der erste Lichtumleiter2210 kann mit einem Ringmodulator implementiert sein. Entscheidung auf dem Entscheidungswellenleiter2206 tritt auf ähnliche Weise auf, wie es in20A beschrieben ist. - Bei diesem Beispiel versuchen ein drittes Modul
2212 , ein viertes Modul2214 , ein siebtes Modul2216 und ein achtes Modul2218 , die als Module 3, 4, 7 bzw. 8 dargestellt sind, das Licht von dem Entscheidungswellenleiter2206 umzuleiten. Das acht Modul2218 leitet erfolgreich das Licht um und erfasst dasselbe, weil das Licht als erstes entlang demselben verläuft und dadurch die Entscheidung gewinnt und das Recht, die Ressource zu verwenden. Die Bezeichnungen erstes, drittes, viertes, siebtes und achtes stellen die Nähe der Module2202 zu einer Laserquelle2220 dar, die den Leistungswellenleiter2204 treibt, wobei die niedrigere Zahl optisch näher ist zu der Laserquelle2220 . - Am Anfang der nächsten Entscheidungsphase leitet ein anderes Modul als das erste Modul
2208 oder Modul 1 das Licht auf den Entscheidungswellenleiter2206 um und ändert dadurch die Priorität für diese Runde. Welches Modul das Licht als Nächstes umleitet, hängt von dem gewünschten Protokoll ab. Ein mögliches Entscheidungsschema ist ein einfaches Round-Robin-Schema, wo die Höchstpriorität einfach abwechselnd durch jedes Modul zyklisch verläuft. - In dem Round-Robin-Schema würde ein zweites Modul
2222 , das als Modul 2 dargestellt ist, das Licht in der nächsten Phase umleiten, gefolgt von dem dritten Modul2212 oder dem Modul 3 in der folgenden Phase usw. Wenn eine Mehrzahl von Wellenlängen gemultiplext wird auf dem Leistungswellenleiter2206 , kann eine bestimmte Wellenlänge oder Gruppe von Wellenlängen an jedem Modul ebenfalls in einem Round-Robin-Schema umgeleitet werden. Falls es beispielsweise zehn Wellenlängen gibt, kann die erste Wellenlänge durch das Modul 0a in einer anfänglichen ersten Epoche umgeleitet werden. In der nächsten Epoche kann nur das Modul2208 (1a ) seinen Lichtumleiter aktivieren, um die erste Wellenlänge umzuleiten. Die Entscheidung kann nach wie vor verteilt sein, da jedes Modul nur über ein synchrones Taktsignal, diejenigen Epochen wissen muss, während denen es Zugriff hat auf unterschiedliche Wellenlängen, die durch die Entscheidungsvorrichtungslogik lokal gespeichert werden können. Das Entscheidungsmodul muss nicht wissen, welchem Modul vorher Zugriff gewährt wurde, und hält somit die Entscheidung verteilt, anstatt globale Kommunikation innerhalb der Computersystemvorrichtung zu erfordern. Indem die Priorität auf diese Weise in jeder Runde geändert wird, kann die Fairness beträchtlich verbessert werden im Vergleich zu einem Festgelegte-Priorität-Schema, das für das Entscheidungssystem2000 von20A beschrieben ist. Ein weiteres Entscheidungsschema für das Entscheidungssystem2200 kann umfassen, dass die Priorität neu angeordnet wird, so dass der aktuelle Halter der Ressource in dem nächsten Entscheidungszyklus zu dem Modul mit niedrigster Priorität wird. Dies führt jedoch globale Informationsaustauschanforderungen ein. - Licht verläuft nicht unmittelbar, daher gibt es Zeitgebungsüberlegungen, die in diesen Schemata berücksichtigt werden müssen. Wenn eine neue Phase beginnt, kann es sein, dass der neue Umleiter darauf warten muss, dass das Licht an dem Leistungswellenleiter ankommt. Außerdem muss ein Modul sicher sein, dass es Licht von dem aktuellen Umleiter verwendet, und kein Licht, das von der vorhergehenden Phase übrig ist.
- In dem Round-Robin-Schema, wo bei jeder Phase das nächsthöhere Modul der Umleiter wird (und zurückspringt zu Null von dem Modul mit der höchsten Zahl), muss ein Modul darauf warten, dass das Licht auf dem Leistungswellenleiter
2204 zu dem nächsten Umleiter verläuft, und dann die Zeit eines vollen Durchlaufs des Rings abwarten, in dem Fall, wo der Gewinner so weit wie möglich entfernt ist von dem Umleiter. Ein voller Durchlauf ist auch die Zeitdauer, die erforderlich ist, um sicherzustellen, dass jedes der Module2002 Licht von der neuen Phase sieht und nicht von der vorhergehenden. - Falls es N Module und N Entscheidungsvorrichtungen gibt (entweder implementiert durch Replikation oder WDM) und falls in jeder Phase alle N Module an einen Empfänger senden möchten, der in einer einheitlichen Zufallsverteilung gewählt wird, nähert sich dieses Schema einer Ausnutzung von 1 – e–1 (etwa 0,632), während sich N erhöht. Die Ausnutzung kann verbessert werden durch Durchführen mehrerer Entscheidungsrunden, wo jede Runde zwischen den Verlierern der vorhergehenden Runde entscheidet. Falls es R Runden gibt, nähert sich die Ausnutzung 1 – e–R, während sich N erhöht.
- Wie es oben beschrieben wurde, kombiniert das Token-Protokoll Leistungszufuhr und Entscheidung nicht wie oben beschrieben. Dies könnte durchgeführt werden durch Hinzufügen eines weiteren Satzes von Modulatoren und eines weiteren Wellenleiters in der Mitte zwischen dem Leistungswellenleiter
2204 und dem Entscheidungswellenleiter2206 . Falls der Entscheidungswellenleiter2206 in22 als der Leistungswellenleiter2008 von20B wirkte, und es einen Ringmodulator gäbe mit jedem Detektor zum Übertragen das Licht auf den Datenwellenleiter2030 von20B , würde dies zu einem kombinierten Leistungszufuhr- und Token-Entscheidungsprotokoll führen. - Die optische Leistung, die erforderlich ist, um diese Entscheidungsprotokolle zu implementieren, könnte beträchtlich geringer sein als eine elektrische Implementierung, insbesondere falls dies über lange Abschnitte oder bei sehr hohen Geschwindigkeiten durchgeführt wird. Ferner hat diese Lösung abhängig von der Größe des Rings des Entscheidungswellenleiters
2206 das Potential, in sehr kurzer Zeit zu einer Entscheidung zu kommen. Ein chipinterner Ring könnte eine Entscheidung in nur einigen wenigen Nanosekunden treffen, im Vergleich zu elektrischen Lösungen, die häufig eine Größenordnung langsamer sind. - Die vorhergehende Beschreibung verwendete zu Erklärungszwecken spezifische Nomenklatur, um ein gründliches Verständnis der Erfindung zu liefern. Es ist jedoch für Fachleute auf diesem Gebiet klar, dass die spezifischen Einzelheiten nicht erforderlich sind, um die Erfindung zu praktizieren. Die vorhergehenden Beschreibungen spezifischer Ausführungsbeispiele der vorliegenden Erfindung sind zu Darstellungs- und Beschreibungszwecken präsentiert. Dieselben sind nicht erschöpfend zu sehen oder so dass sie die Erfindung auf die genau offenbarten Formen begrenzen. Offensichtlich sind hinsichtlich der obigen Lehren viele Modifikationen und Variationen möglich. Die Ausführungsbeispiele sind gezeigt und beschrieben, um die Prinzipien der Erfindung und ihre praktischen Anwendungen am besten zu erklären, um es dadurch anderen Fachleuten auf diesem Gebiet zu ermöglichen, die Erfindung und verschiedene Ausführungsbeispiele mit verschiedenen Modifikationen am besten zu nutzen, wie sie für die bestimmte in Betracht gezogene Verwendung geeignet sind. Der Schutzumfang der Erfindung ist durch die folgenden Ansprüche und ihre Äquivalente definiert.
- Zusammenfassung
- Verschiedene Ausführungsbeispiele der vorliegenden Erfindung beziehen sich auf Systeme und Verfahren für volloptische verteilte Entscheidung für Computersystemkomponenten (
1801 –1804 ), die über eine photonische Verbindung in einer Computersystemvorrichtung kommunikativ gekoppelt sind. Die Ausführungsbeispiele der optischen Entscheidung in dem Computersystem liefern Entscheidungsschemata mit festgelegter Priorität (2000 ) und nicht festgelegter Priorität (1830 ,2200 ). Die Ausführungsbeispiele mit Nicht-Festgelegte-Priorität-Schema können Fairness bei der Entscheidung bereitstellen. Bei einigen Ausführungsbeispielen sind die Zufuhr von Lichtleistung und Entscheidung kombiniert (1830 ,2001 ). - ZITATE ENTHALTEN IN DER BESCHREIBUNG
- Diese Liste der vom Anmelder aufgeführten Dokumente wurde automatisiert erzeugt und ist ausschließlich zur besseren Information des Lesers aufgenommen. Die Liste ist nicht Bestandteil der deutschen Patent- bzw. Gebrauchsmusteranmeldung. Das DPMA übernimmt keinerlei Haftung für etwaige Fehler oder Auslassungen.
- Zitierte Nicht-Patentliteratur
-
- Lehrbücher Fundamentals of Optical Waveguides von Katsunari Okamoto, Elsevier Inc., 2005 [0060]
- Optical Waveguide Theory von Snyder und Love, Chapman and Hall, London, 1983 [0060]
- und Photonic Crystals von Jean-Michel Lourtioz, Springer-Verlag, Berlin, 2005 [0060]
- A. W. Fang u. a., „Integrated AlGaInAs-silicon evanescent race track laser and photodetectors”, Optics Express 15, 2315 (2007) [0061]
- Q. Xu u. a., „12.5 Gbit/s carrier-injection-based silicon microring silicon modulators”, Optics Express 15, 430 (2007) [0077]
Claims (7)
- Ein optisches Entscheidungssystem (
1830 ,2001 ) für die Verwendung mit einer photonischen Verbindung, die Kommunikation in einem Computersystem bereitstellt, das folgende Merkmale umfasst: einen ersten Wellenleiter (1832 ,2008 ); eine Lichtquelle (1834 ,2006 ) zum Senden von Licht über den ersten Wellenleiter (1832 ,2001 ); einen ersten Lichtumleiter (1837 ,1838 ,1839 ,1840 ,2010 ,2012 ,2014 ), der mit dem ersten Wellenleiter gekoppelt ist zum Umleiten des Lichts; einen ersten Detektor (1841 ,1842 ,1843 ,1844 ,2018 ,2022 ,2026 ), der mit dem ersten Lichtumleiter gekoppelt ist zum Erfassen des Lichts; einen ersten Modulator (1841 ,1842 ,1843 ,1844 ,0b ,1b ,2b ) zum Modulieren von Licht zum Tragen von Daten ansprechend darauf, dass der erste Detektor das Licht erfasst; und einen Datenwellenleiter (1814 ,1815 ,1816 ,1827 ,2030 ), der mit dem ersten Modulator gekoppelt ist zum Tragen des modulierten Lichts. - Das System gemäß Anspruch 1, bei dem der erste Wellenleiter ein Leistungswellenleiter (
1832 ,2008 ) ist, der unmoduliertes Licht trägt; und bei dem der erste Modulator mit dem ersten Detektor gekoppelt ist zum Modulieren des unmodulierten Lichts. - Das System gemäß Anspruch 1, bei dem der erste Lichtumleiter einen Ringmodulator (
1700 ) umfasst. - Das System gemäß Anspruch 2, das ferner einen zweiten Lichtumleiter (
1838 ,2012 ) umfasst, der mit dem Leistungswellenleiter (1832 ,2008 ) gekoppelt ist, und der erste Lichtumleiter (1837 ,2010 ) liegt zwischen der Lichtquelle und dem zweiten Lichtumleiter. - Das System gemäß Anspruch 1, bei dem: die Lichtquelle (
1834 ,2006 ) zum Senden eines ersten wellenlängenunmodulierten Lichts und eines zweiten wellenlängenunmodulierten Lichts dient; der erste Lichtumleiter (1837 ,2010 ) zum Umleiten des ersten wellenlängenunmodulierten Lichts dient; und das ferner folgendes Merkmal umfasst: einen zweiten Lichtumleiter (1838 ,2012 ), der mit dem Leistungswellenleiter gekoppelt ist zum Umleiten des zweiten wellenlängenunmodulierten Lichts. - Das optische Entscheidungssystem gemäß Anspruch 1, bei dem das System ein Festgelegte-Priorität-Entscheidungsschema (
2000 ) bereitstellt. - Das optische Entscheidungssystem gemäß Anspruch 1, bei dem das System ein Nicht-Festgelegte-Priorität-Entscheidungsschema (
1830 ,2200 ) bereitstellt.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US19007P | 2007-10-23 | 2007-10-23 | |
US61/000,190 | 2007-10-23 | ||
PCT/US2008/012119 WO2009055032A2 (en) | 2007-10-23 | 2008-10-23 | All optical fast distributed arbitration in a computer system device |
Publications (1)
Publication Number | Publication Date |
---|---|
DE112008002823T5 true DE112008002823T5 (de) | 2011-04-14 |
Family
ID=40580300
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE112008002823T Pending DE112008002823T5 (de) | 2007-10-23 | 2008-10-23 | Volloptische schnelle verteilte Entscheidung in einer Computersystemvorrichtung |
Country Status (6)
Country | Link |
---|---|
US (1) | US8335434B2 (de) |
JP (1) | JP5070342B2 (de) |
KR (1) | KR101492299B1 (de) |
CN (1) | CN101911288B (de) |
DE (1) | DE112008002823T5 (de) |
WO (1) | WO2009055032A2 (de) |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2510448B1 (de) * | 2009-12-10 | 2017-09-20 | Hewlett-Packard Enterprise Development LP | System und verfahren für gerechte token-arbitrierung |
US8705972B2 (en) * | 2010-05-11 | 2014-04-22 | Hewlett-Packard Development Company, L.P. | Energy-efficient and fault-tolerant resonator-based modulation and wavelength division multiplexing systems |
KR20120065809A (ko) * | 2010-12-13 | 2012-06-21 | 한국전자통신연구원 | 멀티 코어 중앙처리장치를 위한 광네트워크 구조 |
KR101527308B1 (ko) | 2011-03-14 | 2015-06-09 | 휴렛-팩커드 디벨롭먼트 컴퍼니, 엘.피. | 메모리 인터페이스 |
US9794019B2 (en) * | 2011-04-28 | 2017-10-17 | Hewlett Packard Enterprise Development Lp | Prioritized optical arbitration systems and methods |
KR101854243B1 (ko) * | 2011-05-16 | 2018-05-03 | 삼성전자주식회사 | 적층 메모리 장치, 및 이를 포함하는 메모리 시스템 |
WO2013078536A1 (en) | 2011-12-01 | 2013-06-06 | Mosaid Technologies Incorporated | Cpu with stacked memory |
WO2013080426A1 (ja) * | 2011-12-01 | 2013-06-06 | パナソニック株式会社 | 熱を考慮した構造を持つ集積回路装置、三次元集積回路、三次元プロセッサ装置、及びプロセススケジューラ |
US8792786B2 (en) * | 2012-03-15 | 2014-07-29 | Massachusetts Institute Of Technology | Photonically-enabled in-flight data reorganization |
US20140003810A1 (en) | 2012-07-02 | 2014-01-02 | Alcatel-Lucent Usa Inc. | Reconfigurable optical networks |
WO2015034802A1 (en) | 2013-09-06 | 2015-03-12 | Massachusetts Institute Of Technology | Isa extensions for synchronous coalesced accesses |
FR3014563B1 (fr) * | 2013-12-09 | 2016-02-05 | Commissariat Energie Atomique | Dispositif et procede d'arbitrage optique dans un systeme de reseau sur puce |
CN104730653B (zh) | 2013-12-23 | 2016-08-31 | 华为技术有限公司 | 光互连系统和方法 |
KR101810952B1 (ko) * | 2014-03-20 | 2017-12-20 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 광 네트워크-온-칩 및 광 링크 대역폭을 조정하는 방법 및 장치 |
US20160314003A1 (en) * | 2015-04-23 | 2016-10-27 | PhotonIC International Pte. Ltd. | Photonics-Optimized Processor System |
US9739939B1 (en) | 2016-02-18 | 2017-08-22 | Micron Technology, Inc. | Apparatuses and methods for photonic communication and photonic addressing |
US20170346445A1 (en) * | 2016-05-31 | 2017-11-30 | Futurewei Technologies, Inc. | Dense Wavelength-Division Multiplexing (DWDM) Network and Method |
US11487445B2 (en) * | 2016-11-22 | 2022-11-01 | Intel Corporation | Programmable integrated circuit with stacked memory die for storing configuration data |
US11398453B2 (en) | 2018-01-09 | 2022-07-26 | Samsung Electronics Co., Ltd. | HBM silicon photonic TSV architecture for lookup computing AI accelerator |
US11503387B2 (en) | 2020-05-21 | 2022-11-15 | Hewlett Packard Enterprise Development Lp | Zero added latency packet reroute via silicon photonics |
US11239169B1 (en) * | 2020-07-24 | 2022-02-01 | Micron Technology, Inc. | Semiconductor memory stacks connected to processing units and associated systems and methods |
US11340410B2 (en) | 2020-10-19 | 2022-05-24 | Hewlett Packard Enterprise Development Lp | Dimensionally all-to-all connected network system using photonic crossbars and quad-node-loop routing |
US11323787B1 (en) | 2020-10-30 | 2022-05-03 | Hewlett Packard Enterprise Development Lp | Multi-chip photonic node for scalable all-to-all connected fabrics |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3172949B2 (ja) * | 1991-03-20 | 2001-06-04 | 富士通株式会社 | 光信号伝送装置 |
JP3257260B2 (ja) * | 1994-07-26 | 2002-02-18 | 松下電器産業株式会社 | 波長多重発光装置および波長多重伝送システム |
JP3728147B2 (ja) * | 1999-07-16 | 2005-12-21 | キヤノン株式会社 | 光電気混載配線基板 |
US20030128980A1 (en) * | 2002-11-27 | 2003-07-10 | Abeles Joseph H. | Channelizer switch |
US7752400B1 (en) * | 2000-12-14 | 2010-07-06 | F5 Networks, Inc. | Arbitration and crossbar device and method |
US6967347B2 (en) * | 2001-05-21 | 2005-11-22 | The Regents Of The University Of Colorado | Terahertz interconnect system and applications |
JP2005244560A (ja) * | 2004-02-26 | 2005-09-08 | Fujitsu Ltd | 光電子集積回路装置、光電子集積回路システム及び伝送方法 |
CN1997924B (zh) * | 2004-04-15 | 2016-05-04 | 英飞聂拉股份有限公司 | 用于wdm传输网络的无制冷且波长栅格漂移的集成光路(pic) |
KR100674933B1 (ko) * | 2005-01-06 | 2007-01-26 | 삼성전자주식회사 | 온 칩 버스(On Chip Bus)에서 최적화된코어-타일-스위치(core-tile-switch)맵핑(mapping) 구조를 결정하는 방법 및 그 방법을기록한 컴퓨터로 읽을 수 있는 기록 매체 |
JP4586654B2 (ja) | 2005-07-04 | 2010-11-24 | ソニー株式会社 | 光データ伝送システムおよび光データ伝送方法 |
US8139904B2 (en) * | 2007-09-18 | 2012-03-20 | International Business Machines Corporation | Method and apparatus for implementing optical deflection switching using coupled resonators |
-
2008
- 2008-10-23 JP JP2010531049A patent/JP5070342B2/ja not_active Expired - Fee Related
- 2008-10-23 DE DE112008002823T patent/DE112008002823T5/de active Pending
- 2008-10-23 CN CN2008801223620A patent/CN101911288B/zh active Active
- 2008-10-23 KR KR1020107009006A patent/KR101492299B1/ko active IP Right Grant
- 2008-10-23 WO PCT/US2008/012119 patent/WO2009055032A2/en active Application Filing
- 2008-10-23 US US12/682,918 patent/US8335434B2/en active Active
Non-Patent Citations (5)
Title |
---|
A. W. Fang u. a., "Integrated AlGaInAs-silicon evanescent race track laser and photodetectors", Optics Express 15, 2315 (2007) |
Lehrbücher Fundamentals of Optical Waveguides von Katsunari Okamoto, Elsevier Inc., 2005 |
Optical Waveguide Theory von Snyder und Love, Chapman and Hall, London, 1983 |
Q. Xu u. a., "12.5 Gbit/s carrier-injection-based silicon microring silicon modulators", Optics Express 15, 430 (2007) |
und Photonic Crystals von Jean-Michel Lourtioz, Springer-Verlag, Berlin, 2005 |
Also Published As
Publication number | Publication date |
---|---|
KR20100075548A (ko) | 2010-07-02 |
JP2011501617A (ja) | 2011-01-06 |
US8335434B2 (en) | 2012-12-18 |
WO2009055032A3 (en) | 2009-07-09 |
JP5070342B2 (ja) | 2012-11-14 |
WO2009055032A2 (en) | 2009-04-30 |
CN101911288B (zh) | 2012-12-26 |
KR101492299B1 (ko) | 2015-02-11 |
CN101911288A (zh) | 2010-12-08 |
US20100226657A1 (en) | 2010-09-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE112008002823T5 (de) | Volloptische schnelle verteilte Entscheidung in einer Computersystemvorrichtung | |
KR101520130B1 (ko) | 광자 상호접속부 | |
DE112018000197B4 (de) | Wellenleiterarchitektur für eine photonische neuronale Komponente | |
DE112008002822B4 (de) | Dreidimensionale Chipstapel mit einer optischen Verbindung, die zwischen Vorrichtungen und innerhalb einer Vorrichtung vorliegt | |
DE60130360T2 (de) | Integriert-optischer multiplexer/demultiplexer | |
DE112018000641B4 (de) | Wellenleiterarchitektur für eine photonische neuronale komponente mit optischen multiplexsignalen auf zwischenknoten-wellenleitern | |
DE102011088358B4 (de) | Optischer Modulator | |
DE3390103C2 (de) | ||
DE112019000130T5 (de) | Knoten mit kombinierter optischer und elektrischer schaltung | |
WO1985003179A1 (fr) | Circuit avec bus optique | |
DE112008003647B4 (de) | Optische Verbindungen | |
DE102021109343B4 (de) | Photonischer multi-chip-knoten für skalierbare all-to-all-verbundene fabrics | |
US8606113B2 (en) | Optical network with tunable optical light sources | |
DE60130150T2 (de) | Photonische signalmatrix in integrierter schaltung | |
DE60123632T2 (de) | Optisches umordnungssystem | |
Wang et al. | A group-based laser power supply scheme for photonic network on chip | |
DE102021107383A1 (de) | Null-latenz-paketumleitung über silizium-photonik | |
Mokhtari et al. | Multilayer optical interconnects design: switching components and insertion loss reduction approach | |
DE10056600C2 (de) | Verfahren zur Herstellung eines elektro-optischen Transceivers für ein Wellenlängenmultiplex-System | |
DE69835238T2 (de) | Verfahren und vorrichtung zur optischen taktverteilung in einer integrierten schaltung | |
Fyodorov | High-performance optoelectronic switching network with vertical-cavity surface-emitting laser arrays | |
Wirz | Opto-electronic interface in multi chip modules (MCM) | |
EP1052874A1 (de) | Vorrichtung zum Routen von Informationen durch grosse Koppelfelder |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OP8 | Request for examination as to paragraph 44 patent law | ||
R079 | Amendment of ipc main class |
Free format text: PREVIOUS MAIN CLASS: H01L0023120000 Ipc: H04B0010000000 |
|
R079 | Amendment of ipc main class |
Free format text: PREVIOUS MAIN CLASS: H01L0023120000 Ipc: H04B0010000000 Effective date: 20120117 |
|
R016 | Response to examination communication | ||
R081 | Change of applicant/patentee |
Owner name: HEWLETT PACKARD ENTERPRISE DEVELOPMENT LP, HOU, US Free format text: FORMER OWNER: HEWLETT-PACKARD DEVELOPMENT COMPANY, L.P., HOUSTON, TEX., US |
|
R082 | Change of representative |
Representative=s name: FLEUCHAUS & GALLO PARTNERSCHAFT MBB, DE Representative=s name: FLEUCHAUS & GALLO PARTNERSCHAFT MBB PATENTANWA, DE Representative=s name: BOEHMERT & BOEHMERT ANWALTSPARTNERSCHAFT MBB -, DE Representative=s name: SCHOPPE, ZIMMERMANN, STOECKELER, ZINKLER, SCHE, DE |
|
R082 | Change of representative |
Representative=s name: FLEUCHAUS & GALLO PARTNERSCHAFT MBB, DE Representative=s name: FLEUCHAUS & GALLO PARTNERSCHAFT MBB PATENTANWA, DE Representative=s name: BOEHMERT & BOEHMERT ANWALTSPARTNERSCHAFT MBB -, DE |
|
R016 | Response to examination communication | ||
R082 | Change of representative |
Representative=s name: FLEUCHAUS & GALLO PARTNERSCHAFT MBB - PATENT- , DE Representative=s name: FLEUCHAUS & GALLO PARTNERSCHAFT MBB, DE Representative=s name: FLEUCHAUS & GALLO PARTNERSCHAFT MBB PATENTANWA, DE |