KR20200104561A - Graphics processing unit based on three dimention crossbar network - Google Patents
Graphics processing unit based on three dimention crossbar network Download PDFInfo
- Publication number
- KR20200104561A KR20200104561A KR1020190023036A KR20190023036A KR20200104561A KR 20200104561 A KR20200104561 A KR 20200104561A KR 1020190023036 A KR1020190023036 A KR 1020190023036A KR 20190023036 A KR20190023036 A KR 20190023036A KR 20200104561 A KR20200104561 A KR 20200104561A
- Authority
- KR
- South Korea
- Prior art keywords
- layer
- input
- output
- crossbar network
- processing unit
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09G—ARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
- G09G3/00—Control arrangements or circuits, of interest only in connection with visual indicators other than cathode-ray tubes
- G09G3/20—Control arrangements or circuits, of interest only in connection with visual indicators other than cathode-ray tubes for presentation of an assembly of a number of characters, e.g. a page, by composing the assembly by combination of individual elements arranged in a matrix no fixed position being assigned to or needed to be assigned to the individual characters or partial characters
- G09G3/2092—Details of a display terminals using a flat panel, the details relating to the control arrangement of the display terminal and to the interfaces thereto
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09G—ARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
- G09G5/00—Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators
- G09G5/36—Control arrangements or circuits for visual indicators common to cathode-ray tube indicators and other visual indicators characterised by the display of a graphic pattern, e.g. using an all-points-addressable [APA] memory
- G09G5/363—Graphics controllers
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09G—ARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
- G09G2300/00—Aspects of the constitution of display devices
- G09G2300/04—Structural and physical details of display devices
- G09G2300/0421—Structural details of the set of electrodes
-
- G—PHYSICS
- G09—EDUCATION; CRYPTOGRAPHY; DISPLAY; ADVERTISING; SEALS
- G09G—ARRANGEMENTS OR CIRCUITS FOR CONTROL OF INDICATING DEVICES USING STATIC MEANS TO PRESENT VARIABLE INFORMATION
- G09G2330/00—Aspects of power supply; Aspects of display protection and defect management
- G09G2330/02—Details of power systems and of start or stop of display operation
- G09G2330/021—Power management, e.g. power saving
Abstract
Description
본 출원은 삼차원 크로스바 네트워크 기반의 그래픽 처리유닛에 관한 것으로, 특히, 종래의 배선 길이를 감소시킬 수 있는 삼차원 크로스바 네트워크 기반의 그래픽 처리유닛에 관한 것이다. The present application relates to a graphic processing unit based on a three-dimensional crossbar network, and more particularly, to a graphic processing unit based on a three-dimensional crossbar network capable of reducing a conventional wiring length.
GPU(Graphics Processing Unit)는 높은 데이터 병렬 처리(data parallelism)를 위해, 레지스터 파일(register file), 캐시(cache), 공유 메모리(shared memory)를 사용하여 수 만개의 스레드(thread)를 실행할 수 있다. 더욱이, GPU 레지스터 파일의 크기는 점점 커지는 추세이고, 이에 따라 레지스터 파일의 소비 전력은 GPU 전체 소비 전력의 중요한 부분을 차지하게 된다. GPU (Graphics Processing Unit) can run tens of thousands of threads using register files, caches, and shared memory for high data parallelism. . Moreover, the size of the GPU register file is gradually increasing, and accordingly, the power consumption of the register file occupies an important part of the total power consumption of the GPU.
구체적으로, GPU 레지스터 파일은 레지스터 파일 뱅크(bank), 크로스바 네트워크(crossbar network), 오퍼랜드 콜렉터(operand collector), 아비터(arbiter)로 구성될 수 있다. 여기서, 레지스터 파일 뱅크(bank)는 GPU 시스템의 높은 처리량(throughput)을 위해 여러 뱅크(multiple bank)들로 구성될 수 있다. Specifically, the GPU register file may be composed of a register file bank, a crossbar network, an operand collector, and an arbiter. Here, the register file bank may be composed of multiple banks for high throughput of the GPU system.
특히, 크로스바 네트워크는 대량의 배선(massive wire)들을 통해 레지스터 파일 뱅크와 오퍼랜드 콜렉터를 연결할 수 있다. 이러한 대량의 배선에서 발생하는 소비 전력은 GPU 레지스터 파일의 구성 요소 중 가장 크며, 대량의 배선의 길이는 크로스바 네트워크의 지연시간(delay)을 결정하는 중요한 요소일 수 있다. In particular, the crossbar network can connect the register file bank and the operand collector through massive wires. The power consumption generated by such a large amount of wiring is the largest among the components of the GPU register file, and the length of the large amount of wiring may be an important factor in determining the delay time of the crossbar network.
한편, 일반적인 3차원 집적 기술(integration technology)인 TSV 기반 방식은 두 다이(die) 사이에 수직으로 구멍(hole)을 뚫어 TSV를 통해 전극(electrode)을 형성하기 때문에, GPU 레지스터 파일과 같은 세분화된 아키텍처(fine-grained architecture)에 적합하지 않다. On the other hand, the TSV-based method, which is a general 3D integration technology, forms an electrode through the TSV by making a hole vertically between two dies. Not suitable for fine-grained architecture.
반면, 모놀리틱 3D 집적(monolithic 3D integration) 기술은 아주 작은 크기의 MIVs(monolithic inter-tier vias)를 사용하여 높은 밀도의 집적(high integration density)을 가능하게 한다. 특히, MIVs는 TSV보다 훨씬 높은 정렬 정밀도(alignment precision)를 지원하며, 우수한 전기적 특성(electrical characteristics)으로 인해 지연시간(delay)이 적고 동적 전력(dynamic power) 및 누설 전력(leakage power)이 낮다. On the other hand, monolithic 3D integration technology enables high integration density by using very small sized monolithic inter-tier vias (MIVs). In particular, MIVs support much higher alignment precision than TSVs, have low delay, and low dynamic power and leakage power due to excellent electrical characteristics.
이에, 본 출원에서, GPU 레지스터 파일의 구성 요소 중 크로스바 네트워크의 배선 연결을 단순화하고, 배선의 연결길이를 감소시켜 MIVs를 이용한 삼차원의 크로스바 네트워크 기반의 그래픽 처리 유닛을 제공하고자 한다. Accordingly, in the present application, a graphic processing unit based on a three-dimensional crossbar network using MIVs is provided by simplifying the wiring connection of the crossbar network among the components of the GPU register file and reducing the connection length of the wiring.
본 출원의 목적은, 이차원 크로스바 네트워크에 비해, 입력 배선 및 출력 배선 중 어느 하나의 배선의 길이를 감소시켜, 배선길이에 따른 소비전력을 감소시킬 수 있는 삼차원 크로스바 네트워크 기반의 그래픽 처리유닛을 제공하기 위한 것이다. An object of the present application is to provide a graphic processing unit based on a three-dimensional crossbar network capable of reducing the power consumption according to the wiring length by reducing the length of any one of the input wiring and the output wiring compared to a two-dimensional crossbar network. For.
본 출원의 일 실시예에 따르는 삼차원 크로스바 네트워크 기반의 그래픽 처리유닛은, 제1 입력 배선이 형성되고, 외부로 연장된 제1 레이어, 상기 제1 레이어와 평행하게 이격되고, 제2 입력 배선이 형성된 적어도 하나의 제2 레이어 및 상기 제1 및 제2 레이어에 대해 수직으로, 상기 제1 및 제2 입력 배선을 전기적으로 연결하는 적어도 하나의 모놀로식 안티티어 비아를 포함한다.In the graphic processing unit based on the 3D crossbar network according to the exemplary embodiment of the present application, a first input wiring is formed, a first layer extending to the outside, spaced apart from the first layer, and a second input wiring is formed. At least one second layer and at least one monolithic anti-tier via electrically connecting the first and second input wires perpendicular to the first and second layers.
실시예에 있어서, 상기 제1 레이어와 상기 적어도 하나의 제2 레이어 각각에, 동일한 격자 패턴으로 배치되는 복수의 3상태 버퍼들을 더 포함한다. In an embodiment, a plurality of tri-state buffers disposed in the same grid pattern are further included in each of the first layer and the at least one second layer.
실시예에 있어서, 상기 제1 입력 배선을 따라 일단에 위치하는 하나의 입력 드라이버 및 상기 복수의 3상태 버퍼들과 연결된 복수의 출력 배선들을 따라 일단에 위치하는 복수의 출력 드라이버를 더 포함하고, 상기 하나의 입력 드라이버는, 상기 제1 입력 배선을 통해 상기 복수의 3상태 버퍼들과 연결된 복수의 입력 배선들을 한번에 활성화시킨다.In an embodiment, further comprising: one input driver positioned at one end along the first input wire and a plurality of output drivers positioned at one end along a plurality of output wires connected to the plurality of tri-state buffers, the One input driver activates a plurality of input wires connected to the plurality of tri-state buffers through the first input wire at a time.
실시예에 있어서, 상기 복수의 출력 드라이버들을 서로 연결시키는 외부 모놀로식 안티티어 비아를 더 포함한다.In an embodiment, an external monolithic anti-tier via connecting the plurality of output drivers to each other is further included.
실시예에 있어서, 상기 적어도 하나의 모놀로식 안티티어 비아의 개수는 상기 복수의 3상태 버퍼들의 개수에 대응된다. In an embodiment, the number of the at least one monolithic anti-tier via corresponds to the number of the plurality of tri-state buffers.
본 출원의 다른 실시예에 따르는 삼차원 크로스바 네트워크 기반의 그래픽 처리유닛은, 제1 출력 배선이 형성된 제1 레이어, 상기 제1 레이어와 평행하게 이격되고, 제2 출력 배선이 형성된 적어도 하나의 제2 레이어 및 상기 제1 및 제2 레이어에 대해 수직으로, 상기 제1 및 제2 출력 배선을 전기적으로 연결하는 적어도 하나의 모놀로식 안티티어 비아를 포함한다.A graphic processing unit based on a 3D crossbar network according to another exemplary embodiment of the present application includes a first layer on which a first output line is formed, and at least one second layer spaced apart from the first layer in parallel and on which a second output line is formed. And at least one monolithic anti-tier via vertically to the first and second layers and electrically connecting the first and second output wires.
실시예에 있어서, 상기 제1 레이어와 상기 적어도 하나의 제2 레이어 각각에, 동일한 격자 패턴으로 배치되는 복수의 3상태 버퍼들을 더 포함한다.In an embodiment, a plurality of tri-state buffers disposed in the same grid pattern are further included in each of the first layer and the at least one second layer.
실시예에 있어서, 상기 제1 출력 배선을 따라 일단에 위치하는 하나의 출력 드라이버 및 상기 복수의 3상태 버퍼들과 연결된 복수의 입력 배선들을 따라 일단에 위치하는 복수의 입력 드라이버를 더 포함하고, 상기 하나의 출력 드라이버는, 상기 제1 출력 배선을 통해 상기 복수의 3상태 버퍼들과 연결된 복수의 출력 배선들을 한번에 활성화시킨다.In an embodiment, further comprising: one output driver positioned at one end along the first output wiring and a plurality of input drivers positioned at one end along a plurality of input wirings connected to the plurality of three-state buffers, the One output driver activates a plurality of output wires connected to the plurality of tri-state buffers through the first output wire at a time.
실시예에 있어서, 상기 복수의 입력 드라이버들을 서로 연결시키는 외부 모놀로식 안티티어 비아를 더 포함한다.In an embodiment, an external monolithic anti-tier via connecting the plurality of input drivers to each other is further included.
실시예에 있어서, 적어도 하나의 모놀로식 안티티어 비아의 개수는 상기 복수의 3상태 버퍼들의 개수에 대응된다. In an embodiment, the number of at least one monolithic anti-tier via corresponds to the number of the plurality of tri-state buffers.
본 출원의 실시 예에 따른 삼차원 크로스바 네트워크 기반의 그래픽 처리유닛은, 이차원 크로스바 네트워크에 비해, 입력 배선 및 출력 배선 중 어느 하나의 배선의 길이를 감소시켜, 배선길이에 따른 소비전력을 감소시킬 수 있다. The graphic processing unit based on a 3D crossbar network according to the exemplary embodiment of the present application may reduce the power consumption according to the length of the wiring by reducing the length of any one of the input wiring and the output wiring compared to the 2D crossbar network. .
도 1은 본 출원의 일 실시예에 따른 삼차원 크로스바 네트워크의 블록도이다.
도 2는 도 1의 삼차원 크로스바 네트워크에 대한 실시 예이다.
도 3은 도 2의 제1 레이어에 대한 평면도이다.
도 4는 도 2의 적어도 하나의 제2 레이어에 대한 평면도이다.
도 5는 본 출원의 다른 실시예에 따른 삼차원 크로스바 네트워크의 블록도이다.
도 6은 도 5의 삼차원 크로스바 네트워크에 대한 실시 예이다.
도 7은 도 6의 제1 레이어에 대한 평면도이다.
도 8은 도 6의 적어도 하나의 제2 레이어에 대한 평면도이다.
도 9는 삼차원 크로스바 네트워크 기반의 그래픽 처리유닛에 대한 실시 예이다. 1 is a block diagram of a three-dimensional crossbar network according to an embodiment of the present application.
2 is an embodiment of the 3D crossbar network of FIG. 1.
3 is a plan view of a first layer of FIG. 2.
4 is a plan view of at least one second layer of FIG. 2.
5 is a block diagram of a three-dimensional crossbar network according to another embodiment of the present application.
6 is an embodiment of the 3D crossbar network of FIG. 5.
7 is a plan view of the first layer of FIG. 6.
8 is a plan view of at least one second layer of FIG. 6.
9 is an embodiment of a graphic processing unit based on a 3D crossbar network.
본 명세서에 개시되어 있는 본 출원의 개념에 따른 실시 예들에 대해서 특정한 구조적 또는 기능적 설명들은 단지 본 출원의 개념에 따른 실시 예들을 설명하기 위한 목적으로 예시된 것으로서, 본 출원의 개념에 따른 실시 예들은 다양한 형태들로 실시될 수 있으며 본 명세서에 설명된 실시 예들에 한정되지 않는다.Specific structural or functional descriptions of the embodiments according to the concept of the present application disclosed in the present specification are exemplified only for the purpose of describing the embodiments according to the concept of the present application, and the embodiments according to the concept of the present application are It may be implemented in various forms and is not limited to the embodiments described herein.
본 출원의 개념에 따른 실시 예들은 다양한 변경들을 가할 수 있고 여러 가지 형태들을 가질 수 있으므로 실시 예들을 도면에 예시하고 본 명세서에 상세하게 설명하고자 한다. 그러나, 이는 본 출원의 개념에 따른 실시 예들을 특정한 개시 형태들에 대해 한정하려는 것이 아니며, 본 출원의 사상 및 기술 범위에 포함되는 모든 변경, 균등물, 또는 대체물을 포함한다.Since the embodiments according to the concept of the present application can apply various changes and have various forms, the embodiments will be illustrated in the drawings and described in detail in the present specification. However, this is not intended to limit the embodiments according to the concept of the present application to specific disclosed forms, and includes all changes, equivalents, or substitutes included in the spirit and scope of the present application.
제1 또는 제2 등의 용어는 다양한 구성 요소들을 설명하는데 사용될 수 있지만, 상기 구성 요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성 요소를 다른 구성 요소로부터 구별하는 목적으로만, 예컨대 본 출원의 개념에 따른 권리 범위로부터 이탈되지 않은 채, 제1구성요소는 제2구성요소로 명명될 수 있고, 유사하게 제2구성요소는 제1구성요소로도 명명될 수 있다.Terms such as first or second may be used to describe various elements, but the elements should not be limited by the terms. The terms are only for the purpose of distinguishing one component from other components, for example, without departing from the scope of the rights according to the concept of the present application, the first component may be named as the second component, and similarly The second component may also be referred to as a first component.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다. 구성요소들 간의 관계를 설명하는 다른 표현들, 즉 "~사이에"와 "바로 ~사이에" 또는 "~에 이웃하는"과 "~에 직접 이웃하는" 등도 마찬가지로 해석되어야 한다.When a component is referred to as being "connected" or "connected" to another component, it is understood that it may be directly connected or connected to the other component, but other components may exist in the middle. Should be. On the other hand, when a component is referred to as being "directly connected" or "directly connected" to another component, it should be understood that there is no other component in the middle. Other expressions describing the relationship between components, such as "between" and "just between" or "adjacent to" and "directly adjacent to" should be interpreted as well.
본 명세서에서 사용한 용어는 단지 특정한 실시 예를 설명하기 위해 사용된 것으로, 본 출원을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 실시된 특징, 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.The terms used in this specification are only used to describe specific embodiments, and are not intended to limit the present application. Singular expressions include plural expressions unless the context clearly indicates otherwise. In the present specification, terms such as "comprise" or "have" are intended to designate the presence of implemented features, numbers, steps, actions, components, parts, or a combination thereof, but one or more other features or numbers It is to be understood that the possibility of addition or presence of, steps, actions, components, parts, or combinations thereof is not preliminarily excluded.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 출원이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가진다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미를 갖는 것으로 해석되어야 하며, 본 명세서에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.Unless otherwise defined, all terms used herein, including technical or scientific terms, have the same meaning as commonly understood by one of ordinary skill in the art to which this application belongs. Terms as defined in a commonly used dictionary should be interpreted as having a meaning consistent with the meaning in the context of the related technology, and should not be interpreted as an ideal or excessively formal meaning unless explicitly defined in this specification. Does not.
이하, 첨부한 도면을 참조하여 본 출원의 바람직한 실시 예를 설명함으로써, 본 출원을 상세히 설명한다.Hereinafter, the present application will be described in detail by describing a preferred embodiment of the present application with reference to the accompanying drawings.
도 1은 본 출원의 일 실시예에 따른 삼차원 크로스바 네트워크(100)의 블록도이다. 1 is a block diagram of a 3D crossbar network 100 according to an embodiment of the present application.
도 1을 참조하면, 삼차원 크로스바 네트워크(100)는 제1 레이어(110), 제2 레이어(120) 및 적어도 하나의 모놀로식 안티티어 비아(130_1_1~130_N_1)를 포함할 수 있다. Referring to FIG. 1, the 3D crossbar network 100 may include a
먼저, 제1 레이어(110)는 X축 방향의 외부로 연장된 제1 입력 배선(IW_1_1)이 형성될 수 있다. First, in the
다음으로, 적어도 하나의 제2 레이어(120)는 제1 레이어(110)와 평행하게 이격되고, 제1 입력 배선(IW_1_1)과 평행하는 제2 입력 배선(IW_1_2)이 형성될 수 있다. 여기서, 적어도 하나의 제2 레이어(120)는 설명의 편의를 위해 하나의 레이어로 도시되지만 이를 한정하는 것은 아니며, 적어도 하나의 제2 레이어(120)는 Z축 방향으로 동일한 레이어들이 복수개로 분할 형성될 수 있다. Next, at least one
본 출원의 기술적 사상에 따른 일 실시예에 있어서, 적어도 하나의 모놀로식 안티티어 비아(130_1_1~130_N_1)는 제1 및 제2 레이어(110, 120)에 대해 수직으로, 제1 및 제2 입력 배선(IW_1_1, IW_1_2)을 서로 연결시킬 수 있다. In one embodiment according to the technical idea of the present application, at least one monolithic anti-tier via (130_1_1 to 130_N_1) is perpendicular to the first and second layers (110, 120), the first and second input The wirings IW_1_1 and IW_1_2 may be connected to each other.
이에 따라, 제1 및 제2 입력 배선(IW_1_1, IW_1_2)이 하나의 입력 배선으로 길게 연장되는 종래의 이차원 크로스바 네트워크에 비해, 삼차원 크로스바 네트워크(100)는 제1 및 제2 입력 배선(IW_1_1, IW_1_2)을 전기적으로 서로 연결시키면서, 제1 및 제2 입력 배선(IW_1_1, IW_1_2)을 각각의 연장 길이를 감소시켜 배선길이에 따른 소비전력을 감소시킬 수 있다. Accordingly, compared to a conventional two-dimensional crossbar network in which the first and second input wires IW_1_1 and IW_1_2 are extended to one input wire, the three-dimensional crossbar network 100 has the first and second input wires IW_1_1 and IW_1_2 ) Is electrically connected to each other, and the extension lengths of the first and second input wires IW_1_1 and IW_1_2 are respectively reduced, thereby reducing power consumption according to the wire length.
도 2는 도 1의 삼차원 크로스바 네트워크(200)에 대한 실시 예이고, 도 3은 도 2의 제1 레이어(210)에 대한 평면도이고, 도 4는 도 2의 적어도 하나의 제2 레이어(220_1~220_L-1)에 대한 평면도이다. FIG. 2 is an embodiment of the 3D crossbar network 200 of FIG. 1, FIG. 3 is a plan view of the
이하, 도 2에서 도시된 입력 배선들, 출력 배선들 및 복수의 3상태 버퍼들(250_11~250_NM)은 설명의 편의를 일부 구성들이 생략되었지만 이를 한정하는 것은 아니며, 도 3과 도 4에 도시된 평면도를 참조하여 설명될 것이다. Hereinafter, the input wires, output wires, and a plurality of tri-state buffers 250_11 to 250_NM illustrated in FIG. 2 are omitted for convenience of description, but are not limited thereto, and are illustrated in FIGS. 3 and 4. It will be described with reference to a plan view.
도 2 내지 도 4를 참조하면, 삼차원 크로스바 네트워크(200)는 제1 레이어(210), 적어도 하나의 제2 레이어(220_1~220_L-1), 복수의 모놀로식 안티티어 비아(230_1_1~230_N_M) 및 제1 내지 제L 복수의 3상태 버퍼들(250_1_1_1~250_N_M_L), 적어도 둘 이상의 출력 드라이버들(260_1~260_L) 및 하나의 입력 드라이버(270)를 포함할 수 있다. 2 to 4, the 3D crossbar network 200 includes a
먼저, 제1 레이어(210)는 X축 방향의 외부로 연장되는 제1 복수의 입력 배선들(IW_1_1~IW_M_1)이 형성될 수 있다. 즉, 제1 레이어(210)는 하나의 입력 드라이버(270)로 연장되는 제1 복수의 입력 배선들(IW_1_1~IW_M_1)이 형성될 수 있다. First, in the
또한, 제1 레이어(210)는 제1 출력 드라이버(260_1)에 연장되는 제1 복수의 출력 배선들(OW_1_1~OW_N_1)이 형성될 수 있다. In addition, the
다음으로, 적어도 하나의 제2 레이어(220_1~220_L-1)는 제1 레이어(210)와 평행하게 이격되고, 제1 복수의 입력 배선들(IW_1_1~IW_M_1)과 평행하는 제2 내지 제L 복수의 입력 배선들(IW_1_2~IW_M_2, IW_1_3~IW_M_3, ..., IW_1_L~IW_M_L)이 형성될 수 있다. 즉, 제2 내지 제L 복수의 입력 배선들(IW_1_2~IW_M_2, IW_1_3~IW_M_3, ..., IW_1_L~IW_M_L)은 제1 복수의 입력 배선들(IW_1_1~IW_M_1)과 다르게 하나의 입력 드라이버(270)로 연장되지 않을 수 있다. Next, the at least one second layer 220_1 to 220_L-1 is spaced apart in parallel with the
또한, 적어도 하나의 제2 레이어(220_1~220_L-1)는 Y축 방향의 외부로 연장되는 제2 내지 제L 복수의 출력 배선들(OW_1_2~OW_N_2, OW_1_3~OW_N_3, ..., OW_1_L~OW_N_L)이 형성될 수 있다. 즉, 적어도 하나의 제2 레이어(220_1~220_L-1)는 적어도 둘 이상의 출력 드라이버들(260_2~260_L)로 연장되는 제2 내지 제L 복수의 출력 배선들(OW_1_2~OW_N_2, OW_1_3~OW_N_3, ..., OW_1_L~OW_N_L)이 형성될 수 있다. In addition, the at least one second layer 220_1 to 220_L-1 may include second to Lth output wirings OW_1_2 to OW_N_2, OW_1_3 to OW_N_3, ..., OW_1_L to OW_N_L extending outward in the Y-axis direction. ) Can be formed. That is, the at least one second layer 220_1 to 220_L-1 includes the second to Lth plurality of output wirings OW_1_2 to OW_N_2, OW_1_3 to OW_N_3, and the at least two output drivers 260_2 to 260_L. .., OW_1_L to OW_N_L) can be formed.
다음으로, 복수의 모놀로식 안티티어 비아들(230_1_1~230_N_M)은 제1 레이어(210) 및 적어도 하나의 제2 레이어(220_1~220_L-1)에 대하여 수직으로, 제1 복수의 입력 배선들(IW_1_1~IW_M_1)과 제2 내지 제L 복수의 입력 배선들(IW_1_2~IW_M_2, IW_1_3~IW_M_3, ..., IW_1_L~IW_M_L)을 전기적으로 연결할 수 있다. 예를 들면, 복수의 모놀로식 안티티어 비아들(230_1_1~230_N_M)은 양단 레이어 사이에 위치한 레이어를 관통할 수 있다. Next, the plurality of monolithic anti-tier vias 230_1_1 to 230_N_M are perpendicular to the
이에, 복수의 모놀로식 안티티어 비아들(230_1_1~230_N_M)은 Z축 방향으로, 제1 복수의 입력 배선들(IW_1_1~IW_M_1)과 제2 내지 제L 복수의 입력 배선들(IW_1_2~IW_M_2, IW_1_3~IW_M_3, ..., IW_1_L~IW_M_L)을 하나의 입력 드라이버(270)에 연결시킬 수 있어, 각 입력 배선 길이 감소에 따른 소비전력을 감소시킬 수 있다. Accordingly, the plurality of monolithic anti-tier vias 230_1_1 to 230_N_M are in the Z-axis direction, the first plurality of input wires IW_1_1 to IW_M_1 and the second to Lth plurality of input wires IW_1_2 to IW_M_2, Since IW_1_3 to IW_M_3, ..., IW_1_L to IW_M_L) can be connected to one
다음으로, 제1 내지 제L 복수의 3상태 버퍼들(250_1_1_1~250_N_M_L)은 제1 레이어(210) 및 적어도 하나의 제2 레이어(220_1~220_L-1)에 배치될 수 있다. Next, the first to Lth three-state buffers 250_1_1_1 to 250_N_M_L may be disposed on the
도 3 및 도 4에 도시된 바와 같이, 제1 복수의 3상태 버퍼들(250_1_1_1~250_N_M_1)은 제1 레이어(210)에 격자 패턴으로 배치되고, 제2 복수의 3상태 버퍼들(250_1_1_2~250_N_M_2)은 적어도 하나의 제2 레이어(220_1~220_L-1) 중 어느 하나의 레이어(예컨대, 220_1)에 격자 패턴으로 배치되며, 제L 복수의 3상태 버퍼들(250_1_1_L~250_N_M_L)은 적어도 하나의 제2 레이어(220_1~220_L-1) 중 상단에 위치한 레이어(예컨대, 220_L)에 배치될 수 있다.3 and 4, the first plurality of tri-state buffers 250_1_1_1 to 250_N_M_1 are disposed in a grid pattern on the
즉, 각 복수의 3상태 버퍼들(250_1_1~250_N_M)은 레이어마다 동일한 격자 패턴으로 배치될 수 있다. 이때, 복수의 3상태 버퍼들(250_1_1~250_N_M)의 개수(N×M)는 복수의 모놀로식 안티티어 비아들(230_1_1~230_N_M)의 개수에 대응될 수 있다. That is, each of the plurality of tri-state buffers 250_1_1 to 250_N_M may be arranged in the same grid pattern for each layer. In this case, the number (N×M) of the plurality of tri-state buffers 250_1_1 to 250_N_M may correspond to the number of the plurality of monolithic anti-tier vias 230_1_1 to 230_N_M.
구체적으로, 각 3상태 버퍼(예컨대, 250_1_1)는 하나의 입력 배선(예컨대, IW_1_1), 하나의 출력 배선(예컨대, OW_1_1) 및 하나의 모놀로식 안티티어 비아(예컨대, 230_1_1)가 교차될 수 있다. Specifically, each of the three-state buffers (eg, 250_1_1) can cross one input line (eg, IW_1_1), one output line (eg, OW_1_1), and one monolithic anti-tier via (eg, 230_1_1). have.
예를 들면, 각 3상태 버퍼(예컨대, 250_1_1)는 임시 저장 장치로서, 로우(low), 하이(high), 하이 임피던스(high impedance;Hi-Z)의 3가지 상태를 출력하는 논리 소자일 수 있다. 또한, 하나의 3상태 버퍼(예컨대, 250_1_1)는 제어신호에 따라, 하나의 입력 배선(예컨대, IW_1_1)을 하나의 출력 배선(예컨대,OW_1_1)으로 스위칭하여 데이터를 출력할 수 있다. For example, each three-state buffer (eg, 250_1_1) is a temporary storage device and may be a logic element that outputs three states of low, high, and high impedance (Hi-Z). have. In addition, one three-state buffer (eg, 250_1_1) may output data by switching one input line (eg, IW_1_1) to one output line (eg, OW_1_1) according to a control signal.
다음으로, 적어도 둘 이상의 출력 드라이버들(260_1~260_L)은 레이어 마다 제1 내지 제L 복수의 3상태 버퍼들(250_1_1_1~250_N_M_L)과 연결된 제1 내지 제L 복수의 출력 배선들(OW_1_1~OW_N_1, OW_1_2~OW_N_2, ..., OW_1_L~OW_N_L)을 따라 연장된 일단에 위치할 수 있다. Next, the at least two output drivers 260_1 to 260_L are the first to Lth output wires OW_1_1 to OW_N_1 connected to the first to Lth tristate buffers 250_1_1_1 to 250_N_M_L for each layer. OW_1_2 ~ OW_N_2, ..., OW_1_L ~ OW_N_L) can be located at one end extending along.
이때, 적어도 둘 이상의 출력 드라이버들(260_1~260_L)의 개수는 레이어 개수(L)에 대응될 수 있다. In this case, the number of at least two or more output drivers 260_1 to 260_L may correspond to the number of layers L.
한편, 적어도 둘 이상의 출력 드라이버들(260_1~260_L)은 외부 모놀로식 안티티어 비아들(예컨대, 231_1~231_N)을 통해 서로 전기적으로 연결될 수 있다. 예를 들면, 적어도 둘 이상의 출력 드라이버들(260_1~260_L)은 외부 모놀로식 안티티어 비아들(예컨대, 231_1~231_N)을 이용하여, 제1 내지 제L 복수의 3상태 버퍼들(250_11_1~250_NM_L)로부터 출력받는 데이터를 하나의 출력 드라이버(예컨대, 260_1)를 통해 외부로 전달할 수 있다. Meanwhile, at least two or more output drivers 260_1 to 260_L may be electrically connected to each other through external monolithic anti-tier vias (eg, 231_1 to 231_N). For example, the at least two output drivers 260_1 to 260_L use external monolithic anti-tier vias (eg, 231_1 to 231_N), and the first to Lth three-state buffers 250_11_1 to 250_NM_L ) May be transmitted to the outside through one output driver (eg, 260_1).
다음으로, 하나의 입력 드라이버(270)는 제1 레이어(210)로부터 제1 복수의 입력 배선(IW_1_1, IW_2_1, ..., IW_M_1)을 따라 연장된 일단에 위치할 수 있다. Next, one
실시예에 따른 하나의 입력 드라이버(270)는 제1 복수의 입력 배선(IW_1_1, IW_2_1, ..., IW_M_1)을 활성화하여, 제1 내지 제L 복수의 3상태 버퍼들(250_11_1~250_NM_L)에 데이터를 한번에 전송할 수 있다. The one
예를 들면, 하나의 입력 드라이버(270)는 제1 복수의 입력 배선(IW_1_1, IW_2_1, ..., IW_M_1)을 활성화하여, 복수의 모놀로식 안티티어 비아(230_11~230_NM)를 통해 제2 내지 제L 복수의 입력 배선들(IW_1_2~IW_M_2, ..., IW_1_L~IW_M_L)을 활성화시킬 수 있다. 즉, 하나의 입력 드라이버(270)는 복수의 모놀로식 안티티어 비아(230_11~230_NM)를 통해 제1 내지 제L 복수의 입력 배선들(IW_1_1~IW_M_1, IW_1_2~IW_M_2, ..., IW_1_L~IW_M_L)을 한번에 활성화시킬 수 있다. For example, one
이에 따라, 하나의 입력 드라이버(270)는 제1 복수의 입력 배선(IW_1_1, IW_2_1, ..., IW_M_1)을 통해 제1 내지 제L 복수의 3상태 버퍼들(250_11_1~250_NM_L)에 동시에 데이터를 입력시킬 수 있다. Accordingly, one
도 5는 본 출원의 다른 실시예에 따른 삼차원 크로스바 네트워크(300)의 블록도이다. 5 is a block diagram of a
도 5를 참조하면, 삼차원 크로스바 네트워크(300)는 제1 레이어(310), 제2 레이어(320) 및 적어도 하나의 모놀로식 안티티어 비아(330_1_1~330_1_M)를 포함할 수 있다. Referring to FIG. 5, the
먼저, 제1 레이어(310)는 Y축 방향의 외부로 연장된 제1 출력 배선(OW_1_1)이 형성될 수 있다. First, in the
다음으로, 적어도 하나의 제2 레이어(320)는 제1 레이어(310)와 평행하게 이격되고, 제1 출력 배선(OW_1_1)과 평행하는 제2 출력 배선(OW_2_1)이 형성될 수 있다. 여기서, 적어도 하나의 제2 레이어(320)는 설명의 편의를 위해 하나의 레이어로 도시되지만 이를 한정하는 것은 아니며, 적어도 하나의 제2 레이어(320)는 Z축 방향으로 동일한 레이어들이 복수개로 분할 형성될 수 있다. Next, at least one
본 출원의 기술적 사상에 따른 다른 실시예에 있어서, 적어도 하나의 모놀로식 안티티어 비아(330_1_1~330_1_M)는 제1 및 제2 레이어(310, 320)에 대해 수직으로, 제1 및 제2 출력 배선(OW_1_1, OW_1_2)을 서로 연결시킬 수 있다. In another embodiment according to the technical idea of the present application, at least one monolithic anti-tier via 330_1_1 to 330_1_M is perpendicular to the first and
이에 따라, 제1 및 제2 출력 배선(OW_1_1, OW_1_2)이 하나의 출력 배선으로 길게 연장되는 종래의 이차원 크로스바 네트워크에 비해, 삼차원 크로스바 네트워크(300)는 제1 및 제2 출력 배선(OW_1_1, OW_1_2)을 전기적으로 서로 연결시키면서, 제1 및 제2 출력 배선(OW_11, OW_21) 각각의 연장 길이를 감소시켜, 배선길이에 따른 소비전력을 감소시킬 수 있다. Accordingly, compared to a conventional two-dimensional crossbar network in which the first and second output wires OW_1_1 and OW_1_2 are extended to one output wire, the three-
도 6은 도 5의 삼차원 크로스바 네트워크(400)에 대한 실시 예이고, 도 7은 도 6의 제1 레이어(410)에 대한 평면도이고, 도 8은 도 6의 적어도 하나의 제2 레이어(420_1~420_L-1)에 대한 평면도이다. 6 is an embodiment of the 3D crossbar network 400 of FIG. 5, FIG. 7 is a plan view of the
이하, 도 6에 도시된 입력 배선들, 출력 배선들 및 복수의 3상태 버퍼들(250_11~250_NM)은 설명의 편의를 일부 구성들이 생략되었지만 이를 한정하는 것은 아니며, 도 7과 도 8에 도시된 평면도를 참조하여 설명될 것이다. Hereinafter, the input wires, output wires, and a plurality of tri-state buffers 250_11 to 250_NM illustrated in FIG. 6 are omitted for convenience of description, but are not limited thereto, and are illustrated in FIGS. 7 and 8. It will be described with reference to a plan view.
도 6 내지 도 8을 참조하면, 삼차원 크로스바 네트워크(400)는 제1 레이어(410), 적어도 하나의 제2 레이어(420_1~420_L-1), 복수의 모놀로식 안티티어 비아들(430_1_1~430_N_M) 및 제1 내지 제L 복수의 3상태 버퍼들(450_1_1~450_N_M), 적어도 둘 이상의 입력 드라이버들(460_1~460_L) 및 하나의 출력 드라이버(470)를 포함할 수 있다. 6 to 8, the 3D crossbar network 400 includes a
먼저, 제1 레이어(410)는 Y축 방향의 외부로 연장되는 제1 복수의 출력 배선들(OW_1_1~OW_N_1)이 형성될 수 있다. 즉, 제1 레이어(410)는 하나의 출력 드라이버(470)로 연장되는 제1 복수의 출력 배선들(OW_1_1~OW_N_1)이 형성될 수 있다. First, in the
또한, 제1 레이어(410)는 제1 입력 드라이버(460_1)에 연장되는 제1 복수의 입력 배선들(OW_1_1~OW_M_1)이 형성될 수 있다. Also, in the
다음으로, 적어도 하나의 제2 레이어(420_1~420_L-1)는 제1 레이어(410)와 평행하게 이격되고, 제1 복수의 출력 배선들(OW_1_1~OW_N_1)과 평행하는 제2 내지 제L 복수의 출력 배선들(OW_1_2~OW_N_2, OW_1_3~OW_N_3, ..., OW_1_L~OW_N_L)이 형성될 수 있다. 즉, 제2 내지 제L 복수의 출력 배선들(OW_1_2~OW_N_2, OW_1_3~OW_N_3, ..., OW_1_L~OW_N_L)은 제1 복수의 출력 배선들(OW_1_1~OW_N_1)과 다르게 하나의 출력 드라이버(470)로 연장되지 않을 수 있다. Next, at least one of the second layers 420_1 to 420_L-1 is spaced apart from the
또한, 적어도 하나의 제2 레이어(420_1~420_L-1)는 X축 방향의 외부로 연장되는 제2 내지 제L 복수의 입력 배선들(IW_1_2~IW_M_2, IW_1_3~IW_M_3, ..., IW_1_L~IW_M_L)이 형성될 수 있다. 즉, 적어도 하나의 제2 레이어(220_1~220_L-1)는 적어도 둘 이상의 입력 드라이버들(460_2~460_L)로 연장되는 제2 내지 제L 복수의 입력 배선들(IW_1_2~IW_M_2, IW_1_3~IW_M_3, ..., IW_1_L~IW_M_L)이 형성될 수 있다. In addition, the at least one second layer 420_1 to 420_L-1 is a plurality of second to Lth input wires IW_1_2 to IW_M_2, IW_1_3 to IW_M_3, ..., IW_1_L to IW_M_L extending outward in the X-axis direction. ) Can be formed. That is, the at least one second layer 220_1 to 220_L-1 includes the second to L-th plurality of input wires IW_1_2 to IW_M_2, IW_1_3 to IW_M_3, which extend to the at least two or more input drivers 460_2 to 460_L. .., IW_1_L to IW_M_L) may be formed.
다음으로, 복수의 모놀로식 안티티어 비아들(430_1_1~430_N_M)은 제1 레이어(410) 및 적어도 하나의 제2 레이어(420_1~420_L-1)에 대하여 수직으로, 제1 복수의 출력 배선들(OW_1_1~OW_N_1)과 제2 내지 제L 복수의 출력 배선들(OW_1_2~OW_N_2, OW_1_3~OW_N_3, ..., OW_1_L~OW_N_L)을 전기적으로 연결할 수 있다. 예를 들면, 복수의 모놀로식 안티티어 비아들(430_1_1~430_N_M)은 양단 레이어 사이에 위치한 레이어를 관통할 수 있다. Next, the plurality of monolithic anti-tier vias 430_1_1 to 430_N_M are perpendicular to the
이에, 복수의 모놀로식 안티티어 비아들(430_1_1~430_N_M)은 Z축 방향으로, 제1 복수의 출력 배선들(OW_1_1~OW_N_1)과 제2 내지 제L 복수의 출력 배선들(OW_1_2~OW_N_2, OW_1_3~OW_N_3, ..., OW_1_L~OW_N_L)을 하나의 출력 드라이버(470)에 연결시킬 수 있어, 각 출력 배선 길이 감소에 따른 소비전력을 감소시킬 수 있다. Accordingly, the plurality of monolithic anti-tier vias 430_1_1 to 430_N_M are in the Z-axis direction, the first plurality of output wires OW_1_1 to OW_N_1 and the second to L-th output wires OW_1_2 to OW_N_2, Since OW_1_3 to OW_N_3, ..., OW_1_L to OW_N_L) can be connected to one
다음으로, 제1 내지 제L 복수의 3상태 버퍼들(450_1_1_1~450_N_M_L)은 제1 레이어(410) 및 적어도 하나의 제2 레이어(420_1~420_L-1)에 배치될 수 있다. Next, the first to Lth tri-state buffers 450_1_1_1 to 450_N_M_L may be disposed on the
도 7과 도 8에 도시된 바와 같이, 제1 복수의 3상태 버퍼들(450_1_1_1~450_N_M_1)은 제1 레이어(410)에 격자 패턴으로 배치되고, 제2 복수의 3상태 버퍼들(450_1_1_2~450_N_M_2)은 적어도 하나의 제2 레이어(420_1~420_L-1) 중 어느 하나의 레이어(예컨대, 420_1)에 격자 패턴으로 배치되며, 제L 복수의 3상태 버퍼들(450_1_1_L~450_N_M_L)은 적어도 하나의 제2 레이어(420_1~420_L-1) 중 상단에 위치한 레이어(예컨대, 420_L)에 배치될 수 있다.7 and 8, the first plurality of three-state buffers 450_1_1_1 to 450_N_M_1 are arranged in a grid pattern on the
즉, 각 복수의 3상태 버퍼들(450_1_1~450_N_M)은 레이어마다 동일한 격자 패턴으로 배치될 수 있다. 이때, 각 복수의 3상태 버퍼들(450_1_1~450_N_M)의 개수(N×M)는 복수의 모놀로식 안티티어 비아들(430_1_1~430_N_M)의 개수에 대응될 수 있다. That is, each of the plurality of tri-state buffers 450_1_1 to 450_N_M may be arranged in the same grid pattern for each layer. In this case, the number (N×M) of each of the plurality of tri-state buffers 450_1_1 to 450_N_M may correspond to the number of the plurality of monolithic anti-tier vias 430_1_1 to 430_N_M.
구체적으로, 각 3상태 버퍼(예컨대, 450_1_1)는 하나의 입력 배선(예컨대, IW_1_1), 하나의 출력 배선(예컨대, OW_1_1) 및 하나의 모놀로식 안티티어 비아(예컨대, 430_1_1)가 교차될 수 있다. Specifically, each of the three-state buffers (eg, 450_1_1) can cross one input line (eg, IW_1_1), one output line (eg, OW_1_1), and one monolithic anti-tier via (eg, 430_1_1). have.
예를 들면, 각 3상태 버퍼(예컨대, 450_1_1)는 임시 저장 장치로서, 로우(low), 하이(high), 하이 임피던스(high impedance;Hi-Z)의 3가지 상태를 출력하는 논리 소자일 수 있다. 또한, 하나의 3상태 버퍼(예컨대, 450_1_1)는 제어신호에 따라, 하나의 입력 배선(예컨대, IW_1_1)을 하나의 출력 배선(예컨대,OW_1_1)으로 스위칭하여 데이터를 출력할 수 있다. For example, each three-state buffer (for example, 450_1_1) is a temporary storage device and may be a logic element that outputs three states of low, high, and high impedance (Hi-Z). have. In addition, one three-state buffer (eg, 450_1_1) may output data by switching one input line (eg, IW_1_1) to one output line (eg, OW_1_1) according to a control signal.
다음으로, 적어도 둘 이상의 입력 드라이버들(460_1~460_L)은 레이어 마다 제1 내지 제L 복수의 3상태 버퍼들(450_1_1_1~450_N_M_L)과 연결된 제1 내지 제L 복수의 입력 배선(IW_1_1~IW_M_1, IW_1_2~IW_M_2, ..., IW_1_L~IW_M_L)을 따라 연장된 일단에 위치할 수 있다. Next, the at least two input drivers 460_1 to 460_L are the first to Lth input wirings IW_1_1 to IW_M_1 and IW_1_2 connected to the first to Lth tristate buffers 450_1_1_1 to 450_N_M_L for each layer. It may be located at one end extending along ~IW_M_2, ..., IW_1_L ~ IW_M_L).
이때, 적어도 둘 이상의 입력 드라이버들(460_1~460_L)의 개수는 레이어 개수(L)에 대응될 수 있다. In this case, the number of at least two or more input drivers 460_1 to 460_L may correspond to the number of layers L.
한편, 적어도 둘 이상의 입력 드라이버들(460_1~460_L)은 외부 모놀로식 안티티어 비아들(예컨대, 431_1~431_N)을 통해 서로 전기적으로 연결될 수 있다. 예를 들면, 적어도 둘 이상의 입력 드라이버들(460_1~460_L)은 외부 모놀로식 안티티어 비아들(예컨대, 431_1~431_N)을 이용하여, 외부로부터 어느 하나의 입력 드라이버(예컨대, 360_1)로 입력받는 데이터를 나머지 입력 드라이버(예컨대, 360_2~360_L)에 공유할 수 있다. Meanwhile, at least two or more input drivers 460_1 to 460_L may be electrically connected to each other through external monolithic anti-tier vias (eg, 431_1 to 431_N). For example, at least two input drivers 460_1 to 460_L receive input from the outside to any one input driver (e.g., 360_1) using external monolithic anti-tier vias (e.g., 431_1 to 431_N) Data can be shared with the rest of the input drivers (eg, 360_2 to 360_L).
다음으로, 하나의 출력 드라이버(470)는 제1 레이어(410)로부터 제1 복수의 출력 배선들(OW_1_1~OW_N_1)을 따라 연장된 일단에 위치할 수 있다. Next, one
실시예에 따른 하나의 출력 드라이버(470)는 제1 복수의 출력 배선들(OW_1_1~OW_N_1)을 활성화하여, 제1 내지 제L 복수의 3상태 버퍼들(250_11_1~250_NM_L)로부터 데이터를 한번에 전송받을 수 있다. One
예를 들면, 하나의 출력 드라이버(470)는 제1 복수의 출력 배선들(OW_1_1~OW_N_1)을 활성화하여, 복수의 모놀로식 안티티어 비아(430_1_1~430_N_M)를 통해 제2 내지 제L 복수의 출력 배선(OW_1_2~OW_N_2, OW_1_3~OW_N_3, ..., OW_1_L~OW_N_L)을 활성화시킬 수 있다. 즉, 하나의 출력 드라이버(470)는 복수의 모놀로식 안티티어 비아(430_1_1~430_N_M)를 통해 제1 내지 제L 복수의 출력 배선(OW_1_1~OW_N_1, OW_1_2~OW_N_2, ..., OW_1_L~OW_N_L)을 한번에 활성화시킬 수 있다. For example, one
이에 따라, 하나의 출력 드라이버(470)는 제1 복수의 출력 배선들(OW_1_1~OW_N_1)을 통해 제1 내지 제L 복수의 3상태 버퍼들(450_11_1~450_NM_L)로부터 데이터를 동시에 전송받을 수 있다. Accordingly, one
도 9는 삼차원 크로스바 네트워크 기반의 그래픽 처리유닛(1000)에 대한 실시 예이다. 9 is an embodiment of a
도 1 내지 도 9를 참조하면, 그래픽 처리유닛(1000)은 삼차원 크로스바 네트워크(500), 레지스터 파일부(610), 오퍼랜드 콜렉터부(620) 및 아비터(630)를 포함할 수 있다. 1 to 9, the
먼저, 삼차원 크로스바 네트워크(500)는 제1 내지 제L 복수의 입력 배선들(IW_1_1~IW_M_1, IW_1_2~IW_M_2, ..., IW_1_L~IW_M_L)과 제1 내지 제L 복수의 출력 배선들(OW_1_1~OW_N_1, OW_1_2~OW_N_2, ..., OW_1_L~OW_N_L)을 포함할 수 있다. First, the
일 실시예에 따른 삼차원 크로스바 네트워크(500)는 제1 내지 제L 복수의 입력 배선들(IW_1_1~IW_M_1, IW_1_2~IW_M_2, ..., IW_1_L~IW_M_L)이 한번에 활성될 수 있다. 도 2에 도시된 바와 같이, 삼차원 크로스바 네트워크(500)는 하나의 입력 드라이버(270)를 통해 제1 내지 제L 복수의 입력 배선들(IW_1_1~IW_M_1, IW_1_2~IW_M_2, ..., IW_1_L~IW_M_L)을 한번에 활성화시킬 수 있다. In the
다른 실시예에 따른 삼차원 크로스바 네트워크(500)는 제1 내지 제L 복수의 출력 배선들(OW_1_1~OW_N_1, OW_1_2~OW_N_2,..., OW_1_L~OW_N_L)이 한번에 활성될 수 있다. 도 7에 도시된 바와 같이, 삼차원 크로스바 네트워크(500)는 하나의 출력 드라이버(470)를 통해 제1 내지 제L 복수의 출력 배선들(OW_1_1~OW_N_1, OW_1_2~OW_N_2,..., OW_1_L~OW_N_L)을 한번에 활성화시킬 수 있다. In the
다음으로, 레지스터 파일부(610)는 SRAM memory 구조로 형성된 복수개의 뱅크들(610_1~610_N)을 포함할 수 있다. Next, the
여기서, 복수개의 뱅크들(610_1~610_N)은 일련의 실행 코드에 해당하는 스레드(Thread)의 모든 콘텍스트(Context)를 저장할 수 있다. 구체적으로, 복수개의 뱅크들(10_1~10_N)은 스레드(Thread)의 모든 콘텍스트(Context) 중 오퍼랜드(Operand)를 저장할 수 있다. 여기서, 오퍼랜드(Operand)는 명령 실행에 사용되는 데이터나 정보를 의미할 수 있다. Here, the plurality of banks 610_1 to 610_N may store all contexts of a thread corresponding to a series of execution codes. Specifically, the plurality of banks 10_1 to 10_N may store an operand among all contexts of a thread. Here, the operand may mean data or information used to execute an instruction.
도 2에 도시된 바와 같이, 실시예에 따른 복수개의 뱅크들(10_1~10_N)은 하나의 입력 드라이버(270)를 통해 활성화되는 삼차원 크로스바 네트워크(500)에 대해 오퍼랜드(Operand)를 동시에 전송할 수 있다. As shown in FIG. 2, a plurality of banks 10_1 to 10_N according to an embodiment may simultaneously transmit an operand to a
다음으로, 오퍼랜드 콜렉터부(620)는 레지스터 파일부(610)에 오퍼랜드(Operand)를 요청함에 따라, 복수개의 뱅크들(10_1~10_N)로부터 삼차원 크로스바 네트워크(500)를 통해 오퍼랜드(Operand)를 전송받아 저장하고, 스레드(Thread)가 수행될 때, 실행유닛으로 전달할 수 있다. Next, as the
도 7에 도시된 바와 같이, 실시예에 따른 오퍼랜드 콜렉터부(620)는 하나의 출력 드라이버(470)를 통해 활성화되는 삼차원 크로스바 네트워크(500)에 대해 오퍼랜드(Operand)를 한번에 전송받을 수 있다. As shown in FIG. 7, the
이때, 아비터(630)는 복수개의 뱅크들(610_1~610_N)로부터 삼차원 크로스바 네트워크(500)를 통해 오퍼랜드 콜렉터부(620)로 전송되는 오퍼랜드(Operand)에 대한 요청 장애(request conflict)를 차단할 수 있도록, 삼차원 크로스바 네트워크(500)를 스케쥴러 기능을 제어할 수 있다. At this time, the
본 출원의 실시예에 따른 삼차원 크로스바 네트워크 기반의 그래픽 처리유닛(1000)은 종래의 이차원 크로스바 네트워크의 각 배선 길이를 감소시킬 수 있어, 배선 길이에 따라 소모되는 소비전력을 감소시킬 수 있다. 나아가, 종래의 이차원 크로스바 네트워크 면적 대비 감소된 삼차원 크로스바 네트워크(500)로 인하여, 그래픽 처리유닛(1000)은 상대적으로 복수개의 뱅크들(10_1~10_N)과 오퍼랜드 콜렉터부(20)의 면적을 늘릴 수 있게 하는 효과가 있다. The
본 출원은 도면에 도시된 일 실시 예를 참고로 설명되었으나 이는 예시적인 것에 불과하며, 본 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시 예가 가능하다는 점을 이해할 것이다. 따라서, 본 출원의 진정한 기술적 보호 범위는 첨부된 등록청구범위의 기술적 사상에 의해 정해져야 할 것이다.Although the present application has been described with reference to an exemplary embodiment illustrated in the drawings, this is only exemplary, and those of ordinary skill in the art will understand that various modifications and equivalent other exemplary embodiments are possible therefrom. Therefore, the true technical protection scope of the present application should be determined by the technical idea of the attached registration claims.
100, 200, 300, 400, 500: 삼차원 크로스바 네트워크
110: 제1 레이어
120: 제2 레이어
130_1_1~130_N_M: 적어도 하나의 모놀로식 안티티어 비아
1000: 그래픽 처리유닛100, 200, 300, 400, 500: three-dimensional crossbar network
110: first layer
120: second layer
130_1_1~130_N_M: at least one monolithic anti-tier via
1000: graphic processing unit
Claims (10)
상기 제1 레이어와 평행하게 이격되고, 제2 입력 배선이 형성된 적어도 하나의 제2 레이어; 및
상기 제1 및 제2 레이어에 대해 수직으로, 상기 제1 및 제2 입력 배선을 전기적으로 연결하는 적어도 하나의 모놀로식 안티티어 비아를 포함하는, 삼차원 크로스바 네트워크 기반의 그래픽 처리유닛. A first layer on which first input wiring is formed and extending to the outside;
At least one second layer spaced apart from the first layer and having a second input line formed thereon; And
A graphic processing unit based on a three-dimensional crossbar network comprising at least one monolithic anti-tier via vertically to the first and second layers and electrically connecting the first and second input wires.
상기 제1 레이어와 상기 적어도 하나의 제2 레이어 각각에, 동일한 격자 패턴으로 배치되는 복수의 3상태 버퍼들을 더 포함하는, 삼차원 크로스바 네트워크 기반의 그래픽 처리유닛. The method of claim 1,
A graphic processing unit based on a three-dimensional crossbar network, further comprising a plurality of three-state buffers arranged in the same grid pattern in each of the first layer and the at least one second layer.
상기 제1 입력 배선을 따라 일단에 위치하는 하나의 입력 드라이버; 및
상기 복수의 3상태 버퍼들과 연결된 복수의 출력 배선들을 따라 일단에 위치하는 복수의 출력 드라이버를 더 포함하고,
상기 하나의 입력 드라이버는, 상기 제1 입력 배선을 통해 상기 복수의 3상태 버퍼들과 연결된 복수의 입력 배선들을 한번에 활성화시키는, 삼차원 크로스바 네트워크 기반의 그래픽 처리유닛. The method of claim 2,
One input driver positioned at one end along the first input wiring; And
Further comprising a plurality of output drivers positioned at one end along a plurality of output wires connected to the plurality of tri-state buffers,
The one input driver activates a plurality of input wires connected to the plurality of three-state buffers through the first input wire at one time, a graphic processing unit based on a three-dimensional crossbar network.
상기 복수의 출력 드라이버들을 서로 연결시키는 외부 모놀로식 안티티어 비아를 더 포함하는, 삼차원 크로스바 네트워크 기반의 그래픽 처리유닛. The method of claim 3,
A graphics processing unit based on a three-dimensional crossbar network, further comprising an external monolithic anti-tier via connecting the plurality of output drivers to each other.
상기 적어도 하나의 모놀로식 안티티어 비아의 개수는 상기 복수의 3상태 버퍼들의 개수에 대응되는, 삼차원 크로스바 네트워크 기반의 그래픽 처리유닛. The method of claim 2,
A graphic processing unit based on a three-dimensional crossbar network, wherein the number of the at least one monolithic anti-tier via corresponds to the number of the plurality of three-state buffers.
상기 제1 레이어와 평행하게 이격되고, 제2 출력 배선이 형성된 적어도 하나의 제2 레이어; 및
상기 제1 및 제2 레이어에 대해 수직으로, 상기 제1 및 제2 출력 배선을 전기적으로 연결하는 적어도 하나의 모놀로식 안티티어 비아를 포함하는, 삼차원 크로스바 네트워크 기반의 그래픽 처리유닛. A first layer on which first output wiring is formed;
At least one second layer spaced apart from the first layer and having a second output line formed thereon; And
A graphic processing unit based on a three-dimensional crossbar network comprising at least one monolithic anti-tier via vertically to the first and second layers and electrically connecting the first and second output wires.
상기 제1 레이어와 상기 적어도 하나의 제2 레이어 각각에, 동일한 격자 패턴으로 배치되는 복수의 3상태 버퍼들을 더 포함하는, 삼차원 크로스바 네트워크 기반의 그래픽 처리유닛. The method of claim 6,
A graphic processing unit based on a three-dimensional crossbar network, further comprising a plurality of three-state buffers arranged in the same grid pattern in each of the first layer and the at least one second layer.
상기 제1 출력 배선을 따라 일단에 위치하는 하나의 출력 드라이버; 및
상기 복수의 3상태 버퍼들과 연결된 복수의 입력 배선들을 따라 일단에 위치하는 복수의 입력 드라이버를 더 포함하고,
상기 하나의 출력 드라이버는, 상기 제1 출력 배선을 통해 상기 복수의 3상태 버퍼들과 연결된 복수의 출력 배선들을 한번에 활성화시키는, 삼차원 크로스바 네트워크 기반의 그래픽 처리유닛. The method of claim 7,
One output driver positioned at one end along the first output wiring; And
Further comprising a plurality of input drivers positioned at one end along a plurality of input wires connected to the plurality of tri-state buffers,
The one output driver activates a plurality of output wires connected to the plurality of three-state buffers at a time through the first output wire. 3D crossbar network based graphics processing unit.
상기 복수의 입력 드라이버들을 서로 연결시키는 외부 모놀로식 안티티어 비아를 더 포함하는, 삼차원 크로스바 네트워크 기반의 그래픽 처리유닛. The method of claim 8,
A graphic processing unit based on a three-dimensional crossbar network, further comprising an external monolithic anti-tier via connecting the plurality of input drivers to each other.
적어도 하나의 모놀로식 안티티어 비아의 개수는 상기 복수의 3상태 버퍼들의 개수에 대응되는, 삼차원 크로스바 네트워크 기반의 그래픽 처리유닛.
The method of claim 7,
A graphic processing unit based on a three-dimensional crossbar network, in which the number of at least one monolithic anti-tier via corresponds to the number of the plurality of three-state buffers.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020190023036A KR102174486B1 (en) | 2019-02-27 | 2019-02-27 | Graphics processing unit based on three dimention crossbar network |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020190023036A KR102174486B1 (en) | 2019-02-27 | 2019-02-27 | Graphics processing unit based on three dimention crossbar network |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20200104561A true KR20200104561A (en) | 2020-09-04 |
KR102174486B1 KR102174486B1 (en) | 2020-11-04 |
Family
ID=72471195
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020190023036A KR102174486B1 (en) | 2019-02-27 | 2019-02-27 | Graphics processing unit based on three dimention crossbar network |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102174486B1 (en) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011123979A (en) * | 2009-12-14 | 2011-06-23 | Toshiba Corp | Semiconductor memory device |
KR20110128047A (en) * | 2010-05-20 | 2011-11-28 | 삼성전자주식회사 | Semiconsuctoe device having three dimensional stacked structure and method for deskewing thereof |
KR20130024317A (en) * | 2011-08-31 | 2013-03-08 | 성균관대학교산학협력단 | Three-dimensional network on chip and communication method of the same |
KR20140043711A (en) * | 2010-12-14 | 2014-04-10 | 쌘디스크 3디 엘엘씨 | Three dimensional non-volatile storage with dual layers of select devices |
KR20150116176A (en) * | 2014-04-07 | 2015-10-15 | 에스케이하이닉스 주식회사 | Non-volatile memory device having page buffer units under cell |
KR20170000397A (en) * | 2013-03-15 | 2017-01-02 | 퀄컴 인코포레이티드 | Three-dimensional(3d) memory cell with read/write ports and access logic on different tiers of the integrated circuit |
KR20180097352A (en) * | 2017-02-23 | 2018-08-31 | 고려대학교 산학협력단 | Monolithic 3d(m3d) integration-based cache memory |
KR20190013049A (en) * | 2017-07-31 | 2019-02-11 | 고려대학교 산학협력단 | Monolithic 3D(M3D) integration-based cache memory and control method thereof |
-
2019
- 2019-02-27 KR KR1020190023036A patent/KR102174486B1/en active IP Right Grant
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011123979A (en) * | 2009-12-14 | 2011-06-23 | Toshiba Corp | Semiconductor memory device |
KR20110128047A (en) * | 2010-05-20 | 2011-11-28 | 삼성전자주식회사 | Semiconsuctoe device having three dimensional stacked structure and method for deskewing thereof |
KR20140043711A (en) * | 2010-12-14 | 2014-04-10 | 쌘디스크 3디 엘엘씨 | Three dimensional non-volatile storage with dual layers of select devices |
KR20130024317A (en) * | 2011-08-31 | 2013-03-08 | 성균관대학교산학협력단 | Three-dimensional network on chip and communication method of the same |
KR20170000397A (en) * | 2013-03-15 | 2017-01-02 | 퀄컴 인코포레이티드 | Three-dimensional(3d) memory cell with read/write ports and access logic on different tiers of the integrated circuit |
KR20150116176A (en) * | 2014-04-07 | 2015-10-15 | 에스케이하이닉스 주식회사 | Non-volatile memory device having page buffer units under cell |
KR20180097352A (en) * | 2017-02-23 | 2018-08-31 | 고려대학교 산학협력단 | Monolithic 3d(m3d) integration-based cache memory |
KR20190013049A (en) * | 2017-07-31 | 2019-02-11 | 고려대학교 산학협력단 | Monolithic 3D(M3D) integration-based cache memory and control method thereof |
Also Published As
Publication number | Publication date |
---|---|
KR102174486B1 (en) | 2020-11-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220068890A1 (en) | 3d processor | |
US10672744B2 (en) | 3D compute circuit with high density Z-axis interconnects | |
US20190123022A1 (en) | 3D Compute Circuit with High Density Z-Axis Interconnects | |
US9515008B2 (en) | Techniques for interconnecting stacked dies using connection sites | |
KR101378152B1 (en) | Shared memory device | |
JP6043015B2 (en) | Flexible memory system with controller and memory stack | |
WO2019079625A1 (en) | 3d compute circuit with high density z-axis interconnects | |
US11507527B2 (en) | Active bridge chiplet with integrated cache | |
JP2017517807A (en) | Interconnect system and method using hybrid memory cube link | |
US11841803B2 (en) | GPU chiplets using high bandwidth crosslinks | |
US20130061004A1 (en) | Memory/logic conjugate system | |
US9400762B2 (en) | Integrated device with memory systems accessible via basic and bypass routes | |
KR102174486B1 (en) | Graphics processing unit based on three dimention crossbar network | |
JP5439567B1 (en) | Semiconductor device | |
CN116737617B (en) | Access controller | |
JP2008047079A (en) | Integrated device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |