JP7270234B2 - Aiチップ - Google Patents
Aiチップ Download PDFInfo
- Publication number
- JP7270234B2 JP7270234B2 JP2022527567A JP2022527567A JP7270234B2 JP 7270234 B2 JP7270234 B2 JP 7270234B2 JP 2022527567 A JP2022527567 A JP 2022527567A JP 2022527567 A JP2022527567 A JP 2022527567A JP 7270234 B2 JP7270234 B2 JP 7270234B2
- Authority
- JP
- Japan
- Prior art keywords
- die
- dies
- memory
- computing
- chip
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013473 artificial intelligence Methods 0.000 claims description 143
- 238000012545 processing Methods 0.000 claims description 91
- 238000004364 calculation method Methods 0.000 claims description 9
- 238000000034 method Methods 0.000 claims description 7
- 239000004020 conductor Substances 0.000 claims description 6
- 238000009792 diffusion process Methods 0.000 claims description 4
- 239000011159 matrix material Substances 0.000 claims description 4
- 238000011176 pooling Methods 0.000 claims description 3
- 238000004891 communication Methods 0.000 description 18
- 238000012986 modification Methods 0.000 description 17
- 230000004048 modification Effects 0.000 description 17
- 241000724291 Tobacco streak virus Species 0.000 description 10
- 238000010586 diagram Methods 0.000 description 10
- 239000000758 substrate Substances 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 6
- 239000010949 copper Substances 0.000 description 4
- 239000007769 metal material Substances 0.000 description 4
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 3
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 3
- 238000007792 addition Methods 0.000 description 3
- 239000000470 constituent Substances 0.000 description 3
- 229910052802 copper Inorganic materials 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 229910052710 silicon Inorganic materials 0.000 description 3
- 239000010703 silicon Substances 0.000 description 3
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 230000006866 deterioration Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000009429 electrical wiring Methods 0.000 description 1
- 238000009713 electroplating Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000012447 hatching Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01L—SEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
- H01L27/00—Devices consisting of a plurality of semiconductor or other solid-state components formed in or on a common substrate
- H01L27/02—Devices consisting of a plurality of semiconductor or other solid-state components formed in or on a common substrate including semiconductor components specially adapted for rectifying, oscillating, amplifying or switching and having potential barriers; including integrated passive circuit elements having potential barriers
- H01L27/04—Devices consisting of a plurality of semiconductor or other solid-state components formed in or on a common substrate including semiconductor components specially adapted for rectifying, oscillating, amplifying or switching and having potential barriers; including integrated passive circuit elements having potential barriers the substrate being a semiconductor body
- H01L27/06—Devices consisting of a plurality of semiconductor or other solid-state components formed in or on a common substrate including semiconductor components specially adapted for rectifying, oscillating, amplifying or switching and having potential barriers; including integrated passive circuit elements having potential barriers the substrate being a semiconductor body including a plurality of individual components in a non-repetitive configuration
- H01L27/0688—Integrated circuits having a three-dimensional layout
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/76—Architectures of general purpose stored program computers
- G06F15/78—Architectures of general purpose stored program computers comprising a single central processing unit
- G06F15/7839—Architectures of general purpose stored program computers comprising a single central processing unit with memory
- G06F15/7864—Architectures of general purpose stored program computers comprising a single central processing unit with memory on more than one IC chip
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11C—STATIC STORES
- G11C5/00—Details of stores covered by group G11C11/00
- G11C5/02—Disposition of storage elements, e.g. in the form of a matrix array
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01L—SEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
- H01L23/00—Details of semiconductor or other solid state devices
- H01L23/52—Arrangements for conducting electric current within the device in operation from one component to another, i.e. interconnections, e.g. wires, lead frames
- H01L23/538—Arrangements for conducting electric current within the device in operation from one component to another, i.e. interconnections, e.g. wires, lead frames the interconnection structure between a plurality of semiconductor chips being formed on, or in, insulating substrates
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01L—SEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
- H01L25/00—Assemblies consisting of a plurality of individual semiconductor or other solid state devices ; Multistep manufacturing processes thereof
- H01L25/03—Assemblies consisting of a plurality of individual semiconductor or other solid state devices ; Multistep manufacturing processes thereof all the devices being of a type provided for in the same subgroup of groups H01L27/00 - H01L33/00, or in a single subclass of H10K, H10N, e.g. assemblies of rectifier diodes
- H01L25/04—Assemblies consisting of a plurality of individual semiconductor or other solid state devices ; Multistep manufacturing processes thereof all the devices being of a type provided for in the same subgroup of groups H01L27/00 - H01L33/00, or in a single subclass of H10K, H10N, e.g. assemblies of rectifier diodes the devices not having separate containers
- H01L25/065—Assemblies consisting of a plurality of individual semiconductor or other solid state devices ; Multistep manufacturing processes thereof all the devices being of a type provided for in the same subgroup of groups H01L27/00 - H01L33/00, or in a single subclass of H10K, H10N, e.g. assemblies of rectifier diodes the devices not having separate containers the devices being of a type provided for in group H01L27/00
- H01L25/0652—Assemblies consisting of a plurality of individual semiconductor or other solid state devices ; Multistep manufacturing processes thereof all the devices being of a type provided for in the same subgroup of groups H01L27/00 - H01L33/00, or in a single subclass of H10K, H10N, e.g. assemblies of rectifier diodes the devices not having separate containers the devices being of a type provided for in group H01L27/00 the devices being arranged next and on each other, i.e. mixed assemblies
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01L—SEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
- H01L25/00—Assemblies consisting of a plurality of individual semiconductor or other solid state devices ; Multistep manufacturing processes thereof
- H01L25/03—Assemblies consisting of a plurality of individual semiconductor or other solid state devices ; Multistep manufacturing processes thereof all the devices being of a type provided for in the same subgroup of groups H01L27/00 - H01L33/00, or in a single subclass of H10K, H10N, e.g. assemblies of rectifier diodes
- H01L25/04—Assemblies consisting of a plurality of individual semiconductor or other solid state devices ; Multistep manufacturing processes thereof all the devices being of a type provided for in the same subgroup of groups H01L27/00 - H01L33/00, or in a single subclass of H10K, H10N, e.g. assemblies of rectifier diodes the devices not having separate containers
- H01L25/065—Assemblies consisting of a plurality of individual semiconductor or other solid state devices ; Multistep manufacturing processes thereof all the devices being of a type provided for in the same subgroup of groups H01L27/00 - H01L33/00, or in a single subclass of H10K, H10N, e.g. assemblies of rectifier diodes the devices not having separate containers the devices being of a type provided for in group H01L27/00
- H01L25/0657—Stacked arrangements of devices
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01L—SEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
- H01L25/00—Assemblies consisting of a plurality of individual semiconductor or other solid state devices ; Multistep manufacturing processes thereof
- H01L25/18—Assemblies consisting of a plurality of individual semiconductor or other solid state devices ; Multistep manufacturing processes thereof the devices being of types provided for in two or more different subgroups of the same main group of groups H01L27/00 - H01L33/00, or in a single subclass of H10K, H10N
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01L—SEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
- H01L27/00—Devices consisting of a plurality of semiconductor or other solid-state components formed in or on a common substrate
- H01L27/02—Devices consisting of a plurality of semiconductor or other solid-state components formed in or on a common substrate including semiconductor components specially adapted for rectifying, oscillating, amplifying or switching and having potential barriers; including integrated passive circuit elements having potential barriers
- H01L27/0203—Particular design considerations for integrated circuits
- H01L27/0207—Geometrical layout of the components, e.g. computer aided design; custom LSI, semi-custom LSI, standard cell technique
-
- H—ELECTRICITY
- H10—SEMICONDUCTOR DEVICES; ELECTRIC SOLID-STATE DEVICES NOT OTHERWISE PROVIDED FOR
- H10B—ELECTRONIC MEMORY DEVICES
- H10B80/00—Assemblies of multiple devices comprising at least one memory device covered by this subclass
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01L—SEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
- H01L2225/00—Details relating to assemblies covered by the group H01L25/00 but not provided for in its subgroups
- H01L2225/03—All the devices being of a type provided for in the same subgroup of groups H01L27/00 - H01L33/648 and H10K99/00
- H01L2225/04—All the devices being of a type provided for in the same subgroup of groups H01L27/00 - H01L33/648 and H10K99/00 the devices not having separate containers
- H01L2225/065—All the devices being of a type provided for in the same subgroup of groups H01L27/00 - H01L33/648 and H10K99/00 the devices not having separate containers the devices being of a type provided for in group H01L27/00
- H01L2225/06503—Stacked arrangements of devices
- H01L2225/06513—Bump or bump-like direct electrical connections between devices, e.g. flip-chip connection, solder bumps
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01L—SEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
- H01L2225/00—Details relating to assemblies covered by the group H01L25/00 but not provided for in its subgroups
- H01L2225/03—All the devices being of a type provided for in the same subgroup of groups H01L27/00 - H01L33/648 and H10K99/00
- H01L2225/04—All the devices being of a type provided for in the same subgroup of groups H01L27/00 - H01L33/648 and H10K99/00 the devices not having separate containers
- H01L2225/065—All the devices being of a type provided for in the same subgroup of groups H01L27/00 - H01L33/648 and H10K99/00 the devices not having separate containers the devices being of a type provided for in group H01L27/00
- H01L2225/06503—Stacked arrangements of devices
- H01L2225/06517—Bump or bump-like direct electrical connections from device to substrate
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01L—SEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
- H01L2225/00—Details relating to assemblies covered by the group H01L25/00 but not provided for in its subgroups
- H01L2225/03—All the devices being of a type provided for in the same subgroup of groups H01L27/00 - H01L33/648 and H10K99/00
- H01L2225/04—All the devices being of a type provided for in the same subgroup of groups H01L27/00 - H01L33/648 and H10K99/00 the devices not having separate containers
- H01L2225/065—All the devices being of a type provided for in the same subgroup of groups H01L27/00 - H01L33/648 and H10K99/00 the devices not having separate containers the devices being of a type provided for in group H01L27/00
- H01L2225/06503—Stacked arrangements of devices
- H01L2225/06527—Special adaptation of electrical connections, e.g. rewiring, engineering changes, pressure contacts, layout
- H01L2225/06531—Non-galvanic coupling, e.g. capacitive coupling
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01L—SEMICONDUCTOR DEVICES NOT COVERED BY CLASS H10
- H01L2225/00—Details relating to assemblies covered by the group H01L25/00 but not provided for in its subgroups
- H01L2225/03—All the devices being of a type provided for in the same subgroup of groups H01L27/00 - H01L33/648 and H10K99/00
- H01L2225/04—All the devices being of a type provided for in the same subgroup of groups H01L27/00 - H01L33/648 and H10K99/00 the devices not having separate containers
- H01L2225/065—All the devices being of a type provided for in the same subgroup of groups H01L27/00 - H01L33/648 and H10K99/00 the devices not having separate containers the devices being of a type provided for in group H01L27/00
- H01L2225/06503—Stacked arrangements of devices
- H01L2225/06541—Conductive via connections through the device, e.g. vertical interconnects, through silicon via [TSV]
Landscapes
- Engineering & Computer Science (AREA)
- Power Engineering (AREA)
- Microelectronics & Electronic Packaging (AREA)
- Computer Hardware Design (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Condensed Matter Physics & Semiconductors (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Design And Manufacture Of Integrated Circuits (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Semiconductor Integrated Circuits (AREA)
- Neurology (AREA)
- Semiconductor Memories (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
Description
本開示は、AIチップに関する。
特許文献1には、論理マクロを複数備えるシステムオンチップと、各論理マクロがアクセスするメモリ領域を有するメモリチップとが積層された半導体集積回路装置が開示されている。複数のメモリチップが積層可能であり、メモリ容量を増やすことができる。
近年、人工知能(AI)を用いた様々な演算処理(以下、AI処理と記載する)を高速に行うことが期待されている。特許文献1に開示されるような構成の半導体集積回路をAI処理に応用できたとしても、メモリ容量を増やすことができるものの、演算処理自体が高速化される訳ではない。処理能力を向上させるためには、チップ自体の再設計などが必要になり、簡単に処理能力を向上させることが難しい。
そこで、本開示は、処理能力を簡単に向上させることができるAIチップを提供することを目的とする。
本開示の一態様に係るAIチップは、データを記憶する複数のメモリダイと、AI処理に含まれる演算を行う複数の演算ダイと、前記複数のメモリダイ及び前記複数の演算ダイを制御するシステムチップとを備え、前記複数のメモリダイの各々は、第1レイアウトパターンを有し、前記複数の演算ダイの各々は、第2レイアウトパターンを有し、前記複数のメモリダイの1つである第2メモリダイは、前記複数のメモリダイの1つである第1メモリダイの前記第1レイアウトパターンの上方に積層され、前記複数の演算ダイの1つである第2演算ダイは、前記複数の演算ダイの1つである第1演算ダイの前記第2レイアウトパターンの上方に積層されている。
本開示に係るAIチップによれば、処理能力を簡単に向上させることができる。
(本開示の概要)
本開示の一態様に係るAIチップは、データを記憶する複数のメモリダイと、AI処理に含まれる演算を行う複数の演算ダイと、前記複数のメモリダイ及び前記複数の演算ダイを制御するシステムチップとを備え、前記複数のメモリダイの各々は、第1レイアウトパターンを有し、前記複数の演算ダイの各々は、第2レイアウトパターンを有し、前記複数のメモリダイの1つである第2メモリダイは、前記複数のメモリダイの1つである第1メモリダイの前記第1レイアウトパターンの上方に積層され、前記複数の演算ダイの1つである第2演算ダイは、前記複数の演算ダイの1つである第1演算ダイの前記第2レイアウトパターンの上方に積層されている。
本開示の一態様に係るAIチップは、データを記憶する複数のメモリダイと、AI処理に含まれる演算を行う複数の演算ダイと、前記複数のメモリダイ及び前記複数の演算ダイを制御するシステムチップとを備え、前記複数のメモリダイの各々は、第1レイアウトパターンを有し、前記複数の演算ダイの各々は、第2レイアウトパターンを有し、前記複数のメモリダイの1つである第2メモリダイは、前記複数のメモリダイの1つである第1メモリダイの前記第1レイアウトパターンの上方に積層され、前記複数の演算ダイの1つである第2演算ダイは、前記複数の演算ダイの1つである第1演算ダイの前記第2レイアウトパターンの上方に積層されている。
これにより、メモリ容量が必要な場合にはメモリダイを、演算能力が必要な場合には演算ダイを、それぞれに必要な個数積層することができる。つまり、AIチップの性能を簡単にスケーラブルに変更することができる。このため、AIチップの処理能力を簡単に向上させることができる。
また、例えば、前記システムチップは、前記第1メモリダイと前記第1演算ダイとを備えてもよい。
これにより、インターポーザを利用しなくてよいので、AIチップの低コスト化を実現することができる。
また、例えば、前記システムチップは、インターポーザを備え、前記第1メモリダイ及び前記第1演算ダイの少なくとも一方は、前記インターポーザ上に積層されていてもよい。
これにより、インターポーザを利用することで、メモリダイ及び演算ダイのみを再設計することで、システムチップ全体の再設計を行うことなく、AIチップの処理能力を向上させることができる。
また、例えば、前記第1メモリダイ及び前記第1演算ダイは、前記インターポーザ上に積層されていてもよい。
これにより、メモリダイ及び演算ダイの配置の自由度を高めることができる。
また、例えば、前記システムチップは、平面視において、互いに重複しない第1領域及び第2領域を有し、前記複数のメモリダイは、前記第1領域に積層され、前記複数の演算ダイは、前記第2領域に積層されていてもよい。
これにより、メモリダイと演算ダイとが別々に積層されるので、メモリダイのレイアウトパターンと演算ダイのレイアウトパターンとが全く異なっていてもよい。メモリダイと演算ダイとで、レイアウトパターンをそれぞれに最適化することができる。
また、例えば、前記第1メモリダイ及び前記第1演算ダイの一方は、前記第1メモリダイ及び前記第1演算ダイの他方の上方に積層されていてもよい。
これにより、メモリダイと演算ダイとを同じ領域に積層することができるので、システムチップの小面積化を実現することができる。
また、例えば、前記複数の演算ダイの各々は、書き換え可能回路を有し、前記書き換え可能回路は、前記AI処理用のアクセラレータ回路を含んでもよい。
これにより、回路の書き換えが可能でありながら、AI処理を高速化することができる。
また、例えば、前記書き換え可能回路は、論理ブロック及びスイッチブロックを含んでもよい。
これにより、AI処理の高速化だけでなく、その他の論理演算を高速に処理することができる。
また、例えば、前記AI処理に含まれる演算は、畳み込み演算、行列演算及びプーリング演算の少なくとも1つを含んでもよい。
これにより、AI処理を高速化することができる。
また、例えば、前記畳み込み演算は、対数領域で行う演算を含んでもよい。
これにより、乗算を使わずに加算だけで演算が可能になるので、AI処理を高速化することができる。また、演算ダイの小面積化が実現できる。
また、例えば、前記AI処理は、ディザを用いた誤差拡散手法を含んでもよい。
これにより、ディザを使うことで、低ビット数でも精度劣化を抑制することができる。
また、例えば、前記システムチップは、制御ブロックと、前記制御ブロックと前記複数のメモリダイ及び前記複数の演算ダイとを電気的に接続するバスとを含んでもよい。
これにより、AIチップのみで複雑な処理を実行することができる。
また、例えば、複数の前記第1レイアウトパターンは、互いに貫通導体を介して接続されていてもよい。
これにより、メモリダイ間の導通を容易に確保することができ、データ及び信号の送受信が可能になる。
また、例えば、複数の前記第1レイアウトパターンは、互いに無線で接続されていてもよい。
これにより、無線通信によってメモリダイ間のデータ及び信号の送受信を簡単に行うことができる。また、AIチップの低コスト化も実現することができる。
また、例えば、複数の前記第2レイアウトパターンは、互いに貫通導体を介して接続されていてもよい。
これにより、演算ダイ間の導通を容易に確保することができ、データ及び信号の送受信が可能になる。
また、例えば、複数の前記第2レイアウトパターンは、互いに無線で接続されていてもよい。
これにより、無線通信によって演算ダイ間のデータ及び信号の送受信を簡単に行うことができる。また、AIチップの低コスト化も実現することができる。
以下では、実施の形態について、図面を参照しながら具体的に説明する。
なお、以下で説明する実施の形態は、いずれも包括的又は具体的な例を示すものである。以下の実施の形態で示される数値、形状、材料、構成要素、構成要素の配置位置及び接続形態、ステップ、ステップの順序などは、一例であり、本開示を限定する主旨ではない。また、以下の実施の形態における構成要素のうち、独立請求項に記載されていない構成要素については、任意の構成要素として説明される。
また、各図は、模式図であり、必ずしも厳密に図示されたものではない。したがって、例えば、各図において縮尺などは必ずしも一致しない。また、各図において、実質的に同一の構成については同一の符号を付しており、重複する説明は省略又は簡略化する。
また、本明細書において、「上方」及び「下方」という用語は、絶対的な空間認識における上方向(鉛直上方)及び下方向(鉛直下方)を指すものではなく、積層構成における積層順を基に相対的な位置関係により規定される用語として用いる。また、「上方」及び「下方」という用語は、2つの構成要素が互いに間隔を空けて配置されて2つの構成要素の間に別の構成要素が存在する場合のみならず、2つの構成要素が互いに密着して配置されて2つの構成要素が接する場合にも適用される。
(実施の形態)
[1.概要]
まず、実施の形態に係るAIチップの概要について、図1を用いて説明する。図1は、本実施の形態に係るAIチップ1を示す模式的な斜視図である。
[1.概要]
まず、実施の形態に係るAIチップの概要について、図1を用いて説明する。図1は、本実施の形態に係るAIチップ1を示す模式的な斜視図である。
図1に示されるAIチップ1は、AI処理を実行する半導体チップである。AI処理は、人工知能を利用するための各種演算処理であり、例えば、自然言語処理、音声認識処理、画像認識処理及びレコメンデーション、並びに、各種機器の制御処理などに利用される。AI処理には、例えば機械学習又はディープラーニングなどが含まれる。
図1に示されるように、AIチップ1は、システムチップ100と、パッケージ基板101と、データを記憶する複数のメモリダイ201と、AI処理に含まれる演算を行う複数の演算ダイ301とを備える。システムチップ100は、パッケージ基板101に実装されている。複数のメモリダイ201及び複数の演算ダイ301は、システムチップ100に実装されている。複数のメモリダイ201及び複数の演算ダイ301はそれぞれが、ベアチップである。
本実施の形態では、システムチップ100は、データを記憶するメモリダイ200と、AI処理に含まれる演算を行う演算ダイ300とを備える。このため、システムチップ100は、単独で(すなわち、メモリダイ201及び演算ダイ301が積層されていなくても)AI処理を実行することができる。AI処理を高速化するために、メモリダイ201及び演算ダイ301が追加的に設けられる。メモリダイ201及び演算ダイ301はそれぞれ、メモリ容量及び演算能力を向上させるために必要な個数設けられる。
複数のメモリダイ201は、メモリダイ200の上方に積層される。メモリダイ201の個数を増やす程、AI処理に利用可能なメモリ容量を増やすことができる。メモリダイ201の個数は、AIチップ1に要求されるメモリ容量に応じて決定される。AIチップ1は、少なくとも1つのメモリダイ201を備える。メモリ容量は、メモリダイの個数に比例して向上する。
複数の演算ダイ301は、演算ダイ300の上方に積層される。演算ダイ301の個数を増やす程、AI処理に利用できる演算能力を増やすことができる。演算ダイ301の個数は、AIチップ1に要求される演算能力に応じて決定される。AIチップ1は、少なくとも1つの演算ダイ301を備える。
演算能力は、例えば、単位時間当たりに実行可能な命令数(TOPS:Tera Operations Per Second)である。例えば、1つの演算ダイ301は、1Wの消費電力で40TOPSの命令実行能力を有する。図1に示されるように、演算ダイ300を含めて合計7つの演算ダイが積層されているので、AIチップ1は、7Wの消費電力で280TOPSの命令実行能力を有する。このように、AIチップ1の処理能力は、演算ダイの個数に比例して向上する。
本実施の形態では、メモリダイと演算ダイとは、別々に積層されている。つまり、複数のメモリダイと複数の演算ダイとは、システムチップ100の平面視における互いに異なる領域に配置されている。
具体的には、システムチップ100は、図1に示されるように、第1領域102と第2領域103とを有する。第1領域102は、平面視において第2領域103とは異なる領域である。
メモリダイ200及び複数のメモリダイ201は、第1領域102に配置されている。具体的には、第1領域102に配置されたメモリダイ200の上に全てのメモリダイ201が積層されている。メモリダイ200と全てのメモリダイ201とは、平面視において互いに重複している。1つのメモリダイ200又は201の上には1つのメモリダイ201が積層されている。
演算ダイ300及び複数の演算ダイ301は、第2領域103に配置されている。具体的には、第2領域103に配置された演算ダイ300の上に全ての演算ダイ301が積層されている。演算ダイ300と全ての演算ダイ301とは、平面視において互いに重複している。1つの演算ダイ300又は301の上には1つの演算ダイ301が積層されている。
以上のように、AIチップ1では、メモリダイ及び演算ダイがそれぞれ、必要に応じた個数を積層可能に構成されている。つまり、メモリ容量が必要な場合は、メモリダイ201を必要な個数積層することができる。演算能力が必要な場合は、演算ダイ301を必要な個数積層することができる。メモリ容量及び演算能力の両方が必要な場合は、メモリダイ201及び演算ダイ301をそれぞれ必要な個数積層することができる。このように、AIチップ1の性能を簡単にスケーラブルに変更することができる。このため、AIチップ1の処理能力を簡単に向上させることができる。
[2.構成]
続いて、AIチップ1の各構成要素の具体的な構成について説明する。
続いて、AIチップ1の各構成要素の具体的な構成について説明する。
[2-1.システムチップ]
まず、システムチップ100の構成について、図2を用いて説明する。図2は、本実施の形態に係るAIチップ1が備えるシステムチップ100の構成を示すブロック図である。
まず、システムチップ100の構成について、図2を用いて説明する。図2は、本実施の形態に係るAIチップ1が備えるシステムチップ100の構成を示すブロック図である。
システムチップ100は、AIチップ1の全体を制御する。具体的には、システムチップ100は、複数のメモリダイ200及び201並びに複数の演算ダイ300及び301を制御する。
図2に示されるように、システムチップ100は、マイクロコントローラ110と、システムバス120と、外部インタフェース130と、画像処理エンジン140と、DRAM(Dynamic Random Access Memory)コントローラ150と、AIアクセラレータ160とを備える。
マイクロコントローラ110は、システムチップ100全体の制御を行う制御ブロックの一例である。マイクロコントローラ110は、システムバス120を介して、外部インタフェース130、画像処理エンジン140、DRAMコントローラ150及びAIアクセラレータ160の各々との間でデータ及び情報の送受信を行い、演算及び命令を実行する。図2に示されるように、マイクロコントローラ110は、複数のCPU(Central Processing Unit)111と、L2キャッシュ112とを備える。なお、マイクロコントローラ110が備えるCPU111の個数は、1個のみでもよい。また、マイクロコントローラ110は、L2キャッシュ112を備えていなくてもよい。
マイクロコントローラ110は、メモリダイ200及び複数のメモリダイ201の中から選択した任意のメモリダイに、AI処理に必要なデータを記憶させる。つまり、一のメモリダイ200又は201に記憶可能なデータは、他のメモリダイ200又は201にも記憶することができる。マイクロコントローラ110は、積層された全てのメモリダイ201を有効なメモリ領域として利用する。新たにメモリダイ201が積層された場合、マイクロコントローラ110は、新たなメモリダイ201を既存のメモリダイ200又は201と同等に制御することができる。
また、マイクロコントローラ110は、演算ダイ300及び複数の演算ダイ301の中から選択した任意の演算ダイに、AI処理に含まれる演算を実行させる。つまり、一の演算ダイ300又は301が実行可能な命令は、他の演算ダイ300又は301が実行することもできる。マイクロコントローラ110は、積層された全ての演算ダイ301を有効な演算回路として利用する。新たに演算ダイ301が積層された場合、マイクロコントローラ110は、新たな演算ダイ301を既存の演算ダイ300又は301と同等に制御することができる。
システムバス120は、データ及び信号などの送受信に利用される配線である。システムバス120には、マイクロコントローラ110、外部インタフェース130、画像処理エンジン140、DRAMコントローラ150及びAIアクセラレータ160が電気的に接続され、互いに通信可能である。
外部インタフェース130は、AIチップ1とは異なる外部装置とのデータ及び信号の送受信を行うためのインタフェースである。
画像処理エンジン140は、画像信号又は映像信号を処理する信号処理回路である。例えば、画像処理エンジン140は、画質調整処理などを実行する。
DRAMコントローラ150は、AIチップ1とは異なる外部メモリに対するデータの読み出し及び書き込みなどを行うメモリコントローラである。
AIアクセラレータ160は、AI処理を高速に行う信号処理回路である。図2に示されるように、AIアクセラレータ160は、内部バス161と、メモリダイ200と、演算ダイ300と、DSP(Digital Signal Processor)400とを備える。
内部バス161は、AIアクセラレータ160内でのデータ及び信号などの送受信に利用される配線である。内部バス161には、メモリダイ200、演算ダイ300及びDSP400が電気的に接続され、互いに通信可能である。内部バス161は、複数のメモリダイ201及び複数の演算ダイ301に対するデータ及び信号などの送受信にも利用される。内部バス161とシステムバス120とは、マイクロコントローラ110と、複数のメモリダイ200及び201並びに複数の演算ダイ300及び301とを電気的に接続するバスを構成している。
メモリダイ200は、AIチップ1が備える複数のメモリダイの1つである第1メモリダイの一例である。図3に示されるように、メモリダイ200が有するレイアウトパターン(第1レイアウトパターン)の上方に複数のメモリダイ201が積層されている。ここで、図3は、図2に示されるブロック図と図1に示される斜視図との関係を模式的に示す図である。複数のメモリダイ201の各々は、第1メモリダイが有する第1レイアウトパターンの上方に積層された第2メモリダイの一例である。
演算ダイ300は、AIチップ1が備える複数の演算ダイの1つである第1演算ダイの一例である。図3に示されるように、演算ダイ300が有するレイアウトパターン(第2レイアウトパターン)の上方に複数の演算ダイ301が積層されている。複数の演算ダイ301の各々は、第1演算ダイが有する第2レイアウトパターンの上方に積層された第2演算ダイの一例である。
DSP400は、AI処理に関わるデジタル信号処理を行うプロセッサである。
なお、システムチップ100の構成は、図2に示される例に限定されない。例えば、システムチップ100は、画像処理エンジン140を備えなくてもよい。システムチップ100は、所定の処理に専用の信号処理回路などを備えてもよい。
[2-2.メモリダイ]
次に、メモリダイ200及び201の構成について、図4を用いて説明する。図4は、本実施の形態に係るAIチップ1が備えるメモリダイ200及び201の平面レイアウトの一例を示す平面図である。
次に、メモリダイ200及び201の構成について、図4を用いて説明する。図4は、本実施の形態に係るAIチップ1が備えるメモリダイ200及び201の平面レイアウトの一例を示す平面図である。
メモリダイ200と複数のメモリダイ201の各々とは、同じレイアウトパターンを有する。具体的には、メモリダイ200と複数のメモリダイ201の各々とは、同一の構成を有し、各々のメモリ容量が同じである。以下では、メモリダイ201の構成を中心に説明する。
メモリダイ201は、例えば、DRAM又はSRAMなどの揮発性メモリである。メモリダイ201は、NAND型フラッシュメモリなどの不揮発性メモリであってもよい。図4に示されるように、メモリダイ200は、一つ以上のメモリブロック210と、一つ以上の入出力ポート240と、一つ以上の配線260とを備える。一つ以上のメモリブロック210と、一つ以上の入出力ポート240と、一つ以上の配線260とはそれぞれ、メモリダイ201を構成するシリコン基板の表面又は内部に形成されている。メモリダイ201のレイアウトパターンは、メモリブロック210、入出力ポート240及び配線260の各々の大きさ、形状、個数及び配置によって表される。
一つ以上のメモリブロック210はそれぞれ、一つ以上のメモリセルを含み、データを記憶する記憶回路である。図4に示される例では、一つ以上のメモリブロック210には、面積(メモリ容量)が異なるものが含まれているが、全てのメモリブロック210が同じ面積であってもよい。
一つ以上の入出力ポート240はそれぞれ、メモリダイ201に対するデータ及び信号の入出力を行う端子である。メモリダイ201は、入出力ポート240を介して、上下に積層されたメモリダイ200又は201と電気的に接続される。メモリダイ201は、メモリダイ200と電気的に接続されており、メモリダイ200を介して内部バス161及びシステムバス120に電気的に接続される。図4に示される例では、一つ以上の入出力ポート240がメモリダイ201の外周に沿って環状に配置されているが、これに限らない。例えば、一つ以上の入出力ポート240は、メモリダイ201の中央に設けられていてもよい。
一つ以上の配線260は、入出力ポート240とメモリブロック210とを接続する電気配線であり、データの送受信に用いられる。一つ以上の配線260は、例えばビット線及びワード線を含んでいる。図4に示される例では、一つ以上の配線260は、格子状に設けられているが、ストライプ状であってもよい。
図4では、メモリダイ200及び201の構成の一例を模式的に簡略化して示したが、メモリダイ200及び201の構成は、レイアウトパターンが同じであれば、特に限定されない。
[2-3.演算ダイ]
次に、演算ダイ300及び301の構成について、図5を用いて説明する。図5は、本実施の形態に係るAIチップ1が備える演算ダイ300及び301の平面レイアウトの一例を示す図である。
次に、演算ダイ300及び301の構成について、図5を用いて説明する。図5は、本実施の形態に係るAIチップ1が備える演算ダイ300及び301の平面レイアウトの一例を示す図である。
演算ダイ300と複数の演算ダイ301の各々とは、同じレイアウトパターンを有する。具体的には、演算ダイ300と複数の演算ダイ301の各々とは、同一の構成を有し、各々の演算能力が同じである。以下では、演算ダイ301の構成を中心に説明する。
演算ダイ301は、書き換え可能回路を有する。具体的には、演算ダイ301は、FPGA(Field Programmable Gate Array)である。図5に示されるように、演算ダイ301は、一つ以上のAI処理ブロック310と、一つ以上の論理ブロック320と、一つ以上のスイッチブロック330と、一つ以上の入出力ポート340と、一つ以上の接続ブロック350と、一つ以上の配線360とを備える。一つ以上のAI処理ブロック310と、一つ以上の論理ブロック320と、一つ以上のスイッチブロック330と、一つ以上の入出力ポート340と、一つ以上の接続ブロック350と、一つ以上の配線360とは、演算ダイ301を構成するシリコン基板の表面又は内部に形成されている。演算ダイ301のレイアウトパターンは、AI処理ブロック310、論理ブロック320、スイッチブロック330、入出力ポート340、接続ブロック350及び配線360の各々の大きさ、形状、個数及び配置によって表される。
一つ以上のAI処理ブロック310はそれぞれ、AI処理用のアクセラレータ回路である。AI処理ブロック310の具体的な構成については、図6を用いて後で説明する。
一つ以上の論理ブロック320はそれぞれ、論理演算を行う演算回路である。一つ以上のAI処理ブロック310と一つ以上の論理ブロック320とは、行列状に並んで配置されている。例えば、図5に示される例では、一つ以上のAI処理ブロック310と一つ以上の論理ブロック320とは、3行×3列に並んで配置されており、各ブロックは、スイッチブロック330及び接続ブロック350を介して配線360によって電気的に接続されている。なお、AI処理ブロック310の個数は、1個のみでもよく、特に限定されない。また、一つ以上のAI処理ブロック310と一つ以上の論理ブロック320の配置は行列上に限定されることはなく、ストライプ状であってもよい。
一つ以上のスイッチブロック330はそれぞれ、スイッチブロック330の隣に位置する2つ~4つの接続ブロック350の接続関係を切り替える切替回路である。
一つ以上の入出力ポート340はそれぞれ、演算ダイ301に対するデータ及び信号の入出力を行う端子である。演算ダイ301は、入出力ポート340を介して、上下に積層された演算ダイ300又は301と接続される。演算ダイ301は、演算ダイ300と接続されており、演算ダイ300を介して内部バス161及びシステムバス120に接続される。図5に示される例では、一つ以上の入出力ポート340が演算ダイ301の外周に沿って環状に配置されているが、これに限らない。例えば、一つ以上の入出力ポート340は、演算ダイ301の中央に設けられていてもよい。
一つ以上の接続ブロック350はそれぞれ、接続ブロック350の隣に位置するAI処理ブロック310、論理ブロック320及びスイッチブロック330と接続するための回路である。
一つ以上の配線360は、入出力ポート340とAI処理ブロック310及び論理ブロック320などとを接続する電気配線であり、データの送受信に用いられる。図5に示される例では、一つ以上の配線360は、格子状に設けられているが、ストライプ状であってもよい。
演算ダイ301は、スイッチブロック330及び接続ブロック350において、入出力ポート340、AI処理ブロック310及び論理ブロック320の接続関係が切り替えられることにより、特定の演算処理を行うことができる。スイッチブロック330及び接続ブロック350の切り替えは、例えば、図示されないメモリに記憶された構成情報(コンフィギュレーションデータ)を用いて行われる。
次に、AI処理ブロック310の具体的な構成について、図6を用いて説明する。図6は、本実施の形態に係る演算ダイ300及び301が備えるAI処理ブロック310の構成を示すブロック図である。
AI処理ブロック310は、AI処理に含まれる演算を行う。具体的には、AI処理ブロック310は、畳み込み演算、行列演算及びプーリング演算の少なくとも1つを行う。例えば、AI処理ブロック310は、図6に示されるように、対数処理回路311を含む。対数処理回路311は、対数量子化された入力データに対して演算を行う。具体的には、対数処理回路311は、対数量子化された入力データの畳み込み演算を行う。畳み込み演算に含まれる乗算処理は、演算対象のデータが対数領域に変換されることにより、加算処理で実行可能である。これにより、AI処理の高速化が実現される。
また、AI処理ブロック310が行うAI処理は、ディザを用いた誤差拡散手法を含んでもよい。具体的には、AI処理ブロック310は、ディザ回路312を含む。ディザ回路312は、誤差拡散手法を用いた演算を行う。これにより、少ないビット数でも演算の精度の劣化を抑制することができる。
図5では、演算ダイ300及び301の構成の一例を模式的に簡略化して示したが、演算ダイ300及び301の構成は、レイアウトパターンが同じであれば、特に限定されない。
[3.積層されたダイ同士の接続]
続いて、積層されたダイ同士の接続について説明する。ダイ同士の接続には、TSV(Through Silicon Via)を用いる場合と、無線を用いる場合とがある。
続いて、積層されたダイ同士の接続について説明する。ダイ同士の接続には、TSV(Through Silicon Via)を用いる場合と、無線を用いる場合とがある。
[3-1.TSV]
図7は、本実施の形態に係る複数のメモリダイ201及び複数の演算ダイ301の接続にTSVが用いられる例を示す断面図である。図7には、システムチップ100がバンプ電極180を介してパッケージ基板101に実装されている様子が図示されている。なお、メモリダイ200及び演算ダイ300はシステムチップ100内で一体的に形成されているが、図7では破線及び網掛けによって模式的にメモリダイ200及び演算ダイ300が設けられた領域を表している。これは、図8においても同様である。
図7は、本実施の形態に係る複数のメモリダイ201及び複数の演算ダイ301の接続にTSVが用いられる例を示す断面図である。図7には、システムチップ100がバンプ電極180を介してパッケージ基板101に実装されている様子が図示されている。なお、メモリダイ200及び演算ダイ300はシステムチップ100内で一体的に形成されているが、図7では破線及び網掛けによって模式的にメモリダイ200及び演算ダイ300が設けられた領域を表している。これは、図8においても同様である。
図7に示されるように、複数のメモリダイ201の各々には、TSV270が設けられている。TSV270は、メモリダイ201を貫通する貫通導体の一例である。TSV270は、例えば、銅(Cu)などの金属材料を用いて形成されている。具体的には、メモリダイ201を厚み方向に貫通する貫通孔を形成した後、貫通孔の内壁を絶縁膜で覆い、その後、電解めっき法などによって金属材料で貫通孔を充填することによってTSV270を形成することができる。
図7では、TSV270の少なくとも一方の端部には、銅などの金属材料を用いてバンプ電極280が形成され、積層方向に隣り合うメモリダイ201のTSV270同士を電気的に接続している。なお、バンプ電極280を使用せずに積層方向に隣り合うメモリダイ201を接続してもよい。
TSV270及びバンプ電極280は、平面視において、図4に示される入出力ポート240に重複する位置に設けられる。本実施の形態では、メモリダイ200及び複数のメモリダイ201が同一のレイアウトパターンを有するので、それぞれを積層した場合に、入出力ポート240の位置が平面視において一致する。このため、メモリダイ201を厚み方向に貫通するTSV270によって、メモリダイ201同士を簡単に電気的に接続することができる。
メモリダイ201と同様に、複数の演算ダイ301の各々には、TSV370が設けられている。TSV370は、演算ダイ301を貫通する貫通導体の一例である。TSV370の材料及び形成方法は、TSV270と同じである。
図7では、TSV370の少なくとも一方の端部には、銅などの金属材料を用いてバンプ電極380が形成され、積層方向に隣り合う演算ダイ301のTSV370同士を電気的に接続している。なお、バンプ電極380を使用せずに積層方向に隣り合う演算ダイ301を接続してもよい。
TSV370及びバンプ電極380は、平面視において、図5に示される入出力ポート340に重複する位置に設けられる。本実施の形態では、演算ダイ300及び複数の演算ダイ301が同一のレイアウトパターンを有するので、それぞれを積層した場合に、入出力ポート340の位置が平面視において一致する。このため、演算ダイ301を厚み方向に貫通するTSV370によって、演算ダイ301同士を簡単に電気的に接続することができる。
なお、最上層のメモリダイ201を最下層のメモリダイ200に電気的に接続するためには、最上層のメモリダイ201を除く全てのメモリダイ201の各々にTSV270が設けられている。同様に、上から2番目のメモリダイ201をメモリダイ200に電気的に接続するためには、最上層及び上から2番目のメモリダイ201を除く残り全てのメモリダイ201の各々にTSV270が設けられている。このとき、最上層のメモリダイ201の接続に用いられるTSV270と、上から2番目のメモリダイ201の接続に用いられるTSV270とは、同じTSVであって共用されていてもよく、異なるTSVであって共用されていなくてもよい。演算ダイ301についても同様である。
[3-2.無線]
図8は、本実施の形態に係る複数のメモリダイ201及び複数の演算ダイ301の接続に無線が用いられる例を示す断面図である。無線を用いた接続は、ワイヤレスTSV技術とも称される。
図8は、本実施の形態に係る複数のメモリダイ201及び複数の演算ダイ301の接続に無線が用いられる例を示す断面図である。無線を用いた接続は、ワイヤレスTSV技術とも称される。
図8に示されるように、複数のメモリダイ201の各々には、無線通信回路290が設けられている。無線通信回路290は、通信範囲が数十μm程度の超近距離無線通信を行う。具体的には、無線通信回路290は、微小なコイルを有し、コイル間の磁界結合を利用して通信を行う。
メモリダイ201と同様に、複数の演算ダイ301の各々には、無線通信回路390が設けられている。無線通信回路390は、通信範囲が数十μm程度の超近距離無線通信を行う。具体的には、無線通信回路390は、微小なコイルを有し、コイル間の磁界結合を利用して通信を行う。
図8では、無線通信回路290及び390がそれぞれ、基板内に埋め込まれている例を示しているが、これに限らない。無線通信回路290及び390は、基板の上面及び下面の少なくとも一方に設けられていてもよい。
なお、メモリダイ201の接続には、TSVが用いられ、演算ダイ301の接続には、無線が用いられてもよい。あるいは、メモリダイ201の接続には、無線が用いられ、演算ダイ301の接続には、TSVが用いられてもよい。また、メモリダイ201の接続には、TSVと無線との両方が用いられてもよい。同様に、演算ダイ301の接続には、TSVと無線との両方が用いられてもよい。
[4.変形例]
続いて、実施の形態に係るAIチップ1の変形例について説明する。以下では、上述した実施の形態との相違点を中心に説明を行い、共通点の説明を省略又は簡略化する。
続いて、実施の形態に係るAIチップ1の変形例について説明する。以下では、上述した実施の形態との相違点を中心に説明を行い、共通点の説明を省略又は簡略化する。
[4-1.変形例1]
まず、変形例1に係るAIチップについて説明する。変形例1では、メモリダイ及び演算ダイの少なくとも一方の積層にインターポーザが用いられる。
まず、変形例1に係るAIチップについて説明する。変形例1では、メモリダイ及び演算ダイの少なくとも一方の積層にインターポーザが用いられる。
図9は、変形例1に係るAIチップ2を示す模式的な斜視図である。図9に示されるように、AIチップ2では、システムチップ100がインターポーザ500を備える。システムチップ100は、メモリダイ200及び演算ダイ300を備えない。
インターポーザ500は、チップと基板との電気的な接続を中継する中継部品である。本変形例では、複数のメモリダイ201の1つと、複数の演算ダイ301の1つとがそれぞれ、インターポーザ500上に積層されている。残りのメモリダイ201は、インターポーザ500上に積層されたメモリダイ201の上方に積層されている。残りの演算ダイ301は、インターポーザ500上に積層された演算ダイ301の上方に積層されている。
なお、本変形例において、システムチップ100は、メモリダイ200及び演算ダイ300の一方を備えてもよい。言い換えると、メモリダイと演算ダイとのいずれか一方のみがインターポーザ500上に積層されていてもよい。
例えば、AIチップ2は、システムチップ100が備えるメモリダイ200の上方に積層された1つ以上のメモリダイ201と、インターポーザ500上に積層された複数の演算ダイ301とを備えてもよい。あるいは、AIチップ2は、システムチップ100が備える演算ダイ300の上方に積層された1つ以上の演算ダイ301と、インターポーザ500上に積層された複数のメモリダイ201とを備えてもよい。
[4-2.変形例2]
次に、変形例2に係るAIチップについて説明する。変形例2では、メモリダイと演算ダイとが混在して積層される。
次に、変形例2に係るAIチップについて説明する。変形例2では、メモリダイと演算ダイとが混在して積層される。
図10~図13はそれぞれ、変形例2に係るAIチップ3~6を示す模式的な斜視図である。
図10に示されるAIチップ3では、システムチップ100は、メモリダイ200を備え、演算ダイ300を備えない。メモリダイ200の上方に、複数のメモリダイ201と複数の演算ダイ301とがこの順で積層されている。つまり、複数のメモリダイ201のうちの最上層のメモリダイ201上に、複数の演算ダイ301のうちの最下層の演算ダイ301が積層されている。
なお、図11に示されるAIチップ4のように、複数の演算ダイ301の上方に複数のメモリダイ201が積層されていてもよい。AIチップ4では、システムチップ100は、演算ダイ300を備え、メモリダイ200を備えない。演算ダイ300の上方に、複数の演算ダイ301と複数のメモリダイ201とがこの順で積層されている。つまり、複数の演算ダイ301のうちの最上層の演算ダイ301上に、複数のメモリダイ201のうちの最下層のメモリダイ201が積層されている。
あるいは、図12に示されるAIチップ5のように、メモリダイ201と演算ダイ301とが交互に積層されていてもよい。AIチップ5では、システムチップ100がメモリダイ200を備え、演算ダイ300を備えない。メモリダイ200上に、演算ダイ301とメモリダイ201とが1つずつ交互に積層される。なお、AIチップ5では、システムチップ100が演算ダイ300を備え、メモリダイ200を備えなくてもよい。演算ダイ300上に、メモリダイ201と演算ダイ301とが1つずつ交互に積層されてもよい。また、AIチップ5では、システムチップ100がメモリダイ200と演算ダイ300とを備えてもよい。メモリダイ200と演算ダイ300との各々の上方に、メモリダイ201と演算ダイ301とが交互に1つずつ積層されてもよい。また、メモリダイ201及び演算ダイ301の少なくとも一方は、複数個ずつ積層されてもよい。
また、図13に示されるAIチップ6のように、インターポーザ500上にメモリダイ201と演算ダイ301とが積層されてもよい。AIチップ6では、システムチップ100は、メモリダイ200及び演算ダイ300のいずれも備えず、インターポーザ500を備える。インターポーザ500上には、複数の演算ダイ301のうちの1つが積層されている。インターポーザ500上に積層された演算ダイ301の上方に、残りの演算ダイ301及びメモリダイ201が積層されている。なお、インターポーザ500上には、メモリダイ201が積層されていてもよい。また、インターポーザ500の上方に積層されるメモリダイ201と演算ダイ301とは1つずつ交互に積層されてもよいし、複数個ずつ積層されてもよい。
このように、メモリダイと演算ダイとの積層方法は特に限定されず、設計変更の自由度が高いAIチップが実現される。
(他の実施の形態)
以上、1つ又は複数の態様に係るAIチップについて、実施の形態に基づいて説明したが、本開示は、これらの実施の形態に限定されるものではない。本開示の主旨を逸脱しない限り、当業者が思いつく各種変形を本実施の形態に施したもの、及び、異なる実施の形態における構成要素を組み合わせて構築される形態も、本開示の範囲内に含まれる。
以上、1つ又は複数の態様に係るAIチップについて、実施の形態に基づいて説明したが、本開示は、これらの実施の形態に限定されるものではない。本開示の主旨を逸脱しない限り、当業者が思いつく各種変形を本実施の形態に施したもの、及び、異なる実施の形態における構成要素を組み合わせて構築される形態も、本開示の範囲内に含まれる。
例えば、図12に示されるAIチップ5のように、1つのメモリダイは、他のメモリダイの第1レイアウトパターン上に直接積層されていなくてもよい。つまり、上層に位置するメモリダイは、下層に位置するメモリダイのレイアウトパターンの上方に積層されていればよく、間に演算ダイが介在していてもよい。同様に、1つの演算ダイは、他の演算ダイの第2レイアウトパターン上に直接積層されていなくてもよい。つまり、上層に位置する演算ダイは、下層に位置する演算ダイのレイアウトパターンの上方に積層されていればよく、間にメモリダイが介在していてもよい。なお、メモリダイ同士、演算ダイ同士、又は、メモリダイと演算ダイとは、インターポーザを介さずに積層されている。
また、演算ダイ300及び301は、書き換え不可能な回路であってもよい。演算ダイ300及び301は、少なくとも1つのAI処理ブロック310を備えればよく、論理ブロック320、スイッチブロック330及び接続ブロック350を備えなくてもよい。
また、上記の各実施の形態は、請求の範囲又はその均等の範囲において種々の変更、置き換え、付加、省略などを行うことができる。
本開示は、処理能力を簡単に向上させることができるAIチップとして利用でき、例えば、各種電化製品及びコンピュータ機器などに利用することができる。
1、2、3、4、5、6 AIチップ
100 システムチップ
101 パッケージ基板
102 第1領域
103 第2領域
110 マイクロコントローラ
111 CPU
112 L2キャッシュ
120 システムバス
130 外部インタフェース
140 画像処理エンジン
150 DRAMコントローラ
160 AIアクセラレータ
161 内部バス
180、280、380 バンプ電極
200、201 メモリダイ
210 メモリブロック
240、340 入出力ポート
260、360 配線
270、370 TSV
290、390 無線通信回路
300、301 演算ダイ
310 AI処理ブロック
311 対数処理回路
312 ディザ回路
320 論理ブロック
330 スイッチブロック
350 接続ブロック
400 DSP(デジタルシグナルプロセッサ)
500 インターポーザ
100 システムチップ
101 パッケージ基板
102 第1領域
103 第2領域
110 マイクロコントローラ
111 CPU
112 L2キャッシュ
120 システムバス
130 外部インタフェース
140 画像処理エンジン
150 DRAMコントローラ
160 AIアクセラレータ
161 内部バス
180、280、380 バンプ電極
200、201 メモリダイ
210 メモリブロック
240、340 入出力ポート
260、360 配線
270、370 TSV
290、390 無線通信回路
300、301 演算ダイ
310 AI処理ブロック
311 対数処理回路
312 ディザ回路
320 論理ブロック
330 スイッチブロック
350 接続ブロック
400 DSP(デジタルシグナルプロセッサ)
500 インターポーザ
Claims (16)
- データを記憶する複数のメモリダイと、
AI(Artificial Intelligence)処理に含まれる演算を行う複数の演算ダイと、
前記複数のメモリダイ及び前記複数の演算ダイを制御するシステムチップとを備え、
前記複数のメモリダイの各々は、第1レイアウトパターンを有し、
前記複数の演算ダイの各々は、第2レイアウトパターンを有し、
前記複数のメモリダイの1つである第2メモリダイは、前記複数のメモリダイの1つである第1メモリダイの前記第1レイアウトパターンの上方に積層され、
前記複数の演算ダイの1つである第2演算ダイは、前記複数の演算ダイの1つである第1演算ダイの前記第2レイアウトパターンの上方に積層されている、
AIチップ。 - 前記システムチップは、前記第1メモリダイと前記第1演算ダイとを備える、
請求項1に記載のAIチップ。 - 前記システムチップは、インターポーザを備え、
前記第1メモリダイ及び前記第1演算ダイの少なくとも一方は、前記インターポーザ上に積層されている、
請求項1に記載のAIチップ。 - 前記第1メモリダイ及び前記第1演算ダイは、前記インターポーザ上に積層されている、
請求項3に記載のAIチップ。 - 前記システムチップは、平面視において、互いに重複しない第1領域及び第2領域を有し、
前記複数のメモリダイは、前記第1領域に積層され、
前記複数の演算ダイは、前記第2領域に積層されている、
請求項1~4のいずれか1項に記載のAIチップ。 - 前記第1メモリダイ及び前記第1演算ダイの一方は、前記第1メモリダイ及び前記第1演算ダイの他方の上方に積層されている、
請求項1~3のいずれか1項に記載のAIチップ。 - 前記複数の演算ダイの各々は、書き換え可能回路を有し、
前記書き換え可能回路は、前記AI処理用のアクセラレータ回路を含む、
請求項1~6のいずれか1項に記載のAIチップ。 - 前記書き換え可能回路は、論理ブロック及びスイッチブロックを含む、
請求項7に記載のAIチップ。 - 前記AI処理に含まれる演算は、畳み込み演算、行列演算及びプーリング演算の少なくとも1つを含む、
請求項1~8のいずれか1項に記載のAIチップ。 - 前記畳み込み演算は、対数領域で行う演算を含む、
請求項9に記載のAIチップ。 - 前記AI処理は、ディザを用いた誤差拡散手法を含む、
請求項1~10のいずれか1項に記載のAIチップ。 - 前記システムチップは、
制御ブロックと、
前記制御ブロックと、前記複数のメモリダイ及び前記複数の演算ダイとを電気的に接続するバスとを含む、
請求項1~11のいずれか1項に記載のAIチップ。 - 複数の前記第1レイアウトパターンは、互いに貫通導体を介して接続されている、
請求項1~12のいずれか1項に記載のAIチップ。 - 複数の前記第1レイアウトパターンは、互いに無線で接続されている、
請求項1~12のいずれか1項に記載のAIチップ。 - 複数の前記第2レイアウトパターンは、互いに貫通導体を介して接続されている、
請求項1~14のいずれか1項に記載のAIチップ。 - 複数の前記第2レイアウトパターンは、互いに無線で接続されている、
請求項1~14のいずれか1項に記載のAIチップ。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020093022 | 2020-05-28 | ||
JP2020093022 | 2020-05-28 | ||
PCT/JP2021/015475 WO2021241048A1 (ja) | 2020-05-28 | 2021-04-14 | Aiチップ |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2021241048A1 JPWO2021241048A1 (ja) | 2021-12-02 |
JP7270234B2 true JP7270234B2 (ja) | 2023-05-10 |
Family
ID=78744363
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022527567A Active JP7270234B2 (ja) | 2020-05-28 | 2021-04-14 | Aiチップ |
Country Status (4)
Country | Link |
---|---|
US (1) | US20230197711A1 (ja) |
JP (1) | JP7270234B2 (ja) |
CN (1) | CN115516628A (ja) |
WO (1) | WO2021241048A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117915670B (zh) * | 2024-03-14 | 2024-07-05 | 上海芯高峰微电子有限公司 | 一种存算一体的芯片结构 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015502664A (ja) | 2011-12-02 | 2015-01-22 | インテル・コーポレーション | デバイス相互接続の変化を可能にする積層メモリ |
US20190073585A1 (en) | 2017-09-01 | 2019-03-07 | Qualcomm Incorporated | Ultra-low power neuromorphic artificial intelligence computing accelerator |
US20200135719A1 (en) | 2018-10-24 | 2020-04-30 | Micron Technology, Inc. | Functional Blocks Implemented by 3D Stacked Integrated Circuit |
US20200161230A1 (en) | 2018-11-18 | 2020-05-21 | International Business Machines Corporation | Thinned die stack |
US20200168527A1 (en) | 2018-11-28 | 2020-05-28 | Taiwan Semiconductor Manfacturing Co., Ltd. | Soic chip architecture |
US20200303344A1 (en) | 2019-03-18 | 2020-09-24 | Kepler Computing Inc. | Artificial intelligence processor with three-dimensional stacked memory |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11100193B2 (en) * | 2018-12-07 | 2021-08-24 | Samsung Electronics Co., Ltd. | Dataflow accelerator architecture for general matrix-matrix multiplication and tensor computation in deep learning |
-
2021
- 2021-04-14 WO PCT/JP2021/015475 patent/WO2021241048A1/ja active Application Filing
- 2021-04-14 CN CN202180029687.XA patent/CN115516628A/zh active Pending
- 2021-04-14 US US17/995,972 patent/US20230197711A1/en active Pending
- 2021-04-14 JP JP2022527567A patent/JP7270234B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015502664A (ja) | 2011-12-02 | 2015-01-22 | インテル・コーポレーション | デバイス相互接続の変化を可能にする積層メモリ |
US20190073585A1 (en) | 2017-09-01 | 2019-03-07 | Qualcomm Incorporated | Ultra-low power neuromorphic artificial intelligence computing accelerator |
US20200135719A1 (en) | 2018-10-24 | 2020-04-30 | Micron Technology, Inc. | Functional Blocks Implemented by 3D Stacked Integrated Circuit |
US20200161230A1 (en) | 2018-11-18 | 2020-05-21 | International Business Machines Corporation | Thinned die stack |
US20200168527A1 (en) | 2018-11-28 | 2020-05-28 | Taiwan Semiconductor Manfacturing Co., Ltd. | Soic chip architecture |
US20200303344A1 (en) | 2019-03-18 | 2020-09-24 | Kepler Computing Inc. | Artificial intelligence processor with three-dimensional stacked memory |
Also Published As
Publication number | Publication date |
---|---|
US20230197711A1 (en) | 2023-06-22 |
WO2021241048A1 (ja) | 2021-12-02 |
JPWO2021241048A1 (ja) | 2021-12-02 |
CN115516628A (zh) | 2022-12-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110875296B (zh) | 包括桥式晶片的层叠封装 | |
US20170179078A1 (en) | Semiconductor packages and methods of manufacturing the same | |
US9318477B2 (en) | Semiconductor device having dummy cell array | |
KR101709675B1 (ko) | 인터페이스 다이와 복수의 다이 스택들 사이에서 동시 통신을 가능하게 하는 장치들, 스태킹된 장치들에서의 인터리빙된 도전성 경로들, 및 이를 형성 및 동작하는 방법들 | |
US9748201B2 (en) | Semiconductor packages including an interposer | |
TW201637166A (zh) | 具有中介層的半導體封裝及其製造方法 | |
JP2010251762A (ja) | パッケージされた集積回路装置及びその動作方法とこれを有するメモリ保存装置及び電子システム | |
US11201140B2 (en) | Semiconductor packages including stacked sub-packages with interposing bridges | |
US9275688B2 (en) | Semiconductor device and semiconductor package | |
US20200402959A1 (en) | Stacked semiconductor package having an interposer | |
US9922965B2 (en) | Manufacturing methods semiconductor packages including through mold connectors | |
KR20110006482A (ko) | 메모리 링크 아키텍쳐를 갖는 멀티 프로세서 시스템에 적합한 멀티 칩 패키지 구조 | |
JP7270234B2 (ja) | Aiチップ | |
CN112786565A (zh) | 具有中介层桥的层叠封装 | |
US20120049361A1 (en) | Semiconductor integrated circuit | |
US10998294B2 (en) | Semiconductor packages having stacked chip structure | |
CN111883489A (zh) | 包括扇出子封装件的层叠封装件 | |
CN103915430A (zh) | 一种三维芯片堆栈结构 | |
CN113257787A (zh) | 包括层叠在基础模块上的芯片的半导体封装 | |
JP6207228B2 (ja) | 集積回路装置およびその構成方法 | |
WO2022029825A1 (ja) | 演算回路及びai処理モジュール | |
US11322475B2 (en) | Stack semiconductor packages having wire-bonding connection structure | |
CN113299638B (zh) | 包括具有插入桥和半导体晶片的堆叠模块的半导体封装 | |
WO2022172609A1 (ja) | Aiモジュール | |
KR20100112490A (ko) | 데이터 라인 레이아웃 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220906 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230328 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230417 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7270234 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |