JP7841160B2 - 複数の同一のダイを有する単一のチップパッケージを用いてニューラルネットワークタスクを処理するための装置および機構 - Google Patents
複数の同一のダイを有する単一のチップパッケージを用いてニューラルネットワークタスクを処理するための装置および機構Info
- Publication number
- JP7841160B2 JP7841160B2 JP2025086567A JP2025086567A JP7841160B2 JP 7841160 B2 JP7841160 B2 JP 7841160B2 JP 2025086567 A JP2025086567 A JP 2025086567A JP 2025086567 A JP2025086567 A JP 2025086567A JP 7841160 B2 JP7841160 B2 JP 7841160B2
- Authority
- JP
- Japan
- Prior art keywords
- artificial intelligence
- aipd
- neural network
- die
- intelligence processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/76—Architectures of general purpose stored program computers
- G06F15/78—Architectures of general purpose stored program computers comprising a single central processing unit
- G06F15/7896—Modular architectures, e.g. assembled from a number of identical packages
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/063—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F13/14—Handling requests for interconnection or transfer
- G06F13/16—Handling requests for interconnection or transfer for access to memory bus
- G06F13/1668—Details of memory controller
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F13/00—Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
- G06F13/38—Information transfer, e.g. on bus
- G06F13/40—Bus structure
- G06F13/4004—Coupling between buses
- G06F13/4027—Coupling between buses using bus bridges
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F7/00—Methods or arrangements for processing data by operating upon the order or content of the data handled
- G06F7/38—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation
- G06F7/48—Methods or arrangements for performing computations using exclusively denominational number representation, e.g. using binary, ternary, decimal representation using non-contact-making devices, e.g. tube, solid state device; using unspecified devices
- G06F7/50—Adding; Subtracting
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11C—STATIC STORES
- G11C11/00—Digital stores characterised by the use of particular electric or magnetic storage elements; Storage elements therefor
- G11C11/21—Digital stores characterised by the use of particular electric or magnetic storage elements; Storage elements therefor using electric elements
- G11C11/22—Digital stores characterised by the use of particular electric or magnetic storage elements; Storage elements therefor using electric elements using ferroelectric elements
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11C—STATIC STORES
- G11C11/00—Digital stores characterised by the use of particular electric or magnetic storage elements; Storage elements therefor
- G11C11/54—Digital stores characterised by the use of particular electric or magnetic storage elements; Storage elements therefor using elements simulating biological cells, e.g. neuron
-
- H—ELECTRICITY
- H10—SEMICONDUCTOR DEVICES; ELECTRIC SOLID-STATE DEVICES NOT OTHERWISE PROVIDED FOR
- H10W—GENERIC PACKAGES, INTERCONNECTIONS, CONNECTORS OR OTHER CONSTRUCTIONAL DETAILS OF DEVICES COVERED BY CLASS H10
- H10W90/00—Package configurations
-
- H—ELECTRICITY
- H10—SEMICONDUCTOR DEVICES; ELECTRIC SOLID-STATE DEVICES NOT OTHERWISE PROVIDED FOR
- H10W—GENERIC PACKAGES, INTERCONNECTIONS, CONNECTORS OR OTHER CONSTRUCTIONAL DETAILS OF DEVICES COVERED BY CLASS H10
- H10W90/00—Package configurations
- H10W90/20—Configurations of stacked chips
- H10W90/288—Configurations of stacked chips characterised by arrangements for thermal management of the stacked chips
-
- H—ELECTRICITY
- H10—SEMICONDUCTOR DEVICES; ELECTRIC SOLID-STATE DEVICES NOT OTHERWISE PROVIDED FOR
- H10W—GENERIC PACKAGES, INTERCONNECTIONS, CONNECTORS OR OTHER CONSTRUCTIONAL DETAILS OF DEVICES COVERED BY CLASS H10
- H10W90/00—Package configurations
- H10W90/20—Configurations of stacked chips
- H10W90/297—Configurations of stacked chips characterised by the through-semiconductor vias [TSVs] in the stacked chips
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Computer Hardware Design (AREA)
- Neurology (AREA)
- Programmable Controllers (AREA)
- Feedback Control In General (AREA)
- Design And Manufacture Of Integrated Circuits (AREA)
- Advance Control (AREA)
- Multi Processors (AREA)
- Stored Programmes (AREA)
- Image Analysis (AREA)
Description
本願は、2017年11月21に出願され、「APPARATUS AND MECHANISM FOR PROCESSING NEURAL NETWORK TASKS USING A SINGLE CHIP PACKAGE WITH MULTIPLE IDENTICAL DIES(複数の同一のダイを有する単一のチップパッケージを用いてニューラルネットワークタスクを処理するための装置および機構)」と題された米国特許出願第15/819,753号に基づく優先権および利益を主張するものであり、すべての目的のためにその内容全体が明細書に引用により援用される。
人工知能コンピューティングの分野におけるニューラルネットワークの使用は、過去数年にわたって急速に成長を遂げている。より最近では、特定用途向け集積回路(ASIC)などの特殊目的コンピュータの使用が、ニューラルネットワークを処理するために用いられている。しかしながら、ASICの使用は、複数の難題を提起している。これらの難題の一部は、(1)長い設計時間、(2)無視できない経常外エンジニアリング費用である。ニューラルネットワークの人気が高まり、どのニューラルネットワークが使用されるかに関するタスクの範囲が広がるにつれて、長い設計時間と無視できない経常外エンジニアリング費用は悪化する。
少なくとも1つの態様は、人工知能プロセシングユニットに向けられている。人工知能処理ユニットは、複数の同一の人工知能処理ダイを備える。複数の同一の人工知能処理ダイの各人工知能処理ダイは、少なくとも1つのダイ間入力ブロックと少なくとも1つのダイ間出力ブロックとを含む。複数の同一の人工知能処理ダイの各人工知能処理ダイは、人工知能処理ダイの少なくとも1つのダイ間出力ブロックから人工知能処理ダイの少なくとも1つのダイ間入力ブロックへの1つまたは複数の通信路を介して、複数の同一の人工知能処理ダイのうちの他の人工知能処理ダイに通信可能に連結されている。複数の同一の人工知能処理ダイの各人工知能処理ダイは、ニューラルネットワークの少なくとも1つの層に対応する。
いくつかの実現例では、複数の同一の人工知能処理ダイのうち第1の人工知能処理ダイは、複数の同一の人工知能処理ダイのうち第2の人工知能処理ダイに隣接して位置しており、第2の人工知能処理ダイの向きは、第1の人工知能処理ダイの向きから180度ずれている。
理ダイにおいて行われた計算の結果データを用いて、ニューラルネットワークの出力層に関連するAI計算を行うことを備える。方法は、第2の人工知能処理ダイにおいて行われたAI計算の結果データを、人工知能処理ユニットに通信可能に連結されたコプロセシングユニットに送信することを備える。
本開示は、一般に、ニューラルネットワークの作業負荷を処理するための装置、システム、および機構に関する。ニューラルネットワークの効率的な処理は、特注の特定用途向け集積回路(ASIC)を利用する。しかしながら、特注のASICの設計には、長い設計時間、高い経常外エンジニアリング費用などのいくつかの難題があり、難題はこれらに
限定されるわけではないが、ASICが少量で生産されると、これらの難題は悪化する。
およびダイ間出力ブロックを選択するように構成されている。AIPD103間の通信について、図2A、図2B、および図2Cを参照して以下でさらに詳細に説明される。メインプロセシングユニットコントローラ105から送信されたデータがニューラルネットワークタスクを行う命令である場合、AIPDコントローラ117は、ニューラルネットワークに関連するデータをバッファ119に記憶し、バッファユニット119に記憶された入力データおよび計算ユニット121を用いてニューラルネットワークタスクを行うように構成されている。バッファ119は、データの記憶のために、レジスタ、DRAM、SRAM、または他の種類の集積回路メモリなどのメモリを含む。計算ユニット121は、複数の乗算累算ユニット(MAC、図示せず)、複数の算術論理演算ユニット(ALU)(図示せず)、および複数のシフトレジスタ(図示せず)などを含む。バッファ119のレジスタの一部は、シストリックアレイを確立するように計算ユニット121の複数のALUに連結されている。シストリックアレイによって、入力値は一度読出され、かつ、後の動作において入力として使用される前に結果を記憶することなく、複数の異なる動作のために使用される。そのようなシストリックアレイの配置例を、図1Cに示す。
ブロック223a、223b、およびホストインターフェースユニット214を含む。AIPD103cは、ダイ間入力ブロック225a、225b、ダイ間出力ブロック227a、227b、およびホストインターフェースユニット215を含む。AIPD103dは、ダイ間入力ブロック229a、229b、ダイ間出力ブロック231a、231b、およびホストインターフェースユニット216を含む。AIPD103eは、ダイ間入力ブロック233a、233b、ダイ間出力ブロック235a、235b、およびホストインターフェースユニット217を含む。AIPD103fは、ダイ間入力ブロック237a、237b、ダイ間出力ブロック239a、239b、およびホストインターフェースユニット218を含む。
ロック111bを用いて送信するように構成されている。AIPD103dのAIPDコントローラ216は、AIPD103dからの結果データを、AIPD103e、ニューラルネットワークの第3の層と関連付けられたAIPD103に、AIPD103eのダイ間入力ブロック233aに電気的に相互接続されたダイ間出力ブロック231aを用いて送信するように構成されている。AIPD103eのAIPDコントローラ217は、AIPD103eからの結果データを、AIPD103b、ニューラルネットワークの第4の層に関連付けれられたAIPD103に、AIPD103bのダイ間入力ブロック221bに電気的に相互接続されたAIPD103eのダイ間出力ブロック235aを用いて送信するように構成されている。AIPD103bのAIPDコントローラ214は、AIPD103bからの結果データを、AIPD103c、ニューラルネットワークの第5の層と関連付けられたAIPD103に、AIPD103cのダイ間入力ブロック225aに電気的に相互接続されたダイ間出力ブロック223aを用いて送信するように構成されている。AIPD103cのAIPDコントローラ215は、AIPD103cからの結果データを、AIPD103f、ニューラルネットワークの第6の層と関連付けられたAIPD103に、AIPD103fのダイ間入力ブロック237aに電気的に相互接続されたAIPD103cのダイ間出力ブロック227bを用いて送信するように構成されている。AIPDコントローラ218は、AIPD103fからのフィードバックデータを、AIPD103e、ニューラルネットワークの第3の層と関連付けられたAIPD103に、AIPD103eのダイ間入力ブロック233bに電気的に相互接続されたAIPD103fのダイ間出力ブロック239bを用いて送信するように構成されている。AIPD103fのAIPDコントローラ218はさらに、AIPD103fがニューラルネットワークの出力層と関連付けられている場合、AIPD103fからの結果データをメインプロセシングユニット101に送信するように構成されている。図2BのAIPD103の配置の順番は、AIPD103aが順番の第1の位置にあり、AIPD103dが第2の位置にあり、AIPD103eが第3の位置にあり、AIPD103bが第4の位置にあり、AIPD103cが第5の位置にあり、AIPD103fが第6の位置にあり、かつ、AIPD103eが第7の位置にある。AIPD103間の図2Bにおけるニューラルネットワーク関連データの通信の順番は、202a、202b、202c、202d、202e、202fで示されるように、103aから始まり、その後、103d、103e、103b、103c、103fへと、そしてその後、フィードバックデータを103eへと送信する。
トコントローラ105は、ニューラルネットワークに関連した入力データをニューラルネットワークの第1の層と関連付けられたAIPD、AIPD103aに送信する。AIPD103aと関連付けられた、変更されたコンフィギュレーションデータとニューラルネットワークへの入力データとに基づいて、AIPD103aは、AI計算を含む、新しいニューラルネットワークの第1の層に関連する計算を行い、ダイ間出力ブロック111aを用いてAIPD103bに結果データを送信する。本明細書で説明されるように、「ニューラルネットワークの層に関連する計算」は、ニューラルネットワークの当該層に関連するAI計算を含む。AIPD103bは、ダイ間入力ブロック221aでAIPD103から受信された結果データと、AIPD103bと関連付けられた、変更されたコンフィギュレーションデータとに基づいて、AI計算を含む、ニューラルネットワークの第2の層に関連する計算を行う。AIPD103bは、ダイ間出力ブロック223aを用いて、結果データをAIPD103cに送信する。AIPD103cは、ダイ間入力ブロック225aでAIPD103bから受信された結果データと、AIPD103cと関連付けられた、変更されたコンフィギュレーションデータとに基づいて、AI計算を含む、ニューラルネットワークの第3の層に関連する計算を行い、ダイ間出力ブロック227bを用いて、結果データをAIPD103fに送信する。AIPD103fは、ダイ間入力ブロック237aでAIPD103cから受信された結果データと、AIPD103fと関連付けられた、変更されたコンフィギュレーションデータとに基づいて、AI計算を含む、ニューラルネットワークの第4の層に関連する計算を行う。AIPD103f、ニューラルネットワークの最後の層と関連付けられたAIPD103は、AIPD103fからの結果データをメインプロセシングユニット101に送信するように構成されている。したがって、AIPUと関連付けられたコンフィギュレーションデータおよび/またはAIPUのAIPDのコンフィギュレーションデータを変更することによって、単一のAIPUを、異なるニューラルネットワークを処理するように再プログラム可能である。それゆえ、特注のASICの使用に関連する、無視できない経常外エンジニアリング費用をより効率的に償却可能であり、この特定のニューラルネットワークのタスクを処理するための特注のASICの設計に伴う設計時間費用をさらに減らすことができる。
入力ブロックおよびダイ間出力ブロック間の電気的な相互接続のためにさらなる領域を必要としない。
ジ306)を備える。各AIPD103において、方法300は、コンフィギュレーションデータを受信すること(ステージ308)を備える。方法300は、コンフィギュレーションデータに基づいて、AIPD103を構成すること(ステージ310)を備える。方法300は、メインプロセシングユニット101に応答を送信すること(ステージ312)を備える。
に送信する。AIPUによってニューラルネットワークタスクを処理する方法の例について、図4を参照して以下で説明する。
(ステージ418)を備える。本明細書で用いられる「ニューラルネットワークタスクの要求側」は、ホストコンピューティングデバイス内の他のプロセス、またはホストコンピューティングデバイスのエンドユーザであり得る。明瞭さを保ち明確な例を示すために2つのAIPD103のみが図4で示されているが、ニューラルネットワークタスクの実行において用いられるAIPD103の数は、少なくとも部分的に、ホストコンピューティングデバイスによって行われると予想されるニューラルネットワークタスクのボリュームによって決まる。
に示す方法400に対応する命令を含み得る。いくつかの実現例では、メモリ570は、コンピューティングシステム510によって提供されるバーチャルマシンまたはコンテナ実行環境でアクセス可能な仮想メモリまたはコンテナメモリをサポートする。
わせとする、またはそれらに含めることができる。また、コンピュータ記憶媒体は、1つもしくは複数の別々のコンポーネントまたは媒体(たとえば、複数のCD、ディスク、またはその他の記憶装置)とする、またはそれに含めることもできる。コンピュータ記憶媒体は、有形の非一時的なコンピュータ記憶媒体であってもよい。
上記の実現例におけるさまざまなシステムコンポーネントの分離は、全ての実現例においてこのような分離が必要であるものとして理解されるべきではなく、記載されているプログラムコンポーネントおよびシステムは、一般に、単一のソフトウェア製品に統合されてもよい、または複数のソフトウェア製品にパッケージングされてもよい、ということが理解されるべきである。
Claims (19)
- ニューラルネットワークの計算タスクを処理するためのシステムであって、
ニューラルネットワーク層に対応する人工知能処理ダイと、
前記人工知能処理ダイに連結されたプロセッサとを備え、前記プロセッサは、
前記人工知能処理ダイにおいて前記ニューラルネットワーク層を実現するために使用されるコンフィギュレーションを表す入力を選択し、
選択された前記入力を前記人工知能処理ダイに送信するように構成され、
前記人工知能処理ダイは、前記ニューラルネットワーク層に対するニューラルネットワーク処理動作を、選択された前記入力によって表される前記コンフィギュレーションに従って構成する、システム。 - 前記人工知能処理ダイは、選択された前記入力に基づいて前記人工知能処理ダイにおいて前記コンフィギュレーションを実現することに応じて、応答信号を前記プロセッサに送信するように構成されている、請求項1に記載のシステム。
- 前記人工知能処理ダイはさらに、選択された前記入力に基づいて前記ニューラルネットワーク処理動作を構成するときに、エラーの検出に応じてエラーメッセージを前記プロセッサに送信するように構成されている、請求項1または2に記載のシステム。
- 前記ニューラルネットワーク処理動作を構成することは、
前記人工知能処理ダイにおいて前記ニューラルネットワーク層を実現するための前記コンフィギュレーションを示すコンフィギュレーションデータを、前記人工知能処理ダイにおいて受信することと、
前記コンフィギュレーションデータに基づいて、前記人工知能処理ダイと前記システムの他の前記人工知能処理ダイとの間のダイ間通信路を決定することとを含む、請求項3に記載のシステム。 - 前記プロセッサは、前記人工知能処理ダイに関連付けられた固有の識別子に基づいて、前記コンフィギュレーションを表す前記入力を選択する、請求項1~4のいずれか1項に記載のシステム。
- 前記プロセッサは、前記人工知能処理ダイのホストインターフェースユニットを介して、選択された前記入力を前記人工知能処理ダイに送信する、請求項1~5のいずれか1項に記載のシステム。
- 前記プロセッサは、
前記人工知能処理ダイのためのコンフィギュレーションデータがアップデートされているかどうかを定期的に判断し、
前記人工知能処理ダイのための前記コンフィギュレーションデータがアップデートされていると判断することに応じて、アップデートされた前記コンフィギュレーションデータを前記人工知能処理ダイに送信するように構成されている、請求項1~6のいずれか1項に記載のシステム。 - i)前記コンフィギュレーションデータは、ホストコンピューティングデバイスのメモリに記憶され、
ii)前記プロセッサと前記人工知能処理ダイとの各々は、前記ホストコンピューティングデバイスの前記メモリから前記コンフィギュレーションデータを読出すように構成されている、請求項7に記載のシステム。 - 前記システムは、前記ホストコンピューティングデバイス内に収容されている、請求項8に記載のシステム。
- 前記人工知能処理ダイは、前記プロセッサによって前記人工知能処理ダイに送信される制御信号命令に基づいて、前記ホストコンピューティングデバイスの前記メモリから前記コンフィギュレーションデータを読出す、請求項9に記載のシステム。
- ニューラルネットワークの計算タスクを処理するための方法であって、
人工知能処理ダイに連結されたプロセッサが、前記人工知能処理ダイにおいてニューラルネットワーク層を実現するために使用されるコンフィギュレーションを表す入力を選択することと、
前記プロセッサが、選択された前記入力を前記人工知能処理ダイに送信することと、
前記人工知能処理ダイにおいて、前記ニューラルネットワーク層に対するニューラルネットワーク処理動作を、選択された前記入力によって表される前記コンフィギュレーションに従って構成することとを備える、方法。 - 前記人工知能処理ダイが、選択された前記入力に基づいて前記人工知能処理ダイにおいて前記コンフィギュレーションを実現することに応じて、応答信号を前記プロセッサに送信することをさらに備える、請求項11に記載の方法。
- 前記人工知能処理ダイが、選択された前記入力に基づいて前記ニューラルネットワーク処理動作を構成するときに、エラーの検出に応じてエラーメッセージを前記プロセッサに送信することをさらに備える、請求項11または12に記載の方法。
- 前記ニューラルネットワーク処理動作を構成することは、
前記人工知能処理ダイにおいて前記ニューラルネットワーク層を実現するための前記コンフィギュレーションを示すコンフィギュレーションデータを、前記人工知能処理ダイにおいて受信することと、
前記コンフィギュレーションデータに基づいて、前記人工知能処理ダイと他の前記人工知能処理ダイとの間のダイ間通信路を決定することとを含む、請求項13に記載の方法。 - 前記プロセッサが、前記人工知能処理ダイに関連付けられた固有の識別子に基づいて、前記コンフィギュレーションを表す前記入力を選択することをさらに備える、請求項11~14のいずれか1項に記載の方法。
- 前記プロセッサが、前記人工知能処理ダイのホストインターフェースユニットを介して、選択された前記入力を前記人工知能処理ダイに送信することをさらに備える、請求項11~15のいずれか1項に記載の方法。
- 前記プロセッサが、前記人工知能処理ダイのためのコンフィギュレーションデータがアップデートされているかどうかを定期的に判断することと、
前記プロセッサが、前記人工知能処理ダイのための前記コンフィギュレーションデータがアップデートされていると判断することに応じて、アップデートされた前記コンフィギュレーションデータを前記人工知能処理ダイに送信することとをさらに備える、請求項11~16のいずれか1項に記載の方法。 - i)前記コンフィギュレーションデータは、ホストコンピューティングデバイスのメモリに記憶され、
ii)前記プロセッサと前記人工知能処理ダイとの各々は、前記ホストコンピューティングデバイスの前記メモリから前記コンフィギュレーションデータを読出すように構成されている、請求項17に記載の方法。 - 前記人工知能処理ダイは、前記プロセッサによって前記人工知能処理ダイに送信される制御信号命令に基づいて、前記ホストコンピューティングデバイスの前記メモリから前記コンフィギュレーションデータを読出す、請求項18に記載の方法。
Applications Claiming Priority (6)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US15/819,753 US10936942B2 (en) | 2017-11-21 | 2017-11-21 | Apparatus and mechanism for processing neural network tasks using a single chip package with multiple identical dies |
| US15/819,753 | 2017-11-21 | ||
| JP2019563078A JP7091367B2 (ja) | 2017-11-21 | 2018-09-21 | 複数の同一のダイを有する単一のチップパッケージを用いてニューラルネットワークタスクを処理するための装置および機構 |
| PCT/US2018/052216 WO2019103782A1 (en) | 2017-11-21 | 2018-09-21 | Apparatus and mechanism for processing neural network tasks using a single chip package with multiple identical dies |
| JP2022096437A JP7473593B2 (ja) | 2017-11-21 | 2022-06-15 | 複数の同一のダイを有する単一のチップパッケージを用いてニューラルネットワークタスクを処理するための装置および機構 |
| JP2024064174A JP2024102091A (ja) | 2017-11-21 | 2024-04-11 | 複数の同一のダイを有する単一のチップパッケージを用いてニューラルネットワークタスクを処理するための装置および機構 |
Related Parent Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2024064174A Division JP2024102091A (ja) | 2017-11-21 | 2024-04-11 | 複数の同一のダイを有する単一のチップパッケージを用いてニューラルネットワークタスクを処理するための装置および機構 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2025131635A JP2025131635A (ja) | 2025-09-09 |
| JP7841160B2 true JP7841160B2 (ja) | 2026-04-06 |
Family
ID=63858084
Family Applications (4)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2019563078A Active JP7091367B2 (ja) | 2017-11-21 | 2018-09-21 | 複数の同一のダイを有する単一のチップパッケージを用いてニューラルネットワークタスクを処理するための装置および機構 |
| JP2022096437A Active JP7473593B2 (ja) | 2017-11-21 | 2022-06-15 | 複数の同一のダイを有する単一のチップパッケージを用いてニューラルネットワークタスクを処理するための装置および機構 |
| JP2024064174A Pending JP2024102091A (ja) | 2017-11-21 | 2024-04-11 | 複数の同一のダイを有する単一のチップパッケージを用いてニューラルネットワークタスクを処理するための装置および機構 |
| JP2025086567A Active JP7841160B2 (ja) | 2017-11-21 | 2025-05-23 | 複数の同一のダイを有する単一のチップパッケージを用いてニューラルネットワークタスクを処理するための装置および機構 |
Family Applications Before (3)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2019563078A Active JP7091367B2 (ja) | 2017-11-21 | 2018-09-21 | 複数の同一のダイを有する単一のチップパッケージを用いてニューラルネットワークタスクを処理するための装置および機構 |
| JP2022096437A Active JP7473593B2 (ja) | 2017-11-21 | 2022-06-15 | 複数の同一のダイを有する単一のチップパッケージを用いてニューラルネットワークタスクを処理するための装置および機構 |
| JP2024064174A Pending JP2024102091A (ja) | 2017-11-21 | 2024-04-11 | 複数の同一のダイを有する単一のチップパッケージを用いてニューラルネットワークタスクを処理するための装置および機構 |
Country Status (6)
| Country | Link |
|---|---|
| US (4) | US10936942B2 (ja) |
| EP (2) | EP3602318A1 (ja) |
| JP (4) | JP7091367B2 (ja) |
| KR (1) | KR102283469B1 (ja) |
| CN (1) | CN110651263A (ja) |
| WO (1) | WO2019103782A1 (ja) |
Families Citing this family (11)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US11164072B2 (en) | 2018-02-08 | 2021-11-02 | Western Digital Technologies, Inc. | Convolution engines for systolic neural network processor |
| US11769042B2 (en) | 2018-02-08 | 2023-09-26 | Western Digital Technologies, Inc. | Reconfigurable systolic neural network engine |
| CN110389824A (zh) * | 2018-04-20 | 2019-10-29 | 伊姆西Ip控股有限责任公司 | 处理计算任务的方法、设备和计算机程序产品 |
| US11625245B2 (en) * | 2018-09-28 | 2023-04-11 | Intel Corporation | Compute-in-memory systems and methods |
| EP4009183B1 (en) | 2018-10-18 | 2026-05-06 | Shanghai Cambricon Information Technology Co., Ltd | Network-on-chip data processing method and device |
| US11783176B2 (en) | 2019-03-25 | 2023-10-10 | Western Digital Technologies, Inc. | Enhanced storage device memory architecture for machine learning |
| US10929058B2 (en) | 2019-03-25 | 2021-02-23 | Western Digital Technologies, Inc. | Enhanced memory device architecture for machine learning |
| KR102147912B1 (ko) * | 2019-08-13 | 2020-08-25 | 삼성전자주식회사 | 프로세서 칩 및 그 제어 방법들 |
| WO2021202160A1 (en) * | 2020-03-30 | 2021-10-07 | Rambus Inc. | Stacked-die neural network with integrated high-bandwidth memory |
| US12462186B2 (en) | 2020-05-29 | 2025-11-04 | Advanced Micro Devices, Inc. | Stacked dies for machine learning accelerator |
| US20220383121A1 (en) * | 2021-05-25 | 2022-12-01 | Applied Materials, Inc. | Dynamic activation sparsity in neural networks |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5781702A (en) | 1995-06-07 | 1998-07-14 | Univ South Western | Hybrid chip-set architecture for artificial neural network system |
| JP2010109111A (ja) | 2008-10-30 | 2010-05-13 | Hitachi Ltd | 半導体集積回路 |
| US9710265B1 (en) | 2016-10-27 | 2017-07-18 | Google Inc. | Neural network compute tile |
Family Cites Families (26)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5956708U (ja) | 1982-10-08 | 1984-04-13 | 株式会社東芝 | 液体抵抗器 |
| JPH02236659A (ja) * | 1989-03-09 | 1990-09-19 | Fujitsu Ltd | 半導体情報処理装置 |
| FR2686175B1 (fr) | 1992-01-14 | 1996-12-20 | Andre Thepaut | Systeme de traitement de donnees multiprocesseur. |
| JPH06151694A (ja) * | 1992-10-30 | 1994-05-31 | Hitachi Ltd | 半導体装置を実装した電子装置 |
| US5568574A (en) * | 1995-06-12 | 1996-10-22 | University Of Southern California | Modulator-based photonic chip-to-chip interconnections for dense three-dimensional multichip module integration |
| US7152051B1 (en) | 2002-09-30 | 2006-12-19 | Michael Lamport Commons | Intelligent control with hierarchical stacked neural networks |
| US7068072B2 (en) | 2003-06-30 | 2006-06-27 | Xilinx, Inc. | Integrated circuit with interface tile for coupling to a stacked-die second integrated circuit |
| US7284226B1 (en) | 2004-10-01 | 2007-10-16 | Xilinx, Inc. | Methods and structures of providing modular integrated circuits |
| US7581198B2 (en) | 2006-10-07 | 2009-08-25 | Active-Semi, Inc. | Method and system for the modular design and layout of integrated circuits |
| JP2011236815A (ja) * | 2010-05-11 | 2011-11-24 | Toyota Motor Corp | 内燃機関の制御装置 |
| US10540588B2 (en) | 2015-06-29 | 2020-01-21 | Microsoft Technology Licensing, Llc | Deep neural network processing on hardware accelerators with stacked memory |
| US10818638B2 (en) | 2015-11-30 | 2020-10-27 | Pezy Computing K.K. | Die and package |
| US9805001B2 (en) * | 2016-02-05 | 2017-10-31 | Google Inc. | Matrix processing apparatus |
| US20170300807A1 (en) * | 2016-02-22 | 2017-10-19 | Aivitae LLC | Neural net computer system with wireless or optical connections between neural net computing nodes |
| US10360163B2 (en) * | 2016-10-27 | 2019-07-23 | Google Llc | Exploiting input data sparsity in neural network compute units |
| US9959247B1 (en) * | 2017-02-17 | 2018-05-01 | Google Llc | Permuting in a matrix-vector processor |
| US10108581B1 (en) * | 2017-04-03 | 2018-10-23 | Google Llc | Vector reduction processor |
| US11353868B2 (en) * | 2017-04-24 | 2022-06-07 | Intel Corporation | Barriers and synchronization for machine learning at autonomous machines |
| US10726514B2 (en) * | 2017-04-28 | 2020-07-28 | Intel Corporation | Compute optimizations for low precision machine learning operations |
| US10534607B2 (en) * | 2017-05-23 | 2020-01-14 | Google Llc | Accessing data in multi-dimensional tensors using adders |
| US10248908B2 (en) * | 2017-06-19 | 2019-04-02 | Google Llc | Alternative loop limits for accessing data in multi-dimensional tensors |
| US10175912B1 (en) * | 2017-07-05 | 2019-01-08 | Google Llc | Hardware double buffering using a special purpose computational unit |
| US10108538B1 (en) * | 2017-07-31 | 2018-10-23 | Google Llc | Accessing prologue and epilogue data |
| GB2568776B (en) * | 2017-08-11 | 2020-10-28 | Google Llc | Neural network accelerator with parameters resident on chip |
| US10373291B1 (en) * | 2018-01-31 | 2019-08-06 | Google Llc | Image transformation for machine learning |
| US10534578B1 (en) * | 2018-08-27 | 2020-01-14 | Google Llc | Multi-input floating-point adder |
-
2017
- 2017-11-21 US US15/819,753 patent/US10936942B2/en active Active
-
2018
- 2018-09-21 JP JP2019563078A patent/JP7091367B2/ja active Active
- 2018-09-21 EP EP18786508.4A patent/EP3602318A1/en not_active Withdrawn
- 2018-09-21 WO PCT/US2018/052216 patent/WO2019103782A1/en not_active Ceased
- 2018-09-21 KR KR1020197034133A patent/KR102283469B1/ko active Active
- 2018-09-21 EP EP23182760.1A patent/EP4273755A3/en active Pending
- 2018-09-21 CN CN201880033593.8A patent/CN110651263A/zh active Pending
-
2021
- 2021-02-26 US US17/186,598 patent/US12079711B2/en active Active
-
2022
- 2022-06-15 JP JP2022096437A patent/JP7473593B2/ja active Active
-
2024
- 2024-04-11 JP JP2024064174A patent/JP2024102091A/ja active Pending
- 2024-08-30 US US18/821,042 patent/US20250068897A1/en active Pending
-
2025
- 2025-01-17 US US19/029,287 patent/US20250238668A1/en active Pending
- 2025-05-23 JP JP2025086567A patent/JP7841160B2/ja active Active
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5781702A (en) | 1995-06-07 | 1998-07-14 | Univ South Western | Hybrid chip-set architecture for artificial neural network system |
| JP2010109111A (ja) | 2008-10-30 | 2010-05-13 | Hitachi Ltd | 半導体集積回路 |
| US9710265B1 (en) | 2016-10-27 | 2017-07-18 | Google Inc. | Neural network compute tile |
Also Published As
| Publication number | Publication date |
|---|---|
| US20210256361A1 (en) | 2021-08-19 |
| EP4273755A3 (en) | 2024-01-24 |
| US20250068897A1 (en) | 2025-02-27 |
| EP3602318A1 (en) | 2020-02-05 |
| KR20190139991A (ko) | 2019-12-18 |
| KR102283469B1 (ko) | 2021-07-30 |
| JP2025131635A (ja) | 2025-09-09 |
| JP7091367B2 (ja) | 2022-06-27 |
| JP2021504770A (ja) | 2021-02-15 |
| JP7473593B2 (ja) | 2024-04-23 |
| JP2024102091A (ja) | 2024-07-30 |
| US20190156187A1 (en) | 2019-05-23 |
| US12079711B2 (en) | 2024-09-03 |
| WO2019103782A1 (en) | 2019-05-31 |
| EP4273755A2 (en) | 2023-11-08 |
| CN110651263A (zh) | 2020-01-03 |
| US10936942B2 (en) | 2021-03-02 |
| US20250238668A1 (en) | 2025-07-24 |
| JP2022137046A (ja) | 2022-09-21 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7841160B2 (ja) | 複数の同一のダイを有する単一のチップパッケージを用いてニューラルネットワークタスクを処理するための装置および機構 | |
| US20230222331A1 (en) | Deep learning hardware | |
| CN108416436B (zh) | 使用多核心处理模块进行神经网络划分的方法及其系统 | |
| JP7506472B2 (ja) | アプリケーション関数を装置にオフロードするためのシステム及び方法 | |
| CN110689138B (zh) | 运算方法、装置及相关产品 | |
| CN111291880B (zh) | 计算装置以及计算方法 | |
| CN109376861B (zh) | 一种用于执行全连接层神经网络训练的装置和方法 | |
| CN109242094B (zh) | 用于执行人工神经网络正向运算的装置和方法 | |
| CN106991478B (zh) | 用于执行人工神经网络反向训练的装置和方法 | |
| CN109375951B (zh) | 一种用于执行全连接层神经网络正向运算的装置和方法 | |
| CN107704267A (zh) | 一种卷积神经网络运算指令及其方法 | |
| WO2017185389A1 (zh) | 一种用于执行矩阵乘运算的装置和方法 | |
| CN107886167A (zh) | 神经网络运算装置及方法 | |
| CN111027690B (zh) | 执行确定性推理的组合处理装置、芯片和方法 | |
| US10877925B2 (en) | Vector processor with vector first and multiple lane configuration | |
| CN116402091A (zh) | 面向人工智能芯片的混合引擎智能计算方法和装置 | |
| CN110647984B (zh) | 芯片、集成处理设备及其操作方法 | |
| WO2023073824A1 (ja) | 深層学習推論システムおよび推論サービング方法 | |
| CN117093263A (zh) | 处理器、芯片、板卡及方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20250618 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20250618 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20260224 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20260325 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7841160 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |