JP7841149B2 - 埋め込み層計算の加速化 - Google Patents
埋め込み層計算の加速化Info
- Publication number
- JP7841149B2 JP7841149B2 JP2025061901A JP2025061901A JP7841149B2 JP 7841149 B2 JP7841149 B2 JP 7841149B2 JP 2025061901 A JP2025061901 A JP 2025061901A JP 2025061901 A JP2025061901 A JP 2025061901A JP 7841149 B2 JP7841149 B2 JP 7841149B2
- Authority
- JP
- Japan
- Prior art keywords
- processor
- addresses
- data
- embedding
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/02—Digital function generators
- G06F1/03—Digital function generators working, at least partly, by table look-up
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5083—Techniques for rebalancing the load in a distributed system
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0495—Quantised networks; Sparse networks; Compressed networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/063—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Neurology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Advance Control (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
- Multi Processors (AREA)
- Complex Calculations (AREA)
- Amplifiers (AREA)
Description
本願は、2019年10月2日に出願された米国仮出願番号第62/909,667号の利益を主張し、米国仮出願番号第62/909,667号は、全文が引用によって本明細書に援用される。
本明細書は、一般に、回路を使用してニューラルネットワーク計算を実行することに関する。
本文献には、人工ニューラルネットワークの埋め込み層の計算を加速させるための技術が記載されている。この技術は、アドレスのリストに対して重複排除演算を実行するように構成された回路を含むコンピューティングシステム(大規模分散システムなど)において使用することができる。重複排除演算は、ニューラルネットワークの埋め込み層での入力の処理中(埋め込み層の例示的なフォワードパス計算中など)に分散システム上の負荷不均衡を減少させるために実行される。
の入力から上記層の出力を生成する。
るステップは、上記入力特徴の複数のセットにわたって、特定の入力についての重複アドレスに対する上記固有の識別子の上記逆マッピングを決定するステップを含む。
内のさまざまな特徴に対して、同一の特徴値をフェッチする必要があり得る。埋め込みを計算または更新する際に(たとえば、メモリ内の同一のアドレスから)同一の入力値を複数回フェッチする必要があるので、アドレスの重複発生を除去する方法は、分散システム上の計算負荷を減少させて、ニューラルネットワークの埋め込み層の計算を向上または加速させるのを手助けすることができる。
詳細な説明
本明細書には、分散コンピューティングシステム内のプロセッサ負荷不均衡に起因して発生し得る処理遅延を緩和するために埋め込み層計算を加速させるための技術が記載されている。たとえば、これらの遅延は、多層ニューラルネットワークの埋め込み層の出力を生成するためのプロセッサ計算中に発生し得る。具体的には、分散システムの特定のプロ
セッサまたはコアが、埋め込みを生成するために相当数のルックアップおよび計算演算(たとえば、検索された値の削減または連結)を実行しなければならない場合に、この特定のプロセッサは、負荷不均衡に対応する処理遅延を受ける可能性がある。
、それらの特徴の各々について個々の埋め込みを検索するように動作可能である。また、このシステムは、たとえば埋め込み値の平均値を計算することによって、検索された埋め込みを組み合わせて、当該特徴タイプについて最終的な埋め込みを生成するように動作可能である。
1つまたは複数の出力特徴セットに対応し得る。
の実現例において、マルチコア処理ユニット104は、更新された密行列を対応する疎要素に変換して、データシャード106a~106kに格納された1つまたは複数の疎要素(たとえば、重み)をそれに従って更新するように動作可能である。
の用語または単語など)間の関係を定義するのに使用することができる数値(たとえば、浮動小数点値)の密ベクトルに対する入力のバッチ内の個別の入力のマッピングである。所与のバッチ内の1つの入力では、埋め込みはベクトルであり得るが、入力のバッチ全体では、埋め込みは行列(たとえば、ベクトルの集合体)であり得る。いくつかの実現例において、埋め込み値のベクトルは、訓練中にニューラルネットワークによって学習される訓練可能な重みに対応する。学習された重みは、埋め込みテーブルに格納された密ベクトルを調べることによって1つまたは複数の単語を符号化することができ、密ベクトルは、特定の単語に対応する。複数の密ベクトルは、たとえば言語処理のために単語のシーケンスを認識することに関連する特定のタスクまたは機能を実行するようにニューラルネットワークを訓練するのに使用される密行列に対応し得る。
は複数の重複アドレスを識別する。たとえば、単一の埋め込みテーブルは、複数の特徴によって参照されることができる。そのため、複数の異なる特徴にわたって重複アドレスが存在し得る。たとえば、埋め込みテーブルTは、特徴F1およびF2によって参照されることができる。この例では、アドレス(たとえば、[99])は、(1つまたは複数のサンプルにおける)F1の入力内および(1つまたは複数のサンプルにおける)F2の入力内で繰り返され得る。
る特定のメモリオフセットについてのものであり得る。
セッサ3は、データ要素(アドレス[912]に格納された入力についての固有の重み値など)をルックアップしてローカルに削減して、例示的な重みベクトル[f2]を生成するように構成される。
することができる。これらの技術も、システム100の負荷均衡およびスケーラビリティの向上につながる。
ワーク520上の別のプロセッサ104nにブロードキャストするように構成され得る。
ッサによる処理のために、第1の入力を取得するための要求をリモートプロセッサに提供することができる。この要求は、固有の識別子に対応する第1の入力についてのアドレスを含み得る。場合によっては、この要求とアドレスとは、別々に送信されてもよいが、同時にまたは並行して送信されてもよい。場合によっては、この要求とアドレスとは、シーケンシャルに、すなわち一方が他方に先行するように送信されてもよい。
ことを含み得る。テーブルに関連付けられたデータは、行列の形式で表すことができる。システム100のプロセッサおよびコンピューティングリソースを使用して、行列乗算を含む線形代数アルゴリズムに基づいてデータを操作することができる。行列は、一次元ベクトルであってもよく、または多次元行列であってもよい。行列は、データ構造(データベーステーブルまたは変数など)によって表されてもよい。埋め込みテーブルは、たとえば行および列次元でシャード化されて、マルチコア処理ユニット104を形成する複数のプロセッサの中の特定のプロセッサにマッピングされたメモリの一部に格納され得る。
て相互接続されている複数のコンピュータで実行されるようにデプロイされてもよい。
ルウェアコンポーネント(たとえば、アプリケーションサーバ)を含むコンピューティングシステムで実現されてもよく、または、フロントエンドコンポーネント(たとえば、ユーザが本明細書に記載されている主題の実現例と相互作用することができるグラフィカルユーザインターフェイスもしくはウェブブラウザを有するクライアントコンピュータ)を含むコンピューティングシステムで実現されてもよく、または、1つもしくは複数のこのようなバックエンドコンポーネント、ミドルウェアコンポーネントもしくはフロントエンドコンポーネントの任意の組み合わせを含むコンピューティングシステムで実現されてもよい。システムのこれらのコンポーネントは、デジタルデータ通信の任意の形式または媒体(たとえば、通信ネットワーク)によって相互接続されることができる。通信ネットワークの例としては、ローカルエリアネットワーク(「LAN」)およびワイドエリアネットワーク(「WAN」)(たとえば、インターネット)が挙げられる。
Claims (12)
- 方法であって、
第1のプロセッサが、メモリ内の場所のアドレスのセットを識別するステップと、
前記第1のプロセッサが、前記アドレスのセットに対して重複排除演算を実行するステップとを備え、前記重複排除演算を実行するステップは、
前記アドレスのセット内の重複アドレスを識別することと、
前記重複アドレスにマッピングされる固有の識別子を生成することと、
前記固有の識別子に基づいて前記セットから前記重複アドレスをフィルタリングすることと、によってなされ、前記方法はさらに、
第2のプロセッサが、前記固有の識別子に対応する前記メモリ内の場所からデータを検索するステップと、
前記第2のプロセッサを使用して前記データを処理することに応答して出力を生成するステップとを備える、方法。 - 前記データは、i)入力特徴のセットと、ii)ニューラルネットワーク層の訓練可能な重みを表す値のベクトルとを含み、
前記固有の識別子は、入力特徴の特徴値を前記セットに格納する記憶場所の重複アドレスのためのものである、請求項1に記載の方法。 - 前記アドレスのセット内の重複アドレスを識別することは、
前記入力特徴のセットにおいて、同一の特徴値を有する2つまたはそれ以上の入力特徴を識別することを含む、請求項2に記載の方法。 - 前記値のベクトルは、前記メモリの複数のデータシャードにわたって格納される埋め込みテーブルの埋め込みである、請求項2に記載の方法。
- 前記ニューラルネットワーク層は、人工ニューラルネットワークの埋め込み層であり、前記第2のプロセッサを使用して前記データを処理することは、
前記データの前記特徴値を前記埋め込み層への入力として提供することと、
前記ニューラルネットワークの前記埋め込み層において前記データを処理することとを含む、請求項4に記載の方法。 - 前記出力を生成するステップは、1つまたは複数の埋め込み特徴ベクトルを前記埋め込み層の出力として生成するステップを含む、請求項5に記載の方法。
- 前記固有の識別子を生成することは、
前記重複アドレスのうちの1つのメモリオフセットに基づいてハッシュIDを生成することと、
前記ハッシュIDに基づいて前記固有の識別子を生成することとを含む、請求項1~6のいずれか1項に記載の方法。 - 前記方法は、前記第1のプロセッサと前記第2のプロセッサとを含む分散されたプロセッサのセットを含む集積回路を使用して実行される、請求項1~7のいずれか1項に記載の方法。
- 前記重複排除演算を実行するステップは、
前記第1のプロセッサと前記第2のプロセッサとの間の負荷不均衡を緩和するために前記アドレスのセット内のアドレスの重複発生を除去するステップを含む、請求項8に記載の方法。 - 前記重複排除演算を実行するステップは、
少なくとも前記分散されたプロセッサのセットの前記第2のプロセッサの全体的な計算負荷を減少させるために前記アドレスのセット内のアドレスの重複発生を除去するステップを含む、請求項8に記載の方法。 - 第1のプロセッサおよび第2のプロセッサに請求項1~10のいずれか1項に記載された方法を実行させる、プログラム。
- システムであって、
複数のプロセッサと、
動作を実行させるように前記複数のプロセッサのうちの1つ以上によって実行可能な命令を格納するための非一時的な機械読取可能媒体とを備え、前記動作は、
第1のプロセッサが、メモリ内の場所のアドレスのセットを識別することと、
前記第1のプロセッサが、前記アドレスのセットに対して重複排除演算を実行することとを含み、前記重複排除演算を実行することは、
前記アドレスのセット内の重複アドレスを識別することと、
前記重複アドレスにマッピングされる固有の識別子を生成することと、
前記固有の識別子に基づいて前記セットから前記重複アドレスをフィルタリングすることと、によってなされ、前記動作はさらに、
第2のプロセッサが、前記重複アドレスが前記セットからフィルタリングされた後に、前記固有の識別子を使用して、前記アドレスのセット内のアドレスによって識別される記憶場所からデータを検索することと、
前記第2のプロセッサを使用して前記データを処理することに応答して出力を生成することとを含む、システム。
Applications Claiming Priority (5)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201962909667P | 2019-10-02 | 2019-10-02 | |
| US62/909,667 | 2019-10-02 | ||
| PCT/US2020/053442 WO2021067376A1 (en) | 2019-10-02 | 2020-09-30 | Accelerated embedding layer computations |
| JP2022511014A JP7325615B2 (ja) | 2019-10-02 | 2020-09-30 | 埋め込み層計算の加速化 |
| JP2023125258A JP7662719B2 (ja) | 2019-10-02 | 2023-08-01 | 埋め込み層計算の加速化 |
Related Parent Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2023125258A Division JP7662719B2 (ja) | 2019-10-02 | 2023-08-01 | 埋め込み層計算の加速化 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2025114554A JP2025114554A (ja) | 2025-08-05 |
| JP7841149B2 true JP7841149B2 (ja) | 2026-04-06 |
Family
ID=72744594
Family Applications (3)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2022511014A Active JP7325615B2 (ja) | 2019-10-02 | 2020-09-30 | 埋め込み層計算の加速化 |
| JP2023125258A Active JP7662719B2 (ja) | 2019-10-02 | 2023-08-01 | 埋め込み層計算の加速化 |
| JP2025061901A Active JP7841149B2 (ja) | 2019-10-02 | 2025-04-03 | 埋め込み層計算の加速化 |
Family Applications Before (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2022511014A Active JP7325615B2 (ja) | 2019-10-02 | 2020-09-30 | 埋め込み層計算の加速化 |
| JP2023125258A Active JP7662719B2 (ja) | 2019-10-02 | 2023-08-01 | 埋め込み層計算の加速化 |
Country Status (9)
| Country | Link |
|---|---|
| US (3) | US11651209B1 (ja) |
| EP (2) | EP3800590B1 (ja) |
| JP (3) | JP7325615B2 (ja) |
| KR (1) | KR102787012B1 (ja) |
| CN (2) | CN121168543A (ja) |
| DK (1) | DK3800590T3 (ja) |
| FI (1) | FI3800590T3 (ja) |
| TW (1) | TWI895288B (ja) |
| WO (1) | WO2021067376A1 (ja) |
Families Citing this family (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP4229511A1 (en) * | 2020-10-16 | 2023-08-23 | Neuroblade, Ltd. | Memory appliances for memory intensive operations |
| CN115730116A (zh) * | 2021-08-31 | 2023-03-03 | 华为技术有限公司 | 一种数据检索方法及相关设备 |
| KR102609562B1 (ko) * | 2021-10-15 | 2023-12-05 | 인하대학교 산학협력단 | 추천 시스템의 임베딩을 위한 하이브리드 니어-메모리 프로세싱 구조 및 방법 |
| US12136138B2 (en) | 2021-11-11 | 2024-11-05 | Samsung Electronics Co., Ltd. | Neural network training with acceleration |
| US12333625B2 (en) * | 2021-11-11 | 2025-06-17 | Samsung Electronics Co., Ltd. | Neural network training with acceleration |
| CN114861911B (zh) * | 2022-05-19 | 2023-04-07 | 北京百度网讯科技有限公司 | 深度学习模型的训练方法、装置、系统、设备和介质 |
| KR102515159B1 (ko) * | 2022-07-12 | 2023-03-29 | 인하대학교 산학협력단 | 딥러닝 기반 추천 시스템에서 메모리 크기와 에너지를 줄일 수 있는 임베딩의 니어-메모리 프로세싱 방법 및 시스템 |
| CN117318892B (zh) * | 2023-11-27 | 2024-04-02 | 阿里云计算有限公司 | 计算系统、数据处理方法、网卡、主机及存储介质 |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20140164710A1 (en) | 2012-12-11 | 2014-06-12 | International Business Machines Corporation | Virtual machines failover |
| JP2018181173A (ja) | 2017-04-20 | 2018-11-15 | 富士通株式会社 | ストレージ制御装置、及びストレージ制御プログラム |
Family Cites Families (52)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS628271A (ja) * | 1985-07-03 | 1987-01-16 | Nec Corp | 多次元空間検索システム |
| AU2001249805A1 (en) | 2000-04-03 | 2001-10-15 | 3-Dimensional Pharmaceuticals, Inc. | Method, system, and computer program product for representing object relationships in a multidimensional space |
| JP5529863B2 (ja) | 2008-07-17 | 2014-06-25 | ビーエーエスエフ ソシエタス・ヨーロピア | 複数層複合体を連続的に製造するための方法 |
| US8380647B2 (en) | 2009-08-14 | 2013-02-19 | Xerox Corporation | Training a classifier by dimension-wise embedding of training data |
| JP6161396B2 (ja) | 2013-05-15 | 2017-07-12 | オリンパス株式会社 | 演算装置 |
| US9304971B2 (en) * | 2013-06-27 | 2016-04-05 | International Business Machines Corporation | Lookup table sharing for memory-based computing |
| CN106663060B (zh) * | 2014-10-07 | 2019-11-19 | 谷歌有限责任公司 | 用于缓存线路去重的方法和系统 |
| US9369374B1 (en) * | 2015-02-03 | 2016-06-14 | Google Inc. | Mesh network addressing |
| EP3091450B1 (en) * | 2015-05-06 | 2017-04-05 | Örjan Vestgöte | Method and system for performing binary searches |
| US10083395B2 (en) * | 2015-05-21 | 2018-09-25 | Google Llc | Batch processing in a neural network processor |
| US10095631B2 (en) * | 2015-12-10 | 2018-10-09 | Arm Limited | System address map for hashing within a chip and between chips |
| US10832134B2 (en) * | 2015-12-10 | 2020-11-10 | Deepmind Technologies Limited | Augmenting neural networks with external memory |
| TWI567628B (zh) | 2016-01-20 | 2017-01-21 | Long press the message immediately after the search method | |
| US10885426B2 (en) * | 2016-02-05 | 2021-01-05 | Deepmind Technologies Limited | Augmenting neural networks with external memory |
| US11468290B2 (en) * | 2016-06-30 | 2022-10-11 | Canon Kabushiki Kaisha | Information processing apparatus, information processing method, and non-transitory computer-readable storage medium |
| KR101884913B1 (ko) * | 2016-08-09 | 2018-08-02 | 고려대학교 산학협력단 | 별도의 가상 영역으로 관리되는 복수의 정보 저장 테이블을 가지는 메모리 장치 및 그의 제어 방법 |
| KR20180033670A (ko) * | 2016-09-26 | 2018-04-04 | 에스케이하이닉스 주식회사 | 반도체 메모리 장치 및 그의 동작 방법 |
| CN110023963B (zh) | 2016-10-26 | 2023-05-30 | 渊慧科技有限公司 | 使用神经网络处理文本序列 |
| US10360163B2 (en) * | 2016-10-27 | 2019-07-23 | Google Llc | Exploiting input data sparsity in neural network compute units |
| CN109952583A (zh) | 2016-11-15 | 2019-06-28 | 谷歌有限责任公司 | 神经网络的半监督训练 |
| US11636314B2 (en) | 2016-11-15 | 2023-04-25 | Google Llc | Training neural networks using a clustering loss |
| US20180150256A1 (en) | 2016-11-29 | 2018-05-31 | Intel Corporation | Technologies for data deduplication in disaggregated architectures |
| JP6823495B2 (ja) * | 2017-02-27 | 2021-02-03 | 株式会社日立製作所 | 情報処理装置および画像認識装置 |
| US10261786B2 (en) * | 2017-03-09 | 2019-04-16 | Google Llc | Vector processing unit |
| EP4657392A3 (en) | 2017-03-17 | 2026-01-28 | Google Llc | Mirror loss neural networks |
| US10902312B2 (en) | 2017-03-28 | 2021-01-26 | Qualcomm Incorporated | Tracking axes during model conversion |
| WO2018213840A1 (en) | 2017-05-19 | 2018-11-22 | Google Llc | Depthwise separable convolutions for neural machine translation |
| US10019668B1 (en) * | 2017-05-19 | 2018-07-10 | Google Llc | Scheduling neural network processing |
| US10990899B2 (en) | 2017-08-11 | 2021-04-27 | Microsoft Technology Licensing, Llc | Deep and wide machine learned model for job recommendation |
| US10943171B2 (en) | 2017-09-01 | 2021-03-09 | Facebook, Inc. | Sparse neural network training optimization |
| US20190073580A1 (en) | 2017-09-01 | 2019-03-07 | Facebook, Inc. | Sparse Neural Network Modeling Infrastructure |
| GB2567190B (en) * | 2017-10-05 | 2020-02-26 | Advanced Risc Mach Ltd | Error recovery for intra-core lockstep mode |
| US10997065B2 (en) * | 2017-11-13 | 2021-05-04 | SK Hynix Inc. | Memory system and operating method thereof |
| US20190164036A1 (en) * | 2017-11-29 | 2019-05-30 | Electronics And Telecommunications Research Institute | Method and apparatus for generating address of data of artificial neural network |
| US10678508B2 (en) * | 2018-03-23 | 2020-06-09 | Amazon Technologies, Inc. | Accelerated quantized multiply-and-add operations |
| US11507846B2 (en) | 2018-03-26 | 2022-11-22 | Nvidia Corporation | Representing a neural network utilizing paths within the network to improve a performance of the neural network |
| KR102619954B1 (ko) * | 2018-03-29 | 2024-01-02 | 삼성전자주식회사 | 데이터를 처리하기 위한 방법 및 이를 지원하는 전자 장치 |
| US10621489B2 (en) * | 2018-03-30 | 2020-04-14 | International Business Machines Corporation | Massively parallel neural inference computing elements |
| US11481612B1 (en) * | 2018-04-20 | 2022-10-25 | Perceive Corporation | Storage of input values across multiple cores of neural network inference circuit |
| CN108447520B (zh) * | 2018-05-03 | 2023-10-13 | 长鑫存储技术有限公司 | 存储器电路装置及存储器检测方法 |
| KR102524804B1 (ko) * | 2019-01-04 | 2023-04-24 | 삼성전자주식회사 | 원-타임 프로그램가능한 메모리 셀, 및 이를 구비하는 otp 메모리 및 메모리 시스템 |
| SE543186C2 (en) * | 2019-01-11 | 2020-10-20 | Zeropoint Tech Ab | Systems, methods and devices for eliminating duplicates and value redundancy in computer memories |
| EP3953866A1 (en) * | 2019-04-09 | 2022-02-16 | Chengdu Synsense Technology Co., Ltd. | Event-driven spiking convolutional neural network |
| US11227120B2 (en) * | 2019-05-02 | 2022-01-18 | King Fahd University Of Petroleum And Minerals | Open domain targeted sentiment classification using semisupervised dynamic generation of feature attributes |
| KR102815137B1 (ko) * | 2019-06-25 | 2025-06-02 | 에스케이하이닉스 주식회사 | 메모리 시스템 |
| EP3767486B1 (en) * | 2019-07-19 | 2023-03-22 | Microsoft Technology Licensing, LLC | Multi-record index structure for key-value stores |
| EP3786959B1 (en) * | 2019-08-30 | 2024-12-04 | TTTech Computertechnik Aktiengesellschaft | Method of error detection in a ternary content addressable memory |
| US11429573B2 (en) * | 2019-10-16 | 2022-08-30 | Dell Products L.P. | Data deduplication system |
| US11620503B2 (en) * | 2020-03-18 | 2023-04-04 | Arm Limited | Neural network processing |
| US11212219B1 (en) * | 2020-06-26 | 2021-12-28 | Lenovo Enterprise Solutions (Singapore) Pte. Ltd. | In-band telemetry packet size optimization |
| US12164924B2 (en) * | 2020-09-25 | 2024-12-10 | Advanced Micro Devices, Inc. | Compression metadata assisted computation |
| US20240396568A1 (en) * | 2024-08-02 | 2024-11-28 | Intel Corporation | Adaptive analog partial sum accumulation technology for energy-efficient compute-in-memory |
-
2019
- 2019-10-21 US US16/659,527 patent/US11651209B1/en active Active
-
2020
- 2020-09-30 CN CN202511287322.3A patent/CN121168543A/zh active Pending
- 2020-09-30 CN CN202080060592.XA patent/CN114503128B/zh active Active
- 2020-09-30 TW TW109134099A patent/TWI895288B/zh active
- 2020-09-30 WO PCT/US2020/053442 patent/WO2021067376A1/en not_active Ceased
- 2020-09-30 KR KR1020227005451A patent/KR102787012B1/ko active Active
- 2020-09-30 JP JP2022511014A patent/JP7325615B2/ja active Active
- 2020-10-02 DK DK20199770.7T patent/DK3800590T3/da active
- 2020-10-02 EP EP20199770.7A patent/EP3800590B1/en active Active
- 2020-10-02 FI FIEP20199770.7T patent/FI3800590T3/fi active
- 2020-10-02 EP EP24207721.2A patent/EP4471664A3/en active Pending
-
2023
- 2023-04-21 US US18/305,297 patent/US11948086B2/en active Active
- 2023-08-01 JP JP2023125258A patent/JP7662719B2/ja active Active
-
2024
- 2024-02-20 US US18/582,294 patent/US12282853B2/en active Active
-
2025
- 2025-04-03 JP JP2025061901A patent/JP7841149B2/ja active Active
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20140164710A1 (en) | 2012-12-11 | 2014-06-12 | International Business Machines Corporation | Virtual machines failover |
| JP2018181173A (ja) | 2017-04-20 | 2018-11-15 | 富士通株式会社 | ストレージ制御装置、及びストレージ制御プログラム |
Also Published As
| Publication number | Publication date |
|---|---|
| CN121168543A (zh) | 2025-12-19 |
| KR102787012B1 (ko) | 2025-03-25 |
| US11651209B1 (en) | 2023-05-16 |
| US11948086B2 (en) | 2024-04-02 |
| US12282853B2 (en) | 2025-04-22 |
| TW202131236A (zh) | 2021-08-16 |
| DK3800590T3 (da) | 2025-03-03 |
| EP4471664A2 (en) | 2024-12-04 |
| EP3800590A1 (en) | 2021-04-07 |
| CN114503128B (zh) | 2025-10-10 |
| TWI895288B (zh) | 2025-09-01 |
| WO2021067376A1 (en) | 2021-04-08 |
| US20230376759A1 (en) | 2023-11-23 |
| JP2023162181A (ja) | 2023-11-08 |
| JP2025114554A (ja) | 2025-08-05 |
| EP4471664A3 (en) | 2024-12-11 |
| JP7662719B2 (ja) | 2025-04-15 |
| JP7325615B2 (ja) | 2023-08-14 |
| US20240273363A1 (en) | 2024-08-15 |
| EP3800590B1 (en) | 2024-12-04 |
| JP2022550254A (ja) | 2022-12-01 |
| FI3800590T3 (fi) | 2025-03-03 |
| KR20220034236A (ko) | 2022-03-17 |
| CN114503128A (zh) | 2022-05-13 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7841149B2 (ja) | 埋め込み層計算の加速化 | |
| CN112101190B (zh) | 一种遥感图像分类方法、存储介质及计算设备 | |
| EP3732631B1 (en) | Neural architecture search for dense image prediction tasks | |
| US12228497B2 (en) | Determining material properties based on machine learning models | |
| TWI781509B (zh) | 用於將稀疏元素變換為一密集矩陣之系統及方法,以及非暫時性機器可讀儲存裝置 | |
| JP2020061167A (ja) | 疎要素を密行列に変換するためのシステムおよび方法 | |
| JP2023508812A (ja) | ニューラルネットワーク計算を加速するためのハードウェア回路 | |
| TWI758223B (zh) | 具有動態最小批次尺寸之運算方法,以及用於執行該方法之運算系統及電腦可讀儲存媒體 | |
| WO2023104200A1 (en) | Systems, apparatuses, methods, and non-transitory computer-readable storage devices for artificial-intelligence model training using hybrid shuffling of training data | |
| Wang et al. | A vector processing method applicable to convolutional algorithms executed in digital signal processors | |
| HK40072706A (en) | Accelerated embedding layer computations | |
| WO2022082493A1 (en) | Method and system for embedding with smart memory pool | |
| JP2023024960A (ja) | 効率的なニューラルネットワーク実行のためのメモリ使用の最適化 | |
| Faizan et al. | Implementation of Deep Learning Models on an SoC-FPGA Device for Real-Time Music Genre Classification. Technologies 2023, 11, 91 | |
| HK40098120A (zh) | 图像检索方法、装置、电子设备、存储介质及程序产品 | |
| WO2026039089A1 (en) | Efficient attention in transformer neural networks using state space models | |
| CN121434257A (zh) | 搜索方法、装置、设备及存储介质 | |
| CN111209529A (zh) | 一种布尔型数据特征增量更新方法及装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20250428 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20250428 |
|
| TRDD | Decision of grant or rejection written | ||
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20260226 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20260303 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20260325 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7841149 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |