JP7408533B2 - 情報処理装置、情報処理方法およびプログラム - Google Patents
情報処理装置、情報処理方法およびプログラム Download PDFInfo
- Publication number
- JP7408533B2 JP7408533B2 JP2020204346A JP2020204346A JP7408533B2 JP 7408533 B2 JP7408533 B2 JP 7408533B2 JP 2020204346 A JP2020204346 A JP 2020204346A JP 2020204346 A JP2020204346 A JP 2020204346A JP 7408533 B2 JP7408533 B2 JP 7408533B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- computing device
- task
- execution
- information processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 42
- 238000003672 processing method Methods 0.000 title claims description 4
- 238000012545 processing Methods 0.000 claims description 58
- 238000000034 method Methods 0.000 claims description 50
- 238000013527 convolutional neural network Methods 0.000 claims description 39
- 230000008569 process Effects 0.000 claims description 25
- 230000004044 response Effects 0.000 claims description 17
- 238000013528 artificial neural network Methods 0.000 claims description 10
- 238000004891 communication Methods 0.000 description 34
- 238000004364 calculation method Methods 0.000 description 32
- 238000010586 diagram Methods 0.000 description 15
- 230000005540 biological transmission Effects 0.000 description 7
- 230000000052 comparative effect Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012546 transfer Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000011960 computer-aided design Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/48—Program initiating; Program switching, e.g. by interrupt
- G06F9/4806—Task transfer initiation or dispatching
- G06F9/4843—Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
- G06F9/4881—Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
- G06F9/5038—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the execution order of a plurality of tasks, e.g. taking priority or time dependency constraints into consideration
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5061—Partitioning or combining of resources
- G06F9/5066—Algorithms for mapping a plurality of inter-dependent sub-tasks onto a plurality of physical CPUs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5083—Techniques for rebalancing the load in a distributed system
- G06F9/5088—Techniques for rebalancing the load in a distributed system involving task migration
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2209/00—Indexing scheme relating to G06F9/00
- G06F2209/50—Indexing scheme relating to G06F9/50
- G06F2209/5017—Task decomposition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
- Multi Processors (AREA)
Description
・N体問題を部分問題に分割して解く際にタスクを計算ユニットに分配する技術
・畳み込みニューラルネットワーク(Convolutional Neural Network:CNN)の畳み込み(Convolution)レイヤを含む複数のレイヤを1つにまとめ、まとめたレイヤを行方向(高さ方向)および列方向(幅方向)で分割した複数のFused Tile(FT)それぞれを、コンピュータクラスタ上で並列に計算する技術(Fused Tile Partitioning:FTP)
・複数の計算装置200からの画像を同時に処理中である。
・CNNが枝分かれする構造を有する。
・タスクTA’の計算の種別
・タスクTA’で処理する部分データ(入力特徴マップのうち、タスクTA’で必要となるデータなど)
・補助データ(タスクTA’以外のタスクでの途中計算のうちタスクTA’の処理に必要な部分、周囲のタスクが未実行か否かを示す情報など)
・タスクTA’の実行が終了したことを示す情報
・タスクTA’の処理結果(出力特徴マップなど)
・補助データ(実行指示に含まれる補助データである周辺タスクの実行状態から判定した、他の計算装置200で再利用される可能性がある途中計算の結果など)
・計算に用いるデータ(特徴マップなど)は、各計算装置に分散して記憶する。
・タスクの実行指示、タスクの終了の通知(応答)は、計算装置と管理装置との間で通信する(通信回数=2回)。
・実行が指示されたタスクに必要なデータは、計算装置間で送受信する(通信回数=2回)。
ニューラルネットワークの分散処理するレイヤのタスクは、FTPの手法により得られるFTを処理するタスク、すなわち、畳み込みレイヤを少なくとも含む複数のレイヤを結合したレイヤを行方向および列方向で分割した複数のFTをそれぞれ処理する複数のタスクであってもよい。
実行制御部102は、1つの割り当てられたタスクではなく複数の割り当てられたタスクを連続して実行するように実行指示を送信してもよい。例えば実行制御部102は、複数のタスクで用いる部分データ(入力特徴マップ)および補助データなどを含む実行指示を、複数のタスクを割り当てた計算装置200に送信する。管理装置100(受信部111)は、計算装置200から、複数のタスクによる1つの処理結果(出力特徴マップ(および補助データを含む応答を受信する。複数のタスクは、相互に隣接する複数のタスクであってもよい。この場合、隣接するタスクで使用するデータを示す補助データの送信が不要となるため、通信量の削減が可能となる。
計算装置200は、ステップS208のようにタスクの実行終了後に管理装置100に応答を送信し、その後に新たなタスクを受け取るのではなく、あるタスクの実行中に新たなタスクの実行指示を受けてもよい。これにより、複数のタスクに関連する処理の一部を並列に実行させ、CNNの計算をより効率化できる。並列化できる処理は、例えば以下の処理である。
・あるタスクの計算と、次のタスクの実行指示の受信
・あるタスクの処理結果を含む応答の送信と、次のタスクの計算
CNNの処理の対象となる画像の入力方法は、撮影装置300により撮影された画像を計算装置200を介して管理装置100に送信する方法に限られず、どのような方法で管理装置100に入力されてもよい。例えば、記憶媒体に記憶された画像を管理装置100が読み出して入力する方法、および、ネットワーク400に接続された装置から画像を受信して入力する方法が用いられてもよい。
本実施形態の情報処理システムは、例えば、建物の監視システムに適用することができる。図15は、本実施形態の情報処理システムを監視システムとして実現する例を示す図である。監視システムでは、監視カメラなどの撮影装置300aで人物600の画像が撮影されたときに、撮影された画像に対するCNNによる画像認識処理が、計算装置200aおよび200bに効率よく分散して実行される。計算終了後、管理装置100は、クラウドサーバ500と連携して、警備センタへの連絡、および、労働者の勤怠管理などを実行する。
101 割当部
102 実行制御部
110 通信制御部
111 受信部
112 送信部
120 記憶部
200a、200b 計算装置
201 タスク実行部
210 通信制御部
211 受信部
212 送信部
220 記憶部
300a、300b 撮影装置
400 ネットワーク
500 クラウドサーバ
Claims (13)
- 第1計算装置および第2計算装置を含む複数の計算装置に接続される情報処理装置であって、
ニューラルネットワークを用いて処理されるn次元(nは2以上の整数)の対象データに含まれる複数の部分データのうち、第1データと、前記第1データとm次元(mは1≦m≦nを満たす整数)の方向に隣接する第2データと、を含む1以上の第1部分データをそれぞれ処理する1以上の第1タスクを、前記第1計算装置に割り当てる割当部と、
前記対象データに含まれる複数の部分データのうち、前記第2計算装置が実行中の第2部分データの実行状態に応じて、1以上の前記第1タスクに含まれる第2タスクの実行を、前記第1計算装置に対して指示する実行制御部と、
を備える情報処理装置。 - 前記実行制御部は、前記第2部分データの処理結果のうち前記第2タスクの処理に使用するデータを示す第1補助データと、前記第2タスクで処理する前記第1部分データと、を含む実行指示を前記第1計算装置に送信することにより、前記第2タスクの実行を指示する、
請求項1に記載の情報処理装置。 - 前記第2タスクの処理結果と、前記第2タスクの実行時に得られるデータであって前記第2計算装置による処理に使用するデータを示す第2補助データと、を含む、前記実行指示に対する応答を、前記第1計算装置から受信する受信部をさらに備える、
請求項2に記載の情報処理装置。 - 前記実行制御部は、1以上の前記第1タスクに含まれる複数の前記第2タスクの実行を指示する、
請求項1に記載の情報処理装置。 - 前記対象データは、n次元のデータを、m次元の方向およびm次元と異なる次元の方向で分割したタイルである、
請求項1に記載の情報処理装置。 - 前記ニューラルネットワークは、畳み込みニューラルネットワークであり、
前記タイルは、前記畳み込みニューラルネットワークに含まれる畳み込みレイヤを少なくとも含む複数のレイヤを統合したデータを分割したFused Tileである、
請求項5に記載の情報処理装置。 - 前記割当部は、タスクに割り当てられていない部分データが前記対象データに含まれない場合に、前記第2計算装置に割り当てたタスクが処理する第3部分データの一部を処理する第3タスクを、前記第1計算装置に割り当てる、
請求項1に記載の情報処理装置。 - 前記第3部分データは、複数の小領域を含み、
前記割当部は、
複数の前記小領域に実行順序を割り当て、
タスクに割り当てられていない部分データが前記対象データに含まれない場合に、複数の前記小領域のうち、前記実行順序が1つおきとなるように選択した小領域を処理する前記第3タスクを、前記第1計算装置に割り当てる、
請求項7に記載の情報処理装置。 - 前記第3部分データは、左上の小領域と、前記左上の小領域にm次元の方向に隣接する右上の小領域と、前記左上の小領域にm次元に直交する次元の方向に隣接する左下の小領域と、前記左下の小領域にm次元の方向に隣接する右下の小領域と、を含むブロックを1個以上含む、
請求項8に記載の情報処理装置。 - 前記割当部は、タスクに割り当てられていない部分データが前記対象データに含まれない場合に、前記第2計算装置に割り当てたタスクが処理する第3部分データの半分に相当するデータを処理する第3タスクを、前記第1計算装置に割り当てる、
請求項7に記載の情報処理装置。 - 前記実行制御部は、1以上の前記第1部分データのうち、前記第2計算装置が実行中のタスクが処理する部分データに隣接しない前記第1部分データを処理する前記第2タスクの実行を、前記第1計算装置に対して指示する、
請求項1に記載の情報処理装置。 - 第1計算装置および第2計算装置を含む複数の計算装置に接続される情報処理装置で実行される情報処理方法であって、
ニューラルネットワークを用いて処理されるn次元(nは2以上の整数)の対象データに含まれる複数の部分データのうち、第1データと、前記第1データとm次元(mは1≦m≦nを満たす整数)の方向に隣接する第2データと、を含む1以上の第1部分データをそれぞれ処理する1以上の第1タスクを、前記第1計算装置に割り当てる割当ステップと、
前記対象データに含まれる複数の部分データのうち、前記第2計算装置が実行中の第2部分データの実行状態に応じて、1以上の前記第1タスクに含まれる第2タスクの実行を、前記第1計算装置に対して指示する実行制御ステップと、
を含む情報処理方法。 - 第1計算装置および第2計算装置を含む複数の計算装置に接続される情報処理装置が備えるコンピュータに、
ニューラルネットワークを用いて処理されるn次元(nは2以上の整数)の対象データに含まれる複数の部分データのうち、第1データと、前記第1データとm次元(mは1≦m≦nを満たす整数)の方向に隣接する第2データと、を含む1以上の第1部分データをそれぞれ処理する1以上の第1タスクを、前記第1計算装置に割り当てる割当ステップと、
前記対象データに含まれる複数の部分データのうち、前記第2計算装置が実行中の第2部分データの実行状態に応じて、1以上の前記第1タスクに含まれる第2タスクの実行を、前記第1計算装置に対して指示する実行制御ステップと、
を実行させるためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020204346A JP7408533B2 (ja) | 2020-12-09 | 2020-12-09 | 情報処理装置、情報処理方法およびプログラム |
US17/446,185 US11941439B2 (en) | 2020-12-09 | 2021-08-27 | Information processing device, information processing method, and computer program product |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020204346A JP7408533B2 (ja) | 2020-12-09 | 2020-12-09 | 情報処理装置、情報処理方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022091486A JP2022091486A (ja) | 2022-06-21 |
JP7408533B2 true JP7408533B2 (ja) | 2024-01-05 |
Family
ID=81849176
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020204346A Active JP7408533B2 (ja) | 2020-12-09 | 2020-12-09 | 情報処理装置、情報処理方法およびプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US11941439B2 (ja) |
JP (1) | JP7408533B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230086727A1 (en) * | 2021-09-22 | 2023-03-23 | KDDI Research, Inc. | Method and information processing apparatus that perform transfer learning while suppressing occurrence of catastrophic forgetting |
FR3140973A1 (fr) * | 2022-10-14 | 2024-04-19 | Orange | Procédé de distribution des paramètres d’un réseau de neurones, procédé d’inférence et dispositifs associés |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019201656A1 (en) | 2018-04-19 | 2019-10-24 | Aimotive Kft. | Method for accelerating operations and accelerator apparatus |
US20190370071A1 (en) | 2018-05-31 | 2019-12-05 | Neuralmagic Inc. | Systems and methods for improved neural network execution |
WO2020052241A1 (en) | 2018-09-11 | 2020-03-19 | Huawei Technologies Co., Ltd. | Heterogeneous scheduling for sequential compute dag |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2447852A3 (en) | 2005-04-19 | 2015-01-07 | D.E. Shaw Research, LLC | Scalable method for the evaluation of distance-limited pairwise particle interactions |
US11574164B2 (en) * | 2017-03-20 | 2023-02-07 | International Business Machines Corporation | Neural network cooperation |
US10387298B2 (en) | 2017-04-04 | 2019-08-20 | Hailo Technologies Ltd | Artificial neural network incorporating emphasis and focus techniques |
US11423284B2 (en) * | 2018-09-07 | 2022-08-23 | Black Sesame Technologies, Inc | Subgraph tile fusion in a convolutional neural network |
US20230081715A1 (en) * | 2020-06-25 | 2023-03-16 | PolyN Technology Limited | Neuromorphic Analog Signal Processor for Predictive Maintenance of Machines |
-
2020
- 2020-12-09 JP JP2020204346A patent/JP7408533B2/ja active Active
-
2021
- 2021-08-27 US US17/446,185 patent/US11941439B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019201656A1 (en) | 2018-04-19 | 2019-10-24 | Aimotive Kft. | Method for accelerating operations and accelerator apparatus |
US20190370071A1 (en) | 2018-05-31 | 2019-12-05 | Neuralmagic Inc. | Systems and methods for improved neural network execution |
WO2020052241A1 (en) | 2018-09-11 | 2020-03-19 | Huawei Technologies Co., Ltd. | Heterogeneous scheduling for sequential compute dag |
Also Published As
Publication number | Publication date |
---|---|
JP2022091486A (ja) | 2022-06-21 |
US20220179688A1 (en) | 2022-06-09 |
US11941439B2 (en) | 2024-03-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10594591B2 (en) | Information processing apparatus, method and non-transitory computer-readable storage medium | |
JP7408533B2 (ja) | 情報処理装置、情報処理方法およびプログラム | |
JP2022052773A (ja) | 畳み込み効率を向上させる方法、システム、及び装置 | |
US20160110913A1 (en) | 3d registration of a plurality of 3d models | |
US9495213B2 (en) | Arithmetic control apparatus, arithmetic control method, non-transitory computer readable medium storing program, and open CL device | |
CN107122147B (zh) | 用于将图像基元部署至计算构造的图像流管线控制器 | |
CN101371263A (zh) | 用于在并行处理系统中处理多媒体数据的算法步骤的方法和装置 | |
US9218554B2 (en) | Image processing apparatus, image processing method, and storage medium | |
JP5655392B2 (ja) | 印刷画像処理装置及びプログラム | |
US9542127B2 (en) | Image processing method and image processing apparatus | |
US10762401B2 (en) | Image processing apparatus controlling the order of storing decompressed data, and method thereof | |
CN104850393A (zh) | 并行平铺引擎管线中的图元块的处理 | |
CN110503593A (zh) | 多个图形处理单元的调度 | |
JP6195342B2 (ja) | 情報処理装置およびメモリアクセス制御方法 | |
JP6477045B2 (ja) | 情報処理装置 | |
US12045183B2 (en) | Distributed processing node and distributed processing system | |
CN110741408A (zh) | 图像处理装置、图像处理方法和图像处理程序 | |
CN117215740A (zh) | 构建调度模型的方法和系统、调度目标任务的方法和系统 | |
JP6372315B2 (ja) | 画像処理装置及び並列処理制御プログラム並びに並列処理制御方法 | |
CN115080207A (zh) | 基于容器集群的任务处理方法及装置 | |
JP2018055570A (ja) | 演算処理装置、演算処理方法及びプログラム | |
JP7014173B2 (ja) | 分散処理システム | |
JP5968497B2 (ja) | 制御方法、システム及びプログラム | |
KR102111740B1 (ko) | 영상 데이터를 처리하는 방법 및 디바이스. | |
JP2009295163A (ja) | 画像処理装置及び画像処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230208 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231025 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231121 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231220 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7408533 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |