JP7214786B2 - 深層学習推論エンジンのスケジューリング方法、装置、機器及び媒体 - Google Patents
深層学習推論エンジンのスケジューリング方法、装置、機器及び媒体 Download PDFInfo
- Publication number
- JP7214786B2 JP7214786B2 JP2021084449A JP2021084449A JP7214786B2 JP 7214786 B2 JP7214786 B2 JP 7214786B2 JP 2021084449 A JP2021084449 A JP 2021084449A JP 2021084449 A JP2021084449 A JP 2021084449A JP 7214786 B2 JP7214786 B2 JP 7214786B2
- Authority
- JP
- Japan
- Prior art keywords
- inference
- inference engine
- load
- task
- type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/48—Program initiating; Program switching, e.g. by interrupt
- G06F9/4806—Task transfer initiation or dispatching
- G06F9/4843—Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
- G06F9/4881—Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
- G06F9/505—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the load
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5083—Techniques for rebalancing the load in a distributed system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/063—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/40—Spoof detection, e.g. liveness detection
- G06V40/45—Detection of the body part being alive
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Description
前記各推論エンジンの総負荷を比較し、比較結果に基づいて前記各推論エンジンから前記現在の推論タスクを実行する目標推論エンジンを決定するステップと、前記目標推論エンジンの、推論エンジンの呼び出しパスを表すためのインデックスを前記アプリケーション層に返信するステップと、を含む。
各推論エンジンが前記タイプの現在の推論タスクを実行した後の総負荷を計算するための計算モジュールと、前記各推論エンジンの総負荷を比較し、比較結果に基づいて前記各推論エンジンから前記現在の推論タスクを実行する目標推論エンジンを決定するための比較モジュールと、前記目標推論エンジンの、推論エンジンの呼び出しパスを表すためのインデックスを前記アプリケーション層に返信するための返信モジュールと、を備える。
Claims (14)
- コンピュータによって実行される深層学習推論エンジンのスケジューリング方法であって、
アプリケーション層からの現在の推論タスクのスケジューリング要求に応答して、前記現在の推論タスクのタイプを決定するステップと、
各推論エンジンが前記タイプの現在の推論タスクを実行すると仮定した場合の総負荷を計算するステップと、
前記各推論エンジンの総負荷を比較し、比較結果に基づいて前記各推論エンジンから前記現在の推論タスクを実行する目標推論エンジンを決定するステップと、
前記目標推論エンジンの、推論エンジンの呼び出しパスを表すためのインデックスを前記アプリケーション層に返信するステップと、
を含む、深層学習推論エンジンのスケジューリング方法。 - 各推論エンジンが前記タイプの現在の推論タスクを実行すると仮定した場合の総負荷を計算する前記ステップが、
前記各推論エンジンの履歴負荷及び各推論エンジンが前記タイプの推論タスクを実行する負荷を取得するステップと、
前記各推論エンジンの履歴負荷と、前記タイプの推論タスクを実行する負荷との合計値をそれぞれ計算し、前記合計値を前記各推論エンジンが前記タイプの現在の推論タスクを実行した後の総負荷とするステップと、
を含む請求項1に記載の方法。 - 前記各推論エンジンが前記タイプの推論タスクを実行する負荷が、
各推論エンジンが過去に前記タイプの推論タスクを実行した平均負荷、又は、
各推論エンジンが前回に前記タイプの推論タスクを実行した負荷、
を含む請求項2に記載の方法。 - 前記各推論エンジンが各推論タスクを実行する、推論タスクのタイプ及び負荷が含まれる負荷フィードバックメッセージを受信するステップと、
前記負荷フィードバックメッセージに基づいて、前記各推論エンジンが実行した推論タスクタイプ及びその負荷を保存するステップと、
を含む請求項1から3のいずれか一項に記載の方法。 - 比較結果に基づいて前記各推論エンジンから前記現在の推論タスクを実行する目標推論エンジンを決定する前記ステップが、
前記総負荷のうち値が最も小さい総負荷に対応する推論エンジンを、前記現在の推論タスクを実行する目標推論エンジンとするステップを含む請求項1に記載の方法。 - アプリケーション層からの現在の推論タスクのスケジューリング要求に応答して、前記現在の推論タスクのタイプを決定するためのタイプ決定モジュールと、
各推論エンジンが前記タイプの現在の推論タスクを実行すると仮定した場合の総負荷を計算するための計算モジュールと、
前記各推論エンジンの総負荷を比較し、比較結果に基づいて前記各推論エンジンから前記現在の推論タスクを実行する目標推論エンジンを決定するための比較モジュールと、
前記目標推論エンジンの、推論エンジンの呼び出しパスを表すためのインデックスを前記アプリケーション層に返信するための返信モジュールと、
を備える、深層学習推論エンジンのスケジューリング装置。 - 前記計算モジュールが、
前記各推論エンジンの履歴負荷及び各推論エンジンが前記タイプの推論タスクを実行する負荷を取得するための取得ユニットと、
前記各推論エンジンの履歴負荷と、前記タイプの推論タスクを実行する負荷との合計値をそれぞれ計算し、前記合計値を前記各推論エンジンが前記タイプの現在の推論タスクを実行した後の総負荷とするための計算ユニットと、
を備える請求項6に記載の装置。 - 前記各推論エンジンが前記タイプの推論タスクを実行する負荷が、
各推論エンジンが過去に前記タイプの推論タスクを実行した平均負荷、又は、
各推論エンジンが前回に前記タイプの推論タスクを実行した負荷、
を含む請求項7に記載の装置。 - 前記各推論エンジンが各推論タスクを実行する、推論タスクのタイプ及び負荷が含まれる負荷フィードバックメッセージを受信し、前記負荷フィードバックメッセージに基づいて、前記各推論エンジンが実行した推論タスクタイプ及びその負荷を保存するための保存モジュールを含む請求項6から8のいずれか一項に記載の装置。
- 前記比較モジュールが、前記各推論エンジンの総負荷を比較し、前記総負荷のうち値が最も小さい総負荷に対応する推論エンジンを、前記現在の推論タスクを実行する目標推論エンジンとするために用いられる請求項6に記載の装置。
- 少なくとも1つのプロセッサと、
該少なくとも1つのプロセッサと通信可能に接続されるメモリと、
を備え、
前記メモリには、前記少なくとも1つのプロセッサによって実行可能な命令が記憶され、前記命令が、前記少なくとも1つのプロセッサが請求項1から5のいずれか一項に記載の深層学習推論エンジンのスケジューリング方法を実行できるように、前記少なくとも1つのプロセッサによって実行される電子機器。 - コンピュータ命令を記憶した非一時的なコンピュータ読み取り可能な記憶媒体であって、前記コンピュータ命令がコンピュータに請求項1から5のいずれか一項に記載の深層学習推論エンジンのスケジューリング方法を実行させるために用いられる非一時的なコンピュータ読み取り可能な記憶媒体。
- 少なくとも1つの推論エンジンを含み、
請求項1から5のいずれか一項に記載の深層学習推論エンジンのスケジューリング方法を実行するためのスケジューラーを含むAIチップ。 - コンピュータ上で動作しているときに、請求項1から5のいずれか一項に記載の深層学習推論エンジンのスケジューリング方法を前記コンピュータに実行させるコンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010537231.1A CN111738446B (zh) | 2020-06-12 | 2020-06-12 | 深度学习推理引擎的调度方法、装置、设备和介质 |
CN202010537231.1 | 2020-06-12 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021121959A JP2021121959A (ja) | 2021-08-26 |
JP7214786B2 true JP7214786B2 (ja) | 2023-01-30 |
Family
ID=72649027
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021084449A Active JP7214786B2 (ja) | 2020-06-12 | 2021-05-19 | 深層学習推論エンジンのスケジューリング方法、装置、機器及び媒体 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20210248469A1 (ja) |
EP (1) | EP3893112A3 (ja) |
JP (1) | JP7214786B2 (ja) |
KR (1) | KR20210080292A (ja) |
CN (2) | CN111738446B (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112486648A (zh) * | 2020-11-30 | 2021-03-12 | 北京百度网讯科技有限公司 | 任务调度方法、装置、系统、电子设备和存储介质 |
CN112883882A (zh) * | 2021-02-26 | 2021-06-01 | 武汉卓鹰世纪科技有限公司 | 人脸识别融合处理方法和系统 |
CN113139660A (zh) * | 2021-05-08 | 2021-07-20 | 北京首都在线科技股份有限公司 | 模型推理方法、装置、电子设备及存储介质 |
CN114020465A (zh) * | 2021-11-08 | 2022-02-08 | 中兴通讯股份有限公司 | 模型的推理优化方法、系统、电子设备和存储介质 |
US11934255B2 (en) | 2022-01-04 | 2024-03-19 | Bank Of America Corporation | System and method for improving memory resource allocations in database blocks for executing tasks |
JP2023176138A (ja) | 2022-05-31 | 2023-12-13 | 日精樹脂工業株式会社 | 粉砕材混合樹脂材料の成形方法 |
JP2024001975A (ja) | 2022-06-23 | 2024-01-11 | 日精樹脂工業株式会社 | 粉砕材樹脂材料の成形支援方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012098683A1 (ja) | 2011-01-21 | 2012-07-26 | 富士通株式会社 | スケジューリング方法およびスケジューリングシステム |
US20180138267A1 (en) | 2012-12-26 | 2018-05-17 | Fujifilm Corporation | Semiconductor film, solar cell, light-emitting diode, thin film transistor, and electronic device |
JP2018200603A (ja) | 2017-05-29 | 2018-12-20 | 富士通株式会社 | タスク配備プログラム、タスク配備方法、およびタスク配備装置 |
JP2020510929A (ja) | 2017-06-15 | 2020-04-09 | グーグル エルエルシー | チャット会話において組み込みアプリケーションで使用するための提案アイテム |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7934216B2 (en) * | 2005-10-03 | 2011-04-26 | International Business Machines Corporation | Method and system for load balancing of computing resources |
CN108924214A (zh) * | 2018-06-27 | 2018-11-30 | 中国建设银行股份有限公司 | 一种计算集群的负载均衡方法、装置及系统 |
CN108958938B (zh) * | 2018-06-29 | 2020-01-14 | 百度在线网络技术(北京)有限公司 | 数据处理方法、装置及设备 |
CN110795228B (zh) * | 2018-08-03 | 2023-08-25 | 伊姆西Ip控股有限责任公司 | 用于训练深度学习模型的方法和制品、以及计算系统 |
CN111221631A (zh) * | 2018-11-23 | 2020-06-02 | 中国移动通信集团有限公司 | 一种任务调度方法、装置及存储介质 |
US11263011B2 (en) * | 2018-11-28 | 2022-03-01 | International Business Machines Corporation | Compound instruction set architecture for a neural inference chip |
US11657124B2 (en) * | 2018-12-10 | 2023-05-23 | Apple Inc. | Integrating binary inference engines and model data for efficiency of inference tasks |
CN110602156A (zh) * | 2019-03-11 | 2019-12-20 | 平安科技(深圳)有限公司 | 一种负载均衡调度方法及装置 |
CN110430278A (zh) * | 2019-08-14 | 2019-11-08 | 平安普惠企业管理有限公司 | 负载均衡配置方法及装置 |
-
2020
- 2020-06-12 CN CN202010537231.1A patent/CN111738446B/zh active Active
- 2020-06-12 CN CN202211243104.6A patent/CN115759252A/zh active Pending
-
2021
- 2021-04-27 US US17/241,941 patent/US20210248469A1/en active Pending
- 2021-04-28 EP EP21170887.0A patent/EP3893112A3/en not_active Withdrawn
- 2021-05-19 JP JP2021084449A patent/JP7214786B2/ja active Active
- 2021-06-10 KR KR1020210075650A patent/KR20210080292A/ko not_active Application Discontinuation
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012098683A1 (ja) | 2011-01-21 | 2012-07-26 | 富士通株式会社 | スケジューリング方法およびスケジューリングシステム |
US20180138267A1 (en) | 2012-12-26 | 2018-05-17 | Fujifilm Corporation | Semiconductor film, solar cell, light-emitting diode, thin film transistor, and electronic device |
JP2018200603A (ja) | 2017-05-29 | 2018-12-20 | 富士通株式会社 | タスク配備プログラム、タスク配備方法、およびタスク配備装置 |
JP2020510929A (ja) | 2017-06-15 | 2020-04-09 | グーグル エルエルシー | チャット会話において組み込みアプリケーションで使用するための提案アイテム |
Also Published As
Publication number | Publication date |
---|---|
CN111738446A (zh) | 2020-10-02 |
EP3893112A2 (en) | 2021-10-13 |
KR20210080292A (ko) | 2021-06-30 |
CN115759252A (zh) | 2023-03-07 |
JP2021121959A (ja) | 2021-08-26 |
EP3893112A3 (en) | 2021-11-17 |
CN111738446B (zh) | 2023-11-03 |
US20210248469A1 (en) | 2021-08-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7214786B2 (ja) | 深層学習推論エンジンのスケジューリング方法、装置、機器及び媒体 | |
KR102482122B1 (ko) | 태스크 병렬 처리 구현 방법, 장치, 기기 및 매체 | |
CN111597028B (zh) | 用于任务调度的方法和装置 | |
EP3862894A1 (en) | Data processing methods, data processing apparatuses, electronic devices, and storage media | |
CN110806923A (zh) | 一种区块链任务的并行处理方法、装置、电子设备和介质 | |
CN112000450A (zh) | 神经网络架构搜索方法以及装置 | |
CN111506401B (zh) | 自动驾驶仿真任务调度方法、装置、电子设备及存储介质 | |
US11769125B2 (en) | Method and apparatus for processing transaction requests in blockchain, device and medium | |
CN111459645B (zh) | 一种任务调度方法、装置和电子设备 | |
JP7282823B2 (ja) | メモリアクセスリクエストスケジューリング方法、装置、電子デバイス、コンピュータ可読記憶媒体及びコンピュータプログラム | |
CN111400000A (zh) | 网络请求处理方法、装置、设备和存储介质 | |
CN111880914A (zh) | 资源调度方法、资源调度装置、电子设备和存储介质 | |
KR20210092689A (ko) | 그래프 데이터베이스의 순회 방법, 장치, 설비 및 저장매체 | |
CN110688229B (zh) | 任务处理方法和装置 | |
CN111488492A (zh) | 用于检索图数据库的方法和装置 | |
CN115080209A (zh) | 系统资源调度方法、装置、电子设备及存储介质 | |
CN111694648B (zh) | 一种任务调度方法、装置以及电子设备 | |
CN114490048A (zh) | 任务执行方法、装置、电子设备及计算机存储介质 | |
CN111290744B (zh) | 流式计算作业处理方法、流式计算系统及电子设备 | |
CN111767149A (zh) | 调度方法、装置、设备及存储设备 | |
CN115952054A (zh) | 一种仿真任务资源管理方法、装置、设备及介质 | |
CN112817965B (zh) | 一种数据拼接方法、装置、电子设备和存储介质 | |
CN111506399B (zh) | 任务迁移方法、装置、电子设备及存储介质 | |
CN114253701A (zh) | 任务调度方法、装置以及计算机系统 | |
CN113760968A (zh) | 数据查询方法、装置、系统、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210519 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220530 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220614 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220912 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230110 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230118 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7214786 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |