CN109885389A - 一种基于容器的并行深度学习调度训练方法及系统 - Google Patents
一种基于容器的并行深度学习调度训练方法及系统 Download PDFInfo
- Publication number
- CN109885389A CN109885389A CN201910122127.3A CN201910122127A CN109885389A CN 109885389 A CN109885389 A CN 109885389A CN 201910122127 A CN201910122127 A CN 201910122127A CN 109885389 A CN109885389 A CN 109885389A
- Authority
- CN
- China
- Prior art keywords
- node
- training
- task
- container
- resource
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
- Debugging And Monitoring (AREA)
Abstract
Description
Claims (9)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910122127.3A CN109885389B (zh) | 2019-02-19 | 2019-02-19 | 一种基于容器的并行深度学习调度训练方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910122127.3A CN109885389B (zh) | 2019-02-19 | 2019-02-19 | 一种基于容器的并行深度学习调度训练方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109885389A true CN109885389A (zh) | 2019-06-14 |
CN109885389B CN109885389B (zh) | 2021-07-16 |
Family
ID=66928341
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910122127.3A Active CN109885389B (zh) | 2019-02-19 | 2019-02-19 | 一种基于容器的并行深度学习调度训练方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109885389B (zh) |
Cited By (67)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110413391A (zh) * | 2019-07-24 | 2019-11-05 | 上海交通大学 | 基于容器集群的深度学习任务服务质量保证方法和系统 |
CN110414687A (zh) * | 2019-07-12 | 2019-11-05 | 苏州浪潮智能科技有限公司 | 一种用于深度学习框架分布式训练的方法和装置 |
CN110502340A (zh) * | 2019-08-09 | 2019-11-26 | 广东浪潮大数据研究有限公司 | 一种资源动态调整方法、装置、设备及存储介质 |
CN110515704A (zh) * | 2019-08-30 | 2019-11-29 | 广东浪潮大数据研究有限公司 | 基于Kubernetes系统的资源调度方法及装置 |
CN110688230A (zh) * | 2019-10-17 | 2020-01-14 | 广州文远知行科技有限公司 | 一种同步训练方法、装置、计算机设备和存储介质 |
CN110704135A (zh) * | 2019-09-26 | 2020-01-17 | 北京智能工场科技有限公司 | 一种基于虚拟环境的竞赛数据处理系统和方法 |
CN110737504A (zh) * | 2019-08-31 | 2020-01-31 | 苏州浪潮智能科技有限公司 | 一种深度学习模型训练容错方法、系统、终端及存储介质 |
CN110780991A (zh) * | 2019-09-12 | 2020-02-11 | 苏州浪潮智能科技有限公司 | 一种基于优先级的深度学习任务调度方法及装置 |
CN110912972A (zh) * | 2019-11-07 | 2020-03-24 | 北京浪潮数据技术有限公司 | 一种业务处理方法、系统、电子设备及可读存储介质 |
CN110928553A (zh) * | 2019-10-16 | 2020-03-27 | 中国平安人寿保险股份有限公司 | 深度学习模型的部署方法、装置和系统 |
CN111045791A (zh) * | 2019-12-16 | 2020-04-21 | 武汉智领云科技有限公司 | 一种大数据容器化中心调度系统和方法 |
CN111104212A (zh) * | 2019-12-18 | 2020-05-05 | 秒针信息技术有限公司 | 一种调度任务执行方法、装置、电子设备及存储介质 |
CN111143060A (zh) * | 2019-12-18 | 2020-05-12 | 重庆紫光华山智安科技有限公司 | Gpu资源调度方法、装置及gpu |
CN111191771A (zh) * | 2019-12-29 | 2020-05-22 | 浪潮(北京)电子信息产业有限公司 | 一种数据处理方法、装置、设备及存储介质 |
CN111274018A (zh) * | 2020-01-21 | 2020-06-12 | 行星算力(深圳)科技有限公司 | 一种基于dl框架下的分布式训练方法 |
CN111400000A (zh) * | 2020-03-09 | 2020-07-10 | 百度在线网络技术(北京)有限公司 | 网络请求处理方法、装置、设备和存储介质 |
CN111444019A (zh) * | 2020-03-31 | 2020-07-24 | 中国科学院自动化研究所 | 云端协同的深度学习模型分布式训练方法及系统 |
CN111459576A (zh) * | 2020-03-31 | 2020-07-28 | 北京九章云极科技有限公司 | 一种数据分析处理系统和模型运行方法 |
CN111562985A (zh) * | 2020-05-09 | 2020-08-21 | 上海商汤智能科技有限公司 | 资源管理方法及装置、电子设备和存储介质 |
CN111625420A (zh) * | 2020-05-21 | 2020-09-04 | 浪潮电子信息产业股份有限公司 | 一种分布式训练任务处理方法、装置、设备及存储介质 |
CN111679891A (zh) * | 2020-08-14 | 2020-09-18 | 支付宝(杭州)信息技术有限公司 | 容器复用方法、装置、设备以及存储介质 |
CN111767146A (zh) * | 2020-06-24 | 2020-10-13 | 杭州电子科技大学 | 一种基于网络重配置的分布式机器学习系统加速方法 |
CN111984679A (zh) * | 2020-07-02 | 2020-11-24 | 中科驭数(北京)科技有限公司 | 硬件加速数据库的访问方法、装置、主机、系统及介质 |
CN112101536A (zh) * | 2020-08-30 | 2020-12-18 | 西南电子技术研究所(中国电子科技集团公司第十研究所) | 轻量级分布式多任务协同框架 |
CN112114931A (zh) * | 2019-06-21 | 2020-12-22 | 鸿富锦精密电子(天津)有限公司 | 深度学习程序配置方法、装置、电子设备及存储介质 |
CN112148438A (zh) * | 2019-06-28 | 2020-12-29 | 杭州海康威视数字技术股份有限公司 | 异常任务处理、任务调度方法、装置及计算机存储介质 |
CN112199178A (zh) * | 2020-10-21 | 2021-01-08 | 中国电子科技集团公司第十五研究所 | 一种基于轻量化容器的云服务动态调度方法及系统 |
CN112286151A (zh) * | 2020-10-21 | 2021-01-29 | 山东华锐智能技术有限公司 | 基于微服务的多种类集群agv导航调度系统及方法 |
CN112286644A (zh) * | 2020-12-25 | 2021-01-29 | 同盾控股有限公司 | Gpu虚拟化算力的弹性调度方法、系统、设备和存储介质 |
CN112311605A (zh) * | 2020-11-06 | 2021-02-02 | 北京格灵深瞳信息技术有限公司 | 提供机器学习服务的云平台及方法 |
CN112328372A (zh) * | 2020-11-27 | 2021-02-05 | 新华智云科技有限公司 | 一种kubernetes节点自愈方法和系统 |
CN112348195A (zh) * | 2019-08-08 | 2021-02-09 | 深圳致星科技有限公司 | 一种基于rdma网络的分布式训练系统及高效训练方法 |
CN112348196A (zh) * | 2019-08-08 | 2021-02-09 | 深圳致星科技有限公司 | 一种自适应rdma网络的分布式机器学习系统及方法 |
CN112394944A (zh) * | 2019-08-13 | 2021-02-23 | 阿里巴巴集团控股有限公司 | 分布式开发方法、装置、存储介质及计算机设备 |
CN112398915A (zh) * | 2020-10-28 | 2021-02-23 | 武汉大势智慧科技有限公司 | 一种云渲染平台的app应用审核方法及系统 |
CN112416368A (zh) * | 2020-11-25 | 2021-02-26 | 中国科学技术大学先进技术研究院 | 缓存部署与任务调度方法、终端和计算机可读存储介质 |
CN112418438A (zh) * | 2020-11-24 | 2021-02-26 | 国电南瑞科技股份有限公司 | 基于容器的机器学习流程化训练任务执行方法及系统 |
TWI721464B (zh) * | 2019-06-21 | 2021-03-11 | 鴻齡科技股份有限公司 | 深度學習程式配置方法、裝置、電子設備及存儲介質 |
CN112685153A (zh) * | 2020-12-25 | 2021-04-20 | 广州奇盾信息技术有限公司 | 微服务调度方法、装置以及电子设备 |
CN112700004A (zh) * | 2020-12-25 | 2021-04-23 | 南方电网深圳数字电网研究院有限公司 | 基于容器技术的深度学习模型训练方法、设备及存储介质 |
CN112799742A (zh) * | 2021-02-09 | 2021-05-14 | 上海海事大学 | 一种基于微服务的机器学习实训系统及方法 |
CN112817711A (zh) * | 2021-01-22 | 2021-05-18 | 海南大学 | 基于微服务的数据融合系统 |
CN112817581A (zh) * | 2021-02-20 | 2021-05-18 | 中国电子科技集团公司第二十八研究所 | 一种轻量级智能服务构建和运行支撑方法 |
CN112835695A (zh) * | 2021-01-28 | 2021-05-25 | 北京市商汤科技开发有限公司 | Pod间通信的方法和分布式计算系统 |
CN112860373A (zh) * | 2021-01-29 | 2021-05-28 | 西藏宁算科技集团有限公司 | 人工智能分布式训练平台的搭建方法及平台 |
CN113033814A (zh) * | 2019-12-09 | 2021-06-25 | 北京中关村科金技术有限公司 | 训练机器学习模型的方法、装置以及存储介质 |
CN113032092A (zh) * | 2021-03-05 | 2021-06-25 | 北京百度网讯科技有限公司 | 分布式计算方法、装置及平台 |
CN113094116A (zh) * | 2021-04-01 | 2021-07-09 | 中国科学院软件研究所 | 一种基于负载特征分析的深度学习应用云配置推荐方法及系统 |
CN113296874A (zh) * | 2020-05-29 | 2021-08-24 | 阿里巴巴集团控股有限公司 | 一种任务的调度方法、计算设备及存储介质 |
CN113296988A (zh) * | 2020-06-08 | 2021-08-24 | 阿里巴巴集团控股有限公司 | 基于多容器共享异构计算设备实现故障隔离的方法及装置 |
WO2021203805A1 (zh) * | 2020-04-08 | 2021-10-14 | 苏州浪潮智能科技有限公司 | 一种gpu共享调度、单机多卡方法、系统及装置 |
CN113672391A (zh) * | 2021-08-23 | 2021-11-19 | 烽火通信科技股份有限公司 | 一种基于Kubernetes的并行计算任务调度方法与系统 |
CN113743425A (zh) * | 2020-05-27 | 2021-12-03 | 北京沃东天骏信息技术有限公司 | 一种生成分类模型的方法和装置 |
CN114020413A (zh) * | 2021-11-05 | 2022-02-08 | 沈阳飞机设计研究所扬州协同创新研究院有限公司 | 一种基于Kubernetes容器集群的分布式强化学习系统设计方法 |
CN114138434A (zh) * | 2021-11-19 | 2022-03-04 | 苏州浪潮智能科技有限公司 | 一种大数据任务调度系统 |
CN114138421A (zh) * | 2021-12-08 | 2022-03-04 | 兴业银行股份有限公司 | kubernetes的智能资源控制系统及方法 |
CN114281311A (zh) * | 2021-12-24 | 2022-04-05 | 重庆农村商业银行股份有限公司 | 一种模型开发系统 |
CN114327886A (zh) * | 2021-12-24 | 2022-04-12 | 国家石油天然气管网集团有限公司 | 一种基于大数据深度学习的动态资源调度方法 |
CN114418127A (zh) * | 2022-03-23 | 2022-04-29 | 阿里云计算有限公司 | 机器学习计算优化方法和平台 |
JP2022084869A (ja) * | 2021-04-02 | 2022-06-07 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | 深層フレームワーク用のスケジューリング方法、スケジューリング装置、電子機器、記憶媒体及びプログラム |
CN114968495A (zh) * | 2022-06-27 | 2022-08-30 | 集美大学 | 一种基于kubernetes平台实现地学数据共享的方法和系统 |
CN114968601A (zh) * | 2022-07-28 | 2022-08-30 | 合肥中科类脑智能技术有限公司 | 一种按比例预留资源的ai训练作业的调度方法和调度系统 |
WO2022206197A1 (en) * | 2021-03-30 | 2022-10-06 | International Business Machines Corporation | Training and scoring for large number of performance models |
CN115601221A (zh) * | 2022-11-28 | 2023-01-13 | 苏州浪潮智能科技有限公司(Cn) | 一种资源的分配方法、装置和一种人工智能训练系统 |
US11556332B2 (en) | 2021-02-23 | 2023-01-17 | International Business Machines Corporation | Application updating in a computing environment using a function deployment component |
CN116155750A (zh) * | 2023-04-19 | 2023-05-23 | 之江实验室 | 深度学习作业资源放置方法、系统、设备和存储介质 |
CN116755893A (zh) * | 2023-08-22 | 2023-09-15 | 之江实验室 | 面向深度学习的分布式计算系统的作业调度方法和装置 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107783818A (zh) * | 2017-10-13 | 2018-03-09 | 北京百度网讯科技有限公司 | 深度学习任务处理方法、装置、设备及存储介质 |
US20180107917A1 (en) * | 2016-10-19 | 2018-04-19 | Ebay Inc. | Applying a quantitative range for qualitative terms |
CN108062246A (zh) * | 2018-01-25 | 2018-05-22 | 北京百度网讯科技有限公司 | 用于深度学习框架的资源调度方法和装置 |
CN108809722A (zh) * | 2018-06-13 | 2018-11-13 | 郑州云海信息技术有限公司 | 一种部署Kubernetes集群的方法、装置和存储介质 |
CN108874542A (zh) * | 2018-06-07 | 2018-11-23 | 桂林电子科技大学 | 基于神经网络的Kubernetes调度优化方法 |
CN108881446A (zh) * | 2018-06-22 | 2018-11-23 | 深源恒际科技有限公司 | 一种基于深度学习的人工智能平台系统 |
CN108920259A (zh) * | 2018-03-30 | 2018-11-30 | 华为技术有限公司 | 深度学习作业调度方法、系统和相关设备 |
CN109117248A (zh) * | 2018-07-19 | 2019-01-01 | 郑州云海信息技术有限公司 | 一种基于kubernetes平台的深度学习任务弹性伸缩系统及方法 |
CN109272116A (zh) * | 2018-09-05 | 2019-01-25 | 郑州云海信息技术有限公司 | 一种深度学习的方法及装置 |
-
2019
- 2019-02-19 CN CN201910122127.3A patent/CN109885389B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180107917A1 (en) * | 2016-10-19 | 2018-04-19 | Ebay Inc. | Applying a quantitative range for qualitative terms |
CN107783818A (zh) * | 2017-10-13 | 2018-03-09 | 北京百度网讯科技有限公司 | 深度学习任务处理方法、装置、设备及存储介质 |
CN108062246A (zh) * | 2018-01-25 | 2018-05-22 | 北京百度网讯科技有限公司 | 用于深度学习框架的资源调度方法和装置 |
CN108920259A (zh) * | 2018-03-30 | 2018-11-30 | 华为技术有限公司 | 深度学习作业调度方法、系统和相关设备 |
CN108874542A (zh) * | 2018-06-07 | 2018-11-23 | 桂林电子科技大学 | 基于神经网络的Kubernetes调度优化方法 |
CN108809722A (zh) * | 2018-06-13 | 2018-11-13 | 郑州云海信息技术有限公司 | 一种部署Kubernetes集群的方法、装置和存储介质 |
CN108881446A (zh) * | 2018-06-22 | 2018-11-23 | 深源恒际科技有限公司 | 一种基于深度学习的人工智能平台系统 |
CN109117248A (zh) * | 2018-07-19 | 2019-01-01 | 郑州云海信息技术有限公司 | 一种基于kubernetes平台的深度学习任务弹性伸缩系统及方法 |
CN109272116A (zh) * | 2018-09-05 | 2019-01-25 | 郑州云海信息技术有限公司 | 一种深度学习的方法及装置 |
Non-Patent Citations (4)
Title |
---|
WALTONWANG: "TensorFlow on Kubernetes的架构与实践", 《HTTPS://MY.OSCHINA.NET/JXCDWANGTAO/BLOG/1612667》 * |
余昌发等: "基于Kubernetes的分布式TensorFlow平台的设计与实现", 《计算机科学》 * |
杜威科: "基于Kubernetes的大数据流式计算Spark平台设计与实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
网易云: "猛犸机器学习开发平台—开发实践", 《HTTPS://SQ.163YUN.COM/BLOG/ARTICLE/160842719918120960》 * |
Cited By (95)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112114931B (zh) * | 2019-06-21 | 2023-12-26 | 富联精密电子(天津)有限公司 | 深度学习程序配置方法、装置、电子设备及存储介质 |
TWI721464B (zh) * | 2019-06-21 | 2021-03-11 | 鴻齡科技股份有限公司 | 深度學習程式配置方法、裝置、電子設備及存儲介質 |
CN112114931A (zh) * | 2019-06-21 | 2020-12-22 | 鸿富锦精密电子(天津)有限公司 | 深度学习程序配置方法、装置、电子设备及存储介质 |
CN112148438A (zh) * | 2019-06-28 | 2020-12-29 | 杭州海康威视数字技术股份有限公司 | 异常任务处理、任务调度方法、装置及计算机存储介质 |
CN110414687A (zh) * | 2019-07-12 | 2019-11-05 | 苏州浪潮智能科技有限公司 | 一种用于深度学习框架分布式训练的方法和装置 |
CN110413391A (zh) * | 2019-07-24 | 2019-11-05 | 上海交通大学 | 基于容器集群的深度学习任务服务质量保证方法和系统 |
CN112348196A (zh) * | 2019-08-08 | 2021-02-09 | 深圳致星科技有限公司 | 一种自适应rdma网络的分布式机器学习系统及方法 |
CN112348195A (zh) * | 2019-08-08 | 2021-02-09 | 深圳致星科技有限公司 | 一种基于rdma网络的分布式训练系统及高效训练方法 |
CN110502340A (zh) * | 2019-08-09 | 2019-11-26 | 广东浪潮大数据研究有限公司 | 一种资源动态调整方法、装置、设备及存储介质 |
CN112394944A (zh) * | 2019-08-13 | 2021-02-23 | 阿里巴巴集团控股有限公司 | 分布式开发方法、装置、存储介质及计算机设备 |
CN110515704B (zh) * | 2019-08-30 | 2023-08-04 | 广东浪潮大数据研究有限公司 | 基于Kubernetes系统的资源调度方法及装置 |
CN110515704A (zh) * | 2019-08-30 | 2019-11-29 | 广东浪潮大数据研究有限公司 | 基于Kubernetes系统的资源调度方法及装置 |
CN110737504B (zh) * | 2019-08-31 | 2022-10-18 | 苏州浪潮智能科技有限公司 | 一种深度学习模型训练容错方法、系统、终端及存储介质 |
CN110737504A (zh) * | 2019-08-31 | 2020-01-31 | 苏州浪潮智能科技有限公司 | 一种深度学习模型训练容错方法、系统、终端及存储介质 |
CN110780991A (zh) * | 2019-09-12 | 2020-02-11 | 苏州浪潮智能科技有限公司 | 一种基于优先级的深度学习任务调度方法及装置 |
CN110780991B (zh) * | 2019-09-12 | 2023-01-06 | 苏州浪潮智能科技有限公司 | 一种基于优先级的深度学习任务调度方法及装置 |
CN110704135A (zh) * | 2019-09-26 | 2020-01-17 | 北京智能工场科技有限公司 | 一种基于虚拟环境的竞赛数据处理系统和方法 |
CN110928553A (zh) * | 2019-10-16 | 2020-03-27 | 中国平安人寿保险股份有限公司 | 深度学习模型的部署方法、装置和系统 |
CN110688230A (zh) * | 2019-10-17 | 2020-01-14 | 广州文远知行科技有限公司 | 一种同步训练方法、装置、计算机设备和存储介质 |
CN110912972B (zh) * | 2019-11-07 | 2022-08-19 | 北京浪潮数据技术有限公司 | 一种业务处理方法、系统、电子设备及可读存储介质 |
CN110912972A (zh) * | 2019-11-07 | 2020-03-24 | 北京浪潮数据技术有限公司 | 一种业务处理方法、系统、电子设备及可读存储介质 |
CN113033814A (zh) * | 2019-12-09 | 2021-06-25 | 北京中关村科金技术有限公司 | 训练机器学习模型的方法、装置以及存储介质 |
CN111045791A (zh) * | 2019-12-16 | 2020-04-21 | 武汉智领云科技有限公司 | 一种大数据容器化中心调度系统和方法 |
CN111143060A (zh) * | 2019-12-18 | 2020-05-12 | 重庆紫光华山智安科技有限公司 | Gpu资源调度方法、装置及gpu |
CN111104212A (zh) * | 2019-12-18 | 2020-05-05 | 秒针信息技术有限公司 | 一种调度任务执行方法、装置、电子设备及存储介质 |
CN111143060B (zh) * | 2019-12-18 | 2021-01-26 | 重庆紫光华山智安科技有限公司 | Gpu资源调度方法、装置及gpu |
CN111191771A (zh) * | 2019-12-29 | 2020-05-22 | 浪潮(北京)电子信息产业有限公司 | 一种数据处理方法、装置、设备及存储介质 |
CN111274018A (zh) * | 2020-01-21 | 2020-06-12 | 行星算力(深圳)科技有限公司 | 一种基于dl框架下的分布式训练方法 |
CN111400000A (zh) * | 2020-03-09 | 2020-07-10 | 百度在线网络技术(北京)有限公司 | 网络请求处理方法、装置、设备和存储介质 |
CN111444019B (zh) * | 2020-03-31 | 2024-01-26 | 中国科学院自动化研究所 | 云端协同的深度学习模型分布式训练方法及系统 |
CN111444019A (zh) * | 2020-03-31 | 2020-07-24 | 中国科学院自动化研究所 | 云端协同的深度学习模型分布式训练方法及系统 |
CN111459576A (zh) * | 2020-03-31 | 2020-07-28 | 北京九章云极科技有限公司 | 一种数据分析处理系统和模型运行方法 |
CN111459576B (zh) * | 2020-03-31 | 2021-03-12 | 北京九章云极科技有限公司 | 一种数据分析处理系统和模型运行方法 |
US11768703B2 (en) | 2020-04-08 | 2023-09-26 | Inspur Suzhou Intelligent Technology Co., Ltd. | GPU-shared dispatching and single-machine multi-card methods, systems, and devices |
WO2021203805A1 (zh) * | 2020-04-08 | 2021-10-14 | 苏州浪潮智能科技有限公司 | 一种gpu共享调度、单机多卡方法、系统及装置 |
CN111562985A (zh) * | 2020-05-09 | 2020-08-21 | 上海商汤智能科技有限公司 | 资源管理方法及装置、电子设备和存储介质 |
CN111562985B (zh) * | 2020-05-09 | 2024-03-22 | 上海商汤智能科技有限公司 | 资源管理方法及装置、电子设备和存储介质 |
CN111625420A (zh) * | 2020-05-21 | 2020-09-04 | 浪潮电子信息产业股份有限公司 | 一种分布式训练任务处理方法、装置、设备及存储介质 |
CN113743425A (zh) * | 2020-05-27 | 2021-12-03 | 北京沃东天骏信息技术有限公司 | 一种生成分类模型的方法和装置 |
CN113296874A (zh) * | 2020-05-29 | 2021-08-24 | 阿里巴巴集团控股有限公司 | 一种任务的调度方法、计算设备及存储介质 |
WO2021249368A1 (zh) * | 2020-06-08 | 2021-12-16 | 阿里巴巴集团控股有限公司 | 基于多容器共享异构计算设备实现故障隔离的方法及装置 |
CN113296988A (zh) * | 2020-06-08 | 2021-08-24 | 阿里巴巴集团控股有限公司 | 基于多容器共享异构计算设备实现故障隔离的方法及装置 |
CN111767146A (zh) * | 2020-06-24 | 2020-10-13 | 杭州电子科技大学 | 一种基于网络重配置的分布式机器学习系统加速方法 |
CN111984679A (zh) * | 2020-07-02 | 2020-11-24 | 中科驭数(北京)科技有限公司 | 硬件加速数据库的访问方法、装置、主机、系统及介质 |
CN111679891A (zh) * | 2020-08-14 | 2020-09-18 | 支付宝(杭州)信息技术有限公司 | 容器复用方法、装置、设备以及存储介质 |
CN112101536A (zh) * | 2020-08-30 | 2020-12-18 | 西南电子技术研究所(中国电子科技集团公司第十研究所) | 轻量级分布式多任务协同框架 |
CN112286151B (zh) * | 2020-10-21 | 2022-04-15 | 济南蓝图士智能技术有限公司 | 基于微服务的多种类集群agv导航调度系统及方法 |
CN112286151A (zh) * | 2020-10-21 | 2021-01-29 | 山东华锐智能技术有限公司 | 基于微服务的多种类集群agv导航调度系统及方法 |
CN112199178A (zh) * | 2020-10-21 | 2021-01-08 | 中国电子科技集团公司第十五研究所 | 一种基于轻量化容器的云服务动态调度方法及系统 |
CN112398915A (zh) * | 2020-10-28 | 2021-02-23 | 武汉大势智慧科技有限公司 | 一种云渲染平台的app应用审核方法及系统 |
CN112398915B (zh) * | 2020-10-28 | 2022-07-01 | 武汉大势智慧科技有限公司 | 一种云渲染平台的app应用审核方法及系统 |
CN112311605B (zh) * | 2020-11-06 | 2023-12-22 | 北京格灵深瞳信息技术股份有限公司 | 提供机器学习服务的云平台及方法 |
CN112311605A (zh) * | 2020-11-06 | 2021-02-02 | 北京格灵深瞳信息技术有限公司 | 提供机器学习服务的云平台及方法 |
CN112418438A (zh) * | 2020-11-24 | 2021-02-26 | 国电南瑞科技股份有限公司 | 基于容器的机器学习流程化训练任务执行方法及系统 |
CN112416368A (zh) * | 2020-11-25 | 2021-02-26 | 中国科学技术大学先进技术研究院 | 缓存部署与任务调度方法、终端和计算机可读存储介质 |
CN112416368B (zh) * | 2020-11-25 | 2024-01-16 | 中国科学技术大学先进技术研究院 | 缓存部署与任务调度方法、终端和计算机可读存储介质 |
CN112328372A (zh) * | 2020-11-27 | 2021-02-05 | 新华智云科技有限公司 | 一种kubernetes节点自愈方法和系统 |
CN112685153A (zh) * | 2020-12-25 | 2021-04-20 | 广州奇盾信息技术有限公司 | 微服务调度方法、装置以及电子设备 |
CN112700004A (zh) * | 2020-12-25 | 2021-04-23 | 南方电网深圳数字电网研究院有限公司 | 基于容器技术的深度学习模型训练方法、设备及存储介质 |
CN112286644A (zh) * | 2020-12-25 | 2021-01-29 | 同盾控股有限公司 | Gpu虚拟化算力的弹性调度方法、系统、设备和存储介质 |
CN112286644B (zh) * | 2020-12-25 | 2021-05-28 | 同盾控股有限公司 | Gpu虚拟化算力的弹性调度方法、系统、设备和存储介质 |
CN112817711A (zh) * | 2021-01-22 | 2021-05-18 | 海南大学 | 基于微服务的数据融合系统 |
CN112835695A (zh) * | 2021-01-28 | 2021-05-25 | 北京市商汤科技开发有限公司 | Pod间通信的方法和分布式计算系统 |
CN112860373A (zh) * | 2021-01-29 | 2021-05-28 | 西藏宁算科技集团有限公司 | 人工智能分布式训练平台的搭建方法及平台 |
CN112799742A (zh) * | 2021-02-09 | 2021-05-14 | 上海海事大学 | 一种基于微服务的机器学习实训系统及方法 |
CN112799742B (zh) * | 2021-02-09 | 2024-02-13 | 上海海事大学 | 一种基于微服务的机器学习实训系统及方法 |
CN112817581A (zh) * | 2021-02-20 | 2021-05-18 | 中国电子科技集团公司第二十八研究所 | 一种轻量级智能服务构建和运行支撑方法 |
US11556332B2 (en) | 2021-02-23 | 2023-01-17 | International Business Machines Corporation | Application updating in a computing environment using a function deployment component |
CN113032092A (zh) * | 2021-03-05 | 2021-06-25 | 北京百度网讯科技有限公司 | 分布式计算方法、装置及平台 |
CN113032092B (zh) * | 2021-03-05 | 2023-08-08 | 北京百度网讯科技有限公司 | 分布式计算方法、装置及平台 |
GB2619664A (en) * | 2021-03-30 | 2023-12-13 | Ibm | Training and scoring for large number of performance models |
WO2022206197A1 (en) * | 2021-03-30 | 2022-10-06 | International Business Machines Corporation | Training and scoring for large number of performance models |
CN113094116A (zh) * | 2021-04-01 | 2021-07-09 | 中国科学院软件研究所 | 一种基于负载特征分析的深度学习应用云配置推荐方法及系统 |
CN113094116B (zh) * | 2021-04-01 | 2022-10-11 | 中国科学院软件研究所 | 一种基于负载特征分析的深度学习应用云配置推荐方法及系统 |
JP2022084869A (ja) * | 2021-04-02 | 2022-06-07 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | 深層フレームワーク用のスケジューリング方法、スケジューリング装置、電子機器、記憶媒体及びプログラム |
JP7336562B2 (ja) | 2021-04-02 | 2023-08-31 | ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド | 深層フレームワーク用のスケジューリング方法、スケジューリング装置、電子機器、記憶媒体及びプログラム |
CN113672391A (zh) * | 2021-08-23 | 2021-11-19 | 烽火通信科技股份有限公司 | 一种基于Kubernetes的并行计算任务调度方法与系统 |
CN113672391B (zh) * | 2021-08-23 | 2023-11-28 | 烽火通信科技股份有限公司 | 一种基于Kubernetes的并行计算任务调度方法与系统 |
CN114020413B (zh) * | 2021-11-05 | 2024-07-23 | 沈阳飞机设计研究所扬州协同创新研究院有限公司 | 一种基于Kubernetes容器集群的分布式强化学习系统设计方法 |
CN114020413A (zh) * | 2021-11-05 | 2022-02-08 | 沈阳飞机设计研究所扬州协同创新研究院有限公司 | 一种基于Kubernetes容器集群的分布式强化学习系统设计方法 |
CN114138434A (zh) * | 2021-11-19 | 2022-03-04 | 苏州浪潮智能科技有限公司 | 一种大数据任务调度系统 |
CN114138434B (zh) * | 2021-11-19 | 2024-01-12 | 苏州浪潮智能科技有限公司 | 一种大数据任务调度系统 |
CN114138421A (zh) * | 2021-12-08 | 2022-03-04 | 兴业银行股份有限公司 | kubernetes的智能资源控制系统及方法 |
CN114281311A (zh) * | 2021-12-24 | 2022-04-05 | 重庆农村商业银行股份有限公司 | 一种模型开发系统 |
CN114327886A (zh) * | 2021-12-24 | 2022-04-12 | 国家石油天然气管网集团有限公司 | 一种基于大数据深度学习的动态资源调度方法 |
CN114418127B (zh) * | 2022-03-23 | 2022-07-12 | 阿里云计算有限公司 | 机器学习计算优化方法和平台 |
CN114418127A (zh) * | 2022-03-23 | 2022-04-29 | 阿里云计算有限公司 | 机器学习计算优化方法和平台 |
CN114968495A (zh) * | 2022-06-27 | 2022-08-30 | 集美大学 | 一种基于kubernetes平台实现地学数据共享的方法和系统 |
CN114968601B (zh) * | 2022-07-28 | 2022-11-08 | 合肥中科类脑智能技术有限公司 | 一种按比例预留资源的ai训练作业的调度方法和调度系统 |
CN114968601A (zh) * | 2022-07-28 | 2022-08-30 | 合肥中科类脑智能技术有限公司 | 一种按比例预留资源的ai训练作业的调度方法和调度系统 |
CN115601221B (zh) * | 2022-11-28 | 2023-05-23 | 苏州浪潮智能科技有限公司 | 一种资源的分配方法、装置和一种人工智能训练系统 |
CN115601221A (zh) * | 2022-11-28 | 2023-01-13 | 苏州浪潮智能科技有限公司(Cn) | 一种资源的分配方法、装置和一种人工智能训练系统 |
CN116155750A (zh) * | 2023-04-19 | 2023-05-23 | 之江实验室 | 深度学习作业资源放置方法、系统、设备和存储介质 |
CN116755893B (zh) * | 2023-08-22 | 2023-11-17 | 之江实验室 | 面向深度学习的分布式计算系统的作业调度方法和装置 |
CN116755893A (zh) * | 2023-08-22 | 2023-09-15 | 之江实验室 | 面向深度学习的分布式计算系统的作业调度方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN109885389B (zh) | 2021-07-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109885389A (zh) | 一种基于容器的并行深度学习调度训练方法及系统 | |
CN109034396B (zh) | 用于处理分布式集群中的深度学习作业的方法和装置 | |
CN110888743B (zh) | 一种gpu资源使用方法、装置及存储介质 | |
CN107025139A (zh) | 一种基于云计算的高性能计算调度框架 | |
CN109347974B (zh) | 提高在线服务质量和集群资源利用率的混合调度系统 | |
US10505791B2 (en) | System and method to handle events using historical data in serverless systems | |
CN107943555A (zh) | 一种云计算环境下的大数据存储和处理平台及处理方法 | |
CN107220100A (zh) | 一种开发运维方法、装置及云计算PaaS平台 | |
CN106385329B (zh) | 资源池的处理方法、装置和设备 | |
CN103780655A (zh) | 一种消息传递接口任务和资源调度系统及方法 | |
CN103092698A (zh) | 云计算应用自动部署系统及方法 | |
CN106919445A (zh) | 一种在集群中并行调度容器的方法和装置 | |
US11252149B1 (en) | Resource management techniques for dialog-driven applications | |
CN109684074A (zh) | 物理机资源分配方法及终端设备 | |
CN109412874A (zh) | 设备资源的配置方法、装置、服务器及存储介质 | |
CN109240825A (zh) | 弹性任务调度方法、装置、设备及计算机可读存储介质 | |
US20090260012A1 (en) | Workload Scheduling | |
CN103761146A (zh) | 一种MapReduce动态设定slots数量的方法 | |
CN109739640A (zh) | 一种基于申威架构的容器资源管理系统 | |
CN113301590B (zh) | 一种面向5g接入网的虚拟资源管控系统 | |
CN114138434B (zh) | 一种大数据任务调度系统 | |
CN111160873A (zh) | 基于分布式架构的跑批处理装置及方法 | |
US11831410B2 (en) | Intelligent serverless function scaling | |
CN109614227A (zh) | 任务资源调配方法、装置、电子设备及计算机可读介质 | |
CN113064744A (zh) | 任务处理方法、装置、计算机可读介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB03 | Change of inventor or designer information |
Inventor after: Dou Yang Inventor after: Yang Jiwei Inventor after: Fang Yadong Inventor before: Dou Yang Inventor before: Yang Jiwei |
|
CB03 | Change of inventor or designer information | ||
CB02 | Change of applicant information |
Address after: 250100 No. 1036 Tidal Road, Jinan High-tech Zone, Shandong Province, S01 Building, Tidal Science Park Applicant after: Inspur cloud Information Technology Co.,Ltd. Address before: 250100 No. 1036 Tidal Road, Jinan High-tech Zone, Shandong Province, S01 Building, Tidal Science Park Applicant before: Tidal Cloud Information Technology Co.,Ltd. Address after: 250100 No. 1036 Tidal Road, Jinan High-tech Zone, Shandong Province, S01 Building, Tidal Science Park Applicant after: Tidal Cloud Information Technology Co.,Ltd. Address before: 250100 S06 tower, 1036, Chao Lu Road, hi tech Zone, Ji'nan, Shandong. Applicant before: SHANDONG INSPUR CLOUD INFORMATION TECHNOLOGY Co.,Ltd. |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |