CN109032610A - 一种程序包部署方法、电子设备及分布式系统 - Google Patents
一种程序包部署方法、电子设备及分布式系统 Download PDFInfo
- Publication number
- CN109032610A CN109032610A CN201710429234.1A CN201710429234A CN109032610A CN 109032610 A CN109032610 A CN 109032610A CN 201710429234 A CN201710429234 A CN 201710429234A CN 109032610 A CN109032610 A CN 109032610A
- Authority
- CN
- China
- Prior art keywords
- training
- calculate node
- node
- information
- mission
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 238000012549 training Methods 0.000 claims abstract description 242
- 238000003860 storage Methods 0.000 claims description 39
- 238000005516 engineering process Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 8
- 230000003993 interaction Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 10
- 238000010801 machine learning Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 235000013399 edible fruits Nutrition 0.000 description 2
- 239000004744 fabric Substances 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F8/00—Arrangements for software engineering
- G06F8/60—Software deployment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/445—Program loading or initiating
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N99/00—Subject matter not provided for in other groups of this subclass
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/94—Hardware or software architectures specially adapted for image or video understanding
- G06V10/95—Hardware or software architectures specially adapted for image or video understanding structured as a network, e.g. client-server architectures
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L49/00—Packet switching elements
- H04L49/35—Switches specially adapted for specific applications
- H04L49/356—Switches specially adapted for specific applications for storage area networks
- H04L49/358—Infiniband Switches
Abstract
本发明实施例提供了一种程序包部署方法、电子设备及分布式系统,该方法应用于第一计算节点,包括:接收训练任务信息,训练任务信息中包含执行训练任务的各台计算节点信息;根据训练任务信息,确定第一计算节点的状态是否为主用状态;如果为主用状态,获取训练程序包,并将所获取的训练程序包部署到执行训练任务的各台计算节点。可见,本方案中,只有主用状态的计算节点获取训练程序包,并将所获取的训练程序包部署到执行训练任务的各台计算节点,也就是说,并不是每台计算节点都从管理设备中获取程序包,降低了网络带宽压力。
Description
技术领域
本发明涉及机器学习技术领域,特别是涉及一种程序包部署方法、电子设备及分布式系统。
背景技术
机器学习是实现人工智能的重要技术手段,机器学习主要是通过对大量数据的学习训练,使得机器具备智能识别的功能。由于学习训练过程中的数据量较大,通常采用分布式系统进行数据训练。
在分布式系统中进行数据训练之前,通常需要在系统的各台计算节点中部署训练所需的程序包,程序包部署完成后,各台计算节点才能协同训练。一般来说,会设置一台管理设备,该管理设备获取训练程序包,并将该程序包下发给系统中各台计算节点。
也就是说,系统中各台计算节点都从该管理设备中获取程序包,这样,该管理设备与各台计算节点之间的网络带宽压力较大。
发明内容
本发明实施例的目的在于提供一种程序包部署方法、电子设备及分布式系统,以降低网络带宽压力。
为达到上述目的,本发明实施例提供了一种程序包部署方法,应用于分布式系统中的第一计算节点,所述方法包括:
接收训练任务信息,所述训练任务信息中包含执行训练任务的各台计算节点信息;
根据所述训练任务信息,确定所述第一计算节点的状态是否为主用状态;
如果为主用状态,获取训练程序包,并将所获取的训练程序包部署到所述执行训练任务的各台计算节点。
可选的,在接收训练任务信息之后,所述方法还可以包括:
解析所述训练任务信息,得到训练程序包的存储地址、执行训练任务的各台计算节点的状态信息及设备地址;
所述根据所述训练任务信息,确定所述第一计算节点的状态是否为主用状态,可以包括:
在所述各台计算节点的状态信息中,查找所述第一计算节点设备地址对应的状态信息;
确定所查找到的状态信息是否为主用状态;
所述获取训练程序包,可以包括:
根据所述训练程序包的存储地址,获取所述训练程序包;
所述将所获取的训练程序包部署到所述执行训练任务的各台计算节点,可以包括:
根据所述各台计算节点的设备地址,在所述各台计算节点中部署所述训练程序包。
可选的,所述方法还可以包括:
如果所述第一计算节点的状态为主用状态,检测到所述执行训练任务的各台计算节点均成功部署所述训练程序包后,生成标记文件,并将所述标记文件发送至所述各台计算节点。
可选的,所述方法还可以包括:
如果所述第一计算节点的状态为主用状态,检测到存在部署所述训练程序包失败的计算节点后,输出用于提示部署失败的第一提示信息。
可选的,所述方法还可以包括:
如果所述第一计算节点的状态不为主用状态,判断是否在预设时间段内接收到所述标记文件;
如果否,输出用于提示部署失败的第二提示信息。
可选的,所述方法还可以包括:
在所述执行训练任务的各台计算节点均成功部署所述训练程序包后,运行所述训练程序包,进行数据训练。
可选的,所述将所获取的训练程序包部署到所述执行训练任务的各台计算节点,可以包括:
通过无限带宽技术Infiniband,将所获取的训练程序包部署到所述执行训练任务的各台计算节点。
为达到上述目的,本发明实施例还提供了一种电子设备,包括:存储器和处理器,其中,
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述任一项程序包部署方法。
为达到上述目的,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项程序包部署方法。
为达到上述目的,本发明实施例还提供了一种分布式系统,包括:至少两台计算节点;
所述计算节点,用于接收训练任务信息,所述训练任务信息中包含执行训练任务的各台计算节点信息;根据所述训练任务信息,确定自身状态是否为主用状态;如果为主用状态,获取训练程序包,并将所获取的训练程序包部署到所述执行训练任务的各台计算节点。
可选的,所述系统还包括:管理节点;
所述管理节点,用于获取并存储训练程序包;将所述训练程序包的存储地址添加至训练任务信息;将所述训练任务信息发送给执行训练任务的各台计算节点;
所述计算节点,具体可以用于:
接收所述管理节点发送的训练任务信息;解析所述训练任务信息,得到训练程序包的存储地址、执行训练任务的各台计算节点的状态信息及设备地址;在所述各台计算节点的状态信息中,查找自身设备地址对应的状态信息;确定所查找到的状态信息是否为主用状态;如果为主用状态,根据所述训练程序包的存储地址,获取所述训练程序包,并根据所述各台计算节点的设备地址,在所述各台计算节点中部署所述训练程序包。
可选的,所述计算节点,还可以用于:
在自身状态为主用状态的情况下:
如果检测到所述执行训练任务的各台计算节点均成功部署所述训练程序包,生成标记文件,并将所述标记文件发送至所述各台计算节点;
如果检测到存在部署所述训练程序包失败的计算节点,向所述管理节点发送用于提示部署失败的第一提示信息。
可选的,所述计算节点,还可以用于:
在自身状态不为主用状态的情况下,判断是否在预设时间段内接收到所述标记文件;
如果否,向所述管理节点发送用于提示部署失败的第二提示信息。
可选的,所述计算节点,还可以用于:
在所述执行训练任务的各台计算节点均成功部署所述训练程序包后,运行所述训练程序包,进行数据训练。
可选的,所述执行训练任务的各台计算节点之间基于无限带宽技术Infiniband通信连接。
应用本发明所示实施例,只有主用状态的计算节点获取训练程序包,并将所获取的训练程序包部署到执行训练任务的各台计算节点,也就是说,并不是每台计算节点都从管理设备中获取程序包,降低了网络带宽压力。
当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的程序包部署方法的第一种流程示意图;
图2为本发明实施例提供的程序包部署方法的第二种流程示意图;
图3为本发明实施例提供的一种电子设备的结构示意图;
图4为本发明实施例提供的分布式系统的第一种结构示意图;
图5为本发明实施例提供的分布式系统的第二种结构示意图;
图6为本发明实施例提供的分布式系统的第三种结构示意图;
图7为本发明实施例提供的分布式系统的第四种结构示意图;
图8为本发明实施例提供的一种实施方式示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了解决上述技术问题,本发明实施例提供了一种程序包部署方法、电子设备及分布式系统。本发明实施例提供的分布式系统可以如图4所示,包含至少两台计算节点(计算节点1、计算节点2……计算节点n),或者也可以如图5所示,包含多台计算节点及管理节点,或者,也可以如图6、图7所示,包含多台计算节点、管理节点及交换机,具体不做限定。
下面首先对本发明实施例提供的一种程序包部署方法进行详细说明,该方法可以应用于该分布式系统中的任一台计算节点。为了方便描述,图1及图2实施例中,将执行该方法的计算节点称为第一计算节点。
图1为本发明实施例提供的一种程序包部署方法的流程示意图,包括:
S101:接收训练任务信息,所述训练任务信息中包含执行训练任务的各台计算节点信息。
训练任务可以为各种机器学习过程中对大量数据进行学习训练的任务,比如,基于人工神经网络的深度学习。在执行训练任务之前,可以利用本方案在分布式系统中进行训练程序包的部署,部署完成之后,系统中的计算节点便可以执行训练任务。
训练任务信息中包含执行本次训练任务的各台计算节点信息。执行本次训练任务的计算节点可以为系统中的部分计算节点。作为一种实施方式,每次需要进行机器学习(执行训练任务)时,用户可以根据实际情况,指定系统中部分计算节点来执行本次训练任务;或者,也可以将系统中的各台计算节点进行分组,同组计算节点执行相同的训练任务;或者,也可以将系统中全部计算节点确定为执行本次训练任务的计算节点,等等,确定执行训练任务的计算节点的方式有很多,本发明实施例并不对此进行限定。
在图4所示系统中,用户设备可以直接将训练任务信息存储至执行训练任务的各台计算节点;或者,可以在系统外设置一台管理设备,该管理设备获取训练任务信息,并解析训练任务信息,确定执行训练任务的各台计算节点,将训练任务信息发送给执行训练任务的各台计算节点。
作为一种实施方式,管理设备可以通过用户设备获取训练任务信息,比如,在web客户端中存储训练任务信息,管理设备从该web客户端上获取训练任务信息。作为主用状态的计算节点,从该管理设备中获取训练程序包。
在图5所示系统中,管理节点可以获取训练任务信息,并解析训练任务信息,确定执行训练任务的各台计算节点,将训练任务信息发送给执行训练任务的各台计算节点。作为一种实施方式,管理节点可以通过用户设备获取训练任务信息,比如,在web客户端中存储训练任务信息,管理节点从该web客户端上获取训练任务信息,具体不做限定。
在本发明所示实施例中,为了区分描述,将设置于系统内的管理设备称为管理节点,将设置于系统外的管理设备称为管理设备。
S102:根据所述训练任务信息,确定第一计算节点的状态是否为主用状态,如果是,执行S103。
作为一种实施方式,执行训练任务的每台计算节点接收到的训练任务信息可以不同。也就是说,用户设备可以在每台计算节点中存储该计算节点对应的训练任务信息,或者管理设备、或者管理节点可以针对每台计算节点,发送该计算节点对应的训练任务信息。
举例来说,用户设备存储在计算节点1中的训练任务信息中可以仅包含计算节点1的状态信息,存储在计算节点2中的训练任务信息中可以仅包含计算节点2的状态信息,等等。管理设备、或者管理节点发送给计算节点1的训练任务信息中可以仅包含计算节点1的状态信息,发送给计算节点2的训练任务信息中可以仅包含计算节点2的状态信息,等等。
或者,作为另一种实施方式,执行训练任务的每台计算节点接收到的训练任务信息是相同的,其中,包含执行训练任务的各台计算节点的状态信息。
计算节点的状态可以包含主用状态和从属状态两种,主用状态的计算节点可以称为主节点,从属状态的计算节点可以称为从节点。计算节点都可以根据S101接收到的训练任务信息,确定自身状态是主用状态还是从属状态。如果是主用状态,执行S103。
S103:获取训练程序包,并将所获取的训练程序包部署到所述执行训练任务的各台计算节点。
在本发明实施例中,仅当计算节点的状态为主用状态时,才获取训练程序包。作为一种实施方式,web客户端中可以存储有训练程序包,web客户端将训练程序包发送给管理节点或管理设备。作为主用状态的计算节点,从该管理节点或管理设备中获取训练程序包。
作为一种实施方式,系统中各台计算节点之间通过无限带宽技术Infiniband通信连接,因此,主节点(主用状态的计算节点)可以通过Infiniband,将所获取的训练程序包部署到执行训练任务的各台计算节点。
本领域技术人员可以理解,InfiniBand架构是一种支持多并发链接的“转换线缆”技术,基于InfiniBand架构的网络具有非常高的带宽。本实施方式中,主节点通过InfiniBand网络拷贝的方式,来完成从节点训练程序包的部署,一方面,可以提高训练程序包部署效率,另一方面,充分利用了Infiniband的带宽能力。
或者,主节点也可以通过其他方式,比如以太网,来完成从节点训练程序包的部署。以太网与InfiniBand网络可以同时存在,也就是说,在一种实施方式中,系统中各台计算节点可以通过以太网及InfiniBand网络进行数据交互。
如果进行程序包部署时,系统中每台计算节点都从管理设备(管理节点)中获取训练程序包,会造成网络拥堵。举例来说,系统中针对多个训练任务进行程序包的部署,其中,计算节点1——计算节点5需要部署针对训练任务A的程序包,计算节点6——计算节点10需要部署针对训练任务B的程序包,计算节点11——计算节点15需要部署针对训练任务C的程序包。如果这15台计算节点都需要从管理设备中获取程序包,管理设备与各台计算节点之间的网络带宽压力较大。
而本发明实施例中,针对每个训练任务,指定一个主节点,只有主节点从管理设备中获取程序包,也就是说,只有3台计算节点从管理设备中获取程序包,降低了管理设备与各台计算节点之间的网络带宽压力。
另一方面,主节点获取程序包后,将程序包部署到执行训练任务的从节点中,主节点与从节点之间的数据交互不同于计算节点与管理设备之间的数据交互,主节点与从节点之间的数据交互可以利用InfiniBand网络或其他系统内部网络,带宽高,速度快,提高了程序包部署效率。
应用本发明图1所示实施例,只有主用状态的计算节点获取训练程序包,并将所获取的训练程序包部署到执行训练任务的各台计算节点,也就是说,并不是每台计算节点都从管理设备中获取程序包,降低了网络带宽压力。
图2为本发明实施例提供的程序包部署方法的第二种流程示意图,包括:
S201:接收训练任务信息。
S202:解析所述训练任务信息,得到训练程序包的存储地址、执行训练任务的各台计算节点的状态信息及设备地址。
作为一种实施方式,web客户端中可以存储有训练程序包及其对应的训练任务信息,该训练任务信息中包含执行训练任务的各台计算节点的状态信息及设备地址。
管理节点或者管理设备从该web客户端中获取训练程序包及训练任务信息。管理节点或者管理设备将训练程序包存储至某一位置,并将存储地址添加至该训练任务信息。另外,管理节点或者管理设备还可以解析该训练任务信息,确定执行训练任务的各台计算节点,并将添加了存储地址的训练任务信息发送给所确定的各台计算节点,也就是执行训练任务的各台计算节点。
这样,执行本方法的第一计算节点接收到的训练任务信息中便包含了训练程序包的存储地址,第一计算节点对接收到的训练任务信息进行解析,可以得到该存储地址。
在本实施例中,训练任务信息中包含的“执行训练任务的各台计算节点信息”中可以包含各台计算节点的状态信息及设备地址。根据上面内容描述,计算节点的状态可以分为主用状态和从属状态两种,主用状态的计算节点可以称为主节点,从属状态的计算节点可以称为从节点。设备地址可以为设备的IP地址、MAC地址等可以访问到设备的地址,具体不做限定。
S203:在所述各台计算节点的状态信息中,查找第一计算节点的设备地址对应的状态信息。
S204:确定所查找到的状态信息是否为主用状态,如果是,执行S205。
S202中解析得到的计算节点的状态信息及设备地址间存在对应关系,举例来说,可以如表1所示:
表1
计算节点的状态信息 | 计算节点的IP地址 |
主用状态 | 100.4.5.6 |
从属状态 | 100.8.2.3 |
从属状态 | 100.6.5.2 |
…… | …… |
上述表1仅为举例说明,并不对本实施例构成限定。
假设执行本方法的第一计算节点的IP地址为100.4.5.6,则第一计算节点在S202的解析结果(包含上述表1)中查找自身IP地址对应的自身状态为主用状态,S204的判断结果为是,执行S205。
S205:根据所述训练程序包的存储地址,获取所述训练程序包。
S202的解析结果中还包含训练程序包的存储地址,根据该存储地址,可以获取到训练程序包。需要说明的是,在本实施例中,只有主用状态的计算节点(主节点)访问该存储地址,获取该训练程序包。
S206:根据所述各台计算节点的设备地址,在所述各台计算节点中部署所述训练程序包。
S202的解析结果中还包含执行本次训练任务的各台计算节点的设备地址,可以根据设备地址,将S205中获取的程序包部署到本次训练任务的各台计算节点中。
作为一种实施方式,系统中各台计算节点之间通过无限带宽技术Infiniband通信连接,因此,主节点可以通过Infiniband,将所获取的训练程序包部署到执行训练任务的各台计算节点。
本领域技术人员可以理解,InfiniBand架构是一种支持多并发链接的“转换线缆”技术,基于InfiniBand架构的网络具有非常高的带宽。本实施方式中,主节点通过InfiniBand网络拷贝的方式,来完成从节点训练程序包的部署,一方面,可以提高训练程序包部署效率,另一方面,充分利用了Infiniband的带宽能力。
或者,主节点也可以通过其他方式,比如以太网,来完成从节点训练程序包的部署。可选地,以太网与InfiniBand网络可以同时存在,也就是说,在一种实施方式中,系统中各台计算节点可以通过以太网及InfiniBand网络进行数据交互。
应用本发明图2所示实施例,只有主用状态的计算节点获取训练程序包,并将所获取的训练程序包部署到执行训练任务的各台计算节点,也就是说,并不是每台计算节点都从管理设备中获取程序包,降低了网络带宽压力。
作为一种实施方式,在图1S103之后、或图2S206之后,还可以包括如下方案:
如果第一计算节点的状态为主用状态,第一计算节点检测到所述执行训练任务的各台计算节点均成功部署所述训练程序包后,生成标记文件,并将所述标记文件发送至所述各台计算节点。
本领域技术人员可以理解,图1、图2所示实施例中只是对程序包进行了部署,而在本实施方式中,可以进一步检测是否部署成功。在上述一种实施方式中,主节点通过InfiniBand网络拷贝的方式,来完成从节点训练程序包的部署,因此,主节点可以判断每次拷贝是否成功,进而检测本次训练任务的程序包是否全部拷贝成功。
主节点在检测到执行本次训练任务的程序包全部拷贝成功后,也就是此次训练程序包部署成功后,可以生成标记文件,并将该标记文件发送给执行本次训练任务的各台计算节点,这样,其他从节点也就得到了部署成功的消息。
在所述执行训练任务的各台计算节点均成功部署所述训练程序包后,运行所述训练程序包,进行数据训练,也就是执行训练任务。
根据上面内容描述,训练任务可以为各种机器学习过程中对大量数据进行学习训练的任务,比如,基于人工神经网络的深度学习。在执行训练任务之前,可以利用本方案在分布式系统中进行训练程序包的部署,部署完成之后,系统中的计算节点便可以进行数据训练,执行训练任务。
在上述“主节点生成标记文件”的实施方式中,可以通过该标记文件来判断训练程序包是否部署成功,如果部署成功,则执行本次训练任务的每台计算节点可以运行自身部署的训练程序包,进行数据训练,也就是开始执行训练任务。
作为一种实施方式,如果第一计算节点的状态为主用状态,检测到存在部署所述训练程序包失败的计算节点后,输出用于提示部署失败的第一提示信息。
也就是说,如果发生主节点将训练程序包拷贝到从节点失败的情况,主节点可以输出第一提示信息。举例来说,可以将该第一提示信息输出至管理设备或管理节点,以提示此次程序包部署失败,或者,也可以将第一提示信息直接展示给用户,提示用户此次程序包部署失败。该第一提示信息中可以包含拷贝失败的从节点信息,或者也可以包含拷贝失败的原因,比如,从节点内存已满、网络故障等,以方便相关人员进行后续处理。
另外,在上述“主节点生成标记文件”的实施方式中,如果第一计算节点的状态不为主用状态,判断是否在预设时间段内接收到所述标记文件;如果否,输出用于提示部署失败的第二提示信息。
可以理解,对于从节点来说,如果一段时间内未收到表示部署成功的标记文件,则可以认为此次部署失败,从节点也可以输出提示信息。为了与主节点输出的提示信息进行区分,将主节点输出的提示信息称为第一提示信息,从节点输出的提示信息称为第二提示信息。
对于从节点来说,该预设时间段可以从接收到训练任务信息开始计时,也可以从确定自身状态为从属状态开始计时,也可以从主节点将训练程序包部署到自身设备中开始计时,等等,具体不做限定。
举例来说,可以将该第二提示信息输出至管理设备或管理节点,以提示此次程序包部署失败,或者,也可以将第二提示信息直接展示给用户,提示用户此次程序包部署失败。该第二提示信息中可以包含拷贝失败的原因,比如,内存已满、网络故障等,以方便相关人员进行后续处理。
与上述方法实施例相对应,本发明实施例还提供一种电子设备,该电子设备为分布式系统中的计算节点。
如图3所示,本发明实施例提供的电子设备包括:处理器301、和存储器302,
存储器302,用于存放计算机程序;
处理器301,用于执行存储器302上所存放的程序时,实现如下步骤:
接收训练任务信息,所述训练任务信息中包含执行训练任务的各台计算节点信息;
根据所述训练任务信息,确定所述电子设备的自身状态是否为主用状态;
如果为主用状态,获取训练程序包,并将所获取的训练程序包部署到所述执行训练任务的各台计算节点。
作为一种实施方式,处理器301,还用于执行存储器302上所存放的程序时,实现如下步骤:
在接收训练任务信息之后,解析所述训练任务信息,得到训练程序包的存储地址、执行训练任务的各台计算节点的状态信息及设备地址;
在所述各台计算节点的状态信息中,查找所述电子设备的自身设备地址对应的状态信息;
确定所查找到的状态信息是否为主用状态;
根据所述训练程序包的存储地址,获取所述训练程序包;
根据所述各台计算节点的设备地址,在所述各台计算节点中部署所述训练程序包。
作为一种实施方式,处理器301,还用于执行存储器302上所存放的程序时,实现如下步骤:
如果所述电子设备的自身状态为主用状态,检测到所述执行训练任务的各台计算节点均成功部署所述训练程序包后,生成标记文件,并将所述标记文件发送至所述各台计算节点。
作为一种实施方式,处理器301,还用于执行存储器302上所存放的程序时,实现如下步骤:
如果所述电子设备的自身状态为主用状态,检测到存在部署所述训练程序包失败的计算节点后,输出用于提示部署失败的第一提示信息。
作为一种实施方式,处理器301,还用于执行存储器302上所存放的程序时,实现如下步骤:
如果所述电子设备的自身状态不为主用状态,判断是否在预设时间段内接收到所述标记文件;
如果否,输出用于提示部署失败的第二提示信息。
作为一种实施方式,处理器301,还用于执行存储器302上所存放的程序时,实现如下步骤:
在所述执行训练任务的各台计算节点均成功部署所述训练程序包后,运行所述训练程序包,进行数据训练。
作为一种实施方式,处理器301,还用于执行存储器302上所存放的程序时,实现如下步骤:
通过无限带宽技术Infiniband,将所获取的训练程序包部署到所述执行训练任务的各台计算节点。
上述电子设备提到的存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Ne twork Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Applica tion SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
应用本发明图3所示实施例,只有主用状态的计算节点获取训练程序包,并将所获取的训练程序包部署到执行训练任务的各台计算节点,也就是说,并不是每台计算节点都从管理设备中获取程序包,降低了网络带宽压力。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现如下步骤:
接收训练任务信息,所述训练任务信息中包含执行训练任务的各台计算节点信息;
根据所述训练任务信息,确定自身状态是否为主用状态;
如果为主用状态,获取训练程序包,并将所获取的训练程序包部署到所述执行训练任务的各台计算节点。
作为一种实施方式,还用于实现如下步骤:
在接收训练任务信息之后,解析所述训练任务信息,得到训练程序包的存储地址、执行训练任务的各台计算节点的状态信息及设备地址;
在所述各台计算节点的状态信息中,查找自身设备地址对应的状态信息;
确定所查找到的状态信息是否为主用状态;
根据所述训练程序包的存储地址,获取所述训练程序包;
根据所述各台计算节点的设备地址,在所述各台计算节点中部署所述训练程序包。
作为一种实施方式,还用于实现如下步骤:
如果自身状态为主用状态,检测到所述执行训练任务的各台计算节点均成功部署所述训练程序包后,生成标记文件,并将所述标记文件发送至所述各台计算节点。
作为一种实施方式,还用于实现如下步骤:
如果自身状态为主用状态,检测到存在部署所述训练程序包失败的计算节点后,输出用于提示部署失败的第一提示信息。
作为一种实施方式,还用于实现如下步骤:
如果自身状态不为主用状态,判断是否在预设时间段内接收到所述标记文件;
如果否,输出用于提示部署失败的第二提示信息。
作为一种实施方式,还用于实现如下步骤:
在所述执行训练任务的各台计算节点均成功部署所述训练程序包后,运行所述训练程序包,进行数据训练。
作为一种实施方式,还用于实现如下步骤:
通过无限带宽技术Infiniband,将所获取的训练程序包部署到所述执行训练任务的各台计算节点。
应用本发明所示实施例,只有主用状态的计算节点获取训练程序包,并将所获取的训练程序包部署到执行训练任务的各台计算节点,也就是说,并不是每台计算节点都从管理设备中获取程序包,降低了网络带宽压力。
本发明实施例还提供一种分布式系统,如图4所示,包含至少两台计算节点(计算节点1、计算节点2……计算节点n),每台计算节点用于:
接收训练任务信息,所述训练任务信息中包含执行训练任务的各台计算节点信息;根据所述训练任务信息,确定自身状态是否为主用状态;如果为主用状态,获取训练程序包,并将所获取的训练程序包部署到所述执行训练任务的各台计算节点。
在图4所示系统中,用户设备可以直接将训练任务信息存储至执行训练任务的各台计算节点;或者,可以在系统外设置一台管理设备,该管理设备获取训练任务信息,并解析训练任务信息,确定执行训练任务的各台计算节点,将训练任务信息发送给执行训练任务的各台计算节点。
作为一种实施方式,管理设备可以通过用户设备获取训练任务信息,比如,在web客户端中存储训练任务信息,管理设备从该web客户端上获取训练任务信息。作为主用状态的计算节点,从该管理设备中获取训练程序包。
或者,分布式系统也可以如图5所示,包含多台计算节点及管理节点,管理节点可以获取训练任务信息,并解析训练任务信息,确定执行训练任务的各台计算节点,将训练任务信息发送给执行训练任务的各台计算节点。
作为一种实施方式,管理节点可以通过用户设备获取训练任务信息,比如,在web客户端中存储训练任务信息,管理节点从该web客户端上获取训练任务信息,具体不做限定。作为主用状态的计算节点,从该管理节点中获取训练程序包。
在本发明所示实施例中,为了区分描述,将设置于系统内的管理设备称为管理节点,将设置于系统外的管理设备称为管理设备。
或者,分布式系统也可以如图6、图7所示,包含多台计算节点、管理节点及交换机,具体不做限定。
在图5、图6或图7所示系统中,管理节点,用于获取并存储训练程序包;将所述训练程序包的存储地址添加至训练任务信息;将所述训练任务信息发送给执行训练任务的各台计算节点。
计算节点,具体用于:
接收所述管理节点发送的训练任务信息;解析所述训练任务信息,得到训练程序包的存储地址、执行训练任务的各台计算节点的状态信息及设备地址;在所述各台计算节点的状态信息中,查找自身设备地址对应的状态信息;确定所查找到的状态信息是否为主用状态;如果为主用状态,根据所述训练程序包的存储地址,获取所述训练程序包,并根据所述各台计算节点的设备地址,在所述各台计算节点中部署所述训练程序包。
作为一种实施方式,计算节点还可以用于:
在自身状态为主用状态的情况下:
如果检测到所述执行训练任务的各台计算节点均成功部署所述训练程序包,生成标记文件,并将所述标记文件发送至所述各台计算节点;
如果检测到存在部署所述训练程序包失败的计算节点,向所述管理节点发送用于提示部署失败的第一提示信息。
作为一种实施方式,计算节点还可以用于:
在自身状态不为主用状态的情况下,判断是否在预设时间段内接收到所述标记文件;
如果否,向所述管理节点发送用于提示部署失败的第二提示信息。
作为一种实施方式,计算节点还可以用于:
在所述执行训练任务的各台计算节点均成功部署所述训练程序包后,运行所述训练程序包,进行数据训练。
作为一种实施方式,执行训练任务的各台计算节点之间基于无限带宽技术Infiniband通信连接。
如图7所示,各台计算节点之间可以通过Infiniband网络交换机进行数据交互,计算节点与管理节点之间可以通过以太网交换机,比如千兆以太网交换机进行数据交互。
本领域技术人员可以理解,InfiniBand架构是一种支持多并发链接的“转换线缆”技术,基于InfiniBand架构的网络具有非常高的带宽。本实施方式中,主节点通过InfiniBand网络拷贝的方式,来完成从节点训练程序包的部署,一方面,可以提高训练程序包部署效率,另一方面,充分利用了Infiniband的带宽能力。
或者,各台计算节点之间也可以通过其他网络进行数据交互,比如以太网。以太网与InfiniBand网络可以同时存在,也就是说,在一种实施方式中,系统中各台计算节点可以通过以太网及InfiniBand网络进行数据交互。
下面提供一种具体的实施方式,如图8所示:
1、web客户端中存储训练程序包及训练任务信息。
2、管理节点从web客户端中获取训练程序包及训练任务信息。
3、管理节点将所获取的训练程序包存储至某一位置,并将该训练程序包的存储地址添加至该训练任务信息。
4、管理节点解析该训练任务信息,确定执行训练任务的各台计算节点。
5、通过以太网交换机,将添加了存储地址的训练任务信息发送给4中所确定的各台计算节点,也就是执行训练任务的各台计算节点。
6、计算节点接收管理节点发送的训练任务信息,解析该训练任务信息,得到训练程序包的存储地址、执行训练任务的各台计算节点的状态信息及设备地址。
7、计算节点在解析得到的各台计算节点的状态信息中,查找自身设备地址对应的状态信息。
8、确定所查找到的状态信息是否为主用状态。主用状态的计算节点为主节点,从属状态的计算节点为从节点。
9、如果为主用状态,根据解析得到的训练程序包的存储地址,获取该训练程序包。
10、主节点根据解析得到的各台计算节点的设备地址,通过无限带宽技术Infiniband,将所获取的训练程序包部署到执行本次训练任务的各台从节点。
11、主节点检测到执行训练任务的各台从节点均成功拷贝该训练程序包后,生成标记文件,并将所述标记文件发送至各台从节点。
12、如果主节点检测到训练程序包拷贝失败的从节点,输出第一提示信息至管理节点,或者,如果从节点在预设时间段内未接收到所述标记文件,输出第二提示信息至管理节点。
13、如果12中的情况未发生,执行训练任务的各台计算节点均成功部署训练程序包后,则各台计算节点运行自身部署的训练程序包,进行数据训练。
如果进行程序包部署时,系统中每台计算节点都从管理节点中获取训练程序包,会造成网络拥堵。举例来说,系统中针对多个训练任务进行程序包的部署,其中,计算节点1——计算节点5需要部署针对训练任务A的程序包,计算节点6——计算节点10需要部署针对训练任务B的程序包,计算节点11——计算节点15需要部署针对训练任务C的程序包。如果这15台计算节点都需要从管理节点中获取程序包,管理节点与各台计算节点之间的网络带宽压力较大。
而本发明实施例中,针对每个训练任务,指定一个主节点,只有主节点从管理节点中获取程序包,也就是说,只有3台计算节点从管理节点中获取程序包,降低了管理节点与各台计算节点之间的网络带宽压力。
另一方面,主节点获取程序包后,将程序包部署到执行训练任务的从节点中,主节点与从节点之间的数据交互不同于计算节点与管理节点之间的数据交互,主节点与从节点之间的数据交互可以利用InfiniBand网络或其他系统内部网络,带宽高,速度快,提高了程序包部署效率。
应用本发明所示实施例,只有主用状态的计算节点获取训练程序包,并将所获取的训练程序包部署到执行训练任务的各台计算节点,也就是说,并不是每台计算节点都从管理设备中获取程序包,降低了网络带宽压力。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
Claims (15)
1.一种程序包部署方法,其特征在于,应用于分布式系统中的第一计算节点,所述方法包括:
接收训练任务信息,所述训练任务信息中包含执行训练任务的各台计算节点信息;
根据所述训练任务信息,确定所述第一计算节点的状态是否为主用状态;
如果为主用状态,获取训练程序包,并将所获取的训练程序包部署到所述执行训练任务的各台计算节点。
2.根据权利要求1所述的方法,其特征在于,在接收训练任务信息之后,所述方法还包括:
解析所述训练任务信息,得到训练程序包的存储地址、执行训练任务的各台计算节点的状态信息及设备地址;
所述根据所述训练任务信息,确定所述第一计算节点的状态是否为主用状态,包括:
在所述各台计算节点的状态信息中,查找所述第一计算节点的设备地址对应的状态信息;
确定所查找到的状态信息是否为主用状态;
所述获取训练程序包,包括:
根据所述训练程序包的存储地址,获取所述训练程序包;
所述将所获取的训练程序包部署到所述执行训练任务的各台计算节点,包括:
根据所述各台计算节点的设备地址,在所述各台计算节点中部署所述训练程序包。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
如果所述第一计算节点的状态为主用状态,检测到所述执行训练任务的各台计算节点均成功部署所述训练程序包后,生成标记文件,并将所述标记文件发送至所述各台计算节点。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
如果所述第一计算节点的状态为主用状态,检测到存在部署所述训练程序包失败的计算节点后,输出用于提示部署失败的第一提示信息。
5.根据权利要求3所述的方法,其特征在于,所述方法还包括:
如果所述第一计算节点的状态不为主用状态,判断是否在预设时间段内接收到所述标记文件;
如果否,输出用于提示部署失败的第二提示信息。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在所述执行训练任务的各台计算节点均成功部署所述训练程序包后,运行所述训练程序包,进行数据训练。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述将所获取的训练程序包部署到所述执行训练任务的各台计算节点,包括:
通过无限带宽技术Infiniband,将所获取的训练程序包部署到所述执行训练任务的各台计算节点。
8.一种电子设备,其特征在于,包括:存储器和处理器,其中,
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-7任一所述的方法步骤。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-7任一所述的方法步骤。
10.一种分布式系统,其特征在于,包括:至少两台计算节点;
所述计算节点,用于接收训练任务信息,所述训练任务信息中包含执行训练任务的各台计算节点信息;根据所述训练任务信息,确定自身状态是否为主用状态;如果为主用状态,获取训练程序包,并将所获取的训练程序包部署到所述执行训练任务的各台计算节点。
11.根据权利要求10所述的系统,其特征在于,所述系统还包括:管理节点;
所述管理节点,用于获取并存储训练程序包;将所述训练程序包的存储地址添加至训练任务信息;将所述训练任务信息发送给执行训练任务的各台计算节点;
所述计算节点,具体用于:
接收所述管理节点发送的训练任务信息;解析所述训练任务信息,得到训练程序包的存储地址、执行训练任务的各台计算节点的状态信息及设备地址;在所述各台计算节点的状态信息中,查找自身设备地址对应的状态信息;确定所查找到的状态信息是否为主用状态;如果为主用状态,根据所述训练程序包的存储地址,获取所述训练程序包,并根据所述各台计算节点的设备地址,在所述各台计算节点中部署所述训练程序包。
12.根据权利要求11所述的系统,其特征在于,所述计算节点,还用于:
在自身状态为主用状态的情况下:
如果检测到所述执行训练任务的各台计算节点均成功部署所述训练程序包,生成标记文件,并将所述标记文件发送至所述各台计算节点;
如果检测到存在部署所述训练程序包失败的计算节点,向所述管理节点发送用于提示部署失败的第一提示信息。
13.根据权利要求12所述的系统,其特征在于,所述计算节点,还用于:
在自身状态不为主用状态的情况下,判断是否在预设时间段内接收到所述标记文件;
如果否,向所述管理节点发送用于提示部署失败的第二提示信息。
14.根据权利要求10所述的系统,其特征在于,所述计算节点,还用于:
在所述执行训练任务的各台计算节点均成功部署所述训练程序包后,运行所述训练程序包,进行数据训练。
15.根据权利要求10-14任一项所述的系统,其特征在于,所述执行训练任务的各台计算节点之间基于无限带宽技术Infiniband通信连接。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710429234.1A CN109032610B (zh) | 2017-06-08 | 2017-06-08 | 一种程序包部署方法、电子设备及分布式系统 |
PCT/CN2018/090263 WO2018224005A1 (zh) | 2017-06-08 | 2018-06-07 | 一种程序包部署方法、电子设备及分布式系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710429234.1A CN109032610B (zh) | 2017-06-08 | 2017-06-08 | 一种程序包部署方法、电子设备及分布式系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109032610A true CN109032610A (zh) | 2018-12-18 |
CN109032610B CN109032610B (zh) | 2024-04-09 |
Family
ID=64566889
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710429234.1A Active CN109032610B (zh) | 2017-06-08 | 2017-06-08 | 一种程序包部署方法、电子设备及分布式系统 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN109032610B (zh) |
WO (1) | WO2018224005A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111723147A (zh) * | 2019-03-21 | 2020-09-29 | 杭州海康威视数字技术股份有限公司 | 基于区块链的数据训练方法、装置及设备、存储介质 |
CN112148468A (zh) * | 2019-06-28 | 2020-12-29 | 杭州海康威视数字技术股份有限公司 | 一种资源调度方法、装置、电子设备及存储介质 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111783968A (zh) * | 2020-06-30 | 2020-10-16 | 山东信通电子股份有限公司 | 一种基于云边协同的输电线路监测方法及系统 |
CN112506955B (zh) * | 2020-12-10 | 2021-09-21 | 星环信息科技(上海)股份有限公司 | 一种查询处理方法、计算机设备及存储介质 |
CN114721804A (zh) * | 2022-04-15 | 2022-07-08 | 支付宝(杭州)信息技术有限公司 | 任务调度方法、装置和电子设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110138396A1 (en) * | 2009-11-30 | 2011-06-09 | International Business Machines Corporation | Method and system for data distribution in high performance computing cluster |
CN102404381A (zh) * | 2011-09-02 | 2012-04-04 | 西安交通大学 | 一种云计算环境下基于工作流的软件部署系统及部署方法 |
CN102546782A (zh) * | 2011-12-28 | 2012-07-04 | 北京奇虎科技有限公司 | 一种分布式系统及其数据操作方法 |
CN103078941A (zh) * | 2012-12-31 | 2013-05-01 | 中金数据系统有限公司 | 一种分布式计算系统的任务调度方法及系统 |
CN105187465A (zh) * | 2014-06-20 | 2015-12-23 | 中国科学院深圳先进技术研究院 | 一种文件的共享方法、装置及系统 |
CN106529673A (zh) * | 2016-11-17 | 2017-03-22 | 北京百度网讯科技有限公司 | 基于人工智能的深度学习网络训练方法及装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9390370B2 (en) * | 2012-08-28 | 2016-07-12 | International Business Machines Corporation | Training deep neural network acoustic models using distributed hessian-free optimization |
CN103744899A (zh) * | 2013-12-25 | 2014-04-23 | 浪潮电子信息产业股份有限公司 | 一种基于分布式环境的海量数据快速分类方法 |
CN104753994B (zh) * | 2013-12-27 | 2019-04-02 | 杭州海康威视系统技术有限公司 | 基于集群服务器系统的数据同步方法及其装置 |
CN105894087A (zh) * | 2015-01-26 | 2016-08-24 | 华为技术有限公司 | 用于神经网络中训练参数集的系统和方法 |
-
2017
- 2017-06-08 CN CN201710429234.1A patent/CN109032610B/zh active Active
-
2018
- 2018-06-07 WO PCT/CN2018/090263 patent/WO2018224005A1/zh active Application Filing
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110138396A1 (en) * | 2009-11-30 | 2011-06-09 | International Business Machines Corporation | Method and system for data distribution in high performance computing cluster |
CN102404381A (zh) * | 2011-09-02 | 2012-04-04 | 西安交通大学 | 一种云计算环境下基于工作流的软件部署系统及部署方法 |
CN102546782A (zh) * | 2011-12-28 | 2012-07-04 | 北京奇虎科技有限公司 | 一种分布式系统及其数据操作方法 |
CN103078941A (zh) * | 2012-12-31 | 2013-05-01 | 中金数据系统有限公司 | 一种分布式计算系统的任务调度方法及系统 |
CN105187465A (zh) * | 2014-06-20 | 2015-12-23 | 中国科学院深圳先进技术研究院 | 一种文件的共享方法、装置及系统 |
CN106529673A (zh) * | 2016-11-17 | 2017-03-22 | 北京百度网讯科技有限公司 | 基于人工智能的深度学习网络训练方法及装置 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111723147A (zh) * | 2019-03-21 | 2020-09-29 | 杭州海康威视数字技术股份有限公司 | 基于区块链的数据训练方法、装置及设备、存储介质 |
CN111723147B (zh) * | 2019-03-21 | 2023-07-25 | 杭州海康威视数字技术股份有限公司 | 基于区块链的数据训练方法、装置及设备、存储介质 |
CN112148468A (zh) * | 2019-06-28 | 2020-12-29 | 杭州海康威视数字技术股份有限公司 | 一种资源调度方法、装置、电子设备及存储介质 |
CN112148468B (zh) * | 2019-06-28 | 2023-10-10 | 杭州海康威视数字技术股份有限公司 | 一种资源调度方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2018224005A1 (zh) | 2018-12-13 |
CN109032610B (zh) | 2024-04-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109032610A (zh) | 一种程序包部署方法、电子设备及分布式系统 | |
CN104866465B (zh) | 敏感文本检测方法及装置 | |
CN105051687B (zh) | 应用部署方法和设备 | |
CN108289034B (zh) | 一种故障发现方法和装置 | |
CN106572173A (zh) | 一种配置信息更新方法、装置和系统 | |
CN109741060A (zh) | 信息查询系统、方法、装置、电子设备及存储介质 | |
CN107566150A (zh) | 处理云资源的方法和物理节点 | |
CN110489391A (zh) | 一种数据处理方法及相关设备 | |
US8478803B2 (en) | Management of logical statements in a distributed database environment | |
CN104636437B (zh) | 一种事件通知方法、监听器的处理方法及装置 | |
CN107612833A (zh) | 一种基于存储系统的uri路由方法及相关装置 | |
CN109194617A (zh) | Xml报文的自动解析、封装方法和装置 | |
CN109933774A (zh) | 语义识别方法、装置存储介质和电子装置 | |
CN109840533A (zh) | 一种应用拓扑图识别方法及装置 | |
CN105939323A (zh) | 数据包过滤方法及装置 | |
CN103856462A (zh) | 一种会话的管理方法及系统 | |
CN106095579A (zh) | 容器资源分配方法及装置 | |
CN107888419A (zh) | 一种交换机网络拓扑生成方法及装置 | |
CN108259555B (zh) | 参数的配置方法及装置 | |
CN110048899A (zh) | 一种日志检测方法、装置、终端及服务器 | |
CN109710676A (zh) | Cmdb模型的数据获取方法、装置及电子设备 | |
CN107609197A (zh) | 一种数据同步方法、数据同步装置及移动终端 | |
CN109831473A (zh) | 物流服务提供方法及设备 | |
CN104012053B (zh) | 查找装置及方法 | |
CN113672776B (zh) | 一种故障分析方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |