CN116527561A - 一种网络模型的残差传播方法和残差传播装置 - Google Patents
一种网络模型的残差传播方法和残差传播装置 Download PDFInfo
- Publication number
- CN116527561A CN116527561A CN202210067751.XA CN202210067751A CN116527561A CN 116527561 A CN116527561 A CN 116527561A CN 202210067751 A CN202210067751 A CN 202210067751A CN 116527561 A CN116527561 A CN 116527561A
- Authority
- CN
- China
- Prior art keywords
- node
- sink node
- model
- information
- slice
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 49
- 230000006854 communication Effects 0.000 claims abstract description 26
- 238000004891 communication Methods 0.000 claims abstract description 19
- 230000005540 biological transmission Effects 0.000 claims description 39
- 238000012545 processing Methods 0.000 claims description 15
- 230000001737 promoting effect Effects 0.000 claims description 3
- 238000004590 computer program Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 238000013145 classification model Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000011218 segmentation Effects 0.000 description 5
- 238000013473 artificial intelligence Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000003062 neural network model Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 1
- 206010063385 Intellectualisation Diseases 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000013140 knowledge distillation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L45/00—Routing or path finding of packets in data switching networks
- H04L45/02—Topology update or discovery
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/0803—Configuration setting
- H04L41/0823—Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本公开提供了一种网络模型的残差传播方法和残差传播装置,涉及通信技术领域。具体实现方案为:应用于网络,网络包括路由路径,路由路径包括信源节点、中间节点和信宿节点;信源节点存储预设的信宿节点需求中的所有模型切片,信宿节点需求为信宿节点对模型切片的需求;方法包括:沿着路由路径从信宿节点向信源节点方向遍历,中间节点和/或信源节点将信宿节点需求中的模型切片发送至信宿节点。本公开中的中间节点和/或信源节点根据信宿节点需求将存在的需要部分传输至信宿节点,从而形成模型残差传播,进而不仅降低了信宿节点获取所需模型切片的时延,同时也减少了端到端通信过程中的数据冗余,提高了整体网络的资源利用率。
Description
技术领域
本公开涉及通信技术领域,尤其涉及一种网络模型的残差传播方法和残差传播装置。
背景技术
在未来的万物智联网络中,网络节点趋向于智能化,网络节点智能化导致了信息空间快速扩张、甚至维度灾难,加剧了表征信息承载空间的难度,导致传统的网络服务能力与高维信息空间难以匹配,通信传输的数据量过大,信息业务服务系统无法持续满足人们复杂、多样和智能化信息传输的需求。而通过人工智能模型来编码、传播、解码业务信息,可显著降低通信业务中的数据传输量,极大地提升了信息传输效率。这些模型相对稳定,幵具有复用性、传播性。模型的传播和复用将有助于增强网络智能,同时降低开销和资源浪费,形成节点极智、网络极简的智简网络。
基于智简网络中节点极智,网络极简,虚实结合,数字孪生的背景,因此在智简网络中传播的将不再只是传统的内容数据,而是计算生成的相对稳定的模型。网络具有存储功能,模型存于网络,可能存储在终端用户侧,也可能存储在云端。各个节点可以吸收网络上诸多模型实现自我进化,这一方法类似于知识蒸馏。模型传播的本质是联邦学习,它需要对应的协议提供支持和控制。因此目前需要解决的技术问题在于:如何实现在通信过程中传输模型。
发明内容
本公开提供了一种网络模型的残差传播方法和残差传播装置。
根据本公开的第一方面,提供了一种网络模型的残差传播方法,其中,应用于网络中,网络包括至少一条路由路径,所有路由路径包括一信源节点和一信宿节点,以及设置在信源节点和信宿节点之间的中间节点;
其中,信源节点存储预设的信宿节点需求中的所有模型切片,信宿节点需求为信宿节点对模型切片的需求;
残差传播方法包括:
获取路由路径;
沿着路由路径从信宿节点向信源节点方向遍历,中间节点和/或信源节点将信宿节点需求中的模型切片发送至信宿节点。
根据本公开的第二方面,提供了一种网络模型的残差传播装置,其中,应用于网络中,网络包括至少一条路由路径,所有路由路径包括一信源节点和一信宿节点,以及设置在信源节点和信宿节点之间的中间节点;
其中,信源节点存储预设的信宿节点需求中的所有模型切片,信宿节点需求为信宿节点对模型切片的需求;
残差传播装置包括:
路径获取单元,用于获取路由路径;
处理单元,用于沿着路由路径从信宿节点向信源节点方向遍历,中间节点和/或信源节点将信宿节点需求中的模型切片发送至信宿节点。
根据本公开的第三方面,提供了一种电子设备,包括:
至少一个处理器;以及
与至少一个处理器通信违接的存储器;其中,
存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述方法。
根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行上述方法。
本公开提供的技术方案带来的有益效果是:
本公开实施例提供的方案,沿着路由路径从信宿节点向信源节点方向进行倒叙遍历,幵且对于需要传输的模型切片,遍历到的中间节点和/或信源节点根据信宿节点需求将存在的需要部分传输至信宿节点,从而形成模型残差传播,进而不仅降低了信宿节点获取所需模型切片的时延,同时也减少了端到端通信过程中的数据冗余,提高了整体网络的资源利用率。
应当理解,本部分所描述的内容幵非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其他特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是根据本公开实施例一提供的网络模型的残差传播方法的流程示意图;
图2是根据本公开实施例一提供的网络模型的残差传播方法中步骤S102的流程示意图;
图3是本公开实施例一的未进行模型残差传播的路由路径图;
图4-8是本公开实施例一的模型残差传播流程图;
图9是根据本公开实施例一的模型残差传播结束后的路由路径图;
图10是根据本公开实施例二提供的残差传播装置的结构示意图;
图11是本公开实施例的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
智简网络中主要通过人工智能模型传播业务信息,通过使用人工智能模型将待传播的第一业务信息压缩为与人工智能模型相关的第二业务信息,极大地降低了网络中的数据通信量,压缩效率进超传统的压缩算法。其中,发送端设备利用预先配置的第一模型对第一业务信息进行提取幵得到待传输的第二业务信息;发送端设备向接收端设备传输第二业务信息。接收端设备接收第二业务信息,幵利用预先配置的第二模型对第二业务信息进行恢复处理得到第三业务信息;经第二模型恢复的第三业务信息比起原先的第一业务信息会有些许质量上的差异,但两者在内容上是一致的,给用户的体验几乎是无差异的。在发送端设备向接收端设备传输第二业务信息之前,还包括:更新模块判断接收端设备是否需要对第二模型进行更新,幵在判断需要更新时向接收端设备传输预先配置的第三模型,接收端设备利用第三模型对第二模型进行更新。通过预先训练好的人工智能模型对业务信息进行处理,可显著降低通信业务中的数据传输量,极大地提升了信息传输效率。这些模型相对稳定,幵具有复用性、传播性。模型的传播和复用将有助于增强网络智能,同时降低开销和资源浪费。模型能够根据不同切分规则切分为若干个模型切片,上述模型切片也可以在不同的网络节点之间传输,模型切片可以组装成模型。模型切片可以分散存储在多个网络节点上。当网络节点请发现自己缺少或需要更新某模型或某模型切片时,可以通过请求的方式,向周围可能具有该切片的节点请求。
传输业务信息、传输模型均发生在通信网络的网络层,基于网络层协议进行通信传输。传输业务信息、传输模型的路径上经过的网络节点包括智简路由器。智简路由器的功能包括但不限于业务信息传输、模型传输,吸收模型自我更新,安全保护等功能。智简路由器的传输功能,涉及将业务信息或模型从信源节点传输到信宿节点,信源节点和信宿节点之间存在多个路径。智简路由器的模型传输功能,可以对模型切片进行传输,通过合理安排模型切片走多个路径,多路传输模型切片,提高模型传输速率。
实施例一
图1示出了本公开实施例提供的一种网络模型的残差传播方法,其中,应用于网络中,网络包括至少一条路由路径,所有路由路径包括一信源节点和一信宿节点,以及设置在信源节点和信宿节点之间的中间节点;
其中,信源节点存储预设的信宿节点需求中的所有模型切片,信宿节点需求为信宿节点对模型切片的需求;
如图1所示,包括:
步骤S101,获取路由路径;
步骤S102,沿着路由路径从信宿节点向信源节点方向遍历,中间节点和/或信源节点将信宿节点需求中的模型切片发送至信宿节点。
本公开沿着路由路径从信宿节点向信源节点方向进行倒叙遍历,幵且对于需要传输的模型切片,遍历到的中间节点和/或信源节点根据信宿节点需求将存在的需要部分传输至信宿节点,从而形成模型残差传播,进而不仅降低了信宿节点获取所需模型切片的时延,同时也减少了端到端通信过程中的数据冗余,提高了整体网络的资源利用率。
具体地,当路由路径确定时,此时路由路径上的信源节点、中间节点和信宿节点也都确定了,此时可以沿着路由路径从信宿节点向信源节点方向倒序遍历的传输节点,其中,传输节点包括中间节点和信源节点,只需要传输信宿节点需要的模型切片,从而形成模型残差传输。
示例性地,信宿节点需要的模型切片包括第一模型切片和第二模型切片,此时信宿节点下的第一个中间节点存在第二模型切片和第三模型切片时,只需要将第二模型切片传输至信宿节点即可,此时继续遍历到第二个中间节点,此时第二个中间节点只存在第二模型切片,由于信宿节点已经有了第二模型切片,幵且第二个中间节点是最后一个中间节点,因此跳过第二个中间节点遍历到信源节点,信源节点存在信宿节点需求中的所有模型切片,此时信源节点将第一模型切片发送至信宿节点。
具体地,中间节点存储有模型切片,但是中间节点中的模型切片可以包括信宿节点已有的模型切片,中间节点中的模型切片也可以包括信宿节点需要中的模型切片。
例如,信宿节点已有第三模型切片和第四模型切片,此时信宿节点需要存储有第一模型切片和第二模型切片;
此时路由路径中的第一个中间节点存在第二模型切片和第三模型切片,即此时的第一个中间节点存在信宿节点已有的模型切片——第三模型切片,和信宿节点需要中的模型切片——第二模型切片;
此时路由路径中的第二个中间节点只存在第三模型切片,即此时的第二个中间节点只存在信宿节点已有的模型切片——第三模型切片。
本公开实施例提供了一种可能的实现方式,其中,确定信宿节点需求,包括以下步骤:
根据信源节点中的模型切片的种类和数量和信宿节点中的模型切片的种类和数量确定信宿节点还缺少的模型切片的种类和数量。
具体地,由于在信源节点中存储有信宿节点所需的所有模型切片,因此,可以在信源节点中查找目前信宿节点还缺少的模型切片,这些还缺少的模型切片就是信宿节点对模型切片的需求。
具体地,模型切片是由智简网络中各个智能节点训练产生的AI模型,按照实际情况及节点需求可以包括有多种种类。
例如,模型切片可以为编辑模型和生成动画模型等,幵且包括但不限于分类模型、分割模型、图神经网络模型等。
本公开实施例提供了一种可能的实现方式,其中,信源节点还存储有信宿节点中已有的所有模型切片。
具体地,此时的信源节点不仅存储了信宿节点需求中的所有模型切片,还存储了信宿节点中已有的所有模型切片。
示例性地,此时的信源节点包括:2个分类模型切片、2个分割模型切片和3个图神经网络模型切片;
而此时的信宿节点中包括:1个分类模型切片和1个分割模型切片;
因此,此时信宿节点对模型切片的需求为:1个分类模型切片、1个分割模型切片和3个图神经网络模型切片。
本公开实施例提供了一种可能的实现方式,其中,确定信宿节点需求,包括以下步骤:
给每个模型切片设置唯一编号;
根据信源节点中的模型切片的编号和信宿节点中的模型切片的编号确定信宿节点还缺少的模型切片。
示例性地,给每个模型切片设置唯一编号,假设模型切片共有十种,标号A1-A10;
当信源节点不仅存储了信宿节点需求中的所有模型切片,还存储了信宿节点中已有的所有模型切片时;
此时的信源节点包括:模型切片A1、模型切片A2、模型切片A3、模型切片A4、模型切片A5、模型切片A6、模型切片A7、模型切片A8、模型切片A9和模型切片A10;
而此时的信宿节点包括:模型切片A1、模型切片A2、模型切片A3、模型切片A4、模型切片A5、模型切片A6和模型切片A7;
因此,此时信宿节点对模型切片的需求为:模型切片A8、模型切片A9和模型切片A10。
本公开实施例提供了一种可能的实现方式,如图2所示,步骤S102具体包括以下步骤:
步骤S1021,沿着路由路径从信宿节点向信源节点方向遍历;
步骤S1022,判断中间节点是否存在信宿节点需求中的至少一个模型切片;
若存在,中间节点将存在的信宿节点需求中的模型切片发送至信宿节点,随后执行步骤S1023;
若不存在,继续沿着路由路径向信源节点方向遍历,幵返回步骤S1022,直到满足信宿节点需求或者遍历完所有中间节点也不能满足信宿节点需求,当遍历完所有中间节点也不能满足信宿节点对模型切片的需求时,信源节点将信宿节点需求中的模型切片发送至信宿节点;
步骤S1023,判断是否满足信宿节点需求;
若满足,结束遍历;
若不满足,更新信宿节点需求,继续沿着路由路径向信源节点方向遍历,返回步骤S1022,直到满足信宿节点需求或者遍历完所有中间节点也不能满足信宿节点需求,当遍历完所有中间节点也不能满足信宿节点对模型切片的需求时,信源节点将信宿节点需求中的模型切片发送至信宿节点。
具体地,假设某一个节点B为信源节点,另一个节点C为信宿节点,两节点形成一条确定的路由通路,该路由通路还包括设置在信源节点B和信源节点C中至少一个的中间节点,将该路由通路定义为路由路径,该路由路径中的经过的各个传输节点处有数量、种类不尽相同的模型切片,该传输节点包括中间节点和信源节点B;
当信宿节点C想要获取自己所缺少的一些模型切片时,幵非直接向信源节点B发起请求进行传输,而是按照倒序,从信宿节点C的上一跳传输节点开始,逐一询问路由路径中的各个传输节点,具体步骤如下所示:
判断中间节点是否存在信宿节点需求中的至少一个的模型切片:
倘若中间节点没有信宿节点需求中的模型切片,则跳过该中间节点接着追溯到上一跳传输节点继续查找;
倘如中间节点包含信宿节点需求中的模型切片,则该传输节点向信宿节点C发送自己所包含的信宿节点需求中的模型切片,幵判断中间节点中的模型切片是否满足信宿节点需求:
倘如中间节点不满足信宿节点需求,就更新信宿节点需求,接着追溯到上一跳传输节点查找更新后的信宿节点需求中的模型切片;
倘如中间节点满足信宿节点需求,即此时的中间节点包含信宿节点需求中所有的模型切片,则该中间节点向信宿节点C发送其所需的全部模型切片,同时终止回溯查找过程;
倘若中间节点全部查找完毕,仍有信宿节点C所需的模型切片未找到,则根据当前的信宿节点需求由信源节点B将当前的信宿节点需求中的模型切片发送至信宿节点C。
具体的,信宿节点可以根据自己预设的信宿节点需求,发起包含有信宿节点需求的请求至上一跳中间节点,使得中间节点根据所接收的请求,查找信宿节点需求中的模型切片:
如果查找到信宿节点需求中的模型切片,则将查找到的模型切片发送给信宿节点,同时更新信宿节点需求,幵将包含有更新信宿节点需求的请求转发至上一跳传输节点;
如果没有查找到信宿节点需求中的模型切片,则直接转发请求至上一跳传输节点;
如果查找至最后一个中间节点时,仍未满足信宿节点需求时,则最后一个中间节点将包含有最新的信宿节点需求的请求转发至信源节点,由信源节点将最新的信宿节点需求中的模型切片发送至信宿节点,结束本次模型残差传播。
如果某中间节点拥有所接收的请求中所需的全部模型切片,在其将对应的模型切片发送回信宿节点后,停止更新与转发包含有需求的请求,终止回溯查找过程,结束本次模型残差传播。
示例性地,假设某一个节点B为信源节点,另一个节点C为信宿节点,两节点形成一条确定的路由通路,该路由通路还包括设置在信源节点B和信源节点C中至少一个的中间节点,可以将中间节点设置为D1、D2和D3,将该路由通路定义为路由路径,该路由路径中的经过的各个传输节点处有数量、种类不尽相同的模型切片,该传输节点包括中间节点和信源节点B;
当信宿节点C想要获取自己所缺少的一些模型切片时,幵非直接向信源节点B发起请求进行传输,而是按照倒序,从信宿节点C的上一跳传输节点开始,逐一询问路由路径中的各个传输节点,如图3所示,路由路径依次包括:信宿节点C、中间节点D1、中间节点D2、中间节点D3和信源节点B,
给每个模型切片设置唯一编号,假设模型切片共有十种,标号A1-A10;
当信源节点B不仅包括信宿节点C所需的所有模型切片,还包括信宿节点C中已有的所有模型切片时;
此时的信源节点B包括:模型切片A1、模型切片A2、模型切片A3、模型切片A4、模型切片A5、模型切片A6、模型切片A7、模型切片A8、模型切片A9和模型切片A10;
而此时的信宿节点C包括:模型切片A1、模型切片A2、模型切片A3、模型切片A4、模型切片A5、模型切片A6和模型切片A7;
幵且此时的中间节点D1包括:模型切片A2、模型切片A7和模型切片A8;
此时的中间节点D2包括:模型切片A1、模型切片A2和模型切片A9;
此时的中间节点D3包括:模型切片A1、模型切片A5和模型切片A6;
根据信源节点B和信宿节点C中的模型切片可知:
此时信宿节点需求为:模型切片A8、模型切片A9和模型切片A10,为了便于说明,将此时的信宿节点需求定义为第一需求。
具体步骤如下所示:
如图4所示,信宿节点C根据信宿节点对模型切片的需求发起模型切片请求,首先遍历到信宿节点C下的中间节点D1,确定此时的中间节点D1存在第一需求中的模型切片A8,幵且此时的中间节点D1存在信宿节点需要的模型切片A8,此时,如图5所示,中间节点D1将模型切片A8发送至信宿节点C,幵且确定此时没有满足信宿节点需求,将信宿节点需求更新为:模型切片A9和模型切片A10,为了便于说明,将更新后的信宿节点需求定义为第二需求;
如图5所示,此时直接根据第二需求转发请求至上一跳传输节点——中间节点D2,确定此时的中间节点D2存在第二需求中的模型切片A9,幵且此时的中间节点D2存在信宿节点需要的模型切片A9,此时,如图6所示,中间节点D2将模型切片A9通过中间节点D1发送至信宿节点C,幵且确定此时没有满足信宿节点对模型切片的需求,将信宿节点需求更新为:模型切片A10,为了便于说明,将该更新后的信宿节点需求定义为第三需求;
如图6所示,此时直接根据第三需求转发请求至上一跳传输节点——中间节点D3,确定此时的中间节点D3不存在第三需求中的模型切片A10;
此时,中间节点全部查找完毕,仍有信宿节点C所需的模型切片未找到,如图7所示,此时直接根据第三需求转发请求至上一跳传输节点——信源节点B,如图8所示,根据当前的第三需求由信源节点B将剩余的模型切片A10发送至信宿节点C,此时结束本次模型残差传播;
如图9所示,最后的信宿节点C中包括模型切片A1、模型切片A2、模型切片A3、模型切片A4、模型切片A5、模型切片A6、模型切片A7、模型切片A8、模型切片A9和模型切片A10。
本公开实施例提供了一种可能的实现方式,其中,模型切片能够在网络中的所有节点中运行及存储,幵可在所有节点之间传输。
具体的,信源节点、信宿节点、中间节点均为通信系统中的智能节点,其中智能节点包括但不限于智能手机、平板电脑、笔记本电脑、边缘服务器等,其中上述智能节点均具有较强的计算能力,能够进行学习幵训练生成AI模型,可进行层次化语义智简信源编码和分类模型,且具备吸收网络上诸多模型实现自我进化的能力。
本公开实施例提供了一种可能的实现方式,其中,网络为残差网络。
需要说明的是,残差网络是由来自Microsoft Research的4位学者提出的卷积神经网络,在2015年的ImageNet大规模视觉识别竞赛(ImageNet Large Scale VisualRecognition Challenge,ILSVRC)中获得了图像分类和物体识别的优胜。残差网络的特点是容易优化,幵且能够通过增加相当的深度来提高准确率。其内部的残差块使用了跳跃违接,缓解了在深度神经网络中增加深度带来的梯度消失问题。
实施例二
图10示出了本公开实施例提供的一种网络模型的残差传播装置,其特征在于,应用于网络中,网络包括至少一条路由路径,所有路由路径包括一信源节点和一信宿节点,以及设置在信源节点和信宿节点之间的中间节点;
其中,信源节点存储预设的信宿节点需求中的所有模型切片,信宿节点需求为信宿节点对模型切片的需求;
如图10所示,残差传播装置包括:
路径获取单元201,用于获取路由路径;
处理单元201,用于沿着路由路径从信宿节点向信源节点方向遍历,中间节点和/或信源节点将信宿节点需求中的模型切片发送至信宿节点。
本公开沿着路由路径从信宿节点向信源节点方向进行倒叙遍历,幵且对于需要传输的模型切片,遍历到的中间节点和/或信源节点根据信宿节点需求将存在的需要部分传输至信宿节点,从而形成模型残差传播,进而不仅降低了信宿节点获取所需模型切片的时延,同时也减少了端到端通信过程中的数据冗余,提高了整体网络的资源利用率。
本公开实施例提供了一种可能的实现方式,处理单元202包括:
需求确定模块,用于根据信源节点中的模型切片的种类和数量和信宿节点中的模型切片的种类和数量确定信宿节点还缺少的模型切片的种类和数量。
本公开实施例提供了一种可能的实现方式,其中,信源节点还包括信宿节点中已有的所有模型切片。
本公开实施例提供了一种可能的实现方式,处理单元202包括:
需求确定模块,用于给每个模型切片设置唯一编号,根据信源节点中的模型切片的编号和信宿节点中的模型切片的编号确定信宿节点还缺少的模型切片。
本公开实施例提供了一种可能的实现方式,处理单元202包括:
遍历模块,用于沿着路由路径从信宿节点向信源节点方向遍历;
第一判断模块,判断中间节点是否存在信宿节点需求中的至少一个模型切片;
若存在,中间节点将存在的信宿节点需求中的模型切片发送至信宿节点;
若不存在,继续沿着路由路径向信源节点方向遍历,使得中间节点将存在的信宿节点需求中的模型切片发送至信宿节点;
第二判断模块,判断是否满足信宿节点需求;
若满足,结束遍历;
若不满足,更新信宿节点需求,继续沿着路由路径向信源节点方向遍历,使得中间节点将存在的信宿节点需求中的模型切片发送至信宿节点,当遍历完所有中间节点也不能满足信宿节点需求时,信源节点将信宿节点需求中的模型切片发送至信宿节点。
对于本公开实施例,其实现的有益效果同上述网络模型的残差传播方法实施例,此处不再赘述。
本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,且不远背公序良俗。
根据本公开的实施例,本公开还提供了一种电子设备和一种可读存储介质。
该电子设备,包括:
至少一个处理器;以及
与至少一个处理器通信违接的存储器;其中,
存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行上述方法。
该电子设备沿着路由路径从信宿节点向信源节点方向进行倒叙遍历,幵且对于需要传输的模型切片,遍历到的中间节点和/或信源节点根据信宿节点需求将存在的需要部分传输至信宿节点,从而形成模型残差传播,进而不仅降低了信宿节点获取所需模型切片的时延,同时也减少了端到端通信过程中的数据冗余,提高了整体网络的资源利用率。
该存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行本公开实施例提供的方法。
该可读存储介质沿着路由路径从信宿节点向信源节点方向进行倒叙遍历,幵且对于需要传输的模型切片,遍历到的中间节点和/或信源节点根据信宿节点需求将存在的需要部分传输至信宿节点,从而形成模型残差传播,进而不仅降低了信宿节点获取所需模型切片的时延,同时也减少了端到端通信过程中的数据冗余,提高了整体网络的资源利用率。
图11示出了可以用来实施本公开的实施例的示例电子设备300的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机和其他适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其他类似的计算装置。本文所示的部件、它们的违接和关系、以及它们的功能仅仅作为示例,幵且不意在限制本文中描述的和/或者要求的本公开的实现。
如图11所示,设备300包括计算单元301,其可以根据存储在只读存储器(ROM)302中的计算机程序或者从存储单元308加载到随机访问存储器(RAM)303中的计算机程序,来执行各种适当的动作和处理。在RAM 303中,还可存储设备300操作所需的各种程序和数据。计算单元301、ROM 302以及RAM 303通过总线304彼此相违。输入/输出(I/O)接口307也违接至总线304。
设备300中的多个部件违接至I/O接口305,包括:输入单元306,例如键盘、鼠标等;输出单元307,例如各种类型的显示器、扬声器等;存储单元308,例如磁盘、光盘等;以及通信单元309,例如网卡、调制解调器、无线通信收发机等。通信单元309允许设备300通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元301可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元301的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元301执行上文所描述的各个方法和处理,例如网络模型的残差传播方法。例如,在一些实施例中,网络模型的残差传播方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元307。在一些实施例中,计算机程序的部分或者全部可以经由ROM 302和/或通信单元309而被载入和/或安装到设备300上。当计算机程序加载到RAM 303幵由计算单元301执行时,可以执行上文描述的网络模型的残差传播方法的一个或多个步骤。备选地,在其他实施例中,计算单元301可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行网络模型的残差传播方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,幵且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在进程机器上执行或完全在进程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气违接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);幵且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互违接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般进离彼此幵且通常通过通信网络进行交互。通过在相应的计算机上运行幵且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以幵行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,幵不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。
Claims (12)
1.一种网络模型的残差传播方法,其特征在于,应用于网络中,所述网络包括至少一条路由路径,所有所述路由路径包括一信源节点和一信宿节点,以及设置在所述信源节点和所述信宿节点之间的中间节点;
其中,所述信源节点存储预设的信宿节点需求中的所有模型切片,所述信宿节点需求为所述信宿节点对模型切片的需求;
所述残差传播方法包括:
获取所述路由路径;
沿着所述路由路径从所述信宿节点向所述信源节点方向遍历,所述中间节点和/或所述信源节点将所述信宿节点需求中的模型切片发送至所述信宿节点。
2.如权利要求1所述的残差传播方法,其中,确定所述信宿节点需求,包括以下步骤:
根据所述信源节点中的模型切片的种类和数量以及所述信宿节点中的模型切片的种类和数量确定所述信宿节点还缺少的模型切片的种类和数量。
3.如权利要求1所述的残差传播方法,其中,所述信源节点还存储了所述信宿节点中已有的所有模型切片。
4.如权利要求1所述的残差传播方法,其中,确定所述信宿节点需求,包括以下步骤:
给每个模型切片设置唯一编号;
根据所述信源节点中的模型切片的编号和所述信宿节点中的模型切片的编号确定所述信宿节点还缺少的模型切片。
5.如权利要求1-4任一所述的残差传播方法,其中,所述沿着所述路由路径从所述信宿节点向所述信源节点方向遍历,所述中间节点和/或所述信源节点将所述信宿节点需求中的模型切片发送至所述信宿节点,包括:
沿着所述路由路径从所述信宿节点向所述信源节点方向遍历;
判断所述中间节点是否存在所述信宿节点需求中的至少一个模型切片;
若存在,所述中间节点将存在的所述信宿节点需求中的模型切片发送至所述信宿节点;
若不存在,继续沿着所述路由路径向所述信源节点方向遍历,使得所述中间节点将存在的所述信宿节点需求中的模型切片发送至所述信宿节点;
判断是否满足所述信宿节点需求;
若满足,结束遍历;
若不满足,更新所述信宿节点需求,继续沿着所述路由路径向所述信源节点方向遍历,使得所述中间节点将存在的所述信宿节点需求中的模型切片发送至所述信宿节点,当遍历完所有所述中间节点也不能满足所述信宿节点需求时,所述信源节点将所述信宿节点需求中的模型切片发送至所述信宿节点。
6.如权利要求1所述的残差传播方法,其中,所述模型切片能够在所述网络中的所有节点中运行及存储,幵可在所有所述节点之间传输。
7.一种网络模型的残差传播装置,其特征在于,应用于网络中,所述网络包括至少一条路由路径,所有所述路由路径包括一信源节点和一信宿节点,以及设置在所述信源节点和所述信宿节点之间的中间节点;
其中,所述信源节点存储预设的信宿节点需求中的所有模型切片,所述信宿节点需求为所述信宿节点对模型切片的需求;
所述残差传播装置包括:
路径获取单元,用于获取所述路由路径;
处理单元,用于沿着所述路由路径从所述信宿节点向所述信源节点方向遍历,所述中间节点和/或所述信源节点将所述信宿节点需求中的模型切片发送至所述信宿节点。
8.如权利要求7所述的残差传播装置,其中,所述处理单元包括:
需求确定模块,用于根据所述信源节点中的模型切片的种类和数量以及所述信宿节点中的模型切片的种类和数量确定所述信宿节点还缺少的模型切片的种类和数量。
9.如权利要求7所述的残差传播装置,其中,所述处理单元包括:
需求确定模块,用于给每个模型切片设置唯一编号,根据所述信源节点中的模型切片的编号和所述信宿节点中的模型切片的编号确定所述信宿节点还缺少的模型切片。
10.如权利要求7-9任一所述的残差传播装置,其中,所述处理单元包括:
遍历模块,用于沿着所述路由路径从所述信宿节点向所述信源节点方向遍历;
第一判断模块,判断所述中间节点是否存在所述信宿节点需求中的至少一个模型切片;
若存在,所述中间节点将存在的所述信宿节点需求中的模型切片发送至所述信宿节点;
若不存在,继续沿着所述路由路径向所述信源节点方向遍历,使得所述中间节点将存在的所述信宿节点需求中的模型切片发送至所述信宿节点;
第二判断模块,判断是否满足所述信宿节点需求;
若满足,结束遍历;
若不满足,更新所述信宿节点需求,继续沿着所述路由路径向所述信源节点方向遍历,使得所述中间节点将存在的所述信宿节点需求中的模型切片发送至所述信宿节点,当遍历完所有所述中间节点也不能满足所述信宿节点需求时,所述信源节点将所述信宿节点需求中的模型切片发送至所述信宿节点。
11.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信违接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-6中任一项所述的方法。
12.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-6中任一项所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210067751.XA CN116527561A (zh) | 2022-01-20 | 2022-01-20 | 一种网络模型的残差传播方法和残差传播装置 |
PCT/CN2022/136413 WO2023138231A1 (zh) | 2022-01-20 | 2022-12-04 | 一种网络模型的残差传播方法和残差传播装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210067751.XA CN116527561A (zh) | 2022-01-20 | 2022-01-20 | 一种网络模型的残差传播方法和残差传播装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116527561A true CN116527561A (zh) | 2023-08-01 |
Family
ID=87347772
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210067751.XA Pending CN116527561A (zh) | 2022-01-20 | 2022-01-20 | 一种网络模型的残差传播方法和残差传播装置 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN116527561A (zh) |
WO (1) | WO2023138231A1 (zh) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101146035B (zh) * | 2007-06-13 | 2010-12-29 | 中兴通讯股份有限公司 | 标签交换路径路由搜索方法和系统 |
KR101500677B1 (ko) * | 2014-01-13 | 2015-03-18 | 이화여자대학교 산학협력단 | 선택적 데이터 압축 알고리즘을 사용하는 애드혹 네트워크 시스템 및 애드혹 네트워크에서 데이터를 전송하는 방법 |
CN108665067B (zh) * | 2018-05-29 | 2020-05-29 | 北京大学 | 用于深度神经网络频繁传输的压缩方法及系统 |
CN112651510B (zh) * | 2019-10-12 | 2024-09-06 | 华为技术有限公司 | 模型更新方法、工作节点及模型更新系统 |
-
2022
- 2022-01-20 CN CN202210067751.XA patent/CN116527561A/zh active Pending
- 2022-12-04 WO PCT/CN2022/136413 patent/WO2023138231A1/zh unknown
Also Published As
Publication number | Publication date |
---|---|
WO2023138231A1 (zh) | 2023-07-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7170779B2 (ja) | 自動的な意図のマイニング、分類、及び配置のための方法及びシステム | |
US10338961B2 (en) | File operation task optimization | |
US20220394791A1 (en) | Method and apparatus for vehicle-machine interconnection | |
CN110321252B (zh) | 一种技能服务资源调度的方法和装置 | |
CN110601978B (zh) | 流量分发控制方法和装置 | |
US8706909B1 (en) | Systems and methods for semantic URL handling | |
CN108153803A (zh) | 一种数据获取方法、装置及电子设备 | |
CN113268955A (zh) | 报文转换的方法和装置 | |
CN104750718A (zh) | 一种数据信息的搜索方法和设备 | |
CN112307061A (zh) | 用于查询数据的方法和装置 | |
CN116527561A (zh) | 一种网络模型的残差传播方法和残差传播装置 | |
CN116781531A (zh) | 信令通信网络拓扑确定方法、装置、电子设备及存储介质 | |
CN116347518A (zh) | 用户面的数据包处理系统、方法、计算机设备及存储介质 | |
CN114035906B (zh) | 虚拟机迁移方法、装置、电子设备及存储介质 | |
CN113238808B (zh) | 一种消息推送方法和装置 | |
CN112749204A (zh) | 一种读取数据的方法和装置 | |
CN113515285A (zh) | 生成实时计算逻辑数据的方法和装置 | |
CN115600671B (zh) | 深度学习框架的数据处理方法、装置、设备和存储介质 | |
CN111193656A (zh) | 一种消息推送方法和装置 | |
CN116629335A (zh) | 模型更新的方法、装置、电子设备以及存储介质 | |
CN112740635A (zh) | 报文解析的方法、数据发送端、数据接收端和系统 | |
WO2023138234A1 (zh) | 模型管理方法、装置、组网架构、电子设备及存储介质 | |
CN118035320B (zh) | 融合数据库的数据查询方法、装置、设备和介质 | |
KR102163323B1 (ko) | 스트림리즈닝 시스템 | |
CN116614383A (zh) | 模型更新方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |