CN113434459B - 基于生成对抗网络的片上网络任务映射方法 - Google Patents

基于生成对抗网络的片上网络任务映射方法 Download PDF

Info

Publication number
CN113434459B
CN113434459B CN202110738562.6A CN202110738562A CN113434459B CN 113434459 B CN113434459 B CN 113434459B CN 202110738562 A CN202110738562 A CN 202110738562A CN 113434459 B CN113434459 B CN 113434459B
Authority
CN
China
Prior art keywords
mapping
training
network
sample
power consumption
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110738562.6A
Other languages
English (en)
Other versions
CN113434459A (zh
Inventor
陈亦欧
何秋璇
余霞
胡剑浩
朱会柱
董亚宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
China Aeronautical Radio Electronics Research Institute
Original Assignee
University of Electronic Science and Technology of China
China Aeronautical Radio Electronics Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China, China Aeronautical Radio Electronics Research Institute filed Critical University of Electronic Science and Technology of China
Priority to CN202110738562.6A priority Critical patent/CN113434459B/zh
Publication of CN113434459A publication Critical patent/CN113434459A/zh
Application granted granted Critical
Publication of CN113434459B publication Critical patent/CN113434459B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • G06F15/76Architectures of general purpose stored program computers
    • G06F15/78Architectures of general purpose stored program computers comprising a single central processing unit
    • G06F15/7807System on chip, i.e. computer system on a single chip; System in package, i.e. computer system on one or more chips in a single package
    • G06F15/7825Globally asynchronous, locally synchronous, e.g. network on chip
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/06Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
    • G06N3/063Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using electronic means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computer Hardware Design (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Microelectronics & Electronic Packaging (AREA)
  • Physiology (AREA)
  • Genetics & Genomics (AREA)
  • Neurology (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明属于通信技术领域,具体涉及一种基于生成对抗网络的片上网络任务映射方法。该方法包括如下步骤:本方法通过遗传算法得到该任务流图向资源流图的映射方案,作为待优化映射;并通过待优化映射训练生成对抗网络的鉴别器和生成器,并通过评价函数比较生成样本和训练样本二者在多目标优化问题下的优越性,并取性能优越者,对生成对抗网络的生成器和鉴别器进行反复迭代训练,当迭代次数达到预设次数时输出映射结果。本发明通过遗传算法得到的待优化映射对生成对抗网络进行训练,并在训练结束后输出映射结果;得到的映射结果改善了遗传算法中存在的解过早收敛且局部最优的问题,因而可以很大程度上接近全局最优解。

Description

基于生成对抗网络的片上网络任务映射方法
技术领域
本发明属于通信技术领域,具体涉及一种基于生成对抗网络的片上网络任务映射方法。
背景技术
随着半导体工艺技术和集成电路的迅速发展,片上系统(System-on-Chip,SoC)的集成度越来越高,同时由于IP核之间的通信量急剧增加,总线负载量增加,传统的总线结构暴露出同步困难、传输效率低、可扩展性差等问题,将使其无法满足数十个乃至上百个IP核的通信需求。作为新一代的片上互连通信模式,片上网络(Network-on-Chip,NoC)将互联网思想移植到片上系统中,通过分离通信和计算两部分,很好地解决了传统总线结构存在的问题,从而实现IP核之间的数据通信。
由于大部分大型网络的设计目标是尽可能地达到网络的最佳性能(如:吞吐量、平均包延时等),其网络计算延时和功耗会受到一定的限制。而NoC映射技术决定了任务与NoC中的IP核之间的关联,即映射方案确定了任务在NoC平台的位置,不同的映射结果往往造成NoC系统在实时性、计算时间和功耗等多方面的差异,因此对映射算法进行优化是实现NoC低功耗和低延时的重要手段,对系统性能具有十分重要的影响。
在NoC映射问题中,随着网络尺寸的增长,其映射解可搜索空间呈阶乘式递增,属于NP难问题(on-Deterministic Polynomial-Hard,NP)即多项式复杂程度的非确定性难问题。目前,研究人员针对NoC映射问题已经设计出诸多的优化算法,其中遗传算法(GeneticsAlgorithm,GA)相较其他启发式算法而言,具有收敛性好的优点,能够解决NoC映射解空间的NP难问题。在多目标映射问题下,由于大型网络任务流图节点数过于庞大,利用遗传算法进行映射后的解搜索空间过大,计算复杂度高,比较容易陷入局部最优解中。
现有技术为解决遗传算法容易陷入局部最优解这一问题,大都对遗传算法进行改进。如学术文献“张保岗,韩国栋,汤先拓.基于改进量子遗传算法的片上网络多目标映射技术[J].计算机应用与软件,2020,37(08):115-121.”其通过改进的量子遗传算法来解决片上网络映射问题;又如申请号为201110283124.1的中国专利文献,其公开了一种基于蚁群混沌遗传算法的片上网络映射方法;其通过引入混沌模型的方法加大遗传算法的突变概率,从而避免遗传算法停滞于局部最优解的问题;这些现有技术仅从改进遗传算法配置参数的角度出发,从而改善遗传算法得到的映射结果停滞于局部最优解的问题。
发明内容
本发明的目的在于克服现有技术中所存在的上述不足,提供一种基于生成对抗网络的片上网络任务映射方法。
为了实现上述发明目的,本发明提供了以下技术方案:
一种基于生成对抗网络的片上网络任务映射方法,所述方法包括如下步骤:
A.获取任务流图和资源流图,并通过遗传算法得到该任务流图向资源流图的映射,作为待优化映射;对所述待优化映射进行标准化处理,得到训练样本;
B.建立生成对抗网络,将所述训练样本输入至所述生成对抗网络;
C.通过所述生成对抗网络的生成器生成与训练样本格式相同的生成样本,并输出生成样本;固定生成器,将所述训练样本和所述生成样本输入鉴别器,用于对鉴别器进行训练,当鉴别器的判别结果满足第一目标函数时,鉴别器训练结束;
D.固定鉴别器,使用所述生成对抗网络的生成器重新生成与训练样本格式相同的生成结果,将并所述生成结果和所述训练样本输入鉴别器鉴别,用于对生成器进行训练,当鉴别器的判别结果满足第二目标函数时,生成器训练结束;
E.通过评价函数,评价所述生成样本和所述训练样本二者的性能;并选择多目标优化性能优异者作为下次迭代的训练样本返回步骤C,重复步骤C~E;
F迭代达到预设次数后,使用生成器生成映射结果。
所述评价函数用于评价在多目标优化问题下评价对象的功耗性能和延时性能。
进一步的是,所述步骤E中,将所述训练样本随机匹配一生成样本,通过所述评价函数,评价所述训练样本和所述生成样本二者的功耗和延时,取优者作为下一次迭代的训练样本。
进一步的是,所述评价函数对功耗和延时加权求和,用于表征所述生成结果或所述训练样本二者在多目标优化问题上的性能;所述功耗通过功耗模型得到,所述延时通过延时模型得到;
进一步的是,所述第一目标函数为:
Figure BDA0003140688600000031
所述第二目标函数为:
Figure BDA0003140688600000041
其中,z~fz(z)是由生成器随机生成的限定范围内的噪声,即生成器生成的生成样本或生成结果,x~fr(x)是真实样本数据即训练样本;
Figure BDA0003140688600000042
为在输入服从分布为fr(x)的训练样本后,判别器将其判定为真的概率的数学期望;
Figure BDA0003140688600000043
为在输入服从分布为fz(z)的噪声后,判别器将其判定为真的概率的负对数的数学期望。
进一步的是,所述功耗模型的表达式为:
P=PP+PR+PL
其中PP,PR,PL分别表示由PE、路由器和NoC链路三者产生的功耗;
所述延时模型的表达式为:
Figure BDA0003140688600000044
其中第一项表示的是PE的处理延时总和;直连边e(i,j)的两端节点i,j分别映射到PEm,PEn上,Pem到PEn经过的跳数为hm,n,映射后的链路传输延时Te(i,j),单跳路由平均交换延时为TA,第二项表示的是链路传输延时和路由交换延时的总和;
所述评价函数的表达式为:
y=αdD(M)+αeP(M)
其中M∈MAP,MAP为所有映射方案的集合,D(M)和P(M)分别表示当前映射方案产生的延时和功耗,αd和αe为权重系数。
进一步的是,所述生成对抗网络的生成器为四层全连接网络,第一层为标准化层,中间两层使用Leaky ReLu层,最后一层使用Sigmoid激活函数,所述生成器的损失函数为BSE函数;
所述鉴别器为三层全连接网络,第一层为标准化层,第二层为Leak ReLu层、最后一层使用Sigmoid激活函数。
同时本发明还提供一种可读存储介质,其上存储有计算机程序,所述程序被计算机执行以实现上述映射方法。
同时本发明还提供一种基于生成对抗网络的片上网络任务映射装置,包括至少一个处理器,以及与所述至少一个处理器通信连接的至少一个存储器;所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的映射方法。
与现有技术相比,本发明的有益效果为:本发明将生成对抗网络与遗传算法结合,通过遗传算法得到的待优化映射作为初始训练对生成对抗网络进行训练,同时使用评价函数来控制训练样本的迭代更新;很好的解决了利用遗传算法进行映射优化,会陷入局部最优解的问题,使用本发明提出的映射方法得到的映射结果可以改善遗传算法中存在的解过早收敛且局部最优的问题,因而可以很大程度上接近全局最优解。
附图说明:
图1为本发明示例性实施例提供的基于生成对抗网络的片上网络映射方法的整体流程图;
图2为本发明示例性实施例提出的4X4 2D-Mesh NoC结构图;
图3为本发明示例性实施例提出的NoC映射示意图;
图4为本发明示例性实施例提出的基于生成对抗网络的片上网络映射方法处理MMSE-IRC算法时和处理SVD算法时与传统遗传算法、Pareto前沿的最优解集对比图;
图5为本发明示例性实施例提出的基于生成对抗网络的片上网络映射方法在处理MMSE-IRC算法时和处理SVD算法时与遗传算法的多目标优化性能对比图。
具体实施方式
下面结合试验例及具体实施方式对本发明作进一步的详细描述。但不应将此理解为本发明上述主题的范围仅限于以下的实施例,凡基于本发明内容所实现的技术均属于本发明的范围。
实施例1
图1示出了本实施例提供的基于生成对抗网络的片上网络映射方法的整体流程图,如图1所示,本方法包括如下步骤:
A.获取任务流图和资源流图,并通过遗传算法得到该任务流图向资源流图的映射,作为待优化映射;对所述待优化映射进行标准化处理,得到训练样本;
B.建立生成对抗网络,将所述训练样本输入至所述生成对抗网络;
C.通过所述生成对抗网络的生成器生成与训练样本格式相同的生成样本,并输出生成样本;固定生成器,将所述训练样本和所述生成样本输入鉴别器,用于对鉴别器进行训练,当鉴别器的判别结果满足第一目标函数时,鉴别器训练结束;
D.固定鉴别器,使用所述生成对抗网络的生成器重新生成与训练样本格式相同的生成结果,将并所述生成结果和所述训练样本输入鉴别器鉴别,用于对生成器进行训练,当鉴别器的判别结果满足第二目标函数时,生成器训练结束;
E.通过评价函数,评价所述生成样本和所述训练样本二者的性能;并选择多目标优化性能优异者作为下次迭代的训练样本返回步骤C,重复步骤C~E;
F迭代达到预设次数后,使用生成器生成映射结果。
其中,在步骤B中可以将遗传算法得到的所有映射方案全部作为待优化映射也可以从中随机选取部分作为待优化映射经,也可以通过本实施例提出的评价函数,选取多目标性能相对优异者作为待优化映射;是否对遗传算法得到的映射方案进行选取,以及如何选取,可以依据实际使用情况灵活选择。
需要说明的是,所述步骤E中,将所述训练样本随机匹配一生成样本,通过所述评价函数,评价所述训练样本和所述生成样本二者的功耗和延时,取优者作为下一次迭代的训练样本。通过给每一个训练样本随机匹配一个生成样本进行比较可以保证每次迭代的训练样本其总数一致,有利于节省计算量。
同时,在迭代的初期,生成样本与训练样本二者的多目标优化性能差距不大,即生成样本的多目标优化性能不明显优于训练样本,此时下一轮迭代的训练样本中,来自初始遗传算法得到的映射依旧占大多数,只有少量来自生成器的生成样本;随着迭代次数的进行,生成对抗网络不断向遗传算法中多目标性能优异的方案和生成器自身上一次迭代生成的多目标性能优异方案学习,其生成样本的多目标性能会明显优于训练样本,此时下一轮迭代的训练样本中生成器生成的生成样本会占大多数,只有少量来自初始遗传算法得到的映射;此时我们认为这一部分来自初始遗传算法得到的映射在一定程度上接近了全局最优解,此时生成对抗网络向这一小部分全局最优解和之前迭代生成的多目标性能优异方案学习;迭代预设次数后,生成对抗网络生成的生成样本可以很大程度上接近全局最优解,使用生成样本进行映射可以即节约能耗又能减少延时。
其中,所述评价函数对功耗和延时加权求和,用于表征所述生成结果或所述训练样本二者在多目标优化问题上的性能;所述功耗通过功耗模型得到,所述延时通过延时模型得到;
片上网络中的延时主要来自于IP核处理数据时的耗时以及数据在片上网络传输过程中的耗时。其中对于单个IP核在处理任务时的时间消耗,只与核的类型相关;数据传输中的延时主要是来自于连接线上的物理延时以及数据包解析时的延时。在不同的NoC平台中,链路传输延时始终受传输的数据量、数据传输速率和并行线路总数的影响;路由节点的交换延时通过M/G/1排队论相关内容获取,学术界已有研究表明M/G/1应用在任务映射问题上的有效性。因此本实施例所采用的延时模型包括三个方面:PE处理延时、片上网络Tile间的链路传输延时和路由节点交换延时,本实施例所采用的延时模型的表达式为:
Figure BDA0003140688600000081
其中第一项表示的是PE的处理延时总和;直连边e(i,j)的两端节点i,j分别映射到PEm,PEn上,PEm到PEn经过的跳数为hm,n,映射后的链路传输延时Te(i,j),单跳路由平均交换延时为TA,第二项表示的是链路传输延时和路由交换延时的总和。
片上网络中消耗的总能量由IP核在处理任务中的耗能及数据通信过程中的耗能两部分组成。目前业内提出了很多NoC通信功耗模型,如:T.T.Ye等人在学术文献Ye T T,Micheli G D,Benini L.Analysis of Power Consumption on Switch Fabricsin[J].2002.中针对路由交换结构提出了位功耗的概念,提出了一种功耗模型,而Hu等人于学术文献Hu J,Marculescu R.Energy-and performance-aware mapping for regular NoCarchitectures[J].IEEE Transactions on Computer Aided Design of IntegratedCircuits&Systems,2005,24(4):551-562.。提出了面向NoC映射问题的平均功耗并构建相应的功耗模型。
然而上面提到的两种功耗模型是针对NoC的网络部分建立的,并没有考虑到PE内部可能产生的功耗。因此考虑到NoC和PE的功耗在模型参数、计算方式甚至单位等方面都存在差异,本实施例采用以某一个功耗值为单位,通过一定的比例表示、衡量两者的功耗,以合并求解NoC和PE两者产生的整体功耗,该功耗模型的表达式为:
P=PP+PR+PL
其中PP,PR,PL分别表示由PE、路由器和NoC链路三者产生的功耗;具体使用时可以以单个系统时钟周期且PE满负载时的峰值功耗值ep为基本功耗单位,则静态功耗、路由器的峰值功耗以及链路传输的峰值功耗均可表示成ep的倍数。
在单目标优化的NoC映射问题范畴,往往只考虑单个性能指标,然而在多目标优化问题中,多个目标之间通常是相互制约的,因此无法使全部指标都得到优化,从而需要在优化指标之间进行妥协。而目标函数的设计决定了映射算法优化的方向,因此实施例确立了以延时和功耗为多目标的片上网络映射优化方向,采用线性加权求和法作为多目标映射优化求解问题的评价函数。
在单目标优化的NoC映射问题范畴,往往只考虑单个性能指标,然而在多目标优化问题中,多个目标之间通常是相互制约的,因此无法使全部指标都得到优化,从而需要在优化指标之间进行妥协。而目标函数的设计决定了映射算法优化的方向;本实施例在确立了以延时和功耗为多目标的片上网络映射优化方向上,采用线性加权求和法提出了一种用于多目标映射优化求解问题的评价函数。所述评价函数的表达式为:
y=αdD(M)+αeP(M)
其中M∈MAP,MAP为所有映射方案的集合,D(M)和P(M)分别表示当前映射方案产生的延时和功耗。
具体使用时,可以根据延时和功耗的重要程度确定权值αd和αe,二者需满足αd≥0,αe≥0,αde=1。当αd=1时只做延时优化;当αe=1时只做功耗优化;当0<αd<1,0<αe<1时,折中优化延时和功耗。
进一步的是,所述第一目标函数为:
Figure BDA0003140688600000101
所述第二目标函数为:
Figure BDA0003140688600000102
其中鉴别器网络D的优化通过maxD V(D,G)实现,V(D,G)为D的目标函数,该函数表达式的第一部分
Figure BDA0003140688600000103
代表着,在输入服从分布为fr(x)的样本数据后,D将其判定为真的概率的数学期望;该表达式的第二部分
Figure BDA0003140688600000104
代表着,在输入服从分布为fz(z)的噪声后,D将其判定为真的概率的负对数的数学期望,D(G(z))越小,该期望值越大,也意味着鉴别器越好。而生成器网络G的设计目标是minG maxD V(D,G),即实现鉴别器目标函数最大值的最小化,从而不断缩小真实数据与生成数据之间的差距。
同时,本实施例还提供一种可读存储介质,其上存储有计算机程序,所述程序被计算机执行以实现上述优化方法。
同时,本实施例还提供一种基于生成对抗网络的片上网络任务映射装置,包括至少一个处理器,以及与所述至少一个处理器通信连接的至少一个存储器;所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的映射方法。
实施例2
在实施例1的基础上,采用Pytorch构建生成对抗网络模型,在Windows系统下,使用Matlab R2016b进行仿真,并对本发明示例性实施例提出的一种基于生成对抗网络的片上网络任务映射方法进行仿真验证。
本实施例使用的生成对抗网络的生成器结构采用Pytorch构建,其结构如下:
生成器为四层全连接网络,第一层为标准化层,中间两层使用Leaky ReLu层,最后一层使用Sigmoid激活函数,所述生成器的损失函数为BSE函数;初始学习率可以设置为0.00008。
鉴别器为三层全连接网络,第一层为标准化层,第二层为Leak ReLu层、最后一层使用Sigmoid激活函数,鉴别器的损失函数为BSE函数;初始学习率可以设置为0.00005。
本实施例中使用的遗传算法参数设置如下:种群规模为20,遗传解求解次数为50。选择算子概率为50%、代沟为100%;交叉算子选择单点交叉,其概率为50%;变异算子选择基因位变异,其概率为10%。并将遗传算法得到的全部遗传解作为待优化映射输入至生成对抗网络,作为第一次迭代的训练样本。预设迭代次数为250次
本实施例里采取Adam优化器对学习率进行优化,损失值函数采用二元交叉熵(BSE)损失函数,同时采用小批量随机梯度下降(SGD)算法分别针对无线网络通信系统的接收机设计中的经典算法:MMSE-IRC和SVD算法进行训练。
本实施例中使用的评价函数,其αd可以设置为0.5,αe可以设置为0.5。
图2示出了一种4X4 2D-Mesh Noc结构图,其NoC系统参数设置如下:采用4×4 2D-Mesh NoC结构,系统时钟频率为250MHz,数据传输速率为50Mbps,并行传输线路数为32,路由器平均交换时延为1e-8秒,单处理器满负载功耗ep=1,单通道满数据位传输功耗、单交换节点工作功耗和分别是eL=eR=ep,静态功耗ef=8%ep。该结构的约束条件设置如下:所有数据节点的运算时间和阈值为0.05秒,同一时刻经过同一条传输链路的所有路径的传输延时阈值为0.1秒。
图3示出了一种NoC映射示意图,本实施例针对无线通信系统的接收机设计中的经典算法:MMSE-IRC和SVD算例使用本发明实施例提供的优化方法进行求解。通过本发明示例性实施例提出的功耗模型和延时模型分别求得gan网络处理后的、传统遗传算法的和暴力搜索得到的映射方案。其中暴力搜索得到的映射方案在本实施例中可视为全局最优解,但因其计算量庞大,在实际的使用中仅将其作为参考映射方案,并不会使用。
图4(a)中示出了采用本发明提出的映射方法在处理MMSE-IRC算法时的功耗与延时与传统遗传算法和暴力搜索得到的映射方案对比图;图4(b)中示出了采用本发明提出的映射方法在处理SVD算例时的功耗与延时与传统遗传算法和暴力搜索得到的映射方案对比图;从图中可以得到在延时和功耗的双目标上,两个算例的整体解比原遗传解更加逼近利用暴力搜索得到的Pareto前沿。在MMSE-IRC算例中,通过GAN后处理优化取得的最优解集与单纯使用遗传最优解集相比,至少能够在功耗上降低24.49%,延时减少10.89%;在SVD中,能够在功耗上降低17.54%,延时减少8.77%,显示出通过GAN后处理作用于双目标优化上的良好性能。
在多目标优化问题中,本示例性实施例采用反世代距离值(InVertedGenerational Distance,IGD)这一指标去评价不同算法在多目标优化问题上的综合性能。其中IGD的计算公式为:
Figure BDA0003140688600000131
其中,P是在根据所选算法获取的点集,|P|是点集规模大小;v是点集P中的点,Q是Pareto前沿上的最优解,在求解规模较大的问题中,可以使用暴力搜索法获取,可以先选取几个分布比较均匀的解作为Pareto前沿。d(v,Q)代表点集P中的每个点v到Q的距离,该距离通过目标值直接的差距计算而成。IGD的整个表达式即计算算法所求的点集到Pareto前沿上的最小距离的平均值。
当算法的收敛性和分布性都好时,
Figure BDA0003140688600000132
的值偏小,当收敛性较差、分布性较好时,则意味着d(v,Q)的值大小不一,其总和偏大;而当分布性较差时、收敛性较好时,d(v,Q)基本都偏大,其总和偏大;因此,IGD的值越小,算法的综合性能,即算法的收敛性、分布性能越好。
图5(a)中示出了采用本发明示例性实施例提出的映射方法和传统遗传算法处理MMSE-IRC算法时二者的IGD值对比图;图5(b)中示出采用本发明示例性实施例提出的映射方法和传统遗传算法处理SVD算法时二者的IGD值对比图;从图中可以得到随着迭代次数的增加,遗传算法最优解适应度逐渐变大;随着遗传解的优化,意味着其提供给生成对抗网络训练样本也更加优化,因此,生成对抗网络的的生成样本最优解适应度也逐渐变大,且始终优于遗传最优解的适应度。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种基于生成对抗网络的片上网络任务映射方法,其特征在于,所述方法包括如下步骤:
A.获取任务流图和资源流图,并通过遗传算法得到该任务流图向资源流图的映射,作为待优化映射;对所述待优化映射进行标准化处理,得到训练样本;
B.建立生成对抗网络,将所述训练样本输入至所述生成对抗网络;
C.通过所述生成对抗网络的生成器生成与训练样本格式相同的生成样本,并输出生成样本;固定生成器,将所述训练样本和所述生成样本输入鉴别器,用于对鉴别器进行训练,当鉴别器的判别结果满足第一目标函数时,鉴别器训练结束;
D.固定鉴别器,使用所述生成对抗网络的生成器重新生成与训练样本格式相同的生成结果,并输出生成结果;将并所述生成结果和所述训练样本输入鉴别器鉴别,用于对生成器进行训练,当鉴别器的判别结果满足第二目标函数时,生成器训练结束;
E.通过评价函数,评价所述生成样本和所述训练样本二者的性能;并选择多目标优化性能优异者作为下次迭代的训练样本返回步骤C,重复步骤C~E;
F迭代达到预设次数后,使用生成器生成映射结果;
所述步骤E中,将所述训练样本随机匹配一生成样本,通过所述评价函数,评价所述训练样本和所述生成样本二者的功耗和延时,取优者作为下一次迭代的训练样本;其中,所述功耗通过功耗模型得到,所述延时通过延时模型得到;所述功耗模型的表达式为:
P=PP+PR+PL
其中,PP,PR,PL分别表示由PE、路由器和NoC链路三者产生的功耗;其中,在求解时,采用以PE、路由器或NoC链路的功耗值为单位,通过一定的比例表示另外两者的功耗;以合并求解NoC和PE两者产生的整体功耗。
2.如权利要求1所述的一种映射方法,其特征在于,所述评价函数对功耗和延时加权求和,用于表征所述生成结果或所述训练样本二者在多目标优化问题上功耗和延时整体的性能。
3.如权利要求1所述的一种映射方法,其特征在于,所述第一目标函数为:
Figure FDA0003773733260000021
所述第二目标函数为:
Figure FDA0003773733260000022
其中,z~fz(z)是由生成器随机生成的限定范围内的噪声,即生成器生成的生成样本或生成结果,x~fr(x)是真实样本数据即训练样本;
Figure FDA0003773733260000023
为在输入服从分布为fr(x)的训练样本后,判别器将其判定为真的概率的数学期望;
Figure FDA0003773733260000025
为在输入服从分布为fz(z)的噪声后,判别器将其判定为真的概率的负对数的数学期望。
4.如权利要求1所述的一种映射方法,其特征在于,
所述延时模型的表达式为:
Figure FDA0003773733260000024
其中第一项表示的是PE的处理延时总和;直连边e(i,j)的两端节点i,j分别映射到PEm,PEn上,Pem到PEn经过的跳数为hm,n,映射后的链路传输延时为Te(i,j),单跳路由平均交换延时为TA,第二项表示的是链路传输延时和路由交换延时的总和;
所述评价函数的表达式为:
y=αdD(M)+αeP(M)
其中M∈MAP,MAP为所有映射方案的集合,D(M)和P(M)分别表示当前映射方案产生的延时和功耗,αd和αe为权重系数。
5.如权利要求1-4任意一项所述的一种映射方法,其特征在于,所述生成对抗网络的生成器为四层全连接网络,第一层为标准化层,中间两层使用LeakyReLu层,最后一层使用Sigmoid激活函数,所述生成器的损失函数为BSE函数;
所述鉴别器为三层全连接网络,第一层为标准化层,第二层为Leak ReLu层、最后一层使用Sigmoid激活函数。
6.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机可读指令,当计算机读取并执行所述计算机可读指令时,使得计算机执行如权利要求1-5任意一项所述的映射方法。
7.一种基于生成对抗网络的片上网络任务映射装置,其特征在于,包括至少一个处理器,以及与所述至少一个处理器通信连接的至少一个存储器;所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-5中任一项所述的映射方法。
CN202110738562.6A 2021-06-30 2021-06-30 基于生成对抗网络的片上网络任务映射方法 Active CN113434459B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110738562.6A CN113434459B (zh) 2021-06-30 2021-06-30 基于生成对抗网络的片上网络任务映射方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110738562.6A CN113434459B (zh) 2021-06-30 2021-06-30 基于生成对抗网络的片上网络任务映射方法

Publications (2)

Publication Number Publication Date
CN113434459A CN113434459A (zh) 2021-09-24
CN113434459B true CN113434459B (zh) 2022-09-02

Family

ID=77758137

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110738562.6A Active CN113434459B (zh) 2021-06-30 2021-06-30 基于生成对抗网络的片上网络任务映射方法

Country Status (1)

Country Link
CN (1) CN113434459B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102129482A (zh) * 2010-01-13 2011-07-20 电子科技大学 一种基于混沌离散粒子群优化的片上网络映射方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5417755B2 (ja) * 2007-10-23 2014-02-19 株式会社リコー 情報処理装置、情報処理方法及びプログラム
CN108153592B (zh) * 2017-12-22 2021-09-17 北京工业大学 一种基于改进遗传算法的NoC映射方法
KR102045017B1 (ko) * 2018-02-12 2019-11-29 송우상 이미지/텍스트 기반 디자인 생성 장치 및 방법
US20200394459A1 (en) * 2019-06-17 2020-12-17 Nvidia Corporation Cell image synthesis using one or more neural networks
CN110533221A (zh) * 2019-07-29 2019-12-03 西安电子科技大学 基于生成式对抗网络的多目标优化方法
US20210049465A1 (en) * 2019-08-12 2021-02-18 University Of Southern California Self-optimizing and self-programming computing systems: a combined compiler, complex networks, and machine learning approach
CN110990130B (zh) * 2019-10-28 2023-05-12 华东师范大学 一种可再生自适应计算卸载分层服务质量优化方法
CN111401528A (zh) * 2020-03-31 2020-07-10 中山大学 基于模拟退火遗传算法的生成对抗网络过采样方法及装置
CN111614215B (zh) * 2020-05-11 2021-11-12 东南大学 一种基于生成对抗网络的电动汽车用驱动电机设计方法
CN111723997A (zh) * 2020-06-23 2020-09-29 上海电科智能系统股份有限公司 一种基于gan的城市重大交通事故数据样本自动生成方法
CN112884671B (zh) * 2021-02-26 2024-02-20 南京航空航天大学 一种基于无监督生成对抗网络的模糊图像复原方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102129482A (zh) * 2010-01-13 2011-07-20 电子科技大学 一种基于混沌离散粒子群优化的片上网络映射方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
永磁球形步进电机位置检测在NOC中的并行实现;雍爱霞;《微电机》;20100628(第06期);第43-47页 *

Also Published As

Publication number Publication date
CN113434459A (zh) 2021-09-24

Similar Documents

Publication Publication Date Title
CN107172166B (zh) 面向工业智能化服务的云雾计算系统
Zhang et al. A survey of multiobjective evolutionary algorithms
Mhemed et al. An energy efficient fuzzy logic cluster formation protocol in wireless sensor networks
CN113285831A (zh) 网络行为知识智能学习方法、装置、计算机设备及存储介质
Wang et al. Latency-aware mapping for 3D NoC using rank-based multi-objective genetic algorithm
CN111526555B (zh) 基于遗传算法的多跳路由路径选择方法
CN111191955B (zh) 基于相依马尔可夫链的电力cps风险区域预测方法
CN107343303B (zh) 无线Mesh网络中基于对偶分解的路由优化方法
Qureshi et al. Attack resistance-based topology robustness of scale-free internet of things for smart cities
CN113434459B (zh) 基于生成对抗网络的片上网络任务映射方法
Garg et al. Cluster head selection using genetic algorithm in hierarchical clustered sensor network
Yang et al. Research on cognitive radio engine based on genetic algorithm and radial basis function neural network
Chitra et al. A nondominated sorting genetic algorithm for shortest path routing problem
CN113420994B (zh) 一种主动配电网结构灵活性评估方法及系统
CN106526450B (zh) 一种多目标NoC测试规划优化方法
CN102768735A (zh) 基于免疫克隆多目标优化的网络社区划分方法
Li et al. A surrogate-assisted offspring generation method for expensive multi-objective optimization problems
CN113783782B (zh) 一种深度强化学习的机会路由候选集节点排序方法
CN117014355A (zh) 一种基于ddpg深度强化学习算法的tssdn动态路由决策方法
He et al. Improved mapping optimization algorithm based on Generative Adversarial Networks (IMOAG)
Zhang et al. Application of convolutional neural network in multi-channel scenario D2D communication transmitting power control
CN114051217B (zh) 综合能源物联网传感器网络的安全路由方法和系统
Wan et al. An improved space information networks topology algorithm
Jiang et al. A new differential evolution for multiobjective optimization by uniform design and minimum reduce hypervolume
Kharbash et al. All-terminal network reliability optimization in fading environment via cross entropy method

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant