CN116560005A - 一种基于光学互联的芯粒实现方法和系统 - Google Patents
一种基于光学互联的芯粒实现方法和系统 Download PDFInfo
- Publication number
- CN116560005A CN116560005A CN202310853724.XA CN202310853724A CN116560005A CN 116560005 A CN116560005 A CN 116560005A CN 202310853724 A CN202310853724 A CN 202310853724A CN 116560005 A CN116560005 A CN 116560005A
- Authority
- CN
- China
- Prior art keywords
- optical
- optical path
- points
- paths
- pair
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000003287 optical effect Effects 0.000 title claims abstract description 192
- 238000000034 method Methods 0.000 title claims abstract description 47
- 239000007771 core particle Substances 0.000 title claims abstract description 16
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 37
- 230000002068 genetic effect Effects 0.000 claims abstract description 29
- 239000000758 substrate Substances 0.000 claims abstract description 26
- 238000005516 engineering process Methods 0.000 claims abstract description 19
- 238000005457 optimization Methods 0.000 claims abstract description 7
- 230000008054 signal transmission Effects 0.000 claims description 22
- 230000005540 biological transmission Effects 0.000 claims description 17
- 238000005265 energy consumption Methods 0.000 claims description 15
- 238000004364 calculation method Methods 0.000 claims description 7
- 238000003064 k means clustering Methods 0.000 claims description 7
- 238000005452 bending Methods 0.000 claims description 6
- 238000009826 distribution Methods 0.000 claims description 5
- 239000013307 optical fiber Substances 0.000 claims description 4
- 230000003094 perturbing effect Effects 0.000 claims description 3
- 230000010354 integration Effects 0.000 abstract description 7
- 238000004891 communication Methods 0.000 abstract description 6
- 238000003860 storage Methods 0.000 description 20
- 230000006870 function Effects 0.000 description 17
- 230000008859 change Effects 0.000 description 9
- 208000010119 wrinkly skin syndrome Diseases 0.000 description 7
- 238000004519 manufacturing process Methods 0.000 description 6
- 239000004065 semiconductor Substances 0.000 description 6
- 238000013461 design Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 230000007935 neutral effect Effects 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F15/00—Digital computers in general; Data processing equipment in general
- G06F15/16—Combinations of two or more digital computers each having at least an arithmetic unit, a program unit and a register, e.g. for a simultaneous processing of several programs
- G06F15/163—Interprocessor communication
-
- G—PHYSICS
- G02—OPTICS
- G02B—OPTICAL ELEMENTS, SYSTEMS OR APPARATUS
- G02B27/00—Optical systems or apparatus not provided for by any of the groups G02B1/00 - G02B26/00, G02B30/00
- G02B27/0012—Optical design, e.g. procedures, algorithms, optimisation routines
-
- G—PHYSICS
- G02—OPTICS
- G02B—OPTICAL ELEMENTS, SYSTEMS OR APPARATUS
- G02B6/00—Light guides; Structural details of arrangements comprising light guides and other optical elements, e.g. couplings
- G02B6/24—Coupling light guides
- G02B6/26—Optical coupling means
- G02B6/28—Optical coupling means having data bus means, i.e. plural waveguides interconnected and providing an inherently bidirectional system by mixing and splitting signals
- G02B6/293—Optical coupling means having data bus means, i.e. plural waveguides interconnected and providing an inherently bidirectional system by mixing and splitting signals with wavelength selective means
-
- G—PHYSICS
- G02—OPTICS
- G02B—OPTICAL ELEMENTS, SYSTEMS OR APPARATUS
- G02B6/00—Light guides; Structural details of arrangements comprising light guides and other optical elements, e.g. couplings
- G02B6/24—Coupling light guides
- G02B6/26—Optical coupling means
- G02B6/35—Optical coupling means having switching means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/12—Computing arrangements based on biological models using genetic models
- G06N3/126—Evolutionary algorithms, e.g. genetic algorithms or genetic programming
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Optics & Photonics (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Computer Hardware Design (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Genetics & Genomics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Physiology (AREA)
- Optical Communication System (AREA)
Abstract
本发明公开了一种基于光学互联的芯粒实现方法和系统,属于芯片技术领域,用于基于芯粒chiplet在基板位置固定后确定初始光路中转点位置,所述方法包括:根据系统需求确定每一对chiplet之间光路中转点的初始位置;采用遗传算法对基板上所有光路中转点的初始位置进行优化;根据遗传算法优化后的光路中转点位置;将相邻且距离较近的多个中转点替换为多路中转点;使用波分复用技术对不同的光路配置不同的波长。本发明基于chiplet位置确定初始光路中转点,采用遗传算法进行优化,通过相邻中转点替换和波分复用技术,实现了高集成度、高性能的光互联系统,提高了带宽利用率,满足了高性能计算和通信设备的需求。
Description
技术领域
本发明属于芯片技术领域,尤其涉及一种基于光学互联的芯粒实现方法和系统。
背景技术
芯粒(chiplet)是一种创新的半导体设计概念,它将一个完整的芯片分解为多个较小、功能独立的模块。每个chiplet负责执行特定的功能,例如处理器核心、内存控制器或输入/输出(I/O)接口。通过将这些chiplet组合在一个集成的基板上,可以实现高度模块化、可扩展和可定制的系统设计。chiplet技术有效地提高了集成电路的性能、功耗和成本效益,同时简化了设计和制造流程。在高性能计算、人工智能和网络设备等领域,chiplet技术已成为实现下一代电子系统的关键技术。
在现代高性能计算系统中,芯片与芯片之间的互联和通信对于实现高性能和低功耗至关重要。传统的电气互联方法在高速信号传输、功耗和布线复杂性方面面临着挑战。为了克服这些问题,使用光互联技术将不同的芯粒(chiplet)连接在一起成为一种理想的解决方案。这种方法将多个功能模块划分为独立的芯粒,然后将它们固定在同一基板上,形成一个高度集成的系统。
将chiplet固定在基板上时,需要考虑多种布局约束,包括热管理、电源分布和信号完整性。这些约束条件可能会限制chiplet的位置选择。在满足这些约束条件的前提下,需要找到最佳的chiplet布局,以便后续确定光中转节点的位置。光中转节点可以是光路交叉点(Optical Crosspoint)或光交换节点(Optical Switching Node),可以采用不同的技术实现,如微型光机械系统(Micro-Electro-Mechanical Systems,MEMS)、液晶光调制器(Liquid CrystalModulators)或半导体光放大器(Semiconductor Optical Amplifiers,SOA)等。
现有的光互联技术在确定chiplet位置和光中转节点位置方面仍然存在挑战。尚未提供一种充分考虑布局约束、光路损耗和通信性能的方法来确定chiplet和光中转节点的最佳布局。因此亟需发展一种新的方法,旨在实现高性能、低功耗和简化布线的光互联系统。本发明的目的是提供一种方法,用于确定chiplet在基板上的最佳位置和光中转节点的位置,以实现高性能、低功耗和简化布线的光互联系统。同时,本发明还旨在提供一种利用光路交叉点或光交换节点实现高性能光互联的方法,以克服现有技术的局限。
发明内容
针对上述现有技术中存在的缺陷,本发明提供一种基于光学互联的芯粒实现方法,用于基于芯粒chiplet在基板位置固定后确定初始光路中转点位置,所述方法包括:
根据系统需求确定每一对chiplet之间光路中转点的初始位置;
采用遗传算法对基板上所有光路中转点的初始位置进行优化;
根据遗传算法优化后的光路中转点位置;
将相邻且距离较近的多个中转点替换为多路中转点;
使用波分复用技术对不同的光路配置不同的波长。
其中,根据系统需求确定每一对chiplet之间光路中转点的初始位置,包括确定每一对chiplet之间光路中转点的的个数。
其中,根据系统需求确定每一对chiplet之间光路中转点的初始位置,包括确定每一对chiplet之间光路中转点的的个数n后,再根据光传播特性初始化每一对chiplet之间的n个光路中转点的初始位置。
其中,在使用遗传算法优化基板上所有光路中转点的初始位置中,将所有光路中转点的坐标编码表示为一个一维数,将根据系统需求确定每一对chiplet之间光路中转点的初始位置作为种子解,在种子解基础上,通过对每个光路中转点坐标进行随机扰动生成其他解,将种子解与其他解组合成初始种群。
其中,确定适应度函数F用于评估每个解的优劣,所述适应度函数F包括信号传输质量和能耗这两项,并考虑每个 chiplet 对的光学互连权重。
其中,所述确定适应度函数F用于评估每个解的优劣,所述适应度函数F包括信号传输质量项和能耗项,并考虑每个 chiplet 对的光学互连权重,包括:
设 Q_i 表示第 i 个 chiplet 对的信号传输质量,w_i 表示第 i 个 chiplet对的光学互连权重,n 表示 chiplet 对的总数,所述信号传输质量 Q(solution)的计算公式为:Q(solution) = Σ (w_iQ_i(solution)) / Σ w_i;
其中,Q_i(solution) 可以使用以下公式计算:
Q_i(solution) = 1 / (L_total_i + αL_bend_i + β/>D_avg_i),
其中,L_total_i、L_bend_i 和 D_avg_i 分别表示第 i 个 chiplet 对的光路总长度、弯曲部分的总长度和中转点之间的平均距离,α 和 β 是调整弯曲程度和中转点距离对信号传输质量影响的权重;
所述能耗项 E(solution)的公式为:E(solution) = γN,其中γ是调整能耗对适应度函数影响的权重;
适应度函数F(solution)的计算公式为:
F(solution) = w1(Σ (w_i/>Q_i(solution)) / Σ w_i) - w2/>(γ/>N),其中w1、 w2分别表示信号传输质量因素和能耗因素对应的权重,且w1+w2=1。
其中,确定 K-means 聚类算法中的 K 值,使用确定的 K 值对遗传算法优化后的光路中转点进行 K-means 聚类。
其中,对于每个簇,首先检查簇内的光路中转点数量,如果一个簇只包含一个光路中转点则不需要合并;
对于一个簇包含多个光路中转点的情形,需要计算簇内中转点之间的距离,如果簇内所有光路中转点之间的距离均小于设定的距离阈值,则这些中转点被合并为多路中转点。
其中,对于需要合并的簇,将簇内的光路中转点合并为一个多路中转点,合并后的多路中转点的位置为簇内中转点的几何中心。
其中,将相邻且距离较近的中转点替换为多路中转点,包括使用集成波长选择开关WSS实现。
其中,通过波分复用技术对不同的光路配置不同的波长,包括:
基于光纤的传输特性、光学放大器的性能以及光学滤波器的选择确定系统支持的波长范围;
为每个未合并的光路中转点分配一个或多个波长,包括:
分配的波长在系统的可用波长范围内,并使得相邻波长之间的信号干扰小于阈值;
对于合并后的多路中转点,为被合并的每个光路分配一个或多个波长,包括通过使用不重叠的波长分配或密集波分复用DWDM技术来进行合并后的多路中转点中每个光路的波长配置。
本发明还提出了一种基于光学互联的芯粒实现系统,所述系统用于实现前述的基于光学互联的芯粒chiplet实现方法,所述系统用于基于chiplet在基板位置固定后确定初始光路中转点位置,所述系统包括:
初始位置计算模块,用于根据系统需求确定每一对chiplet之间光路中转点的初始位置;
初始位置优化模块,用于采用遗传算法对基板上所有光路中转点的初始位置进行优化;
中转点合并模块,用于根据遗传算法优化后的光路中转点位置,将相邻且距离较近的多个中转点替换为多路中转点;
波长分配模块,用于基于波分复用技术对不同的光路配置不同的波长。
本发明通过遗传算法对光路中转点位置进行优化,可以降低光信号的传输损耗和延迟。通过优化光路中转点位置,将相邻且距离较近的中转点替换为多路中转点,可以简化光路布局,有助于提高光路的集成度和降低布线复杂性,从而减少制造难度和成本。以及通过为不同的光路配置不同的波长,实现波分复用技术,可以显著提高系统的带宽利用率,满足高性能计算系统对高带宽的需求。
附图说明
通过参考附图阅读下文的详细描述,本公开示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本公开的若干实施方式,并且相同或对应的标号表示相同或对应的部分,其中:
图1是示出根据本发明实施例的基于光学互联的chiplet实现方法的流程图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义,“多种”一般包含至少两种。
应当理解,尽管在本发明实施例中可能采用术语第一、第二、第三等来描述……,但这些……不应限于这些术语。这些术语仅用来将……区分开。例如,在不脱离本发明实施例范围的情况下,第一……也可以被称为第二……,类似地,第二……也可以被称为第一……。
应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
取决于语境,如在此所使用的词语“如果”、“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的商品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种商品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的商品或者装置中还存在另外的相同要素。
在高性能计算系统中,芯片与芯片之间的互联和通信是至关重要的。为了提高性能,降低功耗并减少布线复杂性,使用光互联技术将不同的芯粒(chiplet)连接在一起是一种理想的解决方案。这种方法将多个功能模块划分为独立的芯粒,然后将它们固定在同一基板上,形成一个高度集成的系统。
将chiplet固定在基板上时,需要考虑布局约束,例如热管理、电源分布和信号完整性。这些约束条件可能会限制chiplet的位置选择。在满足这些约束条件的前提下,需要找到最佳的chiplet布局,以便后续确定光中转节点的位置。本发明的光中转节点为光路交叉点(Optical Crosspoint)或光交换节点(Optical Switching Node)。光交换节点可以采用不同的技术实现,如微型光机械系统(Micro-Electro-Mechanical Systems,MEMS)、液晶光调制器(Liquid CrystalModulators)或半导体光放大器(Semiconductor OpticalAmplifiers,SOA)等。
chiplet在基板上的位置和排列方式会影响光路布局的复杂性。先确定chiplet的位置有助于了解光路布局的难点和挑战,从而更好地确定光中转节点的位置。这可以降低光路布局的复杂性,减少制造难度和成本。
同时chiplet在基板上的位置直接影响光路的长度。光路长度越长,信号传输损耗可能越大。且各个chiplet在基板上的相对位置影响它们之间的通信性能,例如通信距离、带宽需求和延迟要求。在确定chiplet位置后,需要选择合适的光中转节点位置,以减少光路的弯曲和连接损耗。
如图1所示,本发明中基于chiplet在基板位置固定后确定初始光路中转点位置,可以包括如下步骤:
步骤S1,根据系统需求确定每一对chiplet之间光路中转点的初始位置。
步骤S2,采用遗传算法对基板上所有光路中转点的初始位置进行优化。遗传算法是一种启发式搜索算法,通过模拟自然界中的进化过程来寻找问题的最优解。在本发明中,遗传算法的编码方式可以选择实数编码,不断迭代求解最优解。
步骤S3,根据遗传算法优化后的光路中转点位置,将相邻且距离较近的中转点替换为多路中转点,以提高光路的集成度和系统性能。
步骤S4,基于波分复用技术对不同的光路配置不同的波长,提高系统的带宽利用率。
本发明通过遗传算法对光路中转点位置进行优化,可以降低光信号的传输损耗和延迟。通过优化光路中转点位置,将相邻且距离较近的中转点替换为多路中转点,可以简化光路布局,有助于提高光路的集成度和降低布线复杂性,从而减少制造难度和成本。以及通过为不同的光路配置不同的波长,实现波分复用技术,可以显著提高系统的带宽利用率,满足高性能计算系统对高带宽的需求。
在某一实施例中,根据系统需求确定每一对chiplet之间光路中转点的初始位置,包括确定每一对chiplet之间光路中转点的的个数。
在某一实施例中,确定每一对chiplet之间光路中转点的的个数包括如下步骤:根据各个chiplet的计算能力、存储需求以及数据交换模式,计算每一对chiplet之间的数据传输量(T)和传输速率需求(R);根据每一对chiplet之间的数据传输量(T)、速率需求(R)和可靠性需求(K),动态分配相对的延迟额度(D):D = T / RK;根据上述延迟额度(D),计算出每对chiplet之间的光学互连权重W = R / D;建立一个顺序表从光学互连权重最高的到最低进行排列存储各个chiplet之间的光学互连关系;根据光学互连权重所在的数值区间,为每一对chiplet分配光路中转点的个数。
在某一实施例中,根据各个chiplet的计算能力、存储需求以及数据交换模式,计算每一对chiplet之间的数据传输量和传输速率需求,包括:
对于每一对chiplet,分析各个chiplet的数据更新频率,确定在给定时间内的存储量变化率,获取各个chiplet的存储容量规格。计算数据传输量:数据传输量 T = 存储量变化率存储容量。
分析各个chiplet的计算强度和任务类型,确定其计算密集度,以及获取各个chiplet的工作运算频率规格。计算传输速率需求为:传输速率需求 R = 计算密集度 / 运算频率。
通过上述过程可以得到每一对chiplet光学互联关系的T和R值,然后分别计算与各个chiplet互连对之间的T和R值。
在某一实施例中,计算存储量变化率的方法包括:分析各个chiplet的数据访问记录和存储内容变化情况,获取过去一定时间段内的存储量变化曲线;根据存储量变化曲线,采样计算在不同时间间隔(如每1毫秒)内存储量的变化,从而计算出平均每秒存储量变化率;根据各个chiplet执行的任务类型和算法特性,预测其存储内容的变化速度和频率,预估存储量变化率。
在某一实施例中,计算计算密集度的方法包括分析各个chiplet执行的任务,根据各个chiplet执行的算法类型和复杂度,预估其计算密集度。计算一个 chiplet 对的计算密集度可以按照以下步骤进行:确定计算任务的计算需求,通过统计任务中所需的浮点操作数(FLOPs),对于高度并行的任务使用每个并行单元的计算能力来估算总的计算需求;确定计算任务的数据传输需求,包括从内存中读取或写入的数据量,可以统计任务中输入和输出数据的大小并将其相加以得到总的数据传输需求;计算计算密集度,通过将计算需求与数据传输需求相除来得到:计算密集度(FLOPs/字节) = 计算需求 / 数据传输需求。
在某一实施例中,为了根据光学互连权重分配光路中转点个数,需要定义一个权重区间到中转点个数的映射。例如可以将权重划分为四个区间,每个区间对应不同的中转点个数。根据这个映射,对于顺序表中的每个元素根据其权重值为相应的chiplet对分配相应的光路中转点个数。
在某一实施例中,根据系统需求确定每一对chiplet之间光路中转点的初始位置,包括确定每一对chiplet之间光路中转点的的个数n后,再根据光传播特性初始化一个可行的在每一对chiplet之间的n个光路中转点的初始位置。具体地,可以通过如下步骤来实现:
步骤p1,通过 chiplet 的设计规格或布局信息获得 chiplet 位置和尺寸,包括每个 chiplet 在二维平面上的坐标位置以及它们的尺寸。
步骤p2,对于每一对 chiplet计算 chiplet 间距离和避障路径,包括但不限于使用 A算法在二维平面上寻找一条避开所有 chiplet 障碍的最短路径。
步骤p3,根据 chiplet 间的光路中转点个数和避障路径,在避障路径上的每个拐点设置一个光路中转点,确保光路在避开障碍物的同时,尽量保持直线传输。
步骤p4,在设置了拐点上的光路中转点之后,计算剩余需要设置的中转点个数。假设在 chiplet A 和 chiplet B 之间放置 n 个中转点,而拐点上设置了 m 个中转点,那么剩余需要设置的中转点个数为 n - m。
步骤p5,在避障路径的每个直线段上插入剩余的光路中转点,包括根据剩余中转点个数和直线段的数量,计算每个直线段上应插入的中转点个数,包括将剩余的中转点个数按直线段长度占传输长度的占比等比例分配到每个直线段,对每个直线段将其等分为直线段所分配到的中转点个数的数量的小段,并在每个小段的端点设置光路中转点。
步骤p6,最后沿着避障路径,从 chiplet A 开始,记录每个中转点的坐标。
在某一实施例中,使用遗传算法优化基板上所有光路中转点的初始位置,包括以下步骤操作:
步骤m1,将所有光路中转点的坐标编码表示为一个一维数[x1, y1, x2, y2,..., xn, yn,…],其中 n表示第n个光路中转点的坐标。
步骤m2,将根据系统需求确定每一对chiplet之间光路中转点的初始位置作为种子解,在种子解基础上,通过对每个光路中转点坐标进行随机扰动生成其他解,将种子解与其他解组合成初始种群。所述随机扰动包括但不限于添加随机偏移量。其中,需要使得生成的新解仍然满足布局约束,布局约束包括但不限于路径避障。
步骤m3,确定适应度函数F(solution)用于评估每个解的优劣,所述适应度函数F(solution)包括信号传输质量和能耗这两项,并考虑每个 chiplet 对的光学互连权重。
设 Q_i 表示第 i 个 chiplet 对的信号传输质量,w_i 表示第 i 个 chiplet对的光学互连权重,n 表示 chiplet 对的总数。用以下公式表示信号传输质量 Q(solution):
Q(solution) = Σ (w_iQ_i(solution)) / Σ w_i。
其中,Q_i(solution) 可以使用以下公式计算:
Q_i(solution) = 1 / (L_total_i + αL_bend_i + β/>D_avg_i);
这里,L_total_i、L_bend_i 和 D_avg_i 分别表示第 i 个 chiplet 对的光路总长度、弯曲部分的总长度和中转点之间的平均距离。α 和 β 是调整弯曲程度和中转点距离对信号传输质量影响的权重。
能耗项 E(solution)的公式为:E(solution) = γN,其中,γ 是调整能耗对适应度函数影响的权重。
适应度函数F(solution)可以表示为:
F(solution) = w1(Σ (w_i/>Q_i(solution)) / Σ w_i) - w2/>(γ/>N),w1, w2分别表示信号传输质量因素和能耗因素对应的权重,w1+w2=1。
步骤m4,在遗传算法的每一代中,根据适应度函数选择优秀的解,然后进行交叉和变异操作以产生新的解。交叉可以采用单点交叉或多点交叉等方法。变异可以通过随机改变某个光路中转点的位置实现。在进行变异操作时,需要确保新生成的解仍然满足布局约束。
步骤m5,设置终止条件,包括迭代次数达到预设值或适应度函数的最优值在连续若干代内没有明显改善。满足终止条件时,算法结束。
步骤m6,从最后一代种群中选择适应度函数值最高的解,将其解码为光路中转点的最优位置。
通过遗传算法,可以在多代迭代过程中逐渐优化光路中转点的位置,最终获得一个综合考虑信号传输质量、能耗和空间利用率等因素的优秀解。
在某一实施例中,根据遗传算法优化后的光路中转点位置,将相邻且距离较近的中转点替换为多路中转点,包括如下步骤:
步骤r1,确定 K-means 聚类算法中的 K 值,即簇的数量。其中,K 值的选择需要在避免过度合并和减少中转点数量之间取得平衡。通过尝试不同的 K 值并观察性能指标(信号传输质量、能耗等)来选择合适的 K 值。
步骤r2,使用确定的 K 值对遗传算法优化后的光路中转点进行 K-means 聚类。聚类结果将光路中转点分为 K 个簇。
步骤r3,对于每个簇,首先检查簇内的光路中转点数量,如果一个簇只包含一个光路中转点则不需要合并。对于一个簇包含多个光路中转点的情形,需要计算簇内中转点之间的距离,如果簇内所有光路中转点之间的距离均小于设定的距离阈值,则这些中转点可以被合并为多路中转点。
步骤r4,对于需要合并的簇,将簇内的光路中转点合并为一个多路中转点。合并后的多路中转点的位置可以选择为簇内中转点的几何中心。
步骤r5,在合并光路中转点后,重新计算系统性能,包括信号传输质量、能耗等。如果性能满足要求,则保留合并后的布局;否则需要返回步骤r1重新从调整 K 值开始执行聚类操作。
本发明中,K-means 聚类算法可以获得可合并的光路中转点,从而提高系统的集成度和性能。
在某一实施例中,将相邻且距离较近的中转点替换为多路中转点,以提高光路的集成度和系统性能,包括使用集成波长选择开关WSS实现。
集成波长选择开关 (Integrated Wavelength Selective Switches, WSS)是一种光网络中常用的设备,可以根据不同波长的光信号实现动态光路切换。将WSS集成到chiplet中,可以在光路中实现多波长的动态选择与切换。WSS的通道数主要取决于设计和制造技术。在实际应用中,WSS可以实现多达数十到上百路不同波长光信号的转发。常见的WSS包括2、4、8、16通道或更多通道。
在某一实施例中,通过波分复用技术对不同的光路配置不同的波长,包括:
基于光纤的传输特性、光学放大器的性能以及光学滤波器的选择确定系统支持的波长范围。
分析每条光路的带宽需求以确定需要分配给每条光路的波长数量,包括为不同的光路分配不同数量的波长,以满足各自的带宽需求。
为每个未合并的光路中转点分配一个或多个波长。需要确保分配的波长在系统的可用波长范围内,并使信道间隔满足干扰要求,以避免相邻波长之间的信号干扰,包括使得相邻波长之间的信号干扰小于阈值。
对于合并后的多路中转点,需要为被合并的每个光路分配一个或多个波长。在分配波长时,应确保合并后的多路中转点可以同时处理来自不同光路的信号,且不会引起信号干扰。可以通过使用不重叠的波长分配或密集波分复用(Dense Wavelength DivisionMultiplexing,DWDM)技术来进行合并后的多路中转点中每个光路的波长配置。
同时,本发明还公开了一种基于光学互联的芯粒chiplet实现系统,所述系统用于实现前述的基于光学互联的芯粒chiplet实现方法,所述系统用于基于chiplet在基板位置固定后确定初始光路中转点位置,所述系统包括:
初始位置计算模块,用于根据系统需求确定每一对chiplet之间光路中转点的初始位置;
初始位置优化模块,用于采用遗传算法对基板上所有光路中转点的初始位置进行优化;
中转点合并模块,用于根据遗传算法优化后的光路中转点位置,将相邻且距离较近的多个中转点替换为多路中转点;
波长分配模块,用于基于波分复用技术对不同的光路配置不同的波长。
本发明通过遗传算法对光路中转点位置进行优化,可以降低光信号的传输损耗和延迟。通过优化光路中转点位置,将相邻且距离较近的中转点替换为多路中转点,可以简化光路布局,有助于提高光路的集成度和降低布线复杂性,从而减少制造难度和成本。以及通过为不同的光路配置不同的波长,实现波分复用技术,可以显著提高系统的带宽利用率,满足高性能计算系统对高带宽的需求。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定。
以上介绍了本发明的较佳实施方式,旨在使得本发明的精神更加清楚和便于理解,并不是为了限制本发明,凡在本发明的精神和原则之内,所做的修改、替换、改进,均应包含在本发明所附的权利要求概括的保护范围之内。
Claims (12)
1.一种基于光学互联的芯粒实现方法,用于基于芯粒chiplet在基板位置固定后确定初始光路中转点位置,所述方法包括:
根据系统需求确定每一对chiplet之间光路中转点的初始位置;
采用遗传算法对基板上所有光路中转点的初始位置进行优化;
根据遗传算法优化后的光路中转点位置,将相邻且距离较近的多个中转点替换为多路中转点;
使用波分复用技术对不同的光路配置不同的波长。
2.如权利要求1所述的一种基于光学互联的芯粒实现方法,其特征在于,
根据系统需求确定每一对chiplet之间光路中转点的初始位置,包括确定每一对chiplet之间光路中转点的的个数。
3.如权利要求1所述的一种基于光学互联的芯粒实现方法,其特征在于,
根据系统需求确定每一对chiplet之间光路中转点的初始位置,包括确定每一对chiplet之间光路中转点的的个数n后,再根据光传播特性初始化每一对chiplet之间的n个光路中转点的初始位置。
4.如权利要求1所述的一种基于光学互联的芯粒实现方法,其特征在于,
在使用遗传算法优化基板上所有光路中转点的初始位置中,将所有光路中转点的坐标编码表示为一个一维数,将根据系统需求确定每一对chiplet之间光路中转点的初始位置作为种子解;
在种子解基础上,通过对每个光路中转点坐标进行随机扰动生成其他解,将种子解与其他解组合成初始种群。
5.如权利要求1所述的一种基于光学互联的芯粒实现方法,其特征在于,
确定适应度函数F用于评估每个解的优劣,所述适应度函数F包括信号传输质量项和能耗项,并考虑每个 chiplet 对的光学互连权重。
6.如权利要求5所述的一种基于光学互联的芯粒实现方法,其特征在于,所述确定适应度函数F用于评估每个解的优劣,所述适应度函数F包括信号传输质量项和能耗项,并考虑每个 chiplet 对的光学互连权重,包括:
设 Q_i 表示第 i 个 chiplet 对的信号传输质量,w_i 表示第 i 个 chiplet 对的光学互连权重,n 表示 chiplet 对的总数,所述信号传输质量 Q(solution)的计算公式为:Q(solution) = Σ (w_iQ_i(solution)) / Σ w_i;
其中,Q_i(solution) 可以使用以下公式计算:
Q_i(solution) = 1 / (L_total_i +αL_bend_i +β/>D_avg_i),
其中,L_total_i、L_bend_i 和 D_avg_i 分别表示第 i 个 chiplet 对的光路总长度、弯曲部分的总长度和中转点之间的平均距离,α 和 β 是调整弯曲程度和中转点距离对信号传输质量影响的权重;
所述能耗项 E(solution)的公式为:E(solution) = γN,其中γ 是调整能耗对适应度函数影响的权重;
适应度函数F(solution)的计算公式为:
F(solution) = w1 (Σ (w_i/>Q_i(solution)) / Σ w_i) - w2/> (γ/>N),其中w1、 w2分别表示信号传输质量因素和能耗因素对应的权重,且w1+w2=1。
7.如权利要求1所述的一种基于光学互联的芯粒实现方法,其特征在于,
确定 K-means 聚类算法中的 K 值,使用确定的 K 值对遗传算法优化后的光路中转点进行 K-means 聚类。
8.如权利要求7所述的一种基于光学互联的芯粒实现方法,其特征在于,
对于每个簇,首先检查簇内的光路中转点数量,如果一个簇只包含一个光路中转点则不需要合并;
对于一个簇包含多个光路中转点的情形,需要计算簇内中转点之间的距离,如果簇内所有光路中转点之间的距离均小于设定的距离阈值,则这些中转点被合并为多路中转点。
9.如权利要求8所述的一种基于光学互联的芯粒实现方法,其特征在于,
对于需要合并的簇,将簇内的光路中转点合并为一个多路中转点,合并后的多路中转点的位置为簇内中转点的几何中心。
10.如权利要求1所述的一种基于光学互联的芯粒实现方法,其特征在于,
将相邻且距离较近的中转点替换为多路中转点,包括使用集成波长选择开关WSS实现。
11.如权利要求1所述的一种基于光学互联的芯粒实现方法,其特征在于,通过波分复用技术对不同的光路配置不同的波长,包括:
基于光纤的传输特性、光学放大器的性能以及光学滤波器的选择确定系统支持的波长范围;
为每个未合并的光路中转点分配一个或多个波长,包括:
分配的波长在系统的可用波长范围内,并使得相邻波长之间的信号干扰小于阈值;
对于合并后的多路中转点,为被合并的每个光路分配一个或多个波长,包括通过使用不重叠的波长分配或密集波分复用DWDM技术来进行合并后的多路中转点中每个光路的波长配置。
12.一种基于光学互联的芯粒实现系统,所述系统用于实现权利要求1-11的基于光学互联的芯粒实现方法,所述系统用于基于芯粒chiplet在基板位置固定后确定初始光路中转点位置,所述系统包括:
初始位置计算模块,用于根据系统需求确定每一对chiplet之间光路中转点的初始位置;
初始位置优化模块,用于采用遗传算法对基板上所有光路中转点的初始位置进行优化;
中转点合并模块,用于根据遗传算法优化后的光路中转点位置,将相邻且距离较近的多个中转点替换为多路中转点;
波长分配模块,用于基于波分复用技术对不同的光路配置不同的波长。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310853724.XA CN116560005B (zh) | 2023-07-12 | 2023-07-12 | 一种基于光学互联的芯粒实现方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310853724.XA CN116560005B (zh) | 2023-07-12 | 2023-07-12 | 一种基于光学互联的芯粒实现方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116560005A true CN116560005A (zh) | 2023-08-08 |
CN116560005B CN116560005B (zh) | 2023-09-08 |
Family
ID=87493333
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310853724.XA Active CN116560005B (zh) | 2023-07-12 | 2023-07-12 | 一种基于光学互联的芯粒实现方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116560005B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116841804A (zh) * | 2023-09-01 | 2023-10-03 | 中诚华隆计算机技术有限公司 | 一种基于chiplet的动态重配置方法和芯片 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114442438A (zh) * | 2020-11-04 | 2022-05-06 | 芯恩(青岛)集成电路有限公司 | 一种变网格的芯粒排布寻优算法 |
CN114780227A (zh) * | 2022-06-20 | 2022-07-22 | 中国人民解放军国防科技大学 | 一种基于芯粒化网络处理器架构的任务调度映射方法及系统 |
CN115860081A (zh) * | 2023-03-01 | 2023-03-28 | 之江实验室 | 一种芯粒算法调度方法、系统、电子设备及存储介质 |
US20230132571A1 (en) * | 2021-10-29 | 2023-05-04 | Mellanox Technologies, Ltd. | Co-packaged switch with integrated quantum key distribution capabilities |
CN116227409A (zh) * | 2023-02-09 | 2023-06-06 | 奇异摩尔(上海)集成电路设计有限公司 | 适于有源基板上多芯粒的布局方法及系统 |
-
2023
- 2023-07-12 CN CN202310853724.XA patent/CN116560005B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114442438A (zh) * | 2020-11-04 | 2022-05-06 | 芯恩(青岛)集成电路有限公司 | 一种变网格的芯粒排布寻优算法 |
US20230132571A1 (en) * | 2021-10-29 | 2023-05-04 | Mellanox Technologies, Ltd. | Co-packaged switch with integrated quantum key distribution capabilities |
CN114780227A (zh) * | 2022-06-20 | 2022-07-22 | 中国人民解放军国防科技大学 | 一种基于芯粒化网络处理器架构的任务调度映射方法及系统 |
CN116227409A (zh) * | 2023-02-09 | 2023-06-06 | 奇异摩尔(上海)集成电路设计有限公司 | 适于有源基板上多芯粒的布局方法及系统 |
CN115860081A (zh) * | 2023-03-01 | 2023-03-28 | 之江实验室 | 一种芯粒算法调度方法、系统、电子设备及存储介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116841804A (zh) * | 2023-09-01 | 2023-10-03 | 中诚华隆计算机技术有限公司 | 一种基于chiplet的动态重配置方法和芯片 |
CN116841804B (zh) * | 2023-09-01 | 2023-11-17 | 中诚华隆计算机技术有限公司 | 一种基于chiplet的动态重配置方法和芯片 |
Also Published As
Publication number | Publication date |
---|---|
CN116560005B (zh) | 2023-09-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110324264B (zh) | 分配系统资源的方法与系统 | |
CN109314804B (zh) | 用于机架群集中光通信的技术 | |
CN116560005B (zh) | 一种基于光学互联的芯粒实现方法和系统 | |
Frank et al. | Optimal design of centralized computer networks | |
KR101572295B1 (ko) | 스트림 프로세싱 컴퓨터 아키텍쳐를 구현하는 방법 및 시스템 | |
US11544441B2 (en) | Automated network-on-chip design | |
JP2016525290A (ja) | NoCを構成するための方法及びシステム並びにコンピュータ可読記憶媒体 | |
Guo et al. | A novel IP-core mapping algorithm in reliable 3D optical network-on-chips | |
GB2457309A (en) | Process allocation in a processor array using a simulated annealing method | |
US20050010682A1 (en) | Load balancing method for exchanging data between multiple hosts and storage entities, in ip based storage area network | |
JP2014078943A (ja) | ネットワーク仮想化のための経路制御および波長割り当てのシステムと方法 | |
WO2017007720A1 (en) | Network stochastic cross-layer optimization for meeting traffic flow availability target at minimum cost | |
KR20160121380A (ko) | 토러스 네트워크를 이용하는 분산 파일 시스템 및 토러스 네트워크를 이용하는 분산 파일 시스템의 구성 및 운영 방법 | |
CN102769806B (zh) | 光传送网的资源分配方法和装置 | |
JP2022522320A (ja) | 光ネットワークを用いた再構成可能な計算ポッド | |
US7248757B2 (en) | Method, device and computer program for designing a circuit having electric wires and optical connections | |
Chen et al. | An evaluation of network architectures for next generation supercomputers | |
CN115580882A (zh) | 动态网络切片资源分配方法及装置、存储介质及电子设备 | |
Bahrami et al. | Proposing an optimal structure for the architecture of wireless networks on chip | |
JP5900178B2 (ja) | ユーティライゼーションエントロピーを計算するためのシステムおよび方法 | |
CN113438171B (zh) | 一种低功耗存算一体系统的多芯片连接方法 | |
Lu et al. | Topological structure and physical layout co-design for wavelength-routed optical networks-on-chip | |
CN112989749B (zh) | 一种集成电路版图布线中引脚访问方法及装置 | |
JP2023535043A (ja) | Otnネットワークリソース最適化方法および装置、コンピュータデバイスと記憶媒体 | |
Zhuqin et al. | Wavelength assignment method based on ACO to reduce crosstalk for ring-based optical network-on-chip |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |