CN114418082A - 光学神经网络芯片的参数生成方法及制造方法 - Google Patents
光学神经网络芯片的参数生成方法及制造方法 Download PDFInfo
- Publication number
- CN114418082A CN114418082A CN202210080623.9A CN202210080623A CN114418082A CN 114418082 A CN114418082 A CN 114418082A CN 202210080623 A CN202210080623 A CN 202210080623A CN 114418082 A CN114418082 A CN 114418082A
- Authority
- CN
- China
- Prior art keywords
- chip
- optical
- neural network
- light
- parameters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000003287 optical effect Effects 0.000 title claims abstract description 451
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 244
- 238000000034 method Methods 0.000 title claims abstract description 73
- 238000004519 manufacturing process Methods 0.000 title claims abstract description 41
- 238000012549 training Methods 0.000 claims abstract description 140
- 230000035772 mutation Effects 0.000 claims abstract description 123
- 238000003062 neural network model Methods 0.000 claims abstract description 80
- 238000013507 mapping Methods 0.000 claims abstract description 30
- 239000000463 material Substances 0.000 claims description 30
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 claims description 24
- 238000005253 cladding Methods 0.000 claims description 24
- 238000004364 calculation method Methods 0.000 claims description 23
- 238000000151 deposition Methods 0.000 claims description 12
- 210000002569 neuron Anatomy 0.000 claims description 12
- 239000000377 silicon dioxide Substances 0.000 claims description 12
- 239000010408 film Substances 0.000 claims description 10
- 239000000758 substrate Substances 0.000 claims description 9
- 235000012239 silicon dioxide Nutrition 0.000 claims description 8
- 239000010409 thin film Substances 0.000 claims description 8
- 230000008859 change Effects 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 7
- 238000013041 optical simulation Methods 0.000 claims description 7
- 238000003860 storage Methods 0.000 claims description 7
- 230000001902 propagating effect Effects 0.000 claims description 5
- 230000010287 polarization Effects 0.000 claims description 4
- 230000002265 prevention Effects 0.000 claims 4
- 238000012512 characterization method Methods 0.000 claims 2
- 230000006870 function Effects 0.000 description 49
- 206010065042 Immune reconstitution inflammatory syndrome Diseases 0.000 description 20
- 238000012545 processing Methods 0.000 description 18
- 230000008569 process Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 5
- 238000000819 phase cycle Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 238000011031 large-scale manufacturing process Methods 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 241001164374 Calyx Species 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000005265 energy consumption Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 229910052710 silicon Inorganic materials 0.000 description 2
- 239000010703 silicon Substances 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 241000282414 Homo sapiens Species 0.000 description 1
- 229910052581 Si3N4 Inorganic materials 0.000 description 1
- NRTOMJZYCJJWKI-UHFFFAOYSA-N Titanium nitride Chemical compound [Ti]#N NRTOMJZYCJJWKI-UHFFFAOYSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000023077 detection of light stimulus Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005684 electric field Effects 0.000 description 1
- 238000005530 etching Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 150000002736 metal compounds Chemical class 0.000 description 1
- 229920002120 photoresistant polymer Polymers 0.000 description 1
- HQVNEWCFYHHQES-UHFFFAOYSA-N silicon nitride Chemical compound N12[Si]34N5[Si]62N3[Si]51N64 HQVNEWCFYHHQES-UHFFFAOYSA-N 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/06—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons
- G06N3/067—Physical realisation, i.e. hardware implementation of neural networks, neurons or parts of neurons using optical means
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Neurology (AREA)
- Optical Integrated Circuits (AREA)
- Optical Modulation, Optical Deflection, Nonlinear Optics, Optical Demodulation, Optical Logic Elements (AREA)
Abstract
本公开提供一种光学神经网络芯片的参数生成方法、芯片制造方法及装置和介质。光学神经网络芯片的参数生成方法包括:设置光学神经网络芯片的芯片基本参数,并基于芯片基本参数构建芯片神经网络模型,其中光学神经网络芯片包括用于对光学神经网络芯片中的光的光特征量进行调制的至少一个光特征量突变单元;基于芯片基本参数获得光学神经网络芯片的光场的基准函数;获取初始训练集,并将初始训练集映射到光场,以获得光学训练集;利用光学训练集对芯片神经网络模型进行训练,以获得芯片特征参数,其中芯片特征参数表征至少一个光特征量突变单元的结构特性,其中,芯片基本参数和芯片特征参数用于制造光学神经网络芯片。
Description
技术领域
本公开涉及半导体技术领域,并且更具体地涉及一种光学神经网络芯片的参数生成方法、芯片制造方法以及装置、介质和计算机程序产品。
背景技术
随着机器学习算法的不断改进,神经网络在各个领域的应用越来越广泛,而且在很多领域的表现已经超越了人类的现有极限,如计算能力方面。然而,由于传统CPU(Central Processing Unit)采用的是冯诺依曼计算体系结构,导致其不能高效地运行大规模并行计算过程,当神经网络在处理更复杂任务时需要消耗巨大的计算资源。因此,寻找速度更快、能耗更低的替代计算方法具有重要意义。光学神经网络为解决该问题提供了一种途径,因为与数字神经网络计算相比,它具有超快速度、超低能耗以及能够大规模并行处理信号等优势。随着对光学神经网络的研究的不断深入,如何设计并制造能够进行神经网络计算的光学神经网络芯片成为需要解决的问题。
发明内容
为此,本公开提供一种光学神经网络芯片的参数生成方法、芯片制造方法以及装置、介质和计算机程序产品。
根据本公开实施例的一个方面,提供了一种光学神经网络芯片的制造方法,包括:设置光学神经网络芯片的芯片基本参数,并基于所述芯片基本参数构建芯片神经网络模型,其中所述光学神经网络芯片包括用于对所述光学神经网络芯片中的光的光特征量进行调制的至少一个光特征量突变单元;基于所述芯片基本参数获得所述光学神经网络芯片的光场的基准函数,其中所述基准函数是光特征量为零时的光场函数;获取初始训练集,并将所述初始训练集映射到所述光场,以获得光学训练集;利用所述光学训练集对所述芯片神经网络模型进行训练,以获得芯片特征参数,其中所述芯片特征参数表征所述至少一个光特征量突变单元的结构特性;以及基于所述芯片基本参数和所述芯片特征参数制造所述光学神经网络芯片。
根据本公开实施例的示例,其中,所述芯片基本参数包括所述光学神经网络芯片的基本尺寸、所述至少一个光特征量突变单元的数量、每个光特征量突变单元中包括的突变结构的数量及位置、输出检测器的数量及位置中的一个或多个。
根据本公开实施例的示例,其中,基于所述芯片基本参数构建芯片神经网络模型包括:将所述至少一个光特征量突变单元的数量映射为所述芯片神经网络模型的隐藏层的个数,并且将每个光特征量突变单元中的一个或多个突变结构映射为所述芯片神经网络模型的神经元。
根据本公开实施例的示例,其中,基于所述芯片基本参数获得所述光学神经网络芯片的光场的基准函数包括:基于所述芯片基本参数,通过光学理论计算或者光学仿真模拟获得所述光学神经网络芯片的所述光场的所述基准函数。
根据本公开实施例的示例,其中,所述初始训练集包括初始输入值和初始标签值,并且其中,将所述初始训练集映射到所述光场以获得光学训练集包括:将所述初始训练集的初始输入值映射为所述光场的光特征量,以作为所述光学训练集的光学输入值;以及将所述初始训练集的初始标签值映射为所述光场的输出光功率,以作为所述光学训练集的光学标签值。
根据本公开实施例的示例,其中,利用所述光学训练集对所述芯片神经网络模型进行训练以获得芯片特征参数包括:将所述光学训练集中的所述光学输入值输入所述芯片神经网络模型,并计算所述芯片神经网络模型的输出值;计算所述输出值与所述光学标签值的损失函数;以及通过使所述损失函数最小来对所述芯片神经网络模型进行训练,以获得所述芯片特征参数。
根据本公开实施例的示例,其中,通过使所述损失函数最小来对所述芯片神经网络模型进行训练,以获得所述芯片特征参数包括:通过使所述损失函数最小来对所述芯片神经网络模型进行训练,以获得芯片光特征量序列;将所述芯片光特征量序列映射为所述芯片特征参数。
根据本公开实施例的示例,其中,基于所述芯片基本参数和所述芯片特征参数制造所述光学神经网络芯片包括:基于所述芯片基本参数,在衬底材料上沉积二氧化硅薄膜作为所述光学神经网络芯片的下包层;在所述下包层上沉积光波导材料,作为所述光学神经网络芯片的光波导层,并基于所述芯片基本参数和所述芯片特征参数在所述光波导层形成所述光学神经网络芯片的网络结构,所述网络结构包括所述至少一个光特征量突变单元;以及在所述光波导层上沉积薄膜材料,作为所述光学神经网络芯片的上包层。
根据本公开实施例的示例,其中,基于所述芯片基本参数和所述芯片特征参数在所述光波导层形成所述光学神经网络芯片的网络结构包括:在所述光波导层依次形成输入耦合器、输入直波导、输入宽度渐变波导、宽波导、所述至少一个光特征量突变单元、边缘防反射模块、输出界面防反射模块、输出宽度渐变波导、输出直波导以及输出耦合器,其中,进入所述光学神经网络芯片的光依次传播通过输入耦合器、输入直波导、输入宽度渐变波导、宽波导、至少一个光特征量突变单元、边缘防反射模块、输出界面防反射模块、输出宽度渐变波导、输出直波导以及输出耦合器。
根据本公开实施例的示例,上述制造方法还包括:在所述光学神经网络芯片的上包层上形成光特征量调制器,所述光特征量调制器用于对通过所述输入耦合器进入所述光学神经网络芯片的初始光的光特征量进行调制,以通过将输入数据信息映射为所述初始光的光特征量,来将所述初始光调制为携带所述输入数据信息的输入光。
根据本公开实施例的示例,其中,所述边缘防反射模块用于吸收传播至所述光学神经网络芯片的宽波导的侧截面处的光,所述输出界面防反射模块用于吸收从所述宽波导的除所述输出宽度渐变波导之外的输出界面反射回所述宽波导的光。
根据本公开实施例的示例,其中,所述光特征量包括光的振幅、相位、偏振、频率和角动量中的一个。
根据本公开实施例的示例,其中,所述至少一个光特征量突变单元为矩形凹槽阵列,并且所述芯片特征参数为所述矩形凹槽阵列中的每个矩形凹槽的尺寸。
根据本公开实施例的另一方面,提供了一种光学神经网络芯片的参数生成方法,包括:设置光学神经网络芯片的芯片基本参数,并基于所述芯片基本参数构建芯片神经网络模型,其中所述光学神经网络芯片包括用于对所述光学神经网络芯片中的光的光特征量进行调制的至少一个光特征量突变单元;基于所述芯片基本参数获得所述光学神经网络芯片的光场的基准函数,其中所述基准函数是光特征量为零时的光场函数;获取初始训练集,并将所述初始训练集映射到所述光场,以获得光学训练集;利用所述光学训练集对所述芯片神经网络模型进行训练,以获得芯片特征参数,其中所述芯片特征参数表征所述至少一个光特征量突变单元的结构特性,其中,所述芯片基本参数和所述芯片特征参数用于制造所述光学神经网络芯片。
根据本公开实施例的另一方面,提供了一种光学神经网络芯片的制造方法,包括:基于芯片基本参数,在衬底材料上沉积二氧化硅薄膜作为所述光学神经网络芯片的下包层;在所述下包层上沉积光波导材料,作为所述光学神经网络芯片的光波导层,并基于所述芯片基本参数和芯片特征参数在所述光波导层形成所述光学神经网络芯片的网络结构,所述网络结构包括至少一个光特征量突变单元;以及在所述光波导层上沉积薄膜材料,作为所述光学神经网络芯片的上包层,其中,所述芯片基本参数和所述芯片特征参数根据如上述方面中的光学神经网络芯片的参数生成方法来生成。
根据本公开实施例的另一方面,提供了一种光学神经网络芯片的参数生成装置,包括:设置单元,被配置为设置光学神经网络芯片的芯片基本参数,并基于所述芯片基本参数构建芯片神经网络模型,所述光学神经网络芯片包括用于对所述光学神经网络芯片的光特征量进行调制的至少一个光特征量突变单元;获取单元,被配置为基于所述芯片基本参数获得所述光学神经网络芯片的光场的基准函数,其中所述基准函数是光特征量为零时的光场函数,获取初始训练集,并将所述初始训练集映射到所述光场,以获得光学训练集;以及训练单元,被配置为利用所述光学训练集对所述芯片神经网络模型进行训练,以获得芯片特征参数,其中所述芯片特征参数表征所述至少一个光特征量突变单元的结构特性,其中,所述芯片基本参数和所述芯片特征参数用于制造所述光学神经网络芯片。
根据本公开实施例的另一方面,提供了一种光学神经网络芯片,所述光学神经网络芯片是根据如上述各个方面中的光学神经网络芯片的制造方法制造的。
根据本公开实施例的另一方面,提供了一种计算机可读存储介质,其上存储有计算机可读指令,所述计算机可读指令在被处理器执行时,使得所述处理器执行上述各个方面中任一项所述的方法。
根据本公开实施例的另一方面,提供了一种计算机程序产品,其包括计算机可读指令,所述计算机可读指令在被处理器执行时,使得所述处理器执行上述各个方面中任一项所述的方法。
利用根据本公开上述各个方面的光学神经网络芯片的参数生成方法、光学神经网络芯片的制造方法以及装置、介质和计算机程序产品,可以基于神经网络训练来对光学神经网络芯片进行设计,并且基于芯片基本参数和训练得到的芯片特征参数,能够利用传统芯片加工工艺来制造光学神经网络芯片,制造简单、成本低并且可以大规模生产,所得到的光学神经网络芯片在进行神经网络计算时,相比于传统的基于CPU的数字神经网络,具有超低功耗、超快速度且可以大规模并行处理的优势。
附图说明
通过结合附图对本公开实施例进行更详细的描述,本公开实施例的上述以及其它目的、特征和优势将变得更加明显。附图用来提供对本公开实施例的进一步理解,并且构成说明书的一部分,与本公开实施例一起用于解释本公开,并不构成对本公开的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1示出了根据本公开实施例的光学神经网络芯片的参数生成方法的流程图。
图2示出了根据本公开实施例的示例的芯片神经网络模型的训练过程的流程图。
图3示出了根据本公开实施例的光学神经网络芯片的制造方法的流程图。
图4示出了根据本公开实施例的光学神经网络芯片的结构示意图。
图5示出了根据本公开另一实施例的光学神经网络芯片的制造方法的流程图。
图6示出了根据本公开实施例的光学神经网络芯片的参数生成装置的结构示意图。
具体实施方式
下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本公开一部分的实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在无需创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。
由于传统的中央处理器(CPU)在实现深度神经网络算法方面并不理想,学术界和工业界已经开始致力于开发适合人工神经网络和深度学习应用的新硬件体系结构,光学神经网络芯片则为其中一个重要研究方向。如何设计、制造一种光学神经网络芯片,使得能够利用光在该芯片中的传播和检测来进行诸如深度学习等的神经网络计算,并且克服传统数字神经网络的功耗高、速度慢等缺陷,是本公开所关注的问题。
以机器学习中经典的分类算法为例,基于传统CPU的现有的数字神经网络已经可以熟练完成对大规模数据集的分类任务,而若要使得光学神经网络芯片也能够完成这种分类任务,需要将数据集的抽象数据属性映射为光的物理传播特性,并且对光学神经网络芯片的结构特性、制造参数等进行专门的设计和训练。因此,本公开首先提供一种光学神经网络芯片的参数生成方法,以基于神经网络训练来获取用来制造光学神经网络芯片的参数。
图1示出了根据本公开实施例的光学神经网络芯片的参数生成方法100的流程图。为了通过神经网络训练来生成光学神经网络芯片的参数,需要构建芯片神经网络模型,那么首先需要设置芯片的一些基本参数。在步骤110中,设置光学神经网络芯片的芯片基本参数,这里芯片基本参数可以包括光学神经网络芯片的基本尺寸,例如芯片的总长度、总宽度、总厚度等,以及芯片中诸如输入耦合器、输出耦合器等的芯片结构的尺寸参数等等。
如上所述,为使得基于本公开实施例的光学神经网络芯片能够完成对大规模数据集的机器学习计算,首先需要将数据集的抽象数据属性映射为芯片中光的物理传播特性。例如,对于分类任务中常用的鸢尾花(IRIS)数据集,其包含150个鸢尾花的数据样本,每50个数据样本取自三个鸢尾花种之一,即这些数据样本可以分为三类,每类包括50个数据,每个数据样本包含4个属性,即花萼长度、花萼宽度、花瓣长度和花瓣宽度,利用这4个属性,可以预测数据样本属于三类中的哪一类。
在本公开实施例中,如果要利用光学神经网络芯片实现对IRIS数据集的分类,则需要将IRIS数据集中的每个数据样本的4个属性值映射为光的物理传播特性,即采用光的传播特性来表征IRIS数据集中的每个数据样本的4个属性。能够反映光的物理传播特性的光特征量例如可以包括光的振幅、相位、偏振、频率、角动量以及任意其他特征量,本公开实施例对此不作具体限制。以光的相位特征为例,例如,可以将IRIS数据集中的每个数据样本的4个属性分别映射为4个光束的相位,那么,对于IRIS数据集的计算相应地可以映射为对于芯片中的光的相位的调制,这引出了光学神经网络芯片的关键结构——光特征量突变单元。
在本公开实施例中,光特征量突变单元用于对光学神经网络芯片中的光的光特征量进行调制,光在传播通过专门设计的光特征量突变单元时,其光特征量会发生改变,从而在芯片的输出端处检测到的光输出功率的分布也会有所不同。例如,以光特征量为光相位为例,此时光特征突变单元可以称为光相位突变单元,光在传播通过光相位突变单元时,其相位会发生改变。
光学神经网络芯片可以包括至少一个光特征量单元,并且每个光特征量突变单元可以由多个突变结构组成,突变结构例如可以是凹槽、凸起或者任意其他形状结构,本公开实施例对此不作具体限制。以突变结构为凹槽为例,则每个光特征量突变单元可以是凹槽阵列,例如可以是矩形凹槽阵列或者任意其他形状的凹槽阵列,本公开实施例对此不作具体限制。光特征量单元的结构特性是影响光特征量调制的关键因素,换句话说,是影响光学神经网络计算的关键因素。因此,在本公开实施例中,需要针对光特征量单元的结构特性进行神经网络训练,使得光特征量单元具有最佳的结构特性,以期能够获得能够最佳地执行光学神经网络计算的光学神经网络芯片。
在本公开实施例的示例中,以芯片特征参数表征至少一个光特征量突变单元的结构特性,例如,可以表征光特征量突变单元中的每个突变结构的尺寸,以突变结构为矩形凹槽为例,则可以表征矩形凹槽的长度或宽度,但本公开实施例不限于此,芯片特征参数也可以表征光特征量突变单元的其他结构特性,例如突变结构的数量和位置分布等等。
根据本公开实施例的示例,在设置光学神经网络芯片的芯片基本参数时,可以预先设置芯片中的光特征量突变单元的数量、以及每个光特征量突变单元中包括的突变结构的数量和位置,而光特征量突变单元中的每个突变结构的尺寸则可以通过神经网络训练获得,此时每个突变结构的尺寸即为期望获得的芯片特征参数。然而,本公开实施例不限于此,也可以预先设置芯片中的光特征量突变单元的数量、以及每个光特征量突变单元中包括的突变结构的尺寸,而每个光特征量突变单元中突变结构的数量和位置则通过神经网络训练获得,此时突变结构的数量和位置为期望获得的芯片特征参数,等等。
此外,在本公开实施例中,预先设置的光学神经网络芯片的芯片基本参数还可以包括输出检测器的数量及位置,输出检测器用于在芯片的输出端处对光输出功率进行检测,基于其检测结果可以获得光学神经网络计算的结果,例如对输入数据样本的分类结果等。
在步骤S110中,在设置了光学神经网络芯片的芯片基本参数之后,可以基于芯片基本参数构建芯片神经网络模型。在本公开实施例中,可以将光学神经网络芯片中光特征量突变单元的数量映射为该芯片神经网络模型的隐藏层的个数,并且将每个光特征量突变单元中的一个或多个突变结构映射为芯片神经网络模型的神经元。
在一个示例中,可以预先设置光学神经网络芯片包括3个光特征量突变单元,则相应地芯片神经网络模型包括3个隐藏层,但本公开实施例不限于此,光学神经网络芯片可以包括更多或者更少数量的光特征量突变单元,并且芯片神经网络模型可以包括更多或者更少数量的隐藏层。
在一个示例中,可以将每个光特征量突变单元中的多个突变结构映射为芯片神经网络模型的一个神经元,例如,在突变结构为矩形凹槽的情况下,可以将每个光特征量突变单元中的3个矩形凹槽映射为芯片神经网络模型的一个神经元,但本公开实施例不限于此,可以将光特征量突变单元中的更多或者更少数量的突变结构映射为一个神经元。
在步骤S120中,基于所设置的芯片基本参数获得光学神经网络芯片的光场的基准函数。这里,光学神经网络芯片的光场的基准函数是指光特征量为零时的光场函数。根据本公开实施例的示例,可以基于芯片基本参数,通过光学理论计算或者光学仿真模拟来获得光学神经网络芯片的光场的基准函数,例如,可以利用基于瑞利-索末菲公式的芯片空间衍射光场传播模型,通过光学理论计算或者光学仿真模拟计算来获得芯片光场的基准函数,但本公开实施例不限于此,也可以通过任何其他适当的方法来获得芯片光场的基准函数。
接下来,在步骤S130中,获取初始训练集,并将初始训练集映射到光场,以获得光学训练集。这里,初始训练集可以是用于神经网络计算的任意数据集,其包括初始输入值和用于结果对比的初始标签值,例如如前所述的IRIS数据集,本公开实施例对此不作具体限制。
如前面提到的,为了使得根据本公开实施例的光学神经网络芯片能够进行神经网络计算,需要将数据集的抽象数据属性映射为芯片中的光的物理传播特性。因此,为了对芯片神经网络模型进行训练,首先要将传统的初始训练集转换为体现光学特性的光学训练集。具体地,根据本公开实施例的示例,可以将初始训练集的初始输入值映射为光场的光特征量,以作为光学训练集的光学输入值;并且将初始训练集的初始标签值映射为光场的输出光功率,以作为光学训练集的光学标签值。例如,在初始训练集为IRIS数据集、并且光特征量为相位的情况下,可以将IRIS数据集中的每个数据样本的4个属性值分别映射为光场的4个相位值,并且将每个数据样本的标签值映射为光场的光输出功率,从而得到用于训练芯片神经网络模型的光学训练集。
在获得光学训练集之后,在步骤S140中,利用该光学训练集对芯片神经网络模型进行训练,以获得芯片特征参数,其中芯片特征参数表征至少一个光特征量突变单元的结构特性。
具体地,在该步骤中,对于光学训练集中的每个光学输入值,将该光学输入值输入芯片神经网络模型,并相应地计算芯片神经网络模型的输出值,例如可以利用基于瑞利-索末菲公式的芯片空间衍射光场传播模型来计算输出光功率,作为芯片神经网络模型的输出值。之后,计算所得到的各个输出值与对应的光学标签值的损失函数,例如可以计算输出值与光学标签值之间的均方差(Mean Square Error,MSE)、归一化均方误差(NormalizedMean Square Error,NMSE)等等作为损失函数。之后,通过使损失函数最小来对芯片神经网络模型进行训练,以获得芯片特征参数。例如,可以设置预定阈值,在损失函数小于预定阈值的情况下结束训练;或者,可以设置最大迭代次数,在达到最大迭代次数之时结束训练,等等,本公开实施例对此不做具体限制。
在训练结束之后,可以输出使得损失函数小于预定阈值、或者达到最大迭代次数的芯片光特征量序列,然后将该芯片光特征量序列映射为芯片特征参数,即获得了所期望的表征光特征量突变单元的结构特性的最佳参数。以光特征量为相位、光特征突变单元的突变结构为矩形凹槽、且芯片特征参数为各个矩形凹槽的尺寸为例,则训练结束后可以输出相位序列,该相位序列包括与每个矩形凹槽对应的输出相位值。然后,可以利用以下公式将所输出的相位序列中的各个相位值映射为相应矩形凹槽的尺寸:
其中,Li表示第i个矩形凹槽的尺寸,例如,在预设了各个矩形凹槽的宽度的情况下,Li可以表示第i个矩形凹槽的长度,或者,在预设了各个矩形凹槽的长度的情况下,Li可以表示第i个矩形凹槽的宽度,本公开实施例对此不作具体限制;是由该第i个矩形凹槽产生的相位延迟,其可以基于该i个矩形凹槽对应的输出相位值与输入相位值来确定;neff表示光特征量突变单元的有效折射率;nslab则表示光特征量突变单元所位于的芯片宽波导的有效折射率,k0=2π/λ是光传播通过光特征量突变单元的波数,其中λ表示输入光源的波长,其例如可以为1550nm,或者任意其他合适的波长,本公开实施例对此不作具体限制。
通过以上方法确定了芯片特征参数之后,可以基于芯片基本参数和芯片特征参数来制造光学神经网络芯片,如下文将进一步详细描述的。为了使得以上步骤更加清楚,下面结合图2对芯片神经网络模型的训练过程进行进一步的描述。
图2示出了根据本公开实施例的示例的芯片神经网络模型的训练过程的流程图200。如图2所示,在步骤S210中,首先进行参数设置。在该步骤中,可以设置光学神经网络芯片的芯片基本参数,如在上述步骤S110中所描述的,这里不再赘述。此外,在该步骤中,还可以设置芯片神经网络模型的初始训练参数,例如,可以设置损失函数种类,诸如均方差(MSE)、归一化均方误差(NMSE)等等;损失函数的预定阈值,例如可以设置预定阈值为0;最大迭代次数,例如可以设置最大迭代次数为3000;优化器种类,例如可以设置优化器为亚当(Adam)优化器、交叉熵优化器等;以及其他神经网络训练所需的初始参数等,本公开实施例对此不作具体限制。
在步骤S220中,将训练集输入芯片神经网络模型,这里,训练集例如可以是通过上述步骤S130获得的光学训练集。在步骤S230中,对于训练集中的每个数据样本,计算芯片神经网络模型的输出值,例如可以利用基于瑞利-索末菲公式的芯片空间衍射光场传播模型来计算输出光功率,作为芯片神经网络模型的输出值。在步骤S240中,判断是否已遍历训练集中的所有数据样本,如果判断结果为否,则继续遍历训练集并计算其中的各个数据样本的输出值;如果判断结果为是,则进行到下一步。在步骤S250中,计算损失函数,具体地,基于训练集中的各个数据样本的输出值及其对应的标签值,计算训练集的损失函数,例如,可以计算各个数据样本的输出值和标签值之间的NMSE作为损失函数。在步骤S260中,判断损失函数是否低于预定阈值,或者是否已经达到最大迭代次数,如果判断结果为否,则基于损失函数计算梯度,以更新神经网络中各个神经元的光特征量(例如,相位),并返回到步骤S230(步骤S290);如果判断结果为是,则可以结束迭代,输出光特征量序列(步骤S270),并可以利用测试集针对训练后的芯片神经网络模型进行测试(步骤S280)。至此,对于芯片神经网络模型的训练结束,所输出的光特征量序列例如可以被被进一步映射为表征光特征量突变单元的结构特性的芯片特征参数,例如利用上述公式(1)被映射为矩形凹槽阵列中各个矩形凹槽的尺寸,以用于制造光学神经网络芯片。
利用根据本公开上述实施例的光学神经网络芯片的参数生成方法,可以基于神经网络训练来对光学神经网络芯片进行设计,基于该方法所得到的芯片基本参数和芯片特征参数,能够利用传统芯片加工工艺来制造光学神经网络芯片,制造简单、成本低并且可以大规模生产,所得到的光学神经网络芯片在进行神经网络计算时,相比于传统的基于CPU的数字神经网络,具有超低功耗、超快速度且可以大规模并行处理的优势。
下面参照图3描述根据本公开实施例的光学神经网络芯片的制造方法。图3示出了根据本公开实施例的光学神经网络芯片的制造方法300的流程图。
在步骤S310中,基于芯片基本参数,在衬底材料上沉积二氧化硅薄膜作为光学神经网络芯片的下包层。这里,芯片基本参数可以是在生成光学神经网络芯片参数的过程中所预先设置的参数,如上文参照步骤S110所详细描述的。根据本公开实施例的示例,衬底材料可以是硅,也可以是容易在其表面生长二氧化硅薄膜的任意其他材料,本公开实施例对此不作具体限制。二氧化硅薄膜的厚度例如可以为5微米,或者任意其他适当的厚度,本公开实施例对此不作具体限制。可替代地,如果作为下包层的二氧化硅薄膜足够厚,可以直接令二氧化硅薄膜充当衬底,而省略在衬底材料上生长二氧化硅薄膜这一工艺步骤。
在步骤S320中,在下包层上沉积光波导材料,作为光学神经网络芯片的光波导层,并基于芯片基本参数和芯片特征参数在光波导层形成光学神经网络芯片的网络结构,其中网络结构是指光学神经网络芯片上可以进行光学神经网络计算的芯片结构,该网络结构可以包括至少一个光特征量突变单元。根据本公开实施例的示例,光波导材料可以是折射率比二氧化硅高、并且具有高透光性的材料,例如硅、氮化硅(Si3N4)或者任意其他合适的材料,以尽可能降低光在光波导材料中传播时的损耗;光波导材料的厚度例如可以为220纳米,或者任意其他适当的厚度,本公开实施例对此不作具体限制。芯片特征参数可以是通过如上所述的光学神经网络芯片的参数生成方法100所获得的,其表征至少一个光特征量突变单元的结构特性,例如其可以表征构成光特征量突变单元的矩形凹槽阵列中的每个矩形凹槽的尺寸。
在该步骤中,可以基于所获得的芯片特征参数,例如构成每个光特征量突变单元的矩形凹槽阵列中的每个矩形凹槽的尺寸,利用诸如清洗、涂胶、前烘、曝光、显影、坚膜、刻蚀、去光刻胶等的传统半导体加工工艺,在光波导层形成包括至少一个光特征量突变单元的网络结构,即在光学神经网络芯片的光波导层中形成可以进行光学神经网络计算的芯片结构。
在步骤S330中,在光波导层上沉积薄膜材料,作为光学神经网络芯片的上包层(或称为保护层)。根据本公开实施例的示例,薄膜材料可以是折射率比光波导材料高、并且具有高透光性的材料,例如可以是二氧化硅或者任意其他合适的材料,以尽可能降低光在传播过程中的损耗;薄膜材料的厚度例如可以为2微米,或者任意其他适当的厚度,本公开实施例对此不作具体限制。
根据本公开实施例的示例,光学神经网络芯片还可以包括更多结构,以实现光在芯片中的输入、传播、输出等各个过程,下面结合图4对光学神经网络芯片的制造方法300进行进一步的详细说明。图4示出了根据本公开实施例的示例的利用方法300所获得的光学神经网络芯片400的结构示意图。如图4所示,光学神经网络芯片400可以包括衬底材料410、下包层420、光波导层430和上包层440,其中在光波导层430上形成有至少一个光特征量突变单元4305。
根据本公开实施例的示例,基于芯片基本参数和芯片特征参数在光波导层形成光学神经网络芯片的网络结构可以包括在光波导层430上依次形成输入耦合器4301、输入直波导4302、输入宽度渐变波导4303、宽波导4304、至少一个光特征量突变单元4305、边缘防反射模块4306、输出界面防反射模块4307、输出宽度渐变波导4308、输出直波导4309以及输出耦合器4310。其中,输入耦合器4301用于将来自光源(例如激光源)的光耦合进光学神经网络芯片400,其例如可以采用水平耦合的方式将光水平耦合进芯片400,或者采用垂直耦合的方式将光垂直耦合进芯片400,本公开实施例对此不作具体限制;输入直波导4302用于传导通过输入耦合器4301被耦合入芯片400的光;输出直波导4309则用于传导将通过输出耦合器4310被耦合出芯片400的光。
如前面提到的,在利用光学神经网络芯片400进行神经网络计算之前,需要将传统的数据集的数据属性转换为光的物理传播特性,例如,将IRIS数据集中的每个数据样本的4个属性值转换为4个光相位值。为了实现该功能,光学神经网络芯片的制造方法300还包括在光学神经网络芯片的上包层440上形成光特征量调制器4401。光特征量调制器4401用于对通过输入耦合器4301进入光学神经网络芯片400的初始光的光特征量进行调制,以通过将输入数据信息映射为初始光的光特征量,来将初始光调制为携带输入数据信息的输入光。
例如,在光特征量为相位的情况下,光特征量调制器4401可以对初始光的相位进行调制,以将输入数据信息映射为初始光的相位,从而将初始光调制为携带输入数据信息的输入光。以输入数据为IRIS数据集、且光特征量为相位为例,则每个输入数据样本包括4个属性值,光特征量调制器4401可以将每个输入数据样本的4个属性值映射为通过输入耦合器4301进入芯片400的4个初始光束的相位,从而使得这4个初始光束被调制为携带输入数据信息的输入光束。在图4中,示意性地示出了输入耦合器4301包括4路分支,从而可以将4个初始光束分别耦合进芯片400,但这仅仅作为示例,输入耦合器4301可以根据输入数据的实际特性而包括更多或更少的分支,本公开实施例对此不作具体限制。
根据本公开实施例的示例,为了形成光特征量调制器4401,可以利用传统的半导体加工工艺在输入直波导4302正上方的上包层440上制作特定电极,例如,可以采用诸如氮化钛的金属化合物材料来制作热光器件电极,以作为光特征量调制器4401,这种由热光器件电极形成的光特征量调制器4401可以基于热光效应对光特征量(例如,光的相位等)进行调制。可替代地,可以在上包层440上制作导电引线,并形成电光器件电极作为光特征量调制器4401,这种由电光器件电极形成的光特征量调制器4401可以基于电压或者电场的变化对光特征量(例如,光的相位等)进行调制。
根据本公开实施例的示例,输入直波导4302和输出直波导4309使光以单模式光进行传播,例如横电波0(TE0)模式光,从而使光的耦合和传播效率最高。输入宽度渐变波导4303用于在光输入侧将单模式光转换为多模式光,例如从TE0模式光转换为近似平面光,使得进入光特征量突变单元4305的光为多模式光,这可以使得从至少一个光特征量突变单元到神经元网络的映射更加准确,以进一步提高光学神经网络的准确性。相应地,输出宽度渐变波导4308则用于在光输出侧将多模式光转换为单模式光,例如从近似平面光转换为TE0模式光,以使光在输出直波导4309中以单模式光继续传播,并最终通过输出耦合器4310被耦合出芯片400。
根据本公开实施例的示例,至少一个光特征量突变单元4305被形成在宽波导4304上,因此宽波导4304的宽度取决于光特征量突变单元4305的宽度。在通过上述方法100获得芯片基本参数和芯片特征参数之后,可以得到光特征量突变单元4305的结构特性,例如每个光特征量突变单元4305的矩形凹槽阵列中的各个矩形凹槽的尺寸,从而可以确定宽波导4304的宽度。在图4中,示意性地示出了三个光特征量突变单元4305,并且每个光特征量突变单元为矩形凹槽阵列,但这仅仅作为示例,光学神经网络芯片400还可以包括更多或者更少数量的光特征量突变单元,并且每个光特征量突变单元可以为任意其他形状结构,本公开实施例对此不作具体限制。
根据本公开实施例的示例,边缘防反射模块4306用于吸收传播至光学神经网络芯片400的宽波导4304的侧截面处的光;输出界面防反射模块4307则用于吸收从宽波导4304的除输出宽度渐变波导4308之外的输出界面反射回宽波导4304的光,也就是说,确保从宽波导4304的输出界面出射的光仅进入输出宽度渐变波导4308,而不从宽波导4304的输出界面的其他地方反射回宽波导4304。从而,边缘防反射模块4306和输出界面防反射模块4307可以防止从宽波导4304的侧截面以及除输出宽度渐变波导4308之外的输出界面反射回芯片内部的光对整个光学神经网络系统产生噪声干扰。
根据本公开实施例的示例,光通过输入耦合器4301被耦合进入光学神经神经网络芯片400,然后进入输入直波导4302,并在光特征量调制器4401的调制下携带输入数据信息,之后依次传播通过输入宽度渐变波导4303、宽波导4304、至少一个光特征量突变单元4305、边缘防反射模块4306、输出界面防反射模块4307、输出宽度渐变波导4308、输出直波导4309以及输出耦合器4310。其中,光在通过至少一个光特征量突变单元4305时,会在诸如矩形凹槽阵列的突变结构的作用下发生光特征量改变,例如在光特征量为相位的情况下,会发生相位改变,并最终使得输出光功率的分布发生改变。
根据本公开实施例的示例,输出耦合器4310可以包括一路或多路分支,并且在输出耦合器4310的各路分支处,可以布置用于对光的输出功率进行检测的一个或多个输出检测器(图4中未示出),例如光电检测器。通过对各个输出检测器所检测的光输出功率进行分析处理,可以获得光学神经网络芯片的计算结果。例如,在光学神经网络芯片400对IRIS数据集执行分类任务的情况下,输出耦合器4310可以包括三路分支,并且可以分别在输出耦合器4310的每一路分支处布置一个输出检测器,通过比较三个输出检测器所检测到的光输出功率的强度,来对IRIS数据集中的各个数据样本进行分类,即将各个数据样本分类为归属三类鸢尾花中的一类。需要说明的是,在图4中,将输出耦合器4310示出为包括三路分支,但这仅仅作为示例,输出耦合器4310可以根据实际应用情况包括更多或者更少的分支,本公开实施例对此不作具体限制。
以上参照图3和图4对光学神经网络芯片的制造方法300进行了描述。利用根据本公开实施例的制造方法300,能够利用传统芯片加工工艺来制造光学神经网络芯片,制造简单、成本低并且可以大规模生产,所得到的光学神经网络芯片在进行神经网络计算时,相比于传统的基于CPU的数字神经网络,具有超低功耗、超快速度且可以大规模并行处理的优势。
下面参照图5对根据本公开另一实施例的光学神经网络芯片的制造方法进行描述。图5示出了根据本公开另一实施例的光学神经网络芯片的制造方法500的流程图。由于方法500的步骤的细节与上文参照图1和图2描述的方法100、以及参照图3和图4描述的方法300的步骤的细节类似,因此为了简单起见,这里省略了对相同内容的重复描述。
如图5所示,在步骤510中,设置光学神经网络芯片的芯片基本参数,并基于芯片基本参数构建芯片神经网络模型,光学神经网络芯片包括用于对光学神经网络芯片中的光的光特征量进行调制的至少一个光特征量突变单元。在步骤S520中,基于所设置的芯片基本参数获得光学神经网络芯片的光场的基准函数,其中基准函数是光特征量为零时的光场函数。在步骤S530中,获取初始训练集,并将初始训练集映射到光场,以获得光学训练集。在步骤S540中,利用该光学训练集对芯片神经网络模型进行训练,以获得芯片特征参数,其中芯片特征参数表征至少一个光特征量突变单元的结构特性。在步骤S550中,基于芯片基本参数和芯片特征参数制造光学神经网络芯片。
下面参照图6描述根据本公开实施例的光学神经网络芯片的参数生成装置。图6示出了根据本公开实施例的光学神经网络芯片的参数生成装置600的结构示意图。如图6所示,装置600包括设置单元610、获取单元620和训练单元630。除了这3个单元以外,装置600还可以包括其他部件,然而,由于这些部件与本公开实施例的内容无关,因此在这里省略其图示和描述。另外,由于装置600的功能与上文参照图1和图2描述的方法100的步骤的细节类似,因此为了简单起见,这里省略对部分内容的重复描述。
设置单元610被配置为设置光学神经网络芯片的芯片基本参数,并基于芯片基本参数构建芯片神经网络模型,光学神经网络芯片包括用于对光学神经网络芯片的光特征量进行调制的至少一个光特征量突变单元。其中,芯片基本参数可以包括光学神经网络芯片的基本尺寸,例如芯片的总长度、总宽度、总厚度等,以及芯片中诸如输入耦合器、输出耦合器等的芯片结构的尺寸参数等等;芯片基本参数还可以包括光学神经网络芯片中的光特征量突变单元的数量、以及每个光特征量突变单元中包括的突变结构的数量和位置等;芯片基本参数还可以包括输出检测器的数量及位置等,输出检测器用于在芯片的输出端处对光输出功率进行检测,基于其检测结果可以获得光学神经网络计算的结果,例如对输入数据样本的分类结果等。
根据本公开实施例的示例,设置单元610还被配置为将光学神经网络芯片中光特征量突变单元的数量映射为芯片神经网络模型的隐藏层的个数,并且将每个光特征量突变单元中的一个或多个突变结构映射为芯片神经网络模型的神经元。
在一个示例中,设置单元610可以预先设置光学神经网络芯片包括3个光特征量突变单元,则相应地芯片神经网络模型包括3个隐藏层,但本公开实施例不限于此,光学神经网络芯片可以包括更多或者更少数量的光特征量突变单元,并且芯片神经网络模型可以包括更多或者更少数量的隐藏层。
在一个示例中,设置单元610可以将每个光特征量突变单元中的多个突变结构映射为芯片神经网络模型的一个神经元,例如,在突变结构为矩形凹槽的情况下,可以将每个光特征量突变单元中的3个矩形凹槽映射为芯片神经网络模型的一个神经元,但本公开实施例不限于此,可以将光特征量突变单元中的更多或者更少数量的突变结构映射为一个神经元。
获取单元620被配置为基于芯片基本参数获得光学神经网络芯片的光场的基准函数;获取初始训练集,并将初始训练集映射到光场,以获得光学训练集。这里,光学神经网络芯片的光场的基准函数是指光特征量为零时的光场函数。根据本公开实施例的示例,可以基于芯片基本参数,通过光学理论计算或者光学仿真模拟来获得光学神经网络芯片的光场的基准函数,例如,可以利用基于瑞利-索末菲公式的芯片空间衍射光场传播模型,通过光学理论计算或者光学仿真模拟计算来获得芯片光场的基准函数,但本公开实施例不限于此,也可以通过任何其他适当的方法来获得芯片光场的基准函数。初始训练集可以是用于神经网络计算的任意数据集,其包括初始输入值和用于结果对比的初始标签值,例如如前所述的IRIS数据集,本公开实施例对此不作具体限制。
根据本公开实施例的示例,可以将初始训练集的初始输入值映射为光场的光特征量,以作为光学训练集的光学输入值;并且将初始训练集的初始标签值映射为光场的输出光功率,以作为光学训练集的光学标签值。例如,在初始训练集为IRIS数据集,并且光特征量为相位的情况下,可以将IRIS数据集中的每个数据样本的4个属性值分别映射为光场的4个相位值,并且将每个数据样本的标签值映射为光场的光输出功率,从而得到用于训练芯片神经网络模型的光学训练集。
训练单元630被配置为利用光学训练集对芯片神经网络模型进行训练,以获得芯片特征参数,其中芯片特征参数表征至少一个光特征量突变单元的结构特性。具体地,对于光学训练集中的每个光学输入值,训练单元630将该光学输入值输入芯片神经网络模型,并相应地计算芯片神经网络模型的输出值,例如可以利用基于瑞利-索末菲公式的芯片空间衍射光场传播模型来计算输出光功率,作为芯片神经网络模型的输出值。之后,训练单元630计算所得到的各个输出值与对应的光学标签值的损失函数,例如可以计算输出值与光学标签值之间的均方差(MSE)、归一化均方误差(NMSE)等等作为损失函数。之后,训练单元630通过使损失函数最小来对芯片神经网络模型进行训练,以获得芯片特征参数。例如,可以设置预定阈值,在损失函数小于预定阈值的情况下结束训练;或者,可以设置最大迭代次数,在达到最大迭代次数之时结束训练,等等,本公开实施例对此不做具体限制。
在训练结束之后,可以输出使得损失函数小于预定阈值、或者达到最大迭代次数的芯片光特征量序列,然后将该芯片光特征量序列映射为芯片特征参数,即获得了所期望的表征光特征量突变单元的结构特性的最佳参数。以光特征量为相位、光特征突变单元的突变结构为矩形凹槽、且芯片特征参数为各个矩形凹槽的尺寸为例,则训练结束后可以输出相位序列,该相位序列包括与每个矩形凹槽对应的输出相位值。然后,可以利用如上所述的公式(1)将所输出的相位序列中的各个相位值映射为相应矩形凹槽的尺寸。
利用根据本公开上述实施例的光学神经网络芯片的参数生成装置,可以基于神经网络训练来对光学神经网络芯片进行设计,基于该装置所得到的芯片基本参数和芯片特征参数,能够利用传统芯片加工工艺来制造光学神经网络芯片,制造简单、成本低并且可以大规模生产,所得到的光学神经网络芯片在进行神经网络计算时,相比于传统的基于CPU的数字神经网络,具有超低功耗、超快速度且可以大规模并行处理的优势。
本公开实施例还提供一种光学神经网络芯片,其可以根据如上所述的制造方法300或500来生成。该光学神经网络芯片能够进行神经网络计算,并且相比于传统的基于CPU的数字神经网络,具有超低功耗、超快速度且可以大规模并行处理的优势。
本公开的实施例也可以被实现为计算机可读存储介质。根据本公开实施例的计算机可读存储介质上存储有计算机可读指令。当计算机可读指令由处理器运行时,可以执行参照以上附图描述的根据本公开实施例的光学神经网络芯片的参数生成方法、或者光学神经网络芯片的制造方法。计算机可读存储介质包括但不限于例如易失性存储器和/或非易失性存储器。易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。
根据本公开的实施例,还提供了一种计算机程序产品或计算机程序,该计算机程序产品或者计算机程序包括计算机可读指令,该计算机可读指令存储在计算机可读存储介质中。计算机设备的处理器可以从计算机可读存储介质读取该计算机可读指令,处理器执行该计算机可读指令,使得该计算机设备执行上述各个实施例中描述的光学神经网络芯片的参数生成方法、或者光学神经网络芯片的制造方法。
本领域技术人员能够理解,本公开所披露的内容可以出现多种变型和改进。例如,以上所描述的各种设备或组件可以通过硬件实现,也可以通过软件、固件、或者三者中的一些或全部的组合实现。
此外,如本公开和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。本公开中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。同样,“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。
此外,本公开中使用了流程图用来说明根据本公开实施例的实施例的系统所执行的操作。应当理解的是,前面或下面操作不一定按照顺序来精确地执行。相反,可以按照倒序或同时处理各种步骤。同时,也可以将其他操作叠加到这些过程中,或从这些过程移除某一步或数步操作。
除非另有定义,这里使用的所有术语(包括技术和科学术语)具有与本公开所属领域的普通技术人员共同理解的相同含义。还应当理解,诸如在通常字典里定义的那些术语应当被解释为具有与它们在相关技术的上下文中的含义相一致的含义,而不应用理想化或极度形式化的意义来解释,除非这里明确地这样定义。
以上对本公开进行了详细说明,但对于本领域技术人员而言,显然,本公开并非限定于本说明书中说明的实施方式。本公开在不脱离由权利要求书的记载所确定的本公开的宗旨和范围的前提下,可以作为修改和变更方式来实施。因此,本说明书的记载是以示例说明为目的,对本公开而言并非具有任何限制性的意义。
Claims (30)
1.一种光学神经网络芯片的制造方法,包括:
设置光学神经网络芯片的芯片基本参数,并基于所述芯片基本参数构建芯片神经网络模型,其中所述光学神经网络芯片包括用于对所述光学神经网络芯片中的光的光特征量进行调制的至少一个光特征量突变单元;
基于所述芯片基本参数获得所述光学神经网络芯片的光场的基准函数,其中所述基准函数是光特征量为零时的光场函数;
获取初始训练集,并将所述初始训练集映射到所述光场,以获得光学训练集;
利用所述光学训练集对所述芯片神经网络模型进行训练,以获得芯片特征参数,其中所述芯片特征参数表征所述至少一个光特征量突变单元的结构特性;以及
基于所述芯片基本参数和所述芯片特征参数制造所述光学神经网络芯片。
2.如权利要求1所述的方法,其中,所述芯片基本参数包括所述光学神经网络芯片的基本尺寸、所述至少一个光特征量突变单元的数量、每个光特征量突变单元中包括的突变结构的数量及位置、输出检测器的数量及位置中的一个或多个。
3.如权利要求2所述的方法,其中,基于所述芯片基本参数构建芯片神经网络模型包括:
将所述至少一个光特征量突变单元的数量映射为所述芯片神经网络模型的隐藏层的个数,并且将每个光特征量突变单元中的一个或多个突变结构映射为所述芯片神经网络模型的神经元。
4.如权利要求1所述的方法,其中,基于所述芯片基本参数获得所述光学神经网络芯片的光场的基准函数包括:
基于所述芯片基本参数,通过光学理论计算或者光学仿真模拟获得所述光学神经网络芯片的所述光场的所述基准函数。
5.如权利要求1所述的方法,其中,所述初始训练集包括初始输入值和初始标签值,
并且其中,将所述初始训练集映射到所述光场以获得光学训练集包括:
将所述初始训练集的初始输入值映射为所述光场的光特征量,以作为所述光学训练集的光学输入值;以及
将所述初始训练集的初始标签值映射为所述光场的输出光功率,以作为所述光学训练集的光学标签值。
6.如权利要求5所述的方法,其中,利用所述光学训练集对所述芯片神经网络模型进行训练以获得芯片特征参数包括:
将所述光学训练集中的所述光学输入值输入所述芯片神经网络模型,并计算所述芯片神经网络模型的输出值;
计算所述输出值与所述光学标签值的损失函数;以及
通过使所述损失函数最小来对所述芯片神经网络模型进行训练,以获得所述芯片特征参数。
7.如权利要求6所述的方法,其中,通过使所述损失函数最小来对所述芯片神经网络模型进行训练,以获得所述芯片特征参数包括:
通过使所述损失函数最小来对所述芯片神经网络模型进行训练,以获得芯片光特征量序列;
将所述芯片光特征量序列映射为所述芯片特征参数。
8.如权利要求1所述的方法,其中,基于所述芯片基本参数和所述芯片特征参数制造所述光学神经网络芯片包括:
基于所述芯片基本参数,在衬底材料上沉积二氧化硅薄膜作为所述光学神经网络芯片的下包层;
在所述下包层上沉积光波导材料,作为所述光学神经网络芯片的光波导层,并基于所述芯片基本参数和所述芯片特征参数在所述光波导层形成所述光学神经网络芯片的网络结构,所述网络结构包括所述至少一个光特征量突变单元;以及
在所述光波导层上沉积薄膜材料,作为所述光学神经网络芯片的上包层。
9.如权利要求8所述的方法,其中,基于所述芯片基本参数和所述芯片特征参数在所述光波导层形成所述光学神经网络芯片的网络结构包括:
在所述光波导层依次形成输入耦合器、输入直波导、输入宽度渐变波导、宽波导、所述至少一个光特征量突变单元、边缘防反射模块、输出界面防反射模块、输出宽度渐变波导、输出直波导以及输出耦合器,
其中,进入所述光学神经网络芯片的光依次传播通过输入耦合器、输入直波导、输入宽度渐变波导、宽波导、至少一个光特征量突变单元、边缘防反射模块、输出界面防反射模块、输出宽度渐变波导、输出直波导以及输出耦合器。
10.如权利要求9所述的方法,还包括:
在所述光学神经网络芯片的上包层上形成光特征量调制器,所述光特征量调制器用于对通过所述输入耦合器进入所述光学神经网络芯片的初始光的光特征量进行调制,以通过将输入数据信息映射为所述初始光的光特征量,来将所述初始光调制为携带所述输入数据信息的输入光。
11.如权利要求9所述的方法,其中,所述边缘防反射模块用于吸收传播至所述光学神经网络芯片的宽波导的侧截面处的光,所述输出界面防反射模块用于吸收从所述宽波导的除所述输出宽度渐变波导之外的输出界面反射回所述宽波导的光。
12.如权利要求1-11中任一项所述的方法,其中,所述光特征量包括光的振幅、相位、偏振、频率和角动量中的一个。
13.如权利要求1-11中任一项所述的方法,其中,所述至少一个光特征量突变单元为矩形凹槽阵列,并且所述芯片特征参数为所述矩形凹槽阵列中的每个矩形凹槽的尺寸。
14.一种光学神经网络芯片的参数生成方法,包括:
设置光学神经网络芯片的芯片基本参数,并基于所述芯片基本参数构建芯片神经网络模型,其中所述光学神经网络芯片包括用于对所述光学神经网络芯片中的光的光特征量进行调制的至少一个光特征量突变单元;
基于所述芯片基本参数获得所述光学神经网络芯片的光场的基准函数,其中所述基准函数是光特征量为零时的光场函数;
获取初始训练集,并将所述初始训练集映射到所述光场,以获得光学训练集;
利用所述光学训练集对所述芯片神经网络模型进行训练,以获得芯片特征参数,其中所述芯片特征参数表征所述至少一个光特征量突变单元的结构特性,
其中,所述芯片基本参数和所述芯片特征参数用于制造所述光学神经网络芯片。
15.如权利要求14所述的方法,其中,所述芯片基本参数包括所述光学神经网络芯片的基本尺寸、所述至少一个光特征量突变单元的数量、每个光特征量突变单元中包括的突变结构的数量及位置、输出检测器的数量及位置中的一个或多个。
16.如权利要求15所述的方法,其中,基于所述芯片基本参数构建芯片神经网络模型包括:
将所述至少一个光特征量突变单元的数量映射为所述芯片神经网络模型的隐藏层的个数,并且将每个光特征量突变单元中的一个或多个突变结构映射为所述芯片神经网络模型的神经元。
17.如权利要求14所述的方法,其中,基于所述芯片基本参数获得所述光学神经网络芯片的光场的基准函数包括:
基于所述芯片基本参数,通过光学理论计算或者光学仿真模拟获得所述光学神经网络芯片的所述光场的所述基准函数。
18.如权利要求14所述的方法,其中,所述初始训练集包括初始输入值和初始标签值,
并且其中,将所述初始训练集映射到所述光场以获得光学训练集包括:
将所述初始训练集的初始输入值映射为所述光场的光特征量,以作为所述光学训练集的光学输入值;以及
将所述初始训练集的初始标签值映射为所述光场的输出光功率,以作为所述光学训练集的光学标签值。
19.如权利要求18所述的方法,其中,利用所述光学训练集对所述芯片神经网络模型进行训练以获得芯片特征参数包括:
将所述光学训练集中的所述光学输入值输入所述芯片神经网络模型,并计算所述芯片神经网络模型的输出值;
计算所述输出值与所述光学标签值的损失函数;以及
通过使所述损失函数最小来对所述芯片神经网络模型进行训练,以获得所述芯片特征参数。
20.如权利要求19所述的方法,其中,通过使所述损失函数最小来对所述芯片神经网络模型进行训练,以获得所述芯片特征参数包括:
通过使所述损失函数最小来对所述芯片神经网络模型进行训练,以获得芯片光特征量序列;
将所述芯片光特征量序列映射为所述芯片特征参数。
21.如权利要求14-20中任一项所述的方法,其中,所述光特征量包括光的振幅、相位、偏振、频率和角动量中的一个。
22.如权利要求14-20中任一项所述的方法,其中,所述至少一个光特征量突变单元为矩形凹槽阵列,并且所述芯片特征参数为所述矩形凹槽阵列中的每个矩形凹槽的尺寸。
23.一种光学神经网络芯片的制造方法,包括:
基于芯片基本参数,在衬底材料上沉积二氧化硅薄膜作为所述光学神经网络芯片的下包层;
在所述下包层上沉积光波导材料,作为所述光学神经网络芯片的光波导层,并基于所述芯片基本参数和芯片特征参数在所述光波导层形成所述光学神经网络芯片的网络结构,所述网络结构包括至少一个光特征量突变单元;以及
在所述光波导层上沉积薄膜材料,作为所述光学神经网络芯片的上包层,
其中,所述芯片基本参数和所述芯片特征参数根据如权利要求14所述的方法生成。
24.如权利要求23所述的方法,其中,基于所述芯片基本参数和芯片特征参数在所述光波导层形成所述光学神经网络芯片的网络结构包括:
在所述光波导层依次形成输入耦合器、输入直波导、输入宽度渐变波导、宽波导、所述至少一个光特征量突变单元、边缘防反射模块、输出界面防反射模块、输出宽度渐变波导、输出直波导以及输出耦合器,
其中,进入所述光学神经网络芯片的光依次传播通过输入耦合器、输入直波导、输入宽度渐变波导、宽波导、至少一个光特征量突变单元、边缘防反射模块、输出界面防反射模块、输出宽度渐变波导、输出直波导以及输出耦合器。
25.如权利要求23所述的方法,还包括:
在所述光学神经网络芯片的上包层上形成光特征量调制器,所述光特征量调制器用于对通过所述输入耦合器进入所述光学神经网络芯片的初始光的光特征量进行调制,以通过将输入数据信息映射为所述初始光的光特征量,来将所述初始光调制为携带所述输入数据信息的输入光。
26.如权利要求24所述的方法,其中,所述边缘防反射模块用于吸收传播至所述光学神经网络芯片的宽波导的侧截面处的光,所述输出界面防反射模块用于吸收从所述宽波导的除所述输出宽度渐变波导之外的输出界面反射回所述宽波导的光。
27.一种光学神经网络芯片的参数生成装置,包括:
设置单元,被配置为设置光学神经网络芯片的芯片基本参数,并基于所述芯片基本参数构建芯片神经网络模型,所述光学神经网络芯片包括用于对所述光学神经网络芯片的光特征量进行调制的至少一个光特征量突变单元;
获取单元,被配置为基于所述芯片基本参数获得所述光学神经网络芯片的光场的基准函数,其中所述基准函数是光特征量为零时的光场函数,获取初始训练集,并将所述初始训练集映射到所述光场,以获得光学训练集;以及
训练单元,被配置为利用所述光学训练集对所述芯片神经网络模型进行训练,以获得芯片特征参数,其中所述芯片特征参数表征所述至少一个光特征量突变单元的结构特性,
其中,所述芯片基本参数和所述芯片特征参数用于制造所述光学神经网络芯片。
28.一种光学神经网络芯片,所述光学神经网络芯片是根据如权利要求1-13或23-26所述的方法制造的。
29.一种计算机可读存储介质,其上存储有计算机可读指令,所述计算机可读指令在被处理器执行时,使得所述处理器执行如权利要求1-26中任一项所述的方法。
30.一种计算机程序产品,其包括计算机可读指令,所述计算机可读指令在被处理器执行时,使得所述处理器执行如权利要求1-26中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210080623.9A CN114418082A (zh) | 2022-01-24 | 2022-01-24 | 光学神经网络芯片的参数生成方法及制造方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210080623.9A CN114418082A (zh) | 2022-01-24 | 2022-01-24 | 光学神经网络芯片的参数生成方法及制造方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114418082A true CN114418082A (zh) | 2022-04-29 |
Family
ID=81277657
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210080623.9A Pending CN114418082A (zh) | 2022-01-24 | 2022-01-24 | 光学神经网络芯片的参数生成方法及制造方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114418082A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116384460A (zh) * | 2023-03-29 | 2023-07-04 | 清华大学 | 鲁棒性光学神经网络训练方法、装置、电子设备及介质 |
CN116523015A (zh) * | 2023-03-24 | 2023-08-01 | 清华大学 | 对于工艺误差鲁棒的光学神经网络训练方法、装置及设备 |
CN116542305A (zh) * | 2023-03-29 | 2023-08-04 | 清华大学 | 抗入射信号误差的鲁棒性光学神经网络设计方法及装置 |
-
2022
- 2022-01-24 CN CN202210080623.9A patent/CN114418082A/zh active Pending
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116523015A (zh) * | 2023-03-24 | 2023-08-01 | 清华大学 | 对于工艺误差鲁棒的光学神经网络训练方法、装置及设备 |
CN116523015B (zh) * | 2023-03-24 | 2024-09-10 | 清华大学 | 对于工艺误差鲁棒的光学神经网络训练方法、装置及设备 |
WO2024198502A1 (zh) * | 2023-03-24 | 2024-10-03 | 清华大学 | 对于工艺误差鲁棒的光学神经网络训练方法、装置及设备 |
CN116384460A (zh) * | 2023-03-29 | 2023-07-04 | 清华大学 | 鲁棒性光学神经网络训练方法、装置、电子设备及介质 |
CN116542305A (zh) * | 2023-03-29 | 2023-08-04 | 清华大学 | 抗入射信号误差的鲁棒性光学神经网络设计方法及装置 |
CN116384460B (zh) * | 2023-03-29 | 2024-06-11 | 清华大学 | 鲁棒性光学神经网络训练方法、装置、电子设备及介质 |
WO2024198504A1 (zh) * | 2023-03-29 | 2024-10-03 | 清华大学 | 鲁棒性光学神经网络训练方法、装置、电子设备及介质 |
WO2024198503A1 (zh) * | 2023-03-29 | 2024-10-03 | 清华大学 | 抗入射信号误差的鲁棒性光学神经网络设计方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114418082A (zh) | 光学神经网络芯片的参数生成方法及制造方法 | |
Jin et al. | Auto-keras: Efficient neural architecture search with network morphism | |
US9523800B2 (en) | Computation efficiency by iterative spatial harmonics order truncation | |
Lebbe et al. | Robust shape and topology optimization of nanophotonic devices using the level set method | |
Schubert et al. | Inverse design of photonic devices with strict foundry fabrication constraints | |
Ma et al. | Intelligent algorithms: new avenues for designing nanophotonic devices | |
Tu et al. | Analysis of deep neural network models for inverse design of silicon photonic grating coupler | |
CN114519403B (zh) | 基于片上衍射神经网络的光学图神经分类网络、方法 | |
Liao et al. | Integrated photonic neural networks: Opportunities and challenges | |
US20220300796A1 (en) | Photonic neural network | |
CN111582468B (zh) | 光电混合智能数据生成计算系统及方法 | |
CN113705031B (zh) | 基于深度学习的纳米天线阵列电磁性能预测方法 | |
Li et al. | The Intelligent Design of Silicon Photonic Devices | |
Tomiyasu et al. | A study on function-expansion-based topology optimization without gray area for optimal design of photonic devices | |
Cauchon et al. | BraggNet: complex photonic integrated circuit reconstruction using deep learning | |
CN114429081A (zh) | 一种基于智能算法的高q值硅基光子晶体纳米束微腔 | |
CN113392966A (zh) | 一种神经网络平均池化的实现方法、设备及存储介质 | |
Zhao et al. | End-to-End Optimization for a Compact Optical Neural Network Based on Nanostructured 2× 2 Optical Processors | |
CN118192010B (zh) | 用于光学神经网络原位训练的硅基光控微环谐振器 | |
Fiers et al. | Optical information processing: Advances in nanophotonic reservoir computing | |
CN116070583A (zh) | 一种偏振调制纳米光子学器件的设计或优化方法 | |
Almeida et al. | Fully Connected Feedforward Neural Network for the Prediction of Amorphous Silicon Grating Couplers Efficiency | |
CN216286379U (zh) | 一种可变系数的微分方程光子计算求解系统 | |
Zeng | Design of a Neural Network Model for Point-Defect Microcavities in Two-Dimensional Silicon-Based Dielectric Column Photonic Crystals | |
ur Rehman et al. | Robust optimization of 2x2 multimode interference couplers with fabrication uncertainties |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |