JP2020079980A - 光偏微分演算装置および光ニューラルネットワーク - Google Patents
光偏微分演算装置および光ニューラルネットワーク Download PDFInfo
- Publication number
- JP2020079980A JP2020079980A JP2018212031A JP2018212031A JP2020079980A JP 2020079980 A JP2020079980 A JP 2020079980A JP 2018212031 A JP2018212031 A JP 2018212031A JP 2018212031 A JP2018212031 A JP 2018212031A JP 2020079980 A JP2020079980 A JP 2020079980A
- Authority
- JP
- Japan
- Prior art keywords
- optical
- wavelength
- neural network
- optical signal
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
Description
このようなバックプロパゲーションによる学習のためには、ニューラルネットワークの回路定数が事前に判明している必要がある。
また、本発明の光ニューラルネットワークの1構成例において、前記ベクトル行列積演算部のマッハツェンダー干渉計は、さらに、前記第1の方向性結合器よりも前の位置の前記第2の光導波路の近傍に設けられた第5のリング共振器を備え、前記パラメータ更新部は、前記第1、第2の位相シフタと前記第4、第5のリング共振器のうち少なくとも1つに与える制御信号によって前記重みの更新を行うことを特徴とするものである。
以下、本発明の実施例について詳細に説明する。損失関数Lの重みWに関する偏微分∂L/∂Wは、重みWの変動に伴う損失関数Lの変動を意味しているため、順方向に信号を伝搬している系において、着目する重みWを変調すれば損失関数Lの変動を実測することができ、∂L/∂Wの数値変分値を導出することができる。つまりフォワードプロパゲーションによるニューラルネットワークの学習も可能である。
本実施例では、光の伝搬を利用することにより光ニューラルネットワークの学習の高速性を確保し、光の多重性を用いることで重みWの調整の試行回数を削減する手法を提供する。なお、本発明で用いる光信号は、光強度・位相によって入力値、推論値、正解値といった値を表す信号である。
光偏微分演算装置は、波長多重光源1と、出力光強度・位相の波長依存性を有する光デバイスによって構成され、波長多重光源1から入力された波長多重光信号に対する演算を行う光演算器2と、光演算器2による演算後の波長多重光信号を受光し、光演算器2の演算結果を示す電気信号を得ると共に、光演算器2の演算結果の誤差の指標となる損失関数の偏微分値を示す電気信号を得る微分演算部3とから構成される。
光演算器2は、波長依存性を有する光デバイスにより構成されているため、波長多重光信号の波長毎に極微小な演算結果(強度)のずれが生じる。
ニューラルネットワークにおける損失関数Lは、式(6)によって表すことができる。
なお、式(5)の個々の重み(w11,w12,w21,w22,w31,w32,b1,b2,b3)は、個々のMZI200によって実現されるのではなく、複数のMZI200の組み合わせによって実現される。例えばベクトル行列積演算部20が2つのPS(θ,φ)を有するMZI200の組み合わせで構成される場合、計算上の重み(w11,w12,w21,w22,w31,w32,b1,b2,b3)は,回路上はベクトル行列積演算部20に示すMZIとアッテネータの制御信号Θ(θj,φj,j=1〜m、mはベクトル行列積演算部を構成するMZI200の数)に相当する。
微分演算部22は、波長多重光信号の合波を行うことにより、差分演算部21の演算結果に対するノルム演算および和算を行う複数のリング共振器220と、3つの波長多重光信号を受光して差分演算部21の演算結果を示す電気信号を得る3つの受光器221と、ベクトル行列積演算部20が有する波長依存性によって強度にずれが生じた光信号の差分演算と積算(除算)とを行うための受光器222,223および抵抗224とから構成される。受光器222,223と抵抗224とは、図1の受光器30−1,30−3と抵抗31とに相当する。
これにより、微分演算部22の受光器221から、光ニューラルネットワークによる推論結果を示す電気信号を得ることができる。
パラメータ更新部23は、微分演算部22の抵抗224の両端電圧Vdiffに基づいて、損失関数Lが0に近づくように制御信号Θを更新する。具体的には、パラメータ更新部23は、ベクトル行列積演算部20の2×2MZI200に与える制御信号を、−Vdiff(−η×∂L(θ)/∂θ)および−Vdiff(−η×∂L(φ)/∂φ)に相当する分だけずらすようにすればよい。
制御信号Θは重みwおよびbに変換可能であるため、制御信号Θに関する偏微分値の算出ならびに値の更新は、理論上は重みwおよびbを更新することと等価である。すなわち、上述のプロセスは,ニューラルネットワークの学習(最適化)と等しい。
微分演算部22のリング共振器220によって対象とする光信号を選択できるので、選択する光信号を変えることで、各制御信号θに関する偏微分値(−η×∂L(θ)/∂θ)を制御信号θ毎に求めることができる。つまり、パラメータ更新部23は、制御信号θ毎の更新が可能となる。
こうして、光ニューラルネットワークの学習が可能となる。
そこで、さらなる波長多重によって学習の高速化を実現する。これまでの説明においては3波長(1波長を推論に使用し、2波長を偏微分演算に使用)の活用を前提としてきた。しかしながら、本発明においてより多くの波長を活用することは本質的に可能であり、かつ、さらなる波長多重化は光ニューラルネットワークの学習の収束速度の向上、ならびに、勾配計算の並列化による学習の高速化を期待できる。
損失関数Lの各最適化パラメータ(重みwおよびb)に関する偏微分値は独立であるため、偏微分演算の並列化が可能である。
図8の例では、ベクトル行列積演算部20およびアッテネータ201に与える制御信号を任意の値とし、差分演算部21を構成する3つの2×2DC210の一方の入力ポートに正解値t1,t2,t3を示す光信号を入力した状態で、光ニューラルネットワークに波長多重光信号ms1〜ms3を入力する。
さて式(11)に示される転送行列は、下記に示される転送行列MおよびDの組み合わせで表現することができる。そのため、重みwの変化はMZIの位相の変化で表現することができる。そのため、式(2)におけるLのwに対する変化量は、Lの位相に対する変化量として取り扱うことが可能となる。そこで本実施例では、各MZI内の位相の変化がLに与える影響から偏微分値を求め、学習に適用することとする。
ここで、ベクトル行列積演算部20の2×2MZI200の転送行列Mの転送行列Mは、式(12)のようになる。
(I)入力値X、正解値Tとして任意の固定値(訓練データ)を入力する。
以上の偏微分演算と位相角φ,θの更新は各MZI200内のPS2000,2002毎に実行されるため、ベクトル行列積演算部20に含まれるPS2000,2002の個数分の試行回数が必要となり、更に、1つのPSに関する損失関数Lの偏微分値を求めるためには、PS調整前後の損失関数Lの値を測定する必要がある。本実施例では、この偏微分演算を1回で実行する方法を提供する。
図17の例では、微分演算部22内のリング共振器220−1〜220−3の共鳴波長をλ1 -、リング共振器220−4〜220−6の共鳴波長をλ1 +、リング共振器220−7〜220−9の共鳴波長をλ’1 -、リング共振器220−10〜220−12の共鳴波長をλ’1 +としている。
リング共振器220から受光器221〜223への光の受け渡しは、リング共振器220の近傍に設けられた光導波路225〜227を介して行われる。
もちろん、位相δ、ψを直接ずらすために、リング共振器2006および2007の共鳴波長λ1およびλ’1をずらしても良く、使用する光信号の波長をλ1およびλ’1からずらしても良い。これらの場合は、最終的に調整された波長λ1およびλ’1を推論に使用することとする。
使用する光信号の波長をずらす場合は、リング共振器220−1〜220−12には、パラメータ更新部(図6のパラメータ更新部23)から制御信号を与えるようにすればよい。パラメータ更新部は、学習時に2×2MZI200内のリング共振器2006に共鳴させる光信号の波長λ1をずらした場合、波長λ1をずらした分だけ、リング共振器220−1〜220−3の共鳴波長λ1 -とリング共振器220−4〜220−6の共鳴波長λ1 +とをずらす。また、パラメータ更新部は、2×2MZI200内のリング共振器2007に共鳴させる光信号の波長λ’1をずらした場合、波長λ’1をずらした分だけ、リング共振器220−7〜220−9の共鳴波長λ’1 -とリング共振器220−10〜220−12の共鳴波長λ’1 +とをずらす。
また、光ニューラルネットワークによる推論には分散の小さな帯域の波長を使用するため、2×2MZI200内のリング共振器2006,2007に共鳴しない信号の波長数を増やし易く、リング共振器220と受光器221の増設によって検出波長数を増やすことにより推論の波長多重化にも対応が可能である。
Claims (6)
- 出力光強度・位相の波長依存性を有する光デバイスによって構成され、入力された波長多重光信号に対する演算を行う光演算器と、
この光演算器による演算後の波長多重光信号を受光し、前記光演算器の演算結果を示す電気信号を得ると共に、前記光演算器の演算結果の誤差の指標となる損失関数の偏微分値を示す電気信号を得る微分演算部とを備え、
前記微分演算部は、
前記光演算器から出力された波長多重光信号のうち第1の光信号を受光して、前記光演算器の演算結果を示す電気信号を得る第1の受光器と、
前記光演算器から出力された波長多重光信号のうち前記第1の光信号と異なる波長の第2の光信号を受光する第2の受光器と、
この第2の受光器と出力電流の向きが逆になるように接続され、前記光演算器から出力された波長多重光信号のうち前記第1、第2の光信号と異なる波長の第3の光信号を受光する第3の受光器と、
前記第2、第3の受光器の接続点に接続された抵抗とを備え、
前記抵抗の両端電圧が、前記損失関数の偏微分値を示すことを特徴とする光偏微分演算装置。 - 請求項1記載の光偏微分演算装置において、
前記微分演算部は、
さらに、共鳴波長が前記第1の光信号の波長に設定され、前記光演算器から出力された波長多重光信号から前記第1の光信号を取り出して前記第1の受光器に入力する第1のリング共振器と、
共鳴波長が前記第2の光信号の波長に設定され、前記光演算器から出力された波長多重光信号から前記第2の光信号を取り出して前記第2の受光器に入力する第2のリング共振器と、
共鳴波長が前記第3の光信号の波長に設定され、前記光演算器から出力された波長多重光信号から前記第3の光信号を取り出して前記第3の受光器に入力する第3のリング共振器とを備えることを特徴とする光偏微分演算装置。 - 請求項1または2記載の光偏微分演算装置と、
前記光偏微分演算装置の光演算器に設定される重みを、光ニューラルネットワークの学習時に前記損失関数の偏微分値に基づいて、前記損失関数が0に近づくように更新するパラメータ更新部とを備え、
前記光演算器は、
この光演算器に入力された波長多重光信号が示す入力値と前記重みの積和演算を行うマッハツェンダー干渉計からなるベクトル行列積演算部と、
前記学習時に前記ベクトル行列積演算部から出力された波長多重光信号が示す推論値と前記学習時に光演算器に入力される光信号が示す正解値との差分を演算し、光ニューラルネットワークによって推論を行うときには前記ベクトル行列積演算部から出力された波長多重光信号をそのまま出力する差分演算部とから構成されることを特徴とする光ニューラルネットワーク。 - 請求項3記載の光ニューラルネットワークにおいて、
前記ベクトル行列積演算部のマッハツェンダー干渉計は、
第1、第2の2本の光導波路と、
前記第1の光導波路に設けられ、入力ポートがマッハツェンダー干渉計の一方の入力ポートに接続された第1の位相シフタと、
前記第1、第2の光導波路に設けられ、第1の入力ポートが前記第1の位相シフタの出力ポートに接続され、第2の入力ポートがマッハツェンダー干渉計の他方の入力ポートに接続された第1の方向性結合器と、
前記第1の光導波路に設けられ、入力ポートが前記第1の方向性結合器の第1の出力ポートに接続された第2の位相シフタと、
前記第1、第2の光導波路に設けられ、第1の入力ポートが前記第2の位相シフタの出力ポートに接続され、第2の入力ポートが前記第1の位相シフタの第2の出力ポートに接続され、第1の出力ポートがマッハツェンダー干渉計の一方の出力ポートに接続され、第2の出力ポートがマッハツェンダー干渉計の他方の出力ポートに接続された第2の方向性結合器とから構成され、
前記パラメータ更新部は、前記第1、第2の位相シフタのうち少なくとも一方に与える制御信号によって前記重みの更新を行うことを特徴とする光ニューラルネットワーク。 - 請求項4記載の光ニューラルネットワークにおいて、
前記ベクトル行列積演算部のマッハツェンダー干渉計は、
さらに、前記第1の方向性結合器と前記第2の方向性結合器との間の位置の前記第2の光導波路の近傍に設けられた第4のリング共振器を備え、
前記パラメータ更新部は、前記第1、第2の位相シフタと前記第4のリング共振器のうち少なくとも1つに与える制御信号によって前記重みの更新を行うことを特徴とする光ニューラルネットワーク。 - 請求項5記載の光ニューラルネットワークにおいて、
前記ベクトル行列積演算部のマッハツェンダー干渉計は、
さらに、前記第1の方向性結合器よりも前の位置の前記第2の光導波路の近傍に設けられた第5のリング共振器を備え、
前記パラメータ更新部は、前記第1、第2の位相シフタと前記第4、第5のリング共振器のうち少なくとも1つに与える制御信号によって前記重みの更新を行うことを特徴とする光ニューラルネットワーク。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018212031A JP7103602B2 (ja) | 2018-11-12 | 2018-11-12 | 光偏微分演算装置および光ニューラルネットワーク |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018212031A JP7103602B2 (ja) | 2018-11-12 | 2018-11-12 | 光偏微分演算装置および光ニューラルネットワーク |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020079980A true JP2020079980A (ja) | 2020-05-28 |
JP7103602B2 JP7103602B2 (ja) | 2022-07-20 |
Family
ID=70801784
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018212031A Active JP7103602B2 (ja) | 2018-11-12 | 2018-11-12 | 光偏微分演算装置および光ニューラルネットワーク |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7103602B2 (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112232487A (zh) * | 2020-10-19 | 2021-01-15 | 中国科学院半导体研究所 | 光学神经网络芯片及其计算方法 |
CN112989701A (zh) * | 2021-03-15 | 2021-06-18 | 华中科技大学 | 一种sgdbr可调谐半导体激光器的波长调谐方法 |
CN113095482A (zh) * | 2021-04-06 | 2021-07-09 | 西安邮电大学 | 基于bp神经网络的拉曼放大器增益值计算方法及系统 |
CN113657588A (zh) * | 2021-08-19 | 2021-11-16 | 山东云海国创云计算装备产业创新中心有限公司 | 一种实现光学神经网络的方法及系统 |
CN113673677A (zh) * | 2021-08-18 | 2021-11-19 | 山东云海国创云计算装备产业创新中心有限公司 | 一种非线性激活函数relu的实现方法、设备及介质 |
CN115494912A (zh) * | 2022-11-18 | 2022-12-20 | 中国科学技术大学 | 实现多阶微分运算的光学芯片、参数确定方法及运算设备 |
WO2023062510A1 (en) * | 2021-10-15 | 2023-04-20 | 3M Innovative Properties Company | Decorative film for a vehicle interior and anti-scatter film |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002525597A (ja) * | 1998-09-22 | 2002-08-13 | イギリス国 | 光学位相検出器 |
JP2016213379A (ja) * | 2015-05-12 | 2016-12-15 | 富士通株式会社 | 多波長レーザ光源及び波長多重通信システム |
US20170351293A1 (en) * | 2016-06-02 | 2017-12-07 | Jacques Johannes Carolan | Apparatus and Methods for Optical Neural Network |
JP2018160200A (ja) * | 2017-03-24 | 2018-10-11 | 富士通株式会社 | ニューラルネットワークの学習方法、ニューラルネットワークの学習プログラム及びニューラルネットワークの学習装置 |
-
2018
- 2018-11-12 JP JP2018212031A patent/JP7103602B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002525597A (ja) * | 1998-09-22 | 2002-08-13 | イギリス国 | 光学位相検出器 |
JP2016213379A (ja) * | 2015-05-12 | 2016-12-15 | 富士通株式会社 | 多波長レーザ光源及び波長多重通信システム |
US20170351293A1 (en) * | 2016-06-02 | 2017-12-07 | Jacques Johannes Carolan | Apparatus and Methods for Optical Neural Network |
JP2018160200A (ja) * | 2017-03-24 | 2018-10-11 | 富士通株式会社 | ニューラルネットワークの学習方法、ニューラルネットワークの学習プログラム及びニューラルネットワークの学習装置 |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112232487A (zh) * | 2020-10-19 | 2021-01-15 | 中国科学院半导体研究所 | 光学神经网络芯片及其计算方法 |
CN112232487B (zh) * | 2020-10-19 | 2023-09-22 | 中国科学院半导体研究所 | 光学神经网络芯片及其计算方法 |
CN112989701A (zh) * | 2021-03-15 | 2021-06-18 | 华中科技大学 | 一种sgdbr可调谐半导体激光器的波长调谐方法 |
CN112989701B (zh) * | 2021-03-15 | 2022-03-18 | 华中科技大学 | 一种sgdbr可调谐半导体激光器的波长调谐方法 |
CN113095482A (zh) * | 2021-04-06 | 2021-07-09 | 西安邮电大学 | 基于bp神经网络的拉曼放大器增益值计算方法及系统 |
CN113095482B (zh) * | 2021-04-06 | 2024-01-12 | 西安邮电大学 | 基于bp神经网络的拉曼放大器增益值计算方法及系统 |
CN113673677A (zh) * | 2021-08-18 | 2021-11-19 | 山东云海国创云计算装备产业创新中心有限公司 | 一种非线性激活函数relu的实现方法、设备及介质 |
CN113673677B (zh) * | 2021-08-18 | 2023-08-08 | 山东云海国创云计算装备产业创新中心有限公司 | 一种非线性激活函数relu的实现方法、设备及介质 |
CN113657588A (zh) * | 2021-08-19 | 2021-11-16 | 山东云海国创云计算装备产业创新中心有限公司 | 一种实现光学神经网络的方法及系统 |
CN113657588B (zh) * | 2021-08-19 | 2023-08-18 | 山东云海国创云计算装备产业创新中心有限公司 | 一种实现光学神经网络的方法及系统 |
WO2023062510A1 (en) * | 2021-10-15 | 2023-04-20 | 3M Innovative Properties Company | Decorative film for a vehicle interior and anti-scatter film |
CN115494912A (zh) * | 2022-11-18 | 2022-12-20 | 中国科学技术大学 | 实现多阶微分运算的光学芯片、参数确定方法及运算设备 |
Also Published As
Publication number | Publication date |
---|---|
JP7103602B2 (ja) | 2022-07-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7103602B2 (ja) | 光偏微分演算装置および光ニューラルネットワーク | |
Hughes et al. | Training of photonic neural networks through in situ backpropagation and gradient measurement | |
Pai et al. | Parallel programming of an arbitrary feedforward photonic network | |
Tait et al. | Feedback control for microring weight banks | |
Pérez et al. | Principles, fundamentals, and applications of programmable integrated photonics | |
Shokraneh et al. | A single layer neural network implemented by a $4\times 4$ MZI-based optical processor | |
CN109639359A (zh) | 基于微环谐振器的光子神经网络卷积层芯片 | |
US20210192342A1 (en) | Training of Photonic Neural Networks Through in situ Backpropagation | |
US10627849B1 (en) | Reservoir computing operations using multi-mode photonic integrated circuits | |
KR20230062829A (ko) | 결맞음 광 컴퓨팅 아키텍처 | |
Huang et al. | Programmable matrix operation with reconfigurable time-wavelength plane manipulation and dispersed time delay | |
Shao et al. | Generalized robust training scheme using genetic algorithm for optical neural networks with imprecise components | |
Ishihara et al. | An optical neural network architecture based on highly parallelized WDM-multiplier-accumulator | |
CN111198593B (zh) | 一种超线程光子计算结构 | |
Pai et al. | Power monitoring in a feedforward photonic network using two output detectors | |
EP3488275B1 (en) | Method and apparatus for obtaining optical measurements in a device handling split-beam optical signals | |
US20230351167A1 (en) | Frequency multiplexed photonic neural networks | |
CN115905792A (zh) | 一种用于光学实数矩阵计算的马赫曾德尔干涉仪网络 | |
US20230163859A1 (en) | Optical routing network-based quantum array control | |
CN113392965B (zh) | 一种哈达玛积的实现方法、设备及存储介质 | |
Xu et al. | Performance evaluation of an integrated photonic convolutional neural network based on delay buffering and wavelength division multiplexing | |
Bui et al. | Coherent Optical Convolution Processor Based on MMI Structures for Deep Learning Applications | |
WO2023091675A1 (en) | Optical neural network with gain from parity time optical couplers | |
US20220327369A1 (en) | Simultaneous measurements of gradients in optical networks | |
US11402577B2 (en) | Analog optic memory and signal processing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20181112 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210512 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220314 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220329 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220517 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220621 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220628 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7103602 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |