JP2022529870A

JP2022529870A - 人工神経ネットワークのための光子テンソルアクセラレータ

Info

Publication number: JP2022529870A
Application number: JP2021543463A
Authority: JP
Inventors: グイファンリ; ショーンパン; ヒーウェン
Original assignee: University of Central Florida Research Foundation Inc UCFRF
Current assignee: University of Central Florida Research Foundation Inc UCFRF
Priority date: 2019-05-03
Filing date: 2019-10-15
Publication date: 2022-06-27
Anticipated expiration: 2039-10-15
Also published as: WO2020180351A1; CN113518986A; WO2020180351A8; JP7497063B2; EP3864535A4; US20220164642A1; EP3864535A1

Abstract

ベクトル－ベクトル乗算、マトリクス－ベクトル乗算、マトリクス－マトリクス乗算、バッチマトリクス－マトリクス乗算、及びテンソル－テンソル乗算のための光子ユニットを説明する。乗算は、コヒーレント混合及び二乗則検出によるものである。光子アクセラレータを構成するのに使用することができる多くの次元、すなわち、波長、ベクトルモード、直角位相、及び空間の３つの次元が存在する。符号化された入力ベクトル又は入力マトリクスは、所望数のコピーに展開され、かつ重みマトリクスを構成する重みベクトルを含有する対応する符号化されたローカル発振器と混合される。マトリクス－ベクトル（マトリクス－マトリクス）乗算のための光子アクセラレータを構成するために、２つ（３つ）の次元のいずれかの部分集合を使用することができる。拡張性を高めるために、複数の次元を超次元に組み合わせることができる。【選択図】図１

Description

〔関連出願への相互参照〕
この出願は、この出願と同じ出願人に譲渡されて引用によって本明細書にその教示が全体的に組み込まれている代理人整理番号ＵＣＦ３４１２９ＰＲＯＶで２０１９年５月３日に出願された「人工神経ネットワークのための光子テンソルアクセラレータ（ＰｈｏｔｏｎｉｃＴｅｎｓｏｒＡｃｃｅｌｅｒａｔｏｒｓｆｏｒＡｒｔｉｆｉｃｉａｌＮｅｕｒａｌＮｅｔｗｏｒｋｓ）」という名称の米国仮特許出願第６２／８４２，７７１号に関連し、かつそれに対する優先権を主張するものである。

本出願は、一般的に光コンピューティング、より具体的には、ベクトル－ベクトル、マトリクス－ベクトル、マトリクス－マトリクス、バッチマトリクス－マトリクス、及びテンソル－テンソル乗算のための光子アクセラレータに関する。

この出願は、番号を有するカギ括弧、例えば、ｘを番号として［ｘ］で表示する引用文献を含む。引用文献のこの番号リストは、この出願の最後に見出される。更に、これらの引用文献は、本出願と共に提出する情報公開陳述書（ＩＤＳ）に列記している。列記したこれらの引用文献の各々の教示は、これによりその全体が引用によって本明細書に組み込まれる。

エレクトロニクス及びフォトニクスは、多かれ少なかれ、今日まで情報社会でのそれらのそれぞれの技術的役割を切り開いてきた。電子のフェルミ粒子性に起因して、エレクトロニクスは、情報の発生及び処理のための技術を支配してきた。同様に、光子のボース粒子性に起因して、フォトニクスは、エレクトロニクスもレーザ及び光ファイバの発明の前では通信技術を支配してきたが、最近数十年での情報伝達に関する技術を支配している。長らく予想されてきたように、電子集積回路（ＩＣ）の処理パワーは、遅かれ早かれ、ムーアの法則による成長はしなくなることになる。この予想は、過去半世紀にわたって光及び光子情報処理を探求するように光学及びフォトニクス社会を断続的に刺激している。これらの努力は、光トランジスタ［１］、［２］及び汎用光コンピューティングのための論理ゲート［３］、［４］、並びに専用情報処理のためのフーリエ光学［５］を含む。しかし、１９８０年代の終わりまでに、コンピューティングでの光学の役割及び機能を実際以上に評価するという間違いは、この分野を既に何度か後退させ、続く二十年でこの分野を殆ど休眠状態にした［６］。

近年では、ＩＣは、クロック速度を高めるのに必要とされる小さいデバイス特徴部に関連付けられた高密度電力消費からの熱を放散させる難しさに主として起因して、実際にムーアの法則による指数関数的な成長を持続させることができなくなっている。従って、コンピューティングパワーでのＩＣの拡張性に対する制限因子は、全電力ではなく電力密度である。ムーアの法則後の時代では、拡張性問題に対する業界のソリューションは、単一ＣＰＵを有するノイマンアーキテクチャとは対照的に、グラフィック処理ユニット（ＧＰＵ）及びテンソル処理ユニット（ＴＰＵ）のような並列コンピュータ構造及び特定のコンピューティング目的のための最適化されたローカルメモリを有するハードウエアアクセラレータ［７］、［８］を構成することである。これらのハードウエアアクセラレータからの利益を受けて、人工神経ネットワーク（ＡＮＮ）を用いて実施される人工知能（ＡＩ）／機械学習（ＭＬ）に基づく新しい用途は、生のＩＣ処理パワーの停滞にも関わらず、学界、産業界、及び一般社会の事実上あらゆる隅々に拡散した。

本発明は、ベクトル－ベクトル乗算、マトリクス－ベクトル乗算、マトリクス－マトリクス乗算、バッチマトリクス－マトリクス乗算、及びテンソル－テンソル乗算のための光子ユニットである。ベクトル－ベクトル乗算の場合に、光子デバイスは、第１のベクトルを表す第１の光信号を受信する第１の光マルチプレクサを含み、第１のベクトルベクトル内の各要素は、第１の多重化光信号を生成するために光の第１の自由度（ＤＯＦ）／次元上で符号化され、かつ１回の乗算サイクル中に非一時的である。光子ユニットは、第１の光信号とコヒーレントであって第２のベクトルを表す第２の光信号を受信する光マルチプレクサを含み、第２のベクトル内の各要素は、第２の多重化光信号を生成するために第１のベクトルと同一の要素から直交の光自由度（ＤＯＦ）／次元マッピングを用いて符号化される。光子ユニットはまた、第１の光マルチプレクサから第１の多重化光信号及び第２の光マルチプレクサから第２の多重化光信号を受信し、それらを組み合わせて全体干渉強度での第１のベクトルと第２のベクトルの乗算結果を含有する第１の光信号と第２の光信号の間の干渉を生成するビーム結合器を含む。この累算は、ＤＯＦ全体を必要とせず、むしろ符号化に使用されなかったＤＯＦ内の特定の点又はパラメータを必要とする。

Ｍ×１ベクトルとのＮ×Ｍマトリクス乗算の場合に、光子ユニットは、Ｍ個の要素を有する少なくともＭ×１のベクトルを表す少なくとも第１の光信号を受信する第１の光マルチプレクサを含み、Ｍ×１ベクトル内の各要素は、第１の多重化光信号を生成するために第１の直交光自由度（ＤＯＦ）／次元上で符号化され、かつ１回の乗算サイクル中に非一時的であり、Ｍは、１よりも大きいか又はそれに等しい正の整数である。光子ユニットは、第２の直交光自由度（ＤＯＦ）／次元でのＮ個の追加の光信号内でＭ×１ベクトルを表す少なくとも第１の光信号を複数のＮ個のコピーの中に複製するための光複製器を含み、Ｎは、１よりも大きいか又はそれに等しい正の整数である。光子ユニットはまた、光複製器と同一であってＭ個の追加の光信号を各々が受信する第２の直交光自由度（ＤＯＦ）／次元でのＮ個の光マルチプレクサを含み、Ｍ個の追加の光信号の各々は、第１の光信号とコヒーレントであり、Ｎ個の追加の光信号の各々は、Ｍ×Ｎマトリクスの独立行を表し、Ｍ×Ｎマトリクスの行内の各要素は、Ｎ個の追加の多重化光信号を生成するために、Ｍ×１ベクトルを表す第１の光信号と同一の要素から直交の光自由度（ＤＯＦ）／次元マッピングを用いて符号化される。光子ユニットはまた、第１の光マルチプレクサから第１の多重化光信号のＮ個のコピー及びＮ個の光マルチプレクサからＮ個の追加の多重化光信号を受信し、それらを組み合わせてＮ個の全体干渉強度でのＭ×ＮマトリクスとＭ×１ベクトルとの乗算結果を含有する第１の光信号とＮ個の追加の光信号の各々との間の干渉のＮ回の発生を生成する少なくとも１つのビーム結合器を含む。

Ｍ×ＷマトリクスとのＮ×Ｍマトリクス乗算の場合に、光子ユニットは、Ｎ個の光信号の各々がＮ×ＭマトリクスのＭ個の要素を有する独立行を表すＮ個の光信号を受信する第１の直交光自由度（ＤＯＦ）／次元でのＮ個の光マルチプレクサの第１のセットを含み、Ｎ×Ｍマトリクスの各独立行内の各要素は、Ｎ個の多重化光信号を生成するために、第２の直交光自由度（ＤＯＦ）／次元上で符号化され、かつ１回の乗算サイクル中に非一時的であり、Ｍ及びＮは、各々が１よりも大きいか又はそれに等しい正の整数である。光子ユニットは、Ｎ×Ｍマトリクスの独立行を表すＮ個の多重化光信号の各々を第３の直交光自由度（ＤＯＦ）／次元での複数のＷ個のコピーの中に複製するための第１の光複製器を含み、Ｗは、１よりも大きいか又はそれに等しい正の整数である。光子ユニットはまた、Ｗ個の追加の光信号を受信する第３の直交光自由度（ＤＯＦ）／次元での第１の光複製器と同一であるＷ個の光マルチプレクサの第２のセットを含み、Ｗ個の追加の光信号の各々は、Ｎ個の光信号とコヒーレントであり、Ｗ個の追加の光信号の各々は、Ｍ×ＷマトリクスのＭ個の要素を有する独立列を表し、Ｍ×Ｗマトリクスの各独立列内の各要素は、Ｗ個の追加の多重化光信号を生成するために、Ｎ×Ｍマトリクスの各独立行内の各要素と同一の要素から直交の光自由度（ＤＯＦ）／次元マッピングを用いて符号化される。光子ユニットは、Ｍ×Ｗマトリクスの独立列を表すＷ個の多重化光信号の各々を第１の直交光自由度（ＤＯＦ）／次元での複数のＮ個のコピーの中に複製するためのＮ個の光マルチプレクサの第１のセットと同一である第２の光複製器を含む。光子ユニットはまた、Ｎ×Ｍマトリクス及びＭ×Ｗマトリクスのうちの各々の適切に複製された行又は列を表すＮ×Ｗ個の多重化光信号の２つのセットを受信し、それらを組み合わせてＮ×Ｗ個の全体干渉強度での乗算結果を含有するＮ×Ｍマトリクスの行の各々とＭ×Ｗマトリクスの列との間の干渉のＮ×Ｗ回の発生を生成する少なくとも１つのビーム結合器を含む。

Ｂ個のＮ×ＭマトリクスにＭ×Ｗマトリクスを乗じるバッチの場合に、光子ユニットは、第１のＭ×ＮマトリクスのＭ個の要素を各々が有する独立行をＮ個の光信号の各々が表すＮ個の光信号を受信する第１の直交光自由度（ＤＯＦ）／次元でのＮ個の光マルチプレクサの第１のセットを含み、第１のＭ×Ｎマトリクスの各独立行内の各要素は、Ｎ個の多重化光信号を生成するために、第２の直交光自由度（ＤＯＦ）／次元上で符号化され、かつ１回の乗算サイクル中に非一時的であり、Ｍ及びＮは、各々が１よりも大きいか又はそれに等しい正の整数である。光子ユニットは、第１のＮ×Ｍマトリクスの独立行を表すＮ個の多重化光信号の各々をＮ×Ｍマトリクスの第３の直交光自由度（ＤＯＦ）／次元での複数のＷ個のコピーの中に複製するための第１の光複製器を含み、Ｗは、１よりも大きいか又はそれに等しい正の整数である。光子ユニットは、Ｂ個のＮ×Ｍマトリクスのうちの１つの独立行を表すＮ個の多重化光信号の第３の直交自由度（ＤＯＦ）／次元でのＷ個のコピーを各々が含有するＢ個の光信号を受信する第４の直交光自由度（ＤＯＦ）／次元での第２のマルチプレクサを含み、Ｂは、１よりも大きいか又はそれに等しい正の整数である。光子ユニットは、Ｗ個の追加の光信号を受信する第１の光複製器によって使用されるものと同一である第３の直交光自由度（ＤＯＦ）／次元でのＷ個の光マルチプレクサの第３のセットを含み、Ｗ個の追加の光信号の各々は、Ｎ個の光信号とコヒーレントであり、Ｗ個の追加の光信号の各々は、Ｍ×Ｗマトリクスのうちの各々のＭ個の要素を有する独立列を表し、Ｍ×Ｗマトリクスの各独立列内の各要素は、Ｗ個の追加の多重化光信号を生成するために、Ｎ×Ｍマトリクスのうちの各々の各独立行内の各要素と同一の要素から直交の光自由度（ＤＯＦ）／次元マッピングを用いて符号化される。光子ユニットは、Ｍ×Ｗマトリクスの独立列を表すＷ個の多重化信号の各々を第１の直交光自由度（ＤＯＦ）／次元での複数のＮ個のコピーの中に複製するためのＮ個の光マルチプレクサの第１のセットと同一である第２の光複製器を含む。光子ユニットは、Ｍ×Ｗマトリクスのうちの各々の独立列を表すＷ個の多重化信号の第１の直交自由度（ＤＯＦ）／次元でのＮ個のコピーを各々が含有するＢ個の同一光信号を生成する第４の直交光自由度（ＤＯＦ）／次元での第３の光複製器を含む。光子ユニットは、Ｂ×Ｎ×Ｗ個の多重化光信号の２つのセットを第２のマルチプレクサ及び第３の光複製器から受信し、それらを組み合わせてＮ×Ｗ個の全体干渉強度でのＢ個の個別のＮ×Ｍマトリクスに同じＭ×Ｗマトリクスを乗じた乗算の総和を含有する干渉のＮ×Ｗ回の発生を生成する少なくとも１つのビーム結合器を含む。

第１のテンソルが階数ｐを有し、第２のテンソルが階数ｑを有する２つのテンソルの乗算の場合に、第１のテンソルの形状は、［Ｎ_１，Ｎ_２，．．．，Ｎ_ｐ－１，Ｍ］であり、第２のテンソルの形状は、［Ｍ，Ｗ_１，．．．，Ｗ_ｑ－１］である。Ｎ_１，Ｎ_２，．．．，Ｎ_ｐ－１，Ｍ，Ｗ_１，．．．，Ｗ_ｑ－１は、各々が１よりも大きいか又はそれに等しい正の整数である。光子ユニットは、１番目の階数からｐ番目の階数までに沿って第１のテンソルの要素をそれぞれ１番目からｐ番目の直交自由度（ＤＯＦ）／次元に対して符号化する。光子ユニットは、テンソルを表す多重化光信号を（ｐ＋１）番目から（ｐ＋ｑ）番目までの直交光自由度（ＤＯＦ）／次元での複数のＷ_１×Ｗ_２×．．．×Ｗ_ｑ－１個のコピーの中に複製するための光複製器の第１のセットを含む。光子ユニットはまた、第１のテンソルの（ｐ＋１）番目から（ｐ＋ｑ）番目までの直交自由度（ＤＯＦ）／次元の複製物と同一の要素から直交の光自由度（ＤＯＦ）／次元マッピングを用いて、１番目の階数からｑ番目の階数までに沿って第２のテンソルの要素をそれぞれ（ｐ）番目から（ｐ＋ｑ－１）番目までの直交自由度（ＤＯＦ）／次元の上に符号化する。光子ユニットは、第２のテンソルを表す多重化信号を第１のテンソルの第１から第（ｐ－１）までの直交自由度（ＤＯＦ）／次元と同一の要素から直交の光自由度（ＤＯＦ）／次元マッピングである第１から第（ｐ－１）までの直交光自由度（ＤＯＦ）／次元での複数のＮ_１×Ｎ_２×．．．×Ｎ_ｐ－１個のコピーの中に複製するための光複製器の第２のセットを含む。光子ユニットは、［Ｎ_１，Ｎ_２，．．．，Ｎ_ｐ－１，Ｍ，Ｗ_１，．．．，Ｗ_ｑ－１］個の多重化光信号の２つのセットを光複製器の２つのセットから受信し、それらを組み合わせて干渉強度でのＮ_１×Ｎ_２×．．．×Ｎ_ｐ－１×Ｗ_１×．．．×Ｗ_ｑ－１個の個別のＭ－要素ベクトル－ベクトル乗算の乗算の総和を含有する干渉の［Ｎ_１，Ｎ_２，．．．，Ｎ_ｐ－１，Ｗ_１，．．．，Ｗ_ｑ－１］回の発生を生成する少なくとも１つのビーム結合器を含む。

ベクトル－ベクトル、マトリクス－ベクトル、マトリクス－マトリクス、バッチマトリクス－マトリクス、及びテンソル－テンソル乗算のうちのいずれかに対する上述の干渉信号は、典型的には、非線形光学要素に入るか、又は全体干渉強度が電気信号に変換されてそれが非線形電気要素に入るかのいずれかである。

一例では、符号化又は複製は、波長、空間モード、偏光、直角位相、及び波数ベクトルの成分のうちの少なくとも１つを使用する。空間モードは、エルミート－ガウスモード、ラゲール－ガウスモード、又は空間正規直交基底を形成する離散空間サンプルのうちの１つとすることができる。

別の例では、符号化又は複製は、２又は３以上の光自由度（ＤＯＦ）／次元の組合せで構成される超次元を使用する。

別の例では、符号化又は複製に関して、少なくとも２つの直交光自由度（ＤＯＦ）／次元は、光の次元又は超次元の非重複部分集合である。

本発明、並びにその好ましい使用モード、更に別の目的、及び利点は、添付図面と共に読む時に例示的実施形態の以下の詳細説明を参照して最も良く理解されるであろう。

畳み込み隠れ層と完全接続外層とを有する人工神経ネットワークの図、及び人工神経ネットワークの実施での本発明、すなわち、光子テンソルアクセラレータの機能を示す図である。（ａ）はマトリクス乗算の図、（ｂ）は乗累算演算に還元されてＣＰＵを用いて実施される図２（ａ）のマトリクス乗算を示す図、（ｃ）は乗累算演算に還元されてＧＰＵを用いて実施される図２（ａ）のマトリクス乗算を示す図、（ｄ）は乗累算演算に還元されてＴＰＵを用いて実施され、メモリアクセスでの高い並列化と改善されたエネルギ効率とを有する図２（ａ）のマトリクス乗算を示す図である。電子アクセラレータと光子アクセラレータの間の性能比較の表である。波長符号化光子マトリクスアクセラレータに基づくノード層の概略図である。モード符号化光子マトリクスアクセラレータに基づくノード層の概略図である。マトリクス－マトリクス乗算のためのマッピングスキームの概略図である。

非限定的定義
「ビーム結合器」という用語は、コヒーレントビームが互いに干渉し合うことを可能にするデバイスである。ビーム結合器は、非限定的に反射光学系、屈折光学系、回折光学要素、光ファイバデバイス、又はそのような構成要素の組合せによって実施することができる。

「ビームスプリッタ」という用語は、伝播する光を２又は３以上の経路に分割することができるデバイスである。ビームスプリッタは、非限定的に反射光学系、屈折光学系、回折光学要素、光ファイバデバイス、又はそのような構成要素の組合せによって実施することができる。

「要素から直交の光自由度（ＤＯＦ）／次元マッピング」という用語は、マトリクス要素又はベクトル要素から波長、空間モード、偏光、直角位相、及び波数ベクトル成分を含む光の独立パラメータの間の対応である。

「超次元」という用語は、２又は３以上の光自由度（ＤＯＦ）／次元の組合せで構成されることを意味する。

「次元又は超次元の部分集合」という用語は、１光自由度（ＤＯＦ）／次元又は１光超次元での独立パラメータの部分集合を意味する。

「光」という用語は、光スペクトルの可視部分と不可視部分の両方を含む電磁放射線である。

「乗算サイクル」という用語は、単一計算サイクル中に含まれる数学的乗算演算を意味する。

「ビーム複製器」という用語は、波長、空間モード、偏光、直角位相、及び波数ベクトルを含む入射光と同じ１又は２以上の指定パラメータを有する入射光の２又は３以上のコピーを生成するデバイスである。ビーム複製器は、非限定的に反射光学系、屈折光学系、回折光学要素、光ファイバデバイス、又はそのような構成要素の組合せによって実施することができる。

背景
電子ハードウエアアクセラレータ（ＴＰＵ及びＧＰＵ）が演じる重要な役割は、ＡＮＮでの将来の開発がソフトウエアとハードウエアの両方の進歩に依存することを明確に示している。しかし、現在、電子ハードウエアアクセラレータは、拡張性に関して既にその限界まで押しやられている。こうした経緯を踏まえて、光相互接続を益々短くなる長さスケールまで押し進めること、並びに光ニューロモルフィックコンピュータ［１８］～［２３］及び光リザーバコンピュータ［２４］～［３０］

のような新しいコンピュータパラダイムを明らかにすることを含むコンピュータでの光学の役割を探求する新たな努力があった［１７］。ＡＮＮ及びＤＮＮのための主な基礎的要素は、以下の通りである。
１．相互接続、
２．マトリクス－ベクトル乗算及びマトリクス－マトリクス乗算、及び
３．非線形性

光学及びフォトニクスは、エレクトロニクスよりも優れているとは言わないまでも同程度には最初の２つの機能を実施することができ、論理レベルではなくニューロン毎のレベルの光非線形性が実際に非常に実用的であるので、今こそＡＮＮ及びＤＮＮでの光学及びフォトニクスの役割を探求する好期である。本発明者は、ＧＰＵ及びＴＰＵよりも数桁高いコンピューティングパワーを有し、更に１クロックサイクルでのマトリクス－ベクトル乗算、マトリクス－マトリクス乗算、バッチマトリクス乗算、すなわち、３Ｄデータキューブ（例えば、画像バッチ）に重みマトリクスを乗算すること、並びにテンソル－テンソル乗算の機能を有する光子テンソルアクセラレータ（ＰＴＡ）を開示する。本節の残余では、最初に電子ＡＮＮの基礎を概説し、それに光ＡＮＮでの関連の研究の簡単な説明を続ける。

人工神経ネットワーク
３つの一般的なＡＮＮモデル［３１］、すなわち、（ａ）各ニューロンの出力が直前層からの全てのニューロンの線形結合の非線形応答である完全接続（ＦＣ）ネットワークとしても公知の多層パーセプトロン、（ｂ）各ニューロンの出力が直前層からのニューロンの部分集合の指定線形結合（すなわち、カーネルとこの部分集合との畳み込み）の非線形応答である畳み込み神経ネットワーク（ＣＮＮ）、及び（ｃ）各ニューロンの出力が直前層からのニューロンと同じ層からのものであるが前回のものであるニューロンとの両方の線形結合の非線形応答である回帰型神経ネットワーク（ＲＮＮ）がある。図１は、畳み込み隠れ層と完全接続出力層とを有するＡＮＮを示している。

畳み込みと線形結合の両方は、重みマトリクス：

と入力ベクトルのバッチ：

の間のマトリクス乗算に数学的に還元することができる。神経ネットワークにおいてマトリクス計算速度を改善するために、データ変換とスレッド並列化スキームとがＣＰＵ及びＧＰＵに実施される［３２］、［３３］。処理並列化及びクロック速度を押し進めることはできるが、マイクロプロセッサの性能は、最終的にオンチップ電力散逸によって制限される。電力効率を評価するための重要なメトリックは、マトリクス乗算に対して不可欠な演算である乗累算演算（ＭＡＣ）毎のエネルギ消費である。図２（ａ）は、乗累算演算に還元されて図２（ｂ）に示すＣＰＵ、図２（ｃ）に示すＧＰＵ、及び図２（ｄ）に示す高い並列化とメモリアクセスの改善されたエネルギ効率とを有するＴＰＵを用いて実施されるマトリクス乗算の図である。図２Ｂに示すように、各ＭＡＣは、３回のメモリ読取（フィルタ重み、ニューロン入力、及び部分和に関する）と１回のメモリ書込（更新された部分和）とを必要とする。

最新のマイクロプロセッサでは、メモリアクセスが処理エネルギのうちの大部分を消費する。動的ランダムアクセスメモリ（ＤＲＡＭ）は、データアクセス毎に小さいオンチップメモリよりも２桁高いエネルギを消費する。従って、ローカルメモリ上に格納されたデータの再利用性を最適化することにより、全エネルギ消費を有意に低減することができる。しかし、問題は、ＤＲＡＭ（数十ギガバイト）と比較してローカルメモリの容量が限られる（数キロバイト）ことである。メモリアクセスでのこの問題に対処するために、図２（ｃ）及び図２（ｄ）に示す特定用途向け集積回路（ＡＳＩＣ）は、計算の加速のための新しい空間アーキテクチャを探求する。例えば、データストレージが論理ユニットの近くのレジスタに配置されたＧｏｏｇｌｅのＴＰＵは、市販のＧＰＵと比較して２０倍の低減である～１ｐＪ／ＭＡＣのエネルギ効率を明らかにした。しかし、メモリアクセス時の電力散逸は、依然として論理演算時に費やされるものの３倍である。

光人工神経ネットワーク
光人工神経ネットワークは、１９８０年代から研究題材であり続けている。この分野での代表的な研究を振り返る。明らかなように、ＡＮＮの分野は、比較的長い活動休止期間の後に復活を享受している。

ホログラフィに基づく全光ＡＮＮ
１９８０年代には、パターン認識のための全光ＡＮＮを実現することを目指した一連の研究があった。全ての機能（神経ネットワークトレーニングとパターン認識の両方）及び全ての基礎的要素が光学系を用いて達成されたので、光屈折（ＰＲ）体積ホログラム及び非線形ファブリ－ペロー（ＦＰ）共振器を用いた顔認識に関する代表的な研究［３４］、［３５］は、現在までのところ唯一の完全な全光ＡＮＮに留まっている。この従来技術は、光学系がＡＮＮに基づいてパターン認識を実施することができることを明らかにしたが、
・非線形ＦＰ共振器を起動するのに必要とされる高い電力消費、
・光屈折ホログラムのダイナミックレンジに起因して限られる拡張性、及び
・ミリ秒程度のＰＲ搬送波搬送寿命によって限られる低速のトレーニング速度、
という欠点を有し、この技術が有意な実用的応用になることが阻まれた。

回折光学系に基づく機械学習
従来技術［３６］では、パターン認識を特にデジタル分類子として実行するために多平面光回折ネットワークが使用される。ネットワーク内の位相スクリーンは、機械学習技術を用いて設計される。ＭＮＩＳＴ（改変国立標準技術研究所）手書きデジタルデータセットからの１０，０００枚の画像に対する数値試験が行われた［１１］。３Ｄ印刷された位相スクリーンを用いた実験結果は、シミュレーションと実験の間の８８％の一致を示している。この分類子では、相互接続を構成するために自由空間光回折が使用され、同時に相互接続を多様化すること、及び各回折層に対する重みマトリクスを確立することの両方の目的で位相マスクが使用される。

全光デジタル分類は、ＡＮＮに似た構造を用いて達成された。しかし、分類システムは完全に線形である。その結果、直交する入力しか分類することができない。非線形性を導入することにより、このシステムは、真の神経ネットワークとして機能することになると考えられる。

コヒーレントナノフォトニクスに基づく深層学習全光ＡＮＮ
この研究では、マトリクス－ベクトル乗算は、再構成可能シリコン光子集積回路（ＰＩＣ）を通してコヒーレント入力光信号アレイを伝播させることによって実施された。その結果、出力光信号は、ＰＩＣ伝達マトリクスと入力信号の積になる。

シリコンＰＩＣの伝達マトリクスは、いずれかの指定重みマトリクスに設定することができることが見出されている。これは、Ｕ及びＶがｍ×ｍ及びｎ×ｎのユニタリマトリクスであり、Σがｍ×ｎ真値矩形対角マトリクスである時に、あらゆる真値ｍ×ｎマトリクスＴは、特異値分解（ＳＶＤ）により、

として分解することができることに起因する。同様に、光ビームスプリッタ及び位相調整器を用いてあらゆるユニタリ変換を実施することができることも示された［３７］。

［３８］では、ビームスプリッタ及び位相調整器は、シリコン導波管マッハ－ツェンダー（ＭＺ）干渉計で実現された。全光ＡＮＮを実現するために、非線形活性化関数も光ドメイン内に実施しなければならない。［３８］では、光非線形活性化関数を設けるために可飽和吸収器が提案されている。実際の実験的実施では、非線形活性化は、依然として電気ドメイン内で実施される。

ＰＩＣは、伝達マトリクスが重みマトリクスであるように設定されたコヒーレントな多入力多出力（ＭＩＭＯ）システムである。この手法の美しさは、集積ＰＩＣが、いずれの電力も能動的に消費することなくマトリクス－ベクトル乗算に向けて乗算と累算の両方を実施する点である。［３８］では、ＰＩＣは、約１．２ｃｍ×０．５ｃｍの面積を占有する５４個のＭＺを有する。従って、１２’’ウェーハは、約６０，５００個のＭＺ又は約２５０×２５０個のＭＺを支持することができる。その結果、典型的な用途が１００，０００個のニューロンを必要とするのに対して、「方向カプラ及び位相モジュレータのフットプリントは、多数（Ｎ＞１０００）のニューロンにスケーリングすることを非常に困難にする［３９］」。

ＴＤＭ及びコヒーレント混合に基づく深層学習光電子ＡＮＮ
これは、ＭＡＣ演算が光ドメイン内で実行され、非線形活性化が電気ドメイン内で実行される混成手法である［３９］。デジタル分類は、数値シミュレーションを用いて明らかにされる。最先端電子系よりも低いエネルギ消費毎ＭＡＣが予想された。

ベクトル－ベクトル乗算は、時分割多重化（ＴＤＭ）信号とＴＤＭローカル発振器（ＬＯ）の間の要素毎のコヒーレント光混合によって実行され、累算は、積分と同等なローパスフィルタリングによって光検出信号に対して実施された。次いで、マトリクス－ベクトル乗算は、自由空間の並列性を利用することによって達成された。

重みマトリクスは時間変調によって発生されるので、この構成は、超高速ＡＮＮトレーニングを可能にする。エネルギ消費毎ＭＡＣを電子系よりもかなり低くすることができることも示されている。しかし、一般的に、ＡＮＮ重みマトリクスは、低速で更新することができ、最終的に定常状態に留まる。それでもこの構成では、累算が時間積分によって実施されるので、重みマトリクスは、静的重みに対してさえも高電力消費高速変調を常に必要とする。更に、この構造は、その拡張性への直接的な関わりを有する。ＭＡＣに関する積分時間は、電子非線形活性化に関する１ＧＨｚのクロック速度に対応する１ｎｓであると仮定する。５００ＧＨｚの最高変調速度を仮定すると、列毎の重みの個数は、ＴＰＵとそれほど変わらない５００に制限される。それほど関心を抱かせないことは、この構造が全光ＡＮＮに適合しないことである。

要約
図３の表には、光子アクセラレータの性能及び最先端電子系との比較が要約されている。上述のように、拡張性が最も重要なメトリックである。乗算が受動的であることに起因して光学技術の全てがエネルギ効率に対する潜在性を有するが、エネルギ効率は厳密で系統的な計算を必要とするので、この表にはエネルギ効率を列挙していない。光学技術の各々は、手本とすることができる重要な革新技術を実現する。以下に示すように、これらの革新技術及び本明細書に開示する本発明者の多次元手法を組み込むことにより、光子テンソルアクセラレータ（ＰＴＡ）が拡張性に関して最終的に電子系を追い越すことを可能にするはずである。

開示する本発明は、１）電子系に優る数桁高い拡張性及び速度を提供し、２）高速であり、プログラム可能であり、トレーニング並びに推論に理想的に適合し、かつ３）少なくともある一定の部類のＡＩ機能に関して純電子系対応物に優る競争力を有するＡＮＮを可能にするように電力消費密度を低減する光学及び光子方法を使用する。注目に値するのは、
・ＡＮＮが、汎用コンピュータではなく特に光子アクセラレータに適する特殊演算／計算（例えば、ＭＡＣ）しか必要とせず、
・ＡＮＮが、データのダイナミックレンジ内の変動性及び非線形活性化に対してロバストであるので［４０］、アナログ光子アクセラレータが、そのデジタル論理対応物と同等の性能を実現することができる、
ということである。

本発明の実施例
波長符号化及びモード符号化マトリクス－ベクトル乗算アクセラレータ
図４Ａ及び図４Ｂのマトリクス－ベクトル乗算は、乗算がコヒーレント混合及び二乗則検出によって実施される点で［３９］への単一類似性を有する。本発明者の手法と［３９］の間には大きい相違点があり、［３９］での累算は時間ドメイン内を用いて実施されるが、本発明者の手法での累算は、光の波長、空間、及び他の全ての非時間ドメイン／自由度／次元を用いて実施される。図４Ａ及び図４Ｂでは、入力ベクトル及び重みベクトルは、特異波長又は空間モード［例えば、エルミート－ガウス（ＨＧ）モード］上に要素毎に投影される。波長符号化又はモード符号化された入力ベクトルは、所望数のコピーに展開され、重みマトリクスを構成する重みベクトルを含有する対応する波長符号化又はモード符号化されたＬＯと混合される。波長又は空間モード間の直交性［４１］に起因して、１対の信号とＬＯ［図４Ａ］又は［図４Ｂ］のストリームの間のコヒーレント混合は、ベクトル－ベクトル乗算を生成し、２Ｄ空間並列化は、全体的にマトリクス－ベクトル乗算を生成する。

図４Ａ及び図４Ｂを精査すると、（ａ）波長符号化及び（ｂ）モード符号化の光子マトリクスアクセラレータに基づくノード層が示されている。光子アクセラレータは、マトリクス－ベクトル乗算をノード層からの（ａ）光検出後の電子非線形活性化とｂ）可飽和吸収器を用いた光非線形活性化と共に実施するために２Ｄ（ｘ，ｚ）平面内で並列化される。電子非線形活性化と光非線形活性化の両方は、波長符号化、又はモード符号化、又は波長符号化／モード符号化を組み合わせたもののいずれかに適合する。ここで、入力データは、波長次元又はモード次元で表され、重みマトリクスは、２Ｄ（波長又はモードｚ）次元で表され、出力ポートはｘ次元にある。累算は、波長次元（ａ）又はモード次元（ｂ）それぞれでのものである。

図４Ａに示すように、波長符号化及びモード符号化光子マトリクスアクセラレータの出力は、平衡検出によって電気信号に変換することができ、電子非線形活性化に対する入力として機能する。これに代えて、出力は、図４Ｂに示すように可飽和吸収器（ＳＡ）のような光非線形活性化ユニットの中に直接に入力し、それに対するポンプとして機能することができる［プローブ波は、より長い波長又は直交偏光にある］。その結果、波長符号化及び／又はモード符号化マトリクスアクセラレータは、全光ＡＮＮ又は混成光電子ＡＮＮのいずれにも適合する。

カスケード式有向カプラ［４２］、［４３］と、光子ランタン［４４］～［４６］と、多平面光コンバータ（ＭＰＬＣ）［４７］～［４９］とを含むモード（デ）マルチプレクサを実現するためのいくつかの手法がある。

波長符号化及び／又はモード符号化マトリクスアクセラレータ、並びに光子テンソルアクセラレータ（ＰＴＡ）の主な利点は、その拡張性である。モード符号化を単独で利用することにより、本発明者のマトリクスアクセラレータは、少なくとも３００×３００までスケーリングすることができる。ＭＰＬＣモードマルチプレクサは、広い作動波長範囲を有し、従って、波長符号化である。波長符号化とモード符号化とを組み合わせることにより、ベクトルの長さが波長の個数とモードの個数との積になるように波長とモードとを１つの超次元に組み合わせることによって潜在的にマトリクス－ベクトル乗算を先例のないサイズまでスケーリングすることができる。現在の技術では、Ｃ帯域内で１０ＧＨｚのチャネル間隔を有する３００個よりも大きい波長と３００個のモードとを難なく用いて９０，０００というベクトル長さを実現することができる。これは、波長符号化及びモード符号化された信号とＬＯストリームとの干渉（乗算）を単一検出器上に累算することができることに起因する。マトリクスのサイズは、９０，０００×［２Ｄ（ｘ，ｚ）空間並列化の程度］であり、後者は、容易に１００を超えることができ、この波長符号化及びモード符号化アクセラレータの全ＭＡＣ数を２Ｄ空間並列化によって少なくとも９，０００，０００にする。

偏光符号化及び直角位相符号化の各々は、マトリクス－ベクトル乗算のスケールを２倍にすることができる。本発明者は、偏光次元とモード次元とを以下でベクトルモードと呼ぶ単一次元として互いに組み合わせる。

マトリクス－マトリクス乗算アクセラレータ
本発明は、更にｙ方向の中への３Ｄ空間並列化によって先例のないサイズのマトリクス－マトリクス乗算を可能にする。この場合に、図５に指定しているように、入力マトリクスは、（波長及び／又はモード、ｙ）次元で表され、重みマトリクスは、（波長及び／又はモード、ｚ）次元にあり、ｙ方向に繰り返され、出力マトリクスは、（ｘ，ｙ）内に含有される。

一般テンソル乗算アクセラレータ
全体的に、光子アクセラレータを構成するのに自由に使用することができる光の多くの次元（波長、ベクトルモード、直角位相、及び空間の三（３）次元）が存在する。自由空間実施では、３つの空間次元を使用することが自然であり、ＩＣ又はＰＩＣに対しては２つの空間次元が自然である。マトリクス－ベクトル（マトリクス－マトリクス）乗算のための光子アクセラレータを構成するには、いずれかの２つ（３つ）の次元を使用することができる。拡張性を高めるために、複数の次元（例えば、上述した波長－モード）を超次元に組み合わせることができる。ベクトルモードは、空間モードと偏光モードとの組合せである。同様に、バッチマトリクス乗算演算のための光子テンソルアクセラレータ（ＰＴＡ）を構成するにも各次元を独立に使用することができる。例えば、画像のバッチ（３Ｄデータキューブ）を表すために波長－モード次元を使用することができ、更にそれに重みマトリクスを１回のクロックサイクル内で全て一度に乗算し、すなわち、互いに加速することができる。これに代えて、独立／直交自由度の個数を実質的に増大するために、多数のパラメータを有する各次元を相互直交部分集合に分割することができる。例えば、波長は、２つのパラメータのみを有する偏光よりも遥かに多くのパラメータを有する。空間は、相互直交部分集合に分割するための非常に多数のパラメータを有する別の自由度である。空間は、テンソル－テンソル乗算を実施するのに取りわけ有利である。

非限定的実施例
本発明の特定の実施形態を議論したが、当業者は、本発明の範囲から逸脱することなく特定の実施形態に変更を加えることができることを理解するであろう。従って、本発明の範囲を特定の実施形態に限定すべきではなく、特許請求の範囲は、いずれかの及び全てのそのような応用、修正、及び実施形態を本発明内に網羅するように意図している。

本発明の一部の特徴は、本発明の他の特徴を用いずに本発明の一実施形態に使用することができることに注意しなければならない。従って、以上の説明は、本発明の原理、教示、実施例、及び例示的実施形態の限定ではなく、単にこれらを例示するものと考えるべきである。

同じく、これらの実施形態は、本明細書での革新的な教示の多くの有利な使用例に過ぎない。一般的に、この出願の本明細書で行う陳述は、主張する様々な発明のいずれかを必ずしも限定するわけではない。更に、一部の陳述は、一部の本発明の特徴に適用されるが、他の特徴には当て嵌まらない場合がある。

本発明の説明を例示及び説明目的で提示したが、この説明が包括的であること又は開示した形態にある本発明に限定するように意図していない。説明した実施形態の範囲及び精神から逸脱することのない多くの修正及び変更は、当業者に明らかであろう。上述の実施形態は、本発明の原理、実用的な応用を最も明快に説明し、当業者が想定する特定の使用に適するように様々な修正を加えた様々な実施形態に関して本発明を理解することを可能にするように選択して説明したものである。本明細書に用いた用語法は、これらの実施形態の原理、実用的な応用、又は市場で見られる技術に優る技術的改善を最も明快に説明するように、又は当業者が本明細書に開示する実施形態を理解することを可能にするように選択したものである。

１、２光子テンソルアクセラレータ
１、２非線形性
ｆ活性化関数
ＲｅＬＵ漏出

Claims

ベクトル乗算のための光子ユニットであって、
第１のベクトルを表す第１の光信号を受信する第１の光マルチプレクサであって、該第１のベクトル内の各要素が、第１の多重化光信号を生成するために第１の光自由度（ＤＯＦ）／次元上で符号化され、かつ１回の乗算サイクル中に非一時的である前記第１の光マルチプレクサと、
前記第１の光信号とコヒーレントであって第２のベクトルを表す第２の光信号を受信する第２の光マルチプレクサであって、該第２のベクトル内の各要素が、第２の多重化光信号を生成するために前記第１のベクトルと同一の要素から直交の光自由度（ＤＯＦ）／次元マッピングを用いて符号化される前記第２の光マルチプレクサと、
前記第１の光マルチプレクサから前記第１の多重化光信号及び前記第２の光マルチプレクサから第２の多重化光信号を受信し、それらを組み合わせて全体干渉強度での前記第１のベクトルと前記第２のベクトルの乗算結果を含有する該第１の光信号及び第２の光信号間の干渉を生成するビーム結合器と、
を含むことを特徴とする光子ユニット。
光のそれを符号化するのに使用される前記第１の自由度（ＤＯＦ）／次元は、波長、空間モード、偏光、直角位相、及び波数ベクトルの成分のうちの少なくとも１つであることを特徴とする請求項１に記載の光子ユニット。
符号化するのに使用される前記第１の光自由度（ＤＯＦ）／次元は、２又は３以上の光自由度（ＤＯＦ）／次元の組合せで構成される超次元であることを特徴とする請求項１に記載の光子ユニット。
前記空間モードは、
エルミート－ガウスモード、
ラゲール－ガウスモード、又は
空間正規直交基底を形成する離散空間サンプル、
のうちの少なくとも１つである、
ことを特徴とする請求項２に記載の光子ユニット。
干渉信号が、非線形光学要素に入ることを特徴とする請求項２に記載の光子ユニット。
前記全体干渉強度は、電気信号に変換されることを特徴とする請求項２に記載の光子ユニット。
前記電気信号は、非線形電気要素に入ることを特徴とする請求項６に記載の光子ユニット。
Ｍ×１ベクトルとのＮ×Ｍマトリクス乗算のための光子ユニットであって、
Ｍ個の要素を有する少なくともＭ×１ベクトルを表す少なくとも第１の光信号を受信する第１の光マルチプレクサであって、該Ｍ×１ベクトル内の各要素が、第１の多重化光信号を生成するために第１の直交光自由度（ＤＯＦ）／次元上で符号化され、かつ１回の乗算サイクル中に非一時的であり、Ｍが、１よりも大きいか又はそれに等しい正の整数である前記第１の光マルチプレクサと、
前記Ｍ×１ベクトルを表す少なくとも前記第１の光信号を第２の直交光自由度（ＤＯＦ）／次元でのＮ個の追加の光信号内で複数のＮ個のコピーの中に複製するための光複製器であって、Ｎが、１よりも大きいか又はそれに等しい正の整数である前記光複製器と、
前記光複製器と同一であり、各々がＭ個の追加の光信号を受信する前記第２の直交光自由度（ＤＯＦ）／次元でのＮ個の光マルチプレクサであって、該Ｍ個の追加の光信号の各々が、前記第１の光信号とコヒーレントであり、前記Ｎ個の追加の光信号の各々が、Ｍ×Ｎマトリクスの独立行を表し、該Ｍ×Ｎマトリクスの行内の各要素が、Ｎ個の追加の多重化光信号を生成するために前記Ｍ×１ベクトルを表す該第１の光信号と同一の要素から直交の光自由度（ＤＯＦ）／次元マッピングを用いて符号化される前記Ｎ個の光マルチプレクサと、
前記第１の光マルチプレクサから前記第１の多重化光信号のＮ個のコピー及び前記Ｎ個の光マルチプレクサから前記Ｎ個の追加の多重化光信号を受信し、それらを組み合わせてＮ個の全体干渉強度での前記Ｍ×Ｎマトリクスと前記Ｍ×１ベクトルの乗算結果を含有する該第１の光信号と該Ｎ個の追加の光信号の各々との間の干渉のＮ回の発生を生成する少なくとも１つのビーム結合器と、
を含むことを特徴とする光子ユニット。
符号化又は複製のために使用される前記第１及び前記第２の直交光自由度（ＤＯＦ）／次元のうちの少なくとも一方が、波長、空間モード、偏光、直角位相、及び波数ベクトルの成分のうちの少なくとも１つであることを特徴とする請求項８に記載の光子ユニット。
符号化又は複製のために使用される前記第１及び前記第２の直交光自由度（ＤＯＦ）／次元のうちの少なくとも一方が、２又は３以上の光自由度（ＤＯＦ）／次元の組合せで構成される超次元であることを特徴とする請求項８に記載の光子ユニット。
符号化又は複製のために使用される前記第１及び前記第２の直交光自由度（ＤＯＦ）／次元は、光の次元又は超次元の非重複部分集合であることを特徴とする請求項８に記載の光子ユニット。
空間モードが、
エルミート－ガウスモード、
ラゲール－ガウスモード、又は
空間正規直交基底を形成する離散空間サンプル、
のうちの少なくとも１つである、
ことを特徴とする請求項８に記載の光子ユニット。
少なくとも１つの干渉信号が、非線形光学要素に入ることを特徴とする請求項８に記載の光子ユニット。
少なくとも１つの全体干渉強度が、電気信号に変換されることを特徴とする請求項８に記載の光子ユニット。
前記電気信号は、非線形電気要素に入ることを特徴とする請求項１４に記載の光子ユニット。
Ｍ×ＷマトリクスとのＮ×Ｍマトリクス乗算のための光子ユニットであって、
Ｎ×ＭマトリクスのＭ個の要素を有する独立行を各々が表すＮ個の光信号を受信する第１の直交光自由度（ＤＯＦ）／次元でのＮ個の光マルチプレクサの第１のセットであって、該Ｎ×Ｍマトリクスの各独立行内の各要素が、Ｎ個の多重化光信号を生成するために第２の直交光自由度（ＤＯＦ）／次元上で符号化され、かつ１回の乗算サイクル中に非一時的であり、Ｍ及びＮの各々が、１よりも大きいか又はそれに等しい正の整数である前記Ｎ個の光マルチプレクサの第１のセットと、
Ｎ×Ｍマトリクスの独立行を表す前記Ｎ個の多重化光信号の各々を第３の直交光自由度（ＤＯＦ）／次元での複数のＷ個のコピーの中に複製するための第１の光複製器であって、Ｗが、１よりも大きいか又はそれに等しい正の整数である前記第１の光複製器と、
Ｗ個の追加の光信号を受信する前記第１の光複製器と同一である前記第３の直交光自由度（ＤＯＦ）／次元でのＷ個の光マルチプレクサの第２のセットであって、該Ｗ個の追加の光信号の各々が、前記Ｎ個の光信号とコヒーレントであり、該Ｗ個の追加の光信号の各々が、前記Ｍ×ＷマトリクスのＭ個の要素を有する独立列を表し、該Ｍ×Ｗマトリクスの各独立列内の各要素が、Ｗ個の追加の多重化光信号を生成するために前記Ｎ×Ｍマトリクスの各独立行内の各要素と同一の要素から直交の光自由度（ＤＯＦ）／次元マッピングを用いて符号化される前記Ｗ個の光マルチプレクサの第２のセットと、
前記Ｍ×Ｗマトリクスの独立列を表す前記Ｗ個の多重化信号の各々を前記Ｎ個の光マルチプレクサの第１のセットと同一である前記第１の直交光自由度（ＤＯＦ）／次元での複数のＮ個のコピーの中に複製するための第２の光複製器と、
前記Ｎ×Ｍマトリクス及び前記Ｍ×Ｗマトリクスのうちの各々の適切に複製された行又は列を表すＮ×Ｗ個の多重化光信号の２つのセットを受信し、それらを組み合わせてＮ×Ｗ個の全体干渉強度での乗算結果を含有する該Ｎ×Ｍマトリクスの行の各々と該Ｍ×Ｗマトリクスの該列との間の干渉のＮ×Ｗ回の発生を生成する少なくとも１つのビーム結合器と、
を含むことを特徴とする光子ユニット。
符号化又は複製のために使用される前記第１、前記第２、前記第３、及び第４の直交光自由度（ＤＯＦ）／次元のうちの少なくとも１つが、波長、空間モード、偏光、直角位相、及び波数ベクトルの成分のうちの少なくとも１つであることを特徴とする請求項１６に記載の光子ユニット。
符号化又は複製のために使用される前記第１、前記第２、及び前記第３の直交自由度（ＤＯＦ）／次元のうちの少なくとも１つが、２又は３以上の光自由度（ＤＯＦ）／次元の組合せで構成される超次元であることを特徴とする請求項１６に記載の光子ユニット。
符号化又は複製のために使用される前記第１、前記第２、及び前記第３の直交光自由度（ＤＯＦ）／次元のうちの少なくとも２つが、光の次元又は超次元の非重複部分集合であることを特徴とする請求項１６に記載の光子ユニット。
空間モードが、
エルミート－ガウスモード、
ラゲール－ガウスモード、又は
空間正規直交基底を形成する離散空間サンプル、
のうちの少なくとも１つである、
ことを特徴とする請求項１６に記載の光子ユニット。
少なくとも１つの干渉信号が、非線形光学要素に入ることを特徴とする請求項１６に記載の光子ユニット。
少なくとも１つの全体干渉強度が、電気信号に変換されることを特徴とする請求項１６に記載の光子ユニット。
前記電気信号は、非線形電気要素に入ることを特徴とする請求項２２に記載の光子ユニット。
Ｂ個のＮ×ＭマトリクスにＭ×Ｗマトリクスを乗じるバッチを加算するための光子ユニットであって、
第１のＭ×ＮマトリクスのＭ個の要素を各々が有する独立行を各々が表すＮ個の光信号を受信する第１の直交光自由度（ＤＯＦ）／次元でのＮ個の光マルチプレクサの第１のセットであって、該第１のＭ×Ｎマトリクスの各独立行内の各要素が、Ｎ個の多重化光信号を生成するために第２の直交光自由度（ＤＯＦ）／次元上で符号化され、かつ１回の乗算サイクル中に非一時的であり、Ｍ及びＮの各々が、１よりも大きいか又はそれに等しい正の整数である前記Ｎ個の光マルチプレクサの第１のセットと、
第１のＮ×Ｍマトリクスの独立行を表す前記Ｎ個の多重化光信号の各々をＮ×Ｍマトリクスの第３の直交光自由度（ＤＯＦ）／次元での複数のＷ個のコピーの中に複製するための第１の光複製器であって、Ｗが、１よりも大きいか又はそれに等しい正の整数である前記第１の光複製器と、
Ｂ個のＮ×Ｍマトリクスのうちの１つの独立行を表す前記Ｎ個の多重化光信号の第３の直交自由度（ＤＯＦ）／次元でのＷ個のコピーを各々が含有するＢ個の光信号を受信する第４の直交光自由度（ＤＯＦ）／次元での第２のマルチプレクサであって、Ｂが、１よりも大きいか又はそれに等しい正の整数である前記第２のマルチプレクサと、
Ｗ個の追加の光信号を受信する前記第１の光複製器によって使用されるものと同一である前記第３の直交光自由度（ＤＯＦ）／次元でのＷ個の光マルチプレクサの第３のセットであって、該Ｗ個の追加の光信号の各々が、前記Ｎ個の光信号とコヒーレントであり、該Ｗ個の追加の光信号の各々が、前記Ｍ×Ｗマトリクスのうちの各々のＭ個の要素を有する独立列を表し、該Ｍ×Ｗマトリクスの各独立列内の各要素が、Ｗ個の追加の多重化光信号を生成するために前記Ｎ×Ｍマトリクスのうちの各々の各独立行内の各要素と同一の要素から直交の光自由度（ＤＯＦ）／次元マッピングを用いて符号化される前記Ｗ個の光マルチプレクサの第３のセットと、
前記Ｍ×Ｗマトリクスの独立列を表す前記Ｗ個の多重化光信号の各々を前記Ｎ個の光マルチプレクサの第１のセットと同一である前記第１の直交光自由度（ＤＯＦ）／次元での複数のＮ個のコピーの中に複製するための第２の光複製器と、
前記Ｍ×Ｗマトリクスのうちの各々の独立列を表す前記Ｗ個の多重化信号の前記第１の直交自由度（ＤＯＦ）／次元でのＮ個のコピーを各々が含有するＢ個の同一光信号を生成する前記第４の直交光自由度（ＤＯＦ）／次元での第３の光複製器と、
前記第２のマルチプレクサ及び前記第３の光複製器からＢ×Ｎ×Ｗ個の多重化光信号の２つのセットを受信し、それらを組み合わせてＮ×Ｗ個の全体干渉強度でのＢ個の個別のＮ×Ｍマトリクスに同じＭ×Ｗマトリクスを乗じた乗算の総和を含有する干渉のＮ×Ｗ回の発生を生成する少なくとも１つのビーム結合器であって、前記第１の直交光自由度（ＤＯＦ）／次元、前記第２の直交光自由度（ＤＯＦ）／次元、前記第３の直交光自由度（ＤＯＦ）／次元、及び前記第４の直交光自由度（ＤＯＦ）／次元が異なる前記少なくとも１つのビーム結合器と、
を含むことを特徴とする光子ユニット。
符号化又は複製のために使用される前記第１、前記第２、前記第３、及び前記第４の直交光自由度（ＤＯＦ）／次元のうちの少なくとも１つが、波長、空間モード、偏光、直角位相、及び波数ベクトルの成分のうちの少なくとも１つであることを特徴とする請求項２４に記載の光子ユニット。
符号化又は複製のために使用される前記第１、前記第２、前記第３、及び前記第４の直交光自由度（ＤＯＦ）／次元のうちの少なくとも１つが、２又は３以上の光ＤＯＦ／次元の組合せで構成される超次元であることを特徴とする請求項２４に記載の光子ユニット。
符号化又は複製のために使用される前記第１、前記第２、前記第３、及び前記第４の直交光自由度（ＤＯＦ）／次元のうちの少なくとも２つが、光の次元又は超次元の非重複部分集合であることを特徴とする請求項２４に記載の光子ユニット。
空間モードが、
エルミート－ガウスモード、
ラゲール－ガウスモード、又は
空間正規直交基底を形成する離散空間サンプル、
のうちの少なくとも１つである、
ことを特徴とする請求項２４に記載の光子ユニット。
少なくとも１つの干渉信号が、非線形光学要素に入ることを特徴とする請求項２４に記載の光子ユニット。
少なくとも１つの全体干渉強度が、電気信号に変換されることを特徴とする請求項２４に記載の光子ユニット。
前記電気信号は、非線形電気要素に入ることを特徴とする請求項３０に記載の光子ユニット。
各々が２よりも高い階数を有する２つのテンソルの乗算のための光子ユニットであって、
階数ｐを有する第１のテンソルを表す第１の光信号を受信する第１の光マルチプレクサであって、該第１のテンソルの形状が、［Ｎ_１，Ｎ_２，．．．，Ｎ_ｐ－１，Ｍ］である前記第１の光マルチプレクサと、
前記第１のテンソルの各要素を１番目の階数からｐ番目の階数までに沿ってそれぞれ１番目からｐ番目までの直交自由度（ＤＯＦ）／次元に対して符号化するための第１の符号器と、
階数ｑを有する第２のテンソルを表し、前記第１の光信号とコヒーレントである第２の光信号を受信する第２の光マルチプレクサであって、該第２のテンソルの形状が、［Ｍ，Ｗ_１，．．．，Ｗ_ｑ－１］．Ｎ_１，Ｎ_２，．．．，Ｎ_ｐ－１，Ｍ，Ｗ_１，．．．，Ｗ_ｑ－１であり、ｐ及びｑの各々が、１よりも大きいか又はそれに等しい正の整数である前記第２の光マルチプレクサと、
前記テンソルを表す多重化光信号を（ｐ＋１）番目から（ｐ＋ｑ）番目までの直交光自由度（ＤＯＦ）／次元での複数のＷ_１×Ｗ_２×．．．×Ｗ_ｑ－１個のコピーの中に複製するための光複製器の第１のセットと、
前記第２のテンソルの各要素を前記第１のテンソルの（ｐ＋１）番目から（ｐ＋ｑ）番目までの直交自由度（ＤＯＦ）／次元の複製物と同一の要素から直交の光自由度（ＤＯＦ）／次元マッピングを用いて１番目の階数からｑ番目の階数までに沿ってそれぞれ（ｐ）番目から（ｐ＋ｑ－１）番目までの直交自由度（ＤＯＦ）／次元の上に符号化するための第２の符号器と、
前記第２のテンソルを表す前記多重化信号を前記第１のテンソルの１番目から（ｐ－１）番目までの直交自由度（ＤＯＦ）／次元のように前記要素から直交の光自由度（ＤＯＦ）／次元マッピングと同一である１番目から（ｐ－１）番目までの直交光自由度（ＤＯＦ）／次元での複数のＮ１×Ｎ２×．．．×Ｎｐ－１個のコピーの中に複製するための光複製器の第２のセットと、
光複製器の前記２つのセットから［Ｎ１，Ｎ２，．．．，Ｎｐ－１，Ｍ，Ｗ１，．．．，Ｗｑ－１］個の多重化光信号の２つのセットを受信し、それらを組み合わせて干渉強度でのＮ１×Ｎ２×．．．×Ｎｐ－１×Ｗ１×．．．×Ｗｑ－１個の個別のＭ－要素ベクトル－ベクトル乗算の乗算の総和を含有する干渉の［Ｎ１，Ｎ２，．．．，Ｎｐ－１，Ｗ１，．．．，Ｗｑ－１］回の発生を生成する少なくとも１つのビーム結合器と、
を含むことを特徴とする光子ユニット。