JP2002342738A

JP2002342738A - 畳み込みネットワーク挙動のシミュレーション方法

Info

Publication number: JP2002342738A
Application number: JP2002069912A
Authority: JP
Inventors: Julian Eggert; ジュリアン・エゲルト; B Baeuml; ビー・バウム
Original assignee: Honda R&D Europe Deutschland GmbH
Current assignee: Honda R&D Europe Deutschland GmbH
Priority date: 2001-03-15
Filing date: 2002-03-14
Publication date: 2002-11-29
Anticipated expiration: 2022-03-14
Also published as: DE60140654D1; US7236961B2; EP1241619B1; JP4132892B2; US20030028359A1; EP1241619A1

Abstract

(57)【要約】【課題】畳み込みネットワークのシミュレーションの
コストを削減し、直観的な視覚化可能性を含めたネット
ワークの活性度を理解するための手段を提供する。【解決手段】畳み込みネットワークは、それぞれニュ
ーロンの二次元格子から構成される一組の層によって定
義される。ネットワークの最後の層以外の各層は、それ
ぞれ後続のターゲット層についてソース層を表す。部分
ソース領域と呼ばれるソース層の複数のニューロンは、
同一の結合重み行列（畳み込みネットワークの重み共有
技法）を共有する。結合重み行列は、符号化フィルタと
復号化フィルタのスカラー積によって表すことができ、
これによって、ソース層（ソース層の活性度）からそれ
ぞれのソース層への駆動信号の通信を、符号化フィルタ
ステップと復号化フィルタステップに分解することがで
きる。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は畳み込みネットワー
ク（convolutional network）挙動のシミュレーション
方法に関し、ネットワークの内部状態の視覚化に関し、
また、パターン認識等の方法を実施するコンピュータ・
ソフトウェア・プログラムに関する。

【０００２】

【従来の技術】生物学上現実的なコネクショニスト・ネ
ットワークを取扱うときは、通常、複数の問題に遭遇す
る。第１に、結合が統計学的に学習されない場合、結合
を高次元ニューロン特徴空間における２つの点を結ぶも
のとして、機能的に定義しなければならないが、これは
ほとんど不可能な作業である。第２に、高次元であるた
めに、シミュレーションの間に、ネットワークの内部状
態を解釈して視覚化することは困難である。さらに、こ
のようなネットワークの（メモリ及び性能の）シミュレ
ーションは、主に結合の数によって決定される。

【０００３】本発明は、畳み込みネットワーク、すなわ
ち、部分領域（sub-area）を有する層を持つネットワー
クを特に対象とする。このようなネットワークでは、ネ
ットワークの層の部分領域のニューロンは、共通の結合
重み行列を共有する。畳み込みネットワークが遭遇する
主な問題は、共有結合を使用しているダイナミクスの大
規模な計算、結合パターンの非直観的な設計、及びその
結果の処理の困難さである。局所的なダイナミック正規
化手順は、計算のオーバーヘッドをさらに増加させる。
最後に、ネットワーク状態（すなわち、その活性度）の
視覚化は、多次元空間で発生する。

【０００４】

【発明が解決しようとする課題】畳み込みネットワーク
が遭遇する上述の問題に鑑みて、本発明は、シミュレー
ションのコストを削減し、直観的な視覚化可能性を含め
たネットワークの活性度を理解するためのより良い手段
を提供することを目的とする。

【０００５】

【課題を解決するための手段】本発明の第１の態様によ
ると、畳み込みネットワーク挙動のシミュレーション方
法が提案される。畳み込みネットワークは、それぞれニ
ューロンの二次元格子から構成される一組の層によって
定義される。ネットワークの最後の層以外の各層は、そ
れぞれ後続のターゲット層（target layer）のためのソ
ース層（sourcelayer）を表す。部分ソース領域と呼ば
れるソース層の複数のニューロンは、同一の結合重み行
列（畳み込みネットワークの重み共有技法）を共有す
る。結合重み行列は、符号化フィルタと復号化フィルタ
とのスカラー積によって表すことができ、これによっ
て、ソース層（ソース層の活性度）からそれぞれのター
ゲット層への駆動信号の通信を、符号化フィルタステッ
プと復号化フィルタステップに分解することができる。

【０００６】符号化フィルタステップは、符号化フィル
タとソース層の活性度に基づいて、再構成ソースイメー
ジ（source reconstruction image）を算出するステッ
プを含むことができる。復号化フィルタステップは、再
構成ソースイメージと復号化フィルタの畳込み演算によ
ってターゲット層への入力を算出するステップを含むこ
とができる再構成ソースイメージは、各部分ソース領域と対応する
符号化フィルタのスカラー積を求め、全ての部分ソース
領域のスカラー積の結果を結合することによって算出す
ることができる。

【０００７】符号化フィルタ及び／又は復号化フィルタ
は、予め設定することも、あるいは学習過程によって生
成することもできる。

【０００８】有利なことに、符号化フィルタステップ及
び／又は復号化フィルタステップは、高速フーリエ変換
（ＦＦＴ）によって実行することができる。

【０００９】符号化フィルタ及び復号化フィルタは、そ
れぞれ、対応する結合重み行列が並進不変性を示す軸に
沿って、伸張することができる。

【００１０】本発明のさらなる態様は、上述の方法を用
いてネットワークの内部状態を視覚化する方法に関す
る。ネットワークの内部状態は、ソース層と後続するタ
ーゲット層間の各結合についての再構成ソースイメージ
によって視覚化される。各再構成イメージは、符号化フ
ィルタ及び対応するソース層の活性度に基づいて算出さ
れる。

【００１１】各再構成ソースイメージは、ソース層の各
部分ソース領域と対応する符号化フィルタとのスカラー
積をとった後に、全ての部分領域について、得られたス
カラー積を結合することによって、算出される。

【００１２】本発明のさらなる態様によると、畳み込み
ネットワーク挙動のシミュレーションのための別の方法
が提案される。畳み込みネットワークは、一組の層によ
って定義される。各層は、ニューロンの二次元格子から
構成される。最後の層を除いた各層は、それぞれに後続
するターゲット層のついてのソース層を表す。部分ソー
ス領域と呼ばれるソース層の複数のニューロンは、それ
ぞれ同一の結合重み行列を共有する。本発明によれば、
各結合重み行列は、符号化フィルタと復号化フィルタの
とスカラー積によって表される。各ソース層について、
対応する符号化フィルタと対応する部分ソース領域の活
性度に基づいて、再構成ソースイメージが算出される。
各結合重み行列、各部分ターゲット領域、及び各ターゲ
ット層について、ターゲット層の入力は、先行するソー
ス層の再構成ソースイメージと復号化フィルタの畳み込
みとして算出される。最後に、各ターゲット層につい
て、ターゲット層のニューロンの応答関数及びターゲッ
ト層の計算された入力を使用して、ターゲット層の活性
度が算出される。

【００１３】各再構成ソースイメージは、ソース層の各
部分ソース領域と対応する符号化フィルタとのスカラー
積をとった後に、全ての部分領域について、得られたス
カラー積を結合することによって、算出される。

【００１４】本発明のさらに別の態様によると、データ
処理デバイス上で実行されるときに上記方法を実現する
コンピュータ・ソフトウェア・プログラムが提案され
る。

【００１５】最後に、パターン認識方法の使用（ロボッ
ト等）が提案される。

【００１６】

【発明の実施の形態】本発明の第１の理論上の背景を、
図１〜図３を参照して説明する。

【００１７】複数の層１，２，３から構成される大抵の
ニューラルネットワーク１２で共通であるのは、ニュー
ロン４の活性度Ａ_i(ｔ)の評価のある部分において、す
べてのソース（source）ニューロンｊからターゲット
（target）ニューロンｉ（図１参照）へ到来する信号の
寄与度Ａ_j(ｔ)は、重み行列Ｊ_i;jを使用して線形に加算
され、単一のスカラーｈ_i(ｔ)になる。

【００１８】

【数１】

【００１９】ニューロンのインデックスｉ、ｊは、全て
のニューロンを一意に番号付ける。例えば、空間の局所
部分を用いて入力空間（以下、「特徴空間」とも呼ぶ）
を離散的にサンプリングするとき、インデックスは、ニ
ューロンがどの部分に反応しているかを一意に指示する
ことができる。同様に、高次元特徴空間において、ｉ及
びｊは、単一のインデックスではなく、それぞれがいく
つかのサブインデックスで構成されていると考えること
ができる。

【００２０】ニューロンのインデックスは、ソースタイ
プインデックスｋとターゲットタイプインデックスｌ、
及び、タイプ従属のニューロンインデックスｉ、ｊに分
けることができる。つまり、所定のタイプmのすべての
ニューロンの集合をＴ_mで表すとすると、ｉ∈Ｔ_k、ｊ∈
Ｔ_lとなる。対応するソースニューロンタイプ及びター
ゲットニューロンタイプの組ｋ、ｌによって結合タイプ
が一意に決定され、従って式(１)の合計を同一タイプの
結合グループに分割することができる。

【００２１】

【数２】

【００２２】

【数３】

【００２３】

【００２４】

【数４】

【００２５】事実、「畳み込みネットワーク（図１の１
２）」又は「重み共有ネットワーク」と呼ぶことができ
る多数のニューラルネットワークは、この特定の特性を
利用する。重みを共有することによって、独立のパラメ
ータの数が削減され、またこのようなネットワークが扱
い易くなる。さらに、別個のニューロンｉ、ｊ（但し、
タイプｋ、ｌは固定）に対して同一の重み行列を繰り返
し用いることは、固定されたタイプのすべてのニューロ
ン（すべて同一の重み行列を有する）について学習が事
実上同時に起こることを意味する。

【００２６】

【００２７】

【００２８】大量のフィルタに対しての本発明による解
決策は、フィルタを分解することである。式(２)から開
始する。

【００２９】

【数５】

【００３０】

【００３１】一般の結合カーネルは、前述のように並進
不変であり、また、インデックスを比較可能とするため
に、換算関数ｉ→ｊ、ｊ＝Ｌ(ｉ)が２つのインデックス
ｉ、ｊの間の「インタフェース」として動作すると仮定
する。これは、並進不変性の条件に、異なるサイズのｎ
_i、及びｎ_i＝Ｌ(ｎ_j)の、ｉ及びｊステップの増加を含
めることができることを意味する。従って以下の関係が
成り立つ。

【００３２】

【数６】

【００３３】もちろん、Ｌには目的に合った関数が選ば
れるべきであり、例えば、インデックスｉ、ｊの自然数
を使用する場合、Ｌは同じく自然数を返すべきである。

【００３４】

【００３５】

【数７】

【００３６】インデックスｉ及びｊに対して必要な並進
不変性を達成するために、線形関数ｊ→ｘ、ｘ＝Ｍ(ｊ)
が存在すると仮定すると、以下の式が成り立つ。

【００３７】

【数８】

【００３８】従って、以下の式が成り立つ。

【００３９】

【数９】

【００４０】これは、結合カーネルが、共通の空間ｘに
おけるニューロン依存の位置ｘ_i:＝Ｍ[Ｌ(ｉ)] 及び
ｘ_j:＝Ｍ(ｊ)を中心とする２つのフィルタのスカラー積
によって与えられる（生成される）ことを意味する。

【００４１】並進不変性は、以下のようにして検査する
ことができる。

【００４２】

【数１０】

【００４３】

【００４４】この考え方の利点は以下に挙げるように明
白である。

【００４５】・ｎ”×ｎ’個のフィルタの代わりにｎ”
＋ｎ’個のフィルタを記憶し処理すれば良いので、畳み
込みネットワークの組み合わせ問題を回避できる。

【００４６】・ある結合のタイプによって渡されるソー
スデータを、再構成イメージＲ(ｘ;ｔ)を用いて視覚化
し変換できる。

【００４７】・フィルタと再構成イメージが同一空間で
作用するので、フィルタを分析し、かつフィルタがソー
スデータにどのように作用するのかを理解することがで
きる。

【００４８】本発明の考え方は、ソースニューロンの全
体グループ（同一タイプ）からターゲットニューロンの
全体グループ（同一タイプ）に渡されるメッセージを、
それらの間の再構成イメージ（視覚化のために使用でき
る）とともに、符号化/複合化のプロセスとして理解す
ることができることを意味している。このことを、図３
を参照して説明する。

【００４９】

【００５０】

【００５１】・ターゲット層８のニューロンｉ（図２の
４）の全シナプス入力場（他の結合からの多くの寄与度
を含むことができる）が算出（図２の５）された後、局
所ニューロンダイナミクスの非線形処理ステップ（図２
の６）を適用する。

【００５２】・ネットワーク内で識別可能なあらゆる可
能性のある結合タイプについて、上記３つのステップを
繰り返す。

【００５３】シナプス場の算出は畳み込みを利用するだ
けなので、フーリエ畳み込み定理を使用して計算を簡単
にすることができる。特に、ＦＦＴ手法を使用すること
ができる。並進不変の結合構造の場合とは逆に、フーリ
エ技法は提案された技法について意味を持つが、それ
は、ｋ及びｌのあらゆる組み合わせについて畳み込みカ
ーネルがあるからでなく、すべてのｋ及びすべてのｌに
ついてのみ記憶する必要があるからである。これは、領
域間のシナプス場の算出について、ｎ”×ｎ’個のフィ
ルタを使用する代わりに、ｎ”＋ｎ’個のみが必要であ
ることを意味する。

【００５４】標準的な畳み込みネットワークで生じるそ
の他の計算は、以下に示すように、Ｘ空間における畳み
込み及び成分の線形結合を用いて記述することができ
る。再構成イメージは、式8を使用して以下のように記
述することができる。

【００５５】

【数１１】但し、ソースニューロンｌの各タイプについて、部分再
構成ソースイメージは以下の通りである。

【００５６】

【数１２】また、部分活性度イメージは以下の通りである。

【００５７】

【数１３】

【００５８】

【００５９】

【数１４】そして、ターゲットユニット位置ｘ_iでの畳み込みを評
価する。

【００６０】

【数１５】

【００６１】本発明の実施例について、図４を参照して
説明する。

【００６２】ステップＳ１で処理を開始した後、ステッ
プＳ２でネットワーク結合構造が定義される。この定義
ステップＳ２とともに、結合を分解する符号化/復号化
フィルタを見つけなくてはならない。このステップＳ３
の後、シミュレーション・ループＳ４が開始する。各結
合タイプ及び各ソース領域/部分領域について、初め
に、符号化フィルタとソース層の活性度を使用して、再
構成ソースイメージが算出される。従って、このステッ
プＳ５において、処理領域（部分領域）のソース層の活
性度とともに符号化フィルタが使用され、再構成ソース
イメージが得られる。このイメージはターゲット領域へ
渡されるが、通信帯域幅の要求は低い。ステップＳ６
で、ターゲット層の入力は、単に復号化フィルタを再構
成ソースイメージに適用することによって算出される。
これらの２つのステップＳ５及びＳ６は、互いに独立に
実行することができるので、容易に並列化することがで
きる。加えて、計算は行列要素演算と離散フーリエ変換
を含むだけなので、システムのハードウェア実現が容易
である。ネットワークのダイナミクスがＣＡＤ実行であ
るべき時間の間、シミュレーション・ループが繰り返さ
れる。ステップＳ７のこの時間の間に、処理がまだ完了
しないことが決定され、従って、手続きはステップＳ８
でシミュレーション開始ステップＳ４に戻る。そうでな
い場合は、ステップＳ９で処理が停止される。

【００６３】再構成ソースイメージは、ソース領域から
ターゲットが受け取る情報を最も圧縮した形態で含んで
いる。従って、符号化フィルタ及び復号化フィルタが直
観的な空間（例えば、視覚処理のための二次元空間）で
選択されると、再構成ソースイメージをステップＳ１０
で使用して、ネットワークに沿った通信を視覚化するこ
とができる。

【００６４】

【００６５】

【００６６】本発明を要約すると、畳み込みネットワー
クの２つの層間の結合を記述する重み行列は、付加空間
で伸張する２つのフィルタのスカラー積として記述され
る。付加空間は、通常重み行列がその並進不変性を示す
空間となるように選択される。駆動入力に対する分解及
び線形性の仮定から、１つの層（ソース層）から、次の
層（ターゲット層）まで駆動信号を通信するプロセスを
符号化ステップと復号化ステップに分解することができ
るという結果になる。

【００６７】本発明の典型的な応用形態は、パターン認
識（例えば、音響又は視覚）であり、例えばロボットに
使用できる。

【００６８】本発明の利点は、以下のように要約するこ
とができる。

【００６９】・ネットワーク・ダイナミクス全体の計算
を通してのフーリエ変換の使用により、シミュレーショ
ン計算について最適化された環境及びハードウェアの使
用が可能になる。

【００７０】・ネットワークの異なる層間の通信オーバ
ーヘッドの削減により、ネットワーク・ダイナミクス演
算の並列化が可能になる。

【００７１】・高次層間の結合を、共通の作業空間（視
覚処理について、通常は二次元網膜座標ｘ、ｙ）上の符
号化フィルタ及び復号化フィルタとして直感的に設計す
ることができる。

【図面の簡単な説明】

【図１】並進不変の畳み込みネットワークを図式的に示
す図である。

【図２】ネットワーク挙動を計算するときの非線形ステ
ップと線形ステップの区切りを示す図である。

【図３】符号化フィルタ、再構成ソースイメージ及び復
号化フィルタによりソース層とターゲット層の間の結合
の分解を説明する図である。

【図４】本発明によって提案された処理を表すフローチ
ャートである。

【図５】ネットワークの活性度に基づいた、再構成イメ
ージの計算（符号化ステップ）を示す図である。

【図６】再構成イメージに基づいた、ネットワークの活
性度の計算（復号化ステップ）を示す図である。

【符号の説明】

１、２、３層４ニューロン７ソース層８ターゲット層９再構成ソースイメージ１０符号化フィルタ１１復号化フィルタ１２畳み込みネットワーク

───────────────────────────────────────────────────── フロントページの続き (71)出願人 501442529 Ｃａｒｌ−ＬｅｇｉｅｎＳｔｒａｓｓｅ 30 63073 Ｏｆｆｅｎｂａｃｈ／Ｍａｉｎ，Ｇｅｒｍａｎｙ (72)発明者ジュリアン・エゲルトドイツ連邦共和国 63073 オッフェンバッハアムマイン市カール・レギエン・シュトラーセ 30 ホンダアールアンドデーヨーロッパ（ドイッチェラント）ゲーエムベーハーフューチャー・テクノロジー・リサーチ内 (72)発明者ビー・バウムドイツ連邦共和国 82230 ヴェッセリングドイッチェスツェントルムフューアルフトウントラウムファートディエルアール内Ｆターム(参考） 5B056 BB13 BB26 BB31

Claims

【特許請求の範囲】

【請求項１】各層がニューロン(４)の二次元格子によ
って構成され、最後の層(３)を除いた各層(１,２,３)がそれぞれ後続の
ターゲット層(８)についてソース層(７)を表し、部分ソース領域と呼ばれるソース層(７)の複数のニュー
ロン(４)が同一の結合重み行列を共有する、一組の層
(１,２,３)で定義された畳み込みネットワーク(１２)の
挙動のシミュレーション方法であって、各結合重み行列を符号化フィルタ(１０)と復号化フィル
タ(１１)とのスカラー積で表して、ソース層(７)からそ
れぞれのターゲット層(８)への駆動信号の通信を符号化
フィルタステップと復号化フィルタステップに分解する
ことを特徴とする、シミュレーション方法。
【請求項２】前記符号化フィルタステップは、符号化
フィルタ(１０)及びソース層(７)の活性度に基づいて再
構成ソースイメージを計算するステップを含み、前記復号化フィルタステップは、前記再構成ソースイメ
ージ(９)と前記復号化フィルタ(１１)の畳み込みで、前
記ターゲット層(８)の入力を計算するステップを含むこ
とを特徴とする、請求項１に記載のシミュレーション方
法。
【請求項３】各部分ソース領域と対応する符号化フィ
ルタ(１０)のスカラー積を求め、全ての部分ソース領域
のスカラー積の結果を結合することによって前記再構成
ソースイメージを計算することを特徴とする、請求項２
に記載のシミュレーション方法。
【請求項４】前記符号化フィルタ(１０)と前記復号化
フィルタ(１１)が予め設定されているか又は学習過程に
よって生成されることを特徴とする、請求項２又は３に
記載のシミュレーション方法。
【請求項５】前記符号化フィルタステップ及び前記復
号化フィルタステップがそれぞれ高速フーリエ変換を用
いて実行されることを特徴とする、請求項１乃至４のい
ずれか１項に記載のシミュレーション方法。
【請求項６】前記符号化フィルタ(１０)及び前記復号
化フィルタ(１１)は、それぞれ対応する結合重み行列が
並進不変性を示す軸に沿って伸びることを特徴とする、
請求項５に記載のシミュレーション方法。
【請求項７】請求項１乃至６のいずれか１項に記載の
方法を使用してネットワークの内部状態を視覚化する方
法であって、ネットワーク(１２)の内部状態が、ソース層と後続する
ターゲット層の間の各結合に対する１つの再構成ソース
イメージ(９)によって視覚化され、該再構成イメージ
(９)は前記符号化フィルタ(１０)と対応するソース層
(７)の活性度に基づいてそれぞれ計算されることを特徴
とする、視覚化方法。
【請求項８】前記ソース層(７)の各部分ソース領域と
対応する符号化フィルタ(１０)のスカラー積を求めるス
テップと、全ての部分ソース領域のスカラー積の結果を結合するス
テップと、によって各再構成ソースイメージ(９)が計算
されることを特徴とする、請求項７に記載の方法。
【請求項９】各層がニューロン(４)の二次元格子によ
って構成され、最後の層(３)を除いた各層(１,２,３)がそれぞれ後続の
ターゲット層(８)についてソース層(７)を表し、部分ソース領域と呼ばれるソース層(７)の複数のニュー
ロン(４)が同一の結合重み行列を共有する、一組の層
(１,２,３)で定義された畳み込みネットワーク(１２)の
挙動のシミュレーション方法であって、符号化フィルタ(１０)と復号化フィルタ(１１)のスカラ
ー積によって各結合重み行列を表すステップ(Ｓ３)と、各ソース層(７)について、対応する符号化フィルタ(１
０)と対応する部分ソース領域の活性度に基づいて、再
構成ソースイメージ(９)を計算するステップ(Ｓ５)と、各結合重み行列、各部分ターゲット領域、及び各ターゲ
ット層について、前記再構成ソースイメージ(９)と前記
復号化フィルタの畳み込みで前記ターゲット層(８)の入
力を計算するステップ(Ｓ６)と、各ターゲット層(８)について、前記ターゲット層(８)の
ニューロン(４)の応答関数と前記ターゲット層(８)の計
算された入力を使用して、前記ソース層(７)の活性度に
応答して前記ターゲット層(８)の活性度を計算するステ
ップと、を含むことを特徴とする、シミュレーション方法。
【請求項１０】対応するソース層(７)の各部分ソース領
域と対応する符号化フィルタ(１０)のスカラー積を求め
るステップと、全ての部分ソース領域のスカラー積の結果を結合するス
テップによって各再構成ソースイメージ(９)が計算され
ることを特徴とする、請求項９に記載のシミュレーショ
ン方法。
【請求項１１】データ処理デバイスで実現されるとき
に、請求項１乃至１０の何れか１項に記載の方法を実現
することを特徴とする、コンピュータソフトウェアプロ
グラム。
【請求項１２】パターン認識のために請求項８に記載の
方法を使用する方法。