JP7122041B2

JP7122041B2 - ニューラルネットワークに用いられる混合粒度に基づく共同スパース方法

Info

Publication number: JP7122041B2
Application number: JP2021174307A
Authority: JP
Inventors: 成卓; 楚亮郭; 勳▲ヂャオ▼ 尹
Original assignee: Zhejiang University ZJU
Current assignee: Zhejiang University ZJU
Priority date: 2020-12-24
Filing date: 2021-10-26
Publication date: 2022-08-19
Anticipated expiration: 2041-10-26
Also published as: JP2022101461A; CN112288046A; CN112288046B; US20220207374A1

Description

本発明は、構造化スパース、軽量化ネットワーク構造、畳み込みニューラルネットワークなどの工学技術分野に関し、特にニューラルネットワークに用いられる混合粒度に基づく共同スパース方法に関する。

近年、深層学習、特に畳み込みニューラルネットワーク（ＣＮＮ）は、コンピュータ視覚、音声識別と言語処理分野の高精度で大きな成功を収めている。データ量は増大する一方であるので、汎用的な特徴抽出能力を備えるように、ディープニューラルネットワークの規模が大きくなっている。一方、ディープニューラルネットワークのハイパーパラメータ化に伴い、通常、大型モデルはトレーニングと推論プロセスにおいて大量の計算と記憶リソースを必要とする。これらの課題に直面して、最小化計算コスト削減と加速ニューラルネットワーク技術、例えば、テンソル分解、データ量化とネットワークスパース化がますます注目されている。

スパース化では、異なるトリミングデータオブジェクトに対して、そのスパースパターンは、細粒度と粗粒度のスパースパターンに分けてもよく、重要でない要素又はリンクを消却することを目的としている。細粒度のスパースパターンは、さらにより高いモデル精度を保留する可能性がある。しかしながら、計算複雑性によって、実際に、ニューラルネットワークにおける重み要素の重要性を直接評価することは困難である。そのため、細粒度の重みトリミング手法は、通常、振幅基準に基づいているが、それは重み構造のランダム再構築を招くことが多く、汎用加速器（例えば、ＧＰＵ）のこれに対するサポートが悪い。換言すれば、プルーニング後の重み構造のランダム性、不規則性により、細粒度スパースパターンはメモリ占用空間しか節約できず、ＧＰＵ上の推論をほとんど加速させることができない。

細粒度のスパースパターンとは異なり、粗粒度のスパースパターンは、ハードウェア実現効率の向上に役立つことに有益な代替案であると考えられ、粗粒度スパースパターンは、単一要素ではなく一つ特定の領域を単位としてプルーニングを行うことが多い。それは、ニューラルネットワーク語義（例えば、カーネル、フィルタとチャンネル）をＣＮＮに統合し、トリミング後にコンパクトなサブ構造を保留することができる。最近、構造スパーストレーニングがＧＰＵ加速に有用であることが観察された。しかし、関連研究は、一般的に、正規化制約項に関し、例えば、高価な除法と平方根で、Ｌ１とＬ２ノルムを演算する必要がある。このような方法は、さらに、最終的に達成されるスパース性レベルが制御できないように、各層において異なるスパース性比率を自動生成する。

十分なスパース性レベルを優先的に保証するために、研究者は、ユーザが指定又は計算した目標スパース性閾値に依存し、ネットワークを繰り返し方式でプルーニングする別の構造化スパースパターンを提案した。例えば、ブロックスパースパターンとバランススパースパターンが挙げられる。しかし、許容可能なモデル精度を持つブロックスパースパターンは、通常、スパース性が比較的低い重み構造のみを生成することができる。

そのため、高いモデル精度と速いハードウェア実行速度を同時に得るために、常に構造均一性とスパース性との間にバランスを得ることが望ましい。直感的な観察は、よりバランスの動作負荷とより細粒度のスパースパターンを採用することである。そのため、本発明は、畳み込みニューラルネットワークにおける高効率的なＧＰＵ推論を実現する鍵となる混合粒度に基づく共同スパース方法を提案する。

本発明は、現在の構造化スパース方法における上記欠点に対して、ニューラルネットワーク畳み込み層と完全連結層に用いられ、スパース粒度可変、汎用ハードウェア推論加速、モデル推論精度が高いという利点がある混合粒度に基づく共同スパース方法を提供することを目的とする。

本発明の目的は、以下の技術的解決手段によって達成される。ニューラルネットワークに用いられる混合粒度に基づく共同スパース方法であって、この方法は、画像識別に用いられ、まず、複数の画像データを収集して人為的にラベルを付与し、画像データセットを生成し、画像データセットをトレーニングセットとして畳み込みニューラルネットワークに入力し、畳み込みニューラルネットワーク各層の重み行列をランダムに初期化し、繰り返しの方式でトレーニングし、共同スパースプロセスを採用して、畳み込みニューラルネットワークをプルーニングし、
前記共同スパースプロセスは、具体的には、ユーザが目標スパース性（ｔａｒｇｅｔｓｐａｒｓｉｔｙ）と粒度混合比率（ｍｉｘｉｎｇｒａｔｉｏ）を予め設定することにより、異なるプルーニング粒度のプルーニングマスクを得ることができる。独立したベクトルレベル細粒度スパース化（ｖｅｃｔｏｒ－ｗｉｓｅｆｉｎｅ－ｇｒａｉｎｅｄｓｐａｒｓｉｔｙ）とブロックレベル粗粒度スパース化（ｂｌｏｃｋ－ｗｉｓｅｃｏａｒｓｅ－ｇｒａｉｎｅｄｓｐａｒｓｉｔｙ）とを含み、ベクトルレベル細粒度スパース化とブロックレベル粗粒度スパース化の夫々のスパース性は、ユーザが予め設定した目標スパース性と粒度混合比率に基づいて、スパース性補償方法によって推定し、
前記ベクトルレベル細粒度スパース化は、行数が＃ｒｏｗであり、列数が＃ｃｏｌである重み行列を、補間後の最小行列列数がちょうどＫにより割り切れるように該重み行列の右端にゼロ列を充填し、行数が１であり、列数がＫである複数のベクトル行に分割され、且つベクトル行毎に対して、ベクトル行内要素を大きさに基づくプルーニングを行い、プルーニングマスク１上で対応する要素の位置の１を０にセットし、プルーニングマスク１上の０の個数がベクトルレベル細粒度スパース化のスパース性要求を満たすようにし、
前記ブロックレベル粗粒度スパース化は、行数が＃ｒｏｗであり、列数が＃ｃｏｌである重み行列を、補間後の最小行列がちょうどＲ行、Ｓ列サイズのブロックにより割り切れるように該重み行列の下端及び／又は右端にゼロ行及び／又はゼロ列を充填し、行数がＲであり、列数がＳである複数のベクトルブロックに分割され、充填されたゼロ行又はゼロ列を含まない各ベクトルブロックの重要性スコア和（ｐｓｕｍ）を計算し、重要性スコア和の計算に用いた全てのベクトルブロックに対し、重要性スコア和の大きさに応じてプルーニングを行い、プルーニングマスク２上の重要性スコア和の計算に用いたベクトルブロックの対応する要素の位置の１を０にセットし、プルーニングマスク２上の０の個数がブロックレベル粗粒度スパース化のスパース性要求を満たすようにし、
ベクトルレベル細粒度スパース化して得られたプルーニングマスク１とブロックレベル粗粒度スパース化して得られたプルーニングマスク２とをビット論理積演算し、最終的なプルーニングマスク３を得、最終的なプルーニングマスク３と行数が＃ｒｏｗであり、列数が＃ｃｏｌである行列とをビット論理積演算し、スパース化された重み行列を得、
畳み込みニューラルネットワーク各層の重み行列をスパース化して、トレーニングを完了させた後、識別対象画像を畳み込みニューラルネットワークに入力し、画像識別を行う。

さらに、前記ベクトルレベル細粒度スパース化は、ベクトル行内要素の絶対値の大きさに応じて大きさに基づくプルーニングを行うことである。

さらに、前記ベクトルブロックの重要性スコア和は、ベクトルブロック内各要素の２乗の総和である。

さらに、前記ベクトルレベル細粒度スパース化とブロックレベル粗粒度スパース化のプルーニングマスク１とプルーニングマスク２行列における要素の初期は、いずれも１である。

さらに、ベクトルレベル細粒度スパース化とブロックレベル粗粒度スパース化の大きさに基づくプルーニングは、プルーニングマスク１とプルーニングマスク２上で、ベクトル行又はベクトルブロックにおけるスパース性閾値未満の対応する位置の要素を０にセットすることである。

さらに、ベクトルレベル細粒度スパース化とブロックレベル粗粒度スパース化の夫々のスパース性は、ユーザが予め設定した目標スパース性と粒度混合比率に基づいて、スパース性補償方法によって推定するプロセスは、以下のとおりであり、

ここで、ｓ_ｔ、ｓ_ｆとｓ_ｃは、それぞれ、ユーザが予め設定した目標スパース性、ベクトルレベル細粒度スパース性とブロックレベル粗粒度スパース性であり、ｐは、０～１との間の数である粒度混合比率である。

本発明の有益効果は、以下のとおりである。

１）本発明は、正規制約項を必要とせず、混合したスパース粒度を実現することができ、それによって、推論オーバヘッドを低減し、モデル精度を保証する混合粒度に基づく共同スパース方法を提案する。

２）本発明は、達成されるスパース率を最適化及び保証するためのスパース補償方法を提案する。同じ目標スパース性下で実現されるスパース性は、応用されるハイパーパラメータによって調整することができ、それによって、モデル精度とスパース比との間でトレードオフを行う。

３）共同スパース性は、ベクトルレベル細粒度スパース化のベクトル行サイズとブロックレベル粗粒度スパース化のベクトルブロックサイズによらず、ブロックスパース（ｂｌｏｃｋｓｐａｒｓｉｔｙ）とバランススパース（ｂａｌａｎｃｅｄｓｐａｒｓｉｔｙ）パターンとの間の推論速度を常に得る。

図１（ａ）は、ベクトルレベル細粒度スパース化のプルーニングマスクである。図１（ｂ）は、共同スパース方法のプルーニングマスクである。図１（ｃ）は、ブロックレベル粗粒度スパース化のプルーニングマスクである。図２は、ベクトルレベル細粒度スパース化の実施例である。図３は、スパース性補償方法を採用した後、達成できる実際スパース性である。

以下、添付の図面及び具体的な実施例を結び付けながら、本発明をより詳しく説明する。

図１（ａ）、図１（ｂ）と図１（ｃ）に示すように、本発明に提案されているニューラルネットワークに用いられる混合粒度に基づく共同スパース方法であって、この方法は、画像識別、例えば機械リーダカード解答用紙自動採点に用いられ、まず、複数の画像データを収集して人為的にラベルを付与し、画像データセットを生成し、トレーニングデータセットとテストデータセットとに分けられ、トレーニングデータセットを畳み込みニューラルネットワークに入力し、畳み込みニューラルネットワーク各層の重み行列をランダムに初期化し、繰り返しの方式でトレーニングし、共同スパースプロセスを採用して、畳み込みニューラルネットワークをプルーニングし、テストデータセットを用いてトレーニング効果を交差検証し、トレーニングが完了するまで、逆伝播アルゴリズムにより各層重み行列を更新し、この時、ニューラルネットワークは、入力された機械リーダカード解答用紙に対して、正解と照合することで、正誤試験問題を判断することができ、前記共同スパースプロセスは、具体的には、ユーザが目標スパース性と粒度混合比率を予め設定することにより、異なるプルーニング粒度のプルーニングマスクを得、独立したベクトルレベル細粒度スパース化とブロックレベル粗粒度スパース化とを含み、ベクトルレベル細粒度スパース化とブロックレベル粗粒度スパース化の夫々のスパース性は、ユーザが予め設定した目標スパース性と粒度混合比率に基づいて、スパース性補償方法によって推定し、以下のステップを含む。

（１）ベクトルレベル細粒度スパース化：前記ベクトルレベル細粒度スパース化は、行数が＃ｒｏｗであり、列数が＃ｃｏｌである重み行列を、補間後の最小行列列数がちょうどＫにより割り切れるように重み行列の右端にゼロ列を充填し、行数が１であり、列数がＫである複数のベクトル行に分割され、且つベクトル行毎に対して、ベクトル行内要素を絶対値の大きさに応じて、大きさに基づくプルーニングを行い、プルーニングマスク１上で対応する要素の位置の１を０にセットし、プルーニングマスク１上の０の個数がベクトルレベル細粒度スパース化のスパース性要求を満たすようにする。

ベクトルレベル細粒度スパース化は、細粒度の利点があり、疎構造に制約をほとんどかけないため、共同スパース方法のモデル精度の保持が重要である。また、ネットワーク全体においてランキング、プルーニングを行う非構造化スパース性とは異なり、ベクトルレベル細粒度スパース化方式は、ネットワークの特定領域（例えば、行内のベクトル）で重みに対してランキング、プルーニングを行う方が、より直接的で、有効である。図２は、重み行列行におけるベクトルレベル細粒度スパース化の例を示す図である。重み行列における各行は、サイズが等しく、行数が１であり、列数がＫである複数のベクトル行に分割され、且つ現在繰り返しラウンドのスパース閾値に基づいて、絶対値が最小となる重みをプルーニングする。そのため、プルーニング後の重みは、ベクトルレベル（ｖｅｃｔｏｒ－ｗｉｓｅ）とチャンネルレベル（ｃｈａｎｎｅｌ－ｗｉｓｅ）で同じスパース性を実現することができる。

ネットワークの特定領域で高効率に実施でき、モデル正確性を保持するとともに重み要素ランキング複雑度を簡略化にすることができるほか、ベクトルレベル細粒度スパース化の利点は、等化動作負荷を有し、並列ＧＰＵスレッド間の共有メモリに適用されている。様々なＧＰＵプラットフォームの場合、パラメータＫは、共有メモリ中の最大容量として指定してもよい。

（２）ブロックレベル粗粒度スパース化：前記ブロックレベル粗粒度スパース化は、行数が＃ｒｏｗであり、列数が＃ｃｏｌである重み行列を、補間後の最小行列がちょうどＲ行、Ｓ列サイズのブロックにより割り切れるように重み行列の下端及び／又は右端にゼロ行及び／又はゼロ列を充填し、行数がＲであり、列数がＳである複数のベクトルブロックに分割され、充填されたゼロ行又はゼロ列を含まない各ベクトルブロックの重要性スコア和を計算し、前記ベクトルブロックの重要性スコア和は、ベクトルブロック内の各要素の二乗の和であり、重要性スコア和の計算に用いた全てのベクトルブロックに対し、重要性スコア和の大きさに応じてプルーニングを行い、プルーニングマスク２上の重要性スコア和の計算に用いたベクトルブロックの対応する要素の位置の１を０にセットし、プルーニングマスク２上の０の個数がブロックレベル粗粒度スパース化のスパース性要求を満たすようにし、
細粒度プルーニングに比べて、粗粒度プルーニングは、通常、よりハードウェア友好型のサブ構造の構築方面でより良い表現を有するが、その代価が通常、モデル精度を低下している。ブロックレベル粗粒度スパース化の目的は、ＧＰＵの計算並列性のために、適切な行列サブ構造を提供することである。従来の深層学習応用シナリオに配備された商用ＧＰＵ（例えば、Ｖｏｌｔａ、ＴｕｒｉｎｇとＮｖｉｄｉａＡ１００ＧＰＵ）は、ＴｅｎｓｏｒＣｏｒｅと呼ばれる専用ハードウェアを一般的に採用し、このハードウェアは、迅速行列乗算方面において優勢を有し、新規のデータタイプをサポートする。これにより、深層ニューラルネットワークのために利点をもたらし、深層ニューラルネットワークでは、基本算術計算は、畳み込み層と完全連結層における大量基準行列乗算であり、メモリではなく、その乗算計算速度が性能表現を制限している。

解決策の一つは、パーティションされたブロックのサイズをＧＰＵｔｉｌｅサイズとストリーミングマルチプロセッサ（ＳＭ）の個数に適合させることである。理想的には、行列サイズは、ブロックサイズにより割り切れることが可能であり、構築されたＧＰＵｔｉｌｅ数は、ＳＭ個数により割り切れることが可能である。一つの特定のニューラルネットワークモデルを所与すると、通常、ＳＭ個数は、割り切れることができるため、本発明はＧＰＵｔｉｌｅに適用されるブロックサイズに重点を置く。ＧＰＵｔｉｌｅと同じサイズの粗粒度スパース性のブロック化サイズを選択することで、ＧＰＵｔｉｌｅを完全に占用することができる。なお、加算は乗算よりもはるかに小さい時間と面積オーバヘッドを占用し、且つ重み勾配は逆伝播において既存且つ利用可能であるため、本発明は、プルーニングベクトルブロックの基準として、一次テイラーを応用して局部和を近似する。

（３）混合粒度に基づく共同スパース方法：混合粒度に基づく共同スパース方法を実現するための全体的な考え方は、独立生成された細粒度スパース化プルーニングマスク１と粗粒度スパース化プルーニングマスク２でビット論理積演算により、最終的なプルーニングマスク３を形成することである。最終的なプルーニングマスク３と行数が＃ｒｏｗであり、列数が＃ｃｏｌ的である行列をビット論理積演算し、スパース化後の重み行列を得る。

本発明は、行列における要素の初期がいずれも１であるプルーニングマスク１とプルーニングマスク２を独立生成し、プルーニングマスク１とプルーニングマスク２上で、プルーニングマスクに対してベクトルレベル細粒度スパース化とブロックレベル粗粒度スパース化を順次に適用するのではなく、ベクトル行又はベクトルブロックにおけるスパース性閾値未満の対応する位置の要素を０にセットする。あるチャンネルが別のチャンネルよりも重要である可能性があるので、これらのより価値のあるチャンネルでは、大量の重要重みは、順次トリミングにおいてトリミングされ、それによって、モデル精度の低下を招く可能性がある。

畳み込みニューラルネットワーク各層の重み行列をスパース化して、トレーニングを完了させた後、採点が必要な機械リーダカード解答用紙の画像データを採集し、識別対象画像データを畳み込みニューラルネットワークに入力し、画像識別を行い、各機械リーダカード解答用紙の点数を出力する。

共同スパース方法の混合スパース粒度を得るために、本発明は、ベクトルレベル細粒度スパース化が目標スパース性に貢献するスパース性比率を制御するように、粒度混合比率ｐとして表される人為的に設定されたハイパーパラメータを設定する。例えば、畳み込み層の目標スパース性が０．７（すなわち、プルーニング後の畳み込み層重み行列におけるゼロの比率は７０％に達する）であり、且つ粒度混合比率ｐが０．８であれば、ベクトルレベル細粒度スパース化とブロックレベル粗粒度スパース化が貢献するスパース性は、それぞれ０．５６と０．１４であるはずである。畳み込み層における実際に達成されるスパース性を調べることによって、本件出願者が細粒度スパース化プルーニングマスク１と粗粒度スパース化プルーニングマスク２が何らかの重み要素上で重畳している可能性があるため、スパース性は目標スパース性より低いことが発現された。これは、何らかの重みが二つのプルーニング基準において価値があると評価されていることとして解釈され得る。そのため、本発明は、スパース性補償方法を提案し、ベクトルレベル細粒度スパース化とブロックレベル粗粒度スパース化の夫々のスパース性を再近似し、

ここで、ｓ_ｔ、ｓ_ｆとｓ_ｃは、それぞれ、ユーザが予め設定した目標スパース性、ベクトルレベル細粒度スパース性とブロックレベル粗粒度スパース性であり、ｐは、０～１との間の数である粒度混合比率である。このようなスパース性補償方法は、別の見方をすれば、混合比ｐが０．５より大きい場合、目標スパース性を再近似したベクトルレベル細粒度スパース化は、目標スパース性の主な貢献者とみることができ、ブロックレベルの粗粒度スパース化は、別の重みプルーニング基準に基づいて、さらに多くのゼロを生成することができる。ｐが０．５より小さい場合、逆に同様である。図３に示すように、スパース性補償方法を採用する場合、その値に関わらず、所定の目標スパース性を完全に実現することができる。また、ｐが０又は１に近い場合、より顕著なメインプルーニング方案が出現し、そのスパース性比は目標スパース性に近い。又は、ｐが約０．５である場合、余裕のスパース性は初期集中トレーニングの時間を調整することにより、実現可能なスパース性とモデル精度との間でトレードオフを行うことができる。

細粒度スパース化プルーニングマスク１と粗粒度スパース化プルーニングマスク２を生成する時に、本発明は、重み行列を繰り返してトリミングし、且つ毎回のトリミング後に、ネットワークに対して複数の時期の再トレーニングを行う。トリミング後再トレーニングは、１回の繰り返しとして定義される。実際に、通常、繰り返しトリミングは、モデルの正確性を保持しながら、より多くの重み要素をトリミングすることができる。本発明は、一次導関数が正であるが逓減する指数関数を使用して、現在のスパース性閾値を計算し、

ここで、ｓｆｔｈｒｅｓとｓｃｔｈｒｅｓは、それぞれ、現在時期（ｅｐｏｃｈ）ｅｃのベクトルレベル細粒度スパース化閾値とブロックレベル粗粒度スパース化閾値である。ｅｉは最初のプルーニング時期であり、早期の集中トレーニングは、モデルの正確性を保持するために非常に重要であるからである。一方、ｒは閾値の指数に従う増加の遅速を制御する。本発明は、全トレーニングプロセスにおいて、目標スパース性を達成するために、トリミングを繰り返し、及びプロセスをトレーニングし、その後、生成された細粒度スパース化プルーニングマスク１と粗粒度スパース化プルーニングマスク２をビット論理積演算することによって、最終的なプルーニングマスク３を形成する。特に、ｐ＝１によってバランススパースパターンを実現することができ、ｐ＝０によってブロックスパースパターンとチャンネルレベルの構造のスパースパターンを実現することができる。

本出願は、上記の好ましい実施形態に限定されるものではない。当業者であれば、本出願の示唆下で、他の様々な形態の混合粒度に基づく共同スパースパターン及びその実現方法を得ることができ、本出願の特許請求の範囲から逸脱することなく行われる他の変更及び修正は、いずれも本発明の特許請求の範囲内として保護されるべきものである。

（付記）
（付記１）
ニューラルネットワークに用いられる混合粒度に基づく共同スパース方法であって、
この方法は、画像識別に用いられ、まず、複数の画像データを収集して人為的にラベルを付与し、画像データセットを生成し、画像データセットをトレーニングセットとして畳み込みニューラルネットワークに入力し、畳み込みニューラルネットワーク各層の重み行列をランダムに初期化し、繰り返しの方式でトレーニングし、共同スパースプロセスを採用して、畳み込みニューラルネットワークをプルーニングし、
前記共同スパースプロセスは、具体的には、ユーザが目標スパース性と粒度混合比率を予め設定することにより、異なるプルーニング粒度のプルーニングマスクを得、独立したベクトルレベル細粒度スパース化とブロックレベル粗粒度スパース化とを含み、ベクトルレベル細粒度スパース化とブロックレベル粗粒度スパース化の夫々のスパース性は、ユーザが予め設定した目標スパース性と粒度混合比率に基づいて、スパース性補償方法によって推定し、
前記ベクトルレベル細粒度スパース化は、行数が＃ｒｏｗであり、列数が＃ｃｏｌである重み行列を、補間後の最小行列列数がちょうどＫにより割り切れるように該重み行列の右端にゼロ列を充填し、行数が１であり、列数がＫである複数のベクトル行に分割され、且つベクトル行毎に対して、ベクトル行内要素を大きさに基づくプルーニングを行い、プルーニングマスク１上で対応する要素の位置の１を０にセットし、プルーニングマスク１上の０の個数がベクトルレベル細粒度スパース化のスパース性要求を満たすようにし、
前記ブロックレベル粗粒度スパース化は、行数が＃ｒｏｗであり、列数が＃ｃｏｌである重み行列を、補間後の最小行列がちょうどＲ行、Ｓ列サイズのブロックにより割り切れるように該重み行列の下端及び／又は右端にゼロ行及び／又はゼロ列を充填し、行数がＲであり、列数がＳである複数のベクトルブロックに分割され、充填されたゼロ行又はゼロ列を含まない各ベクトルブロックの重要性スコア和を計算し、重要性スコア和の計算に用いた全てのベクトルブロックに対し、重要性スコア和の大きさに応じてプルーニングを行い、プルーニングマスク２上の重要性スコア和の計算に用いたベクトルブロックの対応する要素の位置の１を０にセットし、プルーニングマスク２上の０の個数がブロックレベル粗粒度スパース化のスパース性要求を満たすようにし、
ベクトルレベル細粒度スパース化して得られたプルーニングマスク１とブロックレベル粗粒度スパース化して得られたプルーニングマスク２とをビット論理積演算し、最終的なプルーニングマスク３を得、最終的なプルーニングマスク３と行数が＃ｒｏｗであり、列数が＃ｃｏｌである行列とをビット論理積演算し、スパース化された重み行列を得、
畳み込みニューラルネットワーク各層の重み行列をスパース化して、トレーニングを完了させた後、識別対象画像を畳み込みニューラルネットワークに入力し、画像識別を行う、
ことを特徴とするニューラルネットワークに用いられる混合粒度に基づく共同スパース方法。

（付記２）
前記ベクトルレベル細粒度スパース化は、ベクトル行内要素の絶対値の大きさに応じて大きさに基づくプルーニングを行うことである、
ことを特徴とする付記１に記載のニューラルネットワークに用いられる混合粒度に基づく共同スパース方法。

（付記３）
前記ベクトルブロックの重要性スコア和は、ベクトルブロック内各要素の２乗の総和である、
ことを特徴とする付記１に記載のニューラルネットワークに用いられる混合粒度に基づく共同スパース方法。

（付記４）
前記ベクトルレベル細粒度スパース化とブロックレベル粗粒度スパース化のプルーニングマスク１とプルーニングマスク２行列における要素の初期は、いずれも１である、
ことを特徴とする付記１に記載のニューラルネットワークに用いられる混合粒度に基づく共同スパース方法。

（付記５）
ベクトルレベル細粒度スパース化とブロックレベル粗粒度スパース化の大きさに基づくプルーニングは、プルーニングマスク１とプルーニングマスク２上で、ベクトル行又はベクトルブロックにおけるスパース性閾値未満の対応する位置の要素を０にセットすることである、
ことを特徴とする付記１に記載のニューラルネットワークに用いられる混合粒度に基づく共同スパース方法。

（付記６）
ベクトルレベル細粒度スパース化とブロックレベル粗粒度スパース化の夫々のスパース性は、ユーザが予め設定した目標スパース性と粒度混合比率に基づいて、スパース性補償方法によって推定するプロセスは、以下のとおりであり、

ここで、ｓ_ｔ、ｓ_ｆとｓ_ｃは、それぞれ、ユーザが予め設定した目標スパース性、ベクトルレベル細粒度スパース性とブロックレベル粗粒度スパース性であり、ｐは、０～１との間の数である粒度混合比率である、
ことを特徴とする付記１に記載のニューラルネットワークに用いられる混合粒度に基づく共同スパース方法。

Claims

コンピュータにより実行される、ニューラルネットワークに用いられる混合粒度に基づく共同スパース方法であって、
この方法は、画像識別に用いられ、まず、複数の画像データを収集して人為的にラベルを付与し、画像データセットを生成し、画像データセットをトレーニングセットとして畳み込みニューラルネットワークに入力し、畳み込みニューラルネットワーク各層の重み行列をランダムに初期化し、繰り返しの方式でトレーニングし、共同スパースプロセスを採用して、畳み込みニューラルネットワークをプルーニングし、
前記共同スパースプロセスは、具体的には、ユーザが目標スパース性と粒度混合比率を予め設定することにより、異なるプルーニング粒度のプルーニングマスクを得、独立したベクトルレベル細粒度スパース化とブロックレベル粗粒度スパース化とを含み、ベクトルレベル細粒度スパース化とブロックレベル粗粒度スパース化の夫々のスパース性は、ユーザが予め設定した目標スパース性と粒度混合比率に基づいて、スパース性補償方法によって推定し、
前記ベクトルレベル細粒度スパース化は、行数が＃ｒｏｗであり、列数が＃ｃｏｌである重み行列を、補間後の最小行列列数がちょうどＫにより割り切れるように該重み行列の右端にゼロ列を充填し、行数が１であり、列数がＫである複数のベクトル行に分割され、且つベクトル行毎に対して、ベクトル行内の要素の絶対値の大きさに基づくプルーニングを行い、プルーニングマスク１上で対応する要素の位置の１を０にセットし、プルーニングマスク１上の０の個数がベクトルレベル細粒度スパース化のスパース性要求を満たすようにし、
前記ブロックレベル粗粒度スパース化は、行数が＃ｒｏｗであり、列数が＃ｃｏｌである重み行列を、補間後の最小行列がちょうどＲ行、Ｓ列サイズのブロックにより割り切れるように該重み行列の下端及び／又は右端にゼロ行及び／又はゼロ列を充填し、行数がＲであり、列数がＳである複数のベクトルブロックに分割され、充填されたゼロ行又はゼロ列を含まない各ベクトルブロックの重要性スコア和を計算し、重要性スコア和の計算に用いた全てのベクトルブロックに対し、重要性スコア和の大きさに応じてプルーニングを行い、プルーニングマスク２上の重要性スコア和の計算に用いたベクトルブロックの対応する要素の位置の１を０にセットし、プルーニングマスク２上の０の個数がブロックレベル粗粒度スパース化のスパース性要求を満たすようにし、
ベクトルレベル細粒度スパース化して得られたプルーニングマスク１とブロックレベル粗粒度スパース化して得られたプルーニングマスク２とをビット論理積演算し、最終的なプルーニングマスク３を得、最終的なプルーニングマスク３と行数が＃ｒｏｗであり、列数が＃ｃｏｌである行列とをビット論理積演算し、スパース化された重み行列を得、
畳み込みニューラルネットワーク各層の重み行列をスパース化して、トレーニングを完了させた後、識別対象画像を畳み込みニューラルネットワークに入力し、画像識別を行う、
ことを特徴とするニューラルネットワークに用いられる混合粒度に基づく共同スパース方法。
前記ベクトルブロックの重要性スコア和は、ベクトルブロック内各要素の２乗の総和である、
ことを特徴とする請求項１に記載のニューラルネットワークに用いられる混合粒度に基づく共同スパース方法。
前記ベクトルレベル細粒度スパース化とブロックレベル粗粒度スパース化のプルーニングマスク１とプルーニングマスク２行列における要素の初期は、いずれも１である、
ことを特徴とする請求項１に記載のニューラルネットワークに用いられる混合粒度に基づく共同スパース方法。
ベクトルレベル細粒度スパース化とブロックレベル粗粒度スパース化の大きさに基づくプルーニングは、プルーニングマスク１とプルーニングマスク２上で、ベクトル行又はベクトルブロックにおけるスパース性閾値未満の対応する位置の要素を０にセットすることである、
ことを特徴とする請求項１に記載のニューラルネットワークに用いられる混合粒度に基づく共同スパース方法。
ベクトルレベル細粒度スパース化とブロックレベル粗粒度スパース化の夫々のスパース性は、ユーザが予め設定した目標スパース性と粒度混合比率に基づいて、スパース性補償方法によって推定するプロセスは、以下のとおりであり、

ここで、ｓ_ｔ、ｓ_ｆとｓ_ｃは、それぞれ、ユーザが予め設定した目標スパース性、ベクトルレベル細粒度スパース性とブロックレベル粗粒度スパース性であり、ｐは、０～１との間の数である粒度混合比率である、
ことを特徴とする請求項１に記載のニューラルネットワークに用いられる混合粒度に基づく共同スパース方法。