JP7096888B2

JP7096888B2 - ネットワークモジュール、割り当て方法及び装置、電子機器並びに記憶媒体

Info

Publication number: JP7096888B2
Application number: JP2020527741A
Authority: JP
Inventors: イーリー; ジャンフイクアン; イーミンチェン; ウェイジャン
Original assignee: Shenzhen Sensetime Technology Co Ltd
Current assignee: Shenzhen Sensetime Technology Co Ltd
Priority date: 2019-02-25
Filing date: 2019-10-30
Publication date: 2022-07-06
Anticipated expiration: 2039-10-30
Also published as: TW202032499A; WO2020173115A1; KR20200106027A; JP2021517282A; TWI766228B; CN113592004A; SG11202004552VA; US20200294249A1; US11443438B2; CN109902738B; CN109902738A

Description

（関連出願の相互参照）
本願は、２０１９年２月２５日に中国特許局に提出された、出願番号が２０１９１０１３９００７．４であり、発明の名称が「ネットワークモジュール、割り当て方法及び装置、電子機器並びに記憶媒体」である中国特許出願の優先権を主張し、その開示の全てが参照によって本願に組み込まれる。

本開示は、コンピュータビジョン技術に関し、特に、ネットワークモジュール、割り当て方法及び装置、電子機器並びに記憶媒体に関する。

コンピュータビジョンが人工知能の重要部分であり、それに対して画像分類がコンピュータビジョンの基礎となっているので、良い分類ネットワークはコアネットワークとして支援、分割、追跡等のタスクを実行することができる。近年、特徴アグリゲーションは非常に効果的な視覚認識ネットワークの設計方法になっている。

本開示は、ネットワークモジュール、割り当て方法及び装置、電子機器並びに記憶媒体を提供する。

本開示の一態様によれば、ネットワークモジュールを提供し、
順にカスケード接続される第１ネットワーク層、第２ネットワーク層及び第３ネットワーク層を含み、
前記第１ネットワーク層は、入力された画像を処理して第１特徴マップを得るために用いられ、
前記第２ネットワーク層は、複数の並列のブランチを含み、
各ブランチが第１サンプリング層を含み、
前記第１サンプリング層が、前記第１特徴マップに対してダウンサンプリングを行って第２特徴マップを得るために用いられ、
異なる前記ブランチ中の前記第１サンプリング層で得られた前記第２特徴マップのスケールが異なり、
前記第３ネットワーク層は、各前記ブランチが出力した特徴マップデータを結合するために用いられる。

可能な一実施形態では、前記第１サンプリング層がプーリング層である。

可能な一実施形態では、前記プーリング層が最大プーリング層である。

可能な一実施形態では、各ブランチは、前記第１サンプリング層に順にカスケード接続される第１畳み込み層と第２サンプリング層を更に含み、
前記第１畳み込み層は、前記第２特徴マップに対して畳み込み操作を行って第３特徴マップを得るために用いられ、
前記第２サンプリング層は、前記第３特徴マップのスケールを前記第１特徴マップのスケールに復元するために用いられる。

可能な一実施形態では、前記第２ネットワーク層は、第２畳み込み層を含む元比例ブランチを更に含み、
前記第２畳み込み層は、前記第１特徴マップに対して畳み込み操作を行って、畳み込み操作で得られた特徴マップデータを前記第３ネットワーク層に入力するために用いられ、
前記第３ネットワーク層は、更に、前記第２ネットワーク層中の前記複数の並列のブランチで出力した特徴マップデータと各前記元比例ブランチで出力した特徴マップデータを結合するために用いられる。

本開示の一態様によれば、割り当て方法をさらに提供し、画像処理モデルに複数の特徴マップが存在する場合、各前記特徴マップが利用するニューロンを各前記特徴マップに割り当てるために用いられ、前記画像処理モデルが、少なくとも一つの上記のいずれか一項に記載のネットワークモジュールを含み、前記割り当て方法は、
前記画像処理モデル中の複数の畳み込み層のニューロンの重要性に基づいて、前記ニューロンを選別して第１結果を得るステップであって、複数の畳み込み層が前記画像処理モデルの同一深度にあり、且つ各々の畳み込み層がそれぞれ異なるスケールの前記特徴マップを処理するために用いられ、前記第１結果が複数のニューロンを含むステップと、
前記第１結果中の各ニューロンの位置属性に基づいて、各前記ニューロンに対応する前記特徴マップのスケールを統計して、割り当て関係を得るステップであって、前記位置属性が、各ニューロンの属する畳み込み層を表し、前記割り当て関係が、各前記特徴マップと前記特徴マップが利用するニューロンとの間の対応関係を表すステップと、
前記割り当て関係に基づいて、利用するニューロンを各前記特徴マップに割り当てるステップと、を含む。

可能な一実施形態では、前記画像処理モデル中の複数の畳み込み層のニューロンの重要性に基づいて、前記ニューロンを選別するステップの前に、
各ネットワークモジュール中のブランチの数を決定して、予め設定された前記ネットワークモジュールの数に基づいて、前記画像処理モデルを構築するステップと、
前記画像処理モデルをトレーニングして、前記画像処理モデル中のｂａｔｃｈｎｏｒｍ層のｓｃａｌｅパラメータを得るステップであって、前記ｓｃａｌｅパラメータが、前記ネットワークモジュールにおける各ブランチ中の畳み込み層のニューロンの重要性を表すステップと、を更に含む。

可能な一実施形態では、前記画像処理モデル中の複数の畳み込み層のニューロンの重要性に基づいて、前記ニューロンを選別して、第１結果を得る前記ステップは、
前記画像処理モデルを予めトレーニングして得られたｂａｔｃｈｎｏｒｍ層のｓｃａｌｅパラメータに基づいて、複数の前記畳み込み層のニューロンを順序付けて、複数の前記畳み込み層中のニューロンの並び順序を表す第１シーケンスを得るステップと、
予め設定された計算量に基づいて、複数の前記特徴マップを処理するための予備ニューロン数量を決定するステップと、
決定された前記予備ニューロン数量に基づいて、前記第１シーケンスから必要なニューロンを順に抽出して、前記第１結果を得るステップと、を含む。

可能な一実施形態では、前記割り当て関係に基づいて、利用するニューロンを各前記特徴マップに割り当てるステップの後に、
前記割り当て関係に基づいて、前記画像処理モデルの第１ネットワーク構造を決定するステップと、
前記第１ネットワーク構造の画像処理モデルをトレーニングするステップと、を更に含む。

本開示の一態様によれば、割り当て装置を更に提供し、画像処理モデルに複数の特徴マップが存在する場合、各前記特徴マップが利用するニューロンを各前記特徴マップに割り当てるために用いられ、前記画像処理モデルが、少なくとも一つの上記のいずれか一項に記載のネットワークモジュールを含み、前記割り当て装置は、
前記画像処理モデル中の複数の畳み込み層のニューロンの重要性に基づいて、前記ニューロンを選別して第１結果を得るための選別モジュールであって、複数の畳み込み層が前記画像処理モデルの同一深度にあり、且つ各々の畳み込み層がそれぞれ異なるスケールの前記特徴マップを処理するために用いられ、前記第１結果が複数のニューロンを含む選別モジュールと、
前記第１結果中の各ニューロンの位置属性に基づいて、各前記ニューロンに対応する前記特徴マップのスケールを統計して、割り当て関係を得るための統計モジュールであって、前記位置属性が、各ニューロンの属する畳み込み層を表し、前記割り当て関係が、各前記特徴マップと前記特徴マップが利用するニューロンとの間の対応関係を表す統計モジュールと、
前記割り当て関係に基づいて、利用するニューロンを各前記特徴マップに割り当てるための割り当てモジュールと、を含む。

可能な一実施形態では、
前記選別モジュールが前記画像処理モデル中の複数の畳み込み層のニューロンの重要性に基づいて、前記ニューロンを選別する前に、各ネットワークモジュール中のブランチの数を決定して、予め設定された前記ネットワークモジュールの数に基づいて、前記画像処理モデルを構築するためのモデル構築モジュールと、
前記画像処理モデルをトレーニングして、前記画像処理モデル中のｂａｔｃｈｎｏｒｍ層のｓｃａｌｅパラメータを得るための第１トレーニングモジュールであって、前記ｓｃａｌｅパラメータが、前記ネットワークモジュールにおける各ブランチ中の畳み込み層のニューロンの重要性を表す第１トレーニングモジュールと、を更に含む。

可能な一実施形態では、前記選別モジュールは、
前記画像処理モデルを予めトレーニングして得られたｂａｔｃｈｎｏｒｍ層のｓｃａｌｅパラメータに基づいて、複数の前記畳み込み層のニューロンを順序付けて、複数の前記畳み込み層中のニューロンの並び順序を表す第１シーケンスを得るための順序付けサブモジュールと、
予め設定された計算量に基づいて、複数の前記特徴マップを処理するための予備ニューロン数量を決定するためのニューロン数決定サブモジュールと、
決定された前記予備ニューロン数量に基づいて、前記第１シーケンスから必要なニューロンを順に抽出して、前記第１結果を得るためのニューロン抽出サブモジュールと、を含む。

可能な一実施形態では、
前記割り当てモジュールが前記割り当て関係に基づいて、利用するニューロンを各前記特徴マップに割り当てた後、前記割り当て関係に基づいて、前記画像処理モデルの第１ネットワーク構造を決定するためのネットワーク構造決定モジュールと、
前記第１ネットワーク構造の画像処理モデルをトレーニングするための第２トレーニングモジュールと、を更に含む。

本開示の一態様によれば、電子機器を更に提供し、
上記のいずれか一項に記載の方法を実行するように構成されるプロセッサと、
プロセッサ実行可能コマンドを記憶するためのメモリと、を含む。

本開示の一態様によれば、コンピュータ読取可能記憶媒体を提供し、コンピュータプログラムコマンドが記憶され、前記コンピュータプログラムコマンドがプロセッサにより実行される時に上記割り当て方法を実現する。

本開示の一態様によれば、コンピュータプログラムを提供し、コンピュータ読取可能コードを含み、前記コンピュータ読取可能コードが電子機器中で実行される時に、前記電子機器中のプロセッサが上記割り当て方法を実行する。

本開示の実施例では、上記ネットワークモジュールを設置し、ネットワークモジュール中の第２ネットワーク層において複数の並列のブランチを構築し、各ブランチ中の第１サンプリング層によって、第１ネットワーク層で出力した第１特徴マップに対してダウンサンプリングを行うことで、異なる第１サンプリング層のそれぞれにおいて、異なるスケールを有する第２特徴マップを作成するようにし、それによってネットワークモジュールにおいて複数の異なるスケールの特徴マップを直接作成するという目的を達成する。

以上の一般説明と以下の詳細説明は解釈するための例示的なものに過ぎず、本開示を制限しないことを理解すべきである。

以下の図面と関連付けられた例示的な実施例に対する詳細な説明によれば、本開示の他の特徴および態様は明確になる。

本開示の実施例に係るネットワークモジュールの構造模式図を示す。本開示の別の実施例に係るネットワークモジュールの構造模式図を示す。本開示のまた１つの実施例に係るネットワークモジュールの構造模式図を示す。本開示の実施例に係る割り当て方法のフローチャートを示す。本開示の実施例に係る割り当て装置のブロック図を示す。本開示の実施例に係る電子機器のブロック図を示す。本開示の実施例に係る電子機器のブロック図を示す。

ここの図面は明細書に組み込まれて明細書の一部を構成し、これらの図面は本開示に合致する実施例を示し、明細書と共に本開示の技術的手段を説明するために用いられる。

以下に図面を参照しながら本開示の様々な例示的実施例、特徴および態様を詳細に説明する。図面における同じ符号は同じまたは類似する機能の要素を表す。図面において実施例の様々な態様を示したが、特に断らない限り、比例に従って図面を作る必要がない。

ここの用語「例示的」とは、「例、実施例として用いられることまたは説明的なもの」を意味する。ここで「例示的」に説明したいかなる実施例も他の実施例より優れたものと理解すべきではない。

本明細書の用語の「及び／又は」は、関連対象の関連関係を記述するためのものに過ぎず、３種の関係が存在可能であることを示し、例えば、Ａ及び／又はＢは、Ａが単独して存在し、ＡとＢが同時に存在し、Ｂが単独して存在するという３種の場合を示してもよい。また、本明細書の用語の「少なくとも１種」は多種のうちのいずれか１種又は多種のうちの少なくとも２種の任意の組合を示し、例えば、Ａ、Ｂ、Ｃのうちの少なくとも１種を含むということは、Ａ、Ｂ及びＣから構成される集合から選択されるいずれか１つ又は複数の要素を含むことを示してもよい。

また、本開示をより効果的に説明するために、以下の具体的な実施形態において様々な具体的詳細を示す。当業者であれば、何らかの具体的詳細がなくなるにも関わらず、本開示は同様に実施できるということを理解すべきである。いくつかの実施例では、本開示の趣旨を強調するよう、当業者に既知の方法、手段、要素および回路に対する詳細な説明を省略する。

図１は本開示の実施例に係るネットワークモジュールの構造模式図を示す。

図１に示すように、本開示の実施例のネットワークモジュールは、順にカスケード接続される第１ネットワーク層、第２ネットワーク層及び第３ネットワーク層を含む。ここで、第１ネットワーク層は、入力された画像を処理して、第１特徴マップを得るために用いられる。第２ネットワーク層は、複数の並列のブランチを含み、各ブランチが第１サンプリング層を含み、第１サンプリング層が、第１特徴マップに対してダウンサンプリングを行って第２特徴マップを得るために用いられる。第１サンプリング層は、第１特徴マップに対してダウンサンプリングを行って、第２特徴マップを得るために用いられる。ここで、異なるブランチ中の第１サンプリング層で得られた第２特徴マップのスケールが異なる。第３ネットワーク層は、第３ネットワーク層の次の階層に位置するネットワーク層が画像処理操作を継続できるように、各ブランチで出力した特徴マップデータを結合するために用いられ、第３ネットワーク層は、連結（ｃｏｎｃａｔｅｎａｔｅ）層であってよい。

それによって、上記ネットワークモジュールを設置し、ネットワークモジュール中の第２ネットワーク層において複数の並列のブランチを構築し、各ブランチ中の第１サンプリング層によって、第１ネットワーク層で出力した第１特徴マップに対してダウンサンプリングを行うことで、異なる第１サンプリング層のそれぞれにおいて、異なるスケールを有する第２特徴マップを作成するようにし、それによってネットワークモジュールにおいて複数の異なるスケールの特徴マップを直接作成するという目的を達成する。

異なる深度の特徴マップを接続する方式、ネットワークの同一深度で異なる畳み込みカーネルを利用する方式という二つの方式を利用する関連技術と比べて、本開示の実施例のネットワークモジュールは、各ブランチ中の第１サンプリング層によって異なるスケールの特徴マップを直接作成することができ、即ち、ダウンサンプリング操作によって異なるスケールの特徴マップを作成することができ、それによって、本開示の実施例のネットワークモジュールを採用すれば、実際の状況に応じて異なるスケールの特徴マップを作成することができる。従って、特徴マップの多様性を効果的に高めると共に、得られる特徴マップのスケールの変化範囲をより大きくなり、多様化することができる。また、複数のブランチを設置することでより多様な受容野がもたらされ、ネットワークモジュールを分類や検出タスクに用いる時に分類や検出の精度を効果的に高めることができる。

ここで、上記ネットワークモジュールの第２ネットワーク層で設置されるブランチの数は実際の状況に応じて具体的に設定可能であることを説明する必要がある。例えば、ブランチの数は、２、３又は５、１０等であってよい。つまり、本開示の実施例のネットワークモジュールにおいて、第２ネットワーク層中のブランチの数はその具体的な計算量に応じて決定し得る。従って、ここでブランチの数が限定されない。

また、更に、本開示の実施例に記載されている特徴マップのスケールは、特徴マップの物理的サイズであってもよいし、画像の有効部分のサイズ（例えば、画像の物理的サイズが同様であるが、該画像の一部の画素の画素値をゼロにする等の方式（この方式に限定されない）によって処理されたものとし、これらの処理後の画素以外の画素から構成される部分が有効部分となり、有効部分のサイズが画像の物理的サイズより小さい）等であってもよいが、それらに限定されないことを説明する必要がある。

可能な一実施形態では、第１サンプリング層は、プーリング層であってもよいし、画像に対して様々な操作（例えば、拡大、縮小等）を実行可能な他のネットワーク層であってもよい。つまり、第１サンプリング層は、第１特徴マップを処理して、処理して得られる第２特徴マップに異なるスケールを持たせることができるさえできればよい。それによって本開示の実施例のネットワークモジュールの構造上の柔軟性が高められ、更にネットワークモジュールの構築に寄与する。

図２は本開示の別の実施例に係るネットワークモジュールの構造模式図を示す。

図２に示すように、可能な一実施形態では、第１サンプリング層がプーリング層である場合、プーリング層は、最大プーリング層（ｍａｘｐｏｏｌ）であり得る。即ち、第１サンプリング層は最大プーリング層によって実現されることができる。ここで、第１ネットワーク層は、畳み込み層であってよく、畳み込み層の畳み込みカーネルは、１＊１の大きさ（即ち、１＊１畳み込み層）であってよい。そのため、第１ネットワーク層（例えば、１＊１畳み込み層）によって入力された画像を処理した後、対応する第１特徴マップが得られる。この時に、第１特徴マップは第１スケールを有する。そしてから、第２ネットワーク層中の各ブランチの第１サンプリング層（例えば、最大プーリング層）によって第１スケールを有する第１特徴マップに対してダウンサンプリングを行って（即ち、最大プーリング層によって第１特徴マップに対して最大値プーリング処理を行う）、異なるスケールを有する第２特徴マップを得、それによってネットワークモジュール中で異なるスケールを有する特徴マップを直接作成する目的を達成する。

最大プーリングが特徴マップのサイズを効果的に低減できるため、第１サンプリング層として最大プーリング層を用いて第１特徴マップに対してダウンサンプリングを行うことによって、小さいスケールに向けるブランチの後続の画像処理操作（例えば、畳み込み操作）に対して消費する計算量がより少なく、それによって各ブランチでの計算量を効果的に低減して電力消費を低くした。

可能な一実施形態では、各ブランチは、第１サンプリング層に順にカスケード接続される第１畳み込み層と第２サンプリング層を更に含む。ここで、第１畳み込み層は、第２特徴マップに対して畳み込み操作を行って、第３特徴マップを得るために用いられる。ここで、第１畳み込み層は大きさが異なる畳み込みカーネルを有する畳み込み層（例えば、３＊３畳み込み層、３＊３ｃｏｎｖ）であってよい。また、各ブランチ中の第１畳み込み層の畳み込みカーネルの大きさは、同じであってもよいし、異なっていてもよい。第２サンプリング層は、第３特徴マップのスケールを第１特徴マップのスケールに復元するために用いられる。第２サンプリング層はアップサンプリング（ｕｐｓａｍｐｌｅ）層であってよい。

つまり、各第１サンプリング層が第１特徴マップに対してダウンサンプリングを行って、異なるスケールを有する第２特徴マップを得た後、第１畳み込み層によって異なるスケールの第２特徴マップに対して畳み込み操作を行って、特徴マップの畳み込み処理を実現する。

また、第１サンプリング層による第１特徴マップに対するダウンサンプリング操作によって、得られた第２特徴マップが第１特徴マップと比べてスケールにおいて変わりが生じ、また、各ブランチにおいて、第１畳み込み層によって第２特徴マップに対して畳み込み操作を行って得られた第３特徴マップのスケールが、第２特徴マップのスケールと比べて変わりも生じるので、画像の後続の他の処理を円滑に実行するために、この時に、更に第２サンプリング層によって第３特徴マップに対してアップサンプリング操作を行う必要があり、それによって第３特徴マップのスケールを元のスケール（即ち、第１特徴マップのスケール）に復元する。

それによって、本開示の実施例のネットワークモジュールにおいてアップサンプリングとダウンサンプリング操作によって異なるスケールの特徴マップの作成が実現されたので、マルチスケール特徴を高効率的に抽出することができる。

図３は本開示のまた１つの実施例に係るネットワークモジュールの構造模式図を示す。

図３に示すように、本開示の実施例のネットワークモジュールにおいて、第２ネットワーク層は、元比例ブランチを更に含んでもよい。ここで、元比例ブランチが、上述した複数の並列のブランチと並列関係であり、元比例ブランチが、第１特徴マップのスケールを変えることをしない。ここで、元比例ブランチは、第２畳み込み層を含み、第２畳み込み層が、第１特徴マップに対して畳み込み操作を行って、畳み込み操作で得られた特徴マップデータを第３ネットワーク層に入力するために用いられ、第２畳み込み層で畳み込んで得られた特徴データが第１特徴マップのスケールと同様である。ここで、なお、第２畳み込み層は３＊３畳み込み層（即ち、３＊３ｃｏｎｖ）であってよい。それに対応するように、第３ネットワーク層は、更に、第２ネットワーク層中の複数の並列のブランチで出力した特徴マップデータと元比例ブランチで出力した特徴マップデータを結合するために用いられる。

即ち、第２ネットワーク層に元比例ブランチを設置することによって、元比例ブランチ中の第２畳み込み層で直接第１特徴マップに対して畳み込み操作を行い、特徴マップのスケールを効果的に増加した上で、更に元のスケールの第１特徴マップの処理を保障することができ、それによって処理画像データの完全性と正確性を高め、第１特徴マップ中の一部の特徴の損失を回避した。

また、本開示の実施例のネットワークモジュールはニューラルネットワーク構造中の最小基本単位（ｂｌｏｃｋと略称してよい）としてよい。即ち、上記のいずれか１種のネットワークモジュール（ｂｌｏｃｋ）を繰り返して積み重ねることによって、異なる深度を有するネットワーク構造を構築することができる。ここで、構築するネットワーク構造は、畳み込みニューラルネットワークであってよい。

本開示の別の態様によれば、割り当て方法を更に提供する。本開示の割り当て方法は、画像処理モデルに複数の特徴マップが存在する場合、利用するニューロンを各特徴マップに割り当てるために用いられる。ここで、各特徴マップは異なるスケールを有する。画像処理モデルは、畳み込みニューラルネットワークモデルであってよい。

図４は本開示の実施例に係る割り当て方法のフローチャートを示す。図４に示すように、本開示の割り当て方法は、以下のステップを含む。

ステップＳ１００において、画像処理モデル中の複数の畳み込み層のニューロンの重要性に基づいて、ニューロンを選別して、第１結果を得る。ここで、ここの複数の畳み込み層が画像処理モデルの同一深度にあり（即ち、複数の畳み込み層が画像処理モデルの同一層にある）、また、各畳み込み層がそれぞれ異なるスケールの特徴マップを処理するために用いられる。また、第１結果は複数のニューロンを含む。

ステップＳ２００において、第１結果中の各ニューロンの位置属性に基づいて、各ニューロンに対応する特徴マップのスケールを統計して、割り当て関係を得る。ここで、位置属性は各ニューロンの属する畳み込み層を表す。つまり、位置属性によって、ニューロンがどちらの畳み込み層に属するかを決定する。割り当て関係は、各特徴マップとこの特徴マップが利用するニューロンとの間の対応関係を表す。即ち、割り当て関係に基づいて、各特徴マップがどのニューロンによって処理計算されるかを決定することができる。

ステップＳ３００において、割り当て関係に基づいて、利用するニューロンを各特徴マップに割り当てる。

そのため、以上で開示された割り当て方法は、画像処理モデル中の複数の畳み込み層のニューロンの重要性に基づいて、ニューロンを選別して、更に選別して得られた第１結果中の各ニューロンの位置に基づいて、各ニューロンに対応する特徴マップのスケールを決定する（即ち、各ニューロンによって処理される特徴マップを決定する）ことで、対応の割り当て関係を得る。最後に、決定された割り当て関係に基づいて、各特徴マップとそれが利用するニューロンとの間の割り当てを行って、ニューロン重要性に基づいて各特徴マップにニューロンを割り当てる目的を実現した。このような割り当て方式はデータに依存するもののであり、異なるデータ集合について決定した割り当て関係が異なり、関連技術において人間の経験で設定する方式と比べて、本開示の実施例の割り当て方法は、最終的に各特徴マップに割り当てるニューロンをより精確なものにする。

ここで、本開示の実施例で提供される割り当て方法は、データ処理能力を有するいかなる適切な機器によって実行されてもよく、端末装置とサーバ等を含むが、それらに限定されない。又は、プロセッサによって実行されてもよく、例えば、プロセッサはメモリに記憶された対応のコマンドを呼び出すことで本開示の実施例におけるいずれか１種の割り当て方法を実行する。以下、詳細な説明を省略する。ここで、プロセッサは、汎用プロセッサであってもよく、人工知能プロセッサであってもよい。

また、本開示の実施例の割り当て方法において、画像処理モデルに異なるスケールを有する特徴マップが複数存在すべきである。つまり、画像処理モデルは、第１種のネットワーク構造であってよい。第１種のネットワーク構造とは、異なる深度の特徴マップの間に残差を加えて浅層特徴マップと深層特徴マップを組み合わせることで、マルチスケールの特徴マップを導入するものである。画像処理モデルは、第２種のネットワーク構造であってもよい。第２種のネットワーク構造とは、同一深度で異なる畳み込みカーネルを用いて、マルチスケールの特徴マップを導入するものである。画像処理モデルは、第３種のネットワーク構造であってもよい。第３種のネットワーク構造とは、上記のいずれか一項に記載のネットワークモジュール（ｂｌｏｃｋ）を含むものである（即ち、ネットワークモジュールを繰り返して積み重ねることで構築された所定の深度を有するネットワーク構造）。

可能な一実施形態では、画像処理モデルは上記のいずれか一項に記載のネットワークモジュールを含んでよい。ここで、ネットワークモジュールの数は少なくとも１つである。

そのため、画像処理モデル中の複数の畳み込み層のニューロンの重要性に基づいて、ニューロンを選別するステップの前に、以下のステップを更に含んでもよい。

各ネットワークモジュール中のブランチの数を決定して、決定されたネットワークモジュール中のブランチ数でネットワークモジュールを構築する。更に、予め設定されたネットワークモジュールの数に基づいて、画像処理モデルを構築する。ここで、各ネットワークモデル中のブランチ数は実際に要求される計算量に応じて決定可能である。

画像処理モデルをトレーニングして、画像処理モデル中のｂａｔｃｈｎｏｒｍ層のｓｃａｌｅパラメータを得る。ここで、ｂａｔｃｈｎｏｒｍ層は、正規化処理のために用いられ、ｓｃａｌｅパラメータは、ネットワークモジュールにおける各ブランチ中の畳み込み層のニューロンの重要性を表す。

即ち、本開示の実施例の割り当て方法は、上記のいずれか一項に記載のネットワークモジュールを含む画像処理モデルに利用可能である。画像処理モデルにネットワークモジュールを含む時に、複数の畳み込み層は、ネットワークモジュールにおける第２ネットワーク層の各ブランチ中の第１畳み込み層及び元比例ブランチ中の第２畳み込み層であってよい。

つまり、画像処理モデルに上記のいずれか一項に記載のネットワークモジュールを含む時に、画像処理モデルにおいて同一深度にある複数の畳み込み層は、ネットワークモジュールにおける第２ネットワーク層の各ブランチ中の第１畳み込み層及び／又は第２ネットワーク層の元比例ブランチ中の第２畳み込み層であってよい。

なお、画像処理モデルに上記のいずれか一項に記載のネットワークモジュールを含む時に、ネットワークモジュールの数が少なくとも１つである。ネットワークモジュールの数が複数である時に、ニューロンの割り当ては、各ネットワークモジュール（ｂｌｏｃｋ）の複数の畳み込み層（例えば、第１畳み込み層と第２畳み込み層）中のニューロンに基づいて行われる。更に、ネットワークモジュールの数が複数である時に、複数のネットワークモジュールを順に積み重ねて画像処理モデルを構築してよい。即ち、複数のネットワークモジュールを直列接続するように設置してよく、また、隣接する２つのネットワークモジュールの間にそれぞれ実際の要求に応じて対応するネットワーク層を設置してもよい。ここで具体的に限定されない。

例えば、画像処理モデルに２０のネットワークモジュールを含む場合（即ち、２０のｂｌｏｃｋを積み重ねて構築した所定の深度を有するネットワーク構造の場合）、２０のｂｌｏｃｋにおける第２ネットワーク層の各ブランチ中の第１畳み込み層と元比例ブランチ中の第２畳み込み層のニューロンをそれぞれ選別して割り当ててよい。ここで、２０のｂｌｏｃｋにおける複数の畳み込み層のニューロンの割り当て過程は同時に行ってもよいし、順次行ってもよい。ここで限定されない。

可能な一実施形態では、画像処理モデル中の複数の畳み込み層のニューロンの重要性に基づいて、ニューロンを選別して、第１結果を得るステップは、
画像処理モデルを予めトレーニングして得られたｂａｔｃｈｎｏｒｍ層のｓｃａｌｅパラメータに基づいて、複数の畳み込み層のニューロンを順序付けて、複数の畳み込み層中のニューロンの並び順序を表す第１シーケンスを得るステップと、
予め設定された計算量に基づいて、複数の特徴マップを処理するための予備ニューロン数量を決定するステップと、
決定された予備ニューロン数量に基づいて、第１シーケンスから必要なニューロンを抽出して、第１結果を得るステップと、を含んでよい。

即ち、画像処理モデルを予めトレーニングして学習したｂａｔｃｈｎｏｒｍ層のｓｃａｌｅパラメータを判定基準として、複数の畳み込み層中のニューロン（ここで、複数の畳み込み層中の全てのニューロンであってよい）を順序付けて（ここで、高い順に並べる並び順序であってよい）、対応する第１シーケンスを得る。また、更に予め設定された計算量（即ち、実際に必要とされる計算量）によって複数の特徴マップを処理するのに必要とするニューロンの数（予備ニューロン数量）を決定し、決定された予備ニューロン数量に基づいて、第１シーケンスからニューロンの並び順序によって必要なニューロンを順に抽出する。ここで、抽出される必要なニューロンの数が予備ニューロン数量と一致する。

そのため、学習したｓｃａｌｅパラメータに基づいて複数の畳み込み層のニューロンを選択することで、複数のニューロンが競争的且つ適応的に割り当てられて、ニューロン割り当ての精確性が効果的に高められると共に、ニューロン割り当ての合理性が効果的に高められた。

また、上記のいずれか１種の割り当て方法の実施例では、割り当て関係に基づいて、利用するニューロンを各特徴マップに割り当てる時に、必要とされるニューロンを保留し、必要とされないニューロンを削除する操作を含んでよいことを更に説明する必要がある。

可能な一実施形態として、割り当て関係に基づいて、利用するニューロンを各特徴マップに割り当てた後、
割り当て関係に基づいて、画像処理モデルの第１ネットワーク構造を決定し、第１ネットワーク構造の画像処理モデルをトレーニングするステップを更に含んでもよく、それによって画像処理モデルを最適化する目的を達成して、最終的に得られる画像処理モデルに分類や検出タスクでより高い精度を持たせる。

本開示の実施例の割り当て方法の過程をより明瞭に説明するために、以下、画像処理モデルに１つのネットワークモジュールを含み、且つこのネットワークモジュールが図３に示すネットワーク構造であることを例として、より明瞭で詳細に説明する。

図３に示すように、図３に示すネットワークモジュールの第２ネットワーク層は、１つの元比例ブランチと２つのブランチ（第１ブランチと第２ブランチ）を含む。ここで、元比例ブランチ、第１ブランチ及び第２ブランチは全て並列のものとして設置される。元比例ブランチは１つの３＊３畳み込み層（即ち、第２畳み込み層、３＊３ｃｏｎｖ）を含み、第１ブランチと第２ブランチのそれぞれは順にカスケード接続される第１サンプリング層（最大プーリング層、ｍａｘｐｏｏｌ）、第１畳み込み層（３＊３ｃｏｎｖ）及び第２サンプリング層（ｕｐｓａｍｐｌｅ）を含む。この画像処理モデルに対してニューロンを割り当てる時に、主にそれに含まれるネットワークモジュール中の２つの第１畳み込み層と１つの第２畳み込み層のニューロンを割り当てる。

ここで、元比例ブランチ中の第２畳み込み層のニューロンの数が１０であり（それぞれがニューロン１、ニューロン２、ニューロン３……ニューロン１０である）、第１ブランチ中の第１畳み込み層のニューロンの数も１０であり（それぞれがニューロン１１、ニューロン１２、ニューロン１３……ニューロン２０である）、第２ブランチ中の第１畳み込み層のニューロンの数が同様に１０であってよい（それぞれがニューロン２１、ニューロン２２、ニューロン２３……ニューロン３０である）と考えられる。

また、第２ネットワーク層のブランチ数量が３つ（元比例ブランチ、第１ブランチ及び第２ブランチ）であるので、それらによって作成した特徴マップの数も３枚になる。元比例ブランチ中の特徴マップのスケールが元のスケールであり、第１ブランチで作成した特徴マップのスケールが第１スケールであり、第２ブランチで作成した特徴マップのスケールが第２スケールである。

この画像処理モデルをトレーニングすることでｂａｔｃｈｎｏｒｍ層のｓｃａｌｅパラメータを学習した後、ｓｃａｌｅパラメータに基づいてこれらの３０のニューロンを順序付けて、ニューロンシーケンス（即ち、第１シーケンス）を得る。ここで、得られた第１シーケンスはニューロン１、ニューロン２、ニューロン３、ニューロン４、……、ニューロン２８、ニューロン２９、ニューロン３０である。

更に、予め設定された計算量に基づいて、本実施例における画像処理モデルで上記の３種の異なるスケールの特徴マップを処理することに必要なニューロン数（即ち、予備ニューロン数量）が１５であると決定する。従って、この時に、決定された予備ニューロン数量に基づいて、第１シーケンスからニューロンの並び順序よって必要なニューロン（それぞれがニューロン１、ニューロン２、ニューロン３、ニューロン４、……、ニューロン１４、ニューロン１５である）を順に抽出して、第１結果を得るようにしてよい。

第１結果中の各ニューロンの位置属性に基づいて、各ニューロンに対応する特徴マップのスケールを統計して、割り当て関係を得る。即ち、ニューロン１、ニューロン２、ニューロン３、ニューロン４、……、ニューロン１４、ニューロン１５のそれぞれの位置によって、各ニューロンに対応する特徴マップのスケールを決定する。つまり、各ニューロンの位置属性に基づいてどちらのブランチに属するかを決定する。ここで、ニューロン１～ニューロン１０が元比例ブランチに属するものであり、こられの１０のニューロンに対応する特徴マップのスケールが元のスケールであり、ニューロン１０～ニューロン１５が第１ブランチに属するものであり、こられの５のニューロンに対応する特徴マップのスケールが第１スケールであると決定してよい。従って、対応する割り当て関係（即ち、ニューロン１～ニューロン１５のそれぞれに対応する特徴マップのスケール）が得られる。

割り当て関係が決定された後、割り当て関係に基づいて各特徴マップが利用するニューロンを割り当てることが可能になる。即ち、ニューロン１～ニューロン１５を保留し、ニューロン２０～ニューロン３０を含む第２ブランチを削除する。つまり、第２スケールの特徴マップを作成する第２ブランチを捨てる。それによって、この実施例におけるネットワークモジュール中のニューロンの割り当てが完了される。

以上の通り、本開示の実施例の割り当て方法では、画像処理モデル内の同一深度の複数の畳み込み層のニューロンの重要性に基づいて、異なるスケールを有する各々の特徴マップにニューロンを割り当てることによって、複数のニューロンが競争的且つ適応的に割り当てられて、割り当て結果の精確度と合理性が効果的に高められると共に、画像処理モデルのネットワーク構造が最適化され、そのように、最適化された画像処理モデルに対して再度トレーニングして分類や検出タスクに適用する時に、分類や検出の精度を高めることができる。

本開示に記載されている上記各方法の実施例は、原理と論理に違反しない限り、相互に組み合わせて、組合せ後の実施例を形成することができることが理解され、ページ数に限りがあるので、本開示では詳細な説明を省略する。

具体的な実施形態の上記方法において、各ステップの記述順序は厳しい実行順序であるというわけではなく、実施プロセスの何の制限にもならなく、各ステップの具体的な実行順序はその機能と可能な内在的論理に依存することが当業者に理解される。

また、本開示は、割り当て装置、電子機器、コンピュータ読取可能記憶媒体及びプログラムを更に提供し、それらはいずれも本開示で提供されるいずれか１種の割り当て方法を実現することに利用可能であり、対応する技術的解決手段及び説明については方法部分の対応の記載を参照してもよく、ここで詳細な説明を省略する。

図５は本開示の実施例に係る割り当て装置１００のブロック図を示し、図５に示すように、前記割り当て装置１００は、画像処理モデルに複数の特徴マップが存在する場合、各前記特徴マップが利用するニューロンを各前記特徴マップに割り当てるために用いられ、前記画像処理モデルが、少なくとも一つの上記のいずれか一項に記載のネットワークモジュールを含み、前記割り当て装置１００は、
前記画像処理モデル中の複数の畳み込み層のニューロンの重要性に基づいて、前記ニューロンを選別して第１結果を得るための選別モジュール１１０であって、複数の畳み込み層が前記画像処理モデルの同一深度にあり、且つ各々の畳み込み層がそれぞれ異なるスケールの前記特徴マップを処理するために用いられ、前記第１結果が複数のニューロンを含む選別モジュール１１０と、
前記第１結果中の各ニューロンの位置属性に基づいて、各前記ニューロンに対応する前記特徴マップのスケールを統計して、割り当て関係を得るための統計モジュール１２０であって、前記位置属性が、各ニューロンの属する畳み込み層を表し、前記割り当て関係が、各前記特徴マップと前記特徴マップが利用するニューロンとの間の対応関係を表す統計モジュール１２０と、
前記割り当て関係に基づいて、利用するニューロンを各前記特徴マップに割り当てるための割り当てモジュール１３０と、を含む。

可能な一実施形態では、
前記選別モジュールが前記画像処理モデル中の複数の畳み込み層のニューロンの重要性に基づいて、前記ニューロンを選別するステップの前に、各ネットワークモジュール中のブランチの数を決定して、予め設定された前記ネットワークモジュールの数に基づいて、前記画像処理モデルを構築するためのモデル構築モジュールと、
前記画像処理モデルをトレーニングして、前記画像処理モデル中のｂａｔｃｈｎｏｒｍ層のｓｃａｌｅパラメータを得るための第１トレーニングモジュールであって、前記ｓｃａｌｅパラメータが、前記ネットワークモジュールにおける各ブランチ中の畳み込み層のニューロンの重要性を表す第１トレーニングモジュールと、を更に含む。

可能な一実施形態では、前記選別モジュール１１０は、
前記画像処理モデルを予めトレーニングして得られたｂａｔｃｈｎｏｒｍ層のｓｃａｌｅパラメータに基づいて、複数の前記畳み込み層のニューロンを順序付けて、複数の前記畳み込み層中のニューロンの並び順序を表す第１シーケンスを得るための順序付けサブモジュールと、
予め設定された計算量に基づいて、複数の前記特徴マップを処理するための予備ニューロン数量を決定するためのニューロン数決定サブモジュールと、
決定された前記予備ニューロン数量に基づいて、前記第１シーケンスから必要なニューロンを順に抽出して、前記第１結果を得るためのニューロン抽出サブモジュールと、を含む。

いくつかの実施例では、本開示の実施例で提供された装置に備えた機能又はモジュールは、上記方法実施例に記載の方法を実行するために用いられ、その具体的な実施形態については上記方法実施例の説明を参照してもよく、簡単化するために、ここで重複説明は割愛する。

本開示の実施例は、コンピュータプログラムコマンドが記憶されているコンピュータ読取可能記憶媒体であって、前記コンピュータプログラムコマンドがプロセッサにより実行される時に上記のいずれか一項に記載の割り当て方法を実現するコンピュータ読取可能記憶媒体を更に提供する。コンピュータ読取可能記憶媒体は、非揮発性コンピュータ読取可能記憶媒体であっても、揮発性コンピュータ読取可能記憶媒体であってもよい。

本開示の実施例は、上記のいずれか一項に記載の割り当て方法を実行するように構成されるプロセッサと、プロセッサ実行可能コマンドを記憶するためのメモリと、を含む電子機器を更に提供する。

本開示の実施例は、コンピュータ読取可能コードを含み、前記コンピュータ読取可能コードが電子機器中で実行される時に、前記電子機器中のプロセッサが上記方法を実行するコンピュータプログラムを更に提供する。

電子機器は、端末、サーバ又は他の形態のデバイスとして提供されてよい。

図６は例示的な一実施例に基づいて示した電子機器８００のブロック図である。例えば、装置８００は携帯電話、コンピュータ、デジタル放送端末、メッセージ送受信装置、ゲームコンソール、タブレット装置、医療機器、フィットネス器具、パーソナル・デジタル・アシスタントなどの端末であってよい。

図６を参照すると、電子機器８００は処理コンポーネント８０２、メモリ８０４、電源コンポーネント８０６、マルチメディアコンポーネント８０８、オーディオコンポーネント８１０、入力／出力（Ｉ／Ｏ）インタフェース８１２、センサコンポーネント８１４、および通信コンポーネント８１６の一つ以上を含むことができる。

処理コンポーネント８０２は通常、電子機器８００の全体的な動作、例えば表示、電話の呼び出し、データ通信、カメラ動作および記録動作に関連する動作を制御する。処理コンポーネント８０２は、上記方法の全てまたは一部のステップを完了するために、一つ以上のプロセッサ８２０を含んで命令を実行することができる。また、処理コンポーネント８０２は、他のコンポーネントとの対話のために、一つ以上のモジュールを含むことができる。例えば、処理コンポーネント８０２は、マルチメディアコンポーネント８０８との対話のために、マルチメディアモジュールを含むことができる。

メモリ８０４は電子機器８００での動作をサポートするために様々なタイプのデータを記憶するように構成される。これらのデータの例は電子機器８００において運用するためのあらゆるアプリケーションプログラムまたは方法の命令、連絡先データ、電話帳データ、メッセージ、ピクチャー、ビデオなどを含む。メモリ８０４は、例えば静的ランダムアクセスメモリ（ＳＲＡＭ）、電気的消去可能プログラマブル読み取り専用メモリ（ＥＥＰＲＯＭ）、消去可能なプログラマブル読み取り専用メモリ（ＥＰＲＯＭ）、プログラマブル読み取り専用メモリ（ＰＲＯＭ）、読み取り専用メモリ（ＲＯＭ）、磁気メモリ、フラッシュメモリ、磁気ディスクまたは光ディスクなどの様々なタイプの揮発性または非揮発性記憶機器またはそれらの組み合わせによって実現できる。

電源コンポーネント８０６は電子機器８００の各コンポーネントに電力を供給する。電源コンポーネント８０６は電源管理システム、一つ以上の電源、および電子機器８００のための電力生成、管理および配分に関連する他のコンポーネントを含むことができる。

マルチメディアコンポーネント８０８は前記電子機器８００とユーザとの間で出力インタフェースを提供する画面を含む。いくつかの実施例では、画面は液晶ディスプレイ（ＬＣＤ）およびタッチパネル（ＴＰ）を含むことができる。画面がタッチパネルを含む場合、ユーザからの入力信号を受信するために、タッチ画面として実現してもよい。タッチパネルは、タッチ、スライドおよびタッチパネルでのジェスチャを検知するために、一つ以上のタッチセンサを含む。前記タッチセンサはタッチまたはスライド動きの境界を検知するのみならず、前記タッチまたはスライド操作に関連する持続時間および圧力を検出することもできる。いくつかの実施例では、マルチメディアコンポーネント８０８は前面カメラおよび／または後面カメラを含む。電子機器８００が動作モード、例えば撮影モードまたは撮像モードになる場合、前面カメラおよび／または後面カメラは外部のマルチメディアデータを受信することができる。各前面カメラおよび後面カメラは固定された光学レンズ系または焦点距離および光学ズーム能力を有するものであってもよい。

オーディオコンポーネント８１０はオーディオ信号を出力および／または入力するように構成される。例えば、オーディオコンポーネント８１０は、電子機器８００が動作モード、例えば呼び出しモード、記録モードおよび音声認識モードになる場合、外部のオーディオ信号を受信するように構成されたマイク（ＭＩＣ）を含む。受信されたオーディオ信号はさらにメモリ８０４に記憶されるか、または通信コンポーネント８１６によって送信されてもよい。いくつかの実施例では、オーディオコンポーネント８１０はさらに、オーディオ信号を出力するためのスピーカーを含む。

Ｉ／Ｏインタフェース８１２は処理コンポーネント８０２と周辺インタフェースモジュールとの間でインタフェースを提供し、上記周辺インタフェースモジュールはキーボード、クリックホイール、ボタンなどであってもよい。これらのボタンはホームボタン、音量ボタン、スタートボタンおよびロックボタンを含むことができるが、これらに限定されない。

センサコンポーネント８１４は電子機器８００に各面での状態評価を提供するための一つ以上のセンサを含む。例えば、センサコンポーネント８１４は電子機器８００のオン／オフ状態、コンポーネントの相対的位置決め、例えば前記コンポーネントが電子機器８００の表示装置およびキーパッドであることを検出でき、センサコンポーネント８１４はさらに、電子機器８００または電子機器８００のあるコンポーネントの位置の変化、ユーザと電子機器８００との接触の有無、電子機器８００の方位または加減速および電子機器８００の温度変化を検出できる。センサコンポーネント８１４は、いかなる物理的接触もない場合に近傍の物体の存在を検出するために用いられるように構成された近接センサを含む。センサコンポーネント８１４はさらに、ＣＭＯＳまたはＣＣＤイメージセンサのような、イメージングアプリケーションにおいて使用するための光センサを含むことができる。いくつかの実施例では、該センサコンポーネント８１４はさらに、加速度センサ、ジャイロスコープセンサ、磁気センサ、圧力センサまたは温度センサを含むことができる。

通信コンポーネント８１６は電子機器８００と他の機器との間の有線または無線通信を実現するように配置される。電子機器８００は通信規格に基づく無線ネットワーク、例えばＷｉＦｉ、２Ｇまたは３Ｇ、またはそれらの組み合わせにアクセスできる。一例示的実施例では、通信コンポーネント８１６は放送チャネルによって外部の放送管理システムの放送信号または放送関連情報を受信する。一例示的実施例では、前記通信コンポーネント８１６はさらに、近距離通信を促進させるために、近距離無線通信（ＮＦＣ）モジュールを含む。例えば、ＮＦＣモジュールでは無線周波数識別（ＲＦＩＤ）技術、赤外線データ協会（ＩｒＤＡ）技術、超広帯域（ＵＷＢ）技術、ブルートゥース（ＢＴ）技術および他の技術によって実現できる。

例示的な実施例では、電子機器８００は一つ以上の特定用途向け集積回路（ＡＳＩＣ）、デジタル信号プロセッサ（ＤＳＰ）、デジタル信号処理デバイス（ＤＳＰＤ）、プログラマブルロジックデバイス（ＰＬＤ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、コントローラ、マイクロコントローラ、マイクロプロセッサまたは他の電子要素によって実現し、上記方法を実行するために用いることができる。

例示的な実施例では、さらに、非揮発性コンピュータ読み取り可能記憶媒体、例えばコンピュータプログラム命令を含むメモリ８０４が提供され、上記コンピュータプログラム命令は電子機器８００のプロセッサ８２０によって実行して上記方法を完了することができる。

図７は例示的な一実施例に基づいて示した電子機器１９００のブロック図である。例えば、電子機器１９００はサーバとして提供できる。図７を参照すると、電子機器１９００は、さらに一つ以上のプロセッサを含む処理コンポーネント１９２２、および、処理コンポーネント１９２２によって実行可能な命令、例えばアプリケーションプログラムを記憶するための、メモリ１９３２を代表とするメモリ資源を含む。メモリ１９３２に記憶されたアプリケーションプログラムはそれぞれが１グループの命令に対応する一つ以上のモジュールを含むことができる。また、処理コンポーネント１９２２は命令を実行し、それによって上記方法を実行するように構成される。

電子機器１９００はさらに、電子機器１９００の電源管理を実行するように構成された電源コンポーネント１９２６、電子機器１９００をネットワークにアクセスするように構成された有線または無線ネットワークインタフェース１９５０、および入出力（Ｉ／Ｏ）インタフェース１９５８を含むことができる。電子機器１９００はメモリ１９３２に記憶されたオペレーティングシステム、例えばＷｉｎｄｏｗｓＳｅｒｖｅｒＴＭ、ＭａｃＯＳＸＴＭ、ＵｎｉｘＴＭ、ＬｉｎｕｘＴＭ、ＦｒｅｅＢＳＤＴＭまたは類似するものに基づいて動作できる。

例示的な実施例では、さらに、非揮発性コンピュータ読み取り可能記憶媒体、例えばコンピュータプログラム命令を含むメモリ１９３２が提供され、上記コンピュータプログラム命令は電子機器１９００の処理コンポーネント１９２２によって実行して上記方法を完了することができる。

本開示はシステム、方法および／またはコンピュータプログラム製品であってもよい。コンピュータプログラム製品はプロセッサに本開示の各態様を実現させるためのコンピュータ読み取り可能プログラム命令がロードされているコンピュータ読み取り可能記憶媒体を含むことができる。

コンピュータ読み取り可能記憶媒体は命令実行機器により使用される命令を保存および記憶可能な有形機器であってもよい。コンピュータ読み取り可能記憶媒体は例えば、電気記憶装置、磁気記憶装置、光記憶装置、電磁記憶装置、半導体記憶装置または上記の任意の適当な組み合わせであってもよいが、これらに限定されない。コンピュータ読み取り可能記憶媒体のさらに具体的な例（非包括的リスト）としては、携帯型コンピュータディスク、ハードディスク、ランダムアクセスメモリ（ＲＡＭ）、読み取り専用メモリ（ＲＯＭ）、消去可能プログラマブル読み取り専用メモリ（ＥＰＲＯＭまたはフラッシュメモリ）、静的ランダムアクセスメモリ（ＳＲＡＭ）、携帯型コンパクトディスク読み取り専用メモリ（ＣＤ－ＲＯＭ）、デジタル多用途ディスク（ＤＶＤ）、メモリスティック、フロッピーディスク、機械的符号化装置、例えば命令が記憶されているせん孔カードまたはスロット内突起構造、および上記の任意の適当な組み合わせを含む。ここで使用されるコンピュータ読み取り可能記憶媒体は瞬時信号自体、例えば無線電波または他の自由に伝播される電磁波、導波路または他の伝送媒体を経由して伝播される電磁波（例えば、光ファイバーケーブルを通過するパルス光）、または電線を経由して伝送される電気信号と解釈されるものではない。

ここで記述したコンピュータ読み取り可能プログラム命令はコンピュータ読み取り可能記憶媒体から各計算／処理機器にダウンロードされてもよいし、またはネットワーク、例えばインターネット、ローカルエリアネットワーク、広域ネットワークおよび／または無線ネットワークによって外部のコンピュータまたは外部記憶装置にダウンロードされてもよい。ネットワークは銅伝送ケーブル、光ファイバー伝送、無線伝送、ルーター、ファイアウォール、交換機、ゲートウェイコンピュータおよび／またはエッジサーバを含むことができる。各計算／処理機器内のネットワークアダプタカードまたはネットワークインタフェースはネットワークからコンピュータ読み取り可能プログラム命令を受信し、該コンピュータ読み取り可能プログラム命令を転送し、各計算／処理機器内のコンピュータ読み取り可能記憶媒体に記憶する。

本開示の動作を実行するためのコンピュータプログラム命令はアセンブラ命令、命令セットアーキテクチャ（ＩＳＡ）命令、機械語命令、機械依存命令、マイクロコード、ファームウェア命令、状態設定データ、またはＳｍａｌｌｔａｌｋ、Ｃ＋＋などのオブジェクト指向プログラミング言語、および「Ｃ」言語または類似するプログラミング言語などの一般的な手続き型プログラミング言語を含む一つ以上のプログラミング言語の任意の組み合わせで書かれたソースコードまたは目標コードであってもよい。コンピュータ読み取り可能プログラム命令は、完全にユーザのコンピュータにおいて実行されてもよく、部分的にユーザのコンピュータにおいて実行されてもよく、スタンドアロンソフトウェアパッケージとして実行されてもよく、部分的にユーザのコンピュータにおいてかつ部分的にリモートコンピュータにおいて実行されてもよく、または完全にリモートコンピュータもしくはサーバにおいて実行されてもよい。リモートコンピュータに関与する場合、リモートコンピュータは、ローカルエリアネットワーク（ＬＡＮ）または広域ネットワーク（ＷＡＮ）を含む任意の種類のネットワークを経由してユーザのコンピュータに接続されてもよく、または、（例えばインターネットサービスプロバイダを利用してインターネットを経由して）外部コンピュータに接続されてもよい。いくつかの実施例では、コンピュータ読み取り可能プログラム命令の状態情報を利用して、例えばプログラマブル論理回路、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）またはプログラマブル論理アレイ（ＰＬＡ）などの電子回路をパーソナライズすることで、該電子回路はコンピュータ読み取り可能プログラム命令を実行し、それにより本開示の各態様を実現できるようになる。

なお、ここで本開示の実施例に係る方法、装置（システム）およびコンピュータプログラム製品のフローチャートおよび／またはブロック図を参照しながら本開示の各態様を説明しが、フローチャートおよび／またはブロック図の各ブロックおよびフローチャートおよび／またはブロック図の各ブロックの組み合わせは、いずれもコンピュータ読み取り可能プログラム命令によって実現できることを理解すべきである。

これらのコンピュータ読み取り可能プログラム命令は、機械を製造するために、共通コンピュータ、専用コンピュータまたは他のプログラマブルデータ処理装置のプロセッサへ提供されてもよく、それにより、これらの命令はコンピュータまたは他のプログラマブルデータ処理装置のプロセッサによって実行され、フローチャートおよび／またはブロック図の一つ以上のブロックにおいて指定された機能／動作を実現する手段を創出する。また、これらのコンピュータ読み取り可能プログラム命令は、コンピュータ読み取り可能記憶媒体に記憶し、それによってコンピュータ、プログラマブルデータ処理装置および／または他の機器を特定の方式で動作させるようにしてもよく、それにより、中に保存された命令を有するコンピュータ読み取り可能記憶媒体は、フローチャートおよび／またはブロック図の一つ以上のブロックにおいて指定された機能／動作の各態様を実現する命令を含む製品を備える。

コンピュータ読み取り可能プログラムはコンピュータ、他のプログラマブルデータ処理装置、または他の機器にロードすることにより、コンピュータ実施プロセスを生成するように、コンピュータ、他のプログラマブルデータ処理装置または他の機器において一連の動作ステップを実行させるようにしてもよく、それにより、コンピュータ、他のプログラマブルデータ処理装置、または他の機器において実行される命令はフローチャートおよび／またはブロック図の一つ以上のブロックにおいて指定された機能／動作を実現する。

図面のうちフローチャートおよびブロック図は本開示の複数の実施例に係るシステム、方法およびコンピュータプログラム製品の実現可能なシステムアーキテクチャ、機能および動作を示す。この点では、フローチャートまたはブロック図における各ブロックは一つのモジュール、プログラムセグメントまたは命令の一部分を代表することができ、前記モジュール、プログラムセグメントまたは命令の一部分は指定された論理機能を実現するための一つ以上の実行可能命令を含む。いくつかの置換としての実現形態では、ブロックに表記される機能は図面に付したものと異なる順序で実現してもよい。例えば、二つの連続的なブロックは実質的に同時に実行してもよく、また、係る機能によって、それらは逆な順序で実行してもよい場合がある。なお、ブロック図および／またはフローチャートにおける各ブロック、およびブロック図および／またはフローチャートにおけるブロックの組み合わせは、指定される機能または動作を実行するハードウェアに基づく専用システムによって実現してもよいし、または専用ハードウェアとコンピュータ命令との組み合わせによって実現してもよいことに注意すべきである。

論理に違反しない限り、本開示のそれぞれの実施例は相互に組み合わせることができ、異なる実施例において重点として説明されるものが異なって、重点として説明されていない部分については他の実施例の記載を参照してもよい。

以上、本開示の各実施例を記述したが、上記説明は例示的なものに過ぎず、網羅的なものではなく、かつ披露された各実施例に限定されるものでもない。当業者にとって、説明された各実施例の範囲および精神から逸脱することなく、様々な修正および変更が自明である。本明細書に選ばれた用語は、各実施例の原理、実際の適用または市場における技術への改善を好適に解釈するか、または他の当業者に本文に披露された各実施例を理解させるためのものである。

Claims

割り当て方法であって、
画像処理モデルに複数の特徴マップが存在する場合、各前記特徴マップが利用するニューロンを各前記特徴マップに割り当てるために用いられ、前記画像処理モデルが、少なくとも一つのネットワークモジュールを含み、前記割り当て方法は、
前記画像処理モデル中の複数の畳み込み層のニューロンの重要性に基づいて、前記ニューロンを選別して第１結果を得るステップであって、前記畳み込み層のニューロンの重要性が、前記画像処理モデル中のｂａｔｃｈｎｏｒｍ層のｓｃａｌｅパラメータによって表され、複数の畳み込み層が前記画像処理モデルの同一深度にあり、且つ各々の畳み込み層がそれぞれ異なるスケールの前記特徴マップを処理するために用いられ、前記第１結果が複数のニューロンを含むステップと、
前記第１結果中の各ニューロンの位置属性に基づいて、各前記ニューロンに対応する前記特徴マップのスケールを決定して、割り当て関係を得るステップであって、前記位置属性が、各ニューロンの属する畳み込み層の位置を表し、前記割り当て関係が、各前記特徴マップと前記特徴マップが利用するニューロンとの間の対応関係を表すステップと、
前記割り当て関係に基づいて、利用するニューロンを各前記特徴マップに割り当てるステップと、を含み、
前記ネットワークモジュールは、
順にカスケード接続される第１ネットワーク層、第２ネットワーク層及び第３ネットワーク層を含み、
前記第１ネットワーク層は、入力された画像を処理して第１特徴マップを得るために用いられ、
前記第２ネットワーク層は、複数の並列のブランチを含み、
各ブランチが第１サンプリング層を含み、
前記第１サンプリング層が、前記第１特徴マップに対してダウンサンプリングを行って第２特徴マップを得るために用いられ、
異なる前記ブランチ中の前記第１サンプリング層で得られた前記第２特徴マップのスケールが異なり、
前記第３ネットワーク層は、各前記ブランチが出力した特徴マップデータを結合するために用いられることを特徴とする、
割り当て方法。
前記画像処理モデル中の複数の畳み込み層のニューロンの重要性に基づいて、前記ニューロンを選別して、第１結果を得るステップの前に、
各ネットワークモジュール中のブランチの数を決定して、予め設定された前記ネットワークモジュールの数に基づいて、前記画像処理モデルを構築するステップと、
前記画像処理モデルをトレーニングして、前記画像処理モデル中のｂａｔｃｈｎｏｒｍ層のｓｃａｌｅパラメータを得るステップと、を更に含むことを特徴とする請求項１に記載の方法。
前記画像処理モデル中の複数の畳み込み層のニューロンの重要性に基づいて、前記ニューロンを選別して、第１結果を得る前記ステップは、
前記画像処理モデルを予めトレーニングして得られたｂａｔｃｈｎｏｒｍ層のｓｃａｌｅパラメータの値に基づいて、前記ｓｃａｌｅパラメータの対応する複数の前記畳み込み層のニューロンを順序付けて、複数の前記畳み込み層中のニューロンの並び順序を表す第１シーケンスを得るステップと、
予め設定された計算量に基づいて、複数の前記特徴マップを処理するための予備ニューロン数量を決定するステップと、
決定された前記予備ニューロン数量に基づいて、前記第１シーケンスから必要なニューロンを順に抽出して、前記第１結果を得るステップと、を含むことを特徴とする請求項１又は２に記載の方法。
前記割り当て関係に基づいて、利用するニューロンを各前記特徴マップに割り当てるステップの後に、
前記割り当て関係に基づいて、前記画像処理モデルの第１ネットワーク構造を決定するステップと、
前記第１ネットワーク構造の画像処理モデルをトレーニングするステップと、を更に含むことを特徴とする請求項３に記載の方法。
割り当て装置であって、
画像処理モデルに複数の特徴マップが存在する場合、各前記特徴マップが利用するニューロンを各前記特徴マップに割り当てるために用いられ、前記画像処理モデルが、少なくとも一つのネットワークモジュールを含み、前記割り当て装置は、
前記画像処理モデル中の複数の畳み込み層のニューロンの重要性に基づいて、前記ニューロンを選別して第１結果を得るための選別モジュールであって、前記畳み込み層のニューロンの重要性が、前記画像処理モデル中のｂａｔｃｈｎｏｒｍ層のｓｃａｌｅパラメータによって表され、複数の畳み込み層が前記画像処理モデルの同一深度にあり、且つ各々の畳み込み層がそれぞれ異なるスケールの前記特徴マップを処理するために用いられ、前記第１結果が複数のニューロンを含む選別モジュールと、
前記第１結果中の各ニューロンの位置属性に基づいて、各前記ニューロンに対応する前記特徴マップのスケールを決定して、割り当て関係を得るための統計モジュールであって、前記位置属性が、各ニューロンの属する畳み込み層の位置を表し、前記割り当て関係が、各前記特徴マップと前記特徴マップが利用するニューロンとの間の対応関係を表す統計モジュールと、
前記割り当て関係に基づいて、利用するニューロンを各前記特徴マップに割り当てるための割り当てモジュールと、を含み、
前記ネットワークモジュールは、
順にカスケード接続される第１ネットワーク層、第２ネットワーク層及び第３ネットワーク層を含み、
前記第１ネットワーク層は、入力された画像を処理して第１特徴マップを得るために用いられ、
前記第２ネットワーク層は、複数の並列のブランチを含み、
各ブランチが第１サンプリング層を含み、
前記第１サンプリング層が、前記第１特徴マップに対してダウンサンプリングを行って第２特徴マップを得るために用いられ、
異なる前記ブランチ中の前記第１サンプリング層で得られた前記第２特徴マップのスケールが異なり、
前記第３ネットワーク層は、各前記ブランチが出力した特徴マップデータを結合するために用いられることを特徴とする、
割り当て装置。
前記選別モジュールが前記画像処理モデル中の複数の畳み込み層のニューロンの重要性に基づいて、前記ニューロンを選別する前に、各ネットワークモジュール中のブランチの数を決定して、予め設定された前記ネットワークモジュールの数に基づいて、前記画像処理モデルを構築するためのモデル構築モジュールと、
前記画像処理モデルをトレーニングして、前記画像処理モデル中のｂａｔｃｈｎｏｒｍ層のｓｃａｌｅパラメータを得るための第１トレーニングモジュールと、を更に含むことを特徴とする請求項５に記載の装置。
前記選別モジュールは、
前記画像処理モデルを予めトレーニングして得られたｂａｔｃｈｎｏｒｍ層のｓｃａｌｅパラメータの値に基づいて、前記ｓｃａｌｅパラメータの対応する複数の前記畳み込み層のニューロンを順序付けて、複数の前記畳み込み層中のニューロンの並び順序を表す第１シーケンスを得るための順序付けサブモジュールと、
予め設定された計算量に基づいて、複数の前記特徴マップを処理するための予備ニューロン数量を決定するためのニューロン数決定サブモジュールと、
決定された前記予備ニューロン数量に基づいて、前記第１シーケンスから必要なニューロンを順に抽出して、前記第１結果を得るためのニューロン抽出サブモジュールと、を含むことを特徴とする請求項５又は６に記載の装置。
前記割り当てモジュールが前記割り当て関係に基づいて、利用するニューロンを各前記特徴マップに割り当てた後、前記割り当て関係に基づいて、前記画像処理モデルの第１ネットワーク構造を決定するためのネットワーク構造決定モジュールと、
前記第１ネットワーク構造の画像処理モデルをトレーニングするための第２トレーニングモジュールと、を更に含むことを特徴とする請求項７に記載の装置。
電子機器であって、
請求項１－４のいずれか一項に記載の方法を実行するように構成されるプロセッサと、
プロセッサ実行可能コマンドを記憶するためのメモリと、を含むことを特徴とする電子機器。
コンピュータ読取可能記憶媒体であって、
コンピュータプログラムコマンドが記憶され、前記コンピュータプログラムコマンドがプロセッサにより実行される時に、前記プロセッサに、請求項１－４のいずれか一項に記載の方法を実現させることを特徴とするコンピュータ読取可能記憶媒体。
コンピュータプログラムであって、
コンピュータ読取可能コードを含み、前記コンピュータ読取可能コードが電子機器中で実行される時に、前記電子機器中のプロセッサに、請求項１－４のいずれか一項に記載の方法を実現させることを特徴とするコンピュータプログラム。