JP7076648B2 - 画像処理方法及び装置、コンピュータ機器並びにコンピュータ記憶媒体 - Google Patents
画像処理方法及び装置、コンピュータ機器並びにコンピュータ記憶媒体 Download PDFInfo
- Publication number
- JP7076648B2 JP7076648B2 JP2021537467A JP2021537467A JP7076648B2 JP 7076648 B2 JP7076648 B2 JP 7076648B2 JP 2021537467 A JP2021537467 A JP 2021537467A JP 2021537467 A JP2021537467 A JP 2021537467A JP 7076648 B2 JP7076648 B2 JP 7076648B2
- Authority
- JP
- Japan
- Prior art keywords
- vector
- feature map
- normalization
- hyperparameter
- preset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims description 24
- 239000013598 vector Substances 0.000 claims description 529
- 238000010606 normalization Methods 0.000 claims description 259
- 238000000034 method Methods 0.000 claims description 114
- 238000004364 calculation method Methods 0.000 claims description 32
- 238000012545 processing Methods 0.000 claims description 32
- 230000008569 process Effects 0.000 claims description 29
- 238000013528 artificial neural network Methods 0.000 claims description 25
- 238000000605 extraction Methods 0.000 claims description 12
- 239000006185 dispersion Substances 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 4
- 230000006870 function Effects 0.000 description 51
- 238000010586 diagram Methods 0.000 description 15
- 238000012549 training Methods 0.000 description 14
- 238000004891 communication Methods 0.000 description 10
- 230000003044 adaptive effect Effects 0.000 description 9
- 230000003287 optical effect Effects 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 241000473391 Archosargus rhomboidalis Species 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000011425 standardization method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/32—Normalisation of the pattern dimensions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/449—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
- G06V10/451—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
- G06V10/454—Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02B—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO BUILDINGS, e.g. HOUSING, HOUSE APPLIANCES OR RELATED END-USER APPLICATIONS
- Y02B10/00—Integration of renewable energy sources in buildings
- Y02B10/40—Geothermal heat-pumps
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Multimedia (AREA)
- Biophysics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Biodiversity & Conservation Biology (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本願は、2019年1月29日に提出された出願番号201910087398.Xの中国特許出願に基づく優先権を主張し、該中国特許出願の全内容が参照として本願に組み込まれる。
処理されるべき画像の第1特徴マップを取得することと、
前記第1特徴マップの最終重みベクトルを決定することと、
前記最終重みベクトルに基づいて、予め設定された正規化集合から、前記第1特徴マップに対応するターゲット正規化方式を決定することと、
前記ターゲット正規化方式を用いて、前記第1特徴マップに対して正規化処理を行い、第2特徴マップを得ることと、を含む。
前記ニューラルネットワークにおける畳み込み層を利用して、前記処理されるべき画像に対して特徴抽出を行い、前記第1特徴マップを得ることを含み、
対応して、前記予め設定されたパラメータ集合は、第1ハイパーパラメータ、第2ハイパーパラメータ及び学習パラメータを含み、第1特徴マップの最終重みベクトルを決定することは、
前記予め設定されたパラメータ集合における第1ハイパーパラメータ、第2ハイパーパラメータ及び学習パラメータに基づいて、前記第1特徴マップの最終重みベクトルを算出することを含む。
前記第1ハイパーパラメータ及び前記第2ハイパーパラメータに基づいて、予め設定された制約条件を決定することと、
前記予め設定された制約条件及び前記学習パラメータに基づいて、前記第1特徴マップの最終重みベクトルを決定することであって、前記学習パラメータは、前記第1特徴マップの最終重みベクトルを算出するためのものであり、前記第1ハイパーパラメータは、予め設定されたシンプレックスの中心を表すためのものであり、前記第2ハイパーパラメータは、前記最終重みベクトルの範囲を小さくするためのものである、ことと、を含む。
対応して、前記最終重みベクトルに基づいて、予め設定された正規化集合から、前記第1特徴マップに対応するターゲット正規化方式を決定することは、前記平均値最終重みベクトル及び前記分散最終重みベクトルに基づいて、平均値の第1サブ正規化方式及び分散の第2サブ正規化方式をそれぞれ決定することであって、前記第1サブ正規化方式は前記第2サブ正規化方式と同じであるか又は異なる、ことを含み、
対応して、前記ターゲット正規化方式を利用して、前記第1特徴マップに対して正規化処理を行い、第2特徴マップを得ることは、前記第1サブ正規化方式及び前記第2サブ正規化方式に基づいて、前記平均値ベクトル及び前記分散ベクトルに対してそれぞれ正規化を行い、正規化された平均値ベクトル及び正規化された分散ベクトルを得ることと、前記正規化された平均値ベクトル、前記正規化された分散ベクトル及び前記第1特徴マップに基づいて、前記第2特徴マップを得ることと、を含む。
予め設定された正規化集合に基づいて、前記第1特徴マップの平均値ベクトル及び分散ベクトルを決定することを含み、
前記平均値ベクトルの次元数及び分散ベクトルの次元数は、いずれも前記予め設定された正規化集合における正規化方式の数と同じであり、
前記平均値ベクトルにおける第i次元での平均値は、前記予め設定された正規化集合におけるj番目の正規化方式に対応し、前記分散ベクトルにおける第i次元での分散は、前記予め設定された正規化集合におけるj番目の正規化方式に対応し、i及びjはいずれも0より大きくて前記予め設定された正規化集合における正規化方式の数より小さい整数である。
予め設定された正規化集合における正規化方式の数に基づいて、前記学習パラメータの次元数、前記第1ハイパーパラメータの次元数及び前記第1ハイパーパラメータにおける各次元での数値を決定することであって、前記第1ハイパーパラメータの各次元の数値の合計は、1であり、前記第1ハイパーパラメータの次元数は、前記学習パラメータの次元数と同じであり、前記第1ハイパーパラメータの各次元の数値と同じであり、且つ各次元の数値の合計は、1である、ことと、
予め設定されたシンプレックスの中心から頂点までの距離を決定し、前記距離を、前記第2ハイパーパラメータに対応する予め設定された閾値として決定することであって、前記予め設定されたシンプレックスの各辺長さは、予め設定された固定数値であり、且つ頂点の数は、前記正規化方式の数と同じであり、前記第2ハイパーパラメータは、0より大きくて前記予め設定された閾値以下である数値である、ことと、を含む。
前記第2ハイパーパラメータ及び前記学習パラメータに基づいて、第1サブ重みベクトルを決定することと、
前記第1サブ重みベクトルと前記第1ハイパーパラメータとの距離が前記第2ハイパーパラメータ以上である場合、前記第1サブ重みベクトルを前記最終重みベクトルと決定することと、を含む。
前記第1サブ重みベクトルと前記第1ハイパーパラメータとの距離が前記第2ハイパーパラメータ未満である場合、前記第1ハイパーパラメータ、前記第2ハイパーパラメータ及び前記第1サブ重みベクトルに基づいて、第2サブ重みベクトルを決定することと、
第2サブ重みベクトルが0以上である場合、前記第2サブ重みベクトルを最終重みベクトルと決定することと、を更に含む。
前記第2サブ重みベクトルが0未満である場合、前記第2サブ重みベクトルに基づいて、前記第1ハイパーパラメータを更新し、更新された第1ハイパーパラメータを得ることと、
前記第2ハイパーパラメータ、前記更新された第1ハイパーパラメータ及び更新されていない第1ハイパーパラメータに基づいて、更新された第2ハイパーパラメータを決定することと、
前記第2サブ重みベクトル及び前記学習パラメータに基づいて、第3サブ重みベクトルを決定することと、
前記更新された第1ハイパーパラメータ、前記更新された第2ハイパーパラメータ及び前記第3サブ重みベクトルに基づいて、最終重みベクトルを決定することと、を更に含む。
前記平均値最終重みベクトルにおける各次元での重みを前記平均値ベクトルにおける各次元での重みと一対一に対応するように乗算し、各次元で得られた積を加算し、正規化された平均値ベクトルを得ることと、
前記分散最終重みベクトルにおける各次元での重みを前記分散ベクトルにおける各次元での分散と一対一に対応するように乗算し、各次元で得られた積を加算し、正規化された分散ベクトルを得ることと、を含む。
前記第1特徴マップと前記正規化された平均値ベクトルとの間の差の値を決定することと、
前記正規化された分散ベクトルと予め設定された調整量との和に対応する平均分散を決定することと、
前記平均分散に対する前記差の値の比率を決定することと、
予め設定されたスケーリングパラメータを用いて前記比率をスケーリングし、スケーリングされた比率を得ることと、
予め設定されたシフトパラメータに応じて前記スケーリングされた比率を調整し、前記第2特徴マップを得ることと、を含む。
前記第1取得モジュールは、処理されるべき画像の第1特徴マップを取得するように構成され、
前記第1取得モジュールは、前記第1特徴マップの最終重みベクトルを決定するように構成され、
前記第1決定モジュールは、前記最終重みベクトルに基づいて、予め設定された正規化集合から、前記第1特徴マップに対応するターゲット正規化方式を決定するように構成され、
前記第1処理モジュールは、前記ターゲット正規化方式を用いて、前記第1特徴マップに対して正規化処理を行い、第2特徴マップを得るように構成される。
前記ニューラルネットワークにおける畳み込み層を利用して、前記処理されるべき画像に対して特徴抽出を行い、前記第1特徴マップを得るように構成される第1抽出サブモジュールを備え、
対応して、前記予め設定されたパラメータ集合は、第1ハイパーパラメータ、第2ハイパーパラメータ及び学習パラメータを含み、前記第1計算モジュールは、
前記予め設定されたパラメータ集合における第1ハイパーパラメータ、第2ハイパーパラメータ及び学習パラメータに基づいて、前記第1特徴マップの最終重みベクトルを算出するように構成される第1計算サブモジュールを備える。
前記第1ハイパーパラメータ及び前記第2ハイパーパラメータに基づいて、予め設定された制約条件を決定するように構成される第1決定ユニットと、
前記予め設定された制約条件及び前記学習パラメータに基づいて、前記第1特徴マップの最終重みベクトルを決定するように構成される第2決定ユニットであって、前記学習パラメータは、前記第1特徴マップの最終重みベクトルを算出するためのものであり、前記第1ハイパーパラメータは、予め設定されたシンプレックスの中心を表すためのものであり、前記第2ハイパーパラメータは、前記最終重みベクトルの範囲を小さくするためのものである、第2決定ユニットと、を備える。
前記予め設定された制約条件及び前記学習パラメータに基づいて、前記平均値ベクトルに対応する平均値最終重みベクトル及び前記分散ベクトルに対応する分散最終重みベクトルをそれぞれ決定するように構成される第2決定サブモジュールと、を備え、
対応して、前記第1決定モジュールは、前記平均値最終重みベクトル及び前記分散最終重みベクトルに基づいて、平均値の第1サブ正規化方式及び分散の第2サブ正規化方式をそれぞれ決定するように構成される第3決定サブモジュールであって、前記第1サブ正規化方式は前記第2サブ正規化方式と同じであるか又は異なる、第3決定サブモジュールを備え、
対応して、前記第1処理モジュールは、前記第1サブ正規化方式及び前記第2サブ正規化方式に基づいて、前記平均値ベクトル及び前記分散ベクトルに対してそれぞれ正規化を行い、正規化された平均値ベクトル及び正規化された分散ベクトルを得るように構成される第1正規化サブモジュールと、
前記正規化された平均値ベクトル、前記正規化された分散ベクトル及び前記第1特徴マップに基づいて、前記第2特徴マップを得るように構成される第4決定サブモジュールと、を備える。
予め設定された正規化集合に基づいて、前記第1特徴マップの平均値ベクトル及び分散ベクトルを決定するように構成される第3決定ユニットを備え、
前記平均値ベクトルの次元数及び分散ベクトルの次元数は、いずれも前記予め設定された正規化集合における正規化方式の数と同じであり、
前記平均値ベクトルにおける第i次元での平均値は、前記予め設定された正規化集合におけるj番目の正規化方式に対応し、前記分散ベクトルにおける第i次元での分散は、前記予め設定された正規化集合におけるj番目の正規化方式に対応し、i及びjはいずれも0より大きくて前記予め設定された正規化集合における正規化方式の数より小さい整数である。
予め設定された正規化集合における正規化方式の数に基づいて、前記学習パラメータの次元数、前記第1ハイパーパラメータの次元数及び前記第1ハイパーパラメータにおける各次元での数値を決定するように構成される第2決定モジュールであって、前記第1ハイパーパラメータの各次元の数値の合計は、1であり、前記第1ハイパーパラメータの次元数は、前記学習パラメータの次元数と同じであり、前記第1ハイパーパラメータの各次元の数値と同じであり、且つ各次元の数値の合計は、1である、第2決定モジュールと、
予め設定されたシンプレックスの中心から頂点までの距離を決定し、前記距離を、前記第2ハイパーパラメータに対応する予め設定された閾値として決定するように構成される第3決定モジュールであって、前記予め設定されたシンプレックスの各辺長さは、予め設定された固定数値であり、且つ頂点の数は、前記正規化方式の数と同じであり、前記第2ハイパーパラメータは、0より大きくて前記予め設定された閾値以下である数値である、第3決定モジュールと、を備える。
前記第2ハイパーパラメータ及び前記学習パラメータに基づいて、第1サブ重みベクトルを決定するように構成される第4決定ユニットと、
前記第1サブ重みベクトルと前記第1ハイパーパラメータとの距離が前記第2ハイパーパラメータ以上である場合、前記第1サブ重みベクトルを前記最終重みベクトルと決定するように構成される第5決定ユニットと、を備える。
前記第1サブ重みベクトルと前記第1ハイパーパラメータとの距離が前記第2ハイパーパラメータ未満である場合、前記第1ハイパーパラメータ、前記第2ハイパーパラメータ及び前記第1サブ重みベクトルに基づいて、第2サブ重みベクトルを決定するように構成される第4決定モジュールと、
第2サブ重みベクトルが0以上である場合、前記第2サブ重みベクトルを最終重みベクトルと決定するように構成される第5決定モジュールと、を更に備える。
前記第2サブ重みベクトルが0未満である場合、前記第2サブ重みベクトルに基づいて、前記第1ハイパーパラメータを更新し、更新された第1ハイパーパラメータを得るように構成される第1更新モジュールと、
前記第2ハイパーパラメータ、前記更新された第1ハイパーパラメータ及び更新されていない第1ハイパーパラメータに基づいて、更新された第2ハイパーパラメータを決定するように構成される第6決定モジュールと、
前記第2サブ重みベクトル及び前記学習パラメータに基づいて、第3サブ重みベクトルを決定するように構成される第7決定モジュールと、
前記更新された第1ハイパーパラメータ、前記更新された第2ハイパーパラメータ及び前記第3サブ重みベクトルに基づいて、最終重みベクトルを決定するように構成される第8決定モジュールと、を更に備える。
前記平均値最終重みベクトルにおける各次元での重みを前記平均値ベクトルにおける各次元での重みと一対一に対応するように乗算し、各次元で得られた積を加算し、正規化された平均値ベクトルを得るように構成される第1計算ユニットと、
前記分散最終重みベクトルにおける各次元での重みを前記分散ベクトルにおける各次元での分散と一対一に対応するように乗算し、各次元で得られた積を加算し、正規化された分散ベクトルを得るように構成される第2計算ユニットと、を備える。
前記第1特徴マップと前記正規化された平均値ベクトルとの間の差の値を決定するように構成される第1差値算出ユニットと、
前記正規化された分散ベクトルと予め設定された調整量との和に対応する平均分散を決定するように構成される第3計算ユニットと、
前記平均分散に対する前記差の値の比率を決定するように構成される第4計算ユニットと、
予め設定されたスケーリングパラメータを用いて前記比率をスケーリングし、スケーリングされた比率を得るように構成される第1スケーリングユニットと、
予め設定されたシフトパラメータに応じて前記スケーリングされた比率を調整し、前記第2特徴マップを得るように構成される第1調整ユニットと、を備える。
例えば、本願は以下の項目を提供する。
(項目1)
画像処理方法であって、
処理されるべき画像の第1特徴マップを取得することと、
前記第1特徴マップの最終重みベクトルを決定することと、
前記最終重みベクトルに基づいて、予め設定された正規化集合から、前記第1特徴マップに対応するターゲット正規化方式を決定することと、
前記ターゲット正規化方式を用いて、前記第1特徴マップに対して正規化処理を行い、第2特徴マップを得ることと、を含む、前記方法。
(項目2)
前記処理されるべき画像の第1特徴マップを取得することは、
前記ニューラルネットワークにおける畳み込み層を利用して、前記処理されるべき画像に対して特徴抽出を行い、前記第1特徴マップを得ることを含み、
前記予め設定されたパラメータ集合は、第1ハイパーパラメータ、第2ハイパーパラメータ及び学習パラメータを含み、前記第1特徴マップの最終重みベクトルを決定することは、
前記予め設定されたパラメータ集合における第1ハイパーパラメータ、第2ハイパーパラメータ及び学習パラメータに基づいて、前記第1特徴マップの最終重みベクトルを算出することを含むことを特徴とする
項目1に記載の方法。
(項目3)
前記予め設定されたパラメータ集合における第1ハイパーパラメータ、第2ハイパーパラメータ及び学習パラメータに基づいて、第1特徴マップの最終重みベクトルを算出することは、
前記第1ハイパーパラメータ及び前記第2ハイパーパラメータに基づいて、予め設定された制約条件を決定することと、
前記予め設定された制約条件及び前記学習パラメータに基づいて、前記第1特徴マップの最終重みベクトルを決定することであって、前記学習パラメータは、前記第1特徴マップの最終重みベクトルを算出するためのものであり、前記第1ハイパーパラメータは、予め設定されたシンプレックスの中心を表すためのものであり、前記第2ハイパーパラメータは、前記最終重みベクトルの範囲を小さくするためのものである、ことと、を含むことを特徴とする
項目2に記載の方法。
(項目4)
前記予め設定された制約条件は、前記最終重みベクトルと前記第1ハイパーパラメータとの距離を、前記第2ハイパーパラメータの数値以上に限定するためのものであることを特徴とする
項目3に記載の方法。
(項目5)
前記第1特徴マップの最終重みベクトルを決定することは、前記第1特徴マップの平均値ベクトル及び分散ベクトルを決定することと、前記予め設定された制約条件及び前記学習パラメータに基づいて、前記平均値ベクトルに対応する平均値最終重みベクトル及び前記分散ベクトルに対応する分散最終重みベクトルをそれぞれ決定することと、を含み、
前記最終重みベクトルに基づいて、予め設定された正規化集合から、前記第1特徴マップに対応するターゲット正規化方式を決定することは、前記平均値最終重みベクトル及び前記分散最終重みベクトルに基づいて、平均値の第1サブ正規化方式及び分散の第2サブ正規化方式をそれぞれ決定することであって、前記第1サブ正規化方式は前記第2サブ正規化方式と同じであるか又は異なる、ことを含み、
前記ターゲット正規化方式を利用して、前記第1特徴マップに対して正規化処理を行い、第2特徴マップを得ることは、前記第1サブ正規化方式及び前記第2サブ正規化方式に基づいて、前記平均値ベクトル及び前記分散ベクトルに対してそれぞれ正規化を行い、正規化された平均値ベクトル及び正規化された分散ベクトルを得ることと、前記正規化された平均値ベクトル、前記正規化された分散ベクトル及び前記第1特徴マップに基づいて、前記第2特徴マップを得ることと、を含むことを特徴とする
項目1に記載の方法。
(項目6)
前記第1特徴マップの平均値ベクトル及び分散ベクトルを決定することは、
予め設定された正規化集合に基づいて、前記第1特徴マップの平均値ベクトル及び分散ベクトルを決定することを含み、
前記平均値ベクトルの次元数及び分散ベクトルの次元数は、いずれも前記予め設定された正規化集合における正規化方式の数と同じであり、
前記平均値ベクトルにおける第i次元での平均値は、前記予め設定された正規化集合におけるj番目の正規化方式に対応し、前記分散ベクトルにおける第i次元での分散は、前記予め設定された正規化集合におけるj番目の正規化方式に対応し、i及びjはいずれも0より大きくて前記予め設定された正規化集合における正規化方式の数より小さい整数であることを特徴とする
項目5に記載の方法。
(項目7)
前記方法は、
予め設定された正規化集合における正規化方式の数に基づいて、前記学習パラメータの次元数、前記第1ハイパーパラメータの次元数及び前記第1ハイパーパラメータにおける各次元での数値を決定することであって、前記第1ハイパーパラメータの各次元の数値の合計は、1であり、前記第1ハイパーパラメータの次元数は、前記学習パラメータの次元数と同じであり、前記第1ハイパーパラメータの各次元の数値と同じであり、且つ各次元の数値の合計は、1である、ことと、
予め設定されたシンプレックスの中心から頂点までの距離を決定し、前記距離を、前記第2ハイパーパラメータに対応する予め設定された閾値として決定することであって、前記予め設定されたシンプレックスの各辺長さは、予め設定された固定数値であり、且つ頂点の数は、前記正規化方式の数と同じであり、前記第2ハイパーパラメータは、0より大きくて前記予め設定された閾値以下である数値である、ことと、を含むことを特徴とする
項目2から6のうちいずれか一項に記載の方法。
(項目8)
前記予め設定されたパラメータ集合における第1ハイパーパラメータ、第2ハイパーパラメータ及び学習パラメータに基づいて、第1特徴マップの最終重みベクトルを算出することは、
前記第2ハイパーパラメータ及び前記学習パラメータに基づいて、第1サブ重みベクトルを決定することと、
前記第1サブ重みベクトルと前記第1ハイパーパラメータとの距離が前記第2ハイパーパラメータ以上である場合、前記第1サブ重みベクトルを前記最終重みベクトルと決定することと、を含むことを特徴とする
項目2に記載の方法。
(項目9)
前記第2ハイパーパラメータ及び前記学習パラメータに基づいて、第1サブ重みベクトルを決定した後、前記方法は、
前記第1サブ重みベクトルと前記第1ハイパーパラメータとの距離が前記第2ハイパーパラメータ未満である場合、前記第1ハイパーパラメータ、前記第2ハイパーパラメータ及び前記第1サブ重みベクトルに基づいて、第2サブ重みベクトルを決定することと、
第2サブ重みベクトルが0以上である場合、前記第2サブ重みベクトルを最終重みベクトルと決定することと、を更に含むことを特徴とする
項目8に記載の方法。
(項目10)
前記第1ハイパーパラメータ、前記第2ハイパーパラメータ及び前記第1サブ重みベクトルに基づいて、第2サブ重みベクトルを決定した後、前記方法は、
前記第2サブ重みベクトルが0未満である場合、前記第2サブ重みベクトルに基づいて、前記第1ハイパーパラメータを更新し、更新された第1ハイパーパラメータを得ることと、
前記第2ハイパーパラメータ、前記更新された第1ハイパーパラメータ及び更新されていない第1ハイパーパラメータに基づいて、更新された第2ハイパーパラメータを決定することと、
前記第2サブ重みベクトル及び前記学習パラメータに基づいて、第3サブ重みベクトルを決定することと、
前記更新された第1ハイパーパラメータ、前記更新された第2ハイパーパラメータ及び前記第3サブ重みベクトルに基づいて、最終重みベクトルを決定することと、を更に含むことを特徴とする
項目9に記載の方法。
(項目11)
前記第1サブ正規化方式及び前記第2サブ正規化方式に基づいて、前記平均値ベクトル及び前記分散ベクトルに対してそれぞれ正規化を行い、正規化された平均値ベクトル及び正規化された分散ベクトルを得ることは、
前記平均値最終重みベクトルにおける各次元での重みを前記平均値ベクトルにおける各次元での重みと一対一に対応するように乗算し、各次元で得られた積を加算し、正規化された平均値ベクトルを得ることと、
前記分散最終重みベクトルにおける各次元での重みを前記分散ベクトルにおける各次元での分散と一対一に対応するように乗算し、各次元で得られた積を加算し、正規化された分散ベクトルを得ることと、を含むことを特徴とする
項目5に記載の方法。
(項目12)
前記正規化された平均値ベクトル、正規化された分散ベクトル及び前記第1特徴マップに基づいて、前記第2特徴マップを得ることは、
前記第1特徴マップと前記正規化された平均値ベクトルとの間の差の値を決定することと、
前記正規化された分散ベクトルと予め設定された調整量との和に対応する平均分散を決定することと、
前記平均分散に対する前記差の値の比率を決定することと、
予め設定されたスケーリングパラメータを用いて前記比率をスケーリングし、スケーリングされた比率を得ることと、
予め設定されたシフトパラメータに応じて前記スケーリングされた比率を調整し、前記第2特徴マップを得ることと、を含むことを特徴とする
項目5に記載の方法。
(項目13)
画像処理装置であって、前記装置は、第1取得モジュールと、第1計算モジュールと、第1決定モジュールと、第1処理モジュールと、を備え、
前記第1取得モジュールは、処理されるべき画像の第1特徴マップを取得するように構成され、
前記第1取得モジュールは、前記第1特徴マップの最終重みベクトルを決定するように構成され、
前記第1決定モジュールは、前記最終重みベクトルに基づいて、予め設定された正規化集合から、前記第1特徴マップに対応するターゲット正規化方式を決定するように構成され、
前記第1処理モジュールは、前記ターゲット正規化方式を用いて、前記第1特徴マップに対して正規化処理を行い、第2特徴マップを得るように構成される、前記装置。
(項目14)
前記第1取得モジュールは、
前記ニューラルネットワークにおける畳み込み層を利用して、前記処理されるべき画像に対して特徴抽出を行い、前記第1特徴マップを得るように構成される第1抽出サブモジュールを備え、
前記予め設定されたパラメータ集合は、第1ハイパーパラメータ、第2ハイパーパラメータ及び学習パラメータを含み、前記第1計算モジュールは、
前記予め設定されたパラメータ集合における第1ハイパーパラメータ、第2ハイパーパラメータ及び学習パラメータに基づいて、前記第1特徴マップの最終重みベクトルを算出するように構成される第1計算サブモジュールを備えることを特徴とする
項目13に記載の装置。
(項目15)
前記第1計算サブモジュールは、
前記第1ハイパーパラメータ及び前記第2ハイパーパラメータに基づいて、予め設定された制約条件を決定するように構成される第1決定ユニットと、
前記予め設定された制約条件及び前記学習パラメータに基づいて、前記第1特徴マップの最終重みベクトルを決定するように構成される第2決定ユニットであって、前記学習パラメータは、前記第1特徴マップの最終重みベクトルを算出するためのものであり、前記第1ハイパーパラメータは、予め設定されたシンプレックスの中心を表すためのものであり、前記第2ハイパーパラメータは、前記最終重みベクトルの範囲を小さくするためのものである、第2決定ユニットと、を備えることを特徴とする
項目14に記載の装置。
(項目16)
前記予め設定された制約条件は、前記最終重みベクトルと前記第1ハイパーパラメータとの距離を前記第2ハイパーパラメータの数値以上に限定するためのものであることを特徴とする
項目15に記載の装置。
(項目17)
前記第1取得モジュールは、前記第1特徴マップの平均値ベクトル及び分散ベクトルを決定するように構成される第1決定サブモジュールと、
前記予め設定された制約条件及び前記学習パラメータに基づいて、前記平均値ベクトルに対応する平均値最終重みベクトル及び前記分散ベクトルに対応する分散最終重みベクトルをそれぞれ決定するように構成される第2決定サブモジュールと、を備え、
前記第1決定モジュールは、前記平均値最終重みベクトル及び前記分散最終重みベクトルに基づいて、平均値の第1サブ正規化方式及び分散の第2サブ正規化方式をそれぞれ決定するように構成される第3決定サブモジュールであって、前記第1サブ正規化方式は前記第2サブ正規化方式と同じであるか又は異なる、第3決定サブモジュールを備え、
前記第1処理モジュールは、前記第1サブ正規化方式及び前記第2サブ正規化方式に基づいて、前記平均値ベクトル及び前記分散ベクトルに対してそれぞれ正規化を行い、正規化された平均値ベクトル及び正規化された分散ベクトルを得るように構成される第1正規化サブモジュールと、
前記正規化された平均値ベクトル、前記正規化された分散ベクトル及び前記第1特徴マップに基づいて、前記第2特徴マップを得るように構成される第4決定サブモジュールと、を備えることを特徴とする
項目13に記載の装置。
(項目18)
前記第1決定サブモジュールは、
予め設定された正規化集合に基づいて、前記第1特徴マップの平均値ベクトル及び分散ベクトルを決定するように構成される第3決定ユニットを備え、
前記平均値ベクトルの次元数及び分散ベクトルの次元数は、いずれも前記予め設定された正規化集合における正規化方式の数と同じであり、
前記平均値ベクトルにおける第i次元での平均値は、前記予め設定された正規化集合におけるj番目の正規化方式に対応し、前記分散ベクトルにおける第i次元での分散は、前記予め設定された正規化集合におけるj番目の正規化方式に対応し、i及びjはいずれも0より大きくて前記予め設定された正規化集合における正規化方式の数より小さい整数であることを特徴とする
項目17に記載の装置。
(項目19)
前記装置は、
予め設定された正規化集合における正規化方式の数に基づいて、前記学習パラメータの次元数、前記第1ハイパーパラメータの次元数及び前記第1ハイパーパラメータにおける各次元での数値を決定するように構成される第2決定モジュールであって、前記第1ハイパーパラメータの各次元の数値の合計は、1であり、前記第1ハイパーパラメータの次元数は、前記学習パラメータの次元数と同じであり、前記第1ハイパーパラメータの各次元の数値と同じであり、且つ各次元の数値の合計は、1である、第2決定モジュールと、
予め設定されたシンプレックスの中心から頂点までの距離を決定し、前記距離を、前記第2ハイパーパラメータに対応する予め設定された閾値として決定するように構成される第3決定モジュールであって、前記予め設定されたシンプレックスの各辺長さは、予め設定された固定数値であり、且つ頂点の数は、前記正規化方式の数と同じであり、前記第2ハイパーパラメータは、0より大きくて前記予め設定された閾値以下である数値である、第3決定モジュールと、を備えることを特徴とする
項目14から18のうちいずれか一項に記載の装置。
(項目20)
前記第1計算サブモジュールは、
前記第2ハイパーパラメータ及び前記学習パラメータに基づいて、第1サブ重みベクトルを決定するように構成される第4決定ユニットと、
前記第1サブ重みベクトルと前記第1ハイパーパラメータとの距離が前記第2ハイパーパラメータ以上である場合、前記第1サブ重みベクトルを前記最終重みベクトルと決定するように構成される第5決定ユニットと、を備えることを特徴とする
項目14に記載の装置。
(項目21)
前記装置は、
前記第1サブ重みベクトルと前記第1ハイパーパラメータとの距離が前記第2ハイパーパラメータ未満である場合、前記第1ハイパーパラメータ、前記第2ハイパーパラメータ及び前記第1サブ重みベクトルに基づいて、第2サブ重みベクトルを決定するように構成される第4決定モジュールと、
第2サブ重みベクトルが0以上である場合、前記第2サブ重みベクトルを最終重みベクトルと決定するように構成される第5決定モジュールと、を更に備えることを特徴とする
項目20に記載の装置。
(項目22)
前記装置は、
前記第2サブ重みベクトルが0未満である場合、前記第2サブ重みベクトルに基づいて、前記第1ハイパーパラメータを更新し、更新された第1ハイパーパラメータを得るように構成される第1更新モジュールと、
前記第2ハイパーパラメータ、前記更新された第1ハイパーパラメータ及び更新されていない第1ハイパーパラメータに基づいて、更新された第2ハイパーパラメータを決定するように構成される第6決定モジュールと、
前記第2サブ重みベクトル及び前記学習パラメータに基づいて、第3サブ重みベクトルを決定するように構成される第7決定モジュールと、
前記更新された第1ハイパーパラメータ、前記更新された第2ハイパーパラメータ及び前記第3サブ重みベクトルに基づいて、最終重みベクトルを決定するように構成される第8決定モジュールと、を更に備えることを特徴とする
項目21に記載の装置。
(項目23)
前記第1正規化サブモジュールは、
前記平均値最終重みベクトルにおける各次元での重みを前記平均値ベクトルにおける各次元での重みと一対一に対応するように乗算し、各次元で得られた積を加算し、正規化された平均値ベクトルを得るように構成される第1計算ユニットと、
前記分散最終重みベクトルにおける各次元での重みを前記分散ベクトルにおける各次元での分散と一対一に対応するように乗算し、各次元で得られた積を加算し、正規化された分散ベクトルを得るように構成される第2計算ユニットと、を備えることを特徴とする
項目17に記載の装置。
(項目24)
前記第4決定サブモジュールは、
前記第1特徴マップと前記正規化された平均値ベクトルとの間の差の値を決定するように構成される第1差値算出ユニットと、
前記正規化された分散ベクトルと予め設定された調整量との和に対応する平均分散を決定するように構成される第3計算ユニットと、
前記平均分散に対する前記差の値の比率を決定するように構成される第4計算ユニットと、
予め設定されたスケーリングパラメータを用いて前記比率をスケーリングし、スケーリングされた比率を得るように構成される第1スケーリングユニットと、
予め設定されたシフトパラメータに応じて前記スケーリングされた比率を調整し、前記第2特徴マップを得るように構成される第1調整ユニットと、を備えることを特徴とする
項目17に記載の装置。
(項目25)
コンピュータ実行可能な命令を記憶するコンピュータ記憶媒体であって、前記コンピュータ実行可能な命令が、項目1から12のうちいずれか一項に記載の方法のステップを実施するために実行される、前記コンピュータ記憶媒体。
(項目26)
メモリ及びプロセッサを備えるコンピュータ機器であって、前記メモリに、コンピュータ実行可能な命令が記憶されており、前記プロセッサが前記メモリにおけるコンピュータ実行可能な命令を実行して、項目1から12のうちいずれか一項に記載の方法のステップを実施する、前記コンピュータ機器。
(項目27)
コンピュータ実行可能な命令を含むコンピュータプログラム製品であって、前記コンピュータ実行可能な命令が、項目1から12のうちいずれか一項に記載の方法のステップを実施するために実行される、前記コンピュータプログラム製品。
前記第1サブ重みベクトルと前記第1ハイパーパラメータとの距離が前記第2ハイパーパラメータ未満である場合、前記第1ハイパーパラメータ、前記第2ハイパーパラメータ及び前記第1サブ重みベクトルに基づいて、第2サブ重みベクトルを決定するように構成される第4決定モジュールと、第2サブ重みベクトルが0以上である場合、前記第2サブ重みベクトルを最終重みベクトルと決定するように構成される第5決定モジュールと、を更に備える。
プロセッサ601は、一般的には、コンピュータ機器600の全体的操作を制御する。
Claims (15)
- 画像処理方法であって、
処理されるべき画像の第1特徴マップを取得することと、
前記第1特徴マップの最終重みベクトルを決定することと、
前記最終重みベクトルに基づいて、予め設定された正規化集合から、前記第1特徴マップに対応するターゲット正規化方式を決定することと、
前記ターゲット正規化方式を用いて、前記第1特徴マップに対して正規化処理を行い、第2特徴マップを得ることと、を含む、前記方法。 - 前記処理されるべき画像の第1特徴マップを取得することは、
前記ニューラルネットワークにおける畳み込み層を利用して、前記処理されるべき画像に対して特徴抽出を行い、前記第1特徴マップを得ることを含み、
前記予め設定されたパラメータ集合は、第1ハイパーパラメータ、第2ハイパーパラメータ及び学習パラメータを含み、前記第1特徴マップの最終重みベクトルを決定することは、
前記予め設定されたパラメータ集合における第1ハイパーパラメータ、第2ハイパーパラメータ及び学習パラメータに基づいて、前記第1特徴マップの最終重みベクトルを算出することを含むことを特徴とする
請求項1に記載の方法。 - 前記予め設定されたパラメータ集合における第1ハイパーパラメータ、第2ハイパーパラメータ及び学習パラメータに基づいて、第1特徴マップの最終重みベクトルを算出することは、
前記第1ハイパーパラメータ及び前記第2ハイパーパラメータに基づいて、予め設定された制約条件を決定することであって、前記予め設定された制約条件は、前記最終重みベクトルと前記第1ハイパーパラメータとの距離を、前記第2ハイパーパラメータの数値以上に限定するためのものである、ことと、
前記予め設定された制約条件及び前記学習パラメータに基づいて、前記第1特徴マップの最終重みベクトルを決定することであって、前記学習パラメータは、前記第1特徴マップの最終重みベクトルを算出するためのものであり、前記第1ハイパーパラメータは、予め設定されたシンプレックスの中心を表すためのものであり、前記第2ハイパーパラメータは、前記最終重みベクトルの範囲を小さくするためのものである、ことと、を含むことを特徴とする
請求項2に記載の方法。 - 前記第1特徴マップの最終重みベクトルを決定することは、前記第1特徴マップの平均値ベクトル及び分散ベクトルを決定することと、前記予め設定された制約条件及び前記学習パラメータに基づいて、前記平均値ベクトルに対応する平均値最終重みベクトル及び前記分散ベクトルに対応する分散最終重みベクトルをそれぞれ決定することと、を含み、
前記最終重みベクトルに基づいて、予め設定された正規化集合から、前記第1特徴マップに対応するターゲット正規化方式を決定することは、前記平均値最終重みベクトル及び前記分散最終重みベクトルに基づいて、平均値の第1サブ正規化方式及び分散の第2サブ正規化方式をそれぞれ決定することであって、前記第1サブ正規化方式は前記第2サブ正規化方式と同じであるか又は異なる、ことを含み、
前記ターゲット正規化方式を利用して、前記第1特徴マップに対して正規化処理を行い、第2特徴マップを得ることは、前記第1サブ正規化方式及び前記第2サブ正規化方式に基づいて、前記平均値ベクトル及び前記分散ベクトルに対してそれぞれ正規化を行い、正規化された平均値ベクトル及び正規化された分散ベクトルを得ることと、前記正規化された平均値ベクトル、前記正規化された分散ベクトル及び前記第1特徴マップに基づいて、前記第2特徴マップを得ることと、を含むことを特徴とする
請求項1に記載の方法。 - 前記第1特徴マップの平均値ベクトル及び分散ベクトルを決定することは、
予め設定された正規化集合に基づいて、前記第1特徴マップの平均値ベクトル及び分散ベクトルを決定することを含み、
前記平均値ベクトルの次元数及び分散ベクトルの次元数は、いずれも前記予め設定された正規化集合における正規化方式の数と同じであり、
前記平均値ベクトルにおける第i次元での平均値は、前記予め設定された正規化集合におけるj番目の正規化方式に対応し、前記分散ベクトルにおける第i次元での分散は、前記予め設定された正規化集合におけるj番目の正規化方式に対応し、i及びjはいずれも0より大きくて前記予め設定された正規化集合における正規化方式の数より小さい整数であることを特徴とする
請求項4に記載の方法。 - 前記方法は、
予め設定された正規化集合における正規化方式の数に基づいて、前記学習パラメータの次元数、前記第1ハイパーパラメータの次元数及び前記第1ハイパーパラメータにおける各次元での数値を決定することであって、前記第1ハイパーパラメータの各次元の数値の合計は、1であり、前記第1ハイパーパラメータの次元数は、前記学習パラメータの次元数と同じであり、前記第1ハイパーパラメータの各次元の数値と同じであり、且つ各次元の数値の合計は、1である、ことと、
予め設定されたシンプレックスの中心から頂点までの距離を決定し、前記距離を、前記第2ハイパーパラメータに対応する予め設定された閾値として決定することであって、前記予め設定されたシンプレックスの各辺長さは、予め設定された固定数値であり、且つ頂点の数は、前記正規化方式の数と同じであり、前記第2ハイパーパラメータは、0より大きくて前記予め設定された閾値以下である数値である、ことと、を含むことを特徴とする
請求項2から5のうちいずれか一項に記載の方法。 - 前記予め設定されたパラメータ集合における第1ハイパーパラメータ、第2ハイパーパラメータ及び学習パラメータに基づいて、第1特徴マップの最終重みベクトルを算出することは、
前記第2ハイパーパラメータ及び前記学習パラメータに基づいて、第1サブ重みベクトルを決定することと、
前記第1サブ重みベクトルと前記第1ハイパーパラメータとの距離が前記第2ハイパーパラメータ以上である場合、前記第1サブ重みベクトルを前記最終重みベクトルと決定することと、を含むことを特徴とする
請求項2に記載の方法。 - 前記第2ハイパーパラメータ及び前記学習パラメータに基づいて、第1サブ重みベクトルを決定した後、前記方法は、
前記第1サブ重みベクトルと前記第1ハイパーパラメータとの距離が前記第2ハイパーパラメータ未満である場合、前記第1ハイパーパラメータ、前記第2ハイパーパラメータ及び前記第1サブ重みベクトルに基づいて、第2サブ重みベクトルを決定することと、
第2サブ重みベクトルが0以上である場合、前記第2サブ重みベクトルを最終重みベクトルと決定することと、を更に含むことを特徴とする
請求項7に記載の方法。 - 前記第1ハイパーパラメータ、前記第2ハイパーパラメータ及び前記第1サブ重みベクトルに基づいて、第2サブ重みベクトルを決定した後、前記方法は、
前記第2サブ重みベクトルが0未満である場合、前記第2サブ重みベクトルに基づいて、前記第1ハイパーパラメータを更新し、更新された第1ハイパーパラメータを得ることと、
前記第2ハイパーパラメータ、前記更新された第1ハイパーパラメータ及び更新されていない第1ハイパーパラメータに基づいて、更新された第2ハイパーパラメータを決定することと、
前記第2サブ重みベクトル及び前記学習パラメータに基づいて、第3サブ重みベクトルを決定することと、
前記更新された第1ハイパーパラメータ、前記更新された第2ハイパーパラメータ及び前記第3サブ重みベクトルに基づいて、最終重みベクトルを決定することと、を更に含むことを特徴とする
請求項8に記載の方法。 - 前記第1サブ正規化方式及び前記第2サブ正規化方式に基づいて、前記平均値ベクトル及び前記分散ベクトルに対してそれぞれ正規化を行い、正規化された平均値ベクトル及び正規化された分散ベクトルを得ることは、
前記平均値最終重みベクトルにおける各次元での重みを前記平均値ベクトルにおける各次元での重みと一対一に対応するように乗算し、各次元で得られた積を加算し、正規化された平均値ベクトルを得ることと、
前記分散最終重みベクトルにおける各次元での重みを前記分散ベクトルにおける各次元での分散と一対一に対応するように乗算し、各次元で得られた積を加算し、正規化された分散ベクトルを得ることと、を含むことを特徴とする
請求項4に記載の方法。 - 前記正規化された平均値ベクトル、正規化された分散ベクトル及び前記第1特徴マップに基づいて、前記第2特徴マップを得ることは、
前記第1特徴マップと前記正規化された平均値ベクトルとの間の差の値を決定することと、
前記正規化された分散ベクトルと予め設定された調整量との和に対応する平均分散を決定することと、
前記平均分散に対する前記差の値の比率を決定することと、
予め設定されたスケーリングパラメータを用いて前記比率をスケーリングし、スケーリングされた比率を得ることと、
予め設定されたシフトパラメータに応じて前記スケーリングされた比率を調整し、前記第2特徴マップを得ることと、を含むことを特徴とする
請求項4に記載の方法。 - 画像処理装置であって、前記装置は、第1取得モジュールと、第1計算モジュールと、第1決定モジュールと、第1処理モジュールと、を備え、
前記第1取得モジュールは、処理されるべき画像の第1特徴マップを取得するように構成され、
前記第1取得モジュールは、前記第1特徴マップの最終重みベクトルを決定するように構成され、
前記第1決定モジュールは、前記最終重みベクトルに基づいて、予め設定された正規化集合から、前記第1特徴マップに対応するターゲット正規化方式を決定するように構成され、
前記第1処理モジュールは、前記ターゲット正規化方式を用いて、前記第1特徴マップに対して正規化処理を行い、第2特徴マップを得るように構成される、前記装置。 - コンピュータ実行可能な命令を記憶するコンピュータ可読記憶媒体であって、前記コンピュータ実行可能な命令が、コンピュータに請求項1から11のうちいずれか一項に記載の方法を実行させる、前記コンピュータ可読記憶媒体。
- メモリ及びプロセッサを備えるコンピュータ機器であって、前記メモリに、コンピュータ実行可能な命令が記憶されており、前記プロセッサが前記メモリにおけるコンピュータ実行可能な命令を実行して、請求項1から11のうちいずれか一項に記載の方法を実施する、前記コンピュータ機器。
- コンピュータに、請求項1から11のうちいずれか一項に記載の方法を実行させる、コンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910087398.XA CN109784420B (zh) | 2019-01-29 | 2019-01-29 | 一种图像处理方法及装置、计算机设备和存储介质 |
CN201910087398.X | 2019-01-29 | ||
PCT/CN2019/114721 WO2020155712A1 (zh) | 2019-01-29 | 2019-10-31 | 图像处理方法、装置、计算机设备和计算机存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022500798A JP2022500798A (ja) | 2022-01-04 |
JP7076648B2 true JP7076648B2 (ja) | 2022-05-27 |
Family
ID=66503596
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021537467A Active JP7076648B2 (ja) | 2019-01-29 | 2019-10-31 | 画像処理方法及び装置、コンピュータ機器並びにコンピュータ記憶媒体 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20210158088A1 (ja) |
JP (1) | JP7076648B2 (ja) |
CN (1) | CN109784420B (ja) |
SG (1) | SG11202102380TA (ja) |
TW (1) | TWI712960B (ja) |
WO (1) | WO2020155712A1 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109784420B (zh) * | 2019-01-29 | 2021-12-28 | 深圳市商汤科技有限公司 | 一种图像处理方法及装置、计算机设备和存储介质 |
CN110348537B (zh) * | 2019-07-18 | 2022-11-29 | 北京市商汤科技开发有限公司 | 图像处理方法及装置、电子设备和存储介质 |
CN111062429A (zh) * | 2019-12-12 | 2020-04-24 | 上海点泽智能科技有限公司 | 基于深度学习的厨师帽和口罩佩戴的检测方法 |
CN111325222A (zh) * | 2020-02-27 | 2020-06-23 | 深圳市商汤科技有限公司 | 图像归一化处理方法及装置、存储介质 |
CN112000756B (zh) * | 2020-08-21 | 2024-09-17 | 上海商汤智能科技有限公司 | 轨迹预测的方法、装置、电子设备及存储介质 |
KR20220048644A (ko) * | 2020-10-13 | 2022-04-20 | 삼성전자주식회사 | 뉴럴 네트워크 연산 방법 및 장치 |
EP4276692A1 (en) * | 2022-05-13 | 2023-11-15 | Robert Bosch GmbH | Neural network layer for non-linear normalization |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003346083A (ja) | 2002-05-27 | 2003-12-05 | Canon Inc | 文字認識装置、文字認識方法、プログラムおよび記憶媒体、および文字認識システム |
CN103902737A (zh) | 2014-04-22 | 2014-07-02 | 上海理工大学 | 基于群智能算法的投影寻踪分类建模软件及实现 |
US20170220905A1 (en) | 2014-05-17 | 2017-08-03 | Beijing University Of Technology | Feature grouping normalization method for cognitive state recognition |
CN107193993A (zh) | 2017-06-06 | 2017-09-22 | 苏州大学 | 基于局部学习特征权重选择的医疗数据分类方法及装置 |
CN108921283A (zh) | 2018-06-13 | 2018-11-30 | 深圳市商汤科技有限公司 | 深度神经网络的归一化方法和装置、设备、存储介质 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
IL107996A0 (en) * | 1993-12-12 | 1994-05-30 | P Inspection Ltd As | Apparatus and method for signal processing |
US8923650B2 (en) * | 2013-01-07 | 2014-12-30 | Wexenergy Innovations Llc | System and method of measuring distances related to an object |
US10325351B2 (en) * | 2016-03-11 | 2019-06-18 | Qualcomm Technologies, Inc. | Systems and methods for normalizing an image |
KR102662949B1 (ko) * | 2016-11-24 | 2024-05-02 | 엘지전자 주식회사 | 인공지능 이동 로봇 및 그 제어방법 |
KR102343963B1 (ko) * | 2017-05-30 | 2021-12-24 | 주식회사 케이티 | 손 제스처를 검출하는 컨볼루션 신경망, 그리고 손 제스처에 의한 기기 제어시스템 |
US10963737B2 (en) * | 2017-08-01 | 2021-03-30 | Retina-Al Health, Inc. | Systems and methods using weighted-ensemble supervised-learning for automatic detection of ophthalmic disease from images |
CN107808138B (zh) * | 2017-10-31 | 2021-03-30 | 电子科技大学 | 一种基于FasterR-CNN的通信信号识别方法 |
CN108200522B (zh) * | 2017-11-24 | 2020-02-18 | 华侨大学 | 一种变正则化比例归一化子带自适应滤波方法 |
CN108764357A (zh) * | 2018-05-31 | 2018-11-06 | 西安电子科技大学 | 基于压缩-激发的聚合残差网络高光谱图像分类方法 |
CN109003265B (zh) * | 2018-07-09 | 2022-02-11 | 嘉兴学院 | 一种基于贝叶斯压缩感知的无参考图像质量客观评价方法 |
CN109255381B (zh) * | 2018-09-06 | 2022-03-29 | 华南理工大学 | 一种基于二阶vlad稀疏自适应深度网络的图像分类方法 |
CN109784420B (zh) * | 2019-01-29 | 2021-12-28 | 深圳市商汤科技有限公司 | 一种图像处理方法及装置、计算机设备和存储介质 |
-
2019
- 2019-01-29 CN CN201910087398.XA patent/CN109784420B/zh active Active
- 2019-10-31 WO PCT/CN2019/114721 patent/WO2020155712A1/zh active Application Filing
- 2019-10-31 SG SG11202102380TA patent/SG11202102380TA/en unknown
- 2019-10-31 JP JP2021537467A patent/JP7076648B2/ja active Active
- 2019-12-27 TW TW108148217A patent/TWI712960B/zh active
-
2021
- 2021-02-08 US US17/170,149 patent/US20210158088A1/en not_active Abandoned
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003346083A (ja) | 2002-05-27 | 2003-12-05 | Canon Inc | 文字認識装置、文字認識方法、プログラムおよび記憶媒体、および文字認識システム |
CN103902737A (zh) | 2014-04-22 | 2014-07-02 | 上海理工大学 | 基于群智能算法的投影寻踪分类建模软件及实现 |
US20170220905A1 (en) | 2014-05-17 | 2017-08-03 | Beijing University Of Technology | Feature grouping normalization method for cognitive state recognition |
CN107193993A (zh) | 2017-06-06 | 2017-09-22 | 苏州大学 | 基于局部学习特征权重选择的医疗数据分类方法及装置 |
CN108921283A (zh) | 2018-06-13 | 2018-11-30 | 深圳市商汤科技有限公司 | 深度神经网络的归一化方法和装置、设备、存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN109784420B (zh) | 2021-12-28 |
TWI712960B (zh) | 2020-12-11 |
WO2020155712A1 (zh) | 2020-08-06 |
TW202029074A (zh) | 2020-08-01 |
CN109784420A (zh) | 2019-05-21 |
US20210158088A1 (en) | 2021-05-27 |
JP2022500798A (ja) | 2022-01-04 |
SG11202102380TA (en) | 2021-04-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7076648B2 (ja) | 画像処理方法及び装置、コンピュータ機器並びにコンピュータ記憶媒体 | |
KR102672004B1 (ko) | 저 정밀도 뉴럴 네트워크 학습을 위한 방법 및 장치 | |
Ye et al. | Meta-PU: An arbitrary-scale upsampling network for point cloud | |
CN107622302B (zh) | 用于卷积神经网络的超像素方法 | |
US11983632B2 (en) | Generating and utilizing pruned neural networks | |
CN110503192A (zh) | 资源有效的神经架构 | |
US11704570B2 (en) | Learning device, learning system, and learning method | |
Li et al. | Learning deep implicit functions for 3D shapes with dynamic code clouds | |
US20230267730A1 (en) | Image abnormality detection model training | |
WO2022105108A1 (zh) | 一种网络数据分类方法、装置、设备及可读存储介质 | |
WO2019154411A1 (zh) | 词向量更新方法和装置 | |
WO2020195940A1 (ja) | ニューラルネットワークのモデル縮約装置 | |
CN113486963A (zh) | 一种密度自适应的点云端到端采样方法 | |
CN114493674A (zh) | 一种广告点击率预测模型及方法 | |
US20200372363A1 (en) | Method of Training Artificial Neural Network Using Sparse Connectivity Learning | |
US7933449B2 (en) | Pattern recognition method | |
CN111210439B (zh) | 通过抑制非感兴趣信息的语义分割方法、设备及存储设备 | |
CN114065913A (zh) | 模型量化方法、装置及终端设备 | |
CN113591914A (zh) | 一种数据分类方法、装置、计算机设备和存储介质 | |
CN114580625A (zh) | 用于训练神经网络的方法、设备和计算机可读存储介质 | |
Chang et al. | A hardware-friendly pruning approach by exploiting local statistical pruning and fine grain pruning techniques | |
US20240161245A1 (en) | Image optimization | |
US20230214633A1 (en) | Neural ranking model for generating sparse representations for information retrieval | |
CN116029409A (zh) | 核反应堆多参数优化方法、装置、计算机设备和存储介质 | |
CN116415622A (zh) | 一种深度神经网络推理加速方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210310 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210310 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220511 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220517 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7076648 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |