JP2021533430A - 画像処理方法、画像処理装置、電子機器、記憶媒体及びコンピュータプログラム - Google Patents
画像処理方法、画像処理装置、電子機器、記憶媒体及びコンピュータプログラム Download PDFInfo
- Publication number
- JP2021533430A JP2021533430A JP2020563999A JP2020563999A JP2021533430A JP 2021533430 A JP2021533430 A JP 2021533430A JP 2020563999 A JP2020563999 A JP 2020563999A JP 2020563999 A JP2020563999 A JP 2020563999A JP 2021533430 A JP2021533430 A JP 2021533430A
- Authority
- JP
- Japan
- Prior art keywords
- feature
- stage
- scale
- network
- feature map
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
- G06F18/2137—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on criteria of topology preservation, e.g. multidimensional scaling or self-organising maps
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/082—Learning methods modifying the architecture, e.g. adding, deleting or silencing nodes or connections
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration by the use of more than one image, e.g. averaging, subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/449—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
- G06V10/451—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
- G06V10/454—Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
Abstract
Description
Claims (39)
- 特徴抽出ネットワークによって処理対象となる画像に対して特徴抽出を行い、前記処理対象となる画像の第1特徴マップを取得することと、
M段の符号化ネットワークによって前記第1特徴マップに対してスケールダウン及びマルチスケール融合処理を行い、各特徴マップのスケールが異なる符号化後の複数の特徴マップを取得することと、
N段の復号化ネットワークによって符号化後の複数の特徴マップに対してスケールアップ及びマルチスケール融合処理を行い、前記処理対象となる画像の予測結果を取得することと、を含み、
ここで、M、Nは1より大きい整数であることを特徴とする画像処理方法。 - M段の符号化ネットワークによって前記第1特徴マップに対してスケールダウン及びマルチスケール融合処理を行い、符号化後の複数の特徴マップを取得することは、
第1段の符号化ネットワークによって前記第1特徴マップに対してスケールダウン及びマルチスケール融合処理を行い、第1段の符号化後の第1特徴マップ及び第1段の符号化後の第2特徴マップを取得することと、
第m段の符号化ネットワークによって第m−1段の符号化後のm個の特徴マップに対してスケールダウン及びマルチスケール融合処理を行い、第m段の符号化後のm+1個の特徴マップを取得することと、
第M段の符号化ネットワークによって第M−1段の符号化後のM個の特徴マップに対してスケールダウン及びマルチスケール融合処理を行い、第M段の符号化後のM+1個の特徴マップを取得することと、を含み、
ここで、mは整数で1<m<Mであることを特徴とする請求項1に記載の方法。 - 第1段の符号化ネットワークによって前記第1特徴マップに対してスケールダウン及びマルチスケール融合処理を行い、第1段の符号化後の第1特徴マップ及び第2特徴マップを取得することは、
前記第1特徴マップをスケールダウンし、第2特徴マップを取得することと、
前記第1特徴マップと前記第2特徴マップを融合させ、第1段の符号化後の第1特徴マップ及び第1段の符号化後の第2特徴マップを取得することと、を含むことを特徴とする請求項2に記載の方法。 - 第m段の符号化ネットワークによって第m−1段の符号化後のm個の特徴マップに対してスケールダウン及びマルチスケール融合処理を行い、第m段の符号化後のm+1個の特徴マップを取得することは、
第m−1段の符号化後のm個の特徴マップに対してスケールダウン及び融合を行い、スケールが第m−1段の符号化後のm個の特徴マップのスケールよりも小さいm+1番目の特徴マップを取得することと、
前記第m−1段の符号化後のm個の特徴マップ及び前記m+1番目の特徴マップを融合させ、第m段の符号化後のm+1個の特徴マップを取得することと、を含むことを特徴とする請求項2又は3に記載の方法。 - 第m−1段の符号化後のm個の特徴マップに対してスケールダウン及び融合を行い、m+1番目の特徴マップを取得することは、
第m段の符号化ネットワークの畳み込みサブネットワークによって第m−1段の符号化後のm個の特徴マップをそれぞれスケールダウンし、スケールが前記m+1番目の特徴マップのスケールと同じであるスケールダウン後のm個の特徴マップを取得することと、
前記スケールダウン後のm個の特徴マップに対して特徴融合を行い、前記m+1番目の特徴マップを取得することと、を含むことを特徴とする請求項4に記載の方法。 - 第m−1段の符号化後のm個の特徴マップ及び前記m+1番目の特徴マップを融合させ、第m段の符号化後のm+1個の特徴マップを取得することは、
第m段の符号化ネットワークの特徴最適化サブネットワークによって第m−1段の符号化後のm個の特徴マップ及び前記m+1番目の特徴マップに対してそれぞれ特徴最適化を行い、特徴最適化後のm+1個の特徴マップを取得することと、
第m段の符号化ネットワークのm+1個の融合サブネットワークによって前記特徴最適化後のm+1個の特徴マップをそれぞれ融合させ、第m段の符号化後のm+1個の特徴マップを取得することと、を含むことを特徴とする請求項4又は5に記載の方法。 - 前記畳み込みサブネットワークは少なくとも1つの第1畳み込み層を含み、前記第1畳み込み層は畳み込みカーネルサイズが3×3であり、ストライドが2であり、
前記特徴最適化サブネットワークは少なくとも2つの第2畳み込み層及び残差層を含み、前記第2畳み込み層は畳み込みカーネルサイズが3×3であり、ストライドが1であり、
前記m+1個の融合サブネットワークは最適化後のm+1個の特徴マップに対応することを特徴とする請求項5又は6に記載の方法。 - m+1個の融合サブネットワーク内のk番目の融合サブネットワークの場合、第m段の符号化ネットワークのm+1個の融合サブネットワークによって前記特徴最適化後のm+1個の特徴マップをそれぞれ融合させ、第m段の符号化後のm+1個の特徴マップを取得することは、
少なくとも1つの第1畳み込み層によってスケールが特徴最適化後のk番目の特徴マップよりも大きいk−1個の特徴マップをスケールダウンし、スケールが特徴最適化後のk番目の特徴マップのスケールと同じであるスケールダウン後のk−1個の特徴マップを取得することと、及び/又は
アップサンプリング層及び第3畳み込み層によってスケールが特徴最適化後のk番目の特徴マップよりも小さいm+1−k個の特徴マップに対してスケールアップ及びチャネル調整を行い、スケールが特徴最適化後のk番目の特徴マップのスケールと同じであるスケールアップ後のm+1−k個の特徴マップを取得することと、を含み、
ここで、kは整数で1≦k≦m+1であり、前記第3畳み込み層の畳み込みカーネルサイズは1×1であることを特徴とする請求項7に記載の方法。 - 第m段の符号化ネットワークのm+1個の融合サブネットワークによって前記特徴最適化後のm+1個の特徴マップをそれぞれ融合させ、第m段の符号化後のm+1個の特徴マップを取得することは、
前記スケールダウン後のk−1個の特徴マップ、前記特徴最適化後のk番目の特徴マップ及び前記スケールアップ後のm+1−k個の特徴マップのうちの少なくとも2項を融合させ、第m段の符号化後のk番目の特徴マップを取得することをさらに含むことを特徴とする請求項8に記載の方法。 - N段の復号化ネットワークによって符号化後の複数の特徴マップに対してスケールアップ及びマルチスケール融合処理を行い、前記処理対象となる画像の予測結果を取得することは、
第1段の復号化ネットワークによって第M段の符号化後のM+1個の特徴マップに対してスケールアップ及びマルチスケール融合処理を行い、第1段の復号化後のM個の特徴マップを取得することと、
第n段の復号化ネットワークによって第n−1段の復号化後のM−n+2個の特徴マップに対してスケールアップ及びマルチスケール融合処理を行い、第n段の復号化後のM−n+1個の特徴マップを取得することと、
第N段の復号化ネットワークによって第N−1段の復号化後のM−N+2個の特徴マップに対してマルチスケール融合処理を行い、前記処理対象となる画像の予測結果を取得することと、を含み、
ここで、nは整数で1<n<N≦Mであることを特徴とする請求項2〜9のいずれか1項に記載の方法。 - 第n段の復号化ネットワークによって第n−1段の復号化後のM−n+2個の特徴マップに対してスケールアップ及びマルチスケール融合処理を行い、第n段の復号化後のM−n+1個の特徴マップを取得することは、
第n−1段の復号化後のM−n+2個の特徴マップに対して融合及びスケールアップを行い、スケールアップ後のM−n+1個の特徴マップを取得することと、
前記スケールアップ後のM−n+1個の特徴マップを融合させ、第n段の復号化後のM−n+1個の特徴マップを取得することと、を含むことを特徴とする請求項10に記載の方法。 - 第N段の復号化ネットワークによって第N−1段の復号化後のM−N+2個の特徴マップに対してマルチスケール融合処理を行い、前記処理対象となる画像の予測結果を取得することは、
第N−1段の復号化後のM−N+2個の特徴マップに対してマルチスケール融合を行い、第N段の復号化後の対象特徴マップを取得することと、
前記第N段の復号化後の対象特徴マップに基づいて、前記処理対象となる画像の予測結果を決定することと、を含むことを特徴とする請求項10又は11に記載の方法。 - 第n−1段の復号化後のM−n+2個の特徴マップに対して融合及びスケールアップを行い、スケールアップ後のM−n+1個の特徴マップを取得することは、
第n段の復号化ネットワークのM−n+1個の第1融合サブネットワークによって第n−1段の復号化後のM−n+2個の特徴マップを融合させ、融合後のM−n+1個の特徴マップを取得することと、
第n段の復号化ネットワークの逆畳み込みサブネットワークによって融合後のM−n+1個の特徴マップをそれぞれスケールアップし、スケールアップ後のM−n+1個の特徴マップを取得することと、を含むことを特徴とする請求項11に記載の方法。 - 前記スケールアップ後のM−n+1個の特徴マップを融合させ、第n段の復号化後のM−n+1個の特徴マップを取得することは、
第n段の復号化ネットワークのM−n+1個の第2融合サブネットワークによって前記スケールアップ後のM−n+1個の特徴マップを融合させ、融合後のM−n+1個の特徴マップを取得することと、
第n段の復号化ネットワークの特徴最適化サブネットワークによって前記融合後のM−n+1個の特徴マップをそれぞれ最適化し、第n段の復号化後のM−n+1個の特徴マップを取得することと、を含むことを特徴とする請求項11又は13に記載の方法。 - 前記第N段の復号化後の対象特徴マップに基づいて、前記処理対象となる画像の予測結果を決定することは、
前記第N段の復号化後の対象特徴マップを最適化し、前記処理対象となる画像の予測密度マップを取得することと、
前記予測密度マップに基づいて、前記処理対象となる画像の予測結果を決定することと、を含むことを特徴とする請求項12に記載の方法。 - 特徴抽出ネットワークによって処理対象となる画像に対して特徴抽出を行い、前記処理対象となる画像の第1特徴マップを取得することは、
前記特徴抽出ネットワークの少なくとも1つの第1畳み込み層によって処理対象となる画像に対して畳み込みを行い、畳み込み後の特徴マップを取得することと、
前記特徴抽出ネットワークの少なくとも1つの第2畳み込み層によって畳み込み後の特徴マップを最適化し、前記処理対象となる画像の第1特徴マップを取得することと、を含むことを特徴とする請求項1〜15のいずれか1項に記載の方法。 - 前記第1畳み込み層は畳み込みカーネルサイズが3×3であり、ストライドが2であり、前記第2畳み込み層は畳み込みカーネルサイズが3×3であり、ストライドが1であることを特徴とする請求項16に記載の方法。
- 複数のラベル付きのサンプル画像を含む予め設定されたトレーニング群に基づいて、前記特徴抽出ネットワーク、前記M段の符号化ネットワーク及び前記N段の復号化ネットワークをトレーニングすることをさらに含むことを特徴とする請求項1〜17のいずれか1項に記載の方法。
- 特徴抽出ネットワークによって処理対象となる画像に対して特徴抽出を行い、前記処理対象となる画像の第1特徴マップを取得するための特徴抽出モジュールと、
M段の符号化ネットワークによって前記第1特徴マップに対してスケールダウン及びマルチスケール融合処理を行い、各特徴マップのスケールが異なる符号化後の複数の特徴マップを取得するための符号化モジュールと、
N段の復号化ネットワークによって符号化後の複数の特徴マップに対してスケールアップ及びマルチスケール融合処理を行い、前記処理対象となる画像の予測結果を取得するための復号化モジュールと、を含み、
ここで、M、Nは1より大きい整数であることを特徴とする画像処理装置。 - 前記符号化モジュールは、
第1段の符号化ネットワークによって前記第1特徴マップに対してスケールダウン及びマルチスケール融合処理を行い、第1段の符号化後の第1特徴マップ及び第1段の符号化後の第2特徴マップを取得するための第1符号化サブモジュールと、
第m段の符号化ネットワークによって第m−1段の符号化後のm個の特徴マップに対してスケールダウン及びマルチスケール融合処理を行い、第m段の符号化後のm+1個の特徴マップを取得するための第2符号化サブモジュールと、
第M段の符号化ネットワークによって第M−1段の符号化後のM個の特徴マップに対してスケールダウン及びマルチスケール融合処理を行い、第M段の符号化後のM+1個の特徴マップを取得するための第3符号化サブモジュールと、を含み、
ここで、mは整数で1<m<Mであることを特徴とする請求項19に記載の装置。 - 前記第1符号化サブモジュールは、
前記第1特徴マップをスケールダウンし、第2特徴マップを取得するための第1縮小サブモジュールと、
前記第1特徴マップと前記第2特徴マップを融合させ、第1段の符号化後の第1特徴マップ及び第1段の符号化後の第2特徴マップを取得するための第1融合サブモジュールと、を含むことを特徴とする請求項20に記載の装置。 - 前記第2符号化サブモジュールは、
第m−1段の符号化後のm個の特徴マップに対してスケールダウン及び融合を行い、スケールが第m−1段の符号化後のm個の特徴マップのスケールよりも小さいm+1番目の特徴マップを取得するための第2縮小サブモジュールと、
前記第m−1段の符号化後のm個の特徴マップ及び前記m+1番目の特徴マップを融合させ、第m段の符号化後のm+1個の特徴マップを取得するための第2融合サブモジュールと、を含むことを特徴とする請求項20又は21に記載の装置。 - 前記第2縮小サブモジュールは、
第m段の符号化ネットワークの畳み込みサブネットワークによって第m−1段の符号化後のm個の特徴マップをそれぞれスケールダウンし、スケールが前記m+1番目の特徴マップのスケールと同じであるスケールダウン後のm個の特徴マップを取得し、
前記スケールダウン後のm個の特徴マップに対して特徴融合を行い、前記m+1番目の特徴マップを取得することを特徴とする請求項22に記載の装置。 - 前記第2融合サブモジュールは、
第m段の符号化ネットワークの特徴最適化サブネットワークによって第m−1段の符号化後のm個の特徴マップ及び前記m+1番目の特徴マップに対してそれぞれ特徴最適化を行い、特徴最適化後のm+1個の特徴マップを取得し、
第m段の符号化ネットワークのm+1個の融合サブネットワークによって前記特徴最適化後のm+1個の特徴マップをそれぞれ融合させ、第m段の符号化後のm+1個の特徴マップを取得することを特徴とする請求項22又は23に記載の装置。 - 前記畳み込みサブネットワークは少なくとも1つの第1畳み込み層を含み、前記第1畳み込み層は畳み込みカーネルサイズが3×3であり、ストライドが2であり、
前記特徴最適化サブネットワークは少なくとも2つの第2畳み込み層及び残差層を含み、前記第2畳み込み層は畳み込みカーネルサイズが3×3であり、ストライドが1であり、
前記m+1個の融合サブネットワークは最適化後のm+1個の特徴マップに対応することを特徴とする請求項23又は24に記載の装置。 - m+1個の融合サブネットワーク内のk番目の融合サブネットワークの場合、第m段の符号化ネットワークのm+1個の融合サブネットワークによって前記特徴最適化後のm+1個の特徴マップをそれぞれ融合させ、第m段の符号化後のm+1個の特徴マップを取得することは、
少なくとも1つの第1畳み込み層によってスケールが特徴最適化後のk番目の特徴マップよりも大きいk−1個の特徴マップをスケールダウンし、スケールが特徴最適化後のk番目の特徴マップのスケールと同じであるスケールダウン後のk−1個の特徴マップを取得することと、及び/又は
アップサンプリング層及び第3畳み込み層によってスケールが特徴最適化後のk番目の特徴マップよりも小さいm+1−k個の特徴マップに対してスケールアップ及びチャネル調整を行い、スケールが特徴最適化後のk番目の特徴マップのスケールと同じであるスケールアップ後のm+1−k個の特徴マップを取得することと、を含み、
ここで、kは整数で1≦k≦m+1であり、前記第3畳み込み層の畳み込みカーネルサイズは1×1であることを特徴とする請求項25に記載の装置。 - 第m段の符号化ネットワークのm+1個の融合サブネットワークによって前記特徴最適化後のm+1個の特徴マップをそれぞれ融合させ、第m段の符号化後のm+1個の特徴マップを取得することは、
前記スケールダウン後のk−1個の特徴マップ、前記特徴最適化後のk番目の特徴マップ及び前記スケールアップ後のm+1−k個の特徴マップのうちの少なくとも2項を融合させ、第m段の符号化後のk番目の特徴マップを取得することをさらに含むことを特徴とする請求項26に記載の装置。 - 前記復号化モジュールは、
第1段の復号化ネットワークによって第M段の符号化後のM+1個の特徴マップに対してスケールアップ及びマルチスケール融合処理を行い、第1段の復号化後のM個の特徴マップを取得するための第1復号化サブモジュールと、
第n段の復号化ネットワークによって第n−1段の復号化後のM−n+2個の特徴マップに対してスケールアップ及びマルチスケール融合処理を行い、第n段の復号化後のM−n+1個の特徴マップを取得するための第2復号化サブモジュールと、
第N段の復号化ネットワークによって第N−1段の復号化後のM−N+2個の特徴マップに対してマルチスケール融合処理を行い、前記処理対象となる画像の予測結果を取得するための第3復号化サブモジュールと、を含み、
ここで、nは整数で1<n<N≦Mであることを特徴とする請求項20〜27のいずれか1項に記載の装置。 - 前記第2復号化サブモジュールは、
第n−1段の復号化後のM−n+2個の特徴マップに対して融合及びスケールアップを行い、スケールアップ後のM−n+1個の特徴マップを取得するための拡大サブモジュールと、
前記スケールアップ後のM−n+1個の特徴マップを融合させ、第n段の復号化後のM−n+1個の特徴マップを取得するための第3融合サブモジュールと、を含むことを特徴とする請求項28に記載の装置。 - 前記第3復号化サブモジュールは、
第N−1段の復号化後のM−N+2個の特徴マップに対してマルチスケール融合を行い、第N段の復号化後の対象特徴マップを取得するための第4融合サブモジュールと、
前記第N段の復号化後の対象特徴マップに基づいて、前記処理対象となる画像の予測結果を決定するための結果決定サブモジュールと、を含むことを特徴とする請求項28又は29に記載の装置。 - 前記拡大サブモジュールは、
第n段の復号化ネットワークのM−n+1個の第1融合サブネットワークによって第n−1段の復号化後のM−n+2個の特徴マップを融合させ、融合後のM−n+1個の特徴マップを取得し、
第n段の復号化ネットワークの逆畳み込みサブネットワークによって融合後のM−n+1個の特徴マップをそれぞれスケールアップし、スケールアップ後のM−n+1個の特徴マップを取得することを特徴とする請求項29に記載の装置。 - 前記第3融合サブモジュールは、
第n段の復号化ネットワークのM−n+1個の第2融合サブネットワークによって前記スケールアップ後のM−n+1個の特徴マップを融合させ、融合後のM−n+1個の特徴マップを取得し、
第n段の復号化ネットワークの特徴最適化サブネットワークによって前記融合後のM−n+1個の特徴マップをそれぞれ最適化し、第n段の復号化後のM−n+1個の特徴マップを取得することを特徴とする請求項29又は31に記載の装置。 - 前記結果決定サブモジュールは、
前記第N段の復号化後の対象特徴マップを最適化し、前記処理対象となる画像の予測密度マップを取得し、
前記予測密度マップに基づいて、前記処理対象となる画像の予測結果を決定することを特徴とする請求項30に記載の装置。 - 前記特徴抽出モジュールは、
前記特徴抽出ネットワークの少なくとも1つの第1畳み込み層によって処理対象となる画像に対して畳み込みを行い、畳み込み後の特徴マップを取得するための畳み込みサブモジュールと、
前記特徴抽出ネットワークの少なくとも1つの第2畳み込み層によって畳み込み後の特徴マップを最適化し、前記処理対象となる画像の第1特徴マップを取得するための最適化サブモジュールと、を含むことを特徴とする請求項19〜33のいずれか1項に記載の装置。 - 前記第1畳み込み層は畳み込みカーネルサイズが3×3であり、ストライドが2であり、前記第2畳み込み層は畳み込みカーネルサイズが3×3であり、ストライドが1であることを特徴とする請求項34に記載の装置。
- 複数のラベル付きのサンプル画像を含む予め設定されたトレーニング群に基づいて、前記特徴抽出ネットワーク、前記M段の符号化ネットワーク及び前記N段の復号化ネットワークをトレーニングするためのレーニングサブモジュールをさらに含むことを特徴とする請求項19〜35のいずれか1項に記載の装置。
- プロセッサと、
プロセッサにより実行可能な命令を記憶するためのメモリと、を含み、
前記プロセッサは、前記メモリに記憶されている命令を呼び出すことにより、請求項1〜18のいずれか1項に記載の方法を実行するように構成されることを特徴とする電子機器。 - コンピュータプログラム命令を記憶しているコンピュータ読み取り可能な記憶媒体であって、
前記コンピュータプログラム命令は、プロセッサにより実行されると、請求項1〜18のいずれか1項に記載の方法を実現させることを特徴とするコンピュータ読み取り可能な記憶媒体。 - コンピュータ読み取り可能なコードを含み、前記コンピュータ読み取り可能なコードは、電子機器において実行されると、前記電子機器のプロセッサに請求項1〜18のいずれか1項に記載の方法を実現するための命令を実行させることを特徴とするコンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910652028.6A CN110378976B (zh) | 2019-07-18 | 2019-07-18 | 图像处理方法及装置、电子设备和存储介质 |
CN201910652028.6 | 2019-07-18 | ||
PCT/CN2019/116612 WO2021008022A1 (zh) | 2019-07-18 | 2019-11-08 | 图像处理方法及装置、电子设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021533430A true JP2021533430A (ja) | 2021-12-02 |
JP7106679B2 JP7106679B2 (ja) | 2022-07-26 |
Family
ID=68254016
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020563999A Active JP7106679B2 (ja) | 2019-07-18 | 2019-11-08 | 画像処理方法、画像処理装置、電子機器、記憶媒体及びコンピュータプログラム |
Country Status (7)
Country | Link |
---|---|
US (1) | US20210019562A1 (ja) |
JP (1) | JP7106679B2 (ja) |
KR (1) | KR102436593B1 (ja) |
CN (1) | CN110378976B (ja) |
SG (1) | SG11202008188QA (ja) |
TW (2) | TWI773481B (ja) |
WO (1) | WO2021008022A1 (ja) |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110378976B (zh) * | 2019-07-18 | 2020-11-13 | 北京市商汤科技开发有限公司 | 图像处理方法及装置、电子设备和存储介质 |
CN112784629A (zh) * | 2019-11-06 | 2021-05-11 | 株式会社理光 | 图像处理方法、装置和计算机可读存储介质 |
CN111027387B (zh) * | 2019-11-11 | 2023-09-26 | 北京百度网讯科技有限公司 | 人数评估及评估模型获取方法、装置及存储介质 |
CN112884772B (zh) | 2019-11-29 | 2024-03-19 | 北京四维图新科技股份有限公司 | 语义分割架构 |
CN111429466A (zh) * | 2020-03-19 | 2020-07-17 | 北京航空航天大学 | 一种基于多尺度信息融合网络的空基人群计数与密度估计方法 |
CN111507408B (zh) * | 2020-04-17 | 2022-11-04 | 深圳市商汤科技有限公司 | 图像处理方法及装置、电子设备和存储介质 |
CN111582353B (zh) * | 2020-04-30 | 2022-01-21 | 恒睿(重庆)人工智能技术研究院有限公司 | 一种图像特征检测方法、系统、设备以及介质 |
CN112784897B (zh) | 2021-01-20 | 2024-03-26 | 北京百度网讯科技有限公司 | 图像处理方法、装置、设备和存储介质 |
KR20220108922A (ko) | 2021-01-28 | 2022-08-04 | 주식회사 만도 | 조향 제어 장치와, 조향 어시스트 장치 및 방법 |
CN112990025A (zh) * | 2021-03-19 | 2021-06-18 | 北京京东拓先科技有限公司 | 用于处理数据的方法、装置、设备以及存储介质 |
CN113436287B (zh) * | 2021-07-05 | 2022-06-24 | 吉林大学 | 一种基于lstm网络与编解码网络的篡改图像盲取证方法 |
CN113486908B (zh) * | 2021-07-13 | 2023-08-29 | 杭州海康威视数字技术股份有限公司 | 目标检测方法、装置、电子设备及可读存储介质 |
CN113706530A (zh) * | 2021-10-28 | 2021-11-26 | 北京矩视智能科技有限公司 | 基于网络结构的表面缺陷区域分割模型生成方法及装置 |
CN114419449B (zh) * | 2022-03-28 | 2022-06-24 | 成都信息工程大学 | 一种自注意力多尺度特征融合的遥感图像语义分割方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018181124A (ja) * | 2017-04-18 | 2018-11-15 | Kddi株式会社 | エンコーダデコーダ畳み込みニューラルネットワークにおける解像感を改善するプログラム |
JP2020535502A (ja) * | 2017-09-22 | 2020-12-03 | エフ.ホフマン−ラ ロシュ アーゲーF. Hoffmann−La Roche Aktiengesellschaft | 組織画像からのアーチファクト除去 |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101674568B1 (ko) * | 2010-04-12 | 2016-11-10 | 삼성디스플레이 주식회사 | 영상 변환 장치 및 이를 포함하는 입체 영상 표시 장치 |
CN106462940A (zh) * | 2014-10-09 | 2017-02-22 | 微软技术许可有限责任公司 | 图像中通用对象检测 |
EP3259914A1 (en) * | 2015-02-19 | 2017-12-27 | Magic Pony Technology Limited | Interpolating visual data |
CN107578054A (zh) * | 2017-09-27 | 2018-01-12 | 北京小米移动软件有限公司 | 图像处理方法及装置 |
US10043113B1 (en) * | 2017-10-04 | 2018-08-07 | StradVision, Inc. | Method and device for generating feature maps by using feature upsampling networks |
CN109509192B (zh) * | 2018-10-18 | 2023-05-30 | 天津大学 | 融合多尺度特征空间与语义空间的语义分割网络 |
CN113569796A (zh) * | 2018-11-16 | 2021-10-29 | 北京市商汤科技开发有限公司 | 关键点检测方法及装置、电子设备和存储介质 |
CN110009598B (zh) * | 2018-11-26 | 2023-09-05 | 腾讯科技(深圳)有限公司 | 用于图像分割的方法和图像分割设备 |
CN109598727B (zh) * | 2018-11-28 | 2021-09-14 | 北京工业大学 | 一种基于深度神经网络的ct图像肺实质三维语义分割方法 |
CN109598298B (zh) * | 2018-11-29 | 2021-06-04 | 上海皓桦科技股份有限公司 | 图像物体识别方法和系统 |
CN109598728B (zh) * | 2018-11-30 | 2019-12-27 | 腾讯科技(深圳)有限公司 | 图像分割方法、装置、诊断系统及存储介质 |
CN109784186B (zh) * | 2018-12-18 | 2020-12-15 | 深圳云天励飞技术有限公司 | 一种行人重识别方法、装置、电子设备及计算机可读存储介质 |
CN109635882B (zh) * | 2019-01-23 | 2022-05-13 | 福州大学 | 一种基于多尺度卷积特征提取和融合的显著物体检测方法 |
CN109903301B (zh) * | 2019-01-28 | 2021-04-13 | 杭州电子科技大学 | 一种基于多级特征信道优化编码的图像轮廓检测方法 |
CN109816659B (zh) * | 2019-01-28 | 2021-03-23 | 北京旷视科技有限公司 | 图像分割方法、装置及系统 |
CN109815964A (zh) * | 2019-01-31 | 2019-05-28 | 北京字节跳动网络技术有限公司 | 提取图像的特征图的方法和装置 |
CN109816661B (zh) * | 2019-03-22 | 2022-07-01 | 电子科技大学 | 一种基于深度学习的牙齿ct图像分割方法 |
CN109996071B (zh) * | 2019-03-27 | 2020-03-27 | 上海交通大学 | 基于深度学习的可变码率图像编码、解码系统及方法 |
US10902571B2 (en) * | 2019-05-20 | 2021-01-26 | Disney Enterprises, Inc. | Automated image synthesis using a comb neural network architecture |
CN110378976B (zh) * | 2019-07-18 | 2020-11-13 | 北京市商汤科技开发有限公司 | 图像处理方法及装置、电子设备和存储介质 |
-
2019
- 2019-07-18 CN CN201910652028.6A patent/CN110378976B/zh active Active
- 2019-11-08 SG SG11202008188QA patent/SG11202008188QA/en unknown
- 2019-11-08 WO PCT/CN2019/116612 patent/WO2021008022A1/zh active Application Filing
- 2019-11-08 JP JP2020563999A patent/JP7106679B2/ja active Active
- 2019-11-08 KR KR1020207036987A patent/KR102436593B1/ko active IP Right Grant
- 2019-12-16 TW TW110129660A patent/TWI773481B/zh active
- 2019-12-16 TW TW108145987A patent/TWI740309B/zh active
-
2020
- 2020-08-25 US US17/002,114 patent/US20210019562A1/en not_active Abandoned
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018181124A (ja) * | 2017-04-18 | 2018-11-15 | Kddi株式会社 | エンコーダデコーダ畳み込みニューラルネットワークにおける解像感を改善するプログラム |
JP2020535502A (ja) * | 2017-09-22 | 2020-12-03 | エフ.ホフマン−ラ ロシュ アーゲーF. Hoffmann−La Roche Aktiengesellschaft | 組織画像からのアーチファクト除去 |
Non-Patent Citations (1)
Title |
---|
村上佳菜子,外5名: ""U−Netおよびresidual U−Netを用いたCT画像中のびまん性肺疾患領域のセグメンテーシ", 電子情報通信学会技術研究報告, vol. MI2018-102, JPN6022002377, 22 February 2019 (2019-02-22), pages 175 - 179, ISSN: 0004690304 * |
Also Published As
Publication number | Publication date |
---|---|
KR20210012004A (ko) | 2021-02-02 |
KR102436593B1 (ko) | 2022-08-25 |
US20210019562A1 (en) | 2021-01-21 |
TW202105321A (zh) | 2021-02-01 |
SG11202008188QA (en) | 2021-02-25 |
JP7106679B2 (ja) | 2022-07-26 |
CN110378976B (zh) | 2020-11-13 |
TW202145143A (zh) | 2021-12-01 |
WO2021008022A1 (zh) | 2021-01-21 |
TWI740309B (zh) | 2021-09-21 |
CN110378976A (zh) | 2019-10-25 |
TWI773481B (zh) | 2022-08-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7041284B2 (ja) | 画像処理方法、画像処理装置、電子機器、記憶媒体及びコンピュータプログラム | |
JP2021533430A (ja) | 画像処理方法、画像処理装置、電子機器、記憶媒体及びコンピュータプログラム | |
JP2022522596A (ja) | 画像識別方法及び装置、電子機器並びに記憶媒体 | |
US20210089799A1 (en) | Pedestrian Recognition Method and Apparatus and Storage Medium | |
JP6968270B2 (ja) | 画像の記述文位置決定方法及び装置、電子機器並びに記憶媒体 | |
JP2022500791A (ja) | 画像処理方法、装置、電子機器、記憶媒体及びコンピュータプログラム | |
JP2022517914A (ja) | 顔と手を関連付けて検出する方法及び装置、電子機器、記憶媒体及びコンピュータプログラム | |
JP2022501688A (ja) | 画像処理方法及び装置、電子機器並びに記憶媒体 | |
JP7090183B2 (ja) | ビデオ処理方法及び装置、電子機器、並びに記憶媒体 | |
CN111340731B (zh) | 图像处理方法及装置、电子设备和存储介质 | |
JP2021512378A (ja) | アンカー決定方法及び装置、電子機器並びに記憶媒体 | |
JP2022522551A (ja) | 画像処理方法及び装置、電子機器並びに記憶媒体 | |
JP2022532322A (ja) | 画像処理方法及び装置、電子機器並びに記憶媒体 | |
US20220392202A1 (en) | Imaging processing method and apparatus, electronic device, and storage medium | |
JP2022515274A (ja) | 検出器の配置方法、検出器の配置装置及び非一時的コンピュータ可読記憶媒体 | |
JP2022533065A (ja) | 文字認識方法及び装置、電子機器並びに記憶媒体 | |
CN113841179A (zh) | 图像生成方法及装置、电子设备及存储介质 | |
CN110633715B (zh) | 图像处理方法、网络训练方法及装置、和电子设备 | |
KR20220047802A (ko) | 이미지 재구성 방법 및 장치, 전자 기기 및 저장 매체 | |
CN110781842A (zh) | 图像处理方法及装置、电子设备和存储介质 | |
CN112598676A (zh) | 图像分割方法及装置、电子设备和存储介质 | |
JP2022524254A (ja) | 画像処理方法及び装置、電子機器並びに記憶媒体 | |
KR20210113617A (ko) | 네트워크 트레이닝 방법 및 장치, 이미지 처리 방법 및 장치 | |
CN112200201A (zh) | 一种目标检测方法及装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201111 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201111 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220125 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220405 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220705 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220713 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7106679 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |