JP7635170B2 - 画像処理装置、学習装置、推論装置、および画像処理方法 - Google Patents
画像処理装置、学習装置、推論装置、および画像処理方法 Download PDFInfo
- Publication number
- JP7635170B2 JP7635170B2 JP2022019857A JP2022019857A JP7635170B2 JP 7635170 B2 JP7635170 B2 JP 7635170B2 JP 2022019857 A JP2022019857 A JP 2022019857A JP 2022019857 A JP2022019857 A JP 2022019857A JP 7635170 B2 JP7635170 B2 JP 7635170B2
- Authority
- JP
- Japan
- Prior art keywords
- feature
- image
- extraction
- unit
- feature amount
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/7715—Feature extraction, e.g. by transforming the feature space, e.g. multi-dimensional scaling [MDS]; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/751—Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Description
第1の実施形態では、画像に認識対象の物体が含まれているか否かを認識するニューラルネットワークを学習することについて説明される。上記の物体は、例えば、外観検査における製造品のひびや汚れ、或いは医療診断における腫瘍や内出血した血管などを想定する。
画像処理装置110が入力画像を取得すると、処理画像生成部610は、入力画像に基づくN個(N≧3)の処理画像を生成する。
第1の抽出部620-1は、第1の処理画像について第1の抽出処理を行うことによって第1の特徴量を生成する。
メモリ112は、第1の抽出処理の過程で発生する第1の処理過程データを保持する。
第2の抽出部620-2は、第2の処理画像について第2の抽出処理を行うことによって第2の特徴量を生成する。
メモリ112は、第2の抽出処理の過程で発生する第2の処理過程データを保持する。この時、メモリ112は、2つの処理過程データを保持している。
第1の選択部630-1は、第1の特徴量と第2の特徴量とを比較することによって大きい方を第1の選択特徴量として選択する。
最適化部114は、第1の特徴量と第2の特徴量との比較において選択されなかった特徴量に対応する処理過程データをメモリ112から解放させる。これにより、メモリ112は、1つの処理過程データを保持する。
画像処理装置110は、変数iおよび変数jを定義し、それぞれ3および1を代入する。
第iの抽出部620-iは、第iの処理画像について第iの抽出処理を行うことによって第iの特徴量を生成する。
メモリ112は、第iの抽出処理の過程で発生する第iの処理過程データを保持する。この時、メモリ112は、2つの処理過程データを保持している。
第(i-1)の選択部630-(i-1)は、第jの選択特徴量と第iの特徴量とを比較することによって大きい方を第(j+1)の選択特徴量として選択する。
最適化部114は、第jの選択特徴量と第iの特徴量との比較において選択されなかった特徴量に対応する処理過程データをメモリ112から解放させる。これにより、メモリ112は、1つの処理過程データだけを保持する。
画像処理装置110は、変数iがNであるか否かを判定する。変数iがNではない場合、処理はステップST714へ進む。他方、変数iがNである場合、画像処理装置110は、直前の選択処理において選択された選択特徴量を最大特徴量として誤差算出部120へと出力し、最大特徴量に関する処理過程データを学習部130へと出力し、処理は終了する。
画像処理装置110は、変数iおよび変数jにそれぞれ1を加算する。ステップST714の処理の後、処理はステップST709へ戻る。
上記では、入力画像を分割することによって複数の処理画像を生成する例について説明した。しかし、複数の処理画像は、入力画像の分割に限らない。以下では、入力画像を縮小することによって複数の処理画像を生成する例について、図9を用いて説明する。
上記では、最大特徴量選択部における各々の選択部において、異なる選択部からの出力同士を比較する構成は例示していなかった。以下では、異なる選択部からの出力同士を比較する選択部を含む最大特徴量選択部の構成について、図11を用いて説明する。尚、図11では、説明を簡略化するため、4つの処理画像を用いることを想定する。
画像処理装置110が入力画像を取得すると、処理画像生成部1110は、入力画像に基づくN個(N≧4)の処理画像を生成する。
ステップST1202の処理は、図7のステップST702からステップST707までの処理と同様である。具体的には、第1の抽出部1120-1は、第1の処理画像について第1の抽出処理を行うことによって第1の特徴量を生成する。メモリ112Cは、第1の抽出処理の過程で発生する第1の処理過程データを保持する。第2の抽出部1120-2は、第2の処理画像について第2の抽出処理を行うことによって第2の特徴量を生成する。メモリ112Cは、第2の抽出処理の過程で発生する第2の処理過程データを保持する。第1の選択部1130-1は、第1の特徴量と第2の特徴量とを比較することによって大きい方を第1の選択特徴量として選択する。最適化部114Cは、第1の特徴量と第2の特徴量との比較において選択されなかった特徴量に対応する処理過程データをメモリ112Cから解放させる。
画像処理装置110は、変数iおよび変数jを定義し、それぞれ3および2を代入する。
第iの抽出部620-iは、第iの処理画像について第iの抽出処理を行うことによって第iの特徴量を生成する。
メモリ112Cは、第iの抽出処理の過程で発生する第iの処理過程データを保持する。この時、メモリ112Cは、2つの処理過程データを保持している。
第(i+1)の抽出部620-(i+1)は、第(i+1)の処理画像について第(i+1)の抽出処理を行うことによって第(i+1)の特徴量を生成する。
メモリ112Cは、第(i+1)の抽出処理の過程で発生する第(i+1)の処理過程データを保持する。この時、メモリ112Cは、3つの処理過程データを保持している。
第(i-1)の選択部1130-(i-1)は、第iの特徴量と第(i+1)の特徴量とを比較することによって大きい方を第jの選択特徴量として選択する。
最適化部114Cは、第iの特徴量と第(i+1)の特徴量との比較において選択されなかった特徴量に対応する処理過程データをメモリ112Cから解放させる。これにより、メモリ112Cは、2つの処理過程データを保持する。
第iの選択部1130-iは、第(j-1)の選択特徴量と第jの選択特徴量とを比較することによって大きい方を第(j+1)の選択特徴量として選択する。
最適化部114Cは、第(j-1)の選択特徴量と第jの選択特徴量との比較において選択されなかった特徴量に対応する処理過程データをメモリ112Cから解放させる。これにより、メモリ112Cは、1つの処理過程データだけを保持する。
画像処理装置110は、変数iがN-1であるか否かを判定する。変数iがN-1ではない場合、処理はステップST1213へ進む。他方、変数iがN-1である場合、画像処理装置110は、直前の選択処理において選択された選択特徴量を最大特徴量として誤差算出部120へと出力し、最大特徴量に関する処理過程データを学習部130へと出力し、処理は終了する。
画像処理装置110は、変数iおよび変数jにそれぞれ2を加算する。ステップST1213の後、処理はステップST1204へ戻る。
上記では、入力画像を基準とした複数の処理画像を用いて、複数の処理画像のそれぞれについて特徴量抽出処理を行う構成であった。換言すると、上記の構成は、複数の処理画像それぞれについて個別ニューラルネットワークを用いていた。以下では、入力画像に対して1つのニューラルネットワークを用いた処理を行いつつも、従来よりもメモリ容量を低減可能な構成について、図13から図15までを用いて説明する。
上記では、1チャンネルの入力画像(例えば、白黒画像)を想定して説明した。しかし、入力画像はRGBのカラー画像でもよい。入力画像をカラー画像とした場合、画像処理装置110は、一つの入力画像を、Red成分、Green成分、およびBlue成分の縦横の画素数が同じ3枚の画像、いわゆる3チャンネルの画像として扱う。この場合、画像処理装置110は、3×3画素×3チャンネルなどの3次元のカーネルを用いる。また、画像処理装置110は、特徴量抽出処理において、2チャンネル以上の変換処理を行ってもよい。ニューラルネットワークを用いた画像認識処理においては、一般的に変換画像のチャンネル数を多くするほど認識精度が高くなることが知られている。よって、本実施形態においても、必要に応じてチャンネル数を設定すればよい。
上記では、特徴量は、スカラー値として生成されることを想定して説明した。しかし、特徴量は複数の要素を有するベクトルでもよい。例えば、ひびと汚れなど種類が異なる物体を区別して、それらを同時に認識する場合、画像処理装置110は、認識対象の物体の種類の数と同じ数の次元のベクトルを特徴量として生成する。
第1の実施形態では、画像処理装置を含む学習装置について説明した。他方、第2の実施形態では、画像処理装置を含む推論装置について説明する。第2の実施形態に係る画像処理装置の構成は、第1の実施形態に係る画像処理装置の構成と略同様である。一方で、第2の実施形態に係る画像処理装置は、メモリに保持される処理過程データの種類が第1の実施形態に係る画像処理装置と異なる。
第1の実施形態で述べた学習装置と異なり、推論装置におけるメモリは、所定の条件を満たすことにより、選択されなかった特徴量に関する処理過程データを保持してもよい。所定の条件とは、特徴量がしきい値以上の場合である。具体的には、最大特徴量選択部1713の各々の選択部は、選択されなかった特徴量に対してしきい値との比較処理を行う。そして、最大特徴量選択部1713は、選択されなかった特徴量がしきい値以上の場合に、その特徴量に関する非選択情報を生成しない。これにより、メモリ1712に複数の処理過程データが保持されることから、推論装置1700は、入力画像に認識対象の物体が複数含まれる場合に対応することができる。この場合、推論装置1700は、最大特徴量としきい値以上の特徴量とに基づいて推論結果を出力してもよい。
図22は、一実施形態に係るコンピュータ2200のハードウェア構成を例示するブロック図である。コンピュータ2200は、ハードウェアとして、CPU(Central Processing Unit)2210、RAM(Random Access Memory)2220、プログラムメモリ2230、補助記憶装置2240、入出力インタフェース2250を備える。CPU2210は、バス2260を介して、RAM2220、プログラムメモリ2230、補助記憶装置2240、および入出力インタフェース2250と通信する。
Claims (21)
- 入力画像に基づくN個(N≧3)の処理画像について、ニューラルネットワークを用いた特徴量抽出処理を行うことによってN個の特徴量を生成する特徴量抽出部と、
前記特徴量抽出処理の過程で発生する処理過程データを保持するメモリと、
前記N個の特徴量のうちの2個以上N-1個以下であるM個の組み合わせで2回以上の比較を行うことによって最大特徴量を選択する最大特徴量選択部と、
前記2回以上の比較毎に、選択されなかったM-1個以下の特徴量に対応するM-1個以下の処理過程データを前記メモリから解放させる最適化部と
を具備する、画像処理装置。 - 前記特徴量抽出部は、前記入力画像の一部を切り出すことによって前記N個の処理画像を生成する、
請求項1に記載の画像処理装置。 - 前記特徴量抽出部は、前記N個の特徴量を生成する際に、同じパラメータの前記ニューラルネットワークを用いて前記特徴量抽出処理を行う、
請求項1または請求項2に記載の画像処理装置。 - 前記特徴量抽出部は、前記入力画像を縮小させることによって縮小率の異なる前記N個の処理画像を生成する、
請求項1に記載の画像処理装置。 - 前記特徴量抽出部は、前記N個の特徴量を生成する際に、それぞれ異なるパラメータの前記ニューラルネットワークを用いて前記特徴量抽出処理を行う、
請求項4に記載の画像処理装置。 - 前記N個の処理画像は、前記入力画像に対して畳み込み処理を行って生成されうる中間画像を縦横1画素以上のN個のブロックに分解した前記N個のブロックにそれぞれ対応する前記入力画像におけるN個の領域に相当し、
前記特徴量抽出処理は、前記畳み込み処理であり、
前記特徴量抽出部は、前記N個の領域について、前記畳み込み処理を行うことによって前記N個のブロックのそれぞれに対応する前記N個の特徴量を生成する、
請求項1に記載の画像処理装置。 - 前記特徴量抽出部は、前記N個のブロックのそれぞれについて、加算、平均、または最大値を選択することによって前記N個の特徴量を生成する、
請求項6に記載の画像処理装置。 - 前記N個の特徴量のそれぞれは、複数の要素を持つベクトルである、
請求項1から請求項5までのいずれか一項に記載の画像処理装置。 - 前記最大特徴量選択部は、前記2回以上の比較のそれぞれにおいて、前記複数の要素毎に比較を行うことによって大きい要素を選択し、
前記最大特徴量は、前記N個の特徴量のうちの最も大きい要素を組み合わせたベクトルに相当する、
請求項8に記載の画像処理装置。 - 前記最適化部は、更に、前記最大特徴量を選択するための比較毎に、選択されなかった要素に対応する処理過程データを前記メモリから解放させる、
請求項9に記載の画像処理装置。 - 前記特徴量抽出部は、前記N個の特徴量をそれぞれシーケンシャルに、または複数の特徴量毎に生成する、
請求項1から請求項10までのいずれか一項に記載の画像処理装置。 - 前記メモリは、M個の特徴量に対応するM個の処理過程データを上限として保持する、
請求項1から請求項11までのいずれか一項に記載の画像処理装置。 - 前記最大特徴量選択部は、前記2回以上の比較において、前記M個の組み合わせの個数が異なる比較を含む、
請求項1から請求項12までのいずれか一項に記載の画像処理装置。 - 前記N個の処理画像は、第1の処理画像と、第2の処理画像と、第3の処理画像とを含み、
前記特徴量抽出処理は、第1の抽出処理と、第2の抽出処理と、第3の抽出処理とを含み、
前記N個の特徴量は、第1の特徴量と、第2の特徴量と、第3の特徴量とを含み、
前記特徴量抽出部は、第1の抽出部と、第2の抽出部と、第3の抽出部とを含み、
前記最大特徴量選択部は、第1の選択部と、第2の選択部とを含み、
前記第1の抽出部は、前記第1の処理画像について前記第1の抽出処理を行うことによって前記第1の特徴量を生成し、
前記メモリは、前記第1の抽出処理の過程で発生する第1の処理過程データを保持し、
前記第2の抽出部は、前記第2の処理画像について前記第2の抽出処理を行うことによって前記第2の特徴量を生成し、
前記メモリは、前記第2の抽出処理の過程で発生する第2の処理過程データを保持し、
前記第1の選択部は、前記第1の特徴量と前記第2の特徴量とを比較することによって大きい方を第1の選択特徴量として選択し、
前記最適化部は、前記第1の選択部による選択において、選択されなかった特徴量に対応する処理過程データを前記メモリから解放させ、
前記第3の抽出部は、前記第3の処理画像について前記第3の抽出処理を行うことによって前記第3の特徴量を生成し、
前記メモリは、前記第3の抽出処理の過程で発生する第3の処理過程データを保持し、
前記第2の選択部は、前記第1の選択特徴量と前記第3の特徴量とを比較することによって大きい方を第2の選択特徴量として選択し、
前記最適化部は、前記第2の選択部による選択において、選択されなかった特徴量に対応する処理過程データを前記メモリから解放させる、
請求項1に記載の画像処理装置。 - 前記Nは4以上であり、
前記N個の処理画像は、第1の処理画像と、第2の処理画像と、第3の処理画像と、第4の処理画像とを含み、
前記特徴量抽出処理は、第1の抽出処理と、第2の抽出処理と、第3の抽出処理と、第4の抽出処理とを含み、
前記N個の特徴量は、第1の特徴量と、第2の特徴量と、第3の特徴量と、第4の特徴量とを含み、
前記特徴量抽出部は、第1の抽出部と、第2の抽出部と、第3の抽出部と、第4の抽出部とを含み、
前記最大特徴量選択部は、第1の選択部と、第2の選択部と、第3の選択部とを含み、
前記第1の抽出部は、前記第1の処理画像について前記第1の抽出処理を行うことによって前記第1の特徴量を生成し、
前記メモリは、前記第1の抽出処理の過程で発生する第1の処理過程データを保持し、
前記第2の抽出部は、前記第2の処理画像について前記第2の抽出処理を行うことによって前記第2の特徴量を生成し、
前記メモリは、前記第2の抽出処理の過程で発生する第2の処理過程データを保持し、
前記第1の選択部は、前記第1の特徴量と前記第2の特徴量とを比較することによって大きい方を第1の選択特徴量として選択し、
前記最適化部は、前記第1の選択部による選択において、選択されなかった特徴量に対応する処理過程データを前記メモリから解放させ、
前記第3の抽出部は、前記第3の処理画像について前記第3の抽出処理を行うことによって前記第3の特徴量を生成し、
前記メモリは、前記第3の抽出処理の過程で発生する第3の処理過程データを保持し、
前記第4の抽出部は、前記第4の処理画像について前記第4の抽出処理を行うことによって前記第4の特徴量を生成し、
前記メモリは、前記第4の抽出処理の過程で発生する第4の処理過程データを保持し、
前記第2の選択部は、前記第3の特徴量と前記第4の特徴量とを比較することによって大きい方を第2の選択特徴量として選択し、
前記最適化部は、前記第2の選択部による選択において、選択されなかった特徴量に対応する処理過程データを前記メモリから解放させ、
前記第3の選択部は、前記第1の選択特徴量と前記第2の選択特徴量とを比較することによって大きい方を第3の選択特徴量として選択し、
前記最適化部は、前記第3の選択部による選択において、選択されなかった特徴量に対応する処理過程データを前記メモリから解放させる、
請求項1に記載の画像処理装置。 - 請求項1から請求項15までのいずれか一項に記載の画像処理装置と、
前記最大特徴量と前記入力画像に対応する正解特徴量とに基づいて誤差値を算出する誤差算出部と、
前記メモリが最終的に保持している前記最大特徴量に関する処理過程データと前記誤差値とに基づいて前記ニューラルネットワークを学習する学習部と
を具備する、学習装置。 - 請求項1から請求項15までのいずれか一項に記載の画像処理装置と、
前記最大特徴量に基づいて前記入力画像において認識対象の物体が存在しているか否かを表す推論結果を出力する出力部と
を具備する、推論装置。 - 前記最大特徴量選択部は、前記2回以上の比較毎に、前記M個の特徴量それぞれとしきい値とを更に比較し、
前記最適化部は、前記2回以上の比較毎に、前記選択されなかったM-1個以下の特徴量うち、前記しきい値以上の特徴量に対応する処理過程データを前記メモリから解放させない、
請求項17に記載の推論装置。 - 前記出力部は、前記最大特徴量と前記しきい値以上の特徴量とに基づいて前記推論結果を出力する、
請求項18に記載の推論装置。 - 前記処理過程データは、前記推論結果を可視化した推論画像であり、
前記出力部は、更に、前記入力画像と前記推論画像とに基づいて前記入力画像に写っている前記認識対象の物体の画素を強調させた画像を出力する、
請求項17から請求項19までのいずれか一項に記載の推論装置。 - 入力画像に基づくN個(N≧3)の処理画像について、ニューラルネットワークを用いた特徴量抽出処理を行うことによってN個の特徴量を生成することと、
前記特徴量抽出処理の過程で発生する処理過程データをメモリに保持することと、
前記N個の特徴量のうちの2個以上N-1個以下であるM個の組み合わせで2回以上の比較を行うことによって最大特徴量を選択することと、
前記2回以上の比較毎に、選択されなかったM-1個以下の特徴量に対応するM-1個以下の処理過程データを前記メモリから解放させることと
を具備する、画像処理方法。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2022019857A JP7635170B2 (ja) | 2022-02-10 | 2022-02-10 | 画像処理装置、学習装置、推論装置、および画像処理方法 |
| US17/930,755 US12277751B2 (en) | 2022-02-10 | 2022-09-09 | Image processing apparatus, learning apparatus, inference apparatus, and image processing method |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2022019857A JP7635170B2 (ja) | 2022-02-10 | 2022-02-10 | 画像処理装置、学習装置、推論装置、および画像処理方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2023117247A JP2023117247A (ja) | 2023-08-23 |
| JP7635170B2 true JP7635170B2 (ja) | 2025-02-25 |
Family
ID=87521294
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2022019857A Active JP7635170B2 (ja) | 2022-02-10 | 2022-02-10 | 画像処理装置、学習装置、推論装置、および画像処理方法 |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US12277751B2 (ja) |
| JP (1) | JP7635170B2 (ja) |
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2010128930A (ja) | 2008-11-28 | 2010-06-10 | Toyota Motor Corp | 画像処理装置 |
| JP2019212206A (ja) | 2018-06-08 | 2019-12-12 | 沖電気工業株式会社 | ニューラルネットワーク軽量化装置、情報処理装置、ニューラルネットワーク軽量化方法およびプログラム |
| JP2020144659A (ja) | 2019-03-07 | 2020-09-10 | キヤノン株式会社 | データ処理装置及びその方法、プログラム |
| CN111950718A (zh) | 2019-05-16 | 2020-11-17 | 北京知存科技有限公司 | 利用存算一体芯片实现递进式cnn运算的方法 |
| US20210073585A1 (en) | 2019-09-11 | 2021-03-11 | Expedera, Inc. | Method And Apparatus For Efficiently Processing Convolution Neural Network Operations |
Family Cites Families (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7269406B2 (en) * | 2005-05-26 | 2007-09-11 | Intel Corporation | Methods and apparatus for providing information indicative of traffic delay of a wireless link |
| US7613357B2 (en) * | 2005-09-20 | 2009-11-03 | Gm Global Technology Operations, Inc. | Method for warped image object recognition |
| US8131107B2 (en) * | 2008-05-12 | 2012-03-06 | General Electric Company | Method and system for identifying defects in NDT image data |
| US8229209B2 (en) * | 2008-12-26 | 2012-07-24 | Five Apes, Inc. | Neural network based pattern recognizer |
| CN102422319B (zh) * | 2009-03-04 | 2014-04-30 | 公立大学法人大阪府立大学 | 图像检索方法和图像存储方法 |
| JP2011013732A (ja) * | 2009-06-30 | 2011-01-20 | Sony Corp | 情報処理装置、情報処理方法、およびプログラム |
| JP7297705B2 (ja) | 2020-03-18 | 2023-06-26 | 株式会社東芝 | 処理装置、処理方法、学習装置およびプログラム |
| JP7481956B2 (ja) | 2020-08-26 | 2024-05-13 | 株式会社東芝 | 推論装置、方法、プログラムおよび学習装置 |
-
2022
- 2022-02-10 JP JP2022019857A patent/JP7635170B2/ja active Active
- 2022-09-09 US US17/930,755 patent/US12277751B2/en active Active
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2010128930A (ja) | 2008-11-28 | 2010-06-10 | Toyota Motor Corp | 画像処理装置 |
| JP2019212206A (ja) | 2018-06-08 | 2019-12-12 | 沖電気工業株式会社 | ニューラルネットワーク軽量化装置、情報処理装置、ニューラルネットワーク軽量化方法およびプログラム |
| JP2020144659A (ja) | 2019-03-07 | 2020-09-10 | キヤノン株式会社 | データ処理装置及びその方法、プログラム |
| CN111950718A (zh) | 2019-05-16 | 2020-11-17 | 北京知存科技有限公司 | 利用存算一体芯片实现递进式cnn运算的方法 |
| US20210073585A1 (en) | 2019-09-11 | 2021-03-11 | Expedera, Inc. | Method And Apparatus For Efficiently Processing Convolution Neural Network Operations |
Non-Patent Citations (1)
| Title |
|---|
| Detection of Prostate Cancer in Whole-Slide Images Through End-to-End Training With Image-Level Labels,IEEE Transactions on Medical Imaging,2021年,Volume: 40, Issue: 7,https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=9380553 |
Also Published As
| Publication number | Publication date |
|---|---|
| US12277751B2 (en) | 2025-04-15 |
| JP2023117247A (ja) | 2023-08-23 |
| US20230252762A1 (en) | 2023-08-10 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US10380753B1 (en) | Method and apparatus for generating a displacement map of an input dataset pair | |
| US9418458B2 (en) | Graph image representation from convolutional neural networks | |
| KR102140805B1 (ko) | 위성 영상의 물체 식별을 위한 뉴럴 네트워크 학습 방법 및 장치 | |
| CN112149694B (zh) | 一种基于卷积神经网络池化模块的图像处理方法、系统、存储介质及终端 | |
| KR102470027B1 (ko) | 다수 컨벌루션 윈도우 중의 이미지 데이터를 추출하는 방법, 장치, 기기 및 컴퓨터 판독 가능한 저장매체 | |
| US20210350521A1 (en) | Method for computer-implemented determination of blade-defects of a wind turbine | |
| CN113888491A (zh) | 基于非局部特征的多级高光谱图像递进超分方法及系统 | |
| JP2021517283A (ja) | 画像処理装置及びその画像処理方法、並びに画像処理システム及びそのトレーニング方法 | |
| Rios et al. | Feature visualization for 3D point cloud autoencoders | |
| Xiong et al. | Bi-directional skip connection feature pyramid network and sub-pixel convolution for high-quality object detection | |
| CN115909077A (zh) | 基于无监督光谱解混神经网络的高光谱图像变化检测方法 | |
| JP6532334B2 (ja) | 並列演算装置、画像処理装置及び並列演算方法 | |
| CN120163956A (zh) | 一种基于选择性状态空间模型的红外小目标检测方法及相关装置 | |
| CN116091893A (zh) | 一种基于U-net网络的地震图像反褶积方法及系统 | |
| CN115170418A (zh) | 符合退化的低秩高维图像填充模型及其填充方法与系统 | |
| CN117710301B (zh) | 图像处理方法、装置、设备、存储介质及计算机程序产品 | |
| JP7635170B2 (ja) | 画像処理装置、学習装置、推論装置、および画像処理方法 | |
| US12561754B2 (en) | Method and system for processing image based on weighted multiple kernels | |
| CN120997324A (zh) | 针对无人系统的仿真到真实图像的迁移方法及装置 | |
| KR20220074021A (ko) | 상품불량 선별을 위한 딥러닝 기반의 이미지 분석 방법 및 이를 위한 시스템 | |
| Liu et al. | Multimodal cross fusion Mamba network for remote sensing image semantic segmentation with complementary masked self-supervision | |
| CN113269812A (zh) | 图像预测模型的训练及应用方法、装置、设备、存储介质 | |
| Zhong et al. | Depth Completion With Super-Resolution and Cross-Modality Optimization | |
| CN115618945A (zh) | 面向边缘设备知识蒸馏方法及装置 | |
| Dantas et al. | Fast multidimensional image processing with OpenCL |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20230105 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240301 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20241217 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20250114 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20250212 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7635170 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |