JP6908943B2 - イメージコンカチネーションと、ターゲット物体予測ネットワークとを利用して、多重カメラ又はサラウンドビューモニタリングに利用される物体検出器を学習する方法及び学習装置、並びにこれを利用したテスティング方法及びテスティング装置 - Google Patents
イメージコンカチネーションと、ターゲット物体予測ネットワークとを利用して、多重カメラ又はサラウンドビューモニタリングに利用される物体検出器を学習する方法及び学習装置、並びにこれを利用したテスティング方法及びテスティング装置 Download PDFInfo
- Publication number
- JP6908943B2 JP6908943B2 JP2020002987A JP2020002987A JP6908943B2 JP 6908943 B2 JP6908943 B2 JP 6908943B2 JP 2020002987 A JP2020002987 A JP 2020002987A JP 2020002987 A JP2020002987 A JP 2020002987A JP 6908943 B2 JP6908943 B2 JP 6908943B2
- Authority
- JP
- Japan
- Prior art keywords
- test
- image
- specific
- integrated
- learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012360 testing method Methods 0.000 title claims description 749
- 238000000034 method Methods 0.000 title claims description 74
- 238000012544 monitoring process Methods 0.000 title description 3
- 238000012545 processing Methods 0.000 claims description 190
- 238000001514 detection method Methods 0.000 claims description 128
- 238000012549 training Methods 0.000 claims description 94
- 238000011176 pooling Methods 0.000 claims description 41
- 230000008569 process Effects 0.000 claims description 40
- 238000003754 machining Methods 0.000 claims description 31
- 238000004364 calculation method Methods 0.000 claims description 22
- 238000010998 test method Methods 0.000 claims description 5
- 230000010354 integration Effects 0.000 claims description 4
- 238000013527 convolutional neural network Methods 0.000 description 39
- 238000004891 communication Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 239000000758 substrate Substances 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/18—Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
- H04N7/188—Capturing isolated or intermittent images triggered by the occurrence of a predetermined event, e.g. an object reaching a predetermined position
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/7715—Feature extraction, e.g. by transforming the feature space, e.g. multi-dimensional scaling [MDS]; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/292—Multi-camera tracking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2148—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/449—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
- G06V10/451—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
- G06V10/454—Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/776—Validation; Performance evaluation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/50—Context or environment of the image
- G06V20/56—Context or environment of the image exterior to a vehicle by using sensors mounted on the vehicle
- G06V20/58—Recognition of moving objects or obstacles, e.g. vehicles or pedestrians; Recognition of traffic objects, e.g. traffic signs, traffic lights or roads
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/18—Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/18—Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
- H04N7/181—Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast for receiving images from a plurality of remote sources
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biodiversity & Conservation Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Algebra (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Image Analysis (AREA)
Description
Claims (28)
- イメージコンカチネーション(Image concatenation)と、ターゲット物体統合ネットワークとを利用した、CNN基盤物体検出器のパラメータを学習する方法において、
(a)少なくとも一つのトレーニングイメージが入力されると、学習装置が、(i)ターゲット領域予測ネットワークをもって、前記トレーニングイメージまたはこれに対応する一つ以上のリサイズされたイメージにおいて一つ以上のターゲット物体が位置するものと予測される領域に対応する第1ターゲット領域ないし第nターゲット領域それぞれを探すようにし、(ii)イメージ加工ネットワークをもって、前記トレーニングイメージまたはこれに対応するリサイズされたイメージから、前記第1ターゲット領域ないし前記第nターゲット領域それぞれに対応する第1加工イメージないし第n加工イメージを取得させ、(iii)前記第1加工イメージないし前記第n加工イメージをコンカチネートした統合トレーニングイメージを出力させる段階;
(b)前記学習装置が、(i)一つ以上のコンボリューションレイヤをもって、一つ以上のコンボリューション演算を前記統合トレーニングイメージに適用することにより、少なくとも一つの統合特徴マップを出力するようにし、(ii)RPN(Region Proposal Network)をもって、前記統合特徴マップを利用して、前記第1加工イメージないし前記第n加工イメージそれぞれ内に位置する一つ以上の物体に対応する第1物体プロポーザルないし第n物体プロポーザルそれぞれを出力させ、(iii)プーリングレイヤをもって、前記統合特徴マップ上で、前記第1物体プロポーザルないし前記第n物体プロポーザルそれぞれに対応するそれぞれの領域に一つ以上のプーリング演算を適用して、少なくとも一つのプーリング済み統合特徴マップを出力させ、(iv)FCレイヤをもって、前記プーリング済み統合特徴マップに少なくとも一つのFC(fully connected)演算を適用して、前記物体に対応する第1物体検出情報ないし第n物体検出情報を出力させる段階;及び
(c)前記学習装置が、(i)前記ターゲット物体統合ネットワークをもって、前記第1物体プロポーザルないし前記第n物体プロポーザルを統合して統合物体プロポーザルを生成するようにし、前記第1物体検出情報ないし前記第n物体検出情報を統合して統合物体検出情報を生成するようにし、(ii)少なくとも一つのFCロスレイヤをもって、前記統合物体検出情報と、これに対応するGTとを参照して一つ以上のFCロスを生成するようにすることで、前記FCロスを利用したバックプロパゲーション(Backpropagation)によって、前記FCレイヤ及び前記コンボリューションレイヤのパラメータの中の少なくとも一部を学習する段階;
を含むことを特徴とする方法。 - 前記(c)段階で、
前記学習装置が、少なくとも一つのRPNロスレイヤをもって、前記統合物体プロポーザル情報と、これに対応するGTとを参照して一つ以上のRPNロスを算出するようにすることで、前記RPNロスを利用したバックプロパゲーションによって前記RPNのパラメータを学習することを特徴とする請求項1に記載の方法。 - 前記(a)段階で、
前記学習装置が、前記イメージ加工ネットワークをもって、第1加工イメージないし前記第n加工イメージの幅と高さのうち少なくとも一つを同一に調整した後、同一の大きさに調整された前記幅または前記高さ方向に第1調整済み加工イメージないし第n調整済み加工イメージをコンカチネート(concatenate)させることを特徴とする請求項1に記載の方法。 - 前記学習装置が、前記イメージ加工ネットワークをもって、前記第1調整済み加工イメージないし前記第n調整済み加工イメージのうち、コンカチネートされた隣接するそれぞれの二つの調整済み加工イメージから構成されるそれぞれのペアの間にそれぞれ少なくとも一つのゼロパディング(zero padding)領域を追加するようにすることを特徴とする請求項3に記載の方法。
- 前記(c)段階で、
第1特定加工イメージ及び第2特定加工イメージ上にそれぞれ少なくとも一つの特定同一物体が位置し、前記第1特定加工イメージ上で、前記特定同一物体に対応する少なくとも一つの物体プロポーザルを第1特定物体プロポーザルとし、前記第2特定加工イメージ上で、前記特定同一物体に対応する少なくとも一つの物体プロポーザルを第2特定物体プロポーザルとした場合、
前記学習装置は、前記ターゲット物体統合ネットワークをもって、前記第1特定物体プロポーザルと、前記第2特定物体プロポーザルとの間のIOU(Intersection Over Union)が第1閾値以上になるかを判断するようにし、(I)前記IOUが、前記第1閾値未満と判断されれば、前記第2特定加工イメージ上で前記第1特定物体プロポーザルに対応する領域と、前記第1特定加工イメージ上で前記第2特定物体プロポーザルに対応する領域との間の調整IOUを算出し、(II)前記調整IOUが第2閾値以上と判断されれば、前記第1特定物体プロポーザルと、前記第2特定物体プロポーザルとの中から、(i)確率値の高い特定物体プロポーザルを選択するようにするか(ii)前記トレーニングイメージ上で演算される面積の大きい特定物体プロポーザルを選択するようにすることにより、前記選択された特定物体プロポーザルを前記特定同一物体に対応する特定統合物体プロポーザルとして生成することを特徴とする請求項1に記載の方法。 - 前記(c)段階で、
第1特定加工イメージ及び第2特定加工イメージ上に少なくとも一つの特定同一物体が位置し、前記第1特定加工イメージ上で、前記特定同一物体に対応する少なくとも一つの物体バウンディングボックスを第1特定物体バウンディングボックスとし、前記第2特定加工イメージ上で、前記特定同一物体に対応する少なくとも一つの物体バウンディングボックスを第2特定物体バウンディングボックスとした場合、
前記学習装置は、前記ターゲット物体統合ネットワークをもって、前記第1特定物体バウンディングボックスと、前記第2特定物体バウンディングボックスとの間のIOUが、第1閾値以上になるか否かを判断するようにし、(I)前記IOUが、前記第1閾値未満と判断されれば、前記第2特定加工イメージ上で前記第1特定物体バウンディングボックスに対応する領域と、前記第1特定加工イメージ上で前記第2特定物体バウンディングボックスに対応する領域との間の調整IOUを算出し、(II)前記調整IOUが第2閾値以上と判断されたら、前記第1特定物体バウンディングボックスと、前記第2特定物体バウンディングボックスとの中から(i)確率値の高い特定物体バウンディングボックスを選択するようにするか(ii)前記トレーニングイメージ上で演算される面積の大きい特定物体バウンディングボックスを選択するようにすることにより、前記選択された特定物体バウンディングボックスを前記特定同一物体に対応する特定統合物体検出情報として生成することを特徴とする請求項1に記載の方法。 - イメージコンカチネーション(Image concatenation)と、ターゲット物体統合ネットワークとを利用したCNN基盤物体検出器をテスティングする方法において、
(a)学習装置が、(1)(i)ターゲット領域予測ネットワークをもって、少なくとも一つのトレーニングイメージまたはこれに対応する一つ以上のリサイズされたトレーニングイメージにおいて一つ以上のターゲット物体が位置するものと予測される領域に対応する第1学習用ターゲット領域ないし第n学習用ターゲット領域それぞれを探すようにし、(ii)イメージ加工ネットワークをもって、前記トレーニングイメージまたはこれに対応するリサイズされたトレーニングイメージから、前記第1学習用ターゲット領域ないし前記第n学習用ターゲット領域それぞれに対応する第1学習用加工イメージないし第n学習用加工イメージを取得するようにし、(iii)前記第1学習用加工イメージないし前記第n学習用加工イメージをコンカチネートした統合トレーニングイメージを出力するようにし、(2)(i)一つ以上のコンボリューションレイヤをもって、一つ以上のコンボリューション演算を前記統合トレーニングイメージに適用することにより、少なくとも一つの学習用統合特徴マップを出力するようにし、(ii)RPNをもって、前記学習用統合特徴マップを利用して、前記第1学習用加工イメージないし前記第n学習用加工イメージそれぞれ内に位置する学習用物体に対応する第1学習用物体プロポーザルないし第n学習用物体プロポーザルそれぞれを出力するようにし、(iii)プーリングレイヤをもって、前記学習用統合特徴マップ上で、前記第1学習用物体プロポーザルないし前記第n学習用物体プロポーザルそれぞれに対応するそれぞれの領域に一つ以上のプーリング演算を適用して、少なくとも一つの学習用プーリング済み統合特徴マップを出力させ、(iv)FCレイヤをもって、前記学習用プーリング済み統合特徴マップに少なくとも一つのFC(fully connected)演算を適用して、前記学習用物体に対応する第1学習用物体検出情報ないし第n学習用物体検出情報を出力するようにし、(3)(i)前記ターゲット物体統合ネットワークをもって、前記第1学習用物体プロポーザルないし前記第n学習用物体プロポーザルを統合して学習用統合物体プロポーザルを生成するようにし、前記第1学習用物体検出情報ないし前記第n学習用物体検出情報を統合して学習用統合物体検出情報を生成するようにし、(ii)少なくとも一つのFCロスレイヤをもって、前記学習用統合物体検出情報と、これに対応するGTとを参照して一つ以上のFCロスを生成するようにすることで、前記FCロスを利用したバックプロパゲーション(Backpropagation)によって、前記FCレイヤ及び前記コンボリューションレイヤのパラメータの中の少なくとも一部を学習した状態で、テスティング装置が、少なくとも一つのテストイメージを取得すると、(i)前記ターゲット領域予測ネットワークをもって、前記テストイメージまたはこれに対応する一つ以上のリサイズされたテスト用イメージ上で、一つ以上のテスト用ターゲット物体が位置するものと予測される領域に対応する第1テスト用ターゲット領域ないし第nテスト用ターゲット領域それぞれを探すようにし、(ii)前記イメージ加工ネットワークをもって、前記テストイメージまたはこれに対応するリサイズされたテストイメージから、前記第1テスト用ターゲット領域ないし前記第nテスト用ターゲット領域それぞれに対応する第1テスト用加工イメージないし第nテスト用加工イメージを取得するようにし、(iii)前記第1テスト用加工イメージないし前記第nテスト用加工イメージをコンカチネートした統合テストイメージを出力するようにする段階;
(b)前記テスティング装置が、(i)前記コンボリューションレイヤをもって、前記コンボリューション演算を前記統合テストイメージに適用することにより、少なくとも一つのテスト用統合特徴マップを出力するようにし、(ii)前記RPNをもって、前記テスト用統合特徴マップを利用して、前記第1テスト用加工イメージないし前記第nテスト用加工イメージそれぞれ内に位置するテスト用物体に対応する第1テスト用物体プロポーザルないし第nテスト用物体プロポーザルそれぞれを出力するようにし、(iii)前記プーリングレイヤをもって、前記テスト用統合特徴マップ上で、前記第1テスト用物体プロポーザルないし前記第nテスト用物体プロポーザルそれぞれに対応するそれぞれの領域に前記プーリング演算を適用して、少なくとも一つのテスト用プーリング済み統合特徴マップを出力するようにし、(iv)前記FCレイヤをもって、前記テスト用プーリング済み統合特徴マップに前記FC演算を適用して、前記テスト用物体に対応する第1テスト用物体検出情報ないし第nテスト用物体検出情報を出力するようにする段階;及び
(c)前記テスティング装置が、(i)前記ターゲット物体統合ネットワークをもって、前記第1テスト用物体プロポーザルないし前記第nテスト用物体プロポーザルを統合してテスト用統合物体プロポーザルを生成するようにし、前記第1テスト用物体検出情報ないし前記第nテスト用物体検出情報を統合してテスト用統合物体検出情報を生成するようにする段階;
を含むことを特徴とする方法。 - 前記(3)プロセスで、
前記学習装置が、少なくとも一つのRPNロスレイヤをもって、前記学習用統合物体プロポーザル情報と、これに対応するGTとを参照して一つ以上のRPNロスを算出するようにすることで、前記RPNロスを利用したバックプロパゲーションによって前記RPNのパラメータを学習することを特徴とする請求項8に記載の方法。 - 前記(a)段階で、
前記テスティング装置が、前記イメージ加工ネットワークをもって、前記第1テスト用加工イメージないし前記第nテスト用加工イメージの幅と高さのうち少なくとも一つを同一に調整した後、同一の大きさに調整された前記幅または前記高さ方向に第1テスト用調整済み加工イメージないし第nテスト用調整済み加工イメージをコンカチネートするようにすることを特徴とする請求項8に記載の方法。 - 前記テスティング装置が、前記イメージ加工ネットワークをもって、前記第1テスト用調整済み加工イメージないし前記第nテスト用調整済み加工イメージのうち、コンカチネートされた隣接するそれぞれの二つのテスト用調整済み加工イメージから構成されるそれぞれのペアの間にそれぞれ少なくとも一つのゼロパディング領域を追加するようにすることを特徴とする請求項10に記載の方法。
- 前記(c)段階で、
第1テスト用特定加工イメージ及び第2テスト用特定加工イメージ上にそれぞれ少なくとも一つのテスト用特定同一物体が位置し、前記第1テスト用特定加工イメージ上で、前記テスト用特定同一物体に対応する少なくとも一つのテスト用物体プロポーザルを第1テスト用特定物体プロポーザルとし、前記第2テスト用特定加工イメージ上で、前記テスト用特定同一物体に対応する少なくとも一つのテスト用物体プロポーザルを第2テスト用特定物体プロポーザルとした場合、前記テスティング装置は、前記ターゲット物体統合ネットワークをもって、前記第1テスト用特定物体プロポーザルと、前記第2テスト用特定物体プロポーザルとの間のテスト用IOU(Intersection Over Union)が、第1閾値以上になるかを判断するようにし、(I)前記テスト用IOUが、前記第1閾値未満と判断されれば、前記第2テスト用特定加工イメージ上で前記第1テスト用特定物体プロポーザルに対応する領域と、前記第1テスト用特定加工イメージ上で前記第2テスト用特定物体プロポーザルに対応する領域との間のテスト用調整IOUを算出し、(II)前記テスト用調整IOUが第2閾値以上と判断されれば、前記第1テスト用特定物体プロポーザルと、前記第2テスト用特定物体プロポーザルとの中から、(i)確率値の高いテスト用特定物体プロポーザルを選択するようにするか(ii)前記テストイメージ上で演算される面積の大きいテスト用特定物体プロポーザルを選択させることにより、前記選択されたテスト用特定物体プロポーザルを前記テスト用特定同一物体に対応するテスト用特定統合物体プロポーザルとして生成することを特徴とする請求項8に記載の方法。 - 前記(c)段階で、
第1テスト用特定加工イメージ及び第2テスト用特定加工イメージ上にそれぞれ少なくとも一つのテスト用特定同一物体が位置し、前記第1テスト用特定加工イメージ上で、前記テスト用特定同一物体に対応する少なくとも一つのテスト用物体バウンディングボックスを第1テスト用特定物体バウンディングボックスとし、前記第2テスト用特定加工イメージ上で、前記テスト用特定同一物体に対応する少なくとも一つのテスト用物体バウンディングボックスを第2テスト用特定物体バウンディングボックスとした場合、
前記テスティング装置は、前記ターゲット物体統合ネットワークをもって、前記第1テスト用特定物体バウンディングボックスと、前記第2テスト用特定物体バウンディングボックスとの間のテスト用IOUが第1閾値以上になるかを判断するようにし、(I)前記テスト用IOUが、前記第1閾値未満と判断されれば、前記第2テスト用特定加工イメージ上で前記第1テスト用特定物体バウンディングボックスに対応する領域と、前記第1テスト用特定加工イメージ上で前記第2テスト用特定物体バウンディングボックスに対応する領域との間のテスト用調整IOUを算出し、(II)前記テスト用調整IOUが第2閾値以上と判断されれば、前記第1テスト用特定物体バウンディングボックスと、前記第2テスト用特定物体バウンディングボックスとの中から、(i)確率値の高いテスト用特定物体バウンディングボックスを選択するようにするか(ii)前記テストイメージ上で演算される面積の大きいテスト用特定物体バウンディングボックスを選択するようにすることにより、前記選択されたテスト用特定物体バウンディングボックスを前記テスト用特定同一物体に対応するテスト用特定統合物体検出情報として生成することを特徴とする請求項8に記載の方法。 - イメージコンカチネーション(Image concatenation)と、ターゲット物体統合ネットワークとを利用したCNN基盤物体検出器のパラメータを学習するための学習装置において、
インストラクションを格納する少なくとも一つのメモリ;及び
(I)(i)ターゲット領域予測ネットワークをもって、少なくとも一つのトレーニングイメージまたはこれに対応する一つ以上のリサイズされたイメージにおいて、一つ以上のターゲット物体が位置するものと予測される領域に対応する第1ターゲット領域ないし第nターゲット領域それぞれを探すようにし、(ii)イメージ加工ネットワークをもって、前記トレーニングイメージまたはこれに対応するリサイズされたイメージから、前記第1ターゲット領域ないし前記第nターゲット領域それぞれに対応する第1加工イメージないし第n加工イメージを取得させ、(iii)前記第1加工イメージないし前記第n加工イメージをコンカチネートした統合トレーニングイメージを出力させるプロセス、(II)(i)一つ以上のコンボリューションレイヤをもって、一つ以上のコンボリューション演算を前記統合トレーニングイメージに適用することにより、少なくとも一つの統合特徴マップを出力するようにし、(ii)RPN(Region Proposal Network)をもって、前記統合特徴マップを利用して、前記第1加工イメージないし前記第n加工イメージそれぞれ内に位置する一つ以上の物体に対応する第1物体プロポーザルないし第n物体プロポーザルそれぞれを出力させ、(iii)プーリングレイヤをもって、前記統合特徴マップ上で、前記第1物体プロポーザルないし前記第n物体プロポーザルそれぞれに対応するそれぞれの領域に一つ以上のプーリング演算を適用して、少なくとも一つのプーリング済み統合特徴マップを出力させ、(iv)FCレイヤをもって、前記プーリング済み統合特徴マップに少なくとも一つのFC(fully connected)演算を適用して、前記物体に対応する第1物体検出情報ないし第n物体検出情報を出力させるプロセス、及び(III)(i)前記ターゲット物体統合ネットワークをもって、前記第1物体プロポーザルないし前記第n物体プロポーザルを統合して統合物体プロポーザルを生成するようにし、前記第1物体検出情報ないし前記第n物体検出情報を統合して統合物体検出情報を生成するようにし、(ii)少なくとも一つのFCロスレイヤをもって、前記統合物体検出情報と、これに対応するGTとを参照して一つ以上のFCロスを生成するようにすることで、前記FCロスを利用したバックプロパゲーション(Backpropagation)によって、前記FCレイヤ及び前記コンボリューションレイヤのパラメータの中の少なくとも一部を学習するプロセスを遂行するための、前記インストラクションを実行するように構成された少なくとも一つのプロセッサ;
を含むことを特徴とする学習装置。 - 前記(III)プロセスで、
前記プロセッサが、少なくとも一つのRPNロスレイヤをもって、前記統合物体プロポーザル情報と、これに対応するGTとを参照して一つ以上のRPNロスを算出するようにすることで、前記RPNロスを利用したバックプロパゲーションによって前記RPNのパラメータを学習することを特徴とする請求項15に記載の学習装置。 - 前記(I)プロセスで、
前記プロセッサが、前記イメージ加工ネットワークをもって、前記第1加工イメージないし前記第n加工イメージの幅と高さのうち少なくとも一つを同一に調整した後、同一の大きさに調整された前記幅または前記高さ方向に第1調整済み加工イメージないし第n調整済み加工イメージをコンカチネート(concatenate)させることを特徴とする請求項15に記載の学習装置。 - 前記プロセッサが、前記イメージ加工ネットワークをもって、前記第1調整済み加工イメージないし前記第n調整済み加工イメージのうち、コンカチネートされた隣接するそれぞれの二つの調整済み加工イメージから構成されるそれぞれのペアの間にそれぞれ少なくとも一つのゼロパディング(zero padding)領域を追加するようにすることを特徴とする請求項17に記載の学習装置。
- 前記(III)プロセスで、
第1特定加工イメージ及び第2特定加工イメージ上にそれぞれ少なくとも一つの特定同一物体が位置し、前記第1特定加工イメージ上で、前記特定同一物体に対応する少なくとも一つの物体プロポーザルを第1特定物体プロポーザルとし、前記第2特定加工イメージ上で、前記特定同一物体に対応する少なくとも一つの物体プロポーザルを第2特定物体プロポーザルとした場合、
前記プロセッサは、前記ターゲット物体統合ネットワークをもって、前記第1特定物体プロポーザルと、前記第2特定物体プロポーザルとの間のIOU(Intersection Over Union)が、第1閾値以上になるかを判断するようにし、(i)前記IOUが、前記第1閾値未満と判断されれば、前記第2特定加工イメージ上で前記第1特定物体プロポーザルに対応する領域と、前記第1特定加工イメージ上で前記第2特定物体プロポーザルに対応する領域との間の調整IOUを算出し、(ii)前記調整IOUが第2閾値以上と判断されれば、前記第1特定物体プロポーザルと、前記第2特定物体プロポーザルとの中から、確率値の高い特定物体プロポーザルを選択するようにするか、前記トレーニングイメージ上で演算される面積の大きい特定物体プロポーザルを選択するようにすることにより、前記選択された特定物体プロポーザルを前記特定同一物体に対応する特定統合物体プロポーザルとして生成することを特徴とする請求項15に記載の学習装置。 - 前記(III)プロセスで、
第1特定加工イメージ及び第2特定加工イメージ上に少なくとも一つの特定同一物体が位置し、前記第1特定加工イメージ上で、前記特定同一物体に対応する少なくとも一つの物体バウンディングボックスを第1特定物体バウンディングボックスとし、前記第2特定加工イメージ上で、前記特定同一物体に対応する少なくとも一つの物体バウンディングボックスを第2特定物体バウンディングボックスとした場合、
前記プロセスは、前記ターゲット物体統合ネットワークをもって、前記第1特定物体バウンディングボックスと、前記第2特定物体バウンディングボックスとの間のIOUが、第1閾値以上になるか否かを判断するようにし、(i)前記IOUが、前記第1閾値未満と判断されれば、前記第2特定加工イメージ上で前記第1特定物体バウンディングボックスに対応する領域と、前記第1特定加工イメージ上で前記第2特定物体バウンディングボックスに対応する領域との間の調整IOUを算出し、(ii)前記調整IOUが第2閾値以上と判断されたら、前記第1特定物体バウンディングボックスと、前記第2特定物体バウンディングボックスとの中から、確率値の高い特定物体バウンディングボックスを選択するようにするか、前記トレーニングイメージ上で演算される面積の大きい特定物体バウンディングボックスを選択するようにすることにより、前記選択された特定物体バウンディングボックスを前記特定同一物体に対応する特定統合物体検出情報として生成することを特徴とする請求項15に記載の学習装置。 - イメージコンカチネーション(Image concatenation)と、ターゲット物体統合ネットワークとを利用したCNN基盤物体検出器をテストするためのテスティング装置において、
インストラクションを格納する少なくとも一つのメモリ;及び
学習装置が、(1)(i)ターゲット領域予測ネットワークをもって、少なくとも一つのトレーニングイメージまたはこれに対応する一つ以上のリサイズされたトレーニングイメージにおいて一つ以上のターゲット物体が位置するものと予測される領域に対応する第1学習用ターゲット領域ないし第n学習用ターゲット領域それぞれを探すようにし、(ii)イメージ加工ネットワークをもって、前記トレーニングイメージまたはこれに対応するリサイズされたトレーニングイメージから、前記第1学習用ターゲット領域ないし前記第n学習用ターゲット領域それぞれに対応する第1学習用加工イメージないし第n学習用加工イメージを取得するようにし、(iii)前記第1学習用加工イメージないし前記第n学習用加工イメージをコンカチネートした統合トレーニングイメージを出力するようにし、(2)(i)一つ以上のコンボリューションレイヤをもって、一つ以上のコンボリューション演算を前記統合トレーニングイメージに適用することにより、少なくとも一つの学習用統合特徴マップを出力するようにし、(ii)RPNをもって、前記学習用統合特徴マップを利用して、前記第1学習用加工イメージないし前記第n学習用加工イメージそれぞれ内に位置する学習用物体に対応する第1学習用物体プロポーザルないし第n学習用物体プロポーザルそれぞれを出力するようにし、(iii)プーリングレイヤをもって、前記学習用統合特徴マップ上で、前記第1学習用物体プロポーザルないし前記第n学習用物体プロポーザルそれぞれに対応するそれぞれの領域に一つ以上のプーリング演算を適用して、少なくとも一つの学習用プーリング済み統合特徴マップを出力させ、(iv)FCレイヤをもって、前記学習用プーリング済み統合特徴マップに少なくとも一つのFC(fully connected)演算を適用して、前記学習用物体に対応する第1学習用物体検出情報ないし第n学習用物体検出情報を出力するようにし、(3)(i)前記ターゲット物体統合ネットワークをもって、前記第1学習用物体プロポーザルないし前記第n学習用物体プロポーザルを統合して学習用統合物体プロポーザルを生成するようにし、前記第1学習用物体検出情報ないし前記第n学習用物体検出情報を統合して学習用統合物体検出情報を生成するようにし、(ii)少なくとも一つのFCロスレイヤをもって、前記学習用統合物体検出情報と、これに対応するGTとを参照してFCロスを生成するようにすることで、前記FCロスを利用したバックプロパゲーションによって、前記FCレイヤ及び前記コンボリューションレイヤのパラメータの中の少なくとも一部を学習した状態で、(I)(i)前記ターゲット領域予測ネットワークをもって、少なくとも一つのテストイメージまたはこれに対応する一つ以上のリサイズされたテスト用イメージ上で、一つ以上のテスト用ターゲット物体が位置するものと予測される領域に対応する第1テスト用ターゲット領域ないし第nテスト用ターゲット領域それぞれを探すようにし、(ii)前記イメージ加工ネットワークをもって、前記テストイメージまたはこれに対応するリサイズされたテストイメージから、前記第1テスト用ターゲット領域ないし前記第nテスト用ターゲット領域それぞれに対応する第1テスト用加工イメージないし第nテスト用加工イメージを取得するようにし、(iii)前記第1テスト用加工イメージないし前記第nテスト用加工イメージをコンカチネートした統合テストイメージを出力するようにするプロセス、(II)(i)前記コンボリューションレイヤをもって、前記コンボリューション演算を前記統合テストイメージに適用することにより、少なくとも一つのテスト用統合特徴マップを出力するようにし、(ii)前記RPNをもって、前記テスト用統合特徴マップを利用して、前記第1テスト用加工イメージないし前記第nテスト用加工イメージそれぞれ内に位置するテスト用物体に対応する第1テスト用物体プロポーザルないし第nテスト用物体プロポーザルそれぞれを出力するようにし、(iii)前記プーリングレイヤをもって、前記テスト用統合特徴マップ上で、前記第1テスト用物体プロポーザルないし前記第nテスト用物体プロポーザルそれぞれに対応するそれぞれの領域に前記プーリング演算を適用して、少なくとも一つのテスト用プーリング済み統合特徴マップを出力するようにし、(iv)前記FCレイヤをもって、前記テスト用プーリング済み統合特徴マップに前記FC演算を適用して、前記テスト用物体に対応する第1テスト用物体検出情報ないし第nテスト用物体検出情報を出力するようにするプロセス、及び(III)(i)前記ターゲット物体統合ネットワークをもって、前記第1テスト用物体プロポーザルないし前記第nテスト用物体プロポーザルを統合してテスト用統合物体プロポーザルを生成するようにし、前記第1テスト用物体検出情報ないし前記第nテスト用物体検出情報を統合してテスト用統合物体検出情報を生成するようにするプロセスを遂行するための、前記インストラクションを実行するように構成された少なくとも一つのプロセッサ;
を含むことを特徴とするテスティング装置。 - 前記(3)プロセスで、
前記学習装置が、少なくとも一つのRPNロスレイヤをもって、前記学習用統合物体プロポーザル情報と、これに対応するGTとを参照して一つ以上のRPNロスを算出するようにすることで、前記RPNロスを利用したバックプロパゲーションによって前記RPNのパラメータを学習することを特徴とする請求項22に記載のテスティング装置。 - 前記(I)プロセスで、
前記プロセッサが、前記イメージ加工ネットワークをもって、前記第1テスト用加工イメージないし前記第nテスト用加工イメージの幅と高さのうち少なくとも一つを同一に調整した後、同一の大きさに調整された前記幅または前記高さ方向に第1テスト用調整済み加工イメージないし第nテスト用調整済み加工イメージをコンカチネートするようにすることを特徴とする請求項22に記載のテスティング装置。 - 前記プロセッサが、前記イメージ加工ネットワークをもって、前記第1テスト用調整済み加工イメージないし前記第nテスト用調整済み加工イメージのうち、コンカチネートされた隣接するそれぞれの二つのテスト用調整済み加工イメージから構成されるそれぞれのペアの間にそれぞれ少なくとも一つのゼロパディング領域を追加するようにすることを特徴とする請求項24に記載のテスティング装置。
- 前記(III)プロセスで、
第1テスト用特定加工イメージ及び第2テスト用特定加工イメージ上にそれぞれ少なくとも一つのテスト用特定同一物体が位置し、前記第1テスト用特定加工イメージ上で、前記テスト用特定同一物体に対応する少なくとも一つのテスト用物体プロポーザルを第1テスト用特定物体プロポーザルとし、前記第2テスト用特定加工イメージ上で、前記テスト用特定同一物体に対応する少なくとも一つのテスト用物体プロポーザルを第2テスト用特定物体プロポーザルとした場合、
前記プロセッサは、前記ターゲット物体統合ネットワークをもって、前記第1テスト用特定物体プロポーザルと、前記第2テスト用特定物体プロポーザルとの間のテスト用IOU(Intersection Over Union)が、第1閾値以上になるかを判断するようにし、(i)前記テスト用IOUが、前記第1閾値未満と判断されれば、前記第2テスト用特定加工イメージ上で前記第1テスト用特定物体プロポーザルに対応する領域と、前記第1テスト用特定加工イメージ上で前記第2テスト用特定物体プロポーザルに対応する領域との間のテスト用調整IOUを算出し、(ii)前記テスト用調整IOUが第2閾値以上と判断されれば、前記第1テスト用特定物体プロポーザルと、前記第2テスト用特定物体プロポーザルとの中から、確率値の高いテスト用特定物体プロポーザルを選択するようにするか、前記テストイメージ上で演算される面積の大きいテスト用特定物体プロポーザルを選択するようにすることにより、前記選択されたテスト用特定物体プロポーザルを前記テスト用特定同一物体に対応するテスト用特定統合物体プロポーザルとして生成することを特徴とする請求項22に記載のテスティング装置。 - 前記(III)プロセスで、
第1テスト用特定加工イメージ及び第2テスト用特定加工イメージ上にそれぞれ少なくとも一つのテスト用特定同一物体が位置し、前記第1テスト用特定加工イメージ上で、前記テスト用特定同一物体に対応する少なくとも一つのテスト用物体バウンディングボックスを第1テスト用特定物体バウンディングボックスとし、前記第2テスト用特定加工イメージ上で、前記テスト用特定同一物体に対応する少なくとも一つのテスト用物体バウンディングボックスを第2テスト用特定物体バウンディングボックスとした場合、
前記プロセッサは、前記ターゲット物体統合ネットワークをもって、前記第1テスト用特定物体バウンディングボックスと、前記第2テスト用特定物体バウンディングボックスとの間のテスト用IOUが第1閾値以上になるかを判断するようにし、(i)前記テスト用IOUが、前記第1閾値未満と判断されれば、前記第2テスト用特定加工イメージ上で前記第1テスト用特定物体バウンディングボックスに対応する領域と、前記第1テスト用特定加工イメージ上で前記第2テスト用特定物体バウンディングボックスに対応する領域との間のテスト用調整IOUを算出し、(ii)前記テスト用調整IOUが第2閾値以上と判断されれば、前記第1テスト用特定物体バウンディングボックスと、前記第2テスト用特定物体バウンディングボックスとの中から、確率値の高いテスト用特定物体バウンディングボックスを選択するようにするか、前記テストイメージ上で演算される面積の大きいテスト用特定物体バウンディングボックスを選択するようにすることにより、前記選択されたテスト用特定物体バウンディングボックスを前記テスト用特定同一物体に対応するテスト用特定統合物体検出情報として生成することを特徴とする請求項22に記載のテスティング装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US16/254,522 US10423860B1 (en) | 2019-01-22 | 2019-01-22 | Learning method and learning device for object detector based on CNN to be used for multi-camera or surround view monitoring using image concatenation and target object merging network, and testing method and testing device using the same |
US16/254,522 | 2019-01-22 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020119546A JP2020119546A (ja) | 2020-08-06 |
JP6908943B2 true JP6908943B2 (ja) | 2021-07-28 |
Family
ID=67988595
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020002987A Active JP6908943B2 (ja) | 2019-01-22 | 2020-01-10 | イメージコンカチネーションと、ターゲット物体予測ネットワークとを利用して、多重カメラ又はサラウンドビューモニタリングに利用される物体検出器を学習する方法及び学習装置、並びにこれを利用したテスティング方法及びテスティング装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US10423860B1 (ja) |
EP (1) | EP3686791B1 (ja) |
JP (1) | JP6908943B2 (ja) |
KR (1) | KR102349920B1 (ja) |
CN (1) | CN111462193B (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018211144A1 (en) * | 2017-05-19 | 2018-11-22 | Deepmind Technologies Limited | Making object-level predictions of the future state of a physical system |
JP7163766B2 (ja) * | 2018-12-28 | 2022-11-01 | 株式会社デンソーテン | 付着物検出装置および付着物検出方法 |
US11043003B2 (en) | 2019-11-18 | 2021-06-22 | Waymo Llc | Interacted object detection neural network |
CN110909794B (zh) * | 2019-11-22 | 2022-09-13 | 乐鑫信息科技(上海)股份有限公司 | 一种适用于嵌入式设备的目标检测系统 |
US11132607B1 (en) * | 2020-05-05 | 2021-09-28 | StradVision, Inc. | Method for explainable active learning, to be used for object detector, by using deep encoder and active learning device using the same |
US10970645B1 (en) * | 2020-05-08 | 2021-04-06 | StradVision, Inc. | Method for explainable active learning, to be used for object detector, by using Bayesian dual autoencoder and active learning device using the same |
US11987236B2 (en) * | 2020-08-31 | 2024-05-21 | Nec Corporation | Monocular 3D object localization from temporal aggregation |
KR102423047B1 (ko) * | 2020-11-17 | 2022-07-19 | 연세대학교 산학협력단 | 하드웨어로 구현되는 초해상도 장치를 위한 전처리 장치 및 방법 |
Family Cites Families (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6340228B2 (ja) * | 2014-03-27 | 2018-06-06 | 株式会社メガチップス | 物体検出装置 |
US9536293B2 (en) * | 2014-07-30 | 2017-01-03 | Adobe Systems Incorporated | Image assessment using deep convolutional neural networks |
CN106156807B (zh) * | 2015-04-02 | 2020-06-02 | 华中科技大学 | 卷积神经网络模型的训练方法及装置 |
WO2016165060A1 (en) * | 2015-04-14 | 2016-10-20 | Intel Corporation | Skin detection based on online discriminative modeling |
US9965719B2 (en) * | 2015-11-04 | 2018-05-08 | Nec Corporation | Subcategory-aware convolutional neural networks for object detection |
US9881234B2 (en) * | 2015-11-25 | 2018-01-30 | Baidu Usa Llc. | Systems and methods for end-to-end object detection |
US20180039853A1 (en) * | 2016-08-02 | 2018-02-08 | Mitsubishi Electric Research Laboratories, Inc. | Object Detection System and Object Detection Method |
US10354159B2 (en) * | 2016-09-06 | 2019-07-16 | Carnegie Mellon University | Methods and software for detecting objects in an image using a contextual multiscale fast region-based convolutional neural network |
US10354362B2 (en) * | 2016-09-08 | 2019-07-16 | Carnegie Mellon University | Methods and software for detecting objects in images using a multiscale fast region-based convolutional neural network |
US11308350B2 (en) * | 2016-11-07 | 2022-04-19 | Qualcomm Incorporated | Deep cross-correlation learning for object tracking |
US10846523B2 (en) * | 2016-11-14 | 2020-11-24 | Kodak Alaris Inc. | System and method of character recognition using fully convolutional neural networks with attention |
US10380741B2 (en) * | 2016-12-07 | 2019-08-13 | Samsung Electronics Co., Ltd | System and method for a deep learning machine for object detection |
US10262237B2 (en) * | 2016-12-08 | 2019-04-16 | Intel Corporation | Technologies for improved object detection accuracy with multi-scale representation and training |
CN108303748A (zh) * | 2017-01-12 | 2018-07-20 | 同方威视技术股份有限公司 | 检查设备和检测行李物品中的枪支的方法 |
CN106910206B (zh) * | 2017-01-17 | 2020-02-18 | 邢惠钧 | 一种目标跟踪方法及装置 |
US10185878B2 (en) * | 2017-02-28 | 2019-01-22 | Microsoft Technology Licensing, Llc | System and method for person counting in image data |
US10635927B2 (en) * | 2017-03-06 | 2020-04-28 | Honda Motor Co., Ltd. | Systems for performing semantic segmentation and methods thereof |
US10678846B2 (en) * | 2017-03-10 | 2020-06-09 | Xerox Corporation | Instance-level image retrieval with a region proposal network |
US20180260414A1 (en) * | 2017-03-10 | 2018-09-13 | Xerox Corporation | Query expansion learning with recurrent networks |
US11010595B2 (en) * | 2017-03-23 | 2021-05-18 | Samsung Electronics Co., Ltd. | Facial verification method and apparatus |
US10325342B2 (en) * | 2017-04-27 | 2019-06-18 | Apple Inc. | Convolution engine for merging interleaved channel data |
EP3619681A4 (en) * | 2017-05-02 | 2020-12-16 | HRL Laboratories, LLC | SYSTEM AND METHOD FOR DETECTION OF MOVING OBSTACLES BASED ON A SENSORIC PREDICTION FROM OWN MOVEMENT |
CN108985135A (zh) * | 2017-06-02 | 2018-12-11 | 腾讯科技(深圳)有限公司 | 一种人脸检测器训练方法、装置及电子设备 |
US10460470B2 (en) * | 2017-07-06 | 2019-10-29 | Futurewei Technologies, Inc. | Recognition and reconstruction of objects with partial appearance |
CN107451602A (zh) * | 2017-07-06 | 2017-12-08 | 浙江工业大学 | 一种基于深度学习的果蔬检测方法 |
US10503978B2 (en) * | 2017-07-14 | 2019-12-10 | Nec Corporation | Spatio-temporal interaction network for learning object interactions |
CN107451997A (zh) * | 2017-07-31 | 2017-12-08 | 南昌航空大学 | 一种基于深度学习的焊缝超声tofd‑d扫描缺陷类型的自动识别方法 |
KR101880901B1 (ko) * | 2017-08-09 | 2018-07-23 | 펜타시큐리티시스템 주식회사 | 기계 학습 방법 및 장치 |
JP6972757B2 (ja) * | 2017-08-10 | 2021-11-24 | 富士通株式会社 | 制御プログラム、制御方法、及び情報処理装置 |
JP6972756B2 (ja) * | 2017-08-10 | 2021-11-24 | 富士通株式会社 | 制御プログラム、制御方法、及び情報処理装置 |
US10679351B2 (en) * | 2017-08-18 | 2020-06-09 | Samsung Electronics Co., Ltd. | System and method for semantic segmentation of images |
CN107492099B (zh) * | 2017-08-28 | 2021-08-20 | 京东方科技集团股份有限公司 | 医学图像分析方法、医学图像分析系统以及存储介质 |
US10169679B1 (en) * | 2017-10-13 | 2019-01-01 | StradVision, Inc. | Learning method and learning device for adjusting parameters of CNN by using loss augmentation and testing method and testing device using the same |
US9946960B1 (en) * | 2017-10-13 | 2018-04-17 | StradVision, Inc. | Method for acquiring bounding box corresponding to an object in an image by using convolutional neural network including tracking network and computing device using the same |
-
2019
- 2019-01-22 US US16/254,522 patent/US10423860B1/en active Active
- 2019-11-15 KR KR1020190147080A patent/KR102349920B1/ko active IP Right Grant
- 2019-12-20 CN CN201911330694.4A patent/CN111462193B/zh active Active
- 2019-12-27 EP EP19219877.8A patent/EP3686791B1/en active Active
-
2020
- 2020-01-10 JP JP2020002987A patent/JP6908943B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
EP3686791A1 (en) | 2020-07-29 |
JP2020119546A (ja) | 2020-08-06 |
CN111462193B (zh) | 2023-09-12 |
KR102349920B1 (ko) | 2022-01-12 |
CN111462193A (zh) | 2020-07-28 |
US10423860B1 (en) | 2019-09-24 |
EP3686791C0 (en) | 2023-11-08 |
EP3686791B1 (en) | 2023-11-08 |
KR20200091330A (ko) | 2020-07-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6908943B2 (ja) | イメージコンカチネーションと、ターゲット物体予測ネットワークとを利用して、多重カメラ又はサラウンドビューモニタリングに利用される物体検出器を学習する方法及び学習装置、並びにこれを利用したテスティング方法及びテスティング装置 | |
JP6857370B2 (ja) | ターゲット物体予測ネットワーク及びターゲット物体統合ネットワークを利用して、重要業績評価指標のようなユーザー要求事項に係る最適化のための再構成可能なネットワーク基盤の物体検出器を学習する方法及び学習装置、並びにこれを利用したテスティング方法及びテスティング装置 | |
JP6908944B2 (ja) | 多重カメラまたはサラウンドビューモニタリングに利用されるために、ターゲット物体統合ネットワーク及びターゲット物体予測ネットワークを利用して、重要業績評価指標のようなユーザー要求事項に適用可能なcnn基盤の物体検出器を学習する方法及び学習装置、並びにこれを利用したテスティング方法及びテスティング装置 | |
JP6846069B2 (ja) | 遠距離検出または軍事目的のために、イメージコンカチネーションを利用したcnn基盤のハードウェア最適化が可能な物体検出器を学習する方法及び学習装置、それを利用したテスト方法及びテスト装置{learning method and learning device for object detector with hardware optimization based on cnn for detection at distance or military purpose using image concatenation, and testing method and testing device using the same} | |
JP6850046B2 (ja) | 重要業績評価指標のようなユーザ要求事項に適したターゲット物体予測ネットワークを用いた、cnn基盤の変動に強い物体検出器を学習する方法及び学習装置、並びにこれを利用したテスティング方法及びテスティング装置 | |
JP6875021B2 (ja) | 有用な学習データを取捨選別するためのcnn基盤の学習方法及び学習装置、そしてこれを利用したテスト方法及びテスト装置 | |
KR20200039547A (ko) | 트래킹 네트워크를 포함한 cnn을 사용하여 객체를 트래킹하는 방법 및 이를 이용한 장치 | |
KR20200027889A (ko) | CNN(Convolutional Neural Network)을 사용하여 차선을 검출하기 위한 학습 방법 및 학습 장치 그리고 이를 이용한 테스트 방법 및 테스트 장치 | |
JP6892157B2 (ja) | V2x情報融合技術によって取得された、各物体に対する深さ予測情報及び各物体に対するクラス情報を利用して3d空間を再構築することによりhdマップをアップデートする学習方法及び学習装置、そしてこれを利用したテスティング方法及びテスティング装置 | |
KR20200027888A (ko) | 차선 모델을 이용하여 차선을 검출할 수 있는 학습 방법 및 학습 장치 그리고 이를 이용한 테스트 방법 및 테스트 장치 | |
KR102464358B1 (ko) | 머신러닝에 기반하여 이미지에 대응되는 공간 정보를 추정하기 위한 방법 및 이를 이용한 공간 추정 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200110 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210219 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210302 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210527 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210622 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210625 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6908943 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |