JP6902611B2 - 物体検出方法、ニューラルネットワークの訓練方法、装置および電子機器 - Google Patents
物体検出方法、ニューラルネットワークの訓練方法、装置および電子機器 Download PDFInfo
- Publication number
- JP6902611B2 JP6902611B2 JP2019545345A JP2019545345A JP6902611B2 JP 6902611 B2 JP6902611 B2 JP 6902611B2 JP 2019545345 A JP2019545345 A JP 2019545345A JP 2019545345 A JP2019545345 A JP 2019545345A JP 6902611 B2 JP6902611 B2 JP 6902611B2
- Authority
- JP
- Japan
- Prior art keywords
- feature map
- fusion feature
- target area
- subnet
- layer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2148—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
- G06V10/7747—Organisation of the process, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
Description
プロセッサ、および
前記プロセッサに本願のいずれか一つの実施例に記載の物体検出方法に対応する動作を実行させる少なくとも一つの実行可能指令を記憶するための、または、前記プロセッサに本願のいずれか一つの実施例に記載のニューラルネットワークの訓練方法に対応する動作を実行させる少なくとも一つの実行可能指令を記憶するためのメモリを含む電子機器が提供される。
本願のいずれか一つの実施例に記載の物体検出装置、および、前記物体検出装置を運用する時、本願のいずれか一つの実施例に記載の物体検出装置におけるユニットが運用されるプロセッサ、または
本願のいずれか一つの実施例に記載のニューラルネットワークの訓練装置、および、前記ニューラルネットワークの訓練装置を運用する時、本願のいずれか一つの実施例に記載のニューラルネットワークの訓練装置におけるユニットが運用されるプロセッサを含む別の電子機器が提供される。
機器において運用される時、前記機器内のプロセッサが本願のいずれか一つの実施例に記載のニューラルネットワークの訓練方法における各ステップを実現するための指令を実行するコンピュータ読み取り可能コードを含むコンピュータプログラムが提供される。
第四畳み込み層によって現在の前記融合特徴マップをそれぞれ畳み込み、調整融合特徴マップを取得するためのボックス調整ユニット821と、
現在の予選目標領域ボックスデータに基づき、プーリング層によって調整融合特徴マップの領域プーリングを行い、新たな融合特徴マップを取得するための領域プーリングユニット822と、
新たな融合特徴マップから新たな予選目標領域ボックスデータを取得するための予選ボックス取得ユニット823と、を含む。
前記プロセッサに本願の上記いずれか一つの実施例に記載の物体検出方法に対応する動作を実行させる少なくとも一つの実行可能指令を記憶するための、または、
前記プロセッサに本願の上記いずれか一つの実施例に記載のニューラルネットワークの訓練方法に対応する動作を実行させる少なくとも一つの実行可能指令を記憶するためのメモリを含む電子機器を提供する。
本願の上記いずれか一つの実施例に記載の物体検出装置、および、前記物体検出装置を運用する時、本願の上記いずれか一つの実施例に記載の物体検出装置におけるユニットが運用されるプロセッサ、または
本願の上記いずれか一つの実施例に記載のニューラルネットワークの訓練装置、および、前記ニューラルネットワークの訓練装置を運用する時、本願の上記いずれか一つの実施例に記載のニューラルネットワークの訓練装置におけるユニットが運用されるプロセッサを含む別の電子機器を提供する。
機器において運用される時、前記機器内のプロセッサが本願のいずれか一つの実施例に記載のニューラルネットワークの訓練方法における各ステップを実現するための指令を実行するコンピュータ読み取り可能コードを含むコンピュータプログラムを提供する。
Claims (14)
- 目標領域ボックス検出用のディープ畳み込みニューラルネットワークにより、処理対象の画像から複数の融合特徴マップを予測して取得することであって、前記ディープ畳み込みニューラルネットワークは、複数の第一畳み込み層と少なくとも一つのダウンサンプリング層とを有する第一サブネット、および、複数の第二畳み込み層と少なくとも一つのアップサンプリング層とを有する第二サブネットを含み、前記融合特徴マップは、第一サブネットから取得した第一特徴マップおよび第二サブネットから取得した第二特徴マップによって得られ、少なくとも一つの前記第一畳み込み層には前記第一特徴マップを出力するための第一出力分岐が設けられ、前記第二畳み込み層には前記第二特徴マップを出力するための第二出力分岐が設けられる、ことと、
前記複数の融合特徴マップに基づいて目標領域ボックスデータを取得することと、を含み、
前記第二サブネットは複数の第三畳み込み層をさらに有し、前記第三畳み込み層の入力が前記第一出力分岐および前記第二出力分岐を含み、
複数の融合特徴マップを予測して取得するステップは、前記複数の第三畳み込み層の出力端から前記融合特徴マップをそれぞれ取得することを含む、
物体検出方法。 - 前記第二サブネットは前記第一サブネットの末端に設置され、前記ダウンサンプリング層は前記複数の第一畳み込み層の間に設置され、前記アップサンプリング層は前記複数の第二畳み込み層の間に設置され、前記第一畳み込み層と前記第二畳み込み層は対称に設置され、前記少なくとも一つのダウンサンプリング層と前記少なくとも一つのアップサンプリング層はそれぞれ対称に設置される、請求項1に記載の方法。
- 前記融合特徴マップにおける少なくとも一つのポイントは複数の物体検知ボックスに対応するボックス融合検出データおよび予測正確情報を有し、
前記複数の融合特徴マップに基づいて目標領域ボックスデータを取得するステップは、
少なくとも一つの前記融合特徴マップにおけるボックス融合検出データおよび予測正確情報に基づいて前記融合特徴マップの各々に対応する目標領域ボックスデータをそれぞれ取得することを含む、請求項1に記載の方法。 - 前記複数の融合特徴マップに基づいて目標領域ボックスデータを取得するステップは、
前記融合特徴マップの各々に対応する予選目標領域ボックスデータをそれぞれ取得することと、
前記融合特徴マップを調整することで、調整された融合特徴マップから新たな予選目標領域ボックスデータを取得するという物体領域ボックス回帰操作を、反復終止条件を満たすまで反復実行することと、
前記反復実行によって得られた前記予選目標領域ボックスデータを前記処理対象の画像における目標領域ボックスデータとすることと、を含む、請求項3に記載の方法。 - 前記ディープ畳み込みニューラルネットワークはさらに、前記第三畳み込み層にそれぞれ対応する数群の第四畳み込み層および前記数群の第四畳み込み層にそれぞれ対応する複数のプーリング層を有する第三サブネットを含み、各前記プーリング層の入力は前記調整された融合特徴マップおよび前記予選目標領域ボックスデータを含む、請求項4に記載の方法。
- 前記物体領域ボックス回帰操作は、
前記第四畳み込み層によって現在の前記融合特徴マップをそれぞれ畳み込み、調整融合特徴マップを取得することと、
現在の予選目標領域ボックスデータに基づき、前記プーリング層によって前記調整融合特徴マップの領域プーリングを行い、新たな融合特徴マップを取得することと、
前記新たな融合特徴マップから前記新たな予選目標領域ボックスデータを取得することと、を含む、請求項5に記載の方法。 - 前記第三サブネットはさらに前記プーリング層出力端に設置された第五畳み込み層を有し、
前記新たな融合特徴マップから前記新たな予選目標領域ボックスデータを取得するステップは、
前記第五畳み込み層によって前記新たな融合特徴マップに対して正規化畳み込みを行い、
正規化畳み込みを行った融合特徴マップから前記新たな予選目標領域ボックスデータを取得することを含む、請求項6に記載の方法。 - 目標領域ボックス標記情報を含むサンプル画像を目標領域ボックス検出用のディープ畳み込みニューラルネットワークに入力し、複数の融合特徴マップを検出して取得することであって、前記ディープ畳み込みニューラルネットワークは、複数の第一畳み込み層と少なくとも一つのダウンサンプリング層とを有する第一サブネット、および、複数の第二畳み込み層と少なくとも一つのアップサンプリング層とを有する第二サブネットを含み、前記融合特徴マップは、第一サブネットから取得した第一特徴マップおよび第二サブネットから取得した第二特徴マップによって得られ、少なくとも一つの前記第一畳み込み層には前記第一特徴マップを出力するための第一出力分岐が設けられ、前記第二畳み込み層には前記第二特徴マップを出力するための第二出力分岐が設けられる、ことと、
前記複数の融合特徴マップに基づいて前記サンプル画像の目標領域ボックスデータを取得することと、
取得した前記サンプル画像の目標領域ボックスデータおよび前記目標領域ボックス標記情報に基づいて物体ボックス検出の第一差異データを特定することと、
前記第一差異データに基づいて前記ディープ畳み込みニューラルネットワークのネットワークパラメータを調整することと、を含み、
前記第二サブネットは複数の第三畳み込み層をさらに有し、前記第三畳み込み層の入力が前記第一出力分岐および前記第二出力分岐を含み、
複数の融合特徴マップを予測して取得するステップは、前記複数の第三畳み込み層の出力端から前記融合特徴マップをそれぞれ取得することを含む、
ニューラルネットワークの訓練方法。 - 目標領域ボックス検出用のディープ畳み込みニューラルネットワークにより、処理対象の画像から複数の融合特徴マップを予測して取得するための融合特徴マップ予測モジュールであって、前記ディープ畳み込みニューラルネットワークは、複数の第一畳み込み層と少なくとも一つのダウンサンプリング層とを有する第一サブネット、および、複数の第二畳み込み層と少なくとも一つのアップサンプリング層とを有する第二サブネットを含み、前記融合特徴マップは、第一サブネットから取得した第一特徴マップおよび第二サブネットから取得した第二特徴マップによって得られ、少なくとも一つの前記第一畳み込み層には前記第一特徴マップを出力するための第一出力分岐が設けられ、前記第二畳み込み層には前記第二特徴マップを出力するための第二出力分岐が設けられる、融合特徴マップ予測モジュールと、
前記融合特徴マップ予測モジュールが取得した複数の融合特徴マップに基づいて目標領域ボックスデータを取得するための目標領域ボックス予測モジュールと、を含み、
前記第二サブネットは複数の第三畳み込み層をさらに有し、前記第三畳み込み層の入力が前記第一出力分岐および前記第二出力分岐を含み、
前記融合特徴マップ予測モジュールは、さらに、前記複数の第三畳み込み層の出力端から前記融合特徴マップをそれぞれ取得するために用いられる、
物体検出装置。 - 目標領域ボックス標記情報を含むサンプル画像を目標領域ボックス検出用のディープ畳み込みニューラルネットワークに入力し、複数の融合特徴マップを検出して取得するための融合特徴マップ検出モジュールであって、前記ディープ畳み込みニューラルネットワークは、複数の第一畳み込み層と少なくとも一つのダウンサンプリング層とを有する第一サブネット、および、複数の第二畳み込み層と少なくとも一つのアップサンプリング層とを有する第二サブネットを含み、前記融合特徴マップは、第一サブネットから取得した第一特徴マップおよび第二サブネットから取得した第二特徴マップによって得られ、少なくとも一つの前記第一畳み込み層には前記第一特徴マップを出力するための第一出力分岐が設けられ、前記第二畳み込み層には前記第二特徴マップを出力するための第二出力分岐が設けられる、融合特徴マップ検出モジュールと、
前記複数の融合特徴マップに基づいて前記サンプル画像の目標領域ボックスデータを取得するための目標領域ボックス検出モジュールと、
取得した前記サンプル画像の目標領域ボックスデータおよび前記目標領域ボックス標記情報に基づいて物体ボックス検出の第一差異データを特定するための第一差異取得モジュールと、
前記第一差異データに基づいて前記ディープ畳み込みニューラルネットワークのネットワークパラメータを調整するための第一ネットワーク訓練モジュールと、を含み、
前記第二サブネットは複数の第三畳み込み層をさらに有し、前記第三畳み込み層の入力が前記第一出力分岐および前記第二出力分岐を含み、
前記融合特徴マップ検出モジュールは、さらに、前記複数の第三畳み込み層の出力端から前記融合特徴マップをそれぞれ取得するために用いられる、
ニューラルネットワークの訓練装置。 - プロセッサ、および
前記プロセッサに請求項1から7のいずれか一項に記載の物体検出方法に対応する動作を実行させる少なくとも一つの実行可能指令を記憶するための、または、前記プロセッサに請求項8に記載のニューラルネットワークの訓練方法に対応する動作を実行させる少なくとも一つの実行可能指令を記憶するためのメモリを含む、電子機器。 - 請求項9に記載の物体検出装置、および、前記物体検出装置を運用する時、請求項9に記載の物体検出装置におけるユニットが運用されるプロセッサ、または
請求項10に記載のニューラルネットワークの訓練装置、および前記ニューラルネットワークの訓練装置を運用する時、請求項10に記載のニューラルネットワークの訓練装置におけるユニットが運用されるプロセッサを含む、電子機器。 - 機器において運用される時、前記機器内のプロセッサが請求項1から7のいずれか一項に記載の物体検出方法における各ステップを実現するための指令を実行するか、または
機器において運用される時、前記機器内のプロセッサが請求項8に記載のニューラルネットワークの訓練方法における各ステップを実現するための指令を実行するコンピュータ読み取り可能コードを含む、コンピュータプログラム。 - コンピュータ読み取り可能指令を記憶するためのコンピュータ読み取り可能記憶媒体であって、前記指令が実行される時に請求項1から7のいずれか一項に記載の物体検出方法における各ステップの動作、または請求項8に記載のニューラルネットワークの訓練方法における各ステップの動作を実現することを特徴とする、コンピュータ読み取り可能記憶媒体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710100676.1 | 2017-02-23 | ||
CN201710100676.1A CN108229455B (zh) | 2017-02-23 | 2017-02-23 | 物体检测方法、神经网络的训练方法、装置和电子设备 |
PCT/CN2018/076653 WO2018153319A1 (zh) | 2017-02-23 | 2018-02-13 | 物体检测方法、神经网络的训练方法、装置和电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020509488A JP2020509488A (ja) | 2020-03-26 |
JP6902611B2 true JP6902611B2 (ja) | 2021-07-14 |
Family
ID=62657296
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019545345A Active JP6902611B2 (ja) | 2017-02-23 | 2018-02-13 | 物体検出方法、ニューラルネットワークの訓練方法、装置および電子機器 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11321593B2 (ja) |
JP (1) | JP6902611B2 (ja) |
CN (1) | CN108229455B (ja) |
SG (1) | SG11201907355XA (ja) |
WO (1) | WO2018153319A1 (ja) |
Families Citing this family (101)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108701210B (zh) * | 2016-02-02 | 2021-08-17 | 北京市商汤科技开发有限公司 | 用于cnn网络适配和对象在线追踪的方法和系统 |
US10496895B2 (en) * | 2017-03-28 | 2019-12-03 | Facebook, Inc. | Generating refined object proposals using deep-learning models |
CN108230294B (zh) * | 2017-06-14 | 2020-09-29 | 北京市商汤科技开发有限公司 | 图像检测方法、装置、电子设备和存储介质 |
US10692243B2 (en) * | 2017-12-03 | 2020-06-23 | Facebook, Inc. | Optimizations for dynamic object instance detection, segmentation, and structure mapping |
CN108985206B (zh) * | 2018-07-04 | 2020-07-28 | 百度在线网络技术(北京)有限公司 | 模型训练方法、人体识别方法、装置、设备及存储介质 |
CN108986891A (zh) * | 2018-07-24 | 2018-12-11 | 北京市商汤科技开发有限公司 | 医疗影像处理方法及装置、电子设备及存储介质 |
CN110163197B (zh) * | 2018-08-24 | 2023-03-10 | 腾讯科技(深圳)有限公司 | 目标检测方法、装置、计算机可读存储介质及计算机设备 |
CN109360633B (zh) * | 2018-09-04 | 2022-08-30 | 北京市商汤科技开发有限公司 | 医疗影像处理方法及装置、处理设备及存储介质 |
CN109376767B (zh) * | 2018-09-20 | 2021-07-13 | 中国科学技术大学 | 基于深度学习的视网膜oct图像分类方法 |
CN109461177B (zh) * | 2018-09-29 | 2021-12-10 | 浙江科技学院 | 一种基于神经网络的单目图像深度预测方法 |
CN112088393B (zh) * | 2018-09-29 | 2022-09-23 | 华为技术有限公司 | 图像处理方法、装置及设备 |
US10300851B1 (en) * | 2018-10-04 | 2019-05-28 | StradVision, Inc. | Method for warning vehicle of risk of lane change and alarm device using the same |
CN109410240A (zh) * | 2018-10-09 | 2019-03-01 | 电子科技大学中山学院 | 一种量体特征点定位方法、装置及其存储介质 |
CN111126421B (zh) * | 2018-10-31 | 2023-07-21 | 浙江宇视科技有限公司 | 目标检测方法、装置及可读存储介质 |
CN109522966B (zh) * | 2018-11-28 | 2022-09-27 | 中山大学 | 一种基于密集连接卷积神经网络的目标检测方法 |
CN111260548B (zh) * | 2018-11-30 | 2023-07-21 | 浙江宇视科技有限公司 | 基于深度学习的贴图方法及装置 |
CN111353597B (zh) * | 2018-12-24 | 2023-12-05 | 杭州海康威视数字技术股份有限公司 | 一种目标检测神经网络训练方法和装置 |
CN109543662B (zh) * | 2018-12-28 | 2023-04-21 | 广州海昇计算机科技有限公司 | 基于区域提议的目标检测方法、系统、装置和存储介质 |
CN109800793B (zh) * | 2018-12-28 | 2023-12-22 | 广州海昇教育科技有限责任公司 | 一种基于深度学习的目标检测方法和系统 |
CN111382647B (zh) * | 2018-12-29 | 2021-07-30 | 广州市百果园信息技术有限公司 | 一种图片处理方法、装置、设备及存储介质 |
CN111401396B (zh) * | 2019-01-03 | 2023-04-18 | 阿里巴巴集团控股有限公司 | 图像识别方法及装置 |
CN111445020B (zh) * | 2019-01-16 | 2023-05-23 | 阿里巴巴集团控股有限公司 | 一种基于图的卷积网络训练方法、装置及系统 |
US10402977B1 (en) * | 2019-01-25 | 2019-09-03 | StradVision, Inc. | Learning method and learning device for improving segmentation performance in road obstacle detection required to satisfy level 4 and level 5 of autonomous vehicles using laplacian pyramid network and testing method and testing device using the same |
US10410352B1 (en) * | 2019-01-25 | 2019-09-10 | StradVision, Inc. | Learning method and learning device for improving segmentation performance to be used for detecting events including pedestrian event, vehicle event, falling event and fallen event using edge loss and test method and test device using the same |
US10824947B2 (en) * | 2019-01-31 | 2020-11-03 | StradVision, Inc. | Learning method for supporting safer autonomous driving without danger of accident by estimating motions of surrounding objects through fusion of information from multiple sources, learning device, testing method and testing device using the same |
CN109902634A (zh) * | 2019-03-04 | 2019-06-18 | 上海七牛信息技术有限公司 | 一种基于神经网络的视频分类方法以及系统 |
CN111666960B (zh) * | 2019-03-06 | 2024-01-19 | 南京地平线机器人技术有限公司 | 图像识别方法、装置、电子设备及可读存储介质 |
CN110111299A (zh) * | 2019-03-18 | 2019-08-09 | 国网浙江省电力有限公司信息通信分公司 | 锈斑识别方法及装置 |
CN109978863B (zh) * | 2019-03-27 | 2021-10-08 | 北京青燕祥云科技有限公司 | 基于x射线图像的目标检测方法及计算机设备 |
CN110110617B (zh) * | 2019-04-22 | 2021-04-20 | 腾讯科技(深圳)有限公司 | 医学影像分割方法、装置、电子设备和存储介质 |
CN110097108B (zh) * | 2019-04-24 | 2021-03-02 | 佳都新太科技股份有限公司 | 非机动车的识别方法、装置、设备及存储介质 |
CN110210474B (zh) | 2019-04-30 | 2021-06-01 | 北京市商汤科技开发有限公司 | 目标检测方法及装置、设备及存储介质 |
CN110084309B (zh) * | 2019-04-30 | 2022-06-21 | 北京市商汤科技开发有限公司 | 特征图放大方法、装置和设备及计算机可读存储介质 |
CN110148157B (zh) * | 2019-05-10 | 2021-02-02 | 腾讯科技(深圳)有限公司 | 画面目标跟踪方法、装置、存储介质及电子设备 |
JP7350515B2 (ja) * | 2019-05-22 | 2023-09-26 | キヤノン株式会社 | 情報処理装置、情報処理方法およびプログラム |
CN112001211B (zh) * | 2019-05-27 | 2024-04-19 | 商汤集团有限公司 | 对象检测方法、装置、设备及计算机可读存储介质 |
CN110163864B (zh) * | 2019-05-28 | 2020-12-04 | 北京迈格威科技有限公司 | 图像分割方法、装置、计算机设备和存储介质 |
CN110288082B (zh) * | 2019-06-05 | 2022-04-05 | 北京字节跳动网络技术有限公司 | 卷积神经网络模型训练方法、装置和计算机可读存储介质 |
CN110263797B (zh) * | 2019-06-21 | 2022-07-12 | 北京字节跳动网络技术有限公司 | 骨架的关键点估计方法、装置、设备及可读存储介质 |
CN110378398B (zh) * | 2019-06-27 | 2023-08-25 | 东南大学 | 一种基于多尺度特征图跳跃融合的深度学习网络改进方法 |
CN112241665A (zh) * | 2019-07-18 | 2021-01-19 | 顺丰科技有限公司 | 一种暴力分拣识别方法、装置、设备及存储介质 |
CN110503063B (zh) * | 2019-08-28 | 2021-12-17 | 东北大学秦皇岛分校 | 基于沙漏卷积自动编码神经网络的跌倒检测方法 |
CN110826403B (zh) * | 2019-09-27 | 2020-11-24 | 深圳云天励飞技术有限公司 | 跟踪目标确定方法及相关设备 |
CN110705479A (zh) * | 2019-09-30 | 2020-01-17 | 北京猎户星空科技有限公司 | 模型训练方法和目标识别方法、装置、设备及介质 |
KR102287947B1 (ko) * | 2019-10-28 | 2021-08-09 | 삼성전자주식회사 | 영상의 ai 부호화 및 ai 복호화 방법, 및 장치 |
CN111767935B (zh) * | 2019-10-31 | 2023-09-05 | 杭州海康威视数字技术股份有限公司 | 一种目标检测方法、装置及电子设备 |
CN110852325B (zh) * | 2019-10-31 | 2023-03-31 | 上海商汤智能科技有限公司 | 图像的分割方法及装置、电子设备和存储介质 |
CN111767934B (zh) * | 2019-10-31 | 2023-11-03 | 杭州海康威视数字技术股份有限公司 | 一种图像识别方法、装置及电子设备 |
CN110826457B (zh) * | 2019-10-31 | 2022-08-19 | 上海融军科技有限公司 | 一种复杂场景下的车辆检测方法及装置 |
CN110796115B (zh) * | 2019-11-08 | 2022-12-23 | 厦门美图宜肤科技有限公司 | 图像检测方法、装置、电子设备及可读存储介质 |
CN111222534B (zh) * | 2019-11-15 | 2022-10-11 | 重庆邮电大学 | 一种基于双向特征融合和更平衡l1损失的单发多框检测器优化方法 |
CN112825248A (zh) * | 2019-11-19 | 2021-05-21 | 阿里巴巴集团控股有限公司 | 语音处理方法、模型训练方法、界面显示方法及设备 |
CN111046917B (zh) * | 2019-11-20 | 2022-08-09 | 南京理工大学 | 基于深度神经网络的对象性增强目标检测方法 |
CN110956119B (zh) * | 2019-11-26 | 2023-05-26 | 大连理工大学 | 一种图像中目标检测的方法 |
CN110956122B (zh) * | 2019-11-27 | 2022-08-02 | 深圳市商汤科技有限公司 | 图像处理方法及装置、处理器、电子设备、存储介质 |
CN111079620B (zh) * | 2019-12-10 | 2023-10-17 | 北京小蝇科技有限责任公司 | 基于迁移学习的白细胞图像检测识别模型构建方法及应用 |
CN111091089B (zh) * | 2019-12-12 | 2022-07-29 | 新华三大数据技术有限公司 | 一种人脸图像处理方法、装置、电子设备及存储介质 |
CN111104906A (zh) * | 2019-12-19 | 2020-05-05 | 南京工程学院 | 一种基于yolo的输电塔鸟巢故障检测方法 |
CN111080528B (zh) * | 2019-12-20 | 2023-11-07 | 北京金山云网络技术有限公司 | 图像超分辨率和模型训练方法、装置、电子设备及介质 |
CN110751134B (zh) * | 2019-12-23 | 2020-05-12 | 长沙智能驾驶研究院有限公司 | 目标检测方法、装置、存储介质及计算机设备 |
CN111210417B (zh) * | 2020-01-07 | 2023-04-07 | 创新奇智(北京)科技有限公司 | 基于卷积神经网络的布匹缺陷检测方法 |
CN111310633B (zh) * | 2020-02-10 | 2023-05-05 | 江南大学 | 基于视频的并行时空注意力行人重识别方法 |
CN111260019B (zh) * | 2020-02-18 | 2023-04-11 | 深圳鲲云信息科技有限公司 | 神经网络模型的数据处理方法、装置、设备及存储介质 |
CN111339884B (zh) * | 2020-02-19 | 2023-06-06 | 浙江大华技术股份有限公司 | 图像识别方法以及相关设备、装置 |
CN111340048B (zh) * | 2020-02-28 | 2022-02-22 | 深圳市商汤科技有限公司 | 图像处理方法及装置、电子设备和存储介质 |
CN113496150B (zh) * | 2020-03-20 | 2023-03-21 | 长沙智能驾驶研究院有限公司 | 密集目标检测方法、装置、存储介质及计算机设备 |
CN111767919B (zh) * | 2020-04-10 | 2024-02-06 | 福建电子口岸股份有限公司 | 一种多层双向特征提取与融合的目标检测方法 |
CN111914774A (zh) * | 2020-05-07 | 2020-11-10 | 清华大学 | 基于稀疏卷积神经网络的3d物体检测方法及装置 |
CN111881744A (zh) * | 2020-06-23 | 2020-11-03 | 安徽清新互联信息科技有限公司 | 一种基于空间位置信息的人脸特征点定位方法及系统 |
CN111881912A (zh) * | 2020-08-19 | 2020-11-03 | Oppo广东移动通信有限公司 | 数据处理方法、装置以及电子设备 |
CN112101345A (zh) * | 2020-08-26 | 2020-12-18 | 贵州优特云科技有限公司 | 一种水表读数识别的方法以及相关装置 |
KR20220036061A (ko) * | 2020-09-15 | 2022-03-22 | 삼성전자주식회사 | 전자 장치, 그 제어 방법 및 전자 시스템 |
EP4113382A4 (en) | 2020-09-15 | 2023-08-30 | Samsung Electronics Co., Ltd. | ELECTRONIC DEVICE, ITS CONTROL METHOD AND SYSTEM |
CN112288031A (zh) * | 2020-11-18 | 2021-01-29 | 北京航空航天大学杭州创新研究院 | 交通信号灯检测方法、装置、电子设备和存储介质 |
CN112465226B (zh) * | 2020-11-27 | 2023-01-20 | 上海交通大学 | 一种基于特征交互和图神经网络的用户行为预测方法 |
CN112446378B (zh) * | 2020-11-30 | 2022-09-16 | 展讯通信(上海)有限公司 | 目标检测方法及装置、存储介质、终端 |
CN112419292B (zh) * | 2020-11-30 | 2024-03-26 | 深圳云天励飞技术股份有限公司 | 病理图像的处理方法、装置、电子设备及存储介质 |
CN112418165B (zh) * | 2020-12-07 | 2023-04-07 | 武汉工程大学 | 基于改进型级联神经网络的小尺寸目标检测方法与装置 |
CN112633352B (zh) * | 2020-12-18 | 2023-08-29 | 浙江大华技术股份有限公司 | 一种目标检测方法、装置、电子设备及存储介质 |
CN112801266B (zh) * | 2020-12-24 | 2023-10-31 | 武汉旷视金智科技有限公司 | 神经网络构建方法、装置、设备及介质 |
CN112989919B (zh) * | 2020-12-25 | 2024-04-19 | 首都师范大学 | 一种从影像中提取目标对象的方法及系统 |
CN112686329A (zh) * | 2021-01-06 | 2021-04-20 | 西安邮电大学 | 基于双核卷积特征提取的电子喉镜图像分类方法 |
CN112766137B (zh) * | 2021-01-14 | 2023-02-10 | 华南理工大学 | 一种基于深度学习的动态场景异物入侵检测方法 |
CN112784742A (zh) * | 2021-01-21 | 2021-05-11 | 宠爱王国(北京)网络科技有限公司 | 鼻纹特征的提取方法、装置及非易失性存储介质 |
CN112906485B (zh) * | 2021-01-25 | 2023-01-31 | 杭州易享优智能科技有限公司 | 基于改进的yolo模型的视障人士辅助障碍物感知方法 |
CN113052165A (zh) * | 2021-01-28 | 2021-06-29 | 北京迈格威科技有限公司 | 目标检测方法、装置、电子设备及存储介质 |
CN112906621A (zh) * | 2021-03-10 | 2021-06-04 | 北京华捷艾米科技有限公司 | 一种手部检测方法、装置、存储介质和设备 |
CN112990317B (zh) * | 2021-03-18 | 2022-08-30 | 中国科学院长春光学精密机械与物理研究所 | 一种弱小目标检测方法 |
WO2022205329A1 (zh) * | 2021-04-01 | 2022-10-06 | 京东方科技集团股份有限公司 | 对象检测方法、对象检测装置及对象检测系统 |
CN113191235B (zh) * | 2021-04-22 | 2024-05-17 | 上海东普信息科技有限公司 | 杂物检测方法、装置、设备及存储介质 |
CN113139543B (zh) * | 2021-04-28 | 2023-09-01 | 北京百度网讯科技有限公司 | 目标对象检测模型的训练方法、目标对象检测方法和设备 |
CN113298130B (zh) * | 2021-05-14 | 2023-05-09 | 嘉洋智慧安全科技(北京)股份有限公司 | 目标图像的检测、目标对象检测模型的生成方法 |
US11823490B2 (en) * | 2021-06-08 | 2023-11-21 | Adobe, Inc. | Non-linear latent to latent model for multi-attribute face editing |
CN113538351B (zh) * | 2021-06-30 | 2024-01-19 | 国网山东省电力公司电力科学研究院 | 一种融合多参数电信号的外绝缘设备缺陷程度评估方法 |
CN113673578A (zh) * | 2021-07-27 | 2021-11-19 | 浙江大华技术股份有限公司 | 图像检测方法、图像检测设备及计算机可读存储介质 |
CN114005178B (zh) * | 2021-10-29 | 2023-09-01 | 北京百度网讯科技有限公司 | 人物交互检测方法、神经网络及其训练方法、设备和介质 |
CN114549883B (zh) * | 2022-02-24 | 2023-09-05 | 北京百度网讯科技有限公司 | 图像处理方法、深度学习模型的训练方法、装置和设备 |
CN114871115A (zh) * | 2022-04-28 | 2022-08-09 | 五邑大学 | 一种物体分拣方法、装置、设备及存储介质 |
CN115578624A (zh) * | 2022-10-28 | 2023-01-06 | 北京市农林科学院 | 农业病虫害模型构建方法、检测方法及装置 |
CN116994231A (zh) * | 2023-08-01 | 2023-11-03 | 无锡车联天下信息技术有限公司 | 一种车内遗留物体的确定方法、装置及电子设备 |
CN117237746B (zh) * | 2023-11-13 | 2024-03-15 | 光宇锦业(武汉)智能科技有限公司 | 基于多交叉边缘融合小目标检测方法、系统及存储介质 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103413120B (zh) * | 2013-07-25 | 2016-07-20 | 华南农业大学 | 基于物体整体性和局部性识别的跟踪方法 |
WO2016004330A1 (en) * | 2014-07-03 | 2016-01-07 | Oim Squared Inc. | Interactive content generation |
CN105120130B (zh) | 2015-09-17 | 2018-06-29 | 京东方科技集团股份有限公司 | 一种图像升频系统、其训练方法及图像升频方法 |
US9424494B1 (en) * | 2016-01-28 | 2016-08-23 | International Business Machines Corporation | Pure convolutional neural network localization |
CN106126579B (zh) * | 2016-06-17 | 2020-04-28 | 北京市商汤科技开发有限公司 | 物体识别方法和装置、数据处理装置和终端设备 |
CN106296728B (zh) | 2016-07-27 | 2019-05-14 | 昆明理工大学 | 一种基于全卷积网络的非限制场景中运动目标快速分割方法 |
CN106295678B (zh) * | 2016-07-27 | 2020-03-06 | 北京旷视科技有限公司 | 神经网络训练与构建方法和装置以及目标检测方法和装置 |
CN106355573B (zh) * | 2016-08-24 | 2019-10-25 | 北京小米移动软件有限公司 | 图片中目标物的定位方法及装置 |
CN106447658B (zh) * | 2016-09-26 | 2019-06-21 | 西北工业大学 | 基于全局和局部卷积网络的显著性目标检测方法 |
CN106709532B (zh) | 2017-01-25 | 2020-03-10 | 京东方科技集团股份有限公司 | 图像处理方法和装置 |
CN110647834B (zh) * | 2019-09-18 | 2021-06-25 | 北京市商汤科技开发有限公司 | 人脸和人手关联检测方法及装置、电子设备和存储介质 |
US11367271B2 (en) * | 2020-06-19 | 2022-06-21 | Adobe Inc. | Similarity propagation for one-shot and few-shot image segmentation |
-
2017
- 2017-02-23 CN CN201710100676.1A patent/CN108229455B/zh active Active
-
2018
- 2018-02-13 WO PCT/CN2018/076653 patent/WO2018153319A1/zh active Application Filing
- 2018-02-13 US US16/314,406 patent/US11321593B2/en active Active
- 2018-02-13 JP JP2019545345A patent/JP6902611B2/ja active Active
- 2018-02-13 SG SG11201907355XA patent/SG11201907355XA/en unknown
Also Published As
Publication number | Publication date |
---|---|
CN108229455B (zh) | 2020-10-16 |
US11321593B2 (en) | 2022-05-03 |
SG11201907355XA (en) | 2019-09-27 |
WO2018153319A1 (zh) | 2018-08-30 |
JP2020509488A (ja) | 2020-03-26 |
US20190156144A1 (en) | 2019-05-23 |
CN108229455A (zh) | 2018-06-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6902611B2 (ja) | 物体検出方法、ニューラルネットワークの訓練方法、装置および電子機器 | |
CN109344789B (zh) | 人脸跟踪方法及装置 | |
WO2019020075A1 (zh) | 图像处理方法、装置、存储介质、计算机程序和电子设备 | |
JP7425147B2 (ja) | 画像処理方法、テキスト認識方法及び装置 | |
CN110443258B (zh) | 文字检测方法、装置、电子设备及存储介质 | |
CN110544214A (zh) | 一种图像修复方法、装置及电子设备 | |
CN112749726B (zh) | 目标检测模型的训练方法、装置、计算机设备和存储介质 | |
CN113313083B (zh) | 文本检测方法及装置 | |
CN113177472A (zh) | 动态手势识别方法、装置、设备以及存储介质 | |
WO2020062494A1 (zh) | 图像处理方法和装置 | |
CN112784750B (zh) | 基于像素和区域特征匹配的快速视频物体分割方法和装置 | |
CN112597918A (zh) | 文本检测方法及装置、电子设备、存储介质 | |
CN111914756A (zh) | 一种视频数据处理方法和装置 | |
CN113887615A (zh) | 图像处理方法、装置、设备和介质 | |
CN108229281B (zh) | 神经网络的生成方法和人脸检测方法、装置及电子设备 | |
CN115063656A (zh) | 图像检测方法、装置、计算机可读存储介质及电子设备 | |
CN113516697B (zh) | 图像配准的方法、装置、电子设备及计算机可读存储介质 | |
CN110119736B (zh) | 车牌位置识别方法、装置及电子设备 | |
CN112784743B (zh) | 关键点的识别方法、装置及存储介质 | |
CN111767934B (zh) | 一种图像识别方法、装置及电子设备 | |
CN115330851A (zh) | 单目深度估计方法、装置、电子设备、存储介质及车辆 | |
CN114898190A (zh) | 一种图像处理方法和装置 | |
CN113642510A (zh) | 目标检测方法、装置、设备和计算机可读介质 | |
CN113610856A (zh) | 训练图像分割模型和图像分割的方法和装置 | |
CN115049895B (zh) | 一种图像属性识别方法、属性识别模型训练方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190820 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190820 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200916 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201104 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210202 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210224 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210521 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210601 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210621 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6902611 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |