JP2023531350A - サンプル画像を増分する方法、画像検出モデルの訓練方法及び画像検出方法 - Google Patents
サンプル画像を増分する方法、画像検出モデルの訓練方法及び画像検出方法 Download PDFInfo
- Publication number
- JP2023531350A JP2023531350A JP2022552961A JP2022552961A JP2023531350A JP 2023531350 A JP2023531350 A JP 2023531350A JP 2022552961 A JP2022552961 A JP 2022552961A JP 2022552961 A JP2022552961 A JP 2022552961A JP 2023531350 A JP2023531350 A JP 2023531350A
- Authority
- JP
- Japan
- Prior art keywords
- image
- candidate region
- interest
- region
- loss value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 129
- 238000000034 method Methods 0.000 title claims abstract description 111
- 238000012549 training Methods 0.000 title claims abstract description 53
- 238000012545 processing Methods 0.000 claims abstract description 57
- 238000003860 storage Methods 0.000 claims abstract description 23
- 238000004590 computer program Methods 0.000 claims abstract description 21
- 238000013507 mapping Methods 0.000 claims abstract description 17
- 230000008569 process Effects 0.000 claims description 24
- 230000004044 response Effects 0.000 claims description 5
- 238000013473 artificial intelligence Methods 0.000 abstract description 4
- 238000007689 inspection Methods 0.000 abstract description 4
- 238000013135 deep learning Methods 0.000 abstract description 3
- 238000000605 extraction Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 8
- 230000006870 function Effects 0.000 description 4
- 239000000284 extract Substances 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 238000009826 distribution Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000009432 framing Methods 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- KYGZCKSPAKDVKC-UHFFFAOYSA-N Oxolinic acid Chemical compound C1=C2N(CC)C=C(C(O)=O)C(=O)C2=CC2=C1OCO2 KYGZCKSPAKDVKC-UHFFFAOYSA-N 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000005338 frosted glass Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000007769 metal material Substances 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/60—Image enhancement or restoration using machine learning, e.g. neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/73—Deblurring; Sharpening
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20076—Probabilistic image processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30108—Industrial image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30168—Image quality inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
Description
本出願は、2021年4月7日に提出された、出願番号が202110371342.4で、発明の名称が「サンプル画像を増分する方法、画像検出モデルの訓練方法及び画像検出方法」である中国特許出願に基づく優先権を主張し、当該出願の全文を引用により本出願に組み込む。
1)元の画像Aに対して畳み込みニューラルネットワークにより畳み込み特徴を抽出する。
2)領域提案ネットワークにより、抽出した畳み込み特徴に対して、対象物が存在する可能性のある候補領域と、各候補領域に対象物が存在することの確率スコアを決定する。
3)ステップ2)で得た候補領域と、ステップ1)で抽出した畳み込み特徴に対して、通常のROI(region of interest、関心領域)プーリングを行ってから、二つの全結合層に入力して、数千の分類確率を得ており、それぞれの分類確率はその対応する回帰の決定境界を有し、それらを分類確率a1及び回帰の決定境界a2と記す。
4)ステップ2)で得た候補領域を確率スコアの高い順にソートし、上位N個の候補領域を選び出して元の画像にマッピングして(Nの値は50であり、該パラメータは具体的なタスクに応じて調整可能である)、N個の検出枠が付けられた中間画像を得ることができる。
5)ステップ4)で得た中間画像内の検出枠外の領域を背景領域とし、当該背景領域に対してガウスぼかしを行い、検出枠内の前景領域に対して画像強調を行って鮮明さを向上させて画像Bを得る。
6)画像Bを畳み込み特徴抽出ネットワークに入力すると、最終に、分類確率b1及び回帰の決定境界b2を得ることができる。
7)分類確率a1と分類確率a2とを重み付けて合計して最終的な分類確率を求め、所定の閾値に応じて、分類確率に対応する回帰の決定境界(b1およびb2)を、検出待ちの元の画像にマッピングして、最終の検出結果を得る。
Claims (19)
- サンプル画像を増分する方法であって、
元のサンプル画像の第1の畳み込み特徴を取得するステップと、
領域提案ネットワーク及び前記第1の畳み込み特徴に基づいて、候補領域と、前記候補領域に目標対象物が存在する第1の確率とを決定するステップと、
前記第1の確率に基づいて、前記候補領域において注目候補領域を決定し、前記注目候補領域を前記元のサンプル画像にマッピングして、中間画像を得るステップと、
前記中間画像内の前記注目候補領域に対応する部分に対して画像強調処理を行い、および/または、前記中間画像内の前記注目候補領域以外の領域に対応する部分に対して画像ぼかし処理を行って、増分サンプル画像を得るステップと
を含む方法。 - 前記中間画像内の前記注目候補領域以外の領域に対応する部分に対して画像ぼかし処理を行うことは、
前記中間画像内の前記注目候補領域以外の領域に対応する部分に対してガウスぼかし処理を行うステップを含む、請求項1に記載の方法。 - 前記第1の確率に基づいて、前記候補領域において注目候補領域を決定することは、
前記第1の確率が予め設定された確率よりも大きい候補領域を、注目候補領域として決定するステップを含む、請求項1に記載の方法。 - 前記中間画像内の前記注目候補領域に対応する部分に対して画像強調処理を行うことは、
前記中間画像内の第1の注目領域に対して第1の画像強調処理を行うステップであって、前記第1の注目領域は、少なくとも2つの前記注目候補領域を前記元のサンプル画像にマッピングした重複部分であるステップと、
前記中間画像内の第2の注目領域に対して第2の画像強調処理を行うステップであって、前記第2の注目領域は、単一の前記注目候補領域を前記元のサンプル画像にマッピングした部分であり、前記第1の画像強調処理の画像強調の強度は、前記第2の画像強調処理の画像強調の強度よりも大きいステップと
を含む、請求項1に記載の方法。 - 画像検出モデルの訓練方法であって、
増分サンプル画像の第2の畳み込み特徴を取得するステップであって、前記増分サンプル画像は請求項1~4のいずれか1項に記載のサンプル画像を増分する方法により取得されたものであるステップと、
領域提案ネットワーク及び前記第2の畳み込み特徴に基づいて、新しい候補領域と、前記新しい候補領域に目標対象物が存在する第2の確率とを決定するステップと、
第1の確率に対応する第1の損失値、及び前記第2の確率に対応する第2の損失値を取得するステップと、
重み付け後の第1の損失値と第2の損失値に基づいて、統合損失値を決定するステップと、
前記統合損失値が予め設定された要求を満たすことにより、訓練済み画像検出モデルを得るステップと
を含む方法。 - 前記重み付け後の第1の損失値と第2の損失値に基づいて、統合損失値を決定するステップは、
重み付け後の第1の損失値と重み付け後の第2の損失値との和を、前記統合損失値とするステップを含む、請求項5に記載の画像検出モデルの訓練方法。 - 前記統合損失値が予め設定された要求を満たすことにより、訓練済み画像検出モデルを得るステップは、
前記統合損失値が、予め設定された回数で訓練を繰り返して得た統合損失値のうちの最小値となることに応答して、訓練済み画像検出モデルを出力するステップを含む、請求項5に記載の画像検出モデルの訓練方法。 - 画像検出方法であって、
検出待ちの画像を受信するステップと、
画像検出モデルを呼び出して、前記検出待ちの画像を検出するステップであって、前記画像検出モデルは、請求項5~7のいずれか1項に記載の画像検出モデルの訓練方法により得られた画像検出モデルであるステップと
を含む方法。 - サンプル画像を増分する装置であって、
元のサンプル画像の第1の畳み込み特徴を取得するように構成される第1の畳み込み特徴量取得ユニットと、
領域提案ネットワーク及び前記第1の畳み込み特徴に基づいて、候補領域と、前記候補領域に目標対象物が存在する第1の確率とを決定するように構成される、候補領域・確率決定ユニットと、
前記第1の確率に基づいて、前記候補領域において注目候補領域を決定し、前記注目候補領域を前記元のサンプル画像にマッピングして、中間画像を得るように構成される注目候補領域決定・マッピングユニットと、
前記中間画像内の前記注目候補領域に対応する部分に対して画像強調処理を行い、および/または、前記中間画像内の前記注目候補領域以外の領域に対応する部分に対して画像ぼかし処理を行って、増分サンプル画像を得るように構成される中間画像処理ユニットと
を備える装置。 - 前記中間画像処理ユニットは、前記中間画像内の前記注目候補領域以外の領域に対応する部分に対して画像ぼかし処理を行うぼかし処理サブユニットを備え、
前記ぼかし処理サブユニットは、さらに、
前記中間画像内の前記注目候補領域以外の領域に対応する部分に対してガウスぼかし処理を行うように構成される、請求項9に記載の装置。 - 前記注目候補領域決定・マッピングユニットは、前記第1の確率に基づいて、前記候補領域において注目候補領域を決定するように構成された注目候補領域決定サブユニットを備え、
前記注目候補領域決定サブユニットは、さらに、
前記第1の確率が予め設定された確率よりも大きい候補領域を、注目候補領域として決定するように構成される、請求項9に記載の装置。 - 前記中間画像処理ユニットは、前記中間画像内の前記注目候補領域に対する部分に対して画像強調処理を行う強調処理サブユニットを備え、
前記強調処理サブユニットは、さらに、
前記中間画像内の第1の注目領域に対して第1の画像強調処理を行い、
前記中間画像内の第2の注目領域に対して第2の画像強調処理を行うように構成され、
前記第1の注目領域は、少なくとも2つの前記注目候補領域を前記元のサンプル画像にマッピングした重複部分であり、
前記第2の注目領域は、単一の前記注目候補領域を前記元のサンプル画像にマッピングした部分であり、前記第1の画像強調処理の画像強調の強度は、前記第2の画像強調処理の画像強調の強度よりも大きい、請求項9に記載の装置。 - 画像検出モデルの訓練装置であって、
増分サンプル画像の第2の畳み込み特徴を取得するように構成される第2の畳み込み特徴量取得ユニットであって、前記増分サンプル画像は請求項9~12のいずれか1項に記載のサンプル画像を増分する装置により取得されたものであるユニットと、
領域提案ネットワーク及び前記第2の畳み込み特徴に基づいて、新しい候補領域と、前記新しい候補領域に目標対象物が存在する第2の確率とを決定するように構成される新候補領域・確率決定ユニットと、
第1の確率に対応する第1の損失値、及び前記第2の確率に対応する第2の損失値を取得するように構成される損失値取得ユニットと、
重み付け後の第1の損失値と第2の損失値に基づいて、統合損失値を決定するように構成される統合損失値決定ユニットと、
前記統合損失値が予め設定された要求を満たすことにより、訓練済み画像検出モデルを得るように構成される画像検出モデル訓練ユニットと
を備える装置。 - 前記統合損失値決定ユニットは、さらに、
重み付け後の第1の損失値と重み付け後の第2の損失値との和を、前記統合損失値とするように構成される、請求項13に記載の画像検出モデルの訓練装置。 - 前記画像検出モデル訓練ユニットは、さらに、
前記統合損失値が、予め設定された回数で訓練を繰り返して得た統合損失値のうちの最小値となることに応答して、訓練済み画像検出モデルを出力するように構成される、請求項13に記載の画像検出モデルの訓練装置。 - 画像検出装置であって、
検出待ちの画像を受信するように構成される検出待ち画像受信ユニットと、
画像検出モデルを呼び出して、前記検出待ちの画像を検出するように構成される画像検出ユニットであって、前記画像検出モデルは、請求項13~15のいずれか1項に記載の画像検出モデルの訓練方法により得られた画像検出モデルであるユニットと
を備える装置。 - 少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサに通信可能に接続され、前記少なくとも1つのプロセッサによって実行可能な指令が格納されたメモリと
を備えた電子機器であって、
前記指令は、前記少なくとも1つのプロセッサによって実行されると、前記少なくとも1つのプロセッサに、請求項1~4のいずれか1項に記載のサンプル画像を増分する方法、および/または、請求項5~7のいずれか1項に記載の画像検出モデルの訓練方法、および/または、請求項8に記載の画像検出方法を実行させる電子機器。 - コンピュータ指令を記憶した非一時的なコンピュータ可読記憶媒体であって、
前記コンピュータ指令は、請求項1~4のいずれか1項に記載のサンプル画像を増分する方法、および/または、請求項5~7のいずれか1項に記載の画像検出モデルの訓練方法、および/または、請求項8に記載の画像検出方法を前記コンピュータに実行させる非一時的なコンピュータ可読記憶媒体。 - コンピュータプログラムを含むコンピュータプログラム製品であって、
前記コンピュータプログラムは、プロセッサによって実行されると、請求項1~4のいずれか1項に記載のサンプル画像を増分する方法、および/または、請求項5~7のいずれか1項に記載の画像検出モデルの訓練方法、および/または、請求項8に記載の画像検出方法を実現するコンピュータプログラム製品。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110371342.4A CN112949767B (zh) | 2021-04-07 | 2021-04-07 | 样本图像增量、图像检测模型训练及图像检测方法 |
CN202110371342.4 | 2021-04-07 | ||
PCT/CN2022/075152 WO2022213718A1 (zh) | 2021-04-07 | 2022-01-30 | 样本图像增量、图像检测模型训练及图像检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2023531350A true JP2023531350A (ja) | 2023-07-24 |
Family
ID=76232374
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022552961A Pending JP2023531350A (ja) | 2021-04-07 | 2022-01-30 | サンプル画像を増分する方法、画像検出モデルの訓練方法及び画像検出方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20230008696A1 (ja) |
JP (1) | JP2023531350A (ja) |
CN (1) | CN112949767B (ja) |
WO (1) | WO2022213718A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112949767B (zh) * | 2021-04-07 | 2023-08-11 | 北京百度网讯科技有限公司 | 样本图像增量、图像检测模型训练及图像检测方法 |
CN113361535B (zh) * | 2021-06-30 | 2023-08-01 | 北京百度网讯科技有限公司 | 图像分割模型训练、图像分割方法及相关装置 |
CN113516185B (zh) * | 2021-07-09 | 2023-10-31 | 北京百度网讯科技有限公司 | 模型训练的方法、装置、电子设备及存储介质 |
CN114596637B (zh) * | 2022-03-23 | 2024-02-06 | 北京百度网讯科技有限公司 | 图像样本数据增强训练方法、装置及电子设备 |
CN115100431B (zh) * | 2022-07-26 | 2023-08-08 | 北京百度网讯科技有限公司 | 目标检测方法、神经网络及其训练方法、设备和介质 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102665062B (zh) * | 2012-03-16 | 2016-03-30 | 华为技术有限公司 | 一种使视频中目标物体图像稳定的方法及装置 |
CN108229267B (zh) * | 2016-12-29 | 2020-10-16 | 北京市商汤科技开发有限公司 | 对象属性检测、神经网络训练、区域检测方法和装置 |
CN109003260B (zh) * | 2018-06-28 | 2021-02-09 | 深圳视见医疗科技有限公司 | Ct图像肺结节检测方法、装置、设备及可读存储介质 |
CN109559285B (zh) * | 2018-10-26 | 2021-08-06 | 北京东软医疗设备有限公司 | 一种图像增强显示方法及相关装置 |
CN110248107A (zh) * | 2019-06-13 | 2019-09-17 | Oppo广东移动通信有限公司 | 图像处理方法和装置 |
CN110599503B (zh) * | 2019-06-18 | 2021-05-28 | 腾讯科技(深圳)有限公司 | 检测模型训练方法、装置、计算机设备和存储介质 |
CN110569721B (zh) * | 2019-08-01 | 2023-08-29 | 平安科技(深圳)有限公司 | 识别模型训练方法、图像识别方法、装置、设备及介质 |
CN110503097A (zh) * | 2019-08-27 | 2019-11-26 | 腾讯科技(深圳)有限公司 | 图像处理模型的训练方法、装置及存储介质 |
CN111428875A (zh) * | 2020-03-11 | 2020-07-17 | 北京三快在线科技有限公司 | 图像识别方法、装置及相应模型训练方法、装置 |
CN111597945B (zh) * | 2020-05-11 | 2023-08-18 | 济南博观智能科技有限公司 | 一种目标检测方法、装置、设备及介质 |
CN112949767B (zh) * | 2021-04-07 | 2023-08-11 | 北京百度网讯科技有限公司 | 样本图像增量、图像检测模型训练及图像检测方法 |
-
2021
- 2021-04-07 CN CN202110371342.4A patent/CN112949767B/zh active Active
-
2022
- 2022-01-30 WO PCT/CN2022/075152 patent/WO2022213718A1/zh active Application Filing
- 2022-01-30 JP JP2022552961A patent/JP2023531350A/ja active Pending
- 2022-09-07 US US17/939,364 patent/US20230008696A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
CN112949767B (zh) | 2023-08-11 |
US20230008696A1 (en) | 2023-01-12 |
WO2022213718A1 (zh) | 2022-10-13 |
CN112949767A (zh) | 2021-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11321593B2 (en) | Method and apparatus for detecting object, method and apparatus for training neural network, and electronic device | |
JP2023531350A (ja) | サンプル画像を増分する方法、画像検出モデルの訓練方法及び画像検出方法 | |
CN116051668B (zh) | 文生图扩散模型的训练方法和基于文本的图像生成方法 | |
CN113033537A (zh) | 用于训练模型的方法、装置、设备、介质和程序产品 | |
CN113436100B (zh) | 用于修复视频的方法、装置、设备、介质和产品 | |
CN114792355B (zh) | 虚拟形象生成方法、装置、电子设备和存储介质 | |
CN113643260A (zh) | 用于检测图像质量的方法、装置、设备、介质和产品 | |
CN111539897A (zh) | 用于生成图像转换模型的方法和装置 | |
CN113887615A (zh) | 图像处理方法、装置、设备和介质 | |
CN114913325A (zh) | 语义分割方法、装置及计算机程序产品 | |
CN114724144B (zh) | 文本识别方法、模型的训练方法、装置、设备及介质 | |
JP7324891B2 (ja) | バックボーンネットワーク生成方法、装置、電子機器、記憶媒体およびコンピュータプログラム | |
CN115482248B (zh) | 图像分割方法、装置、电子设备及存储介质 | |
JP2023133274A (ja) | Roi検出モデルのトレーニング方法、検出方法、装置、機器および媒体 | |
US20230005171A1 (en) | Visual positioning method, related apparatus and computer program product | |
CN116402914A (zh) | 用于确定风格化图像生成模型的方法、装置及产品 | |
CN114863450B (zh) | 图像处理方法、装置、电子设备及存储介质 | |
CN113610856B (zh) | 训练图像分割模型和图像分割的方法和装置 | |
CN112560848B (zh) | 兴趣点poi预训练模型的训练方法、装置及电子设备 | |
CN113989152A (zh) | 图像增强方法、装置、设备以及存储介质 | |
CN114882334A (zh) | 用于生成预训练模型的方法、模型训练方法及装置 | |
CN114581711A (zh) | 目标对象检测方法、装置、设备、存储介质以及程序产品 | |
CN114093006A (zh) | 活体人脸检测模型的训练方法、装置、设备以及存储介质 | |
CN114119990A (zh) | 用于图像特征点匹配的方法、装置及计算机程序产品 | |
CN113870142B (zh) | 用于增强图像对比度的方法、装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221014 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221014 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230926 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231214 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240216 |