JP7833348B2 - 生成装置、生成方法及び生成プログラム - Google Patents
生成装置、生成方法及び生成プログラムInfo
- Publication number
- JP7833348B2 JP7833348B2 JP2022085562A JP2022085562A JP7833348B2 JP 7833348 B2 JP7833348 B2 JP 7833348B2 JP 2022085562 A JP2022085562 A JP 2022085562A JP 2022085562 A JP2022085562 A JP 2022085562A JP 7833348 B2 JP7833348 B2 JP 7833348B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- region
- pasting
- label
- generation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Landscapes
- Image Analysis (AREA)
- Image Processing (AREA)
Description
図1は、実施の形態1における処理システムの構成の一例を模式的に示す図である。実施の形態1における処理システムは、学習装置20と物体検出装置30とを有する。
次に、図1に示す生成装置10について説明する。図2は、図1に示す生成装置10の構成の一例を模式的に示す図である。
参考文献1:Blurred Borders in CSS, [online],[令和4年5月24日検索],インターネット<URL:URL:https://css-tricks.com/blurred-borders-in-css/>
参考文献2:Gaussian Blur, [online],[令和4年5月24日検索],インターネット<URL:https://www.sciencedirect.com/topics/engineering/gaussian-blur>
次に、図3、図4、図5-1及び図5-2を参照して、生成装置10の処理について説明する。図3、図4、図5-1及び図5-2は、図2に示す生成装置10における処理の概要を説明する図である。
次に、生成装置10が実行する生成処理の処理手順について説明する。図6は、実施の形態1に係る生成処理の処理手順を示すフローチャートである。
図7は、従来技術を説明する図である。従来、少数のラベリング済みの教師データGtから類似するデータを水増しする場合(図7の(1))、ラベリングしたBounding Boxを教師データGtから切り出して、貼り付け先画像に貼り付けるだけであった。
次に、実施の形態2について説明する。図9は、実施の形態2に係る生成装置の構成の一例を模式的に示す図である。図10は、図9に示す生成装置の処理を説明する図である。
次に、生成装置210が実行する生成処理の処理手順について説明する。図11は、実施の形態2に係る生成処理の処理手順を示すフローチャートである。
図12は、実施の形態2の処理を説明するための図である。図12に示すように、オブジェクト画像Gaの属性を考慮せずに、貼り付け先画像G1に配置すると、本来、そのオブジェクトがいない領域に、オブジェクトが配置されてしまう場合がある。例えば、合成画像G4のように、空中に犬のオブジェクト画像が配置されてしまう。このような不自然な合成画像G4を物体検出モデルの学習データとして使用すると、物体検出モデルの検出精度が低下してしまうおそれがあった。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。さらに、各装置にて行なわれる各処理機能は、その全部または任意の一部が、CPUやGPU及び当該CPUやGPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。
また、上記実施形態において説明した生成装置10,210が実行する処理をコンピュータが実行可能な言語で記述したプログラムを作成することもできる。例えば、実施形態における生成装置10,210が実行する処理をコンピュータが実行可能な言語で記述したプログラムを作成することもできる。この場合、コンピュータがプログラムを実行することにより、上記実施形態と同様の効果を得ることができる。さらに、かかるプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータに読み込ませて実行することにより上記実施形態と同様の処理を実現してもよい。
11 取得部
12 マスク生成部
13 オブジェクト抽出部
14,214 生成部
15 出力部
20 学習装置
30 物体検出装置
142,2142 貼り付け部
143 円滑化処理部
2141 検出部
Claims (6)
- 画像に含まれるオブジェクトのクラスを示すラベルと前記オブジェクトの位置情報とが付与された第1の画像を取得する取得部と、
教師なし学習によって学習が実行されたマスク生成モデルを用いて、前記第1の画像からオブジェクトを切り出すマスクを生成するマスク生成部と、
前記マスクを基に、前記第1の画像から前記オブジェクトが写る領域をオブジェクト画像として抽出し、抽出した前記オブジェクト画像に前記オブジェクトのラベルを付与して出力する抽出部と、
貼り付け先画像の領域の識別情報と、前記領域に対応するラベルの識別情報とが対応付けられた貼り付けルールを記憶する記憶部と、
貼り付け先である第2の画像に対し、種別が異なる領域間の境界を検出する検出部と、
前記第2の画像に対し、前記貼り付けルールにしたがって、前記第2の画像の各領域に対応するラベルが付与された前記オブジェクト画像の下端が、それぞれ対応する前記第2の画像の各領域に位置するように、前記第2の画像の各領域に対応するラベルが付与された前記オブジェクト画像を、前記第2の画像の各領域に貼り付ける貼り付け部と、
前記第2の画像の背景と、前記オブジェクト画像との境界部分を滑らかに変換した第3の画像を生成する変換部と、
前記第3の画像を、画像内の特定の物体の位置情報とラベルとを検出する物体検出モデルの教師データとして出力する出力部と、
を有することを特徴とする生成装置。 - 前記貼り付け部は、前記第1の画像に対する前記オブジェクト画像のラベル、数及びサイズに関する統計情報を基に、前記第2の画像に貼り付ける前記オブジェクト画像の第1のラベル、第1の数、及び第1のサイズを設定し、前記第1のラベルが付与された前記オブジェクト画像を、前記第1の数及び前記第1のサイズで前記第2の画像に貼り付けることを特徴とする請求項1に記載の生成装置。
- 前記貼り付け部は、前記統計情報から外れた第2のラベル、第2の数、及び第2のサイズを設定し、前記第2のラベルが付与された前記オブジェクト画像を、前記第2の数及び前記第2のサイズで前記第2の画像に貼り付けることを特徴とする請求項2に記載の生成装置。
- 前記検出部は、前記第2の画像に写る地平線を検出することを特徴とする請求項1に記載の生成装置。
- 生成装置が実行する生成方法であって、
前記生成装置は、貼り付け先画像の領域の識別情報と、前記領域に対応するラベルの識別情報とが対応付けられた貼り付けルールを記憶する記憶部を有し、
画像に含まれるオブジェクトのクラスを示すラベルと前記オブジェクトの位置情報とが付与された第1の画像を取得する工程と、
教師なし学習によって学習が実行されたマスク生成モデルを用いて、前記第1の画像からオブジェクトを切り出すマスクを生成する工程と、
前記マスクを基に、前記第1の画像から前記オブジェクトが写る領域をオブジェクト画像として抽出し、抽出した前記オブジェクト画像に前記オブジェクトのラベルを付与して出力する工程と、
貼り付け先である第2の画像に対し、種別が異なる領域間の境界を検出する工程と、
前記第2の画像に対し、前記貼り付けルールにしたがって、前記第2の画像の各領域に対応するラベルが付与された前記オブジェクト画像の下端が、それぞれ対応する前記第2の画像の各領域に位置するように、前記第2の画像の各領域に対応するラベルが付与された前記オブジェクト画像を、前記第2の画像の各領域に貼り付ける工程と、
前記第2の画像の背景と、前記オブジェクト画像との境界部分を滑らかに変換した第3の画像を生成する工程と、
前記第3の画像を、画像内の特定の物体の位置情報とラベルとを検出する物体検出モデルの教師データとして出力する工程と、
を含んだことを特徴とする生成方法。 - 画像に含まれるオブジェクトのクラスを示すラベルと前記オブジェクトの位置情報とが付与された第1の画像を取得するステップと、
教師なし学習によって学習が実行されたマスク生成モデルを用いて、前記第1の画像からオブジェクトを切り出すマスクを生成するステップと、
前記マスクを基に、前記第1の画像から前記オブジェクトが写る領域をオブジェクト画像として抽出し、抽出した前記オブジェクト画像に前記オブジェクトのラベルを付与して出力するステップと、
貼り付け先である第2の画像に対し、種別が異なる領域間の境界を検出するステップと、
前記第2の画像に対し、貼り付け先画像の領域の識別情報と前記領域に対応するラベルの識別情報とが対応付けられた貼り付けルールにしたがって、前記第2の画像の各領域に対応するラベルが付与された前記オブジェクト画像の下端が、それぞれ対応する前記第2の画像の各領域に位置するように、前記第2の画像の各領域に対応するラベルが付与された前記オブジェクト画像を、前記第2の画像の各領域に貼り付けるステップと、
前記第2の画像の背景と、前記オブジェクト画像との境界部分を滑らかに変換した第3の画像を生成するステップと、
前記第3の画像を、画像内の特定の物体の位置情報とラベルとを検出する物体検出モデルの教師データとして出力するステップと、
をコンピュータに実行させるための生成プログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2022085562A JP7833348B2 (ja) | 2022-05-25 | 2022-05-25 | 生成装置、生成方法及び生成プログラム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2022085562A JP7833348B2 (ja) | 2022-05-25 | 2022-05-25 | 生成装置、生成方法及び生成プログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2023173367A JP2023173367A (ja) | 2023-12-07 |
| JP7833348B2 true JP7833348B2 (ja) | 2026-03-19 |
Family
ID=89030806
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2022085562A Active JP7833348B2 (ja) | 2022-05-25 | 2022-05-25 | 生成装置、生成方法及び生成プログラム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7833348B2 (ja) |
Citations (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2008227813A (ja) | 2007-03-12 | 2008-09-25 | Sony Corp | 画像処理装置、画像処理方法、画像処理システム |
| JP2018088223A (ja) | 2016-11-30 | 2018-06-07 | キヤノンマーケティングジャパン株式会社 | 情報処理装置、情報処理方法、プログラム |
| JP2020038605A (ja) | 2018-08-29 | 2020-03-12 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 情報処理方法及び情報処理システム |
| JP2020149086A (ja) | 2019-03-11 | 2020-09-17 | オムロン株式会社 | 学習用データ生成装置、学習用データ生成方法、および学習用データ生成プログラム |
| JP2021149801A (ja) | 2020-03-23 | 2021-09-27 | ソニーグループ株式会社 | 情報処理装置及び情報処理方法 |
| WO2022024165A1 (ja) | 2020-07-27 | 2022-02-03 | 日本電気株式会社 | 情報処理装置、情報処理方法、及び、記録媒体 |
| JP2022058135A (ja) | 2020-09-30 | 2022-04-11 | エヌビディア コーポレーション | ニューラル・ネットワークを使用するロバスト予測のための背景修正を含むデータ拡張 |
| JP2022076296A (ja) | 2020-11-09 | 2022-05-19 | 東京ロボティクス株式会社 | データセット生成装置、生成方法、プログラム、システム、機械学習装置、物体認識装置、及びピッキングシステム |
-
2022
- 2022-05-25 JP JP2022085562A patent/JP7833348B2/ja active Active
Patent Citations (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2008227813A (ja) | 2007-03-12 | 2008-09-25 | Sony Corp | 画像処理装置、画像処理方法、画像処理システム |
| JP2018088223A (ja) | 2016-11-30 | 2018-06-07 | キヤノンマーケティングジャパン株式会社 | 情報処理装置、情報処理方法、プログラム |
| JP2020038605A (ja) | 2018-08-29 | 2020-03-12 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 情報処理方法及び情報処理システム |
| JP2020149086A (ja) | 2019-03-11 | 2020-09-17 | オムロン株式会社 | 学習用データ生成装置、学習用データ生成方法、および学習用データ生成プログラム |
| JP2021149801A (ja) | 2020-03-23 | 2021-09-27 | ソニーグループ株式会社 | 情報処理装置及び情報処理方法 |
| WO2022024165A1 (ja) | 2020-07-27 | 2022-02-03 | 日本電気株式会社 | 情報処理装置、情報処理方法、及び、記録媒体 |
| JP2022058135A (ja) | 2020-09-30 | 2022-04-11 | エヌビディア コーポレーション | ニューラル・ネットワークを使用するロバスト予測のための背景修正を含むデータ拡張 |
| JP2022076296A (ja) | 2020-11-09 | 2022-05-19 | 東京ロボティクス株式会社 | データセット生成装置、生成方法、プログラム、システム、機械学習装置、物体認識装置、及びピッキングシステム |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2023173367A (ja) | 2023-12-07 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Gandhi et al. | Preprocessing of non-symmetrical images for edge detection | |
| Yu et al. | Multi-scale context aggregation by dilated convolutions | |
| US9607391B2 (en) | Image object segmentation using examples | |
| US9569855B2 (en) | Apparatus and method for extracting object of interest from image using image matting based on global contrast | |
| CN105144239B (zh) | 图像处理装置、图像处理方法 | |
| CN113164145B (zh) | 图像处理装置、图像处理系统、图像处理方法和存储介质 | |
| US8213726B2 (en) | Image labeling using multi-scale processing | |
| CN102667859B (zh) | 由排他性分类器进行的一般物体的图像识别装置及方法 | |
| WO2020077940A1 (en) | Method and device for automatic identification of labels of image | |
| JP6702716B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
| Alharbi et al. | Automatic counting of wheat spikes from wheat growth images | |
| CN109344762B (zh) | 图像处理方法和装置 | |
| CN113076861B (zh) | 一种基于二阶特征的鸟类细粒度识别方法 | |
| CN114581452B (zh) | 分割网络训练方法、装置、设备、计算机程序以及介质 | |
| JP2019021243A5 (ja) | ||
| More et al. | Seamless nudity censorship: an image-to-image translation approach based on adversarial training | |
| Kawano et al. | Tag: Guidance-free open-vocabulary semantic segmentation | |
| JP7833348B2 (ja) | 生成装置、生成方法及び生成プログラム | |
| CN110580462B (zh) | 一种基于非局部网络的自然场景文本检测方法和系统 | |
| CN111275732B (zh) | 一种基于深度卷积神经网络的前景对象图像分割方法 | |
| CN108765449A (zh) | 一种基于卷积神经网络的图像背景分割和识别方法 | |
| CN106558050A (zh) | 一种基于自适应三阈值的显著物体分割方法 | |
| Wang et al. | Learning to remove reflections for text images | |
| CN109993756B (zh) | 一种基于图模型与连续逐步优化的通用医学图像分割方法 | |
| CN116091515A (zh) | 一种建立脑血管分割模型的方法、脑血管分割方法及装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20250303 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20250930 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20251201 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20260210 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20260309 |