JP7477663B2 - 学習装置、学習方法及び学習プログラム - Google Patents
学習装置、学習方法及び学習プログラム Download PDFInfo
- Publication number
- JP7477663B2 JP7477663B2 JP2023000588A JP2023000588A JP7477663B2 JP 7477663 B2 JP7477663 B2 JP 7477663B2 JP 2023000588 A JP2023000588 A JP 2023000588A JP 2023000588 A JP2023000588 A JP 2023000588A JP 7477663 B2 JP7477663 B2 JP 7477663B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- area
- processing unit
- learning device
- learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 29
- 238000012545 processing Methods 0.000 claims description 75
- 238000012549 training Methods 0.000 claims description 43
- 238000010191 image analysis Methods 0.000 claims description 11
- 230000006870 function Effects 0.000 claims description 6
- 238000001514 detection method Methods 0.000 description 29
- 238000010586 diagram Methods 0.000 description 11
- 241000282472 Canis lupus familiaris Species 0.000 description 10
- 208000009119 Giant Axonal Neuropathy Diseases 0.000 description 6
- 201000003382 giant axonal neuropathy 1 Diseases 0.000 description 6
- 230000010365 information processing Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 230000003416 augmentation Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012946 outsourcing Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000010454 slate Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
- Image Processing (AREA)
Description
まず、図1を用いて、第1の実施形態に係る学習装置の構成について説明する。図1は、第1の実施形態に係る学習装置の構成例を示す図である。
参考文献1:Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network, CVPR, 2017(URL:https://openaccess.thecvf.com/content_cvpr_2017/papers/Ledig_Photo-Realistic_Single_Image_CVPR_2017_paper.pdf)
参考文献2:Conditional Image Synthesis with Auxiliary Classifier GANs(URL:https://arxiv.org/pdf/1610.09585)
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示のように構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部又は一部を、各種の負荷や使用状況等に応じて、任意の単位で機能的又は物理的に分散・統合して構成することができる。さらに、各装置にて行われる各処理機能は、その全部又は任意の一部が、CPU(Central Processing Unit)及び当該CPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。
一実施形態として、学習装置10は、パッケージソフトウェアやオンラインソフトウェアとして上記の生成処理を実行するプログラムを所望のコンピュータにインストールさせることによって実装できる。例えば、上記のプログラムを情報処理装置に実行させることにより、情報処理装置を学習装置10として機能させることができる。ここで言う情報処理装置には、デスクトップ型又はノート型のパーソナルコンピュータが含まれる。また、その他にも、情報処理装置にはスマートフォン、携帯電話機やPHS(Personal Handyphone System)等の移動体通信端末、さらには、PDA(Personal Digital Assistant)等のスレート端末等がその範疇に含まれる。
11 インタフェース部
12 記憶部
13 制御部
121 生成モデル情報
121a 生成器
121b 識別器
122 検出モデル情報
131 加工部
132 自然化処理部
133 検出部
134 更新部
201、202、211、212、221、231 画像
251、261、271、272、273 領域
Claims (8)
- オブジェクトが写っていることが既知の第1の画像から、前記オブジェクトが写った領域をコピーし、当該コピーした領域を第2の画像に貼り付けた画像のうち、水平線、又は地平線によって囲まれる領域であって、前記第2の画像における前記オブジェクトの背景の領域が示す場所が、前記オブジェクトにあらかじめ対応付けられた場所と合致する画像を、第3の画像として作成する加工部と、
入力された画像を基に画像を生成する生成器に、前記第3の画像を入力し、第4の画像を得る自然化処理部と、
前記第4の画像を教師データとして画像解析のためのモデルの訓練を行う訓練部と、
を有することを特徴とする学習装置。 - 前記加工部は、前記第1の画像から、前記オブジェクトを囲む矩形の領域をコピーし、当該矩形の領域を前記第2の画像に貼り付けることを特徴とする請求項1に記載の学習装置。
- 前記加工部は、前記コピーした領域を、前記第2の画像における所定の物体が検出された領域に貼り付けることを特徴とする請求項1に記載の学習装置。
- 前記自然化処理部は、前記生成器に、前記第3の画像を低解像度化した画像を入力することで前記第4の画像を得ることを特徴とする請求項1から3のいずれか1項に記載の学習装置。
- 前記自然化処理部は、GAN(Generative Adversarial Network)を構成する生成器であって、入力された画像を高解像度化した画像を生成する生成器に、前記第3の画像を低解像度化した画像を入力することで前記第4の画像を得ることを特徴とする請求項4に記載の学習装置。
- 前記自然化処理部は、前記第4の画像とともに、前記加工部によって前記コピーした領域が貼り付けられた位置を特定する情報を出力し、
前記訓練部は、前記第4の画像及び前記位置を特定する情報を教師データとして画像解析のためのモデルの訓練を行うことを特徴とする請求項1から5のいずれか1項に記載の学習装置。 - 学習装置によって実行される学習方法であって、
オブジェクトが写っていることが既知の第1の画像から、前記オブジェクトが写った領域をコピーし、当該コピーした領域を第2の画像に貼り付けた画像のうち、水平線、又は地平線によって囲まれる領域であって、前記第2の画像における前記オブジェクトの背景の領域が示す場所が、前記オブジェクトにあらかじめ対応付けられた場所と合致する画像を、第3の画像として作成することで第3の画像を作成する加工工程と、
入力された画像を基に画像を生成する生成器に、前記第3の画像を入力し、第4の画像を得る自然化処理工程と、
前記第4の画像を教師データとして画像解析のためのモデルの訓練を行う訓練工程と、
を含むことを特徴とする学習方法。 - コンピュータを、請求項1から6のいずれか1項に記載の学習装置として機能させるための学習プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2023000588A JP7477663B2 (ja) | 2021-08-19 | 2023-01-05 | 学習装置、学習方法及び学習プログラム |
JP2024067792A JP2024091822A (ja) | 2021-08-19 | 2024-04-18 | 学習装置、学習方法及び学習プログラム |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021133920A JP7208314B1 (ja) | 2021-08-19 | 2021-08-19 | 学習装置、学習方法及び学習プログラム |
JP2023000588A JP7477663B2 (ja) | 2021-08-19 | 2023-01-05 | 学習装置、学習方法及び学習プログラム |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021133920A Division JP7208314B1 (ja) | 2021-08-19 | 2021-08-19 | 学習装置、学習方法及び学習プログラム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2024067792A Division JP2024091822A (ja) | 2021-08-19 | 2024-04-18 | 学習装置、学習方法及び学習プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023030207A JP2023030207A (ja) | 2023-03-07 |
JP7477663B2 true JP7477663B2 (ja) | 2024-05-01 |
Family
ID=84939318
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021133920A Active JP7208314B1 (ja) | 2021-08-19 | 2021-08-19 | 学習装置、学習方法及び学習プログラム |
JP2023000588A Active JP7477663B2 (ja) | 2021-08-19 | 2023-01-05 | 学習装置、学習方法及び学習プログラム |
JP2024067792A Pending JP2024091822A (ja) | 2021-08-19 | 2024-04-18 | 学習装置、学習方法及び学習プログラム |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021133920A Active JP7208314B1 (ja) | 2021-08-19 | 2021-08-19 | 学習装置、学習方法及び学習プログラム |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2024067792A Pending JP2024091822A (ja) | 2021-08-19 | 2024-04-18 | 学習装置、学習方法及び学習プログラム |
Country Status (1)
Country | Link |
---|---|
JP (3) | JP7208314B1 (ja) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3271984B2 (ja) | 1996-08-01 | 2002-04-08 | アレクセービッチ ドン、エフゲニイ | アキソイド力機構(afm) |
JP2020149086A (ja) | 2019-03-11 | 2020-09-17 | オムロン株式会社 | 学習用データ生成装置、学習用データ生成方法、および学習用データ生成プログラム |
US20200356810A1 (en) | 2019-05-06 | 2020-11-12 | Agora Lab, Inc. | Effective Structure Keeping for Generative Adversarial Networks for Single Image Super Resolution |
JP2020187736A (ja) | 2019-05-10 | 2020-11-19 | ネイバー コーポレーションNAVER Corporation | 地域的特徴を有する分類器学習のための学習データ生成方法およびそのシステム |
CN112308763A (zh) | 2019-07-26 | 2021-02-02 | 奥多比公司 | 利用具有双流编码器架构的神经网络来生成合成数字图像 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0812692B2 (ja) * | 1986-10-24 | 1996-02-07 | キヤノン株式会社 | 画像処理装置 |
JPH03271984A (ja) * | 1990-03-20 | 1991-12-03 | Nec Corp | デジタル画像データ切り抜き合成装置 |
US10540749B2 (en) | 2018-03-29 | 2020-01-21 | Mitsubishi Electric Research Laboratories, Inc. | System and method for learning-based image super-resolution |
JP7300331B2 (ja) * | 2019-07-03 | 2023-06-29 | 株式会社日立製作所 | 機械学習用情報処理装置、機械学習用情報処理方法、および機械学習用情報処理プログラム |
-
2021
- 2021-08-19 JP JP2021133920A patent/JP7208314B1/ja active Active
-
2023
- 2023-01-05 JP JP2023000588A patent/JP7477663B2/ja active Active
-
2024
- 2024-04-18 JP JP2024067792A patent/JP2024091822A/ja active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3271984B2 (ja) | 1996-08-01 | 2002-04-08 | アレクセービッチ ドン、エフゲニイ | アキソイド力機構(afm) |
JP2020149086A (ja) | 2019-03-11 | 2020-09-17 | オムロン株式会社 | 学習用データ生成装置、学習用データ生成方法、および学習用データ生成プログラム |
US20200356810A1 (en) | 2019-05-06 | 2020-11-12 | Agora Lab, Inc. | Effective Structure Keeping for Generative Adversarial Networks for Single Image Super Resolution |
JP2020187736A (ja) | 2019-05-10 | 2020-11-19 | ネイバー コーポレーションNAVER Corporation | 地域的特徴を有する分類器学習のための学習データ生成方法およびそのシステム |
CN112308763A (zh) | 2019-07-26 | 2021-02-02 | 奥多比公司 | 利用具有双流编码器架构的神经网络来生成合成数字图像 |
Also Published As
Publication number | Publication date |
---|---|
JP7208314B1 (ja) | 2023-01-18 |
JP2023030207A (ja) | 2023-03-07 |
JP2023028298A (ja) | 2023-03-03 |
JP2024091822A (ja) | 2024-07-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110555795B (zh) | 高解析度风格迁移 | |
US20190236759A1 (en) | Method of image completion | |
US10152213B2 (en) | Techniques for selecting objects in images | |
US11954828B2 (en) | Portrait stylization framework using a two-path image stylization and blending | |
US11200645B2 (en) | Previewing a content-aware fill | |
US11748865B2 (en) | Hierarchical image decomposition for defect detection | |
JP6725452B2 (ja) | 分類装置、分類方法および分類プログラム | |
CN113657396B (zh) | 训练方法、译文展示方法、装置、电子设备以及存储介质 | |
US20200175727A1 (en) | Color Handle Generation for Digital Image Color Gradients using Machine Learning | |
CN111459501A (zh) | 基于SVG的Web组态画面存储与展示系统和方法及介质 | |
CN112101386A (zh) | 文本检测方法、装置、计算机设备和存储介质 | |
CN113506305B (zh) | 三维点云数据的图像增强方法、语义分割方法及装置 | |
CN109697722B (zh) | 用于生成三分图的方法及装置 | |
JP2007198912A (ja) | 画像検査装置、画像検査方法、コンピュータを画像検査装置として機能させるためのプログラムおよび記録媒体 | |
US11335050B2 (en) | Generating digital image editing guides by determining and filtering raster image content boundaries | |
Rasheed et al. | A Novel Model Driven Framework for Image Enhancement and Object Recognition | |
JP7477663B2 (ja) | 学習装置、学習方法及び学習プログラム | |
KR20220043340A (ko) | 건물 하자 이미지 생성 장치 및 방법 | |
CN116524528A (zh) | 用于分离被检测为一个文本边界框的单词的文本检测算法 | |
CN116030256A (zh) | 小目标分割方法、小目标分割系统、设备和介质 | |
CN116246064A (zh) | 一种多尺度空间特征增强方法及装置 | |
US11887356B2 (en) | System, method and apparatus for training a machine learning model | |
US20220343103A1 (en) | Document segmentation for optical character recognition | |
JP7238510B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
US10586311B2 (en) | Patch validity test |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230105 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231206 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231212 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240213 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240319 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240418 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7477663 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |