JP7431005B2 - 学習データ生成装置、学習データ生成方法、及びプログラム - Google Patents
学習データ生成装置、学習データ生成方法、及びプログラム Download PDFInfo
- Publication number
- JP7431005B2 JP7431005B2 JP2019171710A JP2019171710A JP7431005B2 JP 7431005 B2 JP7431005 B2 JP 7431005B2 JP 2019171710 A JP2019171710 A JP 2019171710A JP 2019171710 A JP2019171710 A JP 2019171710A JP 7431005 B2 JP7431005 B2 JP 7431005B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- geometric
- character
- generation
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 12
- 238000010801 machine learning Methods 0.000 claims description 24
- 238000012549 training Methods 0.000 claims description 12
- 230000006870 function Effects 0.000 claims description 10
- 239000000470 constituent Substances 0.000 claims 2
- 238000012545 processing Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000005452 bending Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
Description
まず、図1を参照しながら、本実施形態に係る学習データ生成装置について説明する。図1は、本発明の実施形態に係る学習データ生成装置10の構成例を示すブロック図である。
教師有り学習における学習済みモデルは、学習用のデータセットを用いてDCNN(Deep Convolutional Neural Network)などのモデルを学習させることにより生成される。DCNNは、Convolution(畳込み積分)層を主要部分に使用する深層形のニューラルネットワークである。画像認識においては、DCNNにて入力層に2次元のConvolution層を使用することにより、着目画素とその近傍にある画素の双方の情報を加味した画像特徴情報を効率よく認識できる。さらに2次元Convolutionを重ねて多層化して適用することにより、着目画素の近傍だけでなく、より離れた画素の情報も加味した大域的な画像特徴情報も認識できることが知られている。
Convolution層の計算は、数学的な線形変換式(y=<W,x>+b)で表現することができる。すなわち、これは微分可能な計算式である。微分可能な計算層は、誤差逆伝播法として知られているニューラルネットの教師有り学習の原理を使って、学習を実行することが可能である。
画像データ生成部110は、生成条件に基づき、機械学習における入力用の画像データを生成する機能を有する。例えば、画像データ生成部110は、生成条件に基づき、文字と幾何学的図形とを含む画像を生成する。生成後、画像データ生成部110は、生成した画像を例えば記憶装置(不図示)へ出力し、記憶装置に画像を保存させる。
教師データ生成部120は、入力データと対応する教師データを生成する機能を有する。例えば、教師データ生成部120は、入力データとして生成された画像の画素と、当該画素の要素種別とを対応付けた情報を、機械学習における教師データとして生成する。例えば、教師データ生成部120は、画像の画素ごとに、文字要素、線分要素、又は背景要素のいずれか1つを要素種別として対応付ける。生成後、教師データ生成部120は、生成した教師データを例えば記憶装置(不図示)へ出力し、記憶装置に教師データを保存させる。
教師データ生成部120は、要素種別が線分要素である画素をある特定の色(例えば黒)とし、線分要素ではない画素を、別の色(例えば白)とすることにより、線分要素が対応付けられた画素を示す教師データを生成する。
教師データ生成部120は、要素種別が背景要素である画素をある特定の色(例えば黒)とし、背景要素ではない画素を、別の色(例えば白)とすることにより、背景要素が対応付けられた画素を示す教師データを生成する。
教師データ生成部120は、線分要素が対応付けられた画素を示す教師データにおいて、特定の色(例えば黒)で示された線分要素である画素を含む領域を、線分領域と設定する。
教師データ生成部120は、背景要素が対応付けられた画素を示す教師データにおいて、特定の色(例えば黒)で示された背景要素である画素を含む領域を、背景領域と設定する。
以上、学習データ生成装置10の構成例について説明した。続いて、本実施形態に係る学習データ生成装置10における処理の流れについて説明する。図3は、本発明の実施形態に係る学習データ生成装置10における処理の流れを示すフローチャートである。
110…画像データ生成部
120…教師データ生成部
Claims (5)
- 画像生成条件、文字生成条件、幾何学的図形生成条件、及び背景生成条件を組み合わせた生成条件に基づき、文字と幾何学的図形とを含む画像を機械学習における入力データとして生成する画像データ生成部と、
生成された前記画像における各画素が、文字を構成する要素を示す文字要素であるか、幾何学的図形を構成する要素を示す幾何学要素であるか、文字及び幾何学的図形ではない背景を構成する要素を示す背景要素であるかを区別する要素種別を前記生成条件に基づき取得し、前記画像の各画素に対して前記文字要素、前記幾何学要素、又は前記背景要素のいずれか1つを対応付けた情報を、前記機械学習における教師データとして生成する教師データ生成部と、
を備える、学習データ生成装置。 - 前記教師データ生成部は、前記文字要素が対応付けられた前記画素を含む領域である文字領域を前記教師データに設定する、請求項1に記載の学習データ生成装置。
- 前記画像データ生成部は、前記生成条件に基づき、ノイズをさらに含む前記画像を生成する、請求項1又は請求項2に記載の学習データ生成装置。
- 画像データ生成部が、画像生成条件、文字生成条件、幾何学的図形生成条件、及び背景生成条件を組み合わせた生成条件に基づき、文字と幾何学的図形とを含む画像を機械学習における入力データとして生成することと、
教師データ生成部が、生成された前記画像における各画素が、文字を構成する要素を示す文字要素であるか、幾何学的図形を構成する要素を示す幾何学要素であるか、文字及び幾何学的図形ではない背景を構成する要素を示す背景要素であるかを区別する要素種別を前記生成条件に基づき取得し、前記画像の各画素に対して前記文字要素、前記幾何学要素、又は前記背景要素のいずれか1つを対応付けた情報を、前記機械学習における教師データとして生成することと、
を含む、学習データ生成方法。 - コンピュータを、
画像生成条件、文字生成条件、幾何学的図形生成条件、及び背景生成条件を組み合わせた生成条件に基づき、文字と幾何学的図形とを含む画像を機械学習における入力データとして生成する画像データ生成部と、
生成された前記画像における各画素が、文字を構成する要素を示す文字要素であるか、幾何学的図形を構成する要素を示す幾何学要素であるか、文字及び幾何学的図形ではない背景を構成する要素を示す背景要素であるかを区別する要素種別を前記生成条件に基づき取得し、前記画像の各画素に対して前記文字要素、前記幾何学要素、又は前記背景要素のいずれか1つを対応付けた情報を、前記機械学習における教師データとして生成する教師データ生成部と、
として機能させる、プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019171710A JP7431005B2 (ja) | 2019-09-20 | 2019-09-20 | 学習データ生成装置、学習データ生成方法、及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019171710A JP7431005B2 (ja) | 2019-09-20 | 2019-09-20 | 学習データ生成装置、学習データ生成方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021047816A JP2021047816A (ja) | 2021-03-25 |
JP7431005B2 true JP7431005B2 (ja) | 2024-02-14 |
Family
ID=74878535
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019171710A Active JP7431005B2 (ja) | 2019-09-20 | 2019-09-20 | 学習データ生成装置、学習データ生成方法、及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7431005B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7197042B1 (ja) | 2022-03-18 | 2022-12-27 | 凸版印刷株式会社 | 教師データ自動生成装置、教師データ自動生成方法および教師データ自動生成プログラム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011018338A (ja) | 2009-07-10 | 2011-01-27 | Palo Alto Research Center Inc | スキャンされた文書画像内の前景画素群の連結グループをマーキング種類に基づき分類する方法及びシステム |
JP2018132953A (ja) | 2017-02-15 | 2018-08-23 | ソフネック株式会社 | 画像処理方法、及びコンピュータプログラム |
-
2019
- 2019-09-20 JP JP2019171710A patent/JP7431005B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011018338A (ja) | 2009-07-10 | 2011-01-27 | Palo Alto Research Center Inc | スキャンされた文書画像内の前景画素群の連結グループをマーキング種類に基づき分類する方法及びシステム |
JP2018132953A (ja) | 2017-02-15 | 2018-08-23 | ソフネック株式会社 | 画像処理方法、及びコンピュータプログラム |
Non-Patent Citations (2)
Title |
---|
中村 和明, 山本 眞司, 伊藤 哲也,ニューラルネットワークを用いた文書画像の領域分割,画像電子学会誌,日本,画像電子学会,1999年04月25日,第28巻第2号(1999),pp. 106-115 |
比留川 翔哉, 丸山 一貴,紙面の色と見開きの歪みを考慮した光学文字認識の実装と評価,第18回情報科学技術フォーラム (FIT2019) 講演論文集 第3分冊,日本,2019年08月20日,CH-005,pp. 25-29 |
Also Published As
Publication number | Publication date |
---|---|
JP2021047816A (ja) | 2021-03-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10846524B2 (en) | Table layout determination using a machine learning system | |
JP6441980B2 (ja) | 教師画像を生成する方法、コンピュータおよびプログラム | |
US11631162B2 (en) | Machine learning training method, system, and device | |
US10997464B2 (en) | Digital image layout training using wireframe rendering within a generative adversarial network (GAN) system | |
CN111275129A (zh) | 一种图像数据的增广策略选取方法及系统 | |
EP3255586A1 (en) | Method, program, and apparatus for comparing data graphs | |
JP2018535491A (ja) | 画像のセマンティックセグメンテーションのためのシステム及びコンピューター実施方法、並びに非一時的コンピューター可読媒体 | |
JP6612486B1 (ja) | 学習装置、分類装置、学習方法、分類方法、学習プログラム、及び分類プログラム | |
JP2008537198A (ja) | 人工知能を使用した外来のアプリケーションユーザインタフェースからの情報のインテリジェントインポート | |
CN113826119A (zh) | 纯注意力的计算机视觉 | |
US10846889B2 (en) | Color handle generation for digital image color gradients using machine learning | |
CN111179159A (zh) | 消除视频中目标影像的方法、装置、电子设备及存储介质 | |
JP7431005B2 (ja) | 学習データ生成装置、学習データ生成方法、及びプログラム | |
CN114120349A (zh) | 基于深度学习的试卷识别方法及系统 | |
JP2021047797A (ja) | 機械学習装置、機械学習方法、及びプログラム | |
Silva et al. | Multiview range image registration using the surface interpenetration measure | |
KR102051597B1 (ko) | 내용 기반 영상 크기 조절 장치 및 방법 | |
Zhang et al. | A fast solution for Chinese calligraphy relief modeling from 2D handwriting image | |
Iglesias et al. | Cuckoo search with Lévy flights for reconstruction of outline curves of computer fonts with rational Bézier curves | |
JP2020187583A (ja) | 機械学習モデルのトレーニング方法、データ生成装置、および、学習済みの機械学習モデル | |
Dey | Image Processing Masterclass with Python: 50+ Solutions and Techniques Solving Complex Digital Image Processing Challenges Using Numpy, Scipy, Pytorch and Keras (English Edition) | |
JP2019082847A (ja) | データ推定装置、データ推定方法及びプログラム | |
JP7372591B2 (ja) | 画像処理装置、および、学習済みの機械学習モデル | |
JP7262335B2 (ja) | 予測装置、学習装置、予測方法、及びプログラム | |
US10984173B2 (en) | Vector-based glyph style transfer |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191018 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220803 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230608 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230808 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231006 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240109 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240201 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7431005 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |