JP2019109562A - フォーム種別学習システムおよび画像処理装置 - Google Patents
フォーム種別学習システムおよび画像処理装置 Download PDFInfo
- Publication number
- JP2019109562A JP2019109562A JP2017240285A JP2017240285A JP2019109562A JP 2019109562 A JP2019109562 A JP 2019109562A JP 2017240285 A JP2017240285 A JP 2017240285A JP 2017240285 A JP2017240285 A JP 2017240285A JP 2019109562 A JP2019109562 A JP 2019109562A
- Authority
- JP
- Japan
- Prior art keywords
- image
- unit
- machine learning
- original document
- form type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title claims description 44
- 238000010801 machine learning Methods 0.000 claims abstract description 70
- 230000009467 reduction Effects 0.000 claims description 45
- 238000012549 training Methods 0.000 claims description 7
- 238000002372 labelling Methods 0.000 claims 2
- 230000010365 information processing Effects 0.000 abstract 1
- 238000004891 communication Methods 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000000034 method Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000003467 diminishing effect Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/19147—Obtaining sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
- G06F18/2148—Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the process organisation or structure, e.g. boosting cascade
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Image Analysis (AREA)
- Editing Of Facsimile Originals (AREA)
- Image Processing (AREA)
- Character Input (AREA)
- Processing Or Creating Images (AREA)
Abstract
Description
21 原書類画像取得部
22 画像縮小部
23 ノイズ付加部
24 ラベル付加部
25 フォーム画像取得部
26 画像縮小部
27 分類器
32 機械学習処理部
Claims (7)
- 記入済みフォームの画像を原書類画像として取得する原書類画像取得部と、
前記原書類画像を縮小する画像縮小部と、
前記画像縮小部により縮小される前の前記原書類画像または前記画像縮小部により縮小された後の前記原書類画像にノイズを付加して複数の機械学習用画像を生成するノイズ付加部と、
前記複数の機械学習用画像に対して、前記原書類画像のフォーム種別をラベルとして関連付けるラベル付加部と、
記入済みフォームの画像を入力としフォーム種別を出力とする分類器の機械学習を、前記複数の機械学習用画像および前記ラベルを訓練データとして実行する機械学習処理部と、
を備えることを特徴とするフォーム種別学習システム。 - 前記ノイズ付加部は、前記ノイズとして擬似文字画像を前記原書類画像に付加して複数の機械学習用画像を生成し、
前記擬似文字画像は、所定形状かつ所定サイズの画像であること、
を特徴とする請求項1記載のフォーム種別学習システム。 - 前記所定サイズは、前記画像縮小部により縮小される前の前記原書類画像または前記画像縮小部により縮小された後の前記原書類画像において存在し得る文字の最小サイズから最大サイズまでのいずれかのサイズであることを特徴とする請求項2記載のフォーム種別学習システム。
- 前記ノイズ付加部は、互いに異なるアスペクト比で複数の付加位置に、前記擬似文字画像を付加することを特徴とする請求項2記載のフォーム種別学習システム。
- 前記ノイズ付加部は、前記原書類画像内の枠を検出し、検出した前記枠の内部に前記擬似文字画像を付加することを特徴とする請求項2記載のフォーム種別学習システム。
- 前記ノイズ付加部は、前記ノイズの付加位置をランダムに特定し、特定した前記付加位置の濃度が背景濃度と異なる場合には、前記背景濃度である別の位置に前記付加位置を変更することを特徴とする請求項1記載のフォーム種別学習システム。
- 記入済みフォームの画像を取得するフォーム画像取得部と、
取得された前記記入済みフォームの画像を所定サイズに縮小する画像縮小部と、
縮小された前記記入済みフォームの画像を入力としフォーム種別を出力とする分類器とを備え、
前記分類器は、フォーム種別学習システムにより機械学習されたものであり、
前記フォーム種別学習システムは、記入済みフォームの画像を原書類画像として取得する原書類画像取得部と、前記原書類画像を縮小する画像縮小部と、前記画像縮小部により縮小される前の前記原書類画像または前記画像縮小部により縮小された後の前記原書類画像にノイズを付加して複数の機械学習用画像を生成するノイズ付加部と、前記複数の機械学習用画像に対して、前記原書類画像のフォーム種別をラベルとして関連付けるラベル付加部と、記入済みフォームの画像を入力としフォーム種別を出力とする分類器の機械学習を、前記複数の機械学習用画像および前記ラベルを訓練データとして実行する機械学習処理部とを備えること、
を特徴とする画像処理装置。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017240285A JP6928876B2 (ja) | 2017-12-15 | 2017-12-15 | フォーム種別学習システムおよび画像処理装置 |
CN201810714643.0A CN109934244B (zh) | 2017-12-15 | 2018-07-03 | 格式类别学习系统以及图像处理装置 |
US16/221,477 US10762343B2 (en) | 2017-12-15 | 2018-12-15 | Form type learning system and image processing apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017240285A JP6928876B2 (ja) | 2017-12-15 | 2017-12-15 | フォーム種別学習システムおよび画像処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019109562A true JP2019109562A (ja) | 2019-07-04 |
JP6928876B2 JP6928876B2 (ja) | 2021-09-01 |
Family
ID=66816080
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017240285A Active JP6928876B2 (ja) | 2017-12-15 | 2017-12-15 | フォーム種別学習システムおよび画像処理装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US10762343B2 (ja) |
JP (1) | JP6928876B2 (ja) |
CN (1) | CN109934244B (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2021125040A (ja) * | 2020-02-06 | 2021-08-30 | 株式会社エヌ・ティ・ティ・データ | 帳票仕分システム、帳票仕分方法、及びプログラム |
JP2022518889A (ja) * | 2019-12-27 | 2022-03-17 | シェンチェン センスタイム テクノロジー カンパニー リミテッド | 画像処理方法及び装置、電子機器並びに記憶媒体 |
JP7464903B2 (ja) | 2020-02-19 | 2024-04-10 | 京セラドキュメントソリューションズ株式会社 | 学習用データセット生成システム、学習用データセット生成サーバーおよび学習用データセット生成プログラム |
Families Citing this family (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11775814B1 (en) | 2019-07-31 | 2023-10-03 | Automation Anywhere, Inc. | Automated detection of controls in computer applications with region based detectors |
JP2020095428A (ja) * | 2018-12-12 | 2020-06-18 | 株式会社東芝 | モデル学習システム、モデル学習方法、プログラム、及び記憶媒体 |
US11301224B1 (en) | 2019-04-30 | 2022-04-12 | Automation Anywhere, Inc. | Robotic process automation system with a command action logic independent execution environment |
US11614731B2 (en) | 2019-04-30 | 2023-03-28 | Automation Anywhere, Inc. | Zero footprint robotic process automation system |
US11113095B2 (en) | 2019-04-30 | 2021-09-07 | Automation Anywhere, Inc. | Robotic process automation system with separate platform, bot and command class loaders |
US11243803B2 (en) | 2019-04-30 | 2022-02-08 | Automation Anywhere, Inc. | Platform agnostic robotic process automation |
US11348353B2 (en) | 2020-01-31 | 2022-05-31 | Automation Anywhere, Inc. | Document spatial layout feature extraction to simplify template classification |
US11182178B1 (en) | 2020-02-21 | 2021-11-23 | Automation Anywhere, Inc. | Detection of user interface controls via invariance guided sub-control learning |
US12111646B2 (en) | 2020-08-03 | 2024-10-08 | Automation Anywhere, Inc. | Robotic process automation with resilient playback of recordings |
US11734061B2 (en) | 2020-11-12 | 2023-08-22 | Automation Anywhere, Inc. | Automated software robot creation for robotic process automation |
US11782734B2 (en) | 2020-12-22 | 2023-10-10 | Automation Anywhere, Inc. | Method and system for text extraction from an application window for robotic process automation |
US11820020B2 (en) | 2021-07-29 | 2023-11-21 | Automation Anywhere, Inc. | Robotic process automation supporting hierarchical representation of recordings |
US12097622B2 (en) | 2021-07-29 | 2024-09-24 | Automation Anywhere, Inc. | Repeating pattern detection within usage recordings of robotic process automation to facilitate representation thereof |
US11968182B2 (en) | 2021-07-29 | 2024-04-23 | Automation Anywhere, Inc. | Authentication of software robots with gateway proxy for access to cloud-based services |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6778703B1 (en) * | 2000-04-19 | 2004-08-17 | International Business Machines Corporation | Form recognition using reference areas |
JP2008219825A (ja) * | 2007-03-08 | 2008-09-18 | Fuji Xerox Co Ltd | 情報処理装置、画像処理装置、画像符号化装置、情報処理プログラム、画像処理プログラム及び画像符号化プログラム |
US20160148074A1 (en) * | 2014-11-26 | 2016-05-26 | Captricity, Inc. | Analyzing content of digital images |
JP2017068562A (ja) * | 2015-09-30 | 2017-04-06 | 富士ゼロックス株式会社 | 情報処理装置及びプログラム |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2134255C (en) * | 1993-12-09 | 1999-07-13 | Hans Peter Graf | Dropped-form document image compression |
US7210100B2 (en) * | 2000-09-27 | 2007-04-24 | Eizel Technologies, Inc. | Configurable transformation of electronic documents |
JP2005275447A (ja) * | 2004-03-22 | 2005-10-06 | Casio Comput Co Ltd | 画像処理装置、画像処理方法及びプログラム |
JP2006229305A (ja) | 2005-02-15 | 2006-08-31 | Canon Inc | ネットワーク文書管理システム |
JP2007251690A (ja) * | 2006-03-16 | 2007-09-27 | Sony Corp | 画像処理装置および方法、学習装置および方法、並びにプログラム |
JP2012156860A (ja) * | 2011-01-27 | 2012-08-16 | Murata Mach Ltd | 画像処理装置 |
JP5166569B2 (ja) * | 2011-04-15 | 2013-03-21 | 株式会社東芝 | 業務連携支援システムおよび業務連携支援方法 |
JP6188400B2 (ja) * | 2013-04-26 | 2017-08-30 | オリンパス株式会社 | 画像処理装置、プログラム及び画像処理方法 |
JP2016071412A (ja) * | 2014-09-26 | 2016-05-09 | キヤノン株式会社 | 画像分類装置、画像分類システム、画像分類方法、及びプログラム |
JP6214581B2 (ja) * | 2015-01-30 | 2017-10-18 | キヤノン株式会社 | 文書解析システム、文書解析装置、文書解析方法、及びプログラム |
JP2017010069A (ja) * | 2015-06-16 | 2017-01-12 | シャープ株式会社 | 情報処理装置 |
US9704054B1 (en) * | 2015-09-30 | 2017-07-11 | Amazon Technologies, Inc. | Cluster-trained machine learning for image processing |
US10747994B2 (en) * | 2016-12-28 | 2020-08-18 | Captricity, Inc. | Identifying versions of a form |
-
2017
- 2017-12-15 JP JP2017240285A patent/JP6928876B2/ja active Active
-
2018
- 2018-07-03 CN CN201810714643.0A patent/CN109934244B/zh active Active
- 2018-12-15 US US16/221,477 patent/US10762343B2/en not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6778703B1 (en) * | 2000-04-19 | 2004-08-17 | International Business Machines Corporation | Form recognition using reference areas |
JP2008219825A (ja) * | 2007-03-08 | 2008-09-18 | Fuji Xerox Co Ltd | 情報処理装置、画像処理装置、画像符号化装置、情報処理プログラム、画像処理プログラム及び画像符号化プログラム |
US20160148074A1 (en) * | 2014-11-26 | 2016-05-26 | Captricity, Inc. | Analyzing content of digital images |
JP2017068562A (ja) * | 2015-09-30 | 2017-04-06 | 富士ゼロックス株式会社 | 情報処理装置及びプログラム |
Non-Patent Citations (1)
Title |
---|
萩田 紀博: "2値テンプレートパターンによるデザイン文字認識", 情報処理学会研究報告, vol. 第93巻 第110号, JPN6021002760, 17 December 1993 (1993-12-17), JP, pages 113 - 120, ISSN: 0004492134 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022518889A (ja) * | 2019-12-27 | 2022-03-17 | シェンチェン センスタイム テクノロジー カンパニー リミテッド | 画像処理方法及び装置、電子機器並びに記憶媒体 |
JP7097513B2 (ja) | 2019-12-27 | 2022-07-07 | シェンチェン センスタイム テクノロジー カンパニー リミテッド | 画像処理方法及び装置、電子機器並びに記憶媒体 |
JP2021125040A (ja) * | 2020-02-06 | 2021-08-30 | 株式会社エヌ・ティ・ティ・データ | 帳票仕分システム、帳票仕分方法、及びプログラム |
JP7420578B2 (ja) | 2020-02-06 | 2024-01-23 | 株式会社Nttデータ | 帳票仕分システム、帳票仕分方法、及びプログラム |
JP7464903B2 (ja) | 2020-02-19 | 2024-04-10 | 京セラドキュメントソリューションズ株式会社 | 学習用データセット生成システム、学習用データセット生成サーバーおよび学習用データセット生成プログラム |
Also Published As
Publication number | Publication date |
---|---|
CN109934244A (zh) | 2019-06-25 |
JP6928876B2 (ja) | 2021-09-01 |
CN109934244B (zh) | 2023-04-28 |
US20190188462A1 (en) | 2019-06-20 |
US10762343B2 (en) | 2020-09-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6928876B2 (ja) | フォーム種別学習システムおよび画像処理装置 | |
TW434520B (en) | Two-dimensional code recognition processing method, device therefor and medium | |
US8600165B2 (en) | Optical mark classification system and method | |
US9247080B2 (en) | Information processing apparatus for acquiring a variation region between image data and read data | |
JP2010262648A (ja) | 文書オブジェクトを自動位置合わせするための方法及び装置 | |
CN107025430A (zh) | 着重号列表 | |
US9582483B2 (en) | Automatically tagging variable data documents | |
US11030447B2 (en) | On-device partial recognition systems and methods | |
US11418658B2 (en) | Image processing apparatus, image processing system, image processing method, and storage medium | |
US11670067B2 (en) | Information processing apparatus and non-transitory computer readable medium | |
US9818028B2 (en) | Information processing apparatus for obtaining a degree of similarity between elements | |
CN114529933A (zh) | 一种合同数据差异性的比对方法、装置、设备和介质 | |
CN112613367A (zh) | 票据信息文本框获取方法、系统、设备及存储介质 | |
US11438477B2 (en) | Information processing device, information processing system and computer readable medium | |
JP7365835B2 (ja) | 構造認識システム、構造認識装置、構造認識方法、及びプログラム | |
CN112101356A (zh) | 一种图片中特定文本的定位方法、装置及存储介质 | |
JP2016139869A (ja) | 画像処理装置 | |
JP6606885B2 (ja) | 画像処理装置及び画像処理プログラム | |
US9661179B2 (en) | Image processing device, information processing method, and non-transitory computer-readable medium | |
US20220092761A1 (en) | Information processing apparatus and non-transitory computer readable medium | |
CN113474786A (zh) | 电子签购单识别方法、装置及终端设备 | |
US11238305B2 (en) | Information processing apparatus and non-transitory computer readable medium storing program | |
US20170180581A1 (en) | Information processing apparatus, image reading apparatus, information processing method, and non- transitory computer readable medium | |
CN113887441B (zh) | 一种表格数据处理方法、装置、设备及存储介质 | |
JP2014089575A (ja) | 帳票処理装置、帳票処理方法、及び帳票処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191120 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201225 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210204 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210329 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210426 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210617 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210708 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210721 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6928876 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |