JP7689439B2 - 画像処理システム、画像処理方法、及びプログラム - Google Patents
画像処理システム、画像処理方法、及びプログラム Download PDFInfo
- Publication number
- JP7689439B2 JP7689439B2 JP2021067356A JP2021067356A JP7689439B2 JP 7689439 B2 JP7689439 B2 JP 7689439B2 JP 2021067356 A JP2021067356 A JP 2021067356A JP 2021067356 A JP2021067356 A JP 2021067356A JP 7689439 B2 JP7689439 B2 JP 7689439B2
- Authority
- JP
- Japan
- Prior art keywords
- handwritten characters
- image
- document image
- document
- handwritten
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/22—Character recognition characterised by the type of writing
- G06V30/226—Character recognition characterised by the type of writing of cursive writing
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/1463—Orientation detection or correction, e.g. rotation of multiples of 90 degrees
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
- G06V30/1475—Inclination or skew detection or correction of characters or of image to be recognised
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/1801—Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/19—Recognition using electronic means
- G06V30/191—Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
- G06V30/19147—Obtaining sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/22—Character recognition characterised by the type of writing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Character Input (AREA)
Description
ことを特徴とする。
図1は、本発明の実施形態における画像処理システムの一例を示すブロック図である。図1に示すように、画像処理システムは、画像形成装置100と、ホストコンピュータ170と、サーバー191(クラウドサーバーであってもよい)を含む。
手書き文字と活字が混在する文書の場合、文字間隔やピッチが不均一な手書き文字の影響により、従来の傾き補正が失敗する可能性がある。本実施形態では、手書き文字がある場合、手書き文字の影響を除外した傾き角度推定用の画像を生成して、傾き角度推定を実施する。
本実施形態では、第1実施形態における手書き文字を分離する処理(図2のステップS202の処理)において、傾きの大きい文書画像に対しても、手書き文字の分離精度を高く維持できる手法について説明する。傾きの大きい文書画像に対しては、手書き文字の分離精度を維持する処理を実行し、傾きの小さい文書画像に対しては、十分な精度が発揮できるだけのシンプルな処理を実行する。図4は、第2実施形態における画像処理の手順を示すフローチャートである。以下、第2実施形態について、第1実施形態と異なる点を主に説明する。
以上、本発明をその好適な実施形態に基づいて詳述したが、本発明はこれら特定の実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の様々な形態も本発明に含まれる。また、上述の実施形態の一部を適宜組み合わせてもよい。特に、上述の実施形態においては、画像処理をするCPUとして、画像形成装置100のCPU111を例示したが、サーバー191のCPU192を用いてもよい。
110…制御装置
120…リーダー装置
191…サーバー
198…制御装置
Claims (7)
- 文書画像に対して、傾き補正を実施する画像処理システムにおいて、
手書き文字と活字とが混在する文書画像を取得する文書画像取得部と、
手書き文字を含む画像により手書き文字の特徴を学習させたニューラルネットワークを用いて、前記文書画像内に含まれる手書き文字の画素を判断し、当該判断された手書き文字の画素を前記文書画像から除去することにより、前記手書き文字以外の画像を生成する分離部と、
前記生成された手書き文字以外の画像を用いて、傾き角度を推定する傾き角度推定部と、
前記推定された傾き角度に基づいて、前記手書き文字と前記活字とが混在する前記文書画像の傾きを補正する傾き補正部と、を有する
ことを特徴とする画像処理システム。 - 前記分離部は、前記文書画像の傾き角度の範囲に対応する手法を適用して、前記文書画像から手書き文字を除外することにより、前記手書き文字以外の画像を生成する
ことを特徴とする請求項1に記載の画像処理システム。 - 前記分離部は、
前記文書画像の傾き角度の範囲が規定値以上であれば、第1のニューラルネットワークを用いて前記文書画像内に含まれる手書き文字の画素を判断し、当該判断された手書き文字の画素を前記文書画像から除去することにより、前記手書き文字以外の画像を生成する一方、
前記文書画像の傾き角度の範囲が前記規定値より小さければ、第2のニューラルネットワークを用いて前記文書画像内に含まれる手書き文字の画素を判断し、当該判断された手書き文字の画素を前記文書画像から除去することにより、前記手書き文字以外の画像を生成するものであり、
前記第2のニューラルネットワークの学習に用いた文書画像の傾きは、前記第1のニューラルネットワークの学習に用いた文書画像の傾きより小さい、
ことを特徴とする請求項1に記載の画像処理システム。 - 前記分離部は、
傾き角度が異なる複数通りの手書き文字の画像により手書き文字の特徴を学習させた前記ニューラルネットワークを用いて、前記手書き文字の画素を判断し、当該判断された手書き文字の画素を前記文書画像から除去することにより、前記手書き文字以外の画像を生成する
ことを特徴とする請求項1に記載の画像処理システム。 - 前記分離部は、
傾き角度が異なる複数通りの手書き文字を含む文書画像により手書き文字の特徴を学習させた前記ニューラルネットワークを用いて、前記手書き文字の画素を判断し、当該判断された手書き文字の画素を前記文書画像から除去することにより、前記手書き文字以外の画像を生成する
ことを特徴とする請求項1に記載の画像処理システム。 - 文書画像に対して、傾き補正を実施する画像処理方法において、
手書き文字と活字とが混在する文書画像を取得する文書画像取得工程と、
手書き文字を含む画像により手書き文字の特徴を学習させたニューラルネットワークを用いて、前記文書画像内に含まれる手書き文字の画素を判断し、当該判断された手書き文字の画素を前記文書画像から除去することにより、前記手書き文字以外の画像を生成する分離工程と、
前記生成された手書き文字以外の画像を用いて、傾き角度を推定する傾き角度推定工程と、
前記推定された傾き角度に基づいて、前記手書き文字と前記活字とが混在する前記文書画像の傾きを補正する傾き補正工程と、を有する
ことを特徴とする画像処理方法。 - コンピュータを、請求項1乃至5のいずれか1項に記載の画像処理装置として機能させるためのプログラム。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2021067356A JP7689439B2 (ja) | 2021-04-12 | 2021-04-12 | 画像処理システム、画像処理方法、及びプログラム |
| US17/716,084 US12183101B2 (en) | 2021-04-12 | 2022-04-08 | Image processing system, image processing method, and storage medium |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2021067356A JP7689439B2 (ja) | 2021-04-12 | 2021-04-12 | 画像処理システム、画像処理方法、及びプログラム |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| JP2022162474A JP2022162474A (ja) | 2022-10-24 |
| JP2022162474A5 JP2022162474A5 (ja) | 2024-04-19 |
| JP7689439B2 true JP7689439B2 (ja) | 2025-06-06 |
Family
ID=83602701
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2021067356A Active JP7689439B2 (ja) | 2021-04-12 | 2021-04-12 | 画像処理システム、画像処理方法、及びプログラム |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US12183101B2 (ja) |
| JP (1) | JP7689439B2 (ja) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP7689439B2 (ja) * | 2021-04-12 | 2025-06-06 | キヤノン株式会社 | 画像処理システム、画像処理方法、及びプログラム |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20030215136A1 (en) | 2002-05-17 | 2003-11-20 | Hui Chao | Method and system for document segmentation |
Family Cites Families (11)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5187753A (en) | 1989-12-08 | 1993-02-16 | Xerox Corporation | Method and apparatus for identification and correction of document skew |
| JPH0844822A (ja) | 1994-08-03 | 1996-02-16 | Matsushita Electric Ind Co Ltd | 文字認識装置 |
| JP2006092027A (ja) * | 2004-09-21 | 2006-04-06 | Fuji Xerox Co Ltd | 文字認識装置、文字認識方法および文字認識プログラム |
| US8139897B2 (en) * | 2007-03-15 | 2012-03-20 | Ricoh Company, Limited | Detecting tilt in an image having different resolutions in different directions |
| TW201223239A (en) * | 2010-11-23 | 2012-06-01 | Cal Comp Electronics & Comm Co | Method for image correction and scanner using the same |
| US10056083B2 (en) * | 2016-10-18 | 2018-08-21 | Yen4Ken, Inc. | Method and system for processing multimedia content to dynamically generate text transcript |
| US10783400B2 (en) * | 2018-04-06 | 2020-09-22 | Dropbox, Inc. | Generating searchable text for documents portrayed in a repository of digital images utilizing orientation and text prediction neural networks |
| JP2020053931A (ja) | 2018-09-28 | 2020-04-02 | 日本電産サンキョー株式会社 | 画像処理装置、イメージスキャナ、及び画像処理方法 |
| US11302108B2 (en) * | 2019-09-10 | 2022-04-12 | Sap Se | Rotation and scaling for optical character recognition using end-to-end deep learning |
| US11315351B2 (en) * | 2020-01-08 | 2022-04-26 | Kabushiki Kaisha Genial Technology | Information processing device, information processing method, and information processing program |
| JP7689439B2 (ja) * | 2021-04-12 | 2025-06-06 | キヤノン株式会社 | 画像処理システム、画像処理方法、及びプログラム |
-
2021
- 2021-04-12 JP JP2021067356A patent/JP7689439B2/ja active Active
-
2022
- 2022-04-08 US US17/716,084 patent/US12183101B2/en active Active
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20030215136A1 (en) | 2002-05-17 | 2003-11-20 | Hui Chao | Method and system for document segmentation |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2022162474A (ja) | 2022-10-24 |
| US20220335738A1 (en) | 2022-10-20 |
| US12183101B2 (en) | 2024-12-31 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US8619278B2 (en) | Printed matter examination apparatus, printed matter examination method, and printed matter examination system | |
| US9088673B2 (en) | Image registration | |
| US8792128B2 (en) | Apparatus, system, and method of inspecting image, and recording medium storing image inspection control program | |
| US8131081B2 (en) | Image processing apparatus, and computer program product | |
| US20200202155A1 (en) | Method for image processing, and image-processing system | |
| US20170142274A1 (en) | Information processing device, image processing system and non-transitory computer readable medium storing program | |
| JP6427964B2 (ja) | 画像処理システム、情報処理装置及びプログラム | |
| JP6066108B2 (ja) | 電子文書生成システムおよびプログラム | |
| US9858513B2 (en) | Document file output apparatus, document file output method, and computer readable medium | |
| US20150324954A1 (en) | Methods and systems for automated orientation detection and correction | |
| JP7689439B2 (ja) | 画像処理システム、画像処理方法、及びプログラム | |
| US20110216337A1 (en) | Image processing apparatus, image processing system, and computer readable medium | |
| US10834281B2 (en) | Document size detecting by matching between image of entire document and read size image | |
| US9886648B2 (en) | Image processing device generating arranged image data representing arranged image in which images are arranged according to determined relative position | |
| JP2023158554A (ja) | 文字画質調整システム、文字画質調整装置とその制御方法及びプログラム | |
| US20180260363A1 (en) | Information processing apparatus and non-transitory computer readable medium storing program | |
| JP2005316550A (ja) | 画像処理装置、画像読取装置、画像検査装置、およびプログラム | |
| US10356276B2 (en) | Image processing apparatus, image forming apparatus, and computer readable medium | |
| JP6394579B2 (ja) | 画像読取装置及び画像形成装置 | |
| JP7171269B2 (ja) | 画像照合システム、画像照合方法、及びプログラム | |
| JP2017208655A (ja) | 情報処理装置、情報処理方法及びプログラム | |
| US12260569B2 (en) | Information processing device, information processing system, and non-transitory computer readable medium | |
| US20230245298A1 (en) | Inspection apparatus, method of controlling the same, printing system, and storage medium | |
| US20250022303A1 (en) | Image processing system and non-transitory computer-readable storage medium | |
| US20220301326A1 (en) | Ocr target area position acquisition system, computer-readable non-transitory recording medium storing ocr target area position acquisition program, hard copy, hard copy generation system, and computer-readable non-transitory recording medium storing hard copy generation program |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240411 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20240411 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20250128 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20250204 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20250403 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20250428 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20250527 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7689439 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |