JP7468057B2 - 情報処理装置、情報処理システム、及び情報処理プログラム - Google Patents
情報処理装置、情報処理システム、及び情報処理プログラム Download PDFInfo
- Publication number
- JP7468057B2 JP7468057B2 JP2020056635A JP2020056635A JP7468057B2 JP 7468057 B2 JP7468057 B2 JP 7468057B2 JP 2020056635 A JP2020056635 A JP 2020056635A JP 2020056635 A JP2020056635 A JP 2020056635A JP 7468057 B2 JP7468057 B2 JP 7468057B2
- Authority
- JP
- Japan
- Prior art keywords
- information processing
- item
- items
- acquired
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 130
- 238000012545 processing Methods 0.000 claims description 96
- 238000007781 pre-processing Methods 0.000 claims description 74
- 238000000034 method Methods 0.000 claims description 51
- 230000004044 response Effects 0.000 claims description 3
- 238000012015 optical character recognition Methods 0.000 description 33
- 238000011156 evaluation Methods 0.000 description 24
- 239000000284 extract Substances 0.000 description 13
- 238000010586 diagram Methods 0.000 description 12
- 238000013473 artificial intelligence Methods 0.000 description 7
- 238000000605 extraction Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 230000002950 deficient Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 2
- 230000012447 hatching Effects 0.000 description 2
- 238000012805 post-processing Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00795—Reading arrangements
- H04N1/00798—Circuits or arrangements for the control thereof, e.g. using a programmed control device or according to a measured quantity
- H04N1/00814—Circuits or arrangements for the control thereof, e.g. using a programmed control device or according to a measured quantity according to a detected condition or state of the reading apparatus, e.g. temperature
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/155—Removing patterns interfering with the pattern to be recognised, such as ruled lines or underlines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/46—Colour picture communication systems
- H04N1/56—Processing of colour picture signals
- H04N1/60—Colour correction or control
- H04N1/62—Retouching, i.e. modification of isolated colours only or in isolated picture areas only
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Signal Processing (AREA)
- Artificial Intelligence (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
Description
2 前処理装置
3 認識装置
10 情報処理装置
11 CPU
12 ROM
13 RAM
14 ストレージ
15 入力部
16 モニタ
17 通信I/F
18 バス
21 取得部
22 判定部
23 制御部
24 記憶部
30 読取画像
31 前処理
32 処理済画像
33 OCR処理
34 OCR結果
35 OCR結果取得処理
36 判定処理
37 制御処理
38 候補データ
39 優先順位DB
40 書類
41、41、42 領域
Claims (11)
- プロセッサを有し、前記プロセッサは、
書類の読み取り画像から予め定められた項目、及び前記項目に対応する値を取得し、
取得した前記項目、及び前記値の少なくとも一方が取得できていない場合、前記項目、及び前記値の取得、又は未取得の状態に応じて、前記項目、及び前記値の取得よりも前に行われた処理である前処理、及び文字認識の設定を変更して、前記前処理、及び前記文字認識を実施するように制御し、
前記プロセッサは、前記項目、及び前記値が取得できた場合、かつ取得した前記値が前記項目に対応していないと判定された場合、前記文字認識を実施するように制御する
情報処理装置。 - 前記プロセッサは、前記項目に対応する前記値の候補を予め記憶し、前記候補と、前記値とが、同一であると認められない場合、前記値が前記項目に対応していないと判定する請求項1に記載の情報処理装置。
- 前記前処理は、複数の処理が定められており、前記プロセッサは、設定を変更した前記前処理、及び前記文字認識を実施した結果から前記項目、及び前記値の少なくとも一方が取得できない場合、異なる前処理、及び文字認識を再び実施するように制御する請求項1又は請求項2に記載の情報処理装置。
- 前記プロセッサは、前記複数の処理を全て施した場合、かつ処理を施した前記文字認識の結果から前記項目、及び前記値の少なくとも一方が取得できない場合、前記項目、及び前記値が取得できない旨の通知を行う請求項3に記載の情報処理装置。
- 前記プロセッサは、前記項目、及び前記値の少なくとも一方が取得できていない場合、前記項目、及び前記値が位置する箇所を特定する請求項1から請求項4の何れか1項に記載の情報処理装置。
- 前記プロセッサは、前記項目、及び前記値が取得できていない場合、前記項目、及び前記値とは異なる箇所に位置する前記項目、及び前記値が取得できているか判定を行う請求項5に記載の情報処理装置。
- 前記プロセッサは、異なる箇所に位置する前記項目、及び前記値が取得できている場合、地紋、及び透かしを除去する設定を変更する制御を行う請求項6に記載の情報処理装置。
- 前記前処理、及び前記文字認識の各々に優先順位と、
前記項目、及び前記値を取得する際に発生した障害の種別に対応する前記前処理、及び前記文字認識の各々の選択の可否と、が設定されており、
前記プロセッサは、前記優先順位、及び前記選択の可否に応じて、前記設定を変更するように制御する請求項1から請求項7の何れか1項に記載の情報処理装置。 - 請求項1から請求項8の何れか1項に記載の情報処理装置と、
前記前処理を実施する前処理装置と、
前記文字認識を実施する文字認識装置と、を備え、
前記前処理装置、及び前記文字認識装置は、前記情報処理装置の指示に応じて、文字を認識しやすくするための処理を実施する
情報処理システム。 - 前処理装置、及び前記文字認識装置は、文字を認識しやすくするための処理として、地紋の除去、透かしの除去、白抜き文字の反転、網掛け除去、色背景除去、辞書の変更、及びOCRエンジンの変更の少なくとも1つを実施する請求項9に記載の情報処理システム。
- コンピュータに
書類の読み取り画像から予め定められた項目、及び前記項目に対応する値を取得し、
取得した前記項目、及び前記値の少なくとも一方が取得できていない場合、前記項目、及び前記値の取得、又は未取得の状態に応じて、前記項目、及び前記値の取得よりも前に行われた処理である前処理、及び文字認識の設定を変更して、前記前処理、及び前記文字認識を実施するように制御し、
前記項目、及び前記値が取得できた場合、かつ取得した前記値が前記項目に対応していないと判定された場合、前記文字認識を実施するように制御する
ことを実行させるための情報処理プログラム。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020056635A JP7468057B2 (ja) | 2020-03-26 | 2020-03-26 | 情報処理装置、情報処理システム、及び情報処理プログラム |
US17/037,653 US11265435B2 (en) | 2020-03-26 | 2020-09-29 | Information processing apparatus for re-executing processing for not successfully acquired, information processing system, and non-transitory computer readable medium |
US17/672,631 US11570323B2 (en) | 2020-03-26 | 2022-02-15 | Information processing apparatus, information processing system, and non-transitory computer readable medium |
US18/090,487 US11949828B2 (en) | 2020-03-26 | 2022-12-29 | Information processing apparatus, information processing system, and non-transitory computer readable medium for performing preprocessing and character recognition to acquire item and value of image |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020056635A JP7468057B2 (ja) | 2020-03-26 | 2020-03-26 | 情報処理装置、情報処理システム、及び情報処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021157460A JP2021157460A (ja) | 2021-10-07 |
JP7468057B2 true JP7468057B2 (ja) | 2024-04-16 |
Family
ID=77856824
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020056635A Active JP7468057B2 (ja) | 2020-03-26 | 2020-03-26 | 情報処理装置、情報処理システム、及び情報処理プログラム |
Country Status (2)
Country | Link |
---|---|
US (3) | US11265435B2 (ja) |
JP (1) | JP7468057B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11908053B2 (en) * | 2020-05-29 | 2024-02-20 | Camelot Uk Bidco Limited | Method, non-transitory computer-readable storage medium, and apparatus for searching an image database |
JP2023048262A (ja) | 2021-09-28 | 2023-04-07 | 月島機械株式会社 | 晶析方法および晶析装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000113100A (ja) | 1995-07-31 | 2000-04-21 | Fujitsu Ltd | 媒体処理方法及び媒体処理装置 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0228147Y2 (ja) | 1985-01-31 | 1990-07-27 | ||
JPH11154198A (ja) | 1997-11-20 | 1999-06-08 | Casio Comput Co Ltd | 手書き入力装置及び記憶媒体 |
EP2136317B1 (en) * | 2008-06-19 | 2013-09-04 | Samsung Electronics Co., Ltd. | Method and apparatus for recognizing characters |
JP6528147B2 (ja) | 2014-01-31 | 2019-06-12 | 株式会社日本デジタル研究所 | 会計データ入力支援システム、方法およびプログラム |
JP6658078B2 (ja) * | 2016-02-25 | 2020-03-04 | ブラザー工業株式会社 | 画像処理装置、コンピュータプログラム、および、システム |
TWI671686B (zh) * | 2018-01-24 | 2019-09-11 | 緯創資通股份有限公司 | 影像數據擷取方法及影像數據擷取裝置 |
JP7274322B2 (ja) * | 2019-03-25 | 2023-05-16 | 東芝テック株式会社 | プログラム及び文字認識方法 |
JP7387363B2 (ja) * | 2019-09-30 | 2023-11-28 | キヤノン株式会社 | データ入力支援装置、データ入力支援方法及びプログラム |
JP2021144469A (ja) | 2020-03-12 | 2021-09-24 | キヤノン株式会社 | データ入力支援システム、データ入力支援方法、及びプログラム |
-
2020
- 2020-03-26 JP JP2020056635A patent/JP7468057B2/ja active Active
- 2020-09-29 US US17/037,653 patent/US11265435B2/en active Active
-
2022
- 2022-02-15 US US17/672,631 patent/US11570323B2/en active Active
- 2022-12-29 US US18/090,487 patent/US11949828B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000113100A (ja) | 1995-07-31 | 2000-04-21 | Fujitsu Ltd | 媒体処理方法及び媒体処理装置 |
Also Published As
Publication number | Publication date |
---|---|
US11265435B2 (en) | 2022-03-01 |
US20220174166A1 (en) | 2022-06-02 |
US11570323B2 (en) | 2023-01-31 |
JP2021157460A (ja) | 2021-10-07 |
US11949828B2 (en) | 2024-04-02 |
US20210306498A1 (en) | 2021-09-30 |
US20230135568A1 (en) | 2023-05-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10740899B2 (en) | Image processing apparatus for identifying region within image, information processing method, and storage medium | |
US11949828B2 (en) | Information processing apparatus, information processing system, and non-transitory computer readable medium for performing preprocessing and character recognition to acquire item and value of image | |
CN102289667A (zh) | 对经历光学字符识别(ocr)过程的文本文档中出现的错误的用户纠正 | |
JP7038988B2 (ja) | 画像処理方法及び画像処理システム | |
US20210304364A1 (en) | Method and system for removing noise in documents for image processing | |
CN115828874A (zh) | 基于图像识别技术的行业表格数字化处理方法 | |
US8600175B2 (en) | Apparatus and method of processing image including character string | |
US9524274B2 (en) | Methods and systems for generation of document structures based on sequential constraints | |
Verma et al. | Removal of obstacles in Devanagari script for efficient optical character recognition | |
US20220188543A1 (en) | Information processing apparatus and non-transitory computer readable medium | |
CN117520561A (zh) | 直升机装配领域知识图谱构建的实体关系抽取方法及系统 | |
US20210019554A1 (en) | Information processing device and information processing method | |
Chowdhury et al. | Implementation of an optical character reader (ocr) for bengali language | |
JP7172343B2 (ja) | 文書検索用プログラム | |
US20200304683A1 (en) | Image processing apparatus and non-transitory computer readable medium | |
JP4162195B2 (ja) | 画像処理装置、及び画像処理プログラム | |
JP4677750B2 (ja) | 文書属性取得方法および装置並びにプログラムを記録した記録媒体 | |
JP2020047138A (ja) | 情報処理装置 | |
JP2020198023A (ja) | 情報処理装置、方法及びプログラム | |
CN116563869B (zh) | 页面图像文字处理方法、装置、终端设备和可读存储介质 | |
WO2023062799A1 (ja) | 情報処理システム、原稿種識別方法、モデル生成方法及びプログラム | |
US11574490B2 (en) | Information processing apparatus and non-transitory computer readable medium storing information processing program | |
US8432555B2 (en) | Image processing apparatus, image processing method, computer-readable medium and computer data signal | |
JP6973433B2 (ja) | 帳票処理装置、帳票処理方法、及びプログラム | |
Nell | Quantifying the noise tolerance of the OCR engine Tesseract using a simulated environment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230228 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231127 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231212 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240117 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240305 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240318 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7468057 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |