JP7241506B2 - 光学式文字認識結果の修正支援装置および修正支援用プログラム - Google Patents
光学式文字認識結果の修正支援装置および修正支援用プログラム Download PDFInfo
- Publication number
- JP7241506B2 JP7241506B2 JP2018204444A JP2018204444A JP7241506B2 JP 7241506 B2 JP7241506 B2 JP 7241506B2 JP 2018204444 A JP2018204444 A JP 2018204444A JP 2018204444 A JP2018204444 A JP 2018204444A JP 7241506 B2 JP7241506 B2 JP 7241506B2
- Authority
- JP
- Japan
- Prior art keywords
- area
- accuracy
- original image
- correction
- partial
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/12—Detection or correction of errors, e.g. by rescanning the pattern
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
- G06F18/2178—Validation; Performance evaluation; Active pattern learning techniques based on feedback of a supervisor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
Description
以下、本発明の第1の実施形態を図面に基づいて説明する。図1は、第1の実施形態による光学式文字認識結果の修正支援装置(以下、単に修正支援装置という)10Aを含む文字認識装置100の機能構成例(一部にハードウェア構成を含む)を示すブロック図である。図2は、文字認識装置100のハードウェア構成例を示す図である。修正支援装置10Aは、光学式文字認識によって元画像に含まれる文字から変換されたテキストデータの修正作業を支援する装置である。
次に、本発明の第2の実施形態を図面に基づいて説明する。図5は、第2の実施形態による修正支援装置10Bを含む文字認識装置100の機能構成例(一部にハードウェア構成を含む)を示すブロック図である。なお、この図5において、図1に示した符号と同一の符号を付したものは同一の機能を有するものであるので、ここでは重複する説明を省略する。
次に、本発明の第3の実施形態を図面に基づいて説明する。図7は、第3の実施形態による修正支援装置10Cを含む文字認識装置100の機能構成例(一部にハードウェア構成を含む)を示すブロック図である。なお、この図7において、図1に示した符号と同一の符号を付したものは同一の機能を有するものであるので、ここでは重複する説明を省略する。
11 修正履歴記録部
12 正確度算出部
13 分布図画像生成部
14 分布図画像表示部
15 修正履歴記憶部
16 認識結果表示部
17 修正用画面表示部
Claims (6)
- 光学式文字認識によって元画像に含まれる文字から変換されたテキストデータの修正作業を支援する装置であって、
上記光学式文字認識の結果として出力された上記テキストデータの中から特定箇所がユーザにより修正された場合、その修正箇所が上記元画像のレイアウト上でどの領域に当たるかを検出し、修正箇所の領域情報を修正履歴情報として記録する修正履歴記録部と、
上記修正履歴記録部により記録された修正履歴情報に基づいて、上記元画像のレイアウト上の個々の個別領域ごとに、修正の行われた回数が多いほど値が小さくなり修正の行われた回数が少ないほど値が大きくなる指標である上記光学式文字認識の正確度を算出する正確度算出部と、
上記正確度算出部により上記個々の個別領域ごとに算出された正確度に基づいて、上記正確度の大きさの違いを上記個々の個別領域ごとの表示態様の違いで表した分布図画像を生成する分布図画像生成部と、
上記分布図画像生成部により生成された分布図画像を表示させる分布図画像表示部とを備えたことを特徴とする光学式文字認識結果の修正支援装置。 - 上記分布図画像生成部は、上記元画像の全体レイアウトにおいて、当該全体レイアウトに含まれる個々の個別領域ごとに上記正確度算出部により算出された正確度に基づいて、上記正確度の大きさの違いを上記個々の個別領域ごとの表示態様の違いで表した全体分布図画像を生成することを特徴とする請求項1に記載の光学式文字認識結果の修正支援装置。
- 上記分布図画像生成部は、上記元画像の全体レイアウトの中の指定された一部領域において、当該指定された一部領域に含まれる個々の個別領域ごとに上記正確度算出部により算出された正確度に基づいて、上記正確度の大きさの違いを上記個々の個別領域ごとの表示態様の違いで表した一部分布図画像を生成することを特徴とする請求項1に記載の光学式文字認識結果の修正支援装置。
- 上記元画像を表示し、表示された元画像上の任意の一部領域の指定を受け付けて、当該指定された一部領域における上記光学式文字認識の結果であるテキストデータの領域を部分テキストデータとして生成し、当該部分テキストデータを別画面表示する認識結果表示部を更に備え、
上記認識結果表示部は、上記指定された一部領域に含まれる個々の個別領域ごとに上記正確度算出部により算出された正確度に基づいて、上記別画面表示上において、上記正確度の大きさの違いを、上記部分テキストデータのレイアウト上で上記個々の個別領域に対応する位置に設定される領域である個々のテキスト領域ごとの表示態様の違いで表した表示を行うことを特徴とする請求項1に記載の光学式文字認識結果の修正支援装置。 - 上記元画像上の任意の一部領域の指定を受け付けて、当該指定された一部領域における上記光学式文字認識の結果であるテキストデータの領域を部分テキストデータとして生成し、当該部分テキストデータと、上記指定された一部領域の元画像である部分元画像とを並べて成る修正用画面を表示する修正用画面表示部を更に備え、
上記修正用画面表示部は、上記指定された一部領域に含まれる個々の個別領域ごとに上記正確度算出部により算出された正確度に基づいて、上記修正用画面の上記部分元画像上または上記部分テキストデータ上において、上記正確度の大きさの違いを、上記個々の個別領域または上記部分テキストデータのレイアウト上で上記個々の個別領域に対応する位置に設定される領域である個々のテキスト領域ごとの表示態様の違いで表した表示を行うことを特徴とする請求項1に記載の光学式文字認識結果の修正支援装置。 - 光学式文字認識によって元画像に含まれる文字から変換されたテキストデータの修正作業を支援するための機能を提供する光学式文字認識結果の修正支援用プログラムであって、
上記光学式文字認識の結果として出力された上記テキストデータの中から特定箇所がユーザにより修正された場合、その修正箇所が上記元画像のレイアウト上でどの領域に当たるかを検出し、修正箇所の領域情報を修正履歴情報として記録する修正履歴記録手段、
上記修正履歴記録手段により記録された修正履歴情報に基づいて、上記元画像のレイアウト上の個々の個別領域ごとに、修正の行われた回数が多いほど値が小さくなり修正の行われた回数が少ないほど値が大きくなる指標である上記光学式文字認識の正確度を算出する正確度算出手段、
上記正確度算出手段により上記個々の個別領域ごとに算出された正確度に基づいて、上記正確度の大きさの違いを上記個々の個別領域ごとの表示態様の違いで表した分布図画像を生成する分布図画像生成手段、および
上記分布図画像生成手段により生成された分布図画像を表示させる分布図画像表示手段
としてコンピュータを機能させるための光学式文字認識結果の修正支援用プログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018204444A JP7241506B2 (ja) | 2018-10-30 | 2018-10-30 | 光学式文字認識結果の修正支援装置および修正支援用プログラム |
US16/666,861 US11055551B2 (en) | 2018-10-30 | 2019-10-29 | Correction support device and correction support program for optical character recognition result |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018204444A JP7241506B2 (ja) | 2018-10-30 | 2018-10-30 | 光学式文字認識結果の修正支援装置および修正支援用プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020071619A JP2020071619A (ja) | 2020-05-07 |
JP7241506B2 true JP7241506B2 (ja) | 2023-03-17 |
Family
ID=70325257
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018204444A Active JP7241506B2 (ja) | 2018-10-30 | 2018-10-30 | 光学式文字認識結果の修正支援装置および修正支援用プログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US11055551B2 (ja) |
JP (1) | JP7241506B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7452060B2 (ja) * | 2020-02-12 | 2024-03-19 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びプログラム |
JP2022018202A (ja) * | 2020-07-15 | 2022-01-27 | 株式会社リコー | 情報処理装置およびプログラム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3214281B2 (ja) | 1995-03-03 | 2001-10-02 | 日本鋼管株式会社 | 低温用建築鋼材 |
JP2012133507A (ja) | 2010-12-21 | 2012-07-12 | Fujitsu Marketing Ltd | レシートデータ照合支援装置およびレシートデータ照合支援プログラム |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03214281A (ja) * | 1990-01-19 | 1991-09-19 | Sony Corp | 文字認識装置 |
JPH11102414A (ja) * | 1997-07-25 | 1999-04-13 | Kuraritec Corp | ヒートマップを用いて光学式文字認識の訂正を行うための方法および装置、並びに、ocr出力の誤りを発見するための一連の命令を記録したコンピュータ読み取り可能な記録媒体 |
JP2002073827A (ja) * | 2000-08-31 | 2002-03-12 | Fujitsu Ltd | 校正者の能力管理方法、及び装置 |
JP4006239B2 (ja) * | 2002-02-21 | 2007-11-14 | 株式会社日立製作所 | 文書の検索方法および検索システム |
US7849062B1 (en) * | 2005-03-18 | 2010-12-07 | Beyondcore, Inc. | Identifying and using critical fields in quality management |
US20060247912A1 (en) * | 2005-04-27 | 2006-11-02 | Microsoft Corporation | Metric for evaluating systems that produce text |
US20060285749A1 (en) * | 2005-06-17 | 2006-12-21 | Microsoft Corporation | User-initiated reporting of handwriting recognition errors over the internet |
US20080300898A1 (en) * | 2007-05-30 | 2008-12-04 | Belkacem Bacha | Document processing services |
US9037962B1 (en) * | 2012-04-30 | 2015-05-19 | Intuit Inc. | Method and system for tracking and reporting data importation accuracy |
US10037409B2 (en) * | 2013-02-27 | 2018-07-31 | Mro Corporation | Automated method and system for reducing the improper disclosure of documents |
WO2019092672A2 (en) * | 2017-11-13 | 2019-05-16 | Way2Vat Ltd. | Systems and methods for neuronal visual-linguistic data retrieval from an imaged document |
US10614301B2 (en) * | 2018-04-09 | 2020-04-07 | Hand Held Products, Inc. | Methods and systems for data retrieval from an image |
US11080563B2 (en) * | 2018-06-28 | 2021-08-03 | Infosys Limited | System and method for enrichment of OCR-extracted data |
US11461409B2 (en) * | 2019-06-07 | 2022-10-04 | Accenture Global Solutions Limited | Digitization of technical documentation driven by machine learning |
-
2018
- 2018-10-30 JP JP2018204444A patent/JP7241506B2/ja active Active
-
2019
- 2019-10-29 US US16/666,861 patent/US11055551B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3214281B2 (ja) | 1995-03-03 | 2001-10-02 | 日本鋼管株式会社 | 低温用建築鋼材 |
JP2012133507A (ja) | 2010-12-21 | 2012-07-12 | Fujitsu Marketing Ltd | レシートデータ照合支援装置およびレシートデータ照合支援プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2020071619A (ja) | 2020-05-07 |
US11055551B2 (en) | 2021-07-06 |
US20200134349A1 (en) | 2020-04-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7926732B2 (en) | OCR sheet-inputting device, OCR sheet, program for inputting an OCR sheet and program for drawing an OCR sheet form | |
US20100172590A1 (en) | Combined Image and Text Document | |
JP5121599B2 (ja) | 画像処理装置、画像処理方法およびそのプログラムならびに記憶媒体 | |
US20120105888A1 (en) | Image Forming Apparatus, Non-Transitory Computer-Readable Recording Medium for Storing Image Forming Program, and Image Forming Method | |
JPH10162099A (ja) | 矩形オブジェクトの認識方法及び認識装置、矩形オブジェクトの認識を行うプログラム・プロダクト | |
US11418658B2 (en) | Image processing apparatus, image processing system, image processing method, and storage medium | |
JP2012009000A (ja) | 帳票処理システム、ocr装置、ocr処理プログラム、帳票作成装置、帳票作成プログラム、および帳票処理方法 | |
US9614984B2 (en) | Electronic document generation system and recording medium | |
JP7241506B2 (ja) | 光学式文字認識結果の修正支援装置および修正支援用プログラム | |
CN113378839A (zh) | 信息处理装置、信息处理方法及计算机可读介质 | |
JP2021044803A (ja) | 画像処理装置、画像処理方法、及びプログラム | |
US20200021711A1 (en) | Image processing apparatus | |
JP2018151699A (ja) | 情報処理装置及びプログラム | |
US10812677B2 (en) | Image processing apparatus | |
JP4518212B2 (ja) | 画像処理装置及びプログラム | |
JP2012048637A (ja) | 画像処理装置、画像処理方法、コンピュータプログラム | |
JP5723803B2 (ja) | 画像処理装置及びプログラム | |
US8125691B2 (en) | Information processing apparatus and method, computer program and computer-readable recording medium for embedding watermark information | |
JP4501731B2 (ja) | 画像処理装置 | |
JP4682663B2 (ja) | ドキュメント処理装置 | |
JP2006277149A (ja) | 文字画像切出装置、文字画像切出方法およびプログラム | |
JP2006134079A (ja) | 画像処理装置及びプログラム | |
JP2012190357A (ja) | 画像処理装置、画像処理方法、およびプログラム | |
JP4693825B2 (ja) | 情報処理装置およびプログラム | |
JP4232051B2 (ja) | タイリングオフセット出力システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210802 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220727 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220823 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221018 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230221 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230307 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7241506 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |