JP2013077157A - 光学式文字認識で生成したテキストデータの校正を支援するためのシステム、方法、プログラム - Google Patents
光学式文字認識で生成したテキストデータの校正を支援するためのシステム、方法、プログラム Download PDFInfo
- Publication number
- JP2013077157A JP2013077157A JP2011216500A JP2011216500A JP2013077157A JP 2013077157 A JP2013077157 A JP 2013077157A JP 2011216500 A JP2011216500 A JP 2011216500A JP 2011216500 A JP2011216500 A JP 2011216500A JP 2013077157 A JP2013077157 A JP 2013077157A
- Authority
- JP
- Japan
- Prior art keywords
- calibration
- tool
- carpet
- character
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/98—Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
Landscapes
- Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
Abstract
【解決手段】
システムは、テキストデータのカーペット校正を行うための第1の校正ツールと、テキストデータのサイド・バイ・サイド校正を行うための第2の校正ツールと、第1および第2の校正ツールで行った校正オペレーションのログを記録するための記憶部と、第1の校正ツールのカーペット校正を行う単位である属性ごとに、ログに基づいて算出された第1の校正ツールを使用して校正を行った場合に要する時間の第1の推測値と、第1の校正ツールを使用することなく第2の校正ツールを使用して校正を行った場合に要する時間の第2の推測値を比較して当該属性の校正に第1の校正ツールを使用するかどうかを決定する解析部を備える。
【選択図】 図2
Description
120…スキャナ
Claims (17)
- 光学式文字認識で生成されたテキストデータの校正を支援するためのシステムであって、
前記テキストデータのカーペット校正を行うための第1の校正ツールと、
前記テキストデータのサイド・バイ・サイド校正を行うための第2の校正ツールと、
前記第1および第2の校正ツールで行った校正オペレーションのログを記録するための記憶部と、
前記第1の校正ツールのカーペット校正を行う単位である属性ごとに、前記ログに基づいて算出された前記第1の校正ツールを使用して校正を行った場合に要する時間の第1の推測値と、第1の校正ツールを使用することなく第2の校正ツールを使用して校正を行った場合に要する時間の第2の推測値を比較して当該属性の校正に第1の校正ツールを使用するかどうかを決定する解析部と、
を備える、システム。 - 前記カーペット校正を行う単位である属性が、文字である請求項1に記載のシステム。
- 前記第1の校正ツールによる校正を行った後で、前記第2の校正ツールによる校正が行われ、前記第1の校正ツールによる校正において、文字認識の正誤が不明である場合に、不明であることを示すマークが付される、請求項2に記載の方法。
- 前記不明であることを示すマークが付された文字を、カーペット校正において正誤不明であることを示すようにオペレータに提示する、請求項3に記載のシステム。
- 前記ログに基づいて、ログ統計情報を算出する算出部を備える、請求項2に記載のシステム。
- 前記算出部が、複数の文字をクラスタリングし、クラスタごとにログ情報から統計情報を算出する、請求項5に記載のシステム。
- 前記算出部が、(1)すべての文字に対する1つのクラスタの形成、(2)統計情報の各パラメータの空間によるクラスタの形成、または、(3)文字種ごとのクラスタの形成、のいずれかを実行することができる、請求項9に記載のシステム。
- 前記解析部の決定に基づいて前記属性を第1の校正ツールを使用する対象であることを記述するリストを備える、請求項1に記載のシステム。
- 前記リストに基づいて、前記第1および第2の校正ツールの制御を行う制御部を備える、請求項11に記載のシステム。
- 前記第1のツールが、コンテキスト付きカーペット校正ツールである、請求項1に記載のシステム。
- 前記第2の校正ツールが、ページ、文章、行のうちの少なくとも1つの単位でイメージデータとテキストデータを並べて提示する、請求項1に記載のシステム。
- 請求項1乃至14のいずれかに記載のシステムとしてコンピュータを機能させることができる、プログラム。
- 光学式文字認識で生成されたテキストデータの校正を支援するためのプログラムであって、
前記テキストデータのカーペット校正を行うための第1の校正ツールを準備するステップと、
前記テキストデータのサイド・バイ・サイド校正を行うための第2の校正ツールを準備するステップと、
前記第1および第2の校正ツールで行った校正オペレーションのログを記録するステップと、
前記第1の校正ツールのカーペット校正を行う単位である属性ごとに、前記ログに基づいて算出された前記第1の校正ツールを使用して校正を行った場合に要する時間の第1の推測値と、第1の校正ツールを使用することなく第2の校正ツールを使用して校正を行った場合に要する時間の第2の推測値を比較して当該属性の校正に第1の校正ツールを使用するかどうかを決定するステップと、
をコンピュータに実行させる、プログラム。 - 光学式文字認識で生成されたテキストデータの校正を支援するための方法であって、
前記テキストデータのカーペット校正を行うための第1の校正ツールを準備するステップと、
前記テキストデータのサイド・バイ・サイド校正を行うための第2の校正ツールを準備するステップと、
前記第1および第2の校正ツールで行った校正オペレーションのログを記録するステップと、
前記第1の校正ツールのカーペット校正を行う単位である属性ごとに、前記ログに基づいて算出された前記第1の校正ツールを使用して校正を行った場合に要する時間の第1の推測値と、第1の校正ツールを使用することなく第2の校正ツールを使用して校正を行った場合に要する時間の第2の推測値を比較して当該属性の校正に第1の校正ツールを使用するかどうかを決定するステップと、
を含む、方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011216500A JP5771108B2 (ja) | 2011-09-30 | 2011-09-30 | 光学式文字認識で生成したテキストデータの校正を支援するためのシステム、方法、プログラム |
US13/630,474 US8953910B2 (en) | 2011-09-30 | 2012-09-28 | Proof reading of text data generated through optical character recognition |
US13/669,789 US8971670B2 (en) | 2011-09-30 | 2012-11-06 | Proof reading of text data generated through optical character recognition |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011216500A JP5771108B2 (ja) | 2011-09-30 | 2011-09-30 | 光学式文字認識で生成したテキストデータの校正を支援するためのシステム、方法、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013077157A true JP2013077157A (ja) | 2013-04-25 |
JP5771108B2 JP5771108B2 (ja) | 2015-08-26 |
Family
ID=47992654
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011216500A Expired - Fee Related JP5771108B2 (ja) | 2011-09-30 | 2011-09-30 | 光学式文字認識で生成したテキストデータの校正を支援するためのシステム、方法、プログラム |
Country Status (2)
Country | Link |
---|---|
US (2) | US8953910B2 (ja) |
JP (1) | JP5771108B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5661214B1 (ja) * | 2014-09-02 | 2015-01-28 | 三菱電機インフォメーションシステムズ株式会社 | 文字データ修正方法、文字データ修正装置およびプログラム |
JP2018133605A (ja) * | 2017-02-13 | 2018-08-23 | 京セラドキュメントソリューションズ株式会社 | 画像形成装置 |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11087409B1 (en) | 2016-01-29 | 2021-08-10 | Ocrolus, LLC | Systems and methods for generating accurate transaction data and manipulation |
JP6294554B1 (ja) * | 2017-10-24 | 2018-03-14 | サンネット株式会社 | 文字表示システム、文字表示装置及び文字表示システムを実現させるためのプログラム |
JP2020167618A (ja) * | 2019-03-29 | 2020-10-08 | キヤノン株式会社 | 画像処理装置、その制御方法及びプログラム |
CN110751140A (zh) * | 2019-09-16 | 2020-02-04 | 深圳市国信合成科技有限公司 | 字符批量识别方法、装置和计算机设备 |
CN113780285B (zh) * | 2021-09-27 | 2024-03-15 | 常州市公共资源交易中心 | 证照分析方法、装置和存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11110480A (ja) * | 1997-07-25 | 1999-04-23 | Kuraritec Corp | テキストの表示方法およびその装置 |
JPH11353311A (ja) * | 1998-06-11 | 1999-12-24 | Just Syst Corp | 文書処理装置、文書処理方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2002073827A (ja) * | 2000-08-31 | 2002-03-12 | Fujitsu Ltd | 校正者の能力管理方法、及び装置 |
JP2004341754A (ja) * | 2003-05-14 | 2004-12-02 | Matsushita Electric Ind Co Ltd | 文字認識結果修正装置及びその方法並びに文字認識結果修正プログラム |
JP2005309608A (ja) * | 2004-04-19 | 2005-11-04 | Internatl Business Mach Corp <Ibm> | 文字認識結果出力装置、文字認識装置、その方法及びプログラム |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03240183A (ja) | 1990-02-16 | 1991-10-25 | Nippon Telegr & Teleph Corp <Ntt> | 認識文字自動修正方式 |
JPH05346970A (ja) * | 1991-04-04 | 1993-12-27 | Fuji Xerox Co Ltd | 文書認識装置 |
JPH05314303A (ja) | 1992-05-11 | 1993-11-26 | Fuji Facom Corp | 誤読文字修正方法 |
JP3240183B2 (ja) | 1992-06-24 | 2001-12-17 | 日東電工株式会社 | 試料中の抗原または抗体の測定方法およびその測定装置 |
JPH06290297A (ja) | 1993-04-02 | 1994-10-18 | Sharp Corp | 文字認識装置 |
JPH0757042A (ja) | 1993-08-17 | 1995-03-03 | Nippon Telegr & Teleph Corp <Ntt> | 文字読取方法および装置 |
JPH09179934A (ja) | 1995-12-22 | 1997-07-11 | Oki Electric Ind Co Ltd | 文字読取装置 |
US5923792A (en) * | 1996-02-07 | 1999-07-13 | Industrial Technology Research Institute | Screen display methods for computer-aided data entry |
US6351574B1 (en) * | 1998-12-11 | 2002-02-26 | International Business Machines Corporation | Interactive verification of OCRed characters |
US7111255B2 (en) * | 2001-06-25 | 2006-09-19 | International Business Machines Corporation | Time-based evaluation of data verification results |
US7039256B2 (en) * | 2001-07-12 | 2006-05-02 | International Business Machines Corporation | Efficient verification of recognition results |
JP2003099709A (ja) | 2001-09-25 | 2003-04-04 | Toshiba Corp | 誤読文字修正方法及び光学的文字認識装置 |
JP4110786B2 (ja) | 2002-01-30 | 2008-07-02 | セイコーエプソン株式会社 | 認識文字列修正方法およびその装置並びにコンピュータプログラム |
US7849398B2 (en) * | 2007-04-26 | 2010-12-07 | Xerox Corporation | Decision criteria for automated form population |
JP5314303B2 (ja) | 2008-03-17 | 2013-10-16 | パナソニック株式会社 | 貯湯式給湯システム |
-
2011
- 2011-09-30 JP JP2011216500A patent/JP5771108B2/ja not_active Expired - Fee Related
-
2012
- 2012-09-28 US US13/630,474 patent/US8953910B2/en not_active Expired - Fee Related
- 2012-11-06 US US13/669,789 patent/US8971670B2/en not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11110480A (ja) * | 1997-07-25 | 1999-04-23 | Kuraritec Corp | テキストの表示方法およびその装置 |
JPH11353311A (ja) * | 1998-06-11 | 1999-12-24 | Just Syst Corp | 文書処理装置、文書処理方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2002073827A (ja) * | 2000-08-31 | 2002-03-12 | Fujitsu Ltd | 校正者の能力管理方法、及び装置 |
JP2004341754A (ja) * | 2003-05-14 | 2004-12-02 | Matsushita Electric Ind Co Ltd | 文字認識結果修正装置及びその方法並びに文字認識結果修正プログラム |
JP2005309608A (ja) * | 2004-04-19 | 2005-11-04 | Internatl Business Mach Corp <Ibm> | 文字認識結果出力装置、文字認識装置、その方法及びプログラム |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5661214B1 (ja) * | 2014-09-02 | 2015-01-28 | 三菱電機インフォメーションシステムズ株式会社 | 文字データ修正方法、文字データ修正装置およびプログラム |
JP2015185157A (ja) * | 2014-09-02 | 2015-10-22 | 三菱電機インフォメーションシステムズ株式会社 | 文字データ修正方法、文字データ修正装置およびプログラム |
JP2018133605A (ja) * | 2017-02-13 | 2018-08-23 | 京セラドキュメントソリューションズ株式会社 | 画像形成装置 |
Also Published As
Publication number | Publication date |
---|---|
US20130084011A1 (en) | 2013-04-04 |
US8971670B2 (en) | 2015-03-03 |
JP5771108B2 (ja) | 2015-08-26 |
US8953910B2 (en) | 2015-02-10 |
US20130085746A1 (en) | 2013-04-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5771108B2 (ja) | 光学式文字認識で生成したテキストデータの校正を支援するためのシステム、方法、プログラム | |
US7236968B2 (en) | Question-answering method and question-answering apparatus | |
JP2882569B2 (ja) | 文書書式認識実行方法および装置 | |
JP6874729B2 (ja) | 画像処理装置、画像処理方法およびプログラム | |
US20120134589A1 (en) | Optical character recognition (OCR) engines having confidence values for text types | |
US20060285746A1 (en) | Computer assisted document analysis | |
US10599722B1 (en) | Systems and methods for automated document comparison | |
US20060008148A1 (en) | Character recognition device and method | |
JP2016095753A (ja) | 文字認識システム及び文字認識方法 | |
US20120158599A1 (en) | System and method for analyzing office action of patent application | |
JP2019185137A (ja) | 画像処理装置、画像処理方法およびプログラム | |
US20170178528A1 (en) | Method and System for Providing Automated Localized Feedback for an Extracted Component of an Electronic Document File | |
EP2138959A1 (en) | Word recognizing method and word recognizing program | |
JP2010061471A (ja) | 文字認識装置およびプログラム | |
US20180067916A1 (en) | Analysis apparatus, analysis method, and recording medium | |
JP2017111500A (ja) | 文字認識装置及びプログラム | |
US20220292857A1 (en) | Information processing apparatus, information processing method, and recording medium | |
US20220207900A1 (en) | Information processing apparatus, information processing method, and storage medium | |
WO2002003240A1 (en) | Proofreading system of chinese characters by means of one-to-one comparison | |
JP2020087112A (ja) | 帳票処理装置および帳票処理方法 | |
US20210042555A1 (en) | Information Processing Apparatus and Table Recognition Method | |
US11482029B2 (en) | Image processing device, image processing method, and recording medium | |
CN110647628B (zh) | 一种自动化标检方法及系统 | |
EP2573694A1 (en) | Conversion method and system | |
JP2007286711A (ja) | 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140507 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150126 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150210 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150507 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150609 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150626 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5771108 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |