JP5078321B2 - 文書の画像に対し光学文字認識を実行する方法 - Google Patents
文書の画像に対し光学文字認識を実行する方法 Download PDFInfo
- Publication number
- JP5078321B2 JP5078321B2 JP2006302431A JP2006302431A JP5078321B2 JP 5078321 B2 JP5078321 B2 JP 5078321B2 JP 2006302431 A JP2006302431 A JP 2006302431A JP 2006302431 A JP2006302431 A JP 2006302431A JP 5078321 B2 JP5078321 B2 JP 5078321B2
- Authority
- JP
- Japan
- Prior art keywords
- text
- character
- digital
- digital information
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/12—Detection or correction of errors, e.g. by rescanning the pattern
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/22—Character recognition characterised by the type of writing
- G06V30/224—Character recognition characterised by the type of writing of printed characters having additional code marks or containing code marks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
- Image Processing (AREA)
- Editing Of Facsimile Originals (AREA)
Description
Claims (1)
- テキストを含む文書の画像に対し光学文字認識(OCR)を実行する方法であって、
前記文書上のテキストに関連付けられたデジタル情報の物理的表記を埋め込むステップと、
前記文書をスキャナ装置で走査して、デジタル情報およびデジタル・テキストファイルを生成するステップと、
前記デジタル情報を用いて前記デジタル・テキストファイルを検証するステップとを含み、
前記テキストに関連付けられた前記デジタル情報の物理的表記を埋め込むステップが、
符号化アルゴリズムにより前記テキストを符号化して前記デジタル情報を生成するステップと、
前記文書に前記デジタル情報の物理的表記を添付するステップとを含み、
前記デジタル・テキストファイルを検証するステップが、
前記符号化アルゴリズムにより前記デジタル・テキストファイルを符号化して符号化テキストを生成するステップと、
前記符号化テキストを前記デジタル情報と比較するステップと、
前記符号化テキストが前記デジタル情報に一致する場合、前記デジタル・テキストファイルをアップロードまたは送信するステップ、または
前記符号化テキストが前記デジタル情報に一致しない場合、前記デジタル・テキストファイルが誤識別された旨のフラグを立てるステップと、
頻繁に誤りが発生する文字または文字群を不詳文字として識別するステップと、
前記不詳文字を解析して、誤り発生確率が最も高い前記不詳文字から、誤り発生確率が最低の前記不詳文字まで前記不詳文字のランキングを決定するステップと、
それぞれの不詳文字に対して、少なくとも1個の代替文字候補を特定するステップと、
それぞれの不詳文字についての代替文字を解析して、正しい文字である確率が最良の代替文字から、正しい文字である確率が最低の代替文字まで、代替文字のランキングを決定するステップと、
誤りの確率が最も高い文字を最良な代替文字により置換し、デジタル・テキストファイルを生成するステップと、
物理的表記埋め込み用の前記アルゴリズムを用いてデジタル・テキストファイルを符号化し、符号化テキストを生成するステップと、
前記符号化テキストと前記デジタル情報とを比較し、前記符号化テキストが前記デジタル情報と一致する場合には前記デジタル・テキストファイルをアップロードまたは送信するステップ、または
前記符号化テキストが前記デジタル情報と不一致の場合には前記デジタル・テキストファイルが誤識別された旨のフラグを立てるステップとを含む方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/274,805 | 2005-11-15 | ||
US11/274,805 US7505180B2 (en) | 2005-11-15 | 2005-11-15 | Optical character recognition using digital information from encoded text embedded in the document |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007141233A JP2007141233A (ja) | 2007-06-07 |
JP5078321B2 true JP5078321B2 (ja) | 2012-11-21 |
Family
ID=38040876
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006302431A Expired - Fee Related JP5078321B2 (ja) | 2005-11-15 | 2006-11-08 | 文書の画像に対し光学文字認識を実行する方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US7505180B2 (ja) |
JP (1) | JP5078321B2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7880912B2 (en) * | 2005-12-07 | 2011-02-01 | Xerox Corporation | Network printing system having automated selection of a destination printer |
US9277090B2 (en) | 2007-10-01 | 2016-03-01 | Hewlett-Packard Development Company, L.P. | System and method of document reproduction |
US9025828B2 (en) | 2010-12-02 | 2015-05-05 | 3M Innovative Properties Company | Methods and systems for enhancing read accuracy in an automated license plate reader system |
JP6804977B2 (ja) * | 2014-09-08 | 2020-12-23 | 株式会社根本杏林堂 | 薬液吸引装置、薬液注入システムおよび透視撮像システム |
US9501853B2 (en) * | 2015-01-09 | 2016-11-22 | Adobe Systems Incorporated | Providing in-line previews of a source image for aid in correcting OCR errors |
US9830508B1 (en) | 2015-01-30 | 2017-11-28 | Quest Consultants LLC | Systems and methods of extracting text from a digital image |
DE102015216574A1 (de) * | 2015-08-31 | 2017-03-02 | Siemens Aktiengesellschaft | Verfahren zum Überprüfen der Richtigkeit von einer Darstellung von Bilddaten auf einem Anzeigemittel und Anzeigeeinrichtung |
JP6291098B2 (ja) * | 2017-02-20 | 2018-03-14 | スリーエム イノベイティブ プロパティズ カンパニー | 自動ライセンスプレート読み取りシステムの読み取り精度を高めるための方法及びシステム |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2155891A1 (en) * | 1994-10-18 | 1996-04-19 | Raymond Amand Lorie | Optical character recognition system having context analyzer |
US5765176A (en) * | 1996-09-06 | 1998-06-09 | Xerox Corporation | Performing document image management tasks using an iconic image having embedded encoded information |
US6219453B1 (en) * | 1997-08-11 | 2001-04-17 | At&T Corp. | Method and apparatus for performing an automatic correction of misrecognized words produced by an optical character recognition technique by using a Hidden Markov Model based algorithm |
JP2002298101A (ja) * | 2001-04-03 | 2002-10-11 | Sony Corp | キャラクタ情報認識方法およびキャラクタ情報認識装置 |
JP2003044257A (ja) * | 2001-08-02 | 2003-02-14 | Dainippon Printing Co Ltd | 印刷物、印刷システム、読み取り装置 |
JP2003259112A (ja) * | 2001-12-25 | 2003-09-12 | Canon Inc | 透かし情報抽出装置及びその制御方法 |
US6956958B2 (en) * | 2002-02-21 | 2005-10-18 | Xerox Corporation | Method of embedding color information in printed documents using watermarking |
JP4168673B2 (ja) * | 2002-06-04 | 2008-10-22 | 富士ゼロックス株式会社 | 文書交付システム、認証システム、方法、及びプログラム群 |
JP4164458B2 (ja) * | 2004-03-08 | 2008-10-15 | キヤノン株式会社 | 情報処理装置及び方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体 |
-
2005
- 2005-11-15 US US11/274,805 patent/US7505180B2/en not_active Expired - Fee Related
-
2006
- 2006-11-08 JP JP2006302431A patent/JP5078321B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20070110339A1 (en) | 2007-05-17 |
JP2007141233A (ja) | 2007-06-07 |
US7505180B2 (en) | 2009-03-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5078321B2 (ja) | 文書の画像に対し光学文字認識を実行する方法 | |
KR100311338B1 (ko) | 보증가능한광학문자인식방법 | |
JP4777041B2 (ja) | 画像処理装置、その画像処理装置におけるデータ処理方法およびプログラム | |
JP4854491B2 (ja) | 画像処理装置及びその制御方法 | |
US20060210138A1 (en) | Verification of authenticity of check data | |
JPH07168912A (ja) | プリント文書の光学的文字認識能力強化方法及びその手段 | |
JP7038988B2 (ja) | 画像処理方法及び画像処理システム | |
CN101267491A (zh) | 使用条形码来控制文档复印操作的装置和方法 | |
US20070246542A1 (en) | Document element repair | |
CN109740473B (zh) | 一种基于阅卷系统的图片内容自动标记方法及系统 | |
US7911653B2 (en) | Device using low visibility encoded image to manage copy history | |
US8351086B2 (en) | Two-dimensional code generating device | |
JP4943354B2 (ja) | 情報識別装置、情報識別方法、プログラム及び記録媒体 | |
JP5518140B2 (ja) | 印刷装置、印刷制御装置、データ処理方法およびプログラム | |
JP5073079B2 (ja) | 印刷装置、印刷制御装置、データ処理方法およびプログラム | |
JP6763173B2 (ja) | 文書修正方法、文書修正装置、およびコンピュータプログラム | |
JP2008085579A (ja) | 情報埋め込み装置、情報読み取り装置、情報埋め込み方法、情報読み取り方法、およびコンピュータプログラム | |
JP2004199483A (ja) | 画像出力装置 | |
JP4280939B2 (ja) | 位置面システム画像認識コンピューターソフトウェア | |
JP7452060B2 (ja) | 情報処理装置及びプログラム | |
JP3823005B2 (ja) | ビットマップフォント作成装置および文書復元装置 | |
JP2000011095A (ja) | 文字認識装置及び方法 | |
Garg et al. | Identifying the Leak Sources of Hard Copy Documents | |
CN115331248A (zh) | 结合语音识别与ocr识别的文档图像结构化录入平台 | |
JP2010026986A (ja) | 画像形成装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20091105 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120113 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120124 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120423 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120731 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120828 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150907 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5078321 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |