JP5464474B2 - Ocrシステム - Google Patents
Ocrシステム Download PDFInfo
- Publication number
- JP5464474B2 JP5464474B2 JP2009189689A JP2009189689A JP5464474B2 JP 5464474 B2 JP5464474 B2 JP 5464474B2 JP 2009189689 A JP2009189689 A JP 2009189689A JP 2009189689 A JP2009189689 A JP 2009189689A JP 5464474 B2 JP5464474 B2 JP 5464474B2
- Authority
- JP
- Japan
- Prior art keywords
- ocr
- electronic image
- recognition
- image form
- engine
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012937 correction Methods 0.000 claims description 11
- 238000012790 confirmation Methods 0.000 claims description 10
- 238000012015 optical character recognition Methods 0.000 description 129
- 238000000034 method Methods 0.000 description 17
- 238000012795 verification Methods 0.000 description 9
- 238000001514 detection method Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 7
- 238000003702 image correction Methods 0.000 description 6
- 238000000605 extraction Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 239000004575 stone Substances 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 241000282412 Homo Species 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000012805 post-processing Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 238000010422 painting Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
Images
Landscapes
- Character Discrimination (AREA)
Description
特許文献1は、帳票における重要項目の読取の正確性を向上させることを課題として、OCR認識した帳票の項目に関する入力領域を表示し、入力領域に対するオペレータによる入力データと、OCR認識結果を比較し、不一致の場合は、OCR認識結果を入力データに置き換えるものである。
特許文献2は、複数のOCRエンジンを組合せより高い文字認識精度を実現した光学的文字認識(OCR)のための後処理方法を提供するものである。
(1)特許文献1では、全ての入力領域に対してオペレータによる入力データを必要とすることとなり、作業負担の大幅な削減、すなわち効率的なシステム運営につながらない場合がある。
(2)特許文献2では、複数のOCRエンジンを組み合わせることでより高い文字認識精度を実現できることは開示されているが、読み取った電子画像フォームの補正等複数のOCRエンジンの有効な組み合わせ方、すなわち実用的なシステム運用については開示されていない。また、複数のOCRエンジンによって誤って認識されかつ出力された文字および文字の属性を識別および解明するための後処理方法を備えているため、複雑なOCRシステムとなっており、実用性に疑問が残る。
(3)特許文献3では、文字認識処理を、約500万文字について検証実験を行った結果、約20%の100万文字が超確定の認識属性となり、人手による照合確認作業を不要とするものであるが、残り80%、すなわち4/5以上が人手による照合確認作業を必要とし、作業負担の大幅な削減にはつながらないものである。
第2の発明は、性質の異なる2種類以上のOCRエンジンとは、誤認識を共通にしない或いは共通にすることの少ないOCRエンジンどうしであることを特徴とするものである。
第3の発明は、画像読取手段は、データの記入されたフォーム(帳票)を電子画像フォームとしてFAX受信機で読み取ることを特徴とするものである。
第4の発明は、データベース保存手段は、認識結果が一致しない文字又は信頼性が低い文字についてオペレータによる確認後に修正文字を受け入れる文字修正機能を有することを特徴とするものである。
第5の発明は、画像読取手段によって読み取った電子画像フォームを1のOCRエンジンによって補正して、補正された電子画像フォームをOCR認識手段に供する電子画像フォーム補正手段を備えたことを特徴とするものである。
第6の発明は、画像読取手段によって読み取った電子画像フォームを1のOCRエンジンによって部分的に切り出して、切り出された電子画像フォームをOCR認識手段に供する電子画像フォーム切出手段を備えたことを特徴とするものである。
(1)読み取った電子画像フォームを性質の異なる2種類(以上)のOCRエンジンでOCR認識し、不一致点を修正する極めてシンプルな構造であり、OCRシステムの精度(認識率)を向上させる実用的かつ効率的な技術を提供できる。
(2)すなわち、性質の異なる2種類以上のOCRエンジンに、誤認識を共通にしない或いは共通にすることの少ないOCRエンジンどうしを使用することで、OCR結果に混入している誤認識を効率よく検出する割合を示す「誤り検出率」を可能な限り100%に近づけていくことができる(誤認識を共通にするものであれば、双方で同じ誤認識をすることで認識結果の一致を招き結果として誤認識を検出することができない)。これにより、複数のOCRエンジンを使って「保守的な結論」を導き、充分に信頼性の高いデータには「お墨付き」(人間の確認不要)を与え、そうでない「札付きの当てにならないデータ」は人間に確認させることによって、OCR結果を二重にチェックする方法に比べて飛躍的に作業効率を改善できる。
(3)画像読取手段は、データの記入されたフォーム(帳票)を電子画像フォームとしてFAX受信機で読み取ることができるので、FAX−OCRにも対応できる。
(4)データベース保存手段は、認識結果が一致しない文字又は信頼性が低い文字についてオペレータによる確認後に修正文字を受け入れる文字修正機能を有することで、認識できなかった文字又は信頼性が低い文字を確実に修正できる実用的かつ効率的な技術を提供できる。
(5)OCRエンジンには「画像補正」に優れたものもあり、このOCRエンジンの「画像補正」を利用することで、より精度の高いOCR認識を実現できる。
(6)OCRエンジンにはそれぞれ最適な「OCR認識領域」があり、電子画像フォームから最適な「OCR認識領域」を切り出すことで、より精度の高いOCR認識を実現できる。
図1は、本願発明に係るダブルOCRシステムの概要図である。
データの記入されたフォーム(帳票)がFAXで送信され、FAX受信機がこれを電子画像フォームとして受信する(読み取る)。
受信された(読み取られた)電子画像フォームは、第1OCRエンジン(FAXOCRエンジン)の画像補正機能・画像切出機能によって処理される。処理されたデータは、第1OCRエンジン(FAXOCRエンジン)によって、OCR認識され認識結果が出力される。また、処理されたデータは、第1OCRエンジン(FAXOCRエンジン)と異なる性質を有する第2OCRエンジンによってOCR認識され認識結果が出力される。両OCRエンジンの認識結果が一致する文字については、そのまま自動的にデータベースへ保存される。両OCRエンジンの認識結果が一致しない文字及び一致してもいずれか一方のOCRエンジンの認識の信頼性の低い文字については、オペレーターによる確認修正後にデータベースへ保存される。
ここで「信頼性」とは、OCRエンジンの文字を認識するパターン情報(文字の定義)に基づいて、認識文字の類似度合を数値化したものをいう。市販されているOCRエンジンは、認識文字に対してパターン情報(文字の定義)との類似度合の数値を出力しているので、これを利用して信頼性の数値を算出させたものである。
まず、図7は、第1OCRエンジンと第2OCRエンジンとして採用した「第1OCRエンジンA(以下A)」と「第2OCRエンジンB(以下B)」のOCR結果を表にまとめたものである。「A」と「B」は誤認識を共通にしないものではないが、共通にすることの少ないOCRエンジンどうしであることが分かる。
図8は、正解率特性を示したものである。これによると、信頼性の閾値を100%とした場合、正解率(認識精度)は約80%となっている。
一方、図9は、誤り検出率特性を示したものである。これによると、信頼性の閾値の値にかかわらず、誤り検出率はほぼ100%となっている。
符号10は、FAX送信されるフォーム(帳票)である。手書き入力された文字11がOCR認識の対象部分である。第1OCRエンジン(FAXOCR)はこのFAX送信されるフォーム(帳票)10をフォームの四隅に設けられたコーナーストーン12やフォームID13に基づいて画像補正(縮小、ゆがみ、ギザギザ等の修正)を行う。第1OCRエンジンはFAXOCRなので、この画像補正機能に優れており、第1OCRエンジンの機能・性能を有効に利用できる。
図2に示す処理と異なるのは、第1OCRエンジン(FAXOCR)はこのFAX送信されるフォーム(帳票)10をフォームの四隅に設けられたコーナーストーン12やフォームID13に基づいて画像補正(縮小、ゆがみ、ギザギザ等の修正)を行うだけでなく、OCR認識する画像を切り出した点にある。OCRエンジンによって、最適な「OCR認識領域」があり、この最適な「OCR認識領域」に合わせて画像切り出しを行うことで、より精度の高いOCR認識を実現できる。その他の点は、図2の場合と同様であるのでその説明を省略する。
符号20は、信頼性の低い認識結果の出た電子画像データである。すなわち、FAX受信の際に、受信されたフォーム(帳票)に汚れ(エラー線)が付いてしまうことがある。この場合、正しくは「3」のところ「13」、正しく「7」のところ「17」といったOCRの認識結果が出てしまうことがある。これはフォーム下端に設けられた「エラー抽出線」14を確認することで判明する。このような信頼性の低い認識結果が出た場合は、認識結果が不一致の場合と同様に、該当文字の確認修正作業に回すことになる。
(1)受注処理
(2)経理処理
(3)勤怠処理
(4)アンケート処理
11 手書き入力された文字
12 コーナーストーン
13 フォームID
14 エラー抽出線
20 電子画像データ
Claims (4)
- データの記入されたフォームを電子画像フォームとして読み取る画像読取手段と、
読み取った電子画像フォームを性質の異なる2種類以上のOCRエンジンでOCR認識するOCR認識手段と、
認識結果が一致した文字は自動的にデータベースへ保存し、一致しない文字又は信頼性が低い文字は確認修正後にデータベースへ保存するデータベース保存手段と、を備え、
性質の異なる2種類以上のOCRエンジンとは、誤認識を共通にしない或いは共通にすることの少ないOCRエンジンどうしであることを特徴とするとともに、
画像読取手段によって読み取った電子画像フォームを1のOCRエンジンによって補正して、補正された電子画像フォームをOCR認識手段に供する電子画像フォーム補正手段を備え、
画像読取手段によって読み取った電子画像フォームを1のOCRエンジンでOCR認識し、電子画像フォーム補正手段によって補正された電子画像フォームをその他のOCRエンジンでOCR認識することを特徴とするOCRシステム。 - 画像読取手段は、データの記入されたフォームを電子画像フォームとしてFAX受信機で読み取ることを特徴とする請求項1記載のOCRシステム。
- データベース保存手段は、認識結果が一致しない文字又は信頼性が低い文字についてオペレータによる確認後に修正文字を受け入れる文字修正機能を有することを特徴とする請求項1又は2記載のOCRシステム。
- 画像読取手段によって読み取った電子画像フォームを1のOCRエンジンによって部分的に切り出して、切り出された電子画像フォームをOCR認識手段に供する電子画像フォーム切出手段を備えたことを特徴とする請求項1から3のいずれかに記載のOCRシステム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009189689A JP5464474B2 (ja) | 2008-08-20 | 2009-08-19 | Ocrシステム |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008212094 | 2008-08-20 | ||
JP2008212094 | 2008-08-20 | ||
JP2009189689A JP5464474B2 (ja) | 2008-08-20 | 2009-08-19 | Ocrシステム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010073201A JP2010073201A (ja) | 2010-04-02 |
JP5464474B2 true JP5464474B2 (ja) | 2014-04-09 |
Family
ID=42204860
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009189689A Active JP5464474B2 (ja) | 2008-08-20 | 2009-08-19 | Ocrシステム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5464474B2 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014194599A (ja) * | 2013-03-28 | 2014-10-09 | Hammock:Kk | Ocrシステム |
JP6474161B2 (ja) * | 2016-02-26 | 2019-02-27 | 株式会社スカイコム | 画像処理装置、画像処理方法および画像処理プログラム |
JP7206605B2 (ja) * | 2018-03-20 | 2023-01-18 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置 |
JP7147208B2 (ja) | 2018-03-20 | 2022-10-05 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びプログラム |
US11972197B2 (en) | 2018-08-27 | 2024-04-30 | Kyocera Document Solutions Inc. | OCR system |
JP2021068202A (ja) | 2019-10-24 | 2021-04-30 | 富士ゼロックス株式会社 | 情報処理装置及びプログラム |
JP7415433B2 (ja) | 2019-10-24 | 2024-01-17 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びプログラム |
JP7393960B2 (ja) | 2020-01-24 | 2023-12-07 | 株式会社日本総合研究所 | 情報処理装置、情報処理方法、およびプログラム |
KR102468975B1 (ko) * | 2022-06-13 | 2022-11-28 | 주식회사 엘박스 | 인공지능 기반의 판례 인식의 정확도 향상 방법 및 장치 |
JP7184411B1 (ja) | 2022-06-20 | 2022-12-06 | 健彦 深山 | 文字認識プログラムの評価方法、文字認識プログラムの評価システムおよび文字認識プログラム用教師データの製造方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2828363B2 (ja) * | 1991-12-16 | 1998-11-25 | 沖電気工業株式会社 | ファクシミリ文字認識管理方法 |
JP3265701B2 (ja) * | 1993-04-20 | 2002-03-18 | 富士通株式会社 | 多判定器によるパターン認識装置 |
JP2000057258A (ja) * | 1998-08-13 | 2000-02-25 | Oki Electric Ind Co Ltd | 文字認識装置 |
JP3467437B2 (ja) * | 1999-09-16 | 2003-11-17 | 富士通株式会社 | 文字認識装置及びその方法とプログラム記録媒体 |
JP2002052365A (ja) * | 2000-08-10 | 2002-02-19 | Toshiba Corp | 区分装置と区分処理方法 |
-
2009
- 2009-08-19 JP JP2009189689A patent/JP5464474B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2010073201A (ja) | 2010-04-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5464474B2 (ja) | Ocrシステム | |
US9767379B2 (en) | Systems, methods and computer program products for determining document validity | |
US10789501B2 (en) | Methods for mobile image capture of vehicle identification numbers in a non-document | |
US8170379B2 (en) | Image processing apparatus and image retrieval method | |
JP5591578B2 (ja) | 文字列認識装置および文字列認識方法 | |
US8155442B2 (en) | Method and apparatus for modifying the histogram of an image | |
US8849042B2 (en) | Image processing apparatus, rectangle detection method, and computer-readable, non-transitory medium | |
US5539841A (en) | Method for comparing image sections to determine similarity therebetween | |
US9160884B2 (en) | Image processing apparatus, line detection method, and computer-readable, non-transitory medium | |
US20100061633A1 (en) | Method and Apparatus for Calculating the Background Color of an Image | |
CN102799850A (zh) | 一种条形码识别方法和装置 | |
JP4661921B2 (ja) | 文書処理装置およびプログラム | |
US8897574B2 (en) | Image processing apparatus, line detection method, and computer-readable, non-transitory medium | |
US20150206033A1 (en) | Method of identifying pattern training need during verification of recognized text | |
US20090317003A1 (en) | Correcting segmentation errors in ocr | |
US7013045B2 (en) | Using multiple documents to improve OCR accuracy | |
JP6187323B2 (ja) | 画像処理装置及び画像処理プログラム | |
US20120020535A1 (en) | Unique, repeatable, and compact biometric identifier | |
JP2009129237A (ja) | 画像処理装置及びその方法 | |
CN107977648A (zh) | 一种基于人脸识别的身份证清晰度的判别方法和系统 | |
US20130194298A1 (en) | Image processing apparatus, image processing method, and computer-readable recording medium storing image processing program | |
US10902278B2 (en) | Image processing apparatus, image processing system, computer program product, and image processing method | |
CN112036232A (zh) | 一种图像表格结构识别方法、系统、终端以及存储介质 | |
JP4518141B2 (ja) | 画像照合方法及び画像照合装置並びに画像照合プログラム | |
JP2014194599A (ja) | Ocrシステム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120731 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130926 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131125 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20131128 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131227 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140109 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5464474 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |