JP5134383B2 - Ocr装置、証跡管理装置及び証跡管理システム - Google Patents
Ocr装置、証跡管理装置及び証跡管理システム Download PDFInfo
- Publication number
- JP5134383B2 JP5134383B2 JP2008018172A JP2008018172A JP5134383B2 JP 5134383 B2 JP5134383 B2 JP 5134383B2 JP 2008018172 A JP2008018172 A JP 2008018172A JP 2008018172 A JP2008018172 A JP 2008018172A JP 5134383 B2 JP5134383 B2 JP 5134383B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- character string
- trail management
- character
- trail
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Character Discrimination (AREA)
- Editing Of Facsimile Originals (AREA)
- Character Input (AREA)
Description
また、証跡管理支援画像を用いれば、修正オペレータに対して、入力が不足している旨の警告、あるいは、入力に不整合があるケースについて、システム側から警告を発する機能を作る事ができる。例えば、証跡管理支援画像にある文字行仮説について、当該文字行仮説に対応する修正が無い、あるいは確定した読取り結果が存在しない場合、これを未入力文字行として検出し、警告を発する事ができる。あるいはオペレータが入力したテキスト列に対して、当該テキスト列に対応する文字切出仮説と文字認識仮説を探索し、テキスト列に対して不読文字・文字認識尤度の低いパタンが一定割合以上で生じる場合、これをOCR認識結果と不整合があるとして、注意を促す警告を発することができる。
102 操作端末装置
103 表示端末装置
104 ソータ装置
105 外部記憶装置
106 メモリ
107 中央演算装置
108 内部バス
109 通信装置
201 従来環境における読取対象の書類
202 従来環境におけるOCR装置
203 従来環境におけるOCR装置の出力である読取結果のデータ
204 従来環境における結果表示及び入力装置
205 従来環境における修正ログの蓄積
206 本発明における読取対象の書類
207 本発明におけるOCR装置
208 本発明におけるOCR装置の出力である証跡管理支援画像
209 本発明における結果表示及び入力装置
210 本発明における修正ログの蓄積
Claims (7)
- 処理部と、表示部と、入力部と、記憶部とを有し、
帳票の画像データと、前記画像データ上の項目名及びデータ個所の文字列に関して、各文字列の前記画像データ上での座標情報、OCR読み取り結果としての文字列テキストあるいは文字認識の候補としての認識仮説データ、各文字列と項目名との位置関係を含む付加情報とを1つの画像ファイルにまとめた証跡管理支援画像を読み込み、
前記表示部に、前記帳票の画像と、前記OCR読み取り結果としての文字列テキストを表示し、
前記入力部から、前記読み取り結果に対する修正を受け付け、
前記処理部は、
修正された文字列に対応する前記画像上の位置を、前記証跡管理支援画像に含まれる認識仮説データを参照して取得し、証跡ログとして、前記入力部から受け付けた修正内容と関連付けして前記記憶部に保存し、
修正された文字列に対応する前記画像上の位置の探索範囲を、前記文字列と項目名との位置関係を利用して限定する
ことを特徴とする証跡管理装置。 - 請求項1記載の証跡管理装置において、前記処理部は、前記OCR読み取り結果としての文字列テキストに対応する前記画像上の位置を、前記証跡管理支援画像に含まれる前記各文字列の前記画像データ上での座標情報を参照して取得し、証跡ログとして、前記文字列テキストに関連付けして前記記憶部に保存することを特徴とする証跡管理装置。
- 請求項1記載の証跡管理装置において、前記証跡管理支援画像はタグ形式画像ファイルであることを特徴とする証跡管理装置。
- 撮像部と第1の処理部とを有するOCR装置と、第2の処理部と表示部と入力部と記憶部とを有する証跡管理装置からなる証跡管理システムであって、
前記OCR装置は、前記撮像部によって帳票を撮像して当該帳票の画像データを取得し、前記第1の処理部によって、帳票の項目に関する情報を記憶した項目名辞書を用いて、前記帳票の画像データから項目名とそれに対応するデータ箇所の文字列を読み取り、各文字列について前記画像データ上の座標情報、文字認識結果としての文字列テキストあるいは文字認識の候補としての認識仮説データ、当該文字列と項目名との位置関係を含む付加情報を取得し、前記帳票の画像データと前記付加情報を1つの画像ファイルにまとめた証跡管理支援画像を出力し、
前記証跡管理装置は、前記表示部に前記証跡管理支援画像から抽出した帳票の画像と、前記OCR読み取り結果としての文字列テキストを表示し、前記入力部から前記読み取り結果に対する修正を受け付け、前記第2の処理部によって、修正された文字列に対応する前記画像上の位置を、前記証跡管理支援画像に含まれる認識仮説データを参照して取得し、証跡ログとして、前記入力部から受け付けた修正内容と関連付けして前記記憶部に保存し、前記第2の処理部によって、修正された文字列に対応する前記画像上の位置の探索範囲を、前記文字列と項目名との位置関係を利用して限定する
ことを特徴とする証跡管理システム。 - 請求項4記載の証跡管理システムにおいて、前記画像ファイルはタグ形式画像ファイルであることを特徴とする証跡管理システム。
- 請求項4記載の証跡管理システムにおいて、前記第2の処理部は、前記OCR装置による文字認識結果としての文字列テキストに対応する前記画像上の位置を、前記証跡管理支援画像に含まれる前記各文字列の前記画像データ上での座標情報を参照して取得し、証跡ログとして、前記文字列テキストに関連付けして前記記憶部に保存することを特徴とする証跡管理システム。
- 前記認識仮説データには、文字パタンの識別情報、当該文字パタンの前記画像情報上における座標情報、当該文字パタンに続く文字パタンの識別情報、当該文字パタンの識別文字コード、及び当該文字パタンの識別文字類似度を含むことを特徴とする請求項4記載の証跡管理システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008018172A JP5134383B2 (ja) | 2008-01-29 | 2008-01-29 | Ocr装置、証跡管理装置及び証跡管理システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008018172A JP5134383B2 (ja) | 2008-01-29 | 2008-01-29 | Ocr装置、証跡管理装置及び証跡管理システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009181225A JP2009181225A (ja) | 2009-08-13 |
JP5134383B2 true JP5134383B2 (ja) | 2013-01-30 |
Family
ID=41035184
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008018172A Expired - Fee Related JP5134383B2 (ja) | 2008-01-29 | 2008-01-29 | Ocr装置、証跡管理装置及び証跡管理システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5134383B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5346967B2 (ja) * | 2011-02-25 | 2013-11-20 | 三菱電機インフォメーションシステムズ株式会社 | Faxocrシステムおよびfaxocrプログラム |
JP5833956B2 (ja) | 2012-03-06 | 2015-12-16 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 文書を校正する情報処理装置、方法およびプログラム |
JP7432568B2 (ja) * | 2021-10-05 | 2024-02-16 | ウイングアーク1st株式会社 | 情報処理装置、情報処理方法、及びプログラム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5251273A (en) * | 1992-04-15 | 1993-10-05 | International Business Machines Corporation | Data processing system and method for sequentially repairing character recognition errors for scanned images of document forms |
JP3750406B2 (ja) * | 1999-03-19 | 2006-03-01 | 三菱電機株式会社 | 文書ファイリング装置 |
JP2002109242A (ja) * | 2000-09-29 | 2002-04-12 | Glory Ltd | 帳票処理方法および装置並びに帳票処理プログラムを記憶した記憶媒体 |
JP4461769B2 (ja) * | 2003-10-29 | 2010-05-12 | 株式会社日立製作所 | 文書検索・閲覧手法及び文書検索・閲覧装置 |
JP2007233913A (ja) * | 2006-03-03 | 2007-09-13 | Fuji Xerox Co Ltd | 画像処理装置及びプログラム |
-
2008
- 2008-01-29 JP JP2008018172A patent/JP5134383B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2009181225A (ja) | 2009-08-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10824801B2 (en) | Interactively predicting fields in a form | |
JP4676225B2 (ja) | スキャン・ドキュメントから電子フォームに取り込むための方法および装置 | |
JP4347677B2 (ja) | 帳票ocrプログラム、方法及び装置 | |
JP3088019B2 (ja) | 媒体処理装置及び媒体処理方法 | |
US9098765B2 (en) | Systems and methods for capturing and storing image data from a negotiable instrument | |
JP4996940B2 (ja) | 帳票認識装置およびそのプログラム | |
EP3535689A1 (en) | Method and system for transforming handwritten text to digital ink | |
US20070098263A1 (en) | Data entry apparatus and program therefor | |
JP2008276766A (ja) | フォーム自動埋込方法及び装置 | |
JP2004139484A (ja) | 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム | |
US9031308B2 (en) | Systems and methods for recreating an image using white space and check element capture | |
EP2884425B1 (en) | Method and system of extracting structured data from a document | |
JPH11282955A (ja) | 文字認識装置、文字認識方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JP5134383B2 (ja) | Ocr装置、証跡管理装置及び証跡管理システム | |
US9798711B2 (en) | Method and system for generating a graphical organization of a page | |
WO2014068770A1 (ja) | データ抽出方法、データ抽出装置及びそのプログラム | |
CN113806472A (zh) | 一种对文字图片和图像型扫描件实现全文检索的方法及设备 | |
JPH1173472A (ja) | フォーマット情報登録方法及びocrシステム | |
JP3435374B2 (ja) | 文字読取装置および文字認識方法 | |
JP4347675B2 (ja) | 帳票ocrプログラム、方法及び装置 | |
JP4853313B2 (ja) | 文字認識装置 | |
JP4466241B2 (ja) | 文書処理手法及び文書処理装置 | |
WO2011027113A1 (en) | Method and apparatus for segmenting images | |
KR102561878B1 (ko) | 머신러닝 기반의 ai 블루 ocr 판독 시스템 및 판독 방법 | |
JP2024068871A (ja) | 図面管理システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20101111 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110926 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111004 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111202 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120508 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120709 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121023 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121109 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151116 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151116 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |