JP2015187765A - 帳票フォーマット情報登録方法及びシステム並びにプログラム - Google Patents
帳票フォーマット情報登録方法及びシステム並びにプログラム Download PDFInfo
- Publication number
- JP2015187765A JP2015187765A JP2014064474A JP2014064474A JP2015187765A JP 2015187765 A JP2015187765 A JP 2015187765A JP 2014064474 A JP2014064474 A JP 2014064474A JP 2014064474 A JP2014064474 A JP 2014064474A JP 2015187765 A JP2015187765 A JP 2015187765A
- Authority
- JP
- Japan
- Prior art keywords
- field
- character
- setting
- field definition
- definition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Character Input (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【解決手段】帳票画像上のフィールド内の各文字を文字認識するためにフィールドの構造を定義したフィールド定義を帳票フォーマット情報として帳票辞書データベースに登録するために、複数の帳票画像が帳票の種類別に分類されたクラスの中から登録対象とするクラスを選択する工程と、選択したクラスに属する帳票画像の一つを表示部に表示する工程と、表示部に表示した帳票画像上で文字認識対象とする部分領域をフィールドとして設定する工程と、フィールド内の各文字を文字認識するためのフィールド定義を設定する工程と、選択したクラスに属する複数の帳票画像を対象として、先に設定したフィールド定義に基づく文字認識処理を行うことによりフィールド定義の確認テストを実行する工程と、確認テストで得られた文字認識結果を表示部に表示する工程とを実行する。
【選択図】 図2
Description
11 クラスタリング処理部
12 帳票画像処理部
13 帳票判別情報設定部
14 フィールド定義設定部
15 帳票種類判別部
16 文字認識部
17 設定確認テスト部
18 帳票フォーマット登録部
20 記憶部
21 未登録帳票画像データ
22 クラス別帳票画像データ
23 帳票判別情報データ
24 フィールド定義テンプレートデータ
25 フィールド定義データ
26 文字認識用データ
27 帳票辞書データベース
30 表示部
40 操作部
Claims (12)
- 帳票画像上のフィールド内の各文字を文字認識するために前記フィールドの構造を定義したフィールド定義を、帳票フォーマット情報として帳票辞書データベースに登録する帳票フォーマット情報登録方法であって、
複数の帳票画像が帳票の種類別に分類されたクラスの中から登録対象とするクラスを選択するクラス選択工程と、
選択したクラスに属する帳票画像の一つを表示部に表示する帳票画像表示工程と、
前記表示部に表示した帳票画像上で文字認識対象とする部分領域をフィールドとして設定するフィールド設定工程と、
前記フィールド設定工程で設定した前記フィールド内の各文字を文字認識するためのフィールド定義を設定するフィールド定義設定工程と、
選択したクラスに属する複数の帳票画像を対象として、前記フィールド設定工程で設定したフィールドに前記フィールド定義設定工程で設定したフィールド定義を適用して前記フィールド内の文字を文字認識することにより前記フィールド定義に係る確認テストを実行する確認テスト工程と、
前記確認テスト工程で得られた文字認識結果に関する情報を前記表示部に表示する結果表示工程と
を含んだことを特徴とする帳票フォーマット情報登録方法。 - 前記フィールド定義設定工程は、
前記フィールド設定工程で設定した前記フィールドに、フィールド定義テンプレートとして予め準備された複数種類のフィールド定義のそれぞれを適用して、前記フィールド内の文字を文字認識する工程と、
各フィールド定義テンプレートによる文字認識結果に基づいて、前記フィールドに適用可能なフィールド定義テンプレートを選択する工程と、
選択した前記フィールド定義テンプレートによるフィールド定義を前記フィールドに適用するフィールド定義として設定する工程と
を含んだことを特徴とする請求項1に記載の帳票フォーマット情報登録方法。 - 前記フィールド定義設定工程は、
選択したクラスに属する複数の帳票画像の間で前記フィールド内の文字及び罫線を形成する各画素位置を比較して、所定割合以上のフィールドで共通する位置にない画素は文字を形成する画素であると判定して消去することにより、文字を含まず罫線のみを含む未記入フィールド画像を生成する工程と、
前記未記入フィールド画像に含まれる罫線の特徴に基づいて前記フィールドのフィールド定義を設定する工程と
を含んだことを特徴とする請求項1又は2に記載の帳票フォーマット情報登録方法。 - 前記フィールド定義設定工程は、
前記フィールド設定工程で設定した前記フィールドの画像と、前記フィールド定義設定工程で設定したフィールド定義とを前記表示部に表示する工程と、
前記表示部に表示された前記フィールド定義の修正を指示する操作を受け付けて前記フィールド定義を修正する工程と
を含んだことを特徴とする請求項1、2又は3に記載の帳票フォーマット情報登録方法。 - 前記フィールド設定工程は、
前記表示部に表示した帳票画像上で前記部分領域を含む範囲が指定された場合に、該範囲内の一番外側で連続した罫線から成る矩形枠を検出してフィールドとして認識する工程と、
前記表示部に表示した帳票画像上で前記部分領域に含まれる位置が指定された場合に、指定された前記位置を囲う罫線から成る一番小さい矩形枠を検出すると共に、横方向に連続して前記矩形枠と同じ大きさの矩形枠がある場合には該矩形枠を文字枠であると認識して、横方向に連続する複数の文字枠から成る領域をフィールドとして認識する工程と
を含んだことを特徴とする請求項1〜4のいずれか1項に記載の帳票フォーマット情報登録方法。 - 前記フィールド設定工程は、
前記表示部に表示した帳票画像上で指定された範囲内に文字列が含まれている場合、又は前記帳票画像上で指定された位置が文字列の部分である場合には、前記文字列の文字の全てを含む領域をフィールドとして認識する工程
を含んだことを特徴とする請求項1〜5のいずれか1項に記載の帳票フォーマット情報登録方法。 - 前記結果表示工程では、前記確認テスト工程で文字認識処理の対象とされた帳票画像の数と、前記確認テスト工程で前記フィールド内の文字を文字認識できた帳票画像の数との割合を確認可能な情報が表示されることを特徴とする請求項1〜6のいずれか1項に記載の帳票フォーマット情報登録方法。
- 前記帳票画像表示工程では、選択されたクラスに属する全ての帳票画像の特徴量の平均値に最も近い特徴量を有する帳票画像である代表画像が前記表示部に表示されることを特徴とする請求項1〜7のいずれか1項に記載の帳票フォーマット情報登録方法。
- 前記確認テスト工程で文字認識処理の対象とする帳票画像の数は、予め設定された上限値以下に制限されることを特徴とする請求項1〜8のいずれか1項に記載の帳票フォーマット情報登録方法。
- 前記表示部に表示した帳票画像上で帳票の種類判別に利用する部分領域を指定する領域指定工程と、
前記領域指定工程で指定した前記部分領域内の文字を文字認識して得られた文字を判別文字とする判別文字取得工程と、
選択したクラスに属する複数の帳票画像を対象として、前記領域指定工程で指定した部分領域の文字認識を行って前記判別文字が得られることを確認すると共に、前記帳票辞書データベースに登録済みのクラスの中に同じ部分領域から同じ判別文字が得られるクラスが存在しないことを確認する判別テスト工程と、
前記判別テスト工程で得られた結果を前記表示部に表示する判別結果表示工程と
を含んだことを特徴とする請求項1〜9のいずれか1項に記載の帳票フォーマット情報登録方法。 - 帳票画像上のフィールド内の各文字を文字認識するために前記フィールドの構造を定義したフィールド定義を、帳票フォーマット情報として帳票辞書データベースに登録する帳票フォーマット情報登録システムであって、
複数の帳票画像が帳票の種類別に分類されたクラスの中から登録対象とするクラスに属する帳票画像の一つを表示するための表示部と、
前記表示部に表示された帳票画像上で文字認識対象とする部分領域を指定する操作を受けて前記部分領域をフィールドとして設定すると共に、設定したフィールド内の各文字を文字認識するためのフィールド定義を設定するフィールド定義設定部と、
登録対象とする前記クラスに属する複数の帳票画像を対象として、前記フィールド定義設定部で設定された前記フィールドに前記フィールド定義を適用して前記フィールド内の文字を文字認識することにより前記フィールド定義に係る確認テストを実行する設定確認テスト部と
を備えることを特徴とする帳票フォーマット情報登録システム。 - 帳票画像上のフィールド内の各文字を文字認識するために前記フィールドの構造を定義したフィールド定義を、帳票フォーマット情報として帳票辞書データベースに登録する帳票フォーマット情報登録プログラムであって、
複数の帳票画像が帳票の種類別に分類されたクラスの中から登録対象とするクラスを選択するクラス選択ステップと、
選択したクラスに属する帳票画像の一つを表示部に表示する帳票画像表示ステップと、
前記表示部に表示した帳票画像上で文字認識対象とする部分領域をフィールドとして設定するフィールド設定ステップと、
前記フィールド設定ステップで設定した前記フィールド内の各文字を文字認識するためのフィールド定義を設定するフィールド定義設定ステップと、
選択したクラスに属する複数の帳票画像を対象として、前記フィールド設定ステップで設定したフィールドに前記フィールド定義設定ステップで設定した前記フィールド定義を適用して前記フィールド内の文字を文字認識することにより前記フィールド定義に係る確認テストを実行する確認テストステップと、
前記確認テストステップで得られた文字認識結果に関する情報を前記表示部に表示する結果表示ステップと
をコンピュータに実行させることを特徴とする帳票フォーマット情報登録プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014064474A JP6302317B2 (ja) | 2014-03-26 | 2014-03-26 | 帳票フォーマット情報登録方法及びシステム並びにプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014064474A JP6302317B2 (ja) | 2014-03-26 | 2014-03-26 | 帳票フォーマット情報登録方法及びシステム並びにプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015187765A true JP2015187765A (ja) | 2015-10-29 |
JP6302317B2 JP6302317B2 (ja) | 2018-03-28 |
Family
ID=54429980
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014064474A Active JP6302317B2 (ja) | 2014-03-26 | 2014-03-26 | 帳票フォーマット情報登録方法及びシステム並びにプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6302317B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019095858A (ja) * | 2017-11-17 | 2019-06-20 | グローリー株式会社 | 帳票画像処理装置、帳票画像処理システム、帳票画像処理方法およびプログラム |
JP2020177335A (ja) * | 2019-04-16 | 2020-10-29 | 株式会社ネットショップ支援室 | 受注処理システム、受注処理方法、及びプログラム |
JP2022186026A (ja) * | 2021-06-04 | 2022-12-15 | AI inside株式会社 | プログラム、情報処理装置及び方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0962781A (ja) * | 1995-08-28 | 1997-03-07 | Oki Electric Ind Co Ltd | 光学式文字読取装置 |
JPH1196291A (ja) * | 1997-09-19 | 1999-04-09 | Aibikkusu Kk | 文字認識装置、その文字認識方法およびその記録媒体 |
JP2003208565A (ja) * | 2002-01-11 | 2003-07-25 | Glory Ltd | 帳票登録支援方法および装置並びにプログラム |
JP2007323474A (ja) * | 2006-06-02 | 2007-12-13 | Nec Corp | Ocrシステム、ocrフォーマットパラメータ作成方法、そのプログラムおよびプログラム記録媒体 |
-
2014
- 2014-03-26 JP JP2014064474A patent/JP6302317B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0962781A (ja) * | 1995-08-28 | 1997-03-07 | Oki Electric Ind Co Ltd | 光学式文字読取装置 |
JPH1196291A (ja) * | 1997-09-19 | 1999-04-09 | Aibikkusu Kk | 文字認識装置、その文字認識方法およびその記録媒体 |
JP2003208565A (ja) * | 2002-01-11 | 2003-07-25 | Glory Ltd | 帳票登録支援方法および装置並びにプログラム |
JP2007323474A (ja) * | 2006-06-02 | 2007-12-13 | Nec Corp | Ocrシステム、ocrフォーマットパラメータ作成方法、そのプログラムおよびプログラム記録媒体 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019095858A (ja) * | 2017-11-17 | 2019-06-20 | グローリー株式会社 | 帳票画像処理装置、帳票画像処理システム、帳票画像処理方法およびプログラム |
JP2020177335A (ja) * | 2019-04-16 | 2020-10-29 | 株式会社ネットショップ支援室 | 受注処理システム、受注処理方法、及びプログラム |
JP2022186026A (ja) * | 2021-06-04 | 2022-12-15 | AI inside株式会社 | プログラム、情報処理装置及び方法 |
Also Published As
Publication number | Publication date |
---|---|
JP6302317B2 (ja) | 2018-03-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6528147B2 (ja) | 会計データ入力支援システム、方法およびプログラム | |
KR101122854B1 (ko) | 스캔된 문서들로부터 전자 서식들을 채우기 위한 방법 및장치 | |
US8666174B2 (en) | Techniques for shape clustering and assignment of character codes in post optical character recognition processing | |
US7697758B2 (en) | Shape clustering and cluster-level manual identification in post optical character recognition processing | |
US7650035B2 (en) | Optical character recognition based on shape clustering and multiple optical character recognition processes | |
US7646921B2 (en) | High resolution replication of document based on shape clustering | |
US20140067631A1 (en) | Systems and Methods for Processing Structured Data from a Document Image | |
US6400845B1 (en) | System and method for data extraction from digital images | |
US8144986B2 (en) | Method and apparatus for binarization threshold calculation | |
CN102289667A (zh) | 对经历光学字符识别(ocr)过程的文本文档中出现的错误的用户纠正 | |
US20160379186A1 (en) | Element level confidence scoring of elements of a payment instrument for exceptions processing | |
US20210075919A1 (en) | Image processing apparatus, image processing system, image processing method, and storage medium | |
US20220415008A1 (en) | Image box filtering for optical character recognition | |
JP6302317B2 (ja) | 帳票フォーマット情報登録方法及びシステム並びにプログラム | |
US20180174324A1 (en) | Image processing apparatus for clipping and sorting images from read image according to cards and control method therefor | |
CN113378839A (zh) | 信息处理装置、信息处理方法及计算机可读介质 | |
US10049350B2 (en) | Element level presentation of elements of a payment instrument for exceptions processing | |
EP2116971A2 (en) | Shape clustering in document image processing | |
US20220292857A1 (en) | Information processing apparatus, information processing method, and recording medium | |
CN110909723B (zh) | 信息处理装置及计算机可读存储介质 | |
US20220198190A1 (en) | Information processing apparatus and non-transitory computer readable medium | |
US20230273952A1 (en) | Image processing apparatus, image processing method, and storage medium | |
US20220198183A1 (en) | Information processing apparatus and non-transitory computer readable medium | |
TWI807467B (zh) | 要項偵測模型建立方法、業務導向要項鍵值辨識系統及方法 | |
US20200410043A1 (en) | Information processing apparatus and non-transitory computer readable medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170206 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180125 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180213 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180302 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6302317 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |