JP6193830B2 - 帳票認識装置、帳票認識方法、及び、プログラム - Google Patents
帳票認識装置、帳票認識方法、及び、プログラム Download PDFInfo
- Publication number
- JP6193830B2 JP6193830B2 JP2014190368A JP2014190368A JP6193830B2 JP 6193830 B2 JP6193830 B2 JP 6193830B2 JP 2014190368 A JP2014190368 A JP 2014190368A JP 2014190368 A JP2014190368 A JP 2014190368A JP 6193830 B2 JP6193830 B2 JP 6193830B2
- Authority
- JP
- Japan
- Prior art keywords
- item
- cell
- keyword
- character recognition
- mark
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Character Input (AREA)
Description
特許文献1の技術における定義レス帳票認識は、項目位置特定のヒントとなる「銀行名」などの見出しが存在し、認識項目が1:1になっている項目を対象としている(図1の(1))。
・選択式の帳票においても、受取人情報(銀行名、支店名、科目、口座番号)を通知することでオペレータ入力業務の効率化を図る、
・選択式の帳票においても振込先を一意に特定でき、手入力不要とする(効率化)、
・手入力不要とし、入力誤りを防止する(堅実性向上)、
・レイアウトの事前定義を不要として、帳票改訂時の見直し不要とする(即時効果)、
などを実現する技術が望まれている。
図2には、本実施形態の帳票認識装置の装置構成が示されている。
スキャナ制御部21は、スキャナ11を制御し、帳票の記載面をイメージとして取得する。文字認識処理部23は、帳票のイメージデータから、帳票記載面に記載されている文字を認識する。その際、帳票の記載者の手書きによる文字の認識には、手書き文字認識辞書26を使用し、帳票に印刷された文字の認識には、活字文字認識辞書27を使用する。この文字認識処理は、既存の技術を使用可能なので、以下の説明では、特に詳しくは説明しない。
キーワードテーブル28には、図4に示すように、項目位置特定に必要な見出しキーワードとしての見出し文字列と、認識項目の文字列として含まれる文字列の例としての補助見出し文字列が登録されている。補助見出し文字列に登録された文字列が、文字認識された結果、発見された場合は、その文字列に対応する認識項目が存在すると判定される。例えば、認識項目が「銀行名」については、認識文字列の属性として、漢字あるいはカタカナであって、文字数が2〜30文字の文字列であって、補助見出し文字列に含まれる文字列が存在するか否かを判定する。対応する文字列が存在すると判定された場合には、その文字列が存在する部分の項目は「銀行名」であると判断する。同様に、支店名、科目、口座番号、受取人などの項目を判断する。
図5の(a)のバリエーション1では、振込先銀行口座が複数記載され、振込先銀行・支店に対応する枠内に、預金科目、口座番号が記述されている。帳票の利用者は、自分が希望する銀行口座の欄に丸印などのマークを付けることで、使用する銀行口座の選択を行う。図5の(b)のバリエーション2では、振込先銀行・支店名、預金科目、口座番号は、異なる枠に記載されず、振込先銀行が記載された大きな枠内に列記されている。この場合、帳票の利用者は、大きな枠内の使用する銀行口座の記載の左側に丸印などのマークを付けることによって、使用する銀行口座を指定する。図5の(c)のバリエーション3は、各銀行口座は、異なる枠内に記載されているが、銀行・支店名、預金科目、口座番号は、1つの枠内に記載されている。この場合は、帳票の利用者は、銀行・支店名、預金科目、口座番号が記載されている枠の左側の枠内に、丸印などのマークを付けることにより、使用する銀行口座を指定する。図5の(d)のバリエーション4においては、銀行・支店名、預金科目、口座番号を記載した枠が、横に配列されている。帳票の利用者は、いずれかの枠内に丸印などのマークを付けることによって、使用する銀行口座を指定する。
図6A及び図6Bは、全体の処理の流れを説明する図である。
ステップS40において、「選択肢候補MAX」数分のループを行う。その際、初期値をx=1として、繰り返しごとに、xを1ずつインクリメントする。xが「選択肢候補MAX」より大きくなったら処理を終了する。
ステップS50において、「統合セルCnt」の値を「統合セルCnt2」に設定する。ステップS51において、統合セル数分のループを行う。すなわち、初期値をx=1として、繰り返しごとにxを1だけインクリメントし、xが「統合セルCnt」より大きくなったら処理を終了する。
・「銀行名と支店名」、「科目と口座番号」がセットで記載される。
・「銀行名」が「支店名」より先、「科目」が「口座番号」より先に記載される。
・「銀行名と支店名」が「科目と口座番号」より先に記載される。
・セル1型
・銀行支店1型、科目口座1型
・銀行支店1型、科目口座2型
・銀行支店2型、科目口座1型
・銀行支店2型、科目口座2型
パソコン10においては、CPU30、ROM31、RAM32、通信インタフェース33、記憶装置34、媒体ドライバ35、入出力装置37は、バス38で相互に接続される。
11 スキャナ
20 制御部
21 スキャナ制御部
22 項目位置特定部
23 文字認識処理部
24 認識結果表示部
25 選択式処理部
26 手書き文字認識辞書
27 活字文字認識辞書
28 キーワードテーブル
30 CPU
31 ROM
32 RAM
33 通信インタフェース
34 記憶装置
35 媒体ドライバ
36 可搬記録媒体
37 入出力装置
38 バス
Claims (7)
- 帳票をイメージとして読み込むスキャナ部と、
イメージとして読み込まれた前記帳票に対し文字認識処理を行う文字認識部と、
文字認識された結果から、キーワードを検出し、前記キーワードの配置から、前記帳票に記載された項目の位置を特定する項目位置特定部と、
前記項目の位置から、前記帳票に記載された項目が、いくつかの項目から1つを選択する形式の選択式となっているか否かを判断し、選択式の項目に対して、前記帳票のユーザがつけたマークが、選択式の項目のいずれを選択しているかを判定する選択式処理部と、
前記選択式の項目から前記ユーザが選択した内容の文字認識結果を表示する表示部と、
を備えることを特徴とする帳票認識装置。 - 前記マークを用いた前記ユーザの選択の検出は、前記マークが記載されているべき欄にある画素の数に基づいて検出する、ことを特徴とする請求項1に記載の帳票認識装置。
- 前記マークを用いた前記ユーザの選択の内容の検出は、前記帳票に印刷されている文字をイメージ内で見えなくなるような特定の色の光を前記帳票に照射し、特定の色の光を照射しても見えなくならない画素を検出することにより、マークの位置を特定することを含む、ことを特徴とする請求項1に記載の帳票認識装置。
- 少なくとも前記キーワードと前記キーワードが含まれる文字列が示す項目とを対応付けて記憶するキーワードテーブルを更に備える、ことを特徴とする請求項1に記載の帳票認識装置。
- 前記帳票は、前記帳票を使用する団体や個人が独自にレイアウトした私製帳票である、ことを特徴とする請求項1に記載の帳票認識装置。
- コンピュータに
帳票をスキャナでイメージとして読み込みさせ、
イメージとして読み込まれた前記帳票に対し文字認識処理を行わせ、
文字認識された結果から、キーワードを検出し、前記キーワードの配置から、前記帳票に記載された項目の位置を特定させ、
前記項目の位置から、前記帳票に記載された項目が、いくつかの項目から1つを選択する形式の選択式となっているか否かを判断させ、
選択式の項目に対して、前記帳票のユーザがつけたマークが、選択式の項目のいずれを選択しているかを判定させ、
前記選択式の項目から前記ユーザが選択した内容の文字認識結果を表示させる、
ことを特徴とする帳票認識方法。 - コンピュータに
帳票をスキャナでイメージとして読み込みさせ、
イメージとして読み込まれた前記帳票に対し文字認識処理を行わせ、
文字認識された結果から、キーワードを検出し、前記キーワードの配置から、前記帳票に記載された項目の位置を特定させ、
前記項目の位置から、前記帳票に記載された項目が、いくつかの項目から1つを選択する形式の選択式となっているか否かを判断させ、
選択式の項目に対して、前記帳票のユーザがつけたマークが、選択式の項目のいずれを選択しているかを判定させ、
前記選択式の項目から前記ユーザが選択した内容の文字認識結果を表示させる、
ことを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014190368A JP6193830B2 (ja) | 2014-09-18 | 2014-09-18 | 帳票認識装置、帳票認識方法、及び、プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014190368A JP6193830B2 (ja) | 2014-09-18 | 2014-09-18 | 帳票認識装置、帳票認識方法、及び、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016062347A JP2016062347A (ja) | 2016-04-25 |
JP6193830B2 true JP6193830B2 (ja) | 2017-09-06 |
Family
ID=55796052
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014190368A Active JP6193830B2 (ja) | 2014-09-18 | 2014-09-18 | 帳票認識装置、帳票認識方法、及び、プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6193830B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6638938B2 (ja) | 2016-03-25 | 2020-02-05 | 三菱日立パワーシステムズ株式会社 | 回転機械 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3422924B2 (ja) * | 1998-03-27 | 2003-07-07 | 富士通株式会社 | 文字認識装置、文字認識方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 |
JP2002259909A (ja) * | 2001-02-28 | 2002-09-13 | Oki Electric Ind Co Ltd | 文字読取装置 |
JP5018115B2 (ja) * | 2007-02-09 | 2012-09-05 | 沖電気工業株式会社 | 手書きマーク識別装置、および、手書きマーク識別プログラム |
JP5189056B2 (ja) * | 2009-09-30 | 2013-04-24 | 富士通フロンテック株式会社 | マーク項目認識装置、マーク項目認識方法及びマーク項目認識プログラム |
-
2014
- 2014-09-18 JP JP2014190368A patent/JP6193830B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2016062347A (ja) | 2016-04-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5402099B2 (ja) | 情報処理システム、情報処理装置、情報処理方法およびプログラム | |
JP4461769B2 (ja) | 文書検索・閲覧手法及び文書検索・閲覧装置 | |
JP2005173730A (ja) | 帳票ocrプログラム、方法及び装置 | |
JP2013089197A (ja) | 電子コミック編集装置、方法及びプログラム | |
TW200416583A (en) | Definition data generation method of account book voucher and processing device of account book voucher | |
JP2012190434A (ja) | 帳票定義装置、帳票定義方法、プログラム及び記録媒体 | |
JP2012234344A (ja) | 帳票上の文字を認識する文字認識装置、マスク処理方法、および、マスク処理プログラム | |
JP2013229011A (ja) | 帳票識別装置および帳票識別方法 | |
JP6193830B2 (ja) | 帳票認識装置、帳票認識方法、及び、プログラム | |
JP6432179B2 (ja) | 文書ファイル生成装置及び文書ファイル生成方法 | |
CN116311300A (zh) | 表格生成方法、装置、电子设备以及存储介质 | |
JP3898645B2 (ja) | 帳票書式編集装置および帳票書式編集プログラム | |
JP2021140831A (ja) | 帳票画像処理システム、帳票画像処理方法、および帳票画像処理プログラム | |
JP4347675B2 (ja) | 帳票ocrプログラム、方法及び装置 | |
JP2022090469A (ja) | 書式定義装置、書式定義方法、及びプログラム | |
CN113111881A (zh) | 信息处理装置及记录媒体 | |
JP6960646B1 (ja) | 読取システム、読取プログラムおよび読取方法 | |
JP6503850B2 (ja) | 範囲指定プログラム、範囲指定方法および範囲指定装置 | |
JP6994727B1 (ja) | 読取システム、読取プログラムおよび読取方法 | |
US11481544B2 (en) | Form processing apparatus and non-transitory computer readable medium | |
KR102673900B1 (ko) | 표 데이터 추출 시스템 및 그 방법 | |
JP2013182459A (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP5361315B2 (ja) | 情報処理装置及び情報処理方法 | |
JP7497620B2 (ja) | 文書データ生成装置、画像形成装置、及び文書データ生成プログラム | |
JP5176390B2 (ja) | 文字入力装置及びコンピュータプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160804 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170725 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170808 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170810 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6193830 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |