JP2010140402A - 帳票処理装置、及び方法 - Google Patents

帳票処理装置、及び方法 Download PDF

Info

Publication number
JP2010140402A
JP2010140402A JP2008318208A JP2008318208A JP2010140402A JP 2010140402 A JP2010140402 A JP 2010140402A JP 2008318208 A JP2008318208 A JP 2008318208A JP 2008318208 A JP2008318208 A JP 2008318208A JP 2010140402 A JP2010140402 A JP 2010140402A
Authority
JP
Japan
Prior art keywords
unit
information
label
position information
expression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008318208A
Other languages
English (en)
Inventor
Mitsuo Nunome
光生 布目
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2008318208A priority Critical patent/JP2010140402A/ja
Publication of JP2010140402A publication Critical patent/JP2010140402A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)

Abstract

【課題】人的・時間的なコストをかけることなく、帳票の部分領域の役割の不知に伴う帳票の処理誤りを削減することができる帳票処理装置、及び方法を提供する。
【解決手段】画像受付部100は、帳票の画像データを受け付け、検出部110は、画像データから、帳票上のフォームの位置情報、帳票上の切り取り線の位置情報、並びに帳票上の文字列及びその位置情報を検出し、取得部120は、文字列のうちキーワードとなるキー表現と、当該キー表現の属性を示すラベルを対応付けて記憶するキー表現記憶部42からラベルを取得し、判定部130は、キー表現の位置情報及び当該キー表現を包含するフォームの位置情報にラベルを対応付けた帳票情報を用いて、切り取り線で区分けされた帳票上の部分領域の各々の役割を判定し、出力部20は、判定部130の判定結果に基づいて、所定の役割の部分領域を識別可能な態様で出力する。
【選択図】 図1

Description

本発明は、帳票処理装置、及び方法に関する。
近年、郵政民営化やコンビニエンスストアなどのサービスの拡大、またIT化による郵政端末やPOS端末の高機能化に伴い、業種を問わず様々な窓口で納付書などの帳票が処理されている。この結果、ユーザ及びバックオフィスの双方に、多種多様な帳票を取り扱う必要性が生じるため、種々の処理誤りの発生が懸念されている。
このため、例えば特許文献1では、読み取られた帳票の所定項目に関する情報に一致する情報が、過去に読み取られた帳票のイメージデータと関連付けられて記憶部に記憶されているかを検索し、一致する情報が記憶部に記憶されている場合には、警告を発することで、帳票の2重処理を防止する技術が開示されている。
特開2006−260147号公報
ところで、帳票の多様化に伴って発生する処理誤りは2重処理に限られず、帳票の半券の渡し間違いなど帳票の部分領域の役割が分からないために発生する処理誤りもある。そして、このような処理誤りは、紙ファイル化されたマニュアルなどを参照することで回避が可能であるが、対応するページが直ぐに見つかるとは限らず、人的・時間的なコストがかかってしまうという問題がある。
本発明は、上記事情に鑑みてなされたものであり、人的・時間的なコストをかけることなく、帳票の部分領域の役割の不知に伴う帳票の処理誤りを削減することができる帳票処理装置、及び方法を提供することを目的とする。
上述した課題を解決し、目的を達成するために、本発明の一態様にかかる帳票処理装置は、帳票の画像データを受け付ける画像受付部と、前記画像データから、帳票上のフォームの位置情報、帳票上の切り取り線の位置情報、並びに帳票上の文字列及びその位置情報を検出する検出部と、前記文字列のうちキーワードとなるキー表現と、当該キー表現の属性を示すラベルを対応付けて記憶するキー表現記憶部から、前記ラベルを取得する取得部と、前記キー表現の位置情報及び当該キー表現を包含する前記フォームの位置情報に前記ラベルを対応付けた帳票情報を用いて、前記切り取り線で区分けされた帳票上の部分領域の各々の役割を判定する判定部と、前記判定部の判定結果に基づいて、所定の役割の前記部分領域を識別可能な態様で出力する出力部と、を備えることを特徴とする。
また、本発明の別の態様にかかる帳票処理方法は、画像受付部が、帳票の画像データを受け付ける画像受付ステップと、検出部が、前記画像データから、帳票上のフォームの位置情報、帳票上の切り取り線の位置情報、並びに帳票上の文字列及びその位置情報を検出する検出ステップと、取得部が、前記文字列のうちキーワードとなるキー表現と、当該キー表現の属性を示すラベルを対応付けて記憶するキー表現記憶部から、前記ラベルを取得する取得ステップと、判定部が、前記キー表現の位置情報及び当該キー表現を包含する前記フォームの位置情報に前記ラベルを対応付けた帳票情報を用いて、前記切り取り線で区分けされた帳票上の部分領域の各々の役割を判定する判定ステップと、出力部が、前記判定部の判定結果に基づいて、所定の役割の前記部分領域を識別可能な態様で出力する出力ステップと、を含むことを特徴とする。
本発明では、画像データから検出したキー表現の位置情報及びキー表現を包含するフォームの位置情報にラベルを対応付けた帳票情報を用いて、切り取り線で区分けされた帳票上の部分領域の各々の役割を判定し、所定の役割の部分領域を識別可能な態様で出力する。従って本発明によれば、切り取り線で区分けされる帳票上の部分領域であって、所定の役割を有する部分領域を識別することができ、人的・時間的なコストをかけることなく、帳票の部分領域の役割の不知に伴う帳票の処理誤りを削減することができるという効果を奏する。
以下、添付図面を参照しながら、本発明にかかる帳票処理装置、及び方法の最良な実施の形態を詳細に説明する。
図1は、本実施の形態の帳票処理装置1の構成の一例を示すブロック図である。図1に示すように、帳票処理装置1は、画像読取部10と、出力部20と、記憶部40と、画像受付部100と、検出部110と、取得部120と、判定部130と、抽出部140と、検証部150と、検索部160と、更新部170と、出力制御部180とを備える。
画像読取部10は、帳票を読み取って、帳票の画像データを生成するものであり、例えば、スキャナなどの既存の画像読取装置や、書画カメラ、監視カメラ、又はデジタルカメラなどの既存の撮像装置により実現できる。
出力部20は、後述する出力制御部180の指示により、各種情報を出力するものであり、例えば、液晶ディスプレイなどの既存の表示装置により実現できる。
記憶部40は、帳票処理装置1で行われる各種処理に使用される情報を記憶するものであり、例えば、HDD(Hard Disk Drive)、光ディスク、メモリカード、RAM(Random Access Memory)などの既存の記憶媒体により実現できる。そして記憶部40は、キー表現記憶部42と、帳票事例データベース44と、マニュアル・処理事例データベース46とを含む。なお、キー表現記憶部42、帳票事例データベース44、及びマニュアル・処理事例データベース46の詳細については、後述する。
画像受付部100は、画像読取部10により読み取られた帳票の画像データを受け付ける。
検出部110は、画像受付部100により受け付けられた画像データから、帳票上のフォームの位置情報、帳票上の切り取り線の位置情報、並びに帳票上の文字列及びその位置情報を検出する。また検出部110は、ユーザが帳票を記入中に帳票の画像データを生成した場合には、帳票上のペン先の位置情報も検出する。そして検出部110は、レイアウト情報検出部112と、文字列検出部114とを含む。
レイアウト情報検出部112は、画像受付部100により受け付けられた画像データの罫線情報に基づいて、フォーム(矩形)領域、切り取り線領域、及び文字領域などのレイアウト情報を検出する。なお、これらの領域(位置情報)は、既存の画像処理技術により実現することができる。
文字列検出部114は、レイアウト情報検出部112により検出された文字領域から、文字列を検出する。なお、文字列の検出は、OCR(Optical Character Reader)技術など既存の文字認識技術により実現することができる。
キー表現記憶部42は、キー表現と、当該キー表現の属性を示すラベルを対応付けたキー表現リストを記憶する。図2は、キー表現記憶部42に記憶されているキー表現リストの一例を示す図である。図2に示す例では、キー表現リストは、キー表現のラベルID、キー表現のラベル、キー表現のインスタンスid、及びキー表現のインスタンスを対応付けた情報となっている。なお、キー表現のラベルには、例えば、店舗控え、顧客控え、お客様控え、受領証、領収証、氏名、電話番号、会員番号などキー表現の属性を設定することができる。
取得部120は、キー表現記憶部42からラベルを取得する。そして取得部120は、取得したラベルを、文字列検出部114により検出された文字列のうちキーワードとなるキー表現の位置情報及び当該キー表現を包含するフォーム(矩形)の位置情報に対応付け、帳票情報を生成する。
具体的には、取得部120は、文字列検出部114により検出された文字列のうち、キー表現記憶部42に記憶されているキー表現のインスタンスと一致する文字列に対応付けられたラベルを取得する。
例えば、図2に示すキー表現リストがキー表現記憶部42に記憶されており、文字列検出部114により「納入済通知書」という文字列が検出されたものとする。この場合、取得部120は、「納入済通知書」という文字列(キー表現)に一致するインスタンスに対応付けられた「店舗」というラベルを取得する。
そして取得部120は、取得した「店舗」というラベルを、「納入済通知書」という文字列(キー表現)の位置情報及び当該文字列を包含する最小のフォームに対応付け、帳票情報を生成する。
図3は、帳票の一例を示す図であり、図4は、図3に示す帳票の帳票情報の一例を示す図である。図3及び図4に示す例では、破断境界線[1]が、切り取り線202の情報を示しており、破断境界線[2]が、切り取り線204の情報を示している。また、キー表現[1]が、文字列206の情報を示しており、キー表現[2]が、文字列208の情報を示しており、キー表現[3]が、文字列210の情報を示しており、キー表現[4]が、文字列212の情報を示しており、キー表現[5]が、文字列214の情報を示している。また、領域[n]が、フォーム216の情報を示しており、領域[n+1]が、フォーム218の情報を示している。なお、フォーム216は、インスタンスと一致する文字列である「加入者名」(図2参照)を含む最小のフォームであるため、ラベルが対応付けられている。
図5は、帳票の一例を示す図であり、図6は、図5に示す帳票の帳票情報の一例を示す図である。図5及び図6に示す例では、破断境界線[1]が、切り取り線230の情報を示しており、破断境界線[2]が、切り取り線232の情報を示している。また、キー表現[1]が、文字列234の情報を示しており、領域[m]が、フォーム236の情報を示しており、領域[m+1]が、フォーム238の情報を示している。
判定部130は、帳票情報を用いて、切り取り線で区分けされた帳票上の部分領域の各々の役割を判定する。そして判定部130は、照合部132と、推定部134とを含む。
照合部132は、帳票の事例及び過去に処理された帳票の少なくとも一方であって、当該帳票上のキー表現の位置情報及びフォームの位置情報にラベルを対応付けた帳票事例情報を記憶する帳票事例データベース44に対し、帳票情報に類似する帳票事例情報が記憶されているか否かを照合する。
具体的には、照合部132は、帳票情報をベクトル化して(数式(1)参照)、帳票事例データベース44に記憶されている帳票事例情報のモデルと照合する。そして照合部132は、モデルとの差分・距離を算出し、帳票情報と類似する帳票事例情報を決定する。
Figure 2010140402
なお、数式(1)の第1変数Bordersは、切り取り線の本数及びその位置情報を示す変数である。第2変数Keysは、帳票情報に格納されたキー表現のインスタンスidを示す変数である。第3変数Rectanglesは、帳票情報に格納されたキー表現のラベルID及び当該ラベルIDが示すラベルに対応付けられたフォームの位置情報を示す変数である。
図7は、図3に示す帳票情報をベクトル化したベクトル化表現の一例を示す図である。図7に示す例では、第1変数Bordersは、切り取り線が、切り取り線202、204の2本であること、及び各切り取り線のx座標を示している。また、第2変数Keysは、帳票情報に格納されたキー表現[1]〜[5]などのインスタンスidを示している。また、第3変数Rectanglesは、領域[n]のラベルID及び当該ラベルIDが示すラベルに対応付けられたフォーム216の位置情報を示している。
図8は、帳票事例データベース44に記憶されている帳票事例情報のモデルの一例を示す図である。図8に示すように、帳票事例データベース44には、帳票事例情報をベクトル化したモデルが記憶されている。
また照合部132は、帳票情報と類似すると照合された帳票事例情報を帳票事例データベース44から取得する。そして、判定部130は、取得された帳票事例情報を用いて、部分領域の各々及びフォームの各々の役割を判定する。例えば判定部130は、部分領域が顧客控えであるのか店舗控えであるのかを判定したり、実際に窓口で切り取る切り取り線を判定したり、ラベルが対応付けられていないフォームに記入すべき内容などを判定する。なお、帳票事例情報には、部分領域やフォームの位置情報、部分領域とラベルとの対応関係、フォームとラベルとの対応関係、実際に窓口で切り取る切り取り線の情報などが示されている。
図9は、帳票事例情報で図4に示す帳票情報を更新した後の帳票情報の一例を示す図である。図9に示す例では、フォーム218の情報を示す矩形領域[n+1]にラベルが対応付けられ、切り取り線の切り取り有無情報などが追加されている。
図10は、帳票事例情報で図6に示す帳票情報を更新した後の帳票情報の一例を示す図である。図10に示す例では、フォーム236の情報を示す矩形領域[m]及びフォーム238の情報を示す矩形領域[m+1]にラベルが対応付けられ、切り取り線の切り取り有無情報などが追加されている。
推定部134は、照合部132により帳票情報に類似する帳票事例情報が照合されない場合に、キー表現を包含しないフォームの位置情報にラベルを推定して対応付け、この対応付け結果で帳票情報を更新する。そして、判定部130は、更新された帳票情報を用いて、部分領域の各々及び前記フォームの各々の役割を判定する。
抽出部140は、文字列検出部114により検出された文字列から固有名詞などの固有表現を抽出する。なお、固有表現の抽出は、品詞並びをルールベースや統計量から判定するなどの既存の手法により実現でき、固有表現として抽出された文字列に、例えば、人名、地名、組織名、数値表現(郵便番号、電話番号、金額表現、割合表現)などの品詞を対応付ける。
図11は、図5に示す帳票の文字列から固有表現を抽出した抽出結果の一例を示す図である。図11に示す例では、「山田太郎」に対して「人名」という品詞が対応付けられ、「京都府」、「宇治市」に対しては、「地名」という品詞が対応付けられている。
検証部150は、抽出部140により抽出された固有表現を包含するフォームに対応付けられたラベルを用いて、フォームと固有表現との整合性を検証する。具体的には、検証部150は、抽出部140により抽出された固有表現に対応づけられた品詞と、当該固有表現が記載されたフォームのラベルとを対比して、フォームと固有表現との整合性を検証する。
例えば図10及び図11に示す例では、位置情報を参照することで、「山田太郎」及び「京都市」という固有表現は領域[m](図5に示すフォーム236)に記載されていることが判別できる。このため検証部150は、「山田太郎」、「京都市」にそれぞれ対応付けられた「人名」、「地名」という品詞と、フォーム236に対応付けられた「氏名」、「払込人」というラベルを対比し、整合性がとれていると判断する。
また検証部150は、領域[m+1](図5に示すフォーム238)にも「氏名」、「払込人」というラベルが対応付けられているため、フォーム238にも「人名」、「地名」という品詞が対応付けられた固有表現が記載されているか否かを検証する。そして、検証部150は、位置情報を参照することで、フォーム238には、「人名」、「地名」という品詞がそれぞれ対応付けられた「山田太郎」、「宇治市」という固有表現が記載されていることが判別できるため、整合性がとれていると判断する。
検索部160は、帳票情報に含まれる情報、及び判定部130の判定結果の少なくとも一方を用いて、帳票に関する情報を検索する。具体的には、検索部160は、帳票のタイトルを示す文字列やラベルをクエリとして生成する。そして検索部160は、生成したクエリを用いて、マニュアルや処理事例が記憶されたマニュアル・処理事例データベース46やWeb60から帳票に関する情報を検索する。
また検索部160は、検出部110がペン先の位置情報を検出している場合には、当該ペン先の位置を含むフォーム及び、当該フォームのラベルをクエリとして生成し、マニュアルや処理事例を検索する。
なお、クエリは、これらの情報をキーワードとして羅列しても良いが、マニュアルが帳票別や項目別で検索可能なように、構造化してマニュアル・処理事例データベース46に記憶されている場合には、これらの個々の情報を、マニュアルの対応する項目の絞り込み情報として利用して検索してもよい。
また検索部160は、フォームに対応付けられたラベルが「振込先」である場合、当該フォームに記載された文字列のうち、「人名」、「地名」、「組織名」、「企業名」などの品詞が対応付けられた固有表現を用いて、Web検索を行う。そして、消費者相談センターや、一般のオークションサイトなどを参照して、注意喚起情報や被害報告などを検索する。
更新部170は、帳票情報、判定部130の判定結果、及び検証部150の検証結果の少なくともいずれかで、帳票事例データベース44に記憶されている帳票事例情報を更新する。
出力制御部180は、判定部130の判定結果に基づいて、所定の役割の部分領域を識別可能な態様で出力部20に出力させる。例えば出力制御部180は、出力部20を液晶ディスプレイで実現する場合には、実際に窓口で切り取る切り取り線、即ち、顧客控えの部分領域と店舗控えの部分領域とを区分けする切り取り線を強調表示して出力部20に表示させる。
また出力制御部180は、検索部160の検索結果を、帳票、部分領域、及びフォームの少なくともいずれかに対応付けて出力部20に出力させる。例えば出力制御部180は、出力部20を液晶ディスプレイで実現する場合には、関連するマニュアルや処理事例情報、注意喚起情報などを、帳票、部分領域、及びフォームの少なくともいずれかに対応付けて出力部20に表示させる。
また出力制御部180は、検証部150の検証結果をフォームに対応付けて更に出力部20に出力させる。例えば出力制御部180は、出力部20を液晶ディスプレイで実現する場合には、記載内容の矛盾や不整合が生じたフォームに対応付けて、その旨出力部20に表示させる。
例えば図12に示す例では、出力制御部180は、切り取り線232を、破線250で強調し、部分領域252がお客様控えであることを識別可能に出力部20に表示させている。また出力制御部180は、記入上の注意情報254、256などを出力部20に表示させている。
なお、出力制御部180は、顧客控えの部分領域と店舗控えの部分領域とをアニメーションで出力部20に表示させたり、顧客控えの部分領域と店舗控えの部分領域とを区分けする切り取り線を点線や色線(例えば、赤線)などで出力部20に表示させるようにしてもよい。
次に、図13を参照しながら、本実施の形態の帳票処理装置の動作について説明する。図13は、帳票処理装置1で行われる全体の処理の流れの一例を示すフローチャートである。
まず、画像受付部100は、画像読取部10により読み取られた帳票の画像データを受け付ける(ステップS10)。
次に、レイアウト情報検出部112は、画像受付部100により受け付けられた画像データの罫線情報に基づいて、フォーム(矩形)領域、切り取り線領域、及び文字領域などのレイアウト情報を検出する(ステップS12)。
次に、文字列検出部114は、レイアウト情報検出部112により検出された文字領域から、文字列を検出する(ステップS14)。
次に、取得部120は、キー表現記憶部42からラベルを取得するラベル取得処理を行う(ステップS16)。なお、ラベル取得処理の詳細については後述する。
次に、照合部132は、帳票事例情報を記憶する帳票事例データベース44に対し、帳票情報に類似する帳票事例情報が記憶されているか否かを照合する(ステップS18)。そして、帳票情報に類似する帳票事例情報が照合された場合に(ステップS20でYes)、照合部132は、当該帳票事例情報を帳票事例データベース44から取得し、判定部130は、取得された帳票事例情報を用いて、部分領域の各々及びフォームの各々の役割を判定する。
一方、照合部132により帳票情報に類似する帳票事例情報が照合されなかった場合には(ステップS20でNo)、推定部134は、キー表現を包含しないフォームの位置情報にラベルを推定して対応付ける役割推定処理(ステップS22)。を行う。そして、推定部134は、この対応付け結果で帳票情報を更新し、判定部130は、更新された帳票情報を用いて、部分領域の各々及び前記フォームの各々の役割を判定する。なお、役割推定処理の詳細については後述する。
次に、抽出部140は、文字列検出部114により検出された文字列から固有表現を抽出し、固有表現として抽出された文字列に品詞を対応付ける(ステップS24)。
次に、検証部150は、抽出部140により抽出された固有表現を包含するフォームに対応付けられたラベルを用いて、フォームと固有表現との整合性を検証する整合性検証処理を行う(ステップS26)。なお、整合性検証処理の詳細については後述する。
次に、検索部160は、帳票情報に含まれる情報、及び判定部130の判定結果の少なくとも一方を用いて、マニュアル・処理事例データベース46やWeb60から帳票に関する関連情報を検索する(ステップS28)。
次に、出力制御部180は、判定部130の判定結果に基づいて、帳票の画像データとともに、所定の役割の部分領域を識別可能な態様で示すアラートを出力部20に出力させる(ステップS30)。
次に、図14を参照しながら、図13のステップS16に示すラベル取得処理について説明する。図14は、ラベル取得処理の一例を示すフローチャートである。
まず、取得部120は、文字列検出部114により検出された文字列を、キー表現記憶部42に記憶されているキー表現リストと照合する(ステップS100)。
次に、取得部120は、検出された文字列がキー表現のインスタンスに存在する(検出された文字列がキー表現である)場合には(ステップS102でYes)、当該インスタンスに対応付けられたラベルを取得して、キー表現の位置情報及び当該キー表現を包含するフォームの位置情報に対応付け、帳票情報として登録する(ステップS104)。
一方、取得部120は、検出された文字列がキー表現のインスタンスに存在しない場合には(ステップS102でNo)、ステップS104の処理を行わない。
そして、取得部120は、文字列検出部114により検出された全ての文字列を照合するまで(ステップS106でYes)、ステップS100〜ステップS104の処理を継続し、全ての文字列を照合すると(ステップS106でNo)、処理を終了する。
次に、図15を参照しながら、図13のステップS22に示す役割推定処理について説明する。図15は、役割推定処理の一例を示すフローチャートである。
まず、推定部134は、帳票情報の中にキー表現が存在しているか否かを確認する(ステップS200)。
そして、推定部134は、キー表現が存在している場合には(ステップS200でYes)、キー表現を含む最小の矩形(フォーム)を検出する(ステップS202)。
次に、推定部134は、検出した矩形の辺のうち、切り取り線と重なっているものがあるか否かを確認する(ステップS204)。そして、切り取り線と重なっているものがある場合には(ステップS204でYes)、推定部134は、キー表現のインスタンスに対応付けられたラベルを、検出した矩形に対応付け、帳票情報として登録する(ステップS212)。
一方、切り取り線と重なっているものがない場合には(ステップS204でNo)、推定部134は、続いて、他の矩形と辺を共有しているか否かを判定する共有判定処理を行う(ステップS206)。なお、共有判定処理の詳細については後述する。
そして、共有判定処理の結果、辺を共有している他の矩形にラベルを設定できる場合には(ステップS208でYes)、推定部134は、キー表現のインスタンスに対応付けられたラベルを当該矩形に対応付け、帳票情報として登録する(ステップS212)。
一方、辺を共有している他の矩形にラベルを設定できない場合(辺を共有している他の矩形が存在しない場合を含む)には(ステップS208でNo)、推定部134は、検出された矩形を包含する最小の矩形を更に検出する(ステップS210)。
そして、ステップS210で検出した矩形が帳票全体と一致するまで(ステップS214でNo)、ステップS204〜ステップS210の処理を繰り返す。
次に、ステップS210で検出した矩形が帳票全体と一致した場合(ステップS214でYes)や、ステップS200でキー表現が存在しない場合には(ステップS200でNo)には、デフォルトルールを適用して、暫定候補を付与したり、判定不能としてマーキングする(ステップS216)。なお、マーキングがされている場合には、出力制御部180にその旨を出力部20に表示させ、ユーザからのフィードバックを獲得して、更新部170に帳票事例データベース44に記憶されている帳票事例情報を更新させるようにしてもよい。
そして、推定部134は、帳票情報の中の全てのキー表現をチェックするまで(ステップS218でNo)、ステップS202〜ステップS216の処理を継続し、全てのキー表現をチェックすると(ステップS218でYes)、処理を終了する。
次に、図16を参照しながら、図15のステップS206に示す共有判定処理について説明する。図16は、共有判定処理の一例を示すフローチャートである。
まず、推定部134は、検出された矩形(フォーム)の右辺を共有する矩形があるか否かを確認する(ステップS300)。例えば図17に示す例では、検出された矩形が、矩形300である場合、矩形310が右辺を共有する矩形となる。
そして、右辺を共有する矩形がある場合には(ステップS300でYes)、推定部134は、当該矩形にラベルが設定されているか否かを確認し(ステップS302)、ラベルが設定されていない場合には(ステップS302でNo)、処理を終了する。
一方、右辺を共有する矩形がない場合や(ステップS300でNo)、右辺を共有する矩形にラベルが設定されている場合には(ステップS302でYes)、推定部134は、続いて、検出された矩形の下辺を共有する矩形があるか否かを確認する(ステップS304)。例えば図17に示す例では、検出された矩形が、矩形300である場合、矩形320が下辺を共有する矩形となる。
そして、下辺を共有する矩形がある場合には(ステップS304でYes)、推定部134は、当該矩形にラベルが設定されているか否かを確認し(ステップS306)、ラベルが設定されていない場合には(ステップS306でNo)、処理を終了する。
一方、下辺を共有する矩形がない場合や(ステップS304でNo)、下辺を共有する矩形にラベルが設定されていない場合には(ステップS306でYes)、推定部134は、続いて、検出された矩形の左辺を共有する矩形があるか否かを確認する(ステップS308)。例えば図17に示す例では、検出された矩形が、矩形300である場合、矩形330が左辺を共有する矩形となる。
そして、左辺を共有する矩形がある場合には(ステップS308でYes)、推定部134は、当該矩形にラベルが設定されているか否かを確認し(ステップS310)、ラベルが設定されていない場合には(ステップS310でNo)、処理を終了する。
一方、左辺を共有する矩形がない場合や(ステップS308でNo)、下辺を共有する矩形にラベルが設定されている場合には(ステップS310でYes)、推定部134は、続いて、検出された矩形の上辺を共有する矩形があるか否かを確認する(ステップS312)。例えば図17に示す例では、検出された矩形が、矩形300である場合、矩形340が上辺を共有する矩形となる。
そして、上辺を共有する矩形がある場合には(ステップS312でYes)、推定部134は、当該矩形にラベルが設定されているか否かを確認し(ステップS314)、ラベルが設定されていない場合には(ステップS314でNo)、処理を終了する。
一方、上辺を共有する矩形がない場合や(ステップS312でNo)、下辺を共有する矩形にラベルが設定されている場合には(ステップS314でYes)、辺を共有している他の矩形にラベルを設定できないとして、処理を終了する。
なお、一般的な帳票では、項目が記載されたフォームの右側のフォーム、下側のフォームに内容を記載させるケースが多いため、本実施の形態では、右、下、左、上の順番でラベルを設定できるか否かを確認している。
次に、図18を参照しながら、図13のステップS26に示す整合性検証処理について説明する。図18は、整合性検証処理の一例を示すフローチャートである。
まず、検証部150は、抽出部140により固有表現が抽出されたか否かを確認する(ステップS400)。そして、固有表現が抽出されている場合には(ステップS400でYes)、検証部150は、当該固有表現が記載された矩形のラベルを読み出す(ステップS402)。なお検証部150は、固有表現が抽出されていない場合には(ステップS400でNo)、処理を終了する。
次に、検証部150は、固有表現に対応づけられた品詞と、読み出されたラベルとが対応しているか否かを検証する(ステップS404)。そして、固有表現に対応づけられた品詞と、読み出されたラベルとが対応していない場合には(ステップS404でNo)、検証部150は、その旨をユーザに出力するためのアラートを設定する(ステップS406)。なお、固有表現に対応づけられた品詞と、読み出されたラベルとが対応している場合には(ステップS404でYes)、検証部150は、ステップS406の処理を行わない。
次に、検証部150は、読み出されたラベルと同一のラベルが対応付けられた矩形に、同一の品詞が対応付けられた固有表現が記載されているか否かを検証する(ステップS408)。そして、同一の品詞が対応付けられた固有表現が記載されていない場合には(ステップS408でNo)、検証部150は、その旨をユーザに出力するためのアラートを設定する(ステップS410)。なお、同一の品詞が対応付けられた固有表現が記載されている場合には、(ステップS408でYes)、検証部150は、ステップS410の処理を行わない。
そして、検証部150は、抽出部140により抽出された全ての固有表現をチェックするまで(ステップS412でNo)、ステップS402〜ステップS410の処理を繰り替えし、全ての固有表現をチェックすると(ステップS412でYes)、処理を終了する。
以上のように、本実施の形態では、画像データから検出したキー表現の位置情報及びキー表現を包含するフォームの位置情報にラベルを対応付けた帳票情報を用いて、切り取り線で区分けされた帳票上の部分領域の各々の役割を判定し、所定の役割の部分領域を識別可能な態様で出力する。従って本実施の形態によれば、切り取り線で区分けされる帳票上の部分領域であって、所定の役割を有する部分領域を識別することができ、人的・時間的なコストをかけることなく、帳票の部分領域の役割の不知に伴う帳票の処理誤りを削減することができるという効果を奏する。
また本実施の形態では、ラベルなど帳票情報に含まれる情報をクエリとして、マニュアルや処理事例を検索しているので、記入すべき内容や領域に応じて、記入上の注意をポップアップで表示したり、関連するマニュアルや記入例などを表示することができる。
また本実施の形態では、固有表現に対応づけられた品詞と、当該固有表現が記載されたフォームのラベルとを対比して、フォームと固有表現との整合性を検証するため、帳票の領域と記載内容との対応付けや、連票間の記載組み合わせとして、不備や矛盾があればアラートを出力することができる。
従って本実施の形態では、店舗の窓口担当者の手を煩わせることなく、客への確認を促すことができ、また、ユーザは、記入ミスによる作業の後戻りや、控えの受領ミスによるトラブル、不適切な振込先への納付を回避することができる。
また本実施の形態では、フォームに対応付けられたラベルが「振込先」である場合、当該フォームに記載された文字列のうち、「人名」、「地名」、「組織名」、「企業名」などの品詞が対応付けられた固有表現を用いて、Web検索を行い、注意喚起情報や被害報告などを検索する。従って本実施の形態では、振込み詐欺などの犯罪対策としての効果も期待できる。
また本実施の形態では、処理誤りの多かった事例や新規の帳票事例を蓄積できるので、サービス品質の向上を図ることができる。
なお本実施の形態では、帳票処理装置1がキー表現記憶部42、帳票事例データベース44、及びマニュアル・処理事例データベース46を備えるようにしたが、図示せぬサーバなどが備えるようにしてもよい。このようにすると、複数の帳票処理装置で帳票事例情報やマニュアル・処理事例を共有することができる。
なお本実施の形態の帳票処理装置1は、CPU(Central Processing Unit)などの制御装置、ROM(Read Only Memory)やRAM(Random Access Memory)などの記憶装置、
スキャナなどの画像読取装置、液晶ディスプレイなどの表示装置、ネットワークに接続して通信を行う通信I/F等を備えたハードウェア構成となっている。
本実施の形態の帳票処理装置の構成の一例を示すブロック図である。 本実施の形態のキー表現リストの一例を示す図である。 本実施の形態の帳票の一例を示す図である。 図3に示す帳票の帳票情報の一例を示す図である。 本実施の形態の帳票の一例を示す図である。 図5に示す帳票の帳票情報の一例を示す図である。 図3に示す帳票情報をベクトル化したベクトル化表現の一例を示す図である。 本実施の形態の帳票事例情報のモデルの一例を示す図である。 帳票事例情報で図4に示す帳票情報を更新した後の帳票情報の一例を示す図である。 帳票事例情報で図6に示す帳票情報を更新した後の帳票情報の一例を示す図である。 図5に示す帳票の文字列から固有表現を抽出した抽出結果の一例を示す図である。 本実施の形態の出力内容の一例を示す図である。 本実施の形態の帳票処理装置で行われる全体の処理の流れの一例を示すフローチャートである。 本実施の形態のラベル取得処理の一例を示すフローチャートである。 本実施の形態の役割推定処理の一例を示すフローチャートである。 本実施の形態の共有判定処理の一例を示すフローチャートである。 本実施の形態の共有判定処理の処理例の一例を説明するための図である。 本実施の形態の整合性検証処理の一例を示すフローチャートである。
符号の説明
1 帳票処理装置
10 画像読取部
20 出力部
40 記憶部
42 キー表現記憶部
44 帳票事例データベース
46 マニュアル・処理事例データベース
60 Web
100 画像受付部
110 検出部
112 レイアウト情報検出部
114 文字列検出部
120 取得部
130 判定部
132 照合部
134 推定部
140 抽出部
150 検証部
160 検索部
180 出力制御部
202、204 切り取り線
206、208、210、212、214 文字列
216、218 フォーム
230、232 切り取り線
234 文字列
236、238 フォーム
250 破線
252 部分領域
254、256 注意情報
300、310、320、330、340 矩形

Claims (7)

  1. 帳票の画像データを受け付ける画像受付部と、
    前記画像データから、帳票上のフォームの位置情報、帳票上の切り取り線の位置情報、並びに帳票上の文字列及びその位置情報を検出する検出部と、
    前記文字列のうちキーワードとなるキー表現と、当該キー表現の属性を示すラベルを対応付けて記憶するキー表現記憶部から、前記ラベルを取得する取得部と、
    前記キー表現の位置情報及び当該キー表現を包含する前記フォームの位置情報に前記ラベルを対応付けた帳票情報を用いて、前記切り取り線で区分けされた帳票上の部分領域の各々の役割を判定する判定部と、
    前記判定部の判定結果に基づいて、所定の役割の前記部分領域を識別可能な態様で出力する出力部と、を備えることを特徴とする帳票処理装置。
  2. 帳票の事例及び過去に処理された帳票の少なくとも一方であって、当該帳票上の前記キー表現の位置情報及び前記フォームの位置情報に前記ラベルを対応付けた帳票事例情報を記憶する帳票事例データベースに対し、前記帳票情報に類似する前記帳票事例情報が記憶されているか否かを照合する照合部を更に備え、
    前記判定部は、前記帳票情報に類似する前記帳票事例情報が照合された場合に、当該帳票事例情報を用いて、前記部分領域の各々及び前記フォームの各々の役割を判定することを特徴とする請求項1に記載の帳票処理装置。
  3. 前記帳票情報に類似する前記帳票事例情報が照合されない場合に、前記キー表現を包含しない前記フォームの位置情報に前記ラベルを推定して対応付ける推定部を更に備え、
    前記判定部は、前記推定部の対応付け結果で更新された前記帳票情報を用いて、前記部分領域の各々及び前記フォームの各々の役割を判定することを特徴とする請求項2に記載の帳票処理装置。
  4. 前記帳票情報に含まれる情報、及び前記判定部の判定結果の少なくとも一方を用いて、前記帳票に関する情報を検索する検索部を更に備え、
    前記出力部は、更に、前記検索部の検索結果を、前記帳票、前記部分領域、及び前記フォームの少なくともいずれかに対応付けて出力することを特徴とする請求項1〜3のいずれか1つに記載の帳票処理装置。
  5. 前記検出部により検出された前記文字列から固有表現を抽出する抽出部と、
    前記固有表現を包含する前記フォームに対応付けられた前記ラベルを用いて、前記フォームと前記固有表現との整合性を検証する検証部を更に備え、
    前記出力部は、更に、前記検証部の検証結果を前記フォームに対応付けて出力することを特徴とする請求項1〜4のいずれか1つに記載の帳票処理装置。
  6. 前記帳票情報及び前記判定部の判定結果で、前記帳票事例データベースに記憶されている前記帳票事例情報を更新する更新部を更に備えることを特徴とする請求項3に記載の帳票処理装置。
  7. 画像受付部が、帳票の画像データを受け付ける画像受付ステップと、
    検出部が、前記画像データから、帳票上のフォームの位置情報、帳票上の切り取り線の位置情報、並びに帳票上の文字列及びその位置情報を検出する検出ステップと、
    取得部が、前記文字列のうちキーワードとなるキー表現と、当該キー表現の属性を示すラベルを対応付けて記憶するキー表現記憶部から、前記ラベルを取得する取得ステップと、
    判定部が、前記キー表現の位置情報及び当該キー表現を包含する前記フォームの位置情報に前記ラベルを対応付けた帳票情報を用いて、前記切り取り線で区分けされた帳票上の部分領域の各々の役割を判定する判定ステップと、
    出力部が、前記判定部の判定結果に基づいて、所定の役割の前記部分領域を識別可能な態様で出力する出力ステップと、を含むことを特徴とする帳票処理方法。
JP2008318208A 2008-12-15 2008-12-15 帳票処理装置、及び方法 Pending JP2010140402A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008318208A JP2010140402A (ja) 2008-12-15 2008-12-15 帳票処理装置、及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008318208A JP2010140402A (ja) 2008-12-15 2008-12-15 帳票処理装置、及び方法

Publications (1)

Publication Number Publication Date
JP2010140402A true JP2010140402A (ja) 2010-06-24

Family

ID=42350472

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008318208A Pending JP2010140402A (ja) 2008-12-15 2008-12-15 帳票処理装置、及び方法

Country Status (1)

Country Link
JP (1) JP2010140402A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013097633A (ja) * 2011-11-02 2013-05-20 Hitachi Ltd 文書認識支援装置、文書検索装置及び文書管理方法
JP2017125677A (ja) * 2015-03-10 2017-07-20 パナソニックIpマネジメント株式会社 加熱調理器
JP2020013281A (ja) * 2018-07-17 2020-01-23 株式会社豆蔵 帳票情報処理装置、帳票情報構造化処理方法及び帳票情報構造化処理プログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013097633A (ja) * 2011-11-02 2013-05-20 Hitachi Ltd 文書認識支援装置、文書検索装置及び文書管理方法
JP2017125677A (ja) * 2015-03-10 2017-07-20 パナソニックIpマネジメント株式会社 加熱調理器
JP2020013281A (ja) * 2018-07-17 2020-01-23 株式会社豆蔵 帳票情報処理装置、帳票情報構造化処理方法及び帳票情報構造化処理プログラム
JP7122896B2 (ja) 2018-07-17 2022-08-22 株式会社豆蔵 帳票情報処理装置、帳票情報構造化処理方法及び帳票情報構造化処理プログラム

Similar Documents

Publication Publication Date Title
US11699158B1 (en) Reducing false positive fraud alerts for online financial transactions
CN110309182B (zh) 一种信息录入方法及装置
CN110785773B (zh) 票据识别系统
CN108153824B (zh) 目标用户群体的确定方法及装置
JP2016048444A (ja) 帳票識別プログラム、帳票識別装置、帳票識別システム、および帳票識別方法
US20190354919A1 (en) Methods and systems for automating package handling tasks through deep-learning based package label parsing
JP2015118488A (ja) 会計データ入力システム、方法、およびプログラム
KR102039989B1 (ko) 비정형 텍스트 이미지에서 텍스트 데이터를 추출하는 방법 및 장치
JP6743445B2 (ja) 携帯型情報装置およびプログラム
US11782972B2 (en) Information processing system, information code generating system, information processing method, and information code generating method
KR20080006422A (ko) 장표 인식 장치 및 장표 인식 프로그램
CN113039567A (zh) 自然语言处理系统
JP2007034549A (ja) 提案書設計管理システム
JP2010140402A (ja) 帳票処理装置、及び方法
JP4719164B2 (ja) 配送物受渡管理システム及び配送物受渡管理プログラム
JP6534255B2 (ja) 不正取引検知システム
JP2012141737A (ja) Faxocr装置およびfaxocrプログラム
JPH08221510A (ja) 帳票文書処理装置および帳票文書処理方法
CN108171589A (zh) 验证方法及装置
JP2006190093A (ja) Ocr為替集中処理システム
US20210334775A1 (en) Improved method and system for determining locations of point-of-sale terminals
KR101990072B1 (ko) 식별코드를 이용한 자필서명 검증 시스템 및 방법
JP2009182530A (ja) 業務処理遂行支援装置
JP6534256B2 (ja) 名寄せプログラム
JP2007299093A (ja) 文書管理システム