JP2016051339A - 帳票認識装置及び方法 - Google Patents
帳票認識装置及び方法 Download PDFInfo
- Publication number
- JP2016051339A JP2016051339A JP2014176400A JP2014176400A JP2016051339A JP 2016051339 A JP2016051339 A JP 2016051339A JP 2014176400 A JP2014176400 A JP 2014176400A JP 2014176400 A JP2014176400 A JP 2014176400A JP 2016051339 A JP2016051339 A JP 2016051339A
- Authority
- JP
- Japan
- Prior art keywords
- item value
- score
- item
- character string
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
【解決手段】帳票画像から検出され認識された文字列に対し、項目値表記スコアを計算した後、項目値候補ペアの配置関係に対し、異なる属性の項目値同士の配置関係としての妥当さを表す項目値候補配置スコアを計算し、更に、項目値候補スコアと項目値候補配置スコアの値に基づいて、異なる属性の項目値同士のペアとしての妥当さを表す項目値候補ペアスコアを計算することにより、項目値グループの項目値を決定する。
【選択図】図3
Description
画像入力部は、データの属性を表す文字列である項目名と、項目名に対するデータの文字列である項目値を含む帳票画像を入力する。
(2)項目値表記スコア計算部
項目値表記スコア計算部は、前記帳票画像から認識された、前記帳票画像内の文字列に対し、該文字列が項目値である確率を表す項目値表記スコアを計算する。
(3)項目値単語スコア計算部
項目値単語スコア計算部は、前記帳票画像内の文字列に対し、該文字列が予め登録された詳細な項目値を示す項目値単語である確率を表す項目値単語スコアを計算する。
(4)項目値候補選択部
項目値候補選択部は、前記項目値表記スコアと前記項目値単語スコアの両方を含むスコアを項目値スコア(Sv)とし、前記項目値スコアが予め定められた閾値より高い文字列を項目値候補として選択し、選択された項目値候補に対する項目値候補スコア(Sc)として前記項目値スコア(Sv)を与える。
(5)項目値候補配置スコア計算部
項目値候補配置スコア計算部は、前記帳票画像内の前記項目値候補の文字列ペアに対し、前記帳票画像内において互いに関係する複数の属性の項目値の組合せを項目値グループとした場合に、該文字列ペアの配置関係が各項目値グループの項目値として妥当であるか否かを表す項目値候補配置スコア(Sca)を計算する。
(6)項目値候補ペアスコア計算部
項目値候補ペアスコア計算部は、前記帳票画像内の項目値候補の文字列ペアに対し、前記項目値スコア(Sv)、前記項目値候補配置スコア(Sca)を基に、前記文字列ペアが前記項目値グループの項目値としての尤もらしさを表す評価値である項目値候補ペアスコア(Scp)を計算する。
(7)項目値グループ評価部
項目値グループ評価部は、前記項目値候補ペアスコア(Scp)により、前記帳票画像内の文字列と前記項目値グループとの対応付けを評価することで項目値の文字列を認識する。
(8)出力部
出力部は、前記帳票画像内の文字列の認識結果を出力する。認識結果の出力先には、記憶部も含まれる。
各実施形態に係る装置は、多種レイアウトが混在する帳票群から、それらの帳票定義を使用することなく、読取対象文字列の読取および当該文字列の属性の認識が可能な機能を備えている。また、各実施形態に係る装置は、読取対象とする項目名が記載されていない帳票が処理対象の場合でも、読取対象の項目名に対応する属性の認識が可能な機能も備えている。
(1)処理1
全ての文字列内の文字を識別し、文字の確からしさを表す文字スコアを計算する。
(2)処理2
項目値のうち、「XXX銀行」や「普通」などの単語で記載されるものについては、ユーザが事前に登録した項目値の単語リストである項目値単語辞書内の項目値単語と、帳票画像内の文字列とを照合し、項目値単語辞書内の全ての項目値単語と、帳票画像内の全文字列との組み合わせに対して、「項目値単語スコア」を計算する。
(3)処理3
項目値のうち、日付や、金額、口座番号などの汎用的に利用できる文法表記ルールによって記載されるものについては、ユーザが事前に文法表記ルールを定義した項目値表記辞書内の項目値表記と、帳票画像内の文字列とを照合し、項目値表記辞書内の全ての又は予め定められた項目値表記と、帳票画像内の全文字列との組み合わせに対して、「項目値表記スコア」を計算する。
(4)処理4
前記(2)と(3)の結果から、項目値単語辞書を定義した属性については項目値単語スコアを、項目値表記辞書を定義した属性については項目値表記スコアを「項目値候補スコア」とする。この値が閾値を超える文字列を「項目値候補」とする。
(5)処理5
2つの項目値の配置関係が項目値グループ内の文字列として妥当な配置関係であるかを評価するルールを用いて、属性の異なる2つの項目値候補の組み合わせからなる全ての項目値候補ペアに対して、「項目値候補配置スコア」を計算する。
(6)処理6
項目値単語スコア、項目値表記スコア、項目値候補配置スコアを基に、全ての項目値候補ペアに対して、当該項目値候補ペアが項目値グループ内で妥当な関係にあるかを表す評価値を計算し、前記評価値を基に帳票画像内から項目値グループ内の各項目値に相当する文字列を抽出する。
(1)文字列検出部
文字列検出部は、前記帳票画像から文字列領域を検出する。
(2)文字列認識部
文字列認識部は、前記文字列領域の個々の文字を認識する。
(3)項目値表記スコア計算部
項目値表記スコア計算部は、帳票画像内の文字列に対し、当該文字列が項目値の表記である確率を表す項目値表記スコアを計算する。
(4)項目値単語スコア計算部
項目値単語スコア計算部は、帳票画像内の文字列に対し、当該文字列が項目値の単語である確率を表す項目値単語スコアを計算する。
(5)項目値候補選択部
項目値候補選択部は、項目値表記スコアと項目値単語スコアの両方を項目値スコアとし、項目値スコアが高い文字列を項目値候補として選択する。
(6)項目値候補配置スコア計算部
項目値候補配置スコア計算部は、帳票画像内の項目値候補の文字列ペアに対し、帳票内において互いに関係する複数の属性の項目値の組合せを項目値グループとした場合に、当該文字列ペアの配置関係が項目値グループの項目値として妥当であるか否かを表す項目値候補配置スコアを計算する。
(7)項目値候補ペアスコア計算部
項目値候補ペアスコア計算部は、帳票画像内の項目値候補の文字列ペアに対し、前記項目値スコア、項目値配置スコアを基に、当該文字列ペアが項目値グループの項目値としての尤もらしさを表す評価値を計算する。
(8)項目値グループ評価部
項目値グループ評価部は、前記項目値候補ペアスコアにより、帳票画像内の文字列と項目値グループとの対応付けを評価ことで項目値の文字列を決定する。
図2に、各実施形態に係る帳票認識装置のハードウェア構成例を示す。例えば帳票認識装置200は、操作部210と、表示部220と、画像入力部230と、記憶部240と、制御部250と、インターフェース(IF)260とを備えるコンピュータとして実現される。操作部210は、ユーザが数字や文字の入力操作を行う際に利用するキーボード、スキャンの開始を指示するためのボタン等を含む。表示部220は、入力画像や認識結果等を表示する液晶ディスプレイその他の表示装置である。画像入力部230は、フラットベッドスキャナ、オートシートフィーダ付きスキャナ、CCD(Charge Coupled Device)等の撮像素子を用いて画像を撮像するデジタルカメラ等である。もっとも、入力画像には、画像入力部230から取り込まれる画像データの他、記憶部240に記録されている画像データを用いても良い。記憶部240は、メモリやハードディスク装置等からなる記憶デバイスであり、画像入力部230から取り込まれた画像、各種内部処理用のプログラム、各種設定データを記憶する。また、記憶部240には、文字識別辞書、項目値単語辞書、項目値表記辞書等も記憶される。制御部250は、文字列の検出や認識、項目値グループの解析を行う帳票認識や装置全体の制御を行う。IF260は、他の装置とデータを入出力する。
以下、図3及び図4を用い、制御部250において実行される帳票認識処理1〜4の概要を説明する。
(帳票認識処理1)
図3(A)に、制御部250において実行される帳票認識処理1の概略を示す。
・ステップ305
制御部250は、画像入力部230を通じて帳票画像を入力する。
・ステップ310
制御部250は、入力された帳票画像から枠(セル)を検出する。
・ステップ315
制御部250は、帳票画像から文字列領域を検出する。文字列領域とは、ある1つの文字列を含む矩形領域である。ステップ310及び315の具体例には、例えば特開平11−53466号公報に記載の技術がある。当該技術では、帳票画像から縦と横の罫線を抽出した後、2本の罫線の交点を抽出し、更に、交点の形状と配置関係に基づいて矩形枠の四隅に相当する右上角、左上角、右下角、左下角を検出することにより帳票画像内から枠を検出し、更に、検出された枠の内外の文字列領域を検出する。
制御部250は、前記のステップ315で検出された文字列領域を個々の文字領域に分割し、個々の文字領域のパターンを、文字識別辞書を用いて識別する。この文字識別の具体例には、例えばF.Kimura et. al. “Modified quadratic discriminant functions and the application to chinese character recognition” IEEETransaction on Pattern Analysis and Machine Intelligence、 vol.9、 pp.149-153に記載の技術(改良型投影距離:MQDF)がある。当該技術では、大量の文字パターンを用いて文字識別辞書を作成する際にベイズの定理から導かれる距離尺度である識別関数を文字カテゴリ毎に導出し、入力された文字パターンを識別する際には、識別関数の出力する値に基づいて文字カテゴリに分類することで、個々の文字を識別する。
制御部250は、ステップ320において認識された文字列の認識結果毎に、項目値表記辞書と照合し、当該文字列が項目値表記辞書に登録された文字列の文法表記ルールとの一致度を表す項目値表記スコアを計算する。当該ステップの処理動作の詳細は後述する。
・ステップ330
制御部250は、ステップ320において認識された文字列の認識結果毎に、項目値単語辞書と照合し、当該文字列が項目値単語辞書に登録された単語である確率を表す項目値単語スコアを計算する。当該ステップの処理動作の詳細は後述する。なお、ステップ325とステップ330はどちらを先に実行しても構わない。
・ステップ335
制御部250は、ステップ325で計算された項目値表記スコアとステップ330で計算された項目値単語スコアが共に閾値を超えた文字列を項目値候補として選定する。当該ステップの処理動作の詳細は後述する。
制御部250は、ステップ335で選定された項目値候補に対し、互いに属性が異なる2つの項目値候補の配置関係の妥当さを表す項目値候補配置スコアを計算する。項目値候補配置スコアは、2つの文字列が属する枠の配置関係や、2つの文字列の配置関係に基づいて計算される。当該ステップの処理動作の詳細は後述する。
・ステップ345
制御部250は、ステップ325で計算された項目値表記スコア、ステップ330で計算された項目値単語スコア、ステップ340で計算された項目値候補配置スコアに基づいて、各スコアの数値から2つの項目値候補のペアが項目値グループの一部としての妥当さを表す項目値候補ペアスコアを計算する。項目値候補ペアスコアの計算には、例えば「項目値表記スコア」、「項目値単語スコア」、「項目値候補配置スコア」を代入することで評価値を出力する評価関数を用いる方法などがある。当該ステップの処理動作の詳細は後述する。
制御部250は、ステップ345で計算された評価値に基づいて、帳票画像内での項目値候補から項目値グループを構成する文字列を決定する。制御部250は、例えば、項目値グループを構成する全ての属性を満たす項目値候補ペアの組合せ(例えば「銀行−支店ペア」、「支店−口座種別ペア」、「口座種別−口座番号ペア」の組合せ)のうち、項目値候補ペアスコアの総和が最大となるものを選択する。もしくは、制御部250は、項目値候補ペアスコアがある閾値以上となる組合せを選択する。項目値候補ペアの組合せを決定することにより、文字列の認識結果および該文字列の属性が決定される。当該ステップの処理動作の詳細は後述する。
・ステップ355
制御部250は、ステップ345までの処理で求めた認識結果や途中結果を記憶部240に記憶し、表示部220、及び/又はIF260に出力する。なお、制御部250は、別のタイミングで認識結果や途中結果を記憶部240から読み出し、表示部220及び/又はIF260に出力してもよい。
図3(B)に、制御部250において実行される帳票認識処理2の概略を示す。なお、図3(B)には、図3(A)との共通部分に同一の符号を付して示している。前述した帳票認識処理1との違いは、項目値表記スコア計算処理(ステップ325)と項目値単語スコア計算処理(ステップ330)の間に、項目値キーワード検出処理(ステップ360)と項目値単語照合対象文字列選択処理(ステップ365)が追加されている点である。追加された2つの処理は、項目値単語照合の処理時間の削減を目的とする。例えば、銀行名の属性の項目値単語は非常に多いため、帳票中の全ての文字列に対して照合処理を行うと処理時間がかかる。これに対し、銀行名は「XXX銀行」、「AAA信用金庫」など、「銀行」や「信用金庫」などの属性に応じて記載されるキーワード(以降、「項目値キーワード」と記載する)が存在する。しかも、項目値キーワードの単語数は項目値単語よりも少ないため、まず項目値キーワードを検出して項目値単語が記載される領域を推定し、その領域内についてのみ項目値単語を照合する。
制御部250は、ステップ320において認識された各文字列の認識結果を、項目値キーワード辞書と照合し、当該文字列が項目値キーワード辞書に登録されたキーワード単語である確率を表す項目値キーワードスコアを計算し、スコアが閾値以上の文字列を項目値キーワードであると判定する。当該ステップの処理動作の詳細は後述する。
・ステップ365
制御部250は、ステップ360において項目値キーワードと判定された文字列の周囲の文字列を項目値単語照合の候補として選択する。選択方法には、項目値キーワードが照合された文字列を基準として、その基準文字列の上下左右方向で閾値以内の距離にある文字列を選択する方法、基準文字列を含む枠の上下左右方向に基準以内の枠内の文字列を選択する方法などがある。当該ステップの処理動作の詳細は後述する。
図4(A)に、制御部250において実行される帳票認識処理3の概要を示す。なお、図4(A)には、図3(A)及び(B)との共通部分に同一の符号を付して示している。前述した帳票認識処理2との違いは、項目名スコア処理(ステップ370)、項目名−項目値配置スコア計算処理(ステップ375)、項目名−項目値ペアスコア計算処理(ステップ380)、項目名−項目値ペア検出処理(ステップ385)が追加されている点と、ステップ335が項目値候補選択処理(ステップ390)に変更されている点である。これらの処理は、項目名が記載されている項目値の認識率を向上させることを目的としている。例えば帳票画像のノイズやかすれなどの悪影響により、文字列認識誤りが発生し、項目値表記スコアや項目値単語スコアが低い値になることがある。このような事象が発生した場合、前述したステップ335(項目値候補選択処理)では、項目値の文字列のスコアが低くなる場合や選択できない場合があり、結果的に、後段の処理で正しく項目値グループを決定できない可能性がある。
制御部250は、ステップ320で認識された各文字列の認識結果を、項目名となりうる単語のリストである「項目名辞書」と照合し、当該文字列が項目名辞書に登録された単語である確率を表す項目名スコアSnを計算する。当該ステップの具体例には、例えば特開2011−248609号公報に記載の技術を利用できる。当該ステップの処理動作の詳細は後述する。
・ステップ375
制御部250は、ステップ310で検出された枠の座標およびステップ315で検出された文字列領域の座標に基づいて、帳票画像内の文字列ペアをなす2つの文字列間の配置に対して、項目名−項目値関係としての妥当さを表す項目名―項目値配置スコアSaを計算する。例えば、項目名スコアSnと項目値単語スコアの両方を含むスコアを項目値スコアSvとし、当該項目値スコアを使用して項目名―項目値配置スコアSaを計算してもよい。この他、当該処理には、例えば特開2011−248609号公報に記載の技術を利用できる。当該ステップの処理動作の詳細は後述する。
制御部250は、ステップ370で計算した項目名スコアSnと、ステップ325で計算した項目値表記スコアと、ステップ330で計算した項目値単語スコアと、ステップ375で計算された項目名―項目値配置スコアSaに基づいて、各スコアの数値から2つの文字列の項目名−項目値関係の評価値である項目名−項目値ペアスコアSpを計算する。評価値の計算には、例えば「項目名スコア」、「項目値単語スコア」、「項目値表記スコア」、「項目名―項目値配置スコア」を代入することで評価値を出力する評価関数を用いる方法などがある。当該処理には、例えば特開2011−248609号公報に記載の技術を利用できる。当該ステップの処理動作の詳細は後述する。
・ステップ385
制御部250は、ステップ380で計算した項目名―項目値ペアスコアが閾値を超えた場合に、当該文字列の組合せを項目名と項目値のペアであると判定する。当該処理には、例えば特開2011−248609号公報に記載の技術を利用できる。当該ステップの処理動作の詳細は後述する。
・ステップ390
制御部250は、ステップ325で計算した項目値表記スコアと、ステップ330で計算した項目値単語スコアが閾値を超えた文字列、および、ステップ385で計算した項目名―項目値ペアスコアSpが閾値を超えた文字列ペアを項目値候補として選定する。当該処理の詳細は後述する。
図4(B)に、制御部250において実行される帳票認識処理4の概要を示す。なお、図4(B)には、図4(A)との共通部分に同一の符号を付して示している。前述した帳票認識処理3との違いは、ステップ360とステップ365の処理が削除されている点である。すなわち、本認識処理の場合、制御部250が、項目値キーワード検出による項目値単語照合の削減を実行しない点で相違する。ちなみに、帳票認識処理1(図3(A))との比較では、ステップ370、ステップ375、ステップ380、ステップ385、ステップ390が追加されている点で相違する。ここで、ステップ370、ステップ325、ステップ330、ステップ375、ステップ380は、いずれを先に実行してもかまわない。以上のように、本認識処理によれば、前述した帳票認識処理3に比して、照合処理を簡易化することができる。
以下では、前述した処理ステップのうち一部処理の詳細動作について説明する。なお、後述する処理機能は、図5に示す機能構成を有する制御部250において実行されるものとする。すなわち、制御部250は、枠検出部310Aと、文字列検出部315Aと、文字列認識部320Aと、項目名スコア計算部370Aと、項目値表記スコア計算部325Aと、項目値キーワード検出部360Aと、項目値単語照合対象文字列選択部365Aと、項目値単語スコア計算部330Aと、項目名―項目値配置スコア計算部375Aと、項目名―項目値ペアスコア計算部380Aと、項目名―項目値ペア検出部385Aと、項目値候補選択部335A(390A)と、項目値候補配置スコア計算部340Aと、項目値候補ペアスコア計算部345Aと、項目値グループ評価部350Aと、を有している。図5に示す個々の処理機能部は、前述の帳票認識処理3(図4(A))で実行される各処理に対応している。従って、帳票認識処理1、2、4を実行する制御部250では、これらの処理機能部のうち各処理で必要とされる処理機能部だけで構成すれば良い。
まず、制御部250(文字列認識部320A)は、ステップ315で抽出された文字列画像740に対し、ステップ700の文字切出し処理を実行する。この処理の実行により、制御部250は、1文字単位の切出し方の候補を全て検出してネットワークで表現した切出し仮説ネットワーク750を作成する。次に、制御部250は、ステップ710において、全ての切出し候補の文字パターンを文字識別する。文字識別結果は、確からしさに応じてスコア付けされた第1位から第N位(Nは任意の数)までの候補を持っている(候補文字ネットワーク760)。次の、ステップ720(文字列照合)は、ステップ370、ステップ325、ステップ360、ステップ330に相当する処理であり、制御部250は、ステップ760のネットワークに対して予め用意した文字列辞書730を照合して認識結果770を求める。文字列の照合とは、ネットワーク中の最適なパスを探索する問題とみなすことができる。このため、文字列照合スコアの計算方法として、例えば、文字列照合により求まった文字列パスの切出しパターンの文字識別スコアの平均値を文字列スコアとする方法が利用できる。なお、ネットワークを用いず、文字識別の前に切出し方を一意に決めてから文字識別と照合を行ってもよい。
次に、制御部250(項目名スコア計算部370A)の動作を、図8(A)及び図9(A)を用いて説明する。図8(A)は、項目名辞書の例であり、図9(A)は、項目名辞書を用いて文字列毎に計算された項目名スコアSnを示す項目名スコアテーブルの例である。制御部250は、帳票画像内の文字列と項目名辞書とを照合し、項目名スコアSnを計算する。項目名スコアの計算には、例えば特開2004−171316号公報に記載の技術を利用することができる。図9(A)は、図6に示す帳票画像内の文字列を処理対象として項目名スコアSnを計算することで得られる項目名スコアテーブルの例である。この項目名スコアテーブルの場合、制御部250は、帳票画像内のN個(本実施例の場合、N=29(S101〜S129))の文字列に対し、全ての項目名単語との照合を行い、項目名スコアを計算する。図6に示す帳票画像において、S128の「電話番号」が項目名文字列として検出されるのは、項目名辞書内の「口座番号」や「番号」の単語と照合しているためである。図9(A)の項目名スコアテーブルにおいて、S128の「電話番号」はS113の「口座番号」と比べて低いスコアとなっていることがわかる。同様に、S117の「口座名」も「口座番号」と照合した結果である。図10に抽出結果を示す。図10では、帳票画像内から項目名単語として抽出された「電話番号」、「口座名」、「口座番号」等を実線で囲んで示している。
次に、制御部250(項目値表記スコア計算部325A)の動作を、図8(B)及び図9(B)を用いて説明する。基本的な概念は、前述した項目名スコアの計算処理と同じである。図8(B)は、項目値表記辞書の例、図9(B)は、項目値表記スコアテーブルの例である。制御部250は、帳票画像内の文字列と項目値表記辞書を照合し、項目値表記スコアを計算する。項目値表記スコアの計算には、例えば、高橋他による「回帰的遷移ネットワークを用いた文字経路探索方式の開発」(電子情報通信学会技術研究報告 Vol.109 No.418 pp.141-146)に記載の技術を利用することができる。因みに、この技術は、個別文字の識別候補をノードと見立てた識別候補文字ネットワークと状態遷移ネットワークで表現した表記辞書のマッチングにより、状態遷移ネットワークから最適な文字列パスを選択し、文字列認識結果を取得する。項目値表記辞書の例として、例えば図8(B)の項目値表記辞書800に示すような文字列の表記ルールの正規表現がある。口座番号については、1桁から7桁の数字列の表記が登録されている。口座番号以外の項目値表記辞書の例としては、項目値表記辞書810に示す金額や日付などがある。図8(B)の表記辞書800を用いて、図6の帳票画像内の文字列に対して項目値表記スコアを計算すると、項目値表記スコアテーブルは図9(B)のようになる。図9(B)では、項目値表記辞書には口座番号の属性しか登録されていないため、銀行、支店、口座種別の属性は0となっている。図10に抽出結果を示す。図10では、帳票画像内から項目値表記文字列として抽出された「25年12月1日」、「10000円」等を破線で囲んで示している。
次に、制御部250(項目値キーワード検出部360A)の動作を、図8(C)を用いて説明する。基本的な概念は、前述した項目名スコアの計算処理と同じである。図8(C)は、項目値キーワード辞書の例である。制御部250は、帳票画像内の文字列と項目値キーワード辞書を照合し、項目値キーワードスコアを計算する。項目値キーワードの計算には、ステップ370と同様、特開2004−171316号公報に記載の技術を利用することができる。図8(C)の項目値キーワード辞書を用いて、図6の帳票画像内の文字列に対して項目値キーワードスコアを計算する。図10に抽出結果を示す。図10では、帳票画像内から項目値キーワード文字列として抽出された「銀行」、「支店」等を点線で囲んで示している。
次に、制御部250(項目値単語照合対象文字列選択部365A)の動作を、図11〜図14を用いて説明する。制御部250は、項目値グループの文字列は互いに近接した範囲に記載されているという前提(条件)に従い、抽出済みの項目名文字列1000(図10)、項目値表記文字列1010(図10)、項目値キーワード文字列1020(図10)を利用して、項目値単語照合処理の対象となる文字列を選択する。本例では、項目値表記文字列と項目値キーワード文字列のみを利用してこの処理を行うものとする。本例の場合、制御部250は、例えば図11(A)の表に示すように、照合単語を含む枠とその隣接枠との配置に従って設定した重みを用い、図11(B)の表に示すスコア計算を用いることにより実現できる。ここで、隣接する枠とは、枠の辺を共有する枠同士を指す。上側の隣接枠を図11(C)の例を用いて説明すると、枠C100の上側に隣接する枠はC101、同様にC102の上側隣接枠はC103〜C105、C106の上側隣接枠はC107からC109である。他の辺についても同様である。文字列のスコア(Sw)は、例えば数1や数2を利用することができる。
次に、制御部250(項目値単語スコア計算部330A)の動作を、図8(D)、図15、図16を用いて説明する。基本的な概念は、前記の項目名スコア計算と同じである。図8(D)は、項目値単語辞書の例であり、図15は、項目値スコアテーブルの例であり、図16は、項目値単語文字列の抽出結果の例である。制御部250は、先のステップ365で選択された文字列と項目値単語辞書を照合し、項目値単語スコアを計算する。項目値単語スコアの計算には、ステップ370と同様、特開2004−171316号公報に記載の技術を利用することができる。図8(D)に示す項目値単語辞書を用いて、図6の帳票画像内の文字列に対して項目値単語スコアを計算する場合、項目値スコアテーブルの例は図15のようになる。図15に示すテーブルには、ステップ325で計算された項目値表記スコアとステップ330で計算された項目値単語スコアが記録されている。なお、口座種別の属性については、ステップ360の項目値キーワード検出と同じ内容であるため、ステップ330では省略することができる。また、文字列選択を行わない図3(A)と図4(B)のステップ325では、帳票上の全ての文字列に対して照合処理を行う。
次に、制御部250(項目名―項目値配置スコア計算部375A)の動作を、図17を用いて説明する。制御部250は、2つの文字列間の配置関係を評価することにより、項目名と項目値のペアとして妥当な配置に高い項目名―項目値配置スコアSaを設定し、妥当でない配置に低い項目名−項目値配置スコアSaを設定する。制御部250は、項目名−項目値配置スコアSaを、2つの文字列が属する枠のサイズおよび配置関係、及び/又は、2つの文字列矩形のサイズおよび配置関係に基づいて計算する。項目名−項目値配置スコアSaの計算には、例えば特開2011−248609号公報に記載の技術を利用することができる。この技術では、例えば項目名−項目値配置スコアSaは、項目名−項目値配置スコアSaが取り得る値の最大値で初期化し、文字列ペアをなす2つの文字列の配置関係が項目名−項目値関係として非妥当であると判断できる配置パターンをペナルティルールとして定義し、初期値からペナルティルールによって得られたペナルティ値を減算した値として計算する。この処理を帳票画像内の全文字列ペアに対して実行する。
次に、制御部250(項目名−項目値ペアスコア計算部380A及び項目名−項目値ペア検出部385A)の動作を、図18を用いて説明する。これらの処理には、例えば特開2011−248609号公報に記載の技術を利用することができる。図18は、項目名−項目値ペア検出結果の例である。項目名−項目値ペアスコア計算では、制御部250は、例えば項目名スコア、項目値スコア(項目値表記スコアもしくは項目値単語スコア)、項目名−項目値配置スコアを入力とする評価関数によって計算する。Snを項目名スコア、Svを項目値スコア、Saを項目名−項目値配置スコアとしたときに、評価関数Sp(Sn、Sv、Sa)の例として、例えば数3、数4、数5に示すものがある。
Sp(Sn,Sv,Sa)=(Sn+Sv)Sa
[数4]
Sp(Sn,Sv,Sa)=Sn+Sv+Sa
[数5]
Sp(Sn,Sv,Sa)=Sa・√(Sn+Sv)
なお、評価関数は、数3、数4、数5に限るものではなく、項目名スコア、項目値スコア、項目名−項目値配置スコアの値から、2つの文字列が項目名−項目値関係にある確からしさを算出できる形式であれば、これに限らない。制御部250は、このような評価関数による項目名−項目値評価値計算を帳票画像内の全文字列ペアに対して行い、評価関数Spの値が閾値を超えたペアを項目名−項目値ペアとして検出する。図18では、「先方銀行」と「XXX銀行」のペアが銀行の属性として、「口座番号」と「1234567」のペアが口座番号の属性として、「電話番号」と「042−1234−5678」のペアが口座番号の属性として検出されている。
次に、制御部250(項目値候補選択部390A)の動作を、図19を用いて説明する。制御部250は、項目値候補として、ステップ325で求めた項目値表記スコアが閾値以上の項目値表記文字列、ステップ330で求めた項目値単語スコアが閾値以上の項目値単語文字列、およびステップ385で求めた項目名−項目値ペアスコアが閾値以上の項目名−項目値ペアを使用する。制御部250は、項目値候補スコアScとして、数6に示すように、項目値候補として選択した文字列に応じて、項目値単語スコア、項目値表記スコア、項目名−項目値ペアスコアのいずれかを選択する。
次に、制御部250(項目値候補配置スコア計算部340A)の動作を、図21及び図22を用いて説明する。制御部250は、互いに属性の異なる2つの項目値候補間の配置関係を評価することにより、項目値グループの項目値として妥当な配置に高い項目値候補配置スコア(Sca)を設定し、妥当でない配置に低い項目値候補配置スコアを設定する。ここでは、2つの文字列を含む枠の配置、もしくは文字列間の配置に応じてスコアを計算する。図21に、具体的な計算方式の一例を示す。図21には、4種類の配置スコアの計算方法を示している。ルール(1)は2つの文字列が異なる枠に含まれている場合である。ルール(2)は、2つの文字列が同じ枠内に含まれている場合である。ルール(3)は、一方が枠内、もう一方が枠外の場合である。ルール(4)は、2つの文字列とも枠外の場合である。
次に、制御部250(項目値候補ペアスコア計算部345A)の動作を、図23(B)と図24(A)を用いて説明する。制御部250は、互いに属性の異なる2つの項目値候補の文字列のペアに対して、項目値候補スコアScと項目値候補配置スコアScaを用いて項目値候補ペアスコアScpを計算する。2つの項目値候補の文字列(又は、文字列ペア)iと文字列(又は、文字列ペア)jとの間の項目値候補ペアスコアを求める評価関数Scp(文字列i,文字列j)の計算方法の一例としては、数7がある。
Scp(文字列i,文字列j)
=(Sc(文字列i)+Sc(文字列j))*Sca(文字列i,文字列j)
なお、ステップ385の項目名−項目値ペア検出の評価関数に数3から数5を用いたように、ステップ345の評価関数も数7に限定しない。
次に、制御部250(項目値グループ評価部350A)の動作を、図24(B)と図25を用いて説明する。制御部250は、ステップ345で計算した項目値候補ペアスコアを用いて、最適な文字列の組を決定する。決定方法の一例としては、図23(B)のネットワークにおいて全ての属性を満たすパスの中で項目値候補ペアスコアScpの総和が最大となるパスを選択することや、総和が閾値を超えるパスを選択することが挙げられる。最大値の代わりに平均値を用いることや、その他の評価基準を用いてもよい。また、本実施例ではネットワーク表現を用いているが、その他の方法で実現してもよい。
帳票認識処理2(図3(B))及び帳票認識処理3(図4(A))では、制御部250は、項目値キーワード検出処理(ステップ360)の後、項目値単語照合対象文字列選択処理(ステップ365)を実行し、さらに項目値単語スコア計算処理(ステップ330)を実行している。この場合、銀行と支店の照合を独立して行うため、実際にはない銀行と支店の組合せを求めることがある。この技術課題を解決するため、本実施形態では、項目値単語の照合にあらかじめ優先度を設定し、項目値単語の照合処理を複数の段階に分ける。一例として、優先度1を「銀行」、優先度2を「支店」、優先度3を「口座種別」とすることができる。
本実施形態は、項目値候補ペアスコアの算出(ステップ345)と項目値グループ評価処理(ステップ350)の後、項目値グループ内の項目値の配置に基づいて認識結果の確からしさを判定し、判定結果に応じて、先に求めた項目値候補ペアスコア等を修正した後、項目値グループ評価を再度実行する。項目値グループ評価までの方式は、帳票認識処理1〜5のいずれを使用してもよい。また、項目値候補間のスコアを求めることができるのであれば、帳票認識処理1〜5に限らない。
当該ステップ(項目値グループのレイアウト評価処理)において、制御部250は、ステップ3021(項目値配置の整列性評価処理)、ステップ3022(複数グループ間の配置規則性評価処理)、3023(同一属性の配置規則性評価処理)に示す3つの評価処理を実行する。もっとも、ステップ3020では、これら3つの評価処理の全てを実行しても1つのみ実行してもよい。
図31及び図32を用い、項目値配置の整列性評価処理の詳細を説明する。当該ステップにおいて、制御部250は、項目値グループ内の各項目について、グループ全体としての配置の妥当性を評価する。本ステップにおいて、制御部250は、例えば全ての項目値の文字列が横又は縦方向に整列していることや同一枠内に記載されていること等を評価する。
ステップ3100において、制御部250は、項目値グループ内の各項目値文字列が横方向に整列しているか否かを評価し、条件を満たしていれば整列性ありと判定する。制御部250は、例えば図28(A)のS202aからS202dの文字列は横方向に整列しているため、この条件を満たすと判定する。縦方向の整列性についても同様である。
当該ステップにおいて、制御部250は、項目値グループ内の各項目値文字列を含む枠が、横方向もしくは縦方向に整列しているか否かを評価する。枠の整列性の評価方法としては、例えば横方向であれば枠の上下端、縦方向であれば枠の左右端が揃っているか否かを評価する。
・ステップ3140
当該ステップにおいて、制御部250は、項目値グループ内の各項目値文字列が同一枠内に記載されているか否かを評価する。
当該ステップにおいて、制御部250は、項目値グループ内の項目値文字列が記載されている全ての枠が互いに隣接しているか否かを評価する。この評価は、グループとして纏まって表記されているか否かを評価するものである。枠同士が離れている場合には、誤った項目値を選択している可能性が高いためである。例えば図6において、「XXX銀行」「YYY支店」と「普通」の項目値文字列を含む枠は互いに隣接しており、「XXX銀行」「YYY支店」と「1234567」の項目値文字列を含む枠は互いに隣接している。一方、「YYY支店」の代わりに文字列S125中の「BBB支店」を含む項目値グループを選択した場合、「BBB支店」の枠は他の項目値文字列の枠と隣接していない。このように、項目値文字列を含む枠が互いに隣接関係にあるか否かを判定する。
当該ステップにおいて、制御部250は、項目値グループ内の全ての項目値文字列を含む外接矩形領域内に他の文字列が存在しないか否かを評価する。当該ステップも、ステップ3150と同様、グループとして纏まって表記されているか否かを評価する処理である。図32(C)に示すように、項目値文字列1から項目値文字列4を囲む外接矩形内に他の文字列が存在しない場合は整列性ありと判定する。図32(D)に示すように、外接矩形内に項目値グループとは関係のない文字列が存在する場合には整列性なしと判定する。ただし、図32(E)に示すように、項目値文字列の項目名に相当する文字列であれば整列性ありと判定する。
当該ステップにおいて、制御部250は、全ての項目値文字列の文字サイズが同じか否かを判定する。同じ項目値グループの文字列は同じサイズの文字で記載されることが多いためである。
・ステップ3022
次に、ステップ3020の第2ステップを説明する。当該ステップは、複数グループ間の配置の規則性を評価するステップである。以下では、図33〜図37を用いて説明する。当該ステップでは、2つの項目値グループを比較して配置の規則性の有無が判定される。この判定は、図28(A)に示すように、複数の項目値グループが列挙されている場合には、項目値文字列の配置が類似していることに基づく。
次に、ステップ3020の第3ステップを説明する。当該ステップは、同一属性の配置の規則性を評価するステップである。当該ステップは、2つの項目値グループを比較して同じ属性の項目値文字列間において、配置の規則性の有無を判定するものである。具体的には、同一属性の項目値文字列の位置関係が、全て同じか否かを判定する。
ここでは、図36(B)を用い、ステップ3030(レイアウトに基づくスコア修正処理)について説明する。このステップでは、ステップ3020において判定したパスの規則性に基づいて、ネットワークの項目値候補ペアスコアを修正する。この処理により、ステップ3040の項目値グループ再評価において、パスの再計算をする際に、規則性のあるパスが上位のスコア値となり、複数の項目値グループが列挙されている場合でも、上位のパスを選択することで答えを得ることができる。
ここでは、ステップ3040(項目値グループの再評価処理)について説明する。この処理は、ステップ3030でスコアを修正したネットワークを用いてパスを求める以外、ステップ350と同じである。さらに、ステップ3020の判定内容に基づいて、規則性があると判定されたパスに対してパススコアを増加させてもよい。
本実施形態では、帳票認識処理1〜帳票認識処理6のいずれかの画像処理装置200を利用した金融機関の営業店窓口に設置される営業店窓口端末装置について説明する。金融機関などでは、営業店窓口に設置された端末装置に接続されたスキャナによって、顧客が記入した取引帳票の画像を撮像し、得られた画像データを保存したり、画像データについて文字認識を行ったりしている。営業店窓口端末装置は、例えば操作部210と、表示部220と、スキャナなどの画像入力部230と、利用者との授受のための現金を取り扱う現金入出金部と、通帳に取引内容を印字する通帳プリンタ部と、レシートなどに印字するプリンタ部と、端末記憶部とこれらを制御する端末制御部とによって構成することができる。なお、端末制御部は図2の制御部250に対応し、端末記憶部は図2の記憶部240に対応する。
次に、表示部220に表示される表示画面の例について説明する。例えば図26は、ステップ350において、制御部250が、図24(B)、図25(A)、図25(B)で決定した項目値グループの認識結果を表示した例である。領域2600が帳票画像を表示する領域である。領域2610をはじめとする太い線で囲まれた文字列は、項目値として抽出された結果を表す。領域2620は項目値グループを表示する枠である。一例として、抽出された項目値を含む枠の外接矩形等で表現できる。領域2630は認識結果を表示する領域である。領域2640をはじめとする網掛け領域には項目値の属性が表示される。領域2650をはじめとする枠内には項目値の文字認識結果が表示される。文字認識結果が誤っている場合には、その項目値の文字認識結果表示領域を選択して文字を修正することも可能である。
本明細書において提案する発明は、前述した実施形態に限定されるものではなく、前述した以外にも様々な変形例が含まれる。例えば、上記した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。また、各実施例の構成の一部について、他の構成の追加・削除・置換をすることが可能である。
200…帳票認識装置、
210…操作部、
220…表示部、
230…画像入力部、
240…記憶部、
250…制御部、
260…インターフェース(IF)、
Sv…項目値スコア、
Sc…項目値候補スコア、
Sca…項目値候補配置スコア、
Scp…項目値候補ペアスコア、
Sn…項目名スコア、
Sa…項目名−項目値配置スコア、
Sp…項目名−項目値ペアスコア。
Claims (15)
- 帳票に記載された文字列を認識する帳票認識装置において、
データの属性を表す文字列である項目名と、前記項目名に対するデータの文字列である項目値を含む帳票画像を入力する画像入力部と、
前記帳票画像から認識された、前記帳票画像内の文字列に対し、該文字列が前記項目値である確率を表す項目値表記スコアを計算する項目値表記スコア計算部と、
前記帳票画像内の文字列に対し、該文字列が予め登録された詳細な項目値を示す項目値単語である確率を表す項目値単語スコアを計算する項目値単語スコア計算部と、
前記項目値表記スコアと前記項目値単語スコアの両方を含むスコアを項目値スコア(Sv)とし、前記項目値スコアが予め定められた閾値より高い文字列を項目値候補として選択し、選択された項目値候補に対する項目値候補スコア(Sc)として前記項目値スコア(Sv)を与える項目値候補選択部と、
前記帳票画像内の前記項目値候補の文字列ペアに対し、前記帳票画像内において互いに関係する複数の属性の項目値の組合せを項目値グループとした場合に、該文字列ペアの配置関係が各項目値グループの項目値として妥当であるか否かを表す項目値候補配置スコア(Sca)を計算する項目値候補配置スコア計算部と、
前記帳票画像内の項目値候補の文字列ペアに対し、前記項目値スコア(Sv)、前記項目値候補配置スコア(Sca)を基に、前記文字列ペアが前記項目値グループの項目値としての尤もらしさを表す評価値である項目値候補ペアスコア(Scp)を計算する項目値候補ペアスコア計算部と、
前記項目値候補ペアスコア(Scp)により、前記帳票画像内の文字列と前記項目値グループとの対応付けを評価することで項目値の文字列を認識する項目値グループ評価部と、
前記帳票画像内の文字列の認識結果を出力する出力部と
を有する帳票認識装置。 - 請求項1に記載の帳票認識装置において、
前記帳票画像内の文字列に対し、該文字列が項目値に比較的頻出する項目値キーワードである確率を表す項目値キーワードスコアを計算し、計算された前記項目値キーワードスコアが閾値より大きい文字列を項目値キーワードとして検出する項目値キーワード検出部と、
前記項目値表記スコアと前記項目値キーワードスコアを用いて、項目値の単語を検出する際の対象文字列を選択する項目値単語照合対象文字列選択部と
を更に有し、
前記項目値単語スコア計算部は、前記項目値単語照合対象文字列選択部で選択された文字列に対し、前記項目値単語スコアを計算する
ことを特徴とする帳票認識装置。 - 請求項2に記載の帳票認識装置において、
前記帳票画像内の文字列に対し、該文字列が項目名である確率を表す項目名スコア(Sn)を計算する項目名スコア計算部と、
前記項目名スコア(Sn)と前記項目値単語スコアの両方を含むスコアを前記項目値スコア(Sv)とし、前記帳票画像内の文字列ペアに対し、該文字列ペアの配置関係が項目名−項目値関係として妥当であるか否かを表す項目名―項目値配置スコア(Sa)を計算する項目名―項目値配置スコア計算部と、
前記項目名スコア(Sn)、前記項目値スコア(Sv)、前記項目名―項目値配置スコア(Sa)を基に、該文字列ペアの項目名−項目値としての尤もらしさを表す評価値である項目名−項目値ペアスコア(Sp)を計算する項目名−項目値ペアスコア計算部と、
前記項目名−項目値ペアスコア計算部の出力する前記項目名−項目値ペアスコア(Sp)により、前記帳票画像内での項目名−項目値関係の対応付けを決定する項目名−項目値ペア検出部と
を更に有し、
前記項目値候補選択部は、前記項目値スコア(Sv)が高い文字列と、前記項目名−項目値ペアスコア(Sp)が高い文字列のペアを項目値候補として選択する
ことを特徴とする帳票認識装置。 - 請求項1に記載の帳票認識装置において、
前記帳票画像内の文字列に対し、該文字列が項目名である確率を表す項目名スコア(Sn)を計算する項目名スコア計算部と、
前記項目名スコア(Sn)と前記項目値単語スコアの両方を含むスコアを前記項目値スコア(Sv)とし、前記帳票画像内の文字列ペアに対し、該文字列ペアの配置関係が項目名−項目値関係として妥当であるかを表す項目名―項目値配置スコア(Sa)を計算する項目名―項目値配置スコア計算部と、
前記項目名スコア(Sn)、前記項目値スコア(Sv)、前記項目名―項目値配置スコア(Sa)を基に、該文字列ペアの項目名−項目値としての尤もらしさを表す評価値である項目名−項目値ペアスコア(Sp)を計算する項目名−項目値ペアスコア計算部と、
前記項目名−項目値ペアスコア計算部の出力する前記項目名−項目値ペアスコア(Sp)により、前記帳票画像内での項目名−項目値関係の対応付けを決定する項目名−項目値ペア検出部と
を更に有し、
前記項目値候補選択部は、前記項目値スコア(Sv)が高い文字列と、前記項目名−項目値ペアスコア(Sp)が高い文字列のペアを項目値候補として選択する
ことを特徴とする帳票認識装置。 - 請求項1に記載の帳票認識装置において、
前記項目値候補ペアスコア計算部は、前記項目値候補スコア(Sc)が高い項目値候補の文字列をノードとし、項目値候補同士のリンクのスコアを前記項目値候補配置スコア(Sca)とするネットワークを作成し、前記項目値候補スコア(Sc)及び前記項目値候補配置スコア(Sca)により前記項目値候補ペアスコア(Scp)を計算し、
前記項目値グループ評価部は、前記ネットワーク内で2つの文字列間の前記項目値候補ペアスコア(Scp)が高いパスを選択することにより、前記帳票画像内の文字列と項目値グループとの対応付けを評価することで項目値の文字列を決定する
ことを特徴とする帳票認識装置。 - 請求項3に記載の帳票認識装置において、
項目名となりうる単語のリストである項目名辞書を更に有し、
前記項目名スコア計算部は、帳票画像内の文字列と前記項目名辞書を照合し、前記項目名スコア(Sn)を計算する
ことを特徴とする帳票認識装置。 - 請求項1に記載の帳票認識装置において、
文字列の数字又は記号の表記ルールのリストである項目値表記辞書を更に有し、
前記項目値表記スコア計算部は、帳票画像内の文字列と前記項目値表記辞書を照合し、前記項目値表記スコアを計算する
ことを特徴とする帳票認識装置。 - 請求項2に記載の帳票認識装置において、
属性に応じて記載されるキーワードである項目値キーワードのリストである項目値キーワード辞書を更に有し、
前記項目値キーワード検出部は、帳票画像内の文字列と前記項目値キーワード辞書との照合を行い、前記項目値キーワードスコアを計算する
ことを特徴とする帳票認識装置。 - 請求項2に記載の帳票認識装置において、
前記項目値単語照合対象文字列選択部は、項目値グループの文字列は互いに近接した範囲に記載されているという条件に従い、抽出済みの文字列を利用して項目値単語照合処理の対象となる文字列を選択する
ことを特徴とする帳票認識装置。 - 請求項1に記載の帳票認識装置において、
事前に登録した項目値の単語リストである項目値単語辞書を更に有し、
前記項目値単語スコア計算部は、選択された文字列と前記項目値単語辞書を照合し、前記項目値単語スコアを計算する
ことを特徴とする帳票認識装置。 - 請求項3に記載の帳票認識装置において、
前記項目名―項目値配置スコア計算部は、前記項目名―項目値配置スコア(Sa)を、該項目名―項目値配置スコアが取り得る値の最大値で初期化し、文字列ペアをなす2つの文字列の配置関係が項目名−項目値関係として非妥当であると判断できる配置パターンをペナルティルールとして定義し、初期値からペナルティルールによって得られたペナルティ値を減算した値として計算する
ことを特徴とする帳票認識装置。 - 請求項3に記載の帳票認識装置において、
前記項目値候補選択部は、項目値候補を、前記項目値表記スコアが閾値以上の項目値表記文字列、前記項目値単語スコアが閾値以上の項目値単語文字列、前記項目名―項目値ペアスコアが閾値以上の項目名―項目値ペアとし、項目値候補スコア(Sc)を、項目名―項目値ペアスコア、項目値単語スコア、項目値表記スコア、の順にいずれかを選択して求める
ことを特徴とする帳票認識装置。 - 請求項1に記載の帳票認識装置において、
事前に登録した項目値の単語リストである項目値単語辞書は、項目名にあらかじめ優先度が設定され、第1優先度の項目名の項目値ごとに第2優先度の項目名の項目値のリストを設け、
前記項目値単語スコア計算部は、優先度が設定された前記項目値単語辞書を参照して、優先度の順に項目値単語照合を行って各優先度の項目値の候補を絞る
ことを特徴とする帳票認識装置。 - 請求項1に記載の帳票認識装置において、
前記帳票画像から、前記帳票画像内の文字列や枠を抽出するレイアウト解析部と、
前記項目値グループ評価部による前記項目値候補ペアスコア(Scp)の前記評価の結果に基づいて検出された項目値グループを構成する文字列の配置関係を評価し、さらに、前記配置関係に基づいて、前記文字列の項目値候補としての確からしさのスコアを修正するスコア修正部と
を更に有し、
前記項目値候補配置スコア計算部は、修正された前記スコアに基づいて、該文字列の配置関係が各前記項目値グループの項目値として妥当であるか否かを評価する
ことを特徴とする帳票認識装置。 - 帳票に記載された文字列を制御部によって認識する帳票認識方法であって、
前記制御部が、データの属性を表す文字列である項目名と、項目名に対するデータの文字列を含む帳票画像を記憶部に入力する処理と、
前記制御部が、前記帳票画像から認識した文字列に対し、該文字列が項目値である確率を表す項目値表記スコアを計算する処理と、
前記制御部が、前記帳票画像から認識した文字列に対し、該文字列が予め登録された詳細な項目値を示す項目値単語である確率を表す項目値単語スコアを計算する処理と、
前記制御部が、前記項目値表記スコアと前記項目値単語スコアの両方を含むスコアを項目値スコア(Sv)とし、前記項目値スコアが予め定められた閾値より高い文字列を項目値候補として選択し、前記項目値スコア(Sv)を項目値候補スコア(Sc)とする処理と、
前記制御部が、前記帳票画像内の前記項目値候補の文字列ペアに対し、前記帳票画像内において互いに関係する複数の属性の項目値の組合せを項目値グループとした場合に、該文字列ペアの配置関係が各前記項目値グループの項目値として妥当であるかを表す項目値候補配置スコア(Sca)を計算する処理と、
前記制御部が、前記帳票画像内の項目値候補の文字列ペアに対し、前記項目値スコア(Sv)、前記項目値候補配置スコア(Sca)を基に、前記文字列ペアが前記項目値グループの項目値としての尤もらしさを表す評価値である項目値候補ペアスコア(Scp)を計算する処理と、
前記制御部が、前記項目値候補ペアスコア(Scp)により、前記帳票画像内の文字列と前記項目値グループとの対応付けを評価することで項目値の文字列を認識する処理と、
前記制御部が、前記帳票画像内の文字列の認識結果を出力する処理と
実行することを特徴とする帳票認識方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014176400A JP6406932B2 (ja) | 2014-08-29 | 2014-08-29 | 帳票認識装置及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014176400A JP6406932B2 (ja) | 2014-08-29 | 2014-08-29 | 帳票認識装置及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016051339A true JP2016051339A (ja) | 2016-04-11 |
JP6406932B2 JP6406932B2 (ja) | 2018-10-17 |
Family
ID=55658789
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014176400A Active JP6406932B2 (ja) | 2014-08-29 | 2014-08-29 | 帳票認識装置及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6406932B2 (ja) |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018036998A (ja) * | 2016-09-02 | 2018-03-08 | 株式会社アイリックコーポレーション | 保険証券画像解析システム、記載内容解析装置、携帯端末および携帯端末用のプログラム |
JP2018037017A (ja) * | 2016-09-02 | 2018-03-08 | 株式会社日立製作所 | 分析装置、分析方法、および分析プログラム |
JP2018128996A (ja) * | 2017-02-10 | 2018-08-16 | キヤノン株式会社 | 情報処理装置、制御方法、およびプログラム |
WO2019026147A1 (ja) * | 2017-07-31 | 2019-02-07 | 株式会社Pfu | 情報処理装置、情報処理システム、制御方法及び制御プログラム |
JP2019070955A (ja) * | 2017-10-10 | 2019-05-09 | 株式会社フロンティア・フィールド | 読取システム及び読取プログラム |
US11151373B2 (en) | 2018-07-20 | 2021-10-19 | Ricoh Company, Ltd. | Information processing apparatus and information processing method |
US11416674B2 (en) | 2018-07-20 | 2022-08-16 | Ricoh Company, Ltd. | Information processing apparatus, method of processing information and storage medium |
US11574490B2 (en) | 2019-08-21 | 2023-02-07 | Fujifilm Business Innovation Corp. | Information processing apparatus and non-transitory computer readable medium storing information processing program |
US11588945B2 (en) | 2020-06-29 | 2023-02-21 | Canon Kabushiki Kaisha | Data input support apparatus that displays a window with an item value display area, an overview image display area, and an enlarged image display area |
WO2023062798A1 (ja) * | 2021-10-14 | 2023-04-20 | 株式会社Pfu | 情報処理システム、項目値抽出方法、モデル生成方法及びプログラム |
US11804055B2 (en) | 2020-06-12 | 2023-10-31 | Ricoh Company, Ltd. | Information processing apparatus, information processing method, and information processing system |
US11875587B2 (en) | 2020-03-06 | 2024-01-16 | Ricoh Company, Ltd. | Information processing system, information processing method, and non-transitory recording medium |
US11887390B2 (en) | 2020-07-14 | 2024-01-30 | Ricoh Company, Ltd. | Information processing apparatus, information processing system, information processing method, and non-transitory recording medium |
US11941672B2 (en) | 2019-11-29 | 2024-03-26 | Ricoh Company, Ltd. | Information processing system, information processing method, and non-transitory recording medium |
JP7463675B2 (ja) | 2019-09-03 | 2024-04-09 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置、及び情報処理プログラム |
US11960949B2 (en) | 2020-12-09 | 2024-04-16 | Ricoh Company, Ltd. | Information processing apparatus, information processing system, and information processing method |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009169844A (ja) * | 2008-01-18 | 2009-07-30 | Hitachi Software Eng Co Ltd | 表認識方法及び表認識装置 |
JP2010140204A (ja) * | 2008-12-10 | 2010-06-24 | Sharp Corp | 文字認識装置、文字認識方法、文字認識プログラムおよび記録媒体 |
WO2011104754A1 (ja) * | 2010-02-24 | 2011-09-01 | 三菱電機株式会社 | 検索装置及び検索プログラム |
JP2011248609A (ja) * | 2010-05-26 | 2011-12-08 | Hitachi Omron Terminal Solutions Corp | 帳票認識装置および帳票認識方法 |
JP2015102938A (ja) * | 2013-11-22 | 2015-06-04 | 日立オムロンターミナルソリューションズ株式会社 | 帳票認識装置、帳票認識方法、及びプログラム |
-
2014
- 2014-08-29 JP JP2014176400A patent/JP6406932B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009169844A (ja) * | 2008-01-18 | 2009-07-30 | Hitachi Software Eng Co Ltd | 表認識方法及び表認識装置 |
JP2010140204A (ja) * | 2008-12-10 | 2010-06-24 | Sharp Corp | 文字認識装置、文字認識方法、文字認識プログラムおよび記録媒体 |
WO2011104754A1 (ja) * | 2010-02-24 | 2011-09-01 | 三菱電機株式会社 | 検索装置及び検索プログラム |
JP2011248609A (ja) * | 2010-05-26 | 2011-12-08 | Hitachi Omron Terminal Solutions Corp | 帳票認識装置および帳票認識方法 |
JP2015102938A (ja) * | 2013-11-22 | 2015-06-04 | 日立オムロンターミナルソリューションズ株式会社 | 帳票認識装置、帳票認識方法、及びプログラム |
Non-Patent Citations (1)
Title |
---|
関 峰伸 他: "多重仮説文書構造ネットワークを用いたデータ抽出方式の開発", FIT2013 第12回情報科学技術フォーラム 講演論文集, vol. 第2分冊, JPN6018005049, 20 August 2013 (2013-08-20), JP, pages 3 - 10, ISSN: 0003739898 * |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018037017A (ja) * | 2016-09-02 | 2018-03-08 | 株式会社日立製作所 | 分析装置、分析方法、および分析プログラム |
JP2018036998A (ja) * | 2016-09-02 | 2018-03-08 | 株式会社アイリックコーポレーション | 保険証券画像解析システム、記載内容解析装置、携帯端末および携帯端末用のプログラム |
JP2018128996A (ja) * | 2017-02-10 | 2018-08-16 | キヤノン株式会社 | 情報処理装置、制御方法、およびプログラム |
WO2019026147A1 (ja) * | 2017-07-31 | 2019-02-07 | 株式会社Pfu | 情報処理装置、情報処理システム、制御方法及び制御プログラム |
JP2019070955A (ja) * | 2017-10-10 | 2019-05-09 | 株式会社フロンティア・フィールド | 読取システム及び読取プログラム |
US11151373B2 (en) | 2018-07-20 | 2021-10-19 | Ricoh Company, Ltd. | Information processing apparatus and information processing method |
US11416674B2 (en) | 2018-07-20 | 2022-08-16 | Ricoh Company, Ltd. | Information processing apparatus, method of processing information and storage medium |
US11574490B2 (en) | 2019-08-21 | 2023-02-07 | Fujifilm Business Innovation Corp. | Information processing apparatus and non-transitory computer readable medium storing information processing program |
JP7463675B2 (ja) | 2019-09-03 | 2024-04-09 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置、及び情報処理プログラム |
US11941672B2 (en) | 2019-11-29 | 2024-03-26 | Ricoh Company, Ltd. | Information processing system, information processing method, and non-transitory recording medium |
US11875587B2 (en) | 2020-03-06 | 2024-01-16 | Ricoh Company, Ltd. | Information processing system, information processing method, and non-transitory recording medium |
US11804055B2 (en) | 2020-06-12 | 2023-10-31 | Ricoh Company, Ltd. | Information processing apparatus, information processing method, and information processing system |
US11588945B2 (en) | 2020-06-29 | 2023-02-21 | Canon Kabushiki Kaisha | Data input support apparatus that displays a window with an item value display area, an overview image display area, and an enlarged image display area |
US11887390B2 (en) | 2020-07-14 | 2024-01-30 | Ricoh Company, Ltd. | Information processing apparatus, information processing system, information processing method, and non-transitory recording medium |
US11960949B2 (en) | 2020-12-09 | 2024-04-16 | Ricoh Company, Ltd. | Information processing apparatus, information processing system, and information processing method |
WO2023062798A1 (ja) * | 2021-10-14 | 2023-04-20 | 株式会社Pfu | 情報処理システム、項目値抽出方法、モデル生成方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP6406932B2 (ja) | 2018-10-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6406932B2 (ja) | 帳票認識装置及び方法 | |
JP6938228B2 (ja) | 計算機、文書識別方法、及びシステム | |
US8891871B2 (en) | Form recognition apparatus, method, database generation apparatus, method, and storage medium | |
JP5621169B2 (ja) | 帳票認識装置および帳票認識方法 | |
US10885325B2 (en) | Information processing apparatus, control method, and storage medium | |
JP2004139484A (ja) | 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム | |
US20090226090A1 (en) | Information processing system, information processing apparatus, information processing method, and storage medium | |
JP6174466B2 (ja) | 帳票認識装置、帳票認識方法、及びプログラム | |
US11475688B2 (en) | Information processing apparatus and information processing method for extracting information from document image | |
JP2014182477A (ja) | プログラム及び帳票処理装置 | |
JP4549400B2 (ja) | 文書認識プログラム、文書認識装置、および文書認識方法 | |
CN109389050A (zh) | 一种流程图连接关系识别方法 | |
JP2015069256A (ja) | 文字識別システム | |
JP5942361B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2009093305A (ja) | 帳票認識装置 | |
JP2021196686A (ja) | 情報処理装置、及び情報処理方法 | |
JP4466241B2 (ja) | 文書処理手法及び文書処理装置 | |
JP5134383B2 (ja) | Ocr装置、証跡管理装置及び証跡管理システム | |
JP3898645B2 (ja) | 帳票書式編集装置および帳票書式編集プログラム | |
JP5712415B2 (ja) | 帳票処理システム及び帳票処理方法 | |
JP2009087378A (ja) | 帳票処理装置 | |
US11704921B2 (en) | Image processing apparatus, image processing method, and storage medium | |
JP4521377B2 (ja) | 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム | |
WO2023042270A1 (ja) | 文字認識プログラム、文字認識システム、及び文字認識方法 | |
JP2021071911A (ja) | 帳票認識装置、帳票認識システム及び帳票認識方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170206 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180125 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A132 Effective date: 20180220 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180416 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20180904 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20180918 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6406932 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |