JP2010205122A - レイアウト構造解析装置及びレイアウト構造解析方法 - Google Patents

レイアウト構造解析装置及びレイアウト構造解析方法 Download PDF

Info

Publication number
JP2010205122A
JP2010205122A JP2009051790A JP2009051790A JP2010205122A JP 2010205122 A JP2010205122 A JP 2010205122A JP 2009051790 A JP2009051790 A JP 2009051790A JP 2009051790 A JP2009051790 A JP 2009051790A JP 2010205122 A JP2010205122 A JP 2010205122A
Authority
JP
Japan
Prior art keywords
unit
layout
feature amount
attribute
description element
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009051790A
Other languages
English (en)
Inventor
Akio Furuhata
彰夫 古畑
Naoaki Kodaira
直朗 小平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Solutions Corp filed Critical Toshiba Corp
Priority to JP2009051790A priority Critical patent/JP2010205122A/ja
Publication of JP2010205122A publication Critical patent/JP2010205122A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

【課題】名刺上の文字列の属性を示すタグを特定するための規則を簡素化し、さらにタグの判別精度を高める。
【解決手段】本発明のレイアウト構造解析装置10は、名刺上の各文字列のレイアウト情報とタグとからなる第1の画像特徴量を記憶するレイアウト辞書18と、名刺から読み取った入力画像のレイアウト情報を取得するレイアウト解析部14と、文字認識結果などに基づいて記載要素毎の属性を暫定的に判定するタグ判定部15と、判定された記載要素毎のタグとレイアウト解析により得られたレイアウト情報とを関連付けた第2の画像特徴量を生成する特徴量生成部16と、第1及び第2の画像特徴量の比較結果に基づいて、入力画像の記載要素毎のタグを確定させるタグ確定部17と、を備える。
【選択図】図1

Description

本発明は、名刺や帳票などを含む各種の書面についてのレイアウト構造を解析するレイアウト構造解析装置及びレイアウト構造解析方法に関する。
レイアウト解析によって文書画像中から抽出した各記載領域に対応するベタのレイアウトパターンを生成し、さらに、この生成したレイアウトパターンのパターン照合により、データベース内から同種類の文書画像を検索する技術が知られている(例えば特許文献1参照)。
また、上述したようなレイアウト解析は、いわゆる名刺リーダなどにも利用されている。一般に、名刺リーダは、名刺から読み取った画像イメージのレイアウト解析を行うと共に、このレイアウト解析された画像イメージ中の各記載要素(各文字列)を、姓名、住所、電話番号などに項目分けし、電子データとしてアドレス帳に自動登録する機能などを備えている。
特開平11−328417号公報
つまり、名刺リーダは、名刺上から読み取った各記載要素を項目分けするために、記載要素毎の属性を判別する機能を有する。属性の判別は、名刺上の記載要素を例えば一行単位で文字認識して得た文字認識結果などに基づいて行われる。例えば、文字認識結果として得られた文字列の先頭が「FAX」であり、後続の文字列が主に数字列で構成されている場合、その行の記載要素の属性は、ファクシミリの番号を表すものであると判定される。同様に、文字認識の結果、文字列の先頭が例えば「Email」であり、後続の文字列に比較的英字が多い場合、その行の記載要素の属性は、Eメールアドレスを表すものであると判定することが可能となる。また、予め属性毎に分類されて姓名辞書や住所辞書に登録された被照合用の文字列と、文字認識結果として得られた文字列と、の照合結果をさらに反映させて、記載要素毎の属性を判定する方法なども有用である。
しかしながら、このような方法では、属性の判定が難しい場合もある。例えば、文字認識結果として「105−6691」が得られたときに、この文字列が「郵便番号」を表す文字列であるのか、又は「市外局番なしの電話番号」を表す文字列であるのか、さらには「住所の番地部分」を表す文字列であるのか、といったことを判別する場合である。
このような場合、他の行の記載要素における文字認識結果やその属性の判定結果を利用する方法がある。すなわち、判定対象の記載要素の例えば右側に位置する記載要素の文字認識結果が「東京都港区芝浦1−1−1」であって、かつこの文字列の属性が、住所を表すものであることが既に判っている場合、判定対象の記載要素の属性は、郵便番号を表すものであると特定することが可能となる。
しかしながら、用紙サイズ以外では特にレイアウト上の制約がない上述した名刺などは、様々な種類のレイアウトが存在し、このため、属性を特定するための規則の取り決めが複雑なものとなる。また、上記した規則の取り決め方によっては、属性の判別精度を著しく低下させてしまうおそれなどもある。
本発明は、このような事情を考慮してなされたものであり、書面上の記載要素毎の属性を特定するための規則を簡素化できると共に、属性の判別精度を高めることができるレイアウト構造解析装置及びレイアウト構造解析方法の提供を目的とする。
上記目的を達成するために、本発明に係るレイアウト構造解析装置は、任意の書式で記載された書面上の複数の記載要素それぞれのレイアウトを表すレイアウト情報と、前記記載要素毎に各々対応する属性と、を予め関連付けて登録した第1の特徴量を記憶する特徴量記憶部と、構造解析の対象となる書面の画像を入力画像として取り込む画像入力部と、前記画像入力部により取り込まれた前記入力画像のレイアウト解析を行い、この入力画像を構成する複数の記載要素を各々抽出すると共にこの抽出された記載要素毎のレイアウトを表すレイアウト情報を取得するレイアウト解析部と、前記レイアウト解析部により抽出された少なくとも各記載要素を文字認識した結果に基づいて、当該抽出された記載要素毎の属性を暫定的に判定する属性判定部と、前記属性判定部により判定された記載要素毎の属性と前記レイアウト解析部により取得された記載要素毎のレイアウト情報とを互いに関連付けた第2の特徴量を生成する特徴量生成部と、前記特徴量生成部により生成された前記第2の特徴量と前記特徴量記憶部に予め記憶された前記第1の特徴量とを比較した結果に基づいて、前記入力画像を構成する記載要素毎の属性を確定させる属性確定部と、を具備することを特徴とする。
このように本発明は、任意の書式で記載された書面上の記載要素毎の属性とレイアウト情報とを関連付けた第1の特徴量を予め記憶保持しておく一方で、構造解析の対象となる入力画像をレイアウト解析して得た記載要素毎のレイアウト情報と少なくとも文字認識結果に基づき暫定的に判定した各属性とを関連付けた第2の特徴量を生成する。さらに本発明は、これら第1、第2の特徴量を互いに比較した結果から、入力画像を構成する記載要素毎の属性を確定させる。すなわち、本発明によれば、複雑な処理を伴うことなく比較的容易に生成可能な第2の特徴量と、予め記憶保持しておいた第1の特徴量と、を比較するといった簡明な処理で記載要素毎の属性を特定できるので、属性を特定するための規則などの簡素化を図れる共に属性の判別精度を向上させることができる。
また、本発明に係るレイアウト構造解析方法は、任意の書式で記載された書面の画像を構成する複数の記載要素それぞれのレイアウトを表すレイアウト情報と、前記記載要素毎に各々対応する属性と、を予め関連付けて登録した第1の特徴量を特徴量記憶部が記憶するステップと、構造解析の対象となる書面の画像を画像入力部が入力画像として取り込むステップと、前記画像入力部により取り込まれた前記入力画像のレイアウト解析を行うことにより、レイアウト解析部が、前記入力画像を構成する複数の記載要素を抽出すると共にこの抽出された記載要素毎のレイアウトを表すレイアウト情報を取得するステップと、前記レイアウト解析部により抽出された少なくとも各記載要素を文字認識した結果に基づいて、当該抽出された記載要素毎の属性を属性判定部が暫定的に判定するステップと、前記属性判定部により判定された記載要素毎の属性と前記レイアウト解析部により取得された記載要素毎のレイアウト情報とを互いに関連付けた第2の特徴量を特徴量生成部が生成するステップと、前記特徴量生成部により生成された前記第2の特徴量と前記特徴量記憶部に予め記憶された前記第1の特徴量とを比較した結果に基づいて、前記入力画像を構成する記載要素毎の属性を属性確定部が確定させるステップと、を有することを特徴とする。
本発明によれば、書面上の記載要素毎の属性を特定するための規則を簡素化できると共に、属性の判別精度を高めることが可能なレイアウト構造解析装置及びレイアウト構造解析方法を提供することができる。
本発明の第1の実施形態に係るレイアウト構造解析装置の機能ブロック図。 図1のレイアウト構造解析装置によるレイアウト解析を概念的に示す図。 図1のレイアウト構造解析装置を利用したレイアウト辞書の作成方法を概念的に示す図。 図3のレイアウト辞書の作成方法を示すフローチャート。 図1のレイアウト構造解析装置によるタグの確定処理を概念的に示す図。 図1のレイアウト構造解析装置によるレイアウト構造解析方法の流れを示すフローチャート。 本発明の第2の実施形態に係るレイアウト構造解析装置の機能ブロック図。 図7のレイアウト構造解析装置によるタグの確定処理を概念的に示す図。 図7のレイアウト構造解析装置によるレイアウト構造解析方法の流れを示すフローチャート。
以下、本発明を実施するための形態を図面に基づき説明する。
[第1の実施の形態]
図1は、本発明の第1の実施形態に係るレイアウト構造解析装置10の構成を機能的に示すブロック図である。図2は、レイアウト構造解析装置10が備えたレイアウト解析部14による処理を概念的に示す図である。
本実施形態のレイアウト構造解析装置10は、名刺などの書面から得た画像の記載要素毎の属性(以下「タグ」と記述)を特定することが可能であって、例えば名刺リーダなどの一機能を担う装置として利用される。すなわち、レイアウト構造解析装置10は、図1に示すように、画像入力部12と、レイアウト解析部14と、属性判定部として機能するタグ判定部15と、特徴量生成部16と、属性確定部としてのタグ確定部17と、特徴量記憶部であるレイアウト辞書18とを備える。
レイアウト構造解析装置10は、例えばハードウェアとしてCPU、メインメモリ、外部記憶装置などを備えており、この外部記憶装置などに格納された例えばレイアウト構造解析プログラムがCPUによりメインメモリ上にロードされることによって、上記したレイアウト解析部14やタグ判定部15を含む各構成要素が、ソフトウェアなどで実現される。なお、レイアウト構造解析装置10の上記した各構成要素は、各種の電子部品を組み合わせて構成したハードウェアにより実現されるものであってもよい。また、本実施形態のレイアウト構造解析装置10には、液晶ディスプレイやCRTモニタなどの表示装置、マウスやキーボードなどの入力装置、及びイメージスキャナなどが接続されている。
画像入力部12は、図1及び図2に示すように、構造解析の対象となる書面の画像を入力画像として取り込む。具体的には、図2に示すように、画像入力部12は、イメージスキャナなどで読み取られた例えば名刺の画像19を取得する。また、画像入力部12は、上記のイメージスキャナで読み取られた画像の他、例えばカメラで撮影された画像など、様々な形式の画像を取り込むことが可能である。
レイアウト解析部14は、画像入力部12により取り込まれた入力画像のレイアウト解析を行い、この入力画像を構成する複数の記載要素を各々抽出すると共にこの抽出された記載要素(記載項目)毎のレイアウトを表すレイアウト情報を取得する。すなわち、レイアウト解析部14は、図2に示すように、画像入力部12で入力を受け付けた名刺の画像19をレイアウト解析し、名刺の画像19中の六つの行を構成する文字列を各記載要素として抽出する。ここで、本実施形態においては、記載要素の「105−6691」と「東京都港区芝浦1−1−1」とは、位置的には同じ並びではあるものの、レイアウト解析部14は、互いの文字列間のブランク(隙間)を検出し、異なる行の文字列としてそれぞれを抽出する。
また、レイアウト解析部14は、抽出された記載要素毎のレイアウト(各行に位置する文字列の配置やサイズなど)を表すレイアウト情報として、名刺の画像19のエッジ部(コーナ部)sを基準とした各行の文字列の中心点の座標x,y(座標x1〜x6,y1〜y6)、並びに各行の文字列の幅w(幅w1〜w6)及び高さh(高さh1〜h6)を取得する。ここで、レイアウト解析部14によるレイアウト解析の手法としては、黒画素のかたまり領域を検出してその輪郭をたどる輪郭線追跡方式や、黒画素領域を検出したら順番に番号を付加して連結して行くラベリング方式などを適用することが可能である。
次に、レイアウト辞書18の構成を図1、図2に加え、図3、図4に基づき説明する。ここで、図3は、レイアウト構造解析装置10を利用したレイアウト辞書18の作成方法を概念的に示す図である。また、図4は、レイアウト構造解析装置10を利用したレイアウト辞書18の作成方法を示すフローチャートである。
レイアウト辞書18は、図1、図2に示すように、任意の書式で記載された名刺(書面)上の複数の記載要素それぞれのレイアウトを表すレイアウト情報と、記載要素毎に各々対応するタグと、を予め関連付けて登録した第1の画像特徴量(第1の特徴量)を記憶する。より具体的には、レイアウト辞書18は、書式(様式)の異なる複数の種類の名刺に各々対応した複数の種類の第1の画像特徴量を記憶する。つまり、レイアウト辞書18は、図1に示すように、名刺の書式に各々対応した複数の第1の画像特徴量を種類毎にクラス分けして記憶するクラス別記憶部としての複数のクラス辞書18a、18b、18c…を備えている。
レイアウト辞書18内のクラス辞書18a、18b、18c…毎に記憶される第1の画像特徴量は、図1〜図3に示すように、名刺上の記載要素毎(各行に位置する文字列毎)のレイアウト情報として、名刺の画像のエッジ部などを基準とした各行の文字列の中心点の座標X,Y(座標X1〜X6,Y1〜Y6)、並びに各行の文字列の幅W(幅W1〜W6)及び高さH(高さH1〜H6)を含んでいる。
また、クラス辞書18a、18b、18c…毎に記憶された個々の第1の画像特徴量にそれぞれ含まれるタグは、各行に位置する文字列毎に正の整数値として割り当てられている。具体的には、図3に示すように、姓名を表す文字列の行には「1」、郵便番号を表す文字列の行には「2」、がタグ(属性)として付与されている。同様に、住所名の行には「3」、電話番号の行には「4」、FAX番号の行には「5」、Eメールアドレスの行には「6」がそれぞれタグとして割り当てられている。
すなわち、第1の画像特徴量は、姓名、郵便番号、住所名、電話番号、FAX番号及びEメールアドレスを表す文字列が位置する六つの行それぞれが、文字列の座標X、座標Y、幅W、高さH及びタグからなる五つの特徴量で表現され、さらにこれらの特徴量を順に並べた30次元の特徴ベクトルとして構成されている。
ここで、このように構成されたクラス辞書18a、18b、18c…を備えるレイアウト辞書18の作成方法を図3及び図4に基づいて説明する。なお、レイアウト辞書18の作成には、当該レイアウト構造解析装置10の備える画像入力部12及びレイアウト解析部14、並びに上述した表示装置、入力装置及びイメージスキャナなどが利用される。
図3、図4に示すように、まず、複数の種類の名刺からイメージスキャナなどを介して読み取られた辞書作成用画像群21を、画像入力部12によって取り込む(S1)。次に、レイアウト解析部14は、画像入力部12が取り込んだ辞書作成用画像群21の各画像のレイアウト解析を行い、各行の文字列の座標x,y、幅w及び高さhからなるレイアウト情報を取得する(S2)。次いで、レイアウト情報を取得した各画像のそれぞれの行の文字列毎にタグを辞書作成者(オペレータ)が登録する(S3)。ここで、タグの登録処理では、上記入力装置や表示装置を用いたGUIなどのユーザインターフェースを適宜利用するようにしてもよい。
続いて、図3、図4に示すように、レイアウト情報及び登録されたタグに基づいてクラスタリングを行い、同一の書式を有する画像どうしを一つのクラスタとしてまとめる(S4)。ここで、画像どうしが同一の書式であるか否かの判断の基準には、例えばタグどうしの並び順などを指標にすることが可能である。次に、クラスタリングにより分類されたクラスタ(同一の書式を有する画像群)毎にクラス(クラスA、B、C…)を割り当て複数のクラス画像群22a、22b、22c…を得る(S5)。
最後に、このようにして得られた各クラス画像群22a、22b、22c…に基づいて、当該クラス画像群毎にそれぞれ対応する複数のクラス辞書18a、18b、18c…を作成し、これらを集合させたレイアウト辞書18を得る(S6)。具体的には、図3に示すように、クラス画像群毎に主成分分析を行うことにより、固有値が最大となる固有ベクトルを求め、これを第1の画像特徴量(30次元の特徴ベクトル)として記憶させたクラス辞書を生成する。図3では、主に、クラスAに属する画像群22aを各々特徴量化した複数の特徴ベクトルF=(f1,f2…f30)Tを生成した後、これら複数の特徴ベクトルF=
(f1,f2…f30)Tを主成分分析することで特徴ベクトルA=(a1,a2…a30)Tを求め、さらにこれを記憶させたクラスA用のクラス辞書18aを作成した態様を例示している。
ここで、クラス辞書内の特徴量として採用するベクトルの次元数(主成分の個数)は、例えば累積寄与率が予め定めた規定値になるような次元数を採用するようにしてもよい。また、本実施形態では、名刺の画像を構成する全ての行の文字列から特徴量を抽出して、クラス辞書を作成しているが、これに代えて、名刺の画像を構成する全ての行の文字列のうちの、一部の行の文字列から選択的に特徴量を抽出してクラス辞書を作成してもよい。
次に、タグ判定部15の構成を上記の図1及び図5に基づき説明する。ここで、図5は、レイアウト構造解析装置10により暫定的にタグを判定してからタグを確定するまでの処理を概念的に示す図である。タグ判定部15は、図1及び図5に示すように、レイアウト解析部14により名刺の入力画像Pから抽出された少なくとも各記載要素(各行に位置する個々の文字列)を文字認識した結果に基づいて、当該抽出された記載要素毎のタグを暫定的に判定(仮決定)する。
ここで、タグ判定部15は、レイアウト辞書18内に予め登録された六種類のタグの中から、実質的に一種類のタグを選択するかたちで、前述した入力画像P中の各文字列に該当するタグを暫定的に判定する。さらに詳述すると、タグ判定部15は、図1に示すように、文字認識部15a、文字列照合部15b及び判定保留部15cを備える。
文字認識部15aは、名刺の入力画像P中の各行の文字列を一文字ごとのイメージとして切り出し、切り出した一文字ごとの文字イメージの文字認識を行う。詳細には、文字認識部15aは、文字認識用の辞書を備えている。この文字認識用の辞書内には、複数の文字イメージと複数の文字コードとが互いに対応付けられたかたちで記憶されている。すなわち、文字認識部15aは、複合類似度法や部分空間法などを用いて、一文字毎の文字イメージと文字認識用の辞書内の文字イメージとのパターンマッチングを行い、文字イメージとマッチングした当該辞書内の文字コードを文字認識結果として出力する。
つまり、このような文字認識部15aを備えるタグ判定部15は、図5に示すように、例えば文字認識結果として得られた文字列の先頭が「TEL」であり、後続の文字列が主に数字列で構成されている場合、その行の文字列のタグを、電話番号を表すものであると暫定的に判定する。また同様に、タグ判定部15は、文字認識の結果、文字列の先頭が例えば「Email」であり、後続の文字列に比較的英字が多い場合、その行の文字列のタグを、Eメールアドレスを表すものであると暫定的に判定する。
また、文字列照合部15bは、文字認識部15aにより文字認識結果として得られた記載要素毎の(文字コードで表現される)文字列と、レイアウト辞書18内に予め登録されている属性毎に各々分類された複数の種類の被照合用の(文字コードで表現される)文字列と、をそれぞれ照合する。具体的には、文字列照合部15bは、複数の姓名を表す文字列を登録した姓名辞書や、複数の住所名を表す文字列を登録した住所辞書など、上記レイアウト辞書18内に予め登録されているタグの種類分(六種類分)のタグ別辞書を備えている。
つまり、文字列照合部15bを備えるタグ判定部15は、文字認識の結果得られた文字列と一致する文字列が姓名辞書内に登録されている場合、当該文字認識の結果得られた文字列のタグ(属性)を、姓名を表すものであると暫定的に判定する。また、同様に、タグ判定部15は、文字認識の結果得られた文字列と一致する文字列が住所辞書内に登録されている場合、文字認識の結果得られた文字列のタグを、住所名を表すものと暫定的に判定する。ここで、タグ判定部15は、文字認識部15aによる上述した文字認識結果単独でのタグの判定結果と文字列照合部15bによる判定結果とを併せた結果から、総合的にタグを判定するものであってもよい。
また、各行の文字列のサイズなどをタグの判定要素に加えるようにしてもよいし、さらに、他の行の文字列に対するタグの判定結果を判定要素に加えるようにしてもよい。他の行のタグの判定結果を利用する場合の例としては、図5に示すように、判定対象の記載要素(行)の例えば上段に位置する記載要素のタグが電話番号を表すものであると判定されている場合、判定対象の記載要素のタグは、FAX番号を表すものであると判定される。
判定保留部15cは、タグ別辞書を用いた少なくとも文字列照合部15bによる照合結果に基づいて、タグの判定を記載要素毎(各行に位置する文字列毎)に保留することが可能である。具体的には、判定保留部15cは、名刺の入力画像P中における記載要素の文字認識結果として得られた文字列が、姓名辞書や住所辞書などを含む六種類のタグ別辞書のうちのいずれの辞書にも登録されていなかった場合、その記載要素(その行の文字列)のタグの判定を判定エラーとする。
なお、判定保留部15cは、このような文字列照合部15bによる判定処理と上述した文字認識部15aにより得られた文字認識結果単独での判定処理とを併せてもタグを特定できない場合に、判定エラーを決定するものであってもよい。また、判定保留部15cは、各行の文字列のサイズなどをタグの判定要素に加えたり、さらには、他の行の文字列に対するタグの判定結果を判定要素に加えてもなお、タグを特定できないとき、この場合にはじめて、タグの判定を保留にする(判定エラーを決定する)ものであってもよい。
図1及び図5に示すように、特徴量生成部16は、タグ判定部15により暫定的に判定された名刺の入力画像P中の記載要素毎(各行に位置する文字列毎)のタグと、レイアウト解析部14により名刺の入力画像Pから取得された記載要素毎のレイアウト情報(各文字列の座標、幅、高さ)と、を互いに関連付けた第2の画像特徴量(第2の特徴量)を生成する。この第2の画像特徴量は、レイアウト辞書18内のクラス辞書18a、18b、18c…に記憶された複数の種類の第1の画像特徴量との比較対象となる特徴ベクトルである。
つまり、図5に示すように、第2の画像特徴量は、名刺の入力画像P中の姓名、郵便番号、住所名、電話番号、FAX番号及びEメールアドレスを表す文字列が位置する六つの行それぞれが、文字列の座標x(x1〜x6)、座標y(y1〜y6)、幅w(w1〜w6)、高さh(h1〜h6)及びタグ(主に1〜6)からなる五つの特徴量で表現され、さらにこれらの特徴量を順に並べた30次元の特徴ベクトルとして構成される。
ここで、特徴量生成部16は、前述したタグ判定部15の判定保留部15cによって例えばタグの判定の保留された記載要素(名刺の入力画像P中で判定エラーとなった行に位置する文字列)に対しは、図5に示すように、タグが不明であることを表す情報として、代替用のタグとなる例えば整数値「0」を補完する(割り当てる)ことにより、第2の画像特徴量を生成する。図5は、名刺の入力画像Pの特徴量化によって特徴ベクトルP=
(p1,p2…p30)Tが生成される過程を示しており、さらに、入力画像P中における六番目の行の文字列(Eメールアドレス)のタグが不明となっている態様を例示している。
図1及び図5に示すように、タグ確定部17は、特徴量生成部16により生成された第2の画像特徴量と、レイアウト辞書18内のクラス辞書18a、18b、18c…に記憶された複数の種類の第1の画像特徴量と、を比較した結果に基づいて、名刺の入力画像Pを構成する記載要素毎(各行の文字列)のタグを確定させる。具体的には、タグ確定部17は、類似性比較部17a、特徴量選出部17b及び判定結果補正部17cを備える。
類似性比較部17aは、図1、図5に示すように、上述した第2の画像特徴量と複数の種類の第1の画像特徴量との類似性を各々比較するものであって、詳細には、(一つの)第2の画像特徴量と(全ての)第1の画像特徴量との類似度を各々算出する。つまり、類似性比較部17aは、いわゆる部分空間法を適用するために、第1の画像特徴量毎に第2の画像特徴量との類似度を求める。
類似性比較部17aによる類似度算出のための基本式は、第2の画像特徴量を構成する特徴ベクトルの各成分を“pi”、第1の画像特徴量を構成する特徴ベクトルの各成分を“ai”、“・”を内積、“|| ||”をノルムとすると、下記の式(1)で与えられる。式(1)では、cosθが「1」に近付く程、特徴ベクトルどうしの類似度が高いことになる。さらに、式(1)における特徴ベクトルの各成分の長さ(スカラ量)をそれぞれ「1」とするように正規化(規格化)することで、分母を省略でき、これにより、式(2)で示される単純類似度RAを求めることが可能となる。
Figure 2010205122
Figure 2010205122
さらに、詳述すると、本実施形態の類似性比較部17aは、タグ判定部15の判定保留部15cによって、少なくとも一つの記載要素(入力画像P中の文字列)についてのタグの判定が保留された(判定エラーになった)場合に、第2の画像特徴量と複数の種類の第1の画像特徴量との類似性を各々比較する。このため、類似性比較部17aは、第2の画像特徴量から代替用のタグを表す情報(整数値0で示される属性情報)を除外した画像特徴量と複数の種類の第1の画像特徴量との類似性を各々比較する。
したがって、本実施形態の類似性比較部17aは、下記の式(3)で例示される演算式を適用して、第1及び第2の画像特徴量(特徴ベクトル)どうしの類似性を示す類似度
A1を算出する。
Figure 2010205122
ここで、上記式(3)では、図5に対応させて、第2の画像特徴量を構成する特徴ベクトルP=(p1,p2…p30)T中の成分p30のタグが不明(判定エラー)となっている場合の類似度の演算式を例示している。類似性比較部17aが式(3)のような演算式を適用することで、代替用のタグの情報が、類似度の算出結果に悪影響を及ぼすことを防止できる。
なお、類似性比較部17aは、上記式(3)に代えて、下記の式(4)の演算式を適用し類似度RA2を求めるものであってもよい。
Figure 2010205122
つまり、式(4)では、第1及び第2の画像特徴量(互いの特徴ベクトル)中のタグを除いたレイアウト情報(文字列の座標、幅、高さ)だけの類似度と、タグだけの類似度と、を実質的に個別に算出し、これらを最終的に加算したものを類似度RA2としている。ここで、“δpi,ai”は、タグどうしの純粋な類似度を示しており、さらに“k”は、類似度の重み付け値(定数)を表している。このように、レイアウト情報どうしの類似度とタグどうしの類似度とを個別に得ることで、より緻密な類似度を求めることが可能となる。
図1及び図5に示すように、特徴量選出部17bは、類似性比較部17aによる比較結果に基づいて、第2の画像特徴量との類似性が最も高い第1の画像特徴量を選出(選択)する。具体的には、特徴量選出部17bは、下記の式(5)に例示されるように、レイアウト辞書18内のクラス辞書18a、18b、18c…に記憶された複数の種類の第1の画像特徴量毎に、第2の画像特徴量との類似度を求め、最大の類似度RA1が得られた第1の画像特徴量を選出(図5の例ではクラスAに属する特徴ベクトルを選出)する。
Figure 2010205122
ここで、上述した類似性比較部17a及び特徴量選出部17bでは、類似度の比較において部分空間法を適用しているが、これに代えて、類似度の比較に例えば学習部分空間法や、さらにはニューラルネットワークなどを利用してもよい。なお、これらを利用する場合、クラス辞書18a、18b、18c…の形式やその作成方法などは、適宜変更されることとなる。
また、図1及び図5に示すように、判定結果補正部17cは、特徴量選出部17bにより選出された類似性が最も高い第1の画像特徴量に基づいて、タグ判定部15による暫定的なタグの判定結果を補正し、名刺の入力画像Pを構成する記載要素毎(各行の文字列)のタグを確定させる。具体的には、判定結果補正部17cは、類似性が最も高い第1の画像特徴量のうちの、判定の保留された記載要素(判定エラーとなった行の文字列)とレイアウト情報(文字列の座標、幅、高さ)が対応する記載要素(行に位置する文字列)のタグを、当該判定の保留された記載要素に対して割り当てる。
すなわち、判定結果補正部17cは、図5に例示するように、第2の画像特徴量[特徴ベクトルP=(p1,p2…p30)T]との類似度が最大となった第1の画像特徴量[特徴ベクトルA=(a1,a2…a30)T]のうち、タグの判定エラーとなった六番目の行の文字列の成分
30に対し、特徴ベクトルA=(a1,a2…a30)Tにおける成分a30のEメールアドレスを表すタグ「6」を割り当てる(タグを確定させる)。また、本実施形態の判定結果補正部17cは、判定エラーになっていない他の行の文字列については、タグ判定部15により暫定的に判定されたタグを、そのまま最終的に特定すべきタグとして確定させる。
次に、このように構成されたレイアウト構造解析装置10によるレイアウト構造解析方法を、主に図5及び図6のフローチャートに基づき説明する。まず、各クラス辞書18a、18b、18c…にそれぞれ対応する複数の種類の第1の画像特徴量を記憶させ、レイアウト辞書18を構成する(S11)。次に、画像入力部12は、構造解析の対象となる入力画像P(名刺の画像イメージ)を取り込む(S12)。次いで、レイアウト解析部14は、入力画像Pのレイアウト解析を行い、入力画像P中の記載要素毎(文字列毎)のレイアウト情報を取得する(S13)。続いて、タグ判定部15は、レイアウト解析された記載要素毎のタグを暫定的に判定する(S14)。
ここで、タグ確定部17は、タグの判定がエラーとなった記載要素の有無を検出し(S15)、判定エラーとなった記載要素が存在しない場合(S15のNO)、タグ判定部15により暫定的に判定された各タグをそのまま採用して全てのタグを確定させる(S16)。一方、判定エラーとなった記載要素が存在することをタグ確定部17が検出した場合(S15のYES)、特徴量生成部16は、代替用のタグを補完して第2の画像特徴量を生成する(S17)。
次に、タグ確定部17は、複数の第1の画像特徴量と代替用のタグの情報を除外した第2の画像特徴量との類似度を各々比較し、類似度が最大となった第1の画像特徴量を選出する(S18)。最後に、タグ確定部17は、図5に示すように、類似度が最大の選出された第1の画像特徴量のうち、判定エラーとなった記載要素とレイアウト情報が対応する記載要素のタグを、当該判定エラーとなった記載要素に対して割り当てる(S19)。なお、判定エラーになっていない他の行の文字列については、判定結果補正部17cは、タグ判定部15により暫定的に判定されたタグを、そのまま最終的に特定すべきタグとして確定させる。
既述したように、本実施形態のレイアウト構造解析装置10は、任意の書式で記載された名刺上の記載要素毎のタグとレイアウト情報とを関連付けた第1の画像特徴量を予め記憶保持しておく一方で、構造解析の対象となる入力画像(名刺の画像)をレイアウト解析して得た記載要素毎のレイアウト情報と少なくとも文字認識結果に基づき暫定的に判定したタグとを関連付けた第2の画像特徴量を生成する。さらにレイアウト構造解析装置10では、これら第1、第2の画像特徴量を互いに比較した結果から、入力画像を構成する記載要素毎の属性を確定させる。つまり、本実施形態のレイアウト構造解析装置10では、複雑な処理を伴うことなく比較的容易に生成可能な第2の画像特徴量と、予め記憶保持しておいた第1の画像特徴量と、を比較するといった簡明な処理で記載要素毎のタグを特定できる。これにより、レイアウト構造解析装置10によれば、属性を特定するための規則などの簡素化を図れる共に属性の判別精度を向上させることができる。
[第2の実施の形態]
次に、本発明の第2の実施形態を図7〜図9に基づき説明する。ここで、図7は、第2の実施形態に係るレイアウト構造解析装置30の構成を機能的に示すブロック図である。また、図8は、レイアウト構造解析装置30により暫定的にタグを判定してからタグを確定するまでの処理を概念的に示す図である。さらに、図9は、レイアウト構造解析装置30によるレイアウト構造解析方法の流れを示すフローチャートである。なお、図7及び図8において、第1の実施形態で説明した図1及び図5中の構成要素と同一の構成要素については、同一の符号を付与しその説明を省略する。
図7に示すように、この実施形態のレイアウト構造解析装置30は、第1の実施形態のレイアウト構造解析装置10に設けられていたタグ確定部17に代えて、タグ確定部37を備えていると共に、特徴量更新部としての辞書修正部39をさらに加えて構成されている。上述したタグ確定部37は、タグ確定部17に設けられていた判定結果補正部17cに代えて、判定結果補正部37cを備える。
図7及び図8に示すように、判定結果補正部37cは、第2の画像特徴量側の記載要素毎の各タグ(各行の文字列毎に関連付けられた属性)と、当該第2の画像特徴量との類似性が最も高い第1の画像特徴量側の記載要素毎の各タグと、を互いのレイアウト情報の対応関係(各行に位置する文字列毎の関係)を揃えて比較した結果、タグが不一致となった記載要素が存在した場合、類似性が最も高い第1の画像特徴量側のタグの登録内容を優先させて、当該不一致となった記載要素のタグを確定させる。
図8では、特徴量選出部17bは、下記の式(6)で示されるように、レイアウト辞書18内のクラス辞書18a、18b、18c…に記憶された複数の種類の第1の画像特徴量毎に、第2の画像特徴量[特徴ベクトルP=(p1,p2…p30)T]との類似度を求め、最大の類似度RBが得られた第1の画像特徴量を選出(クラスBに属する[特徴ベクトルB=(b1,b2…b30)T]を選出)した態様を例示している。
Figure 2010205122
ここで、図8の例では、判定結果補正部37cは、第2の画像特徴量[特徴ベクトルP=(p1,p2…p30)T]側の記載要素毎の各タグと、当該第2の画像特徴量との類似度(RB)が最大となった第1の画像特徴量側の記載要素毎の各タグと、を互いの文字列どうしの対応関係を揃えて比較した結果、タグが不一致となった記載要素(文字列)が存在していことを検出している。具体的には、判定結果補正部37cは、五番目の行の文字列(FAX番号を示す文字列)において、第2の画像特徴量側の成分p25のタグ“4”と、選出された第1の画像特徴量側の成分b25のタグ“5”とが不一致となったことを検出している。この場合、判定結果補正部37cは、選出された第1の画像特徴量側のタグの登録内容を優先させて(タグ“5”を選択して)、当該不一致となった記載要素のタグを確定させる。
また、辞書修正部39は、図7及び図8に示すように、特徴量生成部16により生成された第2の画像特徴量と判定結果補正部37cによるタグの判定を補正した結果とに基づいて、当該第2の画像特徴量との類似性が最も高い第1の画像特徴量を記憶したクラス辞書内の記憶内容を更新する(学習させる)。図8の例では、辞書修正部39は、成分p25としてタグ“5”を確定させたことを示す情報と、成分p25以外の第2の画像特徴量[特徴ベクトルP=(p1,p2…p30)T]の内容と、を反映させるようにして、クラスBに対応するクラス辞書18b内の記憶内容[特徴ベクトルB=(b1,b2…b30)T]を更新する(学習させる)。
なお、レイアウト辞書18内のクラス辞書18a、18b、18…を更新(修正)する方法としては、例えばレイアウト辞書18の作成に用いたクラス画像群のうち対応する画像群に入力画像を追加し、辞書を再計算するなどの方法がある。また、辞書修正部39は、クラス辞書を実際に更新する前に、更新予定内容を表示装置などを介してユーザ側に提示し、ユーザからの了承を示す入力操作を入力装置などを通じて受け取った場合にはじめて、クラス辞書を更新するようにしてもよい。
次に、このように構成されたレイアウト構造解析装置30によるレイアウト構造解析方法を図7、図8及び図9のフローチャートに基づき説明する。まず、レイアウト構造解析装置30は、図9に示すように、第1の実施形態で説明した図6中のS11〜S14と同一の処理を行う(S21)。次に、タグ確定部37は、タグの判定がエラーとなった記載要素の有無を検出し(S22)、タグの判定がエラーとなった記載要素が存在する場合(S22のYES)、第1の実施形態で説明した図6中のS17〜S19と同一の処理を行う(S23)。
一方、判定エラーとなった記載要素が存在しないことをタグ確定部37が検出した場合(S22のNO)、特徴量生成部16は、暫定的に判定された全てのタグとレイアウト情報とを関連付けた第2の画像特徴量を生成する(S24)。さらに、タグ確定部37は、複数の第1の画像特徴量と第2の画像特徴量との類似度を各々比較し、類似度が最大となった第1の画像特徴量を選出する(S25)。
ここで、タグ確定部37は、第2の画像特徴量側の記載要素毎の各タグと、選出された第1の画像特徴量側の記載要素毎の各タグと、を互いのレイアウト情報の対応関係を揃えて比較した結果、タグが不一致となった記載要素の有無を検出する(S26)。タグが不一致となった記載要素が存在しない場合(S26のNO)、タグ確定部37は、タグ判定部15により暫定的に判定された各タグをそのまま採用して全てのタグを確定させる(S27)。
一方、タグが不一致となった記載要素が存在する場合(S26のYES)、タグ確定部37は、選出された第1の画像特徴量側のタグの登録内容を優先させて、当該不一致となった記載要素のタグを確定させる(S28)。さらに、この場合、辞書修正部39は、第2の画像特徴量と不一致を補正したタグの補正内容に基づいて、選出された第1の画像特徴量を記憶するクラス辞書内の記憶内容を更新する(S29)。
このように本実施形態のレイアウト構造解析装置30によれば、タグ判定部15が実質的に誤ったタグの判定を行った場合でも、これを修正することが可能となる。また、レイアウト構造解析装置30によれば、生成された第2の画像特徴量とタグの修正内容とに基づいて、レイアウト辞書18内のクラス辞書を学習させることができる。
以上、本発明を第1、第2の実施の形態により具体的に説明したが、本発明はこれらの実施形態にのみ限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能である。例えば、上述した実施形態では、レイアウト構造の解析対象として、名刺を例示していたが、これに代えて、帳票、証明書、一般の文書などを構造解析の対象とすることもできる。
また、第1、第2の画像特徴量が、記載要素(文字列)の座標、幅、高さ及びタグで表現されていたが、このような特徴量の他、文字列の縦横比や、文字列を構成する文字種(ひらがな、カタカナ、漢字、記号、アルファベット、数字などの文字種)の比率、文字列を構成する文字の総数などを第1、第2の画像特徴量に含めるようにしてもよい。
さらに、第1、第2の画像特徴量を作成するために、レイアウト解析部14が、各行の文字列の中心点の座標(x,y)を取得(算出)する場合、名刺の画像19のエッジ部s(図2中の名刺の画像の左上隅)を基準としていたが、これに代えて、例えば名刺の画像全体の中心点を基準としてもよい。また、これに代えて、事前に定義しておいた行の文字列の中心点(例えば姓名を記した文字列の中心点など)を基準として、それ以外の各行の文字列の中心点の座標を取得するようにしてもよい。
また、クラス辞書内に予め記憶された第1の画像特徴量(特徴ベクトル)の次元数と入力画像を基に生成した第2の画像特徴量(特徴ベクトル)の次元数とが異なる場合、予め定めておいた所定の特徴成分を選択したり、次元数の高いほうの特徴量から次元数の低いほうにある行と近い位置にある行のみを選択したり、あるいは次元数の低いほうの特徴量にタグ「不明」の行を追加するなどして次元数を揃えた上で、互いの類似度を算出するようにしてもよい。
10,30…レイアウト構造解析装置、12…画像入力部、14…レイアウト解析部、15…タグ判定部、15a…文字認識部、15b…文字列照合部、15c…判定保留部、16…特徴量生成部、17,37…タグ確定部、17a…類似性比較部、17b…特徴量選出部、17c、37c…判定結果補正部、18…レイアウト辞書、18a,18b,18c…クラス辞書、19…名刺の画像、21…辞書作成用画像群、39…辞書修正部。

Claims (7)

  1. 任意の書式で記載された書面上の複数の記載要素それぞれのレイアウトを表すレイアウト情報と、前記記載要素毎に各々対応する属性と、を予め関連付けて登録した第1の特徴量を記憶する特徴量記憶部と、
    構造解析の対象となる書面の画像を入力画像として取り込む画像入力部と、
    前記画像入力部により取り込まれた前記入力画像のレイアウト解析を行い、この入力画像を構成する複数の記載要素を各々抽出すると共にこの抽出された記載要素毎のレイアウトを表すレイアウト情報を取得するレイアウト解析部と、
    前記レイアウト解析部により抽出された少なくとも各記載要素を文字認識した結果に基づいて、当該抽出された記載要素毎の属性を暫定的に判定する属性判定部と、
    前記属性判定部により判定された記載要素毎の属性と前記レイアウト解析部により取得された記載要素毎のレイアウト情報とを互いに関連付けた第2の特徴量を生成する特徴量生成部と、
    前記特徴量生成部により生成された前記第2の特徴量と前記特徴量記憶部に予め記憶された前記第1の特徴量とを比較した結果に基づいて、前記入力画像を構成する記載要素毎の属性を確定させる属性確定部と、
    を具備することを特徴とするレイアウト構造解析装置。
  2. 前記特徴量記憶部は、書式の異なる複数の種類の書面に各々対応した複数の種類の第1の特徴量を記憶し、
    前記属性確定部は、
    前記複数の種類の第1の特徴量と前記特徴量生成部により生成された前記第2の特徴量との類似性を各々比較する類似性比較部と、
    前記類似性比較部による比較結果に基づいて、前記第2の特徴量との類似性が最も高い第1の特徴量を選出する特徴量選出部と、
    前記特徴量選出部により選出された前記類似性が最も高い第1の特徴量に基づいて、前記属性判定部による判定結果を補正し、前記入力画像を構成する記載要素毎の属性を確定させる判定結果補正部と、
    を具備することを特徴とする請求項1記載のレイアウト構造解析装置。
  3. 前記属性判定部は、
    前記レイアウト解析部により抽出された各記載要素を文字認識する文字認識部と、
    前記文字認識部により文字認識結果として得られた記載要素毎の文字列と、前記特徴量記憶部に予め登録されている属性毎に各々分類された複数の種類の被照合用の文字列と、をそれぞれ照合する文字列照合部と、
    少なくとも、前記文字列照合部による照合結果に基づいて、属性の判定を前記記載要素毎に保留することが可能な判定保留部と、
    を備え、
    前記類似性比較部は、前記判定保留部によって少なくとも一つの記載要素についての属性の判定が保留された場合に、前記複数の種類の第1の特徴量と前記第2の特徴量との類似性を各々比較し、
    さらに、前記判定結果補正部は、前記類似性が最も高い第1の特徴量のうちの、前記判定の保留された記載要素とレイアウト情報が対応する記載要素の属性を、当該判定の保留された記載要素に対して割り当てる、
    ことを特徴とする請求項2記載のレイアウト構造解析装置。
  4. 前記特徴量生成部は、前記判定保留部にて属性の判定の保留された記載要素に対し代替用の属性を表す情報を補完することにより前記第2の特徴量を生成することが可能であり、
    さらに、前記類似性比較部は、当該第2の特徴量から前記代替用の属性を表す情報を除外した特徴量と前記複数の種類の第1の特徴量との類似性を各々比較する、
    ことを特徴とする請求項3記載のレイアウト構造解析装置。
  5. 前記判定結果補正部は、前記第2の特徴量側の記載要素毎の各属性と、当該第2の特徴量との類似性が最も高い第1の特徴量側の記載要素毎の各属性と、を互いのレイアウト情報の対応関係を揃えて比較した結果、属性が不一致となった記載要素が存在した場合、前記類似性が最も高い第1の特徴量側の属性の登録内容を優先させて、当該不一致となった記載要素の属性を確定させる、
    ことを特徴とする請求項2記載のレイアウト構造解析装置。
  6. 前記特徴量記憶部は、前記書面の書式に各々対応した複数の前記第1の特徴量を種類毎にクラス分けして記憶する複数のクラス別記憶部を備え、
    前記特徴量生成部により生成された前記第2の特徴量と前記判定結果補正部による属性の判定を補正した結果とに基づいて、当該第2の特徴量との類似性が最も高い第1の特徴量を記憶したクラス別記憶部内の記憶内容を更新する特徴量更新部、
    をさらに具備することを特徴とする請求項2ないし5のいずれか1項に記載のレイアウト構造解析装置。
  7. 任意の書式で記載された書面上の複数の記載要素それぞれのレイアウトを表すレイアウト情報と、前記記載要素毎に各々対応する属性と、を予め関連付けて登録した第1の特徴量を特徴量記憶部が記憶するステップと、
    構造解析の対象となる書面の画像を画像入力部が入力画像として取り込むステップと、
    前記画像入力部により取り込まれた前記入力画像のレイアウト解析を行うことにより、レイアウト解析部が、前記入力画像を構成する複数の記載要素を抽出すると共にこの抽出された記載要素毎のレイアウトを表すレイアウト情報を取得するステップと、
    前記レイアウト解析部により抽出された少なくとも各記載要素を文字認識した結果に基づいて、当該抽出された記載要素毎の属性を属性判定部が暫定的に判定するステップと、
    前記属性判定部により判定された記載要素毎の属性と前記レイアウト解析部により取得された記載要素毎のレイアウト情報とを互いに関連付けた第2の特徴量を特徴量生成部が生成するステップと、
    前記特徴量生成部により生成された前記第2の特徴量と前記特徴量記憶部に予め記憶された前記第1の特徴量とを比較した結果に基づいて、前記入力画像を構成する記載要素毎の属性を属性確定部が確定させるステップと、
    を有することを特徴とするレイアウト構造解析方法。
JP2009051790A 2009-03-05 2009-03-05 レイアウト構造解析装置及びレイアウト構造解析方法 Pending JP2010205122A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009051790A JP2010205122A (ja) 2009-03-05 2009-03-05 レイアウト構造解析装置及びレイアウト構造解析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009051790A JP2010205122A (ja) 2009-03-05 2009-03-05 レイアウト構造解析装置及びレイアウト構造解析方法

Publications (1)

Publication Number Publication Date
JP2010205122A true JP2010205122A (ja) 2010-09-16

Family

ID=42966510

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009051790A Pending JP2010205122A (ja) 2009-03-05 2009-03-05 レイアウト構造解析装置及びレイアウト構造解析方法

Country Status (1)

Country Link
JP (1) JP2010205122A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150141122A (ko) * 2014-05-13 2015-12-17 시아오미 아이엔씨. 프라이버시 정보 은닉방법, 장치, 프로그램 및 기록매체
JP2019091250A (ja) * 2017-11-15 2019-06-13 三菱電機ビルテクノサービス株式会社 来訪者受付システム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09204422A (ja) * 1996-01-26 1997-08-05 Casio Comput Co Ltd 読み取りデータ処理装置
JP2001344562A (ja) * 2000-05-31 2001-12-14 Toshiba Corp 文書読取装置および文書読取方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09204422A (ja) * 1996-01-26 1997-08-05 Casio Comput Co Ltd 読み取りデータ処理装置
JP2001344562A (ja) * 2000-05-31 2001-12-14 Toshiba Corp 文書読取装置および文書読取方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20150141122A (ko) * 2014-05-13 2015-12-17 시아오미 아이엔씨. 프라이버시 정보 은닉방법, 장치, 프로그램 및 기록매체
KR101657231B1 (ko) * 2014-05-13 2016-09-13 시아오미 아이엔씨. 프라이버시 정보 은닉방법, 장치, 프로그램 및 기록매체
JP2019091250A (ja) * 2017-11-15 2019-06-13 三菱電機ビルテクノサービス株式会社 来訪者受付システム

Similar Documents

Publication Publication Date Title
US7668372B2 (en) Method and system for collecting data from a plurality of machine readable documents
US8843494B1 (en) Method and system for using keywords to merge document clusters
US6996295B2 (en) Automatic document reading system for technical drawings
US9158833B2 (en) System and method for obtaining document information
US9396540B1 (en) Method and system for identifying anchors for fields using optical character recognition data
JP2004139484A (ja) 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム
JP4661921B2 (ja) 文書処理装置およびプログラム
US20120086963A1 (en) Information processing device to generate information for distinguishing forms
US20090226090A1 (en) Information processing system, information processing apparatus, information processing method, and storage medium
WO2010114478A1 (en) Apparatus and methods for analysing goods cartons
JP6357621B1 (ja) 会計処理装置、会計処理システム、会計処理方法及びプログラム
JP2015146075A (ja) 会計データ入力支援システム、方法およびプログラム
EP2092463A1 (en) Automated generation of form definitions from hard-copy forms
US8832108B1 (en) Method and system for classifying documents that have different scales
WO2000052645A1 (fr) Dispositif de traitement d'image document, procede d'extraction de titre de document et procede d'information d'etiquetage de document
JP2005173730A (ja) 帳票ocrプログラム、方法及び装置
US11321558B2 (en) Information processing apparatus and non-transitory computer readable medium
US20150310269A1 (en) System and Method of Using Dynamic Variance Networks
JP4782346B2 (ja) 電子ドキュメントを処理する方法および装置
JP2014182477A (ja) プログラム及び帳票処理装置
JP2015069256A (ja) 文字識別システム
JP6856916B1 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
KR101486495B1 (ko) 사후 광학 문자 인식 처리에서의 형상 클러스터링 기법
WO2014068770A1 (ja) データ抽出方法、データ抽出装置及びそのプログラム
JP2010205122A (ja) レイアウト構造解析装置及びレイアウト構造解析方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110411

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110419

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110620

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20110620

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110823

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20111227