JP2018055256A - 情報処理装置、情報処理方法及びプログラム - Google Patents
情報処理装置、情報処理方法及びプログラム Download PDFInfo
- Publication number
- JP2018055256A JP2018055256A JP2016188405A JP2016188405A JP2018055256A JP 2018055256 A JP2018055256 A JP 2018055256A JP 2016188405 A JP2016188405 A JP 2016188405A JP 2016188405 A JP2016188405 A JP 2016188405A JP 2018055256 A JP2018055256 A JP 2018055256A
- Authority
- JP
- Japan
- Prior art keywords
- area
- keyword
- character
- size
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Character Input (AREA)
Abstract
【課題】特定のキーワードに対応したバリューを特定する処理を高速化することを目的とする。【解決手段】画像から、文字領域を抽出する抽出手段と、予め設定されたキーワードの文字数から、キーワード領域のサイズを推定する推定手段と、キーワード領域のサイズの推定値と、抽出手段により抽出され記文字領域のサイズと、に基づいて、複数の文字領域の中から、キーワードが記載されたキーワード領域を特定する第1の領域特定手段とを有する。【選択図】図3
Description
本発明は、情報処理装置、情報処理方法及びプログラムに関する。
従来、帳票等のスキャン画像に対して、画像中に記載されている名前や合計金額などが記載されている領域を特定し、文字認識をすることで情報を抽出するシステムがある。名前や合計金額等の記載位置が固定でない場合に、キーワード(項目)の領域を特定し、キーワードの領域との位置関係から対応するバリュー(値)が記載されている領域として特定する技術が知られている。例えば、名前を取り出したい場合は、"名前"もしくは"氏名"をキーワードとし、その右側の領域をバリューの領域とする。また、特許文献1には、表領域の枠の最上段と最下段と最左列に位置する文字列のみを項目名領域検出処理の対象とすることで処理の高速化を図る技術が記載されている。
しかしながら、キーワード領域を特定する際に、帳票全体の文字認識結果を用いる場合、処理に時間がかかってしまう。また、特許文献1の技術は、表以外の領域や罫線のない表には適用できないという問題があった。
本発明はこのような問題点に鑑みなされたもので、特定のキーワードに対応したバリューを特定する処理を高速化することを目的とする。
そこで、本発明は、情報処理装置であって、画像から、文字領域を抽出する抽出手段と、予め設定されたキーワードの文字数から、キーワード領域のサイズを推定する推定手段と、前記キーワード領域のサイズの推定値と、前記抽出手段により抽出された前記文字領域のサイズと、に基づいて、複数の文字領域の中から、前記キーワードが記載されたキーワード領域を特定する第1の領域特定手段とを有することを特徴とする。
本発明によれば、特定のキーワードに対応したバリューを特定する処理を高速化することができる。
以下、本発明の実施形態について図面に基づいて説明する。
(第1の実施形態)
図1は、第1の実施形態に係る情報処理システムを示す図である。情報処理システムは、複写機100と、情報処理装置110とを有している。複写機100は、スキャナ101と、プリンタ102と、通信部103とを有している。スキャナ101は、文書のスキャンを行い、スキャン画像を生成する。プリンタ102は、画像を形成する。通信部103は、ネットワークを介して外部装置と通信を行う。
図1は、第1の実施形態に係る情報処理システムを示す図である。情報処理システムは、複写機100と、情報処理装置110とを有している。複写機100は、スキャナ101と、プリンタ102と、通信部103とを有している。スキャナ101は、文書のスキャンを行い、スキャン画像を生成する。プリンタ102は、画像を形成する。通信部103は、ネットワークを介して外部装置と通信を行う。
情報処理装置110は、CPU111と、ROM112と、RAM113と、HDD114と、表示部115と、入力部116と、通信部117とを有している。CPU111は、ROM112に記憶された制御プログラムを読み出して各種処理を実行する。RAM113は、CPU111の主メモリ、ワークエリア等の一時記憶領域として用いられる。HDD114は、各種データや各種プログラム等を記憶する。なお、後述する情報処理装置110の機能や処理は、CPU111がROM112又はHDD114に格納されているプログラムを読み出し、このプログラムを実行することにより実現されるものである。
通信部117は、ネットワークを介して外部装置との通信処理を行う。表示部115は、各種情報を表示する。入力部116は、キーボードやマウスを有し、ユーザによる各種操作を受け付ける。なお、表示部115と入力部116は、タッチパネルのように一体に設けられていてもよい。また、表示部115は、プロジェクタによる投影を行うものであってもよく、入力部116は、投影された画像に対する指先の位置を、カメラで認識するものであってもよい。
本実施形態においては、複写機100のスキャナ101が帳票等をスキャンし、帳票画像を生成する。そして、帳票画像は、通信部103により情報処理装置110に送信される。情報処理装置110においては、通信部117が帳票画像を受信し、これをHDD114等の記憶部に記憶する。なお、スキャナ101のスキャン対象となる帳票は非定型帳票である。非定型帳票とは、帳票中の情報の記載されている位置が固定でないもの(帳票のフォーマットが未知のもの)のことである。これに対応し、情報処理装置110のHDD114には、非定型帳票に対応した、各情報の記載位置が異なる複数の帳票画像が記憶されている。
図2は、非定型帳票の一例を示す図である。図2の例では、図2(a)に示す帳票201と、図2(b)に示す帳票202においては、名前の情報(帳票太郎)が記載されている位置が互いに異なっている。以下、帳票画像に記載された「氏名」や「名前」といった文字列は、対応する「帳票太郎」の文字列を検索するためのキーワードとなる。この「氏名」や「名前」といった文字列を、以降においてキーワード(項目)と称することとする。さらに、キーワードに対応した文字列(例えば、「氏名」に対応した文字列である「帳票太郎」)をバリュー(値)と称することとする。さらに、キーワードが記載された領域をキーワード領域、バリューが記載された領域をバリュー領域と称することとする。
図3は、情報処理装置110によるバリュー抽出処理を示すフローチャートである。S301において、CPU111は、HDD114に記憶されている帳票画像を1つ取得する。次に、S302において、CPU111は、S301において取得した帳票画像に対して、領域解析を行うことにより、文字領域を抽出する。具体的には、CPU111は、帳票画像中の矩形領域毎の属性を判別する。ここで、属性としては、文字領域、画像領域、グラフィック領域などがあるが、本実施形態においては、領域解析結果で特定された文字領域を利用する。領域解析は既知の手法を用いればよい。
図4は、文字領域の抽出結果の一例を示す図である。図4に示す抽出結果は、図2(a)に示す帳票201に対応した帳票画像に対応している。CPU111は、抽出した文字領域の情報を領域テーブルに格納する。図5は、領域テーブルの一例を示す図である。領域テーブルには、領域を識別するIDと、文字領域の位置としての左上座標と、文字領域の幅及び高さと、文字認識結果のフィールドが設けられている。なお、座標値は、画像の左上を原点とし、横方向をX軸とし、縦方向をY軸とした際の、ピクセル値とする。
CPU111は、得られた文字領域に対しIDを付与し、文字領域に対応した、ID、左上座標、幅及び高さを領域テーブルに書き込む。なお、図5に示すIDと図4に示すIDは対応している。なお、S302の処理時点においては文字認識処理が実行されていないため、領域テーブルの文字認識結果のフィールドは空欄である。
図3に戻り、S302の処理の後、S303において、CPU111は、キーバリューテーブルからキーワードの文字数を特定する。図6は、キーバリューテーブルの一例を示す図である。キーバリューテーブルは、例えばHDD114に予め記憶されているものとする。キーバリューテーブルにおいて、インデックス名と、キーワード文字列と、方向と、距離と、が対応付けられている。インデックス名は、キーワードを識別する情報である。キーワード文字列は、キーワードとして表示される文字列である。キーワード文字列は1つでもよく、複数でもよい。方向及び距離については後述する。
キーワード文字列として、例えば、インデックス「total名」に対しては「合計」という1つの文字列のみが対応付けられている。また、その文字数は2文字である。一方、インデックス名「name」に対しては、「氏名」、「名前」、「患者名」の3種類のキーワード文字列が対応付けられている。これらの文字数は、2文字又は3文字である。CPU111は、S303において、キーバリューテーブルのキーワード文字列に格納されている文字列の文字数を特定する。なお、CPU111は、複数の文字列が格納されている場合には、文字数の最小値と最大値を特定する。
次に、S304において、CPU111は、キーワードの文字数に基づいて、キーワード領域の領域サイズを推定する。図7は、領域サイズ推定処理(S304)の説明図である。推定には、予め設定された、文字サイズの最大値及び最小値と、文字間のマージンサイズの最大値及び最小値が用いられる。例えば、文字の最大値を25ピクセル、最小値を18ピクセル、マージンの最大値を15ピクセル、最小値を0ピクセルと定めたとする。
インデックス名「total」に対するキーワード文字列の文字数は2文字である。したがって、この場合、CPU111は、図7(a)に示すように、幅・高さ18の最小サイズの文字701を2つ横に並べた高さ18ピクセル、幅36ピクセルの矩形領域702をキーワード領域の最小値と推定する。一方で、CPU111は、図7(b)に示すように、最大サイズの文字列711を2つ横に並べ、最大サイズのマージン712を文字間に挿入した、高さ25ピクセル、幅65ピクセルの矩形領域714をキーワード領域の最大値と推定する。
なお、本実施形態においては、CPU111は、文字列が横方向に並んでいるものとして、領域サイズの推定を行ったが、文字列が縦に並んでいる場合も想定して別途縦長サイズのキーワード領域の領域サイズを推定してもよい。
図3に戻り、S304の後、S305において、CPU111は、領域サイズの推定値に基づいて、キーワード領域を特定する。本処理は、領域特定処理の一例である。なお、本処理については、図9を参照しつつ後述する。次に、S306において、CPU111は、S305において特定したキーワード領域の位置に基づいて、バリュー領域を特定する。CPU111は、バリュー領域を特定する際には、予め設定されたキーワード領域とバリュー領域の位置関係を示す情報を参照する。本実施形態においては、CPU111は、図6に示すキーバリューテーブルの方向及び距離を参照する。ここで、方向及び距離は、キーワード領域を基準とした、バリュー領域の方向と距離を示す情報である。すなわち、これらの情報は、キーワード領域とバリュー領域の位置関係を示す情報である。方向及び距離には、右方向で30ピクセル以内にある領域というように定義される。
CPU111は、例えば、図8に示すように、キーワード領域と同じ高さで右方向に30ピクセル伸ばした領域801と重なる文字領域を領域テーブルから検索し、領域801と一致した文字領域をバリュー領域として特定する。図5に示すID15の領域がキーワード領域として特定された場合、キーワード領域と同じ高さで右方向に30ピクセル伸ばした領域と重なる領域であるID16の領域がバリュー領域として特定される。なお、S306の処理は、領域特定処理の一例である。次に、S307において、CPU111は、S306において特定されたバリュー領域に対して、文字認識を行い、得られた結果をHDD114に格納する。S307の処理は、バリューの文字を特定する文字特定処理の一例である。なお、抽出したいバリューが複数ある場合には、S303〜S307の処理を繰り返す。
図9は、キーワード領域特定処理(S305)における詳細な処理を示すフローチャートである。まず、S901において、CPU111は、S304において推定した領域サイズに基づいて、キーワード領域に対して基準となるサイズ範囲を定める。CPU111は、S304において特定した領域サイズの最小値から最小値の範囲をサイズ範囲として定める。なお、CPU111は、キーワード領域の領域サイズの推定値からサイズ範囲を定めればよく、そのための処理は実施形態に限定されるものではない。例えば、CPU111は、S304において、代表的な1つの領域サイズを推定し、S901において、代表的な領域サイズを中心値とした所定の幅のサイズ範囲を定めてもよい。
次に、S902において、CPU111は、領域テーブルに格納されている文字領域から、サイズ範囲内のサイズの文字領域をキーワード領域候補として選択する。例えば、インデックス名「total」のキーワードに対するサイズ範囲の最大値が高さ25ピクセル、幅65ピクセル、最小値高さ18ピクセル、幅36ピクセルであるとする。この場合には、図6の領域テーブルからは、ID2、ID4、ID7、ID13、ID15の文字領域がキーワード領域候補として選択される。
次に、S903において、CPU111は、未処理のキーワード領域候補があるか否かを確認する。CPU111は、未処理のキーワード領域候補が存在する場合には(S903でYES)、処理をS904へ進める。CPU111は、未処理のキーワード領域候補が存在しない場合には(S903でNO)、処理をS908へ進める。S904において、CPU111は、未処理のキーワード領域候補を1つ選択する。以下、S904において選択されたキーワード領域候補を選択領域と称する。なお、CPU111は、未処理のキーワード領域候補が複数存在する場合には、左上座標のxの座標が最も小さいものを選択することとする。また、他の例としては、左上座標のy座標の値が最も小さいものを選択してもよい。
次に、S905において、CPU111は、選択領域に対して文字認識を行い、認識結果を、領域テーブルの、選択領域に対応する文字認識結果の欄に書き込む。なお、CPU111は、複数のバリューを抽出する際には、領域テーブルに書き込まれた文字認識結果を参照する。これにより、同じ領域に対し、何度も文字認識を行う手間を省くことができる。なお、文字認識には、既知の方法を用いる。次に、S906において、CPU111は、文字認識結果が、キーバリューテーブルのキーワードの文字列と一致するか否かを確認する。例えば、図6のインデックス名「total」のキーワードの場合には、キーワードの文字列は「合計」なので、文字認識結果が「合計」であるか否かを確認する。
なお、他の例としては、情報処理装置110が文字認識結果の候補を複数出力する場合には、CPU111は、キーワードの文字が認識結果に含まれているか否かを確認してもよい。また、文字認識結果は画像上のノイズ等に影響されて余分な文字を含む文字認識結果が得られる場合等誤認識の可能性がある。これに対応し、文字認識結果の中にキーワード文字列の5割が含まれていたら一致すると判断するなど、一致の条件を緩めてもよい。
CPU111は、両文字列が一致する場合には(S906でYES)、処理をS907へ進める。CPU111は、両文字が一致しない場合には(S906でNO)、選択領域としてのキーワード領域候補に処理済みの情報を設定し、その後処理をS903へ進める。S907において、CPU111は、選択領域をキーワード領域として特定し、キーワード領域をRAM113等の記憶部に記録する。
一方、S908においては、CPU111は、キーワード領域候補として選択されていない文字領域(未選択領域)に対し、キーワード領域があるかの検索を行い、キーワード領域の特定を行う。具体的には、CPU111は、すべての未選択領域に対して、文字認識を実行し、S906の処理と同様にキーワード名と一致している領域がないかの判断を行う。この処理においてもキーワード領域の特定ができなかった場合は、バリューの領域の特定(S306)と、バリューの領域の文字認識(S307)は実施せず、バリューの抽出に失敗したと判断し、失敗を示す情報をRAM113に記録し、処理を終了する。
以上のように、本実施形態に係る情報処理装置110は、キーワードの文字数に基づいて、キーワード領域の領域サイズを推定し、領域サイズの推定値に基づいて、文字領域からキーワード領域候補を絞り込む。これにより、文字領域すべてに対して文字認識を行うことによりキーワード領域を特定する場合に比べて、処理を高速化することができる。また、情報処理装置110は、キーワード領域とバリュー領域の位置関係と、キーワード領域の位置と、に基づいてバリュー領域を特定する。したがって、罫線(枠線)が省略されている表や、表以外の領域においても、キーワード領域の特定及びバリュー領域の特定を行うことができる。以上のように、情報処理装置110は、特定のキーワードに対応したバリューを特定する処理を高速化することができる。
(第2の実施形態)
次に、第2の実施形態に係る情報処理装置110について説明する。第2の実施形態に係る情報処理装置110は、キーワード領域とバリュー領域とを結合した結合領域の領域サイズを推定する。そして、情報処理装置110は、結合領域の領域サイズの推定値(推定サイズ)に基づいて、バリューとしての文字列を特定する。
次に、第2の実施形態に係る情報処理装置110について説明する。第2の実施形態に係る情報処理装置110は、キーワード領域とバリュー領域とを結合した結合領域の領域サイズを推定する。そして、情報処理装置110は、結合領域の領域サイズの推定値(推定サイズ)に基づいて、バリューとしての文字列を特定する。
図10は、第2の実施形態に係る情報処理装置110による、バリュー抽出処理を示すフローチャートである。なお、図10に示す各処理のうち、図3を参照しつつ説明した第1の実施形態に係る各処理と同一の処理には、同一の番号を付し、説明を省略する。CPU111は、S303の処理の後、処理をS1001へ進める。S1001において、CPU111は、キーバリューテーブルから、バリューの文字数を特定する。図11は、第2の実施形態に係るキーバリューテーブルの一例を示す図である。第2の実施形態に係るキーバリューテーブルにおいては、インデックス名に、バリュー文字数がさらに対応付けられている。バリュー文字数は、バリューとなる文字列が取り得る文字数である。例えば、図11に示すように、インデックス名「total」に対しては、5−7の文字数が設定されている。
図10に戻り、S1001の後、S1002において、CPU111は、キーワードの文字数及びバリューの文字数に基づいて、結合領域の領域サイズを推定する。例えば、インデックス名「total」に対しては、キーワードが「合計」という2文字の文字列であり、バリューの文字数が「5〜8」文字である。したがって、これらを結合すると、7〜10文字となる。この場合、CPU111は、7文字の場合の領域サイズの最小値と、10文字の場合の領域サイズの最大値を求める。なお、本処理は、キーワード領域推定処理(S304)における処理と同様である。次に、S1003において、CPU111は、S1002において推定した領域サイズに基づいて、バリューの文字を特定する。
図12は、バリュー特定処理(S1003)における詳細な処理を示すフローチャートである。まず、S1201において、CPU111は、S1002において推定した、結合領域の領域サイズに基づいて、結合領域に対して基準となるサイズ範囲を定める。CPU111は、S1002において特定した領域サイズの最小値から最小値の範囲をサイズ範囲として定める。なお、本処理は、S901の処理と同様である。次に、S1202において、CPU111は、領域テーブルに格納されている文字領域から、サイズ範囲内のサイズの文字領域を結合領域候補として選択する。
次に、S1203において、CPU111は、未処理の結合領域候補があるか否かを確認する。CPU111は、未処理の結合領域候補が存在する場合には(S1203でYES)、処理をS1204へ進める。CPU111は、未処理の結合領域候補が存在しない場合には(S1203でNO)、処理をS1208へ進める。S1204において、CPU111は、未処理の結合領域候補を1つ選択する。以下、S1204において選択された結合領域候補を選択領域と称する。なお、CPU111は、未処理の結合領域候補が複数存在する場合には、左上座標のxの座標が最も小さいものを選択することとする。また、他の例としては、左上座標のy座標の値が最も小さいものを選択してもよい。
次に、S1205において、CPU111は、選択領域に対して文字認識を行い、認識結果を、領域テーブルの、選択領域に対応する文字認識結果の欄に書き込む。次に、S1206において、CPU111は、文字認識結果の一部がキーワードの文字列と一致しているか否かを確認する。例えば、図2に示す「合計20000円」の記載に対応した文字領域が選択領域である場合には、文字認識結果として「合計20000円」が得られる。一方、キーワードの文字列は「合計」である。したがって、この場合には、文字認識結果の一部である「合計」の文字列がキーワードの文字列と一致する。なお、文字認識結果の一宇がキーワードの文字列と一致する結合領域候補は結合領域であり、S1206の処理は、結合領域を特定する領域特定処理の一例である。
CPU111は、文字認識結果の一部がキーワード文字列と一致した場合には(S1206でYES)、処理をS1207へ進める。CPU111は、文字認識結果の一部がキーワード文字列と一致しなかった場合には(S1206でNO)、処理をS1203へ進める。S1207において、CPU111は、文字認識結果からキーワードの文字列を除いたもの、すなわちキーワードの文字以外の文字をバリューの文字として特定する。例えば、文字認識結果「合計20000円」に対しては、キーワードの文字列「合計」を除いた文字列「20000円」がバリューの文字として特定される。CPU111は、バリューの文字列を記憶部に記録する。S1207の処理は、バリューの文字を特定する文字特定処理の一例である。
一方、S1208において、CPU111は、結合領域候補として選択されていない文字領域(未選択領域)に対して、文字認識を実行し、未選択領域に、S904の処理と同様にキーワードの文字列と一致する領域があるか確認する。なお、キーワード領域とバリュー領域が結合している場合もある。したがって、CPU111は、S1206、S1207と同様に、文字認識結果の一部がキーワードの文字列と一致するか否かも確認する。CPU111は、この処理でキーワード領域の特定ができなかった場合は、バリューの抽出に失敗したと判断し、失敗を示す情報をRAM113に記録し、処理を終了する。なお、第2の実施形態に係る情報処理装置110の構成及び処理は、第1の実施形態に係る情報処理装置110の構成及び処理と同様である。
以上のように、第2の実施形態に係る情報処理装置110は、キーワード領域とバリュー領域の結合領域に対して文字認識を行い、認識結果からキーワードを除いたものをバリューの文字として特定する。すなわち、帳票画像から抽出されたすべての文字領域に対して文字認識を行う必要がないため、処理の高速化を図ることができる。また、キーワード領域とバリュー領域が近い場合には、キーワード領域とバリュー領域が1つの文字領域として抽出される可能性があるが、第2の実施形態に係る情報処理装置110は、このような場合においても、バリューの文字を特定することができる。
以上、本発明の好ましい実施形態について詳述したが、本発明は係る特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。
(その他の実施例)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
110 情報処理装置
111 CPU
112 ROM
113 RAM
114 HDD
111 CPU
112 ROM
113 RAM
114 HDD
Claims (12)
- 画像から、文字領域を抽出する抽出手段と、
予め設定されたキーワードの文字数から、キーワード領域のサイズを推定する推定手段と、
前記キーワード領域のサイズの推定値と、前記抽出手段により抽出された前記文字領域のサイズと、に基づいて、複数の文字領域の中から、前記キーワードが記載されたキーワード領域を特定する第1の領域特定手段と
を有することを特徴とする情報処理装置。 - 予め設定された前記キーワード領域との位置関係に基づいて、前記キーワードに対応するバリューが記載されたバリュー領域を特定する第2の領域特定手段と、
前記バリュー領域に対する文字認識によりバリューの文字を特定する文字特定手段と
をさらに有することを特徴とする請求項1に記載の情報処理装置。 - 前記文字領域のサイズが前記キーワード領域のサイズの推定値を基準としたサイズ範囲内の値となる前記文字領域を、キーワード領域候補として選択する選択手段をさらに有し、
前記第1の領域特定手段は、前記キーワード領域候補に対する文字認識結果に基づいて、前記キーワード領域候補から前記キーワード領域を特定することを特徴とする請求項2に記載の情報処理装置。 - 前記推定手段は、予め設定された文字のサイズと、マージンのサイズとに基づいて、前記キーワード領域のサイズを推定することを特徴とする請求項1乃至3の何れか1項に記載の情報処理装置。
- 画像から、文字領域を抽出する抽出手段と、
予め設定されたキーワードが表示されるキーワード領域と、前記キーワードに対応したバリューが表示されるバリュー領域とを結合した結合領域のサイズを、前記キーワード及びバリューの文字数に基づいて推定する推定手段と、
前記結合領域のサイズの推定値と、前記抽出手段により抽出された前記文字領域のサイズと、に基づいて、複数の文字領域の中から、前記結合領域を特定する領域特定手段と、
前記結合領域の文字認識結果と前記キーワードの文字列と、に基づいて、前記バリューの文字を特定する文字特定手段と
を有することを特徴とする情報処理装置。 - 前記文字領域のサイズが前記結合領域のサイズの推定値を基準としたサイズ範囲内の値となる前記文字領域を、結合領域候補として選択する選択手段をさらに有し、
前記領域特定手段は、前記結合領域候補に対する文字認識結果に基づいて、前記結合領域候補から前記結合領域を特定することを特徴とする請求項5に記載の情報処理装置。 - 前記文字特定手段は、前記結合領域に対する文字認識において、前記キーワードの文字に一致した文字以外の文字を前記バリューの文字として特定することを特徴とする請求項5又は6に記載の情報処理装置。
- 前記推定手段は、予め設定された文字のサイズと、マージンのサイズとに基づいて、前記結合領域のサイズを推定することを特徴とする請求項5乃至7の何れか1項に記載の情報処理装置。
- 情報処理装置が実行する情報処理方法であって、
画像から、文字領域を抽出する抽出ステップと、
予め設定されたキーワードの文字数から、キーワード領域のサイズを推定する推定ステップと、
前記キーワード領域のサイズの推定値と、前記抽出ステップにおいて抽出された前記文字領域のサイズと、に基づいて、複数の文字領域の中から、前記キーワードが記載されたキーワード領域を特定する第1の領域特定ステップと
を含むことを特徴とする情報処理方法。 - 情報処理装置が実行する情報処理方法であって、
画像から、文字領域を抽出する抽出ステップと、
予め設定されたキーワードが表示されるキーワード領域と、前記キーワードに対応したバリューが表示されるバリュー領域とを結合した結合領域のサイズを、前記キーワード及びバリューの文字数に基づいて推定する推定ステップと、
前記結合領域のサイズの推定値と、前記抽出ステップにおいて抽出された前記文字領域のサイズと、に基づいて、複数の文字領域の中から、前記結合領域を特定する領域特定ステップと、
前記結合領域の文字認識結果と前記キーワードの文字列と、に基づいて、前記バリューの文字を特定する文字特定ステップと
を含むことを特徴とする情報処理方法。 - コンピュータを、
画像から、文字領域を抽出する抽出手段と、
予め設定されたキーワードの文字数から、キーワード領域のサイズを推定する推定手段と、
前記キーワード領域のサイズの推定値と、前記抽出手段により抽出された前記文字領域のサイズと、に基づいて、複数の文字領域の中から、前記キーワードが記載されたキーワード領域を特定する第1の領域特定手段と
して機能させるためのプログラム。 - コンピュータを、
画像から、文字領域を抽出する抽出手段と、
予め設定されたキーワードが表示されるキーワード領域と、前記キーワードに対応したバリューが表示されるバリュー領域とを結合した結合領域のサイズを、前記キーワード及びバリューの文字数に基づいて推定する推定手段と、
前記結合領域のサイズの推定値と、前記抽出手段により抽出された前記文字領域のサイズと、に基づいて、複数の文字領域の中から、前記結合領域を特定する領域特定手段と、
前記結合領域の文字認識結果と前記キーワードの文字列と、に基づいて、前記バリューの文字を特定する文字特定手段と
して機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016188405A JP2018055256A (ja) | 2016-09-27 | 2016-09-27 | 情報処理装置、情報処理方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016188405A JP2018055256A (ja) | 2016-09-27 | 2016-09-27 | 情報処理装置、情報処理方法及びプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2018055256A true JP2018055256A (ja) | 2018-04-05 |
Family
ID=61833045
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016188405A Pending JP2018055256A (ja) | 2016-09-27 | 2016-09-27 | 情報処理装置、情報処理方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2018055256A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020042320A (ja) * | 2018-09-06 | 2020-03-19 | 富士通フロンテック株式会社 | 画像認識装置、画像認識方法、及び画像認識プログラム |
JP2020119152A (ja) * | 2019-01-22 | 2020-08-06 | 富士ゼロックス株式会社 | 情報処理装置、及び情報処理プログラム |
JP2021064209A (ja) * | 2019-10-15 | 2021-04-22 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
-
2016
- 2016-09-27 JP JP2016188405A patent/JP2018055256A/ja active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2020042320A (ja) * | 2018-09-06 | 2020-03-19 | 富士通フロンテック株式会社 | 画像認識装置、画像認識方法、及び画像認識プログラム |
JP7054662B2 (ja) | 2018-09-06 | 2022-04-14 | 富士通フロンテック株式会社 | 画像認識装置、画像認識方法、及び画像認識プログラム |
JP2020119152A (ja) * | 2019-01-22 | 2020-08-06 | 富士ゼロックス株式会社 | 情報処理装置、及び情報処理プログラム |
JP2021064209A (ja) * | 2019-10-15 | 2021-04-22 | 富士ゼロックス株式会社 | 情報処理装置及び情報処理プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6878034B2 (ja) | 情報処理装置、制御方法、およびプログラム | |
US8107727B2 (en) | Document processing apparatus, document processing method, and computer program product | |
JP6900164B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
US11475688B2 (en) | Information processing apparatus and information processing method for extracting information from document image | |
KR102090973B1 (ko) | 정보 처리장치, 정보 처리방법, 및 기억매체 | |
JP5380040B2 (ja) | 文書処理装置 | |
JP2018055256A (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP5623574B2 (ja) | 帳票識別装置および帳票識別方法 | |
US10984277B2 (en) | Image analysis apparatus, image analysis method, and non-transitory computer readable medium | |
JP6931168B2 (ja) | 情報処理装置、制御方法、プログラム | |
JP2008108114A (ja) | 文書処理装置および文書処理方法 | |
JP4518212B2 (ja) | 画像処理装置及びプログラム | |
JP6700705B2 (ja) | 振り分けシステム、情報処理方法、及びプログラム | |
JP6582464B2 (ja) | 情報入力装置、およびプログラム | |
JP7383882B2 (ja) | 情報処理装置、及び情報処理プログラム | |
JP2013149210A (ja) | 画像処理プログラム、画像処理方法、及び画像処理装置 | |
JP4517822B2 (ja) | 画像処理装置及びプログラム | |
JP6947971B2 (ja) | 情報処理装置、制御方法、プログラム | |
US9912834B2 (en) | Document camera device and cutout assistance method | |
JP6682827B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP2016103150A (ja) | 文書処理装置および文書処理プログラム | |
JP7404943B2 (ja) | 情報処理装置及び情報処理プログラム | |
US11995908B2 (en) | Information processing device and non-transitory computer readable medium | |
JP2019192959A (ja) | 情報処理装置及びプログラム | |
JP6536542B2 (ja) | 情報処理装置、制御方法、プログラム |