JP6693082B2 - 情報処理装置及びプログラム - Google Patents
情報処理装置及びプログラム Download PDFInfo
- Publication number
- JP6693082B2 JP6693082B2 JP2015208927A JP2015208927A JP6693082B2 JP 6693082 B2 JP6693082 B2 JP 6693082B2 JP 2015208927 A JP2015208927 A JP 2015208927A JP 2015208927 A JP2015208927 A JP 2015208927A JP 6693082 B2 JP6693082 B2 JP 6693082B2
- Authority
- JP
- Japan
- Prior art keywords
- common
- elements
- forms
- unit
- extracted
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Character Input (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、複数の帳票の特徴が似通っていることに起因する帳票の種別の誤判定を減らすことを目的とする。
請求項2に係る発明は、請求項1に記載の情報処理装置において、前記抽出手段は、前記取得手段により取得された候補から2以上の前記帳票に共通しない独自要素を抽出し、前記決定手段は、前記独自要素が前記第1抽出手段で前記候補として抽出されたときの前記類似度が決められた条件を満たさない場合に、前記独自要素と前記2以上の共通要素とを前記帳票の特徴を示す要素に決定する。
請求項3に係る発明は、請求項1に記載の情報処理装置において、前記第1抽出手段は、前記第1の要素群に含まれる要素のうち、前記類似度が決められた条件を満たさない要素を、前記帳票の特徴を示す要素の候補として抽出しない。
請求項4に係る発明は、請求項1に記載の情報処理装置において、前記抽出手段は、前記取得手段により取得された候補から2以上の前記帳票に共通しない独自要素を抽出し、前記決定手段は、前記抽出手段により抽出された独自要素を、当該独自要素を含む帳票の特徴を示す要素に決定する。
請求項6に係る発明は、請求項5に記載の情報処理装置において、前記付与手段は、前記共通要素よりも高い優先順位を前記独自要素に付与し、前記決定手段は、前記独自要素
のみを前記帳票の特徴を示す要素に決定する。
請求項7に係る発明は、請求項5に記載の情報処理装置において、前記付与手段は、前記複数の帳票における出現頻度が低い共通要素ほど高い優先順位を付与し、前記決定手段は、前記独自要素と、前記付与手段により付与された優先順位に基づいて選択した共通要素とを、前記帳票の特徴を示す要素に決定する。
請求項8に係る発明は、請求項5乃至7いずれか1項に記載の情報処理装置において、帳票から読み取られた要素と前記決定手段により決定された要素との比較により当該帳票の種別を判定する判定手段と、前記付与手段により付与された優先順位が高い要素ほど前記判定手段による判定における重み付けを重くする重み付け手段とを備える。
請求項2に係る発明によれば、第1の画像に互いに異なるノイズを付加した複数の第2の画像を用いて帳票の特徴を示す要素を抽出する構成を備えない場合と比べて、帳票を読み取って生成された画像に含まれるノイズに起因する帳票の種別の誤判定を減らすことができる。
請求項3に係る発明によれば、独自要素のノイズに対する耐性が不足している場合に耐性の不足を補うことができる。
請求項4に係る発明によれば、ノイズに対する耐性が不足している要素を帳票の特徴を示す要素として用いないようにすることができる。
請求項5に係る発明によれば、帳票に独自要素が含まれている場合には、その独自要素をその帳票の特徴を示す要素として用いることができる。
請求項6、11に係る発明によれば、帳票の種別の判定における優先順位に基づいて帳票の特徴を示す要素を決定する構成を備えない場合と比べて、複数の帳票の特徴が似通っていることに起因する帳票の種別の誤判定を減らすことができる。
請求項7に係る発明によれば、帳票に独自要素が含まれている場合には、その独自要素をその帳票の特徴を示す要素として用いることができる。
請求項8に係る発明によれば、出現頻度が低い共通要素ほど高い優先順位を付与する構成を備えない場合と比べて、帳票の種別の誤判定を減らすことができる。
請求項9に係る発明によれば、優先順位が高い要素ほど重み付けを重くする構成を備えない場合と比べて、帳票の種別の判定の精度を高めることができる。
<第1実施形態>
図1は、実施形態に係るシステムの全体を示す図である。情報処理装置1と読取装置2は、LANなどの通信手段3で接続されている。読取装置2は、帳票のサンプルを読み取って画像データを生成し、この画像データを情報処理装置1に送信する。情報処理装置1は、受信した画像データで表される画像から、帳票の特徴を示す要素を抽出する。抽出された要素は、実際の事務処理で使用される帳票の種別を判定するために用いられる。
制御部11は、帳票の特徴を示す要素の候補を取得する。具体的には、最初に、ユーザが読取装置2にサンプルの帳票を読み取らせる。読取装置2は、サンプルの帳票を読み取って画像データを生成し、画像データを情報処理装置1に送信する。情報処理装置1の制御部11は、読取装置2から受信した画像データで表される画像に対して文字認識と罫線認識を実行する。文字認識は、例えば、OCR(Optical Character Recognition)の手法を用いる。罫線認識は、例えば、特開2003−109007号公報の段落0051に記載されている、X軸方向とY軸方向の黒画素の累積値から罫線を認識する手法を用いる。
図7は、独自要素と共通要素の抽出結果を示す図である。制御部11は、候補リストに格納されている要素の内容を比較して、独自要素と共通要素を抽出する。独自要素は、2以上の帳票で要素の内容が共通しない要素である。共通要素とは、2以上の帳票で要素の内容が共通する要素である。図中で要素IDに○が付加された要素が独自要素であり、要素IDに●が付加された要素が共通要素である。
制御部11が、ステップS2で抽出された独自要素を、この独自要素を含む帳票の特徴を示す要素に決定する。例えば、図7に示す帳票ID=001の帳票については、「学資保険申込書」(要素ID=004)が独自要素として抽出されているから、制御部11は、この独自要素をこの帳票の特徴を示す要素に決定する。同様に、制御部11は、帳票ID=002、004、005の帳票についても、それぞれ、抽出された独自要素を帳票の特徴を示す要素に決定する。
制御部11が、2以上の共通要素を含む帳票を抽出し、この共通要素をその帳票の特徴を示す要素に決定する。図示した例では、共通要素として、「様式A−1」と「住宅ローン申込書」が抽出されている。「様式A−1」は、帳票ID=001、002、003に共通の要素であるから、この要素だけでは、帳票ID=001、002、003の区別がつかない。また、「住宅ローン申込書」は、帳票ID=003、004、005に共通の要素であるから、この要素だけでは、帳票ID=003、004、005の区別がつかない。ところが、5つの帳票のうち、帳票ID=003は、複数の共通要素(「様式A−1」、「住宅ローン申込書」)が抽出されており、この複数の共通要素の組み合わせは、他の帳票にはないものである。従って、制御部11は、この複数の共通要素を、帳票ID=003の帳票の特徴を示す要素に決定する。
本実施形態では、或る帳票から独自要素が抽出されなかった場合であっても、その帳票が2以上の共通要素を含む場合には、その共通要素がその帳票の特徴を示す要素に決定される。よって、本実施形態によれば、複数の帳票の特徴が似通っていることに起因する帳票の種別の誤判定が減少する。
第1実施形態では、帳票の画像を表示した画面上でユーザが帳票の特徴を示す要素の候補を指定するように構成されているが、第2実施形態では、情報処理装置1が帳票の特徴を示す要素の候補を抽出する。具体的には、以下のとおりである。
(a)記入されたもの
例えば、手書きで記入された文字や記号、押印によって形成された印影、記入すべき箇所を示すために鉛筆で書き込まれた印などである。図示した例では、氏名の欄に「富士 太郎」なる文字列(ノイズN1)が手書きで記入されている。また、申請日の欄と氏名の欄に、記入すべき箇所を囲んだ印(ノイズN2)が書き込まれている。また、氏名の欄に印影(ノイズN3)が形成されている。
読取装置2で読み取るとウォーターマークを含んだ画像が生成されるように帳票に隠し文字が設定されている場合がある。ウォーターマークは、帳票の記入や視認に支障が生じない程度の濃度で形成されるが、ウォーターマーク自体の視認性を確保するために、例えば、大きなサイズの文字、斜めの配置、複数のウォーターマークの規則的又は不規則な配置などにより形成される。図示した例では、「コピー禁止」なるウォーターマーク(ノイズN4)が形成されている(図示の都合上、ハッチングを使用)。なお、隠し文字を用いずに、顕在化したウォーターマークが帳票に形成されている場合もある。
例えば、消しゴムのかす、インクのしみ、埃などの汚れが帳票に付着している場合がある。また、帳票の折れ目やしわなどが線状の汚れとなる場合もある。また、読取装置2のプラテンガラスに汚れが付着している場合もある。図示した例では、面状の汚れ(図示の都合上、ハッチングを使用。ノイズN5)と線状の汚れ(ノイズN6)が生じている。
帳票の裏面に文字などが形成されている場合がある。例えば、記入の要領が裏面に記載されている場合や、両面に記入欄が設けられている場合などがある。このように帳票の裏面に文字などが記載されており、且つ、裏面の文字などが透けて見える程度の薄い紙が用いられている場合、裏面の文字などが読取装置2に読み取られてしまうことがある。
本実施形態におけるノイズの概念には、読み取り時の帳票の傾きに起因するものも含まれる。例えば、読取装置2の読み取り位置に帳票を配置したときに帳票に傾きが生じることがある。また、読み取り位置に原稿を搬送する装置が備えられている場合、傾いた姿勢で帳票が搬送されることがある。この傾きの大きさによっては、例えば文字が認識されなかったり、罫線の方向が誤った方向に認識されるなどして、帳票の特徴が正確に認識されなくなるおそれがある。
最初に、ユーザが読取装置2にサンプルの帳票を読み取らせる。読取装置2は、サンプルの帳票を読み取って第1の画像データを生成し、第1の画像データを情報処理装置1に送信する。情報処理装置1の制御部11は、読取装置2から受信した第1の画像データで表される第1の画像に対して文字認識と罫線認識を実行する。文字認識は、例えば、OCR(Optical Character Recognition)の手法を用いる。罫線認識は、例えば、特開2003−109007号公報の段落0051に記載されている、X軸方向とY軸方向の黒画素の累積値から罫線を認識する手法を用いる。本実施形態は、第1の要素群として文字列を取得する例を示す。図3の例では、「様式A−1」、「申請日 年 月 日」、「審査部 御中」、「住宅ローン申込書」、「申込内容」、「氏名 印」の各文字列が認識される。制御部11は、これらの文字列を第1の要素群として取得する。
制御部11は、第1の画像にノイズを付加する。付加するノイズは、例えば前述の(a)記入されたもの、(b)ウォーターマーク、(c)汚れ、(d)裏写り、(e)傾き、である。裏写りを想定した文字は、鏡像でもよいし、鏡像でなくてもよい。記憶部12には、ノイズの初期値が記憶されている。ノイズの初期値とは、例えば、(a)については、文字や線の数、(b)については、文字列の面積、(c)については、汚れの面積、(d)については、裏写りの面積、(e)については、傾きの角度を定めたものである。また、ノイズの初期値の1つとして、例えば、第1の要素群に含まれる各要素(本実施形態では、文字列)の外接矩形内でノイズが占める面積の割合が定められていてもよい。
ステップS01と同様に、制御部11が、第2の画像の各々に対して文字認識を実行して文字列を認識し、認識した文字列を第2の要素群として取得する。図8の例では、ノイズの重なった文字が認識されなくなるため、「様 A−1」、「申請 年 月 日」、「審査部 御中」、「住宅ローン申 書」、「申込内容」、「氏 富士 太郎」の各文字列が認識される。制御部11は、これらの文字列を第2の要素群として取得する。ただし、前述のとおり、複数の第2の画像の各々はノイズの面積や位置などが互いに異なっている。そのため、例えば、図8の例では、「住宅ローン申込書」の「込」にノイズが重なったために「込」が認識されないが、別の文字にノイズが重なった場合には、その文字が認識されなくなる。従って、取得される第2の要素群は、第2の画像毎に異なるものとなる。制御部11は、複数の第2の画像の各々から第2の要素群を取得する。従って、第2の要素群は、第2の画像の数と同じ数だけ取得される。
制御部11は、第1の要素群リストと第2の要素群リストから同一の要素IDに対応する要素を読み出して、2つの要素の類似度を求める。類似度とは、文字列の場合、全文字数に対する一致した文字数の割合である。例えば、要素ID=004については、第1の要素群リストでは「住宅ローン申込書」、第2の要素群リストでは「住宅ローン申 書」であるから、類似度は、0.875である。
図14は、情報処理装置1の機能を示すブロック図である。取得手段110、抽出手段120は、第1実施形態と同じ機能を備える。取得手段110は、複数の帳票の各々の特徴を示す要素の候補を取得する。抽出手段120は、取得手段110により取得された候補から、2以上の帳票に共通しない独自要素と、2以上の帳票に共通する共通要素とを抽出する。付与手段140は、複数の帳票の各々について、当該帳票に含まれる独自要素と共通要素に対して、当該帳票の種別の判定における優先順位を付与する。決定手段150は、複数の帳票の各々について、付与手段140により付与された優先順位に基づいて、少なくとも1つの前記独自要素又は前記共通要素を当該帳票の特徴を示す要素に決定する。これらの機能を実現するための具体的な構成は、以下のとおりである。
制御部11は、複数の帳票の各々の特徴を示す要素の候補を取得する。具体的には、制御部11は、第1実施形態のステップS1と同じ処理により、候補リストを作成する(図6参照)。
制御部11は、取得手段110により取得された候補から、2以上の帳票に共通しない独自要素と、2以上の帳票に共通する共通要素とを抽出する。具体的には、制御部11は、第1実施形態のステップS2と同じ処理により、独自要素と共通要素を抽出する(図7参照)。
制御部11は、複数の帳票の各々について、当該帳票に含まれる独自要素と共通要素に対して、当該帳票の種別の判定における優先順位を付与する。具体的には、制御部11は、共通要素よりも高い優先順位を独自要素に付与する。例えば、図7(○=独自要素、●=共通要素)の例において、帳票ID=001の帳票については、要素ID=004の要素に対して第1位の優先順位が付与され、要素ID=001の要素に対して第2位の優先順位が付与される。帳票ID=003の帳票については、独自要素がなく、2つの候補とも共通要素であるから、両者に第1位の優先順位が付与される。
制御部11は、複数の帳票の各々について、付与手段140により付与された優先順位に基づいて、少なくとも1つの独自要素又は共通要素を当該帳票の特徴を示す要素に決定する。一例として、本実施形態では、制御部11は、独自要素のみを帳票の特徴を示す要素に決定する。図7の例において、帳票ID=001の帳票については、要素ID=004の要素のみがこの帳票の特徴を示す要素に決定される。帳票ID=003の帳票については、第1実施形態と同様に、2つの共通要素をこの帳票の特徴を示す要素に決定してもよい。
次に、第1乃至第3実施形態で示した手順で作成された特徴リストを用いた帳票処理の運用例について説明する。記憶部12には、上記の手順で作成された複数の特徴リストが記憶されている。これらの特徴リストには、互いに異なる帳票IDが関連付けられている。最初にユーザが読取装置2に帳票を読み取らせる。この帳票は、例えば住宅ローンの申込者が図3に示す帳票(住宅ローン申込書)に必要事項を記入したものである。読取装置2は、この帳票を読み取って第3の画像データを生成し、この第3の画像データを情報処理装置1に送信する。情報処理装置1の制御部11は、読取装置2から受信した第3の画像データで表される第3の画像に対して文字認識を実行し、認識された文字列を第3の要素群として取得し、第3の要素群リストを作成する。第3の要素群リストの構成は、前述の第1の要素群リストと同様である。
実施形態を次のように変形してもよい。また、複数の変形例を組み合わせてもよい。
独自要素のノイズに対する耐性が決められた条件を満たさず、且つ、複数の共通要素が抽出された場合に、独自要素と複数の共通要素との組み合わせを帳票の特徴を示す要素に決定してもよい。具体的には、第2実施形態の手法で抽出された候補が独自要素として抽出された場合、第2実施形態のステップS04で求めた類似度の平均値を閾値と比較する。この閾値は、独自要素のノイズに対する耐性の基準値である。類似度の平均値がこの閾値に達しない場合、この独自要素のノイズに対する耐性が不足していることになる。類似度の平均値が閾値に達しない場合、複数の共通要素が抽出されているならば、この独自要素と複数の共通要素との組み合わせにより、独自要素の耐性の不足が補われる。要するに、抽出手段120は、取得手段110により取得された候補から2以上の帳票に共通しない独自要素を抽出し、決定手段130は、独自要素が第1抽出手段104で候補として抽出されたときの類似度が決められた条件を満たさない場合に、独自要素と2以上の共通要素とを帳票の特徴を示す要素に決定する。なお、類似度の平均値に代えて、類似度の最大値や最小値など、類似度に基づく値を用いて上記の処理を行うようにしてもよい。
本変形例によれば、独自要素のノイズに対する耐性が不足している場合に耐性の不足が補われる。
上記の実施形態では、ノイズの位置や面積などを第2の画像毎に乱数を用いて変動させる例を示したが、ノイズの位置や面積などを第2の画像毎に規則的に変動させるようにしてもよい。要するに、第1の画像に互いに異なるノイズを付加した複数の第2の画像を生成するように構成されていればよい。
ノイズに対する耐性が決められた条件を満たさない要素を帳票の特徴を示す要素の候補として抽出しないようにしてもよい。具体的には、第2実施形態のステップS04において、制御部11は、第1の要素群リストと第2の要素群リストから同一の要素IDに対応する要素を読み出して、2つの要素の類似度を求める。制御部11は、すべての第2の要素群リストについてこの処理を行い、要素ID毎に類似度の平均値を求める。制御部11は、この平均値を閾値を比較する。この閾値は、要素のノイズに対する耐性の基準値である。類似度の平均値がこの閾値に達しない場合、この要素のノイズに対する耐性が不足していることになるから、制御部11は、この要素を帳票の特徴を示す要素の候補として抽出しない。要するに、第1抽出手段104は、第1の要素群に含まれる要素のうち、類似度が決められた条件を満たさない要素を、帳票の特徴を示す要素の候補として抽出しない。なお、類似度の平均値に代えて、類似度の最大値や最小値など、類似度に基づく値を用いて上記の処理を行うようにしてもよい。
本変形例によれば、ノイズに対する耐性が不足している要素は、帳票の特徴を示す要素として用いられない。
第3実施形態を以下のように変形してもよい。第3実施形態のステップS13(図15参照)において、制御部11は、複数の帳票における出現頻度が低い共通要素ほど高い優先順位を付与する(付与手段140の一例)。ステップS14において、制御部11は、独自要素と、付与手段140により付与された優先順位に基づいて選択した共通要素とを、帳票の特徴を示す要素に決定する(決定手段150の一例)。具体的には、以下のとおりである。
本変形例によれば、出現頻度が低い共通要素ほど高い優先順位を付与する構成を備えない場合と比べて、帳票の種別の誤判定が減少する。
第3実施形態を以下のように変形してもよい。
図17は、情報処理装置1の機能を示すブロック図である。取得手段110、抽出手段120、付与手段140、決定手段150は、第3実施形態と同じ機能を備える。取得手段110は、複数の帳票の各々の特徴を示す要素の候補を取得する。抽出手段120は、取得手段110により取得された候補から、2以上の帳票に共通しない独自要素と、2以上の帳票に共通する共通要素とを抽出する。付与手段140は、複数の帳票の各々について、当該帳票に含まれる独自要素と共通要素に対して、当該帳票の種別の判定における優先順位を付与する。決定手段150は、複数の帳票の各々について、付与手段140により付与された優先順位に基づいて、少なくとも1つの独自要素又は共通要素を当該帳票の特徴を示す要素に決定する。判定手段160は、帳票から読み取られた要素と決定手段150により決定された要素との比較により当該帳票の種別を判定する。重み付け手段170は、付与手段140により付与された優先順位が高い要素ほど判定手段160による判定における重み付けを重くする。これらの機能を実現するための具体的な構成は、以下のとおりである。
本変形例によれば、優先順位が高い要素ほど重み付けを重くする構成を備えない場合と比べて、帳票の種別の判定の精度が高まる。
上記の実施形態では、情報処理装置1がアプリケーションプログラムを実行することによって上記の機能を実現する例を示したが、上記の機能の一部又は全部がハードウェア回路で実装されていてもよい。また、アプリケーションプログラムを、光記録媒体、半導体メモリ等、コンピュータで読み取り可能な記録媒体に記録して提供し、この記録媒体からプログラムを読み取ってインストールするようにしてもよい。また、このプログラムを電気通信回線で提供してもよい。
Claims (9)
- 複数の帳票の各々の特徴を示す要素の候補を取得する取得手段と、
前記取得手段により取得された候補から2以上の前記帳票に共通する共通要素を抽出する抽出手段と、
前記複数の帳票から、前記抽出手段により抽出された共通要素のうちの2以上の共通要素を含む帳票を抽出し、抽出された帳票に含まれる前記2以上の共通要素を当該帳票の特徴を示す要素に決定する決定手段と、
前記複数の帳票の各々について、当該帳票を読み取って生成された第1の画像に含まれる第1の要素群を取得する第1取得手段と、
前記第1の画像に互いに異なるノイズを付加した複数の第2の画像を生成する付加手段と、
前記複数の第2の画像の各々に含まれる第2の要素群を取得する第2取得手段と、
前記第1の要素群に含まれる要素と複数の前記第2の要素群に含まれる要素との類似度に基づいて、前記第1の要素群から前記帳票の特徴を示す要素の候補を抽出する第1抽出手段と
を備え、
前記取得手段は、前記第1抽出手段により抽出された候補を取得する
情報処理装置。 - 前記抽出手段は、前記取得手段により取得された候補から2以上の前記帳票に共通しない独自要素を抽出し、
前記決定手段は、前記独自要素が前記第1抽出手段で前記候補として抽出されたときの前記類似度が決められた条件を満たさない場合に、前記独自要素と前記2以上の共通要素とを前記帳票の特徴を示す要素に決定する
請求項1に記載の情報処理装置。 - 前記第1抽出手段は、前記第1の要素群に含まれる要素のうち、前記類似度が決められた条件を満たさない要素を、前記帳票の特徴を示す要素の候補として抽出しない
請求項1に記載の情報処理装置。 - 前記抽出手段は、前記取得手段により取得された候補から2以上の前記帳票に共通しない独自要素を抽出し、
前記決定手段は、前記抽出手段により抽出された独自要素を、当該独自要素を含む帳票の特徴を示す要素に決定する
請求項1に記載の情報処理装置。 - 前記抽出手段は、前記取得手段により取得された候補から、2以上の前記帳票に共通しない独自要素と、2以上の前記帳票に共通する共通要素とを抽出し、
前記情報処理装置は、前記複数の帳票の各々について、当該帳票に含まれる前記独自要素と前記共通要素に対して、当該帳票の種別の判定における優先順位を付与する付与手段を備え、
前記決定手段は、前記複数の帳票の各々について、前記付与手段により付与された優先順位に基づいて、少なくとも1つの前記独自要素又は前記共通要素を当該帳票の特徴を示す要素に決定する
請求項1に記載の情報処理装置。 - 前記付与手段は、前記共通要素よりも高い優先順位を前記独自要素に付与し、
前記決定手段は、前記独自要素のみを前記帳票の特徴を示す要素に決定する
請求項5に記載の情報処理装置。 - 前記付与手段は、前記複数の帳票における出現頻度が低い共通要素ほど高い優先順位を付与し、
前記決定手段は、前記独自要素と、前記付与手段により付与された優先順位に基づいて選択した共通要素とを、前記帳票の特徴を示す要素に決定する
請求項5に記載の情報処理装置。 - 帳票から読み取られた要素と前記決定手段により決定された要素との比較により当該帳票の種別を判定する判定手段と、
前記付与手段により付与された優先順位が高い要素ほど前記判定手段による判定における重み付けを重くする重み付け手段と
を備えた請求項5乃至7のいずれか1項に記載の情報処理装置。 - コンピュータを、
複数の帳票の各々の特徴を示す要素の候補を取得する取得手段と、
前記取得手段により取得された候補から2以上の前記帳票に共通する共通要素を抽出する抽出手段と、
前記複数の帳票から、前記抽出手段により抽出された共通要素のうちの2以上の共通要素を含む帳票を抽出し、抽出された帳票に含まれる前記2以上の共通要素を当該帳票の特徴を示す要素に決定する決定手段と、
前記複数の帳票の各々について、当該帳票を読み取って生成された第1の画像に含まれる第1の要素群を取得する第1取得手段と、
前記第1の画像に互いに異なるノイズを付加した複数の第2の画像を生成する付加手段と、
前記複数の第2の画像の各々に含まれる第2の要素群を取得する第2取得手段と、
前記第1の要素群に含まれる要素と複数の前記第2の要素群に含まれる要素との類似度に基づいて、前記第1の要素群から前記帳票の特徴を示す要素の候補を抽出する第1抽出手段
として機能させるためのプログラムにおいて、
前記取得手段は、前記第1抽出手段により抽出された候補を取得する
プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015208927A JP6693082B2 (ja) | 2015-10-23 | 2015-10-23 | 情報処理装置及びプログラム |
US15/097,948 US10049269B2 (en) | 2015-09-30 | 2016-04-13 | Information processing apparatus, information processing method, and non-transitory computer readable medium |
CN201610404427.7A CN106557734B (zh) | 2015-09-30 | 2016-06-08 | 信息处理装置和信息处理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2015208927A JP6693082B2 (ja) | 2015-10-23 | 2015-10-23 | 情報処理装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017083943A JP2017083943A (ja) | 2017-05-18 |
JP6693082B2 true JP6693082B2 (ja) | 2020-05-13 |
Family
ID=58711070
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015208927A Active JP6693082B2 (ja) | 2015-09-30 | 2015-10-23 | 情報処理装置及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6693082B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6879563B2 (ja) * | 2018-02-19 | 2021-06-02 | 株式会社ミラボ | 帳票処理システム及び帳票処理プログラム |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3449392B2 (ja) * | 1996-08-27 | 2003-09-22 | 日本電信電話株式会社 | 識別関数学習方法 |
JPH11282956A (ja) * | 1998-03-26 | 1999-10-15 | Ricoh Co Ltd | 帳票識別方法、装置および記録媒体 |
JP2001312694A (ja) * | 2000-05-01 | 2001-11-09 | Hitachi Ltd | 多種類の帳票認識方法および装置 |
JP2003115028A (ja) * | 2001-10-03 | 2003-04-18 | Hitachi Ltd | 帳票識別辞書自動生成方法及び帳票処理システム |
JP2013041539A (ja) * | 2011-08-19 | 2013-02-28 | Kyocera Document Solutions Inc | 情報抽出装置 |
JP5623574B2 (ja) * | 2012-03-30 | 2014-11-12 | 株式会社東芝 | 帳票識別装置および帳票識別方法 |
JP6578858B2 (ja) * | 2015-09-30 | 2019-09-25 | 富士ゼロックス株式会社 | 情報処理装置及びプログラム |
-
2015
- 2015-10-23 JP JP2015208927A patent/JP6693082B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2017083943A (ja) | 2017-05-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3996579B2 (ja) | 機械可読フォームのアクティブ領域を識別するためのフォーム処理システム | |
US7999657B2 (en) | Image registration method for image comparison and document authentication | |
JP5616308B2 (ja) | 文字の形状特徴を使用した文字比較による文書改変検知方法 | |
US8326085B2 (en) | Image processing apparatus and image processing method | |
JP3943638B2 (ja) | Ocrを利用しない文書画像中のドロップワードの自動認識方法 | |
JP4594952B2 (ja) | 文字認識装置及び文字認識方法 | |
US10643097B2 (en) | Image processing apparatuses and non-transitory computer readable medium | |
JP6578858B2 (ja) | 情報処理装置及びプログラム | |
KR20170101125A (ko) | 정보 처리장치, 정보 처리방법, 및 기억매체 | |
US10049269B2 (en) | Information processing apparatus, information processing method, and non-transitory computer readable medium | |
JP6693082B2 (ja) | 情報処理装置及びプログラム | |
US8749854B2 (en) | Image processing apparatus, method for performing image processing and computer readable medium | |
US20120105917A1 (en) | Image processing apparatus and computer readable medium | |
JP4552757B2 (ja) | 画像処理装置、画像処理方法、および画像処理プログラム | |
JP5476884B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP6693184B2 (ja) | 画像処理装置、および画像処理方法 | |
US11722615B2 (en) | Image processing including adjusting image orientation | |
US20220335738A1 (en) | Image processing system, image processing method, and storage medium | |
JP6645143B2 (ja) | 画像解析装置 | |
JP2022019257A (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP5841511B2 (ja) | 署名鑑処理装置、署名鑑処理方法および署名鑑処理プログラム | |
JP2019195117A (ja) | 情報処理装置、情報処理方法、及びプログラム | |
JPH11219408A (ja) | 文書読取装置 | |
JP2010278710A (ja) | 画像処理装置及び画像処理プログラム | |
JP2008146413A (ja) | 方向判定装置、画像処理装置、画像方向判別方法、および画像方向判別プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180926 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190819 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20191001 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191128 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200317 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200330 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6693082 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |