JP2017068562A - 情報処理装置及びプログラム - Google Patents

情報処理装置及びプログラム Download PDF

Info

Publication number
JP2017068562A
JP2017068562A JP2015192960A JP2015192960A JP2017068562A JP 2017068562 A JP2017068562 A JP 2017068562A JP 2015192960 A JP2015192960 A JP 2015192960A JP 2015192960 A JP2015192960 A JP 2015192960A JP 2017068562 A JP2017068562 A JP 2017068562A
Authority
JP
Japan
Prior art keywords
element group
information processing
noise
image
images
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015192960A
Other languages
English (en)
Other versions
JP6578858B2 (ja
Inventor
信之 重枝
Nobuyuki Shigee
信之 重枝
洋三 鹿島
Yozo Kashima
洋三 鹿島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2015192960A priority Critical patent/JP6578858B2/ja
Priority to US15/016,388 priority patent/US9818028B2/en
Priority to CN201610124207.9A priority patent/CN106557733B/zh
Priority to EP16159412.2A priority patent/EP3151159A1/en
Priority to US15/097,948 priority patent/US10049269B2/en
Priority to CN201610404427.7A priority patent/CN106557734B/zh
Publication of JP2017068562A publication Critical patent/JP2017068562A/ja
Application granted granted Critical
Publication of JP6578858B2 publication Critical patent/JP6578858B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/1914Determining representative reference patterns, e.g. averaging or distorting patterns; Generating dictionaries, e.g. user dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/28Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/416Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

【課題】帳票を読み取って生成した画像に含まれるノイズに起因する帳票の種別の誤判定を減らすこと。【解決手段】情報処理装置1は、帳票を読み取って生成された第1の画像に含まれる第1の要素群を取得し、第1の画像に互いに異なるノイズを付加した複数の第2の画像を生成し、複数の第2の画像の各々に含まれる第2の要素群を取得する。情報処理装置1は、第1の要素群に含まれる要素と複数の第2の要素群に含まれる要素との類似度に基づいて、第1の要素群から帳票の特徴を示す要素を抽出する。【選択図】図6

Description

本発明は、情報処理装置及びプログラムに関する。
特許文献1に記載された帳票処理システムは、帳票画像から文字列を抽出し、抽出した文字列の位置情報及び出現頻度から各文字列の安定度を計算し、同一領域内で各文字列の出現した帳票種の数から固有度を計算し、安定度と固有度とから文字列の帳票識別辞書への登録の優先度を計算する。
特開2003−115028号公報
帳票の処理の能率を向上させるには、電子化が有効な手段となり得る。例えば、複数の種別の帳票の特徴を示す要素を予めコンピュータに登録しておき、帳票をスキャナで読み取って画像を生成し、生成した画像に含まれる要素を抽出し、抽出された要素と予め登録された要素との比較により、読み取った帳票の種別を判定する。ところが、帳票を読み取って生成した画像にノイズが含まれている場合がある。ノイズとは、例えば、帳票の汚れや折れ目、裏写り、記入された文字などである。これらのノイズは、帳票の種別の誤判定(真の種別と異なる種別であると判定されること)の原因となり得る。誤判定が発生すると、判定結果を訂正する煩雑な作業が必要となり、非効率的である。
本発明は、帳票を読み取って生成した画像に含まれるノイズに起因する帳票の種別の誤判定を減らすことを目的とする。
請求項1に係る発明は、帳票を読み取って生成された第1の画像に含まれる第1の要素群を取得する第1取得手段と、前記第1の画像に互いに異なるノイズを付加した複数の第2の画像を生成する付加手段と、前記複数の第2の画像の各々に含まれる第2の要素群を取得する第2取得手段と、前記第1の要素群に含まれる要素と複数の前記第2の要素群に含まれる要素との類似度に基づいて、前記第1の要素群から前記帳票の特徴を示す要素を抽出する抽出手段とを備えた情報処理装置を提供する。
請求項2に係る発明は、請求項1に記載の情報処理装置において、前記付加手段は、予め定められた種類の前記ノイズを前記第2の画像毎に無作為に変動させることによって前記複数の第2の画像を生成する。
請求項3に係る発明は、請求項2に記載の情報処理装置において、前記付加手段は、予め定められた複数種類の前記ノイズを前記第2の画像毎に無作為に変動させることによって前記複数の第2の画像を生成する。
請求項4に係る発明は、請求項1乃至3のいずれか1項に記載の情報処理装置において、前記抽出手段は、前記類似度が閾値に達した要素を前記帳票の特徴を示す要素として抽出する。
請求項5に係る発明は、請求項1乃至4のいずれか1項に記載の情報処理装置において、前記抽出手段は、前記類似度が最高である要素を前記帳票の特徴を示す要素として抽出する。
請求項6に係る発明は、コンピュータを、帳票を読み取って生成された第1の画像に含まれる第1の要素群を取得する第1取得手段と、前記第1の画像に互いに異なるノイズを付加した複数の第2の画像を生成する付加手段と、前記複数の第2の画像の各々に含まれる第2の要素群を取得する第2取得手段と、前記第1の要素群に含まれる要素と複数の前記第2の要素群に含まれる要素との類似度に基づいて、前記第1の要素群から前記帳票の特徴を示す要素を抽出する抽出手段として機能させるためのプログラムを提供する。
請求項1、6に係る発明によれば、第1の画像に互いに異なるノイズを付加した複数の第2の画像を用いて帳票の特徴を示す要素を抽出する構成を備えない場合と比べて、帳票を読み取って生成された画像に含まれるノイズに起因する帳票の種別の誤判定を減らすことができる。
請求項2に係る発明によれば、ノイズを作為的に変動させる構成と比べて、現実のノイズに近いノイズを付加することができる。
請求項3に係る発明によれば、1種類のノイズを付加する構成と比べて、現実のノイズに近いノイズを付加することができる。
請求項4に係る発明によれば、帳票の種別を示す要素の抽出の基準に幅を持たせることができる。
請求項5に係る発明によれば、最も信頼性の高い要素を抽出することができる。
実施形態に係るシステムの全体を示す図。 情報処理装置1のハードウェア構成を示す図。 帳票の例を示す図。 ノイズの例を示す図。 情報処理装置1の機能を示すブロック図。 情報処理装置1の動作を示す流れ図。 第1の要素群リストを示す図。 第2の要素群リストを示す図。 特徴リストを示す図。
本発明の実施形態の一例について説明する。
<構成>
図1は、実施形態に係るシステムの全体を示す図である。情報処理装置1と読取装置2は、LANなどの通信手段3で接続されている。読取装置2は、帳票のサンプルを読み取って画像データを生成し、この画像データを情報処理装置1に送信する。情報処理装置1は、受信した画像データで表される画像から、帳票の特徴を示す要素を抽出する。抽出された要素は、実際の事務処理で使用される帳票の種別を判定するために用いられる。
図2は、情報処理装置1のハードウェア構成を示す図である。情報処理装置1は、制御部11、記憶部12、通信部13などを備えたコンピュータである。制御部11は、CPU(Central Processing Unit)などの演算装置と、ROM(Read Only Memory)やRAM(Random Access Memory)などの記憶装置とを備える。ROMには、ハードウェアやOS(Operating System)の起動の手順を記述したファームウェアが記憶されている。RAMは、CPUが演算を実行する際のデータの記憶に用いられる。記憶部12は、例えばハードディスク装置を備え、OSやアプリケーションプログラムなどが記憶されている。通信部13は、読取装置2と通信するための通信I/F(Interface)を備える。情報処理装置1には、表示装置14と受付装置15が接続されている。表示装置14は、例えば液晶表示装置を備え、操作者が情報処理装置1を操作するための画面などを表示する。受付装置15は、例えばキーボードやマウスなどを備え、操作者が行った操作を受け付けて、その操作に応じた情報を制御部11に出力する。
読取装置2は、例えば、プラテンガラス、遮光板、光源、光学系、撮像素子、演算装置などを備えたイメージスキャナである(図示省略)。プラテンガラス上に載せられた帳票に対して光源が光を照射し、帳票で反射された反射光が光学系を介して撮像素子に入射する。撮像素子は、入射した光を画像信号に変換して演算装置に出力する。演算装置は、画像信号に基づいてラスタ形式の画像データを生成し、この画像データを情報処理装置1に送信する。なお、複写機と情報処理装置1を通信手段3で接続し、複写機に備えられた読取装置を用いて帳票を読み取るようにしてもよい。また、USB(Universal Serial Bus)メモリなどの記録媒体を用いて読取装置2から情報処理装置1に帳票の画像データを受け渡してもよい。
図3は、帳票の例を示す図である。帳票には、文字や罫線などの要素が印刷などによって予め形成されている。この例では、「様式A−1」、「申請日 年 月 日」、「審査部 御中」、「住宅ローン申込書」、「申込内容」、「氏名 印」の各文字列が予め形成されている。また、申込内容の欄を示す罫線が形成されている。
図4は、ノイズの例を示す図である。帳票を読み取って生成した画像には、ノイズが含まれている場合がある。主なノイズは、以下のように分類される。
(a)記入されたもの
例えば、手書きで記入された文字や記号、押印によって形成された印影、記入すべき箇所を示すために鉛筆で書き込まれた印などである。図示した例では、氏名の欄に「富士 太郎」なる文字列(ノイズN1)が手書きで記入されている。また、申請日の欄と氏名の欄に、記入すべき箇所を囲んだ印(ノイズN2)が書き込まれている。また、氏名の欄に印影(ノイズN3)が形成されている。
(b)ウォーターマーク
読取装置2で読み取るとウォーターマークを含んだ画像が生成されるように帳票に隠し文字が設定されている場合がある。ウォーターマークは、帳票の記入や視認に支障が生じない程度の濃度で形成されるが、ウォーターマーク自体の視認性を確保するために、例えば、大きなサイズの文字、斜めの配置、複数のウォーターマークの規則的又は不規則な配置などにより形成される。図示した例では、「コピー禁止」なるウォーターマーク(ノイズN4)が形成されている(図示の都合上、ハッチングを使用)。なお、隠し文字を用いずに、顕在化したウォーターマークが帳票に形成されている場合もある。
(c)汚れ
例えば、消しゴムのかす、インクのしみ、埃などの汚れが帳票に付着している場合がある。また、帳票の折れ目やしわなどが線状の汚れとなる場合もある。また、読取装置2のプラテンガラスに汚れが付着している場合もある。図示した例では、面状の汚れ(図示の都合上、ハッチングを使用。ノイズN5)と線状の汚れ(ノイズN6)が生じている。
(d)裏写り
帳票の裏面に文字などが形成されている場合がある。例えば、記入の要領が裏面に記載されている場合や、両面に記入欄が設けられている場合などがある。このように帳票の裏面に文字などが記載されており、且つ、裏面の文字などが透けて見える程度の薄い紙が用いられている場合、裏面の文字などが読取装置2に読み取られてしまうことがある。
(e)傾き(スキュー)
本実施形態におけるノイズの概念には、読み取り時の帳票の傾きに起因するものも含まれる。例えば、読取装置2の読み取り位置に帳票を配置したときに帳票に傾きが生じることがある。また、読み取り位置に原稿を搬送する装置が備えられている場合、傾いた姿勢で帳票が搬送されることがある。この傾きの大きさによっては、例えば文字が認識されなかったり、罫線の方向が誤った方向に認識されるなどして、帳票の特徴が正確に認識されなくなるおそれがある。
図5は、情報処理装置1の機能を示すブロック図である。第1取得手段101は、帳票を読み取って生成された第1の画像に含まれる第1の要素群を取得する。付加手段102は、前記第1の画像に互いに異なるノイズを付加した複数の第2の画像を生成する。第2取得手段103は、前記複数の第2の画像の各々に含まれる第2の要素群を取得する。抽出手段104は、前記第1の要素群に含まれる要素と複数の前記第2の要素群に含まれる要素との類似度に基づいて、前記第1の要素群から前記帳票の特徴を示す要素を抽出する。これらの機能を実現するための具体的な構成は、以下のとおりである。
<動作>
図6は、情報処理装置1の動作を示す流れ図である。情報処理装置1には、帳票の特徴を示す要素を抽出する手順を記述したアプリケーションプログラムがインストールされている。情報処理装置1の制御部11は、このアプリケーションプログラムを実行して、以下に示す処理を実行する。
<ステップS01>(第1取得手段101の一例)
最初に、ユーザが読取装置2にサンプルの帳票を読み取らせる。読取装置2は、サンプルの帳票を読み取って第1の画像データを生成し、第1の画像データを情報処理装置1に送信する。情報処理装置1の制御部11は、読取装置2から受信した第1の画像データで表される第1の画像に対して文字認識と罫線認識を実行する。文字認識は、例えば、OCR(Optical Character Recognition)の手法を用いる。罫線認識は、例えば、特開2003−109007号公報の段落0051に記載されている、X軸方向とY軸方向の黒画素の累積値から罫線を認識する手法を用いる。本実施形態は、第1の要素群として文字列を取得する例を示す。図3の例では、「様式A−1」、「申請日 年 月 日」、「審査部 御中」、「住宅ローン申込書」、「申込内容」、「氏名 印」の各文字列が認識される。制御部11は、これらの文字列を第1の要素群として取得する。
図7は、第1の要素群リストを示す図である。第1の要素群を取得したならば、制御部11は、第1の要素群リストを作成する。第1の要素群リストは、要素ID、要素の内容、位置情報を関連付けて格納するリストである。要素IDは、要素を識別するための識別子である。要素の内容は、この例では、文字認識で認識された文字列である。位置情報は、第1の画像における要素の位置を示す情報であり、例えば、文字列に外接する矩形の左上の頂点の座標である。
<ステップS02>(付加手段102の一例)
制御部11は、第1の画像にノイズを付加する。付加するノイズは、例えば前述の(a)記入されたもの、(b)ウォーターマーク、(c)汚れ、(d)裏写り、(e)傾き、である。裏写りを想定した文字は、鏡像でもよいし、鏡像でなくてもよい。記憶部12には、ノイズの初期値が記憶されている。ノイズの初期値とは、例えば、(a)については、文字や線の数、(b)については、文字列の面積、(c)については、汚れの面積、(d)については、裏写りの面積、(e)については、傾きの角度を定めたものである。また、ノイズの初期値の1つとして、例えば、第1の要素群に含まれる各要素(本実施形態では、文字列)の外接矩形内でノイズが占める面積の割合が定められていてもよい。
制御部11は、第1の画像にこれらのノイズを付加した複数の第2の画像を生成する。このとき、制御部11は、第2の画像の各々に含まれるノイズを互いに異ならせるようにする。例えば、要素の外接矩形内でノイズを付加する位置を第2の画像毎に乱数を用いて変動させるようにしてもよい。また、要素の外接矩形内でノイズが占める面積や、外接矩形の面積に対するノイズの面積の割合などを第2の画像毎に乱数を用いて変動させるようにしてもよい。要するに、ステップS02において、制御部11は、予め定められた複数種類のノイズを第2の画像毎に無作為に変動させることによって複数の第2の画像を生成する。図4で例示した画像は、複数の第2の画像のうちの1つである。複数の第2の画像の各々は、ノイズN1乃至N6の面積や位置などが互いに異なっている。
<ステップS03>(第2取得手段103の一例)
ステップS01と同様に、制御部11が、第2の画像の各々に対して文字認識を実行して文字列を認識し、認識した文字列を第2の要素群として取得する。図4の例では、ノイズの重なった文字が認識されなくなるため、「様 A−1」、「申請 年 月 日」、「審査部 御中」、「住宅ローン申 書」、「申込内容」、「氏 富士 太郎」の各文字列が認識される。制御部11は、これらの文字列を第2の要素群として取得する。ただし、前述のとおり、複数の第2の画像の各々はノイズの面積や位置などが互いに異なっている。そのため、例えば、図4の例では、「住宅ローン申込書」の「込」にノイズが重なったために「込」が認識されないが、別の文字にノイズが重なった場合には、その文字が認識されなくなる。従って、取得される第2の要素群は、第2の画像毎に異なるものとなる。制御部11は、複数の第2の画像の各々から第2の要素群を取得する。従って、第2の要素群は、第2の画像の数と同じ数だけ取得される。
図8は、第2の要素群リストを示す図である。第2の要素群を取得したならば、制御部11は、第2の要素群リストを作成する。第2の要素群リストは、要素ID、要素の内容、位置情報を関連付けて格納するリストである。第2の要素群リストは、第2の画像と同じ数だけ作成される。
<ステップS04>(抽出手段104の一例)
制御部11は、第1の要素群リストと第2の要素群リストから同一の要素IDに対応する要素を読み出して、2つの要素の類似度を求める。類似度とは、文字列の場合、全文字数に対する一致した文字数の割合である。例えば、要素ID=004については、第1の要素群リストでは「住宅ローン申込書」、第2の要素群リストでは「住宅ローン申 書」であるから、類似度は、0.875である。
制御部11は、すべての第2の要素群リストについてこの処理を行い、要素ID毎に類似度の平均値を求める。例えば、5つの第2の画像から取得された要素ID=004の要素の内容がそれぞれ「住宅ローン申 書」、「住宅ローン 書」、「住宅ローン申 」、「住宅ローン申込書」、「住宅ロー 書」であったとすると、要素ID=004の類似度の平均値は、(0.875+0.75+0.75+1.0+0.625)÷5=0.8となる。制御部11は、類似度の平均値が予め定められた閾値に達しているならば、その要素が、その帳票の特徴を示す要素であると判定する。例えば閾値が0.4である場合、要素ID=004の要素は、類似度の平均値が閾値を上回るから、帳票の特徴を示す要素であると判定される。
図9は、特徴リストを示す図である。制御部11は、すべての要素IDについて上記の処理が済んだならば、特徴リストを作成する。特徴リストは、帳票の特徴を示す要素の要素ID、要素の内容、位置情報を関連付けて格納するリストである。この例では、要素ID=006の「氏名 印」の類似度の平均値が閾値に達しなかったため、要素ID=001乃至005の要素が、帳票の特徴を示す要素として抽出されている。制御部11は、特徴リストを帳票毎に作成する。制御部11は、作成した特徴リストを識別するための識別子である帳票IDを生成してその特徴リストに関連付ける。この例では、作成した特徴リストに特徴ID=001が関連付けられている。以上のようにして、第1の要素群から帳票の特徴を示す要素が抽出される。なお、帳票の特徴を示す要素の抽出結果を示す画像を表示装置14に表示させるようにしてもよい。例えば、作成された特徴リストを表示装置14に表示させるようにしてもよい。また、帳票の特徴を示す要素として抽出された要素を視覚的に強調した帳票の画像を表示装置14に表示させるようにしてもよい。
<運用例>
次に、上記のようにして作成された特徴リストを用いた帳票処理の運用例について説明する。記憶部12には、上記の手順で作成された複数の特徴リストが記憶されている。これらの特徴リストには、互いに異なる帳票IDが関連付けられている。最初にユーザが読取装置2に帳票を読み取らせる。この帳票は、例えば住宅ローンの申込者が図3に示す帳票(住宅ローン申込書)に必要事項を記入したものである。読取装置2は、この帳票を読み取って第3の画像データを生成し、この第3の画像データを情報処理装置1に送信する。情報処理装置1の制御部11は、読取装置2から受信した第3の画像データで表される第3の画像に対して文字認識を実行し、認識された文字列を第3の要素群として取得し、第3の要素群リストを作成する。第3の要素群リストの構成は、前述の第1の要素群リストと同様である。
制御部11は、第3の要素群リストに含まれる各要素の位置情報に対応する要素を特徴リストから読み出し、第3の要素群リストに含まれる各要素と特徴リストから読み出した要素との類似度を求める。第3の要素群リストに含まれる各要素の位置情報に対応する要素が特徴リストに含まれていない場合には、その要素の類似度は0.0となる。制御部11は、特徴リスト毎にその特徴リストに含まれる各要素の類似度に基づいて得点を計算し、得点が閾値以上で、且つ、得点が最高点である特徴リストを抽出する。
記憶部12には、第3の画像データを格納するディレクトリが設けられている。このディレクトリの1つ下の階層には、それぞれに帳票IDが関連付けられた複数のディレクトリと、帳票IDが関連付けられていない1つのディレクトリ(不明な帳票のディレクトリ)が設けられている。制御部11は、抽出された特徴リストの帳票IDと同じ帳票IDが関連付けられたディレクトリに第3の画像データを格納する。すべての特徴リストで得点が閾値に達しない場合には、不明な帳票のディレクトリに第3の画像データを格納する。以上のようにして、帳票の種別が判定される。
本実施形態によれば、第1の画像に互いに異なるノイズを付加した複数の第2の画像を用いて帳票の特徴を示す要素を抽出する構成を備えない場合と比べて、帳票を読み取って生成された画像に含まれるノイズに起因する帳票の種別の誤判定が減少する。また、本実施形態によれば、ノイズを作為的に変動させる構成と比べて、現実のノイズに近いノイズが付加される。また、本実施形態によれば、1種類のノイズを付加する構成と比べて、現実のノイズに近いノイズが付加される。また、本実施形態によれば、帳票の種別を示す要素の抽出の基準に幅が与えられる。
<変形例>
実施形態を次のように変形してもよい。また、複数の変形例を組み合わせてもよい。
<変形例1>
上記の実施形態では、情報処理装置1の制御部11が文字認識や罫線認識などによって第1の要素群、第2の要素群を抽出する例を示したが、例えば、帳票の画像を表示させた画面上でユーザがマウスを用いて要素を指定し、指定された要素を制御部11が第1の要素群、第2の要素群として取得するようにしてもよい。
<変形例2>
第1の画像に付加するノイズに条件を設定するようにしてもよい。具体的には、ノイズの種類を示すメニューを表示装置14に表示させ、第1の画像を示す画面上でユーザが指定した領域に、ユーザがメニューで指定した種類のノイズを付加するようにしてもよい。この構成によれば、例えば、手書きで記入する領域には手書きを模したノイズを付加するといったことが実現される。
<変形例3>
上記の実施形態のステップS04では、類似度の平均値が予め定められた閾値に達しているならば、その要素がその帳票の特徴を示す要素であると判定する例を示したが、類似度の平均値が最高である要素をその帳票の特徴を示す要素であると判定するようにしてもよい。また、類似度の平均値が予め定められた閾値に達し、且つ、類似度の平均値が最高である要素をその帳票の特徴を示す要素であると判定するようにしてもよい。
<変形例4>
複写によって作成された帳票をさらに複写するということを繰り返すと、文字や線の鮮明度が低下して特徴部分が正確に認識されなくなる場合がある。このような複写の繰り返しによる鮮明度の低下もノイズの一種と考えられる。この場合、文字の輪郭をぼかす処理や、線の太さを変更する処理などによって第1の画像にノイズを付加するようにしてもよい。
<変形例5>
上記の実施形態では、ノイズの位置や面積などを第2の画像毎に乱数を用いて変動させる例を示したが、ノイズの位置や面積などを第2の画像毎に規則的に変動させるようにしてもよい。要するに、第1の画像に互いに異なるノイズを付加した複数の第2の画像を生成するように構成されていればよい。
<変形例6>
上記の実施形態では、情報処理装置1がアプリケーションプログラムを実行することによって上記の機能を実現する例を示したが、上記の機能の一部又は全部がハードウェア回路で実装されていてもよい。また、アプリケーションプログラムを、光記録媒体、半導体メモリ等、コンピュータで読み取り可能な記録媒体に記録して提供し、この記録媒体からプログラムを読み取ってインストールするようにしてもよい。また、このプログラムを電気通信回線で提供してもよい。
1…情報処理装置、11…制御部、12…記憶部、13…通信部、14…表示装置、15…受付装置、101…第1取得手段、102…付加手段、103…第2取得手段、104…抽出手段、2…読取装置、3…通信手段

Claims (6)

  1. 帳票を読み取って生成された第1の画像に含まれる第1の要素群を取得する第1取得手段と、
    前記第1の画像に互いに異なるノイズを付加した複数の第2の画像を生成する付加手段と、
    前記複数の第2の画像の各々に含まれる第2の要素群を取得する第2取得手段と、
    前記第1の要素群に含まれる要素と複数の前記第2の要素群に含まれる要素との類似度に基づいて、前記第1の要素群から前記帳票の特徴を示す要素を抽出する抽出手段と
    を備えた情報処理装置。
  2. 前記付加手段は、予め定められた種類の前記ノイズを前記第2の画像毎に無作為に変動させることによって前記複数の第2の画像を生成する
    請求項1に記載の情報処理装置。
  3. 前記付加手段は、予め定められた複数種類の前記ノイズを前記第2の画像毎に無作為に変動させることによって前記複数の第2の画像を生成する
    請求項2に記載の情報処理装置。
  4. 前記抽出手段は、前記類似度が閾値に達した要素を前記帳票の特徴を示す要素として抽出する請求項1乃至3のいずれか1項に記載の情報処理装置。
  5. 前記抽出手段は、前記類似度が最高である要素を前記帳票の特徴を示す要素として抽出する請求項1乃至4のいずれか1項に記載の情報処理装置。
  6. コンピュータを、
    帳票を読み取って生成された第1の画像に含まれる第1の要素群を取得する第1取得手段と、
    前記第1の画像に互いに異なるノイズを付加した複数の第2の画像を生成する付加手段と、
    前記複数の第2の画像の各々に含まれる第2の要素群を取得する第2取得手段と、
    前記第1の要素群に含まれる要素と複数の前記第2の要素群に含まれる要素との類似度に基づいて、前記第1の要素群から前記帳票の特徴を示す要素を抽出する抽出手段
    として機能させるためのプログラム。
JP2015192960A 2015-09-30 2015-09-30 情報処理装置及びプログラム Expired - Fee Related JP6578858B2 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP2015192960A JP6578858B2 (ja) 2015-09-30 2015-09-30 情報処理装置及びプログラム
US15/016,388 US9818028B2 (en) 2015-09-30 2016-02-05 Information processing apparatus for obtaining a degree of similarity between elements
CN201610124207.9A CN106557733B (zh) 2015-09-30 2016-03-04 信息处理装置和信息处理方法
EP16159412.2A EP3151159A1 (en) 2015-09-30 2016-03-09 Information processing apparatus, information processing method and program
US15/097,948 US10049269B2 (en) 2015-09-30 2016-04-13 Information processing apparatus, information processing method, and non-transitory computer readable medium
CN201610404427.7A CN106557734B (zh) 2015-09-30 2016-06-08 信息处理装置和信息处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015192960A JP6578858B2 (ja) 2015-09-30 2015-09-30 情報処理装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2017068562A true JP2017068562A (ja) 2017-04-06
JP6578858B2 JP6578858B2 (ja) 2019-09-25

Family

ID=55755303

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015192960A Expired - Fee Related JP6578858B2 (ja) 2015-09-30 2015-09-30 情報処理装置及びプログラム

Country Status (4)

Country Link
US (1) US9818028B2 (ja)
EP (1) EP3151159A1 (ja)
JP (1) JP6578858B2 (ja)
CN (1) CN106557733B (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017083943A (ja) * 2015-10-23 2017-05-18 富士ゼロックス株式会社 情報処理装置及びプログラム
JP2019109562A (ja) * 2017-12-15 2019-07-04 京セラドキュメントソリューションズ株式会社 フォーム種別学習システムおよび画像処理装置

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10659217B2 (en) 2018-01-05 2020-05-19 Bank Of America Corporation Blockchain-based automated user matching
JP7259468B2 (ja) * 2019-03-25 2023-04-18 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0916714A (ja) * 1995-06-26 1997-01-17 Mitsubishi Electric Corp 多色文字画像読取装置
JPH1063789A (ja) * 1996-08-27 1998-03-06 Nippon Telegr & Teleph Corp <Ntt> 識別関数学習方法
JP2003115028A (ja) * 2001-10-03 2003-04-18 Hitachi Ltd 帳票識別辞書自動生成方法及び帳票処理システム
US20080205742A1 (en) * 2007-02-26 2008-08-28 Emc Corporation Generation of randomly structured forms
JP2010026848A (ja) * 2008-07-22 2010-02-04 Hitachi Omron Terminal Solutions Corp 紙葉類識別装置
US20100310192A1 (en) * 2009-06-05 2010-12-09 Anjaneyulu Seetha Rama Kuchibhotla Document storage system
JP2014146183A (ja) * 2013-01-29 2014-08-14 Casio Comput Co Ltd 情報処理装置、情報処理方法、及びプログラム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0750483B2 (ja) * 1985-05-22 1995-05-31 株式会社日立製作所 文書画像追加情報の蓄積方法
JP2003109007A (ja) 2001-09-28 2003-04-11 Fuji Xerox Co Ltd 帳票様式分類装置、帳票様式分類方法、帳票様式分類プログラムおよび画像照合装置
US8233714B2 (en) * 2006-08-01 2012-07-31 Abbyy Software Ltd. Method and system for creating flexible structure descriptions
JP5929356B2 (ja) * 2012-03-15 2016-06-01 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
JP5962277B2 (ja) * 2012-07-12 2016-08-03 富士ゼロックス株式会社 文書関連付け装置及びプログラム
CN104657504A (zh) * 2015-03-12 2015-05-27 四川神琥科技有限公司 一种文件快速识别方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0916714A (ja) * 1995-06-26 1997-01-17 Mitsubishi Electric Corp 多色文字画像読取装置
JPH1063789A (ja) * 1996-08-27 1998-03-06 Nippon Telegr & Teleph Corp <Ntt> 識別関数学習方法
JP2003115028A (ja) * 2001-10-03 2003-04-18 Hitachi Ltd 帳票識別辞書自動生成方法及び帳票処理システム
US20080205742A1 (en) * 2007-02-26 2008-08-28 Emc Corporation Generation of randomly structured forms
JP2010026848A (ja) * 2008-07-22 2010-02-04 Hitachi Omron Terminal Solutions Corp 紙葉類識別装置
US20100310192A1 (en) * 2009-06-05 2010-12-09 Anjaneyulu Seetha Rama Kuchibhotla Document storage system
JP2014146183A (ja) * 2013-01-29 2014-08-14 Casio Comput Co Ltd 情報処理装置、情報処理方法、及びプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017083943A (ja) * 2015-10-23 2017-05-18 富士ゼロックス株式会社 情報処理装置及びプログラム
JP2019109562A (ja) * 2017-12-15 2019-07-04 京セラドキュメントソリューションズ株式会社 フォーム種別学習システムおよび画像処理装置

Also Published As

Publication number Publication date
US9818028B2 (en) 2017-11-14
CN106557733B (zh) 2019-08-13
JP6578858B2 (ja) 2019-09-25
CN106557733A (zh) 2017-04-05
EP3151159A1 (en) 2017-04-05
US20170091547A1 (en) 2017-03-30

Similar Documents

Publication Publication Date Title
US8732570B2 (en) Non-symbolic data system for the automated completion of forms
CN109934244B (zh) 格式类别学习系统以及图像处理装置
JP3996579B2 (ja) 機械可読フォームのアクティブ領域を識別するためのフォーム処理システム
KR101985612B1 (ko) 종이문서의 디지털화 방법
JP6578858B2 (ja) 情報処理装置及びプログラム
JP2011130439A (ja) 画像比較および文書認証のための画像位置合わせの方法
US10395131B2 (en) Apparatus, method and non-transitory storage medium for changing position coordinates of a character area stored in association with a character recognition result
US9396389B2 (en) Techniques for detecting user-entered check marks
US10643097B2 (en) Image processing apparatuses and non-transitory computer readable medium
JP4594952B2 (ja) 文字認識装置及び文字認識方法
US10049269B2 (en) Information processing apparatus, information processing method, and non-transitory computer readable medium
JP2017212575A (ja) 画像読込み装置及びプログラム
JP7241506B2 (ja) 光学式文字認識結果の修正支援装置および修正支援用プログラム
JP2017083943A (ja) 情報処理装置及びプログラム
JP4552757B2 (ja) 画像処理装置、画像処理方法、および画像処理プログラム
JP5298830B2 (ja) 画像処理プログラム、画像処理装置及び画像処理システム
JP5277750B2 (ja) 画像処理プログラム、画像処理装置及び画像処理システム
WO2023062799A1 (ja) 情報処理システム、原稿種識別方法、モデル生成方法及びプログラム
JP2011065311A (ja) 画像処理装置及び画像処理プログラム
JP2018067096A (ja) 文字認識装置及び文字認識方法
JP2007157076A (ja) 画像処理装置及び画像処理方法
Tian et al. Self-verifiable paper documents and automatic content verification
JP2024037299A (ja) 画像処理装置、画像処理プログラム及び画像処理方法
JP2010049587A (ja) 差分抽出装置及び差分抽出プログラム
JP2019195117A (ja) 情報処理装置、情報処理方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180831

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190709

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190730

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190812

R150 Certificate of patent or registration of utility model

Ref document number: 6578858

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees