JP6476877B2 - 情報処理装置、システム及びプログラム - Google Patents

情報処理装置、システム及びプログラム Download PDF

Info

Publication number
JP6476877B2
JP6476877B2 JP2015004930A JP2015004930A JP6476877B2 JP 6476877 B2 JP6476877 B2 JP 6476877B2 JP 2015004930 A JP2015004930 A JP 2015004930A JP 2015004930 A JP2015004930 A JP 2015004930A JP 6476877 B2 JP6476877 B2 JP 6476877B2
Authority
JP
Japan
Prior art keywords
document
recognition
type
image
documents
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2015004930A
Other languages
English (en)
Other versions
JP2016130942A (ja
Inventor
洋三 鹿島
洋三 鹿島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2015004930A priority Critical patent/JP6476877B2/ja
Priority to US14/814,604 priority patent/US9811724B2/en
Priority to CN201510518384.0A priority patent/CN105787425B/zh
Publication of JP2016130942A publication Critical patent/JP2016130942A/ja
Application granted granted Critical
Publication of JP6476877B2 publication Critical patent/JP6476877B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • G06V10/225Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition based on a marking or identifier characterising the area
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/224Character recognition characterised by the type of writing of printed characters having additional code marks or containing code marks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)

Description

本発明は、情報処理装置、システム及びプログラムに関する。
特許文献1には、基準となる画像の輪郭線と入力された画像の輪郭線とを比較して算出した類似度が高いものを登録する技術が記載されている。また特許文献2には、色や罫線、文字等の特徴を使って帳票を識別する技術が記載されている。
特許第3469345号公報 特許第3851742号公報
上記のように、帳票や書類の種類を認識するための方法は複数存在する。本発明は、認識対象が複数種類の書類を一式としてまとめたものであっても、それぞれの書類に適した書類認識の方法をそれぞれ適用して認識することを目的とする。
本発明の請求項1に係る情報処理装置は、複数種類の画像認識の方法を有する認識手段であって、書類を読み取って当該書類の画像データを生成する生成手段によって複数の書類のうちの第1の書類と第2の書類の画像データがそれぞれ生成された場合、前記第1の書類の画像データから当該第1の書類の種類を認識し、前記複数種類の画像認識の方法のうち当該第1の書類の種類に応じた画像認識の方法を用いて前記第2の書類の画像データから当該第2の書類の種類を認識する認識手段を備えることを特徴とする。
本発明の請求項2に係る情報処理装置は、請求項1に記載の構成において、前記複数の書類は、書類の種類の組合せが予め定められている書類群として提出されるものであり、前記認識手段が認識した結果に基づいて、提出された前記複数の書類の揃い具合を表す情報を出力する出力手段を備えることを特徴とする。
本発明の請求項3に係る情報処理装置は、請求項1または2に記載の構成において、前記認識手段は、前記第1の書類の種類を認識する際、認識に成功するまで前記画像認識の方法を変えて認識を試みることを特徴とする。
本発明の請求項4に係る情報処理装置は、請求項3に記載の構成において、前記生成手段は複数の書類を1枚ずつ順番に読み取り、前記認識手段は、前記生成手段により最初に読み取られた書類の画像データを前記第1の書類の画像データとした場合に、当該第1の書類の画像データからは当該第1の書類の種類が認識されない場合には、前記生成手段により最後に読み取られた書類の画像データを前記第1の書類の画像データとして前記第1の書類の種類の認識を試みることを特徴とする。
本発明の請求項5に係る情報処理装置は、請求項1から4のいずれか1項に記載の構成において、前記複数の書類には、枚数が決まっていない第1の種類の書類と、第2の種類の書類とが含まれ、前記認識手段は、第1の種類の書類の次に第2の種類の書類を認識するように順番が決められている場合に、前記第1の種類に応じた第1の画像認識の方法及び前記第2の種類に応じた第2の画像認識の方法を用いて書類の種類を認識し、前記第1の画像認識の方法での認識が成功したときには当該方法及び前記第2の画像認識の方法で次の書類の種類を認識し、前記第2の画像認識の方法での認識が成功したときには当該方法で次の書類の種類を認識することを特徴とする。
本発明の請求項6に係る情報処理装置は、請求項1から5のいずれか1項に記載の構成において、前記第2の書類には複数の種類があり、当該複数の種類は前記生成手段により読み取られる順番が決まっておらず、前記認識手段は、複数の前記第2の書類の種類にそれぞれ対応する複数の画像認識の方法を用いた第2の書類の種類の認識を繰り返し試み、それまで認識が成功していた方法を用いた認識が失敗すると、その方法を除いた画像認識の方法を用いた前記第2の書類の種類の認識を試みることを特徴とする。
本発明の請求項7に係るシステムは、書類を読み取って当該書類の画像データを生成する生成手段と、複数種類の画像認識の方法を有し、前記生成手段によって複数の書類のうちの第1の書類と第2の書類の画像データがそれぞれが生成された場合、前記第1の書類の画像データから当該第1の書類の種類を認識し、前記複数種類の画像認識の方法のうち当該第1の書類の種類に応じた画像認識の方法を用いて前記第2の書類の画像データから当該第2の書類の種類を認識する認識手段とを備えることを特徴とする。
本発明の請求項8に係るプログラムは、コンピュータを、複数種類の画像認識の方法を有する認識手段であって、書類を読み取って当該書類の画像データを生成する生成手段によって複数の書類のうちの第1の書類と第2の書類の画像データがそれぞれ生成された場合、前記第1の書類の画像データから当該第1の書類の種類を認識し、前記複数種類の画像認識の方法のうち当該第1の書類の種類に応じた画像認識の方法を用いて前記第2の書類の画像データから当該第2の書類の種類を認識する認識手段として機能させることを特徴とする。
請求項1、7、8に係る発明によれば、認識対象が複数種類の書類を一式としてまとめたものであっても、それぞれの書類に適した書類認識の方法をそれぞれ適用して認識することができる。
請求項2に係る発明によれば、書類を提出した者に書類が足りているか否かを伝えることができる。
請求項3に係る発明によれば、第1の書類の種類に適した書類認識の方法が分からなくても第1の書類の種類を認識することができる。
請求項4に係る発明によれば、最初に読み取られた書類の種類が最後に認識される場合でも、第1の書類の種類を認識することができる。
請求項5に係る発明によれば、枚数が決まっていない種類の書類が含まれている場合でも、その枚数分だけその書類の種類を認識し、さらにその次の書類の種類も認識することができる。
請求項6に係る発明によれば、複数の種類の第2の書類を読み取る順番が決まっていない場合でも、それらの第2の書類の種類を認識することができる。
情報処理装置のハードウェア構成を表す図 情報処理装置が実現する機能構成を表す図 QRコード認識の対象となる書類の画像の一例を表す図 領域限定OCRの対象となる書類の画像の一例を表す図 申請に必要な書類群の例を表す図 複数の書類が読み取られる順番の一例を表す図 定義テーブルの一例を表す図 結果データが表す認識の結果の一例を表す図 申請書類の揃い具合を表す情報の一例を表す図 認識処理における動作の手順の一例を表す図 第2の書類の認識処理における動作の手順の一例を表す図 申請の種類を指定するための画像の一例を表す図 変形例の定義テーブルの一例を表す図 変形例の定義テーブルの他の一例を表す図 変形例の第2の書類の認識処理における動作の手順の一例を表す図 変形例の第2の書類の認識処理における動作の手順の一例を表す図 変形例の認識処理における動作の手順の一例を表す図 変形例で実現される機能構成の例を表す図 変形例で用いられる定義テーブルの一例を表す図 書類の画像に対する画像認識の様子の一例を表す図 複数の書類の画像の一例を表す図 変形例の認識処理における動作の手順の一例を表す図
[1]実施形態
例えば役所や企業などで行われる申請の業務では、その申請に必要な書類群が揃っていなければ申請が認められない。そのため、提出された書類を受け取った担当者は、申請に必要な書類群が揃っているか否かを確認する。本実施形態では、このように予め定められた申請に必要な書類群として提出された複数の書類の確認の作業を支援する情報処理装置について説明する。
図1は情報処理装置10のハードウェア構成を表す。情報処理装置10は、制御部11と、記憶部12と、表示部13と、操作部14と、画像読取部15とを備えるコンピュータである。制御部11は、CPU(Central Processing Unit)やRAM(Random Access Memory)、ROM(Read Only Memory)を有する。制御部11は、CPUがROMや記憶部12に記憶されているプログラムを実行することで、各部の動作を制御する。
記憶部12は、不揮発メモリであり、各種プログラムやデータを記憶する。表示部13は、各種メッセージや画像を表示するディスプレイ装置を備えている。操作部14は、情報処理装置10を操作するための操作子等を有する。画像読取部15は、例えばスキャナであり、用紙等のシートを光学的に読み取って、読み取ったシートを表す画像データを制御部11に供給する。画像読取部15は、トレーにセットされた複数のシートを順番に送り出して画像の読み取りを行う位置まで搬送する手段を有し、この手段により送り出されたシートを1枚ずつ順番に読み取る。本実施形態では、画像読取部15は複数のシートのうち、トレー側を下とした場合に上(トレーから離れた側)に重ねられたものから順番に送り出す。
情報処理装置10は、制御部11が記憶部12に記憶されているプログラムを実行することで、図2に示す機能が実現される。
図2は情報処理装置10が実現する機能構成を表す。情報処理装置10は、生成手段101と、認識手段102と、出力手段103とを備える。生成手段101は、書類を読み取ってその書類を表す画像データを生成する手段である。生成手段101は、複数の書類を1枚ずつ順番に読み取ると、生成したそれら複数の書類を表す画像データを認識手段102に供給する。このデータは、それぞれが書類を表す複数の画像データであってもよいし、複数の書類を表す1つの画像の画像データであってもよい。
認識手段102は、生成手段101によって画像データが生成された場合にその画像が表す書類の種類を認識する手段である。認識手段102は、以下に述べる複数の方法のいずれかまたはそれらを組み合わせた方法で書類の種類を認識する。具体的には、QR(Quick Response)コード(登録商標)認識、領域限定OCR(Optical Character Recognition)、罫線認識及びキーワード抽出、地色除去という5つの画像認識の方法が用いられる。
QRコード認識は、書類の画像にQRコードが表されている場合に、そのQRコードによりコード化されている情報(以下「コード情報」という)に基づいてその書類の種類を認識する方法である。QRコードは画像内のどの位置に表されていても認識可能なので、QRコードが表されていればどういった書類の画像であってもQRコード認識の対象となる。
図3はQRコード認識の対象となる書類の画像の一例を表す。図3では、「A申込書」という種類の書類の画像S1が表されている。画像S1の右上にはQRコードQ1が形成されている。この「A申込書」は例えば「0001」というコード情報に対応付けられているものとする。認識手段102は、QRコードQ1のコード情報を読み取り、読み取ったコード情報が「0001」である場合に、このコード情報に対応する「A申込書」という種類を、画像S1が表す書類の種類として認識する。
領域限定OCRは、画像内の文字の形を認識して対応する文字列のコードを取得するいわゆるOCR処理を書類の画像の決められた領域に限定して行った結果に基づいて、その書類の種類を認識する方法である。書類全体をOCR処理すると、罫線などの文字以外の画像を除去しなければ文字の認識率が低くなる。しかし、文字列が表される領域が決まっており、且つ、その領域の位置や大きさが予め分かっている書類の画像の場合は、領域限定OCRを用いることで書類全体をOCR処理するよりも文字の認識率が高められる。従って、この場合の書類の画像は領域限定OCRの対象となる。
図4は領域限定OCRの対象となる書類の画像の一例を表す。図4では、「住民票」という種類の書類の画像S2が表されている。画像S2の領域R1には、書類の種類をそのまま表した「住民票」という文字列T1が表されており、この文字列T1はいうまでもなく「住民票」という書類の種類に対応付けられている。領域R1は、書類の画像の左上を原点とするXY座標系の座標を用いて、座標(100、2)の点P1と、座標(200、18)の点P2とで表される。認識手段102は、これらの座標に基づいて、X座標が100以上200以下、Y座標が2以上18以下の領域R1に限定してOCR処理を行い、文字列T1のコードを取得する。認識手段102は、このコードが表す文字列T1に対応付けられた「住民票」という種類を、画像S2が表す書類の種類として認識する。
罫線認識は、書類に表されている表の形から書類の種類を認識する方法である。認識手段102は、書類に用いられる表の画像を記憶しておき、読み取られた書類の画像内にその表の画像が含まれているか否かを、パターンマッチング処理を行って判断する。認識手段102は、表の画像が含まれていれば、その表の画像に対応する種類の書類であると認識する。罫線認識は、QRコードを埋め込めない既成の書類や書類を特徴付ける文字列のサイズが小さい書類の画像などを対象に用いられる。
キーワード抽出は、「注文票」、「請求書」、「見積書」など、書類を特徴付ける文字列を読み取ることでその書類の種類を認識する方法である。これらの文字列は、書類の作成主体(企業や部門、担当者など)によって画像内の位置が異なるため領域限定OCRは適していない。一方、これらの文字列は、他の文字よりも相対的に大きく、横書きの書類の場合は書類の左右方向(横書きの文字が並ぶ方向)の中央で上下方向の上側に表されているといった特徴を有することが多い。そこで、認識手段102は、これらの文字列を認識した場合に、書類の特徴のとおりのサイズや配置となっていれば、その特徴を有する種類の書類であると認識する。キーワード抽出は、例えば特開2012−190313に開示されている技術を用いて実現される。
地色除去は、書類の下地として描かれた地紋等の画像を除去する方法である。下地が描かれていると下地が文字や罫線に干渉するため無地の場合に比べてOCR処理や罫線認識の認識率が低くなる。地色除去を行うことで、これらの認識率が高められる。
認識手段102による画像の認識は、申請に必要な書類群として複数の書類が提出されたときに行われる。
図5は申請に必要な書類群の例を表す。図5(a)では、申請Aで必要とされる「A申込書」、「住民票」及び「口座開設申請書」を含む書類群Aが表されている。図5(b)では、申請Bで必要とされる「B申込書」、「運転免許証」、「源泉徴収票」及び「請求書」を含む書類群Bが表されている。書類群Bに含まれる書類のうち、「運転免許証」は「パスポート」または「健康保険証」でもよく、「源泉徴収票」は「所得証明書」でもよい。また、「請求書」は「契約書」または「注文書」でもよい。
各書類群には、各々の書類群を代表する書類(以下「代表書類」という)が含まれている。代表書類は、その書類群に必ず含まれており、且つ、他の書類群には含まれていない書類である。例えば「A申込書」は書類群Aの代表書類D1であり、「B申込書」は書類群Bの代表書類D2である。例えば提出された複数の書類に代表書類D1が含まれていれば、それは書類群Aとして提出されたものであることが分かる。
なお、1枚の書類が複数の申請においてそれぞれの代表書類として用いられる場合がある。例えば、新規登録の申請と、登録更新の申請とを1枚の書類で兼ねさせている場合である。その場合、例えば「新規」及び「更新」のいずれかをチェックする欄など、どの申請で用いる書類なのかということを表す記載がある。従って、その記載がされた状態の書類は、印刷された事項は複数の申請で共通しているが、申請者が記入した事項も含めれば、他の申請の書類群には含まれていない書類、すなわち代表書類となる。
本実施形態では、申請者が、複数の書類を決められた順番に重ねて提出するものとする。決められた順番とは、例えば図5に表す書類群Aであれば、1番目が代表書類D1であるA申込書、2番目が住民票、3番目が口座開設申請書という順番である。また、書類群Bであれば、1番目が代表書類D2であるB申込書、2番目が運転免許証、3番目が源泉徴収票、4番目が請求書という順番である(2から4番目は代替の書類でもよい)。この順番は代表書類や代表書類を記載させる場所に貼ってある紙に記載されている。申請者はこの記載を参照して複数の書類を決められた順番に重ねる。
これらの書類を受け取った担当者は、この決められた順番で重ねられた状態の複数の書類を、代表書類が最初に読み取られるように(紙送りが上のシートから行われる場合には1番目を一番上にして)画像読取部15のトレーにセットする。これにより複数の書類が読み取られる順番について図6を参照して説明する。
図6は複数の書類が読み取られる順番の一例を表す。図6では、3枚の書類が提出され、1番目の代表書類D1と、2番目及び3番目のその他の書類とが順番に画像読取部15によって読み取られる様子が表されている。
上記のとおりセットされた複数の書類の読み取りが開始されると、生成手段101が、セットされた複数の書類、すなわち申請に必要な書類群として提出された複数の書類をそれぞれ表す画像データを生成する。認識手段102は、こうして申請に必要な書類群として提出された複数の書類のうちの第1の書類と第2の書類とを表す画像データが生成手段101によってそれぞれ生成された場合に、まず、第1の書類の画像からその第1の書類の種類を認識し、そののちに第2の書類の画像からその第2の書類の種類を認識する。
認識手段102は、本実施形態では、生成手段101によって最初(1枚目)に読み取られた書類を第1の書類として扱い、2枚目以降に読み取られた第1の書類以外の書類を第2の書類として扱う。認識手段102は、上述したQRコード認識などの複数種類の画像認識の方法を有し、それら複数の画像認識の方法を用いてこれらの書類の種類を認識する。認識手段102は、書類の種類ごとに用いるべき画像認識の方法を対応付けて定義した定義テーブルを用いる。
図7は定義テーブルの一例を表す。この定義テーブルでは、複数の書類群(A、B、C、D、…)にそれぞれ含まれる各書類の種類に対応する画像認識の方法が定義されている。各書類の種類に対しては、「1」、「2」、・・・というように順番が決められている。例えば書類群Aであれば、「1」番目が「A申込書」、「2」番目が「住民票」、「3」番目が「口座開設申請書」というように、書類の種類の順番が決められている。
1番目の「A申込書」に対しては、「QRコード認識」という画像認識の方法と、認識用情報として「コード情報:0001」とが対応付けられている。認識用情報とは、書類の種類を認識するために用いられる情報である。このコード情報は、QRコードが表しているコード情報が「0001」であった場合に、そのQRコードが表された書類の種類が「A申込書」だと認識される、というように用いられる。認識手段102がこの画像認識の方法を用いて処理の種類の認識を行ってみた結果、その方法に対応する書類の種類(この場合は「A申込書」)が認識された場合、この画像認識の方法が成功したことになる。反対に、対応する書類の種類が認識されなかった場合、この画像認識の方法が失敗したことになる。
2番目の「住民票」に対しては、「領域限定OCR」という画像認識の方法と、「座標:(100、2)、(200、18)」及び「文字列:住民票」という認識用情報とが対応付けられている。この認識用情報は、書類の画像においてこの座標で表された領域からOCR処理により読み取られた文字列が「住民票」である場合に、この書類の種類が「住民票」だと認識される、というように用いられる。書類群Aについては3番目の「口座開設申請書」まで定義がされている。書類群Bについては4番目の書類の種類まで定義がされている。また、各書類群の1番目の書類の種類は、いずれも代表書類である。
認識手段102は、複数通りの画像認識の方法を順番に用いて第1の書類の画像からその第1の書類の種類を認識するか否かをそれぞれ試みる。認識手段102は、複数の画像認識の方法として、前述した各書類群の1番目の書類の種類に定義テーブルにおいて対応付けられている複数の画像認識の方法を用いる。つまり、認識手段102が用いる複数通りの画像認識の方法は、各々が書類の種類に対応する方法である。認識手段102は、図7の例では、「A申込書」、「B申込書」、「C申請書」、「D申請書」という順番で、それらの書類の種類に対応付けられている画像認識の方法を用いて第1の書類の種類の認識を試みる。
本実施形態では、図7に表す定義テーブルを用いることで、「A申込書」、「B申込書」に対応付けられているQRコード認識が、他の画像認識の方法よりも先に用いられることになる。このように、認識手段102は、QRコードのように情報をコード化して表す画像(以下「コード画像」という)を認識する方法を、他の画像認識の方法よりも先に用いて第1の書類の種類の認識を試みる。
認識手段102が画像認識の方法を用いて第1の書類の種類を認識してみた結果、その認識は成功する場合もあれば失敗する場合もある。例えばQRコード認識を用いて読み取られたコード情報が「0002」であった場合、「A申込書」の認識は失敗するが、次の「B申込書」の認識が成功することになる。また、QRコード認識で「A申込書」及び「B申込書」のいずれも認識に失敗した場合、認識手段102は、「C申請書」に対応する領域限定OCRを用いた認識を行ってみて、それでも失敗する場合は「D申請書」に対応する領域限定OCRを用いた認識を試みる。このように、認識手段102は、第1の書類の種類を認識する際、認識に成功するまで画像認識の方法を変えて認識を試みる。
認識手段102は、前述した複数通りの画像認識の方法のうち、第1の書類の画像からのその第1の書類の種類の認識に成功した方法に対応する種類を第1の書類の種類として認識する。例えば「B申込書」に対応する画像認識の方法(コード情報「0002」を用いたQRコード認識)を用いた場合に認識が成功したのであれば、認識手段102は、この方法に対応する「B申込書」を第1の書類の種類として認識する。
認識手段102は、第1の書類の種類を認識すると、認識された第1の書類の種類を含む書類群について定義された画像認識の方法を、それ以降の書類の種類の認識で用いる。つまり、認識手段102は、複数種類の画像認識の方法のうち、認識した第1の書類の種類に応じた画像認識の方法を用いて第2の書類の画像からその第2の書類の種類を認識する。認識手段102は、例えば「B申込書」が第1の書類の種類として認識された場合には、書類群Bに対応付けられた定義をそれ以降の書類の種類の認識で用いる。具体的には、認識手段102は、2番目の書類の種類である「運転免許証」に対応する画像認識の方法を用いて第2の書類の種類の認識を行ってみて、その次には3番目の書類の種類である「X県住民票」に対応する画像認識の方法を用いて第2の書類の種類の認識を試みる。
認識手段102は、「運転免許証」に対応する画像認識の方法を用いた認識に失敗すると、もう1つの2番目の書類である「健康保険証」に対応する画像認識の方法を用いた認識を試みる。こちらも失敗した場合には、認識手段102は、3番目の書類である「X県住民票」に対応する画像認識の方法を用いた認識を試みる。「X県住民票」に対応する画像認識の方法は2つあるので、認識手段102は、例えばまず1つ目の方法である「領域限定OCR」を用いた認識を行ってみて、それに失敗した場合には2つ目の方法である「罫線認識/キーワード抽出」を用いた認識を試みる。この場合、いずれか一方が成功すれば、「X県住民票」が書類の種類として認識されることになる。
提出された書類に不備があると、例えば2番目の書類の種類として運転免許証も健康保険証も認識されない場合がある。認識手段102は、この場合のように第2の書類の種類の認識が失敗しても、続けて他の第2の書類について認識を試みる。認識が失敗したことも重要な情報であるし、他の第2の書類の認識の成否も重要な情報だからである。認識手段102は、こうして最後の第2の書類の種類まで認識を試みると、それらの認識の結果を表す結果データを出力手段103に供給する。
図8は結果データが表す認識の結果の一例を表す。この結果データは、書類群Bに含まれる書類の種類についてそれぞれ認識の「成功」、「失敗」及び「未実施」であったことを表している。この例では2番目の書類として「運転免許証」の認識が成功しているので、「健康保険証」の認識は実施されていない、つまり「未実施」であったことが表されている。
出力手段103は、認識手段102が認識した結果に基づいて、申請書類(申請のために提出された複数の書類のこと)の揃い具合を表す情報を出力する手段である。出力手段103は、認識手段102から結果データが供給されると、その結果データに基づいてこの申請書類の揃い具合を表す情報を出力する。
図9は申請書類の揃い具合を表す情報の一例を表す。図9(a)では、「画像認識が終了しました」という文字列と、申請の種類が「申請B」であることと、不足している書類がないこととを表す情報が、申請書類の揃い具合を表す情報として表示部13に表示されている。出力手段103は、結果データが表す書類群の各順番に対応付けられている書類の種類(図8の例では1番目から4番目までの書類の種類)について、いずれも少なくとも1以上の書類の種類について認識に成功していれば、不足している書類の種類がないことを表す情報を出力する。
図9(b)では、図9(a)の例と異なり、不足している書類の種類があることを表す情報が、申請書類の揃い具合を表す情報として表示部13に表示されている。図9(b)では、不足している書類の種類として、「運転免許証または健康保険証」という書類の種類が表されている。出力手段103は、結果データが表す書類群の各順番に対応付けられている書類のうち1つも画像認識に成功していないものがあれば、その順番の書類の種類を表す情報を出力する。図9(b)の例では、2番目の書類の種類である運転免許証及び健康保険証のいずれも認識に失敗しているため、これら2つの書類の種類が表されている。
情報処理装置10は、以上の構成に基づいて、書類の画像からその書類の種類を認識する認識処理を行う。認識処理で情報処理装置10が行う動作の手順について、図10及び図11を参照して説明する。
図10は認識処理における動作の手順の一例を表す。認識処理は、申請者により提出された複数の書類を担当者が情報処理装置10に読み取らせる操作を行うことを契機に開始される。まず、情報処理装置10が、複数の画像を読み取ると、それら複数の画像を表す画像データを生成する(ステップS11)。
次に、情報処理装置10は、代表書類に対応する方法を用いて第1の書類の画像からその第1の書類の種類を認識するか否かを試みる(ステップS12)。情報処理装置10は、この認識に成功したか否かを判断し(ステップS13)、成功した(YES)と判断した場合には、第2の書類の認識処理を行う(ステップS20)。第2の書類の認識処理は、第2の書類の画像からその第2の書類の種類の認識を試みる処理である。続いて、情報処理装置10は、ステップS20の認識処理を行っていない第2の書類の画像が有るか否かを判断し(ステップS15)、有る(YES)と判断した場合には、ステップS20の動作を再び行う。
情報処理装置10は、ステップS13において認識に失敗した(NO)と判断した場合には、ステップS12の認識において、自身に対応付けられた画像認識の方法が用いられていない書類群が有るか否かを判断する(ステップS14)。情報処理装置10は、ステップS14で述べた書類群が有る(YES)と判断した場合には、その書類群に対応付けられた画像認識の方法を用いてステップS12の動作を行う。情報処理装置10は、ステップS15で述べた第2の書類の画像がない(NO)と判断した場合には、申請書類の揃い具合を表す情報を出力して(ステップS16)、認識処理を終了する。
情報処理装置10は、ステップS14で述べた書類群がない(NO)と判断した場合にも、ステップS16の動作を行って認識処理を終了する。この場合の申請書類の揃い具合を表す情報は、例えば申請書類、すなわち申請のために提出された複数の書類にいずれの代表書類も含まれていないことを表す情報である。ステップS11の動作は生成手段101が行い、ステップS16の動作は出力手段103が行う。それら以外の動作はいずれも認識手段102が行う。
図11は第2の書類の認識処理における動作の手順の一例を表す。情報処理装置10は、まず、ステップS12で認識に成功した第1の書類に対応する方法を用いて第2の書類の種類の認識を試みる(ステップS21)。次に、情報処理装置10は、ステップS21での認識が成功したか否かを判断し(ステップS22)、成功した(YES)と判断した場合には、第2の書類の認識処理を終了する。情報処理装置10は、ステップS22で認識に失敗した(NO)と判断した場合には、認識に成功した第1の書類を含む書類群に含まれる他の書類の種類の中に、ステップS21の認識において画像認識の方法が用いられていないものが有るか否かを判断する(ステップS23)。情報処理装置10は、ステップS23で画像認識の方法が用いられていない書類の種類が有る(YES)と判断した場合には、その書類の種類に対応する画像認識の方法を用いてステップS21の動作を行い、ない(NO)と判断した場合には第2の書類の認識処理を終了する。
申請に必要な書類群に含まれる書類のフォーマットや記載された内容はまちまちなので、例えば1つの画像認識の方法を用いてそれらの書類の種類を全て認識するのは難しく、各書類の種類に応じた画像認識の方法が用いられることが望ましい。本実施形態では、申請のために提出された第1の書類及び第2の書類の画像から、第1の書類の種類が認識され、認識された第1の書類の種類に応じた画像認識の方法で第2の書類の種類が認識される。例えば上述した代表書類のように書類群に必ず含まれ且つ他の書類群には含まれない書類を第1の書類とすることで、第1の書類の種類が認識されれば、その申請で必要とされる他の書類、すなわち第2の書類の種類が決まり、その第2の書類の画像に対して有効な画像認識の方法も決まる。それらの方法が第1の書類の種類に応じて用いられるようにすることで、認識対象が複数種類の書類を一式としてまとめたものであっても、それぞれの書類に適した書類認識の方法がそれぞれ適用されて認識されることになる。また、それにより、画像認識の方法が固定されている場合に比べて、申請のために提出された複数の書類を表す画像からそれらの書類の種類を認識するときの精度が高められる。
また、本実施形態では、複数通りの画像認識の方法のうち第1の書類の種類の認識に成功した方法に対応する種類が第1の書類の種類として認識される。これにより、第1の書類の種類に適した書類認識の方法が分からなくても第1の書類の種類が認識されることになる。例えば申請を受け付ける業務では、どの種類の申請がされるかは予め分かっているから、それら全ての種類の申請のおける代表書類に対応する画像認識の方法を複数通りの画像認識の方法として用意しておくことで、申請の種類が分からなくても第1の画像の種類が認識されることになる。また、本実施形態では、申請書類、すなわち申請のために提出された複数の書類の揃い具合を表す情報が出力されるので、それらの書類を提出した申請者に書類が足りているか否かが伝えられることになる。
[2]変形例
上述した実施形態は、本発明の実施の一例に過ぎず、以下のように変形させてもよい。また、上述した実施形態及び以下に示す各変形例は、必要に応じてそれぞれ組み合わせて実施してもよい。
[2−1]代表書類の指定
実施形態では第1の書類の種類が画像認識により認識されたが、これに限らず、例えば申請書類を受け付ける担当者など、人が指定することで認識されてもよい。この場合、例えば認識手段102が、申請の種類を指定するための画像を表示部13に表示する。
図12は申請の種類を指定するための画像の一例を表す。図12では、表示部13に「申請の種類を指定してください」という文字列と、指定されている申請の種類を表示する表示欄G1と、指定する種類を決定する際にユーザが操作する操作子G2とが表示されている。図12のように「申請A」が表示欄G1に表示されているときに操作子G2が操作されることで、申請の種類として申請Aが指定される。この場合、認識手段102は、申請Aの代表書類である「A申込書」を第1の書類の種類として認識する。
例えば罫線認識やキーワード抽出といった画像認識の方法は、罫線や文字列の状態によっては正しい書類の種類が認識されない場合がある。そのため、例えば図7に表す書類群Dとして提出された複数の書類に「D申請書」が含まれていても、「D申請書」という文字列がずれて印刷されていると、領域限定OCRで正しい情報が読み取られず、第1の書類の種類が認識されないことになる。本変形例によれば、その場合にも、担当者が第1の書類の種類を指定することで、第1の書類の種類が認識されるようになり、第2の書類の種類の認識や申請書類の揃い具合を表す情報の出力が行われるようになる。
[2−2]複数枚の書類の種類の認識
実施形態では、1つの種類の書類は1枚の書類で提出されたが、複数枚の書類が提出される場合がある。例えば申請書に添付する証明書が3枚にわたって記載されているという場合である。この枚数が決まっている場合には、定義テーブルにおいて、各頁に対応する画像認識の方法が対応付けられていればよい。
図13は本変形例の定義テーブルの一例を表す。この定義テーブルでは、図7に表す定義テーブルに「頁」の列が加わっている。この例では、書類群Eの2番目の書類である「証明書」については、「1」から「3」頁まで3つの画像認識の方法が対応付けられている。この場合、認識手段102は、これら3つの頁の認識がいずれも成功した場合に、「証明書」を第2の書類の種類として認識する。
また、複数の書類には、枚数が決まっていない種類の書類が含まれている場合がある。例えば申請書に契約書の写しを添付する場合、添付する契約書の内容によって枚数が変化する。また、先に述べた証明書も、誰が作成するかによって枚数が変化することがある。この場合、認識手段102は次のように認識を行う。複数の書類には、第1の種類の書類と第2の種類の書類とが含まれており、第1の種類の書類の次に第2の種類の書類を認識するように順番が決められているものとする。
その場合に、認識手段102は、第1の種類に応じた第1の画像認識の方法及び第2の種類に応じた第2の画像認識の方法を用いて書類の種類を認識する。そして、認識手段102は、第1の画像認識の方法での認識が成功したときにはその第1の画像認識の方法及び第2の画像認識の方法で次の書類の種類を認識し、第2の画像認識の方法での認識が成功したときには引き続きその第2の画像認識の方法で次の書類の種類を認識する。このように認識が行われることで、第1の種類の書類の枚数が決まっていない場合でも、その枚数分だけ第1の種類の書類が認識される。この認識が行われる場合に用いられる定義テーブルの一例を図14に表す。
図14は本変形例の定義テーブルの他の一例を表す。この定義テーブルでは、書類群Eに含まれる「E申込書」、「証明書」、「契約書」及び「源泉徴収票」と、それらに対応する「α」、「β」、「γ」及び「Δ」という画像認識の方法とが表されている。各書類が認識される順番は「E申込書」、「証明書」、「契約書」、「源泉徴収票」と決められており、このうちの「証明書」及び「契約書」は枚数が決まっていないものとする。認識手段102は、まず、代表書類である「E申込書」をαの方法で認識する。これ以降の動作の手順について図15を参照して説明する。
図15は本変形例の認識処理における情報処理装置の動作の手順の一例を表す。情報処理装置10は、まず、β及びγという2つの方法を用いて書類の種類の認識を試みる(ステップS31)。次に、情報処理装置10は、γを用いて書類の種類が認識されたか否かを判断し(ステップS32)、認識されていない(NO)と判断した場合には、ステップS31に戻り、次の書類についても、β及びγという2つの方法を用いて書類の種類の認識を試みる。この場合、βが第1の画像認識の方法として用いられ、γが第2の画像認識の方法として用いられる。情報処理装置10は、ステップS32でγを用いて認識された(YES)と判断した場合には、次に、γ及びΔという2つの方法を用いて次の書類の種類の認識を試みる(ステップS33)。
続いて、情報処理装置10は、Δを用いて書類の種類が認識されたか否かを判断し(ステップS34)、認識されていない(NO)と判断した場合には、ステップS33に戻り、次の書類についても、γ及びΔという2つの方法を用いて書類の種類の認識を試みる。この場合、γが第1の画像認識の方法として用いられ、Δが第2の画像認識の方法として用いられる。情報処理装置10は、ステップS34でΔを用いて認識された(YES)と判断した場合には、Δを用いて認識される源泉徴収票は1枚の書類であるため、認識処理を終了する。ステップS31からS34までの動作は認識手段102が行う。
以上のとおり処理の種類が認識されることで、枚数が決まっていない種類の書類が複数の書類に含まれている場合でも、その種類の書類の枚数分だけその書類の種類が認識され、さらにその次の書類の種類も認識されることになる。なお、上述した第1及び第2の種類の書類は、いずれも第2の書類、すなわち2枚目以降に読み取られた第1の書類以外の書類であったが、第1の書類(つまり代表書類)の枚数が決まっていない場合には、代表書類が第1の種類の書類であり、その次に認識される書類が第2の種類の書類であってもよい。
[2−3]読み取りの順番が不定
実施形態では、生成手段101が読み取る書類の種類の順番が決まっていたが、これに限らない。例えば図14に表す第1の書類の種類である「E申込書」は1番目と決まっているが、第2の書類の種類である「証明書」、「契約書」及び「源泉徴収票」の順番が決まっていない場合を説明する。
図16は本変形例の第2の書類の認識処理における動作の手順の一例を表す。情報処理装置10は、まず、β、γ及びΔという3つの方法を用いて第2の書類の種類の認識を試みる(ステップS41)。この場合、第2の書類の種類がどのように並んでいても、いずれかの方法を用いた認識が成功することになる。次に、情報処理装置10は、認識が成功した画像認識の方法が変化したか否かを判断し(ステップS42)、変化していない(NO)と判断した場合にはステップS41に戻って動作を行う。これにより、証明書や契約書のように枚数が決まっていない種類の第2の書類であっても、認識がされなくなるまでステップS41の動作が繰り返し行われる。
情報処理装置10は、ステップS42で変化した(YES)と判断した場合には、先に認識が成功していた方法を除く2つの方法を用いて第2の書類の種類の認識を試みる(ステップS43)。例えば最初にγでの認識が成功していれば、β及びγが用いられる。次に、情報処理装置10は、認識が成功した画像認識の方法が変化したか否かを判断し(ステップS44)、変化していない(NO)と判断した場合にはステップS43に戻って動作を行う。情報処理装置10は、ステップS44で変化した(YES)と判断した場合には先に認識が成功していた方法を除く1つの方法を用いて第2の書類の種類の認識を試みる(ステップS45)。そして、情報処理装置10は、未認識の第2の書類の画像が有るか否かを判断し(ステップS46)、有る(YES)と判断した場合にはステップS45の動作を行い、ない(NO)と判断した場合には、第2の書類の認識処理を終了する。
本変形例では、認識手段102が、複数の第2の書類の種類にそれぞれ対応する複数の画像認識の方法を用いた第2の書類の種類の認識を繰り返し試み、それまで認識が成功していた方法を用いた認識が失敗すると、その方法を除いた画像認識の方法を用いて第2の書類の種類の認識を試みる。これにより、複数の種類の第2の書類を読み取る順番が決まっていない場合でも、それらの第2の書類の種類が認識されることになる。
[2−4]2段階の画像認識
認識手段102は、画像認識を2段階で行ってもよい。認識手段102は、例えば、画像認識の方法が適用可能か否かを確認するための画像認識を1段階目として行い、これにより適用可能と確認された場合に、適用可能と確認された画像認識を2段階目として行って書類の種類を認識する。この1段階目の画像認識としては、2段階目の画像認識よりも処理の負荷が小さいものが用いられる。具体例と挙げると、例えばQRコード認識の場合、書類の画像上にQRコードが有るか否かを確認するための画像認識が1段階目として行われ、有ることが確認されると、画像認識の方法が適用可能と判断し、そのQRコードが表すコード情報を読み取って書類の種類を認識するための画像認識が第2段階として行われる。
また、領域限定OCRの場合は、限定した領域が空白でないか否かを確認するための画像認識が1段階目として行われ、空白でないことが確認されると、画像認識の方法が適用可能と判断し、その領域に対するOCR処理が2段階目として行われる。認識手段102は、この1段階目の画像認識を図16に表すステップS41及びS43で行い、それにより適用可能と判断した方法を用いて第2の書類の種類の認識を試みる。これにより、常に第2の書類の種類の認識を試みる場合に比べて、認識手段102が行う処理の負荷が軽減される。
[2−5]上下反対の読み取り
実施形態では画像読取部15がトレーにセットされた複数の書類のうち上に重ねられたものから順番に送り出したが、反対に下に重ねられたものから順番に送り出すものもある。その場合、申請者が実施形態のように代表書類を1番上に重ねていると、代表書類が最後に読み取られることになる。また、申請者が代表書類を重ねる位置を間違えてしまい、代表書類が最後に読み取られるということも起こり得る。認識手段102は、こういった場合に備えた認識を行ってもよい。
具体的には、認識手段102は、生成手段101により最初に読み取られた書類を表す画像を第1の書類の画像とした場合に、その第1の書類の画像からは第1の書類の種類が認識されないときには、生成手段101により最後に読み取られた書類を表す画像を第1の書類の画像として第1の書類の種類の認識を試みる。これにより、前述したように代表書類が最後に読み取られたとしても、認識手段102は最後に読み取られた書類を表す画像から第1の書類の種類を認識し、そのあとは例えば実施形態のように第2の種類の書類の種類を認識する。本変形例によれば、複数の書類の重ね方やトレーへのセットの仕方が間違っていて代表書類が最後に読み取られてしまう場合、すなわち最初に読み取られた書類の種類が最後に認識される場合でも、第1の書類の種類が認識されることになる。
[2−6]代表書類の位置
代表書類の位置は、実施形態では複数の書類の一番上で上記の変形例では一番上または一番下であったが、それら以外、つまり他の書類に挟まれた位置であってもよい。その場合でも、例えば代表書類の位置が指定されることで、認識手段102は、指定された位置に相当する順番で読み取られた書類の画像を第1の書類の画像として、認識を行う。また、認識手段102は、第1の書類の画像の種類を認識するための画像認識の方法を各書類の画像に対して順番に行っていき、認識に成功した書類を第1の書類として認識してもよい。その場合は、認識手段102は、認識に失敗した書類も含めて第2の書類の認識処理を行う。
[2−7]複数の書類群の読み取り
実施形態では1つの申請のための複数の書類の種類が認識されたが、2以上の申請のための複数の書類の種類が連続して認識されてもよい。
図17は本変形例の認識処理における動作の手順の一例を表す。以下では、図7に表す書類群A及びBとして提出された複数の書類の画像が生成された場合を例にとって説明する。情報処理装置10は、まず、ステップS20(第2の書類の認識処理)まで図10に表す例と共通の動作を行う。それにより、書類群Aの「A申込書」及び「住民票」に対応する画像認識の方法を用いた書類の種類の認識が行われる。
次に、情報処理装置10は、第2の書類の種類の認識に用いられていない未使用の画像認識方法が有るか否かを判断する(ステップS51)。この例では、第1の書類の種類が「A申込書」と認識されるので、「住民票」及び「口座開設申請書」に対応する画像認識の方法が順番に用いられる。ステップS20で「住民票」に対応する画像認識の方法を用いた認識が行われたあとであれば、「口座開設申請書」に対応する画像認識の方法が未使用であるため、情報処理装置10は、ステップS20の動作を行い、この方法を用いて第2の書類の種類の認識を試みる。
これにより、未使用の画像認識の方法がなくなるので、情報処理装置10は、次に、複数の書類を表す画像が残っているか否かを判断する(ステップS52)。この例では、書類群Aとして提出された複数の書類は認識されたが、書類群Bとして提出された複数の書類はまだ認識されていない。つまり、複数の書類を表す画像が残っているので、情報処理装置10は、残っている(YES)と判断して、ステップS12(第1の書類の種類の認識)に戻って動作を行う。そののち、書類群Bとして提出された複数の書類についても認識が終了すると、情報処理装置10は、ステップS52で複数の書類を表す画像が残っていない(NO)と判断し、ステップS16(申請書類の揃い具合を表す情報の出力)の動作を行って認識処理を終了する。本変形例によれば、2以上の申請のための書類が提出されても、それらをまとめて読み取らせることで、各書類の種類が認識されることになる。
[2−8]画像認識の方法
画像認識の方法は上述したものに限らない。例えばQRコードの代わりにバーコードや他の2次元コード画像が用いられてもよい。また、QRコード認識及び領域限定OCRの両方を1つの種類の書類に対して用いてもよいし、3以上の画像認識の方法を組み合わせて1つの種類の書類に対して用いてもよい。また、OCR処理で用いる辞書のフォントの種類を認識用情報として用いてもよい。書類の種類によってフォントの種類が決まっている場合に、その種類のフォントを用いることで、そのフォントを用いない場合に比べて認識率が向上する。
[2−9]各手段を実現する装置
図2に示す各手段は実施形態とは異なる装置によって実現されてもよい。
図18は本変形例で実現される機能構成の例を表す。図18(a)では、図2に表す生成手段101を備える読取装置20と、認識手段102及び出力手段103を備える情報処理装置10aとを備える情報処理システム1が表されている。この例では、図1に表す画像読取部15を備えていない装置でも情報処理装置として利用される。
図18(b)では、読取装置20と、認識手段102を備える情報処理装置10bと、出力手段103を備える出力装置30とを備える情報処理システム1aが表されている。これらの装置は図示せぬ通信回線で接続されている。この場合の情報処理装置10bとしては、例えば書類の提出がされる場所とは異なる場所(例えばデータセンター)に設置されたサーバ装置が用いられる。この例では、書類を提出する窓口に設置された読取装置20に複数の書類が読み取られ、読み取られた書類を表す画像から情報処理装置10bが書類の種類を認識し、その結果を表す結果データが出力装置30に送信される。
出力装置30も窓口に設置されており、この装置が結果データに基づいて申請書類の揃い具合を表す情報を出力する。以上のように、実施形態で述べた情報処理装置10が実現する各手段は、様々な装置によって実現されてもよい。いずれの場合も、認識手段102を備える情報処理装置によって、画像認識の方法が固定されている場合に比べて、申請のために提出された複数の書類を表す画像からそれらの書類の種類を認識するときの精度が高められる。
[2−10]複数の書類
複数の書類は、予め定められた申請に必要な書類群として提出されたものに限らない。例えば申請とは異なる業務で作成される複数の書類であってもよい。それらの書類を読み込んで生成された画像データを記録する業務があれば、上述した認識処理が行われることで、書類の揃い具合がユーザに伝えられるので業務の役に立つ。要するに、書類の種類の組合せが予め定められている書類群として提出されるものであれば、どのような複数の書類が用いられてもよい。いずれの場合も、認識手段102が提出された複数の書類のそれぞれの種類を認識し、出力手段103が、認識手段102が認識した結果に基づいて、提出された複数の書類の揃い具合を表す情報を出力することで、それらの書類を提出した者に書類が足りているか否かが伝えられることになる。
[2−11]第1の書類
実施形態では、第1の書類は1枚の書類であったが、2枚以上の書類であってもよい。その場合、第1の書類である代表書類についても、その頁ごとの画像認識の方法が対応付けられた定義テーブルが用いられる。
図19は本変形例で用いられる定義テーブルの一例を表す。この定義テーブルでは、書類群Fの代表書類である「F申請書」と、その各頁に対応する「ε」、「ζ」及び「η」という画像認識の方法が表されている。また、2番目の書類である「運転免許証」とそれに対応する「κ」という画像認識の方法も表されている。
認識手段102は、各代表書類に対応付けられた画像認識の方法で第1の書類の種類の認識を試みる際に、「F申請書」については、1番目の書類に対応付けられた「ε」を用いて認識を試みる。この認識が成功すると、認識手段102は、引き続き2番目の書類の画像の「ζ」を用いた認識を試みて、それも成功すると、3番目の書類の画像の「η」を用いた認識を試みる。これらの認識が成功すると、認識手段102は、第1の書類の種類を「F申請書」と認識し、残る第2の書類の画像の「κ」を用いた認識を試みる。このように、代表書類が2枚以上の書類であっても、それを第1の書類とした認識が行われる。
[2−12]画像認識を行う方向
認識手段102は、画像認識を行う際、画像を複数のパーツに分割し、例えば画像の一方の側から他方の側に向けて順次画像のパーツを読み込んで行き、読み込んだパーツに対して画像認識の処理を行っていく。
図20は書類の画像に対する画像認識の様子の一例を表す。図20(a)では、書類の画像S3のパーツが上辺H31側から読み込まれて下辺H32側に向けて画像認識の処理が行われていく様子が表されている。図20(b)では、画像H3のパーツが下辺H32側から読み込まれて上辺H31側に向けて画像認識の処理が行われていく様子が表されている。
例えば領域限定OCRを行う場合、限定する領域が上辺H32側にあるのなら、上辺H31側から画像のパーツを読み込めば、その領域の画像のパーツを読み込んだあとは読み込みを停止させてもよい。一方、下辺H32側から画像のパーツを読み込むと、限定する領域の画像のパーツを読み込むまでに画像のパーツの概ね全体を読み込むことになる。そのため、限定する領域が存在する側から認識手段102が画像認識の処理を行うようにすると、反対側から行う場合に比べて、画像認識の処理の負荷が軽くなる。これは他の画像認識の処理でもいえることである。従って、認識手段102が、書類の画像において画像認識の処理を施す領域の配置が偏っていた場合に、その領域が配置されている側から画像認識の処理を施すことで、その反対側から行う場合に比べて、画像認識の処理の負荷が軽くなる。
また、認識手段102は、複数の書類の画像の画像認識を次のように行ってもよい。
図21は複数の書類の画像の一例を表す。図21では、画像S3−1からS3−6までの6つの画像が表されている。これらの画像は、いずれも、書類の上側に限定された領域R3が定められており、図21ではそれらの領域R3を斜線を引いて表している。申請者が書類の上下を合わせて重ねていれば、これらの領域R3は同じ側に配置されるはずで あるが、この例では、S3−1からS3−3までの画像と画像S3−4から3−6までの画像とが上下反対に向けられて重ねられている。このため、領域R3の配置もS3−1からS3−3までは上辺H31側に偏っていたが、D3−4からは下辺H32側に偏るようになっている。
認識手段102は、書類の画像の一方の側(例えば上辺H31側)からその反対側(例えば下辺H32側)に向けて画像認識の処理を進めていき、対象の領域に対する処理が終わったら画像認識の処理を停止して、次の書類の画像に対して画像認識の処理を施す。その際、認識手段102は、各書類の画像に対する画像認識の処理量を測定しておき、測定した処理量が閾値以上になった場合に、次の書類の画像からは画像認識の処理を前述した反対側(この例では下辺H32側)から開始する。この閾値としては、例えば、書類の画像の半分または3分の1等の領域に対して画像認識の処理を施したときの処理量が定められる。これにより、画像認識の処理を進める方向が一定の場合に比べて、認識手段102が行う画像認識の処理の量が少なくなる。
[2−13]書類の種類以外の認識
認識手段102は、実施形態では処理の種類を認識したが、これ以外の情報を認識してもよい。認識手段102は、例えば、書類の決められた領域に記載があるか否かを認識したり、記載された文字列を認識したりする。例えばその領域に記載すべき文字列が定義テーブルに定義されていれば、認識手段102は、認識した文字列と定義テーブルを用いて、記載すべき文字列がその領域に記載されているか否かも認識する。これらの場合、出力手段103は、決められた領域の記載の有無を表す情報を申請書類の揃い具合を表す情報として出力する。これにより、申請に必要な種類の書類は揃っていても記載に不備があるため申請が受け付けられない場合に、そのことが申請者に伝えられることになる。
[2−14]認識失敗時の処理
認識手段102は、実施形態では第2の書類の種類の認識が失敗しても続けて他の第2の書類について認識を試みたが、これに限らず、認識が失敗した時点で第2の書類の認識を終了してもよい。なお、図7に表す書類群Bの2番目の書類(「運転免許証」または「健康保険証」)のように、複数種類の書類のうちのいずれかを提出すればよいもの(代替の書類があるもの)については、それら複数種類の書類のそれぞれに対応する画像認識の方法が全て失敗した場合に、第2の書類の認識を終了する。
図22は本変形例の認識処理における動作の手順の一例を表す。この例では、まず、図10に表すステップS11(画像データの生成)からステップS13(認識成功の判断)までが行われる。情報処理装置10は、第1の書類の種類の認識に成功したと判断すると、次に、第2の書類の認識処理として、書類の順番毎の第2の書類の認識処理を行う(ステップS60)。例えば図7に表す「B申込書」に対応する方法を用いて第2の書類の種類の認識を試みる場合であれば、2番目の書類である「運転免許証」の認識を行い、それに失敗すれば「健康保険証」の認識も行う。つまり、情報処理装置10は、各順番の書類に代替の書類がある場合には、認識が成功するまでそれら代替の書類についても全て書類の種類の認識を試みる。
次に、情報処理装置10は、第2の書類の認識処理が失敗したか否かを判断する(ステップS61)。情報処理装置10は、第2の書類の認識処理が失敗した(YES)と判断した場合には、ステップS16に進んで、申請書類が揃っていないことを表す情報(運転免許証か健康保険証が欠けていることを表す情報でもよい)を出力する。また、情報処理装置10は、第2の書類の認識処理が成功した(NO)と判断した場合には、ステップS15(認識処理の未実施の判断)を行う。例えば2番目の書類の認識が成功しても、3番目以降の書類が認識処理されずに残っているので、ステップS60に戻って3番目の書類の認識処理が行われる。このように、本変形例では、2番目以降の書類については、書類の順番毎に第2の書類の認識処理が行われる。
[2−15]発明のカテゴリ
本発明は、上述した情報処理装置の他に、情報処理装置が実現する機能を実現する複数の装置やそれらの装置を備えるシステムとしても捉えられる。また、情報処理装置が実施する処理を実現するための情報処理方法や、情報処理装置のようなコンピュータを、上述した各手段として機能させるためのプログラムとしても捉えられる。このプログラムは、それを記憶させた光ディスク等の記録媒体の形態や、インターネット等のネットワークを介してコンピュータにダウンロード及びインストールさせて利用可能にするなどの形態で提供される。
1…情報処理システム、10…情報処理装置、20…読取装置、30…出力装置、11…制御部、12…記憶部、13…表示部、14…操作部、15…画像読取部、101…生成手段、102…認識手段、103…出力手段。

Claims (8)

  1. 複数種類の画像認識の方法を有する認識手段であって、書類を読み取って当該書類の画像データを生成する生成手段によって複数の書類のうちの第1の書類と第2の書類の画像データがそれぞれ生成された場合、前記第1の書類の画像データから当該第1の書類の種類を認識し、前記複数種類の画像認識の方法のうち当該第1の書類の種類に応じた画像認識の方法を用いて前記第2の書類の画像データから当該第2の書類の種類を認識する認識手段
    を備えることを特徴とする情報処理装置。
  2. 前記複数の書類は、書類の種類の組合せが予め定められている書類群として提出されるものであり、
    前記認識手段が認識した結果に基づいて、提出された前記複数の書類の揃い具合を表す情報を出力する出力手段を備える
    ことを特徴とする請求項1に記載の情報処理装置。
  3. 前記認識手段は、前記第1の書類の種類を認識する際、認識に成功するまで前記画像認識の方法を変えて認識を試みる
    ことを特徴とする請求項1または2に記載の情報処理装置。
  4. 前記生成手段は複数の書類を1枚ずつ順番に読み取り、
    前記認識手段は、前記生成手段により最初に読み取られた書類の画像データを前記第1の書類の画像データとした場合に、当該第1の書類の画像データからは当該第1の書類の種類が認識されない場合には、前記生成手段により最後に読み取られた書類の画像データを前記第1の書類の画像データとして前記第1の書類の種類の認識を試みる
    ことを特徴とする請求項3に記載の情報処理装置。
  5. 前記複数の書類には、枚数が決まっていない第1の種類の書類と、第2の種類の書類とが含まれ、
    前記認識手段は、第1の種類の書類の次に第2の種類の書類を認識するように順番が決められている場合に、前記第1の種類に応じた第1の画像認識の方法及び前記第2の種類に応じた第2の画像認識の方法を用いて書類の種類を認識し、前記第1の画像認識の方法での認識が成功したときには当該方法及び前記第2の画像認識の方法で次の書類の種類を認識し、前記第2の画像認識の方法での認識が成功したときには当該方法で次の書類の種類を認識する
    ことを特徴とする請求項1から4のいずれか1項に記載の情報処理装置。
  6. 前記第2の書類には複数の種類があり、当該複数の種類は前記生成手段により読み取られる順番が決まっておらず、
    前記認識手段は、複数の前記第2の書類の種類にそれぞれ対応する複数の画像認識の方法を用いた第2の書類の種類の認識を繰り返し試み、それまで認識が成功していた方法を用いた認識が失敗すると、その方法を除いた画像認識の方法を用いた前記第2の書類の種類の認識を試みる
    ことを特徴とする請求項1から5のいずれか1項に記載の情報処理装置。
  7. 書類を読み取って当該書類の画像データを生成する生成手段と、
    複数種類の画像認識の方法を有し、前記生成手段によって複数の書類のうちの第1の書類と第2の書類の画像データがそれぞれが生成された場合、前記第1の書類の画像データから当該第1の書類の種類を認識し、前記複数種類の画像認識の方法のうち当該第1の書類の種類に応じた画像認識の方法を用いて前記第2の書類の画像データから当該第2の書類の種類を認識する認識手段とを備える
    ことを特徴とするシステム。
  8. コンピュータを、
    複数種類の画像認識の方法を有する認識手段であって、書類を読み取って当該書類の画像データを生成する生成手段によって複数の書類のうちの第1の書類と第2の書類の画像データがそれぞれ生成された場合、前記第1の書類の画像データから当該第1の書類の種類を認識し、前記複数種類の画像認識の方法のうち当該第1の書類の種類に応じた画像認識の方法を用いて前記第2の書類の画像データから当該第2の書類の種類を認識する認識手段
    として機能させるためのプログラム。
JP2015004930A 2015-01-14 2015-01-14 情報処理装置、システム及びプログラム Expired - Fee Related JP6476877B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2015004930A JP6476877B2 (ja) 2015-01-14 2015-01-14 情報処理装置、システム及びプログラム
US14/814,604 US9811724B2 (en) 2015-01-14 2015-07-31 Information processing apparatus, system, and non-transitory computer readable medium
CN201510518384.0A CN105787425B (zh) 2015-01-14 2015-08-21 信息处理设备、信息处理系统以及信息处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015004930A JP6476877B2 (ja) 2015-01-14 2015-01-14 情報処理装置、システム及びプログラム

Publications (2)

Publication Number Publication Date
JP2016130942A JP2016130942A (ja) 2016-07-21
JP6476877B2 true JP6476877B2 (ja) 2019-03-06

Family

ID=56367778

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015004930A Expired - Fee Related JP6476877B2 (ja) 2015-01-14 2015-01-14 情報処理装置、システム及びプログラム

Country Status (3)

Country Link
US (1) US9811724B2 (ja)
JP (1) JP6476877B2 (ja)
CN (1) CN105787425B (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6807630B2 (ja) * 2016-12-12 2021-01-06 シャープ株式会社 画像読取装置及び複合機、画像読取方法並びに画像読取用プログラム
JP2019028676A (ja) * 2017-07-28 2019-02-21 グローリー株式会社 紙葉類処理装置、紙葉類処理システム、紙葉類処理方法及び紙葉類処理プログラム
JP7338135B2 (ja) * 2018-09-10 2023-09-05 富士フイルムビジネスイノベーション株式会社 認識処理装置及びプログラム
JP7147544B2 (ja) * 2018-12-19 2022-10-05 京セラドキュメントソリューションズ株式会社 情報処理装置、及び情報処理方法
CN111626076A (zh) * 2019-02-27 2020-09-04 富士通株式会社 信息处理方法、信息处理设备和扫描仪
JP6786658B2 (ja) * 2019-04-25 2020-11-18 株式会社東芝 書類読取システム
JP7351159B2 (ja) * 2019-09-19 2023-09-27 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
JP2021047693A (ja) * 2019-09-19 2021-03-25 富士ゼロックス株式会社 情報処理装置及びプログラム
JP2022091577A (ja) * 2020-12-09 2022-06-21 株式会社リコー 情報処理装置、情報処理方法、プログラム、情報処理システム

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1013657A (ja) * 1996-06-21 1998-01-16 Brother Ind Ltd 画像データ処理装置、および記憶媒体
JP3520872B2 (ja) * 2003-03-05 2004-04-19 株式会社日立製作所 帳票処理方法およびシステム
RU2003108433A (ru) * 2003-03-28 2004-09-27 Аби Софтвер Лтд. (Cy) Способ предварительной обработки изображения машиночитаемой формы
RU2635259C1 (ru) * 2016-06-22 2017-11-09 Общество с ограниченной ответственностью "Аби Девелопмент" Способ и устройство для определения типа цифрового документа
JP4255766B2 (ja) 2003-07-11 2009-04-15 日立オムロンターミナルソリューションズ株式会社 イメージ処理システム及びイメージ処理装置
US8023155B2 (en) * 2005-03-31 2011-09-20 Hubin Jiang Imaging system with quality audit capability
JP2008059157A (ja) * 2006-08-30 2008-03-13 Fuji Xerox Co Ltd 書類確認支援システム、書類確認支援装置およびプログラム
CN101276412A (zh) * 2007-03-30 2008-10-01 夏普株式会社 信息处理装置、信息处理系统和信息处理方法
JP4630350B2 (ja) * 2008-02-29 2011-02-09 株式会社沖データ 画像処理装置および画像処理方法
CN102054171A (zh) * 2009-10-30 2011-05-11 株式会社东芝 文档文件种类识别装置以及文档文件种类识别方法
IL202028A (en) * 2009-11-10 2016-06-30 Icts Holding Company Ltd Product, devices and methods for computerized authentication of electronic documents
US8811711B2 (en) * 2011-03-08 2014-08-19 Bank Of America Corporation Recognizing financial document images
JP5721052B2 (ja) 2011-03-11 2015-05-20 富士ゼロックス株式会社 画像処理装置およびプログラム
JP5924114B2 (ja) * 2012-05-15 2016-05-25 ソニー株式会社 情報処理装置、情報処理方法、コンピュータプログラムおよび画像表示装置
US9406089B2 (en) * 2013-04-30 2016-08-02 Intuit Inc. Video-voice preparation of electronic tax return
US10657186B2 (en) * 2015-05-29 2020-05-19 Dell Products, L.P. System and method for automatic document classification and grouping based on document topic

Also Published As

Publication number Publication date
US9811724B2 (en) 2017-11-07
CN105787425A (zh) 2016-07-20
US20160203363A1 (en) 2016-07-14
CN105787425B (zh) 2019-11-08
JP2016130942A (ja) 2016-07-21

Similar Documents

Publication Publication Date Title
JP6476877B2 (ja) 情報処理装置、システム及びプログラム
US9946865B2 (en) Document authentication based on expected wear
JP2016048444A (ja) 帳票識別プログラム、帳票識別装置、帳票識別システム、および帳票識別方法
US9607524B2 (en) Method and system for generating and evaluating assessment sheets
EP3757881A1 (en) Documentation determination device and documentation determination program
US20150138608A1 (en) System and Method for Printing a Hidden and Secure Barcode
JP5657401B2 (ja) 文書処理装置、及び文書処理プログラム
JP2020013281A (ja) 帳票情報処理装置、帳票情報構造化処理方法及び帳票情報構造化処理プログラム
JP4364827B2 (ja) 帳票処理システム
JP6454998B2 (ja) 帳票処理システム、帳票処理装置及び帳票処理装置用プログラム
JP7206740B2 (ja) 情報処理装置及びプログラム
JP4864574B2 (ja) 帳票処理装置
JP2007334735A (ja) 紙書類と電子データの整合性を検証する装置、方法およびコンピュータプログラム
JP4309881B2 (ja) 身分証認識装置及び身分証認識方法
JP3513806B2 (ja) 不動産登記情報ファイリングシステム
JP2005208934A (ja) 文書配信処理装置及び文書配信処理プログラム
JP2010152464A (ja) 文字認識装置、文字認識装置の確認画面生成方法
JP2008017053A (ja) 帳票処理装置
JP7069821B2 (ja) 画像処理装置、画像処理システム、及び画像処理プログラム
JP4318311B2 (ja) 帳票並びに帳票処理装置および帳票処理プログラム
JP6695638B2 (ja) 画像処理プログラム、画像処理装置および画像処理方法
JP2020052498A (ja) 情報処理装置及びプログラム
KR101642707B1 (ko) 위변조 방지 기능이 구비된 유가증권, 그 유가 증권의 위변조 방지방법 및 위변조 확인 방법
JP5647367B1 (ja) 答案評価支援システム
JP2007065736A (ja) 文字認識装置及び文字認識方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20171214

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181221

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190108

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190121

R150 Certificate of patent or registration of utility model

Ref document number: 6476877

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees