JP2019185142A - 画像処理装置、画像処理方法、プログラム - Google Patents

画像処理装置、画像処理方法、プログラム Download PDF

Info

Publication number
JP2019185142A
JP2019185142A JP2018071146A JP2018071146A JP2019185142A JP 2019185142 A JP2019185142 A JP 2019185142A JP 2018071146 A JP2018071146 A JP 2018071146A JP 2018071146 A JP2018071146 A JP 2018071146A JP 2019185142 A JP2019185142 A JP 2019185142A
Authority
JP
Japan
Prior art keywords
image data
group
form image
work
character string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018071146A
Other languages
English (en)
Other versions
JP7160432B2 (ja
Inventor
裕一 中谷
Yuichi Nakatani
裕一 中谷
克彦 近藤
Katsuhiko Kondo
克彦 近藤
哲 ▲瀬▼川
哲 ▲瀬▼川
Satoru Segawa
杉本 充
Mitsuru Sugimoto
充 杉本
康 日高
Yasushi Hidaka
康 日高
隼哉 秋山
Junya Akiyama
隼哉 秋山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2018071146A priority Critical patent/JP7160432B2/ja
Priority to PCT/JP2019/012937 priority patent/WO2019194029A1/ja
Priority to EP19780888.4A priority patent/EP3779856B1/en
Priority to SG11202009541RA priority patent/SG11202009541RA/en
Priority to US17/043,360 priority patent/US11989693B2/en
Publication of JP2019185142A publication Critical patent/JP2019185142A/ja
Application granted granted Critical
Publication of JP7160432B2 publication Critical patent/JP7160432B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/416Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Business, Economics & Management (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Tourism & Hospitality (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Quality & Reliability (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Geometry (AREA)
  • Computer Graphics (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Image Analysis (AREA)

Abstract

【課題】労力がかかる作業情報を作業者が優先して行う作業として提示する。【解決手段】帳票画像の光学読取結果として生成された帳票画像データを取得する。帳票画像データのグループ種別が特定可能かを判定する。帳票画像データのグループ種別を判定不能と判定した場合にグループ種別の確認作業の必要な帳票画像データと判定する。【選択図】図1

Description

本発明は、画像処理装置、画像処理方法、プログラムに関する。
スキャナ等を用いて取得した文書等が記載された帳票の画像をOCR(Optical Character Recognition)処理し、文書を読み取る画像処理装置がある。帳票の書式が様々である場合にはこのような画像処理装置では帳票の様式定義の情報を予め記憶しておき、読取対象領域を特定することでOCR処理の精度を高めている。これに関連する技術が特許文献1に開示されている。
特開2016−48444号公報
ところで上述のような画像処理装置においては新たに取得した帳票の画像のグループを特定し、特定したグループに応じた処理を行う。一例としては、通関業務で用いられる帳票画像が所定のグループで特定される帳票画像と判定される場合には、通関士に対して当該帳票画像に基づく通関業務の作業を依頼する。また帳票画像が所定のグループで特定される帳票画像と判定されなかった場合には帳票画像を作成するキーパンチャーなどの作業者に対して、通関業務で用いられる帳票画像として適切な画像となるよう文字情報の登録などを再度行うよう依頼する。このような処理が行われる装置においては、帳票の画像のグループを特定する処理は当該画像の機械学習結果を用いて行う。しかしながらこの機械学習の精度が低い帳票の画像や機械学習を行っていない帳票の画像はグループを特定することができない。このようなグループを特定することができない帳票の画像は機械学習のための作業者(上述のキーパンチャーなど)による作業が必要であるが、当該作業は労力がかかるため、作業者が優先して行う作業として当該作業者に提示する必要がある。
そこでこの発明は、上述の課題を解決する画像処理装置、画像処理方法、プログラムを提供することを目的としている。
本発明の第1の態様によれば、画像処理装置は、帳票画像の光学読取結果として生成された帳票画像データを取得する取得部と、前記帳票画像データのグループ種別が特定可能かを判定するグループ特定部と、前記帳票画像データのグループ種別を判定不能と判定した場合にグループ種別の確認作業の必要な帳票画像データと判定する作業対象判定部と、を備えることを特徴とする。
本発明の第2の態様によれば、画像処理方法は、帳票画像の光学読取結果として生成された帳票画像データを取得し、前記帳票画像データのグループ種別が特定可能かを判定し、前記帳票画像データのグループ種別を判定不能と判定した場合にグループ種別の確認作業の必要な帳票画像データと判定することを特徴とする。
本発明の第3の態様によれば、プログラムは、画像処理装置のコンピュータを、帳票画像の光学読取結果として生成された帳票画像データを取得する取得手段、前記帳票画像データのグループ種別が特定可能かを判定するグループ特定手段、前記帳票画像データのグループ種別を判定不能と判定した場合にグループ種別の確認作業の必要な帳票画像データと判定する作業対象判定手段、として機能させることを特徴とする。
本発明によれば、グループを特定することができない帳票の画像の確認のための作業を、作業者が優先して行う作業として出力することができる。
本発明の一実施形態による含む画像処理システムの概要を示す図である。 本発明の一実施形態による画像処理装置のハードウェア構成を示す図である。 本発明の一実施形態による画像処理装置の機能ブロックを示す第一の図である。 本発明の一実施形態による文書帳票の一例を示す図である。 本発明の一実施形態によるデータベースが記憶するデータテーブルの概要を示す図である。 本発明の一実施形態による画像処理装置の処理フローを示す第一の図である。 本発明の一実施形態による画像処理装置の処理フローを示す第二の図である。 本発明の一実施形態による画像処理装置の機能ブロックを示す第二の図である。 本発明の一実施形態による画像処理装置の処理フローを示す第三の図である。 本発明の一実施形態による画像処理装置の処理フローを示す第四の図である。 本発明の一実施形態による画像処理装置の機能ブロックを示す第三の図である。 本発明の一実施形態による画像処理装置の処理フローを示す第五の図である。 本発明の一実施形態による画像処理装置の処理フローを示す第六の図である。 本発明の一実施形態による画像処理装置の最小構成を示す図である。
以下、本発明の一実施形態による画像処理装置を図面を参照して説明する。
図1は本実施形態による画像処理装置を含む画像処理システムの概要を示す図である。
図1で示すように画像処理システム100は画像処理装置1、画像読取装置2、記録装置3、データベース4により構成される。
画像処理装置1は画像読取装置2と通信ケーブルにより接続されている。画像読取装置2は光学的に文書帳票などの画像データを取得して画像処理装置1へ出力する。画像処理装置1は文書帳票の画像データをOCR処理し文字認識する。画像処理装置1は文字認識結果を記録装置3に出力し、記録装置3がその文字認識結果をデータベースに記録する。データベース4は画像処理装置1と記録装置3とに接続されている。データベース4は記録装置3から過去に登録された複数の文書帳票の画像データとその画像データに含まれる文字列のうち記録対象となる文字列を示す記録文字列の対応関係を記憶している。記録文字列が示す文字列は文書帳票に記述される文字列のうちデータベース4に記録、保存しておくべき重要な文字列である。画像処理システム100を利用する作業者は予め、記録装置3を用いて過去に登録された複数の文書帳票の画像データとその画像データに含まれる文字列のうちの記録文字列をデータベース4に登録しておく。
そして記録装置3には文書帳票の画像データとその画像データに含まれる文字列の情報のうち記録対象となる文字列を示す記録文字列の情報との対応関係が、多くの文書帳票について十分に記録されているものとする。このような状態において、画像処理装置1は処理を行う。
図2は画像処理装置のハードウェア構成を示す図である。
画像処理装置1は図2で示すように、CPU(Central Processing Unit)11、IF(Interface)12、通信モジュール13、ROM(Read Only Memory)14、RAM(Random Access Memory)15、HDD(Hard Disk Drive)16などの構成を備えたコンピュータである。通信モジュール13は画像読取装置2、記録装置3、データベース4との間で無線通信を行うものであっても、有線通信を行うものであってもよく、それら2つの機能を有していてもよい。
図3は画像処理装置の機能ブロックを示す第一の図である。
画像処理装置1のCPU11は記憶するプログラムを実行することにより、制御部101、取得部102、特徴量抽出部103、読取対象特徴量生成部104、記録部105の機能を備える。
制御部101は、他の機能部を制御する。
取得部102は、文書帳票の画像データを取得する。
特徴量抽出部103は、複数の文書帳票の画像データの認識処理結果に基づいて、文書帳票の画像データに含まれる記録文字列の特徴を示す第一特徴量を文書帳票の画像データ毎に抽出する。
読取対象特徴量生成部104は、文書帳票の画像データに対応する第一特徴量を用いて記録文字列の読取対象特徴量を生成する。
記録部105は、新たな文書帳票の画像データの読取対象特徴量を用いて、新たな文書帳票の画像データから読み取った文字列の情報のうちの記録文字列を抽出して記録する。
このような処理により画像処理装置1は新たな文書帳票の画像データに含まれる記録するべき文字列情報の記録の労力を軽減する。
図4は文書帳票の一例を示す図である。
この図が示すように文書帳票には、その文書を作成した企業のマーク、作成日、作成担当者、文書内容が、その文書帳票に特有のフォーマットで記述されている。文書内容は、例えば文書帳票が発注票であれば発注した商品名やその発注個数などの情報の組が1つまたは複数を示す。作業者はある1つの文書帳票に基づいて、その文書帳票に記述されている文字列のうち記録すべき特定の記録文字列を、記録装置3を用いてデータベース4へ記録する。具体的には作業者は文書帳票を見ながら記録装置3がデータベース4に記録すべき特定の記録文字列を入力する。また作業者は文書帳票の画像データを画像読取装置2に読み込ませる。文書帳票は作業者の操作に基づいて画像読取装置2が読み取り画像処理装置1へ出力する。そして記録装置3は作業者の操作と画像処理装置1の制御とに基づいて、1つの文書帳票についての画像データと、その文書帳票に記述されている文字列のうち記録すべき特定の記録文字列を対応付けてデータベース4に記録する。図4の例においては、日付51、発注先52、商品名53、数量54、金額55が記録すべき特定の記録文字列である。文書帳票5には作業者によって記録されない非記録文字列等のその他の情報も印字されている。当該情報は例えば文書帳票を発行した発注者の名称501、発注者のエンブレム画像502、文書帳票のタイトル503、挨拶文504などである。
図5はデータベースが記憶するデータテーブルの概要を示す図である。
図5で示すようにデータベース4は文書帳票についての画像データと、その文書帳票に記述されている文字列のうち記録すべき特定の記録文字列を対応付けて記録テーブルに記憶する。
図6は画像処理装置の処理フローを示す第一の図である。
次に画像処理装置1の処理フローについて順を追って説明する。
まずデータベース4にはある文書帳票についての画像データと、その文書帳票に記述されている特定の記録文字列の組み合わせが、その同じ文書帳票複数枚分記録されている。例えば図4で示す文書帳票5についての特定の記録文字列情報が同じ文書帳票複数枚分記録されているとする。このような状態で作業者が画像処理装置1を起動し、当該画像処理装置1へ処理開始を指示する。
画像処理装置1の取得部102はデータベース4から文書帳票5の画像データとその画像データに対応する記録文字列の情報を読み取る(ステップS601)。取得部102は画像データと記録文字列とを特徴量抽出部103へ出力する。特徴量抽出部103は画像データをOCR処理して画像データ中の全ての文字列と当該文字列の範囲を示す画像データ内の座標を検出する(ステップS602)。なお文字列は複数の文字によって構成される文字の纏まりである。特徴量抽出部103は他の文字との間隔などによってその1つの纏まりの範囲を解析し、その範囲に含まれる1つまたは複数の文字を文字列として抽出すると共に、その画像データ内の文字列の範囲を示す座標を検出する。文字列として含まれる文字は、表意文字、表音文字などの記号、マーク、アイコン画像などを含んでよい。
特徴量抽出部103はOCR処理により画像データから抽出した文字列と、画像データと共にデータベース4から読み取った記録文字列とを比較する。特徴量抽出部103はOCR処理により画像データから抽出した文字列のうち、記録文字列の文字情報と一致した画像データ中の文字列と、その文字列に含まれる文字の属性と、その範囲の座標とを特定する(ステップS603)。文字の属性は、数字、アルファベット、ひらがな、漢字、文字数、文字高さ、フォントなどにより表される情報である。また文字列の範囲の座標には文字列に含まれる先頭文字の座標、終了文字の座標などを示す情報である。特徴量抽出部103はそれら特定した情報を含む特徴量を複数枚の同じ文書帳票5について生成する(ステップS604)。
特徴量は特徴量抽出部103によって文書帳票5における記録文字列ごとに生成される。読取対象特徴量生成部104はそれら複数枚の同じ文書帳票5における特徴量を取得し、記録文字列に対応する各特徴量に含まれる文字の属性、文字列の範囲を示す座標を解析してそれぞれ1つの特徴量を生成する。この特徴量の解析は機械学習などの処理により行う。読取対象特徴量生成部104が機械学習などの解析により生成した特徴量を第一特徴量と呼ぶ。つまり読取対象特徴量生成部104は同じ文書帳票5の複数枚を用いて、その文書帳票5における記録文字列それぞれの第一特徴量を生成する(ステップS605)。第一特徴量は記録文字列を認識するための特徴量であり、文字の属性、文字列の範囲を示す座標を含む。読取対象特徴量生成部104は文書帳票5における1つ又は複数の記録文字列それぞれの第一特徴量を、文書帳票5の識別子に紐づけてデータベース4に記録する(ステップS606)。
例えば読取対象特徴量生成部104は、文書帳票5に含まれる記録文字列である日付51、発注先52、商品名53、数量54、金額55それぞれの、文字属性、文字列の範囲を示す座標などを示す各第一特徴量を、文書帳票5の識別子に紐づけてデータベース4に記録する。
以上の処理により画像処理装置1は、作業者の記録文字列を記録する労力を軽減するために利用する情報(第一特徴量)を機械学習等により生成してデータベース4に蓄積することができる。これにより画像処理装置1は新たな文書帳票についての画像データに基づいて記録文字列を自動でデータベース4に記録していくことができる。以下、その処理について説明する。
図7は本実施形態による画像処理装置の処理フローを示す第二の図である。
作業者は新たな文書帳票を画像読取装置2に読み取らせる操作を行う。これにより画像読取装置2は文書帳票の画像データを生成して画像処理装置1へ出力する。画像処理装置1の取得部102は画像データを取得する(ステップS701)。取得部102は画像データを特徴量抽出部103へ出力する。特徴量抽出部103は画像データをOCR処理して、文字列と、文字列に含まれる文字の特徴と、その文字列の範囲の画像データ中の座標を検出する(ステップS702)。特徴量抽出部103はそれら検出した情報を含む第三特徴量を、画像データ中の文字列ごとに生成する(ステップS703)。つまり第三特徴量は新たに読み込んだ画像データの文書帳票に含まれる文字列の特徴を示す情報である。その後、特徴量抽出部103はデータベース4から、処理対象画像データの文書帳票についての1つまたは複数の第一特徴量を読み出す(ステップS704)。特徴量抽出部103は記録部105へ第三特徴量と第一特徴量を出力する。
記録部105は画像データ中の1つまたは複数の文字列についての第三特徴量と、1つ又は複数の第一特徴量とを取得する。記録部105は各第一特徴量に含まれる文字列の範囲を示す座標を用いて、各第一特徴量が示す当該座標に対応する座標を有する第三特徴量が全て存在するかを判定する(ステップS705)。各第一特徴量の座標に対応する座標を有する第三特徴量が全て存在する場合には、記録文字列に対応する文書帳票内の全ての記載事項に文字の記載が存在する。一方、各第一特徴量の座標に対応する座標を有する第三特徴量が全て存在しない場合には、文書帳票内の何れかの記載事項に文字の記載が無い状態である。
ステップS705でYesの場合、記録部105は、第一特徴量に含まれる文字属性と、座標に基づいて特定された対応する第三特徴量に含まれる文字属性がそれぞれ一致するかどうかを判定する(ステップS706)。また記録部105は、第一特徴量に含まれる文字属性が、第三特徴量に含まれる文字属性との一致度が所定の閾値以上かを判定する(ステップS706−2)。
記録部105は、ステップS706−2の判定において一致度が閾値以上である場合には、現在処理している画像データから生成した1つまたは複数の第三特徴量が示す座標に基づく記録文字列の範囲に矩形枠を表示した確認画面を生成する。記録部105は帳票画像を用いた業務を行う業務作業者に出力する確認画面を記憶する第一フォルダを作成して、そのフォルダに確認画面を記録する。業務作業者は、例えば文書帳票が通関業務で用いられる帳票である場合には通関士であってよい。記録部105はその確認画面をモニタに出力する(ステップS707)。業務作業者はこの確認画面に表示された矩形領域を確認して、画像処理装置1が記録しようとする記録文字列を確認することができる。これにより業務作業者は記録文字列に不足が無いかを確認することができる。確認画面にはOKまたはNGの何れかのボタンのアイコン画像が表示されている。このボタンのアイコン画像のうちOKのボタンを選択することにより業務作業者は記録文字列としての選択に不足がないことを指示することができる。他方、ボタンのアイコン画像のうちNGのボタンを選択することにより業務作業者は記録文字列としての選択に不足があることを指示することができる。業務作業者は、自信に与えられた他の業務(通関業務など)の作業を、確認画面を用いて行うようにしてよい。
なお確認画面をモニタに出力する理由を、図4を用いて説明する。図4では、記録文字列のうち商品名53が6つ記入されている。過去の文書帳票においても6つの商品名53の記入が最大だった場合、新たな文書帳票に対して、商品名53は1〜6個の範囲内で自動的に記録文字列と判定される。したがって、例えば新たな帳票では商品名53が7つ記載されていた場合、1〜6個目までの部分については、ステップS705、S706いずれもYesとなるため、画像処理装置1は7個目の文字列を記録せずに終了してしまう。このような事象が改善されるように、画像処理装置1は、ステップS707で記録文字列を記録する前に、確認画面を表示して、業務作業者に対して、記録して終了してよいかの確認を行う。
記録部105は業務作業者のボタンのアイコン画像の押下に応じて、記録文字列の選択に不足が無いかを判定する(ステップS708)。記録部105は不足が無い場合には、第三特徴量に含まれる文字列を、文書帳票の識別情報に対応付けて記録テーブルに記録する(ステップS709)。
例えば、文書帳票の画像データ中から第三特徴量a3、第三特徴量b3、第三特徴量c3、第三特徴量d3が取得できたとする。そして第三特徴量a3が予めデータベースに記録されている第一特徴量a1と、第三特徴量b3が第一特徴量b1と、第三特徴量c3が第一特徴量c1と、第三特徴量d3が第一特徴量d1とそれぞれ特徴量が一致したとする。この場合、記録部105は、第三特徴量a3、第三特徴量b3、第三特徴量c3、第三特徴量d3それぞれに含まれる文字列を、文書帳票の記録テーブルに記録する。
上述のステップS705でNoの場合、またはステップS706でNoの場合、またはステップS708でNoの場合、記録部105は、第一特徴量が示す当該座標に対応する座標を有する第三特徴量が存在しなかった場合の処理を行う。具体的には記録部105は、帳票画像の再確認を行う確認作業者に対する作業フォルダを生成する。そして記録部105は、画像データ中の対応する座標の第三特徴量が存在しなかった第一特徴量の座標の範囲に入力欄を設けた帳票画像の入力用画像データを生成して作業フォルダに記録する。その後、制御部101は確認作業者の指示に基づいて作業フォルダに記録された入力用画像データを当該確認作業者が作業する端末等に出力する(ステップS710)。確認作業者は例えばキーパンチャーなどの作業を行う者であってよい。入力用画像データはHTMLやXMLなどのマークアップ言語で記述されたデータであってよい。作業者はこの入力用画像データを見ながら、画像処理装置1のキーボード等の入力装置を操作して、モニタに表示されている入力用画像データ内の入力欄に記録文字列を入力する。当該入力用画像データには保存ボタンが表示されており、保存ボタンの押下操作をすると記録部105は既に文書帳票について取得した第三特徴量の他、新たに入力用画像データの入力欄に入力された文字列を含む第三特徴量を生成する(ステップS711)。記録部105は帳票画像データの識別子と入力欄に入力された文字列とを対応付けてデータベース4に記録する。画像処理装置1は図6で示した処理フローを再度実施することにより第一特徴量が更新され、自動的に記録できる文字列の範囲を拡張することができる。これにより、次に同じ文書帳票を処理したときには、自動的に文字列を記録できるようになり、作業者が文字列を入力する手間を省くことができる。記録部105は、全ての第三特徴量それぞれに含まれる文字列を、文書帳票の記録テーブルに記録する(ステップS712)。
このような処理によれば、画像処理装置1は予め作業者が記録しておいた文書帳票の画像データと記録文字列によって、新たに入力させた文書帳票の画像データにおける記録文字列を自動的に記録することができる。したがって画像処理装置1は文書帳票における記録文字列の記録の作業者の労力を軽減することができる。
また文書帳票に記録文字列が記載されていない場合でも、本来、記載されているべき記録文字列に対応する記載事項が記載されていない場合には画像処理装置1は入力用画像データを出力する。これにより文書帳票において記載すべき記載事項に対して入力していない誤りが見つかると共に、その記載事項が示す記録文字列を容易に記録することができる。
図8は本実施形態による画像処理装置の機能ブロックを示す第二の図である。
この図が示すように画像処理装置1は、図3で示した各機能部に加え、さらにグループ分類部106、グループ特定部107の機能を有する。画像処理装置1のハードウェア構成は図2で示した構成と同様である。
図9は本実施形態による画像処理装置の処理フローを示す第三の図である。
データベース4には異なる複数の文書帳票についての画像データと、各文書帳票に記述されている特定の記録文字列の組み合わせが、その文書帳票ごとに多数記録されている。例えば図4で示す異なる文書帳票5それぞれについての特定の記録文字列情報が複数枚分記録されているとする。このような状態で作業者が画像処理装置1を起動し、当該画像処理装置1へ処理開始を指示する。
画像処理装置1の取得部102はデータベース4から文書帳票5の画像データとその画像データに対応する記録文字列の情報を全て読み込んだかを判定する(ステップS901)。Noの場合、取得部102はデータベース4から文書帳票5の画像データとその画像データに対応する記録文字列の情報を読み取る(ステップS902)。取得部102は画像データと記録文字列とを特徴量抽出部103へ出力する。特徴量抽出部103は画像データをOCR処理して画像データ中の全ての文字列とその画像データ内の座標を検出する(ステップS903)。なお文字列は複数の文字によって構成される文字の纏まりである。特徴量抽出部103は他の文字との間隔などによってその1つの纏まりの範囲を解析し、その範囲に含まれる1つまたは複数の文字を文字列として抽出すると共に、その画像データ内の文字列の範囲を示す座標を検出する。文字列として含まれる文字は、表意文字、表音文字などの記号、マーク、アイコン画像などを含んでよい。
特徴量抽出部103はOCR処理により画像データから抽出した文字列と、画像データと共にデータベース4から読み取った記録文字列とを比較する。特徴量抽出部103はOCR処理により画像データから抽出した文字列のうち、記録文字列の文字情報と一致した画像データ中の文字列と、その文字列に含まれる文字の属性と、その範囲の座標とを特定する(ステップS904)。文字の属性は、数字、アルファベット、ひらがな、漢字、文字数、文字高さ、フォントなどにより表される情報である。また文字列の範囲の座標には文字列に含まれる先頭文字の座標、終了文字の座標などを示す情報である。特徴量抽出部103はそれら特定した情報を含む特徴量を1つの文書帳票5について生成する(ステップS905)。
特徴量は特徴量抽出部103によって文書帳票5における記録文字列ごとに生成される。読取対象特徴量生成部104はそれら複数枚の文書帳票5における特徴量を取得し、対応する記録文字列毎に当該特徴量に含まれる文字の属性、文字列の範囲を示す座標を解析してそれぞれ1つの特徴量を生成する。票5この特徴量の解析は機械学習などの処理により行う。上述したように読取対象特徴量生成部104が機械学習などの解析により生成した特徴量を第一特徴量と呼ぶ。つまり読取対象特徴量生成部104は同じ文書帳票5の複数枚を用いて、その文書帳における記録文字列それぞれの第一特徴量を生成する(ステップS906)。第一特徴量は記録文字列を認識するための特徴量であり、文字の属性、文字列の範囲を示す座標を含む。読取対象特徴量生成部104は文書帳票5における1つ又は複数の記録文字列それぞれの第一特徴量を、文書帳票5の識別子に紐づけてデータベース4に記録する(ステップS907)。
例えば読取対象特徴量生成部104は、文書帳票5に含まれる記録文字列である日付51、発注先52、商品名53、数量54、金額55それぞれの、文字属性、文字列の範囲を示す座標などを示す各第一特徴量を、文書帳票5の識別子に紐づけてデータベース4に記録する。
特徴量抽出部103はまた、記録文字列に含まれる文字情報と一致しない画像データ中の非記録文字列と、その非記録文字列に含まれる文字の属性と、その範囲の座標とを特定する(ステップS908)。特徴量抽出部103はそれら特定した情報を含む特徴量を文書帳票5について生成する(ステップS909)。
特徴量は特徴量抽出部103によって文書帳票5における非記録文字列ごとに生成される。読取対象特徴量生成部104はそれら複数枚の同じ文書帳票5における特徴量を取得し、非記録文字列に対応する各特徴量に含まれる文字の属性、文字列の範囲を示す座標を解析してそれぞれ1つの特徴量を生成する。これを第二特徴量と呼ぶ。つまり読取対象特徴量生成部104は同じ文書帳票5の複数枚を用いて、その文書帳票5における非記録文字列それぞれの第二特徴を生成する(ステップS910)。第二特徴量は非記録文字列を認識するための特徴量であり、文字の属性、文字列の範囲を示す座標を含む。読取対象特徴量生成部104は文書帳票5における1つ又は複数の非記録文字列それぞれの第二特徴量を、文書帳票5の識別子に紐づけてデータベース4に記録する(ステップS911)。
例えば読取対象特徴量生成部104は、文書帳票5に含まれる非記録文字列である発注者の名称501、発注者のエンブレム画像、文書帳票のタイトル503、挨拶文504などを示す各第二特徴量を、文書帳票5の識別子に紐づけてデータベース4に記録する。
データベース4には異なる複数の文書帳票5の画像データとその画像データに対応する記録文字列の情報が記録されている。画像処理装置1の取得部102は全ての文書帳票5についての画像データと記録文字列の情報を読み込むまでステップS901〜ステップS911の処理を繰り返す。そしてステップS901において全て読み込んだと判定したとする(ステップS901Yes)。
その場合、グループ分類部106が文書帳票5の画像データに含まれる第二特徴量に基づいて、文書帳票5をグループ分けする(ステップS912)。グループは、例えば文書帳票のフォーマット毎の纏まりを意味する。例えばグループ分類部106は、各文書帳票5を、第二特徴量に含まれる非記録文字列の一致度や、エンブレム画像の一致度、非記録文字列の座標範囲の一致度などに基づいてグループ分けする。グループ分類部106はこのグループ分けの処理において文書帳票5のグループ識別子を決定する。グループ分類部106は全ての文書帳票5についてグループ分けが終了したかを判定する(ステップS913)。
グループ分類部106は全ての文書帳票5のグループ分けが完了していない場合にはステップS912の処理を繰り返す。グループ分類部106は、全ての文書帳票5のグループ分けが完了した場合には、文書帳票5の識別子とその文書帳票5に付与されたグループ識別子とを対応付けてデータベース4のグループテーブルに記録する(ステップS914)。
そして読取対象特徴量生成部104はあるグループに属する1つまたは複数の文書帳票5の各第一特徴量および各第二特徴量をデータベース4から読み取り、グループに属する文書帳票5の各第一特徴量および各第二特徴量に対応する各グループ第一特徴量、各グループ第二特徴量を生成する(ステップS915)。各グループ第一特徴量はグループに属する文書帳票5の各第一特徴量の平均等の値であってもよい。同様に各グループ第二特徴量はグループに属する文書帳票5の各第二特徴量の平均等の値であってもよい。各グループ第一特徴量、各グループ第二特徴量は、各第一特徴量の平均、各第二特徴量の平均でなくとも、所定の統計処理や機械学習等の手法を用いて、グループに属する1つ又は複数の文書帳票5の記録文字列や非記録文字列を特定できるよう算出された特徴量であれば、どのようなもの手法を用いて、各グループ第一特徴量、各グループ第二特徴量を生成してもよい。読取対象特徴量生成部104は、グループそれぞれについて各グループ第一特徴量、各グループ第二特徴量を算出し、グループの識別子に対応付けてデータベース4に記録する(ステップS916)。
以上の処理により画像処理装置1は、作業者の記録文字列を記録する労力を軽減するために必要な情報を文書帳票のグループ毎に生成してデータベース4に蓄積することができる。これにより画像処理装置1は新たな文書帳票についての画像データに基づいて記録文字列を自動でデータベース4に記録していくことができる。以下、その処理について説明する。
図10は本実施形態による画像処理装置の処理フローを示す第四の図である。
作業者は新たな文書帳票を画像読取装置2に読み取らせる操作を行う。これにより画像読取装置2は文書帳票の画像データを生成して画像処理装置1へ出力する。画像処理装置1の取得部102は画像データを取得する(ステップS1001)。取得部102は画像データを特徴量抽出部103へ出力する。特徴量抽出部103は画像データをOCR処理して、文字列と、文字列に含まれる文字の特徴と、その文字列の範囲の画像データ中の座標を検出する(ステップS1002)。特徴量抽出部103はそれら検出した情報を含む第三特徴量を、画像データ中の文字列ごとに生成する(ステップS1003)。第三特徴量は新たに読み込んだ画像データの文書帳票に含まれる文字列の特徴を示す情報である。
次にグループ特定部107が、データベース4からあるグループ第二特徴量のうち新たな文書帳票のグループ特定に利用するグループ第二特徴量を読み取る。当該グループ第二特徴量は例えば文書帳票の画像データに表示される発注者のエンブレム画像502に対応する特徴量であってよい。グループ特定部107はあるグループ第二特徴量に示す情報が、ステップS1001で取得した文書帳票の画像データから特定できるかどうかを判定する。グループ特定部107は全てのグループについてのグループ第二特徴量を用いて同様の処理を行う。グループ特定部107はデータベース4から読み取ったグループ第二特徴量に一致する情報が新たに読み込んだ文書帳票の画像データから特定できた場合、そのグループ第二特徴量を有するグループを、新たに読み込んだ文書帳票の画像データのグループと特定する(ステップS1004)。その後、グループ特定部107はデータベース4からそのグループについての1つまたは複数のグループ第一特徴量を読み出す(ステップS1005)。グループ特定部107は記録部105へ第三特徴量と1つまたは複数のグループ第一特徴量を出力する。グループ第一特徴量はそのグループに属する文書帳票内の1つまたは複数の記録文字列を特定するための特徴量である。
記録部105は画像データ中の1つまたは複数の文字列についての第三特徴量と、1つまたは複数のグループ第一特徴量とを取得する。記録部105は各グループ第一特徴量に含まれる文字列の範囲を示す座標を用いて、各グループ第一特徴量が示す当該座標に対応する座標を有する第三特徴量が全て存在するかを判定する(ステップS1006)。各グループ第一特徴量の座標に対応する座標を有する第三特徴量が全て存在する場合には、記録文字列に対応する文書帳票内の全ての記載事項に文字の記載が存在する。一方、各グループ第一特徴量の座標に対応する座標を有する第三特徴量が全て存在しない場合には、文書帳票内の何れかの記載事項に文字の記載が無い状態である。
ステップS1006でYesの場合、記録部105は、グループ第一特徴量に含まれる文字属性と、座標に基づいて特定された対応する第三特徴量に含まれる文字属性がそれぞれ一致するかどうかを判定する(ステップS1007)。
記録部105は、ステップS1007の判定結果がYesとなり文字属性が一致する場合、現在処理している画像データにおいて1つまたは複数の第三特徴量が示す座標に基づく記録文字列の範囲に矩形枠を表示した確認画面を生成する。記録部105はその確認画面をモニタに出力する(ステップS1008)。作業者はこの確認画面に表示された矩形領域を確認して、画像処理装置1が記録しようとする記録文字列を確認することができる。これにより作業者は記録文字列に不足が無いかを確認することができる。確認画面にはOKまたはNGの何れかのボタンのアイコン画像が表示されている。このボタンのアイコン画像のうちOKのボタンを選択することにより作業者は記録文字列としての選択に不足がないことを指示することができる。他方、ボタンのアイコン画像のうちNGのボタンを選択することにより作業者は記録文字列としての選択に不足があることを指示することができる。
記録部105は作業者のボタンのアイコン画像の押下に応じて、記録文字列の選択に不足が無いかを判定する(ステップS1009)。記録部105は不足が無い場合には、第三特徴量に含まれる文字列を、文書帳票の識別情報に対応付けて記録テーブルに記録する(ステップS1010)。
例えば、文書帳票の画像データ中から第三特徴量a3、第三特徴量b3、第三特徴量c3、第三特徴量d3が取得できたとする。そして第三特徴量a3が予めデータベースに記録されているグループ第一特徴量g11と、第三特徴量b3がグループ第一特徴量g12と、第三特徴量c3がグループ第一特徴量g13と、第三特徴量d3がグループ第一特徴量g14とそれぞれ特徴量が一致したとする。この場合、記録部105は、第三特徴量a3、第三特徴量b3、第三特徴量c3、第三特徴量d3それぞれに含まれる文字列を、文書帳票の記録テーブルに記録する。
上述のステップS1006でNoの場合、またはステップS1007でNoの場合、またはステップS1009でNoの場合、記録部105は、グループ第一特徴量が示す当該座標に対応する座標を有する第三特徴量が存在しなかった場合の処理を行う。具体的には記録部105は、画像データ中の対応する座標の第三特徴量が存在しなかったグループ第一特徴量の座標の範囲に入力欄を設けた帳票画像の入力用画像データを生成してモニタに出力する(ステップS1011)。入力用画像データはHTMLやXMLなどのマークアップ言語で記述されたデータであってよい。作業者はこの入力用画像データを見ながら、画像処理装置1のキーボード等の入力装置を操作して、モニタに表示されている入力用画像データ内の入力欄に記録文字列を入力する。当該入力用画像データには保存ボタンが表示されており、保存ボタンの押下操作をすると記録部105は既に文書帳票について取得した第三特徴量の他、新たに入力用画像データの入力欄に入力された文字列を含む第三特徴量を生成する(ステップS1012)。記録部105は帳票画像データの識別子と入力欄に入力された文字列とを対応付けてデータベース4に記録する。画像処理装置1は図6で示した処理フローを再度実施することにより第一特徴量が更新され、自動的に記録できる文字列の範囲を拡張することができる。これにより、次に同じ文書帳票を処理したときには、自動的に文字列を記録できるようになり、作業者が文字列を入力する手間を省くことができる。記録部105は、全ての第三特徴量それぞれに含まれる文字列を、文書帳票の記録テーブルに記録する(ステップS1013)。
このような処理によれば、画像処理装置1は予め作業者が記録しておいた複数の異なる文書帳票の画像データと記録文字列によって、新たに入力させた文書帳票の種別によらずにその文書帳票の画像データにおける記録文字列を自動的に記録することができる。したがって画像処理装置1は文書帳票における記録文字列の記録の作業者の労力を軽減することができる。
また文書帳票に記録文字列が記載されていない場合でも、本来、記載されているべき記録文字列に対応する記載事項が記載されていない場合には画像処理装置1は入力用画像データを出力する。これにより文書帳票において記載すべき記載事項に対して入力していない誤りが見つかると共に、その記載事項が示す記録文字列を容易に記録することができる。
新たに読み込んだ画像データの文書帳票に対応するグループが存在しない場合のグループ分類の為の確認作業等は、作業者に労力がかかるため、作業に適切タイミングで作業者に提示して作業を指示することが望ましい。一例としては、画像処理装置1は、新たに読み込んだ画像データの文書帳票に対する作業のうち、その文書帳票のグループが特定できていない場合の作業を、一日の作業の最初に指示する。以下このような指示を行う場合の処理について説明する。
図11は本実施形態による画像処理装置の機能ブロックを示す第三の図である。
画像処理装置1は、図8で示した各機能部に加え、さらに作業対象判定部108、作業データ生成部109の機能を有する。画像処理装置1のハードウェア構成は図2で示した構成と同様である。
画像処理装置1は、帳票画像の光学読取結果として生成された帳票画像データを取得し、帳票画像データのグループ種別が特定可能かを判定する。画像処理装置1は、帳票画像データのグループ種別を判定不能と判定した場合にグループ種別の確認作業の必要な帳票画像データと判定する。例えば画像処理装置1は、帳票画像データの機械学習結果に基づいて帳票画像データのグループ種別が特定可能かを判定する。画像処理装置1は、確認作業の必要な帳票画像データの作業者への出力が確認作業の不要な帳票画像データの作業者への出力の前に行う作業データを生成する。そして画像処理装置1は、作業者からの確認作業における操作に基づいて確認作業の必要な帳票画像データが属するグループ種別の分類を行う。画像処理装置1は当該分類を機械学習等の処理によって行ってよい。
図12は本実施形態による画像処理装置の処理フローを示す第五の図である。
上述と同様に、データベース4には異なる複数の文書帳票についての画像データと、各文書帳票に記述されている特定の記録文字列の組み合わせが、その文書帳票ごとに多数記録されている。例えば図4で示す異なる文書帳票5それぞれについての特定の記録文字列情報が複数枚分記録されているとする。このような状態で作業者は、次の作業日に作業をするための多くの文書帳票の読み込みを画像読取装置2に指示し、また画像処理装置1に画像読取装置2の読み込んだ文書帳票の画像データの処理を行うよう指示する。
これにより画像読取装置2は文書帳票の画像データを生成して画像処理装置1へ出力する。画像読取装置2は例えば1万枚などの多くの文書帳票を夜間バッチ処理により読み込み、その結果生成した画像データを記録装置3に記録するよう指示する。記録装置3は夜間バッチ処理により読み込まれて生成された各画像データをデータベース4に記録する。そして画像処理装置1の取得部102は夜間バッチ処理によりデータベース4に記録された画像データを1つ取得する(ステップS1201)。取得部102はその画像データを特徴量抽出部103へ出力する。特徴量抽出部103は画像データをOCR処理して、文字列と、文字列に含まれる文字の特徴と、その文字列の範囲の画像データ中の座標を検出する(ステップS1202)。特徴量抽出部103はそれら検出した情報を含む第三特徴量を、画像データ中の文字列ごとに生成する(ステップS1203)。第三特徴量は新たに読み込んだ画像データの文書帳票に含まれる文字列の特徴を示す情報である。
次にグループ特定部107が、データベース4からあるグループ第二特徴量のうち新たな文書帳票のグループ特定に利用するグループ第二特徴量を読み取る。当該グループ第二特徴量は例えば文書帳票の画像データに表示される発注者のエンブレム画像502に対応する特徴量であってよい。グループ特定部107はあるグループ第二特徴量に示す情報が、ステップS1201で取得した文書帳票の画像データから特定できるかどうかを判定する。グループ特定部107は全てのグループについてのグループ第二特徴量を用いて同様の処理を行う。そしてグループ特定部107はデータベース4から読み取ったグループ第二特徴量に一致する情報が、新たに読み込んだ文書帳票の画像データから特定できたかを判定する。グループ特定部107は新たに読み込んだ文書帳票の画像データのグループを判定する(ステップS1204)。
グループ特定部107はデータベース4から読み取ったグループ第二特徴量に一致する情報が新たに読み込んだ文書帳票の画像データから特定でき、これによりグループが判定できた場合、そのグループ第二特徴量を有するグループを、新たに読み込んだ文書帳票の画像データのグループと特定する(ステップS1205)。グループ特定部107は新たに読み込んだ文書帳票の画像データのグループが判定できたことを示すグループ判定結果を生成する。このグループ特定部107の処理は文書帳票の画像データの機械学習結果に基づいて画像データのグループ種別が特定可能かを判定する処理の一態様である。その後、グループ特定部107はデータベース4からそのグループについての1つまたは複数のグループ第一特徴量を読み出す(ステップS1206)。グループ特定部107は記録部105へ第三特徴量と1つまたは複数のグループ第一特徴量を出力する。グループ第一特徴量はそのグループに属する文書帳票内の1つまたは複数の記録文字列を特定するための特徴量である。
記録部105は画像データ中の1つまたは複数の文字列についての第三特徴量と、1つまたは複数のグループ第一特徴量とを取得する。記録部105は各グループ第一特徴量に含まれる文字列の範囲を示す座標を用いて、各グループ第一特徴量が示す当該座標に対応する座標を有する第三特徴量が全て存在するかを判定する(ステップS1207)。各グループ第一特徴量の座標に対応する座標を有する第三特徴量が全て存在する場合には、記録文字列に対応する文書帳票内の全ての記載事項に文字の記載が存在する。一方、各グループ第一特徴量の座標に対応する座標を有する第三特徴量が全て存在しない場合には、文書帳票内の何れかの記載事項に文字の記載が無い状態である。
ステップS1207でYesの場合、記録部105は、グループ第一特徴量に含まれる文字属性と、座標に基づいて特定された対応する第三特徴量に含まれる文字属性がそれぞれ一致するかどうかを判定する(ステップS1208)。
記録部105は、ステップS1208の判定結果がYesとなり文字属性が一致する場合、現在処理している画像データにおいて1つまたは複数の第三特徴量が示す座標に基づく記録文字列の範囲に矩形枠を表示した確認画面を生成する(ステップS1209)。記録部105はその確認画面と、グループ判定結果と、文書帳票の画像データと、文書帳票IDとを対応付けた作業情報を、データベース4に記録する(ステップS1210)。
上述のステップS1204でNoの場合、グループ特定部107は新たに読み込んだ文書帳票の画像データのグループが判定できなかったことを示すグループ判定結果を生成する。そして記録部105は、グループが判定できなかった文書帳票を学習させるために作業者が利用する学習指示画面を生成する(ステップS1211)。記録部105は学習指示画面と、グループ判定結果と、文書帳票の画像データと、文書帳票IDとを対応付けた作業情報を、データベース4に記録する(ステップS1212)。
また上述のステップS1207でNoの場合、またはステップS1208でNoの場合、記録部105は、グループ第一特徴量が示す当該座標に対応する座標を有する第三特徴量が存在しなかった場合の処理を行う。具体的には記録部105は、画像データ中の対応する座標の第三特徴量が存在しなかったグループ第一特徴量の座標の範囲に入力欄を設けた帳票画像の入力用画面を生成する(ステップS1213)。そして記録部105は、入力用画面と、グループ判定結果と、文書帳票の画像データと、文書帳票IDとを対応付けた作業情報を、データベース4に記録する(ステップS1214)。
取得部102は夜間バッチ処理として記録された全ての文書帳票の画像データを読み込んだかに基づいて終了するかを判定する(ステップS1215)。取得部102は全ての文書帳票の画像データを読み込んだ場合には処理を終了する。取得部102は全ての文書帳票の画像データを読み込んでいない場合にはステップS1201からの処理を繰り返す。
図13は本実施形態による画像処理装置の処理フローを示す第六の図である。
作業者は夜間バッチ処理によって夜間にデータベース4に蓄積された作業情報を用いて作業を行う。まず画像処理装置1は作業者から作業開始を入力する(ステップS1301)。画像処理装置1の作業対象判定部108は、夜間バッチ処理によってデータベース4に記録されている作業情報の中から、グループが判定できなかったことを示すグループ判定結果に紐づく作業情報を特定する(ステップS1302)。この作業対象判定部108の処理は、グループ種別の確認作業の必要な作業情報を判定する処理の一態様である。作業対象判定部108はグループが判定できなかったことを示すグループ判定結果に紐づく作業情報に、優先度の高い作業番号を順に割り当てる(ステップS1303)。次に作業対象判定部108は、グループが判定できたことを示すグループ判定結果に紐づく作業情報を特定する(ステップS1304)。作業対象判定部108はグループが判定できたことを示すグループ判定結果に紐づく作業情報に、グループが判定できなかったことを示すグループ判定結果に紐づく作業情報よりも低い優先度の作業番号を順に割り当てる(ステップS1305)。作業対象判定部108はグループが判定できたことを示すグループ判定結果に紐づく作業情報のうち、ステップS1207やステップS1208においてNoと判定された後に生成された作業情報を特定し、それらの作業情報の作業番号を、グループが判定できた他の作業情報の作業番号よりも優先度高く割り当ててもよい。以上の処理により、グループが判定できなかったことにより文書帳票の学習が必要な作業情報に優先度の高い作業番号が割り当てられる。またグループが判定できた作業情報のうち、作業者の入力作業が必須となる作業情報に優先度の高い作業番号が割り当てられる。なお作業対象判定部108は、グループが判定できなかったことを示すグループ判定結果に紐づく作業情報が、所定の時間帯に作業者の端末に出力されるようにすればよい。例えば、作業対象判定部108は、優先度の高い作業情報に出力時間が設定され、この出力時間に基づく出力順序を作業情報に割り当てるようにしてもよい。
作業データ生成部109は夜間バッチ処理によってデータベース4に記録された作業情報を作業番号順に作業者が利用する端末に出力する作業データを生成する(ステップS1306)。作業データ生成部109は作業データに基づいて、作業者の操作に応じて作業番号順に、作業情報を出力する(ステップS1307)。これにより作業者が利用する端末には作業情報として、まずグループが判定できなかった文書帳票についての学習指示画面が出力される。学習指示画面には、学習開始ボタンが表示される。作業者がこの学習開始ボタンを押下すると、上述のステップS901〜ステップS916の処理により文書帳票の機械学習に基づくグループ分けの処理が行われる。
また作業データ生成部109は作業番号に基づいてステップS1213で生成した入力用画像を作業者の端末に出力する。入力用画像データはHTMLやXMLなどのマークアップ言語で記述されたデータであってよい。作業者はこの入力用画像データを見ながら、画像処理装置1のキーボード等の入力装置を操作して、モニタに表示されている入力用画像データ内の入力欄に記録文字列を入力する。当該入力用画像データには保存ボタンが表示されており、保存ボタンの押下操作をすると記録部105は既に文書帳票について取得した第三特徴量の他、新たに入力用画像データの入力欄に入力された文字列を含む第三特徴量を生成する。記録部105は帳票画像データの識別子と入力欄に入力された文字列とを対応付けてデータベース4に記録する。画像処理装置1は図6で示した処理フローを再度実施することにより第一特徴量が更新され、自動的に記録できる文字列の範囲を拡張することができる。これにより、次に同じ文書帳票を処理したときには、自動的に文字列を記録できるようになり、作業者が文字列を入力する手間を省くことができる。記録部105は、全ての第三特徴量それぞれに含まれる文字列を、文書帳票の記録テーブルに記録する。
また作業データ生成部109は作業番号に基づいてステップS1209で生成した確認画面を作業者の端末に出力する。作業者はこの確認画面に表示された矩形領域を確認して、画像処理装置1が記録しようとする記録文字列を確認することができる。これにより作業者は記録文字列に不足が無いかを確認することができる。確認画面にはOKまたはNGの何れかのボタンのアイコン画像が表示されている。このボタンのアイコン画像のうちOKのボタンを選択することにより作業者は記録文字列としての選択に不足がないことを指示することができる。他方、ボタンのアイコン画像のうちNGのボタンを選択することにより作業者は記録文字列としての選択に不足があることを指示することができる。
記録部105は作業者のボタンのアイコン画像の押下に応じて、記録文字列の選択に不足が無いかを判定する。記録部105は不足が無い場合には、第三特徴量に含まれる文字列を、文書帳票の識別情報に対応付けて記録テーブルに記録する。
例えば、文書帳票の画像データ中から第三特徴量a3、第三特徴量b3、第三特徴量c3、第三特徴量d3が取得できたとする。そして第三特徴量a3が予めデータベースに記録されているグループ第一特徴量g11と、第三特徴量b3がグループ第一特徴量g12と、第三特徴量c3がグループ第一特徴量g13と、第三特徴量d3がグループ第一特徴量g14とそれぞれ特徴量が一致したとする。この場合、記録部105は、第三特徴量a3、第三特徴量b3、第三特徴量c3、第三特徴量d3それぞれに含まれる文字列を、文書帳票の記録テーブルに記録する。
上述の処理において作業データ生成部109はグループが判定できなかったことを示すグループ判定結果に紐づく作業情報のうち、機械学習のために必要な数の文書帳票の画像データに対応する作業情報のみに優先度の高い作業番号を割り当ててもよい。例えば、グループが判定できなかったことを示すグループ判定結果に紐づく作業情報が1000個であった場合、そのうちの機械学習に必要な20個の作業情報のみに優先度の高い作業番号を割り当てて、残りの980個の作業情報については作業者による確認なしに自動的に上述のステップS901〜ステップS916の処理により文書帳票の機械学習に基づくグループ分けの処理が行われてよい。
具体的には作業データ生成部109は、グループが判定できなかったことを示す優先度の高い作業番号に紐づく作業情報の数を検出する。作業データ生成部109は検出した数が機械学習に必要な数よりも多い場合には、グループ分類の機械学習に必要な数を決定する。この数は予め作業データ生成部109が既知の数であってもよいし、作業情報としての作業対象である文書帳票の識別子や学習項目などによって定まる値であってもよい。作業データ生成部109はグループ分類の機械学習に必要な数の作業情報の学習指示画面を、作業者の操作に基づいて作業番号順に作業者の端末に出力する。作業データ生成部109は、作業者の端末に出力する学習指示画面の出力数をこのような処理により削減することにより、作業者の確認作業を軽減することができる。
また作業データ生成部109は作業対象である文書帳票の識別子や学習項目の違い毎に作業情報を分類し、その分類単位毎に、グループ分類の機械学習に必要な数を決定してもよい。この場合、作業データ生成部109は、分類単位毎に、グループ分類の機械学習に必要な数の作業情報を作業番号の順番に作業者の端末に出力する。例えば、作業情報1000個に、帳票画像の項目B1についての機械学習が不十分な作業情報500個と、帳票画像の項目B2についての機械学習が不十分な作業情報500個とが含まれているとする。作業データ生成部109は帳票画像の項目B1についての機械学習が不十分な作業情報のうちグループ分類の機械学習に必要な数の20個と、帳票画像の項目B2についての機械学習が不十分な作業情報のうちグループ分類の機械学習に必要な数の20個の作業番号の優先度が最も高い作業情報として順に出力する。
なお、画像処理装置1の処理の他の例としては、作業者が予め文書帳票のグループを画像処理装置1に登録しておいてもよい。例えば作業者は、過去において文書帳票の画像データを登録する際、文書帳票の種類に合わせてグループ識別子を入力しておき文書帳票の画像データと紐づけてデータベース4に登録しておく。これにより、同一グループ内に画像処理装置1の処理誤り等により異種の帳票が混じることがなくなり、精度のよい第一特徴量を抽出することができる。なおこの場合、登録時は作業者が文書帳票のグループを入力するが、新たな帳票に対しては、ステップS1004と同じく、第二特徴量を用いてグループ特定する。
また、画像処理装置1の処理の他の例としては、画像処理装置1は第二特徴量を用いて文書帳票をグループ分けするだけでなく、第一特徴量を用いて、また第二特徴量と共に第一特徴量を用いて、文書帳票をグループ分けするようにしてもよい。第一特徴量は記録文字列であるが、同じ種類の文書帳票であれば、記録文字列の座標やその文字属性は同じであると考えられ、第一特徴量を用いて帳票をグループ分けすることが可能となる。最初のグループ分けを作業者が行い、新たな文書帳票に対してはステップS1004の処理により第一特徴量を用いてグループ分けすることにより、OCR処理において精度よく記録文字列を読み取ることが可能となる。
この場合、取得部102が、複数の帳票画像データとその帳票画像データに含まれる文字列のうち記録対象となった記録文字列とを取得する。そしてグループ分類部106が第一特徴量に基づいて帳票画像データをグループ分けする。そして、読取対象特徴量生成部104は、グループに含まれる帳票画像データに対応する第一特徴量を用いて当該グループごとの記録文字列の読取対象特徴量を生成する。
上述のステップS1004において第二特徴量に基づいて新たな帳票のグループを特定している。しかしながら、別の処理態様として、画像処理装置1はグループを特定する処理を行わずに、作業者により設定された全グループに対して、1グループごとに順に特定して第一特徴量を読み出し、第三特徴量と一致する個数をカウントする。正しいグループの場合には最も多く第一特徴量と第三特徴量とが一致するはずなので、画像処理装置1は一致個数が最も多いときの特定グループの第三特徴量それぞれに含まれる文字列をステップS1008において記録する。これにより、グループを特定しなくても記録文字列を記録することができる。
この場合、取得部102が、複数の帳票画像データとその帳票画像データに含まれる文字列のうち記録対象となった記録文字列とを取得する。そして、特徴量抽出部は、取得部102の取得した帳票画像データを認識処理した結果に基づいて、記録文字列の特徴を示す第一特徴量または記録文字列以外の認識情報を示す第二特徴量を抽出する。読取対象特徴量生成部104は、予め設定された所定のグループに含まれる帳票画像データに対応する第一特徴量または第二特徴量の少なくとも一方を用いて当該グループごとの記録文字列の読取対象特徴量を生成する。
図11は画像処理装置の最小構成を示す図である。
この図が示すように画像処理装置1は、少なくとも取得部102と、グループ特定部107と、作業対象判定部108と、を備えればよい。
取得部は、帳票画像の光学読取結果として生成された帳票画像データを取得する。
グループ特定部107は、帳票画像データのグループ種別が特定可能かを判定する。
作業対象判定部108は、帳票画像データのグループ種別を判定不能と判定した場合にグループ種別の確認作業の必要な帳票画像データと判定する。
上述の各装置は内部に、コンピュータシステムを有している。そして、各装置に上述した各処理を行わせるためのプログラムは、それら装置のコンピュータ読み取り可能な記録媒体に記憶されており、このプログラムを各装置のコンピュータが読み出して実行することによって、上記処理が行われる。ここでコンピュータ読み取り可能な記録媒体とは、磁気ディスク、光磁気ディスク、CD−ROM、DVD−ROM、半導体メモリ等をいう。また、このコンピュータプログラムを通信回線によってコンピュータに配信し、この配信を受けたコンピュータが当該プログラムを実行するようにしても良い。
また、上記プログラムは、前述した各処理部の機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
1・・・画像処理装置
2・・・画像読取装置
3・・・記録装置
4・・・データベース
5・・・文書帳票
101・・・制御部
102・・・取得部
103・・・特徴量抽出部
104・・・読取対象特徴量生成部
105・・・記録部
106・・・グループ分類部
107・・・グループ特定部
108・・・作業対象判定部
109・・・作業データ生成部

Claims (8)

  1. 帳票画像の光学読取結果として生成された帳票画像データを取得する取得部と、
    前記帳票画像データのグループ種別が特定可能かを判定するグループ特定部と、
    前記帳票画像データのグループ種別を判定不能と判定した場合にグループ種別の確認作業の必要な帳票画像データと判定する作業対象判定部と、
    を備える画像処理装置。
  2. 前記グループ特定部は前記帳票画像データの機械学習結果に基づいて前記帳票画像データのグループ種別が特定可能かを判定する
    請求項1に記載の画像処理装置。
  3. 前記確認作業の必要な帳票画像データの作業者への出力が前記確認作業の不要な帳票画像データの前記作業者への出力の前に行う作業データを生成する作業データ生成部と、
    を備える請求項1または請求項2に記載の画像処理装置。
  4. 前記作業データ生成部は、前記確認作業の必要な帳票画像データの出力順序と、前記確認作業の不要な帳票画像データの出力順序とが、前記確認作業の必要な帳票画像データの作業者への出力が前記確認作業の不要な帳票画像データの前記作業者への出力の前に行われる順序となる前記作業データを生成する
    請求項3に記載の画像処理装置。
  5. 前記作業者からの前記確認作業における操作に基づいて前記確認作業の必要な帳票画像データが属する前記グループ種別の分類を行うグループ分類部と、
    を備える請求項3または請求項4に記載の画像処理装置。
  6. 前記作業データ生成部は、前記確認作業の必要な帳票画像データのうち機械学習に必要な数の帳票画像データの作業者への出力を、他の帳票画像データの前記作業者への出力の前に行う作業データを生成する
    請求項3から請求項5の何れか一項に記載の画像処理装置。
  7. 帳票画像の光学読取結果として生成された帳票画像データを取得し、
    前記帳票画像データのグループ種別が特定可能かを判定し、
    前記帳票画像データのグループ種別を判定不能と判定した場合にグループ種別の確認作業の必要な帳票画像データと判定する
    画像処理方法。
  8. 画像処理装置のコンピュータを、
    帳票画像の光学読取結果として生成された帳票画像データを取得する取得手段、
    前記帳票画像データのグループ種別が特定可能かを判定するグループ特定手段、
    前記帳票画像データのグループ種別を判定不能と判定した場合にグループ種別の確認作業の必要な帳票画像データと判定する作業対象判定手段、
    として機能させるプログラム。
JP2018071146A 2018-04-02 2018-04-02 画像処理装置、画像処理方法、プログラム Active JP7160432B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2018071146A JP7160432B2 (ja) 2018-04-02 2018-04-02 画像処理装置、画像処理方法、プログラム
PCT/JP2019/012937 WO2019194029A1 (ja) 2018-04-02 2019-03-26 画像処理装置、画像処理方法、及びプログラムを記憶する記憶媒体
EP19780888.4A EP3779856B1 (en) 2018-04-02 2019-03-26 Image processing device, image processing method, and storage medium for storing program
SG11202009541RA SG11202009541RA (en) 2018-04-02 2019-03-26 Image-processing device, image processing method, and storage medium on which program is stored
US17/043,360 US11989693B2 (en) 2018-04-02 2019-03-26 Image-processing device, image processing method, and storage medium on which program is stored

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018071146A JP7160432B2 (ja) 2018-04-02 2018-04-02 画像処理装置、画像処理方法、プログラム

Publications (2)

Publication Number Publication Date
JP2019185142A true JP2019185142A (ja) 2019-10-24
JP7160432B2 JP7160432B2 (ja) 2022-10-25

Family

ID=68100639

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018071146A Active JP7160432B2 (ja) 2018-04-02 2018-04-02 画像処理装置、画像処理方法、プログラム

Country Status (5)

Country Link
US (1) US11989693B2 (ja)
EP (1) EP3779856B1 (ja)
JP (1) JP7160432B2 (ja)
SG (1) SG11202009541RA (ja)
WO (1) WO2019194029A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6784273B2 (ja) * 2018-04-02 2020-11-11 日本電気株式会社 画像処理装置、画像処理方法およびプログラム

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008027133A (ja) * 2006-07-20 2008-02-07 Canon Inc 帳票処理装置及び帳票処理方法ならびに帳票処理方法を実行するプログラムと記憶媒体
JP2011150626A (ja) * 2010-01-25 2011-08-04 Ihi Corp 画像分類方法、装置、及びプログラム
JP2012198684A (ja) * 2011-03-18 2012-10-18 Pfu Ltd 情報処理装置、帳票種別推定方法および帳票種別推定用プログラム
JP2015011588A (ja) * 2013-06-28 2015-01-19 キヤノン株式会社 画像処理装置、画像処理方法
JP2016027442A (ja) * 2014-06-30 2016-02-18 キヤノンマーケティングジャパン株式会社 情報処理システムと、その処理方法及びプログラム
JP2016048444A (ja) * 2014-08-27 2016-04-07 沖電気工業株式会社 帳票識別プログラム、帳票識別装置、帳票識別システム、および帳票識別方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5923792A (en) * 1996-02-07 1999-07-13 Industrial Technology Research Institute Screen display methods for computer-aided data entry
JP3864246B2 (ja) 2001-05-30 2006-12-27 インターナショナル・ビジネス・マシーンズ・コーポレーション 画像処理方法、画像処理システムおよびプログラム
US8331739B1 (en) * 2009-01-21 2012-12-11 Google Inc. Efficient identification and correction of optical character recognition errors through learning in a multi-engine environment
US9576272B2 (en) * 2009-02-10 2017-02-21 Kofax, Inc. Systems, methods and computer program products for determining document validity
EP2541441A4 (en) * 2010-02-26 2014-10-15 Rakuten Inc INFORMATION PROCESSING DEVICE, INFORMATION PROCESSING METHOD, AND RECORDING MEDIUM CONTAINING INFORMATION PROCESSING PROGRAM
US9251413B2 (en) * 2013-06-14 2016-02-02 Lexmark International Technology, SA Methods for automatic structured extraction of data in OCR documents having tabular data
JP5967164B2 (ja) 2014-04-30 2016-08-10 キヤノンマーケティングジャパン株式会社 帳票システムと、その処理方法及びプログラム
US20160055376A1 (en) * 2014-06-21 2016-02-25 iQG DBA iQGATEWAY LLC Method and system for identification and extraction of data from structured documents
JP6841546B2 (ja) 2016-10-27 2021-03-10 東日本高速道路株式会社 床版舗装構造

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008027133A (ja) * 2006-07-20 2008-02-07 Canon Inc 帳票処理装置及び帳票処理方法ならびに帳票処理方法を実行するプログラムと記憶媒体
JP2011150626A (ja) * 2010-01-25 2011-08-04 Ihi Corp 画像分類方法、装置、及びプログラム
JP2012198684A (ja) * 2011-03-18 2012-10-18 Pfu Ltd 情報処理装置、帳票種別推定方法および帳票種別推定用プログラム
JP2015011588A (ja) * 2013-06-28 2015-01-19 キヤノン株式会社 画像処理装置、画像処理方法
JP2016027442A (ja) * 2014-06-30 2016-02-18 キヤノンマーケティングジャパン株式会社 情報処理システムと、その処理方法及びプログラム
JP2016048444A (ja) * 2014-08-27 2016-04-07 沖電気工業株式会社 帳票識別プログラム、帳票識別装置、帳票識別システム、および帳票識別方法

Also Published As

Publication number Publication date
EP3779856A1 (en) 2021-02-17
SG11202009541RA (en) 2020-10-29
EP3779856A4 (en) 2021-04-28
US11989693B2 (en) 2024-05-21
WO2019194029A1 (ja) 2019-10-10
JP7160432B2 (ja) 2022-10-25
EP3779856B1 (en) 2023-10-25
US20210027052A1 (en) 2021-01-28

Similar Documents

Publication Publication Date Title
JP3425408B2 (ja) 文書読取装置
JP2019185141A (ja) 画像処理装置、画像処理方法およびプログラム
WO2019194026A1 (ja) 画像処理装置、画像処理方法、およびプログラムを記憶する記憶媒体
JP6859977B2 (ja) 画像処理装置、画像処理システム、画像処理方法およびプログラム
JP6826293B2 (ja) 情報処理システムと、その処理方法及びプログラム
CN103198502A (zh) 数字漫画编辑器及方法
JP2022125220A (ja) 画像処理装置、画像処理方法、プログラム
JPH11282955A (ja) 文字認識装置、文字認識方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH04350768A (ja) 名刺電子ファイリング装置
WO2019194029A1 (ja) 画像処理装置、画像処理方法、及びプログラムを記憶する記憶媒体
JP2006127499A (ja) イメージ処理装置
JP6784273B2 (ja) 画像処理装置、画像処理方法およびプログラム
JP3136928B2 (ja) データ処理装置
JP7111143B2 (ja) 画像処理装置、画像処理方法およびプログラム
JP6784274B2 (ja) 画像処理装置、画像処理方法およびプログラム
JP5168706B2 (ja) 電子帳票システムにおけるデータ検索項目情報の自動定義システム
JP2001005886A (ja) データ処理装置及び記憶媒体
JPH09297867A (ja) 個人識別媒体発行システム及びデータチェック方法
JP3637771B2 (ja) 文書編集出力装置
JP3143909B2 (ja) ファイル処理装置
JPH0314170A (ja) 作票装置
JP2004127059A (ja) 情報処理方法および装置
JPH0991359A (ja) 物理ファイル設計方法及びその装置
JPH07182367A (ja) 電子ファイリング装置
JPH10134142A (ja) 表作成システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200622

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20200629

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20200729

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200804

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200930

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201215

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210215

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20210316

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210615

C60 Trial request (containing other claim documents, opposition documents)

Free format text: JAPANESE INTERMEDIATE CODE: C60

Effective date: 20210615

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20210623

C21 Notice of transfer of a case for reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C21

Effective date: 20210629

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20210827

C211 Notice of termination of reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C211

Effective date: 20210831

C22 Notice of designation (change) of administrative judge

Free format text: JAPANESE INTERMEDIATE CODE: C22

Effective date: 20211207

C22 Notice of designation (change) of administrative judge

Free format text: JAPANESE INTERMEDIATE CODE: C22

Effective date: 20220412

C13 Notice of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: C13

Effective date: 20220607

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220803

C23 Notice of termination of proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C23

Effective date: 20220816

C03 Trial/appeal decision taken

Free format text: JAPANESE INTERMEDIATE CODE: C03

Effective date: 20220913

C30A Notification sent

Free format text: JAPANESE INTERMEDIATE CODE: C3012

Effective date: 20220913

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221006

R151 Written notification of patent or utility model registration

Ref document number: 7160432

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151