JP2019185137A - 画像処理装置、画像処理方法およびプログラム - Google Patents
画像処理装置、画像処理方法およびプログラム Download PDFInfo
- Publication number
- JP2019185137A JP2019185137A JP2018071140A JP2018071140A JP2019185137A JP 2019185137 A JP2019185137 A JP 2019185137A JP 2018071140 A JP2018071140 A JP 2018071140A JP 2018071140 A JP2018071140 A JP 2018071140A JP 2019185137 A JP2019185137 A JP 2019185137A
- Authority
- JP
- Japan
- Prior art keywords
- character string
- character
- specific item
- feature amount
- recorded
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/12—Detection or correction of errors, e.g. by rescanning the pattern
- G06V30/127—Detection or correction of errors, e.g. by rescanning the pattern with the intervention of an operator
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/26—Techniques for post-processing, e.g. correcting the recognition result
- G06V30/262—Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
- G06V30/268—Lexical context
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/418—Document matching, e.g. of document images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/1444—Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
- G06V30/1448—Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields based on markings or identifiers characterising the document or the area
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
Description
図1に示す構成で、画像処理システム100は画像処理装置1、画像読取装置2、記録装置3およびデータベース4により構成される。
画像処理装置1は画像読取装置2と通信ケーブルにより接続されている。画像読取装置2は光学的に文書帳票などの画像データを取得して画像処理装置1へ出力する。画像処理装置1は文書帳票の画像データをOCR処理し文字認識する。画像処理装置1は文字認識結果を記録装置3に出力し、記録装置3がその文字認識結果をデータベースに記録する。なお、画像処理装置1が対象とする文書は、特定の種類のものに限定されない。OCR処理可能ないろいろな文書を、画像処理装置1の処理対象とすることができる。
作業者を、画像処理装置1のユーザ、または単にユーザとも称する。
図2に示す構成で、画像処理装置1は、画像処理装置本体10と、表示装置17と、入力デバイス18とを備える。
画像処理装置本体10は、CPU(Central Processing Unit)11、IF(Interface)12、通信モジュール13、ROM(Read Only Memory)14、RAM(Random Access Memory)15、HDD(Hard Disk Drive)16などの構成を備えたコンピュータである。通信モジュール13は画像読取装置2、記録装置3、データベース4との間で無線通信を行うものであっても、有線通信を行うものであってもよく、それら2つの機能を有していてもよい。
表示装置17は、例えば液晶パネルまたはLED(Light Emitting Diode)パネル等の表示画面を備える。
入力デバイス18は、例えばキーボードおよびマウス、あるいは、表示装置17の表示画面に設けられてタッチパネルを構成するタッチセンサ、あるいはこれらの組み合わせなど、ユーザ操作を受ける装置である。
図3は、第一実施形態に係る画像処理装置1の機能構成を示す概略ブロック図である。
通信部110は、図2の通信モジュールを用いて構成され、他の装置と通信を行う。特に、通信部110は、画像読取装置2、記録装置3、データベース4と通信を行う。
表示部120は、図2の表示装置17を用いて構成され、各種画像を表示する。
記憶部180は、図2のROM14、RAM15およびHDD16を用いて構成され、各種データを記憶する。
制御部190は、図2のCPU11が、記憶部180(図2のROM14、RAM15およびHDD16)からプログラムを読み出して実行することで構成される。制御部190は、画像処理装置1の各部を制御して各種処理を実行する。
取得部191は、文書帳票の画像データを取得する。
記録部193は第一特徴量選択部の例に該当し、文書画像の種別毎かつ特定項目毎の第一特徴量のうち、文字認識対象の文書画像についての第一特徴量を選択する。第一特徴量は記録文字列の特徴を示し、ここでは、第一特徴量には文書画像における文字列の位置を示す座標情報が含まれる。従って、記録部193は、文書画像中での特定項目の文字列の位置を示す第一特徴量を選択する。
OCR処理結果から特定項目の文字列を適切に取得できなかった場合、画像処理装置1は、作業者による特定項目の文字列の入力または修正を受ける。
また、画像処理装置1が、特定項目の文字列として事前入力された文字列(事前入力データ)を利用できる場合がある。事前入力データが得られるケースの例として、例えば経理部の担当者が伝票をOCR処理する際に、営業部の担当者が取引内容の入力として伝票の内容の一部を入力していた場合など、業務フロー等で手入力されている場合が挙げられる。
また、特徴量抽出部192は機械学習部の例に該当し、事前入力された文字列と特定項目の文字列とが一致すると判定された場合、事前入力された文字列を用いて処理を行う。具体的には、特徴量抽出部192は、事前入力された文字列を用いて第一特徴量を更新する。従って、特徴量抽出部192は、文字認識結果の文字列の中から特定項目の文字列を選択するための情報を取得する機械学習に、事前入力された文字列を用いる。ここで、特徴量抽出部192が、記録部193が文字認識結果の文字列の中から特定項目の文字列の選択に失敗した場合のみ第一特徴量を更新するようにしてもよいし、成功した場合も第一特徴量を更新するようにしてもよい。従って、特徴量抽出部192は、記録部193が文字認識結果の文字列の中から特定項目の文字列を選択した場合および選択しなかった場合の何れも機械学習を行うようにしてもよい。
この図が示すように文書帳票には、その文書を作成した企業のマーク、作成日、作成担当者、文書内容が、その文書帳票に特有のフォーマットで記述されている。文書内容は、例えば文書帳票が発注票であれば発注した商品名やその発注個数などの情報の組が1つまたは複数示される。作業者はある1つの文書帳票に基づいて、その文書帳票に記述されている文字列のうち記録すべき特定項目の文字列(記録文字列)を、記録装置3を用いてデータベース4へ記録する。具体的には作業者は文書帳票を見ながら記録装置3がデータベース4に記録すべき記録文字列を入力する。また作業者は文書帳票の画像データを画像読取装置2に読み込ませる。文書帳票は作業者の操作に基づいて画像読取装置2が読み取り画像処理装置1へ出力する。そして記録装置3は作業者の操作と画像処理装置1の制御とに基づいて、1つの文書帳票についての画像データと、その文書帳票に記述されている文字列のうち記録文字列を対応付けてデータベース4に記録する。図4の例においては、日付51、発注先52、商品名53、数量54、金額55が記録文字列である。文書帳票5には作業者によって記録されない非記録文字列等のその他の情報も印字されている。当該情報は例えば文書帳票を発行した発注者の名称501、発注者のエンブレム画像502、文書帳票のタイトル503、挨拶文504などである。
図5で示すようにデータベース4は文書帳票についての画像データと、その文書帳票に記述されている文字列のうち記録文字列を対応付けて記録テーブルに記憶する。
次に画像処理装置1の処理フローについて順を追って説明する。
まずデータベース4にはある文書帳票についての画像データと、その文書帳票に記述されている記録文字列との組み合わせが、同じ書式(Format)の文書帳票複数枚分記録されている。例えば図4で示す文書帳票5の書式の記録文字列情報(記録文字列を示す情報)が複数枚分記録されているとする。
このような状態で作業者が画像処理装置1を起動し、当該画像処理装置1へ処理開始を指示する。
特徴量抽出部192が、1つの記録文字列の文字情報に対して、文書帳票における複数の文字列それぞれの文字情報が一致すると判定した場合、これら複数の文字列が、その記録情報の候補となる。作業者が、これら複数の文字列のうち何れか1つを選択することで、記録文字列が一意に特定される。
具体的には、特徴量抽出部192は、記録文字列毎に、複数の文書帳票におけるその記録文字列の文字列属性を解析して、1つの記録文字列に1つの特徴量を抽出する。
特徴量抽出部192が、同じ書式の文書帳票に共通かつ記録文字列毎の特徴量を抽出する方法は、特定の方法に限定されない。例えば、特徴量抽出部192が、複数の文書帳票から得られた複数の文字列属性について、先頭の文字の座標、末尾の文字の座標、文字の種類、文字の高さ、フォントの種類などの項目毎に最頻値(Mode)を求めるようにしてもよい。また、特徴量抽出部192が、先頭の文字の座標、末尾の文字の座標、文字の高さ、文字間の距離など数値で示される属性について項目毎に平均値(Average)または中央値(Median)を求めるようにしてもよい。また、特徴量抽出部192が、数値で表される項目について、その最大値および最小値を特徴量とするなど、範囲を有する特徴量、あるいは、複数の数値で表される特徴量を用いるようにしてもよい。また、特徴量抽出部192が、文字の種類、フォントの種類など数値以外の属性を数値化して特徴量を求めるようにしてもよい。また、特徴量抽出部192が、公知の機械学習アルゴリズムを用いて特徴量を抽出するようにしてもよい。
特徴量抽出部192が、文書帳票の1つの書式かつ1つの記録文字列について複数の数値を取得した場合、これら複数の数値をベクトル化して1つのベクトルの特徴量を抽出するようにしてもよい。
特徴量抽出部192は、記録文字列毎に得られた第一特徴量を、文書帳票の書式の識別子に紐づけてデータベース4に記録する(ステップS605)。
ステップS605の後、画像処理装置1は、図6の処理を終了する。
作業者は新たな文書帳票を画像読取装置2に読み取らせる操作を行う。これにより画像読取装置2は文書帳票の画像データを生成して画像処理装置1へ出力(送信)する。画像処理装置1の取得部191は、通信部110の受信データから画像データを取得する(ステップS701)。取得部191は画像データを特徴量抽出部192へ出力する。特徴量抽出部192は、帳票に対応する学習結果をデータベース4から取得する(ステップS702)。例えば、特徴量抽出部192は記録文字列毎に、その記録文字列の読取位置(座標情報)および文字種情報を示す第一特徴量を学習結果として取得する。
次に、画像処理装置1は、学習結果が示す読取位置毎に処理を行うループL1を開始する(ステップS704)。ループL1で処理対象になっている読取位置をM番目の読取位置と称する。ループL1では、画像処理装置1は、ループ内処理を行う(ステップS705)。
記録文字列を読取位置の文字列、または、読取文字列とも称する。
図8の処理で、記録部193は、M番目の読取位置の文字列の事前入力データがあるかを判定する(ステップS801)。事前入力データ無しと判定した場合(ステップS801:NO)、記録部193は、M番目の読取位置の文字列をOCR処理で読み取れたか否かを判定する(ステップS802)。読み取れなかったと記録部193が判定した場合(ステップS802:NO)、画像処理装置1は、M番目の読取位置文字列について作業者によるキー入力を受ける(ステップS803)。例えば表示部120が、文書帳票の画像上で読取位置を矩形で示す入力依頼画面を表示し、操作入力部130が文字列の入力操作を受ける。
そして、記録部193は、キー入力内容(キー入力で得られた文字列)とOCR処理結果とを含む学習用データを生成する(ステップS804)。ここでの学習用データは、特徴量抽出部192が第一特徴量を更新する機械学習のための学習用データである。
ステップS804の後、画像処理装置1は図8の処理を終了して図7の処理へ戻る。
一方、OCR処理で得られた文字列に誤りがあると判定された場合(ステップS812:YES)、作業者がキー入力で文字列を修正する(ステップS813)。例えば、表示部120が、OCR処理で読み取れた文字列と文書帳票の画像とを表示する。そして、操作入力部130が、文字列の修正のユーザ操作を受け付ける。
ステップS813の後、画像処理装置1は図8の処理を終了して図7の処理へ戻る。
ステップS824の後、処理がステップS804へ進む。
一方、ステップS823で、事前入力データの文字列が正しいと判定された場合(ステップS823:NO)、記録部193は、事前入力データとOCR処理結果とを含む学習用データを生成する(ステップS825)。
ステップS825の後、画像処理装置1は図8の処理を終了して図7の処理へ戻る。
事前入力データの文字列が正しいと判定された場合(ステップS833:NO)、画像処理装置1は図8の処理を終了して図7の処理へ戻る。
ステップS834の後、画像処理装置1は図8の処理を終了して図7の処理へ戻る。
ステップS708の後、画像処理装置1は、図7の処理を終了する。
特に、画像処理装置1がOCR処理に失敗した場合(OCR処理では記録文字列を適切に得られなかった場合)、成功した場合のいずれも、記録部193が学習用データを生成することで、文書帳票の書式の統計的な情報を機械学習に反映させることができる。
ここで、OCR処理に失敗した場合のみ機械学習を行う場合、画像処理装置1がOCR処理に成功すると機械学習を行わない結果、文書帳票の書式の統計的な情報が機械学習に反映されない場合がある。
第二実施形態では、画像処理装置1が、文書帳票の複数の書式に対応する場合について説明する。
図9は第二実施形態に係る画像処理装置の機能構成を示す概略ブロック図である。
図9に示すように第二実施形態に係る画像処理装置1は、図3で示した各機能部に加え、さらにグループ分類部194、グループ特定部195の機能を有する。
次に第二実施形態に係る画像処理装置1の処理フローについて順を追って説明する。
データベース4には書式が異なる複数の文書帳票についての画像データと、各文書帳票に記述されている記録文字列の組み合わせが、その文書帳票毎に多数記録されている。このような状態で作業者が画像処理装置1を起動し、当該画像処理装置1へ処理開始を指示する。
特徴量抽出部192が、1つの記録文字列の文字情報に対して、文書帳票における複数の文字列それぞれの文字情報が一致すると判定した場合、これら複数の文字列が、その記録情報の候補となる。作業者が、これら複数の文字列のうち何れか1つを選択することで、記録文字列が一意に特定される。
特徴量抽出部192は、得られた個別第一特徴量を、文書帳票の識別子および記録文字列の識別子に紐づけてデータベース4に記録する(ステップS906)。記録文字列の識別子として、例えばその記録文字列の位置を示す座標値を用いることができる。
具体的には、特徴量抽出部192は、ステップS904で何れの記録文字列にも対応付けられなかった文字列の各々について、その文字列の属性(文字列属性)を特徴量化する。第一特徴量の場合と同様、文書帳票を書式毎にグループ分けしていないステップS908の時点では、同じ書式の文書帳票に共通の特徴量を生成(抽出)することはできない。そこで、特徴量抽出部192は、グループ毎の第二特徴量を抽出する準備として、文書帳票毎かつ非記録文字列毎の特徴量を抽出しておく。この文書帳票毎かつ非記録文字列毎の特徴量を個別第二特徴量と称する。
特徴量抽出部192は、得られた個別第二特徴量を、文書帳票の識別子および非記録文字列の識別子に紐づけてデータベース4に記録する(ステップS909)。非記録文字列の識別子として、例えばその非記録文字列の位置を示す座標値を用いることができる。
グループ分類部194は、全ての文書帳票のグループ分けが完了した場合(ステップS922:YES)、文書帳票の識別子とその文書帳票に付与されたグループ識別子とを対応付けてデータベース4のグループテーブル(記録テーブル)に記録する(ステップS923)。
例えば、特徴量抽出部192がステップS924で、同一グループに属する複数の文書帳票から記録文字列毎に文字列属性を抽出して(直接的に)グループ第一特徴量を生成するようにしてもよい。この場合、特徴量抽出部192が、ステップS905およびステップS906での個別第一特徴量の抽出および記録をパスする(特に何も処理を行わない)。
特徴量抽出部192は、グループそれぞれについて各グループ第一特徴量、各グループ第二特徴量を算出し、グループの識別子に対応付けてデータベース4に記録する(ステップS925)。
ステップS925の後、画像処理装置1は、図10の処理を終了する。
ステップS1001は、図7のステップS701と共通である。ステップS1002は、図7のステップS703と共通である。そこで、画像処理装置1は、図11の処理を行う場合、図7の処理としてはステップS702の前にステップS703を実行する。
ステップS1002の後、特徴量抽出部192はそれら検出した情報を特徴量化した第三特徴量を、画像データ中の文字列毎に抽出する(ステップS1003)。第三特徴量は新たに読み込んだ画像データの文書帳票に含まれる文字列の特徴を示す情報である。
ステップS1005は図7のステップS702に相当し、グループ第一特徴量はステップS702での学習結果の例に該当する。以下、画像処理装置1はグループ第一特徴量を用いて図7のステップS704以降の処理を行う。
なお、画像処理装置1の処理の他の例としては、作業者が予め文書帳票のグループを画像処理装置1に登録しておいてもよい。例えば作業者は、過去において文書帳票の画像データを登録する際、文書帳票の種類に合わせてグループ識別子を入力しておき文書帳票の画像データと紐づけてデータベース4に登録しておく。これにより、同一グループ内に画像処理装置1の処理誤り等により異種の帳票が混じることがなくなり、精度のよい第一特徴量を抽出することができる。なおこの場合、登録時は作業者が文書帳票のグループを入力するが、新たな帳票に対しては、ステップS1004と同じく、第二特徴量を用いてグループ特定する。
また、画像処理装置1の処理の他の例としては、画像処理装置1は第二特徴量を用いて文書帳票をグループ分けするだけでなく、第一特徴量を用いて、また第二特徴量と共に第一特徴量を用いて、文書帳票をグループ分けするようにしてもよい。第一特徴量は記録文字列の特徴量であるが、同じ種類の文書帳票であれば、記録文字列の座標やその文字属性は同じであると考えられ、第一特徴量を用いて帳票をグループ分けすることが可能となる。最初のグループ分けを第四実施形態で示すように作業者が行い、新たな文書帳票に対してはステップS1004の処理により第一特徴量を用いてグループ分けすることにより、OCR処理において精度よく記録文字列を読み取ることが可能となる。
この場合、取得部191が、複数の帳票画像データとその帳票画像データに含まれる文字列のうち記録対象となった記録文字列とを取得する。そしてグループ分類部194が第一特徴量に基づいて帳票画像データをグループ分けする。そして、特徴量抽出部192は、グループに含まれる帳票画像データに対応する第一特徴量を用いて記録文字列を抽出する。
これにより、画像処理装置1は、事前入力された文字列を特定項目の文字列として用いることができる。作業者(ユーザ)は、事前入力された文字列と特定項目の文字列と入力された文字列とが一致するか否かを判定すればよく、文字列をキー入力する必要がない。この点で画像処理装置1によれば、事前に得られたデータとOCR処理で得られたデータとが一致する場合だけでなく、他の場合にもOCR処理結果を確認する作業者の負担を軽減できる。
これにより、作業者(ユーザ)は、文書帳票の画像に示される特定項目の文字列と入力された文字列とを見比べて一致するか否かを判定すればよく、比較的簡単で判定を行うことができる。画像処理装置1によれば、この点で作業者の負担が軽くて済む。
画像処理装置1によれば、作業者によって確認された文字列を用いて機械学習を行う点で、精度よく機械学習を行うことができる。また、作業者は確認の際文字列をキー入力する必要がなく、この点で作業者の負担が小さくて済む。
これにより、画像処理装置1では、上述したように、文書帳票の書式の統計的な情報を機械学習に反映させることができる。
この場合、画像処理装置1では、記録部193が文字認識処理の結果の文字列のうちの何れかを特定項目の文字列として選択したときも特徴量抽出部192が機械学習を行う場合と比較して、機械学習用に保存するデータ数、および、機械学習に要する時間が少なくて済む。
図12は、実施形態に係る画像処理装置の構成の例を示す図である。図12に示す画像処理装置600は、第一特徴量選択部601と、文字認識処理部602と、文字列選択部603と、ユーザ判定結果取得部604と、を備える。
かかる構成にて、第一特徴量選択部601は、複数の文書画像を文字認識処理した結果に基づいて予め記録され、文書画像の種別毎かつ特定項目毎にその項目の文字列の特徴を示す第一特徴量のうち、文字認識対象の文書画像についての第一特徴量を選択する。文字認識処理部602は、文字認識対象の文書画像の文字認識処理を行う。文字列選択部603は、文字認識処理の結果の文字列のうち第一特徴量に対応する特定項目の文字列を選択する。ユーザ判定結果取得部604は、文字列選択部603が文字認識処理の結果の文字列のうちの何れも特定項目の文字列として選択しなかった場合、事前入力された文字列と特定項目の文字列とが一致するか否かのユーザ判定結果を取得する。
これにより、画像処理装置600は、事前入力された文字列を特定項目の文字列として用いることができる。作業者(ユーザ)は、事前入力された文字列と特定項目の文字列と入力された文字列とが一致するか否かを判定すればよく、文字列をキー入力する必要がない。この点で画像処理装置600によれば、事前に得られたデータとOCR処理で得られたデータとが一致する場合だけでなく、他の場合にもOCR処理結果を確認する作業者の負担を軽減できる。
2 画像読取装置
3 記録装置
4 データベース
110 通信部
120 表示部
130 操作入力部
180 記憶部
190 制御部
191 取得部
192 特徴量抽出部
193 記録部
194 グループ分類部
195 グループ特定部
196 ユーザ判定結果取得部
Claims (7)
- 複数の文書画像を文字認識処理した結果に基づいて予め記録され、文書画像の種別毎かつ特定項目毎にその項目の文字列の特徴を示す第一特徴量のうち、文字認識対象の文書画像についての第一特徴量を選択する第一特徴量選択部と、
前記文字認識対象の文書画像の文字認識処理を行う文字認識処理部と、
前記文字認識処理の結果の文字列のうち前記第一特徴量に対応する特定項目の文字列を選択する文字列選択部と、
前記文字列選択部が前記文字認識処理の結果の文字列のうちの何れも前記特定項目の文字列として選択しなかった場合、事前入力された文字列と前記特定項目の文字列とが一致するか否かのユーザ判定結果を取得するユーザ判定結果取得部と、
を備える画像処理装置。 - 前記第一特徴量選択部は、前記文書画像中での前記特定項目の文字列の位置を示す前記第一特徴量を選択し、
前記ユーザ判定結果取得部は、前記特定項目の文字列の位置を示した前記文書画像と、前記事前入力された文字列とをユーザに提示して、前記文書画像に示される前記特定項目の文字列と前記事前入力された文字列とが一致するか否かのユーザ判定結果を取得する
請求項1に記載の画像処理装置。 - 前記文字列選択部が前記文字認識処理の結果の文字列のうちの何れも前記特定項目の文字列として選択せず、かつ、事前入力された文字列と前記特定項目の文字列とが一致すると前記ユーザ判定結果で示された場合、文字認識結果の文字列の中から前記特定項目の文字列を選択するための情報を取得する機械学習に、前記事前入力された文字列を用いる機械学習部をさらに備える、
請求項1または請求項2に記載の画像処理装置。 - 前記機械学習部は、前記文字列選択部が前記文字認識処理の結果の文字列のうちの何れかを前記特定項目の文字列として選択した場合、および、前記文字認識処理の結果の文字列のうちの何れも前記特定項目の文字列として選択しなかった場合の何れも前記機械学習を行う、
請求項3に記載の画像処理装置。 - 前記機械学習部は、前記文字列選択部が前記文字認識処理の結果の文字列のうちの何れも前記特定項目の文字列として選択しなかった場合に前記機械学習を行い、前記文字列選択部が前記文字認識処理の結果の文字列のうちの何れかを前記特定項目の文字列として選択した場合は前記機械学習の実行を抑制する、
請求項3に記載の画像処理装置。 - 複数の文書画像を文字認識処理した結果に基づいて予め記録され、文書画像の種別毎かつ特定項目毎にその項目の文字列の特徴を示す第一特徴量のうち、文字認識対象の文書画像についての第一特徴量を選択する工程と、
前記文字認識対象の文書画像の文字認識処理を行う工程と、
前記文字認識処理の結果の文字列のうち前記第一特徴量に対応する特定項目の文字列を選択する工程と、
前記文字認識処理の結果の文字列のうちの何れも前記特定項目の文字列として選択しなかった場合、事前入力された文字列と前記特定項目の文字列とが一致するか否かのユーザ判定結果を取得する工程と、
を含む画像処理方法。 - コンピュータに、
複数の文書画像を文字認識処理した結果に基づいて予め記録され、文書画像の種別毎かつ特定項目毎にその項目の文字列の特徴を示す第一特徴量のうち、文字認識対象の文書画像についての第一特徴量を選択する工程と、
前記文字認識対象の文書画像の文字認識処理を行う工程と、
前記文字認識処理の結果の文字列のうち前記第一特徴量に対応する特定項目の文字列を選択する工程と、
前記文字認識処理の結果の文字列のうちの何れも前記特定項目の文字列として選択しなかった場合、事前入力された文字列と前記特定項目の文字列とが一致するか否かのユーザ判定結果を取得する工程と、
を実行させるためのプログラム。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018071140A JP6859977B2 (ja) | 2018-04-02 | 2018-04-02 | 画像処理装置、画像処理システム、画像処理方法およびプログラム |
PCT/JP2019/013319 WO2019194051A1 (ja) | 2018-04-02 | 2019-03-27 | 画像処理装置、画像処理方法、およびプログラムを記憶する記憶媒体 |
US16/976,639 US11321936B2 (en) | 2018-04-02 | 2019-03-27 | Image processing device, image processing method, and storage medium storing program |
EP19781968.3A EP3779783A4 (en) | 2018-04-02 | 2019-03-27 | IMAGE PROCESSING DEVICE, IMAGE PROCESSING METHOD AND STORAGE MEDIUM WITH PROGRAM STORED ON IT |
SG11202008335QA SG11202008335QA (en) | 2018-04-02 | 2019-03-27 | Image processing device, image processing method, and storage medium storing program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018071140A JP6859977B2 (ja) | 2018-04-02 | 2018-04-02 | 画像処理装置、画像処理システム、画像処理方法およびプログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2019185137A true JP2019185137A (ja) | 2019-10-24 |
JP2019185137A5 JP2019185137A5 (ja) | 2020-08-13 |
JP6859977B2 JP6859977B2 (ja) | 2021-04-14 |
Family
ID=68100770
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018071140A Active JP6859977B2 (ja) | 2018-04-02 | 2018-04-02 | 画像処理装置、画像処理システム、画像処理方法およびプログラム |
Country Status (5)
Country | Link |
---|---|
US (1) | US11321936B2 (ja) |
EP (1) | EP3779783A4 (ja) |
JP (1) | JP6859977B2 (ja) |
SG (1) | SG11202008335QA (ja) |
WO (1) | WO2019194051A1 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6784273B2 (ja) * | 2018-04-02 | 2020-11-11 | 日本電気株式会社 | 画像処理装置、画像処理方法およびプログラム |
US11227176B2 (en) * | 2019-05-16 | 2022-01-18 | Bank Of Montreal | Deep-learning-based system and process for image recognition |
JP2022095391A (ja) * | 2020-12-16 | 2022-06-28 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置、及び情報処理プログラム |
JP2022097259A (ja) * | 2020-12-18 | 2022-06-30 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及び情報処理プログラム |
CN113642584B (zh) * | 2021-08-13 | 2023-11-28 | 北京百度网讯科技有限公司 | 文字识别方法、装置、设备、存储介质和智能词典笔 |
CN114519858B (zh) * | 2022-02-16 | 2023-09-05 | 北京百度网讯科技有限公司 | 文档图像的识别方法、装置、存储介质以及电子设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05258099A (ja) * | 1992-03-16 | 1993-10-08 | Fujitsu Ltd | 文字認識処理装置 |
JP2014182477A (ja) * | 2013-03-18 | 2014-09-29 | Fuji Xerox Co Ltd | プログラム及び帳票処理装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09223187A (ja) | 1996-02-20 | 1997-08-26 | Nec Software Ltd | Ocr入力確認修正方法およびシステム |
US8831361B2 (en) | 2012-03-09 | 2014-09-09 | Ancora Software Inc. | Method and system for commercial document image classification |
US8724907B1 (en) * | 2012-03-28 | 2014-05-13 | Emc Corporation | Method and system for using OCR data for grouping and classifying documents |
JP6365627B2 (ja) | 2016-10-27 | 2018-08-01 | 積水ハウス株式会社 | 防水床部の改修方法 |
-
2018
- 2018-04-02 JP JP2018071140A patent/JP6859977B2/ja active Active
-
2019
- 2019-03-27 US US16/976,639 patent/US11321936B2/en active Active
- 2019-03-27 WO PCT/JP2019/013319 patent/WO2019194051A1/ja unknown
- 2019-03-27 SG SG11202008335QA patent/SG11202008335QA/en unknown
- 2019-03-27 EP EP19781968.3A patent/EP3779783A4/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05258099A (ja) * | 1992-03-16 | 1993-10-08 | Fujitsu Ltd | 文字認識処理装置 |
JP2014182477A (ja) * | 2013-03-18 | 2014-09-29 | Fuji Xerox Co Ltd | プログラム及び帳票処理装置 |
Also Published As
Publication number | Publication date |
---|---|
US20210012138A1 (en) | 2021-01-14 |
WO2019194051A1 (ja) | 2019-10-10 |
EP3779783A4 (en) | 2021-05-26 |
SG11202008335QA (en) | 2020-09-29 |
US11321936B2 (en) | 2022-05-03 |
EP3779783A1 (en) | 2021-02-17 |
JP6859977B2 (ja) | 2021-04-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6859977B2 (ja) | 画像処理装置、画像処理システム、画像処理方法およびプログラム | |
JP6874729B2 (ja) | 画像処理装置、画像処理方法およびプログラム | |
US20210073531A1 (en) | Multi-page document recognition in document capture | |
WO2019194026A1 (ja) | 画像処理装置、画像処理方法、およびプログラムを記憶する記憶媒体 | |
US20190294912A1 (en) | Image processing device, image processing method, and image processing program | |
KR100570224B1 (ko) | 전표정의데이터 작성방법 및 전표처리장치 | |
JP2014137605A (ja) | レシート定義データ作成装置およびそのプログラム | |
WO2019194052A1 (ja) | 画像処理装置、画像処理方法、およびプログラムを記憶する記憶媒体 | |
JP2019008775A (ja) | 画像処理装置、画像処理システム、画像処理方法、プログラム | |
JP7111143B2 (ja) | 画像処理装置、画像処理方法およびプログラム | |
JP6784274B2 (ja) | 画像処理装置、画像処理方法およびプログラム | |
JP7160432B2 (ja) | 画像処理装置、画像処理方法、プログラム | |
JP2021140831A (ja) | 帳票画像処理システム、帳票画像処理方法、および帳票画像処理プログラム | |
WO2023021636A1 (ja) | データ処理装置、データ処理方法及びプログラム | |
JP6028566B2 (ja) | プログラム、表示制御方法及び表示制御装置 | |
JP2013182459A (ja) | 情報処理装置、情報処理方法及びプログラム | |
US20220198183A1 (en) | Information processing apparatus and non-transitory computer readable medium | |
JPH0689330A (ja) | 画像ファイリングシステム | |
WO2021117128A1 (ja) | 帳票画像処理システム | |
JP6217403B2 (ja) | 手書き金額記入欄のチェック画面出力方法、手書き金額記入欄のチェック画面出力プログラム、および手書き金額記入欄のチェック画面出力装置 | |
JPH08339420A (ja) | フォーマット情報生成方法及びフォーマット情報生成装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200622 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200630 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20200630 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20200716 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200721 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200923 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201027 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201228 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210224 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210309 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6859977 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |