JP2019185140A - 画像処理装置、画像処理方法およびプログラム - Google Patents
画像処理装置、画像処理方法およびプログラム Download PDFInfo
- Publication number
- JP2019185140A JP2019185140A JP2018071144A JP2018071144A JP2019185140A JP 2019185140 A JP2019185140 A JP 2019185140A JP 2018071144 A JP2018071144 A JP 2018071144A JP 2018071144 A JP2018071144 A JP 2018071144A JP 2019185140 A JP2019185140 A JP 2019185140A
- Authority
- JP
- Japan
- Prior art keywords
- character string
- recorded
- feature amount
- image processing
- processing apparatus
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computer Graphics (AREA)
- Geometry (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
Abstract
Description
また、書類のフォーマットの解析に関して、特許文献2には、入力画像に含まれる表のフォームを識別するために、罫線の長さおよび位置等について複数のモデルの各々との類似度を算出し、最も高い類似度のモデルを選択することが記載されている。
図1に示す構成で、画像処理システム100は画像処理装置1、画像読取装置2、記録装置3およびデータベース4により構成される。
画像処理装置1は画像読取装置2と通信ケーブルにより接続されている。画像読取装置2は光学的に文書帳票などの画像データを取得して画像処理装置1へ出力する。画像処理装置1は文書帳票の画像データをOCR処理し文字認識する。画像処理装置1は文字認識結果を記録装置3に出力し、記録装置3がその文字認識結果をデータベースに記録する。なお、画像処理装置1が対象とする文書は、特定の種類のものに限定されない。OCR処理可能ないろいろな文書を、画像処理装置1の処理対象とすることができる。
作業者を、画像処理装置1のユーザ、または単にユーザとも称する。
図2に示す構成で、画像処理装置1は、画像処理装置本体10と、表示装置17と、入力デバイス18とを備える。
画像処理装置本体10は、CPU(Central Processing Unit)11、IF(Interface)12、通信モジュール13、ROM(Read Only Memory)14、RAM(Random Access Memory)15、HDD(Hard Disk Drive)16などの構成を備えたコンピュータである。通信モジュール13は画像読取装置2、記録装置3、データベース4との間で無線通信を行うものであっても、有線通信を行うものであってもよく、それら2つの機能を有していてもよい。
表示装置17は、例えば液晶パネルまたはLED(Light Emitting Diode)パネル等の表示画面を備える。
入力デバイス18は、例えばキーボードおよびマウス、あるいは、表示装置17の表示画面に設けられてタッチパネルを構成するタッチセンサ、あるいはこれらの組み合わせなど、ユーザ操作を受ける装置である。
図3は、第一実施形態に係る画像処理装置1の機能構成を示す概略ブロック図である。
通信部110は、図2の通信モジュールを用いて構成され、他の装置と通信を行う。特に、通信部110は、画像読取装置2、記録装置3、データベース4と通信を行う。
表示部120は、図2の表示装置17を用いて構成され、各種画像を表示する。
特に、表示部120は確認画面出力部の例に該当し、特徴量抽出部192が文書帳票の画像中で記録文字列の候補を複数特定した場合、それら複数の候補の位置を示す確認画面を出力する。表示部120は、複数の候補の位置を、文書画像上で文字列を特定する表示にて示す確認画面を出力する。作業者が確認画面を参照して記録文字列の候補のうち何れかを選択すると、特徴量抽出部192は、選択された文字列の文書帳票の画像中における特徴量を抽出する。特徴量の抽出を特徴量の生成とも称する。文字列の特徴量を抽出するとは、文字列が有する特徴を特徴量化する(すなわち、特徴を数値で示す)ことである。この特徴量は、新たな文書帳票の画像から記録文字列を抽出するために用いられる。
但し、確認画面出力部が確認画面を出力する方法は、画面を表示する方法に限定されない。例えば、通信部110が確認画面出力部として機能し、確認画面の画像データを他の装置に送信して確認画面を表示させるようにしてもよい。
記憶部180は、図2のROM14、RAM15およびHDD16を用いて構成され、各種データを記憶する。
制御部190は、図2のCPU11が、記憶部180(図2のROM14、RAM15およびHDD16)からプログラムを読み出して実行することで構成される。制御部190は、画像処理装置1の各部を制御して各種処理を実行する。
取得部191は、文書帳票の画像データを取得する。
特に、特徴量抽出部192は、文字認識処理された文書画像に含まれる記録文字列を特定し、特定した記録文字列の文書画像中における第一特徴量を抽出する。具体的には、特徴量抽出部192は記録文字列特定部の例に該当し、処理対象の文書画像の文字認識の結果得られた文字列のうち、記録文字列として指定された文字列を特定する。記録文字列の候補を複数特定した場合、特徴量抽出部192は、表示部120に確認画面を出力させ、確認画面においてユーザが特定した位置における記録文字列の特徴量を抽出する。特に、特徴量抽出部192は、文字列を特定する表示を行った文書画像上でのユーザ操作にて特定された文字列を記録文字列として特徴量の抽出を行う。
ここでいう記録文字列の特定は、文書帳票における文字列のうち何れか1つを、1つの記録文字列に決定することである。
この図が示すように文書帳票には、その文書を作成した企業のマーク、作成日、作成担当者、文書内容が、その文書帳票に特有のフォーマットで記述されている。文書内容は、例えば文書帳票が発注票であれば発注した商品名やその発注個数などの情報の組が1つまたは複数示される。作業者はある1つの文書帳票に基づいて、その文書帳票に記述されている文字列のうち記録すべき特定の文字列(記録文字列)を、記録装置3を用いてデータベース4へ記録する。具体的には作業者は文書帳票を見ながら記録装置3がデータベース4に記録すべき記録文字列を入力する。また作業者は文書帳票の画像データを画像読取装置2に読み込ませる。文書帳票は作業者の操作に基づいて画像読取装置2が読み取り画像処理装置1へ出力する。そして記録装置3は作業者の操作と画像処理装置1の制御とに基づいて、1つの文書帳票についての画像データと、その文書帳票に記述されている文字列のうち記録文字列を対応付けてデータベース4に記録する。図4の例においては、日付51、発注先52、商品名53、数量54、金額55が記録文字列である。文書帳票5には作業者によって記録されない非記録文字列等のその他の情報も印字されている。当該情報は例えば文書帳票を発行した発注者の名称501、発注者のエンブレム画像502、文書帳票のタイトル503、挨拶文504などである。
図5で示すようにデータベース4は文書帳票についての画像データと、その文書帳票に記述されている文字列のうち記録文字列を対応付けて記録テーブルに記憶する。
次に画像処理装置1の処理フローについて順を追って説明する。
まずデータベース4にはある文書帳票についての画像データと、その文書帳票に記述されている記録文字列との組み合わせが、同じ書式(Format)の文書帳票複数枚分記録されている。例えば図4で示す文書帳票5の書式の記録文字列情報(記録文字列を示す情報)が複数枚分記録されているとする。
これら画像データと記録文字列情報との組み合わせとして、例えば過去の業務で扱われた文書帳票の画像データおよび記録文字列情報を用いることができる。過去の業務から画像データおよび記録文字列情報を必要量確保できる場合、画像処理装置に第一特徴量を取得させるために画像データおよび記録文字列情報を別途用意する必要はない。
このような状態で作業者が画像処理装置1を起動し、当該画像処理装置1へ処理開始を指示する。
一意に特定していないと判定した場合(ステップS604:NO)、特徴量抽出部192は、記録文字列の候補それぞれの範囲を枠で示した画像を表示部120に表示させ、作業者によって選択された文字列に記録文字列を特定する(ステップS605)。ここでいう記録文字列の候補は、ステップS603で文字情報が記録文字列の文字情報と一致した文字列のうち、ステップS604で、一意に特定されていないと判定された記録文字列に対応付けられている文字列である。特徴量抽出部192が、1つの記録文字列の文字情報に対して、文書帳票における複数の文字列それぞれの文字情報が一致すると判定した場合、これら複数の文字列が、その記録情報の候補となる。作業者が、これら複数の文字列のうち何れか1つを選択することで、記録文字列が一意に特定される。
作業者が、例えばタッチ操作またはマウスクリックなどにより、矩形枠で囲まれた文字列の何れかを確認画面上で選択することで、この記録文字列が一意に決定される。記録文字列が一意に決定されることで、特徴量抽出部192がその記録文字列の第一特徴量を抽出することができる。
具体的には、特徴量抽出部192は、記録文字列毎に、複数の文書帳票におけるその記録文字列の文字列属性を解析して、1つの記録文字列に1つの特徴量を抽出する。
ステップS604で、特徴量抽出部192が、文書帳票内の全ての記録文字列を一意に特定したと判定した場合(ステップS604:YES)も、処理がステップS606へ進む。
特徴量抽出部192が、文書帳票の1つの書式かつ1つの記録文字列について複数の数値を取得した場合、これら複数の数値をベクトル化して1つのベクトルの特徴量を抽出するようにしてもよい。
特徴量抽出部192は、記録文字列毎に得られた第一特徴量を、文書帳票の書式の識別子に紐づけてデータベース4に記録する(ステップS607)。
ステップS607の後、画像処理装置1は、図6の処理を終了する。
作業者は新たな文書帳票を画像読取装置2に読み取らせる操作を行う。これにより画像読取装置2は文書帳票の画像データを生成して画像処理装置1へ出力(送信)する。画像処理装置1の取得部191は、通信部110の受信データから画像データを取得する(ステップS701)。取得部191は画像データを特徴量抽出部192へ出力する。特徴量抽出部192は画像データをOCR処理して、文字列と、その文字列に含まれる文字の特徴(文字属性)と、その文字列の範囲の画像データ中の座標とを文字列毎に検出する(ステップS702)。特徴量抽出部192はそれら検出した情報を特徴量化した第三特徴量を、画像データ中の文字列毎に抽出する(ステップS703)。つまり第三特徴量は新たに読み込んだ画像データの文書帳票に含まれる文字列の特徴を示す情報である。その後、特徴量抽出部192はデータベース4から記録文字列毎の第一特徴量を読み出す(ステップS704)。特徴量抽出部192は記録部193へ第三特徴量と第一特徴量とを出力する。
各第一特徴量の座標に対応する座標を有する第三特徴量が全て存在する場合(ステップS705:YES)には、記録文字列に対応する文書帳票内の全ての記載事項に文字の記載が存在する。一方、各第一特徴量の座標に対応する座標を有する第三特徴量が全て存在しない場合には、文書帳票内の何れかの記載事項に文字の記載が無い状態である。
確認画面にはOKまたはNGの何れかのボタンのアイコン画像が表示されている。このボタンのアイコン画像のうちOKのボタンを選択することにより作業者は記録文字列としての選択に不足がないことを指示することができる。他方、ボタンのアイコン画像のうちNGのボタンを選択することにより作業者は記録文字列としての選択に不足があることを指示することができる。
ステップS709の後、画像処理装置1は、図8の処理を終了する。
ステップS712の後、画像処理装置1は、図8の処理を終了する。
画像処理装置1が、図8の処理で第一特徴量を更新することで、サンプルデータ数が増加して第一特徴量の精度が向上し、画像処理装置1が記録文字列を抽出する精度が向上することが期待される。また、図8の処理で記録文字列が追加された場合、画像処理装置1が新たに追加された記録文字列についても画像データから抽出できるようになり、作業者が文字列を入力する手間を省けることが期待される。
また文書帳票に記録文字列が記載されていない場合でも、本来、記載されているべき記録文字列に対応する記載事項が記載されていない場合には画像処理装置1は入力用画像データを出力する。これにより文書帳票において記載すべき記載事項に対して入力していない誤りが見つかると共に、その記載事項が示す記録文字列を容易に記録することができる。
第二実施形態では、画像処理装置1が、文書帳票の複数の書式に対応する場合について説明する。
図9は第二実施形態に係る画像処理装置の機能構成を示す概略ブロック図である。
図9に示すように第二実施形態に係る画像処理装置1は、図3で示した各機能部に加え、さらにグループ分類部194、グループ特定部195の機能を有する。
次に第二実施形態に係る画像処理装置1の処理フローについて順を追って説明する。
データベース4には書式が異なる複数の文書帳票についての画像データと、各文書帳票に記述されている記録文字列の組み合わせが、その文書帳票毎に多数記録されている。このような状態で作業者が画像処理装置1を起動し、当該画像処理装置1へ処理開始を指示する。
一意に特定していないと判定した場合(ステップS905:NO)、特徴量抽出部192は、記録文字列の候補それぞれの範囲を枠で示した画像を表示部120に表示させ、作業者によって選択された文字列に記録文字列を特定する(ステップS906)。第一実施形態の場合と同様、ここでいう記録文字列の候補は、ステップS904で文字情報が記録文字列の文字情報と一致した文字列のうち、ステップS905で、一意に特定されていないと判定された記録文字列に対応付けられている文字列である。特徴量抽出部192が、1つの記録文字列の文字情報に対して、文書帳票における複数の文字列それぞれの文字情報が一致すると判定した場合、これら複数の文字列が、その記録情報の候補となる。作業者が、これら複数の文字列のうち何れか1つを選択することで、記録文字列が一意に特定される。
ステップS905で、特徴量抽出部192が、文書帳票内の全ての記録文字列を一意に特定したと判定した場合(ステップS905:YES)も、処理がステップS907へ進む。
特徴量抽出部192は、得られた個別第一特徴量を、文書帳票の識別子および記録文字列の識別子に紐づけてデータベース4に記録する(ステップS908)。記録文字列の識別子として、例えばその記録文字列の位置を示す座標値を用いることができる。
具体的には、特徴量抽出部192は、ステップS904で何れの記録文字列にも対応付けられなかった文字列の各々について、その文字列の属性(文字列属性)を特徴量化する。第一特徴量の場合と同様、文書帳票を書式毎にグループ分けしていないステップS910の時点では、同じ書式の文書帳票に共通の特徴量を生成することはできない。そこで、特徴量抽出部192は、グループ毎の第二特徴量を抽出する準備として、文書帳票毎かつ非記録文字列毎の特徴量を抽出しておく。この文書帳票毎かつ非記録文字列毎の特徴量を個別第二特徴量と称する。
特徴量抽出部192が、文書帳票毎、かつ、複数の非記録文字列を纏めた個別第二特徴量を生成するようにしてもよい。例えば、特徴量抽出部192が、1つの文書帳票につき1つの個別第二特徴量を生成するようにしてもよい。
例えば特徴量抽出部192は、図4の文書帳票5の書式に含まれる非記録文字列である発注者の名称501、発注者のエンブレム画像、文書帳票のタイトル503、挨拶文504などを示す個別第二特徴量を、文書帳票5の識別子および非記録文字列の識別子に紐づけてデータベース4に記録する。
グループ分類部194は、全ての文書帳票のグループ分けが完了した場合(ステップS922:YES)、文書帳票の識別子とその文書帳票に付与されたグループ識別子とを対応付けてデータベース4のグループテーブル(記録テーブル)に記録する(ステップS923)。
一方、個別第二特徴量については、ステップS921でのグループ分けで使用できるように、特徴量抽出部192がステップS910で抽出しておく。但し、ステップ921で、グループ分類部194が、個別第二特徴量を用いず非記録文字列を用いて文書帳票のグループ分けを行うようにしてもよい。この場合、特徴量抽出部192がステップS924で、同一グループに属する複数の文書帳票の非記録文字列の文字列属性から(直接的に)グループ第二特徴量を抽出するようにしてもよい。この場合、特徴量抽出部192は、ステップS909〜ステップS911では特に何も処理を行わない。
特徴量抽出部192は、グループそれぞれについて各グループ第一特徴量、各グループ第二特徴量を算出し、グループの識別子に対応付けてデータベース4に記録する(ステップS925)。
ステップS925の後、画像処理装置1は、図10の処理を終了する。
作業者は新たな文書帳票を画像読取装置2に読み取らせる操作を行う。これにより画像読取装置2は文書帳票の画像データを生成して画像処理装置1へ出力(送信)する。画像処理装置1の取得部191は、通信部110の受信データから画像データを取得する(ステップS1001)。取得部191は画像データを特徴量抽出部192へ出力する。特徴量抽出部192は画像データをOCR処理して、文字列と、その文字列に含まれる文字の特徴(文字属性)と、その文字列の範囲の画像データ中の座標とを文字列毎に検出する(ステップS1002)。特徴量抽出部192はそれら検出した情報を特徴量化した第三特徴量を、画像データ中の文字列毎に抽出する(ステップS1003)。第三特徴量は新たに読み込んだ画像データの文書帳票に含まれる文字列の特徴を示す情報である。
確認画面にはOKまたはNGの何れかのボタンのアイコン画像が表示されている。このボタンのアイコン画像のうちOKのボタンを選択することにより作業者は記録文字列としての選択に不足がないことを指示することができる。他方、ボタンのアイコン画像のうちNGのボタンを選択することにより作業者は記録文字列としての選択に不足があることを指示することができる。
ステップS1010の後、画像処理装置1は、図11の処理を終了する。
ステップS1013の後、画像処理装置1は、図11の処理を終了する。
画像処理装置1が、図11の処理で第一特徴量を更新することで、サンプルデータ数が増加して第一特徴量の精度が向上し、画像処理装置1が記録文字列を抽出する精度が向上することが期待される。また、図11の処理で記録文字列が追加された場合、画像処理装置1が新たに追加された記録文字列についても画像データから抽出できるようになり、作業者が文字列を入力する手間を省けることが期待される。
また文書帳票に記録文字列が記載されていない場合でも、本来、記載されているべき記録文字列に対応する記載事項が記載されていない場合には画像処理装置1は入力用画像データを出力する。これにより文書帳票において記載すべき記載事項に対して入力していない誤りが見つかると共に、その記載事項が示す記録文字列を容易に記録することができる。
なお、画像処理装置1の処理の他の例としては、作業者が予め文書帳票のグループを画像処理装置1に登録しておいてもよい。例えば作業者は、過去において文書帳票の画像データを登録する際、文書帳票の種類に合わせてグループ識別子を入力しておき文書帳票の画像データと紐づけてデータベース4に登録しておく。これにより、同一グループ内に画像処理装置1の処理誤り等により異種の帳票が混じることがなくなり、精度のよい第一特徴量を抽出することができる。なおこの場合、登録時は作業者が文書帳票のグループを入力するが、新たな帳票に対しては、ステップS1004と同じく、第二特徴量を用いてグループ特定する。
また、画像処理装置1の処理の他の例としては、画像処理装置1は第二特徴量を用いて文書帳票をグループ分けするだけでなく、第一特徴量を用いて、また第二特徴量と共に第一特徴量を用いて、文書帳票をグループ分けするようにしてもよい。第一特徴量は記録文字列の特徴量であるが、同じ種類の文書帳票であれば、記録文字列の座標やその文字属性は同じであると考えられ、第一特徴量を用いて帳票をグループ分けすることが可能となる。最初のグループ分けを第四実施形態で示すように作業者が行い、新たな文書帳票に対してはステップS1004の処理により第一特徴量を用いてグループ分けすることにより、OCR処理において精度よく記録文字列を読み取ることが可能となる。
この場合、取得部191が、複数の帳票画像データとその帳票画像データに含まれる文字列のうち記録対象となった記録文字列とを取得する。そしてグループ分類部194が第一特徴量に基づいて帳票画像データをグループ分けする。そして、特徴量抽出部192は、グループに含まれる帳票画像データに対応する第一特徴量を用いて記録文字列を抽出する。
第二実施形態においてはステップS1004において第二特徴量に基づいて新たな帳票のグループを特定している。しかしながら、別の処理態様として、画像処理装置1はグループを特定する処理を行わずに、作業者により設定された全グループに対して、1グループごとに順に特定して第一特徴量を読み出し、第三特徴量と一致する個数をカウントする。正しいグループの場合には最も多く第一特徴量と第三特徴量とが一致するはずなので、画像処理装置1は一致個数が最も多いときの特定グループの第三特徴量それぞれに含まれる文字列をステップS1008において記録する。これにより、グループを特定しなくても記録文字列を記録することができる。
この場合、取得部191が、複数の帳票画像データとその帳票画像データに含まれる文字列のうち記録対象となった記録文字列とを取得する。そして、特徴量抽出部192は、取得部191の取得した帳票画像データを認識処理した結果に基づいて、記録文字列の特徴を示す第一特徴量または記録文字列以外の認識情報を示す第二特徴量を抽出する。特徴量抽出部192は、予め設定された所定のグループに含まれる帳票画像データに対応する第一特徴量を用いて記録文字列を抽出する。
これにより、画像処理装置1では、記録文字列を一意に特定できなかった場合でも、候補の提示および作業者(ユーザ)による特定によって、記録文字列を一意に特定して特徴量の抽出を行うことができる。この点で、画像処理装置1によれば、文字認識結果の確認および修正を行う作業者に対して、文字認識対象のフォーマットが予めわかっていない場合でも、かつ、表形式のフォーマットに限定されずに、確認および修正の作業を支援することができる。
また、画像処理装置1が、記録文字列の候補の位置を示す確認画面をユーザに提示することで、作業者は、提示される位置を参照して比較的容易に記録文字列の候補の位置を把握できる。
表示部120が、文書画像上で文字列を特定するという直接的な表示で記録文字列の候補を作業者に示すことで、作業者は、比較的容易に記録文字列の候補の位置を把握できる。画像処理装置1によれば、この点で、作業者の負担が小さい。
これにより、作業者は、文書画像上に示されている文字列の何れかを選択するという簡単な操作で記録文字列を特定することができる。画像処理装置1によれば、この点で、作業者の負担が小さい。
これにより、画像処理装置1によれば、新たな文書画像の文字認識結果から記録文字列を自動的に抽出することができる。この点で、画像処理装置1によれば、確認および修正の作業を支援することができる。
特に、画像処理装置1によれば、文字認識対象のフォーマットが予めわかっていない場合でも、記録文字列の特徴量を抽出し、抽出した特徴量を用いて新たな文書画像の文字認識結果から記録文字列を自動的に抽出することができる。この点で、画像処理装置1によれば、文字認識結果の確認および修正を行う作業者に対して、文字認識対象のフォーマットが予めわかっていない場合でも、かつ、表形式のフォーマットに限定されずに、確認および修正の作業を支援することができる。
さらに、画像処理装置1によれば、特徴量抽出部192が自動では記録文字列を一意に特定できなかった場合でも、作業者による特定を受けて記録文字列の特徴量を抽出することができる。この点で、画像処理装置1によれば、新たな文書画像の文字認識結果から記録文字列を自動的に抽出するための学習を加速することができる。これにより、画像処理装置1が、より早い時期に新たな文書画像の文字認識結果から記録文字列を自動的に抽出できるようになると期待される。
図12は、実施形態に係る画像処理装置の構成の例を示す図である。図12に示す画像処理装置600は、記録文字列特定部601と、確認画面出力部602と、特徴量抽出部603と、を備える。
かかる構成にて、記録文字列特定部601は、文書画像の文字認識の結果得られた文字列のうち、記録文字列として指定された文字列を特定する。確認画面出力部602は、前記記録文字列特定部601が前記記録文字列の候補を複数特定した場合、それら複数の候補の位置を示す確認画面を出力する。特徴量抽出部603は、前記確認画面においてユーザが特定した位置における記録文字列の特徴量を抽出する。
これにより、画像処理装置600では、記録文字列を一意に特定できなかった場合でも、候補の提示および作業者(ユーザ)による特定によって、記録文字列を一意に特定して特徴量の抽出を行うことができる。この点で、画像処理装置600によれば、文字認識結果の確認および修正を行う作業者に対して、文字認識対象のフォーマットが予めわかっていない場合でも、かつ、表形式のフォーマットに限定されずに、確認および修正の作業を支援することができる。
また、画像処理装置600が、記録文字列の候補の位置を示す確認画面をユーザに提示することで、作業者は、提示される位置を参照して比較的容易に記録文字列の候補の位置を把握できる。
2 画像読取装置
3 記録装置
4 データベース
110 通信部
120 表示部
130 操作入力部
180 記憶部
190 制御部
191 取得部
192 特徴量抽出部
193 記録部
Claims (6)
- 文書画像の文字認識の結果得られた文字列のうち、記録文字列として指定された文字列を特定する記録文字列特定部と、
前記記録文字列特定部が前記記録文字列の候補を複数特定した場合、それら複数の候補の位置を示す確認画面を出力する確認画面出力部と、
前記確認画面においてユーザが特定した位置における記録文字列の特徴量を抽出する特徴量抽出部と、
を備える画像処理装置。 - 前記確認画面出力部は、前記複数の候補の位置を、文書画像上で文字列を特定する表示にて示す前記確認画面を出力する、
請求項1に記載の画像処理装置。 - 前記特徴量抽出部は、前記文字列を特定する表示を行った文書画像上でのユーザ操作にて特定された文字列を記録文字列として特徴量の抽出を行う、
請求項2に記載の画像処理装置。 - 前記特徴量抽出部が抽出した前記記録文字列の特徴量を用いて、新たな文書画像の文字認識結果から記録文字列を抽出する記録部文字列抽出部をさらに備える、
請求項1から3の何れか一項に記載の画像処理装置。 - 文書画像の文字認識の結果得られた文字列のうち、記録文字列として指定された文字列を特定する工程と、
前記記録文字列の候補を複数特定した場合、それら複数の候補の位置を示す確認画面を出力する工程と、
前記確認画面においてユーザが特定した位置における記録文字列の特徴量を抽出する工程と、
を含む画像処理方法。 - コンピュータに、
文書画像の文字認識の結果得られた文字列のうち、記録文字列として指定された文字列を特定する工程と、
前記記録文字列の候補を複数特定した場合、それら複数の候補の位置を示す確認画面を出力する工程と、
前記確認画面においてユーザが特定した位置における記録文字列の特徴量を抽出する工程と、
を実行させるためのプログラム。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018071144A JP6784274B2 (ja) | 2018-04-02 | 2018-04-02 | 画像処理装置、画像処理方法およびプログラム |
SG11202008319XA SG11202008319XA (en) | 2018-04-02 | 2019-03-08 | Image processing device, image processing method, and recording medium |
US16/976,644 US11482029B2 (en) | 2018-04-02 | 2019-03-08 | Image processing device, image processing method, and recording medium |
PCT/JP2019/009350 WO2019193923A1 (ja) | 2018-04-02 | 2019-03-08 | 画像処理装置、画像処理方法および記録媒体 |
EP19781366.0A EP3779791A4 (en) | 2018-04-02 | 2019-03-08 | IMAGE PROCESSING DEVICE, IMAGE PROCESSING METHOD AND RECORDING MEDIA |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018071144A JP6784274B2 (ja) | 2018-04-02 | 2018-04-02 | 画像処理装置、画像処理方法およびプログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2019185140A true JP2019185140A (ja) | 2019-10-24 |
JP2019185140A5 JP2019185140A5 (ja) | 2020-08-13 |
JP6784274B2 JP6784274B2 (ja) | 2020-11-11 |
Family
ID=68100747
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018071144A Active JP6784274B2 (ja) | 2018-04-02 | 2018-04-02 | 画像処理装置、画像処理方法およびプログラム |
Country Status (5)
Country | Link |
---|---|
US (1) | US11482029B2 (ja) |
EP (1) | EP3779791A4 (ja) |
JP (1) | JP6784274B2 (ja) |
SG (1) | SG11202008319XA (ja) |
WO (1) | WO2019193923A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6784273B2 (ja) * | 2018-04-02 | 2020-11-11 | 日本電気株式会社 | 画像処理装置、画像処理方法およびプログラム |
JP2022101136A (ja) * | 2020-12-24 | 2022-07-06 | キヤノン株式会社 | 情報処理装置、情報処理方法およびプログラム |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11120293A (ja) * | 1997-10-16 | 1999-04-30 | Fujitsu Ltd | 文字認識/修正方式 |
JP2005275849A (ja) * | 2004-03-25 | 2005-10-06 | Canon Inc | 文書処理装置および文書処理方法 |
JP2015215878A (ja) * | 2014-04-21 | 2015-12-03 | 株式会社リコー | 画像処理装置及び画像処理システム |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69033312D1 (de) | 1989-07-10 | 1999-11-11 | Hitachi Ltd | Dokumentdatenverarbeitungsgerät unter Anwendung von Bilddaten |
US5703962A (en) * | 1991-08-29 | 1997-12-30 | Canon Kabushiki Kaisha | Image processing method and apparatus |
JP4382074B2 (ja) | 1996-12-27 | 2009-12-09 | 富士通株式会社 | フォーム識別方法 |
JP4998219B2 (ja) | 2007-11-09 | 2012-08-15 | 富士通株式会社 | 帳票認識プログラム、帳票認識装置および帳票認識方法 |
US10108856B2 (en) | 2016-05-13 | 2018-10-23 | Abbyy Development Llc | Data entry from series of images of a patterned document |
JP6461886B2 (ja) | 2016-10-27 | 2019-01-30 | 株式会社イザキ | 地下コンクリート構造物を構築する工法および地下コンクリート構造物 |
-
2018
- 2018-04-02 JP JP2018071144A patent/JP6784274B2/ja active Active
-
2019
- 2019-03-08 WO PCT/JP2019/009350 patent/WO2019193923A1/ja unknown
- 2019-03-08 US US16/976,644 patent/US11482029B2/en active Active
- 2019-03-08 EP EP19781366.0A patent/EP3779791A4/en active Pending
- 2019-03-08 SG SG11202008319XA patent/SG11202008319XA/en unknown
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11120293A (ja) * | 1997-10-16 | 1999-04-30 | Fujitsu Ltd | 文字認識/修正方式 |
JP2005275849A (ja) * | 2004-03-25 | 2005-10-06 | Canon Inc | 文書処理装置および文書処理方法 |
JP2015215878A (ja) * | 2014-04-21 | 2015-12-03 | 株式会社リコー | 画像処理装置及び画像処理システム |
Also Published As
Publication number | Publication date |
---|---|
WO2019193923A1 (ja) | 2019-10-10 |
US20210012104A1 (en) | 2021-01-14 |
US11482029B2 (en) | 2022-10-25 |
EP3779791A4 (en) | 2021-05-26 |
JP6784274B2 (ja) | 2020-11-11 |
SG11202008319XA (en) | 2020-09-29 |
EP3779791A1 (en) | 2021-02-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6874729B2 (ja) | 画像処理装置、画像処理方法およびプログラム | |
US11868717B2 (en) | Multi-page document recognition in document capture | |
WO2019194026A1 (ja) | 画像処理装置、画像処理方法、およびプログラムを記憶する記憶媒体 | |
US10120537B2 (en) | Page-independent multi-field validation in document capture | |
JP6859977B2 (ja) | 画像処理装置、画像処理システム、画像処理方法およびプログラム | |
JP6100532B2 (ja) | レシート定義データ作成装置およびそのプログラム | |
WO2019194052A1 (ja) | 画像処理装置、画像処理方法、およびプログラムを記憶する記憶媒体 | |
JP2022125220A (ja) | 画像処理装置、画像処理方法、プログラム | |
JP5702342B2 (ja) | レシート定義データ作成装置およびプログラム | |
WO2019193923A1 (ja) | 画像処理装置、画像処理方法および記録媒体 | |
JP7111143B2 (ja) | 画像処理装置、画像処理方法およびプログラム | |
JP7160432B2 (ja) | 画像処理装置、画像処理方法、プログラム | |
JP2000003403A (ja) | 帳票入力支援方法 | |
JP3732254B2 (ja) | フォーマット情報生成方法及びフォーマット情報生成装置 | |
JP2020119480A (ja) | 様式データからデータベースアプリケーションを簡易に作成するシステム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200622 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200630 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20200630 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20200708 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200923 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201006 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6784274 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |