JP2022011034A - データ入力支援装置、データ入力支援方法及びプログラム - Google Patents

データ入力支援装置、データ入力支援方法及びプログラム Download PDF

Info

Publication number
JP2022011034A
JP2022011034A JP2020111897A JP2020111897A JP2022011034A JP 2022011034 A JP2022011034 A JP 2022011034A JP 2020111897 A JP2020111897 A JP 2020111897A JP 2020111897 A JP2020111897 A JP 2020111897A JP 2022011034 A JP2022011034 A JP 2022011034A
Authority
JP
Japan
Prior art keywords
item
item value
area
image
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020111897A
Other languages
English (en)
Inventor
航平 戸田
Kohei Toda
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2020111897A priority Critical patent/JP2022011034A/ja
Priority to US17/359,912 priority patent/US11588945B2/en
Publication of JP2022011034A publication Critical patent/JP2022011034A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00795Reading arrangements
    • H04N1/00798Circuits or arrangements for the control thereof, e.g. using a programmed control device or according to a measured quantity
    • H04N1/00816Determining the reading area, e.g. eliminating reading of margins
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/414Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/416Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00326Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus
    • H04N1/00328Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information
    • H04N1/00331Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information with an apparatus performing optical character recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00405Output means
    • H04N1/00408Display of information to the user, e.g. menus
    • H04N1/0044Display of information to the user, e.g. menus for image preview or review, e.g. to help the user position a sheet
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Computer Graphics (AREA)
  • Geometry (AREA)
  • User Interface Of Digital Computer (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

【課題】同種の項目値が複数抽出される場合に、各項目値が正しい位置から抽出されたかを確認する作業に時間を要する。【解決手段】本発明におけるデータ入力支援装置は、データ入力支援装置の表示手段は、取得された項目値と前記項目値に対応する項目名の組合せを含む項目情報のうち、特定の項目種類である確率が最も高い組合せの前記項目値を表示する項目値表示領域と、前記帳票画像全体または前記項目値と当該項目値に対応する項目名を含む俯瞰画像を表示する俯瞰画像表示エリア、および前記項目値を含む拡大画像または前記項目値と当該項目値に対応する項目名を含む拡大画像を表示する拡大画像表示エリアを有する画像プレビュー表示エリアとを含む画面を表示し、取得された項目情報に応じて表示内容を切り替えて表示することを特徴とする。【選択図】図7

Description

本発明は、データ入力支援装置、データ入力支援方法及びプログラムに関する。
会計業務に用いられる紙の帳票から、必要な情報を読み取り、システムに転記するデータ入力業務がある。従来、データ入力業務を支援するために、帳票画像中の所定の位置にある文字列を項目値として読み取り、データ入力作業者に表示することにより入力業務を支援するシステムがあった。しかしながら、この方法は、帳票のレイアウト毎に項目の位置を登録する作業が必要であり、多様なレイアウトが存在し得る帳票に対して適用することは困難である。例えば、請求書は、発行元が独自のテンプレートを用いて作成するため、レイアウトが多様化しやすい。
このようにテンプレートの登録が困難な非定型帳票からデータ(項目値)を自動的に抽出する方法が特許文献1、特許文献2に開示されている。特許文献1では、データの属性を表す文字列である項目名と、データを表す項目値とを画像の文字認識結果から検索し、両者の位置関係に基づいて項目名と項目値とを対応付けることにより項目値の抽出を行う。特許文献2では、読み取り対象の項目名の領域を抽出し、ハイライト表示した上で、項目名に対応する項目値の位置・領域をユーザが大まかに入力することにより項目値を抽出する。
上記のように特許文献1及び特許文献2で開示される方法により項目値を自動抽出できるが、抽出した項目値の文字認識結果は誤ることがあり、そのために、オペレータによる目視確認が必須である。特許文献1では、項目値の文字認識結果を認識結果領域に表示するとともに、帳票画像上において、認識対象となった項目値の領域を太線の枠で囲んで表示する表示方法が開示される。また、特許文献2では、帳票の画像から切り出された文字イメージと、文字イメージの認識結果とを並べて表示することが記載されている。
特開2016-51339号公報 特開2018-37036号公報
帳票内に同様の種類のデータ(数値など)が複数存在する場合、認識結果のデータだけを確認しても、そのデータが所望の項目名に対応するデータなのか判断しにくいことが多い。すなわち、項目値の認識結果を確認する際は、どの項目名に対応する値として帳票画像から抽出したかも合わせて確認することが必要である。
しかしながら、特許文献1に開示された表示方法では、帳票の全体画像上で認識対象となった領域が太線枠で示されるだけである。ユーザは、認識結果が帳票画像上のどの文字画像領域に対応するのかを探し、さらに、その文字画像領域はどの項目名に対応するのかを帳票画像上において目視で確認する必要があり、確認作業に時間を要する。また、特許文献2に開示された表示方法では、文字認識結果に対応する文字イメージを確認することは容易である。しかしながら、その文字イメージが正しい項目名に対応するか否かを確認するためには、帳票の全体画像を別途表示させて確認する必要があり、確認作業に時間を要する。
本発明におけるデータ入力支援装置は、帳票画像の項目値領域と、前記項目値領域に対応する項目名領域とを特定し、前記項目値領域および前記項目名領域の画像を文字認識した結果を取得する手段を有するデータ入力支援装置において、取得された項目値と前記項目値に対応する項目名の組合せを含む項目情報のうち、特定の項目種類である確率が最も高い組合せの前記項目値を表示する項目値表示領域と、前記帳票画像全体または前記項目値と当該項目値に対応する項目名を含む俯瞰画像を表示する俯瞰画像表示エリア、および前記項目値を含む拡大画像または前記項目値と当該項目値に対応する項目名を含む拡大画像を表示する拡大画像表示エリアを有する画像プレビュー表示エリアとを含む画面を表示し、取得された項目情報に応じて表示内容を切り替えて表示する表示手段を備えたことを特徴とするデータ入力支援装置。
本発明によれば、項目値の抽出位置が正しくない場合や、同種の項目値が複数抽出され、項目名による区別ができない場合であっても、画像プレビュー表示エリアに各項目値の確認に最適な画像表示を行うことで、抽出正否の確認に掛かる時間を短縮できる。
第1の実施形態に係るデータ入力支援装置のハードウェア構成を示す図である。 本実施形態のデータ入力支援装置の表示部および入力部を実現するUIを示す図である。 本実施形態のデータ入力支援装置を実現する手段のソフトウェア構成を示す構成図である。 第1の実施形態において想定する帳票画像を示す図である。 帳票画像を対象に得られる検出結果を示す図である。 第1の実施形態を実現するソフトウェアの処理フローを示す図である。 表示手段により構築される確認画面を示す図である。 俯瞰画像及び拡大画像の表示の処理フローを示す図である。 項目種類を一意に表す文字列を持ったデータベースを示す図である。 俯瞰画像表示エリアに帳票画像全体が表示される確認画面を示す図である。 俯瞰画像表示エリアに帳票画像全体が表示される確認画面を示す図である。 俯瞰画像の作成フローを示す図である。 拡大画像表示エリアが画像プレビュー領域全体に拡大される確認画面1000を示す図である。
以下、本発明の実施形態について図面に基づいて説明する。なお、実施形態は本発明を限定するものではなく、また、実施形態で説明されている全ての構成が本発明の課題を解決するため必須の手段であるとは限らない。
本実施形態では、帳票画像300を対象として抽出される項目名及び項目値を表示するデータ入力支援装置について説明する。
<第1の実施形態>
[ハードウェア構成]
図1は、第1の実施形態に係るデータ入力支援装置のハードウェア構成を示す図である。データ入力支援装置100は、システム制御部101と、ROM102と、RAM103と、HDD104と、表示部105と、入力部106と、スキャナ107とを有する。
システム制御部101は、ROM102に記憶された制御プログラムを読み出して各種処理を実行する。RAM103は、システム制御部101の主メモリ、ワークエリア等の一時記憶領域として用いられる。HDD104は、各種データや各種プログラム等を記憶する。なお、後述するデータ入力支援装置100の機能や処理は、システム制御部101がROM102またはHDD104に格納されているプログラムを読み出し、このプログラムを実行することにより実現される。
表示部105は、各種情報を表示する。入力部106は、キーボードやマウスを有し、ユーザによる各種操作を受け付ける。なお、表示部105と入力部106は、タッチパネルのように一体に設けられてもよい。また、表示部105は、プロジェクタによる投影を行うものであってもよく、入力部106は、投影された画像に対する指先の位置を、カメラで認識するものであってもよい。
スキャナ107は、紙面を読み取ってスキャン画像を生成する。なお、スキャナ107は、接触型スキャナに限らず、書画カメラやスマートフォンを非接触型スキャナとして用いてもよい。
本実施形態においては、スキャナ107が帳票等の紙文書を読み取って帳票画像を生成し、当該画像をHDD104などの記憶装置に記憶する。
[UI]
図2は、本実施形態におけるデータ入力支援装置100の表示部105及び入力部106を実現するUI(User Interface)を示す図である。操作パネル201は、表示部105を実現する。操作パネル201はタッチパネル202及びテンキー203を備える。タッチパネル202は、ログイン中のユーザID、メインメニューなどが表示される。
本実施形態において、UIは、処理対象の帳票画像或いは帳票画像から抽出した結果等をユーザに提供するための一手段であり、タッチパネル202上で提供される。UIの表示は、タッチパネルに限定されず、PCに接続されたディスプレイを用いて実行してもよい。
[ソフトウェア構成]
図3は、データ入力支援装置100を実現する手段のソフトウェア構成を示す構成図である。データ入力支援装置100は、各種のモジュール(301~310)から構成される。ソフトウェアを実現するプログラムは、ROM102またはHDD104に記憶される。
制御手段301は、プログラムを制御し、各種モジュールに対する指示、及び管理を行う。
表示手段302は、制御手段301からの指示に従い、データ入力支援装置100のソフトウェアをユーザが操作するためのUI、及び各種の処理結果を表示部105に提供する。
入力手段303は、ソフトウェアに対するユーザの操作を受け付ける。
記憶手段304は、プログラム、及びプログラムが管理するその他の情報をROM102またはHDD104に記憶する。
文字認識手段305は、帳票画像中に記載される文字あるいは文字列について、座標及び文字種を特定する。
項目情報抽出手段306は、帳票画像からデータ入力業務の対象となる項目を項目情報として抽出する。項目情報抽出手段306は、さらにサブモジュール(307~310)を有する。
項目値領域検出手段307は、帳票画像からデータ入力業務の対象データとなる文字列が記載される領域を項目値領域として検出する。
項目名領域検出手段308は、帳票画像から項目値の名称を表す文字列が記載される領域を項目名領域として検出する。
項目値取得手段309は、文字認識手段305により得られる項目値領域の文字列を項目値として取得する。
項目名取得手段310は、文字認識手段305により得られる項目名領域の文字列を項目名として取得する。
項目値領域、項目名領域、項目値、項目名は特許文献1で開示される方法等の公知の方法で取得できる。
なお、文字認識手段305は、帳票画像全体の文字列を対象とする必要はなく、項目値取得手段309及び項目名取得手段210で必要な文字列が認識されていればよい。例えば、文字候補領域を抽出後、領域の位置、サイズ、領域間のレイアウト等に基づき、この領域が項目名または項目値ではないと判定し、文字種を特定しないことで計算量を軽減できる。
[項目検出結果]
図4は、本実施形態において想定する帳票画像400を示す図である。図5に、帳票画像400を対象に項目情報抽出手段306を適用して得られる検出結果501を示す。検出結果501は、図5において、抽出された項目情報が各行に記載され、複数の項目情報が列挙されている。項目情報は、項目種類、順位、項目値、項目名、正規形を有する。さらに、図示しないが、項目値・項目名毎に領域の頂点座標である領域情報を有する。図4における領域401~405は、それぞれ図5におけるNo.1~5の項目値に対応する項目値領域である。同様に領域401a、403a、404a、405aは、No.2を除く各項目名に対応する項目名領域である。
項目種類は、抽出された項目情報の種類を表す。検出結果501では「請求金額」項目、「発行日」項目、「電話番号」項目の3種類が検出されている。順位は、取得された項目値とこれに対応する項目名の組合せを含む項目情報が、同種の項目種類の中で、正しい項目種類である確率の高さに基づき決まる順序である。項目値は、項目情報が表す項目値であり、帳票画像中に記載される文字列である。項目名は、項目種類に対応する文字列である。例えば、検出結果501の「請求金額」項目に対応する項目名として「合計金額」が検出されている。
正規形は、項目種類毎に決められた書式に項目値を正規化した文字列である。例えば「発行日」項目は、「YYYYMMDD」の書式を正規形とし、検出結果501におけるNo.2では、「2019年11月8日」が「20191108」に変換され、正規形の文字列となる。同様に、「請求金額」項目では「小数点以下2桁の実数」を正規形として変換し、「電話番号」項目は「数字のみで構成される文字列」を正規形として変換する。これにより、帳票毎の項目値の表記の揺れを吸収する。
[処理フロー]
本実施形態を実現するソフトウェアの処理フローについて、図6を用いて説明する。
ステップS601で、制御手段301は、HDD104に記憶される帳票画像400を取得する。
ステップS602で、文字認識手段305は、帳票画像400を対象に文字認識処理を行う。これにより帳票画像400中の各文字列領域及び文字種が認識結果として得られる。
ステップS603で、項目情報抽出手段306は、文字認識結果に基づき、帳票画像400から項目情報を取得する。これにより検出結果501が得られる。
ステップS604で、表示手段302は、帳票画像400及び検出結果501をユーザに提示し、検出結果のそれぞれについて、抽出された項目種類に対応する項目値を確認・修正するための確認画面を構築し表示する。この処理については図7以降を用いて後述する。
ステップS605で、入力手段303は、入力部106によるユーザ操作を取得する。ここでユーザは、検出結果501の確認及び修正を行う。ユーザの入力内容に基づき、確認・修正が終了したらS607に遷移し、そうでなければS606で確認画面を更新し、再度ユーザ入力の受付を行う。
最後にステップS607で、制御手段304は、ユーザによる確認及び修正が完了した項目情報を不図示の外部システムに送信し、処理を終了する。
[確認画面]
図7は、表示手段により、処理フローのステップS604で構築される確認画面700を示す図である。確認画面700は、ユーザに対して検出結果501の内容を提示する。ユーザは、確認画面700において、項目値が正しい領域から検出されているか、正しい値が抽出されているかの確認を行い、誤りがあればその修正を行う。確認画面700は、俯瞰画像表示エリア702、および拡大画像表示エリア703を有する画像プレビュー表示エリア701を含む。また、確認画面700は、項目値表示領域として項目種類テキスト704a~704cおよび項目値テキスト705a~705c、前ページ移動ボタン706、送信ボタン707、次ページ移動ボタン708を含む。ただし、確認画面700では、確認画面に表示される具体的な表示内容は示していない。
画像プレビュー表示エリア701は、俯瞰画像表示エリア702と拡大画像表示エリア703から成る。俯瞰画像表示エリア702と拡大画像表示エリア703の表示内容は、検索結果に応じて切り替えられる。また、俯瞰画像表示エリア702が非表示になった場合、拡大画像表示エリア703のみから成る。
俯瞰画像表示エリア702は、帳票画像400に対して、検出結果501における順位1の項目情報(図5のNo.1、No.2、No.4)に対応する領域401、402、404がハイライト表示された俯瞰画像が作成され表示される。ただし、俯瞰画像の作成方法によっては、順位2の項目情報に対応する領域(図5のNo.3、No.5)もハイライト表示される。また、検出結果501の項目名の結果により俯瞰画像を作成せず、俯瞰画像表示エリアを非表示にする場合もある。俯瞰画像の作成方法については、図8~11を用いて後述する。ユーザは、俯瞰画像表示エリア702上でスワイプ操作やピンチイン・ピンチアウト操作を行うことにより、俯瞰画像の表示位置や表示倍率の変更が可能である。
拡大画像表示エリア703は、俯瞰画像表示エリア702にハイライト表示された領域に対応する項目値領域及び項目値領域から作成される画像である。拡大画像の作成方法については図8~11を用いて後述する。拡大画像は、ステップS605においてユーザによる選択が可能である。拡大画像が選択されると、拡大画像に対応する項目情報から項目値テキストが取得され、表示される。また、ユーザは、拡大画像表示エリア703上でスワイプ操作やピンチイン・ピンチアウト操作を行うことにより、俯瞰画像の表示位置や表示倍率の変更が可能である。
項目値表示領域の項目種類テキスト704a~704cは、図6におけるステップS607で外部システムに送信される項目種類の名称を表示する。確認画面700では、項目種類テキスト704aに「請求金額」、項目種類テキスト704bに「発行日」、項目種類テキスト704cに「電話番号」が表示されている。
項目値表示領域の項目値テキスト705a~705cは、俯瞰画像表示エリア702にハイライト表示された領域に対応する項目値が表示されるテキストエリアである。検出結果501のうち、項目種類テキストの項目種類に対応する項目情報のうち、項目値とこれに対応する項目名の組合せの順位が1の項目情報の項目値が表示される。各テキストエリアは、ユーザ入力が可能であり、文字認識結果に誤りがある場合には、ここで修正を行う。またユーザがテキストエリアを選択すると、画像プレビュー表示エリア701が対応する項目値を確認するために最適な表示に切り替わる。
前ページ移動ボタン706は、複数の帳票画像の確認作業を行っている際に一つ前の帳票画像の確認画面700に戻るためのボタンである。ユーザは。前の帳票画像の確認作業をもう一度行いたい場合、前ページ移動ボタン706を押下し、一つ前の帳票画像の確認画面700に戻り、確認・修正作業を行う。
送信ボタン707は、確認画面700を終了し項目種類テキスト704a~704cを、ステップS607で外部システムに送信するためのボタンである。ユーザは、確認画面700による検出結果501の結果の確認及び修正作業が完了後、ユーザは、送信ボタン707を押下し確認作業を終了する。
次ページ移動ボタン708は、複数の帳票画像の確認作業を行っている際に次の帳票画像の確認画面700に進むためのボタンである。ユーザは、現在の帳票画像の確認及び修正作業を終了し、次の帳票画像の確認及び修正作業を行いたい場合、次ページ移動ボタンを押下し、次の帳票画像の確認画面700に進み、確認・修正作業を行う。
[画像プレビュー表示エリアの表示]
図8に、画像プレビュー表示エリア701において、検出結果によって、俯瞰画像表示エリアと拡大画像表示エリアの表示内容を切り替えて表示する処理フローを示す。なお、ここでは検出結果501を対象として、画像プレビュー表示エリア701の表示内容を切り替えるフローを説明する。ステップS1101~S1108までの処理は、検出結果から抽出された項目種類毎(「請求金額」、「発行日」、「電話番号」)に処理される。
(1)確認・修正を行う特定の一つの項目種類に対し、項目値の候補が一つであった場合の俯瞰画像表示エリアと拡大画像表示エリアの表示フローについて、検出結果501の項目種類「請求金額」を例に説明する。
ステップS1101において、項目値の検出時に用いた項目名が項目種類を一意に表す文字列であったかどうか判定する。この判定は、あらかじめ作成されている項目種類データベース1200を参照し行う。
図9に、項目種類を一意に表す文字列を持ったデータベースを示す。項目種類データベース1200は、検出を行う項目種類とその項目種類を一意に表す一または複数の文字列とを保持する。図5に示した例では、項目種類「請求金額」の項目値を「合計金額」という項目名を用いて検出している。項目種類データベース1200を参照した結果、「請求金額」を一意に表す文字列は、「請求金額」の一つだけであるから、検出時に用いた項目名の文字列が、項目種類を一意に表していないと判定される。
ステップS1102において、項目値の検出時に他の候補が存在したか判定を行う。検出結果501より、項目種類の項目値に候補が存在しないため、処理フローはステップS1104、S1105に進む。
ステップS1104において、俯瞰画像表示エリアは、図10に示した俯瞰画像801のように帳票画像全体が表示される。
ステップS1105において、拡大画像表示エリアは、拡大画像802のように検出された項目値領域、この例では、項目種類「請求金額」の項目値の拡大画像が拡大画像表示エリアのサイズに合わせて表示され、本処理フローは終了する。
このように画像プレビュー表示エリア800の初期表示を行うことにより、ユーザが行う項目値の検出位置の確認作業の手間を削減することができる。また項目値の確認作業も行いやすくなる。
(2)確認・修正を行う一つの項目種類に対し、項目値の候補が複数得られ、かつ項目名による判別ができない場合の俯瞰画像表示エリア、拡大画像表示エリアの表示フローについて、検出結果501の項目種類「発行日」を例に説明する。
ステップS1101において、検出結果501と項目種類データベースにより、判定は項目種類の項目名は項目種類を一意に表していないと判定されるため、処理フローはステップS1102に進む。
ステップS1102では、検出結果501より、「発行日」の項目値として2019年11月8日と2019年12月8日とが検出されているので、他候補が存在したと判定され、ステップS1103に進む。
ステップS1103において、俯瞰画像表示エリアには、図11に示した俯瞰画像901が表示される。
ステップS1105において、拡大画像表示エリアは、拡大画像902aのように検出された項目値領域、この例では、項目種類「発行日」の項目値の拡大画像が拡大画像表示エリアのサイズに合わせて表示され、本処理フローは終了する。
図12を参照して、俯瞰画像901の作成方法について説明する。
ステップS1301において帳票画像を取得する。
ステップS1302において、項目値領域をハイライトする。このハイライトは、検出結果501として得られたすべての項目値領域をハイライトする。
ステップS1303において、選択された項目種類の、順位2までの項目名領域と項目値領域とを取得する。項目種類「発行日」が選択された場合、検出結果501のNo.2とNo.3の項目値、項目名領域が取得される。
ステップS1304において、ステップS1301で取得した全ての項目名領域と項目値領域のそれぞれの外接矩形を取得する。
ステップS1305において、それぞれの外接矩形の中心座標を取得する。
ステップS1306において、それぞれの中心座標を直線で結んだ図形を取得する。項目種類「発行日」の場合、検出結果501のNo.2とNo.3の項目名903と項目値904、905の3つの領域の中心を結んだ三角形の図形になる。
ステップS1307において、ステップS1306で取得した図形、ここでは三角形の中心座標を取得する。
ステップS1308において、図形の中心座標を中心として、3つの領域の外接矩形領域が含まれる画像を作成する。このとき作成される画像領域は、外接矩形領域を含む最小の領域ではなく、外接矩形領域を含む最小の領域に縦横一定の幅を持たせた画像となる。
ステップS1309において、作成した画像の表示倍率を俯瞰画像表示エリア901のサイズに合わせ、画像の大きさが最大になるように表示し、終了する。
また、俯瞰画像内のハイライトされた領域をユーザが選択することにより、拡大画像表示エリアに表示される画像を切り替えることができる。この例において、順位2の項目値領域(2019年12月8日)を選択することにより、拡大画像表示エリアに表示される画像は、拡大画像902aから拡大画像902bに切り替わる。
以上のような表示を、画像プレビュー表示エリアに表示することにより、項目値の候補が複数存在する場合に、ユーザが行う項目値の検出位置と項目値の確認作業が容易になる。特に、順位1の項目値の抽出位置が間違っており、新しく正しい項目値を探す作業が発生する場合、あらかじめ順位2の項目値の抽出位置の表示が行われているため、確認作業の削減が可能になる。
(3)確認・修正を行う一つの項目種類に対し、項目値の候補が複数存在するが項目値が一意に決定できる場合の俯瞰画像表示エリア、拡大画像表示エリアの表示フローについて、検出結果501の項目種類「電話番号」を例に説明する。
図8の処理フローに戻り、ステップS1101において、検出結果401、項目種類データベース1200により、項目種類の項目名は、項目種類を一意に表していると判定される。
ステップS1106において、俯瞰画像表示エリアは、図13に示すように、俯瞰画像表示エリア1001のように非表示となる。
ステップS1107において、拡大画像表示エリア1002が画像プレビュー領域全体に拡大される。
ステップS1108により、拡大画像表示エリア1002には、検出した項目名(「請求元TEL」)と項目値(「045-789-1234」)を中心に拡大された拡大画像が表示され、本処理フローは終了する。この拡大画像は、項目名領域と項目値領域が含まれ、各領域の文字サイズが拡大画像上で一定サイズより大きく表示されるよう調整され表示される。
このような初期表示を行うことにより、ユーザが行う項目値の検出位置と項目値の確認作業において、検出位置の確認が不要と考えられる場合には、項目値の確認作業を優先的に行うことが可能になり、確認・修正作業の負担を軽減できる。
以上のように、本実施形態は、確認及び修正作業を行う項目種類の検出結果にあわせて、表示する画像プレビュー表示エリアの表示内容を切り替える。これにより、項目値の抽出位置が正しくない場合の作業や、同じ項目種類に対し、複数の抽出候補が存在する場合の確認作業が容易となる。
<その他の実施形態>
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワークまたは記憶媒体を介してシステムまたは装置に供給することができる。そのシステムまたは装置のコンピュータにおける1つ以上のプロセッサーが、供給されたプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
以上、本発明の好ましい実施形態について説明したが、本発明は、これらの実施形態に限定されず、その要旨の範囲内で種々の変形及び変更が可能である。
301 制御手段
302 表示手段
303 入力手段
304 記憶手段
305 文字認識手段
306 項目情報抽出手段
307 項目値領域検出手段
308 項目名領域検出手段
309 項目値取得手段
310 項目名取得手段

Claims (14)

  1. 帳票画像の項目値領域と、前記項目値領域に対応する項目名領域とを特定し、前記項目値領域および前記項目名領域の画像を文字認識した結果を取得する手段を有するデータ入力支援装置において、
    取得された項目値と前記項目値に対応する項目名の組合せを含む項目情報のうち、特定の項目種類である確率が最も高い組合せの前記項目値を表示する項目値表示領域と、
    前記帳票画像全体または前記項目値と当該項目値に対応する項目名を含む俯瞰画像を表示する俯瞰画像表示エリア、および前記項目値を含む拡大画像または前記項目値と当該項目値に対応する項目名を含む拡大画像を表示する拡大画像表示エリアを有する画像プレビュー表示エリアとを含む画面を表示し、
    取得された項目情報に応じて表示内容を切り替えて表示する表示手段を備えたことを特徴とするデータ入力支援装置。
  2. 前記表示手段は、前記特定の項目種類に一意に対応する組合せがない場合に、前記俯瞰画像表示エリアに、前記帳票画像全体を表示することを特徴とする請求項1に記載のデータ入力支援装置。
  3. 前記表示手段は、前記特定の項目種類に対応する複数の候補がある場合には、前記俯瞰画像表示エリアに、前記特定の項目種類である確率が高い2つの組合せの項目値と当該項目値に対応する項目名を含む俯瞰画像を表示することを特徴とする請求項1に記載のデータ入力支援装置。
  4. 前記表示手段は、前記特定の項目種類に一意に対応する組合せがある場合に、前記俯瞰画像表示エリアを表示せず、前記拡大画像表示エリアに、前記項目値と当該項目値に対応する項目名を含む拡大画像を表示することを特徴とする請求項1に記載のデータ入力支援装置。
  5. ユーザ入力を受け付ける入力手段をさらに備え、
    前記入力手段は、前記俯瞰画像表示エリアの前記項目値領域の選択を受け付け、
    前記表示手段は、前記拡大画像表示エリアに、前記入力手段で選択された前記項目値領域の項目値の拡大画像を表示することを特徴とする請求項1、2または3に記載のデータ入力支援装置。
  6. 帳票画像の項目値領域と、前記項目値領域に対応する項目名領域とを特定し、前記項目値領域および前記項目名領域の画像を文字認識した結果を取得する手段を有するデータ入力支援装置において、
    取得された項目値と前記項目値に対応する項目名の組合せを含む項目情報のうち、特定の項目種類である確率が最も高い組合せの前記項目値を表示する項目値表示領域と、
    前記帳票画像全体を表示する俯瞰画像表示エリア、および前記項目値を含む拡大画像を表示する拡大画像表示エリアを含む画像プレビュー表示エリアと
    を表示する表示手段を備えたことを特徴とするデータ入力支援装置。
  7. 帳票画像の項目値領域と、前記項目値領域に対応する項目名領域とを特定し、前記項目値領域および前記項目名領域の画像を文字認識した結果を取得する手段を有するデータ入力支援装置において、
    取得された項目値と当該項目値に対応する項目名の組合せを含む項目情報のうち、特定の項目種類である確率が最も高い組合せの前記項目値を表示する項目値表示領域と、
    前記特定の項目種類である確率が高い2つの組合せの項目値と当該項目値に対応する項目名を含む俯瞰画像を表示する俯瞰画像表示エリア、および前記項目値を含む拡大画像を表示する拡大画像表示エリアを含む画像プレビュー表示エリアと
    を表示する表示手段を備えたことを特徴とするデータ入力支援装置。
  8. 帳票画像の項目値領域と、前記項目値領域に対応する項目名領域とを特定し、前記項目値領域および前記項目名領域の画像を文字認識した結果を取得する手段を有するデータ入力支援装置において、
    取得された項目値と前記項目値に対応する項目名の組合せを含む項目情報のうち、特定の項目種類に一意に対応する組合せの前記項目値を表示する項目値表示領域と、
    前記項目値に対応する前記項目名を含む拡大画像を表示する画像プレビュー表示エリアと
    を表示する表示手段を備えたことを特徴とするデータ入力支援装置。
  9. ユーザ入力を受け付ける入力手段をさらに備え、
    前記入力手段は、前記俯瞰画像表示エリアの前記項目値領域の選択を受け付け、
    前記表示手段は、前記拡大画像表示エリアに、前記入力手段で選択された前記項目値領域の項目値の拡大画像を表示することを特徴とする請求項6または7に記載のデータ入力支援装置。
  10. 帳票画像の項目値領域と、前記項目値領域に対応する項目名領域とを特定し、前記項目値領域および前記項目名領域の画像を文字認識した結果を取得する手段を有するデータ入力支援装置におけるデータ入力支援方法において、
    取得された項目値と前記項目値に対応する項目名の組合せを含む項目情報のうち、特定の項目種類である確率が最も高い組合せの前記項目値を表示する項目値表示領域と、前記帳票画像全体または前記項目値と当該項目値に対応する項目名を含む俯瞰画像を表示する俯瞰画像表示エリア、および前記項目値を含む拡大画像または前記項目値と当該項目値に対応する項目名を含む拡大画像を表示する拡大画像表示エリアを有する画像プレビュー表示エリアとを含む画面を表示する第1ステップと、
    取得された項目情報に応じて表示内容を切り替えて表示する第2ステップと
    を備えたことを特徴とするデータ入力支援方法。
  11. 帳票画像の項目値領域と、前記項目値領域に対応する項目名領域とを特定し、前記項目値領域および前記項目名領域の画像を文字認識した結果を取得する手段を有するデータ入力支援装置におけるデータ入力支援方法において、
    取得された項目値と前記項目値に対応する項目名の組合せを含む項目情報のうち、特定の項目種類である確率が最も高い組合せの前記項目値を表示する項目値表示領域と、
    前記帳票画像全体を表示する俯瞰画像表示エリア、および前記項目値を含む拡大画像を表示する拡大画像表示エリアを含む画像プレビュー表示エリアと
    を表示するステップを備えたことを特徴とするデータ入力支援方法。
  12. 帳票画像の項目値領域と、前記項目値領域に対応する項目名領域とを特定し、前記項目値領域および前記項目名領域の画像を文字認識した結果を取得する手段を有するデータ入力支援装置におけるデータ入力支援方法において、
    取得された項目値と当該項目値に対応する項目名の組合せを含む項目情報のうち、特定の項目種類である確率が最も高い組合せの前記項目値を表示する項目値表示領域と、
    前記特定の項目種類である確率が高い2つの組合せの項目値と当該項目値に対応する項目名を含む俯瞰画像を表示する俯瞰画像表示エリア、および前記項目値を含む拡大画像を表示する拡大画像表示エリアを含む画像プレビュー表示エリアと
    を表示するステップを備えたことを特徴とするデータ入力支援方法。
  13. 帳票画像の項目値領域と、前記項目値領域に対応する項目名領域とを特定し、前記項目値領域および前記項目名領域の画像を文字認識した結果を取得する手段を有するデータ入力支援装置におけるデータ入力支援方法において、
    取得された項目値と前記項目値に対応する項目名の組合せを含む項目情報のうち、特定の項目種類に一意に対応する組合せの前記項目値を表示する項目値表示領域と、
    前記項目値に対応する前記項目名を含む拡大画像を表示する画像プレビュー表示エリアと
    を表示するステップを備えたことを特徴とするデータ入力支援方法。
  14. コンピュータを、請求項1乃至9のいずれか1項に記載のデータ入力支援装置の一手段として機能させるためのプログラム。
JP2020111897A 2020-06-29 2020-06-29 データ入力支援装置、データ入力支援方法及びプログラム Pending JP2022011034A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2020111897A JP2022011034A (ja) 2020-06-29 2020-06-29 データ入力支援装置、データ入力支援方法及びプログラム
US17/359,912 US11588945B2 (en) 2020-06-29 2021-06-28 Data input support apparatus that displays a window with an item value display area, an overview image display area, and an enlarged image display area

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020111897A JP2022011034A (ja) 2020-06-29 2020-06-29 データ入力支援装置、データ入力支援方法及びプログラム

Publications (1)

Publication Number Publication Date
JP2022011034A true JP2022011034A (ja) 2022-01-17

Family

ID=79030690

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020111897A Pending JP2022011034A (ja) 2020-06-29 2020-06-29 データ入力支援装置、データ入力支援方法及びプログラム

Country Status (2)

Country Link
US (1) US11588945B2 (ja)
JP (1) JP2022011034A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7559415B2 (ja) * 2020-08-06 2024-10-02 株式会社リコー 情報処理装置、情報処理方法、情報処理プログラム、情報処理システム

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6406932B2 (ja) 2014-08-29 2018-10-17 日立オムロンターミナルソリューションズ株式会社 帳票認識装置及び方法
JP6098628B2 (ja) * 2014-12-26 2017-03-22 ブラザー工業株式会社 画像処理プログラム、画像処理方法、及び画像処理装置
US10142499B2 (en) * 2015-10-06 2018-11-27 Canon Kabushiki Kaisha Document distribution system, document distribution apparatus, information processing method, and storage medium
JP6917688B2 (ja) 2016-09-02 2021-08-11 株式会社東芝 帳票読取装置、帳票読取方法、プログラム、および帳票読取システム
JP7030462B2 (ja) * 2017-09-21 2022-03-07 キヤノン株式会社 スキャン画像から文字情報を取得する画像処理装置、画像処理方法、及びプログラム
JP7034730B2 (ja) * 2018-01-23 2022-03-14 キヤノン株式会社 スキャン画像に関連する情報を設定するための装置、方法、およびプログラム
JP6983675B2 (ja) * 2018-01-23 2021-12-17 キヤノン株式会社 スキャン画像に関連する情報を設定するための装置、方法、プログラム、およびシステム
JP7102170B2 (ja) * 2018-02-28 2022-07-19 キヤノン株式会社 画像処理装置、および画像処理装置の制御方法とプログラム
US11308318B2 (en) * 2018-05-30 2022-04-19 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and storage medium
JP7297510B2 (ja) * 2019-04-19 2023-06-26 キヤノン株式会社 ユーザ操作のためのガイダンスを表示する画像処理装置、その制御方法及びプログラム
JP7483384B2 (ja) * 2020-01-21 2024-05-15 キヤノン株式会社 文書を電子化する画像処理システム、その制御方法及びプログラム

Also Published As

Publication number Publication date
US11588945B2 (en) 2023-02-21
US20210409550A1 (en) 2021-12-30

Similar Documents

Publication Publication Date Title
JP5001182B2 (ja) 表示制御装置、電子機器、表示制御方法、およびプログラム
US20200394357A1 (en) Synchronizing data-entry fields with corresponding image regions
JP7434001B2 (ja) 情報処理装置、プログラム、情報処理方法
KR20140030361A (ko) 휴대단말기의 문자 인식장치 및 방법
JP2016224599A (ja) ガイドファイル作成プログラム
WO2013058397A1 (ja) 電子コミック編集装置及び方法
EP3598340A1 (en) Information processing apparatus, method of processing information and carrier means
CN102694940B (zh) 信息处理装置及其控制方法
JP2012064195A (ja) 情報処理装置、情報処理方法、プログラム及び記録媒体。
CN105912315A (zh) 信息处理装置、信息处理系统、信息处理方法和计算机程序产品
JP2012178175A (ja) 表示制御装置、電子機器、表示制御方法、およびプログラム
JP2022011034A (ja) データ入力支援装置、データ入力支援方法及びプログラム
CN115050038A (zh) 信息处理装置、信息处理方法和存储介质
JP2006277001A (ja) 入力イメージ表示方法および入力イメージ表示プログラム
JP7443012B2 (ja) メタデータを設定するための設定方法、プログラム、装置
KR20150096274A (ko) 웹 브라우저에서 화상형성장치의 주소록을 활용하는 방법 및 이를 수행하기 위한 화상형성장치
JP5414920B2 (ja) 表示制御装置、表示制御方法、およびプログラム
JP7458816B2 (ja) データ入力支援装置、データ入力支援方法、表示装置、及びプログラム
JP2021144469A (ja) データ入力支援システム、データ入力支援方法、及びプログラム
WO2021010069A1 (ja) 画面遷移情報生成装置、画面遷移情報生成方法、画面遷移情報生成用プログラム、画面遷移情報生成システム
JP2022010994A (ja) データ入力支援装置、データ入力支援方法及びプログラム
JP2022011019A (ja) データ入力支援装置、データ入力支援方法及びプログラム
JP6657799B2 (ja) 図形処理装置、図形処理方法、および、図形処理プログラム
JP7456131B2 (ja) 情報処理システム、情報処理方法及びプログラム
KR102721513B1 (ko) 메타데이터를 설정하기 위한 화면의 표시를 제어하는 방법, 비일시적 저장 매체 및 장치