JP7081179B2 - 画像処理装置および画像処理プログラム - Google Patents

画像処理装置および画像処理プログラム Download PDF

Info

Publication number
JP7081179B2
JP7081179B2 JP2018014569A JP2018014569A JP7081179B2 JP 7081179 B2 JP7081179 B2 JP 7081179B2 JP 2018014569 A JP2018014569 A JP 2018014569A JP 2018014569 A JP2018014569 A JP 2018014569A JP 7081179 B2 JP7081179 B2 JP 7081179B2
Authority
JP
Japan
Prior art keywords
receipt
image
area
display
receipt image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018014569A
Other languages
English (en)
Other versions
JP2019133379A (ja
Inventor
潔 水庫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Priority to JP2018014569A priority Critical patent/JP7081179B2/ja
Priority to CN201910089598.9A priority patent/CN110097057B/zh
Priority to US16/262,390 priority patent/US20190236351A1/en
Publication of JP2019133379A publication Critical patent/JP2019133379A/ja
Application granted granted Critical
Publication of JP7081179B2 publication Critical patent/JP7081179B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/416Extracting the logical structure, e.g. chapters, sections or page numbers; Identifying elements of the document, e.g. authors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/0485Scrolling or panning
    • G06F3/04855Interaction with scrollbars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/08Payment architectures
    • G06Q20/20Point-of-sale [POS] network systems
    • G06Q20/209Specified transaction journal output feature, e.g. printed receipt or voice output
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/20Scenes; Scene-specific elements in augmented reality scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Artificial Intelligence (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Human Computer Interaction (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
  • Cash Registers Or Receiving Machines (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • User Interface Of Digital Computer (AREA)

Description

本発明は、画像処理装置および画像処理プログラムに関する。
従来、領収書が撮像された領収書画像をディスプレイに表示させ、領収書画像に含まれる店名や品目別金額や合計金額等の明細を確認可能とする画像処理プログラムが知られている(特許文献1参照)。
特開2016‐126356号公報
しかしながら、領収書画像がディスプレイに表示されたとき、領収書の上端側や下端側には、企業の広告や各種アンケート等、明細とは無関係の事項が掲載されていることがある。そのため、領収書画像の中で明細が相対的に小さく表示されたり、明細が画面内に入らなかったりして、ユーザーは明細を確認しづらい場合があった。
画像処理装置は、領収書の読み取りにより生成された領収書画像を取得する制御部と、前記領収書画像を表示する表示部と、を備え、前記制御部は、文字認識により前記領収書画像に含まれている文字列を認識し、前記領収書画像に含まれている文字列に基づいて前記領収書画像内の明細領域を特定し、前記領収書画像のうち前記領収書画像の上端を省略し前記明細領域の一部または全部を含む領域を前記表示部に表示させる。
画像処理装置の構成を簡易的に示す図。 第1実施形態にかかる処理を示すフローチャート。 領収書の一例を示す図。 設定画面の一例を示す図。 図5Aは領収書表示欄における領収書画像の表示態様の一例を示す図、図5Bは領収書表示欄における領収書画像の表示態様の別の例を示す図。 図6Aは領収書画像の従来の表示態様の一例を示す図、図6Bは領収書画像の従来の表示態様の別の例を示す図。 第2実施形態にかかる処理を示すフローチャート。 第3実施形態にかかる設定画面を例示する図。 第4および第5実施形態にかかる設定画面を例示する図。
以下、各図を参照しながら本発明の実施形態を説明する。なお各図は、本実施形態を説明するための例示に過ぎない。
1.装置構成の概略的説明:
図1は、本実施形態にかかる画像処理装置10の構成を簡易的に示している。画像処理装置10は、原稿を光学的に読み取って読取結果としての所定のフォーマットの画像データを生成し当該画像データを外部へ出力する読取装置(スキャナー30)と、通信可能に接続する。スキャナー30は、公知の製品を含めて画像読取装置として機能する装置であればよい。
画像処理装置10は、例えば、パーソナルコンピューター(PC)、スマートフォン、タブレット型端末、携帯電話機、或いはそれらと同程度の処理能力を有する情報処理装置によって実現される。また、本実施形態にかかる制御部11および表示部12を実現可能なハードウェアを画像処理装置と呼んでもよい。
画像処理装置10は、制御部11、表示部12、操作受付部13、通信インターフェイス(IF)14、記憶部15等を備える。制御部11は、プロセッサー(例えばCPU11a。ASICやASICとCPU等の協働であってもよい。)、ROM11b、RAM11c等を有する1つ又は複数のICや、その他のメモリー等を適宜含んで構成される。記憶部15は、例えば、ハードディスクドライブ(HDD)やフラッシュメモリー等の不揮発性の記憶装置である。記憶部15は、制御部11の一部であってもよい。
制御部11では、プロセッサー(CPU11a)が、ROM11bや記憶部15等に保存されたプログラムに従った演算処理を、RAM11c等をワークエリアとして用いて実行することにより、画像処理装置10を制御する。制御部11はプログラムの一つとしてプログラムAを搭載しており、プログラムAに従って、データ取得部20、明細領域特定部21、表示制御部22等といった各機能を実現する。プログラムAは、領収書の読み取りにより生成された領収書画像に対する処理をコンピューターに実行させる画像処理プログラムである。また、プログラムAは、領収書画像の保存や管理を実行するためのアプリケーションである。
通信IF14は、公知の通信規格を含む所定の通信プロトコルに準拠して有線あるいは無線で外部と通信を実行するIFである。図1の例では、画像処理装置10は、通信IF14を介してスキャナー30と接続している。画像処理部10は、通信IF14あるいは不図示の別の通信IFを介して、外部のネットワークに接続することも可能であり、制御部11は、例えば、前記ネットワーク(ローカルエリアネットワークやインターネット通信網等)を通じて、図示しない外部のサーバーに、スキャナー30から取得した画像データをアップロードすることも可能である。
表示部12は、視覚的情報を表示するための手段であり、例えば、液晶ディスプレイ(LCD)や、有機ELディスプレイ等により構成される。表示部12は、ディスプレイと、ディスプレイを駆動するための駆動回路とを含む構成であってもよい。操作受付部13は、ユーザーによる操作を受け付けるための手段であり、例えば、物理的なボタンや、タッチパネルや、マウスや、キーボード等によって実現される。むろん、タッチパネルは、表示部12の一機能として実現されるとしてもよい。また、表示部12および操作受付部13を含めて操作パネル等と呼ぶことができる。
操作受付部13、記憶部15等の図1に示した一部の構成は、画像処理装置10に外付けされた周辺機器であってもよい。また、図1に示した画像処理装置10とスキャナー30とを含んだ構成を1つのシステムとして捉えることも可能である。あるいは、画像処理装置10とスキャナー30とは、実態としてそれら全体が1つの装置に含まれていてもよい。画像処理装置10とスキャナー30とが1つの装置に含まれている場合、そのような1つの装置を読取装置等と呼ぶことができる。また、画像処理装置10とスキャナー30とを含む構成は、プリンター(コピー機)やファクシミリ等としての複数の機能を併せ持った複合機であってもよい。
2.領収書画像の表示処理:
図2は、制御部11がプログラムAに従って実行する処理をフローチャートにより示している。図2のフローチャートは、領収書画像を表示する処理を含んでいる。図2のフローチャートに従って説明する実施形態を第1実施形態とも呼ぶ。
スキャナー30は、ユーザーが任意にセットした原稿を読み取ることにより画像データを生成する。本実施形態では、ユーザーがスキャナー30に読み取らせる原稿は、ユーザーが買い物をした店舗により発行された領収書40であるとする。スキャナー30は、領収書40の読取結果としての画像データを、画像処理装置10へ送信する。本実施形態では、領収書40の読取結果としての画像データを、領収書画像と呼ぶ。制御部11は、通信IF14を介してスキャナー30へ原稿の読取開始を指示し、スキャナー30は、制御部11からの読取開始の指示に従って原稿(領収書40)の読み取りを開始するとしてもよい。
図3は、ユーザーがスキャナー30に読み取らせた領収書40の例を示している。領収書40には、領収書40の発行元である店名、発行の日付、店舗の連絡先、ユーザーが購入した物やサービス毎の金額(品目別金額)、ユーザーが支払った合計金額等が記載されている。その他にも、領収書40には、広告や各種アンケート、ユーザーが保有するポイント数等の様々な情報が記載されることがある。
データ取得部20は、上述のようにスキャナー30から送信された領収書画像を、通信IF14を介して取得する(ステップS100)。なお、データ取得部20は、スキャナー30から直接に領収書画像を取得(受信)するのではなく、スキャナー30から領収書画像が転送された転送先としての記憶部(例えば、記憶部15)から領収書画像を取得するとしてもよい。
明細領域特定部21は、ステップS100でデータ取得部20により取得された領収書画像を対象として、文字認識(OCR:Optical Character Recognition/Reader)を実行することにより、領収書画像に含まれている文字列を認識する(ステップS110)。この場合、明細領域特定部21は、領収書画像に含まれている文字列と認識可能な対象を文字データ(テキストデータ)に変換する。文字認識処理は、公知の技術であるため説明は省略する。
ステップS120では、明細領域特定部21は、ステップS110において認識した領収書画像に含まれている文字列(以下、画像内文字列)に基づいて、領収書画像内の明細領域を特定する。明細領域とは、店名や品目別金額や合計金額等といった所定の項目毎の文字列が記載された領域である。明細領域特定部21は、このような明細領域に含まれる項目別の文字列を画像内文字列から抽出し、領収書画像内の、前記抽出した文字列が記載されている領域を明細領域として特定する。
より具体的には、明細領域特定部21は、画像内文字列の中から、所定の第1項目に該当する第1文字列と所定の第2項目に該当する第2文字列とを抽出し、領収書画像内の第1文字列から第2文字列までの領域を明細領域に特定する。領収書においては、多くの場合、店名と合計金額との間に、品目別金額が記載されている。そこで、一例として、第1項目は店名であり、第2項目は合計金額であるとする。
明細領域特定部21は、例えば、記憶部15等に予め記憶された店名リストを参照し、画像内文字列の中から、店名リストに含まれている何れか一つの店名と一致したり店名リストに含まれている何れか一つの店名を含んだりしている文字列を、第1項目(店名)に該当する第1文字列として抽出する。店名リストには、例えば、過去にプログラムAの機能により領収書画像とともに保存された店名が記録されている。また、明細領域特定部21は、画像内文字列の中から、例えば「合計」や「total」や「売上額」等といった特定のワードと、特定のワードに続いて記載されている金額を示す数字と、を含んだ文字列を、第2項目(合計金額)に該当する第2文字列として抽出する。明細領域特定部21は、画像内文字列のうち、物やサービスの名称と金額を示す数字との組み合わせが領収書画像の上下方向に並列する範囲を、品目別金額を表す文字列として抽出することもできる。そして、明細領域特定部21は、第1文字列を明細の先頭行とし、第2文字列を明細の最終行とし、領収書画像内における明細の先頭行から最終行までの領域を明細領域に特定する。図3を参照すると、領収書40内の、店名「XYZ Mart」と記載された行から「合計 \5,550」と記載された行までの範囲41が、領収書画像内の明細領域に対応する。
ステップS130では、表示制御部22は、領収書画像のうち領収書画像の上端を省略しステップS120で特定された明細領域の一部または全部を含む領域を、表示部12に表示させる。ステップS130で表示部12に表示させる領収書画像の領域を、便宜上、「対象領域」とも呼ぶ。
図4は、表示制御部22がステップS130で表示部12に表示させる設定画面50の一例を示している。設定画面50は、領収書画像を表示するための領収書表示欄51、明細領域に含まれる複数の項目の文字列を表示するための明細表示欄52、保存用ボタン(OKボタン)55等を含んでいる。領収書表示欄51には、ステップS100で取得された領収書画像IMが表示される。ユーザーは、スキャナー30に読み取らせた領収書40を、領収書表示欄51を通じて視認することができる。ただしステップS130では、領収書表示欄51には、領収書画像IMのうちの対象領域IM3が表示される。
明細表示欄52には、領収書の発行元(店名や事業者名等)を設定するための発行元設定欄53や、領収書の発行の日付を設定するための発行日設定欄54や、その他、代金の支払方法、税金の額、代金の合計金額、等をそれぞれ設定するための各設定欄が含まれている。ユーザーは、操作受付部13等を操作して、明細表示欄52の各設定欄に対して任意に入力や編集を行うことができる。また、制御部11は、ステップS110において認識した画像内文字列から店名や日付や合計金額等の各種情報(文字列)を抽出し、抽出した各文字列を明細表示欄52の対応する各設定欄に自動的に表示するとしてもよい。
このような設定画面50が表示部12に表示されることが、対象領域IM3が表示部12に表示されることに該当する。ユーザーの視点に立てば、設定画面50が表示部12に表示された時点で、領収書表示欄51には、領収書画像IMのうちの対象領域IM3が表示されている。
図5Aおよび図5Bはそれぞれ、表示制御部22がステップS130で表示部12に設定画面50を表示させた時点での領収書表示欄51を抜き出して例示している。表示制御部22は、図5A,5Bの表示態様のいずれを採用してもよい。
図5Aは、上下方向を長辺とする領収書画像IMの短辺(横方向を向く辺)が領収書表示欄51の短辺(横方向を向く辺)に一致するサイズで領収書画像IMの一部を領収書表示欄51に表示した例である。
一方、図5Bは、領収書画像IMの上下方向における明細領域IM1の上端E1から下端E2までの範囲が領収書表示欄51の長辺(上下方向を向く辺)に一致するサイズで領収書画像IMの一部を領収書表示欄51に表示した例である。
図5Aや、後述の図6A,6Bでは、説明の便宜上、明細領域IM1の上端E1や下端E2の位置を2点鎖線で示しているが、このような上端E1、上端E2を示す2点鎖線が実際に領収書40に存在している訳ではない。
図5Aにおいては、領収書表示欄51に表示されている画像のうち上端E1よりも上側の画像は、領収書画像IMのうちステップS120で特定された明細領域IM1に該当しない非明細領域IM2の一部である。図5Aにおいて、領収書表示欄51に表示されている画像のうち非明細領域IM2以外の画像は、ステップS120で特定された明細領域IM1の一部に該当する。図5Aにおいては、領収書表示欄51に表示されている非明細領域IM2は、明細領域IM1の上端E1近傍のごく一部であり、領収書画像IMの上端EUを含まない画像である。
従って、図5Aに示す領収書表示欄51内の画像は、領収書画像IMのうち上端EUを省略しステップS120で特定された明細領域IM1の一部または全部を含む領域(対象領域IM3)、の一例に該当する。ちなみに、図5Aの領収書表示欄51内の画像は、図4の領収書表示欄51内の画像と同じものである。図5Aの領収書表示欄51内の画像のうち非明細領域IM2をグレー色で表現している理由については後述する。
表示制御部22はステップS130において、図5Aのように、領収書画像IMの短辺が領収書表示欄51の短辺に一致するサイズで領収書画像IMの一部を領収書表示欄51に表示させる場合、明細領域IM1の上端E1の位置を領収書表示欄51の上端に一致させて、上端E1よりも上側の非明細領域IM2を領収書表示欄51に表示させないようにしてもよい。このように、明細領域IM1の上端E1を領収書表示欄51の上端に一致させた状態の領収書表示欄51内の画像も、領収書画像IMのうち上端EUを省略しステップS120で特定された明細領域IM1の一部または全部を含む領域(対象領域IM3)、に該当する。
図5Bにおいては、明細領域IM1の上端E1が領収書表示欄51の上端に一致し、明細領域IM1の下端E2が領収書表示欄51の下端に一致しており、その結果、領収書表示欄51には明細領域IM1の全体が表示されている。従って、図5Bに示す領収書表示欄51内の画像も、領収書画像IMのうち上端EUを省略しステップS120で特定された明細領域IM1の一部または全部を含む領域(対象領域IM3)、に該当する。
つまり対象領域IM3は、領収書画像IMの上端EUを含まず且つ明細領域IM1の一部または全部を含むという条件を満たす、領収書画像IMの一部領域であり、明細領域IM1全体であったり、明細領域IM1の一部であったり、明細領域IM1全体および非明細領域IM2の一部であったり、明細領域IM1の一部および非明細領域IM2の一部であったりする。また、本実施形態の一態様として、対象領域IM3を、明細領域IM1の一部または全部を含む領域であって領収書画像IMの上端EUを含まず且つ明細領域IM1の上端E1を含む領域、と定義してもよい。
図6Aおよび図6Bは、表示部12における領収書画像IMの従来の表示態様をそれぞれ例示している。従来、領収書画像に対する処理を行うためのアプリケーションは、領収書画像IMの短辺が領収書表示欄51の短辺に一致するサイズで領収書画像IMの一部を領収書表示欄51に表示させる場合、図6Aのように、領収書画像IMの上端EUの位置を領収書表示欄51の上端に一致させて表示していた。つまり、領収書画像IMの上端EUが表示されていた。そのため、領収書表示欄51の大部分あるいは全てを明細領域IM1の上側の非明細領域IM2が占めることとなり、ユーザーは、画面上で明細領域IM1を確認するには領収書表示欄51内の画像を下方向へスクロールする操作をして明細領域IM1を表示させる必要があった。
また従来、領収書画像に対する処理を行うためのアプリケーションは、図6Bのように、領収書画像IMの上端EUの位置を領収書表示欄51の上端に一致させ、かつ領収書画像IMの下端の位置を領収書表示欄51の下端に一致させて、領収書画像IMの全体を領収書表示欄51に表示させていた。このような場合、領収書画像IMの一部である明細領域(上端E1から下端E2までの領域)は、領収書表示欄51の中で相対的に小さく見え辛い状態であり、ユーザーは、画面上で明細領域IM1を確認するには領収書表示欄51内の画像の表示倍率を上げる操作をする必要があった。
このような従来例(図6A,6B)に対して、本実施形態では、図4、図5A,5Bの例のように、ステップS130で設定画面50が表示部12に表示された時点で、領収書表示欄51には明細領域IM1の大部分あるいは全てが表示されている。また、図6Bに示した領収書画像IMの全体を表示させる態様と比較したとき、本実施形態では、明細領域IM1は拡大表示されている。そのためユーザーは、煩雑な操作をすることなく、領収書表示欄51を通じて領収書画像IMの明細領域IM1を容易に視認することができる。
上述のように設定画面50を表示部12に表示させた状態で、表示制御部22は、操作受付部13を介してユーザーによる任意の操作を受け付けた場合には、受け付けた操作に応じた表示制御を行う(ステップS140)。例えば、表示制御部22は、明細表示欄52の各設定欄に対する文字入力を受け付けた場合に、受け付けた文字入力に応じて各設定欄に文字列を表示する。また、表示制御部22は、領収書表示欄51とともに表示したスクロールバーSB(図5参照)への操作を受け付けたとき、スクロールバーSBの操作に応じて領収書表示欄51内の表示をスクロールする。
制御部11は、設定画面50に対する設定入力を終了させる所定の操作、例えばOKボタン55の操作をユーザーから受け付けた場合に、ステップS100で取得した領収書画像をファイルとして記憶部15等に保存し(ステップS150)、設定画面50を閉じて、図2のフローチャートを終了する。制御部11は、領収書画像をファイルとして保存する際、明細表示欄52の各設定欄における現在の設定内容(表示内容)と共に保存する。ユーザーは、領収書画像とともに保存した設定内容については、再び設定画面50を開くことで随時編集することが可能である。
このように本実施形態によれば、画像処理装置10は、領収書40の読み取りにより生成された領収書画像を取得し(ステップS100)、領収書画像を表示部12に表示させる制御部11を備える。制御部11は、プログラムAに従うことにより、文字認識により領収書画像に含まれている文字列(画像内文字列)を認識し(ステップS110)、画像内文字列に基づいて領収書画像内の明細領域を特定し(ステップS120)、領収書画像のうち領収書画像の上端を省略し明細領域の一部または全部を含む領域(対象領域)を表示部12に表示させる(ステップS130)。この結果、領収書画像内でユーザーにとって重要な領域である明細領域が視認し易い状態で表示部12に表示され、ユーザーは明細領域を容易に確認することが可能となる。
また、本実施形態によれば、制御部11は、画像内文字列の中から所定の第1項目(例えば、店名)に該当する第1文字列と所定の第2項目(例えば、合計金額)に該当する第2文字列とを抽出し、領収書画像内の第1文字列から第2文字列までの領域を明細領域に特定する(ステップS120)。当該構成によれば、制御部11は、明細領域に含まれる所定の複数の項目の文字列を抽出することにより、容易に明細領域を特定することができる。
また、本実施形態によれば、制御部11は、領収書画像を表示するための領収書表示欄51と、明細領域に含まれる複数の項目の文字列を表示するための明細表示欄52とを含んだ設定画面50を表示部12に表示させる。当該構成によれば、ユーザーは、領収書画像内の明細領域の確認と、領収書40の発行元や発行日等の各項目の設定とを一画面で行うことができる。
ただし、図4や後述する図8,9は、領収書画像の一部である対象領域を表示する画面の例に過ぎない。対象領域を表示する画面のレイアウトやデザインや役割は様々であり、領収書表示欄51と明細表示欄52とは互いに異なる画面に表示されるとしてもよい。
これまでの説明から明らかなように、画像処理プログラムとしてのプログラムAは、領収書画像を表示部12に表示させる制御機能をプロセッサーに実行させる。また、本実施形態は、画像処理プログラムによる処理に相当する方法や、画像処理プログラムを記憶したコンピューター読み取り可能な記憶媒体も開示していると言える。
本実施形態は、上述した態様だけでなく後述するような種々の態様を含む。各実施形態を組み合わせた構成も本明細書による開示範囲に含まれる。以下では、既に説明した事項と共通する事項については説明を適宜省略する。
3.第2実施形態:
制御部11は、領収書画像の全体を表示部12に表示させる全体表示と、対象領域を表示部12に表示させる一部表示とを実行可能であり、外部からの指示に従って全体表示又は一部表示を実行する、としてもよい。
図7は、制御部11がプログラムAに従って実行する第2実施形態にかかる処理をフローチャートにより示している。図7のフローチャートを実行する前提として、制御部11は、ユーザーからの指示に従って、一部表示モードと全体表示モードとのいずれか一方を有効化している。一部表示モードを有効化した状態では全体表示モードは無効であり、逆に、全体表示モードを有効化した状態では一部表示モードは無効である。本実施形態では、制御部11は、デフォルトの設定では一部表示モードを有効化している。従って、ユーザーが全体表示モードを有効化する指示をしない限り、一部表示モードが有効な状態である。
図7のフローチャートは、図2のフローチャートと比較したとき、ステップS115,S135を含んでいる点で異なる。ステップS110の後、制御部11は、現在、一部表示モードが有効であるか否かを判定し(ステップS115)、一部表示モードが有効であればステップS115からステップS120へ進む。一方、制御部11は、一部表示モードが無効、つまり全体表示モードが有効であれば、ステップS115からステップS135へ進む。
ステップS135では、表示制御部22は、ステップS100で取得された領収書画像の全体を表示部12に表示させる。つまり、表示制御部22は、図6Bに例示したように、設定画面50の領収書表示欄51に、領収書画像IMの全体を表示させる。このような第2実施形態によれば、ユーザーの自由な選択に応じて、制御部11は、領収書画像の全体を表示部12に表示させたり、対象領域を表示部12に表示させたりすることができる。
なお、後述する第3~第5実施形態は、第2実施形態と組み合わせた場合は、全て一部表示モードが有効化されている状態での実施形態である。
4.第3実施形態:
制御部11は、スクロールバーSBを表示部12に表示させる。そして、制御部11は、スクロールバーSBの明細領域に対応する範囲と、スクロールバーSBの領収書画像内の明細領域以外の領域(非明細領域)に対応する範囲とを異なる態様で表示させる、としてもよい。
図8は、第3実施形態においてステップS130で表示部12に表示される設定画面50を例示している。設定画面50内において、領収書表示欄51には併せてスクロールバーSBが表示されている。図8に示すスクロールバーSBは、領収書表示欄51内の画像を上下方向にスクロールさせるためのGUI(Graphical User Interface)である。ユーザーは、操作受付部13を操作してスクロールバーSBのエリアの中でノブSBNを上下に動かすことで、領収書表示欄51内の画像を上下方向にスクロールさせる。ノブSBNが移動可能なスクロールバーSBのエリアの長さに対するノブSBNの長さの比率は、領収書画像の上下方向の長さに対する領収書表示欄51に表示される画像の上下方向の長さの比率を表している。
表示制御部22は、例えば、ノブSBNが移動可能なスクロールバーSBのエリア内のうち非明細領域に対応する範囲NHを、明細領域に対応する範囲よりも暗い色で表示する。言い換えると、表示制御部22は、ノブSBNが移動可能なスクロールバーSBのエリア内のうち明細領域に対応する範囲を、非明細領域に対応する範囲NHよりも明るい色で表示する。このような構成とすれば、ユーザーはノブSBNをスクロールバーSBのエリア内のどの位置へ移動させれば明細領域が領収書表示欄51内に表示されるかを直感的に理解することができるため、領収書表示欄51を通じて明細領域を確認したいユーザーの助けとなる。
5.第4実施形態:
制御部11は、明細領域に含まれる複数の項目のうち予め選択されていない項目に該当する文字列を省略して生成した領域を、表示部12に表示させるとしてもよい。明細領域に含まれる複数の項目とは、上述したように、店名や品目別金額や合計金額等である。一例として、ユーザーは、操作受付部13を操作して、領収書表示欄51に表示すべき明細領域内の項目として、店名および合計金額を選択し、品目別金額を選択せず、この選択結果を制御部11に指示済みであるとする。
図9は、第4実施形態においてステップS130で表示部12に表示される設定画面50を例示している。設定画面50内の領収書表示欄51には、領収書画像IMのうち領収書画像IMの上端を省略し明細領域の一部(後述する再生成した明細領域)を含む対象領域IM3´が表示される。表示制御部22は、ステップS120で明細領域を特定する過程で画像内文字列から抽出した項目毎の文字列のうち、上述のようにユーザーにより選択されている項目(店名および合計金額)の文字列を含む行を残し、ユーザーにより選択されていない項目(品目別金額)の文字列を省いて明細領域の画像を再生成する。そして、表示制御部22は、上下の非明細領域の間に前記再生成した明細領域の画像を挟んで結合した領収書画像(再生成後の領収書画像)に基づいて、領収書表示欄51内の表示を行う。この結果、図9に示したような対象領域IM3´が領収書表示欄51内に表示される。図9に示した対象領域IM3´は、店名としての文字列「XYZ Mart」および合計金額の文字列だけを含んだ再生成後の明細領域、を含んだ画像である。
このような第4実施形態によれば、明細領域内の項目としてユーザーが予め選択した項目にかかる文字列だけを含んだ明細領域が領収書表示欄51に表示されるため、ユーザーは、上下に長い領収書40の中の自身が確認したい項目を、領収書表示欄51を通じて効率的に確認することができる。なお、第4実施形態において、上述のような再生成した明細領域は、あくまで表示部12を通じてユーザーに視認させるための画像である。制御部11は、ステップS150では、前記再生成する前の明細領域、つまりユーザーが選択しなかった項目(品目別金額)の文字列を省く前の明細領域を含んだ領収書画像をファイルとして保存すればよい。
6.第5実施形態:
制御部11は、明細領域を領収書画像内の明細領域以外の領域(非明細領域)と異なる態様で表示部12に表示させるとしてもよい。図9では、領収書表示欄51内の対象領域IM3´のうち非明細領域については、一例としてグレー色で表現している。また、図5Aでは、領収書表示欄51内の画像(つまり対象領域IM3)のうち非明細領域IM2をグレー色で表現している。このようなグレー色は、表示制御部22が、ステップS130の処理において、非明細領域をグレーアウト表示していることを示している。むろん、非明細領域をグレーアウト表示することは一例であり、表示制御部22は、領収書表示欄51内で、非明細領域を白画像に置換して実質的に表示しないようにしてもよい。また、表示制御部22は、領収書表示欄51内で、明細領域の明るさや色を変更することで、明細領域を非明細領域より目立たせるとしてもよい。このような第5実施形態によれば、ユーザーは、表示部12を通じて領収書画像内の明細領域を明確に認識することができる。
7.第6実施形態:
制御部11は、領収書画像から明細領域の画像を分割し、分割した明細領域の画像を記憶部(例えば、記憶部15)に記憶させるとしてもよい。つまり、制御部11は、ステップS150において、ステップS100で取得した領収書画像をファイルとして保存する際、領収書画像の全体を保存するのではなく、領収書画像からステップS120で特定した明細領域を分割し、明細領域の画像だけを、明細表示欄52の各設定欄における設定内容と共に保存する。このような第6実施形態によれば、領収書画像の保存に要する記憶容量の消費を抑えることができる。
10…画像処理装置、11…制御部、12…表示部、13…操作受付部、14…通信IF、15…記憶部、20…データ取得部、21…明細領域特定部、22…表示制御部、30…スキャナー、40…原稿、50…設定画面、51…領収書表示欄、52…明細表示欄、A…プログラム

Claims (9)

  1. 領収書の読み取りにより生成された領収書画像を取得する制御部と、
    前記領収書画像を表示する表示部と、を備え、
    前記制御部は、文字認識により前記領収書画像に含まれている文字列を認識し、前記領収書画像に含まれている文字列に基づいて前記領収書画像内の明細領域を特定し、前記領収書画像のうち前記領収書画像の上端を省略し、前記明細領域に含まれる複数の項目のうち、予め選択された項目である選択項目が複数あるとき、前記選択項目に該当する文字列を前記選択項目毎に抽出し、抽出された文字列毎に生成した複数の領域を結合して再生成された1つの領域を前記表示部に表示させることを特徴とする画像処理装置。
  2. 前記制御部は、前記領収書画像に含まれている文字列の中から、所定の第1項目に該当
    する第1文字列と所定の第2項目に該当する第2文字列とを抽出し、前記領収書画像内の
    前記第1文字列から前記第2文字列までの領域を前記明細領域に特定することを特徴とす
    る請求項1に記載の画像処理装置。
  3. 前記第1項目は店名であり、前記第2項目は合計金額であることを特徴とする請求項2
    に記載の画像処理装置。
  4. 前記制御部は、スクロールバーを前記表示部に表示させ、前記スクロールバーの前記明
    細領域に対応する範囲と、前記スクロールバーの前記領収書画像内の前記明細領域以外の
    領域に対応する範囲とを異なる態様で表示させることを特徴とする請求項1~請求項
    いずれかに記載の画像処理装置。
  5. 前記制御部は、前記明細領域を前記領収書画像内の前記明細領域以外の領域と異なる態
    様で前記表示部に表示させることを特徴とする請求項1~請求項のいずれかに記載の画
    像処理装置。
  6. 前記制御部は、前記領収書画像の全体を前記表示部に表示させる全体表示と、前記領収
    書画像のうち前記上端を省略し前記明細領域の一部または全部を含む領域を前記表示部に
    表示させる一部表示とを実行可能であり、外部からの指示に従って前記全体表示又は前記
    一部表示を実行することを特徴とする請求項1~請求項のいずれかに記載の画像処理装
    置。
  7. 前記制御部は、前記領収書画像を表示するための領収書表示欄と、前記明細領域に含ま
    れる複数の項目の文字列を表示するための明細表示欄とを含んだ画面を前記表示部に表示
    させることを特徴とする請求項1~請求項のいずれかに記載の画像処理装置。
  8. 前記制御部は、前記領収書画像から前記明細領域の画像を分割し、前記分割した前記明
    細領域の画像を記憶部に記憶させることを特徴とする請求項1~請求項のいずれかに記
    載の画像処理装置。
  9. 領収書の読み取りにより生成された領収書画像に対する処理をコンピューターに実行さ
    せる画像処理プログラムであって、
    前記領収書画像を表示部に表示させる制御機能を実行させ、
    前記制御機能は、文字認識により前記領収書画像に含まれている文字列を認識し、前記
    領収書画像に含まれている文字列に基づいて前記領収書画像内の明細領域を特定し、前記
    領収書画像のうち前記領収書画像の上端を省略し、前記明細領域に含まれる複数の項目のうち、予め選択された項目である選択項目が複数あるとき、前記選択項目に該当する文字列を前記選択項目毎に抽出し、抽出された文字列毎に生成した複数の領域を結合して再生成された1つの領域を前記表示部に表示させることを特徴とする画像処理プログラム。
JP2018014569A 2018-01-31 2018-01-31 画像処理装置および画像処理プログラム Active JP7081179B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2018014569A JP7081179B2 (ja) 2018-01-31 2018-01-31 画像処理装置および画像処理プログラム
CN201910089598.9A CN110097057B (zh) 2018-01-31 2019-01-30 图像处理装置以及存储介质
US16/262,390 US20190236351A1 (en) 2018-01-31 2019-01-30 Image processing apparatus and image processing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018014569A JP7081179B2 (ja) 2018-01-31 2018-01-31 画像処理装置および画像処理プログラム

Publications (2)

Publication Number Publication Date
JP2019133379A JP2019133379A (ja) 2019-08-08
JP7081179B2 true JP7081179B2 (ja) 2022-06-07

Family

ID=67391483

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018014569A Active JP7081179B2 (ja) 2018-01-31 2018-01-31 画像処理装置および画像処理プログラム

Country Status (3)

Country Link
US (1) US20190236351A1 (ja)
JP (1) JP7081179B2 (ja)
CN (1) CN110097057B (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019159875A (ja) * 2018-03-14 2019-09-19 セイコーエプソン株式会社 スキャン装置およびスキャン結果表示プログラム
WO2021102850A1 (zh) * 2019-11-28 2021-06-03 京东方科技集团股份有限公司 图片识别的用户界面系统、电子设备及交互方法
JP7380319B2 (ja) * 2020-02-26 2023-11-15 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012043204A (ja) 2010-08-19 2012-03-01 Konica Minolta Business Technologies Inc 画像処理装置、コンテンツ処理方法およびコンテンツ処理プログラム
JP2014137605A (ja) 2013-01-15 2014-07-28 Fujitsu Marketing Ltd レシート定義データ作成装置およびそのプログラム
JP2015049656A (ja) 2013-08-30 2015-03-16 キヤノン株式会社 情報処理装置、方法及びプログラム
JP2015060448A (ja) 2013-09-19 2015-03-30 株式会社Pfu 画像処理装置、画像処理方法及びコンピュータプログラム
JP2016126356A (ja) 2014-12-26 2016-07-11 ブラザー工業株式会社 画像処理プログラム、画像処理方法、及び画像処理装置
JP2016167192A (ja) 2015-03-10 2016-09-15 ブラザー工業株式会社 情報処理装置,画像読取装置,および画像表示方法
US20160307034A1 (en) 2015-04-14 2016-10-20 Microsoft Technology Licensing, Llc Digital image manipulation

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10275196A (ja) * 1997-03-28 1998-10-13 Sanyo Electric Co Ltd データ入力装置
US6646765B1 (en) * 1999-02-19 2003-11-11 Hewlett-Packard Development Company, L.P. Selective document scanning method and apparatus
US8832590B1 (en) * 2007-08-31 2014-09-09 Google Inc. Dynamically modifying user interface elements
EP2256568A4 (en) * 2008-03-10 2013-01-09 Nippon Steel Corp OPERATIONAL SUPPORT DEVICE, OPERATIONAL SUPPORT PROCESS AND COMPUTER PROGRAM
EP2104024B1 (en) * 2008-03-20 2018-05-02 LG Electronics Inc. Portable terminal capable of sensing proximity touch and method for controlling screen using the same
JP4677039B2 (ja) * 2009-04-08 2011-04-27 東芝テック株式会社 注文受付装置およびプログラム
JP5385349B2 (ja) * 2011-08-15 2014-01-08 株式会社富士通マーケティング レシート定義データ作成装置およびそのプログラム
US9245296B2 (en) * 2012-03-01 2016-01-26 Ricoh Company Ltd. Expense report system with receipt image processing
KR101924962B1 (ko) * 2012-10-04 2018-12-04 엘지전자 주식회사 이동 단말기, 홈 어플라이언스 및 그 동작방법
US9547668B2 (en) * 2012-10-29 2017-01-17 Dropbox, Inc. Event-based content item view
JP2017162078A (ja) * 2016-03-08 2017-09-14 グローリー株式会社 取引処理装置及び取引処理システム

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012043204A (ja) 2010-08-19 2012-03-01 Konica Minolta Business Technologies Inc 画像処理装置、コンテンツ処理方法およびコンテンツ処理プログラム
JP2014137605A (ja) 2013-01-15 2014-07-28 Fujitsu Marketing Ltd レシート定義データ作成装置およびそのプログラム
JP2015049656A (ja) 2013-08-30 2015-03-16 キヤノン株式会社 情報処理装置、方法及びプログラム
JP2015060448A (ja) 2013-09-19 2015-03-30 株式会社Pfu 画像処理装置、画像処理方法及びコンピュータプログラム
JP2016126356A (ja) 2014-12-26 2016-07-11 ブラザー工業株式会社 画像処理プログラム、画像処理方法、及び画像処理装置
JP2016167192A (ja) 2015-03-10 2016-09-15 ブラザー工業株式会社 情報処理装置,画像読取装置,および画像表示方法
US20160307034A1 (en) 2015-04-14 2016-10-20 Microsoft Technology Licensing, Llc Digital image manipulation

Also Published As

Publication number Publication date
CN110097057B (zh) 2023-01-06
JP2019133379A (ja) 2019-08-08
CN110097057A (zh) 2019-08-06
US20190236351A1 (en) 2019-08-01

Similar Documents

Publication Publication Date Title
US7577919B2 (en) User interface apparatus, method, and computer readable recording medium for interacting with child windows in an application window
US10108584B2 (en) Host apparatus and screen capture control method thereof
JP7081179B2 (ja) 画像処理装置および画像処理プログラム
JP4821529B2 (ja) 画像表示装置およびプログラム
US9154655B2 (en) Image forming apparatus and method for displaying preview image, and server and method for providing preview image
US10909361B2 (en) Receipt processing apparatus, program, and report production method
US11288500B2 (en) Scan apparatus and scan result display program
US10481776B2 (en) Server apparatus, client apparatus, information processing method, and storage medium
JP2019115011A (ja) 画像処理装置および画像処理プログラム
JP2006209177A (ja) 画面表示プログラム及びその提供方法並びにその提供サーバ
JP7040000B2 (ja) 画像処理装置および画像処理プログラム
JP7032692B2 (ja) 画像処理装置および画像処理プログラム
JP5788447B2 (ja) 保険証券の情報取得システム
US11025790B2 (en) Image forming apparatus, image forming method, and non-transitory computer readable medium
CN113989119A (zh) 图像处理方法、装置、电子设备、介质和程序
JP7314528B2 (ja) 情報処理装置及びプログラム
CN113497860A (zh) 提供属性信息的图像处理系统、图像处理方法及存储介质
KR20160057845A (ko) 이미지 필터 처리를 위한 컴퓨터 구현 방법
JP2020047185A (ja) 情報処理装置およびプログラム
JP7424460B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP6086095B2 (ja) 画像送信装置およびプログラム
JP5657041B2 (ja) 情報処理装置、方法及びプログラム
JP2023102881A (ja) ファイル保存システム、ファイル保存システムのプログラム
US20120185760A1 (en) Data-processing device, data-processing method, program, and computer-readable medium
JP2018181125A (ja) 情報提供システム

Legal Events

Date Code Title Description
RD05 Notification of revocation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7425

Effective date: 20180910

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20181121

RD07 Notification of extinguishment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7427

Effective date: 20200807

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201204

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20210916

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20211021

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20211108

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211116

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211209

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220426

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220509

R150 Certificate of patent or registration of utility model

Ref document number: 7081179

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150