JP7337553B2 - 画像処理装置、画像処理方法及びプログラム - Google Patents

画像処理装置、画像処理方法及びプログラム Download PDF

Info

Publication number
JP7337553B2
JP7337553B2 JP2019103759A JP2019103759A JP7337553B2 JP 7337553 B2 JP7337553 B2 JP 7337553B2 JP 2019103759 A JP2019103759 A JP 2019103759A JP 2019103759 A JP2019103759 A JP 2019103759A JP 7337553 B2 JP7337553 B2 JP 7337553B2
Authority
JP
Japan
Prior art keywords
image
document
character string
image processing
mfp
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019103759A
Other languages
English (en)
Other versions
JP2020198547A (ja
Inventor
啓介 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2019103759A priority Critical patent/JP7337553B2/ja
Priority to US16/884,193 priority patent/US11431860B2/en
Priority to CN202010490072.4A priority patent/CN112036225A/zh
Publication of JP2020198547A publication Critical patent/JP2020198547A/ja
Priority to JP2023134721A priority patent/JP2023157964A/ja
Application granted granted Critical
Publication of JP7337553B2 publication Critical patent/JP7337553B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00405Output means
    • H04N1/00408Display of information to the user, e.g. menus
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00204Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server
    • H04N1/00244Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server with a server, e.g. an internet server
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00002Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
    • H04N1/00005Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for relating to image data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00002Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
    • H04N1/00007Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for relating to particular apparatus or devices
    • H04N1/00018Scanning arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00002Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
    • H04N1/00026Methods therefor
    • H04N1/00037Detecting, i.e. determining the occurrence of a predetermined state
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00002Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
    • H04N1/00026Methods therefor
    • H04N1/00039Analysis, i.e. separating and studying components of a greater whole
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00002Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
    • H04N1/00071Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for characterised by the action taken
    • H04N1/00074Indicating or reporting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00002Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
    • H04N1/00071Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for characterised by the action taken
    • H04N1/00074Indicating or reporting
    • H04N1/00076Indicating or reporting locally
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00002Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
    • H04N1/00071Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for characterised by the action taken
    • H04N1/00082Adjusting or controlling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00002Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
    • H04N1/00092Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for relating to the original or to the reproducing medium, e.g. imperfections or dirt
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00405Output means
    • H04N1/00408Display of information to the user, e.g. menus
    • H04N1/00411Display of information to the user, e.g. menus the display also being used for user input, e.g. touch screen
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00405Output means
    • H04N1/00408Display of information to the user, e.g. menus
    • H04N1/00413Display of information to the user, e.g. menus using menus, i.e. presenting the user with a plurality of selectable options
    • H04N1/00416Multi-level menus
    • H04N1/00419Arrangements for navigating between pages or parts of the menu
    • H04N1/00421Arrangements for navigating between pages or parts of the menu using drop-down menus
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00405Output means
    • H04N1/00408Display of information to the user, e.g. menus
    • H04N1/00413Display of information to the user, e.g. menus using menus, i.e. presenting the user with a plurality of selectable options
    • H04N1/00416Multi-level menus
    • H04N1/00419Arrangements for navigating between pages or parts of the menu
    • H04N1/00424Arrangements for navigating between pages or parts of the menu using a list of graphical elements, e.g. icons or icon bar
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00405Output means
    • H04N1/00474Output means outputting a plurality of functional options, e.g. scan, copy or print
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/0035User-machine interface; Control console
    • H04N1/00405Output means
    • H04N1/00477Indicating status, e.g. of a job
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/04Scanning arrangements, i.e. arrangements for the displacement of active reading or reproducing elements relative to the original or reproducing medium, or vice versa
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/38Circuits or arrangements for blanking or otherwise eliminating unwanted parts of pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • H04N1/3872Repositioning or masking
    • H04N1/3873Repositioning or masking defined only by a limited number of coordinate points or parameters, e.g. corners, centre; for trimming
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • H04N1/393Enlarging or reducing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N2201/00Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
    • H04N2201/0077Types of the still picture apparatus
    • H04N2201/0094Multifunctional device, i.e. a device capable of all of reading, reproducing, copying, facsimile transception, file transception

Description

本発明は、スキャン画像のマルチクロップ処理に関する。
現在、複数の領収書をまとめてスキャンした画像をクラウドサービス上でマルチクロップ処理して領収書単位の画像を取得し、そこから日付や金額といった特定の文字列を抽出して各画像と紐付けてデータベースに登録する経費精算システムが存在する。画像と紐付けて登録される特定文字列は「バリュー情報」とも呼ばれ、ユーザは、データベースにアクセスして登録済みのバリュー情報を確認することができる。そして、バリュー情報が誤って登録されている場合は、それに紐付いている画像を参照して手動で正しい値に修正することも可能である。
特開2017-130811号公報
スキャナ装置にて複数の原稿を同時にスキャンする際、原稿台上に載置した原稿が原稿台カバーを降ろした拍子に動いてしまい、原稿同士が重なってしまうことがある。原稿同士が重なってしまうと、マルチクロップ処理によって原稿単位の正しい画像が得られないので、ユーザは原稿を載置し直して、改めてスキャンを行う必要がある。このような問題に対しては、マルチクロップ処理によってスキャン画像から切り出した画像の中に原稿同士が重なって読み取られた画像が存在する場合に自動で原稿単位の画像に分割する技術が提案されている(特許文献1)。
ここで、載置した領収書に重なりが生じていても日付や金額に関する重要部分が隠れていない場合は、上述の特許文献1の技術を利用することで、分割によって得られた各画像からバリュー情報を抽出することが可能である。また、データベースにアクセスして、登録済みの画像を参照しながら、それに紐付いているバリュー情報の誤りを修正することもできる。しかしながら、原稿同士の重なりによって重要部分が隠れてしまっている場合は、上記特許文献1を適用してスキャン画像を分割しても、得られた画像から必要なバリュー情報を抽出することができない。また、この場合には、データベースにアクセスし、登録済みの画像を参照しながら、それに紐付いているバリュー情報の値を修正することもできない。こうなると、データベース上で登録内容の不備を確認したユーザは、スキャナ装置が設置されている場所まで行って原稿をセットしてスキャンをやり直さなければならない。このような作業はユーザにとって手間であり大きな負担となる。
本開示に係る画像処理装置は、原稿台に載置された複数の原稿をスキャンしてスキャン画像を生成する生成手段と、前記生成手段で生成された前記スキャン画像から前記複数の原稿それぞれに対応する原稿画像を得て各原稿画像から特定の文字列を抽出する解析処理の実行を、画像処理手段に対して指示する指示手段と、前記解析処理の結果に基づき、前記各原稿画像のうち特定の原稿画像に対応する原稿について、前記スキャンの再実行をユーザに促すユーザインタフェース画面を表示手段に表示する表示制御手段と、を備え、前記特定の原稿画像は、前記特定の文字列の抽出に失敗した可能性がある原稿画像である
ことを特徴とする。
本開示の技術によれば、スキャン画像に対しマルチクロップ処理を行って得られた原稿単位の画像と各画像から抽出したバリュー情報とを紐付けてデータベースに登録する際、再スキャンが必要な状況であれば、登録前に再スキャンをユーザに促すことができる。これにより、登録後になって原稿をスキャンし直さなくても済むようになり、ユーザの利便性が向上する。
画像処理システムの全体構成を示す図 MFPのハードウェア構成を示すブロック図 MFP連携サーバ及び経費精算サーバのハードウェア構成を示すブロック図 画像処理システムのソフトウェア構成を示すブロック図 クラウドサービスによって経費精算を行う際の装置間の処理の流れを示すシーケンス図 メイン画面の一例を示す図 ログイン画面の一例を示す図 代理申請対象者リストの一例を示す図 申請者設定画面の一例を示す図 スキャン設定画面の一例を示す図 複数の領収書をスキャンする様子を示す図であり、(a)は原稿台に領収書を裏返して載置した状態を示す図、(b)はそれを原稿台の内部から見た図 (a)はリクエストIDの一例を示す図、(b)は処理中を表すレスポンスの一例を示す図、(c)はエラーを表すレスポンスの一例を示す図 (a)は原稿の重なりが生じてもバリュー情報の抽出に成功するケースの説明図、(b)はバリュー情報の抽出に失敗するケースの説明図 警告画面の一例を示す図 処理完了を表すレスポンスの一例を示す図 メタデータ項目情報の一例を示す図 メタデータ設定画面の一例を示す図 メタデータ設定リクエストと共に送信されるデータの一例を示す図 MFPにおける処理の流れを示すフローチャート MFP連携サーバにおける処理の流れを示すフローチャート バリュー情報抽出処理の流れを示すフローチャート (a) はクロップ画像の中に複数の原稿の画像領域が含まれている場合の一例を示す図、(b)は画像分割を行った場合の一例を示す図 (a)は実施形態1に係る遮蔽判定処理の詳細を示すフローチャート、(b)は実施形態2に係る遮蔽判定処理の詳細を示すフローチャート 実施形態3に係る遮蔽判定処理の詳細を示すフローチャート 原稿の折れによってバリューに相当する文字列が隠れてしまった場合の一例を示す図
以下、本発明を実施するための形態について図面を用いて説明する。なお、以下の実施の形態は特許請求の範囲に係る発明を限定するものでなく、また実施の形態で説明されている特徴の組み合わせの全てが発明の解決手段に必須のものとは限らない。
[実施形態1]
<システム構成>
図1は、本実施形態に係る、画像処理システム100の全体構成を示す図である。画像処理システム100は、MFP(Multi Function Peripheral)110と、インターネット上でクラウドサービスを提供するサーバ装置120及び130とを含む。MFP110は、インターネットを介してサーバ装置120及び130と通信可能に接続されている。
MFP110は、スキャン機能を有する情報処理装置の一例である。MFP110は、スキャン機能に加え印刷機能やBOX保存機能といった複数の機能を有する複合機である。サーバ装置120及び130は、共にクラウドサービスを提供する情報処理装置の一例である。本実施形態のサーバ装置120は、MFP110から受け取ったスキャン画像データに対し所定の画像解析処理を行ったり、別のサービスを提供するサーバ装置130に対しMFP110からのリクエストを転送したりするクラウドサービスを提供する。以下、サーバ装置120が提供するクラウドサービスを「MFP連携サービス」と呼ぶこととする。サーバ装置130は、経費精算を効率的に行うためのクラウドサービス(以下、「経費精算サービス」と呼ぶ。)を提供する。経費精算サービスでは、領収書の画像と当該領収書の日付等の付加情報(メタデータ)を関連付けて保存・管理したり、領収書を受領した本人以外がその電子化作業を行う場合に、当該作業を行う者(代理申請者)を設定したりすることができる。以下、MFP連携サービスを提供するサーバ装置120を「MFP連携サーバ」と呼び、経費精算サービスを提供するサーバ装置130を「経費精算サーバ」と呼ぶこととする。
図1に示す画像処理システム100の構成は一例であって、これに限定されない。例えば、MFP連携サーバ120の機能をMFP110が兼ね備えていてもよい。また、MFP連携サーバ120はインターネット上ではなくLAN(Local Area Network)経由でMFP110と接続されていてもよい。また、本実施形態では、電子化作業の対象文書として領収書を例に説明を行うが、対象文書は領収書に限定されるものではない。
<MFPのハードウェア構成>
図2は、MFP110のハードウェア構成を示すブロック図である。MFP110は、制御部210、操作部220、プリンタ部230及びスキャナ部240で構成される。制御部210は、さらに以下の各部211~218で構成され、MFP110全体の動作を制御する。CPU211は、ROM212に記憶された様々な制御プログラム(後述のソフトウェア構成図で示す各種機能に対応するプログラム)を読み出して実行する。RAM213は、CPU211の主メモリ、ワークエリア等の一時記憶領域として用いられる。なお、本実施例では1つのCPU211が1つのメモリ(RAM213またはHDD214)を用いて後述のフローチャートに示す各処理を実行するものとするが、これに限定されない。例えば、複数のCPUや複数のRAMまたはHDDを協働させて各処理を実行してもよい。HDD214は、画像データや各種プログラムを記憶する大容量記憶部である。操作部I/F215は、操作部220と制御部210とを接続するインタフェースである。操作部220は、タッチパネルやハードキーを備えており、ユーザによる操作/入力/指示を受け付ける。プリンタI/F216は、プリンタ部230と制御部210とを接続するインタフェースである。印刷用の画像データはプリンタI/F216を介して制御部210からプリンタ部230へ転送され、紙等の記録媒体上に印刷される。スキャナI/F217は、スキャナ部240と制御部210とを接続するインタフェースである。スキャナ部240は、不図示の原稿台やADF(Auto Document Feeder)にセットされた原稿をスキャンして得られた画像(スキャン画像)を、スキャナI/F217を介して制御部210に入力する。スキャナ部240で生成されたスキャン画像のデータは、プリンタ部230で印刷したり(コピー出力)、HDD214に保存したり、LANを介して外部装置に送信したりすることができる。ネットワークI/F218は、制御部210(MFP110)をLANに接続するインタフェースである。MFP210は、ネットワークI/F218を用いて、スキャン画像データをMFP連携サーバ120に送信したり、MFP連携サーバ120から各種データを受信したりする。以上説明したMFP110のハードウェア構成は一例であり、必要に応じてその他の構成を備えるものであってもよいし、一部の構成を有していなくてもよい。
<サーバ装置のハードウェア構成>
図3は、MFP連携サーバ120/経費精算サーバ130のハードウェア構成を示すブロック図である。MFP連携サーバ120と経費精算サーバ130は共通のハードウェア構成を有し、CPU311、ROM312、RAM313、HDD314及びネットワークI/F315で構成される。CPU311は、ROM312に記憶された制御プログラムを読み出して各種処理を実行することで、全体の動作を制御する。RAM313は、CPU311の主メモリ、ワークエリア等の一時記憶領域として用いられる。HDD314は、画像データや各種プログラムを記憶する大容量記憶部である。ネットワークI/F315は、制御部310をインターネットに接続するインタフェースである。MFP連携サーバ120及び経費精算サーバ130は、ネットワークI/F315を介して他の装置(MFP110など)から様々な処理のリクエストを受け、当該リクエストに応じた処理結果を返す。
<画像処理システムのソフトウェア構成>
図4は、本実施形態に係る、画像処理システム100のソフトウェア構成を示すブロック図である。以下、画像処理システム100を構成するMFP110、MFP連携サーバ120及び経費精算サーバ130それぞれの役割に対応したソフトウェア構成を、順に説明する。なお、以下では、各装置が有する諸機能のうち、原稿としての領収書をスキャンして経費精算を行うまでの処理に関わる機能に絞って説明を行うものとする。
≪MFPのソフトウェア構成≫
MFP110の機能モジュールは、ネイティブ機能モジュール410とアディショナル機能モジュール420の2つに大別される。ネイティブ機能モジュール410はMFP110に標準的に備えられたアプリケーションであるのに対し、アディショナル機能モジュール420はMFP110に追加的にインストールされたアプリケーションである。アディショナル機能モジュール420は、Java(登録商標)をベースとしたアプリケーションであり、MFP110への機能追加を容易に実現できる。
ネイティブ機能モジュール410は、スキャン実行部411およびスキャン画像管理部412を有する。また、アディショナル機能モジュール420は、表示制御部421、スキャン制御部422、連携サービスリクエスト部423、画像処理部424を有する。
表示制御部421は、操作部220のタッチパネル機能を有する液晶表示部に、ユーザによる各種操作を受け付けるためのユーザインタフェース画面(以下、「UI画面」と表記)を表示する。各種操作には、例えば、MFP連携サーバ120へアクセスするためのログイン認証情報の入力、代理申請者が領収書の電子化作業を行う場合の代理申請対象者の選択、スキャン設定、スキャンの開始指示、メタデータの入力などがある。
スキャン制御部422は、UI画面でなされたユーザ操作(例えば「スキャン開始」ボタンの押下)に応じて、スキャン設定の情報と共にスキャン実行部411に対しスキャン処理の実行を指示する。スキャン実行部411は、スキャン制御部422からのスキャン処理の実行指示に従い、スキャナI/F217を介してスキャナ部240に原稿の読み取り動作を実行させ、スキャン画像データを生成する。生成したスキャン画像データは、スキャン画像管理部412によってHDD214に保存される。この際、保存されたスキャン画像データを一意に示すスキャン画像識別子の情報が、スキャン制御部422へ通知される。
連携サービスリクエスト部423は、MFP連携サーバ120に対して各種処理のリクエストを行ったり、そのレスポンスを受け取ったりする。各種処理には、例えば、ログイン認証、代理で経費精算できる代理申請対象者リストの取得、複数の領収書をスキャンして得られたスキャン画像データに対する解析処理、メタデータ項目情報の取得、メタデータの設定などが含まれる。MFP連携サーバ120とのやり取りには例えばRESTやSOAPなどの通信プロトコルが用いられる。
画像処理部424は、複数の領収書をスキャンして得られたスキャン画像データに対し所定の画像処理を行って、表示制御部421が表示するUI画面で用いられる画像を生成する。所定の画像処理の詳細については後述する。
≪サーバ装置のソフトウェア構成≫
まず、MFP連携サーバ120のソフトウェア構成について説明する。MFP連携サーバ120は、リクエスト制御部431、画像処理部432、経費精算リクエスト部433、データ管理部434、表示制御部435を有する。リクエスト制御部431は、外部装置からのリクエストを受信できる状態で待機しており、受信したリクエスト内容に応じて、画像処理部432、経費精算リクエスト部433、データ管理部434に対し所定の処理の実行を指示する。画像処理部432は、MFP110から送られてくるスキャン画像データに対して、マルチクロップ処理、OCR処理、バリュー情報抽出処理といった解析処理を行う。経費精算リクエスト部433は、経費精算サーバ130に対して経費精算サービスに関する各種処理のリクエストを行ったり、そのレスポンスを受け取ったりする。各種処理には例えば、代理申請対象者や経費タイプの一覧取得、マルチクロップ処理に基づき得られる個々の領収書に対応する画像の登録や各画像に対応するメタデータの設定などが含まれる。なお、本明細書では、マルチクロップ処理によってスキャン画像から切り出された画像を「クロップ画像」と呼ぶこととする。また、スキャン対象となった複数の原稿それぞれに対応する画像を「原稿画像」と呼ぶこととする。そして、原稿が領収書であった場合の原稿画像を特に「領収書画像」と呼ぶ場合がある。データ管理部434は、サーバ装置120で管理するユーザ情報や各種設定データ等を保持・管理する。表示制御部435は、インターネット経由で接続されたPCやモバイル端末(いずれも不図示)上で動作しているウェブブラウザからのリクエストを受けて、画面表示に必要な画面構成情報(HTML、CSS等)を返す。ユーザは、ウェブブラウザで表示される画面経由で、登録されているユーザ情報を確認したり、スキャン設定を変更したりできる。
次に、経費精算サーバ130のソフトウェア構成について説明する。経費精算サーバ130は、リクエスト制御部441、経費情報管理部442、表示制御部443を有する。リクエスト制御部441は、外部装置からのリクエストを受信できる状態で待機しており、本実施形態においてはMFP連携サーバ120からのリクエストに応じて、経費情報管理部442が管理する情報をMFP連携サーバ120に返す。表示制御部443は、インターネット経由で接続されたPCやモバイル端末(いずれも不図示)上で動作しているウェブブラウザからのリクエストを受けて、画面表示に必要な画面構成情報(HTML、CSS等)を返す。ユーザは、ウェブブラウザで表示される画面経由で、登録されている経費レポートの情報や領収書画像を含む経費情報を確認したりすることができる。
<画像処理システム全体の処理の流れ>
図5は、MFP110で領収書をスキャンし、クラウドサービスによって経費精算を行う際の装置間の処理の流れを示すシーケンス図である。図6はMFP110の起動時に表示されるメインメニューのUI画面(以下、「メイン画面」と表記)の一例を示す図である。経費精算サービスの利用に必要な専用のアプリケーションをMFP110にインストールすることで、メイン画面600上に「経費精算」ボタン601が表示されるようになる。そして、ユーザがメイン画面600内に表示されたメニューボタンの中から「経費精算」ボタン601を押下すると、図5のシーケンス図で示される一連の処理が開始する。以下、図5のシーケンス図に沿って、装置間のやり取りを時系列に説明する。なお、以下の説明において記号「S」はステップを表す。
MFP110は、MFP連携サーバ120にアクセスするためのログイン認証の情報を入力するUI画面(以下、「ログイン画面」と表記)を操作部220に表示する(S501)。図7にログイン画面の一例を示す。ユーザが、予め登録されているユーザIDとパスワードを、ログイン画面700上の入力欄702及び703にそれぞれ入力し「ログイン」ボタン701を押下すると、ログイン認証のリクエストがMFP連携サーバ120に送信される(S502)。
ログイン認証のリクエストを受けたMFP連携サーバ120は、当該リクエストに含まれるユーザIDとパスワードを用いて認証処理を行う(S503)。認証処理の結果、正規のユーザであることが確認されれば、MFP連携サーバ120は、アクセストークンをMFP110に返す。以後、MFP110からMFP連携サーバ120に対して行う各種リクエストの際にこのアクセストークンを一緒に送ることで、ログイン中のユーザが特定される。本実施形態では、MFP連携サーバ120へのログインの完了によって、経費精算サーバ130へのログインも同時に完了するものとする。このためにユーザは、インターネット上のPC(不図示)のウェブブラウザ等を介して、MFP連携サービスを利用するためのユーザIDと経費精算サービスを利用するためのユーザIDとの紐づけを予め行っておく。これにより、MFP連携サーバ120へのログイン認証に成功すれば同時に経費精算サーバ130へのログイン認証も完了し、経費精算サーバ130にログインするための操作を省略できる。そして、MFP連携サーバ120においては、自装置にログインしたユーザからの経費精算サービスに関するリクエストにも対応可能となる。なお、ログイン認証の方法は一般的に公知な手法(Basic認証、Digest認証、OAuthを用いた認可等)を用いて行えばよい。
ログインが完了すると、MFP110は、代理申請対象者リストの取得リクエストをログインユーザのアクセストークンと共にMFP連携サーバ120に送信する(S504)。代理申請対象者リストとは、経費精算サービスにおいて本人以外の者が領収書の電子化作業を行う場合(代理申請)における、ログインユーザが代理申請者となり得る対象者を規定した名簿情報である。代理申請対象者リストには、例えばログインユーザが所属する部署の同僚など、同一のMFP110を使用する環境にある、自身と一定の関係にある他のユーザが含まれ、例えば管理者等によって予め作成される。代理申請対象者リストの取得リクエストを受信したMFP連携サーバ120は、アクセストークンで特定されるログインユーザの代理申請対象者リストの取得リクエストを、経費精算サーバ130に送信する(S505)。代理申請対象者リストの取得リクエストを受けた経費精算サーバ130は、ログインユーザについての代理申請対象者リストを読み出してMFP連携サーバ120に返す。そして、MFP連携サーバ120は、経費精算サーバ130から受け取った代理申請者リストをMFP110に送信する。これにより、図8に示すような、ログインユーザが代理申請者となり得る対象者の“UserID”と“UserName”の一覧情報が、MFP110で取得される。なお、経費精算サーバ130で保持している代理申請対象者リストをそのままMFP110に送信してもよいし、フォーマットの全部又は一部を変更して送信してもよい。
代理申請対象者リストを受信したMFP110は、申請者を設定するためのUI画面(以下、「申請者設定画面」と表記)を操作部220に表示する(S506)。図9に、申請者設定画面の一例を示す。申請者設定画面900の選択欄902には、代理申請対象者リストに含まれていたユーザ名に、ログインユーザ自身のユーザ名を加えた一覧が選択候補としてプルダウン表示される。ログインユーザは、本人として領収書の電子化作業を行う場合は自身のユーザ名を、代理申請者として第三者の領収書の電子化作業を行う場合は代理申請対象者のユーザ名を選択して、「次へ」ボタン901を押下する。
「次へ」ボタン901が押下されると、スキャン時の動作条件を設定するUI画面(以下、「スキャン設定画面」と表記)が操作部220に表示される(S507)。図10にスキャン設定画面の一例を示す。スキャン設定画面1000には、「スキャン開始」ボタン1001、カラー設定欄1002、解像度設定欄1003が存在する。「スキャン開始」ボタン1001は、原稿台に載置された原稿(本実施形態では、複数の領収書)に対するスキャン処理の開始を指示するためのボタンである。カラー設定欄1002では、スキャン時のカラーモードを設定する。例えばフルカラーやモノクロといった選択肢の中から指定できるようになっている。解像度設定欄1003では、スキャン時の解像度を設定する。例えば600dpiや1200dpiといった選択肢の中から指定できるようになっている。なお、カラーモードと解像度は設定項目の一例であって、これらすべてが存在しなくてもよいし、これら以外の設定項目が存在してもよい。また、カラーモードや解像度に関する選択肢を、経費精算サービスの要求する設定値のみに限定したりしてもよい。ログインユーザは、このようなスキャン設定画面1000を介してスキャン処理についての詳細な条件設定を行なう。スキャン設定を終えたログインユーザが、MFP110の原稿台にスキャン対象の領収書をセットし、「スキャン開始」ボタン1001を押下するとスキャンが実行される(S508)。図11は、3枚の領有書1101~1103をまとめてスキャンする様子を示す図であり(a)は読み取り対象となる表面を下(フェイスダウン)にして原稿台上に各領収書が置かれている状態を示し、同(b)はそれを原稿台の内側から見た状態を示している。このようにして複数の領収書が同時にスキャンされる。スキャンの完了後、MFP110は、スキャンによって得られた画像データを、その解析リクエストと共にMFP連携サーバ120に送信する(S509)。
スキャン画像の解析リクエストを受けたMFP連携サーバ120では、リクエスト制御部431が画像処理部432に対し、マルチクロップ処理を含む解析処理の実行を指示する(S510)。その際、リクエスト制御部431は、受信した解析リクエストを一意に特定可能なリクエストIDをMFP110に返す。図12(a)にリクエストIDの一例を示す。一方、解析処理の実行指示を受けた画像処理部432は、スキャン画像に対する解析処理を実行する(S511)。この解析処理においては、まず、マルチクロップ処理が実行される。そして、マルチクロップ処理によって検出した個々の原稿に対応する画像領域に対して、回転処理、文字認識(OCR)処理、バリュー情報抽出処理、原稿種別検知処理が施される。具体的には、まず、個々の原稿に対応する各画像領域が斜めになっている場合に原稿の各辺が水平または垂直な状態となるように修正する。そして、修正後の各画像領域に対してOCR処理を行って文字情報を特定する。そして、各画像領域から日付や金額といった特定の文字列の情報(バリュー情報)を抽出する。例えば合計金額を抽出する際には、文字列“合計”をキーとして用い、その周囲にある対応する文字列(例えば“¥100”)をバリューとして抽出する。さらに、原稿種別の検知を行って、各画像領域に対応する原稿の種類を特定する。こうして得られた解析結果は、リクエスト制御部431に渡される。
上記解析処理が行われている間、MFP110は、上述のリクエストIDを使用して、MFP連携サーバ120に対して定期的(例えば3秒毎など)に処理状況の問合せを行う(S512~S512’)。この問合せは、MFP連携サーバ120からの解析処理の完了レスポンスが取得できるまで繰り返し実行される。MFP連携サーバ120は、処理状況の問合せを受けると、リクエストIDに対応する解析処理の進行状況を確認し、完了していない場合は処理中を表すレスポンス(図12(b)を参照)を返す。そして、原稿同士の重なりによって、バリュー情報の抽出失敗の可能性がある場合には、エラーの発生を表すレスポンス(図12(c)を参照)を返す。ここで、原稿の重なりによってバリュー情報の文字列の抽出に失敗するケースの具体例を説明する。いま、バリュー情報として合計金額に対応する文字列を抽出するものとする。図13(a)は、原稿の重なりが生じてもバリュー情報の抽出に成功するケース、同(b)は原稿の重なりが生じた結果、抽出に失敗するケースをそれぞれ示している。図13(a)のケースの場合、「A商店」の領収書の上に「B交通」の領収書が重なっているが、キーに対応する文字列“合計”及びバリューに対応する文字列“¥432”が隠れていない。よって、「B交通」の領収書だけでなく「A商店」の領収書についても問題なくバリュー情報を抽出することができる。一方、図13(b)のケースでは、「B交通」の領収書によって「A商店」の領収書におけるバリューに対応する文字列“¥432”が隠れてしまっており、バリュー情報を抽出することができない。こうした図13(b)のような原稿の重なりによってキーやバリューの文字列が隠れている(その可能性が高い)と判断される場合に、MFP連携サーバ120は、上述の図12(c)に示すエラーレスポンスをMFP110に返す。この際、原稿の重なりによるバリュー情報の抽出失敗の虞があると判断された領収書画像のデータもMFP110に併せて送信される。MFP連携サーバ120における解析処理の詳細については後述する。
上記エラーレスポンスを受け取った場合、MFP110は、ユーザに対してバリュー情報の抽出失敗の虞がある旨を警告して原稿の再スキャンを促すUI画面(以下、「警告画面」と呼ぶ)を操作部220に表示する(S513)。図14に、警告画面の一例を示す。警告画面1400の画像表示領域1410には、対象の領収書画像が縮小処理されてプレビュー表示され、その下部には、バリュー情報の抽出に失敗した可能性がある旨と再スキャンの要否を確認するメッセージが表示されている。「再スキャン」ボタン1401は、スキャンを再実行するためのボタンである。原稿台上の原稿を置き直す等してユーザが「再スキャン」ボタン1401を押下すると、スキャン処理が再実行され、これによって得られたスキャン画像(以下、「再スキャン画像」と呼ぶ。)に対して解析処理が実行される(S514)。ここではS514を1つの処理として表現しているが、その中身は、前述のS508~S512の各処理で構成される。つまり、スキャン処理の再実行後には再スキャン画像の解析リクエストが送信され、MFP連携サーバ120にてその解析処理が実行される。再スキャンの必要がない場合、ユーザは「キャンセル」ボタン1402を押下する。この場合、スキャン処理は再実行されることなく、解析処理の継続を指示するリクエストがMFP連携サーバ120に対して送られる。この継続リクエスト受けてMFP連携サーバ120では、残りの解析処理が再開される。
解析処理が完了すると、MFP連携サーバ120は、完了を表すレスポンス(図15を参照)を返す。図15に示すとおり、処理完了時のレスポンスには、ステータス情報に加え、スキャン画像の解析結果の情報を含む。図15は、前述の図11に対応しており、3枚の領収書をスキャンして得られたスキャン画像の解析結果の情報が示されている。まず、“Status”には、完了を表す内容の文字列(completed)が入る。“Images”には、マルチクロップ処理で検知した原稿に対応するクロップ画像それぞれについて、“ImageID”、“ContentsType”、“ReceiptData”の各情報が格納される。“ImageID”は、例えばURLやURLパラメータを用いた文字列で表された、各原稿画像を識別するID情報である。このImageIDを指定して取得リクエストをMFP連携サーバ120に送信することで、特定の原稿画像を取得できる。“ContentsType”は、検知した原稿の種類を示す。例えば、「領収書」の場合は“Receipt”、「名刺」の場合は“BusinessCard”、「免許証」の場合は“DriverLicense”などの文字列となる。“ReceiptData”は、“ContentsType”が領収書を示す“Receipt”であった場合に追加で含まれる情報であり、バリュー情報抽出処理によって得られた日付を表す“Date”と合計金額を表す“Amount”の値が格納されている。“Points”は、スキャン画像のどの領域に原稿があったかを示す座標情報である。座標情報は、スキャン画像の左上隅を原点(x,y)=(0,0)として、先頭から順に、各原稿画像の左上隅、右上隅、右下隅、左下隅の各位置を示している。
解析処理の完了レスポンスを受信した後、MFP110は、最初に表示する領収書の原稿画像のImageIDを指定して、MFP連携サーバ120に画像取得リクエストを送信する(S515)。画像取得リクエストを受けて、MFP連携サーバ120は、ImageIDに対応する原稿画像のデータをMFP110に返す。この原稿画像は、回転処理によって正しい向きになっている。
次に、MFP110は、メタデータ項目情報の取得リクエストをMFP連携サーバ120に送信する(S516)。メタデータ項目情報とは、各原稿画像と対応付けて登録されるメタデータ項目の内容(例えば領収書の使用目的など)を記した一覧情報である。図16にメタデータ項目情報の一例を示す。“ExpenseTypes”には、その領収書の使用目的を表す定義値として、“ID”と“Name”の各文字列が含まれる。MFP連携サーバ120は、MFP110からのメタデータ項目情報取得リクエストを受けて、それに対応する取得リクエストを経費精算サーバ130に送信して、ログインユーザのメタデータ項目情報を取得する(S517)。MFP連携サーバ120は経費精算サーバ130から取得したメタデータ項目情報をそのままMFP110に返してもよいし、適宜加工したものを返してもよい。例えばMFP連携サーバ120からの取得リクエストを満足するために複数のメタデータ項目情報が必要な場合は、まず、当該複数のメタデータ項目情報の取得リクエストを経費精算サーバ130に送信して取得する。そして、MFP110にレスポンスを返すときはそれぞれのメタデータ項目情報を結合し1つにまとめたものを返してもよい。また、これとは逆に、経費精算サーバ130が返したメタデータ項目情報から必要な情報を間引いたものを返してもよい。
メタデータ項目情報を受け取ったMFP110は、各原稿画像にメタデータを設定するためのUI画面(以下、「メタデータ設定画面」と表記)をスキャン画像の解析結果に基づいて操作部220に表示する(S518)。このメタデータ設定画面は、スキャン画像から切り出された原稿画像の単位(ここでは領収書画像の単位)で生成され、操作部220に表示される。図17に、メタデータ設定画面の一例を示す。メタデータ設定画面1700の画像表示領域1710には、メタデータの設定対象となる領収書画像が縮小処理されてプレビュー表示される。また、メタデータ設定画面1700には、ユーザが各種指示を行うための入力要素として様々なボタンが存在する。「次へ」ボタン1702又は「戻る」ボタン1703は、領収書画像毎に生成されるメタデータ設定画面の表示を切り替えるためのボタンである。「次へ」ボタン1702は、次の領収書画像についてのメタデータ設定画面を表示させるためのボタンである。スキャン画像から切り出された領収書画像のうち最後の領収書画像についてのメタデータ設定画面を表示している時は「次へ」ボタン1702は非表示状態となる。「戻る」ボタン1703は、一つ前の領収書画像についてのメタデータ設定画面を表示させるためのボタンである。スキャン画像から切り出された領収書画像のうち最初の領収書画像についてのメタデータ設定画面を表示しているときは「戻る」ボタン1703は非表示状態となる。そして、画像表示領域1710の右側に設けられた4つの項目(経費タイプ、取引日、金額、場所)の入力欄1704~1707には、表示中の領収書画像における対応する値をそれぞれ入力する。「経費タイプ」入力欄1704には、経費タイプの候補が表示され、ユーザは処理対象の領収書に対応する経費タイプを表示中の候補の中から1つ選択する。前述の図16の例では、“Hotel”や“Car Rental”の文字列の一覧が候補として表示されることになる。「取引日」入力欄1705には、処理対象の領収書の取引日を入力する。「金額」入力欄1706には、処理対象の領収書の金額を入力する。そして、メタデータ設定画面1700の初期表示の時点では、プレビュー表示に係る領収書画像についての“ReceiptData”内の“Date”や“Amount”の情報の情報(図15を参照)がそれぞれ初期値として表示される。このように、完了レスポンスの“ReceiptData”に記載の項目については、メタデータ設定画面の初期表示の時点で、解析処理で得られたバリュー情報が初期値として表示されるので、ユーザは対応する値を入力する手間を省くことできる。場所」入力欄1707には、領収書が発行された場所を入力する。この場合において、例えば前述のメタデータ項目情報の取得時に、場所の項目情報を追加で取得するようにし、場所の項目一覧を候補として表示するようにしてもよい。なお、入力欄1705~1707に値を手入力する方法としては、例えば対象の入力欄を押下することで画面上にキーボードを表示して、ユーザが任意の数字や文字列を入力できるようにすればよい。
各領収書画像に対して、必要な情報の入力を終えたログインユーザが、メタデータ設定画面1700内の「送信」ボタン1701を押下すると、MFP110は、メタデータ設定リクエストをMFP連携サーバ120に送信する(S519)。この際、メタデータ設定画面1700で入力された上記4つの項目(ExpenseTypeID、TransactionDate、Amount、Location)に関するデータが、図18に示すような形式にてメタデータ設定リクエストと共に送信される。なお、メタデータ設定画面1700内の「送信」ボタン1701については、スキャン画像から切り出されたすべての領収書画像についてのメタデータ設定画面1700が表示されるまで無効状態としてもよい。また、本実施形態では、1つの領収書画像に対して1つのメタデータ設定画面を表示するようにしているため、スキャン画像内で検知された領収書の数だけメタデータ設定リクエストを送信する必要がある。しかし、複数の領収書画像についてのメタデータ設定リクエストをまとめて送信できるようにしてもよい。
MFP110からメタデータ設定リクエストを受信したMFP連携サーバ120は、当該リクエストに係る領収書画像の登録リクエストとそのメタデータの設定リクエストを、経費精算サーバ130に送信する(S520)。MFP連携サーバ120から画像登録とメタデータ設定のリクエストを受け取った経費精算サーバ130は、当該リクエストに係る領収書画像とそのメタデータを、自装置で管理する経費情報に登録及び設定する処理を行なう。その後、領収書画像の登録とメタデータの設定が完了したことを示すレスポンスをMFP連携サーバ120に返す。そして、経費精算サーバ130から上記完了レスポンスを受け取ったMFP連携サーバ120も、同様の完了レスポンスをMFP110に返す。
以上が、画像処理システム全体の処理の流れである。
<MFPにおける処理の詳細>
続いて、図5のシーケンス図におけるS508~S513間の処理ついて、MFP110における動作に着目して説明する。図19は、この間のMFP110における処理の流れを示すフローチャートである。この一連の処理は、制御部210において、CPU211がHDD214に記憶された制御プログラムを実行することにより実現され、前述のスキャン設定画面1000での「スキャン開始」ボタン1001の押下に応答して開始される。以下、図19に示すフローチャートに沿って詳しく説明する。なお、各処理の冒頭における記号「S」はステップを意味する。
S1901において、「スキャン開始」ボタン1001の押下の通知を表示制御部421から受けたスキャン制御部422は、スキャン実行部411に対してスキャン処理の実行を指示する。当該指示を受けてスキャン実行部411が、原稿台に置かれた領収書をスキャンする。スキャンによって生成されたスキャン画像データは、画像データ保存部412に保存され、当該スキャン画像を特定可能な識別子がスキャン制御部421に通知される。この際、スキャンの実行中である旨を示すメッセージ画面(不図示)が操作部220上に表示されるようにしてもよい。
S1902において、連携サービスリクエスト部423は、スキャン制御部421を介してスキャン画像データを取得し、MFP連携サーバ120にその解析リクエストと共に送信する。当該解析リクエストに基づき、MFP連携サーバ120では、受信したスキャン画像データに対して、前述の解析処理が実行される。その際、MFP連携サーバ120のリクエスト制御部431からリクエストIDが返される。
リクエストIDを取得した連携サービスリクエスト部423は、S1903において、処理ステータスの取得リクエストをリクエストIDと共にMFP連携サーバ120に送信する。当該取得リクエストに基づき、MFP連携サーバ120は、リクエストIDで特定される解析処理の進行状況に応じたレスポンスをMFP110に返す。
S1904では、連携サービスリクエスト部423が、MFP連携サーバ120から送られてくるレスポンスを受信する。そして、S1905では、受信したレスポンスに応じて、次に行う処理が決定される。受信したレスポンスが処理中を示す内容(図12(b)を参照)であった場合はS1903に戻り、所定時間(例えば数秒程度)の経過を待って、再び処理ステータスの取得リクエストをMFP連携サーバ120に送信する。受信したレスポンスがエラーを示す内容(図12(c)を参照)であった場合はS1906に進む。そして、受信したレスポンスが完了を示す内容(図15を参照)であった場合は、本フローを抜ける。この際、操作部203に、解析処理が正常に終了したことを示すメッセージを表示してもよい。
S1906において、画像処理部432は、エラーレスポンスと共にMFP連携サーバ120から送られてきた領収書画像(バリュー情報の抽出失敗の可能性ありと判断された領収書画像)のデータを用いて、前述の警告画面1400を生成する。そして、S1907において、表示制御部421は、S1906で生成された警告画面を操作部220に表示する。
以上が、MFP110の動作に着目した、スキャンの実行から警告画面の表示までの処理の流れである。
<サーバにおける処理の詳細>
続いて、図5のシーケンス図におけるS510~S512間の処理ついて、MFP連携サーバ120における動作に着目して説明する。図20は、この間のMFP連携サーバ120における処理の流れを示すフローチャートである。この一連の処理は、制御部310において、CPU311がHDD314に記憶された制御プログラムを実行することにより実現され、前述のスキャン画像解析リクエスト(S509)の送信を検知すると開始される。以下、図20に示すフローチャートに沿って詳しく説明する。なお、各処理の冒頭における記号「S」はステップを意味する。
S2001において、リクエスト制御部431は、MFP110から送られてきたスキャン画像データとその解析リクエストを受信する。そして、リクエスト制御部431は、画像処理部432に対し、スキャン画像の解析を指示する。
S2002において、画像処理部432は、スキャン画像に対し、マルチクロップ処理を実行する。具体的には、スキャン画像から各原稿(ここでは各領収書)の画像領域を枠エッジ抽出等により検出して、原稿単位の画像を切り出す処理を行う。続くS2003において、画像処理部432は、S2002で切り出した画像(クロップ画像)に対し、前述のバリュー情報抽出処理を行う。このバリュー情報抽出処理では、クロップ画像が1つの原稿ではなく複数の原稿に対応している場合、クロップ画像を原稿単位の画像に分割する処理も行われる。バリュー情報抽出処理の結果は、リクエスト制御部431に渡される。
S2004において、リクエスト制御部431は、スキャン画像から得られた原稿単位の画像からバリュー情報が正常に抽出されているか(抽出エラーが発生していないか)を判定する。どの原稿画像からもバリュー情報が正常に抽出されている場合はS2005に進んで、前述した解析処理の完了レスポンスをMFP110に送信する。一方、バリュー情報の抽出エラーが発生している場合はS2006に進んで、前述したエラーレスポンスを、抽出エラーに係る原稿画像のデータと共にMFP110に送信する。
以上が、MFP連携サーバ120の動作に着目した、スキャン画像の解析リクエストの受信から解析処理結果のレスポンス送信までの処理の流れである。
<バリュー情報抽出処理の詳細>
続いて、上述の図20のフローにおけるS2003のバリュー情報抽出処理について詳しく説明する。図21は、バリュー情報抽出処理の詳細を示すフローチャートである。
S2101では、S2002で切り出されたクロップ画像のうち注目するクロップ画像が決定され、当該注目クロップ画像が原稿単位の画像であるかどうかチェックされる。図22(a)は、クロップ画像の中に複数の原稿の画像が含まれている場合の一例である。2枚の領収書が重なった状態の場合、それぞれの領収書の枠エッジを検出することができないために、このようなクロップ画像がスキャン画像から切り出されることになる。そこで、クロップ画像内で複数の原稿が重なっているか否かを、クロップ画像に含まれる頂点の数や枠エッジの形状等に基づいて判定する。例えば、クロップ画像が1枚の領収書の画像のみを含む場合、その1枚の領収書のエッジが検出されているので、頂点の数は4個で、枠エッジの形状は矩形になる。これに対し、図22(a)の例では、2枚の領収書が重なった状態でエッジが検出されるので、頂点の数が9個で、枠エッジの形状は矩形とは異なる歪な形状になっている。このような違いに着目して、原稿の重なりの有無を判断する。なお、原稿の重なり判定の手法はこれに限定されず、例えば、一定以上の長さの線分の数に基づいて判定してもよい。
S2102では、S2101での判定結果に基づき、次の処理が決定される。判定の結果、原稿の重なりは存在せず、注目クロップ画像が原稿単位の画像である場合は、S2107に進む。一方、原稿の重なりが存在し、注目クロップ画像が原稿単位の画像でない場合は、S2103に進む。
S2103では、注目クロップ画像を原稿単位の画像に分割する処理が実行される。画像分割の手法としては、OCR処理を行って文字列を抽出してその連続性を基に原稿の上下を判断し、さらに枠エッジの情報に基づき原稿単位の画像に分割するといった公知の手法を適用すればよい。上述の図22(a)に示したクロップ画像の場合、図22(b)に示すような2枚の原稿画像2201及び2202に分割されることになる。
S2104では、画像分割処理によって得られた原稿画像それぞれに対して、バリュー情報の抽出に必要なキーやバリューに相当する文字列が他の原稿によって遮蔽されていないかどうかを判定する処理(遮蔽判定処理)が実行される。図23(a)は、本実施形態に係る遮蔽判定処理の詳細を示すフローチャートである。ここで、図23(a)のフローに沿ってその詳細を説明する。
S2301では、分割によって得られた複数の原稿画像のうち注目する原稿画像について、原稿の重なり領域(他の原稿が重なったことでスキャン時に読み取れなかった領域)が存在するかどうか判定される。重なり領域が存在する場合はS2302に進み、存在しない場合はS2304に進む。前述の図22(b)の例では、分割によって得られた2枚の原稿画像のうち、原稿画像2201には原稿の重なり領域が存在するが、原稿画像2202については原稿の重なり領域は存在しない。本ステップでは、分割によって得られた複数の原稿画像のうち、原稿の重なりによってその一部が欠けている画像が特定されることになる。次に、S2302では、S2301で特定された重なり領域のサイズが、所定の閾値以上であるか否かが判定される。この時、基準となる閾値は、画素数の絶対値を用いて定義してもよいし、スキャンされた原稿の実サイズと比較した時の相対値で定義してもよい。前者の場合は、重なり領域を構成する画素の数が10000画素以上といったような閾値となり、後者の場合は、元の原稿サイズの5%以上といったような閾値となる。重なり領域のサイズが閾値以上である場合はS2303に進み、閾値未満である場合はS2304に進む。そして、S2303では、注目原稿画像は、原稿の重なりによってキーまたはバリューが隠れている可能性のある画像であると判断される。この際、注目原稿画像のデータが、エラーレスポンスと共にMFP110に送信する画像データとしてRAM213に格納される。また、S2304では、注目原稿画像は、キーまたはバリューが隠れている可能性のない画像であると判断される。
以上の処理が、画像分割によって得られたすべての原稿画像について完了すると、図21のフローチャートに戻る。
S2105では、S2103の画像分割によって得られた各原稿画像についての次の処理が、S2104での遮蔽判定処理に基づき決定される。具体的には、キー又はバリューが隠れている可能性があると判断された原稿画像についてはS2106に進む。一方、キー又はバリューが隠れている可能性がないと判断された原稿画像についてはS2107に進む。
S2106では、キー又はバリューが隠れている可能性がある原稿画像について、抽出エラーの判断がなされる。これにより、前述のエラーレスポンスがMFP110に返されることになる。
S2107では、処理対象の原稿画像から、特定のキーに対応するバリューの文字列が抽出される。ここで、処理対象となる原稿画像は、S2102で原稿単位の画像であると判定された注目クロップ画像、或いはS2103の画像分割によって得られた原稿画像のうちキー又はバリューが隠れている可能性がないと判断された原稿画像である。本ステップでは、まず、処理対象の原稿画像に対してOCR処理を実行する。次に、OCR結果から、キーとして予め指定された文字列(例えば“合計”)を検出し、検出した文字列の周囲から、当該キーに対応するバリューとしての文字列(例えば“¥984”)を抽出する。この場合の“周囲”については特定の周辺領域(例えばキーとして検出された文字列を基準として右側に存在する文字領域など)に限定してもよく、予めユーザによって設定しておけばよい。また、予め指定する特定のキー毎に“周囲”の内容を異ならせてもよい。
S2108では、スキャン画像から切り出されたすべてのクロップ画像について処理が完了したかどうかが判定される。未処理のクロップ画像があればS2101に戻って、次の注目クロップ画像を決定して処理を続行する。一方、切り出されたすべてのクロップ画像についての処理が完了していれば、本処理を抜ける。
以上が、バリュー情報抽出処理の内容である。なお、上述の遮蔽判定処理(S2104)では、重なり領域のサイズに基づいてキー又はバリューが隠れている可能性を判定したが、例えば重なり領域の存在する場合は一律にキーまたはバリューが隠れている可能性があると判断してもよい。
以上のとおり本実施形態によれば、スキャン時の原稿同士の重なりによって、バリュー情報の抽出に必要な文字列が隠れている可能性がある場合、原稿の再スキャンがユーザに対して促される。これにより、原稿画像にメタデータを付してストレージサーバ等に登録した後になって登録済みの原稿画像の不備に気付き、再び原稿をスキャンし直すということを防ぐことができる。
[実施形態2]
実施形態1においては、原稿の重なり領域のサイズに基づいて、キーまたはバリューが隠れている可能性があるか否かを判定していた。次に、キーやバリューの文字列と重なり領域との位置関係に基づいて判定することで、遮蔽判定処理の判定精度を高める態様を実施形態2として説明する。
図23(b)は、本実施形態に係る遮蔽判定処理の詳細を示すフローチャートである。なお、実施形態1に係る遮蔽判定処理(図23(a)のフローチャート)と共通の内容についてはその説明を省略ないしは簡略化し、以下では差異点を中心に説明を行うものとする。
S2311では、S2301と同様、分割によって得られた複数の原稿画像のうち注目する原稿画像について、原稿の重なり領域が存在するかどうかが判定される。重なり領域が存在する場合はS2312に進み、存在しない場合はS2313に進む。
S2312では、処理対象の原稿画像に対してOCR処理を実行し、その結果から予め指定されたキーの文字列を検出して、原稿の重なり領域が、検出されたキーの文字列の文字並び方向に存在するか否かが判定される。これは、バリューの文字列の多くが、キーの文字列の文字並び方向に存在することに着目したものである。例えば、キーの文字列が左から右への横書きであって、その延長線上に原稿の重なり領域が存在している場合は、当該キーに対応するバリューの文字列が隠れている可能性が高いと判断する。原稿の重なり領域がキーの文字列の文字並び方向に存在する場合はS2314に進み、存在しない場合はS2313に進む。
S2313では、S2312で検出されたキーに対応するバリューの文字列をOCR結果からさらに検出し、原稿の重なり領域が、キーやバリューの文字列の領域と隣接しているかどうかが判定される。キーやバリューの文字列が検出された位置と原稿の重なり領域とが隣接している場合は、原稿の重なり領域によって、キーやバリューの文字列の一部が隠れてしまっている可能性があるためである。原稿の重なり領域がキーやバリューの文字列の位置に隣接している場合はS2314へ進み、隣接していない場合はS2315に進む。
S2314は前述のS2303と同じであり、S2315はS2304と同じである。すなわち、S2314では、注目原稿画像は、原稿の重なりによってキーまたはバリューが隠れている可能性のある画像であると判断される。この際、注目原稿画像のデータが、エラーレスポンスと共にMFP110に送信する画像データとしてRAM313に格納される。また、S2315では、注目原稿画像は、キーまたはバリューが隠れている可能性のない画像であると判断される。そして、これらの処理が、画像分割によって得られたすべての原稿画像について完了すると、図21のフローチャートに戻る。
以上が、本実施形態に係る遮蔽判定処理の内容である。本実施形態の場合、原稿の重なり領域とキーやバリューの文字列との位置関係を考慮することで、より精度の高い遮蔽判定処理を実現できる。
[実施形態3]
領収者や見積書といったビジネス帳票の多くはその書式が定型化されており、キーやバリューの位置が決まっている。そこで、書式が予め分かっている原稿について、キーとバリューに対応する文字列の位置情報を利用することによって、より正確に、キーやバリューが隠れているか否かを判定する態様を実施形態3として説明する。
図24は、本実施形態に係る遮蔽判定処理の詳細を示すフローチャートである。なお、実施形態1及び2に係る遮蔽判定処理と共通の内容についてはその説明を省略ないしは簡略化し、以下では差異点を中心に説明を行うものとする。
S2401では、実施形態1に係る図23(a)のフローチャートにおけるS2301と同様、画像分割によって得られた複数の原稿画像のうち注目する原稿画像について、原稿の重なり領域が存在するかどうか判定される。重なり領域が存在する場合はS2402に進み、存在しない場合はS2406に進む。
S2402では、注目原稿画像における原稿のフォーマットが特定される。原稿フォーマットの特定は公知の手法を適用すればよい。例えば、予め複数種類の原稿それぞれのフォーマットの特徴情報(特定の文字列やロゴの形状・配置の情報など)をHDD314等に保持しておく。そして、注目原稿画像にパターンマッチングを行う等して、予め保持しておいた各原稿のフォーマットの特徴情報と比較することで注目原稿画像のフォーマットを特定することができる。
S2403では、S2402で特定された原稿フォーマットについての、キー及びバリューに対応する文字列の位置情報(原稿内の位置を示す座標情報など)が取得される。キー及びバリューに対応する文字列の位置情報は、各原稿フォーマットと紐付けてHDD314に保持しておけばよい。あるいは、原稿画像からバリュー情報を抽出する度に学習を行って、新規の原稿フォーマットについての位置情報をHDD314に追加したり、既存の原稿フォーマットについての位置情報を更新したりしてもよい。
S2404では、S2403で取得したキー及びバリューの位置情報を用いて、原稿の重なり領域に、キーまたはバリューに対応する文字列が含まれているか否か(当該文字列領域の少なくとも一部が重なり領域と重複しているか)が判定される。原稿の重なり領域にキーまたはバリューに対応する文字列が含まれている場合はS2405へ進み、含まれていない場合はS2406へ進む。
S2405は前述のS2303と同じであり、S2406はS2304と同じである。すなわち、S2405では、注目原稿画像は、原稿の重なりによってキーまたはバリューが隠れている可能性のある画像であると判断される。この際、注目原稿画像のデータが、エラーレスポンスと共にMFP110に送信する画像データとしてRAM313に格納される。また、S2406では、注目原稿画像は、キーまたはバリューが隠れている可能性のない画像であると判断される。そして、これらの処理が、画像分割によって得られたすべての原稿画像について完了すると、図21のフローチャートに戻る。
以上が、本実施形態に係る遮蔽判定処理の内容である。本実施形態によれば、原稿の書式が判明している場合の遮蔽判定処理の判定精度をさらに高めることができる。
(その他の実施形態)
実施形態1~3では、原稿の重なりによってキーやバリューが隠れてしまうケースを想定していたが、原稿の折れによってキーやバリューが隠れてしまうケースもある。図25は、原稿の折れによってバリューに対応する文字列が隠れてしまった場合の一例を示す図である。実施形態1~3で説明した手法は、このような原稿の折れについても同様に適用可能である。例えば、実施形態1に適用する場合には、マルチクロップ処理によって得られた原稿画像に図25に示すような「折れ領域」が存在するかを判定する。そして、図23のフローチャートにおける「重なり領域」を「折れ領域」と読み替えて適用すればよい。この場合のS2301における原稿の折れの有無は、例えば、原稿画像のエッジが形成する図形の形状が矩形であるかどうか或いは当該図形の各辺が成す角度が直角であるかどうかに基づき判定することが可能である。そして、S2302では、「折れ領域」のサイズが一定サイズ以上であるかどうかを、「重なり領域」の場合と同様に判定すればよい。
また、本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。

Claims (15)

  1. 原稿台に載置された複数の原稿をスキャンしてスキャン画像を生成する生成手段と、
    前記生成手段で生成された前記スキャン画像から前記複数の原稿それぞれに対応する原稿画像を得て各原稿画像から特定の文字列を抽出する解析処理の実行を、画像処理手段に対して指示する指示手段と、
    前記解析処理の結果に基づき、前記各原稿画像のうち特定の原稿画像に対応する原稿について、前記スキャンの再実行をユーザに促すユーザインタフェース画面を表示手段に表示する表示制御手段と、
    を備え、
    前記特定の原稿画像は、前記特定の文字列の抽出に失敗した可能性がある原稿画像である
    ことを特徴とする画像処理装置。
  2. 前記画像処理手段においては、前記スキャン画像に対するマルチクロップ処理が実行され、当該マルチクロップ処理によって得られたクロップ画像が原稿単位の画像でない場合、前記クロップ画像を原稿単位の画像に分割することにより前記原稿画像を得ることを特徴とする請求項1に記載の画像処理装置。
  3. 前記画像処理手段において、前記クロップ画像の分割により得られた原稿画像について、前記スキャン時に原稿同士が重なることで生じた第1の領域の中に前記特定の文字列が存在すると判断できる場合、前記抽出に失敗した可能性があると判定されることを特徴とする請求項に記載の画像処理装置。
  4. 前記画像処理手段において、前記第1の領域のサイズが閾値以上である場合に、前記抽出に失敗した可能性があると判定されることを特徴とする請求項3に記載の画像処理装置。
  5. 前記画像処理手段において、
    前記特定の文字列の抽出は、キーとして予め指定された文字列を検出し、検出した文字列の周囲から、当該キーに対応するバリューとしての文字列を抽出することによって実現され、
    前記第1の領域と前記原稿画像における前記キーの文字列または前記バリューの文字列との位置関係に基づいて、前記抽出に失敗した可能性があるかどうかが判定される
    ことを特徴とする請求項3に記載の画像処理装置。
  6. 前記画像処理手段において、さらに、前記分割によって得られた原稿画像に対応する原稿のフォーマットを特定し、当該特定されたフォーマットに応じた前記キーの文字列及び前記バリュー文字列の位置情報を取得し、当該取得した位置情報から前記第1の領域と前記キーの文字列または前記バリューの文字列の少なくとも一部とが重複していると判定される場合に、前記抽出に失敗した可能性があると判定されることを特徴とする請求項5に記載の画像処理装置。
  7. 前記画像処理手段において前記スキャン画像に対するマルチクロップ処理が実行され、当該マルチクロップ処理によって得られた原稿画像について、前記スキャン時に原稿が折れることで生じた第2の領域の中に前記特定の文字列が存在すると判断できる場合、前記抽出に失敗した可能性があると判定されることを特徴とする請求項1に記載の画像処理装置。
  8. 前記画像処理手段において、前記第2の領域のサイズが閾値以上である場合に、前記抽出に失敗した可能性があると判定されることを特徴とする請求項7に記載の画像処理装置。
  9. 前記画像処理手段において、
    前記特定の文字列の抽出は、キーとして予め指定された文字列を検出し、検出した文字列の周囲から、当該キーに対応するバリューとしての文字列を抽出することによって実現され、
    前記第2の領域と前記原稿画像における前記キーの文字列または前記バリューの文字列との位置関係に基づいて、前記抽出に失敗した可能性があるかどうかが判定されることを特徴とする請求項7に記載の画像処理装置。
  10. 前記画像処理手段において、さらに、前記マルチクロップ処理によって得られた前記原稿画像に対応する原稿のフォーマットを特定し、当該特定されたフォーマットに応じた前記キーの文字列及び前記バリューの文字列の位置情報を取得し、当該取得した位置情報から前記第2の領域と前記キーの文字列または前記バリューの文字列の少なくとも一部とが重複していると判定される場合に、前記抽出に失敗した可能性があるかどうかが判定されることを特徴とする請求項9に記載の画像処理装置。
  11. 前記画像処理装置は、ネットワークを介して外部装置と接続され、
    前記画像処理手段は、前記外部装置が備える、
    ことを特徴とする請求項1乃至10のいずれか1項に記載の画像処理装置。
  12. 前記画像処理手段をさらに備えることを特徴とする請求項1乃至10のいずれか1項に記載の画像処理装置。
  13. 原稿台に載置された複数の原稿をスキャンしてスキャン画像を生成する生成ステップと、
    前記生成ステップにて生成された前記スキャン画像から前記複数の原稿それぞれに対応する原稿画像を得て各原稿画像から特定の文字列を抽出する解析処理の実行を、画像処理手段に対して指示する指示ステップと、
    前記解析処理の結果に基づき、前記各原稿画像のうち特定の原稿画像に対応する原稿について、前記スキャンの再実行をユーザに促すユーザインタフェース画面を表示手段に表示する表示制御ステップと、
    を含み、
    前記特定の原稿画像は、前記特定の文字列の抽出に失敗した可能性がある原稿画像である
    ことを特徴とする画像処理方法。
  14. コンピュータを、請求項1乃至12のいずれか1項に記載の画像処理装置として機能させるためのプログラム。
  15. 原稿台に載置された原稿をスキャンしてスキャン画像を生成する画像処理装置であって、
    スキャン画像から得られる原稿画像から文字列を抽出する解析処理の実行を、画像処理手段に対して指示する指示手段と、
    前記解析処理の結果に基づき、前記原稿画像のうち特定の文字列の抽出に失敗した可能性がある原稿画像に対応する原稿について、スキャンの再実行をユーザに促すユーザインタフェース画面を表示手段に表示する表示制御手段と、
    を有する画像処理装置。
JP2019103759A 2019-06-03 2019-06-03 画像処理装置、画像処理方法及びプログラム Active JP7337553B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2019103759A JP7337553B2 (ja) 2019-06-03 2019-06-03 画像処理装置、画像処理方法及びプログラム
US16/884,193 US11431860B2 (en) 2019-06-03 2020-05-27 Image processing apparatus, image processing method and storage medium
CN202010490072.4A CN112036225A (zh) 2019-06-03 2020-06-02 图像处理装置、图像处理方法及存储介质
JP2023134721A JP2023157964A (ja) 2019-06-03 2023-08-22 画像処理装置、画像処理方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019103759A JP7337553B2 (ja) 2019-06-03 2019-06-03 画像処理装置、画像処理方法及びプログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2023134721A Division JP2023157964A (ja) 2019-06-03 2023-08-22 画像処理装置、画像処理方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2020198547A JP2020198547A (ja) 2020-12-10
JP7337553B2 true JP7337553B2 (ja) 2023-09-04

Family

ID=73550924

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2019103759A Active JP7337553B2 (ja) 2019-06-03 2019-06-03 画像処理装置、画像処理方法及びプログラム
JP2023134721A Pending JP2023157964A (ja) 2019-06-03 2023-08-22 画像処理装置、画像処理方法及びプログラム

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2023134721A Pending JP2023157964A (ja) 2019-06-03 2023-08-22 画像処理装置、画像処理方法及びプログラム

Country Status (3)

Country Link
US (1) US11431860B2 (ja)
JP (2) JP7337553B2 (ja)
CN (1) CN112036225A (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7225017B2 (ja) * 2019-04-19 2023-02-20 キヤノン株式会社 タッチパネルを用いた文字入力のための画像処理装置、その制御方法及びプログラム
JP2021103846A (ja) * 2019-12-25 2021-07-15 キヤノン株式会社 情報処理装置、情報処理システム、情報処理方法及びプログラム
US11350011B2 (en) * 2020-02-14 2022-05-31 Ricoh Company, Ltd. Device, process execution system, process execution method, and non-transitory recording medium
JP2022034948A (ja) * 2020-08-19 2022-03-04 富士フイルムビジネスイノベーション株式会社 情報処理システム、プログラム、および、読み取り装置
JP2022100066A (ja) * 2020-12-23 2022-07-05 富士フイルムビジネスイノベーション株式会社 情報処理装置、及び情報処理プログラム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018067892A (ja) 2016-10-21 2018-04-26 シャープ株式会社 画像切出装置、複合機、画像切出方法及び画像切出用プログラム

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6809757B1 (en) 1990-11-08 2004-10-26 Canon Kabushiki Kaisha Image processing system
DE69131156T2 (de) 1990-11-08 1999-10-14 Canon Kk Bildverarbeitungssystem
JPH06303375A (ja) * 1993-04-15 1994-10-28 Murata Mach Ltd ファクシミリ装置
JP4772888B2 (ja) * 2009-03-27 2011-09-14 シャープ株式会社 画像処理装置、画像形成装置、画像処理方法、プログラムおよびその記録媒体
JP5703270B2 (ja) * 2012-08-29 2015-04-15 京セラドキュメントソリューションズ株式会社 画像読取装置、文書管理システム、及び画像読取制御プログラム
JP6701958B2 (ja) * 2015-12-09 2020-05-27 株式会社リコー 情報処理装置、情報処理システム、情報処理方法およびコンピュータプログラム
JP6628279B2 (ja) 2016-01-20 2020-01-08 シャープ株式会社 画像処理装置、画像処理方法、画像処理プログラムおよび記録媒体
CN106648481B (zh) * 2016-12-28 2019-09-17 珠海赛纳打印科技股份有限公司 处理方法及其装置、打印控制方法和装置
JP6880763B2 (ja) * 2017-01-19 2021-06-02 株式会社リコー 情報解析システム、情報解析方法
JP6887910B2 (ja) * 2017-08-01 2021-06-16 株式会社東芝 画像処理装置
JP2019080166A (ja) * 2017-10-24 2019-05-23 株式会社東芝 画像処理装置、及び制御方法
JP6991072B2 (ja) * 2018-01-31 2022-01-12 シャープ株式会社 画像読取装置、画像形成装置および制御方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018067892A (ja) 2016-10-21 2018-04-26 シャープ株式会社 画像切出装置、複合機、画像切出方法及び画像切出用プログラム

Also Published As

Publication number Publication date
US20200382661A1 (en) 2020-12-03
JP2020198547A (ja) 2020-12-10
JP2023157964A (ja) 2023-10-26
US11431860B2 (en) 2022-08-30
CN112036225A (zh) 2020-12-04

Similar Documents

Publication Publication Date Title
JP7337553B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP7234024B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP7391672B2 (ja) 文書を電子化するための画像処理システム、その制御方法及びプログラム
CN101968837B (zh) 图像形成装置、图像处理装置和图像传送系统
CN103139195B (zh) 数据通信装置及其控制方法
JP7317561B2 (ja) タッチパネルを用いた文字入力のための画像処理装置、その制御方法及びプログラム
JP7297510B2 (ja) ユーザ操作のためのガイダンスを表示する画像処理装置、その制御方法及びプログラム
JP2022096218A (ja) 情報処理装置、情報処理システム、その制御方法及びプログラム
JP7225017B2 (ja) タッチパネルを用いた文字入力のための画像処理装置、その制御方法及びプログラム
US11252290B2 (en) Image processing apparatus, image processing method and storage medium
JP2006209261A (ja) 受信帳票ジョブ表示方法及び装置、並びにプログラム
US11412103B2 (en) Image processing apparatus for displaying an analysis result of a multi-cropping scan processing
JP2020182021A (ja) 情報処理装置、情報処理方法及びプログラム
JP2021103846A (ja) 情報処理装置、情報処理システム、情報処理方法及びプログラム
US11350011B2 (en) Device, process execution system, process execution method, and non-transitory recording medium
JP2021164132A (ja) 画像処理システム、及びプログラム
US11620840B2 (en) Image processing apparatus for extracting a desired character string from a scanned image
JP7476557B2 (ja) 機器、処理実行システム、処理実行方法、プログラム
JP2020127076A (ja) 情報処理装置、情報処理方法及びプログラム
JP2022137727A (ja) 情報処理装置、情報処理システム、その制御方法及びプログラム
JP2024040612A (ja) 情報処理装置、情報処理装置の制御方法、及びプログラム
JP2023167880A (ja) 画像処理装置、画像処理方法、およびプログラム
JP2023009897A (ja) 画像処理システム
JP2021027520A (ja) 情報処理装置、情報処理方法、及びプログラム
JP2010087819A (ja) 入出力装置、入出力方法、及び入出力プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220602

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230131

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230214

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230417

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230509

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230706

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230725

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230823

R151 Written notification of patent or utility model registration

Ref document number: 7337553

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151