JP2021013149A - 画像処理システム、画像処理装置とその制御方法、及びプログラム - Google Patents

画像処理システム、画像処理装置とその制御方法、及びプログラム Download PDF

Info

Publication number
JP2021013149A
JP2021013149A JP2019127890A JP2019127890A JP2021013149A JP 2021013149 A JP2021013149 A JP 2021013149A JP 2019127890 A JP2019127890 A JP 2019127890A JP 2019127890 A JP2019127890 A JP 2019127890A JP 2021013149 A JP2021013149 A JP 2021013149A
Authority
JP
Japan
Prior art keywords
image processing
image data
image
data
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019127890A
Other languages
English (en)
Inventor
健 阿知波
Takeshi Achinami
健 阿知波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2019127890A priority Critical patent/JP2021013149A/ja
Priority to US16/918,414 priority patent/US11223743B2/en
Publication of JP2021013149A publication Critical patent/JP2021013149A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00095Systems or arrangements for the transmission of the picture signal
    • H04N1/00114Systems or arrangements for the transmission of the picture signal with transmission of additional information signals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/12Detection or correction of errors, e.g. by rescanning the pattern
    • G06V30/133Evaluation of quality of the acquired characters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00002Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
    • H04N1/00005Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for relating to image data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00002Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for
    • H04N1/00071Diagnosis, testing or measuring; Detecting, analysing or monitoring not otherwise provided for characterised by the action taken
    • H04N1/0009Storage
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00204Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server
    • H04N1/00209Transmitting or receiving image data, e.g. facsimile data, via a computer, e.g. using e-mail, a computer network, the internet, I-fax
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00127Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
    • H04N1/00204Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server
    • H04N1/00244Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server with a server, e.g. an internet server
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/04Scanning arrangements, i.e. arrangements for the displacement of active reading or reproducing elements relative to the original or reproducing medium, or vice versa
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/409Edge or detail enhancement; Noise or error suppression
    • H04N1/4092Edge or detail enhancement
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

【課題】受信側の装置では、受信した全ての文書画像データに対して共通の画像処理を実行しているため、受信した文書画像データに対して、必要な画像処理と不要な画像処理の両方を実行することになる。【解決手段】第1の画像処理装置と第2の画像処理装置とを有する画像処理システムであって、第1の画像処理装置は、画像データを取得し、その取得した画像データと、当該画像データに関する情報を前記第2の画像処理装置に送信する。第2の画像処理装置は、処理対象の画像データかどうかを判定するための条件を設定しておき、第1の画像処理装置から受信した画像データが、処理対象の画像データであるか否かを、前記条件と前記情報とに基づいて判定し、処理対象の画像データと判定されると、当該画像データに対して前記情報に基づく画像処理を実行し、その画像処理が実行された結果を保存する。【選択図】 図8

Description

本発明は、画像処理システム、画像処理装置とその制御方法、及びプログラムに関する。
従来、受発注業務や申込審査業務を行う企業などの組織は、必要な情報を迅速かつ確実に伝達するために、見積書、注文書、申込書などの帳票書類を使用し、郵送、電子メール、FAX(ファクシミリ)等を利用して送信している。このうち、特に、FAXは、多くの国と地域で通信網が整備されている上に、他の情報伝達手段と比べて即時性と確実性が高いことから、有用な情報伝達手段として広く活用されている。
一般に、このような業務を行う企業の担当者は、帳票書類に記載された情報を、その企業が備える所定の業務システムに入力する必要がある。その際、担当者は、その帳票書類に含まれる所定項目の記載内容を目視で確認しながら、手動で必要なデータを入力している。近年では、このデータ入力を効率化するために、FAXやスキャンで取得した文書画像データに対してOCR処理(文字認識処理)を適用し、それにより得られた文字列のデータを業務システムに自動で入力する取り組みがなされている。更に、このOCR処理そのものを効率化するために、処理対象の文書画像データを予め選別する技術も知られている。特許文献1は、第1の装置で帳票認識した特定書類の文書画像データのみを第2の装置に送信し、第2の装置で特定書類の文書画像データのみに対してOCR処理を適用することで、OCR処理効率を高める技術を記載している。
特開2018−42067号公報
しかしながら、特許文献1に記載の技術は、送信側の装置で、特定書類を予め選別して送信し、受信側の装置では、受信した全ての文書画像データに対して共通の画像処理を実行している。このため受信側の装置では、受信した文書画像データに対して、必要な画像処理と不要な画像処理の両方を実行する場合があった。即ち、例えば、送信側の装置で取得した文書画像データは、解像度の低下や圧縮ノイズなどの異なる劣化要因を有している。しかしながら受信側の装置では、これらを補正するための画像データの復元の要否を判断できないため、その要否を考慮することなく、共通の画像処理を実行していた。
また、送信側の複数の装置(MFP)と単一の装置(サーバ)とが接続されたシステムでは、送信側の複数の装置に特定の書類を選別できない装置が含まれる場合がある。そのような場合、受信側のサーバでは、複数の装置から受信した情報から、特定の情報を抽出する必要があるか否か判断できないため、そのような要否を考慮せずに共通の画像処理を実行することになる。
本発明の目的は、上記従来技術の問題点の少なくとも一つを解決することにある。
本発明の目的は、受信側の装置で、画像データに対する画像処理を効率的に実行できる技術を提供することにある。
上記目的を達成するために本発明の一態様に係る画像処理システムは以下のような構成を備える。即ち、
第1の画像処理装置と第2の画像処理装置とを有する画像処理システムであって、
前記第1の画像処理装置は、
画像データを取得する取得手段と、
前記取得手段により取得された画像データと、当該画像データに関する情報を前記第2の画像処理装置に送信する送信手段と、を有し、
前記第2の画像処理装置は、
前記画像データを受信する受信手段と、
処理対象の画像データかどうかを判定するための条件を設定する手段と、
前記受信した画像データが、前記処理対象の画像データであるか否かを、前記条件と前記情報とに基づいて判定する判定手段と、
前記判定手段により処理対象の画像データと判定されると、当該画像データに対して前記情報に基づく画像処理を実行する実行手段と、
前記実行手段により画像処理が実行された結果を保存する保存手段と、を有することを特徴とする。
本発明によれば、取得した画像データに対して、処理対象の画像データかどうかを判定した画像処理を実行することにより、受信側の装置で、画像データに対する画像処理を効率的に実行できるという効果がある。
本発明のその他の特徴及び利点は、添付図面を参照とした以下の説明により明らかになるであろう。なお、添付図面においては、同じ若しくは同様の構成には、同じ参照番号を付す。
添付図面は明細書に含まれ、その一部を構成し、本発明の実施形態を示し、その記述と共に本発明の原理を説明するために用いられる。
本発明の実施形態1に係る画像処理システムの構成例を示す図。 実施形態1に係る画像処理装置、学習装置、画像処理サーバのハードウェア構成の一例を説明するブロック図。 本発明の実施形態1に係る学習データの成り立ちを説明する図。 実施形態1に係る画像処理システムの利用シーケンスを説明する図。 図4のS407、S408及びS427、S428における、画像処理装置から画像処理サーバへのデータ送信処理を説明するフローチャート。 図4のS402及びS422における、学習装置による学習モデルの学習処理の流れを説明するためのフローチャート。 図4のS409及びS429において、画像処理サーバが、画像処理装置から受け取った画像データが処理対象の画像データであるか否かの判定処理を説明するフローチャート。 図4のS410或いはS430における、画像処理サーバによる画像処理制御の流れを説明するフローチャート。 ユーザによって明示的に画像処理の要否設定が行われた場合における、実施形態3に係る画像処理サーバによる処理対象判定の処理を説明するフローチャート。 注文書の画像例を示す図。 図4のS404或いはS424において、受注者(ユーザ)から画像処理サーバに与えられる画像復元及び情報抽出のための画像処理の要否を設定するための設定画面例を示す図。 入力画像(劣化画像)とオリジナル画像(正解画像)の一例を示す図(A)と、劣化画像と復元画像の一例を示す図(B)。
以下、添付図面を参照して本発明の実施形態を詳しく説明する。尚、以下の実施形態は特許請求の範囲に係る発明を限定するものでない。実施形態には複数の特徴が記載されているが、これら複数の特徴の全てが発明に必須のものとは限らず、また、複数の特徴は任意に組み合わせられてもよい。さらに、添付図面においては、同一もしくは同様の構成に同一の参照番号を付し、重複した説明は省略する。
[実施形態1]
図1は、本発明の実施形態1に係る画像処理システム100の構成例を示す図である。
この画像処理システム100は、画像処理装置101、学習装置102、画像処理サーバ103を有し、これらはネットワーク104を介して互いに接続されている。ここで、画像処理装置101、画像処理サーバ103は、ネットワーク104に対して、単一ではなく複数接続された構成であっても良い。具体的には、例えば、画像処理装置101は、複数の画像処理装置のそれぞれが、ネットワーク104を介して単一の画像処理サーバ103に対して接続された構成であっても良い。また、例えば、画像処理サーバ103は、画像処理サーバ103の高速演算リソースと大容量ストレージを互いに独立させて、高速演算リソースを有する第1のサーバ装置と、大容量ストレージを有する第2のサーバ装置とが接続された構成であっても良い。また学習装置102は、画像処理サーバ103による画像処理が、学習に基づく画像処理である場合に必要となる構成であって、必ずしも画像処理システム100に含まれなくても良い。即ち、本発明の実施形態1において、画像処理サーバ103で実行される画像処理は、学習に基づく画像処理ではなく、従来のアルゴリズムに基づく画像処理であっても良い。
画像処理装置101は、プリント、スキャン、FAX等の複数の機能を実現可能なMFP等で実現される。画像処理装置101は、例えば、帳票等の原稿をスキャンして取得した画像データに対して、所定の画像処理を行って得られた文書画像データを、画像処理サーバ103に送信する。また画像処理装置101は、例えば、不図示のFAX装置から、帳票等の原稿をスキャンして送信されたFAXデータに対して所定の画像処理を行って得られた文書画像データを、画像処理サーバ103に送信する。ここで、画像処理装置101から画像処理サーバ103に送信される文書画像データは、通常、通信データ量を削減する目的で、JPEG等の画像圧縮、解像度変換、二値化等の非可逆変換を施したデータであるため劣化画像と呼ぶことにする。
学習装置102は、圧縮ノイズ除去、高解像度化、多階調化等のように、劣化画像をオリジナル画像(原画像データ)に近づけるように復元するための学習モデルの学習を実行する。そして、学習装置102は、学習結果(ニューラルネットワークのパラメータ等)を生成する学習部として機能する。学習装置102は、例えば、エンジニアによって提供された入力画像データと正解画像データのペアである学習データを用いて学習することで、学習結果を生成する。学習装置102は、生成した学習結果を、ネットワーク104を介して画像処理サーバ103に送信する。
画像処理サーバ103は、画像処理装置101から受信した劣化画像データを復元したり、OCR処理によって、文書画像データに含まれる文字情報を抽出する画像処理部として機能する。画像処理サーバ103は、劣化画像データに対して、学習装置102が生成した学習結果を用いて、ニューラルネットワークによる画像復元を実行し、復元画像データを取得する。ニューラルネットワークを用いる機械学習手法の一つとしては、多層ニューラルネットワークを用いたディープラーニングが挙げられる。ここで画像処理サーバ103は、変換によって取得した復元画像データに対して、OCR処理を実行し、その結果として文字認識されたテキストデータを取得する。更に、画像処理サーバ103は、生成した復元画像データ、及び、文字認識で得られたテキストデータを、大容量ストレージに保存する。
ネットワーク104は、LANや公衆回線(WAN)等で実現されるものであって、画像処理装置101、学習装置102、画像処理サーバ103を互いに接続して、装置間でデータを送受信するのに使用される。
図2は、実施形態1に係る画像処理装置101、学習装置102、画像処理サーバ103のハードウェア構成の一例を説明するブロック図である。
図2(A)は、実施形態1に係る画像処理装置101のハードウェア構成例を説明するブロック図である。
画像処理装置101は、CPU201、ROM202、RAM204、プリンタ205、スキャナ206、原稿搬送部207、ストレージ208、入力部209、表示部210、外部インタフェース211等を有し、これらはバス203を介して接続されている。CPU201は、画像処理装置101における動作全体を制御するための制御部として機能し、CPU201は、ROM202に記憶されたブートプログラムを実行して、ストレージ208に記憶された制御プログラムをRAM204に展開して実行する。それによって、CPU201は、画像処理装置101のプリント、スキャン、FAX等の機能を実現する。ROM202は、書き換えできない不揮発性メモリで、画像処理装置101を起動するブートプログラム等を格納している。バス203は、画像処理装置101を構成するデバイス間で相互に制御信号やデータを送受信する。RAM204は揮発性メモリで実現され、CPU201により実行される制御プログラムの展開エリア、及び制御プログラムを実行する際のワークメモリとして使用される。
プリンタ205は、画像データに基づいて記録媒体(シート)に画像を印刷する。スキャナ206は、文字、図表、写真等が印刷された記録媒体(シート)を光学的に読み取って、その画像データを取得する。原稿搬送部207は、ADF(オートドキュメントフィーダ)等で実現されるものであって、原稿台に載置された帳票等の原稿を検知し、検知した原稿を1枚ずつスキャナ206に搬送する。ストレージ208は、例えばHDD(ハードディスクドライブ)等で、前述の制御プログラムや画像データを記憶する。入力部209は、タッチパネルやハードキー等を有し、ユーザからの画像処理装置101に対する操作入力を受け付ける。表示部210は、画像処理装置101の設定画面をユーザに対して表示する。尚、表示部210は入力部209のタッチパネルと一体であってもよい。外部インタフェース211は、画像処理装置101とネットワーク104との間を接続し、不図示のFAX装置からFAXデータを受信したり、画像処理サーバ103に対して文書画像データを送信する。
図2(B)は、実施形態1に係る学習装置102のハードウェア構成例を説明するブロック図である。
学習装置102は、CPU231、ROM232、RAM234、ストレージ235、入力部236、表示部237、外部インタフェース238、GPU(Graphics Processing Unit)239を有する。これらはバス233を介して互いに接続される。CPU231は、学習装置102における動作全体を制御するための制御部である。CPU231は、ROM232に記憶されたブートプログラムを実行して、ストレージ208に記憶された学習プログラムをRAM234に展開し、それを実行する画像データの復元を行うためのニューラルネットワークを学習する。ROM232は、学習装置102を起動するブートプログラムを格納する。バス233は、学習装置102を構成するデバイス間で相互にデータを送受信する。RAM234は、CPU231が学習プログラムを展開するためのメモリ、及びCPU231が学習プログラムを実行する際のワークメモリを提供する。ストレージ235は、HDD(ハードディスクドライブ)等で実現されるものであって、前述の学習プログラムや学習データを記憶する。入力部236は、ポインティングデバイスやキーボード等を含み、エンジニアからの学習装置102に対する操作入力を受け付ける。表示部237は、学習装置102の設定画面をエンジニアに対して提示するのに使用される。外部インタフェース238は、学習装置102とネットワーク104との間を接続するものであって、不図示のPC等の端末装置から学習データを受信したり、画像処理サーバ103に対して学習モデルを送信したりする。GPU239は、画像処理プロセッサを含む演算部である。GPU239は、例えば、CPU231による制御情報に基づいて、与えられた学習データにに基づいて、学習モデルを構成するパラメータを更新するための演算を実行する。
図2(C)は、実施形態1に係る画像処理サーバ103のハードウェア構成例を説明するブロック図である。
画像処理サーバ103は、CPU261、ROM262、RAM264、ストレージ265、入力部266、表示部267、外部インタフェース268を有し、これらはバス263を介して互いに接続される。CPU261は、画像処理サーバ103における動作全体を制御するための制御部である。CPU261は、ROM262に記憶されたブートプログラムを実行して、ストレージ265に記憶された画像処理プログラムをRAM264に展開して実行することで、画像データの復元や情報抽出の画像処理を選択的に実行する。ROM262は、画像処理サーバ103を起動するブートプログラムを格納する。バス263は、画像処理サーバ103を構成するデバイス間で相互にデータや制御信号等を送受信する。RAM264は、CPU261が実行する画像処理プログラムの展開エリア、及び画像処理プログラムを実行する際のワークメモリを提供する。ストレージ265は、HDD(ハードディスクドライブ)等で実現され、前述の画像処理プログラムや学習モデルを記憶する。入力部266は、ポインティングデバイスやキーボード等を有し、ユーザからの画像処理サーバ103に対する操作入力を受け付ける。表示部267は、画像処理サーバ103の設定画面をユーザに対して提示するのに使用される。外部インタフェース268は、画像処理サーバ103と、ネットワーク104との間を接続するものであって、学習装置102から学習モデルを受信したり、画像処理装置101から文書画像データを受信する。
図4は、実施形態1に係る画像処理システムの利用シーケンスを説明する図である。ここでは、受発注業務において、発注者から受注者に対して注文書などの帳票が送付された際に、受注者(ユーザ)が、当該帳票の画像データ、及び、その画像データに含まれるテキスト情報を業務システム(画像処理サーバ103)に保存する場合を説明する。
図4(A)は、発注者から受注者に対して、郵送によって注文書などの帳票原稿が送付された際に、受注者が、その帳票原稿をスキャンして保存する例を説明する図である。
まずS401で、画像処理システム100を提供するメーカのエンジニアは、学習装置102に画像復元モデルの学習を実行させるために、学習データを入力する。学習装置102はS402で、その入力された学習データを用いて、ニューラルネットワークの学習を実行する。この学習モデル更新の詳細は、図6を参照して後述する。そして学習装置102は、その学習が終了するとS403で、画像処理サーバ103に対して、学習結果を送信する。これらの工程は、これ以降で説明する工程よりも前に予め行われる工程である。
次にS404で受注者は、業務システムに保存したい帳票を選別するための判断条件として、予め、デバイスID、ユーザID、日時、時間帯、定型帳票フォーム等のうち、1つ以上の条件を設定する。このように例えば、受注者側の企業で、担当部門で利用可能な画像処理装置101のデバイスIDや担当者のユーザIDを予め登録する。これにより、異なる複数の業務で帳票を扱う場合でも、特定の受発注業務で扱う帳票を選別して業務システムに保存できる。また、例えば、受注者側の企業で、通常営業する日時や時間帯を予め登録することで、営業時間内に正しく受注処理された帳票のみを選別して業務システムに保存できる。更に、例えば、受注者側の企業で、受発注業務で用いる注文書等の定型帳票フォームを予め登録することで、帳票として認識できる、帳票DBに登録済の定型帳票フォームで作成された注文書等の帳票のみを選別して業務システムに保存できる。
こうして初期設定が完了した後、S405で受注者は、発注者が郵送などによって送付した帳票原稿を受け取る。これを受けてS406で受注者は、その受け取った帳票原稿を画像処理装置101でスキャンして送信するように指示する。
これにより画像処理装置101はS407で、受注者の指示に従い、その原稿をスキャンして取得した画像データを画像処理サーバ103に送信する。更にS408で画像処理装置101は、その原稿のスキャンにおける画像データ取得時の識別情報を画像処理サーバ103に送信する。
次にS409で画像処理サーバ103は、S404で与えられた判断条件に従って、受信した画像データが処理対象の画像データであるか否かを判定する。この処理対象の画像データかどうかの判定の詳細は、図7を参照して後述する。次にS410で画像処理サーバ103は、処理対象の画像データと判定された画像データに対して、S403で与えられた学習モデルを用いて、画像データの復元や情報抽出の画像処理を選択的に実行する。この画像処理制御の詳細は、図8を参照して後述する。次にS411で画像処理サーバ103は、S410の画像処理の結果、生成した画像データの復元結果としての復元画像データ、及び情報抽出結果としての抽出テキストを、画像処理サーバ103が有する所定の記憶領域に保存する。そして最後にS412で画像処理サーバ103は、受注者に対して、その処理完了を通知する。尚、ここで用いる通知方法は、例えば、受注者が画像処理サーバ103の表示部237を参照した際に、処理完了ジョブの通知を表示する方法でも良い。また或いは、例えば、S406で原稿のスキャン指示を行ったログインユーザが有するメールアドレスやメッセージアカウントに対して処理完了ジョブの通知を送信する方法でも良い。
図4(B)は、発注者のFAX装置から受注者(ユーザ)側の画像処理装置101に対してFAX送信された際に、その画像処理装置101が、そのFAXデータを業務システム(画像処理サーバ103)に転送して保存する例を説明する図である。
図4(B)のS421〜S423は、図4(A)のS401〜S403と全く同様であるため、その説明を省略する。次にS424で受注者は、業務システムに保存したい帳票を選別するための判断条件として、予め、送信元FAX番号(ファクシミリ番号)、送信先FAX番号、IPアドレス、ポート番号、日時、時間帯、定型帳票フォーム等のうち、1つ以上の条件を設定する。このように、例えば、受注者側の企業で、得意先の発注者の送信元FAX番号や、特定の受注業務専用の送信先FAX番号を予め登録することで、異なる複数の業務で帳票を扱う場合でも、特定の受発注業務で扱う帳票を選別して業務システムに保存できる。また例えば、受注者側の企業で、担当部門で利用可能な画像処理装置101のIPアドレスやポート番号を予め登録することで、異なる複数の業務で帳票を扱う場合でも、特定の受発注業務で扱う帳票を選別して業務システムに保存できる。また、受注者側の企業で、通常営業する日時や時間帯を予め登録することで、営業時間内に正しく受注処理された帳票のみを選別して業務システムに保存できる。更に、例えば、受注者側の企業で、受発注業務で用いる注文書等の定型帳票フォームを予め登録することで、帳票として認識できる、帳票DBに登録済の定型帳票フォームで作成された注文書等の帳票のみを選別して業務システムに保存できる。
次にS425で、受注者は、FAX受信時の画像データを、予め指定している業務システム(画像処理サーバ103)に転送するように設定する。
そしてS426で、発注者側のFAX装置から受注者(ユーザ)側の画像処理装置101に対してFAXデータが送信される。これにより画像処理装置101は、S425で与えられた転送設定に従い、画像処理サーバ103に対して、そのFAXデータを転送する。その後の図4(B)のS427〜S432は、図4(A)のS407〜S412と全く同であるため、その説明を省略する。
図3は、本発明の実施形態1に係る学習データの成り立ちを説明する図である。ここでは、図3を参照して、図4(A)のS401、及び、図4(B)のS421において、エンジニアが学習装置102に入力した学習データについて説明する。
学習データは、学習装置102が学習部でニューラルネットワークを学習するために使用するデータである。ニューラルネットワークを学習するためには、学習データとして、変換前後のデータのペアが必要となる。具体的には、例えば、FAXやスキャンした後の低品位の画像データを変換前のデータ(入力画像=劣化画像)と、原稿をプリントする前の高品位の画像データを変換後のデータ(正解画像)とを学習データとして用意する。そして、その学習データを、劣化画像を正解画像に復元するための学習に用いる。即ち、例えば、FAXを想定した場合、図12(A)に示したサンプル1及びサンプル2に示すように、劣化画像としての入力画像と、オリジナル画像である正解画像とのペアを、学習データとして大量に用意するものである。
図12(A)は、入力画像(劣化画像)とオリジナル画像(正解画像)の一例を示す図である。
図3に示すように、学習データ306は、正解画像と入力画像のペアで構成されるデータである。ここで、正解画像305は、PDLデータ301を所定の解像度で描画処理(RIP)した結果として生成される。一方、入力画像304は、PDLデータ301を印刷装置で印刷した原稿302をスキャナで読み取ってスキャン画像303を生成し、このスキャン画像303に所定の画像処理を適用することで生成される。
具体的には、例えば、FAX送受信時の劣化画像を再現するために、解像度変換や二値化などのFAX画像処理を実行して、入力画像を生成する。また、具体的には、例えば、スキャン送信時の劣化画像を再現するために、スキャナの特性に合わせた画像補正やJPEG等の画像圧縮などのスキャン画像処理を実行して入力画像を生成する。ここにおいて、エンジニアの開発環境下で画像データを生成する工程で用いる装置は、画像処理装置101のプリンタ205、スキャナ206と同様の特性を有することが望ましい。尚、スキャン画像303は、プリンタ205やスキャナ206を実際に動作させて取得した画像データの代わりに、プリント及びスキャンを疑似的に再現するシミュレーションによって生成した画像データを用いても良い。また、高品位の画像データの復元を行うには、大量の学習データを用いてニューラルネットワークを学習する必要があるが、ここでは予め十分な学習データが与えられた条件下で学習が行われるものとして説明する。
図6は、図4のS402及びS422における、学習装置102による学習モデルの学習処理の流れを説明するためのフローチャートである。尚、図6で示す処理は、学習装置102のCPU231が、ROM232或いはストレージ235のいずれかに記憶されているプログラムをRAM234に展開し、その展開したプログラムを実行することにより達成される。
先ずS601でCPU231は、GPU239を用いて、学習モデルとして用いられるニューラルネットワークを構成する重みパラメータの値を初期化する。即ち、CPU231は、例えば、ニューラルネットワークを構成する重みパラメータをランダムな値に設定したり、前回学習済の値をロードして再設定したりする。次にS602に進みCPU231は、GPU239を用いて、図4のS401及びS421で入力された学習データのうち、解像度、階調、圧縮方式(異なる圧縮率を含む)の条件が合致する入力画像と正解画像のペアを学習データとして取得する。次にS603に進みCPU231は、GPU239を用いて、S601で初期化したニューラルネットワークに対して、入力画像を入力した際の出力画像と、入力画像とペアになっていた正解画像との間で、画素値の誤差を算出する演算を実行するように制御する。次にS604に進みCPU231は、GPU239を用いて、一般に、誤差逆伝搬法(バックプロパゲーション)と呼ばれる、学習モデルの重みパラメータの値を更新する演算を実行するように制御する。そしてS605に進みCPU231は、GPU239を用いて、所定の学習データ数を用いて所定の学習回数だけ演算処理が終了したか否かを判定する。ここで、CPU231は、所定の学習データを用いた所定の学習回数が終了したと判定するとS606に処理を進め、そうでないときはS602〜S604の演算を繰り返す。
S606でCPU231は、GPU239を用いて、学習済モデルのニューラルネットワークを構成する重みパラメータの値を、ストレージ235等の記憶部に保存する。S606で獲得した学習済モデルは、例えば、スキャンして低解像度で送信された入力画像から、オリジナルの原稿相当の高解像度の正解画像に対して、単純に既存の画像に置き換えるのではなく、未知の画像も含めて変換できるような画像変換部として形成される。
具体的には、例えば、学習済モデルは、S602〜S604を繰り返し実行して入力画像と正解画像の差分傾向を学習することで、その原稿のスキャン時の読取ノイズによって発生した画像データ中の孤立点を除去する画像復元方法を獲得する。また、具体的には、例えば、学習済モデルは、低解像度化や二値化によって発生した画像データ中の描画オブジェクトにおけるエッジ部分のがたつきを抑制して平滑化する画像復元方法を獲得する。こうして獲得した画像復元方法を備えた学習済モデルを用いることで、例えば、図12(B)のサンプル1及びサンプル2で示した劣化画像を、それぞれ、復元画像として示すように復元することができる。
図12(B)は、劣化画像と復元画像の一例を示す図である。
次にS607に進みCPU231は、他のデータ形式での学習データを用いて学習モデルを更新するか否かを判定する。ここで、CPU231は、他のデータ形式での学習データを用いて学習モデルを更新すると判定ときはS601に処理を進めて、S601〜S606の処理を繰り返う。一方、他のデータ形式での学習データを用いて学習モデルを更新しないと判定したときは、この学習モデル更新の処理を終了する。
ここで、他のデータ形式とは、例えば、異なる解像度(例:600×600dpi、300×300dpi、200×100dpi)の条件下で生成した正解画像や入力画像をペアにして学習データとして学習するものである。また、生成する他のデータ形式としては、例えば、異なる階調(16ビット階調=65536色、8ビット階調=256色、1ビット階調=2色)の条件下で生成した正解画像や入力画像をペアにして学習するものである。ここで、生成する他のデータ形式は、画像形成装置101で受信可能な全てのデータ形式を、OCRエンジンが推奨する条件を満たすデータ形式に変換できるように、正解画像と入力画像のペアの組合せを網羅するようにしても良い。
図5は、図4のS407、S408及びS427、S428における、画像処理装置101から画像処理サーバ103へのデータ送信処理を説明するフローチャートである。尚、図5で示す処理は、画像処理装置101のROM202或いはストレージ208に記憶されているプログラムをRAM204に展開し、CPU201がその展開したプログラムを実行することにより達成される。
まずS501でCPU201は、図4のS406及びS425で設定された画像送信設定情報を取得する。具体的には、S406のスキャン指示、或いは、S425でのFAX受信の転送設定において、画像処理サーバ103のストレージ265への格納先フォルダを特定するための送信先アドレスを取得する。次にS502に進みCPU201は、発注者側のFAX装置から送信されたFAXデータを受注者側の画像処理装置101で受信したか否かを判定する。ここでCPU201は、FAXデータを受信したと判定するとS503に処理を進め、FAXデータを受信していないと判定するとS506に遷移する。
S503でCPU201は、受信したFAXデータに対して、画像処理を実行する。具体的には、画像処理装置101が実行可能な孤立点除去やスムージング等のフィルタを適用することで、受信したFAXデータを、所定の画像処理アルゴリズムに従って補正したFAX画像データ(図1の劣化画像)を生成する。次にS504に進みCPU201は、S503で生成したFAX画像データ(劣化画像)を画像処理サーバ103に送信する。次にS505に進みCPU201は、S502で受信したFAXジョブに関して、画像処理装置101で取得可能な識別情報を画像処理サーバ103に送信する(図4のS428)。
具体的には、例えば、画像処理装置101は、送信元FAX番号、送信先FAX番号、IPアドレス、ポート番号、FAX受信日時等の識別情報を画像処理サーバ103に送信する。これらの識別情報は、特定の受発注業務でやり取りされる文書画像データであるか否かの識別に利用可能と考えられる情報である。更に、画像処理装置101は、画像処理サーバ103で実現可能な画像復元を適用する際の劣化画像の条件となる識別情報を画像処理サーバ103に送信する。この識別情報は、解像度(例:200×100dpi、200×200dpi)、圧縮方式(例:MR、MMR、JBIG、JPEG)等である。そしてS506に処理を進める。
S506でCPU201は、S406で示したように、受注者が画像処理装置101を用いて原稿のスキャンを実行したか否かを判定する。ここでCPU201は、スキャンが指示されたと判定するとS507に処理を進め、スキャンが指示されていないと判定すると、この処理終了する。S507でCPU201は、原稿を光学的に読み取って取得された画像データに対して画像処理を実行する。具体的には、画像処理装置101が実行可能なスキャナ206の特性に合わせた画像補正やJPEG等の画像圧縮を実行することで、その画像データを所定の画像処理アルゴリズムに基づいて補正した画像データ(図1の劣化画像)を生成する。次にS508に進みCPU201は、S507で生成したスキャン画像データ(劣化画像)を画像処理サーバ103に送信する。そしてS509に進みCPU201は、実行されたスキャンジョブに関して画像処理装置101で取得可能な識別情報を、画像処理サーバ103に送信する(図4のS408)。
具体的には、例えば、画像処理装置101は、特定の受発注業務でやり取りされる文書画像データであるか否かの識別に利用可能と考えられる、デバイスID、ログインユーザID、スキャン日時等の識別情報を画像処理サーバ103に送信する。更に、画像処理装置101は、画像処理サーバ103で実現可能な画像復元を適用する際の劣化画像の条件となる識別情報を画像処理サーバ103に送信する。この識別情報は、解像度(例:300×300dpi、150×150dpi)、圧縮方式(例:高圧縮PDF、JPEG)、階調(例:フルカラー、白黒二値)等である。
こうして画像処理装置101は、原稿をスキャンして得られた画像データ、或いはFAX受信して得られた画像データを、その画像データの復元に参照される情報とともに画像処理サーバ103に送信することができる。
図7は、図4のS409及びS429において、画像処理サーバ103が、画像処理装置101から受け取った画像データが処理対象の画像データであるか否かの判定処理を説明するフローチャートである。尚、図7で示す処理は、画像処理サーバ103のCPU261がROM262或いはストレージ268に記憶されているプログラムをRAM264に展開して実行することにより実現される。
S701でCPU261は、図5のS504或いはS508(或いは図4のS407,S427)で送信されたFAX画像データ、或いはスキャン画像データである文書画像データを取得する。次にS702に進みCPU261は、図5のS505,S509(或いは図4のS407,S427)で送信された、文書画像データに付随する識別情報を取得する。この識別情報には、ジョブに関する識別情報と、画像に関する識別情報が含まれる。即ち、ジョブに関する識別情報は、FAXジョブであれば、送信元FAX番号、送信先FAX番号、IPアドレス、ポート番号、FAX受信日時等が相当し、スキャンジョブであれば、デバイスID、ログインユーザID、スキャン実行日時等が相当する。また、画像に関する識別情報は、解像度(例:300×300dpi、200×100dpi)、圧縮方式(例:MR、MMR、JBIG、JPEG、高圧縮PDF)、階調(例:フルカラー、白黒二値)等が相当する。
次にS703に進みCPU261は、S702で取得したジョブに関する識別情報を有する文書画像データが、情報抽出対象として登録された条件と合致するか否かを判定する。ここで、CPU261は、条件に合致していると判定するとS704に遷移し、条件に合致していないと判定するとS709に遷移する。ここで、情報抽出対象の条件に合致するか否かの判定は、具体的には、例えば、送信元FAX番号が、登録済のFAX番号リストに含まれるか否かを判定することによって実現される。また或いは、情報抽出対象の条件に合致するか否かの判定は、具体的には、例えば、スキャン実行したユーザが、登録済の業務担当者リストに含まれるか否かを判定することで実現される。尚、前述の例はあくまで一例であって、ユーザの所望の特定帳票を絞り込むための1つ以上の条件を設定することで、少ない条件であっても効果的に特定帳票を選別することができる。
S704でCPU261は、S701で画像処理装置101から受信した画像データが持つ画像特徴量を計算し、帳票DBに登録済の帳票が持つ画像特徴量との類似度に基づく帳票認識を実行する。そしてS705に進みCPU261は、S704で得られた照合結果が、帳票DBに登録済のいずれかの帳票に該当するか否かを判定する。ここで、帳票DBに登録済のいずれかの帳票に該当すると判定したときはS706に遷移し、いずれの帳票にも該当しないと判定したときはS709に遷移する。尚、ここで用いる帳票認識技術は、例えば、罫線、枠線、キーワード、記号、マーク、コード等の所定の注目領域のパターンマッチングによって識別可能な公知の技術を用いることで実現できる。尚、ここで、S704の帳票認識の前にS703の対象判定を設けることで、帳票認識処理を全ての帳票に対して実行する必要がなくなるため、帳票認識処理そのものも効率的に実行することができる。
S706でCPU261は、S705で帳票DBに登録済の帳票に該当すると判定された文書画像データに対して、情報抽出対象であることを示すための情報抽出フラグをオンに設定する。次にS707に進みCPU261は、S702で取得した画像に関する識別情報を有する文書画像データが、画像復元対象となる劣化画像の条件と合致するか否かを判定する。ここでCPU261は、その条件に合致していると判定するとS708に遷移し、条件に合致していないと判定するとS709に遷移する。S708でCPU261は、S707で、画像復元対象となる劣化画像の条件と合致すると判定された文書画像データに対して、画像復元対象であることを示すための画像復元フラグをオンに設定する。そしてS709に進みCPU261は、処理対象判定を実行すべき次の画像データがあるか否か判定し、次の画像データがあると判定したときは、前述したS701〜S708を繰り返し実行する。一方、次の画像データが無いと判定したときは、この処理を終了する。
以上説明したようにこの処理によれば、画像処理サーバ103は、画像処理装置101から受信した画像データが、登録済のいずれかの帳票に該当するかどうか判定し、該当すると判定した画像データに対して、更に画像の復元対象かどうか判定する。このように、登録及び復元対象の画像データを絞り込むことにより、帳票の認識及び復元対象かどうかの判定処理を全ての画像データに対して実行する必要がなくなるため、その処理を効率的に実行することができる。
図8は、図4のS410或いはS430における、画像処理サーバ103による画像処理制御の流れを説明するフローチャートである。尚、図8で示す処理は、画像処理サーバ103のCPU261がROM262或いはストレージ268に記憶されているプログラムをRAM264に展開して実行することにより実現される。
先ずS801でCPU261は、図7のS706で、情報抽出フラグがオンに設定されているか否かを判定する。ここで、CPU261は、情報抽出フラグがオンに設定されていると判定するとS803に遷移し、情報抽出フラグがオンに設定されていないと判定するとS802に遷移する。S802でCPU261は、S701で取得した文書画像データに対して、画像復元や情報抽出を実行せずに、受信した画像データを劣化画像の状態でそのまま保存してS809に処理を進める。
一方で、情報抽出フラグがオンに設定されていると判定した場合はS803に進みCPU261は、図7のS708で、画像復元フラグがオンに設定されているか否かを判定する。ここでCPU261は、画像復元フラグがオンに設定されていると判定するとS804に遷移し、画像復元フラグがオンに設定されていないと判定するとS807に遷移する。
こうして対象となる画像データが特定された状態でS804に進みCPU261は、図4のS403或いはS423で画像処理サーバ103に保存された、所定の学習済モデルを選択して取得する。ここにおいて、選択される学習済モデルは、図7のS702で取得した画像に関する識別情報、即ち、解像度、圧縮方式、階調等の劣化画像の条件を参照し、劣化画像の条件と合致する入力画像の条件を持つ学習済モデルである。
そしてS805に進みCPU261は、S701で取得した画像データを入力画像として、S804で取得した学習済モデルに入力する。そして、その学習モデルに従って復元された画像データを、復元された画像データとして取得する。即ち、例えば、FAXを想定した場合、FAXに対応する学習済モデルを用いることにより、例えば図12(B)のサンプル1及びサンプル2で示した劣化画像を、それぞれ復元された結果である復元画像として取得する。そしてS806に進みCPU261は、S805で取得した復元画像を、RAM264やストレージ265の記憶部に保存する。
次にS807に進みCPU261は、S701で取得した文書画像データとしての劣化画像、又は、劣化画像を基に復元した復元画像に対して、OCR処理を実行して、その画像データに含まれる項目情報を抽出し、抽出テキストとして出力する。即ち、例えば、図12(B)のサンプル1及びサンプル2で示した劣化画像、或いは、復元画像を基にして、それぞれOCR結果としての抽出テキストを出力する。ここにおいて、例えば、「源」、「D」の劣化画像に対するOCR結果が、「瀧」、「O」のように誤認識されたのに対し、復元画像に対するOCR結果は、「源」、「D」として正しく認識できるようになる。尚、ここで用いるOCR処理は、S701で取得し、S704で照合した帳票が活字帳票であれば活字OCR処理、手書き帳票であれば手書きOCR処理、というように、対象帳票に含まれる文字種別に応じて処理モジュールを選択して用いるようにしても良い。
そしてS808に進みCPU261は、S807で出力した抽出テキストを、所定の業務システムへの入力データとして保存する。具体的には、例えば、図10に示すように、「商品名」、「数量」、「単価」等の各項目(キー)に対応する抽出テキストの値(バリュー)が、「部品A」、「200」、「450」である場合、CPU261は次の制御を行う。すなわち、CPU261は、業務システムの各項目の入力欄に、それら抽出したテキストの値を入力して保存する。
図10は、注文書の画像例を示す図である。
次にS809に進みCPU261は、画像処理制御を実行すべき次の画像データがあるか否か判定する。ここでCPU261は、次の画像データがあると判定した場合はS801に進んで、上述したS801〜S808を繰り返し実行し、次の画像データが無いと判定したときは、この処理を終了する。
以上説明したように実施形態1によれば、受信側の装置により、受信した文書画像データに対する画像処理を効率的に実行することができる。即ち、解像度の低下や、圧縮ノイズなどの劣化要因を有する文書画像データに対して、受信側の装置で、これらを補正するための画像復元の要否を判定した上で、その画像データに対する画像処理を効率的に実行することができる。
また、送信側の複数の装置(MFP)と受信側の単一の装置(サーバ)が接続されたシステム構成であっても、受信側の装置で、画像データと共に受信した識別情報に基づいて、その受信画像データに基づく情報抽出の要否を判定する。それによって、受信した画像データに対する画像処理を効率的に実行できる。
ここにおいて、特に、ニューラルネットワークを用いた画像処理のように計算量が多く付加価値が高い機能を受信側の装置(サーバ)で提供する場合を想定する。そのような場合、実施形態1によれば、大量の画像データに対しても処理対象を取捨選択し、その画像データに対する処理効率を向上できる。例えば、受信側の装置で、ユーザが業務効率化したい帳票ワークフローに対象を絞ることで、ユーザの待ち時間を短縮することができる。更に、例えば、一般的なクラウドサービスと同様に、受信側の装置(サーバ)のサービス利用コストが計算リソース(CPU、GPU、RAM等)の利用時間によって従量課金される場合でも、その利用コストを低減することができる。
[実施形態2]
上述の実施形態1は、例えば帳票単位で、画像復元や情報抽出の画像処理を実行するか否かを選択的に切り替えるものであった。これに対して実施形態2は、例えば、帳票内の指定領域のみを処理対象として、画像の復元や情報抽出のための画像処理を実行するものである。尚、実施形態2に係る画像処理システムの構成、及び画像処理装置101、学習装置102及び画像処理サーバ103のハードウェア構成は、前述の実施形態1と同様であるため、その説明を省略する。
図10は、帳票の一例である注文書の一例を示し、文書画像データに対して、画像復元と情報抽出の画像処理を適用する処理対象領域を指定領域のみに限定する例を説明するための図である。
上述の実施形態1では、帳票単位で、画像復元フラグがオンに設定されていた場合、例えば、図10で示した注文書のページ全体1000に対して、画像の復元を実行する必要があった。
これに対して実施形態2では、S704で、対象の帳票であると認識した結果としての定型帳票フォームにおいて、予め、画像を復元して情報抽出したい指定領域の位置座標を設定しておくものである。即ち、例えば、図10において、会社名1001、注文書番号1002、及び、注文内容1003の各セルに含まれる項目の値(バリュー)の指定領域のみを入力画像として切り出して、それぞれについて画像復元を実行して、復元画像を生成する。
これによって、画像復元に要する時間は、処理対象の画像面積が小さくなるほど短縮できる。また、復元画像に対するOCR処理も同様に、ページ全体のOCR処理を実行する場合と比較して、処理時間を短縮できる。これは、即ち、ページ全体のOCR処理を実行する場合と比較して、OCR対象となる文字領域を探索して推定する処理(ブロックセレクション)が簡略化され、かつ、OCR対象の文字列そのものも必要最小限に抑制されるためである。
尚、実施形態2に係る画像処理サーバ103による画像処理制御は、前述の実施形態1の図8と全く同様の流れで実現されるため、その説明を省略する。但し、図8のS805の画像復元を適用する際は、実施形態1のようにページ全体ではなく、ページ内の情報抽出したい指定領域のみを入力画像として切り出したものを使用するだけで良い。また、S807の情報抽出を適用する際も、実施形態1のようにページ全体ではなく、S805で入力画像として切り出して生成した復元画像に対して、それぞれOCR処理を実行すれば良い。
以上説明したように実施形態2によれば、ユーザが業務効率化したい帳票内の指定領域のみを処理対象とすることで、帳票のページ全体に対して画像処理を実行する場合と比較して、画像復元や情報抽出の画像処理を効率的に実行することができる。即ち、ユーザが業務効率化したい帳票ワークフローにおいて、帳票を取捨選択するだけでなく、処理領域も限定することで、ユーザの待ち時間を更に短縮することができる。
[実施形態3]
前述の実施形態1,2に係る画像処理サーバ103による画像処理制御では、ユーザによって与えられた処理対象の帳票に対する制約を判定条件としていた。これに対して実施形態3では、ユーザによって与えられた処理対象の帳票に対する画像処理の要否を判定条件とするものである。尚、実施形態3に係る画像処理システムの構成、及び画像処理装置101、学習装置102及び画像処理サーバ103のハードウェア構成は、前述の実施形態1と同様であるため、その説明を省略する。
図11は、図4のS404或いはS424において、受注者(ユーザ)から画像処理サーバ103に与えられる画像復元及び情報抽出のための画像処理の要否を設定するための設定画面例を示す図である。
ここで、この設定画面は、画像処理サーバ103の表示部267、又は、画像処理サーバ103とデータ通信可能な画像処理装置101の表示部210を用いて表示されても良い。また、この設定画面に対してユーザから与えられる設定変更の操作入力は、画像処理サーバ103の入力部266、又は、画像処理サーバ103とデータ通信可能な画像処理装置101の入力部209を介して入力されても良い。
図11(A)〜(C)は、画像復元のための画像処理の要否を設定する設定画面例を示す図である。また図11(D)〜(F)は、情報抽出の一例として、OCR出力設定を行うための画面例を示す図である。
図11(A)は、入力画像(劣化画像)から復元画像を生成して出力する設定例を示す。図11(B)は、入力画像(劣化画像)から復元画像を生成せずに、入力画像をそのまま出力する設定例を示す。図11(C)は、入力画像(劣化画像)及び復元画像のいずれも出力しない設定例を示す。図11(D)は、入力画像(劣化画像)から復元画像を生成し、その復元画像を使用してOCR処理を行う設定例を示す。図11(E)は、入力画像(劣化画像)から復元画像を生成せずに、入力画像を使用してOCR処理を行う設定例を示す。図11(F)は、入力画像或いは復元画像に対してOCR処理を行わない設定例を示す。
例えば、ユーザが、復元画像に対するOCR結果としての抽出テキストのみを入力したい場合は、図11(C)と(D)を設定する。これにより、OCR対象領域のみに対して画像復元を実行できるとともに、OCR処理後は復元画像を保存せずに破棄できる。
また、例えば、ユーザが、復元した結果である復元画像のみを閲覧して、業務システムへの入力は、その復元画像の目視によってユーザが手動入力したい場合は図11(A)と(F)を設定する。これにより、復元画像のみを取得する画像処理を実行できる。
また例えば、ユーザが、画像復元のような画像処理による加工を施さない受信した画像データそのもの(劣化画像)を保存したい場合、図11(B)と(E)を設定する。これにより、受信した画像データそのものを保存できる。尚、図11の設定は、送信された全ての帳票に対して共通で設定可能な構成であって良いし、定型帳票フォームとして登録済の各帳票について個別に設定可能な構成であっても良い。
図9は、図11で示した画像出力設定やOCR出力設定のように、ユーザによって明示的に画像処理の要否設定が行われた場合における、実施形態3に係る画像処理サーバ103による処理対象判定の処理を説明するフローチャートである。尚、図9は、前述の実施形態1の図7に対応するものであって、図7のS701〜S709は、図9のS903に対応する。
S901でCPU261は、図11で説明したユーザ指定による画像復元及び情報抽出の画像処理に関する要否設定情報を参照する。次にS902に進みCPU261は、S901で、ユーザ指定があったか否かを判定する。ここで、CPU261は、ユーザ指定があったと判定したときはS904に遷移し、ユーザ指定が無かったと判定したときはS903に遷移する。S903でCPU261は、図7を参照して説明した処理対象判定を実行して、この処理を終了する。
一方、S902でCPU261は、ユーザ指定があったと判定したときはS904に進みCPU261は、S901で参照した画像復元に関する要否設定情報に基づいて、画像復元フラグをオンまたはオフに設定する。そしてS905に進みCPU261は、S901で参照した情報抽出に関する要否設定情報に基づいて、情報抽出フラグをオン又はオフに設定して、この処理を終了する。
以上説明したように実施形態3によれば、ユーザが帳票ワークフローで実際に使用したい画像(受信した文書画像データの劣化画像、又は、復元画像)、或いはテキストに基づいて、必要十分な画像及びテキストを効率的に出力することができる。
(その他の実施形態)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
本発明は上記実施形態に制限されるものではなく、本発明の精神及び範囲から逸脱することなく、様々な変更及び変形が可能である。従って、本発明の範囲を公にするために、以下の請求項を添付する。
101…画像処理装置、102…学習装置、103…画像処理サーバ、201…CPU(画像処理装置)、231…CPU(学習装置)、261…CPU(画像処理サーバ)

Claims (16)

  1. 第1の画像処理装置と第2の画像処理装置とを有する画像処理システムであって、
    前記第1の画像処理装置は、
    画像データを取得する取得手段と、
    前記取得手段により取得された画像データと、当該画像データに関する情報を前記第2の画像処理装置に送信する送信手段と、を有し、
    前記第2の画像処理装置は、
    前記画像データを受信する受信手段と、
    処理対象の画像データかどうかを判定するための条件を設定する手段と、
    前記受信した画像データが、前記処理対象の画像データであるか否かを、前記条件と前記情報とに基づいて判定する判定手段と、
    前記判定手段により処理対象の画像データと判定されると、当該画像データに対して前記情報に基づく画像処理を実行する実行手段と、
    前記実行手段により画像処理が実行された結果を保存する保存手段と、
    を有することを特徴とする画像処理システム。
  2. 前記取得手段は、原稿のスキャン、或いはファクシミリの受信により前記画像データを取得することを特徴とする請求項1に記載の画像処理システム。
  3. 前記画像データに関する情報は、当該画像データの解像度、圧縮方式、及びファクシミリの受信で得られた画像データの場合は、受信日時、ファクシミリ番号、又は原稿のスキャンにより得られた画像データの場合は、スキャン日時、前記第1の画像処理装置のユーザの識別情報、前記第1の画像処理装置の識別情報の少なくともいずれかを含むことを特徴とする請求項2に記載の画像処理システム。
  4. 前記判定手段は、前記情報が、前記画像データがファクシミリの受信で得られた画像データで、かつファクシミリ番号を含む場合、当該ファクシミリ番号が、前記条件として設定されているか否かに応じて判定することを特徴とする請求項2又は3に記載の画像処理システム。
  5. 前記判定手段は、前記情報が、前記画像データが原稿のスキャンで得られた画像データで、かつ前記第1の画像処理装置のユーザの識別情報或いは前記第1の画像処理装置の識別情報を含む場合、当該識別情報が、前記条件として設定されているか否かに応じて判定することを特徴とする請求項2又は3に記載の画像処理システム。
  6. 前記画像処理は、前記画像データに含まれる文字情報の抽出、及び前記画像データから原画像データへの復元の少なくともいずれかを含むことを特徴とする請求項1乃至5のいずれか1項に記載の画像処理システム。
  7. 前記実行手段は、劣化画像としての入力画像と、オリジナル画像としての正解画像とを含む学習データを有する学習モデルに基づいて、前記画像データを原画像データに復元するための画像処理を実行することを特徴とする請求項1乃至6のいずれか1項に記載の画像処理システム。
  8. 前記実行手段は、更に、前記画像データから復元された原画像データに対して文字認識処理を実行することを特徴とする請求項7に記載の画像処理システム。
  9. 前記実行手段は、前記画像データにおける所定の領域の画像データに対して前記画像処理を実行することを特徴とする請求項1乃至8のいずれか1項に記載の画像処理システム。
  10. 前記画像データに含まれる文字情報の抽出、及び前記画像データから原画像データへの復元の要否を設定する設定手段を、更に有し、
    前記実行手段は、前記判定手段により処理対象の画像データと判定された画像データに対して、更に前記設定手段による設定に基づいて画像処理を実行することを特徴とする請求項1乃至9のいずれか1項に記載の画像処理システム。
  11. 画像処理装置であって、
    画像データを取得する取得手段と、
    処理対象の画像データかどうかを判定するための条件を設定する手段と、
    前記取得手段により取得した画像データが、前記処理対象の画像データであるか否かを、前記条件と前記画像データに付随する情報とに基づいて判定する判定手段と、
    前記判定手段により処理対象の画像データと判定されると、当該画像データに対して前記情報に基づく画像処理を実行する実行手段と、
    前記実行手段により画像処理が実行された結果を保存する保存手段と、
    を有することを特徴とする画像処理装置。
  12. 前記判定手段は、前記情報が、前記画像データがファクシミリの受信で得られた画像データで、かつファクシミリ番号を含む場合、当該ファクシミリ番号が、前記条件として設定されているか否かに応じて判定することを特徴とする請求項11に記載の画像処理装置。
  13. 前記判定手段は、前記情報が、前記画像データが原稿のスキャンで得られた画像データで、かつユーザの識別情報を含む場合、当該識別情報が、前記条件として設定されているか否かに応じて判定することを特徴とする請求項11に記載の画像処理装置。
  14. 前記実行手段は、劣化画像としての入力画像と、オリジナル画像としての正解画像とを含む学習データを有する学習モデルに基づいて、前記画像データを原画像データに復元するための画像処理を実行することを特徴とする請求項11乃至13のいずれか1項に記載の画像処理装置。
  15. 画像処理装置を制御する制御方法であって、
    画像データを取得する取得工程と、
    処理対象の画像データかどうかを判定するための条件を設定する工程と、
    前記取得工程で取得した画像データが、前記処理対象の画像データであるか否かを、前記条件と前記画像データに付随する情報とに基づいて判定する判定工程と、
    前記判定工程により処理対象の画像データと判定されると、当該画像データに対して前記情報に基づく画像処理を実行する実行工程と、
    前記実行工程で画像処理が実行された結果を保存する保存工程と、
    を有することを特徴とする制御方法。
  16. コンピュータに、請求項15に記載の制御方法の各工程を実行させるためのプログラム。
JP2019127890A 2019-07-09 2019-07-09 画像処理システム、画像処理装置とその制御方法、及びプログラム Pending JP2021013149A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019127890A JP2021013149A (ja) 2019-07-09 2019-07-09 画像処理システム、画像処理装置とその制御方法、及びプログラム
US16/918,414 US11223743B2 (en) 2019-07-09 2020-07-01 Image processing system, image processing apparatus, method of controlling the image processing apparatus, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019127890A JP2021013149A (ja) 2019-07-09 2019-07-09 画像処理システム、画像処理装置とその制御方法、及びプログラム

Publications (1)

Publication Number Publication Date
JP2021013149A true JP2021013149A (ja) 2021-02-04

Family

ID=74101635

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019127890A Pending JP2021013149A (ja) 2019-07-09 2019-07-09 画像処理システム、画像処理装置とその制御方法、及びプログラム

Country Status (2)

Country Link
US (1) US11223743B2 (ja)
JP (1) JP2021013149A (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022115141A (ja) * 2021-01-28 2022-08-09 京セラドキュメントソリューションズ株式会社 画像形成装置
JP2023016141A (ja) * 2021-07-21 2023-02-02 キヤノン株式会社 画像形成装置、画像形成装置の制御方法、及びプログラム

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK0670555T3 (da) * 1992-09-28 2000-09-18 Olympus Optical Co Registreringsmedium med prikkode og informationsregistreringssystem
RU2494568C2 (ru) * 2008-07-25 2013-09-27 Сони Корпорейшн Способ и устройство обработки изображения
JP4950977B2 (ja) * 2008-10-08 2012-06-13 キヤノン株式会社 画像形成装置
JP6655963B2 (ja) * 2015-11-28 2020-03-04 キヤノン株式会社 画像処理装置、画像処理装置の制御方法。
GB2557382B (en) * 2016-05-31 2018-12-26 Shanghai United Imaging Healthcare Co Ltd System and method for removing gibbs artifact in medical imaging system
JP6753178B2 (ja) * 2016-07-05 2020-09-09 株式会社リコー 画像処理装置、画像処理方法、プログラム
JP2018042067A (ja) 2016-09-06 2018-03-15 株式会社リコー 画像処理システム、画像処理方法、情報処理装置
JP6904697B2 (ja) * 2016-12-22 2021-07-21 キヤノン株式会社 情報処理装置及び通信制御方法
JP6885151B2 (ja) * 2017-03-30 2021-06-09 ブラザー工業株式会社 画像処理装置
JP2019021159A (ja) * 2017-07-20 2019-02-07 キヤノン株式会社 画像処理装置および画像処理方法
US11343412B2 (en) * 2019-10-22 2022-05-24 Intel Corporation User detection and user attention detection using multi-zone depth sensing

Also Published As

Publication number Publication date
US20210014381A1 (en) 2021-01-14
US11223743B2 (en) 2022-01-11

Similar Documents

Publication Publication Date Title
US7339695B2 (en) Data processing device, data processing method, and data processing program for recognizing characters in a URL
US20070146791A1 (en) Printing apparatus, printing system, printing method, program, and storage medium
US20060007481A1 (en) Image processing system and image processing method
CN101729727A (zh) 图像处理装置及其控制方法和信息处理装置及其控制方法
US10070001B2 (en) Document reading apparatus, method for controlling document reading apparatus, and storage medium
US9712698B1 (en) Customized color for multiple raster content format file
US11223743B2 (en) Image processing system, image processing apparatus, method of controlling the image processing apparatus, and storage medium
US20180270387A1 (en) Printing apparatus, server, printing method, and control method
US11336782B2 (en) Image forming apparatus for creating image including multiple document images, and image forming method, and recording medium therefore
US20210287187A1 (en) Image processing apparatus and non-transitory computer readable medium storing program
US7783111B2 (en) Writing image acquisition apparatus, writing information extraction method, and storage medium
US20140240727A1 (en) Image processing apparatus, image processing method, and storage medium
US9712694B2 (en) Cooperative system, information processing apparatus, and computer program product
JP2021193770A (ja) 検索システム
JP2008288912A (ja) 画像処理装置および画像形成装置
US20220180114A1 (en) Image processing apparatus capable of restoring degraded image with high accuracy, image processing method, and storage medium
JP4710672B2 (ja) 文字色判別装置、文字色判別方法、およびコンピュータプログラム
JP2021051588A (ja) 画像処理システム、及び画像処理装置とその制御方法、並びにプログラム
JP2021193495A (ja) 検索システム
JP6373448B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP2019153061A (ja) 画像処理装置、その制御方法、及びプログラム
US9335959B2 (en) Image forming apparatus operable to form data based on driver type, method of controlling image forming apparatus, and storage medium
JP2004153567A (ja) 画像入出力装置及びその制御方法、画像入出力システム、及び制御プログラム
JP7452059B2 (ja) 情報処理装置及びプログラム
US11093191B2 (en) Information processing apparatus and non-transitory computer readable medium capable of extracting a job flow without use of attribute information included in job entries

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20210103

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210113