JP2007074140A - 画像処理装置及びその制御方法、画像処理システム - Google Patents
画像処理装置及びその制御方法、画像処理システム Download PDFInfo
- Publication number
- JP2007074140A JP2007074140A JP2005256856A JP2005256856A JP2007074140A JP 2007074140 A JP2007074140 A JP 2007074140A JP 2005256856 A JP2005256856 A JP 2005256856A JP 2005256856 A JP2005256856 A JP 2005256856A JP 2007074140 A JP2007074140 A JP 2007074140A
- Authority
- JP
- Japan
- Prior art keywords
- service
- data file
- processing apparatus
- selecting
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Abstract
【課題】 外部から提供されるサービスを効率的に利用して、より好適な情報提供を実現することができる画像処理装置及びその制御方法、画像処理システム、プログラムを提供する。
【解決手段】 入力画像を構成するオブジェクトの内、選択したサービスの処理対象のオブジェクトを選択し、選択したサービスによる処理結果の提供方法を選択する。選択したオブジェクトを含むデータファイルを、選択したサービスで利用可能な所定フォーマットのデータファイルに変換する。変換によって得られる所定フォーマットのデータファイルをネットワークを介してサーバへ送信する。選択したサービスによる、所定フォーマットのデータファイルの処理結果をネットワークを介してサーバから受信する。選択した提供方法で、処理結果を含むデータファイルを提供する。
【選択図】 図3
【解決手段】 入力画像を構成するオブジェクトの内、選択したサービスの処理対象のオブジェクトを選択し、選択したサービスによる処理結果の提供方法を選択する。選択したオブジェクトを含むデータファイルを、選択したサービスで利用可能な所定フォーマットのデータファイルに変換する。変換によって得られる所定フォーマットのデータファイルをネットワークを介してサーバへ送信する。選択したサービスによる、所定フォーマットのデータファイルの処理結果をネットワークを介してサーバから受信する。選択した提供方法で、処理結果を含むデータファイルを提供する。
【選択図】 図3
Description
本発明は、複数種類のサービスを提供するネットワーク上のサーバに入力画像を出力して、前記サーバから前記入力画像に対するサービスによる処理結果を前記ネットワークを介して受信して出力する画像処理装置及びその制御方法、画像処理システム、プログラムに関するものである。
ホストコンピュータやMFP(マルチファンクション複合機)を利用して、紙媒体のドキュメント情報を再利用可能な電子情報に変換する技術が存在する。ここで、特に、電子化された紙媒体の情報から、インターネットを利用して受けられる各種サービスとの連携する技術も存在する。
このように、パーソナルコンピュータ(PC)が会社や家庭で普及し、インターネット等のネットワーク環境のインフラが充実する中で、これらの基盤技術によって各種サービスを利用できる機会が増えてきている。
ユーザが、これらのサービスを利用するときは、サービス提供者による利用形態が示されるが、その利用形態としては、PCに搭載されるWebブラウザによって利用する形式をとるのが一般的である。Webブラウザを利用した翻訳サービスを例に挙げると、以下の(1)〜(6)のステップのような利用方法が一般的である。
(1)ユーザが所有するPCのWebブラウザから、翻訳エンジンのあるサイトを閲覧する(あるいは、会員制である場合はログインする)。
(2)翻訳対象の内容の電子データ(主に、テキスト情報)を所定の形式で、WEBブラウザ上の所定のフィールドに入力、もしくはコピーする。
(3)翻訳を依頼する。
(4)翻訳エンジンから翻訳結果がWebブラウザに表示される。
(5)サービスの利用に料金を課する場合は、(4)のサービスが完了した時点でログインしたユーザIDに対して課金する。
(6)翻訳結果を、Webブラウザから所定のアプリケーションにコピーして、ユーザの利用しやすい形態に変換する。
このような翻訳サービスに限らず、電子ドキュメントを利用するサービスは、一般に、サービス提供者が指定するフォーマットに適合しないと、そのサービスを享受できない(特許文献1)。
また、インターネット上にあるサービスに、紙媒体に書かれた電子化されていないドキュメントを利用したい場合は、紙媒体の情報を電子ドキュメントとしてキーボードを使ってPCから入力するのが一般的である。あるいは、特許文献2にあるように、紙媒体のドキュメントを光学スキャナにて読み込ませ、そのビットマップイメージをOCR(Optical Character Reader)処理して、テキストデータに変換し、所定のフォーマットにあわせて、所定のサービスを利用するのが一般的である。
特許文献1、2ともに、紙媒体のドキュメント情報を電子ドキュメント(電子データ)として利用する場合にはOCR処理が使われ、紙媒体とインターネットを介した外部のサービスを結ぶ主要な技術となっている。
一方、紙媒体から電子ドキュメントに変換する技術としては、例えば、バインダ等で蓄積された紙文書をスキャナで読み取り、画像のラスターデータまたはその符号化データ(以下、これらを総称してイメージデータという)として、ポータブルドキュメントフォーマット(PDFフォーマット)等のコンパクトなファイルに変換して、画像記憶部に格納するものがある(特許文献3)。
特許第3530491号公報
特許第3298965号公報
特開2001−358863号公報
このように、紙媒体からインターネットや公衆回線を利用したサービスの利用には、紙媒体の情報を電子化する作業、それにサービス提供者側が指定するフォーマットに合わせるための作業、さらに提供されるサービスを再利用するための作業が発生する。
また、従来例にある特許文献1、2では、紙媒体を電子化するためにOCR技術を利用しているが、翻訳のサービスを利用する場合は、OCR処理されたテキスト情報に誤りがあると、正しく翻訳できない。
ここで、特許文献1の技術では、処理対象のデータをサービス提供者に送信する送信側は、その送信内容が正しく送信先に電子データとして登録されているかを確認することができない。このように、OCR処理は紙媒体に記載される文字の品位や認識アルゴリズムにより、電子ドキュメントに変換する精度に影響を与えやすい。
また、特許文献3の技術では、紙媒体のドキュメントをイメージデータとしてPDFファイルに変換するが、このままでは外部のサービスと連携することは難しい。加えて、変換されたPDFファイルをさらにOCR処理しても、上記と同じ課題が残る。
本発明は上記の課題を解決するためになされたものであり、外部から提供されるサービスを効率的に利用して、より好適な情報提供を実現することができる画像処理装置及びその制御方法、画像処理システム、プログラムを提供することを目的とする。
上記の目的を達成するための本発明による画像処理装置は以下の構成を備える。即ち、
複数種類のサービスを提供するネットワーク上のサーバに入力画像を出力して、前記サーバから前記入力画像に対するサービスによる処理結果を前記ネットワークを介して受信して出力する画像処理装置であって、
前記サーバが提供するサービス群から、利用するサービスを選択するサービス選択手段と、
前記入力画像を属性毎のオブジェクトに分割する分割手段と、
前記分割手段によって得られる前記入力画像を構成するオブジェクトの内、前記サービス選択手段で選択したサービスの処理対象のオブジェクトを選択するオブジェクト選択手段と、
前記サービス選択手段で選択したサービスによる処理結果の提供方法を選択する提供方法選択手段と、
前記オブジェクト選択手段で選択したオブジェクトを含むデータファイルを、前記サービス選択手段で選択したサービスで利用可能な所定フォーマットのデータファイルに変換する変換手段と、
前記変換手段による変換によって得られる所定フォーマットのデータファイルを前記ネットワークを介して前記サーバへ送信する送信手段と、
前記サービス選択手段で選択したサービスによる、前記所定フォーマットのデータファイルの処理結果を前記ネットワークを介して前記サーバから受信する受信手段と、
前記提供方法選択手段で選択した提供方法で、前記受信手段で受信した処理結果を含むデータファイルを提供する提供手段と
を備える。
複数種類のサービスを提供するネットワーク上のサーバに入力画像を出力して、前記サーバから前記入力画像に対するサービスによる処理結果を前記ネットワークを介して受信して出力する画像処理装置であって、
前記サーバが提供するサービス群から、利用するサービスを選択するサービス選択手段と、
前記入力画像を属性毎のオブジェクトに分割する分割手段と、
前記分割手段によって得られる前記入力画像を構成するオブジェクトの内、前記サービス選択手段で選択したサービスの処理対象のオブジェクトを選択するオブジェクト選択手段と、
前記サービス選択手段で選択したサービスによる処理結果の提供方法を選択する提供方法選択手段と、
前記オブジェクト選択手段で選択したオブジェクトを含むデータファイルを、前記サービス選択手段で選択したサービスで利用可能な所定フォーマットのデータファイルに変換する変換手段と、
前記変換手段による変換によって得られる所定フォーマットのデータファイルを前記ネットワークを介して前記サーバへ送信する送信手段と、
前記サービス選択手段で選択したサービスによる、前記所定フォーマットのデータファイルの処理結果を前記ネットワークを介して前記サーバから受信する受信手段と、
前記提供方法選択手段で選択した提供方法で、前記受信手段で受信した処理結果を含むデータファイルを提供する提供手段と
を備える。
また、好ましくは、前記分割手段によって得られる前記入力画像を構成するオブジェクトそれぞれを、対応する属性に基づいてベクトル化するベクトル化手段を更に備える。
また、好ましくは、前記所定フォーマットのデータファイルは、前記オブジェクト選択手段で選択したオブジェクトの内容を示す記述と、前記オブジェクトが前記サービス選択手段で選択したサービスの処理対象であることを示す記述と、前記提供方法選択手段で選択した提供方法を示す記述を少なくとも含む。
また、好ましくは、前記変換手段は、前記ベクトル化手段によって得られる、前記入力画像に対応するデータファイルから、前記所定フォーマットのデータファイルに変換する。
また、好ましくは、前記受信手段は、前記処理結果として、前記所定フォーマットのデータファイルが前記サービス選択手段で選択したサービスによる処理が施されることによって得られる返信用の所定フォーマットのデータファイルを前記ネットワークを介して前記サーバから受信する。
また、好ましくは、前記ベクトル化手段によって得られる前記入力画像に対応するデータファイルを記憶する記憶手段を更に備える。
また、好ましくは、前記変換手段は、前記記憶手段に記憶される第1データファイルから、前記第1データファイルを識別するための識別情報を示す記述と、前記オブジェクト選択手段で選択したオブジェクトの内容を示す記述を少なくとも含む前記所定フォーマットの第2データファイルに変換する。
また、好ましくは、前記提供手段は、前記受信手段で受信した処理結果と、前記処理結果に含まれる前記識別情報が示す前記記憶手段に記憶される前記第1データファイルとを用いて生成されるデータファイルを、前記提供方法選択手段で選択した提供方法で提供する。
また、好ましくは、前記サーバは、前記ネットワークを介して当該画像処理装置から受信する前記所定フォーマットのデータファイルを解析する解析手段と、
前記解析手段の解析結果に基づいて、前記サービス選択手段で選択したサービスによる処理を、前記所定フォーマットのデータファイル中の前記オブジェクト選択手段で選択したオブジェクトに実行する実行手段と
を備える。
前記解析手段の解析結果に基づいて、前記サービス選択手段で選択したサービスによる処理を、前記所定フォーマットのデータファイル中の前記オブジェクト選択手段で選択したオブジェクトに実行する実行手段と
を備える。
上記の目的を達成するための本発明による情報処理装置は以下の構成を備える。即ち、
ネットワークを介して画像処理装置から受信する入力画像に対して、複数種類のサービスを提供可能な情報処理装置であって、
前記入力画像に対応する、当該情報処理装置で利用可能な所定フォーマットのデータファイルを前記ネットワークを介して前記画像処理装置から受信する受信手段と、
前記所定フォーマットのデータファイルを解析する解析手段と、
前記解析手段の解析結果に基づいて、選択されたサービスによる処理を、前記所定フォーマットのデータファイル中の選択されたオブジェクトに実行する実行手段と、
前記実行手段によって得られる処理結果を前記ネットワークを介して前記画像処理装置へ送信する送信手段と
を備える。
ネットワークを介して画像処理装置から受信する入力画像に対して、複数種類のサービスを提供可能な情報処理装置であって、
前記入力画像に対応する、当該情報処理装置で利用可能な所定フォーマットのデータファイルを前記ネットワークを介して前記画像処理装置から受信する受信手段と、
前記所定フォーマットのデータファイルを解析する解析手段と、
前記解析手段の解析結果に基づいて、選択されたサービスによる処理を、前記所定フォーマットのデータファイル中の選択されたオブジェクトに実行する実行手段と、
前記実行手段によって得られる処理結果を前記ネットワークを介して前記画像処理装置へ送信する送信手段と
を備える。
上記の目的を達成するための本発明による画像処理システムは以下の構成を備える。即ち、
複数種類のサービスを提供するサーバと、前記サーバから前記入力画像に対するサービスによる処理結果を受信して出力する画像処理装置とがネットワークを介して接続されて構成される画像処理システムであって、
前記画像処理装置は、
前記サーバが提供するサービス群から、利用するサービスを選択するサービス選択手段と、
前記入力画像を属性毎のオブジェクトに分割する分割手段と、
前記分割手段によって得られる前記入力画像を構成するオブジェクトの内、前記サービス選択手段で選択したサービスの処理対象のオブジェクトを選択するオブジェクト選択手段と、
前記サービス選択手段で選択したサービスによる処理結果の提供方法を選択する提供方法選択手段と、
前記オブジェクト選択手段で選択したオブジェクトを含むデータファイルを、前記サービス選択手段で選択したサービスで利用可能な所定フォーマットのデータファイルに変換する変換手段と、
前記変換手段による変換によって得られる所定フォーマットのデータファイルを前記ネットワークを介して前記サーバへ送信する第1送信手段と、
前記サービス選択手段で選択したサービスによる、前記所定フォーマットのデータファイルの処理結果を前記ネットワークを介して前記サーバから受信する第2受信手段と、
前記提供方法選択手段で選択した提供方法で、前記受信手段で受信した処理結果を含むデータファイルを提供する提供手段とを備え、
前記サーバは、
前記所定フォーマットのデータファイルを前記ネットワークを介して前記画像処理装置から受信する第2受信手段と、
前記所定フォーマットのデータファイルを解析する解析手段と、
前記解析手段の解析結果に基づいて、前記サービス選択手段で選択したサービスによる処理を、前記所定フォーマットのデータファイル中の前記オブジェクト選択手段で選択したオブジェクトに実行する実行手段と
前記実行手段によって得られる処理結果を前記ネットワークを介して前記画像処理装置へ送信する第2送信手段と
を備える。
複数種類のサービスを提供するサーバと、前記サーバから前記入力画像に対するサービスによる処理結果を受信して出力する画像処理装置とがネットワークを介して接続されて構成される画像処理システムであって、
前記画像処理装置は、
前記サーバが提供するサービス群から、利用するサービスを選択するサービス選択手段と、
前記入力画像を属性毎のオブジェクトに分割する分割手段と、
前記分割手段によって得られる前記入力画像を構成するオブジェクトの内、前記サービス選択手段で選択したサービスの処理対象のオブジェクトを選択するオブジェクト選択手段と、
前記サービス選択手段で選択したサービスによる処理結果の提供方法を選択する提供方法選択手段と、
前記オブジェクト選択手段で選択したオブジェクトを含むデータファイルを、前記サービス選択手段で選択したサービスで利用可能な所定フォーマットのデータファイルに変換する変換手段と、
前記変換手段による変換によって得られる所定フォーマットのデータファイルを前記ネットワークを介して前記サーバへ送信する第1送信手段と、
前記サービス選択手段で選択したサービスによる、前記所定フォーマットのデータファイルの処理結果を前記ネットワークを介して前記サーバから受信する第2受信手段と、
前記提供方法選択手段で選択した提供方法で、前記受信手段で受信した処理結果を含むデータファイルを提供する提供手段とを備え、
前記サーバは、
前記所定フォーマットのデータファイルを前記ネットワークを介して前記画像処理装置から受信する第2受信手段と、
前記所定フォーマットのデータファイルを解析する解析手段と、
前記解析手段の解析結果に基づいて、前記サービス選択手段で選択したサービスによる処理を、前記所定フォーマットのデータファイル中の前記オブジェクト選択手段で選択したオブジェクトに実行する実行手段と
前記実行手段によって得られる処理結果を前記ネットワークを介して前記画像処理装置へ送信する第2送信手段と
を備える。
上記の目的を達成するための本発明による画像処理装置の制御方法は以下の構成を備える。即ち、
複数種類のサービスを提供するネットワーク上のサーバに入力画像を出力して、前記サーバから前記入力画像に対するサービスによる処理結果を前記ネットワークを介して受信して出力する画像処理装置の制御方法であって、
前記サーバが提供するサービス群から、利用するサービスを選択するサービス選択工程と、
前記入力画像を属性毎のオブジェクトに分割する分割工程と、
前記分割工程によって得られる前記入力画像を構成するオブジェクトの内、前記サービス選択工程で選択したサービスの処理対象のオブジェクトを選択するオブジェクト選択工程と、
前記サービス選択工程で選択したサービスによる処理結果の提供方法を選択する提供方法選択工程と、
前記オブジェクト選択工程で選択したオブジェクトを含むデータファイルを、前記サービス選択工程で選択したサービスで利用可能な所定フォーマットのデータファイルに変換する変換工程と、
前記変換工程による変換によって得られる所定フォーマットのデータファイルを前記ネットワークを介して前記サーバへ送信する送信工程と、
前記サービス選択工程で選択したサービスによる、前記所定フォーマットのデータファイルの処理結果を前記ネットワークを介して前記サーバから受信する受信工程と、
前記提供方法選択工程で選択した提供方法で、前記受信工程で受信した処理結果を含むデータファイルを提供する提供工程と
を備える。
複数種類のサービスを提供するネットワーク上のサーバに入力画像を出力して、前記サーバから前記入力画像に対するサービスによる処理結果を前記ネットワークを介して受信して出力する画像処理装置の制御方法であって、
前記サーバが提供するサービス群から、利用するサービスを選択するサービス選択工程と、
前記入力画像を属性毎のオブジェクトに分割する分割工程と、
前記分割工程によって得られる前記入力画像を構成するオブジェクトの内、前記サービス選択工程で選択したサービスの処理対象のオブジェクトを選択するオブジェクト選択工程と、
前記サービス選択工程で選択したサービスによる処理結果の提供方法を選択する提供方法選択工程と、
前記オブジェクト選択工程で選択したオブジェクトを含むデータファイルを、前記サービス選択工程で選択したサービスで利用可能な所定フォーマットのデータファイルに変換する変換工程と、
前記変換工程による変換によって得られる所定フォーマットのデータファイルを前記ネットワークを介して前記サーバへ送信する送信工程と、
前記サービス選択工程で選択したサービスによる、前記所定フォーマットのデータファイルの処理結果を前記ネットワークを介して前記サーバから受信する受信工程と、
前記提供方法選択工程で選択した提供方法で、前記受信工程で受信した処理結果を含むデータファイルを提供する提供工程と
を備える。
上記の目的を達成するための本発明による情報処理装置の制御方法は以下の構成を備える。即ち、
ネットワークを介して画像処理装置から受信する入力画像に対して、複数種類のサービスを提供可能な情報処理装置の制御方法であって、
前記入力画像に対応する、当該情報処理装置で利用可能な所定フォーマットのデータファイルを前記ネットワークを介して前記画像処理装置から受信する受信工程と、
前記所定フォーマットのデータファイルを解析する解析工程と、
前記解析工程の解析結果に基づいて、選択されたサービスによる処理を、前記所定フォーマットのデータファイル中の選択されたオブジェクトに実行する実行工程と、
前記実行工程によって得られる処理結果を前記ネットワークを介して前記画像処理装置へ送信する送信工程と
を備える。
ネットワークを介して画像処理装置から受信する入力画像に対して、複数種類のサービスを提供可能な情報処理装置の制御方法であって、
前記入力画像に対応する、当該情報処理装置で利用可能な所定フォーマットのデータファイルを前記ネットワークを介して前記画像処理装置から受信する受信工程と、
前記所定フォーマットのデータファイルを解析する解析工程と、
前記解析工程の解析結果に基づいて、選択されたサービスによる処理を、前記所定フォーマットのデータファイル中の選択されたオブジェクトに実行する実行工程と、
前記実行工程によって得られる処理結果を前記ネットワークを介して前記画像処理装置へ送信する送信工程と
を備える。
上記の目的を達成するための本発明によるプログラムは以下の構成を備える。即ち、
複数種類のサービスを提供するネットワーク上のサーバに入力画像を出力して、前記サーバから前記入力画像に対するサービスによる処理結果を前記ネットワークを介して受信して出力する画像処理装置の制御を実現するプログラムであって、
前記サーバが提供するサービス群から、利用するサービスを選択するサービス選択工程のプログラムコードと、
前記入力画像を属性毎のオブジェクトに分割する分割工程のプログラムコードと、
前記分割工程によって得られる前記入力画像を構成するオブジェクトの内、前記サービス選択工程で選択したサービスの処理対象のオブジェクトを選択するオブジェクト選択工程のプログラムコードと、
前記サービス選択工程で選択したサービスによる処理結果の提供方法を選択する提供方法選択工程のプログラムコードと、
前記オブジェクト選択工程で選択したオブジェクトを含むデータファイルを、前記サービス選択工程で選択したサービスで利用可能な所定フォーマットのデータファイルに変換する変換工程のプログラムコードと、
前記変換工程による変換によって得られる所定フォーマットのデータファイルを前記ネットワークを介して前記サーバへ送信する送信工程のプログラムコードと、
前記サービス選択工程で選択したサービスによる、前記所定フォーマットのデータファイルの処理結果を前記ネットワークを介して前記サーバから受信する受信工程のプログラムコードと、
前記提供方法選択工程で選択した提供方法で、前記受信工程で受信した処理結果を含むデータファイルを提供する提供工程のプログラムコードと
を備える。
複数種類のサービスを提供するネットワーク上のサーバに入力画像を出力して、前記サーバから前記入力画像に対するサービスによる処理結果を前記ネットワークを介して受信して出力する画像処理装置の制御を実現するプログラムであって、
前記サーバが提供するサービス群から、利用するサービスを選択するサービス選択工程のプログラムコードと、
前記入力画像を属性毎のオブジェクトに分割する分割工程のプログラムコードと、
前記分割工程によって得られる前記入力画像を構成するオブジェクトの内、前記サービス選択工程で選択したサービスの処理対象のオブジェクトを選択するオブジェクト選択工程のプログラムコードと、
前記サービス選択工程で選択したサービスによる処理結果の提供方法を選択する提供方法選択工程のプログラムコードと、
前記オブジェクト選択工程で選択したオブジェクトを含むデータファイルを、前記サービス選択工程で選択したサービスで利用可能な所定フォーマットのデータファイルに変換する変換工程のプログラムコードと、
前記変換工程による変換によって得られる所定フォーマットのデータファイルを前記ネットワークを介して前記サーバへ送信する送信工程のプログラムコードと、
前記サービス選択工程で選択したサービスによる、前記所定フォーマットのデータファイルの処理結果を前記ネットワークを介して前記サーバから受信する受信工程のプログラムコードと、
前記提供方法選択工程で選択した提供方法で、前記受信工程で受信した処理結果を含むデータファイルを提供する提供工程のプログラムコードと
を備える。
上記の目的を達成するための本発明によるプログラムは以下の構成を備える。即ち、
ネットワークを介して画像処理装置から受信する入力画像に対して、複数種類のサービスを提供可能な情報処理装置の制御を実現するプログラムであって、
前記入力画像に対応する、当該情報処理装置で利用可能な所定フォーマットのデータファイルを前記ネットワークを介して前記画像処理装置から受信する受信工程のプログラムコードと、
前記所定フォーマットのデータファイルを解析する解析工程のプログラムコードと、
前記解析工程の解析結果に基づいて、選択されたサービスによる処理を、前記所定フォーマットのデータファイル中の選択されたオブジェクトに実行する実行工程のプログラムコードと、
前記実行工程によって得られる処理結果を前記ネットワークを介して前記画像処理装置へ送信する送信工程のプログラムコードと
を備える。
ネットワークを介して画像処理装置から受信する入力画像に対して、複数種類のサービスを提供可能な情報処理装置の制御を実現するプログラムであって、
前記入力画像に対応する、当該情報処理装置で利用可能な所定フォーマットのデータファイルを前記ネットワークを介して前記画像処理装置から受信する受信工程のプログラムコードと、
前記所定フォーマットのデータファイルを解析する解析工程のプログラムコードと、
前記解析工程の解析結果に基づいて、選択されたサービスによる処理を、前記所定フォーマットのデータファイル中の選択されたオブジェクトに実行する実行工程のプログラムコードと、
前記実行工程によって得られる処理結果を前記ネットワークを介して前記画像処理装置へ送信する送信工程のプログラムコードと
を備える。
本発明によれば、外部から提供されるサービスを効率的に利用して、より好適な情報提供を実現することができる画像処理装置及びその制御方法、画像処理システム、プログラムを提供できる。
以下、本発明の実施の形態について図面を用いて詳細に説明する。
[実施形態1]
[画像処理システム]
図1は本発明の実施形態1の画像処理システムの構成を示すブロック図である。
[画像処理システム]
図1は本発明の実施形態1の画像処理システムの構成を示すブロック図である。
この画像処理システムは、ローカル環境10〜30とをインターネット等のネットワーク104で接続された環境で実現する。
ローカル環境10内に構築されたLAN107には、複数種類の機能(複写機能、印刷機能、送信機能等)を実現する複合機であるMFP(Multi Function Peripheral)100、MFP100を制御するマネージメントPC101、MFP100を利用するクライアントPC102、文書管理サーバ106及びそのデータベース105、及びプロキシサーバ103が接続されている。
ローカル環境20内に構築されたLAN108には、プロキシサーバ103、文書管理サーバ106及びそのデータベース105が接続されている。
ローカル環境30内に構築されたLAN111には、プロキシサーバ103及びサーバ110が接続されている。このサーバは、WEBサーバ機能を有し、クライアントに対して、WEBブラウザを利用した各種サービス(例えば、翻訳サービス)を提供する。
LAN107、LAN108及びLAN111は、それぞれの環境内のプロキシサーバ103を介してネットワーク104に接続されている。
MFP100は、特に、原稿である紙文書を電子的に読み取る画像読取部と、画像読取部から得られる画像信号に対する画像処理を実行する画像処理部を有し、この画像信号はLAN109を介してマネージメントPC101に送信することができる。
マネージメントPC101は、通常のPC(パーソナルコンピュータ)であり、内部に画像記憶部、画像処理部、表示部、入力部等の各種構成要素を有するが、その構成要素の一部はMFP100に一体化して構成されている。
また、実施形態1では、マネージメントPC101において、後述する検索処理や、検索データの補正処理等の各種処理を実行する構成としているが、これをMFP100内で実行する構成としても良い。
サーバ110は、MFP100によって読み取られた電子データに基づいて、翻訳処理等の各種処理を実現するサービスを提供するサーバ機能を有している。
尚、図1の構成は一例であり、文書管理サーバ106を有するローカル環境20がなくても、あるいはもっと複数存在してもよいし、あるいはローカル環境10及び20とが同一LAN上で接続されていても良い。
また、ネットワーク104は、典型的にはインターネットやLANやWANや電話回線、専用デジタル回線、ATMやフレームリレー回線、通信衛星回線、ケーブルテレビ回線、データ放送用無線回線等のいずれか、またはこれらの組み合わせにより実現されるいわゆる通信ネットワークであり、データの送受信が可能であれば良い。
また、マネージメントPC101、クライアントPC102、文書管理サーバ106、サーバ110等の各種端末はそれぞれ、汎用コンピュータに搭載される標準的な構成要素(例えば、CPU、RAM、ROM、ハードディスク、外部記憶装置、ネットワークインタフェース、ディスプレイ、キーボード、マウス等)を有している。
[MFP]
次に、MFP100の詳細構成について、図2を用いて説明する。
次に、MFP100の詳細構成について、図2を用いて説明する。
図2は本発明の実施形態1のMFPの詳細構成を示すブロック図である。
図2において、オートドキュメントフィーダ(ADF)を含む画像読取部118は、束状のあるいは1枚の原稿画像を光源(不図示)で照射し、原稿反射像をレンズで固体撮像素子上に結像する。固体撮像素子は、所定密度(例えば、600DPI)及び所定濃度レベル(例えば、8ビット)のラスタ状の画像読取信号を生成し、その画像読取信号からラスターデータよりなる画像データを構成する。
また、MFP100は、画像読取信号に対応する画像を印刷部112で記録媒体に印刷する複写機能を有し、原稿画像を1つ複写する場合には、この画像読取信号をデータ処理部115で画像処理して記録信号を生成し、これを印刷部112によって記録媒体上に印刷させる。一方、原稿画像を複数複写する場合には、記憶部119に一旦一ページ分の記録信号を記憶保持させた後、これを印刷部112に順次出力して記録媒体上に印刷させる。
また、ネットワークI/F114を介する送信機能においては、画像読取部118から得られるラスター画像を、TIFFやJPEG等の圧縮画像ファイル形式、あるいはPDF等のベクトルデータファイル形式の画像ファイルへと変換し、ネットワークIF114から出力する。出力された画像ファイルは、LAN107を介して文書管理サーバ106へ送信されたり、更にネットワーク104経由で別の文書管理サーバ106やクライアントPC102に転送されたりする。
また、印刷部112による印刷機能においては、例えば、クライアントPC102から出力された印刷データをネットワークI/F114経由でデータ処理部115が受信し、データ処理部115は、その印刷データを印刷部112で印刷可能なラスターデータに変換した後、印刷部112によって印刷媒体上に画像を形成する。
MFP100への操作者の指示は、MFP100に装備されたキー操作部とマネージメントPC101に接続されたキーボード及びマウスからなる入力部113から行われ、これら一連の動作はデータ処理部115内の制御部(不図示)で制御される。また、操作入力の状態表示及び処理中の画像データの表示は、表示部116で行われる。この表示部116は、入力部と表示部(例えば、LCD)で構成されるタッチパネルで構成されていても良い。
記憶部119は、マネージメントPC101からも制御され、MFP100とマネージメントPC101とのデータの送受信及び制御は、ネットワークI/F117及びLAN109を介して行われる。
これらMFP100とマネージメントPC101とのデータの授受及び制御は、LAN109が構成されている場合には、ネットワークI/F117を介してMFP100とマネージメントPC101を直結して実現するが、LAN109が構成されていない場合には、ネットワークI/F114に接続されるLAN107を介して実現する。
[画像処理システム全体の処理概要]
次に、実施形態の画像処理システムで実行する処理全体の概要を、図3を用いて説明する。
次に、実施形態の画像処理システムで実行する処理全体の概要を、図3を用いて説明する。
図3は本発明の実施形態1の画像処理システムで実行する処理全体の概要を示すフローチャートである。
ステップS2001:MFP100の表示部116上に表示される操作画面に対するユーザの操作に基づいて、ユーザが利用するサービス(例えば、サーバ110が提供する各種Webサービス)を選択する。尚、実施形態1では、紙原稿に書かれている内容を翻訳するために、図4に示すサービス選択画面2100から利用するサービスを選択する。
具体的には、まず、サービス選択画面2100よりサービスタブ2101を選択する。サービスタブ2101を選択すると、画面上には、現在、MFP100で利用できる複数のサービスから構成されるサービスリスト画面が表示される。ここで、2102、2003及び2004は、表示画面をスクロールためのスクロールコントロールであり、それぞれ上スクロールボタン、スクロールバー、下スクロールボタンとなる。そして、ユーザは、これらのスクロールコントロールを用いて、所望のサービスをサービスリスト画面から選択することができる。
ボタン2104は利用するサービスを登録するための登録ボタンである。ボタン2105は表示中のサービスを決定するための決定ボタンである。ボタン2106は選択したサービスを取り消すための取消ボタンである。ここでは、例えば、「No.1 翻訳サービス(日本語−英語)」2107を選択したとする。
尚、サービス選択画面2100に係る操作は、表示部116がタッチパネルで構成されている場合には、ユーザの指や、プライスチック製の指示棒(不図示)等を利用して操作することが可能である。
ステップS2002:ユーザの操作に基づいて、紙媒体(読取原稿)中のサービス利用対象のオブジェクトを選択する。尚、オブジェクトの選択方法については後述する。
ステップS2003:紙媒体(読取原稿)からサービスに利用するための電子データへの変換を行なう。尚、読取原稿データは、後述するオリジナルの電子データを検索などの技術を使って、紙媒体と同等の電子データとして以後の処理に利用される。
ステップS2004:ユーザの操作に基づいて、サービスの提供方法を選択する。ここでは、翻訳サービスを選択しているので、翻訳対象の電子データに対する翻訳結果の提供方法を選択することになる。ここで、提供方法とは、サーバ110にて処理された処理結果(情報)をどのような形で、MFP100が受け取るか(サーバ110より提供してもらうか)を指定するものである。
尚、実施形態1では、この提供方法としては、プリント(MFP100によるプリントでも良いし、ネットワーク104上に接続される他のプリンタによるプリント等)、表示部116での表示、外部装置(PC)への出力(出力先(例えば、IPアドレス等)を指定してFTPプロトコルやHTTPプロトコルで送信、もしくは、メールアドレスに添付して送信することも可能である)等がある。
ステップS2005:ステップ2002にて選択したオブジェクト(実施形態1の場合は、テキストオブジェクト)を、ステップ2001で選択したサービスに利用するために、MFP100にて処理対象のデータを定型フォーマットに変換する。尚、この変換の詳細は後述する。
ステップS2006:ステップS2005で変換された定型フォーマットの処理対象のデータをサーバ110へ送信する。ここで、サーバ110は、指定されたサービスに基づいて、受信した処理対象のデータの内容を解析する。また、サーバ110は、その解析結果に基づいて、指定されたサービスを適用するデータを選定し、そのデータに対する処理(実施形態1の場合、翻訳処理)を実行する。また、この処理結果は、返信用の定型フォーマットに変換した上で、MFP100に送信する。
ステップS2007:サーバ110で処理された処理結果(返信用の定型フォーマットのデータ)を受信する。
ステップS2008:受信した処理結果(返信用の定型フォーマットのデータ)を解析する。
ステップS2009:解析結果に基づいて、受信したデータに対し、指定された提供方法による提供処理を実行する。例えば、提供方法として、MFP100でのプリントが指定されている場合、MFP100にて処理結果がプリントされる。
[紙媒体から電子情報データ取得までの処理]
本発明に係る、紙媒体から電子情報データ取得までの処理は、図3のステップS2002〜ステップS2004に相当する。この処理の詳細について、図5を用いて説明する。
本発明に係る、紙媒体から電子情報データ取得までの処理は、図3のステップS2002〜ステップS2004に相当する。この処理の詳細について、図5を用いて説明する。
図5は本発明の実施形態1の電子情報データ取得処理を示すフローチャートである。
ステップS301:MFP100の画像読取部118を動作させて、1枚の原稿をラスター状に走査し、所定解像度及び所定濃度レベルの画像読取信号を取得する。画像読取信号はデータ処理部115によって前処理され、入力画像の1頁分のイメージデータ(画像データ)として、記憶部119に保存する。
ステップS302(ブロックセレクション(BS:領域分割)処理):マネージメントPC101によって、記憶部119に格納されたイメージデータの領域を、文字あるいは線画を含む文字・線画領域と、ハーフトーンの写真領域、不定形の画像領域等に分割する。さらに文字・線画領域について、主に文字を含む文字領域と、主に表、図形等を含む線画領域とを分離し、線画領域は表領域と図形領域に分離する。
尚、実施形態1では、連結画素を検知し、該連結画素の外接矩形領域の形状・サイズ・画素密度等を用いて、属性毎の領域に分割するものとするが、その他の領域分割手法を用いても構わない。
また、文字領域については、文字段落ごとの纏まった塊をブロックとして矩形ブロック(文字領域矩形ブロック)にセグメント化し、線画領域では、表、図形等の個々のオブジェクト(表領域矩形ブロック、線画領域矩形ブロック)ごとに矩形ブロックにセグメント化する。
更に、ハーフトーンで表現される写真領域は、画像領域矩形ブロック、背景領域矩形ブロック等のオブジェクトごとに、矩形ブロックにセグメント化する。ここで、これらの矩形ブロックの情報を「領域分割情報」という。
ステップS303:ブロックセレクション処理で得られた領域分割情報と入力画像とを合成し、それを領域分割結果として、MFP100の表示部116における操作画面上に表示する。
ここで、表示部116に表示される操作画面の一例を、図6に示す。
操作画面には、左半部に入力画像そのものが画像41として表示され、右半部に矩形ブロックによる領域分割情報を示す画像42が表示される。画像42では、入力画像を簡略表示するとともに、各矩形ブロックを矩形で示す。
尚、図6では、矩形ブロックの概念の理解を容易にするため、各矩形ブロックには、その属性を示す、TEXT、PICTURE、LINE、TABLEの表示が付されているが、実際には属性情報は表示されず、分割された矩形ブロックが枠線として表示される。
TEXT、PICTURE、LINE、TABLEはそれぞれ、文字領域矩形ブロック、図画領域矩形ブロック、線図形領域矩形ブロック、表領域矩形ブロックの属性表示であり、写真領域矩形ブロックを示すPHOTO、その他の属性表示が用いられる。
尚、図6では入力画像と領域分割情報を左右に並べて表示しているが、これに限定されるものではない。例えば、これらを重ねて入力画像上に分割された矩形ブロックを表示する等、多様な表示形態が可能である。
ステップS304(特定領域指定処理):ステップS303で表示された領域分割情報について、後述するベクトル化処理のベクトル化対象とする矩形ブロックを特定領域として指定する。
特定領域の指定方法としては、例えば、ユーザが入力部113(例えば、ポインティングデバイス)を用いて、画像42中の1個または複数の矩形ブロックを指示することによって行う。尚、表示部116がタッチパネルを備えているのであれば、ユーザが所望の矩形ブロックを指で指示する方法等、種々の方法を採用し得る。実施形態1では、画像42のTEXT部4201を、処理対象(翻訳サービス対象)に利用する情報を有する矩形ブロックとして選択する。
ステップS305:ステップS304で指定された特定領域をイメージデータとして切り出し、切り出されたイメージデータに対して、以下の処理を行う。
ステップS306:特定領域にオリジナルデータファイルのポインタ情報が埋め込まれているか否かの判定を行うために、OCR/OMR処理を実行する。
ここで、原稿画像中に付加情報として記録された2次元バーコード、あるいはURL(あるいはURI(Uniform Resource Identifier))に該当するオブジェクト(ブロック)を検出する。付加情報がURL画像である場合は、そのURL画像をOCRで文字認識する。一方、付加情報が2次元バーコード画像である場合、その2次元バーコード画像をOMR(Optical Mark Recognition)でマーク解読を行う。
ステップS307(ポイント情報抽出処理):ステップS306の処理結果に基づいて、読取原稿画像のオリジナルデータファイルが格納されている格納先を示すポインタ情報を抽出する。
ステップS308:ポインタ情報の抽出の有無を判定する。ポインタ情報が抽出されない場合(ステップS308でNO)、ステップS309に進む。一方、ポインタ情報が抽出される場合(ステップS308でYES)、ステップS314に進み、ポインタ情報が示す格納先のオリジナルデータファイルを取得する。
尚、オリジナルデータファイルは、読取原稿画像の生成元となる電子ファイルであり、例えば、図1のクライアントPC102内のハードディスク内、データベース105内、あるいはMFP100自体が有する記憶部119のいずれかに格納されている。そして、MFP100、ステップS308で抽出したポインタ情報に従って、これらの記憶部119内を検索する。
ステップS309(ベクトル化処理):ポインタ情報が抽出されない場合、ベクトル化処理に移り、ベクトル化処理により各特定領域のイメージデータをベクトルデータに変換する。
ベクトル化処理によるベクトル化方法は、例えば、以下の(a)〜(f)が存在する。
(a)特定領域が文字領域である場合、さらにOCRによる文字画像のコード変換を行ったり、あるいは文字のサイズ、スタイル、字体を認識し、原稿を走査して得られた文字に可視的に忠実なフォントデータに変換する。
(b)特定領域が文字領域であり、かつOCRによる認識が不可能である場合、文字の輪郭を追跡し、輪郭情報(アウトライン)を線分のつながりとして表現する線分形式のアウトライン情報に変換する。
(c)特定領域が図形領域である場合、図形オブジェクトの輪郭を追跡し、輪郭情報を線分のつながりとして表現する線分形式のアウトライン情報に変換する。
(d)方法(b)及び(c)の線分形式のアウトライン情報をベジエ関数などでフィッティングして、関数情報に変換する。
(e)方法(c)の図形オブジェクトの輪郭情報から、図形の形状を認識し、円、矩形、多角形、等の図形定義情報に変換する。
(f)特定領域が図形領域であり、それが表形式のオブジェクトである場合、罫線や枠線を認識し、所定のフォーマットの帳票フォーマット情報に変換する。
尚、以上のベクトル化方法以外に、イメージデータをコード情報、図形情報、関数情報等のコマンド定義形の情報に置きかえる種々のベクトル化方法を用いても良い。
ステップS310(ファイル検索処理):ポインタ情報が抽出されない場合、ステップS304(特定領域指定処理)で指定した特定領域の情報を含むデータファイルあるいはそのオリジナルデータファイルを、マネージメントPC101やクライアントPC102上のローカルハードディスク及び文書管理サーバ106上のデータベース105において検索する。
ファイル検索処理においては、ステップ309(ベクトル化処理)で生成されたベクトルデータの内、文字領域矩形ブロックに対して行ったOCR処理結果から重要単語を抽出し、重要単語を含むデータファイルを全文検索により抽出する。
あるいは各ベクトルデータから、矩形や特殊図形の有無、表形式データの有無、それぞれの位置関係や配列等の情報からレイアウト情報を取得し、いわゆるレイアウト検索を行う。
ステップS311:検索の結果、類似度の高いデータファイルが抽出された場合、抽出結果としての候補データファイルを表示部116においてサムネイル等で表示する。候補データファイルが複数抽出されたとき等、操作者による選択が必要な場合は、操作者は入力操作によって候補データファイルの中からオリジナルデータファイルの特定を行う。
尚、候補データファイルが1個で類似度が高い場合、ステップS311をスキップして自動的にステップS312にジャンプするようにしてもよい。
このように、実施形態1では、検索されたオリジナルデータファイルの有無をOCR処理結果だけで判断するのではなく、操作者が確認する構成を設けている。
ステップS312:ステップS311で選択されたオリジナルデータファイルがラスターデータファイルあるいは、BMP、tiffに代表される、ラスターデータを符号化したイメージデータファイルであるか否かを判定する。抽出されたデータファイルがイメージデータファイルである場合(ステップS312でNO)、このデータファイルは、ステップS301で入力されたイメージデータと同様のデータ形態であるので、ステップS315において、ステップS309で得られたベクトルデータをそのまま使用して定型フォーマットに変換する。定型フォーマットへの変換は後述する。
一方、抽出されたデータファイルが、文字コードやベクトルデータ等の再利用が容易なデータファイルである場合(ステップS312でYES)、ステップS314に進み、そのデータファイルを取得する。
また、ステップS311でオリジナルデータファイルが選択されない場合、ステップS313に進み、選択したサービスによる処理結果の提供形態(出力形態)を指定した後、ステップS309で得られるベクトルデータを使用して定型フォーマットに変換する。
ステップS313:選択したサービスによる処理結果の提供形態(出力形態)を指定する。これは、例えば、図7に示す指定画面を用いて指定する。
図7では、提供形態として、プリント2201、MAIL2202、表示2203、FTP2204、HTTP2205を提供方法(サービスの受取方法)として利用できるようになっている。また、これらの提供方法は、決定ボタン2206を押下することで確定し、また、指定を取り消すには、取消ボタン2207を押下すればよい。実施形態1では、例えば、プリント2201を選択したとする。
ステップS315:ステップS309で得られたベクトルデータを使用して、選択したサービスが共通して利用できる定型フォーマットに変換し、出力する。通常、データ形式は使用するアプリケーションに依存し、目的に応じたファイル形式に変換する必要がある。
ここで、編集等で再利用可能な定型フォーマットとは、ワードプロセッサ、表計算ソフトウェア等などのアプリケーションを利用して作成されるフォーマットである。これには、例えば、マイクロソフト・コーポレーションのワードプロセッサソフトウェアWORD(登録商標)や表計算アプリケーションソフトウェアEXCEL(登録商標)等のフォーマットがある。これらは、それぞれ使用する目的が異なっており、目的に応じたファイル形式が定義され、その形式でデータファイル(データ)を保存する。
より汎用的なファイル形式としては、マイクロソフト・コーポレーションのRTF(リッチ・テキスト・ファイル)形式、近年使用されるようになったSVG(Scalable Vector Graphics)形式、あるいは単純にテキストデータのみを扱うプレーンテキスト形式等が知られており、これらはサービスが対応するアプリケーションにおいて共通に使用可能である。
ステップS314:ステップS307でポインタ情報が取得されたときは、そのポインタ情報に基づいてオリジナルデータファイルを取得する。次に、ステップ313で、選択したサービスによる処理結果の提供形態(出力形態)を指定する。そして、そのオリジナルデータファイルを、ステップ315で、定型フォーマットに変換する。
尚、実施形態1では、ユーザにより、サービスとして利用したい内容(部分領域(オブジェクト))を読取原稿画像中から指定できる構成とし、それ以外の領域については、不要な処理が実行されないようにしている。但し、指定していな領域については、その読取原稿画像に対応するオリジナルデータファイルを検索する時の検索情報の1つとして利用している。
以上の構成により、ユーザが希望する領域のみがベクトルデータに変換され、編集等の再利用が容易になる。また、画像領域等、ベクトル化すべきでないあるいはベクトル化が不要な領域を誤ってベクトル化する事故を防止できる。
次に、図5の主要なステップについて詳細に説明する。
[ブロックセレクション処理(BS処理)]
BS処理とは、例えば、図6の画像41を、図6の画像42ように、意味のあるブロック毎の塊として認識し、該ブロック各々の属性(文字(TEXT)/図画(PICTURE)/写真(PHOTO)/線(LINE)/表(TABLE)等)を判定し、異なる属性を持つブロックに分割する処理である。
BS処理とは、例えば、図6の画像41を、図6の画像42ように、意味のあるブロック毎の塊として認識し、該ブロック各々の属性(文字(TEXT)/図画(PICTURE)/写真(PHOTO)/線(LINE)/表(TABLE)等)を判定し、異なる属性を持つブロックに分割する処理である。
BS処理の実施形態を以下に説明する。
まず、入力画像を白黒に二値化し、輪郭線追跡を行って黒画素輪郭で囲まれる画素の塊を抽出する。面積の大きい黒画素の塊については、内部にある白画素に対しても輪郭線追跡を行って白画素の塊を抽出、さらに一定面積以上の白画素の塊の内部からは再帰的に黒画素の塊を抽出、輪郭線追跡を実行する。
このようにして得られた黒画素の塊を、大きさ及び形状で分類し、異なる属性を持つブロックへ分類していく。例えば、縦横比が1に近く、大きさが一定の範囲のブロックは文字相当の画素塊とし、さらに近接する文字が整列良くグループ化可能な部分を文字領域矩形ブロック、扁平な画素塊を線ブロック、一定大きさ以上でかつ矩形の白画素塊を整列よく内包する黒画素塊の占める範囲を表領域矩形ブロック、不定形の画素塊が散在している領域を写真領域矩形ブロック、それ以外の任意形状の画素塊を図画領域矩形ブロックとする。
そして、BS処理では、各矩形ブロックを特定するブロックIDを発行し、各ブロックの属性(画像、文字等)、サイズや順序、オリジナル文書内の位置(レイアウト情報(例えば、ブロック間の相対位置関係を規定する相対位置座標、あるいはオリジナル文書に対するブロックの絶対位置関係を規定する絶対位置座標))と各ブロックを関連付けて記憶部119にブロック情報として記憶する。
ここで、ブロック情報の一例について、図8を用いて説明する。
図8は本発明の実施形態1のブロック情報の一例を示す図である。
図8に示すように、ブロック情報は、各ブロックの属性を示すブロック属性(1:文字領域矩形ブロック、2:図画文字領域矩形ブロック、3:表文字領域矩形ブロック、4:線画文字領域矩形ブロック、5:写真文字領域矩形ブロック)、ブロックの位置座標(X,Y)、ブロックの幅W及び高さH、ブロックのOCR情報(テキストデータ)の有無で構成されている。
ここで、ブロックの位置座標(X,Y)とは、例えば、原稿画像の左上角を原点(0,0)とした場合の位置座標である。また、幅W及び高さHは、例えば、画素数で表現される。また、OCR情報は、入力画像におけるポインタ情報の有無を示すことになる。
また、このブロック情報に加えて、BS処理では、原稿画像(入力ファイル)に存在するブロック数Nを示す入力ファイル情報を生成する。図8の例の場合、入力ファイル情報はN=6となる。
これらの矩形ブロックごとのブロック情報は、特定領域でのベクトル化処理に利用される。また、ブロック情報によって、特定領域とその他の領域を合成する際の相対位置関係を特定でき、入力画像のレイアウトを損なわずにベクトル化領域とラスターデータ領域を合成することが可能となる。
[ポインタ情報抽出処理]
次に、図5のステップS307の処理の詳細について、図9を用いて説明する。
次に、図5のステップS307の処理の詳細について、図9を用いて説明する。
図9は本発明の実施形態1のステップS307の処理の詳細を示すフローチャートである。
尚、図9では、例えば、図10に示すような原稿画像310中に付加された2次元バーコード(例えば、QRコードシンボル)311を復号して、データ文字列を出力する処理について説明する。ここで、原稿画像310はデータ処理部115内のページメモリ(不図示)に格納される。原稿画像310には、文字領域矩形ブロック312及び313、図画領域矩形ブロック314、2次元バーコード(QRコード)のシンボル311が構成されている。
ステップS701:データ処理部115内のページメモリに格納された原稿画像310を表すイメージ画像をCPU(不図示)で走査して、上述のBS処理の処理結果に基づいて、所定の2次元バーコードシンボル311(ブロック)の位置を検出する。
特に、実施形態1の場合、2次元バーコードシンボル311であるQRコードの位置検出パターンは、2次元バーコードシンボル311の4隅の内の3隅に配置される同一の位置検出パターンから構成される。そのため、実施形態1では、この位置検出パターンを検出することで、2次元バーコードシンボル311の位置を検出する。
ステップS702:位置検出パターンに隣接する形式情報を復元し、シンボルに適用されている誤り訂正レベル及びマスクパターンを取得する。
ステップS703:2次元バーコードシンボル311を特定する型番(モデル)を決定する。
ステップS704:形式情報で取得されマスクパターンを使って、QRコードの符号化領域ビットパターンをXOR演算し、QRコードのシンボルのマスク処理を解除する。
ステップS705:ステップS703で決定したモデルに対応する配置規則を取得し、この配置規則に基づいて、シンボルキャラクタを読み取り、2次元バーコードシンボル311のデータコード語及び誤り訂正コード語を復元する。
ステップS706:復元された誤り訂正コード語上に、誤りがあるか否かを判定する。誤りがない場合(ステップS706でNO)、ステップS708に進む。一方、誤りがある場合(ステップS706でYES)、ステップS707に進む。
ステップS707:復元された誤り訂正コード語の誤りを訂正する。
ステップS708:誤り訂正されたデータより、モード指示子及び文字数指示子に基づいて、データコード語をセグメントに分割し、データコード語を復元する。
ステップS709:検出された仕様モードに基づいてデータコード文字を復号し、その復号結果を出力する。
尚、2次元バーコード内に組み込まれた情報は、対応するデータファイルのアドレス情報(ポインタ情報)を示している。ここで、アドレス情報とは、URL(URI)や、サーバ名とディレクトリ、ファイル名からなるデータファイルの格納先を示すフルパス情報である。
また、実施形態1では、ポインタ情報が2次元バーコードとして付加された原稿画像310の例について説明したが、ポインタ情報を直接文字列として原稿画像310に印刷するようにしても良い。この場合は、所定のルールに従った文字ブロックを、先のBS処理で検出し、ポインタ情報を示す文字画像の各文字を文字認識することで、直接オリジナルデータファイルのアドレス情報を得ることが可能である。
また、図10の原稿画像310の文字領域矩形ブロック312、あるいは文字領域矩形ブロック313に対して隣接する文字と文字の文字間隔に視認し難い程度の変調を加え、この文字間隔に情報を埋め込むことで、ポインタ情報を原稿画像310に埋め込むようにしても良い。この場合、後述する文字認識処理を行う際に各文字の文字間隔を検出することで、ポインタ情報を得ることが可能である。更には、図画領域矩形ブロック314の中に、電子透かし情報として、ポインタ情報を付加することも可能である。
以上のようなポインタ情報抽出に関しても、実施形態1のようにベクトル化対象の特定領域を指定することにより、迅速かつ確実にポインタ情報を取得することができる。即ち、バーコード、電子透かし等のポインタ情報が埋め込まれている矩形ブロックをユーザが指定することで、効率のよいポインタ情報抽出を行うことが可能である。
逆に、特定領域の指定を行わない場合は、入力画像全体からバーコード、電子透かし等のポインタ情報の位置を探索して抽出する処理を行わなければならず、全体のパフォーマンスを著しく損なう可能性がある。
[データファイル取得処理]
図5のステップS314における、ポインタ情報によるデータファイル取得処理は、以下のように実行する。
図5のステップS314における、ポインタ情報によるデータファイル取得処理は、以下のように実行する。
まず、ポインタ情報に含まれるアドレスに基づいて、ファイルサーバを特定し、ファイルサーバに対して、アドレスを転送する。ここで、ファイルサーバには、クライアントPC102、データベース105を内蔵する文書管理サーバ106、記憶部119を内蔵するMFP100の全てが含まれる。アドレスは、URLや、サーバ名及びファイル名よりなるパス情報である。
アドレスを受信したファイルサーバは、このアドレスに基づいて、オリジナルデータファイルを検索する。このファイル検索によってオリジナルデータファイルを取得できたときは、ファイルのアドレスをMFP100に通知する。また、ユーザが、オリジナルデータファイルの取得を希望するときは、オリジナルデータファイルをMFP100に転送する。一方、ファイルサーバにおいてオリジナルデータファイルを取得できなかったときはその旨をMFP100に通知する。
[ベクトル化処理]
次に、図5のステップS309(ベクトル化処理)の詳細について、図11を用いて説明する。
次に、図5のステップS309(ベクトル化処理)の詳細について、図11を用いて説明する。
図11は本発明の実施形態1のステップS309の処理の詳細を示すフローチャートである。
尚、ベクトル化処理は、ステップS306において入力画像にポインタ情報が抽出されなかった場合に、当該特定領域内のイメージデータをベクトル化する処理である。
ステップS901:特定領域が文字領域矩形ブロックであるか否かを判定する。文字領域矩形ブロックである場合(ステップS901でYES)、ステップS902以降の処理に進み、パターンマッチングの一手法を用いて認識を行い、対応する文字コードを取得する。一方、特定領域が文字領域矩形ブロックでない場合(ステップS901でNO)、ステップS912に進む。
ステップS902:特定領域に対し横書/縦書の判定(組み方向判定)を実行するために、特定領域内で画素値に対する水平・垂直の射影を取る。
ステップS903:ステップS902の射影の分散を評価する。水平射影の分散が大きい場合は横書、垂直射影の分散が大きい場合は縦書と判定する。
ステップS904:ステップS903の評価結果に基づき、組み方向を判定し、行の切出を行い、その後、文字を切り出して文字画像を取得する。
ここで、文字列及び文字への分解は、横書ならば水平方向の射影を利用して行を切り出し、切り出された行に対する垂直方向の射影から、文字を切り出す。一方、縦書の文字領域に対しては、水平と垂直について逆の処理を行う。行、文字切出に際して、文字のサイズも検出し得る。
ステップS905:ステップS904で切り出された各文字画像について、それから得られる特徴を数十次元の数値列に変換した観測特徴ベクトルを生成する。観測特徴ベクトルの抽出には種々の公知手法があり、例えば、文字をメッシュ状に分割し、各メッシュ内の文字線を方向別に線素としてカウントしたメッシュ数次元ベクトルを特徴ベクトルとする方法がある。
ステップS906:ステップS905で生成した観測特徴ベクトルと、あらかじめ字種ごとに登録されている辞書特徴ベクトルとを比較し、観測特徴ベクトルと辞書特徴ベクトルとの距離を算出する。
ステップS907:ステップS906で算出された距離を評価し、最も距離の近い字種を文字認識結果として生成する。
ステップS908:ステップS907における距離評価において、最短距離が所定値よりも大きいか否かによって、類似度を判定する。最短距離が所定値以上の場合、辞書特徴ベクトルにおいて、形状が類似する他の文字に誤認識している可能性が高い。そこで、最短距離が所定値以上の場合、類似度が低いと判定して(ステップS908でYES)、ステップS907の文字認識結果を採用せず、ステップS911に進む。一方、最短距離が所定値未満である場合、つまり、類似度が高い場合(ステップS908でNO)、ステップS907の文字認識結果を採用し、ステップ909に進む。
ステップS909(フォント認識処理):文字認識の際に用いる、字種数分の辞書特徴ベクトルを、文字形状種、即ち、フォント種に対して複数用意しておく。そして、パターンマッチングの際に、文字コードとともにフォント種を出力することで、文字フォントを認識し得る。
ステップS910:文字認識及びフォント認識によって得られた文字コード及びフォント情報を用いて、各々あらかじめ用意されたアウトラインデータを用いて、各文字をベクトルデータに変換する。尚、入力画像がカラー画像である場合は、カラー画像から各文字のカラー情報を抽出して、そのカラー情報をベクトルデータとともに記録する。
ステップS911:文字画像を一般的な線画と同様に扱い、該文字画像をアウトライン化する。即ち、誤認識を起こす可能性の高い文字については、可視的にイメージデータに忠実なアウトラインのベクトルデータを生成する。
ステップS912:特定領域が文字領域矩形ブロックでない場合、画像の輪郭に基づいてベクトル化処理を実行する。
以上の処理により、文字領域矩形ブロックに属するイメージ情報をほぼ形状、大きさ、色が忠実なベクトルデータに変換できる。
[文字領域以外の領域のベクトル化]
ステップS912において、処理対象の領域が、文字領域矩形ブロック以外の領域、即ち、図画領域矩形ブロック、線画領域矩形ブロック、表領域矩形ブロック等と判定される場合は、特定領域内で抽出された黒画素塊の輪郭をベクトルデータに変換する。
ステップS912において、処理対象の領域が、文字領域矩形ブロック以外の領域、即ち、図画領域矩形ブロック、線画領域矩形ブロック、表領域矩形ブロック等と判定される場合は、特定領域内で抽出された黒画素塊の輪郭をベクトルデータに変換する。
文字領域以外の領域のベクトル化においては、まず、線画等を直線及び/または曲線の組み合わせとして表現するために、曲線を複数の区間(画素列)に区切る「角」を検出する。角とは曲率が極大となる点であり、例えば、図12の曲線上の画素Piが角か否かの判定は、以下のように行う。
即ち、Piを起点とし、曲線に沿ってPiから両方向に所定画素(例えば、k個)ずつ離れた画素Pi−k、Pi+kを線分Lで結ぶ。画素Pi−k、Pi+k間の距離をd1、線分Lと画素Piとの距離をd2、曲線の画素Pi−k、Pi+k間の弧の長さをAとするとき、d2が極大となるとき、あるいは比(d1/A)が閾値以下となる場合に画素Piを角と判断する。
角によって分割された画素列を、直線あるいは曲線で近似する。直線への近似は、最小二乗法等により実行し、曲線への近似は3次スプライン関数などを用いる。画素列を分割する角の画素は近似直線あるいは近似直線における、始端または終端となる。
さらにベクトル化された輪郭内に白画素塊の内輪郭が存在するか否かを判断し、内輪郭が存在するときはその輪郭をベクトル化し、内輪郭の内輪郭というように、再帰的に反転画素の内輪郭をベクトル化する。
以上のように、輪郭の区分線近似を用いれば、任意形状の図形のアウトラインをベクトル化することができる。原稿画像がカラー画像の場合は、カラー画像から図形のカラー情報を抽出してベクトルデータとともに記録する。
また、図13に示すように、ある注目区間で外輪郭PRjと、内輪郭PRj+1あるいは別の外輪郭が近接している場合、2個あるいは複数の輪郭線をひとまとめにし、太さを持った線として表現することができる。
例えば、輪郭Pj+1の各画素Piから輪郭PRj上で最短距離となる画素Qiまでの距離PiQiを算出し、PQiのばらつきがわずかである場合には、注目区間を画素Pi、Qiの中点Miの点列に沿った直線または曲線で近似し得る。近似直線、近似曲線の太さは、例えば距離PiQiの平均値とする。
線や線の集合体である表罫線は、太さを持つ線の集合とすることにより、効率よくベクトル表現することができる。
輪郭まとめの処理の後、全体の処理を終了する。
尚、写真領域矩形ブロックについては、ベクトル化せず、イメージデータのままとする。
[図形認識]
以上の線図形等のアウトラインをベクトル化した後、ベクトル化された区分線を図形オブジェクトごとにグループ化する。
以上の線図形等のアウトラインをベクトル化した後、ベクトル化された区分線を図形オブジェクトごとにグループ化する。
この、ベクトル化処理によって得られたベクトルデータを図形ブロック毎にグループ化するグループ化処理について、図14を用いて説明する。
図14は本発明の実施形態1のベクトルデータのグループ化処理を示すフローチャートである。
ステップS1401:まず、各ベクトルデータの始点、終点を算出する。
ステップS1402(図形要素検出処理):ステップS1401で算出した始点、終点情報を用いて、図形要素を検出する。
ここで、図形要素とは、区分線が構成している閉図形であり、検出に際しては、始点、終端となっている共通の角の画素においてベクトルを連結する。即ち、閉形状を構成する各ベクトルはその両端にそれぞれ連結するベクトルを有しているという原理を応用する。
ステップS1403:次に、図形要素内に存在する他の図形要素、もしくは区分線をグループ化し、一つの図形オブジェクトとする。また、図形要素内に他の図形要素、区分線が存在しない場合は図形要素を図形オブジェクトとする。
[図形要素検出処理]
次に、図14のステップS1402の処理の詳細について、図15を用いて説明する。
次に、図14のステップS1402の処理の詳細について、図15を用いて説明する。
図15は本発明の実施形態1のステップS1402の処理の詳細を示すフローチャートである。
ステップS1501:まず、ベクトルデータより両端に連結していない不要ベクトルを除去し、閉図形を構成するベクトルを抽出する。
ステップS1502:次に、閉図形を構成するベクトルについて、いずれかのベクトルの端点(始点または終点)を開始点とし、一定方向、例えば時計回りに、順にベクトルを探索する。即ち、他端点において他のベクトルの端点を探索し、所定距離内の最近接端点を連結ベクトルの端点とする。
そして、閉図形を構成するベクトルを1まわりして開始点に戻ったとき、通過したベクトルを全て一つの図形要素を構成する閉図形としてグループ化する。また、閉図形内部にある閉図形構成ベクトルも全てグループ化する。さらにまだグループ化されていないベクトルの始点を開始点とし、同様の処理を繰り返す。
ステップS1503:最後に、ステップS1501で除去された不要ベクトルの内、ステップS1502で閉図形としてグループ化されたベクトルに端点が近接しているベクトルを検出し、一つの図形要素としてグループ化する。
以上の処理によって図形ブロックを、再利用可能な個別の図形オブジェクトとして扱うことが可能になる。
以上のベクトル化処理は、通常、入力画像全体に対して行う必要性は低く、ユーザが指定した特定領域のみをベクトル化だけに対して行えば充分な場合が多い。
そこで、実施形態1では、ユーザが指定する特定領域のみに対してベクトル化処理を行うことにより、処理のパフォーマンスを向上し、かつユーザが所望する部分のみを効率よくベクトル化して、次のステップの検索処理に利用したり、もしくはイメージ情報のうちの必要な部分だけの再編集や再利用をする効果を提供することが可能になる。
[ファイル検索処理]
次に、図5のステップS310の処理の詳細について、図8及び図16を用いて説明する。
次に、図5のステップS310の処理の詳細について、図8及び図16を用いて説明する。
図16は本発明の実施形態1のステップS310の処理の詳細を示すフローチャートである。
尚、ステップS310の処理は、ステップS308で読取原稿画像(入力ファイル)にポインター情報が存在しなかった場合、または、ポインター情報は存在するがオリジナルデータファイルが見つからなかった場合、あるいはオリジナルデータファイルがイメージファイルである場合に実行される。
また、ステップS310の処理は、ステップS302の処理によって得られたブロック情報及び入力ファイル情報を利用することになるが、ここでは、その具体例として、図8に示したブロック情報及び入力ファイル情報を備え、かつ特定領域内のベクトル化情報が存在するものとする。
また、図8のブロック情報において、各ブロックは、X座標の小さい順、即ち、X1<X2<X3<X4<X5<X6に、ブロック1、ブロック2、ブロック3、ブロック4、ブロック5、ブロック6が管理されているとする。そして、ブロック1〜ブロック6の6個の矩形ブロックについては、属性、座標、幅、高さ、OCR情報の有無がブロック情報として記録され、属性は、文字、画像、表、線画、写真その他に分類されている。また、入力ファイル情報のブロック総数は、入力画像中の全ブロック数であり、図8では、ブロック総数Nは6である。
以下、これらのブロック情報及び入力ファイル情報を使用して、ファイルサーバが管理するデータベース内から、入力ファイルに類似したデータファイルを、レイアウト検索処理で検索する処理について、図16を用いて説明する。ここで、データベースで管理されている各データファイルには、図8と同様のファイル情報及びブロック情報が付与されていることを前提とする。また、レイアウト検索処理は、入力ファイルとデータベース中のデータファイルを順次比較して実行される。
ステップS1101:後述する類似率等を算出するための各種初期値を設定するための初期化を行う。
ステップS1102:次に、入力画像におけるブロック総数Nとの差が所定値以内、即ち、データベース内のデータファイルにおいて、条件式N−ΔN<n<N+ΔNなるn個のブロック総数を持つデータファイルであるか否かを判定する。
条件式を満足するデータファイルが抽出検索される場合(ステップS1102でYES)、ステップS1103に進み、当該検索抽出されたデータファイル内の矩形ブロックの情報と入力画像内のブロック情報とを順次比較していく。
一方、条件式を満足しないデータファイルが抽出検索された場合(ステップS1102でNO)、つまり、ブロック総数の差が所定値より大きい場合、ステップS1116にジャンプする。
尚、矩形ブロックの情報比較においては、ステップS1103〜ステップS1109によって、属性類似率、サイズ類似率、OCR類似率をそれぞれ算出し、これら類似率に基づいてステップS1111において、該比較対象のデータファイルの総合類似率を算出する。
ステップS1103:入力画像のブロック属性と、ステップS1102で抽出されたデータファイルのブロック属性とを比較する。ブロック属性が一致する場合、ステップS1104に進む。一方、ブロック属性が一致しない場合、ステップS1110に進む。
ステップS1104:ステップS1103で比較された、ブロック情報の属性について属性類似率を更新する。属性類似率の算出方法は、任意の方法を用いることが可能であるが、例えば、{(属性一致ブロック数)/(総ブロック数)}に基づいて算出するものとする。
ステップS1105:入力画像のブロック情報のサイズ(幅W、高さH)と、ステップS1102で抽出されたデータベースファイルのサイズ(幅w、高さh)を比較する。サイズの差が所定範囲内であるか否かを判定する。即ち、サイズの差が、W−ΔW<w<W+ΔWでありかつH−ΔH<h<H+ΔHであるか否か判定する。所定範囲内の場合(ステップS1105でYES)、ステップS1106に進む。一方、所定範囲内でない場合(ステップS1105でNO)、ステップS1110に進む。
ステップS1106:ステップS1105で比較されたブロック情報のサイズについてサイズ類似率を更新する。サイズ類似率の算出方法は、任意の方法を用いることが可能であるが、例えば、{1−(サイズ差)/(入力イメージデータの該ブロックサイズ)}で各ブロックのサイズ類似率を算出して、更に、該データファイルについてサイズ類似度の平均値を算出することにより算出することができる。
ステップS1107:入力画像のブロック情報、及びステップS1102で抽出されたデータファイルのブロック情報にOCR情報が「有」か否かを判断する。両者がOCR情報「有」である場合(ステップS1107でYES)、ステップS1108に進む。一方、OCR情報が「無」の場合(ステップS1107でNO)、ステップS1110に進む。
ステップS1108:入力画像のブロック情報のOCR情報と、ステップS1102で抽出されたデータファイルのOCR情報とを比較する。
ステップS1109:ステップS1108で比較されたOCR情報について、OCR情報類似率を算出する。OCR情報類似率の算出方法は、任意の方法を用いることが可能であるが、例えば、各ブロックの認識結果文字同士を比較し、認識結果の一致率を算出する等して算出することができる。
ステップS1110:入力画像に含まれる全てのブロックについて、当該データファイルの各ブロックとの比較処理が終了したか否かを判定する。全てのブロックの処理が終了した場合(ステップS1110でYES)、ステップS1111に進む。一方、未処理のブロックが残っている場合(ステップS1110でNO)、ステップS1115を経て、次のブロックの比較処理を行うために、ステップS1103に戻る。
ステップS1111:属性類似率、サイズ類似率、OCR類似率に基づいて総合類似率を算出する。総合類似率の算出方法は、例えば、各類似率に所定の重み付けを行って、和をとることにより算出される。
ステップS1112:総合類似率が予め設定された閾値Thより高いか否か判定する。総合類似率が閾値Thより高い場合(ステップS1112でYES)、ステップS1113に進む。一方、総合類似率が閾値Th以下である場合(ステップS1112でNO)、ステップS1114に進む。
ステップS1113:ステップS1112で総合類似率が閾値Thより高いと判定されたデータベースのデータファイルを類似候補として保存する。
ステップS1114:データベースの全てのデータファイルについて処理が終了したか否かを判定する。全てのデータファイルの処理が終了している場合(ステップS1114でYES)、そのまま処理を終了する。一方、未処理のデータファイルが残っている場合(ステップS1114でNO)、ステップS1116を経てステップS1101に戻る。
ステップS1115:データファイルの個々のブロック情報と、入力画像のブロック情報の全てを比較するように、比較対象のブロックを次のブロックに進める。
ステップS1116:データベースの各データファイルが順次比較されるように、次のデータファイルを比較対象にする。
尚、図9の各ステップにおいて、N、W、Hは、入力画像のブロック総数、各ブロック幅、各ブロック高さである。また、ΔN、ΔW、ΔHは、入力画像のブロック情報を基準とした許容範囲を示している。更に、n、w、hは、データベースファイルのブロック総数、各ブロック幅、各ブロック高さである。
また、ステップS1105にてサイズ比較時に、座標X、座標Yの位置情報の比較などを行ってもよい。
以上、ファイル検索処理の結果、総合類似度が閾値Thより高く、候補として保存されたデータファイル(ステップS1113)をサムネイル等で表示(ステップS311)する。複数候補の中から操作者が候補を選択すべきときには、操作者の入力操作よってファイルの特定を行う。
以上の処理において、ステップS309で生成されたベクトル化情報が保持され、ファイル検索処理(図5のステップS310、図16)に利用可能なベクトル化情報としてはOCRによる文字コード情報や縦書/横書といったレイアウト情報、図形認識(図15)による図形の個数や配置、フォント認識(図11)による文書中の文字に使われているフォント情報等がある。
本発明では、BS処理によって得られたレイアウト情報に加えて、ユーザが着目する特定領域の詳細なベクトル化情報を、ファイル検索処理(図16)における類似度算出に利用し得るので、検索の精度を向上することができる。また、ファイル検索処理において、特定領域のベクトル化情報の重みを高め、ユーザが着目した部分を重視した類似度が算出されるので、ユーザの希望に沿った検索結果が得られることになる。
[定型フォーマットへの変換処理]
図5のBS処理(ステップS302)の後、ベクトル化処理(ステップS309)の処理結果のデータを用いて、ステップS315の定型フォーマットへの変換処理を実行する。ステップS306のベクトル化処理結果は、図17に示す中間データの形式、いわゆるドキュメント・アナリシス・アウトプット・フォーマット(DAOF)と呼ばれる形式で保存されている。
図5のBS処理(ステップS302)の後、ベクトル化処理(ステップS309)の処理結果のデータを用いて、ステップS315の定型フォーマットへの変換処理を実行する。ステップS306のベクトル化処理結果は、図17に示す中間データの形式、いわゆるドキュメント・アナリシス・アウトプット・フォーマット(DAOF)と呼ばれる形式で保存されている。
ここで、DAOFのデータ構造について、図17を用いて説明する。
図17は本発明の実施形態1のDAOFのデータ構造を示す図である。
図17において、DAOFは、ヘッダ(Header)1601、レイアウト記述データ部1602、文字認識記述データ部1603、表記述データ部1604、画像記述データ部1605、出力形式部1606よりなる。
ヘッダ1601には、処理対象の入力画像に関する情報が保持される。
レイアウト記述データ部1602には、入力画像中の矩形ブロックの属性TEXT(文字)、TITLE(タイトル)、CAPTION(キャプション)、LINE(線画)、PICTURE(図面)、FRAME(枠)、TABLE(表)、PHOTO(写真)等の情報と、これら属性が認識された各矩形ブロックの位置情報が保持される。
文字認識記述データ部1603には、TEXT、TITLE、CAPTION等の文字領域矩形ブロックの内、ユーザにより指定された領域について、文字認識して得られる文字認識結果が保持される。
表記述データ部1604には、表領域矩形ブロック(TABLE)の表構造の詳細が格納される。
画像記述データ部1605には、図画領域矩形ブロック(PICTURE)や線画領域矩形ブロック(LINE)等のブロックにおけるイメージデータが、入力画像データから切り出して保持される。
ベクトル化処理を指示された特定領域においては、ブロックに対しては、画像記述データ部1605には、ベクトル化処理により得られたブロックの内部構造や、画像の形状や文字コード等あらわすデータの集合が保持される。
一方、ベクトル化処理の対象ではない、特定領域以外の矩形ブロックでは、入力画像データそのものが保持される。
出力形式部1606は、図5のステップS313にて指定された提供方法(出力方法)が記述される。
次に、定型フォーマットへの変換処理の詳細について、図18を用いて説明する。
図18は本発明の実施形態1の定型フォーマットへの変換処理の詳細を示すフローチャートである。
ステップS1701:DAOF形式のデータを入力する。
ステップS1702:定型フォーマットのデータの元となる文書構造ツリー生成処理を実行する。
ステップS1703:文書構造ツリーを元に、DAOF内の実データを取得し、定型フォーマットを生成する。
次に、ステップS1703の文書構造ツリー生成処理の詳細について、図19を用いて説明する。
図19は本発明の実施形態1のステップS1703の処理の詳細を示すフローチャートである。
尚、図19の処理において、全体制御の基本ルールとして、処理の流れはミクロブロック(単一矩形ブロック)からマクロブロック(矩形ブロックの集合体)へ移行する。以後「矩形ブロック」は、ミクロブロック及びマクロブロック両者を意味するものとする。
ステップS1801:矩形ブロック単位で、縦方向の関連性に基づいて、矩形ブロックを再グループ化する。図19の処理は繰り返し実行されることがあるが、処理開始直後はミクロブロック単位での判定となる。
ここで、関連性とは、距離が近い、ブロック幅(横方向の場合は高さ)がほぼ同一であることなどの特徴によって定義される。また、距離、幅、高さなどの情報はDAOFを参照し、抽出する。
例えば、図20の入力画像では、最上部で、矩形ブロックT1、T2が横方向に並列されている。矩形ブロックT1、T2の下には横方向セパレータS1が存在し、横方向セパレータS1の下に矩形ブロックT3、T4、T5、T6、T7が存在する。
矩形ブロックT3、T4、T5は、横方向セパレータS1下側の領域における左半部において上から下に、縦方向に配列されている。また、矩形ブロックT6、T7は、横方向セパレータS1下側の領域における右半部において上下に配列されている。
ステップS1801の縦方向の関連性に基づくグルーピング処理を実行する。処理開始直後は、ミクロブロック単位での判定となる。
例えば、図20では、矩形ブロックT3、T4、T5が1個のグループ(矩形ブロック)V1にまとめられる。また、矩形ブロックT6、T7が1個のグループ(矩形ブロック)V2にまとめられる。ここで、グループV1、V2は同一階層となる。
ステップS1802:縦方向のセパレータの有無をチェックする。セパレータは、DAOF中でライン属性を持つオブジェクトであり、アプリケーションソフトウェア中で明示的にブロックを分割する機能を持つブロックである。セパレータを検出すると、処理対象の階層において、入力画像の領域を、セパレータを境界として左右に分割する。図20では、縦方向のセパレータは存在しない。
ステップS1803:縦方向のグループ高さの合計(グループ長)が入力画像の高さ(ページ高さ)に等しいか否かを判定する。即ち、縦方向(例えば、上から下へ)に処理対象の領域を移動しながら横方向のグルーピングを行うときに、入力画像全体の処理が終了する場合は、グループ高さ合計が入力画像高さになることを利用し、処理の終了判定を行う。
そこで、縦方向のグループ長がページ高さである場合(ステップS1803でYES)、処理を終了する。一方、縦方向のグループ長がページ高さでない場合(ステップS1803でNO)、ステップS1804に進む。
ステップS1804:横方向の関連性に基づくグルーピング処理を実行する。
例えば、図20では、矩形ブロックT1、T2が1個のグループ(矩形ブロック)H1にまとめられる。また、矩形ブロックV1、V2が1個のグループ(矩形ブロック)H2にまとめられる。ここで、グループH1、H2は同一階層となる。ここでも、処理開始直後はミクロブロック単位での判定となる。
ステップS1805:横方向のセパレータの有無をチェックする。セパレータを検出すると、処理対象の階層において、入力画像の領域を、セパレータを境界として上下に分割する。図20では、横方向のセパレータS1が存在する。
以上の処理結果は、図21の文書構造ツリーとして登録される。
図21において、入力画像V0は、最上位階層にグループH1、H2、セパレータS1を有し、グループH1には第2階層の矩形ブロックT1、T2が属する。
グループH2には、第2階層のグループV1、V2が属し、グループV1には、第3階層の矩形ブロックT3、T4、T5が属し、グループV2には、第3階層の矩形ブロックT6、T7が属する。
ステップS1806:横方向のグループ長の合計が入力画像の幅(ページ幅)に等しいか否かを判定する。これによって、横方向のグルーピングに関する終了判定を行う。横方向のグループ長がページ幅である場合(ステップS1806でYES)、処理を終了する。一方、横方向のグループ長がページ幅でない場合(ステップS1806でNO)、ステップS1801に戻り、再びもう一段上の階層で、縦方向の関連性チェックから繰り返す。
図20及び図21の文書構造ツリー生成の段階で、横方向の分割幅がページ幅になると、そこで処理を終了し、最後にページ全体を表す最上位階層のV0を文書構造ツリーに付加する。
文書構造ツリーが完成した後、その情報を元にステップS1703において、定型フォーマットのデータの生成を行う。
図20及び図21に基づく定型フォーマットのデータによる、アプリケーションソフトウェアの処理の例は、以下のとおりである。
まず、グループH1が横方向に2個の矩形ブロックT1、T2を有するので、2カラムとし、T1のDAOFを参照し、その内部情報(文字認識結果の文章、画像等)を出力する。その後、カラムを変え、T2の内部情報を出力し、続いてセパレータS1を出力する。
次に、グループH2の処理に移る。グループH2は横方向に2個の矩形ブロックV1、V2を有するので、2カラムとして出力する。グループV1については、矩形ブロックT3、T4、T5の順にその内部情報を出力し、その後、カラムを変え、グループV2の矩形ブロックT6、T7の内部情報を出力する。
以上により、定型フォーマットへデータの変換処理が実行される。
図22は、定型フォーマットへ変換されたデータの一例である。特に、図22では、SVGフォーマットで記述されている例を示しているが、MFP100とサーバ110間で利用可能な定型フォーマットであれば、他のフォーマット形式を利用しても構わない。図22では説明のため、オブジェクトの表記を枠で囲っている。
枠1901は、イメージ属性を示し、そこには、イメージオブジェクト(図画領域矩形ブロックあるいは写真領域矩形ブロック)の領域の示す領域情報とビットマップ情報が示されている。
枠1902は、テキストオブジェクト(文字領域矩形ブロック)の情報が示されている。また、枠1903は、枠1902で示した内容をベクターオブジェクト(ベクトルデータ)として表現している。続く、枠1904は、表オブジェクト等のラインアートを示している。枠1905は、図7で指定した出力形態(提供形態)を示している。
尚、実施形態1では、サービス利用対象の特定領域のオブジェクトとして、文字領域矩形ブロック(テキストデータ)が指定されているため、選択されたサービスである翻訳サービスには、翻訳対象部分をデータ内で明示するために、枠1906に、選択されたサービスを示す情報と、そのサービスの処理対象(翻訳対象)のオブジェクトに関する情報(例えば、位置情報)を、例えば、タグによって記述する。
図22の場合、枠1906では、枠1902を特定するキーワード(文字列)を構成して、このデータをサーバ110に送信したときに識別できるようにしているが、翻訳対象部分の明示方法については、これに限定されず、翻訳対象部部分であるテキストを明示するタグそのものを記述しても構わない。
また、以上説明した翻訳サービスを利用するための定型フォーマットのデータは、MFP100もしくは、ローカル環境10以外のサーバ環境を利用しても同様の処理を実現することができる。
[定型フォーマットの解析]
定型フォーマットで正規化されたデータファイルは、MFP100から、ネットワーク104を介して、指定されたローカル環境30のサーバ110へ送信される。
定型フォーマットで正規化されたデータファイルは、MFP100から、ネットワーク104を介して、指定されたローカル環境30のサーバ110へ送信される。
サーバ110では、始めに、MFP100から受信したデータファイル(例えば、図22)を解析する。解析は、正規化された定型フォーマットでルール化されているため、サーバ110で自動的に、サービスに利用する箇所を利用できるようになっている。
実施形態1では、図22の枠1906の「Key」で明示されているオブジェクトの情報が翻訳サービスで利用するオブジェクトとなる。
[返信用の定型フォーマットの生成]
サーバ110にて、枠1906で指定されたオブジェクト(図22の場合、枠1902)に対する翻訳が終了すると、図23に示すような、MFP100に対する返信用の定型フォーマットのデータファイルの生成を実行する。このとき、生成するデータファイルは、送信時にMFP100が生成したものと同様のファイル形式となっている。
サーバ110にて、枠1906で指定されたオブジェクト(図22の場合、枠1902)に対する翻訳が終了すると、図23に示すような、MFP100に対する返信用の定型フォーマットのデータファイルの生成を実行する。このとき、生成するデータファイルは、送信時にMFP100が生成したものと同様のファイル形式となっている。
この返信用の定型フォーマットのデータファイルの一例を図23に示す。図23では、図22で指定された枠1902にサーバ110の翻訳サービスによる翻訳結果が反映された枠2201を有する返信用のフォーマットのデータファイルが生成されている。
[返信用の定型フォーマットの解析]
サーバ110で生成された翻訳済の返信用の定型フォーマットのデータファイルは、ネットワーク104を介して、MFP100へ送信される。MFP100では、受信した返信用の定型フォーマットのデータファイル(図23)を解析して、指定された出力形態で出力先に出力する。
サーバ110で生成された翻訳済の返信用の定型フォーマットのデータファイルは、ネットワーク104を介して、MFP100へ送信される。MFP100では、受信した返信用の定型フォーマットのデータファイル(図23)を解析して、指定された出力形態で出力先に出力する。
実施形態1の場合では、返信用の定型フォーマットのデータファイルは、SVG形式で記述されているので、MFP100は、SVGパーサー(不図示)を介してデータファイル(図23)を解釈する。SVGパーサーは、解釈内容をデータ処理部115にてRIP(Raster Image Processing)にてラスターデータに変換後、所定の画像処理を施す。
このとき、SVGパーサーは、データファイル(図23)に記述された枠1905(<svg:output print /svg:output>)によって、その出力形態として、データファイルから生成されたビットマップイメージをMFP100の印刷部112に送信してプリントする。
枠1905は、MFP100にてプリントすることを明示しているが、他のMFPを指定することも、実施形態1では可能となる。この場合は、他のMFPを明示するIPアドレスと出力形態:printを枠1905に記述すれば良い。また、他のPCにてファイル転送する場合も、転送先のIPアドレスを記述して所定のフォルダへFTP、もしくはHTTPを指定された内容によって送信する。以下は、IPアドレスが「172.72.100.98」の外部装置に、FTP転送する場合の枠1906の記述例である。
<svg:output ip=”172.72.100.98”, “FTP”, “user=canon”,”passwd=xxxx”, /svg:output>
さらに、クライアントPC102に送信する場合は、公知のメール送信手段により、添付ファイルとして、本ファイルを添付して送信することができる。以下は、クライアントPC102のIPアドレスが「172.72.100.98」である場合に、そのクライアントPC102にメール送信する場合の枠1906の記述例である。
さらに、クライアントPC102に送信する場合は、公知のメール送信手段により、添付ファイルとして、本ファイルを添付して送信することができる。以下は、クライアントPC102のIPアドレスが「172.72.100.98」である場合に、そのクライアントPC102にメール送信する場合の枠1906の記述例である。
<svg:output ip=”172.72.100.99”, “MAIL”, “TO=CANON.JP”, /svg:output>
以上説明したように、実施形態1によれば、ローカル環境以外の外部のサービスを利用する場合に、紙情報を単に電子化したものではなく、オリジナルのデータファイルが利用でき、かつ必要な部分だけを選択して利用できる。その結果として、実施形態1では、OCRの認識精度だけによらず、サービスの恩恵を精度良く受けることができる。
以上説明したように、実施形態1によれば、ローカル環境以外の外部のサービスを利用する場合に、紙情報を単に電子化したものではなく、オリジナルのデータファイルが利用でき、かつ必要な部分だけを選択して利用できる。その結果として、実施形態1では、OCRの認識精度だけによらず、サービスの恩恵を精度良く受けることができる。
また、サービス間で利用するフォーマットとして、正規化された論理記述言語で記述されたものを利用することで、紙情報から複数のWebサービスを統一的に利用できる。その結果、利用したいサービスをMFP、あるいはそれに相当する端末や画像の入出力機器でサービスの追加が容易となる。
最後に、インターネット社会で紙媒体を電子化された世界で利用されるサービスとして自動的に利用できることが最も大きなメリットと言えよう。
[実施形態2]
実施形態1では、サーバ110に送信する内容は、処理対象が紙媒体の一部のオブジェクトにも関わらず、紙媒体全ての情報を定型フォーマットのデータファイルとして送信している。このような構成の場合、データファイルによっては、膨大なイメージオブジェクトやそれに付随するもの、あるいはサービスを受ける必要のないオブジェクト情報が多い場合には、送信にかかるトラフィックが問題となる。
実施形態1では、サーバ110に送信する内容は、処理対象が紙媒体の一部のオブジェクトにも関わらず、紙媒体全ての情報を定型フォーマットのデータファイルとして送信している。このような構成の場合、データファイルによっては、膨大なイメージオブジェクトやそれに付随するもの、あるいはサービスを受ける必要のないオブジェクト情報が多い場合には、送信にかかるトラフィックが問題となる。
そこで、実施形態2では、指定されたオブジェクトのみを、サーバ110に送信する構成について説明する。尚、以下で、実施形態1と同様な構成の説明は省略し、異なる部分について説明する。
図24は本発明の実施形態2の定型フォーマットの一例を示す図である。
ファイルの基本構成は、実施形態1の図22と同様であるが、図5のステップS315で作成する定型フォーマットのデータファイルは、図24に示すように、基本構成は、枠2401に示すデータファイルを固有に識別するための識別情報であるID番号と、枠2402に示す翻訳対象のオブジェクト情報だけである。
枠2401は、サーバ110から受信する返信用の定型フォーマットのデータファイル(この場合、翻訳結果)とマージするため、紙媒体に対応するデータファイルをID番号でMFP100内の記憶部119にて別途管理される。
以上説明したように、翻訳サービスを利用するための定型フォーマットは、MFP100もしくは、ローカル環境10以外のサーバ環境を利用しても同様の処理を実現できる。
[定型フォーマットの解析]
定型フォーマットで正規化されたファイルは、MFP100から、ネットワーク104を介して、指定されたローカル環境30のサーバ110へ送信される。
定型フォーマットで正規化されたファイルは、MFP100から、ネットワーク104を介して、指定されたローカル環境30のサーバ110へ送信される。
サーバ110では、始めに、MFP100から受信したデータファイル(例えば、図24)を解析する。解析は、正規化された定型フォーマットでルール化されているため、サーバ110で自動的に、サービスに利用する箇所を利用できるようになっている。
実施形態2では、図24の枠2402で明示されているオブジェクトの情報が翻訳サービスで利用するオブジェクトとなる。
[返信用の定型フォーマットの生成]
サーバ110にて、枠2402のオブジェクトに対する翻訳が終了すると、図25に示すような、MFP100に対する返信用の定型フォーマットのデータファイルの生成を実行する。このとき、生成するデータファイルは、送信時にMFP100が生成したものと同様のファイル形式となっている。
サーバ110にて、枠2402のオブジェクトに対する翻訳が終了すると、図25に示すような、MFP100に対する返信用の定型フォーマットのデータファイルの生成を実行する。このとき、生成するデータファイルは、送信時にMFP100が生成したものと同様のファイル形式となっている。
この返信用の定型フォーマットのデータファイルの一例を図25に示す。図25では、図24の枠2402にサーバ110の翻訳サービスによる翻訳結果が反映された枠2501を有する返信用のフォーマットのデータファイルが生成されている。
[返信用の定型フォーマットの解析]
サーバ110で生成された翻訳済の定型フォーマットのデータファイルは、ネットワーク104を介して、MFP100へ送信される。MFP100では、受信した返信用の定型フォーマットのデータファイル(図25)を解析して、指定された出力形態で出力先に出力する。
サーバ110で生成された翻訳済の定型フォーマットのデータファイルは、ネットワーク104を介して、MFP100へ送信される。MFP100では、受信した返信用の定型フォーマットのデータファイル(図25)を解析して、指定された出力形態で出力先に出力する。
実施形態2の場合では、返信用の定型フォーマットのデータファイルは、SVG形式で記述されているので、MFP100は、SVGパーサー(不図示)を介してで0他ファイル(図25)を解釈する。
SVGパーサーは、枠2401を解釈すると、MFP100内の記憶部119に格納された「ID=0x238」に関連付けられたオリジナルデータファイル(図22)をメモリ(不図示)にロードし、オリジナルデータファイル(図22)の枠1902の情報を、サーバ110から受信したデータファイル(図25)中の枠2501の情報(翻訳情報)に置き換える。
このとき、SVGパーサーは、枠1902と枠2501で指定されたアドレス空間がファイル全体のオブジェクトと重複しないように変更を行なう。
変更後、SVGパーサーは、解釈した内容をデータ処理部115にてRIP(Raster Image Processing)にてラスターデータに変換後、所定の画像処理を施す。
このとき、SVGパーサーは、データファイル(図22)に記述された枠1905(<svg:output print /svg:output>)によって、その出力形態として、データファイルから生成されたビットマップイメージをMFP100の印刷部112に送信してプリントする。
枠1905は、MFP100にてプリントすることを明示しているが、他のMFPを指定することも、実施形態2では可能となる。これについての詳細は、実施形態1で説明した通りである。
以上説明したように、実施形態2では、実施形態1で説明した効果に加えて、サービスを利用したいオブジェクトだけを選択して外部のサービスを利用できるため、不必要なトラフィックを軽減されることはもちろん、利用するサービスが提供する情報量に比例した料金設定がなされた場合においても、料金を意識したサービスの利用を行なうことができる。
尚、実施形態2では、ネットワーク104を介する情報は、指定されたオブジェクトに限定し、トラフィック情報を軽減する構成について説明した。また、その処理結果を、ユーザに提供する提供形態として、実施形態1と同様に紙媒体に対応する読取原稿画像の内、定型フォーマットへの変換が必要な部分(オブジェクト)だけに変換を施して、サーバ110に提供している。
ここで、実施形態2の派生した形態として、サーバ110に提供した部分だけをユーザに提供する構成も考えられる。そのときは、ID番号で管理される情報(データファイル)は、図22で示す構成のデータファイルである必要はなく、枠1905で示される提供形態だけからなるデータファイルだけをMFP100は管理すればよい。
[他の実施形態]
以上の実施形態1及び2においては、画像読取部118からの読取原稿画像に対する処理について例を挙げて説明したが、これに限定されるものではない。例えば、記憶媒体に格納されたラスターデータあるいはその符号化データよりなるイメージデータ、通信手段によって供給されたイメージデータ等、読取原稿画像以外のイメージデータについても、本発明は有効である。
以上の実施形態1及び2においては、画像読取部118からの読取原稿画像に対する処理について例を挙げて説明したが、これに限定されるものではない。例えば、記憶媒体に格納されたラスターデータあるいはその符号化データよりなるイメージデータ、通信手段によって供給されたイメージデータ等、読取原稿画像以外のイメージデータについても、本発明は有効である。
本発明に係る画像処理方法を実現する構成は、図1、図2に示す画像処理システムに限定されるものではなく、専用の画像処理装置、汎用コンピュータ等種々の手段を採用し得る。
汎用コンピュータにおいて実行する際には、画像処理方法の各ステップを汎用コンピュータに実行させるためプログラムコードを含むコンピュータ実行可能なプログラムを、汎用コンピュータに読み込ませる。そして、汎用コンピュータが画像処理を実行するためのプログラムは、汎用コンピュータに内蔵されたROMや、汎用コンピュータが読み取り得る記憶媒体から読み込まれ、あるいはネットワークを通じてサーバ等から読み込まれる。
また、本発明の趣旨と範囲は、本発明の特定の説明と図に限定されるものではなく、本願特許請求の範囲に述べられた内容の様々な修正および変更に及ぶことは当業者にとって理解されるであろう。
また、実施形態1や2で説明した翻訳サービスでは、定型フォーマットで予めルール化されたフォーマットを利用して翻訳するオブジェクトを明示したが、提供するサービスによって、明示せずともオブジェクトをサーバ110内の解析にて自動的に判断することも可能である。
実施形態1や2では、テキストオブジェクトが翻訳サービスの対象であるので、テキストオブジェクトを抽出することで、本発明は達成可能である。仮に、日本語以外のテキストオブジェクトがある場合は、意味不明な翻訳結果が送信されるが、提供されるユーザは、その内容には関心が無いため、問題はない。
さらに、本発明は、テキストを利用した他のサービスにも適用可能である。例えば、原本保証サービスに代表されるように、オリジナルと同等の電子データを検索することが重要なサービスにとって、本発明の[紙媒体から電子情報データ取得までの処理]は大いに活用でき、さらにその電子データを共通のフォーマットとして自動生成する本画像処理システムの仕組みを利用すれば、その効果を確認できるであろう。
その上、本発明の範囲は、テキストオブジェクト以外のイメージオブジェクト、グラフィックオブジェクトなどを利用するサービスにも適用可能である。その理由は、上述した[紙媒体から電子情報データ取得までの処理]において、紙媒体と同等の電子データをオブジェクト毎に論理記述されたフォーマットのデータとして、コンピュータ間を再利用可能な形で利用できるからである。
以上、実施形態例を詳述したが、本発明は、例えば、システム、装置、方法、プログラムもしくは記憶媒体等としての実施態様をとることが可能であり、具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
尚、本発明は、前述した実施形態の機能を実現するソフトウェアのプログラム(実施形態では図に示すフローチャートに対応したプログラム)を、システムあるいは装置に直接あるいは遠隔から供給し、そのシステムあるいは装置のコンピュータが該供給されたプログラムコードを読み出して実行することによっても達成される場合を含む。
従って、本発明の機能処理をコンピュータで実現するために、該コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等の形態であっても良い。
プログラムを供給するための記録媒体としては、例えば、フロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RW、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD−ROM,DVD−R)などがある。
その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続し、該ホームページから本発明のコンピュータプログラムそのもの、もしくは圧縮され自動インストール機能を含むファイルをハードディスク等の記録媒体にダウンロードすることによっても供給できる。また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明に含まれるものである。
また、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布し、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせ、その鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される他、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部または全部を行ない、その処理によっても前述した実施形態の機能が実現され得る。
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行ない、その処理によっても前述した実施形態の機能が実現される。
100 MFP
101 マネージメントPC
102 クライアントPC
103 プロキシサーバ
104 ネットワーク
105 データベース
106 文書管理サーバ
107、108、109、111 LAN
110 サーバ
112 印刷部
113 入力部
114、117 ネットワークI/F
115 データ処理部
116 表示部
118 画像読取部
119 記憶部
101 マネージメントPC
102 クライアントPC
103 プロキシサーバ
104 ネットワーク
105 データベース
106 文書管理サーバ
107、108、109、111 LAN
110 サーバ
112 印刷部
113 入力部
114、117 ネットワークI/F
115 データ処理部
116 表示部
118 画像読取部
119 記憶部
Claims (15)
- 複数種類のサービスを提供するネットワーク上のサーバに入力画像を出力して、前記サーバから前記入力画像に対するサービスによる処理結果を前記ネットワークを介して受信して出力する画像処理装置であって、
前記サーバが提供するサービス群から、利用するサービスを選択するサービス選択手段と、
前記入力画像を属性毎のオブジェクトに分割する分割手段と、
前記分割手段によって得られる前記入力画像を構成するオブジェクトの内、前記サービス選択手段で選択したサービスの処理対象のオブジェクトを選択するオブジェクト選択手段と、
前記サービス選択手段で選択したサービスによる処理結果の提供方法を選択する提供方法選択手段と、
前記オブジェクト選択手段で選択したオブジェクトを含むデータファイルを、前記サービス選択手段で選択したサービスで利用可能な所定フォーマットのデータファイルに変換する変換手段と、
前記変換手段による変換によって得られる所定フォーマットのデータファイルを前記ネットワークを介して前記サーバへ送信する送信手段と、
前記サービス選択手段で選択したサービスによる、前記所定フォーマットのデータファイルの処理結果を前記ネットワークを介して前記サーバから受信する受信手段と、
前記提供方法選択手段で選択した提供方法で、前記受信手段で受信した処理結果を含むデータファイルを提供する提供手段と
を備えることを特徴とする画像処理装置。 - 前記分割手段によって得られる前記入力画像を構成するオブジェクトそれぞれを、対応する属性に基づいてベクトル化するベクトル化手段を更に備える
ことを特徴とする請求項1に記載の画像処理装置。 - 前記所定フォーマットのデータファイルは、前記オブジェクト選択手段で選択したオブジェクトの内容を示す記述と、前記オブジェクトが前記サービス選択手段で選択したサービスの処理対象であることを示す記述と、前記提供方法選択手段で選択した提供方法を示す記述を少なくとも含む
ことを特徴とする請求項2に記載の画像処理装置。 - 前記変換手段は、前記ベクトル化手段によって得られる、前記入力画像に対応するデータファイルから、前記所定フォーマットのデータファイルに変換する
ことを特徴とする請求項3に記載の画像処理装置。 - 前記受信手段は、前記処理結果として、前記所定フォーマットのデータファイルが前記サービス選択手段で選択したサービスによる処理が施されることによって得られる返信用の所定フォーマットのデータファイルを前記ネットワークを介して前記サーバから受信する
ことを特徴とする請求項3に記載の画像処理装置。 - 前記ベクトル化手段によって得られる前記入力画像に対応するデータファイルを記憶する記憶手段を更に備える
ことを特徴とする請求項2に記載の画像処理装置。 - 前記変換手段は、前記記憶手段に記憶される第1データファイルから、前記第1データファイルを識別するための識別情報を示す記述と、前記オブジェクト選択手段で選択したオブジェクトの内容を示す記述を少なくとも含む前記所定フォーマットの第2データファイルに変換する
ことを特徴とする請求項6に記載の画像処理装置。 - 前記提供手段は、前記受信手段で受信した処理結果と、前記処理結果に含まれる前記識別情報が示す前記記憶手段に記憶される前記第1データファイルとを用いて生成されるデータファイルを、前記提供方法選択手段で選択した提供方法で提供する
ことを特徴とする請求項7に記載の画像処理装置。 - 前記サーバは、前記ネットワークを介して当該画像処理装置から受信する前記所定フォーマットのデータファイルを解析する解析手段と、
前記解析手段の解析結果に基づいて、前記サービス選択手段で選択したサービスによる処理を、前記所定フォーマットのデータファイル中の前記オブジェクト選択手段で選択したオブジェクトに実行する実行手段と
を備えることを特徴とする画像処理装置。 - ネットワークを介して画像処理装置から受信する入力画像に対して、複数種類のサービスを提供可能な情報処理装置であって、
前記入力画像に対応する、当該情報処理装置で利用可能な所定フォーマットのデータファイルを前記ネットワークを介して前記画像処理装置から受信する受信手段と、
前記所定フォーマットのデータファイルを解析する解析手段と、
前記解析手段の解析結果に基づいて、選択されたサービスによる処理を、前記所定フォーマットのデータファイル中の選択されたオブジェクトに実行する実行手段と、
前記実行手段によって得られる処理結果を前記ネットワークを介して前記画像処理装置へ送信する送信手段と
を備えることを特徴とする情報処理装置。 - 複数種類のサービスを提供するサーバと、前記サーバから前記入力画像に対するサービスによる処理結果を受信して出力する画像処理装置とがネットワークを介して接続されて構成される画像処理システムであって、
前記画像処理装置は、
前記サーバが提供するサービス群から、利用するサービスを選択するサービス選択手段と、
前記入力画像を属性毎のオブジェクトに分割する分割手段と、
前記分割手段によって得られる前記入力画像を構成するオブジェクトの内、前記サービス選択手段で選択したサービスの処理対象のオブジェクトを選択するオブジェクト選択手段と、
前記サービス選択手段で選択したサービスによる処理結果の提供方法を選択する提供方法選択手段と、
前記オブジェクト選択手段で選択したオブジェクトを含むデータファイルを、前記サービス選択手段で選択したサービスで利用可能な所定フォーマットのデータファイルに変換する変換手段と、
前記変換手段による変換によって得られる所定フォーマットのデータファイルを前記ネットワークを介して前記サーバへ送信する第1送信手段と、
前記サービス選択手段で選択したサービスによる、前記所定フォーマットのデータファイルの処理結果を前記ネットワークを介して前記サーバから受信する第2受信手段と、
前記提供方法選択手段で選択した提供方法で、前記受信手段で受信した処理結果を含むデータファイルを提供する提供手段とを備え、
前記サーバは、
前記所定フォーマットのデータファイルを前記ネットワークを介して前記画像処理装置から受信する第2受信手段と、
前記所定フォーマットのデータファイルを解析する解析手段と、
前記解析手段の解析結果に基づいて、前記サービス選択手段で選択したサービスによる処理を、前記所定フォーマットのデータファイル中の前記オブジェクト選択手段で選択したオブジェクトに実行する実行手段と
前記実行手段によって得られる処理結果を前記ネットワークを介して前記画像処理装置へ送信する第2送信手段と
を備えることを特徴とする画像処理システム。 - 複数種類のサービスを提供するネットワーク上のサーバに入力画像を出力して、前記サーバから前記入力画像に対するサービスによる処理結果を前記ネットワークを介して受信して出力する画像処理装置の制御方法であって、
前記サーバが提供するサービス群から、利用するサービスを選択するサービス選択工程と、
前記入力画像を属性毎のオブジェクトに分割する分割工程と、
前記分割工程によって得られる前記入力画像を構成するオブジェクトの内、前記サービス選択工程で選択したサービスの処理対象のオブジェクトを選択するオブジェクト選択工程と、
前記サービス選択工程で選択したサービスによる処理結果の提供方法を選択する提供方法選択工程と、
前記オブジェクト選択工程で選択したオブジェクトを含むデータファイルを、前記サービス選択工程で選択したサービスで利用可能な所定フォーマットのデータファイルに変換する変換工程と、
前記変換工程による変換によって得られる所定フォーマットのデータファイルを前記ネットワークを介して前記サーバへ送信する送信工程と、
前記サービス選択工程で選択したサービスによる、前記所定フォーマットのデータファイルの処理結果を前記ネットワークを介して前記サーバから受信する受信工程と、
前記提供方法選択工程で選択した提供方法で、前記受信工程で受信した処理結果を含むデータファイルを提供する提供工程と
を備えることを特徴とする画像処理装置の制御方法。 - ネットワークを介して画像処理装置から受信する入力画像に対して、複数種類のサービスを提供可能な情報処理装置の制御方法であって、
前記入力画像に対応する、当該情報処理装置で利用可能な所定フォーマットのデータファイルを前記ネットワークを介して前記画像処理装置から受信する受信工程と、
前記所定フォーマットのデータファイルを解析する解析工程と、
前記解析工程の解析結果に基づいて、選択されたサービスによる処理を、前記所定フォーマットのデータファイル中の選択されたオブジェクトに実行する実行工程と、
前記実行工程によって得られる処理結果を前記ネットワークを介して前記画像処理装置へ送信する送信工程と
を備えることを特徴とする情報処理装置の制御方法。 - 複数種類のサービスを提供するネットワーク上のサーバに入力画像を出力して、前記サーバから前記入力画像に対するサービスによる処理結果を前記ネットワークを介して受信して出力する画像処理装置の制御を実現するプログラムであって、
前記サーバが提供するサービス群から、利用するサービスを選択するサービス選択工程のプログラムコードと、
前記入力画像を属性毎のオブジェクトに分割する分割工程のプログラムコードと、
前記分割工程によって得られる前記入力画像を構成するオブジェクトの内、前記サービス選択工程で選択したサービスの処理対象のオブジェクトを選択するオブジェクト選択工程のプログラムコードと、
前記サービス選択工程で選択したサービスによる処理結果の提供方法を選択する提供方法選択工程のプログラムコードと、
前記オブジェクト選択工程で選択したオブジェクトを含むデータファイルを、前記サービス選択工程で選択したサービスで利用可能な所定フォーマットのデータファイルに変換する変換工程のプログラムコードと、
前記変換工程による変換によって得られる所定フォーマットのデータファイルを前記ネットワークを介して前記サーバへ送信する送信工程のプログラムコードと、
前記サービス選択工程で選択したサービスによる、前記所定フォーマットのデータファイルの処理結果を前記ネットワークを介して前記サーバから受信する受信工程のプログラムコードと、
前記提供方法選択工程で選択した提供方法で、前記受信工程で受信した処理結果を含むデータファイルを提供する提供工程のプログラムコードと
を備えることを特徴とするプログラム。 - ネットワークを介して画像処理装置から受信する入力画像に対して、複数種類のサービスを提供可能な情報処理装置の制御を実現するプログラムであって、
前記入力画像に対応する、当該情報処理装置で利用可能な所定フォーマットのデータファイルを前記ネットワークを介して前記画像処理装置から受信する受信工程のプログラムコードと、
前記所定フォーマットのデータファイルを解析する解析工程のプログラムコードと、
前記解析工程の解析結果に基づいて、選択されたサービスによる処理を、前記所定フォーマットのデータファイル中の選択されたオブジェクトに実行する実行工程のプログラムコードと、
前記実行工程によって得られる処理結果を前記ネットワークを介して前記画像処理装置へ送信する送信工程のプログラムコードと
を備えることを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005256856A JP2007074140A (ja) | 2005-09-05 | 2005-09-05 | 画像処理装置及びその制御方法、画像処理システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005256856A JP2007074140A (ja) | 2005-09-05 | 2005-09-05 | 画像処理装置及びその制御方法、画像処理システム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007074140A true JP2007074140A (ja) | 2007-03-22 |
Family
ID=37935245
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005256856A Withdrawn JP2007074140A (ja) | 2005-09-05 | 2005-09-05 | 画像処理装置及びその制御方法、画像処理システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007074140A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9690783B2 (en) | 2013-03-29 | 2017-06-27 | Rakuten, Inc. | Image conversion and method for converting text in an image into a targeted language |
JP2019134325A (ja) * | 2018-01-31 | 2019-08-08 | 富士通株式会社 | 記憶制御プログラム、抽出プログラム、記憶制御方法、抽出方法、記憶制御装置および抽出装置 |
-
2005
- 2005-09-05 JP JP2005256856A patent/JP2007074140A/ja not_active Withdrawn
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9690783B2 (en) | 2013-03-29 | 2017-06-27 | Rakuten, Inc. | Image conversion and method for converting text in an image into a targeted language |
JP2019134325A (ja) * | 2018-01-31 | 2019-08-08 | 富士通株式会社 | 記憶制御プログラム、抽出プログラム、記憶制御方法、抽出方法、記憶制御装置および抽出装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7681121B2 (en) | Image processing apparatus, control method therefor, and program | |
JP4546291B2 (ja) | 画像処理装置およびその制御方法 | |
KR100747879B1 (ko) | 화상 처리 장치, 제어 방법 및 기록 매체 | |
JP4251629B2 (ja) | 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体 | |
JP4266784B2 (ja) | 画像処理システム及び画像処理方法 | |
JP3796500B2 (ja) | 画像処理装置及びその制御方法、プログラム | |
JP4510535B2 (ja) | 画像処理装置及びその制御方法、プログラム | |
JP4557765B2 (ja) | 画像処理装置およびその方法 | |
JP4502385B2 (ja) | 画像処理装置およびその制御方法 | |
CN100595781C (zh) | 图像处理设备和图像处理方法 | |
EP1455284A2 (en) | Image processing method and image processing system | |
JP4208780B2 (ja) | 画像処理システム及び画像処理装置の制御方法並びにプログラム | |
JP3862694B2 (ja) | 画像処理装置及びその制御方法、プログラム | |
JP2004326491A (ja) | 画像処理方法 | |
JP4338189B2 (ja) | 画像処理システム及び画像処理方法 | |
CN100501728C (zh) | 图像处理方法、系统、程序、程序存储介质以及信息处理设备 | |
JP2007074140A (ja) | 画像処理装置及びその制御方法、画像処理システム | |
JP4323856B2 (ja) | 画像処理方法 | |
JP4185858B2 (ja) | 画像処理装置及びその制御方法、プログラム | |
JP2005149097A (ja) | 画像処理システム及び画像処理方法 | |
JP2005149210A (ja) | 画像処理装置及びその制御方法、プログラム | |
JP2006146486A (ja) | 画像処理装置 | |
JP2005354415A (ja) | 画像処理装置及びその制御方法、プログラム | |
JP2008084127A (ja) | 画像形成装置 | |
JP2005136729A (ja) | 画像処理装置、画像処理方法、コンピュータプログラム、及びコンピュータ読み取り可能な記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20081202 |