JP4012140B2 - 画像処理装置、情報処理装置及びそれらの制御方法、プログラム - Google Patents

画像処理装置、情報処理装置及びそれらの制御方法、プログラム Download PDF

Info

Publication number
JP4012140B2
JP4012140B2 JP2003390749A JP2003390749A JP4012140B2 JP 4012140 B2 JP4012140 B2 JP 4012140B2 JP 2003390749 A JP2003390749 A JP 2003390749A JP 2003390749 A JP2003390749 A JP 2003390749A JP 4012140 B2 JP4012140 B2 JP 4012140B2
Authority
JP
Japan
Prior art keywords
image
attribute
vectorized
processing apparatus
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003390749A
Other languages
English (en)
Other versions
JP2005157449A (ja
Inventor
進一 加藤
勇志 松久保
博之 矢口
英一 西川
博之 辻
正和 木虎
賢三 関口
廣義 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2003390749A priority Critical patent/JP4012140B2/ja
Priority to EP04257123.2A priority patent/EP1533746A3/en
Priority to CNB2004100952241A priority patent/CN100379239C/zh
Priority to US10/993,450 priority patent/US7433517B2/en
Publication of JP2005157449A publication Critical patent/JP2005157449A/ja
Application granted granted Critical
Publication of JP4012140B2 publication Critical patent/JP4012140B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/40Software arrangements specially adapted for pattern recognition, e.g. user interfaces or toolboxes therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/94Hardware or software architectures specially adapted for image or video understanding
    • G06V10/945User interactive design; Environments; Toolboxes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/248Aligning, centring, orientation detection or correction of the image by interactive preprocessing or interactive shape modelling, e.g. feature points assigned by a user
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/98Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
    • G06V10/987Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns with the intervention of an operator

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Processing Or Creating Images (AREA)
  • Image Processing (AREA)

Description

本発明は、原稿を読み取って得られる原稿画像の画像処理を行う画像処理装置及びその制御方法、プログラム、前記画像処理装置とネットワークを介して接続され、該画像処理装置を制御可能な情報処理装置及びその制御方法、プログラムに関するものである。
近年、環境問題が叫ばれる中、オフィスでのペーパーレス化が急速に進んでいる。このペーパレス化を実現する技術として、従来からバインダー等で蓄積された紙文書をスキャナで読み取り、その読み取った画像を、例えば、ポータブルドキュメントフォーマット(以下、PDFと示す)に変換して、画像記憶装置に蓄積して管理する文書管理システムや遠隔地に送信する画像通信システムなどが提案されている(特許文献1)。
特開2001−358857号公報
しかしながら、上記従来よりの文書管理システムでは、紙文書がコンパクトな情報量のPDFファイルとして文書の保存が可能であるが、ファイル自体がイメージ情報であるので、その紙文書に対応するPDFファイル中に存在する様々な属性のオブジェクト(例えば、図、表等)を再利用することはできない。従って、紙文書に対応するPDFファイル中の所望のオブジェクトを再利用する場合は、その所望のオブジェクトに対応する内容は新たにアプリケーションソフトを用いて再度作成しなければ成らなかった。
本発明は上記の課題を解決するためになされたものであり、用途や目的に応じて適切なデータ構造のデータファイルを生成することで、読み取った原稿画像に基づく処理を効率的に実行することができる画像処理装置、情報処理装置及びそれらの制御方法、プログラムを提供することを目的とする。
上記の目的を達成するための本発明による画像処理装置は以下の構成を備える。即ち、
原稿を読み取って得られる原稿画像の画像処理を行う画像処理装置であって、
原稿を読み取る読取手段と、
前記読取手段で読み取った原稿画像から属性別に分割されるオブジェクト画像単位でベクトルデータを生成するベクトル化処理を行う場合に、ベクトル化処理対象のオブジェクト画像のうちベクトル化処理させるべきオブジェクト画像の属性の種類を、操作者による操作に基づき選択する選択手段と、
前記選択手段で選択された属性の種類に基づいて、前記原稿画像を属性毎のオブジェクト画像に分割する分割手段と、
前記分割手段で分割されたオブジェクト画像の各属性に対応するベクトル化処理を、各オブジェクト画像のうち前記選択手段でベクトル化処理させるべきオブジェクト画像として選択された属性のオブジェクト画像に対して実行するベクトル化処理手段と、
前記選択手段でベクトル化処理させるべきオブジェクト画像として選択された属性のオブジェクト画像は前記ベクトル化処理手段の処理結果として得られるベクトルデータを出力し、前記選択手段でベクトル化処理させるべきオブジェクト画像として選択されていない属性のオブジェクト画像は画像データとして出力する出力手段と
を備える。
また、好ましくは、前記分割手段による処理結果として、分割されたオブジェクト画像とその属性を示す情報を含む前記原稿画像を表示する表示手段を更に備える。
また、好ましくは、前記表示手段で表示された原稿画像中のオブジェクト画像の属性を変更する変更手段を更に備える。
また、好ましくは、前記表示手段で表示された原稿画像中のオブジェクト画像の属性別に、前記ベクトル化処理手段の実行の是非を指定する指定手段を更に備える。
また、好ましくは、前記分割手段は、前記原稿画像に基づいて特定される画像に対して、前記選択手段で選択された属性の種類に基づいて、前記画像を属性毎のオブジェクト画像に分割する。
また、好ましくは、前記属性の種類としては、Text、Graphic、Table、Image、BackGroundの少なくとも1つを含み、
前記ベクトル化処理手段は、
前記Text属性のオブジェクト画像に対して文字認識処理を実行する文字認識手段と、
前記Graphic及びTable属性のオブジェクト画像に対してアウトライン化/関数近似化を実行するベクトル化手段と
を備える。
また、好ましくは、前記属性情報は、前記属性の種類別に互いに異なる表示形態となる情報である。
また、好ましくは、前記ベクトル化処理手段による処理結果として、ベクトル化されたオブジェクト画像を含む前記原稿画像に対応するベクトル化画像を表示する表示手段を更に備える。
上記の目的を達成するための本発明による情報処理装置は以下の構成を備える。即ち、
読取部を有する画像処理装置とネットワークを介して接続され、前記画像処理装置を制御可能な情報処理装置であって、
前記画像処理装置の読取部で読み取られた原稿画像を前記ネットワークを介して受信する受信手段と、
前記受信手段で受信した原稿画像から属性別に分割されるオブジェクト画像単位でベクトルデータを生成するベクトル化処理を行う場合に、ベクトル化処理対象のオブジェクト画像のうちベクトル化処理させるべきオブジェクト画像の属性の種類を、操作者による操作に基づき選択する選択手段と、
前記選択手段で選択された属性の種類に基づいて、前記原稿画像を属性毎のオブジェクト画像に分割する分割手段と、
前記分割手段で分割されたオブジェクト画像の各属性に対応するベクトル化処理を、各オブジェクト画像のうち前記選択手段でベクトル化処理させるべきオブジェクト画像として選択された属性のオブジェクト画像に対して実行するベクトル化処理手段と、
前記選択手段でベクトル化処理させるべきオブジェクト画像として選択された属性のオブジェクト画像は前記ベクトル化処理手段の処理結果として得られるベクトルデータを、前記選択手段でベクトル化処理させるべきオブジェクト画像として選択されていない属性のオブジェクト画像は画像データとしてそれぞれ前記ネットワークを介して前記画像処理装置へ送信する送信手段と
を備える。
上記の目的を達成するための本発明による画像処理装置の制御方法は以下の構成を備える。即ち、
原稿を読み取って得られる原稿画像の画像処理を行う画像処理装置の制御方法であって、
原稿を読み取る読取工程と、
前記読取工程で読み取った原稿画像から属性別に分割されるオブジェクト画像単位でベクトルデータを生成するベクトル化処理を行う場合に、ベクトル化処理対象のオブジェクト画像のうちベクトル化処理させるべきオブジェクト画像の属性の種類を、操作者による操作に基づき選択する選択工程と、
前記選択工程で選択された属性の種類に基づいて、前記原稿画像を属性毎のオブジェクト画像に分割する分割工程と、
前記分割工程で分割されたオブジェクト画像の各属性に対応するベクトル化処理を、各オブジェクト画像のうち前記選択工程でベクトル化処理させるべきオブジェクト画像として選択された属性のオブジェクト画像に対して実行するベクトル化処理工程と、
前記選択工程でベクトル化処理させるべきオブジェクト画像として選択された属性のオブジェクト画像は前記ベクトル化処理工程の処理結果として得られるベクトルデータを出力し、前記選択工程でベクトル化処理させるべきオブジェクト画像として選択されていない属性のオブジェクト画像は画像データとして出力する出力工程と
を備える。
上記の目的を達成するための本発明による情報処理装置の制御方法は以下の構成を備える。即ち、
読取部を有する画像処理装置とネットワークを介して接続され、前記画像処理装置を制御可能な情報処理装置の制御方法であって、
前記画像処理装置の読取部で読み取られた原稿画像を前記ネットワークを介して受信する受信工程と、
前記受信工程で受信した原稿画像から属性別に分割されるオブジェクト画像単位でベクトルデータを生成するベクトル化処理を行う場合に、ベクトル化処理対象のオブジェクト画像のうちベクトル化処理させるべきオブジェクト画像の属性の種類を、操作者による操作に基づき選択する選択工程と、
前記選択工程で選択された属性の種類に基づいて、前記原稿画像を属性毎のオブジェクト画像に分割する分割工程と、
前記分割工程で分割されたオブジェクト画像の各属性に対応するベクトル化処理を、各オブジェクト画像のうち前記選択工程でベクトル化処理させるべきオブジェクト画像として選択された属性のオブジェクト画像に対して実行するベクトル化処理工程と、
前記選択工程でベクトル化処理させるべきオブジェクト画像として選択された属性のオブジェクト画像は前記ベクトル化処理工程の処理結果として得られるベクトルデータを、前記選択工程でベクトル化処理させるべきオブジェクト画像として選択されていない属性のオブジェクト画像は画像データとしてそれぞれ前記ネットワークを介して前記画像処理装置へ送信する送信工程と
を備える。
上記の目的を達成するための本発明によるコンピュータプログラムは以下の構成を備える。即ち、
原稿を読み取って得られる原稿画像の画像処理を行う画像処理装置の制御をコンピュータに実行させるためのコンピュータプログラムであって、
原稿を読み取る読取工程と、
前記読取工程で読み取った原稿画像から属性別に分割されるオブジェクト画像単位でベクトルデータを生成するベクトル化処理を行う場合に、ベクトル化処理対象のオブジェクト画像のうちベクトル化処理させるべきオブジェクト画像の属性の種類を、操作者による操作に基づき選択する選択工程と、
前記選択工程で選択された属性の種類に基づいて、前記原稿画像を属性毎のオブジェクト画像に分割する分割工程と、
前記分割工程で分割されたオブジェクト画像の各属性に対応するベクトル化処理を、各オブジェクト画像のうち前記選択工程でベクトル化処理させるべきオブジェクト画像として選択された属性のオブジェクト画像に対して実行するベクトル化処理工程と、
前記選択工程でベクトル化処理させるべきオブジェクト画像として選択された属性のオブジェクト画像は前記ベクトル化処理工程の処理結果として得られるベクトルデータを出力し、前記選択工程でベクトル化処理させるべきオブジェクト画像として選択されていない属性のオブジェクト画像は画像データとして出力する出力工程と
をコンピュータに実行させる。
上記の目的を達成するための本発明によるコンピュータプログラムは以下の構成を備える。即ち、
読取部を有する画像処理装置とネットワークを介して接続され、前記画像処理装置を制御可能な情報処理装置の制御をコンピュータに実行させるためのコンピュータプログラムであって、
前記画像処理装置の読取部で読み取られた原稿画像を前記ネットワークを介して受信する受信工程と、
前記受信工程で受信した原稿画像から属性別に分割されるオブジェクト画像単位でベクトルデータを生成するベクトル化処理を行う場合に、ベクトル化処理対象のオブジェクト画像のうちベクトル化処理させるべきオブジェクト画像の属性の種類を、操作者による操作に基づき選択する選択工程と、
前記選択工程で選択された属性の種類に基づいて、前記原稿画像を属性毎のオブジェクト画像に分割する分割工程と、
前記分割工程で分割されたオブジェクト画像の各属性に対応するベクトル化処理を、各オブジェクト画像のうち前記選択工程でベクトル化処理させるべきオブジェクト画像として選択された属性のオブジェクト画像に対して実行するベクトル化処理工程と、
前記選択工程でベクトル化処理させるべきオブジェクト画像として選択された属性のオブジェクト画像は前記ベクトル化処理工程の処理結果として得られるベクトルデータを、前記選択工程でベクトル化処理させるべきオブジェクト画像として選択されていない属性のオブジェクト画像は画像データとしてそれぞれ前記ネットワークを介して前記画像処理装置へ送信する送信工程と
をコンピュータに実行させる。
本発明によれば、用途や目的に応じて適切なデータ構造のデータファイルを生成することで、読み取った原稿画像に基づく処理を効率的に実行することができる画像処理装置、情報処理装置及びそれらの制御方法、プログラムを提供できる。
以下、本発明の実施の形態について図面を用いて詳細に説明する。
<実施形態1>
図1は本発明の実施形態1の画像処理システムの構成を示すブロック図である。
図1において、オフィスA内に構築されたLAN102には、複数種類の機能(複写機能、印刷機能、送信(ファイル送信、ファックス送信)機能等)を実現する複合機であるMFP(Multi Function Peripheral)100、MFP100からの送信データを受信したり、MFP100が実現する機能を利用するクライアントPC101及びプロキシサーバ103が接続されている。LAN102は、プロキシサーバ103を介してネットワーク104に接続されている。
このクライアントPC101では、例えば、印刷データをMFP100へ送信することで、その印刷データに基づく印刷物をMFP100で印刷することが可能である。
尚、図1の構成は一例であり、オフィスAと同様の構成要素を有する、複数のオフィスがネットワーク104上に接続されていても良い。
また、ネットワーク104は、典型的にはインターネットやLANやWANや電話回線、専用デジタル回線、ATMやフレームリレー回線、通信衛星回線、ケーブルテレビ回線、データ放送用無線回線等のいずれか、またはこれらの組み合わせにより実現されるいわゆる通信ネットワークであり、データの送受信が可能であれば良い。
また、クライアントPC109、プロキシサーバ103の各種端末はそれぞれ、汎用コンピュータに搭載される標準的な構成要素(例えば、CPU、RAM、ROM、ハードディスク、外部記憶装置、ネットワークインタフェース、ディスプレイ、キーボード、マウス等)を有している。
次に、MFP100の詳細構成について、図2を用いて説明する。
図2は本発明の実施形態1のMFPの詳細構成を示す図である。
図2において、オートドキュメントフィーダ(ADF)を含む画像読取部110は、束状のあるいは1枚の原稿画像を光源(不図示)で照射し、原稿反射像をレンズで固体撮像素子上に結像し、固体撮像素子からラスタ状の画像読取信号を所定密度(例えば、600DPI)のイメージ情報(ラスタ画像)として得る。
また、MFP100は、画像読取信号に対応する画像を印刷部112で記録媒体に印刷する複写機能を有し、原稿画像を1つ複写する場合には、この画像読取信号をデータ処理部115で画像処理して記録信号を生成し、これを印刷部112によって記録媒体上に印刷させる。一方、原稿画像を複数複写する場合には、記憶部111に一旦一ページ分の記録信号を記憶保持させた後、これを印刷部112に順次出力して記録媒体上に印刷させる。
また、ネットワークI/F114を介する送信機能においては、画像読取部110から得られる画像信号を、TIFFやJPEG等の圧縮画像ファイル形式、あるいはPDF等のベクトルデータファイル形式の画像ファイルへと変換し、ネットワークIF114から出力する。出力された画像ファイルは、LAN102を介してクライアント101へ送信されたり、更にネットワーク104経由でネットワーク上の外部端末(例えば、別のMFPやクライアントPC)に転送されたりする。
また、印刷部112による印刷機能においては、例えば、クライアントPC101から出力された印刷データをネットワークIF114経由でデータ処理部115が受信し、データ処理部115は、その印刷データを印刷部112で印刷可能なラスタデータに変換した後、印刷部112によって印刷媒体上に画像を形成する。
MFP100への操作者の指示は、MFP100に装備されたキー操作部やタッチパネルからなる操作部113及び表示部116から行われ、これら一連の動作はデータ処理部115内の制御部(不図示)で制御される。また、操作入力の状態表示及び処理中の画像データの表示は、表示部116で行われる。
記憶部111は、例えば、大容量のハードディスクで実現される。また、記憶部111は、画像読取部110で読み取った画像データや、クライアント101から送信された画像データを記憶管理するデータベースを構成している。
特に、本発明では、画像データのイメージデータと、そのイメージデータをベクトル化することによって得られるベクトルデータファイルを対応づけて管理することができ、用途や目的によっては、イメージデータ及びベクトルデータファイルの少なくとも一方を管理する構成としても良い。
[処理概要]
次に、実施形態1の画像処理システムで実行する処理全体の概要を、図3を用いて説明する。
図3は本発明の実施形態1の画像処理システムが実行する処理全体の概要を示すフローチャートである。
まず、ステップS121で、MFP100の画像読取部110に原稿をセットし、操作部113に備わるベクトルスキャン選択キーによる操作に基づいて、ベクトルスキャンを選択する。
尚、ベクトルスキャンとは、読取原稿画像の入力画像データ(ラスタ画像データ)に対して、文字領域はTextコードに変換したり、細線や図形領域は関数化してコード化するベクトル化処理を施す一連の処理を意味する。つまり、原稿をスキャンして、それによって得られる入力画像データをベクトルデータに変換するまでの処理を、ベクトルスキャンと定義している。また、ベクトルスキャンで実行するベクトル化処理の詳細については、図5以降で説明する。
続けて、ステップS122で、操作部113を介する操作に基づいて、ベクトルモード選択キーから所望のベクトルモードを選択する。
尚、操作部113によるベクトルスキャンに係る操作に関しては、後述する図4A〜図4Cを用いて詳細に説明する。
その後、ベクトルスキャンを動作させるためのスタートキーが操作されると、ステップS123で、画像読取部110にセットされた原稿画像を読み取り、指定されたベクトルモードのベクトルスキャンを実行する。
ベクトルスキャンでは、まず、1枚の原稿をラスタ状に走査して読み取り、例えば、600DPI−8ビットの画像信号を得る。そして、ステップS124で、この画像信号を、データ処理部115で前処理を施し、記憶部111に1ページ分の画像データとして保存する。
データ処理部115のCPUは、記憶部111に保存された画像データに対して、ステップS125及びステップS126でベクトル化処理のための前処理を実行し、また、ステップS127でベクトル化処理を行う。
まず、ステップS125で、データ処理部115において、ブロックセレクション(BS)処理を行う。
具体的には、記憶部111に格納された処理対象の画像信号を、まず、文字/線画部分とハーフトーン画像部分とに領域分割し、文字/線画部分は更に段落で塊として纏まっているブロック毎に、あるいは線で構成された表、図形毎に分割する。
一方、ハーフトーン画像部分は、矩形に分離されたブロックの画像部分、背景部分等の、所謂ブロック毎に独立したオブジェクト(ブロック)に分割する。
この際、ステップS122で選択したベクトルモードに応じて、分割するオブジェクトの属性種類を決定する。
例えば、ベクトルモードとして、Text/Graphic/Table/Imageモードを指定した場合には、Text(文字)、Graphic(細線、図形)、Table(表)、Image(画像)、BackGround(背景)の属性毎のオブジェクト(ブロック)に画像信号を分割する。また、ベクトルモードとして、Textモードを指定した場合には、Text(文字)及びBackGround(背景)の属性毎のオブジェクト(ブロック)に画像信号を分割する。
ここで、BackGround(背景)に関しては、例えば、Textモードの場合には、Text(文字)オブジェクト以外の領域がBackGround(背景)になるので、ベクトルモード選択の表記に入れていない。もちろん、TextモードをText/BackGroundモードという表記にしても良い。
以下、ベクトルモードの具体例について説明する。
1)Text/Graphic/Table/Imageモード
→Text(文字)、Graphic(細線、図形)、Table(表)、Image(画像)、BackGround(背景)の属性毎のオブジェクト(ブロック)に画像を分割。
2)Text/Graphic/Imageモード
→Text(文字)、Graphic(細線、図形、表)、Image(画像)、BackGround(背景)の属性毎のオブジェクト(ブロック)に画像を分割。
3)Text/Imageモード
→Text(文字)、Image(細線、図形、表、画像)、BackGround(背景)の属性毎のオブジェクト(ブロック)に画像を分割。
4)Textモード
→Text(文字)、BackGround(細線、図形、表、画像、背景)の属性毎のオブジェクト(ブロック)に画像を分割。
5)Imageモード
→Image(文字、細線、図形、表、画像)、BackGround(背景)の属性毎のオブジェクト(ブロック)に画像を分割。
このように、ベクトルモードは、ブロックセレクション処理で分割するオブジェクトの属性の種類を規定するとともに、ベクトル化処理においてベクトル化処理を適用するオブジェクトの属性の種類を規定するものである。
尚、実施形態1では、属性の例として、Text(文字)、Graphic(細線、図形)、Table(表)、Image(画像)、BackGround(背景)を挙げたが、属性の種類はこれに限定されるものではなく、用途や目的に応じて、他の種類の属性を使用することも可能であるし、また、すべての属性を使用する必要もない。
また、ベクトルモードの具体例として、Text/Graphic/Table/Imageモード、Text/Graphic/Imageモード、Text/Imageモード、Textモード、Imageモードの5種類を挙げたが、モードの種類はこれに限定されるものではなく、用途や目的に応じて、他の種類のベクトルモードを使用することも可能であるし、またすべてのベクトルモードを使用する必要もない。
属性毎に分割された各オブジェクト(ブロック)は、その後、入力されたイメージ情報全体に対してベクトル化処理を行ない、イメージデータをベクトルデータファイルに変換する。
次に、ステップS126で、ステップS126のブロックセレクション処理で得られた文字ブロックに対してOCR処理を行う。
そして、OCR処理が施された文字ブロックに対しては、更に、ステップS127で、文字のサイズ、スタイル、字体(フォント)を認識し、原稿を走査して得られた文字に可視的に忠実なフォントデータに変換する。一方、線で構成される表、図形ブロックに対しては、アウトライン化/関数近似化する。また、画像ブロックに対しては、イメージデータとして個別のJPEGファイルに変換する。
例えば、ステップS122において、Text/Graphic/Table/Imageモードが指定された場合には、ステップS127では、Text(文字)オブジェクトはフォントデータに変換される。Graphic(細線、図形)オブジェクトは、アウトライン化/関数近似化された関数としてベクトル化変換される。Table(表)オブジェクトは、表内の数値情報はフォントデータに変換し、表部はアウトライン化/関数近似化された関数としてベクトル変換され、各数値情報はセル情報として関連付けられ表オブジェクトとしてコード化される。
更に、Image(画像)オブジェクトは、画像読取部110の読取解像度600DPIのまま低圧縮(例えば、低圧縮JPEG圧縮)を実行して保存される。また、BackGround(背景)オブジェクトは、読取解像度600DPIから低解像度(例えば、解像度300DPI)へ解像度変換を施した後に高圧縮(例えば、高圧縮JPEG圧縮)を実行して保存される。
尚、低圧縮及び高圧縮の定義は、例えば、所定圧縮率(例えば、50%)より高い圧縮率での圧縮を高圧縮、所定圧縮率より低い圧縮率での圧縮を低圧縮とする。
また、ステップS122においてTextモードを指定した場合には、ステップS127では、Text(文字)オブジェクトはフォントデータに変換され、その他のGraphic(細線、図形)オブジェクト、Table(表)オブジェクト及びImage(画像)オブジェクトは、BackGround(背景)オブジェクトと同じ扱いになり、解像度300DPIに解像度変換を施した後に高圧縮でJPEG保存される。
このように、指定するベクトルモードで、ベクトル化処理の処理対象となる属性を変更(制御)することで、生成されるベクトルデータファイルの容量、画質等を、用途や目的に応じて任意に変更することが可能になる。
ステップS127のベクトル化処理の終了後、ステップS128で、各オブジェクト(ブロック)のレイアウト情報を保存して、ベクトルデータファイルとして記憶部111に保存する。
記憶部111に保存されたベクトルデータファイルは、その後、ステップS129で、ベクトルスキャンの目的毎に、後処理を実行する。
後処理としては、例えば、複写の場合には、各オブジェクトに最適な色処理、空間周波数補正等の画像処理が施された後、印刷部112より印刷される。また、ファイル保存の場合には、記憶部111に記憶保持される。また、ファイル送信の場合には、汎用のファイル形式として、例えば、RTF(Rich Text Format)形式に変換したり、SVG形式に変換したりして、ファイル送信先で再利用可能なファイル形式にして変換して、ネットワークI/F114を介してファイル送信先(例えば、クライアントPC101)へファイル送信する。
以上の処理によって得られたベクトルデータファイルは、読取原稿画像に可視的に非常に近い状態のベクトル情報が編集可能な形式で全て含まれており、それらを直接加工、再利用したり、あるいは蓄積、伝送、再印刷を行うことが可能になる。
これらの処理で生成されたベクトルデータファイルは、文字や細線等を記述コードで表現するため、単純にイメージデータ(ラスタビットマップデータ)を直接扱う場合と比較して情報量が削減され、蓄積効率が高まり、伝送時間が短縮され、また記録/表示する際には高品位なデータとして非常に優位となる。
そして、これらベクトル化処理を行う属性の種類を、ベクトルモードとして変更可能な構成とすることで、以下のような優位性を得ることができる。
例えば、画像中のText部分のみをベクトル化して再利用したい場合に、ベクトルモードとしてText/Graphic/Table/Imageモードを指定して画像をベクトル化してしまうと、ベクトル化後にText部分以外の部分もベクトル化されてしまい、Text部分を抜き出して使用する際に作業が煩雑になってしまう。そこで、このような場合には、ベクトルモードとしてTextモードを指定することで、Text部分のみがベクトル化されたベクトルデータファイルを自動的に生成することができるので、Text部分のみを抜き出すのが容易になり、後処理が容易になる。
また、ベクトル化処理を適用することで、元のラスタ画像と大きく形状が異なってしまう場合など、例えば、ベクトルモードがない場合のベクトル化処理では、通常、画像中で種別できる全ての属性のオブジェクトに分割するベクトル化処理が実行される(実施形態1では、Text/Graphic/Table/Imageモードに相当)。そのため、このようなベクトル化処理によって、Graphic、Tableオブジェクトの形状がベクトル化処理によって変わってしまう場合には、ベクトル化処理された後、Graphic、Tableオブジェクトの形状を手作業で修正する必要がある。
これに対し、実施形態1では、ベクトルモードとしてText/Imageモードを用意しているので、このText/Imageモードを指定した場合には、Graphic、Tableオブジェクトは、Imageオブジェクト扱いになり、ベクトル化処理を実行しないで、そのラスタ画像をそのままJPEGデータとして保存することができる。つまり、上述のように、ベクトルデータとラスタデータの形状の違いが気になる場合には、このText/Imageモードのベクトルモードを指定するだけで、元のラスタ画像と形状が異なってしまうことを防ぐことができ、利便性が向上すると同時にラスタデータとのマッチングという観点で画質が向上する。
また、ベクトルモードを可変することによって、ステップS129の後処理毎に最適なオブジェクトに対するベクトル属性を適用することが可能になる。
例えば、コピー時には、文字のみベクトル化し文字品位を向上させ、他のオブジェクトは原稿に対する忠実度合いを重視してベクトル化を行わないようにすることができるText/Imageモードを指定して、コピーを実行することができる。また、ファイル送信時には、送信先のクライアントPC101などで、ベクトル化された各オブジェクトの再利用性を考慮して、Text/Graphic/Table/Imageモードを指定して、フィル送信を実行することができる。このように、後処理毎の用途や目的に応じて、最適なベクトルモードを選択することが可能になる。
[操作部113と表示部116の説明]
図4A〜図4Cは本発明の実施形態1の操作画面の一例を示す図である。
特に、この操作画面は、操作部113と表示部116によって構成される操作画面の一例である。
操作画面10000は、操作部113と表示部116が一体になっている操作画面構成であり、この例では、操作部113と表示部116は、LCDとタッチパネルから構成されるものとするが、もちろん操作部113としてのハードキーもしくはマウスポインタ、表示部116としてのCRT等で独立に構成されていても構わない。
図4Aの操作画面10000は、実施形態1のMFP100の基本操作画面である。実施形態1におけるベクトルスキャン機能の選択は、操作画面10000の例では、応用モードキー100000内に入っているものとする。
応用モードキー100000を押下すると、操作画面10000は、応用モードとしてMFP100で用意されている各種モードからなる、図4Bの応用モード画面10001に切り替わる。
図4Bの応用モード画面10001において、Vectorizeキー100010が、上述のベクトルスキャン機能を動作可能にする選択キーである(図3のステップS121)。このVectorizeキー100010を押下すると、図4Cの操作画面10002が表示される。
操作画面10002において、読込開始キー100020は、原稿読取のスキャン開始を指示するためのキーであり、このキーを押下すると原稿を読み取る。また、ベクトルモード選択キー100021は、上述のベクトルモードを選択するキーである。ベクトルモードを選択(図3のステップS122)した後、読込開始キー100020を押してスキャン動作を開始する。
ベクトルモード選択キー100021は、例えば、押下する毎にその内容(ベクトルモード)が切り替わるキーであり、ここでは、上述の例のように、Text/Graphic/Table/Imageモード、Text/Graphic/Imageモード、Text/Imageモード、Textモード、Imageモードの予め用意されている5種類のいずれかを選択できる構成としているが、モードの選択方法はこれに限定されるものではない。
例えば、Text、Graphic、Table、Imageの4つの属性を任意にチェックすることができるチェックボックスを用意して、操作者が任意の属性の組み合わせをチェックボックスによって選択できる構成としても良い。この場合、例えば、TextとImageをチェックした場合は、Text/Imageモードと同様なモードが実行される。あるいは、各種ベクトルモードからなるプルダウンメニューを構成して、その中から所望のベクトルモードを選択する構成としても良い。
次に、図3のステップS125のブロックセレクション処理の詳細について説明する。
ブロックセレクション処理とは、例えば、図5(a)のラスタ画像を、図5(b)のように、意味のあるブロック毎の塊として認識し、該ブロック各々の属性(Text/Graphic/Image/Table等)を判定し、異なる属性を持つブロックに分割する処理である。
ブロックセレクション処理の実施形態を以下に説明する。
まず、入力画像を白黒に二値化し、輪郭線追跡を行って黒画素輪郭で囲まれる画素の塊を抽出する。面積の大きい黒画素の塊については、内部にある白画素に対しても輪郭線追跡を行って白画素の塊を抽出、さらに一定面積以上の白画素の塊の内部からは再帰的に黒画素の塊を抽出する。
このようにして得られた黒画素の塊を、大きさ及び形状で分類し、異なる属性を持つブロックへ分類していく。例えば、縦横比が1に近く、大きさが一定の範囲のブロックは文字相当の画素塊とし、さらに近接する文字が整列良くグループ化可能な部分を文字ブロック、扁平な画素塊を線ブロック、一定大きさ以上でかつ矩形の白画素塊を整列よく内包する黒画素塊の占める範囲を表ブロック、不定形の画素塊が散在している領域を写真ブロック、それ以外の任意形状の画素塊を図画ブロックとする。
そして、ブロックセレクション処理では、各ブロックを特定するブロックIDを発行し、各ブロックの属性(画像、文字等)、サイズやオリジナル文書内の位置(座標)と各ブロックを関連付けて記憶部111にブロック情報として記憶する。また、これらのブロック情報は、以降に詳細を説明するステップS127のベクトル化処理で利用される。
ここで、ブロック情報の一例について、図6を用いて説明する。
図6は本発明の実施形態1のブロック情報の一例を示す図である。
図6に示すように、ブロック情報は、各ブロックの属性を示すブロック属性(1:TEXT、2:GRAPHIC、3:TABLE、4:IMAGE)、ブロックの位置座標(X,Y)、ブロックの幅W及び高さH、ブロックのOCR情報(テキストデータ)の有無で構成されている。
ここで、ブロックの位置座標(X,Y)とは、例えば、原稿画像の左上角を原点(0,0)とした場合の位置座標である。また、幅W及び高さHは、例えば、画素数で表現される。また、このブロック情報に加えて、ブロックセレクション処理では、原稿画像(入力ファイル)に存在するブロック数Nを示す入力ファイル情報を生成する。図6の例の場合、入力ファイル情報はN=6となる。
次に、図3のステップS126のOCR処理の詳細について説明する。
ここでは公知のOCR処理技術を使用して、文字認識処理を行う。
『文字認識処理』
文字認識処理では、文字ブロックから文字単位で切り出された文字画像に対し、パターンマッチの一手法を用いて文字認識を行い、対応する文字コードを取得する。特に、この文字認識処理は、文字画像から得られる特徴を数十次元の数値列に変換した観測特徴ベクトルと、あらかじめ字種毎に求められている辞書特徴ベクトルとを比較し、最も距離の近い字種を認識結果とするものである。
特徴ベクトルの抽出には種々の公知手法があり、例えば、文字をメッシュ状に分割し、各メッシュブロック内の文字線を方向別に線素としてカウントしたメッシュ数次元ベクトルを特徴とする方法がある。
そして、文字ブロックに対して文字認識処理を行う場合は、まず、該当文字ブロックに対し、横書き/縦書きの判定を行い、各々対応する方向に文字列を切り出し、その後、文字列から文字を切り出して文字画像を取得する。
横書き/縦書きの判定は、該当文字ブロック内で画素値に対する水平/垂直の射影を取り、水平射影の分散が大きい場合は横書き、垂直射影の分散が大きい場合は縦書きと判定する。文字列及び文字への分解は、横書きの文字ブロックである場合には、その水平方向の射影を利用して行を切り出し、さらに切り出された行に対する垂直方向の射影から、文字を切り出すことで行う。一方、縦書きの文字ブロックに対しては、水平と垂直を逆にすれば良い。
尚、この文字認識処理によって、文字のサイズを検出することができる。
次に、図3のステップS127のベクトル化処理の詳細について説明する。
まず、ステップS126のOCR処理によって得られた文字ブロックの各文字に対してフォント認識処理を行う。
『フォント認識処理』
文字認識処理の際に用いる、字種数分の辞書特徴ベクトルを、文字形状種、即ち、フォント種に対して複数用意し、マッチングの際に文字コードとともにフォント種を出力することで、文字のフォントを認識することができる。
『文字のベクトル化処理』
以上の文字認識処理及びフォント認識処理によって得られた、文字コード及びフォント情報を用いて、各々あらかじめ用意されたアウトラインデータを用いて、文字部分の情報をベクトルデータに変換する。尚、原稿画像がカラー画像の場合は、そのカラー画像から各文字の色を抽出してベクトルデータとともに記録する。
以上の処理により、文字ブロックに属するイメージ情報を、ほぼ形状、大きさ、色が忠実なベクトルデータに変換できる。
『文字以外の部分のベクトル化処理』
次に、文字ブロック以外の図画あるいは線、表ブロックについては、そのブロック中で抽出された画素塊の輪郭をベクトルデータに変換する。
具体的には、輪郭をなす画素の点列を角と看倣される点で区切って、各区間を部分的な直線あるいは曲線で近似する。角とは曲率が極大となる点であり、曲率が極大となる点は、図7に示すように、任意点Piに対し左右k個の離れた点Pi−k、Pi+kの間に弦を引いたとき、この弦とPIの距離が極大となる点として求められる。
また、Pi−k、Pi+k間の弦の長さ/弧の長さをRとし、Rの値が閾値以下である点を角とみなすことができる。角によって分割された後の各区間は、直線は点列に対する最小二乗法等の計算式を用いて、また、曲線は3次スプライン関数等の関数を用いてベクトル化することができる。
また、対象が内輪郭を持つ場合、ブロックセレクション処理で抽出した白画素輪郭の点列を用いて、同様に部分的直線あるいは曲線で近似する。
以上のように、輪郭の区分線近似を用いれば、任意形状の図形のアウトラインをベクトル化することができる。尚、原稿画像がカラー画像の場合は、そのカラー画像から図形の色を抽出してベクトルデータとともに記録する。
また、図8に示すように、ある区間で外輪郭と、内輪郭あるいは別の外輪郭が近接している場合、2つの輪郭線をひとまとめにし、太さを持った線として表現することができる。
具体的には、ある輪郭の各点Piから別輪郭上で最短距離となる点Qiまで線を引き、各距離PQiが平均的に一定長以下の場合、注目区間はPQi中点を点列として直線あるいは曲線で近似し、その太さはPQiの平均値とする。線や線の集合体である表罫線は、このような太さを持つ線の集合として効率よくベクトル表現することができる。
尚、先に文字ブロックに対する文字認識処理を用いたベクトル化を説明したが、該文字認識処理の結果、辞書からの距離が最も近い文字を認識結果として用いるが、この距離が所定値以上の場合は、必ずしも本来の文字に一致せず、形状が類似する文字に誤認識している場合が多い。
従って、実施形態1では、このような文字ブロックに対しては、一般的な線画と同じに扱い、その文字ブロックをアウトライン化する。即ち、従来の文字認識処理で誤認識を起こす文字に対しても誤った文字にベクトル化されず、可視的にイメージデータに忠実なアウトライン化によるベクトル化が行える。
また、画像ブロックに対しては、そのままイメージデータとして、ベクトル化は実行しない。
次に、ベクトル化処理によって得られたベクトルデータを図形ブロック毎にグループ化するグループ化処理について、図9を用いて説明する。
図9は本発明の実施形態1のベクトルデータのグループ化処理を示すフローチャートである。
特に、図9では、ベクトルデータを図形ブロック毎にグループ化する処理について説明する。
まず、ステップS700で、各ベクトルデータの始点、終点を算出する。次に、ステップS701で、各ベクトルデータの始点、終点情報を用いて、図形要素を検出する。
ここで、図形要素の検出とは、区分線が構成している閉図形を検出することである。検出に際しては、閉形状を構成する各ベクトルはその両端にそれぞれ連結するベクトルを有しているという原理を応用し、検出を行う。
次に、ステップS702で、図形要素内に存在する他の図形要素、もしくは区分線をグループ化し、一つの図形オブジェクトとする。また、図形要素内に他の図形要素、区分線が存在しない場合は図形要素を図形オブジェクトとする。
次に、図9のステップS701の処理の詳細について、図10を用いて説明する。
図10は本発明の実施形態1のステップS701の処理の詳細を示すフローチャートである。
まず、ステップS710で、ベクトルデータより両端に連結していない不要なベクトルを除去し、閉図形構成ベクトルを抽出する。
次に、ステップS711で、閉図形構成ベクトルの中から該ベクトルの始点を開始点とし、時計回りに順にベクトルを追跡する。そして、この追跡を、開始点に戻るまで行い、通過したベクトルを全て一つの図形要素を構成する閉図形としてグループ化する。また、閉図形内部にある閉図形構成ベクトルも全てグループ化する。さらにまだグループ化されていないベクトルの始点を開始点とし、同様の処理を繰り返す。
最後に、ステップS712で、ステップS710で除去された不要ベクトルの内、ステップS711で閉図形としてグループ化されたベクトルに接合しているもの(閉図形連結ベクトル)を検出し、一つの図形要素としてグループ化する。
以上の処理によって、図形ブロックを個別に再利用可能な個別の図形オブジェクトとして扱うことが可能になる。
次に、上述の図3のステップS125のブロックセレクション処理、ステップS126のOCR処理、ステップS127のベクトル化処理によって得られるデータは、図11に示す中間データ形式のファイルとして変換されている。ここで、このようなデータ形式は、ドキュメント・アナリシス・アウトプット・フォーマット(DAOF)と呼ばれる。
ここで、DAOFのデータ構造について、図11を用いて説明する。
図11は本発明の実施形態1のDAOFのデータ構造を示す図である。
図11において、Header791では、処理対象の原稿画像に関する情報が保持される。レイアウト記述データ部792では、原稿画像中のText(文字)、Title(タイトル)、Caption(キャプション)、Lineart(線画)、Picture(自然画)、Frame(枠)、Table(表)等の属性毎に認識された各ブロックの属性情報とその矩形アドレス情報を保持する。
文字認識記述データ部793では、Text、Title、Caption等のTextブロックを文字認識して得られる文字認識結果を保持する。
表記述データ部794では、Tableブロックの構造の詳細を格納する。画像記述データ部795は、GraphicやImage等のブロックのイメージデータを画像データから切り出して保持する。
このようなDAOFは、中間データとしてのみならず、それ自体がファイル化されて保存される場合もあるが、このファイルの状態では、所謂一般の文書作成アプリケーションで個々のオブジェクト(ブロック)を再利用することはできない。
そこで、実施形態1では、このDAOFから文書作成アプリケーションで利用可能なアプリデータに変換するアプリデータ変換処理を、図3のステップS128のベクトル化処理後に、あるいは図3のステップS129の後処理の一部として実行する。
以下、このアプリデータ変換処理の詳細について、図12を用いて説明する。
図12は本発明の実施形態1のアプリデータ変換処理を示すフローチャートである。
まず、ステップS8000で、DAOFデータの入力を行う。次に、ステップS8002で、アプリデータの元となる文書構造ツリーを生成する。そして、ステップS8004で、文書構造ツリーを元に、DAOF内の実データを流し込み、実際のアプリデータを生成する。
次に、図12のステップS8002の処理の詳細について、図13を用いて説明する。
図13は本発明の実施形態1のステップS8002の処理の詳細を示すフローチャートである。また、図14は本発明の実施形態1の文書構造ツリーの説明図である。
尚、図13の処理において、全体制御の基本ルールとして、処理の流れは、ミクロブロック(単一ブロック)からマクロブロック(ブロックの集合体)へ移行する。
以後、ブロックとは、ミクロブロック及びマクロブロック全体を指す。
まず、ステップS8100で、ブロック単位で縦方向の関連性を元に再グループ化する。スタート直後は、ミクロブロック単位での判定となる。
ここで、関連性とは、距離が近い、ブロック幅(横方向の場合は高さ)がほぼ同一であることなどで定義することができる。また、距離、幅、高さなどの情報はDAOFを参照し、抽出する。
例えば、図14(a)は実際の原稿画像のページ構成、図14(b)はその文書構造ツリーである。ステップS8100の処理によって、ブロックT3、T4、T5が一つのグループV1、ブロックT6、T7が一つのグループV2が同階層グループとして、まず生成される。
ステップS8102で、縦方向のセパレータの有無をチェックする。セパレータとは、例えば、物理的にはDAOF中で線の属性を持つブロックである。また、論理的な意味としては、文書作成アプリケーション中で明示的にブロックを分割する要素である。ここでセパレータを検出した場合は、同じ階層で再分割する。
ステップS8104で、分割がこれ以上存在し得ないか否かを縦方向のグループ長を利用して判定する。具体的には、縦方向のグループ長が原稿画像のページ高さであるか否かを判定する。縦方向のグループ長がページ高さである場合(ステップS8104でYES)、処理を終了する。一方、縦方向のグループ長がページ高さでない場合(ステップS8104でNO)、ステップS8106に進む。
図14(a)の原稿画像の場合は、セパレータもなく、グループ長はページ高さではないので、ステップS8106に進む。
ステップS8106で、ブロック単位で横方向の関連性を元に再グループ化する。ここもスタート直後の第一回目はミクロブロック単位で判定を行うことになる。また、関連性、及びその判定情報の定義は、縦方向の場合と同じである。
図14(a)の原稿画像の場合は、ブロックT1、T2でグループH1、グループV1、V2でグループH2、グループV1、V2の階層の1つ上の同階層グループとして生成される。
ステップS8108で、横方向セパレータの有無をチェックする。図14(a)では、S1が横方向セパレータとなっているので、これを文書構造ツリーに登録し、H1、S1、H2という階層が生成される。
ステップS8110で、分割がこれ以上存在し得ないか否かを横方向のグループ長を利用して判定する。具体的には、横方向のグループ長がページ幅であるか否かを判定する。横方向のグループ長がページ幅である場合(ステップS8110でYES)、処理を終了する。一方、横方向のグループ長がページ幅でない場合(ステップS8110でNO)、ステップS8102に戻り、再びもう一段上の階層で、ステップS8100以降の処理を実行する。
図14の場合は、横方向のグループ長がページ幅となるので、ステップS8110で処理を終了し、最後に、ページ全体を表す最上位階層のV0が文書構造ツリーに付加される。
文書構造ツリーが完成した後、その文書構造ツリーに基づいて、図14のステップS8004で、アプリデータの生成を行う。
図14の場合は、具体的には、以下のようにして、アプリデータを生成する。
即ち、H1は横方向に2つのブロックT1とT2があるので、2カラムとして出力し、ブロックT1の内部情報(DAOFを参照、文字認識結果の文章、画像など)を出力し、その後、カラムを変え、ブロックT2の内部情報を出力、その後、S1を出力する。
次に、H2は横方向に2つのブロックV1とV2があるので、2カラムとして出力し、ブロックV1はT3、T4、T5の順にその内部情報を出力し、その後、カラムを変え、ブロックV2のT6、T7の内部情報を出力する。
以上のようにして、DAOFからアプリデータへの変換処理を実行する。
以上説明したように、実施形態1によれば、読み取った原稿画像をベクトル化する場合には、その用途や目的に応じて、ベクトル化処理で行う処理内容を適宜変更して実行することができる。これにより、原稿画像に基づく各種処理(印刷、送信、保存等)を実行する場合には、その処理内容により適切な構成からなるベクトルデータファイルを使用した処理を実現することが可能となる。
<実施形態2>
実施形態1では、図1のMFP100内に、入力されたラスタ画像データをベクトルデータファイルに変換するベクトル化処理機能を搭載して、MFP100上の操作部113及び表示部116を介して、ベクトル化処理機能を実行するためのベクトルモードを選択して、その選択されたベクトルモードで規定される属性毎にベクトル化されたベクトルデータファイルを生成する構成について説明した。
これに対し、実施形態2では、図15に示すように、MFP100を制御することが可能なマネージメントPC105を構成し、このマネージメントPC105上の操作部でベクトルモードの選択操作を行い、かつMFP100で入力されたラスタ画像データをマネージメントPC105に転送して、マネージメントPC105上で選択されたベクトルモードのベクトル化処理を行う構成について説明する。
まず、実施形態2の画像処理システムの構成について、図15を用いて説明する。
図15は本発明の実施形態2の画像処理システムの構成を示すブロック図である。
尚、図15において、実施形態1の図1の画像処理システムと同一の構成要素については、同一の参照番号を付加し、その詳細な説明については省略する。
図15におけるMFP100は、原稿を読み取る画像読取部と、画像読取部によって得られる画像信号に対する画像処理の一部を行う画像処理部を有する。また、MFP100とマネージメントPC105を接続する専用のLAN106が構成されている場合には、MFP100で生成された画像信号は、LAN106を介してマネージメントPC105に入力される。一方、LAN106が構成されていない場合には、MFP100で生成された画像信号は、LAN102を介してマネージメントPC105に入力される。
マネージメントPC105は、通常のパーソナルコンピュータと同等の構成要素として、内部に画像記憶部、画像処理部、表示部、操作部等を有するが、その一部はMFP100に一体化して構成されている。
また、クライアントPC101と同様、汎用コンピュータに搭載される標準的な構成要素(例えば、CPU、RAM、ROM、ハードディスク、外部記憶装置、ネットワークインタフェース、ディスプレイ、キーボード、マウス等)を有している。
次に、MFP100の詳細構成について、図16を用いて説明する。
図16は本発明の実施形態2のMFPの詳細構成を示す図である。
尚、図16において、実施形態1の図2のMFPと同一の構成要素については、同一の参照番号を付加し、その詳細な説明については省略する。
図16において、MFP100への操作者の操作指示は、実施形態1と同様、MFP100の操作部113と表示部116から行うことも可能であるが、マネージメントPC105に備わる操作部(例えば、キーボードやマウス等)から操作指示を入力して、マネージメントPC105に備わる表示部に操作指示の状態表示及び処理中の画像データの表示を行う構成としても良い。
また、記憶部111は、マネージメントPC105の外部記憶装置として機能することができ、マネージメントPC105からも制御される。
これらMFP100とマネージメントPC105とのデータの授受及び制御は、LAN106が構成されている場合には、ネットワークI/F117を介してMFP100とマネージメントPC105を直結して実現するが、LAN106が構成されていない場合には、ネットワークI/F114に接続されるLAN102を介して実現する。
[処理概要]
次に、実施形態2の画像処理システムで実行する処理全体の概要を、図17を用いて説明する。
図17は本発明の実施形態2の画像処理システムが実行する処理全体の概要を示すフローチャートである。
まず、ステップS1701で、MFP100の画像読取部110に原稿をセットし、マネージメントPC105上の操作部に備わるベクトルスキャン選択キーによる操作に基づいて、ベクトルスキャンを選択する。
続けて、ステップS1702で、マネージメントPC105の操作部でベクトルモード選択キーから所望のベクトルモードを選択する。
尚、マネージメントPC105の操作部及び表示部では、上述した図4A〜図4Cと同等の機能を実現することができるように構成されている。
その後、マネージメントPC105の操作部で、ベクトルスキャンを動作させるためのスタートキーを操作することで、ステップS1703で、MFP100は画像読取部110にセットされた原稿画像を読み取り、マネージメントPC105で指定されたベクトルモードのベクトルスキャンを動作させる。
ベクトルスキャンでは、まず、1枚の原稿をラスタ状に走査して読み取り、例えば、600DPI−8ビットの画像信号を得る。そして、ステップS1704で、この画像信号を、データ処理部115で前処理を施し、記憶部111に1ページ分の画像データとして保存する。
ステップS1705で、記憶部111に保存された画像データを、LAN102もしくはLAN106を介して、マネージメントPC105へ転送する。
マネージメントPC105は、マネージメントPC105上に搭載されたベクトル化処理アプリケーションを起動して、図3のステップS125〜ステップS127の各処理(ブロックセレクション処理、OCR処理、ベクトル化処理)に対応するステップS1706〜ステップS1708の処理を実行する。
ステップS1708のベクトル化処理の終了後、ステップS1709で、各オブジェクト(ブロック)のレイアウト情報を保存して、ベクトルデータファイルとしてマネージメントPC105内の記憶部に保存する。
マネージメントPC105内の記憶部に保存されたベクトルデータファイルは、その後、ステップS1710で、ベクトルスキャンの目的毎に、後処理を実行する。
以上説明したように、実施形態2によれば、マネージメントPC105の操作部及び表示部を介して、MFP100のベクトルスキャンに関する各種指示を行い、MFP100において読み取った画像データをマネージメントPC105に転送し、マネージメントPC105上で一連のベクトル化処理を行う構成とすることで、MFP100にベクトル化処理機能、ベクトルスキャンに関する各種設定(例えば、ベクトルモード選択機能等)が備わっていない場合でも、マネージメントPC105を接続することで、容易に操作者が意図するベクトルモードでのベクトルスキャンを実行することができる。
<実施形態3>
実施形態1及び2においては、操作部と表示部によって、図4A〜図4Cの操作画面を実現する構成について説明した。特に、これらの操作画面では、ベクトルスキャン選択、ベクトルモード選択、ベクトルスキャン開始キー等を操作することで、ベクトルスキャンの一連の処理を起動し、自動的に所望の属性に分割されたオブジェクトからなるベクトルデータファイルを生成する構成について説明した。
これに対し、実施形態3では、実施形態1や2の構成に加えて、原稿画像の読取後に、その原稿画像のプレビュー表示を行い、原稿画像に対応するベクトルデータファイルを生成する前に、ブロックセレクション処理の処理結果を予め確認する構成(操作画面)について説明する。
まず、実施形態3の操作画面について、図18を用いて説明する。
[基本操作仕様]
図18は本発明の実施形態3の操作画面の一例を示す図である。
尚、図4A〜図4Cの操作画面は、実施形態3でも共通して用いる。そして、実施形態3では、図4Cの操作画面10002の読込開始キー100020を押下して、ベクトルスキャン動作が開始され、原稿の読取が終了すると、図18の操作画面10003に表示が切り替わる。
図18の操作画面10003は、図4Cの画面10002においてベクトルモード選択キー100021でText/Graphic/Table/Imageモードを選択した場合の操作画面例を示している。
読み取られた画像データは、図3のステップS125(あるいは図17のステップS1706)のブロックセレクション処理まで実行された後、その読み取られた画像データとブロックセレクション処理の処理結果である画像100029が表示され、その画像を構成する各オブジェクトがブロックセレクション処理された単位(属性)別に矩形枠に囲まれて表示される。
各オブジェクトは、図3のステップS125(あるいは図17のステップS1706)のブロックセレクション処理で自動的に認識された属性毎に、異なる色の矩形枠で表現される。
例えば、Text(文字)は赤、Image(写真)は黄色というように、各オブジェクトを囲む矩形枠を異なる色で表現することで、ブロックセレクション処理で分割された属性別のオブジェクトを容易に識別することができる。これにより、オペレータの視認性が向上する。もちろん異なる色ではなく、矩形枠を、その線の太さや形状(点線)等の他の表示形態で表現しても良い。また、各オブジェクト毎に、スクリーンをかけて表示しても構わない。
画像100029の初期の表示状態は、原稿読取部110で読み取った際のイメージであるが、必要に応じて、拡大/縮小キー100036を用いることで画像サイズを拡大/縮小することが可能である。また、拡大することによって、画像100029の表示内容がその表示エリアを超えて視認できない場合には、スクロールキー10035を用いて画像100029を上下左右に移動することで、その視認できない部分を確認することが可能である。
図18では、画像100029の中央部の文字オブジェクト100030(文字列「We are always waiting YOU!」)が選択されている状態を示している。特に、図18では、選択状態のオブジェクトを、その属性を示す色(この場合、赤)の実線の矩形枠で、それ以外の非選択状態のオブジェクトはそれぞれの属性を示す色の破線の矩形枠で表示されている。このように、矩形枠の表示形態を選択状態と非選択状態に応じて異ならせることで、各オブジェクトの選択状態/非選択状態を容易に確認することができる。
この例では、文字オブジェクト100030が赤の実線の矩形枠で、グラフィックオブジェクト100037が青の破線の矩形枠で、画像オブジェクト100038が黄色の破線の矩形枠で、表オブジェクト100039が緑の破線の矩形枠で表示した場合の例を示しており、それ以外の残りの部分は背景オブジェクトとなる。
尚、背景オブジェクトは、画像100029を構成するオブジェクトを抽出した後の残りの画像部分であるので、特に、矩形枠を用いた表示を行っていない。しかしながら、背景指定という意味で、背景画像の外郭を他のオブジェクト同様に矩形枠で表示する構成としても良い。
編集(例えば、文字オブジェクトであれば、文字オブジェクト中の文字列の編集、グラフィックオブジェクトであれば、そのグラフィックオブジェクトの色調整)を行うためのオブジェクトの選択は、直接、文字オブジェクト100030内の領域をタッチして指定する方法と、オブジェクト選択キー100032を用いて指定する方法がある。どちらの方法を用いても、選択されたオブジェクトの矩形枠は実線になり、非選択のオブジェクトの矩形枠は破線になる。
また、それと同時に選択されているオブジェクトの属性に相当するオブジェクト属性キー100031(この場合、Text、それ以外に、Graphic、Table、Image、BachGroundの種類が存在する)が選択される。この場合、その選択状態を示すために、該当するオブジェクト属性キーはスクリーン表示される。もちろん、これ以外にも、選択状態/非選択状態を示すことができれば、網掛け表示、ブリンク表示等の他の表示形態を用いることができる。
尚、ADFを用いて、複数ページの原稿を読み込んだ場合は、操作画面10003の初期状態では、複数ページの先頭ページの画像が表示され、それ以降のページの画像については、ページ指定キー100033を用いることで、所望するページの画像に切り換えることが可能である。
そして、OKキー100034を押下すると、この表示されている画像100029に対応するベクトルデータファイルが保存される。一方、設定取消キー100040を押下すると、この操作画面10003において実行された各種設定を破棄して、図4Aのコピー基本画面10000に戻る。
[送信/ファックス操作仕様]
次に、ファイル送信/ファックスを行うための操作画面について、図19A〜図19Cを用いて説明する。
図19A〜図19Cは本発明の実施形態3の操作画面の一例を示す図である。
図19Aの操作画面10010は、ファイル送信/ファックスを行うための基本画面である。この操作画面10010による処理を実行する場合には、処理対象の原稿画像をMFP100に読み込む場合の読込設定を行う必要があり、読込設定プルダウンメニュー100100から設定が可能である。これを押下すると、図19Bの操作画面10011のように、プルダウンメニューが表示される。このプルダウンメニューでは、読込設定として、例えば、200×200dpi、300×300dpiを選択することが可能である。
次に、操作画面10011の詳細設定キー100110を押下すると、図19Cの操作画面10012(読込設定画面)が表示される。この操作画面10012の応用モードキー100120を押下すると、図18の操作画面10003が表示され、以降は、上述の基本操作仕様と同様の操作を実現することができる。
[ボックス操作仕様]
次に、MFP100で読み取った画像データを内部の記憶部111に保存するため(ボックス機能)の操作画面について、図20A〜図20Dを用いて説明する。
図20A〜図20Dは本発明の実施形態3の操作画面の一例を示す図である。
図20Aの操作画面10020は、画像データを保存する(ボックス機能)ための基本画面である。現在、MFP100で管理されているボックス群(記憶単位)の内、ボックス00を示すボックスキー100200を押下すると、図20Bの操作画面10021が表示される。
操作画面10021において、原稿読込キー100211を押下すると、原稿読込設定画面が表示される。この原稿読込設定画面は、送信/ファクスの操作仕様と同様で、図19Cの操作画面10012が表示される。
この例では、ボックス00に既に1つのデータファイルが格納されている状態を示しており、このデータファイルの行100210を押下すると、そのデータファイルを選択して、そのデータファイルを処理対象とすることができる。
図20Cの操作画面10022は、データファイルを選択した場合の表示状態を示しており、この場合、選択された行10220が反転表示(網掛表示)される。データファイルを選択すると、そのデータファイルの内容を確認することができ、その場合には画像表示キー100222を押下することで、図18の操作画面10003が表示され、以降は、上述の基本操作仕様と同様の操作を実現することができる。
同様に、図20Cの操作画面10022で、プリントキー100221を押下すると、図20Dの操作画面10023が表示され、プリント設定が可能になる。ここで、応用モードキー100230を押下すると、図18の画面10003が表示され、以降は、上述の基本操作仕様と同様の操作を実現することができる。
以上説明したように、実施形態3によれば、実施形態1や2で説明した効果に加えて、原稿画像の読取後の画像のプレビュー表示として、指定されたベクトルモードでのブロックセレクション処理を行った場合の処理結果を含む画像を表示することで、実際のベクトルスキャンを実行する際に得られるブロックセレクション処理結果を予め確認することができる。
<実施形態4>
実施形態3では、原稿画像の読取後に、その原稿画像のブロックセレクション処理を行った場合の処理結果を含む画像のプレビュー表示を行うことで、最終的にベクトルデータファイルを生成する前に、ブロックセレクション処理結果を予め確認することが可能な構成について説明した。
これに対し、実施形態4では、プレビュー表示において表示されるブロックセレクション処理結果が意図する処理結果になっていない場合には、その処理結果を変更することが可能な構成について説明する。
具体的には、図18の操作画面10003において表示されている各オブジェクトの内、操作者が意図する属性のオブジェクトとして存在しない場合には、この操作画面10003を用いて、その属性を変更することが可能である。
例えば、Text(文字)オブジェクト100030をText属性からGraphic属性に変更したい場合には、操作画面10003上の属性変換ボタン(不図示)を押下した後、Text(文字)オブジェクト100030をタッチして選択し、オブジェクト属性キー100031からGraphicキーを選択することで、Text属性からGraphic属性に変更する。
この場合、属性の変更後は、オブジェクト100030の矩形枠をGraphic属性を示す青色に変更しても良いし、変更前と変更後の属性を視認できるように、Text属性を示す赤色とGraphic属性を示す青色の二重線からなる矩形枠を表示するようにしても良い。
以上説明したように、実施形態4によれば、実施形態3で説明した効果に加えて、プレビュー表示において表示されるオブジェクトの属性を、任意に変更することができるので、プレビュー表示において意図しない属性のオブジェクトが存在しても、適宜、意図する属性のオブジェクトに変更することができる。
<実施形態5>
実施形態3及び4では、図18の操作画面10003によるプレビュー表示を行う構成について説明した。
これに対し、実施形態5では、図4Cの操作画面10002のベクトルモード選択キー100021で選択したベクトルモードに応じて、図18の操作画面10003のオブジェクト属性キー100031の表示内容を変更する構成としても良い。
例えば、ベクトルモード選択キー100021で、Textモードを選択した場合には、オブジェクト属性キー100031もTextのみを表示する。もしくは、ベクトルモード選択キー100021で選択可能なモード一覧をオブジェクト属性キー100031で表示し、実際にベクトルモード選択キー100021で選択されたベクトルモードで規定される属性を表示して、それ以外の属性はグレー表示にして選択不能な構成としても良い。
以上説明したように、実施形態5によれば、実施形態3や4で説明した効果に加えて、プレビュー表示において、選択可能な属性のみでオブジェクト属性キーを表示することで、選択可能な属性の確認を容易に行うことができ、かつ属性に基づく操作の操作性を向上することができる。
<実施形態6>
実施形態4においては、図18の操作画面10003のプレビュー表示において表示されているオブジェクトの属性を変更する構成としているが、この構成に加えて、所望の属性のオブジェクトのベクトル化を最終的に実行するか否かを指定するON/OFFキーを構成しても良い。
以上説明したように、実施形態6によれば、実施形態4で説明した効果に加えて、図18の操作画面10003のプレビュー表示でのブロックセレクション処理結果を確認した上で、所望の属性のオブジェクトを最終的にベクトル化するか否かを決定することができる。
<実施形態7>
実施形態3乃至5においては、図18の操作画面10003において、ブロックセレクション処理の処理結果をプレビュー表示する構成としているが、ベクトル化処理の処理結果を含む画像をプレビュー表示して、そのプレビュー表示において、オブジェクトの属性の変更や、ベクトル化の実行のON/OFFを行う構成としても良い。
この場合には、ラスタ画像データをベクトルデータファイルに変換する際に、ラスタ画像データを別途保持しておき、再指定後に、ベクトル化処理をやり直す方法と、ベクトルデータファイルを一旦ラスタ画像データに変換して、それに対して、再度ベクトル化処理をかけるなどの方法があるが、いずれの構成でも良い。
<実施形態8>
上記実施形態1〜7においては、処理対象の画像として、MFP100から読み取った画像に対して、図3の処理を実行する場合を例に挙げて説明したが、例えば、クライアントPC101から受信する印刷データや、ネットワーク104を介して受信した画像データ(例えば、デジタルカメラで撮影された画像データ)に対して、図3の処理を実行することも可能である。
<実施形態9>
上記実施形態1〜8においては、図1のオフィスA内で実現する場合を例に挙げて説明したが、ネットワーク104上の他のオフィス内のMFPや、ネットワーク104上のMFPで実現する構成としても良い。
<実施形態10>
画像処理システムとしては、MFPやマネージメントPCで実現する構成としているが、画像データを扱うことが可能な機器(例えば、デジタルカメラ、携帯端末(PDA、携帯電話等))であれば、その機器で実現する構成としても良い。
<実施形態11>
入力された画像データに対応するオリジナル画像が既にMFP100の記憶部もしくはネットワーク上のサーバで管理されている場合には、そのオリジナル画像に対して、図3の処理を実行する構成としても良い。
以上、実施形態例を詳述したが、本発明は、例えば、システム、装置、方法、プログラムもしくは記憶媒体等としての実施態様をとることが可能であり、具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
尚、本発明は、前述した実施形態の機能を実現するソフトウェアのプログラム(実施形態では図に示すフローチャートに対応したプログラム)を、システムあるいは装置に直接あるいは遠隔から供給し、そのシステムあるいは装置のコンピュータが該供給されたプログラムコードを読み出して実行することによっても達成される場合を含む。
また、以上の実施形態では、ベクトルモードの指定をMFPやマネージメントPCを操作して行うようにしたが、本発明はこれに限定されるものではない。例えば、原稿にマーカーペンで閉領域を書き込み、その閉領域で囲まれたオブジェクトを所望のベクトルモードに従ってベクトル化するようにするなど種々の変更が可能である。
従って、本発明の機能処理をコンピュータで実現するために、該コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等の形態であっても良い。
プログラムを供給するための記録媒体としては、例えば、フロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RW、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD−ROM,DVD−R)などがある。
その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続し、該ホームページから本発明のコンピュータプログラムそのもの、もしくは圧縮され自動インストール機能を含むファイルをハードディスク等の記録媒体にダウンロードすることによっても供給できる。また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明に含まれるものである。
また、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布し、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせ、その鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される他、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部または全部を行ない、その処理によっても前述した実施形態の機能が実現され得る。
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行ない、その処理によっても前述した実施形態の機能が実現される。
本発明の実施形態1の画像処理システムの構成を示すブロック図である。 本発明の実施形態1のMFPの詳細構成を示す図である。 本発明の実施形態1の画像処理システムが実行する処理全体の概要を示すフローチャートである。 本発明の実施形態1の操作画面の一例を示す図である。 本発明の実施形態1の操作画面の一例を示す図である。 本発明の実施形態1の操作画面の一例を示す図である。 本発明の実施形態1のブロックセレクション処理の概念を説明するための図である。 本発明の実施形態1のブロック情報の一例を示す図である。 本発明の実施形態1のベクトル化処理を説明するための図である。 本発明の実施形態1のベクトル化処理を説明するための図である。 本発明の実施形態1のベクトルデータのグループ化処理を示すフローチャートである。 本発明の実施形態1のステップS701の処理の詳細を示すフローチャートである。 本発明の実施形態1のDAOFのデータ構造を示す図である。 本発明の実施形態1のアプリデータ変換処理を示すフローチャートである。 本発明の実施形態1のステップS8002の処理の詳細を示すフローチャートである。 本発明の実施形態1の文書構造ツリーの説明図である。 本発明の実施形態2の画像処理システムの構成を示すブロック図である。 本発明の実施形態2のMFPの詳細構成を示す図である。 本発明の実施形態2の画像処理システムが実行する処理全体の概要を示すフローチャートである。 本発明の実施形態3の操作画面の一例を示す図である。 本発明の実施形態3の操作画面の一例を示す図である。 本発明の実施形態3の操作画面の一例を示す図である。 本発明の実施形態3の操作画面の一例を示す図である。 本発明の実施形態3の操作画面の一例を示す図である。 本発明の実施形態3の操作画面の一例を示す図である。 本発明の実施形態3の操作画面の一例を示す図である。 本発明の実施形態3の操作画面の一例を示す図である。
符号の説明
100 MFP
101 クライアントPC
102 LAN
103 プロキシサーバ
104 ネットワーク
110 画像読取部
111 記憶部
112 印刷部
113 入力部
114、117 ネットワークI/F
115 データ処理部
116 表示部

Claims (13)

  1. 原稿を読み取って得られる原稿画像の画像処理を行う画像処理装置であって、
    原稿を読み取る読取手段と、
    前記読取手段で読み取った原稿画像から属性別に分割されるオブジェクト画像単位でベクトルデータを生成するベクトル化処理を行う場合に、ベクトル化処理対象のオブジェクト画像のうちベクトル化処理させるべきオブジェクト画像の属性の種類を、操作者による操作に基づき選択する選択手段と、
    前記選択手段で選択された属性の種類に基づいて、前記原稿画像を属性毎のオブジェクト画像に分割する分割手段と、
    前記分割手段で分割されたオブジェクト画像の各属性に対応するベクトル化処理を、各オブジェクト画像のうち前記選択手段でベクトル化処理させるべきオブジェクト画像として選択された属性のオブジェクト画像に対して実行するベクトル化処理手段と、
    前記選択手段でベクトル化処理させるべきオブジェクト画像として選択された属性のオブジェクト画像は前記ベクトル化処理手段の処理結果として得られるベクトルデータを出力し、前記選択手段でベクトル化処理させるべきオブジェクト画像として選択されていない属性のオブジェクト画像は画像データとして出力する出力手段と
    を備えることを特徴とする画像処理装置。
  2. 前記分割手段による処理結果として、分割されたオブジェクト画像とその属性を示す情報を含む前記原稿画像を表示する表示手段を更に備える
    ことを特徴とする請求項1に記載の画像処理装置。
  3. 前記表示手段で表示された原稿画像中のオブジェクト画像の属性を変更する変更手段を更に備える
    ことを特徴とする請求項2に記載の画像処理装置。
  4. 前記表示手段で表示された原稿画像中のオブジェクト画像の属性別に、前記ベクトル化処理手段の実行の是非を指定する指定手段を更に備える
    ことを特徴とする請求項2に記載の画像処理装置。
  5. 前記分割手段は、前記原稿画像に基づいて特定される画像に対して、前記選択手段で選択された属性の種類に基づいて、前記画像を属性毎のオブジェクト画像に分割する
    ことを特徴とする請求項1に記載の画像処理装置。
  6. 前記属性の種類としては、Text、Graphic、Table、Image、BackGroundの少なくとも1つを含み、
    前記ベクトル化処理手段は、
    前記Text属性のオブジェクト画像に対して文字認識処理を実行する文字認識手段と、
    前記Graphic及びTable属性のオブジェクト画像に対してアウトライン化/関数近似化を実行するベクトル化手段と、
    を備えることを特徴とする請求項1に記載の画像処理装置。
  7. 前記属性情報は、前記属性の種類別に互いに異なる表示形態となる情報である
    ことを特徴とする請求項2に記載の画像処理装置。
  8. 前記ベクトル化処理手段による処理結果として、ベクトル化されたオブジェクト画像を含む前記原稿画像に対応するベクトル化画像を表示する表示手段を更に備える
    ことを特徴とする請求項1に記載の画像処理装置。
  9. 読取部を有する画像処理装置とネットワークを介して接続され、前記画像処理装置を制御可能な情報処理装置であって、
    前記画像処理装置の読取部で読み取られた原稿画像を前記ネットワークを介して受信する受信手段と、
    前記受信手段で受信した原稿画像から属性別に分割されるオブジェクト画像単位でベクトルデータを生成するベクトル化処理を行う場合に、ベクトル化処理対象のオブジェクト画像のうちベクトル化処理させるべきオブジェクト画像の属性の種類を、操作者による操作に基づき選択する選択手段と、
    前記選択手段で選択された属性の種類に基づいて、前記原稿画像を属性毎のオブジェクト画像に分割する分割手段と、
    前記分割手段で分割されたオブジェクト画像の各属性に対応するベクトル化処理を、各オブジェクト画像のうち前記選択手段でベクトル化処理させるべきオブジェクト画像として選択された属性のオブジェクト画像に対して実行するベクトル化処理手段と、
    前記選択手段でベクトル化処理させるべきオブジェクト画像として選択された属性のオブジェクト画像は前記ベクトル化処理手段の処理結果として得られるベクトルデータを、前記選択手段でベクトル化処理させるべきオブジェクト画像として選択されていない属性のオブジェクト画像は画像データとしてそれぞれ前記ネットワークを介して前記画像処理装置へ送信する送信手段と
    を備えることを特徴とする情報処理装置。
  10. 原稿を読み取って得られる原稿画像の画像処理を行う画像処理装置の制御方法であって、
    原稿を読み取る読取工程と、
    前記読取工程で読み取った原稿画像から属性別に分割されるオブジェクト画像単位でベクトルデータを生成するベクトル化処理を行う場合に、ベクトル化処理対象のオブジェクト画像のうちベクトル化処理させるべきオブジェクト画像の属性の種類を、操作者による操作に基づき選択する選択工程と、
    前記選択工程で選択された属性の種類に基づいて、前記原稿画像を属性毎のオブジェクト画像に分割する分割工程と、
    前記分割工程で分割されたオブジェクト画像の各属性に対応するベクトル化処理を、各オブジェクト画像のうち前記選択工程でベクトル化処理させるべきオブジェクト画像として選択された属性のオブジェクト画像に対して実行するベクトル化処理工程と、
    前記選択工程でベクトル化処理させるべきオブジェクト画像として選択された属性のオブジェクト画像は前記ベクトル化処理工程の処理結果として得られるベクトルデータを出力し、前記選択工程でベクトル化処理させるべきオブジェクト画像として選択されていない属性のオブジェクト画像は画像データとして出力する出力工程と
    を備えることを特徴とする画像処理装置の制御方法。
  11. 読取部を有する画像処理装置とネットワークを介して接続され、前記画像処理装置を制御可能な情報処理装置の制御方法であって、
    前記画像処理装置の読取部で読み取られた原稿画像を前記ネットワークを介して受信する受信工程と、
    前記受信工程で受信した原稿画像から属性別に分割されるオブジェクト画像単位でベクトルデータを生成するベクトル化処理を行う場合に、ベクトル化処理対象のオブジェクト画像のうちベクトル化処理させるべきオブジェクト画像の属性の種類を、操作者による操作に基づき選択する選択工程と、
    前記選択工程で選択された属性の種類に基づいて、前記原稿画像を属性毎のオブジェクト画像に分割する分割工程と、
    前記分割工程で分割されたオブジェクト画像の各属性に対応するベクトル化処理を、各オブジェクト画像のうち前記選択工程でベクトル化処理させるべきオブジェクト画像として選択された属性のオブジェクト画像に対して実行するベクトル化処理工程と、
    前記選択工程でベクトル化処理させるべきオブジェクト画像として選択された属性のオブジェクト画像は前記ベクトル化処理工程の処理結果として得られるベクトルデータを、前記選択工程でベクトル化処理させるべきオブジェクト画像として選択されていない属性のオブジェクト画像は画像データとしてそれぞれ前記ネットワークを介して前記画像処理装置へ送信する送信工程と
    を備えることを特徴とする情報処理装置の制御方法。
  12. 原稿を読み取って得られる原稿画像の画像処理を行う画像処理装置の制御をコンピュータに実行させるためのコンピュータプログラムであって、
    原稿を読み取る読取工程と、
    前記読取工程で読み取った原稿画像から属性別に分割されるオブジェクト画像単位でベクトルデータを生成するベクトル化処理を行う場合に、ベクトル化処理対象のオブジェクト画像のうちベクトル化処理させるべきオブジェクト画像の属性の種類を、操作者による操作に基づき選択する選択工程と、
    前記選択工程で選択された属性の種類に基づいて、前記原稿画像を属性毎のオブジェクト画像に分割する分割工程と、
    前記分割工程で分割されたオブジェクト画像の各属性に対応するベクトル化処理を、各オブジェクト画像のうち前記選択工程でベクトル化処理させるべきオブジェクト画像として選択された属性のオブジェクト画像に対して実行するベクトル化処理工程と、
    前記選択工程でベクトル化処理させるべきオブジェクト画像として選択された属性のオブジェクト画像は前記ベクトル化処理工程の処理結果として得られるベクトルデータを出力し、前記選択工程でベクトル化処理させるべきオブジェクト画像として選択されていない属性のオブジェクト画像は画像データとして出力する出力工程と
    をコンピュータに実行させることを特徴とするコンピュータプログラム。
  13. 読取部を有する画像処理装置とネットワークを介して接続され、前記画像処理装置を制御可能な情報処理装置の制御をコンピュータに実行させるためのコンピュータプログラムであって、
    前記画像処理装置の読取部で読み取られた原稿画像を前記ネットワークを介して受信する受信工程と、
    前記受信工程で受信した原稿画像から属性別に分割されるオブジェクト画像単位でベクトルデータを生成するベクトル化処理を行う場合に、ベクトル化処理対象のオブジェクト画像のうちベクトル化処理させるべきオブジェクト画像の属性の種類を、操作者による操作に基づき選択する選択工程と、
    前記選択工程で選択された属性の種類に基づいて、前記原稿画像を属性毎のオブジェクト画像に分割する分割工程と、
    前記分割工程で分割されたオブジェクト画像の各属性に対応するベクトル化処理を、各オブジェクト画像のうち前記選択工程でベクトル化処理させるべきオブジェクト画像として選択された属性のオブジェクト画像に対して実行するベクトル化処理工程と、
    前記選択工程でベクトル化処理させるべきオブジェクト画像として選択された属性のオブジェクト画像は前記ベクトル化処理工程の処理結果として得られるベクトルデータを、前記選択工程でベクトル化処理させるべきオブジェクト画像として選択されていない属性のオブジェクト画像は画像データとしてそれぞれ前記ネットワークを介して前記画像処理装置へ送信する送信工程と
    をコンピュータに実行させることを特徴とするコンピュータプログラム。
JP2003390749A 2003-11-20 2003-11-20 画像処理装置、情報処理装置及びそれらの制御方法、プログラム Expired - Fee Related JP4012140B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2003390749A JP4012140B2 (ja) 2003-11-20 2003-11-20 画像処理装置、情報処理装置及びそれらの制御方法、プログラム
EP04257123.2A EP1533746A3 (en) 2003-11-20 2004-11-17 Image processing apparatus and method for converting image data to predetermined format
CNB2004100952241A CN100379239C (zh) 2003-11-20 2004-11-19 用于将图像转换为预定格式的图像处理设备及方法
US10/993,450 US7433517B2 (en) 2003-11-20 2004-11-19 Image processing apparatus and method for converting image data to predetermined format

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003390749A JP4012140B2 (ja) 2003-11-20 2003-11-20 画像処理装置、情報処理装置及びそれらの制御方法、プログラム

Publications (2)

Publication Number Publication Date
JP2005157449A JP2005157449A (ja) 2005-06-16
JP4012140B2 true JP4012140B2 (ja) 2007-11-21

Family

ID=34431596

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003390749A Expired - Fee Related JP4012140B2 (ja) 2003-11-20 2003-11-20 画像処理装置、情報処理装置及びそれらの制御方法、プログラム

Country Status (4)

Country Link
US (1) US7433517B2 (ja)
EP (1) EP1533746A3 (ja)
JP (1) JP4012140B2 (ja)
CN (1) CN100379239C (ja)

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4541770B2 (ja) * 2004-06-10 2010-09-08 キヤノン株式会社 画像処理装置及びその制御方法、プログラム
US7734636B2 (en) * 2005-03-31 2010-06-08 Xerox Corporation Systems and methods for electronic document genre classification using document grammars
US7474928B2 (en) * 2005-04-15 2009-01-06 Autodesk Canada Co. Hybrid vector/raster based paint
JP4408836B2 (ja) * 2005-05-30 2010-02-03 キヤノン株式会社 画像処理装置及びその制御方法、プログラム
JP2007299321A (ja) * 2006-05-02 2007-11-15 Ricoh Co Ltd 情報処理装置、情報処理方法、情報処理プログラム、及び、情報記憶媒体
JP4757120B2 (ja) 2006-07-06 2011-08-24 キヤノン株式会社 画像処理装置及びその制御方法
JP2008112385A (ja) * 2006-10-31 2008-05-15 Canon Inc 画像処理装置、画像処理装置の制御方法、及び制御プログラム
JP4873554B2 (ja) * 2006-12-25 2012-02-08 株式会社リコー 画像配信装置および画像配信方法
US20080304113A1 (en) * 2007-06-06 2008-12-11 Xerox Corporation Space font: using glyphless font for searchable text documents
JP5132347B2 (ja) * 2008-02-13 2013-01-30 キヤノン株式会社 画像処理システム
US8438472B2 (en) * 2009-01-02 2013-05-07 Apple Inc. Efficient data structures for parsing and analyzing a document
JP2010282611A (ja) * 2009-05-07 2010-12-16 Canon Inc 情報処理装置、情報処理方法及びプログラム
CN101930593B (zh) * 2009-06-26 2012-11-21 鸿富锦精密工业(深圳)有限公司 单一物体影像萃取系统及方法
JP5361574B2 (ja) * 2009-07-01 2013-12-04 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
US8743424B2 (en) * 2010-06-18 2014-06-03 Hewlett-Packard Development Company, L.P. Pre-print enhancement of a raster image
JP5720154B2 (ja) * 2010-09-09 2015-05-20 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
US9111327B2 (en) 2011-01-18 2015-08-18 Apple Inc. Transforming graphic objects
US8442998B2 (en) 2011-01-18 2013-05-14 Apple Inc. Storage of a document using multiple representations
US8549399B2 (en) 2011-01-18 2013-10-01 Apple Inc. Identifying a selection of content in a structured document
US8380753B2 (en) 2011-01-18 2013-02-19 Apple Inc. Reconstruction of lists in a document
CN102799571B (zh) * 2011-05-23 2015-06-10 成都科创知识产权研究所 Word文件生成图片的方法及系统
CN102567947A (zh) * 2012-01-12 2012-07-11 惠州Tcl移动通信有限公司 一种移动终端中图像处理方法及移动终端
JP2013164745A (ja) * 2012-02-10 2013-08-22 Sharp Corp 通信端末装置
JP5578188B2 (ja) * 2012-02-17 2014-08-27 コニカミノルタ株式会社 画像処理装置、画像処理装置の制御方法、および、プログラム
US9245714B2 (en) * 2012-10-01 2016-01-26 Kla-Tencor Corporation System and method for compressed data transmission in a maskless lithography system
US9727781B2 (en) * 2012-10-31 2017-08-08 Entrust Datacard Corporation Machine vision verification
CN104918645B (zh) 2013-01-15 2018-10-12 赛诺菲-安万特德国有限公司 用于生成数字图像格式使用报告的医用注射附加装置
US9769365B1 (en) 2013-02-15 2017-09-19 Red.Com, Inc. Dense field imaging
JP5840174B2 (ja) * 2013-06-21 2016-01-06 キヤノン株式会社 情報処理装置、その装置の制御方法、プログラム
TWI566957B (zh) * 2015-01-06 2017-01-21 虹光精密工業股份有限公司 用以產生一式多份文件之列印裝置
JP6958395B2 (ja) * 2018-01-31 2021-11-02 富士通株式会社 記憶制御プログラム、記憶制御方法および記憶制御装置
CN109189524A (zh) * 2018-08-09 2019-01-11 北京金山安全软件有限公司 一种图像资源的生成方法和装置
CN109710783B (zh) * 2018-12-10 2021-06-15 珠海格力电器股份有限公司 一种图片加载方法、装置、存储介质及服务器
TWI776215B (zh) * 2020-08-24 2022-09-01 奇蹟行動科技有限公司 產生使用者介面的描述碼之方法、系統及非暫態電腦可讀取儲存媒體

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06348830A (ja) 1993-06-02 1994-12-22 Matsushita Electric Ind Co Ltd 情報処理装置
US5588072A (en) * 1993-12-22 1996-12-24 Canon Kabushiki Kaisha Method and apparatus for selecting blocks of image data from image data having both horizontally- and vertically-oriented blocks
US6504540B1 (en) * 1995-06-19 2003-01-07 Canon Kabushiki Kaisha Method and apparatus for altering one or more attributes of one or more blocks of image data in a document
US5774579A (en) * 1995-08-11 1998-06-30 Canon Kabushiki Kaisha Block selection system in which overlapping blocks are decomposed
KR100209350B1 (ko) * 1996-05-27 1999-07-15 이계철 유사도 함수를 이용한 전자지도 정밀도 검증방법
JP4071328B2 (ja) * 1997-11-18 2008-04-02 富士通株式会社 文書画像処理装置および方法
JP2000013596A (ja) 1998-06-18 2000-01-14 Minolta Co Ltd 画像処理装置および方法ならびに画像処理プログラムを記録した記録媒体
JP3794171B2 (ja) 1998-08-11 2006-07-05 富士ゼロックス株式会社 画像処理装置および画像処理方法
JP4497733B2 (ja) 2000-02-22 2010-07-07 キヤノン株式会社 データ処理装置及びデータ処理方法
JP3733310B2 (ja) * 2000-10-31 2006-01-11 キヤノン株式会社 文書書式識別装置および識別方法
US7013309B2 (en) * 2000-12-18 2006-03-14 Siemens Corporate Research Method and apparatus for extracting anchorable information units from complex PDF documents
JP2003263301A (ja) 2002-03-07 2003-09-19 Fuji Xerox Co Ltd 画像処理装置及び印刷処理システム

Also Published As

Publication number Publication date
EP1533746A3 (en) 2014-06-18
EP1533746A2 (en) 2005-05-25
CN1620094A (zh) 2005-05-25
US7433517B2 (en) 2008-10-07
US20050111745A1 (en) 2005-05-26
JP2005157449A (ja) 2005-06-16
CN100379239C (zh) 2008-04-02

Similar Documents

Publication Publication Date Title
JP4012140B2 (ja) 画像処理装置、情報処理装置及びそれらの制御方法、プログラム
JP4574235B2 (ja) 画像処理装置、及びその制御方法、プログラム
US7551753B2 (en) Image processing apparatus and method therefor
JP5036430B2 (ja) 画像処理装置及びその制御方法
JP4227569B2 (ja) 画像処理システム、画像処理装置の制御方法、プログラム及び記録媒体
JP4960817B2 (ja) 画像処理装置、および画像処理方法
US8320019B2 (en) Image processing apparatus, image processing method, and computer program thereof
JP3796500B2 (ja) 画像処理装置及びその制御方法、プログラム
WO2004068368A1 (en) Image processing method, system, program, program storage medium and information processing apparatus
US8223389B2 (en) Information processing apparatus, information processing method, and program and storage medium therefor
JP5132416B2 (ja) 画像処理装置およびその制御方法
US8219594B2 (en) Image processing apparatus, image processing method and storage medium that stores program thereof
JP4541770B2 (ja) 画像処理装置及びその制御方法、プログラム
US8181108B2 (en) Device for editing metadata of divided object
JP5132347B2 (ja) 画像処理システム
JP2005151455A (ja) 画像処理装置、情報処理装置及びそれらの制御方法、プログラム
JP4405861B2 (ja) 画像処理装置、情報処理装置及びそれらの制御方法、プログラム
JP2007028181A (ja) 画像処理装置
JP5100354B2 (ja) 画像処理装置、画像処理方法、及びコンピュータプログラム
JP2008092419A (ja) 画像処理装置、画像処理方法
JP2008152353A (ja) 画像処理装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20061222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070110

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070312

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070416

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070613

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20070806

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070831

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070906

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100914

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100914

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110914

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110914

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120914

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120914

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130914

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees