JP2008152353A - 画像処理装置 - Google Patents

画像処理装置 Download PDF

Info

Publication number
JP2008152353A
JP2008152353A JP2006337172A JP2006337172A JP2008152353A JP 2008152353 A JP2008152353 A JP 2008152353A JP 2006337172 A JP2006337172 A JP 2006337172A JP 2006337172 A JP2006337172 A JP 2006337172A JP 2008152353 A JP2008152353 A JP 2008152353A
Authority
JP
Japan
Prior art keywords
data
search
vectorization
image
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2006337172A
Other languages
English (en)
Inventor
Shigeo Hasui
樹生 蓮井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2006337172A priority Critical patent/JP2008152353A/ja
Publication of JP2008152353A publication Critical patent/JP2008152353A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 複合機のボックス(記憶手段)にベクトルデータとラスタデータが混在して格納される場合がある。これに対して検索を行う場合、多量にラスタデータがあると、全てのラスタデータをベクトル化処理すると時間がかかってしまう。
【解決手段】 ボックス内のデータに含まれるオブジェクトの検索時、まだベクトル化処理を行っていないラスタデータを検索対象に含める場合、ラスタデータに対してブロックセレクション(領域分割)を実行後、ユーザが設定した検索キーワードを用いてベクトル化および検索の対象となる属性を識別し、その属性を有するブロックをベクトル化処理した後、オブジェクト検索を行う。
【選択図】 図5

Description

本発明は、内部スプールデータをベクトルデータとして扱う複合機(Multi Functional Peripheral:MFP)において、スキャナなどの入力装置で読み取った画像データと類似するデータを検索する検索技術に関するものである。
近年、MFP機器内のスプールデータをベクタオブジェクトとして保持し、原稿や原稿を構成するオブジェクト単位でデータ検索を行い、画像処理加工やオブジェクト再利用を行う機能が要求されている。
これに対応するために、MFP内の一部または全てのスプールデータを、ページ単位のベクタデータ、またはある所定のサイズの矩形からなるベクタデータ(タイルベクタ)としMFP機能を実現する、ベクタ対応MFPが提案されている。
このようなベクタ対応MFPでは、イメージデータをベクトル化し、ベクトルデータを原稿に記載された情報とした電子データとしての扱いが可能となる。このような電子データをMFPが備えるハードディスク等の外部記憶装置やネットワークで接続される外部記憶上に確保されるボックス領域に格納し、再利用可能な電子入力画像から電子ファイル検索が可能である(例えば、特許文献1)。
ベクトル化処理にはオブジェクトのアウトライン化に伴うエッジ抽出処理や線補完処理、または近似処理化処理等が必要である。これらの処理は一般に高い計算処理能力を要するため、ベクトル化処理に時間がかかるという問題や、ベクトル化処理がCPU等の計算処理リソースを占有してしまうため、MFP内での他の処理を並列的に処理することができず、操作性が著しく低下するという問題がある。
そのため、ベクタ対応MFPにおいても全てのスキャン読み取り原稿をベクトル化するのではなく、時間的に急を要する用途での紙原稿読み取りやスキャン読み取りデータとしてラスタイメージで必要十分な場合にはベクトル化処理を行わない従来型のラスタスキャンを行う場合が考えられる。
また、一方、予めラスタデータとしてスキャンしておき、MFPの処理負荷に空きがある時に後でベクトル化処理を行うことでベクトル化処理に伴う待ち時間をユーザに意識させない手法が提案されている(特許文献2)。
特開2004−349940号公報 特開2004−355315号公報
スプールデータとしてベクトルデータとラスタデータが混在して格納されたボックス領域を対象としてデータ検索を行う場合、ベクトル化未処理のラスタデータに対してはオブジェクト単位での詳細検索が行えない。ユーザに対する検索性を高めるためには、検索時にラスタデータをベクトル化し検索を行う必要がある。しかしながら、ボックス内にラスタデータが多量にあり全てのラスタデータに対してベクトル化処理を実行するとユーザの待ち時間が長くなり、ユーザ利便性が低下するという問題がある。
また特許文献2では、ベクトル化処理の実行有無をスキャン時に設定する必要があるため、検索実行時に、ユーザ所望の検索対象を結果として含むスキャン画像がベクトル化処理されていない場合が生じてしまい、期待する検索結果が得られないという問題がある。
本発明はこのような問題点を解決し、ボックス領域内のラスタデータに対する検索時間を短縮しつつ検索精度を高める手段を提供する。
本発明では、上述した課題を解決するために、本発明の請求項1記載の画像処理装置では、原稿を読み取り走査する原稿読み取り手段と、前記原稿読み取り走査手段で得られるイメージデータをベクトルデータに変換するベクトル化手段と、前記イメージデータおよびベクトルデータを格納する記憶手段と、前記記憶手段に格納されたデータを検索する検索手段とを備え、前記ベクトル化手段は原稿を読み取り走査して得られるイメージデータをオブジェクト毎に分割する手段と、前記検索手段で得られた情報で特定される該分割されたオブジェクト単位でベクトル化する事を特徴とする。
また、上述した課題を解決するために、本発明の請求項2記載の検索手段は、検索対象となるデータを特定するための情報が、前記ベクトル化手段で得られる分割オブジェクトのデータ属性を用いることを特徴とする。
また、上述した課題を解決するために、本発明の請求項3記載の検索手段は、検索対象となるデータを特定するための情報の設定手段としてキーワード入力手段を備えることを特徴とする。
本発明によれば、ボックス内のデータ検索時に、検索情報に適応したラスタデータに対してベクトル化処理を実行し検索することで、検索時間を短縮しつつ検索精度を高めることが可能となる。
(実施例1)
以下に図を用いて、本発明の装置及びその動作について説明する。
図1はMFP100の構成図である。図2においてオートドキュメントフィーダー(以降ADFと記す)を含む画像読み取り部110は複数枚の束状の或いは1枚の原稿画像を図示しない光源で照射し、原稿反射像をレンズで固体撮像素子上に結像し、固体撮像素子からラスタ状の画像読み取り信号を機器固有の解像度(例えば600DPI)の密度のイメージ情報として得る。通常の複写機能はこの画像信号をデータ処理部115で記録信号へ画像処理し、複数枚複写の場合は記憶装置111に一旦1ページ分の記録データを記憶保持した後、記録装置112に順次出力して紙上に画像を形成する。
一方不図示のクライアントPCから出力されるプリントデータは不図示のLAN(Local Area Network)からネットワークIF114を経てデータ処理装置115で記録可能なラスタデータに変換した後、前記記録装置で紙上に記録画像として形成される。
MFP100への操作者の指示はMFPに装備されたキー操作部からなる入力装置113で行われ、これら一連の動作はデータ処理装置115内の図示しない制御部で制御される。スキャナ読み取り時のベクトル化処理の有無も入力装置113より指定される。
操作入力の状態表示及び処理中の画像データの表示は表示装置116で行われる。
(画像処理概要)
次に本発明で行う画像読み取りの概要を図2に示す。
MFP100の画像読み取り部110を動作させ1枚の原稿をラスタ状に走査し、イメージ情報入力処理120で所定の解像度(例えば600DPI)の画像信号を得る。該画像信号をデータ処理部115で前処理を施し記憶装置111に1ページ分の画像データとして保存する。(ステップ120)
データ処理装置115が備える不図示のCPUにより、該格納された画像信号に対して、文字/線画部分とハーフトーンの画像部分とに領域を分離し、文字部は更に段落で塊として纏まっているブロック毎に、或いは線で構成された表、図形に分離し各々セグメント化する。一方ハーフトーンで表現される画像部分は、矩形に分離されたブロックの画像部分、背景部等、所謂ブロック毎に独立したオブジェクトに分割する。得られた各ブロックに対する分割情報は、後のベクトル化処理や検索時の情報として使用される。(ステップ121)
入力装置113でスキャナ読み取り時にベクトル化処理実行が指定されている場合は、ステップ123へ進みベクトル化処理を実行する。(ステップ122)
ステップ123では、ラスターイメージデータからベクトルデータへの変換処理部であり、オリジナル電子ファイルに近く、編集容易でかつ容量の小さい電子ファイルに変換する。詳細は下記(ベクトル化処理)で説明する。ベクトル化処理後の画像データは、記憶装置111へ格納する。
(ブロックセレクション処理)
ブロックセレクション処理とは、ページ画像を構成する複数のオブジェクトを、特定の塊(ブロック)として認識し、該ブロック各々を文字/図画/写真/線/表等の属性に判定し、異なる属性を持つ領域に分割する処理である。
ブロックセレクション処理の実施例を以下に説明する。まず、入力画像を白黒に二値化し、輪郭線追跡をおこなって黒画素輪郭で囲まれる画素の塊を抽出する。面積の大きい黒画素の塊については、内部にある白画素に対しても輪郭線追跡をおこない白画素の塊を抽出、さらに一定面積以上の白画素の塊の内部からは再帰的に黒画素の塊を抽出する。
このようにして得られた黒画素の塊を、大きさおよび形状で分類し、異なる属性を持つ領域へ分類していく。たとえば、縦横比が1に近く、大きさが一定の範囲のものを文字相当の画素塊とし、さらに近接する文字が整列良くグループ化可能な部分を文字領域、扁平な画素塊を線領域、一定大きさ以上でかつ四角系の白画素塊を整列よく内包する黒画素塊の占める範囲を表領域、不定形の画素塊が散在している領域を写真領域、それ以外の任意形状の画素塊を図画領域とする。図画領域に分類された画素塊は閉曲線領域の単位で部品化を行い、各閉曲線領域に対して特徴点を抽出し図形分類を行う。例えば、3頂点を持つ直線からなる閉領域は三角形というように、多頂点を持つ直線から構成される場合は多角形、閉領域を成す線の一次微分成分が常に単調である場合は円形と分類する。
ブロックセレクション処理で得られた各ブロックに対するブロック情報を図3に示す。前記ブロック情報はイメージファイル毎に作成され、以降に説明するベクトル化、或いは検索の為の情報として用いる。
(ベクトル化処理)
ベクトル化処理により各属性領域のイメージデータをベクトルデータに変換する。ベクトル化の方法は、以下(a)〜(f)等が存在する。
(a)属性領域が文字領域のとき、さらに不図示のデータ処理装置115が備えるOCRによる文字画像のコード変換を行う、あるいは文字のサイズ、スタイル、字体を認識し、原稿を走査して得られた文字に可視的に忠実なフォントデータに変換する。
(b)属性領域が文字領域であり、かつ不図示のデータ処理装置115が備えるOCRによる認識が不可能である場合、文字の輪郭を追跡し、輪郭情報(アウトライン)を線分のつながりとして表現する形式に変換する。
(c)属性領域が図形領域の場合、図形オブジェクトの輪郭を追跡し輪郭情報を線分のつながりとして表現する形式に変換する。
(d)b、cの線分形式のアウトライン情報をベジエ関数またはスプライン関数を用いてフィッティングし、関数情報に変換する。
(e)cの図形オブジェクトの輪郭情報から、図形の形状を認識し、円、矩形、多角形、等の図形定義情報に変換する。
(f)属性領域が図形領域であって、特定領域の表形式のオブジェクトの場合、罫線や枠線を認識し、所定のフォーマットの帳票フォーマット情報に変換する。
ベクトル化処理で得られる不図示のベクトル化オブジェクト情報は、ベクトルオブジェクト毎に作成され、以降に説明する検索の為の情報として用いる。
(検索処理)
本発明で行う検索処理のフローチャートを図4に示す。
ステップ450では、表示部116に検索条件を設定する画面を表示し、ユーザに入力を促す。図5は設定画面の一例である。設定画面500では、オブジェクト検索用キーワードをプルダウンメニュー510から選択する。検索用キーワードとして、前述のベクトル化処理で検出可能な各属性の下位属性を表示する。文字領域属性であれば、文字サイズ、スタイル、書体等の属性であり、図形領域属性であれば、円、矩形、多角形等の属性である。
また、オブジェクト検索場所をプルダウンメニュー511から選択する。オブジェクト検索場所としては、記憶装置111上に確保された各ユーザに割り当てられたボックス領域、他ユーザの公開ボックス領域およびネットワークI/F 114に接続される不図示のネットワーク上に接続される他のMFPおよびサーバー上の各ユーザに割り当てられた、または公開されたボックス領域等の1箇所または複数箇所を指定する。
チェックボックス512では、オブジェクト検索対象にラスタデータを含めるか否かを選択する。
ボタン520を押下すると、前述の検索キーワード510、検索場所511、検索オプション512で指定された設定でオブジェクト検索を実行する。
前記検索オプション512がチェックされていない場合は、前記検索場所511で指定されるボックス領域に存在する各ベクトル化処理済みオブジェクトに対応する前述のベクトル化オブジェクト情報を参照し、前記検索キーワード510で指定されるキーワードに対応する属性および詳細情報を持つオブジェクトを検索該当オブジェクトとする。
前記検索オプション512がチェックされている場合は、前述のようにベクトル化処理済みオブジェクトに対する検索に加え、前記検索場所511で指定されるボックス領域に存在するラスタデータを検索対象とする。手順としては、まず各ラスタデータに対応する前述のブロック情報を参照し、前記検索キーワード510で指定されるキーワードに対応する属性を有するブロック情報(ラスタデータ)を抽出する。次に、抽出した前記ラスタデータに対して前述のベクトル化処理を行う。得られたベクトル化オブジェクト情報を参照し、前記検索キーワード510で指定されるキーワードに対応する属性および詳細情報を持つオブジェクトを検索該当オブジェクトとする。
このように、検索キーワードに対応する属性を有するブロック(ラスタデータ内の部分画像)をベクトル化対象にして、ベクトル化処理を行うので、ラスタデータ全てをベクトル化処理する必要がなくなる。したがって、ベクトル化処理にかかる時間が少なくて済み、検索結果の出力も速くなる。検索キーワードに対応する属性を定める処理は、直接属性を入力することによって属性指定してもよい。また、例えば、「三角」というキーワードが入力された場合、テキスト領域の「三角」という文字列をベクトル化検索対象にするのに加えて、図形領域の三角図形をベクトル化検索対象にするようにしてもよい。
検索対象全てに対する検索が終了後、ステップ452において表示部116に検索結果を示す画面を表示する。図6は検索結果画面の一例である。検索結果画面600では、検索該当オブジェクトが、オブジェクト名620、前記オブジェクトを含むファイル名621、保存場所622、オブジェクトサイズ623、更新日時624と共に、表610上に選択可能な形式で表示される。
ボタン650を押下すると、選択されたオブジェクトを不図示のプレビュー画面で表示する。ボタン651を押下すると、選択されたオブジェクトに対する編集作業を行う。ボタン652を押下すると、検索結果画面表示を終了する。
ボタン521を押下すると、画面500を閉じオブジェクト検索を終了する。
本発明の画像形成装置構成図 本発明のラスタ→タイルベクタ変換部の動作を説明するフローチャート ブロックセレクション情報を示す図 本発明の検索処理を表すフローチャート 本発明の検索処理の設定画面の一例を示す図 本発明の検索処理の検索結果画面の一例を示す図

Claims (3)

  1. 原稿を読み取り走査する原稿読み取り手段と、前記原稿読み取り走査手段で得られるイメージデータをベクトルデータに変換するベクトル化手段と、前記イメージデータおよびベクトルデータを格納する記憶手段と、前記記憶手段に格納されたデータを検索する検索手段とを備え、
    前記ベクトル化手段は原稿を読み取り走査して得られるイメージデータをオブジェクト毎に分割する手段と、前記検索手段で得られた情報で特定される該分割されたオブジェクト単位でベクトル化する事を特徴とする画像処理装置。
  2. 前記検索手段は検索対象となるデータを特定するための情報が、前記ベクトル化手段で得られる分割オブジェクトのデータ属性を用いることを特徴とする請求項1記載の画像処理装置。
  3. 前記検索手段は、検索対象となるデータを特定するための情報の設定手段としてキーワード入力手段を備えることを特徴とする請求項1、2記載の画像処理装置。
JP2006337172A 2006-12-14 2006-12-14 画像処理装置 Withdrawn JP2008152353A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006337172A JP2008152353A (ja) 2006-12-14 2006-12-14 画像処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006337172A JP2008152353A (ja) 2006-12-14 2006-12-14 画像処理装置

Publications (1)

Publication Number Publication Date
JP2008152353A true JP2008152353A (ja) 2008-07-03

Family

ID=39654494

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006337172A Withdrawn JP2008152353A (ja) 2006-12-14 2006-12-14 画像処理装置

Country Status (1)

Country Link
JP (1) JP2008152353A (ja)

Similar Documents

Publication Publication Date Title
JP5111268B2 (ja) 画像処理装置、画像処理方法、そのプログラムおよび記憶媒体
JP4251629B2 (ja) 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体
US7551753B2 (en) Image processing apparatus and method therefor
JP4012140B2 (ja) 画像処理装置、情報処理装置及びそれらの制御方法、プログラム
JP5036430B2 (ja) 画像処理装置及びその制御方法
JP4757120B2 (ja) 画像処理装置及びその制御方法
US8384936B2 (en) System which performs resolution-dependent vectorization of print data
JP5137759B2 (ja) 画像処理装置
JP2007049388A (ja) 画像処理装置及びその制御方法、プログラム
JP7262993B2 (ja) 画像処理システム、画像処理方法、画像処理装置
US20090279793A1 (en) Image processing apparatus and method for controlling the same
US8355577B2 (en) Image processing apparatus and method
JP5178490B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
US8219594B2 (en) Image processing apparatus, image processing method and storage medium that stores program thereof
JP4541770B2 (ja) 画像処理装置及びその制御方法、プログラム
JP2010182100A (ja) 画像処理装置及びその制御方法
US20090290797A1 (en) Image processing for storing objects separated from an image in a storage device
JP4179977B2 (ja) スタンプ処理装置、電子承認システム、プログラム、及び記録媒体
JP7301529B2 (ja) 画像処理装置、画像処理方法、及びプログラム
JP2005151455A (ja) 画像処理装置、情報処理装置及びそれらの制御方法、プログラム
JP2008152353A (ja) 画像処理装置
JP5100354B2 (ja) 画像処理装置、画像処理方法、及びコンピュータプログラム
JP2011053901A (ja) 文書画像データ提供装置、文書画像データ提供システム、文書画像データ提供方法、文書画像データ提供プログラム、背景処理プログラム
JP2009093627A (ja) 文書画像データ提供システム、文書画像データ提供装置、情報処理装置、文書画像データ提供方法、情報処理方法、文書画像データ提供プログラム、情報処理プログラム
JP2007048057A (ja) 画像処理装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20100302