JP2009303149A - 画像処理装置、画像処理方法及びコンピュータ制御プログラム - Google Patents

画像処理装置、画像処理方法及びコンピュータ制御プログラム Download PDF

Info

Publication number
JP2009303149A
JP2009303149A JP2008158219A JP2008158219A JP2009303149A JP 2009303149 A JP2009303149 A JP 2009303149A JP 2008158219 A JP2008158219 A JP 2008158219A JP 2008158219 A JP2008158219 A JP 2008158219A JP 2009303149 A JP2009303149 A JP 2009303149A
Authority
JP
Japan
Prior art keywords
metadata
image processing
image
rectangle
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2008158219A
Other languages
English (en)
Inventor
Naoki Ito
直樹 伊藤
Reiji Misawa
玲司 三沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2008158219A priority Critical patent/JP2009303149A/ja
Publication of JP2009303149A publication Critical patent/JP2009303149A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

【課題】 文書内のオブジェクトの検索時に、検索されたオブジェクトを容易に識別できるようにする。
【解決手段】 上記の課題を解決するために、本発明では、画像から抽出したオブジェクトにメタデータを付与する際に、該オブジェクトに外接する矩形位置の付け方を制御する。すなわち、外接矩形をオブジェクト本体より一回り大きくすることにより、検索時にオブジェクト本体と検索結果位置を示す枠との間に隙間が生じるので、視認性がよくなる。
【選択図】 図11

Description

本発明は画像処理装置において、入力画像内のオブジェクトを検索した時に、検索に該当したオブジェクトを視認しやすくするためのメタデータの付加技術に関する。
特許文献1では、データの収集や検索の効率を高めることができるデータ管理技術を提供している。所定の記憶部に格納された複数ファイルを含む複数リソース間の関連付けを示す関連付け情報を関連付けデータベースに記憶する。そして、複数ファイルの実行をするときにユーザの所定の操作に応答して、複数ファイル間を関連付けることで、関連付け情報を変更する。更に、ユーザの操作に応じて、関連付けデータベースに格納された関連付け情報に基づいて、リソースを基準とした関連付け情報を可視的に表現した図を出力する。
特開2006−221312号公報
紙の電子化が行われているが、従来の電子化では目的のファイルを探す場合に、時間がかかる場合があった。現在では、電子化した文書に対して、文章の保管はもちろん、その文章が探しやすくすることも電子化する際の要件になっている。
そこで、電子化した文書内の各オブジェクトにメタデータを付加して、探しやすさを向上させる処理などが考えられている。しかしながら、ページ内のオブジェクトにメタデータを付加したファイルをPC上で検索を行った時、検索キーワードにヒットしたオブジェクトをユーザが判別しにくい場合がある。例えば、文書の検索を行うアプリケーションの機能として、検索キーワードにヒットしたオブジェクト(検索キーワードに合致するメタデータが付与されているオブジェクト)について、該オブジェクトの外接矩形を赤色の枠で囲む機能を有するものがある。このような機能を有するアプリケーションの場合、検索にヒットしたオブジェクトが矩形の写真であったような場合、写真部分と赤色の枠とが一体化して見えてしまい、ユーザにとっては判別が困難になることがある。
上記の課題を解決するために、本発明の画像処理装置は、入力した画像に対して領域分割を行う領域分割手段と、領域分割結果のオブジェクトに対するメタデータを抽出するメタデータ抽出手段と、前記オブジェクトに対してメタデータを付加するメタデータ付加手段と、メタデータをつける際に、該オブジェクトの外接矩形の付け方を制御する制御手段と、を有することを特徴とする。
本発明によれば、オブジェクトに対する外接矩形の付け方を制御することで、電子化した文書を検索する際にヒットしたオブジェクトがどこにあるかの視認性が向上する。これによって、検索をしてヒットしたオブジェクトをすぐに見つける・認識することが出来るようになる。
次に、本発明の詳細を実施例の記述に従って説明する。
以下、本発明を実施するための第1の形態について図面を用いて説明する。
図1は、本発明に係る画像処理システムを示すブロック図、図2は、図1におけるMFPを示すブロック図、図3は、第1実施例で説明する第1のデータ処理フローである。図6は、ベクトル化処理の中で実施するオブジェクト分割処理で領域分割情報した結果の一例を表し、図7は、オブジェクト分割したときの各属性のブロック情報および入力ファイル情報を示す。図8は、文書構造ツリー生成処理の対象となる文書を示す図で、図9は、文書構造ツリーを示す図であり、図10は、本実施例で説明するScalable Vector Graphics(以下、SVG)形式の一例である。
[画像処理システム]
図1において、本発明に係る画像処理システムは、オフィス10とオフィス20とをインターネット104で接続した環境において使用される。
オフィス10内に構築されたLAN107には、記録装置としてのマルチファンクション複合機(以下、MFP)100、MFP100を制御するマネージメントPC101、ローカルPC102、文書管理サーバ106、文書管理サーバ106のためのデータベース105が接続されている。
オフィス20内にはLAN108が構築され、LAN108には文書管理サーバ126、および文書管理サーバ126のためのデータベース125が接続されている。
LAN107、LAN108にはプロキシサーバ103、プロキシサーバ123が接続され、LAN107、LAN108はプロキシサーバ103、プロキシサーバ123を介してインターネットに接続される。
MFP100は原稿から読み取った入力画像に対する画像処理の一部を担当し、処理結果としての画像データはLAN107を通じてマネージメントPC101に入力する機能や、ローカルPC102、もしくは不図示の汎用PCから送信されるPage Discription Language(以下、PDL)言語を解釈して、プリンタとして作用、さらには、原稿から読み取った画像をローカルPC102もしくは、不図示の汎用PCに送信する機能をもつ。マネージメントPC101は、画像記憶手段、画像処理手段、表示手段、入力手段等を含む通常のコンピュータであり、機能的にはこれら構成要素の一部がMFP100と一体化して、画像処理システムの構成要素となっている。なお、本実施例では、マネージメントPCを介してデータベース105において、下記に記載する登録処理などが実行されるものとするが、マネージメントPCで行われる処理をMFPで実行するようにしても構わない。
さらにMFP100は、LAN107によってマネージメントPC101に直接接続されている。
[MFP]
図2において、MFP100は、図示しないAuto Document Feeder(以下、ADF)を有する画像読み取り部110を備え、画像読み取り部110は束状の或いは1枚の原稿の画像を光源で照射し、反射画像をレンズで固体撮像素子上に結像する。固体撮像素子は所定解像度(例えば600dpi)および所定輝度レベル(例えば8ビット)の画像読み取り信号を生成し、画像読み取り信号からラスターデータよりなる画像データが構成される。
MFP100は、記憶装置(以下、BOX)111および記録装置112を有し、通常の複写機能を実行する際には、イメージデータをデータ処理装置115によって、複写用の画像処理して記録信号に変換する。複数枚複写の場合には、1頁分の記録信号を一旦BOX111に記憶保持した後、記録装置112に順次出力して、記録紙上に記録画像を形成する。
MFP100は、LAN107との接続のためのネットワークI/F114を有し、ローカルPC102、もしくは他の汎用PC(不図示)からドライバーを利用して出力するPDL言語を、記録装置112によって記録し得る。ローカルPC102からドライバーを経由して出力されるPDLデータは、LAN107からネットワークI/F114を経てデータ処理装置115で言語を解釈・処理することで記録可能な記録信号に変換された後、MFP100において、記録紙上に記録画像として記録される。
BOX111は、画像読み取り部110からのデータやローカルPC102からドライバーを経由して出力されるPDLデータをレンダリングしたデータを保存できる機能を有している。
MFP100は、MFP100に設けられたキー操作部(入力装置113)、あるいはマネージメントPC101の入力装置(キーボード、ポインティングデバイス等)を通じて操作される。これらの操作のために、データ処理装置115 は内部の制御部(図示せず。)によって所定の制御を実行する。
MFP100は表示装置116を有し、操作入力の状態と、処理すべきイメージデータとを、表示装置116によって表示し得る。
BOX111はネットワークI/F117を介して、マネージメントPC101から直接制御し得る。LAN107は、MFP100とマネージメントPC101との間のデータの授受、制御信号授受に用いられる。
〔オブジェクト毎の保存〕
図3にビットマップ画像データをオブジェクト毎に分割して保存するためのフローチャートを示す。なお、ビットマップ画像データは、MFP100の画像読み取り部110により取得されたビットマップ画像データであってもよいし、ローカルPC102のアプリケーションソフトで作成されたドキュメントをMFP100内部でレンダリングして生成してもよい。
まず、ステップS301において、オブジェクト分割処理(領域分割処理)が行われる。オブジェクト分割後のオブジェクトの種類は、文字、写真、グラフィック(図面、線画、表)、背景、を指す。
分割された各々のオブジェクトは、ステップS302において、オブジェクトの種類(文字、写真、グラフィック、背景)を判定される。写真の場合、ステップS303において、ビットマップのままJPEG圧縮される。また、背景の場合も同様に、ステップS303において、ビットマップのままJPEG圧縮される。
一方、S302のオブジェクト判定の結果が、グラフィックの場合、ステップS304において、ベクトル化処理され、パス化されたデータに変換される。
また、S302のオブジェクト判定の結果が、文字の場合も、ステップS304において、グラフィックと同様にベクトル化処理され、パス化されたデータに変換される。更に、文字の場合には、ステップS308において、OCR処理が施され、文字コード化されたデータも生成される。
次に、全てのオブジェクトデータと、文字コード化されたデータが一つのファイルとしてまとめられる。このとき、ステップS305において、各オブジェクトに対して、最適なメタデータが抽出される。抽出されたメタデータは、メタデータ付加ステップS306で各々のオブジェクトに対して付加され、ステップS307においてMFP100に内蔵されているBOX111に保存される。なお、ここでは、MFP100に内蔵されているBOX111に保存されることを示しているが、ネットワークを介してPCなどの外部の機器に送信することも可能である。
〔ビットマップ画像データ(ステップS301)〕
ステップS301で処理対象となるビットマップ画像データは、MFP100の画像読み取り部から入力される画像と、PC102上のアプリケーションソフトで作成されたデータをレンダリングして生成される画像とがある。
MFP100の画像読み取り部を使用した場合には、図5のステップS501において、画像を読み込む。読み込まれた画像は、既にビットマップ画像データである。そのビットマップ画像データをステップS502において、スキャナに依存する画像処理を行う。スキャナに依存する画像処理とは、例えば、色処理やフィルタ処理など、当該スキャナデバイスの特性に適した画像処理のことを指すものとする。このようにして画像処理が施されて生成された画像が処理対象となる。
一方、PC102上のアプリケーションソフトを使用して作成したアプリデータは、PC102上にあるプリントドライバを介して、プリントデータに変換され、MFP100に送信される。ここで言うプリントデータとは、PDLを意味する。MFP100内部に存在するインタープリタを介して、ディスプレイリストが生成される。そのディスプレイリストを、レンダリングすることにより、ビットマップ画像データが生成される。
このようにして生成されたビットマップ画像データは、ステップ301において、オブジェクト分割されることになる。
〔メタデータ抽出・付加(ステップS305〜S306)〕
ステップS305〜S306のメタデータ抽出およびメタデータ付加に関するフローチャートを図4に示す。
まず、ステップS401において、メタデータ付与対象のオブジェクトの周囲で一番近くに存在する文字オブジェクトを選択する。次に、ステップS402において、選択された文字オブジェクトに対して、文字認識処理と形態素解析を行う。その形態素解析結果により抽出された単語をメタデータとして、ステップ403では、各オブジェクトに関連付ける(メタデータ付加)。
なお、本実施形態では、メタデータの抽出・付加に形態素解析を用いたが、これに限るものではなく、画像特徴量抽出、構文解析等によりメタデータを決定して付加するようにしてもよい。
[登録の詳細設定]
図3のベクトル化処理S304でベクトル化されたデータのフォーマットの一例を図10に示す。本実施例では、SVG形式で表記しているが、これに限定されるものではない。
図10では説明のため、オブジェクトの表記(記述データ)を枠で囲っている。枠:1001はイメージ属性を示し、そこには、イメージオブジェクトの情報(領域情報(位置情報)とビットマップ情報)が示されている。枠:1002はテキストオブジェクトの情報(領域と文字データ)が記載されている。枠:1003では、枠:1002で示した内容をベクターオブジェクトとして表現している。枠:1004は、表オブジェクトの罫線部分や図形オブジェクトなどのラインアート(線画)をベクターオブジェクトとして表している。
[オブジェクト分割ステップ(領域分割ステップ)]
ステップS301(オブジェクト分割ステップ)においては、図6の画像602に示すように、入力画像を属性ごとに矩形ブロックに分割する。前述のように、矩形ブロックの属性としては、文字、写真、グラフィック(図面、線画、表など)がある。なお、オブジェクト分割処理は、公知の技術を利用することが可能である。
オブジェクト分割ステップにおいては、まず、RAM(不図示)に格納されたイメージデータを白黒に2値化し、黒画素輪郭で囲まれる画素塊を抽出する。
さらに、このように抽出された黒画素塊の大きさを評価し、大きさが所定値以上の黒画素塊の内部にある白画素塊に対する輪郭追跡を行う。白画素塊に対する大きさ評価、内部黒画素塊の追跡というように、内部の画素塊が所定値以上である限り、再帰的に内部画素塊の抽出、輪郭追跡を行う。
画素塊の大きさは、例えば画素塊の面積によって評価される。
このようにして得られた画素塊に外接する矩形ブロックを生成し、矩形ブロックの大きさ、形状に基づき属性を判定する。
例えば、縦横比が1に近く、大きさが一定の範囲の矩形ブロックは文字領域矩形ブロックの可能性がある文字相当ブロックとし、近接する文字相当ブロックが規則正しく整列しているときに、これら文字相当ブロックを纏めた新たな矩形ブロックを生成し、新たな矩形ブロックを文字領域矩形ブロックとする。
また扁平な画素塊、もしくは、一定大きさ以上でかつ四角形の白画素塊を整列よく内包する黒画素塊をグラフィック領域矩形ブロック、それ以外の不定形の画素塊を写真領域矩形ブロックとする。
オブジェクト分割ステップでは、このようにして生成された矩形ブロックのそれぞれについて、図7に示す、属性等のブロック情報および入力ファイル情報を生成する。
図7において、ブロック情報には各ブロックの属性、位置の座標X、座標Y、幅W、高さH、OCR情報が含まれる。属性は1〜3の数値で与えられ、1は文字領域矩形ブロック、2は写真領域矩形ブロック、3はグラフィック領域矩形ブロックを示す。座標X、座標Yは入力画像における各矩形ブロックの始点のX、Y座標(左上角の座標)である。幅W、高さHは矩形ブロックのX座標方向の幅、Y座標方向の高さである。OCR情報は入力画像における座標を示す情報の有無を示す。
さらに入力ファイル情報として矩形ブロックの個数を示すブロック総数Nが含まれる。
これらの矩形ブロックごとのブロック情報は、特定領域でのベクトル化に利用される。またブロック情報によって、特定領域とその他の領域を合成する際の相対位置関係を特定でき、入力画像のレイアウトを損なわずにベクトル化領域とラスターデータ領域を合成することが可能となる。
[BOX保存処理]
図3のオブジェクト分割ステップ(ステップS301)の後、ベクトル化(ステップS304)した結果のデータを用いて、BOX(記憶装置)へ保存する際の保存データへの変換処理を実行する。ステップS304のベクトル化処理した直後の結果は、図21に示す中間データの形式(Document・Analysis・Output・Format(以下、DAOF)と呼ぶこととする)で保存されている。
図21において、DAOFは、ヘッダ2101、レイアウト記述データ部2102、文字認識記述データ部2103、表記述データ部2104、画像記述データ部2105よりなる。
ヘッダ2101には、処理対象の入力画像に関する情報が保持される。
レイアウト記述データ部2102には、入力画像中の矩形ブロックの属性である文字、線画、図面 、表、写真等の情報と、これら属性が認識された各矩形ブロックの位置情報が保持される。
文字認識記述データ部2103には、文字領域矩形ブロックのうち、文字認識して得られる文字認識結果が保持される。
表記述データ部2104には、表の属性を持つグラフィック領域矩形ブロックの表構造の詳細が格納される。
画像記述データ部2105には、グラフィック領域矩形ブロックにおけるイメージデータが、入力画像データから切り出して保持される。
ベクトル化処理を指示された特定領域においては、ブロックに対しては、画像記述データ部2105には、ベクトル化処理により得られたブロックの内部構造や、画像の形状や文字コード等あらわすデータの集合が保持される。
一方、ベクトル化処理の対象ではない、特定領域以外の矩形ブロックでは、入力画像データそのものが保持される。
BOX保存データへの変換処理は図22の各ステップにより実行される。
ステップS2201:DAOF形式のデータを入力する。
ステップS2202:アプリデータの元となる文書構造ツリー生成を行う。
ステップS2203:文書構造ツリーを元に、DAOF内の実データを取得し、実際のアプリデータを生成する。
例えば、文書のオブジェクト分割を行った結果が、図8のような複数のオブジェクト(T1〜T7)に分割されたものとすると、この文書構造に基づいて文書構造ツリー生成処理を行うと、図9のような文書構造ツリーになる。入力画像V0は、最上位階層にグループH1、H2、セパレータS1を有し、グループH1には第2階層の矩形ブロックT1、T2が属する。グループH2には、第2階層のグループV1、V2が属し、グループV1には、第3階層の矩形ブロックT3、T4、T5が属し、グループV2には、第3階層の矩形ブロックT6、T7が属する。
[メタデータ付加]
メタデータ付加に関して図12を入力の画像として例にして説明を行う。図12の1201は入力の画像である。この画像の中には、写真画像が2つレイアウトされているものとする(1202、1204)。また、文字としては3文章入っているものとする(1203、1205、1206)。
この文書画像に対して前述したオブジェクト分割(図3のステップS301)を行った結果を図13に示す。図13の1301はオブジェクト分割結果を行った画像全体を示している。図13では、オブジェクト分割の結果を示すように各オブジェクトに対して分割してオブジェクトを切り出す矩形領域を示す枠を付けて示している。図13において写真のオブジェクトの領域は1302と1304である。文字のオブジェクトの領域は1303、1305、1306である。
写真と判定されたオブジェクト1302と1304は、前述した図3のステップS305のメタデータ抽出処理が行われる。この図13に示した画像の場合、オブジェクト1302のメタデータは、近くにある文字オブジェクト1303のOCRデータがメタデータとして抽出される。オブジェクト1304のメタデータは、文字オブジェクト1305のOCRデータがメタデータとなる。このように近くの文字オブジェクトから抽出したメタデータを、写真等のオブジェクトに対し付加することにより写真等のオブジェクトの検索も行えるようになる。
図3に示したステップS306に関して詳細に説明を行う。オブジェクトに対してメタデータを付加するときのフローを図11に示す。ステップS301で切り出した矩形に対してオブジェクト本体が矩形かどうかの判定をステップS1101で行う。ここでオブジェクト本体が矩形かどうかの判定に関して説明を行う。例えば、図12と図13に示したようにオブジェクト1202を囲む矩形領域1302は、矩形領域1302に対してオブジェクト本体1202の輪郭のほぼ全てが接している。このような場合、ステップS1101ではオブジェクト本体は矩形であると判断される。一方、オブジェクト1204を囲む矩形領域1304に関しては、矩形領域1304に対してオブジェクト自身1204が接している部分がとても小さい。この場合、ステップS1101の判定はオブジェクトは矩形ではないと判断する。ここでオブジェクトが矩形かどうかの判断は、オブジェクトを切り出した矩形に対してオブジェクト自身がどれだけ接しているかを率で示し、その率に応じて矩形かそうでないかの判断を行うものとする。
例えば、図14に、オブジェクト分割した矩形領域1302に基づいて切り出したオブジェクト1401に示す。切り出した矩形の画素数(これは図14の1402の枠の画素数)をカウントし、更に、その矩形にオブジェクト本体が接している数のカウントを行う。切り出した矩形領域1401内のうち、矩形領域の枠を1402、オブジェクト本体を1403で示したとすると、1402の枠と1403のオブジェクト自身が接している画素数をカウントする。そして、求める率は以下のようにあらわせる。
率(%)=(オブジェクトが切り出し矩形に接している画素数)/(切り出した矩形の画素数)×100
この率が予め設定した値よりも大きくなった場合は矩形であると判断を行い、あらかじめ設定した値を下回った場合は矩形でないと判断する。例えば、矩形とする率を70%とすると先に示した図13のオブジェクト1302に関して率は100%となるので矩形と判断する。図13のオブジェクト1304に関しては、図14の1404に切り出したオブジェクト示し、切り出した枠を1405、オブジェクトを1406に示した。ここからオブジェクトと切り出した枠が接する率は10%程度となり、予め設定した70%を下回るので、該オブジェクト本体は矩形でないと判断する。
ステップS1101でオブジェクトは矩形でないと判断したらステップS1102でオブジェクトに対してメタデータを付加する。図13のオブジェクト1304に対しては矩形ではないと判断して、オブジェクトにメタデータを付加する。オブジェクトのメタデータとしては、検索用のキーワードと、外接矩形の位置情報とが付加されることになる。
一方、ステップS1101でオブジェクトは矩形であると判断した場合には、ステップS1103でオブジェクトに対して余白を付けてメタデータを付加する。オブジェクトに対して付ける余白の画素数はあらかじめ設定した画素数でおこなうこととする。例えば、5画素分の余白を付加するように設定を行っておく。余白は、オブジェクトの外側にある色を抽出して、例えば、色の平均値で余白を付加するようにする。余白を付加する色の決定方法は、前述したオブジェクトの外側の平均値を求める以外でも可能である。余白の色として、補間演算をもちいて、縦、横、それに斜めのグラデーションを求めてそれを余白とする方法もある。このほかの方法でも余白の色を抽出することが可能であることは示すまでもない。なお、このように矩形状のオブジェクトに対しては、メタデータとして、検索用のキーワードと、本来のオブジェクト本体よりも一回り大きい矩形状の位置情報とが付加されることになる。したがって、後に検索をおこなったとき、このオブジェクトがヒットすると、このオブジェクトより一回り大きい位置に、例えば、赤の枠線で表示されることになる。すなわち、矩形状のオブジェクト本体と検索結果の位置を示す枠線との間に隙間が生じ、分離して見えるので、ユーザにとっては視認性がよくなる。
[検索]
次に、MFP100から、BOX111に保存したデータをローカルPC102に送信して、ローカルPC102上で検索を行うことについて説明する。例えば、図3のフローで作成したデータがBOX111に保存した状態でのファイルフォーマットがPDFであった場合で説明を行う。ここでは、PDFフォーマットとしているが、OPENXMLやXPSなどのフォーマットでも構わない。PDFファイルがローカルPC102に送信して、ローカルPC上でPDFを扱えるビューワによって、PDFファイルを閲覧する。または、PDFファイルを検索した場合に、キーワードを入力し検索が行われる。ここで図15にビューワの例を示す。図15の1501はビューワである。検索を行う場合には1502に対してキーワード・語句を入力する。キーワードを入力し検索を行う一例を図16に示す。1601はビューワであり、検索を行う場合、キーワード入力欄1602において、キーワードを入力する。ここでは“あいうえお”というキーワード1603を入力した。
例えば、図12で示した画像がローカルPC102に送られていた場合、“あいうえお”というキーワードで検索すると、図12で示した画像が検索にヒットし、表示される。検索でヒットしたことが分かる表示の仕方の例を図17に示す。図3に示したフローで処理されたファイルの場合、“あいうえお”というキーワードで検索を行うと、図17においてオブジェクトとして1704と文字の領域1705があたったことを示すように、例えば、赤色の枠がつく。なお、この枠の表示は、同時に表示する形式でも、一つづつ順番に表示される形式でも構わない。ここでは、図3のフローで説明をしたオブジェクトに対してメタデータを付加していることによって、検索であたった場合に、それを示すものが表示される。すなわち、ここで示したのは検索してヒットした場合の表示の一つの例であるのでこれに限るものではない。
次に、先に示したものと同様に図3のフローを処理した図12で示した画像に対して、キーワードを“ABCDE"として検索を行った結果を図18に示す。図18においてオブジェクトとして1804と文字の領域1805がヒットした (検索キーワードにマッチした)ことを示すように枠がつく。これは、図3のフローで説明をしたオブジェクトに対してメタデータを付加していることによって、検索でヒットした場合に、それを示すものが表示される。図18の1804では、オブジェクト本体と枠との間に隙間があるので、ユーザにとって視認しやすいものになっている。
ここで、本発明のように、図3のステップ307のメタデータ付加の際に余白をつける処理をしていない場合に、検索を行うと、検索結果の表示例は図19のようになる。キーワードを”ABCDE"として検索した場合に、図18に示したのと同様にオブジェクトとして1904と文字の領域1905がヒットしたことを示すように枠がつく。ここで、図18に示したものとの大きな違いは、図19の1904は、オブジェクトに枠が付いていることの視認性が良くないことである。図18の1804ではオブジェクトと枠に隙間があるので、検索によりヒットしたことを視認しやすいが、図19では隙間がないのでユーザにとっては判別しにくい。これは図3のステップS307で説明をしたオブジェクトとオブジェクト切り出しの枠との接している面積に応じて余白を付けている効果があらわれているからである。つまり、図3のフローで処理を行ったファイルをローカルPC102で検索を行う場合に、検索した場合のあたったオブジェクトが何であるかの認識を容易にできるようになる。
以下、本発明を実施するための第2の形態について図面を用いて説明する。
第2の実施形態では、図3のフォローの処理を行うところで、メタデータ付加ステップS307で行う処理が異なる。よって、図1、図2などの装置構成や図3においてそれ以外のステップの処理は変わらないため説明は省略し、異なっている部分のみの説明を行う。
図3のメタデータ付加ステップS307の処理に関して図20のフローチャートを用いて説明を行う。図20のステップS2001では、オブジェクトが矩形かどうかの判定を行う。ステップS2001で切り出した矩形に対してオブジェクト自身が矩形かどうかの判定をステップS2001で行う。ここでオブジェクト自身が矩形かどうかの判定に関して説明を行う。図13に示したオブジェクトを切り出す領域(例えば1302)は切り出す矩形に対してオブジェクトが接している。この場合はステップS2001の判定は、オブジェクトは矩形であると判断される。図13のオブジェクト1304に関しては、切り出した枠に対してオブジェクト自身が接している部分がとても小さい。この場合はステップS2001の判定ではオブジェクトは矩形ではないと判断する。ここでオブジェクトが矩形かどうかの判断は、オブジェクトを切り出した矩形に対してオブジェクト自身がどれだけ接しているかを率で示し、その率に応じて矩形かそうでないかの判断を行う。この判断手法は、第1の実施形態と同様のものを用いればよい。
ステップS2001でオブジェクトは矩形でないと判断したらステップS2002でオブジェクトに対してメタデータを付加する。図13のオブジェクト1304に対しては矩形ではないと判断して、オブジェクトにメタデータを付加する。
ステップS2001でオブジェクトが矩形と判断したオブジェクトに対してオブジェクトの外輪郭の色を抽出し判定する処理をステップS2003で行う。具体的には図13のオブジェクト本体1302の外輪郭3画素分の色の平均値を求める。この平均値が予め設定した色と比較する。例えば、図13のオブジェクト1302の外輪郭の3画素分の色の平均値がR=100、G=150,B=50であった場合に、あらかじめ設定した数値が、R=<200andG=<200andB=<200これが全て満たされた場合には、ステップS2005に進むようにする。先に示した設定に対してみたされない場合には、ステップS2004でオブジェクトに対してメタデータを付加する。ここで例に示した比較は、色が濃いのか薄いのかというのを比較するための一つの例として示したものである。色の薄さに関して調べる方法は、RGBを色変換して輝度色差変換をして、輝度値がある値以上であれば薄いと判断をして、薄いものはステップS2004でオブジェクトにメタデータを付加する。輝度値が低いものに関しては、暗い色であると判断をしてステップS2005でオブジェクトに余白を付加してメタデータを付加する。
ステップS2005でオブジェクトに余白を付加してメタデータを付加する方法は、第1の実施の形態で説明した方法と同様である。オブジェクトに対して付ける余白の画素数はあらかじめ設定した画素数でおこなうことを可能にして、例えば、5画素分の余白を付加するように設定を行っておく。余白は、オブジェクトの外側にある色を抽出して、例えば、色の平均値で余白を付加するようにする。余白を付加する色の決定方法は、前述したオブジェクトの外側の平均値を求める以外でも可能である。余白の色として、補間演算をもちいて、縦、横、それに斜めのグラデーションを求めてそれを余白とする方法もある。このほかの方法でも余白の色を抽出することが可能であることは示すまでもない。
このようにすることにより、濃い色のオブジェクトに対しては、検索結果の枠との間に隙間が生じるので、ユーザにとって視認性がよくなる。また、薄い色のオブジェクトに対しては、検索結果の枠が接していたとしても(余白を付与しなくても)、視認性が確保される。
そして、第2の実施の形態で作成したファイルは第1の実施の形態で説明したPDFフォーマットなどにしたデータは、第1の実施の形態で説明したようにローカルPC102に送信されたファイルの検索を行うことが可能になる。これにより、検索した時のキーワードに対して、ヒットしたオブジェクトが何であるかの認識を容易にできる。
[その他の実施例]
以上、実施例を詳述したが、本発明は、例えば、システム、装置、方法、プログラム若しくは記憶媒体(記録媒体)等としての実施態様をとることが可能である。例えば、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。また、本発明は、電子回路などのハードウェアで構成するようにしてもよいし、コンピュータと制御プログラムとを用いてその一部または全部を制御するようにしてもよい。また、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリを利用する形態であってもよい。
また、コンピュータプログラムで本発明を実現する場合、該プログラム(実施形態のフローチャートに対応するプログラム)は、システムあるいは装置に対して、直接あるいは遠隔から供給される。そして、そのシステムあるいは装置のコンピュータが、当該供給されたプログラムコードを読み出して実行することによって本発明が実現される。したがって、該コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等の形態であっても良い。
また、コンピュータプログラムを供給するための方法として、例えば、磁気ディスク、光ディスク、光磁気ディスク、半導体メモリなど、様々なコンピュータ読み取り可能な記録媒体を用いることができる。
その他、プログラムの供給方法としては、コンピュータのブラウザ等を用いてインターネットからハードディスク等の記録媒体にダウンロードすることによっても供給できる。すなわち、インターネットから本発明のコンピュータプログラムそのもの、もしくは圧縮され自動インストール機能を含むファイルをダウンロードすることによっても供給できる。また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるサーバからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロード可能にしたサーバも、本発明に含まれるものである。
本発明に係る画像処理システムを示すブロック図である。 図1におけるMFPを示すブロック図である。 第1の実施の形態で説明するデータ処理フローである。 第1の実施の形態で説明するメタデータを抽出する処理フローである。 第1の実施の形態で説明するスキャナからの読み込みを示すフローである。 オブジェクト分割した結果の一例を示す。 オブジェクト分割情報したときの各属性のブロック情報および入力ファイル情報を示す。 文書構造ツリー生成処理の対象となる文書を示す図である。 図8の処理によって生成される文書構造ツリーを示す図である。 本実施例で説明するSVG(Scalable Vector Graphics)形式の一例である。 第1の実施の形態で説明するメタデータを付加する処理フローである。 第1の実施の形態で説明する画像データの1例を示す図である。 第1の実施の形態で説明する画像データを領域分割した結果を示す図である。 第1の実施の形態で説明するオブジェクトを切り出したものを示す図である。 第1の実施の形態で説明するビューワの一例を示す図である。 第1の実施の形態で説明するキーワードで検索するのを示した図である。 第1の実施の形態で説明する図12で示した画像をキーワードで検索した場合の表示の例を示している図である。 第1の実施の形態で説明する図12で示した画像を図17とは違うキーワードで検索した場合の表示の例を示している図である。 第1の実施の形態で説明する図3のステップS307を行わなかった時にキーワードで検索した場合の表示の例を示している図である。 第2の実施の形態で説明するデータ処理フローである。 第1実施例に係るベクトル化処理結果のデータを示すマップである アプリデータ変換の処理を示すフローチャートである。

Claims (8)

  1. 入力した画像に対して領域分割を行う領域分割手段と、
    領域分割結果のオブジェクトに対するメタデータを抽出するメタデータ抽出手段と、
    前記オブジェクトに対してメタデータを付加するメタデータ付加手段と、
    メタデータをつける際に、該オブジェクトの外接矩形の付け方を制御する制御手段と、
    を有することを特徴とする画像処理装置。
  2. メタデータを付加したときにオブジェクトが矩形であるか否かを判定する判定手段を更に有し、
    前記制御手段は、前記判定結果に応じて、該オブジェクトの外接矩形の付け方を制御することを特徴とする請求項1に記載の画像処理装置。
  3. 前記判定手段は、外接矩形にオブジェクトが接している割合を求める算出手段を含み、当該算出結果に基づいて該オブジェクトが矩形であるか否かを判定することを特徴とする請求項2に記載の画像処理装置。
  4. 前記制御手段は、オブジェクトの外側の色を抽出し、前記抽出した色に基づいてオブジェクトに対して余白を付けることを特徴とする請求項1〜請求項3のいずれかに記載の画像処理装置。
  5. メタデータを付加したときにオブジェクトが矩形であるか否かと、前記オブジェクトの外接部分の色とを判定する判定手段を更に有し、
    前記制御手段は、前記判定結果に応じて、該オブジェクトの外接矩形の付け方を制御することを特徴とする請求項1に記載の画像処理装置。
  6. 前記判定手段は、オブジェクトが矩形であると判定した場合に、当該オブジェクトの外接部分の色を判定することを特徴とする請求項5に記載の画像処理装置。
  7. 領域分割手段が、入力した画像に対して領域分割を行う領域分割ステップと、
    メタデータ抽出手段が、領域分割結果のオブジェクトに対するメタデータを抽出するメタデータ抽出ステップと、
    メタデータ付加手段が、前記オブジェクトに対してメタデータを付加するメタデータ付加ステップと、
    制御手段が、メタデータをつける際に、該オブジェクトの外接矩形の付け方を制御する制御ステップとを有することを特徴とする画像処理方法。
  8. コンピュータを、
    入力した画像に対して領域分割を行う領域分割手段、
    領域分割結果のオブジェクトに対するメタデータを抽出するメタデータ抽出手段、
    前記オブジェクトに対してメタデータを付加するメタデータ付加手段、
    メタデータをつける際に、該オブジェクトの外接矩形の付け方を制御する制御手段、
    として機能させるためのコンピュータ制御プログラム。
JP2008158219A 2008-06-17 2008-06-17 画像処理装置、画像処理方法及びコンピュータ制御プログラム Pending JP2009303149A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008158219A JP2009303149A (ja) 2008-06-17 2008-06-17 画像処理装置、画像処理方法及びコンピュータ制御プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008158219A JP2009303149A (ja) 2008-06-17 2008-06-17 画像処理装置、画像処理方法及びコンピュータ制御プログラム

Publications (1)

Publication Number Publication Date
JP2009303149A true JP2009303149A (ja) 2009-12-24

Family

ID=41549535

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008158219A Pending JP2009303149A (ja) 2008-06-17 2008-06-17 画像処理装置、画像処理方法及びコンピュータ制御プログラム

Country Status (1)

Country Link
JP (1) JP2009303149A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019125912A (ja) * 2018-01-16 2019-07-25 富士ゼロックス株式会社 色変換装置及びプログラム
JP2020177523A (ja) * 2019-04-19 2020-10-29 キヤノン株式会社 スキャン画像のプレビュー表示を行う画像処理装置、その制御方法及びプログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019125912A (ja) * 2018-01-16 2019-07-25 富士ゼロックス株式会社 色変換装置及びプログラム
JP7056161B2 (ja) 2018-01-16 2022-04-19 富士フイルムビジネスイノベーション株式会社 色変換装置及びプログラム
JP2020177523A (ja) * 2019-04-19 2020-10-29 キヤノン株式会社 スキャン画像のプレビュー表示を行う画像処理装置、その制御方法及びプログラム
JP7508199B2 (ja) 2019-04-19 2024-07-01 キヤノン株式会社 スキャン画像のプレビュー表示を行う画像処理装置、その制御方法及びプログラム

Similar Documents

Publication Publication Date Title
JP5111268B2 (ja) 画像処理装置、画像処理方法、そのプログラムおよび記憶媒体
US7551753B2 (en) Image processing apparatus and method therefor
JP4895340B2 (ja) 情報処理装置およびその方法
JP4546291B2 (ja) 画像処理装置およびその制御方法
JP4533273B2 (ja) 画像処理装置及び画像処理方法、プログラム
JP4533187B2 (ja) 画像処理装置およびその制御方法
JP2004265384A (ja) 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体
JP2006270418A (ja) 画像処理装置およびその方法
US20090274369A1 (en) Image processing device, image processing method, program, and storage medium
US20060217826A1 (en) Image processing apparatus and a method therefor
JP2009223509A (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JP2009032186A (ja) 画像処理装置、その制御方法、ならびにそのプログラムおよび記憶媒体
JP4261988B2 (ja) 画像処理装置及び方法
JP2006025129A (ja) 画像処理システム及び画像処理方法
JP2006023944A (ja) 画像処理システム及び画像処理方法
JP5188260B2 (ja) 画像処理装置、画像処理方法ならびにそのプログラムおよび記憶媒体
JP2009211554A (ja) 画像処理装置、画像処理方法、コンピュータプログラム、および記憶媒体
JP4179977B2 (ja) スタンプ処理装置、電子承認システム、プログラム、及び記録媒体
JP2009303149A (ja) 画像処理装置、画像処理方法及びコンピュータ制御プログラム
JP2005352777A (ja) 画像処理装置及びその制御方法、プログラム
JP4323856B2 (ja) 画像処理方法
JP2004334340A (ja) 画像処理方法及び装置
JP2005149210A (ja) 画像処理装置及びその制御方法、プログラム
JP2005174227A (ja) 画像処理装置及びその制御方法、プログラム
JP2007048057A (ja) 画像処理装置

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20100201

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20100630