JP2009075678A - 画像処理装置、画像処理方法、画像処理プログラム及び記憶媒体 - Google Patents

画像処理装置、画像処理方法、画像処理プログラム及び記憶媒体 Download PDF

Info

Publication number
JP2009075678A
JP2009075678A JP2007241588A JP2007241588A JP2009075678A JP 2009075678 A JP2009075678 A JP 2009075678A JP 2007241588 A JP2007241588 A JP 2007241588A JP 2007241588 A JP2007241588 A JP 2007241588A JP 2009075678 A JP2009075678 A JP 2009075678A
Authority
JP
Japan
Prior art keywords
image data
search key
data
processing apparatus
image processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007241588A
Other languages
English (en)
Inventor
Yoichiro Matsuno
陽一郎 松野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2007241588A priority Critical patent/JP2009075678A/ja
Publication of JP2009075678A publication Critical patent/JP2009075678A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】スキャンされた紙ドキュメントを画像データとして管理する際に、画像データに対して検索のための検索キー(タグ、属性等)を容易に付加することが可能な画像処理装置、画像処理方法、画像処理プログラム及び記憶媒体を提供すること。
【解決手段】検索対象の画像データを管理する画像処理装置1であって、前記画像データを入力する入力手段と、入力された前記画像データから、前記画像データの検索のために用いられる検索キーを生成する検索キー生成手段と、生成された前記検索キーを、前記画像データに付加する付加手段とを備えることを特徴とする画像処理装置1。
【選択図】図2

Description

本発明は、画像処理装置、画像処理方法、画像処理プログラム及び記憶媒体に関する。
近年、del.cio.usのようなソーシャルブックマークサービス、Flickrのようなソーシャル画像管理サービスなど、広く個人のブックマークや写真や画像などをWeb上で共有するサービスが提供され始めている。これらのサービスが扱うコンテンツは、ブックマークや写真画像などである。
ユーザはこれらのコンテンツを登録する時に自由にタグや属性をつけることができ、登録されたコンテンツの再利用を可能にする。また、係るソーシャルサービスの特徴として、他のユーザも自由にタグを追加・編集・削除することができる。この際、個々のユーザはそれぞれ独自のタグ付けを行うため、一つのコンテンツに対してさまざまなカテゴリ分類が行われることになる。このような分類はFolksonomyとよばれる。ユーザは、自身のコンテンツ管理だけでなく、他者へのアピールやグループ内での共有など、さまざまな用途に対して柔軟にタグをつけることができる。また、それぞれのユーザが自由に分類可能なため、別のユーザからは想定外のタグ付けも行われる可能性も高く、意外な新規発見がなされることもある。
ところで、Web上にはさまざまな情報があふれており、そのなかには質の高いものから低いものまで数多である。その中から、ユーザの関心ある情報を精度よく見つけ出すことは困難である。そもそもユーザにとって、本当に検索したいものに対して、検索キーワードを適切に選択することも容易ではない。そこで、興味が一致する人のBookmarkを参照したり、ドキュメントへのアノテーションを参照したりするということは、情報を精度良く取得するという点で理にかなっている。
一方、企業内においては、紙文書の電子化が進んでおり、グループウェアやコンテンツマネージメントシステム(CMS)によるデータやドキュメントの管理が行われている。毎年、膨大な量のドキュメントやデータが企業内のシステムには蓄積されつつあり、情報の検索や共有はより重要になりつつある。
特に知的業務においては、以前見かけたドキュメントを検索したり、所定のグループ内や別のグループとの間で情報共有と情報収集したり、企業内における新規情報を検索したり、さまざまな観点で情報を検索する必要がある。
これら様々な要求に対して、単なる検索だけでは十分ではなく、近々ソーシャルブックマークやソーシャル画像(ドキュメント)管理的なサービスが求められることが予想される。
例えば、特許文献1には、ユーザを特定し、スキャンサービスのセキュリティ性や利便性を高めることを目的としたスキャン装置に係る技術が開示されている。
特開2006−148869号公報
ところで、企業において蓄積された膨大な量のドキュメント等に対して上記のようにタグや属性をつけて管理するドキュメントソーシャル画像管理サービスを実現するためには、においては、スキャナによるドキュメントの電子化が考えられる。
しかしながら、従来のスキャナのGUI(Graphical User Interface)では、上記のドキュメントに対するタグ付や属性付けは容易ではなかった。つまり、スキャンされた紙ドキュメントを画像データとして管理する際に、画像データに対してタグや属性等の検索のための検索キーを容易に付加することができないという問題があった。
本発明は、上記の点に鑑みて、この問題を解決するために発明されたものであり、スキャンされた紙ドキュメントを画像データとして管理する際に、画像データに対して検索のための検索キー(タグ、属性等)を容易に付加することが可能な画像処理装置、画像処理方法、画像処理プログラム及び記憶媒体を提供することを目的とする。
上記の目的を達成するために、本発明における画像処理装置は、検索対象の画像データを管理する画像処理装置であって、前記画像データを入力する入力手段と、入力された前記画像データから、前記画像データの検索のために用いられる検索キーを生成する検索キー生成手段と、生成された前記検索キーを、前記画像データに付加する付加手段とを備えるように構成することができる。
また、上記の目的を達成するために、本発明における画像処理装置では、入力された前記画像データが複数のページデータ又は領域データから構成される場合、前記検索キー生成手段は、ページデータ又は領域データ単位で検索キーを生成し、前記付加手段は、ページデータ又は領域データ単位で生成された前記検索キーを、対応するページデータ又は領域データに付加するように構成することができる。
また、上記の目的を達成するために、本発明における画像処理装置は、入力された前記画像データのメタデータから、該画像データを識別する識別情報を生成する識別情報生成手段さらに有し、前記検索キー生成手段は、生成された前記識別情報に基づいて、前記検索キーを生成するように構成することができる。
また、上記の目的を達成するために、本発明における画像処理装置は、入力された前記画像データが文字領域を含む場合に該画像データから文字領域を抽出する文字領域抽出手段と、抽出された前記文字領域内の文字情報から、該画像データを識別する識別情報を生成する識別情報生成手段とをさらに有し、前記検索キー生成手段は、生成された前記識別情報に基づいて、前記検索キーを生成するように構成することができる。
また、上記の目的を達成するために、本発明における画像処理装置は、予め識別情報毎に設定された優先度を保持する識別情報優先度保持手段をさらに有し、前記検索キー生成手段は、抽出された前記識別情報の内の優先度の高い識別情報に基づいて、前記検索キーを生成するように構成することができる。
また、上記の目的を達成するために、本発明における前記検索キー生成手段は、抽出された前記識別情報が別の画像データに対するリンク情報を含む場合に、さらに、前記別の画像データのメタデータから抽出した識別情報に基づいて、前記検索キーを生成するように構成することができる。
また、上記の目的を達成するために、本発明における画像処理装置は、生成された前記検索キーから前記画像データに付加すべき検索キーの選択を促す選択手段をさらに備え、前記付加手段は、生成された前記検索キーの内の選択された検索キーを付加するように構成することができる。
また、上記の目的を達成するために、本発明における画像処理方法は、検索対象の画像データを管理する画像処理装置における画像処理方法であって、前記画像データを入力する入力工程と、入力された前記画像データから、前記画像データの検索のために用いられる検索キーを生成する検索キー生成工程と、生成された前記検索キーを、前記画像データに付加する付加工程とを備えるように構成することができる。
また、上記の目的を達成するために、本発明における画像処理プログラムは、コンピュータに、上記の画像処理装置の各手段に係る処理を実行させるように構成することができる。
また、上記の目的を達成するために、本発明における記録媒体は、上記の画像処理プログラムを記録したことを特徴とするコンピュータ読み取り可能な記録媒体であるように構成することができる。
本発明によれば、ススキャンされた紙ドキュメントを画像データとして管理する際に、画像データに対して検索のための検索キー(タグ、属性等)を容易に付加することが可能な画像処理装置、画像処理方法、画像処理プログラム及び記憶媒体を提供することができる。
以下、本発明を実施するための最良の形態について図面を参照して説明する。
[第1の実施形態]
以下、本発明の第1の実施形態について図1〜3を用いて説明を行う。なお、実施形態1では、本発明を画像処理装置の一形態としての一般的なコンピュータ装置に適用した場合を例に説明を行うが、この場合に限らないものとする。
(装置の構成)
図1は、本実施形態1に係る画像処理装置の構成の一例を示す図である。図1において、画像処理装置1は、アプリケーション部10、サーバ部20を有する構成であり、検索対象の画像データを管理している。
アプリケーション部10は、当該画像処理装置1上の基本ソフトウェア(OS(Operating System)等)上で動作するアプリケーションソフトウェアである。
サーバ部20は、検索対象の画像データを管理するためのハードディスク等のストレージ(外部記憶装置)21、画像データの検索に用いられる検索キー(例えばタグ情報)等を管理する検索キーストレージ22等の記憶装置を有する。サーバ部20における各データの管理方式は、例えばリレーショナルデータベースの管理方式が用いられるものとする。ネットワークを介して接続された非図示のクライアント装置から、キーワード等に基づく画像データの検索指示を受信し、受信した検索指示に基づき当該サーバ部20が管理する画像データから検索を行い、検索結果をクライアント装置に対して送信する。
以上に示される構成により、本実施形態1に係る画像処理装置1では、例えばアプリケーション部10で生成された検索対象の画像データ等はサーバ部20において管理される。
なお、図1では、同一の装置がアプリケーション部10、サーバ部20を有する構成になっているが、ネットワーク等を介して接続された異なる装置が有する構成になっていてもよい。例えば、アプリケーション部10がスキャナ機能、コピー機能等を兼ね備えたMFPにより実現され、サーバ部20がサーバ装置上で実現される構成である。この場合、MFPのスキャナによりスキャンされた画像データがサーバ部20において管理される。
また、ストレージ21は、サーバ部20の外部の任意のリポジトリであってもよい。特にオリジナルドキュメントは、URL(Uniform Resource Locator)やIDで指定される場合があり、必ずしも画像処理装置10内部に保存する必要はない。この場合、画像処理装置10はURL等のリンク情報等を管理する構成にすることもできる。
同様に、検索キーストレージ22は、サーバ部20の外部の任意のリポジトリであってもよい。また、ネットワーク等を介して当該画像処理装置1と接続された他の検索キー管理システムの格納部であってもよい。この場合、他の検索キー管理システムと連携することが可能になる。
さらに、画像処理装置1が画像データのキャッシュ情報を保持するかどうかについては、アプリケーション部10の処理性能等に依存する。もし、画像データが必要になった時点で、画像データに付加されたメタデータから動的に生成しても問題ないようであればキャッシュ情報の必要はないが、問題がある場合は、キャッシュ情報を作って格納することが可能である。
(装置構成例)
図2は、本実施形態1に係る画像処理装置の機能の構成例を示す図である。図2において、画像処理装置1は、アプリケーション部10、サーバ部20を有する。また、アプリケーション部10は、UI提供部110、画像データ入力部120、メタデータ生成部130、(画像等)登録要求部140、(画像等)取得要求部150を有する。さらに、サーバ部20は、登録要求制御部210、検索キー生成部220、記憶部230、取得要求制御部240を有する。
UI提供部(画像登録・取得指示部)110は、各種ユーザインタフェースを提供する機能部である。ここで提供するユーザインタフェースは、当該画像処理装置1に画像データを登録する登録指示若しくは当該画像処理装置1から画像データ等を取得する取得指示を行うためのユーザインタフェースである。例えば、非図示の操作パネル上に画像データの登録指示、取得指示を入力するための表示を行ったり、同操作パネル上でのユーザによる登録指示、取得指示を入力したりする。
画像データ入力部120は、UI提供部110における登録指示の入力に基づいて、画像データの入力を行う。例えばスキャナ等の画像読取装置で画像データを読み取ることにより行う。なお、入力される画像データは、当該アプリケーション部10で作成された画像データであってもよい。
メタデータ生成部130は、画像データ入力部120により入力された画像データに対して付加するメタデータを生成する。例えば画像データ入力部120による画像入力時のユーザ名や登録時刻、登録アプリケーション名などのシステムから取得可能な情報からメタデータを生成する。
(画像等)登録要求部140は、画像データ入力部120により入力された画像データ及びメタデータ生成部130により生成されたメタデータを基に、サーバ部20に対して登録を要求する旨(登録要求)を送信する。
(画像等)取得要求部150は、UI提供部110における画像データ等の取得指示に従って、サーバ部20に対して該当する画像データ等の取得を要求する旨(取得要求)を送信する。
登録要求制御部210は、アプリケーション部10から受信した画像データの登録要求に応じて、画像データ等の登録に係る各種制御を行う。なお、アプリケーション部10からURL等の画像データのリンク情報しか受信しない場合は、画像データを登録しなくてもよい。また、アプリケーション部10から受信した画像データに、後述の検索キー生成部220で生成された検索キーを付加する付加手段としての機能も有する。
検索キー生成部220は、登録要求制御部210が受信した画像データ及びメタデータから、当該画像データの検索のために用いられる例えばタグデータ(又はタグデータの候補)等の検索キーを生成する。検索キーは、単にランダムに選ぶ場合もあるし、所定のルールに従って決定する場合もある。
記憶部230は、各種データを記憶する。例えば図1のストレージ21、検索キーストレージ22等である。検索キー格納部232は、検索キー生成部220で生成された検索キーを格納する。メタデータ格納部234は、登録要求制御部210が受信したメタデータを格納する。画像データ格納部236は、登録要求制御部210が受信した画像データを格納する。なお、登録される検索キー、メタデータ、画像データは、例えばID情報等により互いに対応付けて登録されるものとする。
取得要求制御部240は、アプリケーション部10から受信した画像データ等の取得要求に応じて、記憶部230に記憶されたデータから該当するデータを取得し、取得したデータをアプリケーション部10に対して送信する。また、例えば後述の検索キー生成部220が複数の検索キーを生成した場合に、ユーザに検索キーの選択を促すための検索キーの候補一覧を送信するようにしてもよい。
以上の機能の構成により、本実施形態1に係る画像処理装置1では、例えばスキャナによる読み取り等により入力された画像データ等を、検索対象の画像データとしてサーバ部20に対して登録する。このとき、入力された画像データから該画像データの検索のために用いられる検索キーを生成して、生成した検索キーを画像データに付加して登録する。
(画像データ登録動作の例)
図3は、本実施形態1に係る画像データの登録動作の一例を示すフローチャートである。ここでは、画像処理装置1に対して画像データを登録する動作の一例について図2の各機能部を参照しながら説明する。
まず、画像処理装置1は、画像登録指示を受信する(S1)。ここでは、UI提供部110が、ユーザによる画像データの登録指示を入力する。さらに、画像データ入力部120は、該登録指示に基づいて登録対象の画像データを入力する。
続いてステップS2へ移って、画像処理装置1は、ステップS1における登録時の情報からメタデータを生成する(S2)。ここでは、メタデータ生成部130が、画像入力時のユーザ名や登録時刻、登録アプリケーション名などのシステムから取得可能な情報からメタデータを生成する。
ステップS3へ移って、画像処理装置1は、画像データ及びメタデータを登録要求する(S3)。ここでは、登録要求部140は、ステップS1で入力された画像データ及びステップS2で生成されたメタデータの登録を要求する旨をサーバ部20に対して送信する。また、登録要求制御部210は、該登録要求を受信する。
ステップS4へ移って、画像処理装置1は、検索キーを生成する(S4)。ここでは、検索キー生成部220は、登録要求制御部210が受信した画像データ及びメタデータから、タグデータ等の検索キーを生成する。例えば、メタデータから、所定のキーワード等の識別情報を抽出して(或いは生成して)、抽出した(或いは生成した)識別情報を検索キーとすることにより行う。
ステップS5へ移って、画像処理装置1は、画像データ及びメタデータを格納する(S5)。ここでは、登録要求制御部210は、記憶部230に画像データ及びメタデータを格納する。即ち、画像データ格納部236に対して画像データを、メタデータ格納部234に対してメタデータを格納する。
ステップS6へ移って、画像処理装置1は、検索キーを格納する(S6)。ここでは、登録要求制御部210は、ステップS4で生成された検索キーを検索キー格納部24に格納する。なお、ステップS5及びS6において格納する各データは互いに対応付けて格納されるものとする。これにより、例えば検索キーを用いた画像データの検索等が可能になる。
以上で示される処理により、本実施形態に係る画像処理装置1は、画像データを登録する動作を行う。これにより、画像データ等のドキュメント登録時にタグ付けが簡単になる。また、スキャン時や画像登録時にわざわざタグ付けをするのは面倒であったが、ユーザは特になにも入力する必要がない。とくに、スキャンデータの場合は、MFPのオペレーションパネルで文字を打つことは非常に面倒であるので便利になる。
[第2の実施形態]
以下、本発明の第2の実施形態について図4〜14を用いて説明を行う。前述した実施形態1に係る画像処理装置1は、ドキュメント単位で画像データの登録を行った。しかしながら、ドキュメント単位の情報提供では、ユーザにとって必要な情報としては粒度が大きすぎる問題もある。つまり、100ページの戦略書の中の一つの図が欲しいユーザに、戦略書自体を与えても時間の浪費になる。たとえば、たった一つの記事が必要な場合に膨大なブログのトップページのリンクを教えるようなものである。
ここでは、上記の点に鑑みて、ドキュメント全体に対して検索キーを付加するのではなく、ドキュメントを構成するページデータ又は領域データ単位に検索キーを付加する形態について説明を行う。これにより、ページデータ又は領域データ単位での検索が可能となり、ドキュメントに対する再利用性を高めることができる。
なお、実施形態2に係る画像処理装置の構成は、前述した実施形態1(図1参照)のそれと同様であるとしてここでは説明を省略する。
(装置構成例)
図4は、本実施形態2に係る画像処理装置の機能の構成例を示す図である。図4において、画像処理装置1は、アプリケーション部10、サーバ部20を有する。
図4に示すアプリケーション部10は、前述した実施形態1に係るアプリケーション部10(図2参照)と同様であるとしてここでは説明を省略する。また、図4に示す第一のメタデータ生成部130は図2のメタデータ生成部130と同一の機能部であり、後述の第二のメタデータ生成部250と識別するためにここでは「第一の」としている。
サーバ部20は、前述した実施形態1(図2参照)に加えて、さらに、第二のメタデータ生成部250(領域識別部252、文字認識部254を含む)、構造的重み作成部260、識別情報生成部270、ページデータ・領域データ生成部280、ページデータ・領域データキャッシュ部238を有する。ここでは、前述した実施形態1と相違する各機能部について中心に説明を行う。
登録要求制御部210は、ここでは、実施形態1に加えてさらに、アプリケーション部10から受信した画像データ等の登録に係る各種制御を、後述の第二のメタデータ生成部250(特に領域識別部252)で識別したページデータ又は領域データ単位に行う。同様に、後述の検索キー生成部220でページデータ又は領域データ単位に生成された検索キーを、該当するページデータ又は領域データに付加する付加手段としての機能も有する。
検索キー生成部220は、登録要求制御部210が受信したメタデータから、当該画像データの検索のために用いられる例えばタグデータ(又はタグデータの候補)等の検索キーを生成する。ここでは、実施形態1に加えてさらに、登録要求制御部210が受信した画像データに基づき後述の第二のメタデータ生成部250で生成したメタデータを基に、該当するページデータ又は領域データに付加すべき検索キーを生成する。生成された検索キーは、ページデータ又は領域データ単位で検索キー格納部232に格納される。
第二のメタデータ生成部250は、登録要求制御部210が受信した画像データを、後述の領域識別部252、文字認識部254で識別したページデータ又は領域データ単位のメタデータを生成する。ここで生成されるメタデータとは、例えば画像データをページデータ又は領域データに分割した際の分割されたデータに含まれる文字情報などである。
領域識別部252は、画像データを領域識別する。画像データが複数のページデータ又は領域データから構成される場合に複数のページデータに分割したり、各ページを領域分割したりする処理を行う。文字認識部254は、領域識別部252により識別された領域データに格納された文字情報を認識する。認識された文字情報は、該文字情報を有するページデータ又は領域データのメタデータとなる。
識別情報生成部270は、登録要求制御部210が受信したメタデータから、該画像データを識別する識別情報を生成する。識別情報とは、画像データを識別するための例えばキーワード等の情報である。なお、画像データの画像特徴を識別情報としてもよい。また、登録要求制御部210が受信した画像データが文字領域を含む場合には文字領域内の文字情報から、該画像データを識別する識別情報を生成する。
ページデータ・領域データ生成部280は、領域識別部252によって識別されたページデータ又は領域データを、ページ画像データ又は領域画像データとして切り出す。ページデータ・領域データキャッシュ部238は、ページデータ・領域データ生成部280により切り出された(生成された)ページ画像データ又は領域画像データを格納する。
以上の機能の構成により、本実施形態2に係る画像処理装置1では、実施形態1に加えて、入力された画像データが複数のページデータ又は領域データから構成される場合に、画像データと共に入力されたメタデータ(以降、「第一のメタデータ」という)と該画像データを基にページデータ又は領域データ単位に生成したメタデータ(以降、「第二のメタデータ」という)を基に、検索キーを生成する。続いて、生成した検索キーを該当する画像データ、ページデータ又は領域データに付加して登録する。
これにより、ドキュメントを登録する際に、大量にページがあるものや大量の図や表がある場合がある。あとで、タグを手がかりにドキュメントを探し当てたとして、その後欲しい領域やページをどのドキュメントの中から探し当てる必要がある。そこで、登録時にあらかじめページデータ毎、領域データ毎に検索キー(タグ等)を付加して登録することで、検索時に欲しいページや領域がダイレクトにユーザに見つけることができる。
(画像データ登録動作の例)
図5は、本実施形態2に係る画像処理装置の画像登録の一例を示すフローチャートである。ここでは、画像処理装置1に対して画像データを登録する動作の一例について図4の各機能部を参照しながら説明する。なお、登録する画像データは、複数のページデータ又は領域データから構成されるものとして説明を行う。
まず、画像処理装置1は、画像登録指示を受信する(S11)。ここでは、UI提供部110が、ユーザによる画像データの登録指示を入力する。さらに、画像データ入力部120は、該登録指示に基づいて登録対象の画像データを入力する。
続いてステップS12へ移って、画像処理装置1は、ステップS11における登録時の情報から第一のメタデータを生成する(S12)。ここでは、第一のメタデータ生成部130が、画像入力時のユーザ名や登録時刻、登録アプリケーション名などのシステムから取得可能な情報から第一のメタデータを生成する。
ステップS13へ移って、画像処理装置1は、画像データ及び第一のメタデータを登録要求する(S13)。ここでは、登録要求部140は、ステップS11で入力された画像データ及びステップS12で生成された第一のメタデータの登録を要求する旨をサーバ部20に対して送信する。また、登録要求制御部210は、該登録要求を受信する。
ステップS14へ移って、画像処理装置1は、画像データから第二のメタデータを生成する(S14)。ここでは、第二のメタデータ生成部250は、登録要求制御部210が受信した画像データから第二のメタデータを生成する。図6を用いてより詳細に後述する。
図6は、ページデータ又は領域データ単位のメタデータ生成に係る処理の一例を示すフローチャートである。ここでは、図5のステップS14に係る処理についてより詳細に説明する。
まず、画像処理装置1は、画像データのファイル形式(データ形式)に依存したメタデータを生成する(S21)。ここでは、第二のメタデータ生成部250は、登録要求制御部210が受信した画像データからファイル形式(データ形式)に依存したメタデータを生成する。ファイル形式(データ形式)に依存したメタデータとは、例えば、ファイル形式に係る情報である。
ステップS22へ移って、画像処理装置1は、画像データのページ分割を行う(S22)。ここでは、第二のメタデータ生成部250は、登録要求制御部210が受信した画像データを複数のページデータに分割する処理を行う。
続いてステップS23へ移って、画像処理装置1は、ステップS22で分割された各々のページデータに対して、ステップS24〜27に係る処理(メタデータを生成する処理)を繰り返す(S23)。これにより、ページデータ単位のメタデータが生成される。
ステップS24へ移った場合、画像処理装置1は、領域識別を行う(S24)。ここでは、領域識別部252は、処理対象のページデータにおける領域の座標を取得したり、例えばタイトル、キャプション、写真、表、図、セパレータなどの領域のタイプを取得したりすることにより行う。
ステップS25へ移って、画像処理装置1は、ステップS24で領域識別された各々の領域データに対して、ステップS26に係る処理(メタデータを生成する処理)を繰り返す(S25)。これにより、領域データ単位のメタデータが生成される。
ステップS26へ移って、画像処理装置1は、ページデータ又は領域データ単位のメタデータを生成する(S26)。ステップS26では、まず、文字認識部254がステップS24で領域識別された領域データ内にテキスト領域があるか否かを判定する。テキスト領域がある場合には、OCR(Optical Character Recognition)等によりテキストを抽出する。抽出されるテキストを抽出元の領域データ及び抽出元の領域データが属するページデータのメタデータとする。このようにして、ページデータ又は領域データ単位のメタデータを生成する。なお、テキスト領域がない場合には、ここでは何も処理を行わずに、ステップS25へ戻って次の領域データに対して再度処理を行う。
ステップS22〜S28に係る処理が終了すると、ステップS29へ移って、画像処理装置1は、図5のステップS13に係る処理により画像データと共に送られてきた第一のメタデータを分析する(S29)。
続いてステップS30へ移って、画像処理装置1は、ステップS21で抽出したファイル形式に依存したメタデータを分析する(S30)。
ステップS31へ移って、画像処理装置1は、ステップS22〜S26に係る処理により生成されたページデータ又は領域データ単位のメタデータを分析する(S31)。
続いてステップS32へ移って、画像処理装置1は、メタデータを統合する(S32)。ここでは、ステップS29〜S31に係るメタデータの分析後、メタデータを統合する(生成する)。このようにして統合されたメタデータの例について図7、8、9を用いて説明する。
図7はドキュメント単位のメタデータの一例を示す図である。図7に示すメタデータは、ID、作成日、最終更新日、作成者、最終更新者、ドキュメントのタイトル、オリジナル文書リンク、文書のタイプ、有効領域数、全ページ数、ページのメタデータのID一覧、テキスト、アクセス権、キャッシュされたプレビュー画像、キャッシュされたサムネイル画像等を含んでいる。
図8は、ページ単位のメタデータの一例を示す図である。図8に示すメタデータは、ID、作成日、最終更新日、作成者、最終更新者、ページのタイトル、オリジナル文書リンク、ページのタイプ、領域数、領域の座標、領域のメタデータのID一覧、アクセス権、ページテキスト、キャッシュされたプレビュー画像、キャッシュされたサムネイル画像等を含んでいる。
図9は、領域単位のメタデータの一例を示す図である。図9に示すメタデータは、ID、作成日、最終更新日、作成者、最終更新者、タイトル、オリジナル文書リンク、領域のタイプ、属するページへのリンク、テキスト、周辺テキスト、アクセス権、キャッシュされたプレビュー画像、キャッシュされたサムネイル画像等を含んでいる。
以上で示される処理により、本実施形態に係る画像処理装置1は、画像データが複数のページデータ又は領域データにより構成される場合にメタデータを生成する処理を行う。
図5に戻り、ステップS15へ移って、画像処理装置1は、検索キーを生成する(S15)。ここでは、検索キー生成部220は、図6のステップS33により統合されたメタデータから、検索キーを生成する。図10を用いてより詳細に後述する。
図10は、ページデータ又は領域データ単位の検索キーの生成に係る処理の一例を示すフローチャートである。ここでは、図5のステップS15に係る処理についてより詳細に説明する。
まず、画像処理装置1は、図5のステップS14で生成された第二のメタデータの要素(図7、8、9等参照)毎に属性はテキストであるか否かを判定する(S41)。ここでは、検索キー生成部220は、属性はテキストであるか否かを判定する。
ステップS41において、属性はテキストである場合(S41、YES)、ステップS42へ移る。ステップS41において、属性はテキストでない場合(S41、NO)、ステップS47へ移る。
ステップS42へ移った場合、画像処理装置1は、ドキュメント全体(ページデータ又は領域データ)の識別情報を生成する(S42)。ここでは、識別情報生成部270は、ドキュメント全体(ページデータ全体又は領域データ)を識別する識別情報(例えばキーワード)を生成する。識別情報がキーワードである場合を例にとって以下に補足する。
ステップS42では、ステップS41に係る属性判定の対象が図7のドキュメント全体のメタデータにおける「テキスト」である場合には、ドキュメントのテキスト(図7では「本仕様書はXXについて述べたもの・・・」)からキーワード抽出することにより行う。また、ハイパーリンクを含む場合には、リンク先も走査してテキストからキーワード抽出することにより行う。ドキュメントには、ハイパーリンク情報が含まれる場合がある。スキャン時等のドキュメント登録時に、OCR等の技術を利用してハイパーリンクを取得することが可能である。ハイパーリンク先は、リンク元が参照している情報であり、何らかの関連がある可能性が高い。検索キーの候補として、ハイパーリンク先の文書等のキーワードを識別情報とすることで、後の検索性能を高めることができる。
また、例えばステップS41の属性判定の対象が図8のページデータ単位のメタデータにおける「テキスト」である場合には、当該ページデータが属するドキュメントからキーワード抽出をするに加えて、ページデータのテキスト(図8では「であり、この仕様では定義品・・・」)からキーワード抽出することにより行う。また、隣接するページデータのテキストからキーワード抽出することにより行ってもよい。このとき、隣接の程度に応じて重みづけするようにすることができる。さらに、ハイパーリンクを含む場合には、リンク先も走査してテキストからキーワード抽出することにより行うこともできる。
さらに、例えばステップS41の属性判定の対象が図9の領域データ単位のメタデータの「テキスト」である場合には、当該領域データが属するページデータ並びに当該領域データが属するドキュメントからキーワード抽出をするに加えて、領域データのテキスト(図9では「図13:性能特性図」等)からキーワード抽出することにより行う。また、近傍の領域データのテキストからキーワード抽出することにより行ってもよい。また、図やキャプションなどは重みづけを高くすることもできる。これは、図のキャプションや、写真の周りにある解説文書などのように、ある領域の近くにあるなど、レイアウト的に関係の深い領域同士のテキストには関連性が高く、領域データ内のテキストから抽出したキーワードについで良い検索キーとなる可能性が高いためである。レイアウト情報を解析し、領域間の関連度スコアを計算しておき、関連度の高い領域のキーワードも検索キー決定もしくはタグ候補に入れることで、後の検索性能を高めることができる。
以上のステップS42に係る処理により識別情報が生成されると、続いてステップS43へ移って、画像処理装置1は、領域が図表の場合は、キャプションなどの意味的構造も含めて距離重み作成する(S43)。
続いてステップS44へ移って、画像処理装置1は、ドキュメント全体(ページ全体又は領域)のキーワードランキングを作成する(S44)。
続いてステップS45へ移って、画像処理装置1は、キーワードランキング上位から検索キーを生成する(S45)。
以上のようなステップS44〜S45に係る処理により、予めステップS44で作成された、識別情報毎に設定されたランキング(つまり優先度)の高い識別情報に基づいて、検索キーを生成することができる。
ステップS46へ移った場合、属性はテキストではないため、画像処理装置1は、ドキュメント全体(ページ全体又は領域)の属性(テキスト属性を除く)毎に検索キーを生成する(S46)。
さらにステップS47へ移って、画像処理装置1は、検索キー(又は検索キー候補)をマージする(S47)。
図5に戻り、ステップS16へ移って、画像処理装置1は、ページデータ・領域データを生成する(S16)。ここでは、ページデータ・領域データ生成部280は、ページデータ・領域データを生成する。
ステップS17へ移って、画像処理装置1は、画像データ、ページデータ・領域データ、メタデータを格納する(S17)。ここでは、登録要求制御部210は、画像データ格納部236に対して画像データを、ページデータ・領域データキャッシュ部238に対してページデータ・領域データのキャッシュデータを、メタデータ格納部234に対してメタデータを格納する格納する。なお、ステップS17において格納される各データは互いに対応付けられるものとする。
ステップS18へ移って、画像処理装置1は、検索キーを格納する(S18)。ここでは、登録要求制御部210は、検索キー格納部232に検索キーを格納する。なお、ステップS18において格納される検索キーは、ステップS17において格納される各データと互いに対応付けられるものとする。これにより、例えば検索キーを用いた画像データの検索等が可能になる。
以上で示される処理により、本実施形態2に係る画像処理装置1では、画像データを登録する動作を行う。これにより、前述した実施形態1における利点に加えて、ページデータ又は領域データ単位での検索が可能となり、ドキュメントに対する再利用性を高めることができる。図11は、検索キーが付加された画像データの例を示す図である。ドキュメント登録後に画像とその画像についた複数の検索キーが表示されている図である。
なお、ステップS17及びS18に係る処理により格納される各データのデータ構造について以下に補足する。
図12は、ステップS18で格納される検索キーのデータ構造の例を示す図である。検索キーは、図12(a)の表に示されるように検索キーを識別する検索キーID(識別番号)及び属性を付加して管理される。
図12(a)において、検索キーIDは、検索キーと検索キーが付加された画像データ等とを対応付けるために用いられる。例えば図11(b)の表に示されるように、検索キー識別番号IDと該検索キーを有する画像データ等の識別番号(ID)が対応付けられて格納される。このように検索キーと画像データ等とが対応付けられることにより、検索キーを用いた画像データ、ページデータ又は領域データの検索を容易に行うことができる。なお、検索キーを有しない画像データや画像データを有しない検索キーが存在してもよいものとする。
図12(b)において、属性は、属性付きの検索キーを画像データに対して付加するために用いられる。これにより、セマンティックなWebとの相性がよくなり、将来的にFolksonomyだけでなく意味的関連づけも可能になる。検索キー生成時に属性をつけることで、ユーザが検索キーを選択する際に属性による絞込みを行うこともできる。図13は、属性(ここでは、タイトル)による検索キーの絞込みが行われた様子を示す。
以上にステップS17及びS18に係る処理により格納される各データのデータ構造について補足を行った。
(画像データ登録動作の変形例)
続いて、前述した画像データ登録動作の変形例について説明を行う。前述した画像データ登録動作において、図10のステップS45に係る処理では、画像処理装置1は、キーワードランキング上位から検索キーを生成した。
しかしながら、システム側で自動的に生成する検索キーを決定すると、抽出された識別情報(又は検索キーの候補)が複数有る場合にはユーザの意図にあった検索キーを付加することができないという問題が考えられる。
そのため、ある程度候補を絞った検索キー候補から付加すべき検索キーの選択をユーザに提示する選択手段を備えるようにすることもできる。ユーザはその中から意図にあった検索キーを選択し、選択された検索キーを付加するようにすることにより、ユーザの意図にあった検索キーを自由に付加することができるようになる。
図14は、重みに応じた検索キー候補の表示例を示す図である。ドキュメントのスキャンもしくは、ドキュメント登録時にシステム側で生成されたタグ候補を表示した例である。優先度(重要度)の高い検索キーが強調表示されている。
その他にも、さまざまな方法で検索キー候補を選択することができるが、場合によっては大量の検索キー候補が生成されてしまい、ユーザが容易に選べない場合がある。その補助機能として、識別情報の重要度から計算した検索キーの重みをユーザインタフェースに反映して、重要な複数の検索キー候補をランキング順に並べたり、重要な順に強調したりすることでユーザの検索キー選択を補助することができる。
このように、ユーザが半自動的に登録対象の画像データに対して検索キーを付加するような仕組みを提供する。また、ドキュメント全体に対して検索キーを付加するのではなく、そのページやページを構成する要素ごとに検索キーを付加することにより、要素単位での検索を可能としドキュメントに対する再利用性を高めることができる。
以上、実施形態に基づき本発明の説明を行ってきたが、上記実施形態にあげたその他の要素との組み合わせなど、ここで示した要件に本発明が限定されるものではない。これらの点に関しては、本発明の主旨をそこなわない範囲で変更することが可能であり、その応用形態に応じて適切に定めることができる。
本実施形態1に係る画像処理装置の構成の一例を示す図である。 本実施形態1に係る画像処理装置の機能の構成例を示す図である。 本実施形態1に係る画像データの登録動作の一例を示すフローチャートである。 本実施形態2に係る画像処理装置の機能の構成例を示す図である。 本実施形態2に係る画像データの登録動作の一例を示すフローチャートである。 ページデータ又は領域データ単位のメタデータ生成に係る処理の一例を示すフローチャートである。 ドキュメント単位のメタデータの一例である。 ページデータ単位のメタデータの一例である。 領域データ単位のメタデータの一例である。 ページデータ又は領域データ単位の検索キーの生成に係る処理の一例を示すフローチャートである。 検索キーが付加された画像データの例を示す図である。 検索キーのデータ構造の例を示す図である。 属性による絞り込みを説明するための図である。 重みに応じた検索キー候補の表示例を示す図である。
符号の説明
1 画像処理装置
10 アプリケーション部
20 サーバ部
110 UI提供部
120 画像データ入力部
130 メタデータ生成部
140 (画像等)登録要求部
150 (画像等)取得要求部
210 登録要求制御部
220 検索キー生成部
230 記憶部
232 検索キー格納部
234 メタデータ格納部
236 画像データ格納部
238 ページデータ・領域データキャッシュ部
240 取得要求制御部
250 識別情報生成部
252 領域識別部
254 文字認識部
260 構造的重み作成部
270 識別情報生成部
280 ページデータ・領域データ生成部

Claims (10)

  1. 検索対象の画像データを管理する画像処理装置であって、
    前記画像データを入力する入力手段と、
    入力された前記画像データから、前記画像データの検索のために用いられる検索キーを生成する検索キー生成手段と、
    生成された前記検索キーを、前記画像データに付加する付加手段と、
    を備えることを特徴とする画像処理装置。
  2. 入力された前記画像データが複数のページデータ又は領域データから構成される場合、
    前記検索キー生成手段は、ページデータ又は領域データ単位で検索キーを生成し、
    前記付加手段は、ページデータ又は領域データ単位で生成された前記検索キーを、対応するページデータ又は領域データに付加することを特徴とする請求項1に記載の画像処理装置。
  3. 入力された前記画像データのメタデータから、該画像データを識別する識別情報を生成する識別情報生成手段をさらに有し、
    前記検索キー生成手段は、生成された前記識別情報に基づいて、前記検索キーを生成することを特徴とする請求項1又は2に記載の画像処理装置。
  4. 入力された前記画像データが文字領域を含む場合に該画像データから文字領域を抽出する文字領域抽出手段と、抽出された前記文字領域内の文字情報から、該画像データを識別する識別情報を生成する識別情報生成手段とをさらに有し、
    前記検索キー生成手段は、生成された前記識別情報に基づいて、前記検索キーを生成することを特徴とする請求項1又は2に記載の画像処理装置。
  5. 予め識別情報毎に設定された優先度を保持する識別情報優先度保持手段をさらに有し、
    前記検索キー生成手段は、生成された前記識別情報の内の優先度の高い識別情報に基づいて、前記検索キーを生成することを特徴とする請求項3又は4に記載の画像処理装置。
  6. 前記検索キー生成手段は、生成された前記識別情報が別の画像データに対するリンク情報を含む場合に、さらに、前記別の画像データのメタデータから抽出した識別情報に基づいて、前記検索キーを生成することを特徴とする請求項3乃至5のいずれか一項に記載の情報処理装置。
  7. 生成された前記検索キーから前記画像データに付加すべき検索キーの選択を促す選択手段をさらに備え、
    前記付加手段は、生成された前記検索キーの内の選択された検索キーを付加することを特徴とする請求項1乃至6のいずれか一項に記載の情報処理装置。
  8. 検索対象の画像データを管理する画像処理装置における画像処理方法であって、
    前記画像データを入力する入力工程と、
    入力された前記画像データから、前記画像データの検索のために用いられる検索キーを生成する検索キー生成工程と、
    生成された前記検索キーを、前記画像データに付加する付加工程と、
    を備えることを特徴とする画像処理方法。
  9. コンピュータに、請求項1乃至7のいずれか一項に記載の画像処理装置の各手段に係る処理を実行させることを特徴とする画像処理プログラム。
  10. 請求項9に記載の画像処理プログラムを記録したことを特徴とするコンピュータ読み取り可能な記録媒体。
JP2007241588A 2007-09-18 2007-09-18 画像処理装置、画像処理方法、画像処理プログラム及び記憶媒体 Pending JP2009075678A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007241588A JP2009075678A (ja) 2007-09-18 2007-09-18 画像処理装置、画像処理方法、画像処理プログラム及び記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007241588A JP2009075678A (ja) 2007-09-18 2007-09-18 画像処理装置、画像処理方法、画像処理プログラム及び記憶媒体

Publications (1)

Publication Number Publication Date
JP2009075678A true JP2009075678A (ja) 2009-04-09

Family

ID=40610613

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007241588A Pending JP2009075678A (ja) 2007-09-18 2007-09-18 画像処理装置、画像処理方法、画像処理プログラム及び記憶媒体

Country Status (1)

Country Link
JP (1) JP2009075678A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011070540A (ja) * 2009-09-28 2011-04-07 Sharp Corp 画像ファリング装置、この装置の制御方法、及び画像ファイリングプログラム、並びに画像ファイリングサーバ
WO2015004740A1 (ja) * 2013-07-10 2015-01-15 株式会社メディアシーク コンテンツ提供システム、コンテンツ提供装置、コンテンツ閲覧端末及びコンテンツ閲覧用プログラム
CN104981802A (zh) * 2013-02-27 2015-10-14 日立数据系统有限公司 针对对象存储器索引系统的内容类别
JP2015204015A (ja) * 2014-04-15 2015-11-16 コニカミノルタ株式会社 電子文書生成システム、画像形成装置、通信端末およびプログラム
JP2018014141A (ja) * 2017-10-25 2018-01-25 株式会社リコー システム、画像共有システム、通信方法、及びプログラム

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011070540A (ja) * 2009-09-28 2011-04-07 Sharp Corp 画像ファリング装置、この装置の制御方法、及び画像ファイリングプログラム、並びに画像ファイリングサーバ
CN104981802A (zh) * 2013-02-27 2015-10-14 日立数据系统有限公司 针对对象存储器索引系统的内容类别
JP2016512634A (ja) * 2013-02-27 2016-04-28 ヒタチ データ システムズ コーポレーションHitachi Data Systems Corporation オブジェクトストレージインデキシングシステムのためのコンテンツクラス
US9639564B2 (en) 2013-02-27 2017-05-02 Hitachi Data Systems Corporation Content class for object storage indexing system
US9965502B2 (en) 2013-02-27 2018-05-08 Hitachi Vantara Corporation Content class for object storage indexing system
US10817489B2 (en) 2013-02-27 2020-10-27 Hitachi Vantara Llc Content class for object storage indexing system
WO2015004740A1 (ja) * 2013-07-10 2015-01-15 株式会社メディアシーク コンテンツ提供システム、コンテンツ提供装置、コンテンツ閲覧端末及びコンテンツ閲覧用プログラム
JP2015204015A (ja) * 2014-04-15 2015-11-16 コニカミノルタ株式会社 電子文書生成システム、画像形成装置、通信端末およびプログラム
JP2018014141A (ja) * 2017-10-25 2018-01-25 株式会社リコー システム、画像共有システム、通信方法、及びプログラム

Similar Documents

Publication Publication Date Title
US8285082B2 (en) Automatic identification of digital content related to a block of text, such as a blog entry
US8244037B2 (en) Image-based data management method and system
US8584009B2 (en) Automatically propagating changes in document access rights for subordinate document components to superordinate document components
US20050232484A1 (en) Image processing device, image processing method, and storage medium storing program therefor
US20090183115A1 (en) Document searching apparatus, document searching method, and computer-readable recording medium
JP2004304803A (ja) マルチメディア書類を構成する方法及び装置
JP2006120125A (ja) ドキュメント画像情報管理装置及びドキュメント画像情報管理プログラム
JP2010072842A (ja) 画像処理装置および画像処理方法
CN101611406A (zh) 文档存档系统
JP2006244071A (ja) 情報提供方法、ポータルサイトシステム、及びプログラム
JP2006163842A (ja) 検索システム、情報処理装置及びその制御方法、プログラム
JP2009075678A (ja) 画像処理装置、画像処理方法、画像処理プログラム及び記憶媒体
JP2009086858A (ja) コンテンツ検索装置、コンテンツ検索方法、プログラムおよび記録媒体
JP2008269069A (ja) 情報処理システム及び情報処理方法
JP2011128833A (ja) 文書検索装置、プログラム、文書登録装置、および文書検索システム
KR100719514B1 (ko) 파일 정리/검색 방법, 시스템 및 이를 위한 기록매체
JP6140835B2 (ja) 情報検索システムおよび情報検索方法
JP2014186379A (ja) アノテーション検索装置、方法、及びプログラム
JP2000020549A (ja) 文書データベースシステムへの入力支援装置
JP2008287606A (ja) 情報処理装置およびプログラム
JP5082974B2 (ja) 画像生成装置及びプログラム
JP2006171891A (ja) 画像管理装置、画像管理方法、および画像管理プログラム
JP2009110506A (ja) 情報処理装置及び情報処理プログラム
JP2007028582A (ja) 文書管理システム、文書管理方法、文書管理プログラム
JP4879866B2 (ja) 画像生成装置、画像生成方法