JP4952079B2 - 画像処理装置、方法及びプログラム - Google Patents

画像処理装置、方法及びプログラム Download PDF

Info

Publication number
JP4952079B2
JP4952079B2 JP2006166407A JP2006166407A JP4952079B2 JP 4952079 B2 JP4952079 B2 JP 4952079B2 JP 2006166407 A JP2006166407 A JP 2006166407A JP 2006166407 A JP2006166407 A JP 2006166407A JP 4952079 B2 JP4952079 B2 JP 4952079B2
Authority
JP
Japan
Prior art keywords
image
keyword
unit
data
detected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006166407A
Other languages
English (en)
Other versions
JP2007334670A (ja
Inventor
健太郎 高野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2006166407A priority Critical patent/JP4952079B2/ja
Publication of JP2007334670A publication Critical patent/JP2007334670A/ja
Application granted granted Critical
Publication of JP4952079B2 publication Critical patent/JP4952079B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、データベースに登録されたデータから所望とする資料を簡単に選択するための技術に関する。
近年、オフィス等で保有する資料をデータベースに登録して管理するために、ドキュメント・マネージメント・システム(DMS)等の資料処理装置が普及しており、大量の電子化された資料が登録されている。
またデータベースからオフィス内の個々の情報処理端末に、ネットワークを通じて大量の資料をダウンロードできるようにもなっている。さらに、資料検索機能の向上により、大量の資料からユーザの要求に適合しそうな幾つかの資料を候補として抽出し、表示できるようにもなっている。
そこで、このような候補として表示された資料の内容を短時間で正確に把握する技術も必要となってきている。例えば、キャノン株式会社製の「c−cabinet」(以下、従来製品という)では、サーバ装置に登録した資料のサムネイルとリストを組み合わせた複合表示が可能となっている。
また、特許文献1では、異なる資料ファイルの内容が簡単に分かるように、それぞれの資料ファイルの内容を分割表示領域に表示している。各分割表示領域には、それぞれ個別のスクロールバーが付されており、これらスクロールバーによって各分割表示領域に表示する資料ファイルの内容をスクロール表示できるようにしている。
特開2001−22734号公報
しかしながら、上記従来製品では、画像のサムネイル表示が可能であるが、表示する資料がもともと図や表のない、又は少ない資料であった場合、サムネイル画像では資料内容の把握が簡単ではない。
また、特許文献1は、テキストによる情報提示技術のため、例えばパワーポイント等の図や表を含むドキュメントの表示には対応できない。
本発明は上記事情に鑑みてなされたものであり、所望の資料を迅速、且つ正確に見つけ出すことができる画像処理装置、方法及びプログラムを提供することを目的とする。
かかる目的を達成するために本発明の画像処理装置は、資料データの画像領域を特定して画像を抽出する画像抽出手段と、前記資料データから当該資料データの特徴を表すキーワードを検出する検出手段と、前記検出手段が検出したキーワードに基づいてデータベースを検索し、前記キーワードに関連付けされた画像を取得する画像取得手段と、前記画像抽出手段と前記画像取得手段とから画像を取得し、取得した画像の所定領域を部分画像として切り出す切出手段と、前記切出手段が切り出した前記部分画像を一覧表示したサマリー画像を生成する画像生成手段とを有し、前記切出手段は、前記検出手段が検出したキーワードが人名であると判定した場合、前記画像抽出手段又は前記画像取得手段から取得した画像から、エッジ検出又は目の位置検出により顔画像を検出して、該検出した顔画像を前記部分画像として切り出し、又、前記検出手段が検出したキーワードが人名ではないと判定した場合、前記画像抽出手段又は前記画像取得手段から取得した画像にテキストデータ抽出処理を行って、該画像に前記キーワードが含まれるか否かを判定し、前記キーワードが含まれると判定すると、前記部分画像に前記キーワードが含まれるように前記画像から前記部分画像を切り出すことを特徴とする。
本発明によれば、キーワードとの関連性が高い画像をサマリー画像として表示することができる。このため、資料の内容確認に適したサマリー画像をユーザに提供することができる。
上記画像処理装置において、前記画像取得手段は、前記キーワードを検索キーとするウェブ検索を行い、該ウェブ検索により得られた画像を取得する手段を備え、前記画像抽出手段と前記画像取得手段との少なくとも一方から画像を取得し、取得した画像が、前記画像抽出手段から取得した画像である場合には、前記資料において、前記画像の近傍に配置されたテキストを抽出し、前記取得した画像が、前記画像取得手段が前記ウェブ検索により取得した画像である場合には、前記資料において、前記画像の取得に使用したキーワードの近傍に配置されたテキストを抽出するテキスト抽出手段を備え、前記画像生成手段は、前記テキスト抽出手段が抽出したテキストを前記サマリー画像と共に表示させた画像を生成することを特徴とする。
本発明によれば、画像の近傍に配置されたテキストや、キーワードの近傍に配置されたテキストがサマリー画像と共に表示されるので、ユーザの資料の内容理解を補助する表示を提供することができる。
上記画像処理装置において、前記検出手段が検出したキーワードごとに、各キーワードの重要度と、各キーワードの資料における出現位置とを評価する評価値を生成して、各キーワードを評価する評価手段を備え、前記切出手段は、前記評価手段の評価した評価値が所定値以上のキーワードを所定数選択し、該選択したキーワードを使用した前記データベース又は前記ウェブの検索により得られた画像から前記部分画像を切り出すことを特徴とする。
本発明によれば、検出手段が検出した各キーワードの重要度と、各キーワードの資料における出現位置とを評価した評価値を作成してキーワードを選択しているので、資料の内容確認に適した画像をサマリー画像として表示することができる。
上記画像処理装置において、前記評価手段は、キーワードの資料における出現位置に応じた評価値を予め設定しておき、各キーワードに、資料における出現位置に応じた評価値を付与して各キーワードの重要度を評価する評価値を算出するとともに、評価対象のキーワードが出現する前記資料中での位置を示す行数と、各キーワードの前記資料中での出現位置を示す行数の平均値との差の二乗を、前記検出手段が検出したキーワード数で除算した値を各キーワードごとに算出し、算出した各キーワードの値を加算して前記各キーワードの前記資料における出現位置を評価する評価値を算出することを特徴とする。
本発明によれば、検出手段が検出した各キーワードの重要度と、各キーワードの資料における出現位置とを評価した評価値を作成してキーワードを選択しているので、資料の内容確認に適した画像をサマリー画像として表示することができる。
本発明のプログラムは、コンピュータを、資料データの画像領域を特定して画像を抽出する画像抽出手段と、前記資料データから当該資料データの特徴を表すキーワードを検出する検出手段と、前記検出手段が検出したキーワードに基づいてデータベースを検索し、前記キーワードに関連付けされた画像を取得する画像取得手段と、前記画像抽出手段と前記画像取得手段とから画像を取得し、取得した画像の所定領域を部分画像として切り出す手段であって、前記検出手段が検出したキーワードが人名であると判定した場合、前記画像抽出手段又は前記画像取得手段から取得した画像から、エッジ検出又は目の位置検出により顔画像を検出して、該検出した顔画像を前記部分画像として切り出し、又、前記検出手段が検出したキーワードが人名ではないと判定した場合、前記画像抽出手段又は前記画像取得手段から取得した画像にテキストデータ抽出処理を行って、該画像に前記キーワードが含まれるか否かを判定し、前記キーワードが含まれると判定すると、前記部分画像に前記キーワードが含まれるように前記画像から前記部分画像を切り出す切出手段と、前記切出手段が切り出した前記部分画像を一覧表示したサマリー画像を生成する画像生成手段として機能させることを特徴とする。
本発明は、所望の資料を迅速、且つ正確に見つけ出すことができる。
添付図面を参照しながら本発明の好適な実施例を説明する。
まず、図1を参照しながら本実施例の構成を説明する。本実施例は、資料入力部1、テキスト抽出部2、前処理部3、検索部4、ステンドグラス作成部5、表示制御部6、表示装置7、データベース8を備えている。
資料入力部1は、スキャナ等の入力デバイスによって資料データを読み込んだり、ネットワークを介して資料データを受信する入力部である。
テキスト抽出部2は、資料入力部2で入力した資料データからテキストデータを抽出する。
前処理部3は、資料データから画像データを抽出し、資料データに含まれる画像数をカウントする。資料データ中に画像が少ないと判定すると、資料データの中のテキストに関連のある画像をデータベース8やインターネットを検索して取得する。検索部4は、インターネットを検索して、前処理部3によって指示されたキーワードを含む画像を取得する。
ステンドグラス作成部5は、資料データから抽出した画像データ、データベース8、インターネットを利用して取得した画像データから所定領域の画像を切り出し、複数の画像を一覧表示したサマリー画像(以下、ステンドグラス表示と呼ぶ)を作成する。図2にステンドグラス画像の一例を示す。なお、ステンドグラス作成の詳細については、特開2005−293577号公報と、特開2005−293576号公報とに開示がある。
表示制御部6は、ステンドグラス作成部5によって作成されたステンドグラス画像や、資料から抽出したテキストをデータベース8から取り出して、表示装置7に表示させる。
また、表示制御部6は、ユーザの操作入力に従って、表示装置7に表示させるステンドグラスの形態を変更する。
なお、図1に示す各機能部は、ソフトウェア制御によって実現することもできる。図3は、このソフトウェア制御を実現する制御装置の構成を示すものであり、ROM11に格納したプログラムをCPU10が読み込んで、このプログラムに従った演算をCPU10で行うことにより、各部の機能が実現される。CPU10で実行されるプログラムの詳細については、各機能部の詳細を説明する中で、フローチャートを用いて説明する。なお、RAM12には、演算結果のデータが書き込まれ、NVRAM(Non Volatile RAM)14には、電源オフ時にバックアップが必要なデータが保存される。
以下、各機能部の詳細について説明する。まず、図4に示すフローチャートを参照しながらテキスト抽出部2について説明する。
テキスト抽出部2は、まず、入力した資料データがスキャナ等によって読み込まれたデータであるか否かを判定する(ステップS1)。スキャナによって読み込まれた資料データであった場合には(ステップS1/YES)、OCR(Optical Character Reader))によってテキストデータを抽出する(ステップS2)。
また、資料データがスキャナによって読み込んだデータではなかった場合には(ステップS1/NO)、資料データを電子的に解析して、テキストデータを取り出すことができるかどうかを判定する(ステップS3)。電子的に解析可能な資料データであった場合には(ステップS3/YES)、資料データからテキストデータを取り出す(ステップS4)。例えば、資料データがパワーポイントで作成されていれば、ppt extractorのソフトウェアを用いてテキストデータを抽出することができる。また、電子的に解析可能なデータではなかった場合には(ステップS3/NO)、OCRを用いてテキストデータを抽出する(ステップS5)。
次に、図5に示すフローチャートを参照しながら前処理部3の詳細について説明する。前処理部3は、まず資料データ中から画像データを抽出する(ステップS11)。画像データの抽出には、一般的に知られた方法を用いることができる。例えば、テキスト領域であれば、Labデータの明度を表すL*成分は高周波成分を多く含み、画像領域であれば、L*成分は低周波成分を多く含む。そこで、LabデータのうちL*データに対して周波数フィルタ処理を施した結果から、テキスト領域であるか画像領域であるかの属性を判定することができる。
この他に、資料データのエッジ検出を行って、画像領域を検出することもできる。テキスト領域はエッジ領域として検出され、画像領域では濃度一定のベタパターンが含まれることから、非エッジの領域として検出される。
次に、前処理部3は、検出した画像数をカウントし(ステップS12)、しきい値と比較する。画像数がしきい値よりも小さいと、ステンドグラスの作成に使用する画像数が不足しているので、データベース8やインターネットから資料データに関連する画像データを補完する必要があると判定する(ステップS13)。
前処理部3は、画像データの補完が必要であると判定すると(ステップS13/YES)、資料データからキーワードを抽出する(ステップS14)。キーワードの抽出方法も従来から一般的に用いられている方法を適用することができる。例えば、形態素解析を行ってテキストデータを単語に分割し、単語登録辞書を用いてキーワードとなる単語を検出する方法が挙げられる。また、抽出されるキーワードは、資料データの特徴を表すキーワードであって、例えば、資料のタイトル、見出し、人名、社名等を含む。
次に、前処理部3は、抽出したキーワードに関連する画像データをデータベース8又はインターネットから検索する。データベース8には、キーワードと、このキーワードに関連付けされた画像データとが登録されており、キーワードを検索キーとして画像データを検出する。
また、前処理部3は、検索部4にキーワードを通知して、インターネットを利用した画像検索を行う。検索部4は、ブラウザソフトウェアを備えており、取得したキーワードに関連する画像データをインターネットから取得する。例えば、Googleのイメージ検索等を利用することができる。
キーワードに関連する画像データを検出すると、検出した画像データの中から、実際に使用する画像を選択する(ステップS16)。この処理の詳細については後述する。
次に、図6に示すフローチャートを参照しながら、データベース8を検索してキーワードに関連付けられた画像データを取得する手順を説明する。
前処理部3は、資料データからキーワードを抽出すると、データベース8を検索して、キーワードに関連付けされた画像データを検出する(ステップS21)。画像データを検出すると(ステップS22/YES)、この画像を格納するデータベースのアドレスを取得する(ステップS23)。この処理をS15のキーワード抽出で抽出されたすべてのキーワードについて行う(ステップS24)。
次に、前処理部3は、データベース8又はインターネットを検索して取得した画像データから、実際に使用する画像データを選択する。この処理を図7に示すフローチャートを参照しながら説明する。
前処理部3は、まずキーワードを評価する評価値をキーワードごとに求める(ステップS31)。評価値Wは、以下に示す評価式によって算出される。この評価式は、キーワードを資料の全体から隔たりなく抽出するための評価式である。
W=A×キーワード重要度スコア+B×(キーワード位置評価値)
なお、変数AとBは重み付けの係数である。キーワード重要度スコアの算出は、例えば、キーワードが出現する資料の各部位に応じたスコアを予め定めておき、出現するキーワードのスコアを資料の部位に基づいて加算して求めることができる。例えば、資料のタイトルにキーワードが出現する場合と、大見出しに出現する場合、中見出しに出現する場合、段落の中の文中に出現する場合では、キーワードの重要度が異なると考えられる。そこで、資料のタイトルに出現した語に対してはより大きなスコアを与え、段落の中の文に出現する語には小さなスコアを与えるようにする。この他に、単純に資料データに出現するキーワードの出現頻度やTF−IDF(Term Frequency−Inverse Document Frequency:用語頻度−逆文書頻度アルゴリズム)といった一般的な自然言語処理の指標を用いてもよい。
また、キーワード位置評価値を求める評価式Rは、以下に示す式によって算出される。
Figure 0004952079
上式のX1、X2は、各キーワードの資料データ中での出現位置(資料の行数)を示す。また、Xは、全キーワードの出現位置の平均値を示し、Nは、全キーワード数を示す。なお、全キーワードの出現位置の平均値を示すXの値は、一度選択され、評価されたキーワードを除いたキーワードの位置の平均値である。例えば、最初にキーワードX1が選択された場合、Xは、X2〜Xn(nは全キーワード数)の平均値となる。次にキーワードX2が選択されると、X3〜Xnの平均値となる。
キーワードの評価値が求められると、前処理部3は、評価値がしきい値以上のキーワードを求める(ステップS32)。求めたキーワードからステンドグラスの作成に使用する画像数が所定数以上となるようにキーワードを再度選択し、選択したキーワードに関連付けられた画像をステンドグラス画像の生成に使用する。
前処理部3からステンドグラス作成部5には、選択されたキーワードと、キーワードに関連付けられた画像を格納したデータベース8のアドレスとが通知される。また、インターネットを利用して取得した画像がある場合には、この画像もステンドグラス作成部5に出力される。また前処理部3は、入力した資料データと、資料データから抽出したテキストデータ、画像データとに識別情報を付し、データベース8に登録する。
次に、ステンドグラス作成部5の処理について説明する。ステンドグラス作成部5は、資料データから抽出したキーワードに応じて、ステンドグラスで表示する画像の領域を変更する。
例えば、キーワードが人物名であった場合、図8(A)に示すように画像データから顔画像を切り取る。ステンドグラスの作成の際には、この画像を代表する画像として切り取った顔画像を使用する。
また、キーワードに関連付けられた画像データに文字を含む場合には、図8(B)に示すように画像データの文字部分を取り出して、文字部分がステンドグラスに含まれるように加工する。
図9に示すフローチャートを参照しながらステンドグラス作成部5の処理手順を説明する。
ステンドグラス作成部5は、キーワードと、キーワードに関連する画像データを取得してステンドグラスを作成する。
まず、ステンドグラス作成部5は、キーワードが人名であるかどうかを判定する(ステップS41)。キーワードが人名であった場合には(ステップS41/YES)、画像データに含まれる人物の顔位置を検出する(ステップS42)。顔位置の検出は、例えば、エッジ検出によって顔のエッジ画像を検出することで求められる。また、顔画像データとエッジ画像から顔の中心線を求め、この中心線に基づき顔領域を決定してもよい。
また、人物の目の位置を検出して顔を判定してもよい。目の位置検出は、目と目の周辺との色差(肌色)、目の特徴(対称性、形状等)、目と他の領域(例えば、鼻、口、眉等)との関係を考慮して求めることができる。
顔位置を検出すると、ステンドグラス作成部5は、顔を中心に画像を切り出して、ステンドグラス画像の所定領域に表示されるように処理を行う(ステップS43)。
また、キーワードが人名ではなかった場合には(ステップS41/NO)、キーワードに関連付けされた画像データをOCR処理し、画像データ中にキーワードが含まれているかどうかを判定する(ステップS45)。画像データにキーワードが含まれている場合には(ステップS45/YES)、切り出す画像にキーワードが含まれるように加工処理を行う(ステップS46)。また、画像データにキーワードが含まれていなかった場合には(ステップS45/NO)、通常のステンドグラス処理を行う(ステップS47)。
なお、ステンドグラスを構成する画像の数は、任意に設定することができる。また、ステンドグラス作成部5は、作成したステンドグラス画像に識別情報を付し、このステンドグラス画像を作成した資料データに関連付けてデータベース8に格納する。
次に、表示制御部6の処理について説明する。表示制御部6は、データベース8からステンドグラス画像と、テキストデータを取得して図10に示すように表示装置7に表示させる。
ステンドグラス画像と共に表示するテキストデータは、資料データのタイトルであってもよい。また、資料データにもともと含まれる画像データをステンドグラス画像として表示している場合には、この画像データの近傍のテキストデータを表示させてもよい。
さらに、ステンドグラス画像を構成する画像と、テキストデータとの関係を明確にするために、各画像を取り囲む枠の色と、テキストデータの色とを同一の色で表示させてもよい。もしくは、ステンドグラス画像を構成する各画像の位置構成と同じ配置となるように、対応する各テキストデータを配置することもできる。
このような表示を表示装置7に表示させるための前処理部3の処理手順を図11に示すフローチャートを参照しながら説明する。
前処理部3は、ステンドグラス画像の作成に使用する画像データを選択すると(ステップS51/YES)、この画像データはもともと資料に含まれていた画像であるかどうかを判定する(ステップS52)。画像データが資料に含まれていたものであった場合には(ステップS52/YES)、資料の中で画像データの近傍に配置されたテキストデータを所定数以内で抽出する(ステップS53)。また、画像データが資料データに含まれていたものではなく、データベース8やインターネットを検索して取得したものであった場合には(ステップS52/NO)、キーワードを中心として、キーワードの近傍のテキストデータを所定数以内で抽出する(ステップS54)。
資料データから抽出した画像データ、データベース8やインターネットから抽出した画像データに対して上述の処理が終了すると(ステップS55/YES)、前処理部3は、抽出したテキストデータを資料データに関連付けて、データベース8に登録する(ステップS56)。以上の処理によって生成されたテキストデータを表示制御部6がデータベース8から読み出して表示装置7に表示させることで、図10に示す画像が表示される。
なお、図12には、図10に示す表示の別形態を示す。ステンドグラス画像を表示した時に、マウス等の入力デバイスによってステンドグラスの1画像が選択されると、図12に示すように抽出したテキストデータをステンドグラス画像に重ねて表示させる。
表示装置7に表示させる画像は、図10、12に示すものだけではなく、この他種々の表示形態が考えられる。図面を参照しながら表示装置7の表示例を説明する。
図13に示す表示例では、画像中に文字が含まれていた場合に、文字が読み取れるように文字を含む領域の画像を他の領域の画像よりも大きく表示させる。
ステンドグラス作成部5は、ステンドグラス画像を作成する際に、ステンドグラスを構成する画像に文字が含まれていた場合、文字が含まれるように画像を切り取る。
また図14に示す表示例では、ステンドグラス画像を表示した時に、マウス等の入力デバイスによってステンドグラスの1画像が選択されると、この画像を拡大表示させる。
データベース8には、ステンドグラスの一部に使用した画像と、これを所定倍率に拡大した拡大画像とを用意しておく。表示制御部6は、マウスによって画像が選択されると、選択された画像を拡大処理したステンドグラス画像を表示させる。
また、選択された画像を拡大表示させたステンドグラス画像を表示させるのではなく、図15に示すように選択された画像だけを拡大表示させてもよい。表示制御部6は、ステンドグラス画像の作成の際に切り取った部分画像ではなく、切り取る前の画像の全体を拡大表示させる。
この他に、図16に示す表示例では、マウスによって選択された画像に関連する他の画像を表示している。
キーワードごとに複数の画像候補(第1候補、第2候補)を用意し、第1候補の画像データをステンドグラスの一部を構成する画像とする。ステンドグラス画像を表示した時に、マウス等の入力デバイスによって画像が選択されると、この画像の第2候補をステンドグラス画像上に重ねて表示する。この時、画像の第2候補を1枚だけ表示するのではなく、第3候補や第4候補といった複数の候補をまとめてステンドグラス化して表示しても良い。このようにして複数の画像から資料の内容を判断することができ、ユーザの資料再認性を高めることができる。
さらに、マウス等によって画像が選択されると、図17に示すように選択された画像を含む資料のタイトルをステンドグラス画像に重ねて表示してもよい。
また、ステンドグラス画像から1画像が選択され拡大表示された後に、ユーザが該画像を含む資料データをダウンロードした場合、その画像がユーザのダウンロードをする際の有用な情報であったとみなし、次回、同じ検索キーワードが入力され同資料のステンドグラスを表示する場合には同画像の表示領域を拡大して表示する。
このようにして、履歴を用いることで検索キーワードごとにユーザの情報選択にとって有用な情報を残すことができる。
また、ステンドグラスの作成に使用する資料データの範囲を変更して複数のステンドグラス画像を作成してもよい。例えば、図18に示すように資料データの各ページから画像データやテキストを抽出して、資料の全内容を反映したステンドグラス画像を作成すると共に、各ページ内の画像データやテキストデータだけを使用したステンドグラス画像を作成しておく。
表示装置7に、まず資料データの全体を反映させたステンドグラス画像を表示して、1つの画像が選択されると、そのページの画像やテキストから作成したステンドグラス画像を表示させる。これによってユーザは、資料データの各ページの内容を簡単に認識することができる。
また、ステンドグラス画像を作成する時に、資料アイコンを表示させて、ユーザによって選択された範囲内のテキストデータや画像データを使用してステンドグラス画像を作成してもよい。図19(A)に示すように資料アイコンの全体が選択されると、資料の全体からキーワードや画像データを抽出してステンドグラス画像を生成する。また、図19(B)に示すように資料アイコンの一部が選択されると、選択された範囲に対応する一部の資料データからキーワードや画像データを抽出してステンドグラス画像を生成する。なお、ステンドグラスを構成する画像の数は、参照する資料データの範囲に応じて変更してもよい。
また、ステンドグラス画像の作成後は、ステンドグラスそれぞれの要素がカバーしている範囲を示すため、ステンドグラス画像の枠線の色と、対応する資料アイコンの範囲を示す表示色とを一致させて表示させても良い。
また、複数のステンドグラス画像を作成した時には、図20に示すように資料の全体をタイムラインで表示し、資料中のどの部分を用いてステンドグラス画像を作成したのかが分かるようにしてもよい。さらに、この場合もステンドグラスの個々の要素がタイムライン上でカバーしている範囲を明確に示すため、画像の枠線の色とタイムライン上の色を一致させて表示させても良い。
さらに、データベース8に格納した資料を表示装置7でフォルダ表示するときには、図21に示すようにフォルダに格納した資料内容を反映させたステンドグラスを表示させて、資料が一目で分かるようにしてもよい。
また、複数の資料をまとめて1つのフォルダに保存する時には、これらの資料に共通するキーワードを抽出して、このキーワードに関連する画像を取得してステンドグラスにしてもよい。なお、ステンドグラスに使用する画像を選択するときには、画像の色分散など特徴となる量が大きい画像を選択することで、資料の内容把握が容易になる。
上述した実施例は本発明の好適な実施例である。但しこれに限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々変形実施可能である。
例えば、ステンドグラス画像を作成する際に、資料データにもともと付加されていた画像と、データベース8やインターネットから補完した画像との区別がつくように画像を表示してもよい。例えばデータベース8やインターネットから補完した画像を、セピア、斜線、モノクロ等で表示することができる。
また、各ユーザが自身の端末にダウンロードした資料の履歴を記録しておき、この資料の履歴からステンドグラス画像を作成して、各ユーザが、どのような情報に興味があるかを判別できるようにしてもよい。
例えば、ユーザが以前、車の資料をダウンロードしていた場合には、車の画像をステンドグラス画像の一部に含ませる。また、この車の画像に関連付けて、新車情報や、メンテナンス情報などの様々な車に関する情報を登録しておく。ユーザがステンドグラス画像の車を選択すると、車に関する情報がユーザ端末に表示される(情報の推薦)。このようにして情報推薦サービスのユーザインターフェースとしても利用することができる。
また、キーワードに関連する画像がデータベース8に登録されていない場合、他のデータベースを参照して画像データを取得することもできる。また、データベース8の管理者に画像がデータベース8に登録されていない旨を通知してもよい。
また、上述した実施例ではキーワードのみによる画像の取得を行っていたが、キーワードに関連のある文書を入力して、関連文書文書検索による絞込みを行っても良い。具体的には、キーワードと、このキーワードが掲載されている関連文書(例えば、html文書)からキーワード候補を抽出する。キーワード候補は、キーワードとの類似度判定によって検出する。このようにして抽出したキーワードと、キーワード候補とからより適当な画像を選択して、ステンドグラスの要素とする。
画像処理装置の構成を示すブロック図である。 ステンドグラス画像の一例を示す図である。 プログラム処理によって本発明を実現するためのハードウェア構成を示す図である。 テキスト抽出部の処理手順を示すフローチャートである。 前処理部の処理手順を示すフローチャートである。 データベースを検索して、キーワードに関連する画像データを検出する手順を示すフローチャートである。 ステンドグラス作成に使用する画像を選択する手順を示すフローチャートである。 ステンドグラス作成部5の処理例を示す図である。 ステンドグラス作成部5の処理手順を示すフローチャートである。 表示制御部によって表示装置に表示される画像の一例を示す図である。 ステンドグラス画像と共に表示されるテキストデータを抽出する前処理部の処理手順を示すフローチャートである。 ステンドグラス画像の一例を示す図であって、選択画像に関連するテキストを表示した例である。 ステンドグラス画像の一例を示す図であって、テキストを含む画像を拡大表示した例である。 ステンドグラス画像の一例を示す図であって、マウスによって選択された画像を拡大表示したステンドグラス画像の例である。 ステンドグラス画像の一例を示す図であって、マウスによって選択された画像を拡大表示した例である。 ステンドグラス画像の一例を示す図であって、選択された画像に関連する他の画像を表示する例を示す図である。 ステンドグラス画像の一例を示す図であって、選択された画像を含む資料のタイトルを表示した例である。 ステンドグラス画像の一例を示す図であって、ステンドグラス画像を階層的に構成した例を示す図である。 ステンドグラス画像を作成する資料データの領域を選択する例を示す図である。 資料の全体をタイムラインで表示し、資料中のどの部分を用いたステンドグラス画像であるのかを表示した図である。 フォルダにステンドグラス画像を表示させた状態を示す図である。
符号の説明
1 資料入力部
2 テキスト抽出部
3 前処理部
4 検索部
5 ステンドグラス作成部
6 表示制御部
7 表示装置
8 データベース

Claims (5)

  1. 資料データの画像領域を特定して画像を抽出する画像抽出手段と、
    前記資料データから当該資料データの特徴を表すキーワードを検出する検出手段と、
    前記検出手段が検出したキーワードに基づいてデータベースを検索し、前記キーワードに関連付けされた画像を取得する画像取得手段と、
    記画像抽出手段と前記画像取得手段とから画像を取得し、取得した画像の所定領域を部分画像として切り出す切出手段と、
    前記切出手段が切り出した前記部分画像を一覧表示したサマリー画像を生成する画像生成手段とを有し、
    前記切出手段は、前記検出手段が検出したキーワードが人名であると判定した場合、前記画像抽出手段又は前記画像取得手段から取得した画像から、エッジ検出又は目の位置検出により顔画像を検出して、該検出した顔画像を前記部分画像として切り出し、又、前記検出手段が検出したキーワードが人名ではないと判定した場合、前記画像抽出手段又は前記画像取得手段から取得した画像にテキストデータ抽出処理を行って、該画像に前記キーワードが含まれるか否かを判定し、前記キーワードが含まれると判定すると、前記部分画像に前記キーワードが含まれるように前記画像から前記部分画像を切り出すことを特徴とする画像処理装置。
  2. 前記画像取得手段は、前記キーワードを検索キーとするウェブ検索を行い、該ウェブ検索により得られた画像を取得する手段を備え、
    前記画像抽出手段と前記画像取得手段との少なくとも一方から画像を取得し、取得した画像が、前記画像抽出手段から取得した画像である場合には、前記資料において、前記画像の近傍に配置されたテキストを抽出し、前記取得した画像が、前記画像取得手段が前記ウェブ検索により取得した画像である場合には、前記資料において、前記画像の取得に使用したキーワードの近傍に配置されたテキストを抽出するテキスト抽出手段を備え、
    前記画像生成手段は、前記テキスト抽出手段が抽出したテキストを前記サマリー画像と共に表示させた画像を生成することを特徴とする請求項1記載の画像処理装置。
  3. 前記検出手段が検出したキーワードごとに、各キーワードの重要度と、各キーワードの資料における出現位置とを評価する評価値を生成して、各キーワードを評価する評価手段を備え、
    前記切出手段は、前記評価手段の評価した評価値が所定値以上のキーワードを所定数選択し、該選択したキーワードを使用した前記データベース又は前記ウェブの検索により得られた画像から前記部分画像を切り出すことを特徴とする請求項2記載の画像処理装置。
  4. 前記評価手段は、キーワードの資料における出現位置に応じた評価値を予め設定しておき、各キーワードに、資料における出現位置に応じた評価値を付与して各キーワードの重要度を評価する評価値を算出するとともに、評価対象のキーワードが出現する前記資料中での位置を示す行数と、各キーワードの前記資料中での出現位置を示す行数の平均値との差の二乗を、前記検出手段が検出したキーワード数で除算した値を各キーワードごとに算出し、算出した各キーワードの値を加算して前記各キーワードの前記資料における出現位置を評価する評価値を算出することを特徴とする請求項3記載の画像処理装置。
  5. コンピュータを、
    資料データの画像領域を特定して画像を抽出する画像抽出手段と、
    前記資料データから当該資料データの特徴を表すキーワードを検出する検出手段と、
    前記検出手段が検出したキーワードに基づいてデータベースを検索し、前記キーワードに関連付けされた画像を取得する画像取得手段と、
    前記画像抽出手段と前記画像取得手段とから画像を取得し、取得した画像の所定領域を部分画像として切り出す手段であって、前記検出手段が検出したキーワードが人名であると判定した場合、前記画像抽出手段又は前記画像取得手段から取得した画像から、エッジ検出又は目の位置検出により顔画像を検出して、該検出した顔画像を前記部分画像として切り出し、又、前記検出手段が検出したキーワードが人名ではないと判定した場合、前記画像抽出手段又は前記画像取得手段から取得した画像にテキストデータ抽出処理を行って、該画像に前記キーワードが含まれるか否かを判定し、前記キーワードが含まれると判定すると、前記部分画像に前記キーワードが含まれるように前記画像から前記部分画像を切り出す切出手段と、
    前記切出手段が切り出した前記部分画像を一覧表示したサマリー画像を生成する画像生成手段として機能させることを特徴とするプログラム。
JP2006166407A 2006-06-15 2006-06-15 画像処理装置、方法及びプログラム Expired - Fee Related JP4952079B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006166407A JP4952079B2 (ja) 2006-06-15 2006-06-15 画像処理装置、方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006166407A JP4952079B2 (ja) 2006-06-15 2006-06-15 画像処理装置、方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2007334670A JP2007334670A (ja) 2007-12-27
JP4952079B2 true JP4952079B2 (ja) 2012-06-13

Family

ID=38934088

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006166407A Expired - Fee Related JP4952079B2 (ja) 2006-06-15 2006-06-15 画像処理装置、方法及びプログラム

Country Status (1)

Country Link
JP (1) JP4952079B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5198339B2 (ja) * 2009-03-31 2013-05-15 株式会社デンソーアイティーラボラトリ 情報提示装置、情報提示方法、情報提示システムおよびプログラム
JP6100849B2 (ja) * 2015-08-24 2017-03-22 ヤフー株式会社 生成装置、生成方法、生成プログラム、端末装置、及び表示プログラム
JP6732984B1 (ja) * 2019-03-20 2020-07-29 ヤフー株式会社 情報表示プログラム、情報表示装置、情報表示方法、配信装置、および制御サーバ

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003067382A (ja) * 2001-08-28 2003-03-07 Canon Inc 情報処理装置及びその方法
US7697785B2 (en) * 2004-03-31 2010-04-13 Fuji Xerox Co., Ltd. Generating a highly condensed visual summary

Also Published As

Publication number Publication date
JP2007334670A (ja) 2007-12-27

Similar Documents

Publication Publication Date Title
US8429154B2 (en) Document search device, imaging forming apparatus, and document search system
US8482808B2 (en) Image processing apparatus and method for displaying a preview of scanned document data
US20090106699A1 (en) Image processing device and image processing method
JP2007286864A (ja) 画像処理装置、画像処理方法、プログラムおよび記録媒体
US20110103689A1 (en) System and method for obtaining document information
CN103678460B (zh) 用于识别适于在多语言环境中进行通信的非文本元素的方法和系统
US9213756B2 (en) System and method of using dynamic variance networks
US9881001B2 (en) Image processing device, image processing method and non-transitory computer readable recording medium
JP6025487B2 (ja) フォレンジック分析システムおよびフォレンジック分析方法並びにフォレンジック分析プログラム
JP4952079B2 (ja) 画像処理装置、方法及びプログラム
JP5827206B2 (ja) 文書管理システムおよび文書管理方法並びに文書管理プログラム
JP2008052496A (ja) 画像表示装置、画像表示方法、プログラムおよび記録媒体
JP2006309347A (ja) 対象文書からキーワードを抽出する方法、システムおよびプログラム
US9870632B2 (en) Information processing apparatus and non-transitory computer readable medium
JP2008259199A (ja) モノクロの印刷文書の自動カラー化
JP3879810B2 (ja) 読取支援装置
JP7173314B2 (ja) マッピング支援装置、マッピング支援方法、及びプログラム
JP2004157668A (ja) 検索システム、検索方法および検索プログラム
JP7134814B2 (ja) システム、ページデータ出力方法、及びプログラム
JP2006085234A (ja) 電子文書作成装置、電子文書作成方法及び電子文書作成プログラム
JP2008071311A (ja) 画像検索装置、画像検索方法、画像検索プログラム、及び、情報記憶媒体
JP2021114225A (ja) ファイル検索システム、ファイル検索方法及びプログラム
JP5217513B2 (ja) 情報解析処理方法、情報解析処理プログラム、情報解析処理装置、情報登録処理方法、情報登録処理プログラム、情報登録処理装置、情報登録解析処理方法、および情報登録解析処理プログラム。
JPH10162024A (ja) 電子ファイリング方法及び電子ファイリング装置
US20230030087A1 (en) Information processing apparatus, information processing method, and non-transitory computer readable medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090210

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110419

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110620

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120214

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120227

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150323

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees