JP2007334670A - 画像処理装置、方法及びプログラム - Google Patents

画像処理装置、方法及びプログラム Download PDF

Info

Publication number
JP2007334670A
JP2007334670A JP2006166407A JP2006166407A JP2007334670A JP 2007334670 A JP2007334670 A JP 2007334670A JP 2006166407 A JP2006166407 A JP 2006166407A JP 2006166407 A JP2006166407 A JP 2006166407A JP 2007334670 A JP2007334670 A JP 2007334670A
Authority
JP
Japan
Prior art keywords
image
text data
data
images
image processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006166407A
Other languages
English (en)
Other versions
JP4952079B2 (ja
Inventor
Kentaro Takano
健太郎 高野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2006166407A priority Critical patent/JP4952079B2/ja
Publication of JP2007334670A publication Critical patent/JP2007334670A/ja
Application granted granted Critical
Publication of JP4952079B2 publication Critical patent/JP4952079B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 所望の資料を迅速、且つ正確に見つけ出すことができる画像処理装置を提供する。
【解決手段】 資料データから当該資料データの特徴を表すテキストデータを検出して、検出結果に基づいてデータベース8を検索して、テキストデータに関連のある画像を取得する前処理部3と、画像の所定領域を抽出し、複数の画像から抽出した所定領域の部分画像を一覧表示したサマリー画像を生成するステンドグラス作成部5とを有する構成としている。資料データから資料の特徴を表すテキストデータを検出して、このキーワードに関連する画像で構成したサマリー画像を生成するので、資料の内容を簡単に確認することができ、短時間で目的の資料を検出することができる。
【選択図】 図1

Description

本発明は、データベースに登録されたデータから所望とする資料を簡単に選択するための技術に関する。
近年、オフィス等で保有する資料をデータベースに登録して管理するために、ドキュメント・マネージメント・システム(DMS)等の資料処理装置が普及しており、大量の電子化された資料が登録されている。
またデータベースからオフィス内の個々の情報処理端末に、ネットワークを通じて大量の資料をダウンロードできるようにもなっている。さらに、資料検索機能の向上により、大量の資料からユーザの要求に適合しそうな幾つかの資料を候補として抽出し、表示できるようにもなっている。
そこで、このような候補として表示された資料の内容を短時間で正確に把握する技術も必要となってきている。例えば、キャノン株式会社製の「c−cabinet」(以下、従来製品という)では、サーバ装置に登録した資料のサムネイルとリストを組み合わせた複合表示が可能となっている。
また、特許文献1では、異なる資料ファイルの内容が簡単に分かるように、それぞれの資料ファイルの内容を分割表示領域に表示している。各分割表示領域には、それぞれ個別のスクロールバーが付されており、これらスクロールバーによって各分割表示領域に表示する資料ファイルの内容をスクロール表示できるようにしている。
特開2001−22734号公報
しかしながら、上記従来製品では、画像のサムネイル表示が可能であるが、表示する資料がもともと図や表のない、又は少ない資料であった場合、サムネイル画像では資料内容の把握が簡単ではない。
また、特許文献1は、テキストによる情報提示技術のため、例えばパワーポイント等の図や表を含むドキュメントの表示には対応できない。
本発明は上記事情に鑑みてなされたものであり、所望の資料を迅速、且つ正確に見つけ出すことができる画像処理装置、方法及びプログラムを提供することを目的とする。
かかる目的を達成するために本発明の画像処理装置は、資料データから当該資料データの特徴を表すテキストデータを検出する検出手段と、前記検出手段の検出結果に基づいてデータベースを検索し、前記テキストデータに関連のある画像を取得する画像取得手段と、前記画像の所定領域を抽出する抽出手段と、複数の画像から抽出した前記所定領域の部分画像を一覧表示したサマリー画像を生成する画像生成手段とを有する構成としている。
このように本発明は、資料データの特徴を表すテキストデータを検出して、このキーワードに関連する画像で構成したサマリー画像を生成するので、資料の内容を簡単に確認することができ、短時間で目的の資料を検出することができる。
上記画像処理装置において、前記画像生成手段は、前記資料データに含まれる画像と、前記データベースを検索して取得した画像とを使用して前記サマリー画像を生成するとよい。
従って、資料に画像が含まれる場合には、資料に含まれる画像を活用することで、一度見た資料の検出が容易になる。
上記画像処理装置において、前記特徴を表すテキストデータは、資料のタイトル、資料に付けられた見出し、人名、会社名の少なくとも1つを含むとよい。
上記画像処理装置において、前記抽出手段は、前記特徴を表すテキストデータが人名を表すデータであった場合に、顔画像が含まれるように前記所定領域の画像を抽出するとよい。
従って、テキストデータに人名が含まれていた場合に、人名を表す顔画像をサマリー画像に含めるので、資料の内容確認がさらに簡単になる。
上記画像処理装置において、前記抽出手段は、前記画像中に文字が含まれる場合に、該文字が含まれるように前記所定領域の画像を抽出するとよい。
従って、画像に含まれる文字を資料確認の有効な情報にすることができる。
上記画像処理装置において、前記検出手段は、前記特徴を表すテキストデータを前記資料データの各ページから均等に抽出するとよい。
従って、資料全体の内容を表すサマリー画像を生成することができる。
上記画像処理装置において、前記サマリー画像と、前記サマリー画像を構成する画像に関連のあるテキストデータとを表示する表示制御手段を有するとよい。
また、前記表示制御手段は、前記サマリー画像を構成する画像の1つが選択されると、該画像に関連のあるテキストデータを前記サマリー画像に重ねて表示するとよい。
従って、画像とテキストデータとを表示するので、資料の内容を簡単に確認することができる。
上記画像処理装置において、前記表示制御手段は、前記サマリー画像を構成する画像にテキストデータが含まれていた場合に、該テキストデータを含む画像を他の画像よりも拡大表示させるとよい。
従って、画像に含まれる文字を資料確認の有効な情報にすることができる。
上記画像処理装置において、前記表示制御手段は、前記サマリー画像を構成する画像の1つが選択されると、該画像を拡大表示するとよい。
従って、サマリー画像から選択された画像を見やすいように表示することができる。
上記画像処理装置において、前記表示制御手段は、前記サマリー画像を構成する画像の1つが選択されると、該画像を拡大表示するとよい。また、画像に関連する他の画像を表示してもよい。
従って、資料の内容を簡単に確認することができる。
上記画像処理装置において、前記画像生成手段は、前記特徴を表すテキストデータを抽出する資料データの範囲を変更して、複数のサマリー画像を生成するとよい。
従って、ユーザの記憶に残っている資料範囲のサマリー画像を表示することができる。
本発明の画像処理方法は、資料データから当該資料データの特徴を表すテキストデータを検出するステップと、前記特徴を表すテキストデータの検出結果に基づいてデータベースを検索し、前記テキストデータに関連のある画像を取得するステップと、前記画像の所定領域を抽出するステップと、複数の画像から抽出した前記所定領域の部分画像を一覧表示したサマリー画像を生成するステップと、を有している。
本発明は、資料データから当該資料データの特徴を表すテキストデータを検出する処理と、前記特徴を表すテキストデータの検出結果に基づいてデータベースを検索し、前記テキストデータに関連のある画像を取得する処理と、前記画像の所定領域を抽出する処理と、複数の画像から抽出した前記所定領域の部分画像を一覧表示したサマリー画像を生成する処理と、をコンピュータに実行可能に構成している。
本発明は、所望の資料を迅速、且つ正確に見つけ出すことができる。
添付図面を参照しながら本発明の好適な実施例を説明する。
まず、図1を参照しながら本実施例の構成を説明する。本実施例は、資料入力部1、テキスト抽出部2、前処理部3、検索部4、ステンドグラス作成部5、表示制御部6、表示装置7、データベース8を備えている。
資料入力部1は、スキャナ等の入力デバイスによって資料データを読み込んだり、ネットワークを介して資料データを受信する入力部である。
テキスト抽出部2は、資料入力部2で入力した資料データからテキストデータを抽出する。
前処理部3は、資料データから画像データを抽出し、資料データに含まれる画像数をカウントする。資料データ中に画像が少ないと判定すると、資料データの中のテキストに関連のある画像をデータベース8やインターネットを検索して取得する。検索部4は、インターネットを検索して、前処理部3によって指示されたキーワードを含む画像を取得する。
ステンドグラス作成部5は、資料データから抽出した画像データ、データベース8、インターネットを利用して取得した画像データから所定領域の画像を切り出し、複数の画像を一覧表示したサマリー画像(以下、ステンドグラス表示と呼ぶ)を作成する。図2にステンドグラス画像の一例を示す。なお、ステンドグラス作成の詳細については、特開2005−293577号公報と、特開2005−293576号公報とに開示がある。
表示制御部6は、ステンドグラス作成部5によって作成されたステンドグラス画像や、資料から抽出したテキストをデータベース8から取り出して、表示装置7に表示させる。
また、表示制御部6は、ユーザの操作入力に従って、表示装置7に表示させるステンドグラスの形態を変更する。
なお、図1に示す各機能部は、ソフトウェア制御によって実現することもできる。図3は、このソフトウェア制御を実現する制御装置の構成を示すものであり、ROM11に格納したプログラムをCPU10が読み込んで、このプログラムに従った演算をCPU10で行うことにより、各部の機能が実現される。CPU10で実行されるプログラムの詳細については、各機能部の詳細を説明する中で、フローチャートを用いて説明する。なお、RAM12には、演算結果のデータが書き込まれ、NVRAM(Non Volatile RAM)14には、電源オフ時にバックアップが必要なデータが保存される。
以下、各機能部の詳細について説明する。まず、図4に示すフローチャートを参照しながらテキスト抽出部2について説明する。
テキスト抽出部2は、まず、入力した資料データがスキャナ等によって読み込まれたデータであるか否かを判定する(ステップS1)。スキャナによって読み込まれた資料データであった場合には(ステップS1/YES)、OCR(Optical Character Reader))によってテキストデータを抽出する(ステップS2)。
また、資料データがスキャナによって読み込んだデータではなかった場合には(ステップS1/NO)、資料データを電子的に解析して、テキストデータを取り出すことができるかどうかを判定する(ステップS3)。電子的に解析可能な資料データであった場合には(ステップS3/YES)、資料データからテキストデータを取り出す(ステップS4)。例えば、資料データがパワーポイントで作成されていれば、ppt extractorのソフトウェアを用いてテキストデータを抽出することができる。また、電子的に解析可能なデータではなかった場合には(ステップS3/NO)、OCRを用いてテキストデータを抽出する(ステップS5)。
次に、図5に示すフローチャートを参照しながら前処理部3の詳細について説明する。前処理部3は、まず資料データ中から画像データを抽出する(ステップS11)。画像データの抽出には、一般的に知られた方法を用いることができる。例えば、テキスト領域であれば、Labデータの明度を表すL*成分は高周波成分を多く含み、画像領域であれば、L*成分は低周波成分を多く含む。そこで、LabデータのうちL*データに対して周波数フィルタ処理を施した結果から、テキスト領域であるか画像領域であるかの属性を判定することができる。
この他に、資料データのエッジ検出を行って、画像領域を検出することもできる。テキスト領域はエッジ領域として検出され、画像領域では濃度一定のベタパターンが含まれることから、非エッジの領域として検出される。
次に、前処理部3は、検出した画像数をカウントし(ステップS12)、しきい値と比較する。画像数がしきい値よりも小さいと、ステンドグラスの作成に使用する画像数が不足しているので、データベース8やインターネットから資料データに関連する画像データを補完する必要があると判定する(ステップS13)。
前処理部3は、画像データの補完が必要であると判定すると(ステップS13/YES)、資料データからキーワードを抽出する(ステップS14)。キーワードの抽出方法も従来から一般的に用いられている方法を適用することができる。例えば、形態素解析を行ってテキストデータを単語に分割し、単語登録辞書を用いてキーワードとなる単語を検出する方法が挙げられる。また、抽出されるキーワードは、資料データの特徴を表すキーワードであって、例えば、資料のタイトル、見出し、人名、社名等を含む。
次に、前処理部3は、抽出したキーワードに関連する画像データをデータベース8又はインターネットから検索する。データベース8には、キーワードと、このキーワードに関連付けされた画像データとが登録されており、キーワードを検索キーとして画像データを検出する。
また、前処理部3は、検索部4にキーワードを通知して、インターネットを利用した画像検索を行う。検索部4は、ブラウザソフトウェアを備えており、取得したキーワードに関連する画像データをインターネットから取得する。例えば、Googleのイメージ検索等を利用することができる。
キーワードに関連する画像データを検出すると、検出した画像データの中から、実際に使用する画像を選択する(ステップS16)。この処理の詳細については後述する。
次に、図6に示すフローチャートを参照しながら、データベース8を検索してキーワードに関連付けられた画像データを取得する手順を説明する。
前処理部3は、資料データからキーワードを抽出すると、データベース8を検索して、キーワードに関連付けされた画像データを検出する(ステップS21)。画像データを検出すると(ステップS22/YES)、この画像を格納するデータベースのアドレスを取得する(ステップS23)。この処理をS15のキーワード抽出で抽出されたすべてのキーワードについて行う(ステップS24)。
次に、前処理部3は、データベース8又はインターネットを検索して取得した画像データから、実際に使用する画像データを選択する。この処理を図7に示すフローチャートを参照しながら説明する。
前処理部3は、まずキーワードを評価する評価値をキーワードごとに求める(ステップS31)。評価値Wは、以下に示す評価式によって算出される。この評価式は、キーワードを資料の全体から隔たりなく抽出するための評価式である。
W=A×キーワード重要度スコア+B×(キーワード位置評価値)
なお、変数AとBは重み付けの係数である。キーワード重要度スコアの算出は、例えば、キーワードが出現する資料の各部位に応じたスコアを予め定めておき、出現するキーワードのスコアを資料の部位に基づいて加算して求めることができる。例えば、資料のタイトルにキーワードが出現する場合と、大見出しに出現する場合、中見出しに出現する場合、段落の中の文中に出現する場合では、キーワードの重要度が異なると考えられる。そこで、資料のタイトルに出現した語に対してはより大きなスコアを与え、段落の中の文に出現する語には小さなスコアを与えるようにする。この他に、単純に資料データに出現するキーワードの出現頻度やTF−IDF(Term Frequency−Inverse Document Frequency:用語頻度−逆文書頻度アルゴリズム)といった一般的な自然言語処理の指標を用いてもよい。
また、キーワード位置評価値を求める評価式Rは、以下に示す式によって算出される。
Figure 2007334670
上式のX1、X2は、各キーワードの資料データ中での出現位置(資料の行数)を示す。また、Xは、全キーワードの出現位置の平均値を示し、Nは、全キーワード数を示す。なお、全キーワードの出現位置の平均値を示すXの値は、一度選択され、評価されたキーワードを除いたキーワードの位置の平均値である。例えば、最初にキーワードX1が選択された場合、Xは、X2〜Xn(nは全キーワード数)の平均値となる。次にキーワードX2が選択されると、X3〜Xnの平均値となる。
キーワードの評価値が求められると、前処理部3は、評価値がしきい値以上のキーワードを求める(ステップS32)。求めたキーワードからステンドグラスの作成に使用する画像数が所定数以上となるようにキーワードを再度選択し、選択したキーワードに関連付けられた画像をステンドグラス画像の生成に使用する。
前処理部3からステンドグラス作成部5には、選択されたキーワードと、キーワードに関連付けられた画像を格納したデータベース8のアドレスとが通知される。また、インターネットを利用して取得した画像がある場合には、この画像もステンドグラス作成部5に出力される。また前処理部3は、入力した資料データと、資料データから抽出したテキストデータ、画像データとに識別情報を付し、データベース8に登録する。
次に、ステンドグラス作成部5の処理について説明する。ステンドグラス作成部5は、資料データから抽出したキーワードに応じて、ステンドグラスで表示する画像の領域を変更する。
例えば、キーワードが人物名であった場合、図8(A)に示すように画像データから顔画像を切り取る。ステンドグラスの作成の際には、この画像を代表する画像として切り取った顔画像を使用する。
また、キーワードに関連付けられた画像データに文字を含む場合には、図8(B)に示すように画像データの文字部分を取り出して、文字部分がステンドグラスに含まれるように加工する。
図9に示すフローチャートを参照しながらステンドグラス作成部5の処理手順を説明する。
ステンドグラス作成部5は、キーワードと、キーワードに関連する画像データを取得してステンドグラスを作成する。
まず、ステンドグラス作成部5は、キーワードが人名であるかどうかを判定する(ステップS41)。キーワードが人名であった場合には(ステップS41/YES)、画像データに含まれる人物の顔位置を検出する(ステップS42)。顔位置の検出は、例えば、エッジ検出によって顔のエッジ画像を検出することで求められる。また、顔画像データとエッジ画像から顔の中心線を求め、この中心線に基づき顔領域を決定してもよい。
また、人物の目の位置を検出して顔を判定してもよい。目の位置検出は、目と目の周辺との色差(肌色)、目の特徴(対称性、形状等)、目と他の領域(例えば、鼻、口、眉等)との関係を考慮して求めることができる。
顔位置を検出すると、ステンドグラス作成部5は、顔を中心に画像を切り出して、ステンドグラス画像の所定領域に表示されるように処理を行う(ステップS43)。
また、キーワードが人名ではなかった場合には(ステップS41/NO)、キーワードに関連付けされた画像データをOCR処理し、画像データ中にキーワードが含まれているかどうかを判定する(ステップS45)。画像データにキーワードが含まれている場合には(ステップS45/YES)、切り出す画像にキーワードが含まれるように加工処理を行う(ステップS46)。また、画像データにキーワードが含まれていなかった場合には(ステップS45/NO)、通常のステンドグラス処理を行う(ステップS47)。
なお、ステンドグラスを構成する画像の数は、任意に設定することができる。また、ステンドグラス作成部5は、作成したステンドグラス画像に識別情報を付し、このステンドグラス画像を作成した資料データに関連付けてデータベース8に格納する。
次に、表示制御部6の処理について説明する。表示制御部6は、データベース8からステンドグラス画像と、テキストデータを取得して図10に示すように表示装置7に表示させる。
ステンドグラス画像と共に表示するテキストデータは、資料データのタイトルであってもよい。また、資料データにもともと含まれる画像データをステンドグラス画像として表示している場合には、この画像データの近傍のテキストデータを表示させてもよい。
さらに、ステンドグラス画像を構成する画像と、テキストデータとの関係を明確にするために、各画像を取り囲む枠の色と、テキストデータの色とを同一の色で表示させてもよい。もしくは、ステンドグラス画像を構成する各画像の位置構成と同じ配置となるように、対応する各テキストデータを配置することもできる。
このような表示を表示装置7に表示させるための前処理部3の処理手順を図11に示すフローチャートを参照しながら説明する。
前処理部3は、ステンドグラス画像の作成に使用する画像データを選択すると(ステップS51/YES)、この画像データはもともと資料に含まれていた画像であるかどうかを判定する(ステップS52)。画像データが資料に含まれていたものであった場合には(ステップS52/YES)、資料の中で画像データの近傍に配置されたテキストデータを所定数以内で抽出する(ステップS53)。また、画像データが資料データに含まれていたものではなく、データベース8やインターネットを検索して取得したものであった場合には(ステップS52/NO)、キーワードを中心として、キーワードの近傍のテキストデータを所定数以内で抽出する(ステップS54)。
資料データから抽出した画像データ、データベース8やインターネットから抽出した画像データに対して上述の処理が終了すると(ステップS55/YES)、前処理部3は、抽出したテキストデータを資料データに関連付けて、データベース8に登録する(ステップS56)。以上の処理によって生成されたテキストデータを表示制御部6がデータベース8から読み出して表示装置7に表示させることで、図10に示す画像が表示される。
なお、図12には、図10に示す表示の別形態を示す。ステンドグラス画像を表示した時に、マウス等の入力デバイスによってステンドグラスの1画像が選択されると、図12に示すように抽出したテキストデータをステンドグラス画像に重ねて表示させる。
表示装置7に表示させる画像は、図10、12に示すものだけではなく、この他種々の表示形態が考えられる。図面を参照しながら表示装置7の表示例を説明する。
図13に示す表示例では、画像中に文字が含まれていた場合に、文字が読み取れるように文字を含む領域の画像を他の領域の画像よりも大きく表示させる。
ステンドグラス作成部5は、ステンドグラス画像を作成する際に、ステンドグラスを構成する画像に文字が含まれていた場合、文字が含まれるように画像を切り取る。
また図14に示す表示例では、ステンドグラス画像を表示した時に、マウス等の入力デバイスによってステンドグラスの1画像が選択されると、この画像を拡大表示させる。
データベース8には、ステンドグラスの一部に使用した画像と、これを所定倍率に拡大した拡大画像とを用意しておく。表示制御部6は、マウスによって画像が選択されると、選択された画像を拡大処理したステンドグラス画像を表示させる。
また、選択された画像を拡大表示させたステンドグラス画像を表示させるのではなく、図15に示すように選択された画像だけを拡大表示させてもよい。表示制御部6は、ステンドグラス画像の作成の際に切り取った部分画像ではなく、切り取る前の画像の全体を拡大表示させる。
この他に、図16に示す表示例では、マウスによって選択された画像に関連する他の画像を表示している。
キーワードごとに複数の画像候補(第1候補、第2候補)を用意し、第1候補の画像データをステンドグラスの一部を構成する画像とする。ステンドグラス画像を表示した時に、マウス等の入力デバイスによって画像が選択されると、この画像の第2候補をステンドグラス画像上に重ねて表示する。この時、画像の第2候補を1枚だけ表示するのではなく、第3候補や第4候補といった複数の候補をまとめてステンドグラス化して表示しても良い。このようにして複数の画像から資料の内容を判断することができ、ユーザの資料再認性を高めることができる。
さらに、マウス等によって画像が選択されると、図17に示すように選択された画像を含む資料のタイトルをステンドグラス画像に重ねて表示してもよい。
また、ステンドグラス画像から1画像が選択され拡大表示された後に、ユーザが該画像を含む資料データをダウンロードした場合、その画像がユーザのダウンロードをする際の有用な情報であったとみなし、次回、同じ検索キーワードが入力され同資料のステンドグラスを表示する場合には同画像の表示領域を拡大して表示する。
このようにして、履歴を用いることで検索キーワードごとにユーザの情報選択にとって有用な情報を残すことができる。
また、ステンドグラスの作成に使用する資料データの範囲を変更して複数のステンドグラス画像を作成してもよい。例えば、図18に示すように資料データの各ページから画像データやテキストを抽出して、資料の全内容を反映したステンドグラス画像を作成すると共に、各ページ内の画像データやテキストデータだけを使用したステンドグラス画像を作成しておく。
表示装置7に、まず資料データの全体を反映させたステンドグラス画像を表示して、1つの画像が選択されると、そのページの画像やテキストから作成したステンドグラス画像を表示させる。これによってユーザは、資料データの各ページの内容を簡単に認識することができる。
また、ステンドグラス画像を作成する時に、資料アイコンを表示させて、ユーザによって選択された範囲内のテキストデータや画像データを使用してステンドグラス画像を作成してもよい。図19(A)に示すように資料アイコンの全体が選択されると、資料の全体からキーワードや画像データを抽出してステンドグラス画像を生成する。また、図19(B)に示すように資料アイコンの一部が選択されると、選択された範囲に対応する一部の資料データからキーワードや画像データを抽出してステンドグラス画像を生成する。なお、ステンドグラスを構成する画像の数は、参照する資料データの範囲に応じて変更してもよい。
また、ステンドグラス画像の作成後は、ステンドグラスそれぞれの要素がカバーしている範囲を示すため、ステンドグラス画像の枠線の色と、対応する資料アイコンの範囲を示す表示色とを一致させて表示させても良い。
また、複数のステンドグラス画像を作成した時には、図20に示すように資料の全体をタイムラインで表示し、資料中のどの部分を用いてステンドグラス画像を作成したのかが分かるようにしてもよい。さらに、この場合もステンドグラスの個々の要素がタイムライン上でカバーしている範囲を明確に示すため、画像の枠線の色とタイムライン上の色を一致させて表示させても良い。
さらに、データベース8に格納した資料を表示装置7でフォルダ表示するときには、図21に示すようにフォルダに格納した資料内容を反映させたステンドグラスを表示させて、資料が一目で分かるようにしてもよい。
また、複数の資料をまとめて1つのフォルダに保存する時には、これらの資料に共通するキーワードを抽出して、このキーワードに関連する画像を取得してステンドグラスにしてもよい。なお、ステンドグラスに使用する画像を選択するときには、画像の色分散など特徴となる量が大きい画像を選択することで、資料の内容把握が容易になる。
上述した実施例は本発明の好適な実施例である。但しこれに限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々変形実施可能である。
例えば、ステンドグラス画像を作成する際に、資料データにもともと付加されていた画像と、データベース8やインターネットから補完した画像との区別がつくように画像を表示してもよい。例えばデータベース8やインターネットから補完した画像を、セピア、斜線、モノクロ等で表示することができる。
また、各ユーザが自身の端末にダウンロードした資料の履歴を記録しておき、この資料の履歴からステンドグラス画像を作成して、各ユーザが、どのような情報に興味があるかを判別できるようにしてもよい。
例えば、ユーザが以前、車の資料をダウンロードしていた場合には、車の画像をステンドグラス画像の一部に含ませる。また、この車の画像に関連付けて、新車情報や、メンテナンス情報などの様々な車に関する情報を登録しておく。ユーザがステンドグラス画像の車を選択すると、車に関する情報がユーザ端末に表示される(情報の推薦)。このようにして情報推薦サービスのユーザインターフェースとしても利用することができる。
また、キーワードに関連する画像がデータベース8に登録されていない場合、他のデータベースを参照して画像データを取得することもできる。また、データベース8の管理者に画像がデータベース8に登録されていない旨を通知してもよい。
また、上述した実施例ではキーワードのみによる画像の取得を行っていたが、キーワードに関連のある文書を入力して、関連文書文書検索による絞込みを行っても良い。具体的には、キーワードと、このキーワードが掲載されている関連文書(例えば、html文書)からキーワード候補を抽出する。キーワード候補は、キーワードとの類似度判定によって検出する。このようにして抽出したキーワードと、キーワード候補とからより適当な画像を選択して、ステンドグラスの要素とする。
画像処理装置の構成を示すブロック図である。 ステンドグラス画像の一例を示す図である。 プログラム処理によって本発明を実現するためのハードウェア構成を示す図である。 テキスト抽出部の処理手順を示すフローチャートである。 前処理部の処理手順を示すフローチャートである。 データベースを検索して、キーワードに関連する画像データを検出する手順を示すフローチャートである。 ステンドグラス作成に使用する画像を選択する手順を示すフローチャートである。 ステンドグラス作成部5の処理例を示す図である。 ステンドグラス作成部5の処理手順を示すフローチャートである。 表示制御部によって表示装置に表示される画像の一例を示す図である。 ステンドグラス画像と共に表示されるテキストデータを抽出する前処理部の処理手順を示すフローチャートである。 ステンドグラス画像の一例を示す図であって、選択画像に関連するテキストを表示した例である。 ステンドグラス画像の一例を示す図であって、テキストを含む画像を拡大表示した例である。 ステンドグラス画像の一例を示す図であって、マウスによって選択された画像を拡大表示したステンドグラス画像の例である。 ステンドグラス画像の一例を示す図であって、マウスによって選択された画像を拡大表示した例である。 ステンドグラス画像の一例を示す図であって、選択された画像に関連する他の画像を表示する例を示す図である。 ステンドグラス画像の一例を示す図であって、選択された画像を含む資料のタイトルを表示した例である。 ステンドグラス画像の一例を示す図であって、ステンドグラス画像を階層的に構成した例を示す図である。 ステンドグラス画像を作成する資料データの領域を選択する例を示す図である。 資料の全体をタイムラインで表示し、資料中のどの部分を用いたステンドグラス画像であるのかを表示した図である。 フォルダにステンドグラス画像を表示させた状態を示す図である。
符号の説明
1 資料入力部
2 テキスト抽出部
3 前処理部
4 検索部
5 ステンドグラス作成部
6 表示制御部
7 表示装置
8 データベース

Claims (14)

  1. 資料データから当該資料データの特徴を表すテキストデータを検出する検出手段と、
    前記検出手段の検出結果に基づいてデータベースを検索し、前記テキストデータに関連のある画像を取得する画像取得手段と、
    前記画像の所定領域を抽出する抽出手段と、
    複数の画像から抽出した前記所定領域の部分画像を一覧表示したサマリー画像を生成する画像生成手段と、
    を有することを特徴とする画像処理装置。
  2. 前記画像生成手段は、前記資料データに含まれる画像と、前記データベースを検索して取得した画像とを使用して前記サマリー画像を生成することを特徴とする請求項1記載の画像処理装置。
  3. 前記特徴を表すテキストデータは、資料のタイトル、資料に付けられた見出し、人名、会社名の少なくとも1つを含むことを特徴とする請求項1記載の画像処理装置。
  4. 前記抽出手段は、前記特徴を表すテキストデータが人名を表すデータであった場合に、顔画像が含まれるように前記所定領域の画像を抽出することを特徴とする請求項1から3のいずれか一項記載の画像処理装置。
  5. 前記抽出手段は、前記画像中に文字が含まれる場合に、該文字が含まれるように前記所定領域の画像を抽出することを特徴とする請求項1から3のいずれか一項記載の画像処理装置。
  6. 前記検出手段は、前記特徴を表すテキストデータを前記資料データの各ページから均等に抽出することを特徴とする請求項1記載の画像処理装置。
  7. 前記サマリー画像と、前記サマリー画像を構成する画像に関連のあるテキストデータとを表示する表示制御手段を有することを特徴とする請求項1から6のいずれか一項記載の画像処理装置。
  8. 前記表示制御手段は、前記サマリー画像を構成する画像の1つが選択されると、該画像に関連のあるテキストデータを前記サマリー画像に重ねて表示することを特徴とする請求項7記載の画像処理装置。
  9. 前記表示制御手段は、前記サマリー画像を構成する画像にテキストデータを含んでいた場合に、該テキストデータを含む画像を他の画像よりも拡大表示させることを特徴とする請求項7記載の画像処理装置。
  10. 前記表示制御手段は、前記サマリー画像を構成する画像の1つが選択されると、該画像を拡大表示することを特徴とする請求項7記載の画像処理装置。
  11. 前記表示制御手段は、前記サマリー画像を構成する画像の1つが選択されると、該画像に関連する他の画像を表示することを特徴とする請求項7記載の画像処理装置。
  12. 前記画像生成手段は、前記特徴を表すテキストデータを抽出する資料データの範囲を変更して、複数のサマリー画像を生成することを特徴とする請求項1記載の画像処理装置。
  13. 資料データから当該資料データの特徴を表すテキストデータを検出するステップと、
    前記特徴を表すテキストデータの検出結果に基づいてデータベースを検索し、前記テキストデータに関連のある画像を取得するステップと、
    前記画像の所定領域を抽出するステップと、
    複数の画像から抽出した前記所定領域の部分画像を一覧表示したサマリー画像を生成するステップと、
    を有することを特徴とする画像処理方法。
  14. 資料データから当該資料データの特徴を表すテキストデータを検出する処理と、
    前記特徴を表すテキストデータの検出結果に基づいてデータベースを検索し、前記テキストデータに関連のある画像を取得する処理と、
    前記画像の所定領域を抽出する処理と、
    複数の画像から抽出した前記所定領域の部分画像を一覧表示したサマリー画像を生成する処理と、
    をコンピュータに実行させることを特徴とするプログラム。
JP2006166407A 2006-06-15 2006-06-15 画像処理装置、方法及びプログラム Expired - Fee Related JP4952079B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006166407A JP4952079B2 (ja) 2006-06-15 2006-06-15 画像処理装置、方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006166407A JP4952079B2 (ja) 2006-06-15 2006-06-15 画像処理装置、方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2007334670A true JP2007334670A (ja) 2007-12-27
JP4952079B2 JP4952079B2 (ja) 2012-06-13

Family

ID=38934088

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006166407A Expired - Fee Related JP4952079B2 (ja) 2006-06-15 2006-06-15 画像処理装置、方法及びプログラム

Country Status (1)

Country Link
JP (1) JP4952079B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010237887A (ja) * 2009-03-31 2010-10-21 Denso It Laboratory Inc 情報提示装置、情報提示方法、情報提示システムおよびプログラム
JP2017045139A (ja) * 2015-08-24 2017-03-02 ヤフー株式会社 生成装置、生成方法、生成プログラム、端末装置、及び表示プログラム
JP2020154858A (ja) * 2019-03-20 2020-09-24 ヤフー株式会社 情報表示プログラム、情報表示装置、情報表示方法、配信装置、および制御サーバ

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003067382A (ja) * 2001-08-28 2003-03-07 Canon Inc 情報処理装置及びその方法
JP2005293577A (ja) * 2004-03-31 2005-10-20 Fuji Xerox Co Ltd ビデオ領域の高凝縮ビジュアル・サマリを生成する方法、装置及びプログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003067382A (ja) * 2001-08-28 2003-03-07 Canon Inc 情報処理装置及びその方法
JP2005293577A (ja) * 2004-03-31 2005-10-20 Fuji Xerox Co Ltd ビデオ領域の高凝縮ビジュアル・サマリを生成する方法、装置及びプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010237887A (ja) * 2009-03-31 2010-10-21 Denso It Laboratory Inc 情報提示装置、情報提示方法、情報提示システムおよびプログラム
JP2017045139A (ja) * 2015-08-24 2017-03-02 ヤフー株式会社 生成装置、生成方法、生成プログラム、端末装置、及び表示プログラム
JP2020154858A (ja) * 2019-03-20 2020-09-24 ヤフー株式会社 情報表示プログラム、情報表示装置、情報表示方法、配信装置、および制御サーバ

Also Published As

Publication number Publication date
JP4952079B2 (ja) 2012-06-13

Similar Documents

Publication Publication Date Title
US8726178B2 (en) Device, method, and computer program product for information retrieval
JP5223284B2 (ja) 情報検索装置、方法およびプログラム
US8429154B2 (en) Document search device, imaging forming apparatus, and document search system
JP5059545B2 (ja) 画像処理装置及び画像処理方法
JP2007286864A (ja) 画像処理装置、画像処理方法、プログラムおよび記録媒体
JP2010073114A6 (ja) 画像情報検索装置、画像情報検索方法およびそのコンピュータプログラム
JP2010072842A (ja) 画像処理装置および画像処理方法
CN103678460B (zh) 用于识别适于在多语言环境中进行通信的非文本元素的方法和系统
US9881001B2 (en) Image processing device, image processing method and non-transitory computer readable recording medium
JP6025487B2 (ja) フォレンジック分析システムおよびフォレンジック分析方法並びにフォレンジック分析プログラム
JP4952079B2 (ja) 画像処理装置、方法及びプログラム
JP2008052496A (ja) 画像表示装置、画像表示方法、プログラムおよび記録媒体
US9886627B2 (en) Document analysis server for recommending a storage destination of image data to an image processing apparatus
JPH08166959A (ja) 画像処理方法
CN108875570B (zh) 信息处理装置、存储介质和信息处理方法
JP7134814B2 (ja) システム、ページデータ出力方法、及びプログラム
JP3879810B2 (ja) 読取支援装置
JP2008071311A (ja) 画像検索装置、画像検索方法、画像検索プログラム、及び、情報記憶媒体
JP2021114225A (ja) ファイル検索システム、ファイル検索方法及びプログラム
JP5217513B2 (ja) 情報解析処理方法、情報解析処理プログラム、情報解析処理装置、情報登録処理方法、情報登録処理プログラム、情報登録処理装置、情報登録解析処理方法、および情報登録解析処理プログラム。
JP6303742B2 (ja) 画像処理装置、画像処理方法、および画像処理プログラム
JPH10162024A (ja) 電子ファイリング方法及び電子ファイリング装置
JP4548062B2 (ja) 画像処理装置
US10990338B2 (en) Information processing system and non-transitory computer readable medium
US20230030087A1 (en) Information processing apparatus, information processing method, and non-transitory computer readable medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090210

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110419

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110620

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120214

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120227

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150323

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees