JP2007334670A - 画像処理装置、方法及びプログラム - Google Patents
画像処理装置、方法及びプログラム Download PDFInfo
- Publication number
- JP2007334670A JP2007334670A JP2006166407A JP2006166407A JP2007334670A JP 2007334670 A JP2007334670 A JP 2007334670A JP 2006166407 A JP2006166407 A JP 2006166407A JP 2006166407 A JP2006166407 A JP 2006166407A JP 2007334670 A JP2007334670 A JP 2007334670A
- Authority
- JP
- Japan
- Prior art keywords
- image
- text data
- data
- images
- image processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】 資料データから当該資料データの特徴を表すテキストデータを検出して、検出結果に基づいてデータベース8を検索して、テキストデータに関連のある画像を取得する前処理部3と、画像の所定領域を抽出し、複数の画像から抽出した所定領域の部分画像を一覧表示したサマリー画像を生成するステンドグラス作成部5とを有する構成としている。資料データから資料の特徴を表すテキストデータを検出して、このキーワードに関連する画像で構成したサマリー画像を生成するので、資料の内容を簡単に確認することができ、短時間で目的の資料を検出することができる。
【選択図】 図1
Description
また、特許文献1は、テキストによる情報提示技術のため、例えばパワーポイント等の図や表を含むドキュメントの表示には対応できない。
このように本発明は、資料データの特徴を表すテキストデータを検出して、このキーワードに関連する画像で構成したサマリー画像を生成するので、資料の内容を簡単に確認することができ、短時間で目的の資料を検出することができる。
従って、資料に画像が含まれる場合には、資料に含まれる画像を活用することで、一度見た資料の検出が容易になる。
従って、テキストデータに人名が含まれていた場合に、人名を表す顔画像をサマリー画像に含めるので、資料の内容確認がさらに簡単になる。
従って、画像に含まれる文字を資料確認の有効な情報にすることができる。
従って、資料全体の内容を表すサマリー画像を生成することができる。
また、前記表示制御手段は、前記サマリー画像を構成する画像の1つが選択されると、該画像に関連のあるテキストデータを前記サマリー画像に重ねて表示するとよい。
従って、画像とテキストデータとを表示するので、資料の内容を簡単に確認することができる。
従って、画像に含まれる文字を資料確認の有効な情報にすることができる。
従って、サマリー画像から選択された画像を見やすいように表示することができる。
従って、資料の内容を簡単に確認することができる。
従って、ユーザの記憶に残っている資料範囲のサマリー画像を表示することができる。
また、表示制御部6は、ユーザの操作入力に従って、表示装置7に表示させるステンドグラスの形態を変更する。
テキスト抽出部2は、まず、入力した資料データがスキャナ等によって読み込まれたデータであるか否かを判定する(ステップS1)。スキャナによって読み込まれた資料データであった場合には(ステップS1/YES)、OCR(Optical Character Reader))によってテキストデータを抽出する(ステップS2)。
また、資料データがスキャナによって読み込んだデータではなかった場合には(ステップS1/NO)、資料データを電子的に解析して、テキストデータを取り出すことができるかどうかを判定する(ステップS3)。電子的に解析可能な資料データであった場合には(ステップS3/YES)、資料データからテキストデータを取り出す(ステップS4)。例えば、資料データがパワーポイントで作成されていれば、ppt extractorのソフトウェアを用いてテキストデータを抽出することができる。また、電子的に解析可能なデータではなかった場合には(ステップS3/NO)、OCRを用いてテキストデータを抽出する(ステップS5)。
この他に、資料データのエッジ検出を行って、画像領域を検出することもできる。テキスト領域はエッジ領域として検出され、画像領域では濃度一定のベタパターンが含まれることから、非エッジの領域として検出される。
また、前処理部3は、検索部4にキーワードを通知して、インターネットを利用した画像検索を行う。検索部4は、ブラウザソフトウェアを備えており、取得したキーワードに関連する画像データをインターネットから取得する。例えば、Googleのイメージ検索等を利用することができる。
キーワードに関連する画像データを検出すると、検出した画像データの中から、実際に使用する画像を選択する(ステップS16)。この処理の詳細については後述する。
前処理部3は、資料データからキーワードを抽出すると、データベース8を検索して、キーワードに関連付けされた画像データを検出する(ステップS21)。画像データを検出すると(ステップS22/YES)、この画像を格納するデータベースのアドレスを取得する(ステップS23)。この処理をS15のキーワード抽出で抽出されたすべてのキーワードについて行う(ステップS24)。
前処理部3は、まずキーワードを評価する評価値をキーワードごとに求める(ステップS31)。評価値Wは、以下に示す評価式によって算出される。この評価式は、キーワードを資料の全体から隔たりなく抽出するための評価式である。
W=A×キーワード重要度スコア+B×(キーワード位置評価値)
なお、変数AとBは重み付けの係数である。キーワード重要度スコアの算出は、例えば、キーワードが出現する資料の各部位に応じたスコアを予め定めておき、出現するキーワードのスコアを資料の部位に基づいて加算して求めることができる。例えば、資料のタイトルにキーワードが出現する場合と、大見出しに出現する場合、中見出しに出現する場合、段落の中の文中に出現する場合では、キーワードの重要度が異なると考えられる。そこで、資料のタイトルに出現した語に対してはより大きなスコアを与え、段落の中の文に出現する語には小さなスコアを与えるようにする。この他に、単純に資料データに出現するキーワードの出現頻度やTF−IDF(Term Frequency−Inverse Document Frequency:用語頻度−逆文書頻度アルゴリズム)といった一般的な自然言語処理の指標を用いてもよい。
例えば、キーワードが人物名であった場合、図8(A)に示すように画像データから顔画像を切り取る。ステンドグラスの作成の際には、この画像を代表する画像として切り取った顔画像を使用する。
また、キーワードに関連付けられた画像データに文字を含む場合には、図8(B)に示すように画像データの文字部分を取り出して、文字部分がステンドグラスに含まれるように加工する。
ステンドグラス作成部5は、キーワードと、キーワードに関連する画像データを取得してステンドグラスを作成する。
まず、ステンドグラス作成部5は、キーワードが人名であるかどうかを判定する(ステップS41)。キーワードが人名であった場合には(ステップS41/YES)、画像データに含まれる人物の顔位置を検出する(ステップS42)。顔位置の検出は、例えば、エッジ検出によって顔のエッジ画像を検出することで求められる。また、顔画像データとエッジ画像から顔の中心線を求め、この中心線に基づき顔領域を決定してもよい。
また、人物の目の位置を検出して顔を判定してもよい。目の位置検出は、目と目の周辺との色差(肌色)、目の特徴(対称性、形状等)、目と他の領域(例えば、鼻、口、眉等)との関係を考慮して求めることができる。
顔位置を検出すると、ステンドグラス作成部5は、顔を中心に画像を切り出して、ステンドグラス画像の所定領域に表示されるように処理を行う(ステップS43)。
ステンドグラス画像と共に表示するテキストデータは、資料データのタイトルであってもよい。また、資料データにもともと含まれる画像データをステンドグラス画像として表示している場合には、この画像データの近傍のテキストデータを表示させてもよい。
さらに、ステンドグラス画像を構成する画像と、テキストデータとの関係を明確にするために、各画像を取り囲む枠の色と、テキストデータの色とを同一の色で表示させてもよい。もしくは、ステンドグラス画像を構成する各画像の位置構成と同じ配置となるように、対応する各テキストデータを配置することもできる。
前処理部3は、ステンドグラス画像の作成に使用する画像データを選択すると(ステップS51/YES)、この画像データはもともと資料に含まれていた画像であるかどうかを判定する(ステップS52)。画像データが資料に含まれていたものであった場合には(ステップS52/YES)、資料の中で画像データの近傍に配置されたテキストデータを所定数以内で抽出する(ステップS53)。また、画像データが資料データに含まれていたものではなく、データベース8やインターネットを検索して取得したものであった場合には(ステップS52/NO)、キーワードを中心として、キーワードの近傍のテキストデータを所定数以内で抽出する(ステップS54)。
資料データから抽出した画像データ、データベース8やインターネットから抽出した画像データに対して上述の処理が終了すると(ステップS55/YES)、前処理部3は、抽出したテキストデータを資料データに関連付けて、データベース8に登録する(ステップS56)。以上の処理によって生成されたテキストデータを表示制御部6がデータベース8から読み出して表示装置7に表示させることで、図10に示す画像が表示される。
なお、図12には、図10に示す表示の別形態を示す。ステンドグラス画像を表示した時に、マウス等の入力デバイスによってステンドグラスの1画像が選択されると、図12に示すように抽出したテキストデータをステンドグラス画像に重ねて表示させる。
図13に示す表示例では、画像中に文字が含まれていた場合に、文字が読み取れるように文字を含む領域の画像を他の領域の画像よりも大きく表示させる。
ステンドグラス作成部5は、ステンドグラス画像を作成する際に、ステンドグラスを構成する画像に文字が含まれていた場合、文字が含まれるように画像を切り取る。
データベース8には、ステンドグラスの一部に使用した画像と、これを所定倍率に拡大した拡大画像とを用意しておく。表示制御部6は、マウスによって画像が選択されると、選択された画像を拡大処理したステンドグラス画像を表示させる。
また、選択された画像を拡大表示させたステンドグラス画像を表示させるのではなく、図15に示すように選択された画像だけを拡大表示させてもよい。表示制御部6は、ステンドグラス画像の作成の際に切り取った部分画像ではなく、切り取る前の画像の全体を拡大表示させる。
キーワードごとに複数の画像候補(第1候補、第2候補)を用意し、第1候補の画像データをステンドグラスの一部を構成する画像とする。ステンドグラス画像を表示した時に、マウス等の入力デバイスによって画像が選択されると、この画像の第2候補をステンドグラス画像上に重ねて表示する。この時、画像の第2候補を1枚だけ表示するのではなく、第3候補や第4候補といった複数の候補をまとめてステンドグラス化して表示しても良い。このようにして複数の画像から資料の内容を判断することができ、ユーザの資料再認性を高めることができる。
また、ステンドグラス画像から1画像が選択され拡大表示された後に、ユーザが該画像を含む資料データをダウンロードした場合、その画像がユーザのダウンロードをする際の有用な情報であったとみなし、次回、同じ検索キーワードが入力され同資料のステンドグラスを表示する場合には同画像の表示領域を拡大して表示する。
このようにして、履歴を用いることで検索キーワードごとにユーザの情報選択にとって有用な情報を残すことができる。
表示装置7に、まず資料データの全体を反映させたステンドグラス画像を表示して、1つの画像が選択されると、そのページの画像やテキストから作成したステンドグラス画像を表示させる。これによってユーザは、資料データの各ページの内容を簡単に認識することができる。
また、ステンドグラス画像の作成後は、ステンドグラスそれぞれの要素がカバーしている範囲を示すため、ステンドグラス画像の枠線の色と、対応する資料アイコンの範囲を示す表示色とを一致させて表示させても良い。
例えば、ユーザが以前、車の資料をダウンロードしていた場合には、車の画像をステンドグラス画像の一部に含ませる。また、この車の画像に関連付けて、新車情報や、メンテナンス情報などの様々な車に関する情報を登録しておく。ユーザがステンドグラス画像の車を選択すると、車に関する情報がユーザ端末に表示される(情報の推薦)。このようにして情報推薦サービスのユーザインターフェースとしても利用することができる。
2 テキスト抽出部
3 前処理部
4 検索部
5 ステンドグラス作成部
6 表示制御部
7 表示装置
8 データベース
Claims (14)
- 資料データから当該資料データの特徴を表すテキストデータを検出する検出手段と、
前記検出手段の検出結果に基づいてデータベースを検索し、前記テキストデータに関連のある画像を取得する画像取得手段と、
前記画像の所定領域を抽出する抽出手段と、
複数の画像から抽出した前記所定領域の部分画像を一覧表示したサマリー画像を生成する画像生成手段と、
を有することを特徴とする画像処理装置。 - 前記画像生成手段は、前記資料データに含まれる画像と、前記データベースを検索して取得した画像とを使用して前記サマリー画像を生成することを特徴とする請求項1記載の画像処理装置。
- 前記特徴を表すテキストデータは、資料のタイトル、資料に付けられた見出し、人名、会社名の少なくとも1つを含むことを特徴とする請求項1記載の画像処理装置。
- 前記抽出手段は、前記特徴を表すテキストデータが人名を表すデータであった場合に、顔画像が含まれるように前記所定領域の画像を抽出することを特徴とする請求項1から3のいずれか一項記載の画像処理装置。
- 前記抽出手段は、前記画像中に文字が含まれる場合に、該文字が含まれるように前記所定領域の画像を抽出することを特徴とする請求項1から3のいずれか一項記載の画像処理装置。
- 前記検出手段は、前記特徴を表すテキストデータを前記資料データの各ページから均等に抽出することを特徴とする請求項1記載の画像処理装置。
- 前記サマリー画像と、前記サマリー画像を構成する画像に関連のあるテキストデータとを表示する表示制御手段を有することを特徴とする請求項1から6のいずれか一項記載の画像処理装置。
- 前記表示制御手段は、前記サマリー画像を構成する画像の1つが選択されると、該画像に関連のあるテキストデータを前記サマリー画像に重ねて表示することを特徴とする請求項7記載の画像処理装置。
- 前記表示制御手段は、前記サマリー画像を構成する画像にテキストデータを含んでいた場合に、該テキストデータを含む画像を他の画像よりも拡大表示させることを特徴とする請求項7記載の画像処理装置。
- 前記表示制御手段は、前記サマリー画像を構成する画像の1つが選択されると、該画像を拡大表示することを特徴とする請求項7記載の画像処理装置。
- 前記表示制御手段は、前記サマリー画像を構成する画像の1つが選択されると、該画像に関連する他の画像を表示することを特徴とする請求項7記載の画像処理装置。
- 前記画像生成手段は、前記特徴を表すテキストデータを抽出する資料データの範囲を変更して、複数のサマリー画像を生成することを特徴とする請求項1記載の画像処理装置。
- 資料データから当該資料データの特徴を表すテキストデータを検出するステップと、
前記特徴を表すテキストデータの検出結果に基づいてデータベースを検索し、前記テキストデータに関連のある画像を取得するステップと、
前記画像の所定領域を抽出するステップと、
複数の画像から抽出した前記所定領域の部分画像を一覧表示したサマリー画像を生成するステップと、
を有することを特徴とする画像処理方法。 - 資料データから当該資料データの特徴を表すテキストデータを検出する処理と、
前記特徴を表すテキストデータの検出結果に基づいてデータベースを検索し、前記テキストデータに関連のある画像を取得する処理と、
前記画像の所定領域を抽出する処理と、
複数の画像から抽出した前記所定領域の部分画像を一覧表示したサマリー画像を生成する処理と、
をコンピュータに実行させることを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006166407A JP4952079B2 (ja) | 2006-06-15 | 2006-06-15 | 画像処理装置、方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006166407A JP4952079B2 (ja) | 2006-06-15 | 2006-06-15 | 画像処理装置、方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007334670A true JP2007334670A (ja) | 2007-12-27 |
JP4952079B2 JP4952079B2 (ja) | 2012-06-13 |
Family
ID=38934088
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006166407A Expired - Fee Related JP4952079B2 (ja) | 2006-06-15 | 2006-06-15 | 画像処理装置、方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4952079B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010237887A (ja) * | 2009-03-31 | 2010-10-21 | Denso It Laboratory Inc | 情報提示装置、情報提示方法、情報提示システムおよびプログラム |
JP2017045139A (ja) * | 2015-08-24 | 2017-03-02 | ヤフー株式会社 | 生成装置、生成方法、生成プログラム、端末装置、及び表示プログラム |
JP2020154858A (ja) * | 2019-03-20 | 2020-09-24 | ヤフー株式会社 | 情報表示プログラム、情報表示装置、情報表示方法、配信装置、および制御サーバ |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003067382A (ja) * | 2001-08-28 | 2003-03-07 | Canon Inc | 情報処理装置及びその方法 |
JP2005293577A (ja) * | 2004-03-31 | 2005-10-20 | Fuji Xerox Co Ltd | ビデオ領域の高凝縮ビジュアル・サマリを生成する方法、装置及びプログラム |
-
2006
- 2006-06-15 JP JP2006166407A patent/JP4952079B2/ja not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003067382A (ja) * | 2001-08-28 | 2003-03-07 | Canon Inc | 情報処理装置及びその方法 |
JP2005293577A (ja) * | 2004-03-31 | 2005-10-20 | Fuji Xerox Co Ltd | ビデオ領域の高凝縮ビジュアル・サマリを生成する方法、装置及びプログラム |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010237887A (ja) * | 2009-03-31 | 2010-10-21 | Denso It Laboratory Inc | 情報提示装置、情報提示方法、情報提示システムおよびプログラム |
JP2017045139A (ja) * | 2015-08-24 | 2017-03-02 | ヤフー株式会社 | 生成装置、生成方法、生成プログラム、端末装置、及び表示プログラム |
JP2020154858A (ja) * | 2019-03-20 | 2020-09-24 | ヤフー株式会社 | 情報表示プログラム、情報表示装置、情報表示方法、配信装置、および制御サーバ |
Also Published As
Publication number | Publication date |
---|---|
JP4952079B2 (ja) | 2012-06-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8726178B2 (en) | Device, method, and computer program product for information retrieval | |
JP5223284B2 (ja) | 情報検索装置、方法およびプログラム | |
US8429154B2 (en) | Document search device, imaging forming apparatus, and document search system | |
JP5059545B2 (ja) | 画像処理装置及び画像処理方法 | |
JP2007286864A (ja) | 画像処理装置、画像処理方法、プログラムおよび記録媒体 | |
JP2010073114A6 (ja) | 画像情報検索装置、画像情報検索方法およびそのコンピュータプログラム | |
JP2010072842A (ja) | 画像処理装置および画像処理方法 | |
CN103678460B (zh) | 用于识别适于在多语言环境中进行通信的非文本元素的方法和系统 | |
US9881001B2 (en) | Image processing device, image processing method and non-transitory computer readable recording medium | |
JP6025487B2 (ja) | フォレンジック分析システムおよびフォレンジック分析方法並びにフォレンジック分析プログラム | |
JP4952079B2 (ja) | 画像処理装置、方法及びプログラム | |
JP2008052496A (ja) | 画像表示装置、画像表示方法、プログラムおよび記録媒体 | |
US9886627B2 (en) | Document analysis server for recommending a storage destination of image data to an image processing apparatus | |
JPH08166959A (ja) | 画像処理方法 | |
CN108875570B (zh) | 信息处理装置、存储介质和信息处理方法 | |
JP7134814B2 (ja) | システム、ページデータ出力方法、及びプログラム | |
JP3879810B2 (ja) | 読取支援装置 | |
JP2008071311A (ja) | 画像検索装置、画像検索方法、画像検索プログラム、及び、情報記憶媒体 | |
JP2021114225A (ja) | ファイル検索システム、ファイル検索方法及びプログラム | |
JP5217513B2 (ja) | 情報解析処理方法、情報解析処理プログラム、情報解析処理装置、情報登録処理方法、情報登録処理プログラム、情報登録処理装置、情報登録解析処理方法、および情報登録解析処理プログラム。 | |
JP6303742B2 (ja) | 画像処理装置、画像処理方法、および画像処理プログラム | |
JPH10162024A (ja) | 電子ファイリング方法及び電子ファイリング装置 | |
JP4548062B2 (ja) | 画像処理装置 | |
US10990338B2 (en) | Information processing system and non-transitory computer readable medium | |
US20230030087A1 (en) | Information processing apparatus, information processing method, and non-transitory computer readable medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090210 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110419 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110620 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120214 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120227 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150323 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |