JP4952079B2 - 画像処理装置、方法及びプログラム - Google Patents
画像処理装置、方法及びプログラム Download PDFInfo
- Publication number
- JP4952079B2 JP4952079B2 JP2006166407A JP2006166407A JP4952079B2 JP 4952079 B2 JP4952079 B2 JP 4952079B2 JP 2006166407 A JP2006166407 A JP 2006166407A JP 2006166407 A JP2006166407 A JP 2006166407A JP 4952079 B2 JP4952079 B2 JP 4952079B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- keyword
- unit
- data
- detected
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
また、特許文献1は、テキストによる情報提示技術のため、例えばパワーポイント等の図や表を含むドキュメントの表示には対応できない。
本発明によれば、キーワードとの関連性が高い画像をサマリー画像として表示することができる。このため、資料の内容確認に適したサマリー画像をユーザに提供することができる。
本発明によれば、画像の近傍に配置されたテキストや、キーワードの近傍に配置されたテキストがサマリー画像と共に表示されるので、ユーザの資料の内容理解を補助する表示を提供することができる。
本発明によれば、検出手段が検出した各キーワードの重要度と、各キーワードの資料における出現位置とを評価した評価値を作成してキーワードを選択しているので、資料の内容確認に適した画像をサマリー画像として表示することができる。
本発明によれば、検出手段が検出した各キーワードの重要度と、各キーワードの資料における出現位置とを評価した評価値を作成してキーワードを選択しているので、資料の内容確認に適した画像をサマリー画像として表示することができる。
また、表示制御部6は、ユーザの操作入力に従って、表示装置7に表示させるステンドグラスの形態を変更する。
テキスト抽出部2は、まず、入力した資料データがスキャナ等によって読み込まれたデータであるか否かを判定する(ステップS1)。スキャナによって読み込まれた資料データであった場合には(ステップS1/YES)、OCR(Optical Character Reader))によってテキストデータを抽出する(ステップS2)。
また、資料データがスキャナによって読み込んだデータではなかった場合には(ステップS1/NO)、資料データを電子的に解析して、テキストデータを取り出すことができるかどうかを判定する(ステップS3)。電子的に解析可能な資料データであった場合には(ステップS3/YES)、資料データからテキストデータを取り出す(ステップS4)。例えば、資料データがパワーポイントで作成されていれば、ppt extractorのソフトウェアを用いてテキストデータを抽出することができる。また、電子的に解析可能なデータではなかった場合には(ステップS3/NO)、OCRを用いてテキストデータを抽出する(ステップS5)。
この他に、資料データのエッジ検出を行って、画像領域を検出することもできる。テキスト領域はエッジ領域として検出され、画像領域では濃度一定のベタパターンが含まれることから、非エッジの領域として検出される。
また、前処理部3は、検索部4にキーワードを通知して、インターネットを利用した画像検索を行う。検索部4は、ブラウザソフトウェアを備えており、取得したキーワードに関連する画像データをインターネットから取得する。例えば、Googleのイメージ検索等を利用することができる。
キーワードに関連する画像データを検出すると、検出した画像データの中から、実際に使用する画像を選択する(ステップS16)。この処理の詳細については後述する。
前処理部3は、資料データからキーワードを抽出すると、データベース8を検索して、キーワードに関連付けされた画像データを検出する(ステップS21)。画像データを検出すると(ステップS22/YES)、この画像を格納するデータベースのアドレスを取得する(ステップS23)。この処理をS15のキーワード抽出で抽出されたすべてのキーワードについて行う(ステップS24)。
前処理部3は、まずキーワードを評価する評価値をキーワードごとに求める(ステップS31)。評価値Wは、以下に示す評価式によって算出される。この評価式は、キーワードを資料の全体から隔たりなく抽出するための評価式である。
W=A×キーワード重要度スコア+B×(キーワード位置評価値)
なお、変数AとBは重み付けの係数である。キーワード重要度スコアの算出は、例えば、キーワードが出現する資料の各部位に応じたスコアを予め定めておき、出現するキーワードのスコアを資料の部位に基づいて加算して求めることができる。例えば、資料のタイトルにキーワードが出現する場合と、大見出しに出現する場合、中見出しに出現する場合、段落の中の文中に出現する場合では、キーワードの重要度が異なると考えられる。そこで、資料のタイトルに出現した語に対してはより大きなスコアを与え、段落の中の文に出現する語には小さなスコアを与えるようにする。この他に、単純に資料データに出現するキーワードの出現頻度やTF−IDF(Term Frequency−Inverse Document Frequency:用語頻度−逆文書頻度アルゴリズム)といった一般的な自然言語処理の指標を用いてもよい。
例えば、キーワードが人物名であった場合、図8(A)に示すように画像データから顔画像を切り取る。ステンドグラスの作成の際には、この画像を代表する画像として切り取った顔画像を使用する。
また、キーワードに関連付けられた画像データに文字を含む場合には、図8(B)に示すように画像データの文字部分を取り出して、文字部分がステンドグラスに含まれるように加工する。
ステンドグラス作成部5は、キーワードと、キーワードに関連する画像データを取得してステンドグラスを作成する。
まず、ステンドグラス作成部5は、キーワードが人名であるかどうかを判定する(ステップS41)。キーワードが人名であった場合には(ステップS41/YES)、画像データに含まれる人物の顔位置を検出する(ステップS42)。顔位置の検出は、例えば、エッジ検出によって顔のエッジ画像を検出することで求められる。また、顔画像データとエッジ画像から顔の中心線を求め、この中心線に基づき顔領域を決定してもよい。
また、人物の目の位置を検出して顔を判定してもよい。目の位置検出は、目と目の周辺との色差(肌色)、目の特徴(対称性、形状等)、目と他の領域(例えば、鼻、口、眉等)との関係を考慮して求めることができる。
顔位置を検出すると、ステンドグラス作成部5は、顔を中心に画像を切り出して、ステンドグラス画像の所定領域に表示されるように処理を行う(ステップS43)。
ステンドグラス画像と共に表示するテキストデータは、資料データのタイトルであってもよい。また、資料データにもともと含まれる画像データをステンドグラス画像として表示している場合には、この画像データの近傍のテキストデータを表示させてもよい。
さらに、ステンドグラス画像を構成する画像と、テキストデータとの関係を明確にするために、各画像を取り囲む枠の色と、テキストデータの色とを同一の色で表示させてもよい。もしくは、ステンドグラス画像を構成する各画像の位置構成と同じ配置となるように、対応する各テキストデータを配置することもできる。
前処理部3は、ステンドグラス画像の作成に使用する画像データを選択すると(ステップS51/YES)、この画像データはもともと資料に含まれていた画像であるかどうかを判定する(ステップS52)。画像データが資料に含まれていたものであった場合には(ステップS52/YES)、資料の中で画像データの近傍に配置されたテキストデータを所定数以内で抽出する(ステップS53)。また、画像データが資料データに含まれていたものではなく、データベース8やインターネットを検索して取得したものであった場合には(ステップS52/NO)、キーワードを中心として、キーワードの近傍のテキストデータを所定数以内で抽出する(ステップS54)。
資料データから抽出した画像データ、データベース8やインターネットから抽出した画像データに対して上述の処理が終了すると(ステップS55/YES)、前処理部3は、抽出したテキストデータを資料データに関連付けて、データベース8に登録する(ステップS56)。以上の処理によって生成されたテキストデータを表示制御部6がデータベース8から読み出して表示装置7に表示させることで、図10に示す画像が表示される。
なお、図12には、図10に示す表示の別形態を示す。ステンドグラス画像を表示した時に、マウス等の入力デバイスによってステンドグラスの1画像が選択されると、図12に示すように抽出したテキストデータをステンドグラス画像に重ねて表示させる。
図13に示す表示例では、画像中に文字が含まれていた場合に、文字が読み取れるように文字を含む領域の画像を他の領域の画像よりも大きく表示させる。
ステンドグラス作成部5は、ステンドグラス画像を作成する際に、ステンドグラスを構成する画像に文字が含まれていた場合、文字が含まれるように画像を切り取る。
データベース8には、ステンドグラスの一部に使用した画像と、これを所定倍率に拡大した拡大画像とを用意しておく。表示制御部6は、マウスによって画像が選択されると、選択された画像を拡大処理したステンドグラス画像を表示させる。
また、選択された画像を拡大表示させたステンドグラス画像を表示させるのではなく、図15に示すように選択された画像だけを拡大表示させてもよい。表示制御部6は、ステンドグラス画像の作成の際に切り取った部分画像ではなく、切り取る前の画像の全体を拡大表示させる。
キーワードごとに複数の画像候補(第1候補、第2候補)を用意し、第1候補の画像データをステンドグラスの一部を構成する画像とする。ステンドグラス画像を表示した時に、マウス等の入力デバイスによって画像が選択されると、この画像の第2候補をステンドグラス画像上に重ねて表示する。この時、画像の第2候補を1枚だけ表示するのではなく、第3候補や第4候補といった複数の候補をまとめてステンドグラス化して表示しても良い。このようにして複数の画像から資料の内容を判断することができ、ユーザの資料再認性を高めることができる。
また、ステンドグラス画像から1画像が選択され拡大表示された後に、ユーザが該画像を含む資料データをダウンロードした場合、その画像がユーザのダウンロードをする際の有用な情報であったとみなし、次回、同じ検索キーワードが入力され同資料のステンドグラスを表示する場合には同画像の表示領域を拡大して表示する。
このようにして、履歴を用いることで検索キーワードごとにユーザの情報選択にとって有用な情報を残すことができる。
表示装置7に、まず資料データの全体を反映させたステンドグラス画像を表示して、1つの画像が選択されると、そのページの画像やテキストから作成したステンドグラス画像を表示させる。これによってユーザは、資料データの各ページの内容を簡単に認識することができる。
また、ステンドグラス画像の作成後は、ステンドグラスそれぞれの要素がカバーしている範囲を示すため、ステンドグラス画像の枠線の色と、対応する資料アイコンの範囲を示す表示色とを一致させて表示させても良い。
例えば、ユーザが以前、車の資料をダウンロードしていた場合には、車の画像をステンドグラス画像の一部に含ませる。また、この車の画像に関連付けて、新車情報や、メンテナンス情報などの様々な車に関する情報を登録しておく。ユーザがステンドグラス画像の車を選択すると、車に関する情報がユーザ端末に表示される(情報の推薦)。このようにして情報推薦サービスのユーザインターフェースとしても利用することができる。
2 テキスト抽出部
3 前処理部
4 検索部
5 ステンドグラス作成部
6 表示制御部
7 表示装置
8 データベース
Claims (5)
- 資料データの画像領域を特定して画像を抽出する画像抽出手段と、
前記資料データから当該資料データの特徴を表すキーワードを検出する検出手段と、
前記検出手段が検出したキーワードに基づいてデータベースを検索し、前記キーワードに関連付けされた画像を取得する画像取得手段と、
前記画像抽出手段と前記画像取得手段とから画像を取得し、取得した画像の所定領域を部分画像として切り出す切出手段と、
前記切出手段が切り出した前記部分画像を一覧表示したサマリー画像を生成する画像生成手段とを有し、
前記切出手段は、前記検出手段が検出したキーワードが人名であると判定した場合、前記画像抽出手段又は前記画像取得手段から取得した画像から、エッジ検出又は目の位置検出により顔画像を検出して、該検出した顔画像を前記部分画像として切り出し、又、前記検出手段が検出したキーワードが人名ではないと判定した場合、前記画像抽出手段又は前記画像取得手段から取得した画像にテキストデータ抽出処理を行って、該画像に前記キーワードが含まれるか否かを判定し、前記キーワードが含まれると判定すると、前記部分画像に前記キーワードが含まれるように前記画像から前記部分画像を切り出すことを特徴とする画像処理装置。 - 前記画像取得手段は、前記キーワードを検索キーとするウェブ検索を行い、該ウェブ検索により得られた画像を取得する手段を備え、
前記画像抽出手段と前記画像取得手段との少なくとも一方から画像を取得し、取得した画像が、前記画像抽出手段から取得した画像である場合には、前記資料において、前記画像の近傍に配置されたテキストを抽出し、前記取得した画像が、前記画像取得手段が前記ウェブ検索により取得した画像である場合には、前記資料において、前記画像の取得に使用したキーワードの近傍に配置されたテキストを抽出するテキスト抽出手段を備え、
前記画像生成手段は、前記テキスト抽出手段が抽出したテキストを前記サマリー画像と共に表示させた画像を生成することを特徴とする請求項1記載の画像処理装置。 - 前記検出手段が検出したキーワードごとに、各キーワードの重要度と、各キーワードの資料における出現位置とを評価する評価値を生成して、各キーワードを評価する評価手段を備え、
前記切出手段は、前記評価手段の評価した評価値が所定値以上のキーワードを所定数選択し、該選択したキーワードを使用した前記データベース又は前記ウェブの検索により得られた画像から前記部分画像を切り出すことを特徴とする請求項2記載の画像処理装置。 - 前記評価手段は、キーワードの資料における出現位置に応じた評価値を予め設定しておき、各キーワードに、資料における出現位置に応じた評価値を付与して各キーワードの重要度を評価する評価値を算出するとともに、評価対象のキーワードが出現する前記資料中での位置を示す行数と、各キーワードの前記資料中での出現位置を示す行数の平均値との差の二乗を、前記検出手段が検出したキーワード数で除算した値を各キーワードごとに算出し、算出した各キーワードの値を加算して前記各キーワードの前記資料における出現位置を評価する評価値を算出することを特徴とする請求項3記載の画像処理装置。
- コンピュータを、
資料データの画像領域を特定して画像を抽出する画像抽出手段と、
前記資料データから当該資料データの特徴を表すキーワードを検出する検出手段と、
前記検出手段が検出したキーワードに基づいてデータベースを検索し、前記キーワードに関連付けされた画像を取得する画像取得手段と、
前記画像抽出手段と前記画像取得手段とから画像を取得し、取得した画像の所定領域を部分画像として切り出す手段であって、前記検出手段が検出したキーワードが人名であると判定した場合、前記画像抽出手段又は前記画像取得手段から取得した画像から、エッジ検出又は目の位置検出により顔画像を検出して、該検出した顔画像を前記部分画像として切り出し、又、前記検出手段が検出したキーワードが人名ではないと判定した場合、前記画像抽出手段又は前記画像取得手段から取得した画像にテキストデータ抽出処理を行って、該画像に前記キーワードが含まれるか否かを判定し、前記キーワードが含まれると判定すると、前記部分画像に前記キーワードが含まれるように前記画像から前記部分画像を切り出す切出手段と、
前記切出手段が切り出した前記部分画像を一覧表示したサマリー画像を生成する画像生成手段として機能させることを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006166407A JP4952079B2 (ja) | 2006-06-15 | 2006-06-15 | 画像処理装置、方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006166407A JP4952079B2 (ja) | 2006-06-15 | 2006-06-15 | 画像処理装置、方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007334670A JP2007334670A (ja) | 2007-12-27 |
JP4952079B2 true JP4952079B2 (ja) | 2012-06-13 |
Family
ID=38934088
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006166407A Expired - Fee Related JP4952079B2 (ja) | 2006-06-15 | 2006-06-15 | 画像処理装置、方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4952079B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5198339B2 (ja) * | 2009-03-31 | 2013-05-15 | 株式会社デンソーアイティーラボラトリ | 情報提示装置、情報提示方法、情報提示システムおよびプログラム |
JP6100849B2 (ja) * | 2015-08-24 | 2017-03-22 | ヤフー株式会社 | 生成装置、生成方法、生成プログラム、端末装置、及び表示プログラム |
JP6732984B1 (ja) * | 2019-03-20 | 2020-07-29 | ヤフー株式会社 | 情報表示プログラム、情報表示装置、情報表示方法、配信装置、および制御サーバ |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003067382A (ja) * | 2001-08-28 | 2003-03-07 | Canon Inc | 情報処理装置及びその方法 |
US7697785B2 (en) * | 2004-03-31 | 2010-04-13 | Fuji Xerox Co., Ltd. | Generating a highly condensed visual summary |
-
2006
- 2006-06-15 JP JP2006166407A patent/JP4952079B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2007334670A (ja) | 2007-12-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8429154B2 (en) | Document search device, imaging forming apparatus, and document search system | |
US8482808B2 (en) | Image processing apparatus and method for displaying a preview of scanned document data | |
US20090106699A1 (en) | Image processing device and image processing method | |
JP2007286864A (ja) | 画像処理装置、画像処理方法、プログラムおよび記録媒体 | |
US20110103689A1 (en) | System and method for obtaining document information | |
CN103678460B (zh) | 用于识别适于在多语言环境中进行通信的非文本元素的方法和系统 | |
US9213756B2 (en) | System and method of using dynamic variance networks | |
US9881001B2 (en) | Image processing device, image processing method and non-transitory computer readable recording medium | |
JP6025487B2 (ja) | フォレンジック分析システムおよびフォレンジック分析方法並びにフォレンジック分析プログラム | |
JP4952079B2 (ja) | 画像処理装置、方法及びプログラム | |
JP5827206B2 (ja) | 文書管理システムおよび文書管理方法並びに文書管理プログラム | |
JP2008052496A (ja) | 画像表示装置、画像表示方法、プログラムおよび記録媒体 | |
JP2006309347A (ja) | 対象文書からキーワードを抽出する方法、システムおよびプログラム | |
US9870632B2 (en) | Information processing apparatus and non-transitory computer readable medium | |
JP2008259199A (ja) | モノクロの印刷文書の自動カラー化 | |
JP3879810B2 (ja) | 読取支援装置 | |
JP7173314B2 (ja) | マッピング支援装置、マッピング支援方法、及びプログラム | |
JP2004157668A (ja) | 検索システム、検索方法および検索プログラム | |
JP7134814B2 (ja) | システム、ページデータ出力方法、及びプログラム | |
JP2006085234A (ja) | 電子文書作成装置、電子文書作成方法及び電子文書作成プログラム | |
JP2008071311A (ja) | 画像検索装置、画像検索方法、画像検索プログラム、及び、情報記憶媒体 | |
JP2021114225A (ja) | ファイル検索システム、ファイル検索方法及びプログラム | |
JP5217513B2 (ja) | 情報解析処理方法、情報解析処理プログラム、情報解析処理装置、情報登録処理方法、情報登録処理プログラム、情報登録処理装置、情報登録解析処理方法、および情報登録解析処理プログラム。 | |
JPH10162024A (ja) | 電子ファイリング方法及び電子ファイリング装置 | |
US20230030087A1 (en) | Information processing apparatus, information processing method, and non-transitory computer readable medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090210 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110419 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110620 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120214 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120227 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150323 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |