JP2010250359A - 擬似文書検索システム及び擬似文書検索方法 - Google Patents
擬似文書検索システム及び擬似文書検索方法 Download PDFInfo
- Publication number
- JP2010250359A JP2010250359A JP2009095789A JP2009095789A JP2010250359A JP 2010250359 A JP2010250359 A JP 2010250359A JP 2009095789 A JP2009095789 A JP 2009095789A JP 2009095789 A JP2009095789 A JP 2009095789A JP 2010250359 A JP2010250359 A JP 2010250359A
- Authority
- JP
- Japan
- Prior art keywords
- image
- document
- search
- term
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】文書中から取り出した画像から特徴量と、文書中から抽出した用語とをインデックスとして対応する画像に貼り付けることにより擬似文書を作成する。次に、画像の特徴量及び又は用語を検索クエリーとして擬似文書を検索する。この際、画像の特徴量及び又は用語に対する類似度の判定に対する重みを変更する。これにより、画像の見かけ上の類似度に対する概念軸と他の1つ又は複数の概念軸上における各類似度を尺度とした複数次元での検索を実現する。
【選択図】図2
Description
図1に、画像、用語及び文書間を横断的に検索するシステム(本明細書では「擬似文書検索システム」ともいう。)を示す。擬似文書検索システムは、文書(画像を含む文書)を格納するストレージ101と、前処理102によって生成された擬似文書(特徴量と文書から抽出された用語等をインデックスとして貼り付けた画像)を格納するストレージ103と、ストレージ101、103に対して所定の処理を実行する計算処理装置104とで構成される。
図2及び図3に、擬似文書検索システムで実行される処理機能の概要を説明する。具体的には、前処理102と画像、用語、文書の横断検索処理について説明する。これらの処理は、いずれも計算処理装置104の処理動作を通じて提供される。
次に、前述したシステム構成と処理手順を応用した一つ目の形態例を説明する。図6に示す形態例は、与えられる1つの概念軸を内容の類似度とし、画像の類似度と内容の類似度をインデックスの重みを調節することによって目的画像を検索する例に対応する。なお、前提としての前処理102は既に完了しており、ストレージ103にはインデックス化された擬似文書が格納されているものとする。
続いて、前述したシステム構成と処理手順を応用した二つ目の形態例を説明する。図7に示す形態例の場合も、与えられる1つの概念軸を内容の類似度とし、画像の類似度と内容の類似度をインデックスの重みを調節することによって目的画像を検索する例に対応する。
続いて、前述したシステム構成と処理手順を応用した三つ目の形態例を説明する。図8に示す形態例の場合、与えられる1つの概念軸を生物学的機能に関する内容の類似度とし、画像の類似度と生物学的機能に関する内容の類似度に対応するインデックスの重みをユーザがインタラクティブに調節することにより、目的の画像を検索する例に対応する。
続いて、前述したシステム構成と処理手順を応用した四つ目の形態例を説明する。図9に示す形態例は、与えられる1つの概念軸を疾患に関する内容の類似度とし、画像の類似度と疾患に関する内容の類似度に対するインデックスの重みをユーザがインタラクティブに調節することにより、目的の画像を検索する例に対応する。
続いて、前述した形態例を適用した場合における検索結果の具体的な表示例を示す。なお、以下の説明では、検索クエリーが画像と用語で与えられる場合について説明する。なお、この形態例の場合には、検索クエリーに用語を入れているが用語を入れない場合も考えられる。
なお、従来の用語ベースによる検索手法を利用して、特定の遺伝子を含むpathwayのhand writingのモデル画像(図)を検索する場合、pathwayと遺伝子名称を検索クエリーとして指定入力する。ただし、検索クエリーの条件がこれだけの場合、pathway以外の図も多く含まれるし、遺伝子名称が本文中には記述されていなくとも図に入っている場合はそのpathwayの図は検索されない。たまたま良い検索クエリーが入力された場合には、目的の画像を検索できることもあるが、最良の検索クエリーをユーザが事前に知ることは難しい。
以上の通り、形態例に係る擬似文書検索システムを採用することにより、複数軸のそれぞれについて類似度を自在に調整しながら目的の画像、目的の画像を含む文書、目的の画像に関連する文書、画像、用語、目的の文書に関連する画像、目的の用語に関連する画像等を検索することができる。例えば画像に対する類似度の重みを強めて見かけ上の画像の類似度を上げる一方で、テキスト情報の用語の重みを弱めて内容的な類似度を下げたり、その反対に画像に対する類似度の重みを弱めて見かけ上の画像の類似を下げる一方で、テキスト情報の用語の重みを強めて内容的な類似度を上げたりすることができる。
Claims (9)
- 画像とテキスト情報を含む文書から各画像の特徴量を取り出す手段と、
各画像の説明箇所についての用語を前記文書から抽出する手段と、
前記画像の特徴量と前記用語をインデックスとして対応する各画像に貼り付け、擬似文書を生成する手段と、
画像及び又は用語を検索クエリーとして入力する手段と、
前記検索クエリーを用いて前記擬似文書を検索する際、検索に使用する画像との類似度の判定に対する重みと検索に使用する用語との類似度の判定に対する重みをそれぞれ可変的に設定し、画像の見かけ上の類似度に対する概念軸と他の1つ又は複数の概念軸上における各類似度を尺度として、検索の目的に近い画像又は当該画像を含む文書を検索する手段と
を有することを特徴とする擬似文書検索システム。 - 画像とテキスト情報を含む文書から各画像の特徴量を取り出す手段と、
各画像の説明箇所についての用語を前記文書から抽出する手段と、
前記画像の特徴量と前記用語をインデックスとして対応する各画像に貼り付け、擬似文書を生成する手段と、
画像及び又は用語を検索クエリーとして入力する手段と、
前記検索クエリーを用いて前記擬似文書を検索する手段と、
前記検索クエリーと各擬似文書との類似度を、画像の見かけ上の類似度に対する概念軸と他の1つ又は複数の概念軸によって規定される座標空間上における座標点への画像又はプロットの表示を通じて提示する手段と
を有することを特徴とする擬似文書検索システム。 - 前記検索クエリーと関連性の高い用語を画面上に表示する手段を更に有する
ことを特徴とする請求項2に記載の擬似文書検索システム。 - 前記座標空間上の座標点及び又は前記関連性の高い用語に対するユーザの選択を受け付ける手段と、
ユーザが選択した座標点に関連付けられている擬似文書の特徴量及び用語並びにユーザが選択した前記用語のいずれか一つ又は組み合わせに基づいて検索クエリーを新たに生成し、当該検索クエリーを用いて前記擬似文書を検索する手段と
を有することを特徴とする請求項3に記載の擬似文書検索システム。 - ユーザが選択した座標点に関連付けられている擬似文書の特徴量及び用語並びにユーザが選択した前記用語に対応する各インデックスに対する重みをユーザの操作に応じて変更し、又は、ユーザが選択した座標点に関連付けられている擬似文書の特徴量及び用語並びにユーザが選択した前記用語に対応する各インデックスに対する重みを自動的に変更する
ことを特徴とする請求項4に記載の擬似文書検索システム。 - 前記検索クエリーと関連性の高い画像が含まれる文書のタイトル情報又は画像の説明文を画面上に表示する手段と、
前記座標空間上の座標点、前記関連性の高い用語、前記検索クエリーと関連性の高い画像が含まれる文書のタイトル情報若しくは前記説明文のいずれか一つ又は組み合わせに対するユーザの選択を受け付ける手段と、
ユーザの選択に基づいて検索クエリーを新たに生成し、当該検索クエリーを用いて前記擬似文書を検索する手段と
を有することを特徴とする請求項3又は4に記載の擬似文書検索システム。 - 前記他の1つ又は複数の概念軸のうち少なくとも1つの概念軸が、意味内容上の類似度を与える概念軸である
ことを特徴とする請求項1〜6のいずれか1項に記載の擬似文書検索システム。 - 画像が含まれる文書のうち画像の説明箇所以外の領域の用語と当該文書の構造化情報とを、当該画像に対応する補足文書として取り扱う
ことを特徴とする請求項1〜7のいずれか1項に記載の擬似文書検索システム。 - 各画像の特徴量を量子化して擬似単語を生成する手段と、
生成された擬似単語と前記用語に対応するインデックスの重み付けを変更する手段と
を更に有することを特徴とする請求項1〜8のいずれか1項に記載の擬似文書検索システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009095789A JP5414334B2 (ja) | 2009-04-10 | 2009-04-10 | 擬似文書検索システム及び擬似文書検索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009095789A JP5414334B2 (ja) | 2009-04-10 | 2009-04-10 | 擬似文書検索システム及び擬似文書検索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010250359A true JP2010250359A (ja) | 2010-11-04 |
JP5414334B2 JP5414334B2 (ja) | 2014-02-12 |
Family
ID=43312653
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009095789A Active JP5414334B2 (ja) | 2009-04-10 | 2009-04-10 | 擬似文書検索システム及び擬似文書検索方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5414334B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4979842B1 (ja) * | 2011-06-30 | 2012-07-18 | パナソニック株式会社 | 類似症例検索装置および類似症例検索方法 |
CN102958425A (zh) * | 2011-06-30 | 2013-03-06 | 松下电器产业株式会社 | 类似病例检索装置以及类似病例检索方法 |
US9378248B2 (en) | 2012-03-13 | 2016-06-28 | Nec Corporation | Retrieval apparatus, retrieval method, and computer-readable recording medium |
JP2018156333A (ja) * | 2017-03-16 | 2018-10-04 | ヤフー株式会社 | 生成装置、生成方法および生成プログラム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007109136A (ja) * | 2005-10-17 | 2007-04-26 | Fujitsu Ltd | 画像表示制御装置 |
JP2007264992A (ja) * | 2006-03-28 | 2007-10-11 | Konica Minolta Holdings Inc | 文書検索装置、文書検索方法、および文書検索プログラム |
-
2009
- 2009-04-10 JP JP2009095789A patent/JP5414334B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007109136A (ja) * | 2005-10-17 | 2007-04-26 | Fujitsu Ltd | 画像表示制御装置 |
JP2007264992A (ja) * | 2006-03-28 | 2007-10-11 | Konica Minolta Holdings Inc | 文書検索装置、文書検索方法、および文書検索プログラム |
Non-Patent Citations (2)
Title |
---|
CSNG200500726003; 増本 大器 他: '情報の視覚化 情報を眺めて選ぶマルチメディア検索システムMIRACLES' 情報の科学と技術 第54巻 第11号, 20041101, pp.582-588, 社団法人情報科学技術協会 Information Science and * |
JPN6013018858; 増本 大器 他: '情報の視覚化 情報を眺めて選ぶマルチメディア検索システムMIRACLES' 情報の科学と技術 第54巻 第11号, 20041101, pp.582-588, 社団法人情報科学技術協会 Information Science and * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4979842B1 (ja) * | 2011-06-30 | 2012-07-18 | パナソニック株式会社 | 類似症例検索装置および類似症例検索方法 |
CN102958425A (zh) * | 2011-06-30 | 2013-03-06 | 松下电器产业株式会社 | 类似病例检索装置以及类似病例检索方法 |
US8953857B2 (en) | 2011-06-30 | 2015-02-10 | Panasonic Corporation | Similar case searching apparatus and similar case searching method |
US9378248B2 (en) | 2012-03-13 | 2016-06-28 | Nec Corporation | Retrieval apparatus, retrieval method, and computer-readable recording medium |
JP2018156333A (ja) * | 2017-03-16 | 2018-10-04 | ヤフー株式会社 | 生成装置、生成方法および生成プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5414334B2 (ja) | 2014-02-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8706740B2 (en) | Concept-structured image search | |
JP2003167914A (ja) | マルチメディア情報検索方法、プログラム、記録媒体及びシステム | |
JP5159772B2 (ja) | 文書検索装置及び文書検索方法 | |
US20120162244A1 (en) | Image search color sketch filtering | |
JP2011248596A (ja) | 画像入り文書の検索システム及び検索方法 | |
Qian et al. | HWVP: hierarchical wavelet packet descriptors and their applications in scene categorization and semantic concept retrieval | |
Wang et al. | JIGSAW: interactive mobile visual search with multimodal queries | |
KR20190118744A (ko) | 딥러닝 기반의 지식 구조 생성 방법을 활용한 의료 문헌 구절 검색 방법 및 시스템 | |
JP2011128773A (ja) | 画像検索装置、画像検索方法及びプログラム | |
JP2007080061A (ja) | Webページの検索方法及びWebページのクラスタリング方法 | |
Lokoč et al. | Revisiting SIRET video retrieval tool | |
JP5414334B2 (ja) | 擬似文書検索システム及び擬似文書検索方法 | |
JP5433396B2 (ja) | マンガ画像からテキストを抽出するマンガ画像解析装置、プログラム、検索装置及び方法 | |
Fan et al. | A novel approach to enable semantic and visual image summarization for exploratory image search | |
Liu et al. | Robust semantic sketch based specific image retrieval | |
US20160283520A1 (en) | Search device, search method, and computer program product | |
Dinov et al. | Natural language processing/text mining | |
JP6303669B2 (ja) | 資料検索装置、資料検索システム、資料検索方法、及び、プログラム | |
JP4453440B2 (ja) | 視覚的情報分類方法及び装置及びプログラム及び視覚的情報分類プログラムを記録した記憶媒体 | |
Agin et al. | An approach to the segmentation of multi-page document flow using binary classification | |
Diem et al. | Semi-automated document image clustering and retrieval | |
Yeh et al. | A case for query by image and text content: searching computer help using screenshots and keywords | |
Richter et al. | Leveraging community metadata for multimodal image ranking | |
Gao et al. | An Interactive Appearance-based Document Retrieval System for Historical Newspapers. | |
JP2011248827A (ja) | 言語横断型情報検索方法、言語横断型情報検索システム及び言語横断型情報検索プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120131 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130412 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130423 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130621 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131015 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131112 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5414334 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |