JP2004259061A - 情報検索装置、情報検索方法、及び情報検索プログラム - Google Patents

情報検索装置、情報検索方法、及び情報検索プログラム Download PDF

Info

Publication number
JP2004259061A
JP2004259061A JP2003049988A JP2003049988A JP2004259061A JP 2004259061 A JP2004259061 A JP 2004259061A JP 2003049988 A JP2003049988 A JP 2003049988A JP 2003049988 A JP2003049988 A JP 2003049988A JP 2004259061 A JP2004259061 A JP 2004259061A
Authority
JP
Japan
Prior art keywords
information
search
image data
genotype
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003049988A
Other languages
English (en)
Inventor
Katsunobu Isono
勝宣 磯野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Intec Web and Genome Informatics
Original Assignee
Intec Web and Genome Informatics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Intec Web and Genome Informatics filed Critical Intec Web and Genome Informatics
Priority to JP2003049988A priority Critical patent/JP2004259061A/ja
Publication of JP2004259061A publication Critical patent/JP2004259061A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

【課題】画像データをはじめとする任意の情報を検索する際に、提示する情報の多様性を保持しつつ、検索者の検索意図を十分に反映した上で徐々に評価判断すべき検索候補の範囲を適切に絞り込み、極めて効率のよい情報検索を行う。
【解決手段】情報検索装置10は、画像データを表示する表示装置11と、検索者が入力操作を行うための入力装置12と、検索者の入力に基づいて画像データを検索する画像検索部13と、検索対象となる複数の検索画像データIDを含む各種情報を記憶した画像記憶装置14とを備える。画像検索部13は、入力装置12を介して選択された画像データと画像記憶装置14に蓄積されている検索画像データIDとの類似度を算出し、この類似度に基づいて検索者の嗜好に対する適応度を算出し、この適応度に基づいて次回の検索サイクルで提示する候補画像データを決定する。
【選択図】 図1

Description

【0001】
【発明の属する技術分野】
本発明は、蓄積されている複数の情報から所望の情報を検索する情報検索装置、情報検索方法、及び情報検索プログラムに関する。
【0002】
【従来の技術】
近年、コンピュータ等の各種情報処理装置の処理能力の向上、及びこれら情報処理装置に付随する記憶装置の記憶容量の増大にともない、例えば画像データ等の各種情報を大量に記憶し、処理することが可能となっている。この種の情報処理技術のうち、大量の画像データの中から検索者が所望の画像データを検索する画像検索技術が各種提案されている。
【0003】
例えば、画像検索技術としては、検索者が所望する画像データに類似した画像データを当該検索者が選択入力し、画像データが有する画像特徴に基づいて、当該検索者が選択した画像データと画像データベース内に蓄積された画像データとの類似度を算出し、類似度の高い画像データを検索画像として表示する方式のものがある(例えば、特許文献1乃至特許文献3参照。)。
【0004】
【特許文献1】
特開平2−48772号公報
【特許文献2】
特開2001−101407号公報
【特許文献3】
特開2001−319232号公報
【0005】
具体的には、特許文献1には、入力画像から抽出した特徴をもとにインデックスファイルを作成するとともに、入力画像の特徴及び蓄積用画像をインデックスファイルをもとに蓄積しておき、提示された入力例示画像から画像の類似度を評価するために、入力画像の特徴から評価尺度を計算し、さらに、得られた評価尺度から類似度を決定し、この決定された類似度に基づいて候補順位を付け、その類似度による分類と候補順位にしたがい、画像データベースから必要な画像を検索する類似画像検索方法が開示されている。これにより、この類似画像検索方法は、あらゆる画像を評価尺度により定量的に分類することができ、画像内容に即した人間の感覚に合う検索を実現することができるとしている。
【0006】
また、特許文献2には、所定の制約条件に基づいてカラーアピアランスモデルのモデルパラメータを算出し、このモデルパラメータに基づいて、キー画像又はサーチ画像のいずれか一方のヒストグラムを正規化し、さらに、正規化処理した一方の画像のヒストグラムと他方の画像のヒストグラムとの類似度を算出し、この算出された類似度に基づいて、そのサーチ画像が検索の候補画像であるか否かを判定する類似情報検索装置が開示されている。これにより、この類似情報検索装置は、キー画像とサーチ画像との照明条件が異なる場合であっても、類似度検索を高精度で行うことができるとしている。
【0007】
さらに、特許文献3には、入力された画像データから複数種類の特徴量を抽出し、これら複数種類の特徴量と、蓄積された画像データから抽出された複数種類の特徴量とを比較し、これら両画像データの類似度を算出し、この算出された類似度に基づいて、入力された画像データに類似する画像データを検索する類似情報検索装置が開示されている。これにより、この類似情報検索装置は、グラデーションや模様、テクスチャに特徴がある画像を有効に検索し、検索精度を向上させることができるとしている。
【0008】
【発明が解決しようとする課題】
ところで、一般に、検索者が当初から検索したい画像データのイメージを明確に把握している場合は少ない。そのため、画像データを検索するに際しては、少なくとも検索初期段階では多様性を保持した画像データを提示する必要があり、提示された画像データの中から検索者が所望の画像データを選択する検索サイクルを繰り返し行うことによって画像データの絞り込みを行うというプロセスが必要となる。
【0009】
ここで、上述した特許文献1乃至特許文献3に代表される画像検索技術は、検索者が選択した画像データと画像データベース内に蓄積された画像データとの類似度を基準とし、当該類似度の近い順序で検索結果を求めるものである。したがって、この種の画像検索技術においては、選択した画像データに類似する周辺の画像データのみが次候補の画像データとして提示されてしまい、次候補の画像データに多様性がなく、また、検索者が十分に検討するに足りる画像データを検索することなく直ちに収束してしまい、局所解に陥る可能性が高い。また、この種の画像検索技術においては、検索者が最初にどのような画像データを選択するかによって検索効率が影響を受けてしまうことも考えられる。
【0010】
また、画像データを検索するに際して多様性を保持した画像データを提示するために、候補としての画像データの一部に、無作為に抽出した画像データを提示していくことも考えられるが、この方式では、検索効率が極めて悪いという問題が容易に想定される。
【0011】
なお、これらの問題は、画像データの検索のみならず、抽出した特徴に基づく類似度を用いて検索するものであれば、任意の情報についても生じるものである。
【0012】
本発明は、このような実情に鑑みてなされたものであり、画像データをはじめとする任意の情報を検索する際に、提示する情報の多様性を保持しつつ、検索者の検索意図を十分に反映した上で徐々に評価判断すべき検索候補の範囲を適切に絞り込み、極めて効率のよい情報検索を行うことができる情報検索装置、情報検索方法、及び情報検索プログラムを提供することを目的とする。
【0013】
【課題を解決するための手段】
上述した目的を達成する本発明にかかる情報検索装置は、蓄積されている複数の情報から所望の情報を検索する情報検索装置であって、少なくとも、検索対象となる複数の検索情報と、これら検索情報について抽出された複数種類の特徴のそれぞれの特徴量とを対応付けて記憶する記憶手段と、この記憶手段に蓄積されている検索情報の少なくとも一部を候補情報として提示する提示手段と、この提示手段を介して提示された複数の候補情報の中から、検索者が一の情報を選択するための入力手段と、この入力手段を介して選択された情報に基づいて、記憶手段に蓄積されている検索情報の中から所望の情報を検索する検索手段とを備え、検索手段は、入力手段を介して選択された情報と記憶手段に蓄積されている情報との類似度を算出し、類似度に基づいて検索者の嗜好に対する適応度を算出し、適応度に基づいて次回提示手段を介して提示する候補情報を決定することを特徴としている。
【0014】
このような本発明にかかる情報検索装置は、入力手段を介して選択された情報と記憶手段に蓄積されている情報との類似度に基づいて算出される適応度に基づいて、次回提示する候補情報を決定することにより、候補情報の多様性を保持することができ、局所解に陥るのを回避することができる。したがって、本発明にかかる情報検索装置は、文脈に依存する検索者の検索意図を十分に汲み取った上で徐々に評価判断すべき検索候補の範囲を適切に絞り込むことができ、極めて効率のよい検索を行うことができる。
【0015】
ここで、検索手段は、検索者が入力手段を介して現在までに選択した情報の履歴である選択履歴に基づく情報を用いて適応度を算出する。
【0016】
これにより、本発明にかかる情報検索装置は、より有効な主観推測を行うことが可能となる。
【0017】
また、検索手段は、進化計算法における選択・交叉オペレーションを行い、記憶手段に蓄積されている情報のうち、生成した子孫としての遺伝子型との類似度の高い情報を、次回提示手段を介して提示する候補情報として決定する。
【0018】
より具体的には、検索手段は、進化計算法における選択オペレーションを行い、適応度に基づいて親となる遺伝子型を選択し、選択した親となる遺伝子型に対して進化計算法における交叉オペレーションを行い、子孫としての遺伝子型を生成する。
【0019】
これにより、本発明にかかる情報検索装置は、候補情報の多様性を保持することができる。
【0020】
また、検索手段は、親となる遺伝子型に対して進化計算法における突然変異オペレーションを確率的に行い、子孫としての遺伝子型を生成することにより、より多様性に富む候補情報を提示することができる。
【0021】
このとき、検索手段は、記憶手段に蓄積されている情報についての複数種類の特徴ベクトルをコード化し、親となる遺伝子型とする。
【0022】
また、検索手段は、子孫としての遺伝子型との類似度の高い情報である代表情報が、複数の子孫としての遺伝子型間で共通する場合には、重複する代表情報を省く処理を行う。
【0023】
これにより、本発明にかかる情報検索装置は、候補情報の数が少なくなるのを回避し、より多様性に富む候補情報を提示することができる。
【0024】
また、本発明にかかる情報検索装置は、提示手段を介して提示された複数の候補情報の中から、検索者が入力手段を介して一の情報を選択する検索サイクルを繰り返し行うことを特徴としている。特に、提示手段は、初回の検索サイクル時には、記憶手段に蓄積されている複数の検索情報の中から無作為に選択された情報を、候補情報として提示することを特徴としている。
【0025】
このように、本発明にかかる情報検索装置は、検索候補として提示される複数の候補情報の中から検索者が所望の情報を選択する検索サイクルを繰り返し行い、情報の絞り込み検索を行う対話型検索を行うことにより、検索者のイメージが当初は曖昧であったとしても、検索サイクルの反復に応じてイメージが明確化され、自己の感性に最も合致する所望の情報を検索することが可能となる。
【0026】
なお、本発明にかかる情報検索装置によって検索する情報としては、画像データを挙げることができ、この場合、提示手段は、画像データを表示する表示手段として構成することができる。また、本発明にかかる情報検索装置によって検索する情報としては、音声データも挙げることができ、この場合、提示手段は、音声データを出力する出力手段として構成することができる。
【0027】
また、上述した目的を達成する本発明にかかる情報検索方法は、蓄積されている複数の情報から所望の情報を検索する情報検索方法であって、少なくとも、検索対象となる複数の検索情報と、これら検索情報について抽出された複数種類の特徴のそれぞれの特徴量とを対応付けて記憶する記憶手段に蓄積されている検索情報の少なくとも一部を候補情報として提示する提示工程と、この提示工程にて提示された複数の候補情報の中から、検索者が一の情報を選択する選択工程と、この選択工程にて選択された情報に基づいて、記憶手段に蓄積されている検索情報の中から所望の情報を検索する検索工程とを備え、検索工程では、選択工程にて選択された情報と記憶手段に蓄積されている情報との類似度が算出され、類似度に基づいて検索者の嗜好に対する適応度が算出され、適応度に基づいて次回提示する候補情報が決定されることを特徴としている。
【0028】
このような本発明にかかる情報検索方法は、選択された情報と記憶手段に蓄積されている情報との類似度に基づいて算出される適応度に基づいて、次回提示する候補情報を決定することにより、候補情報の多様性を保持することができ、局所解に陥るのを回避することが可能となる。したがって、本発明にかかる情報検索方法は、文脈に依存する検索者の検索意図を十分に汲み取った上で徐々に評価判断すべき検索候補の範囲を適切に絞り込むことが可能となり、極めて効率のよい検索を行うことが可能となる。
【0029】
さらに、上述した目的を達成する本発明にかかる情報検索プログラムは、蓄積されている複数の情報から所望の情報を検索するコンピュータ実行可能な情報検索プログラムであって、少なくとも、検索対象となる複数の検索情報と、これら検索情報について抽出された複数種類の特徴のそれぞれの特徴量とを対応付けて記憶する記憶手段に蓄積されている検索情報の少なくとも一部を候補情報として提示する提示処理と、この提示処理にて提示された複数の候補情報の中から検索者によって選択された情報に基づいて、記憶手段に蓄積されている検索情報の中から所望の情報を検索する検索処理とを備え、検索処理では、選択された情報と記憶手段に蓄積されている情報との類似度が算出され、類似度に基づいて検索者の嗜好に対する適応度が算出され、適応度に基づいて次回提示する候補情報が決定されることを特徴としている。
【0030】
このような本発明にかかる情報検索プログラムは、選択された情報と記憶手段に蓄積されている情報との類似度に基づいて算出される適応度に基づいて、次回提示する候補情報を決定することにより、候補情報の多様性を保持することができ、局所解に陥るのを回避することが可能となる。したがって、本発明にかかる情報検索プログラムを実行する機器は、文脈に依存する検索者の検索意図を十分に汲み取った上で徐々に評価判断すべき検索候補の範囲を適切に絞り込むことが可能となり、極めて効率のよい検索を行うことが可能となる。
【0031】
【発明の実施の形態】
以下、本発明を適用した具体的な実施の形態について図面を参照しながら詳細に説明する。
【0032】
この実施の形態は、複数の画像データを蓄積した事例データベースから所望の画像データを検索する情報検索装置である。この情報検索装置は、検索候補として提示される複数の画像データの中から検索者が所望の画像データを選択する検索サイクルを繰り返し行うことにより、画像データの絞り込み検索を行う対話型検索を行うものであり、検索しようとする画像データに類似していると感じられる画像データを検索者に選択させながら、評価判断すべき検索候補の範囲を自動的に絞り込むものである。
【0033】
特に、この情報検索装置は、選択された画像データと蓄積されている画像データとの類似度に基づいて算出される適応度に基づいて、次回提示する画像データを決定するものである。これにより、この情報検索装置は、提示する画像データの多様性を保持しつつ、検索者が現在までにどのような画像データを選択してきたかといった文脈(選択履歴)に基づいて徐々に評価判断すべき検索候補の範囲を自動的に絞り込むことができるような大域的及び局所的文脈情報を用いた新たな検索手法を提案するものである。
【0034】
図1に示すように、情報検索装置10は、画像データを表示する提示手段としての表示装置11と、検索者が入力操作を行うための入力手段である入力装置12と、検索者の入力に基づいて画像データを検索する検索手段である画像検索部13と、検索対象となる複数の検索画像データIDを含む各種情報を記憶した記憶手段である画像記憶装置14とを備える。
【0035】
表示装置11は、例えばCRT(Cathode Ray Tube)やLCD(Liquid Crystal Display)等の任意の表示デバイスから構成される。表示装置11は、画像記憶装置14に蓄積されている画像データの少なくとも一部を候補画像データとして表示し、検索者に提示する。
【0036】
入力装置12は、例えばキーボードやマウスといったデバイスから構成され、データの入力が可能なヒューマンインターフェースとして構成される。この入力装置12を介して検索者によって入力された情報は、画像検索部13に供給される。
【0037】
画像検索部13は、入力装置12を介した検索者の入力に基づいて、画像記憶装置14に蓄積されている複数の検索画像データIDの中から検索結果としての所望の画像データを求める。画像検索部13は、検索した画像データを表示装置13に供給する。なお、この画像検索部13は、例えばCD−ROM等の記録媒体や所定のネットワークを介して提供されるコンピュータによって実行可能なプログラムとして構成することも可能である。
【0038】
画像記憶装置14は、例えば、CD−ROM等の着脱可能な記録媒体や、ハードディスクやこれらハードディスクを複数台用いていわゆるRAID(Redundant Arrays of Independent (Inexpensive) Disks)構成とした装置といった所定の記憶装置から構成され、少なくとも、検索対象となる複数の検索画像データIDと、これら検索画像データについて抽出された複数種類の特徴のそれぞれの特徴量を示す特徴データFDとを対応付けて記憶する。なお、画像データの特徴としては、例えばカラーヒストグラム、濃淡分布、周波数分布等、任意のものを採用することができ、特徴の抽出方法も既存の技術を任意に適用することができる。画像記憶装置14には、これら複数種類の特徴毎に抽出された特徴量を示す値が特徴データFDとして記憶される。また、画像記憶装置14には、上述した選択履歴を記述した選択履歴情報SHが格納される。画像記憶装置14に記憶されたこれらの情報は、画像検索部13によって読み出される。
【0039】
このような各部を備える情報検索装置10は、図2に示すような一連の工程を経ることにより、複数の検索画像データIDの中から所望の画像データを検索する。
【0040】
まず、情報検索装置10は、同図に示すように、ステップS1において、画像検索部13の制御のもとに、表示装置11に対して表示するM枚の画像データを、画像記憶装置14に蓄積されている複数の検索画像データIDの中から無作為に選択し、ステップS2において、選択されたM枚の画像データを候補画像データとして表示装置11に対して表示する。ここで、画像データの枚数Mは、表示装置11に対して一度に表示可能な候補画像データの枚数を示すものである。すなわち、情報検索装置10は、表示装置11に対して9枚の候補画像データを一度に表示可能である場合には、例えば図3(A)に示すように、表示装置11に対して9枚の候補画像データをサムネイル形式で表示する。
【0041】
続いて、情報検索装置10においては、図2中ステップS3において、表示装置11に対して表示されたM枚の候補画像データの中に、所望の画像データが存在するか否かを検索者によって判断する。
【0042】
ここで、情報検索装置10は、検索者が所望の画像データが存在するものと判断した場合には、当該検索者が入力装置12を介して所定の入力操作を行うことにより、一連の処理を終了する。
【0043】
一方、情報検索装置10においては、検索者が所望の画像データが存在しないものと判断した場合には、ステップS4において、表示装置11に対して表示されたM枚の候補画像データの中から、当該検索者が検索しようとしている所望の画像データのイメージに最も近い1枚の画像データを、入力装置12を介して選択指定する。なお、以下では、この選択指定された画像データをキー画像データと称するものとする。情報検索装置10は、画像検索部13の制御のもとに、検索者によって選択指定されたキー画像データを示す画像番号を、選択履歴情報SHとして画像記憶装置14に格納する。
【0044】
なお、情報検索装置10は、表示装置11に対して表示されたM枚の候補画像データの中に、検索者が所望する画像データに類似する画像データが含まれていない場合、すなわち、表示装置11に対して表示されたM枚の候補画像データが、検索者が検索しようとする画像データに関連がなく、新たに候補画像データを表示させたい場合には、入力装置12を介した検索者による所定の入力操作に応じて、新たなM枚の候補画像データを表示装置11に対して表示する。また、情報検索装置10は、入力装置12を介した検索者による所定の入力操作に応じて、前画面に戻る制御を行うことも可能である。
【0045】
そして、情報検索装置10は、ステップS5において、キー画像データに基づいて、次回の検索サイクルで用いる候補画像データを決定した後、ステップS2へと処理を移行し、決定した候補画像データを表示装置11に対して表示する。なお、情報検索装置10は、決定した候補画像データがM枚よりも多い場合には、当該検索者が入力装置12を介して所定の入力操作を行うことにより、表示装置11に対して表示する候補画像データをM枚単位で切り替える。
【0046】
情報検索装置10は、このような一連の工程を経ることにより、複数の検索画像データIDの中から所望の画像データを検索することができる。具体的には、情報検索装置10は、図3(A)に示した9枚の候補画像データの中から検索者が1枚の画像データを選択することにより、例えば同図(B)に示すように、選択されたキー画像データに基づいて新たな候補画像データを決定して表示装置11に対して表示する検索サイクルを、検索者が所望する候補画像データが表示されるまで繰り返し行う。
【0047】
このように、情報検索装置10は、検索者が検索しようとする所望の画像データに関連するイメージを提示する対話型検索を行うことにより、検索者のイメージが当初は曖昧であったとしても、検索サイクルの反復に応じてイメージが明確化され、自己の感性に最も合致する所望の画像データを検索することが可能となる。
【0048】
さて、以下では、画像検索部13による図2中ステップS5の処理の詳細について説明する。
【0049】
情報検索装置10は、画像検索部13による図2中ステップS5における次候補画像データの決定処理において、いわゆる遺伝的アルゴリズム(Genetic Algorithm)に代表される進化計算法にて用いられている選択・交叉オペレーションを用いる。この進化計算法とは、生物の進化のメカニズムを模倣してデータ構造を変形、合成、及び/又は選択する手法である。
【0050】
すなわち、情報検索装置10は、現在の検索サイクルで選択指定されたキー画像データと画像記憶装置14に蓄積されている検索画像データIDとの類似度のみに基づいて、当該類似度の高い順序で次回の検索サイクルで用いる候補画像データを選定するのではなく、現在の検索サイクルで選択指定されたキー画像データと画像記憶装置14に蓄積されている検索画像データIDとの類似度、及び過去の検索サイクルで選択指定されたキー画像データと画像記憶装置14に蓄積されている検索画像データIDとの類似度に基づいて得られる検索者の嗜好に対する適応度に基づいて、進化計算法における選択・交叉オペレーションを用い、多様性のある次候補画像データの決定処理を行う。
【0051】
ここで、一般的な進化計算法においては、交叉オペレーションで得られた子孫を母集団の一部又は全部と入れ替えて世代交代を行うことにより、母集団の淘汰を行うが、情報検索装置10は、交叉オペレーションを次候補の多様性の保持のみに用いており、世代交代を行うことはない。
【0052】
進化計算法にて用いられる選択・交叉オペレーションは、概略的には、以下に示すコード化、適応度、選択、交叉、及び突然変異の5つの操作からなる。
【0053】
まず、「コード化」について説明する。一般に、遺伝的アルゴリズムにおいては、解空間内の解を何らかの方法によってコーディングしたデータの集団を扱う。このデータは、遺伝子型(GTYPE)と称され、細胞内の染色体に相当するものである。画像データを検索するに際してのコード化は、画像データを個体として表現することである。各個体は、特徴量がコーディングされた染色体によって構成されることになる。
【0054】
つぎに、「適応度」について説明する。一般に、自然界では、環境に適応する度合いの高い個体が生き残り、増殖することが知られている。遺伝的アルゴリズムにおいても、この現象は同様であり、最適解に近い個体ほど生き残り、次世代に子孫を残す可能性が高くなる。進化計算法においては、この生き残る可能性の程度、すなわち、解としての好ましさを示す指標を適応度という値で表す。情報検索装置10は、後述するように、類似度等の条件を考慮してこの適応度を算出する。
【0055】
つぎに、「選択」について説明する。遺伝的アルゴリズムにおいては、上述したように、最適解に近い個体が生き残る可能性の程度を適応度として表すことから、換言すれば、この適応度の高い個体ほど生き残る可能性が高いことになる。選択は、より環境に適した個体を適応度に応じて確率的に選択する操作である。したがって、情報検索装置10は、適応度の高い個体ほど高い確率で選択することになる。
【0056】
つぎに、「交叉」について説明する。遺伝的アルゴリズムにおいては、ある世代の個体集団は、当該集団内での掛け合わせ等によって次世代の集団を生成する。交叉は、2つの個体間で染色体を組み替えることによって新しい個体を生成する操作である。一般的な交叉法においては、交叉する2つの親個体は、適応度に基づいて確率的に母集団から選択され、子個体が生成される。情報検索装置10は、この交叉オペレーションを行い、新たな個体を生成することになる。
【0057】
最後に、「突然変異」について説明する。突然変異は、交叉のみでは得られないパターンを生成させるために行われる操作である。情報検索装置10は、この突然変異オペレーションを確率的に行うことにより、局所解に陥ることを回避することができ、より大域的な検索を行うことが可能となる。
【0058】
情報検索装置10は、これらコード化、適応度、選択、交叉、及び突然変異の5つの操作からなる選択・交叉オペレーションを用いた図4に示す一連の工程を経ることにより、次候補画像データを決定する。
【0059】
まず、情報検索装置10は、同図に示すように、図2中ステップS4にて選択されたキー画像データKIDを画像検索部13によって受け取ると、図4に示すように、ステップS11において、画像検索部13により、キー画像データKIDと画像記憶装置14に蓄積されている全ての検索画像データIDとの類似度を算出する。なお、類似度は、例えば各特徴ベクトル毎のユークリッド距離やマハラノビス距離等を求め、これら距離の総和で表すことができる。ここでは、各特徴ベクトル毎のユークリッド距離を求め、これらユークリッド距離の総和d(0≦d≦1)で類似度を表すものとする。さらに、情報検索装置10は、算出した類似度dに基づいて、類似順序Oを求める。
【0060】
続いて、情報検索装置10は、ステップS12において、画像検索部13により、算出した類似度に基づいて、全ての検索画像データIDについての適応度を算出する。ここで、適応度は、検索画像データが現在までに選択された回数に応じて与えられる重みw、現在の検索サイクル数cnt、及びキー画像データKIDとの類似順序O等を考慮して求めることができる。なお、検索画像データが現在までに選択された回数は、画像記憶装置14に記憶されている選択履歴情報SHの個数を計数することによって求めることができるが、情報検索装置10は、この選択履歴情報SHに基づく情報を用いて適応度を算出することにより、より有効な主観推測を行うことが可能となる。ここでは、次式(1)を用いて適応度Fitnessを算出するものとする。
【0061】
【数1】
Figure 2004259061
【0062】
続いて、情報検索装置10は、ステップS13及びステップS14において、画像検索部13によって選択・交叉オペレーションを行うことにより、ダミー候補の生成を行う。
【0063】
具体的には、情報検索装置10は、画像検索部13により、画像記憶装置14に蓄積されている検索画像データIDについての複数種類の特徴ベクトルを並べたものが当該検索画像データIDについての特徴を表すものとしてコード化を行う。このコード化された特徴ベクトルを画像GTYPEと称するものとする。なお、画像記憶装置14に蓄積されている全ての検索画像データIDは、ステップS12にてキー画像データKIDとの適応度が求められている。
【0064】
そして、情報検索装置10は、ステップS13において、画像検索部13により、算出した適応度に基づいて、親となる画像GTYPEのペア(以下、親GTYPEという。)を、選択オペレーションを行うことによって確率的にM組選択する。
【0065】
さらに、情報検索装置10は、ステップS14において、画像検索部13により、各親GTYPEに対して交叉オペレーションを行い、子孫としての新たな画像GTYPE(以下、子GTYPEという。)を生成する。このとき、情報検索装置10は、画像検索部13により、各親GTYPEに対して突然変異オペレーションも確率的に行う。ここで生成された子GTYPEをダミー候補と称するものとする。なお、交叉オペレーションとしては、例えば、実数値交叉法(Blend Crossover;BLX−α)、正規化分布交叉法(Normal Distribution Crossover;NDX)、単峰性正規化分布交叉法(Unimodel Normal Distribution Crossover;UNDX)等を用いることができる。
【0066】
このように、情報検索装置10は、画像検索部13によって選択・交叉オペレーションを行い、ダミー候補の生成を行う。
【0067】
ここで、ダミー候補は、ほとんどの場合、実際の画像GTYPEと一致しない。そこで、情報検索装置10は、ステップS15において、M個のダミー候補のそれぞれについて、画像記憶装置14に蓄積されている全ての検索画像データIDとの類似度を算出し、最も類似度の高い検索画像データを、そのダミー候補の代表画像データとする。
【0068】
そして、情報検索装置10は、ステップS16において、画像検索部13により、代表画像データの重複防止処理を行う。すなわち、ステップS15にて求めた代表画像データは、複数のダミー候補間で共通となる場合があることから、情報検索装置10は、この重複する代表画像データを省く処理を行う。
【0069】
具体的には、情報検索装置10は、ステップS15におけるダミー候補との類似度算出によって複数のダミー候補に対して同一の検索画像データが代表画像データとして選択された場合には、これらダミー候補の中で当該代表画像データたる検索画像データとの類似度が最も高いダミー候補に対して、当該検索画像データを代表画像データとして割り当てる。一方、情報検索装置10は、選考からもれたダミー候補については、類似度が2番目に高い検索画像データを代表画像データとして割り当てる。情報検索装置10は、このような操作を、代表画像データの重複がなくなるまで繰り返すことにより、全てのダミー候補に対して異なる検索画像データを代表画像データとして割り当てる。
【0070】
そして、情報検索装置10は、M個のダミー候補に対するM枚の代表画像データを決定すると、当該代表画像データを次候補画像データCIDとして、次回の検索サイクル時に表示装置11に対して表示する。情報検索装置10は、このような検索サイクルを、検索者が所望する候補画像データが表示されるまで繰り返し行う。
【0071】
このように、情報検索装置10は、画像データの類似度を直接的に用いて次候補画像データを決定するのではなく、交叉オペレーションによって得られるダミー候補に基づいて次候補画像データを決定することにより、提示する画像データの多様性を保持しつつ、現在までの選択履歴を含んだ文脈メカニズムをも組み込み、この検索者の選択履歴に基づいて徐々に評価判断すべき検索候補の範囲を自動的に絞り込むことができ、検索者の嗜好の明確化を図りながら極めて効率よく検索を行うことができる。
【0072】
以上説明したように、本発明の実施の形態として示した情報検索装置10は、複数の検索画像データIDの中から所望の画像データを検索する際に、選択されたキー画像データKIDと検索画像データIDとの類似度に基づいて算出される適応度に基づいて、次候補画像データを決定することにより、次候補画像データの多様性を保持し、局所解に陥るのを回避して、検索者の検索意図を十分に汲み取った上で徐々に評価判断すべき検索候補の範囲を適切に絞り込み、極めて効率のよい検索を行うことができる。
【0073】
なお、本発明は、上述した実施の形態に限定されるものではない。例えば、上述した実施の形態では、画像データの検索を行うものとして説明したが、本発明は、例えば音声データをはじめとして、特徴を抽出することができる任意のデータについても適用することができる。
【0074】
具体的には、情報検索装置10は、音声データを検索する場合には、提示手段としての上述した表示装置11の代わりに、例えばスピーカ等の音声データを出力する所定の出力手段を設ければよい。
【0075】
また、本発明は、画像データを検索する場合にあっては、静止画像及び動画像のいずれであっても適用することができ、また、2次元画像及び3次元画像のいずれであっても適用することができる。
【0076】
さらに、上述した実施の形態では、適応度を算出する際に、上式(1)を用いるものとして説明したが、本発明は、検索画像データが現在までに選択された回数に応じて与えられる重みw、現在の検索サイクル数cnt、及びキー画像データKIDとの類似順序O等を考慮するといったように、キー画像データKIDとの類似度dに基づいて適応度を求めるような方法であれば、いかなるものであっても適用することができる。
【0077】
このように、本発明は、その趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
【0078】
【発明の効果】
以上詳細に説明したように、本発明にかかる情報検索装置、情報検索方法、及び情報検索プログラムは、それぞれ、選択された情報と蓄積されている情報との類似度に基づいて算出される適応度に基づいて、次回提示する候補情報を決定することにより、候補情報の多様性を保持しつつ、文脈に依存する検索者の検索意図を十分に汲み取った上で徐々に評価判断すべき検索候補の範囲を適切に絞り込むことができ、極めて効率のよい検索を行うことができる。
【図面の簡単な説明】
【図1】本発明の実施の形態として示す情報検索装置の構成を説明するブロック図である。
【図2】同情報検索装置における一連の処理工程を説明するフローチャートである。
【図3】同情報検索装置が備える表示装置に対して複数の候補画像データが表示された様子を説明するための図であり、(A)は、初期画面として、表示装置に対して9枚の候補画像データが表示されている様子を示し、(B)は、2回目以降の検索サイクルを経ることによって表示装置に対して表示される候補画像データが変化していく様子を説明するための図である。
【図4】図2中ステップS5における一連の次候補画像データの決定処理を説明するフローチャートである。
【符号の説明】
10 情報検索装置、 11 表示装置、 12 入力装置、 13 画像検索部、 14 画像記憶装置、 CID 次候補画像データ、 FD 特徴データ、 ID 画像データ、 KID キー画像データ、 SH 選択履歴情報

Claims (25)

  1. 蓄積されている複数の情報から所望の情報を検索する情報検索装置であって、
    少なくとも、検索対象となる複数の検索情報と、これら検索情報について抽出された複数種類の特徴のそれぞれの特徴量とを対応付けて記憶する記憶手段と、
    上記記憶手段に蓄積されている上記検索情報の少なくとも一部を候補情報として提示する提示手段と、
    上記提示手段を介して提示された複数の上記候補情報の中から、検索者が一の情報を選択するための入力手段と、
    上記入力手段を介して選択された情報に基づいて、上記記憶手段に蓄積されている上記検索情報の中から上記所望の情報を検索する検索手段とを備え、
    上記検索手段は、上記入力手段を介して選択された情報と上記記憶手段に蓄積されている情報との類似度を算出し、上記類似度に基づいて検索者の嗜好に対する適応度を算出し、上記適応度に基づいて次回上記提示手段を介して提示する候補情報を決定すること
    を特徴とする情報検索装置。
  2. 上記検索手段は、上記検索者が上記入力手段を介して現在までに選択した情報の履歴である選択履歴に基づく情報を用いて上記適応度を算出すること
    を特徴とする請求項1記載の情報検索装置。
  3. 上記検索手段は、進化計算法における選択・交叉オペレーションを行い、上記記憶手段に蓄積されている情報のうち、生成した子孫としての遺伝子型との類似度の高い情報を、次回上記提示手段を介して提示する候補情報として決定すること
    を特徴とする請求項1記載の情報検索装置。
  4. 上記検索手段は、進化計算法における選択オペレーションを行い、上記適応度に基づいて親となる遺伝子型を選択し、選択した上記親となる遺伝子型に対して進化計算法における交叉オペレーションを行い、上記子孫としての遺伝子型を生成すること
    を特徴とする請求項3記載の情報検索装置。
  5. 上記検索手段は、上記親となる遺伝子型に対して進化計算法における突然変異オペレーションを確率的に行い、上記子孫としての遺伝子型を生成すること
    を特徴とする請求項4記載の情報検索装置。
  6. 上記検索手段は、上記記憶手段に蓄積されている情報についての複数種類の特徴ベクトルをコード化し、上記親となる遺伝子型とすること
    を特徴とする請求項4記載の情報検索装置。
  7. 上記検索手段は、上記子孫としての遺伝子型との類似度の高い情報である代表情報が、複数の子孫としての遺伝子型間で共通する場合には、重複する代表情報を省く処理を行うこと
    を特徴とする請求項3記載の情報検索装置。
  8. 上記提示手段を介して提示された複数の上記候補情報の中から、上記検索者が上記入力手段を介して一の情報を選択する検索サイクルを繰り返し行うこと
    を特徴とする請求項1記載の情報検索装置。
  9. 上記提示手段は、初回の検索サイクル時には、上記記憶手段に蓄積されている複数の上記検索情報の中から無作為に選択された情報を、上記候補情報として提示すること
    を特徴とする請求項8記載の情報検索装置。
  10. 上記情報は、画像データであり、
    上記提示手段は、画像データを表示する表示手段であること
    を特徴とする請求項1記載の情報検索装置。
  11. 上記情報は、音声データであり、
    上記提示手段は、音声データを出力する出力手段であること
    を特徴とする請求項1記載の情報検索装置。
  12. 蓄積されている複数の情報から所望の情報を検索する情報検索方法であって、
    少なくとも、検索対象となる複数の検索情報と、これら検索情報について抽出された複数種類の特徴のそれぞれの特徴量とを対応付けて記憶する記憶手段に蓄積されている上記検索情報の少なくとも一部を候補情報として提示する提示工程と、
    上記提示工程にて提示された複数の上記候補情報の中から、検索者が一の情報を選択する選択工程と、
    上記選択工程にて選択された情報に基づいて、上記記憶手段に蓄積されている上記検索情報の中から上記所望の情報を検索する検索工程とを備え、
    上記検索工程では、上記選択工程にて選択された情報と上記記憶手段に蓄積されている情報との類似度が算出され、上記類似度に基づいて検索者の嗜好に対する適応度が算出され、上記適応度に基づいて次回提示する候補情報が決定されること
    を特徴とする情報検索方法。
  13. 上記検索工程では、上記検索者が現在までに選択した情報の履歴である選択履歴に基づく情報を用いて上記適応度が算出されること
    を特徴とする請求項12記載の情報検索方法。
  14. 上記検索工程では、進化計算法における選択・交叉オペレーションが行われ、上記記憶手段に蓄積されている情報のうち、生成された子孫としての遺伝子型との類似度の高い情報が、次回提示する候補情報として決定されること
    を特徴とする請求項12記載の情報検索方法。
  15. 上記検索工程では、進化計算法における選択オペレーションが行われ、上記適応度に基づいて親となる遺伝子型が選択され、選択された上記親となる遺伝子型に対して進化計算法における交叉オペレーションが行われ、上記子孫としての遺伝子型が生成されること
    を特徴とする請求項14記載の情報検索方法。
  16. 上記検索工程では、上記親となる遺伝子型に対して進化計算法における突然変異オペレーションが確率的に行われ、上記子孫としての遺伝子型が生成されること
    を特徴とする請求項15記載の情報検索方法。
  17. 上記検索工程では、上記記憶手段に蓄積されている情報についての複数種類の特徴ベクトルがコード化され、上記親となる遺伝子型とされること
    を特徴とする請求項15記載の情報検索方法。
  18. 上記検索工程では、上記子孫としての遺伝子型との類似度の高い情報である代表情報が、複数の子孫としての遺伝子型間で共通する場合には、重複する代表情報を省く処理が行われること
    を特徴とする請求項14記載の情報検索方法。
  19. 蓄積されている複数の情報から所望の情報を検索するコンピュータ実行可能な情報検索プログラムであって、
    少なくとも、検索対象となる複数の検索情報と、これら検索情報について抽出された複数種類の特徴のそれぞれの特徴量とを対応付けて記憶する記憶手段に蓄積されている上記検索情報の少なくとも一部を候補情報として提示する提示処理と、
    上記提示処理にて提示された複数の上記候補情報の中から検索者によって選択された情報に基づいて、上記記憶手段に蓄積されている上記検索情報の中から上記所望の情報を検索する検索処理とを備え、
    上記検索処理では、選択された情報と上記記憶手段に蓄積されている情報との類似度が算出され、上記類似度に基づいて検索者の嗜好に対する適応度が算出され、上記適応度に基づいて次回提示する候補情報が決定されること
    を特徴とする情報検索プログラム。
  20. 上記検索処理では、上記検索者が現在までに選択した情報の履歴である選択履歴に基づく情報を用いて上記適応度が算出されること
    を特徴とする請求項19記載の情報検索プログラム。
  21. 上記検索処理では、進化計算法における選択・交叉オペレーションが行われ、上記記憶手段に蓄積されている情報のうち、生成された子孫としての遺伝子型との類似度の高い情報が、次回提示する候補情報として決定されること
    を特徴とする請求項19記載の情報検索プログラム。
  22. 上記検索処理では、進化計算法における選択オペレーションが行われ、上記適応度に基づいて親となる遺伝子型が選択され、選択された上記親となる遺伝子型に対して進化計算法における交叉オペレーションが行われ、上記子孫としての遺伝子型が生成されること
    を特徴とする請求項21記載の情報検索プログラム。
  23. 上記検索処理では、上記親となる遺伝子型に対して進化計算法における突然変異オペレーションが確率的に行われ、上記子孫としての遺伝子型が生成されること
    を特徴とする請求項22記載の情報検索プログラム。
  24. 上記検索処理では、上記記憶手段に蓄積されている情報についての複数種類の特徴ベクトルがコード化され、上記親となる遺伝子型とされること
    を特徴とする請求項22記載の情報検索プログラム。
  25. 上記検索処理では、上記子孫としての遺伝子型との類似度の高い情報である代表情報が、複数の子孫としての遺伝子型間で共通する場合には、重複する代表情報を省く処理が行われること
    を特徴とする請求項21記載の情報検索プログラム。
JP2003049988A 2003-02-26 2003-02-26 情報検索装置、情報検索方法、及び情報検索プログラム Pending JP2004259061A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003049988A JP2004259061A (ja) 2003-02-26 2003-02-26 情報検索装置、情報検索方法、及び情報検索プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003049988A JP2004259061A (ja) 2003-02-26 2003-02-26 情報検索装置、情報検索方法、及び情報検索プログラム

Publications (1)

Publication Number Publication Date
JP2004259061A true JP2004259061A (ja) 2004-09-16

Family

ID=33115549

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003049988A Pending JP2004259061A (ja) 2003-02-26 2003-02-26 情報検索装置、情報検索方法、及び情報検索プログラム

Country Status (1)

Country Link
JP (1) JP2004259061A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014156559A1 (ja) * 2013-03-28 2014-10-02 富士フイルム株式会社 画像検索装置およびその動作制御方法ならびに画像検索サーバ
JP2015001884A (ja) * 2013-06-17 2015-01-05 新日鉄住金ソリューションズ株式会社 候補提示装置、候補提示方法及びプログラム
WO2018168303A1 (ja) * 2017-03-15 2018-09-20 富士フイルム株式会社 画像評価装置,画像評価方法および画像評価プログラム
US11080338B2 (en) 2017-01-13 2021-08-03 Nec Corporation Information processing apparatus, information processing method, and program
JP2022542752A (ja) * 2019-06-07 2022-10-07 ライカ マイクロシステムズ シーエムエス ゲゼルシャフト ミット ベシュレンクテル ハフツング 生物学関連のデータを処理するためのシステムおよび方法、顕微鏡を制御するためのシステムおよび方法ならびに顕微鏡

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014156559A1 (ja) * 2013-03-28 2014-10-02 富士フイルム株式会社 画像検索装置およびその動作制御方法ならびに画像検索サーバ
JP2014191701A (ja) * 2013-03-28 2014-10-06 Fujifilm Corp 画像検索装置およびその動作制御方法ならびに画像検索サーバ
CN105074771A (zh) * 2013-03-28 2015-11-18 富士胶片株式会社 图像检索装置及其动作控制方法、以及图像检索服务器
US9805253B2 (en) 2013-03-28 2017-10-31 Fujifilm Corporation Image search apparatus, method of controlling operation of same, and image search server
US9959456B2 (en) 2013-03-28 2018-05-01 Fujifilm Corporation Image search server, image search apparatus, and method of controlling operation of same
CN105074771B (zh) * 2013-03-28 2018-11-27 富士胶片株式会社 图像检索装置及其动作控制方法、以及图像检索服务器
JP2015001884A (ja) * 2013-06-17 2015-01-05 新日鉄住金ソリューションズ株式会社 候補提示装置、候補提示方法及びプログラム
US11080338B2 (en) 2017-01-13 2021-08-03 Nec Corporation Information processing apparatus, information processing method, and program
WO2018168303A1 (ja) * 2017-03-15 2018-09-20 富士フイルム株式会社 画像評価装置,画像評価方法および画像評価プログラム
US11210771B2 (en) 2017-03-15 2021-12-28 Fujifilm Corporation Image evaluation apparatus, image evaluation method, and image evaluation program using impression values of representative images
JP2022542752A (ja) * 2019-06-07 2022-10-07 ライカ マイクロシステムズ シーエムエス ゲゼルシャフト ミット ベシュレンクテル ハフツング 生物学関連のデータを処理するためのシステムおよび方法、顕微鏡を制御するためのシステムおよび方法ならびに顕微鏡

Similar Documents

Publication Publication Date Title
US8195674B1 (en) Large scale machine learning systems and methods
CN111798921A (zh) 一种基于多尺度注意力卷积神经网络的rna结合蛋白预测方法及装置
CN111221962B (zh) 一种基于新词扩展与复杂句式扩展的文本情感分析方法
JP5353443B2 (ja) データ分類器作成装置、データ分類装置、データ分類器作成方法、データ分類方法、データ分類器作成プログラム、データ分類プログラム
JP2006048286A (ja) 情報処理装置および方法、並びにプログラム
CN104731882B (zh) 一种基于哈希编码加权排序的自适应查询方法
WO2018015848A2 (en) Finding k extreme values in constant processing time
JP4392620B2 (ja) 情報処理装置、情報処理方法、演算装置、演算方法、プログラム、および記録媒体
JP2011060182A (ja) コンテンツ選択システム
Li et al. Nature-inspired multiobjective epistasis elucidation from genome-wide association studies
CN115428469A (zh) 用于无声视频的ai辅助音效生成
JP2004259061A (ja) 情報検索装置、情報検索方法、及び情報検索プログラム
JPH09204440A (ja) 画像検索システム、画像検索方法、及び記録媒体
KR102188115B1 (ko) 생성적 적대 신경망을 기초로 암의 예후 예측에 사용되는 바이오 마커의 선정이 가능한 전자 장치 및 그 동작 방법
JP2005222445A (ja) データマイニングにおける情報処理方法及び解析装置
US20050112577A1 (en) Rna sequence analyzer, and rna sequence analysis method, program and recording medium
CN110297977B (zh) 一种面向众筹平台的个性化推荐单目标进化方法
CN110162704B (zh) 基于多因子遗传算法的多规模关键用户提取方法
Iclanzan et al. Evolving computationally efficient hashing for similarity search
JP4333902B2 (ja) 情報検索装置、情報検索方法、及び情報検索プログラム
CN116228484B (zh) 基于量子聚类算法的课程组合方法及装置
JP7268069B2 (ja) 学習装置、学習方法、学習プログラム、評価装置、評価方法、および評価プログラム
CN116679981B (zh) 一种基于迁移学习的软件系统配置调优方法及装置
CN109902823B (zh) 一种基于生成对抗网络的模型训练方法及设备
Shaw K-means clustering with automatic determination of K using a Multiobjective Genetic Algorithm with applications to microarray gene expression data

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20051129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081119

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090407