JP3597026B2 - Feature selection device - Google Patents

Feature selection device Download PDF

Info

Publication number
JP3597026B2
JP3597026B2 JP29222197A JP29222197A JP3597026B2 JP 3597026 B2 JP3597026 B2 JP 3597026B2 JP 29222197 A JP29222197 A JP 29222197A JP 29222197 A JP29222197 A JP 29222197A JP 3597026 B2 JP3597026 B2 JP 3597026B2
Authority
JP
Japan
Prior art keywords
feature amount
feature
information
search target
target information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP29222197A
Other languages
Japanese (ja)
Other versions
JPH11126212A (en
Inventor
俊博 柿元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP29222197A priority Critical patent/JP3597026B2/en
Publication of JPH11126212A publication Critical patent/JPH11126212A/en
Application granted granted Critical
Publication of JP3597026B2 publication Critical patent/JP3597026B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、ブラウジング検索を行うための情報探索空間に探索対象情報を配置する際に、前記探索対象情報を表す特徴量を用いて情報探索空間における前記探索対象情報の分布を算出する情報探索装置において、前記算出に用いる特徴量を選択する特徴量選択装置に関する。
【0002】
【従来の技術】
情報検索システムによって必要な情報を得るための検索方法として、従来からハンティング検索とブラウジング検索の二種類の方法があった。ハンティング検索とは、データの集合から、例えばキーワードなど、ユーザによって指定された条件に基づいてデータを選択する方法をいう。ハンティング検索によって検索された情報は、さらにブラウジング検索によって詳細に検査される。ブラウジング検索とは、例えば2次元や3次元の情報空間に情報を分散させて配置し、情報空間の中を移動しつつ、閲覧したいデータを選択する方法をいう。近年、静止画、動画や音声等のマルチメディア情報を含むデータの検索を行う要求が高まっているが、このようなデータの検索においては、ハンティング検索のみによる検索は困難であり、ハンティング検索の後のブラウジング検索が重要性を増している。
【0003】
一方、ブラウジング検索に用いるための情報探索空間にランダムにデータを配置したのでは、ユーザが情報を閲覧しようとする際の情報探索空間内での移動が煩雑なものとなるため、情報をユーザにわかりやすいように分類してデータの配置を行うことが重要である。ところが、最近の情報は種々雑多なものが大量に生産され、これを事前の分類体系で分類することは困難になってきている。これに対応するために、種々のクラスタリング技術が考案されている。
【0004】
【発明が解決しようとする課題】
しかしながら、従来のクラスタリング技術では、例えば、探索対象情報が書籍データである場合には、多数のキーワードをそのまま利用するものが多く、システムによる処理時間が増大することにより、実時間でクラスタリングすることが困難であるという問題点を有していた。
【0005】
本発明は、上記問題点に鑑み、ブラウジング情報検索を行うための情報探索空間に探索対象情報を適切に分布させる場合において、システムによる当該処理の効率を改善することができる特徴量選択装置を提供することを目的とする。
【0006】
【課題を解決するための手段】
前記目的を達成するため、本発明の特徴量選択装置は、情報探索空間に探索対象情報を配置する際に、前記探索対象情報を表す特徴量を用いて情報探索空間における前記探索対象情報の配置を決定する情報探索装置において、前記配置の決定に用いる特徴量を選択する特徴量選択装置であって、それぞれの探索対象情報と、当該探索対象情報を表す複数の特徴量との組を、複数格納する特徴量格納手段と、前記特徴量格納手段に格納されている特徴量から、所定の規則に基づいて、探索対象情報の配置に適切な順に、所定の数だけ特徴量を選択する選択手段とを備えることを特徴とする。
【0007】
ここで、前記選択手段は、情報探索空間に配置すべき探索対象情報を、ある一つの特徴量により表されるか否かにより分割するとした場合に、二つの特徴量による前記分割の結果が、所定の割合以上に類似しているか否かを判定する分割類似性判定部と、前記分割類似性判定部により、類似していると判定された場合に、前記二つの特徴量のうち一つを選択するように制御する選択制御部とを有することが好ましい。分割のされ方が類似しているということは、当該複数の特徴量を重複して選択する意味が乏しいことを意味するため、それらを重複して選択してしまうことを防止することができるからである。
【0008】
また、前記選択手段はさらに、前記分割類似性判定部により、類似していると判定された場合に、二つの特徴量のうち、選択されなかった一つを同一分割特徴量として出力する同一分割特徴量出力部を備え、前記特徴量選択装置はさらに、前記同一分割特徴量出力部が出力した特徴量を格納する同一分割特徴量格納手段を備えることが好ましい。分割のされ方が類似している特徴量に関する情報は、一種のシソーラスデータとして用いることができるので、当該情報を格納しておくことにより、操作者の情報検索の利便を図ることが可能となるからである。
【0009】
さらに、前記分割類似性判定部は、二つの特徴量について、それぞれの特徴量により表される探索対象情報の数の和と、二つの特徴量のいずれか一方のみにより表される探索対象情報の数との比率から、前記分割の結果の類似性を判定することができる。
【0010】
また、前記特徴量選択装置はさらに、二つの特徴量の類似性に関する情報を格納する類似特徴量情報格納手段を備え、前記選択手段はさらに、前記類似特徴量情報格納手段に格納された情報を参照して、二つの特徴量が類似するか否かを判定する特徴量類似判定部と、前記特徴量類似判定部により、類似していると判定された場合に、当該二つの特徴量のうち一つを選択するように制御する第二の選択制御部とを有することが好ましい。例えば、「計算機」と「コンピュータ」など、同義語や類義語を重複して特徴量として選択してしまうことを防止することができるからである。
【0011】
また、前記特徴量選択装置はさらに、操作者により特定された特徴量を入力するユーザ指定特徴量入力手段と、前記ユーザ指定特徴量入力手段により入力された特徴量を格納するユーザ指定特徴量格納手段とを備え、前記選択手段は、前記ユーザ指定特徴量格納手段に格納された特徴量を常に選択することもできる。一定数の特徴量をユーザが指定することを可能とすることによって、よりユーザにとって検索を行いやすい情報探索空間を構築することも可能となる。
【0012】
また、本発明の記憶媒体は、情報探索空間に探索対象情報を配置する際に、前記探索対象情報を表す特徴量を用いて情報探索空間における前記探索対象情報の配置を決定する情報探索装置において、前記配置の決定に用いる特徴量を選択する特徴量選択装置に用いるプログラムであって、それぞれの探索対象情報と、当該探索対象情報を表す複数の特徴量との組を、複数格納する特徴量格納手段から、前記配置の対象となる探索対象情報を表す特徴量を順次取り出す取出ステップと、前記取出ステップで取り出された特徴量により、前記配置の対象となる探索対象情報が表されるか否かによって、配置の対象となる探索対象情報を分割するとした場合に、任意の二つの特徴量による前記分割の結果が、所定の割合以上に類似しているか否かを判定する分割類似性判定ステップと、前記分割類似性判定ステップにおいて、類似していると判定された場合に、当該二つの特徴量のうち一つを、前記配置の決定に用いる特徴量として選択するように制御する選択制御ステップとを実行するコンピュータで読み取り可能なプログラムを記憶したものである。
【0013】
【発明の実施の形態】
以下、本発明の実施の形態について、図面を参照しながら説明する。
【0014】
図1は、本発明の一実施の形態に係る特徴量選択装置を備える情報探索装置の構成を示す機能ブロック図である。同図に示されるように、本実施の形態の特徴量選択装置を含む情報探索装置は、入力部101、制御部102、出力部103、探索対象情報格納部104、配置対象情報格納部105、探索対象特徴量格納部106、特徴量しきい値格納部107、候補特徴量格納部108、同一分割特徴量格納部109、類似特徴量情報格納部110、ユーザ指定特徴量格納部111を備えている。なお、同図では、主として本発明に係る特徴量選択装置を構成する部分を図示しており、情報探索装置としての通常の使用に必要な処理を行う部分については省略しているところもある。
【0015】
入力部101は、ユーザが、情報探索の指定入力や、ユーザ指定特徴量の入力等を行うために用いられる。即ち、特許請求の範囲に記載したユーザ指定特徴量入力手段に対応するものである。入力部101としては、具体的には、マウス等のポインティングデバイスや、キーボード等の入力装置を用いることができる。
【0016】
制御部102は、情報探索装置全体の制御を行う他、本発明に係る特徴量選択装置による特徴量の選択に関する処理等を行う。特許請求の範囲に記載した選択手段に対応するものである。また、制御部102は、特徴量抽出部1021、1/2基準値算出部1022、ユーザ指定特徴量判定部1023、候補特徴量選択部1024、特徴量選択部1025を含んでいる。各部の詳細な処理内容については後述する。
【0017】
出力部103は、本実施の形態の情報探索装置における情報探索空間を表示する。出力部103としては、具体的には、ディスプレイ装置等の二次元の像を表示することができる出力装置が用いられる。なお、情報探索空間は、二次元空間でも三次元空間でもよい。
【0018】
探索対象情報格納部104には、本実施の形態における特徴量選択装置を含む情報探索装置による探索対象となる全ての情報が格納される。探索対象情報格納部104には、例えば、探索対象となる情報が書籍のデータであれば、書籍データを情報探索空間に表示するために必要な情報等が全て格納され、また、探索対象情報が静止画のデータであれば、当該静止画のファイル等が格納される。情報には、その情報を特定するために必要な識別子が含まれる。制御部102は、必要に応じて探索対象情報格納部104を参照し、情報探索空間にデータを表示する。
【0019】
配置対象情報格納部105には、情報探索空間への配置の対象となるデータが格納される。例えば、探索対象となるのが書籍のデータであれば、情報探索空間に配置されるべき書籍のID等、配置されるべき情報を特定するために必要な識別子の情報が格納される。配置対象情報格納部105に格納される情報は、上述の如く、探索対象情報格納部104に格納されている情報全体から、予めハンティング検索によって絞り込まれた情報であるのが一般的であるが、情報量によっては、探索対象情報格納部104に格納されている全ての情報について、識別子等の必要な情報を格納する場合もある。
【0020】
探索対象特徴量格納部106には、探索対象情報格納部104に格納されている全ての情報について、探索対象となるそれぞれの情報の識別子と、特徴量との対応関係に関する情報が保持される。特許請求の範囲に記載した特徴量格納手段に対応するものである。情報の識別子は、配置対象情報格納部105に格納される情報と同一である。図6は、探索対象特徴量格納部106に格納される情報の内容の例を示す図である。図6(a)は、探索対象情報が書籍のデータである場合の例であり、図6(b)は、探索対象情報が静止画のデータである場合の例である。
【0021】
図6(a)に示されるように、探索対象情報が書籍のデータである場合には、特徴量としてキーワードを用いる。キーワードとして、本実施の形態では、表紙及び目次に表示されている文字情報について、形態素解析等の処理を行うことにより自動的に抽出したものを用いるが、当該書籍に含まれる全ての文章から抽出することも可能であり、キーワードの抽出方法にも種々の方法が考えられる。また、同図(a)に示されるように、特徴量としてキーワードを用いる場合は、それぞれのキーワードについて、当該文書情報内における出現頻度を情報として保持する。出現頻度情報の利用方法については後述する。尚、同図では、分かりやすくするためテーブルの形で記載しているが、実際にはキーワードと出現頻度とのペアのリストの形式で格納されている。
【0022】
一方、探索対象情報が静止画の場合は、図6(b)に示されるように、特徴量のみを保持し、出現頻度は保持しない。ここで、探索対象情報が静止画の場合の、本実施の形態における特徴量について説明する。
【0023】
各画素のRGB値として与えられる静止画のデータについて、HSV変換を行い、色相、彩度、明度の情報に変換する。ここで、色相を32区間、彩度を4区間、明度を4区間に分割し、この区間を一つの特徴量と考える。即ち、色相、彩度、明度のそれぞれが8ビットで表されるとすると、色相データについては0から255までの値を32区間に分割し、0から7、8から15、というように、それぞれの区間を一つの特徴量とする。彩度、明度については4区間に分割されるので、0から63、64から127、というように、それぞれの区間を一つの特徴量とする。
【0024】
特徴量の値は、それぞれの区間の値をとる画像内の画素数を、その区間の度数とし、それを全体の画素数で割った値とする。これら40の特徴量から選択する方法については後述する。
【0025】
特徴量しきい値格納部107には、特徴量ごとのしきい値が格納される。例えば、本実施の形態では、特徴量がキーワードである場合のしきい値を1としている。これは、配置対象情報の特徴量として、当該キーワードが一つでも出現する場合には、当該キーワードを特徴量選択処理の対象とすることを意味する。また、特徴量が上記色相、彩度及び明度である場合には、色相の場合は1/32、再度と明度の場合は1/4とする。これは均等に分布しているとした場合の値であるが、この値に限定されるものではない。
【0026】
候補特徴量格納部108には、最終的に特徴量として選択される候補となる特徴量(以下、「候補特徴量」という。)が格納される。候補特徴量の選択、及びその格納の際の処理内容については後述する。
【0027】
同一分割特徴量格納部109には、候補特徴量の選択の際に行われる、情報の分割のされ方が類似する特徴量の重複使用を排除するための処理において、排除された方の特徴量が格納される。特許請求の範囲に記載した同一分割特徴量格納手段に対応するものである。同一分割特徴量格納部109に格納される特徴量の詳細については後述する。
【0028】
類似特徴量情報格納部110には、主として同義語や類義語に関するシソーラスデータが格納される。特許請求の範囲に記載した類似特徴量格納手段に対応するものである。これらの情報は、候補特徴量の選択の際に行われる、意味的に類似する特徴量の重複使用を排除するための処理において利用される。これらのシソーラスデータの格納は、他の既存のプログラムや装置を用いて、ユーザが行うことができるが、当該装置を本実施の形態の情報探索装置に備えるようにすることも可能である。
【0029】
ユーザ指定特徴量格納部111には、ユーザから特に指定された特徴量の情報が格納される。特許請求の範囲に記載したユーザ指定特徴量格納手段に対応するものである。ユーザ指定特徴量格納部111に格納された特徴量は、本発明に係る特徴量選択装置により本来選択されるべきものであるか否かにかかわらず、常に、最終的に特徴量として選択され、情報探索空間の構築に用いられる。
【0030】
次に制御部102の各部の処理内容について説明する。
【0031】
特徴量抽出部1021は、配置対象情報格納部105に格納されている配置対象情報の識別子と、探索対象特徴量格納部106に格納されている情報とから、配置対象情報格納部105に格納されている配置対象情報を表す特徴量であって、特徴量しきい値格納部107に格納されている特徴量のしきい値を超える特徴量を抽出し、当該特徴量により表される配置対象情報のデータ数を算出する。
【0032】
1/2基準値算出部1022は、特徴量抽出部1021により抽出された配置対象情報のデータ数に基づいて、それぞれの特徴量の1/2基準値を算出する。ここで、「1/2基準値」とは、配置対象情報の中で、当該特徴量により表されるものがどれくらいの割合存在しているかを示す数値であり、具体的には、下記の式1で算出される値をいう。
【0033】
h=|w/n−0.5| (1)
例えば、配置対象情報が書籍のデータである場合には、上式1において、wは、配置対象情報の中で、当該キーワードを含む書籍の件数、nは、配置対象情報格納部105に格納されている配置対象情報の全件数である。例えば、配置対象情報格納部105に100件の書籍データが格納されているうち、キーワード「構造」により表されるものが50件あるとした場合に、キーワード「構造」についての1/2基準値は0となる。
【0034】
本発明の特徴量選択装置は、情報探索空間への配置の対象となる情報群を当該空間中に適切に分散配置することを目的とするものであるため、あるキーワードにより表されるか否かによって、配置対象情報を二等分できるようなキーワードがもっとも分散配置に適していると考えることができる。従って、情報の分割に適したキーワードとして、1/2基準値が小さいものを優先して使用する。
【0035】
ユーザ指定特徴量判定部1023は、1/2基準値算出部1022により1/2基準値が算出された特徴量について、ユーザ指定特徴量格納部111を参照し、特徴量がユーザ指定特徴量に該当するか否かを順次判定する。
【0036】
候補特徴量選択部1024は、ユーザ指定特徴量判定部1023によりユーザ指定特徴量でないと判定された特徴量について、候補特徴量の選択処理を行い、選択された特徴量を候補特徴量格納部108に格納する。特許請求の範囲に記載した、分割類似性判定部、選択制御部、同一分割特徴量出力部、特徴量類似判定部に対応する処理を行うものである。
【0037】
特徴量選択部1025は、候補特徴量格納部108に格納された候補特徴量から所定の数の特徴量を選択する。この際に、ユーザ指定特徴量格納部111を参照して、ユーザ指定特徴量を追加して選択する。ここで、選択された特徴量が最終的に情報探索空間の構築に利用される。
【0038】
図2は、本実施の形態における制御部102の処理内容を示すフローチャートである。同図に示されるように、制御部102は、まず、特徴量データ数の算出を行う(S201)。具体的には、特徴量抽出部1021が、配置対象情報格納部105に格納されている情報の識別子に基づいて、探索対象特徴量格納部106を参照し、配置対象情報に対応する特徴量の情報を抽出する。
【0039】
前述の如く、探索対象特徴量格納部106に格納されている特徴量データは、例えば配置対象情報が書籍のデータである場合には、図6(a)の如く、特徴量として用いられるキーワードと、当該キーワードの出現頻度とのペアの形で保持されている。そこで、特徴量抽出部1021はさらに、特徴量しきい値格納部107を参照し、当該キーワードの出現頻度が、特徴量「キーワード」のしきい値以上であるものについてキーワードを抽出し、当該キーワードにより表される書籍の数を算出する。
【0040】
本実施の形態では、特徴量「キーワード」のしきい値は1としている。これは、前述の如く、当該キーワードを一つでも含んでいる書籍が、配置対象情報の中に存在すれば、当該キーワードは、本実施の形態の特徴量選択装置による選択処理の対象となることを意味する。
【0041】
次に、1/2基準値算出部1022が、抽出されたそれぞれの特徴量について、1/2基準値を計算する(S202)。1/2基準値については、先に詳細に説明したので、ここでの説明は省略する。
【0042】
次に、ユーザ指定特徴量判定部1023が、1/2基準値算出部1022によって1/2基準値が算出された特徴量を一つ取り出す(S203)。
【0043】
取り出された特徴量(以下、「処理対象特徴量」という。)について、ユーザ指定特徴量判定部1023が、ユーザ指定特徴量であるか否かを判定する(S204)。ここで、ユーザ指定特徴量とは、例えば、ハンティング検索処理において、情報の絞り込み等のためにユーザから指定されたキーワードの如く、ユーザから指定された特徴量をいう。ただし、書籍データの場合でも、ハンティング検索に用いたキーワードを必ずユーザ指定特徴量とする必要はなく、別途入力部101を用いて入力するようにしてもよい。
【0044】
後述のように、ユーザ指定特徴量は、本発明に係る特徴量選択装置の動作に関係なく、常に選択されるべき特徴量であるから、ステップS204で、ユーザ指定特徴量であると判定された場合(S204:Yes)には、その後の処理をスキップして、ステップS208へと進む。
【0045】
処理対象特徴量が、ユーザ指定特徴量でなかった場合(S204:No)には、当該処理対象特徴量が、ユーザ指定特徴量以外のうちで最初のものであるか否か、即ち、候補特徴量格納部108に候補特徴量が一つでも格納されていないかどうかを判定し(S205)、候補特徴量格納部108に候補特徴量がまったく格納されていない場合(S205:Yes)には、当該処理対象特徴量を、候補特徴量格納部108に格納する(S206)。
【0046】
既に、候補特徴量格納部108に一つでも候補特徴量が格納されている場合には(S205:No)、候補特徴量選択部1024は、候補特徴量格納処理(S207)へと進む。図3は、候補特徴量格納処理の詳細な処理内容を示すフローチャートである。
【0047】
同図に示されるように、候補特徴量格納処理では、候補特徴量選択部1024は、まず、1/2基準値が小さい候補特徴量との同一性検査を行う(S301)。
【0048】
図4は、1/2基準値が小さい候補特徴量との同一性検査の詳細な処理内容を示すフローチャートである。1/2基準値が小さい候補特徴量とは、候補特徴量格納部108に格納されている候補特徴量であって、1/2基準値が等しいか又は小さい特徴量をいう。候補特徴量選択部1024は、当該条件に該当する候補特徴量について、まず、一つデータを取り出す(S401)。
【0049】
次に、候補特徴量選択部1024は、処理対象特徴量と、取り出された候補特徴量との間でEOR値、もしくは類似度を算出する(S402)。
【0050】
ここで、EOR値について、配置対象情報が書籍のデータである場合を例として説明する。EOR値とは、二つのキーワードJ、Lについて、キーワードJを含む書籍の数をk(j)、キーワードLを含む書籍の数をk(l)とし、両者の排他的論理和をとったもの、即ち、キーワードJ、Lのいずれか一方のみを含む書籍の数をe(k(j),k(l))とした場合に、下記の式2で表される値をいう。
【0051】
EOR値= e(k(j),k(l)) / (k(j)+k(l)) (2)
この様子を図7に示す。尚、同図において、外側の四角形は、ハンティング検索により絞り込まれた情報を表わす。同図からもわかるように、EOR値が低いということは、当該二つのキーワードについて、その両方を含む書籍データが多いということを意味しており、当該二つのキーワードを重複して用いても、情報の分割のされ方が似通っているということを示す。このような場合に当該二つのキーワードを、両方とも、配置決定のための特徴量として選択する必要性に乏しいと考えられることから、本発明の特徴量選択装置では、その一方のみを選択することとしたものである。
【0052】
EOR値が算出されると、候補特徴量選択部1024は、算出されたEOR値が一定値以下であるか否かを判定する(S403)。
【0053】
尚、本実施の形態では、ステップS403におけるEOR値の一定値を1/4としたが、任意の値を設定して構わない。本実施の形態で当該一定値を1/4としたのは、例えば、二つのキーワードの1/2基準値がともに0である場合、即ち、当該キーワードを含む情報がそれぞれ全体の1/2であってデータの重複が互いにないような場合の全体のデータ量を1とした場合に、その全体のデータ量の1/4に相当する数までのデータの重複については、情報の分割のされ方が異なるものとして取り扱うという考えに基づくものであるが、この値に限定すべき性質のものではない。
【0054】
EOR値が一定値以下でない場合(S403:No)には、候補特徴量選択部1024は、類似特徴量情報格納部110を参照して、二つのキーワードの意味的な類似性の検査を行う(S404)。これは、同義語や類義語を重複して特徴量として選択してしまうことを避けるための処理である。即ち、例えば、「計算機」と、「コンピュータ」のような同義語や、類義語を重複して特徴量として選択する必要性は乏しいと考えられることから、本発明の特徴量選択装置では、その一方のみを選択するようにしたものである。
【0055】
また、配置対象情報が静止画の場合には、特徴量の類似性を示すものとして類似度を算出する。類似度の算出には、色相、彩度、明度ごとの隣り合った色区間の間の相関をガウス関数で決めたものを採用する。例えば、色相の場合は区間の両端が隣り合っていると考え、円上に区間が配置されているという関係で相関を計算する。例えば、区間の隣が1離れているとすると、j区間離れている区間との類似度は以下の式3で表すことができる。
【0056】
類似度= (exp(−(16−j)*(16−j)/16)−exp(−16))/(1−exp(−16)) (3)
従って、類似特徴量情報格納部110には、上記のような同義語、類義語に関する情報が、その類似性に関する数値的な情報とともに、別途ユーザにより格納される。
【0057】
類似性が一定値以上である場合(S405:Yes)は、選択処理の対象となっている特徴量を候補特徴量としないように、その後の処理を行わず、1/2基準値が小さい候補特徴量との同一性検査を終了する。
【0058】
一方、類似性が一定値以上でない場合(S405:No)には、両者が類似していないことを意味するので、対象となる全ての候補特徴量について検査が終了したか否かを判定し(S406)、全ての候補特徴量について検査が終了していない場合には(S406:No)、ステップS401に戻って、候補特徴量選択部1024が、次の候補特徴量を取り出す。
【0059】
対象となる全ての候補特徴量について検査が終了した場合には、1/2基準値が小さい候補特徴量との同一性検査を終了する(S406:Yes)。
【0060】
また、本実施の形態では、EOR値が一定値以下のものについては、候補特徴量選択部1024が、当該特徴量を、同一分割特徴量格納部109に格納するようにしている(S407)。ここに格納されたデータは、必ずしも意味的に類似するものではないが、配置対象情報の分割のされ方が似ているキーワードとして一種のシソーラスデータとして利用することができる。また、本実施の形態では、上記類似性の検査により排除されるべき特徴量が検出された場合には、候補特徴量選択部1024は、候補特徴量の選択にあたり、より1/2基準値が小さい特徴量を候補特徴量として選択するようにしているが、1/2基準値が同一の場合は、出現頻度が大きい特徴量を選択し、出現頻度も同一であれば、先に出現したものを選択するようにしている。選択されない特徴量については、例えばフラグを設定しておいて、その後の候補特徴量格納処理(S303)において、候補特徴量格納部108に格納しないようにすること等が可能である。
【0061】
次に、処理対象となっているキーワードより1/2基準値が大きい候補対象量との検査の方法について詳細に説明する。図5は、当該検査における詳細な処理内容を示すフローチャートである。
【0062】
候補特徴量選択部1024は、当該条件に該当する候補特徴量について、まず、一つ特徴量データを取り出す(S501)。
【0063】
次に、候補特徴量選択部1024は、図4の処理と同様に、処理対象特徴量と、取り出された候補特徴量との間でEOR値を算出し(S502)、算出されたEOR値が一定値以下であるか否かを判定する(S503)。
【0064】
EOR値が一定以下でない場合(S503:No)には、候補特徴量選択部1024は、類似特徴量情報格納部110を参照して、二つのキーワードの意味的な類似性の検査を行うが(S504)、類似性が一定値以上である場合(S505:Yes)は、取り出された候補特徴量の方を、候補特徴量格納部108から削除し(S506)、ステップS507へと進む。
【0065】
一方、類似性が一定値以上でない場合(S505:No)には、両者が類似していないことを意味するので、そのままステップS507へと進む。
【0066】
ステップS507では、対象となる全ての候補特徴量について検査が終了したか否かを判定し、全ての候補特徴量について検査が終了していない場合には(S507:No)、ステップS501に戻って次の候補特徴量データを取り出す。
【0067】
対象となる全ての候補特徴量について検査が終了した場合には、1/2基準値が大きい候補特徴量との同一性検査を終了する(S507:Yes)。
【0068】
EOR値が一定値以下のものについて、同一分割特徴量格納部109に格納するのは(S508)、図4で説明した例と同様であるが、この場合は、原則として取り出された候補特徴量の方が同一分割特徴量格納部109に格納されることとなる。
【0069】
以上のように、1/2基準値が大きい候補特徴量との同一性検査を終了すると、図3のフローチャートに戻って、候補特徴量格納処理を行う(S303)。
【0070】
候補特徴量格納処理(S303)では、ステップS301及びS302において、分割のされ方においても、意味的にも類似でないと判定された特徴量について、候補特徴量選択部1024が、候補特徴量格納部108の所定の位置に格納する。ここで、所定の位置とは、候補特徴量格納部108において、1/2基準値の小さい順、1/2基準値が同一であれば出現頻度の大きい順に特徴量がソートして格納されるような位置を意味する。
【0071】
以上のように候補特徴量格納処理を終了すると、図2のフローチャートに戻って、未処理の処理対象特徴量があるか否かを判定し(S208)、未処理の処理対象特徴量があれば(S208:Yes)、ステップS203へと進み、次の特徴量データを取り出す。
【0072】
一方、未処理の処理対象特徴量がなければ(S208:No)、ユーザ指定特徴量を除く全ての処理対象特徴量について、処理が終了したことを意味するので、実際に配置対象情報の配置に利用する特徴量を選択する処理を行う。この特徴量の選択にあたり、本実施の形態では、特徴量選択部1025が、まず、ユーザ指定特徴量格納部111からユーザ指定特徴量を読み出し(S209)、さらに、残りの特徴量について、候補特徴量格納部108から選択する(S210)。
【0073】
上述の如く、候補特徴量格納部108には、候補特徴量が1/2基準値の小さい順にソートされている状態で格納されているため、特徴量選択部1025は、ソートされている順に所定の数だけ、実際に利用する特徴量を選択する。その結果として、配置対象情報が書籍データの場合であれば、1/2基準値が小さいキーワードが優先して選択される。また、1/2基準値が同一であれば、出現頻度が大きいキーワードが優先して選択され、出現頻度も同一であれば先に出現したキーワードが優先して選択されることとなるのは上述のとおりである。
【0074】
一方、配置対象情報が静止画データの場合は出現頻度の情報を保持していないが、本実施の形態では1/2基準値が同一の特徴量は全て選択するようにしている。
【0075】
また、選択する特徴量の数は、キーワードの場合であれば、ユーザ指定特徴量を含めて9個選択すれば、ほぼ適切な情報探索空間への配置という目的を達することができる。もっとも、選択する特徴量の数は利用目的によっても異なり、リアルタイムに分布を計算するために処理速度を重視すれば少ない方がよいが、情報の分散を適切に実施するためにはある程度の数が必要である。
【0076】
図8は、本実施の形態における特徴量選択装置において、候補特徴量の選択を行った結果の一例を示す図である。同図は、書籍のデータから、「生物」というキーワードを用いて、ハンティング検索を行った結果として得られた検索結果集合(295件)について、特徴量の選択を行った結果である。尚、同図の例では、候補特徴量としてキーワードを20個格納しているが、候補特徴量として格納可能な個数は、利用目的等により任意に設定してよい。
【0077】
実際に情報探索空間を構築する際には、これらのキーワードから、1/2基準値が小さいものから順に選択して利用することとなる。
【0078】
図9は、本実施の形態の特徴量選択装置によって選択されたキーワードを用いて、情報探索空間に書籍の情報を分散配置しようとした画面の一例を模式的に示す図である。同図の例では、図8に示した例の候補特徴量から、1/2基準値が小さい特徴量を9個、実際の分散配置に用いている。同図において、「利用」のラベルの周辺には、キーワード「利用」を含む書籍の情報が配置されるようになるため、ユーザのブラウジング検索の利便を図ることができる。
【0079】
このように、本発明の特徴量選択装置を用いることにより、ユーザがブラウジング検索を行いやすい情報探索空間を構築するにあたり、最も適切な特徴量を選択することができるため、最小の特徴量で情報探索空間を構築することが可能となり、システムの処理効率を向上させることができる。
【0080】
なお、本発明である特徴量選択装置を実現するプログラムを記憶した記憶媒体は、図10の記憶媒体の例で示すように、CD−ROMやフロッピーディスク等の可搬型記憶媒体だけでなく、回線先の他の記憶装置や、コンピュータのハードディスクやRAM等の記憶媒体のいずれでもよく、プログラム実行時には、プログラムはローディングされ、主メモリ上で実行される。
【0081】
また、本実施の形態では、ユーザ指定特徴量を、必ず最終的に特徴量として選択するようにしているが、他の方法も可能である。例えば、ユーザ指定特徴量であれば、分割の類似性や、意味の類似性の検査において優先して候補特徴量として選択されるようにしておき、最終的な選択の際には、ユーザ指定特徴量も他の候補特徴量と同様に、1/2基準値等を基準として選択するようにすることもできる。
【0082】
【発明の効果】
以上に説明したように、本発明に係る特徴量選択装置によれば、ブラウジング検索を行うための情報探索空間に、特徴量を用いて探索対象情報を分散配置する際に、適切な配置を行いながら、かつ、システムの処理効率を向上させることを可能とする特徴量を選択することができるという効果がある。
【図面の簡単な説明】
【図1】本発明に係る特徴量選択装置を含む情報探索装置の一実施の形態における構成を示す機能ブロック図である。
【図2】本発明の実施の形態における制御部102の処理内容を示すフローチャートである。
【図3】本発明の実施の形態における候補特徴量格納処理の処理内容を示すフローチャートである
【図4】本発明の実施の形態における1/2基準値が小さい候補特徴量との同一性検査の詳細な処理内容を示すフローチャートである。
【図5】本発明の実施の形態における1/2基準値が大きい候補特徴量との同一性検査の詳細な処理内容を示すフローチャートである。
【図6】(a)本発明の実施の形態において、配置対象情報が書籍の情報である場合の、特徴量情報の内容の一例を示す図である。
(b)本発明の実施の形態において、配置対象情報が静止画の情報である場合の特徴量情報の内容の一例を示す図である。
【図7】本実施の形態の特徴量選択装置におけるEOR値の内容を説明するための図である。
【図8】本実施の形態の特徴量選択装置を用いて候補特徴量の選択を行った結果の一例を示す図である。
【図9】本実施の形態の特徴量選択装置によって選択されたキーワードを用いて、情報探索空間に書籍の情報を分散配置しようとした画面の一例を模式的に示す図である。
【図10】記憶媒体の例を示す図である。
【符号の説明】
101 入力部
102 制御部
103 出力部
104 探索対象情報格納部
105 配置対象情報格納部
106 探索対象特徴量格納部
107 特徴量しきい値格納部
108 候補特徴量格納部
109 同一分割特徴量格納部
110 類似特徴量情報格納部
111 ユーザ指定特徴量格納部
1021 特徴量抽出部
1022 1/2基準値算出部
1023 ユーザ指定特徴量判定部
1024 候補特徴量選択部
1025 特徴量選択部
901 回線先の記憶装置
902 CD−ROMやフロッピーディスク等の可搬型記憶媒体
902−1 CD−ROM
902−2 フロッピーディスク
903 コンピュータ
904 コンピュータ上のRAM/ハードディスク等の記憶媒体
[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention provides an information search apparatus that calculates a distribution of search target information in an information search space by using a feature amount representing the search target information when arranging the search target information in an information search space for performing a browsing search. And a feature amount selecting device for selecting a feature amount used for the calculation.
[0002]
[Prior art]
Conventionally, there have been two types of search methods for obtaining necessary information by an information search system, a hunting search and a browsing search. The hunting search is a method of selecting data from a set of data based on a condition specified by a user, such as a keyword. The information searched by the hunting search is further examined in detail by the browsing search. Browsing search refers to a method of distributing and arranging information in, for example, a two-dimensional or three-dimensional information space, and selecting data to be viewed while moving in the information space. In recent years, there has been an increasing demand to search for data including multimedia information such as still images, moving images, and audio. However, in such data search, it is difficult to search only by hunting search. Browsing search is gaining in importance.
[0003]
On the other hand, arranging data randomly in the information search space for use in browsing search makes it difficult for the user to move around in the information search space when trying to browse information, so the information is provided to the user. It is important to classify and arrange data so that it is easy to understand. However, in recent years, various kinds of information have been produced in large quantities, and it has become difficult to classify the information by a prior classification system. To cope with this, various clustering techniques have been devised.
[0004]
[Problems to be solved by the invention]
However, in the conventional clustering technique, for example, when the search target information is book data, many of the keywords use the keywords as they are, and the processing time by the system increases, so that the clustering can be performed in real time. There was a problem that it was difficult.
[0005]
The present invention has been made in view of the above problems, and provides a feature amount selection apparatus that can improve the efficiency of the processing by a system when appropriately distributing search target information in an information search space for performing browsing information search. The purpose is to do.
[0006]
[Means for Solving the Problems]
In order to achieve the above object, the feature amount selecting device of the present invention, when arranging search target information in an information search space, uses the feature amount representing the search target information to arrange the search target information in the information search space. In the information search device for determining the arrangement, a feature amount selection device for selecting a feature amount used to determine the arrangement, wherein a set of each search target information and a plurality of feature amounts representing the search target information, A storage unit for storing a feature amount to be stored, and a selection unit for selecting a predetermined number of feature amounts from the feature amounts stored in the storage unit in an order appropriate for the arrangement of search target information based on a predetermined rule. And characterized in that:
[0007]
Here, the selecting means, if the search target information to be arranged in the information search space is divided by whether or not represented by a certain feature amount, the result of the division by two feature amounts, A division similarity determination unit that determines whether or not similarity is equal to or more than a predetermined ratio, and when the division similarity determination unit determines that the two are similar, one of the two feature amounts is determined. It is preferable to have a selection control unit that controls the selection. The fact that the division is similar means that it is insignificant to select the plurality of feature values redundantly, so that it is possible to prevent the feature values from being selected redundantly. It is.
[0008]
In addition, the selecting unit may further include, when the division similarity determination unit determines that the two are similar, output one of the two feature amounts that is not selected as the same division feature amount. It is preferable that a feature value output unit is provided, and the feature value selection device further includes a same-divided feature value storage unit that stores the feature value output by the same-divided feature value output unit. Since information relating to feature amounts that are divided in a similar manner can be used as a type of thesaurus data, storing the information makes it possible for the operator to conveniently search for information. Because.
[0009]
Further, the division similarity determination unit is configured to determine, for the two feature amounts, the sum of the numbers of search target information represented by the respective feature amounts and the search target information represented by only one of the two feature amounts. The similarity of the result of the division can be determined from the ratio with the number.
[0010]
In addition, the feature amount selection device further includes a similar feature amount information storage unit that stores information about a similarity between two feature amounts, and the selection unit further includes information stored in the similar feature amount information storage unit. A feature amount similarity determination unit that determines whether the two feature amounts are similar to each other, and when the feature amount similarity determination unit determines that the two feature amounts are similar, It is preferable to have a second selection control unit that controls to select one. For example, it is possible to prevent a synonym or a synonym such as “computer” and “computer” from being redundantly selected as a feature amount.
[0011]
In addition, the feature amount selection device further includes a user-specified feature amount input unit that inputs a feature amount specified by an operator, and a user-designated feature amount storage that stores the feature amount input by the user-specified feature amount input unit. Means, and the selecting means can always select the feature quantity stored in the user-specified feature quantity storing means. By enabling the user to specify a certain number of feature values, it is possible to construct an information search space that is easier for the user to search.
[0012]
In addition, the storage medium of the present invention is an information search device that determines the arrangement of the search target information in the information search space by using a feature amount representing the search target information when the search target information is arranged in the information search space. A feature amount selecting apparatus for selecting a feature amount used for determining the arrangement, wherein a plurality of sets of respective search target information and a plurality of feature amounts representing the search target information are stored. An extracting step of sequentially extracting feature amounts representing the search target information to be arranged from the storage unit, and determining whether the search target information to be arranged is represented by the feature amounts extracted in the extracting step. Thus, if the search target information to be arranged is divided, it is determined whether or not the result of the division by any two feature amounts is similar to a predetermined ratio or more. When the similarity is determined in the division similarity determination step and the division similarity determination step, one of the two characteristic amounts is selected as the characteristic amount used for determining the arrangement. And a computer-readable program for executing the selection control step.
[0013]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, embodiments of the present invention will be described with reference to the drawings.
[0014]
FIG. 1 is a functional block diagram illustrating a configuration of an information search device including a feature amount selection device according to an embodiment of the present invention. As shown in the figure, the information search device including the feature amount selection device of the present embodiment includes an input unit 101, a control unit 102, an output unit 103, a search target information storage unit 104, a placement target information storage unit 105, A search target feature storage unit 106, a feature threshold storage unit 107, a candidate feature storage unit 108, the same divided feature storage unit 109, a similar feature information storage unit 110, and a user-specified feature storage unit 111 are provided. I have. It should be noted that FIG. 2 mainly illustrates a portion that constitutes the feature amount selection device according to the present invention, and a portion that performs processing necessary for normal use as an information search device is omitted in some cases.
[0015]
The input unit 101 is used by the user to perform an input for specifying information search, an input of a user-specified feature amount, and the like. That is, it corresponds to the user-specified feature amount input means described in the claims. As the input unit 101, specifically, a pointing device such as a mouse or an input device such as a keyboard can be used.
[0016]
The control unit 102 controls the entire information search apparatus, and also performs processing related to selection of a feature by the feature selection apparatus according to the present invention. This corresponds to the selecting means described in the claims. Further, the control unit 102 includes a feature amount extraction unit 1021, a 基準 reference value calculation unit 1022, a user-designated feature amount determination unit 1023, a candidate feature amount selection unit 1024, and a feature amount selection unit 1025. Detailed processing contents of each unit will be described later.
[0017]
The output unit 103 displays an information search space in the information search device according to the present embodiment. As the output unit 103, specifically, an output device that can display a two-dimensional image, such as a display device, is used. Note that the information search space may be a two-dimensional space or a three-dimensional space.
[0018]
The search target information storage unit 104 stores all information to be searched by the information search device including the feature amount selection device according to the present embodiment. For example, if the information to be searched is book data, the search target information storage unit 104 stores all information and the like necessary to display book data in the information search space. If the data is a still image, a file of the still image is stored. The information includes an identifier required to specify the information. The control unit 102 refers to the search target information storage unit 104 as necessary, and displays data in the information search space.
[0019]
The placement target information storage unit 105 stores data to be placed in the information search space. For example, if the search target is book data, information of an identifier necessary for specifying information to be arranged, such as an ID of a book to be arranged in the information search space, is stored. As described above, the information stored in the arrangement target information storage unit 105 is generally information previously narrowed down by hunting search from the entire information stored in the search target information storage unit 104. Depending on the amount of information, necessary information such as an identifier may be stored for all the information stored in the search target information storage unit 104.
[0020]
The search target feature storage unit 106 stores, for all the information stored in the search target information storage unit 104, information on the correspondence between the identifier of each search target information and the feature value. This corresponds to the feature storage means described in the claims. The information identifier is the same as the information stored in the placement target information storage unit 105. FIG. 6 is a diagram illustrating an example of the content of information stored in the search target feature amount storage unit 106. FIG. 6A shows an example in which the search target information is book data, and FIG. 6B shows an example in which the search target information is still image data.
[0021]
As shown in FIG. 6A, when the search target information is book data, a keyword is used as a feature amount. In the present embodiment, as the keyword, the character information displayed on the cover and the table of contents is automatically extracted by performing a process such as morphological analysis, but is extracted from all the sentences included in the book. It is also possible to use various methods for extracting keywords. Also, as shown in FIG. 3A, when keywords are used as the feature amounts, the appearance frequency in the document information is held as information for each keyword. A method of using the appearance frequency information will be described later. Although the table is shown in the form of a table for easy understanding, it is actually stored in the form of a list of pairs of keywords and appearance frequencies.
[0022]
On the other hand, when the search target information is a still image, as shown in FIG. 6B, only the feature amount is held, and the appearance frequency is not held. Here, the feature amount in the present embodiment when the search target information is a still image will be described.
[0023]
HSV conversion is performed on the still image data given as the RGB values of each pixel to convert the data into hue, saturation, and brightness information. Here, the hue is divided into 32 sections, the saturation is divided into 4 sections, and the brightness is divided into 4 sections, and this section is considered as one feature amount. That is, assuming that each of hue, saturation, and lightness is represented by 8 bits, for hue data, a value from 0 to 255 is divided into 32 sections, and 0 to 7, 8 to 15, and so on. Is defined as one feature amount. Since the saturation and lightness are divided into four sections, each section is defined as one feature amount, such as 0 to 63 and 64 to 127.
[0024]
The value of the feature amount is a value obtained by dividing the number of pixels in the image taking the value of each section as the frequency of the section and dividing the frequency by the total number of pixels. A method of selecting from these 40 feature amounts will be described later.
[0025]
The feature amount threshold storage unit 107 stores a threshold for each feature. For example, in the present embodiment, the threshold value when the feature amount is a keyword is set to 1. This means that if any one of the keywords appears as a feature amount of the arrangement target information, the keyword is set as a target of the feature amount selection process. When the feature amount is the above hue, saturation and lightness, the value is 1/32 for the hue, and 1/4 for the lightness again. This is a value assuming that the distribution is even, but is not limited to this value.
[0026]
The candidate feature amount storage unit 108 stores feature amounts to be finally selected as feature amounts (hereinafter, referred to as “candidate feature amounts”). The selection of the candidate feature amounts and the processing contents at the time of storage thereof will be described later.
[0027]
The same divided feature amount storage unit 109 stores, in the processing for selecting a candidate feature amount, a process for eliminating redundant use of a feature amount in which information is divided in a similar manner, the feature amount that has been excluded. Is stored. This corresponds to the same divided feature quantity storage means described in the claims. Details of the feature amounts stored in the same divided feature amount storage unit 109 will be described later.
[0028]
The similar feature information storage unit 110 mainly stores thesaurus data relating to synonyms and synonyms. This corresponds to the similar feature storage means described in the claims. These pieces of information are used in processing for eliminating redundant use of semantically similar feature amounts performed when selecting candidate feature amounts. The storage of these thesaurus data can be performed by the user using another existing program or device, but the device can be provided in the information search device of the present embodiment.
[0029]
The user-specified feature amount storage unit 111 stores information on feature amounts specified by the user. This corresponds to the user-specified feature amount storage means described in the claims. The feature value stored in the user-specified feature value storage unit 111 is always finally selected as a feature value regardless of whether or not the feature value should be originally selected by the feature value selection device according to the present invention. Used to construct an information search space.
[0030]
Next, processing contents of each unit of the control unit 102 will be described.
[0031]
The feature amount extracting unit 1021 stores the identifier of the placement target information stored in the placement target information storage unit 105 and the information stored in the search target feature storage unit 106 in the placement target information storage unit 105. A feature quantity that represents the placement target information that exceeds the threshold value of the feature quantity stored in the feature quantity threshold value storage unit 107 is extracted, and the placement target information represented by the feature quantity is extracted. Is calculated.
[0032]
The 基準 reference value calculation unit 1022 calculates a 基準 reference value of each feature amount based on the number of data pieces of the placement target information extracted by the feature amount extraction unit 1021. Here, the “1/2 reference value” is a numerical value indicating how much of the arrangement target information is represented by the feature amount, and specifically, the following formula: It means the value calculated by 1.
[0033]
h = | w / n-0.5 | (1)
For example, when the placement target information is book data, in the above equation 1, w is the number of books including the keyword in the placement target information, and n is stored in the placement target information storage unit 105. This is the total number of placement target information items. For example, if 100 pieces of book data are stored in the arrangement target information storage unit 105 and there are 50 pieces represented by the keyword “structure”, a half reference value for the keyword “structure” Becomes 0.
[0034]
The feature amount selection device of the present invention aims at appropriately distributing and distributing an information group to be arranged in an information search space in the information search space. Accordingly, it can be considered that a keyword that can bisect the placement target information is most suitable for the distributed placement. Therefore, a keyword having a small 1/2 reference value is preferentially used as a keyword suitable for information division.
[0035]
The user-specified feature value determination unit 1023 refers to the user-specified feature value storage unit 111 for the feature value for which the 基準 reference value has been calculated by the 基準 reference value calculation unit 1022, and sets the feature value to the user-specified feature value. It is sequentially determined whether or not it is applicable.
[0036]
The candidate feature quantity selection unit 1024 performs a candidate feature quantity selection process on the feature quantity determined by the user designated feature quantity determination unit 1023 to be not a user designated feature quantity, and stores the selected feature quantity in the candidate feature quantity storage unit 108. To be stored. It performs processing corresponding to the division similarity determination unit, the selection control unit, the same division characteristic amount output unit, and the characteristic amount similarity determination unit described in the claims.
[0037]
The feature amount selection unit 1025 selects a predetermined number of feature amounts from the candidate feature amounts stored in the candidate feature amount storage unit 108. At this time, the user-specified feature amount is added and selected with reference to the user-specified feature amount storage unit 111. Here, the selected feature amount is finally used for constructing the information search space.
[0038]
FIG. 2 is a flowchart showing the processing content of control unit 102 in the present embodiment. As shown in the drawing, the control unit 102 first calculates the number of feature data (S201). Specifically, the feature amount extraction unit 1021 refers to the search target feature amount storage unit 106 based on the identifier of the information stored in the placement target information storage unit 105, and obtains the feature amount corresponding to the placement target information. Extract information.
[0039]
As described above, when the placement target information is book data, the feature amount data stored in the search target feature amount storage unit 106 includes a keyword used as a feature amount as shown in FIG. , And the appearance frequency of the keyword. Therefore, the feature amount extraction unit 1021 further refers to the feature amount threshold value storage unit 107 and extracts a keyword for a keyword whose appearance frequency is equal to or greater than the threshold value of the feature amount “keyword”. Calculate the number of books represented by.
[0040]
In the present embodiment, the threshold value of the feature value “keyword” is 1. This means that, as described above, if a book that includes at least one of the keywords is present in the placement target information, the keywords are to be selected by the feature amount selecting apparatus according to the present embodiment. Means
[0041]
Next, the 1/2 reference value calculation unit 1022 calculates a 1/2 reference value for each extracted feature amount (S202). Since the 1/2 reference value has been described in detail above, the description here is omitted.
[0042]
Next, the user-specified feature value determination unit 1023 extracts one feature value whose 1/2 reference value has been calculated by the 1/2 reference value calculation unit 1022 (S203).
[0043]
With respect to the extracted feature amount (hereinafter, referred to as “processing target feature amount”), the user-designated feature amount determination unit 1023 determines whether or not the extracted feature amount is a user-designated feature amount (S204). Here, the user-specified feature amount refers to a feature amount specified by the user, such as a keyword specified by the user for narrowing down information or the like in the hunting search process. However, even in the case of book data, the keyword used for the hunting search does not necessarily have to be the user-specified feature amount, and may be input using the input unit 101 separately.
[0044]
As described later, the user-specified feature amount is a feature amount to be always selected irrespective of the operation of the feature amount selection device according to the present invention. Therefore, it is determined in step S204 that the user-specified feature amount is the user-specified feature amount. In this case (S204: Yes), the subsequent processing is skipped, and the process proceeds to step S208.
[0045]
If the processing target feature is not the user-specified feature (S204: No), it is determined whether the processing target feature is the first one other than the user-specified feature, ie, a candidate feature. It is determined whether or not even one candidate feature is stored in the quantity storage unit 108 (S205). If no candidate feature is stored in the candidate feature storage 108 (S205: Yes), The processing target feature is stored in the candidate feature storage 108 (S206).
[0046]
If at least one candidate feature has already been stored in the candidate feature storage 108 (S205: No), the candidate feature selector 1024 proceeds to the candidate feature storage (S207). FIG. 3 is a flowchart showing the detailed processing contents of the candidate feature amount storage processing.
[0047]
As shown in the figure, in the candidate feature storage process, the candidate feature selector 1024 first performs an identity test with a candidate feature having a small が reference value (S301).
[0048]
FIG. 4 is a flowchart showing the detailed processing content of the identity check with the candidate feature amount having a small 1/2 reference value. The candidate feature value having a small 1/2 reference value is a candidate feature value stored in the candidate feature value storage unit 108, and refers to a feature value having the same or a small 1/2 reference value. The candidate feature quantity selection unit 1024 first extracts one piece of data for the candidate feature quantity that satisfies the condition (S401).
[0049]
Next, the candidate feature Selection section A step 1024 calculates an EOR value or a similarity between the processing target feature amount and the extracted candidate feature amount (S402).
[0050]
Here, the case where the arrangement target information is book data will be described as an example of the EOR value. The EOR value is an exclusive OR of two keywords J and L, where k (j) is the number of books containing the keyword J and k (l) is the number of books containing the keyword L. That is, when the number of books including only one of the keywords J and L is e (k (j), k (l)), the value is expressed by the following expression 2.
[0051]
EOR value = e (k (j), k (l)) / (k (j) + k (l)) (2)
This is shown in FIG. Note that, in the figure, the outer square represents the information narrowed down by the hunting search. As can be seen from the figure, a low EOR value means that there are many book data including both of the two keywords, and even if the two keywords are used repeatedly, Indicates that the way information is divided is similar. In such a case, since it is considered that it is not necessary to select both of the two keywords as the feature amount for determining the arrangement, the feature amount selecting apparatus of the present invention selects only one of the two keywords. It is what it was.
[0052]
When the EOR value is calculated, the candidate feature amount selection unit 1024 determines whether the calculated EOR value is equal to or less than a certain value (S403).
[0053]
In this embodiment, the fixed value of the EOR value in step S403 is set to 1/4, but an arbitrary value may be set. The reason why the constant value is set to 1 / in the present embodiment is, for example, when both 1 / reference values of two keywords are 0, that is, information including the keywords is 1 / of the entire information. If the total data amount in the case where there is no data duplication is assumed to be 1 and the data duplication up to a number corresponding to 1/4 of the total data amount is determined, the information is divided. Are treated as different, but this is not a property to be limited to this value.
[0054]
If the EOR value is not equal to or less than the certain value (S403: No), the candidate feature amount selection unit 1024 refers to the similar feature amount information storage unit 110 to check the semantic similarity between the two keywords ( S404). This is a process for avoiding selecting a synonym or a synonym redundantly as a feature amount. That is, for example, it is considered that there is little need to select a synonym such as “computer” and “computer” or a synonym as a feature amount in a redundant manner. Only one is selected.
[0055]
If the placement target information is a still image, the similarity is calculated as indicating the similarity of the feature amounts. For calculating the similarity, a value obtained by determining a correlation between adjacent color sections for each hue, saturation, and lightness by a Gaussian function is used. For example, in the case of hue, it is considered that both ends of the section are adjacent to each other, and the correlation is calculated based on the relation that the section is arranged on a circle. For example, assuming that the section is 1 away from the section, the similarity to the section j sections away can be expressed by the following Equation 3.
[0056]
Similarity = (exp (− (16−j) * (16−j) / 16) −exp (−16)) / (1−exp (−16)) (3)
Therefore, in the similar feature amount information storage unit 110, information on the above-mentioned synonyms and synonyms is separately stored by the user together with numerical information on the similarity.
[0057]
If the similarity is equal to or more than a certain value (S405: Yes), the subsequent process is not performed so that the feature amount targeted for the selection process is not set as a candidate feature amount, and the candidate having a small 1/2 reference value is used. The identity check with the feature amount ends.
[0058]
On the other hand, if the similarity is not equal to or more than the predetermined value (S405: No), it means that the two are not similar, so it is determined whether or not the inspection has been completed for all target candidate feature amounts ( If the inspection has not been completed for all the candidate feature amounts (S406: No), the process returns to step S401, and the candidate feature amount selection unit 1024 extracts the next candidate feature amount.
[0059]
When the inspection has been completed for all target candidate feature amounts, the identity check with the candidate feature amount having a small 小 さ い reference value ends (S406: Yes).
[0060]
Further, in the present embodiment, the candidate feature amount selection unit 1024 stores the feature amount in the same divided feature amount storage unit 109 when the EOR value is equal to or less than a certain value (S407). The data stored here is not necessarily semantically similar, but can be used as a kind of thesaurus data as a keyword having a similar way of dividing the placement target information. Also, in the present embodiment, when a feature value to be eliminated by the above-described similarity check is detected, the candidate feature value selecting unit 1024 sets the reference value to a value smaller than 1 / the reference value when selecting the candidate feature value. A small feature value is selected as a candidate feature value. If the 1/2 reference value is the same, a feature value with a high appearance frequency is selected. To choose. For a feature amount that is not selected, for example, it is possible to set a flag and not to store it in the candidate feature amount storage unit 108 in the subsequent candidate feature amount storage process (S303).
[0061]
Next, a detailed description will be given of a method of checking a candidate target amount having a 1 / reference value larger than the keyword to be processed. FIG. 5 is a flowchart showing detailed processing contents in the inspection.
[0062]
The candidate feature amount selection unit 1024 first extracts one feature amount data for the candidate feature amount corresponding to the condition (S501).
[0063]
Next, the candidate feature quantity selection unit 1024 calculates an EOR value between the processing target feature quantity and the extracted candidate feature quantity (S502), similarly to the processing in FIG. 4, and calculates the EOR value. It is determined whether the value is equal to or less than a certain value (S503).
[0064]
When the EOR value is not equal to or less than the predetermined value (S503: No), the candidate feature amount selecting unit 1024 refers to the similar feature amount information storage unit 110 to check the semantic similarity of the two keywords ( If the similarity is equal to or more than a certain value (S505), the extracted candidate feature is deleted from the candidate feature storage 108 (S506), and the process proceeds to step S507.
[0065]
On the other hand, if the similarity is not equal to or more than the certain value (S505: No), it means that both are not similar, and the process directly proceeds to step S507.
[0066]
In step S507, it is determined whether the inspection has been completed for all the candidate feature amounts to be processed. If the inspection has not been completed for all the candidate feature amounts (S507: No), the process returns to step S501. The next candidate feature data is extracted.
[0067]
When the inspection is completed for all target candidate feature amounts, the identity check with the candidate feature amount having a large 1/2 reference value is completed (S507: Yes).
[0068]
The storage of the same divided feature amount storage unit 109 for the EOR value equal to or less than a certain value (S508) is similar to the example described with reference to FIG. 4, but in this case, the candidate feature amount extracted in principle is Are stored in the same divided feature amount storage unit 109.
[0069]
As described above, when the identity check with the candidate feature amount having a large 基準 reference value is completed, the process returns to the flowchart of FIG. 3 and the candidate feature amount storage process is performed (S303).
[0070]
In the candidate feature storing process (S303), the candidate feature selecting unit 1024 sets the candidate feature storing unit to the candidate feature selecting unit 1024 for the feature determined in steps S301 and S302 as not being semantically similar in the way of division. 108 at a predetermined position. Here, the predetermined position is stored in the candidate characteristic amount storage unit 108 in the order of small 基準 reference value, and if the 1 / reference value is the same, the characteristic amounts are sorted in descending order of appearance frequency and stored. Means such a position.
[0071]
Upon completion of the candidate feature storage process as described above, the process returns to the flowchart of FIG. 2 to determine whether or not there is an unprocessed feature to be processed (S208). (S208: Yes), the process proceeds to step S203, and the next feature amount data is extracted.
[0072]
On the other hand, if there is no unprocessed feature to be processed (S208: No), it means that the processing has been completed for all the feature to be processed except for the user-specified feature, so that the placement of the placement target information is actually performed. A process for selecting a feature to be used is performed. In this feature amount selection, in the present embodiment, the feature amount selection unit 1025 first reads the user-specified feature amount from the user-specified feature amount storage unit 111 (S209), and further, for the remaining feature amounts, selects candidate features. A selection is made from the quantity storage unit 108 (S210).
[0073]
As described above, since the candidate feature amounts are stored in the candidate feature amount storage unit 108 in a state where the candidate feature amounts are sorted in ascending order of the 基準 reference value, the feature amount selection unit 1025 determines the predetermined order in the sorted order. The feature amounts to be actually used are selected by the number of. As a result, if the placement target information is book data, a keyword having a small 1/2 reference value is preferentially selected. Also, if the 1/2 reference value is the same, the keyword with the higher appearance frequency is preferentially selected. If the appearance frequency is the same, the keyword that appeared earlier is preferentially selected. It is as follows.
[0074]
On the other hand, when the placement target information is still image data, the information on the frequency of appearance is not held, but in the present embodiment, all the feature values having the same 1/2 reference value are selected.
[0075]
Further, in the case of a keyword, if the number of feature amounts to be selected is nine, including the user-specified feature amounts, the purpose of arranging in an almost appropriate information search space can be achieved. However, the number of feature values to be selected also depends on the purpose of use, and it is better to reduce the number if the processing speed is emphasized in order to calculate the distribution in real time. is necessary.
[0076]
FIG. 8 is a diagram illustrating an example of a result of selecting a candidate feature amount in the feature amount selection device according to the present embodiment. The figure shows the result of selecting a feature amount from a set of search results (295 items) obtained as a result of performing a hunting search from the book data using the keyword “creature”. Although 20 keywords are stored as the candidate feature amounts in the example of FIG. 3, the number that can be stored as the candidate feature amounts may be arbitrarily set depending on the purpose of use or the like.
[0077]
When actually constructing the information search space, these keywords are selected and used in ascending order of the 1/2 reference value.
[0078]
FIG. 9 is a diagram schematically illustrating an example of a screen in which book information is to be distributed and arranged in the information search space using the keyword selected by the feature amount selection device according to the present embodiment. In the example of FIG. 9, nine feature values having a smaller か ら reference value are used for actual distributed arrangement from the candidate feature values of the example shown in FIG. 8. In the figure, information of a book including the keyword “use” is arranged around the label of “use”, so that it is possible to improve the user's browsing search convenience.
[0079]
As described above, by using the feature amount selection device of the present invention, the user can select the most appropriate feature amount when constructing an information search space where browsing search can be easily performed. A search space can be constructed, and the processing efficiency of the system can be improved.
[0080]
As shown in the example of the storage medium in FIG. 10, the storage medium storing the program for realizing the feature amount selection device according to the present invention is not only a portable storage medium such as a CD-ROM or a floppy disk, but also a The storage may be any of the other storage devices described above or a storage medium such as a hard disk or a RAM of a computer. When the program is executed, the program is loaded and executed on the main memory.
[0081]
Further, in the present embodiment, the user-specified feature amount is always finally selected as the feature amount, but other methods are also possible. For example, in the case of a user-specified feature amount, it is preferentially selected as a candidate feature amount in inspection of similarity of division and similarity of meaning. The amount can be selected based on a 1/2 reference value or the like as in the case of other candidate feature amounts.
[0082]
【The invention's effect】
As described above, according to the feature amount selection device of the present invention, when distributing search target information using feature amounts in an information search space for performing browsing search, an appropriate arrangement is performed. However, there is an effect that it is possible to select a feature amount that enables the processing efficiency of the system to be improved.
[Brief description of the drawings]
FIG. 1 is a functional block diagram illustrating a configuration of an information search device including a feature amount selection device according to an embodiment of the present invention.
FIG. 2 is a flowchart showing processing contents of a control unit 102 according to the embodiment of the present invention.
FIG. 3 is a flowchart illustrating processing contents of a candidate feature amount storage processing according to the embodiment of the present invention.
FIG. 4 is a flowchart showing a detailed process of an identity check with a candidate feature having a small 1 / reference value according to the embodiment of the present invention;
FIG. 5 is a flowchart illustrating a detailed process of an identity check with a candidate feature having a large 大 き い reference value according to the embodiment of the present invention.
FIG. 6A is a diagram illustrating an example of the content of feature amount information when the placement target information is book information in the embodiment of the present invention.
(B) In the embodiment of the present invention, it is a figure showing an example of the contents of feature amount information when arrangement object information is information on a still picture.
FIG. 7 is a diagram for explaining the contents of an EOR value in the feature amount selection device of the present embodiment.
FIG. 8 is a diagram illustrating an example of a result of selecting candidate feature amounts using the feature amount selection device according to the present embodiment.
FIG. 9 is a diagram schematically illustrating an example of a screen in which book information is to be distributed and arranged in an information search space using a keyword selected by the feature amount selection device according to the present embodiment.
FIG. 10 illustrates an example of a storage medium.
[Explanation of symbols]
101 Input unit
102 control unit
103 Output unit
104 Search target information storage
105 Allocation target information storage
106 Search target feature amount storage unit
107 Feature Threshold Storage
108 Candidate feature storage
109 Same divided feature storage
110 Similar feature information storage
111 User-specified feature storage
1021 feature amount extraction unit
1022 1/2 reference value calculation unit
1023 User-specified feature amount determination unit
1024 candidate feature quantity selection unit
1025 Feature selection section
901 Line destination storage device
902 Portable storage media such as CD-ROM and floppy disk
902-1 CD-ROM
902-2 floppy disk
903 computer
904 Storage media such as RAM / hard disk on computer

Claims (6)

二次元空間または三次元空間に探索対象から得られる特徴量に応じて配置される該探索対象の情報を表示するための情報探索空間に探索対象情報を配置する際に、前記探索対象情報から得られる特徴量を用いて、当該特徴量のラベルの周辺に当該特徴量を持つ探索対象情報が配置されるように、前記情報探索空間における前記探索対象情報の配置を決定し、前記情報探索空間を二次元の像として出力装置に出力する情報探索装置において、前記配置の決定に用いる特徴量を選択する特徴量選択装置であって、
探索対象情報と、当該探索対象情報から得られる複数の特徴量との組を、予め複数格納する特徴量格納手段と、
前記特徴量格納手段に格納されている特徴量から、前記探索対象情報の配置の決定に用いる特徴量を選択する選択手段と
前記選択手段は、
前記特徴量格納手段に格納されている前記探索対象情報と前記特徴量から、一つの特徴量を持つ探索対象情報の数が全探索対象情報数の1/2に近いものから順に、前記探索対象情報の配置の決定に用いる特徴量を選択する選択制御部を有することを特徴とする特徴量選択装置。
When arranging the search target information in the information search space for displaying the information of the search target arranged according to the feature amount obtained from the search target in the two-dimensional space or the three-dimensional space, the search target information is obtained from the search target information. using a feature amount is, as search target information having the feature quantity on the periphery of the feature quantity of the label is arranged to determine the placement of the search target information in the information search space, the information search space In the information search device that outputs to the output device as a two-dimensional image, a feature amount selection device that selects a feature amount used to determine the arrangement,
Feature amount storage means for storing a plurality of sets of search target information and a plurality of feature amounts obtained from the search target information in advance ;
From the feature amount stored in the feature amount storage unit, a selecting means for selecting a feature amount used in determining the placement of the search target information,
The selecting means,
From the search target information and the characteristic amounts stored in the characteristic amount storage unit, the search target information having one feature amount is sequentially arranged in the order from the one that is closer to half of the total search target information number. A feature amount selection device, comprising: a selection control unit that selects a feature amount used to determine the arrangement of information .
前記選択手段はさらに、
二つの特徴量について、それぞれの特徴量を持つ探索対象情報の数の和と、二つの特徴量のいずれか一方のみを持つ探索対象情報の数との比率から、前記二つの特徴量のそれぞれによる分割結果の類似性を判定する分割類似性判定部と、
前記分割類似性判定部により、前記二つの特徴量のそれぞれによる分割結果が類似していると判定された場合に、前記二つの特徴量のうち一つを、前記探索対象情報の配置の決定に用いる特徴量として選択するように制御する第二の選択制御部とを有する請求項1に記載の特徴量選択装置。
The selecting means further comprises:
About two feature amounts, the number of the sum of the search target information having the respective characteristic amount, from the ratio of the number of search target information having only one of the two feature quantities, each of the two feature quantities A division similarity determination unit that determines the similarity of the division results by
When the division similarity determination unit determines that the division results by each of the two characteristic amounts are similar , one of the two characteristic amounts is used to determine the arrangement of the search target information. The feature amount selecting device according to claim 1, further comprising a second selection control unit that performs control so as to select the feature amount to be used .
前記特徴量選択装置はさらに、同一分割特徴量を格納する同一分割特徴量格納手段を備え、
前記選択手段はさらに、前記分割類似性判定部により分割結果が類似していると判定された二つの特徴量のうち、前記第二の選択制御部により選択されなかった一つを、前記同一分割特徴量として前記同一分割特徴量格納手段に出力する同一分割特徴量出力部を備える請求項2に記載の特徴量選択装置。
The feature amount selection device further includes an identical divided feature amount storage unit that stores the identical divided feature amount ,
The selecting means further selects one of the two feature amounts determined as having similar division results by the division similarity determination unit, which is not selected by the second selection control unit , into the same division. 3. The feature quantity selecting device according to claim 2, further comprising an identical divided feature quantity output unit that outputs the same divided feature quantity to the same divided feature quantity storage unit .
前記特徴量選択装置はさらに、二つの特徴量の類似性に関する情報を格納する類似特徴量情報格納手段を備え、
前記選択手段はさらに、
前記類似特徴量情報格納手段に格納された情報を参照して、二つの特徴量が類似するか否かを判定する特徴量類似判定部と、
前記特徴量類似判定部により分割結果が類似していると判定された場合に、当該二つの特徴量のうち一つを、前記探索対象情報の配置の決定に用いる特徴量として選択するように制御する第三の選択制御部とを有する請求項1〜のいずれかに記載の特徴量選択装置。
The feature amount selection device further includes a similar feature amount information storage unit that stores information regarding the similarity between the two feature amounts,
The selecting means further comprises:
A feature amount similarity determination unit that determines whether two feature amounts are similar by referring to information stored in the similar feature amount information storage unit;
When the feature amount similarity determination unit determines that the division results are similar, control is performed such that one of the two feature amounts is selected as a feature amount used to determine the arrangement of the search target information. feature quantity selection apparatus according to any one of claims 1 to 3 having a third selection control unit for.
入力装置から操作者により特定された特徴量を入力するユーザ指定特徴量入力手段と、
前記ユーザ指定特徴量入力手段により入力された特徴量を格納するユーザ指定特徴量格納手段とを備え、
前記選択手段は、前記ユーザ指定特徴量格納手段に格納された特徴量を常に、前記探索対象情報の配置の決定に用いる特徴量として選択する請求項1〜4のいずれかに記載の特徴量選択装置。
A user-specified feature amount input means for inputting a feature amount specified by the operator from the input device ;
User-specified feature value storage means for storing a feature value input by the user-specified feature value input means,
5. The feature amount selection according to claim 1, wherein the selection unit always selects a feature amount stored in the user-specified feature amount storage unit as a feature amount used to determine the arrangement of the search target information. apparatus.
二次元空間または三次元空間に探索対象から得られる特徴量に応じて配置される該探索対象の情報を表示するための情報探索空間に探索対象情報を配置する際に、前記探索対象情報から得られる特徴量を用いて、当該特徴量のラベルの周辺に当該特徴量を持つ探索対象情報が配置されるように、前記情報探索空間における前記探索対象情報の配置を決定し、前記情報探索空間を二次元の像として出力装置に出力する情報探索装置において、前記配置の決定に用いる特徴量を選択する特徴量選択装置の動作を制御するプログラムを記憶した、コンピュータで読み取り可能な記憶媒体であって、
前記プログラムは、
探索対象情報と、当該探索対象情報から得られる複数の特徴量との組を、予め複数格納する特徴量格納手段から、前記探索対象情報の配置の決定に用いる特徴量を選択する選択ステップを前記特徴量選択装置に実行させる命令を含み、
前記選択ステップが、前記特徴量格納手段に格納されている前記探索対象情報と前記特徴量から、一つの特徴量を持つ探索対象情報の数が全探索対象情報数の1/2に近いものから順に、前記探索対象情報の配置に用いる特徴量を選択する選択制御ステップを含むことを特徴とする、コンピュータで読み取り可能な記憶媒体。
When arranging the search target information in the information search space for displaying the information of the search target arranged according to the feature amount obtained from the search target in the two-dimensional space or the three-dimensional space, the search target information is obtained from the search target information. using a feature amount is, as search target information having the feature quantity on the periphery of the feature quantity of the label is arranged to determine the placement of the search target information in the information search space, the information search space A computer-readable storage medium storing a program for controlling an operation of a feature amount selecting device for selecting a feature amount used for determining an arrangement in an information search device that outputs the two-dimensional image to an output device. ,
The program is
The selecting step of selecting a feature amount used for determining the arrangement of the search target information from a feature amount storing unit that stores a plurality of sets of the search target information and a plurality of feature amounts obtained from the search target information in advance. Including an instruction to be executed by the feature amount selecting device,
The selecting step may include, from the search target information and the characteristic amounts stored in the characteristic amount storage unit, the number of search target information having one characteristic amount is determined to be closer to 1 / of the total search target information number. A computer-readable storage medium characterized by including a selection control step of sequentially selecting a feature amount used for arranging the search target information .
JP29222197A 1997-10-24 1997-10-24 Feature selection device Expired - Fee Related JP3597026B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP29222197A JP3597026B2 (en) 1997-10-24 1997-10-24 Feature selection device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP29222197A JP3597026B2 (en) 1997-10-24 1997-10-24 Feature selection device

Publications (2)

Publication Number Publication Date
JPH11126212A JPH11126212A (en) 1999-05-11
JP3597026B2 true JP3597026B2 (en) 2004-12-02

Family

ID=17779082

Family Applications (1)

Application Number Title Priority Date Filing Date
JP29222197A Expired - Fee Related JP3597026B2 (en) 1997-10-24 1997-10-24 Feature selection device

Country Status (1)

Country Link
JP (1) JP3597026B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4254892B1 (en) 2007-11-01 2009-04-15 オムロン株式会社 Feature quantity candidate creation device and feature quantity candidate creation method

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06282587A (en) * 1993-03-24 1994-10-07 Tokyo Electric Power Co Inc:The Automatic classifying method and device for document and dictionary preparing method and device for classification
JPH07160844A (en) * 1993-12-02 1995-06-23 Hitachi Ltd Filing device
JPH09231238A (en) * 1996-02-20 1997-09-05 Omron Corp Display method for text retrieval result and device therefor
JP3614235B2 (en) * 1996-03-19 2005-01-26 富士通株式会社 Information search device
JP3634574B2 (en) * 1997-07-11 2005-03-30 キヤノン株式会社 Information processing method and apparatus

Also Published As

Publication number Publication date
JPH11126212A (en) 1999-05-11

Similar Documents

Publication Publication Date Title
US11663230B2 (en) Interface including graphic representation of relationships between search results
JP4363792B2 (en) Information retrieval system and method
JP4972358B2 (en) Document search apparatus, document search method, document search program, and recording medium.
US8938153B2 (en) Representative image or representative image group display system, representative image or representative image group display method, and program therefor
JP5665125B2 (en) Image processing method and image processing system
US20030236778A1 (en) Drawing search support apparatus and drawing search method
JP2004240750A (en) Picture retrieval device
KR100706389B1 (en) Image search method and apparatus considering a similarity among the images
JPH0778182A (en) Keyword allocating system
JP2008192055A (en) Content search method and content search apparatus
JP2006146628A5 (en)
JP2006146628A (en) Method and apparatus for retrieving document by content image
JP2009140361A (en) Data-managing device and data-processing method
CN109933702B (en) Retrieval display method, device, equipment and storage medium
JP2011203776A (en) Similar image retrieval device, method, and program
US6424963B1 (en) Document retrieval having retrieval conditions that shuffles documents in a sequence of occurrence
JP3597026B2 (en) Feature selection device
JPH08287086A (en) Method and device for emphasizing and displaying image in order of adaptability
JP2004240751A (en) Picture retrieval device
KR102215580B1 (en) Electronic device for selecting important keywords for documents based on style attributes and operating method thereof
JPH05282375A (en) Method and system for retrieving image
JP3035980B2 (en) Electronic firing device
JP2005115457A (en) Method of retrieving document file
JP2003345824A (en) Device, method, and program for document retrieval
JP2021005179A (en) Search device, search system, and search program

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040210

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20040217

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040412

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20040412

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040830

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040907

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080917

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080917

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090917

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090917

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100917

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100917

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110917

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120917

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120917

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130917

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees