JP2003281185A - 情報検索方法および情報検索装置 - Google Patents

情報検索方法および情報検索装置

Info

Publication number
JP2003281185A
JP2003281185A JP2002084743A JP2002084743A JP2003281185A JP 2003281185 A JP2003281185 A JP 2003281185A JP 2002084743 A JP2002084743 A JP 2002084743A JP 2002084743 A JP2002084743 A JP 2002084743A JP 2003281185 A JP2003281185 A JP 2003281185A
Authority
JP
Japan
Prior art keywords
document
similarity
documents
attribute value
specified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002084743A
Other languages
English (en)
Inventor
Mare Uchinomiya
希 内之宮
Hisao Mase
久雄 間瀬
Chiaki Hirai
千秋 平井
Yutaka Kudo
裕 工藤
Yoshiyuki Nagai
愛之 永井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Engineering Co Ltd
Hitachi Ltd
Original Assignee
Hitachi Engineering Co Ltd
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Engineering Co Ltd, Hitachi Ltd filed Critical Hitachi Engineering Co Ltd
Priority to JP2002084743A priority Critical patent/JP2003281185A/ja
Publication of JP2003281185A publication Critical patent/JP2003281185A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】ドキュメントの有用度を、該ドキュメントが属
する集合の該ドキュメント以外のドキュメントを用いて
算出する。 【解決手段】属性を持つドキュメントからなるドキュメ
ント集合において、ある属性値を指定すると、該集合の
他の既存ドキュメントと属性値が同じ他集合のドキュメ
ントとの類似度を求め、その類似度から集合の類似度を
求め、類似度の高い集合の中から、前記で指定された属
性をもつドキュメントを検索する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は一つ以上の属性を持
つドキュメントからなるドキュメント集合を複数格納す
るドキュメントデータベースにおけるドキュメント検索
方法および装置に関し、特に、同じ属性をもつドキュメ
ントの類似度を利用して集合間の類似度を算出し、検索
ドキュメントの選定を行うドキュメント検索方法および
装置に関するものである。
【0002】
【従来の技術】本発明に関する技術情報には以下のもの
がある。 (1)ユーザにとって有益なドキュメントを検索する方
法としては、そのドキュメントに関連する文字列を検索
条件として、文字列比較や類似度計算によって検索を行
って、結果をユーザに提供する方法が一般的である。こ
の方法は、現在広く用いられており、例えば、特開平1
0−63680に示された情報検索システム、特開平1
0−222521の情報共有システムなどがある。
【0003】(2)また、ユーザの過去の閲覧履歴を用
いてユーザに有益であると判断される情報を提示する方
法として、特開2001−175676にはユーザの過
去の閲覧履歴を基に文書を取得し、取得された文書に対
し索引生成処理を行い、その索引と検索サーバによって
すでに収集されている多数の情報に対して生成された索
引との類似度を計算し、計算された類似度のうち類似度
の高い幾つかの文書を検索結果として出力する方法が、
特開2001−273329にはコンテンツの特徴とユ
ーザの利用頻度を用いてユーザの嗜好に応じた情報を選
択し提供する方法が開示されている。
【0004】
【発明が解決しようとする課題】従来技術(1)では、
ユーザにとって有益なドキュメントを検索するために、
関連する文字列や、所望するドキュメントに類似した種
文書を検索キーとしてユーザが入力する必要がある。前
記方法では、所望するドキュメントを検索する為の適切
な文字列や種文書をユーザが考える必要があり、有益な
ドキュメントを検索できるか否かが、ユーザの検索技術
に依存してしまうという問題がある。
【0005】また、従来技術(2)では、ユーザ個人の
嗜好に即した情報が提供されることになる。しかし、例
えば、ソフトウェア開発作業など複数のメンバによる共
同作業においては、個人の閲覧履歴ではなく、該作業自
体の特性や、該作業内で作成されるドキュメントの特性
によって、ユーザに有益であるかどうかを判断する方が
より適切である。従来技術では、このような方法で、ユ
ーザに有益であると判断される情報を検索することは出
来ない。
【0006】
【課題を解決するための手段】本発明では、入力手段を
介してドキュメント集合およびドキュメントの属性値を
指定すると、ドキュメント集合とドキュメントとドキュ
メントの属性値の対応を格納したテーブルを参照して、
前記指定されたドキュメント集合に既に存在するドキュ
メントのうち、前記指定された属性値を持つドキュメン
ト以外のドキュメントを認定し、前記認定されたドキュ
メントの各々について、ドキュメントの持つ属性値を持
つ他ドキュメント集合内のドキュメントを認定してドキ
ュメントの類似度を算出し、前記算出されたドキュメン
トの類似度を用いて、当該他ドキュメント集合の類似度
を算出し、前記算出された類似度をソートして類似度の
高いドキュメント集合を認定し、前記認定されたドキュ
メント集合を出力手段を介して出力することにより、上
記課題を解決する。
【0007】
【発明の実施の形態】本発明の実施例について、以下図
面を用いて詳細に説明する。なお、これにより本発明が
限定されるものではない。
【0008】本実施例では、ソフトウェア開発作業にお
いて、ユーザに有益であるドキュメントを検索するシス
テムについて述べる。あるソフトウェアを開発するプロ
ジェクトにおいては、その開発内容に拠らず、作業工程
および作業工程を構成する作業項目毎に作成すべきドキ
ュメントが固定されているのが一般的である。従って、
ある作業項目において作業を遂行する際に有用となる情
報が、開発を行ったあるいは行っている他のプロジェク
トの同一の作業項目において作成されたドキュメントの
中に存在することが多い。
【0009】そこで、本実施例ではプロジェクトとプロ
ジェクトの中でのドキュメントの属性に着目し、以下で
詳細に述べる方法によって、ユーザに有用なドキュメン
トを検索する。本実施例において「属性」とはプロジェ
クトにおけるドキュメントの位置付けを表すものであ
り、ある特定の作業項目において作成されたドキュメン
トを認定するためのデータである。本実施例では一つの
作業項目において一つのドキュメントが作成されると仮
定し、前記「属性」としてドキュメント種別を用いる。
【0010】図1は、本実施例の概要を示す図である。
ユーザが検索条件として、プロジェクト名αとドキュメ
ント種別Dを入力すると(図1(0))、システムは、
まず入力されたプロジェクト名αの既存ドキュメントを
確認する(図1(1))。次に、該既存ドキュメント
と、他プロジェクトで作成されたドキュメントのうち該
既存ドキュメントと同じドキュメント種別をもつドキュ
メントとの類似度を求める(図1(2))。次に、求め
た類似度を用いて、プロジェクト間の類似度を求める
(図1(3))。そして、類似度の高いプロジェクトの
ドキュメントの中から、ドキュメント種別Dをもつドキ
ュメントを提示することによって、ユーザに有益である
と判断されるドキュメントを提供する(図1(4))。
【0011】図2は、本実施例で述べるドキュメント検
索装置のブロック構成を示す図である。プロジェクト管
理テーブル201はプロジェクト内で作成されたドキュ
メントを管理するテーブルを格納している。ドキュメン
トDB202はドキュメントとドキュメントIDを格納
している。
【0012】ユーザは検索条件入力部210を介して、
検索条件(プロジェクト名とドキュメント種別)の入力
を行う。既存ドキュメント認定部211は、検索条件と
して入力されたプロジェクトのなかで既に作成されてい
るドキュメントを認定し、そのドキュメントIDと属性ID
を取得する。ドキュメント類似度算出部212は、既存
ドキュメント認定部211で認定されたドキュメント
と、前記ドキュメントと同じ属性IDをもつ他プロジェク
トのドキュメントの類似度を算出し、プロジェクトIDお
よび、属性IDと類似度の組からなるデータセットを出力
する。
【0013】プロジェクト類似度算出部213は、プロ
ジェクトIDおよび、属性IDと類似度の組からなるデータ
セットを取得し、前記類似度を用いてプロジェクト類似
度を算出し、プロジェクトIDとプロジェクトの類似度の
組を出力する。
【0014】検索結果表示部214は、プロジェクトの
類似度の高い順に、プロジェクト内で作成されたドキュ
メントのなかで、属性IDが入力された属性IDと同じドキ
ュメントを、検索結果として提示する。
【0015】図3は本実施例におけるプロジェクト管理
テーブル201の構成の一例を示す図である。プロジェ
クト情報310は、プロジェクトID320とドキュメント情報
321から構成され、ドキュメント情報321は、属性ID330
とドキュメント種別331とドキュメントID332から構成さ
れる。
【0016】以下では、図2に示すブロック図を構成す
る個々の処理部の処理内容および処理アルゴリズムにつ
いて詳しく述べる。
【0017】図4は既存ドキュメント確認部211の処
理アルゴリズムを示す図である。プロジェクトID(=P)
と属性ID(=Q)を取得する(ステップ401)。プロジ
ェクト情報N(初期値N=1)310が存在する場合(ス
テップ402)、プロジェクト管理テーブル201のプ
ロジェクト情報Nを取得する(ステップ403)。プロ
ジェクト情報NのプロジェクトID320がPと一致した
場合(ステップ404)、プロジェクト情報Nのドキュ
メント情報321にすでに登録されているもドキュメン
トの属性ID330とドキュメントID332とP,Qをセ
ットで出力する(ステップ406)。プロジェクト情報
NのプロジェクトIDがPと一致しない場合(ステップ4
04)、N=N+1とし(ステップ405)、ステップ4
02に返る。プロジェクト情報N(初期値N=1)310
が存在しない場合(ステップ402)、処理を終了す
る。
【0018】図5はドキュメント類似度算出部212の
処理アルゴリズムを示す図である。既存ドキュメント確
認部211で出力された(1)プロジェクトID(=
P)、(2)属性ID(=Q)、(3)属性IDとドキュメ
ントIDのセット(=R)を取得する(ステップ501)。
プロジェクト情報M(初期値M=1)が存在し(ステップ
502)、プロジェクト情報MのプロジェクトID(ID=
m)がPと一致しない場合(ステップ503)、プロジ
ェクト情報Mのドキュメント情報321から、Rの0以上
の属性IDと同じ属性IDをもつものに関して、属性IDとド
キュメントIDをセットで取得する(ステップ504)。
次に、ドキュメントDBからドキュメントを取得し、同じ
属性IDをもつドキュメント間の類似度を算出する(ステ
ップ505)。例えば、特開2001-265788、特開2001-24
3245に記載されている方法などでよい。(1)m、
(2)属性IDとドキュメント間の類似度の組、をセッ
トで格納する(ステップ506)。M=M+1(ステッ
プ507)とし、ステップ502に戻る。ステップ50
3において、プロジェクト情報MのプロジェクトID
(ID=m)がPと一致したならば、M=M+1(ステ
ップ507)とし、ステップ502に戻る。プロジェク
トMが存在しない場合(ステップ502)、(1)P、
(2)Q、(3)mおよび、属性IDとドキュメント間
の類似度の組のデータセット、を出力し(ステップ50
9)、処理を終了する。
【0019】図6はプロジェクト類似度算出部213の
処理アルゴリズムを示す図である。ドキュメント類似度
算出部212から出力された(1)プロジェクトID(=
P)、(2)属性ID(=Q)、(3)mおよび、属性I
Dとドキュメント間の類似度の組のデータセット、を取
得する(ステップ604)。データセットが存在する場
合(ステップ602)、データセットからmおよび、属性
IDとドキュメント間の類似度の組を一つ取り出す(ス
テップ603)。次に、プロジェクト類似度=取り出し
たドキュメント間の類似度の総和、を算出する(ステッ
プ604)。ここでは取り出したドキュメント間の類似
度の総和をプロジェクト類似度としたが、プロジェクト
類似度としては、算出したドキュメント間の類似度の最
大値、ドキュメント間の類似度の平均値、などを採用す
ることもできる。次にmとプロジェクト類似度をセット
で格納する(ステップ605)。次のデータセットに移
る(ステップ606)。データセットが存在しない場合
(ステップ602)、(1)P、(2)Q、(3)mと
プロジェクト類似度、を出力し(ステップ607)、処
理を終了する。
【0020】図7は検索結果表示部214の処理アルゴ
リズムを示す図である。まず、プロジェクト類似度算出
部213から出力された(1)プロジェクトID(=
P)、(2)属性ID(=Q)、(3)mとプロジェクト
類似度を取得する(ステップ701)。次に、プロジェ
クト管理テーブル201のプロジェクトID=mをもつ
プロジェクトのドキュメント情報321から、属性ID
=QをもつドキュメントID(=変数W)を取得する
(ステップ702)。次に、m、プロジェクト類似度、
Wをセットで格納する(ステップ703)。次に、プロ
ジェクト類似度の高い順にソートする(ステップ70
4)。最後に、ソートされた順番でドキュメントID=
Wのドキュメントを提示し(ステップ705)、処理を
終了する。本実施例では、プロジェクトの高い順にソー
トして、ソートされた順でドキュメントID=Wのドキュ
メントを提示したが、提示するものはプロジェクト名で
も構わない。
【0021】次に本実施例の拡張例を示す。
【0022】(1)プロジェクト類似度を算出する際
に、どの属性IDをもつドキュメントの類似度を用いて
プロジェクト類似度を算出するかを指定することができ
る。
【0023】図8は、拡張例(1)(2)(3)(4)
で述べるドキュメント検索装置のブロック構成を示す図
である。図中の201、202、210から214まで
は図2に示したものと同じものであり、プロジェクト管
理テーブル201の構成の一例は図3に示す。また、既
存ドキュメント確認部211の処理アルゴリズムは図4
に、ドキュメント類似度算出部212の処理アルゴリズ
ムは図5に、プロジェクト類似度算出部213の処理ア
ルゴリズムは図6に、検索結果表示部214の処理アル
ゴリズムは図7に示す。
【0024】拡張例(1)において、ドキュメント類似
度算出ルール801はなくてよい。また、プロジェクト
類似度算出ルール802は属性ID901と利用度90
2を格納している。
【0025】図9は、拡張例(1)におけるプロジェク
ト類似度算出ルール802の構成の一例を示す図であ
る。プロジェクト類似度算出ルールは、属性IDとその
属性IDをもつドキュメントをプロジェクト類似度を算
出する際に用いるか用いないかを示す利用度902から
構成される。
【0026】図6に示すプロジェクト類似度算出部の処
理アルゴリズムにおいて、ステップ604をプロジェク
ト類似度を算出する際に、プロジェクト類似度算出ルー
ルに従い、利用度902が“1”の属性IDをもつドキ
ュメントの類似度の総和をプロジェクト類似度とするこ
とで、拡張例(1)は実現できる。
【0027】(2)プロジェクト類似度を算出する際に
用いるドキュメントの類似度に、ドキュメントの属性ご
とに重みを指定することができる。
【0028】拡張例(2)において、図8に示したドキ
ュメント類似度算出ルール801はなくてよい。また、
プロジェクト類似度算出ルール802は属性ID100
1、重み付けルール1002、さらに重み付けルールを
構成する属性ID1011、重み1012を格納してい
る。
【0029】図10は拡張例(2)におけるプロジェク
ト類似度算出ルール802の構成の一例を示す図であ
る。プロジェクト類似度算出ルールは、属性IDとその
属性IDをもつドキュメントを検索結果として求めるた
めにプロジェクト類似度を算出する際に、用いるドキュ
メント類似度の重み付けを指定してある重み付けルール
1002と、重み付けルールを構成する属性ID101
1と重み1012から構成される。
【0030】図6に示すプロジェクト類似度算出部の処
理アルゴリズムにおいて、ステップ604で、プロジェ
クト類似度を算出する際に、まず、属性IDがステップ
601で取得したQと一致する重み付けルール1002
を取得し、ドキュメント類似度に属性IDが一致する重
み1012をかけたものの総和をプロジェクト類似度と
することで、拡張例(2)は実現できる。 (3)ドキュメントの類似度を求める際に、ドキュメン
トの属性毎に類似度を算出する方法を指定できる。拡張
例(3)において、図8に示したドキュメント類似度算
出ルール801は属性ID901、ドキュメント種別9
02、類似度算出ルールを格納している。また、プロジ
ェクト類似度算出ルール802はなくてもよい。
【0031】図11は拡張例(3)におけるドキュメン
ト類似度算出ルール801の構成の一例を示す図であ
る。ドキュメント類似度算出ルールは、属性ID110
1、ドキュメント種別1102、類似度算出方法110
3から構成される。
【0032】図5に示すドキュメント類似度算出部の処
理アルゴリズムにおいて、ステップ505においてドキ
ュメント間の類似度を求める際に、類似度を求めたいド
キュメントの属性IDに対して定められている類似度算
出方法1103を用いて類似度を算出することにより、
拡張例(3)は実現できる。
【0033】(4)ドキュメントの類似度を求める際
に、ドキュメントに対して類似度を求める対象とする個
所を指定することができる。
【0034】拡張例(4)において、図8に示したドキ
ュメント類似度算出ルール801は属性ID1201、
ドキュメント種別1202、類似度算出ルール1203
を、さらに類似度算出ルールを構成する属性ID121
1、ドキュメント個所1212、類似度算出方法121
3を格納している。また、プロジェクト類似度算出ルー
ル802はなくてもよい。
【0035】図5に示すドキュメント類似度算出部の処
理アルゴリズムにおいて、ステップ505においてドキ
ュメント間の類似度を求める際に、類似度を求めたいド
キュメントの属性IDに対して定められているドキュメ
ント個所1212に対して、類似度算出方法1203を
用いて類似度を算出することにより、拡張例(4)は実
現できる。
【0036】(5)ドキュメント作成順序を定めること
ができる。
【0037】図3に示すプロジェクト管理テーブル20
1のドキュメント情報321にドキュメント作成順序を
示すカラムを一列用意し、類似度を求める際に、入力指
定されたプロジェクトIDをもつプロジェクトで既に作成
されたドキュメントであり、かつ入力指定された属性値
をもつドキュメントより前に作成されることに定められ
ているドキュメントを認定し、前記認定されたドキュメ
ントを用いて類似度を求めることにより、拡張例(5)
は実現できる。
【0038】
【発明の効果】本発明によれば、キーワードや種文書を
検索キーとしてユーザに入力させる必要なしに、またユ
ーザ本人の閲覧履歴に関係なく、ユーザに有益なドキュ
メントを検索することが可能になる。
【0039】さらに、検索されるドキュメントは該作業
内で作成されたドキュメントに依存するため、作業内で
作成されたドキュメントが増えるごとに検索されるドキ
ュメントの精度が高まる。
【図面の簡単な説明】
【図1】本実施例の概要を示す図。
【図2】本実施例における装置のブロック構成を示す
図。
【図3】本実施例におけるプロジェクト管理テーブル2
01の構成の一例を示す図。
【図4】本実施例における既存ドキュメント確認部21
1の処理アルゴリズムを示す図。
【図5】本実施例におけるドキュメント類似度算出部2
12の処理アルゴリズムを示す図。
【図6】本実施例におけるプロジェクト類似度算出部2
13の処理アルゴリズムを示す図。
【図7】本実施例における検索結果表示部214の処理
アルゴリズムを示す図。
【図8】本実施例の拡張例における装置のブロック構成
を示す図。
【図9】本実施例の拡張例(1)におけるプロジェクト
類似度算出ルール802の構成の一例を示す図。
【図10】本実施例の拡張例(2)におけるプロジェク
ト類似度算出ルール802の構成の一例を示す図。
【図11】本実施例の拡張例(3)におけるドキュメン
ト類似度算出ルール801の構成の一例を示す図。
【図12】本実施例の拡張例(4)におけるドキュメン
ト類似度算出ルール801の構成の一例を示す図。
【符号の説明】
201…プロジェクト管理テーブル,202…ドキュメ
ントDB,210…検索条件入力部,211…既存ドキ
ュメント確認部,212…ドキュメント類似度算出部,
213…プロジェクト類似度算出部,214…検索結果
表示部,801…ドキュメント類似度算出ルール,80
2…プロジェクト類似度算出ルール.
───────────────────────────────────────────────────── フロントページの続き (72)発明者 間瀬 久雄 神奈川県川崎市麻生区王禅寺1099番地 株 式会社日立製作所システム開発研究所内 (72)発明者 平井 千秋 神奈川県川崎市麻生区王禅寺1099番地 株 式会社日立製作所システム開発研究所内 (72)発明者 工藤 裕 神奈川県川崎市麻生区王禅寺1099番地 株 式会社日立製作所システム開発研究所内 (72)発明者 永井 愛之 茨城県日立市幸町3丁目2番1号 日立エ ンジニアリング株式会社内 Fターム(参考) 5B075 ND04 ND34 QM08 UU06

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】一つ以上の属性を持つドキュメントからな
    るドキュメント集合を複数格納するドキュメントデータ
    ベースを参照してドキュメントを検索するドキュメント
    検索装置におけるドキュメント検索方法であって、 入力手段を介してドキュメント集合およびドキュメント
    の属性値の指定を受け、ドキュメント集合とドキュメン
    トとドキュメント属性値の対応を格納したテーブルを参
    照して、前記指定されたドキュメント集合に既に存在す
    るドキュメントのうち、前記指定された属性値を持つド
    キュメント以外のドキュメントを認定し、前記認定され
    たドキュメントの各々について、ドキュメントの持つ属
    性値と同じ属性値を持つ他ドキュメント集合内のドキュ
    メントを認定してドキュメントの類似度を算出し、前記
    算出されたドキュメントの類似度を用いて、当該他ドキ
    ュメント集合の類似度を算出し、前記算出された類似度
    をソートして類似度の高いドキュメント集合を認定し、
    前記認定されたドキュメント集合を出力手段を介して出
    力することを特徴とするドキュメント検索方法。
  2. 【請求項2】請求項1記載のドキュメント検索方法にお
    いて、前記認定された類似度の高いドキュメント集合か
    ら、前記指定された属性値をもつドキュメントを認定
    し、出力手段を介して出力することを特徴とするドキュ
    メント検索方法。
  3. 【請求項3】請求項1または2に記載のドキュメント検
    索方法において、ドキュメント集合の類似度を算出する
    際に、どの属性値を持つドキュメントの類似度をどの程
    度重要視するかを表す重み付けを指定することができる
    ドキュメント検索方法。
  4. 【請求項4】請求項1から3のいずれか1に記載のドキ
    ュメント検索方法において、ドキュメントの類似度を算
    出する方法をドキュメントの属性毎に指定することがで
    きることを特徴とするドキュメント検索方法。
  5. 【請求項5】請求項1から4のいずれか1記載のドキュ
    メント検索方法において、前記指定されたドキュメント
    集合に既に存在するドキュメントのうち、前記指定され
    た属性値を持つドキュメント以外のドキュメントを認定
    する際に、ドキュメントの作成順序を予め定義してお
    き、前記指定されたドキュメント集合内の、前記指定さ
    れた属性値を持つドキュメントよりも前に作成すること
    が定められているドキュメントのみを認定することを特
    徴とするドキュメント検索方法。
  6. 【請求項6】請求項1から5のいずれか1に記載のドキ
    ュメント検索方法において、前記指定されたドキュメン
    ト集合に既に存在するドキュメントのうち、前記指定さ
    れた属性値を持つドキュメント以外のドキュメントを認
    定する際に、前記指定された属性値を持つドキュメント
    が前記指定されたドキュメント集合内に存在する場合
    に、前記指定された属性値を持つドキュメントを含める
    ことを特徴とするドキュメント検索方法。
  7. 【請求項7】一つ以上の属性を持つドキュメントからな
    るドキュメント集合を複数格納するドキュメントデータ
    ベースを参照してドキュメントを検索するドキュメント
    検索装置において、入力手段を介してドキュメント集合
    およびドキュメントの属性値を指定する手段と、ドキュ
    メント集合とドキュメントとドキュメントの属性値の対
    応を格納したテーブルを参照して、前記指定されたドキ
    ュメント集合に既に存在するドキュメントのうち、前記
    指定された属性値を持つドキュメント以外のドキュメン
    トを認定する手段と、前記認定されたドキュメントの各
    々について、ドキュメントの持つ属性値と同じ属性値を
    持つ他ドキュメント集合内のドキュメントを認定してド
    キュメントの類似度を算出する手段と、前記算出された
    ドキュメントの類似度を用いて、当該他ドキュメント集
    合の類似度を算出する手段と、前記算出された類似度を
    ソートして類似度の高いドキュメント集合を認定する手
    段と、前記認定されたドキュメント集合を出力する出力
    手段とを有することを特徴とするドキュメント検索装
    置。
  8. 【請求項8】請求項7記載のドキュメント検索装置にお
    いて、前記認定された類似度の高いドキュメント集合か
    ら、前記指定された属性値をもつドキュメントを認定す
    る手段と、出力手段を介して出力する手段を有すること
    を特徴とするドキュメント検索装置。
  9. 【請求項9】請求項7または8に記載のドキュメント検
    索装置において、ドキュメント集合の類似度を算出する
    手段において、どの属性値を持つドキュメントの類似度
    をどの程度重要視するかを表す重み付けを指定する手段
    を有することを特徴とするドキュメント検索装置。
  10. 【請求項10】請求項7から9のいずれか1に記載のド
    キュメント検索装置において、ドキュメントの類似度を
    算出する方法をドキュメントの属性毎に指定する手段を
    有することを特徴とするドキュメント検索装置。
  11. 【請求項11】請求項7から10のいずれか1に記載の
    ドキュメント検索装置において、前記指定されたドキュ
    メント集合に既に存在するドキュメントのうち、前記指
    定された属性値を持つドキュメント以外のドキュメント
    を認定する手段において、ドキュメントの作成順序を予
    め定義しておき、前記指定されたドキュメント集合内
    の、前記指定された属性値を持つドキュメントよりも前
    に作成することが定められているドキュメントのみを認
    定することを特徴とするドキュメント検索装置。
  12. 【請求項12】請求項7から11のいずれか1に記載の
    ドキュメント検索装置において、前記指定されたドキュ
    メント集合に既に存在するドキュメントのうち、前記指
    定された属性値を持つドキュメント以外のドキュメント
    を認定する手段において、前記指定された属性値を持つ
    ドキュメントが前記指定されたドキュメント集合内に存
    在する場合に、前記指定された属性値を持つドキュメン
    トを含めることを特徴とするドキュメント検索装置。
JP2002084743A 2002-03-26 2002-03-26 情報検索方法および情報検索装置 Pending JP2003281185A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002084743A JP2003281185A (ja) 2002-03-26 2002-03-26 情報検索方法および情報検索装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002084743A JP2003281185A (ja) 2002-03-26 2002-03-26 情報検索方法および情報検索装置

Publications (1)

Publication Number Publication Date
JP2003281185A true JP2003281185A (ja) 2003-10-03

Family

ID=29231953

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002084743A Pending JP2003281185A (ja) 2002-03-26 2002-03-26 情報検索方法および情報検索装置

Country Status (1)

Country Link
JP (1) JP2003281185A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009069474A1 (ja) * 2007-11-26 2009-06-04 Nec Corporation 類似サービス検索システム、方法、及び、プログラム
JP2010079672A (ja) * 2008-09-26 2010-04-08 Ricoh Co Ltd タスク検索装置、タスク検索方法、タスク検索プログラムおよび記憶媒体
JP7396061B2 (ja) 2020-01-15 2023-12-12 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009069474A1 (ja) * 2007-11-26 2009-06-04 Nec Corporation 類似サービス検索システム、方法、及び、プログラム
JP2010079672A (ja) * 2008-09-26 2010-04-08 Ricoh Co Ltd タスク検索装置、タスク検索方法、タスク検索プログラムおよび記憶媒体
JP7396061B2 (ja) 2020-01-15 2023-12-12 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム

Similar Documents

Publication Publication Date Title
CN108304444B (zh) 信息查询方法及装置
US7401078B2 (en) Information processing apparatus, document search method, program, and storage medium
US8745039B2 (en) Method and system for user guided search navigation
Knees et al. Combining audio-based similarity with web-based data to accelerate automatic music playlist generation
Fu et al. Privacy-preserving smart similarity search based on simhash over encrypted data in cloud computing
US20090299978A1 (en) Systems and methods for keyword and dynamic url search engine optimization
US20080222138A1 (en) Method and Apparatus for Constructing a Link Structure Between Documents
US20060248067A1 (en) Method and system for providing a shared search index in a peer to peer network
JP2001075969A (ja) 画像管理検索装置、画像管理検索方法及び記憶媒体
JP2012123654A (ja) 情報検索装置、情報検索方法及び情報検索プログラム
KR100695149B1 (ko) 지식기반 음악검색 방법 및 장치와 그 장치의 음악파일관리 방법 및 장치
JP2003173280A (ja) データベース生成装置、データベース生成方法及びデータベース生成プログラム
JP2005107688A (ja) 情報表示方法及びシステム及び情報表示プログラム
JPH11282875A (ja) 情報フィルタリング装置
JP2001188802A (ja) 情報検索装置及び情報検索方法
CN103186650A (zh) 一种搜索方法和装置
JP3692416B2 (ja) 情報フィルタリング方法および装置
JP2003281185A (ja) 情報検索方法および情報検索装置
JP2004287835A (ja) オブジェクト表作成方法及びオブジェクト推薦方法及びオブジェクト表作成プログラム及びオブジェクト推薦方法
CN106294784B (zh) 资源搜索方法及装置
JP2000293531A (ja) 情報検索方法及び装置
JP2008269106A (ja) スキーマ抽出方法、情報処理装置、コンピュータプログラム及び記録媒体
JP3526198B2 (ja) データベース類似検索方法及び装置及び類似検索プログラムを格納した記憶媒体
JPH08320879A (ja) 適合フィードバック装置
EP2083364A1 (en) Method for retrieving a document, a computer-readable medium, a computer program product, and a system that facilitates retrieving a document