JP2008071296A - データ管理装置、データ管理方法およびデータ管理プログラム - Google Patents

データ管理装置、データ管理方法およびデータ管理プログラム Download PDF

Info

Publication number
JP2008071296A
JP2008071296A JP2006251718A JP2006251718A JP2008071296A JP 2008071296 A JP2008071296 A JP 2008071296A JP 2006251718 A JP2006251718 A JP 2006251718A JP 2006251718 A JP2006251718 A JP 2006251718A JP 2008071296 A JP2008071296 A JP 2008071296A
Authority
JP
Japan
Prior art keywords
data
search
similarity
new data
registration
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006251718A
Other languages
English (en)
Inventor
Atsuyuki Goto
淳之 後藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2006251718A priority Critical patent/JP2008071296A/ja
Publication of JP2008071296A publication Critical patent/JP2008071296A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】煩雑な作業を要することなく、適切な検索結果を提示することのできるデータ管理装置を提供する。
【解決手段】複数の登録データを保持するDB120と、新規データを取得する新規データ取得部100と、新規データ取得部100が取得した新規データと、DB120に保持されている登録データの類似度を算出する類似度算出手段112と、類似度算出手段112により算出された類似度が予め定められた閾値よりも大きい場合には新規データを登録データとして登録し、類似度が予め定められた閾値以下である場合には新規データを登録データに対応付けて類似データとして登録する登録手段112とを備えた。
【選択図】 図1

Description

本発明は、検索対象となるデータを管理するデータ管理装置、データ管理方法およびデータ管理プログラムに関するものである。
従来、検索条件に合うデータを検索し、あらかじめ決められた計算式に従いスコア計算し、結果をスコア順にソートし、検索結果一覧を作成する検索装置が知られている(例えば、「特許文献1」参照)。
しかし、例えば企業のお客さま相談室などで発生する顧客の問い合わせデータには、似たような内容のデータが多数発生する。似たような事例は、自由表記のアンケートにより得られるデータにも見られる。表記の揺れが多く、また表現の自由度が大きい自然言語データをデータベースに登録する際に発生する問題である。
このようなデータをデータベースに登録し、従来の方法で検索すると類似データが検索結果一覧の上位を占め、本当に必要なデータが見つかりにくくなる。
たとえば、複写機メーカのお客様相談室のFAQデータベースにおいて、“トナー注文”に関する問い合わせ事例の検索結果として以下の14件が得られたとする。
1.トナーを注文したい。
2.トナーの注文をしたい。
3.廃トナーを注文したい。
4.廃トナーを交換してくださいのMSGがでました。廃トナーの注文をお願いします。
5.トナーの注文お願いします。
6.トナーを注文したい。
7.トナーの注文をお願いしたい。
8.トナーの注文がしたい。
9.トナーを注文したい。どのタイプを注文したらよいか。
10.廃トナーボトルの注文をしたい。
11.トナーの注文をしたいんですが。
12.トナーがなくなったので注文したい。
13.廃トナーボトルを注文したい。
14.トナーが切れたため注文したい。
この場合には、これらを検索結果一覧として提示するよりも、以下のように類似する検索結果をまとめたものを提示した方が、検索者は、所望の情報を特定し易くなる。
1.トナー注文 9件
2.廃トナー注文 4件
3.トナー注文。どのタイプを注文したらよいか。 1件
特開2003−256474号公報
しかしながら、上述のように検索結果をまとめた情報を提示するためには、人手による仕分け作業が必要となる。さらに、検索結果を常に最新の状態にするためには定期的に人間の介在が必要になり、作業が煩雑になるという問題があった。
本発明は、上記に鑑みてなされたものであって、煩雑な作業を要することなく、適切な検索結果を提示することのできるデータ管理装置、データ管理方法およびデータ管理プログラムを提供することを目的とする。
上述した課題を解決し、目的を達成するために、請求項1にかかる発明は、データ管理装置であって、複数の登録データを保持するデータ保持手段と、新規データを取得する新規データ取得手段と、前記新規データ取得手段が取得した前記新規データと、前記データ保持手段に保持されている前記登録データの類似度を算出する類似度算出手段と、前記類似度算出手段により算出された前記類似度が予め定められた閾値よりも大きい場合には前記新規データを前記登録データとして登録し、前記類似度が予め定められた閾値以下である場合には前記新規データを前記登録データに対応付けて類似データとして登録する登録手段とを備えたことを特徴とする。
また、請求項2にかかる発明は、請求項1に記載のデータ管理装置であって、検索語を取得する検索語取得手段と、前記データ保持手段において、前記検索語取得手段が取得した前記検索語に合致する前記登録データを検索する検索手段とをさらに備えたことを特徴とする。
また、請求項3にかかる発明は、請求項2に記載のデータ管理装置であって、前記検索手段により得られた前記登録データに対応付けられている前記類似データを検索結果として得る類似検索手段をさらに備えたことを特徴とする。
また、請求項4にかかる発明は、請求項3に記載のデータ管理装置であって、前記検索手段は、前記類似検索手段により得られた複数の前記類似データを検索条件として関連データ検索を行うことを特徴とする。
また、請求項5にかかる発明は、データ管理方法であって、新規データを取得する新規データ取得ステップと、前記新規データ取得ステップにおいて取得した前記新規データと、複数の登録データを保持するデータ保持手段に保持されている前記登録データの類似度を算出する類似度算出ステップと、前記類似度算出ステップにおいて算出された前記類似度が予め定められた閾値よりも大きい場合には前記新規データを前記登録データとして登録し、前記類似度が予め定められた閾値以下である場合には前記新規データを前記登録データに対応付けて類似データとして登録する登録ステップとを有することを特徴とする。
また、請求項6にかかる発明は、データ管理プログラムであって、請求項5に記載のデータ管理方法をコンピュータに実行させることを特徴とする。
請求項1にかかる発明によれば、データ保持手段が、複数の登録データを保持し、新規データ取得手段が、新規データを取得し、類似度算出手段が、新規データ取得手段が取得した新規データと、データ保持手段に保持されている登録データの類似度を算出し、登録手段が、類似度算出手段により算出された類似度が予め定められた閾値よりも大きい場合には新規データを登録データとして登録し、類似度が予め定められた閾値以下である場合には新規データを登録データに対応付けて類似データとして登録するので、煩雑な作業を要することなく、適切な検索結果を提示することができるという効果を奏する。
また、請求項2にかかる発明によれば、検索語取得手段が、検索語を取得し、検索手段が、データ保持手段において、検索語取得手段が取得した検索語に合致する登録データを検索するので、煩雑な作業を要することなく、適切な検索結果を提示することができるという効果を奏する。
また、請求項3にかかる発明によれば、類似検索手段が、検索手段により得られた登録データに対応付けられている類似データを検索結果として得るので、関連データ検索を精度よく行うことができるという効果を奏する。
また、請求項4にかかる発明によれば、検索手段が、類似検索手段により得られた複数の類似データを検索条件として関連データ検索を行うので、関連データ検索を精度よく行うことができるという効果を奏する。
また、請求項5にかかる発明によれば、新規データ取得ステップにおいて、新規データを取得し、類似度算出ステップにおいて、新規データ取得ステップにおいて取得した新規データと、複数の登録データを保持するデータ保持手段に保持されている登録データの類似度を算出し、登録ステップにおいて、類似度算出ステップにおいて算出された類似度が予め定められた閾値よりも大きい場合には新規データを登録データとして登録し、類似度が予め定められた閾値以下である場合には新規データを登録データに対応付けて類似データとして登録するので、煩雑な作業を要することなく、適切な検索結果を提示することができるという効果を奏する。
また、請求項6にかかる発明によれば、新規データ取得ステップにおいて、新規データを取得し、類似度算出ステップにおいて、新規データ取得ステップにおいて取得した新規データと、複数の登録データを保持するデータ保持手段に保持されている登録データの類似度を算出し、登録ステップにおいて、類似度算出ステップにおいて算出された類似度が予め定められた閾値よりも大きい場合には新規データを登録データとして登録し、類似度が予め定められた閾値以下である場合には新規データを登録データに対応付けて類似データとして登録するので、煩雑な作業を要することなく、適切な検索結果を提示することができるという効果を奏する。
以下に添付図面を参照して、この発明にかかるデータ管理装置、データ管理方法およびデータ管理プログラムの最良な実施の形態を詳細に説明する。
図1は、実施の形態にかかるデータ管理装置10の構成を示すブロック図である。データ管理装置10は、新規データ取得部100と、特徴語抽出部102と、特徴語管理部104と、単語辞書110と、データ分類部112と、データベース(DB)120と、検索要求取得部130と、検索語拡張部132と、ランキング検索部134と、検索結果出力部136と、類似検索部140と、最適データ特定部142と、最適データ出力部144と、選択受付部150とを備えている。
新規データ取得部100は、新規データが発生するたびに新規データを取得する。ここで、新規データとは、新たにDB120に登録すべきデータである。特徴語抽出部102は、新規データから特徴語を抽出する。特徴語とは、新規データを特徴付ける文字列である。具体的には、新規データを形態素解析し、名詞や形容詞を特徴語として抽出する。
特徴語管理部104は、特徴語抽出部102により抽出された特徴語をハッシュテーブルにより管理する。具体的には、特徴語とその出現頻度とを対応付けて管理する。特徴語管理部104は、さらにハッシュテーブルにより管理している特徴語と、その出現頻度とを入力としてLSI(Latent Semantic Indexing)などの手法を用いてクラスタリングを行い、類似する特徴語を1つのグループにまとめる。これらを単語辞書110に格納する。
図2は、単語辞書110のデータ構成を模式的に示す図である。例えば、「あたり」は、「辺」または「辺り」と表記される場合がある。このように表記のゆれが想定される特徴語を類似する特徴語として1つのグループにまとめて登録する。「あたり」、「辺」、「辺り」をtabで区切るCSV形式で格納する。
再び説明を図1に戻す。データ分類部112は、特徴語抽出部102により得られた特徴語に基づいて、新規データをDB120に登録する。このとき、既に登録されている登録データとの類似度を算出し、類似度が予め定められた閾値よりも大きい場合には、登録データに対する類似データとしてDB120に登録する。なお、完全同一の場合には、新規データは登録せずに、特徴語の出現頻度のみを1加算する。
図3は、DB120のデータ構成を模式的に示す図である。このように、類似データのレコード番号は、類似する登録データのレコード番号に対応付けられている。ここで、レコード番号とは、DB120に格納されているデータを識別するための番号である。図3に示す例においては、登録データのレコード番号31988、31671の類似データのレコード番号が共に31670である。すなわち、レコード番号31988、31671のデータは、同じ類似グループに属するデータである。
再び説明を図1に戻す。検索要求取得部130は、検索要求を取得する。ここで、検索要求には、検索語が含まれている。検索語拡張部132は、検索要求に含まれる検索語を抽出する。さらに、単語辞書110を参照し、検索語に対する類似語を特定する。そして、検索語と類似語とをOR演算子により結合することにより、検索語を拡張する。
ランキング検索部134は、検索語拡張部132により拡張された検索語により、DB120に格納されているデータを検索する。検索結果出力部136は、ランキング検索部134による検索結果を出力する。具体的には、検索結果一覧をモニタに表示する。
類似検索部140は、DB120において、ランキング検索部134により検索結果として得られたデータに類似する類似データを検索する。最適データ特定部142は、類似検索部140により得られた検索結果の中から最適データを特定する。最適データ出力部144は、最適データ特定部142により特定された最適データを出力する。具体的には、最適データをモニタに表示する。
選択受付部150は、検索結果出力部136により一覧表示された検索結果のうち所望の検索結果の選択を受け付ける。選択受付部150が選択を受け付けると、類似検索部140は、選択された検索結果に類似するデータの検索を行う。
図4は、データ管理装置10による単語登録処理を示すフローチャートである。データ管理装置10は、ブートストラップ・フェーズにおいて新規データを取得すると、新規データから抽出した特徴語を単語辞書110に登録し、単語辞書を構築する。
まず、新規データ取得部100が新規データを取得すると(ステップS100)、特徴語抽出部102は、新規データから特徴語を抽出する(ステップS102)。そして、特徴語をハッシュテーブルに追加する。
ハッシュテーブルに登録された特徴語の数が予め定められた閾値以上である場合には(ステップS104,Yes)、特徴語管理部104は、クラスタリングによりグループ化を行い(ステップS106)、特徴語を単語辞書110に登録する(ステップS108)。なお、ハッシュテーブルに登録された特徴語の数が閾値未満である場合には(ステップS104,No)、ステップS100に戻る。以上で、単語登録処理が完了する。
図5は、データ管理装置10による新規データ登録処理を示すフローチャートである。データ管理装置10は、ブートストラップ・フェーズにおいては、上述の単語登録処理とともに、得られた新規データをDB120に登録する。さらに、ブートストラップ・フェーズ後に新規データを取得した場合には、登録データまたは類似データとしてDB120に登録する。ここで、登録データとは類似グループに含まれるデータのうち、類似グループを代表するデータである。また、類似データとは、類似グループに含まれる登録データ以外のデータである。図5には、ブートストラップ・フェーズ後の新規データ登録処理を示している。
まず、新規データ取得部100が新規データDを取得すると(ステップS120)、特徴語抽出部102は、特徴語を抽出する(ステップS122)。次に、データ分類部112は、単語辞書110から特徴語の類似語を抽出する。そして、特徴語と類似語とをOR演算子で結合したものを検索語としてDB120を検索し、検索結果Sを得る(ステップS124)。なお、検索結果Sには、n個のデータDi(i=1〜n)が含まれている。
次に、新規データDと検索により得られたデータDiとの類似度を算出する(ステップS126)。なお、類似度は、新規データDの特徴語ベクトルVdとデータDiの特徴語ベクトルVdiの内積として(式1)のように定義する。
sim(Vd,Vdi) …(式1)
なお、新規データDの特徴語ベクトルVdは、新規データDから抽出された特徴語wjと、特徴語の重みにより定義される。なお、特徴語の重みは、wjのデータ内出現頻度tf(term frequency)と、データ出現頻度df(data frequency)により(式2)により定まる。
(1+tf*log(N/df)) …(式2)
ここで、Nは、登録されている総データ数である。検索結果Sに属する各データについても同様に特徴語ベクトルVdiを算出する。
なお、特徴語ベクトルVd,Vdiを算出する際に、単語辞書110を利用して類似する単語の表記を1つにまとめ、特徴語ベクトルVd,Vdiの次元数を下げる。
検索結果Sに含まれるすべてのデータDiと新規データDとの類似度を算出し、類似度が最大となるデータDiを特定する(ステップS128)。次に、特定されたデータDiに対して得られた類似度と予め定められた閾値αとを比較する。類似度がα以下である場合には(ステップS130,No)、新規データDは、DB120に既に登録されているデータとは類似していないので、新規データDを登録データとしてDB120に登録する(ステップS132)。
一方、類似度がαよりも大きい場合には(ステップS130,Yes)、新規データDは、データDiと類似しているので、この場合には、新規データDをデータDiの類似データとしてDB120に登録する。具体的には、データDiの出現頻度を1加算する(ステップS140)。そして、新規データDを類似データとしてデータDiに対応付けてDB120に登録する(ステップS142)。
図6は、データ管理装置10による通常データ検索処理を示すフローチャートである。検索要求取得部130が検索要求を取得すると(ステップS200)、検索語拡張部132は、検索要求から検索語を抽出する(ステップS202)。次に、検索語拡張部132は、単語辞書110を参照し、検索語を拡張する(ステップS204)。次に、ランキング検索部134および類似検索部140により検索処理が行われる(ステップS206)。
図7は、図6を参照しつつ説明した検索処理(ステップS206)における詳細な処理を示すフローチャートである。拡張した検索語によりDB120の検索を行い、n個の検索結果、すなわち検索結果一覧を得る(ステップS210)。次に、iに1を設定する(ステップS212)。そして、類似検索部140は、n個の検索結果のうちの1つである検索結果Diに対する類似検索を行い、検索結果Diに対する類似データグループを特定する(ステップS214)。すなわち、類似データグループに含まれるm個のデータを検索結果として得る。ここで、jに1を、βmaxに0を設定する(ステップS216)。
次に、類似データのグループに含まれる各データDijと検索結果Diの類似度(sim(Vdi,Vdij))を算出する(ステップS218)。このうち、検索語に対する答えとして最もふさわしいデータを求める。具体的には、以下の処理を行う。すなわち、類似度(sim(Vdi,Vdij))をβijに設定する(ステップS220)。βijがβmaxよりも大きい場合には(ステップS222,>)、βmaxにβijを設定し、DimaxにDijを設定する(ステップS224)。βijとβmaxが等しい場合には(ステップS222,=)、対応するデータDijのデータ長の短い方に対応するβをβmaxとする(ステップS226)。βijがβmaxよりも小さい場合には(ステップS222,<)、ステップS230へ進む。
jがmよりも小さい場合には(ステップS230,No)、jを1加算し(ステップS232)、ステップS218に戻る。jがm以上である場合には(ステップS230,Yes)、ステップS234へ進む。次に、iがnよりも小さい場合には(ステップS234,No)、iを1加算し(ステップS236)、ステップS214に戻る。iがn以上である場合には(ステップS234,Yes)、D1max、D2max…を類似検索結果として出力する(ステップS238)。以上で、検索処理が完了する。
このように、本実施の形態にかかるデータ管理装置10は、類似性の最も高いデータを自動的に選択し出力することができる。これにより、人手を介さずに、関連データの検索を行うことができる。
図8は、関連データ検索処理を示すフローチャートである。検索要求取得部130が検索要求を取得すると(ステップS250)、検索語拡張部132は、検索語を抽出する(ステップS252)。そして、ランキング検索部134は、抽出された検索語に基づいてDB120のデータを検索する(ステップS254)。
次に、検索結果出力部136はランキング検索部134の検索により得られた検索結果一覧を表示する(ステップS256)。次に、ユーザにより検索結果一覧の中から所望のデータが選択されると、選択受付部150は、選択を受け付ける(ステップS258)。そして、類似検索部140は、ユーザにより選択されたデータに対する類似データを検索する(ステップS260)。これにより、類似データ一覧が得られる。次に、ランキング検索部134は、類似データ一覧に含まれる各データを入力としてDB120のデータを検索する(ステップS262)。
ここでは、ランキング検索部134は、複数の類似データを入力として、ランキング検索を行う。ランキング検索においては、例えば、類似データ一覧として以下に示す9のデータが得られたとする。
1.トナーを注文したい。
2.トナーの注文をしたい。
3.トナーの注文お願いします。
4.トナーの注文をしたいんですが。
5.トナーが切れたため注文したい。
6.トナーを注文したいが、どうすれば良いか?
7.トナーを注文したいが、値段は?
8.トナーがなくなったので注文したい。
9.トナー注文の方法を知りたい。
この場合には、これらをまとめて検索文とする。これにより、「トナー」、「注文」、「切れた」という特徴語に対する頻度がそれぞれ5、5、1となる。したがって、ユーザにより選択されたデータのみを検索文とした場合に比べて、より高い精度の検索が可能となる。
このように、関連データ検索においては、ユーザにより選択されたデータに対して類似データ検索を行うことにより、検索語の拡張を行う。
従来の関連データ検索法(relevance feedback retrieval)では、良い検索結果を得るために入力データとして複数の適合データが必要であり、検索者が手作業で検索結果を吟味し、指定する必要があった。これに対し、本実施の形態にかかる関連データ検索では、データ登録時に類似データは1つのグループにまとめられるので、類似データグループから類似性の高いデータを適当な数だけ自動選択し、適合データとすることで人手を介さずに関連データ検索を行うことができる。
図9は、実施の形態にかかるデータ管理装置10のハードウェア構成を示す図である。データ管理装置10は、ハードウェア構成として、データ管理装置10における新規データ登録処理、通常データ検索処理、関連データ検索処理など各種処理を実行するデータ管理プログラムなどが格納されているROM52と、ROM52内のプログラムに従ってデータ管理装置10の各部を制御するCPU51と、データ管理装置10の制御に必要な種々のデータを記憶するRAM53と、ネットワークに接続して通信を行う通信I/F57と、各部を接続するバス62とを備えている。
先に述べたデータ管理装置10におけるデータ管理プログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、フロッピー(登録商標)ディスク(FD)、DVD等のコンピュータで読み取り可能な記録媒体に記録されて提供されてもよい。
この場合には、データ管理プログラムは、データ管理装置10において上記記録媒体から読み出して実行することにより主記憶装置上にロードされ、上記ソフトウェア構成で説明した各部が主記憶装置上に生成されるようになっている。
また、本実施の形態のデータ管理プログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよい。
以上、本発明を実施の形態を用いて説明したが、上記実施の形態に多様な変更または改良を加えることができる。
データ管理装置10の構成を示すブロック図である。 単語辞書110のデータ構成を模式的に示す図である。 DB120のデータ構成を模式的に示す図である。 データ管理装置10による単語登録処理を示すフローチャートである。 データ管理装置10による新規データ登録処理を示すフローチャートである。 データ管理装置10による通常データ検索処理を示すフローチャートである。 図6を参照しつつ説明した検索処理(ステップS206)における詳細な処理を示すフローチャートである。 関連データ検索処理を示すフローチャートである。 データ管理装置10のハードウェア構成を示す図である。
符号の説明
10 データ管理装置
51 CPU
52 ROM
53 RAM
57 通信I/F
62 バス
100 新規データ取得部
102 特徴語抽出部
104 特徴語管理部
110 単語辞書
112 データ分類部
120 DB
130 検索要求取得部
132 検索語拡張部
134 ランキング検索部
136 検索結果出力部
140 類似検索部
142 最適データ特定部
144 最適データ出力部
150 選択受付部

Claims (6)

  1. 複数の登録データを保持するデータ保持手段と、
    新規データを取得する新規データ取得手段と、
    前記新規データ取得手段が取得した前記新規データと、前記データ保持手段に保持されている前記登録データの類似度を算出する類似度算出手段と、
    前記類似度算出手段により算出された前記類似度が予め定められた閾値よりも大きい場合には前記新規データを前記登録データとして登録し、前記類似度が予め定められた閾値以下である場合には前記新規データを前記登録データに対応付けて類似データとして登録する登録手段と
    を備えたことを特徴とするデータ管理装置。
  2. 検索語を取得する検索語取得手段と、
    前記データ保持手段において、前記検索語取得手段が取得した前記検索語に合致する前記登録データを検索する検索手段と
    をさらに備えたことを特徴とする請求項1に記載のデータ管理装置。
  3. 前記検索手段により得られた前記登録データに対応付けられている前記類似データを検索結果として得る類似検索手段をさらに備えたことを特徴とする請求項2に記載のデータ管理装置。
  4. 前記検索手段は、前記類似検索手段により得られた複数の前記類似データを検索条件として関連データ検索を行うことを特徴とする請求項3に記載のデータ管理装置。
  5. 新規データを取得する新規データ取得ステップと、
    前記新規データ取得ステップにおいて取得した前記新規データと、複数の登録データを保持するデータ保持手段に保持されている前記登録データの類似度を算出する類似度算出ステップと、
    前記類似度算出ステップにおいて算出された前記類似度が予め定められた閾値よりも大きい場合には前記新規データを前記登録データとして登録し、前記類似度が予め定められた閾値以下である場合には前記新規データを前記登録データに対応付けて類似データとして登録する登録ステップと
    を有することを特徴とするデータ管理方法。
  6. 請求項5に記載のデータ管理方法をコンピュータに実行させることを特徴とするデータ管理プログラム。
JP2006251718A 2006-09-15 2006-09-15 データ管理装置、データ管理方法およびデータ管理プログラム Pending JP2008071296A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006251718A JP2008071296A (ja) 2006-09-15 2006-09-15 データ管理装置、データ管理方法およびデータ管理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006251718A JP2008071296A (ja) 2006-09-15 2006-09-15 データ管理装置、データ管理方法およびデータ管理プログラム

Publications (1)

Publication Number Publication Date
JP2008071296A true JP2008071296A (ja) 2008-03-27

Family

ID=39292798

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006251718A Pending JP2008071296A (ja) 2006-09-15 2006-09-15 データ管理装置、データ管理方法およびデータ管理プログラム

Country Status (1)

Country Link
JP (1) JP2008071296A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011517822A (ja) * 2008-04-14 2011-06-16 アルカテル−ルーセント 重複を最低限に抑えるWebフィードを集約するための方法
JP2021064132A (ja) * 2019-10-11 2021-04-22 株式会社エクサウィザーズ 質問文出力方法、コンピュータプログラム及び情報処理装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011517822A (ja) * 2008-04-14 2011-06-16 アルカテル−ルーセント 重複を最低限に抑えるWebフィードを集約するための方法
JP2021064132A (ja) * 2019-10-11 2021-04-22 株式会社エクサウィザーズ 質問文出力方法、コンピュータプログラム及び情報処理装置

Similar Documents

Publication Publication Date Title
JP5316158B2 (ja) 情報処理装置、全文検索方法、全文検索プログラム、及び記録媒体
JP2006251866A (ja) 情報処理装置および方法、プログラム、並びに記録媒体
US20160140182A1 (en) Systems and methods for parsing search queries
JP4825544B2 (ja) 文書検索装置、文書検索方法、文書検索プログラム及び記録媒体
US20120179709A1 (en) Apparatus, method and program product for searching document
JP2012027788A (ja) 文書検索システム、文書検索方法およびプログラム
JP5834795B2 (ja) 情報処理装置及びプログラム
WO2016015267A1 (en) Rank aggregation based on markov model
JP4324650B2 (ja) 情報資源検索装置、情報資源検索方法及び情報資源検索プログラム
JP2006215717A (ja) 情報検索装置、情報検索方法および情報検索プログラム
JP4091146B2 (ja) 文書検索装置およびその装置としてコンピュータを機能させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP5121872B2 (ja) 画像検索装置
JP2004178421A (ja) 文書検索装置、文書検索方法、プログラムおよび記録媒体
JP2006323517A (ja) テキスト分類装置およびプログラム
CN116738065B (zh) 一种企业搜索方法、装置、设备及存储介质
JP2008299842A (ja) 広告執行による反応情報提供方法、コンピュータ読み取り可能な記録媒体、広告執行による反応情報提供システム
KR20170044408A (ko) 프로젝트의 추천 시스템 및 방법
JP2008071296A (ja) データ管理装置、データ管理方法およびデータ管理プログラム
JP2009098811A (ja) 文書分類装置およびプログラム
JP2012141681A (ja) クエリセグメント位置決定装置
US20140195561A1 (en) Search method and information managing apparatus
JP2004192374A (ja) 文書検索装置、プログラムおよび記録媒体
JP5494066B2 (ja) 検索装置、検索方法および検索プログラム
JP5547030B2 (ja) 情報分析装置及び方法及びプログラム
JP2008084192A (ja) 構造化文書検索装置、構造化文書検索方法および構造化文書検索プログラム