JPH11328220A - データ検索方法、その装置および記録媒体 - Google Patents
データ検索方法、その装置および記録媒体Info
- Publication number
- JPH11328220A JPH11328220A JP10150678A JP15067898A JPH11328220A JP H11328220 A JPH11328220 A JP H11328220A JP 10150678 A JP10150678 A JP 10150678A JP 15067898 A JP15067898 A JP 15067898A JP H11328220 A JPH11328220 A JP H11328220A
- Authority
- JP
- Japan
- Prior art keywords
- data
- search
- word
- vector
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
ために検索結果の数が多くなっても、検索結果を利用者
が容易に把握することができるように分類して出力さ
れ、したがって、操作性に優れたデータ検索方法、その
装置および記録媒体を提供することを目的とする。 【解決手段】 端末装置から入力された検索式に基づい
て、所定のサーバが、所定データを検索し、上記端末装
置に提供するデータ検索装置において、所定の語と、こ
の所定の語に関連する関連語とが対応して格納され、上
記サーバに設けられている関連語辞書を設け、上記検索
式に含まれている検索語の関連語を、上記関連語辞書を
用いて抽出する関連語抽出手段を設け、上記関連語抽出
手段によって抽出された関連語を用いて、検索された複
数のデータを複数のグループに分類する検索結果分類手
段を設けたものである。
Description
トワークを用いたデータ検索方法およびその装置に係
り、特に、検索の結果、多数のデータが選択された場合
に、自動的に検索データを分類し、出力するデータ検索
方法およびその装置に関する。
ベース等に蓄積し、利用者が与えた検索式に関連する文
書を、そのデータベースから取り出す技術である。検索
式とは、たとえば「通信」のような1つの単語だけでは
なく、「通信AND計算機」のように、「通信」と「計
算機」との両方の単語に関連する文書の取り出しを指定
したり、「通信OR計算機」のように、「通信」と「計
算機」とのうちのいずれかの単語に関連する文書の取り
出しを指定する式である。ここで「単語に関連する文
書」とは、ある文書にキーワードとしてある単語が予め
付与されている場合、そのキーワードに対応する文書で
あり、また、ある文書中にある単語が含まれている場
合、その単語に対応する文書である。
照合したデータを提供するデータ検索システムにおい
て、適合するデータが複数である場合、データベースに
格納されている順序で出力、表示されることが一般的で
ある。しかし、多数のデータが選択された場合、検索結
果の中から利用者が所望のデータを得ることが困難であ
り、利用者の作業が膨大になるという問題がある。
開示されているデータベース検索装置では、ユーザ別フ
リーキーワード格納部を設け、キーワードを含有する数
の多い順に検索結果を並び替えて表示するようにしてい
る。
載されているデータベース検索システムでは、キーワー
ド間の相関関係を示す概念ネットワーク図を予め用意
し、入力されたキーワードによってネットワーク図上で
1つのパスを決定し、パス上のキーワードを有するデー
タを優先的に出力するようにしている。
示されているデータベースシステムでは、データに含ま
れているキーワードを用いて予めデータを分類しておく
ことを前提にし、検索キーワードとの関連度が高い分類
を求め、この分類されているデータを出力するようにし
ている。
タ検索システムでは、利用者が容易に把握できる程度の
量に至るまで、検索結果の数を絞り込むためには、利用
者が多くの検索語を入力する必要があり、適切な検索語
を利用者が思いつかない場合、利用者が所望のデータを
得るのが困難である。または、上記のようにデータを予
め分類しておく必要があるという問題がある。
に基づいて利用者が検索しようとするデータは、その時
々で変化する。たとえば、長野オリンピックが開催され
る前の時点では、「オリンピック」という検索語によっ
て検索しようとするデータは、競技場のチケットの状
況、長野のホテルの予約状況、交通手段等のデータであ
るのに対し、オリンピック開催中の検索したいデータ
は、競技結果に関するデータというように、検索したい
データの内容は、時間の経過とともに変化する。
のようなデータニーズの変化には対応できていないとい
う問題がある。
少なく、このために検索結果の数が多くなっても、検索
結果を利用者が容易に把握することができるように分類
して出力され、したがって、操作性に優れたデータ検索
方法、その装置および記録媒体を提供することを目的と
する。
映した状態でデータを分類することができ、多くの利用
者が欲しているデータを分類して提示することができる
データ検索方法、その装置および記録媒体を提供するこ
とを目的とする。
入力された検索式に基づいて、所定のサーバが、所定デ
ータを検索し、上記端末装置に提供するデータ検索装置
において、所定の語と、この所定の語に関連する関連語
とが対応して格納され、上記サーバに設けられている関
連語辞書を設け、上記検索式に含まれている検索語の関
連語を、上記関連語辞書を用いて抽出する関連語抽出手
段を設け、上記関連語抽出手段によって抽出された関連
語を用いて、検索された複数のデータを複数のグループ
に分類する検索結果分類手段を設けたデータ検索装置で
ある。
実施例であるデータ検索装置IS1を示すブロック図で
ある。
スDB1と、関連語辞書Dと、ネットワークを介して端
末装置から送られた検索式を受信する検索式受信部10
と、データ検索部20と、関連語抽出部30と、検索結
果分類装置40と、検索結果送信部50とを有する。
力された検索式に基づいて、所定のサーバが、所定デー
タを検索し、この検索されたデータを上記端末装置に提
供するデータ検索装置であり、関連語辞書Dは、所定の
語と、この所定の語に関連する関連語とが対応して格納
され、上記サーバに設けられている辞書である。
ている検索語の関連語を、関連語辞書Dを用いて抽出す
る手段である。検索結果分類装置40は、関連語抽出部
30によって抽出された関連語を用いて、検索された複
数のデータを複数のグループに分類する手段である。
る。
を示すフローチャートである。
入力された検索式を検索式受信部10が受信し(S
1)、この入力された検索式に基づいて、情報データベ
ースDB1から所定データを検索する(S2)。そし
て、受信された検索式を各検索語に分解し(S3)、分
解された各検索語について、関連語辞書Dを用いて、検
索語と関連する関連語と、上記検索語と上記関連語との
関連度とを抽出する(S4)。その後、抽出された関連
語と関連度とを用いて、ステップS2で検索された検索
結果を後述する所定の手法で分類し(S5)、この分類
された検索結果を端末装置に送信する(S6)。
索語へ分解し、関連語と関連語とを抽出した(S3、S
4)後に、検索式に基づいてデータを検索する(S2)
ようにしてもよい。
た検索におけるデータを解析する後述のデータ関連付け
装置70を用いて作成したものである。
け装置70を示す図である。
は、同一の利用者によって使用された検索語は、その使
用時間間隔が短ければ同じデータを求めるために使用さ
れた検索語であり、その使用時間間隔が長ければ別のデ
ータを求めるために使用された検索語であり、使用時間
間隔が短い程、関連の度合い(関連度)が高いという考
えに基づく装置である。また、データ関連付け装置70
は、ユーザ別検索時刻・検索式抽出部71と、検索式分
解部72と、最小時刻差計算部73と、関連度計算・集
計部74とを有する。
過去の所定期間中に行われた検索におけるデータから、
検索ユーザ毎に、検索時刻と検索式とを抽出する手段で
ある。検索式分解部72は、ユーザ別検索時刻・検索式
抽出部71によって抽出された複数の検索式のうちの1
つの検索式が使用された時刻と、上記抽出された複数の
検索式のうちの別の検索式が使用された時刻との時刻差
のうちの最小値である最小時刻差を、上記検索ユーザ毎
に計算する手段である。
ザにおける上記最小時刻差に基づいて、上記最小時刻差
に対応する上記1つの検索式と上記別の検索式との関連
度を、上記所定の検索ユーザ毎に計算し、複数の上記検
索ユーザについて計算された上記関連度を集計する手段
である。関連度計算・集計部74は、最小時刻差に基づ
いて、2つの検索語同士の関連度を求め、全ユーザにつ
いて集計するものである。
式を検索語に分解し、上記分解された検索語のうちの1
つの検索語が使用された時刻と、上記分解された検索語
のうちの別の検索語が使用された時刻との時刻差のうち
の最小値である最小時刻差を、上記検索ユーザ毎に計算
する手段である。
ーザにおける上記最小時刻差に基づいて、上記最小時刻
差に対応する上記1つの検索語と上記別の検索語との関
連度を、所定の検索ユーザ毎に計算し、複数の検索ユー
ザについて計算された上記関連度を集計する手段であ
る。
差が0秒であれば(同一検索式に2つの検索語が存在す
れば)、検索語同士の関連度を「2」とし、最小時刻差
が0〜60秒であれば、関連度を「1」とし、最小時刻
差が300秒以上であれば、関連度を「0」とし、60
〜300秒の間は、1次関数を用いて求める。
すブロック図である。
に、多数の利用者が同一のデータを求めた場合、その検
索に使用された検索語の使用頻度傾向は似ているという
考えに基づく装置であり、2つの検索語の使用頻度に応
じて2つの検索語の間の相関係数を求める装置である。
また、相関係数検出装置80は、時間別・ユーザ別集計
部81と、検索式分解部82と、検索語集計部83と、
相関係数計算部84とを有する装置である。
た検索式を、日毎、ユーザ毎にまとめるものであり、つ
まり、過去の所定期間中に行われた検索におけるデータ
から、所定時間毎に検索ユーザ毎に、検索式を抽出する
手段である。検索式分解部82は、検索ユーザ毎に、検
索式を検索語へ分解し、重複を除く手段である。
用頻度を集計するものであり、つまり、所定時間毎にお
ける各検索語の使用回数を検索ユーザ毎に計算し、検索
ユーザ毎に計算された各検索語の使用回数を、全ての検
索ユーザについて集計する手段である。相関係数計算部
84は、日毎に集計された各検索語の使用頻度に基づ
き、それぞれの時系列間における2つの検索語の相関係
数を求めるものであり、集計された所定時間毎における
各検索語の使用回数に基づいて、2つの検索語相互間の
相関係数を計算する手段である。
関連語辞書Dを作成するので、データニーズを直接反映
した、タイムリーな関連語を求めることができ、一般的
な同義語ではなく、その時期に同義語的に用いられた関
連語を集約した関連語辞書Dを得ることができる。この
ように、上記実施例は、この関連語辞書Dを用いて広告
データベースDB2を検索するので、データニーズを反
映した、利用者が欲しい広告を選択することができ、宣
伝効果を上げることができる。
し、検索されたデータを、D1 ,D2 ,…,Dm とす
る。
の一例を示す図である。
関連する関連語と、この関連語との関連度とが格納され
ている。
連語Y1 、Y2 、Y3 、……、Ynは、この検索語Xと
関連する関連語であり、関連度Z1 、Z2 、Z3 …、Z
n は、検索語Xと、関連語Y1 、Y2 、Y3 、……、Y
n とのそれぞれの関連度である。
すブロック図である。
41と、ベクトル間類似度計算部42と、検索結果分類
部43とを有するものである。
からデータ検索の結果を受け取り、関連語抽出部30か
ら、上記検索語の関連語を受け取り、以下のようにし
て、検索結果である各データに基づいて、それぞれベク
トルを作成する手段である。
れ、ベクトル変換部41が受け取ったデータDj のベク
トルVj は、以下の式1、式2、式3のいずれかの式で
作成される。ただし、j=1、2、……、mである。
Yi に関する関数であり、検索データに関連語Yi が含
まれていれば、f(Yi )=1であり、検索データに関
連語Yi が含まれていなければ、f(Yi )=0であ
る。ただし、i=1、2、……、nである。
関連語Yi の出現回数を示す関数である。ただし、i=
1、2、……、nとする。
無を用いてベクトルを作成する式である。つまり、式1
を採用したベクトル変換手段は、各データ中の関連語の
有無を用いることによって、上記各データのベクトルを
作成する手段である。
有無と、検索語と各関連語との関連度とを用いてベクト
ルを作成する式である。つまり、式2を採用したベクト
ル変換手段は、各データ中の関連語の有無と、検索語と
各関連語との関連度とを用いて、各データのベクトルを
作成する手段である。
出現回数と関連度とを用いてベクトルを作成する式であ
る。つまり、式3を採用したベクトル変換手段は、デー
タ中の関連語が出現する数と、検索語と各関連語の関連
度とを用いて各データのベクトルを作成する手段であ
る。
うにして作成されたベクトルVj とVk との間の類似度
R(j、k)を、以下の式4によって求める手段であ
る。
るときに、 R(j,k)=(vj,1 ・vk,1 +vj,2 ・vk,2 +……+vj,n ・vk,n ) /{(vj,1 ・vj,1 +vj,2 ・vj,2 +……+vj,n ・vj,n )1/2 ・(vk, 1 ・vk,1 +vk,2 ・vk,2 +……+vk,n ・vk,n )1/2 } (式4) ただし,j=1,2,……,m、k=1,2,……,
m、j≠kとする。
が計算する2つのベクトル間の類似度は、2つのベクト
ルの内積を各ベクトルの大きさで割って得られた値であ
る。つまり、上記式4は、各ベクトルをn次元空間で表
したときのコサイン値(余弦値)に等しい。ここで、関
数f(Yi )、Zi 、g(Yi )は全て0以上の値であ
るので、類似度R(j,k)の値は、0から1の間の値
になる。すなわち、類似度R(j,k)の値が大きい
程、ベクトルVj とベクトルVk との類似度は高くな
り、データDj とDk との共通性が高くなる。
似度を用いて検索結果を分類する手段である。
部43によって検索結果を分類する動作について説明す
る。
分類する動作を示すフローチャートである。
類され、以下では、各検索されたデータDj が属するグ
ループの番号を、G[Dj ]と表示し、初期値として、
グループ番号G[Dj ]=jとする(S11)。ただ
し、j=1,2,……,mである。
ループに属するか否かを、上記2つのデータににそれぞ
れ対応するベクトルの間の類似度Rに応じて判定し、こ
の判定における類似度Rの閾値を、THとする。
(j、k)の最も大きな組(j、k)を取り出し(S1
2)、そして、類似度R(j、k)≦THならば(S1
3)、データDj とDk との類似性が低いので、データ
Dj とDk とを合併せずに(1つのグループに括らない
で)終了する。
3)、番号G[Dj ]のグループに属する要素としての
検索データDp と、番号G[Dk ]のグループに属する
要素としての検索データDq とを取り出し、類似度R
(p、q)>THか否かを判定する(S14)。番号G
[Dj ]のグループに属する全ての要素としてのデータ
Dp と、番号G[Dk ]のグループに属する全ての要素
としてのデータDq とについて、類似度R(p、q)>
THであれば(S14)、番号G[Dj ]のグループに
属する全ての要素としてのデータDp と、番号G[D
k ]のグループに属する全ての要素としてのデータDq
との類似性が高いので、番号G[Dj ]のグループと番
号G[Dk ]のグループとを合併し、1つのグループと
する(S15)。合併後のグループ番号を、たとえば番
号G[Dj ]とする。
類似度R(j、k)≦THになるまで、類似度R(j,
k)の大きな順に繰り返す(S16、S17、S1
8)。
に説明する。
1 〜V5 の各相互間におけるベクトル間類似度をベクト
ル間類似度計算部42が計算し、この計算結果である類
似度を示す図である。
されたデータD1 とD2 との間における類似度R(1,
2)が10であり、検索されたデータD1 とD3 との間
における類似度R(1,3)が8である。
〜D5 を分類する過程を示す図である。
してのデータは、図8(1)に示すように、1つであ
る。つまり、1つのグループに1つの検索データのみが
属している。なお、閾値THは5である。
で、ベクトルV1 とV2 との類似度R(1,2)が10
であり、これが図7中、最も大き値であるので、この類
似度R(1,2)を取り出す。この場合、閾値THは
「5」であるので、類似度R(1、2)>5であり、し
たがって、ベクトルV1 とV2 との類似性が充分に高い
と判断し、図8(2)に示すように、ベクトルV1 を含
むグループとベクトルV2 を含むグループとを合併す
る。
度R(4,5)が10であるので、類似度R(4,5)
が、次に大きな類似度であり、この類似度R(4,5)
を取り出す。そして、類似度R(4,5)>5であるの
で、図8(3)に示すように、ベクトルV4 を含むグル
ープとベクトルV5 を含むグループとを合併する。
度R(1,3)が次に大きく、この類似度R(1、3)
を取り出す。番号G[1]のグループに属する要素とし
ての検索データD1 、D2 のそれぞれについて、検索デ
ータD3 との間における類似度を調べると(図8
(4))、類似度R(1、3)>5、類似度R(2、
3)>5であるので、図8(5)に示すように、2つの
グループを合併する。
あり、これに対応するデータは、D2 、D3 であり、デ
ータD2 、D3 は、図8(5)に示すように、既に1つ
のグループに属しているので、データD2 、D3 に関す
る分類の処理としては、何も実行しない。
あり、これに対応するデータは、データD3 、D4 であ
り、データD3 、D4 の類似度R(3、4)>5である
が、データD4 が属するグループに属する他のデータD
5 とデータD3 との類似度R(3、5)≦5であるの
で、図8(6)に示すように、残った2つのグループ同
士について合併処理を実行しない。
これに対応するデータは、データD1 、D5 であり、デ
ータD1 とD5 との類似度R(1,5)≦5なので、図
8(7)に示すように、分類処理を終了する。
目のグループに配属され、データD4 、D5 が2つ目の
グループに配属され、データD1 、D2 、D3 を含むグ
ループと、データD4 、D5 を含むグループとは、別の
グループになる。このようにして分類処理を終了し、こ
の分類結果を端末装置に送信する。
図である。
ンピック」を使用した例であり、データの検索結果は1
29件で、それら129件の検索データを上記実施例の
処理に従って分類し、属するデータ数の多いグループか
ら順に表示されている。
個のデータを含むグループであり、その中から「オリン
ピック」に最も関連の強いデータを選び、そのタイトル
「長野オリンピック公式ガイド」をそのグループのタイ
トルとしている。さらに、そのグループに含まれている
データの数、残りのデータのタイトルを複数個表示して
いる。
上でクリックすることによって、残りのタイトルが表示
され、さらに、タイトル部分をクリックすると、その詳
細なデータが表示されるようになっている。他のグルー
プについても、上記と同様である。
い検索語の入力でも、利用者は欲しいデータがどこにあ
るか容易に把握することができ、検索時間の短縮、負担
の軽減を図ることができる。
タ検索装置DS2を示すブロック図である。
タ検索装置DS1と同じであり、データ関連づけ部90
が設けられている点のみがデータ検索装置DS1とは異
なるものである。
に行われた検索における情報データベースと、データ関
連づけ装置70とを有し、検索式が入力されるとその過
去の所定期間に行われた検索におけるデータに基づいて
関連語を作成し、関連語辞書Dを更新するものであり、
これによって、常に、データニーズを反映した関連語が
得られるようになっている。
の関連語のみを使用して、各検索されたデータに基づい
てベクトルを作成しているが、上記入力された検索語の
関連語以外の語についてのベクトルを、グループに属す
る要素として考えるようにしてもよい。たとえば、検索
結果のデータに含まれる全ての単語についてのベクトル
を、グループに属する要素として考えるようにしてもよ
い。この場合、単語数がw個あるとすれば、n+w次元
のベクトルを作成することになる。ただし、nは入力さ
れた検索語の関連語の数である。
れた検索式を用いてデータベースからデータを選択する
とともに、関連語辞書Dから得られる関連語を用いて検
索データに関するベクトルを作成し、さらにこのベクト
ルを用いて、ベクトルに対応するデータ同士の間におけ
る類似度を求め、この類似度を用いて検索データを分類
するので、少ない検索語入力の場合でも、検索結果を容
易に把握することが可能であり、利用者が所望のデータ
を得るまでの時間、負担の軽減を図ることができる。
が所定期間に使用した過去の所定期間に行われた検索に
おけるデータを解析して作成した辞書を使用すれば、一
般的な同義語ではなく、その時期に同義語的に使用され
た関連語を集約できるので、現在のデータニーズを反映
した分類が可能である。
把握することができる。つまり、上記実施例は、端末装
置から入力された検索式に基づいて、所定のサーバが、
所定データを検索し、この検索されたデータを上記端末
装置に提供するデータ検索手順において、所定の語と、
この所定の語に関連する関連語とが対応して格納されて
いる関連語辞書を上記サーバに設ける関連語辞書設置手
順と、上記検索式に含まれている検索語の関連語を、上
記関連語辞書を用いて抽出する関連語抽出手順と、上記
関連語抽出手順で抽出された関連語を用いて、検索され
た複数のデータを複数のグループに分類する検索結果分
類手順とをコンピュータに実行させるプログラムを記録
したコンピュータ読み取り可能な記録媒体の例である。
この記憶媒体の例としては、CD、FD、ハードディス
ク、半導体メモリ等がある。
た所定期間の過去の所定期間に行われた検索におけるデ
ータを解析することによって得られた関連語辞書を設
け、検索語の関連語を検索し、この関連語を用いて検索
されたデータについてベクトルを作成し、ベクトル間の
類似度を求め、この類似度で検索結果を自動的に分類し
て出力するので、利用者が検索結果を容易に把握するこ
とができ、データ検索システムの操作性が極めて向上す
るという効果を奏する。
を示すブロック図である。
チャートである。
示す図である。
図である。
である。
分類する動作を示すフローチャートである。
相互間におけるベクトル間類似度をベクトル間類似度計
算部42が計算し、この計算結果である類似度を示す図
である。
する過程を示す図である。
S2を示すブロック図である。
Claims (13)
- 【請求項1】 端末装置から入力された検索式に基づい
て、所定のサーバが、所定データを検索し、この検索さ
れたデータを上記端末装置に提供するデータ検索装置に
おいて、 所定の語と、この所定の語に関連する関連語とが対応し
て格納され、上記サーバに設けられている関連語辞書
と;上記検索式に含まれている検索語の関連語を、上記
関連語辞書を用いて抽出する関連語抽出手段と;上記関
連語抽出手段によって抽出された関連語を用いて、検索
された複数のデータを複数のグループに分類する検索結
果分類手段と;を有することを特徴とするデータ検索装
置。 - 【請求項2】 請求項1において、 上記検索結果分類手段は、 上記抽出された関連語を用いて、上記検索されたデータ
をベクトルに変換するベクトル変換手段と;上記変換さ
れた2つのベクトルの間における類似度を計算するベク
トル間類似度計算手段と;を有し、上記ベクトル間類似
度計算手段によって計算された類似度を用いて、上記検
索された複数のデータを、複数のグループに分類する手
段であることを特徴とするデータ検索装置。 - 【請求項3】 請求項2において、 上記ベクトル変換手段は、 上記各データ中の関連語の有無を用いることによって、
上記各データのベクトルを作成する手段であることを特
徴とするデータ検索装置。 - 【請求項4】 請求項2において、 上記ベクトル変換手段は、 上記各データ中の関連語の有無と、検索語と各関連語と
の関連度とを用いて、各データのベクトルを作成する手
段であることを特徴とするデータ検索装置。 - 【請求項5】 請求項2において、 上記ベクトル変換手段は、 上記データ中の関連語が出現する数と、上記検索語と上
記各関連語の関連度とを用いて上記各データのベクトル
を作成する手段であることを特徴とするデータ検索装
置。 - 【請求項6】 請求項2において、 上記ベクトル間類似度計算手段が計算する上記2つのベ
クトル間の類似度は、上記2つのベクトルの内積を各ベ
クトルの大きさで割って得られた値であることを特徴と
するデータ検索装置。 - 【請求項7】 端末装置から入力された検索式に基づい
て、所定のサーバが、所定データを検索し、この検索さ
れたデータを上記端末装置に提供するデータ検索方法に
おいて、 所定の語と、この所定の語に関連する関連語とが対応し
て格納されている関連語辞書を上記サーバに設ける関連
語辞書設置段階と;上記検索式に含まれている検索語の
関連語を、上記関連語辞書を用いて抽出する関連語抽出
段階と;上記関連語抽出段階で抽出された関連語を用い
て、検索された複数のデータを複数のグループに分類す
る検索結果分類段階と;を有することを特徴とするデー
タ検索方法。 - 【請求項8】 請求項7において、 上記検索結果分類段階は、 上記抽出された関連語を用いて、上記検索されたデータ
をベクトルに変換するベクトル変換段階と;上記変換さ
れた2つのベクトルの間における類似度を計算するベク
トル間類似度計算段階と;を有し、上記ベクトル間類似
度計算段階によって計算された類似度を用いて、上記検
索された複数のデータを、複数のグループに分類する段
階であることを特徴とするデータ検索方法。 - 【請求項9】 請求項8において、 上記ベクトル変換段階は、 上記各データ中の関連語の有無を用いることによって、
上記各データのベクトルを作成する段階であることを特
徴とするデータ検索方法。 - 【請求項10】 請求項8において、 上記ベクトル変換段階は、 上記各データ中の関連語の有無と、検索語と各関連語と
の関連度とを用いて、各データのベクトルを作成する段
階であることを特徴とするデータ検索方法。 - 【請求項11】 請求項8において、 上記ベクトル変換段階は、 上記データ中の関連語が出現する数と、上記検索語と上
記各関連語の関連度とを用いて上記各データのベクトル
を作成する段階であることを特徴とするデータ検索方
法。 - 【請求項12】 請求項8において、 上記ベクトル間類似度計算段階が計算する上記2つのベ
クトル間の類似度は、上記2つのベクトルの内積を各ベ
クトルの大きさで割って得られた値であることを特徴と
するデータ検索方法。 - 【請求項13】 端末装置から入力された検索式に基づ
いて、所定のサーバが、所定データを検索し、この検索
されたデータを上記端末装置に提供するデータ検索手順
において、 所定の語と、この所定の語に関連する関連語とが対応し
て格納されている関連語辞書を上記サーバに設ける関連
語辞書設置手順と;上記検索式に含まれている検索語の
関連語を、上記関連語辞書を用いて抽出する関連語抽出
手順と;上記関連語抽出手順で抽出された関連語を用い
て、検索された複数のデータを複数のグループに分類す
る検索結果分類手順と;をコンピュータに実行させるプ
ログラムを記録したコンピュータ読み取り可能な記録媒
体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP15067898A JP3591813B2 (ja) | 1998-05-14 | 1998-05-14 | データ検索方法、その装置および記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP15067898A JP3591813B2 (ja) | 1998-05-14 | 1998-05-14 | データ検索方法、その装置および記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH11328220A true JPH11328220A (ja) | 1999-11-30 |
JP3591813B2 JP3591813B2 (ja) | 2004-11-24 |
Family
ID=15502089
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP15067898A Expired - Fee Related JP3591813B2 (ja) | 1998-05-14 | 1998-05-14 | データ検索方法、その装置および記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3591813B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006040058A (ja) * | 2004-07-28 | 2006-02-09 | Mitsubishi Electric Corp | 文書分類装置 |
JP2007133761A (ja) * | 2005-11-11 | 2007-05-31 | Ricoh Co Ltd | コンテンツ処理装置、コンテンツ処理プログラムおよびコンテンツ処理方法 |
JP2008027207A (ja) * | 2006-07-21 | 2008-02-07 | Gunma Univ | 検索装置及び検索方法 |
JP2009093646A (ja) * | 2007-10-05 | 2009-04-30 | Fujitsu Ltd | 検索結果のインテリジェント分類のための方法、ソフトウェア及び装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06124308A (ja) * | 1992-10-14 | 1994-05-06 | Fujitsu Ltd | 情報整理処理装置 |
-
1998
- 1998-05-14 JP JP15067898A patent/JP3591813B2/ja not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06124308A (ja) * | 1992-10-14 | 1994-05-06 | Fujitsu Ltd | 情報整理処理装置 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006040058A (ja) * | 2004-07-28 | 2006-02-09 | Mitsubishi Electric Corp | 文書分類装置 |
JP2007133761A (ja) * | 2005-11-11 | 2007-05-31 | Ricoh Co Ltd | コンテンツ処理装置、コンテンツ処理プログラムおよびコンテンツ処理方法 |
JP2008027207A (ja) * | 2006-07-21 | 2008-02-07 | Gunma Univ | 検索装置及び検索方法 |
JP2009093646A (ja) * | 2007-10-05 | 2009-04-30 | Fujitsu Ltd | 検索結果のインテリジェント分類のための方法、ソフトウェア及び装置 |
Also Published As
Publication number | Publication date |
---|---|
JP3591813B2 (ja) | 2004-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6826576B2 (en) | Very-large-scale automatic categorizer for web content | |
US9542393B2 (en) | Method and system for indexing and searching timed media information based upon relevance intervals | |
US6772148B2 (en) | Classification of information sources using graphic structures | |
US6442540B2 (en) | Information retrieval apparatus and information retrieval method | |
US20100114561A1 (en) | Latent metonymical analysis and indexing (lmai) | |
US20100070507A1 (en) | Hybrid content recommending server, system, and method | |
US20090300046A1 (en) | Method and system for document classification based on document structure and written style | |
KR20080031262A (ko) | 관계 네트워크 | |
AU2011239618B2 (en) | Ascribing actionable attributes to data that describes a personal identity | |
KR20080024157A (ko) | 사용자 액티비티, 주의, 관심 측정을 활용하는 데이터감지, 저장, 인덱싱, 및 탐색 | |
WO2009032023A1 (en) | System and methods for clustering information | |
WO2010014082A1 (en) | Method and apparatus for relating datasets by using semantic vectors and keyword analyses | |
Kallipolitis et al. | Semantic search in the World News domain using automatically extracted metadata files | |
US20120239657A1 (en) | Category classification processing device and method | |
US20050114317A1 (en) | Ordering of web search results | |
CN116010552A (zh) | 一种基于关键词词库的工程造价数据解析系统及其方法 | |
Hybridised | OntoKnowNHS: Ontology Driven Knowledge Centric Novel Hybridised Semantic Scheme for Image Recommendation Using Knowledge Graph | |
JP3591813B2 (ja) | データ検索方法、その装置および記録媒体 | |
JP2006065366A (ja) | キーワード分類装置およびその方法、端末装置ならびにプログラム | |
CN115964495A (zh) | 一种新闻类事件脉络梳理方法及系统 | |
CN113157857B (zh) | 面向新闻的热点话题检测方法、装置及设备 | |
JP4134975B2 (ja) | 話題文書提示方法及び装置及びプログラム | |
CN113656641A (zh) | 支持模糊评论挖掘的视频高效检索系统 | |
Selvan et al. | ASE: Automatic search engine for dynamic information retrieval | |
KR101147508B1 (ko) | 검색식 추천 장치 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040210 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040423 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040622 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040820 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040823 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080903 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080903 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090903 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090903 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100903 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100903 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110903 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120903 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130903 Year of fee payment: 9 |
|
LAPS | Cancellation because of no payment of annual fees |