JP2003173352A - 検索ログ解析方法および装置、文書情報検索方法および装置、検索ログ解析プログラム、文書情報検索プログラム、および記録媒体 - Google Patents

検索ログ解析方法および装置、文書情報検索方法および装置、検索ログ解析プログラム、文書情報検索プログラム、および記録媒体

Info

Publication number
JP2003173352A
JP2003173352A JP2001371550A JP2001371550A JP2003173352A JP 2003173352 A JP2003173352 A JP 2003173352A JP 2001371550 A JP2001371550 A JP 2001371550A JP 2001371550 A JP2001371550 A JP 2001371550A JP 2003173352 A JP2003173352 A JP 2003173352A
Authority
JP
Japan
Prior art keywords
document
search
time
request
extracted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001371550A
Other languages
English (en)
Inventor
Akiya Kurishima
聡哉 栗島
Daijiro Mori
大二郎 森
Hiroshi Takeno
浩 竹野
Hiroto Inagaki
博人 稲垣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2001371550A priority Critical patent/JP2003173352A/ja
Publication of JP2003173352A publication Critical patent/JP2003173352A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 利用者が検索を行った時間帯や季節などに適
合した文書情報を容易に得られるようにする。 【解決手段】 検索ログ解析装置30は、検索を行った
際のキーワードと検索時間、参照した文書の文書IDと
参照時間を記録した検索ログデータベース40から、あ
る1つの時間区分で他の時間区分に比べて多い検索キー
ワードまたは参照文書IDを抽出し、時間区分別要求情
報データベース50に保存する。検索結果順位特定部2
4は、検索/参照部23が検索キーワードをもとに文書
情報データベース60から抽出された文書を、時間区分
別要求情報データベース50に保存されている検索キー
ワードまたは参照文書IDに基づいて順位付けし、検索
/参照結果送信部25を介して利用者10に送る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、情報検索方法およ
び装置に関する。
【0002】
【従来の技術】近年、インターネットなどのコンピュー
タネットワークの発展にともない、利用者どうしでやり
取りを行ったり、不特定多数を対象に発信したりする電
子化文書の量は年々増加している。そのため、このよう
な大量の文書情報の中から個人が必要とする情報を検索
することができるサービスがネットワーク上で実現され
ている。
【0003】検索サービスとは、利用者が検索を行いた
いキーワードを1つ、または複数組み合わせて入力し、
そのキーワードとデータベースを比較し、そのキーワー
ドが含まれる文書をデータベースから取り出し、利用者
に返すサービスである。このデータベースは、文書や収
集済みのホームページなどのデータ内に存在する単語を
形態素解析処理により抽出し、単語がどの文書に存在す
るかということを索引化したものである。
【0004】
【発明が解決しようとする課題】しかし、検索結果が利
用者の欲しい情報と必ずしも一致するとは限らない。こ
れは、利用者が検索したい概念を的確にキーワードで表
現することが困難であり、また、検索した結果が大量
で、それを1つ1つ検証することが困難であるからであ
る。これまでは検索結果を、検索キーワードを含有する
数の多い順や、他の文書に引用される数の多い順に並び
替えて表示することで、大量の検索結果を検証しなけれ
ばならないという問題の解決が試みられてきたが、必ず
しも利用者の満足できる順序になっているわけではなか
った。
【0005】本発明の目的は、利用者が欲しい情報とで
きるだけ一致した情報を得ることができる情報検索方法
および装置を提供することにある。
【0006】
【課題を解決するための手段】特定の時間帯、曜日、季
節などでは、多くの利用者が同種の情報を検索しようと
する場合が少なくなくない。またその結果、同じ文書を
閲覧することになる場合も少なくない。例えば、その日
の夜に行われたスポーツの試合の詳細な情報、週末のレ
ジャー情報、ある季節に恒例の行事の情報などである。
このような特定の時間帯、曜日、季節などで情報の検索
を行う場合、それ以前の利用者の検索要求と参照要求の
履歴情報を、検索によって得られた文書の順位付けに活
用することは有効であると考えられる。
【0007】本発明は、上記目的を達成するために、ま
ず検索を行った日時とキーワードを保存し、時間帯や曜
日、季節などで区分けされたある期間でそれ以外の期間
より多く使われるキーワードや参照される文書の情報を
あらかじめ抽出し、抽出した情報を参照して検索した文
書の得点を計算し順位付けを行い提示することで、検索
を行うときに絞り込むキーワードを入れることなく、必
要な情報を利用者に提供するものである。
【0008】本発明では、利用者が検索を行った日時と
検索において用いられた検索キーワードや参照された文
書のデータなどが含まれる検索ログを保存する。そし
て、検索ログからキーワードや参照された文書の一日の
時間別、一週間の曜日別、一年の季節別などで区別した
期間で頻度の計算を行う。上記で計算した頻度からある
一定の時間帯での頻度がそれ以外の時間帯より設定した
条件以上に多く使用されているようなキーワードや参照
された文書を抽出し記録する。
【0009】利用者が検索装置に対してキーワードを利
用して検索を行うと、検索を行った検索時間を取得し、
その検索時間から上記で抽出したある時間帯で多く利用
されているキーワードや多く参照されている文書を特定
する。それから、索引化されたデータベースから検索キ
ーワードが含まれる文書を抽出し、その中から上記で抽
出を行ったキーワードや参照されている文書の情報を用
いて文書の得点を計算する。その得点順に順序を決定し
て、その順序に従って前記検索された文書を表示するよ
うにする。
【0010】このため、検索を行った時間帯で多く求め
られているようなキーワードを含む文書、または多く参
照されている文書、つまり冬に検索したときには冬に関
連した文書が、検索を行った時間、季節に適合している
と考えられる文書の順で表示されるため利用者が時間帯
や季節により適合した情報を得る負担を軽減することが
可能になる。
【0011】
【発明の実施の形態】次に、本発明の実施の形態につい
て図面を参照にして説明する。
【0012】図1を参照すると、本発明の一実施形態の
情報検索システムは文書情報検索装置20と検索ログ解
析装置30と検索ログデータベース40と時間区分別要
求情報データベース50と文書情報データベース60で
構成される。
【0013】文書情報検索装置20は、利用者10から
検索キーワードを含む検索要求または文書IDを含む参
照要求を受け取り、これらを検索ログデータベース40
に記録するとともに、文書情報データベース60からこ
れら検索キーワードまたは文書IDを含む文書を検索
し、時間区分別要求情報データベース50の情報をもと
に順位付けして利用者10に返す。検索/参照要求受信
部21は、利用者10からの検索/参照要求を受け取
り、それを検索/参照要求記録部22と検索/参照部2
3に送信する。検索/参照要求記録部22は、検索/参
照要求受信部21から送信されてきた検索/参照要求
を、要求時刻とともに、検索ログデータベース40に記
録する。検索/参照部23は、検索/参照要求受信部2
1から受信した検索/参照要求に基づいて、別途に作成
された文書情報データベース60から、この検索/参照
要求に対応する文書を抽出する。検索結果順位特定部2
4は、検索要求の時刻に対応した時間区分の検索要求ま
たは参照要求の履歴を時間区分別要求情報データベース
50から受信し、これに基づいて、検索/参照部23で
抽出した検索情報の順位付けを実行し、その検索結果を
検索/参照結果送信部25に送信する機能を有する。検
索/参照結果送信部25は、検索/参照結果を利用者1
0に送信する。各部は、具体的にはCPUならびにメモ
リを含む周辺LSIで構成され、CPUがメモリに記録
されているプログラムを逐次読み出し実行することによ
り、その機能を実現する。
【0014】検索ログ解析装置30は、検索ログデータ
ベース40に保存されている検索要求情報と参照要求情
報を特定の時間区分(例えば、1日の時間帯、1週間の
曜日、1年の季節など)で区分し、各時間区分に含まれ
る各検索キーワード、各文書IDの個数を集計する時間
区分別要求情報計算部31と、これらを時間区分別要求
情報データベース50に記録する時間区分別要求情報記
録部32を含む。各部は、具体的にはCPUならびにメ
モリを含む周辺LSIで構成され、CPUがメモリに記
録されているプログラムを逐次読み出し実行することに
より、その機能を実現する。
【0015】検索ログデータベース40は、利用者10
が文書情報検装置20に送った検索要求および参照要求
を履歴として保存しているものであり、図2に示すよう
に、検索要求を送信した利用者10のユーザーID(Co
okieなどを使って取得する)、その検索要求で指定され
たキーワード、その検索要求が送信された時刻と、参照
要求を送信した利用者10のユーザーID、その参照要
求で指定された文書のID、その参照要求が送信された
時刻が保存されている。
【0016】時間区分別要求情報データベース50は、
図3に示すように、検索要求回数が他の時間区分に比べ
て特に多い検索キーワードと、その検索キーワードがよ
く使われる時間区分の情報、および参照要求回数が他の
時間区分に比べて特に多い文書とその文書がよく参照さ
れる時間区分の情報を保存している。
【0017】検索用情報データベース60は、図4に示
すように、コンピュータ上に入力した文書、特にインタ
ーネット上の検索システムでは、HTML(Hyper Text
Mark-Up Language)ファイルのリンクをたどり収集し
てきた文書を形態素解析処理で単語に分解し、含まれる
単語とその文書を特定するIDを索引化して保存してい
る。また、その文書を文書IDと対応させて保存・管理
している。なお、ここで言う形態素解析処理とは、日本
語の文字列を解析し、その文字列に含まれる単語に分割
し、その単語の属性を解析する処理のことを言う。
【0018】次に、検索ログ解析装置30の動作を図5
により説明する。
【0019】ステップ101で、時間区分別要求情報計
算部31が検索ログデータベース40のキーワードおよ
び/または文書IDを特定の時間区分ごとにカウントす
る。特定の時間区分は、例えば、1日の時間帯、1週間
の曜日、1年の季節などである。
【0020】ステップ102で、時間区分別要求情報計
算部31が他の時間区分における要求回数よりも多く、
かつ、特定の条件を満足する1つの時間区分におけるキ
ーワードおよび/または文書IDを抽出する。ここで、
特定の条件は、例えば、全時間区分の平均値の2倍を超
える要求回数がその時間区分において存在するなど、一
定数以上の要求回数があることが挙げられる。
【0021】ステップ103で、時間区分別要求情報記
録部32が抽出されたキーワードおよび/または文書I
Dをその時間区分と組にして、時間区分別要求情報デー
タベース50に記録する。記録された情報は検索結果の
順位付けに活用される。
【0022】次に、文書情報検索装置20の動作を図6
のフローチャートにより示す。
【0023】ステップ201で、検索/参照要求受信部
21が利用者10から検索要求を受け取る。検索要求と
しては、1つ、あるいは複数組み合わされたキーワード
が挙げられる。
【0024】ステップ202で、検索/参照要求受信部
21が受け取った検索要求情報を検索/参照要求記録部
22と検索/参照部23に送る。
【0025】ステップ203で、検索/参照要求記録部
22が受け取った検索要求情報を検索ログデータベース
40に記録する。この記録は次回以降の検索に活用され
ることになる。
【0026】ステップ204で、検索/参照部23が受
け取った検索情報をもとに文書情報データベース60か
ら文書情報を抽出する。
【0027】ステップ205で、検索結果順位特定部2
4が、検索/参照部23が抽出した文書情報の順位付け
を時間区分別要求情報データベース50の情報をもとに
行う。
【0028】ステップ206で、順位付けを行った文書
情報を検索/参照結果送信部25に送る。
【0029】ステップ207で、検索/参照結果送信部
25から利用者10に検索結果を返す。
【0030】図7は、図6中のステップ205の詳細な
処理の第1の例を示すフローチャートである。
【0031】ステップ301で、時間区分別要求情報デ
ータベース50から、検索が行われた時間をもとにその
時間区分に多く使われるキーワードを抽出する。
【0032】ステップ302で、検索キーワードが含ま
れる文書に特定の時間区分で多く使われるキーワードが
いくつ含まれるか計算する。
【0033】ステップ303で、文書に含まれる単語数
から検索キーワードが含まれる文書の得点を計算する。
得点の計算法は、例えば、TF/IDF("Automatic T
extProcessing" Gerard Salton. ADDISON-WESLEY pub.
1989)と呼ばれる手法を用いて、情報iの得点Scorei
【0034】
【数1】
【0035】で計算する方法が挙げられる。さらに、要
求回数が多い検索キーワードに重みをつけて計算するこ
とも考えられる。
【0036】ステップ304で、その得点をもとに検索
キーワードが含まれる文書の順位付けを行う。
【0037】図8は、図6中のステップ205の詳細な
処理の第2の例を示すフローチャートである。
【0038】ステップ401で、時間区分別要求情報デ
ータベース50から、検索が行われた時間をもとにその
時間区分に多く使われるキーワードを抽出する。
【0039】ステップ402で、抽出したキーワードか
ら検索キーワードと関連性のあるキーワードを抽出す
る。関連性のあるキーワードの抽出方法としては、同義
語や類義語などを集めているシソーラス辞書などを利用
して、検索キーワードと関連性のあるキーワードを抽出
する方法や、検索ログデータベース40や蓄積している
文書などからキーワードどうしの関連性を導き出し、そ
の導き出した規則からキーワードを抽出する方法が考え
られる。
【0040】ステップ403で、検索キーワードが含ま
れる文書に抽出されたキーワードがいくつ含まれるか計
算する。
【0041】ステップ404で、文書に含まれる単語数
から検索キーワードが含まれる文書の得点を計算する。
得点の計算法は第1の例と同様である。
【0042】ステップ405で、その得点をもとに検索
キーワードが含まれる文書の順位付けを行う。
【0043】図9は、図6中のステップ205の詳細な
処理の第3の例を示すフローチャートである。この例で
は、前二者の例とは違い、参照要求の情報を用いる。
【0044】ステップ501で、時間区分別要求情報デ
ータベース50から、検索が行われた時間をもとにその
時間区分に多く参照された文書IDを抽出する。
【0045】ステップ502で、その時間区分に多く参
照された文書情報の参照回数をもとに、検索キーワード
が含まれる文書の得点を計算する。
【0046】ステップ503で、その得点をもとに検索
キーワードが含まれる文書の順位付けを行う。
【0047】図10は、図6中のステップ205の詳細
な処理の第4の例を示すフローチャートである。この例
では、検索要求と参照要求の両方の情報を用いる。
【0048】ステップ601、602で、ステップ50
1、502とそれぞれ同一の処理を行う。ステップ60
3、604、605で、ステップ301、302、30
3とそれぞれ同一の処理を行う。ステップ603、60
4、605をステップ401、402、403、404
と同一な処理で置き換えることも考えられる。
【0049】ステップ606で、ステップ601、60
2、および、ステップ603、604、605で得られ
た文書の得点を加算する。単純に加算することも考えら
れるし、どちらかの得点を重視することも考えられる。
【0050】ステップ607で、その得点をもとに検索
キーワードが含まれる文書の順位付けを行う。
【0051】利用者10は、順位付けされた検索結果の
1つあるいは複数に対して、参照要求を出す。参照要求
は検索/参照要求受信部21で受信され、検索/参照要
求記録部22と検索/参照部23に送られる。検索/参
照要求記録部22では、受信した参照要求情報を検索ロ
グデータベース40に記録し、次回以降の検索に活用す
る。検索/参照部23では、受信した参照要求に対応し
た文書を文書情報データベース60から抽出し、検索/
参照結果送信部25を経由して、利用者10に送る。
【0052】なお、文書情報検索装置20および検索ロ
グ解析装置30は、専用のハードウェアにより実現する
以外に、その機能を実現するためのプログラムを、コン
ピュータで読み取りが可能な記録媒体に記録して、この
記録媒体に記録されたプログラムをコンピュータシステ
ムに読み込ませ、実行するものであってもよい。コンピ
ュータで読み取りが可能な記録媒体とは、フロッピー
(登録商標)ディスク、光磁気ディスク、CD−ROM
等の記録媒体、コンピュータシステムに内蔵されるハー
ドディスク装置等の記憶装置を指す。さらに、コンピュ
ータで読み取りが可能な記録媒体は、インターネットを
介してプログラムを送信する場合のように、短時間の間
に、動的にプログラムを保持するもの(伝送媒体もしく
は伝送波)、その場合のサーバとなるコンピュータシス
テム内部の揮発性メモリのように、一定時間プログラム
を保持しているものも含む。
【0053】
【発明の効果】以上説明したように、本発明は、利用者
が検索システムでどの時間帯にどのようなキーワードで
検索したか、あるいは、どの文書を参照したかを分析
し、検索を行った時間帯でよく使用されていた検索キー
ワードが含まれる文書、あるいはよく参照されていた文
書を返すことにより、検索を行った時刻で需要が多く、
その需要に適合した情報を効率的に検索することが可能
になる。
【図面の簡単な説明】
【図1】本発明の一実施形態である文書情報検索システ
ムの構成概念図である。
【図2】検索ログデータベース40の一例を示す図であ
る。
【図3】時間区分別要求情報データベース50の一例を
示す図である。
【図4】文書情報データベース60の一例を示す図であ
る。
【図5】検索ログ解析装置30の動作を示すフローチャ
ートである。
【図6】文書情報検索装20置の動作を示すフローチャ
ートである。
【図7】文書情報検索装置20の動作のうち、文書の順
位付けの処理の第1の例を示すフローチャートである。
【図8】文書情報検索装置20の動作のうち、文書の順
位付けの処理の第2の例を示すフローチャートである。
【図9】文書情報検索装置20の動作のうち、文書の順
位付けの処理の第3の例を示すフローチャートである。
【図10】文書情報検索装置20の動作のうち、文書の
順位付けの処理の第4の例を示すフローチャートであ
る。
【符号の説明】
10 利用者 20 文書情報検索装置 21 検索/参照要求受信部 22 検索/参照要求記録部 23 検索/参照部 24 検索結果順位特定部 25 検索/参照結果送信部 30 検索ログ解析装置 31 時間区分別要求情報計算部 32 時間区分別要求情報記録部 40 検索ログデータベース 50 時間区分別要求情報データベース 60 文書情報データベース 101〜103 ステップ 201〜207 ステップ 301〜304 ステップ 401〜405 ステップ 501〜203 ステップ 601〜607 ステップ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 竹野 浩 東京都千代田区大手町二丁目3番1号 日 本電信電話株式会社内 (72)発明者 稲垣 博人 東京都千代田区大手町二丁目3番1号 日 本電信電話株式会社内 Fターム(参考) 5B075 KK02 KK33 KK37 PR04

Claims (18)

    【特許請求の範囲】
  1. 【請求項1】 検索キーワードと検索時間を含む検索要
    求情報、および/または、参照文書IDと参照時間を含
    む参照要求情報が記録されている検索ログデータベース
    中の検索キーワードおよび/または参照文書IDをある
    時間区分で区切り、各時間区分に出現する各検索キーワ
    ードおよび/または参照文書IDの数を集計し、他の時
    間区分に比べて出現回数の多い時間区分を有する検索キ
    ーワードおよび/または参照文書IDをその時間区分と
    ともに抽出するステップと、 該抽出された検索キーワードおよび/または参照文書I
    Dと該時間区分を保存するステップを有する検索ログ解
    析方法。
  2. 【請求項2】 前記検索キーワードおよび/または参照
    文書IDを時間区分とともに抽出するステップは、さら
    に、出現回数が特定の条件を満たす検索キーワードおよ
    び/または参照文書IDのみを抽出する、請求項1に記
    載の検索ログ解析方法。
  3. 【請求項3】 利用者から文書の検索要求または参照要
    求を受け付け、検索対象または参照対象の文書が格納さ
    れている文書情報データベースから該要求の文書を抽出
    し、前記利用者に返す文書情報検索方法において、 前記検索要求を受け付けると検索キーワードと検索時間
    を含む検索要求情報を、前記参照要求を受け付けると参
    照文書IDと参照時間を含む参照要求情報を検索ログデ
    ータベースに記録するステップと、 前記検索要求をもとに前記文書情報データベースから抽
    出された文書を、過去に行われた検索要求および/また
    は参照要求の検索キーワードおよび/または参照文書I
    Dが記録されている検索ログデータベースから他の時間
    区分に比べて出現回数が多い特定の時間区分を有する検
    索キーワードおよび/または参照文書IDを抽出し保存
    した時間区分別要求情報データベースに基づいて順位付
    けするステップと、 順位付けされた文書を順位の高い順に前記利用者に提供
    するステップを有することを特徴とする文書情報検索方
    法。
  4. 【請求項4】 前記順位付けするステップは、 前記時間区分別要求情報データベースから、検索が行わ
    れた時刻に対応する時間区分の検索キーワードを抽出す
    るステップと、 抽出された検索キーワードが前記文書情報データベース
    から抽出された各文書に含まれる個数を計算するステッ
    プと、 各文書に含まれる該検索キーワードの個数から各文書の
    得点を計算するステップと、 計算された得点をもとに前記文書の順位付けを行うステ
    ップを含む、請求項3に記載の文書情報検索方法。
  5. 【請求項5】 前記順位付けするステップは、 前記時間区分別要求情報データベースから、検索が行わ
    れた時刻に対応する時間区分の検索キーワードを抽出す
    るステップと、 抽出された検索キーワードのうち、前記検索要求に含ま
    れる検索キーワードと関連性のある検索キーワードを抽
    出するステップと、 抽出された後者の各検索キーワードが、前記文書情報デ
    ータベースから抽出された各文書に含まれる個数を計算
    するステップと、 各文書に含まれる該検索キーワードの個数から各文書の
    得点を計算するステップと、 計算された得点をもとに前記文書の順位付けを行うステ
    ップを含む、請求項3に記載の文書情報検索方法。
  6. 【請求項6】 前記順位付けするステップは、 前記時間区分別要求情報データベースから、検索が行わ
    れた時刻に対応する時間区分の参照文書IDを抽出する
    ステップと、 前記文書情報データベースから抽出された各文書の得点
    を、抽出された文書IDの参照回数をもとに計算するス
    テップと、 計算された得点をもとに前記文書の順位付けを行うステ
    ップを含む、請求項3に記載の文書情報検索方法。
  7. 【請求項7】 前記順位付けするステップは、 前記時間区分別要求情報データベースから、検索が行わ
    れた時刻に対応する時間区分の検索キーワードを抽出す
    るステップと、 該検索キーワードが前記文書情報データベースから抽出
    された各文書に含まれる個数を計算するステップと、 各文書に含まれる該検索キーワードの個数から各文書の
    得点を計算するステップと、 前記時間区分別要求情報データベースから、検索が行わ
    れた時刻に対応する時間区分の参照文書IDを抽出する
    ステップと、 前記文書情報データベースから抽出された各文書の得点
    を、抽出された文書IDの参照回数をもとに計算するス
    テップと、 3番目のステップで計算された得点と5番目のステップ
    で計算された得点を文書ごとに加算するステップと、 加算された得点をもとに前記文書の順位付けを行うステ
    ップを含む、請求項3に記載の文書情報検索方法。
  8. 【請求項8】 検索キーワードと検索時間を含む検索要
    求情報、および/または、参照文書IDと参照時間を含
    む参照要求情報が記録されている検索ログデータベース
    中の検索キーワードおよび/または参照文書IDをある
    時間区分で区切り、各時間区分に出現する各検索キーワ
    ードおよび/または参照文書IDの数を集計し、他の時
    間区分に比べて出現回数の多い時間区分を有する検索キ
    ーワードおよび/または参照文書IDをその時間区分と
    ともに抽出する手段と、 該抽出された検索キーワードおよび/または参照文書I
    Dと該時間区分を保存する手段を有する検索ログ解析装
    置。
  9. 【請求項9】 前記検索キーワードおよび/または参照
    文書IDを時間区分とともに抽出する手段は、さらに、
    出現回数が特定の条件を満たす検索キーワードおよび/
    または参照文書IDのみを抽出する、請求項8に記載の
    検索ログ解析装置。
  10. 【請求項10】 利用者から文書の検索要求または参照
    要求を受け付け、検索対象または参照対象の文書が格納
    されている文書情報データベースから該要求の文書を抽
    出し、前記利用者に返す文書情報検索装置において、 前記検索要求を受け付けると検索キーワードと検索時間
    を含む検索要求情報を、前記参照要求を受け付けると参
    照文書IDと参照時間を含む参照要求情報を検索ログデ
    ータベースに記録する手段と、 前記検索要求をもとに前記文書情報データベースから抽
    出された文書を、過去に行われた検索要求および/また
    は参照要求の検索キーワードおよび/または参照文書I
    Dが記録されている検索ログデータベースから他の時間
    区分に比べて出現回数が多い特定の時間区分を有する検
    索キーワードおよび/または参照文書IDを抽出し保存
    した時間区分別要求情報データベースに基づいて順位付
    けする手段と、 順位付けされた文書を順位の高い順に前記利用者に提供
    する手段を有することを特徴とする文書情報検索装置。
  11. 【請求項11】 前記順位付けする手段は、 前記時間区分別要求情報データベースから、検索が行わ
    れた時刻に対応する時間区分の検索キーワードを抽出す
    る手段と、 抽出された検索キーワードが前記文書情報データベース
    から抽出された各文書に含まれる個数を計算する手段
    と、 各文書に含まれる該検索キーワードの個数から各文書の
    得点を計算する手段と、 計算された得点をもとに前記文書の順位付けを行う手段
    を含む、請求項10に記載の文書情報検索装置。
  12. 【請求項12】 前記順位付けする手段は、 前記時間区分別要求情報データベースから、検索が行わ
    れた時刻に対応する時間区分の検索キーワードを抽出す
    る手段と、 抽出された検索キーワードのうち、前記検索要求に含ま
    れる検索キーワードと関連性のある検索キーワードを抽
    出する手段と、 抽出された後者の各検索キーワードが、前記文書情報デ
    ータベースから抽出された各文書に含まれる個数を計算
    する手段と、 各文書に含まれる該検索キーワードの個数から各文書の
    得点を計算する手段と、 計算された得点をもとに前記文書の順位付けを行う手段
    を含む、請求項10に記載の文書情報検索装置。
  13. 【請求項13】 前記順位付けする手段は、 前記時間区分別要求情報データベースから、検索が行わ
    れた時刻に対応する時間区分の参照文書IDを抽出する
    手段と、 前記文書情報データベースから抽出された各文書の得点
    を、抽出された文書IDの参照回数をもとに計算する手
    段と、 計算された得点をもとに前記の順位付けを行う手段を含
    む、請求項10に記載の文書情報検索装置。
  14. 【請求項14】 前記順位付けする手段は、 前記時間区分別要求情報データベースから、検索が行わ
    れた時刻に対応する時間区分の検索キーワードを抽出す
    る手段と、 該検索キーワードが前記文書情報データベースから抽出
    された各文書に含まれる個数を計算する手段と、 各文書に含まれる該検索キーワードの個数から各文書の
    得点を計算する手段と、 前記時間区分別要求情報データベースから、検索が行わ
    れた時刻に対応する時間区分の参照文書IDを抽出する
    手段と、 前記文書情報データベースから抽出された各文書の得点
    を、抽出された文書IDの参照回数をもとに計算する手
    段と、 3番目の手段で計算された得点と5番目の手段で計算さ
    れた得点を文書ごとに加算する手段と、 加算された得点をもとに前記文書の順位付けを行う手段
    を含む、請求項10に記載の文書情報検索装置。
  15. 【請求項15】 請求項1または2に記載の方法をコン
    ピュータに実行させる検索ログ解析プログラム。
  16. 【請求項16】 請求項3から7のいずれか1項に記載
    の方法をコンピュータに実行させる文書情報検索プログ
    ラム。
  17. 【請求項17】 請求項1または2に記載の方法をコン
    ピュータに実行させる検索ログ解析プログラムを記録し
    た、コンピュータで読み取りが可能な記録媒体。
  18. 【請求項18】 請求項1から6のいずれか1項に記載
    の方法をコンピュータに実行させる文書情報検索プログ
    ラムを記録した、コンピュータで読み取りが可能な記録
    媒体。
JP2001371550A 2001-12-05 2001-12-05 検索ログ解析方法および装置、文書情報検索方法および装置、検索ログ解析プログラム、文書情報検索プログラム、および記録媒体 Pending JP2003173352A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001371550A JP2003173352A (ja) 2001-12-05 2001-12-05 検索ログ解析方法および装置、文書情報検索方法および装置、検索ログ解析プログラム、文書情報検索プログラム、および記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001371550A JP2003173352A (ja) 2001-12-05 2001-12-05 検索ログ解析方法および装置、文書情報検索方法および装置、検索ログ解析プログラム、文書情報検索プログラム、および記録媒体

Publications (1)

Publication Number Publication Date
JP2003173352A true JP2003173352A (ja) 2003-06-20

Family

ID=19180577

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001371550A Pending JP2003173352A (ja) 2001-12-05 2001-12-05 検索ログ解析方法および装置、文書情報検索方法および装置、検索ログ解析プログラム、文書情報検索プログラム、および記録媒体

Country Status (1)

Country Link
JP (1) JP2003173352A (ja)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005085285A (ja) * 2003-09-10 2005-03-31 Microsoft Corp ペンベースのコンピューティングシステムでの注釈の管理
JP2006323790A (ja) * 2005-05-20 2006-11-30 Navitime Japan Co Ltd Poi情報提供システム、poi情報提供方法、情報配信サーバ、端末装置
JP2007034466A (ja) * 2005-07-25 2007-02-08 Yafoo Japan Corp 情報検索システム、情報検索プログラム
JP2007256992A (ja) * 2006-03-20 2007-10-04 Nifty Corp コンテンツ特定方法及び装置
JP2009301540A (ja) * 2008-05-16 2009-12-24 Ntt Docomo Inc 情報検索装置及び情報検索方法
JP2010055494A (ja) * 2008-08-29 2010-03-11 Oki Electric Ind Co Ltd 検索分析サーバ装置及び検索分析方法
JP2010067011A (ja) * 2008-09-11 2010-03-25 Fujitsu Ltd 文書群検出方法及び文書群検出装置
JP2011085992A (ja) * 2009-10-13 2011-04-28 Nippon Telegr & Teleph Corp <Ntt> 文書検索装置、文書検索方法、文書検索プログラム
JP2011141838A (ja) * 2010-01-08 2011-07-21 Fujitsu Ltd 情報処理装置、情報処理プログラム、及び、情報処理方法
US8478822B2 (en) 2007-10-15 2013-07-02 Samsung Electronics Co., Ltd. Device and method of sharing contents based on time synchronization
WO2017143703A1 (zh) * 2016-02-24 2017-08-31 百度在线网络技术(北京)有限公司 线下资源的挖掘方法和装置
US10191940B2 (en) 2007-09-04 2019-01-29 Microsoft Technology Licensing, Llc Gesture-based searching
JP2020205014A (ja) * 2019-06-19 2020-12-24 レクシスノア株式会社 サーバ

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005085285A (ja) * 2003-09-10 2005-03-31 Microsoft Corp ペンベースのコンピューティングシステムでの注釈の管理
JP2006323790A (ja) * 2005-05-20 2006-11-30 Navitime Japan Co Ltd Poi情報提供システム、poi情報提供方法、情報配信サーバ、端末装置
JP2007034466A (ja) * 2005-07-25 2007-02-08 Yafoo Japan Corp 情報検索システム、情報検索プログラム
JP2007256992A (ja) * 2006-03-20 2007-10-04 Nifty Corp コンテンツ特定方法及び装置
US10191940B2 (en) 2007-09-04 2019-01-29 Microsoft Technology Licensing, Llc Gesture-based searching
US8478822B2 (en) 2007-10-15 2013-07-02 Samsung Electronics Co., Ltd. Device and method of sharing contents based on time synchronization
JP2009301540A (ja) * 2008-05-16 2009-12-24 Ntt Docomo Inc 情報検索装置及び情報検索方法
JP2010055494A (ja) * 2008-08-29 2010-03-11 Oki Electric Ind Co Ltd 検索分析サーバ装置及び検索分析方法
JP2010067011A (ja) * 2008-09-11 2010-03-25 Fujitsu Ltd 文書群検出方法及び文書群検出装置
JP2011085992A (ja) * 2009-10-13 2011-04-28 Nippon Telegr & Teleph Corp <Ntt> 文書検索装置、文書検索方法、文書検索プログラム
JP2011141838A (ja) * 2010-01-08 2011-07-21 Fujitsu Ltd 情報処理装置、情報処理プログラム、及び、情報処理方法
WO2017143703A1 (zh) * 2016-02-24 2017-08-31 百度在线网络技术(北京)有限公司 线下资源的挖掘方法和装置
US11416502B2 (en) 2016-02-24 2022-08-16 Baidu Online Network Technology (Beijing) Co., Ltd. Method and apparatus for mining offline resources
JP2020205014A (ja) * 2019-06-19 2020-12-24 レクシスノア株式会社 サーバ

Similar Documents

Publication Publication Date Title
US7636714B1 (en) Determining query term synonyms within query context
CN113711207B (zh) 用于改进的搜索查询相关性的无监督实体和意图标识
US8856145B2 (en) System and method for determining concepts in a content item using context
US6389412B1 (en) Method and system for constructing integrated metadata
US9576029B2 (en) Trust propagation through both explicit and implicit social networks
US7836083B2 (en) Intelligent search and retrieval system and method
US7890485B2 (en) Knowledge management tool
US5717914A (en) Method for categorizing documents into subjects using relevance normalization for documents retrieved from an information retrieval system in response to a query
KR100304335B1 (ko) 키워드 추출 시스템 및 그를 사용한 문서 검색 시스템
US5742816A (en) Method and apparatus for identifying textual documents and multi-mediafiles corresponding to a search topic
US8429176B2 (en) Extending media annotations using collective knowledge
US20130144834A1 (en) Uniform resource locator canonicalization
US20110264658A1 (en) Web object retrieval based on a language model
WO2002101588A1 (fr) Systeme de gestion de contenus
JP2008181186A (ja) クエリーログを利用したキーワードとサイトの関連度を求める方法
JP2011154467A (ja) 検索結果順位付け方法および検索結果順位付けシステム
JP2003173352A (ja) 検索ログ解析方法および装置、文書情報検索方法および装置、検索ログ解析プログラム、文書情報検索プログラム、および記録媒体
KR20040017008A (ko) 검색엔진을 활용한 정보 제공 시스템 및 그 방법
JP5226241B2 (ja) タグを付与する方法
Jepsen et al. Characteristics of scientific Web publications: Preliminary data gathering and analysis
US20020095404A1 (en) Automatic method for quantifying the relevance of intra-document search results
US9183297B1 (en) Method and apparatus for generating lexical synonyms for query terms
JP3547074B2 (ja) データ検索方法、その装置および記録媒体
US20020062341A1 (en) Interested article serving system and interested article serving method
JP2010055164A (ja) 文章検索装置、文章検索方法、文章検索プログラムおよびその記録媒体

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20050610

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070201

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070207

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070402

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20070516