JP2005309760A - 検索語ランキング算出方法及び装置及びプログラム - Google Patents

検索語ランキング算出方法及び装置及びプログラム Download PDF

Info

Publication number
JP2005309760A
JP2005309760A JP2004125747A JP2004125747A JP2005309760A JP 2005309760 A JP2005309760 A JP 2005309760A JP 2004125747 A JP2004125747 A JP 2004125747A JP 2004125747 A JP2004125747 A JP 2004125747A JP 2005309760 A JP2005309760 A JP 2005309760A
Authority
JP
Japan
Prior art keywords
ranking
search
period
search word
calculating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004125747A
Other languages
English (en)
Inventor
Jidai Ohashi
二大 大橋
Harumi Kawashima
晴美 川島
Yoshihide Sato
吉秀 佐藤
Masakatsu Okubo
雅且 大久保
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2004125747A priority Critical patent/JP2005309760A/ja
Publication of JP2005309760A publication Critical patent/JP2005309760A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 従来の検索語ランキング方法ではランキング上位に出現しなかった、近い将来入力頻度が上昇するであろうと予測できる検索語を、ランキング上位に出現させる。
【解決手段】 本発明は、従来の一定期間内における単語の入力頻度に加え、長時間出現し続ける単語よりも新しく出現したランキング評価値が高くなる(上位にランキングされる)よう単語の出現期間における重み付けを実施し、さらに、最近入力頻度が増加傾向にある検索語、即ち、これから話題となるであろうと推測できる検索語ほど、ランキング評価値が高くなるよう重み付けを実施する。
【選択図】 図1

Description

本発明は、検索語ランキング算出方法及び装置及びプログラムに係り、特に、インターネット等のネットワークに接続された1つ以上の情報提供サーバ上で公開されているキーワード検索サイトから収集した検索語のランキングを算出する検索語のランキング算出方法及び装置及びプログラムに関する。
従来、インターネットなどのネットワーク上で公開されているコンテンツを検索する手段として、キーワード検索が利用されている。検索サイトの利用者によって入力された検索語自体が利用者のニーズを表しているものとみなし、これをトレンドの指標として、入力された検索語別の入力回数を1週間単位で集計し、ランキング付けし、ランキング上位の検索語を一般の利用者へ提供する技術がある(例えば、非特許文献1参照)。
http://www.infoseek.co.jp/Keyword?pg-ranking.html
しかしながら、トレンドとは、経済変動の長期的動向や、ファッションの動向といった世の中の事象の動向であり、時代を反映したものであるにもかかわらず、入力頻度のみをトレンドの指標として用い、入力頻度の高い検索語を上位にランキングする前述した従来技術では、図9に示すように、検索語ランキングの上位の検索語は常に同じ単語が連続して出現してしまうことが多く、必ずしも時代を反映しているとはいえない。
本発明は、上記の点に鑑みなされたもので、従来の検索語ランキング方法ではランキング上位に出現しなかった、入力頻度が上昇し始めたばかりの検索語を、ランキング上位に出現させることができる検索語のランキング算出方法及び装置及びプログラムを提供することを目的とする。
図1は、本発明の原理を説明するための図である。
本発明は、一定期間における検索語のランキングを算出する検索語ランキング算出方法において、
検索語、該検索語の入力時刻、該検索語の入力者を特定する利用者識別情報からなる検索ログ情報が格納されている記憶手段から読み出す読み出しステップ(ステップ1)と、
読み出した検索ログ情報の検索語、検索語の入力時刻、利用者識別情報を利用し、ランキング評価期間中に出現している検索語Kの該ランキング評価期間と該ランキング評価期間から過去に遡る連続したN期間中(Nは自然数)の各期間内に入力された全検索語への入力者数Uと、当該ランキング評価期間中に出現している検索語の各期間における入力者数u(K)を集計し、各期間における検索語Kの利用率UR(K)=u(K)/Uを算出する利用率算出ステップ(ステップ2)と、
検索語Kの過去N期間での平均利用率Ave_UR(K)を算出する平均利用率算出ステップ(ステップ3)と、
隣接する期間毎に検索語別の利用率の差分△UR(K)、を算出する利用率差分算出ステップ(ステップ4)と、
過去N期間での検索語Kの平均利用率Ave_UR(K)に応じた重み係数W(K)を算出する重み係数算出ステップ(ステップ5)と、
利用率算出ステップで算出したランキング評価期間での利用率UR(K)、利用率差分算出ステップで算出した平均利用率△UR(K)、重み算出ステップで算出した重み係数W(K)の3つの値から検索語Kの総合ランキング値を算出する総合ランキング評価値算出ステップ(ステップ6)と、
ランキング評価期間、該ランキング評価期間内に出現する検索語Kと該検索語Kの総合ランキング評価値からなるランキング情報を生成するランキング情報生成ステップ(ステップ7)と、
生成した検索語のランキング情報の総合ランキング評価値を記憶手段に記憶するランキング情報書き出しステップ(ステップ8)と、からなる。
図2は、本発明の原理構成図である。
本発明は、一定期間における検索語のランキングを算出する検索語ランキング算出装置であって、
検索語、該検索語の入力時刻、該検索語の入力者を特定する利用者識別情報からなる検索ログ情報が格納されている検索ログ情報記憶手段1と、
検索ログ情報記憶手段1から検索ログ情報を読み出す検索ログ情報読み出し手段3と、
読み出した検索ログ情報の検索語、検索語の入力時刻、利用者識別情報を利用し、ランキング評価期間中に出現している検索語Kの該ランキング評価期間と該ランキング評価期間から過去に遡る連続したN期間中(Nは自然数)の各期間内に入力された全検索語への入力者数Uと、当該ランキング評価期間中に出現している検索語の各期間における入力者数u(K)を集計する利用集計手段4と、
ランキング評価期間と該ランキング評価期間から過去に遡る連続したN期間の各期間での検索語別の利用率UR(K)=u(K)/Uを算出する利用率算出手段5と、
検索語Kの過去N期間での平均利用率Ave_UR(K)を算出する平均利用率算出手段6と、
隣接する期間毎に検索語別の利用率の差分△UR(K)、を算出する利用率差分算出手段7と、
過去N期間での検索語Kの平均利用率Ave_UR(K)に応じた重み係数W(K)を算出する重み係数算出手段8と、
利用率算出手段5で算出したランキング評価期間での利用率UR(K)、利用率差分算出手段7で算出した平均利用率△UR(K)、重み係数算出手段8で算出した重み係数W(K)の3つの値から検索語Kの総合ランキング値を算出する総合ランキング評価値算出手段9と、
ランキング評価期間、該ランキング評価期間内に出現する検索語Kと該検索語Kの総合ランキング評価値からなるランキング情報を生成するランキング情報生成手段10と、
生成した検索語のランキング情報の総合ランキング評価値をランキング情報記憶手段12に記憶するランキング情報書き出し手段11と、を有する。
上述のように、本発明では、検索語を用いたトレンドを算出する際の検索語ランキング方法として、従来の一定期間内における単語の入力頻度に加え、長時間出現し続ける単語よりも新しく出現したランキング評価値が高くなる(上位にランキングされる)よう単語の出現期間における重み付けを実施し、さらに、最近の入力頻度が増加傾向にある検索語、即ち、これから話題となるであろうと推測できる検索語ほど、ランキング評価値が高くなるよう重み付けを実施することにより、時代を反映したトレンド情報を提供する。
つまり、検索語のランキング値(順位ではなく評価値)を定めるにあたり、検索語Kの利用率(評価期間におけるその検索語Kを利用した人の割合)が大きいほどランキング値をよくする。これは、全体の利用回数の影響をなくす意味で、利用頻度(絶対値)ではない。また、検索語Kが過去に遡っても多数利用されていれば、ランキング値を下げる。これにより、日常茶飯事に利用される検索語の評価を下げることが可能となる。また、直前の期間の利用率との差分が大きいほどランキング値を上げる。これにより、最近利用が増えた検索語の評価を上げることが可能となる。
上記から、従来の検索語ランキング方法では、ランキング上位に出現しなかった、近い将来入力頻度が上昇するであろうと予測できる検索語を、ランキング上位に出現させることができるため、従来のランキング評価方法では実現されていなかった時代を反映したトレンド情報を提供することができる。
以下、図面と共に本発明の実施の形態を説明する。
本実施の形態では、インターネット上の一つ以上のキーワード検索サイトにて入力された検索語に対して、ランキング評価期間を直近の一定期間Term_0とし、Term_0内に入力された検索語に対し、入力頻度と検索語の出現期間、入力頻度の変動度合を考慮したランキング評価式により、検索語のランキング評価を実施する。
図3は、本発明の一実施の形態における検索語ランキング装置の構成を示す。
同図に示す検索語ランキング装置102は、インターネット上の一つ以上のキーワード検索サイトにて入力された検索語K、検索語入力時刻Time、検索語を入力した利用者を特定する利用者識別情報UIDからなる検索語ログ情報を日別のファイル形式で記憶しておくための検索ログ情報DB101と、当該検索語ランキング装置102により生成された各検索語のランキング情報として集計期間Term、検索語K、総合ランキング評価値Rank(K)を日別のファイル形式で記憶しておくランキング情報DB111とに接続されている。図4に検索ログ情報DB101のデータの例を、図5にランキング情報DB112のデータの例を示す。
ここで、入力者を特定するための情報としては、Cookieが一例として挙げられるが、これ以外にも入力者または入力者が利用した端末を特定するための識別情報であればどれでもよい。
検索語ランキング装置102は、検索ログ読み出し部103、利用者集計部104、利用率算出部105、平均利用率算出部106、利用率差分算出部107、重み係数算出部108、総合ランキング評価値算出部109、ランキング情報生成部110、及びランキング情報書き出し部111から構成される。
利用者集計部104は、検索ログ読み出し部103により検索ログ情報記憶装置101から読み出した検索語、検索語入力時刻、利用者識別情報を利用し、ランキング評価期間中に出現する検索語Kのランキング評価期間と当該ランキング評価期間から過去に遡る連続したN期間の各期間内に入力された全検索語への入力者数Uと、当該ランキング評価期間中に出現している検索語の各期間における入力者数u(K)を集計する。
利用率算出部105は、当該ランキング評価期間とランキング評価期間から過去に遡る連続したN期間中の各期間での検索語別の利用率UR(K)=u(K)/Uを算出する。
平均利用率算出部106は、検索語Kの過去N期間での平均利用率Ave_UR(K)を算出する。
利用率差分算出部107は、隣接する期間毎に検索語別の利用率の差分△UR(K)を算出する。
重み係数算出部108は、過去N期間での検索語Kの平均利用率Ave_UR(K)に応じた重み係数W(K)を算出する。
総合ランキング評価値算出部109は、利用率算出部105にて算出したランキング評価期間での利用率UR(K)、利用率差分算出部107にて算出した利用率の差分△UR(K)、重み係数算出部108にて算出したW(K)の3つの値から検索語Kの総合ランキング値を算出する。
ランキング情報生成部110は、ランキング評価期間、ランキング評価期間内に出現する検索語KとKの総合ランキング評価値からなるランキング情報を生成する。
ランキング情報書き出し部111は、生成した検索語のランキング情報の総合ランキング評価値をランキング情報記憶装置112に記憶させる。
以下、上記の構成における動作を詳細に説明する。
図6は、本発明の一実施の形態におけるランキング評価値算出処理のフローチャートである。
ステップ101) 検索ログ読み出し部103は、検索ログ情報記憶装置101から、ランキング評価期間Term_0及び、ランキング評価期間Term_0から過去に遡る連続したN期間Term_N(Nは自然数)分に該当する期間の検索語、検索入力時刻、Time、利用者識別情報UIDを読み込む。
ステップ102) 読み込んだ検索ログ情報は、利用者集計処理部104にて、Term_i(i=0〜N)期間毎に入力された全検索語への入力者数U(Term_i)(i=0〜N)と、ランキング評価期間Term_0とTerm_0から過去に遡る連続したN期間の各期間Term_n(n=1〜N)における検索語Kへの入力者数u(Term_i)を(i=1〜N)を算出する。
ステップ103) ステップ102の処理が終了すると、利用率算出部105にて、式(1)を利用して、Term_i(i=0〜N)毎の検索語K別の利用率UR(Term_i,K)(i=0〜N)を算出する。
Figure 2005309760
ステップ104) ステップ103の処理後、平均利用率算出部106にてランキング評価期間Term_0直前の連続したN期間Term_n(n=1〜N)での検索語Kの平均利用率Ave_UR(K)を算出する。
ステップ105) ステップ104の処理後、利用率差分算出部107にて式(2)を利用して、ランキング評価期間Term_0とその1期間前Term_1とのTerm_0に出現する検索語別の利用率の差分△UR(K)を算出する。
△UR(K)=△UR(Term_0,K)−△UR(Term_1,K) (2)
なお、本実施の形態では、利用率の変動度を表す指標として、過去1期間前と利用率の差分を用いているが、これに限定するものではなく、例えば、他には、過去N期間における利用率の平均変化率や、回帰直線の傾き等を利用してもよい。
ステップ106) ステップ105の処理後、重み係数算出部108にて、総合ランキング評価算出時に用いる検索語別の重み係数W(K)の算出を行う。この重み係数W(K)は、平均利用率算出部106にて算出された平均利用率Ave_UR(K)によって変動し、ランキング評価期間Term_0直前の連続した期間において数多く利用されている検索語ほど重み係数の値が小さくなるようにしてある。こうすることにより、従来技術の入力頻度のみでのランキング上位に出現する日常的に出現し続ける一般的な検索語(図9の「無料」や「攻略」といった語彙)のランキング評価値を低くすることができる。
この重み係数W(K)としては、例えば、検索語Kの過去の平均利用率Ave_UR(K)を式(3)の指数関数に代入することにより求める。
Figure 2005309760
(但し、A:A>1の定数)
ステップ107) 重み係数算出部108での処理後、総合ランキング評価値算出部109にて、検索語別の総合ランキング評価値Rank(K)を算出する。Rank(K)は、ランキング評価期間での検索語Kの利用度合を表す利用率UR(K)と、日常的に比較的多数の利用者が入力するような一般的な検索語の総合ランキング評価値を下げる作用を持つ利用率平均による重み係数W(K)と、急激に利用者が興味・関心を持ち始めてきた検索語ほど、総合ランキング評価値が上昇するように作用するような値を持つ利用率の差分△UR(K)の関数G(△UR(K))とを利用して、総合ランキング評価値Rank(K)を算出する。
例えば、関数G(△UR(K))には、図7に示すような式(4)で表わされるシグモイド関数を採用する場合がある。
Figure 2005309760
(但し、Tは、正の定数)
また、Rank(K)の算出式として、例えば、式(1)のランキング評価期間Term_0でのUR(Term_0,K)と式(3)のW(K)と、式(4)のG(△UR(K))の積で表すことができる。
Figure 2005309760
(但し、A:A>1の定数、Tは正の定数)
上記の式(5)の有効性を説明するために、以下の通りモデルケースを考える。
日常的に多数入力される検索語をキーワードA、最近入力回数が単調減少している検索語をキーワードB、最近入力回数が単調増加している検索語をキーワードCとする。
それぞれ、過去4期間における利用率URの値は図8に示すとおりである。
今、式(5)を用いてA=2,T=1とすると、それぞれの総合ランキング評価値Rankは、次の表の通りとなる。
Figure 2005309760
この結果により、急激に利用者が興味・関心を持ち始めてきた検索語(キーワードC)が、日常的に多数入力されている検索語(キーワードA)よりもランキングが上位になっていることがわかる。
即ち、本実施の形態における総合ランキング値を用いることにより、日常的に多数の利用者によって入力されている検索語よりも、ある程度利用率が大きくなってきており、これから利用者の興味・関心を集めるであろうと考えられる検索語をランキング上位にすることができる。
ステップ108) ステップ107の処理が終了すると、ランキング情報生成部110は、算出した検索語別の総合ランキング評価値の大きな順にソートし、ソートした検索語に順位付けを行い、順位情報と検索語、ランキング評価期間をランキング情報としてファイル(図示せず)に書き出す。
ステップ109) ステップ108の処理が終了すると、ランキング情報書き出し部111が、ファイルとして書き出されたランキング情報をランキング情報記憶装置112へ書き込むことで検索語のランキング評価処理が終了する。
なお、上記のステップ101〜109の動作をプログラムとして構築し、検索語ランキング装置として利用されるコンピュータにインストールし、CPU等の制御手段により実行させる、または、ネットワークを介してインストールすることも可能である。
また、構築されたプログラムを検索語ランキング装置として利用されるコンピュータに接続されるハードディスクや、フレキシブルディスク、CD−ROM等の可搬記憶媒体に格納しておき、コンピュータにインストールして実行させることも可能である。
なお、本発明は、上記の実施の形態及び実施例に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。
本発明は、情報処理分野において、インターネット等のネットワークに接続された情報提供サーバで公開されているキーワード検索サイトから検索語を収集する技術に適応可能である。
本発明の原理を説明するための図である。 本発明の原理構成図である。 本発明の一実施の形態における検索語ランキング装置の構成図である。 本発明の一実施の形態における検索ログ情報DB内でのデータ情報の例である。 本発明の一実施の形態におけるランキング情報DB内でのデータ情報の例である。 本発明の一実施の形態におけるランキング評価値算出処理のフローチャートである。 本発明の一実施の形態における重み係数算出部で用いるシグモイド関数を示す図である。 本発明の一実施の形態におけるサンプルデータである。 従来技術における1ヶ月間での検索語ランキングである。
符号の説明
1 検索ログ情報記憶手段
2 検索語ランキング装置
3 検索ログ読み出し手段
4 利用者集計手段
5 利用率算出手段
6 平均利用率算出手段
7 利用率差分算出手段
8 重み係数算出手段
9 総合ランキング評価値算出手段
10 ランキング情報生成手段
11 ランキング情報書き出し手段
12 ランキング情報記憶手段
101 検索ログ情報記憶装置
102 検索語ランキング装置
103 検索ログ読み出し部
104 利用者集計部
105 利用率算出部
106 平均利用率算出部
107 利用率差分算出部
108 重み係数算出部
109 総合ランキング評価値算出部
110 ランキング情報生成部
111 ランキング情報書き出し部
112 ランキング情報記憶装置

Claims (15)

  1. 一定期間における検索語のランキングを算出する検索語ランキング算出方法において、
    検索ログ情報が格納されている記憶手段から検索ログ情報を読み出すステップと、
    読み出した前記検索ログ情報を利用して、ランキング評価期間中に出現する検索語をKとし、該検索語Kの利用が多いほど、ランキング評価値を上げる第1の値を定めるステップと、
    前記検索語Kが過去に遡って多数利用されているほど、ランキング評価値を下げる第2の値を定めるステップと、
    前記検索語Kの最近の利用が多いほど、ランキング評価値を上げる第3の値を定めるステップと、
    前記第1、第2、第3の値により、前記検索語Kの総合ランキングを定めるステップと、
    からなることを特徴とする検索語ランキング算出方法。
  2. 前記検索ログ情報は、検索語、該検索語の入力時刻、該検索語の入力者を特定する利用者識別情報からなり、
    前記第1の値は、前記検索ログ情報を利用し、各期間内に入力された全検索語への入力者数Uと各検索語Kの入力者数u(K)を定め、u(K)をUで除した値u(K)/U(以下、利用率と記す)とする請求項1記載の検索語ランキング算出方法。
  3. 前記第2の値は、指数関数により算出される値である請求項1または、2記載の検索語ランキング算出方法。
  4. 前記第3の値は、シグモイド関数により算出される値である請求項1乃至3記載の検索語ランキング算出方法。
  5. 前記ランキング評価期間を含まない該ランキング評価期間直前の連続したN期間での、前記検索語Kの各期間における平均利用率を求め、該平均利用率を前記指数関数の入力値とする請求項3記載の検索語ランキング算出方法。
  6. 直前の期間との利用率の差分△URを求め、△URを前記シグモイド関数の入力値とする請求項4記載の検索語ランキング算出方法。
  7. 一定期間における検索語のランキングを算出する検索語ランキング算出方法において、
    検索語、該検索語の入力時刻、該検索語の入力者を特定する利用者識別情報からなる検索ログ情報が格納されている記憶手段から読み出す読み出しステップと、
    読み出した前記検索ログ情報の前記検索語、前記検索語の入力時刻、前記利用者識別情報を利用し、ランキング評価期間中に出現している検索語Kの該ランキング評価期間と該ランキング評価期間から過去に遡る連続したN期間中(Nは自然数)の各期間内に入力された全検索語への入力者数Uと、当該ランキング評価期間中に出現している検索語の各期間における入力者数u(K)を集計し、各期間における検索語Kの利用率UR(K)=u(K)/Uを算出する利用率算出ステップと、
    前記検索語Kの過去N期間での平均利用率Ave_UR(K)を算出する平均利用率算出ステップと、
    隣接する期間毎に検索語別の利用率の差分△UR(K)、を算出する利用率差分算出ステップと、
    過去N期間での前記検索語Kの平均利用率Ave_UR(K)に応じた重み係数W(K)を算出する重み係数算出ステップと、
    前記利用率算出ステップで算出した前記ランキング評価期間での前記利用率UR(K)、前記利用率差分算出ステップで算出した前記平均利用率△UR(K)、前記重み算出ステップで算出した前記重み係数W(K)の3つの値から検索語Kの総合ランキング値を算出する総合ランキング評価値算出ステップと、
    前記ランキング評価期間、該ランキング評価期間内に出現する検索語Kと該検索語Kの総合ランキング評価値からなるランキング情報を生成するランキング情報生成ステップと、
    生成した検索語の前記ランキング情報の総合ランキング評価値を記憶手段に記憶するランキング情報書き出しステップと、
    からなることを特徴とする検索語ランキング算出方法。
  8. 一定期間における検索語のランキングを算出する検索語ランキング算出装置であって、
    検索ログ情報が格納されている検索ログ情報記憶手段と、
    前記検索ログ記憶手段から検索ログ情報を読み出す手段と、
    読み出した前記検索ログ情報を利用して、ランキング評価期間中に出現する検索語をKとし、該検索語Kの利用が多いほど、ランキング評価値を上げる第1の値を定める手段と、
    前記検索語Kが過去に遡って多数利用されているほど、ランキング評価値を下げる第2の値を定める手段と、
    前記検索語Kの最近の利用が多いほど、ランキング評価値を上げる第3の値を定める手段と、
    前記第1、第2、第3の値により、前記検索語Kの総合ランキングを定める手段と、
    を有することを特徴とする検索語ランキング算出装置。
  9. 前記検索ログ情報は、検索語、該検索語の入力時刻、該検索語の入力者を特定する利用者識別情報からなり、
    前記第1の値は、前記検索ログ情報を利用し、各期間内に入力された全検索語への入力者数Uと各検索語Kの入力者数u(K)を定め、u(K)をUで除した値u(K)/U(以下、利用率と記す)とする請求項8記載の検索語ランキング算出装置。
  10. 前記第2の値は、指数関数により算出される値である請求項8または、9記載の検索語ランキング算出装置。
  11. 前記第3の値は、シグモイド関数により算出される値である請求項8乃至10記載の検索語ランキング算出装置。
  12. 前記ランキング評価期間を含まない該ランキング評価期間直前の連続したN期間での、前記検索語Kの各期間における平均利用率を求め、該平均利用率を前記指数関数の入力値とする手段を含む請求項10記載の検索語ランキング算出装置。
  13. 直前の期間との利用率の差分△URを求め、△URを上記シグモイド関数の入力値とする請求項11記載の検索語ランキング算出装置。
  14. 一定期間における検索語のランキングを算出する検索語ランキング算出装置であって、
    検索語、該検索語の入力時刻、該検索語の入力者を特定する利用者識別情報からなる検索ログ情報が格納されている検索ログ情報記憶手段と、
    前記検索ログ情報記憶手段から前記検索ログ情報を読み出す検索ログ情報読み出し手段と、
    読み出した前記検索ログ情報の前記検索語、前記検索語の入力時刻、前記利用者識別情報を利用し、ランキング評価期間中に出現している検索語Kの該ランキング評価期間と該ランキング評価期間から過去に遡る連続したN期間中(Nは自然数)の各期間内に入力された全検索語への入力者数Uと、当該ランキング評価期間中に出現している検索語の各期間における入力者数u(K)を集計する利用集計手段と、
    前記ランキング評価期間と該ランキング評価期間から過去に遡る連続したN期間の各期間での検索語別の利用率UR(K)=u(K)/Uを算出する利用率算出手段と、
    前記検索語Kの過去N期間での平均利用率Ave_UR(K)を算出する平均利用率算出手段と、
    隣接する期間毎に検索語別の利用率の差分△UR(K)、を算出する利用率差分算出手段と、
    過去N期間での前記検索語Kの平均利用率Ave_UR(K)に応じた重み係数W(K)を算出する重み係数算出手段と、
    前記利用率算出手段で算出した前記ランキング評価期間での前記利用率UR(K)、前記利用率差分算出手段で算出した前記平均利用率△UR(K)、前記重み係数算出手段で算出した前記重み係数W(K)の3つの値から検索語Kの総合ランキング値を算出する総合ランキング評価値算出手段と、
    前記ランキング評価期間、該ランキング評価期間内に出現する検索語Kと該検索語Kの総合ランキング評価値からなるランキング情報を生成するランキング情報生成手段と、
    生成した検索語の前記ランキング情報の総合ランキング評価値をランキング情報記憶手段に記憶するランキング情報書き出し手段と、
    を有することを特徴とする検索語ランキング算出装置。
  15. 一定期間における検索語のランキングを算出する検索語ランキング算出プログラムであって、
    コンピュータに、
    検索語、該検索語の入力時刻、該検索語の入力者を特定する利用者識別情報からなる検索ログ情報が格納されている記憶手段から読み出す読み出しステップと、
    読み出した前記検索ログ情報の前記検索語、前記検索語の入力時刻、前記利用者識別情報を利用し、ランキング評価期間中に出現している検索語Kの該ランキング評価期間と該ランキング評価期間から過去に遡る連続したN期間中(Nは自然数)の各期間内に入力された全検索語への入力者数Uと、当該ランキング評価期間中に出現している検索語の各期間における入力者数u(K)を集計し、各期間における検索語Kの利用率UR(K)=u(K)/Uを算出する利用率算出ステップと、
    前記検索語Kの過去N期間での平均利用率Ave_UR(K)を算出する平均利用率算出ステップと、
    隣接する期間毎に検索語別の利用率の差分△UR(K)、を算出する利用率差分算出ステップと、
    過去N期間での前記検索語Kの平均利用率Ave_UR(K)に応じた重み係数W(K)を算出する重み係数算出ステップと、
    前記利用率算出ステップで算出した前記ランキング評価期間での前記利用率UR(K)、前記利用率差分算出ステップで算出した前記平均利用率△UR(K)、前記重み算出ステップで算出した前記重み係数W(K)の3つの値から検索語Kの総合ランキング値を算出する総合ランキング評価値算出ステップと、
    前記ランキング評価期間、該ランキング評価期間内に出現する検索語Kと該検索語Kの総合ランキング評価値からなるランキング情報を生成するランキング情報生成ステップと、
    生成した検索語の前記ランキング情報の総合ランキング評価値を記憶手段に記憶するランキング情報書き出しステップと、
    を実行させることを特徴とする検索語ランキング算出プログラム。
JP2004125747A 2004-04-21 2004-04-21 検索語ランキング算出方法及び装置及びプログラム Pending JP2005309760A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004125747A JP2005309760A (ja) 2004-04-21 2004-04-21 検索語ランキング算出方法及び装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004125747A JP2005309760A (ja) 2004-04-21 2004-04-21 検索語ランキング算出方法及び装置及びプログラム

Publications (1)

Publication Number Publication Date
JP2005309760A true JP2005309760A (ja) 2005-11-04

Family

ID=35438480

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004125747A Pending JP2005309760A (ja) 2004-04-21 2004-04-21 検索語ランキング算出方法及び装置及びプログラム

Country Status (1)

Country Link
JP (1) JP2005309760A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008287210A (ja) * 2007-04-16 2008-11-27 Sony Corp 音声チャットシステム、情報処理装置、音声認識方法およびプログラム
JP2011227689A (ja) * 2010-04-20 2011-11-10 Yahoo Japan Corp 検索スコア算出装置及び方法
JP2011253506A (ja) * 2010-06-04 2011-12-15 Yahoo Japan Corp 関連バーストクエリ抽出装置及び方法
JP2013536519A (ja) * 2010-08-25 2013-09-19 オミクロン データ クオリティ ゲーエムべーハー 多数のデータレコードをサーチする方法及びサーチエンジン
US8620658B2 (en) 2007-04-16 2013-12-31 Sony Corporation Voice chat system, information processing apparatus, speech recognition method, keyword data electrode detection method, and program for speech recognition

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008287210A (ja) * 2007-04-16 2008-11-27 Sony Corp 音声チャットシステム、情報処理装置、音声認識方法およびプログラム
US8620658B2 (en) 2007-04-16 2013-12-31 Sony Corporation Voice chat system, information processing apparatus, speech recognition method, keyword data electrode detection method, and program for speech recognition
JP2011227689A (ja) * 2010-04-20 2011-11-10 Yahoo Japan Corp 検索スコア算出装置及び方法
JP2011253506A (ja) * 2010-06-04 2011-12-15 Yahoo Japan Corp 関連バーストクエリ抽出装置及び方法
JP2013536519A (ja) * 2010-08-25 2013-09-19 オミクロン データ クオリティ ゲーエムべーハー 多数のデータレコードをサーチする方法及びサーチエンジン

Similar Documents

Publication Publication Date Title
US20060179044A1 (en) Methods and apparatus for using life-context of a user to improve the organization of documents retrieved in response to a search query from that user
US8972394B1 (en) Generating a related set of documents for an initial set of documents
US20060136451A1 (en) Methods and systems for applying attention strength, activation scores and co-occurrence statistics in information management
CA2578513C (en) System and method for online information analysis
US9251249B2 (en) Entity summarization and comparison
KR20080086868A (ko) 컴퓨터, 하나 이상의 컴퓨터 판독가능 매체, 및 컴퓨터기반 방법
JP2007524172A (ja) 重要度情報を反映した検索結果リスト提供方法およびそのシステム
US11443005B2 (en) Unsupervised clustering of browser history using web navigational activities
JP4569380B2 (ja) ベクトル生成方法及び装置及びカテゴリ分類方法及び装置及びプログラム及びプログラムを格納したコンピュータ読み取り可能な記録媒体
CN111723260A (zh) 推荐内容的获取方法、装置、电子设备及可读存储介质
JP2018114232A (ja) 診断装置、プログラム及び診断システム
Arguello et al. Using query performance predictors to reduce spoken queries
JP5964149B2 (ja) 共起語を特定する装置およびプログラム
TWI480749B (zh) 識別有機搜索引擎優化機會之方法
JP2005309760A (ja) 検索語ランキング算出方法及び装置及びプログラム
JP2009211280A (ja) オンラインページ分析方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体
JP4948071B2 (ja) コンテンツ検索装置及びコンテンツ検索プログラム
JP2010277462A (ja) 行動推薦装置及び方法及びプログラム
JP5513929B2 (ja) 経験情報の再利用性評価装置及び方法及びプログラム
CN112802454B (zh) 一种唤醒词的推荐方法、装置、终端设备及存储介质
US20060136245A1 (en) Methods and systems for applying attention strength, activation scores and co-occurrence statistics in information management
JP6025796B2 (ja) 行動予測装置、行動予測方法及びプログラム
Tian et al. A prediction model for web search hit counts using word frequencies
Jiang et al. Context comparison of bursty events in web search and online media
Mizzaro et al. A context-aware retrieval system for mobile applications