JP5045194B2 - 検索キーワードの流行時期を提示する方法及び検索サーバ - Google Patents

検索キーワードの流行時期を提示する方法及び検索サーバ Download PDF

Info

Publication number
JP5045194B2
JP5045194B2 JP2007103227A JP2007103227A JP5045194B2 JP 5045194 B2 JP5045194 B2 JP 5045194B2 JP 2007103227 A JP2007103227 A JP 2007103227A JP 2007103227 A JP2007103227 A JP 2007103227A JP 5045194 B2 JP5045194 B2 JP 5045194B2
Authority
JP
Japan
Prior art keywords
information
search
keyword
section
client
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2007103227A
Other languages
English (en)
Other versions
JP2008262301A (ja
Inventor
竜馬 備瀬
修 中川
政樹 高田
光昭 森本
智洋 二本木
博和 笠原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dai Nippon Printing Co Ltd
Original Assignee
Dai Nippon Printing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dai Nippon Printing Co Ltd filed Critical Dai Nippon Printing Co Ltd
Priority to JP2007103227A priority Critical patent/JP5045194B2/ja
Publication of JP2008262301A publication Critical patent/JP2008262301A/ja
Application granted granted Critical
Publication of JP5045194B2 publication Critical patent/JP5045194B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、ユーザが指定した検索キーワードの流行時期を提示する技術分野に関する。
インターネット上の情報からユーザが所望する情報を検索するとき、ユーザは検索エンジンを利用することが一般的である。検索エンジンとは、インターネット上の情報を検索する機能を提供するサーバやシステムの総称で、ユーザは、検索エンジンの入力フォームに、一つまたは複数の検索キーワードを入力することで、検索キーワードに関連する情報の一覧である検索結果を検索エンジンから得ることができる。
検索エンジンから得られる検索結果においては、検索キーワードに関連する情報がランク付けされ、検索キーワードに関連する情報がランキング順に表示される。特許文献1の背景技術に記載されているように、有名な検索エンジンの一つであるGoogle(登録商標)では、検索キーワードの出現頻度やWebページのリンク構造に基づいてランク付けされる。
しかし、インターネット上には十数年にも渡り情報が公開されており、従来の検索エンジンでは、検索結果に時間的要素が考慮されていないため、検索キーワードに係わる最新の記事を得るのに苦労したり、逆に、検索キーワードに係わる古い記事を得るのに苦労することが多かった。
流行を提示する一つの発明として、インターネット上で公開されている文書情報の中で多く使用されている単語を抽出し、抽出した単語のカテゴリを用いて文書情報を分類し、同じカテゴリに含まれる文書情報の数を時系列でカウントすることで、指定期間において話題となったカテゴリを提示する発明が開示されている。
特表2007−505403号公報 特開平11−175530号公報
確かに、特許文献2で開示されている発明を利用することで、指定期間において話題となったカテゴリを提示することが可能になるが、ユーザが指定した検索キーワードが流行した時期に加え、検索キーワードが流行した理由を示す情報を提示することはできなかった。
そこで、本発明は、ユーザが指定した検索キーワードの流行時期と流行した理由を提示する方法及び、ユーザが指定した検索キーワードの流行時期と流行した理由を提示する検索サーバを提供することを目的とする。
上述した課題を解決する第1の発明は、インターネット上で公開されている文書情報とその更新日を収集している検索サーバが、検索キーワードの流行時期をクライアントに提示する方法であって、(a)前記検索サーバが、前記検索キーワードの流行時期の提示要求を前記クライアントから受信するステップ、(b)前記検索サーバが前記クライアントから提示要求を受けたときに受信した情報に従い前記検索キーワードの出現頻度の対象期間を決定するステップ、(c)前記検索サーバが、前記対象期間を細分化した区間ごとに、更新日が前記区間に含まれる前記文章情報を対象とし前記検索キーワードの出現頻度をカウントすることで、前記検索キーワードの出現頻度の時系列情報を生成するステップ、(d)前記検索サーバが、前記時系列情報から前記検索キーワードの出現頻度がピークとなるピーク間を検出し、更新日が前記ピーク区間に含まれる前記文書情報から、ピーク区間の共起回数を区間の共起平均で割った値を利用したTF−IDFを利用して、前記検索キーワードの関連キーワードを抽出するステップ、(e)前記検索サーバが、前記時系列情報をグラフ化したグラフ情報を生成し、前記クライアントに送信するステップ、が実行され、前記ステップ(e)で生成される前記グラフ情報においては、前記ピーク区間のラベルとして前記関連キーワードが表示されることを特徴とする方法である。
第1の発明によれば、前記検索キーワードの出現頻度をグラフ化することで、前記クライアントを操作するユーザは、前記検索キーワードが流行した時期を知り得ることができ、更に、前記ピーク期間のラベルとして前記検索キーワードの前記関連キーワードを表示することで、前記ピーク期間の近辺で前記検索キーワードが注目された理由を知り得ることができるようになる。
更に、第2の発明は、第1の発明に記載の方法であって、前記ステップ(a)において、前記検索サーバが、前記クライアントから前記検索キーワードを受信したとき、前記ステップ(b)において、前記検索サーバは、前記検索キーワードの流行時期の提示要求を受けた日付を基準として前記対象期間を決定することを特徴とする方法である。
第2の発明によれば、前記クライアントに表示されている前記グラフ情報の前記区間が選択された情報を受信したとき、選択された前記区間を基準とし、前記クライアントに表示されている前記グラフ情報の前記対象期間よりも短い期間を前記対象期間として決定することで、前記検索キーワードの流行時期を拡大した前記グラフ情報を提示することができる。
更に、第3の発明は、第1の発明に記載の方法であって、前記ステップ(a)において、前記検索サーバが、前記クライアントに表示されている前記グラフ情報の前記区間が選択された情報を受信したとき、前記ステップ(b)において、前記検索サーバは、選択された前記区間を基準とし、前記クライアントに表示されている前記グラフ情報の前記対象期間よりも短い期間を前記対象期間として決定し、前記ステップ(d)において、前記検索サーバは、前記選択された区間に含まれる関連キーワードをもとに、前記クライアントに表示させた前記関連キーワード以外の単語を前記関連キーワードとして抽出することを特徴とする方法である。
第3の発明によれば、前記ピーク区間が選択された前記グラフ情報で表示していた前記関連キーワード以外の単語を、新規に作成する前記グラフ情報に表示する前記関連キーワードとして抽出することで、前記検索キーワードが流行した理由をより詳細に提供することが可能になる。
更に、第4の発明は、検索キーワードの流行時期をクライアントに提示する検索サーバであって、インターネット上で公開されている文書情報とその更新日を収集する文書情報収集手段と、前記文書情報収集手段が収集した前記文書情報とその更新日をデータベースに記憶させる手段と、前記検索キーワードの流行時期の提示要求を前記クライアントから受けたときに、前記クライアント受信した情報に従い前記検索キーワードの出現頻度を表示する対象期間を決定し、前記対象期間から前記検索キーワードの出現頻度をカウントする区間を決定する期間決定手段と、前記データベースを参照し、前記区間ごとに、更新日が前記区間に含まれる前記文章情報を対象とし前記検索キーワードの出現頻度をカウントし、前記検索キーワードの出現頻度の時系列情報を生成する出現頻度カウント手段と、前記時系列情報から前記検索キーワードの出現頻度がピークとなるピーク間を検出するピーク区間検出手段と、前記データベースを参照し、更新日が前記ピーク区間に含まれる文書情報から、ピーク区間の共起回数を区間の共起平均で割った値を利用したTF−IDFを利用して、前記検索キーワードの関連キーワードを抽出する関連キーワード抽出手段と、前記時系列情報をグラフ化したグラフ情報を生成し、前記クライアントに送信するグラフ情報生成手段を備え、前記グラフ情報生成手段が生成する前記グラフ情報においては、前記ピーク区間のラベルとして前記関連キーワードが表示されることを特徴とする検索サーバである。
更に、第5の発明は、第4の発明に記載の検索サーバであって、前記検索サーバに備えられた期間決定手段は、前記クライアントから前記検索キーワードを示すテキスト情報を受信したとき、前記検索キーワードの流行時期の提示要求を受けた日付を基準として前記対象期間を決定し、前記クライアントに表示されている前記グラフ情報の前記区間が選択された情報を受信したとき、選択された前記区間を基準とし、前記クライアントに表示されている前記グラフ情報の前記対象期間よりも短い期間を前記対象期間として決定することを特徴とする検索サーバである。
更に、第6の発明は、第4の発明に記載の検索サーバであって、前記クライアントに表示されている前記グラフ情報の前記ピーク区間が選択された情報を受信したとき、前記検索サーバの前記関連キーワード抽出手段は、前記ピーク区間が選択された前記グラフ情報で表示していた前記関連キーワードを用いて、新規に作成する前記グラフ情報に表示する前記関連キーワードを抽出することを特徴とする検索サーバである。
上述した第4から第6の発明によれば、第1から第3の発明と同様の効果が得られる。
上述した本発明によれば、ユーザが指定した検索キーワードの流行時期と流行した理由を提示する方法及び、ユーザが指定した検索キーワードの流行時期と流行した理由を提示する検索サーバを提供することを目的とする。
ここから、本発明に係わる方法および検索サーバについて、図を参照しながら詳細に説明する。図1は、本発明に係わる検索サーバ1を配置したシステムを説明する図である。
図1のシステムは、本発明に係わる検索サーバ1と、ブログを運営しているブログサーバ3と、ブログサーバ3からブログ記事の更新通知pingが通知されるpingサーバ4と、ユーザが操作するクライアント2とが、インターネット5を介してそれぞれ接続されている。
ブログサーバ3では、大勢の人々がブログを開設し、個人的に興味がある出来事を記述したブログ記事をブログで公開している。ブログのブログ記事が更新されると、更新されたブログサイトのURLなどが記述された更新通知ping(weblogUpdates.ping)が、ブログサーバ3からpingサーバ4に送信され、pingサーバ4は、送信された更新通知pingを記憶するともに、インターネット5を利用して更新通知pingを提供している。
検索サーバ1は、pingサーバ4から得られる更新通知pingを利用し、更新されたブログ記事を特定し、インターネット5上で公開されている文書情報として、ブログサーバ3からブログ記事とその更新日を収集する。
そして、クラインと2から検索キーワードの流行時期の提示要求を検索サーバ1がクライアント2から受けると、収集したブログ記事を活用し、検索キーワードの流行時期を示す情報として、検索キーワードの出現頻度を時系列で示したグラフ(以下、出現頻度グラフ)を表示するためのグラフ情報を生成し、生成したグラフ情報をクライアント2に送信する。
図2は、クライアント2で表示される出現頻度グラフを説明する図である。図2では、出現頻度グラフは棒グラフで、棒グラフの横軸は時間軸で、縦軸は出現頻度(回数)である。出現頻度グラフには、区間ごとの検索キーワードの出現頻度に加え、出現頻度のピークと判定される区間(ピーク区間)には、ピーク区間で抽出された検索キーワードの関連キーワードがラベルとして表示される。
検索キーワードの出現頻度をグラフ化することで、クライアント2を操作するユーザは、検索キーワードが流行した時期を知り得ることができ、更に、ピーク期間のラベルとして関連キーワードを表示することで、ピーク期間の近辺で検索キーワードが注目された理由を知り得ることができる。
なお、図2で図示しているように、出現頻度のピーク期間は一つとは限らず、複数のピーク期間(図2では2つ)が抽出されるケースもある。複数のピーク期間が抽出されたときは、それぞれのピーク期間において関連キーワードが抽出され、それぞれのピーク期間に関連キーワードが表示される。
ここから、出現頻度グラフを表示するグラフ情報を生成する検索サーバ1について詳細に説明する。検索サーバ1についてより詳細に説明することで、本発明の内容がより明らかになる。
検索サーバはCPUを有し、CPUの処理に利用されるハードウェア資源として、RAM、ハードディスク、ネットワークインターフェースなどを備え、本発明に係わる検索サーバの機能は、検索サーバのハードウェア資源を利用したコンピュータプログラムで実現される。
図3は、図1で図示した検索サーバのブロック図である。検索サーバは、クライアント2と情報の入出力を行い、クライアント2ごとにセッションを管理するユーザインターフェース手段10(以下、UI手段10、UI: User Interface)と、ブログサーバ3で公開されているブログ記事を収集するブログ記事収集手段12と、収集したブログ記事を記憶するデータベース13と、データベース13に記憶されたブログ記事の中から、出現頻度グラフの作成に必要な情報を抽出する検索手段11を備えている。
ウェブサーバ1のブログ記事収集手段12は、ウェブサーバ1のビジネスロジック層の一つの機能で、ブログサーバ3で公開されているブログ記事とその更新日を収集し、収集したブログ記事とその更新日をデータベース13に記憶する手段である。
ブログ記事収集手段12は、pingサーバ4から更新通知pingを取得し、更新通知pingを取得するごとに、更新通知pingに記述されたURLで公開されているテキストデータ、例えば、ブログ記事のRSS(Really Simple Syndication, Rich Site Summary)やブログ記事の本文とその更新日を取得し、取得したテキストデータを自然言語処理(例えば、形態素解析)し、検索するときに利用するための索引情報(例えば、形態素解析によって抽出された単語から生成される文書ベクトル)を付加して、データベース13に記憶する。
図1で示したウェブサーバ1のUI手段10は、クライアント2から情報を取得する機能、クライアント2に表示情報を送信する機能を備えた情報入出力部100と、クライアントから受信した情報に従い出現頻度グラフの対象期間及び区間を決定する期間決定部101と、検索手段11から得られる検索結果に基づいて、クライアント2に送信するグラフ情報を生成するグラフ情報生成部102とを含む。
UI手段10の期間決定部101は、クライアント2から検索キーワードの流行時期の提示要求を受けたときに、情報入出力部100がクライアント2から取得した情報を解釈し、出現頻度グラフの対象期間及び区間を決定する。
クライアント2から取得した情報が、フォームに入力されたテキスト情報であるとき、UI手段10の期間決定部101はテキスト情報を検索キーワードとして解釈し、出現頻度グラフの対象期間の終了日を検索キーワードの取得日(或いは、その近傍の日付)とし、終了日から一定期間(図5では3年)前を開始日とする。
また、クライアント2から取得した情報が、出現頻度グラフがクライアント2で表示されている状態で、出現頻度グラフに含まれる区間が選択された情報であるとき、期間決定部101は、選択された区間を基準とし対象期間の開始日と終了日を決定する。例えば、選択された区間の前後の区間、或いは、選択された区間そのものを対象期間とする。
そして、UI手段10の期間決定部101は、対象期間を決定すると、決定した対象期間を定数で除算するなどして、決定した対象期間から出現頻度をカウントする区間を算出する。
対象期間と出現頻度が決定するとUI手段10は、検索キーワード、対象期間を特定する情報(ここでは、対象期間の開始日と終了日)及び区間を検索手段11に引渡し、検索キーワードの出現頻度の時系列情報の生成を検索手段11に要求する。
検索キーワードの出現頻度の時系列情報を生成する検索手段11は、検索キーワードの出現頻度をカウントする出現頻度カウント部110と、ピーク区間を検出するピーク区間検出部111と、検索キーワードの関連キーワードを抽出する関連キーワード抽出部112とを含む。
検索手段11の出現頻度カウント部110は、区間ごとに、更新日が区間内であるブログ記事を対象とし検索キーワードの出現頻度をカウントすることで、出現頻度の時系列情報を生成する。
検索手段11のピーク区間検出部111は、出現頻度カウント部が生成した時系列情報からピーク区間を検出する。出現頻度の時系列情報のピーク期間を検出する手法は様々な手法が知られているが、出現頻度の値や出現頻度の傾きの極性などが考慮されてピーク区間は検出される。
検索手段11の関連キーワード抽出部112は、データベース13を参照し、更新日がピーク区間に含まれるブログ記事で記述されている単語のそれぞれと検索キーワードの共起確率を求め、共起確率の高い単語を関連キーワードとして抽出する。なお、本発明は、検索手段11の関連キーワード抽出部112が関連キーワードを抽出する方式を特定するものではなく、検索手段11の関連キーワード抽出部112は、ピーク区間の共起回数を区間の共起平均で割った値を利用したTF−IDFを利用して関連キーワードを抽出してもよい。
検索手段11は、検索キーワードの出現頻度の時系列情報、ピーク区間及びピーク区間の関連キーワードをUI手段10のグラフ情報生成部102に引渡し、UI手段10のグラフ情報生成部102は引渡されたこれらの情報を用いて出現頻度グラフを表示するためのグラフ情報を生成し、生成されたグラフ情報は、UI手段10の情報入出力部100からクライアント2へと送信される。なお、UI手段10はクライアント2に送信したグラフ情報を、クライアント2とのセッションが終了するまで保持する。
図4は、検索サーバ1が生成するグラフ情報を説明する図で、図4(a)は、検索サーバ1が検索キーワードを受信したときに生成するグラフ情報で、図4(b)は、検索サーバ1が、区間が選択された情報を受信したときに生成するグラフ情報である。
図4(a)で図示したように、UI手段10の情報入力部100が検索キーワードを受信したとき、検索サーバ1は、検索キーワードの取得日(或いは、その近傍の日付)を対象期間の終了日とし、終了日から一定期間(図5では3年)前を対象期間の開始日とした出現頻度グラフを表示するグラフ情報を生成する。
図4(a)で図示した出現頻度グラフにおいて、ピーク区間と判定された区間には、ピーク区間内に更新されたブログ記事から抽出された関連キーワードがラベルとして表示され、更に、図4(a)においては、出現頻度グラフと共に、検索キーワードが記述された最新のブログ記事のリストを表示している。
出現頻度グラフと共にブログ記事を表示することで、クライアント2を操作するユーザは、検索キーワードの流行時期に加え、検索キーワードに係わるブログ記事を閲覧することができるようになる。
図4(b)は、図4(a)で示した矢印の区間が選択されたときのグラフ情報である。図4(b)に図示したように、図4(a)で図示した出現頻度グラフがクライアント2で表示され、表示された出現頻度グラフの区間(ここでは、矢印が示している区間)が選択されると、検索サーバ1は、選択された区間の前後の区間を対象期間とした出現頻度グラフを表示するグラフ情報を生成し、クライアント2に表示される出現頻度グラフは更新される。
なお、図4(a)で図示したように、クライアント2に表示されている出現頻度グラフのピーク区間が選択されたとき、UI手段10は、検索キーワード、対象期間を特定する情報(ここでは、対象期間の開始日と終了日)及び区間に加え、選択されたピーク区間のラベルとしている関連キーワード(ここでは、予選)を検索手段11に引渡し、検索手段11の関連キーワード抽出部112は、引渡された関連キーワード以外の単語を関連キーワードとして抽出する。
また、図(b)においては、出現頻度グラフと共に、選択された検索キーワードが記述され、更新日が選択された区間に含まれるブログ記事のリストが表示されている。
ここから、検索サーバ1が検索キーワードの流行時期を提示する手順について説明する。図5は、検索サーバ1が検索キーワードの流行時期を提示する手順を示したフロー図である。
検索サーバ1が検索キーワードの流行時期を提示する処理を実行開始するとき、検索サーバ1に備えられたUI手段10の情報入出力部100は、検索キーワードの流行時期の提示要求をクライアント2から受信する(ステップS1)。クライアント2から検索サーバ1に検索キーワードの流行時期の提示要求する仕方は2通りある。一つは、検索キーワードを示すテキスト情報を検索サーバ1に送信することで、もう一つは、クライアント2に表示されている出現頻度グラフの区間が選択された情報を送信することである。
検索キーワードを示すテキスト情報をクライアント2が検索サーバ1に送信するとき、検索サーバ1のURLがリンクされたフォームに入力されたテキスト情報が、クライアント2から検索サーバ1に送信される。更に、図で図示したようなグラフ情報の区間がマウスなどのポインティングデバイスで選択されたとき、区間が選択された情報がクライアント2から検索サーバ1に送信される。
検索サーバ1に備えられたUI手段10の期間決定部101は、検索キーワードの流行時期の提示要求をクライアント2から受信すると、受信した情報に従い処理を分岐させる(ステップS2)。UI手段10の期間決定部101は、受信した情報が検索キーワードを示すテキスト情報であるときはステップS3aに進み対象期間を決定し、受信した情報が区間の選択情報であるときはステップS3bに進み対象期間を決定する。
受信した情報が検索キーワードを示すテキスト情報であるとき、UI手段10の期間決定部101は、出現頻度グラフの対象期間の終了日を検索キーワードの取得日(或いは、その近傍の日付)とし、終了日から一定期間(図では3年)前を開始日とする(ステップ3a)。
受信した情報が区間の選択情報であるとき、UI手段10の期間決定部101は、選択された区間から対象日の開始日と終了日を決定する(ステップS3b)。例えば、クライアント2に表示されている出現頻度グラフにおいて、選択された区間の前後の区間を対象期間としたり、選択された区間そのものを対象期間とする。
検索サーバ1に備えられたUI手段10の期間決定部101は、ステップS3a或いはステップS3bで対象期間を決定すると、対象期間を細分化した区間を決定する(ステップS4)。例えば、対象期間を定数で割ることで、対象期間から区間は算出される。
検索サーバ1は、対象期間と区間が決定すると、検索キーワード、対象期間及び区間を検索手段11に引渡し、検索キーワードの出現頻度の時系列情報の生成を依頼する。検索手段11の出現頻度カウント部110は、データベース13を参照し、区間ごとに、更新日が区間に含まれるブログ記事を対象し検索キーワードの出現頻度をカウントし、検索キーワードの出現頻度の時系列情報を生成する(ステップS5)。
検索手段11の出現頻度カウント部110が検索キーワードの出現頻度の時系列情報を生成すると、ピーク区間検出部111が作動し、所定のアルゴリズムを用いて、時系列情報の中から出現頻度がピークとなるピーク区間を検出する(ステップS6)。
検索手段11のピーク区間検出部111がピーク区間を特定すると、検索手段11の関連キーワード抽出部112が作動し、特定したピーク区間ごとに、データベース13を参照し、更新日がピーク区間に含まれるブログ記事に記載されている単語と検索キーワードとの共起確率を求めることで、検索キーワードの関連キーワードを抽出する(ステップS7)。
検索手段11の関連キーワード抽出部112が関連キーワードを抽出すると、検索手段11からUI手段10のグラフ情報生成部102に、時系列情報、ピーク期間及び関連キーワードが引渡され、UI手段10のグラフ情報生成部102は、引渡された情報からグラフ情報を生成し、クライアント2に送信する(ステップS8)。
ステップS8で生成されるグラフ情報においては、ピーク区間のラベルとして、引渡された関連キーワードの中から選択された関連キーワードが表示される。なお、ステップS1で、クライアント2に表示されている出現頻度グラフからピーク区間が選択された情報が送信されたとき、ステップS5で、選択されたピーク区間のラベルとしている関連キーワードがUI手段10から検索手段11に引渡され、ステップS7で、検索手段11の関連キーワード抽出部112は、引渡された関連キーワード以外の単語を関連キーワードとして抽出する。
検索サーバを配置したシステムを説明する図。 出現頻度グラフを説明する図。 検索サーバのブロック図。 検索サーバが生成するグラフ情報を説明する図。 検索キーワードの流行時期を提示する手順を示したフロー図。
符号の説明
1 検索サーバ
10 UI手段
100 情報入出力部
101 期間決定部
102 グラフ情報生成部
11 検索手段
110 出現頻度カウント部
111 ピーク区間検出部
112 関連キーワード抽出部
12 ブログ情報収集手段
13 データベース
2 クライアント
3 ブログサーバ
4 pingサーバ

Claims (6)

  1. インターネット上で公開されている文書情報とその更新日を収集している検索サーバが、検索キーワードの流行時期をクライアントに提示する方法であって、
    (a)前記検索サーバが、前記検索キーワードの流行時期の提示要求を前記クライアントから受信するステップ、
    (b)前記検索サーバが前記クライアントから提示要求を受けたときに受信した情報に従い前記検索キーワードの出現頻度の対象期間を決定するステップ、
    (c)前記検索サーバが、前記対象期間を細分化した区間ごとに、更新日が前記区間に含まれる前記文章情報を対象とし前記検索キーワードの出現頻度をカウントすることで、前記検索キーワードの出現頻度の時系列情報を生成するステップ、
    (d)前記検索サーバが、前記時系列情報から前記検索キーワードの出現頻度がピークとなるピーク間を検出し、更新日が前記ピーク区間に含まれる前記文書情報から、ピーク区間の共起回数を区間の共起平均で割った値を利用したTF−IDFを利用して、前記検索キーワードの関連キーワードを抽出するステップ、
    (e)前記検索サーバが、前記時系列情報をグラフ化したグラフ情報を生成し、前記クライアントに送信するステップ、が実行され、
    前記ステップ(e)で生成される前記グラフ情報においては、前記ピーク区間のラベルとして前記関連キーワードが表示されることを特徴とする方法。
  2. 請求項1に記載の方法であって、前記ステップ(a)において、前記検索サーバが、前記クライアントから前記検索キーワードを受信したとき、前記ステップ(b)において、前記検索サーバは、前記検索キーワードの流行時期の提示要求を受けた日付を基準として前記対象期間を決定することを特徴とする方法。
  3. 請求項1に記載の方法であって、前記ステップ(a)において、前記検索サーバが、前記クライアントに表示されている前記グラフ情報の前記区間が選択された情報を受信したとき、前記ステップ(b)において、前記検索サーバは、選択された前記区間を基準とし、前記クライアントに表示されている前記グラフ情報の前記対象期間よりも短い期間を前記対象期間として決定し、前記ステップ(d)において、前記検索サーバは、前記選択された区間に含まれる関連キーワードをもとに、前記クライアントに表示させた前記関連キーワード以外の単語を前記関連キーワードとして抽出することを特徴とする方法。
  4. 検索キーワードの流行時期をクライアントに提示する検索サーバであって、
    インターネット上で公開されている文書情報とその更新日を収集する文書情報収集手段と、
    前記文書情報収集手段が収集した前記文書情報とその更新日をデータベースに記憶させる手段と、
    前記検索キーワードの流行時期の提示要求を前記クライアントから受けたときに、前記クライアント受信した情報に従い前記検索キーワードの出現頻度を表示する対象期間を決定し、前記対象期間から前記検索キーワードの出現頻度をカウントする区間を決定する期間決定手段と、
    前記データベースを参照し、前記区間ごとに、更新日が前記区間に含まれる前記文章情報を対象とし前記検索キーワードの出現頻度をカウントし、前記検索キーワードの出現頻度の時系列情報を生成する出現頻度カウント手段と、
    前記時系列情報から前記検索キーワードの出現頻度がピークとなるピーク間を検出するピーク区間検出手段と、
    前記データベースを参照し、更新日が前記ピーク区間に含まれる文書情報から、ピーク区間の共起回数を区間の共起平均で割った値を利用したTF−IDFを利用して、前記検索キーワードの関連キーワードを抽出する関連キーワード抽出手段と、
    前記時系列情報をグラフ化したグラフ情報を生成し、前記クライアントに送信するグラフ情報生成手段を備え、
    前記グラフ情報生成手段が生成する前記グラフ情報においては、前記ピーク区間のラベルとして前記関連キーワードが表示されることを特徴とする検索サーバ。
  5. 請求項4に記載の検索サーバであって、前記検索サーバに備えられた期間決定手段は、前記クライアントから前記検索キーワードを示すテキスト情報を受信したとき、前記検索キーワードの流行時期の提示要求を受けた日付を基準として前記対象期間を決定し、前記クライアントに表示されている前記グラフ情報の前記区間が選択された情報を受信したとき、選択された前記区間を基準とし、前記クライアントに表示されている前記グラフ情報の前記対象期間よりも短い期間を前記対象期間として決定することを特徴とする検索サーバ。
  6. 請求項4に記載の検索サーバであって、前記クライアントに表示されている前記グラフ情報の前記ピーク区間が選択された情報を受信したとき、前記検索サーバの前記関連キーワード抽出手段は、前記ピーク区間が選択された前記グラフ情報で表示していた前記関連キーワードを用いて、新規に作成する前記グラフ情報に表示する前記関連キーワードを抽出することを特徴とする検索サーバ。
JP2007103227A 2007-04-10 2007-04-10 検索キーワードの流行時期を提示する方法及び検索サーバ Expired - Fee Related JP5045194B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007103227A JP5045194B2 (ja) 2007-04-10 2007-04-10 検索キーワードの流行時期を提示する方法及び検索サーバ

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007103227A JP5045194B2 (ja) 2007-04-10 2007-04-10 検索キーワードの流行時期を提示する方法及び検索サーバ

Publications (2)

Publication Number Publication Date
JP2008262301A JP2008262301A (ja) 2008-10-30
JP5045194B2 true JP5045194B2 (ja) 2012-10-10

Family

ID=39984747

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007103227A Expired - Fee Related JP5045194B2 (ja) 2007-04-10 2007-04-10 検索キーワードの流行時期を提示する方法及び検索サーバ

Country Status (1)

Country Link
JP (1) JP5045194B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5330046B2 (ja) * 2009-03-23 2013-10-30 株式会社東芝 共起表現抽出装置及び共起表現抽出方法
JP5403340B2 (ja) * 2009-06-09 2014-01-29 ソニー株式会社 情報処理装置および方法、並びにプログラム
JP5323143B2 (ja) * 2011-08-03 2013-10-23 ヤフー株式会社 情報処理装置、情報処理方法、及びプログラム
JP5223018B1 (ja) 2012-05-30 2013-06-26 楽天株式会社 情報処理装置、情報処理方法、情報処理プログラム及び記録媒体
JP6095066B2 (ja) * 2013-10-01 2017-03-15 株式会社日立製作所 データ表示システム
US9832504B2 (en) 2015-09-15 2017-11-28 Google Inc. Event-based content distribution
JP6165913B1 (ja) * 2016-03-24 2017-07-19 株式会社東芝 情報処理装置、情報処理方法およびプログラム
JP6749866B2 (ja) * 2017-06-07 2020-09-02 日本電信電話株式会社 トレンド評価装置、および、トレンド評価方法
JP2019160239A (ja) * 2018-03-16 2019-09-19 エヌ・ティ・ティ・コミュニケーションズ株式会社 解析装置、解析方法及びコンピュータープログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3525948B2 (ja) * 1994-05-31 2004-05-10 富士通株式会社 情報検索装置
JP2005063242A (ja) * 2003-08-15 2005-03-10 Nippon Telegr & Teleph Corp <Ntt> 情報解析システム及び方法

Also Published As

Publication number Publication date
JP2008262301A (ja) 2008-10-30

Similar Documents

Publication Publication Date Title
JP5045194B2 (ja) 検索キーワードの流行時期を提示する方法及び検索サーバ
US8930360B2 (en) System and method for online handwriting recognition in web queries
CN104991962B (zh) 一种生成推荐信息的方法及装置
KR102148968B1 (ko) 컨텍스트 정보 제공 시스템 및 방법
JP2013529805A5 (ja) 検索方法、検索システム及びコンピュータプログラム
CN101000607A (zh) 用于增强搜索结果导航的可视化方法及装置
JP2007233438A (ja) トレンド解析サーバおよびトレンド解析方法
US9529847B2 (en) Information processing apparatus, information processing method, and program for extracting co-occurrence character strings
WO2015195839A1 (en) Generating contextual search presentations
CN103049528A (zh) 基于用户兴趣向量的个性化网页搜索排序方法
JP5269938B2 (ja) 急上昇ワード関連付け装置及び方法
JP2011192102A (ja) サマリ作成装置、サマリ作成方法及びプログラム
JP5579140B2 (ja) 文書検索装置及び方法及びプログラム
KR20100132376A (ko) 스니펫 제공 장치 및 방법
JP2009015495A (ja) キーワード分類装置
JP2014164576A (ja) 予測対象コンテンツにおける将来的なコメント数を予測する予測サーバ、プログラム及び方法
JP2015121858A (ja) データ処理装置、及びデータ処理方法
JP2010123036A (ja) 文書検索装置、文書検索方法、および文書検索プログラム
KR101614843B1 (ko) 사회 이슈에 대한 은폐를 탐지하는 방법 및 판단 장치
JP5370532B2 (ja) ブログ収集サーバ
JP2005063242A (ja) 情報解析システム及び方法
Fung et al. Discover information and knowledge from websites using an integrated summarization and visualization framework
Agrawal et al. Enrichment and reductionism: Two approaches for web query classification
JP5411802B2 (ja) 代表語抽出装置、代表語抽出方法および代表語抽出プログラム
KR20110114969A (ko) 관심 정보 제공 시스템 및 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100225

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120322

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120330

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120518

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120619

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120702

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150727

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 5045194

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees