JP4550781B2 - リアルタイム急上昇検索語検出方法およびリアルタイム急上昇検索語検出システム - Google Patents

リアルタイム急上昇検索語検出方法およびリアルタイム急上昇検索語検出システム Download PDF

Info

Publication number
JP4550781B2
JP4550781B2 JP2006201489A JP2006201489A JP4550781B2 JP 4550781 B2 JP4550781 B2 JP 4550781B2 JP 2006201489 A JP2006201489 A JP 2006201489A JP 2006201489 A JP2006201489 A JP 2006201489A JP 4550781 B2 JP4550781 B2 JP 4550781B2
Authority
JP
Japan
Prior art keywords
search
time
real
computer system
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2006201489A
Other languages
English (en)
Other versions
JP2007035034A (ja
Inventor
裁傑 崔
榮光 朴
▲みん▼廷 盧
相▲よん▼ ▲ばい▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Naver Corp
Original Assignee
Naver Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Naver Corp filed Critical Naver Corp
Publication of JP2007035034A publication Critical patent/JP2007035034A/ja
Application granted granted Critical
Publication of JP4550781B2 publication Critical patent/JP4550781B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3322Query formulation using system suggestions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、現時点における検索語の入力性向(動向)をリアルタイムで反映して未来の推定検索回数を予測し、予測された推定検索回数を用いて算出される判定数値によって急上昇検索語をリアルタイムで検出する方法およびリアルタイム急上昇検索語検出システムに関する。
一般的に、検索サービスを提供する検索サーバは、検索者から検索語が入力されると、該当検索語に応じて検索結果(例えば、前記検索語を含むウェブサイト、前記検索語を含む記事、前記検索語を含むファイル名を有する画像など)を検索者に提供する。
このような検索サービスシステムにおいて、検索語は多様に存在するものの、実質的には、検索語の入力回数に基づいて千余個の上位検索語が全体検索回数において占める比率が非常に高く、反対に、残りの検索語が全体検索回数で占める比率は非常に低い。これは、検索回数が高い上位検索語のいくつかに対して集中的に検索結果を提供するカスタマイズ(Customization)サービスを介して、検索者により高い水準の検索サービスの提供が可能であるということを意味している。
しかし、このような上位検索語を分析すると、1)常時、上位にランクされる検索語(例えば、“ゲーム”、“花札”、“芸能人”など)がある一方、2)一定期間に順位が急上昇して上位検索語に属するようになるという場合とがある。
前記1)の場合は、現在、大部分のインターネット検索サービス提供企業において、それなりに最適化した情報を検索者に提供しているが、前記2)の場合は、検索者からの入力回数が急上昇する検索語を認識して検出することが非常に困難であるため、インターネット検索サービス提供企業はこれに対する適切な対応を成すことができず、長時間が経過した後にようやくこれを認識するようになるという場合が多かった。この場合、インターネット検索サービス提供企業がこれを認識して対応をしようとする時点では、すでに該当検索語の順位が下落しているなどの理由により、前記対応を成す意味がなくなるという場合が発生していた。
また、前記2)の場合、ある人が新聞記事などに多数登場する用語を識別し、これを急上昇検索語として推定する方法を用いることも可能であるが、このような方法による急上昇検索語の検出は、すでに前記検索語が大衆に広く知られた後に遂行可能となるため、時期的にその検出が大きく遅滞してしまうという短所があり、また、あらゆる分野の検索語を包括して検出することができないという問題点もある。
一方、韓国特許出願第10−2000−7010220号(公開番号特2001−0086259)では、急速に人気度が上昇するウェブページをハイフライヤー(High−Flyers)ヒットリストとして検索者に提供するインターネット検索エンジンに対して開示している。前記ハイフライヤーヒットリストとは、検索結果において検索者がクリックした回数が急激に上昇するサイトのリストを意味している。
前記インターネット検索エンジンは、初期一定期間内の各サイトに対するクリック回数および前記各サイトに対する今までの累積クリック回数を測定し、また、前記各サイトの人気度変化率を計算することによって急速に人気度が上昇するサイトをハイフライヤーヒットリストとして検索者に提供している。
しかし、前記インターネット検索エンジンを用いる場合、クリック回数の入力動向を観察するための一定期間が要求され、この一定期間が経過することで急激に上昇するサイトのリストが決定されるという限界は、依然として存在している。
結局、前記インターネット検索エンジンによっても、依然としてインターネット検索サービス提供企業は、前記一定期間内には現在の急上昇検索語を検出することができず、また、現在急激に入力回数が増加している検索語に対して最適化した検索結果を提供するカスタマイズサービスを検索者に適切な時点に提供することができない。
従って、現時点における検索語入力性向をリアルタイムで反映して急上昇検索語を迅速に検出し、これによって前記急上昇検索語に対するカスタマイズサービスを検索者に提供することで、検索回数の増加および検索者の接続時間増加を自然に図ることができる新しい技術が切に要請されてきた。
本発明は、前記のような従来技術の問題点を解決するために創案されたものであって、検索語の現在の入力性向を反映して各検索語別に未来時点における推定検索回数をリアルタイムで予測し、これを用いて急上昇検索語を迅速に検出することが可能なリアルタイム急上昇検索語検出方法およびリアルタイム急上昇検索語検出システムを提供することを目的とする。
また、本発明は、一定期間内の検索語入力回数を集計した後に急上昇検索語を判断するという従来の判断方式から脱し、現時点の検索語入力性向をリアルタイムで反映して急上昇検索語を検出するリアルタイム急上昇検索語検出方法およびリアルタイム急上昇検索語検出システムを提供することを他の目的とする。
また、本発明は、急上昇検索語リストを一定時間間隔ごとに生成することで急上昇検索語リストを持続的に更新して検索者に露出(提供)することができ、現時点の入力性向に関する情報がより迅速に検索者に伝達されるようにするリアルタイム急上昇検索語検出方法およびリアルタイム急上昇検索語検出システムを提供することをさらに他の目的とする。
また、本発明は、検索者からの入力回数が急上昇する検索語を迅速に検出することで、検索回数の増加および検索者の接続時間を増加させ、インターネット検索サービス提供企業にとって営業利益の増大を可能にするリアルタイム急上昇検索語検出方法およびリアルタイム急上昇検索語検出システムを提供することをさらに他の目的とする。
前記の目的を達成するために、リアルタイム急上昇検索語検出方法は、所定時間間隔ごとに一つ以上の検索サーバからログデータを収集する段階と、前記収集されたログデータを用いて前記検索語別の入力回数を算定し、前記算定された検索語別の入力回数を各タイムデータと関連してデータベースに保存する段階と、前記データベースを参照して所定のスライディングウィンドウに属する一つ以上のタイムデータを識別し、前記識別されたタイムデータと関連した検索語別の入力回数を各検索語別に合算する段階と、前記合算された入力回数に基づいて前記各検索語別に推定検索回数を演算する段階と、前記各検索語別に平均検索回数および前記推定検索回数を用いて第1判定数値を演算する段階と、前記合算された入力回数に基づいて前記各検索語別の入力順位を決め、前記決められた入力順位を用いて前記各検索語別の第2判定数値を演算する段階と、前記各検索語別に平均検索回数、標準偏差および前記推定検索回数を用いて第3判定数値を演算する段階と、選定された急上昇最小検索回数と前記推定検索回数を用いて前記各検索語別に第4判定数値を演算する段階と、前記第1ないし第4判定数値に基づいてリアルタイム急上昇検索語を検出する段階と、を含むことを特徴とする。
また、前記目的を達成するための技術的具現装置として、本発明によるリアルタイム急上昇検索語検出システムは、所定時間間隔ごとに一つ以上の検索サーバからログデータを収集するログ収集手段と、前記収集されたログデータを用いて前記検索語別の入力回数を算定し、前記算定された検索語別の入力回数を各タイムデータと関連してデータベースに保存する入力回数算定手段と、前記データベースを参照して所定のスライディングウィンドウに属する一つ以上のタイムデータを識別し、前記識別されたタイムデータと関連した検索語別の入力回数を各検索語別に合算する入力回数合算手段と、前記合算された入力回数に基づいて前記各検索語別に推定検索回数を演算する検索回数推定手段と、前記演算された推定検索回数を用いて第1ないし第4判定数値を算出する判定数値演算手段と、前記算出された第1ないし第4判定数値に基づいてリアルタイム急上昇検索語を検出する検索語抽出手段と、を含むことを特徴とする。
以上の説明から知ることができるように、本発明によると、検索語の現在の入力性向を反映して各検索語別に未来時点における推定検索回数をリアルタイムで予測し、これを用いて急上昇検索語を迅速に検出することが可能なリアルタイム急上昇検索語検出方法およびリアルタイム急上昇検索語検出システムを提供することができる。
本発明によると、一定期間内の検索語入力回数を集計した後に急上昇検索語を判断することができる従来の判断方式から脱し、現時点の検索語の入力性向をリアルタイムで反映して急上昇検索語を検出するリアルタイム急上昇検索語検出方法およびリアルタイム急上昇検索語検出システムを提供することができる。
本発明によると、急上昇検索語リストを一定時間間隔ごとに生成することで急上昇検索語リストを持続的に更新して検索者に露出することができ、現時点の入力性向に関する情報がより迅速に検索者に伝達されるようにするリアルタイム急上昇検索語検出方法およびリアルタイム急上昇検索語検出システムを提供することができる。
本発明によると、検索者からの入力回数が急上昇する検索語を迅速に検出することで、検索回数の増加および検索者の接続時間を増加させてインターネット検索サービス提供企業にとって営業利益を増大することを可能にするリアルタイム急上昇検索語検出方法およびリアルタイム急上昇検索語検出システムを提供することができる。
以下、添付の図面を参照して、本発明に係るリアルタイム急上昇検索語検出方法およびリアルタイム急上昇検索語検出システムに対して説明する。
本明細書で持続的に用いられる“急上昇検索語”とは、検索サービスを提供する一つ以上の検索サーバに入力される検索語のうち、平素に入力された入力回数に比べて現時点で急激に入力回数が増加した検索語を指称する。
このような急上昇検索語は、検索者に他の検索者の検索語入力性向を認知させ、平素に比べて急激に関心を集めている検索語が何であるのかに対する情報を提供する役割をする。同時に、検索サービスを提供する検索サーバの運営者には、急上昇検索語に関する情報の提供を受けた検索者が、急上昇検索語をもう一度入力するように誘導することにより検索回数および検索時間の増加が可能であり、これによってより多くの営業利益を創出することができるようにする。
図1は、本発明の一実施形態に係るリアルタイム急上昇検索語検出システムのネットワーク連結を説明するための図である。
リアルタイム急上昇検索語検出システム100は、過去に比べて入力回数が急激に増加したものと判断される検索語を検出し、検出された急上昇検索語を急上昇程度(例、判定数値の大きさ)によって配列して各検索サーバ110に提供する役割をする。特に、リアルタイム急上昇検索語検出システム100は、現在、検索者120の検索語入力性向をリアルタイムで反映し、迅速かつ正確に急上昇検索語を検出することができる。
まず、検索サーバ110とは、検索者120が探そうとするコンテンツ資料を保有するウェブサイトへの接続が容易となるように検索サービスを支援する検索エンジンサーバなどを意味する。すなわち、検索サーバ110は、検索者120の検索要請に応じ、検索者120が要求する情報を提供することができる所定のコンテンツ供給者CPに対する簡略情報を提供することでコンテンツ資料の検索に要される時間を節約し、検索される資料の正確度を高める役割を遂行する。
ここで、検索要請は、検索サーバ110に接続した検索者120が所定の検索語入力欄に検索語を入力することによって発生し、検索サーバ110は、入力された検索語に対応する簡略情報を検索して検索者120に提供する。
特に、検索サーバ110は、検索者120が検索語を入力したことに対する履歴記録として、ログデータを生成して保有することができる。前記ログデータには、検索者120によって入力が成された検索語、または検索語が入力された時間などに関する情報を含んだりし、検索サーバ110は、検索語が入力される度にログデータに対する記録処理を遂行する。
検索者120とは、検索サーバ110と接続するためのユーザ端末機130を保有し、検索しようとするコンテンツ資料を保有するコンテンツ供給者のウェブサイトに対する検索要請を、検索サーバ110の検索語入力欄に検索語を入力して生成するインターネットユーザを意味する。また、検索者120は、本発明に係るリアルタイム急上昇検索語検出システム100で提供する急上昇検索語リストを検索サーバ110を経由して提供を受けることができ、平素に比べて急激に人気を集めている検索語に対する情報を習得することができる。
ユーザ端末機130は、インターネットなどの通信網140を介してリアルタイム急上昇検索語検出システム100との接続状態を維持し、リアルタイム急上昇検索語検出システム100によって急上昇検索語として検出された検索語をディスプレイすることができる。このようなユーザ端末機130は、例えば、パーソナルコンピュータ、ハンドヘルド(handheld)コンピュータ、PDA(Personal Digital Assistant)、MP3プレーヤ、電子辞典、携帯電話、スマートフォンなどのように所定のメモリ手段を備え、所定のマイクロプロセッサを搭載することで所定の演算能力を備えた端末機を通称する。
リアルタイム急上昇検索語検出システム100は、一つ以上の検索サーバ110から決められた時間間隔でログデータを持続的に収集し、収集されたログデータを加工、分析して、現時点で急激に入力回数が増加している検索語を急上昇検索語として検出する。以下、図2を参照して、本発明のリアルタイム急上昇検索語検出システム200の具体的な構成を説明する。
図2は、本発明の一実施形態に係るリアルタイム急上昇検索語検出システムを説明するための構成図である。
リアルタイム急上昇検索語検出システム200は、ログ収集手段210、入力回数算定手段220、入力回数合算手段230、検索回数推定手段240、判定数値演算手段250、および検索語抽出手段260を含む。
ログ収集手段210は、所定時間間隔ごとに一つ以上の検索サーバ110からログデータを収集する。ここで、時間間隔とは、リアルタイム急上昇検索語検出システム200の運営者によって柔軟に設定される一定の長さの期間であり、例えば、急上昇検索語をより正確に検出するように可能な限り短期間に設定したりする。すなわち、ログ収集手段210は、前記時間間隔として設定された期間内の各検索サーバ110に新たに入力された検索語の現況を収集されるログデータを介して確認する。上述したように、ログデータには、ユーザ端末機130から入力された検索語および検索語の入力時間に対する情報が含まれており、例えば、時間間隔を5秒に設定したログ収集手段210は、ログデータの入力時間に基づいて現在から5秒前の間に各検索サーバ110に新たに記録された検索語に関する情報を獲得することができる。
入力回数算定手段220は、収集されたログデータを用いて検索別の入力回数を算定し、算定された検索語別の入力回数を各タイムデータと関連してデータベース225に保存する。すなわち、入力回数算定手段220は、前記時間間隔内に新たに入力されたものとして記録された検索語をログデータを介して識別し、識別された検索語に基づいて入力が成された回数をカウントする。また、入力回数算定手段220は、前記ログデータを収集した時間と関連したタイムデータを生成することができ、生成されたタイムデータと前記検索語別の入力回数を対応させてデータベース225に保存する。これにより、データベース225には、現時点以前にユーザ端末機130から入力された検索語および検索語別の入力現況に関する情報が前記時間間隔で区分されて持続的に累積、保存される。
入力回数合算手段230は、データベース225を参照して所定のスライディングウィンドウに属する一つ以上のタイムデータを識別し、識別されたタイムデータと関連した検索語別の入力回数を各検索語別に合算する。ここで、スライディングウィンドウとは、データベース225で検索する情報を決める役割をする仮想の時間範囲を意味し、システムの運営者によって設定されたn期間内にデータベース225に保存された情報を選別的に検索することができる。
前記n期間は、システムの運営者によって柔軟に設定され、例えば、データベース225に最も最近に保存されたタイムデータに基づいて以前n(n>0)期間で設定することができる。また、スライディングウィンドウの前記n期間が固定である場合、スライディングウィンドウは、検索される情報を現時点から近い過去に保存された情報として維持するために、時間の経過によって保存時間が古い情報は検索対象から除かれるようにする。ここで、古い情報とは、現時点から以前n期間を超過して保存が成された情報を意味する。
入力回数合算手段230は、スライディングウィンドウのn期間に属するタイムデータおよびタイムデータに対応する検索語/入力回数をデータベース225で識別し、検索語別の入力回数を合算する役割をする。すなわち、入力回数合算手段230は、スライディングウィンドウによって決められた時間範囲内に、各検索サーバ110に入力が成された検索語および検索語別の累積入力回数に対する情報を算出する。
検索回数推定手段240は、合算された入力回数に基づいて各検索語別に推定検索回数を演算する。すなわち、検索回数推定手段240は、現時点から近い限定された時間範囲内で算出された検索語別の入力回数に基づいて、未来時点に発生するものと予想される検索回数を予測する役割をする。推定検索回数の演算において、検索回数推定手段240は、人為的に操作された検索語を除いた後、純粋に検索のために入力された検索語のみを用いて検索回数を予測することができる。例えば、入力回数を増加させようとする意図で広告事業者が特定検索語を過度に入力する場合、検索回数推定手段240は、該当検索語を攻撃性検索語として判断し、関連する入力回数が前記推定検索回数の演算に反映されないように所定の除外処理を遂行したりする。前記推定検索回数を推定する基準時間は、システムの運営者によって柔軟に設定され、例えば、一日を基準として推定したりする。以下、図3ないし図5を参照して、検索語別の推定検索回数を演算することに対して詳しく説明する。
図3は、本発明によるログデータの一例を説明するための図である。
検索サーバ1ないし3は、検索サービスの提供を受けようとする検索者120によって検索語が入力されることによって該当検索語の入力履歴をログデータに記録する。図3に示されたように、ログデータには、検索者120が入力した検索語および検索語の入力時間を対応して記録している。例えば、検索サーバ1によって生成されたログデータには、設定された時間間隔“t”内に検索語“フリースタイル、フリースタイル、プレゼント”が入力されていることを記録している。以後、入力回数算定手段220は、各検索サーバ1ないし3から収集したログデータを用い、各時間間隔内に入力された検索語に対する検索語別の入力回数を演算することができる。
図4は、本発明によるデータベースの一例を説明するための図である。
図4におけるデータベース225は、演算された検索語別の入力回数を時間間隔と関連したタイムデータと関連して保存することを例示している。例えば、入力回数算定手段220は、時間間隔“t”内に各検索サーバ1ないし3で入力が成された検索語および検索語別の入力回数の累計を“プレゼント−5回、フリースタイル−2回、スポンジ−1回”と演算することができ、演算結果をデータベース225上にタイムデータ“t”と関連させて保存することができる。
また、図4では、推定検索回数を予測する場合に用いられる情報の時間範囲を決めるスライディングウィンドウを例示している。前記スライディングウィンドウは、時間範囲であるn期間としてタイムデータ“t〜t−n”で選定し、入力回数合算手段230は、前記タイムデータ(t〜t−n)に相当する検索語および入力回数を識別する。以後、入力回数合算手段230は、識別された情報を用いて検索語別の入力回数を合算する。
図5は、本発明による検索語別の推定検索回数の演算および急上昇検索語の検出一例を説明するための図である。
図5のi)では、前記スライディングウィンドウに属する時間範囲内に識別されて合算
された検索語別の入力回数およびこれから予測される推定検索回数の一例を例示している。上述した例において、入力回数合算手段230は、タイムデータ(t〜t−n)に属する検索後別の入力回数を、“プレゼント−601回、フリースタイル−567回、スポンジ−487回”と累計することができる。このような検索語別の入力回数に基づいた検索回数推定手段240は、検索語それぞれに推定検索回数を予測し、例えば、換算値“127.4”を各入力回数に掛けて“プレゼント−76567.4回、フリースタイル−72235.8回、スポンジ−61916.4回”という一日推定検索回数を予測することができる。前記換算値は、システムの運営者によって柔軟に設定される数値であり、前記例で適用した換算値“127.4”は、本発明の運営者が十分な実験および計算を経て最適に活用することができると判断された値として決められる。
図5のii)では、各検索後別に演算された推定検索回数を用いて算出される判定数値に
基づいて急上昇検索語を検出し、検出された急上昇検索語を前記判定数値によって配列する急上昇検索語リストの一例を示している。上述例の検索語“プレゼント”および“フリースタイル”は、過去に比べて入力回数が急激に増加したものと判断して検出された急上昇検索語である。万一、検索語“プレゼント”の判定数値が検索語“フリースタイル”より相対的に高いとすると、本発明に係るリアルタイム急上昇検索語検出システム200は、検索語“プレゼント”を検索語“フリースタイル”より高い等位に配列する急上昇検索語リストを生成し、これを検索者120に露出されるように検索サーバ110に提供することができる。
従って、本発明によると、検索サーバ110で入力される検索語の現在入力性向を用いて各検索語別に未来時点における推定検索回数を予測することができる。
判定数値演算手段250は、演算された推定検索回数を用いて第1ないし第4判定数値を算出する役割をし、同時に、検索語抽出手段260は、算出された第1ないし第4判定数値に基づいてリアルタイム急上昇検索語を検出する役割をする。ここで、判定数値は、関連する検索語が急上昇する検索語であるかを判断する数値情報であり、検索語抽出手段260は、判定数値が所定数値以上であったり相対的に大きい検索語を急上昇検索語として判断して検出する。
前記第1ないし第4判定数値の算出に先立ち、本発明に係るリアルタイム急上昇検索語検出システム200は、判定数値に用いられる演算因子として検索語別の平均検索回数または標準偏差を算出して維持することができる。前記検索語別の平均検索回数または標準偏差は、通常の平均または標準偏差を算出する方式を準用して算出することができる。このような平均検索回数または標準偏差の演算は、急上昇する検索語を正確に判断するための基準を備えるためのものであり、これら平均検索回数または標準偏差を参考にして、リアルタイム急上昇検索語検出システム200は、平素にあまり入力されていなかった検索語のうち、急激な入力回数を示す検索語を急上昇検索語として検出することができる。
平均検索回数または標準偏差の演算において、リアルタイム急上昇検索語検出システム200は、例えば、データベース225を参照して所定のm期間と関連したタイムデータを識別し、識別されたタイムデータと関連した検索別の入力回数を各検索別に合算し、これを前記m期間に分けて平均検索回数を演算することができる。このとき、m期間とは、入力回数の平均値を正確に演算することができる十分な期間であり、一般的に、前記スライディングウィンドウのn期間より長い期間で設定する。また、標準偏差は、前記m期間内にそれぞれの偏差(一日入力回数と平均検索回数の差)を二乗して算術平均し、前記平均した値を二乗根として演算することができる。
すなわち、リアルタイム急上昇検索語検出システム200は、判定数値を算出するために基準となるデータであって、十分な期間内に入力が成された検索語の検索語別の平均検索回数および標準偏差を演算して維持することができる。例えば、前記mが7である場合、リアルタイム急上昇検索語検出システム200は、7日間で入力された入力回数に基づいて、検索語“プレゼント”に対する平均検索回数を“26715.14”、標準偏差を“3660.8”と算出することができる。
以後、判定数値演算手段250は、各検索語別に平均検索回数および標準偏差を用いて第1判定数値を演算することができる。前記第1判定数値は、前記標準偏差に所定の数を掛けた値と前記平均検索回数を合算して生成されることができる。例えば、前記所定の数は3であったりする。この場合、前記第1判定数値は、“平均+(3*標準偏差)”のような数式で表現されることができる。
以後、検索語抽出手段260は、各検索語別に前記推定検索回数と前記第1判定数値を比較し、前記推定検索回数が前記第1判定数値以上である検索語を検出する。
また、判定数値演算手段250は、データベース225を参照して、EWMA(Exponentially Weighted Moving Average)管理図を用いて前記各検索語別に第2判定数値を演算することができる。この場合、前記第2判定数値は、EWMA管理図を用いて演算される前記各検索語別の管理上限情報であったりする。
一般的に、管理図(control chart)は、多様な目的で多く活用されているが、その中でもEWMA管理図は容易に一般化することができ、小さな変化も容易に検出することができるという長所によって最も多く用いられている。製品の製造過程において、製品の品質を規格に合うように完璧に生産するために、生産過程中に製品の品質を持続的にモニタリング(monitoring)することは非常に重要な問題であるが、EWMA管理図は、一般的にこのような問題を解決するために用いられる。
本実施形態によると、このようなEWMA管理図を急上昇検索語を検出するのに活用することで、いずれか一つの検索語に対する時間変化による入力回数の趨勢をモニタリングすることができるようになる。
本実施形態による急上昇検索語抽出方法は、次のような統計的な問題として生成してみることができる。まず、平素、ある検索語にする入力回が平均がμ0、分散がσ2である正規分布によるものとし、検索語抽出手段260は、リアルタイムで前記検索語に対する平均の移動可否を判断する。特定時点で前記平均が移動したと判断することは、ユーザが前記検索語に対する関心が以前とは異なることを意味するため、検索語抽出手段260は、前記時点で前記検索語を急上昇検索語として検索することができる。
このような問題をEWMA管理図を用いて解くと次のようになる。t時点で次のような統計量を考慮すると、
Figure 0004550781
統計量Zは、t時点で測定された入力回数をpの加重値Xを置いて考慮し、直前の時点における統計量に対しては(1−p)の加重値を置いて計算する。これを介して、最近の測定値により多くの比重を置いて平均移動を考慮することができるようになる。[数1]は、次のように再度表現することができる。
Figure 0004550781
一方、統計量Zの分散は次のように計算することができる。
Figure 0004550781
また、一般的な管理図理論を用いて、次のような管理上限線を計算することができる。
Figure 0004550781
Figure 0004550781
本実施形態によるEWMA管理図を用いて急上昇検索語を検出する方法によると、検索語抽出手段260は、毎時点に計算されたZがUCLを超過すると平均が移動したと判断することができ、このように判断された検索語を急上昇検索語として検索することができる。
また、判定数値演算手段250は、合算された入力回数(スライディングウィンドウによって検索された入力回数の合算した値に基づいて各検索語別の入力順位を決め、決められた入力順位を用いて各検索語別の第3判定数値を演算することができる。
第3判定数値は決められた入力順位の逆数であって、
Figure 0004550781

によって演算されることができる。すなわち、判定数値演算手段250は、現時点で高い頻度で入力される検索語と関連して高い第3判定数値が算出されるようにすることができる。
例えば、スライディングウィンドウ内の入力回数が図4のような場合、判定数値演算手段250は、入力回数が最も高い検索語“プレゼント”に入力順位1位を決めることができ、入力順位2位として検索語“フリースタイル”を決めることができる。また、判定数値演算手段250は、それぞれ決められた入力順位の逆数を用いて第判定数値を算出し、検索語抽出手段260は、第判定数値が相対的に高い検索語“プレゼント”(第3判定数値は“1”)が優先して急上昇検索語として検出されるようにすることができる。
また、判定数値演算手段250は、選定された急上昇最小検索回数と推定検索回数を用いて各検索語別の第4判定数値を演算することができる。ここで、急上昇最小検索回数は、検索語の検出を許容する下限の検索回数であって、第4判定数値は、
Figure 0004550781
によって演算されることができる。すなわち、判定数値演算手段250は、入力回数が極端に少なくても入力回数の変化幅が大きい検索語を急上昇検索語として判断されることを防止しようと、急上昇最小検索回数より少ない推定検索回数を有する検索語と関連して低い第4判定数値が算出されるようにすることができる。
例えば、急上昇最小検索回数が“70,000”であり、予測された各検索語別の推定検索回数が図5のi)のような場合、判定数値演算手段250は、検索語“スポンジ”に
対する第4判定数値を1以下(0.885≒61916.4/70000)と算出することができ、検索語抽出手段260は、前記検索語“スポンジ”を急上昇検索語検出対象から除くことができる。また、検索語抽出手段260は、第4判定数値が相対的に高い検索語“プレゼント”(1.094≒76567.4/70000)が優先して急上昇検索語として検出されるようにすることができる。
従って、本発明によると、現時点で検索者120からの入力回数が急上昇する検索語をリアルタイムで検出することで、現在、最も人気のある検索語に対する情報を迅速かつ正確に識別することができる。
また、リアルタイム急上昇検索語検出システム200は、検出された急上昇検索語を所定の整列条件によって配列し、これを検索サーバ110に接続する検索者120に露出することができる。
このため、リアルタイム急上昇検索語検出システム200は、算出された第1ないし第4判定数値の大きさ順によって検出された急上昇検索語を配列して急上昇検索語リストを生成する検索語配列手段270をさらに含むことができる。すなわち、検索語配列手段270は、急上昇検索語として優先して検出された検索語により高い等位が付与されるようにして急上昇検索語リストを生成し、これを検索サーバ110に提供することで検索サーバ110に接続する検索者120に急上昇検索語リストが露出されるようにする。特に、検索語配列手段270は、前記急上昇検索語リストを上述した時間間隔(ログデータを収集する周期)ごとに生成することで急上昇検索語リストを持続的に更新して検索者120に露出することができ、現時点における検索語入力性向に関する情報がより迅速に検索者120に伝達されるようにすることができる(図5のii)参照)。
以下、本発明の実施形態に係るリアルタイム急上昇検索語検出システム200の作業流れを詳しく説明する。
図6は、本発明の一実施形態に係るリアルタイム急上昇検索語検出方法を具体的に説明するためのフローチャートである。
本発明に係るリアルタイム急上昇検索語検出方法は、上述したリアルタイム急上昇検索語検出システム200によって実行される。
まず、段階610で、リアルタイム急上昇検索語検出システム200は、所定の時間間隔ごとに一つ以上の検索サーバ110からログデータを収集する。本段階610は、設定された時間間隔内に検索者120が検索サーバ110を介して新たに入力した検索語の入力性向に対する情報を獲得する過程である。例えば、前記時間間隔を“5秒”に設定する場合、リアルタイム急上昇検索語検出システム200は、現在から5秒前の間に各検索サーバ110に新たに入力された検索語を記録するログデータを選別して収集することができる。
また、段階620で、リアルタイム急上昇検索語検出システム200は、収集されたログデータを用いて検索語別の入力回数を算定し、算定された検索語別の入力回数を各タイムデータと関連してデータベース225に保存する。本段階620は、検索語に基づいて前記時間間隔に新たに入力される入力回数を累計し、これをタイムデータに対応させてデータベース225に保存する過程である(図4参照)。
次に、段階630で、リアルタイム急上昇検索語検出システム200は、データベース225を参照してスライディングウィンドウに属する一つ以上のタイムデータを識別し、識別されたタイムデータと関連した検索語別の入力回数を各検索語別に合算する。本段階630は、現在の検索語入力性向を反映することができるように情報の検索のためにn期間を含むスライディングウィンドウを設定する過程である。すなわち、本段階630におけるリアルタイム急上昇検索語検出システム200は、前記n期間内にデータベース225に保存された情報のみを選別的に検索することができる(図4参照)。
また、段階640で、リアルタイム急上昇検索語検出システム200は、合算された入力回数に基づいて各検索語別に推定検索回数を演算する。本段階640は、短期間の検索語入力性向を反映して未来の検索回数を予測する過程であって、例えば、スライディングウィンドウに属して合算された検索語別の入力回数に所定の換算値“127.4”を掛けて一日推定検索回数を演算することができる(図5のii)参照)。
続いて、段階650で、リアルタイム急上昇検索語検出システム200は、第1ないし第4判定数値を演算する。本段階650は、前記演算された推定検索回数を用い、検索語のうちで急上昇検索語を検出することができる根拠となる判定数値を計算する過程である。
まず、本段階650におけるリアルタイム急上昇検索語検出システム200は、各検索語別に平均検索回数および標準偏差を用いて第1判定数値を演算することができる。前記第1判定数値は、前記標準偏差に所定の数を掛けた値と前記平均検索回数を合算して生成されることができる。例えば、前記所定の数は3であったりする。この場合、前記第1判定数値は、“平均+(3*標準偏差)”のような数式で表現されることができる。
また、本段階650におけるリアルタイム急上昇検索語検出システム200は、データベース225を参照して、EWMA(Exponentially Weighted Moving Average)管理図を用いて前記各検索語別に第2判定数値を演算することができる。この場合、前記第2判定数値は、EWMA管理図を用いて演算される前記各検索語別の管理上限情報であったりする。
また、本段階650におけるリアルタイム急上昇検索語検出システム200は、合算された入力回数に基づいて各検索語別の入力順位を決め、決められた入力順位を用いて各検索語別の第3判定数値を演算する。このとき、第3判定数値は、決められた入力順位の逆数であって、
Figure 0004550781

によって演算されることができる。
また、本段階650におけるリアルタイム急上昇検索語検出システム200は、選定された急上昇最小検索回数と推定検索回数を用いて各検索語別に第4判定数値を演算する。このとき、急上昇最小検索回数は、検索語の検出を許容する下限の検索回数であって、第4判定数値は、
Figure 0004550781
によって演算されることができる。
以後、段階660で、リアルタイム急上昇検索語検出システム200は、第1ないし第4判定数値に基づいてリアルタイム急上昇検索語を検出する。本段階660は、一つ以上の検索語(スライディングウィンドウに属する検索語)のうち、現時点で急激に入力回数が増加している検索語を急上昇検索語として検出する過程である。
従って、本発明によると、一定期間内の検索語入力性向を集計した後に急上昇検索語を判断する従来の判断方式から脱し、現時点の検索語入力性向をリアルタイムで反映して急上昇検索語を検出することができる。
本発明の実施形態は、コンピュータにより具現される多様な動作を実行するためのプログラム命令を含むコンピュータ読み取り可能な媒体を含む。前記媒体は、プログラム命令、データファイル、データ構造などを単独または組み合わせて含むこともできる。前記媒体およびプログラム命令は、本発明の目的のために特別に設計されて構成されたものでもよく、コンピュータソフトウェア分野の技術を有する当業者にとって公知であり使用可能なものであってもよい。コンピュータ読み取り可能な媒体の例としては、ハードディスク、フロッピー(登録商標)ディスクおよび磁気テープのような磁気媒体、CD−ROMのような光記録媒体、フロプティカルディスクのような磁気−光媒体、およびロム、ラム、フラッシュメモリなどのようなプログラム命令を保存して実行するように特別に構成されたハードウェア装置が含まれる。前記媒体は、プログラム命令、データ構造などの送信媒体であったりもする。プログラム命令の例としては、コンパイラによって生成されるもののような機械語コードだけでなく、インタプリタを用いてコンピュータによって実行される高級言語コードを含む。
図7は、本発明に係るリアルタイム急上昇検索語検出方法を実行するのに好適に採用される汎用コンピュータ装置の内部ブロック図である。
コンピュータシステム700は、主記憶装置(一般的には、random access memoryまたはRAM720)および主記憶装置(一般的には、read only memoryまたはROM730)を含む記憶装置と連結される一つ以上のプロセッサ710(中央処理装置またはCPUとも呼ばれる)を含む。本技術分野において広く知られているように、ロム730は、データ(data)および命令(instruction)を単一方向にCPUに送信する役割をし、ラム720は通常、データおよび命令を双方向的な方法で送信するのに用いられる。これら主記憶装置は、両方とも前記したコンピュータ読み取り可能な媒体のあらゆる好適な形態を含むことができる。大容量記憶装置(Mass Storage)740は、双方向的にCPUに連結され、追加的なデータ格納能力を提供し、前記したコンピュータ読み取り可能な媒体のいずれかを含むことができる。大容量記憶装置740は、プログラム、データなどを記憶するのに用いられ、通常、主記憶装置より速度が遅いハードディスクなどの補助記憶装置である。CD−ROM760などの特定の大容量記憶装置が単一方向にCPUにデータを送ることもある。プロセッサ710は、ビデオモニタ、トラックボール、マウス、キーボード、マイクロフォン、タッチスクリーン型ディスプレイ、カード読み取り機、磁気または紙テープ読み取り機、音声または筆記認識機、ジョイスティック、または他のコンピュータなどの他の公知の入力装置のような一つ以上の入出力装置を含むインターフェイス750と連結される。最後に、プロセッサ710は、ネットワークインターフェイス770に一般的に示されるようなネットワーク接続を用いてコンピュータまたは無線通信ネットワークに接続されてもよい。このようなネットワーク接続を介して、前記した方法の手順を実行することにより、CPUが前記ネットワークから情報の入力を受けたり、前記ネットワークに情報を出力したりすることが意図される。前記した装置および道具は、コンピュータハードウェアおよびソフトウェア技術分野の当業者にとって周知である。
前記したハードウェア要素は、本発明の動作を実行するために一以上のソフトウェアモジュールとして作動するように構成される。
上述したように、本発明の好ましい実施形態を参照して説明したが、該当の技術分野において熟練した当業者にとっては、特許請求の範囲に記載された本発明の思想および領域から逸脱しない範囲内で、本発明を多様に修正および変更させることができることを理解することができるであろう。
すなわち、本発明の技術的範囲は、特許請求の範囲に基づいて定められ、発明を実施するための最良の形態により制限されるものではない。
本発明の一実施形態に係るリアルタイム急上昇検索語検出システムのネットワーク連結を説明するための図である。 本発明の一実施形態に係るリアルタイム急上昇検索語検出システムを説明するための構成図である。 本発明によるログデータの一例を説明するための図である。 本発明によるデータベースの一例を説明するための図である。 本発明による検索語別の推定検索回数の演算および急上昇検索語の検出一例を説明するための図である。 本発明の一実施形態に係るリアルタイム急上昇検索語検出方法を具体的に説明するためのフローチャートである。 本発明に係るリアルタイム急上昇検索語検出方法を実行するのに採用される汎用コンピュータ装置の内部ブロック図である。
符号の説明
200 リアルタイム急上昇検索語検出システム
210 ログ収集手段
220 入力回数算定手段
230 入力回数合算手段
240 検索回数推定手段
250 判定数値演算手段
260 検索語抽出手段
270 検索語配列手段

Claims (14)

  1. 一つ以上の検索サーバに接続されたコンピュータシステムを用いて、ユーザ端末機からの入力回数が急上昇する検索語を検出する方法において、
    第1の時間間隔を前記コンピュータシステムの記憶装置に記憶する段階と、
    前記コンピュータシステムのネットワークインターフェースが、前記第1の時間間隔ごとに前記一つ以上の検索サーバからログデータを受信する段階(前記ログデータは、前記ユーザ端末機から入力された検索語を含む)と、
    前記コンピュータシステムのプロセッサが、前記受信されたログデータを用いて前記検索語別の入力回数を算定し、前記算定された検索語別の入力回数を各タイムデータと関連してデータベースに保存する段階と、
    前記コンピュータシステムのプロセッサが、前記データベースを参照して現在と現在から第2の時間間隔の長さだけ過去に遡った時点との間の期間であるスライディングウィンドウに属する一つ以上のタイムデータを識別し、前記識別されたタイムデータと関連した検索語別の入力回数を各検索語別に合算する段階と、
    前記コンピュータシステムのプロセッサが、前記合算された入力回数に基づいて前記各検索語別に将来の一定の長さの期間において発生すると予測される検索回数である推定検索回数を演算する段階と、
    前記コンピュータシステムのプロセッサが、前記合算された入力回数に基づいて前記各検索語別の入力順位数を決め、前記決められた入力順位数が大きくなると小さくなり前記決められた入力順位数が小さくなると大きくなる第3判定数値を演算する段階と、
    前記コンピュータシステムのプロセッサが、所定の回数である最小検索回数に対する前記推定検索回数の大きさとして算出される第4判定数値を前記各検索語別に演算する段階と、
    前記コンピュータシステムのプロセッサが、前記第4判定数値が所定数値以上であり、前記演算された第3判定数値が他の検索語の第3判定数値よりも相対的に高い検索語を優先してリアルタイム急上昇検索語として検出する段階と、
    を含むことを特徴とするリアルタイム急上昇検索語検出方法。
  2. 前記コンピュータシステムのプロセッサが、前記各検索語別の平均検索回数および標準偏差を用いて前記標準偏差に所定の数を掛けた値と前記平均検索回数を合算して第1判定数値を演算する段階をさらに含み、
    リアルタイム急上昇検索語を検出する前記段階は、
    前記第4判定数値が所定数値以上であり、前記演算された第3判定数値が他の検索語の第3判定数値よりも相対的に高く、かつ、前記第1判定数値以上の前記推定検索回数の検索語を優先してリアルタイム急上昇検索語を検出することを特徴とする請求項1に記載のリアルタイム急上昇検索語検出方法。
  3. 前記所定の数は3であることを特徴とする請求項2に記載のリアルタイム急上昇検索語検出方法。
  4. 前記コンピュータシステムのプロセッサが、前記データベースを参照して、EWMA管理図における重み付けを前記各検索語別に行なった統計量である第2判定数値と前記EWMA管理図における管理上限線の値とを演算する段階をさらに含み、
    リアルタイム急上昇検索語を検出する前記段階は、
    前記第4判定数値が所定数値以上であり、前記演算された第3判定数値が他の検索語の第3判定数値よりも相対的に高く、かつ、前記第2判定数値が前記管理上限線の値を超過した検索語を優先してリアルタイム急上昇検索語を検出することを特徴とする請求項1に記載のリアルタイム急上昇検索語検出方法。
  5. 前記第3判定数値は、前記決められた入力順位数の逆数であって、
    Figure 0004550781
    によって演算されることを特徴とする請求項1に記載のリアルタイム急上昇検索語検出方法。
  6. 前記最小検索回数は、前記検索語の検出を許容する下限の検索回数であって、
    前記第4判定数値は、
    Figure 0004550781
    によって演算されることを特徴とする請求項1に記載のリアルタイム急上昇検索語検出方法。
  7. 前記コンピュータシステムのプロセッサが、前記データベースを参照して前記第2の時間間隔よりも長い時間間隔と関連したタイムデータを識別し、前記識別されたタイムデータと関連した検索語別の入力回数を各検索語別に合算し記憶装置に記憶する段階と、
    前記コンピュータシステムのプロセッサが、前記合算され前記記憶装置に記憶された検索語別の入力回数を用いて、前記検索語別の平均検索回数または標準偏差を算出する段階と、
    をさらに含むことを特徴とする請求項2に記載のリアルタイム急上昇検索語検出方法。
  8. 前記コンピュータシステムのプロセッサが、前記検出された検索語を、前記第3判定数値及び/又は第4判定数値に基づいて配列した急上昇検索語リストを生成する段階と、
    前記コンピュータシステムのネットワークインターフェースが、前記生成された急上昇検索語リストを前記検索サーバに送信する段階と、
    をさらに含み、
    前記急上昇検索語リストは、あらかじめ設定された時間間隔ごとに更新されることを特徴とする請求項1に記載のリアルタイム急上昇検索語検出方法。
  9. 請求項1ないしのいずれか一項の方法をコンピュータシステムに実行させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体。
  10. ユーザ端末機からの入力回数が急上昇する検索語を検出するコンピュータシステムにおいて、
    前記コンピュータシステムの記憶装置には、第1の時間間隔と前記第1の時間間隔の一つ分又は複数分の長さを有する第2の時間間隔が記憶され、
    前記コンピュータシステムの入出力インターフェースを介して前記第1の時間間隔ごとに一つ以上の検索サーバからログデータを受信するログ収集手段(前記ログデータは、前記ユーザ端末機から入力された検索語を含む)と、
    前記コンピュータシステムのプロセッサにより、前記受信されたログデータを用いて前記検索語別の入力回数を算定し、前記算定された検索語別の入力回数を各タイムデータと関連して前記コンピュータシステムの記憶装置に格納されているデータベースに保存する入力回数算定手段と、
    前記コンピュータシステムのプロセッサにより、前記データベースを参照して現在と現在から前記第2の時間間隔の長さだけ過去に遡った時点との間の期間であるスライディングウィンドウに属する一つ以上のタイムデータを識別し、前記識別されたタイムデータと関連した検索語別の入力回数を各検索語別に合算する入力回数合算手段と、
    前記コンピュータシステムのプロセッサにより、前記合算された入力回数に基づいて前記各検索語別に将来の一定の長さの期間において発生すると予測される検索回数である推定検索回数を演算する検索回数推定手段と、
    前記コンピュータシステムのプロセッサにより、前記演算された推定検索回数に基づいて算出される前記各検索語別の入力順位数を用いて前記入力順位数が大きくなると小さくなり前記入力順位数が小さくなると大きくなる第3判定数値および所定の検索回数である最小検索回数に対する前記推定検索回数の大きさである第4判定数値を算出する判定数値演算手段と、
    前記コンピュータシステムのプロセッサにより、前記第4判定数値が所定の値以上であり、前記演算された第3判定数値が他の検索語の第3判定数値よりも相対的に高い検索語を優先してリアルタイム急上昇検索語として検出する検索語抽出手段と、
    を含むことを特徴とするリアルタイム急上昇検索語検出システム。
  11. 前記判定数値演算手段は、前記各検索語別の平均検索回数および標準偏差を用いて前記コンピュータシステムのプロセッサにより前記各検索語別の前記第2の時間間隔よりも長い時間間隔における平均検索回数および標準偏差を用いて前記標準偏差に所定の数を掛けた値と前記平均検索回数を合算して第1判定数値をさらに演算し、
    前記検索語抽出手段は、前記コンピュータシステムのプロセッサにより前記第1判定数値以上の前記推定検索回数の検索語から前記リアルタイム急上昇検索語を抽出することを特徴とする請求項10に記載のリアルタイム急上昇検索語検出システム。
  12. 前記判定数値演算手段は、前記コンピュータシステムのプロセッサにより、前記データベースを参照して、EWMA管理図における重み付けを前記各検索語別に行なった統計量である第2判定数値と前記EWMA管理図における管理上限線の値とをさらに演算し、
    前記検索語抽出手段は、前記コンピュータシステムのプロセッサにより、前記第4判定数値が所定数値以上であり、前記演算された第3判定数値が他の検索語の第3判定数値よりも相対的に高く、かつ、前記第2判定数値が前記管理上限線の値を超過した検索語を優先して前記リアルタイム急上昇検索語を抽出することを特徴とする請求項10に記載のリアルタイム急上昇検索語検出システム。
  13. 前記判定数値演算手段は、前記コンピュータシステムのプロセッサにより、前記第3判定数値を、
    Figure 0004550781
    によって演算することを特徴とする請求項10に記載のリアルタイム急上昇検索語検出システム。
  14. 前記判定数値演算手段は、前記コンピュータシステムのプロセッサにより、前記第4判定数値を、
    Figure 0004550781
    によって演算することを特徴とする請求項10に記載のリアルタイム急上昇検索語検出システム。
JP2006201489A 2005-07-27 2006-07-25 リアルタイム急上昇検索語検出方法およびリアルタイム急上昇検索語検出システム Active JP4550781B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020050068522A KR100522029B1 (ko) 2005-07-27 2005-07-27 실시간 급상승 검색어 검출 방법 및 실시간 급상승 검색어검출 시스템

Publications (2)

Publication Number Publication Date
JP2007035034A JP2007035034A (ja) 2007-02-08
JP4550781B2 true JP4550781B2 (ja) 2010-09-22

Family

ID=37305465

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006201489A Active JP4550781B2 (ja) 2005-07-27 2006-07-25 リアルタイム急上昇検索語検出方法およびリアルタイム急上昇検索語検出システム

Country Status (3)

Country Link
US (1) US7822720B2 (ja)
JP (1) JP4550781B2 (ja)
KR (1) KR100522029B1 (ja)

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7873904B2 (en) * 2007-04-13 2011-01-18 Microsoft Corporation Internet visualization system and related user interfaces
US7685099B2 (en) * 2007-06-28 2010-03-23 Microsoft Corporation Forecasting time-independent search queries
US7689622B2 (en) * 2007-06-28 2010-03-30 Microsoft Corporation Identification of events of search queries
US7693908B2 (en) * 2007-06-28 2010-04-06 Microsoft Corporation Determination of time dependency of search queries
US7685100B2 (en) * 2007-06-28 2010-03-23 Microsoft Corporation Forecasting search queries based on time dependencies
US7693823B2 (en) * 2007-06-28 2010-04-06 Microsoft Corporation Forecasting time-dependent search queries
US8090709B2 (en) * 2007-06-28 2012-01-03 Microsoft Corporation Representing queries and determining similarity based on an ARIMA model
KR100913051B1 (ko) * 2007-09-18 2009-08-20 엔에이치엔(주) 연관 급상승어 검색 방법 및 그 시스템
KR100889986B1 (ko) * 2007-11-30 2009-03-25 엔에이치엔(주) 양방향 방송 단말기를 위한 추천 키워드 제공 시스템 및방법
US7840548B2 (en) * 2007-12-27 2010-11-23 Yahoo! Inc. System and method for adding identity to web rank
JP5260969B2 (ja) * 2008-01-10 2013-08-14 日本電信電話株式会社 集中度監視によるWebサイト推奨装置、集中度監視によるWebサイト推奨方法、集中度監視によるWebサイト推奨プログラムおよびそのプログラムを記録した記録媒体
US20090287537A1 (en) * 2008-05-14 2009-11-19 Eugene Villoso Dynamic bidding and ranking system
US20090307003A1 (en) * 2008-05-16 2009-12-10 Daniel Benyamin Social advertisement network
KR100973214B1 (ko) * 2008-12-19 2010-07-30 엔에이치엔(주) 프로그램 방송 중 검색 서비스를 제공하는 방법 및 장치
US8554854B2 (en) * 2009-12-11 2013-10-08 Citizennet Inc. Systems and methods for identifying terms relevant to web pages using social network messages
US8516100B1 (en) * 2010-02-04 2013-08-20 Symantec Corporation Method and apparatus for detecting system message misrepresentation using a keyword analysis
US20110295678A1 (en) * 2010-05-28 2011-12-01 Google Inc. Expanding Ad Group Themes Using Aggregated Sequential Search Queries
CN102907090B (zh) * 2010-06-08 2015-06-24 夏普株式会社 内容重放装置、内容重放装置的控制方法
CN102375810B (zh) 2010-08-04 2014-03-19 阿里巴巴集团控股有限公司 整体帐户搜索关键词的估计值反馈方法及服务器
US8612293B2 (en) 2010-10-19 2013-12-17 Citizennet Inc. Generation of advertising targeting information based upon affinity information obtained from an online social network
US8615434B2 (en) 2010-10-19 2013-12-24 Citizennet Inc. Systems and methods for automatically generating campaigns using advertising targeting information based upon affinity information obtained from an online social network
US9063927B2 (en) 2011-04-06 2015-06-23 Citizennet Inc. Short message age classification
US8484218B2 (en) * 2011-04-21 2013-07-09 Google Inc. Translating keywords from a source language to a target language
US9191218B1 (en) * 2011-05-13 2015-11-17 Amazon Technologies, Inc. Participant reputation in a group communication environment
US9002892B2 (en) 2011-08-07 2015-04-07 CitizenNet, Inc. Systems and methods for trend detection using frequency analysis
JP5398811B2 (ja) * 2011-11-21 2014-01-29 日本電信電話株式会社 文書分類装置及び方法及びプログラム
US9053497B2 (en) 2012-04-27 2015-06-09 CitizenNet, Inc. Systems and methods for targeting advertising to groups with strong ties within an online social network
KR101639426B1 (ko) * 2013-12-27 2016-07-13 주식회사 유니크래스 이슈 생성 애플리케이션 서비스 시스템 및 그 서비스 제공방법
CN104077354B (zh) * 2014-05-29 2017-09-29 小米科技有限责任公司 论坛中帖子的热度确定方法及相关装置
KR101568800B1 (ko) * 2014-08-25 2015-11-16 주식회사 카카오 실시간 이슈 검색어 선별 방법 및 시스템
JP6019156B2 (ja) * 2015-03-20 2016-11-02 ヤフー株式会社 情報処理装置、情報処理方法および情報処理プログラム
CN106294414B (zh) * 2015-05-25 2020-12-01 腾讯科技(深圳)有限公司 数据排序方法及装置
CN105488599B (zh) * 2015-12-29 2020-03-06 杭州数梦工场科技有限公司 预测文章热度的方法和装置
US10929264B2 (en) * 2016-09-14 2021-02-23 International Business Machines Corporation Measuring effective utilization of a service practitioner for ticket resolution via a wearable device
US10585923B2 (en) * 2017-04-25 2020-03-10 International Business Machines Corporation Generating search keyword suggestions from recently used application
CN110008403B (zh) * 2019-03-05 2021-05-28 百度在线网络技术(北京)有限公司 目标信息的排序方法、排序系统、推荐方法及推荐系统
CN110879771A (zh) * 2019-11-05 2020-03-13 北京航空航天大学 一种基于关键词序列挖掘的用户异常检测的日志分析系统
KR102556550B1 (ko) * 2021-03-10 2023-07-18 주식회사 단빛 공간정보 시스템 활용 예측 지수 계산 장치 및 방법

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000194745A (ja) * 1998-12-25 2000-07-14 Nec Corp トレンド評価装置及びトレンド評価方法
JP2000339316A (ja) * 1999-05-25 2000-12-08 Nippon Telegr & Teleph Corp <Ntt> 検索連動型情報収集方法、装置及びその方法を記憶した記録媒体
JP2002123517A (ja) * 2000-10-16 2002-04-26 Noboru Hayakawa 検索キーワード解析システム
JP2004206517A (ja) * 2002-12-26 2004-07-22 Nifty Corp ホットキーワード提示方法及びホットサイト提示方法
JP2005122683A (ja) * 2003-09-22 2005-05-12 Nippon Telegr & Teleph Corp <Ntt> 情報提供方法及びシステム及び情報提供プログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001031514A2 (en) * 1999-10-28 2001-05-03 General Electric Company A process for the monitoring and diagnostics of data from a remote asset
US20020059272A1 (en) * 2000-04-20 2002-05-16 Porter Edward W. Apparatuses, methods, programming, and propagated signals for creating, editing, organizing and viewing collaborative databases
US7324990B2 (en) * 2002-02-07 2008-01-29 The Relegence Corporation Real time relevancy determination system and a method for calculating relevancy of real time information

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000194745A (ja) * 1998-12-25 2000-07-14 Nec Corp トレンド評価装置及びトレンド評価方法
JP2000339316A (ja) * 1999-05-25 2000-12-08 Nippon Telegr & Teleph Corp <Ntt> 検索連動型情報収集方法、装置及びその方法を記憶した記録媒体
JP2002123517A (ja) * 2000-10-16 2002-04-26 Noboru Hayakawa 検索キーワード解析システム
JP2004206517A (ja) * 2002-12-26 2004-07-22 Nifty Corp ホットキーワード提示方法及びホットサイト提示方法
JP2005122683A (ja) * 2003-09-22 2005-05-12 Nippon Telegr & Teleph Corp <Ntt> 情報提供方法及びシステム及び情報提供プログラム

Also Published As

Publication number Publication date
JP2007035034A (ja) 2007-02-08
US20090049029A1 (en) 2009-02-19
US7822720B2 (en) 2010-10-26
KR100522029B1 (ko) 2005-10-18

Similar Documents

Publication Publication Date Title
JP4550781B2 (ja) リアルタイム急上昇検索語検出方法およびリアルタイム急上昇検索語検出システム
US10614077B2 (en) Computer system for automated assessment at scale of topic-specific social media impact
US20210216915A1 (en) Systems and Methods for Predictive Coding
JP2019509556A (ja) ユーザー・クレジット評価方法、装置及び記憶媒体
US20110313817A1 (en) Key performance indicator weighting
US20140189000A1 (en) Social media impact assessment
US11620474B2 (en) Model reselection for accommodating unsatisfactory training data
US11809505B2 (en) Method for pushing information, electronic device
JP4910804B2 (ja) 業務プロセス推定プログラム、業務プロセス推定方法および業務プロセス推定装置
JP2018077821A (ja) ユーザによって訪問される施設のカテゴリの予測モデルを生成する方法、プログラム、サーバ装置、及び処理装置
KR101132450B1 (ko) 실시간 급상승 키워드 추출 방법 및 실시간 급상승 키워드추출 시스템
US8234584B2 (en) Computer system, information collection support device, and method for supporting information collection
CN111311286A (zh) 一种智能客服数据处理方法、装置及计算设备、存储介质
JP5061999B2 (ja) 解析装置、解析方法及び解析プログラム
US10296924B2 (en) Document performance indicators based on referral context
JP2007323315A (ja) 協調フィルタリング方法、協調フィルタリング装置、および協調フィルタリングプログラムならびにそのプログラムを記録した記録媒体
RU2640637C2 (ru) Способ и сервер проведения контролируемого эксперимента с использованием прогнозирования будущего пользовательского поведения
US11734063B2 (en) Job management based on generated execution time prediction model and prediction accuracy
US11790278B2 (en) Determining rationale for a prediction of a machine learning based model
CN113010782B (zh) 需求量获取方法、装置、电子设备以及计算机可读介质
JP5515117B2 (ja) データ処理装置
US20130152091A1 (en) Optimized Judge Assignment under Constraints
JP2013037478A (ja) 作業工数算出装置、作業工数算出方法、およびプログラム
KR20070095552A (ko) 실시간 급상승 키워드 추출 방법 및 실시간 급상승 키워드추출 시스템
CN114416513B (zh) 搜索数据的处理方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090714

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20090902

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20090910

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20091013

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20091016

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091113

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100112

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100408

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100706

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100708

R150 Certificate of patent or registration of utility model

Ref document number: 4550781

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130716

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250