JP5514703B2 - 検索ログに応じた関連情報を配信する検索配信サーバ、プログラム及び方法 - Google Patents

検索ログに応じた関連情報を配信する検索配信サーバ、プログラム及び方法 Download PDF

Info

Publication number
JP5514703B2
JP5514703B2 JP2010265653A JP2010265653A JP5514703B2 JP 5514703 B2 JP5514703 B2 JP 5514703B2 JP 2010265653 A JP2010265653 A JP 2010265653A JP 2010265653 A JP2010265653 A JP 2010265653A JP 5514703 B2 JP5514703 B2 JP 5514703B2
Authority
JP
Japan
Prior art keywords
search
keyword
related information
analysis target
class
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2010265653A
Other languages
English (en)
Other versions
JP2012118628A (ja
Inventor
恵美 森田
由希子 土生
啓一郎 帆足
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2010265653A priority Critical patent/JP5514703B2/ja
Publication of JP2012118628A publication Critical patent/JP2012118628A/ja
Application granted granted Critical
Publication of JP5514703B2 publication Critical patent/JP5514703B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、検索ログに応じた関連情報を配信する検索配信サーバの技術に関する。特に、関連情報に広告情報を対応付けた、ユーザの行動ターゲティング型の広告配信サービスの技術に関する。
行動ターゲティング型の広告配信サービスとして、ユーザによって操作される端末(パーソナルコンピュータ、携帯端末又は携帯電話機)から検索サーバへ送信された検索ログ(キーワードや宛先アドレス)に応じて、広告情報を配信する技術がある(例えば特許文献1参照)。この技術によれば、「検索ログ」が収集され、これら検索ログを分析することによってそのユーザに対する広告情報が選択される。そして、ユーザが閲覧している端末のWebページ上に、選択された広告情報が表示される。これによって、ユーザの行動情報(嗜好情報)と適合する広告情報のみが、そのユーザに配信される。広告主(又はコンテンツ配信主)にとっては、嗜好に合うユーザに対してのみ、ピンポイント的に広告情報を配信することができる。
図1は、従来技術に基づく検索配信サーバの機能構成図である。
図1の検索配信サーバは、特許文献1に記載された技術に基づくものであって、インターネットに接続する通信インタフェース100と、情報検索エンジン部101と、検索ログ蓄積部102と、分析対象キーワード抽出部103と、分析対象キーワードリスト104と、分析対象検索ログ抽出部105と、検索セッション分割部106と、検索セッションクラス抽出部107と、ユーザ帰属クラス算出部108と、配信先決定部109とを有する。
情報検索エンジン部101は、検索キーワードに応じた、Webサイトのアドレス(URL(Uniform Resource Locator))を膨大に蓄積している。検索配信サーバ1は、携帯電話機専用の検索サイトとして機能するものであってもよいし、汎用的なものであってもよい。情報検索エンジン部101は、通信インタフェース100を介して、端末2から検索キーワードを受信し、その検索キーワードに応じたURLを検索する。検索結果情報は、検索キーワードの送信元となる端末2へ返信される。そして、情報検索エンジン部101は、検索ログ蓄積部102へ、その検索ログを出力する。
検索ログ蓄積部102は、情報検索エンジン部101から出力された検索ログを、蓄積する。図1に表されているように、「検索ログ」とは、ユーザによって操作される端末を特定するための「ユーザ識別子」と、端末から検索された「検索時刻」及び「検索キーワード」とを含む。
[ユーザID]<->[検索時刻][検索キーワード]
分析対象キーワード抽出部103は、検索ログ蓄積部102に蓄積された検索ログの中で、出現頻度が高い順に所定数(例えばM、M≧1を満たす整数)のキーワードを、「分析対象キーワード」として抽出する。抽出された分析対象キーワードは、分析対象キーワードリスト104へ出力される。
分析対象キーワードリスト104は、分析対象キーワード抽出部103から出力された分析対象キーワードを記録する。
分析対象検索ログ抽出部105は、検索ログ蓄積部102に蓄積された検索ログの中で、分析対象キーワードリスト104の分析対象キーワードを含む検索ログを、「分析対象検索ログ」として抽出する。これによって、全ての検索ログを分析することなく、ユーザが比較的多く検索した検索ログのみに集約することができる。抽出された分析対象検索ログは、検索セッション分割部106へ出力される。
検索セッション分割部106は、検索時刻に応じて、1つ以上の分析対象検索ログをまとめた複数の検索セッションに分割する。具体的には、検索時刻の差異が所定時間内である1以上の検索ログを、同一の検索セッションに分類する。分割された複数の検索セッションは、検索セッションクラス抽出部107へ出力される。
検索セッションクラス抽出部107は、複数の検索セッションを入力する。入力された検索セッションは、互いに類似する検索キーワードを含む検索セッション同士が同一のクラスとなるようにクラスタリング(例えばk-means)される。ここで、クラスタリングには、検索時刻から潜在クラスを抽出できる「潜在クラス抽出」技術を用いるのが好ましい(例えば非特許文献1参照)。k個のクラスにクラスタリングされた検索セッションは、ユーザ帰属クラス算出部108へ出力される。
ユーザ帰属クラス算出部108は、ユーザの検索ログ毎に、各クラスに対する帰属確率を算出する。
配信決定部109は、当該ユーザの帰属確率が所定閾値以上となるクラスを抽出する。そして、当該ユーザに対して、抽出されたクラスに基づく広告情報が配信される。
図1の検索配信サーバ1によれば、そのユーザの検索ログには含まれないキーワードであっても、そのユーザが属するクラスの他のユーザの検索ログにそのキーワードが含まれている場合、当該ユーザもそのキーワードに興味があると推定する。これによって、広告情報のキーワードが、ユーザが過去に入力した検索キーワードと一致する場合のみに限られない。即ち、検索キーワードと異なるキーワードであっても、他のユーザの検索ログに基づいて関連性が高いと推定されるキーワードについては、ユーザの嗜好に応じたものと推定し、その広告情報を配信する。
特開2010−102385号公報
A.P. Dempster, N.M. Laird, D.B. Rubin:Maximum likelihood from incomplete data via the EM algorithm, Journal of RoyalStatistic Society, Series B39, pp. 1-38, 1976.
図1及び非特許文献1に記載された技術によれば、ユーザの検索ログ(嗜好)に基づいてクラスを生成し、これらクラスを用いて当該ユーザに配信される広告情報が選択される。これは、あくまで「ユーザの観点」に基づくものである。
しかしながら、広告情報の中における重要キーワードであっても、ユーザから指定される検索キーワードに含まれる数が少ない場合、そのキーワードはどのクラスにも属しないこととなる。その結果、その広告情報は、その重要キーワードに基づいて配信されることはない。即ち、広告主(又はコンテンツ配信主)の観点から有利な広告情報を配信することが難しいことを意味する。これは、広告配信効果の適切な見積りができないおそれや、その広告情報に適合するユーザに対して広告情報を配信する機会を損失するおそれがある。従来技術は、広告情報に応じてクラスが生成されたものではなく、「広告主の観点」に基づくものではない。
そこで、本発明は、広告主の観点から、ユーザの検索ログに応じた広告情報(関連情報)を配信することができる検索配信サーバ、プログラム及び方法を提供することを目的とする。
本発明によれば、ユーザによって操作される端末から受信した検索キーワードによって情報を検索する情報検索エンジン手段と、
情報検索エンジン手段によって得られた、ユーザ識別子毎の検索キーワード及び検索時刻からなる検索ログを蓄積する検索ログ蓄積手段と、
検索ログ蓄積手段に蓄積された検索ログの中で、出現頻度が高い順に所定数のキーワードを、分析対象キーワードとして抽出する分析対象キーワード抽出手段と、
分析対象キーワードを記録した分析対象キーワードリストと
検索ログ蓄積手段に蓄積された検索ログの中で、分析対象キーワードを含む検索ログを、分析対象検索ログとして抽出する分析対象検索ログ抽出手段と、
検索時刻に応じて、1つ以上の分析対象検索ログをまとめた複数の検索セッションに分割する検索セッション分割手段と、
検索セッションを複数のクラスにクラスタリングする検索セッションクラス抽出手段と
を有し、各クラスに含まれる検索ログの検索キーワードに応じた関連情報を配信することできる検索配信サーバにおいて、
関連情報の配信ユーザによって設定された関連情報キーワードを記録する関連情報キーワードリストと
関連情報キーワードリストの関連情報キーワードを、分析対象キーワードリストに付加する関連情報キーワード付加手段と、
検索セッションクラス抽出手段によって生成されたk個のクラスの中で、関連情報キーワードが含まれたクラスを、帰属クラスとして検出するキーワード帰属クラス算出手段と、
帰属クラスに含まれる検索ログのユーザ識別子を抽出し、当該ユーザ識別子に対応する端末へ、関連情報を配信する配信先決定手段と
を有することを特徴とする。
本発明の検索配信サーバにおける他の実施形態によれば、
関連情報は、広告情報であり、
関連情報キーワードリストの関連情報キーワードは、関連情報の配信ユーザとしての広告主によって設定される
ことも好ましい。
本発明の検索配信サーバにおける他の実施形態によれば、
広告情報に含まれる文章から形態素解析によってキーワードを抽出すると共に、TF−IDF(Term Frequency - Inverse Document Frequency:単語の出現頻度−逆出現頻度)によって特徴的な単語を、関連情報キーワードとして関連情報キーワードリストに記録する関連情報キーワード抽出手段を更に有することも好ましい。
本発明の検索配信サーバにおける他の実施形態によれば、
キーワード帰属クラス算出手段は、関連情報キーワードリストの関連情報キーワード毎に、各クラスに対する帰属確率を算出し、所定確率以上のクラスをキーワード帰属クラスとして検出することも好ましい。
本発明の検索配信サーバにおける他の実施形態によれば、
関連情報キーワードリストの関連情報キーワード毎に、重みwが付与されており、
キーワード帰属クラス算出手段は、関連情報キーワードリストの関連情報キーワード毎に、当該重みwを重み付けして、各クラスに対する帰属確率を算出することも好ましい。
本発明によれば、ユーザによって操作される端末から受信した検索キーワードによって情報を検索する情報検索エンジン手段と、
情報検索エンジン手段によって得られた、ユーザ識別子毎の検索キーワード及び検索時刻からなる検索ログを蓄積する検索ログ蓄積手段と、
検索ログ蓄積手段に蓄積された検索ログの中で、出現頻度が高い順に所定数のキーワードを、分析対象キーワードとして抽出する分析対象キーワード抽出手段と、
分析対象キーワードを記録した分析対象キーワードリストと、
検索ログ蓄積手段に蓄積された検索ログの中で、分析対象キーワードを含む検索ログを、分析対象検索ログとして抽出する分析対象検索ログ抽出手段と、
検索時刻に応じて、1つ以上の分析対象検索ログをまとめた複数の検索セッションに分割する検索セッション分割手段と、
検索セッションを複数のクラスにクラスタリングする検索セッションクラス抽出手段と
してコンピュータを機能させ、各クラスに含まれる検索ログの検索キーワードに応じた関連情報を配信することできるサーバ用の検索配信プログラムにおいて、
関連情報の配信ユーザによって設定された関連情報キーワードを記録する関連情報キーワードリストと
関連情報キーワードリストの関連情報キーワードを、分析対象キーワードリストに付加する関連情報キーワード付加手段と、
検索セッションクラス抽出手段によって生成されたk個のクラスの中で、関連情報キーワードが含まれたクラスを、帰属クラスとして検出するキーワード帰属クラス算出手段と、
帰属クラスに含まれる検索ログのユーザ識別子を抽出し、当該ユーザ識別子に対応する端末へ、関連情報を配信する配信先決定手段と
してコンピュータを機能させることを特徴とする。
本発明によれば、ユーザによって操作される端末から受信した検索キーワードによって情報を検索する情報検索エンジン部と、
情報検索エンジン部によって得られた、ユーザ識別子毎の検索キーワード及び検索時刻からなる検索ログを蓄積する検索ログ蓄積部と
を有し、
検索ログ蓄積部に蓄積された検索ログの中で、出現頻度が高い順に所定数のキーワードを、分析対象キーワードとして抽出する第1のステップと、
分析対象キーワードを分析対象キーワードリストに記録する第2のステップと、
検索ログ蓄積部に蓄積された検索ログの中で、分析対象キーワードを含む検索ログを、分析対象検索ログとして抽出する第3のステップと、
検索時刻に応じて、1つ以上の分析対象検索ログをまとめた複数の検索セッションに分割する第4のステップと、
検索セッションをk個のクラスにクラスタリングする第5のステップと
を有し、各クラスに含まれる検索ログの検索キーワードに応じた関連情報を配信することできるサーバの検索配信方法において、
関連情報の配信ユーザによって設定された関連情報キーワードを記録する関連情報キーワードリストを更に有し、
第2のステップについて、関連情報キーワードリストの関連情報キーワードを、分析対象キーワードリストに付加し、
第5のステップによって生成されたk個のクラスの中で、関連情報キーワードが含まれたクラスを、帰属クラスとして検出する第6のステップと、
帰属クラスに含まれる検索ログのユーザ識別子を抽出し、当該ユーザ識別子に対応する端末へ、関連情報を配信する第7のステップと
を更に有することを特徴とする。
本発明の検索配信サーバ、プログラム及び方法によれば、広告主の観点から、ユーザの検索ログに応じた広告情報(関連情報)を配信することができる。
従来技術における検索配信サーバの機能構成図である。 本発明におけるシステム構成図である。 本発明における検索配信サーバの機能構成図である。 本発明におけるクラスの構成を表す説明図である。 本発明における検索配信方法のフローチャートである。
以下、本発明の実施の形態について、図面を用いて詳細に説明する。
図2は、本発明におけるシステム構成図である。
図2によれば、検索配信サーバ1は、検索エンジンを有しており、インターネットを介して複数のWebサーバ4から、アドレス情報及びインデックス情報を自動的に収集し、蓄積する。また、ユーザによって操作される端末2は、アクセスネットワーク及びインターネットを介して、検索配信サーバ1にアクセスし、検索キーワードを送信することによって、所望のWebサイトを検索することができる。検索配信サーバ1は、端末2に対して所望のWebサイトのアドレス情報を返信すると共に、その端末2からの検索ログを収集する。
本発明によれば、広告主によって操作される配信端末3が、アクセスネットワーク及びインターネットを介して、検索配信サーバ1へアクセスする。配信端末3は、広告主によって配信が所望される広告情報(関連情報)を、検索配信サーバ1へ送信する。尚、広告情報と、広告主によって指定された関連情報キーワードとを合わせて、検索配信サーバ1へ送信するものであってもよい。
そして、検索配信サーバ1は、広告情報に基づいて検索ログを分析(クラスタリング)することによって、広告情報を配信するに適切なユーザに対応する端末2を抽出し、その端末2へその広告情報を配信する。
図3は、本発明における検索配信サーバの機能構成図である。
図4は、本発明におけるクラスの構成を表す説明図である。
図3によれば、図1の検索配信サーバ1におけるユーザ帰属クラス算出部108以外の全ての機能構成部(100,101〜107,109)を含む。本発明の検索配信サーバ1によれば、更に、関連情報キーワード抽出部111と、関連情報キーワードリスト112と、関連情報キーワード付加部113と、キーワード帰属クラス算出部114とを有する。これら機能構成部は、サーバに搭載されたコンピュータを機能させるプログラムを実行することによって実現される。
関連情報キーワード抽出部111は、配信端末3から広告情報(関連情報)を受信し、その広告情報から関連情報キーワードを抽出する。抽出された関連情報キーワードは、関連情報キーワードリスト112へ出力される。尚、関連情報キーワード抽出部111は、オプション的なものであってもよい。その場合、広告主が、広告情報と共に、関連情報キーワードも指定することとなる。
関連情報キーワード抽出部111は、広告情報に含まれる文章を形態素解析した後に、文章内の単語同士の出現共起確率から文章中の特徴的な単語を、関連情報キーワードとして抽出するものであってもよい。関連情報キーワードは、例えばTF−IDF(Term Frequency - Inverse Document Frequency:単語の出現頻度−逆出現頻度)によって抽出されることが好ましい。勿論、TF(Term Frequency)又は他のアルゴリズムによるものであってもよい。
関連情報キーワードリスト112は、関連情報キーワードを記録する。関連情報キーワード抽出部111の機能を備えない場合、関連情報キーワードリスト112は、通信インタフェース部100を介して、配信端末3から受信した関連情報キーワードを蓄積する。
関連情報キーワード付加部113は、関連情報キーワードリスト112の関連情報キーワードを、分析対象キーワードリスト104に付加する。関連情報キーワードリストには、分析対象キーワードリストに含まれていないキーワードが含まれている場合がある。即ち、分析対象キーワードリストに、関連情報キーワードリストのキーワードが追加されることとなる。これにより、広告主が設定した関連情報キーワードを含む検索ログが、分析対象検索ログとして確実に含まれる。そして、関連情報キーワードを含む検索ログが、検索セッションのクラスに含まれる。
図4(a)は、分析対象キーワードに、関連情報キーワードK4が付加された場合を表す。当初の分析対象キーワードがn個であれば、関連情報キーワードを付加した後の分析対象キーワードは、m個(m>n)となる。
図4(b)は、検索セッション分割部106によって分割された検索セッションを表す。検索セッションは、検索時刻範囲によって分割されたものであって、同一のユーザ識別子に対しても検索時刻範囲によって複数の検索セッションに分割される。図4(b)によれば、7個の検索セッションに分割されており、各検索セッションに含まれるキーワードが表されている。
検索セッションID:キーワード
11 :{K2,K4}
12 :{K1,K2}
13 :{K1,K2}
14 :{K4}
21 :{K2,K4}
31 :{K4}
41 :{K1,K2,K3}
尚、図4(b)によれば、ユーザID(T0001)の検索ログは、検索時刻範囲に応じて4つのセッションID(11〜14)に分割されている。その他のユーザID(T0002〜T0004)の検索ログはそれぞれ、1つのセッションID(21,31,41)に分割される。
図4(c)は、検索セッションクラス抽出部107によって抽出されたクラスを表す。クラスタリングは、例えばk-meansのような既存のアルゴリズムが用いられる。互いに類似する検索キーワードを含む検索セッション同士が同一のクラスとなるように、k個のクラスにクラスタリングされる。図4(c)によれば、例えば以下のようにクラスタリングされる。
クラス:検索セッションID
c1 : 14,21,31
c2 : 11
c3 : 12,13
c4 : 41
複数のクラスは、検索ログの検索キーワードの動向だけでなく、広告情報(関連情報)の関連情報キーワードの動向を反映して、生成される。
キーワード帰属クラス算出部114は、検索セッションクラス抽出部107から、k個のクラスを入力し、各クラスに検索セッションが属する。そして、キーワード帰属クラス算出部114は、各クラスに対する当該関連情報キーワードの帰属確率を算出する。
図4(d)は、各クラスcj(1≦j≦k)に属するキーワード群に対する、関連情報キーワード群ki(1≦i≦m)の帰属確率ProbClass(ki,cj)を算出する。クラス群Cの各クラスckには、1つ以上の検索セッションが属し、各検索セッションには、検索キーワードが含まれる。具体的には、例えば全てのクラスcj∈Cに対するキーワードの帰属スコアScore(k,cj)は、以下のように表される。
Score(k,cj)=Σi=1 m ProbClass(ki,cj)
図4(e)は、帰属確率が所定閾値以上となるクラスの抽出を表す。そして、キーワード帰属クラス算出部114は、所定閾値以上の帰属確率を有するクラスを、キーワード帰属クラスとして、配信先決定部109へ出力する。
尚、キーワード帰属クラス算出部114は、関連情報キーワード毎に、重みwが付与されていてもよい。関連情報キーワードki毎に、重みwが、前述のProbClass(ki,cj)に乗算される。この重みwは、広告主によって設定されるものであってもよい。また、関連情報キーワード抽出部114によれば、広告情報における出現頻度が高い関連情報キーワードに、高い重みwを設定するものであってもよい。これによって、広告主によって主観的に重要と思われる関連情報キーワードは、高い重みwの帰属確率で算出される。
配信先決定部109は、キーワード帰属クラス(及びそのクラスに含まれる検索セッション)を入力する。そして、配信先決定部109は、キーワード帰属クラスに属する検索セッションに含まれるユーザ識別子を抽出する。そして、抽出されたユーザ識別子に対応する端末へ、広告情報(関連情報)が配信される。
図4(f)によれば、キーワード帰属クラスに属する検索セッションに含まれるユーザ識別子の抽出を表す。関連情報キーワードの所属する4つの検索セッションのうち、割合が高いクラスには3つのユーザ識別子が含まれている。
尚、本発明によれば、図1に基づく従来技術の検索配信サーバによって生成されたクラスと、図3に基づく本発明の検索配信サーバによって生成されたクラスとを比較することによって、ユーザの観点と広告主の観点との差を見出すこともできる。これは、分析対象キーワードリスト104に、関連情報キーワードを付加するか否かによって制御することができる。
図5は、本発明における検索配信方法のフローチャートである。
(S501)検索配信サーバは、広告主によって操作される関連情報端末から、広告情報を受信する。尚、広告主によって操作される関連情報端末から、広告主によって指定された1つ以上の関連情報キーワードを受信するものであってもよい。
(S502)広告情報に含まれる文章から、関連情報キーワードが抽出される。関連情報キーワードは、形態素解析によって抽出された単語の中で、例えばTF−IDFによって抽出された特徴的な単語である。
(S503)関連情報キーワードは、分析対象キーワードリストに付加される。
(S511)検索配信サーバは、ユーザによって操作される端末から、検索キーワードを受信する。
(S512)検索キーワードに対応付けられた、Webサイトのアドレスが、検索される。
(S513)そして、検索配信サーバは、検索結果となるアドレスを、端末へ返信する。
(S514)「ユーザ識別子」「検索時刻」「検索キーワード」を対応付けた「検索ログ」が、検索ログ蓄積部に蓄積される。
(S521)検索ログ蓄積部に蓄積された検索ログの中で、出現頻度の高い順に所定数のキーワードが、分析対象キーワードとして抽出される。
(S522)抽出された分析対象キーワードは、分析対象キーワードリストに記録される。
(S523)検索ログ蓄積部に蓄積された検索ログの中で、分析対象キーワードリストに記録された分析対象キーワードを含む検索ログが、分析対象検索ログとして抽出される。
(S524)分析対象検索ログは、検索時刻に応じて、1つ以上の分析対象検索ログをまとめた複数の検索セッションに分割される。
(S525)分割された検索セッションは、k個のクラスにクラスタリングされる。
(S526)生成されたk個のクラスの中で、関連情報キーワードが含まれたクラスが、帰属クラスとして検出される。
(S527)関連情報は、帰属クラスに属する1つ以上の検索セッションに含まれるユーザ識別子を抽出し、当該ユーザ識別子に対応する端末へ関連情報を配信する。
以上、詳細に説明したように、本発明の検索配信サーバ、プログラム及び方法によれば、広告主の観点から、ユーザの検索ログに応じた広告情報(関連情報)を配信することができる。
従来、広告情報(関連情報)を、どのクラスに属するユーザへ送信すべきかを判断することは困難であった。特に、当該ユーザの検索ログに含まれないような関連情報キーワードを用いて、そのユーザへ広告情報を配信することはできなかった。これに対し、本発明によれば、広告主(又は広告情報)によって設定されたキーワードであって、且つ、そのユーザの検索ログに含まれないものであっても、そのユーザへその広告情報を送信することができる。これは、広告主によって設定された関連情報キーワードを、分析対象検索ログに含めて、検索セッションのクラスを生成することによって、その広告情報に適した配信効果の高いクラスを検出することができる。
前述した本発明の種々の実施形態について、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略は、当業者によれば容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。
1 検索配信サーバ
100 通信インタフェース
101 情報検索エンジン部
102 検索ログ蓄積部
103 分析対象キーワード抽出部
104 分析対象キーワードリスト
105 分析対象検索ログ抽出部
106 検索セッション分割部
107 検索セッションクラス抽出部
108 ユーザ帰属クラス算出部
109 配信先決定部
111 関連情報キーワード抽出部
112 関連情報キーワードリスト
113 関連情報キーワード付加部
114 キーワード帰属クラス算出部
2 端末
3 配信端末
4 Webサーバ

Claims (7)

  1. ユーザによって操作される端末から受信した検索キーワードによって情報を検索する情報検索エンジン手段と、
    前記情報検索エンジン手段によって得られた、ユーザ識別子毎の検索キーワード及び検索時刻からなる検索ログを蓄積する検索ログ蓄積手段と、
    前記検索ログ蓄積手段に蓄積された検索ログの中で、出現頻度が高い順に所定数のキーワードを、分析対象キーワードとして抽出する分析対象キーワード抽出手段と、
    前記分析対象キーワードを記録した分析対象キーワードリストと
    前記検索ログ蓄積手段に蓄積された前記検索ログの中で、前記分析対象キーワードを含む検索ログを、分析対象検索ログとして抽出する分析対象検索ログ抽出手段と、
    検索時刻に応じて、1つ以上の分析対象検索ログをまとめた複数の検索セッションに分割する検索セッション分割手段と、
    前記検索セッションを複数のクラスにクラスタリングする検索セッションクラス抽出手段と
    を有し、各クラスに含まれる検索ログの検索キーワードに応じた関連情報を配信することできる検索配信サーバにおいて、
    前記関連情報の配信ユーザによって設定された関連情報キーワードを記録する関連情報キーワードリストと
    前記関連情報キーワードリストの関連情報キーワードを、前記分析対象キーワードリストに付加する関連情報キーワード付加手段と、
    前記検索セッションクラス抽出手段によって生成されたk個のクラスの中で、前記関連情報キーワードが含まれたクラスを、帰属クラスとして検出するキーワード帰属クラス算出手段と、
    前記帰属クラスに含まれる前記検索ログの前記ユーザ識別子を抽出し、当該ユーザ識別子に対応する端末へ、前記関連情報を配信する配信先決定手段と
    を有することを特徴とする検索配信サーバ。
  2. 前記関連情報は、広告情報であり、
    前記関連情報キーワードリストの前記関連情報キーワードは、前記関連情報の配信ユーザとしての広告主によって設定される
    ことを特徴とする請求項1に記載の検索配信サーバ。
  3. 前記広告情報に含まれる文章から形態素解析によってキーワードを抽出すると共に、TF−IDF(Term Frequency - Inverse Document Frequency:単語の出現頻度−逆出現頻度)によって特徴的な単語を、前記関連情報キーワードとして前記関連情報キーワードリストに記録する関連情報キーワード抽出手段を更に有することを特徴とする請求項2に記載の検索配信サーバ。
  4. 前記キーワード帰属クラス算出手段は、前記関連情報キーワードリストの前記関連情報キーワード毎に、各クラスに対する帰属確率を算出し、所定確率以上のクラスをキーワード帰属クラスとして検出することを特徴とする請求項1から3のいずれか1項に記載の検索配信サーバ。
  5. 前記関連情報キーワードリストの前記関連情報キーワード毎に、重みwが付与されており、
    前記キーワード帰属クラス算出手段は、前記関連情報キーワードリストの前記関連情報キーワード毎に、当該重みwを重み付けして、各クラスに対する帰属確率を算出することを特徴とする請求項4に記載の検索配信サーバ。
  6. ユーザによって操作される端末から受信した検索キーワードによって情報を検索する情報検索エンジン手段と、
    前記情報検索エンジン手段によって得られた、ユーザ識別子毎の検索キーワード及び検索時刻からなる検索ログを蓄積する検索ログ蓄積手段と、
    前記検索ログ蓄積手段に蓄積された検索ログの中で、出現頻度が高い順に所定数のキーワードを、分析対象キーワードとして抽出する分析対象キーワード抽出手段と、
    前記分析対象キーワードを記録した分析対象キーワードリストと、
    前記検索ログ蓄積手段に蓄積された前記検索ログの中で、前記分析対象キーワードを含む検索ログを、分析対象検索ログとして抽出する分析対象検索ログ抽出手段と、
    検索時刻に応じて、1つ以上の分析対象検索ログをまとめた複数の検索セッションに分割する検索セッション分割手段と、
    前記検索セッションを複数のクラスにクラスタリングする検索セッションクラス抽出手段と
    してコンピュータを機能させ、各クラスに含まれる検索ログの検索キーワードに応じた関連情報を配信することできるサーバ用の検索配信プログラムにおいて、
    前記関連情報の配信ユーザによって設定された関連情報キーワードを記録する関連情報キーワードリストと
    前記関連情報キーワードリストの関連情報キーワードを、前記分析対象キーワードリストに付加する関連情報キーワード付加手段と、
    前記検索セッションクラス抽出手段によって生成されたk個のクラスの中で、前記関連情報キーワードが含まれたクラスを、帰属クラスとして検出するキーワード帰属クラス算出手段と、
    前記帰属クラスに含まれる前記検索ログの前記ユーザ識別子を抽出し、当該ユーザ識別子に対応する端末へ、前記関連情報を配信する配信先決定手段と
    してコンピュータを機能させることを特徴とするサーバ用の検索配信プログラム。
  7. ユーザによって操作される端末から受信した検索キーワードによって情報を検索する情報検索エンジン部と、
    前記情報検索エンジン部によって得られた、ユーザ識別子毎の検索キーワード及び検索時刻からなる検索ログを蓄積する検索ログ蓄積部と
    を有し、
    前記検索ログ蓄積部に蓄積された検索ログの中で、出現頻度が高い順に所定数のキーワードを、分析対象キーワードとして抽出する第1のステップと、
    前記分析対象キーワードを分析対象キーワードリストに記録する第2のステップと、
    前記検索ログ蓄積部に蓄積された前記検索ログの中で、前記分析対象キーワードを含む検索ログを、分析対象検索ログとして抽出する第3のステップと、
    検索時刻に応じて、1つ以上の分析対象検索ログをまとめた複数の検索セッションに分割する第4のステップと、
    前記検索セッションをk個のクラスにクラスタリングする第5のステップと
    を有し、各クラスに含まれる検索ログの検索キーワードに応じた関連情報を配信することできるサーバの検索配信方法において、
    前記関連情報の配信ユーザによって設定された関連情報キーワードを記録する関連情報キーワードリストを更に有し、
    第2のステップについて、前記関連情報キーワードリストの関連情報キーワードを、前記分析対象キーワードリストに付加し、
    第5のステップによって生成されたk個のクラスの中で、前記関連情報キーワードが含まれたクラスを、帰属クラスとして検出する第6のステップと、
    前記帰属クラスに含まれる前記検索ログの前記ユーザ識別子を抽出し、当該ユーザ識別子に対応する端末へ、前記関連情報を配信する第7のステップと
    を更に有することを特徴とするサーバ用の検索配信方法。
JP2010265653A 2010-11-29 2010-11-29 検索ログに応じた関連情報を配信する検索配信サーバ、プログラム及び方法 Active JP5514703B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010265653A JP5514703B2 (ja) 2010-11-29 2010-11-29 検索ログに応じた関連情報を配信する検索配信サーバ、プログラム及び方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010265653A JP5514703B2 (ja) 2010-11-29 2010-11-29 検索ログに応じた関連情報を配信する検索配信サーバ、プログラム及び方法

Publications (2)

Publication Number Publication Date
JP2012118628A JP2012118628A (ja) 2012-06-21
JP5514703B2 true JP5514703B2 (ja) 2014-06-04

Family

ID=46501404

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010265653A Active JP5514703B2 (ja) 2010-11-29 2010-11-29 検索ログに応じた関連情報を配信する検索配信サーバ、プログラム及び方法

Country Status (1)

Country Link
JP (1) JP5514703B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140122697A1 (en) * 2012-11-01 2014-05-01 Google Inc. Providing content to linked devices associated with a user
CN107066450B (zh) * 2017-05-27 2020-04-10 国家计算机网络与信息安全管理中心 一种基于学习的即时通信会话切分方法
JP6679682B2 (ja) * 2018-09-20 2020-04-15 ヤフー株式会社 特定装置、特定方法及び特定プログラム
JP7346818B2 (ja) * 2018-12-21 2023-09-20 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
CN113177023B (zh) * 2021-04-19 2023-07-25 杭州海康威视系统技术有限公司 一种日志检索方法、装置及电子设备

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4071805B2 (ja) * 2000-12-27 2008-04-02 楽天株式会社 広告送信サーバ、広告送信プログラム及びユーザ検索方法
JP2004126975A (ja) * 2002-10-03 2004-04-22 Nippon Telegr & Teleph Corp <Ntt> 選好傾向類似ユーザ抽出方法及び装置、並びに選好傾向類似ユーザ抽出プログラム及びそれを記録した記録媒体
JP2010102385A (ja) * 2008-10-21 2010-05-06 Kddi Corp ユーザ分類装置、広告配信装置、ユーザ分類方法、広告配信方法、およびプログラム

Also Published As

Publication number Publication date
JP2012118628A (ja) 2012-06-21

Similar Documents

Publication Publication Date Title
US8260664B2 (en) Semantic advertising selection from lateral concepts and topics
US8799260B2 (en) Method and system for generating web pages for topics unassociated with a dominant URL
KR100650404B1 (ko) 온라인 광고 시스템 및 방법
US8326861B1 (en) Personalized term importance evaluation in queries
CN104254851A (zh) 用于向用户推荐内容的方法和系统
CN101401062A (zh) 确定相关来源、查询及合并多个内容来源的结果的方法和系统
CN101641697A (zh) 对网页的相关搜索查询及其应用
WO2005119423A2 (en) System and method for automated mapping of items to documents
JP5514703B2 (ja) 検索ログに応じた関連情報を配信する検索配信サーバ、プログラム及び方法
KR20120047079A (ko) 집단지성을 이용한 추천 시스템 및 방법
JP2010102385A (ja) ユーザ分類装置、広告配信装置、ユーザ分類方法、広告配信方法、およびプログラム
JP6137960B2 (ja) コンテンツ検索装置、方法及びプログラム
JP5952711B2 (ja) 予測対象コンテンツにおける将来的なコメント数を予測する予測サーバ、プログラム及び方法
US9129306B1 (en) Tie breaking rules for content item matching
KR101346927B1 (ko) 검색 장치, 검색 방법, 및 검색 프로그램을 기억하는 컴퓨터 판독 가능한 기록 매체
US20120005021A1 (en) Selecting advertisements using user search history segmentation
JP4743766B2 (ja) 印象判定システム、広告記事生成システム、印象判定方法、広告記事生成方法、印象判定プログラムおよび広告記事生成プログラム
Mizzaro et al. Short text categorization exploiting contextual enrichment and external knowledge
Jin et al. Simple May Be Best-A Simple and Effective Method for Federated Web Search via Search Engine Impact Factor Estimation.
US20140236929A1 (en) Search method and search system in microblog and computer storage medium
Vattikonda et al. Interpreting advertiser intent in sponsored search
WO2008032037A1 (en) Method and system for filtering and searching data using word frequencies
Hong et al. Exploiting topic tracking in real-time tweet streams
JP4992628B2 (ja) 広告配信システム
Bonomo et al. Identifying the $ k $ Best Targets for an Advertisement Campaign via Online Social Networks

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130814

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140212

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140224

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140226

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140318

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140331

R150 Certificate of patent or registration of utility model

Ref document number: 5514703

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150