JP5514703B2 - 検索ログに応じた関連情報を配信する検索配信サーバ、プログラム及び方法 - Google Patents
検索ログに応じた関連情報を配信する検索配信サーバ、プログラム及び方法 Download PDFInfo
- Publication number
- JP5514703B2 JP5514703B2 JP2010265653A JP2010265653A JP5514703B2 JP 5514703 B2 JP5514703 B2 JP 5514703B2 JP 2010265653 A JP2010265653 A JP 2010265653A JP 2010265653 A JP2010265653 A JP 2010265653A JP 5514703 B2 JP5514703 B2 JP 5514703B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- keyword
- related information
- analysis target
- class
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
[ユーザID]<->[検索時刻][検索キーワード]
情報検索エンジン手段によって得られた、ユーザ識別子毎の検索キーワード及び検索時刻からなる検索ログを蓄積する検索ログ蓄積手段と、
検索ログ蓄積手段に蓄積された検索ログの中で、出現頻度が高い順に所定数のキーワードを、分析対象キーワードとして抽出する分析対象キーワード抽出手段と、
分析対象キーワードを記録した分析対象キーワードリストと、
検索ログ蓄積手段に蓄積された検索ログの中で、分析対象キーワードを含む検索ログを、分析対象検索ログとして抽出する分析対象検索ログ抽出手段と、
検索時刻に応じて、1つ以上の分析対象検索ログをまとめた複数の検索セッションに分割する検索セッション分割手段と、
検索セッションを複数のクラスにクラスタリングする検索セッションクラス抽出手段と
を有し、各クラスに含まれる検索ログの検索キーワードに応じた関連情報を配信することができる検索配信サーバにおいて、
関連情報の配信ユーザによって設定された関連情報キーワードを記録する関連情報キーワードリストと、
関連情報キーワードリストの関連情報キーワードを、分析対象キーワードリストに付加する関連情報キーワード付加手段と、
検索セッションクラス抽出手段によって生成されたk個のクラスの中で、関連情報キーワードが含まれたクラスを、帰属クラスとして検出するキーワード帰属クラス算出手段と、
帰属クラスに含まれる検索ログのユーザ識別子を抽出し、当該ユーザ識別子に対応する端末へ、関連情報を配信する配信先決定手段と
を有することを特徴とする。
関連情報は、広告情報であり、
関連情報キーワードリストの関連情報キーワードは、関連情報の配信ユーザとしての広告主によって設定される
ことも好ましい。
広告情報に含まれる文章から形態素解析によってキーワードを抽出すると共に、TF−IDF(Term Frequency - Inverse Document Frequency:単語の出現頻度−逆出現頻度)によって特徴的な単語を、関連情報キーワードとして関連情報キーワードリストに記録する関連情報キーワード抽出手段を更に有することも好ましい。
キーワード帰属クラス算出手段は、関連情報キーワードリストの関連情報キーワード毎に、各クラスに対する帰属確率を算出し、所定確率以上のクラスをキーワード帰属クラスとして検出することも好ましい。
関連情報キーワードリストの関連情報キーワード毎に、重みwが付与されており、
キーワード帰属クラス算出手段は、関連情報キーワードリストの関連情報キーワード毎に、当該重みwを重み付けして、各クラスに対する帰属確率を算出することも好ましい。
情報検索エンジン手段によって得られた、ユーザ識別子毎の検索キーワード及び検索時刻からなる検索ログを蓄積する検索ログ蓄積手段と、
検索ログ蓄積手段に蓄積された検索ログの中で、出現頻度が高い順に所定数のキーワードを、分析対象キーワードとして抽出する分析対象キーワード抽出手段と、
分析対象キーワードを記録した分析対象キーワードリストと、
検索ログ蓄積手段に蓄積された検索ログの中で、分析対象キーワードを含む検索ログを、分析対象検索ログとして抽出する分析対象検索ログ抽出手段と、
検索時刻に応じて、1つ以上の分析対象検索ログをまとめた複数の検索セッションに分割する検索セッション分割手段と、
検索セッションを複数のクラスにクラスタリングする検索セッションクラス抽出手段と
してコンピュータを機能させ、各クラスに含まれる検索ログの検索キーワードに応じた関連情報を配信することができるサーバ用の検索配信プログラムにおいて、
関連情報の配信ユーザによって設定された関連情報キーワードを記録する関連情報キーワードリストと、
関連情報キーワードリストの関連情報キーワードを、分析対象キーワードリストに付加する関連情報キーワード付加手段と、
検索セッションクラス抽出手段によって生成されたk個のクラスの中で、関連情報キーワードが含まれたクラスを、帰属クラスとして検出するキーワード帰属クラス算出手段と、
帰属クラスに含まれる検索ログのユーザ識別子を抽出し、当該ユーザ識別子に対応する端末へ、関連情報を配信する配信先決定手段と
してコンピュータを機能させることを特徴とする。
情報検索エンジン部によって得られた、ユーザ識別子毎の検索キーワード及び検索時刻からなる検索ログを蓄積する検索ログ蓄積部と
を有し、
検索ログ蓄積部に蓄積された検索ログの中で、出現頻度が高い順に所定数のキーワードを、分析対象キーワードとして抽出する第1のステップと、
分析対象キーワードを分析対象キーワードリストに記録する第2のステップと、
検索ログ蓄積部に蓄積された検索ログの中で、分析対象キーワードを含む検索ログを、分析対象検索ログとして抽出する第3のステップと、
検索時刻に応じて、1つ以上の分析対象検索ログをまとめた複数の検索セッションに分割する第4のステップと、
検索セッションをk個のクラスにクラスタリングする第5のステップと
を有し、各クラスに含まれる検索ログの検索キーワードに応じた関連情報を配信することができるサーバの検索配信方法において、
関連情報の配信ユーザによって設定された関連情報キーワードを記録する関連情報キーワードリストを更に有し、
第2のステップについて、関連情報キーワードリストの関連情報キーワードを、分析対象キーワードリストに付加し、
第5のステップによって生成されたk個のクラスの中で、関連情報キーワードが含まれたクラスを、帰属クラスとして検出する第6のステップと、
帰属クラスに含まれる検索ログのユーザ識別子を抽出し、当該ユーザ識別子に対応する端末へ、関連情報を配信する第7のステップと
を更に有することを特徴とする。
図4は、本発明におけるクラスの構成を表す説明図である。
検索セッションID:キーワード
11 :{K2,K4}
12 :{K1,K2}
13 :{K1,K2}
14 :{K4}
21 :{K2,K4}
31 :{K4}
41 :{K1,K2,K3}
尚、図4(b)によれば、ユーザID(T0001)の検索ログは、検索時刻範囲に応じて4つのセッションID(11〜14)に分割されている。その他のユーザID(T0002〜T0004)の検索ログはそれぞれ、1つのセッションID(21,31,41)に分割される。
クラス:検索セッションID
c1 : 14,21,31
c2 : 11
c3 : 12,13
c4 : 41
複数のクラスは、検索ログの検索キーワードの動向だけでなく、広告情報(関連情報)の関連情報キーワードの動向を反映して、生成される。
Score(k,cj)=Σi=1 m ProbClass(ki,cj)
(S502)広告情報に含まれる文章から、関連情報キーワードが抽出される。関連情報キーワードは、形態素解析によって抽出された単語の中で、例えばTF−IDFによって抽出された特徴的な単語である。
(S503)関連情報キーワードは、分析対象キーワードリストに付加される。
(S512)検索キーワードに対応付けられた、Webサイトのアドレスが、検索される。
(S513)そして、検索配信サーバは、検索結果となるアドレスを、端末へ返信する。
(S514)「ユーザ識別子」「検索時刻」「検索キーワード」を対応付けた「検索ログ」が、検索ログ蓄積部に蓄積される。
(S522)抽出された分析対象キーワードは、分析対象キーワードリストに記録される。
(S523)検索ログ蓄積部に蓄積された検索ログの中で、分析対象キーワードリストに記録された分析対象キーワードを含む検索ログが、分析対象検索ログとして抽出される。
(S524)分析対象検索ログは、検索時刻に応じて、1つ以上の分析対象検索ログをまとめた複数の検索セッションに分割される。
(S525)分割された検索セッションは、k個のクラスにクラスタリングされる。
(S526)生成されたk個のクラスの中で、関連情報キーワードが含まれたクラスが、帰属クラスとして検出される。
(S527)関連情報は、帰属クラスに属する1つ以上の検索セッションに含まれるユーザ識別子を抽出し、当該ユーザ識別子に対応する端末へ関連情報を配信する。
100 通信インタフェース
101 情報検索エンジン部
102 検索ログ蓄積部
103 分析対象キーワード抽出部
104 分析対象キーワードリスト
105 分析対象検索ログ抽出部
106 検索セッション分割部
107 検索セッションクラス抽出部
108 ユーザ帰属クラス算出部
109 配信先決定部
111 関連情報キーワード抽出部
112 関連情報キーワードリスト
113 関連情報キーワード付加部
114 キーワード帰属クラス算出部
2 端末
3 配信端末
4 Webサーバ
Claims (7)
- ユーザによって操作される端末から受信した検索キーワードによって情報を検索する情報検索エンジン手段と、
前記情報検索エンジン手段によって得られた、ユーザ識別子毎の検索キーワード及び検索時刻からなる検索ログを蓄積する検索ログ蓄積手段と、
前記検索ログ蓄積手段に蓄積された検索ログの中で、出現頻度が高い順に所定数のキーワードを、分析対象キーワードとして抽出する分析対象キーワード抽出手段と、
前記分析対象キーワードを記録した分析対象キーワードリストと、
前記検索ログ蓄積手段に蓄積された前記検索ログの中で、前記分析対象キーワードを含む検索ログを、分析対象検索ログとして抽出する分析対象検索ログ抽出手段と、
検索時刻に応じて、1つ以上の分析対象検索ログをまとめた複数の検索セッションに分割する検索セッション分割手段と、
前記検索セッションを複数のクラスにクラスタリングする検索セッションクラス抽出手段と
を有し、各クラスに含まれる検索ログの検索キーワードに応じた関連情報を配信することができる検索配信サーバにおいて、
前記関連情報の配信ユーザによって設定された関連情報キーワードを記録する関連情報キーワードリストと、
前記関連情報キーワードリストの関連情報キーワードを、前記分析対象キーワードリストに付加する関連情報キーワード付加手段と、
前記検索セッションクラス抽出手段によって生成されたk個のクラスの中で、前記関連情報キーワードが含まれたクラスを、帰属クラスとして検出するキーワード帰属クラス算出手段と、
前記帰属クラスに含まれる前記検索ログの前記ユーザ識別子を抽出し、当該ユーザ識別子に対応する端末へ、前記関連情報を配信する配信先決定手段と
を有することを特徴とする検索配信サーバ。 - 前記関連情報は、広告情報であり、
前記関連情報キーワードリストの前記関連情報キーワードは、前記関連情報の配信ユーザとしての広告主によって設定される
ことを特徴とする請求項1に記載の検索配信サーバ。 - 前記広告情報に含まれる文章から形態素解析によってキーワードを抽出すると共に、TF−IDF(Term Frequency - Inverse Document Frequency:単語の出現頻度−逆出現頻度)によって特徴的な単語を、前記関連情報キーワードとして前記関連情報キーワードリストに記録する関連情報キーワード抽出手段を更に有することを特徴とする請求項2に記載の検索配信サーバ。
- 前記キーワード帰属クラス算出手段は、前記関連情報キーワードリストの前記関連情報キーワード毎に、各クラスに対する帰属確率を算出し、所定確率以上のクラスをキーワード帰属クラスとして検出することを特徴とする請求項1から3のいずれか1項に記載の検索配信サーバ。
- 前記関連情報キーワードリストの前記関連情報キーワード毎に、重みwが付与されており、
前記キーワード帰属クラス算出手段は、前記関連情報キーワードリストの前記関連情報キーワード毎に、当該重みwを重み付けして、各クラスに対する帰属確率を算出することを特徴とする請求項4に記載の検索配信サーバ。 - ユーザによって操作される端末から受信した検索キーワードによって情報を検索する情報検索エンジン手段と、
前記情報検索エンジン手段によって得られた、ユーザ識別子毎の検索キーワード及び検索時刻からなる検索ログを蓄積する検索ログ蓄積手段と、
前記検索ログ蓄積手段に蓄積された検索ログの中で、出現頻度が高い順に所定数のキーワードを、分析対象キーワードとして抽出する分析対象キーワード抽出手段と、
前記分析対象キーワードを記録した分析対象キーワードリストと、
前記検索ログ蓄積手段に蓄積された前記検索ログの中で、前記分析対象キーワードを含む検索ログを、分析対象検索ログとして抽出する分析対象検索ログ抽出手段と、
検索時刻に応じて、1つ以上の分析対象検索ログをまとめた複数の検索セッションに分割する検索セッション分割手段と、
前記検索セッションを複数のクラスにクラスタリングする検索セッションクラス抽出手段と
してコンピュータを機能させ、各クラスに含まれる検索ログの検索キーワードに応じた関連情報を配信することができるサーバ用の検索配信プログラムにおいて、
前記関連情報の配信ユーザによって設定された関連情報キーワードを記録する関連情報キーワードリストと、
前記関連情報キーワードリストの関連情報キーワードを、前記分析対象キーワードリストに付加する関連情報キーワード付加手段と、
前記検索セッションクラス抽出手段によって生成されたk個のクラスの中で、前記関連情報キーワードが含まれたクラスを、帰属クラスとして検出するキーワード帰属クラス算出手段と、
前記帰属クラスに含まれる前記検索ログの前記ユーザ識別子を抽出し、当該ユーザ識別子に対応する端末へ、前記関連情報を配信する配信先決定手段と
してコンピュータを機能させることを特徴とするサーバ用の検索配信プログラム。 - ユーザによって操作される端末から受信した検索キーワードによって情報を検索する情報検索エンジン部と、
前記情報検索エンジン部によって得られた、ユーザ識別子毎の検索キーワード及び検索時刻からなる検索ログを蓄積する検索ログ蓄積部と
を有し、
前記検索ログ蓄積部に蓄積された検索ログの中で、出現頻度が高い順に所定数のキーワードを、分析対象キーワードとして抽出する第1のステップと、
前記分析対象キーワードを分析対象キーワードリストに記録する第2のステップと、
前記検索ログ蓄積部に蓄積された前記検索ログの中で、前記分析対象キーワードを含む検索ログを、分析対象検索ログとして抽出する第3のステップと、
検索時刻に応じて、1つ以上の分析対象検索ログをまとめた複数の検索セッションに分割する第4のステップと、
前記検索セッションをk個のクラスにクラスタリングする第5のステップと
を有し、各クラスに含まれる検索ログの検索キーワードに応じた関連情報を配信することができるサーバの検索配信方法において、
前記関連情報の配信ユーザによって設定された関連情報キーワードを記録する関連情報キーワードリストを更に有し、
第2のステップについて、前記関連情報キーワードリストの関連情報キーワードを、前記分析対象キーワードリストに付加し、
第5のステップによって生成されたk個のクラスの中で、前記関連情報キーワードが含まれたクラスを、帰属クラスとして検出する第6のステップと、
前記帰属クラスに含まれる前記検索ログの前記ユーザ識別子を抽出し、当該ユーザ識別子に対応する端末へ、前記関連情報を配信する第7のステップと
を更に有することを特徴とするサーバ用の検索配信方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010265653A JP5514703B2 (ja) | 2010-11-29 | 2010-11-29 | 検索ログに応じた関連情報を配信する検索配信サーバ、プログラム及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010265653A JP5514703B2 (ja) | 2010-11-29 | 2010-11-29 | 検索ログに応じた関連情報を配信する検索配信サーバ、プログラム及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012118628A JP2012118628A (ja) | 2012-06-21 |
JP5514703B2 true JP5514703B2 (ja) | 2014-06-04 |
Family
ID=46501404
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010265653A Active JP5514703B2 (ja) | 2010-11-29 | 2010-11-29 | 検索ログに応じた関連情報を配信する検索配信サーバ、プログラム及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5514703B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140122697A1 (en) * | 2012-11-01 | 2014-05-01 | Google Inc. | Providing content to linked devices associated with a user |
CN107066450B (zh) * | 2017-05-27 | 2020-04-10 | 国家计算机网络与信息安全管理中心 | 一种基于学习的即时通信会话切分方法 |
JP6679682B2 (ja) * | 2018-09-20 | 2020-04-15 | ヤフー株式会社 | 特定装置、特定方法及び特定プログラム |
JP7346818B2 (ja) * | 2018-12-21 | 2023-09-20 | 富士フイルムビジネスイノベーション株式会社 | 情報処理装置及びプログラム |
CN113177023B (zh) * | 2021-04-19 | 2023-07-25 | 杭州海康威视系统技术有限公司 | 一种日志检索方法、装置及电子设备 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4071805B2 (ja) * | 2000-12-27 | 2008-04-02 | 楽天株式会社 | 広告送信サーバ、広告送信プログラム及びユーザ検索方法 |
JP2004126975A (ja) * | 2002-10-03 | 2004-04-22 | Nippon Telegr & Teleph Corp <Ntt> | 選好傾向類似ユーザ抽出方法及び装置、並びに選好傾向類似ユーザ抽出プログラム及びそれを記録した記録媒体 |
JP2010102385A (ja) * | 2008-10-21 | 2010-05-06 | Kddi Corp | ユーザ分類装置、広告配信装置、ユーザ分類方法、広告配信方法、およびプログラム |
-
2010
- 2010-11-29 JP JP2010265653A patent/JP5514703B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2012118628A (ja) | 2012-06-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8260664B2 (en) | Semantic advertising selection from lateral concepts and topics | |
US8799260B2 (en) | Method and system for generating web pages for topics unassociated with a dominant URL | |
KR100650404B1 (ko) | 온라인 광고 시스템 및 방법 | |
US8326861B1 (en) | Personalized term importance evaluation in queries | |
CN104254851A (zh) | 用于向用户推荐内容的方法和系统 | |
CN101401062A (zh) | 确定相关来源、查询及合并多个内容来源的结果的方法和系统 | |
CN101641697A (zh) | 对网页的相关搜索查询及其应用 | |
WO2005119423A2 (en) | System and method for automated mapping of items to documents | |
JP5514703B2 (ja) | 検索ログに応じた関連情報を配信する検索配信サーバ、プログラム及び方法 | |
KR20120047079A (ko) | 집단지성을 이용한 추천 시스템 및 방법 | |
JP2010102385A (ja) | ユーザ分類装置、広告配信装置、ユーザ分類方法、広告配信方法、およびプログラム | |
JP6137960B2 (ja) | コンテンツ検索装置、方法及びプログラム | |
JP5952711B2 (ja) | 予測対象コンテンツにおける将来的なコメント数を予測する予測サーバ、プログラム及び方法 | |
US9129306B1 (en) | Tie breaking rules for content item matching | |
KR101346927B1 (ko) | 검색 장치, 검색 방법, 및 검색 프로그램을 기억하는 컴퓨터 판독 가능한 기록 매체 | |
US20120005021A1 (en) | Selecting advertisements using user search history segmentation | |
JP4743766B2 (ja) | 印象判定システム、広告記事生成システム、印象判定方法、広告記事生成方法、印象判定プログラムおよび広告記事生成プログラム | |
Mizzaro et al. | Short text categorization exploiting contextual enrichment and external knowledge | |
Jin et al. | Simple May Be Best-A Simple and Effective Method for Federated Web Search via Search Engine Impact Factor Estimation. | |
US20140236929A1 (en) | Search method and search system in microblog and computer storage medium | |
Vattikonda et al. | Interpreting advertiser intent in sponsored search | |
WO2008032037A1 (en) | Method and system for filtering and searching data using word frequencies | |
Hong et al. | Exploiting topic tracking in real-time tweet streams | |
JP4992628B2 (ja) | 広告配信システム | |
Bonomo et al. | Identifying the $ k $ Best Targets for an Advertisement Campaign via Online Social Networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130814 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140212 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140224 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140226 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140318 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140331 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5514703 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |