JP2015185153A - 関心ワード抽出システム及びその方法 - Google Patents

関心ワード抽出システム及びその方法 Download PDF

Info

Publication number
JP2015185153A
JP2015185153A JP2014080534A JP2014080534A JP2015185153A JP 2015185153 A JP2015185153 A JP 2015185153A JP 2014080534 A JP2014080534 A JP 2014080534A JP 2014080534 A JP2014080534 A JP 2014080534A JP 2015185153 A JP2015185153 A JP 2015185153A
Authority
JP
Japan
Prior art keywords
word
search
interest
target
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014080534A
Other languages
English (en)
Inventor
敬太 岡野
Keita Okano
敬太 岡野
利和 金井
Toshikazu Kanai
利和 金井
季実子 新沼
Kimiko Niinuma
季実子 新沼
恵理 根岸
Eri Negishi
恵理 根岸
香織 重元
Kaori Shigemoto
香織 重元
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
X Listing Co Ltd
Original Assignee
X Listing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by X Listing Co Ltd filed Critical X Listing Co Ltd
Priority to JP2014080534A priority Critical patent/JP2015185153A/ja
Publication of JP2015185153A publication Critical patent/JP2015185153A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】WEBマーケティングにおいてターゲットユーザの潜在的な興味関心を把握することは重要だが、アクセス解析ツールや関連語・類語抽出サービスでは、ターゲットユーザの関心を軸にワードを抽出することは不可能である。本発明は、ユーザの関心に基づいてワードを抽出することを目的とする。【解決手段】ターゲットユーザグループにおける各検索ワードの検索人数の割合と、一般ユーザにおける同割合を比較することで、関心の高さの違いを算出する。ここで算出した数値(倍率)を関心スコアとして、ターゲットユーザにおいて一般ユーザよりも関心が高い又は低いワードリストを抽出する。【選択図】図2

Description

この発明は、グループ毎の関心ワードを返却するシステム及びその方法に関する。
WEBマーケティングにおいて、SEO(Search Engine Optimizationサーチエンジン最適化)やネット広告など様々な施策が実施されるが、いずれにおいても、WEBサイトに訪れるユーザの興味関心対象をワードとして把握することが重要である。
SEOであれば、興味関心ワード(以下、関心ワードという)に基づいたコンテンツを作成したりHTMLのタグに挿入したりして、そのワードの検索結果における上位表示を狙い、検索エンジン経由のターゲットとするユーザのサイト誘導を図る。
ネット広告(例えば、検索ワードに応じて広告が表示されるリスティング広告)では、いかに前記関心ワードを発見・選定するかが広告効果上重要となる。
WEBサイトを訪問したユーザがどんな事柄に興味関心を持っているかを調査する際、アクセス解析ツールを使用して、WEBサイト流入ワードのランキングや検索数から何に興味を持ってWEBサイトに訪問したか推測することが可能である。(例えば、特許文献1、特許文献2参照)。
しかし、前記WEBサイト流入ワードでは、サイト訪問の直接的な誘因となったワードしか取得できず、WEBサイトを訪問したユーザが潜在的にどんな事柄に興味関心を持っているかを抽出することはできない。
また、別の方法として、サイトと関連性の高いワードの発想を支援するツールや類語辞典等によりWEBサイトの特徴又は商品を表すワードの関連語や類語を抽出し、SEOワードやWEB広告入稿ワードとして使用することができる。
アクセス解析ツールや、関連語・類語を抽出するサービスは数多く存在するが、この方法では、直接関連のない別の分野のワードを、ユーザの関心ワードとして抽出することはできない。(例えば、特許文献3参照)
特開2006−228171号 公報 特開2002−123517号 公報 特開2010−267001号 公報
アクセス解析ツールでは、どのようなワードの検索結果からサイトに訪問したのかを把握することは可能だが、ユーザが潜在的にどのようなことに興味関心が高いのかを把握することはできない。
また、ターゲット層の関心を想定したワードを軸として、その類語や関連語のリストを抽出する方法では、既に定義されている類語や関連語の抽出に限られるため、ユーザにおける興味関心を発見したり、直接関連の無いワードを抽出したりすることはできない。
本発明はこのような課題を解決するためのものであり、直接的・間接的・潜在的に関わらず、ユーザの関心ワードを抽出することを可能にするシステム及び方法を提供することを目的とする。
本発明では、以下のような解決手段を提供する。
ユーザの興味関心をワードとして抽出するために、任意にターゲットとするユーザのグループ(以下、ターゲットユーザグループという)を作成し、そのターゲットユーザグループと広く一般のユーザ(以下、一般ユーザという)とを比較して、ターゲットユーザグループの関心度を算出し、返却することを特徴とする。ターゲットユーザグループは、例としては、WEBサイトを訪問したユーザをグループ化したものや、ある特定のワードを検索したユーザをグループ化したものなどがある。なお、期間を指定して前記条件に当てはまるユーザでグループ化したものでもよい。
また、ターゲットユーザグループは、本システム及び方法が前記グループ化の条件を知ることがなくても、外部のシステムからAPI(Application Programming Interface)やネットワークコンピューティングなどを使用して、グループ識別子とユーザ識別子とを取得することにより前記グループ識別子をターゲットユーザグループの集団を識別するものとして、ターゲットユーザグループの関心度を算出する場合もある。
具体的には、
(1)本発明の関心ワード抽出システムは、少なくとも検索日とユーザ識別子と検索ワードとを検索ログとして記憶する検索ログ記憶装置と、ターゲットユーザグループのユーザ識別子を記憶するターゲットユーザ識別子記憶装置とを備え、前記ターゲットユーザグループのユーザ識別子と検索ログのユーザ識別子が同一である、検索ワードとユーザ識別子とを抽出する検索ワード抽出手段と、検索ログに履歴が存在する全ターゲットユーザ数と、前記検索ワード抽出手段によって抽出された検索ワード毎のターゲットユーザ数とを抽出するターゲットユーザ数抽出手段と、検索ログに履歴が存在する全一般ユーザ数と、前記検索ワード抽出手段によって抽出された検索ワード毎の一般ユーザ数とを抽出する一般ユーザ数抽出手段と、前記全ターゲットユーザ数を分母として、前記検索ワード抽出手段によって抽出された検索ワード毎のターゲットユーザ数を分子としたワード別ターゲットユーザ割合と、前記全一般ユーザ数を分母として、前記検索ワード抽出手段によって抽出された検索ワード毎の一般ユーザ数を分子としたワード別一般ユーザ割合を抽出し、ワード毎に一般ユーザ割合と、ターゲットユーザ割合とを比較することにより、前記ターゲットユーザグループでの関心度を算出する関心度算出手段と、前記関心度算出手段によって算出された関心度を返却する関心ワード返却手段とを備えることを特徴とする。
(2)本発明の関心ワード抽出システムは、(1)に記載の関心ワード抽出システムであって、ターゲットユーザ数抽出手段は、任意の期間を条件に、検索ログに履歴が存在する全ターゲットユーザ数と、前記検索ワード抽出手段によって抽出された検索ワード毎のターゲットユーザ数とを抽出し、一般ユーザ数抽出手段は、任意の期間を条件に、検索ログに履歴が存在する全一般ユーザ数と、前記検索ワード抽出手段によって抽出された検索ワード毎の一般ユーザ数とを抽出することを特徴とする。
(3)本発明の関心ワード抽出システムは、(1)に記載の関心ワード抽出システムであって、ターゲットユーザ識別子記憶装置は、WEBサイトの訪問履歴として、少なくともサイト識別子と訪問日とユーザ識別子を記憶することを特徴とする。
(4)本発明の関心ワード抽出システムは、(1)に記載の関心ワード抽出システムであって、ターゲットユーザ識別子記憶装置は、検索ログを参照し、任意のワードを検索したユーザをグループとして記憶することを特徴とする。
(5)本発明の関心ワード抽出システムは、(1)に記載の関心ワード抽出システムであって、ターゲットユーザ識別子記憶装置は、外部データから得た識別子とユーザ識別子を記憶することを特徴とする。
(6)本発明の関心ワード抽出方法は、少なくとも検索日とユーザ識別子と検索ワードとを検索ログとして記憶する検索ログ記憶手段と、ターゲットユーザグループのユーザ識別子を記憶するターゲットユーザ識別子記憶手段とを含み、前記ターゲットユーザグループのユーザ識別子と検索ログのユーザ識別子が同一である、検索ワードとユーザ識別子とを抽出する検索ワード抽出工程と、検索ログに履歴が存在する全ターゲットユーザ数と、前記検索ワード抽出手段によって抽出された検索ワード毎のターゲットユーザ数とを抽出するターゲットユーザ数抽出工程と、検索ログに履歴が存在する全一般ユーザ数と、前記検索ワード抽出手段によって抽出された検索ワード毎の一般ユーザ数とを抽出する一般ユーザ数抽出工程と、前記全ターゲットユーザ数を分母として、前記検索ワード抽出手段によって抽出された検索ワード毎のターゲットユーザ数を分子としたワード別ターゲットユーザ割合と、前記全一般ユーザ数を分母として、前記検索ワード抽出手段によって抽出された検索ワード毎の一般ユーザ数を分子としたワード別一般ユーザ割合を抽出し、ワード毎に一般ユーザ割合と、ターゲットユーザ割合とを比較することにより、前記ターゲットユーザグループでの関心度を算出する関心度算出工程と、前記関心度算出手段によって算出された関心度を返却する関心ワード返却工程と、を実行することを特徴とする。
本発明によれば、関連語・類語・複合語・WEBサイト内の単語等に限らず、ターゲットユーザグループにおいて、一般ユーザよりも興味関心が高い又は低いワードを返却することを可能にするシステム及び方法を提供することができる。
本発明によれば、WEBサイトやワードに直接関連性のない潜在的な関心でさえも関心ワードとして返却することを可能にするシステム及び方法を提供することができる。
本発明の実施形態による関心ワード抽出システムの外部連携を含めた概略図例である。 関心ワード抽出システムのブロック図である。 サイト訪問履歴の例を示す説明図である。 検索ログの例を示す説明図である。 システム利用者端末に表示される関心ワードの画面表示例を示す図である。 関心度の計算式である。
<第1実施形態>
本発明の第1の実施形態について図を参照しながら説明する。
図1には、本発明の関心ワード抽出システム5の外部連携を含めた概略図例を示す。関心ワード抽出システム5は、各ユーザ端末1が各検索サイト2に入力した検索ワードと、各ターゲットユーザグループ端末3がWEBサイト4に訪問した履歴を記憶し、関心ワードと関心度を抽出し、システム利用者端末6に返却する。関心ワード抽出システム5と、各ユーザ端末1、各ターゲットユーザ端末3、およびシステム利用者端末6とは、図示略のインターネットを介して通信可能に構成されている。
インターネットは、TCP/IPなどの汎用のプロトコルに基づくインターネットである。各ユーザ端末1、各ターゲットユーザ端末3、およびシステム利用者端末6を関心ワード抽出表示システム5に接続させるための構成は、インターネットに限定されず、無線媒体により情報が送受信可能な複数の基地局がネットワークを構成する通信回線網や放送網などのネットワーク、さらには、データを直接受信するための媒体となる無線媒体自体など、データを送受信させるいずれの構成も利用できる。
関心ワード抽出システム5は、ハードウェア構成として、RAM(RANDOM ACCESS MEMORY)やROM(READ ONLY MEMORY)等の図示しない記憶手段と、CPU(CENTRAL PROCESSING UNIT)等の制御手段と、を備えている。RAMはデータなどを一時的に記憶できる一時領域などを有しており、ROMはOS(OPERATING SYSTEM:基本ソフトウェア)や各種サーバを制御するプログラム、各種アプリケーション、各種データ等が格納されている。CPUは、これらの記憶手段に格納されているプログラムを読み出し、このプログラムに従って各種処理を行う。
関心ワード抽出システム5は、図2に示すように、ターゲットユーザ識別子記憶装置10、検索ワード抽出手段11、ターゲットユーザ数抽出手段12、検索ログ記憶装置13、一般ユーザ数抽出手段14、関心度算出手段15、関心ワード返却手段16とを備える。
ターゲットユーザ識別子記憶装置10は、ターゲットとなるグループの識別子とユーザ識別子とを記憶するものである。このターゲットユーザ識別子記憶装置10は、後述の各種処理に、ターゲットとなるグループのユーザ識別子一覧を提供するための記憶装置である。例えば、検索ログ記憶装置13より任意の期間に任意のワードで検索したユーザグループについて、ユーザ識別子とグループ識別子とを記憶させることができる。例えば、APIによって、外部システムによりグループ識別子とユーザ識別子のデータを取得し、ターゲットユーザ識別子記憶装置10に記憶させることができる。例えば、サイト訪問履歴をサイト識別子でグループ化し、そのグループ識別子とユーザ識別子とをターゲットユーザ識別子記憶装置10に記憶させることができる。第1の実施例では、サイト訪問履歴をターゲットユーザ識別子記憶装置10に記憶させた場合の実施例として説明する。
システム利用者は関心ワード抽出システム5の管理画面からビーコンタグを発行し、前記ビーコンタグを関心ワードを抽出したいWEBサイト4に設置する(図1参照)。ビーコンタグは、例えば、JavaScript(登録商標)などの言語により記述されたプログラムや、HTMLのイメージタグを使用することができる。各ターゲットユーザ端末3がWEBサイト4に訪問した際に、ビーコンタグは訪問履歴サーバにリクエストを送信し、サイト訪問履歴を記録する。サイト訪問履歴は、図3に示すとおり、例えばサイト識別子、訪問日時、ユーザ識別子、グループ識別子を備える。サイト訪問履歴をサイト識別子でグループ化することによりターゲットユーザグループを作成し、ターゲットユーザグループ毎のユーザ識別子情報(以下、ターゲットユーザ識別子情報という)が作成できる。
一方、検索ログ記憶装置13は、図1のユーザ端末1が検索サイト2に入力した検索ワードを図4の検索ログとして記憶する。検索ログには、図4に示すとおり、検索日時、ユーザ識別子、検索ワードなどが記録されている。
検索ワード抽出手段11は、ターゲットユーザグループ毎に、前記ターゲットユーザグループの検索ワードを抽出する手段である。検索ワード抽出手段11によって抽出された検索ワードは、後述する関心度を算出する対象ワードとなる。具体的な処理としては、前記ターゲットユーザ識別子情報のユーザ識別子と検索ログ記憶装置13のユーザ識別子とを紐づけ、任意の検索期間の検索ワードとユーザ識別子情報とをターゲットユーザグループ毎に抽出する。任意の期間とは、全期間であってもよいし、システム利用者から指定された期間でもよい。指定される期間として例えば、サイト開設からの全ての期間であったり、ビーコンタグ設置からの全ての期間であったり、前記期間における月別の検索ワード抽出であったりする。
ターゲットユーザ数抽出手段12は、以下の2つの値を抽出する。以下、ターゲットユーザグループ毎に抽出するものとする。
1つ目の値は、ターゲットユーザの中で、前記任意の期間内に検索ログにログを残したユーザ数(以下、全ターゲットユーザ数という)である。この値は、検索ログの検索日時を前記任意の期間として、抽出するユーザ識別子をターゲットユーザ識別子記憶装置10のターゲットユーザ識別子として検索ログを抽出し、そのユーザ識別子数を数えることにより抽出する。
2つ目の値は、前記任意の期間において、前記検索ワード抽出手段11で取得した検索ワード毎にそのワードを検索したターゲットユーザ数(以下、ワードターゲットユーザ数という)を抽出した値である。この値は、前記検索ワード毎に抽出され、検索ワードとワードターゲットユーザ数とで構成される。検索のログの検索日時を前記任意の期間として、抽出するユーザ識別子をターゲットユーザ識別子記憶装置10のターゲットユーザ識別子として検索ログを抽出し、前記検索ワード抽出手段11で取得した検索ワード毎に、そのユーザ識別子数を数えることにより抽出する。
一般ユーザ数抽出手段14は、以下の2つの値を抽出する。
1つ目の値は、一般ユーザ(一般ユーザの例は後述する。)の中で、前記任意の期間内に検索ログにログを残したユーザ数(以下、全一般ユーザ数という)である。この値は、検索ログの検索日時を前記任意の期間として、抽出するユーザ識別子を一般ユーザのユーザ識別子として検索ログを抽出し、そのユーザ識別子数を数えることにより抽出する。
2つ目の値は、前記任意の期間において、前記検索ワード抽出手段11で取得した検索ワード毎にそのワードを検索した一般ユーザ数(以下、ワード一般ユーザ数という)を抽出した値である。この値は、前記検索ワード毎に抽出され、検索ワードとワード一般ユーザ数とで構成される。具体的には、以下の処理で抽出できる。検索ログの検索日時を前記任意の期間で指定し、抽出するユーザ識別子を一般ユーザのユーザ識別子とし、抽出対象の検索ワードを前記検索ワード抽出手段11で取得した検索ワードとして検索ログを抽出し、前記検索ワード毎にユーザ識別子数を数えることにより抽出できる。
上記これらの値は、後述する関心度算出時に使用されるものであって、ターゲットユーザと一般ユーザとを比較して、ワード検索に差異や特異性を見出すためのものである。一般ユーザの定義は、広く一般的ユーザとしてカテゴライズされるものである。よって、抽出対象となる一般ユーザのユーザ識別子は、あらかじめ一般ユーザとしてグループ化されているユーザ識別子のリストに一致したものであっても、検索ログに履歴がある全てのユーザ識別子であってもよい。
関心度算出手段15は、図6の式でワード毎に関心度を算出する。
図6の式で、検索ワード毎の一般ユーザに対するターゲットユーザの検索ボリュームの割合を比較した数値が算出され、それを関心度とする。
なお、本発明では、関心度は、一般ユーザに対するターゲットユーザでの検索ボリュームの割合を比較した数値であって、例えば、図6で示されるワード関心度に前記一般ユーザ数抽出手段で抽出したワード一般ユーザ数を乗算しても良い。ワード一般ユーザ数を乗算することにより、より一般ユーザの検索ボリュームを加味したワードの関心度が算出できる。また、ワード一般ユーザ数、ワードターゲットユーザ数によっては、図6の関心度の数値では、高低差が激しく、人に認知しにくい値であることがあるため、標準化を施したり、偏差値化しても良い。更には、本発明では、関心度は、一般ユーザに対するターゲットユーザでの検索ボリュームの割合を比較した数値であるため、例えば図6の関心度の代わりに、ユーザ数を元に検索ボリュームを算出するのではなく、検索数を元に検索ボリュームの割合を算出して、それを比較して、関心度としてもよい。
関心ワード返却手段16は、関心ワード算出手段15で算出された関心度とワードを返却する。返却パターンは多様であって、例えば、全てのワードについて返却する場合や、システム利用者のリクエストに応じて、上位ワードや、下位ワードに限定して返却する場合や、より誤差の少ないワードのみ返却する場合や、関心度が一定の基準を満たすワードのみ返却する場合や、ワードターゲットユーザ数、ターゲットユーザ数と一般ユーザ数の差分を加味して返却する場合や、任意の期間の期間別に返却する場合などがある。
例として、関心度を関心スコアとしてランキング化したワードと前記ワード毎の期間別のワード一般ユーザ数とを返却し、システム利用者端末6に表示する画面例を図5に示す。
また、図3のサイト訪問履歴と図4の検索ログは、それぞれ、訪問日時、検索日時をデータとして記憶しているため、システム利用者が自由に抽出対象期間を指定して、関心度を算出することも可能である。比較対象となる、ターゲットユーザ数抽出手段12の条件期間と、一般ユーザ数抽出手段14の条件期間とは同じである必要があるが、ターゲットユーザ識別子情報の元となる期間(ターゲットユーザ識別子記憶装置10の期間)と検索ワード抽出手段11と各数値(ターゲットユーザ数抽出手段12と一般ユーザ数抽出手段14)の期間はそれぞれ別の期間を指定してもよい。
また、ターゲットユーザ識別子記憶装置10は、WEBサイト4に訪問した履歴によるターゲットユーザ識別子の抽出記憶以外に、検索ログ記憶装置13に格納されている検索ワードをユーザのグループ化条件に使用して、グループ識別子を設定し、グループ識別子とユーザ識別子とを記憶することもできる。ユーザ識別子の抽出条件は、例えば「自動車保険」を完全一致で検索したユーザや「自動車」、「中古車」のいずれかを含むワードを検索したユーザのようにワードの一致タイプ(例えば、完全一致、部分一致、含むなど)を指定してユーザグループを作成する場合もある。検索ワードでユーザ識別子を抽出できることにより、システム利用者は、サイト訪問者以外で、商品やサービスに興味を持っていると思われるワードを検索したユーザの関心ワードを抽出することが可能となり、サイトに訪問していない潜在顧客に対するマーケティング施策などに活用することができる。
以下に抽出期間の指定例とターゲットユーザ識別子指定例を例示する。
(1)2014年1月に「センター試験」検索したユーザをターゲットユーザとして、2013年4月から2013年12月までの月別で関心度(ワード別関心度を月別で)を要求(指定)する。
前記条件指定の場合、ターゲットユーザ識別子情報は、検索ログ記憶装置13の2014年1月の検索ログにおいて検索ワードが「センター試験」に完全一致するワードを検索したユーザのユーザ識別子とグループ識別子となる。また、検索ワード抽出手段11と、ターゲットユーザ数抽出手段12と、一般ユーザ数抽出手段14の抽出条件には、2013年4月から2013年12月を設定し、前記期間において、月別で検索ワード(検索ワード抽出手段11)と各数値(ターゲットユーザ数抽出手段12と一般ユーザ数抽出手段14)とを抽出する。
この例のワード別関心度の結果によると、例えば、2014年1月にセンター試験を控えた受験生が、2013年4月から2013年12月にかけて、どのような事柄に関心が強かったかなどを時期を加味して把握することができる。本発明の効果通り、センター試験、学習などの分野のみではなく、遊びや悩みなどの関心なども抽出することが可能である。(関心ワードと関心度で抽出・返却することが可能である。)
また、別の条件指定の例として、
(2)2014年1月に、ショッピングサイトを訪問したユーザの2014年1月の関心ワードを要求する。
前記条件指定の場合、ビーコンタグ設置によるサイト訪問履歴からターゲットユーザ識別子情報を取得する。具体的には、関心ワード抽出システム5は、2014年1月のサイト訪問履歴から、対象となるショッピングサイトのサイト識別子を条件に、ユーザ識別子を取得し、グループ識別子とユーザ識別子とをターゲットユーザ識別子記憶装置10に記憶させる。検索ワード抽出手段11と、ターゲットユーザ数抽出手段12と、一般ユーザ数抽出手段14の抽出条件に、2014年1月を設定し、各値(ターゲットユーザ数抽出手段12と一般ユーザ数抽出手段14)を抽出することにより、ワード毎の関心度を算出し、ワード別に返却する。
また、本発明では、例えばシステム利用者が保有する顧客情報とユーザ識別子を紐付けて、年齢や性別などの顧客情報別に関心ワードを抽出し、よりターゲットを細分化したマーケティング施策などに活用することも可能である。
ビーコンタグをWEBサイト4に設置し、前記ビーコンタグは、顧客がログインした状態でWEBサイトを訪問した場合に、顧客データのグループ分け(関心ワードを抽出したいグループ単位)に応じてグループ識別子を付与し、グループ識別子とユーザ識別子と訪問日時とサイト識別子とをサイト訪問履歴に送信し、グループ識別子とユーザ識別子とをターゲットユーザ識別子情報とすることで実施することが可能である。
また、本発明では、外部のシステムからAPIやネットワークコンピューティングなどを使用して、グループ識別子とユーザ識別子とを取得することにより、実施することも可能である。例えば、有料会員と無料会員のグループ識別子とユーザ識別子を取得し、ターゲットユーザ識別子記憶装置10に記憶することで、有料会員と無料会員のそれぞれの関心ワードを抽出することが可能となる。
なお、本発明は、検索ログ記憶装置13の検索ワードを関心ワードの元になるワードとして、その検索ボリュームの割合を比較した値として関心度を算出しているが、検索ログ記憶装置13を使用せず、別のデータを使用することでも、本システムの応用として実施することが可能である。例えば、検索ログ記憶装置13の代用として、ショッピングサイトの購入履歴を代用することも可能である。具体的には、商品名や商品カテゴリを検索ワードの代わりに、購入日時を検索日時の代わりに使用することで関心ワードと関心度の抽出を実施することができる。また、検索ログ記憶装置13の代用として、閲覧ページのカテゴリ名や閲覧ページ内のワードを検索ワードの代わりに、閲覧日時を検索日時の代わりに使用することでも実施することができる。また、SNS(ソーシャルネットワーキングサービス)に書き込んだテキスト情報を検索ワードの代わりに、書き込み日時を検索日時の代わりに使用することでも実施することができる。
1 ユーザ端末
2 検索サイト
3 ターゲットユーザ端末
4 WEBサイト
5 関心ワード抽出システム
6 システム利用者端末
10 ターゲットユーザ識別子記憶装置
11 検索ワード抽出手段
12 ターゲットユーザ数抽出手段
13 検索ログ記憶装置
14 一般ユーザ数抽出手段
15 関心度算出手段
16 関心ワード返却手段

Claims (6)

  1. ターゲットユーザグループの関心ワードを抽出するシステムであって、
    少なくとも検索日とユーザ識別子と検索ワードとを検索ログとして記憶する検索ログ記憶装置と、
    ターゲットユーザグループのユーザ識別子を記憶するターゲットユーザ識別子記憶装置とを備え、
    前記ターゲットユーザグループのユーザ識別子と検索ログのユーザ識別子が同一である、検索ワードとユーザ識別子とを抽出する検索ワード抽出手段と、
    検索ログに履歴が存在する全ターゲットユーザ数と、前記検索ワード抽出手段によって抽出された検索ワード毎のターゲットユーザ数とを抽出するターゲットユーザ数抽出手段と、
    検索ログに履歴が存在する全一般ユーザ数と、前記検索ワード抽出手段によって抽出された検索ワード毎の一般ユーザ数とを抽出する一般ユーザ数抽出手段と、
    前記全ターゲットユーザ数を分母として、前記検索ワード抽出手段によって抽出された検索ワード毎のターゲットユーザ数を分子としたワード別ターゲットユーザ割合と、前記全一般ユーザ数を分母として、前記検索ワード抽出手段によって抽出された検索ワード毎の一般ユーザ数を分子としたワード別一般ユーザ割合を抽出し、ワード毎に一般ユーザ割合と、ターゲットユーザ割合とを比較することにより、前記ターゲットユーザグループでの関心度を算出する関心度算出手段と、
    前記関心度算出手段によって算出された関心度を返却する関心ワード返却手段と、
    を備えることを特徴とする関心ワード抽出システム。
  2. ターゲットユーザ数抽出手段は、
    任意の期間を条件に、検索ログに履歴が存在する全ターゲットユーザ数と、前記検索ワード抽出手段によって抽出された検索ワード毎のターゲットユーザ数とを抽出し、
    一般ユーザ数抽出手段は、
    任意の期間を条件に、検索ログに履歴が存在する全一般ユーザ数と、前記検索ワード抽出手段によって抽出された検索ワード毎の一般ユーザ数とを抽出することを特徴とする、
    請求項1に記載の関心ワード抽出システム
  3. ターゲットユーザ識別子記憶装置は、
    WEBサイトの訪問履歴として、少なくともサイト識別子と訪問日とユーザ識別子を記憶することを特徴とする、
    請求項1に記載の関心ワード抽出システム。
  4. ターゲットユーザ識別子記憶装置は、
    検索ログを参照し、任意のワードを検索したユーザをグループとして記憶することを特徴とする、
    請求項1に記載の関心ワード抽出システム。
  5. ターゲットユーザ識別子記憶装置は、
    外部データから得た識別子とユーザ識別子を記憶することを特徴とする、
    請求項1に記載の関心ワード抽出システム。
  6. ターゲットユーザグループの関心ワードを抽出する方法であって、
    少なくとも検索日とユーザ識別子と検索ワードとを検索ログとして記憶する検索ログ記憶手段と、
    ターゲットユーザグループのユーザ識別子を記憶するターゲットユーザ識別子記憶手段とを含み、
    前記ターゲットユーザグループのユーザ識別子と検索ログのユーザ識別子が同一である、検索ワードとユーザ識別子とを抽出する検索ワード抽出工程と、
    検索ログに履歴が存在する全ターゲットユーザ数と、前記検索ワード抽出手段によって抽出された検索ワード毎のターゲットユーザ数とを抽出するターゲットユーザ数抽出工程と、
    検索ログに履歴が存在する全一般ユーザ数と、前記検索ワード抽出手段によって抽出された検索ワード毎の一般ユーザ数とを抽出する一般ユーザ数抽出工程と、
    前記全ターゲットユーザ数を分母として、前記検索ワード抽出手段によって抽出された検索ワード毎のターゲットユーザ数を分子としたワード別ターゲットユーザ割合と、前記全一般ユーザ数を分母として、前記検索ワード抽出手段によって抽出された検索ワード毎の一般ユーザ数を分子としたワード別一般ユーザ割合を抽出し、ワード毎に一般ユーザ割合と、ターゲットユーザ割合とを比較することにより、前記ターゲットユーザグループでの関心度を算出する関心度算出工程と、
    前記関心度算出手段によって算出された関心度を返却する関心ワード返却工程と、
    を実行する関心ワード抽出方法。
JP2014080534A 2014-03-25 2014-03-25 関心ワード抽出システム及びその方法 Pending JP2015185153A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014080534A JP2015185153A (ja) 2014-03-25 2014-03-25 関心ワード抽出システム及びその方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014080534A JP2015185153A (ja) 2014-03-25 2014-03-25 関心ワード抽出システム及びその方法

Publications (1)

Publication Number Publication Date
JP2015185153A true JP2015185153A (ja) 2015-10-22

Family

ID=54351550

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014080534A Pending JP2015185153A (ja) 2014-03-25 2014-03-25 関心ワード抽出システム及びその方法

Country Status (1)

Country Link
JP (1) JP2015185153A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017062771A (ja) * 2015-09-25 2017-03-30 直也 榊原 キーワードターゲティングシステム、キーワードターゲティング装置、サーバ装置、キーワードターゲティング方法、及びプログラム
JP2019046189A (ja) * 2017-09-01 2019-03-22 ヤフー株式会社 抽出装置、抽出方法及び抽出プログラム
JP2019046043A (ja) * 2017-08-31 2019-03-22 ヤフー株式会社 抽出装置、抽出方法及び抽出プログラム
JP2021149681A (ja) * 2020-03-19 2021-09-27 ヤフー株式会社 判定装置、判定方法及び判定プログラム
JP7074910B1 (ja) 2021-04-20 2022-05-24 ヤフー株式会社 情報処理装置、情報処理方法、及び情報処理プログラム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017062771A (ja) * 2015-09-25 2017-03-30 直也 榊原 キーワードターゲティングシステム、キーワードターゲティング装置、サーバ装置、キーワードターゲティング方法、及びプログラム
JP2019046043A (ja) * 2017-08-31 2019-03-22 ヤフー株式会社 抽出装置、抽出方法及び抽出プログラム
JP2019046189A (ja) * 2017-09-01 2019-03-22 ヤフー株式会社 抽出装置、抽出方法及び抽出プログラム
JP2021149681A (ja) * 2020-03-19 2021-09-27 ヤフー株式会社 判定装置、判定方法及び判定プログラム
JP7127080B2 (ja) 2020-03-19 2022-08-29 ヤフー株式会社 判定装置、判定方法及び判定プログラム
JP7074910B1 (ja) 2021-04-20 2022-05-24 ヤフー株式会社 情報処理装置、情報処理方法、及び情報処理プログラム
JP2022165577A (ja) * 2021-04-20 2022-11-01 ヤフー株式会社 情報処理装置、情報処理方法、及び情報処理プログラム

Similar Documents

Publication Publication Date Title
US8788321B2 (en) Marketing method and system using domain knowledge
JP5721818B2 (ja) 検索におけるモデル情報群の使用
US8682881B1 (en) System and method for extracting structured data from classified websites
US20130332385A1 (en) Methods and systems for detecting and extracting product reviews
US9578135B2 (en) Method of identifying remote users of websites
CN102037464A (zh) 具有最多点击的下一个对象的搜索结果
US20150287047A1 (en) Extracting Information from Chain-Store Websites
CN103617241B (zh) 搜索信息处理方法、浏览器终端与服务器
JP2015185153A (ja) 関心ワード抽出システム及びその方法
EP2884451A1 (en) Product and content association
JP5985543B2 (ja) 情報集計装置、情報集計方法及び情報集計プログラム
US20160299951A1 (en) Processing a search query and retrieving targeted records from a networked database system
RU2598789C2 (ru) Способ представления результатов поиска в соответствии с поисковым запросом в сети интернет
US9201960B2 (en) Virtual agent response to customer inquiries
KR100964090B1 (ko) 로그 분석을 통한 광고 키워드 추천 방법 및 시스템
JP5969718B1 (ja) 個人情報記録装置,個人情報記録プログラム,及び個人行動履歴記録方法
US20160124580A1 (en) Method and system for providing content with a user interface
US20130191304A1 (en) Tools and Methods for Creating Dynamic Feedback Forms
KR101483618B1 (ko) 웹페이지의 쿠키정보 및 리퍼러 기록을 이용한 광고 서비스 시스템 및 방법
JP6664598B2 (ja) 提供装置、提供方法及び提供プログラム
JP2009145406A (ja) サーバ及びその制御方法
US20150310482A1 (en) Method and survey server for generating metrics indicative of website visit originating channel effectiveneess
WO2021230786A1 (en) Method of filtering data traffic sent to a user device
KR20200129782A (ko) 크롤링을 이용한 검색 대행 서비스 방법
KR101684582B1 (ko) 키워드 광고 관리 방법, 장치, 및 컴퓨터 프로그램