JP2014115952A - 興味分野比較分析装置及びシステム及び方法及びプログラム - Google Patents

興味分野比較分析装置及びシステム及び方法及びプログラム Download PDF

Info

Publication number
JP2014115952A
JP2014115952A JP2012271478A JP2012271478A JP2014115952A JP 2014115952 A JP2014115952 A JP 2014115952A JP 2012271478 A JP2012271478 A JP 2012271478A JP 2012271478 A JP2012271478 A JP 2012271478A JP 2014115952 A JP2014115952 A JP 2014115952A
Authority
JP
Japan
Prior art keywords
interest
browsing
field
website
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012271478A
Other languages
English (en)
Other versions
JP5906176B2 (ja
Inventor
Shigeru Fujimura
滋 藤村
Yusuke Ichikawa
裕介 市川
Masashi Uchiyama
匡 内山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2012271478A priority Critical patent/JP5906176B2/ja
Publication of JP2014115952A publication Critical patent/JP2014115952A/ja
Application granted granted Critical
Publication of JP5906176B2 publication Critical patent/JP5906176B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】自サイト利用者の興味分野のみならず、自サイト以外の利用者の興味分野を把握し、他サイトと比較した自サイト利用者の興味傾向を知ることを可能にする。
【解決手段】閲覧ログの閲覧ページが前記サイト-興味分野辞書に登録されている場合には、興味分野毎に集計し、登録されていない場合には、該閲覧ページのURLに基づいて該閲覧ページの興味分野を推定し、該興味分野を集計値に加え、閲覧ログを読み出して、所定の規則に基づいて分析対象サイトを利用している利用者群を特定し、興味分野毎の集計値に応じて順位付けし、特定された利用者の中で、該興味分野の中に該興味分野に興味を有する閲覧者が存在するか否かに応じて、分析対象サイト毎に可視化する。
【選択図】図1

Description

本発明は、興味分野比較分析装置及びシステム及び方法及びプログラムに係り、特に、主としてWebサイトの利用者(訪問者)の興味分野を明らかにすることで、分析対象のWebサイトの利用者の特徴を他のWebサイトと比較する形で把握するための興味分野比較分析装置及びシステム及び方法及びプログラムに関する。
Webサイト、特に電子商取引サイトの保有者にとって、保有するWebサイトを利用する利用者の興味分野の傾向を把握することは、利用者にきめ細かなサービスを提供し満足度を向上させる為にも重要である。
利用者の興味分野を把握する方法の一例としては、現状の多くの検索エンジンでは検索結果のWebページのURL中に利用者が検索に利用したキーワードがパラメータとして含まれているため、分析対象となるWebサイトのアクセスログ中のリファラを分析し、対象サイトへの流入に利用された検索キーワードを収集・集計する事で、当該サイト利用者の興味分野と解釈する方法がある(例えば、非特許文献1参照)。
また、Webサイトの利用者の満足度を向上させるという目的において重要な指標となるユーザの体感品質に関係する、当該Webサイトとの通信品質を測定する方法については既に提案された方法が存在している(例えば特許文献1参照)
特開2004-078712号公報
大塚 真吾,高久 雅生,喜連川 優,宮崎 収兄.女性向けフリーマガジン発行サイトにおけるユーザの行動分析.第1回データ工学と情報マネジメントに関するフォーラム(DEIM2009),論文集B8-4.
Webサイトの保有者が更なるアクセス数のアップのために、自身の保有するWebサイトの利用者がどのような興味を持っているかを知りたいと考えるのは当然のことである。
利用者の興味分野が分かれば、多くの利用者が興味を持っている分野に関するWebページを保有Webサイト内に増やすといった施策や当該分野のWebページに表示されるバナー広告を購入し、保有Webサイトへの誘導を強化するなどといった施策を実行することができる。
Webサイトの利用者の興味分野を把握するために、当該サイトのアクセスログ内のリファラ分析を行い、検索エンジンからの流入の際にどのような検索キーワードを用いていたかを集計した場合、確かに当該Webサイトにアクセスしてきた目的を把握することはできる。しかし、現在では検索エンジンはサイト利用者の主要経路ではあるが、当該サイトへの流入元の一部でしかない。
検索エンジンを経由していない場合でも、例えば、化粧品に関する話題を扱ったサイトからの流入が多いとすれば、当該Webサイトは化粧品に興味を持っている人がよく訪れるサイトと考えることができる。
さらに、当該Webサイトの利用者の興味分野を知るという意味では、当該サイト以外でのサイト閲覧行動も重要になるが、従来技術ではそのような閲覧行動の補足は考慮されていない。
また、競合Webサイトとの差別化を図るためには、分析対象のWebサイト利用者の興味分野だけでなく、競合Webサイト利用者の興味分野を把握することも重要となるが、当該サイトのアクセスログをベースとした従来技術では競合Webサイトの情報を収集することはできない。
本発明は、上記の点に鑑みなされたもので、自サイト利用者の興味分野のみならず、自サイト以外の利用者の興味分野を把握し、他サイトと比較した自サイト利用者の興味傾向を知ることが可能な興味分野比較分析装置及びシステム及び方法及びプログラムを提供することを目的とする。
上記の課題を解決するため、本発明(請求項1)は、Webサイト利用者の興味分野を推定する手段を有した興味分野比較分析装置であって、
閲覧ログ収集手段によって収集された閲覧ログを格納した閲覧ログ記憶手段と、
Webサイトと興味分野を対として登録したサイト-興味分野辞書と、
前記閲覧ログ記憶手段から読み出した閲覧者毎の前記閲覧ログの閲覧ページが前記サイト-興味分野辞書に登録されている場合には、興味分野毎に集計し、登録されていない場合には、該閲覧ページのURLに基づいて該閲覧ページの興味分野を推定し、該興味分野の集計値に加える閲覧者興味特定手段と、
前記閲覧ログ記憶手段から前記閲覧ログを読み出して、所定の規則に基づいて分析対象サイトを利用している利用者群を特定するWebサイト利用者特定手段と、
前記閲覧者興味特定手段で求められた興味分野毎の集計値に応じて順位付けし、前記Webサイト利用者特定手段で特定された利用者の中で、該興味分野の中に該興味分野に興味を有する閲覧者が存在するか否かに応じて、分析対象サイト毎に可視化する可視化手段と、を有する。
また、本発明(請求項2)は、前記可視化手段において、
前記分析対象サイト毎に、前記興味分野に興味を有するユーザIDのランキングを生成し、興味の強さをX軸とし、該X軸に対して該ランキングが昇順となる形式で、閲覧者の存在をY軸方向の線として配置して表示する手段を含む。
また、本発明(請求項3)は、Webサイト利用者の興味分野を推定するための興味分野比較分析装置であって、
収集された閲覧ログを格納した閲覧ログ記憶手段と、
Webサイトと興味分野を対として登録したサイト-興味分野辞書と、
前記閲覧ログ記憶手段から読み出した閲覧者毎の前記閲覧ログの閲覧ページが前記サイト-興味分野辞書に登録されている場合には、興味分野毎に集計し、登録されていない場合には、該閲覧ページのURLに基づいて該閲覧ページの興味分野を推定し、該興味分野の集計値に加える閲覧者興味特定手段と、
前記閲覧ログ記憶手段から前記閲覧ログを読み出して、所定の規則に基づいて分析対象サイトを利用している利用者群を特定するWebサイト利用者特定手段と、
前記Webサイト利用者特定手段で特定された前記利用者群から、前記閲覧者興味特定手段で得られた前記興味分野とWebサイトを組みとして、所定の条件を満たす利用者数を集計するWebサイト比較分析手段と、を有する。
また、本発明(請求項4)は、前記閲覧者興味分野特定手段において、
前記集計値として、閲覧ページ数、前記閲覧ページに関する閲覧ログ中の日時と該閲覧ログのユーザIDの直後の閲覧ログにおける日時との差分を秒単位で算出した閲覧時間を含む。
また、本発明(請求項5)は、前記Webサイト利用者特定手段において、
前記興味分野とWebサイトを組みとした条件として、比較分析の対象となるWebサイトは、そのWebサイトの組み合わせについて、各Webサイトの利用者群からJaccard係数を算出した際に、該計数が所定の値以下となるものとする
請求項3記載の興味分野比較分析装置。
上記のように、本発明によれば、閲覧者のブラウザに組み込まれた閲覧ログ収集手段によって収集された閲覧ログを分析することにより、分析対象のWebサイト以外での閲覧者の行動を考慮可能となり、競合するWebサイトの利用者の興味分野の分析も行うことが可能となる。
本発明の一実施の形態における興味分野比較分析装置の構成図である。 本発明の一実施の形態における閲覧ログ集積データベースの例である。 本発明の一実施の形態における閲覧者興味分野特定部のフローチャートである。 本発明の一実施の形態におけるサイト-興味分野辞書の例である。 本発明の一実施の形態における閲覧者興味特定部の出力例である。 本発明の一実施の形態におけるWebサイト比較分析部の出力例である。 本発明の一実施の形態における可視化部による可視化結果の例(その1)である。 本発明の一実施の形態における可視化部による可視化結果の例(その2)である。
以下、図面と共に本発明の実施の形態を説明する。
図1は、本発明の一実施の形態における興味分野比較分析装置の構成を示す。
同図に示す興味分野比較分析装置は、閲覧ログ集積データベース11、閲覧者興味分野特定部12、サイト-興味分野辞書13、Webサイト利用者特定部14、Webサイト比較分析部15、可視化部16から構成される。閲覧ログ集積データベース11は、ユーザ端末の閲覧ログ収集部10とネットワークを介して接続されている。
本発明の興味分野比較分析装置は、閲覧者のブラウザに組み込まれた閲覧ログ収集部10によって閲覧ログが収集され、閲覧ログ集積データベース11に集積された閲覧ログを分析することによって、分析対象のWebサイト以外での閲覧者の行動を考慮可能なことに加えて、競合するWebサイトの利用者の興味分野の分析も行うことが可能となる。また、以降では、閲覧者とWebサイトの利用者について、Webサイトの利用者とは閲覧者全体の集合の中で当該サイトを頻繁に利用する閲覧者のことを指すこととする。
より具体的には、閲覧ログデータベース11から、閲覧者興味分野特定部12とWebサイト利用者特定部14により得られた情報をWebサイト比較分析部15で統合することで、Webサイト毎に特徴的な利用者及び当該利用者の興味分野を特定する。
閲覧興味分野特定部12は、予め特定の興味分野を持つ閲覧者の要望を満たすようなWebサイト群をWebサイトと興味分野を対として登録したサイト-興味分野辞書13と閲覧WebページのURLに基づいて、閲覧者毎にその興味分野を特定する。
Webサイト利用者特定部14は、分析対象のWebサイト及びその競合となるWebサイトの特徴的な利用者閲覧頻度や閲覧時間等の統計的な指標に基づいて特定する。
Webサイト比較分析部15は、閲覧興味分野特定部12及びWebサイト利用者特定部14の結果を基に、分析対象及び比較対象のWebサイトの利用者の興味を集計し、比較分析を行う分析者に集計結果を提示する。
可視化部16は、Web比較分析部15と同様に、閲覧興味分野特定部12及びWebサイト利用者特定部14の結果に基づいて、分析対象及び比較対象のWebサイトの利用者の興味の違いを可視化し、分析者の提示することによって、分析者が容易にWebサイト間の違いを把握することが可能となる。
なお、図1に示された構成以外にも、例えば、Webサイト比較分析部15の出力を利用して、可視化部16が可視化結果を提示するといった構成も可能である。
以下に詳細に説明する。
閲覧ログ収集部10は、主としてユーザがWeb閲覧を行う端末に組み込まれる機能であり、一例としては、Webブラウザに追加機能(アドオンとも呼ばれる)として組み込まれる。他の構成法としては、Web閲覧を行う際に、必ずプロキシサーバを経由する構成とし、閲覧ログ収集部10をプロキシサーバ内に組み込む方法が考えられるが、以降の実施の形態の説明では、端末に組み込まれているとする。
また、ここでのユーザは大衆からサンプリングを行うことによって抽出された人を対象としてもよいが、より効果的に対象となるWebサイトの分析を行うためには、当該Webサイトの利用者を集めてくることが望ましい。
閲覧ログ収集部10の具体的な動作について説明する。
閲覧ログ収集部10は、ユーザがWebページの閲覧を行う度に、ユーザが閲覧しているWebページのURL、ユーザが直前に閲覧していたWebページのURL(リファラ)、日時、タイトル、当該ユーザに付与された一意に識別可能な固有のユーザID等をネットワーク転送により閲覧ログ集積データベース11に保存する。
閲覧ログ集積データベース11の一例を図2に示す。閲覧ログ集積データベース11は、ユーザIDごとに、日時、URL、リファラ、タイトルを格納する。
閲覧者興味分野特定部12は、閲覧ログ集積データベース11から閲覧者単位(ユーザID)で閲覧ログを取得し、閲覧者の興味分野を特定する。
図3は、本発明の一実施の形態における閲覧者興味分野特定部のフローチャートである。
閲覧者興味分野特定部12は、閲覧ログ集積データベース11から閲覧者単位でログを取得し(ステップ101)、一つ一つの閲覧ページに対して、まず、当該閲覧ページがサイト-興味分野辞書13に登録されているサイト内のページであるかどうかを判定する(ステップ102)。ここで、サイト-興味分野辞書13は、特定の興味分野を有するユーザが頻繁に閲覧するサイトを興味分野とサイトのURLを対として図4のような形で登録した辞書である。閲覧ページがサイト-興味分野辞書13に登録されているサイト内ページである場合は(ステップ102,Yes)、ステップ104の処理に移行し、閲覧ページがサイト-興味分野辞書13に登録されているサイト内ページではない場合は(ステップ102,No)、閲覧ページのURLを基に、該閲覧ページの興味分野を推定する。具体的には、URL中の部分文字列を基に、機械学習手法によって話題を推定する方法が知られている(例えば、非特許文献2:Eda Baykan, Monika Henzinger, Ludmila Marian, Ingmar Weber. Purely URL-based Topic Classification. In proceedings of 18th int. World Wide Web Conference, pp. 1109-1110. 2009.)。また、URLによって一意に定められるWebページに主として使われている言語の言語的な特性を考慮した上で、URL中の部分文字列を基に話題を推定する方法についても提案されている。具体的には、WebページのURLが入力されると、当該URL中のホスト名からホスト名の利用国を特定し、さらに当該ホスト名の利用国における主要言語を判定する。主要言語の言語特性を考慮してURLから特徴量を抽出し、その特徴量に基づいてWebページの話題を判定する。なお、話題を判定する方法としては、事前に特定の話題に属するか否かを学習した判別器を利用する方法がある。
当該閲覧ページが特定の興味分野に該当すると判定された場合には(ステップ103,Yes)、当該ユーザIDに対する興味分野毎の集計値をカウントアップする形で更新する(ステップ104)。ここで、集計値の例としては、閲覧ページ数、該閲覧ページを閲覧していたと考えられる閲覧時間(秒単位)等が考えられるが、これらに限るものではない。また、ここでの閲覧時間は該閲覧ページに関する閲覧ログ中の日時と当該ユーザIDの直後の閲覧ログにおける日時との差分を秒単位で算出したものによって定義することができる。但し、ここでの直後の閲覧ログとはリファラ(REFERRER)が該閲覧ページのURLと一致し、かつ、時間的に該閲覧ページの閲覧ログよりも後の時間となっている最初のログとする。また、閲覧時間については上限値(例えば、300秒)を設定することも考えられる。
閲覧者興味分野特定部12は、全ての閲覧ページ対して処理が完了すると(ステップ105、Yes)最終的には図5に示される形式でWebサイト比較分析部15に結果を出力する。全ての閲覧ページが完了するまでステップ102以降の処理を繰り返す。
Webサイト利用者特定部14は、閲覧ログ集積データベース11を基に、分析対象のWebサイト及び比較対象となるWebサイトに関して、予め定めた特定規則もしくは分析者から特定規則の入力を受け付ける機能を有しているものとし、分析者から入力された特定規則に従うことで該サイトの利用者を特定する。特定規則の例としては、閲覧回数が指定の回数以上、1週間単位の集計において2日以上該サイトにアクセスする、該サイトの1日の閲覧時間が指定値以上である等、非常に多岐にわたり規則を考える事が可能である。
ここで、特定規則はWebサイト毎に異なっていても良いが、Webサイト比較分析部15において有効な比較分析を行うために、少なくとも比較分析の対象となるサイトについては、どの2サイトの組合せについても、それぞれのWebサイトの利用者群からJaccard係数を算出した際に、その値が例えば0.2以下になるように規則を選択することが重要である。Jaccard係数の値が小さな値となればなるほど、それぞれのサイトで利用者が独立となるため、サイト間の違いを際立たせることが可能となる。Jaccard係数の算出方法は、あるWebサイトaに関して規則を満たしたユーザID群をA、もう一方のWebサイトbに対して規則を満たしたユーザID群をBとすると、以下の式(1)となる。
Jaccard(A,B) = |A∩B|/|A∪B|
Webサイト利用者特定部14は、最終的に分析対象および比較対象のWebサイトのそれぞれについて、当該サイトの利用者としてユーザIDの集合を当該サイトの情報も含め、Webサイト比較分析部15に出力する。
Webサイト比較分析部15は、閲覧者興味特定部12およびWebサイト利用者特定部14の出力結果を集計することによって、分析対象および比較対象のWebサイトの利用者の興味分野を明らかにする。
具体的には、Webサイト利用者特定部14の出力から得られる対象のWebサイト毎の利用者のユーザIDを基にして、閲覧者興味特定部12の出力から興味分野毎に、後述の一定の条件を満たすかどうかを調べ、Webサイトと興味分野を一つの対として、条件を満たすユーザIDを出力する、もしくは、ユーザID数を算出するといった例が考えられる。前者の場合、Webサイト比較分析部15の出力は図6のような形となる。また、ここでユーザID毎に当該ユーザが興味分野に対して興味を有するか否かを判定するための一定の条件の例としては、単純に閲覧ページ数や閲覧時間が一定値以上であるかどうか、閲覧者興味分野特定部12の出力結果を基に総閲覧ページ数・総閲覧時間を集計し、総閲覧ページ数・総閲覧時間に占める当該興味分野の閲覧ページ数・時間が一定割合以上であるかどうか、および、ユーザID毎に閲覧時間の割合が大きい興味分野の上位3分野を当該ユーザが興味を持つ分野とするといった方法が考えられる。
可視化部16はWebサイト比較分析部15と同様に閲覧者興味特定部12およびWebサイト利用者特定部14の出力結果を統合し集計した結果を、分析者がより簡単にWebサイト間の違いが把握できるような画像を出力する。
より具体的には、特定の興味分野について分析対象および比較対象のWebサイトの利用者の中に該興味分野に興味を有する閲覧者が存在するかを一瞥で把握するために、まず、閲覧者興味特定部12の出力から当該興味を有するユーザIDのランキングを作成する。ランキングを行う際の基準の例としては、単純に閲覧ページ数順や総閲覧時間に占める閲覧時間の割合等を利用することができる。このランキングを基に、X軸に対してランキングが昇順(ランクの値が小さいものから大きいものへと整列する形式)となる様な形で、閲覧者の存在をY軸方向の線として表現する形で配置する。さらに、分析対象サイトの利用者については、対象サイト毎に異なる色を彩色することで、サイト毎に取り込んでいるユーザ層を把握する事が可能となる。また、X軸方向はユーザの興味の強さを表現しているため、分析対象のサイトが比較対象のサイトと比べ、どの程度当該興味分野に強い興味を有しているユーザを取り込んでいるかを把握することが可能となる。上述の可視化結果の例を図7として示す。この例では、便宜上、分布の異なる2つの図を示しているが、それぞれの有色の縦棒を別々の色として1つの図に重ね合わせる様な形式で示しても良い。閲覧ログ集積データベース11に含まれる総ユーザID数は約800とし、X軸方向に「スポーツ」に対する興味の強さを、総閲覧時間に対して「スポーツ」に関連するページを閲覧した時間の割合として昇順で表現したものとする。分析対象サイトaおよび比較対象サイトbの利用者を有色の線として示す事によって、「スポーツ」に興味の強いユーザをどの程度利用者として取り込めているかを把握する事ができる。この例であれば、上位1〜200人までの有色の線の密度を見る事で、サイトbの方が「スポーツ」に興味の強い利用者をよく取り込んでいる事が一瞥可能である。なお、上述においては、線の密度およびX軸上での位置によって傾向を把握するという例を示したが、X軸上で10位単位に区間を区切り、当該区間中のWebサイトの利用者数を算出した上で、ヒストグラム形式や折れ線グラフ形式で可視化する方法も考えられる。
また、可視化部16において、Webサイト比較分析部15の出力を利用した上で可視化を行う方法も考えられる。具体的には、Webサイト比較分析部15より出力されたWebサイト、興味分野、ユーザID数に基づき、興味分野の幾つかを選択した上でユーザID数の大小に基づき、1以上5以下の実数値に置き換えることにより、図8に示すようなレーダーチャート形式によって可視化することで、Webサイト間の訪問者の興味傾向の違いを一瞥可能となる。ここで、上述においては、レーダーチャート形式での可視化の例を示したが、他にもWebサイト、興味分野、ユーザID数の情報に基づき、棒グラフや折れ線グラフによって可視化を行うことも可能である。
以上、前記までで得られた分析対象および比較対象のWebサイトの利用者の興味分野から、分析対象サイトが競合と比較して、取り込みを得意または苦手としている利用者層を把握する事が可能となり、苦手な興味分野の利用者層を取り込むための対策や多くの利用者が興味を有している分野に対するアクセス増に向けた強化策の検討を支援する事ができる。
なお、上記の興味分野比較分析装置の各構成要素の動作をプログラムとして構築し、興味分野比較分析装置として利用されるコンピュータにインストールして実行させる、または、ネットワークを介して流通させることが可能である。
本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において、種々変更・応用が可能である。
10 閲覧ログ収集部
11 閲覧ログ集積データベース
12 閲覧者興味分野特定部
13 サイト-興味分野辞書
14 Webサイト利用者特定部
15 Webサイト比較分析部
16 可視化部

Claims (8)

  1. Webサイト利用者の興味分野を推定する手段を有した興味分野比較分析装置であって、
    閲覧ログ収集手段によって収集された閲覧ログを格納した閲覧ログ記憶手段と、
    Webサイトと興味分野を対として登録したサイト-興味分野辞書と、
    前記閲覧ログ記憶手段から読み出した閲覧者毎の前記閲覧ログの閲覧ページが前記サイト-興味分野辞書に登録されている場合には、興味分野毎に集計し、登録されていない場合には、該閲覧ページのURLに基づいて該閲覧ページの興味分野を推定し、該興味分野の集計値に加える閲覧者興味特定手段と、
    前記閲覧ログ記憶手段から前記閲覧ログを読み出して、所定の規則に基づいて分析対象サイトを利用している利用者群を特定するWebサイト利用者特定手段と、
    前記閲覧者興味特定手段で求められた興味分野毎の集計値に応じて順位付けし、前記Webサイト利用者特定手段で特定された利用者の中で、該興味分野の中に該興味分野に興味を有する閲覧者が存在するか否かに応じて、分析対象サイト毎に可視化する可視化手段と、
    を有することを特徴とする興味分野比較分析装置。
  2. 前記可視化手段は、
    前記分析対象サイト毎に、前記興味分野に興味を有するユーザIDのランキングを生成し、興味の強さをX軸とし、該X軸に対して該ランキングが昇順となる形式で、閲覧者の存在をY軸方向の線として配置して表示する手段を含む
    請求項1記載の興味分野比較分析装置。
  3. Webサイト利用者の興味分野を推定する手段を有した興味分野比較分析装置であって、
    閲覧ログ収集手段によって収集された閲覧ログを格納した閲覧ログ記憶手段と、
    Webサイトと興味分野を対として登録したサイト-興味分野辞書と、
    前記閲覧ログ記憶手段から読み出した閲覧者毎の前記閲覧ログの閲覧ページが前記サイト-興味分野辞書に登録されている場合には、興味分野毎に集計し、登録されていない場合には、該閲覧ページのURLに基づいて該閲覧ページの興味分野を推定し、該興味分野の集計値に加える閲覧者興味特定手段と、
    前記閲覧ログ記憶手段から前記閲覧ログを読み出して、所定の規則に基づいて分析対象サイトを利用している利用者群を特定するWebサイト利用者特定手段と、
    前記Webサイト利用者特定手段で特定された前記利用者群から、前記閲覧者興味特定手段で得られた前記興味分野とWebサイトを組みとして、所定の条件を満たす利用者数を集計するWebサイト比較分析手段と、
    を有することを特徴とする興味分野比較分析装置。
  4. 前記閲覧者興味分野特定手段は、
    前記集計値として、閲覧ページ数、前記閲覧ページに関する閲覧ログ中の日時と該閲覧ログのユーザIDの直後の閲覧ログにおける日時との差分を秒単位で算出した閲覧時間を含む
    請求項1または3記載の興味分野比較分析装置。
  5. 前記Webサイト利用者特定手段は、
    前記興味分野とWebサイトを組みとした条件として、比較分析の対象となるWebサイトは、そのWebサイトの組み合わせについて、各Webサイトの利用者群からJaccard係数を算出した際に、該計数が所定の値以下となるものとする
    請求項3記載の興味分野比較分析装置。
  6. Webサイト利用者の興味分野を推定する興味分野比較分析システムであって、
    ユーザがWeb閲覧を行う度に、該ユーザが閲覧しているWebページの閲覧ログを収集する閲覧ログ収集手段と、
    前記閲覧ログ収集手段で収集された閲覧ログを格納した閲覧ログ記憶手段と、
    Webサイトと興味分野を対として登録したサイト-興味分野辞書と、
    前記閲覧ログ記憶手段から読み出した閲覧者毎の前記閲覧ログの閲覧ページが前記サイト-興味分野辞書に登録されている場合には、興味分野毎に集計し、登録されていない場合には、該閲覧ページのURLに基づいて該閲覧ページの興味分野を推定し、該興味分野の集計値に加える閲覧者興味特定手段と、
    前記閲覧ログ記憶手段から前記閲覧ログを読み出して、所定の規則に基づいて分析対象サイトを利用している利用者群を特定するWebサイト利用者特定手段と、
    前記閲覧者興味特定手段で求められた興味分野毎の集計値に応じて順位付けし、前記Webサイト利用者特定手段で特定された利用者の中で、該興味分野の中に該興味分野に興味を有する閲覧者が存在するか否かに応じて、分析対象サイト毎に可視化する可視化手段と、
    を有することを特徴とする興味分野比較分析システム。
  7. Webサイト利用者の興味分野を推定する興味分野比較分析方法であって、
    閲覧者のブラウザの閲覧ログ収集手段で収集された閲覧ログを格納した閲覧ログ記憶手段と、Webサイトと興味分野を対として登録したサイト-興味分野辞書と、閲覧者興味特定手段と、Webサイト利用者特定手段と、可視化手段と、を有する装置において、
    前記閲覧興味特定手段が、前記閲覧ログ記憶手段から読み出した閲覧者毎の前記閲覧ログの閲覧ページが前記サイト-興味分野辞書に登録されている場合には、興味分野毎に集計し、登録されていない場合には、該閲覧ページのURLに基づいて該閲覧ページの興味分野を推定し、該興味分野の集計値に加える閲覧者興味特定ステップと、
    前記Webサイト利用者特定手段が、前記閲覧ログ記憶手段から前記閲覧ログを読み出して、所定の規則に基づいて分析対象サイトを利用している利用者群を特定するWebサイト利用者特定ステップと、
    前記可視化手段が、前記閲覧者興味特定ステップで求められた興味分野毎の集計値に応じて順位付けし、前記Webサイト利用者特定ステップで特定された利用者の中で、該興味分野の中に該興味分野に興味を有する閲覧者が存在するか否かに応じて、分析対象サイト毎に可視化する可視化ステップと、
    を行うことを特徴とする興味分野比較分析方法。
  8. コンピュータを、
    請求項1乃至5のいずれか1項に記載の興味分野比較分析装置の各手段として機能させるための興味分野比較分析プログラム。
JP2012271478A 2012-12-12 2012-12-12 興味分野比較分析装置及び方法及びプログラム Expired - Fee Related JP5906176B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012271478A JP5906176B2 (ja) 2012-12-12 2012-12-12 興味分野比較分析装置及び方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012271478A JP5906176B2 (ja) 2012-12-12 2012-12-12 興味分野比較分析装置及び方法及びプログラム

Publications (2)

Publication Number Publication Date
JP2014115952A true JP2014115952A (ja) 2014-06-26
JP5906176B2 JP5906176B2 (ja) 2016-04-20

Family

ID=51171849

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012271478A Expired - Fee Related JP5906176B2 (ja) 2012-12-12 2012-12-12 興味分野比較分析装置及び方法及びプログラム

Country Status (1)

Country Link
JP (1) JP5906176B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016194996A1 (ja) * 2015-06-05 2016-12-08 日本電信電話株式会社 ユーザ推定装置、ユーザ推定方法、および、ユーザ推定プログラム
KR20170030622A (ko) * 2015-05-26 2017-03-17 바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드 2차원 코드를 해석하는 방법 및 장치, 컴퓨터 판독 가능한 저장 매체, 컴퓨터 프로그램 제품 및 단말기 장치

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002024475A (ja) * 2000-06-30 2002-01-25 Plala Networks Inc ユーザ情報収集方法
JP2002132830A (ja) * 2000-10-27 2002-05-10 Nippon Telegr & Teleph Corp <Ntt> Webサイト情報の表示方法およびそのシステム
JP2003330852A (ja) * 2002-05-10 2003-11-21 Canon Electronics Inc 情報管理サーバ、情報処理装置、情報管理システム及びそれらの制御方法、プログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002024475A (ja) * 2000-06-30 2002-01-25 Plala Networks Inc ユーザ情報収集方法
JP2002132830A (ja) * 2000-10-27 2002-05-10 Nippon Telegr & Teleph Corp <Ntt> Webサイト情報の表示方法およびそのシステム
JP2003330852A (ja) * 2002-05-10 2003-11-21 Canon Electronics Inc 情報管理サーバ、情報処理装置、情報管理システム及びそれらの制御方法、プログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170030622A (ko) * 2015-05-26 2017-03-17 바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드 2차원 코드를 해석하는 방법 및 장치, 컴퓨터 판독 가능한 저장 매체, 컴퓨터 프로그램 제품 및 단말기 장치
JP2017534097A (ja) * 2015-05-26 2017-11-16 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド 二次元コードの解析方法および装置、コンピュータ読み取り可能な記憶媒体、コンピュータプログラム製品および端末機器
KR101952248B1 (ko) * 2015-05-26 2019-02-26 바이두 온라인 네트웍 테크놀러지 (베이징) 캄파니 리미티드 2차원 코드를 해석하는 방법 및 장치, 컴퓨터 판독 가능한 저장 매체, 컴퓨터 프로그램 제품 및 단말기 장치
WO2016194996A1 (ja) * 2015-06-05 2016-12-08 日本電信電話株式会社 ユーザ推定装置、ユーザ推定方法、および、ユーザ推定プログラム
JPWO2016194996A1 (ja) * 2015-06-05 2017-11-09 日本電信電話株式会社 ユーザ推定装置、ユーザ推定方法、および、ユーザ推定プログラム
US10860669B2 (en) 2015-06-05 2020-12-08 Nippon Telegraph And Telephone Corporation User estimation apparatus, user estimation method, and user estimation program

Also Published As

Publication number Publication date
JP5906176B2 (ja) 2016-04-20

Similar Documents

Publication Publication Date Title
Lu et al. Between clicks and satisfaction: Study on multi-phase user preferences and satisfaction for online news reading
CN107862022B (zh) 文化资源推荐系统
WO2016101777A1 (zh) 用户兴趣数据分析和收集系统及其方法
JP4637969B1 (ja) ウェブページの主意,およびユーザの嗜好を適切に把握して,最善の情報をリアルタイムに推奨する方法
US8930384B2 (en) Topical activity monitor system and method
KR101566616B1 (ko) 빅데이터 처리를 통한 광고의사결정시스템 및 방법
JP5895052B2 (ja) 情報分析システム及び情報分析方法
US9245035B2 (en) Information processing system, information processing method, program, and non-transitory information storage medium
JP6681661B2 (ja) アクセス解析画像提供装置、アクセス解析画像提供方法、及びプログラム
GB2498762A (en) Computing user traffic at the website based on user actions
JP2014203442A (ja) レコメンド情報生成装置及びレコメンド情報生成方法
JP2011227721A (ja) 関心抽出装置、関心抽出方法、及び関心抽出プログラム
US8140444B2 (en) Method of measuring a large population of web pages for compliance to content standards that require human judgement to evaluate
CN111460333B (zh) 一种实时搜索数据分析系统
Yom-Tov et al. Measuring inter-site engagement
US10296924B2 (en) Document performance indicators based on referral context
JP5906176B2 (ja) 興味分野比較分析装置及び方法及びプログラム
KR100557874B1 (ko) 과학기술 정보분석 방법 및 그 방법에 대한 컴퓨터프로그램을 저장한 기록매체
CN116089732B (zh) 基于广告点击数据的用户偏好识别方法及系统
JP2010218475A (ja) ブログ分析方法及び装置
JP2016118957A (ja) サーバ装置、システム、情報処理方法、及びプログラム
KR20170118399A (ko) 빅데이터를 이용한 검색 방법 및 장치
JP2010282561A (ja) 情報処理装置、情報処理システム、情報処理方法および情報処理プログラム
KR101318843B1 (ko) 시간 정보를 활용한 블로그 카테고리 분류 방법 및 장치
CN105243133B (zh) 一种搜索记录显示方法及电子设备

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150213

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20151221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160105

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160222

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160315

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160318

R150 Certificate of patent or registration of utility model

Ref document number: 5906176

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees