JP2014119838A - ユーザ行動可視化情報付与装置及び方法及びプログラム及びアクセスログ分析装置 - Google Patents

ユーザ行動可視化情報付与装置及び方法及びプログラム及びアクセスログ分析装置 Download PDF

Info

Publication number
JP2014119838A
JP2014119838A JP2012272879A JP2012272879A JP2014119838A JP 2014119838 A JP2014119838 A JP 2014119838A JP 2012272879 A JP2012272879 A JP 2012272879A JP 2012272879 A JP2012272879 A JP 2012272879A JP 2014119838 A JP2014119838 A JP 2014119838A
Authority
JP
Japan
Prior art keywords
host
information
domain
path
url
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012272879A
Other languages
English (en)
Other versions
JP5890301B2 (ja
Inventor
Yamato Takahashi
大和 高橋
Yusuke Ichikawa
裕介 市川
Masashi Uchiyama
匡 内山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2012272879A priority Critical patent/JP5890301B2/ja
Publication of JP2014119838A publication Critical patent/JP2014119838A/ja
Application granted granted Critical
Publication of JP5890301B2 publication Critical patent/JP5890301B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 ユーザのアクセスログの登録されていないURLのみから、URLを分類するための手掛かりとなる付与情報を得る。
【解決手段】 本発明は、アクセスログに付加するための、ドメイン名に対応するドメイン関連情報を対応付けたドメインデータと、ホスト名とホスト関連情報を対応付けたホストデータとを格納した付加情報記憶手段と、入力されたアクセスログのURLを、スキーム、ホスト名、ドメイン名、パスに分割し、ディレクトリ部分の有無を検査するURL分割手段と、スキーム、ドメイン名、ホスト名の順に付加情報記憶手段のデータとのマッチングするマッチング規則に基づいて、URL分割手段で分割されたスキーム、ドメイン名、ホスト名について該付加情報記憶手段を参照して、検索された付与情報をアクセスログと共に結果蓄積手段に出力する付与情報決定手段と、を有する。
【選択図】 図1

Description

本発明は、ユーザ行動可視化情報付与装置及び方法及びプログラム及びアクセスログ分析装置に係り、特に、Web上の行動を記録したユーザ毎のアクセスログのURL(Uniform Resource Locator)からユーザがどのようなWebページを閲覧したかを分類し、ユーザの行動を把握するためのユーザ行動可視化情報付与装置及び方法及びプログラム及びアクセスログ分析装置に関する。
登録済みのURLのみについての分類情報を提供する機能として、例えば、"ヤフー!カテゴリ検索(登録商標)"(非特許文献1参照)では、Webサイト内にどのような情報があるかを示すカテゴリ体系に沿ってURLを分類、整理して検索できるよう公開している。基本的には、カテゴリで検索を行い、そこに属するURLを取得することができる。
また、ネットスター(登録商標)のカテゴリ登録確認(非特許文献2参照)も同様に、登録済みのURLに関してカテゴリを取得できる確認インターフェースを備える。
Yahooカテゴリ http://dir.hahoo.co.jp/ NetSTARのカテゴリ分類確認 http://category.netstar-inc.com/check/index.html
しかしながら、上記非特許文献1のカテゴリ検索を利用することで、逆に登録されているURLに関しては、属するカテゴリを取得することは可能であるが、未登録ホストに関するカテゴリは取得することができない、という問題がある。
また、非特許文献2は、例えば、http://www.itmedia.co.jp/news/(ITメディアニュース(登録商標))の情報は分類結果を取得できるが、http://www.itmedia.co.jp/(ITメディア(登録商標))に関する情報については分類結果を取得できない。
上記のように、従来のポータルサイトでは、登録済みのURLについてのみしか分類情報が得られなかった。
本発明は、上記の点に鑑みなされたもので、ユーザのアクセスログの登録されていないURLのみから、URLを分類するための手掛かりとなる情報を得ることが可能なユーザ行動可視化情報付与装置及び方法及びプログラム及びアクセスログ分析装置を提供することを目的とする。
上記の課題を解決するため、本発明(請求項1)は、Web上の行動を記録したユーザ毎のアクセスログのURLからユーザの行動を把握するためのユーザ行動可視化情報付与装置であって、
前記アクセスログに付加するための、ドメイン名に対応するドメイン関連情報を対応付けたドメインデータと、ホスト名とホスト関連情報を対応付けたホストデータとを格納した付加情報記憶手段と、
入力されたアクセスログのURLを、スキーム、ドメイン名、ホスト名、パスに分割し、該パスのディレクトリ部分の有無を検査するURL分割手段と、
スキーム、ドメイン名、ホスト名の順に前記付加情報記憶手段のデータとのマッチングするマッチング規則に基づいて、前記URL分割手段で分割された前記スキーム、前記ドメイン名、前記ホスト名について該付加情報記憶手段を参照して、検索された付与情報をアクセスログと共に結果蓄積手段に出力する付与情報決定手段と、を有する。
また、本発明(請求項2)は、前記付与情報決定手段において、
前記マッチング規則に加えて、パスに対するマッチング規則に基づいて、前記付加情報記憶手段からパスに対応する付加情報を取得する手段を含む。
また、本発明(請求項3)は、前記付与情報決定手段において、
前記ドメイン名に基づいて前記付加情報記憶手段の前記ドメインデータを参照してドメイン付与情報が得られ、前記ホスト名に基づいて前記ホストデータを参照してホスト付与情報が得られ、前記パスに基づいて該ホストデータに含まれる、パス先頭の"/"に続く1文字を格納したパスマッチリストを参照し、対応するパスのリストとホスト付与情報の組が得られ、前記パスに基づいて該ホストデータに含まれるパスが得られた場合には、該ドメイン付与情報と該パス−ホスト付与情報を出力する手段と、
前記ドメイン名に基づいて前記付加情報記憶手段の前記ドメインデータを参照してドメイン付与情報が得られ、前記ホスト名に基づいて前記ホストデータを参照してホスト付与情報が得られ、前記パスに基づいて該ホストデータに含まれる前記パスマッチリストを参照し、対応するパスのリストとホスト付与情報の組が得られ、前記パスに対応する該ホストデータに含まれるパスが得られない場合には、該ドメイン付与情報と該ホスト付与情報を出力する手段と、
前記ドメイン名に基づいて前記付加情報記憶手段の前記ドメインデータを参照してドメイン付与情報が得られ、前記ホスト名に基づいて前記ホストデータを参照してホスト付与情報が得られ、前記パスに基づいて該ホストデータに含まれる前記パスマッチリストを参照し、対応するパスのリストとホスト付与情報の組が得られない場合は、該ドメイン付与情報と該ホスト付与情報を出力する手段と、
前記ドメイン名に基づいて前記付加情報記憶手段の前記ドメインデータを参照してドメイン付与情報が得られ、該ドメイン名に基づいて前記ホストデータを参照してホスト付与情報が得られない場合で、前記ドメインデータに含まれる同じ役割を持つ複数のホストがある場合に、該ホストデータの、同じ付与情報を与えてもよい複数のホストを扱うためのルールである特別ホストルールに前記ホスト名がある場合は、該ホスト名に対応するホスト付与情報と、該ドメイン付与情報を出力する手段と、
前記ドメイン名に基づいて前記付加情報記憶手段の前記ドメインデータを参照してドメイン付与情報が得られ、前記特別ホストルールに前記ホスト名がない場合は、未知ホストドメイン付与情報を出力する手段と、
を含む。
また、本発明(請求項4)は、前記付与情報決定手段において
前記URL分割手段で前記パスに前記ディレクトリ部分がある場合は、パス先頭の"/"に続く1文字がマッチリスト含まれているかを判定し、含まれていない場合はURLにドメイン付与情報とホスト付与情報を付与し、必要に応じて任意の追加処理を行い、該パスに該ディレクトリ部分がない場合は該パスマッチリストとの照合は行わず、必要に応じて任意の追加処理を行う手段を含む。
本発明によれば、予めマッチング規則と、規則にマッチした場合の付与情報を対応させて作成しておくことにより、URLのみから、URLを分類するための手掛かりとなる情報を得ることができる。ユーザのアクセスログに含まれるURLにこの技術を適用することで、ユーザの行動把握に利用することが可能となる。
本発明の第1の実施の形態におけるユーザ行動可視化情報付与装置の構成図である。 本発明の第1の実施の形態におけるアクセスログ蓄積装置のアクセスログの例である。 本発明の第1の実施の形態における付与情報DBのデータ例である。 本発明の第1の実施の形態におけるアクセスログのURLの構成例である。 本発明の第1の実施の形態における付与情報決定部のフローチャートである。 本発明の第1の実施の形態における出力データの例である。 本発明の第2の実施の形態におけるアクセス分析装置の構成図である。
以下、図面と共に本発明の実施の形態を説明する。
Web上では、新規のホストが日々出現しているため、未登録ホストである場合、正しいカテゴリを取得することはできない。しかし、ユーザ行動把握の観点からは、正しいカテゴリではなくとも、あるWebサービスの一部である、ということが示されるだけでも有用である。例えば、Webサービスの一つであるYahoo!オークション(登録商標)は、http://auctions.yahoo.co.jp/をサービストップとして、多数のホストから成り立っている。これらのホスト名すべてを正確に知ることは難しいが、"XXX.auctions.yahoo.co.jp"であれば、Yahoo!オークション(登録商標)の一部であろう、という推測は可能であり、Yahoo!オークション(登録商標)の一部であることを示されることは、どういったWebサービスを利用したのかの把握をしやすくなる。
このように、未登録のホストであっても、ホストの一部のあるレベルまでのドメインであれば何かしらの付与情報を提示することができる場合が多い。例えば、ヤフー(登録商標)(yahoo.co.jp)で新規のサービスを行うホストが追加された場合(例:newservice.yahoo.co.jpが新規に稼動)でも、yahoo.co.jpドメインに属しているから「ヤフー(登録商標)の一部」であることを示すだけでも有用である。
また、ブログサイトでは、ホスト毎にブログユーザが割り当てられるものも多い。例えば、So-net(登録商標)ブログ(http://blog.so-net.ne.jp/)は、ユーザ毎にホストを割り当てる(例:http://amanosworld.blog.so-net.ne.jp/)場合も、ドメイン(blog.so-net.ne.jp)でブログサイトという付加情報を示すだけでも有用と考えられる。
図1は、本発明の一実施の形態におけるユーザ行動可視化情報付与装置の構成を示す。
同図に示すユーザ行動可視化情報付与装置10は、URL分割処理部11、付与情報決定部12、付与情報DB13を有し、URL分割処理部11は、アクセスログ蓄積装置1に、付与情報決定部12は結果蓄積装置2に接続されている。URL分割処理部11は、アクセスログ蓄積装置1からアクセスログを取得し、当該アクセスログからURLを分割し、スキーム、ドメイン名、ホスト名、パスを抽出し、ディレクトリ部分の有無を検査して付与情報決定部12に出力する。付与情報決定部12は、ドメイン名に基づいて付与情報DB13を検索し、付与情報を取得して、アクセスログと付与情報を結果蓄積装置2に出力する。
アクセスログ蓄積装置1の例を図2に示す。アクセスログは、ユーザID毎に、アクセス時刻とアクセスしたURLを保持する。
付与情報DB13は、図3に示すように、ドメインデータとホストのデータからなる。
ドメインのデータは、同図(a)に示すように、ドメイン名、ドメイン関連情報を有する。ドメイン関連情報としては、スキーム、ドメイン付与情報、特別ホストルール、ホスト付与情報を含む。ホストデータは、同図(b)に示すように、ホスト名とホスト関連情報を有し、ホスト関連情報は、スキーム、ホスト付与情報、パスマッチリスト、パスリスト、ホスト付与情報(パス)を含む。
URL分割処理部11は、アクセスログを取得し、URLからスキーム、ドメイン名、ホスト名、パスを抽出し、パス部分にディレクトリがあるかを検査する。アクセスログのURLの例を図4に示す。本実施の形態では、プロトコルを識別するスキーム、WebサーバやWebアプリケーションを実行するマシンを識別するホスト部、ドメイン名、Webサーバ、アプリケーション内でのメッセージの送り先を識別するパス情報を抽出するものとする。
付与情報決定部12は、ドメイン名を生成し、付与情報を決定する。ドメイン名は、URLのホスト名から2nd、もしくは3rdレベルまで利用して生成する。日本では、co,ne, go,ed, ad,ac,or,gr,lgが2ndレベル予約ドメインとなっており、これらの場合は、3rdレベルドメインまでで、ドメイン名として扱う。
付与情報決定部12において取り扱うスキームは任意であるが、必ず何らかのスキームとドメイン付与情報は記載するものとする。付与情報決定部12では、ドメイン名とスキームが決まれば、URLに付与すべきドメイン付与情報が決定できる。
付与情報DB13の特別ホストルールは、同じ役割を持つ複数のホストがある場合に、それぞれのホスト名一つ一つのエントリを用意するよりも、正規表現などを使って簡潔に表現することで、同じ付与情報を与えてもよい複数のホストを扱うためのルールである。例えば、blog…は、"blog000"や"blog111"といったホストにマッチして、メールというホスト付与情報をURLに付与することになる。
ホスト名とスキームが決まれば、URLに付与すべきホスト付与情報が決定できる。但し、ホストによっては、パスによってサービスが変わることがあるため、そういったパスは、ホストのデータ(図3(b))のパスリストとして扱う。パスリストに纏めるパスの数は、ホストによってはかなり大量になる場合が考えられる。パスは、パスの文字数分合っているかを検査しなければならないため、数が多い場合は検査に時間がかかることになる。また、パスは、"/"を区切りとして複数の単語から構成されるため、URLのパス部分をもとに単語の組み合わせで検索を行おうとすると、パスのインデックスが複雑になる。そのため、ホストデータに含まれるパスリストを基に、URLのパス部分の先頭からパス文字列が全て合っているかどうかで判断する方が効率的である。さらに、余計なパスの検査を省くために、結果パスリストのパス先頭の"/"に続く1文字をまとめ、パスマッチリストとして付与情報DB13のホストのデータ(図3(b))に格納する。これにより、1文字を検査するだけで、パスリストでの検査を要/不要を判定できる。
例えば、あるURL(http://www.aaa.co.jp/articles/20120101.html)に対して、パス部分(/articles/20120101.html)の先頭の/に続く1文字"a"は、このパスリスト(nmb)には含まれていないので、ホスト付与情報としては、「ポータル」が与えられる。
また、あるURL(http://www.aaa.co.jp/news/20120101.html)に対して、パス部分(/news/20120101.html)のパス先頭の/に続く"n"は、このパスリスト(nmb)には含まれているので、続いて、パスリストのパス(/news/)がURLのパス部分に全部含まれているかを検査する。この場合は含まれているので、ホスト付与情報としては、「ニュース」が与えられる。
また、URLには、検索クエリやブログユーザ名が含まれていることもあるため、こういった情報をURLから抽出したい場合、その制御として、ホスト付与情報に特定のキーワードを記述する機構を追加してもよい。
図4は、本発明の一実施の形態における付与情報決定部のフローチャートである。
付与情報決定部12は、URL分割処理部11から取得したURLから2nd、もしくは、3rdまでを使ってドメイン名を生成する(ステップ1)。
以下の処理は、ドメイン名、ホスト名、パスの順に付与情報DB13とマッチングする。
付与情報DB13のドメインデータを参照し、ステップ1で生成したドメイン名が登録されているかを判定する(ステップ2)。ない場合は、未知ドメインとして出力し、当該処理を終了する(ステップ3)。ドメイン名がある場合は、取得したドメイン関連情報を基に、スキームに応じたドメイン付与情報をURLに付与する。もし、ドメインデータの関連情報に該当スキームがない場合でも、必ず何らかのスキームとドメイン付与情報があるので、URLに付与して、補完した旨と共に出力結果とする。
URL分割処理部11から取得したホスト名に基づいて、付与情報DB13のホストデータを参照し、ホスト名を検索する(ステップ4)。ホスト名がなかった場合はステップ4、無)、ホストデータの特別ホストルールに適合するかを検査する(ステップ5)。特別ホストルールと適合した場合には、URLにホスト付加情報を付加して出力する。適合しなかった場合は(ステップ5,無)、ドメイン付与情報のみを出力する(ステップ6)。
ステップ4において、ホスト名がホスト名データにあり、それに加えてパス部分にディレクトリがあった場合は、パス部分先頭の"/"に続く1文字がホストデータのパスマッチリストに含まれているかどうか検査し(ステップ7)、パスマッチリストに含まれていない場合は、URLにドメイン付与情報とホスト付与情報を付与し(ステップ8)、付与情報の内容によっては、追加処理を行って出力する。パス部分にディレクトリが無かった場合は、パスマッチリストとの照合は必要はないが、付与情報の内容によっては、追加処理を行って、その結果を出力する。
追加処理の一例としては、検索キーワードの抽出が挙げられる。追加処理としての、検索キーワードの抽出ルールは、例えば、search.cgi?query=%00%11から、%00%11を抽出して、可能なら入力された検索キーワードまで復号して示す等の方法がある。
ステップ7でパスマッチリストのパスにマッチした場合、パスリストにあるパスを順に、URLのパス部分に含まれているかを検査し(ステップ9)、含まれているものがあれば(ステップ9、有り)、ホスト付与情報(パス)をURLに付与し、付与情報の内容によっては、追加処理を行って出力する。ない場合は(ステップ9、無)、ドメイン付与情報とホスト付与情報のみを付与し、出力する(ステップ10)。パスリストの判定の際には、パスリストの先頭の"/"に続く1文字のみをチェックするものとする。
上記のステップ5において、ホストデータの特別ホストルールに合致するホスト名があり、かつ、追加処理が必要である場合は(ステップ11、有り)、ドメイン付与情報とホスト付与情報、追加処理情報を出力する(ステップ12)。追加処理が不要である場合は(ステップ11、無)、ドメイン付与情報とホスト付与情報を出力する(ステップ13)。
上記のステップ9において、パスリストに該当するパスがある場合で、かつ、追加処理が必要な場合は(ステップ14、有り)、例えば、上記のような検索キーワード抽出ルールより、検索キーワードを抽出し(ステップ16)。追加処理が不要な場合は(ステップ14、無)、ドメイン付与情報とホスト付与情報(パス)を出力する(ステップ15)。
上記の処理により出力されるデータの例を図5に示す。同図に示すように、URL、ドメイン付与情報、ホスト付与情報が結果蓄積装置2に出力される。
上記の処理により、対象とするアクセスログのURLに対して、ドメイン付与情報とホスト付与情報を与えることが可能となる。
[第2の実施の形態]
本実施の形態では、第1の実施の形態におけるユーザ行動可視化情報付与装置の機能に、集計機能を付加し、アクセスログの分析を行うためのアクセスログ分析装置について説明する。アクセスログ分析装置は、ドメイン付与情報にWebサイトの名称だけではなく、その運用元や関連情報も保持しておき、当該運用元での集計や関連情報による集計を可能にするものである。
図6は、本発明の第2の実施の形態におけるアクセスログ分析装置の構成を示す。
同図に示すアクセスログ分析装置20は、付与情報展開部21、展開付与情報記憶部22、付与情報集約部23を有し、付与情報展開部21は、第1の実施の形態でアクセスログと付与情報が格納された結果蓄積装置2に接続され、付与情報集約部23は集約結果蓄積装置3に接続されている。なお、同図に示すアクセスログ分析装置20は、図1に示すユーザ行動可視化情報付与装置10とは独立した構成としているが、この例に限定されることなく、図1のユーザ行動可視化情報付与装置10を含む構成としてもよい。
付与情報展開部21は、ドメイン付与情報やホスト付与情報に対するブランド等の追加情報を、ドメイン付与情報のラベル名に対応付けた関連情報や、辞書やルールといった形式で格納するメモリ211を有し、結果蓄積装置2から、アクセスログ(URL)と付与情報(ドメイン付与情報、ホスト付与情報)を読み込み、アクセスログからユーザ情報とURLを抽出し、メモリ211を参照してドメイン付与情報、もしくはホスト付与情報に対する追加情報を取得、または、生成し、付与情報と共に、展開付与情報記憶部22に格納する。
ドメイン付与情報は、主には、Webサービス名(例:Yahoo!(登録商標)や楽天市場(登録商標)など)を記述することにより、どういったサイトにアクセスしたかが分かり易くなる。これに加えて、上記のように追加情報を加えて展開付与情報記憶部22に格納することにより、付与情報集約部23において、その運用会社名に基づいて集計することで、URLだけでは集計できない事象を可視化することができる。例えば、楽天市場(登録商標)の関連サイトとして、サイトa、サイトb、サイトcがあった場合に、ユーザ毎に、各サイトに何回アクセスしたかを集計することが可能となる。
付与情報展開部21で追加する追加情報について説明する。
例えば、化粧品を扱う会社は様々なブランド名を持ち、ブランド名による公式サイトを運営している。これらのブランドサイトがどの会社が母体であるかについては、人手や機械的な推定処理などで関係性を作成しておき、付与情報展開部21内のメモリ211に格納しておく。例えば、SK-II(登録商標)(www.sk-ii.jp)はP&G(登録商標)が母体であり、P&G(登録商標)は他にも、アリエール(登録商標)(http://myrepi.com/ariel/)やファブリーズ(登録商標)(http://www.febreze.jp/)といった、URLだけでは推定できない関係性を追加情報として付与情報に付与して展開付与情報記憶部22に格納する。
これにより、付与情報集約部23では、展開付与情報記憶部22に格納された情報を活用することで、特定メーカの複数ブランドへのアクセスの集計が可能となる。
また、ホスト付与情報は、付与情報展開部21において、後ほど付与情報集約部23での集計を意識してラベルを付与し、展開付与情報記憶部22に格納する。
付与情報集約部23は、展開付与情報記憶部22のホスト情報とラベルを用いて、同一ラベルに属する異なるドメイン、いわば競合サービスへのアクセスを把握することができる。
例えば、"www.Yahoo.co.jp"やwww.goo.ne.jpに「ポータル」といったラベルを付与することで、アクセスしたサービスを認識し易くすると共に、「ポータル」で集計することで競合サービスとの使い分けなどが分かる。
付与情報集約部23は、種々の集計が可能であるが、例えば、ユーザ毎のドメイン付与情報利用率、ホスト付与情報のラベルごとのユーザ数等を集約結果蓄積装置3に出力する。
なお、本発明は、図1に示すユーザ行動可視化情報付与装置、及び図7のアクセス分析装置の構成要素の動作をプログラムとして構築し、ユーザ行動可視化情報付与装置やアクセス分析装置として利用されるコンピュータにインストールして実行させる、または、ネットワークを介して流通させることが可能である。
本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において、種々変更・応用が可能である。
1 アクセスログ蓄積装置
2 結果蓄積装置
3 展開付与情報記憶部
10 ユーザ行動可視化情報付与装置
11 URL分割処理部
12 付与情報決定部
13 付与情報DB
20 アクセス分析装置
21 付与情報展開部
22 展開付与情報記憶部
23 付与情報集約部
211 メモリ

Claims (7)

  1. Web上の行動を記録したユーザ毎のアクセスログのURLからユーザの行動を把握するためのユーザ行動可視化情報付与装置であって、
    前記アクセスログに付加するための、ドメイン名に対応するドメイン関連情報を対応付けたドメインデータと、ホスト名とホスト関連情報を対応付けたホストデータとを格納した付加情報記憶手段と、
    入力されたアクセスログのURLを、スキーム、ドメイン名、ホスト名、パスに分割し、該パスのディレクトリ部分の有無を検査するURL分割手段と、
    スキーム、ドメイン名、ホスト名の順に前記付加情報記憶手段のデータとのマッチングするマッチング規則に基づいて、前記URL分割手段で分割された前記スキーム、前記ドメイン名、前記ホスト名について該付加情報記憶手段を参照して、検索された付与情報をアクセスログと共に結果蓄積手段に出力する付与情報決定手段と、
    を有することを特徴とするユーザ行動可視化情報付与装置。
  2. 前記付与情報決定手段は、
    前記マッチング規則に加えて、パスに対するマッチング規則に基づいて、前記付加情報記憶手段からパスに対応する付加情報を取得する手段を含む
    請求項1記載のユーザ行動可視化情報付与装置。
  3. 前記付与情報決定手段は、
    前記ドメイン名に基づいて前記付加情報記憶手段の前記ドメインデータを参照してドメイン付与情報が得られ、前記ホスト名に基づいて前記ホストデータを参照してホスト付与情報が得られ、前記パスに基づいて該ホストデータに含まれる、パス先頭の"/"に続く1文字を格納したパスマッチリストを参照し、対応するパスのリストとホスト付与情報の組が得られ、前記パスに基づいて該ホストデータに含まれるパスが得られた場合には、該ドメイン付与情報と該パス−ホスト付与情報を出力する手段と、
    前記ドメイン名に基づいて前記付加情報記憶手段の前記ドメインデータを参照してドメイン付与情報が得られ、前記ホスト名に基づいて前記ホストデータを参照してホスト付与情報が得られ、前記パスに基づいて該ホストデータに含まれる前記パスマッチリストを参照し、対応するパスのリストとホスト付与情報の組が得られ、前記パスに対応する該ホストデータに含まれるパスが得られない場合には、該ドメイン付与情報と該ホスト付与情報を出力する手段と、
    前記ドメイン名に基づいて前記付加情報記憶手段の前記ドメインデータを参照してドメイン付与情報が得られ、前記ホスト名に基づいて前記ホストデータを参照してホスト付与情報が得られ、前記パスに基づいて該ホストデータに含まれる前記パスマッチリストを参照し、対応するパスのリストとホスト付与情報の組が得られない場合は、該ドメイン付与情報と該ホスト付与情報を出力する手段と、
    前記ドメイン名に基づいて前記付加情報記憶手段の前記ドメインデータを参照してドメイン付与情報が得られ、該ドメイン名に基づいて前記ホストデータを参照してホスト付与情報が得られない場合で、前記ドメインデータに含まれる同じ役割を持つ複数のホストがある場合に、該ホストデータの、同じ付与情報を与えてもよい複数のホストを扱うためのルールである特別ホストルールに前記ホスト名がある場合は、該ホスト名に対応するホスト付与情報と、該ドメイン付与情報を出力する手段と、
    前記ドメイン名に基づいて前記付加情報記憶手段の前記ドメインデータを参照してドメイン付与情報が得られ、前記特別ホストルールに前記ホスト名がない場合は、未知ホストドメイン付与情報を出力する手段と、
    を含む請求項1または2記載のユーザ行動可視化情報付与装置。
  4. 前記付与情報決定手段は、
    前記URL分割手段で前記パスに前記ディレクトリ部分がある場合は、パス先頭の"/"に続く1文字がマッチリスト含まれているかを判定し、含まれていない場合はURLにドメイン付与情報とホスト付与情報を付与し、必要に応じて任意の追加処理を行い、該パスに該ディレクトリ部分がない場合は該パスマッチリストとの照合は行わず、必要に応じて任意の追加処理を行う手段を含む
    請求項1記載のユーザ行動可視化情報付与装置。
  5. Web上の行動を記録したユーザ毎のアクセスログのURLからユーザの行動を把握するためのユーザ行動可視化情報付与方法であって、
    前記アクセスログに付加するための、ドメイン名に対応するドメイン関連情報を対応付けたドメインデータと、ホスト名とホスト関連情報を対応付けたホストデータとを格納した付加情報記憶手段と、URL分割手段と、付与情報決定手段と、を有する装置において、
    前記URL分割手段が、入力されたアクセスログのURLを、スキーム、ドメイン名、ホスト名、パスに分割し、該パスにディレクトリ部分の有無を検査するURL分割ステップと、
    前記付与情報決定手段が、スキーム、ドメイン名、ホスト名の順に前記付加情報記憶手段のデータとのマッチングするマッチング規則に基づいて、前記URL分割手段で分割された前記スキーム、前記ドメイン名、前記ホスト名について該付加情報記憶手段を参照して、検索された付与情報をアクセスログと共に結果蓄積手段に出力する付与情報決定ステップと、
    を行うことを特徴とするユーザ行動可視化情報付与方法。
  6. コンピュータを、
    請求項1乃至4のいずれか1項に記載のユーザ行動可視化情報付与装置の各手段として機能させるためのユーザ行動可視化情報付与プログラム。
  7. Web上の行動を記録したユーザ毎のアクセスログのURLからユーザの行動を把握し、分析するためのアクセスログ分析装置であって、
    前記アクセスログに付加するための、ドメイン名に対応するドメイン関連情報を対応付けたドメインデータと、ホスト名とホスト関連情報を対応付けたホストデータとを格納した付加情報記憶手段と、
    入力されたアクセスログのURLを、スキーム、ドメイン名、ホスト名、パスに分割し、該パスにディレクトリ部分の有無を検査するURL分割手段と、
    スキーム、ドメイン名、ホスト名の順に前記付加情報記憶手段のデータとのマッチングするマッチング規則に基づいて、前記URL分割手段で分割された前記スキーム、前記ドメイン名、前記ホスト名について該付加情報記憶手段を参照して、検索された付与情報をアクセスログと共に結果蓄積手段に出力する付与情報決定手段と、
    前記結果蓄積手段から前記アクセスログと前記付与情報を読み込み、該アクセスログのURLに関連する情報、または、該URLに対応する規則、または、該URLに対応する辞書が予め格納されている関連情報記憶手段を参照し、該URLに対応する関連情報を取得して展開付与情報記憶手段に格納する付与情報展開手段と、
    前記展開付与情報記憶手段から前記付与情報、前記関連情報を取得して、任意の集計処理を行い、集計結果と前記アクセスログから取得したユーザ情報を集約結果記憶手段に格納する付与情報集約手段と、
    を有することを特徴とするアクセスログ分析装置。
JP2012272879A 2012-12-13 2012-12-13 ユーザ行動可視化情報付与装置及び方法及びプログラム及びアクセスログ分析装置 Expired - Fee Related JP5890301B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012272879A JP5890301B2 (ja) 2012-12-13 2012-12-13 ユーザ行動可視化情報付与装置及び方法及びプログラム及びアクセスログ分析装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012272879A JP5890301B2 (ja) 2012-12-13 2012-12-13 ユーザ行動可視化情報付与装置及び方法及びプログラム及びアクセスログ分析装置

Publications (2)

Publication Number Publication Date
JP2014119838A true JP2014119838A (ja) 2014-06-30
JP5890301B2 JP5890301B2 (ja) 2016-03-22

Family

ID=51174647

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012272879A Expired - Fee Related JP5890301B2 (ja) 2012-12-13 2012-12-13 ユーザ行動可視化情報付与装置及び方法及びプログラム及びアクセスログ分析装置

Country Status (1)

Country Link
JP (1) JP5890301B2 (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004341942A (ja) * 2003-05-16 2004-12-02 Nippon Telegr & Teleph Corp <Ntt> コンテンツ分類方法、コンテンツ分類装置、コンテンツ分類用プログラムおよびコンテンツ分類用プログラムを記憶した記憶媒体
JP2010117893A (ja) * 2008-11-13 2010-05-27 Nippon Telegr & Teleph Corp <Ntt> 大規模webサイトの評価装置、大規模webサイトの評価方法および大規模webサイトの評価プログラム
JP2010123000A (ja) * 2008-11-20 2010-06-03 Nippon Telegr & Teleph Corp <Ntt> Webページグループ抽出方法及び装置及びプログラム
JP2012094071A (ja) * 2010-10-28 2012-05-17 Nippon Telegr & Teleph Corp <Ntt> フィルタリング方法、フィルタリングシステム及びフィルタリングプログラム
JP2012168582A (ja) * 2011-02-09 2012-09-06 Ntt Docomo Inc 潜在クラス分析装置、潜在クラス分析方法及びプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004341942A (ja) * 2003-05-16 2004-12-02 Nippon Telegr & Teleph Corp <Ntt> コンテンツ分類方法、コンテンツ分類装置、コンテンツ分類用プログラムおよびコンテンツ分類用プログラムを記憶した記憶媒体
JP2010117893A (ja) * 2008-11-13 2010-05-27 Nippon Telegr & Teleph Corp <Ntt> 大規模webサイトの評価装置、大規模webサイトの評価方法および大規模webサイトの評価プログラム
JP2010123000A (ja) * 2008-11-20 2010-06-03 Nippon Telegr & Teleph Corp <Ntt> Webページグループ抽出方法及び装置及びプログラム
JP2012094071A (ja) * 2010-10-28 2012-05-17 Nippon Telegr & Teleph Corp <Ntt> フィルタリング方法、フィルタリングシステム及びフィルタリングプログラム
JP2012168582A (ja) * 2011-02-09 2012-09-06 Ntt Docomo Inc 潜在クラス分析装置、潜在クラス分析方法及びプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
目木 信太郎: "「ユーザの閲覧履歴によるWeb検索のパーソナライズ化」", 第4回データ工学と情報マネジメントに関するフォーラム論文集 (第10回日本データベース学会年次大会), JPN6015050169, 13 July 2012 (2012-07-13), JP, ISSN: 0003216711 *

Also Published As

Publication number Publication date
JP5890301B2 (ja) 2016-03-22

Similar Documents

Publication Publication Date Title
US9436747B1 (en) Query generation using structural similarity between documents
CN102693271B (zh) 一种网络信息推荐方法及系统
CN108304410B (zh) 一种异常访问页面的检测方法、装置及数据分析方法
US20090089278A1 (en) Techniques for keyword extraction from urls using statistical analysis
WO2017071179A1 (zh) 基于流量分析识别用户行为对象的方法和装置
CN110969022B (zh) 语义确定方法及相关设备
US20130198240A1 (en) Social Network Analysis
CN108900554B (zh) Http协议资产检测方法、系统、设备及计算机介质
CN104765882B (zh) 一种基于网页特征字符串的互联网网站统计方法
US20110270691A1 (en) Method and system for providing url possible new advertising
CN104252447A (zh) 文件行为分析方法及装置
CN105808605B (zh) 一种搜索日志合并方法和系统
JP5492047B2 (ja) 購買行動分析装置、購買行動分析方法、購買行動分析プログラム、購買行動分析システム及び制御方法
CN108287831B (zh) 一种url分类方法和系统、数据处理方法和系统
CN112632419A (zh) 域名预解析配置方法、装置、计算机设备及存储介质
TW201500941A (zh) 社群資料篩選系統、方法及其非揮發性電腦可讀取紀錄媒體
JP5890301B2 (ja) ユーザ行動可視化情報付与装置及び方法及びプログラム及びアクセスログ分析装置
CN109948015B (zh) 一种元搜索列表结果抽取方法及系统
WO2015016133A1 (ja) 情報管理装置及び情報管理方法
CN105677827B (zh) 一种表单的获取方法及装置
CN110825976B (zh) 网站页面的检测方法、装置、电子设备及介质
CN102521288A (zh) 一种互联网Web服务信息获取方法
JP2011086156A (ja) 漏洩情報追跡システムおよび漏洩情報追跡プログラム
WO2017206604A1 (zh) 一种数据推荐的处理交互方法、装置及系统
CN109727048B (zh) 数据处理方法及装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150213

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20151130

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151215

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160127

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160216

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160218

R150 Certificate of patent or registration of utility model

Ref document number: 5890301

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees