JP5485856B2 - 閲覧ログ解析装置及び閲覧ログ解析プログラム - Google Patents
閲覧ログ解析装置及び閲覧ログ解析プログラム Download PDFInfo
- Publication number
- JP5485856B2 JP5485856B2 JP2010237989A JP2010237989A JP5485856B2 JP 5485856 B2 JP5485856 B2 JP 5485856B2 JP 2010237989 A JP2010237989 A JP 2010237989A JP 2010237989 A JP2010237989 A JP 2010237989A JP 5485856 B2 JP5485856 B2 JP 5485856B2
- Authority
- JP
- Japan
- Prior art keywords
- page
- query
- relationship
- browsing
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
図2に示された本発明の実施形態に係る閲覧ログ解析装置1は、先ず、リンク関係解析部2が、収集されたウェブ閲覧行動のログ情報に基づきウェブページ間のリンク関係を抽出し、この抽出した複数のリンク関係を有するウェブページの集合を関連するページ集合として抽出する。次いで、クエリ‐クエリ関係解析部3が、前記抽出された複数のページ集合中の検索エンジンによる検索結果ページを含むページ集合について、当該ページ集合中の当該検索結果ページに含まれる検索クエリを抽出し、この検索クエリを含んだ検索結果ページを有するページ集合間の関連性の判定を行い、一定の関連性があると判定されたページ集合の組を同一のページ集合として集約する。また、クエリ‐ページ関係解析部4が、前記検索クエリを含んだ検索結果ページを含むページ集合とその直前の遷移元のページ集合との関連性の判定を行い、一定の関連性があると判定されたページ集合の組を同一のページ集合として集約する。そして、閲覧ページ集合作成部5はクエリ‐クエリ関係解析部3及びクエリ‐ページ関係解析部4で集約されたページ集合に基づき検索クエリとページ集合との関係を示した閲覧ページ集合を作成する。
閲覧ログ解析装置1は、リンク関係解析部2、クエリ‐クエリ関係解析部3、クエリ‐ページ関係解析部4、閲覧ページ集合作成部5を備える。さらには、処理途中のデータを保持する閲覧情報バッファ6及び一時バッファ7を備える。
(リンク関係の解析)
図4を参照しながらリンク関係解析部2による具体的なリンク関係解析手順S101〜S103について説明する。
図6を参照しながらクエリ‐クエリ関係解析部3による具体的な関係解析手順S201〜S204について説明する。
図8を参照しながらクエリ‐ページ関係解析部4による具体的な関係解析手順S301〜S304について説明する。
閲覧ページ集合作成部5は、クエリ‐クエリ関係解析部3による処理(S201〜S204)とクエリ‐ページ関係解析部による処理(S301〜S304)が終了すると、検索クエリとページ集合との関係を示した閲覧ページ集合を作成する。
以上のように閲覧ログ解析装置1によれば検索行動と他のウェブページの関係性を評価することにより直接的なリンク関係の記録されていない検索ページを含めた閲覧行動の集合を抽出できる。したがって、例えば、商品を購入するに当たって様々な検索クエリを投入しながら購入する商品を絞り込んでいった様な閲覧行動を一纏まりの閲覧行動として取得することが可能となる。
本発明は上記の実施形態の閲覧ログ解析装置1に係る各機能部2〜7の一部もしくは全部の機能をコンピュータのプログラムで構成し、そのプログラムをコンピュータによって実行して本発明を実現することができる。また、コンピュータで前記機能部を実現するためのプログラムをそのコンピュータが読み取り可能な記録媒体、例えば、FD(Floppy(登録商標) Disk)や、MO(Magneto−Optical disk)、ROM(Read Only Memory)、メモリカード、CD(Compact Disk)−ROM、DVD(Digital Versatile Disk)−ROM、CD−R、CD−RW、HDD、リムーバブルディスクなどに記録して、保存したり、配布したりすることが可能である。また、上記のプログラムをインターネットや電子メールなど、ネットワークを通して提供することも可能である。
2…リンク関係解析部(リンク関係解析手段)
3…クエリ‐クエリ関係解析部(クエリ‐クエリ関係解析手段)
4…クエリ‐ページ関係解析部(クエリ‐ページ関係解析手段)
5…閲覧ページ集合作成部(閲覧ページ集合作成手段)
Claims (6)
- 検索クエリを含むウェブページの集合をウェブページの閲覧行動のログに基づき一定の関係性を有するページ集合に分割するための閲覧ログ解析装置であって、
収集されたウェブ閲覧行動のログ情報に基づきウェブページ間のリンク関係を抽出し、この抽出した複数のリンク関係を有するウェブページの集合を関連するページ集合として抽出するリンク関係解析手段と、
前記抽出された複数のページ集合中の検索エンジンによる検索結果ページを含むページ集合について、当該検索結果ページに含まれる検索クエリを抽出しこの検索クエリを含んだ検索結果ページを有するページ集合間の関連性の判定を行い一定の関連性があると判定されたページ集合の組を同一のページ集合として集約するクエリ関係解析手段と
を備え、
前記クエリ関係解析手段は、前記検索クエリを含んだ検索結果ページから始まっているページ集合を特定し、この特定したページ集合の直前に閲覧されたページ集合の最後の閲覧ページにおいて当該検索クエリが含まれている場合に、当該特定したページ集合と前記直前に閲覧されたページ集合との内容的な関係性を判定し、一定の関連性があると判定されたページ集合の組を同一のページ集合として集約するクエリ‐ページ関係解析手段を備え、
前記クエリ‐ページ関係解析手段は、前記特定したページ集合と前記直前に閲覧されたページ集合との内容的な関係性を判定するにあたり、当該ページ集合の閲覧ページ情報に含まれる語句の出現頻度と当該閲覧ページ情報をユーザが閲覧した時間とに基づき、前記特定したページ集合と前記直前に閲覧されたページ集合の特徴量を算出すること
を特徴とする閲覧ログ解析装置。 - 前記クエリ関係解析手段は、前記検索クエリを含んだ検索結果ページを有するページ集合についてその特徴量を抽出し、この特徴量の類似度に基づきページ集合間の関係性を判定し、一定の関連性があると判定されたページ集合の組を同一のページ集合として集約するクエリ‐クエリ関係解析手段を備え、
前記クエリ‐クエリ関係解析手段は、前記検索結果ページの内容情報に含まれる語句の出現頻度と当該ページの内容情報をユーザが閲覧した時間とに基づき前記特徴量を算出すること
を特徴とする請求項1に記載の閲覧ログ解析装置。 - 前記クエリ‐ページ関係解析手段は、
前記特定したページ集合と前記直前に閲覧されたページ集合との内容的な関係性を判定する際に下記の(1)式によって両者のページ集合の特徴量を算出し、
この算出された両者のページ集合の特徴量を表すベクトルv1、v2を用いた下記の(2)式による演算によって前記両者のページ集合の類似度を算出し、
この算出された類似度が予め定められた閾値よりも低ければ直前の閲覧ページから新たな興味を発見して検索しているとみなし、閾値よりも高ければ直前の閲覧ページからより興味にあった検索クエリを発見して検索しているとみなして、両者のページ集合の関係性を判定すること
を特徴とする請求項1から3のいずれか1項に記載の閲覧ログ解析装置。 - 前記クエリ‐クエリ関係解析手段によって集約されたページ集合と前記クエリ‐ページ関係解析手段によって集約されたページ集合とに基づき、検索クエリとページ集合との関係を示した閲覧ページ集合を作成する閲覧ページ集合作成手段
をさらに備えたこと
を特徴とする請求項2から4のいずれか1項に記載の閲覧ログ解析装置。 - 請求項1から5のいずれか1項に記載の閲覧ログ解析装置を構成する各手段としてコンピュータを機能させることを特徴とする閲覧ログ解析プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010237989A JP5485856B2 (ja) | 2010-10-22 | 2010-10-22 | 閲覧ログ解析装置及び閲覧ログ解析プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010237989A JP5485856B2 (ja) | 2010-10-22 | 2010-10-22 | 閲覧ログ解析装置及び閲覧ログ解析プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012093803A JP2012093803A (ja) | 2012-05-17 |
JP5485856B2 true JP5485856B2 (ja) | 2014-05-07 |
Family
ID=46387096
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010237989A Expired - Fee Related JP5485856B2 (ja) | 2010-10-22 | 2010-10-22 | 閲覧ログ解析装置及び閲覧ログ解析プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5485856B2 (ja) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4906687B2 (ja) * | 2007-11-19 | 2012-03-28 | 日本電信電話株式会社 | Web閲覧行動特徴抽出装置及びプログラム |
JP5112112B2 (ja) * | 2008-03-04 | 2013-01-09 | 日本電信電話株式会社 | Web閲覧履歴表示装置及び方法及びプログラム及びコンピュータ読取可能な記録媒体 |
JP5079642B2 (ja) * | 2008-09-16 | 2012-11-21 | 日本電信電話株式会社 | 履歴処理装置、履歴処理方法および履歴処理プログラム |
JP5213668B2 (ja) * | 2008-11-28 | 2013-06-19 | 日本電信電話株式会社 | 操作シーケンス抽出方法及び装置及びプログラム |
-
2010
- 2010-10-22 JP JP2010237989A patent/JP5485856B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2012093803A (ja) | 2012-05-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102982053B (zh) | 检测复制和近似复制的文件 | |
KR100544514B1 (ko) | 검색 쿼리 연관성 판단 방법 및 시스템 | |
CN108280114B (zh) | 一种基于深度学习的用户文献阅读兴趣分析方法 | |
CN105518661B (zh) | 经由挖掘的超链接文本的片段来浏览图像 | |
JPWO2007108529A1 (ja) | 情報抽出システム、情報抽出方法、情報抽出プログラムおよび情報サービスシステム | |
US9552415B2 (en) | Category classification processing device and method | |
TWI571756B (zh) | 用以分析瀏覽記錄及其文件之方法及其系統 | |
JP2011154467A (ja) | 検索結果順位付け方法および検索結果順位付けシステム | |
JP4569380B2 (ja) | ベクトル生成方法及び装置及びカテゴリ分類方法及び装置及びプログラム及びプログラムを格納したコンピュータ読み取り可能な記録媒体 | |
WO2007011129A1 (en) | Information search method and information search apparatus on which information value is reflected | |
KR101212457B1 (ko) | 웹페이지 접속시간 및 방문도에 기반한 웹검색 방법 및 웹검색 시스템 | |
JP4970919B2 (ja) | 閲覧対象情報の評価システム、方法、およびプログラム | |
JP4750628B2 (ja) | 情報ランキング方法及び装置及びプログラム及びコンピュータ読み取り可能な記録媒体 | |
JP4912384B2 (ja) | 文書検索装置、文書検索方法、および文書検索プログラム | |
JP5138621B2 (ja) | 情報処理装置及び不満解決商品発見方法及びプログラム | |
JP2006004098A (ja) | 評価情報生成装置、評価情報生成方法、及びプログラム | |
JP5321258B2 (ja) | 情報収集システムおよび情報収集方法ならびにそのプログラム | |
JP5450135B2 (ja) | 関連度辞書を用いた検索モデリングシステムおよび方法 | |
JP5180894B2 (ja) | 属性表現獲得方法及び装置及びプログラム | |
JP5416552B2 (ja) | ランキング関数生成装置、ランキング関数生成方法、ランキング関数生成プログラム | |
JP5485856B2 (ja) | 閲覧ログ解析装置及び閲覧ログ解析プログラム | |
JP2006286026A (ja) | 意見収集分析装置及びそれに用いる意見収集分析方法並びにそのプログラム | |
CN112989020B (zh) | 信息处理方法、装置和计算机可读存储介质 | |
JP4134975B2 (ja) | 話題文書提示方法及び装置及びプログラム | |
JP5551665B2 (ja) | 情報抽出装置、情報抽出方法、情報抽出プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20121225 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130919 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131015 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131209 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140218 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140220 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5485856 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |