JP2010128981A - 操作シーケンス抽出方法及び装置及びプログラム - Google Patents
操作シーケンス抽出方法及び装置及びプログラム Download PDFInfo
- Publication number
- JP2010128981A JP2010128981A JP2008305545A JP2008305545A JP2010128981A JP 2010128981 A JP2010128981 A JP 2010128981A JP 2008305545 A JP2008305545 A JP 2008305545A JP 2008305545 A JP2008305545 A JP 2008305545A JP 2010128981 A JP2010128981 A JP 2010128981A
- Authority
- JP
- Japan
- Prior art keywords
- search
- browsing
- information
- query
- browsing information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】本発明は、操作ログから検索行動とその結果得られる検索結果ページと、その検索結果から実際に閲覧したページをまとめる。1つの検索結果ページに着目し、閲覧したページに存在する語句の割合(全ページに対する存在ページの割合)を要素(成分)とする特徴ベクトルで表現する。特徴ベクトルの類似度(内積)により類似したものをまとめ(どのような検索語句で検索したかをグループ化)、これを操作シーケンスとして抽出する。
【選択図】図1
Description
検索閲覧行動抽出手段が、操作記録データベースの操作ログから検索行動とその結果得られる検索結果ページのリンクを辿って閲覧したページを対応付け、該操作ログから検索結果ページとそこからリンクを辿って閲覧した閲覧ページとの組からなる検索閲覧情報を抽出し、検索閲覧情報記憶手段に格納する検索閲覧行動抽出ステップ(ステップ1)と、
検索条件解析手段が、検索閲覧情報記憶手段から検索閲覧情報を取得して、閲覧ページ含まれる情報に共有して含まれる語句を、ユーザが情報の絞込み条件として意図していたが検索クエリに含めなかった語句を潜在クエリとして抽出し、該検索閲覧情報記憶手段に格納する潜在クエリ抽出ステップ(ステップ2)と、
行動関係性判別手段が、検索閲覧情報記憶手段の検索閲覧情報について、それぞれが持つ検索クエリと潜在クエリとを比較し、該検索閲覧情報におけるユーザの検索意図の類似度合を算出することにより、検索閲覧情報間の関連性を抽出し、関連度を該検索閲覧情報記憶手段に格納する関連性抽出ステップ(ステップ3)と、
操作シーケンス抽出手段が、検索閲覧情報記憶手段の関連度を参照し、関連度の高い検索閲覧情報を類似の行動としてまとめることにより、該検索閲覧情報記憶手段の検索閲覧情報集合から操作シーケンスを抽出する操作シーケンス抽出ステップ(ステップ4)と、を行う。
検索閲覧情報記憶手段の検索閲覧情報に含まれる閲覧ページに含まれる各語句に対して、該語句を含む閲覧ページの数xを、該検索閲覧情報記憶手段の閲覧ページの件数Nで割った値であるx/Nを、該語句の潜在クエリスコアとし、一定以上の潜在クエリスコアを有する語句を検索閲覧行動の潜在クエリとして抽出する。
2つの検索閲覧情報の組に含まれるそれぞれの検索閲覧情報について、当該検索閲覧行動情報が持つ潜在クエリ情報に含まれる語句と潜在クエリスコアからなる語句ベクトルに、当該検索閲覧情報に含まれる検索クエリを表す単語をスコア1として加えた語句ベクトルを抽出し、得られた2つの語句ベクトルのコサイン類似度を算出することにより、当該検索閲覧情報間の関連スコアを抽出する。
操作記録データベース160の操作ログから検索行動とその結果得られる検索結果ページのリンクを辿って閲覧したページを対応付け、該操作ログから検索結果ページとそこからリンクを辿って閲覧した閲覧ページとの組からなる検索閲覧情報を抽出し、検索閲覧情報記憶手段130に格納する検索閲覧行動抽出手段120と、
検索閲覧情報記憶手段130から検索閲覧情報を取得して、閲覧ページ含まれる情報に共有して含まれる語句を、ユーザが情報の絞込み条件として意図していたが検索クエリに含めなかった語句を潜在クエリとして抽出し、該検索閲覧情報記憶手段130に格納する検索条件解析手段140と、
検索閲覧情報記憶手段130の検索閲覧情報の組について、それぞれが持つ検索クエリと潜在クエリとを比較し、検索閲覧情報におけるユーザの検索意図の類似度合を算出することにより、検索閲覧情報間の関連性を抽出し、関連度を該検索閲覧情報記憶手段130に格納する行動関係性判別手段150と、
検索閲覧情報記憶手段130の関連度を参照し、関連度の高い検索閲覧情報を類似の行動としてまとめることにより、該検索閲覧情報記憶手段130の検索閲覧情報集合から操作シーケンスを抽出する操作シーケンス抽出手段160と、を有する。
検索閲覧情報記憶手段130の検索閲覧情報に含まれる閲覧ページに含まれる各語句に対して、該語句を含む閲覧ページの数xを、該検索閲覧情報記憶手段130の閲覧ページの件数Nで割った値であるx/Nを、該語句の潜在クエリスコアとし、一定以上の潜在クエリスコアを有する語句を検索閲覧行動の潜在クエリとして抽出する手段を含む。
2つの検索閲覧情報の組に含まれるそれぞれの検索閲覧情報について、当該検索閲覧行動情報が持つ潜在クエリ情報に含まれる語句と潜在クエリスコアからなる語句ベクトルに、当該検索閲覧情報に含まれる検索クエリを表す単語をスコア1として加えた語句ベクトルを抽出し、得られた2つの語句ベクトルのコサイン類似度を算出することにより、当該検索閲覧情報間の関連スコアを抽出する手段を含む。
「A社」「の」「最新」「携帯電話」「を」「セール」「販売」「中」
というように分割される。形態素解析を行う際に、処理の簡便化のために名詞のみの単語集合に変換し、
「A社」「最新」「携帯電話」「セール」「販売」
といった単語のみに絞って分割を行ってもよい。
また、構築されたプログラムをハードディスクや、フレキシブルディスク・CD−ROM等の可搬記憶媒体に格納し、コンピュータにインストールする、または、配布することが可能である。
110 解析対象入力装置
120 検索閲覧行動抽出手段、検索閲覧情報抽出部
130 検索閲覧情報記憶手段、検索閲覧情報バッファ
140 検索条件解析手段、検索条件解析部
150 行動関係性判別手段、行動関係性判別部
160 操作シーケンス抽出手段、操作シーケンス抽出部
161 関連スコアバッファ
170 操作シーケンス情報出力装置
180 操作記録データベース
Claims (8)
- ブラウザ閲覧履歴から操作シーケンスを抽出する操作シーケンス抽出方法において、
検索閲覧行動抽出手段が、操作記録データベースの操作ログから検索行動とその結果得られる検索結果ページのリンクを辿って閲覧したページを対応付け、該操作ログから検索結果ページとそこからリンクを辿って閲覧した閲覧ページとの組からなる検索閲覧情報を抽出し、検索閲覧情報記憶手段に格納する検索閲覧行動抽出ステップと、
検索条件解析手段が、前記検索閲覧情報記憶手段から前記検索閲覧情報を取得して、閲覧ページ含まれる情報に共有して含まれる語句を、ユーザが情報の絞込み条件として意図していたが検索クエリに含めなかった語句を潜在クエリとして抽出し、該検索閲覧情報記憶手段に格納する潜在クエリ抽出ステップと、
行動関係性判別手段が、前記検索閲覧情報記憶手段の検索閲覧情報の組について、それぞれが持つ検索クエリと潜在クエリとを比較し、検索閲覧情報におけるユーザの検索意図の類似度合を算出することにより、検索閲覧情報間の関連性を抽出し、関連度を該検索閲覧情報記憶手段に格納する関連性抽出ステップと、
操作シーケンス抽出手段が、前記検索閲覧情報記憶手段の前記関連度を参照し、関連度の高い検索閲覧情報を類似の行動としてまとめることにより、該検索閲覧情報記憶手段の検索閲覧情報集合から操作シーケンスを抽出する操作シーケンス抽出ステップと、
を行うことを特徴とする操作シーケンス抽出方法。 - 前記潜在クエリ抽出ステップにおいて、
前記検索閲覧情報記憶手段の前記検索閲覧情報に含まれる閲覧ページに含まれる各語句に対して、該語句を含む閲覧ページの数xを、該検索閲覧情報記憶手段の閲覧ページの件数Nで割った値であるx/Nを、該語句の潜在クエリスコアとし、一定以上の潜在クエリスコアを有する語句を検索閲覧行動の潜在クエリとして抽出する
請求項1記載の操作シーケンス抽出方法。 - 前記関連性抽出ステップにおいて、
2つの検索閲覧情報の組に含まれるそれぞれの検索閲覧情報について、当該検索閲覧行動情報が持つ潜在クエリ情報に含まれる語句と潜在クエリスコアからなる語句ベクトルに、当該検索閲覧情報に含まれる検索クエリを表す単語をスコア1として加えた語句ベクトルを抽出し、得られた2つの語句ベクトルのコサイン類似度を算出することにより、当該検索閲覧情報間の関連スコアを抽出する
請求項1記載の操作シーケンス抽出方法。 - ブラウザ閲覧履歴から操作シーケンスを抽出する操作シーケンス抽出装置であって、
操作記録データベースの操作ログから検索行動とその結果得られる検索結果ページのリンクを辿って閲覧したページを対応付け、該操作ログから検索結果ページとそこからリンクを辿って閲覧した閲覧ページとの組からなる検索閲覧情報を抽出し、検索閲覧情報記憶手段に格納する検索閲覧行動抽出手段と、
前記検索閲覧情報記憶手段から前記検索閲覧情報を取得して、閲覧ページ含まれる情報に共有して含まれる語句を、ユーザが情報の絞込み条件として意図していたが検索クエリに含めなかった語句を潜在クエリとして抽出し、該検索閲覧情報記憶手段に格納する検索条件解析手段と、
前記検索閲覧情報記憶手段の検索閲覧情報の組について、それぞれが持つ検索クエリと潜在クエリとを比較し、検索閲覧情報におけるユーザの検索意図の類似度合を算出することにより、検索閲覧情報間の関連性を抽出し、関連度を該検索閲覧情報記憶手段に格納する行動関係性判別手段と、
前記検索閲覧情報記憶手段の前記関連度を参照し、関連度の高い検索閲覧情報を類似の行動としてまとめることにより、該検索閲覧情報記憶手段の検索閲覧情報集合から操作シーケンスを抽出する操作シーケンス抽出手段と、
を有することを特徴とする操作シーケンス抽出装置。 - 前記検索条件解析手段は、
前記検索閲覧情報記憶手段の前記検索閲覧情報に含まれる閲覧ページに含まれる各語句に対して、該語句を含む閲覧ページの数xを、該検索閲覧情報記憶手段の閲覧ページの件数Nで割った値であるx/Nを、該語句の潜在クエリスコアとし、一定以上の潜在クエリスコアを有する語句を検索閲覧行動の潜在クエリとして抽出する手段を含む
請求項4記載の操作シーケンス抽出装置。 - 前記行動関係性判別手段は、
2つの検索閲覧情報の組に含まれるそれぞれの検索閲覧情報について、当該検索閲覧行動情報が持つ潜在クエリ情報に含まれる語句と潜在クエリスコアからなる語句ベクトルに、当該検索閲覧情報に含まれる検索クエリを表す単語をスコア1として加えた語句ベクトルを抽出し、得られた2つの語句ベクトルのコサイン類似度を算出することにより、当該検索閲覧情報間の関連スコアを抽出する手段を含む
請求項4記載の操作シーケンス抽出装置。 - 請求項4乃至6のいずれか1項に記載の操作シーケンス抽出装置を構成する各手段としてコンピュータを機能させるための操作シーケンス抽出プログラム。
- 請求項7記載の操作シーケンス抽出プログラムを格納したことを特徴とするコンピュータ読取可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008305545A JP5213668B2 (ja) | 2008-11-28 | 2008-11-28 | 操作シーケンス抽出方法及び装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008305545A JP5213668B2 (ja) | 2008-11-28 | 2008-11-28 | 操作シーケンス抽出方法及び装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010128981A true JP2010128981A (ja) | 2010-06-10 |
JP5213668B2 JP5213668B2 (ja) | 2013-06-19 |
Family
ID=42329302
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008305545A Active JP5213668B2 (ja) | 2008-11-28 | 2008-11-28 | 操作シーケンス抽出方法及び装置及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5213668B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012093803A (ja) * | 2010-10-22 | 2012-05-17 | Nippon Telegr & Teleph Corp <Ntt> | 閲覧ログ解析装置及び閲覧ログ解析プログラム |
JP2014059865A (ja) * | 2012-09-14 | 2014-04-03 | Hon Hai Precision Industry Co Ltd | 検索システム及びその方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006127321A (ja) * | 2004-10-29 | 2006-05-18 | Solid Technology Kk | 端末属性後付装置および端末属性後付方法 |
JP2007264718A (ja) * | 2006-03-27 | 2007-10-11 | Yafoo Japan Corp | ユーザ興味分析装置、方法、プログラム |
JP2007280011A (ja) * | 2006-04-06 | 2007-10-25 | Nippon Telegr & Teleph Corp <Ntt> | Webページ閲覧履歴の提示方法および装置 |
-
2008
- 2008-11-28 JP JP2008305545A patent/JP5213668B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006127321A (ja) * | 2004-10-29 | 2006-05-18 | Solid Technology Kk | 端末属性後付装置および端末属性後付方法 |
JP2007264718A (ja) * | 2006-03-27 | 2007-10-11 | Yafoo Japan Corp | ユーザ興味分析装置、方法、プログラム |
JP2007280011A (ja) * | 2006-04-06 | 2007-10-25 | Nippon Telegr & Teleph Corp <Ntt> | Webページ閲覧履歴の提示方法および装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012093803A (ja) * | 2010-10-22 | 2012-05-17 | Nippon Telegr & Teleph Corp <Ntt> | 閲覧ログ解析装置及び閲覧ログ解析プログラム |
JP2014059865A (ja) * | 2012-09-14 | 2014-04-03 | Hon Hai Precision Industry Co Ltd | 検索システム及びその方法 |
Also Published As
Publication number | Publication date |
---|---|
JP5213668B2 (ja) | 2013-06-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108280114B (zh) | 一种基于深度学习的用户文献阅读兴趣分析方法 | |
TWI524193B (zh) | 用於搜尋結果之語義目錄的電腦可讀取媒體及電腦實現方法 | |
US8655648B2 (en) | Identifying topically-related phrases in a browsing sequence | |
US20170154116A1 (en) | Method and system for recommending contents based on social network | |
US9256649B2 (en) | Method and system of filtering and recommending documents | |
KR101252670B1 (ko) | 연관 콘텐츠 제공 장치, 방법 및 컴퓨터 판독 가능한 기록 매체 | |
CN110309251B (zh) | 文本数据的处理方法、装置和计算机可读存储介质 | |
US8290925B1 (en) | Locating product references in content pages | |
JP4896132B2 (ja) | 情報価値を反映した情報検索方法及びその装置 | |
JP4569380B2 (ja) | ベクトル生成方法及び装置及びカテゴリ分類方法及び装置及びプログラム及びプログラムを格納したコンピュータ読み取り可能な記録媒体 | |
JP5367632B2 (ja) | 知識量推定装置及びプログラム | |
KR20100132376A (ko) | 스니펫 제공 장치 및 방법 | |
JP2012008900A (ja) | 関連語句抽出方法、関連語句抽出装置及び関連語句抽出プログラム | |
JP4912384B2 (ja) | 文書検索装置、文書検索方法、および文書検索プログラム | |
JP5213668B2 (ja) | 操作シーケンス抽出方法及び装置及びプログラム | |
CN109933691B (zh) | 用于内容检索的方法、装置、设备和存储介质 | |
JP4759600B2 (ja) | 文章検索装置、文章検索方法、文章検索プログラムおよびその記録媒体 | |
JPWO2013157603A1 (ja) | 検索クエリ分析装置、検索クエリ分析方法、及びプログラム | |
JP5180894B2 (ja) | 属性表現獲得方法及び装置及びプログラム | |
Moumtzidou et al. | Discovery of environmental nodes in the web | |
JP2012145974A (ja) | バースト情報検索装置、バースト情報検索方法、及びバースト情報検索プログラム | |
JP2010286888A (ja) | 情報収集システムおよび情報収集方法ならびにそのプログラム | |
JP2010272006A (ja) | 関係抽出装置、関係抽出方法、及びプログラム | |
JP5292336B2 (ja) | 検索システムユーザの分野ごとにおける知識量推定装置、知識量推定方法および知識量推定プログラム | |
JP4938515B2 (ja) | 単語間相関度計算装置および方法、プログラム並びに記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110104 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121115 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121127 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130128 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130219 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130226 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5213668 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160308 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |