JP5213668B2 - 操作シーケンス抽出方法及び装置及びプログラム - Google Patents
操作シーケンス抽出方法及び装置及びプログラム Download PDFInfo
- Publication number
- JP5213668B2 JP5213668B2 JP2008305545A JP2008305545A JP5213668B2 JP 5213668 B2 JP5213668 B2 JP 5213668B2 JP 2008305545 A JP2008305545 A JP 2008305545A JP 2008305545 A JP2008305545 A JP 2008305545A JP 5213668 B2 JP5213668 B2 JP 5213668B2
- Authority
- JP
- Japan
- Prior art keywords
- search
- browsing
- information
- browsing information
- score
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
検索閲覧行動抽出手段が、操作記録データベースの操作ログから検索行動とその結果得られる検索結果ページのリンクを辿って閲覧したページを対応付け、該操作ログから検索結果ページとそこからリンクを辿って閲覧した閲覧ページとの組からなる検索閲覧情報を抽出し、検索閲覧情報記憶手段に格納する検索閲覧行動抽出ステップ(ステップ1)と、
検索条件解析手段が、検索閲覧情報記憶手段の検索閲覧情報に含まれる閲覧ページに含まれる各語句に対して、該語句を含む閲覧ページの数xを、該検索閲覧情報記憶手段の閲覧ページの件数Nで割った値であるx/Nを、該語句の潜在クエリスコアとし、一定以上の潜在クエリスコアを有する語句を検索閲覧行動の潜在クエリ情報として抽出し、該検索閲覧情報記憶手段に格納する潜在クエリ抽出ステップ(ステップ2)と、
行動関係性判別手段が、検索閲覧情報記憶手段の検索閲覧情報の組について、当該検索閲覧情報が持つ潜在クエリ情報に基づいて、該検索閲覧情報間の関連スコアを算出し、関連スコアを該検索閲覧情報記憶手段に格納する関連性抽出ステップ(ステップ3)と、
操作シーケンス抽出手段が、検索閲覧情報記憶手段の関連スコアを参照し、関連スコアの高い検索閲覧情報を類似の行動としてまとめることにより、該検索閲覧情報記憶手段の検索閲覧情報集合から操作シーケンスを抽出する操作シーケンス抽出ステップ(ステップ4)と、
を行うことを特徴とする操作シーケンス抽出方法。
2つの検索閲覧情報の組に含まれるそれぞれの検索閲覧情報について、当該検索閲覧情報が持つ潜在クエリ情報に含まれる語句と潜在クエリスコアからなる語句ベクトルに、当該検索閲覧情報に含まれる検索クエリを表す単語をスコア1として加えた語句ベクトルを抽出し、得られた2つの語句ベクトルのコサイン類似度を算出することにより、当該検索閲覧情報間の関連スコアを抽出する。
操作記録データベース160の操作ログから検索行動とその結果得られる検索結果ページのリンクを辿って閲覧したページを対応付け、該操作ログから検索結果ページとそこからリンクを辿って閲覧した閲覧ページとの組からなる検索閲覧情報を抽出し、検索閲覧情報記憶手段130に格納する検索閲覧行動抽出手段120と、
検索閲覧情報記憶手段130の検索閲覧情報に含まれる閲覧ページに含まれる各語句に対して、該語句を含む閲覧ページの数xを、該検索閲覧情報記憶手段の閲覧ページの件数Nで割った値であるx/Nを、該語句の潜在クエリスコアとし、一定以上の潜在クエリスコアを有する語句を検索閲覧行動の潜在クエリ情報として抽出し、該検索閲覧情報記憶手段130に格納する検索条件解析手段140と、
検索閲覧情報記憶手段130の検索閲覧情報の組について、当該検索閲覧情報が持つ潜在クエリ情報に基づいて、該検索閲覧情報間の関連スコアを算出し、関連スコアを該検索閲覧情報記憶手段130に格納する行動関係性判別手段150と、
検索閲覧情報記憶手段130の関連スコアを参照し、関連スコアの高い検索閲覧情報を類似の行動としてまとめることにより、該検索閲覧情報記憶手段130の検索閲覧情報集合から操作シーケンスを抽出する操作シーケンス抽出手段160と、を有する。
2つの検索閲覧情報の組に含まれるそれぞれの検索閲覧情報について、当該検索閲覧情報が持つ潜在クエリ情報に含まれる語句と潜在クエリスコアからなる語句ベクトルに、当該検索閲覧情報に含まれる検索クエリを表す単語をスコア1として加えた語句ベクトルを抽出し、得られた2つの語句ベクトルのコサイン類似度を算出することにより、当該検索閲覧情報間の関連スコアを抽出する手段を含む。
「A社」「の」「最新」「携帯電話」「を」「セール」「販売」「中」
というように分割される。形態素解析を行う際に、処理の簡便化のために名詞のみの単語集合に変換し、
「A社」「最新」「携帯電話」「セール」「販売」
といった単語のみに絞って分割を行ってもよい。
また、構築されたプログラムをハードディスクや、フレキシブルディスク・CD−ROM等の可搬記憶媒体に格納し、コンピュータにインストールする、または、配布することが可能である。
110 解析対象入力装置
120 検索閲覧行動抽出手段、検索閲覧情報抽出部
130 検索閲覧情報記憶手段、検索閲覧情報バッファ
140 検索条件解析手段、検索条件解析部
150 行動関係性判別手段、行動関係性判別部
160 操作シーケンス抽出手段、操作シーケンス抽出部
161 関連スコアバッファ
170 操作シーケンス情報出力装置
180 操作記録データベース
Claims (6)
- ブラウザ閲覧履歴から操作シーケンスを抽出する操作シーケンス抽出方法において、
検索閲覧行動抽出手段が、操作記録データベースの操作ログから検索行動とその結果得られる検索結果ページのリンクを辿って閲覧したページを対応付け、該操作ログから検索結果ページとそこからリンクを辿って閲覧した閲覧ページとの組からなる検索閲覧情報を抽出し、検索閲覧情報記憶手段に格納する検索閲覧行動抽出ステップと、
検索条件解析手段が、前記検索閲覧情報記憶手段の前記検索閲覧情報に含まれる閲覧ページに含まれる各語句に対して、該語句を含む閲覧ページの数xを、該検索閲覧情報記憶手段の閲覧ページの件数Nで割った値であるx/Nを、該語句の潜在クエリスコアとし、一定以上の潜在クエリスコアを有する語句を検索閲覧行動の潜在クエリ情報として抽出し、該検索閲覧情報記憶手段に格納する潜在クエリ抽出ステップと、
行動関係性判別手段が、前記検索閲覧情報記憶手段の検索閲覧情報の組について、当該検索閲覧情報が持つ潜在クエリ情報に基づいて、該検索閲覧情報間の関連スコアを算出し、関連スコアを該検索閲覧情報記憶手段に格納する関連性抽出ステップと、
操作シーケンス抽出手段が、前記検索閲覧情報記憶手段の前記関連スコアを参照し、関連スコアの高い検索閲覧情報を類似の行動としてまとめることにより、該検索閲覧情報記憶手段の検索閲覧情報集合から操作シーケンスを抽出する操作シーケンス抽出ステップと、
を行うことを特徴とする操作シーケンス抽出方法。 - 前記関連性抽出ステップにおいて、
2つの検索閲覧情報の組に含まれるそれぞれの検索閲覧情報について、当該検索閲覧情報が持つ潜在クエリ情報に含まれる語句と潜在クエリスコアからなる語句ベクトルに、当該検索閲覧情報に含まれる検索クエリを表す単語をスコア1として加えた語句ベクトルを抽出し、得られた2つの語句ベクトルのコサイン類似度を算出することにより、当該検索閲覧情報間の関連スコアを抽出する
請求項1記載の操作シーケンス抽出方法。 - ブラウザ閲覧履歴から操作シーケンスを抽出する操作シーケンス抽出装置であって、
操作記録データベースの操作ログから検索行動とその結果得られる検索結果ページのリンクを辿って閲覧したページを対応付け、該操作ログから検索結果ページとそこからリンクを辿って閲覧した閲覧ページとの組からなる検索閲覧情報を抽出し、検索閲覧情報記憶手段に格納する検索閲覧行動抽出手段と、
前記検索閲覧情報記憶手段の前記検索閲覧情報に含まれる閲覧ページに含まれる各語句に対して、該語句を含む閲覧ページの数xを、該検索閲覧情報記憶手段の閲覧ページの件数Nで割った値であるx/Nを、該語句の潜在クエリスコアとし、一定以上の潜在クエリスコアを有する語句を検索閲覧行動の潜在クエリ情報として抽出し、該検索閲覧情報記憶手段に格納する検索条件解析手段と、
前記検索閲覧情報記憶手段の検索閲覧情報の組について、当該検索閲覧情報が持つ潜在クエリ情報に基づいて、該検索閲覧情報間の関連スコアを算出し、関連スコアを該検索閲覧情報記憶手段に格納する行動関係性判別手段と、
前記検索閲覧情報記憶手段の前記関連スコアを参照し、関連スコアの高い検索閲覧情報を類似の行動としてまとめることにより、該検索閲覧情報記憶手段の検索閲覧情報集合から操作シーケンスを抽出する操作シーケンス抽出手段と、
を有することを特徴とする操作シーケンス抽出装置。 - 前記行動関係性判別手段は、
2つの検索閲覧情報の組に含まれるそれぞれの検索閲覧情報について、当該検索閲覧情報が持つ潜在クエリ情報に含まれる語句と潜在クエリスコアからなる語句ベクトルに、当該検索閲覧情報に含まれる検索クエリを表す単語をスコア1として加えた語句ベクトルを抽出し、得られた2つの語句ベクトルのコサイン類似度を算出することにより、当該検索閲覧情報間の関連スコアを抽出する手段を含む
請求項3記載の操作シーケンス抽出装置。 - 請求項3または4に記載の操作シーケンス抽出装置を構成する各手段としてコンピュータを機能させるための操作シーケンス抽出プログラム。
- 請求項5記載の操作シーケンス抽出プログラムを格納したことを特徴とするコンピュータ読取可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008305545A JP5213668B2 (ja) | 2008-11-28 | 2008-11-28 | 操作シーケンス抽出方法及び装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008305545A JP5213668B2 (ja) | 2008-11-28 | 2008-11-28 | 操作シーケンス抽出方法及び装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010128981A JP2010128981A (ja) | 2010-06-10 |
JP5213668B2 true JP5213668B2 (ja) | 2013-06-19 |
Family
ID=42329302
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008305545A Active JP5213668B2 (ja) | 2008-11-28 | 2008-11-28 | 操作シーケンス抽出方法及び装置及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5213668B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5485856B2 (ja) * | 2010-10-22 | 2014-05-07 | 日本電信電話株式会社 | 閲覧ログ解析装置及び閲覧ログ解析プログラム |
TW201411379A (zh) * | 2012-09-14 | 2014-03-16 | Hon Hai Prec Ind Co Ltd | 搜索系統及方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006127321A (ja) * | 2004-10-29 | 2006-05-18 | Solid Technology Kk | 端末属性後付装置および端末属性後付方法 |
JP2007264718A (ja) * | 2006-03-27 | 2007-10-11 | Yafoo Japan Corp | ユーザ興味分析装置、方法、プログラム |
JP2007280011A (ja) * | 2006-04-06 | 2007-10-25 | Nippon Telegr & Teleph Corp <Ntt> | Webページ閲覧履歴の提示方法および装置 |
-
2008
- 2008-11-28 JP JP2008305545A patent/JP5213668B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2010128981A (ja) | 2010-06-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108280114B (zh) | 一种基于深度学习的用户文献阅读兴趣分析方法 | |
US8655648B2 (en) | Identifying topically-related phrases in a browsing sequence | |
JP4922692B2 (ja) | 検索クエリー作成装置 | |
CA2985257A1 (en) | System and method for ranking search results | |
US20130339373A1 (en) | Method and system of filtering and recommending documents | |
US20150302036A1 (en) | Method, system and computer program for information retrieval using content algebra | |
US8290925B1 (en) | Locating product references in content pages | |
JP5724009B2 (ja) | 代表者の信頼度を用いた検索結果順位化装置および方法 | |
JP4569380B2 (ja) | ベクトル生成方法及び装置及びカテゴリ分類方法及び装置及びプログラム及びプログラムを格納したコンピュータ読み取り可能な記録媒体 | |
JP4896132B2 (ja) | 情報価値を反映した情報検索方法及びその装置 | |
KR20120087058A (ko) | 연관 콘텐츠 제공 장치, 방법 및 컴퓨터 판독 가능한 기록 매체 | |
KR101011726B1 (ko) | 스니펫 제공 장치 및 방법 | |
CN113094519A (zh) | 一种基于文档进行检索的方法及装置 | |
JP5367632B2 (ja) | 知識量推定装置及びプログラム | |
CN103226601A (zh) | 一种图片搜索的方法和装置 | |
KR20230014035A (ko) | 사용자 검색 의도 분석을 통한 연관 문서 추천 방법 및 장치 | |
JP4759600B2 (ja) | 文章検索装置、文章検索方法、文章検索プログラムおよびその記録媒体 | |
JP4912384B2 (ja) | 文書検索装置、文書検索方法、および文書検索プログラム | |
JP5213668B2 (ja) | 操作シーケンス抽出方法及び装置及びプログラム | |
JP5321258B2 (ja) | 情報収集システムおよび情報収集方法ならびにそのプログラム | |
KR101614551B1 (ko) | 카테고리 매칭을 이용한 키워드 추출 시스템 및 방법 | |
JP5180894B2 (ja) | 属性表現獲得方法及び装置及びプログラム | |
JP5416552B2 (ja) | ランキング関数生成装置、ランキング関数生成方法、ランキング関数生成プログラム | |
JP5286007B2 (ja) | 文書検索装置、文書検索方法、および文書検索プログラム | |
JP5292336B2 (ja) | 検索システムユーザの分野ごとにおける知識量推定装置、知識量推定方法および知識量推定プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110104 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20121115 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20121127 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130128 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130219 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130226 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5213668 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160308 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |