JP2010128981A - 操作シーケンス抽出方法及び装置及びプログラム - Google Patents

操作シーケンス抽出方法及び装置及びプログラム Download PDF

Info

Publication number
JP2010128981A
JP2010128981A JP2008305545A JP2008305545A JP2010128981A JP 2010128981 A JP2010128981 A JP 2010128981A JP 2008305545 A JP2008305545 A JP 2008305545A JP 2008305545 A JP2008305545 A JP 2008305545A JP 2010128981 A JP2010128981 A JP 2010128981A
Authority
JP
Japan
Prior art keywords
search
browsing
information
query
browsing information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008305545A
Other languages
English (en)
Other versions
JP5213668B2 (ja
Inventor
Yuichiro Sekiguchi
裕一郎 関口
Yukako Kitagawa
結香子 北川
Masashi Uchiyama
匡 内山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2008305545A priority Critical patent/JP5213668B2/ja
Publication of JP2010128981A publication Critical patent/JP2010128981A/ja
Application granted granted Critical
Publication of JP5213668B2 publication Critical patent/JP5213668B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】異なる目的で閲覧したページがそれぞれ別のシーケンスとなるような、操作シーケンスの抽出を行う。
【解決手段】本発明は、操作ログから検索行動とその結果得られる検索結果ページと、その検索結果から実際に閲覧したページをまとめる。1つの検索結果ページに着目し、閲覧したページに存在する語句の割合(全ページに対する存在ページの割合)を要素(成分)とする特徴ベクトルで表現する。特徴ベクトルの類似度(内積)により類似したものをまとめ(どのような検索語句で検索したかをグループ化)、これを操作シーケンスとして抽出する。
【選択図】図1

Description

本発明は、操作シーケンス抽出方法及び装置及びプログラムに係り、特に、操作シーケンスに基づいて個人のブラウザ閲覧履歴を表示するための操作シーケンス抽出方法及び装置及びプログラムに関する。
インターネットが普及し、購買行動や調べ物をはじめ多くの作業がインターネットを用いて行われるようになってきた。このような作業中でユーザが閲覧したページ内容の情報は、閲覧に用いたブラウザアプリケーション(例えば、非特許文献1参照)や操作ログ記録アプリケーションなどに記録される。このようなものにおいて記録・蓄積されるユーザのブラウジング操作のログ情報は、当該ユーザがどのような興味を持って情報を探索していたかを表すものであり、それを解析して表示することは、ユーザの購買基準等の販売促進に有用なデータを表すものである。
そのため、ユーザのブラウジング操作ログを解析する試みがこれまで多くなされてきた。例えば、従来の技術として、操作ログを解析することにより、キーワードを用いて関連する操作シーケンスを検索する技術がある(例えば、特許文献1参照)。
特開2007−148687号公報 「Memory-Retriever:体験獲得情報を想起させる行動検索手法」森田哲之他6名、情報処理学会論文誌、vol.48, no.3, pp.1197-1208, (2007).
しかしながら、上記のキーワードを用いて関連する操作シーケンスを検索する技術においては、入力したキーワードに関連する操作シーケンスを抽出する処理を、当該キーワードを含む閲覧ページとそのページと閲覧した時間が近い閲覧ページをまとめることにより行っていたため、閲覧した時間は近いが異なる目的をもって閲覧していたページを同一のシーケンスに含めてしまうとい問題点があった。
例えば、「京都」に関連する情報を調べ終わった直後に「プログラム手法」について調べた場合、閲覧した時間が近いために、「京都」に関するページと「プログラム手法」に近いページが同一のシーケンスとして抽出されてしまう。
本発明は、上記の点に鑑みなされたもので、異なる目的で閲覧したページがそれぞれ別のシーケンスとなるような、操作シーケンスの抽出を行うことが可能な操作シーケンス抽出方法及び装置及びプログラムを提供することを目的とする。
図1は、本発明の原理を説明するための図である。
本発明(請求項1)は、ブラウザ閲覧履歴から操作シーケンスを抽出する操作シーケンス抽出方法において、
検索閲覧行動抽出手段が、操作記録データベースの操作ログから検索行動とその結果得られる検索結果ページのリンクを辿って閲覧したページを対応付け、該操作ログから検索結果ページとそこからリンクを辿って閲覧した閲覧ページとの組からなる検索閲覧情報を抽出し、検索閲覧情報記憶手段に格納する検索閲覧行動抽出ステップ(ステップ1)と、
検索条件解析手段が、検索閲覧情報記憶手段から検索閲覧情報を取得して、閲覧ページ含まれる情報に共有して含まれる語句を、ユーザが情報の絞込み条件として意図していたが検索クエリに含めなかった語句を潜在クエリとして抽出し、該検索閲覧情報記憶手段に格納する潜在クエリ抽出ステップ(ステップ2)と、
行動関係性判別手段が、検索閲覧情報記憶手段の検索閲覧情報について、それぞれが持つ検索クエリと潜在クエリとを比較し、該検索閲覧情報におけるユーザの検索意図の類似度合を算出することにより、検索閲覧情報間の関連性を抽出し、関連度を該検索閲覧情報記憶手段に格納する関連性抽出ステップ(ステップ3)と、
操作シーケンス抽出手段が、検索閲覧情報記憶手段の関連度を参照し、関連度の高い検索閲覧情報を類似の行動としてまとめることにより、該検索閲覧情報記憶手段の検索閲覧情報集合から操作シーケンスを抽出する操作シーケンス抽出ステップ(ステップ4)と、を行う。
また、本発明(請求項2)は、潜在クエリ抽出ステップ(ステップ2)において、
検索閲覧情報記憶手段の検索閲覧情報に含まれる閲覧ページに含まれる各語句に対して、該語句を含む閲覧ページの数xを、該検索閲覧情報記憶手段の閲覧ページの件数Nで割った値であるx/Nを、該語句の潜在クエリスコアとし、一定以上の潜在クエリスコアを有する語句を検索閲覧行動の潜在クエリとして抽出する。
また、本発明(請求項3)は、関連性抽出ステップ(ステップ3)において、
2つの検索閲覧情報の組に含まれるそれぞれの検索閲覧情報について、当該検索閲覧行動情報が持つ潜在クエリ情報に含まれる語句と潜在クエリスコアからなる語句ベクトルに、当該検索閲覧情報に含まれる検索クエリを表す単語をスコア1として加えた語句ベクトルを抽出し、得られた2つの語句ベクトルのコサイン類似度を算出することにより、当該検索閲覧情報間の関連スコアを抽出する。
図2は、本発明の原理構成図である。
本発明(請求項4)は、ブラウザ閲覧履歴から操作シーケンスを抽出する操作シーケンス抽出装置であって、
操作記録データベース160の操作ログから検索行動とその結果得られる検索結果ページのリンクを辿って閲覧したページを対応付け、該操作ログから検索結果ページとそこからリンクを辿って閲覧した閲覧ページとの組からなる検索閲覧情報を抽出し、検索閲覧情報記憶手段130に格納する検索閲覧行動抽出手段120と、
検索閲覧情報記憶手段130から検索閲覧情報を取得して、閲覧ページ含まれる情報に共有して含まれる語句を、ユーザが情報の絞込み条件として意図していたが検索クエリに含めなかった語句を潜在クエリとして抽出し、該検索閲覧情報記憶手段130に格納する検索条件解析手段140と、
検索閲覧情報記憶手段130の検索閲覧情報の組について、それぞれが持つ検索クエリと潜在クエリとを比較し、検索閲覧情報におけるユーザの検索意図の類似度合を算出することにより、検索閲覧情報間の関連性を抽出し、関連度を該検索閲覧情報記憶手段130に格納する行動関係性判別手段150と、
検索閲覧情報記憶手段130の関連度を参照し、関連度の高い検索閲覧情報を類似の行動としてまとめることにより、該検索閲覧情報記憶手段130の検索閲覧情報集合から操作シーケンスを抽出する操作シーケンス抽出手段160と、を有する。
また、本発明(請求項5)は、検索条件解析手段140において、
検索閲覧情報記憶手段130の検索閲覧情報に含まれる閲覧ページに含まれる各語句に対して、該語句を含む閲覧ページの数xを、該検索閲覧情報記憶手段130の閲覧ページの件数Nで割った値であるx/Nを、該語句の潜在クエリスコアとし、一定以上の潜在クエリスコアを有する語句を検索閲覧行動の潜在クエリとして抽出する手段を含む。
また、本発明(請求項6)は、行動関係性判別手段150において、
2つの検索閲覧情報の組に含まれるそれぞれの検索閲覧情報について、当該検索閲覧行動情報が持つ潜在クエリ情報に含まれる語句と潜在クエリスコアからなる語句ベクトルに、当該検索閲覧情報に含まれる検索クエリを表す単語をスコア1として加えた語句ベクトルを抽出し、得られた2つの語句ベクトルのコサイン類似度を算出することにより、当該検索閲覧情報間の関連スコアを抽出する手段を含む。
本発明(請求項7)は、請求項4乃至6のいずれか1項に記載の操作シーケンス抽出装置を構成する各手段としてコンピュータを機能させるための操作シーケンス抽出プログラムである。
本発明(請求項8)は、請求項7記載の操作シーケンス抽出プログラムを格納したことを特徴とするコンピュータ読取可能な記録媒体である。
上記のように、本発明によれば、ユーザがWeb上で検索した行動において調べようとしていた事柄の意図を、その前後に閲覧したページから抽出することにより、異なる目的で検索して閲覧したページがそれぞれ別のシーケンスとなるような、操作シーケンスの抽出が可能となる。
以下、図面と共に本発明の実施の形態を説明する。
図3は、本発明の一実施の形態における操作シーケンス抽出装置の構成を示す。
同図に示す操作シーケンス抽出装置100は、検索閲覧情報抽出部120、検索閲覧情報バッファ130、検索条件解析部140、行動関係性判別部150、操作シーケンス抽出部160から構成される。
操作シーケンス抽出装置100は、解析対象とするユーザ情報を入力する解析対象入力装置110と、解析対象となる操作記録情報が蓄積された操作記録データベース180と、抽出したシーケンス情報を出力するシーケンス情報出力装置170に接続されている。
操作記録データベース180には、ユーザのブラウジングアプリケーションや、前述の非特許文献1に示すログ記録アプリケーションから得られる、ユーザのブラウジング記録が複数のユーザ分蓄積されている。ここでいうユーザのブラウジング記録とは、閲覧したユーザを一意に指定するユーザID情報と、閲覧したページを一意に指定するURL情報と、閲覧した時刻情報と、閲覧したページ内容情報と、閲覧したページの前にどのページを閲覧していたかを表すリファラー情報とが組になったページ閲覧情報が時系列順に並べられたデータを表す。図4に操作記録データベース180に蓄積される閲覧ページデータの例を示す。同図に示すように、閲覧ページデータは、ユーザID毎に、URL、時刻、リファラ、ページ内容等が格納される。
検索閲覧情報抽出部120は、解析対象入力装置110から解析対象とするユーザID情報が入力されると処理を開始し、操作記録データベース180から当該ユーザID情報を含むページ閲覧情報の集合を抽出し、得られたページ閲覧情報の集合から検索結果を表す情報とそこからリンクを辿って閲覧したページの情報とをまとめた検索閲覧情報を抽出し、ページ閲覧情報バッファ130に格納する。
図5は、本発明の一実施の形態における検索閲覧情報抽出部の動作のフローチャートである。
ステップ101) 検索閲覧情報抽出部120は、解析対象入力装置110から解析対象とするユーザID情報が入力されると処理を開始し、操作記録データベース180から当該ユーザID情報を含むページ閲覧情報の集合を抽出し、ページ閲覧情報バッファ130に蓄積する。
ステップ102) 次に、ページ閲覧情報バッファ130に蓄積された閲覧ページ情報の集合の中から、インターネット上で提供されている検索機能で検索した結果得られる検索結果ページを表すページ閲覧情報を抽出する。具体的には、多くの検索結果ページはそのURL中に検索クエリ等の検索条件がパラメータとして指定されているため、予め入力された検索結果ページのURLパターンに対応するURL情報を持つ閲覧ページ情報を抽出する。
ステップ103) ステップ102で得られた検索結果ページを表す閲覧ページ情報それぞれに対して、当該閲覧ページからリンクを辿って閲覧したページを表す閲覧ページ情報をページ閲覧情報バッファ130から抽出し、得られたページ閲覧情報の集合と当該検索結果ページを表すページ閲覧情報とを組とした検索閲覧情報を検索閲覧情報バッファ130に記録する。具体的には、当該閲覧ページ情報のURL情報と同一の値をリファラ情報に持つページ閲覧情報を検索閲覧情報バッファ130から全て選び出すことにより、当該閲覧ページ情報からリンクを辿って閲覧した閲覧ページ情報を抽出する。図6に検索閲覧情報バッファ130に含まれる、検索閲覧情報の例を示す。
ステップ104) 検索閲覧情報バッファ130中に、同一の検索条件の検索結果ページを含む検索閲覧情報がある場合、片方のリンクから閲覧したページの情報を、もう一方のリンクから閲覧したページの情報に付加することにより一つにまとめる。同一の検索条件を持つかの判定は、URL情報中に含まれる検索クエリ内容を表すパラメータ情報が一致しているか否かによって行う。
図6の例を用いて説明すると、閲覧ページAが「餃子」で検索した上位10位の検索結果を表すページで、閲覧ページ情報Dが「餃子」で検索した上位10位の検索結果を表すページで、閲覧ページ情報Dが「餃子」で検索した上位11位から20位までの検索結果の場合、検索閲覧情報バッファ130から閲覧ページ情報Dを含む行を削除し、削除した行のリンクから閲覧したページ情報だった閲覧ページ情報gを、閲覧ページ情報Aを検索結果に持つ行のリンクから閲覧したページ情報に付け加える。
ステップ104の処理を行い、同一検索条件のページをまとめた後の検索閲覧情報バッファ130に含まれる情報の例を図7に示す。
検索条件解析部140は、検索閲覧情報抽出部120の処理が終了すると処理を開始する。
図8は、本発明の一実施の形態における検索条件解析部の処理のフローチャートである。
ステップ201) 検索条件解析部140は、処理を開始すると検索閲覧情報バッファ130から検索閲覧行動情報を一つ読み込む。
ステップ202) 次に、取り出した検索閲覧行動に含まれる閲覧ページ情報それぞれに対して、ページ内容情報を一般的な形態素解析処理を行うことにより単語集合に変換する。例えば、「A社の最新携帯電話をセール販売中」というページ内容であると、
「A社」「の」「最新」「携帯電話」「を」「セール」「販売」「中」
というように分割される。形態素解析を行う際に、処理の簡便化のために名詞のみの単語集合に変換し、
「A社」「最新」「携帯電話」「セール」「販売」
といった単語のみに絞って分割を行ってもよい。
ステップ203) 得られた単語集合の単語それぞれに対して、その単語を含む閲覧ページ情報が検索閲覧行動中にいくつ存在しているかを集計し、得られた値を検索閲覧情報に含まれる閲覧ページ情報の数で割った値を当該単語のスコアとして算出する。
例えば、検索閲覧情報中に閲覧ページ情報がN件含まれているときに、ある語句を含む閲覧ページ情報がx件あったとする場合、当該語句のスコアはx/Nとなる。
ステップ204) 検索閲覧情報中の検索結果ページを表す情報から、検索条件となっているクエリ語句を抽出し、当該語句のスコアを1とする。
ステップ205) ステップ203及びステップ204で得られた語句とそのスコアの情報の組を、重み付き語句ベクトルの形式で集約し、検索閲覧情報の処理対象とした検索閲覧情報を持つ行の潜在クエリ情報の欄に書き込む。
ステップ206) 検索閲覧情報バッファ130中に潜在クエリ欄が書き込まれていない未処理の検索閲覧情報が存在するかを確認し、存在した場合はステップ201に戻り処理を続行する。存在しなかった場合は、検索条件解析部140の処理を終了する。
行動関係判別部150は、検索条件解析部140の処理が終了すると処理を開始し、検索閲覧情報バッファ130中のあらゆる検索閲覧情報の組み合わせに対して、その関連性が高いほど大きな値となる関連スコアを算出し、操作シーケンス抽出部160の関連スコアバッファ161に書き込む。
図9は、本発明の一実施の形態における行動関係性判別部の処理のフローチャートである。
ステップ301) 行動関係性判別部150は、検索条件解析部140の処理が終了すると処理を開始し、検索閲覧情報バッファ130中から2つの検索閲覧情報からなる組を取り出す。
ステップ302) 各検索閲覧情報から潜在クエリ情報を読み込み、そのコサイン類似度を関連スコアとして算出する。
ステップ303) 2つの検索閲覧情報の持つID情報とステップ302で算出した関連スコアとを、操作シーケンス抽出部160の関連スコアバッファ161に書き込む。
ステップ304) 関連スコアを未計算の検索閲覧情報の組が検索閲覧情報バッファ130中に存在するかを確認し、存在する場合は、ステップ301に戻り処理を続行する。存在しない場合は処理を終了する。
操作シーケンス抽出部160は、関連スコアバッファ161を有し、行動関係性判別部150により関連スコアバッファ161に格納された関連スコアが予め定められた値以上である検索閲覧行動を纏めることにより、似通った検索を行っている検索行動を同一の操作シーケンスとして統合し、得られた操作シーケンスの集合をシーケンス情報出力装置170に出力する。この際、ある操作シーケンスに含まれるどれか一つの検索閲覧行動と、予め定められた値以上の関連度スコアを持つ検索閲覧行動を、同一の操作シーケンスとしてまとめることとしてよい。
なお、上記の図3の構成における各構成要素の動作をプログラムとして構築し、検索シーケンス抽出装置として利用されるコンピュータにインストールして実行させる、または、ネットワークを介して流通させることが可能である。
また、構築されたプログラムをハードディスクや、フレキシブルディスク・CD−ROM等の可搬記憶媒体に格納し、コンピュータにインストールする、または、配布することが可能である。
なお、本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。
本発明は、ユーザのブラウザ閲覧履歴を取得する技術に適用可能である。
本発明の原理を説明するための図である。 本発明の原理構成図である。 本発明の一実施の形態における検索シーケンス抽出装置の構成図である。 本発明の一実施の形態における操作記録データベースに蓄積される閲覧ページ情報の例である。 本発明の一実施の形態における検索閲覧情報抽出部の動作のフローチャートである。 本発明の一実施の形態における検索閲覧情報バッファに蓄積される検索閲覧情報の例である。 本発明の一実施の形態における同一の検索条件を持つ情報をまとめた後の検索閲覧情報バッファに蓄積される検索閲覧情報の例である。 本発明の一実施の形態における検索条件解析部の動作のフローチャートである。 本発明の一実施の形態における行動関係性判別部の処理のフローチャートである。
符号の説明
100 検索シーケンス抽出装置
110 解析対象入力装置
120 検索閲覧行動抽出手段、検索閲覧情報抽出部
130 検索閲覧情報記憶手段、検索閲覧情報バッファ
140 検索条件解析手段、検索条件解析部
150 行動関係性判別手段、行動関係性判別部
160 操作シーケンス抽出手段、操作シーケンス抽出部
161 関連スコアバッファ
170 操作シーケンス情報出力装置
180 操作記録データベース

Claims (8)

  1. ブラウザ閲覧履歴から操作シーケンスを抽出する操作シーケンス抽出方法において、
    検索閲覧行動抽出手段が、操作記録データベースの操作ログから検索行動とその結果得られる検索結果ページのリンクを辿って閲覧したページを対応付け、該操作ログから検索結果ページとそこからリンクを辿って閲覧した閲覧ページとの組からなる検索閲覧情報を抽出し、検索閲覧情報記憶手段に格納する検索閲覧行動抽出ステップと、
    検索条件解析手段が、前記検索閲覧情報記憶手段から前記検索閲覧情報を取得して、閲覧ページ含まれる情報に共有して含まれる語句を、ユーザが情報の絞込み条件として意図していたが検索クエリに含めなかった語句を潜在クエリとして抽出し、該検索閲覧情報記憶手段に格納する潜在クエリ抽出ステップと、
    行動関係性判別手段が、前記検索閲覧情報記憶手段の検索閲覧情報の組について、それぞれが持つ検索クエリと潜在クエリとを比較し、検索閲覧情報におけるユーザの検索意図の類似度合を算出することにより、検索閲覧情報間の関連性を抽出し、関連度を該検索閲覧情報記憶手段に格納する関連性抽出ステップと、
    操作シーケンス抽出手段が、前記検索閲覧情報記憶手段の前記関連度を参照し、関連度の高い検索閲覧情報を類似の行動としてまとめることにより、該検索閲覧情報記憶手段の検索閲覧情報集合から操作シーケンスを抽出する操作シーケンス抽出ステップと、
    を行うことを特徴とする操作シーケンス抽出方法。
  2. 前記潜在クエリ抽出ステップにおいて、
    前記検索閲覧情報記憶手段の前記検索閲覧情報に含まれる閲覧ページに含まれる各語句に対して、該語句を含む閲覧ページの数xを、該検索閲覧情報記憶手段の閲覧ページの件数Nで割った値であるx/Nを、該語句の潜在クエリスコアとし、一定以上の潜在クエリスコアを有する語句を検索閲覧行動の潜在クエリとして抽出する
    請求項1記載の操作シーケンス抽出方法。
  3. 前記関連性抽出ステップにおいて、
    2つの検索閲覧情報の組に含まれるそれぞれの検索閲覧情報について、当該検索閲覧行動情報が持つ潜在クエリ情報に含まれる語句と潜在クエリスコアからなる語句ベクトルに、当該検索閲覧情報に含まれる検索クエリを表す単語をスコア1として加えた語句ベクトルを抽出し、得られた2つの語句ベクトルのコサイン類似度を算出することにより、当該検索閲覧情報間の関連スコアを抽出する
    請求項1記載の操作シーケンス抽出方法。
  4. ブラウザ閲覧履歴から操作シーケンスを抽出する操作シーケンス抽出装置であって、
    操作記録データベースの操作ログから検索行動とその結果得られる検索結果ページのリンクを辿って閲覧したページを対応付け、該操作ログから検索結果ページとそこからリンクを辿って閲覧した閲覧ページとの組からなる検索閲覧情報を抽出し、検索閲覧情報記憶手段に格納する検索閲覧行動抽出手段と、
    前記検索閲覧情報記憶手段から前記検索閲覧情報を取得して、閲覧ページ含まれる情報に共有して含まれる語句を、ユーザが情報の絞込み条件として意図していたが検索クエリに含めなかった語句を潜在クエリとして抽出し、該検索閲覧情報記憶手段に格納する検索条件解析手段と、
    前記検索閲覧情報記憶手段の検索閲覧情報の組について、それぞれが持つ検索クエリと潜在クエリとを比較し、検索閲覧情報におけるユーザの検索意図の類似度合を算出することにより、検索閲覧情報間の関連性を抽出し、関連度を該検索閲覧情報記憶手段に格納する行動関係性判別手段と、
    前記検索閲覧情報記憶手段の前記関連度を参照し、関連度の高い検索閲覧情報を類似の行動としてまとめることにより、該検索閲覧情報記憶手段の検索閲覧情報集合から操作シーケンスを抽出する操作シーケンス抽出手段と、
    を有することを特徴とする操作シーケンス抽出装置。
  5. 前記検索条件解析手段は、
    前記検索閲覧情報記憶手段の前記検索閲覧情報に含まれる閲覧ページに含まれる各語句に対して、該語句を含む閲覧ページの数xを、該検索閲覧情報記憶手段の閲覧ページの件数Nで割った値であるx/Nを、該語句の潜在クエリスコアとし、一定以上の潜在クエリスコアを有する語句を検索閲覧行動の潜在クエリとして抽出する手段を含む
    請求項4記載の操作シーケンス抽出装置。
  6. 前記行動関係性判別手段は、
    2つの検索閲覧情報の組に含まれるそれぞれの検索閲覧情報について、当該検索閲覧行動情報が持つ潜在クエリ情報に含まれる語句と潜在クエリスコアからなる語句ベクトルに、当該検索閲覧情報に含まれる検索クエリを表す単語をスコア1として加えた語句ベクトルを抽出し、得られた2つの語句ベクトルのコサイン類似度を算出することにより、当該検索閲覧情報間の関連スコアを抽出する手段を含む
    請求項4記載の操作シーケンス抽出装置。
  7. 請求項4乃至6のいずれか1項に記載の操作シーケンス抽出装置を構成する各手段としてコンピュータを機能させるための操作シーケンス抽出プログラム。
  8. 請求項7記載の操作シーケンス抽出プログラムを格納したことを特徴とするコンピュータ読取可能な記録媒体。
JP2008305545A 2008-11-28 2008-11-28 操作シーケンス抽出方法及び装置及びプログラム Active JP5213668B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008305545A JP5213668B2 (ja) 2008-11-28 2008-11-28 操作シーケンス抽出方法及び装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008305545A JP5213668B2 (ja) 2008-11-28 2008-11-28 操作シーケンス抽出方法及び装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2010128981A true JP2010128981A (ja) 2010-06-10
JP5213668B2 JP5213668B2 (ja) 2013-06-19

Family

ID=42329302

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008305545A Active JP5213668B2 (ja) 2008-11-28 2008-11-28 操作シーケンス抽出方法及び装置及びプログラム

Country Status (1)

Country Link
JP (1) JP5213668B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012093803A (ja) * 2010-10-22 2012-05-17 Nippon Telegr & Teleph Corp <Ntt> 閲覧ログ解析装置及び閲覧ログ解析プログラム
JP2014059865A (ja) * 2012-09-14 2014-04-03 Hon Hai Precision Industry Co Ltd 検索システム及びその方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006127321A (ja) * 2004-10-29 2006-05-18 Solid Technology Kk 端末属性後付装置および端末属性後付方法
JP2007264718A (ja) * 2006-03-27 2007-10-11 Yafoo Japan Corp ユーザ興味分析装置、方法、プログラム
JP2007280011A (ja) * 2006-04-06 2007-10-25 Nippon Telegr & Teleph Corp <Ntt> Webページ閲覧履歴の提示方法および装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006127321A (ja) * 2004-10-29 2006-05-18 Solid Technology Kk 端末属性後付装置および端末属性後付方法
JP2007264718A (ja) * 2006-03-27 2007-10-11 Yafoo Japan Corp ユーザ興味分析装置、方法、プログラム
JP2007280011A (ja) * 2006-04-06 2007-10-25 Nippon Telegr & Teleph Corp <Ntt> Webページ閲覧履歴の提示方法および装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012093803A (ja) * 2010-10-22 2012-05-17 Nippon Telegr & Teleph Corp <Ntt> 閲覧ログ解析装置及び閲覧ログ解析プログラム
JP2014059865A (ja) * 2012-09-14 2014-04-03 Hon Hai Precision Industry Co Ltd 検索システム及びその方法

Also Published As

Publication number Publication date
JP5213668B2 (ja) 2013-06-19

Similar Documents

Publication Publication Date Title
CN108280114B (zh) 一种基于深度学习的用户文献阅读兴趣分析方法
TWI524193B (zh) 用於搜尋結果之語義目錄的電腦可讀取媒體及電腦實現方法
US8655648B2 (en) Identifying topically-related phrases in a browsing sequence
US20170154116A1 (en) Method and system for recommending contents based on social network
US9256649B2 (en) Method and system of filtering and recommending documents
KR101252670B1 (ko) 연관 콘텐츠 제공 장치, 방법 및 컴퓨터 판독 가능한 기록 매체
CN110309251B (zh) 文本数据的处理方法、装置和计算机可读存储介质
US8290925B1 (en) Locating product references in content pages
JP4896132B2 (ja) 情報価値を反映した情報検索方法及びその装置
JP4569380B2 (ja) ベクトル生成方法及び装置及びカテゴリ分類方法及び装置及びプログラム及びプログラムを格納したコンピュータ読み取り可能な記録媒体
JP5367632B2 (ja) 知識量推定装置及びプログラム
KR20100132376A (ko) 스니펫 제공 장치 및 방법
JP2012008900A (ja) 関連語句抽出方法、関連語句抽出装置及び関連語句抽出プログラム
JP4912384B2 (ja) 文書検索装置、文書検索方法、および文書検索プログラム
JP5213668B2 (ja) 操作シーケンス抽出方法及び装置及びプログラム
CN109933691B (zh) 用于内容检索的方法、装置、设备和存储介质
JP4759600B2 (ja) 文章検索装置、文章検索方法、文章検索プログラムおよびその記録媒体
JPWO2013157603A1 (ja) 検索クエリ分析装置、検索クエリ分析方法、及びプログラム
JP5180894B2 (ja) 属性表現獲得方法及び装置及びプログラム
Moumtzidou et al. Discovery of environmental nodes in the web
JP2012145974A (ja) バースト情報検索装置、バースト情報検索方法、及びバースト情報検索プログラム
JP2010286888A (ja) 情報収集システムおよび情報収集方法ならびにそのプログラム
JP2010272006A (ja) 関係抽出装置、関係抽出方法、及びプログラム
JP5292336B2 (ja) 検索システムユーザの分野ごとにおける知識量推定装置、知識量推定方法および知識量推定プログラム
JP4938515B2 (ja) 単語間相関度計算装置および方法、プログラム並びに記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110104

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121115

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121127

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130128

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130219

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130226

R150 Certificate of patent or registration of utility model

Ref document number: 5213668

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160308

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350