JP5238437B2 - ウェブ閲覧目的分類装置、ウェブ閲覧目的分類方法、及びウェブ閲覧目的分類プログラム - Google Patents

ウェブ閲覧目的分類装置、ウェブ閲覧目的分類方法、及びウェブ閲覧目的分類プログラム Download PDF

Info

Publication number
JP5238437B2
JP5238437B2 JP2008255609A JP2008255609A JP5238437B2 JP 5238437 B2 JP5238437 B2 JP 5238437B2 JP 2008255609 A JP2008255609 A JP 2008255609A JP 2008255609 A JP2008255609 A JP 2008255609A JP 5238437 B2 JP5238437 B2 JP 5238437B2
Authority
JP
Japan
Prior art keywords
browsing
unit
web
web page
knowledge
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008255609A
Other languages
English (en)
Other versions
JP2010086343A (ja
Inventor
亘 仲野
優 鈴木
秀樹 筒井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2008255609A priority Critical patent/JP5238437B2/ja
Priority to US12/554,188 priority patent/US9189562B2/en
Publication of JP2010086343A publication Critical patent/JP2010086343A/ja
Application granted granted Critical
Publication of JP5238437B2 publication Critical patent/JP5238437B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明はウェブ閲覧履歴の特徴を用いて閲覧者がウェブページを閲覧する目的を分類するウェブ閲覧目的分類装置、ウェブ閲覧目的分類方法、及びウェブ閲覧目的分類プログラムに関する。
閲覧者が閲覧中のウェブページの内容を元にして、その内容と関連のある別の情報を提示するウェブ関連情報推薦システムは提案されている。例えば、Google(R)AdSenseはウェブページの内容から関連する広告記事とそのリンクをウェブページ内に表示する手法であり、閲覧者はリンクを辿ることで広告記事本文の閲覧やウェブ上での商品購入が可能になる。しかし、これらの従来のウェブ関連情報推薦は、広告記事の内容は考慮しているが、例えば閲覧者がどのような目的でそのウェブページを閲覧しているかなど、閲覧者についての情報は扱うことができない。その結果、ウェブ閲覧者は自分の現在の目的とは異なる広告記事や関連情報をシステムに提示されてしまうという不利益を受けることになる。
ウェブ閲覧者の背景や属性を情報推薦に利用する情報推薦システムとしては、例えば、特許文献1がある。ここでは、ウェブビジターの識別とウェブビジターの時間的に変化する関心を把握し、多数の定義済みユーザグループ内で各ユーザのメンバーシップを判定し、インターネット行動の詳細なプロフィールを形成する。このプロフィールを用いてユーザへのマーケット情報及び製品情報の提示、ウェブコンテンツの動的なカスタマイズ、並びに、その他の販売目的に使用することができるインターネット・プロファイリングシステムであり、閲覧者は自身の属性や関心に沿ったコンテンツの提供を受けることができる。
しかし、閲覧者は例えば特定の目的意識を持たず暇つぶしのためにウェブサイトを訪問したり、逆にすでに特定の目的が明らかになった状態でウェブサイトを訪問したりするが、閲覧者の属性や関心を利用するだけでは、それらのウェブ閲覧の目的意識が扱えないため、ウェブ閲覧者にその時の目的に沿ったコンテンツを推薦することができない場合がある。
特開2001-142907 AdSense へようこそ−<https://www.google.com/adsense/login/ja/?gsessionid=ELyQ―tEramE>
従来のウェブ関連情報推薦システムにおいては、閲覧者のウェブページ及びウェブサイトに対する目的意識を考慮していないために、効果的な関連情報取得が困難な場合がある。
本発明の目的は、閲覧者のウェブページ及びウェブサイトにおけるその時の閲覧目的を分類することである。
第1の発明はウェブページを表示する表示部と、前記ウェブページから文書データを読み出す文書読出部と、キーワード抽出のための知識を蓄積するキーワード抽出知識蓄積部と、前記キーワード抽出のための知識を用いて、文書データからキーワードを抽出するキーワード抽出部と、ウェブページ形式判定のための知識を蓄積するウェブページ形式判定知識蓄積部と、ウェブページ形式判定のための知識を用いて、ウェブページ形式を判定するウェブページ形式判定部と、前記キーワードと前記ウェブページ形式をウェブ閲覧履歴として蓄積するウェブ閲覧履歴蓄積部と、閲覧目的分類のための知識を蓄積する閲覧目的分類知識蓄積部と、前記ウェブ閲覧履歴を基に、閲覧者の閲覧目的を分類する閲覧目的分類部とを持つことを特徴とするウェブ閲覧目的分類装置である。
第2の発明は、ウェブページから抽出したキーワード間の意味関係を判定するためのオントロジー辞書を更に具備することを特徴とする請求項1記載のウェブ閲覧目的分類装置である。
第3の発明では、前記キーワード抽出部が文書データを形態素に分割する形態素解析部と文書データの部分文字列についてその意味属性を取得する意味属性解析部の少なくともいずれか一つを持つことを特徴とする請求項1乃至2記載のウェブ閲覧目的分類装置である。
第4の発明では、前記閲覧目的分類部がウェブ閲覧履歴情報に共通しているキーワードを前記閲覧目的の対象物を指す目的キーワードとして抽出することを特徴とする請求項1乃至3記載のウェブ閲覧目的分類装置である。
第5の発明では、前記閲覧目的が閲覧者が特定情報を収集している収集モードと、特定情報収集を目的としてない暇つぶしモードの2種類の状態を含むことを特徴とする請求項4記載のウェブ閲覧目的分類装置である。
第6の発明は、前記収集モードが特定の対象について更なる別の情報を収集している深堀りモードと、あるテーマについて複数の対象を比較検討する目的で情報を収集している比較検討モードの2種類の状態を含むことを特徴とする請求項5記載のウェブ閲覧目的分類装置である。
第7の発明は、前記目的キーワードと前記閲覧目的を前記ウェブ閲覧履歴と対応付けて蓄積する閲覧目的蓄積部と、前記ウェブ閲覧履歴を前記目的キーワードと前記閲覧目的とに対応付けて前記表示部に表示させる閲覧履歴表示制御部とを更に具備することを特徴とする請求項1乃至6記載のウェブ閲覧目的分類装置である。
第8の発明は前記閲覧目的毎に関連情報検索文を生成するための知識を蓄積する関連情報検索文生成知識蓄積部と、前記関連情報検索文を生成するための知識を用いて、関連情報を検索するための検索文を生成する関連情報検索文生成部と、検索文を用いて関連情報を検索する関連情報検索部と、検索結果の関連情報を前記表示部に表示させる関連情報表示制御部を更に具備することを特徴とする請求項1乃至7記載のウェブ閲覧目的分類装置である。発明8によれば、閲覧目的を分類して、関連情報を効率良く取得することができる。
第9の発明は表示部が、ウェブページを表示し、文書読出部が、表示されたウェブページから文書データを読み出し、キーワード抽出部が、キーワード抽出知識蓄積部に蓄積した知識を利用して、文書データから少なくとも1つ以上のキーワードを抽出し、ウェブページ形式判定部が、ウェブページ形式判定知識蓄積部に蓄積した知識を利用して、ウェブページの形式を判定し、ウェブ閲覧履歴蓄積部が、キーワードとウェブページの形式をウェブ閲覧履歴として蓄積し、閲覧目的分類知識蓄積部が、閲覧目的分類のための知識を蓄積し、閲覧目的分類部が、ウェブ閲覧履歴蓄積部に蓄積されたキーワードとウェブページ形式を基に、閲覧者のウェブ閲覧における目的を分類することを特徴とするウェブ閲覧目的分類方法。
本発明によれば、閲覧されているウェブページ及びウェブサイトのその時の閲覧目的を分類することができる。
以下、図面を参照して、本発明の実施の形態について説明する。
本発明の第1の実施の形態は、クライアント端末上で動作するソフトウェアであり、クライアント端末上でウェブブラウザを用いて、閲覧者がウェブページを閲覧している際の閲覧目的を自動的に分類するウェブ閲覧目的分類装置、ウェブ閲覧目的分類方法及びウェブ閲覧目的分類プログラムについて説明したものである。
図1は、本発明のウェブ閲覧目的分類装置における第1の実施の形態について構成図を示したものである。本実施例に備えている各構成要件は下記のように詳しく説明する。
閲覧者が能動的に閲覧するウェブページを表示する表示ウィンドウは表示部10に表示されている。ウェブページはネットワーク30から取得して、文書データ記録部31に格納されている。
文書読出部11は、表示部10に表示されているウェブページを文書データ記録部31から取得する。取得されているウェブページから、HTMLタグを含むHTML文書データを取得する。HTML文書データの取得を開始する条件としては、表示部10にウェブページが表示されたらすぐに取得を開始するのでもよいし、例えば表示部10がアクティブウィンドウかどうかをチェックする、またはアクティブウィンドウになって一定時間経過したかどうかをチェックする、などの条件を設定してもよい。一定時間表示されたことはタイマやクロックなどの計測する機能を持っている機器で測る。この計測する機能を持っている機器は、表示部10が所持してもよいし、文書読出部11が所持してもよい。
キーワード抽出部12は、文書読出部11によって取得されたHTML文書データから、ウェブページの内容を使って、関連情報を検索するためのキーワードを抽出する。キーワードの抽出は、HTML文書データを複数の部分文字列に分割し、その部分文字列をフィルタリングして絞り込むことによって行う。
HTML文書データの文字列の切り分けには、図1の形態素解析部13を用いて、文書読出部11が取得されたHTML文書データの形態素解析を行う。分割された文字列の中からキーワードを絞り込む際に、部分文字列に対して、図1の意味属性解析部14によって意味属性を付与する。特定の意味属性を持つ部分文字列のみをキーワードとして絞り込むこともできる。形態素解析と意味属性解析は終了になると、さらに、部分文字列に対して、例えば形態素や意味属性などを手がかりとして、キーワード抽出知識蓄積部15に保有した知識に基づいて抽出するキーワードを決定する。
ウェブページ形式判定部16は、表示部10により表示されているウェブページがどのような形式のウェブページであるかを判定する。形式の例としては、ポータル型ウェブサイトのトップページや、リンク集、検索結果一覧のウェブページ、特定のニュース記事や商品情報を記載するウェブページ、ブログのエントリなどがある。ウェブページの形式はこれらの例に限るものではなく、またこれらの例を必ずしも判定できる必要はない。ウェブページ判定のための知識は、ウェブページ形式判定知識蓄積部17に記憶する。ウェブページ判定のための知識についての詳細な説明は後でする。
ウェブ閲覧履歴蓄積部18は、閲覧者のウェブ閲覧履歴を保管する。ウェブ閲覧履歴として、閲覧したウェブページのURLの他に、ウェブページ形式判定部16によって得られたウェブページ形式、キーワード抽出部12によって得られたウェブページからのキーワード群を含む。
閲覧目的分類部19は、閲覧者が閲覧しているウェブページに対して、どのような目的で閲覧を行っているかを分類する。例えば、ユーザは特に目的キーワードとウェブページ形式に閲覧していない場合、特定情報収集を目的としてないので、閲覧目的は「暇つぶし」だと見なす。各閲覧目的についての詳細な説明は後でする。閲覧目的の分類には、ウェブ閲覧履歴蓄積部18に蓄積された現在及びそれまでに閲覧したウェブページの履歴情報や、閲覧目的分類知識蓄積部20が有する知識を用いる。また、オントロジー辞書蓄積部21に記憶されたオントロジー辞書を利用して閲覧目的を分類してもよい。閲覧目的分類に利用するウェブ閲覧の履歴の範囲は、例えば履歴情報によって静的に制限してもよいし、閲覧している閲覧時間や日数に応じて動的に履歴情報を変化させてもよい。
関連情報検索文生成部22は、閲覧中のウェブページの内容に関連する情報を検索して取得するための検索文を生成する。検索文生成は、キーワード抽出部12で抽出したキーワード群をウェブページの内容の手がかりとして用い、閲覧目的分類部19によって得られた、閲覧中のウェブページに対する閲覧者の閲覧目的を基に、関連情報の内容を限定するように検索文を拡張する。これらの検索文生成・拡張は関連情報検索文生成知識蓄積部23が保有する知識を利用して行う。関連情報検索文生成部22で生成される。生成された検索文は関連情報検索部24によって、前と同じネットワーク30を通して検索エンジンに入力され、出力結果を関連情報検索部24が受け取る。
関連情報表示制御部25は、関連情報検索部24が取得した検索結果の情報を表示する。提示の方法として関連情報がウェブページであればそのリンクURLを提示するのでもよいし、そのウェブページの要約やキーワード、関連すると判定される根拠となったキーワードなどを同時に提示することもできる。提示方法はこれらの例に限るものではない。
次に、本発明の第1の実施の形態について、具体的な例に基づいて説明する。
この例では、閲覧者がウェブページを閲覧している際の閲覧目的を自動的に分類し、閲覧目的に応じて適切な関連情報の種類を分類し、関連情報を提示するという動作をする装置を考える。図2は第1の実施の形態における全体的な処理フローを示した図である。まず、表示部10はウェブページを表示する(ステップS101)。次に、文書読出部11が、表示部10に表示されているウェブページの状態を調べ、表示部10がアクティブウィンドウであるか否か、且つアクティブウィンドウの状態がクロックやタイマなどで10秒間継続されているか否かをチェックする(ステップS102)。ウィンドウはアクティブではないまたはアクティブ状態は10秒以上継続されていない場合、再び表示部10と表示されているウェブページの状態を調べ(ステップS103のNo)。ウィンドウはアクティブであるまたはアクティブ状態は10秒以上継続されている場合、文書読出部11は表示部10に表示されているウェブページから、そのHTML文書データを取得する(ステップS103)。続く、キーワード抽出部12が、文書読出部11によって取得されたHTML文書データから、ウェブページの内容を表すキーワード群を抽出する(ステップS104)。次に、ウェブページ形式判定部16は、文書読出部11によって取得されたHTML文書データから、ウェブページ形式判定知識蓄積部17に蓄積された知識を用いて、ウェブページの形式を判定する(ステップS105)。ウェブページの形式の判定については、図8を用いて、後で説明する。そして、ウェブ閲覧履歴蓄積部18は、文書読出部11が抽出したHTML文書データからそのURL、ウェブページ形式判定部16からウェブページの形式、キーワード抽出部12からウェブページの内容を表すキーワード群、をそれぞれ受け取り、1つのウェブ閲覧履歴として保持する(ステップS106)。次に、閲覧目的分類部19が、現在閲覧者が閲覧中のウェブページに対し、履歴情報を用いてその閲覧目的を分類する(ステップS107)。閲覧目的が分類されると、関連情報検索文生成部22は閲覧目的分類部19が出力した閲覧目的に基づいて、現在のウェブページ内容と閲覧目的の双方に沿った関連情報を取得するための検索文を生成する(ステップS108)。関連情報検索部24は生成した検索文を本実施例構成外のウェブ検索エンジンに送信して、関連情報の検索を行う(ステップS109)。その後、関連情報検索部24はウェブ検索エンジンからの検索結果を受信する。関連情報表示制御部25は、受信した検索結果である関連情報を表示部10表示し、処理終了になる(ステップS110)。
次に、図3の説明をする。表示部10に表示するウェブページの例を図3のTに示す。図3では、クライアント端末の表示ディスプレイDにおいて、表示部10である表示ウィンドウWが動作し、W上にTが表示されている。
ウェブページから取得したHTML文書データの例を図4のDocに示す。ウェブページから取得したHTML文書データはそのウェブページのURLも含めている。DocはHTMLタグを含むHTML文書であり、以下では図4のDocにあるように、<BODY>や<P>などのHTMLタグと、<h1>ノートパソコンA、ModelX</h1><P>ネット動画などをTVの大画面で楽しめるHDMI端子搭載〜〜〜</P>という見出しと部分文章を含むとする。<h1>から</h1>までに含めている部分は一つの見出しとして見なして、<P>から</P>までに含めている部分は一つの段落として見なす。
次に、図2のステップS104の詳細について説明する。キーワード抽出部12による、HTML文書データからのキーワード抽出処理フローの一例を図5に示す。まず、文書読出部11はHTML文書データを読み込む(ステップS201)。読み込んだHTML文書データについて、文字列があるか否かをチェックする(ステップS202)。文字列がない場合、そのウェブページに対する処理は終了する(ステップS202のNo)。文字列がある場合(ステップS202のYes)、HTML文書データを形態素解析部13によって形態素に分割する(ステップS203)。形態素は、形態素文字列とその品詞情報や出現位置情報が組になったデータ構造をしている。次に、形態素に対して意味属性解析部14によって意味属性を付与する(ステップS204)。その後、特定の形式で連続した形態素について、連続した形態素全体に対して意味属性解析部14で意味属性を付与する(ステップS205)。そして、キーワード抽出部12で特定の品詞、意味属性を持つ形態素及び連続した形態素をキーワードリストに挿入して(ステップS206)、カウンタ変数iを0に初期化する(ステップ207)。次に、カウンタ変数iがキーワードリストの要素数より小さいか否かをチェックする(ステップS208)。カウンタ変数iがキーワードリストの要素数より小さい場合(ステップS208のYes)、キーワードリストのカウンタ変数i+1番目の要素を読み出し(ステップS209)、評価点を格納する変数Xを0に初期化する(ステップS210)。次に、キーワード抽出知識蓄積部15に蓄積された知識を用いて、i+1番目の要素を評価して、評価点をXに加算して(ステップS211)、評価点をキーワードリストに追加する(ステップS212)。キーワード抽出知識蓄積部15に蓄積された知識は例えば、履歴情報に格納されている過去の評価に用いる要素の例としては、HTML文書データ中の単語出現回数や出現位置、HTMLタグによる意味的な役割と位置、特定表現の有無などがあり、それらの一つまたは全部を総合的に考慮して評価点を算出する。そして、カウンタ変数iを1増やして(ステップS213)、再びカウンタ変数iがキーワードリストの要素数より小さいか否かをチェックする。カウンタ変数iが要素数より大きい場合(ステップS208のNo)、キーワード抽出部12はキーワードリストの要素を評価点でソートする(ステップS214)。ソートされた要素のうち、評価点が上位である5件のキーワードをウェブページのキーワードとして出力して(ステップS215)、ウェブページに対する処理終了になる。
次に図6について説明する。図6にウェブページからのキーワード抽出の例を示す。まず、図2のステップS103によって、ウェブページからHTML文書データを取得する。次に、図1のステップS104によって、HTML文書データからキーワードを抽出して、キーワードリストLに示す。Lでは、固有名詞や一般名詞、形容詞などがキーワードとして選ばれている。図6の例では、文書から意味属性は「製造物」、品詞は「名詞」のキーワード「ノートパソコンA」、意味属性は「製品名」、品詞は「固有名詞」のキーワード「ModelX」、意味属性は「その他」、品詞は「名詞句」のキーワード「ネット動画」と意味属性は「製造物」、品詞は「固有名詞」のキーワード「HDMI端子」を抽出する。要素番数(要素No.)を示すために、キーワードリストLの一番左に要素数の列を設ける。
次に図7について説明する。図7は本実施例におけるキーワード評価と抽出を示す。評価に用いる要素の例としては、ウェブページのHTML構造上の特徴やURLの構造及び特殊文字列の有無、HTML文書データ中の特殊文字列の有無などがある。図7のキーワードリストの例では、図5のステップ211で評価されたキーワードを示す。この例では、HTML文書データ中の出現回数を評価点としてキーワードリストに追加して、図5のステップS214によってソートする。例えば、HTML文書データに2回出現したキーワード「ノートパソコンA」と「ModelX」は評価点「2」を付けて、HTML文書データに1回出現したキーワード「ネット動画」と「HDMI端子」は評価点「1」を付ける。その後、評価点の高い順にソートする。
図8はウェブページ形式分類知識蓄積部17が蓄積する知識の例である。この例では、ウェブページ及びURLに含まれる文字列またはウェブページ及びURLの構造によって、ウェブページ形式を判定する。例えば、ウェブページのURLに含まれる文字列が「top.htm」の場合、ウェブページ形式は「サイトトップページ」だと見なす。URLに含まれる文字列が「item」の場合、ウェブページ形式は「商品ページまたはニュース記事ページ」だと見なす。URLに含まれている文字列が「search、result」または「search、keyword」の場合、ウェブページ形式は「検索結果ページ」だと見なす。もう一つの例では、URLの構造を用いて、ウェブページ形式を判定する。例えば、URLの構造が「ドメインのみ」の場合、このウェブページの形式は「サイトトップページ」だと見なす。
次に、図1のステップS105の詳細について説明する。図9はウェブページ形式の判定を行う処理のフローの例である。まず、ウェブページ形式判定部16は文書読出部11よりHTML文書データを取得する(ステップS301)。次に、ウェブ閲覧履歴蓄積部によりウェブページのURLを取得する(ステップS302)。このURLの情報はHTML文書データに格納されている。そして、URLの部分文字列の中に、ウェブページ形式判定知識蓄積部17に記憶されている文字列に該当するものがあるか否かをチェックする(ステップS303)。該当するものがあれば(ステップS303のYes)、ウェブページ形式判定知識蓄積部17において対応するウェブページ形式を出力して、履歴情報として格納する(ステップS309)。ウェブページ形式について、図10を用いて、後で説明する。該当するものが無ければ(ステップS303のNo)、URLの構造の中に、ウェブページ形式判定知識蓄積部17に記憶されているURL構造に該当するものがあるか否かをチェックする(ステップS304)。該当するものがあれば(ステップS304のYes)、ウェブページ形式判定部17において対応するウェブページ形式を履歴情報として格納して、処理を終了する(ステップS309)。該当するものが無ければ(ステップS304のNo)、ウェブページのDocument Object Model(DOM)ツリーを取得する(ステップS305)。
次に、HTML文書データの中に、ウェブページ形式判定知識蓄積部17に記憶されているウェブページ特殊文字列に該当するものがあるか否かをチェックする(ステップS306)。該当するものがあれば(ステップS306のYes)、ウェブページ形式判定部17において対応するウェブページ形式を履歴情報として格納して、処理を終了する(ステップS309)。該当するものが無ければ(ステップS306のNo)、HTML文書データの中に、ウェブページ形式判定知識蓄積部17に記憶されているウェブページ構造に該当するものがあるか否かをチェックする(ステップS307)。該当するものがあれば(ステップS307のYes)、ウェブページ形式判定知識蓄積部17において対応するウェブページ形式を履歴情報として格納して、処理を終了する(ステップS309)。該当するものが無ければ(ステップS307のNo)、ウェブページ形式は「その他」として出力して(ステップS308)、処理終了になる。
次に、図10について説明する。ウェブ閲覧履歴蓄積部18では、ウェブ閲覧履歴は時系列順に保管され、閲覧者がこれまでにウェブ閲覧を行った際に蓄積された履歴情報を情報として持つことになる。また、他の例としては、各ウェブページの閲覧時間や通産閲覧回数などの情報もウェブ閲覧履歴として含むことができる。例えば、日時「20080101_2130_1」の場合、閲覧者は「URL1.com/PCA/modelX」を閲覧したので、ウェブ閲覧履歴蓄積部18はこの情報とキーワード抽出部12によって得られたウェブページからのキーワード群「ノートパソコンA、ModelX」とウェブ形式「商品ページ」を記録する。
次に、図11について説明する。閲覧目的分類部19は、現在閲覧者が閲覧中のウェブページに対し、その閲覧目的を分類する。この例では、閲覧者の閲覧目的は、ウェブ閲覧履歴蓄積部18に保管されているウェブ閲覧履歴を利用して分類する。利用するウェブ閲覧履歴の範囲については、例えば新しい履歴から時系列順に5件とするという手法や、最新24時間以内の全履歴とするという手法などがある。本実施例の閲覧目的は、ウェブ閲覧履歴におけるウェブページの内容を表すキーワード群から選択した目的キーワードに加え、閲覧者の閲覧目的種別を組み合わせたものとする。目的種別の例として、閲覧者が特定情報を収集している収集モードと、特定情報収集を目的としてない暇つぶしモードの2通りに大別できるとする。これらの状態について、前者を特定目的閲覧、後者を暇つぶし閲覧と定義する。また、特定目的閲覧のうち、特定の対象についての情報を収集している深掘りモード、特定のテーマに対して複数の対象を比較検討する目的で情報を収集している比較検討モードと定義する。本実施例では、閲覧目的分類部19は、これらの4種類の目的種別と、特定目的閲覧の場合はその対象となる目的キーワードとの組み合わせをもって閲覧目的と定義し、分類を行う。
閲覧目的分類には、閲覧目的分類知識蓄積部20において記憶された知識と、オントロジー辞書記憶部21において記憶されたオントロジー辞書を利用する。閲覧種別を分類するための要素の例として、キーワードの共通性、ウェブ閲覧パスの特徴、キーワード間のオントロジーの3点をあげる。キーワードの共通性とは、各ウェブページからキーワード抽出部12によって抽出されたキーワード群に関して、共通して抽出されるキーワードがあるかどうか、また、その度合いなどを利用することを指す。例えば、現在閲覧しているウェブページを含めた最近数件のウェブページについて、抽出されるキーワードに共通性が全くない場合、現在閲覧者に明確な目的がない状態、暇つぶし閲覧であるということが考えられる。それに対し、一貫して抽出されるキーワードが存在する場合では、そのキーワードが目的の対象となるような特定目的閲覧を行っていると考えられる。
また、ウェブ閲覧パスの特徴とは、閲覧者が最近数件のウェブ閲覧履歴において、ウェブページ形式判定部が判定したウェブページ形式を基に、特徴的なウェブページの辿り方をしていることを手がかりとする。例えば、検索結果一覧のウェブページから、各検索結果のウェブページを1つずつ閲覧しているような辿り方をしているような場合では、閲覧者は検索を行った概念について、比較検討という形での調査を行っていると推測できる。これに対し、あるニュース記事や商品を扱うウェブページからページ内リンクを辿ったり、再度検索クエリを変更・追加して検索を行ったりするなどの場合、あるニュース記事や商品という特定の目的に対して更なる追加情報を収集している深掘り閲覧であると推測することができる。
閲覧目的分類知識蓄積部20に格納されている知識の一例を図12に示す。この例では、閲覧のパスのパターンと閲覧されたページから抽出したキーワードによって、閲覧者の目的を分類する。例えば、閲覧者はサイトトップページを閲覧して、そのページの直下にある個別記事ページAを選び、このページからキーワードA、BとCが抽出された。次に、閲覧者は個別記事ページAのページからページの直下にある個別記事ページBを選び、このページからキーワードA、CとFが抽出された。最後に、閲覧者は個別記事ページBのページからページの直下にある個別記事ページCを選び、このページからキーワードA、DとEが抽出された。このとき、三つのページ全てからキーワードAを抽出しているため、この共通しているキーワードAを目的キーワードとして抽出する。同時に、閲覧パスは閲覧しているページの直下の記事を選んで、ずっと一つの道に進んでいる。従って、目的種別は比較検討モードに設定される。但し、もし、図12の下の欄のように、任意の閲覧パスを使って、抽出されたキーワードに共通するものが無い場合、目的種別は暇つぶしモードと分類される。
次に、オントロジー辞書記憶部21に記録されるオントロジー辞書の例を図13に示す。図13のような商品オントロジーを用いると、キーワードの共通性と組み合わせることにより、より詳細な閲覧目的が分類できる。例えば、「ノートパソコン」は共通して抽出されているがその下位概念である各商品名は各ウェブページで異なるものが抽出されていれば、現在閲覧者は「ノートパソコン」に対して「比較検討閲覧」を行っていることが推測でき、目的キーワードをノートパソコン、目的種別を比較検討閲覧とすることができる。
次に、図1のステップS107の詳細について説明する。図14は閲覧目的を分類する処理フローの例を示した図である。まず、閲覧履歴蓄積部18から、最新の過去閲覧履歴5件を取得する(ステップS401)。次に、閲覧履歴のキーワードで共通しているものがあるか否かをチェックする(ステップS402)。共通しているものが無ければ(ステップS402のNo)、閲覧目的を「暇つぶし閲覧」として出力して、処理終了になる(ステップS407)。共通しているものがあれば(ステップS402のYes)、閲覧目的分類知識蓄積部20に、閲覧履歴のウェブページ形式の出現列パターンがあるか否かをチェックする(ステップS403)。出現列パターンがある場合(ステップS403のYes)、対応する閲覧目的を出力して、処理終了になる(ステップS408)。出現列パターンが無い場合(ステップS403のNo)、共通して出現しているキーワードが、オントロジー辞書記憶部21にあるか否かをチェックする(ステップS404)。
キーワードがオントロジー辞書記憶部21にある場合(ステップS404のYes)、対応する閲覧目的を出力して、処理終了になる(ステップS408)。キーワードがオントロジー辞書記憶部21に無い場合(ステップS404のNo)、共通して出現しているキーワード間のオントロジー上の関係が、閲覧履歴分類知識蓄積部20にあるか否かをチェックする(ステップS405)。キーワード間のオントロジー上の関係が閲覧履歴分類知識蓄積部20にある場合(ステップS405のYes)、対応する閲覧目的を出力して、処理終了になる(ステップS408)。キーワード間のオントロジー上の関係が閲覧履歴分類知識蓄積部20に無い場合(ステップS405のNo)、共通して出現しているキーワードとそれ以外のキーワード間の関係が、閲覧履歴分類知識蓄積部20にあるか否かをチェックする(ステップS406)。キーワードとそれ以外のキーワード間の関係が、閲覧履歴分類知識蓄積部20にある場合(ステップS406のYes)、対応する閲覧目的を出力して、処理終了になる(ステップS408)。キーワードとそれ以外のキーワード間の関係が、閲覧目的分類知識蓄積部20に無い場合(ステップS406のNo)、閲覧目的を「暇つぶし閲覧」として出力して、処理終了になる(ステップS407)。
次に、図1のステップS108の詳細について説明する。関連情報検索文生成部22は、閲覧目的分類部19が出力した閲覧目的に基づいて、現在のウェブページ内容と閲覧目的の双方に沿った関連情報を取得するための検索文を生成する。関連情報検索文生成知識蓄積部23は検索文生成のための知識を有する。本実施例では、ウェブページに対して特定の閲覧目的が分類されるため、閲覧目的に合致する関連情報を検索し、収集する。例えば閲覧目的が「ノートパソコンに対して比較検討閲覧」だった場合、まだ閲覧者が閲覧していないノートパソコンの商品紹介をするウェブページや、これまでに閲覧したノートパソコンの商品を含む、性能比較を行っている特集記事のウェブページなどのURLが関連情報として考えられる。また、閲覧目的が「ノートパソコンAに対して深掘り閲覧」だった場合では、ノートパソコンAという商品の購入者が感想や評価などを書いたブログ記事や、商品の画像、ノートパソコンAに対応している付属商品の商品購入ウェブページなどが関連情報の例である。暇つぶし閲覧と分類された場合は、関連情報の一例として、現在閲覧中のウェブページから抽出されたキーワードではなく、これまでの閲覧履歴でより多く抽出されたキーワードについての関連情報を提示するということが考えられる。前記の例を含む関連情報を検索するための、関連情報検索文生成部22が行う検索文生成処理の例としては、閲覧目的の目的キーワードと特定表現の組み合わせにより検索文を生成するという手法や、検索対象のカテゴリを限定する条件の付与を行うという手法、検索文を送信する検索エンジンを変更するという手法などがある。
次に、図1のステップS108の詳細について説明する。図15には、検索文生成処理の処理フローの例を説明する。まず、閲覧目的分類部19は関連情報検索文リストを初期化する(ステップS501)。次に、閲覧目的分類部19は閲覧目的分類知識蓄積部20とオントロジー辞書記憶部21を用いて、閲覧目的の目的種別を調べる(ステップS502)。目的種別ごとに検索文を生成する手法を切り替える。目的種別が「比較検討」の場合、「目的キーワードAND“比較”」の組み合わせを検索文リストに追加して(ステップS503)、検索文リストを出力して(ステップS509)、処理終了になる。目的種別が「深掘り」の場合、「目的キーワードAND“ブログ”AND(購入OR感想OR評価OR使用感)」の組み合わせを検索文リストに追加する(ステップS504)。関連情報検索文生成知識蓄積部23はステップS503やS504にあるような生成手法を記憶しており、処理の際には関連情報検索文生成知識蓄積部23から処理内容を読み出す。次に、閲覧目的分類部19は目的キーワードの意味属性が製品名か否かをチェックする(ステップS505)。目的キーワードの意味属性は製品名の場合(ステップS505のYes)、「目的キーワードAND“周辺機器”」の組み合わせを検索文リストに追加して(ステップS506)、検索文リストを出力して(ステップS509)、処理終了になる。目的キーワードの意味属性は製品名ではない場合(ステップS505のNo)、そのまま検索文リストを出力して(ステップS509)、処理終了になる。目的種別が「暇つぶし」の場合、ウェブ閲覧履歴のキーワード群の中で、出現頻度の高い上位3件を抽出する(ステップS507)。そして、上記3件それぞれ「AND“動画”」を検索文リストに追加する(ステップS508)。次に、関連情報検索文生成部22で検索文リストを出力して、処理終了になる(ステップS509)。
なお、図15では検索文を文字列のみとしているが、検索文を文字列と検索エンジン名の組み合わせにすることもできる。その場合は、閲覧目的によって映像検索エンジンや画像検索エンジンに検索文を送信するように検索文を生成することができる。
次に、ステップS110において、関連情報表示制御部25は関連情報検索部24が受信した関連情報を表示することを説明する。図16は関連情報表示制御部25の表示方法の例を示した図である。図16に示す表示方法は、関連情報が検索された場合、関連情報表示ウィンドウ25aが起動して、関連情報であるウェブページへのリンクを表示する。閲覧者はリンクをクリックすることで、対応するウェブページをウェブブラウザで閲覧することができたり、映像や画像を閲覧することができたりする。この場合、閲覧者の閲覧目的を分類して、関連情報を効率良く取得することができる。
その際に、閲覧目的分類部18が分類した閲覧目的や、関連情報検索文生成部22において作成した検索文の種類に対応して各関連情報の種類名を、関連情報と対応付けて表示する。このことにより、閲覧者は関連情報が推薦された経緯を知ることができ、リンク先にある関連情報の内容についてリンク先を閲覧する前に部分的に知ることができる。これらの閲覧目的や関連情報の種類名を参考に、閲覧者は関連情報を閲覧するかどうかを選択することができる。
なお、もう一つの表示方法の例として、複数の種類の関連情報をタブで区切って一つの関連情報ウィンドウ25bに表示する手法を図17に示す。図17は関連情報表示制御部25の表示方法の例を示した図である。この場合では、図1に示した構成図と同様の構成からなり、全体の動作フローも図2に示したものと同一とする。図2のステップS107では閲覧目的分類部19が閲覧中のウェブページに対する閲覧者の閲覧目的を分類するが、このとき本実施例では特定の閲覧目的、特に目的種別を分類するのではなく、予め定めた目的種別ごとにその確率を求め、順位付けを行う。例えば、現在閲覧中のウェブページに対する閲覧目的として、可能性の高い順に「ノートPCに対する比較検討閲覧」「暇つぶし閲覧」「ModelAに対する深掘り閲覧」が考えられるという、目的キーワードの分類と目的種別の順位付けを行う。ステップS108において、関連情報検索文生成部22は、順位付けされた複数の閲覧目的に対し、それぞれに対応した関連情報を検索するための検索文を生成する。閲覧目的に合った関連情報、及びその関連情報を取得するための検索文生成手法の例については前期の例で示したものと同一である。ステップS109では、関連情報検索部24が、関連情報検索文生成部22によって生成された複数の検索文それぞれについて本実施例構成外のウェブ検索エンジンに送信し、ウェブ検索エンジンからの検索結果を受信する。
ステップS110において、関連情報表示制御部25は関連情報検索部24が受信した関連情報を表示する。図17に示す表示方法では、関連情報と閲覧目的がそれぞれ対応付けられて表示され、閲覧目的と対応したタブを手動で選択することにより、閲覧目的ごとの関連情報表示を切り替えることができる。閲覧目的の表示順は閲覧目的分類部19において行った、閲覧目的の順位付けによって決定することができ、例えば、初期状態として選択されるタブは閲覧目的の順位付けで最も可能性の高いと分類された閲覧目的になる、ということができる。
図18に本発明の第2の実施例を示す。この変形例では図1の実施例と殆ど同じであるが、ウェブ閲覧履歴と対応付けた閲覧目的を蓄積する閲覧目的蓄積部26と閲覧履歴を関連付けて閲覧目的を閲覧者に提示することを制御するウェブ閲覧履歴表示制御部27を追加する。
図19にウェブ閲覧履歴表示制御部27の閲覧履歴、閲覧目的表示方法の例を示す。図19では、閲覧履歴表示制御部27は、各日付に対して閲覧目的でウェブ閲覧履歴をまとめ、閲覧目的を時系列順にウィンドウW1に表示する。閲覧者が閲覧目的をクリックすると、別のウィンドウW2に、その閲覧目的に対応した閲覧履歴がURL形式で表示される。また、ウェブ上での商品注文や電子メール送信など、閲覧以外の行動をとった場合は、別途表示することもできる。
この発明に係るウェブ閲覧目的分類装置の第1の実施の形態を示す構成図。 図1に示したウェブ閲覧目的分類装置の構成における、全体の処理フローの一例を示したフローチャート図。 図2に示した動作フローチャートのステップS101における、ウェブ閲覧目的分類装置の画面イメージを示した図。 図2に示した動作フローチャートのステップS102及びS103における、ウェブ閲覧目的分類装置の動作イメージを示した図。 図2に示した動作フローチャートのステップS104における、キーワード抽出部12の処理フローの例を示したフローチャート図。 図2に示した動作フローチャートのステップS104における、キーワード抽出部12によるキーワード抽出の動作イメージを示した図。 図2に示した動作フローチャートのステップS105における、ウェブページ形式判定部16の動作イメージを示した図。 図2に示した動作フローチャートのステップS105における、ウェブページ形式判定知識蓄積部17が保持する判定知識の例を示した図。 図2に示した動作フローチャートのステップS105における、ウェブページ形式判定部16の処理フローの例を示したフローチャート図。 図2に示した動作フローチャートのステップS106における、閲覧履歴蓄積部18が保持する閲覧履歴の例を示した図。 図2に示した動作フローチャートのステップS107における、閲覧目的分類部19が分類した閲覧目的の例を示した図。 図2に示した動作フローチャートのステップS107における、閲覧目的分類部19が保持する閲覧目的知識の例を示した図。 図2に示した動作フローチャートのステップS107における、オントロジー辞書記憶部21が保持するオントロジーの例を示した図。 図2に示した動作フローチャートのステップS107における、閲覧目的分類部19の処理フローの例を示したフローチャート図。 図2に示した動作フローチャートのステップS108における、関連情報検索文生成部22の処理フローの例を示したフローチャート図。 図1に示した関連情報表示制御部25による関連情報の表示手法の例を示す図。 図1に示した関連情報表示制御部25による関連情報の表示手法の例を示す図。 この発明に係るウェブ閲覧目的分類装置の第1の実施の形態の第2の変形例を示す構成図。 図16に示したウェブ閲覧履歴表示制御部27の表示手法の例を示す図。
符号の説明
10 表示部
11 文書読出部
12 キーワード抽出部
13 形態素解析部
14 意味属性解析部
15 キーワード抽出知識蓄積部
16 ウェブページ形式判定部
17 ウェブページ形式判定知識蓄積部
18 ウェブ閲覧履歴蓄積部
19 閲覧目的分類部
20 閲覧目的分類知識蓄積部
21 オントロジー辞書記憶部
22 関連情報検索文生成部
23 関連情報検索文生成知識蓄積部
24 関連情報検索部
25 関連情報表示制御部
26 閲覧目的蓄積部
27 ウェブ閲覧履歴表示制御部
31 文書データ記憶部

Claims (9)

  1. ウェブページを表示する表示部と、
    前記ウェブページから文書データを読み出す文書読出部と、
    キーワード抽出のための知識を蓄積するキーワード抽出知識蓄積部と、
    前記キーワード抽出のための知識を用いて、文書データからキーワードを抽出するキーワード抽出部と、
    ウェブページ形式判定のための知識を蓄積するウェブページ形式判定知識蓄積部と、
    ウェブページ形式判定のための知識を用いて、ウェブページ形式を判定するウェブページ形式判定部と、
    前記キーワードと前記ウェブページ形式をウェブ閲覧履歴として蓄積するウェブ閲覧履歴蓄積部と、
    閲覧のパスのパターンと閲覧されたページから抽出したキーワードによって、閲覧者の目的を分類するための閲覧目的分類知識を蓄積する閲覧目的分類知識蓄積部と、
    前記ウェブ閲覧履歴及び前記閲覧目的分類知識を基に、前記閲覧者の閲覧目的を分類する閲覧目的分類部とを持つことを特徴とするウェブ閲覧目的分類装置。
  2. ウェブページから抽出したキーワード間の意味関係を判定するためのオントロジー辞書を更に具備することを特徴とする請求項1記載のウェブ閲覧目的分類装置。
  3. 前記キーワード抽出部は、文書データを形態素に分割する形態素解析部と文書データの部分文字列についてその意味属性を取得する意味属性解析部の少なくともいずれか一つを持つことを特徴とする請求項1乃至2記載のウェブ閲覧目的分類装置。
  4. 前記閲覧目的分類部は、ウェブ閲覧履歴情報に共通しているキーワードを前記閲覧目的の対象物を指す目的キーワードとして抽出することを特徴とする請求項1乃至3記載のウェブ閲覧目的分類装置。
  5. 前記閲覧目的は、前記閲覧者が特定情報を収集している収集モードと、特定情報収集を目的としてない暇つぶしモードの2種類の状態を含むことを特徴とする請求項1乃至4記載のウェブ閲覧目的分類装置。
  6. 前記収集モードは、特定の対象について更なる別の情報を収集している深堀りモードと、あるテーマについて複数の対象を比較検討する目的で情報を収集している比較検討モードの2種類の状態を含むことを特徴とする請求項5記載のウェブ閲覧目的分類装置。
  7. 前記ウェブ閲覧履歴蓄積部は前記ウェブ閲覧履歴として、閲覧したウェブページのURLをさらに蓄積し、
    前記目的キーワードと前記閲覧目的を前記ウェブ閲覧履歴と対応付けて蓄積する閲覧目的蓄積部と、
    少なくとも前記閲覧したウェブページのURLを前記目的キーワードと前記閲覧目的とに対応付けて前記表示部に表示させる閲覧履歴表示制御部とを更に具備することを特徴とする請求項記載のウェブ閲覧目的分類装置。
  8. 前記閲覧目的毎に関連情報検索文を生成するための知識を蓄積する関連情報検索文生成知識蓄積部と、
    前記関連情報検索文を生成するための知識を用いて、関連情報を検索するための検索文を生成する関連情報検索文生成部と、
    検索文を用いて関連情報を検索する関連情報検索部と、
    検索結果の関連情報を前記表示部に表示させる関連情報表示制御部を更に具備することを特徴とする請求項記載のウェブ閲覧目的分類装置。
  9. 表示部が、ウェブページを表示し、
    文書読出部が、表示されたウェブページから文書データを読み出し、
    キーワード抽出部が、キーワード抽出知識蓄積部に蓄積した知識を利用して、文書データから少なくとも1つ以上のキーワードを抽出し、
    ウェブページ形式判定部が、ウェブページ形式判定知識蓄積部に蓄積した知識を利用して、ウェブページの形式を判定し、
    ウェブ閲覧履歴蓄積部が、キーワードとウェブページの形式をウェブ閲覧履歴として蓄積し、
    閲覧目的分類知識蓄積部が、閲覧のパスのパターンと閲覧されたページから抽出したキーワードによって、閲覧者の目的を分類するための閲覧目的分類知識を蓄積し、
    閲覧目的分類部が、前記ウェブ閲覧履歴及び前記閲覧目的分類知識を基に、前記閲覧者の閲覧目的を分類することを特徴とするウェブ閲覧目的分類方法。
JP2008255609A 2008-09-30 2008-09-30 ウェブ閲覧目的分類装置、ウェブ閲覧目的分類方法、及びウェブ閲覧目的分類プログラム Expired - Fee Related JP5238437B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008255609A JP5238437B2 (ja) 2008-09-30 2008-09-30 ウェブ閲覧目的分類装置、ウェブ閲覧目的分類方法、及びウェブ閲覧目的分類プログラム
US12/554,188 US9189562B2 (en) 2008-09-30 2009-09-04 Apparatus, method and program product for classifying web browsing purposes

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008255609A JP5238437B2 (ja) 2008-09-30 2008-09-30 ウェブ閲覧目的分類装置、ウェブ閲覧目的分類方法、及びウェブ閲覧目的分類プログラム

Publications (2)

Publication Number Publication Date
JP2010086343A JP2010086343A (ja) 2010-04-15
JP5238437B2 true JP5238437B2 (ja) 2013-07-17

Family

ID=42058652

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008255609A Expired - Fee Related JP5238437B2 (ja) 2008-09-30 2008-09-30 ウェブ閲覧目的分類装置、ウェブ閲覧目的分類方法、及びウェブ閲覧目的分類プログラム

Country Status (2)

Country Link
US (1) US9189562B2 (ja)
JP (1) JP5238437B2 (ja)

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8731954B2 (en) 2006-03-27 2014-05-20 A-Life Medical, Llc Auditing the coding and abstracting of documents
US7908552B2 (en) 2007-04-13 2011-03-15 A-Life Medical Inc. Mere-parsing with boundary and semantic driven scoping
US8682823B2 (en) 2007-04-13 2014-03-25 A-Life Medical, Llc Multi-magnitudinal vectors with resolution based on source vector features
US9946846B2 (en) 2007-08-03 2018-04-17 A-Life Medical, Llc Visualizing the documentation and coding of surgical procedures
US8577887B2 (en) * 2009-12-16 2013-11-05 Hewlett-Packard Development Company, L.P. Content grouping systems and methods
KR20110071623A (ko) * 2009-12-21 2011-06-29 한국전자통신연구원 장소 사회적 기반 자동 카테고리 이용한 정보 검색 장치 및 그 방법
US8832101B2 (en) * 2010-02-18 2014-09-09 Yahoo! Inc. Automated user behavior feedback system for whole page search success optimization
CN102253936B (zh) * 2010-05-18 2013-07-24 阿里巴巴集团控股有限公司 记录用户访问商品信息的方法及搜索方法和服务器
CN102314450B (zh) * 2010-06-30 2014-11-26 国际商业机器公司 用于增强网页浏览的方法和设备
JP5256263B2 (ja) * 2010-08-31 2013-08-07 東芝テック株式会社 情報処理装置、情報処理システムおよびプログラム
US9129009B2 (en) * 2010-11-03 2015-09-08 Google Inc. Related links
US8918331B2 (en) * 2010-12-21 2014-12-23 Yahoo ! Inc. Time-triggered advertisement replacement
US20120290622A1 (en) * 2011-05-11 2012-11-15 Searchviews LLC Sentiment and factor-based analysis in contextually-relevant user-generated data management
JP5092038B1 (ja) * 2011-05-18 2012-12-05 株式会社東芝 情報処理装置の情報処理方法、情報処理装置およびプログラム。
US9613135B2 (en) * 2011-09-23 2017-04-04 Aol Advertising Inc. Systems and methods for contextual analysis and segmentation of information objects
US8793252B2 (en) * 2011-09-23 2014-07-29 Aol Advertising Inc. Systems and methods for contextual analysis and segmentation using dynamically-derived topics
JP5559352B2 (ja) * 2012-05-31 2014-07-23 株式会社東芝 知見抽出装置、知見更新装置、及びプログラム
CN103577490A (zh) * 2012-08-08 2014-02-12 百度在线网络技术(北京)有限公司 一种网页浏览历史展现方法及装置
CN103678320B (zh) * 2012-09-03 2017-10-27 腾讯科技(深圳)有限公司 网络信息的挖掘方法和装置
WO2015035193A1 (en) 2013-09-05 2015-03-12 A-Life Medical, Llc Automated clinical indicator recognition with natural language processing
US10133727B2 (en) 2013-10-01 2018-11-20 A-Life Medical, Llc Ontologically driven procedure coding
KR101529120B1 (ko) * 2013-12-30 2015-06-29 주식회사 케이티 바이오 문헌 정보의 마이닝을 위한 마이닝 패턴 생성 방법 및 시스템
CN103870553B (zh) * 2014-03-03 2018-07-10 百度在线网络技术(北京)有限公司 一种输入资源推送方法及系统
KR102244298B1 (ko) * 2014-04-30 2021-04-23 삼성전자주식회사 의미를 기반으로 웹 페이지 접근 기록을 구조화하는 장치 및 방법
US10162473B2 (en) * 2014-06-17 2018-12-25 Lenovo (Singapore) Pte. Ltd. Integrating browser navigation between multiple browsing contexts
JP6707316B2 (ja) * 2014-08-29 2020-06-10 カシオ計算機株式会社 文書表示装置及びプログラム
CN104573097B (zh) * 2015-01-30 2018-07-24 湖南蚁坊软件有限公司 一种提取网页正文的方法
CN105095440B (zh) * 2015-07-23 2019-02-12 百度在线网络技术(北京)有限公司 一种搜索推荐方法及装置
CN107577592B (zh) * 2016-07-04 2024-04-19 北京奇虎科技有限公司 网页元素的定位方法及装置
CN108319613A (zh) * 2017-01-18 2018-07-24 阿里巴巴集团控股有限公司 一种网页信息归类的方法及设备
US10482149B2 (en) 2017-03-09 2019-11-19 Wipro Limited Method and system for classification of web browsing history
CN107463616B (zh) * 2017-07-03 2020-04-10 上海凡响网络科技有限公司 一种企业信息分析方法及系统
CN109710874A (zh) * 2018-11-09 2019-05-03 深圳壹账通智能科技有限公司 页面数据的处理方法及装置、存储介质、计算机设备
IT202000005716A1 (it) * 2020-03-18 2021-09-18 Mediavoice S R L Metodo di navigazione di una risorsa mediante interazione vocale
CN112417329A (zh) * 2020-10-19 2021-02-26 中国互联网金融协会 监测非法互联网外汇保证金交易平台的方法及装置
CN117131301B (zh) * 2023-10-24 2024-01-05 苏州阿基米德网络科技有限公司 一种医疗设备文档的网页端浏览方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6356898B2 (en) * 1998-08-31 2002-03-12 International Business Machines Corporation Method and system for summarizing topics of documents browsed by a user
US6839680B1 (en) 1999-09-30 2005-01-04 Fujitsu Limited Internet profiling
US7017110B1 (en) * 2000-03-31 2006-03-21 Xerox Corporation System and method for inferring user information need in hypermedia linked document collection
US20020091836A1 (en) * 2000-06-24 2002-07-11 Moetteli John Brent Browsing method for focusing research
US7043535B2 (en) * 2001-03-30 2006-05-09 Xerox Corporation Systems and methods for combined browsing and searching in a document collection based on information scent
GB0314782D0 (en) * 2003-06-25 2003-07-30 Ibm A searchable personal browsing history
US7958115B2 (en) * 2004-07-29 2011-06-07 Yahoo! Inc. Search systems and methods using in-line contextual queries
US20060080321A1 (en) * 2004-09-22 2006-04-13 Whenu.Com, Inc. System and method for processing requests for contextual information
JP2006235875A (ja) * 2005-02-23 2006-09-07 Nippon Telegr & Teleph Corp <Ntt> 情報ナビゲーション方法及び装置及びプログラム
US8510282B2 (en) * 2008-03-24 2013-08-13 Chigurupati Murali Thread-based web browsing history

Also Published As

Publication number Publication date
US20100082673A1 (en) 2010-04-01
JP2010086343A (ja) 2010-04-15
US9189562B2 (en) 2015-11-17

Similar Documents

Publication Publication Date Title
JP5238437B2 (ja) ウェブ閲覧目的分類装置、ウェブ閲覧目的分類方法、及びウェブ閲覧目的分類プログラム
US8812505B2 (en) Method for recommending best information in real time by appropriately obtaining gist of web page and user&#39;s preference
US7739221B2 (en) Visual and multi-dimensional search
US8219577B2 (en) Apparatus and method product for presenting recommended information
JP5168961B2 (ja) 最新評判情報通知プログラム、記録媒体、装置及び方法
US20090144240A1 (en) Method and systems for using community bookmark data to supplement internet search results
KR101100830B1 (ko) 인터넷을 활용한 개체 검색과 이를 위한 하이브리드 기반의 의견분석 시스템 및 그 방법
US20080086555A1 (en) System and Method for Search and Web Spam Filtering
US20110167053A1 (en) Visual and multi-dimensional search
CN107577759A (zh) 用户评论自动推荐方法
WO2007085528A1 (en) Knowledge management system, program product and method
JP2007334502A (ja) 検索装置、方法およびプログラム
KR101011726B1 (ko) 스니펫 제공 장치 및 방법
KR101074820B1 (ko) 인터넷을 활용한 추천 검색 시스템 및 그 방법
KR20120003834A (ko) 인터넷을 활용한 개체 검색과 이를 위한 하이브리드 기반의 의견분석 시스템 및 그 방법
JP6960253B2 (ja) 商品等評価装置、商品等評価方法、およびプログラム
JP4853915B2 (ja) 検索システム
JP6960553B2 (ja) ブランド辞書作成装置、商品等評価装置、ブランド辞書作成方法及びプログラム
JP2020057188A (ja) 提供装置、提供方法及び提供プログラム
JP5661708B2 (ja) 広告入札システム、文書検索システム、広告入札方法、文書検索方法、及びプログラム
JP5844887B2 (ja) 通信ネットワークを通じたビデオ・コンテンツ検索のための支援
KR101083669B1 (ko) 인터넷을 활용한 전문가 웹사이트 검색시스템 및 그 방법
Islam Representative Image Extraction from Web page
US20210295371A1 (en) Advanced search engine for business
JP6964445B2 (ja) ブランド辞書作成装置、ブランド辞書作成方法、およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110318

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20111125

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20111205

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20121025

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121109

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130108

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130308

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130401

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160405

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees