JP2015212947A - ウェブページアクセスのための装置及び方法 - Google Patents

ウェブページアクセスのための装置及び方法 Download PDF

Info

Publication number
JP2015212947A
JP2015212947A JP2015092601A JP2015092601A JP2015212947A JP 2015212947 A JP2015212947 A JP 2015212947A JP 2015092601 A JP2015092601 A JP 2015092601A JP 2015092601 A JP2015092601 A JP 2015092601A JP 2015212947 A JP2015212947 A JP 2015212947A
Authority
JP
Japan
Prior art keywords
web page
topic
access record
summary graph
page access
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015092601A
Other languages
English (en)
Other versions
JP6611458B2 (ja
Inventor
錫 津 洪
Seok Jin Hong
錫 津 洪
景 久 禹
Kyoung-Gu Woo
景 久 禹
堯 韓 盧
Yo Han Roh
堯 韓 盧
尚 賢 柳
Sang Hyun Yoo
尚 賢 柳
知 ▲ひょん▼ 李
Ji-Hyun Lee
知 ▲ひょん▼ 李
昊 潼 李
Ho Dong Lee
昊 潼 李
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2015212947A publication Critical patent/JP2015212947A/ja
Application granted granted Critical
Publication of JP6611458B2 publication Critical patent/JP6611458B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/254Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • G06F16/84Mapping; Conversion
    • G06F16/86Mapping to a database
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/954Navigation, e.g. using categorised browsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • G06F16/9566URL specific, e.g. using aliases, detecting broken or misspelled links
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Remote Sensing (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

【課題】 ウェブページアクセスのための装置及び方法と、ウェブページアクセス記録を構造化する装置及び方法と、を提供する。【解決手段】 本発明の一態様によるウェブページアクセス記録構造化装置は、ユーザがアクセスしたウェブページを分析して、ウェブページと関連した少なくとも1つのトピックを抽出するトピック抽出部と、抽出された少なくとも1つのトピックをオントロジー基盤のデータ構造のノードにマッピングするマッピング部と、マッピングされたノードを含むサブグラフをオントロジー基盤のデータ構造から抽出し、該抽出されたサブグラフに基づいて要約グラフを生成する要約グラフ生成部と、を含む。【選択図】 図1

Description

本発明は、ユーザがアクセス記録に基づいてウェブページにアクセスすることを許諾する装置及び方法と、ウェブページアクセス記録を構造化する装置及び方法と、に関する。
最近、携帯用スマート機器の幅広い普及につれて、誰でも携帯用スマート機器を用いていつでもどこでも所望の情報を容易に検索可能になった。
携帯用スマート機器ユーザは、携帯用スマート機器に設けられたウェブブラウザーを通じて、多様な類型の情報が入れられたウェブページを自在に探索する。ユーザが、ウェブページを探索する時、ウェブページに含まれた情報は、ユーザの頭に記憶されるが、多くのウェブページを探索するか、探索後に長時間が経過した場合、人の記憶の限界によって、ユーザは、習得した情報やアクセスしたウェブページを忘れてしまう。
このような記憶の揮発性を補完するために、ユーザは、情報検索途中で必要な内容をメモし、過去に習得した知識やアクセスしたウェブページ情報に対する記憶を復元するために、ウェブ探索ヒストリーなどを検索する。しかし、このような方法は、情報を整理するための努力が必要であるか、整理されていない記録から必要な情報を復元しなければならない煩わしさがある。
本発明は、ウェブページアクセスのための装置及び方法を提供することである。
本発明の一態様によるウェブページアクセス記録構造化装置は、ユーザがアクセスしたウェブページを分析して、ウェブページと関連した少なくとも1つのトピックを抽出するトピック抽出部と、抽出された少なくとも1つのトピックをオントロジー基盤のデータ構造のノードにマッピングするマッピング部と、マッピングされたノードを含むサブグラフを前記オントロジー基盤のデータ構造から抽出し、該抽出されたサブグラフに基づいて要約グラフを生成する要約グラフ生成部と、を含みうる。
トピック抽出部は、トピックワード接近法(Topic word approach)、語彙連鎖接近法(Lexical chain approach)、潜在意味分析(LSA:Latent Semantic Analysis)、確率的潜在意味分析(PLSA:Probabilistic Latent Semantic Analysis)、及びFull blown Bayesian topic modelsのうち少なくとも1つを用いてウェブページから少なくとも1つのトピックを抽出することができる。
オントロジー基盤のデータ構造は、前記装置の外部にあらかじめ構築されたオントロジーモデルに基づくことができる。
要約グラフ生成部は、各トピックが抽出されたウェブページにアクセスするための情報を、前記各トピックがマッピングされたサブグラフの当該ノードにそれぞれ保存して、要約グラフを生成することができる。
ウェブページにアクセスするための情報は、URL(Uniform Resource Locators)、URN(Uniform Resource Name)、及びURLまたはURNに連結されるようにハイパーリンクされたウェブページのサムネイルイメージのうち少なくとも1つを含みうる。
ウェブページアクセス記録構造化装置は、要約グラフがセッション単位で生成されるように、ウェブページをセッション単位で管理するセッション管理部をさらに含みうる。
ウェブページアクセス記録構造化装置は、ウェブページのアクセス記録を収集するアクセス記録収集部をさらに含みうる。
ウェブページアクセス記録構造化装置は、複数の要約グラフを統合して統合要約グラフを生成する要約グラフ統合部をさらに含みうる。
本発明の他の態様によるウェブページアクセス情報構造化方法は、ユーザがアクセスしたウェブページを分析して、ウェブページから少なくとも1つのトピックを抽出する段階と、抽出された少なくとも1つのトピックをオントロジー基盤のデータ構造のノードにマッピングする段階と、マッピングされたノードを含むサブグラフをオントロジー基盤のデータ構造から抽出する段階と、抽出されたサブグラフに基づいて要約グラフを生成する段階と、を含みうる。
ウェブページから少なくとも1つのトピックを抽出する段階は、トピックワード接近法、語彙連鎖接近法、潜在意味分析(LSA)、確率的潜在意味分析(PLSA)、及びFullblown Bayesian topic modelsのうち少なくとも1つを用いてウェブページから少なくとも1つのトピックを抽出することができる。
要約グラフを生成する段階は、ウェブページにアクセスするための情報を前記サブグラフのノードに保存して要約グラフを生成することができる。
ウェブページにアクセスするための情報は、URL、URN、及びURLまたはURNに連結されるようにハイパーリンクされたウェブページのサムネイルイメージのうち少なくとも1つを含みうる。
ウェブページアクセス記録構造化方法は、ウェブページから少なくとも1つのトピックを抽出する段階以前に、ウェブページのアクセス記録を収集する段階をさらに含みうる。
ウェブページアクセス記録構造化方法は、要約グラフを生成する段階以後に、生成された要約グラフを他の要約グラフと統合する段階をさらに含みうる。
本発明のさらに他の態様によるウェブページアクセス記録構造化装置は、ユーザがアクセスした少なくとも1つのウェブページから少なくとも1つのトピックを抽出するトピック抽出部と、抽出された少なくとも1つのトピック間の意味関係を分析する意味関係分析部と、意味関係に基づいて要約グラフを生成する要約グラフ生成部と、を含みうる。
トピック抽出部は、トピックワード接近法、語彙連鎖接近法、潜在意味分析(LSA)、確率的潜在意味分析(PLSA)、及びFull blown Bayesian topic modelsのうち少なくとも1つを用いてウェブページ別トピックを抽出することができる。
意味関係分析部は、あらかじめ構築されたオントロジーモデルに基づいてトピック間の意味関係を分析することができる。
要約グラフ生成部は、分析されたトピック間の意味関係に基づいて、各トピックはノードに対応させ、トピック間の意味関係は、そのトピックに対応するノードを連結するエッジに対応させて、意味関係グラフを生成し、各トピックが抽出されたウェブページにアクセスするための情報を、各トピックに対応する意味関係グラフの当該ノードに保存して要約グラフを生成することができる。
ウェブページにアクセスするための情報は、URL、URN、及びURLまたはURNに連結されるようにハイパーリンクされたウェブページのサムネイルイメージのうち少なくとも1つを含みうる。
ウェブページアクセス記録構造化装置は、要約グラフがセッション単位で生成されるように、少なくとも1つのウェブページをセッション単位で管理するセッション管理部をさらに含みうる。
ウェブページアクセス記録構造化装置は、少なくとも1つのウェブページのアクセス記録を収集するアクセス記録収集部をさらに含みうる。
ウェブページアクセス記録構造化装置は、複数の要約グラフを統合して統合要約グラフを生成する要約グラフ統合部をさらに含みうる。
本発明のさらに他の態様によるウェブページアクセスのための装置は、ブラウザーを通じてアクセスしたウェブページからトピックを抽出するトピック抽出部と、トピックをオントロジー基盤のデータ構造にマッピングするマッピング部と、ウェブページにアクセスするための情報としてデータ構造をアップデートするデータ構造アップデートプロセッサと、を含みうる。
データ構造アップデートプロセッサは、データ構造にマッピングされたトピックを含むデータ構造の部分に基づいてウェブページにアクセスするための情報を保存する要約グラフを生成する要約グラフ生成部を含み、この際、データ構造は、メモリに保存することができる。
ウェブページアクセスのための装置は、ウェブページアクセス記録を検索するために、ディスプレイスクリーン上にユーザインターフェースを提供するアクセス記録検索プロセッサをさらに含みうる。
アクセス記録検索プロセッサは、ユーザが時間間隔を設定し、前記ウェブページと関連した1つ以上のトピックに基づいてウェブページを選択することを許諾することができる。
ウェブページアクセス記録構造化装置の一実施形態を示すブロック図である。 ユーザがアクセスしたウェブサイトからトピックを抽出する方法の例を示す図面である。 抽出されたトピックをオントロジーのノードにマッピングする方法の例を示す図面である。 データ構造からサブグラフを抽出し、要約グラフを生成する方法の例を示す図面である。 要約グラフが表示されるユーザインターフェース画面の例を示す図面である。 ウェブページアクセス記録構造化装置の他の実施形態を示すブロック図である。 ウェブページアクセス記録構造化装置のさらに他の実施形態を示すブロック図である。 ウェブページアクセス記録構造化装置のさらに他の実施形態を示すブロック図である。 ウェブページアクセス記録構造化方法の一実施形態を示すフローチャートである。 ウェブページアクセス記録構造化方法の他の実施形態を示すフローチャートである。 ウェブページアクセス記録構造化装置の他の実施形態を示すブロック図である。 他の記載がない限り、図面及び詳細な説明の全般に亘って、同じ参照番号は、同じ構成要素、特徴、及び構造を参照するものと理解される。図面は、拡大されないこともあり、図面の構成要素の相対的な大きさ、比率、及び描写は、明確性、便宜性のために誇張して表現される。
以降の詳細な説明は、本明細書に記載の方法、装置、及び/またはシステムの包括的な理解を助けるために提供される。しかし、本明細書に記載の方法、装置、及び/またはシステムの多様な変更、修正及び均等物は、当業者に明白である。説明された処理段階及び/または動作の進行は、一例に過ぎず、動作の順序は、本明細書に記載の例に限定されず、特定の順序で必然的に発生する段階及び/または動作を除いては変更されうる。また、当業者に公知の機能及び構造についての説明は、本発明の要旨を不明にするおそれがあるので、省略されうる。
本明細書に説明された特徴は、多様な形態として具現され、本明細書に記載の例に限定されるものと解釈されてはならない。
オントロジーは、ある関心の対象となる分野の概念化を行うために、明示的であり、定型化した詳細内訳(an explicit and formal specification)である。オントロジーは、あるエレメントをその属性や関係を使用して定義することによって、そのエレメントに関する知識を保存する。例えば、“男子は人である”という知識がある時に、“男子”、“人”は、一般的な概念としてクラスと言うが、“男子”クラスは、“人”クラスに含まれる概念である。したがって、2つのクラスは、さらに広いクラスと狭いクラスとの間の階層を表現する関係属性と説明される。このような関係属性を“isA”と表現する。また、このような包含関係は、多様な階層で形成されうる。
属性は、さまざまな形態があるが、例えば、“運動をすれば元気になる”という知識があれば、“運動”と“健康”との間には、因果関係があるものであり、これを通常“cause”と言う。例えば、“夏は暑い”のようなある概念がある特性を有する場合には、“夏”と“暑い”は、“hasProperty”という関係属性と関連付けられる。関係属性は、定められたものではなく、作成者が、当該オントロジーモデルの目的に合わせて定義することができる。
オントロジーは、オントロジーモデルに基づいたデータ構造の構築に適用可能である。例えば、データ構造は、方向性があるグラフ構造(directed grapgh structure)であって、複数のノード及びエッジで構成することができる。ここで、ノードは、クラスに、エッジはクラス間の関係属性に、それぞれ対応する。
一方、ウェブページは、インターネット上にあるそれぞれの文書を言い、本明細書でウェブページとページは、同じ意味として使われ、混用されうる。
図1は、ウェブページアクセス記録構造化装置の一実施形態を示すブロック図である。
本発明の一実施形態によるウェブページアクセス記録構造化装置100は、ユーザがアクセスしたウェブページを意味(semantics)に基づいて要約し、構造化するように構成されている。ウェブページアクセス記録構造化装置100は、固定端末または移動端末として具現可能である。しかし、これらに限定されるものではなく、ウェブページアクセス記録構造化装置100が、別個の装置として具現されて、固定端末または移動端末に搭載されることも可能である。
ここで、固定端末は、デジタルTV、スマートTV、デスクトップコンピュータなどを含み、移動端末は、携帯電話、スマートフォン、タブレットPC、ラップトップコンピュータ、デジタル放送用端末機、PDA(Personal Digital Assistant)、PMP(Portable MultimediaPlayer)、ナビゲーションなどを含みうる。
図1を参照すれば、本発明の一実施形態によるウェブページアクセス記録構造化装置100は、トピック抽出部110、マッピング部120、及び要約グラフ生成部130を含みうる。トピック抽出部110、マッピング部120、及び要約グラフ生成部130は、1つ以上のプロセッサとして具現可能である。
トピック抽出部110は、ウェブブラウザーを通じてユーザがアクセスしたウェブページを分析して、ページ別に少なくとも1つのトピックを抽出することができる。
例えば、トピック抽出部110は、ウェブページに含まれたテキストデータを構文分析(syntactic analysis)し、その結果、抽出された名詞をトピックとして抽出することができる。
他の例を挙げれば、トピック抽出部110は、ウェブページから出現頻度が高い単語をトピックとして抽出することができる。
このために、トピック抽出部110は、トピックワード接近法、語彙連鎖接近法、潜在意味分析(LSA)、確率的潜在意味分析(PLSA)、Full blown Bayesian topic modelsなどを利用することができるが、これらに限定されるものではなく、文書からトピックを抽出するための多様なトピック抽出アルゴリズムを利用できる。
マッピング部120は、概念の階層構造で構成されたオントロジーモデルに基づいたデータ構造のノードに対して、トピック抽出部110から抽出したトピックをマッピングすることができる。データ構造は、非一時的なコンピュータメモリに保存することができる。
例えば、トピック抽出部110が、ウェブページ1では、“キャンピング用品”を、ウェブページ2では、“キャンピング用品”、“寝袋”、及び“テント”をトピックとして抽出した場合、マッピング部120は、“キャンピング用品”クラスに対応するオントロジーノードには、“キャンピング用品”トピックを、“寝袋”クラスに対応するオントロジーノードには、“寝袋”トピックを、“テント”クラスに対応するオントロジーノードには、“テント”トピックを、それぞれマッピングすることができる。
この際、オントロジー基盤のデータ構造は、ウェブページアクセス記録構造化装置100の外部サーバにあらかじめ構築されており、ウェブページアクセス記録構造化装置100の内部にあらかじめ構築されていることもある。データ構造は、ウェブページアクセス記録構造化装置100の外部から生成されたオントロジーモデルに基づくことができる。
要約グラフ生成部130は、各トピックがマッピングされたノードを含むサブグラフをオントロジーモデルに基づいたデータ構造から抽出し、該抽出されたサブグラフに基づいて要約グラフを生成することができる。
前述したように、オントロジー基盤のデータ構造は、方向性があるグラフ構造であって、複数のノードで構成されるので、要約グラフ生成部130は、各トピックがマッピングされたノードを含むサブグラフをデータ構造から抽出することができる。
また、要約グラフ生成部130は、各トピックが抽出されたウェブページにアクセス可能な情報をサブグラフの当該ノードにそれぞれ保存して、要約グラフを生成することができる。
例えば、前記の例で、ウェブページ1のトピックは、“キャンピング用品”であり、ウェブページ2のトピックは、“キャンピング用品”、“寝袋”、及び“テント”である場合、要約グラフ生成部130は、“キャンピング用品”トピックがマッピングされたノード(以下、キャンピング用品ノード)、“寝袋”トピックがマッピングされたノード(以下、寝袋ノード)、及び“テント”トピックがマッピングされたノード(以下、テントノード)を含むサブグラフをオントロジー基盤のデータ構造から抽出する。その後、要約グラフ生成部130は、サブグラフのキャンピング用品ノードには、“キャンピング用品”トピックが抽出されたウェブページ1及びウェブページ2にアクセス可能な情報を保存し、サブグラフの寝袋ノードには、“寝袋”トピックが抽出されたウェブページ2にアクセス可能な情報を保存し、サブグラフのテントノードには、“テント”トピックが抽出されたウェブページ2にアクセス可能な情報をそれぞれ保存することによって、要約グラフを生成する。
ここで、ウェブページにアクセス可能な情報は、URL、URN、URLまたはURNに連結されるようにハイパーリンクされたウェブページのサムネイルイメージなどを含みうるが、これらに限定されるものではない。
図2Aないし図2Cは、ウェブページアクセス記録構造化方法を説明する図面である。例えば、図2Aは、ユーザがアクセスしたウェブサイトからトピックを抽出する方法の例を示す図面であり、図2Bは、抽出されたトピックをオントロジーモデルに基づいたデータ構造のノードにマッピングする方法の例を示す図面であり、図2Cは、オントロジーモデルに基づいたデータ構造からサブグラフを抽出し、要約グラフを生成する例を示す図面である。
図2Aを参照すれば、ユーザが、ウェブブラウザーを用いて6つのウェブページ211〜216を順次にアクセスすれば、トピック抽出部110は、ユーザがアクセスしたウェブページ211〜216を分析して、各ページのトピック220を抽出する。
図2Aに示された例のように、トピック抽出部110は、ウェブページ1(211)を分析してトピック1を、ウェブページ2(212)を分析してトピック1、トピック2及びトピック3を、ウェブページ3(213)を分析してトピック4を、ウェブページ4(214)を分析してトピック5、トピック6、トピック7及びトピック8を、ウェブページ5(215)を分析してトピック5及びトピック6を、ウェブページ6(216)を分析してトピック6を抽出する。
この際、トピック抽出部110は、前述したように、トピックワード接近法、語彙連鎖接近法、潜在意味分析、確率的潜在意味分析、Full blown Bayesiantopic modelsなど多様なトピック抽出アルゴリズムを用いて、各ページからトピックを抽出することができる。しかし、これらに限定されるものではない。
図2Bを参照すれば、マッピング部120は、トピック抽出部110によって抽出されたトピック220を各トピックに対応するオントロジーに基づいたデータ構造230のノードにそれぞれマッピングする。データ構造230は、非一時的なコンピュータメモリに保存することができる。
この際、データ構造230は、方向性があるグラフ構造であって、クラスに対応するノード及びクラス間の関係属性に対応するエッジで構成される。データ構造230は、ウェブページアクセス記録構造化装置100の外部にあらかじめ構築されていることもあり、ウェブページアクセス記録構造化装置100の内部にあらかじめ構築されていることもある。
図2Cを参照すれば、要約グラフ生成部130は、トピックがマッピングされたノードを含むサブグラフ240をデータ構造230から抽出し、各トピックが抽出されたウェブページにアクセス可能な情報を抽出されたサブグラフ240の当該ノードにそれぞれ保存して、要約グラフ250を生成する。
図2Aないし図2Cに示された例で、要約グラフ生成部130は、データ構造230でトピック1がマッピングされたノード241、トピック2がマッピングされたノード242、トピック3がマッピングされたノード243、トピック4がマッピングされたノード244、トピック5がマッピングされたノード245、トピック6がマッピングされたノード246、トピック7がマッピングされたノード247、及びトピック8がマッピングされたノード248を含むサブグラフ240を抽出する。この際、サブグラフ240は、データ構造230と同様に、各トピックがマッピングされたノード230及び各トピック間の関係属性を表わすエッジで構成することができる。
また、要約グラフ生成部130は、トピック1がマッピングされたノード241には、トピック1が抽出されたウェブページ1(211)及びウェブページ2(212)にアクセス可能な情報を、トピック2がマッピングされたノード242には、トピック2が抽出されたウェブページ2(212)にアクセス可能な情報を、トピック3がマッピングされたノード243には、トピック3が抽出されたウェブページ2(212)にアクセス可能な情報を、トピック4がマッピングされたノード244には、トピック4が抽出されたウェブページ3(213)にアクセス可能な情報を、トピック5がマッピングされたノード245には、トピック5が抽出されたウェブページ4(214)及びウェブページ5(215)にアクセス可能な情報を、トピック6がマッピングされたノード246には、トピック6が抽出されたウェブページ4(214)、ウェブページ5(215)及びウェブページ6(216)にアクセス可能な情報を、トピック7がマッピングされたノード(247)には、トピック7が抽出されたウェブページ4(214)にアクセス可能な情報を、トピック8がマッピングされたノード248には、トピック8が抽出されたウェブページ4(214)にアクセス可能な情報を、それぞれ保存して、要約グラフ250を生成する。
この際、ウェブページにアクセス可能な情報は、URL、URN、URLまたはURNに連結されるようにハイパーリンクされたウェブページのサムネイルイメージなどを含みうるが、これらに限定されるものではない。
図3は、要約グラフが表示されるユーザインターフェース画面の例を示す図面である。図3を参照すれば、ユーザインターフェース画面300は、要約グラフが表示される領域310及びユーザが選択したノードに保存された情報が表示される領域320を含む。また、領域310には、検索しようとするウェブアクセス記録の期間を設定するためのユーザインターフェース311が表示される。
図示された例で、ユーザが、検索期間を2014年4月18日から2014年4月24日に設定すれば、ウェブページアクセス記録構造化装置100は、ユーザが設定した検索期間の間のウェブサイトアクセス記録に基づいて要約グラフをリアルタイムで生成して領域310に表示するか、ユーザが設定した検索期間の間のウェブサイトアクセス記録に基づいて生成されて、既に保存されている要約グラフを領域310に表示する。
その後、ユーザが、領域310に表示された要約グラフのうちからトピック6に対応するノード312を選択すれば、ノード312に保存された情報、すなわち、2014年4月18日から2014年4月24日までの期間の間にユーザがアクセスしたウェブページのうち、トピック6に関する内容を含んだウェブページ(ウェブページ4、ウェブページ5及びウェブページ6)にアクセス可能なようにハイパーリンクされた各ページのサムネイルイメージ321〜323を表示する。
ユーザが、表示されたサムネイルイメージ321〜323のうちからウェブページ4のサムネイルイメージ321を選択すれば、ウェブページ4が、ユーザインターフェース画面300または領域320に表示される。
図4は、ウェブページアクセス記録構造化装置の他の実施形態を示すブロック図である。図4を参照すれば、本発明の他の実施形態によるウェブページアクセス記録構造化装置400は、ウェブページアクセス記録構造化装置100でセッション管理部410、アクセス記録収集部420、及び要約グラフ統合部430を選択的にさらに含みうる。セッション管理部410、アクセス記録収集部420、及び要約グラフ統合部430は、1つ以上のプロセッサとして具現可能である。
セッション管理部410は、要約グラフがセッション単位で生成されるように、ユーザがウェブブラウザーを通じて探索したウェブページの束をセッション単位で管理することができる。ここで、セッションとは、ユーザがウェブブラウザーを通じて探索を行った一連の作業単位を言う。
アクセス記録収集部420は、ユーザがウェブブラウザーを通じてアクセスしたウェブページのアクセス記録を収集することができる。
要約グラフ統合部430は、複数の要約グラフを統合することができる。
ウェブページアクセス記録構造化装置400は、基本的に概念の階層構造であって、構成されたオントロジーモデルに基づいたデータ構造に基づいてウェブアクセス記録要約を行う。したがって、下位概念探索を行ったトピックに対しては、データ構造上の下位レベルのノードが要約グラフに多く含まれるが、下位概念探索を行っていないトピックは、下位レベルのノードが要約グラフに含まれない。
したがって、本発明の一実施形態によれば、ウェブページアクセス記録構造化装置400は、探索を多くしていないノードに対して追加探索のヒントになる情報を与える用途としても、要約グラフが活用されうる。例えば、ウェブページアクセス記録構造化装置400は、探索を多くしていないノードに対してあらかじめ情報を検索して見せるのに活用されることもあり、当該ノードに対して他のユーザが探索した情報を集めて見せるのに活用されることもある。このために、要約グラフ統合部430は、多数の要約グラフを集めて1つの統合された要約グラフを生成することができる。
図5は、ウェブページアクセス記録構造化装置のさらに他の実施形態を示すブロック図である。図5を参照すれば、ウェブページアクセス記録構造化装置500は、トピック抽出部510、意味関係分析部520、及び要約グラフ生成部530を含みうる。
トピック抽出部510は、ウェブブラウザーを通じてユーザがアクセスしたウェブページを分析して、ページ別に少なくとも1つのトピックを抽出することができる。
例えば、トピック抽出部510は、ウェブページに含まれたテキストデータを構文分析し、その結果、抽出された名詞をトピックとして抽出することができる。
他の例を挙げれば、トピック抽出部510は、ウェブページから出現頻度が高い単語をトピックとして抽出することができる。
このために、トピック抽出部510は、トピックワード接近法、語彙連鎖接近法、潜在意味分析(LSA)、確率的潜在意味分析(PLSA)、Full blown Bayesian topic modelsなどを利用することができるが、これらに限定されるものではなく、文書からトピックを抽出するための多様なトピック抽出アルゴリズムを利用できる。
意味関係分析部520は、トピック抽出部510から抽出されたトピック間の意味関係(semantic relation)をオントロジー基盤のデータ構造に基づいて分析することができる。この際、データ構造は、ウェブページアクセス記録構造化装置500の外部サーバにあらかじめ構築されており、ウェブページアクセス記録構造化装置500の内部にあらかじめ構築されていることもある。
オントロジー基盤のデータ構造が、ウェブページアクセス記録構造化装置500の外部サーバにあらかじめ構築されている場合、意味関係分析部520は、ウェブページアクセス記録構造化装置500が搭載される端末の通信モジュールを通じて、外部サーバと通信することができる。すなわち、意味関係分析部520は、端末の通信モジュールを通じて外部サーバにトピック間の意味関係分析をリクエストし、外部サーバからトピック間の意味関係分析結果を受信することができる。この場合、外部サーバは、トピック間の意味関係分析リクエストを受信して、あらかじめ構築されたオントロジー基盤のデータ構造に基づいてトピック間の意味関係を分析して、その結果を端末の通信モジュールを通じて意味関係分析部520に伝送しうる。
本発明の一実施形態によれば、ウェブページアクセス記録構造化装置は、外部サーバと通信するための通信部(図示せず)をさらに含みうる。この場合、意味関係分析部520は、ウェブページアクセス記録構造化装置の通信部を通じて外部サーバと通信する。
要約グラフ生成部530は、意味関係分析部520の分析結果に基づいて要約グラフを生成することができる。
要約グラフ生成部530は、意味関係分析部520から分析されたトピック間の意味関係に基づいて、各トピックは、ノードに、トピック間の意味関係は、そのトピックに対応するノードを連結するエッジにそれぞれ対応させて、意味関係グラフを生成することができる。
要約グラフ生成部530は、各トピックが抽出されたページにアクセス可能なように、意味関係グラフの各ノードに当該ノードのトピックが抽出されたページにアクセス可能な情報を保存して、要約グラフを生成することができる。
ここで、ウェブページにアクセス可能な情報は、URL、URN、URLまたはURNに連結されるようにハイパーリンクされたウェブページのサムネイルイメージなどを含みうるが、これらに限定されるものではない。
図6は、ウェブページアクセス記録構造化装置のさらに他の実施形態を示すブロック図である。図6を参照すれば、本発明のさらに他の実施形態によるウェブページアクセス記録構造化装置600は、ウェブページアクセス記録構造化装置500に加えてセッション管理部610、アクセス記録収集部620、及び要約グラフ統合部630を選択的にさらに含みうる。セッション管理部610、アクセス記録収集部620、及び要約グラフ統合部630は、1つ以上のプロセッサとして具現可能である。
セッション管理部610は、要約グラフがセッション単位で生成されるようにユーザがウェブブラウザーを通じて探索したウェブページの束をセッション単位で管理することができる。ここで、セッションとは、ユーザがウェブブラウザーを通じて探索を行った一連の作業単位を言う。
アクセス記録収集部620は、ユーザがウェブブラウザーを通じてアクセスしたウェブページのアクセス記録を収集することができる。
要約グラフ統合部630は、複数の要約グラフを統合することができる。
図7は、ウェブページアクセス記録構造化方法の一実施形態を示すフローチャートである。図7を参照すれば、本発明の一実施形態によるウェブページアクセス記録構造化方法(700)は、まず、ユーザがアクセスしたウェブページを分析して、ページ別に少なくとも1つのトピックを抽出する(710)。例えば、トピック抽出部110は、ウェブページに含まれたテキストデータを構文分析し、その結果、抽出された名詞をトピックとして抽出することができる。他の例を挙げれば、トピック抽出部110は、ウェブページから出現頻度が高い単語をトピックとして抽出することができる。このために、トピック抽出部110は、トピックワード接近法、語彙連鎖接近法、潜在意味分析(LSA)、確率的潜在意味分析(PLSA)、Full blown Bayesian topic modelsなどを利用することができるが、これらに限定されるものではなく、文書からトピックを抽出するための多様なトピック抽出アルゴリズムを利用できる。
その後、概念の階層構造で構成されたオントロジーモデルに基づいたデータ構造のノードに抽出されたトピックをマッピングする(720)。例えば、マッピング部120は、抽出された各トピックを概念の階層構造で構成されたオントロジーモデルに基づいたデータ構造の対応ノードにそれぞれマッピングすることができる。
その後、各トピックがマッピングされたノードを含むサブグラフをデータ構造から抽出する(730)。例えば、要約グラフ生成部130は、各トピックがマッピングされたノードのみを含むサブグラフをオントロジーモデルに基づいたデータ構造から抽出することができる。
その後、抽出されたサブグラフに基づいて要約グラフを生成する(740)。例えば、要約グラフ生成部130は、各トピックが抽出されたウェブページにアクセス可能な情報をサブグラフの当該ノードにそれぞれ保存して、要約グラフを生成することができる。
ここで、ウェブページにアクセス可能な情報は、URL、URN、URLまたはURNに連結されるようにハイパーリンクされたウェブページのサムネイルイメージなどを含みうるが、これらに限定されるものではない。
この際、要約グラフは、セッション単位で生成されうる。この際、セッションとは、ユーザがウェブブラウザーを通じて探索を行った一連の作業単位を言う。
一方、追加的な実施形態によれば、ウェブページアクセス記録構造化方法(700)は、ユーザがウェブブラウザーを通じてアクセスしたウェブページのアクセス記録を収集する段階(705)をさらに含みうる。
一方、追加的な実施形態によれば、ウェブページアクセス記録構造化方法(700)は、生成された要約グラフを他の要約グラフと統合する段階(745)をさらに含みうる。
図8は、ウェブページアクセス記録構造化方法の他の実施形態を示すフローチャートである。図8を参照すれば、本発明の他の実施形態によるウェブページアクセス記録構造化方法(800)は、まず、ウェブブラウザーを通じてユーザがアクセスしたウェブページを分析して、ページ別に少なくとも1つのトピックを抽出する(810)。例えば、トピック抽出部510は、ウェブページに含まれたテキストデータを構文分析し、その結果、抽出された名詞をトピックとして抽出することができる。他の例を挙げれば、トピック抽出部510は、ウェブページから出現頻度が高い単語をトピックとして抽出することができる。このために、トピック抽出部510は、トピックワード接近法、語彙連鎖接近法、潜在意味分析(LSA)、確率的潜在意味分析(PLSA)、Full blown Bayesian topic modelsなどを利用することができるが、これらに限定されるものではなく、文書からトピックを抽出するための多様なトピック抽出アルゴリズムを利用できる。
その後、抽出されたトピック間の意味関係を概念の階層構造で構成されたオントロジーモデルに基づいて分析することができる(820)。例えば、意味関係分析部520は、ウェブページアクセス記録構造化装置500の外部サーバまたは内部にあらかじめ構築されているオントロジーモデルに基づいてトピック間の意味関係を分析することができる。
その後、意味関係分析結果に基づいて意味関係グラフを生成する(830)。例えば、要約グラフ生成部530は、意味関係分析部520の分析結果に基づいて、各トピックは、ノードに、トピック間の意味関係は、そのトピックに対応するノードを連結するエッジにそれぞれ対応させて、意味関係グラフを生成することができる。
その後、生成された意味関係グラフに基づいて要約グラフを生成する(840)。例えば、要約グラフ生成部530は、各トピックが抽出されたページにアクセス可能なように、意味関係グラフの各ノードに当該ノードのトピックが抽出されたページにアクセス可能な情報を保存して、要約グラフを生成することができる。
ここで、ウェブページにアクセス可能な情報は、URL、URN、URLまたはURNに連結されるようにハイパーリンクされたウェブページのサムネイルイメージなどを含みうるが、これらに限定されるものではない。
一方、追加的な実施形態によれば、ウェブページアクセス記録構造化方法(800)は、ユーザがウェブブラウザーを通じてアクセスしたウェブページのアクセス記録を収集する段階(805)をさらに含みうる。
一方、追加的な実施形態によれば、ウェブページアクセス記録構造化方法(800)は、生成された要約グラフを他の要約グラフと統合する段階(845)をさらに含みうる。
図9は、ウェブページアクセス記録構造化装置の他の実施形態を示すブロック図である。図9を参照すれば、ウェブページアクセス記録構造化装置900は、ユーザがウェブページアクセス記録を用いてウェブページにアクセス可能なように、ユーザにウェブページアクセス記録を提供する装置として具現可能である。ウェブページアクセス記録構造化装置900は、端末であり得る。例えば、ウェブページアクセス記録構造化装置900は、スマートフォン、ラップトップコンピュータ、タブレットPC、デジタル放送端末(digital broadcasting terminal)、PDA、PMP、ナビゲーションのような移動端末、またはデジタルTV、スマートTV、デスクトップコンピュータのような固定端末であり得る。
図9を参照すれば、ウェブページアクセス記録構造化装置900は、プロセッサを含み、プロセッサは、トピック抽出部910、マッピング部920、データ構造アップデートプロセッサ930、及びアクセス記録検索プロセッサ940を含みうる。ウェブページアクセス記録構造化装置900は、入力/出力デバイス960、及びメモリ950をさらに含みうる。入力/出力デバイス960は、ユーザがウェブページアクセス記録構造化装置900とコミュニケーションを行うことを許諾する。例えば、入力/出力デバイス960は、ディスプレイスクリーン、タッチスクリーン、キーボード、マイクなどを含む。しかし、これらに限定されるものではなく、入力/出力デバイス960は、ウェブブラウザーまたはユーザがウェブページをブラウジングすることができる他のユーザインターフェースをディスプレイすることができる。
トピック抽出部910は、ユーザがアクセスしたウェブページを分析して、それぞれのウェブページから少なくとも1つのトピックを抽出することができる。例えば、トピック抽出部910は、ウェブページに含まれたテキストデータを構文法的に分析し、名詞をトピックとして抽出することができる。他の例を挙げれば、トピック抽出部910は、出現頻度が高い単語をトピックとして抽出することができる。
マッピング部920は、概念の階層構造で構成されたオントロジーモデルに基づいたデータ構造にトピック抽出部910から抽出されたトピックをマッピングすることができる。データ構造は、メモリ950に保存することができる。
データ構造アップデートプロセッサ930は、データ構造をアップデートすることができる。例えば、データ構造アップデートプロセッサ930は、サブグラフのノードにウェブページアクセス情報を保存することによって、データ構造のサブグラフに基づいて要約グラフを生成する要約グラフ生成部を含みうる。要約グラフ生成部は、多数の要約グラフを統合し、これにより、データ構造をアップデートすることができる。メモリ950は、別個の複数のメモリで構成することができる。
アクセス記録検索プロセッサ940は、ウェブページアクセス記録を検索するためのユーザインターフェースをユーザに提供することができる。ユーザインターフェースの例は、図3を参照して説明される。図1ないし図8に示された例を参照して提供された説明は、図9に示されたウェブページアクセス記録構造化装置900に適用される。
本発明の一態様は、コンピュータで読み取り可能な記録媒体にコンピュータで読み取り可能なコードとして具現しうる。前記のプログラムを具現するコード及びコードセグメントは、当該分野のコンピュータプログラマーによって容易に推論されうる。コンピュータで読み取り可能な記録媒体は、コンピュータシステムによって読み取れるデータが保存されるあらゆる種類の記録装置を含みうる。コンピュータで読み取り可能な記録媒体の例としては、ROM、RAM、CD−ROM、磁気テープ、フロッピー(登録商標)ディスク、光ディスクなどを含みうる。また、コンピュータで読み取り可能な記録媒体は、ネットワークで接続されたコンピュータシステムに分散されて、分散方式でコンピュータで読み取り可能なコードとして作成されて実行可能である。
以上、本発明について、その望ましい実施形態を中心に説明した。当業者ならば、本発明が、本発明の本質的な特性から逸脱しない範囲内で変形された形態として具現可能であることを理解できるであろう。したがって、本発明の範囲は、前述した実施形態に限定されず、特許請求の範囲に記載の内容と均等な範囲内にある多様な実施形態が含まれるように解釈しなければならない。
本発明は、ウェブページアクセスのための装置及び方法関連の技術分野に適用可能である。
100 装置
110 トピック抽出部
120 マッピング部
130 要約グラフ生成部
211 ウェブページ
220 トピック
230 データ構造
300 ユーザインターフェース画面
410 セッション管理部
420 アクセス記録収集部
430 要約グラフ統合部
520 意味関係分析部

Claims (26)

  1. ユーザがアクセスしたウェブページを分析して、ウェブページと関連した少なくとも1つのトピックを抽出するトピック抽出部と、
    抽出された少なくとも1つのトピックをオントロジー基盤のデータ構造のノードにマッピングするマッピング部と、
    マッピングされたノードを含むサブグラフを前記オントロジー基盤のデータ構造から抽出し、該抽出されたサブグラフに基づいて要約グラフを生成する要約グラフ生成部と、
    を含む、ウェブページアクセス記録構造化装置。
  2. 前記トピック抽出部は、トピックワード接近法、語彙連鎖接近法、潜在意味分析(LSA)、確率的潜在意味分析(PLSA)、及びFull blown Bayesian topic modelsのうち少なくとも1つを用いてウェブページから少なくとも1つのトピックを抽出する、
    請求項1に記載のウェブページアクセス記録構造化装置。
  3. 前記オントロジー基盤のデータ構造は、前記装置の外部にあらかじめ構築されたオントロジーモデルに基づく、
    請求項1または2に記載のウェブページアクセス記録構造化装置。
  4. 前記要約グラフ生成部は、各トピックが抽出されたウェブページにアクセスするための情報を、前記各トピックがマッピングされたサブグラフの当該ノードにそれぞれ保存して、要約グラフを生成する、
    請求項1乃至3いずれか一項に記載のウェブページアクセス記録構造化装置。
  5. 前記ウェブページにアクセスするための情報は、URL、URN、及びURLまたはURNに連結されるようにハイパーリンクされたウェブページのサムネイルイメージのうち少なくとも1つを含む、
    請求項4に記載のウェブページアクセス記録構造化装置。
  6. 前記要約グラフがセッション単位で生成されるように、前記ウェブページをセッション単位で管理するセッション管理部と、をさらに含む、
    請求項1乃至5いずれか一項に記載のウェブページアクセス記録構造化装置。
  7. 少なくとも1つの前記ウェブページのアクセス記録を収集するアクセス記録収集部と、をさらに含む、
    請求項1乃至6いずれか一項に記載のウェブページアクセス記録構造化装置。
  8. 複数の要約グラフを統合して統合要約グラフを生成する要約グラフ統合部と、をさらに含む、
    請求項1乃至7いずれか一項に記載のウェブページアクセス記録構造化装置。
  9. ユーザがアクセスしたウェブページを分析して、ウェブページから少なくとも1つのトピックを抽出する段階と、
    抽出された少なくとも1つのトピックをオントロジー基盤のデータ構造のノードにマッピングする段階と、
    マッピングされたノードを含むサブグラフを前記オントロジー基盤のデータ構造から抽出する段階と、
    抽出されたサブグラフに基づいて要約グラフを生成する段階と、
    を含む、ウェブページアクセス記録構造化方法。
  10. 前記ウェブページから少なくとも1つのトピックを抽出する段階は、トピックワード接近法、語彙連鎖接近法、潜在意味分析(LSA)、確率的潜在意味分析(PLSA)、及びFull blown Bayesian topic modelsのうち少なくとも1つを用いてウェブページから少なくとも1つのトピックを抽出する、
    請求項9に記載のウェブページアクセス記録構造化方法。
  11. 前記要約グラフを生成する段階は、ウェブページにアクセスするための情報を前記サブグラフのノードに保存して要約グラフを生成する、
    請求項9または10に記載のウェブページアクセス記録構造化方法。
  12. 前記ウェブページにアクセスするための情報は、URL、URN、及びURLまたはURNに連結されるようにハイパーリンクされたウェブページのサムネイルイメージのうち少なくとも1つを含む、
    請求項11に記載のウェブページアクセス記録構造化方法。
  13. 前記ウェブページから少なくとも1つのトピックを抽出する段階以前に、
    前記ウェブページのアクセス記録を収集する段階と、をさらに含む、
    請求項9乃至12いずれか一項に記載のウェブページアクセス記録構造化方法。
  14. 前記要約グラフを生成する段階以後に、
    前記生成された要約グラフを他の要約グラフと統合する段階と、をさらに含む、
    請求項9乃至13いずれか一項に記載のウェブページアクセス記録構造化方法。
  15. ユーザがアクセスした少なくとも1つのウェブページから少なくとも1つのトピックを抽出するトピック抽出部と、
    抽出された少なくとも1つのトピック間の意味関係を分析する意味関係分析部と、
    意味関係に基づいて要約グラフを生成する要約グラフ生成部と、
    を含む、ウェブページアクセス記録構造化装置。
  16. 前記トピック抽出部は、トピックワード接近法、語彙連鎖接近法、潜在意味分析(LSA)、確率的潜在意味分析(PLSA)、及びFull blown Bayesian topic modelsのうち少なくとも1つを用いてウェブページ別トピックを抽出する、
    請求項15に記載のウェブページアクセス記録構造化装置。
  17. 前記意味関係分析部は、あらかじめ構築されたオントロジーモデルに基づいて、前記トピック間の意味関係を分析する、
    請求項15または16に記載のウェブページアクセス記録構造化装置。
  18. 前記要約グラフ生成部は、
    分析されたトピック間の意味関係に基づいて、各トピックはノードに対応させ、トピック間の意味関係は、そのトピックに対応するノードを連結するエッジに対応させて、意味関係グラフを生成し、
    各トピックが抽出されたウェブページにアクセスするための情報を、前記各トピックに対応する前記意味関係グラフの当該ノードに保存して要約グラフを生成する、
    請求項15乃至17いずれか一項に記載のウェブページアクセス記録構造化装置。
  19. 前記ウェブページにアクセスするための情報は、URL、URN、及びURLまたはURNに連結されるようにハイパーリンクされたウェブページのサムネイルイメージのうち少なくとも1つを含む、
    請求項18に記載のウェブページアクセス記録構造化装置。
  20. 前記要約グラフがセッション単位で生成されるように、前記少なくとも1つのウェブページをセッション単位で管理するセッション管理部と、をさらに含む、
    請求項15乃至19いずれか一項に記載のウェブページアクセス記録構造化装置。
  21. 少なくとも1つのウェブページのアクセス記録を収集するアクセス記録収集部と、をさらに含む、
    請求項15乃至20いずれか一項に記載のウェブページアクセス記録構造化装置。
  22. 複数の要約グラフを統合して統合要約グラフを生成する要約グラフ統合部と、をさらに含む、
    請求項15乃至21いずれか一項に記載のウェブページアクセス記録構造化装置。
  23. ブラウザーを通じてアクセスしたウェブページからトピックを抽出するトピック抽出部と、
    前記トピックをオントロジー基盤のデータ構造にマッピングするマッピング部と、
    前記ウェブページにアクセスするための情報として前記データ構造をアップデートするデータ構造アップデートプロセッサと、
    を含む、ウェブページアクセスのための装置。
  24. 前記データ構造アップデートプロセッサは、
    前記データ構造にマッピングされたトピックを含むデータ構造の部分に基づいて、前記ウェブページにアクセスするための情報を保存する要約グラフを生成する要約グラフ生成部を含み、
    前記データ構造は、メモリに保存される、
    請求項23に記載のウェブページアクセスのための装置。
  25. ウェブページアクセス記録を検索するために、ディスプレイスクリーン上にユーザインターフェースを提供するアクセス記録検索プロセッサと、をさらに含む、
    請求項23または24に記載のウェブページアクセスのための装置。
  26. 前記アクセス記録検索プロセッサは、ユーザが時間間隔を設定し、前記ウェブページと関連した1つ以上のトピックに基づいてウェブページを選択することを許諾する、
    請求項25に記載のウェブページアクセスのための装置。
JP2015092601A 2014-04-30 2015-04-30 ウェブページアクセスのための装置及び方法 Active JP6611458B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020140052838A KR102244298B1 (ko) 2014-04-30 2014-04-30 의미를 기반으로 웹 페이지 접근 기록을 구조화하는 장치 및 방법
KR10-2014-0052838 2014-04-30

Publications (2)

Publication Number Publication Date
JP2015212947A true JP2015212947A (ja) 2015-11-26
JP6611458B2 JP6611458B2 (ja) 2019-11-27

Family

ID=53040382

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015092601A Active JP6611458B2 (ja) 2014-04-30 2015-04-30 ウェブページアクセスのための装置及び方法

Country Status (5)

Country Link
US (1) US10521474B2 (ja)
EP (1) EP2940604A1 (ja)
JP (1) JP6611458B2 (ja)
KR (1) KR102244298B1 (ja)
CN (1) CN105022775A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102232927B1 (ko) * 2020-11-23 2021-03-26 주식회사 하비비커뮤니케이션 토탈 캠핑 앱 기반의 토탈 캠핑 플랫폼 제공 시스템

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160070446A1 (en) * 2014-09-04 2016-03-10 Home Box Office, Inc. Data-driven navigation and navigation routing
US10552008B2 (en) * 2015-06-24 2020-02-04 International Business Machines Corporation Managing a domain specific ontology collection
TWI537751B (zh) * 2015-08-12 2016-06-11 國立雲林科技大學 非揮發性電腦可讀取儲存媒體、影像自動描述系統與方法
KR101931859B1 (ko) * 2016-09-29 2018-12-21 (주)시지온 전자문서의 대표 단어 선정 방법, 전자 문서 제공 방법, 및 이를 수행하는 컴퓨팅 시스템
US11711372B2 (en) 2020-03-16 2023-07-25 AVAST Software s.r.o. Network resource privacy negotiation system and method
US20220012365A1 (en) * 2020-07-11 2022-01-13 AVAST Software s.r.o. System and method for differentiated privacy management of user content
US11842153B2 (en) * 2021-07-28 2023-12-12 Microsoft Technology Licensing, Llc Computing system for auto-identification of secondary insights using reverse extraction
KR102600305B1 (ko) * 2022-10-07 2023-11-09 주식회사 커피챗 머신러닝 기반 학습된 모델을 이용한 사용자 맞춤형 대화 파트너 매칭 제공 추천 시스템 및 그 동작 방법
KR102600307B1 (ko) * 2022-10-11 2023-11-09 주식회사 커피챗 사용자별 대표 활동 로그 추출 방법과 머신러닝 모델의 병합을 적용한 사용자 및 대화 파트너 매칭 제공 최적화 시스템 및 그 동작 방법

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080104061A1 (en) * 2006-10-27 2008-05-01 Netseer, Inc. Methods and apparatus for matching relevant content to user intention
JP2010086343A (ja) * 2008-09-30 2010-04-15 Toshiba Corp ウェブ閲覧目的分類装置、ウェブ閲覧目的分類方法、及びウェブ閲覧目的分類プログラム
JP2010205265A (ja) * 2009-03-05 2010-09-16 Nhn Corp オントロジを用いたコンテンツ検索システムおよび方法
WO2011013191A1 (ja) * 2009-07-27 2011-02-03 株式会社 東芝 関連性提示装置、方法およびプログラム
US20110191344A1 (en) * 2010-02-03 2011-08-04 Jing Jin Automatic organization of browsing histories
JP2013004013A (ja) * 2011-06-21 2013-01-07 Konica Minolta Business Technologies Inc プロファイル更新装置およびその制御方法、ならびに、プロファイル更新用プログラム

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050257400A1 (en) * 1998-11-06 2005-11-24 Microsoft Corporation Navigating a resource browser session
US6711585B1 (en) 1999-06-15 2004-03-23 Kanisa Inc. System and method for implementing a knowledge management system
US7406459B2 (en) * 2003-05-01 2008-07-29 Microsoft Corporation Concept network
KR20060034187A (ko) 2004-10-18 2006-04-21 원인호 솔라셀판 커텐과 이를 내장한 틀
JP4576211B2 (ja) 2004-11-22 2010-11-04 日立オムロンターミナルソリューションズ株式会社 文書情報検索システム
KR100704508B1 (ko) 2004-12-14 2007-04-09 한국전자통신연구원 N-gram 네트워크를 이용하는 한국어 연속음성인식의언어모델 적응장치 및 그 방법
CN100449547C (zh) * 2006-12-06 2009-01-07 华为技术有限公司 一种媒体内容管理系统及方法
KR100771577B1 (ko) 2007-02-16 2007-10-30 드림아이 커뮤니케이션즈(주) 웹페이지 접속 이력정보 관리방법
US8326847B2 (en) * 2008-03-22 2012-12-04 International Business Machines Corporation Graph search system and method for querying loosely integrated data
JP5150341B2 (ja) 2008-04-10 2013-02-20 株式会社東芝 データ作成装置及び方法
KR101087224B1 (ko) 2008-11-20 2011-11-25 후레쉬푸드주식회사 락토바실러스 퍼멘텀 js 균주를 함유하는 소스
JP5077210B2 (ja) 2008-12-04 2012-11-21 富士通モバイルコミュニケーションズ株式会社 携帯型情報処理装置
KR101082814B1 (ko) 2008-12-29 2011-11-11 한양대학교 산학협력단 키워드를 이용한 온톨로지 정보 검색 방법 및 장치
CN102812562B (zh) 2010-01-25 2016-02-24 Lg化学株式会社 光伏组件
US9135354B2 (en) * 2010-04-07 2015-09-15 Yahoo! Inc. Method and system for topical browser history
KR101097191B1 (ko) 2010-04-27 2011-12-21 서울대학교산학협력단 용어체계에 기반하는 데이터 개체 정의지원 시스템
US8880514B2 (en) 2010-04-27 2014-11-04 Snu R&Db Foundation Terminology-based system for supporting data object definition
US20120066073A1 (en) * 2010-09-02 2012-03-15 Compass Labs, Inc. User interest analysis systems and methods
KR101144371B1 (ko) 2011-07-15 2012-05-10 엔에이치엔비즈니스플랫폼 주식회사 웹페이지에 대한 방문기록을 도식화하는 방법 및 시스템 그리고 상기 방문기록을 이용한 추가정보 제공 방법 및 시스템
GB2498762A (en) * 2012-01-27 2013-07-31 Qatar Foundation Computing user traffic at the website based on user actions
CN103455487B (zh) * 2012-05-29 2018-07-06 腾讯科技(深圳)有限公司 一种搜索词的提取方法及装置
KR20120119885A (ko) 2012-09-17 2012-10-31 삼성전자주식회사 사용자의 검색 히스토리를 이용한 컨텐츠 분류 방법 및 시스템

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080104061A1 (en) * 2006-10-27 2008-05-01 Netseer, Inc. Methods and apparatus for matching relevant content to user intention
JP2010086343A (ja) * 2008-09-30 2010-04-15 Toshiba Corp ウェブ閲覧目的分類装置、ウェブ閲覧目的分類方法、及びウェブ閲覧目的分類プログラム
JP2010205265A (ja) * 2009-03-05 2010-09-16 Nhn Corp オントロジを用いたコンテンツ検索システムおよび方法
WO2011013191A1 (ja) * 2009-07-27 2011-02-03 株式会社 東芝 関連性提示装置、方法およびプログラム
US20110191344A1 (en) * 2010-02-03 2011-08-04 Jing Jin Automatic organization of browsing histories
JP2013004013A (ja) * 2011-06-21 2013-01-07 Konica Minolta Business Technologies Inc プロファイル更新装置およびその制御方法、ならびに、プロファイル更新用プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102232927B1 (ko) * 2020-11-23 2021-03-26 주식회사 하비비커뮤니케이션 토탈 캠핑 앱 기반의 토탈 캠핑 플랫폼 제공 시스템

Also Published As

Publication number Publication date
EP2940604A1 (en) 2015-11-04
US20150317408A1 (en) 2015-11-05
US10521474B2 (en) 2019-12-31
JP6611458B2 (ja) 2019-11-27
CN105022775A (zh) 2015-11-04
KR20150125442A (ko) 2015-11-09
KR102244298B1 (ko) 2021-04-23

Similar Documents

Publication Publication Date Title
JP6611458B2 (ja) ウェブページアクセスのための装置及び方法
Bizer et al. Dbpedia-a crystallization point for the web of data
Jacksi et al. Lod explorer: Presenting the web of data
US9152674B2 (en) Performing application searches
US8972440B2 (en) Method and process for semantic or faceted search over unstructured and annotated data
Vandic et al. Faceted product search powered by the semantic web
US9400835B2 (en) Weighting metric for visual search of entity-relationship databases
US20130262449A1 (en) System and method for search refinement using knowledge model
US11580177B2 (en) Identifying information using referenced text
KR100868187B1 (ko) 사진 기반 통합 컨텐츠 생성 및 제공 시스템 그리고 그방법.
JP2017157193A (ja) 画像とコンテンツのメタデータに基づいてコンテンツとマッチングする画像を選択する方法
Aksac et al. A novel semantic web browser for user centric information retrieval: PERSON
US11745093B2 (en) Developing implicit metadata for data stores
Contreras et al. Semantic web and augmented reality for searching people, events and points of interest within of a university campus
KR20070065774A (ko) 온톨로지를 이용한 시맨틱 블로그 관리 시스템 및 방법
Posea et al. Bringing the social semantic web to the personal learning environment
Fung et al. Discover information and knowledge from websites using an integrated summarization and visualization framework
US9530094B2 (en) Jabba-type contextual tagger
Rástočný et al. Web search results exploration via cluster-based views and zoom-based navigation
Razis et al. Semantic social analytics and linked open data cloud
Veeraiah et al. A novel approach for extraction and representation of main data from web pages to android application
Pham Towards a characteristics-aware document search engine
Tvarozek et al. Bridging semantic and legacy web exploration: Orientation, revisitation and result exploration support
Thanadechteemapat et al. A web assessment approach based on summarisation and visualisation
Nummiaho et al. Utilizing Existing Semantic Knowledge Bases for Creating Annotations on Mobile Devices

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180320

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190121

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190305

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190604

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191008

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191029

R150 Certificate of patent or registration of utility model

Ref document number: 6611458

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250