JP5634859B2 - サイトクラスタシステムおよびサイトクラスタ方法 - Google Patents
サイトクラスタシステムおよびサイトクラスタ方法 Download PDFInfo
- Publication number
- JP5634859B2 JP5634859B2 JP2010294003A JP2010294003A JP5634859B2 JP 5634859 B2 JP5634859 B2 JP 5634859B2 JP 2010294003 A JP2010294003 A JP 2010294003A JP 2010294003 A JP2010294003 A JP 2010294003A JP 5634859 B2 JP5634859 B2 JP 5634859B2
- Authority
- JP
- Japan
- Prior art keywords
- site
- cluster
- theme
- user
- clusters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
Description
101 関連サイト抽出部
102 クラスタ生成部
103 クラスタ分類部
104 クラスタ分析部
Claims (17)
- ユーザのサイトクリックログを用いて関連サイトを抽出する関連サイト抽出部と、
前記抽出された関連サイトの関連関係を用いて類似の属性を有する関連サイトに対するサイトクラスタを生成するクラスタ生成部と、
前記生成されたサイトクラスタを類似のテーマ別に分類するクラスタ分類部と、
前記テーマに応じて分類されたサイトクラスタを分析して、前記サイトクラスタのテーマに応じて時系列的分析、テーマ別分布度、クリック回数、テーマ別サイトリスト、テーマ別関心ユーザ数、またはユーザの訪問行動の結果を含む分析結果を提供するクラスタ分析部と、を含むことを特徴とするサイトクラスタシステム。 - 前記関連サイト抽出部は、同一の時間区間でユーザ別にクリックしたサイト情報を収集し、前記収集したサイト情報に関連規則を適用して関連サイトを抽出することを特徴とする請求項1に記載のサイトクラスタシステム。
- 前記関連サイト抽出部は、サイトの検索回数に係る関連規則、ユーザのIPアドレスに係る関連規則、またはユーザ識別情報に係る関連規則のうちいずれか1つの関連規則に基づいて関連サイトを抽出することを特徴とする請求項2に記載のサイトクラスタシステム。
- 前記クラスタ生成部は、前記抽出された関連サイトに応じて代表サイトおよび関連サイトの対を生成してサイトクラスタを生成することを特徴とする請求項1に記載のサイトクラスタシステム。
- 前記クラスタ生成部は、前記代表サイトおよび関連サイトの対に共通する関連サイトを用いて関連サイトに対する接続関係を生成し、前記接続関係に範疇型のクラスタ方式を適用してサイトクラスタを生成することを特徴とする請求項4に記載のサイトクラスタシステム。
- 前記クラスタ分類部は、前記サイトクラスタを構成するサイト別の流入キーワードに対するテーマを考慮して前記サイトクラスタを類似のテーマ別に分類することを特徴とする請求項1に記載のサイトクラスタシステム。
- 前記クラスタ分類部は、最初に生成されたサイトクラスタに対してテーマ別に分類してシードクラスタを生成し、前記生成されたシードクラスタに基づいて予め設定した周期別に生成されたサイトクラスタをテーマ別に分類することを特徴とする請求項1に記載のサイトクラスタシステム。
- 前記クラスタ分析部は、前記テーマを含む第1階層、前記テーマ別に分類されたサイトクラスタを含む第2階層、および前記サイトクラスタに対する関連サイトを含む第3階層に構成されたデータ階層図を提供することを特徴とする請求項1に記載のサイトクラスタシステム。
- 関連サイト抽出部と、クラスタ生成部と、クラスタ分類部と、クラスタ分析部と、を含むサイトクラスタシステムにおけるサイトクラスタ方法であって、
前記関連サイト抽出部がユーザのサイトクリックログを用いて関連サイトを抽出し、
前記クラスタ生成部が前記抽出された関連サイトの関連関係を用いて類似の属性を有する関連サイトに対するサイトクラスタを生成し、
前記クラスタ分類部が前記生成されたサイトクラスタを類似のテーマ別に分類し、
前記クラスタ分析部が前記テーマに応じて分類されたサイトクラスタを分析して、前記サイトクラスタのテーマに応じて時系列的分析、テーマ別分布度、クリック回数、テーマ別サイトリスト、テーマ別関心ユーザ数、またはユーザの訪問行動の結果を含む分析結果を提供すること、
を含むことを特徴とするサイトクラスタ方法。 - 前記関連サイトを抽出することは、前記関連サイト抽出部が、同一の時間区間でユーザ別にクリックしたサイト情報を収集し、前記収集したサイト情報に関連規則を適用して関連サイトを抽出することを特徴とする請求項9に記載のサイトクラスタ方法。
- 前記関連サイトを抽出することは、前記関連サイト抽出部が、サイトの検索回数に係る関連規則、ユーザのIPアドレスに係る関連規則、またはユーザ識別情報に係る関連規則のうちいずれか1つの関連規則に基づいて関連サイトを抽出することを特徴とする請求項10に記載のサイトクラスタ方法。
- 前記関連サイトに対するサイトクラスタを生成することは、前記クラスタ生成部が、前記抽出された関連サイトに応じて代表サイトおよび関連サイトの対を生成してサイトクラスタを生成することを特徴とする請求項9に記載のサイトクラスタ方法。
- 前記関連サイトに対するサイトクラスタを生成することは、
前記クラスタ生成部が、
サンギ代表サイトおよび関連サイトの対に共通する関連サイトを用いて関連サイトに対する接続関係を生成し、
前記接続関係に範疇型のクラスタ方式を適用してサイトクラスタを生成すること、
を含むことを特徴とする請求項12に記載のサイトクラスタ方法。 - 前記生成されたサイトクラスタを類似するテーマ別に分類することは、前記サイトクラスタを構成するサイト別の流入キーワードに対するテーマを考慮して前記サイトクラスタを類似のテーマ別に分類することを特徴とする請求項9に記載のサイトクラスタ方法。
- 前記生成されたサイトクラスタを類似のテーマ別に分類することは、
前記クラスタ分類部が、
最初に生成されたサイトクラスタに対してテーマ別に分類してシードクラスタを生成し、
前記生成されたシードクラスタに基づいて予め設定した周期別に生成されたサイトクラスタをテーマ別に分類すること、
を含むことを特徴とする請求項9に記載のサイトクラスタ方法。 - 前記サイトクラスタを分析して分析結果を提供することは、前記クラスタ分析部が、前記テーマを含む第1階層、前記テーマ別に分類されたサイトクラスタを含む第2階層、および前記サイトクラスタに対する関連サイトを含む第3階層に構成されたデータ階層図を提供することを特徴とする請求項9に記載のサイトクラスタ方法。
- 請求項9乃至請求項16のいずれか1項の方法を実行するためのプログラムが記録されたコンピュータで読み出し可能な記録媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2009-0134033 | 2009-12-30 | ||
KR1020090134033A KR101076522B1 (ko) | 2009-12-30 | 2009-12-30 | 사이트 클러스터링 시스템 및 사이트 클러스터링 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011138517A JP2011138517A (ja) | 2011-07-14 |
JP5634859B2 true JP5634859B2 (ja) | 2014-12-03 |
Family
ID=44349807
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010294003A Active JP5634859B2 (ja) | 2009-12-30 | 2010-12-28 | サイトクラスタシステムおよびサイトクラスタ方法 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP5634859B2 (ja) |
KR (1) | KR101076522B1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5944878B2 (ja) * | 2013-10-18 | 2016-07-05 | ヤフー株式会社 | 判定装置、判定方法及び判定プログラム |
RU2632149C2 (ru) * | 2015-05-06 | 2017-10-02 | Общество С Ограниченной Ответственностью "Яндекс" | Система, способ и постоянный машиночитаемый носитель для проверки веб-страниц |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005148846A (ja) * | 2003-11-11 | 2005-06-09 | Nippon Telegr & Teleph Corp <Ntt> | コンテンツ分類システムおよび方法、コンピュータプログラムおよび記録媒体 |
JP2007323334A (ja) * | 2006-05-31 | 2007-12-13 | Waakuatto:Kk | Webページ抽出システム、これを用いた広告配信システムおよび広告配信プログラム |
US7680858B2 (en) | 2006-07-05 | 2010-03-16 | Yahoo! Inc. | Techniques for clustering structurally similar web pages |
-
2009
- 2009-12-30 KR KR1020090134033A patent/KR101076522B1/ko active IP Right Grant
-
2010
- 2010-12-28 JP JP2010294003A patent/JP5634859B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2011138517A (ja) | 2011-07-14 |
KR20110077445A (ko) | 2011-07-07 |
KR101076522B1 (ko) | 2011-10-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lu et al. | BizSeeker: a hybrid semantic recommendation system for personalized government‐to‐business e‐services | |
Elmeleegy et al. | Mashup advisor: A recommendation tool for mashup development | |
CA2617954C (en) | Method and system for extracting web data | |
Belhadi et al. | A data-driven approach for Twitter hashtag recommendation | |
KR101048540B1 (ko) | 연관 키워드에 따른 클러스터를 이용하여 검색 키워드를 분류하는 장치 및 방법 | |
US20100185623A1 (en) | Topical ranking in information retrieval | |
Zhuang et al. | Measuring conference quality by mining program committee characteristics | |
EP2827294A1 (en) | Systems and method for determining influence of entities with respect to contexts | |
Huang et al. | Kb-enabled query recommendation for long-tail queries | |
Jagan et al. | A survey on web personalization of web usage mining | |
JP2012141985A (ja) | ユーザグループごとにキーワードの順位を決定するシステムおよび方法 | |
Mehrotra et al. | An intelligent clustering approach for improving search result of a website | |
Wang et al. | Magnet community identification on social networks | |
Katz et al. | Wikiometrics: a Wikipedia based ranking system | |
Rawat et al. | Topic modelling of legal documents using NLP and bidirectional encoder representations from transformers | |
US10255246B1 (en) | Systems and methods for providing a searchable concept network | |
JP5634859B2 (ja) | サイトクラスタシステムおよびサイトクラスタ方法 | |
Zhang et al. | Discovering consumers’ purchase intentions based on mobile search behaviors | |
Gupta et al. | Search bot: Search intention based filtering using decision tree based technique | |
Cuzzola et al. | Automated classification and localization of daily deal content from the Web | |
Dziczkowski et al. | An opinion mining approach for web user identification and clients' behaviour analysis | |
KR20150079353A (ko) | 브랜드 이미지 측정장치 및 측정방법 | |
Munilatha et al. | A study on issues and techniques of web mining | |
Saleheen et al. | User centric dynamic web information visualization | |
Lucchese et al. | Recommender Systems. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130703 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140110 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140121 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140421 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140930 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141015 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5634859 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |