JP2011138517A - サイトクラスタシステムおよびサイトクラスタ方法 - Google Patents
サイトクラスタシステムおよびサイトクラスタ方法 Download PDFInfo
- Publication number
- JP2011138517A JP2011138517A JP2010294003A JP2010294003A JP2011138517A JP 2011138517 A JP2011138517 A JP 2011138517A JP 2010294003 A JP2010294003 A JP 2010294003A JP 2010294003 A JP2010294003 A JP 2010294003A JP 2011138517 A JP2011138517 A JP 2011138517A
- Authority
- JP
- Japan
- Prior art keywords
- site
- cluster
- theme
- user
- clusters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【解決手段】サイトクラスタシステムはユーザのサイトクリックログを用いて関連サイトを抽出する関連サイト抽出部および前記抽出された関連サイトの関連関係を用いて類似の属性を有する関連サイトに対するサイトクラスタを生成するクラスタ生成部を含んでもよい。生成されたサイトクラスタを類似のテーマ別に分類するクラスタ分類部をさらに含むようにしてもよい。
【選択図】図1
Description
101 関連サイト抽出部
102 クラスタ生成部
103 クラスタ分類部
104 クラスタ分析部
Claims (23)
- ユーザのサイトクリックログを用いて関連サイトを抽出する関連サイト抽出部と、
前記抽出された関連サイトの関連関係を用いて類似の属性を有する関連サイトに対するサイトクラスタを生成するクラスタ生成部と、
を含むことを特徴とするサイトクラスタシステム。 - 前記生成されたサイトクラスタを類似のテーマ別に分類するクラスタ分類部をさらに含むことを特徴とする請求項1に記載のサイトクラスタシステム。
- 前記関連サイト抽出部は、同一の時間区間でユーザ別にクリックしたサイト情報を収集し、前記収集したサイト情報に関連規則を適用して関連サイトを抽出することを特徴とする請求項1に記載のサイトクラスタシステム。
- 前記関連サイト抽出部は、サイトの検索回数に係る関連規則、ユーザのIPアドレスに係る関連規則、またはユーザ識別情報に係る関連規則のうちいずれか1つの関連規則に基づいて関連サイトを抽出することを特徴とする請求項3に記載のサイトクラスタシステム。
- 前記クラスタ生成部は、前記抽出された関連サイトに応じて代表サイトおよび関連サイトの対を生成してサイトクラスタを生成することを特徴とする請求項1に記載のサイトクラスタシステム。
- 前記クラスタ生成部は、前記代表サイトおよび関連サイトの対に共通する関連サイトを用いて関連サイトに対する接続関係を生成し、前記接続関係に範疇型のクラスタ方式を適用してサイトクラスタを生成することを特徴とする請求項5に記載のサイトクラスタシステム。
- 前記クラスタ分類部は、前記サイトクラスタを構成するサイト別の流入キーワードに対するテーマを考慮して前記サイトクラスタを類似のテーマ別に分類することを特徴とする請求項2に記載のサイトクラスタシステム。
- 前記クラスタ分類部は、最初に生成されたサイトクラスタに対してテーマ別に分類してシードクラスタを生成し、前記生成されたシードクラスタに基づいて予め設定した周期別に生成されたサイトクラスタをテーマ別に分類することを特徴とする請求項2に記載のサイトクラスタシステム。
- 前記テーマに応じて分類されたサイトクラスタを分析して分析結果を提供するクラスタ分析部をさらに含むことを特徴とする請求項1に記載のサイトクラスタシステム。
- 前記クラスタ分析部は、前記テーマを含む第1階層、前記テーマ別に分類されたサイトクラスタを含む第2階層、および前記サイトクラスタに対する関連サイトを含む第3階層に構成されたデータ階層図を提供することを特徴とする請求項9に記載のサイトクラスタシステム。
- 前記クラスタ分析部は、前記サイトクラスタのテーマに応じて時系列的分析、テーマ別分布度、クリック回数、テーマ別サイトリスト、テーマ別関心ユーザ数、またはユーザの訪問行動の結果のうち少なくとも1つの分析結果を提供することを特徴とする請求項9に記載のサイトクラスタシステム。
- ユーザのサイトクリックログを用いて関連サイトを抽出し、
前記抽出された関連サイトの関連関係を用いて類似の属性を有する関連サイトに対するサイトクラスタを生成すること、
を含むことを特徴とするサイトクラスタ方法。 - 前記生成されたサイトクラスタを類似のテーマ別に分類することをさらに含むことを特徴とする請求項12に記載のサイトクラスタ方法。
- 前記関連サイトを抽出することは、同一の時間区間でユーザ別にクリックしたサイト情報を収集し、前記収集したサイト情報に関連規則を適用して関連サイトを抽出することを特徴とする請求項12に記載のサイトクラスタ方法。
- 前記関連サイトを抽出することは、サイトの検索回数に係る関連規則、ユーザのIPアドレスに係る関連規則、またはユーザ識別情報に係る関連規則のうちいずれか1つの関連規則に基づいて関連サイトを抽出することを特徴とする請求項14に記載のサイトクラスタ方法。
- 前記関連サイトに対するサイトクラスタを生成することは、前記抽出された関連サイトに応じて代表サイトおよび関連サイトの対を生成してサイトクラスタを生成することを特徴とする請求項12に記載のサイトクラスタ方法。
- 前記関連サイトに対するサイトクラスタを生成することは、
サンギ代表サイトおよび関連サイトの対に共通する関連サイトを用いて関連サイトに対する接続関係を生成し、
前記接続関係に範疇型のクラスタ方式を適用してサイトクラスタを生成すること、
を含むことを特徴とする請求項16に記載のサイトクラスタ方法。 - 前記生成されたサイトクラスタを類似するテーマ別に分類することは、前記サイトクラスタを構成するサイト別の流入キーワードに対するテーマを考慮して前記サイトクラスタを類似のテーマ別に分類することを特徴とする請求項13に記載のサイトクラスタ方法。
- 前記生成されたサイトクラスタを類似のテーマ別に分類することは、
最初に生成されたサイトクラスタに対してテーマ別に分類してシードクラスタを生成し、
前記生成されたシードクラスタに基づいて予め設定した周期別に生成されたサイトクラスタをテーマ別に分類すること、
を含むことを特徴とする請求項13に記載のサイトクラスタ方法。 - 前記テーマに応じて分類されたサイトクラスタを分析して分析結果を提供することをさらに含むことを特徴とする請求項12に記載のサイトクラスタ方法。
- 前記サイトクラスタを分析して分析結果を提供することは、前記テーマを含む第1階層、前記テーマ別に分類されたサイトクラスタを含む第2階層、および前記サイトクラスタに対する関連サイトを含む第3階層に構成されたデータ階層図を提供することを特徴とする請求項20に記載のサイトクラスタ方法。
- 前記サイトクラスタを分析して分析結果を提供することは、前記サイトクラスタのテーマに応じて時系列的分析、テーマ別分布度、クリック回数、テーマ別サイトリスト、テーマ別関心ユーザ数、またはユーザの訪問行動の結果のうち少なくとも1つの分析結果を提供することを特徴とする請求項20に記載のサイトクラスタ方法。
- 請求項12乃至請求項22のいずれか1項の方法を実行するためのプログラムが記録されたコンピュータで読み出し可能な記録媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2009-0134033 | 2009-12-30 | ||
KR1020090134033A KR101076522B1 (ko) | 2009-12-30 | 2009-12-30 | 사이트 클러스터링 시스템 및 사이트 클러스터링 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011138517A true JP2011138517A (ja) | 2011-07-14 |
JP5634859B2 JP5634859B2 (ja) | 2014-12-03 |
Family
ID=44349807
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010294003A Active JP5634859B2 (ja) | 2009-12-30 | 2010-12-28 | サイトクラスタシステムおよびサイトクラスタ方法 |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP5634859B2 (ja) |
KR (1) | KR101076522B1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015079471A (ja) * | 2013-10-18 | 2015-04-23 | ヤフー株式会社 | 判定装置、判定方法及び判定プログラム |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2632149C2 (ru) * | 2015-05-06 | 2017-10-02 | Общество С Ограниченной Ответственностью "Яндекс" | Система, способ и постоянный машиночитаемый носитель для проверки веб-страниц |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005148846A (ja) * | 2003-11-11 | 2005-06-09 | Nippon Telegr & Teleph Corp <Ntt> | コンテンツ分類システムおよび方法、コンピュータプログラムおよび記録媒体 |
JP2007323334A (ja) * | 2006-05-31 | 2007-12-13 | Waakuatto:Kk | Webページ抽出システム、これを用いた広告配信システムおよび広告配信プログラム |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7680858B2 (en) | 2006-07-05 | 2010-03-16 | Yahoo! Inc. | Techniques for clustering structurally similar web pages |
-
2009
- 2009-12-30 KR KR1020090134033A patent/KR101076522B1/ko active IP Right Grant
-
2010
- 2010-12-28 JP JP2010294003A patent/JP5634859B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005148846A (ja) * | 2003-11-11 | 2005-06-09 | Nippon Telegr & Teleph Corp <Ntt> | コンテンツ分類システムおよび方法、コンピュータプログラムおよび記録媒体 |
JP2007323334A (ja) * | 2006-05-31 | 2007-12-13 | Waakuatto:Kk | Webページ抽出システム、これを用いた広告配信システムおよび広告配信プログラム |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015079471A (ja) * | 2013-10-18 | 2015-04-23 | ヤフー株式会社 | 判定装置、判定方法及び判定プログラム |
Also Published As
Publication number | Publication date |
---|---|
KR101076522B1 (ko) | 2011-10-24 |
JP5634859B2 (ja) | 2014-12-03 |
KR20110077445A (ko) | 2011-07-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Liu et al. | Analyzing changes in hotel customers’ expectations by trip mode | |
Elmeleegy et al. | Mashup advisor: A recommendation tool for mashup development | |
Phan et al. | A hidden topic-based framework toward building applications with short web documents | |
Boldi et al. | Query suggestions using query-flow graphs | |
Hao et al. | Knowledge map-based method for domain knowledge browsing | |
MX2008001772A (es) | Metodo y sistema para extraer datos de la red. | |
KR101048540B1 (ko) | 연관 키워드에 따른 클러스터를 이용하여 검색 키워드를 분류하는 장치 및 방법 | |
US20100185623A1 (en) | Topical ranking in information retrieval | |
JP2011520193A (ja) | 最もクリックされた次オブジェクトを有する検索結果 | |
Huang et al. | Kb-enabled query recommendation for long-tail queries | |
Bin et al. | Web mining research | |
Jagan et al. | A survey on web personalization of web usage mining | |
Dias et al. | Automating the extraction of static content and dynamic behaviour from e-commerce websites | |
Man et al. | Analysis study on R-Eclat algorithm in infrequent itemsets mining. | |
Wang et al. | Magnet community identification on social networks | |
Katz et al. | Wikiometrics: a Wikipedia based ranking system | |
Rawat et al. | Topic modelling of legal documents using NLP and bidirectional encoder representations from transformers | |
JP5634859B2 (ja) | サイトクラスタシステムおよびサイトクラスタ方法 | |
Gupta et al. | Search bot: Search intention based filtering using decision tree based technique | |
Cuzzola et al. | Automated classification and localization of daily deal content from the Web | |
Dziczkowski et al. | An opinion mining approach for web user identification and clients' behaviour analysis | |
Rana et al. | Analysis of web mining technology and their impact on semantic web | |
Duc et al. | S3g2: A scalable structure-correlated social graph generator | |
KR20150079353A (ko) | 브랜드 이미지 측정장치 및 측정방법 | |
Al-Abdullatif et al. | Using online hotel customer reviews to improve the booking process |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130703 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140110 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140121 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140421 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140930 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141015 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5634859 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |