JP2012141985A - ユーザグループごとにキーワードの順位を決定するシステムおよび方法 - Google Patents
ユーザグループごとにキーワードの順位を決定するシステムおよび方法 Download PDFInfo
- Publication number
- JP2012141985A JP2012141985A JP2011289464A JP2011289464A JP2012141985A JP 2012141985 A JP2012141985 A JP 2012141985A JP 2011289464 A JP2011289464 A JP 2011289464A JP 2011289464 A JP2011289464 A JP 2011289464A JP 2012141985 A JP2012141985 A JP 2012141985A
- Authority
- JP
- Japan
- Prior art keywords
- document
- keyword
- data
- subject
- data set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 26
- 238000004458 analytical method Methods 0.000 claims description 10
- 230000000877 morphologic effect Effects 0.000 claims description 6
- 238000004220 aggregation Methods 0.000 abstract 4
- 230000002776 aggregation Effects 0.000 abstract 4
- 238000010586 diagram Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 235000014510 cooky Nutrition 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003442 weekly effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Computing Systems (AREA)
- General Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【解決手段】キーワード順位決定システムは、ウェブログのデータを予め選定された主題ごとに分類するデータ分類部と、主題ごとに分類されたデータに該当する文書の主題の集中程度を表す文書集中度を算出し、文書集中度に応じる加重値をデータに付与する加重値付与部と、加重値が付与されたデータを検索意図ごとに分類して少なくとも1つのデータ集合を生成するデータ集合生成部と、データ集合間の順位を主題ごとに決定する順位決定部と、データ集合を代表する代表キーワードを決定する代表キーワード決定部とを備える。
【選択図】図1
Description
(b)予め選定された回数以上のクリックの発生に用いられたキーワード
(c)キーワードの長さが長いキーワード
(2)異なる文書がクリックされても、検索語が同一であるか類似していれば、同一の検索意図である。
310 データ分類部
320 加重値付与部
330 順位決定部
340 代表キーワード決定部
Claims (19)
- ウェブログのデータを予め選定された主題ごとに分類するデータ分類部と、
前記主題ごとに分類されたデータに該当する文書の前記主題の集中程度を表す文書集中度を算出し、前記文書集中度に応じる加重値を前記データに付与する加重値付与部と、
前記加重値が付与されたデータを検索意図ごとに分類して少なくとも1つのデータ集合を生成し、前記データ集合間の順位を前記主題ごとに決定する順位決定部と、
前記データ集合を代表する代表キーワードを前記データ集合ごとに決定する代表キーワード決定部と、
を備えることを特徴とするキーワード順位決定システム。 - 前記ウェブログのデータは、文書、前記文書の選択に用いられたキーワード、および前記キーワードに応じて前記文書が選択された選択回数のうち2つ以上に関する情報を含み、
前記加重値付与部は、前記文書が分類された主題に該当する文書である確率および前記文書が全体の主題それぞれに該当する文書である確率を用いて文書ごとに前記文書集中度を算出し、前記文書集中度を前記加重値として付与して前記文書に対する選択回数を調整することを特徴とする請求項1に記載のキーワード順位決定システム。 - 前記順位決定部は、前記文書ごとに調整された選択回数を用いて前記主題に含まれた前記データ集合ごとに占有率を算出し、前記算出された占有率に応じて前記主題におけるデータ集合間の順位を決定することを特徴とする請求項2に記載のキーワード順位決定システム。
- 前記占有率は、前記データ集合における前記選択回数の和および全体データ集合に対する全体選択回数の和を用いて算出されることを特徴とする請求項3に記載のキーワード順位決定システム。
- 前記ウェブログのデータは、文書、前記文書の選択に用いられたキーワード、および前記キーワードに応じて前記文書が選択された選択回数のうち2つ以上に関する情報を含み、
前記順位決定部は、同一の文書に関する情報を含むデータを互いに同一の検索意図に分類し、同一のキーワードまたはキーワード間の類似度が予め選定された値以上であるキーワードを含むデータを互いに同一の検索意図に分類して前記データ集合を生成することを特徴とする請求項1から4のいずれか1項に記載のキーワード順位決定システム。 - 前記ウェブログのデータは、文書、前記文書の選択に用いられたキーワード、および前記キーワードに応じて前記文書が選択された選択回数のうち2つ以上に関する情報を含み、
前記順位決定部は、文書ごとに該当文書の選択に用いられたキーワードに対してキーワード間の類似度を用いて文書をクラスタリングし、同一の文書を含むデータを同一のデータ集合として生成することを特徴とする請求項1から5のいずれか1項に記載のキーワード順位決定システム。 - 前記代表キーワード決定部は、前記データ集合に含まれたキーワードを形態素分析して算出された形態素ごとの重複回数に基づいた加重値、該当キーワードに応じて発生した文書の選択回数に応じた加重値、およびキーワードの長さに応じた加重値のうち少なくとも1つの加重値を用いて前記キーワードの中から前記代表キーワードを決定することを特徴とする請求項1から6のいずれか1項に記載のキーワード順位決定システム。
- 前記形態素ごとの重複回数に基づいた加重値は、最も多い重複回数を有する形態素を含むか否かに応じて決定されることを特徴とする請求項7に記載のキーワード順位決定システム。
- 前記予め選定された主題は、B−クッキーによってユーザを分類し、決定されたユーザグループに応じて分類されることを特徴とする請求項1から8のいずれか1項に記載のキーワード順位決定システム。
- ウェブログのデータを予め選定された主題ごとに分類し、
前記主題ごとに分類されたデータに該当する文書の前記主題の集中程度を表す文書集中度を算出して前記文書集中度に応じる加重値を前記データに付与し、
前記加重値が付与されたデータを検索意図ごとに分類して少なくとも1つのデータ集合を生成して前記データ集合間の順位を前記主題ごとに決定し、
前記データ集合を代表する代表キーワードを前記データ集合ごとに決定すること、
を含むことを特徴とするキーワード順位決定方法。 - 前記ウェブログのデータは、文書、前記文書の選択に用いられたキーワード、および前記キーワードに応じて前記文書が選択された選択回数のうち2つ以上に関する情報を含み、
前記加重値を付与することは、前記文書が分類された主題に該当する文書である確率および前記文書が全体の主題それぞれに該当する文書である確率を用いて文書ごとに文書集中度を算出し、前記文書集中度を前記加重値として付与して前記文書に対する選択回数を調整することを特徴とする請求項10に記載のキーワード順位決定方法。 - 前記データ集合間の順位を前記主題ごとに決定することは、前記文書ごとに調整された選択回数を用いて前記主題に含まれた前記データ集合ごとに占有率を算出し、前記算出された占有率に応じて前記主題におけるデータ集合間の順位を決定することを特徴とする請求項11に記載のキーワード順位決定方法。
- 前記占有率は、前記データ集合における前記選択回数の和および全体データ集合に対する全体選択回数の和を用いて算出されることを特徴とする請求項12に記載のキーワード順位決定方法。
- 前記ウェブログのデータは、文書、前記文書の選択に用いられたキーワード、および前記キーワードに応じて前記文書が選択された選択回数のうち2つ以上に関する情報を含み、
前記データ集合間の順位を前記主題ごとに決定することは、同一の文書に関する情報を含むデータを互いに同一の検索意図に分類し、同一のキーワードまたはキーワード間の類似度が予め選定された値以上であるキーワードを含むデータを互いに同一の検索意図に分類して前記データ集合を生成することを特徴とする請求項10から13のいずれか1項に記載のキーワード順位決定方法。 - 前記ウェブログのデータは、文書、前記文書の選択に用いられたキーワード、および前記キーワードに応じて前記文書が選択された選択回数のうち2つ以上に関する情報を含み、
前記データ集合間の順位を前記主題ごとに決定することは、文書ごとに該当文書の選択に用いられたキーワードに対してキーワード間の類似度を用いて文書をクラスタリングし、同一の文書を含むデータを同一のデータ集合として生成することを特徴とする請求項10から14のいずれか1項に記載のキーワード順位決定方法。 - 前記データ集合を代表する代表キーワードを前記データ集合ごとに決定することは、前記データ集合に含まれたキーワードを形態素分析して算出された形態素ごとの重複回数に基づいた加重値、該当キーワードに応じて発生した文書の選択回数に応じた加重値、およびキーワードの長さに応じた加重値のうち少なくとも1つの加重値を用いて前記キーワードの中から前記代表キーワードを決定することを特徴とする請求項10から15のいずれか1項に記載のキーワード順位決定方法。
- 前記形態素ごとの重複回数に基づいた加重値は、最も多い重複回数を有する形態素を含むか否かに応じて決定されることを特徴とする請求項16に記載のキーワード順位決定方法。
- 前記予め選定された主題は、B−クッキーによってユーザを分類し、決定されたユーザグループに応じて分類されることを特徴とする請求項10から17のいずれか1項に記載のキーワード順位決定方法。
- 請求項10から18のいずれか1項の方法を行うプログラムを記録したコンピュータで読み出し可能な記録媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2010-0138879 | 2010-12-30 | ||
KR1020100138879A KR101274419B1 (ko) | 2010-12-30 | 2010-12-30 | 사용자 그룹별로 키워드의 순위를 결정하는 시스템 및 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012141985A true JP2012141985A (ja) | 2012-07-26 |
JP5865076B2 JP5865076B2 (ja) | 2016-02-17 |
Family
ID=46381712
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011289464A Active JP5865076B2 (ja) | 2010-12-30 | 2011-12-28 | ユーザグループごとにキーワードの順位を決定するシステムおよび方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US9262790B2 (ja) |
JP (1) | JP5865076B2 (ja) |
KR (1) | KR101274419B1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2014050981A1 (ja) * | 2012-09-27 | 2016-08-22 | 日本電気株式会社 | テキスト情報監視用辞書作成装置、テキスト情報監視用辞書作成方法、及び、テキスト情報監視用辞書作成プログラム |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104077407B (zh) * | 2014-07-10 | 2017-06-16 | 中国工商银行股份有限公司 | 一种智能数据搜索系统及方法 |
CN105574015A (zh) * | 2014-10-13 | 2016-05-11 | 阿里巴巴集团控股有限公司 | 搜索推荐方法和装置 |
KR101708444B1 (ko) * | 2015-11-16 | 2017-02-22 | 주식회사 위버플 | 키워드 및 자산 가격 관련성 평가 방법 및 그 장치 |
KR101931859B1 (ko) * | 2016-09-29 | 2018-12-21 | (주)시지온 | 전자문서의 대표 단어 선정 방법, 전자 문서 제공 방법, 및 이를 수행하는 컴퓨팅 시스템 |
CN109660580B (zh) * | 2017-10-11 | 2021-06-22 | 苏州跃盟信息科技有限公司 | 一种信息推送方法及装置 |
CN108776679B (zh) * | 2018-05-30 | 2021-12-07 | 百度在线网络技术(北京)有限公司 | 一种搜索词的分类方法、装置、服务器及存储介质 |
JP2022096218A (ja) * | 2020-12-17 | 2022-06-29 | キヤノン株式会社 | 情報処理装置、情報処理システム、その制御方法及びプログラム |
CN113449145B (zh) * | 2021-06-29 | 2023-11-10 | 乐视云网络技术(北京)有限公司 | 视频搜索结果排序调整方法、装置、电子设备和计算机可读存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100452086B1 (ko) * | 2003-12-22 | 2004-10-13 | 엔에이치엔(주) | 카테고리 별 키워드의 입력 순위를 제공하기 위한 검색서비스 시스템 및 그 방법 |
JP2008299839A (ja) * | 2007-05-31 | 2008-12-11 | Nhn Corp | キーワード推薦方法、コンピュータ読み取り可能な記録媒体、キーワード推薦システム |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5864848A (en) * | 1997-01-31 | 1999-01-26 | Microsoft Corporation | Goal-driven information interpretation and extraction system |
US6493703B1 (en) * | 1999-05-11 | 2002-12-10 | Prophet Financial Systems | System and method for implementing intelligent online community message board |
WO2002010945A1 (en) * | 2000-08-02 | 2002-02-07 | Biospace.Com, Inc. | Apparatus and method for producing contextually marked-up electronic content |
MXPA03006566A (es) * | 2001-01-23 | 2004-10-15 | Educational Testing Service | Metodo para el analisis automatico de examenes. |
US7028026B1 (en) * | 2002-05-28 | 2006-04-11 | Ask Jeeves, Inc. | Relevancy-based database retrieval and display techniques |
US8086619B2 (en) * | 2003-09-05 | 2011-12-27 | Google Inc. | System and method for providing search query refinements |
US7689585B2 (en) | 2004-04-15 | 2010-03-30 | Microsoft Corporation | Reinforced clustering of multi-type data objects for search term suggestion |
US20060218153A1 (en) * | 2005-03-28 | 2006-09-28 | Voon George H H | Building social networks using shared content data relating to a common interest |
US20060265362A1 (en) * | 2005-05-18 | 2006-11-23 | Content Analyst Company, Llc | Federated queries and combined text and relational data |
US20060282303A1 (en) * | 2005-06-08 | 2006-12-14 | Microsoft Corporation | Distributed organizational analyzer |
US7421429B2 (en) * | 2005-08-04 | 2008-09-02 | Microsoft Corporation | Generate blog context ranking using track-back weight, context weight and, cumulative comment weight |
US7765209B1 (en) * | 2005-09-13 | 2010-07-27 | Google Inc. | Indexing and retrieval of blogs |
US20070271146A1 (en) * | 2005-10-20 | 2007-11-22 | Ebags.Com | Method and apparatus for matching and/or coordinating shoes handbags and other consumer products |
US7685091B2 (en) * | 2006-02-14 | 2010-03-23 | Accenture Global Services Gmbh | System and method for online information analysis |
KR100785754B1 (ko) | 2006-03-22 | 2007-12-18 | 엔에이치엔(주) | 지역별 실시간 키워드 순위 결정 방법 및 지역별 실시간키워드 순위 결정 시스템 |
US8296168B2 (en) * | 2006-09-13 | 2012-10-23 | University Of Maryland | System and method for analysis of an opinion expressed in documents with regard to a particular topic |
US20080282186A1 (en) * | 2007-05-11 | 2008-11-13 | Clikpal, Inc. | Keyword generation system and method for online activity |
KR100892263B1 (ko) * | 2007-08-01 | 2009-04-09 | 주식회사 다음커뮤니케이션 | 카테고리별 키워드 추천 시스템 및 방법 |
US20100131455A1 (en) * | 2008-11-19 | 2010-05-27 | Logan James D | Cross-website management information system |
MX2011006340A (es) * | 2008-12-12 | 2011-10-28 | Atigeo Llc | Suministro de recomendaciones utilizando la informacion determinada para dominios de interés. |
US8290926B2 (en) * | 2010-01-21 | 2012-10-16 | Microsoft Corporation | Scalable topical aggregation of data feeds |
-
2010
- 2010-12-30 KR KR1020100138879A patent/KR101274419B1/ko active IP Right Grant
-
2011
- 2011-12-27 US US13/337,741 patent/US9262790B2/en active Active
- 2011-12-28 JP JP2011289464A patent/JP5865076B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100452086B1 (ko) * | 2003-12-22 | 2004-10-13 | 엔에이치엔(주) | 카테고리 별 키워드의 입력 순위를 제공하기 위한 검색서비스 시스템 및 그 방법 |
US20070130139A1 (en) * | 2003-12-22 | 2007-06-07 | Nhn Corporation | Search system for providing information of keyword input freguency by category and method thereof |
JP2007528531A (ja) * | 2003-12-22 | 2007-10-11 | エヌエイチエヌ コーポレーション | カテゴリ別のキーワードの入力順位を提供するための検索サービスシステムおよびその方法 |
JP2008299839A (ja) * | 2007-05-31 | 2008-12-11 | Nhn Corp | キーワード推薦方法、コンピュータ読み取り可能な記録媒体、キーワード推薦システム |
KR20090001997A (ko) * | 2007-05-31 | 2009-01-09 | 엔에이치엔(주) | 키워드 추천 방법 및 그 시스템 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2014050981A1 (ja) * | 2012-09-27 | 2016-08-22 | 日本電気株式会社 | テキスト情報監視用辞書作成装置、テキスト情報監視用辞書作成方法、及び、テキスト情報監視用辞書作成プログラム |
Also Published As
Publication number | Publication date |
---|---|
KR20120077055A (ko) | 2012-07-10 |
JP5865076B2 (ja) | 2016-02-17 |
KR101274419B1 (ko) | 2013-06-17 |
US20120173542A1 (en) | 2012-07-05 |
US9262790B2 (en) | 2016-02-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5865076B2 (ja) | ユーザグループごとにキーワードの順位を決定するシステムおよび方法 | |
US9576251B2 (en) | Method and system for processing web activity data | |
US9443008B2 (en) | Clustering of search results | |
US8321278B2 (en) | Targeted advertisements based on user profiles and page profile | |
JP6517818B2 (ja) | ウェブサイト・トラフィック最適化の改善 | |
US8990208B2 (en) | Information management and networking | |
RU2382400C2 (ru) | Построение и применение веб-каталогов для фокусированного поиска | |
JP5608286B2 (ja) | 無限ブラウズ | |
TWI471737B (zh) | 具搜尋結果之蹤跡識別系統與方法 | |
US8306962B1 (en) | Generating targeted paid search campaigns | |
JP5377829B2 (ja) | 関連性のある情報源を決定し、クエリし、複数のコンテンツ情報源からの結果をマージするための方法とシステム | |
CN107862022B (zh) | 文化资源推荐系统 | |
US20110258148A1 (en) | Active prediction of diverse search intent based upon user browsing behavior | |
US20110119209A1 (en) | Method and system for developing a classification tool | |
JP2014504754A (ja) | 環境入力に基づいて情報を提供するために、知識表現を使用するシステム及び方法 | |
EP2827294A1 (en) | Systems and method for determining influence of entities with respect to contexts | |
Kirsh et al. | Splitting the web analytics atom: from page metrics and KPIs to sub-page metrics and KPIs | |
KR100954842B1 (ko) | 카테고리 태그 정보를 이용한 웹 페이지 분류 방법, 그 시스템 및 이를 기록한 기록매체 | |
US11941073B2 (en) | Generating and implementing keyword clusters | |
TWI480749B (zh) | 識別有機搜索引擎優化機會之方法 | |
Li | Internet tourism resource retrieval using PageRank search ranking algorithm | |
CN109977292A (zh) | 搜索方法、装置、计算设备和计算机可读存储介质 | |
Budhiraja et al. | Coverage pattern based framework to improve search engine advertising | |
US20200311761A1 (en) | System and method for analyzing the effectiveness and influence of digital online content | |
Rong et al. | Research on Web log mining |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140623 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150421 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150424 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150721 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150825 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151113 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20151208 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20151225 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5865076 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |