KR20090093153A - Method and system for providing relevance site using chracteristic word of site - Google Patents

Method and system for providing relevance site using chracteristic word of site

Info

Publication number
KR20090093153A
KR20090093153A KR1020080018511A KR20080018511A KR20090093153A KR 20090093153 A KR20090093153 A KR 20090093153A KR 1020080018511 A KR1020080018511 A KR 1020080018511A KR 20080018511 A KR20080018511 A KR 20080018511A KR 20090093153 A KR20090093153 A KR 20090093153A
Authority
KR
South Korea
Prior art keywords
site
word
characteristic
search
sites
Prior art date
Application number
KR1020080018511A
Other languages
Korean (ko)
Other versions
KR101042445B1 (en
Inventor
김병학
Original Assignee
엔에이치엔(주)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엔에이치엔(주) filed Critical 엔에이치엔(주)
Priority to KR1020080018511A priority Critical patent/KR101042445B1/en
Publication of KR20090093153A publication Critical patent/KR20090093153A/en
Application granted granted Critical
Publication of KR101042445B1 publication Critical patent/KR101042445B1/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Abstract

A linkage site providing method and a system thereof using a site characteristic word supplying the site related to a specific site are provided to supply information about the keyword. A keyword exposing unit(601) exposes one or more search word flowed in a site. In case one is selected between exposed one or more search word and one, a related site detector(602) detects the linkage site about the search word. A property word determiner(604) determines one or more property word about the collected site. In case one includes the search word among determined one or more property word, a related site determiner(605) determines the search word and site as the linkage site.

Description

사이트 특성 단어를 이용한 연관 사이트 제공 방법 및 시스템{METHOD AND SYSTEM FOR PROVIDING RELEVANCE SITE USING CHRACTERISTIC WORD OF SITE}METHOD AND SYSTEM FOR PROVIDING RELEVANCE SITE USING CHRACTERISTIC WORD OF SITE}

본 발명은 연관 사이트 제공 방법 및 시스템에 관한 것으로, 보다 상세하게는 검색어와 연관된 사이트, 특정 사이트와 연관된 사이트를 제공하는 연관 사이트 제공 방법 및 시스템에 관한 것이다.The present invention relates to a method and system for providing a related site, and more particularly, to a related site providing method and system for providing a site associated with a search word and a site associated with a specific site.

사용자들은 자신이 개설하거나 타인이 개설한 미니홈피, 블로그 또는 카페 등과 같은 사이트에 어떤 검색어를 통해 접근하는지 알고 싶어하는 경우가 종종 있다. 예를 들어, 블로그 등에 '와인', '축구' 등과 관련된 글을 게재하는 사용자는 자신이 게시한 '와인'에 대한 글을 타인이 어떤 검색어를 통해 사이트에 유입하는 지 알고 싶어하는 경우가 있다. 유입되는 검색어를 분석함으로써, 타인의 관심도를 파악할 수 있고, 사용자는 이러한 타인의 관심도를 반영하여 보다 효과적으로 자신의 글을 최상위로 노출시킬 수 있는 기회가 많아질 수 있다. 또한, 유입된 검색어를 분석하여 타인의 관심도를 파악함으로써 자신의 블로그를 보다 효과적으로 광고하고, 노출시킬 수 있다.Users often want to know what search terms they access through sites like their own homepages, blogs, or cafes. For example, a user who posts articles related to 'wine' or 'soccer' on a blog or the like may want to know what search terms other people enter the site about. By analyzing the incoming search words, it is possible to grasp the interests of others, and the user may have more opportunities to more effectively expose his or her posts by reflecting the interests of others. In addition, by analyzing the searched words to find out the interests of others, you can more effectively advertise and expose your blog.

또한, 유입된 검색어를 분석함으로써, 해당 검색어와 관련이 있는 사이트를 검색할 필요성도 요구될 수 있다. 더 나아가, 특정 사이트에 대해 관련이 있는 사이트를 검색하고자 하는 필요성도 제기될 수 있다. 이러한 검색어의 역추적을 통해 효과적으로 사이트를 홍보할 수 있다. 그리고, 사이트의 문서에 포함된 내용을 대중에 보다 효과적으로 게시할 수 있다. 결국, 이러한 잠재적인 홍보 효과를 요구하는 만족시킬 수 있는 발명이 요구되고 있다.In addition, by analyzing the imported search words, a need to search for a site related to the search word may be required. Furthermore, the need to search for relevant sites for a particular site may be raised. By backtracking these search terms, you can effectively promote your site. In addition, the contents of the site's documents can be posted more effectively to the public. As a result, there is a need for a satisfactory invention that requires such potential promotional effects.

본 발명은 미니홈피, 블로그 또는 카페 등과 같은 각종 사이트에 접근하기 위해 유입된 검색어를 노출시킴으로써, 상기 사이트에 접근하는데 유입된 검색어에 대한 정보를 제공할 수 있는 연관 사이트 제공 방법 및 시스템을 제공한다.The present invention provides a method and system for providing a related site that can provide information about a search word introduced in accessing the site by exposing a search word introduced to access various sites such as a mini homepage, a blog or a cafe.

본 발명은 노출된 검색어에 대해 선택하는 경우, 검색어와 링크로 연결된 연관 사이트를 제공함으로써, 검색어에 대한 추가적인 정보를 제공할 수 있는 연관 사이트 제공 방법 및 시스템을 제공한다.The present invention provides a related site providing method and system that can provide additional information on a search word by providing a related site linked with the search word when selecting the exposed search word.

본 발명은 검색어, 색인어, 태그 단어, 카테고리 단어와 같은 사이트의 특성 단어를 이용하여 연관 사이트를 검출함으로써 특성 단어의 내용을 반영하는 연관 사이트를 용이하게 검색할 수 있는 연관 사이트 제공 방법 및 시스템을 제공한다.The present invention provides a method and system for providing a related site that can easily search for related sites that reflect the content of the specific word by detecting the related site by using characteristic words of the site such as search terms, index words, tag words, and category words. do.

본 발명은 미니홈피, 블로그 또는 카페 등과 같은 사이트 간에 특성 정보를 이용하여 사이트 간 연관도를 파악함으로써, 특정 사이트에 대한 연관 사이트를 검출할 수 있는 연관 사이트 제공 방법 및 시스템을 제공한다.The present invention provides a method and system for providing a related site that can detect a related site for a specific site by grasping the degree of association between the sites by using characteristic information between sites such as a mini homepage, a blog or a cafe.

본 발명의 일실시예에 따른 연관 사이트 제공 방법은 사이트에 유입된 적어도 하나의 검색어를 노출하는 단계, 상기 노출된 적어도 하나의 검색어 중 어느 하나가 선택된 경우, 상기 검색어에 대한 연관 사이트를 검출하는 단계 및 상기 선택된 검색어와 링크로 연결하여 상기 검출된 연관 사이트를 제공하는 단계를 포함한다.In accordance with another aspect of the present invention, there is provided a method for providing a related site, including: exposing at least one search term introduced to a site; detecting one of the at least one search term related to the search term; And providing the detected related site by linking with the selected search word.

본 발명의 일실시예에 따른 연관 사이트 제공 방법은 사이트에 대한 적어도 하나의 특성 단어를 결정하여 상기 특성 단어 각각의 단어 벡터를 생성하는 단계, 상기 생성된 사이트 단어 벡터를 이용하여 사이트 사이의 단어 벡터 연관도를 계산하는 단계 및 상기 단어 벡터 연관도를 이용하여 연관 사이트를 검출하는 단계를 포함한다.In accordance with an embodiment of the present invention, a method for providing an associated site includes determining at least one characteristic word for a site and generating a word vector of each characteristic word, and using the generated site word vector, a word vector between sites. Calculating an association degree and detecting an association site using the word vector association degree.

본 발명의 일실시예에 따른 연관 사이트 제공 시스템은 사이트에 유입된 적어도 하나의 검색어를 노출하는 검색어 노출부, 상기 노출된 적어도 하나의 검색어 중 어느 하나가 선택된 경우, 상기 검색어에 대한 연관 사이트를 검출하는 연관 사이트 검출부 및 상기 선택된 검색어와 링크로 연결하여 상기 검출된 연관 사이트를 제공하는 연관 사이트 제공부를 포함한다.Related site providing system according to an embodiment of the present invention is a search term exposure unit that exposes at least one search term introduced to the site, when any one of the at least one of the exposed search terms, the associated site for the search term is detected And an associated site detector for connecting the selected search word with a link and providing the detected related site.

본 발명의 일실시예에 따른 연관 사이트 제공 시스템은 사이트에 대한 적어도 하나의 특성 단어를 결정하여 상기 특성 단어 각각의 단어 벡터를 생성하는 단어 벡터 생성부, 상기 생성된 사이트 단어 벡터를 이용하여 사이트 사이의 단어 벡터 연관도를 계산하는 단어 벡터 연관도 계산부 및 상기 단어 벡터 연관도를 이용하여 연관 사이트를 검출하는 연관 사이트 검출부를 포함한다.According to an embodiment of the present invention, an associated site providing system includes a word vector generator configured to determine at least one feature word for a site and to generate a word vector of each feature word, and between sites using the generated site word vector. And a word vector relevance calculator for calculating a word vector relevance of and a related site detector for detecting a related site using the word vector relevance.

본 발명에 따르면, 미니홈피, 블로그 또는 카페 등과 같은 각종 사이트에 접근하기 위해 유입된 검색어를 노출시킴으로써, 상기 사이트에 접근하는데 유입된 검색어에 대한 정보를 제공할 수 있는 연관 사이트 제공 방법 및 시스템이 제공된다.According to the present invention, a method and system for providing a related site that can provide information on a search word introduced to access the site by exposing a search word introduced to access various sites such as a mini homepage, a blog or a cafe, etc. do.

본 발명에 따르면, 노출된 검색어에 대해 선택하는 경우, 검색어와 링크로 연결된 연관 사이트를 제공함으로써, 검색어에 대한 추가적인 정보를 제공할 수 있는 연관 사이트 제공 방법 및 시스템이 제공된다.According to the present invention, a method and system for providing a related site which can provide additional information about a search word by providing a related site linked with the search word when selecting the exposed search word are provided.

본 발명에 따르면, 검색어, 색인어, 태그 단어, 카테고리 단어와 같은 사이트의 특성 단어를 이용하여 연관 사이트를 검출함으로써 특성 단어의 내용을 반영하는 연관 사이트를 용이하게 검색할 수 있는 연관 사이트 제공 방법 및 시스템이 제공된다.According to the present invention, a method and system for providing a related site that can easily search for a related site reflecting the content of the specific word by detecting the related site by using the characteristic word of the site such as a search word, an index word, a tag word, and a category word. This is provided.

본 발명에 따르면, 미니홈피, 블로그 또는 카페 등과 같은 사이트 간에 특성 정보를 이용하여 사이트 간 연관도를 파악함으로써, 특정 사이트에 대한 연관 사이트를 검출할 수 있는 연관 사이트 제공 방법 및 시스템이 제공된다.According to the present invention, there is provided a related site providing method and system capable of detecting a related site for a specific site by grasping the degree of association between sites using characteristic information between sites such as a mini homepage, a blog or a cafe.

도 1은 본 발명의 일실시예에 따른 연관 사이트 제공 방법을 도시한 플로우차트이다. 1 is a flowchart illustrating a method for providing a related site according to an embodiment of the present invention.

도 2는 본 발명의 일실시예에 따른 연관 사이트 제공 방법에 따라 사이트에 유입된 검색어를 노출하는 일례를 도시한 도면이다.2 is a diagram illustrating an example of exposing a search word introduced to a site according to a related site providing method according to an exemplary embodiment of the present invention.

도 3은 본 발명의 일실시예에 따른 선택된 검색어에 대해 연관 사이트를 제공하는 과정을 설명하기 위한 도면이다.3 is a diagram illustrating a process of providing a related site for a selected search word according to an embodiment of the present invention.

도 4는 본 발명의 다른 일실시예에 따른 연관 사이트 제공 방법을 도시한 플로우차트이다.4 is a flowchart illustrating a method for providing a related site according to another embodiment of the present invention.

도 5는 본 발명의 일실시예에 따른 사이트와 사이트 간 사이트 단어 벡터의 연관도를 통해 연관 사이트를 검출하는 과정을 설명하기 위한 도면이다.FIG. 5 is a diagram for describing a process of detecting an associated site through a degree of association between a site and a site word vector between sites according to an embodiment of the present invention.

도 6은 본 발명의 일실시예에 따른 연관 사이트 제공 시스템을 도시한 블록 다이어그램이다.6 is a block diagram illustrating an associated site providing system according to an embodiment of the present invention.

도 7은 본 발명의 다른 일실시예에 따른 연관 사이트 제공 시스템을 도시한 블록 다이어그램이다.7 is a block diagram illustrating a related site providing system according to another exemplary embodiment of the present invention.

<도면의 주요 부분에 대한 부호의 설명><Description of the symbols for the main parts of the drawings>

600: 연관 사이트 제공 시스템600: related site providing system

601: 검색어 노출부601: Query exposed portion

602: 연관 사이트 검출부602: associated site detection unit

603: 연관 사이트 제공부603: related site provider

604: 특성 단어 결정부604: characteristic word determination unit

605: 연관 사이트 판단부605: association site determination unit

이하, 첨부된 도면들에 기재된 내용들을 참조하여 본 발명에 따른 실시예를 상세하게 설명한다. 다만, 본 발명이 실시예들에 의해 제한되거나 한정되는 것은 아니다. 각 도면에 제시된 동일한 참조부호는 동일한 부재를 나타낸다. 본 발명의 일실시예에 따른 연관 사이트 제공 방법은 연관 사이트 제공 시스템에 의해 수행될 수 있다.Hereinafter, with reference to the contents described in the accompanying drawings will be described in detail an embodiment according to the present invention. However, the present invention is not limited or limited by the embodiments. Like reference numerals in the drawings denote like elements. The method for providing a related site according to an embodiment of the present invention may be performed by a related site providing system.

도 1은 본 발명의 일실시예에 따른 연관 사이트 제공 방법을 도시한 플로우차트이다. 1 is a flowchart illustrating a method for providing a related site according to an embodiment of the present invention.

본 발명의 일실시예에 따른 연관 사이트 제공 방법은 사이트에 유입된 적어도 하나의 검색어를 노출할 수 있다(S101). 일례로, 사이트에 유입된 적어도 하나의 검색어는 노출하는 단계(S101)는 상기 적어도 하나의 검색어 및 상기 적어도 하나의 검색어 각각에 대한 사이트 유입률을 노출할 수 있다. 이 때, 사이트에 유입된 적어도 하나의 검색어는 노출하는 단계(S101)는 상기 적어도 하나의 검색어를 검색어 각각의 유입률에 따라 정렬하여 노출할 수 있다. 일례로, 사이트는 미니홈피, 블로그 또는 카페를 포함할 수 있다. 사이트의 종류는 한정되지 않고, 온라인 상에서 URL 등의 링크를 통해 접속할 수 있는 것이면 모두 포함될 수 있다.The method of providing a related site according to an embodiment of the present invention may expose at least one search word introduced to a site (S101). For example, in the step S101 of exposing at least one search word introduced to the site, the site inflow rate for each of the at least one search word and the at least one search word may be exposed. In this case, in the step of exposing at least one search word introduced to the site (S101), the at least one search word may be arranged and exposed according to the inflow rate of each search word. In one example, the site may include a minihompy, a blog or a cafe. The type of site is not limited, and any site can be included as long as it can be accessed through a link such as a URL online.

일례로, 검색어에 대한 사이트 유입률은 해당 사이트에 접근한 횟수와 검색어 별 접근 횟수로 계산될 수 있다. 예를 들어, 'A'사이트에 a, b, c라는 검색어로 유입되었다고 가정할 수 있다. 이 때, 'A'사이트에 접근한 횟수가 총 100건이고, 이 중 검색어 'a'로 유입된 횟수가 50건, 검색어 'b로 유입된 횟수가 37건, 검색어 'c'로 유입된 횟수가 13건이라고 하자. 그러면, 검색어 각각에 대한 사이트 유입률은 검색어 'a'의 경우 50%, 검색어 'b의 경우 37%, 검색어 'c의 경우 13%로 계산될 수 있다. 그리고, 사이트에 유입된 적어도 하나의 검색어는 노출하는 단계(S101)는 사이트 유입률에 따라 'a', 'b', 'c' 순으로 정렬하여 노출할 수 있다.For example, the site inflow rate for a search term may be calculated by the number of times of accessing the corresponding site and the number of accesses per search term. For example, it may be assumed that the search words a, b, and c flow into the 'A' site. At this time, the total number of times 'A' site was accessed was 100, of which 50 flowed into the query 'a', 37 flowed into the query 'b', and flowed into the query 'c'. Let's say 13 cases. Then, the site inflow rate for each search term may be calculated as 50% for search term 'a', 37% for search term 'b' and 13% for search term 'c'. In operation S101, at least one search word introduced to a site may be exposed in a sorted order of 'a', 'b', and 'c' according to the site inflow rate.

본 발명의 일실시예에 따른 연관 사이트 제공 방법은 상기 노출된 적어도 하나의 검색어 중 어느 하나가 선택된 경우, 상기 검색어에 대한 연관 사이트를 검출할 수 있다(S102). 상기 예를 참조하면, 사용자가 'b' 검색어를 선택하는 경우, 검색어에 대한 연관 사이트를 검출하는 단계(S102)는 'b' 검색어에 대한 연관 사이트를 검출할 수 있다.In the method of providing a related site according to an embodiment of the present invention, when any one of the at least one search term is selected, the related site for the search term may be detected (S102). Referring to the above example, when the user selects the 'b' search word, detecting the related site for the search word (S102) may detect the related site for the 'b' search word.

보다 구체적으로, 'abcde' 블로그에 대한 검색어 유입 순위 1위로 '재즈'라는 검색어가 노출된 경우, 사용자가 '재즈'를 선택하면, 연관 사이트 제공 방법은 '재즈'와 연관있는 블로그, 카페 또는 미니홈피 등과 같은 연관 사이트를 검출하여 제공할 수 있다. 즉, 본 발명의 일실시예에 따른 연관 사이트 제공 방법은 특정 검색어와 연관이 있는 연관 사이트를 제공할 수 있다.More specifically, if the search query 'Jazz' is ranked as the top search term inflow for the 'abcde' blog, and the user selects 'Jazz', the relevant site is provided by the blog, cafe or mini associated with 'Jazz'. Related sites such as homepages can be detected and provided. That is, the method for providing a related site according to an embodiment of the present invention may provide a related site associated with a specific search word.

일례로, 검색어에 대한 연관 사이트를 검출하는 단계(S102)는 사이트를 수집하여 상기 수집된 사이트에 대한 적어도 하나의 특성 단어를 결정할 수 있다. 이 때, 검색어에 대한 연관 사이트를 검출하는 단계(S102)는 수집할 수 있는 모든 범위의 사이트를 수집하여 데이터베이스에 저장할 수 있다. 그리고, 검색어에 대한 연관 사이트를 검출하는 단계(S102)는 데이터베이스에 저장된 사이트에 대한 적어도 하나의 특성 단어를 결정할 수 있다. 이 때, 특성 단어는 해당 사이트의 대표적인 특성을 나타내는 단어라고 할 수 있다. 다만, 사이트 내 다수의 목록을 통해 다양한 종류의 글이 포스팅된 경우, 특성 단어는 하나 이상일 수 있다.In one example, detecting the associated site for the search word (S102) may collect the site to determine at least one characteristic word for the collected site. At this time, the step (S102) of detecting a related site for a search word may collect all the ranges of sites that can be collected and store them in a database. In operation S102, detecting an associated site for a search word may determine at least one characteristic word for a site stored in a database. In this case, the characteristic word may be a word representing a representative characteristic of the corresponding site. However, when various kinds of articles are posted through a plurality of lists in the site, the characteristic word may be one or more.

이 때, 상기 적어도 하나의 특성 단어를 결정하는 단계는 사이트의 문서에 접근하기 위해 유입된 적어도 하나의 검색어를 상기 사이트의 특성 단어로 결정할 수 있다. 일례로, 사이트의 문서에 접근하기 위해 유입된 적어도 하나의 검색어는 미리 설정한 기간 동안 누적된 검색 로그 데이터를 통해 결정될 수 있다.In this case, the determining of the at least one characteristic word may determine the at least one search word introduced to access the document of the site as the characteristic word of the site. For example, the at least one search word introduced to access the document of the site may be determined through the search log data accumulated during the preset period.

또한, 상기 적어도 하나의 특성 단어를 결정하는 단계는 상기 사이트에 포함된 문서에 대한 적어도 하나의 색인어를 상기 사이트의 특성 단어로 결정할 수 있다. 즉, 수집된 사이트에 포함된 문서의 특성을 나타낼 수 있는 색인어를 사이트의 특성 단어로 결정할 수 있다. 예를 들어, '와인'과 관련된 블로그의 경우, 해당 블로그에 포함된 문서는 '와인'에 관한 내용을 포함할 수 있으며 색인어도 '와인'과 관련 있는 단어일 수 있다.In the determining of the at least one characteristic word, the at least one index word for the document included in the site may be determined as the characteristic word of the site. That is, the index word that can represent the characteristics of the documents included in the collected site may be determined as the characteristic words of the site. For example, in the case of a blog related to 'wine', a document included in the blog may include content related to 'wine' and an index word may be a word related to 'wine'.

이 때, 사이트의 전체 문서에 공통으로 자주 노출되는 단어 또는 거의 노출되지 않는 단어가 색인어가 되는 경우, 상기 색인어가 사이트의 특성을 효율적으로 반영되지 않을 수 있다. 따라서, 상기 적어도 하나의 특성 단어를 결정하는 단계는 상기 적어도 하나의 색인어 중 미리 설정한 문서 노출 빈도 범위에 속하는 색인어를 상기 사이트의 특성 단어로 결정할 수 있다.At this time, when a word that is frequently exposed or a word that is rarely exposed to the entire document of the site becomes an index word, the index word may not efficiently reflect the characteristics of the site. Accordingly, in the determining of the at least one characteristic word, the index word belonging to a preset document exposure frequency range among the at least one index word may be determined as the characteristic word of the site.

또한, 상기 적어도 하나의 특성 단어를 결정하는 단계는 상기 사이트에 포함된 문서를 작성할 때 입력된 적어도 하나의 태그 단어를 상기 사이트의 특성 단어로 결정할 수 있다. 이 때, 태그 단어는 문서 작성자가 문서의 내용에 대한 대표적인 특징으로 입력한 단어라고 할 수 있다. In the determining of the at least one characteristic word, the at least one tag word input when a document included in the site may be determined as the characteristic word of the site. In this case, the tag word may be a word input by the document creator as a representative feature of the content of the document.

또한, 상기 적어도 하나의 특성 단어를 결정하는 단계는 상기 사이트에 포함된 문서를 분류하는 적어도 하나의 카테고리 단어를 상기 사이트의 특성 단어로 결정할 수 있다. 즉, 사이트의 관리자가 문서를 분류하기 위해 생성한 카테고리 (예를 들면, 음악, 여행, 사진 등)가 해당 사이트의 특성 단어가 될 수 있다.In the determining of the at least one characteristic word, the at least one category word for classifying a document included in the site may be determined as the characteristic word of the site. That is, a category (eg, music, travel, photo, etc.) generated by the administrator of the site to classify the document may be a characteristic word of the site.

또한, 검색어에 대한 연관 사이트를 검출하는 단계(S102)는 상기 결정된 적어도 하나의 특성 단어가 상기 검색어와 연관 관계에 있는 경우, 상기 사이트를 상기 검색어에 대한 연관 사이트로 판단할 수 있다.In operation S102, when the determined at least one characteristic word is related to the search word, the site may be determined as the related site for the search word.

예를 들면, 'A'라는 검색어가 선택되었을 때, 수집된 사이트 중 결정된 특성 단어가 'A'와 연관 관계에 있는 사이트는 'A' 검색어와 관련된 문서를 포함하고 있다. 따라서, 결정된 특성 단어가 'A'와 연관 관계에 있는 사이트는 'A' 검색어와 연관이 있다고 할 수 있다.For example, when a search word 'A' is selected, a site whose characteristic word is determined to be associated with 'A' among collected sites includes a document related to the search word 'A'. Therefore, it can be said that a site whose determined characteristic word is related to 'A' is related to 'A' search term.

이 때, 검색어와 특성 단어가 완전히 동일한 것에 한정되지 않고, 유사하거나 동종 분야에 있는 등 연관 관계를 이루고 있는 경우, 특성 단어를 포함하는 사이트는 검색어에 대한 연관 사이트로 검출될 수 있다.In this case, when the search word and the characteristic word are not limited to the same thing and are related in the same or similar fields, the site including the characteristic word may be detected as the related site for the search word.

본 발명의 일실시예에 따른 연관 사이트 제공 방법은 상기 선택된 검색어와 링크로 연결하여 상기 검출된 연관 사이트를 제공할 수 있다(S103). 일례로, 검출된 연관 사이트를 제공하는 단계(S103)는 검색어와 연관 관계에 있는 다수의 연관 사이트의 목록을 제공할 수 있다. 또한, 일례로, 검출된 연관 사이트를 제공하는 단계(S103)는 상기 검출된 연관 사이트에 포함된 문서 중 상기 선택된 검색어가 노출된 문서를 제공할 수 있다.The method for providing a related site according to an embodiment of the present invention may provide the detected related site by linking the selected search word with a link (S103). In one example, providing a detected related site (S103) may provide a list of a plurality of related sites that are associated with a search term. Also, as an example, providing a detected related site (S103) may provide a document in which the selected search word is exposed among documents included in the detected related site.

도 2는 본 발명의 일실시예에 따른 연관 사이트 제공 방법에 따라 사이트에 유입된 검색어를 노출하는 일례를 도시한 도면이다.2 is a diagram illustrating an example of exposing a search word introduced to a site according to a related site providing method according to an exemplary embodiment of the present invention.

도 2는, 사용자가 A사이트(202)를 입력하는 경우, A사이트에 유입된 검색어 순위를 제공하는 검색 결과(201)를 나타내고 있다. 앞에서 언급했듯이, 사이트는 미니홈피, 블로그 또는 카페를 포함할 수 있다.FIG. 2 shows a search result 201 that provides a ranking of search terms flowing into the A site when the user inputs the A site 202. As mentioned earlier, the site can include a minihompy, a blog or a cafe.

도 3의 검색어 리스트(203)를 참고하면, A 사이트에 유입된 검색어 중 가장 많이 유입된 적어도 하나의 검색어가 도시되고 있다. 상기 검색어 각각은 유입률과 함께 노출될 수 있으며, 이 때, 검색어 순위는 유입률에 따라 결정될 수 있다.Referring to the search word list 203 of FIG. 3, at least one search word most introduced among the search words introduced to the site A is illustrated. Each of the search terms may be exposed together with an inflow rate, and the search term ranking may be determined according to the inflow rate.

본 발명의 일실시예에 따른 연관 사이트 제공 방법은 사용자가 노출된 검색어를 선택하는 경우, 선택된 검색어에 대한 연관 사이트를 제공할 수 있다. 예를 들어, 사용자가 1순위 검색어 'ab'를 선택하는 경우, 연관 사이트 제공 방법은 'ab'와 관련 있는 연관 사이트를 검출하여 제공할 수 있다. 동일한 방식으로, 사용자가 2순위 검색어 'cd'를 선택하는 경우, 연관 사이트 제공 방법은 'cd'와 관련 있는 연관 사이트를 검출하여 제공할 수 있다. 이 때, 선택된 검색어에 대한 연관 사이트를 제공하는 구체적인 과정은 도 3에서 구체적으로 설명된다.The related site providing method according to an embodiment of the present invention may provide a related site for the selected search word when the user selects the exposed search word. For example, when the user selects the first priority search word 'ab', the related site providing method may detect and provide a related site related to 'ab'. In the same manner, when the user selects the second ranking search term 'cd', the related site providing method may detect and provide a related site related to 'cd'. In this case, a detailed process of providing a related site for the selected search word will be described in detail with reference to FIG. 3.

도 3은 본 발명의 일실시예에 따른 선택된 검색어에 대해 연관 사이트를 제공하는 과정을 설명하기 위한 도면이다.3 is a diagram illustrating a process of providing a related site for a selected search word according to an embodiment of the present invention.

도 3을 참조하면, 사용자가 검색어 순위가 1위인 검색어 'ab'를 선택한 경우 검색어(301) 'ab'와 관련된 A사이트(302), B사이트(303), C사이트(304)가 검출되어 제공될 수 있다. 일례로, 검출된 사이트는 리스트 형태로 제공될 수 있d으며, 사이트의 개수는 상기 예에 제한되지 않는다. 또한, 검출된 사이트는 선택된 검색어(301)가 포함된 문서와 함께 노출되어 제공될 수 있다. 또한, 검출된 사이트는 선택된 검색어(301)와 연관 관계에 있는 단어가 포함된 문서와 함께 노출되어 제공될 수 있다.Referring to FIG. 3, when the user selects the search term 'ab' having the highest ranking, the A site 302, the B site 303, and the C site 304 related to the search word 301 and 'ab' are detected and provided. Can be. In one example, the detected sites may be provided in the form of a list, and the number of sites is not limited to the above example. In addition, the detected site may be exposed and provided together with the document including the selected search word 301. In addition, the detected site may be exposed and provided together with a document including a word associated with the selected search word 301.

도 2에서 이미 설명했듯이, 수집된 사이트에서 상기 사이트에 유입된 적어도 하나의 검색어, 상기 사이트의 문서에 대한 적어도 하나의 색인어, 상기 사이트와 관련된 적어도 하나의 태그 단어 또는 상기 사이트의 문서를 분류하는 적어도 하나의 카테고리 단어 중 어느 하나가 특성 단어로 결정될 수 있다. 연관 사이트 제공 방법은 결정된 특성 단어와 검색어(301)가 연관 관계에 있는 경우, 상기 사이트를 연관 사이트로 검출할 수 있다.As already described in FIG. 2, at least one search term entered into the site from the collected site, at least one index word for the document of the site, at least one tag word associated with the site, or at least to classify the document of the site. Any one of the category words may be determined as a characteristic word. The related site providing method may detect the site as the related site when the determined characteristic word and the search word 301 are related to each other.

도 4는 본 발명의 다른 일실시예에 따른 연관 사이트 제공 방법을 도시한 플로우차트이다. 도 4는 도 1과 달리, 특정 사이트와 관련 있는 연관 사이트를 제공하는 연관 사이트 제공 방법을 도시하고 있다.4 is a flowchart illustrating a method for providing a related site according to another embodiment of the present invention. 4 illustrates a related site providing method for providing a related site related to a specific site, unlike FIG. 1.

본 발명의 일실시예에 따른 연관 사이트 제공 방법은 사이트에 대한 적어도 하나의 특성 단어를 결정하여 상기 특성 단어 각각의 단어 벡터를 생성할 수 있다(S401). 일례로, 특성 단어 각각의 단어 벡터를 생성하는 단계(S401)는 사이트의 문서에 접근하기 위해 유입된 적어도 하나의 검색어를 상기 사이트의 특성 단어로 결정할 수 있다. 이 때, 특성 단어 각각의 단어 벡터를 생성하는 단계(S401)는 상기 사이트의 문서에 접근한 총 접근 횟수와 상기 적어도 하나의 검색어 각각의 접근 횟수를 이용하여 상기 적어도 하나의 검색어에 대한 단어 벡터를 생성할 수 있다. 즉, 특성 단어가 검색어인 경우, 단어 벡터는 상기 검색어에 대한 사이트 유입률로 계산될 수 있다.In the method of providing a related site according to an embodiment of the present invention, at least one feature word for a site may be determined to generate a word vector of each feature word (S401). For example, in operation S401, the word vector of each feature word may be determined as the feature word of the site, at least one search word introduced to access the document of the site. In this case, the generating of the word vector of each characteristic word (S401) may include generating the word vector for the at least one search word by using the total number of accesses to the document of the site and the access times of each of the at least one search word. Can be generated. That is, when the characteristic word is a search word, the word vector may be calculated as a site inflow rate for the search word.

일례로, 특성 단어 각각의 단어 벡터를 생성하는 단계(S401)는 상기 사이트에 포함된 문서에 대한 적어도 하나의 색인어를 상기 사이트의 특성 단어로 결정할 수 있다. 이 때, 사이트의 전체 문서에 공통으로 자주 노출되는 단어 또는 거의 노출되지 않는 단어가 색인어가 되는 경우, 상기 색인어가 사이트의 특성을 효율적으로 반영되지 않을 수 있다. 따라서, 특성 단어 각각의 단어 벡터를 생성하는 단계(S401)는 상기 적어도 하나의 색인어 중 미리 설정한 문서 노출 빈도 범위에 속하는 색인어를 상기 사이트의 특성 단어로 결정할 수 있다.For example, generating a word vector of each feature word (S401) may determine at least one index word for a document included in the site as the feature word of the site. At this time, when a word that is frequently exposed or a word that is rarely exposed to the entire document of the site becomes an index word, the index word may not efficiently reflect the characteristics of the site. Accordingly, in the generating of the word vector of each feature word (S401), an index word belonging to a preset document exposure frequency range among the at least one index word may be determined as the feature word of the site.

이 때, 특성 단어 각각의 단어 벡터를 생성하는 단계(S401)는 사이트의 문서에서 전체 색인어에 대해 각각의 색인어가 노출되는 비율을 계산하여 단어 벡터를 계산할 수 있다. 예를 들면, 색인어 1은 30%, 색인어 2는 20%의 형태로 단어 벡터가 계산될 수 있다.At this time, generating the word vector of each characteristic word (S401) may calculate the word vector by calculating the ratio of each index word to the total index word in the document of the site. For example, the word vector may be calculated in the form of index 1 for 30% and index 2 for 20%.

일례로, 특성 단어 각각의 단어 벡터를 생성하는 단계(S401)는 상기 사이트에 포함된 문서를 작성할 때 입력된 적어도 하나의 태그 단어를 상기 사이트의 특성 단어로 결정할 수 있다. For example, generating a word vector of each feature word (S401) may determine at least one tag word input when a document included in the site is a feature word of the site.

이 때, 특성 단어 각각의 단어 벡터를 생성하는 단계(S401)는 사이트의 문서에서 전체 태그 단어에 대해 각각의 태그 단어가 노출되는 비율을 계산하여 단어 벡터를 계산할 수 있다. 예를 들면, 태그 단어 1은 30%, 태그 단어 2는 20%의 형태로 단어 벡터가 계산될 수 있다.In this case, in the generating of the word vector of each characteristic word (S401), the word vector may be calculated by calculating a rate at which each tag word is exposed for all the tag words in the document of the site. For example, the word vector may be calculated in the form of tag word 1 of 30% and tag word 2 of 20%.

일례로, 특성 단어 각각의 단어 벡터를 생성하는 단계(S401)는 상기 사이트에 포함된 문서를 분류하는 적어도 하나의 카테고리 단어를 상기 사이트의 특성 단어로 결정할 수 있다.For example, generating a word vector of each feature word (S401) may determine at least one category word that classifies a document included in the site as the feature word of the site.

이 때, 특성 단어 각각의 단어 벡터를 생성하는 단계(S401)는 사이트의 문서에서 전체 카테고리 단어에 대해 각각의 카테고리 단어가 노출되는 비율을 계산하여 단어 벡터를 계산할 수 있다. 예를 들면, 카테고리 단어 1은 25%, 카테고리 단어 2는 14%의 형태로 단어 벡터가 계산될 수 있다. 도 1과 달리, 도 3에서 특성 단어는 기준이 되는 사이트와 비교 대상이 되는 사이트 각각에 대해 결정될 수 있다.In this case, in the generating of the word vector of each characteristic word (S401), the word vector may be calculated by calculating a ratio of the exposure of each category word with respect to all category words in the document of the site. For example, the word vector may be calculated in the form of category word 1 for 25% and category word 2 for 14%. Unlike FIG. 1, the characteristic word in FIG. 3 may be determined for each of the sites to be compared with the sites to be compared.

본 발명의 일실시예에 따른 연관 사이트 제공 방법은 상기 생성된 사이트 단어 벡터를 이용하여 사이트 사이의 단어 벡터 연관도를 계산할 수 있다(S402). 이 때, 사이트 사이의 단어 벡터 연관도를 계산하는 단계(S402)는 상기 사이트 단어 벡터의 크기를 이용하여 상기 사이트 사이의 단어 벡터 연관도를 계산할 수 있다. 즉, 단어 벡터 연관도는 단어 벡터 사이의 가중치를 기반으로 계산될 수 있다. In the method of providing a related site according to an embodiment of the present invention, a degree of word vector association between sites may be calculated using the generated site word vector (S402). At this time, the step S402 of calculating the word vector association between the sites may calculate the word vector association between the sites using the size of the site word vector. That is, the word vector association may be calculated based on weights between the word vectors.

일례로, 사이트 사이의 단어 벡터 연관도를 계산하는 단계(S402)는 코사인 유사도(cosine similarity)를 이용하여 상기 사이트 단어 벡터 사이의 각을 계산할 수 있다. 즉, 코사인 유사도는 두 벡터 간의 내적을 이용하는 방법이라고 할 수 있다.In one example, calculating the word vector association between sites (S402) may calculate the angle between the site word vector using cosine similarity (cosine similarity). In other words, the cosine similarity can be said to use the dot product between the two vectors.

예를 들면, A사이트의 특성 단어가 '와인, 음악, 유럽 여행'이고 B사이트의 특성 단어가 '와인, 사진, 프랑스 여행'이라고 가정하자. 그리고, 특성 단어 각각에 대한 단어 벡터는 A사이트의 경우 (0.6, 0.3, 0.1)이고, B사이트의 경우 (0.3, 0.5, 0.2)라고 할 수 있다. 그러면, 단어 벡터 연관도는 0.6*0.3+0.1*0.2=0.2로 결정될 수 있다.For example, suppose the characteristic word for site A is 'wine, music, travel to Europe' and the characteristic word for site B is 'wine, photo, travel to France'. The word vector for each characteristic word is (0.6, 0.3, 0.1) for the A site and (0.3, 0.5, 0.2) for the B site. Then, the word vector association may be determined as 0.6 * 0.3 + 0.1 * 0.2 = 0.2.

일례로, 사이트의 특성 단어 사이에 연관도가 높은 경우, 각각의 특성 단어에 가중치를 부여하는 방식도 적용될 수 있다. 즉, A사이트와 B 사이트의 경우, '와인'이라는 특성 단어가 동일하므로, '와인'이라는 특성 단어에 다른 특성 단어보다 더 많은 가중치를 부여할 수 있다.For example, when a high degree of association between characteristic words of a site is applied, a method of weighting each characteristic word may also be applied. That is, in the case of the A site and the B site, since the characteristic words of 'wine' are the same, the characteristic word of 'wine' can be given more weight than other characteristic words.

본 발명의 일실시예에 따른 연관 사이트 제공 방법은 상기 단어 벡터 연관도를 이용하여 연관 사이트를 검출할 수 있다(S403). 일례로, 연관 사이트를 검출하는 단계(S403)는 단어 벡터 연관도에 따라 상기 사이트 사이의 거리를 판단하는 단계 및 상기 사이트 사이의 거리가 짧은 순서로 사이트를 정렬하여 미리 설정한 순위에 속하는 사이트를 연관 사이트로 검출하는 단계를 포함할 수 있다.In a method of providing a related site according to an embodiment of the present invention, an associated site may be detected using the word vector degree of association (S403). For example, the detecting of the related site (S403) may include determining a distance between the sites according to the word vector relevance and sorting the sites in the order of the shortest distance between the sites to determine which sites belong to a preset ranking. Detecting as an associated site.

예를 들어, 단어 벡터 연관도가 기준이 되는 A 사이트에 대해 B사이트의 단어 벡터 연관도는 0.7이고, C 사이트와의 단어 벡터 연관도는 0.4라고 하ㄱ가정하자. 그러면, A사이트는 C사이트보다 B사이트와의 거리가 더 가깝다고 판단될 수 있다. 연관 사이트를 검출하는 단계(S403)는 기준이 되는 A 사이트에 대해 거리가 짧은 순서로 사이트를 정렬하고, 미리 설정한 순위(예를 들어, 5위)에 속하는 사이트만 연관 사이트로 검출하여 제공할 수 있다.For example, suppose the word vector association of site B is 0.7 and the word vector association of site C is 0.4 with respect to site A on which the word vector association is based. Then, site A may be determined to be closer to site B than site C. Detecting the related site (S403) is to arrange the sites in the order of short distance to the site A as a reference, and to detect and provide only sites belonging to a predetermined rank (for example, 5th) as the related site. Can be.

도 5는 본 발명의 일실시예에 따른 사이트와 사이트 간 사이트 단어 벡터의 연관도를 통해 연관 사이트를 검출하는 과정을 설명하기 위한 도면이다. 도 5를 참고하면, 본 발명의 일실시예에 따른 연관 사이트 제공 방법은 기준이 되는 A사이트(501)에 대해 연관 사이트를 검출하여 제공할 수 있다.FIG. 5 is a diagram for describing a process of detecting an associated site through a degree of association between a site and a site word vector between sites according to an embodiment of the present invention. Referring to FIG. 5, the method for providing a related site according to an embodiment of the present invention may detect and provide an associated site with respect to the A site 501 as a reference.

이 때, 연관 사이트 제공 방법은 수집된 사이트인 B사이트(502),C사이트(503) 및 D사이트(504)와의 연관도를 판단하여 연관 사이트를 검출할 수 있다. 이 때, 연관 사이트 제공 방법은 기준이 되는 A사이트(501)와 비교 대상이 되는 B사이트(502), C사이트(503) 및 D사이트(504) 각각으로부터 적어도 하나의 특성 단어를 결정할 수 있다. 앞에서 이미 언급했듯이, 특성 단어는 각 사이트의 검색어, 색인어, 태그 단어 또는 카테고리 단어를 통해 결정될 수 있다. 그리고, 연관 사이트 제공 방법은 결정된 특성 단어 각각에 대한 단어 벡터를 결정할 수 있다.In this case, the related site providing method may detect the related site by determining the degree of association with the collected sites B, 502, C, 503, and D, 504. In this case, the related site providing method may determine at least one characteristic word from each of the A site 501, which is a reference, and the B site 502, C site 503, and D site 504 to be compared. As already mentioned above, feature words can be determined through search terms, index words, tag words, or category words for each site. In addition, the method of providing a related site may determine a word vector for each of the determined characteristic words.

이 때, 연관 사이트 제공 방법은 A사이트(501)의 단어 벡터와 B사이트(502), C사이트(502) 및 D사이트(504) 각각의 단어 벡터 간의 단어 벡터 연관도를 계산할 수 있다. 그리고, 연관 사이트 제공 방법은 단어 벡터 연관도가 클수록 사이트 간의 거리가 가깝다고 판단할 수 있다. 또한, 연관 사이트 제공 방법은 A사이트(501)와 거리가 가까운 순서대로 C사이트(503),D사이트(504) 및 B사이트(502)로 정렬할 수 있다. 예를 들어, 연관 사이트 제공 방법은 상위 2위까지 연관 사이트로 검출할 수 있다고 가정하자. 그러면, 도 5에서 볼 수 있듯이,연관 사이트 제공 방법은 상위 2위에 속하는 C사이트(503) 및 D사이트(504)를 연관 사이트로 검출하여 제공할 수 있다.In this case, the method for providing a related site may calculate a word vector association between the word vector of the A site 501 and the word vectors of the B site 502, the C site 502, and the D site 504. In addition, the method of providing a related site may determine that the distance between the sites is closer as the word vector association is greater. In addition, the related site providing method may be arranged into the C site 503, the D site 504, and the B site 502 in the order of close proximity to the A site 501. For example, suppose that the related site providing method can detect the top 2 positions as the related site. Then, as shown in Figure 5, the associated site providing method can detect and provide the C site 503 and the D site 504 belonging to the top two to the associated site.

도 6은 본 발명의 일실시예에 따른 연관 사이트 제공 시스템을 도시한 블록 다이어그램이다. 본 발명의 일실시예에 따른 연관 사이트 제공 시스템(600)은 검색어 노출부(601), 연관 사이트 검출부(602) 및 연관 사이트 제공부(603)를 포함할 수 있다. 6 is a block diagram illustrating an associated site providing system according to an embodiment of the present invention. Related site providing system 600 according to an embodiment of the present invention may include a search word exposure unit 601, an associated site detection unit 602 and an associated site providing unit 603.

검색어 노출부(601)는 사이트에 유입된 적어도 하나의 검색어를 노출할 수 있다.The search word exposure unit 601 may expose at least one search word introduced to the site.

이 때, 검색어 노출부(601)는 상기 적어도 하나의 검색어 및 상기 적어도 하나의 검색어 각각에 대한 사이트 유입률을 노출할 수 있다. 그리고, 검색어 노출부(601)는 검색어 각각에 대한 사이트 유입률에 따라 정렬하여 노출할 수 있다.In this case, the search word exposure unit 601 may expose a site inflow rate for each of the at least one search word and the at least one search word. In addition, the search word exposure unit 601 may sort and display the search terms according to the site inflow rate for each search word.

연관 사이트 검출부(602)는 상기 노출된 적어도 하나의 검색어 중 어느 하나가 선택된 경우, 상기 검색어에 대한 연관 사이트를 검출할 수 있다. 일례로, 연관 사이트 검출부는 특성 단어 결정부(604) 및 연관 사이트 판단부(605)를 포함할 수 있다.The related site detector 602 may detect a related site for the search word when any one of the at least one search term is selected. For example, the associated site detector may include a feature word determiner 604 and an associated site determiner 605.

특성 단어 결정부(604)는 사이트를 수집하여 상기 수집된 사이트에 대한 적어도 하나의 특성 단어를 결정할 수 있다.The feature word determiner 604 may collect sites to determine at least one feature word for the collected sites.

일례로, 특성 단어 결정부(604)는 사이트의 문서에 접근하기 위해 유입된 적어도 하나의 검색어를 상기 사이트의 특성 단어로 결정할 수 있다.For example, the feature word determiner 604 may determine at least one search word introduced to access the document of the site as the feature word of the site.

일례로, 특성 단어 결정부(604)는 상기 사이트에 포함된 문서에 대한 적어도 하나의 색인어를 상기 사이트의 특성 단어로 결정할 수 있다.For example, the feature word determiner 604 may determine at least one index word for a document included in the site as the feature word of the site.

일례로, 특성 단어 결정부(604)는 상기 사이트에 포함된 문서를 작성할 때 입력된 적어도 하나의 태그를 상기 사이트의 특성 단어로 결정할 수 있다.For example, the characteristic word determiner 604 may determine at least one tag input when creating a document included in the site as the characteristic word of the site.

일례로, 특성 단어 결정부(604)는 상기 사이트에 포함된 문서를 분류하는 적어도 하나의 카테고리 단어를 상기 사이트의 특성 단어로 결정할 수 있다.For example, the characteristic word determiner 604 may determine at least one category word for classifying a document included in the site as the characteristic word of the site.

연관 사이트 판단부(605)는 상기 결정된 적어도 하나의 특성 단어 중 상기 검색어를 포함하는 경우, 상기 검색어와 상기 사이트를 연관 사이트로 판단할 수 있다.The related site determining unit 605 may determine the search word and the site as the related site when the search word is included in the at least one characteristic word.

연관 사이트 제공부(603)는 상기 선택된 검색어와 링크로 연결하여 상기 검출된 연관 사이트를 제공할 수 있다. 이 때, 연관 사이트 제공부(603)는 연관 사이트의 리스트를 제공할 수 있다. 또한, 연관 사이트 제공부(603)는 상기 검출된 연관 사이트에 포함된 문서 중 상기 검색어가 노출된 문서를 제공할 수 있다.The related site provider 603 may provide the detected related site by linking the selected search word. At this time, the related site provider 603 may provide a list of related sites. In addition, the related site providing unit 603 may provide a document in which the search word is exposed among documents included in the detected related site.

도 7은 본 발명의 다른 일실시예에 따른 연관 사이트 제공 시스템을 도시한 블록 다이어그램이다.7 is a block diagram illustrating a related site providing system according to another exemplary embodiment of the present invention.

본 발명의 일실시예에 따른 연관 사이트 제공 시스템(700)은 단어 벡터 생성부(701), 단어 벡터 연관도 계산부(702) 및 연관 사이트 검출부(703)를 포함할 수 있다. The associated site providing system 700 according to an exemplary embodiment of the present invention may include a word vector generator 701, a word vector association calculator 702, and an associated site detector 703.

단어 벡터 생성부(701)는 사이트에 대한 적어도 하나의 특성 단어를 결정하여 상기 특성 단어 각각의 단어 벡터를 생성할 수 있다.The word vector generator 701 may generate at least one feature word for the site to generate a word vector of each feature word.

일례로, 단어 벡터 생성부(701)는 사이트의 문서에 접근하기 위해 유입된 적어도 하나의 검색어를 상기 사이트의 특성 단어로 결정할 수 있다. 이 때, 단어 벡터 생성부(701)는 상기 사이트의 문서에 접근한 총 접근 횟수와 상기 적어도 하나의 검색어 각각의 접근 횟수를 이용하여 사이트 유입률을 계산할 수 있다. 이 때, 계산된 사이트 유입률은 검색어에 대한 단어 벡터일 수 있다.For example, the word vector generator 701 may determine at least one search word that is introduced to access a document of a site as a characteristic word of the site. In this case, the word vector generator 701 may calculate a site inflow rate using the total number of accesses to the document of the site and the number of accesses of each of the at least one search word. In this case, the calculated site inflow rate may be a word vector for a search word.

일례로, 단어 벡터 생성부(701)는 상기 사이트에 포함된 문서에 대한 적어도 하나의 색인어를 상기 사이트의 특성 단어로 결정할 수 있다. 이 때, 단어 벡터 생성부(701)는 사이트의 문서에서 전체 색인어에 대해 각각의 색인어가 노출되는 비율을 계산하여 단어 벡터를 생성할 수 있다.For example, the word vector generator 701 may determine at least one index word for a document included in the site as a characteristic word of the site. In this case, the word vector generator 701 may generate a word vector by calculating a ratio of each index word exposed to all index words in the document of the site.

일례로, 단어 벡터 생성부(701)는 상기 사이트에 포함된 문서를 작성할 때 입력된 적어도 하나의 태그를 상기 사이트의 특성 단어로 결정할 수 있다. 이 때, 단어 벡터 생성부(701)는 사이트의 문서에서 전체 태그 단어에 대해 각각의 태그 단어가 노출되는 비율을 계산하여 단어 벡터를 생성할 수 있다.For example, the word vector generator 701 may determine at least one tag input when the document included in the site is a characteristic word of the site. In this case, the word vector generator 701 may generate a word vector by calculating a ratio of each tag word to the entire tag words in the document of the site.

일례로, 단어 벡터 생성부(701)는 상기 사이트에 포함된 문서를 분류하는 적어도 하나의 카테고리 단어를 상기 사이트의 특성 단어로 결정할 수 있다. 이 때, 단어 벡터 생성부(701)는 사이트의 문서에서 전체 카테고리 단어에 대해 각각의 카테고리 단어가 노출되는 비율을 계산하여 단어 벡터를 생성할 수 있다.For example, the word vector generator 701 may determine at least one category word for classifying a document included in the site as a characteristic word of the site. In this case, the word vector generator 701 may generate a word vector by calculating a ratio of each category word exposed to all category words in the document of the site.

단어 벡터 연관도 계산부(702)는 상기 생성된 사이트 단어 벡터를 이용하여 사이트 사이의 단어 벡터 연관도를 계산할 수 있다. 단어 벡터 연관도 계산부(702)는 상기 사이트 단어 벡터의 크기를 이용하여 상기 사이트 사이의 단어 벡터 연관도를 계산할 수 있다.The word vector association calculator 702 may calculate a word vector association between sites using the generated site word vector. The word vector association calculator 702 may calculate a word vector association between the sites using the size of the site word vector.

연관 사이트 검출부(703)는 상기 단어 벡터 연관도를 이용하여 연관 사이트를 검출할 수 있다. 일례로, 연관 사이트 검출부(703)는 상기 단어 벡터 연관도에 따라 상기 사이트 사이의 거리를 판단할 수 있다. 그리고, 연관 사이트 검출부(703)는 상기 사이트 사이의 거리가 짧은 순서로 사이트를 정렬하여 미리 설정한 순위에 속하는 사이트를 연관 사이트로 검출할 수 있다.The related site detector 703 may detect the related site by using the word vector degree of association. For example, the related site detector 703 may determine the distance between the sites according to the word vector degree of association. In addition, the related site detector 703 may arrange the sites in the order of short distance between the sites and detect a site belonging to a predetermined rank as the related site.

도 6 및 도 7에 대한 구체적인 설명은 도 1 내지 도 5의 설명을 참고할 수 있다.6 and 7 may refer to the descriptions of FIGS. 1 to 5.

또한, 본 발명의 일실시예에 따른 연관 사이트 제공 방법은 다양한 컴퓨터로 구현되는 동작을 수행하기 위한 프로그램 명령을 포함하는 컴퓨터 판독 가능 매체를 포함한다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.In addition, the method for providing a related site according to an embodiment of the present invention includes a computer readable medium including program instructions for performing various computer-implemented operations. The computer readable medium may include program instructions, data files, data structures, etc. alone or in combination. The medium or program instructions may be those specially designed and constructed for the purposes of the present invention, or they may be of the kind well-known and available to those having skill in the computer software arts. Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks, and magnetic tape, optical media such as CD-ROMs, DVDs, and magnetic disks, such as floppy disks. Magneto-optical media, and hardware devices specifically configured to store and execute program instructions, such as ROM, RAM, flash memory, and the like. Examples of program instructions include not only machine code generated by a compiler, but also high-level language code that can be executed by a computer using an interpreter or the like.

이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 이는 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. 따라서, 본 발명 사상은 아래에 기재된 특허청구범위에 의해서만 파악되어야 하고, 이의 균등 또는 등가적 변형 모두는 본 발명 사상의 범주에 속한다고 할 것이다.As described above, the present invention has been described by way of limited embodiments and drawings, but the present invention is not limited to the above-described embodiments, which can be variously modified and modified by those skilled in the art to which the present invention pertains. Modifications are possible. Accordingly, the spirit of the present invention should be understood only by the claims set forth below, and all equivalent or equivalent modifications thereof will belong to the scope of the present invention.

Claims (31)

사이트에 유입된 적어도 하나의 검색어를 노출하는 단계;Exposing at least one search term introduced to the site; 상기 노출된 적어도 하나의 검색어 중 어느 하나가 선택된 경우, 상기 검색어에 대한 연관 사이트를 검출하는 단계; 및If any one of the at least one search term is selected, detecting a related site for the search term; And 상기 선택된 검색어와 링크로 연결하여 상기 검출된 연관 사이트를 제공하는 단계Linking with the selected search word to provide the detected related site 를 포함하는 연관 사이트 제공 방법.Related site providing method comprising a. 제1항에 있어서,The method of claim 1, 상기 사이트에 유입된 적어도 하나의 검색어를 노출하는 단계는,Exposing at least one search term that has flowed into the site, 상기 적어도 하나의 검색어 및 상기 적어도 하나의 검색어 각각에 대한 사이트 유입률을 노출하는 연관 사이트 제공 방법.And providing a site inflow rate for each of the at least one search term and the at least one search term. 제1항에 있어서,The method of claim 1, 상기 사이트에 유입된 적어도 하나의 검색어를 노출하는 단계는,Exposing at least one search term that has flowed into the site, 상기 적어도 하나의 검색어를 검색어 각각의 유입률에 따라 정렬하여 노출하는 연관 사이트 제공 방법.The related site providing method of displaying the at least one search word sorted according to the inflow rate of each search word. 제1항에 있어서,The method of claim 1, 상기 검색어에 대한 연관 사이트를 검출하는 단계는,Detecting related sites for the search term, 사이트를 수집하여 상기 수집된 사이트에 대한 적어도 하나의 특성 단어를 결정하는 단계; 및Collecting sites to determine at least one characteristic word for the collected sites; And 상기 결정된 적어도 하나의 특성 단어가 상기 검색어와 연관 관계에 있는 경우, 상기 사이트를 상기 검색어에 대한 연관 사이트로 판단하는 단계Determining the site as a related site for the search word when the determined at least one characteristic word is related to the search word. 를 포함하는 연관 사이트 제공 방법.Related site providing method comprising a. 제4항에 있어서,The method of claim 4, wherein 상기 적어도 하나의 특성 단어를 결정하는 단계는,Determining the at least one characteristic word, 사이트의 문서에 접근하기 위해 유입된 적어도 하나의 검색어를 상기 사이트의 특성 단어로 결정하는 연관 사이트 제공 방법.The related site providing method of determining at least one search term introduced to access a document of a site as a characteristic word of the site. 제4항에 있어서,The method of claim 4, wherein 상기 적어도 하나의 특성 단어를 결정하는 단계는,Determining the at least one characteristic word, 상기 사이트에 포함된 문서에 대한 적어도 하나의 색인어를 상기 사이트의 특성 단어로 결정하는 연관 사이트 제공 방법.And determining at least one index word for a document included in the site as a characteristic word of the site. 제6항에 있어서,The method of claim 6, 상기 적어도 하나의 특성 단어를 결정하는 단계는,Determining the at least one characteristic word, 상기 적어도 하나의 색인어 중 미리 설정한 문서 노출 빈도 범위에 속하는 색인어를 상기 사이트의 특성 단어로 결정하는 연관 사이트 제공 방법.The related site providing method of determining an index word which belongs to a preset document exposure frequency range among the at least one index word as a characteristic word of the site. 제4항에 있어서,The method of claim 4, wherein 상기 적어도 하나의 특성 단어를 결정하는 단계는,Determining the at least one characteristic word, 상기 사이트에 포함된 문서를 작성할 때 입력된 적어도 하나의 태그 단어를 상기 사이트의 특성 단어로 결정하는 연관 사이트 제공 방법.And providing at least one tag word input when creating a document included in the site as a characteristic word of the site. 제4항에 있어서,The method of claim 4, wherein 상기 적어도 하나의 특성 단어를 결정하는 단계는,Determining the at least one characteristic word, 상기 사이트에 포함된 문서를 분류하는 적어도 하나의 카테고리 단어를 상기 사이트의 특성 단어로 결정하는 연관 사이트 제공 방법.And providing at least one category word for classifying a document included in the site as a characteristic word of the site. 제1항에 있어서,The method of claim 1, 상기 검출된 연관 사이트를 제공하는 단계는,Providing the detected associated site, 상기 검출된 연관 사이트에 포함된 문서 중 상기 선택된 검색어가 노출된 문서를 제공하는 연관 사이트 제공 방법.A related site providing method of providing a document in which the selected search word is exposed among documents included in the detected related site. 사이트에 대한 적어도 하나의 특성 단어를 결정하여 상기 특성 단어 각각의 단어 벡터를 생성하는 단계;Determining at least one feature word for a site to generate a word vector of each feature word; 상기 생성된 사이트 단어 벡터를 이용하여 사이트 사이의 단어 벡터 연관도를 계산하는 단계; 및Calculating a word vector association between sites using the generated site word vector; And 상기 단어 벡터 연관도를 이용하여 연관 사이트를 검출하는 단계Detecting a related site using the word vector relevance 를 포함하는 연관 사이트 제공 방법. Related site providing method comprising a. 제11항에 있어서,The method of claim 11, 상기 특성 단어 각각의 단어 벡터를 생성하는 단계는,Generating a word vector of each characteristic word, 사이트에 유입된 적어도 하나의 검색어, 상기 사이트의 문서에 대한 적어도 하나의 색인어, 상기 사이트와 관련된 적어도 하나의 태그 단어 또는 상기 사이트의 문서를 분류하는 적어도 하나의 카테고리 단어 중 어느 하나를 특성 단어로 결정하는 연관 사이트 제공 방법.Determine as a characteristic word any one of at least one search word entered into a site, at least one index word for a document of the site, at least one tag word associated with the site, or at least one category word for classifying a document of the site. How to provide related sites. 제12항에 있어서,The method of claim 12, 상기 특성 단어 각각의 단어 벡터를 생성하는 단계는,Generating a word vector of each characteristic word, 상기 사이트의 문서에 접근한 총 접근 횟수와 상기 적어도 하나의 검색어 각각의 접근 횟수를 이용하여 상기 적어도 하나의 검색어에 대한 단어 벡터를 생성하는 연관 사이트 제공 방법.And generating a word vector for the at least one search term using the total number of accesses to the document of the site and the number of accesses of each of the at least one search term. 제12항에 있어서,The method of claim 12, 상기 사이트에 대한 적어도 하나의 특성 단어를 결정하는 단계는,Determining at least one characteristic word for the site, 상기 적어도 하나의 색인어 중 미리 설정한 문서 노출 빈도 범위에 속하는 색인어를 상기 사이트의 특성 단어로 결정하는 연관 사이트 제공 방법.The related site providing method of determining an index word which belongs to a preset document exposure frequency range among the at least one index word as a characteristic word of the site. 제11항에 있어서,The method of claim 11, 상기 사이트 사이의 단어 벡터 연관도를 계산하는 단계는,Calculating word vector associations between the sites, 상기 사이트 단어 벡터의 크기를 이용하여 상기 사이트 사이의 단어 벡터 연관도를 계산하는 연관 사이트 제공 방법.And a word vector association between the sites using the size of the site word vector. 제15항에 있어서,The method of claim 15, 상기 사이트 사이의 단어 벡터 연관도를 계산하는 단계는,Calculating word vector associations between the sites, 코사인 유사도(cosine similarity)를 이용하여 상기 사이트 단어 벡터 사이의 각을 계산하는 것을 특징으로 하는 연관 사이트 제공 방법.A method for providing an associative site, comprising calculating the angle between the site word vectors using cosine similarity. 제11항에 있어서,The method of claim 11, 상기 단어 벡터 연관도를 이용하여 연관 사이트를 검출하는 단계는,The detecting of the associated site by using the word vector relevance may include: 상기 단어 벡터 연관도에 따라 상기 사이트 사이의 거리를 판단하는 단계; 및Determining a distance between the sites according to the word vector relevance; And 상기 사이트 사이의 거리가 짧은 순서로 사이트를 정렬하여 미리 설정한 순위에 속하는 사이트를 연관 사이트로 검출하는 단계Arranging the sites in the order of shortest distance between the sites and detecting sites belonging to a predetermined ranking as related sites; 를 포함하는 연관 사이트 제공 방법.Related site providing method comprising a. 제1항 내지 제17항 중 어느 한 항의 방법을 실행하기 위한 프로그램이 기록되어 있는 것을 특징으로 하는 컴퓨터에서 판독 가능한 기록 매체.A computer-readable recording medium in which a program for executing the method of any one of claims 1 to 17 is recorded. 사이트에 유입된 적어도 하나의 검색어를 노출하는 검색어 노출부;A search term exposure unit that exposes at least one search term introduced to the site; 상기 노출된 적어도 하나의 검색어 중 어느 하나가 선택된 경우, 상기 검색어에 대한 연관 사이트를 검출하는 연관 사이트 검출부; 및An associated site detector for detecting a related site for the search word when any one of the at least one search term is selected; And 상기 선택된 검색어와 링크로 연결하여 상기 검출된 연관 사이트를 제공하는 연관 사이트 제공부Related site providing unit for providing the detected related site by connecting to the selected search word link 를 포함하는 연관 사이트 제공 시스템.Associated site providing system comprising a. 제19항에 있어서,The method of claim 19, 상기 검색어 노출부는,The search word exposure unit, 상기 적어도 하나의 검색어 및 상기 적어도 하나의 검색어 각각에 대한 사이트 유입률을 노출하는 연관 사이트 제공 시스템.Related site providing system for exposing the site inflow rate for each of the at least one search term and the at least one search term. 제19항에 있어서,The method of claim 19, 상기 연관 사이트 검출부는,The associated site detection unit, 사이트를 수집하여 상기 수집된 사이트에 대한 적어도 하나의 특성 단어를 결정하는 특성 단어 결정부; 및A characteristic word determination unit that collects sites and determines at least one characteristic word for the collected sites; And 상기 결정된 적어도 하나의 특성 단어 중 상기 검색어를 포함하는 경우, 상기 검색어와 상기 사이트를 연관 사이트로 판단하는 연관 사이트 판단부An associated site determination unit that determines the search term and the site as an associated site when the search term is included in the determined at least one characteristic word 를 포함하는 는 연관 사이트 제공 시스템.The associated site providing system comprising a. 제21항에 있어서,The method of claim 21, 상기 특성 단어 결정부는,The characteristic word determination unit, 사이트의 문서에 접근하기 위해 유입된 적어도 하나의 검색어를 상기 사이트의 특성 단어로 결정하는 연관 사이트 제공 시스템.Related site providing system for determining at least one search term introduced to access the document of the site as the characteristic words of the site. 제21항에 있어서,The method of claim 21, 상기 특성 단어 결정부는,The characteristic word determination unit, 상기 사이트에 포함된 문서에 대한 적어도 하나의 색인어를 상기 사이트의 특성 단어로 결정하는 연관 사이트 제공 시스템.And an associated site providing system for determining at least one index word for a document included in the site as a characteristic word of the site. 제21항에 있어서,The method of claim 21, 상기 특성 단어 결정부는,The characteristic word determination unit, 상기 사이트에 포함된 문서를 작성할 때 입력된 적어도 하나의 태그 단어를 상기 사이트의 특성 단어로 결정하는 연관 사이트 제공 시스템.And at least one tag word input when a document included in the site is determined as a characteristic word of the site. 제21항에 있어서,The method of claim 21, 상기 특성 단어 결정부는,The characteristic word determination unit, 상기 사이트에 포함된 문서를 분류하는 적어도 하나의 카테고리 단어를 상기 사이트의 특성 단어로 결정하는 연관 사이트 제공 시스템.And an at least one category word for classifying a document included in the site as a characteristic word of the site. 제19항에 있어서,The method of claim 19, 상기 연관 사이트 제공부는,The associated site provider, 상기 검출된 연관 사이트에 포함된 문서 중 상기 검색어가 노출된 문서를 제공하는 연관 사이트 제공 시스템.Related site providing system for providing a document exposed the search word among the documents included in the detected related site. 사이트에 대한 적어도 하나의 특성 단어를 결정하여 상기 특성 단어 각각의 단어 벡터를 생성하는 단어 벡터 생성부;A word vector generator for determining at least one characteristic word for a site to generate a word vector of each characteristic word; 상기 생성된 사이트 단어 벡터를 이용하여 사이트 사이의 단어 벡터 연관도를 계산하는 단어 벡터 연관도 계산부; 및A word vector association calculator that calculates a word vector association between sites using the generated site word vector; And 상기 단어 벡터 연관도를 이용하여 연관 사이트를 검출하는 연관 사이트 검출부An association site detector for detecting an association site using the word vector association 를 포함하는 연관 사이트 제공 시스템. Associated site providing system comprising a. 제27항에 있어서,The method of claim 27, 상기 단어 벡터 생성부는,The word vector generator, 사이트에 유입된 적어도 하나의 검색어, 상기 사이트의 문서에 대한 적어도 하나의 색인어, 상기 사이트와 관련된 적어도 하나의 태그 단어 또는 상기 사이트의 문서를 분류하는 적어도 하나의 카테고리 단어 중 어느 하나를 특성 단어로 결정하는 연관 사이트 제공 시스템.Determine as a characteristic word any one of at least one search word entered into a site, at least one index word for a document of the site, at least one tag word associated with the site, or at least one category word for classifying a document of the site. Association site provision system. 제28항에 있어서,The method of claim 28, 상기 단어 벡터 생성부는,The word vector generator, 상기 사이트의 문서에 접근한 총 접근 횟수와 상기 적어도 하나의 검색어 각각의 접근 횟수를 이용하여 상기 적어도 하나의 검색어에 대한 단어 벡터를 생성하는 연관 사이트 제공 시스템.And a word vector for the at least one search term using the total number of accesses to the document of the site and the number of accesses of each of the at least one search term. 제27항에 있어서,The method of claim 27, 상기 단어 벡터 연관도 계산부는,The word vector association calculation unit, 상기 사이트 단어 벡터의 크기를 이용하여 상기 사이트 사이의 단어 벡터 연관도를 계산하는 연관 사이트 제공 시스템.An association site providing system for calculating a word vector association between the sites using the magnitude of the site word vector. 제27항에 있어서,The method of claim 27, 상기 연관 사이트 검출부는,The associated site detection unit, 상기 단어 벡터 연관도에 따라 상기 사이트 사이의 거리를 판단하고, 상기 사이트 사이의 거리가 짧은 순서로 사이트를 정렬하여 미리 설정한 순위에 속하는 사이트를 연관 사이트로 검출하는 연관 사이트 제공 시스템.And determining the distance between the sites according to the word vector association degree, and aligning the sites in the order of the shortest distance between the sites to detect sites belonging to a predetermined ranking as the related sites.
KR1020080018511A 2008-02-28 2008-02-28 Method and system for providing relevance site using chracteristic word of site KR101042445B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020080018511A KR101042445B1 (en) 2008-02-28 2008-02-28 Method and system for providing relevance site using chracteristic word of site

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020080018511A KR101042445B1 (en) 2008-02-28 2008-02-28 Method and system for providing relevance site using chracteristic word of site

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020100115731A Division KR101347884B1 (en) 2010-11-19 2010-11-19 Method and system for providing relevance site using chracteristic word of site

Publications (2)

Publication Number Publication Date
KR20090093153A true KR20090093153A (en) 2009-09-02
KR101042445B1 KR101042445B1 (en) 2011-06-16

Family

ID=41301665

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080018511A KR101042445B1 (en) 2008-02-28 2008-02-28 Method and system for providing relevance site using chracteristic word of site

Country Status (1)

Country Link
KR (1) KR101042445B1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160033563A (en) * 2014-09-18 2016-03-28 경북대학교 산학협력단 Method for constructing database, recording medium for performing the method
KR20220126950A (en) * 2021-03-10 2022-09-19 주식회사 웰컨 Method and system for spatial information system utilization prediction index calculation

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100455439B1 (en) * 2000-09-21 2004-11-08 (주)하우앤와이 Internet resource retrieval and browsing method based on expanded web site map and expanded natural domain names assigned to all web resources
JP2002215674A (en) * 2001-01-22 2002-08-02 Kddi Corp Web page browsing support system, method and program

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160033563A (en) * 2014-09-18 2016-03-28 경북대학교 산학협력단 Method for constructing database, recording medium for performing the method
KR20220126950A (en) * 2021-03-10 2022-09-19 주식회사 웰컨 Method and system for spatial information system utilization prediction index calculation

Also Published As

Publication number Publication date
KR101042445B1 (en) 2011-06-16

Similar Documents

Publication Publication Date Title
Wan et al. Aminer: Search and mining of academic social networks
Lewandowski et al. The influence of search engine optimization on Google's results: A multi-dimensional approach for detecting SEO
US9497277B2 (en) Interest graph-powered search
JP5329540B2 (en) User-centric information search method, computer-readable recording medium, and user-centric information search system
CN104268171A (en) Activity similarity and social trust based social networking website friend recommendation system and method
JP2010055618A (en) Method and system for providing search based on topic
US8825641B2 (en) Measuring duplication in search results
Mani et al. Spam review detection using ensemble machine learning
CN111052109B (en) Expert search thread invitation engine
US8204872B2 (en) Method and system for instantly expanding a keyterm and computer readable and writable recording medium for storing program for instantly expanding keyterm
KR100954842B1 (en) Method and System of classifying web page using category tag information and Recording medium using by the same
Schedl # nowplaying Madonna: a large-scale evaluation on estimating similarities between music artists and between movies from microblogs
Yulianti et al. Tweet‐biased summarization
Guo et al. An opinion feature extraction approach based on a multidimensional sentence analysis model
KR100913049B1 (en) Method and system for providing positive / negative search result using user preference
Zhang et al. A generic pseudo relevance feedback framework with heterogeneous social information
KR102299525B1 (en) Product Evolution Mining Method And Apparatus Thereof
Manohar et al. Composite analysis of web pages in adaptive environment through Modified Salp Swarm algorithm to rank the web pages
JP5427119B2 (en) Similar document search device, similar document search method, program thereof, and recording medium
KR101347884B1 (en) Method and system for providing relevance site using chracteristic word of site
KR101042445B1 (en) Method and system for providing relevance site using chracteristic word of site
Spahiu et al. Topic profiling benchmarks in the linked open data cloud: Issues and lessons learned
KR101544142B1 (en) Searching method and system based on topic
Jasbick et al. Some branches may bear rotten fruits: Diversity browsing vp-trees
Lin et al. Integrating the optimal classifier set for sentiment analysis

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
J201 Request for trial against refusal decision
A107 Divisional application of patent
AMND Amendment
E902 Notification of reason for refusal
B701 Decision to grant
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20160329

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20170328

Year of fee payment: 7