KR20100138858A - Method and system for providing relevance site using chracteristic word of site - Google Patents

Method and system for providing relevance site using chracteristic word of site Download PDF

Info

Publication number
KR20100138858A
KR20100138858A KR1020100115731A KR20100115731A KR20100138858A KR 20100138858 A KR20100138858 A KR 20100138858A KR 1020100115731 A KR1020100115731 A KR 1020100115731A KR 20100115731 A KR20100115731 A KR 20100115731A KR 20100138858 A KR20100138858 A KR 20100138858A
Authority
KR
South Korea
Prior art keywords
site
word
search
providing
sites
Prior art date
Application number
KR1020100115731A
Other languages
Korean (ko)
Other versions
KR101347884B1 (en
Inventor
김병학
Original Assignee
엔에이치엔(주)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엔에이치엔(주) filed Critical 엔에이치엔(주)
Priority to KR1020100115731A priority Critical patent/KR101347884B1/en
Publication of KR20100138858A publication Critical patent/KR20100138858A/en
Application granted granted Critical
Publication of KR101347884B1 publication Critical patent/KR101347884B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata
    • G06F16/148File search processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata
    • G06F16/156Query results presentation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Library & Information Science (AREA)
  • Tourism & Hospitality (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PURPOSE: A method and a system for providing a relevance site using a characteristic word of a site are provided to expose search words for access to various sites, thereby providing information for the search words when accessing the sites. CONSTITUTION: A search word exposing unit(601) exposes one or more search words inserted into a site. If one of the exposed search words is selected, an associated site detecting unit(602) detects an associated site with the search word. A characteristic word determining unit(604) collects sites. The characteristic word determining unit determines at least one specific word about the collected sites. If the search word is included in the determined specific words, an associated site determining unit(605) determines the search word and the site as an associated site.

Description

사이트 특성 단어를 이용한 연관 사이트 제공 방법 및 시스템{METHOD AND SYSTEM FOR PROVIDING RELEVANCE SITE USING CHRACTERISTIC WORD OF SITE}METHOD AND SYSTEM FOR PROVIDING RELEVANCE SITE USING CHRACTERISTIC WORD OF SITE}

본 발명은 연관 사이트 제공 방법 및 시스템에 관한 것으로, 보다 상세하게는 검색어와 연관된 사이트, 특정 사이트와 연관된 사이트를 제공하는 연관 사이트 제공 방법 및 시스템에 관한 것이다.The present invention relates to a method and system for providing a related site, and more particularly, to a related site providing method and system for providing a site associated with a search word and a site associated with a specific site.

사용자들은 자신이 개설하거나 타인이 개설한 미니홈피, 블로그 또는 카페 등과 같은 사이트에 어떤 검색어를 통해 접근하는지 알고 싶어하는 경우가 종종 있다. 예를 들어, 블로그 등에 '와인', '축구'와 관련된 글을 게재하는 사용자는 자신이 게시한 '와인'에 대한 글을 타인이 어떤 검색어를 통해 접근하는 지 알고 싶어하는 경우가 있다. 유입되는 검색어를 분석함으로써, 타인의 관심도를 파악할 수 있고, 사용자는 이러한 타인의 관심도를 반영하여 보다 효과적으로 자신의 글을 최상위로 노출시킬 수 있는 기회가 많아질 수 있다. 또한, 유입된 검색어를 분석하여 타인의 관심도를 파악함으로써 자신의 블로그를 보다 효과적으로 광고하고, 노출시킬 수 있다.Users often want to know what search terms they access through sites like their own homepages, blogs, or cafes. For example, a user who posts articles related to "wine" or "soccer" on a blog may want to know what search terms others are accessing. By analyzing the incoming search words, it is possible to grasp the interests of others, and the user may have more opportunities to more effectively expose his or her posts by reflecting the interests of others. In addition, by analyzing the searched words to find out the interests of others, you can more effectively advertise and expose your blog.

또한, 유입된 검색어를 분석함으로써, 해당 검색어와 관련이 있는 사이트를 검색할 필요성도 요구될 수 있다. 더 나아가, 특정 사이트에 대해 관련이 있는 사이트를 검색하고자 하는 필요성도 제기될 수 있다. 이러한 검색어의 역추적을 통해 효과적으로 사이트를 홍보할 수 있다. 그리고, 사이트의 문서에 포함된 내용을 대중에 보다 효과적으로 게시할 수 있다. 결국, 이러한 잠재적인 홍보 효과를 요구하는 만족시킬 수 있는 발명이 요구되고 있다.In addition, by analyzing the imported search words, a need to search for a site related to the search word may be required. Furthermore, the need to search for relevant sites for a particular site may be raised. By backtracking these search terms, you can effectively promote your site. In addition, the contents of the site's documents can be posted more effectively to the public. As a result, there is a need for a satisfactory invention that requires such potential promotional effects.

본 발명은 미니홈피, 블로그 또는 카페 등과 같은 각종 사이트에 접근하기 위해 유입된 검색어를 노출시킴으로써, 상기 사이트에 접근하는데 유입된 검색어에 대한 정보를 제공할 수 있는 연관 사이트 제공 방법 및 시스템을 제공한다.The present invention provides a method and system for providing a related site that can provide information about a search word introduced in accessing the site by exposing a search word introduced to access various sites such as a mini homepage, a blog or a cafe.

본 발명은 노출된 검색어에 대해 선택하는 경우, 검색어와 링크로 연결된 연관 사이트를 제공함으로써, 검색어에 대한 추가적인 정보를 제공할 수 있는 연관 사이트 제공 방법 및 시스템을 제공한다.The present invention provides a related site providing method and system that can provide additional information on a search word by providing a related site linked with the search word when selecting the exposed search word.

본 발명은 검색어, 색인어, 태그 단어, 카테고리 단어와 같은 사이트의 특성 단어를 이용하여 연관 사이트를 검출함으로써 특성 단어의 내용을 반영하는 연관 사이트를 용이하게 검색할 수 있는 연관 사이트 제공 방법 및 시스템을 제공한다.The present invention provides a method and system for providing a related site that can easily search for related sites that reflect the content of the specific word by detecting the related site by using characteristic words of the site such as search terms, index words, tag words, and category words. do.

본 발명은 미니홈피, 블로그 또는 카페 등과 같은 사이트 간에 특성 정보를 이용하여 사이트 간 연관도를 파악함으로써, 특정 사이트에 대한 연관 사이트를 검출할 수 있는 연관 사이트 제공 방법 및 시스템을 제공한다.The present invention provides a method and system for providing a related site that can detect a related site for a specific site by grasping the degree of association between the sites by using characteristic information between sites such as a mini homepage, a blog or a cafe.

본 발명의 일실시예에 따른 연관 사이트 제공 방법은 사이트에 유입된 적어도 하나의 검색어를 노출하는 단계, 상기 노출된 적어도 하나의 검색어 중 어느 하나가 선택된 경우, 상기 검색어에 대한 연관 사이트를 검출하는 단계 및 상기 선택된 검색어와 링크로 연결하여 상기 검출된 연관 사이트를 제공하는 단계를 포함한다.In accordance with another aspect of the present invention, there is provided a method for providing a related site, including: exposing at least one search term introduced to a site; detecting one of the at least one search term related to the search term; And providing the detected related site by linking with the selected search word.

본 발명의 일실시예에 따른 연관 사이트 제공 방법은 사이트에 대한 적어도 하나의 특성 단어를 결정하여 상기 특성 단어 각각의 단어 벡터를 생성하는 단계, 상기 생성된 사이트 단어 벡터를 이용하여 사이트 사이의 단어 벡터 연관도를 계산하는 단계 및 상기 단어 벡터 연관도를 이용하여 연관 사이트를 검출하는 단계를 포함한다.In accordance with an embodiment of the present invention, a method for providing an associated site includes determining at least one characteristic word for a site and generating a word vector of each characteristic word, and using the generated site word vector, a word vector between sites. Calculating an association degree and detecting an association site using the word vector association degree.

본 발명의 일실시예에 따른 연관 사이트 제공 시스템은 사이트에 유입된 적어도 하나의 검색어를 노출하는 검색어 노출부, 상기 노출된 적어도 하나의 검색어 중 어느 하나가 선택된 경우, 상기 검색어에 대한 연관 사이트를 검출하는 연관 사이트 검출부 및 상기 선택된 검색어와 링크로 연결하여 상기 검출된 연관 사이트를 제공하는 연관 사이트 제공부를 포함한다.Related site providing system according to an embodiment of the present invention is a search term exposure unit that exposes at least one search term introduced to the site, when any one of the at least one of the exposed search terms, the associated site for the search term is detected And an associated site detector for connecting the selected search word with a link and providing the detected related site.

본 발명의 일실시예에 따른 연관 사이트 제공 시스템은 사이트에 대한 적어도 하나의 특성 단어를 결정하여 상기 특성 단어 각각의 단어 벡터를 생성하는 단어 벡터 생성부, 상기 생성된 사이트 단어 벡터를 이용하여 사이트 사이의 단어 벡터 연관도를 계산하는 단어 벡터 연관도 계산부 및 상기 단어 벡터 연관도를 이용하여 연관 사이트를 검출하는 연관 사이트 검출부를 포함한다. According to an embodiment of the present invention, an associated site providing system includes a word vector generator configured to determine at least one feature word for a site and to generate a word vector of each feature word, and between sites using the generated site word vector. And a word vector relevance calculator for calculating a word vector relevance of and a related site detector for detecting a related site using the word vector relevance.

본 발명에 따르면, 미니홈피, 블로그 또는 카페 등과 같은 각종 사이트에 접근하기 위해 유입된 검색어를 노출시킴으로써, 상기 사이트에 접근하는데 유입된 검색어에 대한 정보를 제공할 수 있는 연관 사이트 제공 방법 및 시스템이 제공된다.According to the present invention, a method and system for providing a related site that can provide information on a search word introduced to access the site by exposing a search word introduced to access various sites such as a mini homepage, a blog or a cafe, etc. do.

본 발명에 따르면, 노출된 검색어에 대해 선택하는 경우, 검색어와 링크로 연결된 연관 사이트를 제공함으로써, 검색어에 대한 추가적인 정보를 제공할 수 있는 연관 사이트 제공 방법 및 시스템이 제공된다.According to the present invention, a method and system for providing a related site which can provide additional information about a search word by providing a related site linked with the search word when selecting the exposed search word are provided.

본 발명에 따르면, 검색어, 색인어, 태그 단어, 카테고리 단어와 같은 사이트의 특성 단어를 이용하여 연관 사이트를 검출함으로써 특성 단어의 내용을 반영하는 연관 사이트를 용이하게 검색할 수 있는 연관 사이트 제공 방법 및 시스템이 제공된다.According to the present invention, a method and system for providing a related site that can easily search for a related site reflecting the content of the specific word by detecting the related site by using the characteristic word of the site such as a search word, an index word, a tag word, and a category word. This is provided.

본 발명에 따르면, 미니홈피, 블로그 또는 카페 등과 같은 사이트 간에 특성 정보를 이용하여 사이트 간 연관도를 파악함으로써, 특정 사이트에 대한 연관 사이트를 검출할 수 있는 연관 사이트 제공 방법 및 시스템이 제공된다.According to the present invention, there is provided a related site providing method and system capable of detecting a related site for a specific site by grasping the degree of association between sites using characteristic information between sites such as a mini homepage, a blog or a cafe.

도 1은 본 발명의 일실시예에 따른 연관 사이트 제공 방법을 도시한 플로우차트이다.
도 2는 본 발명의 일실시예에 따른 연관 사이트 제공 방법에 따라 사이트에 유입된 검색어를 노출하는 일례를 도시한 도면이다.
도 3은 본 발명의 일실시예에 따른 선택된 검색어에 대해 연관 사이트를 제공하는 과정을 설명하기 위한 도면이다.
도 4는 본 발명의 다른 일실시예에 따른 연관 사이트 제공 방법을 도시한 플로우차트이다.
도 5는 본 발명의 일실시예에 따른 사이트와 사이트 간 사이트 단어 벡터의 연관도를 통해 연관 사이트를 검출하는 과정을 설명하기 위한 도면이다.
도 6은 본 발명의 일실시예에 따른 연관 사이트 제공 시스템을 도시한 블록 다이어그램이다.
도 7은 본 발명의 다른 일실시예에 따른 연관 사이트 제공 시스템을 도시한 블록 다이어그램이다.
1 is a flowchart illustrating a method for providing a related site according to an embodiment of the present invention.
2 is a diagram illustrating an example of exposing a search word introduced to a site according to a related site providing method according to an exemplary embodiment of the present invention.
3 is a diagram illustrating a process of providing a related site for a selected search word according to an embodiment of the present invention.
4 is a flowchart illustrating a method for providing a related site according to another embodiment of the present invention.
FIG. 5 is a diagram for describing a process of detecting an associated site through a degree of association between a site and a site word vector between sites according to an embodiment of the present invention.
6 is a block diagram illustrating an associated site providing system according to an embodiment of the present invention.
7 is a block diagram illustrating a related site providing system according to another exemplary embodiment of the present invention.

이하, 첨부된 도면들에 기재된 내용들을 참조하여 본 발명에 따른 실시예를 상세하게 설명한다. 다만, 본 발명이 실시예들에 의해 제한되거나 한정되는 것은 아니다. 각 도면에 제시된 동일한 참조부호는 동일한 부재를 나타낸다. 본 발명의 일실시예에 따른 연관 사이트 제공 방법은 연관 사이트 제공 시스템에 의해 수행될 수 있다.Hereinafter, with reference to the contents described in the accompanying drawings will be described in detail an embodiment according to the present invention. However, the present invention is not limited to or limited by the embodiments. Like reference numerals in the drawings denote like elements. The method for providing a related site according to an embodiment of the present invention may be performed by a related site providing system.

도 1은 본 발명의 일실시예에 따른 연관 사이트 제공 방법을 도시한 플로우차트이다. 1 is a flowchart illustrating a method for providing a related site according to an embodiment of the present invention.

본 발명의 일실시예에 따른 연관 사이트 제공 방법은 사이트에 유입된 적어도 하나의 검색어를 노출할 수 있다(S101). 일례로, 사이트에 유입된 적어도 하나의 검색어는 노출하는 단계(S101)는 상기 적어도 하나의 검색어 및 상기 적어도 하나의 검색어 각각에 대한 사이트 유입률을 노출할 수 있다. 이 때, 사이트에 유입된 적어도 하나의 검색어는 노출하는 단계(S101)는 상기 적어도 하나의 검색어를 검색어 각각의 유입률에 따라 정렬하여 노출할 수 있다. 일례로, 사이트는 미니홈피, 블로그 또는 카페를 포함할 수 있다. 사이트의 종류는 한정되지 않고, 온라인 상에서 URL 등의 링크를 통해 접속할 수 있는 것이면 모두 포함될 수 있다.The method of providing a related site according to an embodiment of the present invention may expose at least one search word introduced to a site (S101). For example, in the step S101 of exposing at least one search word introduced to the site, the site inflow rate for each of the at least one search word and the at least one search word may be exposed. In this case, in the step of exposing at least one search word introduced to the site (S101), the at least one search word may be arranged and exposed according to the inflow rate of each search word. In one example, the site may include a minihompy, a blog or a cafe. The type of site is not limited, and any site can be included as long as it can be accessed through a link such as a URL online.

일례로, 검색어에 대한 사이트 유입률은 해당 사이트에 접근한 횟수와 검색어 별 접근 횟수로 계산될 수 있다. 예를 들어, 'A'라는 사이트에 a, b, c라는 검색어로 유입되었다고 가정할 수 있다. 이 때, 'A' 사이트에 접근한 횟수가 총 100건이고, 이 중 검색어 'a'로 유입된 횟수가 50건, 검색어 'b'로 유입된 횟수가 37건, 검색어 'c'로 유입된 횟수가 13건이라고 하자. 그러면, 검색어 각각에 대한 사이트 유입률은 'a'는 50%, 'b'는 37%, 'c'는 13%로 계산될 수 있다. 그리고, 사이트에 유입된 적어도 하나의 검색어는 노출하는 단계(S101)는 사이트 유입률에 따라 'A', 'b', 'c' 순으로 정렬하여 노출할 수 있다.For example, the site inflow rate for a search term may be calculated by the number of times of accessing the corresponding site and the number of accesses per search term. For example, it can be assumed that a search term 'a', 'b', or 'c' enters a site called 'A'. In this case, the total number of accesses to 'A' site was 100, of which 50 flowed into the search term 'a', 37 flowed into the search term 'b', and flowed into the search term 'c'. Say 13 times. Then, the site inflow rate for each of the search terms may be calculated as 'a' 50%, 'b' 37%, and 'c' 13%. In operation S101, at least one search word introduced to a site may be exposed by sorting in order of 'A', 'b', and 'c' according to the site inflow rate.

본 발명의 일실시예에 따른 연관 사이트 제공 방법은 상기 노출된 적어도 하나의 검색어 중 어느 하나가 선택된 경우, 상기 검색어에 대한 연관 사이트를 검출할 수 있다(S102). 상기 예를 참조하면, 사용자가 'b' 검색어를 선택하는 경우, 검색어에 대한 연관 사이트를 검출하는 단계(S102)는 'b' 검색어에 대한 연관 사이트를 검출할 수 있다.In the method of providing a related site according to an embodiment of the present invention, when any one of the at least one search term is selected, the related site for the search term may be detected (S102). Referring to the above example, when the user selects the 'b' search word, detecting the related site for the search word (S102) may detect the related site for the 'b' search word.

보다 구체적으로, 'abcde'라는 블로그에 대한 검색어 유입 순위 1위로 '재즈'라는 검색어가 노출된 경우, 사용자가 '재즈'를 선택하면, 연관 사이트 제공 방법은 '재즈'와 연관있는 블로그, 카페 또는 미니홈피 등과 같은 연관 사이트를 검출하여 제공할 수 있다. 즉, 본 발명의 일실시예에 따른 연관 사이트 제공 방법은 특정 검색어와 연관이 있는 연관 사이트를 제공할 수 있다.More specifically, if the search query 'Jazz' is the highest search inflow rate for the blog 'abcde' and the user selects 'Jazz', then the relevant site is provided by the blog, cafe or Related sites such as minihompy can be detected and provided. That is, the method for providing a related site according to an embodiment of the present invention may provide a related site associated with a specific search word.

일례로, 검색어에 대한 연관 사이트를 검출하는 단계(S102)는 사이트를 수집하여 상기 수집된 사이트에 대한 적어도 하나의 특성 단어를 결정할 수 있다. 이 때, 검색어에 대한 연관 사이트를 검출하는 단계(S102)는 수집할 수 있는 모든 범위의 사이트를 수집하여 데이터베이스에 저장할 수 있다. 그리고, 검색어에 대한 연관 사이트를 검출하는 단계(S102)는 데이터베이스에 저장된 사이트에 대한 적어도 하나의 특성 단어를 결정할 수 있다. 이 때, 특성 단어는 해당 사이트의 대표적인 특성을 나타내는 단어라고 할 수 있다. 다만, 사이트 내 다수의 목록을 통해 다양한 종류의 글이 포스팅된 경우, 특성 단어는 하나 이상일 수 있다.In one example, detecting the associated site for the search word (S102) may collect the site to determine at least one characteristic word for the collected site. At this time, the step (S102) of detecting a related site for a search word may collect all the ranges of sites that can be collected and store them in a database. In operation S102, detecting an associated site for a search word may determine at least one characteristic word for a site stored in a database. In this case, the characteristic word may be a word representing a representative characteristic of the corresponding site. However, when various kinds of articles are posted through a plurality of lists in the site, the characteristic word may be one or more.

이 때, 상기 적어도 하나의 특성 단어를 결정하는 단계는 사이트의 문서에 접근하기 위해 유입된 적어도 하나의 검색어를 상기 사이트의 특성 단어로 결정할 수 있다. 일례로, 사이트의 문서에 접근하기 위해 유입된 적어도 하나의 검색어는 미리 설정한 기간 동안 누적된 검색 로그 데이터를 통해 결정될 수 있다.In this case, the determining of the at least one characteristic word may determine the at least one search word introduced to access the document of the site as the characteristic word of the site. For example, the at least one search word introduced to access the document of the site may be determined through the search log data accumulated during the preset period.

또한, 상기 적어도 하나의 특성 단어를 결정하는 단계는 상기 사이트에 포함된 문서에 대한 적어도 하나의 색인어를 상기 사이트의 특성 단어로 결정할 수 있다. 즉, 수집된 사이트에 포함된 문서의 특성을 나타낼 수 있는 색인어를 사이트의 특성 단어로 결정할 수 있다. 예를 들어, '와인'과 관련된 블로그의 경우, 해당 블로그에 포함된 문서는 '와인'에 관한 내용을 포함할 수 있으며 색인어도 '와인'과 관련 있는 단어일 수 있다.In the determining of the at least one characteristic word, the at least one index word for the document included in the site may be determined as the characteristic word of the site. That is, the index word that can represent the characteristics of the documents included in the collected site may be determined as the characteristic words of the site. For example, in the case of a blog related to 'wine', a document included in the blog may include content related to 'wine' and an index word may be a word related to 'wine'.

이 때, 사이트의 전체 문서에 공통으로 자주 노출되는 단어 또는 거의 노출되지 않는 단어가 색인어가 되는 경우, 상기 색인어가 사이트의 특성을 효율적으로 반영되지 않을 수 있다. 따라서, 상기 적어도 하나의 특성 단어를 결정하는 단계는 상기 적어도 하나의 색인어 중 미리 설정한 문서 노출 빈도 범위에 속하는 색인어를 상기 사이트의 특성 단어로 결정할 수 있다.At this time, when a word that is frequently exposed or a word that is rarely exposed to the entire document of the site becomes an index word, the index word may not efficiently reflect the characteristics of the site. Accordingly, in the determining of the at least one characteristic word, the index word belonging to a preset document exposure frequency range among the at least one index word may be determined as the characteristic word of the site.

또한, 상기 적어도 하나의 특성 단어를 결정하는 단계는 상기 사이트에 포함된 문서를 작성할 때 입력된 적어도 하나의 태그 단어를 상기 사이트의 특성 단어로 결정할 수 있다. 이 때, 태그 단어는 문서 작성자가 문서의 내용에 대한 대표적인 특징으로 입력한 단어라고 할 수 있다. In the determining of the at least one characteristic word, the at least one tag word input when a document included in the site may be determined as the characteristic word of the site. In this case, the tag word may be a word input by the document creator as a representative feature of the content of the document.

또한, 상기 적어도 하나의 특성 단어를 결정하는 단계는 상기 사이트에 포함된 문서를 분류하는 적어도 하나의 카테고리 단어를 상기 사이트의 특성 단어로 결정할 수 있다. 즉, 사이트의 관리자가 문서를 분류하기 위해 생성한 카테고리 (예를 들면, 음악, 여행, 사진 등)가 해당 사이트의 특성 단어가 될 수 있다.In the determining of the at least one characteristic word, the at least one category word for classifying a document included in the site may be determined as the characteristic word of the site. That is, a category (eg, music, travel, photo, etc.) generated by the administrator of the site to classify the document may be a characteristic word of the site.

또한, 검색어에 대한 연관 사이트를 검출하는 단계(S102)는 상기 결정된 적어도 하나의 특성 단어가 상기 검색어와 연관 관계에 있는 경우, 상기 사이트를 상기 검색어에 대한 연관 사이트로 판단할 수 있다.In operation S102, when the determined at least one characteristic word is related to the search word, the site may be determined as the related site for the search word.

예를 들면, 'A'라는 검색어가 선택되었을 때, 수집된 사이트 중 결정된 특성 단어가 'A'와 연관 관계에 있는 사이트는 'A' 검색어와 관련된 문서를 포함하고 있으므로, 'A'라는 검색어와 연관이 있다고 할 수 있다.For example, if the search term "A" is selected, the site with the attribute word determined of the collected sites associated with "A" contains documents related to the search term "A". There is a connection.

이 때, 검색어와 특성 단어가 완전히 동일한 것에 한정되지 않고, 유사하거나 동종 분야에 있는 등 연관 관계를 이루고 있는 경우, 특성 단어를 포함하는 사이트는 검색어에 대한 연관 사이트로 검출될 수 있다.In this case, when the search word and the characteristic word are not limited to the same thing and are related in the same or similar fields, the site including the characteristic word may be detected as the related site for the search word.

본 발명의 일실시예에 따른 연관 사이트 제공 방법은 상기 선택된 검색어와 링크로 연결하여 상기 검출된 연관 사이트를 제공할 수 있다(S103). 일례로, 검출된 연관 사이트를 제공하는 단계(S103)는 검색어와 연관 관계에 있는 다수의 연관 사이트의 목록을 제공할 수 있다. 또한, 일례로, 검출된 연관 사이트를 제공하는 단계(S103)는 상기 검출된 연관 사이트에 포함된 문서 중 상기 선택된 검색어가 노출된 문서를 제공할 수 있다.The method for providing a related site according to an embodiment of the present invention may provide the detected related site by linking the selected search word with a link (S103). In one example, providing a detected related site (S103) may provide a list of a plurality of related sites that are associated with a search term. Also, as an example, providing a detected related site (S103) may provide a document in which the selected search word is exposed among documents included in the detected related site.

도 2는 본 발명의 일실시예에 따른 연관 사이트 제공 방법에 따라 사이트에 유입된 검색어를 노출하는 일례를 도시한 도면이다.2 is a diagram illustrating an example of exposing a search word introduced to a site according to a related site providing method according to an exemplary embodiment of the present invention.

도 2는, 사용자가 'A'라는 사이트(202)를 입력하는 경우, 'A' 사이트에 유입된 검색어 순위를 제공하는 검색 결과(201)를 나타내고 있다. 앞에서 언급했듯이, 사이트는 미니홈피, 블로그 또는 카페를 포함할 수 있다.FIG. 2 illustrates a search result 201 that provides a ranking of search terms introduced to a site 'A' when a user inputs a site 202 'A'. As mentioned earlier, the site can include a minihompy, a blog or a cafe.

검색어 리스트(203)를 참고하면, 'A'사이트에 유입된 검색어 중 가장 많이 유입된 적어도 하나의 검색어가 도시되고 있다. 상기 검색어 각각은 유입률과 함께 노출될 수 있으며, 이 때, 검색어 순위는 유입률에 따라 결정될 수 있다.Referring to the search word list 203, at least one search word most introduced among search words introduced to the 'A' site is illustrated. Each of the search terms may be exposed together with an inflow rate, and the search term ranking may be determined according to the inflow rate.

본 발명의 일실시예에 따른 연관 사이트 제공 방법은 사용자가 노출된 검색어를 선택하는 경우, 선택된 검색어에 대한 연관 사이트를 제공할 수 있다. 예를 들어, 사용자가 1순위 검색어 'ab'를 선택하는 경우, 연관 사이트 제공 방법은 'ab'와 관련 있는 연관 사이트를 검출하여 제공할 수 있다. 동일한 방식으로, 사용자가 2순위 검색어 'cd'를 선택하는 경우, 연관 사이트 제공 방법은 'cd'와 관련 있는 연관 사이트를 검출하여 제공할 수 있다. 이 때, 선택된 검색어에 대한 연관 사이트를 제공하는 구체적인 과정은 도 3에서 구체적으로 설명된다.The related site providing method according to an embodiment of the present invention may provide a related site for the selected search word when the user selects the exposed search word. For example, when the user selects the first priority search word 'ab', the related site providing method may detect and provide a related site related to 'ab'. In the same manner, when the user selects the second ranking search term 'cd', the related site providing method may detect and provide a related site related to 'cd'. In this case, a detailed process of providing a related site for the selected search word will be described in detail with reference to FIG. 3.

도 3은 본 발명의 일실시예에 따른 선택된 검색어에 대해 연관 사이트를 제공하는 과정을 설명하기 위한 도면이다.3 is a diagram illustrating a process of providing a related site for a selected search word according to an embodiment of the present invention.

도 3을 참조하면, 사용자가 검색어 순위가 1위인 검색어 'ab'를 선택한 경우 검색어(301) 'ab'와 관련된 'A 사이트'(302), 'B 사이트'(303), 'C 사이트'(304)가 검출되어 제공될 수 있다. 일례로, 검출된 사이트는 리스트 형태로 제공될 수 있다. 또한, 검출된 사이트는 선택된 검색어(301)가 포함된 문서와 함께 노출되어 제공될 수 있다. 또한, 검출된 사이트는 선택된 검색어(301)와 연관 관계에 있는 단어가 포함된 문서와 함께 노출되어 제공될 수 있다.Referring to FIG. 3, when the user selects the search term 'ab' having the highest ranking, the 'site A' 302, 'site B' 303, 'site C' associated with the term 'ab', 304 can be detected and provided. In one example, the detected sites may be provided in the form of a list. In addition, the detected site may be exposed and provided together with the document including the selected search word 301. In addition, the detected site may be exposed and provided together with a document including a word associated with the selected search word 301.

도 2에서 이미 설명했듯이, 수집된 사이트에서 상기 사이트에 유입된 적어도 하나의 검색어, 상기 사이트의 문서에 대한 적어도 하나의 색인어, 상기 사이트와 관련된 적어도 하나의 태그 단어 또는 상기 사이트의 문서를 분류하는 적어도 하나의 카테고리 단어 중 어느 하나가 특성 단어로 결정될 수 있다. 연관 사이트 제공 방법은 결정된 특성 단어와 검색어(301)가 연관 관계에 있는 경우, 상기 사이트를 연관 사이트로 검출할 수 있다.As already described in FIG. 2, at least one search term entered into the site from the collected site, at least one index word for the document of the site, at least one tag word associated with the site, or at least to classify the document of the site. Any one of the category words may be determined as a characteristic word. The related site providing method may detect the site as the related site when the determined characteristic word and the search word 301 are related to each other.

도 4는 본 발명의 다른 일실시예에 따른 연관 사이트 제공 방법을 도시한 플로우차트이다. 도 4는 도 1과 달리, 특정 사이트와 관련 있는 연관 사이트를 제공하는 연관 사이트 제공 방법을 도시하고 있다.4 is a flowchart illustrating a method for providing a related site according to another embodiment of the present invention. 4 illustrates a related site providing method for providing a related site related to a specific site, unlike FIG. 1.

본 발명의 일실시예에 따른 연관 사이트 제공 방법은 사이트에 대한 적어도 하나의 특성 단어를 결정하여 상기 특성 단어 각각의 단어 벡터를 생성할 수 있다(S401). 일례로, 특성 단어 각각의 단어 벡터를 생성하는 단계(S401)는 사이트의 문서에 접근하기 위해 유입된 적어도 하나의 검색어를 상기 사이트의 특성 단어로 결정할 수 있다. 이 때, 특성 단어 각각의 단어 벡터를 생성하는 단계(S401)는 상기 사이트의 문서에 접근한 총 접근 횟수와 상기 적어도 하나의 검색어 각각의 접근 횟수를 이용하여 상기 적어도 하나의 검색어에 대한 단어 벡터를 생성할 수 있다. 즉, 특성 단어가 검색어인 경우, 단어 벡터는 상기 검색어에 대한 사이트 유입률로 계산될 수 있다.In the method of providing a related site according to an embodiment of the present invention, at least one feature word for a site may be determined to generate a word vector of each feature word (S401). For example, in operation S401, the word vector of each feature word may be determined as the feature word of the site, at least one search word introduced to access the document of the site. In this case, the generating of the word vector of each characteristic word (S401) may include generating the word vector for the at least one search word by using the total number of accesses to the document of the site and the access times of each of the at least one search word. Can be generated. That is, when the characteristic word is a search word, the word vector may be calculated as a site inflow rate for the search word.

일례로, 특성 단어 각각의 단어 벡터를 생성하는 단계(S401)는 상기 사이트에 포함된 문서에 대한 적어도 하나의 색인어를 상기 사이트의 특성 단어로 결정할 수 있다. 이 때, 사이트의 전체 문서에 공통으로 자주 노출되는 단어 또는 거의 노출되지 않는 단어가 색인어가 되는 경우, 상기 색인어가 사이트의 특성을 효율적으로 반영되지 않을 수 있다. 따라서, 특성 단어 각각의 단어 벡터를 생성하는 단계(S401)는 상기 적어도 하나의 색인어 중 미리 설정한 문서 노출 빈도 범위에 속하는 색인어를 상기 사이트의 특성 단어로 결정할 수 있다.For example, generating a word vector of each feature word (S401) may determine at least one index word for a document included in the site as the feature word of the site. At this time, when a word that is frequently exposed or a word that is rarely exposed to the entire document of the site becomes an index word, the index word may not efficiently reflect the characteristics of the site. Accordingly, in the generating of the word vector of each feature word (S401), an index word belonging to a preset document exposure frequency range among the at least one index word may be determined as the feature word of the site.

이 때, 특성 단어 각각의 단어 벡터를 생성하는 단계(S401)는 사이트의 문서에서 전체 색인어에 대해 각각의 색인어가 노출되는 비율을 계산하여 단어 벡터를 계산할 수 있다. 예를 들면, 색인어 1은 30%, 색인어 2는 20%의 형태로 단어 벡터가 계산될 수 있다.At this time, generating the word vector of each characteristic word (S401) may calculate the word vector by calculating the ratio of each index word to the total index word in the document of the site. For example, the word vector may be calculated in the form of index 1 for 30% and index 2 for 20%.

일례로, 특성 단어 각각의 단어 벡터를 생성하는 단계(S401)는 상기 사이트에 포함된 문서를 작성할 때 입력된 적어도 하나의 태그 단어를 상기 사이트의 특성 단어로 결정할 수 있다. For example, generating a word vector of each feature word (S401) may determine at least one tag word input when a document included in the site is a feature word of the site.

이 때, 특성 단어 각각의 단어 벡터를 생성하는 단계(S401)는 사이트의 문서에서 전체 태그 단어에 대해 각각의 태그 단어가 노출되는 비율을 계산하여 단어 벡터를 계산할 수 있다. 예를 들면, 태그 단어 1은 30%, 태그 단어 2는 20%의 형태로 단어 벡터가 계산될 수 있다.In this case, in the generating of the word vector of each characteristic word (S401), the word vector may be calculated by calculating a rate at which each tag word is exposed for all the tag words in the document of the site. For example, the word vector may be calculated in the form of tag word 1 of 30% and tag word 2 of 20%.

일례로, 특성 단어 각각의 단어 벡터를 생성하는 단계(S401)는 상기 사이트에 포함된 문서를 분류하는 적어도 하나의 카테고리 단어를 상기 사이트의 특성 단어로 결정할 수 있다.For example, generating a word vector of each feature word (S401) may determine at least one category word that classifies a document included in the site as the feature word of the site.

이 때, 특성 단어 각각의 단어 벡터를 생성하는 단계(S401)는 사이트의 문서에서 전체 카테고리 단어에 대해 각각의 카테고리 단어가 노출되는 비율을 계산하여 단어 벡터를 계산할 수 있다. 예를 들면, 카테고리 단어 1은 25%, 카테고리 단어 2는 14%의 형태로 단어 벡터가 계산될 수 있다. 도 1과 달리, 도 3에서 특성 단어는 기준이 되는 사이트와 비교 대상이 되는 사이트 각각에 대해 결정될 수 있다.In this case, in the generating of the word vector of each characteristic word (S401), the word vector may be calculated by calculating a ratio of the exposure of each category word with respect to all category words in the document of the site. For example, the word vector may be calculated in the form of category word 1 for 25% and category word 2 for 14%. Unlike FIG. 1, the characteristic word in FIG. 3 may be determined for each of the sites to be compared with the sites to be compared.

본 발명의 일실시예에 따른 연관 사이트 제공 방법은 상기 생성된 사이트 단어 벡터를 이용하여 사이트 사이의 단어 벡터 연관도를 계산할 수 있다(S402). 이 때, 사이트 사이의 단어 벡터 연관도를 계산하는 단계(S402)는 상기 사이트 단어 벡터의 크기를 이용하여 상기 사이트 사이의 단어 벡터 연관도를 계산할 수 있다. 즉, 단어 벡터 연관도는 단어 벡터 사이의 가중치를 기반으로 계산될 수 있다. In the method of providing a related site according to an embodiment of the present invention, a degree of word vector association between sites may be calculated using the generated site word vector (S402). At this time, the step S402 of calculating the word vector association between the sites may calculate the word vector association between the sites using the size of the site word vector. That is, the word vector association may be calculated based on weights between the word vectors.

일례로, 사이트 사이의 단어 벡터 연관도를 계산하는 단계(S402)는 코사인 유사도(cosine similarity)를 이용하여 상기 사이트 단어 벡터 사이의 각을 계산할 수 있다. 즉, 코사인 유사도는 두 벡터 간의 내적을 이용하는 방법이라고 할 수 있다.In one example, calculating the word vector association between sites (S402) may calculate the angle between the site word vector using cosine similarity (cosine similarity). In other words, the cosine similarity can be said to use the dot product between the two vectors.

예를 들면, 'A 사이트'의 특성 단어가 '와인, 음악, 유럽 여행'이고, 'B 사이트'의 특성 단어가 '와인, 사진, 프랑스 여행' 이라고 가정하자. 그리고, 특성 단어 각각에 대한 단어 벡터는 'A 사이트' 의 경우 (0.6, 0.3, 0.1)이고, 'B 사이트'의 경우 (0.3, 0.5, 0.2)라고 할 수 있다. 그러면, 단어 벡터 연관도는 0.6*0.3+0.1*0.2=0.2로 결정될 수 있다.For example, suppose that the characteristic word for 'site A' is 'wine, music and travel to Europe' and the characteristic word for 'site B' is 'wine, photo and travel to France'. The word vector for each characteristic word may be (0.6, 0.3, 0.1) for 'A site' and (0.3, 0.5, 0.2) for 'B site'. Then, the word vector association may be determined as 0.6 * 0.3 + 0.1 * 0.2 = 0.2.

일례로, 사이트의 특성 단어 사이에 연관도가 높은 경우, 각각의 특성 단어에 가중치를 부여하는 방식도 적용될 수 있다. 즉, 'A 사이트'와 'B 사이트'의 경우 '와인'이라는 특성 단어가 동일하므로, 연관도가 더 높기 때문에 다른 특성 단어보다 더 많은 가중치를 부여할 수 있다.For example, when a high degree of association between characteristic words of a site is applied, a method of weighting each characteristic word may also be applied. That is, 'site A' and 'site B' have the same characteristic words as 'wine', and thus have a higher degree of relevance and thus can be given more weight than other characteristic words.

본 발명의 일실시예에 따른 연관 사이트 제공 방법은 상기 단어 벡터 연관도를 이용하여 연관 사이트를 검출할 수 있다(S403). 일례로, 연관 사이트를 검출하는 단계(S403)는 단어 벡터 연관도에 따라 상기 사이트 사이의 거리를 판단하는 단계 및 상기 사이트 사이의 거리가 짧은 순서로 사이트를 정렬하여 미리 설정한 순위에 속하는 사이트를 연관 사이트로 검출하는 단계를 포함할 수 있다.In a method of providing a related site according to an embodiment of the present invention, an associated site may be detected using the word vector degree of association (S403). For example, the detecting of the related site (S403) may include determining a distance between the sites according to the word vector relevance and sorting the sites in the order of the shortest distance between the sites to determine which sites belong to a preset ranking. Detecting as an associated site.

예를 들어, 단어 벡터 연관도가 기준이 되는 'A 사이트'에 대해 'B 사이트'와 단어 벡터 연관도는 0.7이고, 'C 사이트'와 단어 벡터 연관도는 0.4라고 하면, 'A 사이트'는 'C 사이트'보다 'B 사이트'와 더 거리가 가깝다고 판단될 수 있다. 연관 사이트를 검출하는 단계(S403)는 기준이 되는 A 사이트에 대해 거리가 짧은 순서로 사이트를 정렬하고, 미리 설정한 순위(예를 들어, 5위)에 속하는 사이트만 연관 사이트로 검출하여 제공할 수 있다.For example, if the word vector association is 0.7, the site B and the word vector association is 0.7, and the site C and the word vector association is 0.4. It can be judged that the distance from the 'site B' is closer than the 'site C'. Detecting the related site (S403) is to arrange the sites in the order of short distance to the site A as a reference, and to detect and provide only sites belonging to a predetermined rank (for example, 5th) as the related site. Can be.

도 5는 본 발명의 일실시예에 따른 사이트와 사이트 간 사이트 단어 벡터의 연관도를 통해 연관 사이트를 검출하는 과정을 설명하기 위한 도면이다.FIG. 5 is a diagram for describing a process of detecting an associated site through a degree of association between a site and a site word vector between sites according to an embodiment of the present invention.

도 5를 참고하면, 본 발명의 일실시예에 따른 연관 사이트 제공 방법은 기준이 되는 'A 사이트(501)'에 대해 연관 사이트를 검출하여 제공할 수 있다. 이 때, 연관 사이트 제공 방법은 수집된 사이트인 'B 사이트(502)', 'C 사이트(503)' 및 'D 사이트(504)'와 연관도를 판단하여 연관 사이트를 검출할 수 있다. 이 때, 연관 사이트 제공 방법은 기준이 되는 'A 사이트(501)' 와 비교 대상이 되는 'B 사이트(502)', 'C 사이트(503)' 및 'D 사이트(504)' 각각으로부터 적어도 하나의 특성 단어를 결정할 수 있다. 앞에서 이미 언급했듯이, 특성 단어는 각 사이트의 검색어, 색인어, 태그 단어 또는 카테고리 단어를 통해 결정될 수 있다. 그리고, 연관 사이트 제공 방법은 결정된 특성 단어 각각에 대한 단어 벡터를 결정할 수 있다.Referring to FIG. 5, the method for providing a related site according to an embodiment of the present invention may detect and provide a related site for 'A site 501' which is a reference. At this time, the related site providing method may detect the related site by determining the degree of association with the collected sites 'B site 502', 'C site 503' and 'D site 504'. At this time, the related site providing method is at least one from each of the 'site A (501), the reference site' B site 502 ',' C site 503 'and' D site 504 'to be compared The characteristic word of can be determined. As already mentioned above, feature words can be determined through search terms, index words, tag words, or category words for each site. In addition, the method of providing a related site may determine a word vector for each of the determined characteristic words.

이 때, 연관 사이트 제공 방법은 'A 사이트(501)'의 단어 벡터와 'B 사이트(502)', 'C 사이트(503)' 및 'D 사이트(504)' 각각의 단어 벡터 간의 단어 벡터 연관도를 계산할 수 있다. 그리고, 연관 사이트 제공 방법은 단어 벡터 연관도가 클수록 사이트 간의 거리가 가깝다고 판단할 수 있다. 또한, 예를 들어, 연관 사이트 제공 방법은 'A 사이트(501)'와 거리가 가까운 순서대로 'C 사이트(503)', 'D 사이트(504)' 및 'B 사이트(502)로 정렬하였다고 가정하자. 또한, 연관 사이트 제공 방법은 상위 2위까지 연관 사이트로 검출한다고 가정하자. 그러면 연관 사이트 제공 방법은 상위 2위에 속하는 'C 사이트(503)' 및 'D 사이트(504)'를 연관 사이트로 검출하여 제공할 수 있다.In this case, the method of providing a related site is a word vector association between a word vector of 'A site 501' and a word vector of each of 'B site 502', 'C site 503' and 'D site 504'. The degree can be calculated. In addition, the method of providing a related site may determine that the distance between the sites is closer as the word vector association is greater. Also, for example, it is assumed that the related site providing method is arranged in the order of the distance closest to the 'site A (501)', 'site C (503),' site D (504) 'and' site B (502) '. lets do it. In addition, suppose that the related site providing method detects the top 2 positions as the related site. Then, the related site providing method may detect and provide 'C site 503' and 'D site 504' belonging to the top two as related sites.

도 6은 본 발명의 일실시예에 따른 연관 사이트 제공 시스템을 도시한 블록 다이어그램이다. 본 발명의 일실시예에 따른 연관 사이트 제공 시스템(600)은 검색어 노출부(601), 연관 사이트 검출부(602) 및 연관 사이트 제공부(603)를 포함할 수 있다. 6 is a block diagram illustrating an associated site providing system according to an embodiment of the present invention. Related site providing system 600 according to an embodiment of the present invention may include a search word exposure unit 601, an associated site detection unit 602 and an associated site providing unit 603.

검색어 노출부(601)는 사이트에 유입된 적어도 하나의 검색어를 노출할 수 있다.The search word exposure unit 601 may expose at least one search word introduced to the site.

이 때, 검색어 노출부(601)는 상기 적어도 하나의 검색어 및 상기 적어도 하나의 검색어 각각에 대한 사이트 유입률을 노출할 수 있다. 그리고, 검색어 노출부(601)는 검색어 각각에 대한 사이트 유입률에 따라 정렬하여 노출할 수 있다.In this case, the search word exposure unit 601 may expose a site inflow rate for each of the at least one search word and the at least one search word. In addition, the search word exposure unit 601 may sort and display the search terms according to the site inflow rate for each search word.

연관 사이트 검출부(602)는 상기 노출된 적어도 하나의 검색어 중 어느 하나가 선택된 경우, 상기 검색어에 대한 연관 사이트를 검출할 수 있다. 일례로, 연관 사이트 검출부는 특성 단어 결정부(604) 및 연관 사이트 판단부(605)를 포함할 수 있다.The related site detector 602 may detect a related site for the search word when any one of the at least one search term is selected. For example, the associated site detector may include a feature word determiner 604 and an associated site determiner 605.

특성 단어 결정부(604)는 사이트를 수집하여 상기 수집된 사이트에 대한 적어도 하나의 특성 단어를 결정할 수 있다.The feature word determiner 604 may collect sites to determine at least one feature word for the collected sites.

일례로, 특성 단어 결정부(604)는 사이트의 문서에 접근하기 위해 유입된 적어도 하나의 검색어를 상기 사이트의 특성 단어로 결정할 수 있다.For example, the feature word determiner 604 may determine at least one search word introduced to access the document of the site as the feature word of the site.

일례로, 특성 단어 결정부(604)는 상기 사이트에 포함된 문서에 대한 적어도 하나의 색인어를 상기 사이트의 특성 단어로 결정할 수 있다.For example, the feature word determiner 604 may determine at least one index word for a document included in the site as the feature word of the site.

일례로, 특성 단어 결정부(604)는 상기 사이트에 포함된 문서를 작성할 때 입력된 적어도 하나의 태그를 상기 사이트의 특성 단어로 결정할 수 있다.For example, the characteristic word determiner 604 may determine at least one tag input when creating a document included in the site as the characteristic word of the site.

일례로, 특성 단어 결정부(604)는 상기 사이트에 포함된 문서를 분류하는 적어도 하나의 카테고리 단어를 상기 사이트의 특성 단어로 결정할 수 있다.For example, the characteristic word determiner 604 may determine at least one category word for classifying a document included in the site as the characteristic word of the site.

연관 사이트 판단부(605)는 상기 결정된 적어도 하나의 특성 단어 중 상기 검색어를 포함하는 경우, 상기 검색어와 상기 사이트를 연관 사이트로 판단할 수 있다.The related site determining unit 605 may determine the search word and the site as the related site when the search word is included in the at least one characteristic word.

연관 사이트 제공부(603)는 상기 선택된 검색어와 링크로 연결하여 상기 검출된 연관 사이트를 제공할 수 있다. 이 때, 연관 사이트 제공부(603)는 연관 사이트의 리스트를 제공할 수 있다. 또한, 연관 사이트 제공부(603)는 상기 검출된 연관 사이트에 포함된 문서 중 상기 검색어가 노출된 문서를 제공할 수 있다.The related site provider 603 may provide the detected related site by linking the selected search word. At this time, the related site provider 603 may provide a list of related sites. In addition, the related site providing unit 603 may provide a document in which the search word is exposed among documents included in the detected related site.

도 7은 본 발명의 다른 일실시예에 따른 연관 사이트 제공 시스템을 도시한 블록 다이어그램이다.7 is a block diagram illustrating a related site providing system according to another exemplary embodiment of the present invention.

본 발명의 일실시예에 따른 연관 사이트 제공 시스템(700)은 단어 벡터 생성부(701), 단어 벡터 연관도 계산부(702) 및 연관 사이트 검출부(703)를 포함할 수 있다. The associated site providing system 700 according to an exemplary embodiment of the present invention may include a word vector generator 701, a word vector association calculator 702, and an associated site detector 703.

단어 벡터 생성부(701)는 사이트에 대한 적어도 하나의 특성 단어를 결정하여 상기 특성 단어 각각의 단어 벡터를 생성할 수 있다.The word vector generator 701 may generate at least one feature word for the site to generate a word vector of each feature word.

일례로, 단어 벡터 생성부(701)는 사이트의 문서에 접근하기 위해 유입된 적어도 하나의 검색어를 상기 사이트의 특성 단어로 결정할 수 있다. 이 때, 단어 벡터 생성부(701)는 상기 사이트의 문서에 접근한 총 접근 횟수와 상기 적어도 하나의 검색어 각각의 접근 횟수를 이용하여 사이트 유입률을 계산할 수 있다. 이 때, 계산된 사이트 유입률은 검색어에 대한 단어 벡터일 수 있다.For example, the word vector generator 701 may determine at least one search word that is introduced to access a document of a site as a characteristic word of the site. In this case, the word vector generator 701 may calculate a site inflow rate using the total number of accesses to the document of the site and the number of accesses of each of the at least one search word. In this case, the calculated site inflow rate may be a word vector for a search word.

일례로, 단어 벡터 생성부(701)는 상기 사이트에 포함된 문서에 대한 적어도 하나의 색인어를 상기 사이트의 특성 단어로 결정할 수 있다. 이 때, 단어 벡터 생성부(701)는 사이트의 문서에서 전체 색인어에 대해 각각의 색인어가 노출되는 비율을 계산하여 단어 벡터를 생성할 수 있다.For example, the word vector generator 701 may determine at least one index word for a document included in the site as a characteristic word of the site. In this case, the word vector generator 701 may generate a word vector by calculating a ratio of each index word exposed to all index words in the document of the site.

일례로, 단어 벡터 생성부(701)는 상기 사이트에 포함된 문서를 작성할 때 입력된 적어도 하나의 태그를 상기 사이트의 특성 단어로 결정할 수 있다. 이 때, 단어 벡터 생성부(701)는 사이트의 문서에서 전체 태그 단어에 대해 각각의 태그 단어가 노출되는 비율을 계산하여 단어 벡터를 생성할 수 있다.For example, the word vector generator 701 may determine at least one tag input when the document included in the site is a characteristic word of the site. In this case, the word vector generator 701 may generate a word vector by calculating a ratio of each tag word to the entire tag words in the document of the site.

일례로, 단어 벡터 생성부(701)는 상기 사이트에 포함된 문서를 분류하는 적어도 하나의 카테고리 단어를 상기 사이트의 특성 단어로 결정할 수 있다. 이 때, 단어 벡터 생성부(701)는 사이트의 문서에서 전체 카테고리 단어에 대해 각각의 카테고리 단어가 노출되는 비율을 계산하여 단어 벡터를 생성할 수 있다.For example, the word vector generator 701 may determine at least one category word for classifying a document included in the site as a characteristic word of the site. In this case, the word vector generator 701 may generate a word vector by calculating a ratio of each category word exposed to all category words in the document of the site.

단어 벡터 연관도 계산부(702)는 상기 생성된 사이트 단어 벡터를 이용하여 사이트 사이의 단어 벡터 연관도를 계산할 수 있다. 단어 벡터 연관도 계산부(702)는 상기 사이트 단어 벡터의 크기를 이용하여 상기 사이트 사이의 단어 벡터 연관도를 계산할 수 있다.The word vector association calculator 702 may calculate a word vector association between sites using the generated site word vector. The word vector association calculator 702 may calculate a word vector association between the sites using the size of the site word vector.

연관 사이트 검출부(703)는 상기 단어 벡터 연관도를 이용하여 연관 사이트를 검출할 수 있다. 일례로, 연관 사이트 검출부(703)는 상기 단어 벡터 연관도에 따라 상기 사이트 사이의 거리를 판단할 수 있다. 그리고, 연관 사이트 검출부(703)는 상기 사이트 사이의 거리가 짧은 순서로 사이트를 정렬하여 미리 설정한 순위에 속하는 사이트를 연관 사이트로 검출할 수 있다.The related site detector 703 may detect the related site by using the word vector degree of association. For example, the related site detector 703 may determine the distance between the sites according to the word vector degree of association. In addition, the related site detector 703 may arrange the sites in the order of short distance between the sites and detect a site belonging to a predetermined rank as the related site.

도 6 및 도 7에 대한 구체적인 설명은 도 1 내지 도 5의 설명을 참고할 수 있다.6 and 7 may refer to the descriptions of FIGS. 1 to 5.

또한, 본 발명의 일실시예에 따른 연관 사이트 제공 방법은 다양한 컴퓨터로 구현되는 동작을 수행하기 위한 프로그램 명령을 포함하는 컴퓨터 판독 가능 매체를 포함한다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.In addition, the method for providing a related site according to an embodiment of the present invention includes a computer readable medium including program instructions for performing various computer-implemented operations. The computer readable medium may include program instructions, data files, data structures, etc. alone or in combination. The media may be program instructions that are specially designed and constructed for the present invention or may be available to those skilled in the art of computer software. Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks, and magnetic tape, optical media such as CD-ROMs, DVDs, and magnetic disks, such as floppy disks. Magneto-optical media, and hardware devices specifically configured to store and execute program instructions, such as ROM, RAM, flash memory, and the like. Examples of program instructions include not only machine code generated by a compiler, but also high-level language code that can be executed by a computer using an interpreter or the like.

이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 이는 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. 따라서, 본 발명 사상은 아래에 기재된 특허청구범위에 의해서만 파악되어야 하고, 이의 균등 또는 등가적 변형 모두는 본 발명 사상의 범주에 속한다고 할 것이다.As described above, the present invention has been described by way of limited embodiments and drawings, but the present invention is not limited to the above-described embodiments, which can be variously modified and modified by those skilled in the art to which the present invention pertains. Modifications are possible. Accordingly, the spirit of the present invention should be understood only by the claims set forth below, and all equivalent or equivalent modifications thereof will belong to the scope of the present invention.

600: 연관 사이트 제공 시스템
601: 검색어 노출부
602: 연관 사이트 검출부
603: 연관 사이트 제공부
604: 특성 단어 결정부
605: 연관 사이트 판단부
600: related site providing system
601: Query exposed portion
602: associated site detection unit
603: related site provider
604: characteristic word determination unit
605: association site determination unit

Claims (1)

사이트에 유입된 적어도 하나의 검색어를 노출하는 단계;
상기 노출된 적어도 하나의 검색어 중 어느 하나가 선택된 경우, 상기 검색어에 대한 연관 사이트를 검출하는 단계; 및
상기 선택된 검색어와 링크로 연결하여 상기 검출된 연관 사이트를 제공하는 단계
를 포함하는 방법.
Exposing at least one search term introduced to the site;
If any one of the at least one search term is selected, detecting a related site for the search term; And
Linking with the selected search word to provide the detected related site
How to include.
KR1020100115731A 2010-11-19 2010-11-19 Method and system for providing relevance site using chracteristic word of site KR101347884B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020100115731A KR101347884B1 (en) 2010-11-19 2010-11-19 Method and system for providing relevance site using chracteristic word of site

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020100115731A KR101347884B1 (en) 2010-11-19 2010-11-19 Method and system for providing relevance site using chracteristic word of site

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020080018511A Division KR101042445B1 (en) 2008-02-28 2008-02-28 Method and system for providing relevance site using chracteristic word of site

Publications (2)

Publication Number Publication Date
KR20100138858A true KR20100138858A (en) 2010-12-31
KR101347884B1 KR101347884B1 (en) 2014-01-07

Family

ID=43512181

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100115731A KR101347884B1 (en) 2010-11-19 2010-11-19 Method and system for providing relevance site using chracteristic word of site

Country Status (1)

Country Link
KR (1) KR101347884B1 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160022408A (en) * 2014-08-19 2016-03-02 주식회사 모브릭 Apparatus and method for relaying media
KR20160022839A (en) * 2016-01-26 2016-03-02 주식회사 모브릭 Apparatus and method for relaying media
CN111382566A (en) * 2018-12-28 2020-07-07 北京搜狗科技发展有限公司 Site theme determination method and device and electronic equipment

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010092922A (en) * 2000-03-27 2001-10-27 이현구 Method for Searching Similar Websites
JP2002215674A (en) * 2001-01-22 2002-08-02 Kddi Corp Web page browsing support system, method and program
KR100816934B1 (en) * 2006-04-13 2008-03-26 엘지전자 주식회사 Clustering system and method using search result document

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160022408A (en) * 2014-08-19 2016-03-02 주식회사 모브릭 Apparatus and method for relaying media
KR20160022839A (en) * 2016-01-26 2016-03-02 주식회사 모브릭 Apparatus and method for relaying media
CN111382566A (en) * 2018-12-28 2020-07-07 北京搜狗科技发展有限公司 Site theme determination method and device and electronic equipment
CN111382566B (en) * 2018-12-28 2024-05-24 北京搜狗科技发展有限公司 Site theme determining method and device and electronic equipment

Also Published As

Publication number Publication date
KR101347884B1 (en) 2014-01-07

Similar Documents

Publication Publication Date Title
US11741173B2 (en) Related notes and multi-layer search in personal and shared content
Lewandowski et al. The influence of search engine optimization on Google's results: A multi-dimensional approach for detecting SEO
US9418128B2 (en) Linking documents with entities, actions and applications
JP5329540B2 (en) User-centric information search method, computer-readable recording medium, and user-centric information search system
US10152478B2 (en) Apparatus, system and method for string disambiguation and entity ranking
US8825641B2 (en) Measuring duplication in search results
US11347758B2 (en) Method and apparatus for processing search data
KR101541306B1 (en) Computer enabled method of important keyword extraction, server performing the same and storage media storing the same
KR101254362B1 (en) Method and system for providing keyword ranking using common affix
Patankar et al. A bias aware news recommendation system
KR100954842B1 (en) Method and System of classifying web page using category tag information and Recording medium using by the same
Yulianti et al. Tweet‐biased summarization
KR101347884B1 (en) Method and system for providing relevance site using chracteristic word of site
KR100913049B1 (en) Method and system for providing positive / negative search result using user preference
KR102299525B1 (en) Product Evolution Mining Method And Apparatus Thereof
JP5427119B2 (en) Similar document search device, similar document search method, program thereof, and recording medium
KR101042445B1 (en) Method and system for providing relevance site using chracteristic word of site
Spahiu et al. Topic profiling benchmarks in the linked open data cloud: Issues and lessons learned
KR101544142B1 (en) Searching method and system based on topic
Efremova et al. A geo-tagging framework for address extraction from web pages
An et al. Improving local search with open geographic data
Anastácio et al. Using the geographic scopes of web documents for contextual advertising
WO2008143407A1 (en) Method and system for providing keyword ranking using common affix
KR20090097710A (en) System and method for searching person
Horch et al. Extracting product offers from e-shop websites

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20161024

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20171011

Year of fee payment: 5