KR101050013B1 - Apparatus and method for ranking search results using representative reliability - Google Patents

Apparatus and method for ranking search results using representative reliability Download PDF

Info

Publication number
KR101050013B1
KR101050013B1 KR1020090038119A KR20090038119A KR101050013B1 KR 101050013 B1 KR101050013 B1 KR 101050013B1 KR 1020090038119 A KR1020090038119 A KR 1020090038119A KR 20090038119 A KR20090038119 A KR 20090038119A KR 101050013 B1 KR101050013 B1 KR 101050013B1
Authority
KR
South Korea
Prior art keywords
representative
search result
reliability
extracting
result document
Prior art date
Application number
KR1020090038119A
Other languages
Korean (ko)
Other versions
KR20100119157A (en
Inventor
이해진
이준호
신중호
Original Assignee
엔에이치엔(주)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엔에이치엔(주) filed Critical 엔에이치엔(주)
Priority to KR1020090038119A priority Critical patent/KR101050013B1/en
Priority to JP2010093975A priority patent/JP5497523B2/en
Publication of KR20100119157A publication Critical patent/KR20100119157A/en
Application granted granted Critical
Publication of KR101050013B1 publication Critical patent/KR101050013B1/en
Priority to JP2014042802A priority patent/JP5724009B2/en
Priority to JP2015068780A priority patent/JP5989170B2/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions

Abstract

대표자의 신뢰도를 이용한 검색 결과 순위화 장치 및 방법이 개시된다. 대표자의 신뢰도를 이용한 검색 결과 순위화 장치는, 검색 쿼리에 대한 검색 결과 문서를 추출하는 검색부, 상기 검색 결과 문서에 대한 대표자를 추출하는 대표자 추출부, 상기 대표자에 대한 신뢰도를 산출하는 신뢰도 산출부 및 상기 신뢰도를 고려하여 상기 검색 결과 문서를 순위화하는 순위화부를 포함한다.Disclosed are an apparatus and method for ranking search results using a representative's reliability. The search result ranking apparatus using the reliability of the representative includes: a search unit for extracting a search result document for a search query, a representative extractor for extracting a representative for the search result document, and a reliability calculator for calculating the reliability of the representative And a ranking unit for ranking the search result documents in consideration of the reliability.

대표자, 신뢰도, 순위화, 대표자명, 가중치 Representative, Reliability, Ranking, Representative Name, Weight

Description

대표자의 신뢰도를 이용한 검색 결과 순위화 장치 및 방법 {DEVICE FOR RANKING SEARCH RESULT USING REPRESENTATIVE'S RELIABILITY AND METHOD THEREOF}Apparatus and method for ranking search results using representative reliability {DEVICE FOR RANKING SEARCH RESULT USING REPRESENTATIVE'S RELIABILITY AND METHOD THEREOF}

본 발명의 일실시예는 검색 쿼리에 대응한 검색 결과 문서의 대표자를 추출하고 상기 대표자의 신뢰도를 고려하여 상기 검색 결과 문서를 순위화하는 장치 및 방법에 관한 것이다. One embodiment of the present invention relates to an apparatus and method for extracting a representative of a search result document corresponding to a search query and ranking the search result document in consideration of the reliability of the representative.

검색 키워드에 대응하여 검색 결과로서 나타나는 페이지에는 검색 키워드를 주제로 하는 사이트, 검색 키워드를 내용에 포함하는 블로그, 카페, 게시판, 뉴스, 웹문서 등이 게재될 수 있다.The page that appears as a search result in response to the search keyword may include a site that includes the search keyword, a blog, a cafe, a bulletin board, a news, a web document, etc. including the search keyword in the content.

이러한 검색 결과를 순위화하는 과정에 있어서 해당 문서의 키워드와의 유사도 또는 해당 문서의 페이지랭크 등만을 고려하다 보니 신뢰성이 부족한 문서들이 검색 결과의 상단에 노출되는 경우가 발생한다. 이로 인해, 검색 키워드를 포함하지만 검색 의도에 부합하지 않는 문서들이 결과로서 나타나게 되어, 검색 결과의 신뢰도가 보장되지 않는 경우가 발생한다.In the ranking of the search results, only the similarity with the keywords of the document or the page rank of the document is considered, so that the documents with insufficient reliability may be exposed at the top of the search result. As a result, documents including the search keyword but not matching the search intention appear as a result, and thus the reliability of the search result occurs.

이는 검색 키워드를 포함하는 각각의 문서 자체의 연관도 또는 인기도만을 고려하여 순위화를 하기 때문이다.This is because the ranking is made only by considering the relevance or popularity of each document itself including the search keyword.

따라서, 사용자의 검색 의도에 보다 부합하고, 검색의 신뢰성을 향상시킬 수 있는 검색 결과 순위화 장치 및 방법이 요구된다.Accordingly, there is a need for a search result ranking apparatus and method that can more closely match a user's search intent and improve the reliability of the search.

본 발명은 검색 결과 문서에 대한 대표자를 추출하고, 상기 대표자의 신뢰도를 고려하여 상기 검색 결과 문서를 순위화함으로써, 사용자의 검색 의도에 부합하고, 신뢰성이 높은 검색 결과 문서를 우선 순위에 제공할 수 있는 검색 결과 순위화 장치 및 방법을 제공한다.The present invention extracts a representative of a search result document and ranks the search result document in consideration of the reliability of the representative, thereby providing a search result document having high reliability in accordance with a user's search intention and having high reliability. A search result ranking apparatus and method are provided.

본 발명은 검색 결과 문서의 대표자에 대한 신뢰도를 추출하기 위해 상기 대표자가 운영하는 사이트의 페이지 랭크, 방문자 수, 및 하위 문서의 품질값 등의 다양한 팩터를 고려함으로써, 대표자에 대한 신뢰도를 보다 정확하게 추출하는 검색 결과 순위화 장치 및 방법을 제공한다.The present invention more accurately extracts the reliability of the representative by considering various factors such as the page rank of the site operated by the representative, the number of visitors, and the quality value of the sub document to extract the reliability of the representative of the search result document. Provided are a search result ranking apparatus and method.

본 발명은 검색 쿼리에 대표자명이 포함된 경우, 대표자명과 연관된 문서에 가중치를 두어 검색 결과 문서를 순위화함으로써, 사용자의 의도에 보다 부합하는 검색 결과를 우선 순위로 제공할 수 있는 검색 결과 순위화 장치 및 방법을 제공한다.According to the present invention, when a search query includes a representative name, the search result ranking apparatus may provide a search result that is more in line with the user's intention by prioritizing the search result documents by weighting the documents associated with the representative name. And methods.

본 발명의 일실시예에 따른 검색 결과 순위화 장치는, 검색 쿼리에 대한 검색 결과 문서를 추출하는 검색부, 상기 검색 결과 문서에 대한 대표자를 추출하는 대표자 추출부, 상기 대표자에 대한 신뢰도를 산출하는 신뢰도 산출부 및 상기 신뢰도를 고려하여 상기 검색 결과 문서를 순위화하는 순위화부를 포함할 수 있다.The search result ranking apparatus according to an embodiment of the present invention, a search unit for extracting a search result document for a search query, a representative extractor for extracting a representative for the search result document, calculating the reliability of the representative It may include a reliability calculator and a ranking unit for ranking the search result document in consideration of the reliability.

본 발명의 일측면에 따르면, 상기 대표자 추출부는, 상기 검색 결과 문서가 블로그 포스트인 경우, 블로그 소유자를 대표자로 추출하고, 상기 검색 결과 문서가 카페의 게시글인 경우, 상기 카페를 대표자로 추출하고, 상기 검색 결과 문서가 웹 페이지인 경우, 웹 사이트를 대표자로 추출하고, 상기 검색 결과 문서가 뉴스인 경우, 상기 뉴스를 제공하는 언론사를 대표자로 추출할 수 있다.According to an aspect of the present invention, the representative extracting unit, if the search result document is a blog post, extracts the blog owner as a representative, if the search result document is a post of the cafe, extract the cafe as a representative, When the search result document is a web page, a web site may be extracted as a representative, and when the search result document is news, a press that provides the news may be extracted as a representative.

본 발명의 일측면에 따르면, 상기 신뢰도 산출부는, 상기 대표자가 운영하는 사이트의 페이지 랭크, 방문자 수, 및 하위 문서의 품질값 중 적어도 하나를 이용하여 신뢰도를 산출할 수 있다.According to an aspect of the present invention, the reliability calculator may calculate the reliability by using at least one of a page rank of a site operated by the representative, the number of visitors, and a quality value of a lower document.

본 발명의 일측면에 따르면, 상기 신뢰도 산출부는, 각각의 검색 쿼리에 대응하여 상기 대표자의 신뢰도를 산출할 수 있다.According to an aspect of the present invention, the reliability calculator may calculate the reliability of the representative in response to each search query.

본 발명의 일측면에 따르면, 상기 순위화부는, 상기 검색 결과 문서의 상기 검색 쿼리와의 유사도, 상기 검색 결과 문서의 페이지랭크, 및 상기 신뢰도 중 적어도 하나를 이용하여 상기 검색 결과 문서를 순위화할 수 있다.According to an aspect of the present disclosure, the ranking unit may rank the search result document using at least one of a similarity with the search query of the search result document, a page rank of the search result document, and the reliability. have.

본 발명의 일측면에 따르면, 상기 검색 쿼리는 대표자명을 포함하고, 상기 순위화부는, 상기 대표자명과 연관된 대표자 사이트의 하위 문서에 가중치를 부여하여 순위화할 수 있다.According to an aspect of the present invention, the search query includes a representative name, and the ranking unit may rank by weighting a lower document of a representative site associated with the representative name.

본 발명의 일실시예에 따른 검색 결과 순위화 방법은, 검색 쿼리에 대한 검색 결과 문서를 추출하는 단계, 상기 검색 결과 문서에 대한 대표자를 추출하는 단계, 상기 대표자에 대한 신뢰도를 산출하는 단계 및 상기 신뢰도를 고려하여 상기 검색 결과 문서를 순위화하는 단계를 포함할 수 있다Search result ranking method according to an embodiment of the present invention, extracting a search result document for a search query, extracting a representative for the search result document, calculating the reliability of the representative and the Ranking the search result documents in consideration of reliability;

본 발명의 일측면에 따르면, 상기 대표자를 추출하는 단계는, 상기 검색 결 과 문서의 유알엘(URL) 패턴을 분석하고, 상기 유알엘 패턴을 이용하여 대표자를 추출할 수 있다.According to an aspect of the present invention, in the extracting of the representative, the URL pattern of the search result document may be analyzed and the representative may be extracted by using the URL pattern.

본 발명의 일측면에 따르면, 상기 대표자를 추출하는 단계는, 기선정된 대표자 풀(pool)로부터 상기 검색 결과 문서에 대응하는 대표자를 추출할 수 있다.According to an aspect of the present disclosure, the extracting of the representative may include extracting a representative corresponding to the search result document from a predetermined representative pool.

본 발명의 일실시예에 따르면, 검색 결과 문서에 대한 대표자를 추출하고, 상기 대표자의 신뢰도를 고려하여 상기 검색 결과 문서를 순위화함으로써, 사용자의 검색 의도에 부합하고, 신뢰성이 높은 검색 결과 문서를 우선 순위에 제공할 수 있는 검색 결과 순위화 장치 및 방법이 제공된다.According to an embodiment of the present invention, by extracting the representative of the search result document and ranking the search result document in consideration of the reliability of the representative, a search result document that meets the user's search intention, and has a high reliability Provided are a search result ranking apparatus and method that can provide priority.

본 발명의 일실시예에 따르면, 검색 결과 문서의 대표자에 대한 신뢰도를 추출하기 위해 상기 대표자가 운영하는 사이트의 페이지 랭크, 방문자 수, 및 하위 문서의 품질값 등의 다양한 팩터를 고려함으로써, 대표자에 대한 신뢰도를 보다 정확하게 추출하는 검색 결과 순위화 장치 및 방법이 제공된다.According to an embodiment of the present invention, in order to extract the reliability of the representative of the search result document by considering various factors such as the page rank of the site operated by the representative, the number of visitors, and the quality value of the sub document, Provided are a search result ranking apparatus and method for more accurately extracting the reliability.

본 발명의 일실시예에 따르면, 검색 쿼리에 대표자명이 포함된 경우, 대표자명과 연관된 문서에 가중치를 두어 검색 결과 문서를 순위화함으로써, 사용자의 의도에 보다 부합하는 검색 결과를 우선 순위로 제공할 수 있는 검색 결과 순위화 장치 및 방법이 제공된다.According to an embodiment of the present invention, when the search query includes the representative name, the search result documents are ranked by weighting the documents associated with the representative name, thereby providing search results that are more in line with the user's intentions. A search result ranking apparatus and method are provided.

이하, 첨부된 도면들에 기재된 내용들을 참조하여 본 발명의 실시예들을 상세하게 설명한다. 다만, 본 발명이 실시예들에 의해 제한되거나 한정되는 것은 아 니다. 각 도면에 제시된 동일한 참조부호는 동일한 부재를 나타낸다. 검색 결과 순위화 방법은 검색 결과 순위화 장치를 구성하는 구성 요소에 의해 수행될 수 있다.Hereinafter, with reference to the contents described in the accompanying drawings will be described in detail the embodiments of the present invention. However, the present invention is not limited or limited by the embodiments. Like reference numerals in the drawings denote like elements. The search result ranking method may be performed by components constituting the search result ranking apparatus.

도 1은 본 발명의 일실시예에 있어서, 검색 결과 순위화 장치를 도시한 블록도이다.1 is a block diagram showing a search result ranking apparatus according to an embodiment of the present invention.

도 1을 참고하면, 검색 결과 순위화 장치(100)는 검색부(110), 대표자 추출부(120), 신뢰도 산출부(130), 및 순위화부(140)를 포함할 수 있다.Referring to FIG. 1, the search result ranking apparatus 100 may include a search unit 110, a representative extractor 120, a reliability calculator 130, and a ranking unit 140.

검색부(110)는 검색 쿼리에 대한 검색 결과 문서를 추출할 수 있다. 즉, 사용자로부터 입력받은 검색 쿼리에 대응하여 하나 이상의 검색 결과 문서를 추출할 수 있다. 여기서, 상기 검색 쿼리는 대표자명을 포함할 수 있다.The search unit 110 may extract a search result document for the search query. That is, one or more search result documents may be extracted in response to a search query received from a user. Here, the search query may include a representative name.

대표자 추출부(120)는 상기 검색 결과 문서에 대한 대표자를 추출할 수 있다. 여기서, 상기 대표자는 상기 검색 결과 문서의 대표 사이트, 상기 검색 결과 문서의 정보 출처 중 적어도 하나일 수 있다. 한편, 대표자 추출은 기선정된 계산방식에 의해 자동적으로 추출되도록 할 수 있다. 이때, 모든 검색 결과 문서에 대해 대표자를 선정하지 않고, 일정한 조건을 만족하는 검색 결과 문서에 대해서만 대표자를 추출하도록 할 수도 있다. 예를 들어, 사이트의 페이지 랭크, 블로그 랭크, 방문자수, 하위 문서의 품질값 등을 고려하여 대표자를 추출할 수 있는 기준을 설정하고, 상기 검색 결과 문서가 포함된 사이트가 상기 대표자를 추출할 수 있는 기준 이상의 값을 갖는 경우에만 상기 검색 결과 문서에 대한 대표자를 추출하도록 할 수 있다. 일실시예로, 블로그 랭킹 300위 내의 블로그에 대해서만 대표자를 추 출하고자 할 때, 검색 결과 문서가 게재된 블로그가 500위의 블로그 랭킹을 갖는다면, 상기 검색 결과 문서에 대해서는 대표자를 추출하지 않도록 할 수 있다.The representative extractor 120 may extract a representative of the search result document. The representative may be at least one of a representative site of the search result document and an information source of the search result document. Meanwhile, the representative extraction may be automatically extracted by a predetermined calculation method. In this case, the representative may be extracted only for the search result document that satisfies a predetermined condition without selecting the representative for all the search result documents. For example, a criterion for extracting a representative may be set in consideration of a page rank of a site, a blog rank, the number of visitors, a quality value of a sub document, and the site including the search result document may extract the representative. The representative of the search result document may be extracted only when the value has a value higher than a criterion. As an example, when a representative of a blog in which a search result document is posted has a blog ranking of 500, when a representative of only a blog within 300 rankings is to be extracted, the representative of the search result document may not be extracted. Can be.

대표자 추출의 일실시예를 도 2를 참고하여 이하에서 더욱 상세하게 설명한다.One embodiment of representative extraction is described in more detail below with reference to FIG. 2.

도 2는 본 발명의 일실시예에 있어서, 검색 결과 문서의 대표자를 추출하는 과정을 도시한 도면이다.2 is a diagram illustrating a process of extracting a representative of a search result document according to one embodiment of the present invention.

도 2를 참고하면, 검색 결과 문서(210)의 종류에 따라 대표자가 다양하게 선택될 수 있다. 예를 들어, 검색 결과 문서(210)가 블로그 포스트인 경우, 블로그 소유자(211)를 대표자로 추출하고, 검색 결과 문서(210)가 카페의 게시글인 경우, 상기 카페(212)를 대표자로 추출하고, 검색 결과 문서(210)가 웹 페이지인 경우, 웹 사이트(213)를 대표자로 추출하고, 검색 결과 문서(210)가 뉴스인 경우, 상기 뉴스를 제공하는 언론사(214)를 대표자로 추출할 수 있다. 즉, 상기 대표자는 상기 검색 결과 문서의 출처로 인식될 수 있는 대표 사이트, 사람, 회사 등을 의미할 수 있다. Referring to FIG. 2, the representative may be variously selected according to the type of the search result document 210. For example, when the search result document 210 is a blog post, the owner of the blog 211 is extracted as a representative, and when the search result document 210 is a post of a cafe, the cafe 212 is extracted as a representative. When the search result document 210 is a web page, the web site 213 may be extracted as a representative, and when the search result document 210 is news, a media company 214 providing the news may be extracted as a representative. have. That is, the representative may refer to a representative site, a person, a company, etc. that can be recognized as a source of the search result document.

다시 도 1을 참고하면, 상기 대표자는, 상기 검색 결과 문서의 유알엘(URL) 패턴을 분석하고, 상기 유알엘 패턴을 이용하여 추출될 수 있다. 예를 들어, '스포츠 조선'의 하위 문서는 'http://sports.chosun.com'을 포함하므로, 'http://sports.chosun.com'을 대표자 추출을 위한 URL로 결정할 수 있다. 따라서, URL의 앞부분이 'http://sports.chosun.com'로 시작하는 문서에 대해서는 모두 '스포츠 조선'을 대표자로 추출할 수 있다. 즉, URL 'http://sports.chosun.com' 로 시작하는 문서에 대해서는 '스포츠 조선'에 대한 신뢰도를 기초로 순위화할 수 있다.Referring back to FIG. 1, the representative may analyze a URL pattern of the search result document and extract the URL using the URL pattern. For example, since the sub document of 'Sport Shipbuilding' includes 'http://sports.chosun.com', 'http://sports.chosun.com' may be determined as a URL for extracting representatives. Therefore, all the documents whose first part of the URL starts with 'http://sports.chosun.com' can be extracted as 'sports shipbuilding' as a representative. In other words, documents starting with the URL 'http://sports.chosun.com' can be ranked based on the reliability of 'sports shipbuilding'.

신뢰도 산출부(130)는 상기 대표자에 대한 신뢰도를 산출할 수 있다. 즉, 상기 추출된 대표자에 대한 신뢰도를 기선정된 방법으로 산출하여 상기 검색 결과 문서에 대한 신뢰도를 추정할 수 있다. 신뢰도 산출의 일예로, 상기 대표자가 운영하는 사이트의 페이지 랭크, 방문자 수, 및 하위 문서의 품질값 중 적어도 하나를 이용하여 신뢰도를 산출할 수 있다. 따라서, 상기 대표자가 운영하는 사이트의 페이지 랭크가 높을수록, 방문자 수가 많을수록, 하위 문서의 품질값이 높을수록 상기 대표자의 신뢰도가 높아질 수 있다. The reliability calculator 130 may calculate a reliability of the representative. That is, the reliability of the search result document may be estimated by calculating the reliability of the extracted representative by a predetermined method. As an example of calculating the reliability, the reliability may be calculated using at least one of a page rank of a site operated by the representative, the number of visitors, and a quality value of a lower document. Therefore, the higher the page rank of the site operated by the representative, the more the number of visitors, and the higher the quality value of the lower document, the higher the reliability of the representative.

또한, 신뢰도 산출부(130)는 기선정된 대표자 풀에 포함된 대표자에 대하여만 신뢰도를 산출할 수 있다. 예를 들어, 모든 검색 결과 문서의 대표자에 대해 신뢰도를 산출하는 것이 아니라, 대표자 풀에 포함되는 대표자에 대해서만 신뢰도를 산출할 수 있다. 즉, 대표자 풀에 포함되는 대표자에 대해서만 신뢰도를 산출하도록 함으로써, 신뢰도 산출에 과도한 부하가 걸리지 않도록 할 수 있다.In addition, the reliability calculator 130 may calculate the reliability of only representatives included in the pre-selected representative pool. For example, the reliability may be calculated only for the representatives included in the representative pool, not for the representatives of all the search result documents. That is, by calculating the reliability only for the representatives included in the representative pool, it is possible to prevent excessive load from calculating the reliability.

순위화부(140)는 상기 신뢰도를 고려하여 상기 검색 결과 문서를 순위화할 수 있다. 예를 들어, 상기 검색 결과 문서의 대표자에 대한 신뢰도가 높을수록, 높은 순위의 검색 결과로 출력될 수 있다. 이때, 상기 신뢰도뿐만 아니라, 상기 검색 결과 문서의 상기 검색 쿼리와의 유사도, 상기 검색 결과 문서의 페이지랭크 등을 함께 고려하여 상기 검색 결과 문서를 순위화할 수 있다.The ranking unit 140 may rank the search result document in consideration of the reliability. For example, the higher the reliability of the representative of the search result document, the higher the search result may be output. In this case, the search result document may be ranked by considering not only the reliability but also the similarity with the search query of the search result document and the page rank of the search result document.

한편, 검색 쿼리가 대표자명을 포함하는 경우, 상기 대표자명에 대응하는 대표자를 추출하고, 상기 대표자와 연관된 검색 결과 문서는 가중치를 부여하여 순위화할 수 있다.Meanwhile, when the search query includes a representative name, the representative corresponding to the representative name may be extracted, and the search result document associated with the representative may be weighted and ranked.

예를 들어, 사용자가 'KTX 부산'을 검색어로 입력하는 경우에 KTX가 대표자명으로 분류되어 상기 대표자명과 관련되는 사이트인 'http://www.korail.com'(이하 '코레일'이라 함)이 대표자가 될 수 있다. 따라서, 상기 대표자명과 관련되는 사이트의 하위 페이지 중에 '부산'이라는 키워드를 갖는 문서가 검색되는 경우, 상기 '부산'이라는 키워드를 갖는 문서는 가중치가 부여되어 검색 결과의 상단에 위치하도록 할 수 있다.For example, when a user enters 'KTX Busan' as a search word, KTX is classified as a representative name and 'http://www.korail.com' (hereinafter referred to as 'korail'), a site related to the representative name. ) Can be representative. Therefore, when a document having the keyword 'Busan' is searched among the lower pages of the site related to the representative name, the document having the keyword 'Busan' may be weighted to be positioned at the top of the search result.

상기와 같이, 검색 결과 문서에 대한 대표자를 추출하고, 상기 대표자의 신뢰도를 고려하여 상기 검색 결과 문서를 순위화함으로써, 사용자의 검색 의도에 부합하고, 신뢰성이 높은 검색 결과 문서를 우선 순위에 제공할 수 있다.As described above, by extracting the representative of the search result document, and ranking the search result document in consideration of the reliability of the representative, it is possible to provide a search result document in accordance with the user's search intent, high-reliability in priority Can be.

도 3은 본 발명의 일실시예에 있어서, 신뢰도를 고려하지 않은 검색 결과 문서 리스트의 출력을 설명하기 위한 도면이다.3 is a diagram for describing an output of a search result document list without considering reliability in an embodiment of the present invention.

도 3을 참고하면, 사용자가 검색 쿼리로 '여행정보'를 입력한 경우, 복수의 검색 결과 문서에 대한 리스트를 웹 브라우저 창(310)을 통해 상기 사용자에게 제공할 수 있다. 이때, 각 검색 결과 문서는 상기 검색 결과 문서에 대한 신뢰도는 고려하지 않고, 상기 검색 쿼리와의 유사도, 상기 검색 결과 문서의 페이지랭크 중 적어도 하나를 이용하여 순위화되어 제공된 것일 수 있다. 도 3의 경우, 사용자의 검색 쿼리 '여행정보'에 대응하는 검색 결과 문서로 '한국관광공사'(311), 'Tour123'(312), '지오트래블'(313), '네이버 여행'(314) 등이 순서대로 제공될 수 있다. 이 경우, 검색 쿼리와 관련되는 내용이 포함되어 있으나, 사용자가 원하는 정보와는 관계가 적은 검색 결과 문서가 상위 순위에 노출되어 상기 사용자에게 제공될 수 있다.Referring to FIG. 3, when a user inputs 'travel information' as a search query, a list of a plurality of search result documents may be provided to the user through a web browser window 310. In this case, each search result document may be provided by ranking using at least one of similarity with the search query and page rank of the search result document without considering reliability of the search result document. 3, 'Korea Tourism Organization' 311, 'Tour123' 312, 'Geotravel' 313, and 'Naver Travel' as the search result document corresponding to the user's search query 'Travel information' (314). ) May be provided in order. In this case, contents related to the search query may be included, but a search result document having a small relation with information desired by the user may be exposed to a higher rank and provided to the user.

도 4는 본 발명의 일실시예에 있어서, 신뢰도를 고려한 검색 결과 문서 리스트의 출력을 설명하기 위한 도면이다.4 is a diagram for describing an output of a search result document list in consideration of reliability according to one embodiment of the present invention.

도 4를 참고하면, 상기 도 3과 마찬가지로, 사용자가 검색 쿼리로 '여행정보'를 입력한 경우, 복수의 검색 결과 문서에 대한 리스트를 웹 브라우저 창(410)을 통해 상기 사용자에게 제공할 수 있다. 여기서, 상기 복수의 검색 결과 문서는 각 검색 결과 문서의 대표자에 대한 신뢰도를 고려하여 순위화되어 제공될 수 있다. 도 4의 경우, 검색 결과 문서로 '한국관광공사'(411), '네이버 여행'(412), '지오트래블'(413), 'Tour123'(414) 등이 추출될 수 있다. Referring to FIG. 4, as in FIG. 3, when a user inputs 'travel information' as a search query, a list of a plurality of search result documents may be provided to the user through a web browser window 410. . Here, the plurality of search result documents may be ranked and provided in consideration of reliability of the representative of each search result document. In the case of Figure 4, as a search result document 'Korea Tourism Organization' (411), 'Naver Travel' (412), 'Geo Travel' (413), 'Tour123' (414) may be extracted.

이때, 한국관광공사(411)에 대한 대표자는 한국관광공사 자체 또는 한국관광공사의 대표 사이트가 될 수 있다. 따라서, 한국관광공사 자체 또는 한국관광공사의 대표 사이트의 신뢰도를 추출할 수 있다. 여기서, 신뢰도는 수치화되어 저장될 수 있으며, 한국관광공사(411)의 경우, 일예로 신뢰도 '90'을 가질 수 있다. At this time, the representative of the Korea Tourism Organization 411 may be a representative site of the Korea Tourism Organization itself or Korea Tourism Organization. Therefore, it is possible to extract the reliability of the Korea Tourism Organization itself or the representative site of the Korea Tourism Organization. Here, the reliability may be stored numerically, and in the case of the Korea Tourism Organization 411, for example, it may have a reliability '90'.

또한, Tour123(412)의 경우, Tour123(412)의 대표 사이트 또는 사이트 운영자가 대표자로 추출될 수 있고, Tour123(412)의 대표 사이트 또는 사이트 운영자에 대한 신뢰도가 추출될 수 있다. 이때, Tour123(412)의 경우, 일예로, 신뢰도 '30'을 가질 수 있다. In addition, in the case of Tour123 412, the representative site or site operator of Tour123 412 may be extracted as a representative, and the reliability of the representative site or site operator of Tour123 412 may be extracted. At this time, in the case of Tour123 412, for example, it may have a reliability '30'.

또한, 지오트래블(413)의 경우, 지오트래블(413)의 대표 사이트 또는 사이 트 운영자가 대표자로 추출될 수 있고, 지오트래블(413)의 대표 사이트 또는 사이트 운영자에 대한 신뢰도가 추출될 수 있다. 이때, 지오트래블(413)의 경우, 일예로, 신뢰도 '50'을 가질 수 있다. In addition, in the case of the geotravel 413, the representative site or site operator of the geotravel 413 may be extracted as a representative, the reliability of the representative site or site operator of the geotravel 413 may be extracted. At this time, in the case of the geotravel 413, for example, it may have a reliability '50'.

또한, 네이버 여행(414)의 경우, 네이버의 대표 사이트 등이 대표자로 추출될 수 있고, 네이버의 대표 사이트에 대한 신뢰도가 추출될 수 있다. 이때, 네이버의 경우, 신뢰도 '80'을 가질 수 있다.In addition, in the case of Naver travel 414, the representative site of Naver may be extracted as a representative, and the reliability of the representative site of Naver may be extracted. At this time, in the case of Naver, it may have a reliability of '80'.

따라서, 각 검색 결과 문서의 신뢰도들을 고려하여 검색 결과 문서를 순위화 하는 경우, '한국관광공사'(411), '네이버 여행'(412), '지오트래블'(413), 'Tour123'(414) 등의 순서로 검색 결과가 제공될 수 있다. 즉, 도 3의 경우와 같이, 신뢰도가 낮은 'Tour123'(312) 등이 상위 랭크에 제공되지 않고, '네이버 여행'(412)과 같은 신뢰도가 높은 대표자의 하위 문서가 높은 순위로 제공될 수 있다.Therefore, when ranking the search result documents in consideration of the reliability of each search result document, 'Korea Tourism Organization' (411), 'Naver Travel' (412), 'Geo Travel' (413), 'Tour123' (414) The search results may be provided in the order of That is, as in the case of FIG. 3, 'Tour123' 312 having low reliability may not be provided in a higher rank, and lower documents of a highly reliable representative such as 'Naver Travel' 412 may be provided in a high rank. have.

도 5는 본 발명의 일실시예에 있어서, 대표자명에 가중치를 부여하지 않고 검색 결과 문서 리스트를 출력한 결과를 설명하기 위한 도면이다.FIG. 5 is a diagram for describing a result of outputting a search result document list without weighting a representative name according to one embodiment of the present invention.

도 5를 참고하면, 사용자가 검색 쿼리로 'KTX 부산'을 입력한 경우, 복수의 검색 결과 문서에 대한 리스트를 웹 브라우저 창(510)을 통해 상기 사용자에게 제공할 수 있다. 이때, 상기 복수의 검색 결과 문서는 'KTX'와 '부산'을 모두 포함하는 검색 결과 문서를 추출하여 사용자에게 제공할 수 있다. 이 경우, 대표자명에 가중치를 두지 않고 사용자에게 검색 결과 문서를 제공하는 경우, 지구투어의 제1 하위문서(511), 지구투어의 제2 하위문서(512), oktour의 하위문서(513), 및 유앤아이여행사(514)의 하위문서 등이 순차적으로 제공될 수 있다.Referring to FIG. 5, when a user inputs 'KTX Busan' as a search query, a list of a plurality of search result documents may be provided to the user through a web browser window 510. In this case, the plurality of search result documents may be provided to the user by extracting a search result document including both 'KTX' and 'Busan'. In this case, when providing the search result document to the user without weighting the representative name, the first subdocument 511 of the earth tour, the second subdocument 512 of the earth tour, the subdocument 513 of oktour, And sub-documents of the Y & I travel agency 514 may be provided sequentially.

도 6은 본 발명의 일실시예에 있어서, 대표자명에 가중치를 부여하여 검색 결과 문서를 순위화하는 방법을 설명하기 위한 도면이다.FIG. 6 is a diagram for describing a method of ranking search result documents by assigning weights to representative names according to one embodiment of the present invention.

도 6을 참고하면, 사용자가 검색 쿼리로 'KTX 부산'을 입력한 경우, 복수의 검색 결과 문서에 대한 리스트를 웹 브라우저 창(610)을 통해 상기 사용자에게 제공할 수 있다. 이때, 상기 검색 쿼리 중 'KTX'가 대표자명으로 분류되어, 상기 대표자명에 가중치를 두어 검색 결과 문서를 순위화할 수 있다. 여기서, 대표자명은 상기 대표자가 운영하는 사이트명 및 상기 대표자가 운영하는 사이트와 연관된 키워드 중 적어도 하나를 포함하는 것일 수 있다. 여기서, 대표자명 'KTX'에 대응하는 대표자를 검출하면, 대표자명 'KTX'와 연관되는 사이트 중 대표 사이트인 '코레일'이 대표자로 검출할 수 있다. 따라서, '코레일'의 하위 페이지 중 '부산'이라는 키워드를 갖는 문서가 검색되는 경우, 상기 '부산'이라는 키워드를 갖는 문서에 가중치가 부여되어 검색 결과의 상단에 노출될 수 있다. 도 6의 경우, 상기 대표자 '코레일'의 하위 페이지 중 '부산'이라는 키워드를 갖는 '코레일'의 제1 하위문서(611) 및 '코레일'의 제2 하위문서(612)가 제1 순위 및 제2 순위로 노출되고, 대표자가 '코레일'이 아닌 지구투어의 제1 하위문서(613) 및 지구투어의 제2 하위문서(613)는 제3 순위 및 제4 순위로 노출될 수 있다.Referring to FIG. 6, when a user inputs 'KTX Busan' as a search query, a list of a plurality of search result documents may be provided to the user through a web browser window 610. In this case, 'KTX' of the search query may be classified as a representative name, and the search result document may be ranked by weighting the representative name. Here, the representative name may include at least one of a site name operated by the representative and keywords associated with a site operated by the representative. Here, when the representative corresponding to the representative name 'KTX' is detected, the representative site 'Korrail' among the sites associated with the representative name 'KTX' may be detected as the representative. Therefore, when a document having a keyword of 'Busan' is searched among the lower pages of 'Korail', a weight is assigned to the document having the keyword of 'Busan' and may be exposed at the top of the search result. In FIG. 6, the first sub-document 611 of 'Korrail' and the second sub-document 612 of 'Korail' having the keyword 'Busan' among the sub-pages of the representative 'Korrail' are the first. The first sub-document 613 of the Earth Tour and the second sub-document 613 of the Earth Tour, which are exposed by the rank and the second rank and whose representative is not a 'korail', may be exposed by the third and fourth rank. have.

상기와 같이, 검색 쿼리에 대표자명이 포함된 경우, 대표자명에 가중치를 두어 검색 결과 문서를 순위화함으로써, 사용자의 의도에 보다 부합하는 검색 결과를 우선 순위로 제공할 수 있다.As described above, when the representative name is included in the search query, the search result documents are ranked by weighting the representative names, so that the search results more closely match the intention of the user may be provided as priorities.

도 7은 본 발명의 일실시예에 있어서, 검색 결과 순위화 방법을 도시한 흐 름도이다.7 is a flowchart illustrating a search result ranking method according to an embodiment of the present invention.

도 7을 참고하면, 단계(710)에서는 검색 쿼리에 대한 검색 결과 문서를 추출할 수 있다. 여기서, 검색 쿼리에는 대표자명을 포함할 수 있다. 여기서, 대표자명은 상기 대표자가 운영하는 사이트명 및 상기 대표자가 운영하는 사이트와 연관된 키워드 중 적어도 하나를 포함할 수 있다. 이 경우, 대표자명과 연관된 대표자를 추출하고 상기 대표자의 하위 문서가 상기 검색 결과 문서에 포함되는 경우에는, 상기 대표자의 하위 문서는 검색 결과의 상위 랭크에 노출되어 사용자에게 제공될 수 있다.Referring to FIG. 7, in operation 710, a search result document for a search query may be extracted. Here, the search query may include the representative name. Here, the representative name may include at least one of a site name operated by the representative and keywords associated with a site operated by the representative. In this case, when the representative associated with the representative name is extracted and the sub document of the representative is included in the search result document, the sub document of the representative may be exposed to an upper rank of the search result and provided to the user.

단계(720)에서는 상기 검색 결과 문서에 대한 대표자를 추출할 수 있다. 여기서, 상기 대표자는 기선정된 대표자 풀로부터 추출될 수 있다. 대표자 추출의 일예로, 상기 검색 결과 문서가 블로그 포스트인 경우, 블로그 소유자를 대표자로 추출하고, 상기 검색 결과 문서가 카페의 게시글인 경우, 상기 카페를 대표자로 추출하고, 상기 검색 결과 문서가 웹 페이지인 경우, 웹 사이트를 대표자로 추출하고, 상기 검색 결과 문서가 뉴스인 경우, 상기 뉴스를 제공하는 언론사를 대표자로 추출할 수 있다. 또한, 단계(720)는 상기 검색 결과 문서의 유알엘(URL) 패턴을 분석하여 상기 대표자를 추출하기 위한 최소 유알엘을 결정하는 단계, 상기 검색 결과 문서 중 상기 최소 유알엘을 포함하는 문서를 분류하는 단계 및 상기 분류된 문서에 대한 대표자를 추출하는 단계를 포함할 수 있다. 예를 들어, 검색 결과 문서의 URL패턴을 분석하여, 'http://blog.naver.com/idxxxx'를 대표자 분류를 위한 최소 유알엘로 결정할 수 있다. 이후, 상기 검색 결과 문서 중 URL의 앞부분에 'http://blog.naver.com/idxxxx'를 포함하는 문서를 분류하고, 상기 분류된 문서에 대해서는 상기 URL을 주소로 사용하는 블로그의 소유자를 대표자로 추출할 수 있다. 이후, 'http://blog.naver.com/idxxxx'를 포함하는 문서는 상기 블로그 소유자에 대한 신뢰도가 고려되어 순위화될 수 있다.In operation 720, the representative of the search result document may be extracted. Here, the representative may be extracted from a predetermined representative pool. As an example of extracting the representative, if the search result document is a blog post, the owner of the blog is extracted as the representative, if the search result document is a post of the cafe, the cafe is extracted as the representative, and the search result document is a web page In this case, the web site may be extracted as a representative, and when the search result document is news, the press that provides the news may be extracted as a representative. In operation 720, the method may include determining a minimum UEL for extracting the representative by analyzing a URL pattern of the search result document, classifying a document including the minimum UEL among the search result documents, and The method may include extracting representatives of the classified documents. For example, by analyzing a URL pattern of a search result document, 'http://blog.naver.com/idxxxx' may be determined as the minimum UEL for representative classification. Thereafter, a document including 'http://blog.naver.com/idxxxx' is classified at the beginning of the URL among the search result documents, and the owner of a blog using the URL as an address for the classified documents is represented. Can be extracted with Thereafter, documents including 'http://blog.naver.com/idxxxx' may be ranked in consideration of the trust of the blog owner.

단계(730)에서는 상기 대표자에 대한 신뢰도를 산출할 수 있다. 여기서, 신뢰도는, 일예로, 상기 대표자가 운영하는 사이트의 페이지 랭크, 방문자 수, 및 하위 문서의 품질값 중 적어도 하나를 이용하여 산출될 수 있다. 따라서, 대표자가 운영하는 사이트의 페이지랭크가 높을수록, 방문자 수가 많을 수록, 하위 문서의 품질값이 높을수록 상기 대표자의 신뢰도가 높아지고, 상기 대표자의 하위 문서들은 검색 결과 출력시 높은 순위로 제공될 수 있다.In operation 730, the reliability of the representative may be calculated. Here, the reliability may be calculated using at least one of, for example, the page rank of the site operated by the representative, the number of visitors, and the quality value of the lower document. Therefore, the higher the page rank of the site operated by the representative, the more the number of visitors, the higher the quality value of the lower document, the higher the reliability of the representative, and the lower documents of the representative may be provided with a higher ranking when the search results are output. have.

단계(740)에서는 상기 신뢰도를 고려하여 상기 검색 결과 문서를 순위화할 수 있다. 즉, 신뢰도가 높은 대표자를 갖는 검색 결과 문서는 높은 순위로 표시될 수 있다. 또한, 상기 신뢰도를 고려하여 상기 검색 결과 문서를 순위화하는 경우, 상기 신뢰도뿐만 아니라, 검색 쿼리와의 유사도, 상기 검색 결과 문서의 페이지랭크 등을 함께 고려할 수 있다.In operation 740, the search result document may be ranked in consideration of the reliability. That is, a search result document having a representative with high reliability may be displayed with a high rank. In addition, when ranking the search result document in consideration of the reliability, not only the reliability but also the similarity with the search query, the page rank of the search result document, and the like may be considered together.

한편, 도 7에서 설명되지 않은 부분은 도 1 내지 도 6의 설명을 참고할 수 있다.On the other hand, the portions not described in FIG. 7 may refer to the description of FIGS. 1 to 6.

상기와 같이, 검색 결과 문서를 순위화하여 제공하기 위해, 검색 결과 문서에 대한 대표자를 추출하고, 상기 대표자의 신뢰도를 고려하여 상기 검색 결과 문서를 순위화함으로써, 사용자의 검색 의도에 부합하고, 신뢰성이 높은 검색 결과 문서를 우선 순위에 제공할 수 있는 장치 및 방법이 제공될 수 있다. 이때, 신뢰도뿐만 아니라 검색 쿼리와의 유사도, 페이지랭크 등을 종합적으로 고려함으로써 사용자의 검색 의도에 보다 부합하는 문서를 상위랭크로 노출할 수 있다.As described above, in order to rank and provide a search result document, the representative of the search result document is extracted, and the search result document is ranked in consideration of the reliability of the representative, thereby meeting the user's search intention and reliability. An apparatus and method may be provided that can provide this high search result document in priority. In this case, by considering not only the reliability but also the similarity with the search query, the page rank, and the like, a document that more closely matches the user's search intention may be exposed as a higher rank.

또한, 검색 결과 문서의 대표자에 대한 신뢰도를 추출하기 위해 상기 대표자가 운영하는 사이트의 페이지 랭크, 방문자 수, 및 하위 문서의 품질값 등의 다양한 팩터를 고려함으로써, 대표자에 대한 신뢰도를 보다 정확하게 추출할 수 있다.In addition, in order to extract the reliability of the representative of the search result document, the reliability of the representative can be extracted more accurately by considering various factors such as the page rank of the site operated by the representative, the number of visitors, and the quality value of the sub document. Can be.

또한 본 발명의 일실시예에 따른 검색 결과 순위화 방법은 다양한 컴퓨터로 구현되는 동작을 수행하기 위한 프로그램 명령을 포함하는 컴퓨터 판독 가능 매체를 포함한다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.In addition, the search result ranking method according to an embodiment of the present invention includes a computer readable medium including program instructions for performing operations implemented by various computers. The computer readable medium may include program instructions, data files, data structures, etc. alone or in combination. The media may be program instructions that are specially designed and constructed for the present invention or may be available to those skilled in the art of computer software. Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks, and magnetic tape, optical media such as CD-ROMs, DVDs, and magnetic disks, such as floppy disks. Magneto-optical media, and hardware devices specifically configured to store and execute program instructions, such as ROM, RAM, flash memory, and the like. Examples of program instructions include not only machine code generated by a compiler, but also high-level language code that can be executed by a computer using an interpreter or the like.

이상과 같이 본 발명의 일실시예는 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명의 일실시예는 상기 설명된 실시예에 한정되는 것은 아니며, 이는 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.  따라서, 본 발명의 일실시예는 아래에 기재된 특허청구범위에 의해서만 파악되어야 하고, 이의 균등 또는 등가적 변형 모두는 본 발명 사상의 범주에 속한다고 할 것이다.Although one embodiment of the present invention as described above has been described by a limited embodiment and drawings, one embodiment of the present invention is not limited to the above-described embodiment, which is a general knowledge in the field of the present invention Those having a variety of modifications and variations are possible from these descriptions. Accordingly, one embodiment of the invention should be understood only by the claims set forth below, all equivalent or equivalent modifications will be within the scope of the invention idea.

도 1은 본 발명의 일실시예에 있어서, 검색 결과 순위화 장치를 도시한 블록도이다.1 is a block diagram showing a search result ranking apparatus according to an embodiment of the present invention.

도 2는 본 발명의 일실시예에 있어서, 검색 결과 문서의 대표자를 추출하는 과정을 도시한 도면이다.2 is a diagram illustrating a process of extracting a representative of a search result document according to one embodiment of the present invention.

도 3은 본 발명의 일실시예에 있어서, 신뢰도를 고려하지 않은 검색 결과 문서 리스트의 출력을 설명하기 위한 도면이다.3 is a diagram for describing an output of a search result document list without considering reliability in an embodiment of the present invention.

도 4는 본 발명의 일실시예에 있어서, 신뢰도를 고려한 검색 결과 문서 리스트의 출력을 설명하기 위한 도면이다.4 is a diagram for describing an output of a search result document list in consideration of reliability according to one embodiment of the present invention.

도 5는 본 발명의 일실시예에 있어서, 대표자명에 가중치를 부여하지 않고 검색 결과 문서 리스트를 출력한 결과를 설명하기 위한 도면이다.FIG. 5 is a diagram for describing a result of outputting a search result document list without weighting a representative name according to one embodiment of the present invention.

도 6은 본 발명의 일실시예에 있어서, 대표자명에 가중치를 부여하여 검색 결과 문서를 순위화하는 방법을 설명하기 위한 도면이다.FIG. 6 is a diagram for describing a method of ranking search result documents by assigning weights to representative names according to one embodiment of the present invention.

도 7은 본 발명의 일실시예에 있어서, 검색 결과 순위화 방법을 도시한 흐름도이다.7 is a flowchart illustrating a search result ranking method according to an embodiment of the present invention.

<도면의 주요 부분에 대한 부호의 설명><Explanation of symbols for the main parts of the drawings>

110 : 검색부110: search unit

120 : 대표자 추출부120: representative extraction unit

130 : 신뢰도 산출부130: reliability calculation unit

140 : 순위화부140: ranking unit

Claims (21)

삭제delete 검색 쿼리에 대한 검색 결과 문서를 추출하는 검색부;A search unit for extracting a search result document for the search query; 상기 검색 결과 문서에 대한 대표자를 추출하는 대표자 추출부;A representative extracting unit for extracting a representative of the search result document; 상기 대표자에 대한 신뢰도를 산출하는 신뢰도 산출부; 및A reliability calculator configured to calculate a reliability of the representative; And 상기 신뢰도를 이용하여 상기 검색 결과 문서를 순위화하는 순위화부A ranking unit for ranking the search result documents using the reliability 를 포함하고,Including, 상기 대표자 추출부는,The representative extracting unit, 상기 검색 결과 문서가 블로그 포스트인 경우, 블로그 소유자를 대표자로 추출하고,If the search result document is a blog post, extract the blog owner as a representative, 상기 검색 결과 문서가 카페의 게시글인 경우, 상기 카페를 대표자로 추출하고,If the search result document is a post of the cafe, extract the cafe as a representative, 상기 검색 결과 문서가 웹 페이지인 경우, 상기 웹 페이지의 대표 웹 사이트를 대표자로 추출하고,If the search result document is a web page, extract a representative web site of the web page as a representative, 상기 검색 결과 문서가 뉴스인 경우, 상기 뉴스를 제공하는 언론사를 대표자로 추출하는 것을 특징으로 하는 검색 결과 순위화 장치.And when the search result document is news, extracting the press providing the news as a representative. 검색 쿼리에 대한 검색 결과 문서를 추출하는 검색부;A search unit for extracting a search result document for the search query; 상기 검색 결과 문서에 대한 대표자를 추출하는 대표자 추출부;A representative extracting unit for extracting a representative of the search result document; 상기 대표자에 대한 신뢰도를 산출하는 신뢰도 산출부; 및A reliability calculator configured to calculate a reliability of the representative; And 상기 신뢰도를 이용하여 상기 검색 결과 문서를 순위화하는 순위화부A ranking unit for ranking the search result documents using the reliability 를 포함하고,Including, 상기 대표자 추출부는,The representative extracting unit, 상기 검색 결과 문서의 유알엘(URL) 패턴을 분석하고, 상기 유알엘 패턴을 이용하여 대표자를 추출하는 것을 특징으로 하는 검색 결과 순위화 장치.Search result ranking apparatus characterized in that for analyzing the URL pattern of the search result document, and extracting the representative by using the URL pattern. 검색 쿼리에 대한 검색 결과 문서를 추출하는 검색부;A search unit for extracting a search result document for the search query; 상기 검색 결과 문서에 대한 대표자를 추출하는 대표자 추출부;A representative extracting unit for extracting a representative of the search result document; 상기 대표자에 대한 신뢰도를 산출하는 신뢰도 산출부; 및A reliability calculator configured to calculate a reliability of the representative; And 상기 신뢰도를 이용하여 상기 검색 결과 문서를 순위화하는 순위화부A ranking unit for ranking the search result documents using the reliability 를 포함하고,Including, 상기 대표자 추출부는,The representative extracting unit, 상기 검색 결과 문서가 포함된 사이트의 페이지 랭크, 블로그 랭크, 방문자수 중 적어도 하나가 기선정된 각각의 임계값 이상인 경우, 상기 검색 결과 문서의 대표자를 추출하는 것을 특징으로 하는 검색 결과 순위화 장치.And a representative of the search result document is extracted when at least one of a page rank, a blog rank, and the number of visitors of a site including the search result document is equal to or greater than a predetermined threshold value. 검색 쿼리에 대한 검색 결과 문서를 추출하는 검색부;A search unit for extracting a search result document for the search query; 상기 검색 결과 문서에 대한 대표자를 추출하는 대표자 추출부;A representative extracting unit for extracting a representative of the search result document; 상기 대표자에 대한 신뢰도를 산출하는 신뢰도 산출부; 및A reliability calculator configured to calculate a reliability of the representative; And 상기 신뢰도를 이용하여 상기 검색 결과 문서를 순위화하는 순위화부A ranking unit for ranking the search result documents using the reliability 를 포함하고,Including, 상기 신뢰도 산출부는,The reliability calculation unit, 기선정된 대표자 풀(pool)에 포함되는 대표자에 대하여 신뢰도를 추출하는 것을 특징으로 하는 검색 결과 순위화 장치.Search result ranking apparatus characterized by extracting the reliability for the representatives included in the pre-selected representative pool (pool). 제2항 내지 제5항 중 어느 한 항에 있어서,The method according to any one of claims 2 to 5, 상기 신뢰도 산출부는,The reliability calculation unit, 상기 대표자가 운영하는 사이트의 페이지 랭크, 방문자 수 중 적어도 하나를 이용하여 신뢰도를 산출하는 것을 특징으로 하는 검색 결과 순위화 장치.Search result ranking apparatus characterized in that to calculate the reliability using at least one of the page rank, the number of visitors of the site operated by the representative. 검색 쿼리에 대한 검색 결과 문서를 추출하는 검색부;A search unit for extracting a search result document for the search query; 상기 검색 결과 문서에 대한 대표자를 추출하는 대표자 추출부;A representative extracting unit for extracting a representative of the search result document; 상기 대표자에 대한 신뢰도를 산출하는 신뢰도 산출부; 및A reliability calculator configured to calculate a reliability of the representative; And 상기 신뢰도를 이용하여 상기 검색 결과 문서를 순위화하는 순위화부A ranking unit for ranking the search result documents using the reliability 를 포함하고,Including, 상기 신뢰도 산출부는,The reliability calculation unit, 각각의 검색 쿼리에 대응하여 상기 대표자의 신뢰도를 산출하는 것을 특징으로 하는 검색 결과 순위화 장치.And a result of calculating the reliability of the representative in response to each search query. 제2항 내지 제5항 또는 제7항 중 어느 한 항에 있어서,The method according to any one of claims 2 to 5 or 7, 상기 순위화부는,The ranking unit, 상기 검색 결과 문서의 상기 검색 쿼리와의 유사도, 상기 검색 결과 문서의 페이지랭크, 및 상기 신뢰도 중 적어도 하나를 이용하여 상기 검색 결과 문서를 순위화하는 것을 특징으로 하는 검색 결과 순위화 장치.And the search result document is ranked using at least one of the similarity of the search result document to the search query, the page rank of the search result document, and the reliability. 검색 쿼리에 대한 검색 결과 문서를 추출하는 검색부;A search unit for extracting a search result document for the search query; 상기 검색 결과 문서에 대한 대표자를 추출하는 대표자 추출부;A representative extracting unit for extracting a representative of the search result document; 상기 대표자에 대한 신뢰도를 산출하는 신뢰도 산출부; 및A reliability calculator configured to calculate a reliability of the representative; And 상기 신뢰도를 이용하여 상기 검색 결과 문서를 순위화하는 순위화부A ranking unit for ranking the search result documents using the reliability 를 포함하고,Including, 상기 검색 쿼리는 대표자명을 포함하고,The search query includes a representative name, 상기 순위화부는,The ranking unit, 상기 대표자명과 연관된 대표자 사이트의 하위 문서에 가중치를 부여하여 순위화하는 것을 특징으로 하는 검색 결과 순위화 장치.And ranking the weighted sub document of the representative site associated with the representative name. 제9항에 있어서,10. The method of claim 9, 상기 대표자명은,The representative name is, 상기 대표자가 운영하는 사이트명 및 상기 대표자가 운영하는 사이트의 하위문서에 포함된 키워드 중 적어도 하나를 포함하는 것을 특징으로 하는 검색 결과 순위화 장치.And at least one of a site name operated by the representative and keywords included in sub-documents of the site operated by the representative. 삭제delete 검색 쿼리에 대한 검색 결과 문서를 추출하는 단계;Extracting a search result document for the search query; 상기 검색 결과 문서에 대한 대표자를 추출하는 단계;Extracting a representative for the search result document; 상기 대표자에 대한 신뢰도를 산출하는 단계; 및Calculating a confidence level for the representative; And 상기 신뢰도를 이용하여 상기 검색 결과 문서를 순위화하는 단계Ranking the search result document using the reliability 를 포함하고,Including, 상기 대표자를 추출하는 단계는,Extracting the representative, 상기 검색 결과 문서가 블로그 포스트인 경우, 블로그 소유자를 대표자로 추출하고,If the search result document is a blog post, extract the blog owner as a representative, 상기 검색 결과 문서가 카페의 게시글인 경우, 상기 카페를 대표자로 추출하고,If the search result document is a post of the cafe, extract the cafe as a representative, 상기 검색 결과 문서가 웹 페이지인 경우, 상기 웹 페이지의 대표 웹 사이트를 대표자로 추출하고,If the search result document is a web page, extract a representative web site of the web page as a representative, 상기 검색 결과 문서가 뉴스인 경우, 상기 뉴스를 제공하는 언론사를 대표자로 추출하는 것을 특징으로 하는 검색 결과 순위화 방법.And when the search result document is news, extracting the press providing the news as a representative. 검색 쿼리에 대한 검색 결과 문서를 추출하는 단계;Extracting a search result document for the search query; 상기 검색 결과 문서에 대한 대표자를 추출하는 단계;Extracting a representative for the search result document; 상기 대표자에 대한 신뢰도를 산출하는 단계; 및Calculating a confidence level for the representative; And 상기 신뢰도를 이용하여 상기 검색 결과 문서를 순위화하는 단계Ranking the search result document using the reliability 를 포함하고,Including, 상기 대표자를 추출하는 단계는,Extracting the representative, 상기 검색 결과 문서의 유알엘(URL) 패턴을 분석하여 상기 대표자를 추출하기 위한 최소 유알엘을 결정하는 단계;Analyzing a URL pattern of the search result document to determine a minimum URL for extracting the representative; 상기 검색 결과 문서 중 상기 최소 유알엘을 포함하는 문서를 분류하는 단계; 및Classifying a document including the minimum UAL among the search result documents; And 상기 분류된 문서에 대한 대표자를 추출하는 단계Extracting representatives of the classified documents 를 포함하는 것을 특징으로 하는 검색 결과 순위화 방법.Search result ranking method comprising the. 검색 쿼리에 대한 검색 결과 문서를 추출하는 단계;Extracting a search result document for the search query; 상기 검색 결과 문서에 대한 대표자를 추출하는 단계;Extracting a representative for the search result document; 상기 대표자에 대한 신뢰도를 산출하는 단계; 및Calculating a confidence level for the representative; And 상기 신뢰도를 이용하여 상기 검색 결과 문서를 순위화하는 단계Ranking the search result document using the reliability 를 포함하고,Including, 상기 대표자를 추출하는 단계는,Extracting the representative, 상기 검색 결과 문서가 포함된 사이트의 페이지 랭크, 블로그 랭크, 방문자수 중 적어도 하나가 기선정된 각각의 임계값 이상인 경우, 상기 검색 결과 문서의 대표자를 추출하는 것을 특징으로 하는 검색 결과 순위화 방법.And a representative of the search result document is extracted when at least one of a page rank, a blog rank, and the number of visitors of a site including the search result document is equal to or greater than a predetermined threshold value. 검색 쿼리에 대한 검색 결과 문서를 추출하는 단계;Extracting a search result document for the search query; 상기 검색 결과 문서에 대한 대표자를 추출하는 단계;Extracting a representative for the search result document; 상기 대표자에 대한 신뢰도를 산출하는 단계; 및Calculating a confidence level for the representative; And 상기 신뢰도를 이용하여 상기 검색 결과 문서를 순위화하는 단계Ranking the search result document using the reliability 를 포함하고,Including, 상기 신뢰도를 산출하는 단계는,The step of calculating the reliability, 기선정된 대표자 풀(pool)에 포함되는 대표자에 대하여 신뢰도를 추출하는 것을 특징으로 하는 검색 결과 순위화 방법.Search results ranking method characterized in that the extraction of the reliability for the representatives included in the pre-selected representative pool (pool). 제12항 내지 제15항 중 어느 한 항에 있어서,The method according to any one of claims 12 to 15, 상기 신뢰도를 산출하는 단계는,The step of calculating the reliability, 상기 대표자가 운영하는 사이트의 페이지 랭크, 방문자 수 중 적어도 하나를 이용하여 신뢰도를 산출하는 것을 특징으로 하는 검색 결과 순위화 방법.Search result ranking method comprising the step of calculating the reliability using at least one of the page rank, the number of visitors of the site operated by the representative. 검색 쿼리에 대한 검색 결과 문서를 추출하는 단계;Extracting a search result document for the search query; 상기 검색 결과 문서에 대한 대표자를 추출하는 단계;Extracting a representative for the search result document; 상기 대표자에 대한 신뢰도를 산출하는 단계; 및Calculating a confidence level for the representative; And 상기 신뢰도를 이용하여 상기 검색 결과 문서를 순위화하는 단계Ranking the search result document using the reliability 를 포함하고,Including, 상기 신뢰도를 산출하는 단계는,The step of calculating the reliability, 상기 검색 쿼리에 대응하는 상기 대표자의 신뢰도를 산출하는 것을 특징으로 하는 검색 결과 순위화 방법.And calculating the reliability of the representative corresponding to the search query. 제12항 내지 제15항 또는 제17항 중 어느 한 항에 있어서,The method according to any one of claims 12 to 15 or 17, 상기 순위화하는 단계는,The ranking step, 상기 검색 결과 문서의 상기 검색 쿼리와의 유사도, 상기 검색 결과 문서의 페이지랭크, 및 상기 신뢰도 중 적어도 하나를 이용하여 상기 검색 결과 문서를 순위화하는 것을 특징으로 하는 검색 결과 순위화 방법.And ranking the search result document using at least one of a similarity of the search result document to the search query, a page rank of the search result document, and the reliability. 검색 쿼리에 대한 검색 결과 문서를 추출하는 단계;Extracting a search result document for the search query; 상기 검색 결과 문서에 대한 대표자를 추출하는 단계;Extracting a representative for the search result document; 상기 대표자에 대한 신뢰도를 산출하는 단계; 및Calculating a confidence level for the representative; And 상기 신뢰도를 이용하여 상기 검색 결과 문서를 순위화하는 단계Ranking the search result document using the reliability 를 포함하고,Including, 상기 검색 결과 문서를 추출하는 단계는,Extracting the search result document, 대표자명을 포함하는 상기 검색 쿼리에 대한 검색 결과 문서를 추출하고,Extract a search results document for the search query that includes a representative name, 상기 순위화하는 단계는,The ranking step, 상기 대표자명과 연관된 대표자 사이트의 하위 문서에 가중치를 부여하여 순위화하는 것을 특징으로 하는 검색 결과 순위화 방법.Search results ranking method comprising weighting the lower documents of the representative site associated with the representative name. 제19항에 있어서,The method of claim 19, 상기 대표자명은,The representative name is, 상기 대표자가 운영하는 사이트명 및 상기 대표자가 운영하는 사이트의 하위문서에 포함된 키워드 중 적어도 하나를 포함하는 것을 특징으로 하는 검색 결과 순위화 방법.Search result ranking method comprising at least one of a site name operated by the representative and keywords included in the sub-documents of the site operated by the representative. 제12항 내지 제15항, 제17항, 제19항, 제20항 중 어느 한 항의 방법을 실행하기 위한 프로그램이 기록되어 있는 것을 특징으로 하는 컴퓨터에서 판독 가능한 기록 매체.A computer-readable recording medium having recorded thereon a program for executing the method of any one of claims 12 to 15, 17, 19, and 20.
KR1020090038119A 2009-04-30 2009-04-30 Apparatus and method for ranking search results using representative reliability KR101050013B1 (en)

Priority Applications (4)

Application Number Priority Date Filing Date Title
KR1020090038119A KR101050013B1 (en) 2009-04-30 2009-04-30 Apparatus and method for ranking search results using representative reliability
JP2010093975A JP5497523B2 (en) 2009-04-30 2010-04-15 Search result ranking apparatus and method using reliability of representative
JP2014042802A JP5724009B2 (en) 2009-04-30 2014-03-05 Search result ranking apparatus and method using reliability of representative
JP2015068780A JP5989170B2 (en) 2009-04-30 2015-03-30 Search result ranking apparatus and method using reliability of representative

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020090038119A KR101050013B1 (en) 2009-04-30 2009-04-30 Apparatus and method for ranking search results using representative reliability

Publications (2)

Publication Number Publication Date
KR20100119157A KR20100119157A (en) 2010-11-09
KR101050013B1 true KR101050013B1 (en) 2011-07-19

Family

ID=43360614

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090038119A KR101050013B1 (en) 2009-04-30 2009-04-30 Apparatus and method for ranking search results using representative reliability

Country Status (2)

Country Link
JP (3) JP5497523B2 (en)
KR (1) KR101050013B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190019589A (en) * 2017-08-18 2019-02-27 주식회사 포스코아이씨티 System and Method for Checking Fact

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013162265A1 (en) * 2012-04-23 2013-10-31 줌인터넷 주식회사 Method and system for providing ranking information by using packet mirroring
WO2013162263A1 (en) * 2012-04-23 2013-10-31 줌인터넷 주식회사 Method and system for determining search target rank by using packet mirroring
US9323810B2 (en) * 2013-08-29 2016-04-26 Fujitsu Limited Curation selection for learning
WO2016178337A1 (en) * 2015-05-01 2016-11-10 ソニー株式会社 Information processing device, information processing method, and computer program
CN105488151A (en) * 2015-11-27 2016-04-13 小米科技有限责任公司 Reference document recommendation method and apparatus
JP6577925B2 (en) * 2016-09-20 2019-09-18 株式会社トヨタマップマスター FACILITY SEARCH DEVICE, FACILITY SEARCH METHOD, COMPUTER PROGRAM, AND RECORDING MEDIUM CONTAINING COMPUTER PROGRAM

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090000236A (en) * 2007-01-16 2009-01-07 넷다이버(주) Method, apparatus for evaluation of internet contents and recoding media that saves program implementing the same
KR20090001754A (en) * 2007-05-17 2009-01-09 엔에이치엔(주) Pay per post method and system based on influence of blog
KR20090013367A (en) * 2007-08-01 2009-02-05 주식회사 다음커뮤니케이션 System and method for recommending a keyword according to each category

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10171819A (en) * 1996-12-06 1998-06-26 Fuji Xerox Co Ltd Information retrieving device
US7523051B2 (en) * 2001-05-31 2009-04-21 Sony Corporation Information processing apparatus, information processing method, and program
JP2004192542A (en) * 2002-12-13 2004-07-08 Nippon Telegr & Teleph Corp <Ntt> Information recommendation device, information recommendation method, program, and recording medium
US7577655B2 (en) * 2003-09-16 2009-08-18 Google Inc. Systems and methods for improving the ranking of news articles
JP2005327028A (en) * 2004-05-13 2005-11-24 Ricoh Co Ltd Talent search system, program, and recording medium
KR100462542B1 (en) * 2004-05-27 2004-12-17 엔에이치엔(주) contents search system for providing confidential contents through network and method thereof
JP2006164086A (en) * 2004-12-10 2006-06-22 Nippon Telegr & Teleph Corp <Ntt> Online knowledge search support system and online knowledge search support method
JP4911599B2 (en) * 2006-12-28 2012-04-04 独立行政法人情報通信研究機構 Reputation information extraction device and reputation information extraction method

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090000236A (en) * 2007-01-16 2009-01-07 넷다이버(주) Method, apparatus for evaluation of internet contents and recoding media that saves program implementing the same
KR20090014414A (en) * 2007-01-16 2009-02-10 넷다이버(주) Method, apparatus for evaluation of internet contents and recoding media that saves program implementing the same
KR20090001754A (en) * 2007-05-17 2009-01-09 엔에이치엔(주) Pay per post method and system based on influence of blog
KR20090013367A (en) * 2007-08-01 2009-02-05 주식회사 다음커뮤니케이션 System and method for recommending a keyword according to each category

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190019589A (en) * 2017-08-18 2019-02-27 주식회사 포스코아이씨티 System and Method for Checking Fact
KR101972660B1 (en) * 2017-08-18 2019-04-25 주식회사 포스코아이씨티 System and Method for Checking Fact

Also Published As

Publication number Publication date
JP5497523B2 (en) 2014-05-21
JP5724009B2 (en) 2015-05-27
JP5989170B2 (en) 2016-09-07
JP2010262638A (en) 2010-11-18
KR20100119157A (en) 2010-11-09
JP2014112433A (en) 2014-06-19
JP2015144011A (en) 2015-08-06

Similar Documents

Publication Publication Date Title
JP5989170B2 (en) Search result ranking apparatus and method using reliability of representative
JP4936401B2 (en) Method and system for filtering subject-related web pages based on navigation path information
US8255386B1 (en) Selection of documents to place in search index
US7996405B2 (en) Technique for managing data in association with tag information
US20130173610A1 (en) Extracting Search-Focused Key N-Grams and/or Phrases for Relevance Rankings in Searches
US20050222989A1 (en) Results based personalization of advertisements in a search engine
US20120076414A1 (en) External Image Based Summarization Techniques
JP5161658B2 (en) Keyword input support device, keyword input support method, and program
US20120036144A1 (en) Information and recommendation device, method, and program
JP5329540B2 (en) User-centric information search method, computer-readable recording medium, and user-centric information search system
US20110208715A1 (en) Automatically mining intents of a group of queries
US20110307432A1 (en) Relevance for name segment searches
US8799257B1 (en) Searching based on audio and/or visual features of documents
JP5552582B2 (en) Content search device
KR101011726B1 (en) Apparatus and method for providing snippet
KR100913733B1 (en) Method for Providing Search Result Using Template
JP6577692B1 (en) Learning system, learning method, and program
KR101178208B1 (en) Apparatus and method for extracting keywords
CN112035723A (en) Resource library determination method and device, storage medium and electronic device
JP4759600B2 (en) Text search device, text search method, text search program and recording medium thereof
CN110297994A (en) Acquisition method, device, computer equipment and the storage medium of web data
KR100943625B1 (en) Method and System for Generating Integrated Database for Integradedly Managing Local Information and Website Information and Method for Providing Search Result Using Integrated Database
JP2012104051A (en) Document index creating device
Suchomel et al. Source retrieval for plagiarism detection
US20150169526A1 (en) Heuristically determining key ebook terms for presentation of additional information related thereto

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20150701

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20160701

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20170704

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20190701

Year of fee payment: 9