KR100818553B1 - Document ranking granting method and computer readable record medium thereof - Google Patents

Document ranking granting method and computer readable record medium thereof Download PDF

Info

Publication number
KR100818553B1
KR100818553B1 KR20060079176A KR20060079176A KR100818553B1 KR 100818553 B1 KR100818553 B1 KR 100818553B1 KR 20060079176 A KR20060079176 A KR 20060079176A KR 20060079176 A KR20060079176 A KR 20060079176A KR 100818553 B1 KR100818553 B1 KR 100818553B1
Authority
KR
Grant status
Grant
Patent type
Prior art keywords
document
ranking
user
method
weight
Prior art date
Application number
KR20060079176A
Other languages
Korean (ko)
Other versions
KR20080017685A (en )
Inventor
유현애
이길재
이상호
장성민
정경석
정영신
홍석후
Original Assignee
에스케이커뮤니케이션즈 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Grant date

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/30Information retrieval; Database structures therefor ; File system structures therefor
    • G06F17/30861Retrieval from the Internet, e.g. browsers
    • G06F17/30864Retrieval from the Internet, e.g. browsers by querying, e.g. search engines or meta-search engines, crawling techniques, push systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/30Information retrieval; Database structures therefor ; File system structures therefor
    • G06F17/3061Information retrieval; Database structures therefor ; File system structures therefor of unstructured textual data
    • G06F17/30634Querying
    • G06F17/30657Query processing
    • G06F17/30675Query execution

Abstract

본 발명은 본 발명은 문서랭킹 부여방법에 관한 것으로, 사용자가 검색엔진의 검색창을 통해 검색질의를 입력하면, 상기 질의에 해당하는 문서의 가중치에 그 문서의 사용자 액션랭킹를 고려하고, 상기 문서의 작성시간을 적용하여, 상기 질의에 관심있는 다른 사용자들로부터 액션이 많이 수행되고, 그 문서의 사용자가 그 주제에 구루에 해당하면 상위에 랭크되도록 하는 문서랭킹 부여방법에 관한 것이다. The invention The present invention relates to a method document ranking given, when a user enters a search query via a search box of a search engine, consider a user action of the document raengkingreul to the weight of the article corresponding to the query, and in the article by applying the right time, and a lot of actions performed by other users interested in the question, if the user of the document corresponding to the guru on the subject relates to the document ranking given way to ensure that rank on top.
이러한 본 발명은, 특정 질의에 부합하는 문서와 사용자를 노출하고, 사용자의 피드백 정보를 이용하여 기존의 단순한 키워드 기반 검색랭킹 방법에 비해, 월등한 검색 성능을 보이는 효과가 있다. The present invention is effective exposure of document with a user, and by using the user's feedback information showing, superior scanning performance compared to the conventional simple keyword-based search method ranking with a certain quality.
문서, 작성자, 액션, 랭킹, 랭크 Article, author, action, ranking, rank

Description

문서랭킹 부여방법 및 이를 수행할 수 있는 프로그램이 수록된 컴퓨터로 읽을 수 있는 기록 매체{DOCUMENT RANKING GRANTING METHOD AND COMPUTER READABLE RECORD MEDIUM THEREOF} Give evidence in this document ranking method and a program that can do this, the computer-readable media contained {DOCUMENT RANKING GRANTING METHOD AND COMPUTER READABLE RECORD MEDIUM THEREOF}

도1은 본 발명에 적용되는 랭킹계산 방법에 대한 구조도 1 is a structure for the ranking calculation method applied to the present invention

도2는 본 발명에 적용되는 액션의 종류와 사용 유무를 나타내는 표 Figure 2 is a table showing the action of the type of whether they will be used to be applied to the present invention

도3은 문서 생성기간(d c -d w )에 따른 시간 가중치 3 is a time-weighted according to the document generation period (d c -d w)

도4는 본 발명에서 사용되는 검색 시 적용 방법에 대한 도면 4 is a diagrammatic view of a search method of application to be used in the present invention

도5는 본 발명이 적용되는 검색결과 화면 예시 Figure 5 is an example Search Results screen to which the present invention is applied

도6은 본 발명이 적용되는 전문가 결과 화면 예시 6 illustrates expert result screen to which the present invention is applied

본 발명은 문서랭킹 부여방법에 관한 것으로, 사용자가 검색엔진의 검색창을 통해 검색질의를 입력하면, 상기 질의에 해당하는 문서의 가중치에 그 문서의 사용 자 액션랭킹를 고려하고, 상기 문서의 작성시간을 적용하여, 상기 질의에 관심있는 다른 사용자들로부터 액션이 많이 수행되고, 그 문서의 사용자가 그 주제에 구루에 해당하면 상위에 랭크되도록 하므로써, 특정 질의에 부합하는 문서와 사용자를 노출하고, 사용자의 피드백 정보를 이용하여 기존의 단순한 키워드 기반 검색랭킹 방법에 비해, 월등한 검색 성능을 보이는 효과가 있는 문서랭킹 부여방법에 관한 것이다. The present invention relates to a method document ranking given, when a user enters a search query via a search box of a search engine, used in the document to the weight of the article corresponding to the querying user considering action raengkingreul, and the document creation time applied, and a lot of actions performed by other users who are interested in the query, if the user of the document corresponds to the glove on the subject exposed to, documents and users with a certain quality by so ranked high, and user using the feedback information relates to a method that is effective exhibit superior performance document search rankings given relative to conventional simple keyword-based search ranking method.

사용자들이 검색엔진을 이용하여 정보를 찾을 때, 검색엔진의 여러 가지 품질 척도중에 가장 중요한 것은 랭킹이다. When users find information by using a search engine, the most important measure of the quality ranking among the various search engines. 여기서 랭킹이란, 특정 키워드를 기준으로 적합한 문서를 순위화하는 것으로, 적합한 문서를 상위에 위치시켜 사용자에게 정보획득의 노력을 덜어 줄 수 있다. Here is the ranking, that ranking the appropriate documentation based on specific keywords and can bring documents to the appropriate position for the top relieves the user the effort of the information obtained.

현재 국내 포탈의 경우, 검색한 질의를 기준으로 검색결과문서에서의 출현 위치정보를 이용하거나 출현빈도를 이용하고 있다. Using the appearing position of the information in the current case of domestic portal, search based on the search result of a query document, or is using the appearance frequency. 하지만, 이것만으로 방대한 문서에서 원하는 문서를 쉽게 찾을 수 있는 효율적인 검색을 하기는 어렵다. However, it is difficult to make an efficient search can easily find the desired documents from the extensive documentation only this.

국외의 경우, 단어 기반의 출현 정보 이외에, 문서간의 링크된 구조를 이용한 페이지 랭크를 필두로 하여, html상의 여러 메타정보등을 이용한 다양한 가중치 결정 방식을 사용하고 있다. In the case of foreign, in addition to the appearance of the information word-based, and led by PageRank using the link structure between the documents, and using a variety of weight determination method using a number of meta-information, such as on the html. 또한, 메타 검색엔진들은 질의에 따라 검색 시스템을 선택하는 방법등을 사용하기도 한다. In addition, the meta-search engines may use a method for selecting a search system according to the query. 하지만, 그러한 많은 비용에 비하여 성능의 개선은 한계가 있고, 웹페이지를 대상으로 검증되어, 국내 포탈에서 제공하는 다양한 컨텐츠에 일괄적으로 적용할 수 없다. However, improvement in performance compared to many such costs and limitations, are subject to verification by the web page can not be applied collectively to the various contents provided by the national portal.

최근까지 발표된 문헌 및 논문을 보면, 검색랭킹에 유의한 여러 요소들을 대상으로 적절한 가중치를 할당하는 연구들이 수행되었다. In a paper published literature and, until recently, studies have been carried out to assign appropriate weighting of several factors significant in the search rankings as a target. 웹 문서를 기준으로 페이지 랭크가 가장 좋은 영향을 끼쳤으며, 각 도메인마다 강력한 요소들이 다르다는 것이 증명되었다. Kkichyeot had the most positive influence page rank based on a web page, proved to be a powerful factor different for each domain.

그러나 이런 방법들은 현재 국내에서 서비스하는 주요한 문서인 UCC(사용자제작컨텐츠)계열의 문서에 적합하지 않고, 많은 비용을 필요로 하여, 적용하는데 어려움이 있다. However, these methods are difficult to apply without the appropriate documents of the main series documents the UCC (user created content) of the current service in the country, and need a lot of money.

본 발명은 상기와 같은 종래기술의 문제점을 해결하기 위한 것으로, 국내 포탈의 컨텐츠를 랭킹하기 위한 주요 요소는 주제 적합성과 사용자의 액션 정보이다. The present invention for solving the problems of the prior art, key factors for ranking the local content portal is the action information and user subject compliance. 특정 질의에 부합되는 주제를 갖는 문서와 구루들을 서비스 하기 위해서는 자동분류 방법이 필요하다. The automatic classification methods are needed to service documents and Guru with topics that match a specific query. 자동분류는 일정한 주제 목록을 정의하고, 문서를 분석하여, 그 문서를 대표할 수 있는 주제들에게 매칭시키는 방법이다. Automatic classification is defined by a list of certain topics, analysis of documents, a method of matching to the subject that can represent the document. 또한, 사용자의 액션 정보를 이용하여, 사용자가 선호하는 문서를 상위에 위치하도록 이전의 주제 분류 적합성과 연계하여 랭킹 값을 계산하는 방법을 제공하고자 하는 것을 그 목적으로 한다. Further, that in conjunction with the previous classification of the subject compliance to provide a method of calculating the ranking values ​​by using the user information of the action, to position the document that a user prefers a higher for that purpose.

본 발명에서는 사용자의 입력 키워드와 일치하거나 유사한 주제를 갖는 문서와 사용자의 다양한 피드백정보(이후 액션이라 칭함)를 이용하여 그 주제에 잘 부합되거나 사용자들이 선호하는 문서를 상위에 올릴 수 있는 랭킹(이후 액션랭킹이 라 칭함)을 제안한다. In the present invention, by using a match the user's criteria, or a variety of feedback of the document and the user having similar topic information (as later action quot;) well suited for the subject or a user can raise the preferred article of the higher rank (hereinafter the proposed action rankings hereinafter). 또한, 입력한 키워드에 적합한 구루(전문가) 리스트를 노출하여, 검색의 효율성을 극대화 하고자 한다. Further, by exposing the glove (expert) list suitable for the input keyword, and to maximize the efficiency of the search.

본 발명에 의한 문서랭킹 부여방법은, Document ranking given method according to the invention,

사용자에 의해 문서가 작성되는 문서작성단계와; Document creation step that creates a document by a user; 검색자에 의해 질의가 입력되는 질의입력단계와; Query inputting step that the query is entered by the searcher and; 상기 문서작성단계에서 작성된 문서가 상기 질의와 일치할 확률에 상기 문서에 대한 검색일까지의 플러스영향력, 중복도영향력, 클릭영향력의 합을 고려한 문서가중치를 추출하는 문서가중치추출단계와; Document weight extraction step that the documents created in the steps of creating the document, a document is extracted weight to the probability that match the query considering the positive impact, the sum of redundancy influence, click to search the influence of one of the above documents; 상기 사용자가 작성한 문서들 중 상기 질의와 관련된 문서들에 대한 다른 사람들이 행한 문서가중치의 총합과, 상기 사용자가 상기 질의와 관련된 다른 사람들의 플러스가중치의 총합, 중복도가중치의 총합, 클릭가중치의 총합으로부터 사용자랭킹을 추출하는 사용자랭킹추출단계와; The sum of the document weighting others have done for documents related to the quality of the documents that the user created and the sum of the user is the sum of the positive weights of other people associated with the query, the redundancy sum of the weights, click weights from the user ranking extraction step for extracting a user rankings; 상기 문서가중치와 사용자랭킹으로부터 문서랭킹을 추출하는 문서랭킹추출단계를 갖는다. It has a document ranking extraction step for extracting a document from the document ranking weights and the user ranking.

상기 문서랭킹은 The document ranking

Figure 112006059610944-pat00001
에 의해 계산되는 것이 바람직하다. It is desirable to be calculated.

여기서, here,

W(s, d j )는 문서가중치 W (s, d j) is weighted document

AR A (s, u i )는 사용자랭킹. AR A (s, u i) user rankings.

상기 문서가중치는 The document weights

Figure 112006059610944-pat00002
에 의해 계산되는 것이 바람직하다. It is desirable to be calculated.

여기서, here,

Figure 112006059610944-pat00003

상기 사용자랭킹은 The user rankings

Figure 112006059610944-pat00004
에 의해 계산되는 것이 바람직하다. It is desirable to be calculated.

여기서, here,

문서가중치 Document weight

Figure 112006059610944-pat00005

플러스가중치 Plus weights

Figure 112006059610944-pat00006

중복도가중치 Redundancy weighting

Figure 112006059610944-pat00007

클릭가중치 Click weights

Figure 112006059610944-pat00008

Figure 112006059610944-pat00009

Figure 112006059610944-pat00010

Figure 112006059610944-pat00011

상기 사용자랭킹, 문서랭킹 중 어느 하나 또는 둘에는 시간가중치가 적용되어 시간이 경과함에 따라 랭킹이 하락하는 것이 바람직하다. Wherein the user ranking, either or both of the document ranking has been applied, the time weight is preferable that the ranking drops with time.

상기 시간가중치는 The time weight

Figure 112006059610944-pat00012
으로 정의되며, 상기 적용은 상기 사용자랭킹, 문서랭킹에 상기 시간가중치가 곱해진 것을 의미하는 것이 바람직하다. As defined, the application is preferably made means that the time-weight product to the user ranking, the document ranking.

여기서, here,

d c 는 액션랭킹 계산시 시간 d c is calculated at the time the action Rankings

d w 는 문서 생성 시간. d w is the document creation time.

상기 문서랭킹에 시스템랭크를 적용하여 최종 문서랭킹을 산출하는 것이 바람직하다. To calculate the final document ranking by applying the system to rank the document rankings are preferred.

상기 최종 문서랭킹은 The final document ranking

Figure 112006059610944-pat00013
에 의해 계산되는 것이 바람직하다. It is desirable to be calculated.

여기서, here,

Figure 112006059610944-pat00014
: 질의 q에 대한 최종 문서랭킹 : Final document ranking for the query q

s j : j번째 주제값 s j: j-th value of the subject

d i : i번째 문서 d i: i-th article

q : query q: query

ave : 평균값 ave: average

Figure 112006059610944-pat00015
: 주제벡터 s j 와 쿼리벡터 q간의 코사인 값 Subjects vector cosine between s j and the query vector q

Figure 112006059610944-pat00016
: j번째 주제에 속한 문서 i번째 문서의 Atype 액션랭크 점수 : J i-th article of the document belongs to the second theme Atype action scores rank

α, β : 액션랭크 점수와 SR의 가중치 α, β: Action Rank scores and weights of the SR

SR : 시스템 랭크값(검색엔진의 랭킹점수) SR: System Value Rank (ranking score of a search engine)

작성한 사용자를 알 수 없는 문서에 대하여는, 상기 문서에 대한 플러스회수, 클릭회수의 영향력과 시스템랭크값을 고려한 문서랭킹을 추출하는 사용자가 없는 문서의 문서랭킹을 추출하는 문서랭킹추출단계를 갖는 것이 바람직하다. For a document of unknown written by the user, preferably it has a positive number, the document ranking extracting the document rank of a document which the user for extracting a document ranking considering the influence to the system a rank value of the click number to said article Do.

상기 사용자가 없는 문서의 문서랭킹은 Document ranking of the document without the user's

Figure 112006059610944-pat00017
에 의해 계산되는 것이 바람직하다. It is desirable to be calculated.

여기서, here,

Figure 112006059610944-pat00018

상기 사용자가 없는 문서의 문서랭킹에는 시간가중치가 적용되어 시간이 경과함에 따라 랭킹이 하락하는 것이 바람직하다. Document ranking of the document that does not contain the user, it is preferable that the ranking drops over time, the time weight is applied.

상기 시간가중치는 The time weight

Figure 112006059610944-pat00019
로 정의되며, 상기 적용은 상기 사용자가 없는 문서의 문서랭킹에 상기 시간가중치가 곱해진 것을 의미하는 것이 바람직하다. Is defined as the application is preferably made means that the time-weight product in the document ranking of the document that does not contain the user.

여기서, here,

d c 는 액션랭킹 계산시 시간 d c is calculated at the time the action Rankings

d w 는 문서 생성 시간. d w is the document creation time.

또 다른, 본 발명에 의한 문서랭킹 부여방법은, Another, document ranking given method according to the invention,

제 1 문서에 행해지는 사용자의 액션에 따라 상기 제 1 문서의 가중치를 계산하는 단계; According to the user is performed in one document action comprises: calculating a weight of the first document; 상기 계산된 제 1 문서의 가중치와 제 1 키워드와의 제 1 적합도를 계산하는 단계; The method comprising the calculated weight of the first document and calculating a first fit with the first keyword; 상기 제 1 키워드에 의해 질의가 발생하는 경우, 상기 제 1 키워드와 소정 크기 이상의 제 2 적합도를 가지는 제 2 문서에서, 상기 제 1 적합도 및 상기 제 2 적합도의 크기에 따라 상기 제 1 문서 및 상기 제 2 문서를 정렬하는 단 계를 포함한다. If a query by the first keyword generated, the first keyword and the second document having a second fit over a predetermined size, the first fit and the first document and the second depending on the size of the second fit 2 comprises a step for aligning a document.

상기 제 1 문서의 가중치는 상기 제 1 문서를 작성한 사용자의 랭킹에 비례하는 것이 바람직하다. Weight of the first article is preferably proportional to the user's ranking created by the first article.

상기 제 1 문서의 가중치는 상기 제 1 문서를 읽은 사용자가 상기 제 1 문서를 북마크한 횟수 또는 답글을 추가하는 횟수에 비례하는 것이 바람직하다. Weight of the first article is preferably in proportion to the number of times that the user read the first document added to the number of replies or bookmarked for the first document.

상기 제 1 문서의 가중치는 상기 제 1 문서를 읽은 사용자의 수에 비례하는 것이 바람직하다. Weight of the first article is preferably in proportion to the number of users who read the first document.

상기 제 1 문서와 상기 제 2 문서가 동일한 내용을 포함하고, 상기 동일한 내용의 원 저자가 상기 제 1 문서인 경우, 상기 제 1 문서의 상기 제 1 키워드와의 적합도를 상기 제 2 문서의 적합도보다 높게 설정하는 단계를 더 포함하는 것이 바람직하다. Said first article and said second article than the fit of the of the same information, and, if the original author of the same content of the first document, the first document, wherein the the fit of the first keyword second article in the further comprise the step of setting higher is preferred.

상기 제 1 문서의 가중치는 상기 제 1 문서에 대해 발생하는 사용자의 액션의 시간적 순서에 비례하는 것이 바람직하다. Weight of the first article is preferably proportional to the time sequence of the user, which occurs for the first document action.

상기 목적을 달성하기 위한 또 다른 본 발명은, 상기 방법을 수행할 수 있는 프로그램이 수록된 컴퓨터로 읽을 수 있는 기록 매체를 제공한다. Another aspect of the present invention for achieving the above object, there is provided a recording medium on which a program capable of performing the method can be read by a computer recorded.

이하 도면을 참조하여 상세히 설명한다. Reference to the drawings will be described in detail. 그러나, 이들 도면은 예시적인 목적일 뿐 본 발명이 이에 한정되는 것은 아니다. However, these figures but the invention as an illustrative purpose is not limited thereto.

도1은 검색 대상인 문서의 정보 및 사용자의 피드백 정보를 저장하는 데이터 베이스와 자동분류를 수행하는 자동분류기, 분류정보와 사용자 액션 정보를 이용하여 랭킹 값을 계산하는 랭킹 계산 모듈로 크게 이루어진다. 1 is using an automatic sorter, the classification information and the user action information that the automatic classification and data base for storing the information and the user's feedback information of the document for detection is made large to a ranking calculation module for calculating a ranking value.

액션은 정보탐색 과정 중의 암시적이거나 명시적인 활동을 모두 말한다. Action speaks all implied or explicit activity of the information search process. 이런 액션은 두 분류로 나눌 수 있으며, 첫 번째가 정보제공 주체로서의 Creation 액션이며, 두 번째는 정보탐색자로서의 Delivery 액션이다. These actions can be divided into two categories, Creation and action as the first to provide information about the subject, the second is the Delivery Action as information seekers. 본 발명에서는 두 가지를 모두 비중있게 다룰 것이나, 실제 액션 가중치에는 Delivery액션보다 Creation 액션에 중요한 의미를 부여한다. In the present invention would able to handle both of the specific gravity, the actual action weights are given to significance Creation action than Delivery action.

도2는 액션의 종류 및 채택하는 액션에 대한 표를 나타내고 있다. Figure 2 shows a table of the actions for the type of action and adopted.

Write 액션은 문서를 작성하는 행위를 말한다. Write Action refers to the act of writing a document. 통에서, 페이퍼에서, 싸이월드 게시판에서와 같이 자신이 작성한 글을 말하여, 모든 행동 중 가장 중요한 행동이 되며 주제 분류 시, 문서가 특정 주제로 분류될 값인 Write 액션 값은 재조정된다. In pain, in a paper by the end of the article you have created, as in Cyworld board, the most important action of all the action, and when the subject classification, Write Action value value the document is classified as a specific topic is restructuring.

Wiki는 서치 플러스 서비스와 같이 개설될 서비스로, Wiki에서 내가 작성한 글에 대한 가중치이다. Wiki is a service to be established, such as search-plus-services, the weight of the articles I've written in the Wiki. Wiki는 글을 쓸 수 있는 사용자가 제한적이기 때문에 Write액션과 동일한 가중치를 주는 것에는 문제가 있어 보인다. Wiki is because a user who can write is limited to giving equal weight to action Write seems there is a problem. 이는 모든 사용자가 동일한 조건하에 경쟁해야하는 조건에 위배된다. This is contrary to the terms all users must compete under the same conditions. 구루를 더욱 구루로 만들어 주며, 일반사용자는 구루 군에 들어올 수 있는 확률을 줄여 빈익빈 부익부현상이 이곳에서도 발생할 소지가 있다. Create a guru to guru gives more general users have binikbin buikbu phenomena occur in possession here reduces the chance of entering the Guru groups. 또한 Wiki는 한 문서에 대해서 여러명이 작성할 수 있어, 이를 액션랭킹에 반영하는 것이 쉽지 않다. Wiki also got multiple people to write about the document, it is not easy to incorporate them into action rankings. 그래서 Wiki는 백과사전의 활용으로 한정하고, 액션랭킹과는 별개로 진행한다. So Wiki is limited to the use of encyclopedias and action rankings and proceeds to separate.

RSS 액션은 나의 Archive를 RSS를 통해 주기적으로 읽는 다른 사용자의 영향력 지수를 나의 영향력으로 흡수한 점수이다. RSS is an action that has absorbed the impact factor scores of someone reading my Archive periodically via RSS to my influence. 단, RSS는 특정 주제의 문서들만을 등록할 경우만 반영될 수 있으나, RSS를 전체로 등록하는 것은 특정 주제로 매핑될 수가 없으므로 액션랭킹에서는 일단 배제한다. However, RSS, but it can be reflected only when the document to be registered only in a particular subject, but to register the RSS as a whole can not be mapped to a specific topic should one exclude the action rankings.

Plus 액션은 검색결과 또는 웹 서핑 도중 발견한 좋은 문서를 북마크 하는 개념으로, 사용자가 플러스한 문서는 원문 소유자의 액션점수로 반영되고, 또한 원문 자체의 내용도 나의 액션 점수에 미약하게 반영된다. Plus the action as a concept to bookmark a good document found during a search results or web surfing, document the user is reflected in the positive action of the original owner points, and also to reflect on my actions even weak points of the original content itself. Plus 액션은 문서에 대한 평가도 포함되며, 좋고 나쁨의 정도에 의해 랭킹값에도 영향을 주게 된다. Plus action is influenced even ranking value by the level of Bad and include evaluation of the article, good.

Comment 액션은 특정 문서에 대해 남들이 커맨트한 회수를 문서 주인의 액션랭킹에 반영함을 말한다. Comment Action says that reflects the number of times that others have the action keomaenteu ranking of the document owner for a specific document. 문서가 생성된 서비스의 종류에 따라 커맨트 시스템이 구축되지 않은 경우가 있을 수 있기 때문에 커맨트의 값을 모든 문서에서 동일하게 부여하기는 어렵다. Because you might have if the document is not a keomaenteu system is not constructed in accordance with the type of service, it is difficult to produce a given value of keomaenteu the same in all documents. 또한 커맨트 자체가 긍정적 의미인지 부정적 의미인지는 시스템이 판단하기 어렵기 때문에 랭킹에 직접적인 영향을 주는 것은 위험하여 비용 대비 경제성이 없다. Also it keomaenteu itself a positive sense that the negative sense what is it that directly affect the ranking system is difficult to determine because there is no cost to economic risks.

Query 액션은 사용자가 검색질의로 사용한 키워드에 대한 가중치이다. Query actions are weighted for the keywords you used in the search query. 이 액션은 어떤 사용자가 어떤 주제에 관심이 있다는 성향파악에는 도움이 되나, Query를 많이 한 것이 많은 정보력을 가지지 않기 때문에 정보력 측면에서 유용하지 않은 액션이다. This action is any action a user is not useful in terms of intelligence, but because they help identify tendencies that are interested in the topic, have a much intelligence as much as the Query.

Click 액션은 검색결과에서 사용자가 클릭한 다른 사람의 문서들을 말한다. Click Action, says the document of another person that you click on in search results. 나의 영향력이 클릭된 문서에 반영되고, 문서의 내용은 나의 성향 및 액션점수에 미약하게 반영된다. This is reflected in the influence-click My Documents, the content of the document is reflected in the weak points in my disposition and action.

Duplicate 액션은 A타입 문서(네티즌 정보 베스트)만 해당되며, 스크랩이나 부분적인 문단 도용 등을 가려 원작자에게 좀더 좋은 높은 점수를 주고, 중복도가 높은 문서일수록 Write 액션 값을 더 높게 주기 위함이다. Duplicate actions are A-type document (best surfers information) is intended only give, give scrap or partial paragraph, such as the theft overshadowed more good high scores to the author, the higher the more redundancy the highest article Write Action value. 이 것은 실제 연산 시, Plus 액션으로 투영할 수 있다. This can be projected during the actual operation, Plus action. 예를 들어, A라는 사용자가 B라는 사용자의 문서를 스크랩하면, A라는 사용자가 B문서를 Plus한 것으로 계산하면 된다. For example, scrap of document that the user A of the user B, is calculated as if the user B Plus a document called A.

액션 랭킹을 계산 하는 방법은 주제별 랭킹을 계산하기 위해 사용자의 문서(또는 액션들)을 주제별로 자동분류를 수행해야 한다. How to calculate the rankings action should perform automatic classification of documents on a user's (or action) by topic to compute the thematic rankings. 이후 분류된 문서에 대해, 어떤 액션을 취한 타인의 영향력을 반영한다. After about a classified document, others reflecting the impact of any action taken.

계산 절차는 다음과 같다. The calculation procedure is as follows.

- 액션 자동분류 Action Automatic Classification

- 분류된 액션의 확률값에 남의 영향력을 반영 - reflects the influence of others on the probability of the classification action

- 영향력이 반영된 액션들의 점수를 취합 - gathers score reflects the impact of the action

액션의 기본이 되는 것은 문서와 키워드이다. What is the primary action of the document and keywords. 플러스, 클릭조차 주체가 되는 것은 문서이므로 액션의 자동분류는 이러한 것들이 기본 소스가 된다. Since it is positive, and even click on a document that is the subject of the action is automatic classification of these things is the primary source. 자동분류된 액션들은 한 주제에 대한 적합도가 확률값으로 표현된다. The automatic classification actions are a fit for the subject is represented by a probability. 이 확률값과 함께 남이 이 문서에 한 액션들의 영향력을 같이 계산한다. This probability is calculated as others with the impact of an action on this document.

사용자의 영향력은 주제로 나뉘어지게 되며, 특정 주제에 대한 사용자의 영향력은 1차적으로 그 주제에 포함된 문서 액션들의 합으로 계산된다. The user's influence is divided be the subject, is calculated as the sum of the actions included in the document subject to the influence of the first user is on a particular topic derivative. 여기서 액션 들의 합이란, 사용자가 취한 모든 액션들을 자동분류를 통해 그 주제와 일치하는 확률을 계산하고, 이 확률값들에 액션 가중치로 보정하여 사용자의 영향력으로 판단한다. Here, the sum of the action is, through automatic classification of all actions taken by the user calculate the probability that matches the subject and corrected by the action of the weight to the probability determined by your influence.

액션랭크의 알고리즘은 앞서 말한 액션의 종류들에 대해 수치화 되어진 결과가 합산되어 나타난다. Rank algorithm of action appears to have resulted in quantifying the types of the aforementioned actions are summed.

다음은 각 액션 별 가중치 계산법이다. The following is a weighted calculation of each action.

(1) 생성한 문서에 대한 가중치 (1) generates weights for the article

사용자가 작성한 문서에 대한 영향력은 특정 주제에 포함된 사용자의 문서들의 가중치 및 남의 영향력의 총 합으로 계산된다. Influence on the article you have written is calculated as a weighted sum of the others and influence of the documents of people included in a specific topic.

특정 주제 s에 대해 j번째 문서의 가중치를 W(s,d j ) 라 할 때 When referred to the weight of the j-th article on a particular topic s W (s, d j)

Figure 112006059610944-pat00020

Figure 112006059610944-pat00021

문서의 가중치는 자동분류를 통해 분류된 문서의 주제에 기본적으로 영향을 받는다. The document is subjected to the weight basically influenced the subject matter of classified documents through automatic classification. 여기서 P(s, d j )는 자동분류를 통해 생성된 주제별 문서의 확률값이다. Where P (s, d j) is the probability of a document theme generated by the automatic classification. 문서의 가중치는 속한 주제와 일치할 확률값을 기본값으로 하고, 여기에 다른 사용자가 이 문서에 행한 액션의 영향력을 통해 확률값이 보정되어진다. The document is a weighted probability coincides with the subjects that belong to the default, and the others are here, the probability is corrected by the impact of the actions carried out in this document.

다른 사용자의 영향력은 크게 3가지로 플러스와 중복도와 클릭으로 나뉜다. The influence of others is largely divided into a positive and help redundant in three clicks. 이를 계산하는 방법은 시스템 리소스와 시간을 고려하여, 매일 한 번 이전 날까지(d-1) 각 액션의 영향력의 총 합에 그 날(d)의 남의 영향력을 합쳐서 계산하게 된다. How to calculate it is calculated by considering the system resources and time, together with others influence of the previous day to once per day (d-1) that day (d) the sum total of the impact of each action. 마지막으로, 이 문서 이하에 쓰이는 각 액션들에 대한 가중치는 시뮬레이션을 통해서 평가된 회귀계수를 반영한 가중치가 사용된다. Finally, the weights for each of the actions used in the document hereinafter have the weights reflect the regression coefficient evaluated through simulations, is used.

(2) 내가 한 플러스 가중치 (2) I am a plus weights

플러스 액션이 발생하면, 나의 영향력이 문서가중치를 계산할 때 문서 작성자에게 일정부분이 부여된다. When this action occurs Plus, a certain portion of a document's author when my influence to calculate the document is assigned a weight. 그리고, 나에게는 플러스한 문서가 속한 주제에 대해 문서의 가중치가 나의 영향력으로 일정부분 부여된다. And the weight of the document or about the subject belongs to one who is given a document plus a portion of my influence. 플러스 가중치는 다음 수식으로 결정한다. Plus the weight is determined by the following formula:

특정 주제 s에 속해 있는 ㅣ번째 문서에 대한 플러스 가중치를 W(s, p )라 할 때 When La plus weights for l second document belongs to a particular topic s W (s, p l)

Figure 112006059610944-pat00022

Figure 112006059610944-pat00023

주제별 문서의 영향력은 주제에 속할 문서의 확률과 문서 소유자의 영향력이 곱해서 반영된다. The impact of thematic documents is reflected by multiplying the probability and impact of the document belong to the owner of the document on the subject.

한 문서에는 여러 사람이 플러스 할 수 있으며, 이때 플러스 영향력은 동일하게 분배된다고 가정한다. It is assumed that a document can be several people, plus The positive influence is equally distributed.

(3) 내가 한 중복도 가중치 (3) I have redundancy weights

중복도 액션은 플러스와 같은 방식으로 계산된다. Redundancy action is calculated in the same way as the plus. 중복도 가중치는 다음 수식으로 결정한다. Redundancy weight is determined by the following equation.

특정 주제 s에 속해 있는 o번째 문서에 대한 중복도 가중치를 W(s, r o )라 할 때 O redundant for the second document that belongs to a particular topic s also referred to the weight W (s, r o)

Figure 112006059610944-pat00024

Figure 112006059610944-pat00025

(4) 내가 한 클릭 가중치 (4) I click weights

클릭 또한, 플러스와 같은 방식으로 계산한다. Click addition, calculated in the same manner as Plus. 단지, 중요도는 플러스가 월등할 것으로 예상된다. Only, importance is expected to be a superior plus. 클릭은 중복 제거 방법을 적용하여, 악의적인 행위에 대해 클릭방지를 할 수 있어야 한다(하루에 문서당, 한 유저가 한 번의 클릭만 할 수 있도록 제안). Click is to apply the deduplication process, should be able to click protection against malicious acts (documents per day, so that a user can only propose a single click).

특정 주제 s에 속해 있는 m번째 문서에 대한 클릭 가중치를 W(s, c m )라 할 때 When referred to the weight of the m-th-click a document that belongs to a particular topic s W (s, c m)

Figure 112006059610944-pat00026

Figure 112006059610944-pat00027

최종 액션랭킹은 위에서 설명한 3가지의 가중치를 조합하여 문서의 작성자의 유무에 따라 크게 두가지 타입으로 나누어 수식화 된다. The final action ranking combined weight of the three above formulation is divided into two main types depending on the presence or absence of the document creator.

(1) 문서의 작성자를 알수있는 타입(이후 A타입이라 칭함) 1 type can be seen the author of a document (hereinafter referred to as type A)

A타입은 액션랭킹이 사용자 랭킹과 문서 랭킹으로 나뉜다. A type of action Ranking Ranking is divided into user and document ranking.

사용자의 액션랭킹은 생성한 문서에 가중치와 내가 한 플러스 가중치와 내가 한 클릭 가중치를 복합적으로 사용한다. The actions of users ranking is used in combination with the weight and I plus my weight and weight-click on the generated document. A타입에 따른 사용자 액션랭킹은 아래와 같다. A user action Ranking of the type shown below.

Figure 112006059610944-pat00028

위의 식은 특정 주제(s)에 대하여 관심있는 사용자(u j )의 랭킹은 그 사용자가 작성한 모든 문서들 각각 다른 사용자들로부터 액션이 많이 수행( Expressions of interest for the user on a specific topic (s) ranking is a lot of actions performed by all documents the different users that you created in the (u j) (

Figure 112006059610944-pat00029
)되고, 그 자신 또한, 그 주제에 일치하는 문서들에 대해서 많은 액션을 수행( ) Is, himself also perform a number of actions for the documents that match that topic (
Figure 112006059610944-pat00030
)하였을 때 순위가 올라가게 됨을 의미한다. ) Means that the ranking go up when.

문서의 액션랭킹은 생성한 문서에 가중치와 사용자의 액션랭킹과 시스템랭킹을 모두 병합하여 사용한다. Action ranking of the document will be used to merge both the weight and the user's actions and ranking system ranking the generated document. A타입에 따른 문서 액션랭킹은 다음과 같다. Document Actions ranked according to the type A is as follows.

Figure 112006059610944-pat00031

위의 식은 문서가 생성한 문서의 가중치(W(s, d j ))에 그 문서의 사용자 액션점수(AR A (s, u j ))를 곱하는 것으로, d j 문서가 특정 주제(s)에 관심있는 다른 사용자들로부터 액션이 많이 수행되고, 그 문서의 사용자가 그 주제에 구루이면 상위에 랭크 되도록 하기 위함이다. To the weight of the expression of these documents to produce document (W (s, d j) ) by multiplying the user action score of the document (AR A (s, u j )), the d j documents on a specific topic (s) and a lot of actions performed by other users who are interested, the user of the document if the glove on the subject is to ensure that the higher the rank.

(2) 사용자를 알수 없는 타입(이후 B타입이라 칭함) (2) type unknown to the user (hereinafter referred to as B type)

Figure 112006059610944-pat00032

Figure 112006059610944-pat00033

B타입의 문서는 주제에 대한 정보가 없으므로, 단순히 고려한 액션 자질의 횟수만을 사용한다. B-type document is no information on the subject, simply use only the number of qualities considering action.

(3) 날짜 반영 (3) The date reflects

문서의 생성 날짜를 시점에서 현재 액션랭킹을 계산하는 날짜까지의 기간을 수치화하여 이를 액션랭킹 값에 곱하여, 최신의 글들이 좀 더 랭킹이 높도록 유도한다. To quantify the duration of the action until the date for calculating the current ranking at the time of the creation date of the document by multiplying them in action Ranking value, leading to the latest articles are a little more high ranking. AR A (s, d j )과 AR B (s, d j )에 0.998^(d c -d w )을 곱하면 도3과 같은 그래프를 그린다. AR A (s, d j) and AR B (s, d j) to 0.998 ^ (d c -d w) draw the graph as shown in FIG. 3 multiply. 단, 최소 시간가중치는 0.5이며, 1년 이후부터 0.5를 일괄 곱하여 시간성을 반영한다. However, the minimum time and the weight is 0.5, reflecting the temporality multiplied by the batch of 0.5 after 1 year. 여기서 d c 는 액션랭킹 계산 시 시간, d w 는 문서 생성 시간을 말한다. Wherein d c is refers to the document generation time calculated at time action ranking, d w.

최종 시간 가중치를 고려한 타입별 액션랭크는 다음과 같다. Type action star rank considering the last time the weights are as follows:

Figure 112006059610944-pat00034

검색 시 적용 방법은 다음과 같다. In search of how to apply are as follows:

검색도 물론, A타입과 B타입으로 구분하며, 아래의 도4의 시스템 구성으로 검색을 수행한다. Retrieval, of course, be classified as Type A and Type B, and performs a search using the system configuration of FIG. 4 below. B타입은 기존의 검색방법으로, B타입 액션랭킹으로 순위화하면 되지만 A타입 검색은 주제 검색 서버로부터 쿼리와 가장 잘 일치하는 주제정보를 검색하여 기존 랭킹과 결합하는 점이 다른 점이다. Type B is a screen when a conventional search methods, priority ranking of B-type action, but the A-type search, search the information that best matches the subject and topic search query from a server to another point, which combined with the existing ranking points. 아래의 설명은 A타입에 대한 문서와 사용자 검색 적용 방법이다. The following description is a document and the user search method applied to the A type.

(1) 문서 검색 (1) Article Search

전통적인 검색과 같은 맥락이나, 내부 검색 방법은 키워드 매칭과 주제 매칭의 결합으로 결과를 추출한다. Context, or internal search methods, such as traditional search and extract the results to a combination of keyword matching and matching themes.

검색 알고리즘 Search Algorithm

1) 여러 키워드에 대해 여러 주제를 매핑하여 찾음(max 3개). 1) Finding and mapping the many topics for various keywords (max 3 pieces).

--> 질의벡터와 주제 벡터간의 cosine 계수 사용 -> query using cosine coefficients between vector and vector Subject

2) 질의벡터가 포함된 문서들을 결과 집합으로 추출 2) extracting the documents that contain the query result set into vector

--> 질의-문서간 키워드 매칭 사용 -> Query - Use keyword matching between documents

3) 액션랭킹을 반영하여 최종 랭킹을 계산 3) calculate the final ranking reflects the action Rankings

Figure 112006059610944-pat00035

여기서, here,

Figure 112006059610944-pat00036
: 질의 q에 대한 최종 문서랭킹 : Final document ranking for the query q

s j : j번째 주제값 s j: j-th value of the subject

d i : i번째 문서 d i: i-th article

q : query q: query

ave : 평균값 ave: average

Figure 112006059610944-pat00037
: 주제벡터 s j 와 쿼리벡터 q간의 코사인 값 Subjects vector cosine between s j and the query vector q

Figure 112006059610944-pat00038
: j번째 주제에 속한 문서 i번째 문서의 Atype 액션랭크 점수 : J i-th article of the document belongs to the second theme Atype action scores rank

α, β : 액션랭크 점수와 SR의 가중치 α, β: Action Rank scores and weights of the SR

SR : 시스템 랭크값(검색엔진의 랭킹점수) SR: System Value Rank (ranking score of a search engine)

정책적으로 시스템 랭크보다, 쿼리와의 주제 관계까지 고려한 액션 중, 어디에 무게를 줄 것인지 등을 가중치로 제어할 수 있다. than the political system to rank, in consideration of the relation to the subject of the action query, you can control the weight where you want to reduce weight.

α는 class 회귀계수를 참고하고 β는 system 회귀 계수를 이용한다. α will refer to the class and the coefficient β is used in the system coefficient.

검색 질의는 복합질의가 될 수 있으며, 질의 또는 주제분류에 따라 검색결과가 하나의 주제에 대한 결과가 아닌 여러 주제에 걸친 주제 집합의 결과가 나타날 수 있다. Search queries can be a complex query, you may receive a result of a set of topics across a variety of topics, not the results on the topic of one of the search results according to the query or topic category. 이 결과 중에서, cosine 계수가 높은 주제를 최대 3개만 추출한다. From the result, and extracts the subject a cosine coefficient higher maximum three. 이는, 엔진에서의 검색 반응 속도를 저하를 방지하기 위함이다. This is to prevent a decrease rate of the search response from the engine. 그리고, 키워드 매칭으로 인한 문서들을 최종적으로 액션랭크로 순위화하여 검색한다. Then, the search screen and finally rank rank by action due to the article keyword matching.

(2) 사람 검색 (2) People Search

문서검색과 유사하나, 주제내의 사람들만 추출하는 것이 다르다. A similar document search is different than extracting only those in the subject.

검색 알고리즘 Search Algorithm

1) 여러 키워드에 대해 여러 주제를 매핑하여 찾음. 1) Finding and mapping the many topics for different keywords.

--> 질의벡터와 주제 벡터간의 cosine 계수 사용 -> query using cosine coefficients between vector and vector Subject

2) 매핑된 주제에 속한 사용자를 전체 결과 집합으로 추출 2) extract the user belongs to a mapped subject to the full set of results

3) 질의에 따른 액션랭킹을 반영하여 최종 랭킹을 계산 3) calculate the final ranking, reflecting the action according to the quality ranking

도5와 도6은 위의 알고리즘으로 서비스되는 문서와 사용자의 목록을 예시한다. Figure 5 and 6 illustrates a list of documents and users serviced by the above algorithm.

이상과 같이 본 발명에 의하면, 특정 질의에 부합하는 문서와 사용자를 노출하고, 사용자의 피드백 정보를 이용하여 기존의 단순한 키워드 기반 검색랭킹 방법에 비해, 월등한 검색 성능을 보이는 효과가 있다. According to the present invention as described above, there is an effect exposes the document and the user, using the user's feedback information showing, superior scanning performance compared to the conventional simple keyword-based search method ranking with a certain quality.

Claims (19)

  1. 문서랭킹 부여방법에 있어서, In the document ranking given way,
    사용자에 의해 문서가 작성되는 문서작성단계와; Document creation step that creates a document by a user;
    검색자에 의해 질의가 입력되는 질의입력단계와; Query inputting step that the query is entered by the searcher and;
    상기 문서작성단계에서 작성된 문서가 상기 질의와 일치할 확률에 상기 문서에 대한 검색일까지의 플러스영향력, 중복도영향력, 클릭영향력의 합을 고려한 문서가중치를 추출하는 문서가중치추출단계와; Document weight extraction step that the documents created in the steps of creating the document, a document is extracted weight to the probability that match the query considering the positive impact, the sum of redundancy influence, click to search the influence of one of the above documents;
    상기 사용자가 작성한 문서들 중 상기 질의와 관련된 문서들에 대한 다른 사람들이 행한 문서가중치의 총합과, 상기 사용자가 상기 질의와 관련된 다른 사람들의 플러스가중치의 총합, 중복도가중치의 총합, 클릭가중치의 총합으로부터 사용자랭킹을 추출하는 사용자랭킹추출단계와; The sum of the document weighting others have done for documents related to the quality of the documents that the user created and the sum of the user is the sum of the positive weights of other people associated with the query, the redundancy sum of the weights, click weights from the user ranking extraction step for extracting a user rankings;
    상기 문서가중치와 사용자랭킹으로부터 문서랭킹을 추출하는 문서랭킹추출단계를 갖는 문서랭킹 부여방법. Ranking method given document having a document ranking extraction step for extracting a document from the document ranking weights and the user ranking.
  2. 제1항에 있어서, According to claim 1,
    상기 문서랭킹 AR A (s, d j )는 하기식에 의해 계산되는 것을 특징으로 하는 문서랭킹 부여방법. The document ranking AR A (s, d j) The method characterized in that the given document ranking calculated by the following equation.
    Figure 112006059610944-pat00039
    여기서, here,
    W(s, d j )는 문서가중치 W (s, d j) is weighted document
    AR A (s, u i )는 사용자랭킹. AR A (s, u i) user rankings.
  3. 제2항에 있어서, 3. The method of claim 2,
    상기 문서가중치 W(s, d j )는 하기식에 의해 계산되는 것을 특징으로 하는 문서랭킹 부여방법. The document weights W (s, d j) The method characterized in that the given document ranking calculated by the following equation.
    Figure 112006059610944-pat00040
    여기서, here,
    Figure 112006059610944-pat00041
  4. 제2항에 있어서, 3. The method of claim 2,
    상기 사용자랭킹 AR A (s, u i )는 하기식에 의해 계산되는 것을 특징으로 하는 문서랭킹 부여방법. Wherein the user ranking AR A (s, u i) is given document ranking method, characterized in that calculated by the following equation.
    Figure 112006059610944-pat00042
    여기서, here,
    문서가중치 Document weight
    Figure 112006059610944-pat00043
    플러스가중치 Plus weights
    Figure 112006059610944-pat00044
    중복도가중치 Redundancy weighting
    Figure 112006059610944-pat00045
    클릭가중치 Click weights
    Figure 112006059610944-pat00046
    Figure 112006059610944-pat00047
    Figure 112006059610944-pat00048
    Figure 112006059610944-pat00049
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, The method according to any one of the preceding claims,
    상기 사용자랭킹, 문서랭킹 중 어느 하나 또는 둘에는 시간가중치가 적용되어 시간이 경과함에 따라 랭킹이 하락하는 것을 특징으로 하는 문서랭킹 부여방법. Wherein the user ranking, document ranking either or both, the method given document ranking characterized in that the rank of decline as the time passed, the application time of the weight.
  6. 제5항에 있어서, 6. The method of claim 5,
    상기 시간가중치는 하기식으로 정의되며, 상기 적용은 상기 사용자랭킹, 문서랭킹에 상기 시간가중치가 곱해진 것을 의미하는 것을 특징으로 하는 문서랭킹 부여방법. The time weight is to be defined by the following formula, wherein the method is applied to give the document ranking characterized in that the means made the time-weight product to the user ranking, the document ranking.
    Figure 112006059610944-pat00050
    여기서, here,
    d c 는 액션랭킹 계산시 시간 d c is calculated at the time the action Rankings
    d w 는 문서 생성 시간. d w is the document creation time.
  7. 제5항에 의한 문서랭킹에 시스템랭크를 적용하여 최종 문서랭킹을 산출하는 것을 특징으로 하는 문서랭킹 부여방법. The document ranking method given, characterized in that for calculating the final document ranking system ranks the documents by applying a ranking by 5.
  8. 제7항에 있어서, The method of claim 7,
    상기 최종 문서랭킹 The final document ranking
    Figure 112006059610944-pat00051
    는 하기식에 의해 계산되는 것을 특징으로 하는 문서랭킹 부여방법. Document ranking method is assigned, characterized in that, calculated by the following equation.
    Figure 112006059610944-pat00052
    여기서, here,
    Figure 112006059610944-pat00053
    : 질의 q에 대한 최종 문서랭킹 : Final document ranking for the query q
    s j : j번째 주제값 s j: j-th value of the subject
    d i : i번째 문서 d i: i-th article
    q : query q: query
    ave : 평균값 ave: average
    Figure 112006059610944-pat00054
    : 주제벡터 s j 와 쿼리벡터 q간의 코사인 값 Subjects vector cosine between s j and the query vector q
    Figure 112006059610944-pat00055
    : j번째 주제에 속한 문서 i번째 문서의 Atype 액션랭크 점수 : J i-th article of the document belongs to the second theme Atype action scores rank
    α, β : 액션랭크 점수와 SR의 가중치 α, β: Action Rank scores and weights of the SR
    SR : 시스템 랭크값(검색엔진의 랭킹점수) SR: System Value Rank (ranking score of a search engine)
  9. 제8항에 있어서, The method of claim 8,
    작성한 사용자를 알 수 없는 문서에 대하여는, 상기 문서에 대한 플러스회수, 클릭회수의 영향력과 시스템랭크값을 고려한 문서랭킹을 추출하는 사용자가 없는 문서의 문서랭킹을 추출하는 문서랭킹추출단계를 갖는 문서랭킹 부여방법. For a document of unknown written by the user, the document having a positive number, click number of document ranking extracting the document rank of a document which the user for extracting a document ranking considering the influence to the system a rank value for the document ranking how granted.
  10. 제9항에 있어서, 10. The method of claim 9,
    상기 사용자가 없는 문서의 문서랭킹 AR B (s, d j )는 하기식에 의해 계산되는 것을 특징으로 하는 문서랭킹 부여방법. Document ranking method given which is characterized in that the user is calculated by the document ranking AR B (s, d j) is the formula of a document that does not.
    Figure 112006059610944-pat00056
    Figure 112006059610944-pat00057
  11. 제10항에 있어서, 11. The method of claim 10,
    상기 사용자가 없는 문서의 문서랭킹에는 시간가중치가 적용되어 시간이 경과함에 따라 랭킹이 하락하는 것을 특징으로 하는 문서랭킹 부여방법. Document Ranking Method grant which comprises ranking fell as the document pages do not rank the user, the time elapsed, the time weighting is applied.
  12. 제11항에 있어서, 12. The method of claim 11,
    상기 시간가중치는 하기식으로 정의되며, 상기 적용은 상기 사용자가 없는 문서의 문서랭킹에 상기 시간가중치가 곱해진 것을 의미하는 것을 특징으로 하는 문서랭킹 부여방법. The time weight is to be defined by the following formula, wherein the application is a document ranking method given characterized in that the means made the time-weight product in the document ranking of the document that does not contain the user.
    Figure 112006059610944-pat00058
    여기서, here,
    d c 는 액션랭킹 계산시 시간 d c is calculated at the time the action Rankings
    d w 는 문서 생성 시간. d w is the document creation time.
  13. 제 1 문서에 행해지는 사용자의 액션에 따라 상기 제 1 문서의 가중치를 계산하되, 상기 제 1 문서의 가중치는 상기 제 1 문서에 대해 발생하는 사용자의 액션의 시간적 순서에 비례하는 단계와; The method comprising: according to the user action is performed on the article, but calculate the weight of the first article, the weight of the first article relative to the time sequence of user actions that occur for the first document and;
    상기 계산된 제 1 문서의 가중치와 제 1 키워드와의 제 1 적합도를 계산하는 단계; The method comprising the calculated weight of the first document and calculating a first fit with the first keyword;
    상기 제 1 키워드에 의해 질의가 발생하는 경우, 상기 제 1 키워드와 제 2 적합도를 가지는 제 2 문서에서, 상기 제 1 적합도 및 상기 제 2 적합도의 크기에 따라 상기 제 1 문서 및 상기 제 2 문서를 정렬하는 단계를 포함하는, 문서 랭킹 부여방법. If a query by the first keyword generated, the second document having the first keyword and the second fit, the first fit and the first document and the second document based on the size of the second fit how, given the document ranking comprises alignment.
  14. 제 13항에 있어서, 14. The method of claim 13,
    상기 제 1 문서의 가중치는 상기 제 1 문서를 작성한 사용자의 랭킹에 비례하는 것을 특징으로 하는, 문서 랭킹 부여방법. Weight of the first document is how, given a document ranking, characterized in that in proportion to the rank of the user who created the first document.
  15. 제 13항에 있어서, 14. The method of claim 13,
    상기 제 1 문서의 가중치는 상기 제 1 문서를 읽은 사용자가 상기 제 1 문서를 북마크한 횟수 또는 답글을 추가하는 횟수에 비례하는 것을 특징으로 하는, 문서 랭킹 부여방법. Weight of the first document is how, given a document ranking, characterized in that in proportion to the number of times that the user read the first document added to the number of replies or bookmarked for the first document.
  16. 제 13항에 있어서, 14. The method of claim 13,
    상기 제 1 문서의 가중치는 상기 제 1 문서를 읽은 사용자의 수에 비례하는 것을 특징으로 하는, 문서 랭킹 부여방법. Weight of the first document is how, given a document ranking, characterized in that in proportion to the number of users who read the first document.
  17. 제 13항에 있어서, 14. The method of claim 13,
    상기 제 1 문서와 상기 제 2 문서가 동일한 내용을 포함하고, 상기 동일한 내용의 원 저자가 상기 제 1 문서인 경우, 상기 제 1 문서의 상기 제 1 키워드와의 적합도를 상기 제 2 문서의 적합도보다 높게 설정하는 단계를 더 포함하는, 문서 랭킹 부여방법. Said first article and said second article than the fit of the of the same information, and, if the original author of the same content of the first document, the first document, wherein the the fit of the first keyword second article in the further comprising the step of setting higher, given how the document ranking.
  18. 삭제 delete
  19. 제 1항 내지 제 17항 중의 어느 한 항의 방법을 수행할 수 있는 프로그램이 수록된 컴퓨터로 읽을 수 있는 기록 매체. Claim 1 to claim 17, a computer-readable recording medium a program capable of performing any one of the methods listed in the claims.
KR20060079176A 2006-08-22 2006-08-22 Document ranking granting method and computer readable record medium thereof KR100818553B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR20060079176A KR100818553B1 (en) 2006-08-22 2006-08-22 Document ranking granting method and computer readable record medium thereof

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20060079176A KR100818553B1 (en) 2006-08-22 2006-08-22 Document ranking granting method and computer readable record medium thereof
PCT/KR2007/003956 WO2008023904A1 (en) 2006-08-22 2007-08-20 Document ranking granting method and computer readable record medium thereof

Publications (2)

Publication Number Publication Date
KR20080017685A true KR20080017685A (en) 2008-02-27
KR100818553B1 true KR100818553B1 (en) 2008-04-01

Family

ID=39106964

Family Applications (1)

Application Number Title Priority Date Filing Date
KR20060079176A KR100818553B1 (en) 2006-08-22 2006-08-22 Document ranking granting method and computer readable record medium thereof

Country Status (2)

Country Link
KR (1) KR100818553B1 (en)
WO (1) WO2008023904A1 (en)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7606793B2 (en) 2004-09-27 2009-10-20 Microsoft Corporation System and method for scoping searches using index keys
KR100913905B1 (en) * 2007-04-12 2009-08-26 엔에이치엔비즈니스플랫폼 주식회사 Method and system for analyzing blog
US9348912B2 (en) 2007-10-18 2016-05-24 Microsoft Technology Licensing, Llc Document length as a static relevance feature for ranking search results
KR100952284B1 (en) * 2008-06-02 2010-04-12 엔에이치엔(주) Method and System for Providing Search Service Using Timeliness Query
WO2011025162A3 (en) * 2009-08-25 2011-04-21 Han Soung-Joo Method for searching for a list of entities belonging to a specific class
US8260789B2 (en) * 2010-04-01 2012-09-04 Microsoft Corporation System and method for authority value obtained by defining ranking functions related to weight and confidence value
KR101098871B1 (en) 2010-04-13 2011-12-26 건국대학교 산학협력단 Which can be read by the measuring device is content similarity, a method based on the feedback information of the user and rank program for executing the method records a computer recording medium
US9870424B2 (en) * 2011-02-10 2018-01-16 Microsoft Technology Licensing, Llc Social network based contextual ranking
US8954503B2 (en) * 2011-03-03 2015-02-10 Facebook, Inc. Identify experts and influencers in a social network
US9495462B2 (en) 2012-01-27 2016-11-15 Microsoft Technology Licensing, Llc Re-ranking search results

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000063442A (en) * 2000-07-12 2000-11-06 오경운 The system for concluding search ranking and the method for concluding search ranking thereof
KR20020007742A (en) * 2000-07-18 2002-01-29 김민욱 Methods of Information Recommendation based on Analysis of User's Information Preferences and Measurement of Information Popularity on the Internet and the System thereof
KR20040053369A (en) * 2001-11-26 2004-06-23 후지쯔 가부시끼가이샤 Information analysis method and apparatus
KR20050103997A (en) * 2004-04-27 2005-11-02 엔에이치엔(주) Method for managing on-line knowledge community and system for enabling the method

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7562068B2 (en) * 2004-06-30 2009-07-14 Microsoft Corporation System and method for ranking search results based on tracked user preferences

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000063442A (en) * 2000-07-12 2000-11-06 오경운 The system for concluding search ranking and the method for concluding search ranking thereof
KR20020007742A (en) * 2000-07-18 2002-01-29 김민욱 Methods of Information Recommendation based on Analysis of User's Information Preferences and Measurement of Information Popularity on the Internet and the System thereof
KR20040053369A (en) * 2001-11-26 2004-06-23 후지쯔 가부시끼가이샤 Information analysis method and apparatus
KR20050103997A (en) * 2004-04-27 2005-11-02 엔에이치엔(주) Method for managing on-line knowledge community and system for enabling the method

Also Published As

Publication number Publication date Type
WO2008023904A1 (en) 2008-02-28 application
KR20080017685A (en) 2008-02-27 application

Similar Documents

Publication Publication Date Title
Agichtein et al. Finding high-quality content in social media
Grossman et al. Information retrieval: Algorithms and heuristics
Cao et al. Adapting ranking SVM to document retrieval
Hawking et al. Measuring search engine quality
Rahman et al. Supervised models for coreference resolution
Voorhees et al. Building a question answering test collection
Huang et al. Learning deep structured semantic models for web search using clickthrough data
Soboroff et al. Overview of the TREC 2006 Enterprise Track.
Nenkova et al. A compositional context sensitive multi-document summarizer: exploring the factors that influence summarization
Lacerda et al. Learning to advertise
Lau et al. Automatic labelling of topic models
Rasolofo et al. Term proximity scoring for keyword-based retrieval systems
Adafre et al. Discovering missing links in Wikipedia
Hoffart et al. KORE: keyphrase overlap relatedness for entity disambiguation
Eirinaki et al. SEWeP: using site semantics and a taxonomy to enhance the Web personalization process
Li et al. User comments for news recommendation in forum-based social media
Surdeanu et al. Learning to rank answers on large online QA collections
Wang et al. Instance-based schema matching for web databases by domain-specific query probing
Fernández et al. Semantically enhanced information retrieval: An ontology-based approach
Sarawagi et al. Interactive deduplication using active learning
Turney et al. Measuring praise and criticism: Inference of semantic orientation from association
Zhu et al. Incorporating quality metrics in centralized/distributed information retrieval on the World Wide Web
Rao et al. Entity linking: Finding extracted entities in a knowledge base
Voorhees et al. Overview of the TREC 2003 Question Answering Track.
Deng et al. Formal models for expert finding on dblp bibliography data

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
N231 Notification of change of applicant
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130326

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20140317

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20150303

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20170307

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20180228

Year of fee payment: 11