KR20110112116A - Searching method and system based on topic - Google Patents

Searching method and system based on topic Download PDF

Info

Publication number
KR20110112116A
KR20110112116A KR1020100031541A KR20100031541A KR20110112116A KR 20110112116 A KR20110112116 A KR 20110112116A KR 1020100031541 A KR1020100031541 A KR 1020100031541A KR 20100031541 A KR20100031541 A KR 20100031541A KR 20110112116 A KR20110112116 A KR 20110112116A
Authority
KR
South Korea
Prior art keywords
documents
document
response index
representative
providing
Prior art date
Application number
KR1020100031541A
Other languages
Korean (ko)
Other versions
KR101544142B1 (en
Inventor
신중호
이해진
Original Assignee
엔에이치엔(주)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엔에이치엔(주) filed Critical 엔에이치엔(주)
Priority to KR1020100031541A priority Critical patent/KR101544142B1/en
Publication of KR20110112116A publication Critical patent/KR20110112116A/en
Application granted granted Critical
Publication of KR101544142B1 publication Critical patent/KR101544142B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9532Query formulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

화제도 기반의 검색 제공 방법 및 검색 시스템이 개시된다. 수집된 문서들에서 작성 시간이 설정된 문서들을 추출하고, 추출된 문서들의 반응 지수를 이용하여 대표 문서의 반응 지수를 결정하여 대표 문서와 반응 지수를 함께 제공할 수 있다. 그리고, 클러스터 별로 대표 문서들을 시간 순 또는 반응 지수 순으로 정렬하여 표시할 수 있다. Disclosed are a method and a search system based on a topic. From the collected documents, documents with a set time may be extracted, and the response index of the representative document may be determined using the response indexes of the extracted documents to provide the representative document and the response index together. In addition, the representative documents may be displayed by sorting in order of time or response index for each cluster.

Description

화제도 기반의 검색 제공 방법 및 시스템{SEARCHING METHOD AND SYSTEM BASED ON TOPIC}Search method and system based on fire system {SEARCHING METHOD AND SYSTEM BASED ON TOPIC}

화제도 기반의 검색 방법 및 검색 시스템이 개시된다. 특히, 인터넷 상에 존재하는 다양한 정보들 중에서 검색 키워드와 관련된 정보를 검색하여 제공하는 방법 및 검색 시스템이 개시된다.Disclosed is a search method and a search system based on a topic. In particular, a method and a search system for searching and providing information related to a search keyword among various information existing on the Internet are disclosed.

최근 들어, 인터넷이 발달하고 보편화됨에 따라, 많은 사람들이 인터넷을 이용하여 필요한 정보를 얻고 있다. In recent years, as the Internet is developed and popularized, many people are using the Internet to obtain necessary information.

더욱이, 인터넷을 이용함에 따라 국내뿐만 아니라 전 세계에 존재하는 다양한 종류의 정보들을 제공할 수 있게 되었다. 이에 따라, 더욱 많은 사람들은 이동의 불편함이 없고, 손쉽게 필요한 정보를 얻을 수 있다.Moreover, with the use of the Internet, it is possible to provide various kinds of information existing in the world as well as domestically. As a result, many more people do not have inconvenience in moving and can easily obtain necessary information.

한편, 많은 사용자가 인터넷을 이용함에 따라, 인터넷을 통해 제공되는 정보의 양도 점점 증가하고 있다. 이렇듯, 많은 양의 정보가 제공됨에 따라, 사용자들이 원하는 정보를 획득하기 위한 검색 시간이 점차 증가하고 있다. On the other hand, as many users use the Internet, the amount of information provided through the Internet is also increasing. As such, as a large amount of information is provided, a search time for acquiring information desired by users is gradually increasing.

이에 따라, 인터넷 상에 존재하는 많은 양의 정보들 중에서 사용자가 필요로 하는 정보들을 보다 정확하게 검색하여 제공할 수 있는 검색 제공 기술이 필요하다.Accordingly, there is a need for a search providing technology capable of more accurately searching and providing information required by a user among a large amount of information existing on the Internet.

본 발명은 사용자에게 보다 빠르고 손쉽게 검색 키워드와 관련된 정보들을 제공할 수 있는 검색 제공 방법 및 검색 시스템을 제공한다.The present invention provides a search providing method and a search system that can provide information related to a search keyword to a user more quickly and easily.

본 발명은 다양한 종류의 문서들 중에서 사용자가 필요로 하는 검색 키워드와 관련하여 정확한 정보를 제공할 수 있는 검색 제공 방법 및 검색 시스템을 제공한다.The present invention provides a search providing method and a search system capable of providing accurate information regarding a search keyword required by a user among various types of documents.

본 발명은 작성 시간이 설정된 문서들 중에서 검색된 문서들을 제공함에 따라 보다 정확한 정보를 사용자에게 제공할 수 있는 검색 제공 방법 및 검색 시스템을 제공한다. The present invention provides a search providing method and a retrieval system that can provide more accurate information to a user by providing documents retrieved from documents whose creation time is set.

본 발명은 시간 별 또는 반응 지수 별로 정렬된 문서들과 함께 문서의 반응 지수를 제공함으로써 사용자가 필요로 하는 문서를 획득하는데 소요되는 시간을 단축시킬 수 있는 검색 제공 방법 및 검색 시스템을 제공한다.The present invention provides a search providing method and a search system that can shorten the time required to obtain a document required by a user by providing a response index of a document together with documents sorted by time or response index.

본 발명의 일 실시예에 따른 검색 제공 방법은, 문서들에 대해 시간 별 정렬 옵션 및 반응 지수 별 정렬 옵션을 제공하는 단계, 상기 제공된 옵션에 따라 상기 문서들을 정렬하여 상기 옵션에 따라 정렬된 문서들에 대한 정보 및 상기 정렬된 문서들의 반응 지수에 대한 정보를 제공하는 단계를 포함할 수 있다.According to an aspect of the present invention, there is provided a method of providing a search, comprising: providing a sorting option by time and a sorting response index for documents, sorting the documents according to the provided options, and sorting the documents according to the options. Providing information about and information on the response index of the sorted documents.

이때, 상기 문서들은, 문서들의 작성 시간이 각각 설정된 문서들이 될 수 있다.In this case, the documents may be documents in which document creation times are set.

또한, 상기 문서들을 유사 문서 별로 클러스터링하는 단계, 및 상기 클러스터 별로 대표 문서를 결정하는 단계를 더 포함할 수 있다. 그러면, 상기 정보를 제공하는 단계는, 상기 결정된 대표 문서들을 상기 옵션에 따라 정렬하고, 정렬된 문서들에 대한 정보를 제공할 수 있다.The method may further include clustering the documents by the similar documents, and determining the representative document by the clusters. The providing of the information may then align the determined representative documents according to the option, and provide information on the sorted documents.

이때, 상기 반응 지수는, 상기 문서의 꼬리 글(comment)의 개수, 북마크 수, 상기 문서의 인용 횟수, 및 상기 문서의 평점 중 적어도 하나를 이용하여 획득될 수 있다.In this case, the response index may be obtained using at least one of the number of comments, the number of bookmarks, the number of citations of the document, and the rating of the document.

또한, 상기 정보를 제공하는 단계는, 상기 정렬된 문서들에 대한 정보 및 상기 정렬된 문서들의 반응 지수에 대한 정보를 웹 페이지 형태로 제공할 수 있다. 이때, 상기 웹 페이지에 기초하여 상기 정렬된 문서들 및 상기 정렬된 문서들의 반응 지수는 함께 표시될 수 있다.In addition, the providing of the information may provide information on the sorted documents and information on the response index of the sorted documents in the form of a web page. In this case, the sorted documents and the response index of the sorted documents may be displayed together based on the web page.

또한, 본 발명의 일 실시예에 따른 검색 시스템은, 시간 별 정렬 옵션 및 반응 지수 별 정렬 옵션에 따라 문서들을 정렬하는 정렬부, 및 상기 정렬된 문서들에 대한 정보 및 상기 정렬된 문서들의 반응 지수에 대한 정보를 제공하는 정보 제공부를 포함할 수 있다. In addition, the search system according to an embodiment of the present invention, the sorting unit for sorting the documents according to the sorting options by time and the sorting response index, and information about the sorted documents and the response index of the sorted documents It may include an information providing unit for providing information about.

또한, 상기 문서들을 유사 문서 별로 클러스터링하고, 상기 클러스터 별로 대표 문서를 결정하는 검색부를 더 포함할 수 있다. 그러면, 상기 정렬부는, 상기 결정된 대표 문서들을 상기 옵션에 따라 정렬할 수 있다.The apparatus may further include a searcher configured to cluster the documents by the similar documents and determine the representative document by the clusters. Then, the sorting unit may sort the determined representative documents according to the option.

또한, 상기 결정된 대표 문서의 반응 지수를 계산하는 반응 지수 계산부를 더 포함할 수 있다. 그러면, 상기 정보 제공부는, 상기 계산된 대표 문서의 반응 지수에 대한 정보를 제공할 수 있다.The apparatus may further include a response index calculator for calculating a response index of the determined representative document. Then, the information providing unit may provide information about the response index of the calculated representative document.

본 발명의 일실시예에 따르면, 사용자에게 보다 빠르고 손쉽게 검색 키워드와 관련된 정보들을 제공할 수 있다.According to an embodiment of the present invention, information related to a search keyword can be provided to a user more quickly and easily.

본 발명의 일실시예에 따르면, 다양한 종류의 문서들 중에서 사용자가 필요로 하는 검색 키워드와 관련하여 정확한 정보를 제공할 수 있다.According to an embodiment of the present invention, accurate information may be provided in relation to a search keyword required by a user among various types of documents.

본 발명의 일실시예에 따르면, 작성 시간이 설정된 문서들 중에서 검색된 문서들을 제공함에 따라 보다 정확한 정보를 사용자에게 제공할 수 있다.According to an embodiment of the present invention, more accurate information may be provided to the user by providing documents searched among documents whose creation time is set.

본 발명의 일실시예에 따르면, 시간 별 또는 반응 지수 별로 정렬된 문서들과 함께 문서의 반응 지수를 제공함으로써 사용자가 필요로 하는 문서를 획득하는데 소요되는 시간을 단축시킬 수 있다.According to one embodiment of the present invention, by providing the response index of the document together with the documents sorted by time or by the response index, it is possible to shorten the time required to obtain a document required by the user.

도 1은 화제도 기반의 검색을 제공하는 검색 시스템의 구성을 도시한 도면이다.
도 2는 화제도 기반의 검색 제공 방법을 설명하기 위해 제공되는 흐름도이다.
도 3 내지 도 6은 화제도 기반의 검색 제공 방법을 이용하여 표시되는 화면을 도시한 도면이다.
1 is a diagram illustrating a configuration of a search system that provides a conversation based search.
2 is a flowchart provided to explain a topic-based search providing method.
3 to 6 are diagrams illustrating a screen displayed by using a topic-based search providing method.

이하에서는 첨부된 도면을 참조하여, 본 발명의 실시예를 설명하기로 한다.Hereinafter, with reference to the accompanying drawings, it will be described an embodiment of the present invention.

도 1은 화제도 기반의 검색을 제공하는 검색 시스템의 구성을 도시한 도면이다. 그리고, 도 2는 화제도 기반의 검색 제공 방법을 설명하기 위해 제공되는 흐름도이다.1 is a diagram illustrating a configuration of a search system that provides a conversation based search. 2 is a flowchart provided to explain a topic-based search providing method.

도 1을 참조하면, 검색 시스템(100)은 문서 수집부(110), 검색부(120), 반응지수 계산부(130), 정렬부(140), 및 정보 제공부(150)를 포함할 수 있다. Referring to FIG. 1, the search system 100 may include a document collector 110, a searcher 120, a response index calculator 130, an alignment unit 140, and an information provider 150. have.

도 1 및 도 2를 참조하면, 먼저, 검색부(120)는 수집된 문서들 중에서 작성 시간이 설정된 문서들을 추출할 수 있다(210). 1 and 2, first, the searcher 120 may extract documents in which a creation time is set from the collected documents (210).

이때, 문서 수집부(110)는 웹 크롤러를 이용하여 사진, 글(article), 웹 사이트 주소 등과 같이 다양한 종류의 문서들을 수집할 수 있다. 그러면, 검색부(120)는 수집된 문서들 중에서 작성 시간이 설정된 문서들을 추출할 수 있다.In this case, the document collecting unit 110 may collect various types of documents such as a photo, an article, a web site address, and the like by using a web crawler. Then, the search unit 120 may extract the documents whose creation time is set from the collected documents.

일례로, 검색부(120)는 수집된 문서들 중에서 신문 기사, 게시 글, 블로그 글, 트위터 글 등과 같이 작성 시간이 명확한 글로 구성된 문서들을 추출할 수 있다. 이때, 문서의 작성 시간이 명확한 경우, 글로 구성된 문서들은 텍스트뿐만 아니라 이미지, 웹 사이트 주소를 포함할 수도 있다. For example, the searcher 120 may extract documents including clear articles, such as newspaper articles, posts, blog posts, and Twitter posts, from the collected documents. In this case, when the writing time of the document is clear, the documents composed of the text may include not only text but also an image and a web site address.

이어, 검색부(120)는 추출된 문서들을 비교하여 동일한 문서이거나, 혹은 문서의 내용이 유사한 문서들 별로 추출된 문서들을 클러스터링할 수 있다(220). 이때, 검색부(120)는 추출된 문서들을 대상으로, 문서들 간의 유사도가 기설정된 기준값 이상인 문서들을 유사 문서들로 결정할 수 있다.Subsequently, the searcher 120 may compare the extracted documents and cluster the extracted documents for each document that is the same document or the contents of the document are similar to each other (220). In this case, the searcher 120 may determine, as target documents, similar documents among documents having similarity between documents.

일례로, 100개의 문서가 추출된 경우, 검색부(120)는 추출된 문서들 중 내용이 유사한 30개, 25개, 17개, 15개, 13개의 문서들 별로 동일한 클러스터에 속하도록 클러스터링 할 수 있다. 즉, 30개의 문서들이 제1 클러스터, 25개의 문서들이 제2 클러스터, 17개의 문서들이 제3 클러스터, 15개의 문서들이 제4 클러스터, 및 13개의 문서들이 제5 클러스터에 속할 수 있다.For example, when 100 documents are extracted, the searcher 120 may cluster 30, 25, 17, 15, and 13 documents having similar contents among the extracted documents so that they belong to the same cluster. have. That is, 30 documents may belong to the first cluster, 25 documents to the second cluster, 17 documents to the third cluster, 15 documents to the fourth cluster, and 13 documents to the fifth cluster.

그리고, 검색부(120)는 클러스터에 속하는 문서들을 이용하여 클러스터 별로 대표 문서를 결정할 수 있다(230).The search unit 120 may determine the representative document for each cluster by using the documents belonging to the cluster (230).

일례로, 검색부(120)는 클러스터에 속하는 문서들 중에서 반응 지수가 가장 높은 문서를 대표 문서로 결정할 수 있다. For example, the searcher 120 may determine a document having the highest response index among documents belonging to the cluster as the representative document.

이때, 반응 지수는 해당 문서에 대한 꼬리 글(comment)의 개수, 각종 북마크 사이트들에서 해당 문서가 북마크된 횟수, 해당 문서를 다른 문서에서 인용한 횟수, 및 해당 문서의 평점 중 적어도 하나를 포함할 수 있다. 여기서, 해당 문서의 평점은, 다양한 레뷰 사이트들에서 추천된 횟수, 또는 평가값을 포함할 수 있다.In this case, the response index may include at least one of the number of comments on the document, the number of bookmarks of the document in various bookmark sites, the number of times the document is cited in another document, and the rating of the document. Can be. Here, the rating of the document may include a number of times recommended in various review sites or an evaluation value.

다른 예로, 검색부(120)는 클러스터에 속하는 문서들 중에서 검색 키워드와 관련도가 높은 문서를 대표 문서로 결정할 수도 있다. 여기서, 검색 키워드와 관련도가 높은 문서는 클러스터에 속하는 문서들 중에서 다른 단말에 의해 클릭된 횟수가 많은 문서가 될 수 있다. 즉, 클러스터에 속하는 문서들 중에서 다른 단말에 의해 클릭된 횟수가 많은 문서가 대표 문서로 결정될 수 있다.As another example, the search unit 120 may determine a document that is highly related to a search keyword among the documents belonging to the cluster as the representative document. Here, the document having a high relation with the search keyword may be a document having a large number of clicks by other terminals among documents belonging to the cluster. That is, a document having a large number of clicks by another terminal among documents belonging to the cluster may be determined as the representative document.

이어, 반응 지수 계산부(130)는 클러스터 별로 결정된 대표 문서의 반응 지수를 계산할 수 있다(240).Subsequently, the response index calculator 130 may calculate a response index of the representative document determined for each cluster (240).

이때, 반응 지수 계산부(130)는 클러스터에 속하는 문서들 각각의 반응 지수의 합으로써 대표 문서의 반응 지수를 계산할 수 있다. 일례로, 클러스터에 10개의 문서들이 속하고, 10개 문서의 반응 지수가 1 내지 10 각각에 해당하는 경우, 반응 지수 계산부(130)는 대표 문서의 반응 지수를 1부터 10의 합인 55로 계산할 수 있다. 동일한 방법으로, 반응 지수 계산부(130)는 복수의 클러스터에 속하는 대표 문서들의 반응 지수를 각각 계산할 수 있다.In this case, the response index calculator 130 may calculate the response index of the representative document as the sum of the response indexes of the documents belonging to the cluster. For example, when 10 documents belong to a cluster, and the response index of 10 documents corresponds to 1 to 10, the response index calculator 130 may calculate the response index of the representative document as 55, which is a sum of 1 to 10. Can be. In the same manner, the response index calculator 130 may calculate response indexes of representative documents belonging to a plurality of clusters, respectively.

그리고, 정렬부(140)는 결정된 대표 문서들을 옵션에 따라 정렬할 수 있다(250). 여기서, 옵션은 시간 별 정렬 옵션 및 반응 지수 별 정렬 옵션을 포함할 수 있다. 이때, 옵션은 기설정되거나, 또는 시간 별 정렬 옵션과 반응 지수 별 정렬 옵션 중 어느 하나를 사용자로부터 입력받을 수도 있다.In addition, the alignment unit 140 may arrange the determined representative documents according to an option (250). Here, the options may include a sorting option by time and a sorting option by response index. In this case, the option may be preset, or one of the sorting option by time and the sorting option by response index may be input from the user.

일례로, 도 3과 같이, 시간 별 정렬 옵션이 이용되는 경우, 정렬부(140)는 대표 문서들을 대표 문서의 작성된 시간 순서로 정렬할 수 있다.For example, as illustrated in FIG. 3, when the time-based sorting option is used, the sorting unit 140 may sort the representative documents in the order of the created time of the representative document.

이어, 정보 제공부(150)는 정렬된 대표 문서들에 대한 정보와 대표 문서들의 반응 지수에 대한 정보를 함께 단말에 제공할 수 있다. 이때, 정보 제공부(150)는 정렬된 대표 문서들의 작성 시간에 대한 정보도 단말에 제공할 수도 있다. 그러면, 단말에는 정렬된 대표 문서들, 대표 문서들의 반응 지수, 및 작성 시간이 함께 표시될 수 있다(260).Subsequently, the information providing unit 150 may provide the terminal with information about the arranged representative documents and information about the response index of the representative documents. In this case, the information providing unit 150 may also provide the terminal with information on the preparation time of the arranged representative documents. Then, the terminal may display the sorted representative documents, the response index of the representative documents, and the creation time together (260).

일례로, 정보 제공부(150)는 정렬된 대표 문서들의 링크 정보 및 반응 지수를 포함하는 웹 페이지를 단말에 제공할 수 있다. 그러면, 단말은 웹 페이지를 기초로 정렬된 대표 문서들 및 대표 문서들의 반응 지수를 함께 표시할 수 있다. For example, the information provider 150 may provide a terminal with a web page including link information and response indexes of representative representative documents. Then, the terminal may display the response documents of the representative documents and the representative documents arranged based on the web page.

이때, 대표 문서의 반응 지수는 시각화하여 표시될 수 있다. 일례로, 도 3과 같이, 대표 문서의 반응 지수(310)는 수치로 표시될 수도 있고, 별 모양 등의 특수 문자의 개수, 반응 지수의 높낮이에 따라 구분된 컬러, 또는 그라데이션 그래프로 표시될 수도 있다.In this case, the response index of the representative document may be visualized and displayed. For example, as shown in FIG. 3, the response index 310 of the representative document may be displayed numerically, or may be displayed in a color or a gradient graph divided according to the number of special characters such as a star shape, the height of the response index, and the like. have.

한편, 반응 지수 별 정렬 옵션이 이용되는 경우, 정렬부(140)는 대표 문서들을 대표 문서의 반응 지수 순서로 정렬할 수 있다. 그러면, 시간 별 정렬 옵션이 이용되는 경우와 마찬가지로, 반응 지수 순으로 정렬된 대표 문서들, 대표 문서의 반응 지수, 및 작성 시간이 함께 단말에 표시될 수 있다. On the other hand, when the response index sorting option is used, the alignment unit 140 may sort the representative documents in the response index order of the representative document. Then, as in the case where the time-based sorting option is used, the representative documents arranged in response index order, the response index of the representative document, and the creation time may be displayed together on the terminal.

이때, 표시된 대표 문서들 중에서 단말에 의해 문서가 선택된 경우, 정보 제공부(150)는 선택된 대표 문서의 클러스터에 속하는 문서들에 대한 정보를 웹 페이지 형태로 단말로 제공할 수 있다. 그러면, 단말에는 선택된 대표 문서의 클러스터에 속하는 문서들이 표시될 수 있다. In this case, when a document is selected by the terminal among the displayed representative documents, the information providing unit 150 may provide the terminal with information about documents belonging to the cluster of the selected representative document in the form of a web page. Then, documents belonging to the cluster of the selected representative document may be displayed on the terminal.

일례로, 도 4와 같이, 반응 지수가 43인 4번째 대표 문서가 선택된 경우, 뉴스, 블로그, 게시판에 관계없이 선택된 4번째 대표 문서의 클러스터에 속하는 문서들이 표시(410)될 수 있다. For example, as illustrated in FIG. 4, when a fourth representative document having a response index of 43 is selected, documents belonging to the cluster of the fourth representative document selected regardless of news, blogs, and bulletin boards may be displayed 410.

이때, 4번째 대표 문서의 클러스터에 속하는 문서들의 개수가 기설정된 임계값 이상인 경우, 정보 제공부(150)는 스크롤을 제공할 수도 있다. 그러면, 단말에는 스크롤을 이용하여 대표 문서의 클러스터에 속하는 모든 문서들이 표시될 수 있다.In this case, when the number of documents belonging to the cluster of the fourth representative document is equal to or greater than a predetermined threshold value, the information provider 150 may provide scrolling. Then, the terminal may display all documents belonging to the cluster of the representative document by using the scroll.

다른 예로, 정보 제공부(150)는 도 5와 같이, 선택된 4번째 대표 문서의 클러스터에 속하는 문서들 중에서 뉴스 기사에 해당하는 문서들 만을 웹 페이지 형태로 단말로 제공할 수도 있다. 그러면, 단말에는 선택된 4번째 대표 문서의 클러스터에 속하는 문서들 중에서 뉴스 기사에 해당하는 문서들 만이 표시(510)될 수 있다.As another example, as illustrated in FIG. 5, the information providing unit 150 may provide only the documents corresponding to the news article among the documents belonging to the selected fourth representative document cluster to the terminal in the form of a web page. Then, only documents corresponding to the news article among the documents belonging to the selected fourth representative document cluster may be displayed on the terminal.

한편, 정렬된 대표 문서들의 상세 보기 옵션이 선택된 경우, 정보 제공부(150)는 대표 문서들 각각의 상세 정보를 웹 페이지 형태로 제공할 수도 있다. 그러면, 도 6과 같이, 단말에는 대표 문서들 각각의 상세 정보가 표시될 수 있다. Meanwhile, when the detailed view option of the arranged representative documents is selected, the information provider 150 may provide detailed information of each representative document in the form of a web page. Then, as illustrated in FIG. 6, detailed information of each representative document may be displayed on the terminal.

이상에서는, 대표 문서들을 시간 순서 또는 반응 지수 순으로 정렬하는 것으로 설명하였으나, 이는 실시예에 해당되며, 검색 시스템(100)은 대표 문서들을 시간 순서 및 반응 지수를 모두 이용하여 정렬할 수도 있다.In the above description, the representative documents are sorted in order of time or response index. However, this is an exemplary embodiment, and the search system 100 may sort the representative documents using both the time order and the response index.

일례로, 검색 시스템(100)은 대표 문서들 중에서 작성 시간이 기설정된 기준 시간 이내에 해당하는 문서들을 추출하고, 추출된 대표 문서들을 반응 지수가 높은 순서로 정렬할 수도 있다. 즉, 대표 문서들 중에서 최근에 작성된 대표 문서들을 반응 지수가 높은 순서로 정렬할 수 있다.For example, the search system 100 may extract documents corresponding to a creation time within a predetermined reference time from among the representative documents, and sort the extracted representative documents in order of high response index. That is, the representative documents recently created among the representative documents may be sorted in ascending order of response index.

또한, 본 발명의 실시예들에 따른 촬영 장치 및 방법은 다양한 컴퓨터로 구현되는 동작을 수행하기 위한 프로그램 명령을 포함하는 컴퓨터 판독 가능 매체를 포함한다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.In addition, the imaging apparatus and method according to the embodiments of the present invention includes a computer readable medium including program instructions for performing operations implemented by various computers. The computer readable medium may include program instructions, data files, data structures, etc. alone or in combination. The media may be program instructions that are specially designed and constructed for the present invention or may be available to those skilled in the art of computer software. Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks, and magnetic tape, optical media such as CD-ROMs, DVDs, and magnetic disks, such as floppy disks. Magneto-optical media, and hardware devices specifically configured to store and execute program instructions, such as ROM, RAM, flash memory, and the like. Examples of program instructions include not only machine code generated by a compiler, but also high-level language code that can be executed by a computer using an interpreter or the like. The hardware device described above may be configured to operate as one or more software modules to perform the operations of the present invention, and vice versa.

이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.As described above, the present invention has been described by way of limited embodiments and drawings, but the present invention is not limited to the above embodiments, and those skilled in the art to which the present invention pertains various modifications and variations from such descriptions. This is possible.

그러므로, 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다. Therefore, the scope of the present invention should not be limited to the described embodiments, but should be determined not only by the claims below but also by the equivalents of the claims.

110: 문서 수집부
120: 검색부
130: 반응 지수 계산부
140: 정렬부
150: 정보 제공부
110: document collection unit
120: search unit
130: response index calculation unit
140: alignment unit
150: information provider

Claims (17)

문서들에 대해 시간 별 정렬 옵션 및 반응 지수 별 정렬 옵션을 제공하는 단계;
상기 옵션에 따라 정렬된 문서들에 대한 정보 및 상기 정렬된 문서들의 반응 지수에 대한 정보를 제공하는 단계
를 포함하는 검색 제공 방법.
Providing a sort by time option and a sort by response index for documents;
Providing information about the documents sorted according to the option and the response index of the sorted documents
Search providing method comprising a.
제1항에 있어서,
상기 문서들은, 문서들의 작성 시간이 각각 설정된 문서들인 것을 특징으로 하는 검색 제공 방법.
The method of claim 1,
And the documents are documents in which document creation times are set.
제1항에 있어서,
상기 문서들을 유사 문서 별로 클러스터링하는 단계; 및
상기 클러스터 별로 대표 문서를 결정하는 단계
를 더 포함하고,
상기 정보를 제공하는 단계는,
상기 결정된 대표 문서들을 상기 옵션에 따라 정렬하고, 정렬된 문서들에 대한 정보를 제공하는 검색 제공 방법.
The method of claim 1,
Clustering the documents by similar documents; And
Determining a representative document for each cluster
Further comprising:
Providing the information,
And sorting the determined representative documents according to the option and providing information on the sorted documents.
제3항에 있어서,
상기 대표 문서를 결정하는 단계는,
상기 클러스터에 속한 문서들 중에서 반응 지수가 가장 높은 문서를 상기 대표 문서로 결정하는 검색 제공 방법.
The method of claim 3,
Determining the representative document,
The search providing method of determining, as the representative document, a document having the highest response index among documents belonging to the cluster.
제3항에 있어서,
상기 대표 문서를 결정하는 단계는,
상기 클러스터에 속한 문서들 중에서 검색 키워드와 관련도가 가장 높은 문서를 상기 대표 문서로 결정하는 검색 제공 방법.
The method of claim 3,
Determining the representative document,
A search providing method of determining, as the representative document, a document most relevant to a search keyword among documents belonging to the cluster.
제3항에 있어서,
상기 결정된 대표 문서의 반응 지수를 계산하는 단계
를 더 포함하고,
상기 정보를 제공하는 단계는,
상기 결정된 대표 문서의 반응 지수에 대한 정보를 제공하는 검색 제공 방법.
The method of claim 3,
Calculating a response index of the determined representative document
Further comprising:
Providing the information,
The search providing method of providing information on the response index of the determined representative document.
제6항에 있어서,
상기 계산하는 단계는,
상기 클러스터에 속한 문서들 각각의 반응 지수의 합을 상기 클러스터에 속한 대표 문서의 반응 지수로 계산하는 검색 제공 방법.
The method of claim 6,
The calculating step,
The search providing method of calculating the sum of the response index of each document belonging to the cluster as the response index of the representative document belonging to the cluster.
제1항에 있어서,
상기 반응 지수는, 상기 문서의 꼬리 글(comment)의 개수, 북마크 수, 상기 문서의 인용 횟수, 및 상기 문서의 평점 중 적어도 하나를 이용하여 획득되는 검색 제공 방법.
The method of claim 1,
And the response index is obtained using at least one of the number of comments of the document, the number of bookmarks, the number of citations of the document, and the rating of the document.
제1항에 있어서,
상기 정보를 제공하는 단계는,
상기 정렬된 문서들에 대한 정보 및 상기 정렬된 문서들의 반응 지수에 대한 정보를 웹 페이지 형태로 제공하고,
상기 웹 페이지에 기초하여 상기 정렬된 문서들 및 상기 정렬된 문서들의 반응 지수는 함께 표시되는 검색 제공 방법.
The method of claim 1,
Providing the information,
Providing information about the sorted documents and the response index of the sorted documents in the form of a web page,
And a response index of the sorted documents and the sorted documents based on the web page is displayed together.
시간 별 정렬 옵션 및 반응 지수 별 정렬 옵션에 따라 문서들을 정렬하는 정렬부; 및
상기 정렬된 문서들에 대한 정보 및 상기 정렬된 문서들의 반응 지수에 대한 정보를 제공하는 정보 제공부
를 포함하는 검색 시스템.
An alignment unit for sorting documents according to a sorting by time option and a sorting by response index; And
Information providing unit for providing information on the sorted documents and the response index of the sorted documents
Search system comprising a.
제10항에 있어서,
상기 문서들은, 문서들의 작성 시간이 각각 설정된 문서들인 것을 특징으로 하는 검색 시스템.
The method of claim 10,
And the documents are documents in which document creation times are set.
제10항에 있어서,
상기 문서들을 유사 문서 별로 클러스터링하고, 상기 클러스터 별로 대표 문서를 결정하는 검색부
를 더 포함하고,
상기 정렬부는,
상기 결정된 대표 문서들을 상기 옵션에 따라 정렬하는 검색 시스템.
The method of claim 10,
A searcher for clustering the documents by similar documents and determining a representative document for each cluster
Further comprising:
The alignment unit,
And sort the determined representative documents according to the option.
제12항에 있어서,
상기 검색부는,
상기 클러스터에 속한 문서들 중에서 반응 지수가 가장 높은 문서를 상기 대표 문서로 결정하는 검색 시스템.
The method of claim 12,
The search unit,
And a document having the highest response index among documents belonging to the cluster as the representative document.
제12항에 있어서,
상기 검색부는,
상기 클러스터에 속한 문서들 중에서 검색 키워드와 관련도가 가장 높은 문서를 상기 대표 문서로 결정하는 검색 시스템.
The method of claim 12,
The search unit,
A search system for determining a document that is most relevant to a search keyword among the documents in the cluster as the representative document.
제12항에 있어서,
상기 결정된 대표 문서의 반응 지수를 계산하는 반응 지수 계산부
를 더 포함하고,
상기 정보 제공부는,
상기 계산된 대표 문서의 반응 지수에 대한 정보를 제공하는 검색 시스템.
The method of claim 12,
Response index calculation unit for calculating the response index of the determined representative document
Further comprising:
The information providing unit,
A search system for providing information on the response index of the calculated representative document.
제15항에 있어서,
상기 반응 지수 계산부는,
상기 클러스터에 속한 문서들 각각의 반응 지수의 합을 상기 클러스터에 속한 대표 문서의 반응 지수로 계산하는 검색 시스템.
16. The method of claim 15,
The reaction index calculation unit,
And a sum of the response indices of the documents belonging to the cluster as the response indices of the representative documents in the cluster.
제15항에 있어서,
상기 정보 제공부는,
상기 정렬된 문서들에 대한 정보 및 상기 정렬된 문서들의 반응 지수에 대한 정보를 웹 페이지 형태로 제공하고,
상기 웹 페이지에 기초하여 상기 정렬된 문서들 및 상기 정렬된 문서들의 반응 지수는 함께 표시되는 검색 시스템.
16. The method of claim 15,
The information providing unit,
Providing information about the sorted documents and the response index of the sorted documents in the form of a web page,
And the response index of the sorted documents and the sorted documents is displayed together based on the web page.
KR1020100031541A 2010-04-06 2010-04-06 Searching method and system based on topic KR101544142B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020100031541A KR101544142B1 (en) 2010-04-06 2010-04-06 Searching method and system based on topic

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020100031541A KR101544142B1 (en) 2010-04-06 2010-04-06 Searching method and system based on topic

Publications (2)

Publication Number Publication Date
KR20110112116A true KR20110112116A (en) 2011-10-12
KR101544142B1 KR101544142B1 (en) 2015-08-17

Family

ID=45028019

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100031541A KR101544142B1 (en) 2010-04-06 2010-04-06 Searching method and system based on topic

Country Status (1)

Country Link
KR (1) KR101544142B1 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190132904A (en) * 2018-05-21 2019-11-29 네이버 주식회사 Ai headline news
US11144783B2 (en) 2018-05-21 2021-10-12 Naver Corporation Servers, non-transitory computer-readable media and methods for providing articles
KR102580460B1 (en) * 2023-01-26 2023-09-21 농업협동조합중앙회 Server for providing news based on keyword and method thereof

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100645614B1 (en) * 2005-07-15 2006-11-14 (주)첫눈 Search method and apparatus considering a worth of information

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190132904A (en) * 2018-05-21 2019-11-29 네이버 주식회사 Ai headline news
US11144783B2 (en) 2018-05-21 2021-10-12 Naver Corporation Servers, non-transitory computer-readable media and methods for providing articles
KR102580460B1 (en) * 2023-01-26 2023-09-21 농업협동조합중앙회 Server for providing news based on keyword and method thereof

Also Published As

Publication number Publication date
KR101544142B1 (en) 2015-08-17

Similar Documents

Publication Publication Date Title
US9659067B2 (en) Providing a search results document that includes a user interface for performing an action in connection with a web page identified in the search results document
CN109074383B (en) Document search with visualization within the context of a document
CN107122400B (en) Method, computing system and storage medium for refining query results using visual cues
CN102609474B (en) A kind of visit information supplying method and system
US20130054672A1 (en) Systems and methods for contextualizing a toolbar
US20150081681A1 (en) Method and apparatus for classifying and comparing similar documents using base templates
US20150113388A1 (en) Method and apparatus for performing topic-relevance highlighting of electronic text
JP4896268B2 (en) Information retrieval method and apparatus reflecting information value
JP5989170B2 (en) Search result ranking apparatus and method using reliability of representative
CN103593378A (en) Terminal and method for determining type of input method editor
JP2010536086A (en) User-centric information search method and system
CN104142990A (en) Search method and device
CN103678325A (en) Method and device for providing browsing page corresponding to initial page
KR102206001B1 (en) Apparatus and method for recommending e-books based on user behavior
CN103365879A (en) Method and device for obtaining page similarity
KR20160002199A (en) Issue data extracting method and system using relevant keyword
KR101544142B1 (en) Searching method and system based on topic
KR100913049B1 (en) Method and system for providing positive / negative search result using user preference
CN103942233B (en) The lobby page recognition methods of directory type web and device
TW201241775A (en) Advertisement management device, advertisement selection device, advertisement management method, advertisement management program and storage medium storing advertisement management program
CN104462151A (en) Method for evaluating web page publishing time and related device
Alcic et al. Measuring performance of web image context extraction
KR101347884B1 (en) Method and system for providing relevance site using chracteristic word of site
US20160124946A1 (en) Managing a set of data
KR101614551B1 (en) System and method for extracting keyword using category matching

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20190701

Year of fee payment: 5