KR20110112116A - Searching method and system based on topic - Google Patents
Searching method and system based on topic Download PDFInfo
- Publication number
- KR20110112116A KR20110112116A KR1020100031541A KR20100031541A KR20110112116A KR 20110112116 A KR20110112116 A KR 20110112116A KR 1020100031541 A KR1020100031541 A KR 1020100031541A KR 20100031541 A KR20100031541 A KR 20100031541A KR 20110112116 A KR20110112116 A KR 20110112116A
- Authority
- KR
- South Korea
- Prior art keywords
- documents
- document
- response index
- representative
- providing
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9538—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9532—Query formulation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
화제도 기반의 검색 제공 방법 및 검색 시스템이 개시된다. 수집된 문서들에서 작성 시간이 설정된 문서들을 추출하고, 추출된 문서들의 반응 지수를 이용하여 대표 문서의 반응 지수를 결정하여 대표 문서와 반응 지수를 함께 제공할 수 있다. 그리고, 클러스터 별로 대표 문서들을 시간 순 또는 반응 지수 순으로 정렬하여 표시할 수 있다. Disclosed are a method and a search system based on a topic. From the collected documents, documents with a set time may be extracted, and the response index of the representative document may be determined using the response indexes of the extracted documents to provide the representative document and the response index together. In addition, the representative documents may be displayed by sorting in order of time or response index for each cluster.
Description
화제도 기반의 검색 방법 및 검색 시스템이 개시된다. 특히, 인터넷 상에 존재하는 다양한 정보들 중에서 검색 키워드와 관련된 정보를 검색하여 제공하는 방법 및 검색 시스템이 개시된다.Disclosed is a search method and a search system based on a topic. In particular, a method and a search system for searching and providing information related to a search keyword among various information existing on the Internet are disclosed.
최근 들어, 인터넷이 발달하고 보편화됨에 따라, 많은 사람들이 인터넷을 이용하여 필요한 정보를 얻고 있다. In recent years, as the Internet is developed and popularized, many people are using the Internet to obtain necessary information.
더욱이, 인터넷을 이용함에 따라 국내뿐만 아니라 전 세계에 존재하는 다양한 종류의 정보들을 제공할 수 있게 되었다. 이에 따라, 더욱 많은 사람들은 이동의 불편함이 없고, 손쉽게 필요한 정보를 얻을 수 있다.Moreover, with the use of the Internet, it is possible to provide various kinds of information existing in the world as well as domestically. As a result, many more people do not have inconvenience in moving and can easily obtain necessary information.
한편, 많은 사용자가 인터넷을 이용함에 따라, 인터넷을 통해 제공되는 정보의 양도 점점 증가하고 있다. 이렇듯, 많은 양의 정보가 제공됨에 따라, 사용자들이 원하는 정보를 획득하기 위한 검색 시간이 점차 증가하고 있다. On the other hand, as many users use the Internet, the amount of information provided through the Internet is also increasing. As such, as a large amount of information is provided, a search time for acquiring information desired by users is gradually increasing.
이에 따라, 인터넷 상에 존재하는 많은 양의 정보들 중에서 사용자가 필요로 하는 정보들을 보다 정확하게 검색하여 제공할 수 있는 검색 제공 기술이 필요하다.Accordingly, there is a need for a search providing technology capable of more accurately searching and providing information required by a user among a large amount of information existing on the Internet.
본 발명은 사용자에게 보다 빠르고 손쉽게 검색 키워드와 관련된 정보들을 제공할 수 있는 검색 제공 방법 및 검색 시스템을 제공한다.The present invention provides a search providing method and a search system that can provide information related to a search keyword to a user more quickly and easily.
본 발명은 다양한 종류의 문서들 중에서 사용자가 필요로 하는 검색 키워드와 관련하여 정확한 정보를 제공할 수 있는 검색 제공 방법 및 검색 시스템을 제공한다.The present invention provides a search providing method and a search system capable of providing accurate information regarding a search keyword required by a user among various types of documents.
본 발명은 작성 시간이 설정된 문서들 중에서 검색된 문서들을 제공함에 따라 보다 정확한 정보를 사용자에게 제공할 수 있는 검색 제공 방법 및 검색 시스템을 제공한다. The present invention provides a search providing method and a retrieval system that can provide more accurate information to a user by providing documents retrieved from documents whose creation time is set.
본 발명은 시간 별 또는 반응 지수 별로 정렬된 문서들과 함께 문서의 반응 지수를 제공함으로써 사용자가 필요로 하는 문서를 획득하는데 소요되는 시간을 단축시킬 수 있는 검색 제공 방법 및 검색 시스템을 제공한다.The present invention provides a search providing method and a search system that can shorten the time required to obtain a document required by a user by providing a response index of a document together with documents sorted by time or response index.
본 발명의 일 실시예에 따른 검색 제공 방법은, 문서들에 대해 시간 별 정렬 옵션 및 반응 지수 별 정렬 옵션을 제공하는 단계, 상기 제공된 옵션에 따라 상기 문서들을 정렬하여 상기 옵션에 따라 정렬된 문서들에 대한 정보 및 상기 정렬된 문서들의 반응 지수에 대한 정보를 제공하는 단계를 포함할 수 있다.According to an aspect of the present invention, there is provided a method of providing a search, comprising: providing a sorting option by time and a sorting response index for documents, sorting the documents according to the provided options, and sorting the documents according to the options. Providing information about and information on the response index of the sorted documents.
이때, 상기 문서들은, 문서들의 작성 시간이 각각 설정된 문서들이 될 수 있다.In this case, the documents may be documents in which document creation times are set.
또한, 상기 문서들을 유사 문서 별로 클러스터링하는 단계, 및 상기 클러스터 별로 대표 문서를 결정하는 단계를 더 포함할 수 있다. 그러면, 상기 정보를 제공하는 단계는, 상기 결정된 대표 문서들을 상기 옵션에 따라 정렬하고, 정렬된 문서들에 대한 정보를 제공할 수 있다.The method may further include clustering the documents by the similar documents, and determining the representative document by the clusters. The providing of the information may then align the determined representative documents according to the option, and provide information on the sorted documents.
이때, 상기 반응 지수는, 상기 문서의 꼬리 글(comment)의 개수, 북마크 수, 상기 문서의 인용 횟수, 및 상기 문서의 평점 중 적어도 하나를 이용하여 획득될 수 있다.In this case, the response index may be obtained using at least one of the number of comments, the number of bookmarks, the number of citations of the document, and the rating of the document.
또한, 상기 정보를 제공하는 단계는, 상기 정렬된 문서들에 대한 정보 및 상기 정렬된 문서들의 반응 지수에 대한 정보를 웹 페이지 형태로 제공할 수 있다. 이때, 상기 웹 페이지에 기초하여 상기 정렬된 문서들 및 상기 정렬된 문서들의 반응 지수는 함께 표시될 수 있다.In addition, the providing of the information may provide information on the sorted documents and information on the response index of the sorted documents in the form of a web page. In this case, the sorted documents and the response index of the sorted documents may be displayed together based on the web page.
또한, 본 발명의 일 실시예에 따른 검색 시스템은, 시간 별 정렬 옵션 및 반응 지수 별 정렬 옵션에 따라 문서들을 정렬하는 정렬부, 및 상기 정렬된 문서들에 대한 정보 및 상기 정렬된 문서들의 반응 지수에 대한 정보를 제공하는 정보 제공부를 포함할 수 있다. In addition, the search system according to an embodiment of the present invention, the sorting unit for sorting the documents according to the sorting options by time and the sorting response index, and information about the sorted documents and the response index of the sorted documents It may include an information providing unit for providing information about.
또한, 상기 문서들을 유사 문서 별로 클러스터링하고, 상기 클러스터 별로 대표 문서를 결정하는 검색부를 더 포함할 수 있다. 그러면, 상기 정렬부는, 상기 결정된 대표 문서들을 상기 옵션에 따라 정렬할 수 있다.The apparatus may further include a searcher configured to cluster the documents by the similar documents and determine the representative document by the clusters. Then, the sorting unit may sort the determined representative documents according to the option.
또한, 상기 결정된 대표 문서의 반응 지수를 계산하는 반응 지수 계산부를 더 포함할 수 있다. 그러면, 상기 정보 제공부는, 상기 계산된 대표 문서의 반응 지수에 대한 정보를 제공할 수 있다.The apparatus may further include a response index calculator for calculating a response index of the determined representative document. Then, the information providing unit may provide information about the response index of the calculated representative document.
본 발명의 일실시예에 따르면, 사용자에게 보다 빠르고 손쉽게 검색 키워드와 관련된 정보들을 제공할 수 있다.According to an embodiment of the present invention, information related to a search keyword can be provided to a user more quickly and easily.
본 발명의 일실시예에 따르면, 다양한 종류의 문서들 중에서 사용자가 필요로 하는 검색 키워드와 관련하여 정확한 정보를 제공할 수 있다.According to an embodiment of the present invention, accurate information may be provided in relation to a search keyword required by a user among various types of documents.
본 발명의 일실시예에 따르면, 작성 시간이 설정된 문서들 중에서 검색된 문서들을 제공함에 따라 보다 정확한 정보를 사용자에게 제공할 수 있다.According to an embodiment of the present invention, more accurate information may be provided to the user by providing documents searched among documents whose creation time is set.
본 발명의 일실시예에 따르면, 시간 별 또는 반응 지수 별로 정렬된 문서들과 함께 문서의 반응 지수를 제공함으로써 사용자가 필요로 하는 문서를 획득하는데 소요되는 시간을 단축시킬 수 있다.According to one embodiment of the present invention, by providing the response index of the document together with the documents sorted by time or by the response index, it is possible to shorten the time required to obtain a document required by the user.
도 1은 화제도 기반의 검색을 제공하는 검색 시스템의 구성을 도시한 도면이다.
도 2는 화제도 기반의 검색 제공 방법을 설명하기 위해 제공되는 흐름도이다.
도 3 내지 도 6은 화제도 기반의 검색 제공 방법을 이용하여 표시되는 화면을 도시한 도면이다.1 is a diagram illustrating a configuration of a search system that provides a conversation based search.
2 is a flowchart provided to explain a topic-based search providing method.
3 to 6 are diagrams illustrating a screen displayed by using a topic-based search providing method.
이하에서는 첨부된 도면을 참조하여, 본 발명의 실시예를 설명하기로 한다.Hereinafter, with reference to the accompanying drawings, it will be described an embodiment of the present invention.
도 1은 화제도 기반의 검색을 제공하는 검색 시스템의 구성을 도시한 도면이다. 그리고, 도 2는 화제도 기반의 검색 제공 방법을 설명하기 위해 제공되는 흐름도이다.1 is a diagram illustrating a configuration of a search system that provides a conversation based search. 2 is a flowchart provided to explain a topic-based search providing method.
도 1을 참조하면, 검색 시스템(100)은 문서 수집부(110), 검색부(120), 반응지수 계산부(130), 정렬부(140), 및 정보 제공부(150)를 포함할 수 있다. Referring to FIG. 1, the
도 1 및 도 2를 참조하면, 먼저, 검색부(120)는 수집된 문서들 중에서 작성 시간이 설정된 문서들을 추출할 수 있다(210). 1 and 2, first, the
이때, 문서 수집부(110)는 웹 크롤러를 이용하여 사진, 글(article), 웹 사이트 주소 등과 같이 다양한 종류의 문서들을 수집할 수 있다. 그러면, 검색부(120)는 수집된 문서들 중에서 작성 시간이 설정된 문서들을 추출할 수 있다.In this case, the
일례로, 검색부(120)는 수집된 문서들 중에서 신문 기사, 게시 글, 블로그 글, 트위터 글 등과 같이 작성 시간이 명확한 글로 구성된 문서들을 추출할 수 있다. 이때, 문서의 작성 시간이 명확한 경우, 글로 구성된 문서들은 텍스트뿐만 아니라 이미지, 웹 사이트 주소를 포함할 수도 있다. For example, the
이어, 검색부(120)는 추출된 문서들을 비교하여 동일한 문서이거나, 혹은 문서의 내용이 유사한 문서들 별로 추출된 문서들을 클러스터링할 수 있다(220). 이때, 검색부(120)는 추출된 문서들을 대상으로, 문서들 간의 유사도가 기설정된 기준값 이상인 문서들을 유사 문서들로 결정할 수 있다.Subsequently, the
일례로, 100개의 문서가 추출된 경우, 검색부(120)는 추출된 문서들 중 내용이 유사한 30개, 25개, 17개, 15개, 13개의 문서들 별로 동일한 클러스터에 속하도록 클러스터링 할 수 있다. 즉, 30개의 문서들이 제1 클러스터, 25개의 문서들이 제2 클러스터, 17개의 문서들이 제3 클러스터, 15개의 문서들이 제4 클러스터, 및 13개의 문서들이 제5 클러스터에 속할 수 있다.For example, when 100 documents are extracted, the
그리고, 검색부(120)는 클러스터에 속하는 문서들을 이용하여 클러스터 별로 대표 문서를 결정할 수 있다(230).The
일례로, 검색부(120)는 클러스터에 속하는 문서들 중에서 반응 지수가 가장 높은 문서를 대표 문서로 결정할 수 있다. For example, the
이때, 반응 지수는 해당 문서에 대한 꼬리 글(comment)의 개수, 각종 북마크 사이트들에서 해당 문서가 북마크된 횟수, 해당 문서를 다른 문서에서 인용한 횟수, 및 해당 문서의 평점 중 적어도 하나를 포함할 수 있다. 여기서, 해당 문서의 평점은, 다양한 레뷰 사이트들에서 추천된 횟수, 또는 평가값을 포함할 수 있다.In this case, the response index may include at least one of the number of comments on the document, the number of bookmarks of the document in various bookmark sites, the number of times the document is cited in another document, and the rating of the document. Can be. Here, the rating of the document may include a number of times recommended in various review sites or an evaluation value.
다른 예로, 검색부(120)는 클러스터에 속하는 문서들 중에서 검색 키워드와 관련도가 높은 문서를 대표 문서로 결정할 수도 있다. 여기서, 검색 키워드와 관련도가 높은 문서는 클러스터에 속하는 문서들 중에서 다른 단말에 의해 클릭된 횟수가 많은 문서가 될 수 있다. 즉, 클러스터에 속하는 문서들 중에서 다른 단말에 의해 클릭된 횟수가 많은 문서가 대표 문서로 결정될 수 있다.As another example, the
이어, 반응 지수 계산부(130)는 클러스터 별로 결정된 대표 문서의 반응 지수를 계산할 수 있다(240).Subsequently, the
이때, 반응 지수 계산부(130)는 클러스터에 속하는 문서들 각각의 반응 지수의 합으로써 대표 문서의 반응 지수를 계산할 수 있다. 일례로, 클러스터에 10개의 문서들이 속하고, 10개 문서의 반응 지수가 1 내지 10 각각에 해당하는 경우, 반응 지수 계산부(130)는 대표 문서의 반응 지수를 1부터 10의 합인 55로 계산할 수 있다. 동일한 방법으로, 반응 지수 계산부(130)는 복수의 클러스터에 속하는 대표 문서들의 반응 지수를 각각 계산할 수 있다.In this case, the
그리고, 정렬부(140)는 결정된 대표 문서들을 옵션에 따라 정렬할 수 있다(250). 여기서, 옵션은 시간 별 정렬 옵션 및 반응 지수 별 정렬 옵션을 포함할 수 있다. 이때, 옵션은 기설정되거나, 또는 시간 별 정렬 옵션과 반응 지수 별 정렬 옵션 중 어느 하나를 사용자로부터 입력받을 수도 있다.In addition, the
일례로, 도 3과 같이, 시간 별 정렬 옵션이 이용되는 경우, 정렬부(140)는 대표 문서들을 대표 문서의 작성된 시간 순서로 정렬할 수 있다.For example, as illustrated in FIG. 3, when the time-based sorting option is used, the
이어, 정보 제공부(150)는 정렬된 대표 문서들에 대한 정보와 대표 문서들의 반응 지수에 대한 정보를 함께 단말에 제공할 수 있다. 이때, 정보 제공부(150)는 정렬된 대표 문서들의 작성 시간에 대한 정보도 단말에 제공할 수도 있다. 그러면, 단말에는 정렬된 대표 문서들, 대표 문서들의 반응 지수, 및 작성 시간이 함께 표시될 수 있다(260).Subsequently, the
일례로, 정보 제공부(150)는 정렬된 대표 문서들의 링크 정보 및 반응 지수를 포함하는 웹 페이지를 단말에 제공할 수 있다. 그러면, 단말은 웹 페이지를 기초로 정렬된 대표 문서들 및 대표 문서들의 반응 지수를 함께 표시할 수 있다. For example, the
이때, 대표 문서의 반응 지수는 시각화하여 표시될 수 있다. 일례로, 도 3과 같이, 대표 문서의 반응 지수(310)는 수치로 표시될 수도 있고, 별 모양 등의 특수 문자의 개수, 반응 지수의 높낮이에 따라 구분된 컬러, 또는 그라데이션 그래프로 표시될 수도 있다.In this case, the response index of the representative document may be visualized and displayed. For example, as shown in FIG. 3, the
한편, 반응 지수 별 정렬 옵션이 이용되는 경우, 정렬부(140)는 대표 문서들을 대표 문서의 반응 지수 순서로 정렬할 수 있다. 그러면, 시간 별 정렬 옵션이 이용되는 경우와 마찬가지로, 반응 지수 순으로 정렬된 대표 문서들, 대표 문서의 반응 지수, 및 작성 시간이 함께 단말에 표시될 수 있다. On the other hand, when the response index sorting option is used, the
이때, 표시된 대표 문서들 중에서 단말에 의해 문서가 선택된 경우, 정보 제공부(150)는 선택된 대표 문서의 클러스터에 속하는 문서들에 대한 정보를 웹 페이지 형태로 단말로 제공할 수 있다. 그러면, 단말에는 선택된 대표 문서의 클러스터에 속하는 문서들이 표시될 수 있다. In this case, when a document is selected by the terminal among the displayed representative documents, the
일례로, 도 4와 같이, 반응 지수가 43인 4번째 대표 문서가 선택된 경우, 뉴스, 블로그, 게시판에 관계없이 선택된 4번째 대표 문서의 클러스터에 속하는 문서들이 표시(410)될 수 있다. For example, as illustrated in FIG. 4, when a fourth representative document having a response index of 43 is selected, documents belonging to the cluster of the fourth representative document selected regardless of news, blogs, and bulletin boards may be displayed 410.
이때, 4번째 대표 문서의 클러스터에 속하는 문서들의 개수가 기설정된 임계값 이상인 경우, 정보 제공부(150)는 스크롤을 제공할 수도 있다. 그러면, 단말에는 스크롤을 이용하여 대표 문서의 클러스터에 속하는 모든 문서들이 표시될 수 있다.In this case, when the number of documents belonging to the cluster of the fourth representative document is equal to or greater than a predetermined threshold value, the
다른 예로, 정보 제공부(150)는 도 5와 같이, 선택된 4번째 대표 문서의 클러스터에 속하는 문서들 중에서 뉴스 기사에 해당하는 문서들 만을 웹 페이지 형태로 단말로 제공할 수도 있다. 그러면, 단말에는 선택된 4번째 대표 문서의 클러스터에 속하는 문서들 중에서 뉴스 기사에 해당하는 문서들 만이 표시(510)될 수 있다.As another example, as illustrated in FIG. 5, the
한편, 정렬된 대표 문서들의 상세 보기 옵션이 선택된 경우, 정보 제공부(150)는 대표 문서들 각각의 상세 정보를 웹 페이지 형태로 제공할 수도 있다. 그러면, 도 6과 같이, 단말에는 대표 문서들 각각의 상세 정보가 표시될 수 있다. Meanwhile, when the detailed view option of the arranged representative documents is selected, the
이상에서는, 대표 문서들을 시간 순서 또는 반응 지수 순으로 정렬하는 것으로 설명하였으나, 이는 실시예에 해당되며, 검색 시스템(100)은 대표 문서들을 시간 순서 및 반응 지수를 모두 이용하여 정렬할 수도 있다.In the above description, the representative documents are sorted in order of time or response index. However, this is an exemplary embodiment, and the
일례로, 검색 시스템(100)은 대표 문서들 중에서 작성 시간이 기설정된 기준 시간 이내에 해당하는 문서들을 추출하고, 추출된 대표 문서들을 반응 지수가 높은 순서로 정렬할 수도 있다. 즉, 대표 문서들 중에서 최근에 작성된 대표 문서들을 반응 지수가 높은 순서로 정렬할 수 있다.For example, the
또한, 본 발명의 실시예들에 따른 촬영 장치 및 방법은 다양한 컴퓨터로 구현되는 동작을 수행하기 위한 프로그램 명령을 포함하는 컴퓨터 판독 가능 매체를 포함한다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.In addition, the imaging apparatus and method according to the embodiments of the present invention includes a computer readable medium including program instructions for performing operations implemented by various computers. The computer readable medium may include program instructions, data files, data structures, etc. alone or in combination. The media may be program instructions that are specially designed and constructed for the present invention or may be available to those skilled in the art of computer software. Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks, and magnetic tape, optical media such as CD-ROMs, DVDs, and magnetic disks, such as floppy disks. Magneto-optical media, and hardware devices specifically configured to store and execute program instructions, such as ROM, RAM, flash memory, and the like. Examples of program instructions include not only machine code generated by a compiler, but also high-level language code that can be executed by a computer using an interpreter or the like. The hardware device described above may be configured to operate as one or more software modules to perform the operations of the present invention, and vice versa.
이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.As described above, the present invention has been described by way of limited embodiments and drawings, but the present invention is not limited to the above embodiments, and those skilled in the art to which the present invention pertains various modifications and variations from such descriptions. This is possible.
그러므로, 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다. Therefore, the scope of the present invention should not be limited to the described embodiments, but should be determined not only by the claims below but also by the equivalents of the claims.
110: 문서 수집부
120: 검색부
130: 반응 지수 계산부
140: 정렬부
150: 정보 제공부110: document collection unit
120: search unit
130: response index calculation unit
140: alignment unit
150: information provider
Claims (17)
상기 옵션에 따라 정렬된 문서들에 대한 정보 및 상기 정렬된 문서들의 반응 지수에 대한 정보를 제공하는 단계
를 포함하는 검색 제공 방법.Providing a sort by time option and a sort by response index for documents;
Providing information about the documents sorted according to the option and the response index of the sorted documents
Search providing method comprising a.
상기 문서들은, 문서들의 작성 시간이 각각 설정된 문서들인 것을 특징으로 하는 검색 제공 방법.The method of claim 1,
And the documents are documents in which document creation times are set.
상기 문서들을 유사 문서 별로 클러스터링하는 단계; 및
상기 클러스터 별로 대표 문서를 결정하는 단계
를 더 포함하고,
상기 정보를 제공하는 단계는,
상기 결정된 대표 문서들을 상기 옵션에 따라 정렬하고, 정렬된 문서들에 대한 정보를 제공하는 검색 제공 방법.The method of claim 1,
Clustering the documents by similar documents; And
Determining a representative document for each cluster
Further comprising:
Providing the information,
And sorting the determined representative documents according to the option and providing information on the sorted documents.
상기 대표 문서를 결정하는 단계는,
상기 클러스터에 속한 문서들 중에서 반응 지수가 가장 높은 문서를 상기 대표 문서로 결정하는 검색 제공 방법.The method of claim 3,
Determining the representative document,
The search providing method of determining, as the representative document, a document having the highest response index among documents belonging to the cluster.
상기 대표 문서를 결정하는 단계는,
상기 클러스터에 속한 문서들 중에서 검색 키워드와 관련도가 가장 높은 문서를 상기 대표 문서로 결정하는 검색 제공 방법.The method of claim 3,
Determining the representative document,
A search providing method of determining, as the representative document, a document most relevant to a search keyword among documents belonging to the cluster.
상기 결정된 대표 문서의 반응 지수를 계산하는 단계
를 더 포함하고,
상기 정보를 제공하는 단계는,
상기 결정된 대표 문서의 반응 지수에 대한 정보를 제공하는 검색 제공 방법.The method of claim 3,
Calculating a response index of the determined representative document
Further comprising:
Providing the information,
The search providing method of providing information on the response index of the determined representative document.
상기 계산하는 단계는,
상기 클러스터에 속한 문서들 각각의 반응 지수의 합을 상기 클러스터에 속한 대표 문서의 반응 지수로 계산하는 검색 제공 방법.The method of claim 6,
The calculating step,
The search providing method of calculating the sum of the response index of each document belonging to the cluster as the response index of the representative document belonging to the cluster.
상기 반응 지수는, 상기 문서의 꼬리 글(comment)의 개수, 북마크 수, 상기 문서의 인용 횟수, 및 상기 문서의 평점 중 적어도 하나를 이용하여 획득되는 검색 제공 방법.The method of claim 1,
And the response index is obtained using at least one of the number of comments of the document, the number of bookmarks, the number of citations of the document, and the rating of the document.
상기 정보를 제공하는 단계는,
상기 정렬된 문서들에 대한 정보 및 상기 정렬된 문서들의 반응 지수에 대한 정보를 웹 페이지 형태로 제공하고,
상기 웹 페이지에 기초하여 상기 정렬된 문서들 및 상기 정렬된 문서들의 반응 지수는 함께 표시되는 검색 제공 방법.The method of claim 1,
Providing the information,
Providing information about the sorted documents and the response index of the sorted documents in the form of a web page,
And a response index of the sorted documents and the sorted documents based on the web page is displayed together.
상기 정렬된 문서들에 대한 정보 및 상기 정렬된 문서들의 반응 지수에 대한 정보를 제공하는 정보 제공부
를 포함하는 검색 시스템.An alignment unit for sorting documents according to a sorting by time option and a sorting by response index; And
Information providing unit for providing information on the sorted documents and the response index of the sorted documents
Search system comprising a.
상기 문서들은, 문서들의 작성 시간이 각각 설정된 문서들인 것을 특징으로 하는 검색 시스템.The method of claim 10,
And the documents are documents in which document creation times are set.
상기 문서들을 유사 문서 별로 클러스터링하고, 상기 클러스터 별로 대표 문서를 결정하는 검색부
를 더 포함하고,
상기 정렬부는,
상기 결정된 대표 문서들을 상기 옵션에 따라 정렬하는 검색 시스템.The method of claim 10,
A searcher for clustering the documents by similar documents and determining a representative document for each cluster
Further comprising:
The alignment unit,
And sort the determined representative documents according to the option.
상기 검색부는,
상기 클러스터에 속한 문서들 중에서 반응 지수가 가장 높은 문서를 상기 대표 문서로 결정하는 검색 시스템.The method of claim 12,
The search unit,
And a document having the highest response index among documents belonging to the cluster as the representative document.
상기 검색부는,
상기 클러스터에 속한 문서들 중에서 검색 키워드와 관련도가 가장 높은 문서를 상기 대표 문서로 결정하는 검색 시스템.The method of claim 12,
The search unit,
A search system for determining a document that is most relevant to a search keyword among the documents in the cluster as the representative document.
상기 결정된 대표 문서의 반응 지수를 계산하는 반응 지수 계산부
를 더 포함하고,
상기 정보 제공부는,
상기 계산된 대표 문서의 반응 지수에 대한 정보를 제공하는 검색 시스템.The method of claim 12,
Response index calculation unit for calculating the response index of the determined representative document
Further comprising:
The information providing unit,
A search system for providing information on the response index of the calculated representative document.
상기 반응 지수 계산부는,
상기 클러스터에 속한 문서들 각각의 반응 지수의 합을 상기 클러스터에 속한 대표 문서의 반응 지수로 계산하는 검색 시스템.16. The method of claim 15,
The reaction index calculation unit,
And a sum of the response indices of the documents belonging to the cluster as the response indices of the representative documents in the cluster.
상기 정보 제공부는,
상기 정렬된 문서들에 대한 정보 및 상기 정렬된 문서들의 반응 지수에 대한 정보를 웹 페이지 형태로 제공하고,
상기 웹 페이지에 기초하여 상기 정렬된 문서들 및 상기 정렬된 문서들의 반응 지수는 함께 표시되는 검색 시스템.16. The method of claim 15,
The information providing unit,
Providing information about the sorted documents and the response index of the sorted documents in the form of a web page,
And the response index of the sorted documents and the sorted documents is displayed together based on the web page.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020100031541A KR101544142B1 (en) | 2010-04-06 | 2010-04-06 | Searching method and system based on topic |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020100031541A KR101544142B1 (en) | 2010-04-06 | 2010-04-06 | Searching method and system based on topic |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20110112116A true KR20110112116A (en) | 2011-10-12 |
KR101544142B1 KR101544142B1 (en) | 2015-08-17 |
Family
ID=45028019
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020100031541A KR101544142B1 (en) | 2010-04-06 | 2010-04-06 | Searching method and system based on topic |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101544142B1 (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190132904A (en) * | 2018-05-21 | 2019-11-29 | 네이버 주식회사 | Ai headline news |
US11144783B2 (en) | 2018-05-21 | 2021-10-12 | Naver Corporation | Servers, non-transitory computer-readable media and methods for providing articles |
KR102580460B1 (en) * | 2023-01-26 | 2023-09-21 | 농업협동조합중앙회 | Server for providing news based on keyword and method thereof |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100645614B1 (en) * | 2005-07-15 | 2006-11-14 | (주)첫눈 | Search method and apparatus considering a worth of information |
-
2010
- 2010-04-06 KR KR1020100031541A patent/KR101544142B1/en active IP Right Grant
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190132904A (en) * | 2018-05-21 | 2019-11-29 | 네이버 주식회사 | Ai headline news |
US11144783B2 (en) | 2018-05-21 | 2021-10-12 | Naver Corporation | Servers, non-transitory computer-readable media and methods for providing articles |
KR102580460B1 (en) * | 2023-01-26 | 2023-09-21 | 농업협동조합중앙회 | Server for providing news based on keyword and method thereof |
Also Published As
Publication number | Publication date |
---|---|
KR101544142B1 (en) | 2015-08-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9659067B2 (en) | Providing a search results document that includes a user interface for performing an action in connection with a web page identified in the search results document | |
CN109074383B (en) | Document search with visualization within the context of a document | |
CN107122400B (en) | Method, computing system and storage medium for refining query results using visual cues | |
CN102609474B (en) | A kind of visit information supplying method and system | |
US20130054672A1 (en) | Systems and methods for contextualizing a toolbar | |
US20150081681A1 (en) | Method and apparatus for classifying and comparing similar documents using base templates | |
US20150113388A1 (en) | Method and apparatus for performing topic-relevance highlighting of electronic text | |
JP4896268B2 (en) | Information retrieval method and apparatus reflecting information value | |
JP5989170B2 (en) | Search result ranking apparatus and method using reliability of representative | |
CN103593378A (en) | Terminal and method for determining type of input method editor | |
JP2010536086A (en) | User-centric information search method and system | |
CN104142990A (en) | Search method and device | |
CN103678325A (en) | Method and device for providing browsing page corresponding to initial page | |
KR102206001B1 (en) | Apparatus and method for recommending e-books based on user behavior | |
CN103365879A (en) | Method and device for obtaining page similarity | |
KR20160002199A (en) | Issue data extracting method and system using relevant keyword | |
KR101544142B1 (en) | Searching method and system based on topic | |
KR100913049B1 (en) | Method and system for providing positive / negative search result using user preference | |
CN103942233B (en) | The lobby page recognition methods of directory type web and device | |
TW201241775A (en) | Advertisement management device, advertisement selection device, advertisement management method, advertisement management program and storage medium storing advertisement management program | |
CN104462151A (en) | Method for evaluating web page publishing time and related device | |
Alcic et al. | Measuring performance of web image context extraction | |
KR101347884B1 (en) | Method and system for providing relevance site using chracteristic word of site | |
US20160124946A1 (en) | Managing a set of data | |
KR101614551B1 (en) | System and method for extracting keyword using category matching |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20190701 Year of fee payment: 5 |