KR20070043090A - Method and apparatus for serving search result using template based on query and contents clustering - Google Patents

Method and apparatus for serving search result using template based on query and contents clustering Download PDF

Info

Publication number
KR20070043090A
KR20070043090A KR1020050098926A KR20050098926A KR20070043090A KR 20070043090 A KR20070043090 A KR 20070043090A KR 1020050098926 A KR1020050098926 A KR 1020050098926A KR 20050098926 A KR20050098926 A KR 20050098926A KR 20070043090 A KR20070043090 A KR 20070043090A
Authority
KR
South Korea
Prior art keywords
search
query
information
word
user
Prior art date
Application number
KR1020050098926A
Other languages
Korean (ko)
Inventor
한미나
이은영
정인서
이승준
성영제
Original Assignee
(주)첫눈
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)첫눈 filed Critical (주)첫눈
Priority to KR1020050098926A priority Critical patent/KR20070043090A/en
Publication of KR20070043090A publication Critical patent/KR20070043090A/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3322Query formulation using system suggestions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3338Query expansion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

인터넷상에서 정보검색 결과를 보다 효과적으로 제시하기 위한 방법 및 그 장치가 개시된다. 본 발명에 따라, 정보검색 결과 제공은 질의어와 관련성이 높은 웹 사이트 또는 콘텐츠를 선정하는 단계; 상기 질의어, 상기 관련 웹 사이트 및 상기 관련 콘텐츠 중 적어도 하나에 기초하여 사용자에게 검색결과를 제공할 템플릿을 자동으로 결정하는 단계; 상기 결정된 템플릿에 따라 상기 검색결과를 제공하는 단계를 포함하는 정보제공방법에 의하여 달성된다. A method and apparatus for presenting information retrieval results more effectively on the Internet are disclosed. According to the present invention, the information search result providing step of selecting a website or content that is highly relevant to the query; Automatically determining a template to provide a search result to a user based on at least one of the query word, the related web site and the related content; It is achieved by the information providing method comprising the step of providing the search results according to the determined template.

또한, 상기 질의어는 사용자의 입력 검색어를 기반으로 구성된 확장검색어를 포함하는 것으로 확장될 수 있으며, 이에 의하여 사용자의 검색 의도에 부합하면서도 보다 풍부한 검색결과를 제공할 수 있다.In addition, the query may be extended to include an extended search word configured based on a user's input search word, thereby providing a richer search result while meeting the user's search intention.

검색엔진, 검색서비스, 템플릿, 추천검색어 Search engines, search services, templates, search suggestions

Description

질의어 및 콘텐츠 분류 기반 템플릿을 이용한 검색결과 제공방법 및 그 장치 {Method and apparatus for serving search result using template based on query and contents clustering}Method and apparatus for providing search results using template based on query and content classification {Method and apparatus for serving search result using template based on query and contents clustering}

도 1은 본 발명에서 제안하는 질의어 및 콘텐츠 분류 기반 템플릿을 이용한 검색결과 제공방법의 플로우 차트,1 is a flow chart of a search result providing method using a query and content classification based template proposed in the present invention;

도 2는 본 발명의 바람직한 실시예에 따른 검색결과 출력 화면,2 is a search result output screen according to a preferred embodiment of the present invention;

도 3은 본 발명의 바람직한 실시예에 따라 자동으로 생성된 웹 사이트의 제목정보와 요약정보를 나타낸 출력화면,3 is an output screen showing title information and summary information of an automatically generated web site according to a preferred embodiment of the present invention;

도 4는 본 발명의 바람직한 실시예에 따라 자동으로 생성된 추천검색어 정보의 출력화면이다. 4 is an output screen of recommended search word information automatically generated according to a preferred embodiment of the present invention.

본 발명은 인터넷 정보검색 엔진에 관한 것으로서 보다 상세하게는 질의어 또는 콘텐츠의 자동분류결과에 대응하는 템플릿을 사용한 효율적인 검색결과 제공방법에 관한 것이다. The present invention relates to an Internet information search engine, and more particularly, to an efficient search result providing method using a template corresponding to an automatic classification result of a query or content.

인터넷을 통한 정보 제공자와 이용자의 폭발적인 증가에 따라 검색엔진을 이 용하는 사용자에게 입력한 검색어와 관련된 정보를 한정된 화면에서 효율적으로 제공하는 것이 필요하다. 이에 사용자 입력 검색어에 대응하는 컨텐츠들에 대해 수동분류 작업등을 통하여 콘텐츠 모음 서비스를 일부 제공한 예는 있으나, 서비스 제공자의 입장에서는 과도한 노동력이 소모됨에 따라 폭발적으로 증가하는 인터넷의 콘텐츠에 대한 대응이 시의 적절하지 못하는 등 서비스의 생성, 수정에 한계가 있으며, 사용자의 입장에서도 입력 검색어에 대한 관련 정보를 충분하게 제공 받지 못한다는 문제점이 있다.With the explosion of information providers and users over the Internet, it is necessary to efficiently provide information related to search terms entered on a limited screen to users using search engines. As a result, some contents collection services have been provided through manual sorting for contents corresponding to user input search terms, but the service provider's response to the contents of the Internet, which is exploding due to excessive labor force, is inevitable. There is a limit to the creation and modification of the service, such as not appropriate, and there is a problem in that the user does not receive enough related information on the input search word.

본 발명이 이루고자 하는 기술적 과제는 사용자가 입력한 검색어를 기반으로 하여 사용자의 관심사를 반영하는 확장 검색어를 구성하고, 사용자 입력 검색어 또는 확장 검색어로 구성된 질의어를 기반으로 인터넷상에서 관련 웹 사이트 또는 콘텐츠에 대한 정보를 수집하여, 상기 사용자 입력검색어, 확장검색어, 상기 수집된 관련 웹사이트 또는 콘텐츠에 대한 정보들 중 적어도 하나에 기초한 자동분류 결과에 대응하는 콘텐츠 템플릿을 활용하여 제공함으로서 최종적으로 사용자가 검색어를 통하여 열람하고자 하였던 관련 정보들을 보다 효율적으로 제공하는 하는 것이다.An object of the present invention is to construct an extended search term that reflects a user's interest based on a search term input by the user, and to search for a related website or content on the Internet based on a user input query or a query term composed of the extended search term. By collecting the information and providing a content template corresponding to an automatic classification result based on at least one of the user input search word, the extended search word, and the information about the collected related website or content, the user finally uses the search word. It is to provide related information more effectively.

상기 기술적 과제는 본 발명에 따라, 질의어와 관련성이 높은 웹 사이트 또는 콘텐츠를 선정하는 단계; 상기 질의어, 상기 관련 웹 사이트 및 관련 콘텐츠 중 적어도 하나에 기초하여 사용자에게 검색결과를 제공할 템플릿을 자동으로 결정하 는 단계; 및 상기 결정된 템플릿에 따라 상기 선정된 웹 사이트 또는 콘텐츠 정보를 제공하는 단계를 포함하는 정보제공방법에 의하여 달성된다.According to the present invention, the step of selecting a web site or content that is highly related to the query; Automatically determining a template to provide a search result to a user based on at least one of the query word, the related web site and related content; And providing the selected web site or content information according to the determined template.

상기 질의어는 일예로서 사용자가 직접 입력한 검색어 자체가 될 수 있다. 바람직하게는 사용자 입력 검색어를 기반으로 하여 구성된 확장검색어를 포함할 수 있으며 상기 확장검색어는 동일한 검색어를 입력한 사용자들이 입력한 다른 검색어들 중에서 빈도가 일정한 값 이상이 되는 것으로 구성되는 것이 바람직하다.For example, the query may be a search word input directly by a user. Preferably, the search term may include an extended search term configured based on a user input search term, and the extended search term may be configured such that a frequency is equal to or greater than a predetermined value among other search terms input by users who input the same search term.

또한 질의어를 구성하는 단계에서는 사용자가 검색어를 입력하는 과정에 있어서 발생할 수 있는 불명료한 점을 개선하기 위하여 오타 수정 등의 기능을 부가적으로 포함할 수 있다.In addition, the step of constructing the query may additionally include a function such as a typo correction to improve the ambiguity that may occur when the user enters the search word.

질의어와 관련성이 높은 웹 사이트 또는 콘텐츠를 선정하는 단계는 통상적인 인터넷 검색엔진들에서 사용하는 방법들에 의하여 이루어 질 수 있다. 바람직하게는 질의어가 해당문서에서 출현하는 빈도에 기반을 둔 통계학적인 분석에 의하여 질의어와 웹문서의 관련성을 판정할 수 있다.The step of selecting a web site or content that is highly related to the query word may be performed by methods used in conventional Internet search engines. Preferably, the relation between the query word and the web document can be determined by statistical analysis based on the frequency of the query word appearing in the document.

검색결과를 제공할 템플릿을 결정하는 단계는 질의어의 분류에 기초하여 결정될 수 있을 뿐 아니라 상기 질의어에 대응하는 검색결과에 의하여 수집된 웹 사이트 또는 콘텐츠의 분류에 기초하여서도 결정될 수 있다.The step of determining a template for providing a search result may be determined not only based on the classification of the query word, but also based on the classification of the web site or content collected by the search result corresponding to the query word.

템플릿 결정을 위하여 상기 분류작업을 수행하는 단계는 상기 각 분류대상에 대한 분류별 관련어 사전(시소러스, thesaurus)에 기초하여 관련성에 대한 통계적 분석을 수행함으로서 달성될 수 있으며, 바람직하게는 상관성이 높은 분류의 관련어 사전에 분류대상이 포함되어 있지 아니한 경우 해당 분류대상을 상기 분류별 관 련어 사전에 추가하여 상기 분류별 관련어 사전을 자동적으로 확장해 나아가는 단계를 포함할 수 있다.Performing the classification for determining the template may be achieved by performing a statistical analysis on the relationship based on the dictionary of thesaurus for each classification object (thesaurus), preferably of a highly correlated classification. If a classification target is not included in the related dictionary, the classification target may be added to the related dictionary for each classification to automatically expand the related dictionary for each classification.

검색결과를 제공하는 데 있어서 사용할 템플릿을 결정하는 단계는 상기 분류 결과에 기초하여 제공할 템플릿을 서비스 제공자의 서비스제공 정책에 따라 미리 설정하여 두는 방법으로 이루어 질 수 있으며, 해당 질의어에 대한 검색결과에서 사용자가 방문한 웹사이트 또는 콘텐츠에 관한 통계를 반영하여 분류별로 제공하는 템플릿의 유형을 자동으로 선정하는 단계를 추가적으로 포함하는 것이 바람직하다.Determining a template to be used in providing a search result may be performed by setting a template to be provided based on the classification result according to a service provider's service provision policy. The method may further include automatically selecting a type of template provided for each category by reflecting statistics on a website or content visited by the user.

검색결과를 제공하는데 사용하는 템플릿의 경우에는 각 서비스의 목적에 맞게 사용자의 편의를 고려하여 미리 디자인될 수 있으며, 일반적으로 인터넷상의 검색결과로서 빈번하게 호출되는 것으로서는 관련된 웹 사이트를 모아 보여주는 바로가기 템플릿, 관련명칭 등을 보여주는 추천검색어 템플릿, 기업정보 템플릿, 영화정보 템플릿, 날씨정보 템플릿, 인물정보 템플릿, 기기정보 템플릿 등이 있다.The template used to provide the search results can be designed in advance for the user's convenience in consideration of the purpose of each service. In general, the frequently used web search results as a search result on the Internet collects related websites. There is a recommended search term template, a company information template, a movie information template, a weather information template, a person information template, and a device information template.

상기 바로가기 템플릿은 질의어와 관련된 웹 사이트의 하이퍼링크를 묶어서 제공하는 것으로서, 모든 분류의 질의어에 대응하여 제공되는 것이 바람직하다. 상기 바로가기 템플릿의 경우에 있어서 각 웹 사이트의 URL에 색인어를 부여하여 색인어가 같은 URL을 하나의 묶음으로 하여 트리(Tree)형태로 사용자에게 제공하는 것이 바람직하다. 상기 색인어는 각 URL 별로 복수개가 할당될 수 있으며, 해당 웹사이트에 방문하기 위하여 사용자가 입력한 검색어와 상기 웹사이트의 내용을 분석하여 그 출현빈도가 일정값 이상인 단어들을 색인어로 취하는 것이 바람직하다.The shortcut template is provided by grouping hyperlinks of a web site related to a query, and is preferably provided corresponding to all categories of query. In the case of the shortcut template, it is preferable to give an index word to the URL of each web site, and provide the user with a URL in the form of a bundle of URLs having the same index word. A plurality of index words may be assigned to each URL, and it is preferable to analyze a search word input by a user and contents of the website to visit a corresponding website, and to take words having an occurrence frequency of a predetermined value or more.

상기 바로가기 템플릿에 사용될 웹 사이트에 대한 제목과 세부설명 정보는 각 웹 사이트의 내용 데이타를 분석하여 자동으로 생성될 수 있다. 바람직하게는 사용자가 입력한 검색어와 연관도가 높은 내용을 포함하는 특정 페이지의 내용 데이터를 분석하여 출현빈도가 높은 단어들로서 제목과 요약정보를 구성할 수 있다.The title and detailed information of the web site to be used in the shortcut template may be automatically generated by analyzing the content data of each web site. Preferably, the title data and the summary information may be configured as words with high occurrence frequency by analyzing content data of a specific page including a content that is highly related to a search word input by a user.

또한, 상기 추천검색어 템플릿은 질의어에 대응하는 검색결과로 추출된 웹 페이지 및 콘텐츠를 분석하여 자연인성명 또는 기관명 등으로 판단되는 후보문구들 중에서 검색결과 상에서 질의어와 관련성이 높은 것으로 판단된 문구들을 제시하는 기능을 수행한다.In addition, the recommended search term template analyzes web pages and contents extracted as a search result corresponding to the query word and presents phrases determined to be highly related to the query word in the search results among candidate phrases determined as natural names or institution names. Perform the function.

상기 자연인 성명으로 판단되는 후보문구를 추출하는 과정은 해당문구의 음절의 길이, 첫음절이 성(姓)으로서 관용되는지 여부, 한자 및 나이의 병기여부, 해당문구 뒤에 1음절 조사 연결여부 및 전화번호부 등 관련 데이타베이스에 수록되어 있는지 등에 기초한 분석을 통하여 수행될 수 있으며, 상기 기관명칭으로 판단되는 후보문구를 추출하는 과정은 관용명칭인 (주),협회 등과의 결합여부, 상장기업 명칭과의 일치여부, 전화번호부 등 관련 데이터베이스에 등록여부 등에 기초하여 수행될 수 있다.The process of extracting candidate phrases judged to be natural names includes the length of syllables of the phrase, whether the first syllable is tolerated as sex, whether or not the kanji and age are written together, whether one-syllable survey is connected after the phrase and the telephone directory. The process of extracting candidate phrases that are determined to be the name of the institution may be combined with common names, such as Co., Ltd., associations, and listed companies. It can be performed based on whether or not to register in the relevant database such as a phone book.

또한 상기 후보문구들과 질의어와의 관련성은 동일문서에서 동시에 출현하는 빈도 또는 확률, 동일 문서내에서의 질의어와 후보문구의 위치 인접성 등을 기초하여 판단될 수 있으며, 상기 과정에 의하여 추출된 자연인 성명 또는 기관명칭은 질의어와의 관련성 또는 관련명칭 자체의 최근 사용자 조회 빈도 등을 고려하여 노출순위를 결정하는 것이 바람직하다.In addition, the relation between the candidate phrases and the query word may be determined based on the frequency or probability of simultaneous appearance in the same document, the positional proximity of the query word and the candidate phrase in the same document, and the natural name extracted by the above process. Alternatively, the organization name may be determined in consideration of the relation with the query word or the frequency of recent user inquiry of the related name itself.

상기 추천검색어 템플릿에 있어서 추천검색어는 반드시 자연인 명칭이거나 기관명칭에 국한되는 것은 아니며, 바람직하게는 사용자 입력검색어를 기초로 하여 해당 검색어를 입력한 다른 사용자들의 검색이력 등을 참조하여 구성된 확장검색어들 중에서 검색결과에서 나타는 확률 등이 일정값 이상인 것들을 포함할 수 있다.In the recommended search term template, the recommended search word is not necessarily a natural name or an organization name, and preferably, among the extended search words configured based on the search history of other users who input the search word based on the user input search word, etc. Probability, etc. appearing in the search results may include those that are above a certain value.

한편, 본 발명의 다른 분야에 따르면, 상기 기술적 과제는 질의어와 관련성이 높은 웹 사이트 또는 콘텐츠를 선정하는 정보검색부; 상기 질의어의 분류를 결정하는 자동분류부; 상기 결정된 분류에 따라 사용자에게 검색결과를 제공할 템플릿을 결정하는 템플릿 결정부; 및 상기 결정된 템플릿에 따라 상기 선정된 웹 사이트 및 콘텐츠 정보를 제공하는 단계를 포함하는 정보제공 장치에 의해서도 달성된다.On the other hand, according to another field of the present invention, the technical problem is an information search unit for selecting a web site or content highly related to the query; An automatic classification unit for determining a classification of the query word; A template determination unit which determines a template to provide a search result to a user according to the determined classification; And providing the selected web site and content information according to the determined template.

이하 첨부된 도면을 참조하여 본 발명의 바람직한 실시예에 대해 상세히 설명한다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings.

도 1은 본 발명에서 제안하는 질의어 및 콘텐츠 분류 기반 템플릿을 이용한 검색결과 제공방법의 플로우 차트이다.1 is a flow chart of a search result providing method using a query and content classification based template proposed in the present invention.

사용자는 자신이 찾고자하는 검색어를 입력하게 되고, 이에 대해 확장검색어를 구성한다(S110). 이들 사용자 입력검색어와 확장검색어에 기초하여 웹상에서 관련성이 높은 웹 사이트 및 콘텐츠를 검색한다(S120). 이러한 정보검색과정은 인터넷 검색엔진들에서 일반적으로 사용되는 통계학적인 방법에 의하여 달성될 수 있다. 이들 질의어에 대한 검색결과를 보다 효과적으로 제시하기 위한 템플릿의 선택을 위해 질의어가 속하는 분류를 결정하게 된다(S130).The user inputs a search word that he / she wants to find, and configures an extended search word for this (S110). Based on the user input search word and the extended search word, a relevant web site and content are searched on the web (S120). This information retrieval process can be accomplished by statistical methods commonly used in Internet search engines. In order to select a template for more effectively presenting the search results for these query terms, the classification to which the query terms belong is determined (S130).

서비스 제공자는 서비스 정책에 따라 각 분류별로 제공할 템플릿을 사전에 정의하여 둘 수 있으며 질의어 및 콘텐츠의 자동분류 결과에 따라 어떠한 템플릿을 사용하여 검색결과를 제공할 지에 대한 매핑(mapping)을 사전에 정의할 수 있다. 이러한 매핑(mapping)에 의하여 분류결과에 대응하는 템플릿의 종류가 결정된다. 관련 웹사이트 바로가기 템플릿 및 관련인물 템플릿과 같은 일반적인 속성을 가진 템플릿은 분류결과에 상관없이 기본적으로 제공하는 것이 바람직하다. 최종적으로 선택된 템플릿의 필드가 검색결과에 의하여 자동적으로 생성되어 검색결과를 보다 효율적으로 제공한다.(S140)The service provider can define in advance the templates to be provided for each category according to the service policy, and define the mapping of which templates are used to provide the search results based on the query and content classification results. can do. This mapping determines the type of template corresponding to the classification result. It is desirable to provide templates with general attributes such as related website shortcut templates and related character templates regardless of the classification result. Finally, the field of the selected template is automatically generated by the search result to provide the search result more efficiently (S140).

도 2는 본 발명의 바람직한 실시예에 따른 검색결과 출력 화면이다.2 is a search result output screen according to a preferred embodiment of the present invention.

사용자가 입력한 검색어 “네오위즈”에 대하여 웹상에서 검색을 수행하여 관련된 웹 사이트인 “네오위즈”,“피망”,“세이클럽”,“쥬크온”등의 웹사이트에 대한 URL을 수집하고 각 URL에 대하여 색인어를 부여한다.Performs a search on the web for the search term “Neowiz” entered by the user, and collects URLs for related websites such as “Neowiz”, “Green Pepper”, “Sayclub”, and “Juke-on”. Give an index word.

바로가기 템플릿(210)은 모든 분류의 질의어에 대응하여 사용되는 것이 바람직하다. 바로가기 템플릿에서는 사용자 입력 검색어인 “네오위즈” 관련된 하위개념 색인어인 “네오위즈 피망 ”에 관련된 웹사이트를 하나의 묶음(211)으로 제시하고 또 다른 색인어인 “네오위즈 세이클럽”에 관련된 웹사이트를 하나의 묶음으로(212)제시한다. 이와 같이 본 발명에서 사용하는 바로가기 템플릿의 경우에는 각각의 URL마다 복수의 색인어가 부여될 수 있으므로 바람직하게는 하나의 웹 사이트가 복수의 색인어에 대응하여 표현되는 트리구조로 표현될 수 있다.The shortcut template 210 may be used to correspond to all categories of query words. In the shortcut template, the website related to the user input search term "Neowiz" related subconcept index "Neowiz Bell Pepper" is presented in a bundle (211) and the website related to another index term "Neowiz Say Club" In a bundle (212). As described above, in the case of the shortcut template used in the present invention, since a plurality of index words may be assigned to each URL, one web site may be represented as a tree structure represented corresponding to the plurality of index words.

그 외 콘텐츠 템플릿 영역(220)은 질의어의 자동분류 결과에 따라 사용자에게 제시할 템플릿이 결정된다. 사용자 입력 검색어인 “네오위즈”가 기업의 명칭 으로 분류됨에 따라 주가정보 템플릿과 기업정보 템플릿 및 게시판,블로그 템플릿을 제공하도록 선택된다. 보다 상세하게는 기업정보 템플릿의 경우 “기업명”“대표이사”“본사주소”“대표전화”의 필드를 가지게 되며 이 필드는 웹 검색결과 및 관련 데이터베이스에 의하여 제공되는 정보로 채워진다.In addition, the content template area 220 determines a template to present to the user according to the automatic classification result of the query. As the user input search term "Neowiz" is classified as a company name, it is selected to provide a stock price template, a company information template, a bulletin board, and a blog template. More specifically, the corporate information template has fields of “company name”, “representative director”, “head office address” and “representative phone”, which are filled with information provided by web search results and related databases.

도 3은 본 발명의 바람직한 실시예에 따라 자동으로 생성된 웹사이트의 제목정보와 요약정보를 나타낸 출력화면이다.3 is an output screen showing title information and summary information of an automatically generated website according to a preferred embodiment of the present invention.

각 URL의 제목(310)과 요약정보(311)는 각 웹 사이트의 내용을 사용자가 간략하게 파악할 수 있도록 자동으로 생성된다. 바람직하게는 해당 URL에서 사용자가 입력한 검색어인 “네오위즈”와 연관도가 높은 내용을 포함하는 웹문서의 내용 데이터 및 앵커텍스트 등에 기반하여 자동으로 생성되며, 상기 문서에서의 출현빈도, 사용자가 입력한 검색어와의 유사성 등을 고려하여 “커뮤니티 서비스 세이클럽”“온라인 게임 피망”등이 해당 URL의 제목(310)내지는 요약정보(311)로서 사용될 수 있다.The title 310 and summary information 311 of each URL are automatically generated so that the user can briefly grasp the contents of each web site. Preferably, the URL is automatically generated based on the content data and anchor text of the web document including the content highly related to the search word “Neowiz” entered by the user, and the frequency of occurrence and input by the user. In consideration of similarity with one search word, “community service Say Club” and “online game green pepper” may be used as the title 310 or summary information 311 of the corresponding URL.

도 4는 본 발명의 바람직한 실시예에 따라 자동으로 생성된 추천검색어로서의 관련인물 정보의 출력화면이다.4 is an output screen of related person information as a recommendation search word automatically generated according to a preferred embodiment of the present invention.

추천검색어 템플릿(410)의 경우에는 사용자의 편의를 고려하여 검색화면의 우측에 위치하며, 사용자 입력 검색어인 ‘첫눈’에 대한 검색결과를 분석하여 소정의 방법에 의하여 추출된 추천검색어로서 자연인 성명과 관련기업명 등의 정보를 제시한다.In the case of the recommended search term template 410, it is located on the right side of the search screen in consideration of the user's convenience. Present information such as the name of the company concerned.

한편, 전술한 정보 제공 방법은 컴퓨터 프로그램으로 작성 가능하다. 상기 프로그램을 구성하는 코드들 및 코드 세그먼트들은 당해 분야의 컴퓨터 프로그래머에 의하여 용이하게 추론될 수 있다. 또한, 상기 프로그램은 컴퓨터가 읽을 수 있는 정보저장매체(computer readable media)에 저장되고, 컴퓨터에 의하여 읽혀지고 실행됨으로써 검색 데이터 수집 방법을 구현한다. 상기 정보저장매체는 자기 기록매체, 광 기록매체, 및 캐리어 웨이브 매체를 포함한다.On the other hand, the above-described information providing method can be created by a computer program. Codes and code segments constituting the program can be easily inferred by a computer programmer in the art. In addition, the program is stored in a computer readable media, which is read and executed by a computer to implement a search data collection method. The information storage medium includes a magnetic recording medium, an optical recording medium, and a carrier wave medium.

이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.So far I looked at the center of the preferred embodiment for the present invention. Those skilled in the art will appreciate that the present invention can be implemented in a modified form without departing from the essential features of the present invention. Therefore, the disclosed embodiments should be considered in descriptive sense only and not for purposes of limitation. The scope of the present invention is shown in the claims rather than the foregoing description, and all differences within the scope will be construed as being included in the present invention.

전술한 바와 같이 본 발명에 따르면, 바람직하게는 사용자의 입력 검색어에 대하여 사용자의 관심사를 나타내는 확장검색어를 구성하고, 상기 입력검색어 및 확장검색어를 포함한 질의어에 대한 인기 콘텐츠를 자동으로 추출하고, 상기 질의어, 상기 관련 웹 사이트 및 상기 관련 콘텐츠 중 적어도 하나에 기초한 자동분류 결과에 대응하여 결정된 템플릿에 웹상의 수집된 관련 정보를 자동으로 대입하여 사용자에게 제공함으로써 최종적으로는 사용자의 검색 의도에 부합하는 검색결과 및 관련 사이트들을 제시할 수 있게 된다.As described above, according to the present invention, preferably, an extended search term indicating a user's interest is configured with respect to a user's input search word, automatically extracting popular content for the query word including the input search word and the extended search word, and the query word. , And automatically substitutes the collected relevant information on the web into a template determined in response to an automatic classification result based on at least one of the related web site and the related content, and finally provides the user with a search result corresponding to the user's search intention. And related sites.

종래의 관련 기술과 비교하여서도 유사한 서비스를 제공하기 위한 서비스 제공자 측의 노동력 소모를 현저히 줄일 수 있을 뿐만 아니라, 사용자가 검색어를 통하여 열람하고자 하였던 정보들에 대한 인터넷상에 이슈가 되고 있는 정보들에 대해서도 시의 적절하게 대응할 수 있다.Compared with the related art, it is possible not only to significantly reduce the labor consumption of the service provider to provide similar services, but also to provide information on the Internet about the information that the user wants to view through a search word. Also, it can respond timely.

Claims (11)

질의어와 관련된 웹 사이트 또는 콘텐츠를 선정하는 단계;Selecting a website or content related to the query; 상기 질의어, 상기 관련 웹 사이트 및 상기 관련 콘텐츠 중 적어도 하나에 기초하여 사용자에게 검색결과를 제공할 템플릿을 자동으로 결정하는 단계; 및Automatically determining a template to provide a search result to a user based on at least one of the query word, the related web site and the related content; And 상기 결정된 템플릿에 따라 질의어 관련 검색결과를 제공하는 단계를 포함하는 정보제공방법.And providing search results related to the query according to the determined template. 제1항에 있어서, 질의어는 사용자가 입력하는 검색어 자체이거나 또는 부가적으로 상기 사용자 입력 검색어에 기초하여 구성된 확장검색어를 포함하는 것을 특징으로 하는 정보제공방법.The information providing method of claim 1, wherein the query word is a search word input by the user or additionally includes an extended search word configured based on the user input search word. 제1항 또는 제2항에 있어서,The method according to claim 1 or 2, 상기 사용자에게 제공되는 질의어 관련 검색결과 정보는 관련 웹 사이트들의 URL(Uniform Resource Locator)인 것을 특징으로 하는 정보 제공방법.The query-related search result information provided to the user is an information providing method, characterized in that the URL (Uniform Resource Locator) of the relevant web sites. 제1항 내지 제3항 중 어느 한 항에 있어서, The method according to any one of claims 1 to 3, 검색어 관련 사이트들의 정보를 제공함에 있어서 자동으로 생성된 사이트 제목정보 및 요약정보를 함께 제공하는 단계를 추가적으로 포함하는 정보제공방법.The information providing method further comprises the step of providing the site title information and summary information automatically generated in providing the information of the search site related sites. 제1항 또는 제2항에 있어서,The method according to claim 1 or 2, 상기 사용자에게 제공되는 질의어 관련 검색결과 정보는 소정의 방법에 의하여 추출된 질의어 관련 추천검색어인 것을 특징으로 하는 정보제공방법,The information providing method, characterized in that the query-related search result information provided to the user is a query-related recommended search word extracted by a predetermined method; 질의어와 관련된 웹 사이트 또는 콘텐츠를 선정하는 정보검색부;An information retrieval unit for selecting a web site or content related to the query word; 상기 질의어, 상기 관련 웹 사이트 및 상기 관련 콘텐츠 중 적어도 하나에 기초하여 사용자에게 검색결과를 제공할 템플릿을 자동으로 결정하는 템플릿 결정부; 및A template determination unit that automatically determines a template to provide a search result to a user based on at least one of the query word, the related web site, and the related content; And 상기 결정된 템플릿에 따라 질의어 관련 검색결과를 제공하는 단계를 포함하는 정보제공 장치.And providing search results related to the query according to the determined template. 제6항에 있어서, 질의어는 사용자가 입력하는 검색어 자체이거나 또는 부가적으로 상기 사용자 입력 검색어에 기초하여 구성된 확장검색어를 포함하는 것을 특징으로 하는 정보제공 장치The information providing apparatus of claim 6, wherein the query word is a search word input by the user or additionally includes an extended search word configured based on the user input search word. 제6항 또는 제7항에 있어서,The method according to claim 6 or 7, 상기 사용자에게 제공되는 질의어 관련 검색결과 정보는 관련 웹 사이트들의 URL(Uniform Resource Locator)인 것을 특징으로 하는 정보제공 장치.Information providing apparatus, characterized in that the query-related search result information provided to the user is a URL (Uniform Resource Locator) of the relevant web sites. 제6항 내지 제8항 중 어느 한 항에 있어서, The method according to any one of claims 6 to 8, 검색어 관련 사이트들의 정보를 제공함에 있어서 자동으로 생성된 사이트 제목정보 및 요약정보를 함께 제공하는 정보제시부를 추가적으로 포함하는 정보제공 장치.An information providing apparatus further comprising an information presentation unit for providing site title information and summary information which are automatically generated in providing information about search term related sites. 제6항 또는 제7항에 있어서,The method according to claim 6 or 7, 상기 사용자에게 제공되는 질의어 관련 검색결과 정보는 소정의 방법에 의하여 추출된 질의어 관련 추천검색어 정보인 것을 특징으로 하는 정보제공장치.The information providing apparatus related to the query word provided to the user is information related to the query word extracted by a predetermined method. 제1항 내지 제5항 중 어느 한 항에 기재된 방법을 컴퓨터상에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.A computer-readable recording medium having recorded thereon a program for executing the method according to any one of claims 1 to 5 on a computer.
KR1020050098926A 2005-10-20 2005-10-20 Method and apparatus for serving search result using template based on query and contents clustering KR20070043090A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020050098926A KR20070043090A (en) 2005-10-20 2005-10-20 Method and apparatus for serving search result using template based on query and contents clustering

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020050098926A KR20070043090A (en) 2005-10-20 2005-10-20 Method and apparatus for serving search result using template based on query and contents clustering

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020070072129A Division KR100913733B1 (en) 2007-07-19 2007-07-19 Method for Providing Search Result Using Template

Publications (1)

Publication Number Publication Date
KR20070043090A true KR20070043090A (en) 2007-04-25

Family

ID=38177632

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020050098926A KR20070043090A (en) 2005-10-20 2005-10-20 Method and apparatus for serving search result using template based on query and contents clustering

Country Status (1)

Country Link
KR (1) KR20070043090A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100931693B1 (en) * 2007-12-11 2009-12-14 주식회사 다음커뮤니케이션 How to search for keywords

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100931693B1 (en) * 2007-12-11 2009-12-14 주식회사 다음커뮤니케이션 How to search for keywords

Similar Documents

Publication Publication Date Title
US8166013B2 (en) Method and system for crawling, mapping and extracting information associated with a business using heuristic and semantic analysis
US7676745B2 (en) Document segmentation based on visual gaps
US7783644B1 (en) Query-independent entity importance in books
US9262530B2 (en) Search system using search subdomain and hints to subdomains in search query statements and sponsored results on a subdomain-by-subdomain basis
JP5576842B2 (en) Similarity calculation method between user characteristics
US7606794B2 (en) Active Abstracts
US7200820B1 (en) System and method for viewing search results
US8433704B2 (en) Local item extraction
US7607082B2 (en) Categorizing page block functionality to improve document layout for browsing
US20090144240A1 (en) Method and systems for using community bookmark data to supplement internet search results
TWI391834B (en) Systems for and methods of finding relevant documents by analyzing tags
US20050222989A1 (en) Results based personalization of advertisements in a search engine
US20070250501A1 (en) Search result delivery engine
JP2006127509A (en) System and method for providing geographic search function
JP2005182817A (en) Query recognizer
KR100913733B1 (en) Method for Providing Search Result Using Template
US20110307432A1 (en) Relevance for name segment searches
US8799257B1 (en) Searching based on audio and/or visual features of documents
KR100434902B1 (en) Knowledge base custom made information offer system and service method thereof
KR20000050225A (en) Internet information searching system and method by document auto summation
KR20050078655A (en) Dynamic keyword extraction and processing system
KR20010095215A (en) Method for retrieving data on internet through constructing site information database
KR20070043090A (en) Method and apparatus for serving search result using template based on query and contents clustering
KR101440385B1 (en) Device for managing information using indicator
KR20100115411A (en) System and method for providing contents information, user's terminals and recording medium

Legal Events

Date Code Title Description
A201 Request for examination
N231 Notification of change of applicant
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
J201 Request for trial against refusal decision
AMND Amendment
A107 Divisional application of patent
E801 Decision on dismissal of amendment
B601 Maintenance of original decision after re-examination before a trial
J301 Trial decision

Free format text: TRIAL DECISION FOR APPEAL AGAINST DECISION TO DECLINE REFUSAL REQUESTED 20070628

Effective date: 20080328

Free format text: TRIAL NUMBER: 2007101007047; TRIAL DECISION FOR APPEAL AGAINST DECISION TO DECLINE REFUSAL REQUESTED 20070628

Effective date: 20080328