KR100898458B1 - Method for searching information and system thereof - Google Patents
Method for searching information and system thereof Download PDFInfo
- Publication number
- KR100898458B1 KR100898458B1 KR1020070080878A KR20070080878A KR100898458B1 KR 100898458 B1 KR100898458 B1 KR 100898458B1 KR 1020070080878 A KR1020070080878 A KR 1020070080878A KR 20070080878 A KR20070080878 A KR 20070080878A KR 100898458 B1 KR100898458 B1 KR 100898458B1
- Authority
- KR
- South Korea
- Prior art keywords
- query
- category
- information
- type
- feedback information
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/247—Thesauruses; Synonyms
Abstract
정보 검색 방법 및 그 시스템을 제공한다. 정보 검색 방법은 복수 개의 질의에 대한 유형을 분석하는 단계와, 상기 분석된 유형에 따라 질의를 분류하는 단계와, 상기 분류된 질의를 이용하여 정보를 색인하는 단계 및 상기 색인 결과를 이용하여 사용자로부터 입력된 질의에 대응되는 정보를 검색하는 단계를 포함하고, 상기 질의에 대한 유형은 카테고리, 브랜드, 모델명 또는 동의어 질의를 포함한다.An information retrieval method and system thereof are provided. The information retrieval method includes analyzing types of a plurality of queries, classifying queries according to the analyzed types, indexing information using the classified queries, and using the index results from a user. Retrieving information corresponding to the entered query, wherein the type for the query includes a category, brand, model name, or synonym query.
카테고리, 피드백 정보, 검색 Category, feedback information, search
Description
본 발명은 정보 검색 방법 및 그 시스템에 관한 것으로, 더욱 상세하게는 사용자의 질의 의도에 적합한 정보를 검색하는 정보 검색 방법 및 그 시스템에 관한 것이다. The present invention relates to an information retrieval method and system, and more particularly, to an information retrieval method and system for retrieving information suitable for the user's query intent.
일반적으로 정보 검색 방법은 사용자가 입력한 쿼리를 분석하고, 상기 분석된 쿼리에 대응되는 검색 결과를 인기도순에 따라 정렬하여 제공한다. In general, an information retrieval method analyzes a query input by a user and provides search results corresponding to the analyzed query in order of popularity.
예를 들어 사용자가 '드럼'을 쿼리로 입력하여 악기인 드럼과 연관된 정보를 검색하고자 하는 경우, 종래 정보 검색 방법은 다른 사용자에 의해 '드럼'에 대응되는 검색 결과로 '드럼 세탁기'가 인기도가 높으면, 상기 사용자가 검색하고자 하는 악기인 드럼보다 드럼 세탁기를 우선적으로 검색 결과로 제공함으로써 사용자가 원하는 검색 결과를 우선적으로 제공하지 못하는 문제점이 있다. For example, if a user enters 'drum' as a query and wants to search for information related to the drum, which is a musical instrument, the conventional information retrieval method is a search result corresponding to 'drum' by another user. If high, the drum washing machine preferentially provides a search result over a drum, which is an instrument to be searched, so that the user cannot preferentially provide a desired search result.
일례로 사용자에 의해 입력된 질의가 '청바지'인 경우, 종래 정보 검색 방법은 남자 청바지 또는 여자 청바지 중 인기 있는 상품만을 검색함으로써 사용자가 여자이나 남자 청바지를 원하는 경우 여자 청바지 중 인기 있는 상품만을 검색 결 과로 제공하게 되면, 사용자가 원하는 정보를 제대로 검색하지 못하는 결과를 초래한다. For example, if the query entered by the user is 'jeans', the conventional information retrieval method searches only the popular items among men's jeans or women's jeans, so if the user wants women's or men's jeans, only the popular products among women's jeans are searched. Overprovisioning may result in a user not properly searching for the desired information.
일례로 사용자에 의해 입력된 질의가 '푸마'인 경우, 종래 정보 검색 방법은 어뷰즈(abuse)에 의해 '나이키/아디다스/폴로/빈폴' 등이 포함된 검색 결과가 상위에 노출되게 되면, 실제로 사용자가 원하는 푸마에 대한 검색 결과를 정확하게 제공하는 못하는 문제점이 있다.For example, when the query input by the user is 'puma', the conventional information retrieval method is actually used when the search results including 'Nike / Adidas / Polo / Beanpole' are exposed to the top by Abuse. There is a problem in that it does not provide an accurate search result for the desired puma.
따라서, 사용자의 질의 의도를 파악하여 보다 정확하게 사용자가 원하는 정보 검색 결과를 제공할 수 있는 방안이 절실하게 요청되고 있다.Therefore, there is an urgent need for a method that can grasp the query intention of the user and provide a more accurate information search result desired by the user.
본 발명은 사용자의 질의 의도에 적합한 정보를 검색하는 정보 검색 방법 및 그 시스템을 제공한다.The present invention provides an information retrieval method and system for retrieving information suitable for a user's query intent.
또한 본 발명은 어뷰즈를 제거하여 사용자가 원하는 보다 정확한 정보 검색 결과를 제공하는 정보 검색 방법 및 그 시스템을 제공한다.In addition, the present invention provides an information retrieval method and system that removes the abuse to provide a more accurate information search results desired by the user.
또한 본 발명은 정보 검색 시 수작업 검색 결과를 개선할 수 있는 정보 검색 방법 및 그 시스템을 제공한다.In addition, the present invention provides an information retrieval method and system that can improve the manual search results when retrieving information.
또한 본 발명은 상품 판매도를 검색 랭킹에 반영할 수 있는 정보 검색 방법 및 그 시스템을 제공한다.The present invention also provides an information retrieval method and system capable of reflecting a merchandise sales degree in a search ranking.
또한 본 발명은 상품 출시일을 검색 랭킹에 반영할 수 있는 정보 검색 방법 및 그 시스템을 제공한다.The present invention also provides an information retrieval method and system that can reflect the product release date in the search ranking.
본 발명의 일실시예에 따른 정보 검색 방법은, 복수 개의 질의에 대한 유형을 분석하는 단계와, 상기 분석된 유형에 따라 질의를 분류하는 단계와, 상기 분류된 질의를 이용하여 정보를 색인하는 단계 및 상기 색인 결과를 이용하여 사용자로부터 입력된 질의에 대응되는 정보를 검색하는 단계를 포함하고, 상기 질의에 대한 유형은 카테고리, 브랜드, 모델명 또는 동의어 질의를 포함한다. An information retrieval method according to an embodiment of the present invention includes analyzing types of a plurality of queries, classifying a query according to the analyzed types, and indexing information using the classified queries. And retrieving information corresponding to a query input from a user using the index result, wherein the type of the query includes a category, a brand, a model name, or a synonym query.
본 발명의 일실시예에 따른 정보 검색 시스템은, 복수 개의 질의에 대한 유형을 분석하는 분석부와, 상기 분석된 유형에 따라 질의를 분류하는 분류부와, 상 기 분류된 질의를 이용하여 정보를 색인하는 색인부 및 상기 색인 결과를 이용하여 사용자로부터 입력된 질의에 대응되는 정보를 검색하는 검색부를 포함하고, 상기 질의에 대한 유형은 카테고리, 브랜드, 모델명 또는 동의어 질의를 포함한다. An information retrieval system according to an embodiment of the present invention, the analysis unit for analyzing the types of the plurality of queries, the classification unit for classifying the query according to the analyzed type, and the information using the classified query An index unit for indexing and a search unit for searching for information corresponding to a query input from a user using the index result, the type of the query includes a category, brand, model name or synonym query.
본 발명에 따르면, 사용자의 질의 의도에 적합한 정보를 검색하는 정보 검색 방법 및 그 시스템을 제공할 수 있다.According to the present invention, an information retrieval method and system for retrieving information suitable for a user's query intent can be provided.
또한 본 발명에 따르면, 어뷰즈를 제거하여 사용자가 원하는 보다 정확한 정보 검색 결과를 제공하는 정보 검색 방법 및 그 시스템을 제공할 수 있다.In addition, according to the present invention, it is possible to provide an information retrieval method and system that provides a more accurate information retrieval result desired by the user by eliminating the abuse.
또한 본 발명에 따르면, 정보 검색 시 수작업 검색 결과를 개선할 수 있는 정보 검색 방법 및 그 시스템을 제공할 수 있다.In addition, according to the present invention, it is possible to provide an information retrieval method and system that can improve the manual search results when retrieving information.
또한 본 발명에 따르면, 상품 판매도를 검색 랭킹에 반영할 수 있는 정보 검색 방법 및 그 시스템을 제공할 수 있다.In addition, according to the present invention, it is possible to provide an information retrieval method and system that can reflect the product sales degree in the search ranking.
또한 본 발명에 따르면, 상품 출시일을 검색 랭킹에 반영할 수 있는 정보 검색 방법 및 그 시스템을 제공할 수 있다.In addition, according to the present invention, it is possible to provide an information retrieval method and system that can reflect the product release date in the search ranking.
이하 첨부된 도면들을 참조하여 본 발명에 따른 정보 검색 방법 및 그 시스템을 상세하게 설명하기로 한다. Hereinafter, an information retrieval method and system thereof according to the present invention will be described in detail with reference to the accompanying drawings.
도 1은 본 발명에 따른 정보 검색 시스템과 사용자 단말기간의 연동 관계를 나타내는 도면이다.1 is a diagram illustrating an interlocking relationship between an information retrieval system and a user terminal according to the present invention.
도 1을 참조하면, 사용자 단말기(110)는 사용자로부터 검색하고자 하는 질 의(query)를 입력 받으면, 상기 입력된 질의를 정보 검색 시스템(120)으로 전송한다.Referring to FIG. 1, when a
정보 검색 시스템(120)은 데이터베이스에 저장된 복수 개의 질의에 대한 유형을 분석한다. 상기 질의에 대한 유형은 카테고리, 브랜드, 모델명 또는 동의어 질의를 포함할 수 있다. 즉, 정보 검색 시스템(120)은 피드백 정보를 이용하여 질의 의도를 분석하고, 상기 질의 의도에 대한 분석 결과에 따라 상기 질의가 가장 많이 클릭된 정보들이 존재하는 카테고리를 랭킹함으로써 상기 질의에 대한 유형을 분석할 수 있다. 상기 피드백 정보는 질의에 대한 클릭 빈도 등을 포함할 수 있다. The
정보 검색 시스템(120)은 상기 분석된 유형에 따라 상기 정보에 대한 카테고리가 상위 카테고리명과 하위 카테고리명이 중복되는 경우, 중복된 카테고리명을 제거할 수 있다. 또한, 정보 검색 시스템(120)은 상기 분석된 유형에 따라 상기 정보에 대한 카테고리에 정해진 키워드가 포함된 경우, 정해진 카테고리를 제외한 상기 키워드가 포함된 카테고리를 제거할 수 있다. 또한, 정보 검색 시스템(120)은 상기 분석된 유형에 따라 상기 피드백 정보가 임계값 이하의 클릭 빈도를 갖는 경우, 상기 피드백 정보를 제거할 수 있다. The
정보 검색 시스템(120)은 상기 질의 의도에 대한 분석 결과에 따라 카테고리, 브랜드, 제조사, 모델명, 키워드 또는 피드백 정보에 대한 섹션 가중치를 적용하여 상기 섹션 가중치가 가장 높은 섹션을 이용하여 상기 정보를 랭킹할 수 있다. 또한, 정보 검색 시스템(120)은 상기 질의에 대한 누적된 클릭 빈도수, 어뷰즈 판 독 지수 또는 각 상품에 대한 판매지수를 반영하여 상기 질의에 대한 유형을 분석할 수 있다. 또한, 정보 검색 시스템(120)은 상기 어뷰즈 판독 지수가 기준치 이하인 경우, 상기 누적된 클릭 빈도수, 상기 어뷰즈 판독 지수 및 상기 판매 지수에 대해 패널티를 적용하여 상기 질의에 대한 유형을 분석할 수 있다. The
정보 검색 시스템(120)은 상기 분석된 유형에 따라 질의를 분류하고, 상기 분류된 질의를 이용하여 정보를 색인한다. 정보 검색 시스템(120)은 동의어 사전을 이용하여 상기 질의에 대한 동의어를 추가하여 상기 질의를 확장할 수 있다. The
정보 검색 시스템(120)은 상기 색인 결과를 이용하여 사용자로부터 입력된 질의에 대응되는 정보를 검색한다. 그리고, 정보 검색 시스템(120)은 상기 검색된 정보를 사용자 단말기(110)로 제공한다. The
도 2는 본 발명의 일실시예에 따른 정보 검색 시스템의 구성을 나타내는 도면이다.2 is a diagram illustrating a configuration of an information retrieval system according to an embodiment of the present invention.
도 2를 참조하면, 정보 검색 시스템(120)은 정보 데이터베이스(210), 분석부(220), 분류부(230), 색인부(240), 색인 데이터베이스(250) 및 검색부(260)를 포함한다.2, the
정보 데이터베이스(210)는 사용자들에 의해 입력된 복수 개의 질의 및 상기 질의에 따라 제공될 수 있는 각종 정보를 기록하고 유지한다. The
분석부(220)는 복수 개의 질의에 대한 유형을 분석한다. 즉, 분석부(220)는 정보 데이터베이스(210)에 기록된 복수 개의 질의에 대한 유형을 분석할 수 있다. 상기 질의에 대한 유형은 카테고리, 브랜드, 모델명 또는 동의어 질의를 포함할 수 있다. The
분석부(220)는 피드백 정보를 이용하여 질의 의도를 분석하고, 상기 질의 의도에 대한 분석 결과에 따라 상기 질의가 가장 많이 클릭된 정보들이 존재하는 카테고리를 랭킹하여 상기 정보를 분석한다. 상기 피드백 정보는 정보를 클릭한 사용자 질의 집합으로서 사용자들의 검색 의도를 파악할 수 있는 수단이며, 상기 정보가 클릭될 때 사용된 질의 및 상기 질의를 사용한 사용자들에 의해 상기 정보가 클릭된 횟수를 나타내는 클릭 빈도를 포함한다. The
도 5는 피드백 정보의 일례를 나타내는 도면이다.5 is a diagram illustrating an example of feedback information.
도 5를 참조하면, 상품 정보(510)는 사용자로부터 입력된 질의에 대한 검색 결과 중에서 상기 사용자에 의해 클릭된 쇼핑 상품 정보로서 아디다스 져지 트레이닝복 Warm Set 츄리닝(검/흰)을 나타낸다. 피드백 정보(520)는 상품 정보(510)를 클릭한 사용자 질의 집합으로서 사용자들에 의해 상품 정보(510)가 클릭된 횟수를 나타내는 클릭 빈도 및 상품 정보(510)를 클릭할 때 상기 사용자들에 의해 입력된 질의를 포함한다. 일례로 피드백 정보(520)는 상기 질의가 트레이닝복인 경우 상기 클릭 빈도가 412이고, 상기 질의가 아디다스인 경우 상기 클릭 빈도가 259이고, 상기 질의가 아디다스 트레이닝복인 경우 상기 클릭 빈도가 196이고, 상기 질의가 운동복인 경우 상기 클릭 빈도가 182이고, 상기 질의가 adidas 운동복인 경우 상기 클릭 빈도가 160이다. Referring to FIG. 5, the
이와 같이, 분석부(220)는 도 5에 도시된 것과 같은 피드백 정보를 이용하여 질의 의도를 분석하고, 상기 질의 의도에 대한 분석 결과에 따라 상기 질의가 가장 많이 클릭된 정보들이 존재하는 카테고리를 랭킹할 수 있다. As such, the
또한 분석부(220)는 상기 질의 의도에 대한 분석 결과에 따라 카테고리, 브랜드, 제조사, 모델명, 키워드, 또는 피드백 정보에 대한 섹션 가중치를 적용하여 상기 섹션 가중치가 가장 높은 섹션을 이용하여 상기 정보를 랭킹할 수 있다. Also, the
도 3은 분석부에 대한 구체적인 구성의 일례를 나타내는 도면이다.3 is a diagram illustrating an example of a specific configuration of an analysis unit.
도 3을 참조하면, 분석부(220)는 카테고리 정제부(310), 피드백 정보 정제부(320) 및 인기도 적용부(330)를 포함한다. Referring to FIG. 3, the
카테고리 정제부(310)는 상기 분석된 유형에 따라 상기 정보에 대한 카테고리가 상위 카테고리명과 하위 카테고리명이 중복되는 경우, 중복된 카테고리명을 제거하여 카테고리를 정제한다. 즉, 카테고리 정제부(310)는 다분류 카테고리명인 경우, 하위 카테고리명에 상위 카테고리명이 중복되면, 중복된 상위 카테고리명을 제거하여 상기 카테고리를 정제할 수 있다. When the category for the information overlaps the upper category name and the lower category name according to the analyzed type, the
도 6은 카테고리를 정제한 일례를 나타내는 도면이다.6 is a diagram illustrating an example of refining a category.
도 6을 참조하면, 일례로 제1 카테고리(610)를 정제하는 경우, 카테고리 정제부(310)는 '노트북/데스크탑/모니터>노트북>LG전자'와 같이 '노트북'이 상위 카테고리명과 하위 카테고리명이 중복되므로 중복된 상위 카테고리명인 '노트북/데스크탑/모니터'를 제거할 수 있다. Referring to FIG. 6, when the
일례로 제2 카테고리(620)를 정제하는 경우, 카테고리 정제부(310)는 '디카/캠코더>디지털카메라>캐논'과 같이 상위 카테고리명인 '디카'와 하위 카테고리명인 '디지털카메라'가 동의어에 해당하여 실질적으로 중복되어 있으므로 중복된 상 위 카테고리명인 '디카/캠코더'를 제거할 수 있다. For example, in the case of refining the
일례로 제3 카테고리(630)를 정제하는 경우, 카테고리 정제부(310)는 '기저귀/위생용품>팬티형>하기스'와 같이 하위 카테고리명에 상위 카테고리명이 존재하지 않으므로 카테고리명을 제거하지 않고, '기저귀/위생용품>팬티형>하기스'를 그대로 사용할 수 있다. For example, when refining the
또한 카테고리 정제부(310)는 카테고리에 중의적 의미를 가지는 키워드가 포함된 경우, 특정 의미를 택일하여 상기 특정 의미의 키워드가 포함된 카테고리를 제외한 나머지 모든 카테고리에서 상기 중의적 의미를 가지는 키워드를 제거할 수 있다. 일례로 상기 카테고리에 '기타'라는 키워드가 포함된 경우, 상기 카테고리가 악기인 '기타'에 대한 카테고리이면 유지하고, 상기 카테고리가 악기인 '기타'에 대한 카테고리를 제외한 모든 카테고리명에서 '기타'를 제거할 수 있다. Also, when the
피드백 정보 정제부(320)는 상기 분석된 유형에 따라 상기 피드백 정보가 임계값 이하의 클릭 빈도를 갖는 경우, 상기 피드백 정보를 제거하여 상기 피드백 정보를 정제한다. 즉, 피드백 정보 정제부(320)는 정보별 누적된 피드백 정보를 정제하기 위해 클릭 빈도 임계값을 정의하고, 상기 임계값 이하의 클릭 빈도를 갖는 피드백 정보를 제거함으로써 피드백 정보를 정제할 수 있다. 상기 클릭 빈도 임계값은 피드백 정보 내 클릭 빈도값, 바람직하게는 최대 클릭 빈도값을 참조하여 결정될 수 있다.The
도 7은 피드백 정보를 정제한 일례를 나타내는 도면이다.7 is a diagram illustrating an example in which feedback information is purified.
도 7을 참조하면, 피드백 정보(700)에서 최대 클릭 빈도를 참조하여 상기 클 릭 빈도 임계값을 일례로 '40'으로 정할 수 있다. 피드백 정보 정제부(320)는 피드백 정보(700)에서 상기 클릭 빈도 임계값인 '40'보다 작은 클릭 빈도가 '25'인 이효리폰과 '10'인 Sch-S470을 제거할 수 있다. Referring to FIG. 7, the click frequency threshold may be set to '40' as an example by referring to the maximum click frequency in the feedback information 700. The
인기도 적용부(330)는 상기 질의 의도에 대한 분석 결과에 따라 누적된 클릭 빈도수, 어뷰즈 판독 지수 또는 각 상품에 대한 판매지수를 인기도로 적용한다. 즉, 인기도 적용부(330)는 상기 누적된 클릭 빈도수를 로그(log) 정규화하고, 형태소 분석을 통한 상품명의 어뷰즈 판단 지수를 정규화하고, 상품의 판매 지수 리스트에서 최대값을 이용하여 인기도로 적용할 수 있다. 이때, 인기도 적용부(330)는 정보 생성 기간(Maxage)이 6개월 이내인 최신성 스코어를 상기 인기도에 반영할 수 있다. 또한 인기도 적용부(330)는 상기 어뷰즈 판독 지수가 기준치 이하인 경우, 상기 누적된 클릭 빈도수, 상기 어뷰즈 판독 지수 및 상기 판매 지수에 대해 패널티를 상기 인기도에 적용할 수 있다. 일례로 상기 어뷰즈 판독 지수가 기준치 이하인 경우, 인기도 적용부(330)는 상기 누적된 클릭 빈도수, 상기 어뷰즈 판독 지수, 상기 판매 지수 및 피드백 정보에 대한 클릭 빈도를 감소시킴으로써 패널티를 상기 인기도에 적용할 수 있다. The
분석부(220)는 상기 분석된 질의 의도, 인기도 및 유사도를 결합하여 검색 랭킹을 정의할 수 있다. 일례로 분석부(220)는 제품명(모델명), 카테고리명, 브랜드명, 피드백 정보의 빈도를 사용한 유사도를 정의할 수 있다. The
분류부(230)는 상기 분석된 유형에 따라 질의를 분류한다. The
도 4는 분류부에 대한 구성의 일례를 나타내는 도면이다.4 is a diagram illustrating an example of a configuration of a classification unit.
도 4를 참조하면, 분류부(230)는 질의 확장부(410) 및 질의 분류부(420)를 포함한다. 질의 확장부(410)는 동의어 사전을 이용하여 상기 질의에 대한 동의어를 추가하여 상기 질의를 확장한다. 즉, 질의 확장부(410)는 상기 동의어 사전을 이용하여 ORMAX 연산을 적용하여 상기 질의를 확장한다. 상기 확장된 질의는 하나의 개념으로서 질의 개수가 하나이다. 또한 질의 확장부(410)는 포스팅(Posting)을 머지(merge)할 때 가중치를 합하여 유사도를 생성하는 것이 아니라 최대값을 사용하고, 상기 가중치를 정규화하는 과정에서도 질의의 개수를 나누지 않는다. 일례로 상기 질의가 '휴대폰'인 경우, 질의 확장부(410)는 상기 동의어 사전을 이용하여 '휴대폰, 핸드폰, 최신폰, 핸펀' 등으로 질의를 확장할 수 있다. Referring to FIG. 4, the
질의 분류부(420)는 상기 확장된 질의를 분류한다. The
색인부(240)는 상기 분류된 질의를 이용하여 정보를 색인한다. The
색인 데이터베이스(250)는 상기 색인 결과를 기록하고 유지한다. 상기 색인 결과는 상기 질의 및 상기 질의에 대응되는 정보이다.
검색부(260)는 상기 색인 결과를 이용하여 사용자로부터 입력된 질의에 대응되는 정보를 검색한다. 즉, 검색부(260)는 색인 데이터베이스(250)를 참조하여 상기 사용자로부터 입력된 질의에 대응되는 정보를 검색할 수 있다. The
이와 같이, 본 발명에 따른 정보 검색 시스템은 사용자의 질의 의도에 적합한 카테고리의 정보를 검색할 수 있다. As such, the information retrieval system according to the present invention can retrieve information of a category suitable for a user's query intent.
도 8은 본 발명의 일실시예에 따른 정보 검색 방법의 흐름을 나타내는 도면이다.8 is a diagram illustrating a flow of an information retrieval method according to an embodiment of the present invention.
도 8을 참조하면, 단계(S810)에서 정보 검색 시스템은 복수 개의 질의에 대한 유형을 분석한다. 상기 질의에 대한 유형은 카테고리, 브랜드, 모델명 또는 동의어 질의를 포함할 수 있다. Referring to FIG. 8, in operation S810, the information retrieval system analyzes types of a plurality of queries. The type for the query may include a category, brand, model name or synonym query.
도 9는 질의에 대한 유형을 분석하는 단계를 보다 구체화한 일례를 나타내는 도면이다. 9 is a diagram illustrating an example of a more detailed step of analyzing a type of a query.
도 9를 참조하면, 단계(S910)에서 상기 정보 검색 시스템은 피드백 정보를 이용하여 질의 의도를 분석한다. 상기 피드백 정보는 상기 질의 및 상기 질의를 사용한 사용자들에 의해 클릭된 상품 정보의 클릭 횟수를 나타내는 클릭 빈도를 포함할 수 있다. Referring to FIG. 9, in step S910, the information retrieval system analyzes query intention using feedback information. The feedback information may include a click frequency indicating a number of clicks of the query and product information clicked by users who use the query.
단계(S920)에서 상기 정보 검색 시스템은 상기 질의 의도에 대한 분석 결과에 따라 상기 질의가 가장 많이 클릭된 정보들이 존재하는 카테고리를 랭킹한다. 즉, 단계(S920)에서 상기 정보 검색 시스템은 상기 질의 의도에 대한 분석 결과에 따라 카테고리, 브랜드, 제조사, 모델명, 키워드, 또는 피드백 정보에 대한 섹션 가중치를 적용하여 상기 섹션 가중치가 가장 높은 섹션을 이용하여 상기 정보를 랭킹할 수 있다. In step S920, the information retrieval system ranks the category in which the information in which the query is clicked most exists according to the analysis result of the query intention. That is, in step S920, the information retrieval system uses the section having the highest section weight by applying section weight to category, brand, manufacturer, model name, keyword, or feedback information according to the analysis result of the query intention. To rank the information.
일례로 단계(S810)에서 상기 정보 검색 시스템은 상기 질의에 대한 유형을 분석한 결과에 따라 질의에 대한 카테고리가 상위 카테고리명과 하위 카테고리명이 중복되는 경우, 중복된 카테고리명을 제거할 수 있다. For example, in operation S810, when the category for the query overlaps the upper category name and the lower category name according to a result of analyzing the type of the query, the information retrieval system may remove the duplicate category name.
일례로 단계(S810)에서 상기 정보 검색 시스템은 상기 질의에 대한 유형을 분석한 결과에 따라 상기 피드백 정보가 임계값 이하의 클릭 빈도를 갖는 경우, 상 기 피드백 정보를 제거할 수 있다. For example, in operation S810, when the feedback information has a click frequency less than or equal to a threshold value according to a result of analyzing the type of the query, the information retrieval system may remove the feedback information.
일례로 단계(S810)에서 상기 정보 검색 시스템은 상기 질의에 대한 누적된 클릭 빈도수, 어뷰즈 판독 지수 또는 각 상품에 대한 판매지수를 반영하여 상기 질의에 대한 유형을 분석할 수 있다. For example, in step S810, the information retrieval system may analyze the type of the query by reflecting the cumulative click frequency for the query, the Abyss reading index, or the sales index for each product.
일례로 단계(S810)에서 상기 정보 검색 시스템은 상기 어뷰즈 판독 지수가 기준치 이하인 경우, 상기 누적된 클릭 빈도수, 상기 어뷰즈 판독 지수 및 상기 판매 지수에 대해 패널티를 적용하여 상기 질의에 대한 유형을 분석할 수도 있다. For example, in operation S810, when the Abbers reading index is less than or equal to a reference value, the information retrieval system may analyze a type of the query by applying a penalty to the accumulated click frequency, the Abbuzz reading index, and the sales index. have.
단계(S820)에서 상기 정보 검색 시스템은 상기 분석된 유형에 따라 질의를 분류한다. 일례로 단계(S820)에서 상기 정보 검색 시스템은 동의어 사전을 이용하여 상기 질의에 대한 동의어를 추가하여 상기 질의를 확장한 후 상기 분석된 유형에 따라 상기 확장된 질의를 분류할 수 있다. In step S820, the information retrieval system classifies the query according to the analyzed type. For example, in operation S820, the information retrieval system may expand the query by adding a synonym for the query using a synonym dictionary, and then classify the extended query according to the analyzed type.
단계(S830)에서 상기 정보 검색 시스템은 상기 분류된 질의를 이용하여 정보를 색인한다. In step S830, the information retrieval system indexes the information using the classified query.
단계(S840)에서 상기 정보 검색 시스템은 상기 색인 결과를 이용하여 사용자로부터 입력된 질의에 대응되는 정보를 검색한다. In operation S840, the information retrieval system retrieves information corresponding to a query input from a user using the index result.
이와 같이, 본 발명에 따른 정보 검색 방법은 사용자의 질의 의도에 적합한 카테고리의 정보를 검색할 수 있다. As described above, the information retrieval method according to the present invention can retrieve information of a category suitable for the query intention of the user.
한편 본 발명에 따른 정보 검색 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능한 기록 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구 조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능한 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.Meanwhile, the information retrieval method according to the present invention can be implemented in the form of program instructions that can be executed by various computer means and recorded in a computer readable recording medium. The computer readable medium may include program instructions, data files, data structures, etc. alone or in combination. Program instructions recorded on the media may be those specially designed and constructed for the purposes of the present invention, or they may be of the kind well-known and available to those having skill in the computer software arts. Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks and magnetic tape, optical media such as CD-ROMs, DVDs, and magnetic disks such as floppy disks. Magneto-optical media, and hardware devices specifically configured to store and execute program instructions, such as ROM, RAM, flash memory, and the like. Examples of program instructions include not only machine code generated by a compiler, but also high-level language code that can be executed by a computer using an interpreter or the like. The hardware device described above may be configured to operate as one or more software modules to perform the operations of the present invention, and vice versa.
이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. As described above, the present invention has been described by way of limited embodiments and drawings, but the present invention is not limited to the above embodiments, and those skilled in the art to which the present invention pertains various modifications and variations from such descriptions. This is possible.
그러므로, 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 아니되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다. Therefore, the scope of the present invention should not be limited to the described embodiments, but should be determined not only by the claims below but also by the equivalents of the claims.
도 1은 본 발명에 따른 정보 검색 시스템과 사용자 단말기간의 연동 관계를 나타내는 도면이다.1 is a diagram illustrating an interlocking relationship between an information retrieval system and a user terminal according to the present invention.
도 2는 본 발명의 일실시예에 따른 정보 검색 시스템의 구성을 나타내는 도면이다.2 is a diagram illustrating a configuration of an information retrieval system according to an embodiment of the present invention.
도 3은 분석부에 대한 구체적인 구성의 일례를 나타내는 도면이다.3 is a diagram illustrating an example of a specific configuration of an analysis unit.
도 4는 분류부에 대한 구성의 일례를 나타내는 도면이다.4 is a diagram illustrating an example of a configuration of a classification unit.
도 5는 피드백 정보의 일례를 나타내는 도면이다.5 is a diagram illustrating an example of feedback information.
도 6은 카테고리를 정제한 일례를 나타내는 도면이다.6 is a diagram illustrating an example of refining a category.
도 7은 피드백 정보를 정제한 일례를 나타내는 도면이다.7 is a diagram illustrating an example in which feedback information is purified.
도 8은 본 발명의 일실시예에 따른 정보 검색 방법의 흐름을 나타내는 도면이다.8 is a diagram illustrating a flow of an information retrieval method according to an embodiment of the present invention.
도 9는 질의에 대한 유형을 분석하는 단계를 보다 구체화한 일례를 나타내는 도면이다.9 is a diagram illustrating an example of a more detailed step of analyzing a type of a query.
<도면의 주요 부분에 대한 부호의 설명><Explanation of symbols for the main parts of the drawings>
110: 사용자 단말기 120: 정보 검색 시스템110: user terminal 120: information retrieval system
210: 정보 데이터베이스 220: 분석부210: information database 220: analysis unit
230: 분류부 240: 색인부230: classification unit 240: index unit
250: 색인 데이터베이스 260: 검색부250: index database 260: search unit
310: 카테고리 정제부 320: 피드백 정보 정제부310: category refiner 320: feedback information refiner
330: 인기도 적용부330: popularity application
410: 질의 확장부 420: 질의 분류부410: query extension unit 420: query classification unit
Claims (19)
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020070080878A KR100898458B1 (en) | 2007-08-10 | 2007-08-10 | Method for searching information and system thereof |
JP2008205234A JP4750832B2 (en) | 2007-08-10 | 2008-08-08 | Information retrieval method and system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020070080878A KR100898458B1 (en) | 2007-08-10 | 2007-08-10 | Method for searching information and system thereof |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20090016328A KR20090016328A (en) | 2009-02-13 |
KR100898458B1 true KR100898458B1 (en) | 2009-05-21 |
Family
ID=40443888
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020070080878A KR100898458B1 (en) | 2007-08-10 | 2007-08-10 | Method for searching information and system thereof |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP4750832B2 (en) |
KR (1) | KR100898458B1 (en) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102253936B (en) * | 2010-05-18 | 2013-07-24 | 阿里巴巴集团控股有限公司 | Method for recording access of user to merchandise information, search method and server |
CN102810104B (en) * | 2011-06-03 | 2015-05-20 | 阿里巴巴集团控股有限公司 | Information adjusting method and device |
US9298776B2 (en) | 2011-06-08 | 2016-03-29 | Ebay Inc. | System and method for mining category aspect information |
CN103368986B (en) | 2012-03-27 | 2017-04-26 | 阿里巴巴集团控股有限公司 | Information recommendation method and information recommendation device |
KR101509209B1 (en) * | 2014-01-13 | 2015-04-09 | 네이버 주식회사 | Apparatus of providing searching service, and method of providing searching service |
KR101616958B1 (en) * | 2015-01-26 | 2016-04-29 | 주식회사 포워드벤처스 | Apparatus, method and computer program for providing shopping service |
CN106951422B (en) * | 2016-01-07 | 2021-05-28 | 腾讯科技(深圳)有限公司 | Webpage training method and device, and search intention identification method and device |
CN108664515B (en) * | 2017-03-31 | 2019-09-17 | 北京三快在线科技有限公司 | A kind of searching method and device, electronic equipment |
KR102491077B1 (en) | 2020-08-10 | 2023-01-20 | 네이버 주식회사 | Method and system for providing sports team ranking on real-time issue |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20020032060A (en) * | 2000-10-25 | 2002-05-03 | 전종훈 | Method and System for Retrieving Information using Proximity Search Formula |
KR20040006515A (en) * | 2002-07-12 | 2004-01-24 | 주식회사 네오위즈 | Method And System for Providing Information Service System and Searching Result by Using Log Analysis and Information Inputed by User |
KR20050049206A (en) * | 2003-11-21 | 2005-05-25 | 한국전자통신연구원 | Apparatus for xml yellow-page web-service making possible to update a category and system using it |
KR20050095230A (en) * | 2004-03-25 | 2005-09-29 | 주식회사 첫눈 | Method and system for providing information service and information search service by using visited uniform resource locator log |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4453229B2 (en) * | 2001-07-03 | 2010-04-21 | 日本電気株式会社 | Information search system, information search method, and information search program |
JP4230710B2 (en) * | 2002-03-19 | 2009-02-25 | 株式会社ジャストシステム | SEARCH DEVICE, SEARCH METHOD, AND PROGRAM |
JP4453437B2 (en) * | 2004-05-11 | 2010-04-21 | 日本電信電話株式会社 | Search keyword ranking method, apparatus and program |
-
2007
- 2007-08-10 KR KR1020070080878A patent/KR100898458B1/en active IP Right Grant
-
2008
- 2008-08-08 JP JP2008205234A patent/JP4750832B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20020032060A (en) * | 2000-10-25 | 2002-05-03 | 전종훈 | Method and System for Retrieving Information using Proximity Search Formula |
KR20040006515A (en) * | 2002-07-12 | 2004-01-24 | 주식회사 네오위즈 | Method And System for Providing Information Service System and Searching Result by Using Log Analysis and Information Inputed by User |
KR20050049206A (en) * | 2003-11-21 | 2005-05-25 | 한국전자통신연구원 | Apparatus for xml yellow-page web-service making possible to update a category and system using it |
KR20050095230A (en) * | 2004-03-25 | 2005-09-29 | 주식회사 첫눈 | Method and system for providing information service and information search service by using visited uniform resource locator log |
Also Published As
Publication number | Publication date |
---|---|
JP4750832B2 (en) | 2011-08-17 |
JP2009043264A (en) | 2009-02-26 |
KR20090016328A (en) | 2009-02-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100898458B1 (en) | Method for searching information and system thereof | |
Deveaud et al. | Accurate and effective latent concept modeling for ad hoc information retrieval | |
US7769751B1 (en) | Method and apparatus for classifying documents based on user inputs | |
US8983963B2 (en) | Techniques for comparing and clustering documents | |
US8612208B2 (en) | Ontology for use with a system, method, and computer readable medium for retrieving information and response to a query | |
KR100898459B1 (en) | Method for classifying query and system thereof | |
JP2010055618A (en) | Method and system for providing search based on topic | |
JP2010170529A (en) | Method and system for object classification | |
JP2009093653A (en) | Refining search space responding to user input | |
KR101098832B1 (en) | Apparatus and method for a personalized search | |
US8577865B2 (en) | Document searching system | |
Ru et al. | Indexing the invisible web: a survey | |
Kumar et al. | Book search using social information, user profiles and query expansion with pseudo relevance feedback | |
Sharifpour et al. | Large-scale analysis of query logs to profile users for dataset search | |
Ibrahim et al. | Scientometric re-ranking approach to improve search results | |
Campos et al. | Enriching temporal query understanding through date identification: how to tag implicit temporal queries? | |
JPWO2016067396A1 (en) | Sentence sorting method and calculator | |
Gamzu et al. | Query rewriting for voice shopping null queries | |
Rajkumar et al. | Users’ click and bookmark based personalization using modified agglomerative clustering for web search engine | |
Vadivel et al. | An Effective Document Category Prediction System Using Support Vector Machines, Mann-Whitney Techniques | |
JP2002288189A (en) | Method and apparatus for classifying documents, and recording medium with document classification processing program recorded thereon | |
Kirtsis et al. | Query reformulation for task-oriented web searches | |
Kowalski | Information system evaluation | |
Knees et al. | Contextual music similarity, indexing, and retrieval | |
JP5458058B2 (en) | Product name identity determination device and product name identity determination program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20120329 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20160329 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20170328 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20190401 Year of fee payment: 11 |