KR100898458B1 - Method for searching information and system thereof - Google Patents

Method for searching information and system thereof Download PDF

Info

Publication number
KR100898458B1
KR100898458B1 KR1020070080878A KR20070080878A KR100898458B1 KR 100898458 B1 KR100898458 B1 KR 100898458B1 KR 1020070080878 A KR1020070080878 A KR 1020070080878A KR 20070080878 A KR20070080878 A KR 20070080878A KR 100898458 B1 KR100898458 B1 KR 100898458B1
Authority
KR
South Korea
Prior art keywords
query
category
information
type
feedback information
Prior art date
Application number
KR1020070080878A
Other languages
Korean (ko)
Other versions
KR20090016328A (en
Inventor
최지훈
김광현
이상호
Original Assignee
엔에이치엔(주)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엔에이치엔(주) filed Critical 엔에이치엔(주)
Priority to KR1020070080878A priority Critical patent/KR100898458B1/en
Priority to JP2008205234A priority patent/JP4750832B2/en
Publication of KR20090016328A publication Critical patent/KR20090016328A/en
Application granted granted Critical
Publication of KR100898458B1 publication Critical patent/KR100898458B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/247Thesauruses; Synonyms

Abstract

정보 검색 방법 및 그 시스템을 제공한다. 정보 검색 방법은 복수 개의 질의에 대한 유형을 분석하는 단계와, 상기 분석된 유형에 따라 질의를 분류하는 단계와, 상기 분류된 질의를 이용하여 정보를 색인하는 단계 및 상기 색인 결과를 이용하여 사용자로부터 입력된 질의에 대응되는 정보를 검색하는 단계를 포함하고, 상기 질의에 대한 유형은 카테고리, 브랜드, 모델명 또는 동의어 질의를 포함한다.An information retrieval method and system thereof are provided. The information retrieval method includes analyzing types of a plurality of queries, classifying queries according to the analyzed types, indexing information using the classified queries, and using the index results from a user. Retrieving information corresponding to the entered query, wherein the type for the query includes a category, brand, model name, or synonym query.

카테고리, 피드백 정보, 검색 Category, feedback information, search

Description

정보 검색 방법 및 그 시스템{method for searching information and system thereof}Method for searching information and system

본 발명은 정보 검색 방법 및 그 시스템에 관한 것으로, 더욱 상세하게는 사용자의 질의 의도에 적합한 정보를 검색하는 정보 검색 방법 및 그 시스템에 관한 것이다. The present invention relates to an information retrieval method and system, and more particularly, to an information retrieval method and system for retrieving information suitable for the user's query intent.

일반적으로 정보 검색 방법은 사용자가 입력한 쿼리를 분석하고, 상기 분석된 쿼리에 대응되는 검색 결과를 인기도순에 따라 정렬하여 제공한다. In general, an information retrieval method analyzes a query input by a user and provides search results corresponding to the analyzed query in order of popularity.

예를 들어 사용자가 '드럼'을 쿼리로 입력하여 악기인 드럼과 연관된 정보를 검색하고자 하는 경우, 종래 정보 검색 방법은 다른 사용자에 의해 '드럼'에 대응되는 검색 결과로 '드럼 세탁기'가 인기도가 높으면, 상기 사용자가 검색하고자 하는 악기인 드럼보다 드럼 세탁기를 우선적으로 검색 결과로 제공함으로써 사용자가 원하는 검색 결과를 우선적으로 제공하지 못하는 문제점이 있다. For example, if a user enters 'drum' as a query and wants to search for information related to the drum, which is a musical instrument, the conventional information retrieval method is a search result corresponding to 'drum' by another user. If high, the drum washing machine preferentially provides a search result over a drum, which is an instrument to be searched, so that the user cannot preferentially provide a desired search result.

일례로 사용자에 의해 입력된 질의가 '청바지'인 경우, 종래 정보 검색 방법은 남자 청바지 또는 여자 청바지 중 인기 있는 상품만을 검색함으로써 사용자가 여자이나 남자 청바지를 원하는 경우 여자 청바지 중 인기 있는 상품만을 검색 결 과로 제공하게 되면, 사용자가 원하는 정보를 제대로 검색하지 못하는 결과를 초래한다. For example, if the query entered by the user is 'jeans', the conventional information retrieval method searches only the popular items among men's jeans or women's jeans, so if the user wants women's or men's jeans, only the popular products among women's jeans are searched. Overprovisioning may result in a user not properly searching for the desired information.

일례로 사용자에 의해 입력된 질의가 '푸마'인 경우, 종래 정보 검색 방법은 어뷰즈(abuse)에 의해 '나이키/아디다스/폴로/빈폴' 등이 포함된 검색 결과가 상위에 노출되게 되면, 실제로 사용자가 원하는 푸마에 대한 검색 결과를 정확하게 제공하는 못하는 문제점이 있다.For example, when the query input by the user is 'puma', the conventional information retrieval method is actually used when the search results including 'Nike / Adidas / Polo / Beanpole' are exposed to the top by Abuse. There is a problem in that it does not provide an accurate search result for the desired puma.

따라서, 사용자의 질의 의도를 파악하여 보다 정확하게 사용자가 원하는 정보 검색 결과를 제공할 수 있는 방안이 절실하게 요청되고 있다.Therefore, there is an urgent need for a method that can grasp the query intention of the user and provide a more accurate information search result desired by the user.

본 발명은 사용자의 질의 의도에 적합한 정보를 검색하는 정보 검색 방법 및 그 시스템을 제공한다.The present invention provides an information retrieval method and system for retrieving information suitable for a user's query intent.

또한 본 발명은 어뷰즈를 제거하여 사용자가 원하는 보다 정확한 정보 검색 결과를 제공하는 정보 검색 방법 및 그 시스템을 제공한다.In addition, the present invention provides an information retrieval method and system that removes the abuse to provide a more accurate information search results desired by the user.

또한 본 발명은 정보 검색 시 수작업 검색 결과를 개선할 수 있는 정보 검색 방법 및 그 시스템을 제공한다.In addition, the present invention provides an information retrieval method and system that can improve the manual search results when retrieving information.

또한 본 발명은 상품 판매도를 검색 랭킹에 반영할 수 있는 정보 검색 방법 및 그 시스템을 제공한다.The present invention also provides an information retrieval method and system capable of reflecting a merchandise sales degree in a search ranking.

또한 본 발명은 상품 출시일을 검색 랭킹에 반영할 수 있는 정보 검색 방법 및 그 시스템을 제공한다.The present invention also provides an information retrieval method and system that can reflect the product release date in the search ranking.

본 발명의 일실시예에 따른 정보 검색 방법은, 복수 개의 질의에 대한 유형을 분석하는 단계와, 상기 분석된 유형에 따라 질의를 분류하는 단계와, 상기 분류된 질의를 이용하여 정보를 색인하는 단계 및 상기 색인 결과를 이용하여 사용자로부터 입력된 질의에 대응되는 정보를 검색하는 단계를 포함하고, 상기 질의에 대한 유형은 카테고리, 브랜드, 모델명 또는 동의어 질의를 포함한다. An information retrieval method according to an embodiment of the present invention includes analyzing types of a plurality of queries, classifying a query according to the analyzed types, and indexing information using the classified queries. And retrieving information corresponding to a query input from a user using the index result, wherein the type of the query includes a category, a brand, a model name, or a synonym query.

본 발명의 일실시예에 따른 정보 검색 시스템은, 복수 개의 질의에 대한 유형을 분석하는 분석부와, 상기 분석된 유형에 따라 질의를 분류하는 분류부와, 상 기 분류된 질의를 이용하여 정보를 색인하는 색인부 및 상기 색인 결과를 이용하여 사용자로부터 입력된 질의에 대응되는 정보를 검색하는 검색부를 포함하고, 상기 질의에 대한 유형은 카테고리, 브랜드, 모델명 또는 동의어 질의를 포함한다. An information retrieval system according to an embodiment of the present invention, the analysis unit for analyzing the types of the plurality of queries, the classification unit for classifying the query according to the analyzed type, and the information using the classified query An index unit for indexing and a search unit for searching for information corresponding to a query input from a user using the index result, the type of the query includes a category, brand, model name or synonym query.

본 발명에 따르면, 사용자의 질의 의도에 적합한 정보를 검색하는 정보 검색 방법 및 그 시스템을 제공할 수 있다.According to the present invention, an information retrieval method and system for retrieving information suitable for a user's query intent can be provided.

또한 본 발명에 따르면, 어뷰즈를 제거하여 사용자가 원하는 보다 정확한 정보 검색 결과를 제공하는 정보 검색 방법 및 그 시스템을 제공할 수 있다.In addition, according to the present invention, it is possible to provide an information retrieval method and system that provides a more accurate information retrieval result desired by the user by eliminating the abuse.

또한 본 발명에 따르면, 정보 검색 시 수작업 검색 결과를 개선할 수 있는 정보 검색 방법 및 그 시스템을 제공할 수 있다.In addition, according to the present invention, it is possible to provide an information retrieval method and system that can improve the manual search results when retrieving information.

또한 본 발명에 따르면, 상품 판매도를 검색 랭킹에 반영할 수 있는 정보 검색 방법 및 그 시스템을 제공할 수 있다.In addition, according to the present invention, it is possible to provide an information retrieval method and system that can reflect the product sales degree in the search ranking.

또한 본 발명에 따르면, 상품 출시일을 검색 랭킹에 반영할 수 있는 정보 검색 방법 및 그 시스템을 제공할 수 있다.In addition, according to the present invention, it is possible to provide an information retrieval method and system that can reflect the product release date in the search ranking.

이하 첨부된 도면들을 참조하여 본 발명에 따른 정보 검색 방법 및 그 시스템을 상세하게 설명하기로 한다. Hereinafter, an information retrieval method and system thereof according to the present invention will be described in detail with reference to the accompanying drawings.

도 1은 본 발명에 따른 정보 검색 시스템과 사용자 단말기간의 연동 관계를 나타내는 도면이다.1 is a diagram illustrating an interlocking relationship between an information retrieval system and a user terminal according to the present invention.

도 1을 참조하면, 사용자 단말기(110)는 사용자로부터 검색하고자 하는 질 의(query)를 입력 받으면, 상기 입력된 질의를 정보 검색 시스템(120)으로 전송한다.Referring to FIG. 1, when a user terminal 110 receives a query to search from a user, the user terminal 110 transmits the input query to the information retrieval system 120.

정보 검색 시스템(120)은 데이터베이스에 저장된 복수 개의 질의에 대한 유형을 분석한다. 상기 질의에 대한 유형은 카테고리, 브랜드, 모델명 또는 동의어 질의를 포함할 수 있다. 즉, 정보 검색 시스템(120)은 피드백 정보를 이용하여 질의 의도를 분석하고, 상기 질의 의도에 대한 분석 결과에 따라 상기 질의가 가장 많이 클릭된 정보들이 존재하는 카테고리를 랭킹함으로써 상기 질의에 대한 유형을 분석할 수 있다. 상기 피드백 정보는 질의에 대한 클릭 빈도 등을 포함할 수 있다. The information retrieval system 120 analyzes the types of the plurality of queries stored in the database. The type for the query may include a category, brand, model name or synonym query. That is, the information retrieval system 120 analyzes the query intention using the feedback information and ranks the category in which the information in which the query is most clicked according to the analysis result of the query intention is selected. Can be analyzed. The feedback information may include a click frequency for a query.

정보 검색 시스템(120)은 상기 분석된 유형에 따라 상기 정보에 대한 카테고리가 상위 카테고리명과 하위 카테고리명이 중복되는 경우, 중복된 카테고리명을 제거할 수 있다. 또한, 정보 검색 시스템(120)은 상기 분석된 유형에 따라 상기 정보에 대한 카테고리에 정해진 키워드가 포함된 경우, 정해진 카테고리를 제외한 상기 키워드가 포함된 카테고리를 제거할 수 있다. 또한, 정보 검색 시스템(120)은 상기 분석된 유형에 따라 상기 피드백 정보가 임계값 이하의 클릭 빈도를 갖는 경우, 상기 피드백 정보를 제거할 수 있다. The information retrieval system 120 may remove the duplicate category name when the category for the information overlaps the upper category name and the lower category name according to the analyzed type. In addition, the information retrieval system 120 may remove a category including the keyword except for the predetermined category when the predetermined keyword is included in the category for the information according to the analyzed type. In addition, the information retrieval system 120 may remove the feedback information when the feedback information has a click frequency less than or equal to a threshold value according to the analyzed type.

정보 검색 시스템(120)은 상기 질의 의도에 대한 분석 결과에 따라 카테고리, 브랜드, 제조사, 모델명, 키워드 또는 피드백 정보에 대한 섹션 가중치를 적용하여 상기 섹션 가중치가 가장 높은 섹션을 이용하여 상기 정보를 랭킹할 수 있다. 또한, 정보 검색 시스템(120)은 상기 질의에 대한 누적된 클릭 빈도수, 어뷰즈 판 독 지수 또는 각 상품에 대한 판매지수를 반영하여 상기 질의에 대한 유형을 분석할 수 있다. 또한, 정보 검색 시스템(120)은 상기 어뷰즈 판독 지수가 기준치 이하인 경우, 상기 누적된 클릭 빈도수, 상기 어뷰즈 판독 지수 및 상기 판매 지수에 대해 패널티를 적용하여 상기 질의에 대한 유형을 분석할 수 있다. The information retrieval system 120 may rank the information using the section having the highest section weight by applying section weights to categories, brands, manufacturers, model names, keywords, or feedback information according to the analysis result of the query intention. Can be. In addition, the information retrieval system 120 may analyze the type of the query by reflecting the cumulative click frequency for the query, the Abyss reading index, or the sales index for each product. The information retrieval system 120 may analyze the type of the query by applying penalties to the accumulated click frequency, the Abyss reading index, and the sales index, when the Abyss reading index is less than or equal to a reference value.

정보 검색 시스템(120)은 상기 분석된 유형에 따라 질의를 분류하고, 상기 분류된 질의를 이용하여 정보를 색인한다. 정보 검색 시스템(120)은 동의어 사전을 이용하여 상기 질의에 대한 동의어를 추가하여 상기 질의를 확장할 수 있다. The information retrieval system 120 classifies the query according to the analyzed type, and indexes the information using the classified query. The information retrieval system 120 may expand the query by adding synonyms to the query using the synonym dictionary.

정보 검색 시스템(120)은 상기 색인 결과를 이용하여 사용자로부터 입력된 질의에 대응되는 정보를 검색한다. 그리고, 정보 검색 시스템(120)은 상기 검색된 정보를 사용자 단말기(110)로 제공한다. The information retrieval system 120 retrieves information corresponding to a query input from a user using the index result. In addition, the information retrieval system 120 provides the retrieved information to the user terminal 110.

도 2는 본 발명의 일실시예에 따른 정보 검색 시스템의 구성을 나타내는 도면이다.2 is a diagram illustrating a configuration of an information retrieval system according to an embodiment of the present invention.

도 2를 참조하면, 정보 검색 시스템(120)은 정보 데이터베이스(210), 분석부(220), 분류부(230), 색인부(240), 색인 데이터베이스(250) 및 검색부(260)를 포함한다.2, the information retrieval system 120 includes an information database 210, an analysis unit 220, a classification unit 230, an index unit 240, an index database 250, and a search unit 260. do.

정보 데이터베이스(210)는 사용자들에 의해 입력된 복수 개의 질의 및 상기 질의에 따라 제공될 수 있는 각종 정보를 기록하고 유지한다. The information database 210 records and maintains a plurality of queries input by users and various information that can be provided according to the queries.

분석부(220)는 복수 개의 질의에 대한 유형을 분석한다. 즉, 분석부(220)는 정보 데이터베이스(210)에 기록된 복수 개의 질의에 대한 유형을 분석할 수 있다. 상기 질의에 대한 유형은 카테고리, 브랜드, 모델명 또는 동의어 질의를 포함할 수 있다. The analyzer 220 analyzes the types of the plurality of queries. That is, the analyzer 220 may analyze the types of the plurality of queries recorded in the information database 210. The type for the query may include a category, brand, model name or synonym query.

분석부(220)는 피드백 정보를 이용하여 질의 의도를 분석하고, 상기 질의 의도에 대한 분석 결과에 따라 상기 질의가 가장 많이 클릭된 정보들이 존재하는 카테고리를 랭킹하여 상기 정보를 분석한다. 상기 피드백 정보는 정보를 클릭한 사용자 질의 집합으로서 사용자들의 검색 의도를 파악할 수 있는 수단이며, 상기 정보가 클릭될 때 사용된 질의 및 상기 질의를 사용한 사용자들에 의해 상기 정보가 클릭된 횟수를 나타내는 클릭 빈도를 포함한다. The analysis unit 220 analyzes the query intention using the feedback information, and analyzes the information by ranking the category in which the information in which the query is clicked the most is located according to the analysis result of the query intention. The feedback information is a user query set that clicks on information, and means for identifying the search intention of users, and a click indicating a query used when the information is clicked and the number of times the information is clicked by users using the query. Include frequency.

도 5는 피드백 정보의 일례를 나타내는 도면이다.5 is a diagram illustrating an example of feedback information.

도 5를 참조하면, 상품 정보(510)는 사용자로부터 입력된 질의에 대한 검색 결과 중에서 상기 사용자에 의해 클릭된 쇼핑 상품 정보로서 아디다스 져지 트레이닝복 Warm Set 츄리닝(검/흰)을 나타낸다. 피드백 정보(520)는 상품 정보(510)를 클릭한 사용자 질의 집합으로서 사용자들에 의해 상품 정보(510)가 클릭된 횟수를 나타내는 클릭 빈도 및 상품 정보(510)를 클릭할 때 상기 사용자들에 의해 입력된 질의를 포함한다. 일례로 피드백 정보(520)는 상기 질의가 트레이닝복인 경우 상기 클릭 빈도가 412이고, 상기 질의가 아디다스인 경우 상기 클릭 빈도가 259이고, 상기 질의가 아디다스 트레이닝복인 경우 상기 클릭 빈도가 196이고, 상기 질의가 운동복인 경우 상기 클릭 빈도가 182이고, 상기 질의가 adidas 운동복인 경우 상기 클릭 빈도가 160이다. Referring to FIG. 5, the product information 510 represents adidas jersey sweatshirt warm set sweats (black / white) as shopping product information clicked by the user among search results for a query input from a user. The feedback information 520 is a set of user queries that click on the product information 510. The feedback information 520 indicates a click frequency indicating the number of times the product information 510 is clicked by the users and when the product information 510 is clicked. Contains the entered query. For example, the feedback information 520 may have a click frequency of 412 when the query is a sweat suit, a click frequency of 259 when the query is adidas, a click frequency of 196 when the query is adidas sweatshirt, and the query. Is 182 when the sportswear, and the click frequency is 160 when the query is adidas sportswear.

이와 같이, 분석부(220)는 도 5에 도시된 것과 같은 피드백 정보를 이용하여 질의 의도를 분석하고, 상기 질의 의도에 대한 분석 결과에 따라 상기 질의가 가장 많이 클릭된 정보들이 존재하는 카테고리를 랭킹할 수 있다. As such, the analysis unit 220 analyzes the query intention using the feedback information as shown in FIG. 5, and ranks the category in which the information in which the query is clicked most exists according to the analysis result of the query intention. can do.

또한 분석부(220)는 상기 질의 의도에 대한 분석 결과에 따라 카테고리, 브랜드, 제조사, 모델명, 키워드, 또는 피드백 정보에 대한 섹션 가중치를 적용하여 상기 섹션 가중치가 가장 높은 섹션을 이용하여 상기 정보를 랭킹할 수 있다. Also, the analysis unit 220 ranks the information using the section having the highest section weight by applying section weights to categories, brands, manufacturers, model names, keywords, or feedback information according to the analysis result of the query intention. can do.

도 3은 분석부에 대한 구체적인 구성의 일례를 나타내는 도면이다.3 is a diagram illustrating an example of a specific configuration of an analysis unit.

도 3을 참조하면, 분석부(220)는 카테고리 정제부(310), 피드백 정보 정제부(320) 및 인기도 적용부(330)를 포함한다. Referring to FIG. 3, the analyzer 220 includes a category refiner 310, a feedback information refiner 320, and a popularity applier 330.

카테고리 정제부(310)는 상기 분석된 유형에 따라 상기 정보에 대한 카테고리가 상위 카테고리명과 하위 카테고리명이 중복되는 경우, 중복된 카테고리명을 제거하여 카테고리를 정제한다. 즉, 카테고리 정제부(310)는 다분류 카테고리명인 경우, 하위 카테고리명에 상위 카테고리명이 중복되면, 중복된 상위 카테고리명을 제거하여 상기 카테고리를 정제할 수 있다. When the category for the information overlaps the upper category name and the lower category name according to the analyzed type, the category refining unit 310 purifies the category by removing the duplicate category name. That is, in the case of a multi-category category name, the category refining unit 310 may refine the category by removing the duplicate upper category name if the upper category name overlaps with the lower category name.

도 6은 카테고리를 정제한 일례를 나타내는 도면이다.6 is a diagram illustrating an example of refining a category.

도 6을 참조하면, 일례로 제1 카테고리(610)를 정제하는 경우, 카테고리 정제부(310)는 '노트북/데스크탑/모니터>노트북>LG전자'와 같이 '노트북'이 상위 카테고리명과 하위 카테고리명이 중복되므로 중복된 상위 카테고리명인 '노트북/데스크탑/모니터'를 제거할 수 있다. Referring to FIG. 6, when the first category 610 is refined, the category refiner 310 may have a 'notebook' as an upper category name and a lower category name such as 'notebook / desktop / monitor> notebook> LG electronic'. As it is duplicated, duplicate parent category name 'laptop / desktop / monitor' can be removed.

일례로 제2 카테고리(620)를 정제하는 경우, 카테고리 정제부(310)는 '디카/캠코더>디지털카메라>캐논'과 같이 상위 카테고리명인 '디카'와 하위 카테고리명인 '디지털카메라'가 동의어에 해당하여 실질적으로 중복되어 있으므로 중복된 상 위 카테고리명인 '디카/캠코더'를 제거할 수 있다. For example, in the case of refining the second category 620, the category refining unit 310 is synonymous with the upper category name 'dica' and the lower category name 'digital camera' such as 'dica / camcorder> digital camera> canon'. Therefore, since it is substantially duplicated, it is possible to remove the duplicate category name 'dica / camcorder'.

일례로 제3 카테고리(630)를 정제하는 경우, 카테고리 정제부(310)는 '기저귀/위생용품>팬티형>하기스'와 같이 하위 카테고리명에 상위 카테고리명이 존재하지 않으므로 카테고리명을 제거하지 않고, '기저귀/위생용품>팬티형>하기스'를 그대로 사용할 수 있다. For example, when refining the third category 630, the category refining unit 310 does not remove the category name because the upper category name does not exist in the lower category name, such as 'diaper / sanitary products> panty type> Huggies', Diapers / Hygiene items> Panties> Huggies' can be used as it is.

또한 카테고리 정제부(310)는 카테고리에 중의적 의미를 가지는 키워드가 포함된 경우, 특정 의미를 택일하여 상기 특정 의미의 키워드가 포함된 카테고리를 제외한 나머지 모든 카테고리에서 상기 중의적 의미를 가지는 키워드를 제거할 수 있다. 일례로 상기 카테고리에 '기타'라는 키워드가 포함된 경우, 상기 카테고리가 악기인 '기타'에 대한 카테고리이면 유지하고, 상기 카테고리가 악기인 '기타'에 대한 카테고리를 제외한 모든 카테고리명에서 '기타'를 제거할 수 있다. Also, when the category refining unit 310 includes a keyword having an implicit meaning in a category, the category refining unit 310 selects a specific meaning and removes the keyword having the implicit meaning from all categories except the category including the keyword having the specific meaning. can do. For example, when the category includes the keyword 'guitar', the category is maintained for the category 'guitar' which is an instrument, and the category 'guitar' in all category names except the category for the guitar 'guitar'. Can be removed.

피드백 정보 정제부(320)는 상기 분석된 유형에 따라 상기 피드백 정보가 임계값 이하의 클릭 빈도를 갖는 경우, 상기 피드백 정보를 제거하여 상기 피드백 정보를 정제한다. 즉, 피드백 정보 정제부(320)는 정보별 누적된 피드백 정보를 정제하기 위해 클릭 빈도 임계값을 정의하고, 상기 임계값 이하의 클릭 빈도를 갖는 피드백 정보를 제거함으로써 피드백 정보를 정제할 수 있다. 상기 클릭 빈도 임계값은 피드백 정보 내 클릭 빈도값, 바람직하게는 최대 클릭 빈도값을 참조하여 결정될 수 있다.The feedback information refiner 320 purifies the feedback information by removing the feedback information when the feedback information has a click frequency less than or equal to a threshold value according to the analyzed type. That is, the feedback information refiner 320 may refine the feedback information by defining a click frequency threshold in order to refine the accumulated feedback information for each information, and removing feedback information having a click frequency less than or equal to the threshold. The click frequency threshold may be determined with reference to a click frequency value, preferably a maximum click frequency value, in feedback information.

도 7은 피드백 정보를 정제한 일례를 나타내는 도면이다.7 is a diagram illustrating an example in which feedback information is purified.

도 7을 참조하면, 피드백 정보(700)에서 최대 클릭 빈도를 참조하여 상기 클 릭 빈도 임계값을 일례로 '40'으로 정할 수 있다. 피드백 정보 정제부(320)는 피드백 정보(700)에서 상기 클릭 빈도 임계값인 '40'보다 작은 클릭 빈도가 '25'인 이효리폰과 '10'인 Sch-S470을 제거할 수 있다. Referring to FIG. 7, the click frequency threshold may be set to '40' as an example by referring to the maximum click frequency in the feedback information 700. The feedback information refiner 320 may remove the Lee Hyo Lee phone having a click frequency of '25' and the Sch-S470 having '10' from the feedback information 700.

인기도 적용부(330)는 상기 질의 의도에 대한 분석 결과에 따라 누적된 클릭 빈도수, 어뷰즈 판독 지수 또는 각 상품에 대한 판매지수를 인기도로 적용한다. 즉, 인기도 적용부(330)는 상기 누적된 클릭 빈도수를 로그(log) 정규화하고, 형태소 분석을 통한 상품명의 어뷰즈 판단 지수를 정규화하고, 상품의 판매 지수 리스트에서 최대값을 이용하여 인기도로 적용할 수 있다. 이때, 인기도 적용부(330)는 정보 생성 기간(Maxage)이 6개월 이내인 최신성 스코어를 상기 인기도에 반영할 수 있다. 또한 인기도 적용부(330)는 상기 어뷰즈 판독 지수가 기준치 이하인 경우, 상기 누적된 클릭 빈도수, 상기 어뷰즈 판독 지수 및 상기 판매 지수에 대해 패널티를 상기 인기도에 적용할 수 있다. 일례로 상기 어뷰즈 판독 지수가 기준치 이하인 경우, 인기도 적용부(330)는 상기 누적된 클릭 빈도수, 상기 어뷰즈 판독 지수, 상기 판매 지수 및 피드백 정보에 대한 클릭 빈도를 감소시킴으로써 패널티를 상기 인기도에 적용할 수 있다. The popularity application unit 330 applies the accumulated click frequency, the Abuse reading index, or the sales index for each product according to the analysis result of the query intention as the popularity. That is, the popularity application unit 330 may log-normalize the accumulated click frequency, normalize the Abuse judgment index of the brand name through morphological analysis, and apply the popularity using the maximum value in the list of the product's sales index. Can be. In this case, the popularity application unit 330 may reflect the freshness score of the information generation period (Maxage) within 6 months to the popularity. In addition, the popularity application unit 330 may apply a penalty to the popularity of the cumulative click frequency, the Avues reading index and the sales index, when the Abeus reading index is less than or equal to the reference value. As an example, when the ABBIS reading index is less than or equal to a reference value, the popularity applicator 330 may apply a penalty to the popularity by reducing the click frequency of the accumulated click frequency, the ABBUS reading index, the sales index, and the feedback information. have.

분석부(220)는 상기 분석된 질의 의도, 인기도 및 유사도를 결합하여 검색 랭킹을 정의할 수 있다. 일례로 분석부(220)는 제품명(모델명), 카테고리명, 브랜드명, 피드백 정보의 빈도를 사용한 유사도를 정의할 수 있다. The analyzer 220 may define a search ranking by combining the analyzed query intent, popularity, and similarity. For example, the analyzer 220 may define a similarity using the product name (model name), category name, brand name, and frequency of feedback information.

분류부(230)는 상기 분석된 유형에 따라 질의를 분류한다. The classification unit 230 classifies the query according to the analyzed type.

도 4는 분류부에 대한 구성의 일례를 나타내는 도면이다.4 is a diagram illustrating an example of a configuration of a classification unit.

도 4를 참조하면, 분류부(230)는 질의 확장부(410) 및 질의 분류부(420)를 포함한다. 질의 확장부(410)는 동의어 사전을 이용하여 상기 질의에 대한 동의어를 추가하여 상기 질의를 확장한다. 즉, 질의 확장부(410)는 상기 동의어 사전을 이용하여 ORMAX 연산을 적용하여 상기 질의를 확장한다. 상기 확장된 질의는 하나의 개념으로서 질의 개수가 하나이다. 또한 질의 확장부(410)는 포스팅(Posting)을 머지(merge)할 때 가중치를 합하여 유사도를 생성하는 것이 아니라 최대값을 사용하고, 상기 가중치를 정규화하는 과정에서도 질의의 개수를 나누지 않는다. 일례로 상기 질의가 '휴대폰'인 경우, 질의 확장부(410)는 상기 동의어 사전을 이용하여 '휴대폰, 핸드폰, 최신폰, 핸펀' 등으로 질의를 확장할 수 있다. Referring to FIG. 4, the classifier 230 includes a query extension unit 410 and a query classifier 420. The query extension unit 410 expands the query by adding a synonym for the query using a synonym dictionary. That is, the query extension unit 410 expands the query by applying an ORMAX operation using the synonym dictionary. The extended query is a concept, and the number of queries is one. In addition, the query extension unit 410 does not generate similarity by adding weights when merging posts, but uses a maximum value and does not divide the number of queries even in the process of normalizing the weights. For example, when the query is a 'mobile phone', the query extension unit 410 may extend the query to a 'mobile phone, a mobile phone, a new phone, a handfun' and the like by using the synonym dictionary.

질의 분류부(420)는 상기 확장된 질의를 분류한다. The query classifier 420 classifies the extended query.

색인부(240)는 상기 분류된 질의를 이용하여 정보를 색인한다. The indexing unit 240 indexes the information using the classified query.

색인 데이터베이스(250)는 상기 색인 결과를 기록하고 유지한다. 상기 색인 결과는 상기 질의 및 상기 질의에 대응되는 정보이다. Index database 250 records and maintains the index results. The index result is the query and information corresponding to the query.

검색부(260)는 상기 색인 결과를 이용하여 사용자로부터 입력된 질의에 대응되는 정보를 검색한다. 즉, 검색부(260)는 색인 데이터베이스(250)를 참조하여 상기 사용자로부터 입력된 질의에 대응되는 정보를 검색할 수 있다. The search unit 260 searches for information corresponding to a query input from a user using the index result. That is, the search unit 260 may search the information corresponding to the query input from the user with reference to the index database 250.

이와 같이, 본 발명에 따른 정보 검색 시스템은 사용자의 질의 의도에 적합한 카테고리의 정보를 검색할 수 있다. As such, the information retrieval system according to the present invention can retrieve information of a category suitable for a user's query intent.

도 8은 본 발명의 일실시예에 따른 정보 검색 방법의 흐름을 나타내는 도면이다.8 is a diagram illustrating a flow of an information retrieval method according to an embodiment of the present invention.

도 8을 참조하면, 단계(S810)에서 정보 검색 시스템은 복수 개의 질의에 대한 유형을 분석한다. 상기 질의에 대한 유형은 카테고리, 브랜드, 모델명 또는 동의어 질의를 포함할 수 있다. Referring to FIG. 8, in operation S810, the information retrieval system analyzes types of a plurality of queries. The type for the query may include a category, brand, model name or synonym query.

도 9는 질의에 대한 유형을 분석하는 단계를 보다 구체화한 일례를 나타내는 도면이다. 9 is a diagram illustrating an example of a more detailed step of analyzing a type of a query.

도 9를 참조하면, 단계(S910)에서 상기 정보 검색 시스템은 피드백 정보를 이용하여 질의 의도를 분석한다. 상기 피드백 정보는 상기 질의 및 상기 질의를 사용한 사용자들에 의해 클릭된 상품 정보의 클릭 횟수를 나타내는 클릭 빈도를 포함할 수 있다. Referring to FIG. 9, in step S910, the information retrieval system analyzes query intention using feedback information. The feedback information may include a click frequency indicating a number of clicks of the query and product information clicked by users who use the query.

단계(S920)에서 상기 정보 검색 시스템은 상기 질의 의도에 대한 분석 결과에 따라 상기 질의가 가장 많이 클릭된 정보들이 존재하는 카테고리를 랭킹한다. 즉, 단계(S920)에서 상기 정보 검색 시스템은 상기 질의 의도에 대한 분석 결과에 따라 카테고리, 브랜드, 제조사, 모델명, 키워드, 또는 피드백 정보에 대한 섹션 가중치를 적용하여 상기 섹션 가중치가 가장 높은 섹션을 이용하여 상기 정보를 랭킹할 수 있다. In step S920, the information retrieval system ranks the category in which the information in which the query is clicked most exists according to the analysis result of the query intention. That is, in step S920, the information retrieval system uses the section having the highest section weight by applying section weight to category, brand, manufacturer, model name, keyword, or feedback information according to the analysis result of the query intention. To rank the information.

일례로 단계(S810)에서 상기 정보 검색 시스템은 상기 질의에 대한 유형을 분석한 결과에 따라 질의에 대한 카테고리가 상위 카테고리명과 하위 카테고리명이 중복되는 경우, 중복된 카테고리명을 제거할 수 있다. For example, in operation S810, when the category for the query overlaps the upper category name and the lower category name according to a result of analyzing the type of the query, the information retrieval system may remove the duplicate category name.

일례로 단계(S810)에서 상기 정보 검색 시스템은 상기 질의에 대한 유형을 분석한 결과에 따라 상기 피드백 정보가 임계값 이하의 클릭 빈도를 갖는 경우, 상 기 피드백 정보를 제거할 수 있다. For example, in operation S810, when the feedback information has a click frequency less than or equal to a threshold value according to a result of analyzing the type of the query, the information retrieval system may remove the feedback information.

일례로 단계(S810)에서 상기 정보 검색 시스템은 상기 질의에 대한 누적된 클릭 빈도수, 어뷰즈 판독 지수 또는 각 상품에 대한 판매지수를 반영하여 상기 질의에 대한 유형을 분석할 수 있다. For example, in step S810, the information retrieval system may analyze the type of the query by reflecting the cumulative click frequency for the query, the Abyss reading index, or the sales index for each product.

일례로 단계(S810)에서 상기 정보 검색 시스템은 상기 어뷰즈 판독 지수가 기준치 이하인 경우, 상기 누적된 클릭 빈도수, 상기 어뷰즈 판독 지수 및 상기 판매 지수에 대해 패널티를 적용하여 상기 질의에 대한 유형을 분석할 수도 있다. For example, in operation S810, when the Abbers reading index is less than or equal to a reference value, the information retrieval system may analyze a type of the query by applying a penalty to the accumulated click frequency, the Abbuzz reading index, and the sales index. have.

단계(S820)에서 상기 정보 검색 시스템은 상기 분석된 유형에 따라 질의를 분류한다. 일례로 단계(S820)에서 상기 정보 검색 시스템은 동의어 사전을 이용하여 상기 질의에 대한 동의어를 추가하여 상기 질의를 확장한 후 상기 분석된 유형에 따라 상기 확장된 질의를 분류할 수 있다. In step S820, the information retrieval system classifies the query according to the analyzed type. For example, in operation S820, the information retrieval system may expand the query by adding a synonym for the query using a synonym dictionary, and then classify the extended query according to the analyzed type.

단계(S830)에서 상기 정보 검색 시스템은 상기 분류된 질의를 이용하여 정보를 색인한다. In step S830, the information retrieval system indexes the information using the classified query.

단계(S840)에서 상기 정보 검색 시스템은 상기 색인 결과를 이용하여 사용자로부터 입력된 질의에 대응되는 정보를 검색한다. In operation S840, the information retrieval system retrieves information corresponding to a query input from a user using the index result.

이와 같이, 본 발명에 따른 정보 검색 방법은 사용자의 질의 의도에 적합한 카테고리의 정보를 검색할 수 있다. As described above, the information retrieval method according to the present invention can retrieve information of a category suitable for the query intention of the user.

한편 본 발명에 따른 정보 검색 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능한 기록 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구 조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능한 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.Meanwhile, the information retrieval method according to the present invention can be implemented in the form of program instructions that can be executed by various computer means and recorded in a computer readable recording medium. The computer readable medium may include program instructions, data files, data structures, etc. alone or in combination. Program instructions recorded on the media may be those specially designed and constructed for the purposes of the present invention, or they may be of the kind well-known and available to those having skill in the computer software arts. Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks and magnetic tape, optical media such as CD-ROMs, DVDs, and magnetic disks such as floppy disks. Magneto-optical media, and hardware devices specifically configured to store and execute program instructions, such as ROM, RAM, flash memory, and the like. Examples of program instructions include not only machine code generated by a compiler, but also high-level language code that can be executed by a computer using an interpreter or the like. The hardware device described above may be configured to operate as one or more software modules to perform the operations of the present invention, and vice versa.

이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. As described above, the present invention has been described by way of limited embodiments and drawings, but the present invention is not limited to the above embodiments, and those skilled in the art to which the present invention pertains various modifications and variations from such descriptions. This is possible.

그러므로, 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 아니되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다. Therefore, the scope of the present invention should not be limited to the described embodiments, but should be determined not only by the claims below but also by the equivalents of the claims.

도 1은 본 발명에 따른 정보 검색 시스템과 사용자 단말기간의 연동 관계를 나타내는 도면이다.1 is a diagram illustrating an interlocking relationship between an information retrieval system and a user terminal according to the present invention.

도 2는 본 발명의 일실시예에 따른 정보 검색 시스템의 구성을 나타내는 도면이다.2 is a diagram illustrating a configuration of an information retrieval system according to an embodiment of the present invention.

도 3은 분석부에 대한 구체적인 구성의 일례를 나타내는 도면이다.3 is a diagram illustrating an example of a specific configuration of an analysis unit.

도 4는 분류부에 대한 구성의 일례를 나타내는 도면이다.4 is a diagram illustrating an example of a configuration of a classification unit.

도 5는 피드백 정보의 일례를 나타내는 도면이다.5 is a diagram illustrating an example of feedback information.

도 6은 카테고리를 정제한 일례를 나타내는 도면이다.6 is a diagram illustrating an example of refining a category.

도 7은 피드백 정보를 정제한 일례를 나타내는 도면이다.7 is a diagram illustrating an example in which feedback information is purified.

도 8은 본 발명의 일실시예에 따른 정보 검색 방법의 흐름을 나타내는 도면이다.8 is a diagram illustrating a flow of an information retrieval method according to an embodiment of the present invention.

도 9는 질의에 대한 유형을 분석하는 단계를 보다 구체화한 일례를 나타내는 도면이다.9 is a diagram illustrating an example of a more detailed step of analyzing a type of a query.

<도면의 주요 부분에 대한 부호의 설명><Explanation of symbols for the main parts of the drawings>

110: 사용자 단말기 120: 정보 검색 시스템110: user terminal 120: information retrieval system

210: 정보 데이터베이스 220: 분석부210: information database 220: analysis unit

230: 분류부 240: 색인부230: classification unit 240: index unit

250: 색인 데이터베이스 260: 검색부250: index database 260: search unit

310: 카테고리 정제부 320: 피드백 정보 정제부310: category refiner 320: feedback information refiner

330: 인기도 적용부330: popularity application

410: 질의 확장부 420: 질의 분류부410: query extension unit 420: query classification unit

Claims (19)

삭제delete 복수 개의 질의에 대한 유형을 분석하는 단계;Analyzing the types of the plurality of queries; 상기 분석된 유형에 따라 질의를 분류하는 단계;Classifying the query according to the analyzed type; 상기 분류된 질의를 이용하여 정보를 색인하는 단계; 및Indexing information using the classified query; And 상기 색인 결과를 이용하여 사용자로부터 입력된 질의에 대응되는 정보를 검색하는 단계Searching for information corresponding to a query input from a user by using the index result 를 포함하고,Including, 상기 질의에 대한 유형은,The type for the query is 카테고리, 브랜드, 모델명 또는 동의어 질의를 포함하고,Include category, brand, model name, or synonym query, 질의에 대한 유형을 분석하는 상기 단계는,The step of analyzing the type for the query, 피드백 정보를 이용하여 질의 의도를 분석하는 단계; 및Analyzing the query intention using the feedback information; And 상기 질의 의도에 대한 분석 결과에 따라 상기 질의가 가장 많이 클릭된 정보들이 존재하는 카테고리를 랭킹하는 단계Ranking a category in which the information in which the query is clicked most is located according to an analysis result of the query intention 를 포함하고, Including, 상기 피드백 정보는,The feedback information, 상기 질의에 대한 클릭 빈도를 포함하는 정보 검색 방법.An information retrieval method including a click frequency for the query. 제2항에 있어서, The method of claim 2, 질의에 대한 유형을 분석하는 상기 단계는,The step of analyzing the type for the query, 상기 질의에 대한 유형을 분석한 결과에 따라 질의에 대한 카테고리가 상위 카테고리명과 하위 카테고리명이 중복되는 경우, 중복된 카테고리명을 제거하는 단계를 더 포함하는 정보 검색 방법.And removing the duplicate category name when the category for the query is duplicated with the upper category name and the lower category name according to the result of analyzing the type of the query. 제3항에 있어서, The method of claim 3, 중복된 카테고리명을 제거하는 상기 단계는,The step of removing the duplicate category name, 상기 질의에 대한 카테고리에 정해진 키워드가 포함된 경우, 정해진 카테고리를 제외한 모든 카테고리에서 상기 키워드를 제거하는 정보 검색 방법.And when the predetermined keyword is included in the category for the query, removing the keyword from all categories except the predetermined category. 제2항에 있어서, The method of claim 2, 질의에 대한 유형을 분석하는 상기 단계는,The step of analyzing the type for the query, 상기 질의에 대한 유형을 분석한 결과에 따라 상기 피드백 정보가 임계값 이하의 클릭 빈도를 갖는 경우, 상기 피드백 정보를 제거하는 단계를 더 포함하는 정보 검색 방법.And removing the feedback information when the feedback information has a click frequency less than or equal to a threshold value according to a result of analyzing the type of the query. 제2항에 있어서, The method of claim 2, 카테고리를 랭킹하는 상기 단계는,The step of ranking the category, 상기 질의 의도에 대한 분석 결과에 따라 카테고리, 브랜드, 제조사, 모델 명, 키워드, 또는 피드백 정보에 대한 섹션 가중치를 적용하여 상기 섹션 가중치가 가장 높은 섹션을 이용하여 상기 정보를 랭킹하는 정보 검색 방법.And ranking the information using the section having the highest section weight by applying section weights to categories, brands, manufacturers, model names, keywords, or feedback information according to analysis results of the query intent. 제2항에 있어서, The method of claim 2, 질의에 대한 유형을 분석하는 상기 단계는,The step of analyzing the type for the query, 상기 질의에 대한 누적된 클릭 빈도수, 어뷰즈 판독 지수 또는 각 상품에 대한 판매지수를 반영하여 상기 질의에 대한 유형을 분석하는 정보 검색 방법.An information retrieval method for analyzing the type of the query by reflecting the accumulated frequency of clicks on the query, the Abyss reading index, or the sales index for each product. 제7항에 있어서, The method of claim 7, wherein 질의에 대한 유형을 분석하는 상기 단계는,The step of analyzing the type for the query, 상기 어뷰즈 판독 지수가 기준치 이하인 경우, 상기 누적된 클릭 빈도수, 상기 어뷰즈 판독 지수 및 상기 판매 지수에 대해 패널티를 적용하여 상기 질의에 대한 유형을 분석하는 정보 검색 방법.And analyzing the type of the query by applying a penalty to the accumulated click frequency, the Abuse reading index, and the sales index, when the Absolute Reading Index is less than or equal to a reference value. 제2항에 있어서, The method of claim 2, 동의어 사전을 이용하여 상기 질의에 대한 동의어를 추가하여 상기 질의를 확장하는 단계를 더 포함하는 정보 검색 방법.And expanding the query by adding synonyms to the query using a synonym dictionary. 제2항 내지 제9항 중 어느 한 항의 방법을 실행하기 위한 프로그램이 기록되어 있는 것을 특징으로 하는 컴퓨터에서 판독 가능한 기록 매체.A computer-readable recording medium in which a program for executing the method of any one of claims 2 to 9 is recorded. 삭제delete 복수 개의 질의에 대한 유형을 분석하는 분석부;An analysis unit for analyzing types of a plurality of queries; 상기 분석된 유형에 따라 질의를 분류하는 분류부;A classification unit classifying the query according to the analyzed type; 상기 분류된 질의를 이용하여 정보를 색인하는 색인부; 및An indexing unit for indexing information using the classified query; And 상기 색인 결과를 이용하여 사용자로부터 입력된 질의에 대응되는 정보를 검색하는 검색부Search unit for searching the information corresponding to the query input from the user by using the index results 를 포함하고,Including, 상기 질의에 대한 유형은,The type for the query is 카테고리, 브랜드, 모델명 또는 동의어 질의를 포함하고,Include category, brand, model name, or synonym query, 상기 분석부는,The analysis unit, 피드백 정보를 이용하여 질의 의도를 분석하고, 상기 질의 의도에 대한 분석 결과에 따라 상기 질의가 가장 많이 클릭된 정보들이 존재하는 카테고리를 랭킹하여 상기 복수 개의 질의에 대한 유형을 분석하고, Analyze the query intention using feedback information, and analyze the types of the plurality of queries by ranking the category in which the information in which the query is clicked the most is located according to the analysis result of the query intention, 상기 피드백 정보는,The feedback information, 상기 질의 및 상기 질의가 사용자들에 의해 클릭된 횟수를 나타내는 클릭 빈도를 포함하는 정보 검색 시스템.And a click frequency indicative of the query and the number of times the query was clicked by users. 제12항에 있어서, The method of claim 12, 상기 분석부는,The analysis unit, 상기 분석된 유형에 따라 상기 정보에 대한 카테고리가 상위 카테고리명과 하위 카테고리명이 중복되는 경우, 중복된 카테고리명을 제거하여 카테고리를 정제하는 카테고리 정제부를 포함하는 정보 검색 시스템.And a category refining unit for refining the category by removing the duplicate category name when the category for the information overlaps the upper category name and the lower category name according to the analyzed type. 제13항에 있어서, The method of claim 13, 상기 카테고리 정제부는,The category refiner, 상기 분석된 유형에 따라 상기 정보에 대한 카테고리에 정해진 키워드가 포함된 경우, 정해진 카테고리를 제외한 모든 카테고리에서 상기 키워드를 제거하는 정보 검색 시스템.And a predetermined keyword is included in a category for the information according to the analyzed type. 제12항에 있어서, The method of claim 12, 상기 분석부는,The analysis unit, 상기 분석된 유형에 따라 상기 피드백 정보가 임계값 이하의 클릭 빈도를 갖는 경우, 상기 피드백 정보를 제거하여 상기 피드백 정보를 정제하는 피드백 정보 정제부를 포함하는 정보 검색 시스템.And a feedback information refining unit for refining the feedback information by removing the feedback information when the feedback information has a click frequency below a threshold value according to the analyzed type. 제12항에 있어서, The method of claim 12, 상기 분석부는,The analysis unit, 상기 질의 의도에 대한 분석 결과에 따라 카테고리, 브랜드, 제조사, 모델 명, 키워드, 또는 피드백 정보에 대한 섹션 가중치를 적용하여 상기 섹션 가중치가 가장 높은 섹션을 이용하여 상기 정보를 랭킹하는 정보 검색 시스템.And ranking the information using the section having the highest section weight by applying section weights to categories, brands, manufacturers, model names, keywords, or feedback information according to analysis results of the query intent. 제12항에 있어서, The method of claim 12, 상기 분석부는,The analysis unit, 상기 질의 의도에 대한 분석 결과에 따라 누적된 클릭 빈도수, 어뷰즈 판독 지수 또는 각 상품에 대한 판매지수를 인기도로 적용하는 인기도 적용부를 포함하는 정보 검색 시스템.And a popularity application unit configured to apply the accumulated click frequency, the Abyss reading index, or the sales index for each product as popularity according to the analysis result of the query intention. 제17항에 있어서, The method of claim 17, 상기 인기도 적용부는,The popularity application unit, 상기 어뷰즈 판독 지수가 기준치 이하인 경우, 상기 누적된 클릭 빈도수, 상기 어뷰즈 판독 지수 및 상기 판매 지수에 대해 패널티를 상기 인기도에 적용하는 정보 검색 시스템.And the penalty is applied to the popularity for the cumulative click frequency, the avues reading index, and the sales index, when the avails reading index is less than or equal to a reference value. 제12항에 있어서, The method of claim 12, 동의어 사전을 이용하여 상기 질의에 대한 동의어를 추가하여 상기 질의를 확장하는 질의 확장부를 더 포함하는 정보 검색 시스템.And a query extension unit for expanding the query by adding synonyms to the query using a synonym dictionary.
KR1020070080878A 2007-08-10 2007-08-10 Method for searching information and system thereof KR100898458B1 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020070080878A KR100898458B1 (en) 2007-08-10 2007-08-10 Method for searching information and system thereof
JP2008205234A JP4750832B2 (en) 2007-08-10 2008-08-08 Information retrieval method and system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020070080878A KR100898458B1 (en) 2007-08-10 2007-08-10 Method for searching information and system thereof

Publications (2)

Publication Number Publication Date
KR20090016328A KR20090016328A (en) 2009-02-13
KR100898458B1 true KR100898458B1 (en) 2009-05-21

Family

ID=40443888

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070080878A KR100898458B1 (en) 2007-08-10 2007-08-10 Method for searching information and system thereof

Country Status (2)

Country Link
JP (1) JP4750832B2 (en)
KR (1) KR100898458B1 (en)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102253936B (en) * 2010-05-18 2013-07-24 阿里巴巴集团控股有限公司 Method for recording access of user to merchandise information, search method and server
CN102810104B (en) * 2011-06-03 2015-05-20 阿里巴巴集团控股有限公司 Information adjusting method and device
US9298776B2 (en) 2011-06-08 2016-03-29 Ebay Inc. System and method for mining category aspect information
CN103368986B (en) 2012-03-27 2017-04-26 阿里巴巴集团控股有限公司 Information recommendation method and information recommendation device
KR101509209B1 (en) * 2014-01-13 2015-04-09 네이버 주식회사 Apparatus of providing searching service, and method of providing searching service
KR101616958B1 (en) * 2015-01-26 2016-04-29 주식회사 포워드벤처스 Apparatus, method and computer program for providing shopping service
CN106951422B (en) * 2016-01-07 2021-05-28 腾讯科技(深圳)有限公司 Webpage training method and device, and search intention identification method and device
CN108664515B (en) * 2017-03-31 2019-09-17 北京三快在线科技有限公司 A kind of searching method and device, electronic equipment
KR102491077B1 (en) 2020-08-10 2023-01-20 네이버 주식회사 Method and system for providing sports team ranking on real-time issue

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020032060A (en) * 2000-10-25 2002-05-03 전종훈 Method and System for Retrieving Information using Proximity Search Formula
KR20040006515A (en) * 2002-07-12 2004-01-24 주식회사 네오위즈 Method And System for Providing Information Service System and Searching Result by Using Log Analysis and Information Inputed by User
KR20050049206A (en) * 2003-11-21 2005-05-25 한국전자통신연구원 Apparatus for xml yellow-page web-service making possible to update a category and system using it
KR20050095230A (en) * 2004-03-25 2005-09-29 주식회사 첫눈 Method and system for providing information service and information search service by using visited uniform resource locator log

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4453229B2 (en) * 2001-07-03 2010-04-21 日本電気株式会社 Information search system, information search method, and information search program
JP4230710B2 (en) * 2002-03-19 2009-02-25 株式会社ジャストシステム SEARCH DEVICE, SEARCH METHOD, AND PROGRAM
JP4453437B2 (en) * 2004-05-11 2010-04-21 日本電信電話株式会社 Search keyword ranking method, apparatus and program

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020032060A (en) * 2000-10-25 2002-05-03 전종훈 Method and System for Retrieving Information using Proximity Search Formula
KR20040006515A (en) * 2002-07-12 2004-01-24 주식회사 네오위즈 Method And System for Providing Information Service System and Searching Result by Using Log Analysis and Information Inputed by User
KR20050049206A (en) * 2003-11-21 2005-05-25 한국전자통신연구원 Apparatus for xml yellow-page web-service making possible to update a category and system using it
KR20050095230A (en) * 2004-03-25 2005-09-29 주식회사 첫눈 Method and system for providing information service and information search service by using visited uniform resource locator log

Also Published As

Publication number Publication date
JP4750832B2 (en) 2011-08-17
JP2009043264A (en) 2009-02-26
KR20090016328A (en) 2009-02-13

Similar Documents

Publication Publication Date Title
KR100898458B1 (en) Method for searching information and system thereof
Deveaud et al. Accurate and effective latent concept modeling for ad hoc information retrieval
US7769751B1 (en) Method and apparatus for classifying documents based on user inputs
US8983963B2 (en) Techniques for comparing and clustering documents
US8612208B2 (en) Ontology for use with a system, method, and computer readable medium for retrieving information and response to a query
KR100898459B1 (en) Method for classifying query and system thereof
JP2010055618A (en) Method and system for providing search based on topic
JP2010170529A (en) Method and system for object classification
JP2009093653A (en) Refining search space responding to user input
KR101098832B1 (en) Apparatus and method for a personalized search
US8577865B2 (en) Document searching system
Ru et al. Indexing the invisible web: a survey
Kumar et al. Book search using social information, user profiles and query expansion with pseudo relevance feedback
Sharifpour et al. Large-scale analysis of query logs to profile users for dataset search
Ibrahim et al. Scientometric re-ranking approach to improve search results
Campos et al. Enriching temporal query understanding through date identification: how to tag implicit temporal queries?
JPWO2016067396A1 (en) Sentence sorting method and calculator
Gamzu et al. Query rewriting for voice shopping null queries
Rajkumar et al. Users’ click and bookmark based personalization using modified agglomerative clustering for web search engine
Vadivel et al. An Effective Document Category Prediction System Using Support Vector Machines, Mann-Whitney Techniques
JP2002288189A (en) Method and apparatus for classifying documents, and recording medium with document classification processing program recorded thereon
Kirtsis et al. Query reformulation for task-oriented web searches
Kowalski Information system evaluation
Knees et al. Contextual music similarity, indexing, and retrieval
JP5458058B2 (en) Product name identity determination device and product name identity determination program

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120329

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20160329

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20170328

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20190401

Year of fee payment: 11