KR20100106718A - System and method for classifying search keyword using cluster for related keyword - Google Patents

System and method for classifying search keyword using cluster for related keyword Download PDF

Info

Publication number
KR20100106718A
KR20100106718A KR1020090024817A KR20090024817A KR20100106718A KR 20100106718 A KR20100106718 A KR 20100106718A KR 1020090024817 A KR1020090024817 A KR 1020090024817A KR 20090024817 A KR20090024817 A KR 20090024817A KR 20100106718 A KR20100106718 A KR 20100106718A
Authority
KR
South Korea
Prior art keywords
search keyword
search
keyword
cluster
keywords
Prior art date
Application number
KR1020090024817A
Other languages
Korean (ko)
Other versions
KR101048540B1 (en
Inventor
정윤영
최재걸
김재은
Original Assignee
엔에이치엔(주)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엔에이치엔(주) filed Critical 엔에이치엔(주)
Priority to KR1020090024817A priority Critical patent/KR101048540B1/en
Publication of KR20100106718A publication Critical patent/KR20100106718A/en
Application granted granted Critical
Publication of KR101048540B1 publication Critical patent/KR101048540B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/355Class or cluster creation or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Abstract

PURPOSE: A system and a method for classifying a search keyword using a cluster based on a related keyword are provided to generates a search keyword cluster through the related keyword for the search keyword to classify the search keyword cluster according to a theme, thereby accurately grasping a search intention of a user. CONSTITUTION: A search keyword classifying system(100) includes a related keyword extracting unit(101), a cluster generating unit(102), and a cluster classifying unit(103). The related keyword extracting unit extracts a related keyword about a search keyword. The cluster generating unit generates a search keyword cluster through the extracted related keyword. The cluster classifying unit classifies the search keyword cluster in consideration of a search intention of a user.

Description

연관 키워드에 따른 클러스터를 이용하여 검색 키워드를 분류하는 시스템 및 방법{SYSTEM AND METHOD FOR CLASSIFYING SEARCH KEYWORD USING CLUSTER FOR RELATED KEYWORD}System and method for classifying search keywords using clusters based on related keywords {SYSTEM AND METHOD FOR CLASSIFYING SEARCH KEYWORD USING CLUSTER FOR RELATED KEYWORD}

본 발명의 일실시예들은 검색 키워드를 분류하는 방법에 관한 것으로, 보다 자세하게는, 검색 키워드의 연관 키워드를 통해 검색 키워드 클러스터를 생성하여 검색 키워드를 분류하는 시스템 및 방법에 관한 것이다.One embodiment of the present invention relates to a method for classifying a search keyword, and more particularly, to a system and a method for classifying a search keyword by generating a search keyword cluster through a related keyword of the search keyword.

인터넷 검색 엔진에 사용자로부터 수많은 검색 키워드가 입력된다. 검색 키워드는 사용자가 특별한 검색 의도를 가지고 입력한 키워드이다. 즉, 검색 키워드는 사용자의 관심이나 선호 사항을 반영할 수 있다. 결국, 인터넷 검색 엔진의 관리자는 검색 키워드를 이용하여 사용자들의 정보에 대한 니즈를 분석함으로써 사용자 맞춤형 서비스를 제공하기를 원한다. 또한, 검색 광고주들은 검색 키워드를 이용하여 사용자 맞춤형 광고를 제공함으로써 광고 효과를 증대시키기를 원한다.Numerous search keywords are entered from an Internet search engine by a user. The search keyword is a keyword entered by the user with a special search intention. That is, the search keyword may reflect the user's interest or preference. As a result, an administrator of an internet search engine wants to provide a user-customized service by analyzing a need for information of users using search keywords. In addition, search advertisers want to increase advertising effectiveness by providing customized ads using search keywords.

그러나, 종래에 사용자가 입력한 검색 키워드를 통해 사용자의 검색 의도를 파악하는 기술이 일부 존재하였지만 사용자의 검색 의도에 대한 정확도는 낮았는 바, 사용자의 검색 의도에 대한 정확도를 향상시킬 수 있는 기술이 요구되고 있다.However, although some techniques exist for identifying a user's search intention through a search keyword input by the user, the accuracy of the user's search intention is low. Therefore, a technique for improving the accuracy of the user's search intention is required. It is becoming.

본 발명의 일실시예는 사용자가 입력한 검색 키워드에 대한 연관 키워드를 이용하여 검색 키워드 클러스터를 생성하고, 검색 키워드 클러스터를 주제별로 분류함으로써 사용자의 검색 의도를 좀더 정확하게 파악할 수 있는 검색 키워드 분류 시스템 및 방법을 제공할 수 있다.An embodiment of the present invention is to create a search keyword cluster by using the associated keyword for the search keyword input by the user, and search keyword classification system that can more accurately grasp the user's search intention by classifying the search keyword cluster by topic; It may provide a method.

본 발명의 일실시예는 연관 키워드에 따른 검색 키워드의 연결 관계를 이용하여 검색 키워드 간 연결 강도에 따라 검색 키워드 클러스터를 생성함으로써 사용자의 검색 의도를 좀더 정확하게 파악할 수 있는 검색 키워드 분류 시스템 및 방법을 제공할 수 있다.An embodiment of the present invention provides a search keyword classification system and method that can more accurately grasp a user's search intention by creating a search keyword cluster according to the link strength between search keywords using a link relationship of search keywords according to related keywords. can do.

본 발명의 일실시예는 주제, 검색 키워드 클러스터 및 검색 키워드에 대한 데이터 계층도를 제공함으로써 사용자 검색 의도를 파악할 수 있는 검색 키워드에 대한 정보를 시각적/정량적으로 제공하는 검색 키워드 분류 시스템 및 방법을 제공할 수 있다.An embodiment of the present invention provides a search keyword classification system and method for providing information about search keywords visually and quantitatively by providing a data hierarchy diagram for a topic, a search keyword cluster, and a search keyword. can do.

본 발명의 일실시예는 일별로 검색 키워드에 대한 검색 키워드 클러스터를 생성함으로써, 시간에 따른 사용자 검색 트렌드를 용이하게 파악할 수 있는 검색 키워드 분류 시스템 및 방법을 제공할 수 있다.An embodiment of the present invention may provide a search keyword classification system and method that can easily identify a user search trend over time by generating a search keyword cluster for a search keyword on a daily basis.

본 발명의 일실시예에 따른 검색 키워드 분류 시스템은 사용자가 입력한 검색 키워드에 대해 연관 키워드를 추출하는 연관 키워드 추출부, 상기 추출된 연관 키워드를 이용하여 검색 키워드 클러스터를 생성하는 클러스터 생성부 및 사용자 검색 의도를 고려하여 상기 검색 키워드 클러스터를 주제에 따라 분류하는 클러스터 분류부를 포함할 수 있다.Search keyword classification system according to an embodiment of the present invention is an associated keyword extraction unit for extracting a related keyword for the search keyword input by the user, a cluster generation unit for generating a search keyword cluster using the extracted related keywords and the user It may include a cluster classification unit for classifying the search keyword cluster according to the topic in consideration of the search intent.

본 발명의 일실시예에 따른 검색 키워드 분류 시스템은 상기 주제를 포함하는 제1 계층, 상기 주제로 분류된 검색 키워드 클러스터를 포함하는 제2 계층 및 상기 검색 키워드 클러스터에 대한 검색 키워드를 포함하는 제3 계층으로 구성된 데이터 계층도를 생성하는 데이터 계층도 생성부를 더 포함할 수 있다.A search keyword classification system according to an embodiment of the present invention includes a first hierarchy including the subject, a second hierarchy including the search keyword cluster classified into the subject, and a third search keyword for the search keyword cluster. The data hierarchy diagram generating data hierarchy diagram configured as a hierarchy may further include a generation unit.

본 발명의 일실시예에 따른 검색 키워드 분류 방법은 사용자가 입력한 검색 키워드에 대해 연관 키워드를 추출하는 단계, 상기 추출된 연관 키워드를 이용하여 검색 키워드 클러스터를 생성하는 단계 및 상기 검색 키워드 클러스터로부터 사용자 검색 의도를 추출하여 상기 검색 키워드 클러스터를 주제에 따라 분류하는 단계를 포함할 수 있다.In accordance with another aspect of the present invention, there is provided a method of classifying a search keyword, including: extracting a related keyword with respect to a search keyword input by a user, generating a search keyword cluster using the extracted related keyword, and user from the search keyword cluster The method may include extracting a search intent and classifying the search keyword cluster according to a topic.

본 발명의 일실시예에 따른 검색 키워드 분류 방법은 상기 주제를 포함하는 제1 계층, 상기 주제로 분류된 검색 키워드 클러스터를 포함하는 제2 계층 및 상기 검색 키워드 클러스터에 대한 검색 키워드를 포함하는 제3 계층으로 구성된 데이터 계층도를 생성하는 단계를 더 포함할 수 있다.Search keyword classification method according to an embodiment of the present invention includes a first layer including the subject, a second layer including a search keyword cluster classified into the subject and a third including a search keyword for the search keyword cluster The method may further include generating a hierarchical data layer diagram.

본 발명의 일실시예에 따르면, 사용자가 입력한 검색 키워드에 대한 연관 키워드를 이용하여 검색 키워드 클러스터를 생성하고, 검색 키워드 클러스터를 주제별로 분류함으로써 사용자의 검색 의도를 좀더 정확하게 파악할 수 있는 검색 키워 드 분류 시스템 및 방법이 제공된다.According to an embodiment of the present invention, a search keyword for generating a search keyword cluster by using a related keyword for a search keyword input by a user and classifying the search keyword cluster by a topic may more accurately identify a user's search intention. A classification system and method are provided.

본 발명의 일실시예에 따르면, 연관 키워드에 따른 검색 키워드의 연결 관계를 이용하여 검색 키워드 간 연결 강도에 따라 검색 키워드 클러스터를 생성함으로써 사용자의 검색 의도를 좀더 정확하게 파악할 수 있는 검색 키워드 분류 시스템 및 방법이 제공된다.According to an embodiment of the present invention, a search keyword classification system and method for more accurately grasping a user's search intention by generating a search keyword cluster according to the link strength between search keywords using the connection relation of the search keywords according to the related keywords This is provided.

본 발명의 일실시예에 따르면, 주제, 검색 키워드 클러스터 및 검색 키워드에 대한 데이터 계층도를 제공함으로써 사용자 검색 의도를 파악할 수 있는 검색 키워드에 대한 정보를 시각적/정량적으로 제공하는 검색 키워드 분류 시스템 및 방법이 제공된다.According to an embodiment of the present invention, a search keyword classification system and method for visually and quantitatively providing information on a search keyword capable of identifying a user search intention by providing a data hierarchy diagram for a topic, a search keyword cluster, and a search keyword. This is provided.

본 발명의 일실시예에 따르면, 일별로 검색 키워드에 대한 검색 키워드 클러스터를 생성함으로써, 시간에 따른 사용자 검색 트렌드를 용이하게 파악할 수 있는 검색 키워드 분류 시스템 및 방법이 제공된다.According to an embodiment of the present invention, a search keyword classification system and method for easily identifying a user search trend over time by generating a search keyword cluster for a search keyword on a daily basis is provided.

이하, 첨부된 도면들에 기재된 내용들을 참조하여 본 발명에 따른 실시예를 상세하게 설명한다. 다만, 본 발명이 실시예들에 의해 제한되거나 한정되는 것은 아니다. 각 도면에 제시된 동일한 참조부호는 동일한 부재를 나타낸다. 본 발명의 일실시예에 따른 검색 키워드 분류 방법은 검색 키워드 분류 시스템에 의해 수행될 수 있다. Hereinafter, with reference to the contents described in the accompanying drawings will be described in detail an embodiment according to the present invention. However, the present invention is not limited to or limited by the embodiments. Like reference numerals in the drawings denote like elements. The search keyword classification method according to an embodiment of the present invention may be performed by the search keyword classification system.

도 1은 본 발명의 일실시예에 따른 검색 키워드 분류 시스템의 전체 구성을 도시한 블록 다이어그램이다.1 is a block diagram showing the overall configuration of a search keyword classification system according to an embodiment of the present invention.

도 1을 참고하면, 검색 키워드 분류 시스템(100)은 연관 키워드 추출부(101), 클러스터 생성부(102), 클러스터 분류부(103)를 포함할 수 있다. 추가적으로, 검색 키워드 분류 시스템(100)은 데이터 계층도 생성부(104)를 포함할 수 있다.Referring to FIG. 1, the search keyword classification system 100 may include an associated keyword extraction unit 101, a cluster generation unit 102, and a cluster classification unit 103. In addition, the search keyword classification system 100 may include a data hierarchy diagram generator 104.

연관 키워드 추출부(101)는 사용자가 입력한 검색 키워드에 대해 연관 키워드를 추출할 수 있다. 연관 키워드는 사용자가 입력한 검색 키워드 이후에 특정 시간 이내에 입력되어 검색되는 비율이 높은 키워드를 의미할 수 있다. 즉, 연관 키워드는 사용자들이 자신의 검색 의도에 부합하는 검색 결과를 도출할 수 있도록 함께 검색하는 경향이 높은 키워드들을 의미할 수 있다. 다시 말해서, 검색 키워드에 대한 연관 키워드는 사용자의 검색 의도를 파악할 수 있는 하나의 수단이 될 수 있다.The related keyword extracting unit 101 may extract a related keyword with respect to the search keyword input by the user. The related keyword may mean a keyword having a high rate of being input and searched within a specific time after the search keyword input by the user. In other words, the related keywords may refer to keywords that have a high tendency to search together so that users can derive search results that match their search intent. In other words, the related keyword for the search keyword may be one means for determining the user's search intention.

일례로, 연관 키워드 추출부(101)는 일정 기간 동안 검색 횟수가 미리 설정한 검색 횟수 이상인 검색 키워드에 대해 연관 키워드를 추출할 수 있다. 예를 들면, 최근 일주일 검색 횟수(Query Count: QC)가 300 이상인 검색 키워드에 대해 연관 키워드를 추출할 수 있다. 이 때, 연관 키워드 추출부(101)는 하나의 키워드에 대해 하나 이상의 연관 키워드를 추출할 수 있다. 즉, 일정 수 이상의 검색 횟수를 나타내는 검색 키워드에 대해 연관 키워드를 추출함으로써, 검색 키워드를 입력한 사용자의 검색 의도를 좀더 정확하게 파악할 수 있다.For example, the related keyword extracting unit 101 may extract a related keyword for a search keyword whose search number is equal to or greater than a predetermined search number for a predetermined period of time. For example, related keywords may be extracted for a search keyword having a recent query count (QC) of 300 or more per week. In this case, the related keyword extracting unit 101 may extract one or more related keywords for one keyword. In other words, by extracting a related keyword for a search keyword representing a certain number of search times or more, it is possible to more accurately grasp the search intention of the user who inputs the search keyword.

일례로, 연관 키워드 추출부(101)는 키워드의 검색 횟수에 따른 연관 규칙, 사용자의 IP 주소에 따른 연관 규칙 또는 사용자 식별 정보에 따른 연관 규칙 중 어느 하나의 연관 규칙에 기초하여 검색 키워드에 대한 연관 키워드를 추출할 수 있다.For example, the related keyword extracting unit 101 associates the search keyword with respect to any one of an association rule according to the number of searches for the keyword, an association rule according to the user's IP address, or an association rule based on the user identification information. You can extract keywords.

클러스터 생성부(102)는 추출된 연관 키워드를 이용하여 검색 키워드 클러스터를 생성할 수 있다. 일례로, 클러스터 생성부(102)는 연관 키워드를 매개로 하여 검색 키워드의 연결 관계를 생성하고, 검색 키워드의 연결 관계로부터 검색 키워드 클러스터를 생성할 수 있다. 이 때, 클러스터 생성부(102)는 둘 이상의 검색 키워드들을 공통적인 연관 키워드를 중심으로 연결함으로써 검색 키워드의 연결 관계를 생성할 수 있다.The cluster generator 102 may generate a search keyword cluster using the extracted related keyword. In one example, the cluster generation unit 102 may generate a connection relationship of the search keyword via the associated keyword, and generate a search keyword cluster from the connection relationship of the search keyword. In this case, the cluster generator 102 may generate a connection relationship of the search keywords by connecting two or more search keywords based on a common related keyword.

클러스터 생성부(102)는 검색 키워드 사이에 연결 강도에 기초하여 검색 키워드 클러스터를 생성할 수 있다. 이 때, 연결 강도는 검색 키워드 사이에 공통된 연관 키워드가 많을수록 증가할 수 있다. 예를 들어, 클러스터 생성부(102)는 검색 키워드의 연결 관계에 범주형 클러스터링 기법을 적용하여 검색 키워드 클러스터를 생성할 수 있다. 즉, 클러스터 생성부(102)는 범주형 클러스터링 기법에 따라 주어진 검색 키워드에 대한 연결 관계에서 공통된 연관 키워드를 통해 검색 키워드 간 유사도를 판단하고, 유사도가 높은 검색 키워드들을 그룹화하여 클러스터를 생성할 수 있다.The cluster generator 102 may generate a search keyword cluster based on the connection strength between the search keywords. In this case, the connection strength may increase as there are more related keywords common between the search keywords. For example, the cluster generator 102 may generate a search keyword cluster by applying a categorical clustering technique to the connection relation of the search keywords. That is, the cluster generation unit 102 may determine similarity between search keywords through a common related keyword in a connection relation to a given search keyword according to a categorical clustering technique, and generate a cluster by grouping high similarity search keywords. .

클러스터 분류부(103)는 사용자 검색 의도를 고려하여 검색 키워드 클러스터를 주제에 따라 분류할 수 있다. 검색 키워드 클러스터는 공통적인 연관 키워드를 기초로 연결된 검색 키워드들을 포함하고 있으므로, 유사한 사용자의 검색 의도를 나타내는 검색 키워드들로 구성될 수 있다. 따라서, 클러스터 분류부(103)는 사용자의 검색 의도를 의미하는 주제에 따라 검색 키워드 클러스터를 분류할 수 있으며, 결국 주제에 따라 검색 키워드를 분류할 수 있다.The cluster classifier 103 may classify the search keyword cluster according to a subject in consideration of a user search intent. Since the search keyword cluster includes search keywords connected based on a common related keyword, the search keyword cluster may be composed of search keywords indicating similar search intentions of users. Accordingly, the cluster classifier 103 may classify the search keyword clusters according to a topic representing a user's search intention, and eventually classify the search keywords according to a topic.

이 때, 하나의 주제에 적어도 하나의 클러스터가 포함될 수 있다. 이 경우, 클러스터 분류부(103)는 검색 키워드 클러스터 간에 연관성을 고려하여 검색 키워드 클러스터를 주제별로 분류할 수 있다.In this case, at least one cluster may be included in one subject. In this case, the cluster classification unit 103 may classify the search keyword cluster by subject in consideration of the correlation between the search keyword clusters.

일례로, 클러스터 분류부(103)는 최초로 생성된 검색 키워드 클러스터에 대해 주제별로 분류하여 시드 클러스터를 생성하고, 시드 클러스터를 기초로 미리 설정한 주기별로 생성된 검색 키워드 클러스터를 주제별로 분류할 수 있다.For example, the cluster classification unit 103 may generate a seed cluster by classifying the first generated search keyword cluster by a topic, and classify the search keyword cluster generated by a predetermined period based on the seed cluster by the topic. .

결국, 본 발명의 일실시예에 따르면, 연관 키워드는 사용자의 검색이 발생하는 모든 관심 분야에서 추출될 수 있기 때문에, 검색 키워드 클러스터를 통해 다양한 주제의 키워드 세그먼트를 획득할 수 있다.As a result, according to an embodiment of the present invention, since the related keywords may be extracted from all areas of interest where a user's search occurs, keyword segments of various subjects may be acquired through the search keyword cluster.

데이터 계층도 생성부(104)는 주제를 포함하는 제1 계층, 주제로 분류된 검색 키워드 클러스터를 포함하는 제2 계층 및 검색 키워드 클러스터에 대한 검색 키워드를 포함하는 제3 계층으로 구성된 데이터 계층도를 생성할 수 있다. The data hierarchy diagram generating unit 104 may include a data hierarchy diagram including a first hierarchy including a topic, a second hierarchy including a search keyword cluster classified into topics, and a third hierarchy including a search keyword for the search keyword cluster. Can be generated.

즉, 본 발명의 일실시예에 따른 검색 키워드 분류 시스템(100)은 연관 키워드를 이용하여 검색 키워드->검색 키워드 클러스터->주제 단위로 계층을 형성할 수 있으며, 형성된 계층에 기초하여 데이터 계층도를 통해 시각적인 데이터 계층도를 생성할 수 있다.That is, the search keyword classification system 100 according to an embodiment of the present invention may form hierarchies by search keyword-> search keyword cluster-> topic unit by using related keywords, and based on the formed hierarchical diagram Allows you to create visual data hierarchies.

일례로, 데이터 계층도 생성부(104)는 주제에 포함된 검색 키워드의 검색 횟수에 따라 제1 계층에 대한 주제별 사이즈를 결정할 수 있다. 그리고, 데이터 계층도 생성부(104)는 검색 키워드 클러스터에 포함된 검색 키워드의 검색 횟수에 따라 제2 계층에 대한 검색 키워드 클러스터별 사이즈를 결정할 수 있다. 또한, 데이터 계층도 생성부(104)는 검색 키워드의 검색 횟수에 따라 제3 계층에 대한 검색 키워드별 사이즈를 결정할 수 있다.In one example, the data layer diagram generator 104 may determine the size of the subject for the first layer according to the number of searches of the search keyword included in the subject. The data hierarchy diagram generator 104 may determine the size of each search keyword cluster for the second hierarchy according to the number of searches of the search keywords included in the search keyword cluster. In addition, the data layer diagram generator 104 may determine the size of each search keyword for the third layer according to the number of searches of the search keyword.

도 2는 본 발명의 일실시예에 따라 검색 키워드에 대한 복수의 연관 키워드의 일례를 도시한 도면이다.2 illustrates an example of a plurality of related keywords for a search keyword according to an embodiment of the present invention.

검색 키워드 분류 시스템(100)은 사용자가 입력한 검색 키워드에 대해 연관 키워드를 추출할 수 있다. 도 2를 참고하면, 검색 키워드 각각에 하나 이상의 연관 키워드가 추출된 결과가 도시되어 있다. 이 때, 검색 키워드는 일정 기간 동안 검색 횟수가 미리 설정한 검색 횟수 이상인 키워드를 의미할 수 있다.The search keyword classification system 100 may extract a related keyword with respect to the search keyword input by the user. Referring to FIG. 2, a result of extracting one or more related keywords from each of the search keywords is shown. In this case, the search keyword may mean a keyword whose search number is equal to or greater than a predetermined search number for a predetermined period.

일례로, 검색 키워드 분류 시스템(100)은 키워드의 검색 횟수에 따른 연관 규칙에 기초하여 검색 키워드에 대한 연관 키워드를 추출할 수 있다. 예를 들면, 사용자가 A라는 키워드를 입력하여 검색한 후 보다 상세한 검색 결과를 얻기 위해 연속하여 B라는 키워드를 입력한 경우, 키워드 A가 검색된 후 키워드 B가 입력되는 조건이 미리 설정한 임계치 이상이라면 키워드 B는 키워드 A에 대한 연관 키워드로 정의될 수 있다.For example, the search keyword classification system 100 may extract an associated keyword for the search keyword based on an association rule according to the number of times of keyword search. For example, if a user enters the keyword A to search and then enters the keyword B consecutively to obtain more detailed search results, if the condition under which keyword B is entered after the keyword A is searched is greater than or equal to a preset threshold, Keyword B may be defined as an associated keyword for keyword A.

일례로, 검색 키워드 분류 시스템(100)은 키워드의 검색 횟수에 따른 연관 규칙을 이용하여 검색 키워드에 대해 연관 키워드를 추출할 수 있다. 구체적으로, 검색 키워드 분류 시스템(100)은 키워드 A의 검색 횟수, 키워드 B의 검색 횟수 및 키워드 A가 검색된 이후 특정 시간 이내 키워드 B의 검색 횟수를 통해 조건부 확 률(A가 검색된 후 B가 이어서 검색될 확률) 및 키워드 간 상관 관계를 결정하고, 조건부 확률 및 상관 관계에 기초하여 키워드 A와 키워드 B가 연관 관계에 있는 지 판단할 수 있다. 이 때, 검색 키워드 분류 시스템(100)은 키워드 A와 키워드 B가 연관 관계에 있는 지 판단하기 위해 검색 횟수, 조건부 확률 및 상관 관계 정도에 임계치를 설정할 수 있다.For example, the search keyword classification system 100 may extract a related keyword with respect to the search keyword using an association rule according to the number of times the keyword is searched. Specifically, the search keyword classification system 100 may search conditional probability (B after A is searched after the number of searches for keyword A, the number of searches for keyword B, and the number of searches for keyword B within a specific time after keyword A is searched. Probability) and the correlation between the keywords, and determine whether the keyword A and the keyword B are related based on the conditional probability and the correlation. At this time, the search keyword classification system 100 may set thresholds on the number of searches, conditional probabilities, and the degree of correlation in order to determine whether keywords A and B are related.

다른 일례로, 검색 키워드 분류 시스템(100)은 키워드를 입력한 사용자의 IP 주소에 따른 연관 규칙을 이용하여 검색 키워드에 대해 연관 키워드를 추출할 수 있다. 구체적으로, 검색 키워드 분류 시스템(100)은 키워드 A를 입력한 사용자의 IP 주소 정보, 키워드 B를 입력한 사용자의 IP 주소 정보 및 키워드 A가 입력된 후 키워드 B가 입력된 경우 키워드 B를 입력한 사용자의 IP 주소 정보를 통해 조건부 확률을 결정하고, 조건부 확률에 기초하여 키워드 A와 키워드 B가 연관 관계에 있는 지 여부를 판단할 수 있다. 이 때, 검색 키워드 분류 시스템(100)은 키워드 A와 키워드 B가 연관 관계에 있는 지 판단하기 위해 IP 주소 수, 조건부 확률에 임계치를 설정할 수 있다.As another example, the search keyword classification system 100 may extract a related keyword for the search keyword using an association rule according to the IP address of the user who inputs the keyword. Specifically, the search keyword classification system 100 inputs the keyword B when the IP address information of the user who inputs the keyword A, the IP address information of the user who inputs the keyword B, and the keyword B is input after the keyword A is input. The conditional probability may be determined based on the IP address information of the user, and based on the conditional probability, it may be determined whether the keyword A and the keyword B are related. In this case, the search keyword classification system 100 may set thresholds on the number of IP addresses and conditional probabilities to determine whether the keyword A and the keyword B are related.

또 다른 일례로, 검색 키워드 분류 시스템(100)은 키워드를 입력한 사용자의 사용자 식별 정보(UID)에 따른 연관 규칙을 이용하여 검색 키워드에 대해 연관 키워드를 추출할 수 있다. 사용자 식별 정보에 따른 연관 규칙은 사용자의 IP 주소에 따른 연관 규칙을 이용한 방법에 동일한 형태로 적용할 수 있다.As another example, the search keyword classification system 100 may extract a related keyword for the search keyword using an association rule according to user identification information (UID) of the user who inputs the keyword. The association rule according to the user identification information may be applied in the same way to the method using the association rule according to the user's IP address.

이러한 과정을 통해 검색 키워드에 대한 연관 키워드가 추출되면, 검색 키워드 분류 시스템(100)은 연관 키워드를 매개로 검색 키워드의 연결 관계를 생성할 수 있다. 도 2를 참고하면, 만약 연관 키워드 b3와 연관 키워드 c3가 동일한 경우, 검색 키워드 분류 시스템(100)은 연관 키워드 b3(또는 연관 키워드 c3)를 매개로 하여 검색 키워드 B와 검색 키워드 C를 연결할 수 있다. When the related keyword for the search keyword is extracted through this process, the search keyword classification system 100 may generate a connection relationship of the search keyword through the related keyword. Referring to FIG. 2, if the related keyword b 3 and the related keyword c 3 are the same, the search keyword classification system 100 uses the related keyword b 3 (or the related keyword c 3 ) as a medium. You can associate search keyword B with search keyword C.

마찬가지로, 연관 키워드 b5, 연관 키워드 c5 및 연관 키워드 d5가 동일한 경우, 검색 키워드 분류 시스템(100)은 연관 키워드 b5(또는 연관 키워드 c5, 연관 키워드 d5)를 매개로 하여 검색 키워드 B, 검색 키워드 C 및 검색 키워드 D를 연결할 수 있다. 이러한 과정을 통해 검색 키워드 분류 시스템(100)은 검색 키워드의 연결 관계를 생성할 수 있다.Similarly, when the associated keyword b 5 , the associated keyword c 5 and the associated keyword d 5 are equal, the search keyword classification system 100 searches for the search keyword via the associated keyword b 5 (or the associated keyword c 5 , the associated keyword d 5 ). B, search keyword C and search keyword D can be linked. Through this process, the search keyword classification system 100 may generate a connection relationship of the search keywords.

도 3은 본 발명의 일실시예에 따라 연관 키워드를 통해 검색 키워드 간의 연결 관계에 대한 일례를 도시한 도면이다.3 is a diagram illustrating an example of a connection relationship between search keywords through an associated keyword according to an embodiment of the present invention.

도 3을 참고하면, 연관 키워드를 매개로 연결된 검색 키워드 A 내지 검색 키워드 J(301~310)가 도시되어 있다.Referring to FIG. 3, search keywords A through search keywords J 301 ˜ 310 connected through a related keyword are illustrated.

검색 키워드 분류 시스템(100)은 연관 키워드를 매개로 하여 검색 키워드의 연결 관계를 생성할 수 있다. 이 때, 검색 키워드 사이에 공통된 연관 키워드가 많을수록 연결 강도는 증가할 수 있다.The search keyword classification system 100 may generate a connection relationship of the search keywords through the related keywords. At this time, the connection strength may increase as more related keywords are common between search keywords.

도 3을 살펴보면, 검색 키워드 B(302)와 검색 키워드 C(303)는 4개의 공통된 연관 키워드를 매개로 연결되어 있고, 검색 키워드 B(302)와 검색 키워드 A(301)는 2개의 공통된 연관 키워드를 매개로 연결되어 있으므로, 검색 키워드 B(302)와 검색 키워드 C(303) 간의 연결 강도가 검색 키워드 B(302)와 검색 키워드 A(301) 간의 연결 강도보다 더 크다고 할 수 있다. Referring to FIG. 3, search keyword B 302 and search keyword C 303 are connected by four common related keywords, and search keyword B 302 and search keyword A 301 are two common related keywords. Since the connection strength between the search keyword B 302 and the search keyword C 303 is greater than the connection strength between the search keyword B 302 and the search keyword A 301.

도 4는 본 발명의 일실시예에 따라 검색 키워드 간의 연결 관계로부터 검색 키워드 클러스터를 생성하는 과정을 설명하기 위한 도면이다.4 is a diagram for describing a process of generating a search keyword cluster from a connection relationship between search keywords according to an embodiment of the present invention.

검색 키워드 분류 시스템(100)은 검색 키워드의 연결 관계로부터 검색 키워드 클러스터를 생성할 수 있다. 이 때, 검색 키워드 분류 시스템(100)은 검색 키워드 사이에 연결 강도에 기초하여 검색 키워드 클러스터를 생성할 수 있다.The search keyword classification system 100 may generate a search keyword cluster from the connection relation of the search keywords. In this case, the search keyword classification system 100 may generate a search keyword cluster based on the strength of the connection between the search keywords.

도 4에 나타난 검색 키워드들(401~410) 사이에 연결된 선은 연결 강도를 나타낸다. 도 4를 참고하면, 검색 키워드 A(401), 검색 키워드 B(402), 검색 키워드 C(403) 및 검색 키워드 D(404)간에 연결 강도는 미리 설정한 기준을 초과한다고 가정한다. 마찬가지로, 검색 키워드 E(405), 검색 키워드 F(406), 검색 키워드 G(407), 검색 키워드 H(408), 검색 키워드 I(409) 및 검색 키워드 J(410) 간에 연결 강도는 미리 설정한 기준을 초과한다고 가정한다. 다만, 검색 키워드 D(404)와 검색 키워드 E(405)의 연결 강도와 검색 키워드 D(404)와 검색 키워드 F(406)의 연결 강도는 미리 설정한 기준을 초과하지 않는다고 가정한다.Lines connected between the search keywords 401 to 410 shown in FIG. 4 indicate connection strengths. Referring to FIG. 4, it is assumed that the connection strength between the search keyword A 401, the search keyword B 402, the search keyword C 403, and the search keyword D 404 exceeds a preset criterion. Similarly, the connection strength between the search keyword E 405, the search keyword F 406, the search keyword G 407, the search keyword H 408, the search keyword I 409 and the search keyword J 410 is set in advance. Assume that the criteria are exceeded. However, it is assumed that the connection strength between the search keyword D 404 and the search keyword E 405 and the connection strength between the search keyword D 404 and the search keyword F 406 do not exceed a preset criterion.

그러면, 검색 키워드 분류 시스템(100)은 검색 키워드 A(401), 검색 키워드 B(402), 검색 키워드 C(403) 및 검색 키워드 D(404)를 하나의 검색 키워드 클러스터 X(411)로 정의할 수 있다. 마찬가지로, 검색 키워드 E(405), 검색 키워드 F(406), 검색 키워드 G(407), 검색 키워드 H(408), 검색 키워드 I(409) 및 검색 키워드 J(410)를 하나의 검색 키워드 클러스터 Y(412)로 정의할 수 있다. 그러나, 검색 키워드 D(404)와 검색 키워드 E(405) 및 검색 키워드 D(404)와 검색 키워드 F(406)는 서로 연결되어 있지만, 연결 강도가 미리 설정한 기준을 만족하지 못하므로 하나의 검색 키워드 클러스터에 포함될 수 없다. Then, the search keyword classification system 100 may define the search keyword A 401, the search keyword B 402, the search keyword C 403, and the search keyword D 404 as one search keyword cluster X 411. Can be. Similarly, search keyword E (405), search keyword F (406), search keyword G (407), search keyword H (408), search keyword I (409), and search keyword J (410) are combined into one search keyword cluster Y. It can be defined as (412). However, although the search keyword D 404, the search keyword E 405, and the search keyword D 404 and the search keyword F 406 are connected to each other, the connection strength does not satisfy a predetermined criterion so that one search is performed. It cannot be included in a keyword cluster.

이러한 과정을 통해 검색 키워드 분류 시스템(100)은 검색 키워드 간의 연결 관계에서 특정 범주에 존재하는 복수의 검색 키워드를 포함하는 검색 키워드 클러스터를 생성할 수 있다.Through this process, the search keyword classification system 100 may generate a search keyword cluster including a plurality of search keywords existing in a specific category in a connection relationship between the search keywords.

도 5는 본 발명의 일실시예에 따라 검색 키워드 클러스터를 주제별로 분류하여 일별로 클러스터링을 수행하는 과정을 설명하기 위한 도면이다.5 is a diagram illustrating a process of classifying search keyword clusters by topic and performing clustering on a daily basis according to an embodiment of the present invention.

일례로, 검색 키워드 분류 시스템(100)은 최초로 생성된 검색 키워드 클러스터에 대해 주제별로 분류하여 시드 클러스터를 생성하고, 시드 클러스터를 기초로 미리 설정한 주기별로 생성된 검색 키워드 클러스터를 주제별로 분류할 수 있다.For example, the search keyword classification system 100 may generate a seed cluster by classifying the first generated search keyword cluster by a subject, and classify the search keyword cluster generated by a predetermined period based on the seed cluster by subject. have.

도 5를 참고하면, 2008년 7월 17일부터 2008년 10월 30일까지 일별 검색 키워드 클러스터를 생성하여 검색 키워드 클러스터를 분류하는 과정이 도시되어 있다.Referring to FIG. 5, a process of classifying search keyword clusters by generating daily search keyword clusters from July 17, 2008 to October 30, 2008 is illustrated.

먼저, 2008년 7월 17일에 최초로 검색 키워드 클러스터(501)(cluster 40214, cluster 27584, cluster 73920, cluster 58134, cluster 21276, cluster 15865)가 생성되면, 검색 키워드 분류 시스템(100)은 검색 키워드 클러스터(501)를 복수의 주제(501) 각각으로 분류할 수 있다. 도 5에서 볼 수 있듯이, cluster 40214, cluster 27584는 "대중음악"으로 분류되고, cluster 73920는 "게임"으로 분 류될 수 있다. 마찬가지로, cluster 58134는 "의류/잡화"로 분류되고, cluster 21276, cluster 15865는 "여행"으로 분류될 수 있다. 이렇게 주제별로 분류된 검색 키워드 클러스터(501)가 시드 클러스터가 될 수 있다.First, when a search keyword cluster 501 (cluster 40214, cluster 27584, cluster 73920, cluster 58134, cluster 21276, cluster 15865) is first generated on July 17, 2008, the search keyword classification system 100 performs a search keyword cluster. 501 can be classified into a plurality of subjects 501, respectively. As can be seen in Figure 5, cluster 40214, cluster 27584 can be classified as "pop music", cluster 73920 can be classified as "game". Similarly, cluster 58134 may be classified as "clothing / miscellaneous goods," and cluster 21276 and cluster 15865 may be classified as "travel." The search keyword cluster 501 classified according to the subject may be a seed cluster.

그러면, 다음날 2008년 7월 18일에 생성된 검색 키워드 클러스터는 복수의 시드 클러스터 각각이 속한 주제로 분류될 수 있으며, 이러한 과정은 2008년 10월 30일까지 매일 반복될 수 있다.Then, the search keyword cluster generated on the next day of July 18, 2008 may be classified as a subject to which each of the plurality of seed clusters belongs, and this process may be repeated every day until October 30, 2008.

일별로 생성된 검색 키워드 클러스터는 시드 클러스터가 속한 주제로 분류될 수 있으며, 최종적으로, 검색 키워드가 복수의 주제 각각으로 분류될 수 있다. 주제는 사용자의 검색 의도와 대응될 수 있으므로, 동일한 주제에 포함된 검색 키워드 클러스터는 동일한 사용자의 검색 의도를 나타내는 것을 의미할 수 있다. 이 때, 주제는 미리 설정한 개수만큼 설정될 수 있다.The search keyword cluster generated on a daily basis may be classified into the subject to which the seed cluster belongs, and finally, the search keyword may be classified into each of the plurality of subjects. Since the subject may correspond to the search intention of the user, the search keyword cluster included in the same subject may mean that the search intention of the same user is indicated. At this time, the number of subjects may be set by a preset number.

본 발명의 일실시예에 따르면, 검색 키워드 분류 시스템(100)은 주제별로 검색 키워드 및 검색 키워드 클러스터에 대한 정보를 제공할 수 있다. 그리고, 검색 키워드 분류 시스템(100)은 주제별로 검색 키워드를 입력한 사용자 분포에 대한 정보, 사용자의 검색 패턴 등의 정보를 제공할 수 있다.According to an embodiment of the present invention, the search keyword classification system 100 may provide information about a search keyword and a search keyword cluster for each topic. In addition, the search keyword classification system 100 may provide information about a distribution of a user who inputs a search keyword for each subject, information about a user's search pattern, and the like.

도 6은 본 발명의 일실시예에 따라 주제, 검색 키워드 클러스터 및 검색 키워드 간의 계층 관계를 나타내는 일례를 도시한 도면이다.6 illustrates an example of a hierarchical relationship between a topic, a search keyword cluster, and a search keyword according to an embodiment of the present invention.

본 발명의 일실시예에 따른 검색 키워드 분류 시스템(100)은 검색 키워드->검색 키워드 클러스터->주제의 3단계의 계층을 도출할 수 있다. 이 때, 검색 키워드 분류 시스템(100)은 주제를 포함하는 제1 계층(601), 상기 주제로 분류된 검색 키워드 클러스터를 포함하는 제2 계층(602) 및 상기 검색 키워드 클러스터에 대한 검색 키워드를 포함하는 제3 계층(603)으로 구성된 데이터 계층도를 생성할 수 있다.The search keyword classification system 100 according to an embodiment of the present invention may derive three levels of search keyword-> search keyword cluster-> topic. At this time, the search keyword classification system 100 includes a first layer 601 including a subject, a second layer 602 including a search keyword cluster classified into the subject, and a search keyword for the search keyword cluster. A data layer diagram composed of the third layer 603 may be generated.

일례로, 검색 키워드 분류 시스템(100)은 주제에 포함된 검색 키워드의 검색 횟수에 따라 제1 계층(601)에 대한 주제별 사이즈를 결정할 수 있다. 그리고, 검색 키워드 분류 시스템(100)은 검색 키워드 클러스터에 포함된 검색 키워드의 검색 횟수에 따라 제2 계층(602)에 대한 검색 키워드 클러스터별 사이즈를 결정할 수 있다. 또한, 검색 키워드 분류 시스템(100)은 검색 키워드의 검색 횟수에 따라 제3 계층(603)에 대한 검색 키워드별 사이즈를 결정할 수 있다.For example, the search keyword classification system 100 may determine the size of each subject for the first layer 601 according to the number of searches of the search keywords included in the subject. The search keyword classification system 100 may determine the size of each search keyword cluster for the second hierarchy 602 according to the number of search keywords included in the search keyword cluster. In addition, the search keyword classification system 100 may determine the size of each search keyword for the third layer 603 according to the number of searches of the search keyword.

제1 계층(601)에 포함된 사각형의 넓이는 주제별 사이즈를 의미하며, 사각형의 넓이가 넓을수록 해당 사각형에 대응하는 주제에 포함된 검색 키워드의 검색 횟수가 많은 것을 의미할 수 있다. 그리고, 제2 계층(602)에 포함된 사각형의 넓이는 검색 키워드 클러스터별 사이즈를 의미하며, 사각형의 넓이가 넓을수록 해당 사각형에 대응하는 검색 키워드 클러스터에 포함된 검색 키워드의 검색 횟수가 많은 것을 의미할 수 있다. 또한, 제3 계층(603)에 포함된 사각형의 넓이는 검색 키워드별 사이즈를 의미하며, 사각형의 넓이가 넓을수록 해당 사각형에 대응하는 검색 키워드의 검색 횟수가 많은 것을 의미할 수 있다.The width of the rectangle included in the first layer 601 may mean the size of each subject, and as the width of the rectangle increases, the number of search keywords included in the subject corresponding to the rectangle may increase. The width of the rectangle included in the second layer 602 means the size of each search keyword cluster, and the wider the width of the rectangle, the more the number of search keywords included in the search keyword cluster corresponding to the rectangle. can do. In addition, the width of the rectangle included in the third layer 603 may mean the size of each search keyword, and as the width of the rectangle increases, the number of search keywords corresponding to the rectangle may be increased.

검색 키워드 분류 시스템(100)은 제1 계층(601), 제2 계층(602) 및 제3 계층(603)을 시각적/정량적으로 제공할 수 있다. 만약, 제1 계층(601)에서 주제 X(604)가 선택되면, 검색 키워드 분류 시스템(100)은 주제 X(604)로 분류된 검색 키워드 클러스터에 대한 제2 계층(602)을 표시할 수 있다. 그리고, 제2 계층(602)에서 검색 키워드 클러스터 Y(605)가 선택되면, 검색 키워드 분류 시스템(100)은 검색 키워드 클러스터 Y(605)에 포함된 검색 키워드에 대한 제3 계층(603)을 표시할 수 있다. 도 6에 표시된 데이터 계층도는 일례에 불과하고, 시스템의 구성에 따라 다른 형태로 표시될 수 있다.The search keyword classification system 100 may provide the first layer 601, the second layer 602, and the third layer 603 visually and quantitatively. If topic X 604 is selected in the first hierarchy 601, the search keyword classification system 100 may display a second hierarchy 602 for a search keyword cluster classified as topic X 604. . When the search keyword cluster Y 605 is selected in the second hierarchy 602, the search keyword classification system 100 displays the third hierarchy 603 for the search keyword included in the search keyword cluster Y 605. can do. The data hierarchy diagram shown in FIG. 6 is merely an example and may be displayed in other forms according to the configuration of the system.

도 7은 본 발명의 일실시예에 따른 검색 키워드 분류 방법의 전체 구성을 도시한 도면이다.7 is a diagram illustrating the overall configuration of a search keyword classification method according to an embodiment of the present invention.

단계(S701)에서, 검색 키워드 분류 시스템(100)은 사용자가 입력한 검색 키워드에 대해 연관 키워드를 추출할 수 있다. 이 때, 연관 키워드는 사용자들이 자신의 검색 의도에 부합하는 검색 결과를 도출할 수 있도록 함께 검색하는 경향이 높은 키워드들을 의미할 수 있다. 다시 말해서, 검색 키워드에 대한 연관 키워드는 사용자의 검색 의도를 파악할 수 있는 하나의 수단이 될 수 있다.In operation S701, the search keyword classification system 100 may extract a related keyword with respect to the search keyword input by the user. In this case, the related keywords may refer to keywords that have a high tendency to search together so that users can derive search results that match their search intentions. In other words, the related keyword for the search keyword may be one means for determining the user's search intention.

일례로, 검색 키워드 분류 시스템(100)은 일정 기간 동안 검색 횟수가 미리 설정한 검색 횟수 이상인 검색 키워드에 대해 연관 키워드를 추출할 수 있다. 이 때, 검색 키워드 분류 시스템(100)은 키워드의 검색 횟수에 따른 연관 규칙, 사용자의 IP 주소에 따른 연관 규칙 또는 사용자 식별 정보에 따른 연관 규칙 중 어느 하나의 연관 규칙에 기초하여 검색 키워드에 대한 연관 키워드를 추출할 수 있다.For example, the search keyword classification system 100 may extract a related keyword for a search keyword whose search number is equal to or greater than a predetermined search number for a predetermined period of time. At this time, the search keyword classification system 100 associates the search keyword with respect to any one of an association rule according to the number of searches of the keyword, an association rule according to the user's IP address, or an association rule based on the user identification information. You can extract keywords.

단계(S702)에서, 검색 키워드 분류 시스템(100)은 추출된 연관 키워드를 이용하여 검색 키워드 클러스터를 생성할 수 있다. 검색 키워드 분류 시스템(100)은 연관 키워드를 매개로 하여 검색 키워드의 연결 관계를 생성하고, 검색 키워드의 연결 관계로부터 검색 키워드 클러스터를 생성할 수 있다.In operation S702, the search keyword classification system 100 may generate a search keyword cluster using the extracted related keywords. The search keyword classification system 100 may generate a connection relationship of the search keywords through the associated keyword, and generate a search keyword cluster from the connection relationship of the search keywords.

이 때, 검색 키워드 분류 시스템(100)은 검색 키워드 사이에 연결 강도에 기초하여 검색 키워드 클러스터를 생성할 수 있다. 여기서, 연결 강도는 검색 키워드 사이에 공통된 연관 키워드가 많을수록 증가할 수 있다. 예를 들어, 검색 키워드 분류 시스템(100)은 검색 키워드의 연결 관계에 범주형 클러스터링 기법을 적용하여 검색 키워드 클러스터를 생성할 수 있다.In this case, the search keyword classification system 100 may generate a search keyword cluster based on the strength of the connection between the search keywords. Here, the connection strength may increase as there are more related keywords common between the search keywords. For example, the search keyword classification system 100 may generate a search keyword cluster by applying a categorical clustering technique to the connection relation of the search keywords.

즉, 검색 키워드 분류 시스템(100)은 범주형 클러스터링 기법에 따라 주어진 검색 키워드에 대한 연결 관계에서 공통된 연관 키워드를 통해 검색 키워드 간 유사도를 판단하고, 유사도가 높은 검색 키워드들을 그룹화하여 클러스터를 생성할 수 있다.That is, the search keyword classification system 100 may determine similarity between search keywords through a common association keyword in a connection relationship to a given search keyword according to a categorical clustering technique, and generate a cluster by grouping search keywords with high similarity. have.

단계(S703)에서, 검색 키워드 분류 시스템(100)은 사용자 검색 의도를 고려하여 검색 키워드 클러스터를 주제에 따라 분류할 수 있다. 이 때, 검색 키워드 분류 시스템(100)은 검색 키워드 클러스터 간에 연관성을 고려하여 검색 키워드 클러스터를 주제별로 분류할 수 있다. 단계(S703)은 최초로 생성된 검색 키워드 클러스터에 대해 주제별로 분류하여 시드 클러스터를 생성하는 과정 및 시드 클러스터를 기초로 미리 설정한 주기별로 생성된 검색 키워드 클러스터를 주제별로 분류하는 과정을 포함할 수 있다.In operation S703, the search keyword classification system 100 may classify the search keyword cluster according to a topic in consideration of a user search intention. In this case, the search keyword classification system 100 may classify the search keyword cluster by subject in consideration of the correlation between the search keyword clusters. Step S703 may include a process of generating a seed cluster by classifying the first generated search keyword cluster by a subject and classifying the search keyword cluster generated by a predetermined period based on the seed cluster by subject. .

검색 키워드 분류 시스템(100)은 사용자의 검색 의도를 의미하는 주제에 따라 검색 키워드 클러스터를 분류할 수 있으며, 결국 주제에 따라 검색 키워드를 분류할 수 있다.The search keyword classification system 100 may classify the search keyword cluster according to a theme representing a user's search intention, and eventually classify the search keyword according to a theme.

단계(S704)에서, 검색 키워드 분류 시스템(100)은 주제를 포함하는 제1 계층, 주제로 분류된 검색 키워드 클러스터를 포함하는 제2 계층 및 검색 키워드 클러스터에 대한 검색 키워드를 포함하는 제3 계층으로 구성된 데이터 계층도를 생성할 수 있다. 이 때, 단계(S704)는 검색 키워드 분류 시스템(100)은 주제에 포함된 검색 키워드의 검색 횟수에 따라 제1 계층에 대한 주제별 사이즈를 결정하는 단계, 검색 키워드 클러스터에 포함된 검색 키워드의 검색 횟수에 따라 제2 계층에 대한 검색 키워드 클러스터별 사이즈를 결정하는 단계 및 검색 키워드의 검색 횟수에 따라 제3 계층에 대한 검색 키워드별 사이즈를 결정하는 단계를 포함할 수 있다.In step S704, the search keyword classification system 100 moves to a first tier containing a topic, a second tier containing a search keyword cluster classified into a subject, and a third tier including a search keyword for the search keyword cluster. A configured data hierarchy can be created. At this time, in step S704, the search keyword classification system 100 determines the size of each topic for the first layer according to the number of searches of the search keywords included in the topic, and the number of searches of the search keywords included in the search keyword cluster. The method may include determining a size of each search keyword cluster for the second layer and determining a size of each search keyword for the third layer according to the number of search keywords.

이 때, 검색 키워드 분류 시스템(100)은 데이터 계층도를 통해 주제에 대한 제1 계층, 검색 키워드 클러스터에 대한 제2 계층(602) 및 검색 키워드에 대한 제3 계층(603)을 시각적/정량적으로 제공할 수 있다.At this time, the search keyword classification system 100 visually and quantitatively displays the first tier for the topic, the second tier 602 for the search keyword cluster, and the third tier 603 for the search keyword through the data hierarchy diagram. Can provide.

도 7에서 설명되지 않은 구체적인 부분은 도 1 내지 도 6의 설명을 참고할 수 있다.Specific parts not described in FIG. 7 may refer to descriptions of FIGS. 1 to 6.

또한 본 발명의 일실시예에 따른 검색 키워드 분류 방법은 다양한 컴퓨터로 구현되는 동작을 수행하기 위한 프로그램 명령을 포함하는 컴퓨터 판독 가능 매체를 포함한다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.In addition, the search keyword classification method according to an embodiment of the present invention includes a computer readable medium including program instructions for performing various computer-implemented operations. The computer readable medium may include program instructions, data files, data structures, etc. alone or in combination. The media may be program instructions that are specially designed and constructed for the present invention or may be available to those skilled in the art of computer software. Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks, and magnetic tape, optical media such as CD-ROMs, DVDs, and magnetic disks, such as floppy disks. Magneto-optical media, and hardware devices specifically configured to store and execute program instructions, such as ROM, RAM, flash memory, and the like. Examples of program instructions include not only machine code generated by a compiler, but also high-level language code that can be executed by a computer using an interpreter or the like.

이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 이는 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. 따라서, 본 발명 사상은 아래에 기재된 특허청구범위에 의해서만 파악되어야 하고, 이의 균등 또는 등가적 변형 모두는 본 발명 사상의 범주에 속한다고 할 것이다.As described above, the present invention has been described by way of limited embodiments and drawings, but the present invention is not limited to the above-described embodiments, which can be variously modified and modified by those skilled in the art to which the present invention pertains. Modifications are possible. Accordingly, the spirit of the present invention should be understood only by the claims set forth below, and all equivalent or equivalent modifications thereof will belong to the scope of the present invention.

도 1은 본 발명의 일실시예에 따른 검색 키워드 분류 시스템의 전체 구성을 도시한 블록 다이어그램이다.1 is a block diagram showing the overall configuration of a search keyword classification system according to an embodiment of the present invention.

도 2는 본 발명의 일실시예에 따라 검색 키워드에 대한 복수의 연관 키워드의 일례를 도시한 도면이다.2 illustrates an example of a plurality of related keywords for a search keyword according to an embodiment of the present invention.

도 3은 본 발명의 일실시예에 따라 연관 키워드를 통해 검색 키워드 간의 연결 관계에 대한 일례를 도시한 도면이다.3 is a diagram illustrating an example of a connection relationship between search keywords through an associated keyword according to an embodiment of the present invention.

도 4는 본 발명의 일실시예에 따라 검색 키워드 간의 연결 관계로부터 검색 키워드 클러스터를 생성하는 과정을 설명하기 위한 도면이다.4 is a diagram for describing a process of generating a search keyword cluster from a connection relationship between search keywords according to an embodiment of the present invention.

도 5는 본 발명의 일실시예에 따라 검색 키워드 클러스터를 주제별로 분류하여 일별로 클러스터링을 수행하는 과정을 설명하기 위한 도면이다.5 is a diagram illustrating a process of classifying search keyword clusters by topic and performing clustering on a daily basis according to an embodiment of the present invention.

도 6은 본 발명의 일실시예에 따라 주제, 검색 키워드 클러스터 및 검색 키워드 간의 계층 관계를 나타내는 일례를 도시한 도면이다.6 illustrates an example of a hierarchical relationship between a topic, a search keyword cluster, and a search keyword according to an embodiment of the present invention.

도 7은 본 발명의 일실시예에 따른 검색 키워드 분류 방법의 전체 구성을 도시한 도면이다.7 is a diagram illustrating the overall configuration of a search keyword classification method according to an embodiment of the present invention.

<도면의 주요 부분에 대한 부호의 설명><Explanation of symbols for the main parts of the drawings>

100: 검색 키워드 분류 시스템100: search keyword classification system

101: 연관 키워드 추출부101: related keyword extraction unit

102: 클러스터 생성부102: cluster generator

103: 클러스터 분류부103: cluster classification unit

104: 데이터 계층도 생성부104: data layer diagram generation unit

Claims (21)

사용자가 입력한 검색 키워드에 대해 연관 키워드를 추출하는 연관 키워드 추출부;An association keyword extraction unit for extracting an association keyword with respect to a search keyword input by a user; 상기 추출된 연관 키워드를 이용하여 검색 키워드 클러스터를 생성하는 클러스터 생성부; 및A cluster generation unit generating a search keyword cluster using the extracted related keywords; And 사용자 검색 의도를 고려하여 상기 검색 키워드 클러스터를 주제에 따라 분류하는 클러스터 분류부Cluster classification unit for classifying the search keyword cluster according to the subject in consideration of user search intent 를 포함하는 검색 키워드 분류 시스템.Search keyword classification system comprising a. 제1항에 있어서,The method of claim 1, 상기 연관 키워드 추출부는,The related keyword extraction unit, 일정 기간 동안 검색 횟수가 미리 설정한 검색 횟수 이상인 검색 키워드에 대해 연관 키워드를 추출하는 것을 특징으로 하는 검색 키워드 분류 시스템.A search keyword classification system comprising extracting a related keyword for a search keyword whose search number is equal to or greater than a predetermined search number for a predetermined period. 제1항에 있어서,The method of claim 1, 상기 연관 키워드 추출부는,The related keyword extraction unit, 키워드의 검색 횟수에 따른 연관 규칙, 사용자의 IP 주소에 따른 연관 규칙 또는 사용자 식별 정보에 따른 연관 규칙 중 어느 하나의 연관 규칙에 기초하여 상기 검색 키워드에 대한 연관 키워드를 추출하는 것을 특징으로 하는 검색 키워드 분류 시스템.A search keyword for extracting a related keyword for the search keyword based on any one of an association rule according to the number of searches of a keyword, an association rule according to a user's IP address, or an association rule according to user identification information Classification system. 제1항에 있어서,The method of claim 1, 상기 클러스터 생성부는,The cluster generation unit, 상기 연관 키워드를 매개로 하여 상기 검색 키워드의 연결 관계를 생성하고, 상기 검색 키워드의 연결 관계로부터 상기 검색 키워드 클러스터를 생성하는 것을 특징으로 하는 검색 키워드 분류 시스템.And generating a connection relationship between the search keywords via the associated keyword, and generating the search keyword cluster from the connection relationship between the search keywords. 제4항에 있어서,The method of claim 4, wherein 상기 클러스터 생성부는,The cluster generation unit, 상기 검색 키워드 사이에 연결 강도에 기초하여 상기 검색 키워드 클러스터를 생성하고,Generate the search keyword cluster based on a connection strength between the search keywords, 상기 연결 강도는,The connection strength is 상기 검색 키워드 사이에 공통된 연관 키워드가 많을수록 증가하는 것을 특징으로 하는 검색 키워드 분류 시스템.The search keyword classification system, characterized in that increases as the number of related keywords in common among the search keywords increases. 제5항에 있어서,The method of claim 5, 상기 클러스터 생성부는,The cluster generation unit, 상기 검색 키워드의 연결 관계에 범주형 클러스터링 기법을 적용하여 상기 검색 키워드 클러스터를 생성하는 것을 특징으로 하는 검색 키워드 분류 시스템. And a search keyword cluster is generated by applying a categorical clustering technique to the connection relation of the search keywords. 제1항에 있어서,The method of claim 1, 상기 클러스터 분류부는,The cluster classification unit, 상기 검색 키워드 클러스터 간에 연관성을 고려하여 상기 검색 키워드 클러스터를 주제별로 분류하는 것을 특징으로 하는 검색 키워드 분류 시스템.Search keyword classification system, characterized in that to classify the search keyword cluster in consideration of the association between the search keyword cluster. 제1항에 있어서,The method of claim 1, 상기 클러스터 분류부는,The cluster classification unit, 최초로 생성된 검색 키워드 클러스터에 대해 주제별로 분류하여 시드 클러스터를 생성하고, 상기 생성된 시드 클러스터를 기초로 미리 설정한 주기별로 생성된 검색 키워드 클러스터를 주제별로 분류하는 것을 특징으로 하는 검색 키워드 분류 시스템.A search keyword classification system, comprising: generating a seed cluster by classifying the first generated search keyword cluster by a topic; and classifying the search keyword cluster generated by a predetermined period based on the generated seed cluster. 제1항에 있어서,The method of claim 1, 상기 주제를 포함하는 제1 계층, 상기 주제로 분류된 검색 키워드 클러스터를 포함하는 제2 계층 및 상기 검색 키워드 클러스터에 대한 검색 키워드를 포함하는 제3 계층으로 구성된 데이터 계층도를 생성하는 데이터 계층도 생성부Generate a data hierarchy diagram that generates a data hierarchy diagram comprising a first hierarchy comprising the subject, a second hierarchy comprising a search keyword cluster classified into the subject, and a third hierarchy comprising a search keyword for the search keyword cluster part 를 더 포함하는 검색 키워드 분류 시스템.Search keyword classification system further comprising. 제9항에 있어서,10. The method of claim 9, 상기 데이터 계층도 생성부는,The data layer diagram generation unit, 상기 주제에 포함된 검색 키워드의 검색 횟수에 따라 상기 제1 계층에 대한 상기 주제별 사이즈를 결정하고,Determine the subject size of the first layer according to the number of searches of the search keywords included in the subject, 상기 검색 키워드 클러스터에 포함된 검색 키워드의 검색 횟수에 따라 상기 제2 계층에 대한 상기 검색 키워드 클러스터별 사이즈를 결정하고,Determine the size of each of the search keyword clusters for the second layer according to the number of search keywords included in the search keyword cluster; 상기 검색 키워드의 검색 횟수에 따라 상기 제3 계층에 대한 상기 검색 키워드별 사이즈를 결정하는 것을 특징으로 하는 검색 키워드 분류 시스템.Search keyword classification system, characterized in that for determining the size of the search keyword for the third layer according to the number of searches of the search keyword. 사용자가 입력한 검색 키워드에 대해 연관 키워드를 추출하는 단계;Extracting a related keyword with respect to the search keyword input by the user; 상기 추출된 연관 키워드를 이용하여 검색 키워드 클러스터를 생성하는 단계; 및Generating a search keyword cluster using the extracted related keywords; And 사용자 검색 의도를 고려하여 상기 검색 키워드 클러스터를 주제에 따라 분류하는 단계Classifying the search keyword cluster according to a topic in consideration of a user search intent 를 포함하는 검색 키워드 분류 방법.Search keyword classification method comprising a. 제11항에 있어서,The method of claim 11, 상기 연관 키워드를 추출하는 단계는,Extracting the related keyword, 일정 기간 동안 검색 횟수가 미리 설정한 검색 횟수 이상인 검색 키워드에 대해 연관 키워드를 추출하는 것을 특징으로 하는 검색 키워드 분류 방법.A search keyword classification method comprising extracting a related keyword for a search keyword whose search number is equal to or greater than a predetermined search number for a predetermined period. 제11항에 있어서,The method of claim 11, 상기 연관 키워드를 추출하는 단계는,Extracting the related keyword, 키워드의 검색 횟수에 따른 연관 규칙, 사용자의 IP 주소에 따른 연관 규칙 또는 사용자 식별 정보에 따른 연관 규칙 중 어느 하나의 연관 규칙에 기초하여 상기 검색 키워드에 대한 연관 키워드를 추출하는 것을 특징으로 하는 검색 키워드 분류 방법.A search keyword for extracting a related keyword for the search keyword based on any one of an association rule according to the number of searches of a keyword, an association rule according to a user's IP address, or an association rule according to user identification information Classification method. 제11항에 있어서,The method of claim 11, 상기 검색 키워드 클러스터를 생성하는 단계는,Generating the search keyword cluster, 상기 연관 키워드를 매개로 하여 상기 검색 키워드의 연결 관계를 생성하는 단계; 및Generating a connection relationship of the search keyword via the related keyword; And 상기 검색 키워드의 연결 관계로부터 상기 검색 키워드 클러스터를 생성하는 단계Generating the search keyword cluster from the connection relationship of the search keywords 를 포함하는 검색 키워드 분류 방법.Search keyword classification method comprising a. 제14항에 있어서,The method of claim 14, 상기 검색 키워드 클러스터를 생성하는 단계는,Generating the search keyword cluster, 상기 검색 키워드 사이에 연결 강도에 기초하여 상기 검색 키워드 클러스터를 생성하고,Generate the search keyword cluster based on a connection strength between the search keywords, 상기 연결 강도는,The connection strength is 상기 검색 키워드 사이에 공통된 연관 키워드가 많을수록 증가하는 것을 특징으로 하는 검색 키워드 분류 방법.The search keyword classification method characterized by increasing as more related keywords common to the search keywords. 제15항에 있어서,The method of claim 15, 상기 검색 키워드 클러스터를 생성하는 단계는,Generating the search keyword cluster, 상기 검색 키워드의 연결 관계에 범주형 클러스터링 기법을 적용하여 상기 검색 키워드 클러스터를 생성하는 것을 특징으로 하는 검색 키워드 분류 방법. And a search keyword cluster is generated by applying a categorical clustering technique to the connection relation of the search keywords. 제11항에 있어서,The method of claim 11, 상기 검색 키워드 클러스터를 주제에 따라 분류하는 단계는,Categorizing the search keyword cluster according to a topic, 상기 검색 키워드 클러스터 간에 연관성을 고려하여 상기 검색 키워드 클러스터를 주제별로 분류하는 것을 특징으로 하는 검색 키워드 분류 방법.Search keyword classification method, characterized in that to classify the search keyword clusters in consideration of the correlation between the search keyword clusters. 제11항에 있어서,The method of claim 11, 상기 검색 키워드 클러스터를 주제에 따라 분류하는 단계는,Categorizing the search keyword cluster according to a topic, 최초로 생성된 검색 키워드 클러스터에 대해 주제별로 분류하여 시드 클러스터를 생성하는 단계; 및Generating a seed cluster by classifying the first generated search keyword cluster by a topic; And 상기 생성된 시드 클러스터를 기초로 미리 설정한 주기별로 생성된 검색 키워드 클러스터를 주제별로 할당하는 단계Allocating a search keyword cluster generated by a predetermined period based on the generated seed cluster for each subject; 를 포함하는 검색 키워드 분류 방법.Search keyword classification method comprising a. 제11항에 있어서,The method of claim 11, 상기 주제를 포함하는 제1 계층, 상기 주제로 분류된 검색 키워드 클러스터를 포함하는 제2 계층 및 상기 검색 키워드 클러스터에 대한 검색 키워드를 포함하는 제3 계층으로 구성된 데이터 계층도를 생성하는 단계Generating a data hierarchy diagram comprising a first tier including the subject, a second tier comprising a search keyword cluster classified into the subject, and a third tier including a search keyword for the search keyword cluster 를 더 포함하는 검색 키워드 분류 방법.Search keyword classification method further comprising. 제19항에 있어서,The method of claim 19, 상기 데이터 계층도를 생성하는 단계는,Generating the data hierarchy diagram, 상기 주제에 포함된 검색 키워드의 검색 횟수에 따라 상기 제1 계층에 대한 상기 주제별 사이즈를 결정하는 단계;Determining the size of each topic for the first layer according to the number of searches of a search keyword included in the topic; 상기 검색 키워드 클러스터에 포함된 검색 키워드의 검색 횟수에 따라 상기 제2 계층에 대한 상기 검색 키워드 클러스터별 사이즈를 결정하는 단계; 및Determining a size of each of the search keyword clusters for the second layer according to the number of searches of the search keywords included in the search keyword cluster; And 상기 검색 키워드의 검색 횟수에 따라 상기 제3 계층에 대한 상기 검색 키워드별 사이즈를 결정하는 단계Determining the size of each search keyword for the third layer according to the number of searches of the search keyword; 를 포함하는 검색 키워드 분류 방법.Search keyword classification method comprising a. 제11항 내지 제20항 중 어느 한 항의 방법을 실행하기 위한 프로그램이 기록된 컴퓨터에서 판독 가능한 기록 매체.A computer-readable recording medium having recorded thereon a program for executing the method of any one of claims 11 to 20.
KR1020090024817A 2009-03-24 2009-03-24 Apparatus and method for classifying search keywords using clusters according to related keywords KR101048540B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020090024817A KR101048540B1 (en) 2009-03-24 2009-03-24 Apparatus and method for classifying search keywords using clusters according to related keywords

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020090024817A KR101048540B1 (en) 2009-03-24 2009-03-24 Apparatus and method for classifying search keywords using clusters according to related keywords

Publications (2)

Publication Number Publication Date
KR20100106718A true KR20100106718A (en) 2010-10-04
KR101048540B1 KR101048540B1 (en) 2011-07-11

Family

ID=43128754

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090024817A KR101048540B1 (en) 2009-03-24 2009-03-24 Apparatus and method for classifying search keywords using clusters according to related keywords

Country Status (1)

Country Link
KR (1) KR101048540B1 (en)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102646103A (en) * 2011-02-18 2012-08-22 腾讯科技(深圳)有限公司 Index word clustering method and device
KR101395165B1 (en) * 2013-06-13 2014-05-15 삼성증권주식회사 The system which analyze a available searching key-word
US9235638B2 (en) 2013-11-12 2016-01-12 International Business Machines Corporation Document retrieval using internal dictionary-hierarchies to adjust per-subject match results
US9251136B2 (en) 2013-10-16 2016-02-02 International Business Machines Corporation Document tagging and retrieval using entity specifiers
US9262510B2 (en) 2013-05-10 2016-02-16 International Business Machines Corporation Document tagging and retrieval using per-subject dictionaries including subject-determining-power scores for entries
KR20160131477A (en) * 2015-05-07 2016-11-16 신재욱 An e-commerce system based on interest category using related keywords
US9524337B2 (en) 2013-03-28 2016-12-20 Electronics And Telecommunications Research Institute Apparatus, system, and method for detecting complex issues based on social media analysis
KR20200080571A (en) * 2018-12-27 2020-07-07 에스케이 주식회사 Information Search System and Method using keyword and relation information
CN117351956A (en) * 2023-12-05 2024-01-05 广州一链通互联网科技有限公司 Freight track generation and query method

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11941073B2 (en) 2019-12-23 2024-03-26 97th Floor Generating and implementing keyword clusters
KR102396287B1 (en) 2021-03-31 2022-05-10 쿠팡 주식회사 Electronic apparatus and information providing method thereof

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100396826B1 (en) * 2000-05-31 2003-09-02 주식회사 지식정보 Term-based cluster management system and method for query processing in information retrieval
KR100806862B1 (en) * 2004-07-16 2008-02-26 (주)이네스트커뮤니케이션 Method and apparatus for providing a list of second keywords related with first keyword being searched in a web site
KR100970335B1 (en) * 2007-08-14 2010-07-15 엔에이치엔비즈니스플랫폼 주식회사 Method for updating interest keyword of user and system for executing the method

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102646103B (en) * 2011-02-18 2016-03-16 腾讯科技(深圳)有限公司 The clustering method of term and device
WO2012109959A1 (en) * 2011-02-18 2012-08-23 腾讯科技(深圳)有限公司 Clustering method and device for search terms
CN102646103A (en) * 2011-02-18 2012-08-22 腾讯科技(深圳)有限公司 Index word clustering method and device
US9524337B2 (en) 2013-03-28 2016-12-20 Electronics And Telecommunications Research Institute Apparatus, system, and method for detecting complex issues based on social media analysis
US9262510B2 (en) 2013-05-10 2016-02-16 International Business Machines Corporation Document tagging and retrieval using per-subject dictionaries including subject-determining-power scores for entries
US9971828B2 (en) 2013-05-10 2018-05-15 International Business Machines Corporation Document tagging and retrieval using per-subject dictionaries including subject-determining-power scores for entries
KR101395165B1 (en) * 2013-06-13 2014-05-15 삼성증권주식회사 The system which analyze a available searching key-word
US9251136B2 (en) 2013-10-16 2016-02-02 International Business Machines Corporation Document tagging and retrieval using entity specifiers
US9971782B2 (en) 2013-10-16 2018-05-15 International Business Machines Corporation Document tagging and retrieval using entity specifiers
US9235638B2 (en) 2013-11-12 2016-01-12 International Business Machines Corporation Document retrieval using internal dictionary-hierarchies to adjust per-subject match results
US9430559B2 (en) 2013-11-12 2016-08-30 International Business Machines Corporation Document retrieval using internal dictionary-hierarchies to adjust per-subject match results
KR20160131477A (en) * 2015-05-07 2016-11-16 신재욱 An e-commerce system based on interest category using related keywords
KR20200080571A (en) * 2018-12-27 2020-07-07 에스케이 주식회사 Information Search System and Method using keyword and relation information
CN117351956A (en) * 2023-12-05 2024-01-05 广州一链通互联网科技有限公司 Freight track generation and query method

Also Published As

Publication number Publication date
KR101048540B1 (en) 2011-07-11

Similar Documents

Publication Publication Date Title
KR101048540B1 (en) Apparatus and method for classifying search keywords using clusters according to related keywords
Chang et al. Social media analytics: Extracting and visualizing Hilton hotel ratings and reviews from TripAdvisor
Nagamma et al. An improved sentiment analysis of online movie reviews based on clustering for box-office prediction
US8190621B2 (en) Method, system, and computer readable recording medium for filtering obscene contents
Li et al. Detection and characterization of human trafficking networks using unsupervised scalable text template matching
JP2009093654A (en) Determinion of document specificity
CN108090216A (en) A kind of Tag Estimation method, apparatus and storage medium
Sharoff Classifying Web corpora into domain and genre using automatic feature identification
SG193613A1 (en) Text analyzing device, problematic behavior extraction method, and problematic behavior extraction program
Tran et al. Spam detection in online classified advertisements
Soe et al. Automated detection of dark patterns in cookie banners: how to do it poorly and why it is hard to do it any other way
Sara-Meshkizadeh et al. Webpage classification based on compound of using HTML features & URL features and features of sibling pages
Medvet et al. Brand-related events detection, classification and summarization on twitter
Pan et al. Optimizing temporal topic segmentation for intelligent text visualization
Noekhah et al. A novel approach for opinion spam detection in e-commerce
Yao et al. Interpretable and low-resource entity matching via decoupling feature learning from decision making
KR102299525B1 (en) Product Evolution Mining Method And Apparatus Thereof
Bollegala et al. Extracting key phrases to disambiguate personal name queries in web search
Noekhah et al. A novel model for opinion spam detection based on multi-iteration network structure
Aslam et al. Web-AM: An efficient boilerplate removal algorithm for Web articles
CN116186298A (en) Information retrieval method and device
KR101076522B1 (en) System and method for site clustering
Sharafat et al. Legal data mining from civil judgments
Yin et al. Research of integrated algorithm establishment of a spam detection system
Novitasari et al. A method of discovering interesting association rules from student admission dataset

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20150701

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20160701

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20190701

Year of fee payment: 9