KR20100106718A - System and method for classifying search keyword using cluster for related keyword - Google Patents
System and method for classifying search keyword using cluster for related keyword Download PDFInfo
- Publication number
- KR20100106718A KR20100106718A KR1020090024817A KR20090024817A KR20100106718A KR 20100106718 A KR20100106718 A KR 20100106718A KR 1020090024817 A KR1020090024817 A KR 1020090024817A KR 20090024817 A KR20090024817 A KR 20090024817A KR 20100106718 A KR20100106718 A KR 20100106718A
- Authority
- KR
- South Korea
- Prior art keywords
- search keyword
- search
- keyword
- cluster
- keywords
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/355—Class or cluster creation or modification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
Abstract
Description
본 발명의 일실시예들은 검색 키워드를 분류하는 방법에 관한 것으로, 보다 자세하게는, 검색 키워드의 연관 키워드를 통해 검색 키워드 클러스터를 생성하여 검색 키워드를 분류하는 시스템 및 방법에 관한 것이다.One embodiment of the present invention relates to a method for classifying a search keyword, and more particularly, to a system and a method for classifying a search keyword by generating a search keyword cluster through a related keyword of the search keyword.
인터넷 검색 엔진에 사용자로부터 수많은 검색 키워드가 입력된다. 검색 키워드는 사용자가 특별한 검색 의도를 가지고 입력한 키워드이다. 즉, 검색 키워드는 사용자의 관심이나 선호 사항을 반영할 수 있다. 결국, 인터넷 검색 엔진의 관리자는 검색 키워드를 이용하여 사용자들의 정보에 대한 니즈를 분석함으로써 사용자 맞춤형 서비스를 제공하기를 원한다. 또한, 검색 광고주들은 검색 키워드를 이용하여 사용자 맞춤형 광고를 제공함으로써 광고 효과를 증대시키기를 원한다.Numerous search keywords are entered from an Internet search engine by a user. The search keyword is a keyword entered by the user with a special search intention. That is, the search keyword may reflect the user's interest or preference. As a result, an administrator of an internet search engine wants to provide a user-customized service by analyzing a need for information of users using search keywords. In addition, search advertisers want to increase advertising effectiveness by providing customized ads using search keywords.
그러나, 종래에 사용자가 입력한 검색 키워드를 통해 사용자의 검색 의도를 파악하는 기술이 일부 존재하였지만 사용자의 검색 의도에 대한 정확도는 낮았는 바, 사용자의 검색 의도에 대한 정확도를 향상시킬 수 있는 기술이 요구되고 있다.However, although some techniques exist for identifying a user's search intention through a search keyword input by the user, the accuracy of the user's search intention is low. Therefore, a technique for improving the accuracy of the user's search intention is required. It is becoming.
본 발명의 일실시예는 사용자가 입력한 검색 키워드에 대한 연관 키워드를 이용하여 검색 키워드 클러스터를 생성하고, 검색 키워드 클러스터를 주제별로 분류함으로써 사용자의 검색 의도를 좀더 정확하게 파악할 수 있는 검색 키워드 분류 시스템 및 방법을 제공할 수 있다.An embodiment of the present invention is to create a search keyword cluster by using the associated keyword for the search keyword input by the user, and search keyword classification system that can more accurately grasp the user's search intention by classifying the search keyword cluster by topic; It may provide a method.
본 발명의 일실시예는 연관 키워드에 따른 검색 키워드의 연결 관계를 이용하여 검색 키워드 간 연결 강도에 따라 검색 키워드 클러스터를 생성함으로써 사용자의 검색 의도를 좀더 정확하게 파악할 수 있는 검색 키워드 분류 시스템 및 방법을 제공할 수 있다.An embodiment of the present invention provides a search keyword classification system and method that can more accurately grasp a user's search intention by creating a search keyword cluster according to the link strength between search keywords using a link relationship of search keywords according to related keywords. can do.
본 발명의 일실시예는 주제, 검색 키워드 클러스터 및 검색 키워드에 대한 데이터 계층도를 제공함으로써 사용자 검색 의도를 파악할 수 있는 검색 키워드에 대한 정보를 시각적/정량적으로 제공하는 검색 키워드 분류 시스템 및 방법을 제공할 수 있다.An embodiment of the present invention provides a search keyword classification system and method for providing information about search keywords visually and quantitatively by providing a data hierarchy diagram for a topic, a search keyword cluster, and a search keyword. can do.
본 발명의 일실시예는 일별로 검색 키워드에 대한 검색 키워드 클러스터를 생성함으로써, 시간에 따른 사용자 검색 트렌드를 용이하게 파악할 수 있는 검색 키워드 분류 시스템 및 방법을 제공할 수 있다.An embodiment of the present invention may provide a search keyword classification system and method that can easily identify a user search trend over time by generating a search keyword cluster for a search keyword on a daily basis.
본 발명의 일실시예에 따른 검색 키워드 분류 시스템은 사용자가 입력한 검색 키워드에 대해 연관 키워드를 추출하는 연관 키워드 추출부, 상기 추출된 연관 키워드를 이용하여 검색 키워드 클러스터를 생성하는 클러스터 생성부 및 사용자 검색 의도를 고려하여 상기 검색 키워드 클러스터를 주제에 따라 분류하는 클러스터 분류부를 포함할 수 있다.Search keyword classification system according to an embodiment of the present invention is an associated keyword extraction unit for extracting a related keyword for the search keyword input by the user, a cluster generation unit for generating a search keyword cluster using the extracted related keywords and the user It may include a cluster classification unit for classifying the search keyword cluster according to the topic in consideration of the search intent.
본 발명의 일실시예에 따른 검색 키워드 분류 시스템은 상기 주제를 포함하는 제1 계층, 상기 주제로 분류된 검색 키워드 클러스터를 포함하는 제2 계층 및 상기 검색 키워드 클러스터에 대한 검색 키워드를 포함하는 제3 계층으로 구성된 데이터 계층도를 생성하는 데이터 계층도 생성부를 더 포함할 수 있다.A search keyword classification system according to an embodiment of the present invention includes a first hierarchy including the subject, a second hierarchy including the search keyword cluster classified into the subject, and a third search keyword for the search keyword cluster. The data hierarchy diagram generating data hierarchy diagram configured as a hierarchy may further include a generation unit.
본 발명의 일실시예에 따른 검색 키워드 분류 방법은 사용자가 입력한 검색 키워드에 대해 연관 키워드를 추출하는 단계, 상기 추출된 연관 키워드를 이용하여 검색 키워드 클러스터를 생성하는 단계 및 상기 검색 키워드 클러스터로부터 사용자 검색 의도를 추출하여 상기 검색 키워드 클러스터를 주제에 따라 분류하는 단계를 포함할 수 있다.In accordance with another aspect of the present invention, there is provided a method of classifying a search keyword, including: extracting a related keyword with respect to a search keyword input by a user, generating a search keyword cluster using the extracted related keyword, and user from the search keyword cluster The method may include extracting a search intent and classifying the search keyword cluster according to a topic.
본 발명의 일실시예에 따른 검색 키워드 분류 방법은 상기 주제를 포함하는 제1 계층, 상기 주제로 분류된 검색 키워드 클러스터를 포함하는 제2 계층 및 상기 검색 키워드 클러스터에 대한 검색 키워드를 포함하는 제3 계층으로 구성된 데이터 계층도를 생성하는 단계를 더 포함할 수 있다.Search keyword classification method according to an embodiment of the present invention includes a first layer including the subject, a second layer including a search keyword cluster classified into the subject and a third including a search keyword for the search keyword cluster The method may further include generating a hierarchical data layer diagram.
본 발명의 일실시예에 따르면, 사용자가 입력한 검색 키워드에 대한 연관 키워드를 이용하여 검색 키워드 클러스터를 생성하고, 검색 키워드 클러스터를 주제별로 분류함으로써 사용자의 검색 의도를 좀더 정확하게 파악할 수 있는 검색 키워 드 분류 시스템 및 방법이 제공된다.According to an embodiment of the present invention, a search keyword for generating a search keyword cluster by using a related keyword for a search keyword input by a user and classifying the search keyword cluster by a topic may more accurately identify a user's search intention. A classification system and method are provided.
본 발명의 일실시예에 따르면, 연관 키워드에 따른 검색 키워드의 연결 관계를 이용하여 검색 키워드 간 연결 강도에 따라 검색 키워드 클러스터를 생성함으로써 사용자의 검색 의도를 좀더 정확하게 파악할 수 있는 검색 키워드 분류 시스템 및 방법이 제공된다.According to an embodiment of the present invention, a search keyword classification system and method for more accurately grasping a user's search intention by generating a search keyword cluster according to the link strength between search keywords using the connection relation of the search keywords according to the related keywords This is provided.
본 발명의 일실시예에 따르면, 주제, 검색 키워드 클러스터 및 검색 키워드에 대한 데이터 계층도를 제공함으로써 사용자 검색 의도를 파악할 수 있는 검색 키워드에 대한 정보를 시각적/정량적으로 제공하는 검색 키워드 분류 시스템 및 방법이 제공된다.According to an embodiment of the present invention, a search keyword classification system and method for visually and quantitatively providing information on a search keyword capable of identifying a user search intention by providing a data hierarchy diagram for a topic, a search keyword cluster, and a search keyword. This is provided.
본 발명의 일실시예에 따르면, 일별로 검색 키워드에 대한 검색 키워드 클러스터를 생성함으로써, 시간에 따른 사용자 검색 트렌드를 용이하게 파악할 수 있는 검색 키워드 분류 시스템 및 방법이 제공된다.According to an embodiment of the present invention, a search keyword classification system and method for easily identifying a user search trend over time by generating a search keyword cluster for a search keyword on a daily basis is provided.
이하, 첨부된 도면들에 기재된 내용들을 참조하여 본 발명에 따른 실시예를 상세하게 설명한다. 다만, 본 발명이 실시예들에 의해 제한되거나 한정되는 것은 아니다. 각 도면에 제시된 동일한 참조부호는 동일한 부재를 나타낸다. 본 발명의 일실시예에 따른 검색 키워드 분류 방법은 검색 키워드 분류 시스템에 의해 수행될 수 있다. Hereinafter, with reference to the contents described in the accompanying drawings will be described in detail an embodiment according to the present invention. However, the present invention is not limited to or limited by the embodiments. Like reference numerals in the drawings denote like elements. The search keyword classification method according to an embodiment of the present invention may be performed by the search keyword classification system.
도 1은 본 발명의 일실시예에 따른 검색 키워드 분류 시스템의 전체 구성을 도시한 블록 다이어그램이다.1 is a block diagram showing the overall configuration of a search keyword classification system according to an embodiment of the present invention.
도 1을 참고하면, 검색 키워드 분류 시스템(100)은 연관 키워드 추출부(101), 클러스터 생성부(102), 클러스터 분류부(103)를 포함할 수 있다. 추가적으로, 검색 키워드 분류 시스템(100)은 데이터 계층도 생성부(104)를 포함할 수 있다.Referring to FIG. 1, the search
연관 키워드 추출부(101)는 사용자가 입력한 검색 키워드에 대해 연관 키워드를 추출할 수 있다. 연관 키워드는 사용자가 입력한 검색 키워드 이후에 특정 시간 이내에 입력되어 검색되는 비율이 높은 키워드를 의미할 수 있다. 즉, 연관 키워드는 사용자들이 자신의 검색 의도에 부합하는 검색 결과를 도출할 수 있도록 함께 검색하는 경향이 높은 키워드들을 의미할 수 있다. 다시 말해서, 검색 키워드에 대한 연관 키워드는 사용자의 검색 의도를 파악할 수 있는 하나의 수단이 될 수 있다.The related
일례로, 연관 키워드 추출부(101)는 일정 기간 동안 검색 횟수가 미리 설정한 검색 횟수 이상인 검색 키워드에 대해 연관 키워드를 추출할 수 있다. 예를 들면, 최근 일주일 검색 횟수(Query Count: QC)가 300 이상인 검색 키워드에 대해 연관 키워드를 추출할 수 있다. 이 때, 연관 키워드 추출부(101)는 하나의 키워드에 대해 하나 이상의 연관 키워드를 추출할 수 있다. 즉, 일정 수 이상의 검색 횟수를 나타내는 검색 키워드에 대해 연관 키워드를 추출함으로써, 검색 키워드를 입력한 사용자의 검색 의도를 좀더 정확하게 파악할 수 있다.For example, the related
일례로, 연관 키워드 추출부(101)는 키워드의 검색 횟수에 따른 연관 규칙, 사용자의 IP 주소에 따른 연관 규칙 또는 사용자 식별 정보에 따른 연관 규칙 중 어느 하나의 연관 규칙에 기초하여 검색 키워드에 대한 연관 키워드를 추출할 수 있다.For example, the related
클러스터 생성부(102)는 추출된 연관 키워드를 이용하여 검색 키워드 클러스터를 생성할 수 있다. 일례로, 클러스터 생성부(102)는 연관 키워드를 매개로 하여 검색 키워드의 연결 관계를 생성하고, 검색 키워드의 연결 관계로부터 검색 키워드 클러스터를 생성할 수 있다. 이 때, 클러스터 생성부(102)는 둘 이상의 검색 키워드들을 공통적인 연관 키워드를 중심으로 연결함으로써 검색 키워드의 연결 관계를 생성할 수 있다.The
클러스터 생성부(102)는 검색 키워드 사이에 연결 강도에 기초하여 검색 키워드 클러스터를 생성할 수 있다. 이 때, 연결 강도는 검색 키워드 사이에 공통된 연관 키워드가 많을수록 증가할 수 있다. 예를 들어, 클러스터 생성부(102)는 검색 키워드의 연결 관계에 범주형 클러스터링 기법을 적용하여 검색 키워드 클러스터를 생성할 수 있다. 즉, 클러스터 생성부(102)는 범주형 클러스터링 기법에 따라 주어진 검색 키워드에 대한 연결 관계에서 공통된 연관 키워드를 통해 검색 키워드 간 유사도를 판단하고, 유사도가 높은 검색 키워드들을 그룹화하여 클러스터를 생성할 수 있다.The
클러스터 분류부(103)는 사용자 검색 의도를 고려하여 검색 키워드 클러스터를 주제에 따라 분류할 수 있다. 검색 키워드 클러스터는 공통적인 연관 키워드를 기초로 연결된 검색 키워드들을 포함하고 있으므로, 유사한 사용자의 검색 의도를 나타내는 검색 키워드들로 구성될 수 있다. 따라서, 클러스터 분류부(103)는 사용자의 검색 의도를 의미하는 주제에 따라 검색 키워드 클러스터를 분류할 수 있으며, 결국 주제에 따라 검색 키워드를 분류할 수 있다.The
이 때, 하나의 주제에 적어도 하나의 클러스터가 포함될 수 있다. 이 경우, 클러스터 분류부(103)는 검색 키워드 클러스터 간에 연관성을 고려하여 검색 키워드 클러스터를 주제별로 분류할 수 있다.In this case, at least one cluster may be included in one subject. In this case, the
일례로, 클러스터 분류부(103)는 최초로 생성된 검색 키워드 클러스터에 대해 주제별로 분류하여 시드 클러스터를 생성하고, 시드 클러스터를 기초로 미리 설정한 주기별로 생성된 검색 키워드 클러스터를 주제별로 분류할 수 있다.For example, the
결국, 본 발명의 일실시예에 따르면, 연관 키워드는 사용자의 검색이 발생하는 모든 관심 분야에서 추출될 수 있기 때문에, 검색 키워드 클러스터를 통해 다양한 주제의 키워드 세그먼트를 획득할 수 있다.As a result, according to an embodiment of the present invention, since the related keywords may be extracted from all areas of interest where a user's search occurs, keyword segments of various subjects may be acquired through the search keyword cluster.
데이터 계층도 생성부(104)는 주제를 포함하는 제1 계층, 주제로 분류된 검색 키워드 클러스터를 포함하는 제2 계층 및 검색 키워드 클러스터에 대한 검색 키워드를 포함하는 제3 계층으로 구성된 데이터 계층도를 생성할 수 있다. The data hierarchy
즉, 본 발명의 일실시예에 따른 검색 키워드 분류 시스템(100)은 연관 키워드를 이용하여 검색 키워드->검색 키워드 클러스터->주제 단위로 계층을 형성할 수 있으며, 형성된 계층에 기초하여 데이터 계층도를 통해 시각적인 데이터 계층도를 생성할 수 있다.That is, the search
일례로, 데이터 계층도 생성부(104)는 주제에 포함된 검색 키워드의 검색 횟수에 따라 제1 계층에 대한 주제별 사이즈를 결정할 수 있다. 그리고, 데이터 계층도 생성부(104)는 검색 키워드 클러스터에 포함된 검색 키워드의 검색 횟수에 따라 제2 계층에 대한 검색 키워드 클러스터별 사이즈를 결정할 수 있다. 또한, 데이터 계층도 생성부(104)는 검색 키워드의 검색 횟수에 따라 제3 계층에 대한 검색 키워드별 사이즈를 결정할 수 있다.In one example, the data
도 2는 본 발명의 일실시예에 따라 검색 키워드에 대한 복수의 연관 키워드의 일례를 도시한 도면이다.2 illustrates an example of a plurality of related keywords for a search keyword according to an embodiment of the present invention.
검색 키워드 분류 시스템(100)은 사용자가 입력한 검색 키워드에 대해 연관 키워드를 추출할 수 있다. 도 2를 참고하면, 검색 키워드 각각에 하나 이상의 연관 키워드가 추출된 결과가 도시되어 있다. 이 때, 검색 키워드는 일정 기간 동안 검색 횟수가 미리 설정한 검색 횟수 이상인 키워드를 의미할 수 있다.The search
일례로, 검색 키워드 분류 시스템(100)은 키워드의 검색 횟수에 따른 연관 규칙에 기초하여 검색 키워드에 대한 연관 키워드를 추출할 수 있다. 예를 들면, 사용자가 A라는 키워드를 입력하여 검색한 후 보다 상세한 검색 결과를 얻기 위해 연속하여 B라는 키워드를 입력한 경우, 키워드 A가 검색된 후 키워드 B가 입력되는 조건이 미리 설정한 임계치 이상이라면 키워드 B는 키워드 A에 대한 연관 키워드로 정의될 수 있다.For example, the search
일례로, 검색 키워드 분류 시스템(100)은 키워드의 검색 횟수에 따른 연관 규칙을 이용하여 검색 키워드에 대해 연관 키워드를 추출할 수 있다. 구체적으로, 검색 키워드 분류 시스템(100)은 키워드 A의 검색 횟수, 키워드 B의 검색 횟수 및 키워드 A가 검색된 이후 특정 시간 이내 키워드 B의 검색 횟수를 통해 조건부 확 률(A가 검색된 후 B가 이어서 검색될 확률) 및 키워드 간 상관 관계를 결정하고, 조건부 확률 및 상관 관계에 기초하여 키워드 A와 키워드 B가 연관 관계에 있는 지 판단할 수 있다. 이 때, 검색 키워드 분류 시스템(100)은 키워드 A와 키워드 B가 연관 관계에 있는 지 판단하기 위해 검색 횟수, 조건부 확률 및 상관 관계 정도에 임계치를 설정할 수 있다.For example, the search
다른 일례로, 검색 키워드 분류 시스템(100)은 키워드를 입력한 사용자의 IP 주소에 따른 연관 규칙을 이용하여 검색 키워드에 대해 연관 키워드를 추출할 수 있다. 구체적으로, 검색 키워드 분류 시스템(100)은 키워드 A를 입력한 사용자의 IP 주소 정보, 키워드 B를 입력한 사용자의 IP 주소 정보 및 키워드 A가 입력된 후 키워드 B가 입력된 경우 키워드 B를 입력한 사용자의 IP 주소 정보를 통해 조건부 확률을 결정하고, 조건부 확률에 기초하여 키워드 A와 키워드 B가 연관 관계에 있는 지 여부를 판단할 수 있다. 이 때, 검색 키워드 분류 시스템(100)은 키워드 A와 키워드 B가 연관 관계에 있는 지 판단하기 위해 IP 주소 수, 조건부 확률에 임계치를 설정할 수 있다.As another example, the search
또 다른 일례로, 검색 키워드 분류 시스템(100)은 키워드를 입력한 사용자의 사용자 식별 정보(UID)에 따른 연관 규칙을 이용하여 검색 키워드에 대해 연관 키워드를 추출할 수 있다. 사용자 식별 정보에 따른 연관 규칙은 사용자의 IP 주소에 따른 연관 규칙을 이용한 방법에 동일한 형태로 적용할 수 있다.As another example, the search
이러한 과정을 통해 검색 키워드에 대한 연관 키워드가 추출되면, 검색 키워드 분류 시스템(100)은 연관 키워드를 매개로 검색 키워드의 연결 관계를 생성할 수 있다. 도 2를 참고하면, 만약 연관 키워드 b3와 연관 키워드 c3가 동일한 경우, 검색 키워드 분류 시스템(100)은 연관 키워드 b3(또는 연관 키워드 c3)를 매개로 하여 검색 키워드 B와 검색 키워드 C를 연결할 수 있다. When the related keyword for the search keyword is extracted through this process, the search
마찬가지로, 연관 키워드 b5, 연관 키워드 c5 및 연관 키워드 d5가 동일한 경우, 검색 키워드 분류 시스템(100)은 연관 키워드 b5(또는 연관 키워드 c5, 연관 키워드 d5)를 매개로 하여 검색 키워드 B, 검색 키워드 C 및 검색 키워드 D를 연결할 수 있다. 이러한 과정을 통해 검색 키워드 분류 시스템(100)은 검색 키워드의 연결 관계를 생성할 수 있다.Similarly, when the associated keyword b 5 , the associated keyword c 5 and the associated keyword d 5 are equal, the search
도 3은 본 발명의 일실시예에 따라 연관 키워드를 통해 검색 키워드 간의 연결 관계에 대한 일례를 도시한 도면이다.3 is a diagram illustrating an example of a connection relationship between search keywords through an associated keyword according to an embodiment of the present invention.
도 3을 참고하면, 연관 키워드를 매개로 연결된 검색 키워드 A 내지 검색 키워드 J(301~310)가 도시되어 있다.Referring to FIG. 3, search keywords A through
검색 키워드 분류 시스템(100)은 연관 키워드를 매개로 하여 검색 키워드의 연결 관계를 생성할 수 있다. 이 때, 검색 키워드 사이에 공통된 연관 키워드가 많을수록 연결 강도는 증가할 수 있다.The search
도 3을 살펴보면, 검색 키워드 B(302)와 검색 키워드 C(303)는 4개의 공통된 연관 키워드를 매개로 연결되어 있고, 검색 키워드 B(302)와 검색 키워드 A(301)는 2개의 공통된 연관 키워드를 매개로 연결되어 있으므로, 검색 키워드 B(302)와 검색 키워드 C(303) 간의 연결 강도가 검색 키워드 B(302)와 검색 키워드 A(301) 간의 연결 강도보다 더 크다고 할 수 있다. Referring to FIG. 3,
도 4는 본 발명의 일실시예에 따라 검색 키워드 간의 연결 관계로부터 검색 키워드 클러스터를 생성하는 과정을 설명하기 위한 도면이다.4 is a diagram for describing a process of generating a search keyword cluster from a connection relationship between search keywords according to an embodiment of the present invention.
검색 키워드 분류 시스템(100)은 검색 키워드의 연결 관계로부터 검색 키워드 클러스터를 생성할 수 있다. 이 때, 검색 키워드 분류 시스템(100)은 검색 키워드 사이에 연결 강도에 기초하여 검색 키워드 클러스터를 생성할 수 있다.The search
도 4에 나타난 검색 키워드들(401~410) 사이에 연결된 선은 연결 강도를 나타낸다. 도 4를 참고하면, 검색 키워드 A(401), 검색 키워드 B(402), 검색 키워드 C(403) 및 검색 키워드 D(404)간에 연결 강도는 미리 설정한 기준을 초과한다고 가정한다. 마찬가지로, 검색 키워드 E(405), 검색 키워드 F(406), 검색 키워드 G(407), 검색 키워드 H(408), 검색 키워드 I(409) 및 검색 키워드 J(410) 간에 연결 강도는 미리 설정한 기준을 초과한다고 가정한다. 다만, 검색 키워드 D(404)와 검색 키워드 E(405)의 연결 강도와 검색 키워드 D(404)와 검색 키워드 F(406)의 연결 강도는 미리 설정한 기준을 초과하지 않는다고 가정한다.Lines connected between the
그러면, 검색 키워드 분류 시스템(100)은 검색 키워드 A(401), 검색 키워드 B(402), 검색 키워드 C(403) 및 검색 키워드 D(404)를 하나의 검색 키워드 클러스터 X(411)로 정의할 수 있다. 마찬가지로, 검색 키워드 E(405), 검색 키워드 F(406), 검색 키워드 G(407), 검색 키워드 H(408), 검색 키워드 I(409) 및 검색 키워드 J(410)를 하나의 검색 키워드 클러스터 Y(412)로 정의할 수 있다. 그러나, 검색 키워드 D(404)와 검색 키워드 E(405) 및 검색 키워드 D(404)와 검색 키워드 F(406)는 서로 연결되어 있지만, 연결 강도가 미리 설정한 기준을 만족하지 못하므로 하나의 검색 키워드 클러스터에 포함될 수 없다. Then, the search
이러한 과정을 통해 검색 키워드 분류 시스템(100)은 검색 키워드 간의 연결 관계에서 특정 범주에 존재하는 복수의 검색 키워드를 포함하는 검색 키워드 클러스터를 생성할 수 있다.Through this process, the search
도 5는 본 발명의 일실시예에 따라 검색 키워드 클러스터를 주제별로 분류하여 일별로 클러스터링을 수행하는 과정을 설명하기 위한 도면이다.5 is a diagram illustrating a process of classifying search keyword clusters by topic and performing clustering on a daily basis according to an embodiment of the present invention.
일례로, 검색 키워드 분류 시스템(100)은 최초로 생성된 검색 키워드 클러스터에 대해 주제별로 분류하여 시드 클러스터를 생성하고, 시드 클러스터를 기초로 미리 설정한 주기별로 생성된 검색 키워드 클러스터를 주제별로 분류할 수 있다.For example, the search
도 5를 참고하면, 2008년 7월 17일부터 2008년 10월 30일까지 일별 검색 키워드 클러스터를 생성하여 검색 키워드 클러스터를 분류하는 과정이 도시되어 있다.Referring to FIG. 5, a process of classifying search keyword clusters by generating daily search keyword clusters from July 17, 2008 to October 30, 2008 is illustrated.
먼저, 2008년 7월 17일에 최초로 검색 키워드 클러스터(501)(cluster 40214, cluster 27584, cluster 73920, cluster 58134, cluster 21276, cluster 15865)가 생성되면, 검색 키워드 분류 시스템(100)은 검색 키워드 클러스터(501)를 복수의 주제(501) 각각으로 분류할 수 있다. 도 5에서 볼 수 있듯이, cluster 40214, cluster 27584는 "대중음악"으로 분류되고, cluster 73920는 "게임"으로 분 류될 수 있다. 마찬가지로, cluster 58134는 "의류/잡화"로 분류되고, cluster 21276, cluster 15865는 "여행"으로 분류될 수 있다. 이렇게 주제별로 분류된 검색 키워드 클러스터(501)가 시드 클러스터가 될 수 있다.First, when a search keyword cluster 501 (cluster 40214, cluster 27584, cluster 73920, cluster 58134, cluster 21276, cluster 15865) is first generated on July 17, 2008, the search
그러면, 다음날 2008년 7월 18일에 생성된 검색 키워드 클러스터는 복수의 시드 클러스터 각각이 속한 주제로 분류될 수 있으며, 이러한 과정은 2008년 10월 30일까지 매일 반복될 수 있다.Then, the search keyword cluster generated on the next day of July 18, 2008 may be classified as a subject to which each of the plurality of seed clusters belongs, and this process may be repeated every day until October 30, 2008.
일별로 생성된 검색 키워드 클러스터는 시드 클러스터가 속한 주제로 분류될 수 있으며, 최종적으로, 검색 키워드가 복수의 주제 각각으로 분류될 수 있다. 주제는 사용자의 검색 의도와 대응될 수 있으므로, 동일한 주제에 포함된 검색 키워드 클러스터는 동일한 사용자의 검색 의도를 나타내는 것을 의미할 수 있다. 이 때, 주제는 미리 설정한 개수만큼 설정될 수 있다.The search keyword cluster generated on a daily basis may be classified into the subject to which the seed cluster belongs, and finally, the search keyword may be classified into each of the plurality of subjects. Since the subject may correspond to the search intention of the user, the search keyword cluster included in the same subject may mean that the search intention of the same user is indicated. At this time, the number of subjects may be set by a preset number.
본 발명의 일실시예에 따르면, 검색 키워드 분류 시스템(100)은 주제별로 검색 키워드 및 검색 키워드 클러스터에 대한 정보를 제공할 수 있다. 그리고, 검색 키워드 분류 시스템(100)은 주제별로 검색 키워드를 입력한 사용자 분포에 대한 정보, 사용자의 검색 패턴 등의 정보를 제공할 수 있다.According to an embodiment of the present invention, the search
도 6은 본 발명의 일실시예에 따라 주제, 검색 키워드 클러스터 및 검색 키워드 간의 계층 관계를 나타내는 일례를 도시한 도면이다.6 illustrates an example of a hierarchical relationship between a topic, a search keyword cluster, and a search keyword according to an embodiment of the present invention.
본 발명의 일실시예에 따른 검색 키워드 분류 시스템(100)은 검색 키워드->검색 키워드 클러스터->주제의 3단계의 계층을 도출할 수 있다. 이 때, 검색 키워드 분류 시스템(100)은 주제를 포함하는 제1 계층(601), 상기 주제로 분류된 검색 키워드 클러스터를 포함하는 제2 계층(602) 및 상기 검색 키워드 클러스터에 대한 검색 키워드를 포함하는 제3 계층(603)으로 구성된 데이터 계층도를 생성할 수 있다.The search
일례로, 검색 키워드 분류 시스템(100)은 주제에 포함된 검색 키워드의 검색 횟수에 따라 제1 계층(601)에 대한 주제별 사이즈를 결정할 수 있다. 그리고, 검색 키워드 분류 시스템(100)은 검색 키워드 클러스터에 포함된 검색 키워드의 검색 횟수에 따라 제2 계층(602)에 대한 검색 키워드 클러스터별 사이즈를 결정할 수 있다. 또한, 검색 키워드 분류 시스템(100)은 검색 키워드의 검색 횟수에 따라 제3 계층(603)에 대한 검색 키워드별 사이즈를 결정할 수 있다.For example, the search
제1 계층(601)에 포함된 사각형의 넓이는 주제별 사이즈를 의미하며, 사각형의 넓이가 넓을수록 해당 사각형에 대응하는 주제에 포함된 검색 키워드의 검색 횟수가 많은 것을 의미할 수 있다. 그리고, 제2 계층(602)에 포함된 사각형의 넓이는 검색 키워드 클러스터별 사이즈를 의미하며, 사각형의 넓이가 넓을수록 해당 사각형에 대응하는 검색 키워드 클러스터에 포함된 검색 키워드의 검색 횟수가 많은 것을 의미할 수 있다. 또한, 제3 계층(603)에 포함된 사각형의 넓이는 검색 키워드별 사이즈를 의미하며, 사각형의 넓이가 넓을수록 해당 사각형에 대응하는 검색 키워드의 검색 횟수가 많은 것을 의미할 수 있다.The width of the rectangle included in the
검색 키워드 분류 시스템(100)은 제1 계층(601), 제2 계층(602) 및 제3 계층(603)을 시각적/정량적으로 제공할 수 있다. 만약, 제1 계층(601)에서 주제 X(604)가 선택되면, 검색 키워드 분류 시스템(100)은 주제 X(604)로 분류된 검색 키워드 클러스터에 대한 제2 계층(602)을 표시할 수 있다. 그리고, 제2 계층(602)에서 검색 키워드 클러스터 Y(605)가 선택되면, 검색 키워드 분류 시스템(100)은 검색 키워드 클러스터 Y(605)에 포함된 검색 키워드에 대한 제3 계층(603)을 표시할 수 있다. 도 6에 표시된 데이터 계층도는 일례에 불과하고, 시스템의 구성에 따라 다른 형태로 표시될 수 있다.The search
도 7은 본 발명의 일실시예에 따른 검색 키워드 분류 방법의 전체 구성을 도시한 도면이다.7 is a diagram illustrating the overall configuration of a search keyword classification method according to an embodiment of the present invention.
단계(S701)에서, 검색 키워드 분류 시스템(100)은 사용자가 입력한 검색 키워드에 대해 연관 키워드를 추출할 수 있다. 이 때, 연관 키워드는 사용자들이 자신의 검색 의도에 부합하는 검색 결과를 도출할 수 있도록 함께 검색하는 경향이 높은 키워드들을 의미할 수 있다. 다시 말해서, 검색 키워드에 대한 연관 키워드는 사용자의 검색 의도를 파악할 수 있는 하나의 수단이 될 수 있다.In operation S701, the search
일례로, 검색 키워드 분류 시스템(100)은 일정 기간 동안 검색 횟수가 미리 설정한 검색 횟수 이상인 검색 키워드에 대해 연관 키워드를 추출할 수 있다. 이 때, 검색 키워드 분류 시스템(100)은 키워드의 검색 횟수에 따른 연관 규칙, 사용자의 IP 주소에 따른 연관 규칙 또는 사용자 식별 정보에 따른 연관 규칙 중 어느 하나의 연관 규칙에 기초하여 검색 키워드에 대한 연관 키워드를 추출할 수 있다.For example, the search
단계(S702)에서, 검색 키워드 분류 시스템(100)은 추출된 연관 키워드를 이용하여 검색 키워드 클러스터를 생성할 수 있다. 검색 키워드 분류 시스템(100)은 연관 키워드를 매개로 하여 검색 키워드의 연결 관계를 생성하고, 검색 키워드의 연결 관계로부터 검색 키워드 클러스터를 생성할 수 있다.In operation S702, the search
이 때, 검색 키워드 분류 시스템(100)은 검색 키워드 사이에 연결 강도에 기초하여 검색 키워드 클러스터를 생성할 수 있다. 여기서, 연결 강도는 검색 키워드 사이에 공통된 연관 키워드가 많을수록 증가할 수 있다. 예를 들어, 검색 키워드 분류 시스템(100)은 검색 키워드의 연결 관계에 범주형 클러스터링 기법을 적용하여 검색 키워드 클러스터를 생성할 수 있다.In this case, the search
즉, 검색 키워드 분류 시스템(100)은 범주형 클러스터링 기법에 따라 주어진 검색 키워드에 대한 연결 관계에서 공통된 연관 키워드를 통해 검색 키워드 간 유사도를 판단하고, 유사도가 높은 검색 키워드들을 그룹화하여 클러스터를 생성할 수 있다.That is, the search
단계(S703)에서, 검색 키워드 분류 시스템(100)은 사용자 검색 의도를 고려하여 검색 키워드 클러스터를 주제에 따라 분류할 수 있다. 이 때, 검색 키워드 분류 시스템(100)은 검색 키워드 클러스터 간에 연관성을 고려하여 검색 키워드 클러스터를 주제별로 분류할 수 있다. 단계(S703)은 최초로 생성된 검색 키워드 클러스터에 대해 주제별로 분류하여 시드 클러스터를 생성하는 과정 및 시드 클러스터를 기초로 미리 설정한 주기별로 생성된 검색 키워드 클러스터를 주제별로 분류하는 과정을 포함할 수 있다.In operation S703, the search
검색 키워드 분류 시스템(100)은 사용자의 검색 의도를 의미하는 주제에 따라 검색 키워드 클러스터를 분류할 수 있으며, 결국 주제에 따라 검색 키워드를 분류할 수 있다.The search
단계(S704)에서, 검색 키워드 분류 시스템(100)은 주제를 포함하는 제1 계층, 주제로 분류된 검색 키워드 클러스터를 포함하는 제2 계층 및 검색 키워드 클러스터에 대한 검색 키워드를 포함하는 제3 계층으로 구성된 데이터 계층도를 생성할 수 있다. 이 때, 단계(S704)는 검색 키워드 분류 시스템(100)은 주제에 포함된 검색 키워드의 검색 횟수에 따라 제1 계층에 대한 주제별 사이즈를 결정하는 단계, 검색 키워드 클러스터에 포함된 검색 키워드의 검색 횟수에 따라 제2 계층에 대한 검색 키워드 클러스터별 사이즈를 결정하는 단계 및 검색 키워드의 검색 횟수에 따라 제3 계층에 대한 검색 키워드별 사이즈를 결정하는 단계를 포함할 수 있다.In step S704, the search
이 때, 검색 키워드 분류 시스템(100)은 데이터 계층도를 통해 주제에 대한 제1 계층, 검색 키워드 클러스터에 대한 제2 계층(602) 및 검색 키워드에 대한 제3 계층(603)을 시각적/정량적으로 제공할 수 있다.At this time, the search
도 7에서 설명되지 않은 구체적인 부분은 도 1 내지 도 6의 설명을 참고할 수 있다.Specific parts not described in FIG. 7 may refer to descriptions of FIGS. 1 to 6.
또한 본 발명의 일실시예에 따른 검색 키워드 분류 방법은 다양한 컴퓨터로 구현되는 동작을 수행하기 위한 프로그램 명령을 포함하는 컴퓨터 판독 가능 매체를 포함한다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.In addition, the search keyword classification method according to an embodiment of the present invention includes a computer readable medium including program instructions for performing various computer-implemented operations. The computer readable medium may include program instructions, data files, data structures, etc. alone or in combination. The media may be program instructions that are specially designed and constructed for the present invention or may be available to those skilled in the art of computer software. Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks, and magnetic tape, optical media such as CD-ROMs, DVDs, and magnetic disks, such as floppy disks. Magneto-optical media, and hardware devices specifically configured to store and execute program instructions, such as ROM, RAM, flash memory, and the like. Examples of program instructions include not only machine code generated by a compiler, but also high-level language code that can be executed by a computer using an interpreter or the like.
이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 이는 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. 따라서, 본 발명 사상은 아래에 기재된 특허청구범위에 의해서만 파악되어야 하고, 이의 균등 또는 등가적 변형 모두는 본 발명 사상의 범주에 속한다고 할 것이다.As described above, the present invention has been described by way of limited embodiments and drawings, but the present invention is not limited to the above-described embodiments, which can be variously modified and modified by those skilled in the art to which the present invention pertains. Modifications are possible. Accordingly, the spirit of the present invention should be understood only by the claims set forth below, and all equivalent or equivalent modifications thereof will belong to the scope of the present invention.
도 1은 본 발명의 일실시예에 따른 검색 키워드 분류 시스템의 전체 구성을 도시한 블록 다이어그램이다.1 is a block diagram showing the overall configuration of a search keyword classification system according to an embodiment of the present invention.
도 2는 본 발명의 일실시예에 따라 검색 키워드에 대한 복수의 연관 키워드의 일례를 도시한 도면이다.2 illustrates an example of a plurality of related keywords for a search keyword according to an embodiment of the present invention.
도 3은 본 발명의 일실시예에 따라 연관 키워드를 통해 검색 키워드 간의 연결 관계에 대한 일례를 도시한 도면이다.3 is a diagram illustrating an example of a connection relationship between search keywords through an associated keyword according to an embodiment of the present invention.
도 4는 본 발명의 일실시예에 따라 검색 키워드 간의 연결 관계로부터 검색 키워드 클러스터를 생성하는 과정을 설명하기 위한 도면이다.4 is a diagram for describing a process of generating a search keyword cluster from a connection relationship between search keywords according to an embodiment of the present invention.
도 5는 본 발명의 일실시예에 따라 검색 키워드 클러스터를 주제별로 분류하여 일별로 클러스터링을 수행하는 과정을 설명하기 위한 도면이다.5 is a diagram illustrating a process of classifying search keyword clusters by topic and performing clustering on a daily basis according to an embodiment of the present invention.
도 6은 본 발명의 일실시예에 따라 주제, 검색 키워드 클러스터 및 검색 키워드 간의 계층 관계를 나타내는 일례를 도시한 도면이다.6 illustrates an example of a hierarchical relationship between a topic, a search keyword cluster, and a search keyword according to an embodiment of the present invention.
도 7은 본 발명의 일실시예에 따른 검색 키워드 분류 방법의 전체 구성을 도시한 도면이다.7 is a diagram illustrating the overall configuration of a search keyword classification method according to an embodiment of the present invention.
<도면의 주요 부분에 대한 부호의 설명><Explanation of symbols for the main parts of the drawings>
100: 검색 키워드 분류 시스템100: search keyword classification system
101: 연관 키워드 추출부101: related keyword extraction unit
102: 클러스터 생성부102: cluster generator
103: 클러스터 분류부103: cluster classification unit
104: 데이터 계층도 생성부104: data layer diagram generation unit
Claims (21)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020090024817A KR101048540B1 (en) | 2009-03-24 | 2009-03-24 | Apparatus and method for classifying search keywords using clusters according to related keywords |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020090024817A KR101048540B1 (en) | 2009-03-24 | 2009-03-24 | Apparatus and method for classifying search keywords using clusters according to related keywords |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20100106718A true KR20100106718A (en) | 2010-10-04 |
KR101048540B1 KR101048540B1 (en) | 2011-07-11 |
Family
ID=43128754
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020090024817A KR101048540B1 (en) | 2009-03-24 | 2009-03-24 | Apparatus and method for classifying search keywords using clusters according to related keywords |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101048540B1 (en) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102646103A (en) * | 2011-02-18 | 2012-08-22 | 腾讯科技(深圳)有限公司 | Index word clustering method and device |
KR101395165B1 (en) * | 2013-06-13 | 2014-05-15 | 삼성증권주식회사 | The system which analyze a available searching key-word |
US9235638B2 (en) | 2013-11-12 | 2016-01-12 | International Business Machines Corporation | Document retrieval using internal dictionary-hierarchies to adjust per-subject match results |
US9251136B2 (en) | 2013-10-16 | 2016-02-02 | International Business Machines Corporation | Document tagging and retrieval using entity specifiers |
US9262510B2 (en) | 2013-05-10 | 2016-02-16 | International Business Machines Corporation | Document tagging and retrieval using per-subject dictionaries including subject-determining-power scores for entries |
KR20160131477A (en) * | 2015-05-07 | 2016-11-16 | 신재욱 | An e-commerce system based on interest category using related keywords |
US9524337B2 (en) | 2013-03-28 | 2016-12-20 | Electronics And Telecommunications Research Institute | Apparatus, system, and method for detecting complex issues based on social media analysis |
KR20200080571A (en) * | 2018-12-27 | 2020-07-07 | 에스케이 주식회사 | Information Search System and Method using keyword and relation information |
CN117351956A (en) * | 2023-12-05 | 2024-01-05 | 广州一链通互联网科技有限公司 | Freight track generation and query method |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11941073B2 (en) | 2019-12-23 | 2024-03-26 | 97th Floor | Generating and implementing keyword clusters |
KR102396287B1 (en) | 2021-03-31 | 2022-05-10 | 쿠팡 주식회사 | Electronic apparatus and information providing method thereof |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100396826B1 (en) * | 2000-05-31 | 2003-09-02 | 주식회사 지식정보 | Term-based cluster management system and method for query processing in information retrieval |
KR100806862B1 (en) * | 2004-07-16 | 2008-02-26 | (주)이네스트커뮤니케이션 | Method and apparatus for providing a list of second keywords related with first keyword being searched in a web site |
KR100970335B1 (en) * | 2007-08-14 | 2010-07-15 | 엔에이치엔비즈니스플랫폼 주식회사 | Method for updating interest keyword of user and system for executing the method |
-
2009
- 2009-03-24 KR KR1020090024817A patent/KR101048540B1/en active IP Right Grant
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102646103B (en) * | 2011-02-18 | 2016-03-16 | 腾讯科技(深圳)有限公司 | The clustering method of term and device |
WO2012109959A1 (en) * | 2011-02-18 | 2012-08-23 | 腾讯科技(深圳)有限公司 | Clustering method and device for search terms |
CN102646103A (en) * | 2011-02-18 | 2012-08-22 | 腾讯科技(深圳)有限公司 | Index word clustering method and device |
US9524337B2 (en) | 2013-03-28 | 2016-12-20 | Electronics And Telecommunications Research Institute | Apparatus, system, and method for detecting complex issues based on social media analysis |
US9262510B2 (en) | 2013-05-10 | 2016-02-16 | International Business Machines Corporation | Document tagging and retrieval using per-subject dictionaries including subject-determining-power scores for entries |
US9971828B2 (en) | 2013-05-10 | 2018-05-15 | International Business Machines Corporation | Document tagging and retrieval using per-subject dictionaries including subject-determining-power scores for entries |
KR101395165B1 (en) * | 2013-06-13 | 2014-05-15 | 삼성증권주식회사 | The system which analyze a available searching key-word |
US9251136B2 (en) | 2013-10-16 | 2016-02-02 | International Business Machines Corporation | Document tagging and retrieval using entity specifiers |
US9971782B2 (en) | 2013-10-16 | 2018-05-15 | International Business Machines Corporation | Document tagging and retrieval using entity specifiers |
US9235638B2 (en) | 2013-11-12 | 2016-01-12 | International Business Machines Corporation | Document retrieval using internal dictionary-hierarchies to adjust per-subject match results |
US9430559B2 (en) | 2013-11-12 | 2016-08-30 | International Business Machines Corporation | Document retrieval using internal dictionary-hierarchies to adjust per-subject match results |
KR20160131477A (en) * | 2015-05-07 | 2016-11-16 | 신재욱 | An e-commerce system based on interest category using related keywords |
KR20200080571A (en) * | 2018-12-27 | 2020-07-07 | 에스케이 주식회사 | Information Search System and Method using keyword and relation information |
CN117351956A (en) * | 2023-12-05 | 2024-01-05 | 广州一链通互联网科技有限公司 | Freight track generation and query method |
Also Published As
Publication number | Publication date |
---|---|
KR101048540B1 (en) | 2011-07-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101048540B1 (en) | Apparatus and method for classifying search keywords using clusters according to related keywords | |
Chang et al. | Social media analytics: Extracting and visualizing Hilton hotel ratings and reviews from TripAdvisor | |
Nagamma et al. | An improved sentiment analysis of online movie reviews based on clustering for box-office prediction | |
US8190621B2 (en) | Method, system, and computer readable recording medium for filtering obscene contents | |
Li et al. | Detection and characterization of human trafficking networks using unsupervised scalable text template matching | |
JP2009093654A (en) | Determinion of document specificity | |
CN108090216A (en) | A kind of Tag Estimation method, apparatus and storage medium | |
Sharoff | Classifying Web corpora into domain and genre using automatic feature identification | |
SG193613A1 (en) | Text analyzing device, problematic behavior extraction method, and problematic behavior extraction program | |
Tran et al. | Spam detection in online classified advertisements | |
Soe et al. | Automated detection of dark patterns in cookie banners: how to do it poorly and why it is hard to do it any other way | |
Sara-Meshkizadeh et al. | Webpage classification based on compound of using HTML features & URL features and features of sibling pages | |
Medvet et al. | Brand-related events detection, classification and summarization on twitter | |
Pan et al. | Optimizing temporal topic segmentation for intelligent text visualization | |
Noekhah et al. | A novel approach for opinion spam detection in e-commerce | |
Yao et al. | Interpretable and low-resource entity matching via decoupling feature learning from decision making | |
KR102299525B1 (en) | Product Evolution Mining Method And Apparatus Thereof | |
Bollegala et al. | Extracting key phrases to disambiguate personal name queries in web search | |
Noekhah et al. | A novel model for opinion spam detection based on multi-iteration network structure | |
Aslam et al. | Web-AM: An efficient boilerplate removal algorithm for Web articles | |
CN116186298A (en) | Information retrieval method and device | |
KR101076522B1 (en) | System and method for site clustering | |
Sharafat et al. | Legal data mining from civil judgments | |
Yin et al. | Research of integrated algorithm establishment of a spam detection system | |
Novitasari et al. | A method of discovering interesting association rules from student admission dataset |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20150701 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20160701 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20190701 Year of fee payment: 9 |