KR101871739B1 - Method of determining representative keyword of application and system for determining representative keyword of application - Google Patents
Method of determining representative keyword of application and system for determining representative keyword of application Download PDFInfo
- Publication number
- KR101871739B1 KR101871739B1 KR1020180049073A KR20180049073A KR101871739B1 KR 101871739 B1 KR101871739 B1 KR 101871739B1 KR 1020180049073 A KR1020180049073 A KR 1020180049073A KR 20180049073 A KR20180049073 A KR 20180049073A KR 101871739 B1 KR101871739 B1 KR 101871739B1
- Authority
- KR
- South Korea
- Prior art keywords
- keywords
- target application
- applications
- determining
- keyword
- Prior art date
Links
Images
Classifications
-
- G06F17/30864—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
-
- G06F17/2755—
Abstract
Description
본 발명은 모바일 어플리케이션을 대표하는 키워드를 분석하는 기술에 관한 것으로, 보다 상세하게는 어플리케이션의 대표 키워드 결정 방법 및 어플리케이션의 대표 키워드 결정 시스템에 관한 것이다.BACKGROUND OF THE
최근 스마트폰, 태블릿 PC 등과 같은 모바일 단말기의 성능이 향상되고 무선 통신 속도가 증가함에 따라 모바일 단말기에서 실행될 수 있는 어플리케이션의 종류가 급격히 증가하고 있다.Recently, as the performance of mobile terminals such as smart phones and tablet PCs has improved and wireless communication speeds have increased, the kinds of applications that can be executed in mobile terminals have been rapidly increasing.
따라서 모바일 단말기 사용자들은 수많은 어플리케이션들 중에서 자신이 원하는 어플리케이션을 찾기가 점점 어려워지고 있다.Therefore, it is increasingly difficult for mobile terminal users to find an application desired by a user among a large number of applications.
이에, 어플리케이션 개발 회사나 어플리케이션을 판매하는 오픈 마켓은 어플리케이션의 성격, 특징, 기능 등을 나타내는 설명 자료를 어플리케이션과 함께 제공하고 있다.Therefore, Open Market, which sells application development companies and applications, provides explanatory materials showing the characteristics, characteristics, and functions of applications with applications.
또한, 최근 어플리케이션을 판매하는 오픈 마켓에서는 어플리케이션들을 종류에 따라 복수의 카테고리들로 분류하고, 어플리케이션의 카테고리 정보를 어플리케이션의 설명 자료와 함께 사용자에게 제공함으로써 사용자의 어플리케이션 검색 편의성을 향상시키고자 노력하고 있다.In an open market for selling applications, recently, applications are classified into a plurality of categories according to their types, and category information of an application is provided to a user together with explanatory data of the application, thereby making it easy to improve user's convenience of searching for an application .
그러나, 사용자는 어플리케이션의 카테고리 정보만으로는 어플리케이션의 특징이나 기능에 대해 파악하기가 어렵고, 자신이 원하는 어플리케이션을 찾기 위해 다양한 어플리케이션들의 설명 자료를 읽어 봄으로써 어플리케이션들의 특징이나 기능을 파악하는 데에도 많은 시간과 노력이 필요하다는 문제점이 있다.However, it is difficult for the user to understand the characteristics and functions of the application only by the category information of the application. Also, by reading explanatory data of various applications to find the application desired by the user, There is a problem that effort is required.
상기와 같은 문제점을 해결하기 위한 본 발명의 일 목적은 모바일 어플리케이션의 특징을 효과적으로 나타낼 수 있는 어플리케이션의 대표 키워드들을 결정하는 방법 및 시스템을 제공하는 것이다.SUMMARY OF THE INVENTION It is an object of the present invention to provide a method and system for determining representative keywords of an application that can effectively represent a feature of a mobile application.
상술한 본 발명의 일 목적을 달성하기 위하여, 본 발명의 일 실시예에 따른 어플리케이션의 대표 키워드 결정 방법에서, 어플리케이션 마켓으로부터 복수의 어플리케이션들 각각의 설명 자료를 크롤링(crawling)하고, 상기 복수의 어플리케이션들 각각에 대하여, 상기 설명 자료에 포함되는 키워드들 및 상기 설명 자료에서 상기 키워드들의 비중들을 결정하여 제1 데이터베이스에 저장하고, 상기 복수의 어플리케이션들 중에서 목표 어플리케이션을 선택하고, 상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션과 높은 연관도를 갖는 연관 어플리케이션들의 목록을 획득하고, 상기 제1 데이터베이스로부터 상기 목표 어플리케이션 및 상기 연관 어플리케이션들 각각의 상기 키워드들 및 상기 키워드들의 비중들을 독출하고, 상기 목표 어플리케이션의 상기 키워드들 중에서 상기 연관 어플리케이션들의 상기 키워드들과 중복되는 키워드들을 중복 키워드들로 결정하고, 상기 목표 어플리케이션의 상기 키워드들의 비중들과 상기 연관 어플리케이션들 각각의 상기 중복 키워드들의 비중들에 기초하여 상기 목표 어플리케이션의 상기 키워드들 중에서 상기 목표 어플리케이션을 대표하는 대표 키워드들을 결정한다.In order to accomplish one object of the present invention, in a representative keyword determination method of an application according to an embodiment of the present invention, crawling description data of each of a plurality of applications from an application market, For each of the plurality of applications, the weight of the keywords in the keywords included in the explanatory data and the explanatory data is determined and stored in the first database, the target application is selected from among the plurality of applications, Obtaining a list of associated applications having a high degree of association with the target application, reading the weight of the keywords and the keywords of each of the target application and the associated applications from the first database, Determining, based on the weight of the keywords of the target application and the weight of the duplicate keywords of each of the associated applications, determining keywords that overlap with the keywords of the related applications among the keywords of the target applications, And determines representative keywords representing the target application from among the keywords of the target application.
일 실시예에 있어서, 상기 복수의 어플리케이션들 각각에 대하여, 상기 설명 자료에 포함되는 상기 키워드들 및 상기 설명 자료에서 상기 키워드들의 상기 비중들을 결정하여 상기 제1 데이터베이스에 저장하는 단계는, 상기 복수의 어플리케이션들 각각에 대하여, 상기 설명 자료에 대해 형태소 분석(morphological analysis)을 수행하여 상기 설명 자료에 포함되는 상기 키워드들을 추출하는 단계, 상기 설명 자료에서 상기 키워드들 각각의 반복 횟수를 결정하는 단계, 상기 키워드들 각각의 상기 반복 횟수를 상기 키워드들의 상기 반복 횟수들의 총합으로 나눈 값을 상기 키워드들 각각의 상기 비중으로 결정하는 단계, 및 상기 키워드들 및 상기 키워드들의 상기 비중들을 상응하는 어플리케이션의 명칭과 연관시켜 상기 제1 데이터베이스에 저장하는 단계를 포함할 수 있다.In one embodiment, for each of the plurality of applications, the step of determining the weight of the keywords in the keywords and the explanatory data included in the explanatory data and storing the determined weight in the first database may include: Performing morphological analysis on the explanatory data for each of the applications to extract the keywords included in the explanatory data; determining a repetition frequency of each of the keywords in the explanatory data; Determining, by the weight of each of the keywords, a value obtained by dividing the repetition count of each of the keywords by the sum of the repetition counts of the keywords, and associating the weight of the keywords and the keywords with the name of the corresponding application To the first database It can be included.
일 실시예에 있어서, 상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션과 높은 연관도를 갖는 상기 연관 어플리케이션들의 목록을 획득하는 단계는, 상기 복수의 어플리케이션들 각각에 대하여, 상응하는 어플리케이션과 높은 연관도를 갖는 상기 연관 어플리케이션들의 목록을 미리 저장하는 제2 데이터베이스로부터 상기 목표 어플리케이션에 상응하는 상기 연관 어플리케이션들의 목록을 독출하는 단계를 포함할 수 있다.In one embodiment, the step of obtaining a list of the associated applications having a high degree of association with the target application among the plurality of applications may include, for each of the plurality of applications, And reading a list of the associated applications corresponding to the target application from a second database that stores a list of the associated applications in advance.
일 실시예에 있어서, 상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션과 높은 연관도를 갖는 상기 연관 어플리케이션들의 목록을 획득하는 단계는, 복수의 모바일 단말기들 각각의 식별 아이디 및 상기 복수의 모바일 단말기들 각각에 설치된 어플리케이션들의 목록을 포함하는 설치 로그 데이터를 수신하여 제3 데이터베이스에 저장하는 단계, 상기 제3 데이터베이스에 저장된 상기 복수의 모바일 단말기들의 상기 설치 로그 데이터에 기초하여 상기 복수의 모바일 단말기들 중에서 제1 내지 제k(k는 양의 정수) 어플리케이션들 각각이 설치된 모바일 단말기들의 비율에 상응하는 제1 내지 제k 전체 비율들을 결정하는 단계, 상기 제3 데이터베이스에 저장된 상기 복수의 모바일 단말기들의 상기 설치 로그 데이터에 기초하여 상기 목표 어플리케이션이 설치된 모바일 단말기들 중에서 상기 제1 내지 제k 어플리케이션들 각각이 설치된 모바일 단말기들의 비율에 상응하는 제1 내지 제k 교차 비율들을 결정하는 단계, 상기 제1 내지 제k 전체 비율들 및 상기 제1 내지 제k 교차 비율들에 기초하여 상기 목표 어플리케이션과 상기 제1 내지 제k 어플리케이션들 각각 사이의 연관도를 나타내는 제1 내지 제k 연관 지수들을 결정하는 단계, 및 상기 제1 내지 제k 어플리케이션들 중에서 상대적으로 높은 연관 지수를 갖는 어플리케이션들을 상기 연관 어플리케이션들로 결정하는 단계를 포함할 수 있다.In one embodiment, the step of obtaining a list of the associated applications having a high degree of association with the target application among the plurality of applications comprises the steps of: obtaining an identification ID of each of the plurality of mobile terminals, Receiving install log data including a list of installed applications and storing the received install log data in a third database, storing installation log data including a list of installed applications in a first database, Determining k-th total ratios corresponding to the ratios of mobile terminals in which each k-th (k is a positive integer) application is installed; Based on the target application Determining k-th intersection ratios corresponding to ratios of mobile terminals in which each of the first to k-th applications is installed among mobile terminals with installed first to k-th applications, Determining k-th association indices indicative of a degree of association between the target application and each of the first to k-th applications based on the k-th to k-th crossing ratios, Determining the applications with a relatively high association index as the associated applications.
상기 제3 데이터베이스에 저장된 상기 복수의 모바일 단말기들의 상기 설치 로그 데이터에 기초하여 상기 복수의 모바일 단말기들 중에서 상기 제1 내지 제k 어플리케이션들 각각이 설치된 모바일 단말기들의 비율에 상응하는 상기 제1 내지 제k 전체 비율들을 결정하는 단계는, 상기 복수의 모바일 단말기들의 상기 설치 로그 데이터에 기초하여 상기 복수의 모바일 단말기들에 상응하는 상기 식별 아이디들의 개수를 전체 개수로 결정하는 단계, 상기 복수의 모바일 단말기들의 상기 설치 로그 데이터에 기초하여 제j(j는 1 이상 k 이하의 임의의 양의 정수) 어플리케이션이 설치된 모바일 단말기들에 상응하는 상기 식별 아이디들의 개수를 제j 설치 개수로 결정하는 단계, 및 상기 제j 설치 개수를 상기 전체 개수로 나눈 값을 제j 전체 비율로 결정하는 단계를 포함할 수 있다.The first to kth applications corresponding to the ratios of mobile terminals installed with the first to k-th applications among the plurality of mobile terminals, based on the installation log data of the plurality of mobile terminals stored in the third database, Determining all ratios includes determining a total number of the identification IDs corresponding to the plurality of mobile terminals based on the installation log data of the plurality of mobile terminals, Determining, as a j-th installation number, the number of identification IDs corresponding to mobile terminals having a j-th application (where j is any positive integer equal to or greater than 1 k) based on installation log data; and Determining the value obtained by dividing the installation number by the total number as the total j ratio System.
상기 제3 데이터베이스에 저장된 상기 복수의 모바일 단말기들의 상기 설치 로그 데이터에 기초하여 상기 목표 어플리케이션이 설치된 모바일 단말기들 중에서 상기 제1 내지 제k 어플리케이션들 각각이 설치된 모바일 단말기들의 비율에 상응하는 상기 제1 내지 제k 교차 비율들을 결정하는 단계는, 상기 복수의 모바일 단말기들의 상기 설치 로그 데이터에 기초하여 상기 목표 어플리케이션이 설치된 모바일 단말기들에 상응하는 상기 식별 아이디들의 개수를 목표 설치 개수로 결정하는 단계, 상기 복수의 모바일 단말기들의 상기 설치 로그 데이터에 기초하여 상기 목표 어플리케이션과 제j(j는 1 이상 k 이하의 임의의 양의 정수) 어플리케이션이 함께 설치된 모바일 단말기들에 상응하는 상기 식별 아이디들의 개수를 제j 교차 개수로 결정하는 단계, 및 상기 제j 교차 개수를 상기 목표 설치 개수로 나눈 값을 제j 교차 비율로 결정하는 단계를 포함할 수 있다.The first to the kth applications corresponding to the ratio of the mobile terminals installed with the first to k-th applications among the mobile terminals installed with the target application on the basis of the installation log data of the plurality of mobile terminals stored in the third database, Determining the kth intersection ratios comprises: determining a number of the identification IDs corresponding to mobile terminals on which the target application is installed based on the installation log data of the plurality of mobile terminals as a target installation number, Based on the installation log data of the mobile terminals of the mobile terminals of the mobile terminals, the number of the identification IDs corresponding to the mobile terminals in which the target application and the j (j is an arbitrary positive integer equal to or greater than 1) Determining a number, Wherein the j-th cross-number can include determining a value obtained by dividing the number of target installed in the j-th cross ratio.
상기 제1 내지 제k 전체 비율들 및 상기 제1 내지 제k 교차 비율들에 기초하여 상기 목표 어플리케이션과 상기 제1 내지 제k 어플리케이션들 각각 사이의 연관도를 나타내는 상기 제1 내지 제k 연관 지수들을 결정하는 단계는, 상기 제1 내지 제k 전체 비율들 각각과 상기 제1 내지 제k 교차 비율들 각각 사이의 차이에 기초하여 상기 제1 내지 제k 연관 지수들을 결정하는 단계를 포함할 수 있다.The first through k-th associative exponents representing the degree of association between the target application and each of the first through k-th applications based on the first through k-th overall ratios and the first through k- Determining may comprise determining the first to k < RTI ID = 0.0 > k < / RTI > associated exponents based on a difference between each of the first through k total ratios and each of the first through k crossings ratios.
상기 제1 내지 제k 전체 비율들 및 상기 제1 내지 제k 교차 비율들에 기초하여 상기 목표 어플리케이션과 상기 제1 내지 제k 어플리케이션들 각각 사이의 연관도를 나타내는 상기 제1 내지 제k 연관 지수들을 결정하는 단계는, 상기 제1 내지 제k 전체 비율들 각각에 대한 상기 제1 내지 제k 교차 비율들 각각의 비율에 기초하여 상기 제1 내지 제k 연관 지수들을 결정하는 단계를 포함할 수 있다.The first through k-th associative exponents representing the degree of association between the target application and each of the first through k-th applications based on the first through k-th overall ratios and the first through k- The determining may comprise determining the first through k k -th associative exponents based on a ratio of each of the first through k-th crossing ratios for each of the first through k-th overall ratios.
상기 제1 내지 제k 전체 비율들 및 상기 제1 내지 제k 교차 비율들에 기초하여 상기 목표 어플리케이션과 상기 제1 내지 제k 어플리케이션들 각각 사이의 연관도를 나타내는 상기 제1 내지 제k 연관 지수들을 결정하는 단계는, 상기 제1 내지 제k 전체 비율들 각각과 상기 제1 내지 제k 교차 비율들 각각 사이의 차이 및 상기 제1 내지 제k 전체 비율들 각각에 대한 상기 제1 내지 제k 교차 비율들 각각의 비율에 기초하여 상기 제1 내지 제k 연관 지수들을 결정하는 단계를 포함할 수 있다.The first through k-th associative exponents representing the degree of association between the target application and each of the first through k-th applications based on the first through k-th overall ratios and the first through k- Determining the difference between each of said first through kth total ratios and each of said first through kth intersection ratios and said first through kth intersection ratios for each of said first through k total ratios, K < / RTI > associated indexes based on the ratio of each of the first through k < th >
상기 제1 내지 제k 전체 비율들 및 상기 제1 내지 제k 교차 비율들에 기초하여 상기 목표 어플리케이션과 상기 제1 내지 제k 어플리케이션들 각각 사이의 연관도를 나타내는 상기 제1 내지 제k 연관 지수들을 결정하는 단계는, 상기 제1 내지 제k 전체 비율들 각각과 상기 제1 내지 제k 교차 비율들 각각 사이의 차이, 상기 제1 내지 제k 전체 비율들 각각에 대한 상기 제1 내지 제k 교차 비율들 각각의 비율, 및 0보다 크고 1보다 작은 값을 갖는 가중치에 기초하여 상기 제1 내지 제k 연관 지수들을 결정하는 단계를 포함할 수 있다.The first through k-th associative exponents representing the degree of association between the target application and each of the first through k-th applications based on the first through k-th overall ratios and the first through k- Determining a difference between each of said first through kth total ratios and each of said first through kth intersection ratios, said first through kth intersection ratios for each of said first through kth total ratios, , And determining the first through k < RTI ID = 0.0 > k < / RTI > associated exponents based on a weight having a ratio of each of the first through k and a value greater than zero and less than one.
일 실시예에 있어서, 상기 목표 어플리케이션의 상기 키워드들의 비중들과 상기 연관 어플리케이션들 각각의 상기 중복 키워드들의 비중들에 기초하여 상기 목표 어플리케이션의 상기 키워드들 중에서 상기 목표 어플리케이션을 대표하는 상기 대표 키워드들을 결정하는 단계는, 상기 목표 어플리케이션의 상기 키워드들 중에서 상기 중복 키워드들 각각에 대하여, 상기 목표 어플리케이션의 상기 중복 키워드의 비중에 상기 연관 어플리케이션들 각각의 상기 중복 키워드의 비중을 가중치로 적용하여 상기 중복 키워드의 점수를 결정하는 단계, 상기 목표 어플리케이션의 상기 키워드들 중에서 상기 중복 키워드가 아닌 비중복 키워드들 각각에 대하여, 상기 목표 어플리케이션의 상기 비중복 키워드의 비중을 상기 비중복 키워드의 점수로 결정하는 단계, 및 상기 목표 어플리케이션의 상기 키워드들 중에서 상대적으로 높은 점수를 갖는 키워드들을 상기 대표 키워드들로 결정하는 단계를 포함할 수 있다.In one embodiment, the representative keywords representing the target application among the keywords of the target application are determined based on the weight of the keywords of the target application and the weight of the duplicate keywords of each of the associated applications For each of the duplicate keywords among the keywords of the target application, applying a weight of the duplicate keyword of each of the associated applications to a weight of the duplicate keyword of the target application as a weight, Determining a score of the non-overlapping keyword in the target application for each of the non-overlapping keywords that are not duplicate keywords among the keywords in the target application System, and it can include determining a keyword having a relatively high score among the keyword of the target application with the representative keywords.
상기 목표 어플리케이션의 상기 키워드들 중에서 상기 중복 키워드들 각각에 대하여, 상기 목표 어플리케이션의 상기 중복 키워드의 비중에 상기 연관 어플리케이션들 각각의 상기 중복 키워드의 비중을 가중치로 적용하여 상기 중복 키워드의 점수를 결정하는 단계는, 상기 연관 어플리케이션들의 상기 중복 키워드의 비중들의 합을 상기 목표 어플리케이션의 상기 중복 키워드의 비중과 합한 값을 상기 중복 키워드의 점수로 결정하는 단계를 포함할 수 있다.For each of the duplicate keywords among the keywords of the target application, a weight of the duplicate keyword is determined by applying a weight of the duplicate keyword of each of the associated applications to a weight of the duplicate keyword of the target application May include determining a sum of the weights of the duplicate keywords of the associated applications and a specific gravity of the duplicate keywords of the target application as a score of the duplicate keyword.
일 실시예에 있어서, 상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션과 높은 연관도를 갖는 상기 연관 어플리케이션들의 목록을 획득하는 단계는, 상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션과 상대적으로 높은 연관도를 갖는 어플리케이션들에 상응하는 상기 연관 어플리케이션들의 목록 및 상기 목표 어플리케이션과 상기 연관 어플리케이션들 사이의 연관도를 나타내는 연관 지수들을 획득하는 단계를 포함할 수 있다.In one embodiment, the step of acquiring a list of the associated applications having a high degree of association with the target application among the plurality of applications may include acquiring, from among the plurality of applications, Obtaining a list of the associated applications corresponding to the target application and associated indexes representing the degree of association between the target application and the associated applications.
상기 목표 어플리케이션의 상기 키워드들의 비중들과 상기 연관 어플리케이션들 각각의 상기 중복 키워드들의 비중들에 기초하여 상기 목표 어플리케이션의 상기 키워드들 중에서 상기 목표 어플리케이션을 대표하는 상기 대표 키워드들을 결정하는 단계는, 상기 목표 어플리케이션의 상기 키워드들 중에서 상기 중복 키워드들 각각에 대하여, 상기 목표 어플리케이션의 상기 중복 키워드의 비중에 상기 연관 어플리케이션들 각각의 상기 중복 키워드의 비중 및 상기 연관 어플리케이션들 각각의 상기 연관 지수를 가중치로 적용하여 상기 중복 키워드의 점수를 결정하는 단계, 상기 목표 어플리케이션의 상기 키워드들 중에서 상기 중복 키워드가 아닌 비중복 키워드들 각각에 대하여, 상기 목표 어플리케이션의 상기 비중복 키워드의 비중을 상기 비중복 키워드의 점수로 결정하는 단계, 및 상기 목표 어플리케이션의 상기 키워드들 중에서 상대적으로 높은 점수를 갖는 키워드들을 상기 대표 키워드들로 결정하는 단계를 포함할 수 있다.Wherein the step of determining the representative keywords representing the target application among the keywords of the target application based on the weight of the keywords of the target application and the weight of the overlapping keywords of each of the associated applications, For each of the duplicate keywords among the keywords of the application, the weight of the duplicate keyword of each of the associated applications and the association index of each of the associated applications is applied as a weight to the weight of the duplicate keyword of the target application Determining a score of the duplicate keyword, calculating, for each of the non-duplicated keywords that are not duplicate keywords among the keywords of the target application, Determining a score of the keyword clothing, and may include determining keywords having a relatively high score among the keyword of the target application with the representative keywords.
상기 목표 어플리케이션의 상기 키워드들 중에서 상기 중복 키워드들 각각에 대하여, 상기 목표 어플리케이션의 상기 중복 키워드의 비중에 상기 연관 어플리케이션들 각각의 상기 중복 키워드의 비중 및 상기 연관 어플리케이션들 각각의 상기 연관 지수를 가중치로 적용하여 상기 중복 키워드의 점수를 결정하는 단계는, 상기 연관 어플리케이션들 각각의 상기 중복 키워드의 비중과 상기 연관 어플리케이션들 각각의 상기 연관 지수의 곱을 상기 목표 어플리케이션의 상기 중복 키워드의 비중과 합한 값을 상기 중복 키워드의 점수로 결정하는 단계를 포함할 수 있다.For each of the duplicate keywords among the keywords of the target application, a weight of the duplicate keyword of each of the associated applications and a weight of the association index of each of the associated applications in the weight of the duplicate keyword of the target application Wherein the step of determining the score of the duplicate keyword comprises: calculating a sum of the weight of the duplicate keyword of each of the associated applications and the association index of each of the associated applications together with the specific gravity of the duplicate keyword of the target application, As a score of a duplicate keyword.
일 실시예에 있어서, 상기 목표 어플리케이션의 상기 키워드들의 비중들과 상기 연관 어플리케이션들 각각의 상기 중복 키워드들의 비중들에 기초하여 상기 목표 어플리케이션의 상기 키워드들 중에서 상기 목표 어플리케이션을 대표하는 상기 대표 키워드들을 결정하는 단계는, 상기 목표 어플리케이션의 상기 키워드들의 비중들과 상기 연관 어플리케이션들 각각의 상기 중복 키워드들의 비중들에 기초하여 상기 목표 어플리케이션의 상기 키워드들 각각의 점수를 결정하는 단계, 상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션의 상기 키워드들 각각과 중복되는 키워드를 포함하는 어플리케이션들의 개수에 기초하여 상기 목표 어플리케이션의 상기 키워드들 각각의 보정 계수를 결정하는 단계, 상기 목표 어플리케이션의 상기 키워드들 각각의 상기 점수에 상기 목표 어플리케이션의 상기 키워드들 각각의 상기 보정 계수를 곱한 값을 상기 목표 어플리케이션의 상기 키워드들 각각의 보정 점수로 결정하는 단계, 및 상기 목표 어플리케이션의 상기 키워드들 중에서 상대적으로 높은 보정 점수를 갖는 키워드들을 상기 대표 키워드들로 결정하는 단계를 포함할 수 있다.In one embodiment, the representative keywords representing the target application among the keywords of the target application are determined based on the weight of the keywords of the target application and the weight of the duplicate keywords of each of the associated applications Determining a score for each of the keywords in the target application based on the weight of the keywords in the target application and the weight of the duplicate keywords in each of the associated applications, Determining a correction coefficient for each of the keywords of the target application based on the number of applications including keywords overlapping each of the keywords of the target application, Of the target application by the correction coefficient of each of the keywords of the target application as the correction score of each of the keywords of the target application, And determining the keywords having the correction score as the representative keywords.
상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션의 상기 키워드들 각각과 중복되는 키워드를 포함하는 어플리케이션들의 개수에 기초하여 상기 목표 어플리케이션의 상기 키워드들 각각의 상기 보정 계수를 결정하는 단계는, 상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션의 상기 키워드와 동일한 키워드를 포함하는 어플리케이션들의 개수가 상대적으로 많은 경우, 상기 목표 어플리케이션의 상기 키워드의 상기 보정 계수를 상대적으로 작은 값으로 결정하는 단계, 및 상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션의 상기 키워드와 동일한 키워드를 포함하는 어플리케이션들의 개수가 상대적으로 적은 경우, 상기 목표 어플리케이션의 상기 키워드의 상기 보정 계수를 상대적으로 큰 값으로 결정하는 단계를 포함할 수 있다.The step of determining the correction coefficient of each of the keywords of the target application based on the number of applications including a keyword overlapping each of the keywords of the target application among the plurality of applications comprises: Determining the correction coefficient of the keyword of the target application to be a relatively small value when the number of applications including the same keyword as the keyword of the target application is relatively large among the plurality of applications, Determining the correction coefficient of the keyword of the target application as a relatively large value when the number of applications including the same keyword as the keyword of the target application is relatively small, .
일 실시예에 있어서, 상기 어플리케이션의 대표 키워드 결정 방법은 상기 복수의 어플리케이션들 각각의 상기 설명 자료에 기초하여 상기 복수의 어플리케이션들 각각의 카테고리 정보를 상기 제1 데이터베이스에 저장하는 단계를 더 포함할 수 있다. 상기 목표 어플리케이션의 상기 키워드들의 비중들과 상기 연관 어플리케이션들 각각의 상기 중복 키워드들의 비중들에 기초하여 상기 목표 어플리케이션의 상기 키워드들 중에서 상기 목표 어플리케이션을 대표하는 상기 대표 키워드들을 결정하는 단계는, 상기 목표 어플리케이션의 상기 키워드들의 비중들과 상기 연관 어플리케이션들 각각의 상기 중복 키워드들의 비중들에 기초하여 상기 목표 어플리케이션의 상기 키워드들 각각의 점수를 결정하는 단계, 상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션의 상기 키워드들 각각과 중복되는 키워드를 포함하는 어플리케이션들이 속하는 카테고리들의 개수에 기초하여 상기 목표 어플리케이션의 상기 키워드들 각각의 보정 계수를 결정하는 단계, 상기 목표 어플리케이션의 상기 키워드들 각각의 상기 점수에 상기 목표 어플리케이션의 상기 키워드들 각각의 상기 보정 계수를 곱한 값을 상기 목표 어플리케이션의 상기 키워드들 각각의 보정 점수로 결정하는 단계, 및 상기 목표 어플리케이션의 상기 키워드들 중에서 상대적으로 높은 보정 점수를 갖는 키워드들을 상기 대표 키워드들로 결정하는 단계를 포함할 수 있다.In one embodiment, the representative keyword determination method of the application may further include storing category information of each of the plurality of applications in the first database based on the description data of each of the plurality of applications have. Wherein the step of determining the representative keywords representing the target application among the keywords of the target application based on the weight of the keywords of the target application and the weight of the overlapping keywords of each of the associated applications, Determining a score of each of the keywords in the target application based on the weight of the keywords in the application and the weight of the duplicate keywords in each of the associated applications; Determining a correction coefficient for each of the keywords of the target application based on the number of categories to which the applications that contain the keywords overlap each other, Of the target application by the correction coefficient of each of the keywords of the target application as the correction score of each of the keywords of the target application, And determining the keywords having the correction score as the representative keywords.
상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션의 상기 키워드들 각각과 중복되는 키워드를 포함하는 어플리케이션들이 속하는 카테고리들의 개수에 기초하여 상기 목표 어플리케이션의 상기 키워드들 각각의 상기 보정 계수를 결정하는 단계는, 상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션의 상기 키워드와 동일한 키워드를 포함하는 어플리케이션들이 속하는 카테고리들의 개수가 상대적으로 많은 경우, 상기 목표 어플리케이션의 상기 키워드의 상기 보정 계수를 상대적으로 작은 값으로 결정하는 단계, 및 상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션의 상기 키워드와 동일한 키워드를 포함하는 어플리케이션들이 속하는 카테고리들의 개수가 상대적으로 적은 경우, 상기 목표 어플리케이션의 상기 키워드의 상기 보정 계수를 상대적으로 큰 값으로 결정하는 단계를 포함할 수 있다.The step of determining the correction coefficient of each of the keywords of the target application based on the number of categories to which the applications including the keywords overlapping each of the keywords of the target application among the plurality of applications belongs, Determining the correction coefficient of the keyword of the target application to be a relatively small value when the number of categories to which the applications including the same keyword as the keyword of the target application belongs is relatively large among the applications of the target application, When the number of categories to which the applications including the same keyword as the keyword of the target application among the plurality of applications belongs is relatively small, The correction coefficient of the word may include the step of relatively the greater the value.
상술한 본 발명의 일 목적을 달성하기 위하여, 본 발명의 일 실시예에 따른 어플리케이션의 대표 키워드 결정 시스템은 데이터베이스, 설명 자료 수집부, 키워드 추출부, 연관 어플리케이션 결정부, 및 키워드 분석부를 포함한다. 상기 설명 자료 수집부는 어플리케이션 마켓으로부터 복수의 어플리케이션들 각각의 설명 자료를 크롤링(crawling)한다. 상기 키워드 추출부는 상기 복수의 어플리케이션들 각각에 대하여, 상기 설명 자료에 포함되는 키워드들 및 상기 설명 자료에서 상기 키워드들의 비중들을 결정하여 상기 데이터베이스에 저장한다. 상기 연관 어플리케이션 결정부는 상기 복수의 어플리케이션들 중에서 목표 어플리케이션을 선택하고, 상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션과 높은 연관도를 갖는 연관 어플리케이션들의 목록을 획득한다. 상기 키워드 분석부는 상기 데이터베이스로부터 상기 목표 어플리케이션 및 상기 연관 어플리케이션들 각각의 상기 키워드들 및 상기 키워드들의 비중들을 독출하고, 상기 목표 어플리케이션의 상기 키워드들 중에서 상기 연관 어플리케이션들의 상기 키워드들과 중복되는 키워드들을 중복 키워드들로 결정하고, 상기 목표 어플리케이션의 상기 키워드들의 비중들과 상기 연관 어플리케이션들 각각의 상기 중복 키워드들의 비중들에 기초하여 상기 목표 어플리케이션의 상기 키워드들 중에서 상기 목표 어플리케이션을 대표하는 대표 키워드들을 결정한다.In order to accomplish one object of the present invention, a representative keyword determination system of an application according to an embodiment of the present invention includes a database, a description data collection unit, a keyword extraction unit, an associated application determination unit, and a keyword analysis unit. The description data collection unit crawls description data of each of a plurality of applications from an application market. The keyword extracting unit determines the specific weight of the keywords in the description data and the description data for each of the plurality of applications and stores the determined weight in the database. The associated application determination unit selects a target application among the plurality of applications, and acquires a list of related applications having a high degree of association with the target application among the plurality of applications. Wherein the keyword analyzing unit reads the weightings of the keywords and the keywords of each of the target application and the related applications from the database and stores keywords overlapping the keywords of the related applications among the keywords of the target application Determines representative keywords representing the target application among the keywords of the target application based on the weight of the keywords of the target application and the weight of the duplicate keywords of each of the associated applications .
본 발명의 실시예들에 따른 어플리케이션의 대표 키워드 결정 시스템 및 어플리케이션의 대표 키워드 결정 방법은 어플리케이션의 특징을 효과적으로 나타내는 대표 키워드들을 정확하게 결정할 수 있다.The representative keyword determination system of the application and the representative keyword determination method of the application according to the embodiments of the present invention can accurately determine the representative keywords that effectively characterize the application.
도 1은 본 발명의 일 실시예에 따른 어플리케이션의 대표 키워드 결정 시스템을 나타내는 도면이다.
도 2는 본 발명의 일 실시예에 따른 어플리케이션의 대표 키워드 결정 방법을 나타내는 순서도이다.
도 3은 도 2의 복수의 어플리케이션들 각각에 대하여, 설명 자료에 포함되는 키워드들 및 상기 설명 자료에서 상기 키워드들의 비중들을 결정하여 제1 데이터베이스에 저장하는 단계의 일 예를 나타내는 순서도이다.
도 4는 도 1의 어플리케이션의 대표 키워드 결정 시스템에 포함되는 제1 데이터베이스의 일 예를 나타내는 도면이다.
도 5는 도 1에 도시된 어플리케이션의 대표 키워드 결정 시스템의 일 예를 나타내는 도면이다.
도 6은 도 5의 어플리케이션의 대표 키워드 결정 시스템에 포함되는 제2 데이터베이스의 일 예를 나타내는 도면이다.
도 7은 도 1의 어플리케이션의 대표 키워드 결정 시스템에 포함되는 연관 어플리케이션 결정부의 일 예를 나타내는 블록도이다.
도 8은 도 2의 복수의 어플리케이션들 중에서 목표 어플리케이션과 높은 연관도를 갖는 연관 어플리케이션들의 목록을 획득하는 단계의 일 예를 나타내는 순서도이다.
도 9는 도 7에 도시된 복수의 모바일 단말기들 각각으로부터 연관 어플리케이션 결정부로 전송되는 설치 로그 데이터의 일 예를 나타내는 도면이다.
도 10은 도 7의 연관 어플리케이션 결정부에 포함되는 제3 데이터베이스의 일 예를 나타내는 도면이다.
도 11은 도 8의 복수의 모바일 단말기들 중에서 제1 내지 제k 어플리케이션들 각각이 설치된 모바일 단말기들의 비율에 상응하는 제1 내지 제k 전체 비율들을 결정하는 단계의 일 예를 나타내는 순서도이다.
도 12는 도 8의 목표 어플리케이션이 설치된 모바일 단말기들 중에서 제1 내지 제k 어플리케이션들 각각이 설치된 모바일 단말기들의 비율에 상응하는 제1 내지 제k 교차 비율들을 결정하는 단계의 일 예를 나타내는 순서도이다.
도 13은 도 2의 목표 어플리케이션의 키워드들의 비중들과 연관 어플리케이션들 각각의 중복 키워드들의 비중들에 기초하여 상기 목표 어플리케이션의 상기 키워드들 중에서 상기 목표 어플리케이션을 대표하는 대표 키워드들을 결정하는 단계의 일 예를 나타내는 순서도이다.
도 14는 도 2의 목표 어플리케이션의 키워드들의 비중들과 연관 어플리케이션들 각각의 중복 키워드들의 비중들에 기초하여 상기 목표 어플리케이션의 상기 키워드들 중에서 상기 목표 어플리케이션을 대표하는 대표 키워드들을 결정하는 단계의 다른 예를 나타내는 순서도이다.
도 15는 도 2의 목표 어플리케이션의 키워드들의 비중들과 연관 어플리케이션들 각각의 중복 키워드들의 비중들에 기초하여 상기 목표 어플리케이션의 상기 키워드들 중에서 상기 목표 어플리케이션을 대표하는 대표 키워드들을 결정하는 단계의 또 다른 예를 나타내는 순서도이다.
도 16은 도 2의 목표 어플리케이션의 키워드들의 비중들과 연관 어플리케이션들 각각의 중복 키워드들의 비중들에 기초하여 상기 목표 어플리케이션의 상기 키워드들 중에서 상기 목표 어플리케이션을 대표하는 대표 키워드들을 결정하는 단계의 또 다른 예를 나타내는 순서도이다.
도 17은 도 1의 어플리케이션의 대표 키워드 결정 시스템에 포함되는 제1 데이터베이스의 다른 예를 나타내는 도면이다.1 is a diagram illustrating a representative keyword determination system of an application according to an exemplary embodiment of the present invention.
2 is a flowchart illustrating a representative keyword determination method of an application according to an embodiment of the present invention.
FIG. 3 is a flowchart illustrating an example of determining the weight of the keywords in the description data and the keywords in the description data for each of the plurality of applications in FIG. 2 and storing the determined weight in the first database.
4 is a diagram showing an example of a first database included in the representative keyword determination system of the application of FIG.
5 is a diagram showing an example of a representative keyword determination system of the application shown in FIG.
6 is a diagram showing an example of a second database included in the representative keyword determination system of the application of FIG.
7 is a block diagram showing an example of an associated application determination unit included in the representative keyword determination system of the application shown in FIG.
FIG. 8 is a flowchart showing an example of a step of acquiring a list of associated applications having a high degree of association with a target application among the plurality of applications of FIG. 2. FIG.
9 is a diagram illustrating an example of installation log data transmitted from each of a plurality of mobile terminals shown in FIG. 7 to an associated application determination unit.
10 is a diagram showing an example of a third database included in the associated application determination unit of FIG.
FIG. 11 is a flowchart showing an example of determining the first to k-th overall ratios corresponding to the ratios of mobile terminals in which each of the first to k-th applications among the plurality of mobile terminals in FIG. 8 is installed.
FIG. 12 is a flowchart showing an example of determining the first through k-th intersection ratios corresponding to the ratios of the mobile terminals installed with the first through k-th applications among the mobile terminals installed with the target application of FIG.
13 shows an example of a step of determining representative keywords representing the target application among the keywords of the target application on the basis of the weight of the keywords of the target application and the weight of the duplicate keywords of each of the related applications Fig.
14 shows another example of the step of determining representative keywords representing the target application among the keywords of the target application based on the weight of the keywords of the target application and the weight of the duplicate keywords of each of the related applications Fig.
FIG. 15 is a flowchart illustrating a method for determining representative keywords representative of the target application among the keywords of the target application based on the weight of the keywords of the target application and the weight of duplicate keywords of each of the related applications Fig.
FIG. 16 is a flowchart illustrating a process of determining representative keywords representing the target application among the keywords of the target application based on the weight of the keywords of the target application and the weight of duplicate keywords of each of the related applications, Fig.
17 is a diagram showing another example of the first database included in the representative keyword determination system of the application of FIG.
본문에 개시되어 있는 본 발명의 실시예들에 대해서, 특정한 구조적 내지 기능적 설명들은 단지 본 발명의 실시예를 설명하기 위한 목적으로 예시된 것으로, 본 발명의 실시예들은 다양한 형태로 실시될 수 있으며 본문에 설명된 실시예들에 한정되는 것으로 해석되어서는 아니 된다.For the embodiments of the invention disclosed herein, specific structural and functional descriptions are set forth for the purpose of describing an embodiment of the invention only, and it is to be understood that the embodiments of the invention may be practiced in various forms, The present invention should not be construed as limited to the embodiments described in Figs.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 형태를 가질 수 있는바, 특정 실시예들을 도면에 예시하고 본문에 상세하게 설명하고자 한다. 그러나 이는 본 발명을 특정한 개시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.The present invention is capable of various modifications and various forms, and specific embodiments are illustrated in the drawings and described in detail in the text. It is to be understood, however, that the invention is not intended to be limited to the particular forms disclosed, but on the contrary, is intended to cover all modifications, equivalents, and alternatives falling within the spirit and scope of the invention.
제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로 사용될 수 있다. 예를 들어, 본 발명의 권리 범위로부터 이탈되지 않은 채 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다.The terms first, second, etc. may be used to describe various components, but the components should not be limited by the terms. The terms may be used for the purpose of distinguishing one component from another. For example, without departing from the scope of the present invention, the first component may be referred to as a second component, and similarly, the second component may also be referred to as a first component.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다. 구성요소들 간의 관계를 설명하는 다른 표현들, 즉 "~사이에"와 "바로 ~사이에" 또는 "~에 이웃하는"과 "~에 직접 이웃하는" 등도 마찬가지로 해석되어야 한다.It is to be understood that when an element is referred to as being "connected" or "connected" to another element, it may be directly connected or connected to the other element, . On the other hand, when an element is referred to as being "directly connected" or "directly connected" to another element, it should be understood that there are no other elements in between. Other expressions that describe the relationship between components, such as "between" and "between" or "neighboring to" and "directly adjacent to" should be interpreted as well.
본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 설시된 특징, 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.The terminology used in this application is used only to describe a specific embodiment and is not intended to limit the invention. The singular expressions include plural expressions unless the context clearly dictates otherwise. In the present application, the terms "comprise", "having", and the like are intended to specify the presence of stated features, integers, steps, operations, elements, components, or combinations thereof, , Steps, operations, components, parts, or combinations thereof, as a matter of principle.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미이다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미인 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.Unless otherwise defined, all terms used herein, including technical or scientific terms, have the same meaning as commonly understood by one of ordinary skill in the art to which this invention belongs. Terms such as those defined in commonly used dictionaries should be construed as meaning consistent with meaning in the context of the relevant art and are not to be construed as ideal or overly formal in meaning unless expressly defined in the present application .
이하, 첨부한 도면들을 참조하여, 본 발명의 바람직한 실시예를 보다 상세하게 설명하고자 한다. 도면상의 동일한 구성요소에 대해서는 동일한 참조부호를 사용하고 동일한 구성요소에 대해서 중복된 설명은 생략한다.Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings. The same reference numerals are used for the same constituent elements in the drawings and redundant explanations for the same constituent elements are omitted.
도 1은 본 발명의 일 실시예에 따른 어플리케이션의 대표 키워드 결정 시스템을 나타내는 도면이다.1 is a diagram illustrating a representative keyword determination system of an application according to an exemplary embodiment of the present invention.
도 1을 참조하면, 어플리케이션의 대표 키워드 결정 시스템(10)은 설명 자료 수집부(100), 키워드 추출부(200), 제1 데이터베이스(DB1)(300), 연관 어플리케이션 결정부(400), 및 키워드 분석부(500)를 포함한다.Referring to FIG. 1, a representative
일반적으로 어플리케이션들을 제공하는 어플리케이션 마켓(20)은 어플리케이션들의 특징, 기능 등을 기술하는 설명 자료(DS)를 함께 제공한다.The
어플리케이션의 대표 키워드 결정 시스템(10)은 유무선 통신을 통해 어플리케이션 마켓(20)으로부터 복수의 어플리케이션들 각각의 설명 자료(DS)를 크롤링(crawling)하고, 상기 복수의 어플리케이션들 각각의 설명 자료(DS)를 분석하여 상기 복수의 어플리케이션들 각각을 대표하는 대표 키워드들(REP_KWs)을 결정한다.The representative
이 때, 후술하는 바와 같이, 어플리케이션의 대표 키워드 결정 시스템(10)은 상기 복수의 어플리케이션들 각각에 대해 상기 복수의 어플리케이션들 각각과 높은 연관도를 갖는 연관 어플리케이션들의 목록을 획득한 후, 상기 복수의 어플리케이션들 각각의 설명 자료(DS)뿐만 아니라 상기 복수의 어플리케이션들 각각에 대한 상기 연관 어플리케이션들의 설명 자료(DS)를 함께 분석하여 상기 복수의 어플리케이션들 각각을 대표하는 대표 키워드들(REP_KWs)을 결정한다.At this time, as will be described later, the representative
따라서 본 발명의 실시예들에 따른 어플리케이션의 대표 키워드 결정 시스템(10)은 어플리케이션의 특징을 효과적으로 나타내는 대표 키워드들(REP_KWs)을 정확하게 결정할 수 있다.Therefore, the representative
도 2는 본 발명의 일 실시예에 따른 어플리케이션의 대표 키워드 결정 방법을 나타내는 순서도이다.2 is a flowchart illustrating a representative keyword determination method of an application according to an embodiment of the present invention.
도 2에 도시된 어플리케이션의 대표 키워드 결정 방법은 도 1의 어플리케이션의 대표 키워드 결정 시스템(10)을 통해 수행될 수 있다.The representative keyword determination method of the application shown in FIG. 2 can be performed through the representative
이하, 도 1 및 2를 참조하여 어플리케이션의 대표 키워드 결정 시스템(10)을 통해 수행되는 어플리케이션의 대표 키워드 결정 방법에 대해 상세히 설명한다.Hereinafter, a representative keyword determination method of an application performed through the representative
설명 자료 수집부(100)는 유무선 통신을 통해 어플리케이션 마켓(20)으로부터 복수의 어플리케이션들 각각의 설명 자료(DS)를 크롤링할 수 있다(단계 S100).The explanation
예를 들어, 설명 자료 수집부(100)는 어플리케이션 마켓(20)에 등록된 모든 어플리케이션들의 설명 자료(DS)를 순차적으로 검색하여 다운로드할 수 있다.For example, the description
설명 자료 수집부(100)는 크롤링된 상기 복수의 어플리케이션들 각각의 설명 자료(DS)를 키워드 추출부(200)에 제공할 수 있다.The description
키워드 추출부(200)는 상기 복수의 어플리케이션들 각각에 대하여, 설명 자료(DS)에 포함되는 키워드들(KW) 및 설명 자료(DS)에서 키워드들(KW)의 비중들(GV)을 결정하여 제1 데이터베이스(300)에 저장할 수 있다(단계 S200).The
도 3은 도 2의 복수의 어플리케이션들 각각에 대하여, 설명 자료에 포함되는 키워드들 및 상기 설명 자료에서 상기 키워드들의 비중들을 결정하여 제1 데이터베이스에 저장하는 단계(S200)의 일 예를 나타내는 순서도이다.FIG. 3 is a flowchart illustrating an example of a step S200 of determining the weight of the keywords in the description data and the keywords in the description data for each of the plurality of applications shown in FIG. 2, and storing the determined weight in the first database .
키워드 추출부(200)는 상기 복수의 어플리케이션들 각각에 대하여 도 3에 도시된 동작들을 수행함으로써, 상기 복수의 어플리케이션들 각각의 키워드들(KW) 및 상응하는 어플리케이션의 설명 자료(DS)에서 키워드들(KW) 각각이 차지하는 비중들(GV)을 결정하여 제1 데이터베이스(300)에 저장할 수 있다.The
구체적으로, 도 3을 참조하면, 키워드 추출부(200)는 상기 복수의 어플리케이션들 각각에 대하여, 설명 자료(DS)에 대해 형태소 분석(morphological analysis)을 수행하여 설명 자료(DS)에 포함되는 키워드들(KW)을 추출할 수 있다(단계 S210).3, the
일 실시예에 있어서, 키워드 추출부(200)는 설명 자료(DS)에 대해 형태소 분석을 수행하여 설명 자료(DS)에 포함되는 모든 형태소들을 추출한 후, 상기 파악된 형태소들 중에서 명사인 형태소들을 설명 자료(DS)의 키워드들(KW)로 결정할 수 있다.In one embodiment, the
그러나 본 발명은 이에 한정되지 않으며, 실시예들에 따라서 키워드 추출부(200)는 다양한 종류의 형태소 분석 알고리즘을 사용하여 설명 자료(DS)에 포함되는 키워드들(KW)을 추출할 수 있다.However, the present invention is not limited thereto, and the
이후, 키워드 추출부(200)는 키워드들(KW)이 추출된 설명 자료(DS)에서 키워드들(KW) 각각의 반복 횟수를 결정할 수 있다(단계 S220).Thereafter, the
예를 들어, 키워드 추출부(200)는 키워드들(KW) 각각이 설명 자료(DS)에 포함되는 개수를 카운트하여 키워드들(KW) 각각의 상기 반복 횟수로 결정할 수 있다.For example, the
이후, 키워드 추출부(200)는 키워드들(KW) 각각의 상기 반복 횟수를 키워드들(KW)의 상기 반복 횟수들의 총합으로 나눈 값을 키워드들(KW) 각각의 비중(GV)으로 결정할 수 있다(단계 S230).The
예를 들어, 설명 자료(DS)에서 제1 키워드가 5회 반복되고, 제2 키워드가 3회 반복되고, 제3 키워드가 2회 반복되는 경우, 키워드 추출부(200)는 상기 제1 키워드의 비중(GV)은 0.5로 결정하고, 상기 제2 키워드의 비중(GV)은 0.3으로 결정하고, 상기 제3 키워드의 비중(GV)은 0.2로 결정할 수 있다.For example, when the first keyword is repeated five times, the second keyword is repeated three times, and the third keyword is repeated twice in the explanation data DS, the
이후, 키워드 추출부(200)는 상기 복수의 어플리케이션들 각각에 대하여, 키워드들(KW) 및 키워드들(KW)의 비중들(GV)을 상응하는 어플리케이션의 명칭(APP_N)과 연관시켜 제1 데이터베이스(300)에 저장할 수 있다(단계 S240).The
도 4는 도 1의 어플리케이션의 대표 키워드 결정 시스템에 포함되는 제1 데이터베이스의 일 예를 나타내는 도면이다.4 is a diagram showing an example of a first database included in the representative keyword determination system of the application of FIG.
도 4를 참조하면, 제1 데이터베이스(300a)는 어플리케이션 필드(APP_F), 키워드 필드(KW_F), 및 비중 필드(GV_F)를 포함할 수 있다.Referring to FIG. 4, the
키워드 추출부(200)는 상기 복수의 어플리케이션들 각각에 대하여, 어플리케이션의 명칭(APP_N)을 어플리케이션 필드(APP_F)에 저장하고, 상응하는 어플리케이션의 키워드들(KW)을 키워드 필드(KW_F)에 저장하고, 상응하는 어플리케이션의 키워드들(KW)의 비중들(GV)을 비중 필드(GV_F)에 저장할 수 있다.The
도 4에는 예시적으로 APP1에 상응하는 어플리케이션의 키워드들(KW)은 "대화", "친구", 및 "첨부"로 결정되고, APP1에 상응하는 어플리케이션에서 "대화", "친구", 및 "첨부"의 비중(GV)은 각각 "0.40", "0.35", 및 "0.25"로 결정되고, APP2에 상응하는 어플리케이션의 키워드들(KW)은 "임신", "태교", "다이어리", 및 "영양"으로 결정되고, APP2에 상응하는 어플리케이션에서 "임신", "태교", "다이어리", 및 "영양"의 비중(GV)은 각각 "0.45", "0.30", "0.15", 및 "0.10"으로 결정된 것을 나타낸다.4, the keywords KW of the application corresponding to APP1 are determined to be "conversation", "friend", and "attachment", and "conversation", "friend", and " Appendix "are determined to be" 0.40 ", "0.35 ", and" 0.25 ", and the keywords KW of the application corresponding to APP2 are determined as "pregnancy ","Quot;, " pregnancy ", "diary ", and" nutrition "in the application corresponding to APP2 are determined as" 0.10 ".
다시 도 1 및 2를 참조하면, 연관 어플리케이션 결정부(400)는 상기 복수의 어플리케이션들 중에서 목표 어플리케이션을 선택할 수 있다(단계 S300).1 and 2, the associated
예를 들어, 도 1에 도시된 바와 같이, 연관 어플리케이션 결정부(400)는 제1 데이터베이스(300)에 저장된 어플리케이션의 명칭들(APP_N) 중의 하나를 선택하여 상기 목표 어플리케이션의 명칭(T_APP_N)으로서 독출할 수 있다.For example, as shown in FIG. 1, the associated
이후, 연관 어플리케이션 결정부(400)는 상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션과 높은 연관도를 갖는 연관 어플리케이션들의 목록(CORR_APPs)을 획득할 수 있다(단계 S400).Thereafter, the associated
일 실시예에 있어서, 어플리케이션의 대표 키워드 결정 시스템(10)은 상기 복수의 어플리케이션들 각각에 대한 연관 어플리케이션들의 목록들을 미리 저장할 수 있다.In one embodiment, the representative
이 경우, 연관 어플리케이션 결정부(400)는 어플리케이션의 대표 키워드 결정 시스템(10)에 미리 저장되는 상기 복수의 어플리케이션들 각각에 대한 연관 어플리케이션들의 목록들로부터 상기 목표 어플리케이션에 상응하는 연관 어플리케이션들의 목록(CORR_APPs)을 독출함으로써 상기 목표 어플리케이션에 대한 연관 어플리케이션들의 목록(CORR_APPs)을 획득할 수 있다(단계 S400).In this case, the associated
도 5는 도 1에 도시된 어플리케이션의 대표 키워드 결정 시스템의 일 예를 나타내는 도면이다.5 is a diagram showing an example of a representative keyword determination system of the application shown in FIG.
도 5를 참조하면, 도 5에 도시된 어플리케이션의 대표 키워드 결정 시스템(10)은 도 1에 도시된 어플리케이션의 대표 키워드 결정 시스템(10)에서 제2 데이터베이스(DB2)(600)를 더 포함할 수 있다.5, the representative
제2 데이터베이스(600)는 상기 복수의 어플리케이션들 각각에 대한 연관 어플리케이션들의 목록들을 미리 저장할 수 있다.The
이 경우, 연관 어플리케이션 결정부(400)는 제2 데이터베이스(600)로부터 상기 목표 어플리케이션에 상응하는 연관 어플리케이션들의 목록(CORR_APPs)을 독출할 수 있다.In this case, the associated
도 6은 도 5의 어플리케이션의 대표 키워드 결정 시스템에 포함되는 제2 데이터베이스의 일 예를 나타내는 도면이다.6 is a diagram showing an example of a second database included in the representative keyword determination system of the application of FIG.
도 6을 참조하면, 제2 데이터베이스(600)는 어플리케이션 필드(APP_F), 연관 어플리케이션 필드(CORR_APP_F), 및 연관 지수 필드(RI_F)를 포함할 수 있다.Referring to FIG. 6, the
어플리케이션 필드(APP_F)는 상기 복수의 어플리케이션들 각각의 명칭(APP_N)을 저장하고, 연관 어플리케이션 필드(CORR_APP_F)는 상응하는 어플리케이션과 높은 연관도를 갖는 연관 어플리케이션들의 목록을 저장하고, 연관 지수 필드(RI_F)는 상응하는 어플리케이션과 상기 연관 어플리케이션들 사이의 연관도를 나타내는 연관 지수들을 저장할 수 있다.The application field (APP_F) stores the name (APP_N) of each of the plurality of applications, the associated application field (CORR_APP_F) stores a list of associated applications having a high degree of association with the corresponding application, ) May store association indices indicating the degree of association between the corresponding application and the associated applications.
일 실시예에 있어서, 상기 연관 지수는 상기 상응하는 어플리케이션과 상기 연관 어플리케이션 사이의 연관도가 높을수록 상대적으로 큰 값을 갖고, 상기 상응하는 어플리케이션과 상기 연관 어플리케이션 사이의 연관도가 낮을수록 상대적으로 작은 값을 가질 수 있다.In one embodiment, the association index has a relatively large value as the degree of association between the corresponding application and the associated application is high, and the association index has a relatively small value as the association degree between the corresponding application and the associated application is low Value. ≪ / RTI >
도 6에는 예시적으로 APP1에 상응하는 어플리케이션의 연관 어플리케이션들은 APP3, APP4, 및 APP7이고, APP1과 APP3, APP4, 및 APP7 사이의 상기 연관 지수는 각각 A1, A2, 및 A3이고, APP2에 상응하는 어플리케이션의 연관 어플리케이션들은 APP4, APP5, APP8, 및 APP9이고, APP2와 APP4, APP5, APP8, 및 APP9 사이의 상기 연관 지수는 각각 A4, A5, A6, 및 A7인 것을 나타낸다. 여기서, A1, A2, A3, A4, A5, A6, 및 A7은 실수를 나타낸다.6 illustratively shows that the associated applications of the application corresponding to APP1 are APP3, APP4 and APP7, and the association indices between APP1 and APP3, APP4 and APP7 are A1, A2, and A3, respectively, The associated applications of the application are APP4, APP5, APP8, and APP9, and the association indices between APP2 and APP4, APP5, APP8, and APP9 are A4, A5, A6, and A7, respectively. Here, A1, A2, A3, A4, A5, A6, and A7 represent real numbers.
이 경우, 연관 어플리케이션 결정부(400)는 제2 데이터베이스(600)로부터 상기 목표 어플리케이션에 상응하는 연관 어플리케이션들의 목록(CORR_APPs) 및 상기 목표 어플리케이션과 상기 연관 어플리케이션들 사이의 연관도를 나타내는 연관 지수들(RIs)을 독출할 수 있다.In this case, the associated
다른 실시예에 있어서, 연관 어플리케이션 결정부(400)는 다양한 사용자들이 사용하는 복수의 모바일 단말기들에 설치된 어플리케이션들의 설치 패턴을 분석하여 상기 목표 어플리케이션과 높은 연관도를 갖는 연관 어플리케이션들의 목록(CORR_APPs)을 결정할 수 있다(단계 S400).In another embodiment, the associated
도 7은 도 1의 어플리케이션의 대표 키워드 결정 시스템에 포함되는 연관 어플리케이션 결정부의 일 예를 나타내는 블록도이다.7 is a block diagram showing an example of an associated application determination unit included in the representative keyword determination system of the application shown in FIG.
도 7을 참조하면, 연관 어플리케이션 결정부(400)는 데이터 수신부(410), 제3 데이터베이스(DB3)(420), 비율 계산부(430), 연관도 분석부(440), 및 연관 어플리케이션 선택부(450)를 포함할 수 있다.7, the associated
도 8은 도 2의 복수의 어플리케이션들 중에서 목표 어플리케이션과 높은 연관도를 갖는 연관 어플리케이션들의 목록을 획득하는 단계(S400)의 일 예를 나타내는 순서도이다.FIG. 8 is a flowchart illustrating an example of acquiring a list of associated applications having a high degree of association with a target application (S400) among the plurality of applications of FIG.
도 8에 도시된 복수의 어플리케이션들 중에서 목표 어플리케이션과 높은 연관도를 갖는 연관 어플리케이션들의 목록을 획득하는 단계(S400)는 도 7에 도시된 연관 어플리케이션 결정부(400)를 통해 수행될 수 있다.The step S400 of acquiring a list of related applications having a high degree of association with the target application among the plurality of applications shown in FIG. 8 may be performed through the associated
이하, 도 7 및 8을 참조하여 연관 어플리케이션 결정부(400)가 다양한 사용자들이 사용하는 복수의 모바일 단말기들(30)에 설치된 어플리케이션들의 설치 패턴을 분석하여 상기 목표 어플리케이션과 높은 연관도를 갖는 연관 어플리케이션들의 목록(CORR_APPs)을 결정하는 방법의 일 예에 대해 상세히 설명한다.7 and 8, the associated
복수의 모바일 단말기들(30) 각각은 고유한 식별 아이디를 내부적으로 저장할 수 있다.Each of the plurality of
일 실시예에 있어서, 상기 식별 아이디는 광고에 활용하기 위한 목적으로 모바일 단말기들마다 고유하게 부여된 광고 아이디(Advertising ID, ADID)일 수 있다.In one embodiment, the identification ID may be an advertisement ID (ADID) uniquely assigned to each mobile terminal for the purpose of utilizing the advertisement.
복수의 모바일 단말기들(30) 각각은 다양한 종류의 어플리케이션들을 어플리케이션 마켓(20)으로부터 다운로드하여 설치하고, 상기 설치된 어플리케이션들을 실행할 수 있다.Each of the plurality of
복수의 모바일 단말기들(30) 각각은 복수의 모바일 단말기들(30) 각각의 상기 식별 아이디 및 복수의 모바일 단말기들(30) 각각에 설치된 모든 어플리케이션들의 목록을 포함하는 설치 로그 데이터(I_LOG)를 연관 어플리케이션 결정부(400)로 전송할 수 있다.Each of the plurality of
일 실시예에 있어서, 복수의 모바일 단말기들(30) 각각에 설치된 어플리케이션들 중의 적어도 하나는 설치 로그 데이터 전송 모듈을 포함할 수 있다.In one embodiment, at least one of the applications installed in each of the plurality of
예를 들어, 어플리케이션 마켓(20)에 등록된 상기 복수의 어플리케이션들 중에서 미리 약정된 어플리케이션들은 상기 설치 로그 데이터 전송 모듈을 미리 포함할 수 있다.For example, applications that are prearranged among the plurality of applications registered in the
모바일 단말기(30)가 어플리케이션 마켓(20)으로부터 상기 미리 약정된 어플리케이션을 다운로드하여 설치하는 경우, 상기 설치 로그 데이터 전송 모듈도 모바일 단말기(30)에 함께 설치될 수 있다.When the
이후, 모바일 단말기(30)에서 상기 약정된 어플리케이션이 실행될 때마다, 상기 설치 로그 데이터 전송 모듈이 모바일 단말기(30)에서 자동으로 실행되어 모바일 단말기(30)의 상기 식별 아이디 및 모바일 단말기(30)에 설치된 어플리케이션들의 목록을 포함하는 설치 로그 데이터(I_LOG)를 연관 어플리케이션 결정부(400)로 전송할 수 있다.The install log data transfer module is automatically executed in the
도 9는 도 7에 도시된 복수의 모바일 단말기들 각각으로부터 연관 어플리케이션 결정부로 전송되는 설치 로그 데이터의 일 예를 나타내는 도면이다.9 is a diagram illustrating an example of installation log data transmitted from each of a plurality of mobile terminals shown in FIG. 7 to an associated application determination unit.
도 9를 참조하면, 설치 로그 데이터(I_LOG)는 모바일 단말기(30)의 식별 아이디(ADID) 및 모바일 단말기(30)에 설치된 어플리케이션들의 목록(APP_LIST)을 포함하는 반정형 데이터(semi-structured data)일 수 있다.9, the installation log data I_LOG includes semi-structured data including an identification ID (ADID) of the
실시예에 따라서, 설치 로그 데이터(I_LOG)는 전송 날짜, 모바일 단말기(30)의 IP(Internet Protocol) 주소, 및 모바일 단말기(30)의 모델명을 더 포함할 수 있다.According to the embodiment, the installation log data I_LOG may further include a transmission date, an Internet Protocol (IP) address of the
한편, 도 7에서 복수의 모바일 단말기들(30) 각각은 스마트폰(smart phone)인 것으로 도시되어 있으나, 본 발명은 이에 한정되지 않는다. 실시예에 따라서 복수의 모바일 단말기들(30) 각각은 태블릿 컴퓨터(tablet computer), 휴대폰(mobile phone), 개인 정보 단말기(personal digital assistant; PDA), 등과 같은 휴대 가능한 임의의 모바일 단말기일 수 있다.In FIG. 7, each of the plurality of
다시 도 7 및 8을 참조하면, 연관 어플리케이션 결정부(400)에 포함되는 데이터 수신부(410)는 복수의 모바일 단말기들(30)로부터 복수의 모바일 단말기들(30) 각각의 식별 아이디(ADID) 및 복수의 모바일 단말기들(30) 각각에 설치된 어플리케이션들의 목록(APP_LIST)을 포함하는 설치 로그 데이터(I_LOG)를 수신하여 제3 데이터베이스(420)에 저장할 수 있다(단계 S410).7 and 8, the
도 10은 도 7의 연관 어플리케이션 결정부에 포함되는 제3 데이터베이스의 일 예를 나타내는 도면이다.10 is a diagram showing an example of a third database included in the associated application determination unit of FIG.
도 10을 참조하면, 제3 데이터베이스(420)는 식별 아이디 필드(ADID_F) 및 어플리케이션 목록 필드(APP_LIST_F)를 포함할 수 있다.Referring to FIG. 10, the
데이터 수신부(410)가 복수의 모바일 단말기들(30) 각각으로부터 설치 로그 데이터(I_LOG)를 수신하는 경우, 설치 로그 데이터(I_LOG)에 포함되는 식별 아이디(ADID)는 제3 데이터베이스(420)의 식별 아이디 필드(ADID_F)에 저장하고, 설치 로그 데이터(I_LOG)에 포함되는 어플리케이션들의 목록(APP_LIST)은 제3 데이터베이스(420)의 어플리케이션 목록 필드(APP_LIST_F)에 저장할 수 있다.When the
도 10에는 예시적으로 식별 아이디(ADID)가 ADID1에 상응하는 모바일 단말기(30)에는 APP1, APP3, APP5 등의 어플리케이션들이 설치되어 있고, 식별 아이디(ADID)가 ADID2에 상응하는 모바일 단말기(30)에는 APP2, APP3, APP6 등의 어플리케이션들이 설치되어 있는 것을 나타낸다.10 shows an example in which applications such as APP1, APP3 and APP5 are installed in the
다시 도 7 및 8을 참조하면, 연관 어플리케이션 결정부(400)에 포함되는 비율 계산부(430)는 제1 데이터베이스(300)에 저장된 상기 복수의 어플리케이션들 중에서 목표 어플리케이션을 선택할 수 있다(단계 S300).7 and 8, the
예를 들어, 도 1에 도시된 바와 같이, 비율 계산부(430)는 제1 데이터베이스(300)에 저장된 어플리케이션의 명칭들(APP_N) 중의 하나를 선택하여 상기 목표 어플리케이션의 명칭(T_APP_N)으로서 독출할 수 있다.For example, as shown in FIG. 1, the
또한, 비율 계산부(430)는 상기 목표 어플리케이션과의 연관도를 분석할 제1 내지 제k 어플리케이션들을 결정할 수 있다. 여기서, k는 양의 정수를 나타낸다.Also, the
일 실시예에 있어서, 비율 계산부(430)는 제1 데이터베이스(300)에 저장된 상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션을 제외한 나머지 어플리케이션들을 상기 제1 내지 제k 어플리케이션들로 결정할 수 있다.In one embodiment, the
다른 실시예에 있어서, 비율 계산부(430)는 제3 데이터베이스(420)에 저장된 모든 어플리케이션들 중에서 상기 목표 어플리케이션을 제외한 나머지 어플리케이션들을 상기 제1 내지 제k 어플리케이션들로 결정할 수 있다.In another embodiment, the
이후, 비율 계산부(430)는 제3 데이터베이스(420)에 저장된 복수의 모바일 단말기들(30)의 설치 로그 데이터(I_LOG)에 기초하여 복수의 모바일 단말기들(30) 중에서 상기 제1 내지 제k 어플리케이션들 각각이 설치된 모바일 단말기들(30)의 비율에 상응하는 제1 내지 제k 전체 비율들(T_RATE_1~T_RATE_k)을 결정할 수 있다(단계 S420).The
도 11은 도 8의 복수의 모바일 단말기들 중에서 제1 내지 제k 어플리케이션들 각각이 설치된 모바일 단말기들의 비율에 상응하는 제1 내지 제k 전체 비율들을 결정하는 단계(S420)의 일 예를 나타내는 순서도이다.11 is a flowchart showing an example of a step S420 of determining the first to k-th overall ratios corresponding to the ratios of the mobile terminals in which the first to k-th applications are installed among the plurality of mobile terminals in Fig. 8 .
도 11을 참조하면, 비율 계산부(430)는 제3 데이터베이스(420)에 저장된 복수의 모바일 단말기들(30)의 설치 로그 데이터(I_LOG)에 기초하여 복수의 모바일 단말기들(30)에 상응하는 식별 아이디들(ADID)의 개수를 전체 개수로 결정할 수 있다(단계 S421).11, the
상술한 바와 같이, 식별 아이디(ADID)는 모바일 단말기들마다 고유하게 부여된 식별값이므로, 상기 전체 개수는 복수의 모바일 단말기들(30)의 총 개수에 상응할 수 있다.As described above, since the identification ID (ADID) is an identification value uniquely assigned to mobile terminals, the total number may correspond to the total number of the plurality of
또한, 비율 계산부(430)는 제3 데이터베이스(420)에 저장된 복수의 모바일 단말기들(30)의 설치 로그 데이터(I_LOG)에 기초하여 상기 제j 어플리케이션이 설치된 모바일 단말기들(30)에 상응하는 식별 아이디들(ADID)의 개수를 제j 설치 개수로 결정할 수 있다(단계 S423). 여기서, j는 1 이상 k 이하의 임의의 양의 정수를 나타낸다.The
따라서 상기 제j 설치 개수는 복수의 모바일 단말기들(30) 중에서 상기 제j 어플리케이션이 설치된 모바일 단말기들(30)의 개수에 상응할 수 있다.Therefore, the number of the j-th installation may correspond to the number of the
이후, 비율 계산부(430)는 상기 제j 설치 개수를 상기 전체 개수로 나눈 값을 제j 전체 비율(T_RATE_j)로 결정할 수 있다(단계 S425).Then, the
따라서 제j 전체 비율(T_RATE_j)은 복수의 모바일 단말기들(30) 중에서 상기 제j 어플리케이션이 설치된 모바일 단말기들(30)의 비율을 나타낼 수 있다.Therefore, the j-th overall ratio T_RATE_j may represent the proportion of the
비율 계산부(430)는 상기 제1 내지 제k 어플리케이션들 각각에 대해 상술한 단계들(S423 및 S425)을 반복적으로 수행함으로써 복수의 모바일 단말기들(30) 중에서 상기 제1 내지 제k 어플리케이션들 각각이 설치된 모바일 단말기들(30)의 비율에 상응하는 제1 내지 제k 전체 비율들(T_RATE_1~T_RATE_k)을 결정할 수 있다.The
다시 도 7 및 8을 참조하면, 비율 계산부(430)는 제3 데이터베이스(420)에 저장된 복수의 모바일 단말기들(30)의 설치 로그 데이터(I_LOG)에 기초하여 상기 목표 어플리케이션이 설치된 모바일 단말기들(30) 중에서 상기 제1 내지 제k 어플리케이션들 각각이 설치된 모바일 단말기들(30)의 비율에 상응하는 제1 내지 제k 교차 비율들(I_RATE_1~I_RATE_k)을 결정할 수 있다(단계 S430).Referring to FIGS. 7 and 8 again, the
도 12는 도 8의 목표 어플리케이션이 설치된 모바일 단말기들 중에서 제1 내지 제k 어플리케이션들 각각이 설치된 모바일 단말기들의 비율에 상응하는 제1 내지 제k 교차 비율들을 결정하는 단계(S430)의 일 예를 나타내는 순서도이다.12 shows an example of a step (S430) of determining first to kth intersection ratios corresponding to ratios of mobile terminals in which each of the first to k-th applications among the mobile terminals in which the target application of Fig. 8 is installed It is a flowchart.
도 12를 참조하면, 비율 계산부(430)는 제3 데이터베이스(420)에 저장된 복수의 모바일 단말기들(30)의 설치 로그 데이터(I_LOG)에 기초하여 상기 목표 어플리케이션이 설치된 모바일 단말기들(30)에 상응하는 식별 아이디들(ADID)의 개수를 목표 설치 개수로 결정할 수 있다(단계 S431).12, the
따라서 상기 목표 설치 개수는 복수의 모바일 단말기들(30) 중에서 상기 목표 어플리케이션이 설치된 모바일 단말기들(30)의 개수에 상응할 수 있다.Therefore, the target installation number may correspond to the number of the
또한, 비율 계산부(430)는 제3 데이터베이스(420)에 저장된 복수의 모바일 단말기들(30)의 설치 로그 데이터(I_LOG)에 기초하여 상기 목표 어플리케이션과 상기 제j 어플리케이션이 함께 설치된 모바일 단말기들(30)에 상응하는 식별 아이디들(ADID)의 개수를 제j 교차 개수로 결정할 수 있다(단계 S433).The
따라서 상기 제j 교차 개수는 복수의 모바일 단말기들(30) 중에서 상기 목표 어플리케이션과 상기 제j 어플리케이션이 함께 설치된 모바일 단말기들(30)의 개수에 상응할 수 있다.Therefore, the number of the j-th intersection may correspond to the number of the
이후, 비율 계산부(430)는 상기 제j 교차 개수를 상기 목표 설치 개수로 나눈 값을 제j 교차 비율(I_RATE_j)로 결정할 수 있다(단계 S435).Then, the
따라서 제j 교차 비율(I_RATE_j)은 상기 목표 어플리케이션이 설치된 모바일 단말기들(30) 중에서 상기 제j 어플리케이션이 설치된 모바일 단말기들(30)의 비율을 나타낼 수 있다.Therefore, the j-th intersection ratio I_RATE_j may indicate the ratio of the
비율 계산부(430)는 상기 제1 내지 제k 어플리케이션들 각각에 대해 상술한 단계들(S433 및 S435)을 반복적으로 수행함으로써 상기 목표 어플리케이션이 설치된 모바일 단말기들(30) 중에서 상기 제1 내지 제k 어플리케이션들 각각이 설치된 모바일 단말기들(30)의 비율에 상응하는 제1 내지 제k 교차 비율들(I_RATE_1~I_RATE_k)을 결정할 수 있다.The
이후, 비율 계산부(430)는 제1 내지 제k 전체 비율들(T_RATE_1~T_RATE_k) 및 제1 내지 제k 교차 비율들(I_RATE_1~I_RATE_k)을 연관도 분석부(440)에 제공할 수 있다.The
다시 도 7 및 8을 참조하면, 연관 어플리케이션 결정부(400)에 포함되는 연관도 분석부(440)는 제1 내지 제k 전체 비율들(T_RATE_1~T_RATE_k) 및 제1 내지 제k 교차 비율들(I_RATE_1~I_RATE_k)에 기초하여 상기 목표 어플리케이션과 상기 제1 내지 제k 어플리케이션들 각각 사이의 연관도를 나타내는 제1 내지 제k 연관 지수들(RI_1~RI_k)을 결정할 수 있다(단계 S440).7 and 8, the
상술한 바와 같이, 제j 전체 비율(T_RATE_j)은 복수의 모바일 단말기들(30) 중에서 상기 제j 어플리케이션이 설치된 모바일 단말기들(30)의 비율을 나타내고, 제j 교차 비율(I_RATE_j)은 상기 목표 어플리케이션이 설치된 모바일 단말기들(30) 중에서 상기 제j 어플리케이션이 설치된 모바일 단말기들(30)의 비율을 나타내므로, 제j 교차 비율(I_RATE_j)이 제j 전체 비율(T_RATE_j)보다 큰 경우 상기 목표 어플리케이션과 상기 제j 어플리케이션 사이에 연관성(correlation)이 존재하고, 제j 교차 비율(I_RATE_j)이 제j 전체 비율(T_RATE_j)보다 작은 경우 상기 목표 어플리케이션과 상기 제j 어플리케이션 사이에 반연관성(inverse correlation)이 존재할 수 있다.As described above, the j-th overall ratio T_RATE_j indicates the proportion of the
여기서, 상기 목표 어플리케이션과 상기 제j 어플리케이션 사이에 연관성(correlation)이 존재한다는 것은 상기 제j 어플리케이션의 평균적인 설치 비율에 비해 상기 목표 어플리케이션이 설치된 모바일 단말기들(30) 중에서 상기 제j 어플리케이션이 설치된 비율이 더 크다는 것을 의미하고, 상기 목표 어플리케이션과 상기 제j 어플리케이션 사이에 반연관성(inverse correlation)이 존재한다는 것은 상기 제j 어플리케이션의 평균적인 설치 비율에 비해 상기 목표 어플리케이션이 설치된 모바일 단말기들(30) 중에서 상기 제j 어플리케이션이 설치된 비율이 더 작다는 것을 의미한다.Here, the presence of correlation between the target application and the j-th application means that a ratio of the installed rate of the j-th application among the
일 실시예에 있어서, 연관도 분석부(440)는 상기 목표 어플리케이션과 상기 제j 어플리케이션 사이에 연관성(correlation)이 존재하는 경우, 제j 연관 지수(RI_j)가 양의 값을 갖도록 제j 연관 지수(RI_j)를 결정하고, 상기 목표 어플리케이션과 상기 제j 어플리케이션 사이에 반연관성(inverse correlation)이 존재하는 경우, 제j 연관 지수(RI_j)가 음의 값을 갖도록 제j 연관 지수(RI_j)를 결정할 수 있다.In one embodiment, when there is a correlation between the target application and the j-th application, the
구체적으로, 연관도 분석부(440)는 상기 목표 어플리케이션과 상기 제j 어플리케이션 사이의 연관성(correlation)이 높을수록 제j 연관 지수(RI_j)가 양의 값을 가지면서 상대적으로 큰 절대값을 갖도록 제j 연관 지수(RI_j)를 결정하고, 상기 목표 어플리케이션과 상기 제j 어플리케이션 사이의 반연관성(inverse correlation)이 높을수록 제j 연관 지수(RI_j)가 음의 값을 가지면서 상대적으로 큰 절대값을 갖도록 제j 연관 지수(RI_j)를 결정할 수 있다.Specifically, the
이하, 연관도 분석부(440)가 제1 내지 제k 전체 비율들(T_RATE_1~T_RATE_k) 및 제1 내지 제k 교차 비율들(I_RATE_1~I_RATE_k)에 기초하여 상기 목표 어플리케이션과 상기 제1 내지 제k 어플리케이션들 각각 사이의 연관도를 나타내는 제1 내지 제k 연관 지수들(RI_1~RI_k)을 결정하는 다양한 실시예들에 대해 설명한다.Hereinafter, the
일 실시예에 있어서, 연관도 분석부(440)는 제1 내지 제k 전체 비율들(T_RATE_1~T_RATE_k) 각각과 제1 내지 제k 교차 비율들(I_RATE_1~I_RATE_k) 각각 사이의 차이에 기초하여 제1 내지 제k 연관 지수들(RI_1~RI_k)을 결정할 수 있다.In one embodiment, the
예를 들어, 연관도 분석부(440)는 아래의 [수학식 1]에 기초하여 제1 내지 제k 연관 지수들(RI_1~RI_k)을 결정할 수 있다.For example, the
[수학식 1][Equation 1]
여기서, j는 k 이하의 양의 정수를 나타내고, RI_j는 상기 제j 연관 지수를 나타내고, I_RATE_j는 상기 제j 교차 비율을 나타내고, T_RATE_j는 상기 제j 전체 비율을 나타낸다.J denotes a positive integer equal to or less than k, RI_j denotes the j-th association index, I_RATE_j denotes the j-th intersection ratio, and T_RATE_j denotes the j-th total ratio.
연관도 분석부(440)가 상기 [수학식 1]에 기초하여 제1 내지 제k 연관 지수들(RI_1~RI_k)을 결정하는 경우, 제j 연관 지수(RI_j)는 상기 목표 어플리케이션이 설치된 모바일 단말기들(30) 중에서 상기 제j 어플리케이션이 설치된 모바일 단말기들(30)의 비율과 복수의 모바일 단말기들(30) 중에서 상기 제j 어플리케이션이 설치된 모바일 단말기들(30)의 비율의 차이를 그대로 나타내므로, 제j 연관 지수(RI_j)는 상기 목표 어플리케이션과 상기 제j 어플리케이션 사이의 연관성(correlation) 또는 반연관성(inverse correlation)을 객관적으로 나타낼 수 있다.When the
이와 같이, 본 발명의 실시예들에 따른 연관 어플리케이션 결정부(400)는 복수의 모바일 단말기들(30)의 사용자들의 상기 제1 내지 제k 어플리케이션들에 대한 주관적인 선호도 평가에 대한 고려 없이, 복수의 모바일 단말기들(30)에 설치된 어플리케이션들의 목록(APP_LIST)에 기초하여 상기 목표 어플리케이션과 상기 제1 내지 제k 어플리케이션들 각각 사이의 연관도를 추정하여 제1 내지 제k 연관 지수들(RI_1~RI_k)을 결정할 수 있다.As described above, the associated
따라서 연관 어플리케이션 결정부(400)는 어플리케이션들 사이의 연관도 분석의 객관성 및 정확성을 효과적으로 향상시킬 수 있다.Therefore, the associated
다른 실시예에 있어서, 연관도 분석부(440)는 제1 내지 제k 전체 비율들(T_RATE_1~T_RATE_k) 각각에 대한 제1 내지 제k 교차 비율들(I_RATE_1~I_RATE_k) 각각의 비율에 기초하여 제1 내지 제k 연관 지수들(RI_1~RI_k)을 결정할 수 있다.In another embodiment, the
예를 들어, 연관도 분석부(440)는 아래의 [수학식 2]에 기초하여 제1 내지 제k 연관 지수들(RI_1~RI_k)을 결정할 수 있다.For example, the
[수학식 2]&Quot; (2) "
여기서, j는 k 이하의 양의 정수를 나타내고, RI_j는 상기 제j 연관 지수를 나타내고, I_RATE_j는 상기 제j 교차 비율을 나타내고, T_RATE_j는 상기 제j 전체 비율을 나타낸다.J denotes a positive integer equal to or less than k, RI_j denotes the j-th association index, I_RATE_j denotes the j-th intersection ratio, and T_RATE_j denotes the j-th total ratio.
연관도 분석부(440)가 상기 [수학식 2]에 기초하여 제1 내지 제k 연관 지수들(RI_1~RI_k)을 결정하는 경우, 제j 연관 지수(RI_j)는 제j 전체 비율(T_RATE_j)과 제j 교차 비율(I_RATE_j) 사이의 비율에 기초하여 결정되므로, 제j 전체 비율(T_RATE_j)과 제j 교차 비율(I_RATE_j)의 크기가 서로 비슷한 경우에도 제j 연관 지수(RI_j)는 상기 목표 어플리케이션과 상기 제j 어플리케이션 사이의 연관성(correlation) 또는 반연관성(inverse correlation)을 효과적으로 나타낼 수 있다.The
또한, 상기 목표 어플리케이션의 평균적인 설치 비율이 상대적으로 작은 경우, 제j 전체 비율(T_RATE_j)과 제j 교차 비율(I_RATE_j)의 크기는 모두 상대적으로 작은 값을 가질 수 있다. 이러한 경우에도, 연관도 분석부(440)가 상기 [수학식 2]에 기초하여 제1 내지 제k 연관 지수들(RI_1~RI_k)을 결정하는 경우, 제j 연관 지수(RI_j)는 제j 전체 비율(T_RATE_j)과 제j 교차 비율(I_RATE_j) 사이의 비율에 기초하여 결정되므로, 본 발명의 실시예들에 따른 연관 어플리케이션 결정부(400)는 어플리케이션들 사이의 연관도 분석의 정확성을 효과적으로 향상시킬 수 있다.Also, when the average installation rate of the target application is relatively small, the size of the jth total ratio (T_RATE_j) and the jth intersection ratio (I_RATE_j) may be relatively small. In this case also, when the
또 다른 실시예에 있어서, 연관도 분석부(440)는 제1 내지 제k 전체 비율들(T_RATE_1~T_RATE_k) 각각과 제1 내지 제k 교차 비율들(I_RATE_1~I_RATE_k) 각각 사이의 차이 및 제1 내지 제k 전체 비율들(T_RATE_1~T_RATE_k) 각각에 대한 제1 내지 제k 교차 비율들(I_RATE_1~I_RATE_k) 각각의 비율에 기초하여 제1 내지 제k 연관 지수들(RI_1~RI_k)을 결정할 수 있다.In another embodiment, the
예를 들어, 연관도 분석부(440)는 아래의 [수학식 3]에 기초하여 제1 내지 제k 연관 지수들(RI_1~RI_k)을 결정할 수 있다.For example, the
[수학식 3]&Quot; (3) "
여기서, j는 k 이하의 양의 정수를 나타내고, RI_j는 상기 제j 연관 지수를 나타내고, I_RATE_j는 상기 제j 교차 비율을 나타내고, T_RATE_j는 상기 제j 전체 비율을 나타내고, ABS()는 절대값 연산을 나타내고, A_DIFF_j는 제j 절대 비율 차이를 나타내고, R_DIFF_j는 제j 상대 비율 차이를 나타낸다.J represents a positive integer equal to or less than k, RI_j represents the j-th association index, I_RATE_j represents the j-th intersection ratio, T_RATE_j represents the j-th total ratio, ABS A_DIFF_j represents a j-th absolute ratio difference, and R_DIFF_j represents a j-th relative ratio difference.
상기 [수학식 1], 상기 [수학식 2], 및 상기 [수학식 3]을 비교하면, 제j 절대 비율 차이(A_DIFF_j)는 상기 [수학식 1]에 따른 제j 연관 지수(RI_j)와 동일하고, 제j 상대 비율 차이(R_DIFF_j)는 상기 [수학식 2]에 따른 제j 연관 지수(RI_j)와 동일하다. 따라서, 제j 절대 비율 차이(A_DIFF_j) 및 제j 상대 비율 차이(R_DIFF_j)에 대한 중복되는 설명은 생략한다.When comparing the above-mentioned Equations (1), (2) and (3), the j-th absolute ratio difference A_DIFF_j can be calculated by using the j-th association index RI_j And the j-th relative ratio difference R_DIFF_j is equal to the j-th association index RI_j according to Equation (2). Therefore, redundant description of the j-th absolute rate difference A_DIFF_j and the j-th relative rate difference R_DIFF_j will be omitted.
상기 [수학식 3]을 참조하면, 제j 절대 비율 차이(A_DIFF_j), 제j 상대 비율 차이(R_DIFF_j), 및 제j 연관 지수(RI_j)는 서로 동일한 부호를 가지므로, 연관도 분석부(440)가 상기 [수학식 3]에 기초하여 제1 내지 제k 연관 지수들(RI_1~RI_k)을 결정하는 경우, 제j 연관 지수(RI_j)는 제j 절대 비율 차이(A_DIFF_j)와 제j 상대 비율 차이(R_DIFF_j)의 기하 평균에 상응할 수 있다.Referring to Equation (3), since the j-th absolute rate difference A_DIFF_j, the j-th relative rate difference R_DIFF_j, and the j-th related index RI_j have the same sign, ) Determines the first to k-th related indexes RI_1 to RI_k based on the above-described Equation (3), the j-th association index RI_j is a sum of the j-th absolute rate difference A_DIFF_j and the j- May correspond to the geometric mean of the difference R_DIFF_j.
따라서 상기 [수학식 3]에 따른 제j 연관 지수(RI_j)는 제j 절대 비율 차이(A_DIFF_j)가 갖는 상기 목표 어플리케이션과 상기 제j 어플리케이션 사이의 연관도 분석의 장점과 제j 상대 비율 차이(R_DIFF_j)가 갖는 상기 목표 어플리케이션과 상기 제j 어플리케이션 사이의 연관도 분석의 장점을 모두 가질 수 있다.Therefore, the j-th relevance index RI_j according to Equation (3) is the sum of the advantages of the association analysis between the target application and the j-th application in the j-th absolute rate difference A_DIFF_j and the j- ) May have all of the advantages of analyzing the association between the target application and the j-th application.
따라서 본 발명의 실시예들에 따른 연관 어플리케이션 결정부(400)는 어플리케이션들 사이의 연관도 분석의 객관성 및 정확성을 더욱 효과적으로 향상시킬 수 있다.Therefore, the associated
또 다른 실시예에 있어서, 연관도 분석부(440)는 제1 내지 제k 전체 비율들(T_RATE_1~T_RATE_k) 각각과 제1 내지 제k 교차 비율들(I_RATE_1~I_RATE_k) 각각 사이의 차이, 제1 내지 제k 전체 비율들(T_RATE_1~T_RATE_k) 각각에 대한 제1 내지 제k 교차 비율들(I_RATE_1~I_RATE_k) 각각의 비율, 및 0보다 크고 1보다 작은 값을 갖는 가중치에 기초하여 제1 내지 제k 연관 지수들(RI_1~RI_k)을 결정할 수 있다.In another embodiment, the
예를 들어, 연관도 분석부(440)는 아래의 [수학식 4]에 기초하여 제1 내지 제k 연관 지수들(RI_1~RI_k)을 결정할 수 있다.For example, the
[수학식 4]&Quot; (4) "
여기서, j는 k 이하의 양의 정수를 나타내고, RI_j는 상기 제j 연관 지수를 나타내고, I_RATE_j는 상기 제j 교차 비율을 나타내고, T_RATE_j는 상기 제j 전체 비율을 나타내고, wt는 상기 가중치를 나타내고, ABS()는 절대값 연산을 나타내고, A_DIFF_j는 제j 절대 비율 차이를 나타내고, R_DIFF_j는 제j 상대 비율 차이를 나타낸다.J denotes a positive integer equal to or less than k, RI_j denotes the j-th association index, I_RATE_j denotes the j-th intersection ratio, T_RATE_j denotes the j-th overall ratio, wt denotes the weight, ABS () represents an absolute value operation, A_DIFF_j represents a j-th absolute ratio difference, and R_DIFF_j represents a j-th relative ratio difference.
일 실시예에 있어서, 연관도 분석부(440)는 외부로부터의 입력을 통해 가중치(wt)를 획득할 수 있다.In one embodiment, the
다른 실시예에 있어서, 연관도 분석부(440)는 내부적으로 미리 저장된 가중치(wt)를 독출함으로써 가중치(wt)를 획득할 수 있다.In an alternative embodiment, the
상기 [수학식 3]과 상기 [수학식 4]를 비교하면, 상기 [수학식 4]에 따른 제j 연관 지수(RI_j)는 가중치(wt)를 적용한 제j 절대 비율 차이(A_DIFF_j)와 제j 상대 비율 차이(R_DIFF_j)의 가중 기하 평균에 상응할 수 있다.The j-th relevance index RI_j according to Equation (4) can be calculated by substituting the j-th absolute ratio difference A_DIFF_j applying the weight wt and the j- May correspond to the weighted geometric mean of the relative ratio difference R_DIFF_j.
따라서 상기 [수학식 4]에 따른 제j 연관 지수(RI_j)는 제j 절대 비율 차이(A_DIFF_j)가 갖는 상기 목표 어플리케이션과 상기 제j 어플리케이션 사이의 연관도 분석의 장점과 제j 상대 비율 차이(R_DIFF_j)가 갖는 상기 목표 어플리케이션과 상기 제j 어플리케이션 사이의 연관도 분석의 장점을 모두 가질 수 있다.Therefore, the j-th relevance index RI_j according to Equation (4) can be calculated by taking advantage of the degree of association analysis between the target application and the j-th application possessed by the j-th absolute rate difference A_DIFF_j, ) May have all of the advantages of analyzing the association between the target application and the j-th application.
또한, 가중치(wt)의 값을 조절함으로써 제j 절대 비율 차이(A_DIFF_j)가 제j 연관 지수(RI_j)에 미치는 영향과 제j 상대 비율 차이(R_DIFF_j)가 제j 연관 지수(RI_j)에 미치는 영향은 조절될 수 있다.The influence of the j-th absolute ratio difference A_DIFF_j on the j-th relevance index RI_j and the influence of the j-th relative ratio difference R_DIFF_j on the j-th relevance index RI_j by adjusting the values of the weights wT Can be adjusted.
따라서 본 발명의 실시예들에 따른 연관 어플리케이션 결정부(400)는 상기 목표 어플리케이션의 특성에 따라 가중치(wt)의 값을 조절함으로써 어플리케이션들 사이의 연관도 분석의 정확성을 더욱 향상시킬 수 있다.Therefore, the associated
다시 도 7 및 8을 참조하면, 연관 어플리케이션 결정부(400)에 포함되는 연관 어플리케이션 선택부(450)는 상기 목표 어플리케이션과 상기 제1 내지 제k 어플리케이션들 각각 사이의 연관도를 나타내는 제1 내지 제k 연관 지수들(RI_1~RI_k)의 크기를 비교하여, 상기 제1 내지 제k 어플리케이션들 중에서 상대적으로 높은 연관 지수를 갖는 어플리케이션들을 상기 목표 어플리케이션에 대한 상기 연관 어플리케이션들로 결정할 수 있다(단계 S450).Referring again to FIGS. 7 and 8, the associated
일 실시예에 있어서, 연관 어플리케이션 선택부(450)는 상기 제1 내지 제k 어플리케이션들 중에서 연관 지수가 높은 순서대로 미리 정해진 개수의 어플리케이션들을 상기 연관 어플리케이션들로 결정할 수 있다.In one embodiment, the associated
다른 실시예에 있어서, 연관 어플리케이션 선택부(450)는 상기 제1 내지 제k 어플리케이션들 중에서 문턱값보다 높은 연관 지수를 갖는 어플리케이션들을 상기 연관 어플리케이션들로 결정할 수 있다.In another embodiment, the associated
이후, 연관 어플리케이션 선택부(450)는 상기 목표 어플리케이션에 대한 연관 어플리케이션들의 목록(CORR_APPs) 및 상기 목표 어플리케이션과 상기 연관 어플리케이션들 사이의 연관도를 나타내는 연관 지수들(RIs)을 키워드 분석부(500)에 제공할 수 있다.Then, the associated
이상, 도 5 내지 12를 참조하여, 연관 어플리케이션 결정부(400)가 상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션과 높은 연관도를 갖는 연관 어플리케이션들의 목록(CORR_APPs)을 획득하는 다양한 실시예들에 대해 설명하였으나, 본 발명은 이에 한정되지 않으며, 실시예들에 따라서 연관 어플리케이션 결정부(400)는 다양한 방식으로 상기 목표 어플리케이션과 높은 연관도를 갖는 연관 어플리케이션들의 목록(CORR_APPs)을 획득할 수 있다.5-12, description will be given of various embodiments in which the associated
다시 도 1 및 2를 참조하면, 키워드 분석부(500)는 연관 어플리케이션 결정부(400)로부터 상기 목표 어플리케이션에 대한 연관 어플리케이션들의 목록(CORR_APPs)을 수신할 수 있다.Referring again to FIGS. 1 and 2, the
또한, 실시예들에 따라서, 키워드 분석부(500)는 연관 어플리케이션 결정부(400)로부터 상기 목표 어플리케이션과 상기 연관 어플리케이션들 사이의 연관도를 나타내는 연관 지수들(RIs)을 더 수신할 수도 있다.In addition, according to embodiments, the
한편, 키워드 분석부(500)는 제1 데이터베이스(300)로부터 상기 목표 어플리케이션 및 상기 연관 어플리케이션들 각각의 키워드들(KW) 및 키워드들의 비중들(GV)을 독출할 수 있다(단계 S500).Meanwhile, the
이후, 키워드 분석부(500)는 상기 목표 어플리케이션의 키워드들(KW)과 상기 연관 어플리케이션들 각각의 키워드들(KW)을 비교하여, 상기 목표 어플리케이션의 키워드들(KW) 중에서 상기 연관 어플리케이션들의 키워드들(KW)과 중복되는 키워드들을 중복 키워드들로 결정하고, 상기 목표 어플리케이션의 키워드들(KW) 중에서 상기 중복 키워드가 아닌 키워드들을 비중복 키워드들로 결정할 수 있다(단계 S600).Thereafter, the
예를 들어, 키워드 분석부(500)는 상기 목표 어플리케이션의 키워드들(KW)과 상기 연관 어플리케이션들 중의 적어도 하나의 키워드들(KW)에 공통으로 포함되는 키워드들을 상기 중복 키워드들로 결정하고, 상기 목표 어플리케이션의 키워드들(KW) 중에서 상기 중복 키워드가 아닌 키워드들을 비중복 키워드들로 결정할 수 있다.For example, the
이후, 키워드 분석부(500)는 상기 목표 어플리케이션의 키워드들(KW)의 비중들(GV)과 상기 연관 어플리케이션들 각각의 상기 중복 키워드들의 비중들(GV)에 기초하여 상기 목표 어플리케이션의 키워드들(KW) 중에서 상기 목표 어플리케이션을 대표하는 대표 키워드들(REP_KWs)을 결정할 수 있다(단계 S700).The
도 13은 도 2의 목표 어플리케이션의 키워드들의 비중들과 연관 어플리케이션들 각각의 중복 키워드들의 비중들에 기초하여 상기 목표 어플리케이션의 상기 키워드들 중에서 상기 목표 어플리케이션을 대표하는 대표 키워드들을 결정하는 단계(S700)의 일 예를 나타내는 순서도이다.FIG. 13 is a flowchart illustrating a method of determining representative keywords representing the target application among the keywords of the target application (S700) based on the weight of the keywords of the target application of FIG. 2 and the weight of duplicate keywords of each of the associated applications; As shown in Fig.
도 13을 참조하면, 키워드 분석부(500)는 상기 목표 어플리케이션의 키워드들(KW) 중에서 상기 중복 키워드들 각각에 대하여, 상기 목표 어플리케이션의 상기 중복 키워드의 비중(GV)에 상기 연관 어플리케이션들 각각의 상기 중복 키워드의 비중(GV)을 가중치로 적용하여 상기 중복 키워드의 점수를 결정할 수 있다(단계 S710).Referring to FIG. 13, the
일 실시예에 있어서, 키워드 분석부(500)는 상기 연관 어플리케이션들의 상기 중복 키워드의 비중들(GV)의 합을 상기 목표 어플리케이션의 상기 중복 키워드의 비중(GV)과 합한 값을 상기 중복 키워드의 점수로 결정할 수 있다.In one embodiment, the
예를 들어, 상기 목표 어플리케이션의 제1 중복 키워드의 비중(GV)이 a1이고, 상기 연관 어플리케이션들 중에서 제1 내지 제3 연관 어플리케이션들이 상기 제1 중복 키워드를 포함하며, 상기 제1 연관 어플리케이션의 상기 제1 중복 키워드의 비중(GV)이 b1이고, 상기 제2 연관 어플리케이션의 상기 제1 중복 키워드의 비중(GV)이 b2이고, 상기 제3 연관 어플리케이션의 상기 제1 중복 키워드의 비중(GV)이 b3인 경우, 키워드 분석부(500)는 상기 목표 어플리케이션의 상기 제1 중복 키워드의 점수를 (a1+b1+b2+b3)로 결정할 수 있다.For example, if the specific gravity (GV) of the first duplicate keyword of the target application is a1, the first to third associated applications include the first duplicate keyword, The specific gravity GV of the first duplicate keyword is b1, the specific gravity GV of the first duplicate keyword of the second associated application is b2, and the specific gravity GV of the first duplicate keyword of the third related application is b3, the
한편, 키워드 분석부(500)는 상기 목표 어플리케이션의 키워드들(KW) 중에서 상기 비중복 키워드들 각각에 대하여, 상기 목표 어플리케이션의 상기 비중복 키워드의 비중(GV)을 그대로 상기 비중복 키워드의 점수로 결정할 수 있다(단계 S730).On the other hand, the
예를 들어, 상기 목표 어플리케이션의 제1 비중복 키워드의 비중이 c1이고, 상기 연관 어플리케이션들 중에서 상기 제1 비중복 키워드를 포함하는 연관 어플리케이션이 존재하지 않는 경우, 키워드 분석부(500)는 상기 목표 어플리케이션의 상기 제1 비중복 키워드의 점수를 c1로 결정할 수 있다.For example, if the weight of the first non-overlapping keyword of the target application is c1 and the associated application including the first non-overlapping keyword does not exist, the
상술한 바와 같은 방식으로 상기 목표 어플리케이션의 중복 키워드들 및 비중복 키워드들의 점수를 결정한 후, 키워드 분석부(500)는 상기 목표 어플리케이션의 키워드들(KW) 중에서 상대적으로 높은 점수를 갖는 키워드들을 상기 목표 어플리케이션을 대표하는 대표 키워드들(REP_KWs)로 결정할 수 있다(단계 S740).After determining the scores of the duplicate keywords and the non-overlapping keywords of the target application in the above-described manner, the
일 실시예에 있어서, 키워드 분석부(500)는 상기 목표 어플리케이션의 키워드들(KW) 중에서 점수가 높은 순서대로 미리 정해진 개수의 키워드들을 대표 키워드들(REP_KWs)로 결정할 수 있다.In one embodiment, the
다른 실시예에 있어서, 키워드 분석부(500)는 상기 목표 어플리케이션의 키워드들(KW) 중에서 문턱 점수보다 높은 점수를 갖는 키워드들을 대표 키워드들(REP_KWs)로 결정할 수 있다.In another embodiment, the
도 13을 참조하여 상술한 바와 같이, 본 발명의 실시예들에 따른 어플리케이션의 대표 키워드 결정 시스템(10)은 상기 목표 어플리케이션의 키워드들(KW)의 비중들(GV)뿐만 아니라, 상기 연관 어플리케이션들 각각의 상기 중복 키워드들의 비중들(GV)을 함께 고려하여 상기 목표 어플리케이션을 대표하는 대표 키워드들(REP_KWs)을 결정한다.As described above with reference to FIG. 13, the representative
따라서 본 발명의 실시예들에 따른 어플리케이션의 대표 키워드 결정 시스템(10) 및 어플리케이션의 대표 키워드 결정 방법은 어플리케이션의 특징을 효과적으로 나타내는 대표 키워드들(REP_KWs)을 정확하게 결정할 수 있다.Therefore, the representative
도 14는 도 2의 목표 어플리케이션의 키워드들의 비중들과 연관 어플리케이션들 각각의 중복 키워드들의 비중들에 기초하여 상기 목표 어플리케이션의 상기 키워드들 중에서 상기 목표 어플리케이션을 대표하는 대표 키워드들을 결정하는 단계(S700)의 다른 예를 나타내는 순서도이다.FIG. 14 is a flowchart illustrating a process of determining representative keywords representing the target application among the keywords of the target application (S700) based on the weight of the keywords of the target application of FIG. 2 and the weight of duplicate keywords of each of the related applications; Fig.
도 14를 참조하면, 키워드 분석부(500)는 상기 목표 어플리케이션의 키워드들(KW) 중에서 상기 중복 키워드들 각각에 대하여, 상기 목표 어플리케이션의 상기 중복 키워드의 비중(GV)에 상기 연관 어플리케이션들 각각의 상기 중복 키워드의 비중(GV) 및 상기 연관 어플리케이션들 각각의 연관 지수(RI)를 가중치로 적용하여 상기 중복 키워드의 점수를 결정할 수 있다(단계 S720).Referring to FIG. 14, the
일 실시예에 있어서, 키워드 분석부(500)는 상기 연관 어플리케이션들 각각의 상기 중복 키워드의 비중(GV)과 상기 연관 어플리케이션들 각각의 연관 지수(RI)의 곱을 상기 목표 어플리케이션의 상기 중복 키워드의 비중(GV)과 합한 값을 상기 중복 키워드의 점수로 결정할 수 있다.In one embodiment, the
예를 들어, 상기 목표 어플리케이션의 제1 중복 키워드의 비중(GV)이 a1이고, 상기 연관 어플리케이션들 중에서 제1 내지 제3 연관 어플리케이션들이 상기 제1 중복 키워드를 포함하며, 상기 제1 연관 어플리케이션의 상기 제1 중복 키워드의 비중(GV)이 b1이고, 상기 제1 연관 어플리케이션의 연관 지수(RI)가 r1이고, 상기 제2 연관 어플리케이션의 상기 제1 중복 키워드의 비중(GV)이 b2이고, 상기 제2 연관 어플리케이션의 연관 지수(RI)가 r2이고, 상기 제3 연관 어플리케이션의 상기 제1 중복 키워드의 비중(GV)이 b3이고, 상기 제3 연관 어플리케이션의 연관 지수(RI)가 r3인 경우, 키워드 분석부(500)는 상기 목표 어플리케이션의 상기 제1 중복 키워드의 점수를 (a1 + b1*r1 + b2*r2 + b3*r3)로 결정할 수 있다.For example, if the specific gravity (GV) of the first duplicate keyword of the target application is a1, the first to third associated applications include the first duplicate keyword, The specific weight (GV) of the first duplicate keyword is b1, the association index (RI) of the first associated application is r1, the specific gravity (GV) of the first duplicate keyword of the second associated application is b2, When the association index (RI) of the second associated application is r2, the specific gravity (GV) of the first duplicate keyword of the third associated application is b3, and the association index (RI) of the third associated application is r3, The
한편, 키워드 분석부(500)는 상기 목표 어플리케이션의 키워드들(KW) 중에서 상기 비중복 키워드들 각각에 대하여, 상기 목표 어플리케이션의 상기 비중복 키워드의 비중(GV)을 그대로 상기 비중복 키워드의 점수로 결정할 수 있다(단계 S730).On the other hand, the
예를 들어, 상기 목표 어플리케이션의 제1 비중복 키워드의 비중이 c1이고, 상기 연관 어플리케이션들 중에서 상기 제1 비중복 키워드를 포함하는 연관 어플리케이션이 존재하지 않는 경우, 키워드 분석부(500)는 상기 목표 어플리케이션의 상기 제1 비중복 키워드의 점수를 c1로 결정할 수 있다.For example, if the weight of the first non-overlapping keyword of the target application is c1 and the associated application including the first non-overlapping keyword does not exist, the
상술한 바와 같은 방식으로 상기 목표 어플리케이션의 중복 키워드들 및 비중복 키워드들의 점수를 결정한 후, 키워드 분석부(500)는 상기 목표 어플리케이션의 키워드들(KW) 중에서 상대적으로 높은 점수를 갖는 키워드들을 상기 목표 어플리케이션을 대표하는 대표 키워드들(REP_KWs)로 결정할 수 있다(단계 S740).After determining the scores of the duplicate keywords and the non-overlapping keywords of the target application in the above-described manner, the
도 14를 참조하여 상술한 바와 같이, 본 발명의 실시예들에 따른 어플리케이션의 대표 키워드 결정 시스템(10)은 상기 목표 어플리케이션의 키워드들(KW)의 비중들(GV)뿐만 아니라, 상기 연관 어플리케이션들 각각의 상기 중복 키워드들의 비중들(GV)과 상기 연관 어플리케이션들의 연관 지수들(RIs)을 함께 고려하여 상기 목표 어플리케이션을 대표하는 대표 키워드들(REP_KWs)을 결정한다.As described above with reference to FIG. 14, the representative
따라서 본 발명의 실시예들에 따른 어플리케이션의 대표 키워드 결정 시스템(10) 및 어플리케이션의 대표 키워드 결정 방법은 어플리케이션의 특징을 효과적으로 나타내는 대표 키워드들(REP_KWs)을 더욱 정확하게 결정할 수 있다.Therefore, the representative
도 15는 도 2의 목표 어플리케이션의 키워드들의 비중들과 연관 어플리케이션들 각각의 중복 키워드들의 비중들에 기초하여 상기 목표 어플리케이션의 상기 키워드들 중에서 상기 목표 어플리케이션을 대표하는 대표 키워드들을 결정하는 단계(S700)의 또 다른 예를 나타내는 순서도이다.FIG. 15 is a flowchart illustrating a process of determining representative keywords representing the target application among the keywords of the target application (S700) based on the weight of the keywords of the target application of FIG. 2 and the weight of duplicate keywords of each of the related applications; As shown in Fig.
도 15를 참조하면, 키워드 분석부(500)는 상기 목표 어플리케이션의 키워드들(KW)의 비중들(GV)과 상기 연관 어플리케이션들 각각의 상기 중복 키워드들의 비중들(GV)에 기초하여 상기 목표 어플리케이션의 키워드들(KW) 각각의 점수를 결정할 수 있다(단계 S701).Referring to FIG. 15, the
일 실시예에 있어서, 키워드 분석부(500)는 도 13을 참조하여 상술한 바와 같은 방법으로 상기 목표 어플리케이션의 상기 중복 키워드들 각각의 점수 및 상기 목표 어플리케이션의 상기 비중복 키워드들 각각의 점수를 결정할 수 있다.In one embodiment, the
다른 실시예에 있어서, 키워드 분석부(500)는 도 14를 참조하여 상술한 바와 같은 방법으로 상기 목표 어플리케이션의 상기 중복 키워드들 각각의 점수 및 상기 목표 어플리케이션의 상기 비중복 키워드들 각각의 점수를 결정할 수 있다.In another embodiment, the
이후, 키워드 분석부(500)는 제1 데이터베이스(300)에 저장된 상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션의 키워드들(KW) 각각과 중복되는 키워드를 포함하는 어플리케이션들의 개수에 기초하여 상기 목표 어플리케이션의 키워드들(KW) 각각의 보정 계수를 결정할 수 있다(단계 S750).Then, the
예를 들어, 키워드 분석부(500)는 제1 데이터베이스(300)에 저장된 상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션의 키워드(KW)와 동일한 키워드를 포함하는 어플리케이션들의 개수가 상대적으로 많은 경우, 상기 목표 어플리케이션의 키워드(KW)의 상기 보정 계수를 상대적으로 작은 값으로 결정하고, 제1 데이터베이스(300)에 저장된 상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션의 키워드(KW)와 동일한 키워드를 포함하는 어플리케이션들의 개수가 상대적으로 적은 경우, 상기 목표 어플리케이션의 키워드(KW)의 상기 보정 계수를 상대적으로 큰 값으로 결정할 수 있다.For example, if the number of applications having the same keyword as the keyword KW of the target application among the plurality of applications stored in the
이후, 키워드 분석부(500)는 상기 목표 어플리케이션의 키워드들(KW) 각각의 상기 점수에 상기 목표 어플리케이션의 키워드들(KW) 각각의 상기 보정 계수를 곱한 값을 상기 목표 어플리케이션의 키워드들(KW) 각각의 보정 점수로 결정하고(단계 S770), 상기 목표 어플리케이션의 키워드들(KW) 중에서 상대적으로 높은 보정 점수를 갖는 키워드들을 상기 목표 어플리케이션을 대표하는 대표 키워드들(REP_KWs)로 결정할 수 있다(단계 S780).Then, the
일반적으로 "권한", "결제" 등과 같이 다양한 어플리케이션들의 설명 자료(DS)에서 공통으로 사용되는 일반적인 단어들은 특정 어플리케이션의 특징이나 기능을 효과적으로 나타낼 수 없다.Generally, common words commonly used in DSs of various applications such as "authority "," settlement ", etc. can not effectively represent characteristics or functions of a specific application.
도 15를 참조하여 상술한 바와 같이, 본 발명의 실시예들에 따른 어플리케이션의 대표 키워드 결정 시스템(10)은 상기 보정 계수를 통해 "권한", "결제" 등과 같이 다양한 어플리케이션들의 설명 자료(DS)에서 공통으로 사용되는 일반적인 키워드의 점수를 감소시켜 상기 보정 점수를 결정하므로, 범용적인 키워드가 상기 목표 어플리케이션의 대표 키워드(REP_KWs)로 결정되는 것을 효과적으로 방지할 수 있다.As described above with reference to Fig. 15, the representative
따라서 본 발명의 실시예들에 따른 어플리케이션의 대표 키워드 결정 시스템(10) 및 어플리케이션의 대표 키워드 결정 방법은 어플리케이션의 특징을 효과적으로 나타내는 대표 키워드들(REP_KWs)을 더욱 정확하게 결정할 수 있다.Therefore, the representative
도 16은 도 2의 목표 어플리케이션의 키워드들의 비중들과 연관 어플리케이션들 각각의 중복 키워드들의 비중들에 기초하여 상기 목표 어플리케이션의 상기 키워드들 중에서 상기 목표 어플리케이션을 대표하는 대표 키워드들을 결정하는 단계(S700)의 또 다른 예를 나타내는 순서도이다.FIG. 16 is a flowchart illustrating a method of determining representative keywords representative of the target application among the keywords of the target application (S700) based on the weight of the keywords of the target application of FIG. 2 and the weight of duplicate keywords of each of the related applications; As shown in Fig.
도 16을 참조하면, 키워드 분석부(500)는 상기 목표 어플리케이션의 키워드들(KW)의 비중들(GV)과 상기 연관 어플리케이션들 각각의 상기 중복 키워드들의 비중들(GV)에 기초하여 상기 목표 어플리케이션의 키워드들(KW) 각각의 점수를 결정할 수 있다(단계 S701).Referring to FIG. 16, the
일 실시예에 있어서, 키워드 분석부(500)는 도 13을 참조하여 상술한 바와 같은 방법으로 상기 목표 어플리케이션의 상기 중복 키워드들 각각의 점수 및 상기 목표 어플리케이션의 상기 비중복 키워드들 각각의 점수를 결정할 수 있다.In one embodiment, the
다른 실시예에 있어서, 키워드 분석부(500)는 도 14를 참조하여 상술한 바와 같은 방법으로 상기 목표 어플리케이션의 상기 중복 키워드들 각각의 점수 및 상기 목표 어플리케이션의 상기 비중복 키워드들 각각의 점수를 결정할 수 있다.In another embodiment, the
일 실시예에 있어서, 어플리케이션 마켓(20)으로부터 크롤링되는 상기 복수의 어플리케이션들 각각의 설명 자료(DS)는 상기 복수의 어플리케이션들의 카테고리 정보를 포함할 수 있다.In one embodiment, the description data DS of each of the plurality of applications crawled from the
이 경우, 키워드 추출부(200)는 상기 복수의 어플리케이션들 각각의 설명 자료(DS)에 기초하여 상기 복수의 어플리케이션들 각각의 상기 카테고리 정보를 제1 데이터베이스(300)에 추가적으로 저장할 수 있다.In this case, the
도 17은 도 1의 어플리케이션의 대표 키워드 결정 시스템에 포함되는 제1 데이터베이스의 다른 예를 나타내는 도면이다.17 is a diagram showing another example of the first database included in the representative keyword determination system of the application of FIG.
도 17을 참조하면, 제1 데이터베이스(300b)는 어플리케이션 필드(APP_F), 카테고리 필드(CATEGORY_F), 키워드 필드(KW_F), 및 비중 필드(GV_F)를 포함할 수 있다.Referring to FIG. 17, the
키워드 추출부(200)는 상기 복수의 어플리케이션들 각각에 대하여, 어플리케이션의 명칭(APP_N)을 어플리케이션 필드(APP_F)에 저장하고, 상응하는 어플리케이션의 카테고리를 카테고리 필드(CATEGORY_F)에 저장하고, 상응하는 어플리케이션의 키워드들(KW)을 키워드 필드(KW_F)에 저장하고, 상응하는 어플리케이션의 키워드들(KW)의 비중들(GV)을 비중 필드(GV_F)에 저장할 수 있다.The
도 17에는 예시적으로 APP1에 상응하는 어플리케이션의 카테고리는 "커뮤니케이션"이고, APP1에 상응하는 어플리케이션의 키워드들(KW)은 "대화", "친구", 및 "첨부"로 결정되고, APP1에 상응하는 어플리케이션에서 "대화", "친구", 및 "첨부"의 비중(GV)은 각각 "0.40", "0.35", 및 "0.25"로 결정되고, APP2에 상응하는 어플리케이션의 카테고리는 "출산"이고, APP2에 상응하는 어플리케이션의 키워드들(KW)은 "임신", "태교", "다이어리", 및 "영양"으로 결정되고, APP2에 상응하는 어플리케이션에서 "임신", "태교", "다이어리", 및 "영양"의 비중(GV)은 각각 "0.45", "0.30", "0.15", 및 "0.10"으로 결정된 것을 나타낸다.17, the category of the application corresponding to APP1 is "communication", the keywords KW of the application corresponding to APP1 are determined as "conversation", "friend", and "attachment" 0.35 " and "0.25 ", respectively, and the category of the application corresponding to APP2 is" birth " , The keywords KW of the application corresponding to APP2 are determined as "pregnancy", "fetish", "diary", and "nutrition", and "pregnancy", " , And the "specific gravity" (GV) of "nutrition" were determined as "0.45", "0.30", "0.15", and "0.10", respectively.
이 경우, 도 16에 도시된 바와 같이, 키워드 추출부(200)는 제1 데이터베이스(300)에 저장된 상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션의 키워드들(KW) 각각과 중복되는 키워드를 포함하는 어플리케이션들이 속하는 카테고리들의 개수에 기초하여 상기 목표 어플리케이션의 키워드들(KW) 각각의 보정 계수를 결정할 수 있다(단계 S760).In this case, as shown in FIG. 16, the
예를 들어, 키워드 분석부(500)는 제1 데이터베이스(300)에 저장된 상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션의 키워드(KW)와 동일한 키워드를 포함하는 어플리케이션들이 속하는 카테고리들의 개수가 상대적으로 많은 경우, 상기 목표 어플리케이션의 키워드(KW)의 상기 보정 계수를 상대적으로 작은 값으로 결정하고, 제1 데이터베이스(300)에 저장된 상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션의 키워드(KW)와 동일한 키워드를 포함하는 어플리케이션들이 속하는 카테고리들의 개수가 상대적으로 적은 경우, 상기 목표 어플리케이션의 키워드(KW)의 상기 보정 계수를 상대적으로 큰 값으로 결정할 수 있다.For example, when the number of categories to which the applications including the keyword (KW) of the target application belongs is relatively large among the plurality of applications stored in the
이후, 키워드 분석부(500)는 상기 목표 어플리케이션의 키워드들(KW) 각각의 상기 점수에 상기 목표 어플리케이션의 키워드들(KW) 각각의 상기 보정 계수를 곱한 값을 상기 목표 어플리케이션의 키워드들(KW) 각각의 보정 점수로 결정하고(단계 S770), 상기 목표 어플리케이션의 키워드들(KW) 중에서 상대적으로 높은 보정 점수를 갖는 키워드들을 상기 목표 어플리케이션을 대표하는 대표 키워드들(REP_KWs)로 결정할 수 있다(단계 S780).Then, the
일반적으로 "권한", "결제" 등과 같이 다양한 종류의 카테고리들에 속하는 어플리케이션들의 설명 자료(DS)에서 공통으로 사용되는 일반적인 단어들은 특정 어플리케이션의 특징이나 기능을 효과적으로 나타낼 수 없다.Generally, common words commonly used in description data (DS) of applications belonging to various categories of categories such as "authority" and "settlement" can not effectively represent the characteristics or functions of a specific application.
도 16 및 17을 참조하여 상술한 바와 같이, 본 발명의 실시예들에 따른 어플리케이션의 대표 키워드 결정 시스템(10)은 상기 보정 계수를 통해 "권한", "결제" 등과 같이 다양한 종류의 카테고리들에 속하는 어플리케이션들의 설명 자료(DS)에서 공통으로 사용되는 일반적인 키워드의 점수를 감소시켜 상기 보정 점수를 결정하므로, 범용적인 키워드가 상기 목표 어플리케이션의 대표 키워드(REP_KWs)로 결정되는 것을 효과적으로 방지할 수 있다.As described above with reference to Figs. 16 and 17, the representative
따라서 본 발명의 실시예들에 따른 어플리케이션의 대표 키워드 결정 시스템(10) 및 어플리케이션의 대표 키워드 결정 방법은 어플리케이션의 특징을 효과적으로 나타내는 대표 키워드들(REP_KWs)을 더욱 정확하게 결정할 수 있다.Therefore, the representative
본 발명의 실시예들에 따른 어플리케이션의 대표 키워드 결정 시스템(10)은 제1 데이터베이스(300)에 저장된 상기 복수의 어플리케이션들 각각을 순차적으로 상기 목표 어플리케이션으로 선택하고, 상기 선택된 목표 어플리케이션에 대해 도 1 내지 17을 참조하여 상술한 바와 같은 동작을 반복적으로 수행함으로써, 상기 복수의 어플리케이션들 각각의 대표 키워드들(REP_KWs)을 결정할 수 있다.The representative
본 발명의 실시예들에 따른 어플리케이션의 대표 키워드 결정 시스템(10)을 통해 결정되는 상기 복수의 어플리케이션들 각각의 대표 키워드들(REP_KWs)은 어플리케이션의 검색, 광고 등과 같은 다양한 분야에서 유용하게 활용될 수 있다.The representative keywords (REP_KWs) of each of the plurality of applications determined through the representative
본 발명은 어플리케이션의 특징을 효과적으로 나타내는 대표 키워드들을 정확하게 결정할 수 있으므로, 어플리케이션 검색의 편의성을 향상시키고, 어플리케이션의 광고 대상을 선별하는 데에 유용하게 이용될 수 있다.INDUSTRIAL APPLICABILITY The present invention can accurately determine representative keywords that effectively characterize an application, and thus can be used to improve the convenience of application search and to select an advertisement object of an application.
상술한 바와 같이, 본 발명의 바람직한 실시예를 참조하여 설명하였지만 해당 기술 분야에서 통상의 지식을 가진 자라면 하기의 특허청구범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.Although the preferred embodiments of the present invention have been disclosed for illustrative purposes, those skilled in the art will appreciate that various modifications, additions and substitutions are possible, without departing from the scope and spirit of the invention as disclosed in the accompanying claims. It will be understood that the invention may be modified and varied without departing from the scope of the invention.
10: 어플리케이션의 대표 키워드 결정 시스템
20: 어플리케이션 마켓 30: 모바일 단말기
100: 설명 자료 수집부 200: 키워드 추출부
300: 제1 데이터베이스 400: 연관 어플리케이션 결정부
410: 데이터 수신부 420: 제3 데이터베이스
430: 비율 계산부 440: 연관도 분석부
450: 연관 어플리케이션 선택부 500: 키워드 분석부
600: 제2 데이터베이스10: Application's representative keyword determination system
20: Application Market 30: Mobile Terminal
100: description data collecting unit 200: keyword extracting unit
300: First database 400: Associated application determining unit
410: Data receiving unit 420: Third database
430: ratio calculation unit 440: relevance analysis unit
450: Associated application selection unit 500: Keyword analysis unit
600: second database
Claims (20)
상기 복수의 어플리케이션들 각각에 대하여, 상기 설명 자료에 포함되는 키워드들 및 상기 설명 자료에서 상기 키워드들의 비중들을 결정하여 제1 데이터베이스에 저장하는 단계;
상기 복수의 어플리케이션들 중에서 목표 어플리케이션을 선택하는 단계;
상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션과 높은 연관도를 갖는 연관 어플리케이션들의 목록을 획득하는 단계;
상기 제1 데이터베이스로부터 상기 목표 어플리케이션 및 상기 연관 어플리케이션들 각각의 상기 키워드들 및 상기 키워드들의 비중들을 독출하는 단계;
상기 목표 어플리케이션의 상기 키워드들 중에서 상기 연관 어플리케이션들의 상기 키워드들과 중복되는 키워드들을 중복 키워드들로 결정하는 단계; 및
상기 목표 어플리케이션의 상기 키워드들의 비중들과 상기 연관 어플리케이션들 각각의 상기 중복 키워드들의 비중들에 기초하여 상기 목표 어플리케이션의 상기 키워드들 중에서 상기 목표 어플리케이션을 대표하는 대표 키워드들을 결정하는 단계를 포함하는 어플리케이션의 대표 키워드 결정 방법.Crawling description data of each of a plurality of applications from an application market;
Determining, for each of the plurality of applications, the weight of the keywords in the description data and the keywords included in the description data and storing the determined weight in the first database;
Selecting a target application among the plurality of applications;
Obtaining a list of associated applications having a high degree of association with the target application among the plurality of applications;
Reading the weight of the keywords and the keywords of each of the target application and the associated applications from the first database;
Determining duplicated keywords as duplicate keywords among the keywords of the associated applications among the keywords of the target application; And
Determining representative keywords representative of the target application among the keywords of the target application based on the weight of the keywords of the target application and the weight of the duplicate keywords of each of the associated applications How to determine representative keywords.
상기 복수의 어플리케이션들 각각에 대하여,
상기 설명 자료에 대해 형태소 분석(morphological analysis)을 수행하여 상기 설명 자료에 포함되는 상기 키워드들을 추출하는 단계;
상기 설명 자료에서 상기 키워드들 각각의 반복 횟수를 결정하는 단계;
상기 키워드들 각각의 상기 반복 횟수를 상기 키워드들의 상기 반복 횟수들의 총합으로 나눈 값을 상기 키워드들 각각의 상기 비중으로 결정하는 단계; 및
상기 키워드들 및 상기 키워드들의 상기 비중들을 상응하는 어플리케이션의 명칭과 연관시켜 상기 제1 데이터베이스에 저장하는 단계를 포함하는 어플리케이션의 대표 키워드 결정 방법.2. The method of claim 1, wherein for each of the plurality of applications, determining the weight of the keywords from the keywords included in the description data and the description data and storing the determined weight in the first database comprises:
For each of the plurality of applications,
Performing morphological analysis on the explanatory data to extract the keywords included in the explanatory data;
Determining the number of repetitions of each of the keywords in the description data;
Determining a value obtained by dividing the repetition count of each of the keywords by the total of the repetition counts of the keywords as the weight of each of the keywords; And
And associating the weight of the keywords and the keywords with a name of a corresponding application and storing the keyword in the first database.
상기 복수의 어플리케이션들 각각에 대하여, 상응하는 어플리케이션과 높은 연관도를 갖는 상기 연관 어플리케이션들의 목록을 미리 저장하는 제2 데이터베이스로부터 상기 목표 어플리케이션에 상응하는 상기 연관 어플리케이션들의 목록을 독출하는 단계를 포함하는 어플리케이션의 대표 키워드 결정 방법.The method of claim 1, wherein the step of obtaining a list of the associated applications having a high degree of association with the target application among the plurality of applications comprises:
Reading, for each of the plurality of applications, a list of the associated applications corresponding to the target application from a second database that stores in advance a list of the associated applications having a high degree of association with the corresponding application A method for determining representative keywords of an application.
복수의 모바일 단말기들 각각의 식별 아이디 및 상기 복수의 모바일 단말기들 각각에 설치된 어플리케이션들의 목록을 포함하는 설치 로그 데이터를 수신하여 제3 데이터베이스에 저장하는 단계;
상기 제3 데이터베이스에 저장된 상기 복수의 모바일 단말기들의 상기 설치 로그 데이터에 기초하여 상기 복수의 모바일 단말기들 중에서 제1 내지 제k(k는 양의 정수) 어플리케이션들 각각이 설치된 모바일 단말기들의 비율에 상응하는 제1 내지 제k 전체 비율들을 결정하는 단계;
상기 제3 데이터베이스에 저장된 상기 복수의 모바일 단말기들의 상기 설치 로그 데이터에 기초하여 상기 목표 어플리케이션이 설치된 모바일 단말기들 중에서 상기 제1 내지 제k 어플리케이션들 각각이 설치된 모바일 단말기들의 비율에 상응하는 제1 내지 제k 교차 비율들을 결정하는 단계;
상기 제1 내지 제k 전체 비율들 및 상기 제1 내지 제k 교차 비율들에 기초하여 상기 목표 어플리케이션과 상기 제1 내지 제k 어플리케이션들 각각 사이의 연관도를 나타내는 제1 내지 제k 연관 지수들을 결정하는 단계; 및
상기 제1 내지 제k 어플리케이션들 중에서 상대적으로 높은 연관 지수를 갖는 어플리케이션들을 상기 연관 어플리케이션들로 결정하는 단계를 포함하는 어플리케이션의 대표 키워드 결정 방법.The method of claim 1, wherein the step of obtaining a list of the associated applications having a high degree of association with the target application among the plurality of applications comprises:
Receiving installation log data including an identification ID of each of the plurality of mobile terminals and a list of applications installed in each of the plurality of mobile terminals, and storing the received installation log data in a third database;
(K is a positive integer) applications among the plurality of mobile terminals based on the installation log data of the plurality of mobile terminals stored in the third database Determining first through kth total ratios;
K-th applications corresponding to the ratios of the mobile terminals in which the first to k-th applications are installed, among the mobile terminals in which the target application is installed, based on the installation log data of the plurality of mobile terminals stored in the third database k crossing ratios;
Determining first to k < th > k association indices indicative of a degree of association between the target application and each of the first to k-th applications based on the first to k-th overall ratios and the first to k- ; And
And determining, as the related applications, applications having a relatively high association index among the first to k-th applications.
상기 복수의 모바일 단말기들의 상기 설치 로그 데이터에 기초하여 상기 복수의 모바일 단말기들에 상응하는 상기 식별 아이디들의 개수를 전체 개수로 결정하는 단계;
상기 복수의 모바일 단말기들의 상기 설치 로그 데이터에 기초하여 제j(j는 1 이상 k 이하의 임의의 양의 정수) 어플리케이션이 설치된 모바일 단말기들에 상응하는 상기 식별 아이디들의 개수를 제j 설치 개수로 결정하는 단계; 및
상기 제j 설치 개수를 상기 전체 개수로 나눈 값을 제j 전체 비율로 결정하는 단계를 포함하는 어플리케이션의 대표 키워드 결정 방법.5. The method according to claim 4, further comprising the step of, based on the installation log data of the plurality of mobile terminals stored in the third database, Wherein determining the first through k < RTI ID = 0.0 > k <
Determining a total number of the identification IDs corresponding to the plurality of mobile terminals based on the installation log data of the plurality of mobile terminals;
Determining a number of the identification IDs corresponding to mobile terminals provided with an application of j (j is an arbitrary positive integer equal to or greater than 1 k) based on the installation log data of the plurality of mobile terminals as a j-th installation number ; And
Determining a value obtained by dividing the number of the j-th installation by the total number as a j-th overall ratio.
상기 복수의 모바일 단말기들의 상기 설치 로그 데이터에 기초하여 상기 목표 어플리케이션이 설치된 모바일 단말기들에 상응하는 상기 식별 아이디들의 개수를 목표 설치 개수로 결정하는 단계;
상기 복수의 모바일 단말기들의 상기 설치 로그 데이터에 기초하여 상기 목표 어플리케이션과 제j(j는 1 이상 k 이하의 임의의 양의 정수) 어플리케이션이 함께 설치된 모바일 단말기들에 상응하는 상기 식별 아이디들의 개수를 제j 교차 개수로 결정하는 단계; 및
상기 제j 교차 개수를 상기 목표 설치 개수로 나눈 값을 제j 교차 비율로 결정하는 단계를 포함하는 어플리케이션의 대표 키워드 결정 방법.5. The method according to claim 4, further comprising the steps of: determining, based on the installation log data of the plurality of mobile terminals stored in the third database, a ratio of mobile terminals installed with the first to k- The step of determining corresponding first through kth intersection ratios comprises:
Determining, as a target installation number, the number of the identification IDs corresponding to the mobile terminals on which the target application is installed based on the installation log data of the plurality of mobile terminals;
(J is a positive integer equal to or less than k) applications based on the installation log data of the plurality of mobile terminals, the number of the identification IDs corresponding to mobile terminals installed together with the target application and the j j as a number of intersections; And
Determining a value obtained by dividing the j-th intersection number by the target installed number as a j-th intersection ratio.
상기 제1 내지 제k 전체 비율들 각각과 상기 제1 내지 제k 교차 비율들 각각 사이의 차이에 기초하여 상기 제1 내지 제k 연관 지수들을 결정하는 단계를 포함하는 어플리케이션의 대표 키워드 결정 방법.5. The method of claim 4, further comprising: determining whether the target application and the first to k-th applications are associated with each other based on the first through k < 0.0 > k < / RTI > association indexes,
And determining the first through k-th associated indexes based on a difference between each of the first through k-th overall ratios and each of the first through k-th crossing ratios.
상기 제1 내지 제k 전체 비율들 각각에 대한 상기 제1 내지 제k 교차 비율들 각각의 비율에 기초하여 상기 제1 내지 제k 연관 지수들을 결정하는 단계를 포함하는 어플리케이션의 대표 키워드 결정 방법.5. The method of claim 4, further comprising: determining whether the target application and the first to k-th applications are associated with each other based on the first through k < 0.0 > k < / RTI > association indexes,
And determining the first through k k-related indexes based on a ratio of each of the first through k-th crossing ratios for each of the first through k-th overall ratios.
상기 제1 내지 제k 전체 비율들 각각과 상기 제1 내지 제k 교차 비율들 각각 사이의 차이 및 상기 제1 내지 제k 전체 비율들 각각에 대한 상기 제1 내지 제k 교차 비율들 각각의 비율에 기초하여 상기 제1 내지 제k 연관 지수들을 결정하는 단계를 포함하는 어플리케이션의 대표 키워드 결정 방법.5. The method of claim 4, further comprising: determining whether the target application and the first to k-th applications are associated with each other based on the first through k < 0.0 > k < / RTI > association indexes,
The ratio of each of the first through kth total ratios and each of the first through kth intersection ratios to each of the first through kth total ratios, And determining the first through k < th > k-related indexes based on the first through k-th associated indexes.
상기 제1 내지 제k 전체 비율들 각각과 상기 제1 내지 제k 교차 비율들 각각 사이의 차이, 상기 제1 내지 제k 전체 비율들 각각에 대한 상기 제1 내지 제k 교차 비율들 각각의 비율, 및 0보다 크고 1보다 작은 값을 갖는 가중치에 기초하여 상기 제1 내지 제k 연관 지수들을 결정하는 단계를 포함하는 어플리케이션의 대표 키워드 결정 방법.5. The method of claim 4, further comprising: determining whether the target application and the first to k-th applications are associated with each other based on the first through k < 0.0 > k < / RTI > association indexes,
A ratio of each of the first through k-th total ratios and a difference between each of the first through k-th intersection ratios, a ratio of each of the first through k-th intersection ratios to each of the first through k- And determining the first through k-th associated indexes based on a weight having a value greater than zero and less than one.
상기 목표 어플리케이션의 상기 키워드들 중에서 상기 중복 키워드들 각각에 대하여, 상기 목표 어플리케이션의 상기 중복 키워드의 비중에 상기 연관 어플리케이션들 각각의 상기 중복 키워드의 비중을 가중치로 적용하여 상기 중복 키워드의 점수를 결정하는 단계;
상기 목표 어플리케이션의 상기 키워드들 중에서 상기 중복 키워드가 아닌 비중복 키워드들 각각에 대하여, 상기 목표 어플리케이션의 상기 비중복 키워드의 비중을 상기 비중복 키워드의 점수로 결정하는 단계; 및
상기 목표 어플리케이션의 상기 키워드들 중에서 상대적으로 높은 점수를 갖는 키워드들을 상기 대표 키워드들로 결정하는 단계를 포함하는 어플리케이션의 대표 키워드 결정 방법.The method of claim 1, further comprising: determining the representative keywords representing the target application from among the keywords of the target application based on the weight of the keywords of the target application and the weight of the duplicate keywords of each of the associated applications Lt; / RTI >
For each of the duplicate keywords among the keywords of the target application, a weight of the duplicate keyword is determined by applying a weight of the duplicate keyword of each of the associated applications to a weight of the duplicate keyword of the target application step;
Determining a weight of the non-overlapping keyword of the target application as the score of the non-overlapping keyword, for each of the non-overlapping keywords that are not duplicate keywords among the keywords of the target application; And
And determining, as the representative keywords, keywords having a relatively high score among the keywords of the target application.
상기 연관 어플리케이션들의 상기 중복 키워드의 비중들의 합을 상기 목표 어플리케이션의 상기 중복 키워드의 비중과 합한 값을 상기 중복 키워드의 점수로 결정하는 단계를 포함하는 어플리케이션의 대표 키워드 결정 방법.12. The method of claim 11, wherein for each of the duplicate keywords among the keywords in the target application, a weight of the duplicate keyword of each of the associated applications is applied as a weight to a weight of the duplicate keyword of the target application, The step of determining the score of the keyword comprises:
Determining a sum of the weights of the duplicate keywords of the associated applications and a weight of the duplicate keyword of the target application as a score of the duplicate keyword.
상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션과 상대적으로 높은 연관도를 갖는 어플리케이션들에 상응하는 상기 연관 어플리케이션들의 목록 및 상기 목표 어플리케이션과 상기 연관 어플리케이션들 사이의 연관도를 나타내는 연관 지수들을 획득하는 단계를 포함하는 어플리케이션의 대표 키워드 결정 방법.The method of claim 1, wherein the step of obtaining a list of the associated applications having a high degree of association with the target application among the plurality of applications comprises:
Obtaining a list of the associated applications corresponding to applications having a relatively high degree of association with the target application among the plurality of applications and association indexes indicating association degrees between the target applications and the associated applications A method for determining representative keywords of an application.
상기 목표 어플리케이션의 상기 키워드들 중에서 상기 중복 키워드들 각각에 대하여, 상기 목표 어플리케이션의 상기 중복 키워드의 비중에 상기 연관 어플리케이션들 각각의 상기 중복 키워드의 비중 및 상기 연관 어플리케이션들 각각의 상기 연관 지수를 가중치로 적용하여 상기 중복 키워드의 점수를 결정하는 단계;
상기 목표 어플리케이션의 상기 키워드들 중에서 상기 중복 키워드가 아닌 비중복 키워드들 각각에 대하여, 상기 목표 어플리케이션의 상기 비중복 키워드의 비중을 상기 비중복 키워드의 점수로 결정하는 단계; 및
상기 목표 어플리케이션의 상기 키워드들 중에서 상대적으로 높은 점수를 갖는 키워드들을 상기 대표 키워드들로 결정하는 단계를 포함하는 어플리케이션의 대표 키워드 결정 방법.14. The method of claim 13, further comprising determining the representative keywords representing the target application from the keywords of the target application based on the weight of the keywords in the target application and the weight of the duplicate keywords in each of the associated applications Lt; / RTI >
For each of the duplicate keywords among the keywords of the target application, a weight of the duplicate keyword of each of the associated applications and a weight of the association index of each of the associated applications in the weight of the duplicate keyword of the target application Determining a score of the duplicate keyword;
Determining a weight of the non-overlapping keyword of the target application as the score of the non-overlapping keyword, for each of the non-overlapping keywords that are not duplicate keywords among the keywords of the target application; And
And determining, as the representative keywords, keywords having a relatively high score among the keywords of the target application.
상기 연관 어플리케이션들 각각의 상기 중복 키워드의 비중과 상기 연관 어플리케이션들 각각의 상기 연관 지수의 곱을 상기 목표 어플리케이션의 상기 중복 키워드의 비중과 합한 값을 상기 중복 키워드의 점수로 결정하는 단계를 포함하는 어플리케이션의 대표 키워드 결정 방법.15. The method of claim 14, further comprising: for each of the duplicate keywords among the keywords in the target application, the weight of the duplicate keyword of each of the associated applications in the weight of the duplicate keyword in the target application, The step of determining the score of the duplicate keyword by applying the association index as a weight,
Determining a sum of the weight of the duplicate keyword of each of the related applications and the association index of each of the associated applications together with the weight of the duplicate keyword of the target application as the score of the duplicate keyword How to determine representative keywords.
상기 목표 어플리케이션의 상기 키워드들의 비중들과 상기 연관 어플리케이션들 각각의 상기 중복 키워드들의 비중들에 기초하여 상기 목표 어플리케이션의 상기 키워드들 각각의 점수를 결정하는 단계;
상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션의 상기 키워드들 각각과 중복되는 키워드를 포함하는 어플리케이션들의 개수에 기초하여 상기 목표 어플리케이션의 상기 키워드들 각각의 보정 계수를 결정하는 단계;
상기 목표 어플리케이션의 상기 키워드들 각각의 상기 점수에 상기 목표 어플리케이션의 상기 키워드들 각각의 상기 보정 계수를 곱한 값을 상기 목표 어플리케이션의 상기 키워드들 각각의 보정 점수로 결정하는 단계; 및
상기 목표 어플리케이션의 상기 키워드들 중에서 상대적으로 높은 보정 점수를 갖는 키워드들을 상기 대표 키워드들로 결정하는 단계를 포함하는 어플리케이션의 대표 키워드 결정 방법.The method of claim 1, further comprising: determining the representative keywords representing the target application from among the keywords of the target application based on the weight of the keywords of the target application and the weight of the duplicate keywords of each of the associated applications Lt; / RTI >
Determining a score of each of the keywords in the target application based on the weight of the keywords in the target application and the weight of the duplicate keywords in each of the associated applications;
Determining a correction coefficient of each of the keywords of the target application based on the number of applications including a keyword overlapping each of the keywords of the target application among the plurality of applications;
Determining a value obtained by multiplying the score of each of the keywords of the target application by the correction coefficient of each of the keywords of the target application as a correction score of each of the keywords of the target application; And
And determining, as the representative keywords, keywords having a relatively high correction score among the keywords of the target application.
상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션의 상기 키워드와 동일한 키워드를 포함하는 어플리케이션들의 개수가 상대적으로 많은 경우, 상기 목표 어플리케이션의 상기 키워드의 상기 보정 계수를 상대적으로 작은 값으로 결정하는 단계; 및
상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션의 상기 키워드와 동일한 키워드를 포함하는 어플리케이션들의 개수가 상대적으로 적은 경우, 상기 목표 어플리케이션의 상기 키워드의 상기 보정 계수를 상대적으로 큰 값으로 결정하는 단계를 포함하는 어플리케이션의 대표 키워드 결정 방법.17. The method of claim 16, wherein determining the correction factor for each of the keywords of the target application based on a number of applications that include a keyword overlapping each of the keywords of the target application among the plurality of applications ,
Determining the correction coefficient of the keyword of the target application as a relatively small value when the number of applications including the same keyword as the keyword of the target application is relatively large among the plurality of applications; And
Determining the correction coefficient of the keyword of the target application to be a relatively large value when the number of applications including the same keyword as the keyword of the target application is relatively small among the plurality of applications, ≪ / RTI >
상기 복수의 어플리케이션들 각각의 상기 설명 자료에 기초하여 상기 복수의 어플리케이션들 각각의 카테고리 정보를 상기 제1 데이터베이스에 저장하는 단계를 더 포함하고,
상기 목표 어플리케이션의 상기 키워드들의 비중들과 상기 연관 어플리케이션들 각각의 상기 중복 키워드들의 비중들에 기초하여 상기 목표 어플리케이션의 상기 키워드들 중에서 상기 목표 어플리케이션을 대표하는 상기 대표 키워드들을 결정하는 단계는,
상기 목표 어플리케이션의 상기 키워드들의 비중들과 상기 연관 어플리케이션들 각각의 상기 중복 키워드들의 비중들에 기초하여 상기 목표 어플리케이션의 상기 키워드들 각각의 점수를 결정하는 단계;
상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션의 상기 키워드들 각각과 중복되는 키워드를 포함하는 어플리케이션들이 속하는 카테고리들의 개수에 기초하여 상기 목표 어플리케이션의 상기 키워드들 각각의 보정 계수를 결정하는 단계;
상기 목표 어플리케이션의 상기 키워드들 각각의 상기 점수에 상기 목표 어플리케이션의 상기 키워드들 각각의 상기 보정 계수를 곱한 값을 상기 목표 어플리케이션의 상기 키워드들 각각의 보정 점수로 결정하는 단계; 및
상기 목표 어플리케이션의 상기 키워드들 중에서 상대적으로 높은 보정 점수를 갖는 키워드들을 상기 대표 키워드들로 결정하는 단계를 포함하는 어플리케이션의 대표 키워드 결정 방법.The method according to claim 1,
Further comprising storing the category information of each of the plurality of applications in the first database based on the description data of each of the plurality of applications,
The step of determining the representative keywords representing the target application among the keywords of the target application based on the weight of the keywords of the target application and the weight of the redundant keywords of each of the related applications,
Determining a score of each of the keywords in the target application based on the weight of the keywords in the target application and the weight of the duplicate keywords in each of the associated applications;
Determining a correction coefficient of each of the keywords of the target application based on the number of categories to which applications including keywords overlapping each of the keywords of the target application among the plurality of applications belong;
Determining a value obtained by multiplying the score of each of the keywords of the target application by the correction coefficient of each of the keywords of the target application as a correction score of each of the keywords of the target application; And
And determining, as the representative keywords, keywords having a relatively high correction score among the keywords of the target application.
상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션의 상기 키워드와 동일한 키워드를 포함하는 어플리케이션들이 속하는 카테고리들의 개수가 상대적으로 많은 경우, 상기 목표 어플리케이션의 상기 키워드의 상기 보정 계수를 상대적으로 작은 값으로 결정하는 단계; 및
상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션의 상기 키워드와 동일한 키워드를 포함하는 어플리케이션들이 속하는 카테고리들의 개수가 상대적으로 적은 경우, 상기 목표 어플리케이션의 상기 키워드의 상기 보정 계수를 상대적으로 큰 값으로 결정하는 단계를 포함하는 어플리케이션의 대표 키워드 결정 방법.19. The method of claim 18, further comprising: determining the correction factor of each of the keywords of the target application based on the number of categories to which applications containing keywords overlapping each of the keywords of the target application among the plurality of applications belong. Lt; / RTI >
Determining the correction coefficient of the keyword of the target application to be a relatively small value when the number of categories to which the applications including the same keyword as the keyword of the target application belongs is relatively large among the plurality of applications; And
Determining the correction coefficient of the keyword of the target application to be a relatively large value when the number of categories to which the applications including the same keyword as the keyword of the target application belongs is relatively small among the plurality of applications, A method for determining representative keywords of an application to be included.
어플리케이션 마켓으로부터 복수의 어플리케이션들 각각의 설명 자료를 크롤링(crawling)하는 설명 자료 수집부;
상기 복수의 어플리케이션들 각각에 대하여, 상기 설명 자료에 포함되는 키워드들 및 상기 설명 자료에서 상기 키워드들의 비중들을 결정하여 상기 데이터베이스에 저장하는 키워드 추출부;
상기 복수의 어플리케이션들 중에서 목표 어플리케이션을 선택하고, 상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션과 높은 연관도를 갖는 연관 어플리케이션들의 목록을 획득하는 연관 어플리케이션 결정부; 및
상기 데이터베이스로부터 상기 목표 어플리케이션 및 상기 연관 어플리케이션들 각각의 상기 키워드들 및 상기 키워드들의 비중들을 독출하고, 상기 목표 어플리케이션의 상기 키워드들 중에서 상기 연관 어플리케이션들의 상기 키워드들과 중복되는 키워드들을 중복 키워드들로 결정하고, 상기 목표 어플리케이션의 상기 키워드들의 비중들과 상기 연관 어플리케이션들 각각의 상기 중복 키워드들의 비중들에 기초하여 상기 목표 어플리케이션의 상기 키워드들 중에서 상기 목표 어플리케이션을 대표하는 대표 키워드들을 결정하는 키워드 분석부를 포함하는 어플리케이션의 대표 키워드 결정 시스템.Database;
A description data collection unit for crawling description data of each of a plurality of applications from an application market;
A keyword extracting unit for each of the plurality of applications to determine the specific weight of the keywords from the keywords included in the explanatory data and the explanatory data and store the determined weight in the database;
An associated application determining unit selecting a target application among the plurality of applications and acquiring a list of related applications having a high degree of association with the target application among the plurality of applications; And
Reads out the weight of the keywords and the keywords of each of the target application and the related applications from the database and determines keywords that are overlapped with the keywords of the related applications among the keywords of the target application as duplicate keywords And a keyword analysis unit for determining representative keywords representing the target application among the keywords of the target application based on the weight of the keywords of the target application and the weight of the redundant keywords of each of the related applications A representative keyword determination system of an application to be executed.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180049073A KR101871739B1 (en) | 2018-04-27 | 2018-04-27 | Method of determining representative keyword of application and system for determining representative keyword of application |
PCT/KR2018/008121 WO2019208872A1 (en) | 2018-04-27 | 2018-07-18 | Method and system for determining representative keyword of application |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180049073A KR101871739B1 (en) | 2018-04-27 | 2018-04-27 | Method of determining representative keyword of application and system for determining representative keyword of application |
Publications (1)
Publication Number | Publication Date |
---|---|
KR101871739B1 true KR101871739B1 (en) | 2018-06-27 |
Family
ID=62789824
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020180049073A KR101871739B1 (en) | 2018-04-27 | 2018-04-27 | Method of determining representative keyword of application and system for determining representative keyword of application |
Country Status (2)
Country | Link |
---|---|
KR (1) | KR101871739B1 (en) |
WO (1) | WO2019208872A1 (en) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012173818A (en) * | 2011-02-17 | 2012-09-10 | Ntt Docomo Inc | Server and method for recommending application to user |
KR20130122424A (en) * | 2012-04-30 | 2013-11-07 | 삼성전자주식회사 | Method and system for providing app service |
KR20150090756A (en) * | 2014-01-29 | 2015-08-06 | 한국외국어대학교 연구산학협력단 | Method and apparatus for generating an opportunity map of mobile application |
JP2017134787A (en) * | 2016-01-29 | 2017-08-03 | Kddi株式会社 | Device, program, and method for analyzing topic evaluation in multiple areas |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7860895B1 (en) * | 2005-08-23 | 2010-12-28 | Amazon Technologies, Inc. | Method and system for determining interest spaces among online content sources |
US9483557B2 (en) * | 2011-03-04 | 2016-11-01 | Microsoft Technology Licensing Llc | Keyword generation for media content |
KR101828995B1 (en) * | 2017-05-08 | 2018-02-14 | 한국과학기술정보연구원 | Method and Apparatus for clustering keywords |
-
2018
- 2018-04-27 KR KR1020180049073A patent/KR101871739B1/en active IP Right Grant
- 2018-07-18 WO PCT/KR2018/008121 patent/WO2019208872A1/en active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012173818A (en) * | 2011-02-17 | 2012-09-10 | Ntt Docomo Inc | Server and method for recommending application to user |
KR20130122424A (en) * | 2012-04-30 | 2013-11-07 | 삼성전자주식회사 | Method and system for providing app service |
KR20150090756A (en) * | 2014-01-29 | 2015-08-06 | 한국외국어대학교 연구산학협력단 | Method and apparatus for generating an opportunity map of mobile application |
JP2017134787A (en) * | 2016-01-29 | 2017-08-03 | Kddi株式会社 | Device, program, and method for analyzing topic evaluation in multiple areas |
Also Published As
Publication number | Publication date |
---|---|
WO2019208872A1 (en) | 2019-10-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106599278B (en) | Application search intention identification method and device | |
JP4920023B2 (en) | Inter-object competition index calculation method and system | |
CN101814067B (en) | System and methods for quantitative assessment of information in natural language contents | |
CN102902806B (en) | A kind of method and system utilizing search engine to carry out query expansion | |
US8949227B2 (en) | System and method for matching entities and synonym group organizer used therein | |
CN105095187A (en) | Search intention identification method and device | |
CN101697109A (en) | Method and system for acquiring candidates of input method | |
KR101491627B1 (en) | Quantification method, apparatus and system of reviews for mobile application evaluation | |
CN111797214A (en) | FAQ database-based problem screening method and device, computer equipment and medium | |
Geiß et al. | Neckar: A named entity classifier for wikidata | |
CN109558587B (en) | Method for classifying public opinion tendency recognition aiming at category distribution imbalance | |
JP2021022359A (en) | Management system and management method | |
CN110362601A (en) | Mapping method, device, equipment and the storage medium of metadata standard | |
CN101393550A (en) | Method and system for calculating competitiveness betweens objects | |
CN101105799B (en) | Method for evaluating file importance degree | |
JP2011248762A (en) | Classification device, content retrieval system, content classification method, content retrieval method, and program | |
WO2023151576A1 (en) | Search recommendation method, search recommendation system, computer device and storage medium | |
KR102063242B1 (en) | Searching device and searching program | |
KR101871739B1 (en) | Method of determining representative keyword of application and system for determining representative keyword of application | |
CN112035723A (en) | Resource library determination method and device, storage medium and electronic device | |
Kuck et al. | Context-sensitive service discovery meets information retrieval | |
CN114625973B (en) | Anonymous information cross-domain recommendation method and device, electronic equipment and storage medium | |
KR20110138850A (en) | User adaptive image management system and user adaptive image management method | |
KR101854912B1 (en) | Method of analyzing correlation between applications and apparatus for analyzing correlation between applications | |
KR101871745B1 (en) | Method of determining representative keyword of mobile device user and system for determining representative keyword of mobile device user |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |